Amazon Glue Studio 用户指南的文档历史记录 - Amazon Glue Studio
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Glue Studio 用户指南的文档历史记录

下表介绍了每个《Amazon Glue Studio 用户指南》版本中的重要更改。如需对此文档更新的通知,您可以订阅 RSS 源。

变更说明日期

Amazon Glue Studio 现在提供数据质量

Amazon Glue Data Quality 根据您定义的规则评估和监控您的数据质量。有关更多信息,请参阅使用 Amazon Glue Studio 评估数据质量

2022 年 11 月 30 日

Amazon Glue Studio 现在提供自定义视觉转换

自定义视觉转换允许客户在团队之间定义、重用和共享特定于业务的 ETL 逻辑。有关更多信息,请参阅自定义视觉转换

2022 年 11 月 28 日

Glue Studio 现已在中国可用

Amazon Glue Studio 现已在中国北京和宁夏区域可用。

2021 年 10 月 11 日

Amazon Glue Studio 提供笔记本创作,用于交互式作业编辑

笔记本可以帮助您编写和执行代码、可视化结果和共享见解。通常,数据科学家使用笔记本来执行实验和数据探索任务。有关更多信息,请参阅使用 notebook

2021 年 10 月 1 日

现在可以直接访问串流源

在可视化编辑器中将数据源添加到 ETL 任务时,您可以提供信息来访问数据流,而不必使用数据目录数据库和表。

2021 年 9 月 30 日

自定义连接器现在可以与数据预览一起使用

使用自定义连接器编辑数据源节点时,可以选择 Dat preview(数据集预览)选项卡预览数据集。有关更多信息,请参阅自定义连接器

2021 年 9 月 24 日

Amazon Glue Studio 支持 Amazon Glue 版本 3.0

在 Amazon Glue Studio 中创建任务时,您可以在 Job details (任务详细信息) 选项卡中将 Glue 3.0 选择为您的任务版本。如果您没有为 ETL 任务选择版本,则默认情况下使用 Glue 2.0。

2021 年 8 月 18 日

Amazon GovCloud (US) Region

Amazon Glue Studio 现已在 Amazon GovCloud (US) Region 中可用

2021 年 8 月 18 日

Python Shell 编写适用于 Amazon Glue Studio

创建新任务时,您现在可以选择创建 Python Shell 任务。有关更多信息,请参阅 开启任务创建流程在 Amazon Glue Studio 中编辑 Python Shell 任务

2021 年 8 月 13 日

将脚本上传到 Amazon Glue Studio

结合脚本编辑器功能,您可以将任务脚本上传到 Amazon Glue Studio。有关更多信息,请参阅启动任务创建流程编辑或上载任务脚本

2021 年 6 月 14 日

在创建和编辑任务时查看任务的数据集

您可以为任务图中的节点使用新的 Data Preview (数据预览) 选项卡,以查看由该节点处理的数据示例。有关更多信息,请参阅在可视化任务编辑器中使用数据预览

2021 年 6 月 7 日

在可视化任务编辑器中指定流式传输 ETL 任务的设置

您可以在可视任务编辑器中为流式传输数据源配置其他连接设置,以优化流式传输 ETL 任务。有关更多信息,请参阅使用流式传输数据源

2021 年 6 月 4 日

添加了网络连接支持

如果要访问 VPC 中的数据源,可以为任务指定网络连接。有关更多信息,请参阅修改任务属性

2021 年 5 月 24 日

编辑任务脚本

您现在可以在任务编辑器中编辑脚本。有关更多信息,请参阅编辑任务脚本

2021 年 5 月 24 日

使用 Amazon Glue Studio 控制台删除任务

您现在可以在 Amazon Glue Studio 中删除任务。要了解如何操作,请参阅删除任务

2021 年 5 月 24 日

从 Amazon S3 的子文件夹中的文件读取数据

您可以在 Amazon S3 中指定单个文件夹作为数据源,并使用 Recursive (递归) 选项包含数据源的所有子文件夹。有关更多信息,请参阅将 Amazon S3 中的文件用作数据源

2021 年 4 月 30 日

添加了“删除连接器和连接”功能

您现在可以在 Amazon Glue Studio 中删除连接器和连接。有关更多信息,请参阅删除连接器和连接

2021 年 4 月 30 日

添加了“填充缺失值转换”

您可以在数据集中使用FillMissingValues转换Amazon Glue Studio,查找数据集中缺少值的记录,并添加具有估计值的新字段。有关更多信息,请参阅编辑数据转换节点

2021 年 3 月 29 日

提供 SQL 转换

您可以使用 SQL 转换节点以 SQL 查询形式编写您自己的转换。有关更多信息,请参阅使用 SQL 查询转换数据

2021 年 3 月 23 日

JDBC 源节点现在支持任务书签键

作业书签可帮助 Amazon Glue 维护状态信息,并可防止重新处理旧数据。有关更多信息,请参阅使用自定义连接器编写任务

2021 年 3 月 15 日

连接器可用于数据目标

现在支持为数据目标使用自定义或 Amazon Web Services Marketplace 连接器。有关更多信息,请参阅使用自定义连接器编写任务

2021 年 3 月 15 日

新工具栏可用于可视化任务编辑器

更简化且功能性更强的工具栏适用于 Amazon Glue Studio 的可视化任务编辑器。该功能简化了向图表添加节点的流程。

2021 年 3 月 8 日

从 Amazon S3 读取数据,而无需创建数据目录表

Amazon Glue Studio 现在允许您直接从 Amazon S3 读取数据,而无需先在 Amazon Glue Data Catalog 中创建表。有关更多信息,请参阅编辑数据源节点

2021 年 2 月 5 日

Amazon Glue Studio 任务现在可以更新数据目录表

Amazon Glue Studio 现在支持在任务运行期间更新 Amazon Glue Data Catalog。此功能使您的任务能够在将新数据写入 Amazon S3 时轻松保持表的最新状态。这样的话,您可以立即从与 Amazon Glue Data Catalog 兼容的分析服务获取查询数据。有关更多信息,请参阅配置数据目标节点

2021 年 2 月 5 日

任务计划现在适用于 Amazon Glue Studio

您可以在 Amazon Glue Studio 中为任务运行定义基于时间的计划。您可以使用控制台创建基本计划,或者使用类似 Unix 的 cron 语法定义更复杂的计划。有关更多信息,请参阅计划任务运行

2020 年 12 月 21 日

发布了 Amazon Glue 自定义连接器

Amazon Glue 自定义连接器允许您在 Amazon Web Services Marketplace 中发现和订阅连接器。我们还发布了 Amazon Glue Spark 运行时接口,用于插入为 Apache Spark Datasource、Athena 联合查询和 JDBC API 构建的连接器。有关更多信息,请参阅 在 Amazon Glue Studio 中使用连接器和连接

2020 年 12 月 21 日

Amazon Glue 版本 2.0 支持运行串流 ETL 任务

Amazon Glue Studio 现在支持使用 Amazon Glue 版本 2.0 运行串流 ETL 任务。有关更多信息,请参阅 Amazon Glue 开发人员指南中的在 Amazon Glue 中添加串流 ETL 任务

2020 年 11 月 11 日

宣布了 Amazon Glue Studio 的可用性

Amazon Glue Studio 提供可视化界面,简化了为分析准备数据的任务的创建。本指南的初始版本与 Amazon Glue Studio 在同一天发布。

2020 年 9 月 23 日