Amazon Glue Studio 用户指南的文档历史记录 - Amazon Glue Studio
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

Amazon Glue Studio 用户指南的文档历史记录

上次文档更新日期:2021 年 10 月 11 日

下表介绍了每个 Amazon Glue Studio 用户指南版本中的重要更改。如需对此文档更新的通知,您可以订阅 RSS 源。

更新-历史记录-更改说明日期

Glue Studio 现已在中国可用

Amazon Glue Studio 现已在中国北京和宁夏区域可用。

2021 年 10 月 11 日

现在可以直接访问串流源

在可视化编辑器中将数据源添加到 ETL 任务时,您可以提供信息来访问数据流,而不必使用数据目录数据库和表。

2021 年 9 月 30 日

自定义连接器现在可以与数据预览一起使用

使用自定义连接器编辑数据源节点时,可以选择 Dat preview(数据集预览)选项卡预览数据集。有关更多信息,请参阅自定义连接器

2021 年 9 月 24 日

Amazon Glue Studio 支持 Amazon Glue 版本 3.0

在 Amazon Glue Studio 中创建任务时,您可以在 Job details (任务详细信息) 选项卡中将 Glue 3.0 选为您的任务版本。如果您没有为 ETL 任务选择版本,则默认情况下使用 Glue 2.0。

2021 年 8 月 18 日

Amazon GovCloud (US) Region

Amazon Glue Studio 现已在 Amazon GovCloud (US) Region 中可用

2021 年 8 月 18 日

Python Shell 编写适用于 Amazon Glue Studio

创建新任务时,您现在可以选择创建 Python Shell 任务。有关更多信息,请参阅启动任务创建流程在 Amazon Glue Studio 中编辑 Python Shell 任务

2021 年 8 月 13 日

将脚本上传到 Amazon Glue Studio

结合脚本编辑器功能,您可以将任务脚本上传到 Amazon Glue Studio。有关更多信息,请参阅启动任务创建流程编辑或上载任务脚本

2021 年 6 月 14 日

在创建和编辑任务时查看任务的数据集

您可以为任务图中的节点使用新的 Data Preview (数据预览) 选项卡,以查看由该节点处理的数据示例。有关更多信息,请参阅在可视化任务编辑器中使用数据预览

2021 年 6 月 7 日

在可视化任务编辑器中指定流式传输 ETL 任务的设置

您可以在可视任务编辑器中为流式传输数据源配置其他连接设置,以优化流式传输 ETL 任务。有关更多信息,请参阅使用流式传输数据源

2021 年 6 月 4 日

添加了网络连接支持

如果要访问 VPC 中的数据源,可以为任务指定网络连接。有关更多信息,请参阅修改任务属性

2021 年 5 月 24 日

编辑任务脚本

您现在可以在任务编辑器中编辑脚本。有关更多信息,请参阅编辑任务脚本

2021 年 5 月 24 日

使用 Amazon Glue Studio 控制台删除任务

您现在可以在 Amazon Glue Studio 中删除任务。要了解如何操作,请参阅删除任务

2021 年 5 月 24 日

从 Amazon S3 的子文件夹中的文件读取数据

您可以在 Amazon S3 中指定单个文件夹作为数据源,并使用 Recursive (递归) 选项包含数据源的所有子文件夹。有关更多信息,请参阅将 Amazon S3 中的文件用作数据源

2021 年 4 月 30 日

添加了“删除连接器和连接”功能

您现在可以在 Amazon Glue Studio 中删除连接器和连接。有关更多信息,请参阅删除连接器和连接

2021 年 4 月 30 日

添加了“填充缺失值转换

您可以在 Amazon Glue Studio 中使用 FillMissingValues 转换,查找数据集中缺少值的记录,并添加具有估计值的新字段。有关更多信息,请参阅编辑数据转换节点

2021 年 3 月 29 日

提供 SQL 转换

您可以使用 SQL 转换节点以 SQL 查询形式编写您自己的转换。有关更多信息,请参阅使用 SQL 查询转换数据

2021 年 3 月 23 日

JDBC 源节点现在支持任务书签键

作业书签可帮助 Amazon Glue 维护状态信息,并可防止重新处理旧数据。有关更多信息,请参阅使用自定义连接器编写任务

2021 年 3 月 15 日

连接器可用于数据目标

现在支持为数据目标使用自定义或 Amazon Web Services Marketplace 连接器。有关更多信息,请参阅使用自定义连接器编写任务

2021 年 3 月 15 日

新工具栏可用于可视化任务编辑器

更简化且功能性更强的工具栏适用于 Amazon Glue Studio 的可视化任务编辑器。该功能简化了向图表添加节点的流程。

2021 年 3 月 8 日

从 Amazon S3 读取数据,而无需创建数据目录表

Amazon Glue Studio 现在允许您直接从 Amazon S3 读取数据,而无需先在 Amazon Glue Data Catalog 中创建表。有关更多信息,请参阅编辑数据源节点

2021 年 2 月 5 日

Amazon Glue Studio 任务现在可以更新数据目录表

Amazon Glue Studio 现在支持在任务运行期间更新 Amazon Glue Data Catalog。此功能使您的任务能够在将新数据写入 Amazon S3 时轻松保持表的最新状态。这样的话,您可以立即从与 Amazon Glue Data Catalog 兼容的分析服务获取查询数据。有关更多信息,请参阅配置数据目标节点

2021 年 2 月 5 日

任务计划现在适用于 Amazon Glue Studio

您可以在 Amazon Glue Studio 中为任务运行定义基于时间的计划。您可以使用控制台创建基本计划,或者使用类似 Unix 的 cron 语法定义更复杂的计划。有关更多信息,请参阅计划任务运行

2020 年 12 月 21 日

Amazon Glue 自定义连接器已发布

Amazon Glue 自定义连接器允许您在 Amazon Web Services Marketplace 中发现和订阅连接器。我们还发布了 Amazon Glue Spark 运行时接口,用于插入为 Apache Spark Datasource、Athena 联合查询和 JDBC API 构建的连接器。有关更多信息,请参阅在 Amazon Glue Studio 中使用连接器和连接

2020 年 12 月 21 日

Amazon Glue 版本 2.0 支持运行串流 ETL 任务

Amazon Glue Studio 现在支持使用 Amazon Glue 版本 2.0 运行串流 ETL 任务。有关更多信息,请参阅 Amazon Glue 开发人员指南中的在 Amazon Glue 中添加串流 ETL 任务

2020 年 11 月 11 日

宣布了 Amazon Glue Studio 的可用性

Amazon Glue Studio 提供可视化界面,简化了为分析准备数据的任务的创建。本指南的初始版本与 Amazon Glue Studio 在同一天发布。

2020 年 9 月 23 日