本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Glue Studio 用户指南的文档历史记录
下表介绍了每个《Amazon Glue Studio 用户指南》版本中的重要更改。如需对此文档更新的通知,您可以订阅 RSS 源。
变更 | 说明 | 日期 |
---|---|---|
Amazon Glue Studio 现在提供数据质量 | Amazon Glue Data Quality 根据您定义的规则评估和监控您的数据质量。有关更多信息,请参阅使用 Amazon Glue Studio 评估数据质量。 | 2022 年 11 月 30 日 |
Amazon Glue Studio 现在提供自定义视觉转换 | 自定义视觉转换允许客户在团队之间定义、重用和共享特定于业务的 ETL 逻辑。有关更多信息,请参阅自定义视觉转换。 | 2022 年 11 月 28 日 |
Glue Studio 现已在中国可用 | Amazon Glue Studio 现已在中国北京和宁夏区域可用。 | 2021 年 10 月 11 日 |
Amazon Glue Studio 提供笔记本创作,用于交互式作业编辑 | 笔记本可以帮助您编写和执行代码、可视化结果和共享见解。通常,数据科学家使用笔记本来执行实验和数据探索任务。有关更多信息,请参阅使用 notebook。 | 2021 年 10 月 1 日 |
现在可以直接访问串流源 | 在可视化编辑器中将数据源添加到 ETL 任务时,您可以提供信息来访问数据流,而不必使用数据目录数据库和表。 | 2021 年 9 月 30 日 |
自定义连接器现在可以与数据预览一起使用 | 使用自定义连接器编辑数据源节点时,可以选择 Dat preview(数据集预览)选项卡预览数据集。有关更多信息,请参阅自定义连接器。 | 2021 年 9 月 24 日 |
Amazon Glue Studio 支持 Amazon Glue 版本 3.0 | 在 Amazon Glue Studio 中创建任务时,您可以在 Job details (任务详细信息) 选项卡中将 Glue 3.0 选择为您的任务版本。如果您没有为 ETL 任务选择版本,则默认情况下使用 Glue 2.0。 | 2021 年 8 月 18 日 |
Amazon GovCloud (US) Region | Amazon Glue Studio 现已在 Amazon GovCloud (US) Region 中可用 | 2021 年 8 月 18 日 |
Python Shell 编写适用于 Amazon Glue Studio | 创建新任务时,您现在可以选择创建 Python Shell 任务。有关更多信息,请参阅 开启任务创建流程和在 Amazon Glue Studio 中编辑 Python Shell 任务。 | 2021 年 8 月 13 日 |
将脚本上传到 Amazon Glue Studio | 结合脚本编辑器功能,您可以将任务脚本上传到 Amazon Glue Studio。有关更多信息,请参阅启动任务创建流程和编辑或上载任务脚本。 | 2021 年 6 月 14 日 |
在创建和编辑任务时查看任务的数据集 | 您可以为任务图中的节点使用新的 Data Preview (数据预览) 选项卡,以查看由该节点处理的数据示例。有关更多信息,请参阅在可视化任务编辑器中使用数据预览。 | 2021 年 6 月 7 日 |
在可视化任务编辑器中指定流式传输 ETL 任务的设置 | 您可以在可视任务编辑器中为流式传输数据源配置其他连接设置,以优化流式传输 ETL 任务。有关更多信息,请参阅使用流式传输数据源。 | 2021 年 6 月 4 日 |
添加了网络连接支持 | 如果要访问 VPC 中的数据源,可以为任务指定网络连接。有关更多信息,请参阅修改任务属性。 | 2021 年 5 月 24 日 |
编辑任务脚本 | 您现在可以在任务编辑器中编辑脚本。有关更多信息,请参阅编辑任务脚本。 | 2021 年 5 月 24 日 |
使用 Amazon Glue Studio 控制台删除任务 | 您现在可以在 Amazon Glue Studio 中删除任务。要了解如何操作,请参阅删除任务。 | 2021 年 5 月 24 日 |
从 Amazon S3 的子文件夹中的文件读取数据 | 您可以在 Amazon S3 中指定单个文件夹作为数据源,并使用 Recursive (递归) 选项包含数据源的所有子文件夹。有关更多信息,请参阅将 Amazon S3 中的文件用作数据源。 | 2021 年 4 月 30 日 |
添加了“删除连接器和连接”功能 | 您现在可以在 Amazon Glue Studio 中删除连接器和连接。有关更多信息,请参阅删除连接器和连接。 | 2021 年 4 月 30 日 |
添加了“填充缺失值转换” | 您可以在数据集中使用FillMissingValues转换Amazon Glue Studio,查找数据集中缺少值的记录,并添加具有估计值的新字段。有关更多信息,请参阅编辑数据转换节点。 | 2021 年 3 月 29 日 |
提供 SQL 转换 | 您可以使用 SQL 转换节点以 SQL 查询形式编写您自己的转换。有关更多信息,请参阅使用 SQL 查询转换数据。 | 2021 年 3 月 23 日 |
JDBC 源节点现在支持任务书签键 | 作业书签可帮助 Amazon Glue 维护状态信息,并可防止重新处理旧数据。有关更多信息,请参阅使用自定义连接器编写任务。 | 2021 年 3 月 15 日 |
连接器可用于数据目标 | 现在支持为数据目标使用自定义或 Amazon Web Services Marketplace 连接器。有关更多信息,请参阅使用自定义连接器编写任务。 | 2021 年 3 月 15 日 |
新工具栏可用于可视化任务编辑器 | 更简化且功能性更强的工具栏适用于 Amazon Glue Studio 的可视化任务编辑器。该功能简化了向图表添加节点的流程。 | 2021 年 3 月 8 日 |
从 Amazon S3 读取数据,而无需创建数据目录表 | Amazon Glue Studio 现在允许您直接从 Amazon S3 读取数据,而无需先在 Amazon Glue Data Catalog 中创建表。有关更多信息,请参阅编辑数据源节点。 | 2021 年 2 月 5 日 |
Amazon Glue Studio 任务现在可以更新数据目录表 | Amazon Glue Studio 现在支持在任务运行期间更新 Amazon Glue Data Catalog。此功能使您的任务能够在将新数据写入 Amazon S3 时轻松保持表的最新状态。这样的话,您可以立即从与 Amazon Glue Data Catalog 兼容的分析服务获取查询数据。有关更多信息,请参阅配置数据目标节点。 | 2021 年 2 月 5 日 |
任务计划现在适用于 Amazon Glue Studio | 您可以在 Amazon Glue Studio 中为任务运行定义基于时间的计划。您可以使用控制台创建基本计划,或者使用类似 Unix 的 cron | 2020 年 12 月 21 日 |
发布了 Amazon Glue 自定义连接器 | Amazon Glue 自定义连接器允许您在 Amazon Web Services Marketplace 中发现和订阅连接器。我们还发布了 Amazon Glue Spark 运行时接口,用于插入为 Apache Spark Datasource、Athena 联合查询和 JDBC API 构建的连接器。有关更多信息,请参阅 在 Amazon Glue Studio 中使用连接器和连接。 | 2020 年 12 月 21 日 |
Amazon Glue 版本 2.0 支持运行串流 ETL 任务 | Amazon Glue Studio 现在支持使用 Amazon Glue 版本 2.0 运行串流 ETL 任务。有关更多信息,请参阅 Amazon Glue 开发人员指南中的在 Amazon Glue 中添加串流 ETL 任务。 | 2020 年 11 月 11 日 |
宣布了 Amazon Glue Studio 的可用性 | Amazon Glue Studio 提供可视化界面,简化了为分析准备数据的任务的创建。本指南的初始版本与 Amazon Glue Studio 在同一天发布。 | 2020 年 9 月 23 日 |