本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
的文档历史记录Amazon Glue DataBrew开发者指南
当前 API 版本:databrew-2017-07-25
下表介绍了此版本的 Amazon Glue DataBrew 的文档。如果你想在什么时候收到通知Amazon Glue DataBrew开发者指南已更新,你可以订阅 RSS 提要。
变更 | 说明 | 日期 |
---|---|---|
在 CRYPTOGRAPHIC_HASH 转换中支持多种哈希算法 | 现在,在对列中的值进行哈希处理时,您可以指定哈希算法。有关更多信息,请参见密码学_哈希。 | 2023年8月11日 |
支持 Apache ORC 文件格式 | DataBrew现在支持 Apache ORC 作为文件格式DataBrew数据源和输出。有关更多信息,请参见数据源支持的文件类型。 | 2022 年 3 月 31 日 |
支持跨账户Amazon Glue Data Catalog亚马逊 S3 访问权限 | 你现在可以访问Amazon Glue Data Catalog来自其他的 S3 表Amazon Web Services 账户如果在中创建了相应的资源策略Amazon Glue控制台。创建策略后,可以在创建策略时选择相关的 Data Catalog S3 表作为输入源DataBrew数据集。有关更多信息,请参见支持的数据源和输出连接。 | 2022 年 3 月 11 日 |
支持将本机控制台与亚马逊集成AppFlow | DataBrew现在可以与亚马逊进行原生控制台集成AppFlow。这种集成意味着你可以连接来自 Salesforce、Zendesk、Slack 的数据ServiceNow,以及其他software-as-a-service(SaaS) 应用程序。您也可以连接到来自的数据Amazon Web Services例如亚马逊 S3 和亚马逊 Redshift。有关更多信息,请参见支持的数据源和输出连接。 | 2021 年 11 月 18 日 |
支持数据质量规则 | DataBrew现在支持创建数据质量规则,这些规则是可自定义的验证检查,用于定义特定数据的业务需求。有关更多信息,请参见在中验证数据质量Amazon Glue DataBrew。 | 2021 年 11 月 18 日 |
支持自定义 SQL 语句 | DataBrew现在支持用于从亚马逊 Redshift 和 Snowflake 检索数据的自定义 SQL 语句。这种支持意味着您可以使用专门构建的查询来选择和限制从大型表返回的数据。有关更多信息,请参见支持的数据源和输出连接。 | 2021 年 11 月 18 日 |
支持 PII 检测 | DataBrew现在支持检测个人身份信息 (PII)。这使您可以选择在数据准备期间屏蔽 PII。有关更多信息,请参见识别和处理个人身份信息 (PII)。 | 2021 年 11 月 18 日 |
支持其他Amazon地区 | DataBrew现在支持更多Amazon地区。有关支持的区域列表,请参阅Amazon Glue DataBrew终端节点和配额。 | 2021 年 10 月 5 日 |
支持将数据写入基于 Lake Formation 的 Amazon S3 | DataBrew现在支持将数据写入Amazon Glue Data CatalogS3 表基于Amazon Lake Formation。DataBrew现在还支持将数据写入 Tableau Hyper 格式。有关更多信息,请参见创建和使用Amazon Glue DataBrew食谱工作。 | 2021 年 8 月 13 日 |
支持将数据写入 JDBC 目标 | DataBrew现在支持将数据直接写入 JDBC 支持的数据库和数据仓库。其中包括亚马逊 Redshift、Snowflake、微软 SQL 服务器、MySQL、甲骨文数据库和 PostgreSQL。有关更多信息,请参见创建和使用Amazon Glue DataBrew食谱工作。 | 2021 年 7 月 23 日 |
支持指定为配置文件作业生成哪些数据质量统计数据 | DataBrew现在支持指定在配置文件作业中为数据集自动生成哪些数据质量统计数据。有关更多信息,请参见创建和使用Amazon Glue DataBrew食谱工作。 | 2021 年 7 月 23 日 |
支持将数据集写入Amazon Glue Data Catalog | DataBrew现在包括支持将数据集直接写入Amazon Glue Data Catalog。您可以选择在数据目录中的 Amazon S3、Amazon Redshift 和 Amazon RDS 表中存储根据运行数据准备配方的任务创建的数据集。支持的 RDS 表包括亚马逊 Aurora、Oracle 版 RDS、微软 SQL Server 版 RDS、MySQL 版 RDS 和 PostgreSQL 版 RDS 表。 | 2021 年 6 月 30 日 |
支持识别高级数据类型 | DataBrew现在支持自动识别和标记列的高级数据类型,这样可以更轻松地对包含某些类型数据的列进行标准化。这些类型的数据包括社会安全号码、电子邮件地址、电话号码、性别、信用卡、URL、IP 地址、日期和时间、货币、邮政编码、国家、地区、州和城市。 | 2021 年 6 月 30 日 |
支持使用亚马逊AppFlow从 SAAS 应用程序传输数据 | DataBrew现在支持使用亚马逊AppFlow将数据从第三方传输到 Amazon S3software-as-a-service(SaaS) 应用程序,例如 Salesforce、Zendesk、Slack 和ServiceNow。有关更多信息,请参见支持的数据源和输出连接。 | 2021 年 4 月 29 日 |
支持创建DataBrew包含 JDBC 数据库输入的数据集 | DataBrew现在支持从 JDBC 支持的数据库和数据仓库中的数据创建数据集,包括亚马逊 Redshift、Snowflake、微软 SQL Server、MySQL、Oracle 数据库和 PostgreSQL。有关更多信息,请参见支持的数据源和输出连接。 | 2021年4月2日 |
支持其他Amazon Web Services 区域 | DataBrew现在支持更多Amazon Web Services 区域。有关支持的区域列表,请参阅Amazon Glue DataBrew终端节点和配额。 | 2021 年 1 月 28 日 |
用于处理重复的新变换 | 已向中添加了四个用于处理重复的新变换DataBrew控制台和 API。有关更多信息,请参见删除重复行,标记_DUPLICATE_ROWS,在列中标记重复项,以及删除重复项在数据质量配方步骤。 | 2021 年 1 月 28 日 |
其他 CSV 分隔符 | DataBrew现在支持用于创建的逗号分隔值 (CSV) 文件中的逗号以外的其他分隔符DataBrew数据集。有关更多信息,请参见创建和使用Amazon Glue DataBrew数据集 | 2021 年 1 月 28 日 |
DataBrew扩展为JupyterLab | 现在你可以使用Amazon Glue DataBrew作为扩展JupyterLab。有关更多信息,请参见使用DataBrew作为扩展JupyterLab。 | 2020 年 11 月 20 日 |
新的数据准备工具:Amazon Glue DataBrew | 这是 Amazon Glue DataBrew 开发人员指南的首次发布。 | 2020 年 11 月 11 日 |