发行说明 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

发行说明

数据 Wrangler 会定期更新新功能和错误修复。要升级你在 Studio 中使用的 Data Wrangler 版本,请按照中的说明操作关闭并更新 Studio 应用.

发行说明

2/2022

新功能:

  • 您现在可以使用目标节点进行导出。有关更多信息,请参阅 。Export

  • 您可以导入 ORC 和 JSON 文件。有关文件类型的更多信息,请参阅导入.

  • 数据 Wrangler 现在支持使用 SMOTE 转换。有关更多信息,请参阅 余额数据

  • Data Wrangler 现在支持分类数据的相似性编码。有关更多信息,请参阅 相似性编码

  • Data Wrangler 现在支持取消嵌套 JSON 数据。有关更多信息,请参阅 取消嵌套 JSON 数据

  • Data Wrangler 现在支持将数组的值扩展为单独的列。有关更多信息,请参阅 分解数组

  • Data Wrangler 现在支持在遇到问题时与服务团队联系。有关更多信息,请参阅 问题排查

  • Data Wrangler 支持编辑和删除数据流中的步骤。有关更多信息,请参阅 从数据流中删除步骤编辑数据 Wrangler 流程中的步骤

  • 您现在可以对多列执行转换。有关更多信息,请参阅 转换数据

  • 数据 Wrangler 现在支持成本分配标签。有关更多信息,请参阅使用成本分配标签

10/16/2021

新功能:

Data Wrangler 现在支持 Athena 工作组。有关更多信息,请参阅 从 Athena 导入数据

10/6/2021

新功能:

Data Wrangler 现在支持转换时间序列数据。有关更多信息,请参阅 转换时间序列

7/15/2021

新功能:

  • 雪花和数据牧马人现在支持。您可以在 Data Wrangler 中使用 Snowflake 作为数据源。

  • 添加了对 CSV 中自定义字段分隔符的支持。现在支持逗号、冒号、分号、管道 (|) 和 Tab。

  • 现在,您可以直接将结果导出到 Amazon S3。

  • 添加了一些新的多共线性分析仪:差异通货膨胀因素、主成分分析和套索功能选择。

增强功能:

  • 分析图表不能再包含重叠的标签。

错误修复:

  • One Hot 编码器优雅地处理空字符串。

  • 修复了当数据框列名包含点时发生的崩溃问题。

4/26/2021

增强功能:

  • 添加对分布式处理作业的支持。运行处理作业时,您可以使用多个实例。

  • 当估计结果大小小小于 1 GB 时,Data Wrangler 处理作业现在会自动合并小输出。

  • 功能商店笔记本:改进了 feature store 摄取性能

  • Data Wrangler 处理作业现在使用 1.x 作为 future 版本的权威容器标签。

错误修复:

  • 修复了多面直方图的渲染问题。

  • Fixed导出到处理 Job以支持矢量类型列。

  • FixedExtract using regex运算符返回第一个捕获的组,如果正则表达式或正则表达式中存在一个或多个组。

2/8/2021

新功能:

  • Data Wrangler Flow 支持多个实例。

  • 更新了导出到数据 Wrangler Job 笔记本以使用 SageMaker SDK 2.20.0。

  • 更新了导出到管道笔记本以使用 SageMaker SDK 2.20.0。

  • 更新了导出到流水线笔记本以添加 xgBoost 训练示例作为可选步骤。

增强功能:

  • 为了提高性能,不再支持导入在单个字段中包含多行的 CSV 文件。

错误修复:

  • 修复了 Quick 模型中的类型推理问题。

  • 修复了偏差报告中的偏差指标错误。

  • 修复了 “功能化” 文本转换以处理缺少值的列的问题。

  • 修复了直方图和散点图内置的可视化效果,以处理包含类似数组列的数据集。

  • 如果查询执行 ID 已过期,Athena 查询现在会重新运行。