发行说明 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

发行说明

数据 Wrangler 定期更新新功能和错误修复。要升级您在 Studio 中使用的数据牧羊人版本,请按照更新 Studio 应用程序.

发行说明

7/15/2021

新的功能:

  • Snowflake现在支持。您可以在数据牧师中使用雪花作为数据源。

  • 增加了对 CSV 中自定义字段分隔符的支持。现在支持逗号、冒号、分号、管道 (|) 和 Tab。

  • 现在,您可以直接将结果导出到 Amazon S3。

  • 增加了一些新的多共线性分析仪:方差膨胀因子、主成分分析和套索特征选择。

增强功能:

  • 无法再使用重叠标签打包分析图表。

错误修复:

  • 一个热编码器优雅地处理空字符串。

  • 修复了当数据框列名称包含点时发生的崩溃。

4/26/2021

增强功能:

  • 添加了对分布式处理作业的支持。您可以在运行处理作业时使用多个实例。

  • 现在,当估计结果大小小于 1 GB 时,数据 Wrangler 处理作业会自动合并小输出。

  • 功能商店笔记本电脑:改进了 feature store 接收性能

  • 数据牧师处理作业现在使用 1.x 作为未来版本的权威容器标签。

错误修复:

  • 修复了多面直方图的渲染问题。

  • 修正导出到处理 Job 以支持矢量类型列。

  • 修复了 “使用正则表达式提取” 运算符返回第一个捕获的组,如果正则表达式或正则表达式中存在一个或多个。

2/8/2021

新的功能:

  • 数据 Wrangler 流支持多个实例。

  • 更新了 “导出到数据牧师 Job 笔记本”,以使用 SageMaker SDK 2.20.0。

  • 更新了 “导出到管道笔记本” 以使用 SageMaker SDK 2.20.0。

  • 更新了 “导出到管道笔记本” 以添加 XGBoost 培训示例作为可选步骤。

增强功能:

  • 为了提高性能,不再支持导入单个字段中包含多行的 CSV 文件。

错误修复:

  • 修复了快速模型中的类型推断问题。

  • 修正了偏差报告中的偏差指标错误。

  • 修复了 “特征化” 文本转换以使用缺失值的列。

  • 固定直方图和散点图内置可视化效果,用于处理包含类似数组列的数据集。

  • 现在,如果查询执行 ID 已过期,Athena 查询将重新运行。