准备和分析数据集 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备和分析数据集

使用 Amazon SageMaker 数据牧师导入、准备、转换、可视化和分析数据。您可以将 Data Wrangler 集成到机器学习工作流中,从而简化和简化数据预处理和特征工程,只需很少甚至无需编码即可。您还可以添加自己的 Python 脚本和转换以自定义数据准备工作流。

从 Amazon S3 导入 Amazon Redshift 据Amazon Athena,并使用 Data Wrangler 通过内置和自定义数据转换和分析(包括特征目标泄漏和快速建模)创建复杂的机器学习数据准备工作流。

定义数据准备工作流后,或数据流,您可以将其与 SageMaker 处理、SageMaker 管道和 SageMaker 功能存储集成,从而简化处理、共享和存储 ML 训练数据的任务。您还可以将数据流导出到 python 脚本,并创建自定义的 ML 数据准备管道。

有关更多信息,请参阅使用 Amazon SageMaker er 数据牧羊人准备 ML 数据