探索、分析和处理数据 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

探索、分析和处理数据

使用数据集训练模型之前,数据科学家通常会对其进行探索、分析和预处理。

要预处理数据,请使用以下方法之一:

Amazon SageMaker处理 允许在 SageMaker 上轻松、大规模地运行作业,以便对数据进行预处理和后期处理,执行功能设计以及评估模型。当与 SageMaker 提供的其他关键机器学习任务(如训练和托管)结合使用时,处理 具备完全托管的机器学习环境的诸多优势,其中包括 SageMaker 所有内置的安全性和合规性支持。借助 处理,您可以灵活地使用内置的数据处理容器,或者使用您自己的容器并提交自定义作业以便在托管基础结构上运行。在提交作业之后,SageMaker 将启动计算实例、处理和分析输入数据,并在完成后释放资源。有关更多信息,请参阅处理数据