探索、分析和处理数据 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

探索、分析和处理数据

使用数据集训练模型之前,数据科学家通常会对其进行探索、分析和预处理。

Amazon SageMaker Processing 允许在 SageMaker 上轻松、大规模地运行作业,以便对数据进行预处理和后期处理,执行特征工程以及评估模型。当与 SageMaker 提供的其他关键机器学习任务(如训练和托管)结合使用时,Processing 具备完全托管的机器学习环境的诸多优势,其中包括 SageMaker 内置的所有安全性和合规性支持。借助 Processing,您可以灵活地使用内置的数据处理容器,或者使用您自己的容器并提交自定义作业以便在托管基础设施上运行。在提交作业之后,SageMaker 将启动计算实例、处理和分析输入数据,并在完成后释放资源。有关更多信息,请参阅 处理数据