使用亚马逊自动 SageMaker 驾驶仪自动开发模型 - 亚马逊 SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用亚马逊自动 SageMaker 驾驶仪自动开发模型

Amazon A SageMaker utopilot 是一项功能集,可自动执行自动机器学习 (AutoML) 过程的关键任务。它会探索您的数据,选择与您的问题类型相关的算法,并准备数据以促进模型训练和调整。在适当时,Autopilot 会自动对所有候选算法应用交叉验证重采样程序,以测试其预测未受过训练的数据的能力。它还生成指标来评估其候选机器学习模型的预测质量。它通过自动执行构成 AutoML 流程的这些关键任务来简化您的机器学习体验。它根据性能对所有经过优化的模型进行排名。它可以找到性能最佳的模型,您只需通常所需时间的一小部分即可部署该模型。

您可以通过不同的方式使用自动驾驶:在自动驾驶仪上(因此得名),也可以在不同程度的人工指导下使用,无需通过Amazon SageMaker Studio编写代码,也可以使用使用其中一个Amazon软件开发工具包的代码。Autopilot 目前支持回归以及二进制和多类分类问题类型。它支持格式化为 CSV 或 Parquet 文件的表格数据,其中每列包含具有特定数据类型的要素,每行包含一个观测值。接受的列数据类型包括数字、分类、文本和由逗号分隔的数字字符串组成的时间序列。Autopilot 支持在高达数百 GB 的大型数据集上构建机器学习模型。

Autopilort 还有助于解释模型如何使用功能归因方法进行 SageMaker 预测。Autopilot 会自动生成一份报告,指出每项功能对最佳候选人所作预测的重要性。这种可解释性功能可以使机器学习模型更容易被Amazon客户理解。生成的模型治理报告可用于为风险和合规团队以及外部监管机构提供信息。

您可以全面了解数据是如何处理的,以及如何为每个测试候选人选择、训练和调整模型。这是由Autopilot为每次试验生成的笔记本电脑提供的,其中包含用于探索数据和寻找最佳候选人的代码。笔记本还提供教育工具,帮助您学习和进行自己的机器学习实验。通过查看 Autopilot 提供的各种数据探索和候选定义笔记本,你可以了解实验中各种输入和权衡的影响。你还可以通过自己修改笔记本并重新运行它们,对性能较高的候选者进行进一步的实验。

下图概述了由 Autopilot 管理的 AutoML 流程的主要任务。


      亚马逊 A SageMaker  utopilot 使用的自动机器学习流程概述。

使用Amazon SageMaker,您可以按实际用量付费。您可以根据使用量为 SageMaker 或其他Amazon服务中的底层计算和存储资源付费。有关使用费用的更多信息 SageMaker,请参阅亚马逊 SageMaker定价