使用 SageMaker 执行自动模型优化 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 SageMaker 执行自动模型优化

Amazon SageMaker 自动模型优化(也称为超参数优化)通过使用您指定的算法和超参数范围在您的数据集上运行很多训练作业来查找模型的最佳版本。然后,它会选择超参数值来生成性能最佳的模型(按所选指标衡量)。

例如,假设您希望解决营销数据集上的二进制分类问题。您的目标是最大化曲线下面的区域 (auc)度量,通过训练XGBoost 算法模型。您不知道应该使用 etaalphamin_child_weightmax_depth 超参数的哪些值来训练最佳模型。要查找这些超参数的最佳值,您可以指定 SageMaker 超参数优化搜索的值范围,根据您选择的目标指标进行评估,查找在训练作业中获得最佳表现的值组合。超参数优化会启动训练作业,使用您指定范围中的超参数值,然后返回具有最高 auc 的训练作业。

您可以将 SageMaker 自动模型优化与内置算法、自定义算法和机器学习框架的 SageMaker 预构建容器结合使用。

Amazon SageMaker 自动模型调整可以使用 Amazon EC2 竞价型实例来优化运行培训作业时的成本。有关托管现场训练的更多信息,请参阅亚马逊 SageMaker 中的托管的 Spot 训练.

在开始使用超参数优化之前,您应该已经具有明确定义的机器学习问题,包括下列内容:

  • 一个数据集

  • 了解需要训练的算法的类型

  • 明确了解如何衡量成功

您还应准备数据集和算法,使其可用于 SageMaker 中,并至少成功运行训练作业一次。有关设置和运行训练作业的信息,请参阅开始使用 Amazon SageMaker 入门