使用 SageMaker 执行自动模型调优 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 SageMaker 执行自动模型调优

Amazon SageMaker 自动模型调优 (AMT) 也称为超参数调优,通过在数据集上运行大量训练作业来查找模型的最佳版本。为此,AMT 使用您指定的算法和超参数范围。然后,选择超参数值创建性能最佳的模型(按照您选择的指标衡量)。

例如,假设您希望解决营销数据集上的二进制分类问题。您的目标是通过训练 XGBoost 算法模型,最大化算法的曲线下面积 (AUC) 指标。您希望找出 etaalphamin_child_weightmax_depth 超参数的哪些值可以训练出最佳模型。为这些超参数指定值的范围。然后,SageMaker 超参数调优在这些范围内进行搜索,以找到能够创建可生成具最高 AUC 的模型的训练作业的值组合。为了节省资源或满足特定的模型质量期望,您还可以设置完成标准,以便在达到标准后停止调优。

您可以将 SageMaker AMT 与内置算法、自定义算法或 SageMaker 预构建容器结合使用于机器学习框架。

在运行训练作业时,SageMaker AMT 可以使用 Amazon EC2 竞价型实例优化成本。有关更多信息,请参阅使用 Amazon SageMaker 中的托管竞价型训练

在开始使用超参数调优之前,您应该已经具有明确定义的机器学习问题,包括下列内容:

  • 数据集

  • 了解需要训练的算法类型

  • 明确了解如何衡量成功

请准备数据集和算法,使其可用于 SageMaker 中,并至少成功运行训练作业一次。有关设置和运行训练作业的信息,请参阅开始使用