使用执行自动模型调整 SageMaker - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用执行自动模型调整 SageMaker

Amazon SageMaker 自动模型调整 (AMT),也称为超参数调整,它通过在您的数据集中运行许多训练作业来找到模型的最佳版本。为此,AMT 使用您指定的算法和超参数范围。然后,选择超参数值创建性能最佳的模型(按照您选择的指标衡量)。

例如,假设您希望解决营销数据集上的二进制分类问题。您的目标是通过训练 在亚马逊上使用 xgBoost 算法 SageMaker模型,最大化算法的曲线下面积 (AUC) 指标。您希望找出 etaalphamin_child_weightmax_depth 超参数的哪些值可以训练出最佳模型。为这些超参数指定值的范围。然后, SageMaker 超参数调整在这些范围内进行搜索以找到创建具有最高 AUC 模型的训练作业的值组合。为了节省资源或满足特定的模型质量期望,您还可以设置完成标准,以便在达到标准后停止调优。

您可以将 SageMaker AMT 与内置算法、自定义算法或机器学习框架的 SageMaker 预建容器一起使用。

SageMaker 在运行训练作业时,AMT 可以使用 Amazon EC2 竞价型实例来优化成本。有关更多信息,请参阅 在 Amazon 中使用托管竞技训练 SageMaker

在开始使用超参数调优之前,您应该已经具有明确定义的机器学习问题,包括下列内容:

  • 数据集

  • 了解需要训练的算法类型

  • 明确了解如何衡量成功

准备好您的数据集和算法,以便它们在训练作业中工作 SageMaker 并成功运行至少一次。有关设置和运行训练作业的信息,请参阅Amazon 入门指南 SageMaker