Amazon SageMaker Autopilot 生成 notebook 以管理 任务AutoML - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker Autopilot 生成 notebook 以管理 任务AutoML

Amazon SageMaker Autopilot 管理自动机器学习 (AutoML) 过程中的关键任务。它们由 Autopilot 与 AutoML 作业一起实现。作业创建两个笔记本,用于描述 AutoML 为生成候选模型而需遵循的计划。Autopilot候选模型由一个(管道、算法)对组成。首先,有一个数据探索笔记本,它描述了 Autopilot 从您提供的数据中了解到的信息。其次,有一个候选项生成笔记本,它使用数据相关信息来生成候选项。

您可以在 Amazon SageMaker 中或本地运行这两个笔记本(如果您已安装 Amazon SageMaker Python SDK)。您可以像共享任何其他 SageMaker Studio 笔记本一样共享这些笔记本。这些笔记本是为您创建的,供您进行实验。例如,您可以在笔记本中编辑以下项目:

  • 对数据使用的预处理器

  • 超参数优化 (HPO) 运行的次数及其并行度

  • 要尝试的算法

  • 用于 HPO 作业的实例类型

  • 超参数范围

鼓励对候选项生成笔记本进行修改以用作一种学习工具。通过此功能,您可以了解在机器学习过程中做出的决策如何影响您的结果。

注意

在默认实例中运行笔记本时,将产生基准成本,但在从候选项笔记本中执行 HPO 作业时,这些作业使用额外的计算资源,这会产生额外成本。

数据探索笔记本

在 AutoML 作业的分析阶段将生成一个笔记本,帮助您确定数据集中的问题。它确定了要调查的特定区域,帮助您确定与数据相关的上游问题,这些问题可能会导致生成非最优模型。

候选项生成笔记本

候选项生成笔记本包含每个建议的预处理步骤、算法和超参数范围。如果您选择生成笔记本而不运行 AutoML 作业,则可以决定要训练和调整哪些候选项。它们会自动进行优化,并最终确定最佳候选项。如果您直接运行作业而未先查看候选项,在完成作业后打开笔记本时,将仅显示最佳的候选项。