Amazon SageMaker Autopilot 示例笔记本 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon SageMaker Autopilot 示例笔记本

以下笔记本可作为实用动手操作示例,用于处理 Autopilot 的各种使用场景。

在 SageMaker GitHub 示例存储库的 autopilot 目录中,您可以找到 Autopilot 的所有笔记本。

建议您在 Studio 中克隆完整的 Git 存储库,以便直接访问和运行笔记本。有关如何在 Studio 中克隆 Git 存储库的信息,请参阅在 SageMaker Studio 中克隆 Git 存储库

使用案例 描述
无服务器推理

默认情况下,Autopilot 允许将生成的模型部署到实时推理端点。在此存储库中,笔记本说明了如何将在 ENSEMBLINGHYPERPARAMETER OPTIMIZATION (HPO) 模式下训练的 Autopilot 模型部署到无服务器端点。无服务器端点会自动启动计算资源,并根据流量横向扩展和缩减,而无需选择实例类型或管理扩展策略。

自定义特征选择

Autopilot 会检查您的数据集,并运行多个候选模型,以找出数据预处理步骤、机器学习算法和超参数的最佳组合。您可以轻松地将其部署在实时端点,也可用于批量处理。

在某些情况下,您可能希望能够灵活地将自定义数据处理代码引入 Autopilot。例如,您的数据集可能包含大量自变量,您可能希望加入一个自定义特征选择步骤,以便首先移除不相关的变量。这样得到的较小的数据集可用于启动 Autopilot 作业。最终,您可能还希望包括自定义处理代码和来自 Autopilot 的模型,以进行实时或批量处理。

管道示例

虽然 Autopilot 简化了构建 ML 模型的过程,但 MLOps 工程师仍负责在生产环境中创建、自动化和管理端到端 ML 工作流。SageMaker Pipelines 可以协助自动执行 ML 生命周期的各种步骤,例如数据预处理、模型训练、超参数调整、模型评估和部署。本笔记本演示了如何将 Autopilot 整合到 SageMaker Pipelines 的端到端 AutoML 训练工作流中。要在 Pipelines 中启动 Autopilot 实验,您必须使用 Pipelines Lambda处理步骤编写自定义集成代码,从而创建模型构建工作流。有关更多信息,请参阅使用 Amazon SageMaker Pipelines 将 Amazon SageMaker Autopilot ML 模型从实验转移到生产

或者,在组合模式下使用 Autopilot 时,您可以参考笔记本示例,该示例演示了如何使用 SageMaker 管道的原生 AutoML 步骤中的原生 AutoML 步骤。由于 Pipelines 支持将 Autopilot 作为原生步骤,您现在可以在 Pipelines 中添加自动训练步骤 (AutoMLStep),然后在组合模式下调用 Autopilot 实验。

更多笔记本

在根目录中,您可以找到更多说明其他使用场景的笔记本,例如批量转换时间序列预测等。