Amazon SageMaker 模型构建管道 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker 模型构建管道

Amazon SageMaker 模型构建管道是一种利用直接 SageMaker 集成来构建机器学习管道的工具。通过此集成,您可以创建管道并设置 SageMaker 项目以进行编排。此设置使用的工具可以处理大部分步骤的创建和管理。您可以使用 SageMaker Python SDK 构建管道,也可以使用管道定义 JSON 架构创作SageMaker 管道

SageMaker 与其他 Amazon 工作流程产品相比,Pipelines 具有以下优势:

SageMaker 集成

SageMaker Pipelines 直接与集成 SageMaker,因此您无需与任何其他 Amazon 服务进行交互。您也不需要管理任何资源,因为 Pipelin SageMaker es 是一项完全托管的服务。这意味着 Pipelin SageMaker es 会为您创建和管理资源。

SageMaker Python 软件开发工具包

由于 SageMaker 流水线已与 SageMaker Python SDK 集成,因此您可以使用高级 Python 接口以编程方式创建管道。要查看 SageMaker Python SDK API 参考,请参阅流水线。有关 SageMaker Python 软件开发工具包代码示例,请参阅亚马逊 SageMaker 模型构建管道

SageMaker 工作室集成

SageMaker Studio 提供了管理 end-to-end SageMaker 流水线体验的环境。使用 Studio,您可以绕过 Amazon 控制台进行整个工作流程管理。有关从 SageMaker Studio 管理 SageMaker 流水线的更多信息,请参阅在 SageMaker Studio 中查看、跟踪和执行 SageMaker 管道

数据世系跟踪

借 SageMaker 助 Pipelines,您可以在管道执行过程中跟踪数据的历史记录。Amazon SageMaker ML Lineage Tracking 允许您分析:

  • 数据来自哪里

  • 其中数据被用作输入

  • 从数据中生成的输出

例如,您可以查看根据单个数据集创建的模型,并查看创建单个模型所用的数据集。有关更多信息,请参阅 亚马逊 SageMaker ML Lineage 追踪

步骤重复使用

使用 P SageMaker ipelines,您可以指定缓存步骤。缓存步骤后,如果再次运行相同的步骤,则会对其进行索引,以便以后重复使用。然后,您可以重复使用同一管道中相同步骤的先前步骤运行的输出,而不必再次运行该步骤。有关步骤缓存的更多信息,请参阅缓存管道步骤