Amazon SageMaker 模型构建管道 - 亚马逊 SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker 模型构建管道

Amazon SageMaker 模型构建管道是一种用于构建利用直接 SageMaker 集成的机器学习管道的工具。由于这种集成,您可以使用可为您处理大部分步骤创建和管理的工具来创建管道并设置 SageMaker项目以进行编排。 SageMaker 相比其他Amazon工作流程产品,Pipelines 具备以下优势:

SageMaker 整合

SageMaker Pipelines 直接集成到 SageMaker,因此您无需与任何其他Amazon服务进行交互。您也不需要管理任何资源,因为 Pipelines 是一项完全托 SageMaker 管的服务,这意味着它可以为您创建和管理资源。

SageMaker Python 开发工具

由于 SageMaker 管道与 SageMaker Python SDK 集成,因此您可以使用您可能已经熟悉的高级别 Python 接口以编程方式创建管道。要查看 SageMaker Python 开发工具包 API 参考资料,请参阅流水线。有关 SageMaker Python SDK 代码示例,请参阅亚马逊 SageMaker 模型构建管道

SageMaker 工作室集成

SageMaker Studio 提供了一个管理 end-to-end SageMaker 管道体验的环境。使用 Studio,您可以绕过Amazon控制台进行整个工作流程管理。有关从 SageMaker Studio 管理 SageMaker 流水线的更多信息,请参阅在 SageMaker Studio 中查看、跟踪和 SageMaker 执行流水线

数据谱系跟踪

使用 SageMaker 管道,您可以跟踪管道执行中的数据历史记录。Amazon SageMaker ML Lineage Tracking 允许您分析数据的来源、用作输入的位置以及由此产生的输出。例如,您可以查看根据单个数据集创建的模型,也可以查看创建单个模型时使用的数据集。有关更多信息,请参阅亚马逊 SageMaker ML 世系追踪

重复使用步骤

使用 SageMaker 管道,您可以指定缓存步骤。缓存步骤时,如果再次执行同一步骤,则会对其进行索引以供日后重用。因此,您可以在同一管道中重复使用先前执行相同步骤的输出而无需再次运行该步骤。有关步骤缓存的更多信息,请参阅缓存管道步骤