Amazon SageMaker Model Building Pipelines - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker Model Building Pipelines

Amazon SageMaker Model Building Pipelines 是用于构建机器学习管道的工具,该管道利用了直接SageMaker集成。由于此集成,您可以使用可为您处理大量步骤创建和管理的工具创建管道并设置 SageMaker 项目以进行编排。 相对于其他SageMaker Pipelines工作流程产品AWS具有以下优势:

SageMaker 集成

SageMaker Pipelines 直接与 集成SageMaker,因此您无需与任何其他 AWS 服务交互。您也不需要管理任何 资源,因为 SageMaker Pipelines 是一项完全托管的服务,这意味着它将为您创建和管理 资源。

SageMaker Python 开发工具包集成

由于 SageMaker Pipelines 与 SageMaker Python 开发工具包集成,因此,您可以使用您可能已经熟悉的高级 Python 接口以编程方式创建管道。 要查看 SageMaker Python 开发工具包文档,请参阅管道

SageMaker 集成

SageMaker Studio 提供了管理端到端SageMaker Pipelines体验的环境。使用 Studio,您可以绕过整个工作流程管理的AWS控制台。有关SageMaker Pipelines从 SageMaker Studio 管理 的更多信息,请参阅在 SageMaker Studio 中查看、跟踪和执行 SageMaker 管道

数据谱系跟踪

借助 SageMaker Pipelines ,您可以跟踪管道执行中的数据历史记录。 Amazon SageMakerML 谱系跟踪可让您分析数据的来源、数据用作输入的位置以及从中生成的输出。例如,您可以查看从单个数据集创建的模型,也可以查看用于创建单个模型的数据集。有关更多信息,请参阅Amazon SageMaker ML 谱系跟踪

步骤重用

借助 SageMaker Pipelines,您可以指定缓存步骤。缓存步骤时,如果再次执行同一步骤,则会为其编制索引以供以后重复使用。因此,您可以重复使用同一管道中同一步骤的上一步执行的输出,而无需再次运行该步骤。有关步骤缓存的更多信息,请参阅缓存管道步骤