Amazon SageMaker 建模管线 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon SageMaker 建模管线

Amazon SageMaker 建模管线是一款利用 SageMaker 直接集成优势构建机器学习管道的工具。通过这种集成,您可以创建一个管道,并使用一款能为您处理大部分步骤创建和管理流程的工具来设置 SageMaker 项目以进行编排。您可以使用 SageMaker Python SDK 构建管道,也可以使用 SageMaker 管道定义 JSON 架构创作管道。

相比其他 Amazon 工作流产品,SageMaker Pipelines 具有以下优势:

SageMaker 集成

SageMaker Pipelines 直接与 SageMaker 集成,因此您无需与任何其他 Amazon 服务进行交互。您也无需管理任何资源,因为 SageMaker Pipelines 是一项完全托管的服务,这意味着它可以为您创建和管理资源。

SageMaker Python SDK 集成

由于 SageMaker Pipelines 与 SageMaker Python SDK 集成在一起,因此您可以使用可能已经熟悉的高级 Python 接口以编程方式创建管道。要查看 SageMaker Python SDK API 参考,请参阅管道。有关 SageMaker Python SDK 代码示例,请参阅 Amazon SageMaker 建模管线

SageMaker Studio 集成

SageMaker Studio 提供了管理端到端 SageMaker Pipelines 体验的环境。使用 Studio,您可以绕过 Amazon 控制台来管理整个工作流。有关从 SageMaker Studio 管理 SageMaker Pipelines 的更多信息,请参阅在 SageMaker Studio 中查看、跟踪和执行 SageMaker Pipelines

数据世系跟踪

借助 SageMaker Pipelines,您可以在管道执行过程中跟踪数据的历史记录。借助 Amazon SageMaker 机器学习世系跟踪,您可以分析数据的来源、用作输入的位置以及由此生成的输出。例如,您可以查看根据单个数据集创建的模型,也可以查看创建单个模型时使用的数据集。有关更多信息,请参阅 Amazon SageMaker 机器学习世系跟踪

步骤重复使用

使用 SageMaker Pipelines,您可以指定要进行缓存的步骤。缓存一个步骤后,如果再次执行同一步骤,则会对其进行索引,以便以后重复使用。因此,您可以在同一管道中重复使用以前执行同一步骤的输出,而无需再次运行该步骤。有关步骤缓存的更多信息,请参阅缓存管道步骤