

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 管道概述
<a name="pipelines-overview"></a>

Amazon SageMaker AI 管道是定向无环图 (DAG) 中一系列相互关联的步骤，这些步骤是使用 drag-and-drop UI 或 Pipelin [es SDK](https://sagemaker.readthedocs.io/en/stable/workflows/pipelines/sagemaker.workflow.pipelines.html) 定义的。您还可以使用[管道定义 JSON 模式](https://aws-sagemaker-mlops.github.io/sagemaker-model-building-pipeline-definition-JSON-schema/)构建管道。此 DAG JSON 定义提供了管道中每个步骤的要求和关系信息。管道 DAG 的结构由步骤之间的数据依赖关系决定。当一个步骤的输出属性作为输入传递给另一个步骤时，就会产生这些数据依赖关系。下图是管道 DAG 的示例：

![\[\]](http://docs.amazonaws.cn/sagemaker/latest/dg/images/pipeline-full.png)


**示例 DAG 包括以下步骤：**

1. `AbaloneProcess` 是[处理](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-processing)步骤的一个实例，在用于训练的数据上运行预处理脚本。例如，脚本可以填充缺失值，对数值数据进行规范化处理，或将数据分成训练数据集、验证数据集和测试数据集。

1. `AbaloneTrain` 是[训练](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-training)步骤的一个实例，用于配置超参数，并根据预处理的输入数据训练模型。

1. `AbaloneEval` 是[处理](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-processing)步骤的另一个实例，用于评估模型的准确性。本步骤展示了一个数据依赖的例子 - 本步骤使用 `AbaloneProcess` 的测试数据集输出。

1. `AbaloneMSECond`是 Condit [i](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-condition) on 步骤的一个实例，在本例中，该步骤进行检查以确保模型评估的 mean-square-error结果低于特定限制。如果模型不符合标准，管道运行就会停止。

1. 管道运行按以下步骤进行：

   1. `AbaloneRegisterModel`，其中 SageMaker AI 调用[RegisterModel](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-register-model)步骤将模型作为版本控制的模型包组注册到 Amazon SageMaker 模型注册表中。

   1. `AbaloneCreateModel`，其中 SageMaker AI 调用一个[CreateModel](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-create-model)步骤来创建模型，为批量转换做准备。在中`AbaloneTransform`， SageMaker AI 调用 “[转换](https://docs.amazonaws.cn/sagemaker/latest/dg/build-and-manage-steps.html#step-type-transform)” 步骤，对您指定的数据集生成模型预测。

以下主题介绍了 Pipelines 的基本概念。有关描述这些概念的实施的教程，请参阅[Pipelines 操作](pipelines-build.md)。

**Topics**
+ [管道结构和执行](build-and-manage-pipeline.md)
+ [IAM 访问管理](build-and-manage-access.md)
+ [为 Pipelines 设置跨账户支持](build-and-manage-xaccount.md)
+ [Pipeline 参数](build-and-manage-parameters.md)
+ [Pipelines 步骤](build-and-manage-steps.md)
+ [Lift-and-shift 使用 @step 装饰器的 Python 代码](pipelines-step-decorator.md)
+ [在步骤之间传递数据](build-and-manage-propertyfile.md)
+ [缓存管道步骤](pipelines-caching.md)
+ [管道步骤的重试策略](pipelines-retry-policy.md)
+ [选择性执行管道步骤](pipelines-selective-ex.md)
+ [基准计算、偏差检测和生命周期以及 Amazon Pi ClarifyCheck pelin SageMaker es 中的 QualityCheck 步骤](pipelines-quality-clarify-baseline-lifecycle.md)
+ [安排管道运行](pipeline-eventbridge.md)
+ [亚马逊 SageMaker 实验集成](pipelines-experiments.md)
+ [使用本地模式运行管道](pipelines-local-mode.md)
+ [对亚马逊 SageMaker 管道进行故障排除](pipelines-troubleshooting.md)