跟踪管道的发展历程 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

跟踪管道的发展历程

在本教程中,您将使用 Amazon SageMaker Studio 来跟踪亚马逊 A SageMaker I 机器学习管道的血统。

该管道由 Amazon SageMaker 示例 GitHub 存储库中的 “使用亚马逊 SageMaker 模型构建管道编排任务” 笔记本创建。有关如何创建管道的详细信息,请参阅定义管道

Studio 中的血统跟踪以有向无环图 () DAG 为中心。DAG表示管道中的步骤。从中DAG你可以追踪从任何步骤到任何其他步骤的血统。下图显示了管道中的步骤。这些步骤在 Studio DAG 中显示为。

管道工作流程的步骤图。

要在 Amazon SageMaker Studio 控制台中跟踪管道的血统,请根据您使用的是 Studio 还是 Studio Classic 完成以下步骤。

Studio
跟踪管道的世系
  1. 按照启动 Amazon SageMaker Studio 中的说明打开 SageMaker Studio 控制台。

  2. 在左侧导航窗格中,选择 Pipelines

  3. (可选)要按名称筛选管道列表,请在搜索字段中输入管道的全名或部分名称。

  4. 名称列中,选择管道名称以查看管道的详细信息。

  5. 选择执行选项卡。

  6. 执行表的名称列中,选择要查看的管道执行名称。

  7. 在 “执行” 页面的右上角,选择垂直省略号,然后选择 “下载管道定义” (JSON)。您可以查看该文件以了解管道图表的定义方式。

  8. 选择编辑打开管道设计器。

  9. 使用画布右上角的大小调整和缩放控件可以放大或缩小图表,将图表调整到适合屏幕,或将图表扩展到全屏。

  10. 要查看训练、验证和测试数据集,请完成以下步骤:

    1. 选择管道图中的处理步骤。

    2. 在右侧边栏选择概览选项卡。

    3. 文件部分,找到训练、验证和测试数据集的 Amazon S3 路径。

  11. 要查看模型构件,请完成以下步骤:

    1. 选择管道图中的 Training 步骤。

    2. 在右侧边栏选择概览选项卡。

    3. 文件部分,找到模型构件的 Amazon S3 路径。

  12. 要查找模型包ARN,请完成以下步骤:

    1. 选择注册模型步骤。

    2. 在右侧边栏选择概览选项卡。

    3. 在 “文件” 部分,ARN找到模型包的。

Studio Classic
跟踪管道的世系
  1. 登录亚马逊 SageMaker Studio 经典版。有关更多信息,请参阅启动 Amazon SageMaker Studio 经典版

  2. 在 Studio 的左侧边栏中,选择主页图标 ( Black square icon representing a placeholder or empty image. )。

  3. 在菜单中,选择管道

  4. 使用搜索框来筛选管道列表。

  5. 选择 AbalonePipeline 管道,查看执行列表和管道的其他详细信息。

  6. 选择右侧边栏中的 “属性检查器” 图标 ( Black square icon representing a placeholder or empty image. ) 以打开TABLEPROPERTIES窗格,您可以在其中选择要查看的属性。

  7. 选择设置选项卡,然后选择下载管道定义文件。您可以查看该文件以了解管道图表的定义方式。

  8. 执行标签中,选择执行列表中的第一行,查看其执行图和有关执行的其他详细信息。请注意,该图表与教程开头显示的图表相匹配。

    使用图表右下方的大小调整图标可以放大或缩小图表,将图表调整到适合屏幕,或将图表扩展到全屏。要聚焦于图表的特定部分,可以选择图表的空白区域,然后拖动图表使其居中。图表右下角的嵌入图显示您在图表中的位置。

    带有嵌入和大小调整图标的管道图示例。
  9. 图表选项卡上,选择 AbaloneProcess 步骤以查看有关该步骤的详细信息。

  10. 输出选项卡的文件下方找到训练、验证和测试数据集的 Amazon S3 路径。

    注意

    要获取完整路径,请右键单击路径,然后选择复制单元格内容

    s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/train s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/validation s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/test
  11. 选择 AbaloneTrain 步骤。

  12. 输出选项卡的文件下方找到模型构件的 Amazon S3 路径:

    s3://sagemaker-eu-west-1-acct-id/AbaloneTrain/pipelines-6locnsqz4bfu-AbaloneTrain-NtfEpI0Ahu/output/model.tar.gz
  13. 选择 AbaloneRegisterModel 步骤。

  14. 在 “ARN输出” 选项卡的 “文件:” 下方找到模型包的

    arn:aws:sagemaker:eu-west-1:acct-id:model-package/abalonemodelpackagegroupname/2