追踪 SageMaker 机器学习管道的血统 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

追踪 SageMaker 机器学习管道的血统

在本教程中,您将使用 Amazon SageMaker Studio 来跟踪亚马逊 SageMaker 机器学习管道的血统。

该管道由 Amazon SageMaker 示例 GitHub 存储库中的 “使用亚马逊 SageMaker 模型构建管道编排任务” 笔记本创建。有关如何创建管道的详细信息,请参阅定义模型构建管道

Studio 中的世系跟踪以有向无环图 (DAG) 为中心。DAG 表示管道中的步骤。在 DAG 中,您可以跟踪从任何步骤到任何其他步骤的世系。下图显示了管道中的步骤。这些步骤在 Studio 中显示为 DAG。

管道工作流程的步骤示意图。

要在 Amazon SageMaker Studio 控制台中跟踪管道的血统,请根据您使用的是 Studio 还是 Studio Classic 完成以下步骤。

Studio
跟踪管道的世系
  1. 按照启动 Amazon SageMaker Studio 中的说明打开 SageMaker Studio 控制台。

  2. 在左侧导航窗格中,选择 “流水线”。

  3. (可选)要按名称筛选管道列表,请在搜索字段中输入完整或部分管道名称。

  4. 在 “名称” 列中,选择管道名称以查看有关该管道的详细信息。管道的 “执行” 页面打开,并显示管道执行列表。

  5. 在 “执行” 表的 “名称” 列中,选择要查看的管道执行的名称。

  6. 执行页面的右上角,选择垂直省略号,然后选择下载管道定义 (JSON)。您可以查看该文件以了解管道图表的定义方式。

  7. 使用图表右下角的大小调整图标来放大和缩小图表、使图表适应屏幕或将图表扩展到全屏。要聚焦于图表的特定部分,可以选择图表的空白区域,然后将图表拖动到该区域的中心。图表右下角的嵌入图显示您在图表中的位置。

    下图显示了带有插图和调整大小图标的管道图示例。此外,图表右侧的选项卡包含有关您的管道运行的详细信息。

    管道图和显示步骤详细信息的选项卡。
  8. 要查看您的训练、验证和测试数据集,请完成以下步骤:

    1. 在管道图中选择处理步骤。

    2. 述选项卡的文件部分,找到训练、验证和测试数据集的 Amazon S3 路径。

  9. 要查看您的模型工件,请完成以下步骤:

    1. 在管道图中选择 “训练” 步骤。

    2. 述选项卡的文件部分,找到模型工件的 Amazon S3 路径。

  10. 要查找模型包 ARN,请完成以下步骤:

    1. 选择模型寄存器 (RegisterModel) 步骤。

    2. 概述选项卡的文件部分,找到模型包的 ARN。

Studio Classic
跟踪管道的世系
  1. 登录亚马逊 SageMaker Studio 经典版。有关更多信息,请参阅启动 Amazon SageMaker Studio 经典版

  2. 在 Studio 的左侧边栏中,选择主页图标 ( )。

  3. 在菜单中,选择管道

  4. 使用搜索框来筛选管道列表。

  5. 选择AbalonePipeline管道以查看执行列表以及有关该管道的其他详细信息。

  6. 在右侧边栏中选择 Property Inspector 图标 ( ),打开表属性窗格,您可以在其中选择要查看的属性。

  7. 选择设置选项卡,然后选择下载管道定义文件。您可以查看该文件以了解管道图表的定义方式。

  8. 在 “执行” 选项卡上,选择执行列表中的第一行以查看其执行图表以及有关该执行的其他详细信息。请注意,该图表与教程开头显示的图表相匹配。

    使用图表右下角的大小调整图标来放大和缩小图表、使图表适应屏幕或将图表扩展到全屏。要聚焦于图表的特定部分,可以选择图表的空白区域,然后将图表拖动到该区域的中心。图表右下角的嵌入图显示您在图表中的位置。

    管道 DAG。
  9. 图表选项卡上,选择 AbaloneProcess 步骤以查看有关该步骤的详细信息。

  10. 输出选项卡的文件下方找到训练、验证和测试数据集的 Amazon S3 路径。

    注意

    要获取完整路径,请右键单击路径,然后选择复制单元格内容

    s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/train s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/validation s3://sagemaker-eu-west-1-acct-id/sklearn-abalone-process-2020-12-05-17-28-28-509/output/test
  11. 选择 AbaloneTrain 步骤。

  12. 输出选项卡的文件下方找到模型构件的 Amazon S3 路径:

    s3://sagemaker-eu-west-1-acct-id/AbaloneTrain/pipelines-6locnsqz4bfu-AbaloneTrain-NtfEpI0Ahu/output/model.tar.gz
  13. 选择 AbaloneRegisterModel 步骤。

  14. 输出选项卡的文件下方找到模型包的 ARN:

    arn:aws:sagemaker:eu-west-1:acct-id:model-package/abalonemodelpackagegroupname/2