亚马逊 SageMaker ML 血统追踪 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊 SageMaker ML 血统追踪

重要

截至 2023 年 11 月 30 日,之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新后的 Studio 体验的信息,请参阅亚马逊 SageMaker Studio

Amazon SageMaker ML Lineage Tracking 创建并存储有关机器学习 (ML) 工作流程从数据准备到模型部署的各个步骤的信息。利用跟踪信息,您可以重现工作流步骤,跟踪模型和数据集世系,并建立模型治理和审计标准。

SageMaker的 Lineage Tracking 功能在后端运行,用于跟踪与您的模型训练和部署工作流程相关的所有元数据。其中包括您的训练作业、使用的数据集、管道、端点和实际模型。您可以随时查询世系服务,以找到用于训练模型的确切构件。使用这些构件,只要您可以访问所使用的确切数据集,就可以重新创建相同的机器学习工作流来重现模型。一个试验组件会跟踪训练作业。此试验组件包含用作训练作业一部分的所有参数。如果不需要重新运行整个工作流,可以重现训练作业以派生出相同的模型。

借助 SageMaker Lineage Tracking,数据科学家和模型构建者可以执行以下操作:

  • 保存模型发现实验的运行历史记录。

  • 通过跟踪用于审计和合规性验证的模型世系构件,建立模型治理。

下图显示了 Amazon 在 end-to-end模型训练和部署 ML 工作流程中 SageMaker 自动创建的谱系图示例。

为跟踪您的工作流程而创建的世系实体元数据的示例图。 SageMaker