跟踪实体 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

跟踪实体

跟踪实体维护端到端机器学习工作流的所有元素的表示。您可以使用此表示形式建立模型治理、重现工作流以及维护工作历史记录。

当您创建 SageMaker 作业(如处理作业、培训作业和批量转换作业)时,Amazon SageMaker 会自动为试用组件及其相关试验和实验创建跟踪实体。有关更多信息,请参阅使用 Amazon SageMaker 实验管理 Machine Learning

SageMaker 还会自动为工作流中的其他步骤创建跟踪实体,使您能够从端到端跟踪工作流。有关更多信息,请参阅Amazon SageMaker 已创建追踪实体

您可以创建其他实体以补充由 SageMaker 创建的实体。有关更多信息,请参阅手动创建跟踪实体

SageMaker 重用任何现有实体,而不是创建新实体。例如,只能有一个具有唯一SourceUri.

定义了以下跟踪实体:

实验实体

  • 试用构成部分— 机器学习试验的阶段。包括处理作业、训练作业和批量转换作业。

  • 试用— 通常生成模型的试验组件的组合。

  • 试验— 一组试验通常侧重于解决特定用例。

世系实体

  • 上下文— 提供其他跟踪或试验实体的逻辑分组。从概念上讲,实验和试验是背景。一些示例包括端点和模型包。

  • 操作— 表示操作或活动。通常,操作至少涉及一个输入工件或输出工件。一些示例包括工作流步骤和模型部署。

  • Artifact— 表示 URI 可寻址的对象或数据。工件通常是试验组件或操作的输入或输出。一些示例包括数据集(Amazon S3 存储桶 URI)、映像(Amazon ECR 注册表路径)或操作 (ARN)。

  • 关联— 链接其他追踪或实验图元。例如,训练数据位置与训练作业之间的关联。

    关联具有可选AssociationType属性。以下值与每种类型的建议用法一起提供。SageMaker 对其使用没有任何限制:

    • ContributedTo— 源对目标作出贡献或在启用目标方面具有一部分。例如,培训数据有助于培训工作。

    • AssociatedWith— 源连接到目标。例如,审核工作流与模型部署相关联。

    • DerivedFrom-目标是源的修改。例如,处理作业的通道输入的摘要输出来自原始输入。

    • Produced— 源生成目标。例如,一个培训作业生成了一个模型工件。

常见属性

  • 类型属性

    操作、工件和上下文实体具有type财产,ActionTypeArtifactType, 和ContextType,分别。此属性是一个自定义字符串,它可以将有意义的信息与实体相关联,并在 List API 中用作筛选器。

  • 源属性

    操作、工件和上下文实体具有Source属性。此属性提供实体表示的基础 URI。一些示例如下:

    • 网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的UpdateEndpoint操作,其中源是EndpointArn.

    • 处理作业的图像工件,其中源为ImageUri.

    • 网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的Endpoint上下文,其中源是EndpointArn.

  • 元数据属性

    动作和对象实体具有可选Metadata属性,它可以提供以下信息:

    • ProjectId— 例如,模型所属的 SageMaker MLOP 项目的 ID。

    • GeneratedBy— 例如,注册了模型包版本的 SageMaker 管道执行。

    • Repository— 例如,包含算法的存储库。

    • CommitId— 例如,算法版本的提交 ID。