跟踪实体 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

跟踪实体

跟踪实体可保留端到端机器学习工作流程中所有元素的表示形式。您可以使用此表示形式来建立模型监管、重现工作流程并保留工作历史记录。

Amazon SageMaker 会在您创建 SageMaker 作业(如处理作业、训练作业和批量转换作业)时自动为试验组件及其关联的试验和实验创建跟踪实体。有关更多信息,请参阅使用 Amazon SageMaker 实验管理机器学习

SageMaker 还自动为工作流程中的其他步骤创建跟踪实体,使您可以端到端跟踪工作流程。有关更多信息,请参阅Amazon SageMaker 已创建跟踪实体

您可以创建其他实体来补充 SageMaker 创建的实体。有关更多信息,请参阅手动创建跟踪实体

SageMaker 重复使用任何现有实体,而不是创建新实体。例如,只能有一个具有唯一 SourceUri 的构件。

定义了以下跟踪实体:

实验实体

  • 试验组件 – 机器学习试验的阶段。包括处理作业、训练作业和批量转换作业。

  • 试验 通常会生成模型的试验组件组合。–

  • 实验 通常会专注于解决特定使用案例的试验分组。–

谱系实体

  • 上下文 – 提供其他跟踪或实验实体的逻辑分组。从概念上讲,实验和试验是上下文。一些示例是终端节点和模型包。

  • Action – 表示操作或活动。通常,一个操作涉及至少一个输入项目或输出项目。例如,工作流程步骤和模型部署。

  • 构件 – 表示可寻址的 URI 对象或数据。构件通常是试验组件或操作的输入或输出。一些示例包括数据集(Amazon S3 存储桶 URI)、映像(Amazon ECR 注册表路径)或操作 (ARN)。

  • 关联 链接其他跟踪或实验实体。–例如,训练数据的位置与训练作业之间的关联。

    关联具有可选的 AssociationType 属性。以下值可用于每种类型的建议使用情况。SageMaker 不会对其使用施加任何限制:

    • ContributedTo – 源对目标有贡献,或者是部分负责启用目标。例如,训练数据有助于训练作业。

    • AssociatedWith – 源已连接到目标。例如,审批工作流程与模型部署关联。

    • DerivedFrom - 目标是源的修改。例如,处理作业的通道输入的摘要输出派生自原始输入。

    • Produced – 源生成了目标。例如,训练作业生成了模型构件。

通用属性

  • 类型属性

    操作、构件和上下文实体分别具有 type (类型) 属性、ActionTypeArtifactTypeContextType。此属性是一个自定义字符串,它可以将有意义的信息与实体关联,并用作列表 APIs 中的筛选条件。

  • 源属性

    操作、构件和上下文实体具有 Source 属性。此属性提供实体表示的基础 URI。一些示例包括:

    • 一个 UpdateEndpoint 操作,其中源是 EndpointArn

    • 处理作业的图像构件,其中源是 ImageUri

    • 一个 Endpoint 上下文,其中源是 EndpointArn

  • 元数据属性

    操作和构件实体具有可选的 Metadata 属性,该属性可以提供以下信息:

    • ProjectId – 例如,模型所属的 SageMaker MLOps 项目的 ID。

    • GeneratedBy – 例如,注册模型包版本的 SageMaker 管道执行。

    • Repository – 例如,包含算法的存储库。

    • CommitId – 例如,算法版本的提交 ID。