本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
实体简介
如果有数据,Amazon SageMaker 会自动为 SageMaker 任务、模型、模型包和终端节点创建跟踪实体。对于基本的工作流程,假设您使用数据集训练模型。 SageMaker 自动生成包含三个实体的谱系图:
-
数据集:一种构件,即表示URI可寻址对象或数据的实体。构件通常是试验组件或操作的输入或输出。
-
TrainingJob:一种试验组件,即代表处理、训练和转换作业的实体。
-
Model:另一种构件。与数据集构件一样,模型也是一个URI可寻址的对象。在本例中,它是TrainingJob试用组件的输出。
如果您在工作流中添加其他步骤(如数据预处理或后处理),将模型部署到端点,或者将模型包含在模型包中,等等,则模型世系图会迅速扩展。有关 SageMaker 实体的完整列表,请参阅亚马逊 SageMaker ML 血统追踪。
实体属性
图表中的每个节点都显示实体类型,但您可以选择实体类型右侧的垂直省略号来查看与工作流相关的具体细节。在我们之前的准系统谱系图中,你可以选择旁边的垂直省略号DataSet来查看以下属性的特定值(所有工件实体都通用):
-
名称:数据集的名称。
-
来源 URI:您的数据集的 Amazon S3 位置。
对于 TrainingJob
实体,可以看到以下属性(所有 TrialComponent
实体都通用)的特定值:
-
名称:训练作业的名称。
-
JobARN:您的训练作业的 Amazon 资源名称 (ARN)。
对于模型实体,您看到的属性与列出的属性相同,DataSet因为它们都是构件实体。有关实体及其关联属性的列表,请参阅世系跟踪实体。
实体查询
Amazon 会在您使用世系实体时 SageMaker 自动生成图表。但是,如果您正在对实验进行多次迭代,并且不想查看每个谱系图,则 Amazon SDK可以帮助您在所有工作流程中执行查询。例如,您可以查询所有使用端点的处理作业的世系实体。或者,您可以看到所有使用构件的下游跟踪。有关可执行的所有查询的列表,请参阅查询世系实体。