标签验证和调整 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

标签验证和调整

当需要验证数据集上的标签时,Amazon G SageMaker round Truth 提供了让工作人员验证标签是否正确或调整之前标签的功能。这些类型的作业分为两个不同的类别:

  • 标签验证 – 工作人员指出现有标签是否正确或评级其质量,并可添加注释来解释自己的推理。工作人员将无法修改或调整标签。

    如果您创建 3D 点云或视频帧标签调整或验证作业,则可以选择使标签类别属性(不支持 3D 点云语义分割)和帧属性由工作人员编辑。

  • 标签调整 – 工作人员调整之前的注释,如果适用,还调整标签类别和帧属性以更正它们。

以下 Ground Truth 内置任务类型支持调整和验证标注作业:

  • 边界框

  • 语义分割

  • 3D 点云对象检测、3D 点云对象跟踪和 3D 点云语义分割

  • 所有视频帧对象检测和视频帧对象跟踪任务类型 – 边界框、折线、多边形和关键点

提示

对于 3D 点云和视频帧标注验证作业,建议将新的标签类别属性或帧属性添加到标注作业中。工作人员可以使用这些属性来验证单个标签或整个帧。要了解有关标签类别和帧属性的更多信息,请参阅工作人员用户界面 (UI)(对于 3D 点云)和工作人员用户界面 (UI)(对于视频帧)。

您可以使用 SageMaker 控制台或启动标签验证和调整作业API。

注意事项和考虑事项

要在创建标签验证或调整作业时获得预期行为,请仔细验证输入数据。

  • 如果您使用的是图像数据,请验证您的清单文件是否包含十六进制RGB颜色信息。

  • 为节省处理成本,请筛选数据以确保标注作业输入清单中不包含不需要的对象。

  • 添加所需的 Amazon S3 权限以确保您的输入数据得到正确处理。

使用 Ground Truth 创建校正或验证标注作业时API,必须使用与原始标注作业LabelAttributeName不同的标注作业。

语义分割作业的颜色信息要求

为了在验证或调整任务中正确重现颜色信息,该工具要求清单中包含十六进制RGB颜色信息(例如,# FFFFFF 代表白色)。当您设置语义分割验证或调整作业时,该工具会检查清单以确定是否存在此信息。如果找不到,Amazon Gro SageMaker und Truth 会显示一条错误消息并结束任务设置。

在语义分割工具的先前版本中,类别颜色信息未以十六进制RGB格式输出到输出清单。在引入验证和调整工作流的同时,输出清单也引入了这一功能。因此,旧的输出清单与这个新工作流不兼容。

在开始工作之前筛选数据

Amazon G SageMaker round Truth 会处理您的输入清单中的所有对象。如果您有一个部分标注的数据集,则可能需要对输入清单使用 Amazon S3 Select 查询来创建自定义清单。未标注的对象会单独失败,但不会导致作业失败,而且可能会产生处理成本。筛选掉您不希望验证的对象会降低您的成本。

如果使用控制台创建验证作业,则可以使用控制台提供的筛选工具。如果您使用创建作业API,请根据需要将筛选数据作为工作流程的一部分。