创建标记作业(控制台) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建标记作业(控制台)

您可以使用 Amazon SageMaker 控制台为所有 Ground Truth 内置任务类型和自定义标记工作流创建标记作业。对于内置任务类型,我们建议您将此页与页面中的任务类型. 每个任务类型页面都包含有关使用该任务类型创建标签作业的特定详细信息。

您需要提供以下内容以在 SageMaker 控制台中创建标记作业:

  • Amazon S3 中的输入清单文件。您可以将输入数据集放置在 Amazon S3 中,并使用 Ground Truth 控制台自动生成清单文件(3D 点云标签作业不支持)。

    或者,您也可以手动创建输入清单文件。要了解如何操作,请参阅输入数据

  • 用于存储输出数据的 Amazon S3 存储桶。

  • 具有 Amazon S3 中的资源访问权限并附加了 SageMaker 执行策略的 IAM 角色。对于常规解决方案,您可以将托管策略 AmazonSageMakerFullAccess 附加到 IAM 角色,并包含sagemaker和句点 (.)。

    有关更详细的策略,请参阅分配 IAM 权限以使用 Ground Truth.

    3D 点云任务类型具有其他安全性考虑。了解更多

  • 工作团队 您可以从由 Amazon Mechanical Turk 工作人员、供应商或您自己的私人工组成的员工中创建一个工作团队。要了解更多信息,请参阅创建和管理人力.

    您无法将 Mechanical Turk 人力用于 3D 点云或视频帧标记作业。

  • 如果您使用自定义标记工作流,您必须在 Amazon S3 中保存工作人员任务模板,并为该模板提供 Amazon S3 URI。有关更多信息,请参阅第 2 步:创建自定义工作人员任务模板

  • (可选)Amazon KMS密钥 ARN,如果您希望 SageMaker 使用您自己的Amazon KMS加密密钥而不是默认的 Amazon S3 服务密钥。

  • (可选)用于标记作业的数据集的现有标签。如果您希望工作人员调整、批准或拒绝标签,请使用该选项。

  • 如果要创建调整或验证标签任务,您必须在 Amazon S3 中拥有一个包含要调整或验证的标签的输出清单文件。此选项仅适用于边界框和语义分割图像标注作业以及 3D 点云和视频帧标注作业。建议您使用验证和调整标签创建验证或校正标注作业。

重要

您的工作组、输入清单文件、输出存储桶以及 Amazon S3 中的其他资源必须位于同一个Amazon用于创建标记作业的区域。

在使用 SageMaker 控制台创建标记作业时,需要将工作人员说明和标签添加到 Ground Truth 提供的工作人员 UI 中。在控制台中创建标记作业时,您可以预览工作人员 UI 并与之交互。您还可以在内置任务类型页.

创建标记作业(控制台)

  1. 通过以下网址登录 SageMaker 控制台:https://console.aws.amazon.com/sagemaker/.

  2. 在左侧导航窗格中,选择 Labeling jobs (标记作业)

  3. Labeling jobs (标记作业) 页面上,选择 Create labeling job (创建标记作业)

  4. 对于 Job name (作业名称),请输入标记作业的名称。

  5. (可选)如果要使用一个键以标识标签,请选择 I want to specify a label attribute name different from the labeling job name (我希望指定与标记作业名称不同的标签属性名称)。如果未选择该选项,将使用在上一步中指定的标记作业名称在输出清单文件中标识标签。

  6. 选择要设置的数据设置,以便在输入数据集和 Ground Truth 值之间建立连接。

    • 适用于自动化数据设置

    • 适用于手动数据设置

      • 适用于输入数据集位置中,请提供您输入清单文件所在的 Amazon S3 中的位置。例如,如果输入清单文件 manifestst.json 位于示例存储桶,输入S3: //示例存储桶/清单 .json.

      • 适用于输出数据集位置中,请在 Amazon S3 中提供您希望 Ground Truth 以存储标记作业的输出数据的位置。

  7. 适用于IAM 角色中,选择一个现有的 IAM 角色或创建一个 IAM 角色,该角色有权访问您在 Amazon S3 中的资源、写入到上面指定的输出 Amazon S3 存储桶并附加了 SageMaker 执行策略。

  8. (可选)其他配置,您可以指定希望工作人员标记多少数据集,并且希望 SageMaker 使用Amazon KMS加密密密密密钥。要对输出数据进行加密,您必须具有所需的Amazon KMS权限附加到在上一步中提供的 IAM 角色。有关更多信息,请参阅分配 IAM 权限以使用 Ground Truth

  9. 任务类型部分,位置在下任务类别中,使用下拉列表选择您的任务类别。

  10. Task selection (任务选择) 中,选择任务类型。

  11. (可选)为标记作业提供标签,以便以后在控制台中轻松找到该作业。

  12. 选择 Next (下一步)

  13. Workers (工作人员) 部分中,选择您要使用的人力类型。有关人力选项的更多详细信息,请参阅创建和管理人力

  14. (可选)在选择人力后,指定任务超时。这是为工作人员处理任务提供的最长时间。

    对于 3D 点云注释任务,默认任务超时为 3 天。文本和图像分类以及标签验标记作业的默认超时为 5 分钟。所有其他标记作业的默认超时为 60 分钟。

  15. (可选)对于边界框、语义分割、视频帧和 3D 点云任务类型,您可以选择显示现有标签(如果要显示输入数据集的标签以供工作人员验证或调整。

    对于边界框和语义分割标记作业,这将创建调整标记作业。

    对于 3D 点云和视频帧标记作业:

    • Select调整创建调整标注作业。选择此选项后,您可以添加新标签,但不能从上一个作业中删除或编辑现有标签。(可选)您可以选择要工作人员编辑的标签类别属性和框架属性。要将某个属性设置为可编辑属性,请选中该复选框允许工作人员编辑此属性作为该属性。

      或者,您可以添加新的标注类别和框架属性。

    • Select验证创建调整标注作业。选择此选项时,您不能在之前作业中添加、修改或删除现有标签。(可选)您可以选择要工作人员编辑的标签类别属性和框架属性。要将某个属性设置为可编辑属性,请选中该复选框允许工作人员编辑此属性作为该属性。

      我们建议您可以将新的标签类别属性添加到希望工作人员验证的标签中,或者添加一个或多个框架属性以使工作人员提供有关整个框架的信息。

    有关更多信息,请参阅验证和调整标签

  16. 配置工作人员的 UI:

    • 如果您正在使用内置任务类型中,指定工作人员说明和标签。

      • 对于图像分类和文本分类(单标签和多标签),您必须至少指定两个标签类别。对于所有其他内置任务类型,必须至少指定一个标签类别。

      • (可选)如果要创建 3D 点云或视频帧标记作业,可以指定标签类别属性(3D 点云语义分割不支持)和帧属性。可以将标签类别属性分配给一个或多个标签。帧属性将显示在每个点云或视频帧工作程序标签上。要了解更多信息,请参阅工作人员用户界面 (UI)用于 3D 点云和工作人员用户界面 (UI)适用于视频帧。

      • (可选)添加附加说明来帮助您的工作人员完成您的任务。

    • 如果要创建自定义标注工作流,则必须执行以下操作:

      • 输入自定义模板在代码框中。可以使用 HTML、液体模板语言和我们预先构建的 Web 组件来创建自定义模板。您可以选择从下拉菜单中开始使用基本模板。

      • 指定注释前和注释后 lambda 函数。要了解如何创建这些函数,请参阅第 3 步:处理方式Amazon Lambda.

  17. (可选)您可以选择请参阅预览以预览工作人员说明、标签,并与工作人员 UI 进行交互。在生成预览之前,请确保禁用浏览器的弹出窗口阻止程序。

  18. 选择创建

在成功创建标记作业后,您将重定向到 Labeling jobs (标记作业) 页面。您刚创建的标记作业的状态为正在进行中. 在工作人员完成任务时,将逐渐更新该状态。在成功完成所有任务后,该状态将变为 Completed (已完成)

如果在创建标记作业时出现问题,其状态将变为已失败.

要查看有关作业的更多详细信息,请选择标记作业名称。

后续步骤

在您的标签作业状态更改为已完成,您可以在创建该标记作业时指定的 Amazon S3 存储桶中查看输出数据。有关输出数据格式的更多信息,请参阅输出数据