创建标记作业(控制台) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建标记作业(控制台)

您可以使用 Amazon SageMaker 控制台为所有 Ground Truth 内置任务类型和自定义标记工作流创建标记作业。对于内置任务类型,我们建议您将此页与任务类型的页面. 每个任务类型页面都包含使用该任务类型创建标签作业的具体详细信息。

您需要提供以下内容以在 SageMaker 控制台中创建标记作业:

  • Amazon S3 中的输入清单文件。您可以将输入数据集放在 Amazon S3 中,并使用 Ground Truth 控制台自动生成清单文件(不支持 3D 点云标签作业)。

    或者,您可以手动创建输入清单文件。要了解如何操作,请参阅输入数据

  • 用于存储输出数据的 Amazon S3 存储桶。

  • 具有在 Amazon S3 中访问资源的权限并附加了 SageMaker 执行策略的 IAM 角色。对于常规解决方案,您可以将托管策略 AmazonSageMakerFullAccess 附加到 IAM 角色,并包括:sagemaker和句点 (.)。

    有关更精细的策略,请参阅分配 IAM 权限以使用 Ground Truth.

    3D 点云任务类型还有其他安全注意事项。了解更多

  • 工作团队。您可以从 Amazon Mechanical Turk 员工、供应商或自己的私人员组成的员工中创建一个工作团队。要了解更多信息,请参阅创建和管理人力.

    您无法将 Mechanical Turk 人力用于 3D 点云或视频帧标记作业。

  • 如果使用自定义标记工作流,您必须在 Amazon S3 中保存工作人员任务模板,并为该模板提供 Amazon S3 URI。有关更多信息,请参阅 第 2 步:创建自定义工作人员任务模板

  • (可选)Amazon KMS如果希望 SageMaker 使用您自己的标记作业输出进行加密,则需要提供密钥 ARN。Amazon KMS加密密钥而不是默认的 Amazon S3 服务密钥。

  • (可选)用于标记作业的数据集的现有标签。如果您希望工作人员调整、批准或拒绝标签,请使用该选项。

  • 如果要创建调整或验证标签任务,则必须在 Amazon S3 中有一个输出清单文件,其中包含要调整或验证的标签。此选项仅适用于边界框和语义分割图像标注作业以及 3D 点云和视频帧标注作业。建议您使用上的说明。验证和调整标签以创建验证或调整标签作业。

重要

您的工作组、输入清单文件、输出存储桶以及 Amazon S3 中的其他资源必须位于同一位置Amazon您用来创建标记作业的区域。

在使用 SageMaker 控制台创建标记作业时,您可以将工作人员说明和标签添加到 Ground Truth 提供的工作人员 UI 中。在控制台中创建标记作业时,您可以预览工作人员 UI 并与之交互。你也可以在你的上面看到工作人员 UI 的预览内置任务类型页.

创建标记作业(控制台)

  1. 登录位于的 SageMaker 控制台。https://console.aws.amazon.com/sagemaker/.

  2. 在左侧导航窗格中,选择 Labeling jobs (标记作业)

  3. Labeling jobs (标记作业) 页面上,选择 Create labeling job (创建标记作业)

  4. 对于 Job name (作业名称),请输入标记作业的名称。

  5. (可选)如果要使用一个键以标识标签,请选择 I want to specify a label attribute name different from the labeling job name (我希望指定与标记作业名称不同的标签属性名称)。如果未选择该选项,将使用在上一步中指定的标记作业名称在输出清单文件中标识标签。

  6. 选择要设置的数据设置,以便在输入数据集和 Ground Truth 之间建立连接。

    • 适用于自动化数据设置

    • 适用于手动数据设置

      • 适用于输入数据集位置,请在 Amazon S3 中提供输入清单文件所在的位置。例如,如果输入清单文件 manifest.json 位于示例存储桶输入s3: //示例存储桶 /manifest.json.

      • 适用于Output 数据集位置在 Amazon S3 中提供希望 Ground Truth 存储标记作业输出数据的位置。

  7. 适用于IAM 角色,选择一个现有的 IAM 角色或创建一个 IAM 角色,该角色有权访问 Amazon S3 中的资源以写入到上面指定的输出 Amazon S3 存储桶并附加了 SageMaker 执行策略。

  8. (可选)对于其他配置,您可以指定希望工作人员标记数据集的哪些部分,以及是否希望 SageMaker 使用Amazon KMS加密钥。要对输出数据进行加密,您必须具有必需的Amazon KMS附加到您在上一步中提供的 IAM 角色的权限。有关更多信息,请参阅 分配 IAM 权限以使用 Ground Truth

  9. 任务类型位置在下部分下任务类别中,使用下拉列表选择任务类别。

  10. Task selection (任务选择) 中,选择任务类型。

  11. (可选)为标记作业提供标签,以便以后在控制台中轻松找到该作业。

  12. 选择 Next(下一步)。

  13. Workers (工作人员) 部分中,选择您要使用的人力类型。有关人力选项的更多详细信息,请参阅创建和管理人力

  14. (可选)在选择人力后,指定任务超时。这是为工作人员处理任务提供的最长时间。

    对于 3D 点云注释任务,默认任务超时为 3 天。文本和图像分类以及标签验证标记作业的默认超时为 5 分钟。所有其他标记作业的默认超时为 60 分钟。

  15. (可选)对于边界框、语义分割、视频帧和 3D 点云任务类型,您可以选择显示现有标签如果要显示输入数据集的标签以供工作人员验证或调整。

    对于边界框和语义分割标记作业,这将创建调整标记作业。

    对于 3D 点云和视频帧标记作业:

    • Select调整以创建调整标签作业。选择此选项时,您可以添加新标签,但无法从上一个作业中删除或编辑现有标签。或者,您可以选择要员工编辑的标签类别属性和框架属性。要将某个属性设置为可编辑,请选中复选框。允许工作人员编辑此属性对于该属性。

      或者,您可以添加新的标签类别和框架属性。

    • Select验证以创建调整标签作业。如果选择此选项,您无法在上一作业中添加、修改或删除现有的标签。或者,您可以选择要员工编辑的标签类别属性和框架属性。要将某个属性设置为可编辑,请选中复选框。允许工作人员编辑此属性对于该属性。

      我们建议您可以向希望工作人员验证的标签添加新的标签类别属性,或者添加一个或多个帧属性以让工作人员提供有关整个帧的信息。

    有关更多信息,请参阅 验证和调整标签

  16. 配置你的员工用户界面:

    • 如果您使用内置任务类型,指定工作人员的说明和标签。

      • 对于图像分类和文本分类(单个和多标签),您必须至少指定两个标签类别。对于所有其他内置任务类型,您必须至少指定一个标签类别。

      • (可选)如果要创建 3D 点云或视频帧标记作业,则可以指定标记类别属性(不支持 3D 点云语义分割)和帧属性。您可以将标签类别属性分配给一个或多个标签。帧属性将显示在每个点云或视频帧工作人员标签上。要了解更多信息,请参阅工作人员用户界面 (UI)对于 3D 点云和工作人员用户界面 (UI)对于视频帧。

      • (可选)添加其他说明以帮助你的员工完成你的任务。

    • 如果要创建自定义标签工作流程,则必须:

      • 输入自定义模板在代码框中。可以使用 HTML、Liquid 模板语言和我们预先构建的 Web 组件的组合来创建自定义模板。或者,您可以从下拉菜单中选择基本模板以开始使用。

      • 指定注释前和注释后 lambda 函数。要了解如何创建这些函数,请参阅第 3 步:使用处理Amazon Lambda.

  17. (可选)你可以选择请参阅预览以预览工作人员说明、标签以及与工作人员 UI 交互。在生成预览之前,请确保浏览器的弹出窗口阻止程序处于禁用状态。

  18. 选择创建

在成功创建标记作业后,您将重定向到 Labeling jobs (标记作业) 页面。您刚创建的标记作业的状态为正在进行中. 在工作人员完成任务时,将逐渐更新该状态。在成功完成所有任务后,该状态将变为 Completed (已完成)

如果在创建标记作业时出现问题,其状态变为已失败.

要查看有关作业的更多详细信息,请选择标记作业名称。

后续步骤

在您的贴标作业状态更改为之后已完成,您可以在创建该标记作业时指定的 Amazon S3 存储桶中查看输出数据。有关输出数据格式的更多信息,请参阅输出数据