创建标注作业(控制台) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

创建标注作业(控制台)

您可以使用 Amazon SageMaker 控制台为所有 Ground Truth 内置任务类型和自定义标注工作流创建标注作业。对于内置任务类型,我们建议您同时使用本页面和任务类型页面。每个任务类型页面都包含使用该任务类型创建标注作业的具体详细信息。

您需要提供以下内容以在 SageMaker 控制台中创建标注作业:

  • Amazon S3 中的输入清单文件。您可以将输入数据集放置在 Amazon S3 中,并使用 Ground Truth 控制台自动生成清单文件(3D 点云标注作业不支持)。

    或者,您可以手动创建输入清单文件。要了解如何操作,请参阅输入数据

  • 存储输出数据的 Amazon S3 存储桶。

  • 一个 IAM 角色,该角色有权访问您在 Amazon S3 中的资源并附加了 SageMaker 执行策略。对于一般解决方案,您可以将托管策略 AmazonSageMakerFullAccess 附加到 IAM 角色,并将 sagemaker 包含在您的存储桶名称中。

    有关更精细的策略,请参阅分配 IAM 权限以使用 Ground Truth

    3D 点云任务类型有额外的安全考虑因素。了解更多

  • 一个工作团队。您可以从 Amazon Mechanical Turk 工作人员、供应商或您自己的私有工作人员组成的人力中创建一个工作团队。要了解更多信息,请参阅创建和管理人力

    您无法将 Mechanical Turk 人力用于 3D 点云或视频帧标注作业。

  • 如果使用自定义标注工作流,则必须在 Amazon S3 中保存工作人员任务模板,并为该模板提供 Amazon S3 URI。有关更多信息,请参阅 步骤 2:创建自定义的工作人员任务模板

  • (可选)如果希望 SageMaker 使用您自己的 Amazon KMS 加密密钥对标注作业输出进行加密,而不是使用默认 Amazon S3 服务密钥,则需要提供 Amazon KMS 密钥 ARN。

  • (可选)用于标注作业的数据集的现有标签。如果您希望工作人员调整、批准或拒绝标签,请使用该选项。

  • 如果要创建调整或验证标注作业,则必须在 Amazon S3 中有一个输出清单文件,其中包含要调整或验证的标签。只有边界框和语义分割图像标注作业以及 3D 点云和视频帧标注作业才支持此选项。建议您使用验证和调整标签上的说明创建验证或调整标注作业。

重要

您的工作团队、输入清单文件、输出存储桶以及 Amazon S3 中的其他资源必须位于用来创建标注作业的同一 Amazon 区域中。

使用 SageMaker 控制台创建标注作业时,可以将工作人员说明和标签添加到 Ground Truth 提供的工作人员 UI 中。在控制台中创建标注作业时,您可以预览该工作人员 UI 并与之交互。您还可以在内置任务类型页面上看到工作人员 UI 的预览。

创建标注作业(控制台)
  1. 登录到 SageMaker 控制台,网址为 https://console.aws.amazon.com/sagemaker/

  2. 在左侧导航窗格中,选择标注作业

  3. 标注作业页面上,选择创建标注作业

  4. 对于作业名称,请输入标注作业的名称。

  5. (可选)如果要使用一个键以标识标签,请选择我希望指定与标注作业名称不同的标签属性名称。如果未选择该选项,将使用在上一步中指定的标注作业名称在输出清单文件中标识标签。

  6. 选择一个数据设置,以便在输入数据集和 Ground Truth 之间建立连接。

    • 对于自动数据设置

    • 对于手动数据设置

      • 对于输入数据集位置,请提供输入清单文件在 Amazon S3 中的位置。例如,如果输入清单文件 manifest.json 位于 example-bucket,请输入 s3://example-bucket/manifest.json

      • 对于输出数据集位置,请提供您希望 Ground Truth 在 Amazon S3 中存储标注作业的输出数据的位置。

  7. 对于 IAM 角色,选择一个现有的 IAM 角色或创建一个 IAM 角色,该角色有权访问 Amazon S3 中的资源以写入到上面指定的输出 Amazon S3 存储桶并附加了 SageMaker 执行策略。

  8. (可选)对于其他配置,您可以指定希望工作人员标注数据集的哪些部分,以及是否希望 SageMaker 使用 Amazon KMS 加密密钥对标注作业的输出数据进行加密。要对输出数据进行加密,您必须将所需的 Amazon KMS 权限附加到在上一步中提供的 IAM 角色。有关更多详细信息,请参阅分配 IAM 权限以使用 Ground Truth

  9. 任务类型部分的任务类别下面,使用下拉列表选择任务类别。

  10. 任务选择中,选择任务类型。

  11. (可选)为标注作业提供标签,以便以后在控制台中轻松找到该作业。

  12. 选择下一步

  13. 工作人员部分中,选择您要使用的人力类型。有关人力选项的更多详细信息,请参阅创建和管理人力

  14. (可选)在选择人力后,指定任务超时。这是为工作人员处理任务提供的最长时间。

    对于 3D 点云注释任务,默认任务超时为 3 天。文本和图像分类以及标签验证标注作业的默认超时为 5 分钟。所有其他标注作业的默认超时为 60 分钟。

  15. (可选)对于边界框、语义分割、视频帧和 3D 点云任务类型,如果要显示输入数据集的标签以供工作人员验证或调整,则可以选择显示现有的标签

    对于边界框和语义分割标注作业,这将创建一个调整标注作业。

    对于 3D 点云和视频帧标注作业:

    • 选择调整以创建调整标注作业。选择此选项后,您可以添加新标签,但不能删除或编辑前一个作业中的现有标签。您还可以选择希望工作人员编辑的标签类别属性和帧属性。要使某个属性可编辑,请选中此属性对应的复选框允许工作人员编辑此属性

      您还可以选择添加新的标签类别和帧属性。

    • 选择验证以创建调整标注作业。选择此选项后,不能添加标签,也不能修改或删除前一个作业中的现有标签。您还可以选择希望工作人员编辑的标签类别属性和帧属性。要使某个属性可编辑,请选中此属性对应的复选框允许工作人员编辑此属性

      我们建议您可以向希望工作人员验证的标签添加新的标签类别属性,或者添加一个或多个帧属性以使工作人员提供有关整个帧的信息。

    有关更多信息,请参阅 验证和调整标签

  16. 配置工作人员 UI:

    • 如果您正在使用内置任务类型,请指定工作人员说明和标签。

      • 对于图像分类和文本分类(单标签和多标签),必须至少指定两个标签类别。对于所有其他内置任务类型,必须至少指定一个标签类别。

      • (可选)如果要创建 3D 点云或视频帧标注作业,则可以指定标签类别属性(不支持 3D 点云语义分割)和帧属性。可以将标签类别属性分配给一个或多个标签。帧属性将显示在每个点云或视频帧工作人员标签上。要了解更多信息,请参阅工作人员用户界面 (UI)(对于 3D 点云)和工作人员用户界面 (UI)(对于视频帧)。

      • (可选)添加其他说明以便于工作人员完成您的任务。

    • 如果要创建自定义标注工作流,则必须:

      • 在代码框中输入自定义模板。可以使用 HTML、Liquid 模板语言和我们预先构建的 Web 组件的组合来创建自定义模板。您还可以从下拉菜单中选择一个基本模板以开始使用。

      • 指定注释前和注释后 Lambda 函数。要了解如何创建这些函数,请参阅步骤 3:使用 Amazon Lambda 处理

  17. (可选)您可以选择查看预览以预览工作人员说明和标签,并与工作人员 UI 进行交互。在生成预览之前,请确保浏览器的弹出窗口阻止程序处于禁用状态。

  18. 选择创建

在成功创建标注作业后,您将重定向到标注作业页面。您刚创建的标注作业的状态为正在进行。在工作人员完成任务时,该状态会逐步更新。在成功完成所有任务后,该状态将变为已完成

如果在创建标注作业时出现问题,作业状态将变为失败

要查看有关作业的更多详细信息,请选择标注作业名称。

后续步骤

在标注作业状态变为已完成后,您可以在创建该标注作业时指定的 Amazon S3 存储桶中查看输出数据。有关输出数据格式的详细信息,请参阅输出数据