使用 Amazon Mechanical Turk 人力 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon Mechanical Turk 人力

Amazon Mechanical Turk 力(Mechanical Turk 人力)可为您的Amazon SageMaker Ground Truth标记作业和Amazon Augmented AI人类审查任务. Amazon Mechanical Turk 人力是世界范围内的资源。工作人员每周 7 天、每天 24 小时提供服务。当您使用 Amazon Mechanical Turk 力时,通常会为您的人工审核任务和标记作业获得最快的周转时间。

任何 Amazon Mechanical Turk 人力账单都将作为您的 Ground Truth 账单或 Amazon Augmented AI 账单的一部分处理。您无需创建单独的 Mechanical Turk 其人力账户来使用 Amazon Mechanical Turk 人力。

重要

您不应与此人力共享机密信息、个人信息或受保护的健康信息。如果您将 Amazon Mechanical Turk 马逊 A2I 与AmazonHIPAA 合格的服务,例如 Amazon Ttract 和 Amazon Rekognition,适用于包含受保护健康信息的工作负载。

当您创建 “Ground Truth” 标签作业或 Amazon A2I 人工审查工作流程(流程定义)时,您可以选择 “Mechanical Turk 其人” 作为您的员工。您可以使用 SageMaker 控制台和 API 创建标记作业和人工审核工作流。

当您使用 API 操作创建标签作业或人工审核工作流程时,您可以将以下 ARN 用于 Amazon Mechanical Turk 员的WorkteamArn. Replaceregion使用Amazon用于创建标注作业或人工循环的区域。例如,如果您在美国西部(俄勒冈)中创建标记作业,请将region替换为us-west-2.

  • arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

Ground Truth 与 Amazon A2Irequire当您使用 Mechanical Turk 其人时,您的输入数据是免费的个人身份信息 (PII)。如果您使用 “Mechanical Turk 其人” 工作人员,并且未指定您的输入数据不含 PII,则 “Ground Truth” 标签作业和 Augmented AI 任务将失败。当您创建 “Ground Truth” 标签作业时,以及当您使用内置集成或StartHumanLoopoperation.

使用以下各节可了解如何将 Mechanical Turk 与这些服务一起使用。

使用 Mechanical Turk 人与 Ground Truth

当您使用控制台创建标记作业时,您可以使用 “Mechanical Turk 其人”,或CreateLabelingJoboperation.

在创建标记作业时,我们建议您根据作业的复杂性和您需要的质量,调整对每个数据对象进行注释的工作人员数量。Amazon SageMaker Ground Truth 使用注释整合来提高标签的质量。对于较为复杂的标记作业,工作人员数量较多会给标签质量带来帮助,但对于比较简单的作业则没多大作用。有关更多信息,请参阅合并注释。请注意,Amazon A2I 人工审核工作流程不支持注释整合。

在您创建标记作业时使用 MMechanical Turk(控制台):

  1. 使用以下内容可以使用 SageMaker 控制台的 “Ground Truth 值” 区域创建标记作业:创建标记作业(控制台).

  2. 当您选择工作线程类型中的工作线程部分中,选择Amazon Mechanical Turk.

  3. 指定工作人员必须使用任务超时.

  4. 指定任务可供工作人员使用的总时间任务过期. 这是工作人员在任务失败之前必须接受多长时间。

  5. 选择每项任务的价格使用下拉列表。这是工作人员为完成单个任务而收到的金额。

  6. (可选)如果适用,请选择该数据集不包含成人内容。 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 其人力。

  7. 您必须通过选中复选框以使用 Mechanical Turk 工作人员来阅读并确认以下语句。如果您输入的数据包含机密信息、个人信息或受保护的健康信息,则必须选择其他人力。

    您理解并同意,Metrics Turk 人力由遍布世界各地的独立承包商组成,并且您不应与此人力共享机密信息、个人信息或受保护的健康信息。

  8. (可选)选中旁边的复选框启用自动化数据标签如果您想要启用自动数据标记。要了解有关此功能的详细信息,请参阅自动数据标记.

  9. 您可以指定每个数据集对象的工作线程数UNDER其他配置. 例如,如果您在此字段中输入 3,则每个数据对象将由 3 个工作线程进行标记。

创建标注作业时,通过选择Create,您的标签任务将发送给 Mechanical Turk 工人。

在您创建标记作业 (API) 时使用 Mechanical Turk:

  1. 使用以下内容创建标记作业,使用CreateLabelingJob操作:创建标记作业 (API).

  2. 对使用以下值:WorkteamArn. Replaceregion使用Amazon用于创建标注作业的区域。

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. 使用TaskTimeLimitInSeconds指定工作人员完成任务所需的总时间量。

  4. 使用TaskAvailabilityLifetimeInSeconds指定任务可供工作人员使用的总时间。这是工作人员在任务失败之前必须接受多长时间。

  5. 使用NumberOfHumanWorkersPerDataObject指定每个数据集对象的工作人员数量。

  6. 使用PublicWorkforceTaskPrice设置每个任务的价格。这是工作人员为完成单个任务而收到的金额。

  7. 使用DataAttributes指定您的输入数据不含机密信息、个人信息或受保护的健康信息。

    Ground Truth需要如果您使用 Mechanical Turk 其人员,则您的输入数据不包含个人身份信息 (PII)。如果您使用 “Mechanical Turk 其人”,并且未指定您的输入数据不使用FreeOfPersonallyIdentifiableInformation标记时,您的标注作业将失败。

    使用FreeOfAdultContent标志来声明您的输入数据不含成人内容。 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 其人力。

您可以在 GitHub 上找到以下笔记本电脑中看到如何使用此 API 的示例:Ground Truth 朱皮特笔记本示例. 您可以在 SageMaker 下访问这些笔记本电脑示例笔记本笔记本实例.

Mechanical Turk 用 Amazon A2I

在创建人工审核工作流程时,您可以指定要将 Mechanical Turk 与 Amazon A2I 一起使用,也称为流定义、在控制台中或使用CreateFlowDefinitionAPI 操作。使用此人工审阅工作流配置人工循环时,必须指定输入数据不含 PII。

在您创建人工审核工作流(控制台)时使用 MMechanical Turk:

  1. 使用以下内容可在 SageMaker 控制台的 “Augmented AI” 部分中创建人工审阅工作流:创建人工审核工作流程(控制台).

  2. 当您选择工作线程类型中的工作线程部分中,选择Amazon Mechanical Turk.

  3. 选择每项任务的价格使用下拉列表。这是工作人员为完成单个任务而收到的金额。

  4. (可选)您可以指定每个数据集对象的工作线程数UNDER其他配置. 例如,如果您在此字段中输入 3,则每个数据对象将由 3 个工作线程进行标记。

  5. (可选)指定工作人员使用任务超时.

  6. (可选)指定任务可供工作人员在任务过期. 这是工作人员在任务失败之前必须接受多长时间。

  7. 创建人工审核工作流程后,您可以通过在参数中提供其 Amazon 资源名称 (ARN) 来配置人工循环FlowDefinitionArn. 您可以使用内置任务类型的 API 操作之一或 Amazon A2I 运行时 API 操作来配置人工循环StartHumanLoop. 要了解更多信息,请参阅“创建和启动人工循环”。

    当您配置人工循环时,您必须指定输入数据不含个人身份信息 (PII),使用FreeOfPersonallyIdentifiableInformation内容分类器DataAttributes. 如果您使用 “Mechanical Turk 其人” 并且未指定您的输入数据不含 PII,则您的人工审核任务将失败。

    使用FreeOfAdultContent标志来声明您的输入数据不含成人内容。 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 其人力。

在您创建人工审核工作流 (API) 时使用 MMechanical Turk:

  1. 使用以下内容可创建人工审核工作流程,使用CreateFlowDefinition操作:创建人工审核工作流程 (API).

  2. 对使用以下值:WorkteamArn. Replaceregion使用Amazon用于创建标注作业的区域。

    arn:aws:sagemaker:region:394669845002:workteam/public-crowd/default

  3. 使用TaskTimeLimitInSeconds指定工作人员完成任务所需的总时间量。

  4. 使用TaskAvailabilityLifetimeInSeconds指定任务可供工作人员使用的总时间。这是工作人员在任务失败之前必须接受多长时间。

  5. 使用TaskCount指定每个数据集对象的工作人员数量。例如,如果为此参数指定 3,则每个数据对象将由 3 个工作线程进行标记。

  6. 使用PublicWorkforceTaskPrice设置每个任务的价格。这是工作人员为完成单个任务而收到的金额。

  7. 创建人工审核工作流程后,您可以通过在参数中提供其 Amazon 资源名称 (ARN) 来配置人工循环FlowDefinitionArn. 您可以使用内置任务类型的 API 操作之一或 Amazon A2I 运行时 API 操作来配置人工循环StartHumanLoop. 要了解更多信息,请参阅“创建和启动人工循环”。

    当您配置人工循环时,您必须指定输入数据不含个人身份信息 (PII),使用FreeOfPersonallyIdentifiableInformation内容分类器DataAttributes. 如果您使用 “Mechanical Turk 其人” 并且未指定您的输入数据不含 PII,则您的人工审核任务将失败。

    使用FreeOfAdultContent标志来声明您的输入数据不含成人内容。 SageMaker 可能会限制可以查看您的任务的 Mechanical Turk 其人力。

您可以在 GitHub 上找到以下笔记本电脑中看到如何使用此 API 的示例:Amazon A2I Jupyter 笔记本示例.

什么时候不支持 Mechanical Turk 人?

在以下情况下不支持此工作人员。在每种情况下,您必须使用私有或者供应商人力。

  • Ground Truth 视频帧标记作业和 3D 点云标记作业不支持此人力。

  • 如果您的输入数据包含个人身份信息 (PII),则无法使用此人力。

  • Mechanical Turk 人是不可用的一些Amazon特殊区域。如果适用,请参阅您特定区域的文档以了解更多信息。