Amazon A2I 的核心组件 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon A2I 的核心组件

查看以下术语以熟悉 Amazon A2I 的核心组件。

任务类型

您将 Amazon A2I 集成到的 AI/ML 工作流定义了 Amazon A2I 任务类型

Amazon A2I 支持:

在下表中选择选项卡,查看说明 Amazon A2I 如何处理各种任务类型的图表。使用上述列表中的链接选择任务类型页面,以了解有关该任务类型的详细信息。

Amazon Textract – Key-value pair extraction

此图描述了与 Amazon Textract 结合使用的 Amazon A2I 内置工作流。左侧描述的是创建 Amazon Textract 人工审核工作流所需的资源:Amazon S3 存储桶、激活条件、工作人员任务模板和工作团队。这些资源用于创建人工审核工作流,也称为流定义。一个箭头指向右侧的工作流的下一步:使用 Amazon Textract 配置采用人工审核工作流的人工循环。第二个箭头向右从此步骤直接指向满足了人工审核工作流中指定的激活条件的步骤。这将开始创建人工循环。在图像右侧,人工循环分三个步骤描述:1) 生成工作人员 UI 和工具,使任务可供工作人员使用,2) 工作人员审核输入数据,最后 3) 结果保存在 Amazon S3 中。

Amazon Rekognition – Image moderation

这张图片描述了 Amazon A2I 内置的 Amazon Rekognition 工作流。左侧是创建 Amazon Rekognition 人工审核工作流所需的资源:Amazon S3 存储桶、激活条件、工作人员任务模板和工作团队。这些资源用于创建人工审核工作流,也称为流定义。一个箭头指向右侧的工作流的下一步:使用 Amazon Rekognition 配置采用人工审核工作流的人工循环。第二个箭头向右从此步骤直接指向满足了人工审核工作流中指定的激活条件的步骤。这将开始创建人工循环。在图像右侧,人工循环分三个步骤描述:1) 生成工作人员 UI 和工具,使任务可供工作人员使用,2) 工作人员审核输入数据,最后 3) 结果保存在 Amazon S3 中。

Custom Task Type

下图描述了 Amazon A2I 自定义工作流。使用自定义 ML 模型来生成预测。客户端应用程序使用用户定义的标准筛选这些预测,并确定是否需要人工审核。如果需要,则这些预测将发送到 Amazon A2I 以进行人工审核。Amazon A2I 在 Amazon S3 中收集人工审核结果,客户端应用程序可以访问这些结果。如果筛选过程确定不需要人工审核,则可以直接将预测提供给客户端应用程序。

人工审核工作流(流定义)

您可以使用人工审核工作流来指定您的人员工作团队,使用工作人员任务模板设置工作人员 UI,并提供有关工作人员应如何完成审核任务的信息。

对于内置任务类型,您还可以使用人工审核工作流来确定启动人工循环的条件。例如,Amazon Rekognition 可以使用机器学习执行图像内容审核。如果 Amazon Rekognition 的置信度过低,则可使用人工审核工作流,指定图像需要发送给人员来进行内容审核。

您可以使用人工审核工作流创建多个人工循环。

您可以在 SageMaker 控制台中或使用 SageMaker API 创建流定义。要了解有关这些选项的更多信息,请参阅创建人工审核工作流

工作团队

工作团队是一群工作人员,您向他们发送人工审核任务。

创建人工审核工作流时,您需要指定一个工作团队。

您的工作团队可以包括 Amazon Mechanical Turk 人力供应商管理的人力或者您自己的私有人力。使用私有人力时,您可以创建多个工作团队。每个工作团队都可用于多个人工审核工作流中。要了解如何创建人力和工作团队,请参阅创建和管理人力

工作人员模板和人工任务 UI

您可以使用工作人员任务模板,为人工审核任务创建工作人员 UI(人工任务 UI)。

工作人员任务 UI 显示输入数据,如文档或图像,以及面向工作人员的说明。它还提供了工作人员可用于完成任务的交互式工具。

对于内置任务类型,您必须使用为该任务类型提供的 Amazon A2I 工作人员任务模板。

人工循环

人工循环用于创建单个人工审核作业。对于每个人工审核作业,您可以选择工作人员的数量,任务会发送给这些工作人员以审核单个数据对象。例如,对于图像分类标注作业,如果将每个对象的工作人员数设置为 3,则会有三名工作人员对每个输入图像进行分类。增加每个对象的工作人员数量可以提高标签准确性。

人工循环使用人工审核工作流创建,如下所示:

  • 对于内置任务类型,人工审核工作流中指定的条件决定何时创建人工循环。

  • 人工审核任务将发送到在人工审核工作流中指定的工作团队。

  • 在人工审核工作流中指定的工作人员任务模板用于呈现人工任务 UI。

什么时候会创建人工循环?

如果您使用某种内置任务类型,则在满足人工审核工作流中指定的条件时,相应的 Amazon 服务会代表您创建并启动人工循环。例如:

  • 当您将 Augmented AI 与 Amazon Textract 结合使用时,您可以使用 API 操作 AnalyzeDocument 将 Amazon A2I 集成到文档审核任务中。当键值对满足在人工审核工作流中指定条件时,只要 Amazon Textract 返回与这些键值对相关的推理,就会创建人工循环。

  • 当您将 Augmented AI 与 Amazon Rekognition 结合使用时,您可以使用 API 操作 DetectModerationLabels 将 Amazon A2I 集成到图像审核任务中。当图像内容满足在人工审核工作流中指定条件时,只要 Amazon Rekognition 返回与这些图像内容相关的推理,就会创建人工循环。

在使用自定义任务类型时,您可以使用 Amazon Augmented AI 运行时系统 API 启动人工循环。当您在自定义应用程序中调用 StartHumanLoop 时,任务将发送给人工审核员。

要了解如何创建和启动人工循环,请参阅创建和启动人工循环

为了生成这些资源并创建人工审核工作流,Amazon A2I 集成了多个 API,包括 Amazon Augmented AI 运行时系统模型、SageMaker API 以及与您的任务类型关联的 API。要了解更多信息,请参阅在 Amazon Augmented AI 中使用 API