将 Amazon Augmented AI 与 Amazon Textract 结合使用 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将 Amazon Augmented AI 与 Amazon Textract 结合使用

利用 Amazon Textract,您可向应用程序添加文档文本检测和分析功能。Amazon Augmented AI (Amazon A2I) 直接与 Amazon Textract 的 AnalyzeDocument API 操作集成。可以使用 AnalyzeDocument 分析文档以了解检测到的项目之间的关系。在向 AnalyzeDocument 请求添加 Amazon A2I 人工审核循环时,Amazon A2I 会监控 Amazon Textract 结果,并在满足流定义中指定的条件时将文档发送给一个或多个工作人员以进行审核。例如,如果您希望人员审核特定键(例如 Full name:)及其关联的输入值,您可以创建激活条件,只要检测到 Full name: 键就启动人工审核,或在该键的推理置信度低于您指定的范围时启动人工审核。

下图描绘了 Amazon A2I 内置的 Amazon Textract 工作流。左侧是创建 Amazon Textract 人工审核工作流所需的资源:Amazon S3 存储桶、激活条件、工作人员任务模板和工作团队。这些资源用于创建人工审核工作流,也称为流定义。一个箭头指向右侧的工作流的下一步:使用 Amazon Textract 配置采用人工审核工作流的人工循环。第二个箭头向右从此步骤直接指向满足了人工审核工作流中指定的激活条件的步骤。这将开始创建人工循环。在图像右侧,人工循环分三个步骤描述:1) 生成工作人员 UI 和工具,使任务可供工作人员使用,2) 工作人员审核输入数据,最后 3) 结果保存在 Amazon S3 中。

将 Amazon Augmented AI 与 Amazon Textract 结合使用

在创建人工审核工作流或流定义时,您可以通过指定激活条件,指定 Amazon Textract 何时将任务发送给工作人员以进行审核。

在使用 Amazon Textract 任务类型时,可以设置以下激活条件:

  • 根据表单键置信度分数,启动对特定表单键的人工审核。

  • 在特定表单键缺失时启动人工审核。

  • 针对 Amazon Textract 标识的置信度分数在指定范围内的所有表单键,启动人工审核。

  • 随机将表单示例发送给工作人员以进行审查。

当激活条件依赖于表单键置信度分数时,您可以使用两种类型的预测置信度来启动人工循环:

  • 标识置信度 – 在表单中检测到的键/值对的置信度分数。

  • 资格置信度 – 表单中的键和值包含的文本的置信度分数。

在以下部分的图像中,Full Name: Jane Doe 是键/值对,Full Name 是键,Jane Doe 是值。

您可以在创建人工审核工作流程时使用 Amazon SageMaker 控制台来设置这些激活条件,也可以为人工循环激活条件创建 JSON 并将其指定为 CreateFlowDefinition API 操作HumanLoopActivationConditions参数中的输入。要了解如何以 JSON 格式指定激活条件,请参阅 Amazon Augmented AI 中用于人工循环激活条件的 JSON 架构将人工循环激活条件 JSON 架构与 Amazon Textract 结合使用

注意

在 Amazon Textract 中使用增强人工智能时,请在您用来调用的同一 Amazon 区域创建增强人工智能资源。AnalyzeDocument

开始使用:将人工审核集成到 Amazon Textract 分析文档作业中

要将人工审核集成到 Amazon Textract 文本检测和分析作业中,您需要创建流定义,然后使用 Amazon Textract API 将该流定义集成到您的工作流中。要了解如何使用 SageMaker 控制台或 Agumented AI API 创建流程定义,请参阅以下主题:

在创建流定义后,请参阅将 Augmented AI 与 Amazon Textract 结合使用,以了解如何将流定义集成到 Amazon Textract 任务中。

使用 Amazon Textract 和 Amazon A2I 的端到端示例

有关演示如何使用 end-to-end 控制台将 Amazon Textract 与 Amazon A2I 配合使用的示例,请参阅。教程:开始使用 Amazon A2I 控制台

要学习如何使用亚马逊 A2I API 创建和开始人工审阅,您可以在笔记本实例中使用亚马逊增强人工智能(Amazon A2I)与 Amazon Textract 的分析文档 [示例] 集成。 SageMaker 要开始使用,请参阅 将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本配合使用

A2I Textract 工作人员控制台预览

在 Amazon Textract 工作流中为工作人员分配审核任务时,工作人员可能会看到与以下内容类似的用户界面:

您可以在创建人工审核定义时在 SageMaker 控制台中自定义此界面,也可以通过创建和使用自定义模板来自定义此界面。要了解更多信息,请参阅创建和管理工作人员任务模板