在 Amazon Textract 中使用亚马逊 Augmented AI - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon Textract 中使用亚马逊 Augmented AI

借助 Amazon Textract,您可以向应用程序添加文档文本检测和分析功能。Amazon Augmented AI (Amazon A2I) 直接与 Amazon Textract 集成AnalyzeDocumentAPI 操作。可以使用 AnalyzeDocument 分析文档以了解检测到的项目之间的关系。当您将 Amazon A2I 人工评论循环添加到AnalyzeDocument请求,Amazon A2I 会监控 Amazon Textract 结果,并在满足流程定义中指定的条件时将文档发送给一个或多个工作人员以进行审核。例如,如果你希望人类查看一个特定的密钥,例如Full name:以及它们相关的输入值,你可以创建一个激活条件,随时启动人工评论Full name:检测到 key,或者当该键的推断置信度在您指定的范围内时。

下图描述了亚马逊 A2I 内置的 Amazon Textract 工作流程。左侧描述了创建 Amazon Textract 人工审核工作流程所需的资源:以及 Amazon S3 存储桶、激活条件、工作人员任务模板和工作团队。这些资源用于创建人工审核工作流,或流定义。一个箭头指向工作流程的下一步:使用 Amazon Textract 通过人工审核工作流程配置人工循环。第二个箭头指向从此步骤直接指向满足人工审核工作流程中指定的激活条件的步骤。这启动了人工循环的创建。在图像右侧,人类循环分三个步骤描述:1) 生成工作人员 UI 和工具,任务可供员工使用 2) 工作人员查看输入数据,最后 3) 结果保存在 Amazon S3 中。


            在 Amazon Textract 中使用亚马逊 Augmented AI

您可以通过指定指定在创建人工审核工作流程或流程定义时指定 Amazon Textract 将任务发送给工作人员以进行审核的时间。激活条件.

在使用 Amazon Textract 任务类型时,您可以设置以下激活条件:

  • 根据表单键置信度分数启动对特定表单键的人工审查。

  • 在特定表单键丢失时启动人工审查。

  • 对 Amazon Textract 识别的所有表单键启动人工审查,并在指定范围内的置信度分数。

  • 随机将表单示例发送给工作人员以进行审查。

当激活条件依赖于表单键置信度分数时,您可以使用两种类型的预测置信度来启动人工循环:

  • 识别置信度— 在表单中检测到的键值对的置信度分数。

  • 资格认证信— 表单中键和值中包含的文本的置信度分数。

在下一节的图片中,全名:Jane Doe是键值对,全名是关键,而且Jane Doe是值。

您可以在创建人工审核工作流程时使用 Amazon SageMaker 控制台设置这些激活条件,也可以通过为人工循环激活条件创建 JSON 并将其指定为HumanLoopActivationConditions的参数CreateFlowDefinitionAPI 操作。要了解如何以 JSON 格式指定激活条件,请参阅 亚马逊Augmented AI 中人循环激活条件的 JSON 架构在Amazon Textract 中使用人循环激活条件 JSON 架构

注意

将 Augmented AI 与 Amazon Textract 结合使用时,请在相同的内容创建 Augmented AI 资源Amazon你用来打电话的地区AnalyzeDocument.

开始使用:将人工审核集成到 Amazon Textract 分析文档 Job 中

要将人工审核集成到 Amazon Textract 文本检测和分析作业中,您需要创建流程定义,然后使用 Amazon Textract API 将该流程定义集成到您的工作流程中。要了解如何使用 SageMaker 控制台或 Augmented AI API 创建流程定义,请参阅以下主题:

创建流程定义后,请参阅将 Augmented AI 与 Amazon Textract 结合使用以了解如何将流程定义集成到 Amazon Textract 任务中。

使用 Amazon Textract 和 Amazon A2I 的端到端示例

要了解如何使用控制台将 Amazon Textract 与 Amazon A2I 结合使用的端到端示例,请参阅教程:亚马逊 A2I 控制台入门.

要了解如何使用 Amazon A2I API 创建并启动人工审核,您可以使用Amazon AAugmented AI (Amazon A2I) 与 Amazon Textract 的分析文档集成 [示例]在 SageMaker 笔记本实例中。要了解其用法,请参阅 将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本电脑一起使用

A2I Textract 工作人员控制台预览

在 Amazon Textract 工作流程中为工作人员分配审核任务时,工作人员可能会看到与以下内容类似的用户界面:

您可以在创建人工审核定义时,或通过创建并使用自定义模板,来在 SageMaker 控制台中自定义此界面。要了解更多信息,请参阅“创建和管理工作人员任务模板”。