将亚马逊 Augmented AI 与 Amazon Textract 结合使用 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将亚马逊 Augmented AI 与 Amazon Textract 结合使用

Amazon Textract 可让您向应用程序添加文档文本检测和分析功能。Amazon Augmented AI 2I) 直接集成到 Amazon Ttextract 的AnalyzeDocumentAPI 操作。可以使用 AnalyzeDocument 分析文档以了解检测到的项目之间的关系。当您将亚马逊 A2I 人工审核循环添加到AnalyzeDocument请求时,Amazon A2I 会监控 Amazon Textract 结果,并在满足流定义中指定的条件时将文档发送给一个或多个工作人员以进行审核。例如,如果你希望一个人查看一个特定的密钥,如Full name:及其关联的输入值,您可以创建一个激活条件,以便在Full name:键或该键的推断置信度在您指定的范围内时。

下图描述了亚马逊 A2I 内置的亚马逊 Textract 工作流程。左侧描述了创建 Amazon Textract 人工审核工作流所需的资源:以及 Amazon S3 存储桶、激活条件、工作人员任务模板和工作团队。这些资源用于创建人工审核工作流或流定义。箭头指向工作流程中的下一步:使用 Amazon Textract 配置人工审核工作流程的人工循环。第二个箭头从此步骤直接指向满足人工审阅工作流中指定的激活条件的步骤。这启动了人工循环的创建。在图像右侧,人工循环分三个步骤进行描述:1) 生成工作人员 UI 和工具并将任务提供给工作人员,2) 工作人员查看输入数据,最后 3) 结果保存在 Amazon S3 中。


            将亚马逊 Augmented AI 与 Amazon Textract 结合使用

您可以在创建人工审核工作流或流定义时指定 Amazon Textract 何时将任务发送给人工审核的时间,通过指定激活条件

在使用 Amazon Textract 任务类型时,您可以设置以下激活条件:

  • 根据表单键置信度分数启动对特定表单键的人工审查。

  • 在特定表单键丢失时启动人工审核。

  • 根据指定范围内的置信度分数启动对 Amazon Textract 标识的所有表单键的人工审查。

  • 随机将表单示例发送给工作人员以进行审查。

当激活条件依赖于表单键置信度分数时,您可以使用两种类型的预测置信度来启动人工循环:

  • 身份可信度— 在表单中检测到的键值对的置信度分数。

  • 资格可信度— 表单中的键和值中包含的文本的置信度分数。

在下一节的图像中,全名: Jane Doe是键值对,全名是关键,Jane Doe是值。

您可以在创建人工审核工作流程时使用 Amazon SageMaker 控制台设置这些激活条件,也可以通过为人工循环激活条件创建 JSON 并将其指定为HumanLoopActivationConditions的参数CreateFlowDefinitionAPI 操作。要了解如何以 JSON 格式指定激活条件,请参阅 亚马逊 Augmented AI 中的人工循环激活条件 JSON 架构将人工循环激活条件 JSON 架构与 Amazon Textract 结合使用

注意

将 Augmented AI 与 Amazon Textract 配合使 Augmented AI 时,请在同一Amazon您用于调用的区域AnalyzeDocument

入门:将人工审核集成到 Amazon Textract 分析文档 Job 中

要将人工审核集成到 Amazon Textract 文本检测和分析作业中,您需要创建流程定义,然后使用 Amazon Ttextract API 将该流程定义集成到工作流程中。要了解如何使用 SageMaker 控制台或 Augmented AI API 创建流程定义,请参阅以下主题:

创建流定义后,请参阅将 Augmented AI 与 Amazon Textract 结合使用,了解如何将流程定义集成到 Amazon Textract 任务中。

使用 Amazon Ttextract 和 Amazon A2I 的端到端示例

有关演示如何使用控制台将 Amazon Ttextract 与 Amazon A2I 结合使用的端到端示例,请参阅教程:使用 Amazon A2I 控制台入门

要了解如何使用 Amazon A2I API 创建并启动人工审核,您可以使用Amazon Augmented AI (Amazon A2I) 与 Amazon Ttract 的分析文档集成 [示例]在 SageMaker 笔记本实例中。要了解其用法,请参阅 将 SageMaker 笔记本实例与亚马逊 A2I Jupyter 笔记本电脑一起使用

A2I Textract 工作人员控制台预览

在 Amazon Textract 工作流程中为工作人员分配审核任务时,工作人员可能会看到与以下内容类似的用户界面:

可以在创建人工审核定义时,或通过创建并使用自定义模板,来在 SageMaker 控制台中自定义此界面。要了解更多信息,请参阅“创建和管理工作人员任务模板”。