将 Amazon Augmented AI 与 Amazon Textract 结合使用 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

将 Amazon Augmented AI 与 Amazon Textract 结合使用

利用 Amazon Textract,您可向应用程序添加文档文本检测和分析功能。Amazon Augmented AI (Amazon A2I) 直接与 Amazon Textract 的 AnalyzeDocument API 操作集成。可以使用 AnalyzeDocument 分析文档以了解检测到的项目之间的关系。在向 AnalyzeDocument 请求添加 Amazon A2I 人工审核循环时,Amazon A2I 会监控 Amazon Textract 结果,并在满足流定义中指定的条件时将文档发送给一个或多个工作人员以进行审核。例如,如果您希望人员审核特定键(例如 Full name:)及其关联的输入值,您可以创建激活条件,只要检测到 Full name: 键就启动人工审核,或在该键的推理置信度低于您指定的范围时启动人工审核。

下图描述了 Amazon A2I 内置的 Amazon Textract 工作流。左侧是创建 Amazon Textract 人工审核工作流所需的资源:Amazon S3 存储桶、激活条件、工作人员任务模板和工作团队。这些资源用于创建人工审核工作流,也称为流定义。一个箭头指向右侧的工作流的下一步:使用 Amazon Textract 配置采用人工审核工作流的人工循环。第二个箭头向右从此步骤直接指向满足了人工审核工作流中指定的激活条件的步骤。这将开始创建人工循环。在图像右侧,人工循环分三个步骤描述:1) 生成工作人员 UI 和工具,使任务可供工作人员使用,2) 工作人员审核输入数据,最后 3) 结果保存在 Amazon S3 中。


            将 Amazon Augmented AI 与 Amazon Textract 结合使用

在创建人工审核工作流或流定义时,您可以通过指定激活条件,指定 Amazon Textract 何时将任务发送给工作人员以进行审核。

在使用 Amazon Textract 任务类型时,可以设置以下激活条件:

  • 根据表单键置信度分数,启动对特定表单键的人工审核。

  • 在特定表单键缺失时启动人工审核。

  • 针对 Amazon Textract 标识的置信度分数在指定范围内的所有表单键,启动人工审核。

  • 随机将表单示例发送给工作人员以进行审查。

当激活条件依赖于表单键置信度分数时,您可以使用两种类型的预测置信度来启动人工循环:

  • 标识置信度 – 在表单中检测到的键/值对的置信度分数。

  • 资格置信度 – 表单中的键和值包含的文本的置信度分数。

在以下部分的图像中,Full Name: Jane Doe 是键/值对,Full Name 是键,Jane Doe 是值。

在创建人工审核工作流时,您可以使用 Amazon SageMaker 控制台设置这些激活条件,也可以为人工循环激活条件创建 JSON 并将其在 CreateFlowDefinition API 操作的 HumanLoopActivationConditions 参数中指定为输入,以此来设置这些激活条件。要了解如何以 JSON 格式指定激活条件,请参阅 Amazon Augmented AI 中用于人工循环激活条件的 JSON 架构将人工循环激活条件 JSON 架构与 Amazon Textract 结合使用

注意

将 Augmented AI 与 Amazon Textract 一起使用时,请在您调用 AnalyzeDocument 的同一 Amazon 区域中创建 Augmented AI 资源。

开始使用:将人工审核集成到 Amazon Textract 分析文档作业中

要将人工审核集成到 Amazon Textract 文本检测和分析作业中,您需要创建流定义,然后使用 Amazon Textract API 将该流定义集成到您的工作流中。要了解如何使用 SageMaker 控制台或 Augmented AI API 创建流定义,请参阅以下主题:

在创建流定义后,请参阅将 Augmented AI 与 Amazon Textract 结合使用,以了解如何将流定义集成到 Amazon Textract 任务中。

使用 Amazon Textract 和 Amazon A2I 的端到端示例

有关演示如何使用控制台将 Amazon Textract 与 Amazon A2I 结合使用的端到端示例,请参阅教程:开始使用 Amazon A2I 控制台

要学习如何使用 Amazon A2I API 创建和启动人工审核,您可以在 SageMaker 笔记本实例中,使用 Amazon Augmented AI (Amazon A2I) 与 Amazon Textract 的分析文档相集成 [示例]。要了解其用法,请参阅 将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本一起使用

A2I Textract 工作人员控制台预览

在 Amazon Textract 工作流中为工作人员分配审核任务时,工作人员可能会看到与以下内容类似的用户界面:

在创建人工审核定义时,您可以在 SageMaker 控制台中自定义此界面,也可以使用自定义模板来创建和自定义界面。要了解更多信息,请参阅创建和管理工作人员任务模板