使用 Amazon A2I 的使用场景和示例 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 Amazon A2I 的使用场景和示例

您可以使用 Amazon Augmented AI 将人工审核集成到内置任务类型、Amazon Textract 和 Amazon Rekognition 的工作流中,也可以使用自定义任务类型将人工审核集成到您的自定义任务中。

当您使用内置任务类型之一创建人工审核工作流时,您可以指定条件(如置信度阈值)来启动人工审核。当满足这些条件时,服务(Amazon Rekognition 或 Amazon Textract)会代表您创建一个人工循环,并将您的输入数据直接提供给 Amazon A2I 以发送给人工审核者。要了解内置任务类型的更多信息,请参阅以下内容:

使用自定义任务类型时,您可以使用 Amazon A2I 运行时系统 API 创建并启动人工循环。使用自定义任务类型,将人工审核工作流与其他 Amazon 服务或者自己的自定义 ML 应用程序集成。

下表概述了您可以使用 SageMaker Jupyter 笔记本探索的各种 Amazon A2I 使用场景。要开始使用 Jupyter 笔记本,请按照将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本一起使用中的说明操作。有关更多示例,请参阅该 GitHub 存储库

使用场景 描述 任务类型

将 Amazon A2I 与 Amazon Textract 结合使用

通过人工来审核单页文档,以审核重要的表单键/值对,或者让 Amazon Textract 对数据集中的文档随机抽样并发送给工作人员进行审核。

内置
将 Amazon A2I 与 Amazon Rekognition 结合使用

如果 Amazon Rekognition 返回的置信度分数较低,则通过人工来审核不安全图像中的明显成人或暴力内容,或者 Amazon Rekognition 对数据集中的图像随机抽样并发送给工作人员进行审核。

内置

将 Amazon A2I 与 Amazon Comprehend 结合使用

通过人工来审核 Amazon Comprehend 对文本数据进行的推理,例如情绪分析、文本语法和实体检测。

自定义

将 Amazon A2I 与 Amazon Transcribe 结合使用

通过人工来审核 Amazon Transcribe 对视频或音频文件的转录。使用对转录的人工审核循环的结果来创建自定义词汇,并改善未来类似视频或音频内容的转录。

自定义
将 Amazon A2I 与 Amazon Translate 结合使用

通过人工来审核 Amazon Translate 返回的低置信度翻译。

自定义

使用 Amazon A2I 审核实时 ML 推理

使用 Amazon A2I 实时审核部署到 SageMaker 托管端点的模型进行的低置信度推理,并使用 Amazon A2I 输出数据以增量方式训练模型。

自定义

使用 Amazon A2I 审核表格数据

使用 Amazon A2I 将人工审核循环集成到使用表格数据的 ML 应用程序中。

自定义

将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本一起使用

对于演示如何将 Amazon A2I 人工审核循环集成到机器学习工作流中的端到端示例,您可以在 SageMaker 笔记本实例中使用 GitHub 存储库中的 Jupyter 笔记本。

要在 Amazon SageMaker 笔记本实例中使用 Amazon A2I 自定义任务类型示例笔记本,请执行以下操作:
  1. 如果您没有有效的 SageMaker 笔记本实例,请按照步骤 1:创建 Amazon SageMaker 笔记本实例中的说明创建一个。

  2. 在笔记本实例处于活动状态时,选择笔记本实例名称右侧的打开 JupyterLab。加载 JupyterLab 可能需要一些时间。

  3. 选择 图标以将 GitHub 存储库克隆到您的工作区。

  4. 输入 amazon-a2i-sample-jupyter-notebooks 存储库 HTTPS URL。

  5. 选择 CLONE (克隆)

  6. 打开要运行的笔记本。

  7. 按照笔记本中的说明配置人工审核工作流和人工循环,然后运行调用。

  8. 为了避免产生不必要的费用,在您完成演示后,请停止并删除笔记本实例,以及在演练过程中创建的任何 Amazon S3 存储桶、IAM 角色和 CloudWatch Events 资源。