使用 Amazon A2I 的使用场景和示例 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon A2I 的使用场景和示例

您可以使用 Amazon Augmented AI 将人工审核集成到内置任务类型、Amazon Textract 和 Amazon Rekognition 的工作流中,也可以使用自定义任务类型将人工审核集成到您的自定义任务中。

当您使用内置任务类型之一创建人工审核工作流时,您可以指定条件(如置信度阈值)来启动人工审核。当满足这些条件时,服务(Amazon Rekognition 或 Amazon Textract)会代表您创建一个人工循环,并将您的输入数据直接提供给 Amazon A2I 以发送给人工审核者。要了解内置任务类型的更多信息,请参阅以下内容:

使用自定义任务类型时,您可以使用 Amazon A2I 运行时创建并启动人工循环。API使用自定义任务类型,将人工审核工作流与其他 Amazon 服务或者自己的自定义 ML 应用程序集成。

下表概述了您可以使用 Jupyt SageMaker er 笔记本探索的各种 Amazon A2I 用例。要开始使用 Jupyter 笔记本,请按照将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本配合使用中的说明操作。有关更多示例,请参阅此GitHub存储库

使用场景 描述 任务类型

将 Amazon A2I 与 Amazon Textract 结合使用

通过人工来审核单页文档,以审核重要的表单键/值对,或者让 Amazon Textract 对数据集中的文档随机抽样并发送给工作人员进行审核。

内置
将 Amazon A2I 与 Amazon Rekognition 结合使用

如果 Amazon Rekognition 返回的置信度分数较低,则通过人工来审核不安全图像中的明显成人或暴力内容,或者 Amazon Rekognition 对数据集中的图像随机抽样并发送给工作人员进行审核。

内置

将 Amazon A2I 与 Amazon Comprehend 结合使用

通过人工来审核 Amazon Comprehend 对文本数据进行的推理,例如情绪分析、文本语法和实体检测。

自定义

将 Amazon A2I 与 Amazon Transcribe 结合使用

通过人工来审核 Amazon Transcribe 对视频或音频文件的转录。使用对转录的人工审核循环的结果来创建自定义词汇,并改善未来类似视频或音频内容的转录。

自定义
将 Amazon A2I 与 Amazon Translate 结合使用

通过人工来审核 Amazon Translate 返回的低置信度翻译。

自定义

使用 Amazon A2I 审核实时 ML 推理

使用 Amazon A2I 查看部署到 SageMaker 托管终端节点的模型所做的实时、低可信度推断,并使用 Amazon A2I 输出数据对模型进行增量训练。

自定义

使用 Amazon A2I 审核表格数据

使用 Amazon A2I 将人工审核循环集成到使用表格数据的 ML 应用程序中。

自定义

将 SageMaker 笔记本实例与 Amazon A2I Jupyter 笔记本配合使用

有关演示如何将 Amazon A2I 人工审阅循环集成到机器学习工作流程中的示 end-to-end 例,您可以在笔记本实例中使用此GitHub 存储库中的 Jupyter 笔记本。 SageMaker

要在亚马逊笔记本实例中使用 Amazon A2I 自定义任务类型示例笔记本,请执行以下 SageMaker操作:
  1. 如果您没有活动的 SageMaker 笔记本实例,请按照中的说明创建一个笔记本实例为本教程创建 Amazon SageMaker 笔记本实例

  2. 当您的笔记本实例处于活动状态时,选择笔记本实例名称右侧的 “打开 JupyterLab”。可能需要一些时间 JupyterLab 才能加载。

  3. 选择 “添加 Github 存储库” 图标 ( Diagonal arrow icon with N and 1 symbols, representing a one-to-many relationship. ),将 GitHub 仓库克隆到您的工作区。

  4. 进入亚马逊 a2 存储库i-sample-jupyter-notebooks。HTTPS URL

  5. 选择CLONE

  6. 打开要运行的笔记本。

  7. 按照笔记本中的说明配置人工审核工作流和人工循环,然后运行调用。

  8. 为避免产生不必要的费用,完成演示后,请停止并删除您的笔记本实例,以及演练期间创建的任何 Amazon S3 存储桶、IAM角色和 CloudWatch 事件资源。