教程:开始使用 Amazon A2I 控制台
以下教程向您展示了如何在 Amazon A2I 控制台中开始使用 Amazon A2I。
本教程允许您选择将 Augmented AI 与 Amazon Textract 结合使用来进行文档审查,或者与 Amazon Rekognition 结合使用来进行图像内容审查。
先决条件
要开始使用 Amazon A2I,请先满足以下先决条件。
-
在与输入和输出数据的工作流所在的同一 Amazon 区域中,创建 Amazon S3 存储桶。例如,如果您在 us-east-1 中将 Amazon A2I 与 Amazon Textract 结合使用,请在 us-east-1 中创建存储桶。要创建存储桶,请按照《Amazon Simple Storage Service 控制台用户指南》中的创建存储桶的说明操作。
-
请执行下列操作之一:
注意
Amazon A2I 控制台嵌入在 SageMaker 控制台中。
步骤 1:创建工作团队
首先,在 Amazon A2I 控制台中创建一个工作团队,然后将自己添加为工作人员,这样您就可以预览工作人员审核任务。
重要
本教程使用私有工作团队。Amazon A2I 私有人力在 SageMaker 控制台的 Ground Truth 区域配置,此资源在 Amazon A2I 和 Ground Truth 之间共享。
使用工作人员电子邮件创建私有人力
-
通过 https://console.aws.amazon.com/sagemaker/
打开 SageMaker 控制台。 -
在导航窗格中,选择 Ground Truth 下的标注人力。
-
选择私有,然后选择创建私有团队。
-
选择通过电子邮件邀请新工作人员。
-
对于本教程,请输入您的电子邮件,以及任何其他您希望能够预览人工任务 UI 的人员的电子邮件。您可在电子邮件地址框中粘贴或键入包含最多 50 个电子邮件的列表,以逗号分隔。
-
输入组织名称和联系人电子邮件。
-
(可选)选择团队订阅到的 Amazon SNS 主题,这样在有新的 Ground Truth 标注作业可用时,工作人员将收到通知。Ground Truth 支持 Amazon SNS 通知,而 Augmented AI 不支持。如果您将工作人员订阅到 Amazon SNS 通知,他们将仅接收有关 Ground Truth 标注作业的通知,而不会收到有关 Augmented AI 任务的通知。
-
选择创建私有团队。
如果您将自己添加到私有工作团队,则会收到来自 no-reply@verificationemail.com
的电子邮件,其中提供了登录信息。使用此电子邮件中的链接重置密码,然后登录您的工作人员门户。在您创建人工循环时,人工审核任务就会显示在此处。
步骤 2:创建人工审核工作流
在此步骤中,您将创建人工审核工作流。每个人工审核工作流都是针对特定任务类型创建的。在本教程中,您可以在内置任务类型之间进行选择:Amazon Rekognition 和 Amazon Textract。
要创建人工审核工作流,请执行以下操作:
-
通过 https://console.aws.amazon.com/a2i
打开 Augmented AI 控制台,以访问人工审核工作流页面。 -
选择创建人工审核工作流。
-
在工作流设置中,输入工作流的名称、S3 存储桶,以及您为本教程创建的 IAM 角色和所附加的 Amazon 托管策略
AmazonAugmentedAIIntegratedAPIAccess
。 -
对于任务类型,选择 Textract – 键值对提取或者 Rekognition – 图像审核。
-
选择您在下表中选择的任务类型,以获取该任务类型的说明。
-
在工作人员任务模板创建下,选择从默认模板创建。
-
输入模板名称。
-
在任务描述字段中,输入以下文本:
Read the instructions carefully and complete the task.
-
在工作人员下,选择私有。
-
选择您创建的私有团队。
-
选择创建。
创建人工审核工作流后,它将显示在人工审核工作流页面上的表中。当状态为 Active
时,复制并保存工作流 ARN。您在下一个步骤中需要用到它。
步骤 3:启动人工循环
您必须使用 API 操作来启动人工循环。您可以使用各种特定于语言的 SDK 与这些 API 操作进行交互。要查看其中每个 SDK 的文档,请参阅 API 文档的另请参阅部分,如下图所示。
在本教程中,您可以使用以下 API 之一:
-
如果您选择了 Amazon Textract 任务类型,则可以使用
AnalyzeDocument
操作。 -
如果您选择了 Amazon Rekognition 任务类型,则可以使用
DetectModerationLabels
操作。
您可以使用 SageMaker 笔记本实例(建议新用户使用)或 Amazon Command Line Interface (Amazon CLI) 与这些 API 进行交互。选择以下选项之一以详细了解这些选项:
-
要详细了解并设置笔记本实例,请参阅 Amazon SageMaker 笔记本实例。
-
要了解更多信息并开始使用 Amazon CLI,请参阅《Amazon Command Line Interface 用户指南》中的什么是 Amazon 命令行界面?
在下表中选择您的任务类型,以查看使用 Amazon SDK for Python (Boto3) 的 Amazon Textract 和 Amazon Rekognition 示例请求。
步骤 4:在控制台中查看人工循环状态
当您启动人工循环时,您可以在 Amazon A2I 控制台中查看其状态。
查看人工循环状态
-
通过 https://console.aws.amazon.com/a2i
打开 Augmented AI 控制台,以访问人工审核工作流页面。 -
选择用于启动人工循环的人工审核工作流。
-
在人工循环部分中,您可以看到您的人工循环。在状态列中查看其状态。
步骤 5:下载输出数据
输出数据存储在您创建人工审核工作流时指定的 Amazon S3 存储桶中。
查看 Amazon A2I 输出数据
-
打开 Amazon S3 控制台
。 -
选择您在本示例的步骤 2 中,在创建人工审核工作流时指定的 Amazon S3 存储桶。
-
首先从以人工审核工作流命名的文件夹,选择具有以下命名约定的文件夹来导航到输出数据:
s3://
output-bucket-specified-in-human-review-workflow
/human-review-workflow-name
/YYYY
/MM
/DD
/hh
/mm
/ss
/human-loop-name
/output.json -
选择
output.json
并选择下载。