演示:在 Amazon A2I 控制台中开始使用 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

演示:在 Amazon A2I 控制台中开始使用

以下演示说明如何在 Amazon A2I 控制台Amazon A2I中开始使用 。

该演示为您提供了将 Augmented AI 与 结合使用Amazon Textract以进行文档审核或Amazon Rekognition图像内容审核的选项。

Prerequisites

要开始使用 Amazon A2I,请满足以下先决条件。

注意

Amazon A2I 控制台嵌入在 SageMaker 控制台中。

步骤 1:创建工作团队

首先,在 Amazon A2I 控制台中创建一个工作团队,并将自己添加为工作人员,以便您可以预览工作人员审核任务。

重要

本演练使用私有工作团队。Amazon A2I 私有人力在Ground Truth控制台的 SageMaker 区域中配置,并在 Amazon A2I 和 之间共享Ground Truth。

使用工作人员电子邮件创建私有人力

  1. 在 SageMakerhttps://console.aws.amazon.com/sagemaker/ 打开 控制台。

  2. 在导航窗格中,选择 下的 Ground TruthLabeling workforces (标记人力)。

  3. 选择 Private (私有),然后选择 Create private team (创建私有团队)

  4. 选择 Invite new workers by email (通过电子邮件邀请新工作人员)

  5. 在本演示中,输入您的电子邮件以及您希望能够预览人工任务 UI 的任何其他电子邮件。您可以在电子邮件地址框中粘贴或键入最多包含 50 个电子邮件地址的列表,以逗号分隔。

  6. 输入组织名称和联系人电子邮件。

  7. (可选)选择团队订阅到的 SNS 主题,这样在有新的Ground Truth标记作业可用时,工作人员将收到通知。 Amazon SNS 通知受 支持Ground Truth,但不受 支持Augmented AI。如果您为工作人员订阅 SNS 通知,他们将仅接收有关Ground Truth标记作业的通知。它们不接收有关Augmented AI任务的通知。

  8. 单击 Create private team (创建私有团队) 按钮。

如果您将自己添加到私有工作团队,则会收到来自 的电子邮件no-reply@verificationemail.com,其中包含登录信息。使用此电子邮件中的链接重置您的密码并登录到工作人员门户。这是在创建人工循环时显示人工审核任务的位置。

步骤 2:创建人工审核工作流程

在此步骤中,您将创建一个人工审核工作流程。每个人工审核工作流程都是为特定任务类型创建的。此演示允许您在内置任务类型之间进行选择: Amazon Rekognition 和 Amazon Textract。

创建人工审核工作流程:

  1. 通过 Augmented AIhttps://console.aws.amazon.com/a2i 打开 控制台以访问 Human review workflows (人工审查工作流程) 页面。

  2. 选择 Create human review workflow (创建人工审核工作流程)。

  3. Workflow settings (工作流程设置) 中,输入工作流程 Name (名称)、S3 bucket (S3 存储桶) 以及您为此演示创建IAM的角色,并附加了 AWS 托管策略 AmazonAugmentedAIIntegratedAPIAccess。

  4. 对于 Task type (任务类型),选择 Textract - 键值对提取Rekognition - Image moderation (Rekognition - 图像审核)。

  5. 从下表中选择任务类型以获取该任务类型的说明。

    Amazon Textract - Key-value pair extraction

    1. 选择 Trigger a human review for specific form keys based based on the form keys assumity score or when specific form keys is missing. (根据表单键置信度得分或在特定表单键缺失

    2. 对于 Key name (密钥名称),输入 Mail Address (邮件地址)。

    3. 设置介于 099 之间的标识置信度阈值。

    4. 设置介于 099 之间的资格置信度阈值。

    5. 选择 Trigger a human review for all form keys identifyed by Amazon Textract with confidence scores in a specific range。

    6. 设置介于 090 之间的标识置信度阈值。

    7. 设置介于 090 之间的资格置信度阈值。

    如果 为 Amazon TextractMail Address 及其键返回的置信度得分低于 99,或者为在文档中检测到的任何键值对返回的置信度得分低于 90,则会触发人工审核。

    Amazon Rekognition - Image moderation

    1. 选择 Trigger human review for labels identified Amazon Rekognition by based on based based on label confidence score (根据标签置信度

    2. 设置介于 098 之间的阈值

    如果 Amazon Rekognition 返回的图像审核作业的置信度分数低于 98,则会触发人工审核。

  6. Worker task template creation (工作人员任务模板创建) 下,选择 Create from a default template (从默认模板创建)。

  7. 输入 Template name (模板名称)。

  8. Task description (任务描述) 中,将以下内容复制并粘贴到文本框中:

    请仔细阅读说明并完成任务。

  9. Workers (工作人员) 下,选择 Private (私有)。

  10. 选择您创建的私有团队。

  11. 选择 Create (创建)

创建人工审核工作流程后,该工作流程将显示在 Human review workflows (人工审核工作流程) 页面上的 表中。当 Status (状态) 为 Active (活动) 时,复制并保存 Workflow ARN (工作流程 ARN)。在下一步中,您将需要此信息。

步骤 3:启动人工循环

您必须使用 API 操作启动人工循环。您可以使用各种特定于语言SDKs与这些 API 操作进行交互。要查看每个SDKs的文档,请参阅 API 文档中的另请参阅部分。例如:

在本演示中,您将使用以下 APIs 之一:

您可以使用 SageMaker 笔记本实例(建议新用户使用)或 AWS Command Line Interface (AWS CLI) 与这些 APIs 进行交互。选择下列 ot 之一可了解有关这些选项的更多信息:

在下表中选择您的任务类型以查看针对 Amazon Textract 和Amazon Rekognition使用适用于 Python 的 AWS 开发工具包 (Boto3 的示例请求。

Amazon Textract- Key-value pair extraction

以下示例使用适用于 Python 的 AWS 开发工具包 (Boto3 在 us-west-2 analyze_document 中调用 。将红色的斜体文本替换为您的资源。如果您使用的是 人力,则包括 DataAttributesAmazon Mechanical Turk 参数。有关更多信息,请参阅适用于 Python (Boto) 的 AWS 开发工具包 API 参考中的analyze_document文档。

response = client.analyze_document( Document={ "S3Object": { "Bucket": "AWSDOC-EXAMPLE-BUCKET", "Name": "document-name.pdf" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes" : { ContentClassifiers:["FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent"] } }, FeatureTypes=["TABLES", "FORMS"])
Amazon Rekognition - Image moderation

以下示例使用适用于 Python 的 AWS 开发工具包 (Boto3 在 us-west-2 detect_moderation_labels 中调用 。将红色的斜体文本替换为您的资源。如果您使用的是 人力,则包括 DataAttributesAmazon Mechanical Turk 参数。有关更多信息,请参阅适用于 Python (Boto) 的 AWS 开发工具包 API 参考中的detect_moderation_labels文档。

response = client.detect_moderation_labels( Image={ "S3Object":{ "Bucket": "AWSDOC-EXAMPLE-BUCKET", "Name": "image-name.png" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes":{ ContentClassifiers:["FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent"] } })

步骤 4:在控制台中查看人工循环状态

启动人工循环时,您可以在 Amazon A2I 控制台中查看其状态。

查看人工循环状态

  1. 通过 Augmented AIhttps://console.aws.amazon.com/a2i 打开 控制台以访问 Human review workflows (人工审查工作流程) 页面。

  2. 选择用于启动人工循环的人工审核工作流程。

  3. 在人工循环部分中,您可以看到您的人工循环。在 Status 列中查看其状态。

步骤 5:下载输出数据

您的输出数据存储在创建人工审核工作流程时指定的 Amazon S3 存储桶中。

查看Amazon A2I输出数据

  1. 打开 Amazon S3 控制台

  2. 选择您在本演示的步骤 2 中创建人工审核工作流程时指定的 Amazon S3 存储桶。

  3. 从以人工审核工作流程命名的文件夹开始,通过单击具有以下命名约定的文件夹来导航到输出数据:

    s3://output-bucket-specified-in-human-review-workflow/human-review-workflow-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json
  4. 选择 output.json,然后选择 Download (下载)。