本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
图像分类(多标签)
当您需要工作人员对图像中的多个对象进行分类时,请使用 Amazon SageMaker Ground Truth 多标签图像分类标记任务。例如,下图显示了一只狗和一只猫。您可以使用多标签图像分类将标签“dog”和“cat”与此图像相关联。

在处理多标签图像分类任务时,工作人员应选择所有适用的标签,且必须选择至少一个标签。使用此任务类型创建作业时,您最多可提供 50 个标签类别。
在控制台中创建标记作业时,Ground Truth 不会针对没有任何标签应用于图像的情况提供 “无” 类别。要向工作人员提供此选项,请在创建多标签图像分类作业时,包含类似于“无”或“其他”的标签。
要限制工作人员为每个图像选择单个标签,请使用 图像分类(单个标签) 任务类型。
对于此任务类型,如果您创建自己的清单文件,请使用"source-ref"
识别 Amazon S3 中您要标记的每个图像文件的位置。有关更多信息,请参阅 输入数据。
创建多标签图像分类标记作业(控制台)
你可以按照中的说明创建标记作业(控制台)以了解如何在 SageMaker 控制台中创建多标签图像分类标记作业。在步骤 10 中,选择Image来自 的任务类别然后选择下拉菜单图像分类(多标签)作为任务类型。
为标记任务提供类似于以下内容的工作人员 UI。在控制台中创建标记作业时,需要指定说明,以帮助工作人员完成工作人员可以从中选择的作业和标签。

创建多标签图像分类标记作业 (API)
要创建多标签图像分类标记作业,请使用 SageMaker API 操作。CreateLabelingJob
. 该 API 为所有 Amazon 开发工具包定义了该操作。要查看此操作支持的特定于语言的 SDK 列表,请查看另请参阅部分CreateLabelingJob
.
请按照创建标记作业 (API)中的说明进行操作,并在配置请求时执行以下操作:
-
此任务类型的注释前 Lambda 函数以结尾。
PRE-ImageMultiClassMultiLabel
. 要查找您所在区域的注释前 Lambda ARN,请参阅PreHumanTaskLambdaArn. -
此任务类型的注释合并 Lambda 函数以结尾
ACS-ImageMultiClassMultiLabel
. 要查找您所在区域的注释合并 Lambda ARN,请参阅AnnotationConsolidationLambdaArn.
以下是一个示例:AmazonPython 软件开发工具包 (Boto3) 请求
response = client.create_labeling_job( LabelingJobName=
'example-multi-label-image-classification-labeling-job
, LabelAttributeName='label'
, InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri':'s3://bucket/path/manifest-with-input-data.json'
} }, 'DataAttributes': { 'ContentClassifiers': ['FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent'
, ] } }, OutputConfig={ 'S3OutputPath':'s3://bucket/path/file-to-store-output-data'
, 'KmsKeyId':'string'
}, RoleArn='arn:aws:iam::*:role/*
, LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json'
, StoppingConditions={ 'MaxHumanLabeledObjectCount':123
, 'MaxPercentageOfInputDatasetLabeled':123
}, HumanTaskConfig={ 'WorkteamArn':'arn:aws:sagemaker:region:*:workteam/private-crowd/*'
, 'UiConfig': { 'UiTemplateS3Uri':'s3://bucket/path/worker-task-template.html'
}, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414
:function:PRE-ImageMultiClassMultiLabel', 'TaskKeywords': ['Image Classification'
, ], 'TaskTitle':'Multi-label image classification task'
, 'TaskDescription':'Select all labels that apply to the images shown'
, 'NumberOfHumanWorkersPerDataObject':123
, 'TaskTimeLimitInSeconds':123
, 'TaskAvailabilityLifetimeInSeconds':123
, 'MaxConcurrentTaskCount':123
, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414
:function:ACS-ImageMultiClassMultiLabel' }, Tags=[ { 'Key':'string'
, 'Value':'string'
}, ] )
为多标签图像分类提供模板
如果要使用 API 创建标记作业,必须在 UiTemplateS3Uri
中提供工作人员任务模板。复制并修改以下模板。仅修改 short-instructions
、full-instructions
和 header
。
将此模板上传到 S3,并在 UiTemplateS3Uri
中为此文件提供 S3 URI。
多标签图像分类输出数据
创建多标签图像分类标签任务后,您的输出数据将位于S3OutputPath
使用 API 时的参数或在输出数据集位置字段的Job 概述控制台的部分。
要详细了解 Ground Truth 生成的输出清单文件以及 Ground Truth 用于存储输出数据的文件结构,请参阅。输出数据.
要查看多标签图像分类标记作业的输出清单文件示例,请参阅多标签分类作业输出。