创建多标签文本分类标注作业（控制台）创建多标签文本分类标注作业 (API)多标签文本分类输出数据

通过文本分类（多标签）对文本进行分类

要将文章和文本分类为多个预定义类别，请使用多标签文本分类任务类型。例如，您可以使用此任务类型来识别在文本中传达的多种情感。以下各节将介绍如何通过管理控制台和 API 创建多标签文本分类任务。

在处理多标签文本分类任务时，工作人员应选择所有适用的标签，且必须至少选择一个标签。使用此任务类型创建作业时，您最多可提供 50 个标签类别。

当所有标签都不适用时，Amazon G SageMaker round Truth 不提供 “无” 类别。要向工作人员提供此选项，请在创建多标签文本分类作业时，包含类似于“无”或“其他”的标签。

若要限制工作人员为每个文档或文本选择单个标签，请使用通过文本分类（单标签）对文本进行分类任务类型。

重要

如果您手动创建输入清单文件，请使用 "source" 来识别要标注的文本。有关更多信息，请参阅输入数据。

创建多标签文本分类标注作业（控制台）

您可以按照说明学习创建标注作业（控制台）如何在 Amazon A SageMaker I 控制台中创建多标签文本分类标注任务。在步骤 10 中，从任务类别下拉菜单中选择文本，然后选择文本分类（多标签）作为任务类型。

Ground Truth 为标注任务提供类似于以下内容的工作人员 UI。使用控制台创建标注作业时，需要指定说明，以便于工作人员完成工作人员可以从中选择的作业和标签。

Gif 展示了如何在 Amazon A SageMaker I 控制台中创建多标签文本分类标签作业。

创建多标签文本分类标注作业 (API)

要创建多标签文本分类标注作业，请使用 SageMaker API 操作CreateLabelingJob。此 API 为所有人定义了此操作 Amazon SDKs。要查看此操作 SDKs 支持的特定语言列表，请查看的 “另请参阅” 部分。CreateLabelingJob

请按照创建标注作业 (API)中的说明进行操作，并在配置请求时执行以下操作：

此任务类型的注释前 Lambda 函数以 PRE-TextMultiClassMultiLabel 结尾。要查找您所在地区的预注释 Lambda ARN，请参阅。PreHumanTaskLambdaArn
此任务类型的注释合并 Lambda 函数以 ACS-TextMultiClassMultiLabel 结尾。要查找您所在地区的注释合并 Lambda ARN，请参阅。AnnotationConsolidationLambdaArn

以下是一个 Amazon Python SDK (Boto3) 请求示例，该请求在美国东部（弗吉尼亚州北部）区域中创建标注作业。所有红色参数都应替换为您的规范和资源。


response = client.create_labeling_job(
    LabelingJobName='example-multi-label-text-classification-labeling-job,
    LabelAttributeName='label',
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json'
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent',
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': 's3://bucket/path/file-to-store-output-data',
        'KmsKeyId': 'string'
    },
    RoleArn='arn:aws:iam::*:role/*,
    LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json',
    StoppingConditions={
        'MaxHumanLabeledObjectCount': 123,
        'MaxPercentageOfInputDatasetLabeled': 123
    },
    HumanTaskConfig={
        'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*',
        'UiConfig': {
            'UiTemplateS3Uri': 's3://bucket/path/custom-worker-task-template.html'
        },
        'PreHumanTaskLambdaArn': 'arn:aws:lambda::function:PRE-TextMultiClassMultiLabel,
        'TaskKeywords': [
            'Text Classification',
        ],
        'TaskTitle': 'Multi-label text classification task',
        'TaskDescription': 'Select all labels that apply to the text shown',
        'NumberOfHumanWorkersPerDataObject': 123,
        'TaskTimeLimitInSeconds': 123,
        'TaskAvailabilityLifetimeInSeconds': 123,
        'MaxConcurrentTaskCount': 123,
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-TextMultiClassMultiLabel'
        },
    Tags=[
        {
            'Key': 'string',
            'Value': 'string'
        },
    ]
)

为多标签文本分类创建模板

如果要使用 API 创建标注作业，必须在 UiTemplateS3Uri 中提供工作人员任务模板。复制并修改以下模板。仅修改 short-instructions、full-instructions 和 header。

将此模板上传到 S3，并在 UiTemplateS3Uri 中为此文件提供 S3 URI。

要了解如何创建自定义模板，请参阅自定义标注工作流程。

多标签文本分类输出数据

创建多标签图像分类标注作业后，输出数据将位于使用 API 时在 S3OutputPath 参数中指定的 Amazon S3 存储桶中，或者位于控制台的作业概览部分的输出数据集位置字段中。

要了解有关 Ground Truth 生成的输出清单文件以及 Ground Truth 用来存储输出数据的文件结构的更多信息，请参阅标注作业输出数据。

要查看多标签文本分类标注作业的输出清单文件示例，请参阅多标签分类作业输出。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

通过文本分类（单标签）对文本进行分类

视频和视频帧标注