视频分类 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

视频分类

当您需要工作人员使用您指定的预定义标签对视频进行分类时,请使用 Amazon SageMaker Ground Truth 视频分类标记任 工作人员将看到视频,并要求工作人员为每个视频选择一个标签。

您可以使用 Amazon SageMaker 控制台的 “Ground Truth” 部分或CreateLabelingJoboperation.

您的视频文件必须以标记数据的工作团队使用的浏览器支持的格式进行编码。建议您使用 worker UI 预览验证输入清单文件中的所有视频文件格式是否正确显示。您可以使用工作人员说明将受支持的浏览器传达给工作 要查看支持的文件格式,请参阅支持的数据格式.

重要

对于此任务类型,如果您创建自己的清单文件,请使用"source-ref"以识别 Amazon S3 中您要标记的每个视频文件的位置。有关更多信息,请参阅 输入数据

创建视频分类标记 Job (控制台)

您可以按照中的说明进行操作创建标记作业(控制台)以了解如何在 SageMaker 控制台中创建视频分类标记作业。在步骤 10 中,选择视频来自 的任务类别下拉列表,然后选择视频分类作为任务类型。

Ground Truth 为标记任务提供类似于以下内容的工作人员 UI。在控制台中创建标记作业时,需要指定说明,以帮助工作人员完成工作人员可以从中选择的作业和标签。

创建视频分类标记 Job (API)

本节介绍了使用 SageMaker API 操作创建标记作业时需要了解的详细信息。CreateLabelingJob. 该 API 为所有 Amazon 开发工具包定义了该操作。要查看此操作支持的特定于语言的 SDK 列表,请查看另请参阅的部分CreateLabelingJob.

请按照创建标记作业 (API)中的说明进行操作,并在配置请求时执行以下操作:

  • 使用以下结尾的预注 Lambda 函数PRE-VideoClassification. 要查找您的区域的注释前 Lambda ARN,请参阅。PreHumanTaskLambdaArn.

  • 使用注释合并 Lambda 函数,结尾为ACS-VideoClassification. 要查找您所在区域的注释合并 Lambda ARN,请参阅。AnnotationConsolidationLambdaArn.

以下是一个示例:AmazonPython SDK (Boto3) 请求在美国东部(弗吉尼亚北部)区域创建标记作业。

response = client.create_labeling_job( LabelingJobName='example-video-classification-labeling-job, LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://bucket/path/file-to-store-output-data', 'KmsKeyId': 'string' }, RoleArn='arn:aws:iam::*:role/*, LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json', StoppingConditions={ 'MaxHumanLabeledObjectCount': 123, 'MaxPercentageOfInputDatasetLabeled': 123 }, HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*', 'UiConfig': { 'UiTemplateS3Uri': 's3://bucket/path/worker-task-template.html' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-VideoClassification', 'TaskKeywords': [ 'Video Classification', ], 'TaskTitle': 'Video classification task', 'TaskDescription': 'Select a label to classify this video', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-VideoClassification' }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )

为视频分类提供模板

如果要使用 API 创建标记作业,必须在 UiTemplateS3Uri 中提供工作人员任务模板。通过修改以下模板复制并修改以下模板short-instructionsfull-instructions, 和header. 将此模板上传到 Amazon S3,并在中为此文件提供 Amazon S3 URI。UiTemplateS3Uri.

视频分类输出数据

创建视频分类标签作业后,您的输出数据 Amazon S3 位于在S3OutputPath使用 API 时的参数或在输出数据集位置字段中的Job 概述控制台的部分。

要详细了解 Ground Truth 生成的输出清单文件以及 Ground Truth 用于存储输出数据的文件结构,请参阅。输出数据.

要查看视频分类标记作业的输出清单文件示例,请参阅。分类作业输出.