自动视频帧输入数据设置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自动视频帧输入数据设置

您可以使用 Ground Truth 自动数据设置自动检测 Amazon S3 存储桶中的视频文件,并从这些文件中提取视频帧。要了解如何操作,请参阅提供视频文件

如果您在 Amazon S3 中已有视频帧,则可以使用自动数据设置在标签作业中使用这些视频帧。对于此选项,必须使用唯一前缀存储单个视频中的所有视频帧。要了解使用此选项的要求,请参阅提供视频帧.

选择以下部分之一,了解如何使用 Ground Truth 值设置自动输入数据集连接。

使用以下步骤将视频文件与 Ground Truth 连接,并自动从这些文件中提取视频帧以进行视频帧对象检测和对象跟踪标注作业。

注意

如果使用自动数据设置控制台工具从 10 多个视频文件中提取视频帧,则需要修改该工具生成的清单文件,或创建一个新的清单文件以包含 10 个或更少的视频帧序列文件。要了解更多信息,请参阅“提供视频文件”。

请确保视频文件存储在 Amazon S3 存储桶中,位于Amazon您在中执行自动数据设置的区域。

使用 Ground Truth 自动连接 Amazon S3 中的视频文件并提取视频帧:

  1. 导航到创建标记作业页面:https://console.aws.amazon.com/sagemaker/groundtruth.

    您的输入和输出 S3 存储桶必须位于同一Amazon您在其中创建标注作业的区域。此链接让您在北弗吉尼亚 (us-east-1)Amazon区域。如果输入数据位于另一个区域中的 Amazon S3 存储桶中,请切换到该区域。更改Amazon区域,位于导航栏下,选择当前所显示区域的名称。

  2. Select创建标记作业.

  3. 输入作业名称.

  4. 在部分中输入数据设置,SELECT自动化数据设置.

  5. 输入 Amazon S3 URI输入数据集的 S3 位置. S3 URI 看起来与以下内容类似:s3://DOC-EXAMPLE-BUCKET/path-to-files/. 此 URI 应指向存储视频文件的 Amazon S3 位置。

  6. 指定您的输出数据集的 S3 位置. 这是您存放输出数据的地方。您可以选择将输出数据存储在与输入数据集相同的位置或者指定新位置并输入要存储输出数据的位置的 S3 URI。

  7. 选择视频文件用于您的数据类型使用下拉列表。

  8. 选择是,提取用于对象跟踪和检测任务的帧.

  9. 选择一个方法帧抽取.

    • 在选择使用从视频中提取的所有帧创建标注任务时,“Ground Truth” 将从您的每个视频中提取所有帧输入数据集的 S3 位置,最多 2000 个帧。如果输入数据集中的视频包含超过 2,000 帧,则会提取前 2,000 帧并用于该标注任务。

    • 在选择使用每个x从视频帧创建标注任务时,Ground Truth 提取每个xth帧中的每个视频输入数据集的 S3 位置.

      例如,如果您的视频长度为 2 秒,并且具有帧率为每秒 30 帧,则视频中有 60 帧。如果您在此处指定 10,则 “Ground Truth” 将每 10th帧从您的视频。这意味着 1ST, 10th, 20th, 30th, 40th, 50th,以及 60 个th帧被提取。

  10. 选择或创建 IAM 执行角色。确保此角色有权访问您的 Amazon S3 位置,以获取步骤 5 和 6 中指定的输入和输出数据。

  11. Select完成数据设置.

使用以下步骤将视频帧序列与 Ground Truth 连接,以进行视频帧对象检测和对象跟踪标注作业。

确保您的视频帧存储在 Amazon S3 存储桶中,位于Amazon您在中执行自动数据设置的区域。每个视频帧序列都应具有唯一的前缀。例如,如果您有两个序列存储在s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/,每个值应该有一个唯一的前缀,如sequence1sequence2,并且都应该直接位于/sequences/prefix. 在以上示例中,这两个序列的位置是:s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/.

使用 Ground Truth 自动连接 Amazon S3 中的视频帧:

  1. 导航到创建标记作业页面:https://console.aws.amazon.com/sagemaker/groundtruth.

    您的输入和输出 S3 存储桶必须位于同一Amazon您在其中创建标注作业的区域。此链接让您在北弗吉尼亚 (us-east-1)Amazon区域。如果输入数据位于另一个区域中的 Amazon S3 存储桶中,请切换到该区域。更改Amazon区域,位于导航栏下,选择当前所显示区域的名称。

  2. Select创建标记作业.

  3. 输入作业名称.

  4. 在部分中输入数据设置,SELECT自动化数据设置.

  5. 输入 Amazon S3 URI输入数据集的 S3 位置.

    这应是存储序列的序列的 Amazon S3 位置。例如,如果您有两个序列存储在s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/,输入s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/此处.

  6. 指定您的输出数据集的 S3 位置. 这是您存放输出数据的地方。您可以选择将输出数据存储在与输入数据集相同的位置或者指定新位置并输入要存储输出数据的位置的 S3 URI。

  7. 选择视频帧用于您的数据类型使用下拉列表。

  8. 选择或创建 IAM 执行角色。确保此角色有权访问您的 Amazon S3 位置,以获取步骤 5 和 6 中指定的输入和输出数据。

  9. Select完成数据设置.

这些过程将在 Amazon S3 位置为您在步骤 5 中指定的输入数据集创建输入清单。如果要使用 SageMaker API 创建标记作业,或者,Amazon CLI,或Amazon开发工具包,请将此输入清单文件的 Amazon S3 URI 用作参数ManifestS3Uri.