自动视频帧输入数据设置 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自动视频帧输入数据设置

您可以使用Ground Truth自动数据设置自动检测 Amazon S3 存储桶中的视频文件并从这些文件中提取视频帧。要了解如何操作,请参阅提供视频文件

如果您在 中已有视频帧Amazon S3,则可以使用自动数据设置在标记作业中使用这些视频帧。对于此选项,单个视频中的所有视频帧都必须使用唯一前缀存储。要了解使用此选项的要求,请参阅提供视频帧

选择以下部分之一以了解如何设置与 的自动输入数据集连接Ground Truth。

使用以下过程将视频文件连接到 Ground Truth ,并自动从这些文件中提取视频帧以进行视频帧对象检测和对象跟踪标记作业。

注意

如果您使用自动数据设置控制台工具从 10 个以上的视频文件中提取视频帧,则需要修改该工具生成的清单文件或创建新的清单文件以包含 10 个或更少的视频帧序列文件。要了解更多信息,请参阅“提供视频文件”。

确保您的视频文件存储在您在其中执行自动数据设置的同一 AWS 区域的 Amazon S3 存储桶中。

使用 自动连接 中的视频文件Amazon S3Ground Truth并提取视频帧:

  1. 导航到 控制台中的 Create labeling job (创建标记作业Amazon SageMaker) 页面https://console.aws.amazon.com/sagemaker/groundtruth

    您的输入和输出 S3 存储桶必须位于您在其中创建标记作业的同一 AWS 区域中。此链接会将您置于弗吉尼亚北部 (us-east-1) AWS 区域中。如果您的输入数据位于另一个区域的 Amazon S3 存储桶中,请切换到该区域。要更改您的 AWS 区域,请在导航栏上选择当前显示的区域的名称。

  2. 选择 Create labeling job (创建标记作业)。

  3. 输入 Job name (作业名称)。

  4. Input data setup (输入数据设置) 部分中,选择 Automated data setup (自动数据设置)。

  5. 输入输入数据集Amazon S3的 S3 位置的 URI。S3 URI 如下所示s3:///path-to-files/:。此 URI 应指向存储视频文件Amazon S3的位置。

  6. 指定输出数据集S3 位置。这是存储输出数据的位置。您可以选择将输出数据存储在与输入数据集相同的位置或指定新位置,然后输入要存储输出数据的位置的 S3 URI。

  7. 使用下拉列表为您的 Data type 选择 Video Files。

  8. 选择 Yes, extract frames for object tracking and detection tasks (是,提取帧以执行对象跟踪和

  9. 选择一种 Frame 提取方法。

    • 当您选择 Use all frames 提取自视频以创建标记任务时, 从输入数据集Ground Truth的 S3 位置中的每个视频中提取所有帧,最多 2000 帧。如果输入数据集中的视频包含超过 2000 帧,则提取前 2000 帧并将其用于该标记任务。

    • 当您选择 Use every 时 x 来自视频的 帧,用于创建标记任务,Ground Truth提取每个 xS3 位置中每个视频的输入数据集 帧。

      例如,如果您的视频长度为 2 秒,并且帧速率为 30 帧/秒,则视频中有 60 帧。如果您在此处指定 10,Ground Truth 将从您的视频中每第 10 帧提取一次。这意味着提取第 1 帧、第 10 帧、第 20 帧、第 30 帧、第 40 帧、第 50 帧和第 60 帧。

  10. 选择或创建IAM执行角色。确保此角色有权访问您的Amazon S3位置以获取在步骤 5 和 6 中指定的输入和输出数据。

  11. 选择 Complete data setup (完成数据设置)。

使用以下过程将您的视频帧序列与 连接Ground Truth,以执行视频帧对象检测和对象跟踪标记作业。

确保您的视频帧存储在您在其中执行自动数据设置的 AWS 区域的 Amazon S3 存储桶中。每个视频帧序列应具有唯一的前缀。例如,如果您在 中存储了两个序列s3:///video-frames/sequences/,则每个序列应具有唯一的前缀,如 sequence1sequence2 ,并且它们应直接位于 /sequences/ 前缀的下方。在上述示例中,这两个序列的位置是: s3:///video-frames/sequences/sequence1/s3:///video-frames/sequences/sequence2/

Amazon S3 使用 在 中自动连接您的视频帧Ground Truth:

  1. 导航到 控制台中的 Create labeling job (创建标记作业Amazon SageMaker) 页面https://console.aws.amazon.com/sagemaker/groundtruth

    您的输入和输出 S3 存储桶必须位于您在其中创建标记作业的同一 AWS 区域中。此链接会将您置于弗吉尼亚北部 (us-east-1) AWS 区域中。如果您的输入数据位于另一个区域的 Amazon S3 存储桶中,请切换到该区域。要更改您的 AWS 区域,请在导航栏上选择当前显示的区域的名称。

  2. 选择 Create labeling job (创建标记作业)。

  3. 输入 Job name (作业名称)。

  4. Input data setup (输入数据设置) 部分中,选择 Automated data setup (自动数据设置)。

  5. 输入输入数据集Amazon S3的 S3 位置的 URI。

    这应该是存储序列Amazon S3的位置。例如,如果您在 中存储了两个序列 s3:///video-frames/sequences/sequence1/s3:///video-frames/sequences/sequence2/s3:///video-frames/sequences/在此处输入 。

  6. 指定输出数据集S3 位置。这是存储输出数据的位置。您可以选择将输出数据存储在与输入数据集相同的位置或指定新位置,然后输入要存储输出数据的位置的 S3 URI。

  7. 使用下拉列表为您的数据类型选择 Video frames (视频帧)。

  8. 选择或创建IAM执行角色。确保此角色有权访问您的Amazon S3位置以获取在步骤 5 和 6 中指定的输入和输出数据。

  9. 选择 Complete data setup (完成数据设置)。

这些过程将在您在步骤 5 中指定的输入数据集Amazon S3的位置创建一个输入清单。如果您使用 SageMaker API 或 AWS CLI或 AWS 开发工具包创建标记作业,请将此输入清单文件的 Amazon S3 URI 用作参数 的输入ManifestS3Uri