自动视频帧输入数据设置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

自动视频帧输入数据设置

您可以使用 Ground Truth 自动数据设置自动检测 Amazon S3 存储桶中的视频文件并从这些文件中提取视频帧。要了解如何操作,请参阅提供视频文件

如果 Amazon S3 中已有视频帧,则可以使用自动数据设置在标注作业中使用这些视频帧。对于此选项,来自单个视频的所有视频帧必须使用唯一的前缀来存储。要了解使用此选项的要求,请参阅提供视频帧

选择以下部分之一,了解如何设置与 Ground Truth 的自动输入数据集连接。

使用以下过程将视频文件与 Ground Truth 连接起来,并自动从这些文件中提取视频帧以进行视频帧对象检测和对象跟踪标注作业。

注意

如果您使用自动数据设置控制台工具从 10 个以上的视频文件中提取视频帧,则需要修改该工具生成的清单文件,或创建一个新的清单文件以包含 10 个或更少的视频帧序列文件。要了解更多信息,请参阅提供视频文件

确保您的视频文件存储在您执行自动数据设置所在 Amazon 区域的 Amazon S3 存储桶中。

使用 Ground Truth 自动连接 Amazon S3 中的视频文件并提取视频帧:
  1. 导航到 Amazon SageMaker 控制台中的创建标注作业页面:https://console.aws.amazon.com/sagemaker/groundtruth

    输入和输出 S3 存储桶必须位于创建标注作业的同一 Amazon 区域中。通过该链接,您将进入弗吉尼亚州北部 (us-east-1) Amazon 区域。如果输入数据在另一个区域的 Amazon S3 存储桶中,请切换到该区域。要更改 Amazon 区域,请在导航栏上选择当前显示的区域名称。

  2. 选择创建标注作业

  3. 输入作业名称

  4. 输入数据设置部分,选择自动数据设置

  5. 输入 Amazon S3 URI 作为输入数据集的 S3 位置。S3 URI 如下所示:s3://DOC-EXAMPLE-BUCKET/path-to-files/。此 URI 应指向存储视频文件的 Amazon S3 位置。

  6. 指定输出数据集的 S3 位置。这是存储输出数据的位置。您可以选择将输出数据存储在与输入数据集相同的位置,或指定新位置,并输入您要存储输出数据的位置的 S3 URI。

  7. 使用下拉列表为数据类型选择视频文件

  8. 选择是的,为对象跟踪和检测任务提取帧

  9. 选择一种帧提取方法。

    • 当您选择使用从视频中提取的所有帧来创建标注任务时,Ground Truth 将从输入数据集的 S3 位置的每个视频中提取所有帧,最多可提取 2000 帧。如果输入数据集中的视频包含 2000 多个帧,则会提取前 2000 个帧用于该标注任务。

    • 当您选择使用视频中的每 x 帧来创建标注任务时,Ground Truth 会从输入数据集的 S3 位置的每个视频中提取每第 x 帧。

      例如,如果您的视频长度为 2 秒,帧频为每秒 30 帧,那么视频中就有 60 个帧。如果在此指定 10,Ground Truth 将提取视频中的每第 10 帧。这意味着提取第 1、第 10、第 20、第 30、第 40、第 50 和第 60 帧

  10. 选择或创建 IAM 执行角色。确保此角色有权访问您的 Amazon S3 位置以获取步骤 5 和 6 中指定的输入和输出数据。

  11. 选择完成数据设置

使用以下过程将视频帧序列与 Ground Truth 连接起来,以进行视频帧对象检测和对象跟踪标注作业。

确保您的视频帧存储在您执行自动数据设置所在 Amazon 区域的 Amazon S3 存储桶中。每个视频帧序列都应该有唯一的前缀。例如,如果您在 s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/ 中存储了两个序列,则每个序列都应该有一个唯一的前缀(如 sequence1sequence2),并且都应该位于 /sequences/ 前缀的正下方。在上面的示例中,这两个序列的位置是:s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/

自动将您在 Amazon S3 中的视频帧与 Ground Truth 连接:
  1. 导航到 Amazon SageMaker 控制台中的创建标注作业页面:https://console.aws.amazon.com/sagemaker/groundtruth

    输入和输出 S3 存储桶必须位于创建标注作业的同一 Amazon 区域中。通过该链接,您将进入弗吉尼亚州北部 (us-east-1) Amazon 区域。如果输入数据在另一个区域的 Amazon S3 存储桶中,请切换到该区域。要更改 Amazon 区域,请在导航栏上选择当前显示的区域名称。

  2. 选择创建标注作业

  3. 输入作业名称

  4. 输入数据设置部分,选择自动数据设置

  5. 输入 Amazon S3 URI 作为输入数据集的 S3 位置

    这应该是存储序列的 Amazon S3 位置。例如,如果在 s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/ 中存储了两个序列,请在此处输入 s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/

  6. 指定输出数据集的 S3 位置。这是存储输出数据的位置。您可以选择将输出数据存储在与输入数据集相同的位置,或指定新位置,并输入您要存储输出数据的位置的 S3 URI。

  7. 使用下拉列表为数据类型选择视频帧

  8. 选择或创建 IAM 执行角色。确保此角色有权访问您的 Amazon S3 位置以获取步骤 5 和 6 中指定的输入和输出数据。

  9. 选择完成数据设置

这些过程将在您在步骤 5 中指定的输入数据集的 Amazon S3 位置创建输入清单。如果您使用 SageMaker API、Amazon CLI 或 Amazon SDK 创建标注作业,请使用此输入清单文件的 Amazon S3 URI 作为参数 ManifestS3Uri 的输入。