设置自动视频帧输入数据 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

设置自动视频帧输入数据

您可以使用 Ground Truth 自动数据设置自动检测 Amazon S3 存储桶中的视频文件并从这些文件中提取视频帧。要了解如何操作,请参阅 提供视频文件

如果 Amazon S3 中已有视频帧,则可以使用自动数据设置在标注作业中使用这些视频帧。对于此选项,来自单个视频的所有视频帧必须使用唯一的前缀来存储。要了解使用此选项的要求,请参阅提供视频帧

选择以下部分之一,了解如何设置与 Ground Truth 的自动输入数据集连接。

使用以下过程将视频文件与 Ground Truth 连接起来,并自动从这些文件中提取视频帧以进行视频帧对象检测和对象跟踪标注作业。

注意

如果您使用自动数据设置控制台工具从 10 个以上的视频文件中提取视频帧,则需要修改该工具生成的清单文件,或创建一个新的清单文件以包含 10 个或更少的视频帧序列文件。要了解更多信息,请参阅 提供视频文件

确保您的视频文件存储在您执行自动数据设置所在 Amazon 区域的 Amazon S3 存储桶中。

使用 Ground Truth 自动连接 Amazon S3 中的视频文件并提取视频帧:
  1. 导航至亚马逊 SageMaker控制台中的创建标签作业页面:g https://console.aws.amazon.com/sagemaker/roundtrut h。

    输入和输出 S3 存储桶必须位于创建标注作业的同一 Amazon 区域中。此链接将您带到北弗吉尼亚州 (us-east- Amazon 1) 区域。如果输入数据在另一个区域的 Amazon S3 存储桶中,请切换到该区域。要更改您的 Amazon 区域,请在导航栏上选择当前显示的区域的名称。

  2. 选择创建标注作业

  3. 输入作业名称

  4. 输入数据设置部分,选择自动数据设置

  5. 输入输入数据集的 Ama URI zon S3 for S3 位置。S3 URI 如下所示:s3://amzn-s3-demo-bucket/path-to-files/. 这URI应该指向存储视频文件的 Amazon S3 位置。

  6. 指定输出数据集的 S3 位置。这是存储输出数据的位置。您可以选择将输出数据存储在与输入数据集相同的位置,也可以选择指定新位置并输入要存储输出数据的位置的 S3 URI。

  7. 使用下拉列表为数据类型选择视频文件

  8. 选择是的,为对象跟踪和检测任务提取帧

  9. 选择一种帧提取方法。

    • 当您选择使用从视频中提取的所有帧来创建标注任务时,Ground Truth 将从输入数据集的 S3 位置的每个视频中提取所有帧,最多可提取 2000 帧。如果输入数据集中的视频包含 2000 多个帧,则会提取前 2000 个帧用于该标注任务。

    • 当你选择 Use e very 时 x 从视频中提取帧来创建标签任务,Ground Truth 会提取所有帧以创建标注任务 x您@@ S3 位置中每个视频中输入数据集的第 1 个帧。

      例如,如果您的视频长度为 2 秒,帧频为每秒 30 帧,那么视频中就有 60 个帧。如果在此指定 10,Ground Truth 将提取视频中的每第 10 帧。这意味着提取第 1、第 10、第 20、第 30、第 40、第 50 和第 60 帧

  10. 选择或创建IAM执行角色。确保此角色有权访问您的 Amazon S3 位置以获取步骤 5 和 6 中指定的输入和输出数据。

  11. 选择完成数据设置

使用以下过程将视频帧序列与 Ground Truth 连接起来,以进行视频帧对象检测和对象跟踪标注作业。

确保您的视频帧存储在您执行自动数据设置所在 Amazon 区域的 Amazon S3 存储桶中。每个视频帧序列都应该有唯一的前缀。例如,如果您在 s3://amzn-s3-demo-bucket/video-frames/sequences/ 中存储了两个序列,则每个序列都应该有一个唯一的前缀(如 sequence1sequence2),并且都应该位于 /sequences/ 前缀的正下方。在上面的示例中,这两个序列的位置是:s3://amzn-s3-demo-bucket/video-frames/sequences/sequence1/s3://amzn-s3-demo-bucket/video-frames/sequences/sequence2/

自动将您在 Amazon S3 中的视频帧与 Ground Truth 连接:
  1. 导航至亚马逊 SageMaker 控制台中的创建标签作业页面:g https://console.aws.amazon.com/sagemaker/roundtrut h。

    输入和输出 S3 存储桶必须位于创建标注作业的同一 Amazon 区域中。此链接将您带到北弗吉尼亚州 (us-east- Amazon 1) 区域。如果输入数据在另一个区域的 Amazon S3 存储桶中,请切换到该区域。要更改您的 Amazon 区域,请在导航栏上选择当前显示的区域的名称。

  2. 选择创建标注作业

  3. 输入作业名称

  4. 输入数据设置部分,选择自动数据设置

  5. 输入输入数据集的 Ama URI zon S3 for S3 位置

    这应该是存储序列的 Amazon S3 位置。例如,如果在 s3://amzn-s3-demo-bucket/video-frames/sequences/sequence1/s3://amzn-s3-demo-bucket/video-frames/sequences/sequence2/ 中存储了两个序列,请在此处输入 s3://amzn-s3-demo-bucket/video-frames/sequences/

  6. 指定输出数据集的 S3 位置。这是存储输出数据的位置。您可以选择将输出数据存储在与输入数据集相同的位置,也可以选择指定新位置并输入要存储输出数据的位置的 S3 URI。

  7. 使用下拉列表为数据类型选择视频帧

  8. 选择或创建IAM执行角色。确保此角色有权访问您的 Amazon S3 位置以获取步骤 5 和 6 中指定的输入和输出数据。

  9. 选择完成数据设置

这些过程将在您在步骤 5 中指定的输入数据集的 Amazon S3 位置创建输入清单。如果您使用 SageMaker API或、或创建标签任务 Amazon CLI,请使用此输入清单文件的 Amazon S3 URI 作为参数的输入ManifestS3Uri。 Amazon SDK