手动输入数据设置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

手动输入数据设置

如果您已为每个视频帧序列创建了序列文件,并在清单文件中列出了对这些序列文件的引用,请选择手动数据设置选项。

创建视频帧输入清单文件

在创建标注任务时,Ground Truth 使用输入清单文件来标识输入数据集的位置。对于视频帧对象检测和对象跟踪标注作业,输入清单文件中的每一行都标识视频帧序列文件的位置。每个序列文件标识单个视频帧序列中包含的图像。

使用本页可以了解如何为视频帧对象跟踪和对象检测标注作业创建视频帧序列文件和输入清单文件。

如果您希望 Ground Truth 自动生成序列文件和输入清单文件,请参阅自动视频帧输入数据设置

创建视频帧序列输入清单

在视频帧序列输入清单文件中,清单中的每一行都是一个 JSON 对象,其中有一个引用序列文件的 "source-ref" 键。每个序列文件标识视频帧序列的位置。这是所有视频帧标注作业所需的清单文件格式。

下面的示例演示了用于输入清单文件的语法:

{"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq1.json"} {"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq2.json"}

创建视频帧序列文件

每个视频帧序列的数据需要存储在一个 JSON 数据对象中。以下是用于序列文件的格式示例。有关每个帧的信息将包含为 JSON 对象并在 frames 列表中列出。为了便于阅读,下面的 JSON 已经扩展。

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

下表详细介绍了此代码示例中显示的参数。

参数

必需

接受的值

描述

seq-no

整数

序列的有序编号。

prefix

字符串

接受的值

s3://<bucket-name>/<prefix>/

序列文件所在的 Amazon S3 位置。

前缀必须以正斜杠结尾:/

number-of-frames

整数

序列文件中包含的总帧数。该数字必须与下一行中的 frames 参数列出的总帧数匹配。

frames

JSON 对象列表

必需

frame-no, frame

可选

unix-timestamp

帧数据列表。列表长度必须等于 number-of-frames。在工作人员 UI 中,序列中的帧以 UTF-8 二进制顺序排序。要了解有关此排序的更多信息,请参阅提供视频帧

frame-no

整数

帧顺序号。这将决定帧在序列中的顺序。

unix-timestamp

整数

帧的 unix 时间戳。从 1970 年 1 月 1 日到捕获帧时的 UTC 时间的秒数。

frame

字符串

视频帧图像文件的名称。