手动输入数据设置 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

手动输入数据设置

如果您已为每个视频帧序列创建序列文件,并有一个清单文件列出对这些序列文件的引用,请选择手动数据设置选项。

创建视频帧输入清单文件

Ground Truth 在创建标记任务时, 使用输入清单文件来标识输入数据集的位置。对于视频帧对象检测和对象跟踪标记作业,输入清单文件中的每一行标识视频帧序列文件的位置。每个序列文件标识包含在单个视频帧序列中的图像。

可以使用此页面了解如何为视频帧对象跟踪和对象检测标记作业创建视频帧序列文件和输入清单文件。

如果要Ground Truth自动生成序列文件和输入清单文件,请参阅自动视频帧输入数据设置

创建视频帧序列输入清单

在视频帧输入清单文件中,清单中的每一行都是 JSON 对象,带有引用序列文件的"source-ref"键。每个序列文件标识一系列视频帧的位置。这是所有视频帧标记作业所需的清单文件格式。

以下示例演示了用于输入清单文件的语法:

{"source-ref": "s3:///example-folder/seq1.json"} {"source-ref": "s3:///example-folder/seq2.json"}

创建视频帧序列文件

每个视频帧序列的数据需要存储在 JSON 数据对象中。以下是用于序列文件的格式示例。有关每个帧的信息将包含为 JSON 对象并在 frames 列表中列出。为便于阅读,已扩展以下 JSON。

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

下表提供了有关此代码示例中显示的参数的详细信息。

参数

必需

接受的值

描述

seq-no

整数

序列的有序编号。

prefix

字符串

接受的值

s3://<bucket-name>/<prefix>/

序列文件所在的 Amazon S3 位置。

前缀必须以正斜杠结尾:/

number-of-frames

整数

序列文件中包含的总帧数。该数字必须与下一行中的 frames 参数列出的总帧数匹配。

frames

JSON 对象列表

必填项

frame-no, frame

(可选)

unix-timestamp

帧数据列表。列表长度必须等于 number-of-frames。在工作人员 UI 中,序列中的帧按 UTF-8 二进制顺序排序。要了解有关此排序的更多信息,请参阅提供视频帧

frame-no

字符串

帧顺序编号。这将确定帧在序列中的顺序。

unix-timestamp

整数

帧的 unix 时间戳。从 1970 年 1 月 1st到捕获帧的 UTC 时间之间的秒数。

frame

字符串

视频帧图像文件的名称。