手动输入数据设置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

手动输入数据设置

如果您已经为每个视频帧序列创建了序列文件,并且清单文件列出了这些序列文件的引用,请选择手动数据设置选项。

创建视频帧输入清单文件

Ground Truth 在创建标注任务时使用输入清单文件来识别输入数据集的位置。对于视频帧对象检测和对象跟踪标记作业,输入清单文件中的每一行都标识视频帧序列文件的位置。每个序列文件标识单个视频帧序列中包含的图像。

使用此页面了解如何为视频帧对象跟踪和对象检测标记作业创建视频帧序列文件和输入清单文件。

如果你想让 Ground Truth 自动生成序列文件和输入清单文件,请参阅自动视频帧输入数据设置.

创建视频帧序列输入清单

在视频帧序列输入清单文件中,清单中的每一行都是一个 JSON 对象,带有"source-ref"引用序列文件的密钥。每个序列文件标识视频帧序列的位置。这是所有视频帧标记作业所需的清单文件格式。

下面的示例说明用于输入清单文件的语法:

{"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq1.json"} {"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq2.json"}

创建视频帧序列文件

每个视频帧序列的数据需要存储在 JSON 数据对象中。以下是用于序列文件的格式示例。有关每个帧的信息将包含为 JSON 对象并在 frames 列表中列出。以下 JSON 已扩展以提高可读性。

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

下表提供了有关此代码示例中显示的参数的详细信息。

参数

必需

接受的值

描述

seq-no

整数

序列的有序编号。

prefix

字符串

接受的值

s3://<bucket-name>/<prefix>/

序列文件的 Amazon S3 位置。

前缀必须以正斜杠结尾:/

number-of-frames

整数

序列文件中包含的总帧数。该数字必须与下一行中的 frames 参数列出的总帧数匹配。

frames

JSON 对象列表

必需

frame-no, frame

可选

unix-timestamp

帧数据列表。列表长度必须等于 number-of-frames。在工作器用户界面中,序列中的帧按顺序排列UTF-8二进制订单。要了解有关此订购的更多信息,请参阅提供视频帧.

frame-no

整数

帧顺序号。这将决定序列中帧的顺序。

unix-timestamp

整数

帧的 unix 时间戳。从 1970 年 1 月 1 日到捕获帧的 UTC 时间为止的秒数。

frame

字符串

视频帧图像文件的名称。