本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在输出数据中查找重复数据删除键和 ID
您可以在输出数据中看到重复数据删除键和 ID。重复数据删除键由 dataset-objectid-attribute-name 标识。当您使用自己的自定义重复数据删除键时,输出结果类似于下面的内容:
"dataset-objectid-attribute-name": "byo-key", "byo-key": "UniqueId",
如果未指定键,则可通过以下方式找到 Ground Truth 为数据对象分配的重复数据删除 ID。$ 参数标识重复数据删除 ID。label-attribute-name-object-id
{ "source-ref":"s3://bucket/prefix/object1", "dataset-objectid-attribute-name":"$label-attribute-name-object-id" "label-attribute-name" :0, "label-attribute-name-metadata": {...}, "$label-attribute-name-object-id":"<service-generated-key>" }
对于 ,如果数据对象是通过 Amazon S3 配置生成的,Ground Truth 会添加该服务使用的唯一值,并发出一个以 <service-generated-key>$ 为键值的新字段,显示使用的 Amazon S3 sequencer。如果对象直接馈送到 SNS,Ground Truth 将使用 SNS 消息 ID。sequencer