本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
标记任务的批次
Amazon SageMaker Ground Truth 将数据对象按批次发送给工作人员。每个数据对象对应一个或多个任务。对于每个任务,工作人员注释其中一个数据对象。批处理执行以下操作:
-
设置工作人员可用的数据对象的数量。在注释对象后,将发送另一个批次。
-
将工作分成多个更小的块,以避免人力负担过重。
-
提供数据区块以便对自动数据标记模型进行迭代训练。
Ground Truth 首先给工作人员发送包含 10 个任务的批次。它使用这个小批次来设置标记作业,并确保该作业得到正确配置。
Ground Truth然后, 会给工作人员发送更大的批次。
当您使用 CreateLabelingJob
操作创建作业时,配置批处理大小。如果使用 Amazon SageMaker 控制台创建标记作业,Ground Truth 自动将作业配置为在每个批次中使用 1,000
个任务。