使用 Amazon SageMaker Ground Truth 标记数据 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon SageMaker Ground Truth 标记数据

要训练机器学习模型,您需要一个大型、高质量、已标记的数据集。Ground Truth 可帮助您为机器学习模型构建高品质的训练数据集。借助 Ground Truth,您可以将来自 Amazon Mechanical Turk、您选择的供应商公司或内部私有人力资源的工作人员与机器学习相结合,以便创建已标记的数据集。您可以使用从 Ground Truth 输出的已标记数据集来训练您自己的模型。您也可以将输出用作 Amazon SageMaker 模型的训练数据集。

根据您的 ML 应用程序,您可以选择一种 Ground Truth 内置任务类型,以使工作人员为您的数据生成特定类型的标签。您也可以构建自定义标记工作流,以便为标记数据的工作人员提供您自己的 UI 和工具。要了解 Ground Truth 内置任务类型的更多信息,请参阅。要了解如何创建自定义标签工作流,请参阅