选择要标注的数据

您可以使用 Amazon SageMaker AI 控制台选择数据集的一部分进行标注。数据必须存储在 Amazon S3 存储桶中。您有三种选择：

选择 “创建标注任务” 后，SageMaker AI 控制台的 “标注任务” 部分中提供了以下选项。要了解如何在控制台中创建标注作业，请参阅入门：使用 Ground Truth 创建边界框标注作业。要配置用于标注的数据集，请在作业概览部分中选择其他配置。

使用完整数据集

当您选择使用完整数据集时，必须为数据对象提供一个清单文件。您可以提供包含清单文件的 Amazon S3 存储桶的路径，也可以使用 SageMaker AI 控制台创建该文件。要了解如何使用控制台创建清单文件，请参阅自动设置标注作业的数据。

如果要标注数据的随机子集，请选择随机样本。数据集存储在输入数据集位置字段中指定的 Amazon S3 存储桶中。

指定要包含在样本中的数据对象的百分比后，选择创建子集。 SageMaker AI 会为您的标注任务随机挑选数据对象。选定对象后，请选择使用此子集。

SageMaker AI 为选定的数据对象创建清单文件。它还会修改输入数据集位置字段中的值以指向新的清单文件。

不再向新客户提供 Amazon S3 Select。Amazon S3 Select 的现有客户可以像往常一样继续使用该功能。要了解更多信息，请参阅《如何优化 Amazon S3 中的数据查询》。

您可以对对象文件名使用 Amazon S3 SELECT 查询以指定数据对象的一个子集。

为您定义了 SQL 查询的 SELECT 语句。您提供 WHERE 子句来指定应返回哪些数据对象。

有关 Amazon S3 SELECT 语句的更多信息，请参阅从对象中选择内容。

选择创建子集开始选择，然后选择使用此子集来使用选择的数据。

SageMaker AI 为选定的数据对象创建清单文件。它还会更新输入数据集位置字段中的值以指向新的清单文件。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

输入数据限额

3D 点云输入数据