CreateDatasetImportJob - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateDatasetImportJob

创建一个将训练数据从数据源(Amazon S3 存储桶)导入到 Amazon Personalize 数据集的作业。要允许 Amazon Personalize 导入培训数据,您必须指定有权从数据源读取的 IAM 服务角色,因为 Amazon Personalize 会制作数据的副本并在内部处理数据。有关授予 Amazon S3 存储桶访问权限的信息,请参阅向 Amazon 授予 Amazon S3 资源的个性化访问权限.

重要

数据集导入作业将替换您批量导入的数据集中的任何现有数据。

状态

数据集导入作业可能处于以下状态之一:

  • 创建待处理 > 创建进度 > 活动-或-创建失败

要获取导入作业的状态,请致电DescribeDatasetImportJob,请提供数据集导入任务的 Amazon 资源名称 (ARN)。当状态显示为 ACTIVE 时,数据集导入完成。如果状态显示为 CREATE FAILED,则响应中包含failureReasonkey,它描述了作业失败的原因。

注意

导入需要耗费时间。您必须等待,直到状态显示为 ACTIVE,然后才能使用数据集训练模型。

请求语法

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "jobName": "string", "roleArn": "string" }

请求参数

请求接受采用 JSON 格式的以下数据。

datasetArn

接收导入数据的数据集的 ARN。

类型: 字符串

约束:长度上限为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

:必需 是

dataSource

包含要导入的训练数据的 Amazon S3 存储桶。

类型:DataSource 对象

:必需 是

jobName

数据集导入作业的名称。

类型: 字符串

约束:最小长度为 1。长度上限为 63。

模式:^[a-zA-Z0-9][a-zA-Z0-9\-_]*

:必需 是

roleArn

有权从 Amazon S3 数据源读取的 IAM 角色的 ARN。

类型: 字符串

约束:长度上限为 256。

模式:arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

:必需 是

响应语法

{ "datasetImportJobArn": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回的以下数据。

datasetImportJobArn

数据集导入作业的 ARN。

类型: 字符串

约束:长度上限为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

错误

InvalidInputException

为字段或参数提供有效值。

HTTP 状态代码:400

LimitExceededException

已超出每秒的请求数的限制。

HTTP 状态代码:400

ResourceAlreadyExistsException

已存在指定的资源。

HTTP 状态代码:400

ResourceInUseException

正在使用指定的资源。

HTTP 状态代码:400

ResourceNotFoundException

找不到指定的资源。

HTTP 状态代码:400

另请参阅

有关在特定语言的Amazon软件开发工具包中使用此 API 的更多信息,请参阅以下内容: