CreateDatasetImportJob - Amazon Personalize
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateDatasetImportJob

创建将培训数据从您的数据源(Amazon S3 存储桶)导入到 Amazon Personalize 数据集的作业。要允许 Amazon Personalize 导入培训数据,您必须指定一个有权从数据源读取的 IAM 服务角色,因为 Amazon Personalize 会制作您的数据副本并在内部进行处理。有关授予 Amazon S3 存储桶访问权限的信息,请参阅向 Amazon S3 资源提供 Amazon Personalize 访问权限

重要

数据集导入作业将替换您批量导入的数据集中的所有现有数据。

状态

数据集导入作业可以处于以下状态之一:

  • “创建挂起” > “正在创建” > “活动” 或 “创建失败”

要获取导入作业的状态,请调用DescribeDatasetImportJob,提供数据集导入作业的 Amazon 资源名称 (ARN)。当状态显示为 ACTIVE 时,数据集导入完成。如果状态显示为 CREATE FOREATE FOREATE FOREATEfailureReason键,其中描述了作业失败的原因。

注意

导入需要耗费时间。您必须等待,直到状态显示为 ACTIVE,然后才能使用数据集训练模型。

请求语法

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "jobName": "string", "roleArn": "string" }

请求参数

请求接受采用 JSON 格式的以下数据。

datasetArn

接收导入数据的数据集的 ARN。

类型: 字符串

长度约束:长度上限为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

:必需 是

数据源

包含要导入的培训数据的 Amazon S3 存储桶。

类型:DataSource 对象

:必需 是

jobName

数据集导入作业的名称。

类型: 字符串

长度约束:最小长度为 1。长度上限为 63。

模式:^[a-zA-Z0-9][a-zA-Z0-9\-_]*

:必需 是

roleArn

有权从 Amazon S3 数据源读取的 IAM 角色的 ARN。

类型: 字符串

长度约束:长度上限为 256。

模式:arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

:必需 是

响应语法

{ "datasetImportJobArn": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回的以下数据。

DatasaseImportJobArn

数据集导入作业的 ARN。

类型: 字符串

长度约束:长度上限为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

Errors

InvalidInputException

为字段或参数提供有效值。

HTTP 状态代码:HTTP:HTTP:400

LimitExceededException

每秒的请求数限制已超出。

HTTP 状态代码:HTTP:HTTP:400

ResourceAlreadyExistsException

已存在指定的资源。

HTTP 状态代码:HTTP:HTTP:400

ResourceInUseException

Specify resource is use (指定的资源正在使用

HTTP 状态代码:HTTP:HTTP:400

ResourceNotFoundException

找不到指定的资源。

HTTP 状态代码:HTTP:HTTP:400