CreateDatasetExportJob - Amazon Personalize
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateDatasetExportJob

创建将数据从数据集导出到 Amazon S3 存储桶的作业。要允许 Amazon Personalize 导出培训数据,您必须指定一个与服务相关的 IAM 角色,该角色为亚马逊提供个性化PutObject对您的 Amazon S3 存储桶的权限。想要了解有关信息,请参阅导出数据集Amazon Personalize 开发者指南中。

状态

数据集导出作业可以处于以下状态之一:

  • “创建挂起” > “正在创建” > “活动” 或 “创建失败”

要获取导出任务的状态,请调用DescribeDatasetExportJob,并指定数据集导出作业的 Amazon 资源名称 (ARN)。当状态显示为 ACTIVE 时,数据集导出完成。如果状态显示为 CREATE FOREATE FOREATE FOREATEfailureReason键,其中描述了作业失败的原因。

请求语法

{ "datasetArn": "string", "ingestionMode": "string", "jobName": "string", "jobOutput": { "s3DataDestination": { "kmsKeyArn": "string", "path": "string" } }, "roleArn": "string" }

请求参数

请求接受采用 JSON 格式的以下数据。

datasetArn

包含要导出数据的数据集的 Amazon 资源名称 (ARN)。

类型: 字符串

长度约束:长度上限为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

:必需 是

摄入模式

要导出的数据,取决于导入数据的方式。您可以选择仅导出BULK使用数据集导入作业导入的数据,仅PUT以增量方式导入的数据(使用控制台、PutEvents、PutUtUser 和 Putitems 操作),或ALL对于这两种类型。默认值为 PUT

类型: 字符串

有效值: BULK | PUT | ALL

:必需 否

jobName

数据集导出作业的名称。

类型: 字符串

长度约束:最小长度为 1。长度上限为 63。

模式:^[a-zA-Z0-9][a-zA-Z0-9\-_]*

:必需 是

作业输出

存储作业输出的 Amazon S3 存储桶的路径。

类型:DatasetExportJobOutput 对象

:必需 是

roleArn

有权向您的输出 Amazon S3 存储桶添加数据的 IAM 服务角色的 Amazon 资源名称 (ARN)。

类型: 字符串

长度约束:长度上限为 256。

模式:arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

:必需 是

响应语法

{ "datasetExportJobArn": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回的以下数据。

数据文件工具

数据集导出作业的 Amazon 资源名称 (ARN)。

类型: 字符串

长度约束:长度上限为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

Errors

InvalidInputException

为字段或参数提供有效值。

HTTP 状态代码:HTTP:HTTP:400

LimitExceededException

每秒的请求数限制已超出。

HTTP 状态代码:HTTP:HTTP:400

ResourceAlreadyExistsException

已存在指定的资源。

HTTP 状态代码:HTTP:HTTP:400

ResourceInUseException

Specify resource is use (指定的资源正在使用

HTTP 状态代码:HTTP:HTTP:400

ResourceNotFoundException

找不到指定的资源。

HTTP 状态代码:HTTP:HTTP:400