CreateDataDeletionJob - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CreateDataDeletionJob

创建批处理作业,批量删除 Amazon Personalize 数据集组中对特定用户的所有引用。您可以在 Amazon S3 存储桶中的用户 ID 的 CSV 文件中指定要删除的用户。任务完成后,Amazon Personalize 不再根据用户的数据进行训练,也不会在生成用户细分时考虑用户。有关创建数据删除任务的更多信息,请参阅删除用户

  • 您的输入文件必须是一个 CSV 文件,其中包含一个列出用户 ID 的 USER_ID 列。有关准备 CSV 文件的更多信息,请参阅准备数据删除文件并将其上传到 Amazon S3

  • 要授予 Amazon Personalize 访问您输入的 CSV 用户标识文件的权限,您必须指定一个有权从数据源中读取数据的 IAM 服务角色。此角色需要GetObject存储桶及其内容的ListBucket权限。这些权限与导入数据相同。有关授予对 Amazon S3 存储桶的访问权限的信息,请参阅向 Amazon Personalize 授予访问 Amazon S3 资源的权限

创建作业后,最多可能需要一天时间才能从数据集和模型中删除对用户的所有引用。在任务完成之前,Amazon Personalize 会在训练时继续使用这些数据。而且,如果您使用用户细分配方,则用户可能会出现在用户细分中。

状态

数据删除任务可以具有以下状态之一:

  • 待处理 > 进行中 > 已完成-或-失败

要获取数据删除任务的状态,请调用 DescribeDataDeletionJobAPI 操作并指定该任务的 Amazon 资源名称 (ARN)。如果状态为 FAILED,则响应将包含一个failureReason密钥,用于描述任务失败的原因。

请求语法

{ "datasetGroupArn": "string", "dataSource": { "dataLocation": "string" }, "jobName": "string", "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

请求参数

请求接受采用 JSON 格式的以下数据。

datasetGroupArn

包含您要从中删除记录的数据集的数据集组的 Amazon 资源名称 (ARN)。

类型:字符串

长度约束:最大长度为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

必需:是

dataSource

包含要删除的用户的用户 ID 列表的 Amazon S3 存储桶。

类型:DataSource 对象

必需:是

jobName

数据删除任务的名称。

类型:字符串

长度限制:最小长度为 1。最大长度为 63。

模式:^[a-zA-Z0-9][a-zA-Z0-9\-_]*

必需:是

roleArn

有权读取 Amazon S3 数据源的 IAM 角色的亚马逊资源名称 (ARN)。

类型:字符串

长度约束:最大长度为 256。

模式:arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

必需:是

tags

要应用于数据删除任务的标签列表。

类型:Tag 对象数组

数组成员:最少 0 个物品。最多 200 项。

必需:否

响应语法

{ "dataDeletionJobArn": "string" }

响应元素

如果此操作成功,则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回以下数据。

dataDeletionJobArn

数据删除任务的亚马逊资源名称 (ARN)。

类型:字符串

长度约束:最大长度为 256。

模式:arn:([a-z\d-]+):personalize:.*:.*:.+

错误

InvalidInputException

为字段或参数提供有效值。

HTTP 状态代码:400

LimitExceededException

超出每秒请求次数的限制。

HTTP 状态代码:400

ResourceAlreadyExistsException

指定资源已经存在。

HTTP 状态代码:400

ResourceInUseException

指定的资源正在使用中。

HTTP 状态代码:400

ResourceNotFoundException

找不到指定的资源。

HTTP 状态代码:400

TooManyTagsException

您已超出您可以应用到此资源的最大标签数量。

HTTP 状态代码:400

另请参阅

有关在特定语言的 Amazon SDK 中使用此 API 的更多信息,请参阅以下内容: