用户数据集 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用户数据集

A用户数据集存储有关用户的元数据。这可能包括年龄、性别或会员资格等信息。用户数据集是可选的。您必须至少创建交互式数据集.

创建用户数据集时,您还必须为数据集创建架构。Aschema告诉 Amazon Personalize 您的数据结构,并允许 Amazon Personalize 解析数据。有关用户架构的示例,请参阅。用户架构示例. 有关架构要求的信息,请参阅数据集和方案要求.

本节提供有关所需用户数据以及您可以上传用于培训的用户数据种类的信息。它还包括用户架构示例. 有关将用户数据导入到用户数据集的信息,请参阅。准备和导入数据.

创建用户数据集并添加用户数据后,您可以根据特定用户条件筛选建议以包括或排除项目。有关更多信息,请参阅筛选建议.

注意

相关的项目与项目相似性 (SIMS) 等配方不使用用户数据集。

所需的用户数据

您为每个用户提供的训练数据必须与您的方案匹配。至少必须为每个用户提供一个用户 ID(最大长度 256 个字符)。根据您的架构,用户元数据可以包含空/空值。

有关用户数据集的最小要求和最大数据限制的详细信息,请参阅服务配额.

分类元数据

使用用户个性化或者个性化-排名配方,Amazon Personalize 在识别底层模式时会使用类别元数据(例如用户的性别或成员状态),从而为您的用户显示最相关的项目。

对于所有配方,您可以导入分类元数据,并使用它根据用户属性筛选建议。有关筛选建议的信息,请参阅。筛选建议.

要使用类别数据,请添加string并将字段的类别属性设置为true在架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。对于具有多个类别的用户,请使用垂直条 “|” 分隔每个值。有关具有分类字段的架构的示例,请参阅。用户架构示例.

分类值最多可包含 1000 个字符。任何具有超过 1,000 个字符的类别值的用户都会在数据集导入作业期间丢弃,不用于训练。

用户架构示例

以下示例演示如何构建用户架构。这些区域有:USER_ID字段为必填字段,并且AGEGENDER字段是元数据。至少需要一个元数据字段,您最多可以添加 5 个元数据字段。有关架构要求的信息,请参阅数据集和方案要求.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true } ], "version": "1.0" }

对于此架构,CSV 文件中的前几行历史数据可能如下所示。

USER_ID,AGE,GENDER 5,34,Male 6,56,Female 8,65,Male ... ...