用户数据集 - Amazon Personalize
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用户数据集

A用户数据集存储有关用户的元数据。这可能包括年龄、性别或会员资格等信息。

在创建用户数据集时,还必须创建架构的数据集。Aschema告诉 Amazon Personalize 您的数据结构,并允许 Amazon Personalize 解析数据。有关用户架构的示例,请参阅用户架构示例。有关架构要求的信息,请参阅数据集和方案要求

本节提供有关所需用户数据以及您可以上传用于培训的用户数据种类的信息。它还包括用户架构示例。有关将用户数据导入到用户数据集的信息,请参阅准备和导入数据

创建用户数据集并添加用户数据后,您可以根据特定用户条件筛选建议以包括或排除项目。有关更多信息,请参阅 筛选建议

注意

相关的项目配方(如项目与项目相似性 (SIMS))不使用用户数据集。

所需的用户数据

您为每个用户提供的训练数据必须与您的方案匹配。必须至少提供每个用户的用户 ID。根据您的架构,用户元数据可以包含空/空值。类别值最多可包含 1000 个字符。任何类别值大于 1000 的用户都会在数据集导入作业期间丢弃,不在训练中使用。

有关用户数据集的最小要求和最大数据限制的详细信息,请参阅服务配额

用户架构示例

以下示例显示了一个 Avro 格式的用户架构。这些区域有:USER_ID字段为必填项,并且AGEGENDER字段是元数据。至少需要一个元数据字段,您最多可以添加 5 个元数据字段。有关架构要求的信息,请参阅数据集和方案要求

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true } ], "version": "1.0" }