用户数据集要求(自定义) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用户数据集要求(自定义)

一个用户数据集存储有关用户的元数据。这可能包括每个项目的年龄、性别和会员资格等信息。有关可导入到 Amazon Personalize 化中的用户数据类型的信息,请参阅用户数据.

您为每个用户提供的数据必须与您的架构匹配。至少,您必须为每个用户提供一个用户 ID(最长 256 个字符)。根据您的架构,用户元数据可以包含空/空值。你的用户架构必须至少有一个元数据字段,但是如果你添加null类型,该值对于用户来说可以为空。您可以根据使用案例和数据自由添加额外的字段。只要这些字段没有列为必填字段或保留字段,并且数据类型在架构数据类型,字段名称和数据类型取决于您。

要使用分类数据,请添加类型字段string然后将字段的类别属性设置为true在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。对于具有多个类别的用户,请使用垂直条 “|” 分隔每个值。例如,对于 SUBSCRIPTION_MODEL 字段,用户的数据可能是学生 | 每月 | 折扣。

分类值最多可以有 1000 个字符。如果您的用户的分类值超过 1000 个字符,则数据集导入作业将失败。

有关用户数据集的最低要求和最大数据限制的详细信息,请参阅Service Quotas.

用户架构示例(自定义)

以下示例演示了如何构建 Users 架构。这些区域有:USER_ID字段为必填项,AGEGENDER字段是元数据。至少需要一个元数据字段,您最多可以添加 5 个元数据字段。有关架构要求的信息,请参阅自定义数据集和架构要求.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true } ], "version": "1.0" }

对于此架构,CSV 文件中的前几行历史数据可能如下所示。

USER_ID,AGE,GENDER 5,34,Male 6,56,Female 8,65,Male ... ...