用户数据集要求(ECOMMERCE 域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用户数据集要求(ECOMMERCE 域)

用户数据集 存储有关用户的元数据。这可能包括每个用户的年龄、性别或会员资格等信息。有关您可以导入 Amazon Personalize 的用户数据类型的更多信息,请参阅用户元数据。有关 Amazon Personalize 架构的一般要求(例如格式设置要求和可用的字段数据类型)的信息,请参阅为 Amazon Personalize 架构创建架构 JSON 文件。这些要求适用于所有架构,不论域如何。

对于所有 ECOMMERCE 使用案例,用户数据集都是可选的。如果您有用户数据,我们建议您创建一个用户数据集,以获得最相关的建议。如果您创建用户数据集,则架构必须包含以下字段。

  • USER_ID

  • 1 个元数据字段(分类 string 或数字)

您导入的数据必须与您的架构相匹配。您可以根据您的使用案例和数据自由添加其他字段。只要字段未列为必填字段或保留字段,并且数据类型列在架构数据类型中,则字段名称和数据类型由您决定。有关 ECOMMERCE 域用户数据集的默认架构示例,请参阅默认用户架构(ECOMMERCE 域)

有关用户数据集的最低要求和最大数据限制的更多信息,请参阅服务配额

使用分类数据

要使用分类数据,请添加类型为 string 的字段,并在架构中将该字段的类别属性设置为 true。然后,将分类数据包含在批量 CSV 文件和单个记录导入中。对于具有多个类别的用户,使用竖线“|”分隔每个值。例如,对于 SUBSCRIPTION_MODEL 字段,您的用户数据可能是 student|monthly|discount。

分类值最多可以有 1000 个字符。如果您的用户的分类值超过 1000 个字符,则您的数据集导入作业将失败。

默认用户架构(ECOMMERCE 域)

以下是将 CATEGORY 字段作为必填元数据字段的用户数据集的默认 ECOMMERCE 域架构。

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "MEMBERSHIP_STATUS", "type": "string", "categorical": true } ], "version": "1.0" }