用户数据集要求(VIDEO_ON_DEMAND 域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用户数据集要求(VIDEO_ON_DEMAND 域)

一个用户数据集存储有关用户的元数据。这可能包括年龄、性别和每件物品的会员资格等信息。有关您可以导入到 Amazon Personalize 中的用户数据类型的信息,请参阅用户数据. 有关一般 Amazon Personalize 架构要求(如格式要求和可用字段数据类型)的信息,请参阅数据集和架构. 这些要求适用于所有架构,无论域如何。

对于所有 VIDEO_ON_DEMAND 用例,用户数据集都是可选的。如果您有用户数据,我们建议您创建一个,以获得最相关的推荐。如果创建 Users 数据集,则架构必须包含以下字段。

  • USER_ID

  • 1 个元数据字段(分类字段)string或 numeric)

您可以根据使用案例和数据自由添加额外的字段。只要字段未列为必填字段或保留字段,并且数据类型在架构数据类型,字段名称和数据类型由您决定。有关 VIDEO_ON_DEMAND 域的用户数据集默认架构的示例,请参阅默认用户架构(VIDEO_ON_DEMAND 域).

一个SUBSCRIPTION_MODEL字段包含在默认架构中。此字段是可选的保留关键字,其类型必须为string分类设置为true. 为了获得最佳建议,如果您的数据中有关于每个用户的订阅模型信息,我们建议您在架构中保留此字段。您导入的数据必须与架构匹配。

使用分类数据

要使用分类数据,请添加类型为的字段string并将字段的分类属性设置为trueIN SCHERA。然后将分类数据包含在批量 CSV 文件和单个项目导入中。对于具有多个类别的用户,请使用竖线 “|” 分隔每个值。例如,对于 SUBSCRIPTION_MODEL 字段,用户的数据可能是学生|每月|折扣。

类别值最多可包含 1000 个字符。如果您的用户的类别值超过 1000 个字符,则数据集导入作业将失败。

默认用户架构(VIDEO_ON_DEMAND 域)

以下是用户数据集的默认 VIDEO_ON_DEMAND 域架构。

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true } ], "version": "1.0" }