本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
用户数据集要求(VIDEO_ON_DEMAND 域)
用户数据集 存储有关用户的元数据。这可能包括每个用户的年龄、兴趣、性别或会员资格等信息。有关您可以导入 Amazon Personalize 的用户数据类型的信息,请参阅用户元数据。有关通用 Amazon Personalize 架构要求的信息,请参阅为 Amazon Personalize 架构创建架构 JSON 文件。这些要求适用于所有架构,不论域如何。
对于所有 VIDEO_ON_DEMAND 使用案例,用户数据集都是可选的。如果您有用户数据,我们建议您创建一个用户数据集,以获得最相关的建议。如果您创建用户数据集,则架构必须包含以下字段。
-
USER_ID
-
1 个元数据字段(分类
string
或数字)
您可以根据您的使用案例和数据自由添加其他字段。只要字段未列为必填字段或保留字段,并且数据类型列在架构数据类型中,则字段名称和数据类型由您决定。有关 VIDEO_ON_DEMAND 域用户数据集的默认架构示例,请参阅默认用户架构(VIDEO_ON_DEMAND 域)。
默认架构中包含 SUBSCRIPTION_MODEL
字段。此字段是一个可选保留关键字字段,其类型必须为 string
,类别设置为 true
。为了获得最佳建议,我们建议在您的数据中存在关于每个用户的订阅模式信息时,在架构中保留此字段。您导入的数据必须与您的架构相匹配。
使用分类数据
要使用分类数据,请添加类型为 string
的字段,并在架构中将该字段的类别属性设置为 true
。然后,将分类数据包含在批量 CSV 文件和单个记录导入中。对于具有多个类别的用户,使用竖线“|”分隔每个值。例如,对于 SUBSCRIPTION_MODEL 字段,您的用户数据可能是 student|monthly|discount。
分类值最多可以有 1000 个字符。如果您的用户的分类值超过 1000 个字符,则您的数据集导入作业将失败。
默认用户架构(VIDEO_ON_DEMAND 域)
以下是用户数据集的默认 VIDEO_ON_DEMAND 域架构。
{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true } ], "version": "1.0" }