用户数据集要求(VIDEO_ON_DEMAND 域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用户数据集要求(VIDEO_ON_DEMAND 域)

一个用户数据集存储有关用户的元数据。这可能包括年龄、性别和每个商品的会员资格等信息。用户数据集是可选的,但我们建议创建一个数据集以获取与 VIDEO_ON_DEMAND 域最相关的建议。如果创建用户数据集,则您的方案必须包含以下字段。

  • USER_ID

  • 1 个元数据字段(类别)string或数字)

有关 VIDEO_ON_DEMAND 域的用户数据集的默认模式示例,请参阅默认用户架构(VIDEO_ON_DEMAND 域).

一个SUBSCRIPTION_MODEL字段包含在默认架构中。此字段是可选的保留关键字,必须具有string分类设置为true. 为了获得最佳建议,如果您有关于数据中每个用户的订阅模型信息,我们建议您将此字段保留在架构中。您导入的数据必须与您的架构匹配。

要使用分类数据,请添加类型字段string然后将字段的类别属性设置为true在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。对于具有多个类别的用户,请使用垂直条 “|” 分隔每个值。例如,对于 SUBSCRIPTION_MODEL 字段,用户的数据可能是 ADS|4K|DVR|Live。如果您有多个级别的类别数据,请为每个级别添加一个字段,然后在每个字段名称后添加一个级别指示器。例如,CATEGY_L1、CATEGY_L2、CATEGY_L3。

类别值最多可以包括 1000 个字符。如果您的用户的分类值超过 1,000 个字符,则数据集导入作业将失败。

有关用户数据集的最低要求和最大数据限制的详细信息,请参阅Service Quotas.

默认用户架构(VIDEO_ON_DEMAND 域)

以下是用户数据集的默认 VIDEO_ON_DEMAND 域架构。

{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true } ], "version": "1.0" }