项目数据集要求(VIDEO_ON_DEMAND 域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

项目数据集要求(VIDEO_ON_DEMAND 域)

网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的物品数据集存储有关 VIDEO_ON_DEMENT 商品的元数据。这可能包括每件商品的价格、类型和可用性等信息。Item 数据集是可选的,但我们建议创建一个数据集来获取与 VIDEO_ON_DEMAND 域最相关的建议。如果创建项目数据集,则架构必须包含以下字段:

  • ITEM_ID

  • 流派(分类string

  • CREATION_TIMAL(采用 Unix 纪元时间格式)

您的模式还可以包括以下保留关键字:

  • 价格(浮点数)

  • 持续时间(浮点数)

  • GENRE_L2(分类string

  • GENRE_L3(分类string

  • AVERAGE_评级(float

  • 产品/描述 (textual

  • CONTENT_OWNER(分类string

  • CONTENT_ 分类(分类string

使用保留关键字 GENRE_L2 和 GENRE_L3 获取更具体的子类型。例如,History是视频的 GENRES 价值,Biopic可能是 L2 类型。有关 VIDEO_ON_DEMAND 域的项目数据集的默认模式示例,请参阅默认物品架构(VIDEO_ON_DEMAND 域).

为了获得最佳建议,我们建议您在架构中保留这些字段中的数量与您拥有的数据一样多。您导入的数据必须与您的架构匹配。有关文本和分类元数据的信息,请参阅项目数据集.

要使用分类数据,请添加类型字段string然后将字段的类别属性设置为true在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。对于具有多个类别的商品,请使用垂直条 “|” 分隔每个值。例如,对于 GENES 字段,物品的数据可能是动作 | 冒险 | 喜剧。如果您有多个级别的类别数据,请为每个级别添加一个字段,然后在每个字段名称后添加一个级别指示器。例如,CATEGY_L1、CATEGY_L2、CATEGY_L3。

类别值最多可以包括 1000 个字符。如果您的用户的分类值超过 1,000 个字符,则数据集导入作业将失败。

默认物品架构(VIDEO_ON_DEMAND 域)

以下是 VIDEO_ON_DEMAND 域的项目数据集的默认架构。

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES_L1", "type": [ "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" } ], "version": "1.0" }