项目数据集要求(VIDEO_ON_DEMAND 域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

项目数据集要求(VIDEO_ON_DEMAND 域)

网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的物品数据集在目录中存储有关商品的元数据。这可能包括每件商品的价格、类型和可用性等信息。有关您可以导入 Amazon Personalize 化中的商品数据类型的信息,请参阅项目数据. 有关 Amazon Personalize 化架构的一般要求(例如格式要求和可用字段数据类型)的信息,请参阅数据集和架构. 这些要求适用于所有架构,无论域如何。

某些使用案例需要项目数据集(请参阅)VIDEO_ON_DEMENT 使用案例)。如果可选,我们仍建议创建一个以获得最相关的建议。如果创建 Item 数据集,则您的方案必须包含以下字段:

  • ITEM_ID

  • 流派(分类string

  • CREATION_STIMEMA(采用 Unix 纪元时间格式)

您的架构还可以包括以下保留关键字:

  • 价格(浮点数)

  • 持续时间(浮点数)

  • GENRE_L2(分类string

  • GENRE_L3(分类string

  • AVERAGE_评级(float

  • 商品描述 (textual

  • CONTENT_OWNER(分类string): 拥有该视频的公司。例如,值可能是 HBO、派拉蒙和 NBC。

  • CONTENT_ 分类(分类string): 内容的评级。例如,值可能是 G、PG、PG-13、R、NC-17 和未评级。

为了获得最佳建议,我们建议您在架构中保留这些字段中的数量与您拥有的数据一样多。您导入的数据必须匹配您的架构。您可以根据使用案例和数据自由添加额外的字段。只要这些字段没有列为必填字段或保留字段,并且数据类型在架构数据类型,字段名称和数据类型取决于您。

对于具有多个多级分类的商品,请使用预留关键字 GENRE_L2 和 GENRE_L3。有关更多信息,请参阅 使用分类数据。有关文本和分类元数据的信息,请参阅项目数据. 有关电子商务域 Item 数据集的默认模式示例,请参阅默认物品架构(VIDEO_ON_DEMAND 域).

使用分类数据

要使用分类数据,请添加类型字段string然后将字段的类别属性设置为true在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。分类值最多可以有 1000 个字符。如果您的项目的分类值超过 1000 个字符,则数据集导入作业将失败。

对于具有多个分类的商品,请使用垂直条 “|” 分隔每个值。例如,对于 GENRES 字段,您的物品数据可能是Action|Crime|Biopic. 如果您有多个级别的类别数据,并且某些项目在层次结构中的每个级别都有多个类别,请为每个级别添加一个字段,然后在每个字段名称后添加一个级别指示器:流派、GENRE_L2、GENRE_L3。这允许您根据子类别筛选推荐,即使商品属于多个多级类别(有关创建和使用筛选器的信息,请参阅筛选推荐和用户细分)。例如,视频可能包含每个类别级别的以下数据:

  • 流派:行动 | 冒险

  • GENRE_L2:犯罪 | 西方

  • GENRE_L3:传记片

在此示例中,视频处于操作 > 犯罪 > 传记图片层次结构冒险 > 西方 > 传记图片层次结构。我们建议仅使用最多 L3 级,但如有必要,您可以使用更多级别。

默认物品架构(VIDEO_ON_DEMAND 域)

以下是 VIDEO_ON_DEMAND 域的项目数据集的默认架构。

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES_L1", "type": [ "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" } ], "version": "1.0" }