物品数据集要求(VIDEO_ON_DEMAND 域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

物品数据集要求(VIDEO_ON_DEMAND 域)

物品数据集 存储有关目录物品的元数据。这可能包括每件物品的价格、类型和库存等信息。有关您可以导入 Amazon Personalize 的物品数据类型的信息,请参阅物品数据集。有关 Amazon Personalize 架构的一般要求(例如格式设置要求和可用的字段数据类型)的信息,请参阅架构。这些要求适用于所有架构,不论域如何。

某些使用案例需要物品数据集(请参阅 VIDEO_ON_DEMAND 使用案例)。可选时,我们仍建议您创建一个物品数据集,以获取最相关的建议。如果您创建物品数据集,则架构必须包含以下字段:

  • ITEM_ID

  • GENRES(分类 string

  • CREATION_TIMESTAMP(采用 Unix 纪元时间格式)

您的架构还可以包含以下保留关键字。每个关键字都列出了其所需的数据类型以及它是否支持空数据。添加空类型是可选的。

  • PRICE(浮点)

  • DURATION(浮点)

  • GENRE_L2(分类 stringnull

  • GENRE_L3(分类 stringnull

  • AVERAGE_RATING(floatnull

  • PRODUCT_DESCRIPTION(文本 stringnull

  • CONTENT_OWNER(分类 stringnull):拥有视频的公司。例如,值可能是 HBO、Paramount 和 NBC。

  • CONTENT_CLASSIFICATION(分类 stringnull):内容的评级。例如,值可能是 G、PG、PG-13、R、NC-17 和未分级。

为了获得最佳建议,我们建议您在架构中尽可能多保留这些字段,因为您拥有数据。您导入的数据必须与您的架构相匹配。最大元数据列数为 100。您可以根据您的使用案例和数据自由添加其他字段。只要字段未列为必填字段或保留字段,并且数据类型列在架构数据类型中,则字段名称和数据类型由您决定。

对于具有多个多级类别的物品,使用保留关键字 GENRE_L2 和 GENRE_L3。有关更多信息,请参阅 使用分类数据。有关文本和分类元数据的信息,请参阅物品数据集。有关 ECOMMERCE 域物品数据集的默认架构示例,请参阅默认物品架构(VIDEO_ON_DEMAND 域)

使用分类数据

要使用分类数据,请添加类型为 string 的字段,并在架构中将该字段的类别属性设置为 true。然后,将分类数据包含在批量 CSV 文件和单个物品导入中。分类值最多可以有 1000 个字符。如果您的物品的分类值超过 1000 个字符,则您的数据集导入作业将失败。

对于具有多个类别的物品,使用竖线“|”分隔每个值。例如,对于 GENRES 字段,您的物品数据可能是 Action|Crime|Biopic。如果您有多个级别的分类数据,并且某些物品在层次结构中的每个级别都有多个类别,请为每个级别添加一个字段,并在每个字段名称后面附加一个级别指示符:GENRES、GENRE_L2、GENRE_L3。这样,您可以根据子类别筛选建议,即使一个物品属于多个多级类别,也是如此。例如,某个视频可能包含每个类别级别的以下数据:

  • GENRES:动作|冒险

  • GENRE_L2:犯罪|西方

  • GENRE_L3:传记片

在此示例中,该视频位于动作 > 犯罪 > 传记片层次结构 冒险 > 西方 > 传记片层次结构中。我们建议使用的级别最高仅到 L3,但如有必要,可以使用更多级别。有关创建和使用筛选器的信息,请参阅筛选建议和用户细分

默认物品架构(VIDEO_ON_DEMAND 域)

以下是 VIDEO_ON_DEMAND 域物品数据集的默认架构。

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" } ], "version": "1.0" }