物品数据集要求(电子商务域) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

物品数据集要求(电子商务域)

网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的物品数据集存储有关电子商务项目的元数据 这可能包括每个项目的价格、类别和产品描述等信息。有关可导入 Amazon Personalize 化的商品数据类型的更多信息,请参阅项目数据. 有关 Amazon Personalize 化架构的一般要求(例如格式要求和可用字段数据类型)的信息,请参阅数据集和架构. 这些要求适用于所有架构,无论域如何。

物品数据集对于所有电子商务用例都是可选的。如果您有物品数据,我们建议创建一个以获得最相关的推荐。如果创建项目数据集,则架构必须包含以下字段:

  • ITEM_ID

  • 价格(float

  • CATEGY_L1(分类string

您的架构还可以包括以下保留关键字。对于分类字段,您可以根据用例定义自己的值范围。

  • CATEGY_L2(分类string

  • CATEGY_L3(分类string

  • 商品描述 (textual

  • CREATION_时间戳 (float

  • AGE_GROUP(分类string): 商品适用的年龄组。价值可能是新生儿、婴儿、儿童和成人。

  • 成人(分类string): 商品是否仅限成人使用,例如酒精类。值可能是或否。

  • 性别(分类string): 商品适用的性别。价值观可能是男性、女性和男女皆宜的。

为了获得最佳建议,我们建议您在架构中保留这些字段中的数量与您拥有的数据一样多。您导入的数据必须匹配您的架构。您导入的数据必须匹配您的架构。您可以根据使用案例和数据自由添加额外的字段。只要字段未列为必填字段或保留字段,并且数据类型在架构数据类型,字段名称和数据类型取决于您。

对于具有多个多级分类的商品,请使用预留关键字 CATEGY_L2 和 CATEGY_L3。有关更多信息,请参阅 使用分类数据。有关文本和分类元数据的信息,请参阅非结构化文本元数据. 有关电子商务域 Item 数据集的默认模式示例,请参阅默认物品架构(电子商务域).

使用分类数据

要使用分类数据,请添加类型字段string然后将字段的类别属性设置为true在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。您可以基于自己的使用案例定义自己的值范围。分类值最多可以有 1000 个字符。如果您的项目的分类值超过 1000 个字符,则数据集导入作业将失败。

对于具有多个分类的商品,请使用垂直条 “|” 分隔每个值。例如,对于 CATEGY_L1 字段,您的项目数据可能是Electronics|Productivity|Mouse. 如果您有多个级别的类别数据,并且某些项目在层次结构中的每个级别都有多个类别,请为每个级别添加一个字段,然后在每个字段名称后添加一个级别指示器:类别/_L1、类别/_L2、类别/_L3。这允许您根据子类别筛选推荐,即使一个商品属于多个多级类别(有关创建和使用筛选器的信息,请参阅筛选推荐和用户细分)。例如,商品可能包含每个类别级别的以下数据:

  • CATEGORY_L1:电子产品 | 生产力

  • CATEGORY_L2:生产力 | 计算机

  • CATEGORY_L3:Mouse

在此示例中,商品位于电子产品 > 生产力 > 鼠标层次结构中生产力 > 计算机 > 鼠标层次结构。我们建议仅使用最多 L3 级,但如有必要,您可以使用更多级别。

默认物品架构(电子商务域)

以下是仅包含必填字段的电子商务域的 Item 数据集的默认模式。

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "PRICE", "type": "float" }, { "name": "CATEGORY_L1", "type": [ "string" ], "categorical": true } ], "version": "1.0" }