物品数据集要求(自定义) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

物品数据集要求(自定义)

网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的物品数据集在目录中存储有关商品的元数据。这可能包括每件商品的价格、类型和可用性等信息。有关您可以导入到 Amazon Personalize 的商品数据类型的信息,请参阅项目数据.

您为每个项目提供的数据必须与 Item 数据集架构匹配。至少,您必须为每件商品提供商品编号(最大长度 256 个字符)。根据您的架构,项目元数据可以包含空/空值。你的架构必须至少有一个元数据字段,但是如果你添加null类型,该项目的此值可以为空。您可以根据使用案例和数据自由添加额外的字段。只要这些字段没有列为必填字段或保留字段,并且数据类型在架构数据类型,字段名称和数据类型取决于您。

要使用分类数据,请添加类型字段string然后将字段的类别属性设置为true在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。分类值最多可以有 1000 个字符。如果您的项目的分类值超过 1000 个字符,则数据集导入作业将失败。

对于具有多个分类的商品,请使用垂直条 “|” 分隔每个值。例如,对于 GENRES 字段,您的物品数据可能是Action|Crime|Biopic. 如果您有多个级别的类别数据,并且某些项目在层次结构中的每个级别都有多个类别,请为每个级别添加一个字段,然后在每个字段名称后添加一个级别指示器:流派、GENRE_L2、GENRE_L3。这允许您根据子类别筛选推荐,即使一个商品属于多个多级类别(有关创建和使用筛选器的信息,请参阅筛选推荐和用户细分)。例如,视频可能包含每个类别级别的以下数据:

  • 流派:行动 | 冒险

  • GENRE_L2:犯罪 | 西方

  • GENRE_L3:传记片

在此示例中,视频处于操作 > 犯罪 > 传记图片层次结构冒险 > 西方 > 传记图片层次结构。我们建议仅使用最多 L3 级,但如有必要,您可以使用更多级别。

在模特培训期间,Amazon Personalize 化最多可考虑 75 万件商品。如果您导入的商品超过 750,000 件,Amazon Personalize 化将决定将哪些物品包括在培训中,重点放在包括新项目(您最近添加的没有互动的商品)和包含最近互动数据的现有商品。

有关 Item 数据集的最低要求和最大数据限制的详细信息,请参阅Service Quotas.

项目数据集模式示例(自定义)

以下示例演示了如何构建 Item 架构。ITEM_ID 字段为必填项。这些区域有:GENRE字段是分类元数据,DESCRIPTION字段是文本元数据。至少需要一个元数据字段。您最多可添加 50 个元数据字段。这些区域有:CREATION_TIMESTAMP字段是保留的关键字。有关架构要求的信息,请参阅自定义数据集和架构要求.

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }, ], "version": "1.0" }

对于此架构,CSV 文件中的前几行历史数据可能如下所示。

ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...