本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
物品数据集要求(自定义)
网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的物品数据集在目录中存储有关商品的元数据。这可能包括每件商品的价格、类型和可用性等信息。有关您可以导入到 Amazon Personalize 的商品数据类型的信息,请参阅项目数据.
您为每个项目提供的数据必须与 Item 数据集架构匹配。至少,您必须为每件商品提供商品编号(最大长度 256 个字符)。根据您的架构,项目元数据可以包含空/空值。你的架构必须至少有一个元数据字段,但是如果你添加null
类型,该项目的此值可以为空。您可以根据使用案例和数据自由添加额外的字段。只要这些字段没有列为必填字段或保留字段,并且数据类型在架构数据类型,字段名称和数据类型取决于您。
要使用分类数据,请添加类型字段string
然后将字段的类别属性设置为true
在您的架构中。然后在批量 CSV 文件和增量项目导入中包含分类数据。分类值最多可以有 1000 个字符。如果您的项目的分类值超过 1000 个字符,则数据集导入作业将失败。
对于具有多个分类的商品,请使用垂直条 “|” 分隔每个值。例如,对于 GENRES 字段,您的物品数据可能是Action|Crime|Biopic
. 如果您有多个级别的类别数据,并且某些项目在层次结构中的每个级别都有多个类别,请为每个级别添加一个字段,然后在每个字段名称后添加一个级别指示器:流派、GENRE_L2、GENRE_L3。这允许您根据子类别筛选推荐,即使一个商品属于多个多级类别(有关创建和使用筛选器的信息,请参阅筛选推荐和用户细分)。例如,视频可能包含每个类别级别的以下数据:
-
流派:行动 | 冒险
-
GENRE_L2:犯罪 | 西方
-
GENRE_L3:传记片
在此示例中,视频处于操作 > 犯罪 > 传记图片层次结构和冒险 > 西方 > 传记图片层次结构。我们建议仅使用最多 L3 级,但如有必要,您可以使用更多级别。
在模特培训期间,Amazon Personalize 化最多可考虑 75 万件商品。如果您导入的商品超过 750,000 件,Amazon Personalize 化将决定将哪些物品包括在培训中,重点放在包括新项目(您最近添加的没有互动的商品)和包含最近互动数据的现有商品。
有关 Item 数据集的最低要求和最大数据限制的详细信息,请参阅Service Quotas.
项目数据集模式示例(自定义)
以下示例演示了如何构建 Item 架构。ITEM_ID
字段为必填项。这些区域有:GENRE
字段是分类元数据,DESCRIPTION
字段是文本元数据。至少需要一个元数据字段。您最多可添加 50 个元数据字段。这些区域有:CREATION_TIMESTAMP
字段是保留的关键字。有关架构要求的信息,请参阅自定义数据集和架构要求.
{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }, ], "version": "1.0" }
对于此架构,CSV 文件中的前几行历史数据可能如下所示。
ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...