本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
物品交互数据集要求(ECOMMERCE 域)
物品交互数据集存储来自用户和 ECOMMERCE 目录中物品之间交互的历史数据和实时数据。有关您可以存储在交互数据集中的数据类型的更多信息,请参阅物品交互数据。有关 Amazon Personalize 架构的一般要求(例如格式设置要求和可用的字段数据类型)的信息,请参阅为 Amazon Personalize 架构创建架构 JSON 文件。这些要求适用于所有架构,不论域如何。
您必须至少创建一个物品交互数据集,且您的架构必须包含以下字段:
-
USER_ID (
string
) -
ITEM_ID (
string
) -
TIMESTAMP (
long
) -
EVENT_TYPE(
string
,取决于使用案例,Purchase
和View
事件类型)
您的架构还可以包含以下保留关键字:
EVENT_VALUE(
float
、null
)-
IMPRESSION(
string
、null
) -
RECOMMENDATION_ID(
string
、null
)
您导入的数据必须与您的架构相匹配。您可以根据您的使用案例和数据自由添加其他字段。只要字段未列为必填字段或保留字段,并且数据类型列在架构数据类型中,则字段名称和数据类型由您决定。有关 ECOMMERCE 域的物品交互数据集的默认架构示例,请参阅默认交互架构(ECOMMERCE 域)。
如果您的事件具有值数据,则可以选择添加保留关键字 EVENT_VALUE。如果您想包含显式和隐式展示数据,则可以选择添加保留关键字 IMPRESSION。有关记录展示数据的更多信息,请参阅展示数据。
您可以添加到物品交互数据集的最大可选元数据字段总数,再加上物品交互数据中不同事件类型的总数,结果为 10。此计数中包含的元数据字段是 EVENT_TYPE、EVENT_VALUE 字段以及您添加到架构中的任何自定义元数据字段。不包括保留字段(例如 IMPRESSION)的元数据字段的最大数量为 5。分类值最多可以有 1000 个字符。如果交互的分类值大于 1000,则您的数据集导入作业将失败。
有关 ECOMMERCE 域的物品交互数据集的最低要求和最大数据限制的更多信息,请参阅服务配额。
默认交互架构(ECOMMERCE 域)
以下是物品交互数据集的默认 ECOMMERCE 域架构。
{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }