本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
项目数据
您可以导入到 Amazon Personalize 化的商品数据包括数字和分类元数据,例如创建时间戳、价格、类型、描述和可用性。您将商品的元数据导入到 Amazon Personalize 化物品数据集. 某些域和配方需要 Item 数据集。有关配方要求的更多信息,请参第 1 步:选择配方.
本主题提供有关以下项目数据类型的信息:
创建时间戳数据
Amazon Personalize 化使用创建时间戳数据(以 Unix 纪元时间格式,以秒为单位)来计算商品的年龄并相应调整建议。
如果缺少一个或多个商品的创建时间戳数据,亚马逊 Personalize 从互动数据(如果有)中推断此信息,并使用商品最早互动数据的时间戳作为商品的创建时间戳。如果商品没有互动数据,则其创建时间戳将设置为培训集中最新互动的时间戳,Amazon Personalize 化将其视为新项目。
分类元数据
对于某些食谱和域名,Amazon Personalize 化使用分类元数据,例如商品的类型或颜色,在识别为用户揭示最相关物品的基础模式时。您可以基于自己的使用案例来定义值的范围。分类元数据可以使用任何语言。
对于所有配方和域,您可以导入分类数据并使用它来根据项目的属性筛选推荐。有关筛选建议的信息,请参阅。筛选推荐和用户细分.
分类值最多可包含 1000 个字符。如果您的项目的分类值超过 1000 个字符,则数据集导入作业将失败。
对于域数据集组,VIDEO_ON_DEMAND 和电子商务域都使用分类元数据。对于自定义数据集组和自定义解决方案,使用分类元数据的配方包括以下内容:
非结构化文本元数据
使用某些配方和域名,Amazon Personalize 可以从非结构化文本元数据中提取有意义的信息,例如商品描述、商品评论或电影摘要。Amazon Personalize 化使用非结构化文本为您的用户识别相关项目,尤其是当商品是新品或交互数据较少的情况下。在 Item 数据集中包含非结构化文本数据,以提高目录中新项目的点击率和对话率。
要使用非结构化数据,请添加类型字段string
转到你的物品架构并设置字段textual
属性true
. 然后将文本数据包含在批量 CSV 文件和增量项目导入中。对于批量 CSV 文件,请将文本用双引号括起来。使用\
字符来转义数据中的任何双引号或\ 字符。有关具有非结构化文本数据字段的 Item 架构的示例,请参阅项目数据集模式示例(自定义). 有关将数据导入 Amazon Personalize 化的信息,请参阅准备和导入数据.
非结构化文本值最多可以包含 20,000 个字符,文本必须是英语。Amazon Personalize 化将超过字符限制的值截断为 20,000 个字符。
对于域数据集组,VIDEO_ON_DEMAND 和电子商务域都使用文本元数据。对于自定义数据集组和自定义解决方案,使用文本元数据的配方包括以下内容: