项目数据 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

项目数据

您可以导入到 Amazon Personalize 化的商品数据包括数字和分类元数据,例如创建时间戳、价格、类型、描述和可用性。您将商品的元数据导入到 Amazon Personalize 化物品数据集. 某些域和配方需要 Item 数据集。有关配方要求的更多信息,请参第 1 步:选择配方.

本主题提供有关以下项目数据类型的信息:

创建时间戳数据

Amazon Personalize 化使用创建时间戳数据(以 Unix 纪元时间格式,以秒为单位)来计算商品的年龄并相应调整建议。

如果缺少一个或多个商品的创建时间戳数据,亚马逊 Personalize 从互动数据(如果有)中推断此信息,并使用商品最早互动数据的时间戳作为商品的创建时间戳。如果商品没有互动数据,则其创建时间戳将设置为培训集中最新互动的时间戳,Amazon Personalize 化将其视为新项目。

分类元数据

对于某些食谱和域名,Amazon Personalize 化使用分类元数据,例如商品的类型或颜色,在识别为用户揭示最相关物品的基础模式时。您可以基于自己的使用案例来定义值的范围。分类元数据可以使用任何语言。

对于所有配方和域,您可以导入分类数据并使用它来根据项目的属性筛选推荐。有关筛选建议的信息,请参阅。筛选推荐和用户细分.

分类值最多可包含 1000 个字符。如果您的项目的分类值超过 1000 个字符,则数据集导入作业将失败。

对于域数据集组,VIDEO_ON_DEMAND 和电子商务域都使用分类元数据。对于自定义数据集组和自定义解决方案,使用分类元数据的配方包括以下内容:

非结构化文本元数据

使用某些配方和域名,Amazon Personalize 可以从非结构化文本元数据中提取有意义的信息,例如商品描述、商品评论或电影摘要。Amazon Personalize 化使用非结构化文本为您的用户识别相关项目,尤其是当商品是新品或交互数据较少的情况下。在 Item 数据集中包含非结构化文本数据,以提高目录中新项目的点击率和对话率。

要使用非结构化数据,请添加类型字段string转到你的物品架构并设置字段textual属性true. 然后将文本数据包含在批量 CSV 文件和增量项目导入中。对于批量 CSV 文件,请将文本用双引号括起来。使用\字符来转义数据中的任何双引号或\ 字符。有关具有非结构化文本数据字段的 Item 架构的示例,请参阅项目数据集模式示例(自定义). 有关将数据导入 Amazon Personalize 化的信息,请参阅准备和导入数据.

非结构化文本值最多可以包含 20,000 个字符,文本必须是英语。Amazon Personalize 化将超过字符限制的值截断为 20,000 个字符。

对于域数据集组,VIDEO_ON_DEMAND 和电子商务域都使用文本元数据。对于自定义数据集组和自定义解决方案,使用文本元数据的配方包括以下内容: