Similar-Items 食谱 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Similar-Items 食谱

注意

所有 RELATED_ITEMS 食谱都使用交互数据。如果您还有物品元数据并希望 Amazon Personalize 使用它来查找类似物品,可选择 Similar-Items。或者,在您想为模型配置更多超参数时,选择 SIMS 配方

Simalar-Item aws-similar-items s () 配方会为与您指定的物品相似的项目生成推荐。使用 Similar-Items,可帮助客户根据他们之前的行为和物品元数据发现您目录中的新物品。推荐类似物品可以提高您应用程序的用户参与度、点击率和转化率。

Similar-Items 根据交互数据和您提供的任何物品元数据计算相似度。它会考虑交互数据集用户历史记录中物品的共存情况,以及任何物品元数据的相似度。例如,对于 Similar-Items,Amazon Personalize 可以推荐客户经常购买的具有相似风格的物品(分类元数据),或者不同用户也观看过类似描述的电影(非结构化文本元数据)。

对于 Similar-Items,您可以在 GetRecommendations 操作(或 Amazon Personalize 控制台)中提供物品 ID,Amazon Personalize 会返回类似物品的列表。或者,您可以使用批量工作流程针对库存中的所有物品获取相似物品(请参阅获取批量商品推荐)。当您获得类似物品时,您可以根据您在请求中指定的物品的属性筛选物品。为此,请将 CurrentItem.attribute 元素添加到您的筛选器。有关示例,请参阅item data filter examples

要使用 Similar-Items,您必须创建一个包含至少 1000 个唯一历史和事件交互(组合)的物品交互数据集。为了获得更准确的预测,我们建议您同时创建物品数据集并导入有关目录中物品的元数据。Similar-Items 在生成建议时不使用用户数据集中的数据。您仍然可以根据用户数据集中的数据筛选建议。有关更多信息,请参阅 筛选建议和用户细分

如果您的物品数据集包含文本数据和物品标题数据,则可以在批量建议中为相关物品生成主题。有关更多信息,请参阅内容生成器中带有主题的批量建议

您可以获得与冷物品(交互次数少于五次的物品)相似的物品的建议。如果 Amazon Personalize 找不到您在建议请求或批量输入文件中指定的物品 ID,则食谱会将热门物品作为建议返回。

创建解决方案版本后,确保您的解决方案版本和数据为最新状态。对于类似商品,您必须手动创建新的解决方案版本(重新训练模型),让 Amazon Personalize 考虑推荐新商品,并根据用户的最新行为更新模型。然后,您必须使用解决方案版本更新所有市场活动。有关更多信息,请参阅 维护建议相关性

属性和超参数

Similar-Items 食谱具有以下属性:

  • 名称aws-similar-items

  • 食谱 Amazon 资源名称 (ARN) - arn:aws:personalize:::recipe/aws-similar-items

  • 算法 ARN - arn:aws:personalize:::algorithm/aws-similar-items

有关更多信息,请参阅 选择食谱

下表描述 Similar-Items 食谱的超参数。超参数 是一个算法参数,您可以调整该参数以提高模型性能。算法超参数控制模型的执行方式。为超参数选择最佳值的过程称为超参数优化 (HPO)。有关更多信息,请参阅 超参数和 HPO

该表还为每个超参数提供以下信息:

  • 范围:[上界, 下界]

  • 值类型:Integer、Continuous(浮点数)、Categorical(布尔值、列表、字符串)

  • 可调 HPO:该参数是否可以参与 HPO?

名称 描述
算法超参数
popularity_discount_factor

配置受欢迎程度如何影响建议。指定一个接近 0 的值可包含更受欢迎的物品。指定一个更接近 1 的值可减少对受欢迎程度的关注。

默认值:0.0

范围:[0.0, 1.0]

值类型:浮点数

HPO 可调:否

item_id_hidden_dim

Amazon Personalize 根据交互数据对物品 ID 嵌入进行建模时使用的隐藏变量的数量。隐藏变量 重新创建用户的购买历史记录和物品统计数据来生成排名分数。要使用 item_id_hidden_dim,您必须使用 HPO 并提供最小和最大范围值。Amazon Personalize 使用 HPO 来查找您指定范围内的最佳值。当物品交互数据集较大时,指定更大的最大值。使用较大的最大值需要更多处理时间。

要使用 HPO,请在您调用 CreateSolution 操作时,将 performHPO 设置为 true

默认值:100

范围:[30、200]

值类型:整数

HPO 可调:是

item_metadata_hidden_dim

Amazon Personalize 用来对物品元数据建模的隐藏变量的数量。要使用 item_metadata_hidden_dim,您必须使用 HPO 并提供最小和最大范围值。Amazon Personalize 使用 HPO 来查找您指定范围内的最佳值。当物品交互数据集较大时,指定更大的最大值。使用较大的最大值需要更多处理时间。

要使用 HPO,请在您调用 CreateSolution 操作时,将 performHPO 设置为 true

默认值:100

范围:[30、200]

值类型:整数

HPO 可调:是