HRNN-Coldstart 食谱（旧版）

注意

旧版 HRNN 食谱不再可用。此文档仅供参考。

我们建议使用 aws-user-personalizaton（用户个性化）配方，而不是传统的 HRNN 配方。User-Personalization 改进并统一了 HRNN 食谱提供的功能。有关更多信息，请参阅 User-Personalization 食谱。

当您经常添加新物品和交互并希望立即获得有关这些物品的建议时，可以使用 HRNN-Coldstart 食谱来预测用户将与之交互的物品。HRNN 冷启动配方类似于 HRNN 元数据配方，但它允许您获取有关新物品的建议。

此外，当您由于最近的流行趋势或由于交互可能极不寻常并且在训练中引入噪音而希望从训练物品中排除具有长交互列表的物品时，也可以使用 HRNN 冷启动配方。使用 HRNN 冷启动，您可以筛选掉相关性较弱的物品以创建用于训练的子集。该物品子集称为冷物品，是在物品交互数据集中具有相关交互事件的物品。如果物品符合以下条件，则该物品被视为冷物品：

交互数量少于指定的最大交互数量。您在配方的 cold_start_max_interactions 超参数中指定此值。
相对持续时间短于最大持续时间。您在配方的 cold_start_max_duration 超参数中指定此值。

要减少冷物品的数量，请为 cold_start_max_interactions 或 cold_start_max_duration 设置较低的值。要增加冷物品的数量，请为 cold_start_max_interactions 或 cold_start_max_duration 设置较大的值。

HRNN-Coldstart 具有以下冷物品限制：

Maximum cold start items：80,000
Minimum cold start items：100

如果冷物品的数量超出此范围，则尝试创建解决方案将失败。

HRNN-Coldstart 配方具有以下属性：

名称 – aws-hrnn-coldstart
食谱 Amazon 资源名称 (ARN) - arn:aws:personalize:::recipe/aws-hrnn-coldstart
算法 ARN - arn:aws:personalize:::algorithm/aws-hrnn-coldstart
特征转换 ARN - arn:aws:personalize:::feature-transformation/featurize_coldstart
食谱类型 - USER_PERSONALIZATION

有关更多信息，请参阅选择食谱。

下表描述 HRNN-Coldstart 配方的超参数。超参数 是一个算法参数，您可以调整该参数以提高模型性能。算法超参数控制模型的执行方式。特征化超参数控制如何筛选训练中使用的数据。为超参数选择最佳值的过程称为超参数优化 (HPO)。有关更多信息，请参阅超级参数和 HPO。

该表还为每个超参数提供以下信息：

范围：[上界, 下界]
值类型：Integer、Continuous（浮点数）、Categorical（布尔值、列表、字符串）
可调 HPO：该参数是否可以参与 HPO？

名称	描述
算法超参数
`hidden_dimension`	模型中使用的隐藏变量的数量。隐藏变量重新创建用户的购买历史记录和物品统计数据来生成排名分数。当物品交互数据集包含更复杂的模式时，请指定更多数量的隐藏维度。使用更多隐藏维度需要更大的数据集和更多的处理时间。要确定最佳值，请使用 HPO。要使用 HPO，当您调用 CreateSolution 和 CreateSolutionVersion 操作时，请将 `performHPO` 设置为 `true`。默认值：149 范围：[32, 256] 值类型：整数 HPO 可调：是
`bptt`	确定是否使用基于时间的反向传播技术。反向传播是一种在基于递归神经网络的算法中更新权重的技术。将 `bptt` 用于长期积分以将延迟奖励与早期事件联系起来。例如，延迟奖励可以是几次点击后进行的购买。早期事件可以是初始点击。即使在相同的事件类型（例如点击）中，最好考虑长期影响并最大化总奖励。要考虑长期效果，请使用较大的 `bptt` 值。使用较大的 `bptt` 值需要更大的数据集和更多的处理时间。默认值：32 范围：[2, 32] 值类型：整数 HPO 可调：是
`recency_mask`	确定模型是否应考虑物品交互数据集中的最新流行趋势。最新流行趋势可能包括交互事件的基本模式的突然变化。要训练一个使最近事件具有更高权重的模型，请将 `recency_mask` 设置为 `true`。要训练一个使所有过往交互占相同权重的模型，请将 `recency_mask` 设置为 `false`。要使用相等权重获得好的建议，您可能需要较大的训练数据集。默认值：`True` 范围：`True` 或 `False` 值类型：布尔值 HPO 可调：是
特征化超参数
`cold_start_max_interactions`	物品可能必须被视为冷物品的最大用户-物品交互次数。默认值：15 范围：正整数值类型：整数 HPO 可调：否
`cold_start_max_duration`	用户-物品交互被视为冷启动物品的相对于起点的最大持续时间（以天为单位）。要设置用户-物品交互的起点，请设置 `cold_start_relative_from` 超参数。默认值：5.0 范围：正浮点数值类型：浮点数 HPO 可调：否
`cold_start_relative_from`	确定 HRNN 冷启动配方计算 `cold_start_max_duration` 的起点。要从当前时间计算，请选择 `currentTime`。要从物品交互数据集中最新物品的时间戳计算 `cold_start_max_duration`，请选择 `latestItem`。如果您经常添加新物品，该设置将非常有用。默认值：`latestItem` 范围：`currentTime`、`latestItem` 值类型：字符串 HPO 可调：否
`min_user_history_length_percentile`	要包含在模型训练中的用户历史记录长度的最小百分位数。历史记录长度是有关用户的数据总量。使用 `min_user_history_length_percentile` 排除历史记录长度较短的一定百分比的用户。历史记录较短的用户通常会根据物品受欢迎程度而不是用户的个人需求或需要来显示模式。删除它们可以在训练模型时更多地关注数据中的基础模式。使用直方图或类似工具查看用户历史记录长度后，请选择适当的值。我们建议您设置一个值，该值将保留大多数用户，但会删除边缘案例。例如，设置 `min__user_history_length_percentile to 0.05` 和 `max_user_history_length_percentile to 0.95` 将包括除那些历史记录长度在最低或最高 5% 内的用户之外的所有用户。默认值：0.0 范围：[0.0, 1.0] 值类型：浮点数 HPO 可调：否
`max_user_history_length_percentile`	要包含在模型训练中的用户历史记录长度的最大百分位数。历史记录长度是有关用户的数据总量。使用 `max_user_history_length_percentile` 排除具有较长历史记录长度的一定百分比的用户，因为这些用户的数据往往包含噪音。例如，机器人可能有很长的自动交互列表。删除这些用户可限制训练中的噪音。使用直方图或类似工具查看用户历史记录长度后，请选择适当的值。我们建议您设置一个值，该值将保留大多数用户，但会删除边缘案例。例如，设置 `min__user_history_length_percentile to 0.05` 和 `max_user_history_length_percentile to 0.95` 将包括除那些历史记录长度在最低或最高 5% 内的用户之外的所有用户。默认值：0.99 范围：[0.0, 1.0] 值类型：浮点数 HPO 可调：否

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

HRNN 元数据