准备清单 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备清单

在您查看了 Amazon Personalize 的工作原理并完成入门练习后,您可以开始准备使用 Amazon Personalize 处理自己的数据了。此清单列出了 Amazon Personalize 的特征、要求和数据指南。它可以帮助您进行规划,也可以将其用作在 Amazon Personalize 中创建资源时的参考。

您是否将自己的使用案例与 Amazon Personalize 资源进行了匹配?

Amazon Personalize 建议可以解决以下使用案例:

  • 为用户生成个性化建议

  • 推荐类似或相关物品

  • 推荐趋势或热门物品

  • 为用户建议下一个最佳操作

  • 按相关性重新排序(仅限使用自定义资源)

  • 生成用户细分(仅限使用自定义资源)

Amazon Personalize 提供基于域的资源和为这些使用案例配置的自定义资源。首先,创建域数据集组或自定义数据集组:

  • 对于域数据集组,创建针对 VIDEO_ON_DEMAND 或 ECOMMERCE 域进行预配置和优化的资源。

    如果您有流视频或电子商务应用程序,我们建议您从域数据集组开始。您仍然可以添加自定义资源,例如针对自定义使用案例训练的解决方案和解决方案版本。而且,您仍然可以使用自定义资源来获取批量推荐。

  • 对于自定义数据集组,选择与您的使用案例相匹配的食谱。然后,只训练和部署可配置的解决方案与解决方案版本(经过训练的 Amazon Personalize 建议模型)。准备就绪后,您可以在活动中部署解决方案版本以获得实时推荐。或者,您也可以在没有广告活动的情况下获得批量推荐。

    如果您没有流视频或电子商务应用程序,我们建议您创建自定义数据集组。否则,从域数据集组开始,然后根据需要添加自定义资源。

有关 Amazon Personalize 中提供的使用案例和自定义食谱的信息,请参阅域使用案例和自定义配方

您是否有足够的物品交互数据?

对于所有使用案例和配方,您的 25 个唯一用户必须进行至少 1000 次物品交互,每个用户至少有两次交互。为获得高质量的建议,我们建议您至少有 1000 名用户的最少 5 万次物品交互,每位用户有两次或更多次物品交互。

如果您不确定自己是否有足够的数据,可以使用 Amazon Personalize 控制台导入和分析数据。有关更多信息,请参阅分析数据集中的数据

您是否有实时事件流式传输架构?

如果您没有足够的物品交互数据,则可以使用 Amazon Personalize 来收集其它实时事件数据。对于一些食谱和使用案例,Amazon Personalize 可以从用户的最新活动中学习,并在他们使用您的应用程序时更新建议。

有关记录事件的信息(包括事件如何影响建议、第三方事件跟踪服务列表以及示例实施),请参阅记录事件

您的数据是否针对 Amazon Personalize 进行了优化?

我们建议您在数据中检查以下内容:

  • 检查是否缺失值。我们建议至少 70% 的记录包含每个属性的数据。我们建议允许空值的列的填写率至少为 70%。

  • 修复数据中的任何不准确之处或问题,例如命名约定不一致、项类别重复、数据集之间的 ID 不匹配或 ID 重复。这些问题可能会对建议产生负面影响或导致意外行为。例如,您的数据中可能同时有“N/A”和“不适用”,但仅基于“N/A”筛选建议。标记为“不适用”的物品不会被筛选器删除。

  • 如果一个物品、用户或操作可以有多个类别(例如一部电影有多种类型),请将分类值合并到一个属性中,并使用 | 运算符分隔每个值。例如,电影的 GENRES 数据可能是动作 | 冒险 | 惊悚片。

  • 避免为一列设置超过 1000 个可能的类别(除非该列包含仅用于筛选目的的数据)。

有关数据建议的完整列表以及如何使用 Amazon Personalize 识别问题的说明,请参阅分析数据集中的数据

您是否收集可以改进建议的可选数据?

以下数据可以帮助提高建议相关性。

  • 事件类型(对所有域数据集组使用案例为必填项)

  • 事件值

  • 上下文元数据

  • 物品和用户元数据

  • 操作交互数据(仅由 PERSONALIZED_ACTIONS 配方使用)

有关 Amazon Personalize 可以使用的数据类型的更多信息,请参阅 Amazon Personalize 可以使用的数据类型

您是否有计划测试您的建议?

您可以使用 A/B 测试来比较不同用户组与来自不同模型的建议进行交互的结果。A/B 测试可以帮助您比较不同的建议策略,并查看建议是否有助于您实现业务目标。有关更多信息,请参阅使用 A/B 测试衡量建议影响

您是否还有其他业务目标?

在一些情况下,除了为用户生成相关建议外,您可能还有其他目标。例如,您可能想要最大限度地提高收入,或者推广某个类别中某些类型的物品。以下 Amazon Personalize 特征可以提供帮助:

  • 推广:您可以使用推广来确保一定比例的物品满足您的业务需求。有关更多信息,请参阅通过建议推广物品

  • 针对业务目标进行优化:对于某些自定义数据集组食谱,您可以针对自定义目标优化解决方案,例如最大限度地提高流式传输时长或增加收入。有关更多信息,请参阅针对其他目标优化解决方案

  • 筛选建议。使用筛选器将业务规则应用于建议。您可以使用筛选器,在建议中包含或排除某些类型的物品。有关更多信息,请参阅 筛选建议和用户细分