Amazon Personalize 术语 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon Personalize 术语

本节介绍了 Amazon Personalize 中使用的术语。

数据导入和管理

以下术语与在 Amazon Personalize 中导入、导出数据及其格式设置有关。

上下文元数据

您在事件(例如单击)发生时收集的有关用户浏览上下文(例如使用的设备或位置)的交互数据。上下文元数据可以改善新用户和现有用户的建议相关性。

数据集

用于存放您上传到 Amazon Personalize 的数据的容器。Amazon Personalize 数据集有三种类型:用户、物品和交互。

数据集组

Amazon Personalize 资源的容器,包括数据集、域推荐器和自定义资源。数据集组将资源组织到独立的集合中,在其中,一个数据集组中的资源不会影响任何其他数据集组中的资源。数据集组可以是域数据集组,也可以是自定义数据集组。

域数据集组

一个数据集组,包含针对不同业务域和使用案例的预配置资源。Amazon Personalize 负责管理训练模型和部署的生命周期。创建域数据集组时,您可以选择业务域,导入数据,并为每个使用案例创建推荐器。您可以在应用程序中使用推荐器,通过 GetRecommendations 操作获取建议。

如果您从域数据集组开始,则仍然可以添加自定义资源,例如解决方案和解决方案版本,这些版本使用自定义使用案例配方进行训练。

自定义数据集组

仅包含自定义资源的数据集组,包括解决方案、解决方案版本、筛选器、市场活动和批量推理作业。您可以使用市场活动,通过 GetRecommendations 操作获取建议。您负责管理训练模型和部署的生命周期。如果您从自定义数据集组开始,则以后无法将其与域相关联。相反,创建新的域数据集组。

数据集导出作业

一种记录导出工具,可将数据集中的记录输出到 Amazon S3 存储桶中的一个或多个 CSV 文件。输出 CSV 文件包括标题行,其列名称与数据集架构中的字段相匹配。

数据集导入作业

一种批量导入工具,可使用来自 Amazon S3 存储桶中 CSV 文件的数据填充您的 Amazon Personalize 数据集。

事件

您记录并上传到 Amazon Personalize 物品交互数据集的用户操作(如单击、购买或视频观看)。您可以通过 Amazon Personalize 控制台以增量方式从 CSV 文件中实时批量导入事件。

显式展示

您手动添加到 Amazon Personalize 物品交互数据集的物品列表。不同于隐式展示(Amazon Personalize 自动从建议数据中派生此类展示),您可以选择要在显式展示中包含的物品。

隐式展示

您的应用程序向用户显示的建议。不同于显式展示(手动将此类展示添加到物品交互数据集),Amazon Personalize 自动从您的建议数据派生隐式展示。

展示数据

当用户与特定物品进行交互(例如单击、观看或购买等)时,您向其展示的物品列表。Amazon Personalize 根据用户选择或忽略同一物品的频率,使用展示数据计算新物品对用户的相关性。

交互数据集

用于保存从用户和物品(称为事件)之间的交互中收集的历史数据和实时数据的容器。交互数据可以包括展示数据上下文元数据

物品数据集

用于保存物品相关元数据(例如价格、类型或可用性)的容器。

架构

Apache Avro 格式的 JSON 对象,用于向 Amazon Personalize 告知您的数据结构。Amazon Personalize 使用您的架构来解析您的数据。

用户数据集

用于保存用户相关元数据(例如年龄、性别或会员资格)的容器。

训练

以下术语与在 Amazon Personalize 中训练模型有关。

物品间相似度 (SIMS) 配方

RELATED_ITEMS 配方,使用交互数据集中的数据为类似于指定物品的物品生成建议。SIMS 配方根据用户与物品进行交互的方式而不是匹配物品元数据(如价格或颜色)计算相似度。

item-affinity

USER_SEGMENTATION 配方,它使用来自物品交互数据集和物品数据集的数据,根据用户与物品交互的可能性为您指定的每个物品创建用户细分。

item-attribute-affinity

USER_SEGMENTATION 配方,它使用来自物品交互数据集和物品数据集的数据,根据用户与带有属性的物品交互的可能性为您指定的每个物品属性创建用户细分。

个性化-排名配方

PERSONALIZED_RANKING 配方,根据特定用户的预测兴趣级别对您提供的一系列物品进行排名。使用 personalized-ranking 配方,可对针对特定用户个性化的物品或搜索结果的精选列表顺序进行个性化设置。

热门程度-计数配方

USER_PERSONALIZATION 配方,用于推荐与唯一用户交互最多的物品。

推荐器

用于生成建议的域数据集组工具。您可以为域数据集组创建推荐器,并在应用程序中使用它通过 GetRecommendations API 获取实时建议。创建推荐器时,您需指定一个使用案例,然后 Amazon Personalize 通过使用案例的最佳配置,训练支持推荐器的模型。

recipe

一种预先配置的 Amazon Personalize 算法,用于预测用户将与之进行交互的物品(对于 USER_PERSONALIZATION 配方),或计算与用户表示感兴趣的特定物品类似的物品(对于 RELATED_ITEMS 配方),或根据特定用户的预测兴趣对您提供的一系列物品进行排名(对于 PERSONALIZED_RANKING 配方)。

solution

Amazon Personalize 用来生成建议的配方、自定义参数和经过训练的模型(解决方案版本)。

解决方案版本

作为 Amazon Personalize 解决方案的一部分创建的经过训练的模型。您可以在市场活动中部署解决方案版本以激活用于请求建议的个性化 API。

训练模式

创建解决方案版本时要执行的训练的范围。有以下两种不同的模式:“完整”和“更新”。完整模式基于数据集组中数据集的全部训练数据,创建一个全新的解决方案版本。更新模式以增量方式更新现有解决方案版本,以推荐自上次训练以来添加的新物品。

注意

通过 User-Personalization 或 Next-Best-Action,Amazon Personalize 自动更新在完整训练模式下训练的最新解决方案版本。请参阅自动更新

user-personalization 配方

基于分层递归神经网络 (HRNN) 的 USER_PERSONALIZATION 配方,可预测用户将与之交互的物品。用户-个性化配方可以使用物品浏览和展示数据生成有关新物品的推荐。

模型部署和建议

以下术语与在 Amazon Personalize 中部署和使用模型有关。

批量推理作业

一种工具,可从 Amazon S3 存储桶导入您的批量输入数据,使用您的解决方案版本生成建议,并将建议导出到 Amazon S3 存储桶。我们建议使用不同的输出数据位置(文件夹或其他 Amazon S3 存储桶)。使用批量推理作业,针对不需要实时更新的大型数据集获取建议。

批量细分作业

一种工具,可从 Amazon S3 存储桶导出批量输入数据,使用您的解决方案版本创建用户细分,并将用户细分导出到 Amazon S3 存储桶。我们建议使用不同的输出数据位置(文件夹或其他 Amazon S3 存储桶)。通过由 USER_SEGMENTATION 配方支持的解决方案使用批量细分作业,根据用户与不同物品或具有不同物品属性的物品交互的可能性来创建用户细分。

市场活动

部署的解决方案版本(经过训练的模型),具有预调配的专用事务容量,用于为您的应用程序用户创建实时建议。创建市场活动后,您可以使用 getRecommendationsgetPersonalizedRanking API 操作来获取建议。

物品浏览

在浏览中,建议包括一些通常不太可能向用户建议的物品或操作,例如新物品或操作、交互量很少的物品或操作,或者根据用户以前的行为与用户不太相关的物品或操作。

建议

Amazon Personalize 预测用户将与之交互的物品列表。根据所使用的 Amazon Personalize 配方,建议可以是物品列表(使用 USER_PERSONALIZATION 配方和 RELATED_ITEMS 配方),也可以是您提供的一系列物品的排名(使用 PERSONALIZED_RANKING 配方)。

用户细分

Amazon Personalize 预测用户将与您的目录交互的用户列表。根据所使用的 USER_SEGMENTATION 配方,您可以根据物品(Item-Affinity 配方)和物品元数据(Item-Attribute-Affinity 配方)创建用户细分。您可以使用批量细分作业来创建用户细分。