交互数据 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

交互数据

在Amazon Personalize 中,一个相互作用是一个事件你记录下来然后作为训练数据导入。您可以录制多种事件类型,例如点击,要么. 例如,如果用户点击一件特定的物品然后喜欢商品,您希望 Amazon Personalize 使用这些事件作为训练数据,对于每个事件,您需要记录用户的 ID、商品 ID、时间戳(采用 Unix 时间周期格式)和事件类型(点击)。然后,您需要将两个交互事件添加到交互数据集中。记录了足够多的事件后,您可以训练模型并使用 Amazon Personalize 为用户生成推荐。有关最低要求,请参阅Service Quotas.

Amazon Personalize 将互动数据存储在交互数据集. 对于所有用例(域数据集组)和配方(自定义数据集组),您的互动数据必须具有以下内容:

  • 至少有 1000 条来自与您目录中商品互动的用户的互动记录。这些交互可以来自批量导入或流媒体事件,或两者兼而有之。

  • 至少 25 个唯一用户 ID,每个 ID 至少有 2 次互动。

要创建推荐器或自定义解决方案,您必须至少创建一个 Interactions 数据集。本部分提供有关您可以导入 Amazon Personalize 的以下类型的交互数据的信息。

事件类型和事件值数据

Interactions 数据集可以存储事件类型数据,例如点击事件类型和每个事件的事件值数据。

  • 如果您为 VIDEO_ON_DEMAND 或电子商务域创建域名数据集组,则所有用例都要求您的数据包含 EVENT_TYPE 字段。不同的用例需要不同的事件类型。有关更多信息,请参阅选择推荐用例.

    对于域数据集组,Amazon Personalize 不使用事件值数据。

  • 如果您创建自定义数据集组,Amazon Personalize 会在训练前使用事件类型和事件值数据筛选事件。您可以导入事件类型数据或事件类型事件值数据。导入此数据以选择 Amazon Personalize 在训练中使用的交互数据,如下所示:

    • 根据事件类型选择事件— 要根据类型选择记录,请在 EVENT_TYPE 列中记录每个事件的类型。配置解决方案时,您需要指定类型,Amazon Personalize 将在培训中仅使用此类型的记录。

      例如,如果您的数据包括购买,点击,以及事件类型,你想让 Amazon Personalize 只用它来训练模型事件,你需要在 EVENT_TYPE 列中包含每个事件的类型。然后,在创建解决方案时,指定作为event typeAmazon Personalize 在培训中使用的。

      如果您的 Interactions 数据集在 EVENT_TYPE 列中有多个事件类型,并且您在配置解决方案时未提供事件类型,则 Amazon Personalize 使用所有交互数据进行训练,无论类型如何,均具有同等权重。

    • 根据类型和值选择记录— 要根据类型和值选择记录,请记录每个事件的事件类型和事件值。您为每个事件选择的值取决于要排除的数据以及要记录的事件类型。例如,您可以匹配用户活动,例如用户观看的视频的百分比事件类型。

      配置解决方案时,您可以将特定值设置为阈值,以从训练中排除记录。例如,如果你的 EVENT_VALUE 数据用于事件类型为是用户观看的视频的百分比,前提是将事件值阈值设置为 0.5,事件类型设置为,Amazon Personalize 仅使用训练模型EVENT_VALUE 大于等于等于等于等于等于等于等于

上下文元数据

对于某些配方和推荐用例,Amazon Personalize 可以在识别向您的用户揭示最相关的内容的基础模式时使用上下文元数据。情境元数据是您在事件发生时在用户环境中收集的交互数据,例如用户的位置或设备类型。

包括上下文元数据允许您为现有用户提供更加个性化的体验。例如,如果客户通过手机访问您的目录与使用计算机访问您的目录时的购物方式不同,请提供有关用户设备的上下文元数据。然后,根据他们的浏览方式,推荐将变得更具相关性。

此外,上下文元数据有助于缩短新用户或身份不明用户的冷启动阶段。冷启动阶段是指您的推荐引擎由于缺少有关该用户的历史信息而提供相关性较低的推荐的时期。

对于域数据集组,以下推荐用例可以使用上下文元数据:

对于自定义数据集组和自定义解决方案,使用上下文元数据的配方包括以下内容:

有关上下文信息的更多信息,请参阅下列内容:AmazonMachine Learning 博客文章:利用上下文信息,提高您的Amazon Personalize 推荐的相关性.

展示数据

如果您为 VIDEO_ON_DEMAND 或电子商务域创建域名数据集组,或者使用用户个性化食谱,Amazon Personalize 可以对你上传到互动数据集的展示量数据进行建模。曝光量是用户在与特定项目互动(例如,点击或观看)时可见的项目列表。

Amazon Personalize 使用曝光量数据来确定要在探索中包含哪些商品。浏览这里的推荐包括互动数据或相关性较低的新项目。商品出现在曝光量数据中的频率越高,Amazon Personalize 在探索中包含该物品的可能性就越小。印象值最多可以有 1000 个字符(包括竖线字符)。

有关探索优点的信息,请参阅用户个性化. Amazon Personalize 可以模拟两种类型的曝光量:隐式展示显式展示.

隐式展示

隐式展示是您向用户展示的从 Amazon Personalize 中检索到的推荐。你可以将它们集成到你的推荐工作流程中,方法是添加RecommendationId(由返回GetRecommendationsGetPersonalizedRanking操作)作为future 输入PutEvents请求。Amazon Personalize 根据您的推荐数据得出隐含的曝光量。

例如,您可能有一个为流式视频提供推荐应用程序。使用隐式展示的推荐工作流程可能如下所示:

  1. 您使用 Amazon Personalize 为您的一个用户请求视频推荐GetRecommendationsAPI 操作。

  2. Amazon Personalize 为使用您的模型(解决方案版本)的用户生成推荐并返回recommendationId在 API 响应中。

  3. 您可以在应用程序中向用户显示视频推荐。

  4. 当您的用户与视频互动(例如,点击)时,在对视频的通话中录制选择PutEventsAPI 并包括recommendationId作为参数。有关代码示例,请参阅记录展示数据.

  5. Amazon Personalize ersonalrecommendationId从之前的视频推荐中获得展示次数数据,然后使用展示次数数据来指导探索,future 推荐包括互动数据或相关性较低的新视频。

    有关使用隐式曝光数据记录事件的更多信息,请参阅记录展示数据.

显式展示

显式展示是您手动记录并发送给 Amazon Personalize 的曝光量。使用露骨的印象来操纵来自Amazon Personalize 结果。物品的顺序没有影响。

例如,您可能有一个提供鞋子推荐的购物应用程序。如果您只推荐当前有货的鞋子,则可以使用明确的印象来指定这些商品。使用显式印象的推荐工作流程可能如下所示:

  1. 您使用 Amazon Personalize 为您的某位用户请求推荐GetRecommendationsAPI。

  2. Amazon Personalize 使用您的模型(解决方案版本)为用户生成建议,并在 API 响应中返回这些建议。

  3. 您只向用户显示推荐的库存鞋子。

  4. 对于实时增量数据导入,当你的用户与一双鞋互动(例如,点击)时,你可以在调用PutEventsAPI 并在其中列出库存的推荐商品impression参数。有关代码示例,请参阅记录展示数据.

    要在历史互动数据中导入展示次数,您可以在 csv 文件中列出明确的展示次数,并用 “|” 字符分隔每个项目。竖线字符计入到 1000 个字符限制中。有关示例,请参阅 格式化显式展示

  5. Amazon Personalize 使用展示数据来指导探索,future 推荐包括互动数据或相关性较低的新鞋。