交互数据 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

交互数据

在 Amazon Personalize 化中,相互作用事件您记录然后作为训练数据导入。你可以记录多种事件类型,例如点击要么. 例如,如果用户点击然后是一个特定的物品喜欢商品,并且您希望 Amazon Personalize 化将这些事件用作培训数据,对于每个活动,您都要记录用户的 ID、商品 ID、时间戳(以 Unix 时间纪元格式)和活动类型(点击)。然后,您将两个互动事件添加到交互数据集中。记录了足够的事件后,您可以训练模型并使用 Amazon Personalize 化为用户生成推荐。有关最低要求请参见Service Quotas.

Amazon Personalize 化将互动数据存储在交互数据集. 要创建推荐者或自定义解决方案,您至少必须创建一个互动数据集。本节提供有关以下类型的互动数据的信息,您可以导入到 Amazon Personalize 化中。

事件类型和事件价值数据

交互数据集可以存储事件类型数据,例如点击事件类型以及每个活动的事件价值数据。

  • 如果您为 VIDEO_ON_DEMAND 或电子商务域创建域数据集组,则所有使用案例都要求您的数据包含 EVENT_TYPE 字段。不同的用例需要不同的事件类型。有关更多信息,请参阅选择推荐用例.

    对于域数据集组,Amazon Personalize 化不会使用事件价值数据。

  • 如果您创建自定义数据集组,Amazon Personalize 会在培训之前使用事件类型和事件值数据筛选活动。您可以导入事件类型数据或事件类型事件值数据。导入此数据以选择 Amazon Personalize 化在培训中使用的互动数据,如下所示:

    • 根据事件类型选择活动— 要根据类型选择记录,请在 EVENT_TYPE 列中记录每个事件的类型。配置解决方案时,您将指定类型,Amazon Personalize 将在培训中仅使用具有此类型的记录。

      例如,如果你的数据包括购买点击, 和事件类型,并且您希望 Amazon Personalize 化只能训练模型事件时,您将在 EVENT_TYPE 列中包含每个事件的类型。然后,在您创建解决方案时,请指定作为event typeAmazon Personalize 化在培训中使用的。

      如果您的互动数据集在一个 EVENT_TYPE 列中有多种事件类型,并且您在配置解决方案时没有提供事件类型,则 Amazon Personalize 会使用所有互动数据进行培训,而不论类型如何,均具有相同权重

    • 根据类型和值选择记录— 要根据类型和值选择记录,请记录每个事件的事件类型和事件值。为每个事件选择的值取决于要排除哪些数据以及要记录的事件类型。例如,您可能与用户活动匹配,例如用户观看的视频百分比事件类型。

      配置解决方案时,可以将特定值设置为阈值,以便将记录排除在培训之外。例如,如果事件的 EVENT_VALUE 数据的 EVENT_TYPE 为是用户观看的视频的百分比,如果将事件值阈值设置为 0.5,事件类型为,Amazon Personalize 化仅使用训练模型与 EVENT_VALUE 大于或等于 0.5 的交互事件。

上下文元数据

对于某些食谱和推荐用例,Amazon Personalize 可以在识别向用户揭示最相关项目的潜在模式时使用上下文元数据。上下文元数据是您在事件发生时在用户环境中收集的交互数据,例如用户的位置或设备类型。

包括上下文元数据可让您为现有用户提供更个性化的体验。例如,如果客户在从手机访问您的目录时与计算机相比购物不同,请包含有关用户设备的上下文元数据。然后,建议将根据他们的浏览方式更加相关。

此外,上下文元数据有助于减少新用户或未识别用户的冷启动阶段。冷启动阶段是指由于缺乏有关该用户的历史信息,您的推荐引擎提供的相关性较低的建议的时期。

对于域数据集组,以下推荐用例可以使用上下文元数据:

对于自定义数据集组和自定义解决方案,使用上下文元数据的配方包括:

有关上下文信息的更多信息,请参阅以下内容:AmazonMachine Learning 博客文章:利用上下文信息,提高 Amazon Personalize 化推荐的相关性.

展示数据

如果您为 VIDEO_ON_DEMAND 或电子商务域创建域数据集组,或者使用用户个性化方法,Amazon Personalize 化可以为您上传到互动数据集的展示量数据建模。展示次数是用户在与特定项目互动(例如点击或观看)特定项目时可见的项目列表。Amazon Personalize 化使用展示量数据来确定探索中要包含哪些商品。Exploration (探索)是建议包括互动数据或相关性较少的新项目的地方。商品在展示数据中出现的频率越高,Amazon Personalize 化在探索中包含该商品的可能性就越小。

有关探索好处的信息,请参阅用户个性化. Amazon Personalize 化可以为两种类型的展示量建模:隐式展示显式展示.

隐式展示

隐式展示是从 Amazon Personalize 化中检索到的向用户展示的推荐。您可以将它们集成到推荐工作流程中,方法是将RecommendationId(由返回的GetRecommendationsGetPersonalizedRanking操作)作为未来的投入PutEvents请求。Amazon Personalize 化根据您的推荐数据得出隐含的展示次数。

例如,您可能有一个提供流式传输视频的推荐的应用程序。使用隐式展示的推荐工作流程可能如下所示:

  1. 您使用 “Amazon Personalize 化” 为其中一位用户申请视频推荐GetRecommendationsAPI 操作。

  2. Amazon Personalize 化为使用您的模型(解决方案版本)的用户生成建议,然后使用recommendationId在 API 响应中。

  3. 您在应用程序中向用户展示视频推荐。

  4. 当您的用户与视频互动(例如,点击)视频时,请在呼叫PutEventsAPI 并包含recommendationId作为参数。有关代码示例,请参阅记录展示数据.

  5. Amazon Personalize 使用recommendationId从以前的视频推荐中获取印象数据,然后使用印象数据来指导探索,其中未来的建议包括互动数据或相关性较少的新视频。

    有关使用隐式展示数据记录事件的详细信息,请参阅记录展示数据.

显式展示

显式展示是您手动记录并发送给 Amazon Personalize 化的展示次数。使用明确的展示来操纵来自 Amazon Personalize 化的结果。商品的顺序没有影响。

例如,您可能有一个提供鞋子推荐的购物应用程序。如果您只推荐当前有货的鞋子,则可以使用明确的展示次数来指定这些商品。使用明确展示的推荐工作流程可能如下所示:

  1. 您使用 “Amazon Personalize 化” 为其中一位用户请求推荐GetRecommendationsAPI。

  2. Amazon Personalize 化为使用您的模型(解决方案版本)的用户生成建议,并在 API 响应中返回这些建议。

  3. 你只向用户展示有库存的推荐鞋子。

  4. 对于实时增量数据导入,当您的用户与一双鞋子进行交互(例如,点击)时,您可以在呼叫PutEventsAPI 并列出中有库存的推荐商品impression参数。有关代码示例,请参阅记录展示数据.

    要在历史交互数据中导入展示次数,您可以在 csv 文件中列出显式展示次数,并使用 “|” 字符分隔每个项目。请参阅 设定显式展示

  5. Amazon Personalize 化使用展示数据来指导探索,未来的建议包括互动数据或相关性较少的新鞋子。