什么是 Amazon Personalize? - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 Amazon Personalize?

Amazon Personalize 是一项完全托管的机器学习服务,使开发人员能够轻松为其用户提供个性化体验。它反映了 Amazon 在构建个性化系统方面的知识和经验。

您可以在各种场景中使用 Amazon Personalize,例如,根据用户的偏好和行为生成针对用户的推荐、对结果进行个性化重新排名、为电子邮件个性化内容或基于用户细分创建有针对性的营销活动。Amazon Personalize 不需要机器学习经验。您可以快速开始使用适用于您的业务域的使用案例优化资源,也可以创建自己的可配置自定义资源。

在 Amazon Personalize 化中,您首先创建一个数据集组,该组是 Amazon Personalize 化组件的容器。您的数据集组可以是以下组之一:

  • 一个域数据集组,您可以在其中为不同的业务域和使用案例创建预配置的资源,例如获取类似视频(VIDEO_ON_DEMAND 域)或最畅销商品(电子商务域)的推荐。您可以选择自己的业务域、导入数据并创建推荐者。您在应用程序中使用推荐者来获取推荐。

    如果您有视频点播或电子商务应用程序,并希望 Amazon Personalize 化为您的使用案例找到最佳配置,请使用域数据集组。如果您从域数据集组开始,则还可以添加自定义资源,例如解决方案版本,其解决方案版本经过自定义使用案例的配方训练。

  • 一个自定义数据集组,您可以在其中为自定义用例和批量推荐工作流创建可配置资源。您可以选择配方、训练解决方案版本(模型),然后通过营销活动部署解决方案版本。您在应用程序中使用广告系列来获取推荐。

    如果您没有视频点播或电子商务应用程序,或者只想配置和管理自定义资源,或者希望在批处理工作流中获取建议,请使用自定义数据集组。如果您从自定义数据集组开始,则以后无法将其与域关联。而是创建新的域数据集组。

您可以使用Amazon控制台,Amazon Command Line Interface(Amazon CLI),或者以编程方式使用Amazon开发工具包。

借助域数据集组和自定义数据集组,Amazon Personalize 可以捕获用户的实时事件,以实现实时个性化。Amazon Personalize 可以将实时用户活动数据与现有用户配置文件和项目信息(历史数据)混合,以向用户推荐最相关的项目。您也可以使用 Amazon Personalize 收集新属性(例如,新网站)的交互数据,在收集到足够的数据后,Amazon Personalize 就可以开始提出建议。

使用域数据集组

借助域数据集组,Amazon Personalize 提供基于您的域的数据要求的默认架构,全面管理培训和更新推荐者的生命周期,并处理推荐 API 的配置。域数据集组使您可以轻松判断需要导入哪些数据才能获得针对自己的使用案例量身定制的建议,而且您不必担心为您的企业领域找到最佳的培训配置。

如果您从域数据集组开始,您仍可以添加自定义资源,例如经过自定义用例配方训练的解决方案和解决方案版本。

对于域数据集组,您只需执行以下操作:

  1. 创建数据集组并选择您的业务域。

  2. 创建一个包含域名必填字段的架构。在导入数据之前,必须先创建架构。

  3. 将任何历史输入数据的格式化以匹配您的架构并将数据上载到 Amazon S3 存储桶。

  4. 将您的数据导入 Amazon Personalize 化数据集,并记录来自用户与物品交互的实时事件数据。

  5. 当您收集了足够的数据后,请为每个使用案例创建推荐者。

    训练模型的最低数据要求如下:

    • 1000 条组合交互数据记录(按eventTypeeventValueThreshold,如果提供)。

    • 25 个唯一用户,每个用户至少 2 个交互。

  6. 使用你的应用程序中的推荐者通过 getCompents 操作 GetRecommendations。

  7. 随着目录的增长,通过批量或增量数据导入操作使数据保持最新状态来保持建议的相关性。Amazon Personalize 管理推荐人的生命周期,并随着数据集的变化进行更新。

使用自定义数据集组

使用自定义数据集组,您可以训练解决方案并根据自己的用例进行配置。例如,用户个性化、与某个项目相关的项目、项目的重新排名或用户细分。您可以根据使用案例选择配方并输入数据。Amazon Personalize 会对数据进行特征化,并应用学习算法的选择以及默认超参数和超参数优化作业配置。

您可以使用配方在 Amazon Personalize 中创建自定义个性化模型,而无需机器学习专业知识。某些配方可以根据用户的浏览上下文提供推荐。例如,使用用户个性化配方,当用户在移动设备上浏览时,与同一个用户在桌面上浏览时,Amazon Personalize 可以提供不同的推荐。为了帮助您决定要使用的配方,Amazon Personalize 提供了指标以描述训练后解决方案版本的特征。

对于自定义数据集组,您只需执行以下操作:

  1. 根据中的自定义架构要求格式化历史输入数据自定义数据集和架构然后将数据上传到 Amazon S3 存储桶。

  2. 将您的数据导入 Amazon Personalize 化数据集,并记录来自用户与物品交互的实时事件数据。

  3. 选择要在数据上使用的配方(算法),如果收集了足够的数据,则使用配方训练解决方案版本。

    训练模型的最低数据要求如下:

    • 1000 条组合交互数据记录(按eventTypeeventValueThreshold,如果提供)。

    • 25 个唯一用户,每个用户至少 2 个交互。

    不同的配方有额外的数据要求。有关更多信息,请参阅第 1 步:选择配方.

  4. 使用以下方法获取推荐或用户细分:

    • 使用广告系列部署解决方案版本并获取建议。

    • 创建批处理推理作业以获取批处理建议。

    • 创建用户细分作业以获取用户细分。

Amazon Personalize 定价

使用 Amazon Personalize,您可以按实际用量付费。无最低费用,无预先承诺。Amazon Personalize 化的成本取决于数据处理和存储、培训以及推荐请求的数量。

这些区域有:Amazon免费套餐允许您每月最多可用存储 20GB 的存储空间Amazon地区,每个符合条件的培训时间长达 100 小时Amazon区域,每月最多 50 个 TPS 小时的实时推荐。Amazon Personalize 化免费套餐在使用的前两个月内有效。

有关费用和价格的完整列表,请参阅Amazon Personalize 定价.

首次使用的 Amazon Personalize 化用户的推荐

如果您是 Amazon Personalize 的首次接触,我们建议您按顺序阅读以下内容:

  1. 工作方式— 本节介绍 Amazon Personalize 化工作流程,并引导您完成为用户创建个性化体验的步骤。本节还包括常见的 Amazon Personalize 化术语及其定义。从本部分开始了解本指南中将使用的术语。

  2. 设置 Amazon Personalize— 在本节中,您将设置您的Amazon Web Services 账户,设置使用 Amazon Personalize 化所需的权限,然后设置Amazon CLI和Amazon用于使用和管理 Amazon Personalize 化的 SDK。在开始获得建议之前,请完成本部分以确保您对 Amazon Personalize 化工作流程和条款有充分的了解。

  3. 开始使用— 在本节中,您将开始使用简单的电影数据集使用 Amazon Personalize 化。完成这些教程以获得 Amazon Personalize 化体验。您可以选择开始使用域数据集组或自定义数据集组:

  4. 根据您的申请,完成以下任一部分:

    • 域数据集组— 如果您有流媒体视频或电子商务应用程序,请按照本节中的步骤为您的使用案例创建域数据集组和推荐者。这些过程基于您在完成域数据集组入门练习时学到的知识,并提供了有关推荐者和域使用案例的更多深入信息。

    • 自定义数据集组— 如果您没有流媒体视频或电子商务应用程序,请按照本节中的步骤创建自定义数据集组。这些过程基于您在完成自定义数据集组入门练习时学到的知识,并提供了有关自定义配方和模型的更多深入信息。

  5. 记录事件— 本节介绍了如何实时记录用户互动事件。在您设置 Amazon Personalize 化资源后,请完成本部分以了解如何通过记录互动来使互动数据集与用户的行为保持最新事件使用事件跟踪器和PutEventsoperation.

  6. 筛选推荐和用户细分— 本节介绍如何筛选推荐。完成本节以了解如何构建筛选器表达式以根据自定义条件筛选推荐。例如,您可能不希望推荐用户已经购买的产品,或推荐用户已经观看过的影片。

了解深入的教程和代码示例

如果您是经验丰富的 Amazon Personalize 用户,您可以在亚马逊个性化样本 GitHub 存储库.