Amazon Personalize 术语

以下术语与在 Amazon Personalize 中导入、导出数据及其格式设置有关。

操作数据集

用于存放操作元数据的容器。操作是指您可能想向用户推荐的交互或创收活动，例如安装移动应用程序，或加入忠诚度计划。操作的元数据可能包括操作的到期时间戳、值、重复频率数据和分类元数据。只有 Next-Best-Action 配方才使用此数据类型。

操作交互数据集

用于保存从用户和操作之间的交互中收集的历史数据和实时数据的容器。每个操作交互都包含 userID、actionID、时间戳、事件类型以及有关交互的任何其它数据，如分类元数据。只有 Next-Best-Action 配方才使用此数据类型。

上下文元数据

您在事件（例如单击）发生时收集的有关用户浏览上下文（例如使用的设备或位置）的交互数据。上下文元数据可以改善新用户和现有用户的建议相关性。

数据集

用于存放您上传到 Amazon Personalize 的数据的容器。Amazon Personalize 数据集有五种类型：用户、项目、项目交互数据集、操作交互数据集和操作。

数据集组

Amazon Personalize 资源的容器，包括数据集、域推荐器和自定义资源。数据集组将资源组织到独立的集合中，在其中，一个数据集组中的资源不会影响任何其他数据集组中的资源。数据集组可以是域数据集组，也可以是自定义数据集组。

域数据集组

一个数据集组，包含针对不同业务域和使用案例的预配置资源。Amazon Personalize 负责管理训练模型和部署的生命周期。创建域数据集组时，您可以选择业务域，导入数据，并为每个使用案例创建推荐器。您可以在应用程序中使用推荐器，通过 GetRecommendations 操作获取建议。

如果您从域数据集组开始，则仍然可以添加自定义资源，例如解决方案和解决方案版本，这些版本使用自定义使用案例食谱进行训练。

自定义数据集组

仅包含自定义资源的数据集组，包括解决方案、解决方案版本、筛选器、市场活动和批量推理作业。您可以使用市场活动，通过 GetRecommendations 操作获取建议。您负责管理训练模型和部署的生命周期。如果您从自定义数据集组开始，则以后无法将其与域相关联。相反，创建新的域数据集组。

数据集导出作业

一种记录导出工具，可将数据集中的记录输出到 Amazon S3 存储桶中的一个或多个 CSV 文件。输出 CSV 文件包括标题行，其列名称与数据集架构中的字段相匹配。

数据集导入作业

一种批量导入工具，可使用来自 Amazon S3 存储桶中 CSV 文件的数据填充您的 Amazon Personalize 数据集。

事件

您记录并上传到 Amazon Personalize 物品交互数据集的用户操作（如单击、购买或视频观看）。您可以通过 Amazon Personalize 控制台以增量方式从 CSV 文件中实时批量导入事件。

显式展示

您手动添加到 Amazon Personalize 物品交互数据集的物品列表。不同于隐式展示（Amazon Personalize 自动从建议数据中派生此类展示），您可以选择要在显式展示中包含的物品。

隐式展示

您的应用程序向用户显示的建议。不同于显式展示（手动将此类展示添加到物品交互数据集），Amazon Personalize 自动从您的建议数据派生隐式展示。

展示数据

当用户与特定物品进行交互（例如单击、观看或购买等）时，您向其展示的物品列表。Amazon Personalize 根据用户选择或忽略同一物品的频率，使用展示数据计算新物品对用户的相关性。

交互数据集

用于保存从用户和物品（称为事件）之间的交互中收集的历史数据和实时数据的容器。交互数据包括事件类型数据和上下文元数据。

物品数据集

用于保存物品相关元数据（例如价格、类型或可用性）的容器。

重复频率

一种可以导入到操作数据集的操作元数据。重复频率数据根据用户在您的操作交互数据集中的历史记录，指定 Amazon Personalize 在用户与特定操作交互后应等待多少天才能建议该操作。

架构

Apache Avro 格式的 JSON 对象，用于向 Amazon Personalize 告知您的数据结构。Amazon Personalize 使用您的架构来解析您的数据。

用户数据集

用于保存用户相关元数据（例如年龄、性别或会员资格）的容器。

以下术语与在 Amazon Personalize 中训练模型有关。

物品间相似度 (SIMS) 配方: RELATED_ITEMS 食谱，使用交互数据集中的数据为类似于指定物品的物品生成建议。SIMS 食谱根据用户与物品进行交互的方式而不是匹配物品元数据（如价格或颜色）计算相似度。
item-affinity: USER_SEGMENTATION 配方，它使用来自物品交互数据集和物品数据集的数据，根据用户与物品交互的可能性为您指定的每个物品创建用户细分。
item-attribute-affinity: USER_SEGMENTATION 配方，它使用来自物品交互数据集和物品数据集的数据，根据用户与带有属性的物品交互的可能性为您指定的每个物品属性创建用户细分。
Next-Best-Action 配方: 此配方为您的用户生成下一个最佳操作的实时推荐。用户的下一个最佳操作是他们最有可能采取的操作。例如，注册您的忠诚度计划、下载您的应用或申请信用卡。有关更多信息，请参阅 Next-Best-Action 配方。
Personalized-Ranking-v2 配方: PERSONALIZED_RANKING 食谱，根据特定用户的预测兴趣级别对您提供的一系列物品进行排名。此配方使用基于转换器的架构来训练模型，该模型可以从物品交互数据、物品元数据和用户元数据中学习。使用 Personalized-Ranking-v2 配方，可对针对特定用户个性化的物品或搜索结果的精选列表顺序进行个性化设置。它可对多达 500 万个物品进行训练并生成更相关的推荐，延迟比之前版本更低。
个性化-排名配方: PERSONALIZED_RANKING 食谱，根据特定用户的预测兴趣级别对您提供的一系列物品进行排名。使用 personalized-ranking 食谱，可对针对特定用户个性化的物品或搜索结果的精选列表顺序进行个性化设置。
热门程度-计数配方: USER_PERSONALIZATION 配方，用于推荐与唯一用户交互最多的物品。
推荐器: 用于生成建议的域数据集组工具。您可以为域数据集组创建推荐器，并在应用程序中使用它通过 GetRecommendations API 获取实时建议。创建推荐器时，您需指定一个使用案例，然后 Amazon Personalize 通过使用案例的最佳配置，训练支持推荐器的模型。
recipe: 一种预先配置的 Amazon Personalize 算法，用于预测用户将与之进行交互的物品（对于 USER_PERSONALIZATION 食谱），或计算与用户表示感兴趣的特定物品类似的物品（对于 RELATED_ITEMS 食谱），或根据特定用户的预测兴趣对您提供的一系列物品进行排名（对于 PERSONALIZED_RANKING 食谱）。
解决方案: Amazon Personalize 用来生成建议的食谱、自定义参数和经过训练的模型（解决方案版本）。
解决方案版本: 作为 Amazon Personalize 解决方案的一部分创建的经过训练的模型。您可以在市场活动中部署解决方案版本以激活用于请求建议的个性化 API。
训练模式: 创建解决方案版本时要执行的训练的范围。有以下两种不同的模式：“完整”和“更新”。完整模式基于数据集组中数据集的全部训练数据，创建一个全新的解决方案版本。更新模式以增量方式更新现有解决方案版本，以推荐自上次训练以来添加的新物品。

注意
使用 User-Personalization-v2、User-Personalization 或 Next-Best-Action 时，Amazon Personalize 自动更新在完整训练模式下训练的最新解决方案版本。请参阅自动更新。
User-Personalization-v2 配方: USER_PERSONALIZATION 配方根据用户的偏好推荐用户将与之交互的物品。此配方使用基于转换器的架构来训练模型，该模型可以从物品交互数据、物品元数据和用户元数据中学习。它可对多达 500 万个物品进行训练并生成更相关的推荐，延迟比之前版本更低。
User-Personalization 食谱: 基于分层递归神经网络 (HRNN) 的 USER_PERSONALIZATION 食谱，可预测用户将与之交互的物品。用户-个性化配方可以使用物品浏览和展示数据生成有关新物品的推荐。

以下术语与部署和使用模型生成推荐相关。

操作优化期: Amazon Personalize 在预测用户最有可能采取的操作时使用的时间段。例如，如果操作优化期为 14 天，Amazon Personalize 预测用户在接下来的 14 天内最有可能采取的操作。使用 Next-Best-Action 配方创建解决方案时，您可以配置操作优化期。
批量推理作业: 一种工具，可从 Amazon S3 存储桶导入您的批量输入数据，使用您的解决方案版本生成建议，并将建议导出到 Amazon S3 存储桶。我们建议使用不同的输出数据位置（文件夹或其他 Amazon S3 存储桶）。使用批量推理作业，针对不需要实时更新的大型数据集获取建议。
批量细分作业: 一种工具，可从 Amazon S3 存储桶导出批量输入数据，使用您的解决方案版本创建用户细分，并将用户细分导出到 Amazon S3 存储桶。我们建议使用不同的输出数据位置（文件夹或其他 Amazon S3 存储桶）。通过由 USER_SEGMENTATION 食谱支持的解决方案使用批量细分作业，根据用户与不同物品或具有不同物品属性的物品交互的可能性来创建用户细分。
市场活动: 部署的解决方案版本（经过训练的模型），具有预调配的专用事务容量，用于为您的应用程序用户创建实时建议。创建市场活动后，您可以使用 getRecommendations 或 getPersonalizedRanking API 操作来获取建议。
物品浏览: 在浏览中，建议包括一些通常不太可能向用户建议的物品或操作，例如新物品或操作、交互量很少的物品或操作，或者根据用户以前的行为与用户不太相关的物品或操作。
指标归因: 您用来衡量物品推荐所产生影响的工具。指标归因可根据您导入的物品交互和物品数据以及您指定的指标创建报告。例如，用户观看的影片总时长或单击事件的总数。
建议: Amazon Personalize 预测用户将与之交互的物品列表。根据所使用的 Amazon Personalize 食谱，建议可以是物品列表（使用 USER_PERSONALIZATION 食谱和 RELATED_ITEMS 食谱），也可以是您提供的一系列物品的排名（使用 PERSONALIZED_RANKING 食谱）。
用户细分: Amazon Personalize 预测用户将与您的目录交互的用户列表。根据所使用的 USER_SEGMENTATION 食谱，您可以根据物品（Item-Affinity 食谱）和物品元数据（Item-Attribute-Affinity 食谱）创建用户细分。您可以使用批量细分作业来创建用户细分。

主题

数据导入和管理

训练

注意

模型部署和建议