将数据导入域数据集组数据集 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将数据导入域数据集组数据集

创建域数据集组和一个或多个数据集之后,您就可以将数据导入 Amazon Personalize。导入数据时,可以选择批量导入记录、单独导入记录或两者导入记录,具体取决于业务需求和收集的历史数据量。如果您有大量历史记录,我们建议您首先批量导入数据,然后随着目录的增长以增量方式添加数据。保持数据最新有助于保持建议的相关性。如果你完成创建域数据集组,您可能已经导入了历史交互数据。

导入批量记录

重要

Amazon Personalize 中的批量导入是对批量数据的完全刷新。数据集中的现有批量数据将被替换。这不包括以增量方式导入的记录。

使用数据集导入任务将批量记录导入到 Amazon Personalize 数据集中。一个数据集导入作业是一种批量导入工具,用 Amazon S3 存储桶中的数据填充数据集。您可以使用 Amazon Personalize 控制台创建数据集导入任务并导入批量记录,Amazon Command Line Interface(Amazon CLI),或Amazon开发工具包。

在域数据集组中为数据集创建数据集导入作业的方式与自定义数据集组中的数据集的方式相同。有关分步说明,请参阅使用数据集导入作业导入批量记录.

以增量方式导入记录

创建 Domain 数据集组和数据集之后,可以增量导入一条或多条新记录,包括交互事件、用户或项目转移到现有数据集中。以增量方式导入记录允许您随着目录的增长将一条或多条记录导入 Amazon Personalize 数据集。

筛选增量记录导入的更新

Amazon Personalize 会在上次增量导入后 20 分钟内使用新的互动、项目和用户数据更新您在数据集组中创建的任何筛选器。此更新允许你的广告活动在筛选用户的推荐时使用你的最新数据。

新记录如何影响推荐

如果您已经创建了解决方案版本(训练了模型),则新记录会影响建议,如下所示:

  • 适用于新活动,Amazon Personalize 在为同一用户生成推荐时,立即使用用户与现有物品(您用于训练最新模型的数据中包含的物品)之间的历史和实时互动事件。您使用 Amazon Personalize 化控制台导入的历史事件以及您以相同的方式实时记录影响力推荐的事件。有关更多信息,请参阅实时事件如何影响推荐

  • 适用于新物品,如果您使用用户个性化训练了解决方案版本,则 Amazon Personalize 会每两小时自动更新模型。每次更新后,新项目都可以包含在探索推荐中。有关探索的信息,请参阅用户个性化配方.

    对于任何其他配方,您必须重新训练模型,以便将其包括在推荐中的新项目。

  • 适用于新用户,最初推荐仅适用于热门商品。从第一个活动开始,记录事件时,用户推荐将更加相关。有关更多信息,请参阅记录事件

您使用 Amazon Personalize 化控制台以增量方式导入记录,Amazon CLI,或者Amazon开发工具包。您可以按增量方式导入 Domain 数据集组中的数据集的记录,与以增量方式导入自定义数据集组记录的方式相同。有关分步说明,请参阅以增量方式导入记录.