准备和导入数据 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备和导入数据

Amazon Personalize 使用您提供的数据来训练模型。导入数据时,可以选择批量、单独或两者都导入记录。通过单独导入,您可以从实时活动中导入历史记录或数据。随着目录的增长,我们建议您完成额外的导入,以使您在 Amazon Personalize 中的数据保持最新状态。要获得实时推荐,请通过实时记录互动,使您的互动数据集与用户行为保持同步事件使用事件跟踪器和PutEvents操作。

对于所有配方,您的互动数据必须包含以下内容:

  • 至少有 1000 条来自与您目录中商品互动的用户的互动记录。这些互动可以来自批量导入或流媒体事件,或两者兼而有之。

  • 至少 25 个唯一用户 ID,每个用户至少有 2 次互动。

要将您的训练数据导入 Amazon Personalize,请执行以下操作:

  1. 创建空数据集组。数据集组是Amazon Personalize 组件的容器。有关更多信息,请参阅 步骤 1:创建自定义数据集组

  2. 对于您正在使用的每种类型的数据集,创建一个带有关联架构的空数据集。数据集Amazon Personalize 数据和架构容器是否会告诉 Amazon Personalize 你的数据结构。有关更多信息,请参阅 步骤 2:创建数据集和架构

  3. 导入数据:

本部分提供有关将 Amazon Personalizon Personazon 有关实时记录直播活动数据的信息,请参见记录事件.