准备和导入数据 - Amazon Personalize
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备和导入数据

Amazon Personalize 使用您提供的数据来训练模型。导入数据时,可以选择批量导入记录或增量导入记录,或两者都导入记录。通过增量导入,您可以根据您的业务需求添加单个历史记录或实时事件中的数据或两者。

本部分提供有关将历史数据导入 Amazon Personalize 的信息。有关记录实时交互数据的信息,请参阅记录事件

要将您的历史训练数据导入 Amazon Personalize,请执行以下操作:

  1. 创建空数据集组。数据集组是相关数据集的域特定容器。有关更多信息,请参阅第 1 步:创建数据集组

  2. 对于正在使用的每种类型的数据集,请创建一个具有关联方案的空数据集。数据集是指定数据集内容的 Amazon Personalize 数据和架构的容器。有关更多信息,请参阅第 2 步:创建数据集和方案

  3. 导入数据:

    • 使用数据集导入任务导入存储在 Amazon S3 存储桶中的批量记录。请参阅 导入批量记录

    • 以增量方式导入记录,使用AmazonPython 开发工具包或Amazon Command Line Interface(Amazon CLI)。请参阅 以增量方式导入记录