准备和导入数据 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

准备和导入数据

Amazon Personalize 化使用您提供的数据来训练模型。导入数据时,可以选择批量导入记录,也可以选择以增量方式导入记录,或者两者都 通过增量导入,您可以根据业务需求添加单个历史记录或来自实时活动的数据,或两者都添加。

训练模型的最低数据要求如下:

  • 1000 条组合交互数据记录(过滤后,eventTypeeventValueThreshold,如果提供)。

  • 25 个独特用户,每个用户至少 2 个交互。

此部分提供有关将历史数据导入 Amazon Personalize 化的信息。有关记录实时交互数据的信息,请参阅记录事件.

要将历史训练数据导入到 Amazon Personalize 化,请执行以下操作:

  1. 创建空数据集组。数据集组是针对相关数据集的域特定容器。有关更多信息,请参阅 第 1 步:创建自定义数据集组

  2. 对于所使用的每种类型的数据集,请创建一个具有关联架构的空数据集。数据集是指定数据集内容的数据和架构的 Amazon Personalize 容器。有关更多信息,请参阅 第 2 步:创建数据集和架构

  3. 导入数据:

    • 使用数据集导入任务导入 Amazon S3 存储桶中存储的批量记录。请参阅 导入批量记录

    • 使用以增量方式导入记录AmazonPython 开发工具包或Amazon Command Line Interface(Amazon CLI)。请参阅 以增量方式导入记录