步骤 2:准备和导入数据 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

步骤 2:准备和导入数据

Amazon Personalize 使用您的数据为您的用户和用户细分生成建议。在您删除数据集之前,Amazon Personalize 会将您的数据存储在数据集中。对于所有使用案例(域数据集组)和配方(自定义资源),您的交互数据必须具有以下内容:

  • 至少 1000 条来自用户与您目录中的物品进行交互的物品交互记录。这些交互可以来自批量导入,也可以来自流事件,或者两者兼而有之。

  • 至少 25 个唯一的用户 ID,每位用户至少有两次物品交互。

为获得高质量的建议,我们建议您至少有 1000 名用户的最少 5 万次物品交互,每位用户有两次或更多次物品交互。

导入数据时,您可以选择批量、单独导入记录(或两者兼而有之)。

  • 批量导入涉及一次性导入大量历史记录。您可以使用 SageMaker Data Wrangler 与多个数据来源准备和导入物品交互、用户和物品批量数据。或者,您可以自己准备批量数据,然后将其从 Amazon S3 中的 CSV 文件直接导入 Amazon Personalize。有关如何设置 Amazon Personalize 批量数据格式的信息,请参阅数据格式指南

  • 对于个人导入,您可以通过 Amazon Personalize 控制台和 API 操作导入个人记录。或者,您可以从实时事件中实时导入交互数据。

将数据导入 Amazon Personalize 数据集后,您可以对其进行分析,将其导出到 Amazon S3 存储桶,对其进行更新,或者通过删除数据集将其删除。有关更多信息,请参阅管理数据

随着目录的增长,使用额外批量或单个数据导入操作来更新历史数据。要获得实时建议,请将您的物品交互数据集与用户的行为保持同步。为此,您可以使用事件跟踪器和 PutEvents 操作记录实时交互事件。有关更多信息,请参阅记录事件