将数据直接导入 Amazon Personalize 数据集 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将数据直接导入 Amazon Personalize 数据集

创建数据集后,您就可以将大型 CSV 文件中的批量记录导入到 Amazon Personalize 数据集了。

要将数据直接导入 Amazon Personalize 数据集,您需执行以下操作:

  1. 根据您的数据创建架构 JSON 文件。有关架构要求和示例,请参阅架构

  2. 确保数据格式正确。列名称必须与您的架构相匹配。数据必须保存在 CSV 文件中。有关数据格式指南,请参阅数据格式指南

  3. 将您的 CSV 文件上传至 Amazon Simple Storage Service (Amazon S3) 存储桶,然后向 Amazon Personalize 授予对 Amazon S3 资源的访问权限。

  4. 使用第一步中的 JSON 文件创建 Amazon Personalize 架构。然后创建一个 Amazon Personalize 数据集。

  5. 创建通过 Amazon S3 存储桶中的数据填充数据集的数据集导入作业。要为交互数据集创建数据集导入作业,您的 CSV 文件必须至少有 1000 条交互记录。

将数据导入 Amazon Personalize 数据集后,您可以对其进行分析,将其导出到 Amazon S3 存储桶,对其进行更新,或者通过删除数据集将其删除。有关更多信息,请参阅管理数据