入门先决条件 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门先决条件

以下步骤是入门练习的先决条件。

  1. 设置权限,以便 Amazon Personalize 可以代表您访问您的资源。这包括为 Amazon Personalize 创建服务角色,并通过 IAM 策略授予其访问Amazon Personalize 资源的权限。有关更多信息,请参阅 授予Amazon Personalize 访问您的Amazon Personalize 资源的权限

  2. 准备训练数据并将数据上传到 Amazon S3 存储桶:

  3. 授予您的 Amazon Personalize 服务角色访问您的 Amazon S3 资源的权限,如中所述为Amazon Personalize 授予 Amazon S3 资源的访问

创建训练数据(域数据集组)

要创建训练数据,请将电影分级数据下载到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后授予 Amazon Personalize 从存储桶中读取的权限。

创建训练数据
  1. 下载并解压缩电影分级 zip 文件,即 ml-latest-small.zip 文件,取自MovieLens以下推荐用于教育和发展(F. Maxwell Harp er 和 Joseph A. Konstan。2015 年)。 MovieLens 数据集:历史和背景。 ACM 交互式智能系统 (TII) 交易 5, 4:19:1 — 19:19。https://doi.org/10.1145/2827872)。

  2. 打开 ratings.csv 文件。此文件包含本教程的交互数据。

    1. 删除评级 列。

    2. userIdmovieIdITEM_ID分别重命名为USER_ID和。

    3. 添加 EVENT_TYPE 列,将每条记录的值设置为watch。如果你使用的是 Microsoft Excel,你可以为每条记录设置 EVENT_TYPE,方法是输入watch该列的第一个单元格,然后双击该单元格的右下角。您的标题应如下所示:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE

      这些列必须与显示的完全一致,Amazon Personalize 才能识别数据。数据的前几行应如下所示:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....

    保存 ratings.csv 文件。

  3. 上传ratings.csv到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon S imple Storage Service 用户指南》中的拖放上传文件和文件夹

  4. 授予 Amazon Personalize 读取存储桶中数据的权限。有关更多信息,请参阅为Amazon Personalize 授予 Amazon S3 资源的访问

创建训练数据(自定义数据集组)

要创建训练数据,请将电影分级数据下载到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后授予 Amazon Personalize 从存储桶中读取的权限。

  1. 下载并解压缩电影分级 zip 文件,即 ml-latest-small.zip 文件,取自MovieLens以下推荐用于教育和发展(F. Maxwell Harp er 和 Joseph A. Konstan。2015 年)。 MovieLens 数据集:历史和背景。 ACM 交互式智能系统 (TII) 交易 5, 4:19:1 — 19:19。https://doi.org/10.1145/2827872)。

  2. 打开 ratings.csv 文件。此文件包含本教程的交互数据。

    1. 删除评级 列。

    2. 使用以下内容替换标题行:

      USER_ID,ITEM_ID,TIMESTAMP

      这些标题必须与显示的完全一致,Amazon Personalize 才能识别数据。

    保存 ratings.csv 文件。

  3. 上传ratings.csv到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon S imple Storage Service 用户指南》中的拖放上传文件和文件夹

  4. 授予 Amazon Personalize 读取存储桶中数据的权限。有关更多信息,请参阅为Amazon Personalize 授予 Amazon S3 资源的访问