入门先决条件 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门先决条件

以下步骤是入门练习的先决条件。

  1. 设置权限,让 Amazon Personalize 可以代表您访问您的资源。这包括为 Amazon Personalize 创建服务角色,并通过IAM策略向其授予访问亚马逊个性化资源的权限。有关更多信息,请参阅 向 Amazon Personalize 授予访问资源的权限

  2. 准备您的训练数据并将该数据上传到 Amazon S3 存储桶:

  3. 向您的 Amazon Personalize 服务角色授予访问 Amazon S3 资源的权限,如向 Amazon Personalize 授予访问 Amazon S3 资源的权限中所述。

创建训练数据(域数据集组)

要创建训练数据,请下载、修改电影评级数据,并将此数据保存到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,向 Amazon Personalize 提供从存储桶进行读取的权限。

创建训练数据
  1. 下载并解压缩电影分级 zip 文件,ml-latest-small.zip 来自MovieLens教育和发展的推荐文件(F. Maxwell Harper 和 Joseph A. Konstan。2015 年。 MovieLens 数据集:历史和背景。 ACM交互式智能系统 (TII) 上的交易 5、4:19:1 — 19:19。https://doi.org/10.1145/2827872)。

  2. 打开 ratings.csv文件。此文件包含本教程的交互数据。

    1. 删除评级 列。

    2. userIdmovieId 列分别重命名为 USER_IDITEM_ID

    3. 添加一个 EVENT _ TYPE 列,将每条记录的值设置为watch。如果你使用的是 Microsoft Excel,则可以在列的第一个单元格watch中输入,然后双击该单元格的右下角,从而为每条记录设置 EVENT _ TYPE。您的标题应如下所示:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE

      这些列必须与所示内容完全相同,Amazon Personalize 才能识别数据。数据的前几行应如下所示:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....

    保存 ratings.csv 文件。

  3. ratings.csv 上传到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的使用拖放功能上传文件和文件夹

  4. 向 Amazon Personalize 提供在存储桶中读取数据的权限。有关更多信息,请参阅 向 Amazon Personalize 授予访问 Amazon S3 资源的权限

创建训练数据(自定义数据集组)

要创建训练数据,请下载、修改电影评级数据,并将此数据保存到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,向 Amazon Personalize 提供从存储桶进行读取的权限。

  1. 下载并解压缩电影分级 zip 文件,ml-latest-small.zip 来自MovieLens教育和发展的推荐文件(F. Maxwell Harper 和 Joseph A. Konstan。2015 年。 MovieLens 数据集:历史和背景。 ACM交互式智能系统 (TII) 上的交易 5、4:19:1 — 19:19。https://doi.org/10.1145/2827872)。

  2. 打开 ratings.csv文件。此文件包含本教程的交互数据。

    1. 删除评级 列。

    2. 使用以下内容替换标题行:

      USER_ID,ITEM_ID,TIMESTAMP

      这些标题必须与所示内容完全相同,Amazon Personalize 才能识别数据。

    保存 ratings.csv 文件。

  3. ratings.csv 上传到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的使用拖放功能上传文件和文件夹

  4. 向 Amazon Personalize 提供在存储桶中读取数据的权限。有关更多信息,请参阅 向 Amazon Personalize 授予访问 Amazon S3 资源的权限