入门先决条件 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门先决条件

以下步骤是入门练习的先决条件。

  1. 创建 Amazon 账户和 Amazon Identity and Access Management 用户,如注册Amazon 中所述。

  2. 创建 IAM 策略,为用户和 Amazon Personalize 化您的 Amazon 个性化资源提供完全访问权限。然后,将策略附加到您的 Amazon Personalize elage Service 用户或组。请参阅 创建新 IAM 策略

  3. 创建Amazon Identity and Access Management(IAM) 服务角色,如中所述创建 Amazon Personalize 的 IAM 角色. 在上传电影训练数据时使用该角色 ARN。

  4. 准备您的训练数据并将此数据上传到 Amazon S3 存储桶:

  5. 向您的 Amazon Personalize 服务角色授予访问 Amazon S3 资源的权限,如中所述为 Amazon S3 资源授予针对 Amazon S3 资源的访问.

创建训练数据(域数据集组)

要创建训练数据,请下载、修改电影评级数据并将此数据保存到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,向 Amazon Personalize 授予从存储桶进行读取的权限。

要创建训练数据,请执行

  1. 下载电影评级 zip 文件,ml-latest-small.zipMovieLens(在推荐用于教育和发展)。解压缩该文件。用户交互数据位于名为 ratings.csv 的文件中。

  2. 打开ratings.csv文件并按如下方式修改数据:

    1. 删除评级 列。

    2. userIdmovieId要使用的列USER_IDITEM_ID

    3. 添加一个 EVENT_TYPE 列,将每条记录的值设置为watch. 如果你使用的是微软 Excel,你可以通过输入来为每条记录设置 EVENT_TYPEwatch在列的第一个单元格中,然后双击单元格的右下角。你的标题应该是以下内容:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE

      这些列必须与所示内容完全相同 Amazon Personalize 才能识别数据。您的数据的前几行应如下所示:

      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....

    保存 ratings.csv 文件。

  3. 上传ratings.csv到 Amazon S3 存储桶。有关更多信息,请参阅 。使用拖放方式上传文件和文件夹(Amazon Simple Storage Service 用户指南)。

  4. 向 Amazon Personalize elation 授予读取存储桶中的数据的权限。有关更多信息,请参阅 为 Amazon S3 资源授予针对 Amazon S3 资源的访问

创建训练数据(自定义数据集组)

要创建训练数据,请下载、修改电影评级数据并将此数据保存到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,向 Amazon Personalize 授予从存储桶进行读取的权限。

  1. 下载电影评级 zip 文件,ml-latest-small.zipMovieLens(在推荐用于教育和发展)。解压缩该文件。用户交互数据位于名为 ratings.csv 的文件中。

  2. 打开 ratings.csv 文件。

    1. 删除评级 列。

    2. 使用以下内容替换标题行:

      USER_ID,ITEM_ID,TIMESTAMP

      这些标题必须与所示内容完全相同,才能识别数据。

    保存 ratings.csv 文件。

  3. 上传ratings.csv到 Amazon S3 存储桶。有关更多信息,请参阅 。使用拖放方式上传文件和文件夹(Amazon Simple Storage Service 用户指南)。

  4. 向 Amazon Personalize elation 授予读取存储桶中的数据的权限。有关更多信息,请参阅 为 Amazon S3 资源授予针对 Amazon S3 资源的访问