本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
入门先决条件
以下步骤是入门练习的先决条件。
-
设置权限,让 Amazon Personalize 可以代表您访问您的资源。这包括为 Amazon Personalize 创建服务角色,并通过IAM策略向其授予访问亚马逊个性化资源的权限。有关更多信息,请参阅 向 Amazon Personalize 授予访问资源的权限。
-
准备您的训练数据并将该数据上传到 Amazon S3 存储桶:
-
有关域数据集组教程,请参阅创建训练数据(域数据集组)。
-
有关自定义数据集组教程,请参阅创建训练数据(自定义数据集组)。
-
-
向您的 Amazon Personalize 服务角色授予访问 Amazon S3 资源的权限,如向 Amazon Personalize 授予访问 Amazon S3 资源的权限中所述。
创建训练数据(域数据集组)
要创建训练数据,请下载、修改电影评级数据,并将此数据保存到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,向 Amazon Personalize 提供从存储桶进行读取的权限。
创建训练数据
-
下载并解压缩电影分级 zip 文件,ml-latest-small.zip
来自MovieLens 教育和发展的推荐文件(F. Maxwell Harper 和 Joseph A. Konstan。2015 年。 MovieLens 数据集:历史和背景。 ACM交互式智能系统 (TII) 上的交易 5、4:19:1 — 19:19。https://doi.org/10.1145/2827872)。 -
打开
ratings.csv
文件。此文件包含本教程的交互数据。-
删除评级 列。
-
将
userId
和movieId
列分别重命名为USER_ID
和ITEM_ID
。 -
添加一个 EVENT _ TYPE 列,将每条记录的值设置为
watch
。如果你使用的是 Microsoft Excel,则可以在列的第一个单元格watch
中输入,然后双击该单元格的右下角,从而为每条记录设置 EVENT _ TYPE。您的标题应如下所示:USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE
这些列必须与所示内容完全相同,Amazon Personalize 才能识别数据。数据的前几行应如下所示:
USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....
保存
ratings.csv
文件。 -
-
将
ratings.csv
上传到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的使用拖放功能上传文件和文件夹。 -
向 Amazon Personalize 提供在存储桶中读取数据的权限。有关更多信息,请参阅 向 Amazon Personalize 授予访问 Amazon S3 资源的权限。
创建训练数据(自定义数据集组)
要创建训练数据,请下载、修改电影评级数据,并将此数据保存到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,向 Amazon Personalize 提供从存储桶进行读取的权限。
-
下载并解压缩电影分级 zip 文件,ml-latest-small.zip
来自MovieLens 教育和发展的推荐文件(F. Maxwell Harper 和 Joseph A. Konstan。2015 年。 MovieLens 数据集:历史和背景。 ACM交互式智能系统 (TII) 上的交易 5、4:19:1 — 19:19。https://doi.org/10.1145/2827872)。 -
打开
ratings.csv
文件。此文件包含本教程的交互数据。-
删除评级 列。
-
使用以下内容替换标题行:
USER_ID,ITEM_ID,TIMESTAMP
这些标题必须与所示内容完全相同,Amazon Personalize 才能识别数据。
保存
ratings.csv
文件。 -
-
将
ratings.csv
上传到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的使用拖放功能上传文件和文件夹。 -
向 Amazon Personalize 提供在存储桶中读取数据的权限。有关更多信息,请参阅 向 Amazon Personalize 授予访问 Amazon S3 资源的权限。