本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
入门先决条件
以下步骤是入门练习的先决条件。
-
设置权限,以便 Amazon Personalize 可以代表您访问您的资源。这包括为 Amazon Personalize 创建服务角色,并通过 IAM 策略授予其访问Amazon Personalize 资源的权限。有关更多信息,请参阅 授予Amazon Personalize 访问您的Amazon Personalize 资源的权限。
-
准备训练数据并将数据上传到 Amazon S3 存储桶:
-
有关域数据集组教程,请参阅创建训练数据(域数据集组)。
-
有关自定义数据集组教程,请参阅创建训练数据(自定义数据集组)。
-
-
授予您的 Amazon Personalize 服务角色访问您的 Amazon S3 资源的权限,如中所述为Amazon Personalize 授予 Amazon S3 资源的访问。
创建训练数据(域数据集组)
要创建训练数据,请将电影分级数据下载到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后授予 Amazon Personalize 从存储桶中读取的权限。
创建训练数据
-
下载并解压缩电影分级 zip 文件,即 ml-latest-small.zip 文件,取自MovieLens
以下推荐用于教育和发展(F. Maxwell Harp er 和 Joseph A. Konstan。2015 年)。 MovieLens 数据集:历史和背景。 ACM 交互式智能系统 (TII) 交易 5, 4:19:1 — 19:19。https://doi.org/10.1145/2827872)。 -
打开
ratings.csv
文件。此文件包含本教程的交互数据。-
删除评级 列。
-
将
userId
和movieId
列ITEM_ID
分别重命名为USER_ID
和。 -
添加 EVENT_TYPE 列,将每条记录的值设置为
watch
。如果你使用的是 Microsoft Excel,你可以为每条记录设置 EVENT_TYPE,方法是输入watch
该列的第一个单元格,然后双击该单元格的右下角。您的标题应如下所示:USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE
这些列必须与显示的完全一致,Amazon Personalize 才能识别数据。数据的前几行应如下所示:
USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE 1,1,964982703,watch 1,3,964981247,watch 1,6,964982224,watch 1,47,964983815,watch 1,50,964982931,watch .... ....
保存
ratings.csv
文件。 -
-
上传
ratings.csv
到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon S imple Storage Service 用户指南》中的拖放上传文件和文件夹。 -
授予 Amazon Personalize 读取存储桶中数据的权限。有关更多信息,请参阅为Amazon Personalize 授予 Amazon S3 资源的访问:
创建训练数据(自定义数据集组)
要创建训练数据,请将电影分级数据下载到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后授予 Amazon Personalize 从存储桶中读取的权限。
-
下载并解压缩电影分级 zip 文件,即 ml-latest-small.zip 文件,取自MovieLens
以下推荐用于教育和发展(F. Maxwell Harp er 和 Joseph A. Konstan。2015 年)。 MovieLens 数据集:历史和背景。 ACM 交互式智能系统 (TII) 交易 5, 4:19:1 — 19:19。https://doi.org/10.1145/2827872)。 -
打开
ratings.csv
文件。此文件包含本教程的交互数据。-
删除评级 列。
-
使用以下内容替换标题行:
USER_ID,ITEM_ID,TIMESTAMP
这些标题必须与显示的完全一致,Amazon Personalize 才能识别数据。
保存
ratings.csv
文件。 -
-
上传
ratings.csv
到 Amazon S3 存储桶。有关更多信息,请参阅《Amazon S imple Storage Service 用户指南》中的拖放上传文件和文件夹。 -
授予 Amazon Personalize 读取存储桶中数据的权限。有关更多信息,请参阅为Amazon Personalize 授予 Amazon S3 资源的访问: