本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
处理数据并将其导入 Amazon Personalize
当您完成数据分析和转换后,就可以对其进行处理并将其导入 Amazon Personalize 了。
-
处理数据 - 处理数据会将转换应用于整个数据集并将其输出到您指定的目的地。在这种情况下,您可以指定 Amazon S3 存储桶。
-
将数据导入 Amazon P ersonalize — 要将处理过的数据导入亚马逊个性化,您需要运行 A SageMaker I Studio Classic 中提供的 Jupyter 笔记本。此笔记本可创建您的 Amazon Personalize 数据集并将您的数据导入其中。
处理数据
在将数据导入 Amazon Personalize 之前,您必须将转换应用于整个数据集并将其输出到 Amazon S3 存储桶。为此,您需要创建一个目标节点,并将目标设置为 Amazon S3 存储桶,然后启动转换的处理作业。
有关指定目标和启动流程任务的 step-by-step说明,请参阅使用 Amazon A SageMaker I Data Wrangler 点击几下即可启动处理任务
处理完数据后,您就可以将其从 Amazon S3 存储桶导入到 Amazon Personalize 了。
将数据导入 Amazon Personalize
处理完数据后,即可将其导入 Amazon Personalize。要将处理后的数据导入 Amazon Personalize,您需要运行 A SageMaker I Studio Classic 中提供的 Jupyter 笔记本。此笔记本可创建您的 Amazon Personalize 数据集并将您的数据导入其中。
将处理过的数据导入 Amazon Personalize
-
对于要导出的转换,选择导出到,然后选择 Amazon Personalize(通过 Jupyter 笔记本)。
-
修改笔记本,以指定您用作处理作业数据目标的 Amazon S3 存储桶。(可选)为您的数据集组指定域。默认情况下,笔记本会创建自定义数据集组。
-
查看创建架构的笔记本单元格。在运行单元格之前,验证架构字段是否具有预期的类型和属性。
-
验证支持空数据的字段是否在类型列表中列出了
null
。以下示例说明了如何为字段添加null
。{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }
-
验证分类字段的类别属性是否设置为 true。以下示例说明了如何标记字段类别。
{ "name": "SUBSCRIPTION_MODEL", "type": "string", "categorical": true }
-
验证文本字段的文本属性是否设置为 true。以下示例说明了如何将字段标记为文本。
{ "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true }
-
-
运行笔记本以创建架构,创建数据集,然后将您的数据导入 Amazon Personalize 数据集。你可以像 SageMaker AI Studio Classic 之外的笔记本电脑一样运行笔记本电脑。有关运行 Jupyter 笔记本的信息,请参阅运行代码
。有关 SageMaker AI Studio Classic 中笔记本电脑的信息,请参阅亚马逊 SageMaker AI 开发者指南中的使用亚马逊 SageMaker AI 笔记本电脑。 完成笔记本后,如果您导入了交互数据,则可以创建推荐器或自定义资源。或者,您可以对物品数据集或用户数据集重复该过程。
-
有关创建域推荐器的信息,请参阅Amazon Personalize 中的域推荐器。
-
有关创建和部署自定义资源的信息,请参阅用于训练和部署 Amazon Personalize 模型的自定义资源。
-