处理数据并将其导入 Amazon Personalize

当您完成数据分析和转换后，就可以对其进行处理并将其导入 Amazon Personalize 了。

处理数据 - 处理数据会将转换应用于整个数据集并将其输出到您指定的目的地。在这种情况下，您可以指定 Amazon S3 存储桶。
将数据导入 Amazon P ersonalize — 要将处理过的数据导入亚马逊个性化，您需要运行 A SageMaker I Studio Classic 中提供的 Jupyter 笔记本。此笔记本可创建您的 Amazon Personalize 数据集并将您的数据导入其中。

处理数据

在将数据导入 Amazon Personalize 之前，您必须将转换应用于整个数据集并将其输出到 Amazon S3 存储桶。为此，您需要创建一个目标节点，并将目标设置为 Amazon S3 存储桶，然后启动转换的处理作业。

有关指定目标和启动流程任务的 step-by-step说明，请参阅使用 Amazon A SageMaker I Data Wrangler 点击几下即可启动处理任务。添加目标时，选择 Amazon S3。将处理过的数据导入 Amazon Personalize 时，您将使用此位置。

处理完数据后，您就可以将其从 Amazon S3 存储桶导入到 Amazon Personalize 了。

将数据导入 Amazon Personalize

处理完数据后，即可将其导入 Amazon Personalize。要将处理后的数据导入 Amazon Personalize，您需要运行 A SageMaker I Studio Classic 中提供的 Jupyter 笔记本。此笔记本可创建您的 Amazon Personalize 数据集并将您的数据导入其中。

将处理过的数据导入 Amazon Personalize

对于要导出的转换，选择导出到，然后选择 Amazon Personalize（通过 Jupyter 笔记本）。
修改笔记本，以指定您用作处理作业数据目标的 Amazon S3 存储桶。（可选）为您的数据集组指定域。默认情况下，笔记本会创建自定义数据集组。
查看创建架构的笔记本单元格。在运行单元格之前，验证架构字段是否具有预期的类型和属性。
- 验证支持空数据的字段是否在类型列表中列出了 null。以下示例说明了如何为字段添加 null。
```
{
  "name": "GENDER",
  "type": [
    "null",
    "string"
  ],
  "categorical": true
}
```
- 验证分类字段的类别属性是否设置为 true。以下示例说明了如何标记字段类别。
```
{
          "name": "SUBSCRIPTION_MODEL",
          "type": "string",
          "categorical": true
}
```
- 验证文本字段的文本属性是否设置为 true。以下示例说明了如何将字段标记为文本。
```
{
      "name": "DESCRIPTION",
      "type": [
        "null",
        "string"
      ],
      "textual": true
}
```
运行笔记本以创建架构，创建数据集，然后将您的数据导入 Amazon Personalize 数据集。你可以像 SageMaker AI Studio Classic 之外的笔记本电脑一样运行笔记本电脑。有关运行 Jupyter 笔记本的信息，请参阅运行代码。有关 SageMaker AI Studio Classic 中笔记本电脑的信息，请参阅亚马逊 SageMaker AI 开发者指南中的使用亚马逊 SageMaker AI 笔记本电脑。

完成笔记本后，如果您导入了交互数据，则可以创建推荐器或自定义资源。或者，您可以对物品数据集或用户数据集重复该过程。
- 有关创建域推荐器的信息，请参阅Amazon Personalize 中的域推荐器。
- 有关创建和部署自定义资源的信息，请参阅用于训练和部署 Amazon Personalize 模型的自定义资源。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

生成可视化和数据见解

导入单个记录