创建域数据集组并导入交互数据(控制台) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建域数据集组并导入交互数据(控制台)

创建域数据集组时,您可以选择域、创建架构和交互数据集,然后导入历史数据。如果您没有历史数据,可以选择以后以增量方式记录交互数据。

创建交互数据集时,您可以选择为域使用默认架构并对其进行自定义,或者选择预先存在的架构。架构允许 Amazon Personalize 化读取您的数据。使用字段及其类型作为指南,以确定要导入 Amazon Personalize 化的数据。有关默认架构的更多信息,请参阅域数据集和架构

第 1 步:创建域数据集组

创建域数据集组,然后使用 Amazon Personalize 控制台选择您的域,如下所示。

创建域数据集组

  1. 从打开 Amazon Personalize 控制台https://console.aws.amazon.com/personalize/home然后登录您的账户。

  2. 选择 Create dataset group (创建数据集组)

  3. In数据集组详情,对于名称中,指定您的数据集组的名称。

  4. 适用于数据集组域,选择电商创建电子商务域数据集组,或者选择点播视频以创建 VIDEO_ON_DEMENT 域数据集组。您选择的域决定了导入数据时将使用的默认架构,并决定了推荐者可用的使用案例。

  5. 适用于标签,可选添加任何标签。有关标记 Amazon Personalize 资源的更多信息,请参阅为 AAmazon Personalize son.

  6. 选择继续创建数据集组并继续. 这些区域有:创建交互数据集此时将显示页。继续执行第 2 步:创建架构和交互数据集

第 2 步:创建架构和交互数据集

完成后第 1 步:创建域数据集组中,创建交互数据集以存储来自用户与目录中项目之间交互的数据。

创建架构和交互数据集

  1. 在存储库的创建交互数据集页面,数据集名称提供交互数据集的名称。

  2. 适用于数据集架构选择要使用的架构:

    • 选择通过修改域的现有默认模式来创建新的域架构如果要使用域的默认模式作为模板,请输入架构名称,然后可以选择添加任何字段。

    • 选择使用现有架构然后选择符合您的域名的现有架构。这些区域有:现有架构如果不存在符合条件的架构,则会禁用字段。

  3. 选择架构后,架构字段表更新以显示架构的字段。选择表格架构选项卡以修改表中的架构,或者选择JSON schema code选项卡来查看和修改架构的 JSON 代码。

  4. 对于表格架构中,使用以下字段修改模式。

    • 要添加自定义字段,请选择添加自定义字段按钮,然后为新字段命名并选择其类型。

    • 要删除可选字段和自定义字段,请选中该字段的复选框,然后选择Remove按钮。

  5. 如果您在 Amazon S3 的 CSV 文件中有批量数据,请确保您的数据与此处的架构定义匹配。您的 CSV 文件必须具有相同的数据列在架构定义并且每个字段必须具有相同的类型。

  6. 适用于标签,可选添加任何标签。有关标记 Amazon Personalize 资源的更多信息,请参阅为 AAmazon Personalize son.

  7. 选择 Next(下一步)。这些区域有:导入交互数据此时将显示页。继续执行第 3 步:导入交互数据

第 3 步:导入交互数据

完成后第 2 步:创建架构和交互数据集中,将您的交互数据从 Amazon S3 导入交互数据集中。如果 Amazon S3 中没有批量数据,则可以跳过此步骤,然后使用事件摄取 SDK 和PutEventsoperation. 有关更多信息,请参阅记录事件.

导入交互数据

  1. 在存储库的导入交互数据页面,数据导入源从以下选项之一中选择导入数据的方式:

    • 选择从 S3 导入批量数据如果您将批量历史数据存储在 Amazon S3 存储桶中。您的存储桶必须具有正确的权限。有关授予权限的更多信息,请参阅授予 Amazon S3 资源的个性化权限. 从 Amazon S3 导入数据后,您仍可以使用 API 以增量方式导入数据。

    • 或者选择使用 API 以增量方式数据如果您在 Amazon S3 中没有历史数据,并且想要使用事件摄取 SDK 和以增量方式导入交互数据PutEventsoperation. 如果您选择此选项,则需要在创建推荐者前收集数据,直到记录至少 1000 次交互。有关更多信息,请参阅记录事件.

  2. 适用于数据集导入作业名称,给你的导入作业命名。

  3. 适用于数据位置中,指定 Amazon 简单存储服务 (S3) 中的电影数据文件的存储位置。使用下面的语法:

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>

    注意

    如果 CSV 文件位于 S3 存储桶的文件夹中,并且您想将多个 CSV 文件上传到具有一个数据集导入作业的数据集,请使用此语法而不带 CSV 文件名。

  4. InIAM 角色,对于IAM 服务角色选择以下选项之一:

    • 选择创建并使用新的服务角色并提供服务角色名称使用AmazonPersonalizeFullAccess附加策略。

    • 如果您已创建了角色,请选择使用现有服务角色. 有关创建角色的信息,请参阅创建 IAM 角色.

  5. 选择导入数据导入数据。这些区域有:概述此时将显示域数据集组的页面。请注意导入的状态设置数据集部分。