第 1 步:创建数据集组 - Amazon Personalize
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 1 步:创建数据集组

A数据集组是 Amazon Personalize 组件的容器,包括数据集、事件跟踪器、解决方案、筛选器、营销活动和批量推理作业。数据集组将资源组织到独立的集合中,因此来自一个数据集组的资源不能影响任何其他数据集组中的资源。例如,您可能有一个提供流式视频推荐的应用程序,还有一个提供有声电子书的推荐的应用程序。在 Amazon Personalize 中,每个应用程序都有自己的数据集组。您可以使用 Amazon Personalize 控制台创建数据集组,Amazon开发工具包,或Amazon Command Line Interface(Amazon CLI)。

创建数据集组(控制台)

通过在 Amazon Personalize 控制台中指定数据集组名称来创建数据集组。

创建数据集组

  1. 打开 Amazon Personalize 控制台https://console.aws.amazon.com/personalize/home并登录您的账户。

  2. 选择 Create dataset group (创建数据集组)

  3. 如果这是您第一次使用 Amazon Personalize,请在创建数据集组页面, 在新数据集组中,选择试用

  4. Dataset group details (数据集组详细信息) 中,对于 Dataset group name (数据集组名称),为您的数据集组指定一个名称。

  5. 选择 Next。这些区域有:创建用户项交互数据集页面随即显示。现在,您可以将具有关联方案的数据集添加到数据集组。请参阅 创建数据集和架构(控制台)

创建数据集组 (Amazon CLI)

通过运行以下命令来创建数据集组。有关该 API 的更多信息,请参阅CreateDatasetGroup

aws personalize create-dataset-group --name dataset group name

此时将显示数据集组 Amazon 资源名称 (ARN),如以下示例所示。

{ "datasetGroupArn": "arn:aws:personalize:us-west-2:acct-id:dataset-group/DatasetGroupName" }

记录此值,供将来使用。要显示您创建的数据集组,请使用describe-dataset-group命令并指定返回的数据集组 ARN。

aws personalize describe-dataset-group \ --dataset-group-arn dataset group arn

此时将显示数据集组及其属性,如以下示例所示。

{ "datasetGroup": { "name": "DatasetGroupName", "datasetGroupArn": "arn:aws:personalize:us-west-2:acct-id:dataset-group/DatasetGroupName", "status": "ACTIVE", "creationDateTime": 1542392161.262, "lastUpdatedDateTime": 1542396513.377 } }

当数据集组的status处于活动状态,请继续创建数据集和方案 (Amazon CLI)

创建数据集组 (Amazon开发工具包)

使用CreateDatasetGroupoperation.

SDK for Python (Boto3)
import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset_group(name = 'dataset group name') dsg_arn = response['datasetGroupArn'] description = personalize.describe_dataset_group(datasetGroupArn = dsg_arn)['datasetGroup'] print('Name: ' + description['name']) print('ARN: ' + description['datasetGroupArn']) print('Status: ' + description['status'])

这些区域有:DescribeDatasetGroup操作将返回datasetGroupArn和操作的状态。

SDK for Java 2.x
public static void createDatasetGroup(PersonalizeClient personalizeClient, String datasetGroupName) { long waitInMilliseconds = 60 * 1000; try { CreateDatasetGroupRequest createDatasetGroupRequest = CreateDatasetGroupRequest.builder() .name(datasetGroupName) .build(); String datasetGroupArn = personalizeClient.createDatasetGroup(createDatasetGroupRequest) .datasetGroupArn(); long maxTime = Instant.now().getEpochSecond() + (15 * 60); // 15 minutes DescribeDatasetGroupRequest describeRequest = DescribeDatasetGroupRequest.builder() .datasetGroupArn(datasetGroupArn) .build(); String status = null; while (Instant.now().getEpochSecond() < maxTime) { status = personalizeClient.describeDatasetGroup(describeRequest) .datasetGroup() .status(); System.out.println("DatasetGroup status:" + status); if (status.equals("ACTIVE") || status.equals("CREATE FAILED")) { break; } try { Thread.sleep(waitInMilliseconds); } catch (InterruptedException e) { System.out.println(e.getMessage()); } } } catch(PersonalizeException e) { System.out.println(e.awsErrorDetails().errorMessage()); } }