步骤 1:创建项目 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 1:创建项目

在此步骤中,您将使用 DataBrew 控制台快速开始示例项目。

创建项目
  1. 登录 Amazon Web Services Management Console 并打开 DataBrew 控制台,网址为 https://console.aws.amazon.com/databrew/

  2. 确保在控制台的右上角选择了您 Amazon 所在的地区。 DataBrew有关支持的 Amazon 区域列表 DataBrew,请参阅中的DataBrew 终端节点和配额Amazon Web Services 一般参考

  3. 在导航窗格上,选择 “项目”,然后选择 “创建项目”。

  4. 项目详细信息窗格上,执行以下操作:

    • 在 “项目名称” 中,输入chess-project

    • 对于附加食谱,创建一个新配方。提供了食谱的建议名称(chess-project-recipe)。

  5. 选择数据集窗格上,选择示例文件

  6. 示例文件窗格上,选择著名的国际象棋游戏动作。该数据集包含超过 20,000 场国际象棋游戏的详细信息。

    对于数据集名称,提供了数据集的建议名称 (chess-games)。

  7. 在 “访问权限” 窗格上,选择AwsGlueDataBrewDataAccessRole。这是一个服务相关角色,允许代表您 DataBrew 访问 Amazon S3 存储桶。

  8. 选择 “创建项目”,然后等到项目准备 DataBrew 完毕。窗口看上去类似下面这样。

    您看到的数据代表数据chess-games集中的样本。默认情况下,样本包含数据集中的前 500 行。您以后可以更改此项目设置。

    工具栏提供对数百种数据转换的访问权限,您可以将其应用于数据。

    DataBrew 控制台右侧的配方窗格会跟踪你到目前为止应用的变换。