Amazon DynamoDB
开发人员指南 (API Version 2012-08-10)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

步骤 2:启动 Amazon EMR 集群

在此步骤中,您将配置和启动 Amazon EMR 集群。集群上已安装 Hive 和 DynamoDB 存储处理程序。

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create Cluster

  3. Create Cluster - Quick Options 页面上,执行以下操作:

    1. Cluster name 中,键入您的集群名称 (例如:My EMR cluster)。

    2. EC2 key pair 中,选择您之前创建的键前缀。

    将其他设置保留为默认值。

  4. 选择 Create cluster

您的集群将需要几分钟来启动。您可以使用 Amazon EMR 控制台中的 Cluster Details 页面监控其进度。

当状态更改为 Waiting 时,即可使用集群。

集群日志文件和 Amazon S3

Amazon EMR 集群会生成日志文件,其中包含有关集群状态和调试信息的信息。Create Cluster - Quick Options 的默认设置包括设置 Amazon EMR 日志记录。

如果存储桶不存在,AWS 管理控制台 会创建一个 Amazon S3 存储桶。存储桶名称为 aws-logs-account-id-region,其中 account-id 是您的 AWS 账号,region 是您启动集群的区域 (例如 aws-logs-123456789012-us-west-2)。

注意

您可以使用 Amazon S3 控制台查看日志文件。有关更多信息,请参阅 Amazon EMR 管理指南中的查看日志文件

除了日志记录以外,您还可以将此存储桶用于其他用途。例如,您可以将存储桶用作存储 Hive 脚本的位置,或在将数据从 Amazon DynamoDB 导出到 Amazon S3 中时用作目的地。

下一步

步骤 3:连接到主节点