步骤 2:启动 Amazon EMR 集群 - Amazon DynamoDB
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 2:启动 Amazon EMR 集群

在此步骤中,您将配置并启动 Amazon EMR 集群。集群上将已安装适用于 DynamoDB 的 Hive 和存储处理程序。

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create Cluster (创建集群)

  3. Create Cluster - Quick Options 页面上,执行以下操作:

    1. Cluster name (集群名称) 中,键入集群的名称(例如:My EMR cluster)。

    2. EC2 密钥对中,选择您之前创建的密钥对。

    将其他设置保留为默认值。

  4. 选择 Create Cluster (创建集群)

启动集群需要几分钟时间。您可以使用 控制台中的 Cluster Details (集群详细信息)Amazon EMR 页面监控其进度。

当状态变为 Waiting 时,表示集群可供使用。

集群日志文件和Amazon S3

集群生成日志文件,其中包含有关集群状态和调试信息的信息。Amazon EMRCreate Cluster - Quick Options (创建集群 - 快速选项) 的默认设置包括设置 日志记录。Amazon EMR

如果还没有存储桶,AWS 管理控制台将创建一个 Amazon S3 存储桶。存储桶名称为 aws-logs-account-id-region,其中 account-id 是您的 AWS 账号,region 是您启动集群的区域(例如,aws-logs-123456789012-us-west-2)。

注意

您可以使用 Amazon S3 控制台查看日志文件。有关更多信息,请参阅 https://docs.amazonaws.cn/ElasticMapReduce/latest/ManagementGuide/emr-manage-view-web-log-files.html 管理指南 中的Amazon EMR查看日志文件

除了日志记录之外,您还可以将此存储桶用于其他目的。例如,您可以将存储桶用作存储 Hive 脚本的位置,或用作将数据从 Amazon DynamoDB 导出到 Amazon S3 时的目标。

下一步

步骤 3:连接到 领导节点 节点