Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

步骤 1:设置示例集群的先决条件

在开始设置 Amazon EMR 集群之前,请确保您已完成本主题中的先决条件。

注册 AWS

If you do not have an AWS account, use the following procedure to create one.

To sign up for AWS

  1. Open http://www.amazonaws.cn/ and click Sign Up.

  2. Follow the on-screen instructions.

创建 Amazon S3 存储桶

在本教程中,您将使用 Amazon S3 存储桶存储日志文件和输出数据。为符合 Hadoop 要求,用于 Amazon EMR 的 S3 存储桶名称具有以下限制条件:

  • 只能包含小写字母、数字、句点 (.) 和连字符 (-)

  • 不能以数字结尾。

如果您已有满足这些要求的存储桶,则可使用它来完成本教程。否则,请创建要使用的存储桶。有关创建存储桶的更多信息,请参阅 Amazon Simple Storage Service Getting Started Guide 中的创建存储桶

在您的 S3 存储桶中,请创建名为 logsoutput 的文件夹。此外,输出文件夹应为空。有关创建文件夹的更多信息,请参阅 Amazon Simple Storage Service Console User Guide 中的创建文件夹

创建 Amazon EC2 密钥对

您必须拥有 Amazon Elastic Compute Cloud (Amazon EC2) 密钥对才能使用安全外壳 (SSH) 协议通过安全通道连接集群中的节点。如果您已有要使用的密钥对,则可跳过这一步。如果您没有密钥对,请根据您的操作系统执行以下过程之一。