Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

创建带 HBase 的集群

此部分中的过程包含使用 AWS Management Console和 AWS CLI 启动集群的基础知识。有关如何计划、配置和启动 EMR 集群的详细信息,请参阅 Amazon EMR 管理指南 中的计划和配置集群

使用控制台创建带 HBase 的集群

有关使用控制台启动集群的快速步骤,请参阅 Amazon EMR 管理指南 中的步骤 3:启动 Amazon EMR 集群

使用控制台启动安装了 HBase 的集群

  1. Open the Amazon EMR console at https://console.amazonaws.cn/elasticmapreduce/.

  2. 选择 Create clusterGo to advanced options

  3. 对于 Software Configuration,选择 Amazon Release Version 4.6.0 或更高版本 (我们建议选择最新版本)。根据需要,选择 HBase 和其他应用程序。

  4. 对于 Amazon EMR 5.2.0 版和更高版本,在 HBase Storage Settings 下,选择 HDFSS3。有关更多信息,请参阅 HBase on Amazon S3 (Amazon S3 存储模式)

  5. 根据需要选择其他选项,然后选择 Create cluster

使用 AWS CLI 创建带 HBase 的集群

使用以下命令创建安装了 HBase 的集群:

aws emr create-cluster --name "Test cluster" --release-label emr-5.13.0 \ --applications Name=HBase --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type m4.large --instance-count 3

注意

包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

如果您使用 HBase on Amazon S3,请指定 --configurations 选项以及对 JSON 配置对象的引用。配置对象必须包含一个 hbase-site 分类,此分类使用 hbase.rootdir 属性指定 HBase 数据在 Amazon S3 中的存储位置。它还必须包含一个 hbase分类,此分类使用 hbase.emr.storageMode 属性指定 s3。以下示例演示一个具有这些配置设置的 JSON 代码段。

{ "Classification": "hbase-site", "Properties": { "hbase.rootdir": "s3://MyBucket/MyHBaseStore",} }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode":"s3", } }

有关 HBase on Amazon S3 的更多信息,请参阅 HBase on Amazon S3 (Amazon S3 存储模式)。有关分类的更多信息,请参阅配置应用程序