Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

创建带 HBase 的集群

此部分中的过程包含使用 AWS 管理控制台和 AWS CLI 启动集群的基础知识。有关如何计划、配置和启动 EMR 集群的详细信息,请参阅 Amazon EMR 管理指南中的计划和配置集群

使用控制台创建带 HBase 的集群

有关使用控制台启动集群的快速步骤,请参阅 Amazon EMR 管理指南中的步骤 3:启动 Amazon EMR 集群

使用控制台启动安装了 HBase 的集群

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create cluster (创建集群)Go to advanced options (转到高级选项)

  3. 对于 Software Configuration (软件配置),选择 Amazon Release Version (Amazon 发布版) 4.6.0 或更高版本(我们建议选择最新版本)。根据需要,选择 HBase 和其他应用程序。

  4. 对于 Amazon EMR 版本 5.2.0 及更高版本,在 HBase Storage Settings (HBase 存储设置) 下,选择 HDFSS3。有关更多信息,请参阅HBase on Amazon S3(Amazon S3 存储模式)

  5. 根据需要选择其他选项,然后选择 Create cluster (创建集群)

使用 AWS CLI 创建带 HBase 的集群

使用以下命令创建安装了 HBase 的集群:

aws emr create-cluster --name "Test cluster" --release-label emr-5.20.0 \ --applications Name=HBase --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type m4.large --instance-count 3

注意

包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

如果您使用 HBase on Amazon S3,请指定 --configurations 选项以及对 JSON 配置对象的引用。配置对象必须包含一个 hbase-site 分类,此分类使用 hbase.rootdir 属性指定 HBase 数据在 Amazon S3 中的存储位置。它还必须包含一个 hbase分类,此分类使用 s3 属性指定 hbase.emr.storageMode。以下示例演示一个具有这些配置设置的 JSON 代码段。

{ "Classification": "hbase-site", "Properties": { "hbase.rootdir": "s3://MyBucket/MyHBaseStore",} }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode":"s3", } }

有关 HBase on Amazon S3 的更多信息,请参阅 HBase on Amazon S3(Amazon S3 存储模式)。有关分类的更多信息,请参阅配置应用程序