创建群集 HBase - Amazon EMR
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建群集 HBase

此部分中的过程包含使用 AWS 管理控制台和 AWS CLI 启动集群的基础知识。有关如何计划、配置和启动 EMR 群集的详细信息,请参阅 https://docs.amazonaws.cn/emr/latest/ManagementGuide/emr-plan.html 中的Amazon EMR 管理指南计划和配置群集

创建群集 HBase 使用控制台

有关通过控制台启动群集的快速步骤,请参阅 第3步: 启动AmazonEMR群集Amazon EMR 管理指南.

如何启动群集 HBase 使用控制台安装

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 创建群集转到高级选项.

  3. 对于 软件配置,选择一个 Amazon版本 4.6.0或更高版本(我们建议使用最新版本)。选择 HBase 和其他应用程序。

  4. 有 Amazon EMR 版本5.2.0及更高版本,低于 HBase 存储设置,选择 HDFS(HDFS)上3. 有关更多信息,请参阅HBase 于 Amazon S3 (人Amazon S3 存储模式)

  5. 根据需要选择其他选项,然后选择 Create cluster (创建集群)

创建群集 HBase 使用 AWS CLI

使用以下命令创建群集 HBase 已安装:

aws emr create-cluster --name "Test cluster" --release-label emr-5.31.0 \ --applications Name=HBase --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type m5.xlarge --instance-count 3
注意

包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

如果您使用 HBase 于 Amazon S3,指定 --configurations 选项引用JSON配置对象。配置对象必须包含一个 hbase-site 分类,此分类使用 hbase.rootdir 属性指定 HBase 数据在 Amazon S3 中的存储位置。它还必须包含 hbase 分类,其中指定了 s3 使用 hbase.emr.storageMode 属性。以下示例演示了具有这些配置设置的JSON代码段。

[ { "Classification": "hbase-site", "Properties": { "hbase.rootdir": "s3://MyBucket/MyHBaseStore" } }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode": "s3" } } ]

有关 HBase 于 Amazon S3,请参阅 HBase 于 Amazon S3 (人Amazon S3 存储模式). 有关分类的更多信息,请参阅 配置应用程序.