本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建带 HBase 的集群
此部分中的过程包含使用 AWS 管理控制台和 AWS CLI 启动集群的基础知识。有关如何计划、配置和启动 EMR 群集的详细信息,请参阅 https://docs.amazonaws.cn/emr/latest/ManagementGuide/emr-plan.html 中的Amazon EMR 管理指南计划和配置群集。
使用控制台创建带 HBase 的群集
有关使用 控制台启动集群的快速步骤,请参阅 Amazon EMR 中的 入门Amazon EMR 管理指南。
使用控制台启动安装了 HBase 的群集
-
通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/
。 -
选择 Create cluster (创建集群) 和 Go to advanced options (转到高级选项)。
-
对于 Software Configuration (软件配置),选择 Amazon 发行版 4.6.0 或更高版本(我们建议使用最新版本)。根据需要选择 HBase 和其他应用程序。
-
对于 Amazon EMR 版本 5.2.0 及更高版本,在 HBase Storage Settings (HBase 存储设置) 下,选择 HDFS 或 S3。有关更多信息,请参阅HBase on Amazon S3(Amazon S3 存储模式)。
-
根据需要选择其他选项,然后选择 Create cluster (创建集群)。
使用 AWS CLI 创建带 HBase 的集群
使用以下命令创建安装了 HBase 的群集:
aws emr create-cluster --name "
Test cluster
" --release-labelemr-5.32.0
\ --applications Name=HBase
--use-default-roles --ec2-attributes KeyName=myKey
\ --instance-typem5.xlarge
--instance-count3
包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。
如果您使用 HBase on Amazon S3,请指定 --configurations
选项以及对 JSON 配置对象的引用。配置对象必须包含一个 hbase-site
分类,此分类使用 Amazon S3 属性指定 HBase 数据在 hbase.rootdir
中的存储位置。它还必须包含 hbase
分类,该分类s3
使用 hbase.emr.storageMode
属性指定 。以下示例演示了具有这些配置设置的 JSON 代码段。
[ { "Classification": "hbase-site", "Properties": { "hbase.rootdir": "
s3://MyBucket/MyHBaseStore
" } }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode": "s3
" } } ]
有关 HBase on Amazon S3 的更多信息,请参阅 HBase on Amazon S3(Amazon S3 存储模式)。有关分类的更多信息,请参阅配置应用程序。