创建带 HBase 的集群 - Amazon EMR
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建带 HBase 的集群

此部分中的过程包含使用 AWS 管理控制台和 AWS CLI 启动集群的基础知识。有关如何计划、配置和启动 EMR 群集的详细信息,请参阅 https://docs.amazonaws.cn/emr/latest/ManagementGuide/emr-plan.html 中的Amazon EMR 管理指南计划和配置群集

使用控制台创建带 HBase 的群集

有关使用 控制台启动集群的快速步骤,请参阅 Amazon EMR 中的 入门Amazon EMR 管理指南

使用控制台启动安装了 HBase 的群集

  1. 通过以下网址打开 Amazon EMR 控制台:https://console.amazonaws.cn/elasticmapreduce/

  2. 选择 Create cluster (创建集群) 和 Go to advanced options (转到高级选项)。

  3. 对于 Software Configuration (软件配置),选择 Amazon 发行版 4.6.0 或更高版本(我们建议使用最新版本)。根据需要选择 HBase 和其他应用程序。

  4. 对于 Amazon EMR 版本 5.2.0 及更高版本,在 HBase Storage Settings (HBase 存储设置) 下,选择 HDFSS3。有关更多信息,请参阅HBase on Amazon S3(Amazon S3 存储模式)

  5. 根据需要选择其他选项,然后选择 Create cluster (创建集群)

使用 AWS CLI 创建带 HBase 的集群

使用以下命令创建安装了 HBase 的群集:

aws emr create-cluster --name "Test cluster" --release-label emr-5.32.0 \ --applications Name=HBase --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type m5.xlarge --instance-count 3
注意

包含了 Linux 行继续符 (\) 以提高可读性。可以在 Linux 命令中删除或使用它们。对于 Windows,请删除它们或将其替换为脱字号 (^)。

如果您使用 HBase on Amazon S3,请指定 --configurations 选项以及对 JSON 配置对象的引用。配置对象必须包含一个 hbase-site 分类,此分类使用 Amazon S3 属性指定 HBase 数据在 hbase.rootdir 中的存储位置。它还必须包含 hbase 分类,该分类s3使用 hbase.emr.storageMode 属性指定 。以下示例演示了具有这些配置设置的 JSON 代码段。

[ { "Classification": "hbase-site", "Properties": { "hbase.rootdir": "s3://MyBucket/MyHBaseStore" } }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode": "s3" } } ]

有关 HBase on Amazon S3 的更多信息,请参阅 HBase on Amazon S3(Amazon S3 存储模式)。有关分类的更多信息,请参阅配置应用程序