创建带 HBase 的集群 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

创建带 HBase 的集群

此部分中的过程包含使用 Amazon Web Services Management Console和 Amazon CLI 启动集群的基础知识。有关如何计划、配置和启动 EMR 集群的详细信息,请参阅《Amazon EMR 管理指南》中的计划和配置集群

使用控制台创建带 HBase 的集群

有关使用控制台启动集群的快速步骤,请参阅《Amazon EMR 管理指南》中的Amazon EMR 入门

使用控制台启动安装了 HBase 的集群

  1. 通过以下链接打开 Amazon EMR 控制台:https://console.aws.amazon.com/elasticmapreduce/

  2. 依次选择 Create cluster (创建集群)Go to advanced options (转到高级选项)

  3. Software Configuration (软件配置) 中,选择 Amazon Release Version (亚马逊发行版) 4.6.0 或更高版本(建议使用最新版本)。根据需要选择 HBase 和其它应用程序。

  4. 对于 Amazon EMR 版本 5.2.0 及更高版本,在 HBase Storage Settings (HBase 存储设置) 下,选择 HDFSS3。有关更多信息,请参阅HBase on Amazon S3(Amazon S3 存储模式)

  5. 根据需要选择其它选项,然后选择 Create cluster (创建集群)

使用 Amazon CLI 创建带 HBase 的集群

使用以下命令创建安装了 HBase 的集群:

aws emr create-cluster --name "Test cluster" --release-label emr-5.34.0 \ --applications Name=HBase --use-default-roles --ec2-attributes KeyName=myKey \ --instance-type m5.xlarge --instance-count 3
注意

为了便于读取,包含 Linux 行继续符(\)。它们可以通过 Linux 命令删除或使用。对于 Windows,请将它们删除或替换为脱字号(^)。

如果您使用 HBase on Amazon S3,请指定--configurations选项以及对 JSON 配置对象的引用。配置对象必须包含一个 hbase-site 分类,此分类使用 hbase.rootdir 属性指定 HBase 数据在 Amazon S3 中的存储位置。它还必须包含 hbase 分类,其中使用 hbase.emr.storageMode 属性指定 s3。以下示例演示了具有这些配置设置的 JSON 代码段。

[ { "Classification": "hbase-site", "Properties": { "hbase.rootdir": "s3://MyBucket/MyHBaseStore" } }, { "Classification": "hbase", "Properties": { "hbase.emr.storageMode": "s3" } } ]

有关 HBase on Amazon S3 的更多信息,请参阅HBase on Amazon S3(Amazon S3 存储模式)。有关分类的更多信息,请参阅配置应用程序