本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Apache HBase
HBase
HBase 与 Hadoop 无缝协作,共享其文件系统,并作为 MapReduce 框架和执行引擎的直接输入和输出。 HBase 还与 Apache Hive 集成,支持对表进行类似 SQL 的查询,与基于 Hive 的 HBase 表进行联接,并支持 Java 数据库连接 (JDBC)。有关的更多信息 HBase,请参阅 Apache HBase 和 Apach
HBase 在 Amazon EMR 上,您还可以将 HBase 数据直接备份到亚马逊简单存储服务 (Amazon S3) Simple Storage Service,并在启动集群时从先前创建的备份中恢复。 HBase Amazon EMR 提供与 Amazon S3 集成的其它选项以实现数据持久性和灾难恢复。
-
HBase 在 Amazon S3 上 ——在 Amazon EMR 5.2.0 及更高版本中,你可以 HBase 在 Amazon S3 上使用将集群的 HBase 根目录和元数据直接存储到 Amazon S3 中。随后,您可以启动新集群,将其指向 Amazon S3 中的根目录位置。一次只能有一个集群使用 Amazon S3 中的 HBase 位置,只读副本集群除外。有关更多信息,请参阅 HBase 在亚马逊 S3(亚马逊 S3 存储模式)上。
-
HBase 只读副本—— 亚马逊 EMR 版本 5.7.0 及更高版本在 A HBase mazon S3 上支持只读副本集群。在只读操作中,只读副本集群提供对主集群的存储文件和元数据的只读访问权限。有关更多信息,请参阅 使用只读副本集群。
HBase 快照-作为 Amaz HBase on S3 的替代方案,在 EMR 版本 4.0 及更高版本中,您可以将 HBase 数据直接创建到 Amazon S3 的快照,然后使用快照恢复数据。有关更多信息,请参阅 使用 HBase 快照。
重要
对于 Amazon EMR HBase 集群扩展,我们不建议对集群使用托管扩展或使用自定义策略进行 HBase 扩展。
下表列出了最新版本的 Amazon EMR 7.x 系列中 HBase 包含的版本,以及 Amazon EMR 随之安装的组件。 HBase
有关此版本 HBase 中安装的组件的版本,请参阅 7.8.0 版组件版本。
Amazon EMR 发行版标签 | HBase 版本 | 安装在一起的组件 HBase |
---|---|---|
emr-7.8.0 |
HBase 2.6.1 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server |
下表列出了最新版本的 Amazon EMR 6.x 系列中 HBase 包含的版本以及与之一起安装的 Amazon EMR 的组件。 HBase
有关此版本 HBase 中安装的组件的版本,请参阅 6.15.0 版组件版本。
Amazon EMR 发行版标签 | HBase 版本 | 安装在一起的组件 HBase |
---|---|---|
emr-6.15.0 |
HBase 2.4.17 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, emr-wal-cli, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, hbase-operator-tools, zookeeper-client, zookeeper-server |
注意
Apache HBase HBCK2 是一个单独的操作工具,用于修复 HBase 区域和系统表。在 Amazon EMR 版本 6.1.0 及更高版本中,主节点上的 /usr/lib/hbase-operator-tools/
中提供 hbase-hbck2.jar。有关如何构建和使用该工具的更多信息,请参阅HBaseHBCK2
下表列出了最新版本的 Amazon EMR 5.x 系列中 HBase 包含的版本,以及 Amazon EMR 随之安装的组件。 HBase
有关此版本 HBase 中安装的组件的版本,请参阅 5.36.2 版组件版本。
Amazon EMR 发行版标签 | HBase 版本 | 安装在一起的组件 HBase |
---|---|---|
emr-5.36.2 |
HBase 1.4.13 |
emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-mapred, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hbase-hmaster, hbase-client, hbase-region-server, hbase-rest-server, hbase-thrift-server, zookeeper-client, zookeeper-server |