Apache HBase - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Apache HBase

HBase 是一种开源、非关系型分布式数据库,它作为 Apache 软件基金会的 Hadoop 项目的一部分开发。HBase 在 Hadoop 分布式文件系统 (HDFS) 上运行,为 Hadoop 生态系统提供非关系型数据库功能。HBase 包含在 Amazon EMR 4.6.0 发行版 4.6.0 及更高版本中。

HBase 与 Hadoop 无缝协作,共享其文件系统,并作为 MapReduce 框架和执行引擎的直接输入和输出。HBase 还与 Apache Hive 集成,可通过 HBase 表实现类似 SQL 的查询、与基于配置单元的表连接以及对 Java 数据库连接 (JDBC) 的支持。有关 HBase 的更多信息,请参阅Apache HBaseHBase 文档在阿帕奇网站上。有关如何将 HBase 与 Hive 结合使用的示例,请参阅Amazon大数据博客文章使用亚马逊 EMR 上的 Apache HBase 和 Apache 配置单元结合 NoSQL 和大规模并行分析

使用 HBase on Amazon EMR,您还可将 HBase 数据直接备份到 Amazon Simple Storage Service (Amazon S3),并在启动 HBase 群集时从之前创建的备份还原。Amazon EMR 提供与 Amazon S3 集成的其他选项以实现数据持久性和灾难恢复。

  • HBase 版本-对于 Amazon EMR 5.2.0 版及更高版本,您可使用 HBase on Amazon S3 将集群的 HBase 根目录和元数据直接存储到 Amazon S3 中。随后,您可以启动新群集,将其指向 Amazon S3 中的根目录位置。一次仅一个集群可使用 Amazon S3 中的 HBase 位置,只读副本集群例外。有关更多信息,请参阅Amazon S3 上的 HBase(Amazon S3 存储模式)

  • HBase 只读副本-具有 HBase on Amazon S3 的 Amazon EMR 5.7.0 版及更高版本支持只读副本群集。在只读操作中,只读副本群集提供对主群集的存储文件和元数据的只读访问权限。有关更多信息,请参阅使用只读副本群集

  • HBase 快照-作为 Amazon S3 上的 HBase 替代方案,对于 EMR 版本 4.0 及更高版本,您可为直接传输至 Amazon S3 的 HBase 数据创建快照,然后使用快照恢复数据。有关更多信息,请参阅使用 HBase 快照

下表列出了 Amazon EMR 6.x 系列的最新发布版本附带的 HBase 版本,以及 Amazon EMR 随 HBase 一起安装的组件。

有关随此发行版本中的 HBase 一起安装的组件的版本,请参阅发行版 6.3.0 组件版本

emr-6.3.0 的版本信息
Amazon EMR 发布版标签 HBase 版本 随 HBase 一起安装的组件

emr-6.3.0

HBase 2.2.6

emrfs、emr-ddb、emr-goodies、emr-kinesis、emr-s3-dist-cp、hadoop-client、hadoop-hdfs-datanode、hadoop-hdfs-library、hadoop-hdfs-namenode、hadoop-httpfs-server、hadoop-kms-server、hadoop-mapred、hadoop-yarn-nodemanager、hadoop-yarn-resourcemanager、hadoop-yarn-timeline-server、hbase-hmaster、hbase-client、hbase-region-server、hbase-rest-server、hbase-thrift-server、zookeeper-client、zookeeper-server

注意

阿帕奇 HBase HBCK2 是一个独立的操作工具,用于修复 HBase 区域和系统表。有关如何构建和使用工具的详细信息,请参阅HBase HBCK2

下表列出了 Amazon EMR 5.x 系列的最新发布版本附带的 HBase 版本,以及 Amazon EMR 随 HBase 一起安装的组件。

有关随此发行版本中的 HBase 一起安装的组件的版本,请参阅发行版 5.33.0 组件版本

emr-5.33.0 的版本信息
Amazon EMR 发布版标签 HBase 版本 随 HBase 一起安装的组件

emr-5.33.0

HBase 1.4.13

emrfs、emr-ddb、emr-goodies、emr-kinesis、emr-s3-dist-cp、hadoop-client、hadoop-hdfs-datanode、hadoop-hdfs-library、hadoop-hdfs-namenode、hadoop-httpfs-server、hadoop-kms-server、hadoop-mapred、hadoop-yarn-nodemanager、hadoop-yarn-resourcemanager、hadoop-yarn-timeline-server、hbase-hmaster、hbase-client、hbase-region-server、hbase-rest-server、hbase-thrift-server、zookeeper-client、zookeeper-server