Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

使用 Hadoop 的 MapR 分配

MapR 是提供开放式企业级分配的第三方应用程序,可让 Hadoop 更易于使用且更可靠。为便于使用,MapR 提供了网络文件系统 (NFS) 和开放式数据库链接 (ODBC) 界面、综合管理套件及自动压缩。在可靠性方面,MapR 具有无 NameNode 的自愈性架构以及快照数据保护、灾难恢复和跨集群镜像功能,因此可提供高可用性。有关 MapR 的详细信息,请转到 http://www.mapr.com/

Amazon EMR 上可以使用多个版本的 MapR:

  • M3 Edition (版本 4.0.2、3.1.1、3.0.3、3.0.2、2.1.3) - Hadoop 完整发行版的免费版本。M3 提供了完整的随机读写平台,支持行业标准接口 (例如 NFS、ODBC)。同时提供管理、压缩和性能优势。

  • M5 Edition (版本 4.0.2、3.1.1、3.0.3、3.0.2、2.1.3) – Apache Hadoop 的完整发行版,针对所有 Hadoop 文件操作提供企业级功能。M5 功能包括镜像、快照、NFS HA 和数据放置控制。有关更多信息 (包括定价)。请参见 Amazon EMR 详细信息页面上的 MapR。

  • M7 Edition (版本 4.0.2、3.1.1、3.0.3、3.0.2) – Apache Hadoop 的完整发行版,为 NoSQL 和 Hadoop 应用程序提供了易用性、可靠性和性能优势。M7 具有不需要压缩和后台一致性检查的架构,实现了可扩展、高一致性、稳定可靠且持续低延迟。有关更多信息 (包括定价)。请参见 Amazon EMR 详细信息页面上的 MapR。

注意

要让 Apache HBase 应用程序实现企业级的可靠性和一致的性能,请使用 MapR M7 版次。

此外,MapR 不支持 Ganglia 和调试,Amazon EMR 上的 MapR M3 和 M5 版本不支持 Apache HBase。

在 Amazon EMR 中支持 Hadoop 2.x 的 MapR 版本是 4.0.2,它只能与 Amazon EMR AMI 3.3.2 配合使用