Amazon EMR
Amazon EMR 版本指南
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

Apache Hadoop

Apache Hadoop 是一种开源 Java 软件框架,支持跨越实例集群处理大量数据。它可在一个实例或成千上万个实例上运行。Hadoop 使用名为 MapReduce 的编程模型在多个实例之间分配处理工作。此外,它还实施了一个名为 HDFS 的分布式文件系统,该系统在多个实例之间存储数据。Hadoop 监控集群中实例的运行状况,并可从一个或多个节点的故障中恢复。通过这种方法,Hadoop 提高了处理和存储容量,同时实现了高可用性。

有关更多信息,请参阅 http://hadoop.apache.org

适用于此版本 Amazon EMR 的 Hadoop 版本信息

应用程序 Amazon EMR 发行版标签 随此应用程序安装的组件

Hadoop 2.7.3

emr-5.4.0

emrfs、emr-ddb、emr-goodies、emr-kinesis、emr-s3-dist-cp、hadoop-client、hadoop-hdfs-datanode、hadoop-hdfs-library、hadoop-hdfs-namenode、hadoop-httpfs-server、hadoop-kms-server、hadoop-mapred、hadoop-yarn-nodemanager、hadoop-yarn-resourcemanager

主题