Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

Apache Mahout

Amazon EMR 支持 Apache Mahout,一种 Apache Hadoop 机器学习框架。有关 Mahout 的更多信息,请转至 http://mahout.apache.org/

Mahout 是一个机器学习库,具有用于集群化、分类和多种推荐系统的工具,包括用于计算最相似的项目或为用户生成项目建议的工具。Mahout 使用 Hadoop 框架跨集群分发计算,并且现在包括其他工作分发方法 (包括 Spark)。

有关更多信息以及如何将 Mahout 用于 Amazon EMR 的示例,请参阅 AWS 大数据博客上的在 Amazon EMR 上使用 Apache Mahout 构建推荐系统一文。

注意

只有 Mahout 版本 0.13.0 及更高版本与 Amazon EMR 发布版本 5.0.0 及更高版本中的 Spark 版本 2.x 兼容。

下表列出了最新版的 Amazon EMR 附带的 Mahout 的版本,以及 Amazon EMR 随 Mahout 一起安装的组件。

有关随此版本中的 Mahout 一起安装的组件的版本,请参阅发行版 5.13.0 组件版本

emr-5.13.0 的 Mahout 版本信息

Amazon EMR 发行版标签 Mahout 版本 随 Mahout 安装的组件

emr-5.13.0

Mahout 0.13.0

emrfs、emr-ddb、emr-goodies、emr-kinesis、emr-s3-dist-cp、hadoop-client、hadoop-mapred、hadoop-hdfs-datanode、hadoop-hdfs-library、hadoop-hdfs-namenode、hadoop-httpfs-server、hadoop-kms-server、hadoop-yarn-nodemanager、hadoop-yarn-resourcemanager、hadoop-yarn-timeline-server、mahout-client