Amazon EMR
Amazon EMR 版本指南
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

Apache Zeppelin

使用 Apache Zeppelin 作为用于交互式数据探索的笔记本。有关 Zeppelin 的更多信息,请参阅 https://zeppelin.apache.org/

要访问 Zeppelin Web 界面,请设置连接到主节点的 SSH 隧道和代理连接。有关更多信息,请参阅查看 Amazon EMR 集群上托管的 Web 界面

适用于此版本 Amazon EMR 的 Zeppelin 版本信息

应用程序 Amazon EMR 发行版标签 随此应用程序安装的组件

Zeppelin 0.7.0

emr-5.4.0

emrfs、emr-goodies、hadoop-client、hadoop-hdfs-datanode、hadoop-hdfs-library、hadoop-hdfs-namenode、hadoop-httpfs-server、hadoop-kms-server、hadoop-yarn-nodemanager、hadoop-yarn-resourcemanager、spark-client、spark-history-server、spark-on-yarn、spark-yarn-slave、zeppelin-server

在 Amazon EMR 上使用 Zeppelin 时的注意事项

  • 使用相同的 SSH 隧道方法连接到 Zeppelin 以连接到主节点上的其他 Web 服务器。可在端口 8890 上找到 Zeppelin 服务器。

  • Amazon EMR 版本 5.0.0 及更高版本上的 Zeppelin 支持 Shiro 身份验证

  • Amazon EMR 版本 5.8.0 及更高版本上的 Zeppelin 支持使用 AWS Glue Data Catalog作为 Spark SQL 的元数据仓。有关更多信息,请参阅使用 AWS Glue Data Catalog作为 Spark SQL 的元数据仓

  • Zeppelin 不使用集群的 spark-defaults.conf 配置文件中定义的部分设置 (即使它指示 YARN 在您启用相应设置时动态分配执行者也是如此)。您必须在“Interpreter”选项卡上设置执行者设置 (如内存和内核)。然后为要使用的设置重新启动解释器。

  • Amazon EMR 上的 Zeppelin 不支持 SparkR 解释器。