本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
JupyterHub
Jupyter Notebook
Sparkmagic 是内核库,内核允许 Jupyter notebook 通过 Apache Livy(适用于 Spark 的 REST 服务器)与在 Amazon EMR 上运行的 Apache Spark
下图描述了 Amazon EMR JupyterHub 上的组件以及适用于笔记本用户和管理员的相应身份验证方法。有关更多信息,请参阅 添加 Jupyter notebook 用户和管理员。

下表列出了最新版本的 Amazon EMR 7.x 系列中 JupyterHub 包含的版本,以及 Amazon EMR 随之安装的组件。 JupyterHub
有关此版本 JupyterHub 中安装的组件的版本,请参阅 7.6.0 版组件版本。
Amazon EMR 发行版标签 | JupyterHub 版本 | 安装在一起的组件 JupyterHub |
---|---|---|
emr-7.6.0 |
JupyterHub 1.5.0 |
emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
下表列出了最新版本的 Amazon EMR 6.x 系列中 JupyterHub 包含的版本,以及 Amazon EMR 随之安装的组件。 JupyterHub
有关此版本 JupyterHub 中安装的组件的版本,请参阅 6.15.0 版组件版本。
Amazon EMR 发行版标签 | JupyterHub 版本 | 安装在一起的组件 JupyterHub |
---|---|---|
emr-6.15.0 |
JupyterHub 1.5.0 |
aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
下表列出了最新版本的 Amazon EMR 5.x 系列中 JupyterHub 包含的版本,以及 Amazon EMR 随之安装的组件。 JupyterHub
有关此版本 JupyterHub 中安装的组件的版本,请参阅 5.36.2 版组件版本。
Amazon EMR 发行版标签 | JupyterHub 版本 | 安装在一起的组件 JupyterHub |
---|---|---|
emr-5.36.2 |
JupyterHub 1.4.1 |
aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
亚马逊 EMR 中包含的 Python 3 内核是 3.6.4。 JupyterHub
jupyterhub
容器中安装的库可能因亚马逊 EMR 发行版本和 Amazon EC2 AMI 版本而异。
使用 conda
列出已安装的库
在主节点命令行上运行以下命令:
sudo docker exec jupyterhub bash -c "conda list"
使用 pip
列出已安装的库
在主节点命令行上运行以下命令:
sudo docker exec jupyterhub bash -c "pip freeze"