JupyterHub
Jupyter notebook
Sparkmagic 是内核库,内核允许 Jupyter notebook 通过 Apache Livy(适用于 Spark 的 REST 服务器)与在 Amazon EMR 上运行的 Apache Spark
下图描述了 JupyterHub on Amazon EMR 的组件以及 Notebook 用户和管理员对应的身份验证方法。有关更多信息,请参阅 添加 Jupyter notebook 用户和管理员。
下表列出了 Amazon EMR 7.x 系列的最新发行版附带的 JupyterHub 版本,以及 Amazon EMR 随 JupyterHub 一起安装的组件。
有关此发行版中随 JupyterHub 安装的组件版本,请参阅发行版 7.10.0 组件版本。
| Amazon EMR 发行版标签 | JupyterHub 版本 | 随 JupyterHub 安装的组件 |
|---|---|---|
emr-7.10.0 |
JupyterHub 1.5.0 |
emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
下表列出了 Amazon EMR 6.x 系列的最新发行版附带的 JupyterHub 版本,以及 Amazon EMR 随 JupyterHub 一起安装的组件。
有关此发行版中随 JupyterHub 安装的组件版本,请参阅发行版 6.15.0 组件版本。
| Amazon EMR 发行版标签 | JupyterHub 版本 | 随 JupyterHub 安装的组件 |
|---|---|---|
emr-6.15.0 |
JupyterHub 1.5.0 |
aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
下表列出了 Amazon EMR 5.x 系列的最新发行版附带的 JupyterHub 版本,以及 Amazon EMR 随 JupyterHub 一起安装的组件。
有关此发行版中随 JupyterHub 安装的组件版本,请参阅发行版 5.36.2 组件版本。
| Amazon EMR 发行版标签 | JupyterHub 版本 | 随 JupyterHub 安装的组件 |
|---|---|---|
emr-5.36.2 |
JupyterHub 1.4.1 |
aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
JupyterHub on Amazon EMR 附带的 Python 3 内核为 3.6.4。
在 Amazon EMR 版本和 Amazon EC2 AMI 版本之间,jupyterhub 容器内安装的库可能不同。
使用 conda 列出已安装的库
在主节点命令行上运行以下命令:
sudo docker exec jupyterhub bash -c "conda list"
使用 pip 列出已安装的库
在主节点命令行上运行以下命令:
sudo docker exec jupyterhub bash -c "pip freeze"