本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
JupyterHub
Jupyter 笔记本
Sparkmagic 是内核库,内核允许 Jupyter notebook 通过 Apache Livy(适用于 Spark 的 REST 服务器)与在 Amazon EMR 上运行的 Apache Spark
下图描述了 Amaz JupyterHub on EMR 的组件以及 Notebook 用户和管理员对应的身份验证方法。有关更多信息,请参阅 添加 Jupyter notebook 用户和管理员。

下表列出了 Amazon EMR 7.x 系列的最新发行版 JupyterHub 附带的,以及 Amazon EMR 随 Amazon EMR 一起安装的组件。 JupyterHub
有关此发行版 JupyterHub 中随安装的组件版本,请参阅 Rele ase 7.9.0 组件版本。
Amazon EMR 发行版标签 | JupyterHub 版本 | 随安装的组件 JupyterHub |
---|---|---|
emr-7.9.0 |
JupyterHub 1.5.0 |
emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
下表列出了 Amazon EMR 6.x 系列的最新发行版 JupyterHub 附带的,以及 Amazon EMR 随 Amazon EMR 一起安装的组件。 JupyterHub
有关此发行版 JupyterHub 中随安装的组件版本,请参阅 Rele ase 6.15.0 组件版本。
Amazon EMR 发行版标签 | JupyterHub 版本 | 随安装的组件 JupyterHub |
---|---|---|
emr-6.15.0 |
JupyterHub 1.5.0 |
aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
下表列出了 Amazon EMR 5.x 系列的最新发行版 JupyterHub 附带的,以及 Amazon EMR 随 Amazon EMR 一起安装的组件。 JupyterHub
有关此发行版 JupyterHub 中随安装的组件版本,请参阅发行版 5.36.2 组件版本。
Amazon EMR 发行版标签 | JupyterHub 版本 | 随安装的组件 JupyterHub |
---|---|---|
emr-5.36.2 |
JupyterHub 1.4.1 |
aws-sagemaker-spark-sdk, emrfs, emr-goodies, emr-ddb, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hudi, hudi-spark, r, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, livy-server, jupyterhub |
Amazon EMR 附带的 Pyth JupyterHub on 3 内核为 3.6.4。
jupyterhub
容器内安装的库可能因Amazon EMR 发行版和 Amazon EC2 AMI 版本而异。
使用 conda
列出已安装的库
在主节点命令行上运行以下命令:
sudo docker exec jupyterhub bash -c "conda list"
使用 pip
列出已安装的库
在主节点命令行上运行以下命令:
sudo docker exec jupyterhub bash -c "pip freeze"