本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
正在配置 JupyterHub
您可以通过连接到集群主节点并编辑配置文件来自定义 Amaz JupyterHub on EMR 和个人用户笔记本的配置。在更改值之后,重启 jupyterhub 容器。
修改以下文件中的属性以配置 JupyterHub 和各个 Jupyter 笔记本:
jupyterhub_config.py– 默认情况下,此文件保存在主节点上的/etc/jupyter/conf/目录中。有关更多信息,请参阅 JupyterHub 文档中的配置基础知识。 jupyter_notebook_config.py– 默认情况下,该文件保存在/etc/jupyter/目录中,并作为默认值复制到jupyterhub容器中。有关更多信息,请参阅 Jupyter notebook 文档中的配置文件和命令行选项。
您也可以使用 jupyter-sparkmagic-conf 配置分类自定义 Sparkmagic,这会更新 Sparkmagic 的 config.json 文件中的值。有关可用设置的更多信息,请参阅上的 e xample_c
以下示例使用启动集群 Amazon CLI,引用了 Sparkmagic 配置分类设置MyJupyterConfig.json的文件。
注意
为了便于读取,包含 Linux 行继续符(\)。它们可以通过 Linux 命令删除或使用。对于 Windows,请将它们删除或替换为脱字号(^)。
aws emr create-cluster--use-default-roles--release-label emr-5.14.0 \ --applications Name=Jupyter --instance-typem4.xlarge--instance-count3\ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6--configurationsfile://MyJupyterConfig.json
MyJupyterConfig.json 的示例内容如下所示:
[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]
注意
对于 Amazon EMR 5.21.0 及更高版本,您可以覆盖集群配置,并为运行的集群中的每个实例组指定额外的配置分类。您可以使用 Amazon EMR 控制台、 Amazon Command Line Interface (Amazon CLI) 或软件开发工具包来完成此操作。 Amazon 有关更多信息,请参阅为运行的集群中的实例组提供配置。