Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用 EMR 笔记本时的注意事项

EMR 笔记本 运行 Jupyter Notebook 5.7.0 版和 Python 3.6.5。

EMR 笔记本 是预配置的,安装了以下内核和库包。

内核

  • PySpark

  • PySpark3

  • Python3

  • Spark

  • SparkR

如果需要所有用户都可访问的其他库,则可在创建集群时通过执行引导操作或为 Amazon EMR 指定自定义 Amazon Linux AMI 来安装它们。有关更多信息,请参阅 创建引导操作以安装其他软件使用自定义 AMI

借助 Amazon EMR 5.26.0 及更高版本,您可以从笔记本编辑器中安装其他库包。这些库是笔记本范围 的库。它们仅供当前的笔记本会话使用。它们不会干扰集群范围的库或其他笔记本中安装的库。有关更多信息,请参阅 使用笔记本范围的库

与 EMR 笔记本结合使用的集群会有一些要求。能够与集群结合使用的笔记本的数量受主节点配置限制。有关更多信息,请参阅为笔记本创建 Amazon EMR 集群