使用 Amazon EMR Notebooks - Amazon EMR
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用 Amazon EMR Notebooks

可以将 Amazon EMR 笔记本 与运行 Apache Spark 的 Amazon EMR 集群结合使用,在 Amazon EMR 控制台中创建并打开 Jupyter Notebook 和 JupyterLab 界面。EMR 笔记本 是一款“无服务器”笔记本,可用于运行查询和代码。与传统笔记本不同,EMR 笔记本 自身的内容(笔记本单元中的方程式、查询、模型、代码和叙述文本)在客户端中运行。命令是使用 EMR 集群上的内核执行的。笔记本内容也将独立于集群数据保存到 Amazon S3 中以实现持久性和灵活重用。

您可以启动集群,附加 EMR 笔记本 以进行分析,然后终止集群。您还可以关闭已附加到一个正在运行的集群的笔记本并切换到另一个笔记本。多个用户可以同时将笔记本附加到同一个集群,并在 Amazon S3 中相互共享笔记本文件。利用这些功能,您可以按需运行集群以节省成本,并减少为不同的集群和数据集重新配置笔记本所花费的时间。

重要

EMR 笔记本 受使用 Amazon EMR 5.18.0 及更高版本创建的集群的支持。我们强烈建议您将 EMR 笔记本 与使用最新版本的 Amazon EMR(具体而言,为 Amazon EMR 发布版本 5.30.0 及更高版本,不包括 6.0.0)创建的集群结合使用。已对 Amazon EMR 5.30.0 进行了更改,以便 Jupyter 内核在附加的集群而不是 Jupyter 实例上运行。此更改可帮助提高性能并增强您自定义内核和库的能力。有关更多信息,请参阅集群发布版本的功能差异

我们会针对 Amazon S3 存储和 Amazon EMR 集群收取适当的费用。