Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

使用 Amazon EMR Notebooks

通过将 Amazon EMR 笔记本 与 Amazon EMR 控制台结合使用来创建和打开 Jupyter 笔记本。您可以将 EMR 笔记本与运行 Apache Spark 的 Amazon EMR 集群结合使用,以远程运行查询和代码。EMR 笔记本是一种“无服务器”Jupyter 笔记本。与传统笔记本不同的是,EMR 笔记本自身的内容(公式、可视化效果、查询、模型、代码和叙述性文本)在 Amazon S3 中是与运行此代码的集群分开保存的。这便使 EMR 笔记本具备了持久性存储、高效访问和灵活性。

在 EMR 笔记本中执行代码和查询时,需要使用 Amazon EMR 集群,但笔记本不会锁定到该集群。这样可支持临时提高集群的效率。您可以启动一个集群,向其附加 EMR 笔记本,以及终止该集群。笔记本仍存在,因此,您下次要对数据进行分析或建模时,可以创建另一个集群并向其附加相同的笔记本。

您还可以停止附加到正在运行的集群的 EMR 笔记本,然后更改集群。您可以附加到其他正在运行的集群,也可创建新的集群,均无需重新配置笔记本或终止集群。借助这些功能,您可以按需运行集群以节省成本。此外,在您想要对不同集群或数据集使用同一笔记本时,您还可以节省重新配置笔记本的时间。

我们会针对 Amazon S3 存储和 Amazon EMR 集群收取适当的费用。