Amazon EMR 笔记本 - Amazon EMR
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon EMR 笔记本

您可以将 Amazon EMR 笔记本 与运行 Amazon EMR 的 Apache Spark 集群结合使用,以在 控制台中创建并打开 JupyterAmazon EMR Notebook 和 JupyterLab 界面。EMR 笔记本 是一款“无服务器”笔记本,可用于运行查询和代码。与传统笔记本不同,EMR 笔记本本身的内容—笔记本单元中的公式、查询、模型、代码和叙述性文本—在客户端中运行。命令是使用 EMR 集群上的内核执行的。笔记本内容也将独立于集群数据保存到 Amazon S3 中以实现持久性和灵活重用。

您可以启动集群,附加 EMR 笔记本 以进行分析,然后终止集群。您还可以关闭已附加到一个正在运行的集群的笔记本并切换到另一个笔记本。多个用户可以同时将笔记本附加到同一个集群,并在 Amazon S3 中相互共享笔记本文件。利用这些功能,您可以按需运行集群以节省成本,并减少为不同的集群和数据集重新配置笔记本所花费的时间。

您还可以使用 EMR API 以编程方式执行 EMR 笔记本,而无需与 EMR 控制台交互(“无管控执行”)。您需要在 EMR 笔记本 中包含具有参数标签的单元格。该单元格允许脚本将新输入值传递到笔记本。参数化笔记本可以与不同的输入值集重用。无需制作同一笔记本的副本即可使用新的输入值进行编辑和执行。对于每次参数化笔记本运行,EMR 会在 S3 上创建和保存输出笔记本。有关 EMR 笔记本 API 代码示例,请参阅 以编程方式执行 EMR 笔记本 的示例命令

重要

EMR 笔记本 受使用 Amazon EMR 5.18.0 及更高版本创建的集群的支持。我们强烈建议您将 EMR 笔记本 与使用最新版本的 Amazon EMR(尤其是 – 发行版 5.30.0 及更高版本(不包括 6.0.0)创建的集群结合使用。Amazon EMR已对 Amazon EMR 5.30.0 进行了更改,以便 Jupyter 内核在附加的集群而不是 Jupyter 实例上运行。此更改可帮助提高性能并增强您自定义内核和库的能力。有关更多信息,请参阅 集群发布版本的功能差异.

我们会针对 Amazon S3 存储和 Amazon EMR 集群收取适当的费用。