创建笔记本 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

创建笔记本

注意

EMR Notebooks 在新控制台中作为 Amazon EMR Studio Workspaces 提供。您仍然可以在旧控制台中使用现有笔记本,但无法在其中创建新笔记本。新控制台中的创建 Workspace 按钮将取代此功能。要访问或创建 Workspaces,EMR Notebooks 用户需要额外的 IAM 角色权限。有关更多信息,请参阅 Amazon EMR Notebooks are Amazon EMR Studio Workspaces in new console(Amazon EMR Notebooks 在新控制台中为 Amazon EMR Studio Workspaces)和 What's new in the console?(控制台中有哪些新功能?)

您可以使用旧 Amazon EMR 控制台创建 EMR 笔记本。不支持使用 Amazon CLI 或 Amazon EMR API 创建笔记本。

创建 EMR Notebooks
  1. 通过以下链接打开 Amazon EMR 控制台:https://console.aws.amazon.com/elasticmapreduce/

  2. 依次选择 Notebooks (笔记本)Create notebook (创建笔记本)

  3. Notebook name (笔记本名称) 中输入一个名称,在 Notebook description (笔记本描述)(可选)中输入相关描述。

  4. 如果您有一个要向其附加笔记本的活动集群,请将默认值 Choose an existing cluster (选择现有集群) 保持选中状态,单击 Choose (选择),从列表中选择集群,然后单击 Choose cluster (选择集群)。有关 EMR Notebooks 的集群要求的信息,请参阅使用 EMR Notebooks 时的注意事项

    —或者—

    选择 Create a cluster (创建集群),输入 Cluster name (集群名称),然后根据以下准则选择选项。使用按需型实例在账户的默认 VPC 中创建集群。

    设置 描述

    集群名称

    用于标识集群的友好名称。

    Release

    无法修改。默认为最新的 Amazon EMR 发行版本(5.36.1)。

    应用程序

    无法修改。列出集群上安装的应用程序。

    实例

    输入实例数并选择 EC2 实例类型。一个实例用于主节点。其余实例用于核心节点。实例类型决定了可同时附加到集群的笔记本的数量。有关更多信息,请参阅并发附加的 EMR Notebooks 的限制

    EMR 角色

    保留默认值或选择用于为 Amazon EMR 指定自定义服务角色的链接。有关更多信息,请参阅Amazon EMR 的服务角色(EMR 角色)

    EC2 实例配置文件

    保留默认值或选择用于为 EC2 实例指定自定义服务角色的链接。有关更多信息,请参阅集群 EC2 实例(EC2 实例配置文件)的服务角色

    EC2 密钥对

    选择可用于连接到集群实例的 EC2 密钥对。有关更多信息,请参阅使用 SSH 连接到主节点

  5. 对于 Security groups (安全组),选择 Use default security groups (使用默认安全组)。或者,选择 Choose security groups (选择安全组),然后选择集群的 VPC 中可用的自定义安全组。您应为主实例选择一个安全组,为笔记本客户端实例选择另一个安全组。有关更多信息,请参阅为 EMR Notebooks 指定 EC2 安全组

  6. 对于 Amazon Service Role (亚马逊云科技服务角色),保留默认设置或从列表中选择一个自定义角色。笔记本的客户端实例将使用此角色。有关更多信息,请参阅EMR Notebooks 的服务角色

  7. 对于 Notebook location (笔记本位置),选择笔记本文件在 Amazon S3 中的保存位置,或指定自己的位置。如果存储桶和文件夹不存在,Amazon EMR 会进行创建。

    Amazon EMR 会创建一个文件夹名称为笔记本 ID 的文件夹,并将此笔记本保存到名为 NotebookName.ipynb 的文件中。例如,如果为名为 MyFirstEMRManagedNotebook 的笔记本指定 Amazon S3 位置 s3://MyBucket/MyNotebooks,则该笔记本文件将保存到 s3://MyBucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb 下。

    如果在 Amazon S3 中指定一个加密位置,则必须将 EMR Notebooks 的服务角色 设置为密钥用户。默认服务角色为 EMR_Notebooks_DefaultRole。如果您使用 Amazon KMS 密钥进行加密,请参阅《Amazon Key Management Service 开发人员指南》中的在 Amazon KMS 中使用密钥策略添加密钥用户的支持文章

  8. (可选)如果您已将基于 Git 的存储库添加到要与此笔记本关联的 Amazon EMR,请选择 Git repository (Git 存储库),单击 Choose repository (选择存储库),然后从列表中选择一个存储库。有关更多信息,请参阅将基于 Git 的存储库与 EMR Notebooks 关联

  9. (可选)选择 Tags (标签),然后为该笔记本添加其它键-值标签。

    重要

    其中 Key (键) 字符串设置为 creatorUserID,值设置为您的 IAM 用户 ID 的默认标签用于访问目的。我们建议您不要更改或删除此标签,因为它可用于控制访问权限。有关更多信息,请参阅将集群和笔记本标签与访问控制 IAM policy 结合使用

  10. 选择 Create Notebook (创建笔记本)