为 EMR Notebooks 指定 EC2 安全组 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

为 EMR Notebooks 指定 EC2 安全组

创建 EMR 笔记本时,使用笔记本编辑器时,将使用两个安全组来控制 EMR 笔记本和 Amazon EMR 集群之间的网络流量。默认安全组具有最小规则,其中仅允许 EMR Notebooks 服务和附加了笔记本的集群之间的网络流量。

EMR 笔记本借助 Apache Livy 通过使用 TCP 端口 18888 的代理与集群通信。利用为您的环境定制的规则创建自定义安全组时,您可以限制网络流量,以便仅使一部分笔记本在特定集群上的笔记本编辑器中运行代码。除了集群的默认安全组外,集群还使用您的自定义安全性。有关更多信息,请参阅《Amazon EMR 管理指南》中的使用安全组控制网络流量和为 EMR Notebooks 指定 EC2 安全组。

主实例的默认 EC2 安全组

除主实例的集群安全组外,主实例的默认 EC2 安全组还会与主实例关联。

组名:ElasticMapReduceEditors-Livy

规则

  • 入站

    允许 TCP 端口 18888 响应来自 EMR Notebooks 默认 EC2 安全组中任何资源的请求

  • 出站

EMR Notebooks 的默认 EC2 安全组

EMR Notebooks 的默认 EC2 安全组会与向任意 EMR Notebooks 分配的笔记本编辑器相关联。

组名:ElasticMapReduceEditors-编辑器

规则

  • 入站

  • 出站

    允许 TCP 端口 18888 向 EMR Notebooks 默认 EC2 安全组中的任何资源发出请求。

将笔记本与 Git 存储库关联时,针对 EMR Notebooks 的自定义 EC2 安全组

要将 Git 存储库链接到笔记本,EMR 笔记本的安全组必须包含出站规则,以允许笔记本将流量路由到 Internet。为了这个目的,建议您创建一个新的安全组。更新默认的 ElasticMapReduceEditors-Edit or安全组可能会为附加到该安全组的其他笔记本提供相同的出站规则。

规则

  • 入站

  • 出站

    允许笔记本通过集群将流量路由到互联网,如以下示例所示:值 0.0.0.0/0 用于示例。您可以修改此规则以指定基于 Git 的存储库的 IP 地址。

    类型 协议 端口范围 目标位置

    自定义 TCP 规则

    TCP

    18888

    SG-

    HTTPS

    TCP

    443

    0.0.0.0/0