开发终端节点 - Amazon连接词
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开发终端节点

开发终端节点是可用于开发和测试您的 Amazon Glue 脚本的环境。您可以使用Amazon Glue创建、编辑和删除开发终端节点。这些区域有:开发终端节点选项卡上Amazon Glue控制台列出了创建的所有开发终端节点。您可以添加、删除或轮换开发终端节点的 SSH 密钥。您还可以创建使用开发终端节点的笔记本。

您提供配置值以预置开发环境。这些值告诉Amazon Glue如何设置网络,以便您可以安全地访问开发终端节点,并且您的终端节点可以访问您的数据存储。然后,您可以创建一个笔记本以连接到开发终端节点。您可以使用您的笔记本编写和测试 ETL 脚本。

使用 AWS Identity the Access Management (IAM) 角色,该角色与您用于运行的 IAM 角色具有相似的权限。Amazon GlueETL 作业。使用 Virtual Private Cloud (VPC)、子网和安全组创建可以安全地连接到您的数据资源的开发终端节点。您可以使用 SSH 生成 SSH key pair 以连接到开发环境。

您可以在 VPC 中为 Amazon S3 数据创建开发终端节点。借助该终端节点,您可以使用 JDBC 访问数据集。

您可以在本地计算机上安装 Apache Zeppelin 笔记本,并使用它在开发终端节点上调试和测试 ETL 脚本。或者,您可以在 Amazon EC2 实例上托管 Zeppelin 笔记本。笔记本服务器是一个基于 Web 的环境,您可以使用它运行 PySpark 语句。

Amazon Glue使用前缀为 Amazon EC2 实例aws-glue-dev-endpoint

您可以在开发终端节点上设置笔记本服务器,以运行具有 Amazon Glue 扩展的 PySpark 语句。有关 Zeppelin 笔记本的更多信息,请参阅Apache Zeppelin