在 AWS Glue 控制台中使用笔记本 - AWS Glue
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

在 AWS Glue 控制台中使用笔记本

开发终端节点 是可用于开发和测试您的 AWS Glue 脚本的环境。使用笔记本 可在开发终端节点上交互式开发和测试您的 ETL(提取、转换和加载)脚本。

AWS Glue 提供一个用于 SageMaker 笔记本和 Apache Zeppelin 笔记本服务器的接口。在 AWS Glue 笔记本页面上,您可以创建 SageMaker 笔记本并将其附加到开发终端节点。您还可以管理您创建并附加到开发终端节点的 Zeppelin 笔记本服务器。要创建 Zeppelin 笔记本服务器,请参阅创建在 Amazon EC2 上托管的笔记本服务器

AWS Glue 控制台上的 Notebooks (笔记本) 页面会列出您的 AWS Glue 环境中的所有 SageMaker 笔记本和 Zeppelin 笔记本服务器。您可以使用控制台来对您的笔记本执行一些操作。要显示笔记本或笔记本服务器的详细信息,请在列表中选择该笔记本。笔记本详细信息包含您在使用 Create SageMaker notebook (创建 SageMaker 笔记本)Create Zeppelin Notebook server (创建 Zeppelin 笔记本服务器) 向导创建笔记本时定义的信息。

可根据需要将附加到开发终端节点的 SageMaker 笔记本切换到另一个开发终端节点。仅 2019 年 11 月 21 日之后创建的 SageMaker 笔记本支持切换开发终端节点操作。

将 SageMaker 笔记本切换到其他开发终端节点

  1. 登录 AWS 管理控制台并通过以下网址打开 AWS Glue 控制台:https://console.amazonaws.cn/glue/

  2. 在导航窗格中,选择 Notebooks (笔记本)

  3. 在列表中选择该笔记本。选择 Action (操作),然后选择 Switch Dev Endpoint (切换开发终端节点)

  4. 选择可用的开发终端节点,然后选择 Apply (应用)

    此操作需要某些 IAM 角色。有关更多信息,请参阅为 Amazon SageMaker 笔记本创建 IAM 策略

SageMaker 笔记本会定期检查它是否已连接到附加的开发终端节点。如果未连接,则笔记本会尝试自动重新连接。

AWS Glue 控制台中的 SageMaker 笔记本

以下是 SageMaker 笔记本的一些属性。当您查看笔记本的详细信息时,控制台将显示其中部分属性。

重要

AWS Glue 只管理某些 AWS 区域内的 SageMaker 笔记本。有关更多信息,请参阅管理笔记本

在开始之前,请确保您有权在 AWS Glue 控制台上管理 SageMaker 笔记本。有关更多信息,请参阅步骤 3:将策略附加到访问 AWS Glue 的 IAM 用户中的 AWSGlueConsoleSageMakerNotebookFullAccess

笔记本名称

SageMaker 笔记本的唯一名称。

开发终端节点

此笔记本附加到的开发终端节点的名称。

重要

此开发终端节点必须是已经在 2018 年 8 月 15 日之后创建

状态

笔记本的预置状态:Ready (就绪)Failed (失败)Starting (正在启动)Stopping (正在停止) 以及 Stopped (已停止)

失败原因

如果状态为 Failed (失败),则显示笔记本的失败原因。

实例类型

笔记本所使用实例的类型。

IAM 角色

用于创建 SageMaker 笔记本的 IAM 角色。

此角色与 SageMaker 之间有信任关系。可以在 AWS Identity and Access Management (IAM) 控制台上创建此角色。创建角色时,选择 Amazon SageMaker,然后附加用于笔记本的策略,如 AWSGlueServiceSageMakerNotebookRoleDefault。有关更多信息,请参阅步骤 7:创建用于 SageMaker 笔记本的 IAM 角色

AWS Glue 控制台上的 Zeppelin 笔记本服务器

以下是 Apache Zeppelin 笔记本服务器的一些属性。当您查看笔记本的详细信息时,控制台将显示其中部分属性。

笔记本服务器名称

Zeppelin 笔记本服务器的唯一名称。

开发终端节点

在创建终端节点时为其授予的唯一名称。

预置状态

描述笔记本服务器的状态为 CREATE_COMPLETE 还是 ROLLBACK_COMPLETE

失败原因

如果状态为 Failed (失败),则显示笔记本的失败原因。

CloudFormation 堆栈

用于创建笔记本服务器的 AWS CloudFormation 堆栈的名称。

EC2 实例

为托管笔记本而创建的 Amazon EC2 实例的名称。它链接到 Amazon EC2 控制台 (https://console.amazonaws.cn/ec2/),在其中实例是用密钥 aws-glue-dev-endpoint 以及开发终端节点的名称的值标记的。

SSH 到 EC2 服务器命令

在终端窗口中输入此命令,以连接到正运行笔记本服务器的 Amazon EC2 实例。此命令中显示的 Amazon EC2 地址可能是公有地址,也可能是私有地址,具体取决于您是否已选择将公有 IP 地址附加到笔记本服务器 EC2 实例

复制证书

示例 scp 命令用于将设置 Zeppelin 笔记本服务器所需的密钥存储复制到托管笔记本服务器的 Amazon EC2 实例。从终端窗口在 Amazon EC2 私有密钥所在的目录中运行命令。访问 Amazon EC2 实例的密钥是 -i 选项的参数。您需要提供 path-to-keystore-file。命令的其余部分是 Amazon EC2 服务器上的开发终端节点私有 SSH 密钥所在的位置。

HTTPS URL

完成笔记本服务器的设置后,在浏览器中输入此 URL 以使用 HTTPS 连接到您的笔记本。