本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 Amazon Glue Studio 中使用笔记本创建 ETL 任务
在 Amazon Glue Studio 控制台中开启使用笔记本
-
将 Amazon Identity and Access Management 策略附上 Amazon Glue Studio 用户并为 ETL 作业和笔记本创建 IAM 角色。
-
按照 为 IAM 角色授予权限 中的描述,为笔记本配置额外的 IAM 安全措施
-
请访问 https://console.aws.amazon.com/gluestudio/
打开 Amazon Glue Studio 控制台。 注意
请确保您的浏览器不会阻止第三方 Cookie。浏览器的默认设置,或用户启用的设置阻止第三方 Cookie 时,都将阻止笔记本启动。有关管理 Cookie 的更多信息,请参阅:
-
选择左侧导航菜单中的 Jobs(任务)链接。
-
选择 Jupyter notebook(Jupyter 笔记本),然后选择 Create(创建)以开启新的笔记本会话。
-
在 Create job in Jupyter notebook(在 Jupyter 笔记本中创建任务)页面上,提供任务名称并选择要使用的 IAM 角色。请选择创建任务。
等待很短一段时间后,将出现笔记本编辑器。
-
添加代码后,您必须执行单元格才能初始化会话。有多种方法可以执行单元格:
按下播放按钮。
-
使用键盘快捷键:
-
在 MacOS 上,Command 键 + Enter 键以运行单元格。
-
在 Windows 上,Shift 键 + Enter 键以运行单元格。
-
有关使用 Jupyter notebook 界面编写代码的信息,请参阅 Jupyter notebook 用户文档
。 -
要测试脚本,请运行整个脚本或单个单元格。任何命令输出都将显示在单元格下方的区域中。
-
完成笔记本开发后,您可以保存任务,然后运行。您可以在 Script(脚本)选项卡中找到脚本。您添加到笔记本的任意魔术都将被删除,并且不会被保存为所生成 Amazon Glue 任务的脚本的一部分。Amazon Glue Studio 会自动将
job.commit()
添加到从笔记本内容生成的脚本的末尾。有关运行任务的更多信息,请参阅 启动任务运行。