在 Amazon Glue Studio 中使用笔记本创建 ETL 任务 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

在 Amazon Glue Studio 中使用笔记本创建 ETL 任务

在 Amazon Glue Studio 控制台中开启使用笔记本
  1. 将 Amazon Identity and Access Management 策略附上 Amazon Glue Studio 用户并为 ETL 作业和笔记本创建 IAM 角色。

  2. 按照 为 IAM 角色授予权限 中的描述,为笔记本配置额外的 IAM 安全措施

  3. 请访问 https://console.aws.amazon.com/gluestudio/ 打开 Amazon Glue Studio 控制台。

    注意

    请确保您的浏览器不会阻止第三方 Cookie。浏览器的默认设置,或用户启用的设置阻止第三方 Cookie 时,都将阻止笔记本启动。有关管理 Cookie 的更多信息,请参阅:

  4. 选择左侧导航菜单中的 Jobs(任务)链接。

  5. 选择 Jupyter notebook(Jupyter 笔记本),然后选择 Create(创建)以开启新的笔记本会话。

  6. Create job in Jupyter notebook(在 Jupyter 笔记本中创建任务)页面上,提供任务名称并选择要使用的 IAM 角色。请选择 Create job (创建任务)

    等待很短一段时间后,将出现笔记本编辑器。

  7. 添加代码后,您必须执行单元格才能初始化会话。有多种方法可以执行单元格:

    • 按下播放按钮。

    • 使用键盘快捷键:

      • 在 MacOS 上,Command 键 + Enter 键以运行单元格。

      • 在 Windows 上,Shift 键 + Enter 键以运行单元格。

    有关使用 Jupyter notebook 界面编写代码的信息,请参阅 Jupyter notebook 用户文档

  8. 要测试脚本,请运行整个脚本或单个单元格。任何命令输出都将显示在单元格下方的区域中。

  9. 完成笔记本开发后,您可以保存任务,然后运行。您可以在 Script(脚本)选项卡中找到脚本。您添加到笔记本的任意魔术都将被删除,并且不会被保存为所生成 Amazon Glue 任务的脚本的一部分。Amazon Glue Studio 会自动将 job.commit() 添加到从笔记本内容生成的脚本的末尾。

    有关运行任务的更多信息,请参阅 启动任务运行