将交互式会话与 Microsoft Visual Studio Code 配合使用 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将交互式会话与 Microsoft Visual Studio Code 配合使用

先决条件

  • 安装 Amazon Glue 交互式会话并验证其可与 Jupyter Notebook 搭配使用。

  • 通过 Jupyter 下载和安装 Visual Studio Code。有关详细信息,请参阅采用 VS 代码的 Jupyter Notebook

要开始交互式会话,请使用 VSCode
  1. 在 VS Code AutoStart 中禁用 Jupyter。

    在 Visual Studio Code 中,Jupyter 内核将自动启动,这将防止您的魔术命令因会话已开启而生效。要在 Windows 上禁用自动启动,请前往文件 > 首选项 > 扩展 > Jupyter > 右键单击 Jupyter,然后选择扩展设置

    在 MacOS 上,请前往代码 > 设置 > 扩展 > Jupyter > 右键单击 Jupyter,然后选择扩展设置

    向下滚动直到看到 Jupyter:禁用 Jupyter 自动启动。选中标有“如果为 true,则禁止为您自动启动 Jupyter”。You must instead run a cell to start Jupyter(您必须运行一个单元格才能开启 Jupyter)。”

    屏幕截图显示为 VS 代码中 Jupyter 扩展启用的复选框。
  2. 转到 File(文件)> New File(新建文件)> Save(保存)以使用您选择的名称将此文件保存为 .ipynb 扩展,或者在 select a language(选择语言)下选择 jupyter 并保存文件。

    此屏幕截图显示正在使用新名称保存文件。
  3. 双击文件。系统将显示 Jupyter Shell 并打开笔记本。

    屏幕截图显示打开的笔记本。
  4. 在 Windows 上,您首次创建文件时,默认情况下,其未选择内核。单击 Select Kernel(选择内核),此时将显示可用内核的列表。选择 Glu e PySpark。

    在 macOS 上,如果你看不到 Glue 内 PySpark核,请尝试以下步骤:

    1. 运行本地 Jupyter 会话以获取. URL

      例如,运行以下命令以启动 Jupyter Notebook。

      jupyter notebook

      当笔记本首次运行时,你会看到URL一个看起来像http://localhost:8888/?token=3398XXXXXXXXXXXXXXXX

      复制URL.

    2. 在 VS Code 中,单击当前内核,然后选择其他内核...,然后选择现有的 Jupyter 服务器...。粘贴URL您从上面步骤中复制的内容。

      如果收到错误消息,请查看 VS Code Jupyter Wiki

    3. 如果成功,则会将内核设置为 Glue PySpark

    屏幕截图显示突出显示的 Select Kernel(选择内核)按钮。

    选择 Glue PySpark或 Gl ue Spark 内核(分别用于 Python 和 Scala)。

    屏幕截图显示了对的选择Amazon Glue PySpark。

    如果您在下拉列表中看不到Amazon Glue PySparkAmazon GlueSpark 内核,请确保您已在上述步骤中安装了Amazon Glue内核,或者您在 Visual Studio Code 中的python.defaultInterpreterPath设置是正确的。有关更多信息,请参阅 python。 defaultInterpreterPath 设置描述

  5. 创建 Amazon Glue 交互式会话。继续操作,以您在 Jupyter notebook 中相同的方式创建会话。在第一个单元格的顶部指定任意魔术,并运行代码语句。