本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将交互式会话与 Microsoft Visual Studio Code 配合使用
先决条件
-
安装 Amazon Glue 交互式会话并验证其可与 Jupyter Notebook 搭配使用。
-
通过 Jupyter 下载和安装 Visual Studio Code。有关详细信息,请参阅采用 VS 代码的 Jupyter Notebook
。
要开始交互式会话,请使用 VSCode
-
在 VS Code AutoStart 中禁用 Jupyter。
在 Visual Studio Code 中,Jupyter 内核将自动启动,这将防止您的魔术命令因会话已开启而生效。要在 Windows 上禁用自动启动,请前往文件 > 首选项 > 扩展 > Jupyter > 右键单击 Jupyter,然后选择扩展设置。
在 MacOS 上,请前往代码 > 设置 > 扩展 > Jupyter > 右键单击 Jupyter,然后选择扩展设置。
向下滚动直到看到 Jupyter:禁用 Jupyter 自动启动。选中标有“如果为 true,则禁止为您自动启动 Jupyter”。You must instead run a cell to start Jupyter(您必须运行一个单元格才能开启 Jupyter)。”
-
转到 File(文件)> New File(新建文件)> Save(保存)以使用您选择的名称将此文件保存为
.ipynb
扩展,或者在 select a language(选择语言)下选择 jupyter 并保存文件。 -
双击文件。系统将显示 Jupyter Shell 并打开笔记本。
-
在 Windows 上,您首次创建文件时,默认情况下,其未选择内核。单击 Select Kernel(选择内核),此时将显示可用内核的列表。选择 Glu e PySpark。
在 macOS 上,如果你看不到 Glue 内 PySpark核,请尝试以下步骤:
-
运行本地 Jupyter 会话以获取. URL
例如,运行以下命令以启动 Jupyter Notebook。
jupyter notebook
当笔记本首次运行时,你会看到URL一个看起来像
http://localhost:8888/?token=3398XXXXXXXXXXXXXXXX
。复制URL.
-
在 VS Code 中,单击当前内核,然后选择其他内核...,然后选择现有的 Jupyter 服务器...。粘贴URL您从上面步骤中复制的内容。
如果收到错误消息,请查看 VS Code Jupyter Wiki
。 -
如果成功,则会将内核设置为 Glue PySpark。
选择 Glue PySpark或 Gl ue Spark 内核(分别用于 Python 和 Scala)。
如果您在下拉列表中看不到Amazon Glue PySpark和 Amazon GlueSpark 内核,请确保您已在上述步骤中安装了Amazon Glue内核,或者您在 Visual Studio Code 中的
python.defaultInterpreterPath
设置是正确的。有关更多信息,请参阅 python。 defaultInterpreterPath 设置描述。 -
-
创建 Amazon Glue 交互式会话。继续操作,以您在 Jupyter notebook 中相同的方式创建会话。在第一个单元格的顶部指定任意魔术,并运行代码语句。