使用SQL扩展程序浏览数据 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用SQL扩展程序浏览数据

要打开SQL扩展用户界面 (UI),请在 Studio 中 JupyterLab 应用程序的导航窗格中选择SQL扩展程序图标 ( Purple circular icon with a clock symbol representing time or scheduling. )。左侧面板的数据发现视图展开并显示了与亚马逊 Athena、Amazon Redshift 和 Snowflake 的所有预先配置的数据存储连接。

从那里,你可以:

  • 展开特定连接以浏览其数据库、架构、表或视图以及列。

  • 使用SQL扩展用户界面中的搜索框搜索特定的连接。搜索会返回与您输入的字符串部分匹配的所有数据库、架构、表或视图。

注意

如果 Amazon 您的账户中已经设置了 Athena,则可以在应用程序中启用default-athena-connection。 JupyterLab 这使您无需手动创建连接即可运行 Athena 查询。要启用默认 Athena 连接,请执行以下操作:

  1. 请向管理员核实您的执行角色是否具有访问 Athena 和目录所需的权限。 Amazon Glue 有关所需权限的详细信息,请参阅 为 Ath Amazon Glue ena 配置连接

  2. 在 JupyterLab 应用程序中,导航到顶部导航栏的 “设置” 菜单,然后打开 “设置编辑器” 菜单。

  3. 选择 “数据发现”。

  4. 选中 “启用默认 Athena 连接” 复选框。

  5. primary WorkGroup 如果需要,您可以更新默认值。

要从SQL扩展窗格中的给定连接查询 JupyterLab 笔记本中的数据库、架构或表,请执行以下操作:

  • 选择任意数据库、架构或表右侧的三点图标 ( SQL extension three dots icon. )。

  • 从菜单中选择 “在笔记本中查询”。

    这会自动在笔记本单元格中 JupyterLab 填充相关的%%sm_sql魔法命令以连接到数据源。它还添加了一个示例SQL语句来帮助您立即开始查询。您可以使用扩展程序的自动完成和突出显示功能进一步完善SQL查询。SQL JupyterLab SQL扩展程序的编辑器功能有关使用SQL扩展SQL编辑器的更多信息,请参阅。

在表格级别,三点图标提供了选择预览表格元数据的附加选项。

下面的 JupyterLab 笔记本单元格内容显示了一个示例,说明在SQL扩展窗格中的redshift-connection数据源上选择 “在笔记本中查询” 菜单时会自动生成的内容。

%%sm_sql --metastore-id redshift-connection --metastore-type GLUE_CONNECTION -- Query to list tables from schema 'dev.public' SHOW TABLES FROM SCHEMA "dev"."public"

使用SQL扩展窗格顶部的小符号 ( Icon to clear the SQL extension search box. ) 清除搜索框或返回到连接列表。

注意

该扩展程序会缓存您的探索结果以便快速访问。如果缓存的结果已过时或列表中缺少连接,则可以通过选择SQL扩展面板底部的刷新按钮来手动刷新缓存。有关连接缓存的更多信息,请参阅SQL扩展连接缓存