本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 EMR Studio SQL 版资源管理器浏览数据
注意
SQLAmazon EMR Serverless 交互式应用程序或启用了IAM身份中心可信身份传播的 Studio 不支持 Explorer for Studio。EMR
本主题提供的信息可帮助您开始在 Amazon EMR Studio 中使用 SQL Explorer。 SQLExplorer 是 Workspace 中的单页工具,可帮助您了解EMR集群数据目录中的数据源。您可以使用 SQL Explorer 浏览数据、运行SQL查询以检索数据以及下载查询结果。
SQL资源管理器支持 Presto。在使用 SQL Explorer 之前,请确保您的集群使用安装了 Presto EMR 的 Amazon 版本 5.34.0 或更高版本或 6.4.0 或更高版本。Amazon EMR Studio SQL Explorer 不支持您配置了传输中加密的 Presto 集群。这是因为 Presto 在这些集群上以TLS模式运行。
浏览集群的数据目录
SQLExplorer 提供了一个目录浏览器界面,您可以使用该界面来浏览和了解数据的组织方式。例如,在编写SQL查询之前,您可以使用数据目录浏览器来验证表名和列名。
浏览数据目录
-
在工作区中打开SQL资源管理器。
-
请确保您的工作区已连接到运行于安装了 Presto EC2 的 Amazon 6.4.0 或更高EMR版本的EMR集群。您可以选择一个现有的集群或创建一个新的集群。有关更多信息,请参阅 将计算机连接到 EMR Studio 工作空间。
-
请从下拉列表中选择一个要浏览的 Database(数据库)。
-
展开数据库中的表以查看表的列名称。您还可在搜索栏中输入一个关键词以筛选表结果。
运行SQL查询以检索数据
通过SQL查询检索数据并下载结果
-
在工作区中打开SQL资源管理器。
-
确保你的工作区已连接到安装了 Presto 和 Spark 的EMR集群。EC2您可以选择一个现有的集群或创建一个新的集群。有关更多信息,请参阅 将计算机连接到 EMR Studio 工作空间。
-
选择 Open editor(打开编辑器)以在您的 Workspace 中打开一个新的编辑器选项卡。
-
在编辑器选项卡中撰写您的SQL查询。
-
选择运行。
-
在 “结果预览” 下查看您的查询结果。 SQL默认情况下,资源管理器显示前 100 个结果。您可以使用 Preview first 100 query results(预览前 100 个查询结果)下拉列表以选择要求显示的不同数量的结果(最高 1000)。
-
选择下载结果以CSV格式下载结果。您最多可以下载 1000 行结果。