本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Hive JDBC 驱动程序
您可以将常用商业智能工具(如 Microsoft Excel、MicroStrategy、QlikView 和 Tableau)与 Amazon EMR 结合使用来探索和显示您的数据。许多这类工具都需要 Java 数据库连接(JDBC)驱动程序或开放式数据库连接(ODBC)驱动程序。Amazon EMR 支持 JDBC 和 ODBC 连接。
以下示例演示了如何使用 SQL Workbench/J 作为 SQL 客户端,与 Amazon EMR 中的 Hive 集群连接。有关其他驱动程序的更多信息,请参阅将业务情报工具与 Amazon EMR 结合使用。
在安装和使用 SQL Workbench/J 之前,请下载驱动程序包并安装驱动程序。程序包中包含的驱动程序支持 Amazon EMR 发行版 4.0 及更高版本中提供的 Hive 版本。如需详细的发布说明和文档,请参阅程序包中的 PDF 文档。
-
最新 Hive JDBC 驱动程序包下载
http://awssupportdatasvcs.com/bootstrap-actions/Simba/latest/
-
Hive JDBC 驱动程序的旧版本
安装和配置 SQL Workbench
-
从 http://www.sql-workbench.net/downloads.html
下载适用于您的操作系统的 SQL Workbench/J 客户端。 -
安装 SQL Workbench/J。有关更多信息,请参阅 SQL Workbench/J 用户手册中的安装并启动 SQL Workbench/J
。 -
Linux、Unix、Mac OS X 用户:在终端会话中,使用下面的命令创建到集群主节点的 SSH 隧道。将
mmaster-public-dns-name
替换为主节点 的公有 DNS 名称,将path-to-key-file
替换为您的 Amazon EC2 私有密钥(.pem
)文件的位置和文件名。ssh -o ServerAliveInterval=10 -i
path-to-key-file
-N -L 10000:localhost:10000 hadoop@master-public-dns-name
Windows 用户:在 PuTTY 会话中,使用
10000
作为 Source port (源端口)、使用
作为 Destination (目标) 来创建到集群主节点 的 SSH 隧道(使用本地端口转发)。将master-public-dns-name
:10000
替换为主节点的公有 DNS 名称。master-public-dns-name
-
将 JDBC 驱动程序添加到 SQL Workbench。
-
在 Select Connection Profile (选择连接配置文件) 对话框中,单击 Manage Drivers (管理驱动程序)。
-
单击 Create a new entry (创建新条目)(空白页)图标。
-
在名称字段中,键入
Hive JDBC
。 -
对于 Library (库),请单击 Select the JAR file(s) (选择 JAR 文件) 图标。
-
导航到包含提取的驱动程序的位置。选择您下载的 JDBC 驱动程序包版本中包含的驱动程序,然后单击 Open(打开)。
例如,您的 JDBC 驱动程序包可能包括以下 JAR。
hive_metastore.jar hive_service.jar HiveJDBC41.jar libfb303-0.9.0.jar libthrift-0.9.0.jar log4j-1.2.14.jar ql.jar slf4j-api-1.5.11.jar slf4j-log4j12-1.5.11.jar TCLIServiceClient.jar zookeeper-3.4.6.jar
-
在 Please select one driver (请选择一个驱动程序) 对话框中,选择
com.amazon.hive.jdbc41.HS2Driver
、确定。
-
-
当您返回到 Manage Drivers (管理驱动程序) 对话框时,确认 Classname (类名) 字段已经填写,然后选择确定。
当您返回到 Select Connection Profile (选择连接配置文件) 对话框时,验证驱动程序 字段是否设置为 Hive JDBC,然后在 URL 字段中提供以下 JDBC 连接字符串:
jdbc:hive2://localhost:10000/default
。选择确定进行连接。连接完成后,连接详细信息将显示在 SQL Workbench/J 窗口顶部。
有关使用 Hive 和 JDBC 界面的更多信息,请参阅 Apache Hive 文档中的 HiveClient