

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 Hive JDBC 驱动程序
<a name="HiveJDBCDriver"></a>

你可以使用流行的商业智能工具，例如微软 Excel、 MicroStrategyQlikView、和 Tableau 以及搭载 Amazon EMR 的 Tableau 来探索和可视化你的数据。许多这类工具都需要 Java 数据库连接（JDBC）驱动程序或开放式数据库连接（ODBC）驱动程序。Amazon EMR 支持通过 JDBC 和 ODBC 连接到 Spark、Hive 或 Presto 集群。

以下示例演示了使用 SQL Workbench/J 作为 SQL 客户端连接到 Amazon EMR 中的 Hive 集群。有关其他驱动程序的更多信息，请参阅[将业务情报工具与 Amazon EMR 结合使用](https://docs.amazonaws.cn/emr/latest/ManagementGuide/emr-bi-tools.html)。

在安装和使用 SQL Workbench/J 之前，请下载驱动程序包并安装驱动程序。程序包中包含的驱动程序支持 Amazon EMR 发行版 4.0 及更高版本中提供的 Hive 版本。如需详细的发布说明和文档，请参阅程序包中的 PDF 文档。
+ **最新的 JDBC 和 ODBC 驱动程序包**

  [http://awssupportdatasvcs.com/bootstrap-actions/Simba/](http://awssupportdatasvcs.com/bootstrap-actions/Simba/)

**安装和配置 SQL Workbench**

1. 从下载适用于您的操作系统的 SQL Workbench/J 客户端[http://www.sql-workbench.net/downloads.html](http://www.sql-workbench.net/downloads.html)。

1. 安装 SQL Workbench/J。有关更多信息，请参阅《SQL 手册用户手册》中的[安装和启动 SQL Workbench/J](http://www.sql-workbench.net/manual/install.html)。 Workbench/J 

1. **Linux、Unix、Mac OS X 用户**：在终端会话中，使用下面的命令创建到集群主节点的 SSH 隧道。*master-public-dns-name*替换为主节点的公有 DNS *path-to-key-file* 名称以及 Amazon EC2 私有密钥 (`.pem`) 文件的位置和文件名。

   ```
   ssh -o ServerAliveInterval=10 -i path-to-key-file -N -L 10000:localhost:10000 hadoop@master-public-dns-name
   ```

   **Windows 用户**：在 PuTTY 会话中，使用 `10000` 作为 **Source port** (源端口)、使用 `master-public-dns-name:10000` 作为 **Destination** (目标) 来创建到集群主节点 的 SSH 隧道（使用本地端口转发）。将 `master-public-dns-name` 替换为主节点的公有 DNS 名称。

1. 将 JDBC 驱动程序添加到 SQL Workbench。

   1. 在 **Select Connection Profile (选择连接配置文件)** 对话框中，单击 **Manage Drivers (管理驱动程序)**。

   1. 单击 **Create a new entry (创建新条目)**（空白页）图标。

   1. 在**名称**字段中，键入 **Hive JDBC**。

   1. 对于 **Library (库)**，请单击 **Select the JAR file(s) (选择 JAR 文件)** 图标。

   1. 导航到包含提取的驱动程序的位置。选择您下载的 JDBC 驱动程序包版本中包含的驱动程序，然后单击 **Open**（打开）。

      例如，您的 JDBC 驱动程序包可能包含以下内容。JARs

      ```
      hive_metastore.jar
      hive_service.jar
      HiveJDBC41.jar
      libfb303-0.9.0.jar
      libthrift-0.9.0.jar
      log4j-1.2.14.jar
      ql.jar
      slf4j-api-1.5.11.jar
      slf4j-log4j12-1.5.11.jar
      TCLIServiceClient.jar
      zookeeper-3.4.6.jar
      ```

   1. 在 **Please select one driver (请选择一个驱动程序)** 对话框中，选择 `com.amazon.hive.jdbc41.HS2Driver`、**确定**。

1. 当您返回到 **Manage Drivers (管理驱动程序)** 对话框时，确认 **Classname (类名)** 字段已经填写，然后选择**确定**。

1. 当您返回到 **Select Connection Profile (选择连接配置文件)** 对话框时，验证**驱动程序** 字段是否设置为 **Hive JDBC**，然后在 **URL** 字段中提供以下 JDBC 连接字符串：`jdbc:hive2://localhost:10000/default`。

1. 选择**确定**进行连接。连接完成后，连接详细信息将显示在 SQL Workbench/J 窗口的顶部。

有关使用 Hive 和 JDBC 接口的更多信息，请参阅 Apache Hive 文档JDBCInterface中的[HiveClient](https://cwiki.apache.org/confluence/display/Hive/HiveClient)和 [Hive](https://cwiki.apache.org/confluence/display/Hive/HiveJDBCInterface)。