

# 教程：使用 Amazon DynamoDB 和 Apache Hive
<a name="EMRforDynamoDB.Tutorial"></a>

在本教程中，您将启动 Amazon EMR 集群，然后使用 Apache Hive 处理 DynamoDB 表存储的数据。

*Hive* 是用于 Hadoop 的数据仓库应用程序，用于处理和分析来自多个来源的数据。Hive 提供了类似 SQL 的语言 *HiveQL*，可用于 Amazon EMR 集群本地存储的数据或外部数据源（如 Amazon DynamoDB）的数据。

有关更多信息，请参见 [Hive 教程](https://cwiki.apache.org/confluence/display/Hive/Tutorial)。

**Topics**
+ [开始前的准备工作](#EMRforDynamoDB.Tutorial.BeforeYouBegin)
+ [步骤 1：创建 Amazon EC2 密钥对](EMRforDynamoDB.Tutorial.EC2KeyPair.md)
+ [第 2 步：启动一个 Amazon EMR 集群](EMRforDynamoDB.Tutorial.LaunchEMRCluster.md)
+ [第 3 步：连接到主节点](EMRforDynamoDB.Tutorial.ConnectToLeaderNode.md)
+ [第 4 步：将数据加载到 HDFS](EMRforDynamoDB.Tutorial.LoadDataIntoHDFS.md)
+ [第 5 步：将数据复制到 DynamoDB](EMRforDynamoDB.Tutorial.CopyDataToDDB.md)
+ [第 6 步：查询 DynamoDB 表中的数据](EMRforDynamoDB.Tutorial.QueryDataInDynamoDB.md)
+ [第 7 步：（可选）清除](EMRforDynamoDB.Tutorial.CleanUp.md)

## 开始前的准备工作
<a name="EMRforDynamoDB.Tutorial.BeforeYouBegin"></a>

在本教程中，您需要以下内容：
+ 一个 Amazon 账户。如果没有，请参阅 [注册 Amazon](SettingUp.DynamoWebService.md#SettingUp.DynamoWebService.SignUpForAWS)。
+ SSH 客户端 (Secure Shell)。使用 SSH 客户端连接到 Amazon EMR 集群的主节点，运行交互式命令。默认情况下，大多数 Linux、Unix 和 Mac OS X 安装均提供 SSH 客户端。Windows 用户可以下载并安装支持 SSH 的 [PuTTY](http://www.chiark.greenend.org.uk/~sgtatham/putty/) 客户端。

**后续步骤**  
[步骤 1：创建 Amazon EC2 密钥对](EMRforDynamoDB.Tutorial.EC2KeyPair.md)