教程:使用 Amazon DynamoDB 和 Apache Hive - Amazon DynamoDB
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

教程:使用 Amazon DynamoDB 和 Apache Hive

在本教程中,您将启动一个 Amazon EMR 集群,然后使用 Apache Hive 处理存储在 DynamoDB 表中的数据。

Hive 是 Hadoop 的数据仓库应用程序,允许您处理和分析来自多个源的数据。Hive 提供了类似 SQL 的语言 HiveQL,该语言允许您使用存储在本地 Amazon EMR 集群或外部数据源(例如 Amazon DynamoDB)中的数据。

有关更多信息,请参阅 Hive 教程

开始前的准备工作

在本教程中,您需要以下内容:

  • 一个 AWS 账户。如果没有,请参阅注册 AWS

  • SSH 客户端 (安全外壳)。您可以使用 SSH 客户端连接到 领导节点 集群的 Amazon EMR 节点并运行交互式命令。默认情况下,大多数 Linux、Unix 和 Mac OS X 安装均提供 SSH 客户端。Windows 用户可以下载并安装具有 SSH 支持的 PuTTY 客户端。

下一步

步骤 1:创建 Amazon EC2 密钥对