Amazon DynamoDB
开发人员指南 (API Version 2012-08-10)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

性能优化

当您在创建映射到 DynamoDB 表的 Hive 外部表时,不会占用 DynamoDB 的任何读取或写入容量。但是,Hive 表上的读取和写入活动 (例如 INSERTSELECT) 会直接转化为基础 DynamoDB 表上的读取和写入操作。

Amazon EMR 上的 Apache Hive 实施其自己的逻辑来实现 DynamoDB 表的 I/O 负载均衡,并试图最大限度地降低超出表的预置吞吐量的可能性。在每次 Hive 查询结束时,Amazon EMR 会返回运行时指标,包括超出预置吞吐量的次数。您可以将此信息与 DynamoDB 表的 CloudWatch 指标结合使用,提高后续请求的性能。

Amazon EMR 控制台为您的集群提供基本监控工具。有关更多信息,请参阅 Amazon EMR 管理指南中的查看和监控集群

您还可以使用基于 Web 的工具 (如 Hue、Ganglia 和 Hadoop Web 界面) 监控集群和 Hadoop 作业。有关更多信息,请参阅 Amazon EMR 管理指南中的查看 Amazon EMR 集群上托管的 Web 界面

此部分描述了调整 Hive 对 DynamoDB 外部表的操作性能所需要的步骤。