Amazon DynamoDB
开发人员指南 (API Version 2012-08-10)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

性能优化

当您在创建映射到 DynamoDB 表的 Hive 外部表时,不会占用 DynamoDB 的任何读取或写入容量。但是,Hive 表上的读取和写入活动 (例如 INSERTSELECT) 会直接转化为基础 DynamoDB 表上的读取和写入操作。

Amazon EMR 上的 Apache Hive 实施其自己的逻辑来实现 DynamoDB 表的 I/O 负载均衡,并试图最大限度地降低超出表的预置吞吐量的可能性。在每次 Hive 查询结束时,Amazon EMR 会返回运行时指标,包括超出预置吞吐量的次数。您可以将此信息与 DynamoDB 表的 CloudWatch 指标结合使用,提高后续请求的性能。

Amazon EMR 控制台为您的集群提供基本监控工具。有关更多信息,请参阅 Amazon EMR 管理指南中的查看和监控集群

您还可以使用基于 Web 的工具 (如 Hue、Ganglia 和 Hadoop Web 界面) 监控集群和 Hadoop 作业。有关更多信息,请参阅 Amazon EMR 管理指南中的查看 Amazon EMR 集群上托管的 Web 界面

此部分描述了调整 Hive 对 DynamoDB 外部表的操作性能所需要的步骤。