性能优化 - Amazon DynamoDB
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

性能优化

创建映射到 DynamoDB 表的 Hive 外部表时,不占用 DynamoDB 的任何读取或写入容量。但是,Hive 表的读取和写入操作(如 INSERTSELECT)直接转换为对底层 DynamoDB 表的读取和写入操作。

Amazon EMR 的 Apache Hive 采用自己的逻辑平衡 DynamoDB 表的 I/O 负载,尽可能减少超出表预置吞吐量的可能。每个 Hive 查询结束时,Amazon EMR 返回运行时指标,包括超出预置吞吐量的次数。可以使用这些信息以及 DynamoDB 表的 CloudWatch 指标,在后续请求中提高性能。

Amazon EMR 控制台为集群提供基本监控工具。有关更多信息,请参见 Amazon EMR 管理指南查看和监控集群

还可以使用基于 Web 的工具(例如 Hue、Ganglia 和 Hadoop Web 界面)监控集群和 Hadoop 任务。有关更多信息,请参见 Amazon EMR g管理指南查看 Amazon EMR 集群上托管的 Web 界面

本节介绍调整外部 DynamoDB 表的 Hive 操作性能可以采取的步骤。