其他主题 - Amazon DynamoDB
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

其他主题

以下是调整使用 Hive 访问 DynamoDB 的应用程序的一些其他方法。

重试持续时间

默认情况下,如果 Hadoop 作业未在两分钟内从 DynamoDB 返回任何结果,Hive 将重新运行该作业。您可以通过修改 dynamodb.retry.duration 参数来调整此时间间隔:

SET dynamodb.retry.duration=2;

该值必须是非零整数,表示重试间隔的分钟数。的默认值为 2(分钟)。dynamodb.retry.duration

并行数据请求

从多个用户或多个应用程序向单个表发出的多个数据请求可能会耗尽预配置的读取吞吐量并降低性能。

处理持续时间

DynamoDB 中的数据一致性取决于在每个节点上执行读取和写入操作的顺序。当正在进行 Hive 查询时,其他应用程序可能会将新数据加载到 DynamoDB 表,或者修改或删除现有数据。在这种情况下,Hive 查询的结果可能无法反映查询正在运行时对数据所做的更改。

请求时间

调度 Hive 查询以便在对 DynamoDB 表的需求较低时访问 DynamoDB 表,可以改善性能。例如,如果应用程序的大多数用户住在旧金山,当大多数用户都已睡眠且未更新 DynamoDB 数据库中的记录时,您可以选择在太平洋标准时间凌晨 4:00 导出每日数据。