Amazon DynamoDB
开发人员指南 (API Version 2012-08-10)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

其他主题

以下是优化使用 Hive 访问 DynamoDB 的应用程序的一些其他方式。

重试持续时间

默认情况下,如果两分钟内没有从 DynamoDB 返回任何结果,Hive 将会重新运行 Hadoop 作业。您可以通过修改 dynamodb.retry.duration 参数调整此时间间隔:

Copy
SET dynamodb.retry.duration=2;

该值必须为非零整数,代表重试时间间隔的分钟数。dynamodb.retry.duration 的默认值为 2 (分钟)。

并行数据请求

从多个用户或多个应用程序向单个表发出的多个数据请求可能会耗尽预置的读取吞吐量并降低性能。

处理持续时间

DynamoDB 中的数据一致性取决于在每个节点上执行读取和写入操作的顺序。当正在进行 Hive 查询时,其他应用程序可能会将新数据加载到 DynamoDB 表,或者修改或删除现有数据。在这种情况下,Hive 查询的结果可能无法反映查询正在运行时对数据所做的更改。

请求时间

调度 Hive 查询以便在对 DynamoDB 表的需求较低时访问 DynamoDB 表,可以改善性能。举例来说,如果应用程序的大多数用户住在旧金山,您可以选择在大部分用户正在睡觉的太平洋标准时间凌晨 4 点导出每日数据,并且不更新 DynamoDB 数据库中的记录。