DynamoDB 数据导出到 Amazon S3:工作原理 - Amazon DynamoDB
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

DynamoDB 数据导出到 Amazon S3:工作原理

要将数据从 Amazon DynamoDB 表导出到 Amazon S3 存储桶,必须在源表上启用时间点恢复 (PITR)。您可以从 PITR 窗口内的任何时间点导出表数据,最多 35 天。有关更多信息,请参阅DynamoDB 的时间点恢复

导出表不会占用表的读取容量,并且不会影响表性能和可用性。您可以将表数据导出到另一个 AWS 账户拥有的 S3 存储桶,也可以导出到与表所在的存储桶不同的区域。您的数据始终在静态和传输过程中进行加密。

您可以选择以 DynamoDB JSON 格式或 Amazon Ion 文本格式导出数据。有关导出格式的更多信息,请参阅数据对象

如果您具有写入该表的适当权限,则可以将数据导出到其他账户拥有的 S3 存储桶。目标存储桶可能位于与源表不同的区域中。有关更多信息,请参阅Amazon S3 设置和权限

可以同时导出最多 300 个导出任务或最多 100 TB 的表大小。

在一分钟时间范围内,数据湖导出请求中包含的请求时间和上次更新时间可能会有所不同。例如,如果您在下午 2:25 提交请求,则输出将保证包含提交到表(最大为 2:24)的所有数据,并且将不包括 2:26 之后提交的数据。输出可能包含或可能包含在 2:24 和 2:26 之间所做的数据修改。导出的数据也不在事务上是一致的。

AWS CloudTrail 记录表导出的所有控制台和 API 操作以启用日志记录、持续监控和审计。有关更多信息,请参阅使用 AWS CloudTrail 记录 DynamoDB 操作

DynamoDB 表导出比使用表扫描导出表的速度要快。但是,完成导出所需的确切时间取决于表的大小以及分配表数据的一致性。如果您的使用案例涉及实时分析,则可以使用 Amazon Kinesis Data Streams。有关更多信息,请参阅 Amazon Kinesis Data Streams 开发人员指南

有关 Amazon S3 的更多信息,请参阅 Amazon Simple Storage Service 开发人员指南