DynamoDB 数据导出到 Amazon S3:工作方式 - Amazon DynamoDB
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

DynamoDB 数据导出到 Amazon S3:工作方式

使用 DynamoDB 表导出,可以在从时间点恢复窗口的任何时间,将数据从 Amazon DynamoDB 表导出到 Amazon S3 存储桶。将 DynamoDB 表导出到 S3 存储桶,可以使用其他 Amazon 服务如 Athena、Amazon Glue 和 Lake Formation,对数据进行分析和复杂查询。DynamoDB 表导出是一个完全托管的解决方案,用于批量导出 DynamoDB 表,比涉及表扫描的其他解决方法快得多。

导出表不占用表的读取容量,也不影响表的性能和可用性。可以将表数据导出到其他 Amazon 账户拥有的 S3 存储桶,以及您的表所在区域以外的其他区域。数据始终采用端到端加密。

可以使用 Amazon Web Services Management Console、Amazon Command Line Interface 或 DynamoDB API 导出 DynamoDB 表。有关更多信息,请参阅在 DynamoDB 中请求表导出

有关 Amazon 区域可用性和定价的更多信息,请参阅 Amazon DynamoDB 定价

要将 Amazon DynamoDB 表中的数据导出到 Amazon S3 存储桶,必须在源表上启用时间点恢复 (PITR)。可以在 PITR 窗口中的任何时间点导出表数据,最长可达 35 天。有关更多信息,请参阅 DynamoDB 的时间点恢复

导出表不占用表的读取容量,也不影响表的性能和可用性。可以将表数据导出到其他 Amazon 账户拥有的 S3 存储桶,以及您的表所在区域以外的其他区域。静态和传输中的数据始终加密。

可以选择以 DynamoDB JSON 格式或 Amazon Ion 文本格式导出数据。有关导出格式的更多信息,请参阅 数据对象

如果具有写入存储桶的权限,可以将数据导出到其他账户拥有的 S3 存储桶。目标存储桶可以位于与源表不同的区域。有关更多信息,请参阅Amazon S3 设置和权限

最多可以同时导出 300 个导出任务,或最多 100 TB 的表。

数据湖导出请求中包含的请求时间和上次更新时间可能会在一分钟内变化。例如,如果下午 2:25 提交请求,则输出将保证包含到 2:24 为止提交到表的所有数据,不包含 2:26 之后提交的数据。输出可以也可以不包含在 2:24 和 2:26 之间进行的数据修改。导出的数据在事务上也不一致。

Amazon CloudTrail 记录表导出的所有控制台和 API 操作,实现日志记录、持续监控和审计。有关更多信息,请参阅 使用 Amazon CloudTrail 记录 DynamoDB 操作日志

DynamoDB 表导出的设计比使用表扫描导出表更快。但是,完成导出所需的确切时间取决于表的大小以及表数据的均匀分布。如果使用案例涉及实时分析,可以使用 Amazon Kinesis Data Streams。有关更多信息,请参阅 Amazon Kinesis Data Streams 开发人员指南

有关 Amazon S3 的更多信息,请参阅 Amazon Simple Storage Service 用户指南