本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon Database Migration Service(DMS)迁移到 Amazon DocumentDB:快速入门指南
准备 DMS 源
要启用 DocumentDB 变更流或启用 MongoDB Oplog 以支持 DMS 变更数据捕获(CDC),请参阅 启用变更流。
DMS 源必须保留所有正在进行的变更,直至所有包含的集合的 DMS 完全加载完成。
DocumentDB 变更流是基于时间的。确保您的
change_stream_log_retention_duration设置足够大,足以覆盖完成完全加载所需要的时间。MongoDB Oplog 为固定大小。确保其大小可容纳完全加载期间的所有操作。
设置 DMS
创建 DMS 实例、源端点和目标端点,并测试每个端点。
启用 DocumentDB 压缩
通过向 DocumentDB 集群附加自定义参数组并将 default_collection_compression 参数更新为 enabled 来启用压缩。请参阅管理集合级文档压缩了解更多信息。
创建复制任务
在 DMS 控制台的导航窗格中,选择迁移或复制,然后选择任务。
选择创建任务。
在创建任务页面的任务配置部分中:
输入唯一且有意义的任务标识符(例如,“mongodb-docdb-replication”)。
在源数据库端点下拉菜单中选择您之前创建的源端点。
在目标数据库端点下拉菜单中选择您之前创建的目标端点。
对于任务类型,选择迁移和复制。
在设置部分中:
对于任务日志,选中打开 CloudWatch 日志框。
对于编辑模式(位于部分顶部),选择 JSON 编辑器并设置以下属性:
将
ParallelApplyThreads设置为 5(位于TargetMetadata下方)。这样可以在 CDC 中每秒执行大约 1000 次插入/更新/删除操作。将
MaxFullLoadSubTasks设置为 16(位于FullLoadSettings下方)。根据您的实例大小酌情增加此值。对于大型集合(超过 100GB),请启用自动分区(在“表映射”下和
parallel-load属性下):“type”:“partitions-auto”
“number-of-partitions”:16
监控进度
使用 Amazon DMS 控制台或创建自定义控制面板(控制面板工具
FullLoadThroughputBandwidthTarget – 测量 DMS 在迁移的完全加载阶段向目标数据库传输数据时使用的网络带宽(以 KB/秒为单位)。
CDCLatencyTarget – 测量源数据库发生变更与将该变更应用于目标数据库之间的时间延迟(以秒为单位)。
CDCThroughputRowsTarget – 测量 DMS 在迁移的持续复制阶段每秒向目标数据库应用的行数。
其他信息
有关 Amazon DocumentDB 和 Amazon DMS 的更多信息,请参阅: