使用适用于 Linux、Unix、Windows 的 IBM Db2 和亚马逊 RDS 数据库 (Db2 LUW) 作为来源 Amazon DMS - Amazon 数据库迁移服务
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用适用于 Linux、Unix、Windows 的 IBM Db2 和亚马逊 RDS 数据库 (Db2 LUW) 作为来源 Amazon DMS

您可以使用 () 将数据从适用于 Linux、Unix、Windows 和 Amazon RDS (Db2 LUW) 的 IBM Db Amazon Database Migration Service 2 数据库迁移到任何支持的目标数据库。Amazon DMS

有关 Amazon DMS 支持作为源的 Linux、Unix、Windows 和 RDS 上的 Db2 版本的信息,请参阅的来源 Amazon DMS

可以使用安全套接字层 (SSL) 加密 Db2 LUW 端点与复制实例之间的连接。有关将 SSL 用于 Db2 LUW 终端节点的更多信息,请参阅将 SSL 与 Amazon Database Migration Service

使用 Db2 LUW 作为源时的先决条件 Amazon DMS

需要先满足以下先决条件,然后才能将 Db2 LUW 数据库作为源。

要启用持续复制(也称为更改数据捕获 (CDC)),请执行以下操作:

  • 将数据库设置为可恢复,这 Amazon DMS 需要捕获更改。如果数据库配置参数 LOGARCHMETH1 和/或 LOGARCHMETH2 设置为 ON,则数据库是可恢复的。

    如果您的数据库是可恢复的,则 Amazon DMS 可以在ARCHIVE LOG需要时访问 Db2。

  • 确保 DB2 事务日志可用,并有足够的保留期供 Amazon DMS其处理。

  • DB2 需要 SYSADMDBADM 授权才能提取事务日志记录。向用户账户授予以下权限:

    • SYSADMDBADM

    • DATAACCESS

    注意

    对于仅完全加载任务,DMS 用户账户需要 DATAACCESS 权限。

  • 使用 IBM DB2 for LUW 版本 9.7 作为源时,请按如下方式设置额外连接属性(ECA):CurrentLSN

    CurrentLSN=LSN,这里的 LSN 指定要在其中启动复制的日志序列号(LSN)。或者 CurrentLSN=scan

使用 Db2 LUW 作为源代码时的限制 Amazon DMS

Amazon DMS 不支持群集数据库。但是,您可以为集群的每个终端节点定义一个单独的 Db2 LUW。例如,您可以使用集群中的任何一个节点创建完全加载迁移任务,然后从每个节点创建单独的任务。

Amazon DMS 不支持您的源 Db2 LUW 数据库中的BOOLEAN数据类型。

在使用持续复制 (CDC) 时,以下限制将适用:

  • 当包含多个分区的表被截断时, Amazon DMS 控制台中显示的 DDL 事件数等于分区数。这是因为 Db2 LUW 为每个分区记录一个单独的 DDL。

  • 已分区表上不支持以下 DDL 操作:

    • ALTER TABLE ADD PARTITION

    • ALTER TABLE DETACH PARTITION

    • ALTER TABLE ATTACH PARTITION

  • Amazon DMS 不支持从 DB2 高可用性灾难恢复 (HADR) 备用实例进行持续复制迁移。备用实例无法访问。

  • 不支持 DECFLOAT 数据类型。因此,在持续复制期间,将忽略对 DECFLOAT 列所做的更改。

  • 不支持 RENAME COLUMN 语句。

  • 对多维聚类 (MDC) 表执行更新时,每次更新都会在 Amazon DMS 控制台中显示为 INSERT + DELETE。

  • 如果未启用任务设置 Include LOB columns in replication (在复制中包含 LOB 列),则将在持续复制期间暂停任何具有 LOB 列的表。

  • 对于 Db2 LUW 版本 10.5 及更高版本,将忽略包含存储数据的可变长度字符串列。 out-of-row 此限制仅适用于对于具有 VARCHAR 和 VARGRAPHIC 等数据类型的列,那些使用扩展行大小创建的表。要解决此限制,请将表移至具有较大页面大小的表格空间。有关更多信息,请参阅如果我想更改 DB2 表空间的页面大小该怎么办

  • 对于正在进行的复制,DMS 不支持对 DB2 LOAD 实用程序在页面级别加载的数据进行迁移。相反,请使用 IMPORT 实用程序,该实用程序使用 SQL 插入。有关更多信息,请参阅 IMPORT 和 LOAD 实用程序之间的区别

  • 当复制任务正在运行时,只有在使用 DATA CAPTURE CHANGE 属性创建了表时,DMS 才捕获 CREATE TABLE DDL。

  • 使用 Db2 数据库分区功能 (DPF) 时,DMS 存在以下限制:

    • 在 DPF 环境中,DMS 无法在 Db2 节点之间协调事务。这是由于 IBM DB2READLOG API 接口中的限制造成的。在 DPF 中,事务可能跨越多个 Db2 节点,具体取决于 DB2 对数据进行分区的方式。因此,您的 DMS 解决方案必须独立地从每个 Db2 节点捕获事务。

    • 通过在多个 DMS 源端点1上设置connectNode为,DMS 可以从 DPF 集群中的每个 Db2 节点捕获本地事务。此配置对应于 DB2 服务器配置文件db2nodes.cfg中定义的逻辑节点号。

    • 单个 Db2 节点上的本地事务可能是更大的全局事务的一部分。DMS 在目标上独立应用每个本地事务,无需与其他 Db2 节点上的事务进行协调。这种独立的处理可能会导致复杂性,尤其是在分区之间移动行时。

    • 当 DMS 从多个 Db2 节点复制时,无法保证目标上的操作顺序是正确的,因为 DMS 会独立地为每个 Db2 节点应用操作。您必须确保独立于每个 Db2 节点捕获本地事务适用于您的特定用例。

    • 从 DPF 环境迁移时,我们建议先运行不带缓存事件的满载任务,然后运行仅限 CDC 的任务。我们建议每个 Db2 节点运行一个任务,从您使用端点设置设置的满载开始时间戳或 LRI(日志记录标识符)开始。StartFromContext有关确定复制起点的信息,请参阅 IBM Su pport 文档中的查找复制开始的 LSN 或 LRI 值

  • 对于持续复制(CDC),如果您计划从特定时间戳开始复制,则必须将 StartFromContext 连接属性设置为所需的时间戳。

  • 目前,DMS 不支持 Db2 pureScale 功能,这是 DB2 LUW 的扩展,可以用来扩展数据库解决方案。

  • Amazon DMS 使用适用于 Amazon RDS 的 Db2 作为来源时不支持 CDC。

使用 Db2 LUW 作为源时的端点设置 Amazon DMS

您可以使用端点设置来配置 Db2 LUW 源数据库,这与使用额外连接属性类似。您可以在使用 Amazon DMS 控制台创建源端点时指定设置,或者使用中带有 --ibm-db2-settings '{"EndpointSetting": "value", ...}' JSON 语法的create-endpointAmazon CLI命令来指定设置。

下表显示了将 Db2 LUW 用作源时可以使用的端点设置。

名称 描述

CurrentLSN

对于持续复制 (CDC),请使用 CurrentLSN 指定要在其中启动复制的日志序列号 (LSN)。

MaxKBytesPerRead

每次读取的最大字节数,以 NUMBER 值表示。默认值为 64 KB。

SetDataCaptureChanges

启用持续复制 (CDC) 作为 BOOLEAN 值。默认值为 true。

StartFromContext

对于持续复制(CDC),请使用 StartFromContext 指定日志的下限,复制将从此位置开始。StartFromContext 接受不同格式的值。有效值包括:

  • timestamp(UTC)。例如:

    '{"StartFromContext": "timestamp:2021-09-21T13:00:00"}'
  • NOW

    对于 IBM DB2 LUW 版本 10.5 及更高版本,NOW 与 CurrentLSN: scan 结合使用,从最新的 LSO 启动任务。例如:

    '{"CurrentLSN": "scan", "StartFromContext": "NOW"}'
  • 特定 LRI。例如:

    '{"StartFromContext": "0100000000000022CC000000000004FB13"}'

要确定日志文件的 LRI/LSN 范围,请按以下示例所示运行 db2flsn 命令。

db2flsn -db SAMPLE -lrirange 2

该示例的输出类似于以下内容。

S0000002.LOG: has LRI range 00000000000000010000000000002254000000000004F9A6 to 000000000000000100000000000022CC000000000004FB13

在该输出中,日志文件为 S0000002 .LOG,StartFromContextLRI 值为范围末尾的 34 字节。

0100000000000022CC000000000004FB13

IBM Db2 LUW 的源数据类型

使用 Db2 LUW 作为源的数据迁移 Amazon DMS 支持大多数 Db2 LUW 数据类型。下表显示了使用时支持的 Db2 LUW 源数据类型 Amazon DMS 以及 Amazon DMS 数据类型的默认映射。有关 Db2 LUW 数据类型的更多信息,请参阅 Db2 LUW 文档

有关如何查看目标中映射的数据类型的信息,请参阅使用的目标终端节点对应的部分。

有关 Amazon DMS 数据类型的更多信息,请参见Amazon Database Migration Service 的数据类型

Db2 LUW 数据类型

Amazon DMS 数据类型

INTEGER

INT4

SMALLINT

INT2

BIGINT

INT8

DECIMAL (p,s)

NUMERIC (p,s)

FLOAT

REAL8

DOUBLE

REAL8

REAL

REAL4

DECFLOAT (p)

如果精度为 16,则为 REAL8;如果精度为 34,则为 STRING

GRAPHIC (n)

WSTRING,用于长度大于 0 且小于或等于 127 个双字节字符的固定长度图形字符串

VARGRAPHIC (n)

WSTRING,用于长度大于 0 且小于或等于 16352 个双字节字符的可变长度图形字符串

LONG VARGRAPHIC (n)

CLOB,用于长度大于 0 且小于或等于 16352 个双字节字符的可变长度图形字符串

CHARACTER (n)

STRING,用于长度大于 0 且小于或等于 255 个双字节字符的固定长度字符串

VARCHAR (n)

STRING,用于长度大于 0 且小于或等于 32704 个双字节字符的可变长度字符串

LONG VARCHAR (n)

CLOB,用于长度大于 0 且小于或等于 32704 个双字节字符的可变长度字符串

CHAR (n) FOR BIT DATA

BYTES

VARCHAR (n) FOR BIT DATA

BYTES

LONG VARCHAR FOR BIT DATA

BYTES

DATE

DATE

TIME

TIME

TIMESTAMP

DATETIME

BLOB (n)

BLOB

最大长度为 2147483647 个字节

CLOB (n)

CLOB

最大长度为 2147483647 个字节

DBCLOB (n)

CLOB

最大长度为 1073741824 个双字节字符

XML

CLOB