排除 Amazon Database Migration Service 中的迁移任务问题 - Amazon Database Migration Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排除 Amazon Database Migration Service 中的迁移任务问题

您可以在下面找到有关解决AmazonDatabase Migration Service (Amazon DMS)。这些主题可以帮助您解决常见问题,使用Amazon DMS和选定的终端数据库。

如果您打开了AmazonSupport 案例中,您的支持工程师可能会发现您的端点数据库配置中存在的潜在问题。您的工程师可能还会要求您运行支持脚本以返回有关数据库的诊断信息。有关从此类支持脚本下载、运行和上载诊断信息的详细信息,请参阅使用诊断支持脚本Amazon DMS.

迁移任务运行缓慢

多个问题可能导致迁移任务运行缓慢,或导致后续任务的运行速度慢于初始任务的运行速度。

迁移任务运行缓慢的最常见原因是,分配给Amazon DMS复制实例。要确保您的实例拥有足够的资源来运行任务,请检查您的复制实例对 CPU、内存、交换文件和 IOPS 的使用。例如,多个将 Amazon Redshift 作为终端节点的任务是 I/O 密集型的。您可以增加复制实例的 IOPS 或跨多个复制实例拆分任务以实现更高效的迁移。

有关如何确定复制实例的大小的更多信息,请参阅选择复制实例的最佳大小.

您可以执行以下操作来提高初始迁移加载的速度:

  • 如果您的目标是 Amazon RDS 数据库实例,请确保未为目标数据库实例启用多可用区。

  • 在加载期间关闭目标数据库上的任何自动备份或日志记录功能,并在迁移完成后重新启用这些功能。

  • 如果功能适用于您的目标,请使用预置 IOPS。

  • 如果迁移数据包含 LOB,请确保已针对 LOB 迁移优化任务。有关针对 LOB 进行优化的更多信息,请参阅目标元数据任务设置.

任务状态栏不会移动

任务状态栏提供了任务进度的估计值。此估计值的质量取决于源数据库的表统计数据的质量;表统计数据的质量越好,估计值就越准确。

对于只有一个表而且该表没有预计行统计数据的任务,Amazon DMS无法提供任何类型的完成百分比估计值。在此情况下,请使用任务状态和加载行的指示来确认任务是否在运行且取得进展。

任务已完成,但未迁移任何内容

如果任务完成后未迁移任何内容,请执行以下操作。

  • 检查创建终端节点的用户是否具有对要迁移的表的读取访问权限。

  • 检查要迁移的对象是否为表。如果是视图,请更新表映射并将对象定位器指定为 “视图” 或 “全部”。有关更多信息,请参阅指定控制台中的表选择和转换规则

缺少外键和辅助索引

Amazon DMS会创建表、主键和 (在某些情况下) 唯一索引,但它不会创建有效迁移源中的数据时不需要的任何其他对象。例如,它不会创建二级索引、非主键约束或数据默认值。

要迁移数据库中的二级对象,请使用数据库的本机工具 (如果您将迁移到与源数据库相同的数据库引擎)。使用Amazon Schema Conversion Tool(Amazon SCT),如果您将迁移到的数据库引擎不同于源数据库用来迁移二级对象的数据库引擎。

连接到亚马逊 RDS 时出现问题

有多个原因导致您无法连接到设为源或目标的 Amazon RDS 数据库实例。一些要检查的项目如下:

  • 检查用户名和密码组合是否正确。

  • 检查 Amazon RDS 控制台中为实例显示的终端节点值是否与用于创建Amazon DMS终端节点。

  • 检查 Amazon RDS 控制台中为实例显示的端口值是否与分配给Amazon DMS终端节点。

  • 检查分配给 Amazon RDS 数据库实例的安全组是否允许来自 Amazon DMS 复制实例的连接。

  • 如果Amazon DMS复制实例和 Amazon RDS 数据库实例不在同一虚拟私有云 (VPC) 中,请检查数据库实例是否可公开访问。

错误消息:不正确的线程连接字符串:不正确的线程值 0

在测试与终端节点的连接时通常会出现此错误。此错误表示连接字符串中存在错误。主机 IP 地址后有一个空格。另一个是复制到连接字符串中的错误字符。

发生联网问题

最常见的联网问题涉及 Amazon DMS 复制实例所使用的 VPC 安全组。默认情况下,此安全组中的规则允许在所有端口上进入 0.0.0.0/0。在许多情况下,您可以修改此安全组或使用自己的安全组。如果是,请至少确保将出口传出到源终端节点和目标终端节点上的数据库端口。

其他与配置相关的问题可能包括以下内容:

  • 同一 VPC 中的复制实例以及源和目标终端节点— 终端节点使用的安全组必须允许从复制实例向数据库端口上的传入。确保由复制实例使用的安全组已传入到终端节点。或者,您可以在由终端节点使用的安全组中创建规则,允许访问复制实例的私有 IP 地址。

  • 源终端节点位于复制实例使用的 VPC 之外(使用互联网网关)— VPC 安全组必须包括路由规则,将并非以 VPC 为目标的流量发送到 Internet 网关。在此配置中,与终端节点的连接显示为来自复制实例上的公有 IP 地址。

  • 源终端节点位于复制实例使用的 VPC 之外(使用 NAT 网关)— 您可以使用绑定到单个 elastic network interface 的单个弹性 IP 地址来配置网络地址转换 (NAT) 网关。此 NAT 网关将收到一个 NAT 标识符 (nat-#####)。

    在某些情况下,VPC 包含到 NAT 网关而不是 Internet 网关的默认路由。在此情况下,复制实例将改为显示使用 NAT 网关的公有 IP 地址连接数据库终端节点。在这里,对 VPC 外部的数据库终端节点的传入需要允许从 NAT 地址的传入,而不是复制实例的公有 IP 地址。

有关如何使用您自己的本地名称服务器的信息,请参阅 使用您自己的本地名称服务器 .

CDC 在满载后粘滞

在多个 Amazon DMS 设置相互冲突的情况下,复制更改在完全加载迁移后将减慢或粘滞。

例如,假设目标表准备模式参数设置为不执行任何操作或者截断. 在这种情况下,您将指示Amazon DMS不对目标表执行任何设置,包括创建主索引和唯一索引。如果尚未在目标表上创建主键或唯一键,请Amazon DMS将对每个更新执行全表扫描。此方法可能会显著影响性能。

重新启动任务时出现主键冲突错误

当数据保留在上一个迁移任务中的目标数据库中时,会出现此错误。如果目标表准备模式选项设置为不执行任何操作、Amazon DMS不会对目标表执行任何操作,包括清除从上一个任务中插入的数据。

要重新启动任务并避免出现这些错误,请删除上次运行任务时插入目标表中的行。

架构初始加载失败

在某些情况下,模式的初始加载可能会失败,错误为Operation:getSchemaListDetails:errType=, status=0, errMessage=, errDetails=.

在这种情况下,Amazon DMS连接到源终端节点没有必需的权限。

任务失败,显示未知错误

未知类型错误的原因可能会有所不同。然而,我们通常会发现,该问题与分配给Amazon DMS复制实例。

要确保您的复制实例拥有足够的资源来执行迁移,请检查您的实例对 CPU、内存、交换文件和 IOPS 的使用。有关监控的更多信息,请参阅Amazon Database Migration Service指标

任务重新启动操作从头开始加载表

Amazon DMS在未完成表的初始加载时重新开始表加载。重新启动任务时,Amazon DMS当初始加载未完成时,会从一开始重新加载表。

每个任务的表数导致问题

每个复制任务的表数没有设置限制。但是,我们建议将任务中的表数限制为小于 60000,这是一个经验法则。当单个任务使用 60000 个以上的表时,资源使用通常是一个瓶颈。

在 LOB 列上创建主键时,任务失败

在完全 LOB 或有限 LOB 模式下,Amazon DMS不支持复制属于 LOB 数据类型的主键。

DMS 最初将具有 LOB 列的行迁移为 null,然后更新 LOB 列。因此,当在 LOB 列上创建主键时,初始插入失败,因为主键不能为 null。解决方法是,添加另一列作为主键,然后从 LOB 列中删除主键。

在没有主键的目标表上出现重复记录

运行满负载和 CDC 任务可以在没有主键或唯一索引的目标表上创建重复的记录。要避免在满载荷和 CDC 任务期间重复目标表上的记录,请确保目标表具有主键或唯一索引。

源端点属于保留 IP 范围

如果Amazon DMS源数据库使用的 IP 地址位于 192.168.0.0/24 的保留 IP 范围内,则源终端节点连接测试失败。以下步骤提供了一个可能的解决方法:

  1. 查找一个不在预留范围内且可以在 192.168.0.0/24 与源数据库通信的 Amazon EC2 实例。

  2. 安装 socat 代理并运行它。下面是一个示例。

    yum install socat socat -d -d -lmlocal2 tcp4-listen:database port,bind=0.0.0.0,reuseaddr,fork tcp4:source_database_ip_address:database_port &

将 EC2 实例 IP 地址和上面给出的数据库端口用于Amazon DMS终端节点。确保终端节点具有允许Amazon DMS在该数据库端口与其通信。

时间戳在 Amazon Athena 查询中被乱码

如果时间戳在 Athena 查询中出现乱码,请使用Amazon Web Services Management Console或ModifyEndpoint操作来设置parquetTimestampInMillisecond值,将您的 Amazon S3 终端节点设置为true. 有关更多信息,请参阅 。S3Settings.

排查 Oracle 的相关问题

以下内容,您可以了解有关故障排除特定于使用Amazon DMS与 Oracle 数据库一起使用。

从视图中提取数据

您可以从视图中提取一次数据;您无法将其用于持续复制。要能够从视图中提取数据,您必须将以下代码添加到额外的连接属性中的Advanced部分的内容。从视图中提取数据时,该视图将显示为目标架构上的表。

exposeViews=true

从 Oracle 12c 迁移 LOB

Amazon DMS 可使用以下两种方法捕获对 Oracle 数据库进行的更改:Binary Reader 和 Oracle LogMiner。默认情况下,Amazon DMS 使用 Oracle LogMiner 捕获更改。但在 Oracle 12c 上,Oracle LogMiner 不支持 LOB 列。要捕获对 Oracle 12c 上的 LOB 列进行的更改,请使用 Binary Reader。

在 Oracle LogMiner 和 Binary Reader 之间切换

Amazon DMS 可使用以下两种方法捕获对源 Oracle 数据库进行的更改:Binary Reader 和 Oracle LogMiner。默认情况下,使用 Oracle LogMiner。要切换到使用 Binary Reader 捕获更改,请执行以下操作:

使用 Binary Reader 捕获更改

  1. 登录到Amazon Web Services Management Console,打开Amazon DMS控制台位置https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要使用 Binary Reader 的 Oracle 源终端节点。

  4. 选择修改

  5. 选择Advanced,然后添加以下代码额外的连接属性.

    useLogminerReader=N
  6. 使用 Oracle 开发人员工具 (例如 SQL-Plus) 将以下附加权限授予Amazon DMS用于连接到 Oracle 终端节点的用户帐户。

    SELECT ON V_$TRANSPORTABLE_PLATFORM

Error: Oracle CDC 已停止 122301 Oracle CDC 已超出最大重试计数器。

如果在 Amazon DMS 能够使用所需的 Oracle 存档日志捕获更改之前从服务器中删除该日志,则会出现此错误。增加数据库服务器上的日志保留策略。对于 Amazon RDS 数据库,请运行以下过程来增加日志保留期。例如,以下代码将 Amazon RDS 数据库实例上的日志保留期增至 24 小时。

exec rdsadmin.rdsadmin_util.set_configuration('archivelog retention hours',24);

自动将补充日志记录添加到 Oracle 源终端节点

默认情况下,Amazon DMS 已禁用补充日志记录。要自动为源 Oracle 终端节点启用补充日志记录,请执行以下操作:

将补充日志记录添加到源 Oracle 终端节点

  1. 登录到Amazon Web Services Management Console,打开Amazon DMS控制台位置https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要将补充日志记录添加到的 Oracle 源终端节点。

  4. 选择修改

  5. 选择Advanced,然后将以下代码添加到额外的连接属性文本框:

    addSupplementalLogging=Y
  6. 选择修改

LOB 更改未被捕获

当前,表必须具有 Amazon DMS 的主键才能捕获 LOB 更改。如果包含 LOB 的表不具有主键,您可以执行多个操作来捕获 LOB 更改:

  • 向表添加主键。此操作与添加 ID 列并使用触发器向该列填充序列一样简单。

  • 创建将系统生成的 ID 包含为主键的表的实体化视图,并迁移该实体化视图而非表。

  • 创建逻辑备用,向表添加主键并从逻辑备用迁移。

Error: 或者 列的值过大column-name

错误 “ORA-12899: 值对于列过大column-name” 通常是由几个问题引起的。

在其中一个问题中,源数据库和目标数据库使用的字符集不匹配。

在其中的另一个问题中,两个数据库之间的国家语言支持 (NLS) 设置不同。通常,当源数据库 NLS_LENGTH_SEMANTICS 参数设置为 CHAR 而目标数据库 NLS_LENGTH_SEMANTICS 参数设置为 BYTE 时,会出现此错误。

未正确解释 NUMBER 数据类型

Oracle NUMBER 数据类型将转换为各种Amazon DMS数据类型,具体取决于 NUMBER 的精度和小数位数。此处记录了这些转换:Oracle 的源数据类型。使用源 Oracle 终端节点的额外连接属性也会影响 NUMBER 类型的转换方式。将 Oracle 作为 Amazon DMS 源时的额外连接属性中记录了这些额外连接属性。

完全加载过程中丢失记录

执行满载时,Amazon DMS在数据库级别查找打开的事务并等待事务被提交。例如,基于任务设置TransactionConsistencyTimeout=600、Amazon DMS即使打开的事务位于表映射中未包含的表上,也会等待 10 分钟。但是,如果打开的事务位于表映射中包含的表上,并且事务未按时提交,则在目标表结果中缺少记录。

您可以修改TransactionConsistencyTimeout任务设置并增加等待时间,如果您知道打开的事务将需要更长的时间来提交。

此外,请注意FailOnTransactionConsistencyBreached任务设置为false. 这意味着Amazon DMS继续应用其他事务,但未完成的事务将丢失。如果希望任务在未及时关闭未完成的事务时失败,则可以设置FailOnTransactionConsistencyBreachedtrue.

表错误

Table Error在复制期间显示在表统计信息中,如果WHERE子句不引用主键列,并且补充日志记录不适用于所有列。

要纠正该问题,请为引用的表的所有列启用补充日志记录。有关更多信息,请参阅设置补充日志记录

对 MySQL 进行问题排查

以下内容,您可以了解有关故障排除特定于使用Amazon DMS与 MySQL 数据库一起使用。

由于已禁用二进制日志记录,无法为 Amazon RDS 数据库实例终端节点完成 CDC 任务

Amazon RDS 数据库实例会因禁用自动化备份而出现该问题。可通过将备份保留期设置为非零值来启用自动备份。

与目标 MySQL 实例的连接在任务期间中断

如果涉及 LOB 的任务与 MySQL 目标的连接断开,则可能会在任务日志中看到以下类型的错误。

[TARGET_LOAD ]E: RetCode: SQL_ERROR SqlState: 08S01 NativeError: 2013 Message: [MySQL][ODBC 5.3(w) Driver][mysqld-5.7.16-log]Lost connection to MySQL server during query [122502] ODBC general error.
[TARGET_LOAD ]E: RetCode: SQL_ERROR SqlState: HY000 NativeError: 2006 Message: [MySQL][ODBC 5.3(w) Driver]MySQL server has gone away [122502] ODBC general error.

在这种情况下,您可能需要调整某些任务设置。

要解决任务与 MySQL 目标的连接断开的问题,请执行以下操作:

  • 检查数据库变量 max_allowed_packet 集是否足以保留您的最大 LOB。

  • 检查您是否让以下变量集具有较大的超时值。建议您对其中每个变量使用的值至少为 5 分钟。

    • net_read_timeout

    • net_write_timeout

    • wait_timeout

有关设置 MySQL 系统变量的信息,请参阅Service 系统变量中的MySQL 文档.

将自动提交添加到与 MySQL 兼容的终端节点

将自动提交添加到与 MySQL 兼容的目标终端节点

  1. 登录到Amazon Web Services Management Console,打开Amazon DMS控制台位置https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要将自动提交添加到的与 MySQL 兼容的目标终端节点。

  4. 选择修改

  5. 选择Advanced,然后将以下代码添加到额外的连接属性文本框:

    Initstmt= SET AUTOCOMMIT=1
  6. 选择修改

在与 MySQL 兼容的目标终端节点上禁用外键

在 MySQL 上,您可以通过将以下内容添加到额外的连接属性中的Advanced部分、Amazon Aurora MySQL 兼容版或 MariaDB 终端节点。

在与 MySQL 兼容的目标终端节点上禁用外键

  1. 登录到Amazon Web Services Management Console,打开Amazon DMS控制台位置https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要禁用外键的 MySQL、Aurora MySQL 或 MariaDB 目标终端节点。

  4. 选择修改

  5. 选择Advanced,然后将以下代码添加到额外的连接属性文本框:

    Initstmt=SET FOREIGN_KEY_CHECKS=0
  6. 选择修改

字符被替换为问号

导致出现该问题的最常见情况是,当源终端节点字符使用了 Amazon DMS 不支持的字符集进行编码时。

“错误事件” 日志条目

迁移日志中的 “错误事件” 条目通常指示已对源数据库终端节点尝试执行不受支持的数据定义语言 (DDL) 操作。不支持的 DDL 操作会导致复制实例无法跳过的事件,从而导致记录错误事件。

要解决此问题,请从头重新启动任务。执行此操作将重新加载表并在发出不受支持的 DDL 操作后的某个时间点开始捕获更改。

使用 MySQL 5.5 的更改数据捕获

Amazon DMS适用于与 Amazon RDS MySQL 兼容的数据库的更改数据捕获 (CDC) 需要基于完整图像行的二进制日志记录,此功能在 MySQL 版本 5.5 或早期版本中不受支持。要使用 Amazon DMS CDC,必须将 Amazon RDS 数据库实例升级到 MySQL 版本 5.6。

增加 Amazon RDS 数据库实例的二进制日志保留期

Amazon DMS 需要为更改数据捕获保留二进制日志文件。要增加 Amazon RDS 数据库实例上的日志保留期,请使用以下过程。以下示例将二进制日志保留期增至 24 小时。

call mysql.rds_set_configuration('binlog retention hours', 24);

日志消息:源数据库中的一些更改在应用于目标数据库时不起作用。

当 Amazon DMS 将 MySQL 数据库列的值更新为其现有值时,将从 MySQL 返回消息 zero rows affected。此行为与其他数据库引擎,如 Oracle 和 SQL Server 不同。这些引擎更新一行,甚至在替换值与当前值相同时也是如此。

Error: 标识符太长

当标识符太长时,会出现以下错误:

TARGET_LOAD E: RetCode: SQL_ERROR SqlState: HY000 NativeError: 1059 Message: MySQLhttp://ODBC 5.3(w) Driverhttp://mysqld-5.6.10Identifier name 'name' is too long 122502 ODBC general error. (ar_odbc_stmt.c:4054)

在某些情况下,您将Amazon DMS在目标数据库中创建表和主键。在这些情况下,DMS 当前不会对源数据库中已使用的主键使用相同的名称。相反,DMS 会根据表名创建主键名称。当表名较长时,创建的自动生成的标识符的长度会超出 MySQL 允许的限制。

要解决该问题,当前的方法是首先在目标数据库中预先创建表和主键。然后使用具有任务设置的任务目标表准备模式设置为不执行任何操作或者截断填充目标表。

Error: 不受支持的字符集导致字段数据转换失败

当不受支持的字符集导致字段数据转换失败时,会出现以下错误:

"[SOURCE_CAPTURE ]E: Column 'column-name' uses an unsupported character set [120112] A field data conversion failed. (mysql_endpoint_capture.c:2154)

检查与连接相关的数据库参数。以下命令可用于设置这些参数。

SHOW VARIABLES LIKE '%char%';

Error: 代码页 1252 到 UTF8 [120112] 字段数据转换失败

如果源 MySQL 数据库中具有非代码页 1252 字符,则在迁移过程中可能会发生以下错误。

[SOURCE_CAPTURE ]E: Error converting column 'column_xyz' in table 'table_xyz with codepage 1252 to UTF8 [120112] A field data conversion failed. (mysql_endpoint_capture.c:2248)

解决办法是:您可以对您的源 MySQL 终端节点使用 CharsetMapping 额外连接属性来指定字符集映射。您可能需要重启Amazon DMS迁移任务,如果您添加了此额外连接属性。

例如,下面的额外连接属性可用于源字符集为utf8或者latin1。65001 是 UTF8 代码页标识符。

CharsetMapping=utf8,65001 CharsetMapping=latin1,65001

排查 PostgreSQL 的相关问题

以下内容,您可以了解有关故障排除特定于使用Amazon DMS与 PostgreSQL 数据库一起使用。

JSON 数据类型被截断

Amazon DMS 将 PostgreSQL 中的 JSON 数据类型视为 LOB 数据类型列。这意味着,使用受限 LOB 模式时的 LOB 大小限制适用于 JSON 数据。

例如,假设有限 LOB 模式设置为 4,096 KB。在此情况下,任何大于 4,096 KB 的 JSON 数据将在 4,096 KB 限制处截断,并且 PostgreSQL 中的验证测试失败。

以下日志信息显示由于 LOB 模式设置和验证失败而截断的 JSON。

03:00:49 2017-09-19T03:00:49 [TARGET_APPLY ]E: Failed to execute statement: 'UPDATE "public"."delivery_options_quotes" SET "id"=? , "enabled"=? , "new_cart_id"=? , "order_id"=? , "user_id"=? , "zone_id"=? , "quotes"=? , "start_at"=? , "end_at"=? , "last_quoted_at"=? , "created_at"=? , "updated_at"=? WHERE "id"=? ' [1022502] (ar_odbc_stmt 2017-09-19T03:00:49 [TARGET_APPLY ]E: Failed to execute statement: 'UPDATE "public"."delivery_options_quotes" SET "id"=? , "enabled"=? , "new_cart_id"=? , "order_id"=? , "user_id"=? , "zone_id"=? , "quotes"=? , "start_at"=? , "end_at"=? , "last_quoted_at"=? , "created_at"=? , "updated_at"=? WHERE "id"=? ' [1022502] (ar_odbc_stmt.c:2415)  03:00:49 2017-09-19T03:00:49 [TARGET_APPLY ]E: RetCode: SQL_ERROR SqlState: 22P02 NativeError: 1 Message: ERROR: invalid input syntax for type json;, Error while executing the query [1022502] (ar_odbc_stmt.c:2421) 2017-09-19T03:00:49 [TARGET_APPLY ]E: RetCode: SQL_ERROR SqlState: 22P02 NativeError: 1 Message: ERROR: invalid input syntax for type json;, Error while executing the query [1022502] (ar_odbc_stmt.c:2421)

用户定义的数据类型的列未正确迁移

在从 PostgreSQL 源复制时,Amazon DMS 将为所有列(带用户定义的数据类型的列除外)创建带相同数据类型的目标表。在此类情况下,在目标中创建数据类型作为“可变字符”。

Error: 未选择要在其中执行创建操作的架构

在某些情况下,您可能会看到错误 “SQL_错误 SqlState:3F000 NativeError:7 消息:错误:未选择要在其中执行创建操作的架构。

当您的 JSON 表映射包含架构的通配符值,但源数据库不支持该值时,会出现此错误。

未使用 CDC 复制针对表的删除内容和更新内容

如果源表没有主键,则将在更改数据捕获 (CDC) 期间忽略删除和更新操作。Amazon DMS对具有主键的 PostgreSQL 表支持更改数据捕获 (CDC)。

如果某个表没有主键,提前写入 (WAL) 日志将不包含数据库行的前映像。在这种情况下,Amazon DMS无法更新表。要复制删除操作,请在源表上创建主键。

截断语句未被传播

在使用更改数据捕获 (CDC) 时,不支持 TRUNCATE 操作。Amazon DMS.

阻止 PostgreSQL 捕获 DDL

您可以添加以下额外的连接属性语句以禁止 PostgreSQL 目标终端节点捕获 DDL 语句。额外的连接属性参数是在源终端节点的高级选项卡中提供的。

captureDDLs=N

选择在其中创建用于捕获 DDL 的数据库对象的架构

您可以控制在哪些架构中创建用于捕获 DDL 的数据库对象。请添加以下额外的连接属性语句。额外的连接属性参数是在源终端节点的高级选项卡中提供的。

ddlArtifactsSchema=xyzddlschema

迁移到 PostgreSQL 后缺少 Oracle 表

在这种情况下,您的表和数据通常仍然可以访问。

Oracle 默认为大写形式的表名,PostgreSQL 默认为小写形式的表名。当您执行从 Oracle 迁移到 PostgreSQL 时,我们建议您在任务的表映射部分下提供某些转换规则。这些是转换表名称大小写的转换规则。

如果您在未使用转换规则来转换表名的大小写的情况下迁移表,请在引用表名时为其添加引号。

复制插槽磁盘使用量增加,并且 restart_lsn 停止在较长的事务(例如 ETL 工作负载)期间向前移动

启用逻辑复制后,每个事务在内存中保留的最大更改数为 4MB。之后,更改将溢出到磁盘。因此ReplicationSlotDiskUsage增加,restart_lsn在事务完成/中止并且回滚完成之前不会进行。由于它是一个长事务,因此可能需要很长时间才能完成回滚。

因此,在启用逻辑复制时,避免长时间运行的事务。相反,尝试将事务分解为几个较小的事务。

使用视图作为源的任务未复制行

要迁移视图,请将table-typeall或者view. 有关更多信息,请参阅指定控制台中的表选择和转换规则

支持视图的源如下。

  • Oracle

  • Microsoft SQL Server

  • MySQL

  • PostgreSQL

  • IBM Db2 LUW

  • SAP Adaptive Server Enterprise (ASE)

排查 Microsoft SQL Server 的问题

以下内容,您可以了解有关故障排除特定于使用Amazon DMSMicrosoft SQL Server 数据库。

捕获 SQL Server 数据库的更改时出错

更改数据捕获 (CDC) 期间出错通常指示未满足某个先决条件。例如,经常被忽视的先决条件是完整数据库备份。任务日志中会指出此忽略以及以下错误:

SOURCE_CAPTURE E: No FULL database backup found (under the 'FULL' recovery model). To enable all changes to be captured, you must perform a full database backup. 120438 Changes may be missed. (sqlserver_log_queries.c:2623)

查看将 SQL Server 作为源的先决条件将 Microsoft SQL Server 数据库作为 Amazon DMS 的源.

缺少身份列

Amazon DMS在创建目标架构时,不支持身份列。在初始加载完成后,必须添加这些列。

Error: SQL Server 不支持发布

在将 SQL Server Express 作为源终端节点时,会生成以下错误:

RetCode: SQL_ERROR SqlState: HY000 NativeError: 21106 Message: This edition of SQL Server does not support publications.

Amazon DMS当前不支持将 SQL Server Express 作为源或目标。

更改未显示在您的目标中

Amazon DMS 要求源 SQL Server 数据库处于“FULL”或“BULK LOGGED”数据恢复模式中以便一致地捕获更改。不支持 “SIMPLE” 模式。

SIMPLE 恢复模式记录允许用户恢复其数据库所需的最少信息。在发生检查点操作时,将自动截断所有非活动日志条目。

所有操作仍被记录。但是,一旦出现检查点,日志将自动截断。此截断意味着日志变为可供重复使用,并且可以覆盖较早的日志条目。当日志条目被覆盖时,无法捕获更改。这个问题就是为什么Amazon DMS不支持 SIMBER 数据恢复模型。有关将 SQL Server 作为源所需的其他先决条件的信息,请参阅将 Microsoft SQL Server 数据库作为 Amazon DMS 的源.

跨分区映射的不一致表

在更改数据捕获 (CDC) 期间,在Amazon DMS无法在桌子上正确执行 CDC。并提示类似以下消息:

[SOURCE_CAPTURE ]W: Table is not uniformly mapped across partitions. Therefore - it is excluded from CDC (sqlserver_log_metadata.c:1415) [SOURCE_CAPTURE ]I: Table has been mapped and registered for CDC. (sqlserver_log_metadata.c:835)

对 SQL Server 表运行 CDC 时,Amazon DMS 会解析 SQL Server tlog。在每条 tlog 记录上,Amazon DMS 会解析包含在更改过程中插入、更新或删除的列数据的十六进制值。

为了解析十六进制记录,Amazon DMS 会从 SQL Server 系统表中读取表元数据。这些系统表用于标识特殊结构的表列是什么,并显示它们的一些内部属性,例如“xoffset”和“空位位置”。

Amazon DMS 要求表的所有原始分区的元数据都是相同的。但在某些情况下,特殊结构化的表在其所有分区上并不具有相同的元数据。在这些情况下,Amazon DMS可以暂停该表上的 CDC,以避免错误地解析更改并向目标提供不正确的数据。变通方法包括:

  • 如果表具有群集索引,请执行索引重建。

  • 如果表没有群集索引,请将群集索引添加到表中(稍后可以根据需要删除)。

排查 Amazon Redshift 的相关问题

以下内容,您可以了解有关故障排除特定于使用Amazon DMS使用 Amazon Redshift 数据库。

加载到不同的 Amazon Redshift 集群Amazon区域

您无法加载到其他Amazon区域比您的Amazon DMS复制实例。DMS 要求您的复制实例和 Amazon Redshift 群集位于同一区域内。

Error: 关系 “awsdms_应用_例外” 已存在

在将 Redshift 终端节点指定为 PostgreSQL 终端节点时,通常会出现“关系‘awsdms_apply_exceptions’已存在”错误。要纠正该问题,请修改终端节点并将目标引擎更改为“redshift”。

其名称以“awsdms_changes”开头的表出错

当同时运行两个尝试将数据加载到同一个 Amazon Redshift 群集中的任务时,可能会出现其名称以 “awsdms_change” 开头的 “awsdms_change” 开头的表错误消息。由于临时表的命名方式,当更新同一表时,并发任务会发生冲突。

查看集群中具有诸如 dms.awsdms_changes000000000XXXX 这样的名称的表

Amazon DMS在从存储在 Amazon S3 中的文件加载数据时,创建临时表。这些临时表的名称每个都有前缀dms.awsdms_changes. 这些表是必需的,以便 Amazon DMS 能够在首次加载数据时以及在将数据放置到最终目标表之前存储数据。

使用 Amazon Redshift 所需的权限

使用Amazon DMS,则用于访问 Amazon Redshift 的用户账户必须具有以下权限:

  • CRUD(选择、插入、更新、删除)

  • 批量加载

  • 创建、更改、删除 (如果任务的定义要求)

要查看将 Amazon Redshift 作为目标所需的先决条件,请参阅将 Amazon Redshift 数据库作为的目标Amazon Database Migration Service.

排查 Amazon Aurora MySQL 的相关问题

以下内容,您可以了解有关故障排除特定于使用Amazon DMS使用 Amazon Aurora MySQL 数据库。

Error: 字符集 UTF8 字段由 “,” 终止,由 “,” 终止,包含在 “"” 中,行由 “\ n” 终止

如果您将 Amazon Aurora MySQL 用作目标,您可能会在日志中看到类似下面的错误。此类型的错误通常表示您将 ANSI_QUOTES 作为 SQL_MODE 参数的一部分。将 ANSI_QUOTES 作为 SQL_MODE 参数的一部分会导致像处理引号一样处理双引号,并且会导致您运行任务时出现问题。

要纠正此错误,请从 SQL_MODE 参数中删除 ANSI_QUOTES。

2016-11-02T14:23:48 [TARGET_LOAD ]E: Load data sql statement. load data local infile "/rdsdbdata/data/tasks/7XO4FJHCVON7TYTLQ6RX3CQHDU/data_files/4/LOAD000001DF.csv" into table `VOSPUSER`.`SANDBOX_SRC_FILE` CHARACTER SET UTF8 fields terminated by ',' enclosed by '"' lines terminated by '\n'( `SANDBOX_SRC_FILE_ID`,`SANDBOX_ID`, `FILENAME`,`LOCAL_PATH`,`LINES_OF_CODE`,`INSERT_TS`,`MODIFIED_TS`,`MODIFIED_BY`, `RECORD_VER`,`REF_GUID`,`PLATFORM_GENERATED`,`ANALYSIS_TYPE`,`SANITIZED`,`DYN_TYPE`, `CRAWL_STATUS`,`ORIG_EXEC_UNIT_VER_ID` ) ; (provider_syntax_manager.c:2561)