排除 Amazon Database Migration Service 中的迁移任务问题 - Amazon 数据库迁移服务
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排除 Amazon Database Migration Service 中的迁移任务问题

在下文中,您可以找到有关对使用 Amazon Database Migration Service (Amazon DMS) 时的问题进行故障排除的主题。这些主题可以帮助您解决使用 Amazon DMS 和所选端点数据库的常见问题。

如果您已提交 Amazon Support 案例,则您的支持工程师可能会确定您的某个端点数据库配置存在潜在问题。工程师可能还会要求您运行支持脚本以返回有关数据库的诊断信息。有关从此类支持脚本下载、运行和上传诊断信息的详细信息,请参阅使用 Amazon DMS 中的诊断支持脚本

出于故障排除目的,在复制实例中Amazon DMS收集跟踪文件并转储文件。如果出现需要故障排除的问题,Amazon您可以将这些文件提供给 Support。默认情况下,DMS 会清除超过三十天的跟踪和转储文件。要选择退出跟踪和转储文件收集,请向 Support Amazon 提交案例。

迁移任务运行缓慢

多个问题可能导致迁移任务运行缓慢,或导致后续任务的运行速度慢于初始任务的运行速度。

导致迁移任务运行缓慢的最常见原因是,分配给 Amazon DMS 复制实例的资源不足。为确保您的实例拥有足够的资源来运行任务,请检查复制实例的 CPU、内存、交换文件和 IOPS 的使用情况。例如,多个将 Amazon Redshift 作为端点的任务是 I/O 密集型的。您可以增加复制实例的 IOPS 或跨多个复制实例拆分任务以实现更高效的迁移。

有关如何确定复制实例的大小的更多信息,请参阅选择复制实例的最佳大小

您可以执行以下操作来提高初始迁移加载的速度:

  • 如果您的目标是 Amazon RDS 数据库实例,请确保没有为目标数据库实例启用多可用区。

  • 在加载期间,请关闭目标数据库上的任何自动备份或日志记录功能,并在迁移完成后重新启用这些功能。

  • 如果该功能在目标上可用,请使用预调配 IOPS。

  • 如果迁移数据包含 LOB,请确保已针对 LOB 迁移优化任务。有关针对 LOB 进行优化的更多信息,请参阅目标元数据任务设置

任务状态栏没有进展

任务状态栏提供了任务进度的估计值。此估计值的质量取决于源数据库的表统计数据的质量;表统计数据的质量越好,估计值就越准确。

对于只有一个表而且该表没有估算的行统计数据的任务,Amazon DMS 无法提供任何类型的完成百分比估计值。在此情况下,可使用任务状态和行加载指示来确认任务是否正在运行且取得进展。

任务已完成但未迁移任何内容

如果任务完成后未迁移任何内容,请执行以下操作。

  • 检查创建端点的用户对要迁移的表是否具有读取权限。

  • 检查要迁移的对象是否为表。如果是视图,则更新表映射并将 object-locator 指定为“view”或“all”。有关更多信息,请参见 通过控制台指定表选择和转换规则

缺少外键和辅助索引

Amazon DMS 会创建表、主键和(在某些情况下)唯一索引,但不会创建高效迁移源中数据时不需要的任何其他对象。例如,它不会创建二级索引、非主键约束或数据默认值。

要迁移数据库中的二级对象,请使用数据库的本机工具 (如果您将迁移到与源数据库相同的数据库引擎)。如果您要迁移到的数据库引擎不同于源数据库用来迁移二级对象的数据库引擎,请使用 Amazon Schema Conversion Tool (Amazon SCT)。

Amazon DMS不创建 CloudWatch 日志

如果您的复制任务未创建 CloudWatch 日志,请确保您的账户具有该dms-cloudwatch-logs-role角色。如果此角色不存在,请执行以下操作以创建:

  1. 登录到 Amazon Web Services Management Console,然后通过以下网址打开 IAM 控制台:https://console.aws.amazon.com/iam/

  2. 选择角色选项卡。选择创建角色)。

  3. 选择受信任实体的类型部分中,选择 Amazon Web Service

  4. 选择使用案例部分中,选择 DMS

  5. 选择下一步: 权限

  6. 在搜索栏AmazonDMSCloudWatchLogsRole中输入,然后选中 AmazonD CloudWatchLogsRole MS 旁边的复选框。这会授Amazon DMS予访问权限 CloudWatch。

  7. 选择下一步:标签

  8. 选择下一步:审核

  9. 对于角色名称,输入 dms-cloudwatch-logs-role。此名称区分大小写。

  10. 选择创建角色

连接 Amazon RDS 时出现问题

有多个原因会导致您无法连接到设置为源或目标的 Amazon RDS 数据库实例。以下是一些需要检查的项目:

  • 检查用户名和密码组合是否正确。

  • 检查 Amazon RDS 控制台中为实例显示的端点值是否与用于创建 Amazon DMS 端点的端点标识符相同。

  • 检查 Amazon RDS 控制台中为实例显示的端口值是否与分配给 Amazon DMS 端点的端口相同。

  • 检查分配给 Amazon RDS 数据库实例的安全组是否允许来自 Amazon DMS 复制实例的连接。

  • 如果 Amazon DMS 复制实例和 Amazon RDS 数据库实例不在同一个虚拟私有云 (VPC) 中,请检查数据库实例是否可公开访问。

错误消息:线程连接字符串不正确:线程值 0 不正确

在测试与终端节点的连接时通常会出现此错误。此错误表示连接字符串出错。例如,主机 IP 地址后面有一个空格。另一种可能是在连接字符串中复制了错误字符。

出现网络问题

最常见的联网问题涉及 Amazon DMS 复制实例所使用的 VPC 安全组。默认情况下,此安全组中的规则允许在所有端口上进入 0.0.0.0/0。在许多情况下,您可以修改此安全组或使用自己的安全组。如果这样做,请确保在源端点和目标端点各自的数据库端口上向其提供传出。

其他与配置相关的问题可能包括:

  • 复制实例以及源和目标端点位于同一 VPC 中 – 端点所使用的安全组必须允许复制实例通过数据库端口传入。确保复制实例使用的安全组可以传入端点。或者您可以在由端点使用的安全组中创建规则,允许复制实例的私有 IP 地址访问。

  • 源端点位于复制实例所使用的 VPC 的外部(使用互联网网关)– VPC 安全组必须包含将未指定发往 VPC 的流量发送到互联网网关的路由规则。在此配置中,与终端节点的连接显示为来自复制实例上的公有 IP 地址。

  • 源端点位于复制实例所使用的 VPC 的外部(使用 NAT 网关)– 您可以使用绑定到单个弹性网络接口的单个弹性 IP 地址来配置网络地址转换 (NAT) 网关。此 NAT 网关接收 NAT 标识符 (nat-#####)。

    在某些情况下,VPC 包含指向该 NAT 网关的默认路由,而不是互联网网关。在这种情况下,复制实例改为使用 NAT 网关的公有 IP 地址联系数据库端点。此时,对 VPC 外部的数据库端点的传入需要允许从 NAT 地址的传入,而不是复制实例的公有 IP 地址。

有关如何使用您自己的本地名称服务器的信息,请参阅 使用您自己的本地名称服务器

CDC 在完全加载后粘滞

在多个 Amazon DMS 设置相互冲突的情况下,复制更改在完全加载迁移后将减慢或粘滞。

例如,假设目标表准备模式参数设置为不执行任何操作截断。在这种情况下,您指示 Amazon DMS 不要对目标表进行任何设置,包括创建主索引和唯一索引。如果您尚未在目标表上创建主键或唯一键,则 Amazon DMS 必须对每个更新执行全表扫描。此方法将大大影响性能。

重新启动任务时出现主键冲突错误

当数据保留在上一个迁移任务中的目标数据库中时,会出现此错误。如果目标表准备模式选项设置为不执行任何操作,则 Amazon DMS 不会在目标表上进行任何准备,包括清理从上一任务中插入的数据。

要重新启动任务并避免出现这些错误,请删除上次运行任务时插入目标表中的行。

架构初始加载失败

在某些情况下,架构的初始加载可能会失败,出现错误 Operation:getSchemaListDetails:errType=, status=0, errMessage=, errDetails=

在这种情况下,Amazon DMS 用来连接到源端点的用户账户没有必要的权限。

任务失败,出现未知错误

可能会因为各种各样的原因导致出现未知类型错误。但是,我们经常发现问题涉及分配给 Amazon DMS 复制实例的资源不足。

为确保您的复制实例拥有足够的资源来执行迁移,请检查实例的 CPU、内存、交换文件和 IOPS 的使用情况。有关监控的更多信息,请参阅Amazon Database Migration Service 指标

任务重新启动操作从头开始加载表

Amazon DMS 在未完成表的初始加载时从头开始重新加载表。当任务重新启动时,Amazon DMS 在初始加载未完成时从头开始重新加载表。

每个任务的表数量导致问题

每个复制任务上的表数量没有设置限制。但是,根据经验,我们建议将一个任务中的表数量限制在 60000 以下。当单个任务使用 60000 个以上的表时,资源使用通常是一个瓶颈。

在 LOB 列上创建主键时,任务失败

在 FULL LOB 或 LIMITED LOB 模式下,Amazon DMS 不支持 LOB 数据类型的主键。

DMS 最初将具有 LOB 列的行迁移为 null,然后更新 LOB 列。因此,当在 LOB 列上创建主键时,初始插入失败,因为主键不能为 null。解决方法是添加另一列作为主键,然后从 LOB 列中删除主键。

不带主键的目标表上出现重复的记录

运行完全加载和 CDC 任务会在没有主键或唯一索引的目标表上创建重复的记录。为避免在完全加载和 CDC 任务期间在目标表上出现重复的记录,请确保目标表具有主键或唯一索引。

预留 IP 范围内的源端点失败

如果 Amazon DMS 源数据库使用的 IP 地址位于 192.168.0.0/24 的预留 IP 范围内,则源端点连接测试将失败。以下步骤提供了一个可能的解决方法:

  1. 查找一个不在预留范围内且可以与 192.168.0.0/24 中的源数据库通信的 Amazon EC2 实例。

  2. 安装 socat 代理并运行它。下面是一个示例。

    yum install socat socat -d -d -lmlocal2 tcp4-listen:database port,bind=0.0.0.0,reuseaddr,fork tcp4:source_database_ip_address:database_port &

将 Amazon EC2 实例 IP 地址和上面给出的数据库端口用于 Amazon DMS 端点。确保端点具有允许 Amazon DMS 访问数据库端口的安全组。请注意,代理需要在 DMS 任务执行期间运行。根据使用案例,您可能需要自动设置代理。

Amazon Athena 查询中的时间戳是乱码

如果 Athena 查询中的时间戳出现乱码,请使用Amazon Web Services Management Console或ModifyEndpoint操作将 Amazon S3 终端节点的值parquetTimestampInMillisecond设置为。true有关更多信息,请参阅 S3Settings

排除 Oracle 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 Oracle 数据库一起使用时的特定问题。

从视图中提取数据

您可以从视图中提取一次数据;您无法将其用于持续复制。要能够从视图中提取数据,您必须将以下代码添加到 Oracle 源端点页面的端点设置部分中。从视图中提取数据时,此视图将显示为目标架构上的表。

"ExposeViews": true

从 Oracle 12c 迁移 LOB

Amazon DMS可以使用两种方法来捕获 Oracle 数据库的更改,即二进制读取器和 Oracle LogMiner。默认情况下,Amazon DMS使用 Oracle LogMiner 来捕获更改。但是,在 Oracle 12c 上,甲骨文 LogMiner 不支持 LOB 列。要捕获对 Oracle 12c 上的 LOB 列进行的更改,请使用 Binary Reader。

在甲骨文 LogMiner和二进制阅读器之间切换

Amazon DMS可以使用两种方法来捕获源 Oracle 数据库的更改,即 Binary Reader 和 Oracle LogMiner。甲骨文 LogMiner 是默认的。要切换到使用 Binary Reader 捕获更改,请执行以下操作:

使用 Binary Reader 捕获更改
  1. 登录到 Amazon Web Services Management Console,然后通过以下网址打开 Amazon DMS 控制台:https://console.aws.amazon.com/dms/v2/

  2. 选择端点

  3. 选择要使用 Binary Reader 的 Oracle 源端点。

  4. 选择修改

  5. 选择高级,然后为额外的连接属性添加以下代码:

    useLogminerReader=N
  6. 使用 Oracle 开发人员工具(例如 SQL-Plus)将以下附加权限授予用于连接到 Oracle 端点的 Amazon DMS 用户账户:

    SELECT ON V_$TRANSPORTABLE_PLATFORM

错误:Oracle CDC 已停止 122301 Oracle CDC 已超出最大重试计数器。

如果在 Amazon DMS 能够使用所需的 Oracle 存档日志捕获更改之前从服务器中删除该日志,则会出现此错误。增加数据库服务器上的日志保留策略。对于 Amazon RDS 数据库,请运行以下过程来增加日志保留期。例如,以下代码将 Amazon RDS 数据库实例上的日志保留期增至 24 小时。

exec rdsadmin.rdsadmin_util.set_configuration('archivelog retention hours',24);

自动将补充日志记录添加到 Oracle 源端点

默认情况下,Amazon DMS 已禁用补充日志记录。要自动为源 Oracle 终端节点启用补充日志记录,请执行以下操作:

将补充日志记录添加到源 Oracle 终端节点
  1. 登录到 Amazon Web Services Management Console,然后通过以下网址打开 Amazon DMS 控制台:https://console.aws.amazon.com/dms/v2/

  2. 选择端点

  3. 选择要将补充日志记录添加到的 Oracle 源端点。

  4. 选择 Modify(修改)。

  5. 选择高级,然后将以下代码添加到额外的连接属性文本框中:

    addSupplementalLogging=Y
  6. 选择修改

未捕获 LOB 更改

当前,表必须具有 Amazon DMS 的主键才能捕获 LOB 更改。如果包含 LOB 的表不具有主键,您可以执行多个操作来捕获 LOB 更改:

  • 向表添加主键。此操作与添加 ID 列并使用触发器向该列填充序列一样简单。

  • 创建将系统生成的 ID 包含为主键的表的实体化视图,并迁移该实体化视图而非表。

  • 创建逻辑备用,向表添加主键并从逻辑备用迁移。

错误:ORA-12899: 值对于列 column-name 过大

错误“ORA-12899:值对于列 column-name 太大”通常是由几个问题引起的。

其中一个问题是源数据库和目标数据库使用的字符集不匹配。

另一个问题是两个数据库之间的国家语言支持 (NLS) 设置不同。通常,当源数据库 NLS_LENGTH_SEMANTICS 参数设置为 CHAR 而目标数据库 NLS_LENGTH_SEMANTICS 参数设置为 BYTE 时,会出现此错误。

未正确解释 NUMBER 数据类型

Oracle NUMBER 数据类型可转换为各种 Amazon DMS 数据类型,具体取决于 NUMBER 的精度和小数位数。此处记录了这些转换:Oracle 的源数据类型。使用源 Oracle 端点上的端点设置,也会影响 NUMBER 类型的转换方式。这些端点设置记录在使用 Oracle 作为 Amazon DMS 的源时的端点设置中。

完全加载期间缺少记录

执行完全加载时,Amazon DMS 会在数据库级别查找未完成的事务,然后等待事务提交。例如,根据任务设置 TransactionConsistencyTimeout=600,Amazon DMS 会等待 10 分钟,即使未完成的事务位于未包含在表映射中的表上。但是,如果未完成的事务位于表映射中包含的表上,并且该事务未及时提交,则会导致目标表中缺少记录。

如果您知道未完成的事务需要较长的时间才能提交,则可以修改 TransactionConsistencyTimeout 任务设置并延长等待时间。

另请注意,FailOnTransactionConsistencyBreached 任务设置的默认值为 false。这意味着 Amazon DMS 继续应用其他事务,但会错过未完成的事务。如果您希望在未完成的事务没有及时关闭时任务失败,则可以 FailOnTransactionConsistencyBreached 将设置为 true

表错误

如果 WHERE 子句未引用主键列,并且未对所有列使用补充日志,则 Table Error 会在复制期间出现在表统计信息中。

要修复此问题,请为所引用表的所有列启用补充日志记录。有关更多信息,请参见 设置补充日志记录

错误:无法检索 Oracle 存档的重做日志目标 ID

当您的 Oracle 源未生成任何存档日志或 V$ARCHIVED_LOG 为空时,就会发生此错误。您可以通过手动切换日志来解决错误。

对于 Amazon RDS 数据库,请运行以下过程来切换日志文件。switch_logfile 过程没有任何参数。

exec rdsadmin.rdsadmin_util.switch_logfile;

对于自管理 Oracle 源数据库,请使用以下命令强制切换日志。

ALTER SYSTEM SWITCH LOGFILE ;

评估 Oracle 重做或存档日志的读取性能

如果您的 Oracle 源遇到性能问题,则可以评估 Oracle 重做或存档日志的读取性能,以寻找提高性能的方法。要测试重做或存档日志的读取性能,请使用 Amazon DMS 诊断亚马逊机器映像 (AMI)

您可以使用 Amazon DMS 诊断 AMI 执行以下操作:

  • 使用 bFile 方法评估重做日志文件的性能。

  • 使用该 LogMiner 方法评估重做日志文件的性能。

  • 使用 PL/SQL (dbms_lob.read) 方法评估重做日志文件的性能。

  • 使用单线程来评估 ASMFile 上的读取性能。

  • 使用多线程来评估 ASMFile 上的读取性能。

  • 使用 Direct OS Readfile() Windows 或 Pread64 Linux 函数来评估重做日志文件。

然后,您可以根据结果采取补救措施。

测试 Oracle 重做或归档日志文件的读取性能
  1. 创建 Amazon DMS 诊断 AMI Amazon EC2 实例并连接到该实例。

    有关更多信息,请参阅使用 Amazon DMS 诊断 AMI

  2. 运行 awsreplperf 命令。

    $ awsreplperf

    该命令显示 Amazon DMS Oracle 读取性能实用程序选项。

    0. Quit 1. Read using Bfile 2. Read using LogMiner 3. Read file PL/SQL (dms_lob.read) 4. Read ASMFile Single Thread 5. Read ASMFile Multi Thread 6. Readfile() function
  3. 从列表中选择一个选项。

  4. 输入以下数据库连接和存档日志信息。

    Oracle user name [system]: Oracle password: Oracle connection name [orcllx]: Connection format hostname:port/instance Oracle event trace? [N]: Default N = No or Y = Yes Path to redo or archive log file []:
  5. 检查显示的输出以获取相关的读取性能信息。例如,以下显示了选择选项编号 2 “读取使用” 可能产生的输出 LogMiner。

    
                            读取性能实用程序输出
  6. 要退出该实用程序,请输入 0(零)。

后续步骤
  • 当结果显示读取速度低于可接受的阈值时,请在端点上运行 Oracle 诊断支持脚本,查看“等待时间”、“加载配置文件”和“IO 配置文件”部分。然后调整任何可能提高读取性能的异常配置。例如,如果您的重做日志文件最大为 2 GB,请尝试将 LOG_BUFFER 增加到 200 MB 以帮助提高性能。

  • 查看 Amazon DMS 最佳实践,确保以最佳方式配置了您的 DMS 复制实例、任务和端点。

排除 MySQL 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 MySQL 数据库一起使用时的特定问题。

由于已禁用二进制日志记录,无法为 Amazon RDS 数据库实例终端节点完成 CDC 任务

Amazon RDS 数据库实例会因禁用自动化备份而出现该问题。可通过将备份保留期设置为非零值来启用自动备份。

与目标 MySQL 实例的连接在任务期间中断

如果涉及 LOB 的任务与 MySQL 目标的连接断开,则您可能需要在任务日志中查看以下类型的错误。

[TARGET_LOAD ]E: RetCode: SQL_ERROR SqlState: 08S01 NativeError: 2013 Message: [MySQL][ODBC 5.3(w) Driver][mysqld-5.7.16-log]Lost connection to MySQL server during query [122502] ODBC general error.
[TARGET_LOAD ]E: RetCode: SQL_ERROR SqlState: HY000 NativeError: 2006 Message: [MySQL][ODBC 5.3(w) Driver]MySQL server has gone away [122502] ODBC general error.

在这种情况下,您可能需要调整某些任务设置。

要解决任务与 MySQL 目标的连接断开的问题,请执行以下操作:

  • 检查数据库变量 max_allowed_packet 集是否足以保留您的最大 LOB。

  • 检查您是否让以下变量集具有较大的超时值。建议您对其中每个变量使用的值至少为 5 分钟。

    • net_read_timeout

    • net_write_timeout

    • wait_timeout

有关设置 MySQL 系统变量的信息,请参阅 MySQL 文档中的服务器系统变量

将自动提交添加到与 MySQL 兼容的终端节点

将自动提交添加到与 MySQL 兼容的目标终端节点
  1. 登录到 Amazon Web Services Management Console,然后通过以下网址打开 Amazon DMS 控制台:https://console.aws.amazon.com/dms/v2/

  2. 选择端点

  3. 选择要将自动提交添加到的与 MySQL 兼容的目标端点。

  4. 选择修改

  5. 选择高级,然后将以下代码添加到额外的连接属性文本框中:

    Initstmt= SET AUTOCOMMIT=1
  6. 选择修改

在与 MySQL 兼容的目标终端节点上禁用外键

在目标 MySQL、Amazon Aurora MySQL 兼容版或 MariaDB 端点的高级部分的额外的连接属性中,您可以添加以下内容以在 MySQL 上禁用外键检查。

在与 MySQL 兼容的目标终端节点上禁用外键
  1. 登录到 Amazon Web Services Management Console,然后通过以下网址打开 Amazon DMS 控制台:https://console.aws.amazon.com/dms/v2/

  2. 选择端点

  3. 选择要禁用外键的 MySQL、Aurora MySQL 或 MariaDB 目标端点。

  4. 选择修改

  5. 选择高级,然后将以下代码添加到额外的连接属性文本框中:

    Initstmt=SET FOREIGN_KEY_CHECKS=0
  6. 选择修改

字符被替换为问号

导致出现该问题的最常见情况是,当源终端节点字符使用了 Amazon DMS 不支持的字符集进行编码时。

“错误事件”日志条目

迁移日志中的“错误事件”条目通常指示对源数据库端点尝试执行了不受支持的数据定义语言 (DDL) 操作。不支持的 DDL 操作会导致复制实例无法跳过的事件,从而导致记录错误事件。

要修复此问题,请从头开始重新启动任务。这样做会重新加载表,并在发出不支持的 DDL 操作后的时间点开始捕获更改。

使用 MySQL 5.5 的更改数据捕获

Amazon RDS MySQL 兼容数据库的 Amazon DMS 更改数据捕获 (CDC, Change Data Capture) 需要完整映像的基于行的二进制日志记录,此功能在 MySQL 版本 5.5 或早期版本中不受支持。要使用 Amazon DMS CDC,必须将 Amazon RDS 数据库实例升级到 MySQL 版本 5.6。

增加 Amazon RDS 数据库实例的二进制日志保留期

Amazon DMS 需要为更改数据捕获保留二进制日志文件。要增加 Amazon RDS 数据库实例上的日志保留期,请使用以下过程。以下示例将二进制日志保留期增至 24 小时。

call mysql.rds_set_configuration('binlog retention hours', 24);

日志消息:源数据库中的一些更改在应用于目标数据库时不起作用。

当 Amazon DMS 将 MySQL 数据库列的值更新为其现有值时,将从 MySQL 返回消息 zero rows affected。这种行为与其他数据库引擎(例如 Oracle 和 SQL Server)不同。即使替换值与当前值相同,这些引擎也会更新一行。

错误:标识符太长

当标识符太长时,会出现以下错误:

TARGET_LOAD E: RetCode: SQL_ERROR SqlState: HY000 NativeError: 1059 Message: MySQLhttp://ODBC 5.3(w) Driverhttp://mysqld-5.6.10Identifier name 'name' is too long 122502 ODBC general error. (ar_odbc_stmt.c:4054)

在某些情况下,您可以将 Amazon DMS 设置为在目标数据库中创建表和主键。在这些情况下,DMS 当前为主键使用的名称,与源数据库中使用的主键名不同。相反,DMS 创建基于表名的主键名。当表名较长时,所创建的自动生成标识符的长度会超出 MySQL 允许的限制。

为了解决这个问题,当前的方法是先在目标数据库中预先创建表和主键。然后使用任务,将任务设置目标表准备模式设置为不执行任何操作截断来填充目标表。

错误:不受支持的字符集导致字段数据转换失败

当不受支持的字符集导致字段数据转换失败时,会出现以下错误:

"[SOURCE_CAPTURE ]E: Column 'column-name' uses an unsupported character set [120112] A field data conversion failed. (mysql_endpoint_capture.c:2154)

请检查与连接相关的数据库参数。以下命令可用于设置这些参数。

SHOW VARIABLES LIKE '%char%';

错误:代码页 1252 到 UTF8 [120112] 字段数据转换失败

如果源 MySQL 数据库中具有非代码页 1252 字符,则在迁移过程中可能会发生以下错误。

[SOURCE_CAPTURE ]E: Error converting column 'column_xyz' in table 'table_xyz with codepage 1252 to UTF8 [120112] A field data conversion failed. (mysql_endpoint_capture.c:2248)

解决办法是:您可以对您的源 MySQL 终端节点使用 CharsetMapping 额外连接属性来指定字符集映射。如果您添加此端点设置,则可能需要从头开始重新启动 Amazon DMS 迁移任务。

例如,以下端点设置可用于源字符集为 Utf8latin1 的 MySQL 源端点。65001 是 UTF8 代码页标识符。

CharsetMapping=utf8,65001 CharsetMapping=latin1,65001

索引、外键或级联更新内容或删除内容未迁移

Amazon DMS 不支持迁移次要对象,例如索引和外键。要复制通过级联更新或删除操作对子表所做的更改,您需要在目标表上激活触发外键约束。要解决此限制,请在目标表上手动创建外键。然后,为完全加载和 CDC 创建单个任务,或者为完全加载和 CDC 创建两个单独的任务,如下所述:

创建支持完全加载和 CDC 的单个任务

此过程介绍如何为完全加载和 CDC 使用单个任务来迁移外键和索引。

创建完全加载和 CDC 任务
  1. 在目标上手动创建带有外键和索引的表,以匹配源表。

  2. 将以下 ECA 添加到目标 Amazon DMS 端点:

    Initstmt=SET FOREIGN_KEY_CHECKS=0;
  3. 创建 DO_NOTHING 任务,将 TargetTablePrepMode 设置为 Amazon DMS。

  4. Stop task after full load completes 设置为 StopTaskCachedChangesApplied

  5. 启动任务。Amazon DMS 在完成完全加载后自动停止任务,并应用所有缓存的更改。

  6. 移除您之前添加的 SET FOREIGN_KEY_CHECKS ECA。

  7. 继续执行任务。任务进入 CDC 阶段,并将源数据库的持续更改应用到目标。

分别创建完全加载任务和 CDC 任务

这些过程介绍如何分别为完全加载和 CDC 使用单独的任务来迁移外键和索引。

创建完全加载任务
  1. 在目标上手动创建带有外键和索引的表,以匹配源表。

  2. 将以下 ECA 添加到目标 Amazon DMS 端点:

    Initstmt=SET FOREIGN_KEY_CHECKS=0;
  3. 创建 Amazon DMS 任务,将 TargetTablePrepMode 参数设置为 DO_NOTHING,并将 EnableValidation 设置为 FALSE

  4. 启动任务。Amazon DMS 在完成完全加载后自动停止任务,并应用所有缓存的更改。

  5. 任务完成后,记下 UTC 格式的完全加载任务开始时间,或者二进制日志文件名和位置,以启动仅限 CDC 的任务。请参阅日志,获取从初始完全加载开始时间的时间戳,采用 UTC 格式。

创建仅限 CDC 的任务
  1. 移除您之前设置的 SET FOREIGN_KEY_CHECKS ECA。

  2. 创建仅 CDC 的任务,并将起始位置设置为上一步中记录的完全加载开始时间。或者,您可以使用上一步中记录的二进制日志位置。将 TargetTablePrepMode 设置为 DO_NOTHING。如果需要,请将 EnableValidation 设置设为 TRUE 来启用数据验证。

  3. 启动仅限 CDC 的任务,并监控日志中是否存在错误。

注意

此解决方法仅适用于 MySQL 到 MySQL 的迁移。此方法不能与批量应用功能一起使用,因为批量应用要求目标表没有活动外键。

排除 PostgreSQL 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 PostgreSQL 数据库一起使用时的特定问题。

JSON 数据类型被截断

Amazon DMS 将 PostgreSQL 中的 JSON 数据类型视为 LOB 数据类型列。这意味着,使用受限 LOB 模式时的 LOB 大小限制适用于 JSON 数据。

例如,假设有限的 LOB 模式设置为 4096 KB。在这种情况下,任何大于 4096 KB 的 JSON 数据都会在 4096 KB 的限制下被截断,无法通过 PostgreSQL 中的验证测试。

以下日志信息显示 JSON 由于受限 LOB 模式设置而截断,并且验证失败。

03:00:49 2017-09-19T03:00:49 [TARGET_APPLY ]E: Failed to execute statement: 'UPDATE "public"."delivery_options_quotes" SET "id"=? , "enabled"=? , "new_cart_id"=? , "order_id"=? , "user_id"=? , "zone_id"=? , "quotes"=? , "start_at"=? , "end_at"=? , "last_quoted_at"=? , "created_at"=? , "updated_at"=? WHERE "id"=? ' [1022502] (ar_odbc_stmt 2017-09-19T03:00:49 [TARGET_APPLY ]E: Failed to execute statement: 'UPDATE "public"."delivery_options_quotes" SET "id"=? , "enabled"=? , "new_cart_id"=? , "order_id"=? , "user_id"=? , "zone_id"=? , "quotes"=? , "start_at"=? , "end_at"=? , "last_quoted_at"=? , "created_at"=? , "updated_at"=? WHERE "id"=? ' [1022502] (ar_odbc_stmt.c:2415)  03:00:49 2017-09-19T03:00:49 [TARGET_APPLY ]E: RetCode: SQL_ERROR SqlState: 22P02 NativeError: 1 Message: ERROR: invalid input syntax for type json;, Error while executing the query [1022502] (ar_odbc_stmt.c:2421) 2017-09-19T03:00:49 [TARGET_APPLY ]E: RetCode: SQL_ERROR SqlState: 22P02 NativeError: 1 Message: ERROR: invalid input syntax for type json;, Error while executing the query [1022502] (ar_odbc_stmt.c:2421)

用户定义的数据类型的列未正确迁移

在从 PostgreSQL 源复制时,Amazon DMS 将为所有列(带用户定义的数据类型的列除外)创建带相同数据类型的目标表。在此类情况下,在目标中创建数据类型作为“可变字符”。

错误:未选择要在其中执行创建操作的架构

在某些情况下,您可能会看到错误 “SQL_ERROR SqlState:3F000:7 消息 NativeError:错误:未选择要在中创建的架构”。

当您的 JSON 表映射包含架构的通配符值但源数据库不支持该值时,可能会发生此错误。

未使用 CDC 复制针对表的删除内容和更新内容

如果源表没有主键,则更改数据捕获 (CDC) 期间的删除和更新操作将被忽略。Amazon DMS支持带有主键的 PostgreSQL 表的更改数据捕获 (CDC)。

如果某个表没有主键,提前写入日志 (WAL) 将不包含数据库行的前映像。在这种情况下,Amazon DMS 无法更新表。对于要复制的删除操作,请在源表上创建主键。

未传播截断语句

在使用更改数据捕获 (CDC) 时,Amazon DMS 不支持 TRUNCATE 操作。

阻止 PostgreSQL 捕获 DDL

您可通过添加以下端点设置语句来阻止 PostgreSQL 目标端点捕获 DDL 语句。

"CaptureDDLs": "N"

选择在其中创建用于捕获 DDL 的数据库对象的架构

您可以控制在哪些架构中创建用于捕获 DDL 的数据库对象。添加以下端点设置语句。端点设置参数在源端点的选项卡中可用。

"DdlArtifactsSchema: "xyzddlschema"

迁移到 PostgreSQL 后缺少 Oracle 表

在这种情况下,您的表和数据通常仍然可以访问。

Oracle 默认为大写表名,而 PostgreSQL 默认为小写表名。当您执行从 Oracle 到 PostgreSQL 的迁移时,我们建议您在任务的表映射部分下提供特定转换规则。这些是转换表名大小写的转换规则。

如果您在未使用转换规则来转换表名的大小写的情况下迁移表,请在引用表名时为其添加引号。

ReplicationSlotDiskUsage 在长时间交易(例如 ETL 工作负载)期间,增加并且 restart_lsn 停止向前移动

启用逻辑复制后,每个事务在内存中保留的最大更改数为 4MB。之后,更改会溢出到磁盘。因此,ReplicationSlotDiskUsage 会增加,并且在事务完成/中止并且回滚完成之前,restart_lsn 不会有进展。由于这是一个长时间运行的事务,可能需要花费较长时间回滚。

因此,在启用逻辑复制时,请避免长时间运行的事务。请改为尝试将事务分成几个较小的事务。

使用视图作为源的任务未复制行

要迁移视图,请将 table-type 设置为 allview。有关更多信息,请参见 通过控制台指定表选择和转换规则

以下来源支持视图。

  • Oracle

  • Microsoft SQL Server

  • MySQL

  • PostgreSQL

  • IBM Db2 LUW

  • SAP Adaptive Server Enterprise (ASE)

排除 Microsoft SQL Server 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 Microsoft SQL Server 数据库一起使用时的特定问题。

捕获 SQL Server 数据库的更改时出错

更改数据捕获 (CDC) 期间出错通常指示未满足某个先决条件。例如,经常被忽视的先决条件是完整数据库备份。任务日志中会指出此忽略以及以下错误:

SOURCE_CAPTURE E: No FULL database backup found (under the 'FULL' recovery model). To enable all changes to be captured, you must perform a full database backup. 120438 Changes may be missed. (sqlserver_log_queries.c:2623)

使用微软 SQL Server 数据库作为来源 Amazon DMS中查看有关将 SQL Server 作为源的先决条件。

缺少身份列

在创建目标架构时,Amazon DMS 不支持身份列。在初始加载完成后,必须添加这些列。

错误:SQL Server 不支持发布

在将 SQL Server Express 作为源终端节点时,会生成以下错误:

RetCode: SQL_ERROR SqlState: HY000 NativeError: 21106 Message: This edition of SQL Server does not support publications.

Amazon DMS 当前不支持将 SQL Server Express 作为源或目标。

更改未显示在目标中

Amazon DMS 要求源 SQL Server 数据库处于“FULL”或“BULK LOGGED”数据恢复模式中以便一致地捕获更改。不支持“SIMPLE”模式。

SIMPLE 恢复模式记录允许用户恢复其数据库所需的最少信息。在发生检查点操作时,将自动截断所有非活动日志条目。

所有操作仍会被记录下来。但是,一旦出现检查点,日志就会自动截断。这种截断意味着日志可供重复使用,并且可以覆盖较旧的日志条目。当日志条目被覆盖时,无法捕获更改。这个问题就是 Amazon DMS 不支持 SIMPLE 数据恢复模式的原因。有关将 SQL Server 作为源所需的其他先决条件的信息,请参阅使用微软 SQL Server 数据库作为来源 Amazon DMS

跨分区映射的不一致表

在更改数据捕获 (CDC) 期间,当 Amazon DMS 无法对表正确执行 CDC 时,对特殊结构的表的迁移将暂停。并提示类似以下消息:

[SOURCE_CAPTURE ]W: Table is not uniformly mapped across partitions. Therefore - it is excluded from CDC (sqlserver_log_metadata.c:1415) [SOURCE_CAPTURE ]I: Table has been mapped and registered for CDC. (sqlserver_log_metadata.c:835)

对 SQL Server 表运行 CDC 时,Amazon DMS 会解析 SQL Server tlog。在每条 tlog 记录上,Amazon DMS 会解析包含在更改过程中插入、更新或删除的列数据的十六进制值。

为了解析十六进制记录,Amazon DMS 会从 SQL Server 系统表中读取表元数据。这些系统表用于标识特殊结构的表列是什么,并显示它们的一些内部属性,例如“xoffset”和“空位位置”。

Amazon DMS 要求表的所有原始分区的元数据都是相同的。但是在某些情况下,特殊结构的表在所有分区上没有相同的元数据。在这些情况下,Amazon DMS 可以暂停该表上的 CDC,以避免错误地解析更改并向目标提供错误的数据。解决方法如下所示:

  • 如果表具有集群索引,请执行索引重建。

  • 如果表没有集群索引,请向表中添加集群索引(稍后可以根据需要删除)。

排除 Amazon Redshift 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 Amazon Redshift 数据库一起使用时的特定问题。

加载到不同 Amazon 区域内的 Amazon Redshift 集群中

您不能加载到与您的 Amazon DMS 复制实例位于不同 Amazon 区域的 Amazon Redshift 集群中。DMS 要求您的复制实例和 Amazon Redshift 集群处于相同区域中。

错误:关系“attrep_apply_exceptions”已存在

在将 Redshift 终端节点指定为 PostgreSQL 终端节点时,通常会出现“关系‘awsdms_apply_exceptions’已存在”错误。要纠正该问题,请修改终端节点并将目标引擎更改为“redshift”。

其名称以“awsdms_changes”开头的表出错

同时运行两个尝试将数据加载到同一个 Amazon Redshift 集群中的任务时,通常会出现名称以“awsdms_changes”开头的表错误消息。由于临时表的命名方式,当更新同一表时,并发任务会发生冲突。

查看集群中名称类似于 dms.awsdms_changes000000000XXXX 的表

从存储在 Amazon S3 中的文件加载数据时,Amazon DMS 创建临时表。这些临时表的名称的前缀均为 dms.awsdms_changes。这些表是必需的,以便 Amazon DMS 能够在首次加载数据时以及在将数据放置到最终目标表之前存储数据。

使用 Amazon Redshift 所需的权限

要将 Amazon DMS 与 Amazon Redshift 一起使用,您用来访问 Amazon Redshift 的用户账户必须具有以下权限:

  • CRUD(选择、插入、更新、删除)

  • 批量加载

  • 创建、更改、删除(如果任务的定义要求)

要查看有关将 Amazon Redshift 作为目标的所有先决条件,请参阅将 Amazon Redshift 数据库作为 Amazon Database Migration Service 目标

排除 Amazon Aurora MySQL 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 Amazon Aurora MySQL 数据库一起使用时的特定问题。

错误:CHARACTER SET UTF8 字段由“,”终止,包含在“"”中,行由“\n”终止

如果您使用 Amazon Aurora MySQL 作为目标,则可能会在日志中看到类似以下内容的错误。此类错误通常表示您将 ANSI_QUOTES 作为 SQL_MODE 参数的一部分。将 ANSI_QUOTES 作为 SQL_MODE 参数的一部分会导致像处理引号一样处理双引号,在运行任务时导致出现问题。

要纠正此错误,请从 SQL_MODE 参数中删除 ANSI_QUOTES。

2016-11-02T14:23:48 [TARGET_LOAD ]E: Load data sql statement. load data local infile "/rdsdbdata/data/tasks/7XO4FJHCVON7TYTLQ6RX3CQHDU/data_files/4/LOAD000001DF.csv" into table `VOSPUSER`.`SANDBOX_SRC_FILE` CHARACTER SET UTF8 fields terminated by ',' enclosed by '"' lines terminated by '\n'( `SANDBOX_SRC_FILE_ID`,`SANDBOX_ID`, `FILENAME`,`LOCAL_PATH`,`LINES_OF_CODE`,`INSERT_TS`,`MODIFIED_TS`,`MODIFIED_BY`, `RECORD_VER`,`REF_GUID`,`PLATFORM_GENERATED`,`ANALYSIS_TYPE`,`SANITIZED`,`DYN_TYPE`, `CRAWL_STATUS`,`ORIG_EXEC_UNIT_VER_ID` ) ; (provider_syntax_manager.c:2561)

排除 SAP ASE 的问题

接下来,您可以了解如何排除将 Amazon DMS 与 SAP ASE 数据库一起使用时的特定问题。

错误:当源具有包含 NULL 值的复合唯一索引时,LOB 列的值为 NULL

使用 SAP ASE 作为源时,如果表配置了允许 NULL 值的复合唯一索引,则在持续复制过程中,LOB 值可能不会迁移。这种行为通常是 DMS 复制实例客户端上默认将 ANSI_NULL 设置为 1 的结果。

为确保 LOB 字段正确迁移,请为任务的 Amazon DMS 源端点提供端点设置 'AnsiNull=0'

排除 IBM Db2 中的问题

接下来,您可以了解如何排除将 Amazon DMS 与 IBM Db2 数据库一起使用时的特定问题。

错误:不支持从时间戳恢复任务

对于持续复制 (CDC),如果您计划从特定时间戳开始复制,请将连接属性 StartFromContext 设置为所需的时间戳。有关更多信息,请参阅使用 Db2 LUW 时的端点设置。将 StartFromContext 设置为所需的时间戳可以防止出现以下问题:

Last Error Resume from timestamp is not supported Task error notification received from subtask 0, thread 0 [reptask/replicationtask.c:2822] [1020455] 'Start from timestamp' was blocked to prevent Replicate from scanning the log (to find the timestamp). When using IBM DB2 for LUW, 'Start from timestamp' is only supported if an actual change was captured by this Replicate task earlier to the specified timestamp.