排除 Amazon Database Migration Service 中的迁移任务问题 - Amazon Database Migration Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排除 Amazon Database Migration Service 中的迁移任务问题

在接下来的内容中,您将了解有关排查的主题AmazonDatabase Migration Service (Amazon DMS)。这些主题可以帮助你使用两者解决常见问题Amazon DMS以及选定的端点数据库。

如果你已经打开了AmazonSupport 案例,您的支持工程师可能会发现您的终端数据库配置之一的潜在问题。您的工程师还可能会要求您运行支持脚本以返回有关数据库的诊断信息。有关从此类支持脚本下载、运行和上传诊断信息的详细信息,请参阅在中使用诊断支持脚本Amazon DMS.

迁移任务运行缓慢

多个问题可能导致迁移任务运行缓慢,或导致后续任务的运行速度慢于初始任务的运行速度。

导致迁移任务运行缓慢的最常见原因是,分配给Amazon DMS复制实例。要确保您的实例拥有足够的资源来运行任务,请检查您的复制实例对 CPU、内存、交换文件和 IOPS 的使用。例如,多个将 Amazon Redshift 作为终端节点的任务是 I/O 密集型的。您可以增加复制实例的 IOPS 或跨多个复制实例拆分任务以实现更高效的迁移。

有关如何确定复制实例的大小的更多信息,请参阅选择复制实例的最佳大小.

您可以执行以下操作来提高初始迁移加载的速度:

  • 如果您的目标是 Amazon RDS 数据库实例,请确保未为目标数据库实例启用多可用区。

  • 在加载期间关闭目标数据库上的任何自动备份或日志记录功能,并在迁移完成后重新启用这些功能。

  • 如果功能在目标上可用,请使用预置 IOPS。

  • 如果迁移数据包含 LOB,请确保已针对 LOB 迁移优化任务。有关针对 LOB 进行优化的更多信息,请参阅目标元数据任务设置.

任务状态栏不移动

任务状态栏提供了任务进度的估计值。此估计值的质量取决于源数据库的表统计数据的质量;表统计数据的质量越好,估计值就越准确。

对于只有一个表而且该表没有估算行统计数据的任务,Amazon DMS无法提供任何种类的完整百分比估计值。在这种情况下,请使用任务状态和加载行的指示来确认任务是否正在运行并且取得进展。

任务已完成但没有迁移

如果任务完成后没有迁移任何内容,请执行以下操作。

  • 检查创建终端节点的用户是否对要迁移的表具有读取访问权限。

  • 检查要迁移的对象是否是表。如果是视图,请更新表映射并将对象定位器指定为 “view” 或 “所有”。有关更多信息,请参阅 从控制台指定表选择和转换规则

缺少外键和辅助索引

Amazon DMS创建表、主键和 (在某些情况下) 唯一索引,但它不会创建有效迁移源中的数据时不需要的任何其他对象。例如,它不会创建二级索引、非主键约束或数据默认值。

要迁移数据库中的二级对象,请使用数据库的本机工具 (如果您将迁移到与源数据库相同的数据库引擎)。使用Amazon Schema Conversion Tool(Amazon SCT) 如果您将迁移到的数据库引擎不同于源数据库用来迁移辅助对象的数据库引擎。

Amazon DMS不创建 CloudWatch 日志

如果复制任务未创建 CloudWatch 日志,请确保您的账户具有dms-cloudwatch-logs-role角色。如果此角色不存在,请执行以下操作来创建它:

  1. 登录 Amazon Web Services Management Console,然后通过以下网址打开 IAM 控制台:https://console.aws.amazon.com/iam/

  2. 选择角色选项卡。选择 Create role(创建角色)。

  3. 选择受信任实体的类型部分,选择Amazon Web Service.

  4. 选择使用案例部分,选择DMS.

  5. 选择 Next:Permissions (下一步:权限)

  6. EnterAmazonDMSCloudWatchLogsRole在搜索字段中,然后选中旁边的框AmazonDMSCloudWatchLogsRole. 该授予Amazon DMS访问 CloudWatch 的权限。

  7. 选择 Next:标签

  8. 选择 Next:审核

  9. Enterdms-cloudwatch-logs-role为了Role name (角色名称). 该名称区分大小写。

  10. 选择 Create role(创建角色)。

连接到 Amazon RDS 时出现问题

有多个原因导致您无法连接到设为源或目标的 Amazon RDS 数据库实例。一些要检查的物品如下:

  • 检查用户名和密码组合是否正确。

  • 检查 Amazon RDS 控制台中为实例显示的终端节点值是否与用于创建Amazon DMS终端节点。

  • 检查 Amazon RDS 控制台中为实例显示的端口值是否与分配给Amazon DMS终端节点。

  • 检查分配给 Amazon RDS 数据库实例的安全组是否允许来自 Amazon DMS 复制实例的连接。

  • 如果Amazon DMS检查复制实例和 Amazon RDS 数据库实例不在同一虚拟私有云 (VPC) 中,检查数据库实例是否可公开访问。

错误消息:线程连接字符串不正确:线程值不正确 0

在测试与终端节点的连接时通常会出现此错误。此错误表示连接字符串中存在错误。例如,在主机 IP 地址后面有空格。另一个是复制到连接字符串中的坏字符。

发生联网问题

最常见的联网问题涉及 Amazon DMS 复制实例所使用的 VPC 安全组。默认情况下,此安全组中的规则允许在所有端口上进入 0.0.0.0/0。在许多情况下,您可以修改此安全组或使用自己的安全组。如果是,则至少要确保将出口传出到源终端节点和目标终端节点的相应数据库端口上的传出。

其他与配置相关的问题可能包括以下内容:

  • 同一 VPC 中的复制实例以及源和目标终端节点— 终端节点使用的安全组必须允许从复制实例向数据库端口的传入。确保复制实例使用的安全组已传入到终端节点。或者,您可以在由终端节点使用的安全组中创建规则,允许访问复制实例的私有 IP 地址。

  • 源终端节点位于复制实例使用的 VPC 之外(使用互联网网关)— VPC 安全组必须包括路由规则,将并非 VPC 的流量发送到 Internet 网关。在此配置中,与终端节点的连接显示为来自复制实例上的公有 IP 地址。

  • 源终端节点位于复制实例使用的 VPC 之外(使用 NAT 网关)— 您可以使用绑定到单个 elastic network interface 的单个弹性 IP 地址来配置网络地址转换 (NAT) 网关。此 NAT 网关将收到一个 NAT 标识符 (nat-######)。

    在某些情况下,VPC 包含到 NAT 网关的默认路由,而不是 Internet 网关。在这种情况下,复制实例似乎会使用 NAT 网关的公有 IP 地址与数据库终端节点联系。在这里,对 VPC 外部的数据库终端节点的传入需要允许从 NAT 地址的传入,而不是复制实例的公有 IP 地址。

有关使用您自己的本地名称服务器的信息,请参阅 使用您自己的本地名称服务器.

CDC 在完全加载后停滞

在多个 Amazon DMS 设置相互冲突的情况下,复制更改在完全加载迁移后将减慢或粘滞。

例如,假设目标表准备模式参数设置为不执行任何操作要么截断. 在这种情况下,您已指示Amazon DMS不对目标表执行任何设置,包括创建主索引和唯一索引。如果尚未在目标表上创建主键或唯一键,Amazon DMS对每个更新执行全表扫描。这种方法可能会显著影响性能。

重新启动任务时出现主键冲突错误

当数据保留在上一个迁移任务中的目标数据库中时,会出现此错误。如果目标表准备模式选项设置为不执行任何操作、Amazon DMS不会对目标表执行任何操作,包括清除从上一个任务中插入的数据。

要重新启动任务并避免出现这些错误,请删除上次运行任务时插入目标表中的行。

架构的初始加载失败

在某些情况下,模式的初始加载可能会失败,并出现错误Operation:getSchemaListDetails:errType=, status=0, errMessage=, errDetails=.

在这种情况下,使用的用户帐户Amazon DMS要连接到源终端节点没有必需的权限。

任务失败,显示未知错误

未知类型的错误的原因可能会有所不同。但是,我们通常会发现,该问题涉及分配给不足的资源。Amazon DMS复制实例。

要确保您的复制实例拥有足够的资源来执行迁移,请检查您的实例对 CPU、内存、交换文件和 IOPS 的使用。有关监控的更多信息,请参阅Amazon Database Migration Service 指标

任务重新启动操作从头开始加载表

Amazon DMS在未完成表的初始加载时重新开始表加载。重新启动任务时,Amazon DMS当初加载未完成时,从一开始就重新加载表。

每个任务的表数导致问题

每个复制任务的表数没有设置限制。但是,我们建议将任务中的表数限制在 60,000 以下,作为经验法则。当单个任务使用 60000 个以上的表时,资源使用通常是一个瓶颈。

在 LOB 列上创建主键时,任务失败

在 FULL LOB 或有限 LOB 模式下,Amazon DMS不支持复制数据类型为 LOB 的主键。

DMS 最初将具有 LOB 列的行迁移为 null,然后更新 LOB 列。因此,当在 LOB 列上创建主键时,初始插入失败,因为主键不能为 null。作为解决方法,请添加另一列作为主键,然后从 LOB 列中删除主键。

没有主键的目标表上出现重复的记录

运行满负载和 CDC 任务可以在没有主键或唯一索引的目标表上创建重复的记录。要避免在满载和 CDC 任务期间重复目标表上的记录,请确保目标表拥有主键或唯一索引。

源端点属于预留 IP 范围

如果Amazon DMS源数据库使用的 IP 地址位于 192.168.0.0/24 的保留 IP 范围内,源终端节点连接测试失败。以下步骤提供了可能的解决方法:

  1. 查找一个不在预留范围内且可以在 192.168.0.0/24 与源数据库通信的 Amazon EC2 实例。

  2. 安装 socat 代理并运行它。下面是一个示例。

    yum install socat socat -d -d -lmlocal2 tcp4-listen:database port,bind=0.0.0.0,reuseaddr,fork tcp4:source_database_ip_address:database_port &

将 EC2 实例 IP 地址和上面给出的数据库端口用于Amazon DMS终端节点。确保终端节点具有允许的安全组Amazon DMS在数据库端口与它交谈。

Amazon Athena 查询中的时间戳有乱码

如果 Athena 查询中的时间戳有乱码,请使用Amazon Web Services Management Console或者ModifyEndpoint操作来设置parquetTimestampInMillisecond对于 Amazon S3 终端节点的值true. 有关更多信息,请参阅 。S3Settings.

对 Oracle 进行问题排查

接下来,您可以了解如何解决特定于使用的问题Amazon DMS使用 Oracle 数据库。

从视图中提取数据

您可以从视图中提取一次数据;您无法将其用于持续复制。要能够从视图中提取数据,您必须将以下代码添加到额外的连接属性中的Advanced部分的内容。从视图中提取数据时,该视图将显示为目标架构上的表。

exposeViews=true

从 Oracle 12c 迁移 LOB

Amazon DMS 可使用以下两种方法捕获对 Oracle 数据库进行的更改:Binary Reader 和 Oracle LogMiner。默认情况下,Amazon DMS 使用 Oracle LogMiner 捕获更改。但在 Oracle 12c 上,Oracle LogMiner 不支持 LOB 列。要捕获对 Oracle 12c 上的 LOB 列进行的更改,请使用 Binary Reader。

在 Oracle LogMiner 和 Binary Reader 之间切换

Amazon DMS 可使用以下两种方法捕获对源 Oracle 数据库进行的更改:Binary Reader 和 Oracle LogMiner。默认情况下,使用 Oracle LogMiner。要切换到使用 Binary Reader 捕获更改,请执行以下操作:

使用 Binary Reader 捕获更改

  1. 登录到Amazon Web Services Management Console打开Amazon DMS控制台在https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要使用 Binary Reader 的 Oracle 源终端节点。

  4. 选择修改

  5. 选择Advanced选择,然后将以下代码添加额外的连接属性.

    useLogminerReader=N
  6. 使用 Oracle 开发人员工具 (例如 SQL-Plus) 将以下附加权限授予Amazon DMS用于连接到 Oracle 终端节点的用户帐户。

    SELECT ON V_$TRANSPORTABLE_PLATFORM

Error: Oracle CDC 已停止 122301 Oracle CDC 已超出最大重试计数器。

如果在 Amazon DMS 能够使用所需的 Oracle 存档日志捕获更改之前从服务器中删除该日志,则会出现此错误。增加数据库服务器上的日志保留策略。对于 Amazon RDS 数据库,请运行以下过程来增加日志保留期。例如,以下代码将 Amazon RDS 数据库实例上的日志保留期增至 24 小时。

exec rdsadmin.rdsadmin_util.set_configuration('archivelog retention hours',24);

自动将补充日志记录添加到 Oracle 源终端节点

默认情况下,Amazon DMS 已禁用补充日志记录。要自动为源 Oracle 终端节点启用补充日志记录,请执行以下操作:

将补充日志记录添加到源 Oracle 终端节点

  1. 登录到Amazon Web Services Management Console打开Amazon DMS控制台在https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要将补充日志记录添加到的 Oracle 源终端节点。

  4. 选择修改

  5. 选择Advanced选择,然后将以下代码添加到额外的连接属性文本框:

    addSupplementalLogging=Y
  6. 选择修改

LOB 更改没有被捕获

当前,表必须具有 Amazon DMS 的主键才能捕获 LOB 更改。如果包含 LOB 的表不具有主键,您可以执行多个操作来捕获 LOB 更改:

  • 向表添加主键。此操作与添加 ID 列并使用触发器向该列填充序列一样简单。

  • 创建将系统生成的 ID 包含为主键的表的实体化视图,并迁移该实体化视图而不是表。

  • 创建逻辑备用,向表添加主键并从逻辑备用迁移。

Error: ORA-12899:对于列来说价值太大了column-name

错误 “ORA-12899: 值对于列过大column-name“通常是由几个问题引起的。

在其中一个问题中,源数据库和目标数据库使用的字符集不匹配。

在其中另一个问题中,两个数据库的国家语言支持 (NLS) 设置不同。通常,当源数据库 NLS_LENGTH_SEMANTICS 参数设置为 CHAR 而目标数据库 NLS_LENGTH_SEMANTICS 参数设置为 BYTE 时,会出现此错误。

未正确解释 NUMBER 数据类型

Oracle NUMBER 数据类型将转换为各种Amazon DMS数据类型,具体取决于 NUMBER 的精度和小数位数。此处记录了这些转换:Oracle 的源数据类型。使用源 Oracle 终端节点的额外连接属性也会影响 NUMBER 类型的转换方式。将 Oracle 作为 Amazon DMS 源时的额外连接属性中记录了这些额外连接属性。

满载期间丢失记录

执行满载时,Amazon DMS在数据库级别查找未结事务并等待事务提交。例如,基于任务设置TransactionConsistencyTimeout=600、Amazon DMS即使未完成的交易在表映射中不包含的表上,也会等待 10 分钟。但是,如果打开的事务处于表映射中包含的表上,且该事务没有及时提交,那么目标表结果中会丢失记录。

您可以修改TransactionConsistencyTimeout任务设置并增加等待时间,如果您知道未结交易需要更长时间才能提交。

另请注意的默认值FailOnTransactionConsistencyBreached任务设置为false. 这意味着Amazon DMS继续应用其他交易,但未完成的交易丢失。如果您希望在未及时关闭交易时任务失败,则可以设置FailOnTransactionConsistencyBreachedtrue.

表错误

Table Error如果在复制期间出现在表统计信息中WHERE子句不引用主键列,并且没有对所有列使用补充日志记录。

要修复此问题,请为引用表的所有列启用补充日志记录。有关更多信息,请参阅设置补充日志记录

Error: 无法检索 Oracle 存档的重做日志目标 ID

如果您的 Oracle 源没有生成任何存档日志或 V$ARCHIVED_LOG 为空,就会出现此错误。你可以通过手动切换日志来解决错误。

对于 Amazon RDS 数据库,请运行以下过程来切换日志文件。这些区域有:switch_logfile过程没有参数。

exec rdsadmin.rdsadmin_util.switch_logfile;

对于自我管理的 Oracle 源数据库,请使用以下命令强制执行日志切换。

ALTER SYSTEM SWITCH LOGFILE ;

对 MySQL 进行问题排查

接下来,您可以了解如何解决特定于使用的问题Amazon DMS使用 MySQL 数据库。

由于已禁用二进制日志记录,无法为 Amazon RDS 数据库实例终端节点完成 CDC 任务

Amazon RDS 数据库实例会因禁用自动化备份而出现该问题。可通过将备份保留期设置为非零值来启用自动备份。

与目标 MySQL 实例的连接在任务期间中断

如果您的 LOB 任务与 MySQL 目标断开连接,则可能会在任务日志中看到下面的错误类型。

[TARGET_LOAD ]E: RetCode: SQL_ERROR SqlState: 08S01 NativeError: 2013 Message: [MySQL][ODBC 5.3(w) Driver][mysqld-5.7.16-log]Lost connection to MySQL server during query [122502] ODBC general error.
[TARGET_LOAD ]E: RetCode: SQL_ERROR SqlState: HY000 NativeError: 2006 Message: [MySQL][ODBC 5.3(w) Driver]MySQL server has gone away [122502] ODBC general error.

在这种情况下,您可能需要调整某些任务设置。

要解决任务与 MySQL 目标的连接断开的问题,请执行以下操作:

  • 检查数据库变量 max_allowed_packet 集是否足以保留您的最大 LOB。

  • 检查您是否让以下变量集具有较大的超时值。建议您对其中每个变量使用的值至少为 5 分钟。

    • net_read_timeout

    • net_write_timeout

    • wait_timeout

有关设置 MySQL 系统变量的信息,请参阅服务器系统变量中的MySQL 文档.

将自动提交添加到与 MySQL 兼容的终端节点

将自动提交添加到与 MySQL 兼容的目标终端节点

  1. 登录到Amazon Web Services Management Console打开Amazon DMS控制台在https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要将自动提交添加到的与 MySQL 兼容的目标终端节点。

  4. 选择修改

  5. 选择Advanced选择,然后将以下代码添加到额外的连接属性文本框:

    Initstmt= SET AUTOCOMMIT=1
  6. 选择修改

在与 MySQL 兼容的目标终端节点上禁用外键

您可以通过将以下内容添加到 MySQL 上的外键检查。额外的连接属性中的Advanced部分是目标 MySQL、Amazon Aurora MySQL 兼容版或 MariaDB 终端节点的部分。

在与 MySQL 兼容的目标终端节点上禁用外键

  1. 登录到Amazon Web Services Management Console打开Amazon DMS控制台在https://console.aws.amazon.com/dms/v2/.

  2. 选择终端节点.

  3. 选择要禁用外键的 MySQL、Aurora MySQL 或 MariaDB 目标终端节点。

  4. 选择修改

  5. 选择Advanced选择,然后将以下代码添加到额外的连接属性文本框:

    Initstmt=SET FOREIGN_KEY_CHECKS=0
  6. 选择修改

字符被替换为问号

导致出现该问题的最常见情况是,当源终端节点字符使用了 Amazon DMS 不支持的字符集进行编码时。

“错误事件” 日志条目

迁移日志中的 “错误事件” 条目通常指示已在源数据库终端节点上尝试执行不受支持的数据定义语言 (DDL) 操作。不支持的 DDL 操作会导致复制实例无法跳过的事件,从而导致记录错误事件。

要解决此问题,请从头开始重新启动任务。执行此操作将重新加载表并在发出不受支持的 DDL 操作后的某个时间点开始捕获更改。

使用 MySQL 5.5 的更改数据捕获

Amazon DMS适用于与 Amazon RDS MySQL 兼容的数据库的更改数据捕获 (CDC) 需要基于完整图像行的二进制日志记录,此功能在 MySQL 版本 5.5 或早期版本中不受支持。要使用 Amazon DMS CDC,必须将 Amazon RDS 数据库实例升级到 MySQL 版本 5.6。

增加 Amazon RDS 数据库实例的二进制日志保留期

Amazon DMS 需要为更改数据捕获保留二进制日志文件。要增加 Amazon RDS 数据库实例上的日志保留期,请使用以下过程。以下示例将二进制日志保留期增至 24 小时。

call mysql.rds_set_configuration('binlog retention hours', 24);

日志消息:在应用于目标数据库时,源数据库中的一些更改不起作用。

当 Amazon DMS 将 MySQL 数据库列的值更新为其现有值时,将从 MySQL 返回消息 zero rows affected。这种行为不同于其他数据库引擎,例如 Oracle 和 SQL Server。即使替换值与当前引擎相同,这些引擎将更新一行。

Error: 标识符太长

当标识符太长时,会出现以下错误:

TARGET_LOAD E: RetCode: SQL_ERROR SqlState: HY000 NativeError: 1059 Message: MySQLhttp://ODBC 5.3(w) Driverhttp://mysqld-5.6.10Identifier name 'name' is too long 122502 ODBC general error. (ar_odbc_stmt.c:4054)

在某些情况下,您将设置为Amazon DMS在目标数据库中创建表和主键。在这些情况下,DMS 目前不会对源数据库中使用的主键使用相同的名称。相反,DMS 根据表名创建主键名称。当表名较长时,创建的自动生成的标识符的长度会超出 MySQL 允许的限制。

要解决此问题,当前的方法是首先在目标数据库中创建表和主键。然后在任务设置中使用任务目标表准备模式设置为不执行任何操作要么截断填充目标表。

Error: 不受支持的字符集导致字段数据转换失败

当不受支持的字符集导致字段数据转换失败时,会出现以下错误:

"[SOURCE_CAPTURE ]E: Column 'column-name' uses an unsupported character set [120112] A field data conversion failed. (mysql_endpoint_capture.c:2154)

检查与连接相关的数据库参数。以下命令可用于设置这些参数。

SHOW VARIABLES LIKE '%char%';

Error: 代码页 1252 到 UTF8 [120112] 字段数据转换失败

如果源 MySQL 数据库中具有非代码页 1252 字符,则在迁移过程中可能会发生以下错误。

[SOURCE_CAPTURE ]E: Error converting column 'column_xyz' in table 'table_xyz with codepage 1252 to UTF8 [120112] A field data conversion failed. (mysql_endpoint_capture.c:2248)

解决办法是:您可以对您的源 MySQL 终端节点使用 CharsetMapping 额外连接属性来指定字符集映射。您可能需要重新启动Amazon DMS如果您添加了此额外连接属性,则从头开始迁移任务。

例如,下面的额外连接属性可用于源字符集为的 MySQL 源终端节点。utf8要么latin1。65001 是 UTF8 代码页标识符。

CharsetMapping=utf8,65001 CharsetMapping=latin1,65001

排查 PostgreSQL 的问题

接下来,您可以了解如何解决特定于使用的问题Amazon DMS使用 PostgreSQL 数据库。

JSON 数据类型被截断

Amazon DMS 将 PostgreSQL 中的 JSON 数据类型视为 LOB 数据类型列。这意味着,在使用受限 LOB 模式时,LOB 大小限制将适用于 JSON 数据。

例如,假设有限 LOB 模式设置为 4,096 KB。在这种情况下,任何大于 4,096 KB 的 JSON 数据将在 4,096 KB 限制处截断,并且 PostgreSQL 中的验证测试失败。

以下日志信息显示由于 LOB 模式设置受限且验证失败而截断的 JSON。

03:00:49 2017-09-19T03:00:49 [TARGET_APPLY ]E: Failed to execute statement: 'UPDATE "public"."delivery_options_quotes" SET "id"=? , "enabled"=? , "new_cart_id"=? , "order_id"=? , "user_id"=? , "zone_id"=? , "quotes"=? , "start_at"=? , "end_at"=? , "last_quoted_at"=? , "created_at"=? , "updated_at"=? WHERE "id"=? ' [1022502] (ar_odbc_stmt 2017-09-19T03:00:49 [TARGET_APPLY ]E: Failed to execute statement: 'UPDATE "public"."delivery_options_quotes" SET "id"=? , "enabled"=? , "new_cart_id"=? , "order_id"=? , "user_id"=? , "zone_id"=? , "quotes"=? , "start_at"=? , "end_at"=? , "last_quoted_at"=? , "created_at"=? , "updated_at"=? WHERE "id"=? ' [1022502] (ar_odbc_stmt.c:2415)  03:00:49 2017-09-19T03:00:49 [TARGET_APPLY ]E: RetCode: SQL_ERROR SqlState: 22P02 NativeError: 1 Message: ERROR: invalid input syntax for type json;, Error while executing the query [1022502] (ar_odbc_stmt.c:2421) 2017-09-19T03:00:49 [TARGET_APPLY ]E: RetCode: SQL_ERROR SqlState: 22P02 NativeError: 1 Message: ERROR: invalid input syntax for type json;, Error while executing the query [1022502] (ar_odbc_stmt.c:2421)

用户定义的数据类型的列未正确迁移

在从 PostgreSQL 源复制时,Amazon DMS 将为所有列(带用户定义的数据类型的列除外)创建带相同数据类型的目标表。在此类情况下,在目标中创建数据类型作为“可变字符”。

Error: 未选择要在其中执行创建操作的架构

在某些情况下,你可能会看到错误 “SQL_ERROR SqlState:3F000 NativeError:7. 消息:错误:未选择要在其中执行创建操作的架构”。

当您的 JSON 表映射包含架构的通配符值,但源数据库不支持该值时,会出现此错误。

未使用 CDC 复制对表的删除和更新

如果源表没有主键,则将在更改数据捕获 (CDC) 期间忽略删除和更新操作。Amazon DMS对具有主键的 PostgreSQL 表支持更改数据捕获 (CDC)。

如果某个表没有主键,提前写入 (WAL) 日志将不包括数据库行的前映像。在这种情况下,Amazon DMS无法更新表格。要复制删除操作,请在源表上创建主键。

截断语句没有被传播

在使用更改数据捕获 (CDC) 时,不支持 TRUNCATE 操作。Amazon DMS.

阻止 PostgreSQL 捕获 DDL

您可以添加以下额外的连接属性语句以禁止 PostgreSQL 目标终端节点捕获 DDL 语句。额外的连接属性参数是在源终端节点的高级选项卡中提供的。

captureDDLs=N

选择在其中创建用于捕获 DDL 的数据库对象的架构

您可以控制在哪些架构中创建用于捕获 DDL 的数据库对象。请添加以下额外的连接属性语句。额外的连接属性参数是在源终端节点的高级选项卡中提供的。

ddlArtifactsSchema=xyzddlschema

迁移到 PostgreSQL 后缺少 Oracle 表

在这种情况下,您的表和数据通常仍然可以访问。

Oracle 默认为大写形式的表名,PostgreSQL 默认为小写形式的表名。当您从 Oracle 迁移到 PostgreSQL 时,我们建议您在任务的表映射部分下提供某些转换规则。这些是转换表名称大小写的转换规则。

如果您在未使用转换规则来转换表名的大小写的情况下迁移表,请在引用表名时用引号括起来。

ReplicationSlotDiskUse 会增加,并且 restart_lsn 停止在长期事务期间(例如 ETL 工作负载)继续前进

启用逻辑复制后,每个事务保留在内存中的最大更改数为 4MB。之后,更改将溢出到磁盘。因此,ReplicationSlotDiskUsage增加,restart_lsn直到事务完成/中止并且回滚完成后才会推进。由于这是一个长期事务,因此回滚可能需要很长时间。

因此,在启用逻辑复制时,避免长时间运行的事务。相反,尝试将交易分解为几笔较小的交易。

使用视图作为源的任务未复制行

要迁移视图,请设置table-typeall要么view. 有关更多信息,请参阅 从控制台指定表选择和转换规则

支持视图的源如下。

  • Oracle

  • Microsoft SQL Server

  • MySQL

  • PostgreSQL

  • IBM Db2 LUW

  • SAP Adaptive Server Enterprise (ASE)

排查 Microsoft SQL Server 的相关问题

接下来,您可以了解如何解决特定于使用的问题Amazon DMSMicrosoft SQL Server 数据库使用。

捕获 SQL Server 数据库的更改时出错

更改数据捕获 (CDC) 期间出错通常指示未满足某个先决条件。例如,经常被忽视的先决条件是完整数据库备份。任务日志中会指出此忽略以及以下错误:

SOURCE_CAPTURE E: No FULL database backup found (under the 'FULL' recovery model). To enable all changes to be captured, you must perform a full database backup. 120438 Changes may be missed. (sqlserver_log_queries.c:2623)

查看中列出的将 SQL Server 作为源的先决条件将 Microsoft SQL Server 数据库作为 Amazon DMS 的源.

缺少身份列

Amazon DMS在创建目标架构时,不支持身份列。在初始加载完成后,必须添加这些列。

Error: SQL Server 不支持发布

在将 SQL Server Express 作为源终端节点时,会生成以下错误:

RetCode: SQL_ERROR SqlState: HY000 NativeError: 21106 Message: This edition of SQL Server does not support publications.

Amazon DMS当前不支持将 SQL Server Express 作为源或目标。

目标中未显示更改

Amazon DMS 要求源 SQL Server 数据库处于“FULL”或“BULK LOGGED”数据恢复模式中以便一致地捕获更改。不支持 “SIMPLE” 模式。

SIMPLE 恢复模式记录允许用户恢复其数据库所需的最少信息。在发生检查点操作时,将自动截断所有非活动日志条目。

仍记录所有操作。但是,一旦发生检查点,日志就会自动截断。此截断意味着日志可以重复使用,并且可以覆盖较旧的日志条目。覆盖日志条目时,无法捕获更改。这个问题就是为什么Amazon DMS不支持 SIMPLE 数据恢复模型。有关将 SQL Server 作为源所需的其他先决条件的信息,请参阅将 Microsoft SQL Server 数据库作为 Amazon DMS 的源.

跨分区映射的非统一表

在更改数据捕获 (CDC) 期间,具有专业结构的表的迁移将在以下情况下暂停。Amazon DMS无法在桌子上正确执行 CDC。并提示类似以下消息:

[SOURCE_CAPTURE ]W: Table is not uniformly mapped across partitions. Therefore - it is excluded from CDC (sqlserver_log_metadata.c:1415) [SOURCE_CAPTURE ]I: Table has been mapped and registered for CDC. (sqlserver_log_metadata.c:835)

对 SQL Server 表运行 CDC 时,Amazon DMS 会解析 SQL Server tlog。在每条 tlog 记录上,Amazon DMS 会解析包含在更改过程中插入、更新或删除的列数据的十六进制值。

为了解析十六进制记录,Amazon DMS 会从 SQL Server 系统表中读取表元数据。这些系统表用于标识特殊结构的表列是什么,并显示它们的一些内部属性,例如“xoffset”和“空位位置”。

Amazon DMS 要求表的所有原始分区的元数据都是相同的。但是在某些情况下,特殊结构化的表在其所有分区上并不具有相同的元数据。在这些情况下,Amazon DMS可以在该表上暂停 CDC,以避免错误地解析更改并为目标提供错误数据。解决方法包括:

  • 如果表具有群集索引,请执行索引重建。

  • 如果表没有群集索引,请向表中添加群集索引(稍后可以根据需要删除)。

排查 Amazon Redshift 的相关问题

接下来,您可以了解如何解决特定于使用的问题Amazon DMS使用 Amazon Redshift 数据库。

在其他集群中加载到 Amazon Redshift 集群Amazon区域

您无法加载到不同的 Amazon Redshift 集群中Amazon地区比你的Amazon DMS复制实例。DMS 要求复制实例和 Amazon Redshift 集群位于同一区域内。

Error: 关系 “awsd_apply_例外” 已存在

在将 Redshift 终端节点指定为 PostgreSQL 终端节点时,通常会出现“关系‘awsdms_apply_exceptions’已存在”错误。要纠正该问题,请修改终端节点并将目标引擎更改为“redshift”。

其名称以“awsdms_changes”开头的表出错

当同时运行两个尝试将数据加载到同一个 Amazon Redshift 群集中的任务时,会出现以 “awsdms_changes” 开头的名称以 “awsdms_changes” 开头的表错误消息。由于临时表的命名方式,当更新同一表时,并发任务会发生冲突。

查看集群中具有诸如 dms.awsdms_changes00000000000XXXX 这样的名称的表

Amazon DMS在从存储在 Amazon S3 中的文件加载数据时,创建临时表。这些临时表的名称每个都有前缀。dms.awsdms_changes. 这些表是必需的,以便 Amazon DMS 能够在首次加载数据时以及在将数据放置到最终目标表之前存储数据。

使用 Amazon Redshift 所需的权限

使用Amazon DMS对于 Amazon Redshift,您用来访问 Amazon Redshift 的用户账户必须具有以下权限:

  • CRUD (选择、插入、更新、删除)

  • 批量加载

  • 创建、更改、删除(如果任务的定义要求)

要查看将 Amazon Redshift 作为目标的先决条件,请参阅将 Amazon Redshift 数据库作为目标Amazon Database Migration Service.

排查 Amazon Aurora MySQL 的相关问题

接下来,您可以了解如何解决特定于使用的问题Amazon DMS使用 Amazon Aurora MySQL 数据库。

Error: 以 “,” 终止的字符集 UTF8 字段由 “,” 终止,行由 “\ n” 终止

如果您将 Amazon Aurora MySQL 作为目标,则可能会在日志中看到类似下面的错误。此类错误通常指示您将 ANSI_QUOTES 作为 SQL_MODE 参数的一部分。将 ANSI_QUOTES 作为 SQL_MODE 参数的一部分会导致像处理引号一样处理双引号,并且会导致您运行任务时出现问题。

要纠正此错误,请从 SQL_MODE 参数中删除 ANSI_QUOTES。

2016-11-02T14:23:48 [TARGET_LOAD ]E: Load data sql statement. load data local infile "/rdsdbdata/data/tasks/7XO4FJHCVON7TYTLQ6RX3CQHDU/data_files/4/LOAD000001DF.csv" into table `VOSPUSER`.`SANDBOX_SRC_FILE` CHARACTER SET UTF8 fields terminated by ',' enclosed by '"' lines terminated by '\n'( `SANDBOX_SRC_FILE_ID`,`SANDBOX_ID`, `FILENAME`,`LOCAL_PATH`,`LINES_OF_CODE`,`INSERT_TS`,`MODIFIED_TS`,`MODIFIED_BY`, `RECORD_VER`,`REF_GUID`,`PLATFORM_GENERATED`,`ANALYSIS_TYPE`,`SANITIZED`,`DYN_TYPE`, `CRAWL_STATUS`,`ORIG_EXEC_UNIT_VER_ID` ) ; (provider_syntax_manager.c:2561)

解决 SAP ASE 的问题

接下来,您可以了解如何解决特定于使用的问题Amazon DMS使用 SAP ASE 数据库。

Error: 当源具有具有 NULL 值的复合唯一索引时,LOB 列具有 NULL 值

当使用 SAP ASE 作为源,其中表配置了允许 NULL 值的复合唯一索引时,LOB 值可能不会在持续复制期间迁移。此行为通常是在 DMS 复制实例客户端上默认设置为 1 的 ANSI_NULL 的结果。

为确保 LOB 字段正确迁移,请包括额外连接属性 (ECA)'AnsiNull=0'到Amazon DMS任务的源终端节点。