创建任务 - Amazon Database Migration Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建任务

要创建 Amazon DMS 迁移任务,请执行以下操作:

  • 在创建迁移任务之前,创建源终端节点、目标终端节点以及复制实例。

  • 选择迁移方法:

    • 将数据迁移到目标数据库— 此过程将在目标数据库中创建文件或表,并自动定义目标所需的元数据。它还会用源数据填充表。为提高效率,系统将并行加载表中的数据。此过程是迁移现有数据选项Amazon Web Services Management Console,并被称为Full Load在 API 中。

    • 在迁移过程中捕获更改— 此过程捕获在将数据从源迁移到目标时对源数据库进行的更改。在完成最初请求的数据的迁移后,更改数据捕获 (CDC) 过程会将捕获到的更改应用于目标数据库。捕获更改并以单个提交事务为单位应用更改,并且可以将多个不同的目标表作为单个源提交进行更新。此方法可保证目标数据库中的事务完整性。该过程是控制台中的 Migrate existing data and replicate ongoing changes (迁移现有数据并复制持续更改) 选项,在 API 中称为 full-load-and-cdc

    • 仅复制源数据库上的数据更改— 此过程读取源数据库管理系统 (DBMS) 的恢复日志文件,并将每个事务的条目组合在一起。在某些情况下,Amazon DMS 无法在合理的时间内对目标应用更改(例如,如果目标不可访问)。在这些情况下,Amazon DMS 会在必要时对复制服务器上的更改进行缓冲。它不会重新读取源 DBMS 日志,这可能需要大量时间。该过程是 控制台中的仅复制数据更改Amazon DMS选项。

  • 确定该任务如何处理源上的大型二进制对象 (LOB)。有关更多信息,请参阅在 Amazon DMS 任务中为源数据库设置 LOB 支持

  • 指定迁移任务设置。这些设置包括设置日志记录,指定写入到迁移控制表的数据,如何处理错误以及其他设置。有关任务设置的更多信息,请参阅指定的任务设置AmazonDatabase Migration Service

  • 设置表映射以定义用于选择和筛选要迁移的数据的规则。有关表映射的更多信息,请参阅使用表映射指定任务设置。在指定映射之前,请确保查看有关源数据库和目标数据库之间的数据类型映射的文档部分。

  • 在运行任务之前启用并运行迁移前任务评估。有关迁移前评估的更多信息,请参阅启用和使用任务的迁移前评估.

  • 指定迁移数据的任务所需的任何补充数据。有关更多信息,请参阅指定任务设置的补充数据

您可以选择在 Create task (创建任务) 页面上指定任务的信息后立即启动任务。或者,在指定任务信息后从“Dashboard (控制面板)”页启动任务。

以下过程假定您已经指定了复制实例信息和终端节点。有关设置终端节点的更多信息,请参阅创建源和目标终端节点.

创建迁移任务

  1. 登录到Amazon Web Services Management Console并打开Amazon DMS控制台https://console.aws.amazon.com/dms/v2/.

    如果以 Amazon Identity and Access Management (IAM) 用户身份登录,请确保具有适当的 Amazon DMS 访问权限。有关所需权限的更多信息,请参阅使用 Amazon DMS 所需的 IAM 权限

  2. 在左侧导航窗格中选择 Tasks (任务),然后选择 Create Task (创建任务)

  3. 创建任务页中,指定任务选项。下表描述了设置。

    
                        Create task (创建任务)
    对于该选项 请执行该操作

    任务名称

    输入任务的名称。

    任务描述

    输入任务的描述。

    源终端节点

    显示要使用的源终端节点。

    目标终端节点

    显示要使用的目标终端节点。

    复制实例

    显示要使用的复制实例。

    迁移类型

    选择要使用的迁移方法。您可以选择仅让现有数据迁移到目标数据库,或将持续更改以及迁移的数据发送到目标数据库。

    在创建时启动任务

    在选定该选项时,任务将在创建后立即开始。

  4. 选择任务设置选项卡 (如下所示),指定目标表、LOB 支持以及启用日志记录值。显示的任务设置取决于所选的 Migration type (迁移类型) 值。例如,在选择 Migrate existing data (迁移现有数据) 时,将显示以下选项:

    
                        Task settings (任务设置)
    对于该选项 请执行该操作

    Target table preparation mode (目标表准备模式)

    不执行任何操作— 在不执行任何操作模式、Amazon DMS假定目标上已预先创建目标表。如果迁移是完全加载或者完全加载加 CDC,那么在开始迁移之前,请确保目标表为空。如果目标表不存在,DMS 将为您创建该表。您的表结构将保留原样,并且任何现有数据将保留在表中。在目标表已经从源回填,并且应用了持续复制来确保源和目标同步时,Do nothing (不执行任何操作) 模式对于仅 CDC 任务是合适的选择。要预先创建表,您可以使用 Amazon Schema Conversion Tool (Amazon SCT)。有关更多信息,请参阅安装 Amazon SCT

    删除目标中的表— 在删除目标中的表模式、Amazon DMS删除目标表并在开始迁移之前重新创建它们。此方法确保了在迁移开始时目标表为空。Amazon DMS 仅创建高效迁移数据所需的对象:表、主键以及(在某些情况下)唯一索引。Amazon DMS 不会创建二级索引、非主键约束或列数据默认值。如果您执行完全加载外加 CDC 或仅 CDC 任务,我们建议您此时暂停迁移。然后,创建支持筛选更新和删除语句的二级索引。

    使用删除目标中的表模式时,您可能需要在目标数据库上执行某些配置。例如,对于 Oracle 目标,由于安全原因,Amazon DMS 无法创建架构(数据库用户)。在这种情况下,您可以预先创建架构用户,以便 Amazon DMS 在迁移开始时创建表。对于大多数其他目标类型,Amazon DMS 使用合适的配置参数创建架构以及所有关联的表。

    截断— 在截断模式、Amazon DMS在迁移开始之前截断所有目标表。如果目标表不存在,DMS 将为您创建该表。您的表结构将保留原样,但在目标上截断表。Truncate (截断) 模式适用于完全加载迁移或完全加载加 CDC 迁移,其中目标架构在迁移开始前已预先创建。要预先创建表,您可以使用 Amazon SCT。有关更多信息,请参阅安装 Amazon SCT

    注意

    如果你的源代码是 MongoDB,截断模式不会截断目标位置的表。相反,它会丢弃集合并丢失所有索引。避免截断模式时,您的源代码是 MongoDB。

    在复制时包括 LOB 列

    Dolt (LOB) 列— 从迁移操作中排除 LOB 列。

    完整 LOB 模式— 无论大小,迁移整个 LOB。Amazon DMS以块的形式分段迁移 LOB,块的大小受最大 LOB 大小参数。此模式比受限 LOB 模式的速度要慢。

    受限的 LOB 模式— 将 LOB 截断为最大 LOB 大小参数。此模式比使用完整 LOB 模式的速度要快。

    最大 LOB 大小 (kb)

    受限 LOB 模式下,超出 Max LOB size (最大 LOB 大小) 设置的 LOB 列将被截断到指定的 Max LOB Size (最大 LOB 大小)

    启用验证

    启用数据验证,以确认准确地将数据从源迁移到目标。有关更多信息,请参阅AmazonDMS 数据验证

    启用日志记录

    由 Amazon CloudWatch 启用日志记录。

    如果为迁移类型选择迁移现有数据并复制,将显示以下选项:

    
                        Task settings (任务设置)
    对于该选项 请执行该操作

    Target table preparation mode (目标表准备模式)

    不执行任何操作— 不更改目标表的数据和元数据。

    Drop tables on target (删除目标中的表) – 删除表并在其位置创建新表。

    Truncate (截断) – 截断表,而不会影响表元数据。

    在完全加载完成后停止任务

    不要停止— 不停止任务,但立即应用缓存的更改并继续。

    在应用缓存的更改前停止 - 在应用缓存的更改之前停止任务。使用此方式时,可以添加可能会加速更改应用的辅助索引。

    在应用缓存的更改之后停止 – 在应用缓存的更改后停止任务。使用此方式时,可以在使用事务应用时添加外键、触发器等。

    在复制时包括 LOB 列

    Dolt (LOB) 列— 从迁移操作中排除 LOB 列。

    完整 LOB 模式— 无论大小,迁移整个 LOB。在受 LOB 块大小控制的组块中分段迁移 LOB。此方法比受限 LOB 模式速度慢。

    受限的 LOB 模式— 将 LOB 截断到 “最大 LOB 大小”。此方法比使用完整 LOB 模式快。

    最大 LOB 大小 (KB)

    受限 LOB 模式下,超出 Max LOB size (最大 LOB 大小) 设置的 LOB 列将被截断到指定的最大 LOB 大小。

    启用验证

    启用数据验证,以确认准确地将数据从源迁移到目标。有关更多信息,请参阅AmazonDMS 数据验证

    启用日志记录

    启用 CloudWatch 日志记录。

  5. 选择表映射选项卡 (如下所示) 以设置架构映射和映射方法值。如果选择自定义,您可以指定目标架构和表值。有关表映射的更多信息,请参阅使用表映射指定任务设置

    
                        Table mapping (表映射)
  6. 如有必要,请在相应选项卡中指定补充任务数据。例如,如果目标终端节点适用于 Amazon Neptune 图形数据库,请选择图映射规则选项卡。然后,浏览以选择适当的图形映射配置文件,或者使用编辑器直接输入映射规则。有关指定补充任务数据的详细信息,请参阅指定任务设置的补充数据.

  7. 完成任务设置后,请选择 Create task (创建任务)