使用 Neptune 流跨区域复制以进行灾难恢复 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Neptune 流跨区域复制以进行灾难恢复

Neptune 提供了两种实现跨区域故障切换功能的方法:

  • 跨区域快照复制和还原

  • 使用 Neptune 流在两个不同区域的两个群集之间复制数据。

跨区域快照复制和恢复在不同区域中恢复 Neptune 群集的操作开销最低。但是,在区域之间复制快照可能需要大量的数据传输时间,因为快照是 Neptune 群集的完整备份。因此,跨区域快照复制和还原可用于只需要恢复点目标 (RPO) 小时和恢复时间目标 (RTO) 小时的方案。

恢复点目标 (RPO) 通过两次备份之间的时间来衡量。它定义了从上次备份到恢复数据库之间可能丢失的数据量。

恢复时间目标 (RTO) 通过执行恢复操作所需的时间来衡量。这是数据库群集在发生故障后故障转移到已恢复数据库所需的时间。

Neptune 流提供了一种保持备份 Neptune 群集始终与主生产群集同步的方法。如果发生故障,您的数据库随后故障转移到备份群集。这将 RPO 和 RTO 缩短到几分钟,因为数据不断复制到备份群集,备份群集随时可以作为故障转移目标使用。

以这种方式使用 Neptune 流的缺点是,维护复制组件所需的操作开销和使第二个 Neptune 数据库群集始终在线的成本都非常高。

重要

目前,使用 Neptune 流进行灾难恢复只有在其他区域中的目标群集未启用 IAM 身份验证时才有效。

设置海王星到海王星复制

您的主生产数据库集群驻留在给定源区域的 VPC 中。为了进行灾难恢复,您需要在不同的恢复区域复制或模拟以下三个主要内容:

  • 存储在集群中的数据。

  • 主群集的配置。这将包括它是否使用 IAM 身份验证、是否已加密、数据库集群参数、实例参数、实例大小等)。

  • 它使用的网络拓扑,包括目标 VPC 及其安全组等。

您可以使用 Neptune 管理 API(如下所示)来收集该信息:

通过收集的信息,您可以使用以下过程在不同区域设置备份群集,在发生故障时,生产群集可以故障切换到该群集。

1:启用 Neptune 流

您可以使用ModifyDBClusterParameterGroup以设置neptune_streams参数设置为 1。然后,重新启动数据库集群中的所有实例,以使更改生效。

启用 Neptune 流后,最好在源数据库群集上执行至少一个添加或更新操作。这将使用数据点填充更改流,以后在将生产群集与备份群集重新同步时可以引用这些数据点。

2: 在您希望在其中设置备份集群的区域中创建新 VPC

在与主集群不同的区域中创建新的 Neptune 数据库集群之前,您需要在目标区域中建立新的 VPC 来托管集群。主群集和备份群集之间的连接是通过 VPC 对等建立的,后者使用不同 VPC 中的私有子网之间的流量。但是,要在两个 VPC 之间建立 VPC 对等,它们不得具有重叠的 CIDR 块或 IP 地址空间。这使您不能在两个区域中只使用默认 VPC,因为默认 VPC 的 CIDR 块始终相同(172.31.0.0/16)。

您可以使用目标区域中的现有 VPC,只要它满足以下条件即可:

  • 它没有与主集群所在 VPC 的 CIDR 块重叠的 CIDR 块。

  • 它尚未与其他 VPC 对等,该 VPC 与您的主集群所在的 VPC 具有相同的 CIDR 块。

如果目标区域中没有合适的 VPC,请使用 Amazon EC2 创建一个CreateVpcAPI。

3: 创建主集群的快照,然后将其还原到目标备份区域

现在,您可以在目标备份区域的相应 VPC 中创建一个新的 Neptune 群集,该 VPC 是您的生产集群的副本:

在备份区域中制作生产群集的副本

  1. 在目标备份区域中,重新创建生产数据库群集使用的参数和参数组。您可以使用CreateDBClusterParameterGroupCreateDBParameterGroupModifyDBClusterParameterGroupModifyDBParameterGroup.

    请注意,CopyDBClusterParameterGroupCopyDBParameterGroupAPI 当前不支持跨区域复制。

  2. 使用CreateDBClusterSnapshot在您的生产区域的 VPC 中创建生产集群的快照。

  3. 使用CopyDBClusterSnapshot以将快照复制到目标备份区域中的 VPC。

  4. 使用RestoreDBClusterFromSnapshot使用复制的快照在目标备份区域的 VPC 中创建新的数据库集群。使用从主生产群集复制的配置设置和参数。

  5. 新 Neptune 集群现在存在,但不包含任何实例。使用CreateDBInstance创建一个新的主/写入器实例,该实例类型和大小与生产集群的写入器实例具有相同的实例类型和大小。此时无需创建其他只读副本,除非您的备份实例将用于在故障转移之前为目标区域中的读取 I/O 提供服务。

4:在主集群的 VPC 和新备份集群的 VPC 之间建立 VPC 对等

通过设置 VPC 对等,您可以启用主集群的 VPC 与备份集群的 VPC 通信,就像它们是单个私有网络一样。为此,请执行以下步骤:

  1. 在您的生产集群的 VPC 中,调用CreateVpcPeeringConnectionAPI 来建立对等连接。

  2. 在目标备份集群的 VPC 中,调用AcceptVpcPeeringConnectionAPI 接受对等连接。

  3. 在您的生产集群的 VPC 中,使用CreateRouteAPI 将路由添加到 VPC 的路由表中,该路由将所有流量重定向到目标 VPC 的 CIDR 块,以便它使用 VPC 对等前缀列表。

  4. 同样,在目标备份集群的 VPC 中,使用CreateRouteAPI 将路由添加到 VPC 的路由表中,该路由将流量路由到主集群的 VPC。

:5 设置 Neptune 流复制基础架构

既然两个群集都已部署并且两个区域之间建立了网络通信,请使用海王星到海王星Amazon CloudFormation模板部署 Neptune 流消费者 Lambda 函数,并附加支持数据复制的基础架构。在您的主生产集群的 VPC 中执行此操作。

重要

此过程当前不支持启用了 IAM 身份验证的目标群集。

您需要为此提供的参数Amazon CloudFormation堆栈是:

  • NeptuneStreamEndpoint— 主集群的流终端节点(URL 格式)。例如:https://(cluster name):8182/gremlin/stream

  • QueryEngine— 必须是gremlin或者sparql.

  • RouteTableIds— 允许您为 DynamoDB VPC 终端节点和监控 VPC 终端节点添加路由。

    另外两个参数,即CreateMonitoringEndpointCreateDynamoDBEndpoint,如果主集群的 VPC 上尚不存在,则还必须将其设置为 true。如果它们已经存在,请确保它们被设置为 false 或Amazon CloudFormation创建将失败。

  • SecurityGroupIds— 指定 Lambda 使用者用于与主群集的 Neptune 流终端节点通信的安全组。

    在目标备份群集中,附加一个允许源自此安全组的流量的安全组。

  • SubnetIds— 主集群 VPC 中的子网 ID 列表,Lambda 使用者可以使用该子网 ID 与主群集进行通信。

  • TargetNeptuneClusterEndpoint— 目标备份群集的群集终端节点(仅限主机名)

  • VPC— 主集群 VPC 的 ID。

所有其他参数都可以保留其默认值。

一旦Amazon CloudFormation模板,Neptune 将开始将所有更改从主群集复制到备份群集。您可以在 Lambda 使用者函数生成的 CloudWatch 日志中监视此复制。

其他考虑因素

  • 如果您需要在主集群和备份集群之间使用 IAM 身份验证,还可以在调用Amazon CloudFormation模板。

  • 如果在主群集上启用静态加密,请在将快照复制到目标区域并在目标区域中关联新 KMS 密钥时,考虑如何管理关联的 KMS 密钥。

  • 最佳做法是在应用程序中使用的 Neptune 终端节点前面使用 DNS 别名。然后,如果您需要手动故障切换到目标备份群集,则可以将这些 CNames 更改为指向目标群集和/或实例终端节点。