在 Amazon 云上为 SAP 工作负载实施灾难恢复 - SAP 通用指南
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon 云上为 SAP 工作负载实施灾难恢复

使用 Elastic 灾难恢复为 SAP 工作负载实施灾难恢复解决方案,需要考虑典型 SAP 工作负载的不同部分(例如 S/4HANA 部署)的不同注意事项。 Amazon 以下各节提供了有关在应用程序和数据库层中使用 Elastic 灾难恢复时如何设计、实施和管理 Elastic 灾难恢复的差异的指导。

SAP 应用程序层

我们建议使用 Amazon Elastic Disaster Recovery 来保护你的 SAP 应用程序服务器,例如 SAP ASCS/SCS、PAS、AAS 等。Elastic 灾难恢复支持基于 SAP 的 SAP 应用程序层 NetWeaver、ABAP 基础以及 TREX、内容服务器等独立应用程序。您可以对 Amazon EBS 支持的存储使用弹性灾难恢复,例如 SAP 实例二进制文件、存储在 Amazon EBS 卷上的本地文件。

应用程序层还包含共享文件系统,例如 SAP 装载、传输和接口目录。这些文件系统通常需要单独管理。有关更多信息,请参阅 共享存储弹性

要进行设置,请在应用程序服务器上安装 Elastic 灾难恢复代理。创建具有所需权限的 IAM 用户。向 Elastic 灾难恢复代理提供用户信息,以便与 Elastic 灾难恢复 API 建立连接。配置代理后,它将使用 TLS 1.3 加密的 Elastic Daser Recovery API 端点进行身份验证握手。该服务在暂存区域子网中为每个复制的源卷生成大小相同的 Amazon EBS 卷,用于数据同步。可以在复制服务器设置中配置 Amazon EBS 卷的类型。复制将在生成暂存区域子网资源并安装代理后开始。通过加密将数据从源服务器直接传输到复制服务器。该服务自动管理暂存区域的子网资源,根据源服务器和磁盘的并行复制情况向上或向下扩展这些资源。

SAP 数据库层

Amazon Elastic Disaster Recovery 完全支持作为灾难恢复解决方案,适用于在任何数据库上运行的 SAP 应用程序,也适用于在纵向扩展配置下在 SAP HANA 数据库上运行的 SAP 应用程序。不支持复制多节点 SAP 数据库,例如 SAP HANA 横向扩展群集。

SAP 系统中的数据存储在数据库中。这些数据包括主数据、交易数据和 ABAP 工件。在评估灾难恢复解决方案的 Elastic 灾难恢复时,您必须考虑您的业务 RPO 和 RTO 要求。该服务不具备应用程序感知能力,而是通过将连接的存储复制到目标暂存环境来在操作系统层运行。根据您的 RTO 和 RPO 要求,您可以选择弹性灾难恢复或数据库原生复制方法,例如适用于 SAP HANA 的 SAP HANA 系统复制 (HSR)。

以下是选择数据库复制方法的重要注意事项。

网络带宽

Amazon Elastic Disaster Recovery 在操作系统层运行,对连接的存储设备进行块级复制。根据源位置的更改率,您可能需要更高的网络带宽来保持复制的最新状态。像 SAP HSR 这样的数据库感知技术需要更少的网络带宽,从而可以更快地复制变化率高的系统。

RPO

弹性灾难恢复支持亚秒级的 RPO。对于 SAP 工作负载,请确保您的网络能够支持峰值变化率。如果您的 RPO 非常小,我们建议您同时测试数据库本机复制方法以及 Elastic 灾难恢复。

导致数据库数据发生重大变化的操作会导致暂存区域的数据复制延迟。它可以包括将备份部分或全部恢复到源服务器上数据库的受保护卷中。对存储卷所做的更改远高于源服务器上通常的更改率。从备份中恢复到源服务器上受保护卷的数据被视为已更改的数据块,并由 Elastic 灾难恢复进行复制。复制服务器需要更多时间才能从源系统接收和写入如此大量的更改数据。这可能会影响您的业务 RPO。

建议在工作负载不太重要的时候管理操作,例如从备份中恢复。这样,较长的 RPO 值就不会影响您的工作负载。您可以使用 Elastic 灾难恢复跟踪仍在等待复制的更改数据量。有关更多信息,请参阅 “恢复” 控制面板。 

速率变率

对于更改率较高的数据库,您可以通过性能充足的网络以及复制服务器的存储和计算配置来满足性能要求。如果这些更改不足以满足业务性能要求,则可以选择数据库本机复制方法来优化 RPO。

RTO

使用 Elastic 灾难恢复,一旦触发灾难恢复事件,就会配置目标灾难恢复环境。总时间取决于数据库的大小和所选的时间点 (PiT)。在生产环境中实施灾难恢复场景之前,必须先测试灾难恢复方案。

费用

由于 Elastic 灾难恢复不使用热备用或热备用方法,因此与许多其他灾难恢复选项相比,您的灾难恢复环境的计算成本可以降至最低。有关更多信息,请参阅Amazon Elastic Disaster Recovery 定价。使用数据库本机复制方法,成本可能会随着灾难恢复区域的计算资源而增加。

RCO

如果您有多个紧密耦合的系统,则需要使用数据库本机复制方法。

存储限制

在大多数情况下,可用的 Amazon EBS 卷类型足以满足任何存储容量和性能需求。根据源环境架构,在某些情况下,恢复实例上的存储量会超过单个 Amazon EBS 卷的容量和/或性能限制。这可能发生在非Amazon Amazon 灾难恢复实施中,data并且log卷连接到高负载数据库服务器。有关更多信息,请参阅 Amazon EBS 卷类型

将服务器迁移到时 Amazon,必须将此类存储卷重构为新的存储架构,例如,创建条带卷集。条带卷集是使用恢复实例操作系统中的逻辑卷管理器工具定义和维护的。有关更多信息,请参阅 Linux 上的 RAID 配置。这些卷集将跨越两个或更多 Amazon EBS 卷,最多可达到满足所需卷大小和性能所需的总量。然后将存储卷数据复制到新的条带化卷集中。虽然可以通过 Elastic Disaster Recovery 启动后脚本或通过事件规则触发代码的警报 Amazon EventBridge 事件自动执行此过程,但额外的步骤可能会导致更长的恢复时间。

在这些情况下,实施混合灾难恢复解决方案是合适的。大多数服务器由 Elastic 灾难恢复管理,部分服务器(出于存储性能考虑)使用其他灾难恢复方法,例如本机数据库复制技术。存储架构重构是在初始灾难恢复环境实施期间设置备用复制服务器时完成的。由于复制现在是在应用程序级别进行的,因此灾难恢复服务器能够写入与源服务器上的存储架构不同的存储架构。