网络、存储和计算 - SAP 通用指南
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

网络、存储和计算

本节提供有关为暂存环境和目标环境配置网络、存储和计算的信息,以便通过 Elastic 灾难恢复实现 SAP 工作负载 Amazon 的灾难恢复目标。

网络

用于灾难恢复的网络架构和配置可以在支持有效的 RTO 和 RPO SLA 方面发挥重要作用。触发灾难恢复时,必须考虑网络设计和将流量重定向到恢复实例。

以下是设计用于灾难恢复的网络的四个步骤。

连接源网络和目标网络

第一步是选择和配置从源网络到复制服务器的网络连接方法。您可以选择 “私有或公开”。有关更多信息,请参阅数据路由和限制

无论采用哪种方法,传输的数据在传输过程中始终处于加密状态。默认方法是 public,即数据通过 Internet 路由到复制服务器上的公共网络接口。在私有方法中,数据通过私有网络进行复制。专用网络的选择取决于所使用的灾难恢复方案。

定义暂存子网和恢复子网

建议使用一个子网来托管复制服务器,称为暂存区域子网。其他子网(称为恢复子网)是灾难恢复操作的目标所必需的。对于源网络处于开启状态的场景 Amazon,请考虑如何根据所选 Amazon Web Services 账户 策略和 landing zone 分配子网。通常,这可能意味着暂存区域子网应与您的源服务器位于不同的 Amazon VPC 中。为了简化环境,这可能只是在同一 Amazon VPC 中使用不同的子网。这意味着减少生产和非生产灾难恢复环境之间的隔离。有关更多信息,请参阅 Well-Architec Amazon ted Framework:最佳实践 5.3。

归根结底,这些子网的数量和设计应遵循与源环境相似的概念。有关更多信息,请参阅网络图

对于Amazon 区域内灾难恢复场景,我们建议将暂存区域子网托管在与恢复子网不同的可用区中。这种设计为灾难恢复提供了额外的冗余。启动的恢复实例受单独可用区中的暂存区保护。这遵循了使用多个可用区来保持弹性的设计原则。

配置网络安全设置

确保配置了所需的网络安全设置。这包括允许通过本地防火墙、网络安全设备、安全组或网络访问控制列表(网络 ACL)中的多个端口进行访问,可能还包括其他任务,具体取决于您的源环境的位置。有关更多信息,请参阅复制网络要求

SAP 最终用户和集成流量

以下是影响最终用户和集成相关网络流量如何影响您的 RTO 和 RPO 的一些因素。

  • 客户端识别并解析到新 IP 的 DNS 传播时间

  • 用于重新路由流量的网络组件(如果有)出现延迟,例如全局或本地负载均衡器,包括 Amazon 应用程序负载均衡器、 Amazon 全球加速器或 Amazon Route 53 Public Data Plane

有关更多信息,请参阅云中的灾难恢复选项

存储

Amazon Elastic Disaster Recovery 旨在根据源服务器性能为您的暂存环境评估和定义最佳 Amazon EBS 卷设置。演练和恢复服务器使用默认性能设置。这些卷的大小可以满足源系统的容量需求。您必须根据 SAP 工作负载的特定要求查看这些设置。这确保了高效且符合灾难恢复 SLA 的环境。这些不同的服务器类型具有不同的要求和管理存储的方法。

复制服务器

暂存区需要存储空间来支持源计算机的持续复制。这些 Amazon EBS 卷通常是低成本的硬盘驱动器 (HDD) 类型的存储卷。但是,如果复制的磁盘写入吞吐量很高,则默认的复制服务器设置会动态更改为性能更高的固态硬盘 (SSD) 存储类型。SAP 工作负载的推荐设置是默认 Amazon EBS 卷类型设置(复制服务器的自动卷类型选择)。它会根据您的工作负载要求自动选择高性能、经济高效的 Amazon EBS 卷。

您可以通过选择固态驱动器 (SSD) 来提高暂存区域的性能。这可以帮助 SAP 工作负载,例如突发或持续高事务速率的数据库,这些数据库的创建、更新和/或删除操作速率很高,必须应用于其存储。对于此类工作负载,我们建议您监控 Amazon CloudWatch 指标并检查是否存在持续或不断增加的延迟。您可以使用以下 CloudWatch 指标进行 Elastic Disaster Recovery。

  • LagDuration— 最新一致性快照的使用年限,以秒为单位

  • 待办事项列表 — 尚未同步的数据量,以字节为单位

如果复制服务器上的 Amazon EBS 指标也表明存在性能问题,则可以更改 Amazon EBS 卷类型。有关更多信息,请参阅以下资源。

演练和恢复实例

对于 90% 或更多的用例,包括 SAP 应用程序和数据库(SAP HANA 和任何其他),SAP 工作负载至少需要gp3卷类型。如果您的每卷 IOPS 要求更高,超过 16,000 IOPS,或者每个卷的吞吐量要求大于 1,000 MiB/s,请考虑或卷。io2 io2 Block Express

当您启动演练或恢复实例时,Elastic 灾难恢复会根据启动模板中定义的类型创建 Amazon EBS 存储卷。有关更多信息,请参阅 Amazon EC2 启动模板。启动模板由 Elastic Daser Recovery 自动生成,具有存储性能的默认值,使用通用型 SSD(卷大小与源系统容量要求相匹配)。查看启动模板,确认启动模板的默认分配满足了工作负载的存储需求。

您可以根据不同的卷类型或性能设置修改启动模板。修改之前,请确认您的目标 Amazon EC2 实例类型是否支持更高的存储空间。有关更多详细信息,请参阅支持的实例类型。有关 SAP HANA 数据库,请参阅存储配置。将更改应用于模板后,将修改后的版本定义为服务器的默认启动模板。在使用 Elastic 灾难恢复时,我们不建议在模板中添加或删除 Amazon EBS 卷。

对于需要在激活数据之前加载大量数据的服务器(例如数据库服务器),您可以在启动模板中配置更高的性能设置和存储类型。例如,如果您的服务器配置了gp3存储,那么为您的存储定义更多的预配置吞吐量和 IOPS,和/或使用性能更高的扩展存储,例如io2 Block Express(支持的 Amazon EC2 实例类型),可以缩短演练或恢复实例处理预期工作负载所需的时间。演练或恢复实例完全联机后,您可以更改恢复存储设置。有关更多信息,请参阅 Amazon EBS 弹性卷。您可以增加卷大小,更改卷类型或调整 Amazon EBS 卷的性能,而无需分离卷或重新启动实例。

时间点故障恢复

Amazon Elastic Disaster Recovery 使用 Amazon EBS 快照提供可在演练或恢复期间使用的时间点 (PiT) 恢复选项。Amazon EBS 的暂存快照是连续拍摄卷,以提供最新(亚秒级 RPO)的恢复点,第一个小时以 10 分钟为增量,以 1 小时为增量,持续 24 小时。每日 PiT 将在您的时间点 (PiT) 政策中指定的天数内保留。您可以指定 1 到 365 天之间,默认值为 7 天。有关更多信息,请参阅了解时间点状态

计算

您必须为复制服务器和恢复服务器选择 Amazon EC2 实例类型。

复制服务器

复制服务器通常比源系统小。 t3.small是默认的实例类型,它最多可以复制 15 个卷。您可以在 SAP 应用程序服务器或其他更改率较低的服务器之间使用共享复制服务器。

如果您的工作负载处于突发状态,或者数据库的事务速率一直很高,并且必须对其存储进行大量创建、更新和/或删除操作,则可能需要对暂存区域进行不同的配置。如果您发现工作负载的复制出现延迟,请将默认复制服务器更改为其他实例系列。例如,通用型 Amazon EC2 实例系列或使用专用的复制服务器。这种变化可能会影响成本。有关更多信息,请参阅复制服务器配置

演练和恢复实例

对于恢复实例,请配置 Amazon EC2 启动模板设置,使 Amazon 目标实例与源实例相匹配。有关 SAP 认证实例的列表,请参阅以下资源。

以下是影响灾难恢复解决方案的 RTO 的一些与计算相关的因素。

  • 服务器启动时间

  • 在微软 Windows Server 操作系统上运行的 SAP

  • 需要超过 10 分钟才能启动的大型 SAP HANA 数据库

  • 服务器上安装的 SAP 应用程序及其启动时间

  • 源服务器和目标服务器以及存储配置不匹配 — 在目标端配置较低的计算能力或存储性能会增加 RTO

您必须将应用程序启动时间视为恢复的一个因素。我们建议选择能够提供有效启动时间的 Amazon EC2 实例类型和存储配置。这有助于您优化灾难恢复解决方案的 RTO。此外,通过执行灾难恢复测试或演练,您可以根据自己的操作系统和数据库来衡量 RTO。

SAP 系统可以在各种操作系统、基础架构平台和处理器指令集上运行。如果您的源服务器位于本地或其他云提供商,则它必须与 Amazon EC2 和 Elastic 灾难恢复兼容。源服务器必须具有专为 x86 系统架构构建的基于 64 位的操作系统。源服务器上 Amazon有各种基于 x86 的 CPU 可供使用,尤其是在服务器是旧型号的情况下。建议使用基于 SAP 大小的方法将源系统映射到 Amazon EC2 实例类型。要了解更多信息,请参阅 SAP 的规模信息。

源服务器

虽然对复制代理的系统要求相对较低,但请考虑源服务器上的 CPU、内存、网络、存储和其他资源限制,这些限制可能会影响灾难恢复解决方案的性能。根据这些因素调整源服务器的大小。有关更多信息,请参阅源服务器要求