Introduction - SAP 通用指南
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Introduction

几十年来,SAP 客户使用两种常见模式在本地保护 SAP 工作负载:高可用性和灾难恢复。云计算的出现为利用现代体系结构和技术重新思考 SAP 的 HADR 功能提供了一个机会。

让我们回顾一下 SAP 系统设计和作为 SAP n 层体系结构一部分的单点故障点。

SAP NetWeaver 体系结构单点故障  


          SAP 单点故障

图 1:SAP 单点故障

图 1 显示了典型的 SAP NetWeaver 体系结构,该体系结构有以下几个单点故障点:

  • SAP 中央服务(消息服务器和入队进程)

  • SAP 应用服务器

  • NFS(共享存储)

  • 数据库

  • SAP Web 调度员

对于 SAP 中央服务和数据库,可以通过部署其他主机来增加保护。例如,运行 SAP 复制入队的其他主机可以保护应用程序级别锁(入队锁)的丢失,运行辅助数据库实例的额外主机可以防止数据丢失。

但是,这些单点故障的固有设计限制了轻松利用云原生功能提供高可用性和可靠性的能力。 

亚马逊弹性文件服务 (Amazon EFS) 是一项高度可用且持久的托管 NFS 服务,可在多个物理位置积极运行(Amazon可用区)。此服务可以帮助保护 SAP 单点故障之一。

高可用性和灾难恢复

高可用性 (HA) 是系统的属性,可在规定的时间段内以可接受或商定的水平提供服务,并掩盖最终用户的计划外停机。这通常是通过使用群集服务器来实现的。这些服务器提供了自动故障检测、恢复或高弹性硬件、强大的测试以及问题和变更管理。

灾难恢复 (DR) 通过在不同硬件和/或物理位置上进行可靠且可预测的恢复来防止意外的重大停机,例如站点灾难。由于损坏或恶意软件导致的数据丢失被认为是合乎逻辑的灾难事件。它通常在单独的解决方案中解决,例如从最新的备份或存储快照中恢复。逻辑灾难恢复并不一定意味着故障切换到另一个设施。

从记录和可衡量的数据点的角度来看,HADR 要求通常按以下方式定义:

  • 正常运行率是指指定时间(每月或每年)内正常运行时间的百分比。

  • 平均复苏时间 (MTTR)是从故障中恢复所需的平均时间。

  • 返回服务 (RTS)是让系统恢复为用户服务所需的时间。

  • 恢复时间目标 (RTO)是系统或服务可以停机的最长时间、解决方案恢复需要多长时间以及服务再次可用所需的时间。

  • 恢复点目标 (RPO)是企业愿意丢失多少数据,及时表示。这是故障到恢复点之间的最长时间。


          从破坏性事件中恢复

图 2:从破坏性事件中恢复

本地部署模式与云部署模式

传统上,具有高可用性要求的客户将在单个数据中心或托管设施中部署其主要计算能力,通常在两个独立的房间或数据中心大厅中部署在具有不同的冷却和电力以及高速网络连接的数据中 有些客户将在近距离运行两个托管设施,分离计算功能,但足够接近,不会受到网络延迟的影响。

为了满足灾难恢复要求(上述情况表示不可预见的位置故障带来的风险增加),许多客户将扩展其体系结构,以包括一个辅助位置,其中存放数据副本,并提供额外的闲置计算容量。主站点和辅助位置之间的距离通常导致需要异步传输数据,这影响了恢复点目标。这是许多运行 SAP 的行业和公司的高可用性和灾难恢复的标准和普遍接受的体系结构模式。


          本地灾难恢复

图 3:本地灾难恢复

在图 3 中,我们举例说明了客户经常在本地采用的方法。In位置 1,客户有两个托管设施,通常在同一数据中心中分开房间或大厅,在那里他们为 SAP 单点故障部署了高可用性体系结构。位置 2是在中的两个托管设施都出现重大故障时,SAP 系统恢复的灾难恢复位置位置 1.

将 SAP 工作负载迁移到云提供商的客户仍会恢复到此架构并将其映射到Amazon如图 4 所示的区域和可用区 (AZ)。虽然此体系结构可以在您的环境中工作,但它不遵循Amazon架构完善的框架这有助于云架构师为其应用程序构建安全、高性能、弹性和高效的基础架构。


          在本地Amazon区域映射方法

图 4:在本地Amazon区域映射方法

Amazon在区域和可用区中隔离设施。多可用区方法可提供距离,同时保持主计算容量的性能。这种方法(图 5)极大地降低了位置故障的风险。


          本地的替代方法Amazon地区映射

图 5:本地的替代方法Amazon地区映射

随着主计算容量的位置故障风险大幅降低,可以根据业务需求评估第二个区域的需求。您可以使用在同一或不同的区域快速部署所需容量Amazon. 闲置硬件不再是问题。您可以将数据备份存储在 Amazon Simple Storage Service (Amazon S3) 上。Amazon区域或多个Amazon利用跨区域复制来实现区域。此体系结构可以简化并随时可用(图 6)。


          单列排序Amazon区域方法

图 6:单列排序Amazon区域方法

除了考虑基础设施或托管设施故障的影响之外,还需要考虑的另一种情况是由于意外或恶意的技术活动而导致的业务数据丢失。

由于意外或恶意的技术活动导致的业务数据丢失称为逻辑灾难恢复. 它需要决定从良好的本地副本中恢复业务数据。为了实现这一点,需要决定数据的存储位置以及在出现逻辑灾难恢复.

此外,在本指南中,我们详细介绍了关键的体系结构准则、架构模式以及为您的可用性和可靠性要求考虑的决策。