概念 - SAP HANA 开启 Amazon
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

概念

SAP — SAP HANA 和 Hana 系统复制

SAP HANA 是一款由 SAP 开发的内存中面向列的关系数据库管理系统。它使用 HANA 系统复制 (HSR) 将数据和更改从主系统复制到一个或多个辅助系统。在横向扩展部署中,这种复制发生在主系统和辅助系统的相应节点之间,每项服务在辅助系统中都有对应的服务。HSR 确保不断复制更改,以最大限度地减少恢复点目标 (RPO)。虽然可以使用 HANA 工具手动触发接管,但添加 Pacemaker 集群可通过监控、编排以及与用于硬件连接和管理的资源代理集成来实现故障转移过程的自动化。

Amazon — 可用区

可用区是一个或多个独立的数据中心,在一个 Amazon 区域内具有冗余电源、网络和连接。有关更多信息,请参阅区域和可用区。

对于以最大限度地缩短恢复时间目标 (RTO) 为目标的 SAP 关键任务部署,我们建议将单点故障分散到各个可用区。 Amazon 与单实例或单可用区部署相比,这增强了抵御包括自然灾害在内的各种故障场景和问题的恢复能力和隔离能力。

每个可用区与另一个可用区之间有一段有意义的距离(数千米)。一个 Amazon 区域中的所有可用区域通过完全冗余的专用城域光纤与高带宽、低延迟的网络重新互连。这样可以实现同步复制。可用区之间的所有流量都是加密的。

Amazon — 覆盖 IP

无论哪个可用区(和子网)包含主动主节点,Overlay IP 都支持与应用程序的连接。

在中部署 Amazon EC2 实例时 Amazon,IP 地址是从所分配子网的 CIDR 范围中分配的。子网不能跨越多个可用区,因此子网 IP 地址在出现故障后可能不可用,包括网络连接或硬件问题,需要故障转移到不同可用区域中的复制目标。

为了解决这个问题,我们建议您配置一个覆盖 IP,并在应用程序的连接参数中使用它。此 IP 地址是来自 VPC CIDR 块之外的非重叠 RFC1918 私有 IP 地址,被配置为一个或多个路由表中的一个条目。该路由将连接定向到主动节点,并在故障转移期间由群集软件更新。

您可以为叠加 IP 地址选择以下任意一个 RFC1918 私有 IP 地址:

  • 10.0.0.0 — 10.255.255.255(10/8 前缀)

  • 172.16.0.0 — 172.31.255.255(前缀 172.16/12)

  • 192.168.0.0 — 192.168.255.255(192.168/16 前缀)

例如,如果您在 SAP VPC 中使用 10/8 前缀,则选择 172 或 192 IP 地址可能有助于区分叠层 IP。考虑使用诸如 Amazon VPC IP 地址管理器之类的 IP 地址管理 (IPAM) 工具来规划、跟踪和监控工作负载的 IP 地址。 Amazon 有关更多信息,请参阅什么是 IPAM

如果您的子网关联或连接需要,也可以将集群中的叠加 IP 代理配置为更新包含叠加 IP 条目的多个路由表。

访问覆盖 IP

叠加 IP 不在 VPC 的范围内,因此无法从与路由表无关的地点(包括本地和其他位置)到达 VPCs。

使用 T Amazon ransit Gateway 作为中心枢纽,使用 Di Amazon rect Connect 或 C Amazon lient VPN,便于从多个位置(包括亚马逊 VPCs、其他 Amazon 地区和本地)连接到叠加 IP 地址。

如果您未将 T Amazon ransit Gateway 设置为网络交通枢纽,或者在您的首选 Amazon 区域不可用,则可以使用网络负载均衡器启用对叠加 IP 的网络访问。

有关更多信息,请参阅 SAP 关于 Amazon 高可用性设置

Amazon — 共享 VPC

Enterprise landing zone 设置或安全要求可能需要使用单独的集群帐户,将 Overlay IP 所需的路由表访问权限限制为隔离账户。有关更多信息,请参阅与其他账户共享您的 VPC

在设置共享 VPC 之前,请评估对您的安全态势的运营影响。

Pacemaker-STONITH 击剑剂

在 SAP HANA 部署中,无论是在纵向扩展配置(双节点)还是横向扩展配置(每个站点两个或更多节点)中,通过确保在任何给定时间只有指定的一个或多个主节点才能处理写入操作来保持数据一致性至关重要。当节点变得无响应或无法传染时,为了保持数据一致性,可能需要在集群开始其他操作(例如升级新的主节点)之前关闭故障节点的电源,将其隔离。该仲裁是击剑代理人的职责。

在双节点扩展场景中,围栏竞赛是一个关键问题。当通信故障导致两个节点同时尝试互相屏蔽(断电)时,就会发生这种情况,而认为另一个节点已经出现故障。围栏代理通过提供外部证人来应对这种风险。在横向扩展部署中,虽然由于存在多个可以参与法定人数决策的节点,因此围栏争夺的可能性较小,但适当的围栏对于保持较大节点集的数据一致性仍然至关重要。

红帽支持多种屏蔽代理,包括推荐用于亚马逊 EC2 实例的屏蔽代理 (fence_aws)。