测试 3:使节点 1 上的主数据库崩溃 - 上的 SAP HANAAmazon
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

测试 3:使节点 1 上的主数据库崩溃

说明— 模拟主数据库系统的完整细分。

运行节点:SAP HANA 主数据库节点

运行步骤

  • 使用以下命令导致主数据库系统崩溃<sid>adm

    prihana:~ # sudo su - hdbadm hdbadm@prihana:/usr/sap/HDB/HDB00> HDB kill -9 hdbenv.sh: Hostname prihana defined in $SAP_RETRIEVAL_PATH=/usr/sap/HDB/HDB00/ prihana differs from host name defined on command line. hdbenv.sh: Error: Instance not found for host -9 killing HDB processes: kill -9 6011 /usr/sap/HDB/HDB00/prihana/trace/hdb.sapHDB_HDB00 -d -nw -f /usr/sap/HDB/HDB00/prihana/daemon.ini pf=/usr/sap/HDB/SYS/profile/HDB_HDB00_prihana kill -9 6027 hdbnameserver kill -9 6137 hdbcompileserver kill -9 6139 hdbpreprocessor kill -9 6484 hdbindexserver -port 30003 kill -9 6494 hdbxsengine -port 30007 kill -9 7068 hdbwebdispatcher kill orphan HDB processes: kill -9 6027 [hdbnameserver] <defunct> kill -9 6484 [hdbindexserver] <defunct>

预期输出:

  • 群集检测已停止的主 SAP HANA 数据库(在节点 1 上),并将辅助 SAP HANA 数据库(在节点 2 上)提升为主数据库。

    [root@prihana ~]# pcs status Cluster name: rhelhanaha Stack: corosync Current DC: sechana (version 1.1.19-8.el7_6.5-c3c624ea3d) - partition with quorum Last updated: Tue Nov 10 17:58:19 2020 Last change: Tue Nov 10 17:57:41 2020 by root via crm_attribute on sechana 2 nodes configured 6 resources configured Online: [ prihana sechana ] Full list of resources: clusterfence (stonith:fence_aws): Started prihana Clone Set: SAPHanaTopology_HDB_00-clone [SAPHanaTopology_HDB_00] Started: [ prihana sechana ] Master/Slave Set: SAPHana_HDB_00-master [SAPHana_HDB_00] Masters: [ sechana ] Slaves: [ prihana ] hana-oip (ocf::heartbeat:aws-vpc-move-ip): Started sechana Failed Actions: * SAPHana_HDB_00_monitor_59000 on prihana 'master (failed)' (9): call=31, status=complete, exitreason='', last-rc-change='Tue Nov 10 17:56:52 2020', queued=0ms, exec=0ms Daemon Status: corosync: active/enabled pacemaker: active/enabled pcsd: active/enabled [root@prihana ~]#
  • 叠加 IP 地址将迁移到新的主节点(在节点 2 上)。

  • 由于AUTOMATED_REGISTER设置为true时,集群将重新启动出现故障的 SAP HANA 数据库,并将其注册到新的主数据库。

恢复程序

  • 清除群集”failed actions” 在节点 1 上作为根目录。

    root@prihana ~]# pcs resource cleanup SAPHana_HDB_00 --node prihana Cleaned up SAPHana_HDB_00:0 on prihana Cleaned up SAPHana_HDB_00:1 on prihana Waiting for 1 replies from the CRMd. OK [root@prihana ~]#
  • 资源清理后,请确保群集”failed actions” 被清理。