使节点 1 上的主 SAP HANA 数据库崩溃 - SAP HANA 开启 Amazon
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使节点 1 上的主 SAP HANA 数据库崩溃

说明:模拟主数据库系统的完整分解。

运行节点:SAP HANA 主数据库节点

运行步骤

  • 使用以下命令停止主数据库系统<sid>adm

    prihana:~  sudo su - hdbadm
    hdbadm@prihana:/usr/sap/HDB/HDB00> HDB kill -9
    hdbenv.sh: Hostname prihana defined in $SAP_RETRIEVAL_PATH=/usr/sap/
    HDB/HDB00/prihana differs from host name defined on command line.
    hdbenv.sh: Error: Instance not found for host -9
    killing HDB processes:
    kill -9 6011 /usr/sap/HDB/HDB00/prihana/trace/hdb.sapHDB_HDB00 -d -nw -f
    /usr/sap/HDB/HDB00/prihana/daemon.ini pf=/usr/sap/HDB/SYS/profile/HDB_HDB00_prihana
    kill -9 6027 hdbnameserver
    kill -9 6137 hdbcompileserver
    kill -9 6139 hdbpreprocessor
    kill -9 6484 hdbindexserver -port 30003
    kill -9 6494 hdbxsengine -port 30007
    kill -9 7068 hdbwebdispatcher
    kill orphan HDB processes:
    kill -9 6027 [hdbnameserver] <defunct>
    kill -9 6484 [hdbindexserver] <defunct>
    • 预期结果**:

  • 集群检测到已停止的主要 SAP HANA 数据库(在节点 1 上),并将辅助的 SAP HANA 数据库(在节点 2 上)提升为主数据库。

    prihana:~  crm status
    Stack: corosync
    Current DC: prihana (version 1.1.18+20180430.b12c320f5-3.24.1-b12c320f5) -
    partition with quorum
    Last updated: Thu Nov 12 11:53:21 2020
    Last change: Thu Nov 12 11:53:19 2020 by root via crm_attribute on sechana
    
    2 nodes configured
    6 resources configured
    
    Online: [ prihana sechana ]
    
    Full list of resources:
    
     res_AWS_STONITH        (stonith:external/ec2): Started prihana
     res_AWS_IP     (ocf::suse:aws-vpc-move-ip):    Started sechana
     Clone Set: cln_SAPHanaTopology_HDB_HDB00 [rsc_SAPHanaTopology_HDB_HDB00]
         Started: [ prihana sechana ]
     Master/Slave Set: msl_SAPHana_HDB_HDB00 [rsc_SAPHana_HDB_HDB00]
         Masters: [ sechana ]
         Slaves: [ prihana ]
    
    Failed Actions:
    * rsc_SAPHana_HDB_HDB00_monitor_60000 on prihana 'master (failed)' (9): call=50,
    status=complete, exitreason='',
        last-rc-change='Thu Nov 12 11:51:45 2020', queued=0ms, exec=0ms
  • 重叠 IP 地址已迁移到新的主地址(在节点 2 上)。

  • AUTOMATIC_REGISTER参数设置为 “true” 后,集群会重新启动出现故障的 SAP HANA 数据库,并自动将其注册到新的主数据库。

    • 恢复程序**:

  • 以 root 用户身份清理节点 1 上的集群 “操作失败”。

    prihana:~  crm resource cleanup rsc_SAPHana_HDB_HDB00 prihana
    Cleaned up rsc_SAPHana_HDB_HDB00:0 on prihana
    Cleaned up rsc_SAPHana_HDB_HDB00:1 on prihana
    Waiting for 1 replies from the CRMd. OK
  • 资源清理后,将清理群集 “失败的操作”。