Remettre en état la couche LLT après un problème de heartbeat

De Le wiki de Fred sur gantzer.eu

Il se peut qu'après un problème réseau sur le heartbeat, la couche GAB/LLT ne fonctionne plus:

  # lltstat -nvv
  LLT node information:
   Node                 State    Link  Status  Address
  * 0 node1             OPEN
                                 eth3   UP      00:1F:29:5D:XX:F5
                                 eth1   UP      00:23:7D:A9:XX:62
    1 node2             IDLE
                                 eth3   DOWN    00:1F:29:5D:XX:31
                                 eth1   DOWN    00:23:7D:A9:XX:06
    2 node3             IDLE
                                 eth3   DOWN    00:1F:29:5D:XX:7F
                                 eth1   DOWN    00:23:7D:A9:XX:DA
    3 node4             IDLE
                                 eth3   DOWN    00:1F:29:5F:XX:09
                                 eth1   DOWN    00:22:64:0D:XX:08


Il faut procéder à l'arrêt/relance GAB/LLT sur chaque noeud du cluster.

Arrêt

Il faut arrêter VCS pour pouvoir stopper la couche GAB

  • Arrêter VCS sans tomber les groupes de service (avec l'option force):
  hastop -local -force
  • Arrêter GAB
  service gab stop

Il se peut que ça bloque. Faire un gabconfig -U

  • Arrêter LLT
  service LLT stop

Relance

  service LLT start
  service gab start
  haastart
Outils personnels
Navigation