C.5. Häufige Verhalten: 2-4 Member Cluster mit IP-basiertem Tie-Breaker

Netzwerk-Partition

Häufige Ursachen: Problem mit dem Netzwerk-Schalter

Testfall: Verbinden Sie die Hälfte der Member zu Schalter A, die andere Hälfte zu Schalter B. Verbinden Sie Schalter A zu Schalter B mit einem Up-Link oder Crossover-Kabel. Verbinden Sie das Gerät, das als Tie-Breaker IP-Adress agiert zu Schalter A. Starten Sie die Cluster-Services. Trennen Sie die Verbindung zwischen Schalter A und Schalter B.

Erwartetes Verhalten: Alle Cluster-Partitionen, die genau aus der Hälfte (1/2 oder 2/4) der Member bestehen, senden ping-Pakete zur Tie-Breaker IP-Adresse. Wird Antwort erhalten, formiert die Partition ein Quorum. Im Testfall heisst das, dass die Hälfte, die zum Schalter A verbunden ist ein Quorum formieren wird. Da der Cluster-Manager ein vollständig verbundenes Subnet erfordert, wird der Fall bei einem gleichmäßigen Split (oder split-brain), wenn beide Partitionen die Tie-Breaker IP erreichen können, nicht behandelt.

Überprüfung: Führen Sie clustat auf den mit Schalter A verbundenen Membern aus. Es sollte eine Cluster Quorum Incarnation-Nummer am Anfang der Ausgabe angegeben sein.

Verlust des Zugriffs auf gemeinsame Medien

Häufige Ursachen: Gemeinsame Medien verlieren Stromversorgung, ein verbindendes Kabel von einem Member zu den gemeinsamen Medien ist getrennt.

Testfall: Ziehen Sie das SCSI- oder Fibre-Channel-Kabel von einem Member.

Erwartetes Verhalten: Konfigurierte Aktionen werden ausgeführt um dem Verlust des Zugriffs auf gemeinsamen Speicher entgegen zu gehen (reboot/halt/stop/ignore). Die Vorgabe ist reboot.

Hängen des Systems oder Absturz (Panic) eines Cluster-Member

Testfall: Kill cluquorumd und clumembd Daemons.

killall -STOP cluquorumd clumembd

Erwartetes Verhalten: Cluster-Member wird von anderen Cluster-Membern ausgegrenzt. Services werden umgelagert. Konfigurierte Watchdog-Timer werden eventuell aufgerufen, sofern verwendet.