C.5. 常見的行為: 含有 IP 為基礎之 Tie-Breaker 的 2-4 成員叢集

網路分割區

常見的原因: 網路交換器的問題。

測試例子: 將一半的成員連接到交換器 A,而另一半則連接到交換器 B,使用跳接線將交換器 A 與 B 連接起來。 將當作 tie-breaker IP 位址的裝置連接到交換器 A,再啟動叢集服務,在交換器 B 上拔除交換器 A 的連線。

預期的行為: 由一半成員所組成的所有叢集分割區將發送 ping 封包到 tie-breaker IP 位址,假如接收到回覆,該分割區並形成一個 quorum。 在這個測試例子中,這表示連接到交換器 A 的一半成員將會形成一個 quorum。 由於叢集管理員需要一個完全連線的子網路,因此將不處理 一個成員均分的情況(當兩個分割區都可以到達 tie-breaker IP)。

檢驗: 在連接到交換器 A 的成員上執行 clustat,在輸出的頂端應該會出現一個 Cluster Quorum Incarnation 號碼。

無法存取共用的媒體

常見的原因: 共用的媒體失去電源; 連接成員到共用媒體的纜線被拔除。

測試例子: 於成員上拔除 SCSI 或光纖通道的纜線。

預期的行為: 將採取設定好的動作來處理無法存取共用儲存裝置的問題(reboot/halt/stop/ignore),預設為 reboot

叢集成員的系統當機或運行中斷(panic)

測試例子: 強制中斷(kill) cluquorumdclumembd 系統程式。

killall -STOP cluquorumd clumembd

預期的行為: 其他成員將保護該叢集成員,服務將近形容錯移轉,而且假如有使用看門狗的話,也許會被觸動。