常見的原因: 網路交換器的問題。
測試例子: 將一半的成員連接到交換器 A,而另一半則連接到交換器 B,使用跳接線將交換器 A 與 B 連接起來。 將當作 tie-breaker IP 位址的裝置連接到交換器 A,再啟動叢集服務,在交換器 B 上拔除交換器 A 的連線。
預期的行為: 由一半成員所組成的所有叢集分割區將發送 ping 封包到 tie-breaker IP 位址,假如接收到回覆,該分割區並形成一個 quorum。 在這個測試例子中,這表示連接到交換器 A 的一半成員將會形成一個 quorum。 由於叢集管理員需要一個完全連線的子網路,因此將不處理 一個成員均分的情況(當兩個分割區都可以到達 tie-breaker IP)。
檢驗: 在連接到交換器 A 的成員上執行 clustat,在輸出的頂端應該會出現一個 Cluster Quorum Incarnation 號碼。
常見的原因: 共用的媒體失去電源; 連接成員到共用媒體的纜線被拔除。
測試例子: 於成員上拔除 SCSI 或光纖通道的纜線。
預期的行為: 將採取設定好的動作來處理無法存取共用儲存裝置的問題(reboot/halt/stop/ignore),預設為 reboot。
測試例子: 強制中斷(kill) cluquorumd 與 clumembd 系統程式。
killall -STOP cluquorumd clumembd |
預期的行為: 其他成員將保護該叢集成員,服務將近形容錯移轉,而且假如有使用看門狗的話,也許會被觸動。