常見的原因: 失去網路連線。
測試例子: 拔除一部成員上的所有網路線。
預期的行為: 不進行容錯移轉,除非磁碟更新也遺失了。 在大部份的情況下,將無法重置服務,這是由於 鎖定伺服器需要網路連線的事實。
檢驗: 請執行 clustat 來檢查成員上的服務仍然標示為執行中的,即使根據成員資格來說, 它不是處於使用中的。 將會紀錄成員現在正處於 PANIC 狀態的訊息。
常見的原因: 共用的媒體失去電源、連接成員到共用媒體的纜線已被拔除。
測試例子: 於成員上拔除 SCSI 或光纖通道的纜線。
預期的行為: 不進行容錯移轉,除非網路連線已中斷,將會採取設定好的動作來處理無法存取共用儲存裝置 的問題(reboot/halt/stop/ignore),預設為 reboot,這個動作也許會進而導致一個容錯移轉的發生。
測試例子: 強制中斷(kill) cluquorumd 與 clumembd 系統程式。
killall -STOP cluquorumd clumembd |
預期的行為: 其他叢集成員將會保護當機的叢集成員,服務將進行容錯移轉,也許會觸動設定好的看門狗計時器。
常見的原因: 不良的網路交換器,一部或兩部成員都沒有網路連線
測試例子: 停止所有成員上的叢集服務,將一部成員上的所有網路線拔除,啟動兩部成員上的叢集服務。
檢驗: 並非所有的服務都將啟動,因為鎖定需要網路連線。 由於叢集管理員需要一個完全連線的子網路, 這個例子是假設在最佳的情況下進行的,不過技術上看來這仍然是一個無法運作的叢集。