C.4. 常見的行為: 含有磁碟為基礎之 Tie-breaker 的兩部成員叢集

與其他成員失去網路連線,仍然可以存取共用的媒體

常見的原因: 失去網路連線。

測試例子: 拔除一部成員上的所有網路線。

預期的行為: 不進行容錯移轉,除非磁碟更新也遺失了。 在大部份的情況下,將無法重置服務,這是由於 鎖定伺服器需要網路連線的事實。

檢驗: 請執行 clustat 來檢查成員上的服務仍然標示為執行中的,即使根據成員資格來說, 它不是處於使用中的。 將會紀錄成員現在正處於 PANIC 狀態的訊息。

無法存取共用的媒體

常見的原因: 共用的媒體失去電源、連接成員到共用媒體的纜線已被拔除。

測試例子: 於成員上拔除 SCSI 或光纖通道的纜線。

預期的行為: 不進行容錯移轉,除非網路連線已中斷,將會採取設定好的動作來處理無法存取共用儲存裝置 的問題(reboot/halt/stop/ignore),預設為 reboot,這個動作也許會進而導致一個容錯移轉的發生。

成員 X 發生系統當機或中斷運作(panic)

測試例子: 強制中斷(kill) cluquorumdclumembd 系統程式。

killall -STOP cluquorumd clumembd

預期的行為: 其他叢集成員將會保護當機的叢集成員,服務將進行容錯移轉,也許會觸動設定好的看門狗計時器。

於缺少網路連線的情況下啟動叢集服務

常見的原因: 不良的網路交換器,一部或兩部成員都沒有網路連線

測試例子: 停止所有成員上的叢集服務,將一部成員上的所有網路線拔除,啟動兩部成員上的叢集服務。

檢驗: 並非所有的服務都將啟動,因為鎖定需要網路連線。 由於叢集管理員需要一個完全連線的子網路, 這個例子是假設在最佳的情況下進行的,不過技術上看來這仍然是一個無法運作的叢集。