未阻絕 SCSI 匯流排 | 紀錄檔案中出現 SCSI 錯誤 | 每一條 SCSI 匯流排都必須在開頭與結尾處進行阻絕,取決於匯流排的設定,也許需要 啟用或停用主機匯流排配接卡、RAID 控制卡與儲存附件上的阻絕設定。 為了支援熱插拔,需要外部的阻絕 裝置來阻絕一條 SCSI 匯流排。 | 除此之外,請確定沒有任何裝置使用長度大於 0.1 公尺 的 stub 來連接到 SCSI 匯流排。 | 請參考 第 1.4.4 節 與 第 B.3 節 來取得關於阻絕不同 SCSI 匯流排類型的資訊。 |
|
SCSI ;匯流排的長度大於最長的限制 | 紀錄檔案中出現 SCSI 錯誤 | 每一種 SCSI 匯流排類型都必須遵照長度的限制,如 第 B.4 節 所述。 | 除此之外,請確定沒有任何單埠的(single-ended)裝置連接到 LVD SCSI 匯流排, 因為這將會導致整個匯流排回歸到一條單埠的匯流排,此種類型的匯流排比差動式(differential)匯流排的 長度限制更多。 |
|
SCSI ID 號碼不獨特 | 紀錄檔案中出現 SCSI 錯誤 | 一條 SCSI 匯流排上的每一個裝置都必須擁有一個獨特的 ID 號碼,請參考 第 B.5 節 以取得更多資訊。 |
SCSI 指令於完成前逾時 | 紀錄檔案中出現 SCSI 錯誤 | SCSI 匯流排上的優先順序調停機制將會導致低優先順序的裝置被鎖定一段時間。 假如一個低優先順序的儲存裝置(如一個磁碟)無法贏得調停,並且完成一部主機已經佇列的一個指令, 將會導致該指令逾時。 對於某些工作量來說,可以藉由指定較低的 SCSI ID 號碼給主機匯流排配接卡來 防止這個問題發生。 | 請參考 第 B.5 節 以取得更多資訊。 |
|
已掛載的 quorum 分割區 | 紀錄檔案中出現指出一個 quorum 分割區上檢查碼錯誤的訊息 | 請確定 quorum 分割區的 raw 裝置只能由叢集狀態資訊所使用,它們不能被叢集服務或 非叢集的目的所使用,而且不能含有一個檔案系統。 請參考 第 1.4.4.3 節 以取得 更多資訊。 | 這些訊息也可能指出 quorum 分割區中的區塊裝置特殊檔案已經被非叢集的功能 所錯誤使用了。 |
|
服務檔案系統含有不完整的資料 | 無法啟用一個已經停用的服務 | 手動執行一個檢查程式,例如 fsck,然後再啟用服務。 | 請注意叢集的基礎架構確實預設執行含有 -p 選項的 fsck 來自動修復檔案系統的不一致性。 至於非常特定的錯誤類型,您也許需要手動初始檔案系統的修復選項。 |
|
Quorum 分割區未設定正確 | 紀錄檔案中出現無法存取 quorum 分割區的訊息 | 請執行 /sbin/shutil -t 指令來檢查 quorum 分割區是否可以存取,假如指令成功的話, 請在兩部叢集系統上執行 shutil -p 指令。 假如兩部系統的輸出不同的話,表示該 quorum 分割區並未指向同一裝置。 請檢查以確認 raw 裝置確實存在,而且在 /etc/sysconfig/rawdevices 檔案中已經正確地指定了。 請參考 第 1.4.4.3 節 以取得更多資訊。 |
叢集服務操作失敗 | 在紀錄檔案或主控台中出現操作失敗的訊息 | 服務操作失敗有可能是許多種不同的因素所造成(例如一項服務停止或啟動),如要找出問題的癥結所在, 請設定叢集系統程式的嚴重性等級為 DEBUG 以紀錄較具描述性的訊息。 然後再試 一次該服務操作,並且檢查紀錄檔案。 請參考 第 7.6 節 以取得更多資訊。 |
因為無法卸載一個檔案系統而導致無法停止叢集服務 | 主控台或紀錄檔案中出現操作失敗的訊息 | 使用 fuser 與 ps 指令來找出存取檔案系統 的程序。 使用 kill 指令來停止該程序,使用 lsof -t file_system 指令來顯示出正在存取所指定之檔案系統的程序 ID。 假如需要的話,請 pipe 輸出到 kill 指令。 | 如要防止這個問題,請確定只有叢集相關的程序才能存取共用儲存裝置的資料。 除此之外,修改該服務而且啟用強制卸載檔案系統。 這將會啟用叢集服務來卸載一個檔案系統, 即使一個應用程式或使用者正在存取該檔案系統。 |
|
叢集資料庫中錯誤的紀錄項 | 叢集操作已損壞 | 可以使用 叢集狀態工具 來檢查與修改服務的設定,而您可以使用 叢集設定工具 來修改叢集的參數。 |
叢集資料庫或 /etc/hosts 檔案中含有錯誤的乙太網路 heartbeat 紀錄項 | 叢集狀態指出一個乙太網路的 heartbeat 頻道已經 OFFLINE(即使該介面仍是有效的) | 請檢查目前的設定,並且執行 叢集設定工具 來修改叢集的組態設定(如 第 7.4 節 中所指定的),並且修正問題。 | 除此之外,請使用 ping 來傳送一個封包到叢集中使用的所有網路介面。 |
|
電源開關的纜線連線鬆弛 | 使用 clufence 所產生的電源開關狀態傳回一個錯誤或當機 | 檢查序列纜線的連線 |
叢集資料庫中指定了錯誤的電源開關序列埠 | 使用 clufence 指令所產生的電源開關狀態指出一個問題的存在 | 請檢查目前的設定,並且執行 叢集設定工具 來修改叢集的組態設定(如 第 7.4 節 中所指定的),並且修正問題。 |