クラスタ ハードウェア設定に電源スイッチが使われている時は、 clufenceユーティリティを各クラスタシステムで実行し、 遠隔操作で他のクラスタメンバーの電源を切ってすぐ入れなおせるか(power cycleできるか)確認してください。
このコマンドの実行に成功したら、 両方のクラスタシステムに shutil -pコマンドを実行し、定数(quorum)パーティションのヘッダー データ構成の要約を表示してください。 各システムの出力が異なる場合、定数パーティションは両システムの同じデバイスには ポイントしません。rawデバイスが存在し、/etc/sysconfig/rawdevicesファイルに正しく指定されているか 確認してください。 詳細は項1.4.4.3を参照ください。
ネットワーク接続電源スイッチとシリアル接続電源スイッチどちらかがクラスタハードウェア設定に使用されている時はクラスタソフトウェアをインストールしてください。そして clufenceコマンドを実行して 電源スイッチをテストしてください。 各クラスタシステムでこのコマンドを実行して、 遠隔操作で他のクラスタメンバーの電源を切ってすぐ入れなおせるか(power cycleできるか)確認してください。 このテストに成功したら、クラスタを起動することができます。
The clufence コマンドにて電源スイッチのテストを正確に行なうことができます。 clufenceコマンドのフォーマットは次の通りです。
usage: clufence [-d] [-[furs] <member>] -d Turn on debugging -f <member> Fence (power off) <member> -u <member> Unfence (power on) <member> -r <member> Reboot (power cycle) <member> -s <member> Check status of all switches controlling <member> |
電源スイッチをテストする際、最初に各クラスタメンバーと接続した電源スイッチが正しく通信できるか確認してください。 クラスタメンバーと電源スイッチの通信が可能な場合の clufenceコマンド出力例は次の通りです。
[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2 [23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5 |
出力上のエラーは次に上げるような問題が存在することを示しています。
シリアル接続電源スイッチの場合。
クラスタ設定ツールにて 遠隔電源スイッチ接続のシリアルポート(例:/dev/ttyS0)が クラスタデータベースに正しく指定されているか確認してください。 必要なら、minicomのようなターミナル エミュレーション パッケージ を使用し、クラスタシステムがシリアルポートに接続できるかテストしてください。
遠隔電源スイッチ接続用のシリアルポートが 非クラスタ プロクラム(例: gettyプログラム) によって使用していないことを確認してください。 このタスクを実行するには、lsofコマンドを使用してください。
遠隔電源スイッチへのケーブルが正しく接続されているか確認してください。 また、正しい種類のケーブルが使われているか (例えば、RPS-10電源スイッチにはヌル モデムケーブルが必要)、 全てしっかり接続されているか確認してください。
電源スイッチの物理ディップ スイッチやロータリー スイッチが全て正しく設定されているか 確認してください。
ネットワークベースの電源スイッチの場合。
ネットワークベーススイッチへのネットワーク接続が正しく行なわれているか確認してください。 スイッチの多くには接続状態を示すリンクライトが付いています。
ネットワークスイッチをpingできるはずです。 できない場合は ネットワークパラメータに対してスイッチが正しく接続されていない可能性があります。
正しいパスワードとログイン名(スイッチタイプによって異なります)が クラスタ設定データベースに指定されているか確認してください。 (実行中のクラスタ設定ツールによって確立されます) 便利な診断アプローチとして、 クラスタ設定で指定されたものと同じパラメータを使用して、 ネットワークスイッチへのTelnetアクセスを確認する方法があります。
スイッチの通信を無事確認した後、 別のクラスタメンバーの電源を切ってすぐに入れ直してみてください(power cycleする)。 これを実行する前に、別のクラスタメンバーが重要な機能 (アクティブクライアントへのクラスタサービス提供など) を実行していないか確認するとよいでしょう。 それには次のコマンドを実行してください。
clufence -r clu3 |
下記はpower cycle が無事実行されたこと示しています。
Successfully power cycled host clu3. |