3.8. 失敗したサービスを処理する

すべてのメンバーでサービスを正常に起動できない場合、 クラスタはサービスを失敗しましたの状態にし、 サービスを正常に停止することができません。 誤った設定のサービスの実行、サービスのハングやクラッシュなど、 さまざまなことが原因で、失敗しましたの状態になります。 クラスタステータスツールは、 これを失敗しましたと表示します。

図 3-2. Failedの状態にあるサービス

注意注記
 

サービスを変更または再度有効にする前に、失敗しましたの サービスを無効にしてください。

失敗したサービスは、十分に注意して処理してください。 サービスのリソースがサービスを所有しているメンバー上にまだ設定されている場合、 他方のメンバーでサービスを起動すると重大な問題が発生することがあります。 たとえば、ファイルシステムがサービスを所有しているメンバーにマウントされたまま、 他方のメンバーでサービスを起動すると、ファイルシステムは両方のメンバーにマウントされ、 データが破損することがあります。 有効にできなかった場合、サービスは無効状態になったままです。

サービスをハイライトしてオフにするをクリックしたら、 失敗しましたの状態の要因となる問題の修正を試行できます。 サービスを変更したら、クラスタソフトウェアは可能であればオーナーメンバー (サービスを所有するメンバー)でサービスを有効にします。あるいは、 サービスは無効状態のままです。 以下の一覧で、サービスが失敗した際に行なう手順を説明します。

  1. クラスタイベントロギングをログデバッグメッセージに変更します。 ログを確認する ことで、問題箇所を確定できます。詳細については、項7.6 を参照してください。

  2. クラスタステータスツールを使用して、 クラスタまたはフェイルオーバーのドメインメンバーのひとつで サービスを有効または無効にしてみます。詳細については、項3.3項3.4を参照してください。

  3. サービスが、メンバーで起動または停止しない場合は、/var/log/messagesと(ログを別々に設定の場合)/var/log/cluster の各ログファイルを調べ、問題を診断して訂正します。 クラスタ設定ファイル内の 誤った情報を修正するために、サービスを変更する必要があるかもしれません (たとえば、起動スクリプトの誤り)。 または、オーナーメンバー(サービスを所有する メンバー)でマニュアルの作業を行なう必要があるかもしれません (たとえば、ファイルシステムをアンマウントする)。

  4. メンバーでサービスを繰り返し有効または無効にしてみます。 問題が解決されず、サービスを有効または無効にできない場合は、 そのメンバーを再起動します。

  5. 上記の手順を行なってもサービスを起動できない場合は、 クラスタフレームワーク外でサービスを手動で再起動できるか確認してください。 たとえば、ファイルシステムを手動でマウントしたり、 サービス起動スクリプトを手動で実行します。