3.8. Handhabung ausgefallener Services

Der Cluster setzt einen Service in einen Fehlgeschlagen-Zustand, sollte es diesen Service nicht erfolgreich starten können. Ein Fehlgeschlagen-Zustand kann durch verschiedene Probleme verursacht werden, zum Beispiel dadurch, dass ein Service nicht erfolgreich gestartet werden konnte, oder dass ein anschließender Versuch den Service zu beenden auch fehlschlug. Cluster Status Tool wird diesen Service als Fehlgeschlagen anzeigen.

Abbildung 3-2. Service im Zustand Fehlgeschlagen

AnmerkungHinweis
 

Sie müssen einen Fehlgeschlagen Service deaktivieren, bevor Sie diesen ändern oder neu starten können.

Stellen Sie sicher, ausgefallene Services sorgfältig zu behandeln. Sollten Service-Ressourcen noch auf einem System konfiguriert sein, könnte das Starten des Service auf dem anderen Cluster System erhebliche Probleme verursachen. Sollte zum Beispiel das System noch einen Mount zu einem Dateisystem enthalten, und das Starten des Service auf dem anderen Cluster System einen Mount dieses Dateisystem mit sich bringen, dann haben beide Cluster Systeme einen Mount zu diesem Dateisystem, was die Korruption von Daten zur Folge haben kann. Sollte das Einschalten fehlschlagen, wird der Service in einem Deaktiviert-Zustand verbleiben.

Nachdem Sie den Service von Hand in den Deaktiviert-Status versetzt haben, können Sie versuchen, das Problem, das den Fehlgeschlagen-Status verursacht hat, zu beheben. Nach dem Ändern des Services aktiviert die Software den Service auf dem Besitzer-Member wenn möglich; ansonsten bleibt der Service Deaktiviert. In der folgenden Liste werden Schritte im Falle eines Service-Ausfalls beschrieben:

  1. Modifizieren Sie das Cluster-Event-Logging zum Schreiben von Debug-Meldungen in eine Log-Datei. Weitere Informationen finden Sie unter Abschnitt 7.6.

  2. Benutzen Sie das Cluster Status Tool und versuchen Sie, den Service auf dem Cluster-System oder Failover-Domain-Member, auf dem dieser läuft, ein oder auszuschalten. Weitere Informationen finden Sie unter Abschnitt 3.3 und Abschnitt 3.4.

  3. Sollte ein Service auf dem laufenden System weder starten noch stoppen, untersuchen Sie die Log-Dateien /var/log/messages und (falls für eine separate Log konfiguriert) /var/log/cluster und finden und beheben Sie das Problem. Unter Umständen müssen Sie den Service modifizieren, um Fehler in der Cluster-Datenbank zu berichtigen (zum Beispiel ein fehlerhaftes Start-Skript), oder Sie müssen Aufgaben auf dem laufenden System manuell erledigen (zum Beispiel einen Unmount von Dateisystemen).

  4. Wiederholen Sie den Versuch, den Service auf dem laufenden System ein- oder auszuschalten. Sollten wiederholte Versuche fehlschlagen, starten sie das Cluster-System, auf dem der Service läuft, neu.

  5. Sollte der Service immernoch nicht gestartet werden können, prüfen Sie, dass der Service manuell, außerhalb des Cluster, gestartet werden kann. Dies kann zum Beispiel ein manuelles Mounten der Dateisysteme und Ausführen des Service-Start-Skript umfassen.