3.8. Traitement des services échoués

Le cluster change l'état d'un service en Échoué s'il ne réussit pas à démarrer le service sur tous les membres et ne peut pas arrêter le service de façon nette. Un état Échoué peut être la conséquence de plusieurs problèmes comme une mauvaise configuration lors de l'exécution du service ou le blocage ou l'arrêt d'un service. L'Outil de statut du cluster affiche le service comme étant Échoué.

Figure 3-2. Service dans l'état Échoué

NoteRemarque
 

Vous devez désactiver un service Échoué avant de pouvoir le modifier ou de nouveau l'activer.

Traitez les situations de services défaillants avec précautions. Si les ressources du système sont toujours configurées sur le membre propriétaire, le démarrage du service sur un autre membre peut entraîner de sérieux problèmes. Par exemple, si un système de fichiers est toujours monté sur le membre propriétaire et que vous démarrez le service sur un autre membre, le système de fichiers sera monté sur les deux membres en même temps, ce qui peut entraîner la corruption des données. Si l'activation échoue, le service restera à l'état Désactivé.

Après avoir sélectionné le service et avoir cliqué sur Désactivé, vous pourrez essayer de résoudre le problème à l'origine de l'état Échoué. Après la modification du service, le logiciel de cluster l'activera sur le membre propriétaire, si possible, sinon il restera à l'état Désactivé. La liste ci-dessous détaille les étapes à suivre en cas de défaillance d'un service :

  1. Modifiez l'enregistrement des événements du cluster pour enregistrer des messages de débogage. L'examen des journaux peut aider à déterminer les zones à problèmes. Pour plus d'informations, consultez la Section 7.6.

  2. Utilisez l'Outil de statut du cluster pour essayer d'activer ou de désactiver le service sur l'un des membres du cluster ou du domaine de failover. Pour plus d'informations, consultez la Section 3.3 et la Section 3.4.

  3. Si le service ne démarre pas ou ne s'arrête pas sur le membre, examinez les fichiers journaux /var/log/messages et /var/log/cluster (si le service est configuré de façon à enregistrer les évènements séparément), afin de diagnostiquer et résoudre le problème. Il vous faudra peut-être modifier le service afin de corriger des informations incorrectes dans le fichier de configuration du cluster (par exemple, un script de démarrage incorrect) ou il vous faudra peut-être exécuter des tâches manuelles sur le membre propriétaire (par exemple, le démontage de systèmes de fichiers).

  4. Essayez à nouveau d'activer ou de désactiver le service sur le membre. Si plusieurs tentatives ne réussissent pas à résoudre le problème et à activer ou désactiver le service, redémarrez le membre.

  5. S'il n'est toujours pas possible de démarrer le service avec succès, vérifiez si le service peut être manuellement redémarrer hors du cadre du cluster. Par exemple, vous devrez peut-être démonter manuellement les systèmes de fichiers et lancer manuellement le script de démarrage du service.