2.11. Vérification de la configuration du cluster

Pour vous assurer que le logiciel de cluster a été configuré correctement, utilisez les outils suivants qui se trouvent dans le répertoire /sbin :

La section suivante traite de façon plus détaillée les utilitaires du cluster.

2.11.1. Test des partitions partagées

Les partitions partagées doivent faire référence au même périphérique physique sur tous les membres. Invoquez l'utilitaire /usr/sbin/shutil avec la commande -v pour tester les partitions partagées et vérifier qu'elles sont accessibles.

Si la commande aboutit, exécutez la commande /usr/sbin/shutil -p /cluster/header sur tous les membres pour afficher un résumé de la structure des données d'en-tête pour les partitions partagées. Si la sortie est différente sur les membres, les partitions partagées ne renvoient pas aux mêmes périphériques sur tous les membres. Vérifiez que les périphériques bruts existent et sont spécifiés correctement dans le fichier /etc/sysconfig/rawdevices. Consultez la Section 1.4.4.3 pour de plus amples informations.

Dans l'exemple suivant, les partitions partagées font référence au même périphérique physique sur les membres du cluster clu1.example.com et clu2.example.com via la commande /usr/sbin/shutil -p /cluster/header :

/cluster/header is 140 bytes long
SharedStateHeader {
        ss_magic = 0x39119fcd
        ss_timestamp = 0x000000003ecbc215 (14:14:45 May 21 2003)
        ss_updateHost = clu1.example.com

Tous les champs dans la sortie de la commande /usr/sbin/shutil -p /cluster/header devraient être les mêmes que lorsqu'elle est exécutée sur tous les membres du cluster. Si la sortie n'est pas la même sur tous les membres, exécutez les opérations suivantes :

Après avoir effectué ces tâches, relancez l'utilitaire /usr/sbin/shutil avec l'option -p.

2.11.2. Test des interrupteurs

Si, dans la configuration matérielle du cluster, des interrupteurs réseau ou des interrupteurs reliés à des câbles série sont utilisés, installez le logiciel de cluster et invoquez la commande clufence pour les tester. Invoquez cette commande sur chaque membre pour vous assurer que la prise de relais est bien possible par l'un ou l'autre. Si le test est positif, vous pouvez alors démarrer le cluster.

La commande clufence ne peut tester un interrupteur de façon précise que si le logiciel de cluster ne tourne pas. En effet, pour les interrupteurs attachés aux câbles série, seul un programme à la fois peut accéder au port série qui connecte un interrupteur à un membre. Lorsque la commande clufence est utilisée, elle vérifie le statut du logiciel de cluster. Si le logiciel de cluster est lancé, la commande est interrompue et un message demandant d'arrêter le logiciel de cluster apparaît.

Les options de la commande clufence sont les suivantes :

Lors du test des interrupteurs, la première étape est de s'assurer que chaque membre du cluster peut bien communiquer avec l'interrupteur auquel il est relié. L'exemple suivant des sorties de la commande clufence montre que le membre du cluster peut en effet communiquer avec son interrupteur :

[27734] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com
[27734] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com

Dans le cas d'une erreur dans la sortie de clufence, vérifiez les éléments suivants :

Après vous être assuré que la communication avec l'interrupteur est bien établie, essayez de prendre le relais de l'autre membre du cluster. Auparavant, il est recommandé de s'assurer que l'autre membre du cluster n'effectue pas activement de fonctions importantes (comme fournir des services du cluster à des clients actifs). L'exécution de la commande clufence -f clumember2.example.com affiche la sortie suivante lors d'un arrêt réussi et d'une opération de fencing (clôture) (ce qui signifie que le système ne reçoit pas d'alimentation de l'interrupteur jusqu'à ce que sa clôture soit enlevée) :

[7397] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com
[7397] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com
[7397] notice: STONITH: clumember2.example.com has been fenced!

2.11.3. Affichage de la version du logiciel de cluster

Assurez-vous que tous les membres font tourner la même version du logiciel de Gestionnaire de cluster de Red Hat.

Pour afficher la version de l'Outil de configuration du cluster et de l'Outil de statut du cluster, utilisez l'une des méthodes suivantes :