D.4. Utilisation de l'utilitaire clufence

Si des interrupteurs sont utilisés dans la configuration matérielle du cluster, exécutez l'utilitaire clufence sur chaque membre du cluster afin de vous assurer qu'ils peuvent bien prendre en relais les autres membres du cluster et ce, à distance.

Si la commande réussit, exécutez la commande shutil -p sur les deux membres afin d'afficher un résumé de la structure des données d'en-tête pour les partitions quorum. Si la sortie est différente sur les systèmes, les partitions de quorum ne sont pas dirigées vers les mêmes périphériques sur les deux systèmes. Vérifiez bien que les périphériques bruts existent et qu'ils sont correctement spécifiés dans le fichier /etc/sysconfig/rawdevices. Conslutez la Section 1.4.4.3 pour davantage d'informations.

Si les interrupteurs connectés au réseau ou en série sont utilisés dans la configuration matérielle du cluster, installez le logiciel de cluster et lancez la commande clufence afin de tester les interrupteurs. Lancez la commande sur chaque membre du cluster pour vous assurer qu'il peut bien prendre en relais les autres membres. Si le test réussit, le cluster peut alors être lancé.

La commande clufence peut correctement tester un interrupteur. Le format de la commande clufence est le suivant :

usage: clufence [-d] [-[furs] <member>]
  -d              Turn on debugging
  -f <member>     Fence (power off) <member>
  -u <member>     Unfence (power on) <member>
  -r <member>     Reboot (power cycle) <member>
  -s <member>     Check status of all switches controlling <member>

Lorsque vous testez des interrupteurs, la première étape consiste à s'assurer que chaque membre du cluster peut communiquer avec l'interrupteur qui lui est connecté. L'exemple suivant de sortie de la commande clufence montre que le membre du cluster peut communiquer avec son interrupteur :

[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2
[23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5

Toute erreur dans la sortie peut indiquer les types de problèmes suivants :

Après avoir vérifié la communication avec le commutateur, essayez de prendre en relais l'autre membre du cluster. Avant d'effectuer cela, nous vous conseillons de vérifier que l'autre membre n'est pas en train d'effectuer d'autres fonctions importantes (comme fournir des services du cluster aux clients actifs). Pour ce faire, exécutez la commande suivante :

clufence -r clu3

L'exemple suivant illustre une opération de prise en relais réussie :

Successfully power cycled host clu3.