Suite de cluster de Red Hat: Configuration et gestion d'un cluster | ||
---|---|---|
Précédent | Annexe D. Utilitaires de ligne de commande d'un cluster | Suivant |
Si des interrupteurs sont utilisés dans la configuration matérielle du cluster, exécutez l'utilitaire clufence sur chaque membre du cluster afin de vous assurer qu'ils peuvent bien prendre en relais les autres membres du cluster et ce, à distance.
Si la commande réussit, exécutez la commande shutil -p sur les deux membres afin d'afficher un résumé de la structure des données d'en-tête pour les partitions quorum. Si la sortie est différente sur les systèmes, les partitions de quorum ne sont pas dirigées vers les mêmes périphériques sur les deux systèmes. Vérifiez bien que les périphériques bruts existent et qu'ils sont correctement spécifiés dans le fichier /etc/sysconfig/rawdevices. Conslutez la Section 1.4.4.3 pour davantage d'informations.
Si les interrupteurs connectés au réseau ou en série sont utilisés dans la configuration matérielle du cluster, installez le logiciel de cluster et lancez la commande clufence afin de tester les interrupteurs. Lancez la commande sur chaque membre du cluster pour vous assurer qu'il peut bien prendre en relais les autres membres. Si le test réussit, le cluster peut alors être lancé.
La commande clufence peut correctement tester un interrupteur. Le format de la commande clufence est le suivant :
usage: clufence [-d] [-[furs] <member>] -d Turn on debugging -f <member> Fence (power off) <member> -u <member> Unfence (power on) <member> -r <member> Reboot (power cycle) <member> -s <member> Check status of all switches controlling <member> |
Lorsque vous testez des interrupteurs, la première étape consiste à s'assurer que chaque membre du cluster peut communiquer avec l'interrupteur qui lui est connecté. L'exemple suivant de sortie de la commande clufence montre que le membre du cluster peut communiquer avec son interrupteur :
[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2 [23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5 |
Toute erreur dans la sortie peut indiquer les types de problèmes suivants :
Pour les interrupteurs connectés en série :
Vérifiez que le fichier spécial de périphérique pour le port série de connexion à l'interrupteur à distance (par exemple, /dev/ttyS0) est bien spécifié dans la base de données du cluster, comme il est établi via l'Outil de configuration du cluster. Au besoin, utilisez un paquetage d'émulation de terminal, tel que minicom, afin de tester si le membre du cluster peut accéder au port série.
Assurez-vous qu'un programme qui n'agit pas sur tout le cluster (par exemple, un programme getty) n'utilise pas le port série pour la connexion de l'interrupteur à distance. Vous pouvez utiliser la commande lsof pour effectuer cette tâche.
Vérifiez que la connexion câble vers l'interrupteur à distance est correcte. Vérifiez que le type de câble utilisé est correct (par exemple, un interrupteur RPS-10 requiert un câble modem null) et que toutes les connexions sont fixées de manière sécurisée.
Vérifiez que tous les commutateurs dip physiques ou tous les commutateurs rotatifs sur l'interrupteur sont bien configurés.
Pour les interrupteurs basés sur le réseau :
Vérifiez que la connexion réseau vers les commutateurs basés sur le réseau est opérationnelle. La plupart des commutateurs ont un voyant de lien qui représente la connectivité.
Il devrait être possible de lancer une commande ping vers le commutateur réseau ; dans le cas contraire, ses paramètres réseau ne sont peut-être pas configurés correctement.
Vérifiez que le bon mot de passe et le bon nom de connexion (selon le type de commutateur) ont été spécifiés dans la base de données de configuration du cluster (comme établis lors de l'exécution de l'Outil de configuration du cluster). Une approche de diagnostique utile consiste à vérifier l'accès Telnet au commutateur réseau en utilisant les mêmes paramètres que ceux spécifiés dans la configuration du cluster.
Après avoir vérifié la communication avec le commutateur, essayez de prendre en relais l'autre membre du cluster. Avant d'effectuer cela, nous vous conseillons de vérifier que l'autre membre n'est pas en train d'effectuer d'autres fonctions importantes (comme fournir des services du cluster aux clients actifs). Pour ce faire, exécutez la commande suivante :
clufence -r clu3 |
L'exemple suivant illustre une opération de prise en relais réussie :
Successfully power cycled host clu3. |
Précédent | Sommaire | Suivant |
Utilisation de l'utilitaire clusvcadm | Niveau supérieur | Index |