Red Hat Cluster Suite: Configuring and Managing a Cluster | ||
---|---|---|
Anterior | Capítulo 2. Configuración del cluster | Siguiente |
Para asegurar que el software del cluster ha sido configurado correctamente, utilice las siguientes herramientas localizadas en el directorio /usr/sbin:
Evalue las particiones compartidas y asegúrese de que están accesibles.
Invoque la utilidad /usr/sbin/shutil con la opción -v para evaluar la accesabilidad de las particiones compartidas. Vea la Sección 2.11.1 para más información.
Pruebe el funcionamiento de los interruptores.
Si se usan interruptores en la configuración del hardware del cluster, ejecute el comando clufence en cada sistema cluster para asegurar que puedan encender (power cycle) el otro sistema remotamente. No ejecute este comando mientras el software del cluster se esté ejecutando. Consulte la Sección 2.11.2 para más información.
Asegúrese de que todos sistemas estén ejecutando la misma versión de software.
Invoque el comando rpm -q clumanager y rpm -q redhat-config-cluster en cada miembro cluster para desplegar la revisión del RPM instalado.
La siguiente sección explica las utilidades del cluster con más detalles.
Las particiones compartidas deben referirse al mismo dispositivo físico en todos los miembros. Invoque la utilidad /usr/sbin/shutil con la opción -v para probar las particiones compartidas y verificar si están accesibles.
Si el comando se completa exitosamente, ejecute el comando /usr/sbin/shutil -p /cluster/header en todos los miembros para desplegar un resúmen de la estructura de datos de la cabecera para las particiones compartidas. Si la salida es diferente en los miembros, las particiones compartidas no están apuntando a los mismos dispositivos en todos los miembros. Verifique para asegurarse que los dispositivos brutos existen y están especificados correctamente en el archivo /etc/sysconfig/rawdevices. Vea la Sección 1.4.4.3 para más información.
El ejemplo siguiente muestra que las particiones compartidas se refieren al mismo dispositivo físico en los miembros cluster clu1.example.com y clu2.example.com a través del comando /usr/sbin/shutil -p /cluster/header:
/cluster/header is 140 bytes long SharedStateHeader { ss_magic = 0x39119fcd ss_timestamp = 0x000000003ecbc215 (14:14:45 May 21 2003) ss_updateHost = clu1.example.com |
Todos los campos en la salida del comando /usr/sbin/shutil -p /cluster/header deberían ser lo mismo cuando se ejecute en todos los miembros. Si la salida no es la misma en todos los miembros, haga lo siguiente:
Examine el archivo /etc/sysconfig/rawdevices en cada miembro y asegúrese de que los dispositivos brutos de caracteres y en bloque para las particiones compartidas primaria y de respaldo, han sido especificados correctamente. Si no son los mismos, edite el archivo y corrija cualquier error. Entonces, vuelva a ejecutar la utilidad Herramienta de configuración del cluster. Para más información, consulte la Sección 2.5.
Verifique que ha creado los dispositivos brutos para las particiones compartidas en cada miembro. Consulte la Sección 1.4.4.3 para más información.
Examine los mensajes de arranque del sistema usando dmesg |less, hasta el punto donde el sistema prueba el subsistema SCSI para determinar la configuración del bus. Verifique que todos los miembros identifican los mismos dispositivos de almacenamiento y le asignan el mismo nombre.
Verifique que un miembro no esté tratando de montar un sistema de archivos en la partición compartida. Por ejemplo, asegúrese de que el dispositivo actual (por ejemplo, /dev/sdb1) no esté incluido en un archivo /etc/fstab.
Después de realizar estas tareas, ejecute nuevamente la utilidad /usr/sbin/shutil con la opción -p.
Si se emplean interruptores conectados a la red o a puerto serial en la configuración del hardware del cluster, instale el software del cluster e invoque el comando clufence para probar los interruptores. Invoque el comando en cada miembro para asegurarse de que puede hacer ciclo de encendido con el otro miembro. Si la prueba es exitosa, entonces se puede arrancar el cluster.
El comando clufence puede probar correctamente un interruptor solamente si el software del cluster no se está ejecutando. Esto es debido a que para los switches conectados a serial, solo un programa a la vez puede accesar el puerto serial que conecta un interruptor a un miembro. Cuando se invoca el comando clufence, este verifica el estado del software del cluster. Si el software del cluster se está ejecutando, el comando se termina con un mensaje indicando que se debe detener el software del cluster.
Las opciones de línea de comando de clufence son como se muestra a continuación:
-d — Activa la depuración
-f — Apaga el miembro
-u — Enciende el miembro
-r — Reinicia (ciclo de encendido) un miembro
-s — Verifica el estado de todos los switches que controlan un miembro
Cuando se este probando los interruptores, el primer paso es verificar que cada miembro cluster puede comunicarse exitósamente con su interruptor. El siguiente ejemplo de la salida del comando clufence muestra que el cluster miembro es capaz de comunicarse con su interruptor:
[27734] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com [27734] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com |
En el evento de un error en la salida de clufence, verifique lo siguiente:
Para interruptores conectados a serial:
Verifique que el archivo especial del dispositivo para el switch con conexión remota de puerto serial (por ejemplo, /dev/ttyS0) está especificado correctamente en el archivo de configuración del cluster. En la Herramienta de configuración del cluster, muestre la ventana de diálogo Regulador de energía para verificar el valor del puerto serial. Si es necesario, use un paquete de emulación de terminal tal como minicom para evaluar si el miembro cluster puede accesar el puerto serial.
Asegúrese de que un programa no-cluster (por ejemplo, un programa getty) no esté usando el puerto serial para la conexión remota del interruptor. Puede usar el comando lsof para realizar esta tarea.
Verifique que la conexión del cable al interruptor remoto esté correcta. Verifique que el tipo de cable correcto esté siendo usado (por ejemplo, un interruptor RPS-10 requiere cables de módem nulo), y que todas las conexiones estén sujetadas con seguridad.
Verifique que cualquier interruptor físico dip o rotativo en el interruptor, estén configurado correctamente.
Para interruptores basados en red:
Verifique que las conexiones de red de los interruptores basados en red esten funcionando. La mayoría de los switches tienen un indicador de luz que indica conectividad.
Debería ser posible hacerle un ping al switch de red; si no, entonces el switch puede que no esté configurado de la forma adecuada para sus parámetros de red.
Verifique que se hayan especificado el nombre de inicio de sesión y contraseña correctos (dependiendo del tipo de interruptor) en el archivo de configuración del cluster (como se establece ejecutando Herramienta de configuración del cluster y observando las propiedades especificadas en la ventana de diálogo Regulador de energía). Una forma muy útil de diagnóstico es verificar el acceso Telnet al switch de la red usando los mismos parámetros especificados en la configuración del cluster.
Después de exitosamente verificar la comunicación con el switch, intente encender el otro miembro cluster. Antes de hacer esto, se recomienda verificar que el otro miembro cluster no está realizando activamente ninguna función importante (tal como proporcionando servicios cluster a clientes activos). Al ejecutar el comando clufence -f clumember2.example.com, se muestra la siguiente salida luego de un apagado y operación de cercado exitosa (lo que significa que el sistema no recibe energía desde el interruptor hasta que se quite el cerco del sistema):
[7397] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com [7397] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com [7397] notice: STONITH: clumember2.example.com has been fenced! |
Asegúrese que todos los miembros cluster estén ejecutando la misma versión de software Red Hat Cluster Manager.
Para mostrar la versión de la Herramienta de configuración del cluster y de la Herramienta de estado del cluster, use cualquiera de los siguientes métodos:
Seleccione Ayuda => Acerca de. La ventana de diálogo Acerca de incluye los números de versión.
Invoque los comandos siguientes:
rpm -q redhat-config-cluster rpm -q clumanager |
También se puede determinar la versión del paquete clumanager, llamando el comando clustat -v.