Red Hat Cluster Suite: Configuring and Managing a Cluster | ||
---|---|---|
Anterior | Apéndice D. Utilidades de Línea de comandos del Cluster | Siguiente |
Si se utilizan interruptores en la configuración del cluster, ejecute la utilidad clufence para asegurarse de que puede hacer ciclos de encendido remotamente a los otros miembros cluster.
Si el comando es exitoso, ejecute el comando shutil -p en ambos sistemas cluster para mostrar un resumen de la estructura de la cabecera de datos para las particiones quorum. Si la salida es diferente en los sistemas, las particiones quorum no apuntan a los mismos dispositivos en ambos sistemas. Verifique para asegurarse que los dispositivos crudos existen y están especificados correctamente en el archivo /etc/sysconfig/rawdevices. Para más información vea la Sección 1.4.4.3.
Si se emplean interruptores conectados a la red o serial en la configuración del cluster, instale el software del cluster e invoque el comando clufence para evaluar los interruptores. Invoque el comando en cada sistema cluster para asegurarse de que pueden hacer ciclos de encendido remotamente a los otros miembros. Si la prueba es exitosa, entonces puede iniciar el cluster.
El comando clufence puede evaluar efectivamente un interruptor. El formato para el comando clufence es como se muestra a continuación:
usage: clufence [-d] [-[furs] <member>] -d Turn on debugging -f <member> Fence (power off) <member> -u <member> Unfence (power on) <member> -r <member> Reboot (power cycle) <member> -s <member> Check status of all switches controlling <member> |
Cuando pruebe interruptores, el primer paso es asegurarse de que cada miembro cluster puede comunicarse con su interruptor. El ejemplo siguiente de la salida del comando clufence muestra que el miembro cluster es capaz de comunicarse con su interruptor:
[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2 [23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5 |
Cualquier error en la salida puede ser un indicativo de los siguientes tipos de problemas:
Para interruptores conectados a serial:
Verifique que el archivo especial de dispositivo para el puerto serial de la conexión remota del interruptor (por ejemplo, /dev/ttyS0) está especificado correctamente en la base de datos del cluster, como se estableción a través de la Herramienta de configuración del cluster. Si es necesario, utilice un paquete de emulación de terminal tal como minicom para evaluar si el sistema cluster puede acceder al puerto serial.
Asegúrese de que no hay un programa no cluster (tal como un programa getty) no esté usando el puerto serial para la conexión del interruptor remoto. Puede utilizar el comando lsof para llevar a cabo esta tarea.
Verifique que la conexión de cable para el interruptor remoto sea correcta. Verifique que se utilice el tipo correcto de cable (por ejemplo, un interruptor RPS-10 necesita cables de módem nulos) y que todas las conexiones estén bien ajustadas.
Verifique que cualquier switche físico de inmersión o rotatorio en el interruptor esté colocado correctamente.
Para los interruptores basados en red:
Verifique que la conexión de red al interruptor basado en la red, esté operacional. La mayoría de los interruptores tienen una luz de enlace que indica conectividad.
Debería ser posible hacer ping al interruptor de red; si no, entonces el interruptor puede estar mal configurado para sus parámetros de red.
Verifique que se han especificado el nombre de usuario y contraseña correctos (dependiendo del tipo de switch) en la base de datos de configuración del cluster (como se estableció al ejecutar la Herramienta de configuración del cluster). Un enfoque de diagnóstico muy útil es verificar el acceso Telnet al switche de red usando los mismos parámetros especificados en la configuración del cluster.
Después de verificar exitosamente la comunicación con el switch, intente hacer un ciclo de encendido con el otro miembro cluster. Antes de hacer esto, se recomienda verificar que el otro miembro cluster no está realizando ninguna actividad importante (tal como sirviendo servicios cluster a los clientes activos), ejecutando el comando siguiente:
clufence -r clu3 |
Lo siguiente representa una operación de ciclo de encendido exitosa:
Successfully power cycled host clu3. |