Red Hat Cluster Suite: Configurazione e gestione di un cluster | ||
---|---|---|
Indietro | Appendice D. Utility della linea di comando del cluster | Avanti |
Se si usano degli interruttori in una configurazione hardware del cluster, eseguire la utility clufence su ogni sistema del cluster, in modo da assicurare che possa baipassare in modo remoto gli altri membri del cluster.
Se il comando ha successo, eseguire il comando shutil -p su entrambi i sistemi del cluster, in modo da visualizzare un sommario della struttura dei dati di testo per le partizioni del quorum. Se l'output è diverso sui sistemi, le partizioni del quorum non indicano gli stessi dispositivi su entrambi i sistemi. Controllate in modo da assicurarvi dell'esistenza dei dispositivi raw e che siano specificati correttamente nel file /etc/sysconfig/rawdevices. Controllare la Sezione 1.4.4.3 per maggiori informazioni.
Se gli interruttori collegati in modo seriale o quelli di rete, sono in uso nella configurazione del cluster, installate il software del cluster e invocate il comando clufence, in modo da eseguire un test degli interruttori. Invocare il comando su ogni sistema del cluster per assicurare che sia in grado di baipassare, in modo remoto, gli altri membri del cluster. Se il test ha avuto successo, è possibile avviare il cluster.
Il comando clufence può eseguire un test accurato per l'interruttore. Il formato del comando clufence è il seguente:
usage: clufence [-d] [-[furs] <member>] -d Turn on debugging -f <member> Fence (power off) <member> -u <member> Unfence (power on) <member> -r <member> Reboot (power cycle) <member> -s <member> Check status of all switches controlling <member> |
Quando si esegue un test degli interruttori, la prima fase è quella di assicurare che ogni membro del cluster possa comunicare con successo con il proprio interruttore. Il seguente esempio di output del comando clufence, mostra come il membro del cluster sia in grado di comunicare con il proprio interruttore.
[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2 [23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5 |
Qualsiasi errore nell'output, potrebbe essere indicativo delle seguenti problematiche:
Per interruttori collegati in modo seriale:
Verificare che il file speciale del dispositivo per la porta seriale di collegamento dell'interruttore remoto (per esempio, /dev/ttyS0), sia specificata correttamente nel database del cluster, come stabilito tramite Tool di configurazione del Cluster. Se necessario, usare un pacchetto di emulazione del terminale, come ad esempio minicom, per eseguire un test se il sistema del cluster è in grado di accedere alla porta seriale.
Assicurarsi che un programma non-cluster (per esempio, un programma getty), non stia usando la porta seriale per il collegamento dell'interruttore remoto. Potete usare il comando lsof, per eseguire il segunte compito.
Controllate che il collegamento del cavo per l'interruttore remoto sia corretto. Verificare che venga usato il tipo di cavo corretto (per esempio un interruttore RPS-10, richiede un cavo di tipo null modem), e che tutti i collegamenti siano ben fissati.
Verificare che qualsiasi DIP switch fisico o interruttore rotante sull'interruttore di alimentazione, sia impostato in modo corretto.
Per interruttori basati sulla rete:
Verificare che il collegamento di rete per gli interruttori basati sulla rete sia operativo. La maggior parte degli interruttori hanno un indicatore che indica lo stato della connessione.
Dovrebbe essere possibile eseguire un ping nei confronti dell'interruttore di rete, in caso contrario, l'interruttore potrebbe non essere stato configurato propriamente per i suoi parametri di rete.
Verificare di aver specificato la corretta password e login name (a seconda del tipo di interruttore), nel database di configurazione del cluster (come stabilito con l'esecuzione di Tool di configurazione del Cluster). Un approccio diagnostico utile è quello di verificare l'accesso Telnet all'interruttore di rete, usando gli stessi parametri come specificato nella configurazione del cluster.
Dopo aver verificato con successo la comunicazione con l'interruttore, cercare di baipassare l'altro membro del cluster. Prima di fare ciò, è consigliabile verificare che l'altro membro del cluster non stia eseguendo funzioni importanti (come ad esempio fornire i servizi del cluster a client attivi). Eseguite il seguente comando:
clufence -r clu3 |
Il seguente rappresenta una operazione di power cycle con esito positivo:
Successfully power cycled host clu3. |