D.4. Uso della utility clufence

Se si usano degli interruttori in una configurazione hardware del cluster, eseguire la utility clufence su ogni sistema del cluster, in modo da assicurare che possa baipassare in modo remoto gli altri membri del cluster.

Se il comando ha successo, eseguire il comando shutil -p su entrambi i sistemi del cluster, in modo da visualizzare un sommario della struttura dei dati di testo per le partizioni del quorum. Se l'output è diverso sui sistemi, le partizioni del quorum non indicano gli stessi dispositivi su entrambi i sistemi. Controllate in modo da assicurarvi dell'esistenza dei dispositivi raw e che siano specificati correttamente nel file /etc/sysconfig/rawdevices. Controllare la Sezione 1.4.4.3 per maggiori informazioni.

Se gli interruttori collegati in modo seriale o quelli di rete, sono in uso nella configurazione del cluster, installate il software del cluster e invocate il comando clufence, in modo da eseguire un test degli interruttori. Invocare il comando su ogni sistema del cluster per assicurare che sia in grado di baipassare, in modo remoto, gli altri membri del cluster. Se il test ha avuto successo, è possibile avviare il cluster.

Il comando clufence può eseguire un test accurato per l'interruttore. Il formato del comando clufence è il seguente:

usage: clufence [-d] [-[furs] <member>]
  -d              Turn on debugging
  -f <member>     Fence (power off) <member>
  -u <member>     Unfence (power on) <member>
  -r <member>     Reboot (power cycle) <member>
  -s <member>     Check status of all switches controlling <member>

Quando si esegue un test degli interruttori, la prima fase è quella di assicurare che ogni membro del cluster possa comunicare con successo con il proprio interruttore. Il seguente esempio di output del comando clufence, mostra come il membro del cluster sia in grado di comunicare con il proprio interruttore.

[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2
[23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5

Qualsiasi errore nell'output, potrebbe essere indicativo delle seguenti problematiche:

Dopo aver verificato con successo la comunicazione con l'interruttore, cercare di baipassare l'altro membro del cluster. Prima di fare ciò, è consigliabile verificare che l'altro membro del cluster non stia eseguendo funzioni importanti (come ad esempio fornire i servizi del cluster a client attivi). Eseguite il seguente comando:

clufence -r clu3

Il seguente rappresenta una operazione di power cycle con esito positivo:

Successfully power cycled host clu3.