Le informazioni riportate in questi paragrafi aiutano l'utente nella gestione della configurazione del software del cluster.
Un cluster usa diversi meccanismi di comunicazione di tipo intra-cluster per assicurare l'integritá dei dati ed il corretto comportamento del cluster quando si presenta un errore. Il cluster usa i suddetti meccanismi per:
Controllare quando un sistema é idoneo a diventare membro del cluster
Determinare la condizione dei sistemi del cluster
Controlare il comportamento del cluster quando si verifica un errore
Ecco riportati i meccanismi di comunicazione del cluster:
Partizioni (quorum) condivise
Periodicamente, ogni sistema del cluster scrive un timestamp e la condizione del sistema sulle partizioni condivise primarie e shadow, le quali sono delle partizioni di tipo raw situate su di una memoria condivisa. Ogni membro del cluster legge la condizione del sistema ed il timestamp che sono stati scritti dagli altri membri, e ne determina il loro aggiornamento. I membri cercano di leggere le informazioni dalla partizione primaria del quorum. Se la partizione é corrotta, i membri sono in grado di leggere le informazioni dalla partizione shadow condivisae simultaneamente effettueranno una riparazione della partizione primaria. La consistenza dei dati viene mantenuta attraverso delle somme di verifica, e qualsiasi inconsistenza tra le partizioni sará automaticamente corretta.
Se un sistema del cluster esegue un riavvio ma non puó scrivere su entrambi le partizioni condivise, il sistema non sará ammesso a far parte del cluster. Per di piú, se un sistema esistente del cluster non é piú in grado di scrivere in entrambe le partizioni, egli stesso si rimuoverá dal cluster terminando le sue funzioni.
Le partizioni condivise vengono usate solo come un meccanismo di comunicazione nei cluster a due membri, con l'interruttore di rete disabilitato.
Controllo remoto dell'interruttore
Periodicamente, ogni membro controlla la condizione del collegamento remoto dell'interruttore, se presente. Il membro usa queste informazioni per aiutare a determinare la condizione dell'altro sistema del cluster. Se il meccanismo di comunicazione dell'interruttore presenta un errore,tale stato non causerà automaticamente in un failover.
Heartbeat ethernet
I membri sono collegati insieme usando delle linee seriali e linee Ethernet point-to-point. Periodicamente, ogni membro del cluster emette degli heartbeat (ping), attraverso queste linee. Il cluster usa queste informazioni per aiutare a determinare la condizione dei membri e per assicurare il funzionamento corretto del cluster. Se il meccanismo di comunicazione heartbeat presenta un errore, ció non ne risulterebbe automaticamente in un failover.
Se un membro determina che il timestamp di un altro membronon é aggiornato, esso controllerá la condizione dell'heartbeat. Se gli heartbeat sul membro sono ancora funzionanti, il software del cluster non intraprenderá alcuna azione. Se un membro non aggiorna il proprio timestamp dopo un certo periodo di tempo, e se non risponde al comando heartbeat ping, esso verrá considerato non funzionante.
Notare che il cluster rimarrá funzionante fino a quando un sistema del cluster é in grado di scrivere sulle partizioni condivise, anche se tutti i meccanismi di comunicazione presentano degli errori.
Da notare che la partizione condivisa viene usata solo come back up in alcune configurazioni a due membri. L'algoritmo della membership di rete rappresenta il fattore primario nel determinare i membri attivi da quelli passivi. Un membro che non aggiorna il proprio time-stamp in questa configurazione, non causa mai un failover fino a quando clumembd riporta che il membro non è attivo.