C.5. Comportamentos Comuns: Cluster de 2-4 Membros com Tie-Breaker Baseado no IP

Partição de Rede

Causas Comuns: Problema no comutador de rede.

Teste: Conecte metade dos membros ao comutador A. Conecte a outra metade ao comutador B. Conecte o comutador A ao comutador B usando um cabo up-link ou cruzado (crossover). Conecte o dispositivo agindo como o endereço IP do tie-breaker ao comutador A. Inicie os serviços do cluster. Desconecte o comutador A do comutador B.

Comportamento Esperado: Todas as partições do cluster compostas de exatamente metade (1/2 ou 2/4) dos membros enviam pacotes ping ao endereço IP do tie-breaker. Se receber uma resposta, a partição forma um quorum. No caso de teste, isto significa que a metade conectada ao comutador A formará um quorum. Como o Cluster Manager requer uma sub-rede totalmente conectada, o caso no qual uma divisão igualitária (ou divisão-cérebro) ocorre, quando ambas partições podem acessar o IP do tie-breaker, não é tratado.

Verificação: Rode clustat nos membros conectados ao comutador A. Deve haver um número da Encarnação do Quorum do Cluster listado no topo do output.

Perda de acesso à mídia compartilhada

Causas Comuns: Mídia compartilhada perde energia; cabo conectando um membro à mídia compartilhada é desconectado.

Teste: Desconecte o cabo SCSI ou Fibre Channel de um membro.

Comportamento Esperado: É tomada uma ação configurada para resolver a perda de acesso ao armazenamento compartilhado (reboot/halt/stop/ignore). A ação default é reboot (reinicializar).

Sistema pendente ou com problemas (panic) no membro do cluster

Teste: Encerre (kill) os daemons cluquorumd e clumembd.

killall -STOP cluquorumd clumembd

Comportamento Esperado: O membro do cluster é controlado por outro membro. Serviços são transferidos. Se houver um watchdog em uso, pode ser acionado.