C.6. Comportamentos Comuns: Cluster de 3-5 Membros

Partição de Rede

Causas Comuns: Problema no comutador de rede

Teste: Conecte a maioria dos membros ao comutador A. Conecte os membros restantes ao comutador B. Conecte o comutador A ao comutador B usando um cabo up-link ou cruzado (crossover). Inicie os serviços do cluster. Desconecte o comutador A do comutador B.

Comportamento Esperado: A partição com a maioria dos membros continua operando e forma-se uma nova visualização do quorum do cluster. Os membros na partição da minoria são controlados e os serviços que rodavam nesta partição são iniciados na partição da maioria, se possível. No caso do teste, isto significa que os membros conectados ao comutador A controlarão os membros conectados ao comutador B.

Verificação: Rode clustat em um dos membros conectados ao comutador A. Deve haver um número da Encarnação do Quorum do Cluster listado próximo ao topo do output.

Sistema pendente no membro do cluster

Teste: Encerre (kill) o daemon clumembd.

killall -STOP clumembd

Comportamento Esperado: Os membro do cluster é controlado por outro membro. Serviços são transferidos. Se o timer watchdog está configurado, pode ser acionado.

Perda de acesso à mídia compartilhada

Causas Comuns: Mídia compartilhada perde energia; o cabo conectando um membro à mídia compartilhada é desconectado.

Teste: Desconecte o cabo SCSI ou Fibre Channel de um membro.

Comportamento Esperado: É tomada uma ação configurada para resolver a perda de acesso ao armazenamento compartilhado (reboot/halt/stop/ignore). A ação default é reboot (reinicializar).