C.4. Comportamentos Comuns: Cluster de Dois Membros com Tie-breaker Baseado no Disco

Perda da conectividade de rede para outro membro; mídia compartilhada ainda accessível

Causas Comuns: perda da conectividade de rede.

Teste: Desconecte todos os cabos de rede de um membro.

Comportamento Esperado: Sem processo de queda e transferência (failover) a não ser que as atualizações também sejam perdidas. Os serviços não poderão ser alocados na maioria das vezes, pois o servidor de bloqueio requer conectividade de rede.

Verificação: Rode clustat para verificar se os serviços ainda estão marcados como ativos (running) no membro, mesmo que este esteja inativo de acordo com a associação. As mensagens são registradas afirmando que o membro está agora no estado PANIC.

Perda de acesso à mídia compartilhada

Causas Comuns: Mídia compartilhada perde energia; o cabo conectando um membro à mídia compartilhada é desconectado.

Teste: Desconecte o cabo SCSI ou Fibre Channel de um membro.

Comportamento Esperado: A queda e transferência (failover) não ocorre a não ser que a rede também seja perdida. É tomada uma ação configurada para resolver a perda de acesso à mídia compartilhada (reboot/halt/stop/ignore). A ação default é reboot (reinicializar). A ação pode causar uma queda subsequente.

Sistema pendente ou com problemas (panic) no membro X

Teste: Encerre (kill) os daemons cluquorumd e clumembd.

killall -STOP cluquorumd clumembd

Comportamento Esperado: O membro pendente do cluster é controlado por outro membro. Serviços são transferidos. Timers watchdog configurados podem ser acionados.

Início dos Serviços do Cluster sem conectividade de rede

Causas Comuns: Má comutação; um ou ambos membros estão sem conectividade de rede.

Teste: Pare os serviços do cluster em todos os membros. Desconecte todos os cabos de rede de um membro. Inicie os serviços do cluster em ambos os membros.

Verificação: Nem todos os serviços devem iniciar, já que os bloqueios requerem conectividade. Como o Cluster Manager requer uma sub-rede totalmente conectada, este caso é tratado com muito empenho, mas é um cluster tecnicamente inoperante.