D.4. Usando o Utilitário clufence

Se a configuração do hardware do cluster contém comutadores de energia, rode o utilitário clufence em cada membro do cluster para garantir que possam assumir os serviços de outros membros remotamente.

Se o comando der certo, rode o comando shutil -p nos dois sistemas do cluster para exibir um sumário da estrutura de dados do cabeçalho das partições quorum. Se o output é diferente nos sistemas, as partições quorum não apontam para os mesmos dispositivos em ambos sistemas. Verifique esta questão e garanta que os dipositivos raw existam e estejam corretamente especificados no arquivo /etc/sysconfig/rawdevices. Veja a Seção 1.4.4.3 para mais informações.

Se a configuração do hardware do cluster inclui comutadores de energia de rede ou seriais anexos, instale o software do cluster e invoque o comando clufence para testar os comutadores de energia. Invoque o comando em cada sistema do cluster para garantir que possam assumir os serviços dos outros membros remotamente. Se o teste for bem-sucedido, então o cluster pode ser iniciado.

O comando clufence pode testar um comutador de energia com acuracidade. O formato do comando clufence é o seguinte:

usage: clufence [-d] [-[furs] <member>]
  -d              Turn on debugging
  -f <member>     Fence (power off) <member>
  -u <member>     Unfence (power on) <member>
  -r <member>     Reboot (power cycle) <member>
  -s <member>     Check status of all switches controlling <member>

Ao testar comutadores de energia, o primeiro passo é garantir que cada membro do cluster possa comunicar-se adequadamente com seu comutador de energia. O exemplo a seguir do output do comando clufence mostra que o membro do cluster é capaz de se comunicar com seu comutador de energia:

[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2
[23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5

Os erros no output podem indicar algum dos seguintes tipos de problemas:

Após verificar a comunicação com o comutador, tente passar os serviços (power cycle) para o outro membro. Antes de fazer isso, é recomendado verificar se o outro membro não está executando nenhuma atividade importante (tal como oferecer serviços do cluster para clientes ativos), executando o seguinte comando:

clufence -r clu3

O seguinte descreve uma operação 'power cycle' bem-sucedida:

Successfully power cycled host clu3.