Red Hat Cluster Suite: Configurando e Administrando um Cluster | ||
---|---|---|
Anterior | Apêndice D. Utilitários de Linha de Comando do Cluster | Próxima |
Se a configuração do hardware do cluster contém comutadores de energia, rode o utilitário clufence em cada membro do cluster para garantir que possam assumir os serviços de outros membros remotamente.
Se o comando der certo, rode o comando shutil -p nos dois sistemas do cluster para exibir um sumário da estrutura de dados do cabeçalho das partições quorum. Se o output é diferente nos sistemas, as partições quorum não apontam para os mesmos dispositivos em ambos sistemas. Verifique esta questão e garanta que os dipositivos raw existam e estejam corretamente especificados no arquivo /etc/sysconfig/rawdevices. Veja a Seção 1.4.4.3 para mais informações.
Se a configuração do hardware do cluster inclui comutadores de energia de rede ou seriais anexos, instale o software do cluster e invoque o comando clufence para testar os comutadores de energia. Invoque o comando em cada sistema do cluster para garantir que possam assumir os serviços dos outros membros remotamente. Se o teste for bem-sucedido, então o cluster pode ser iniciado.
O comando clufence pode testar um comutador de energia com acuracidade. O formato do comando clufence é o seguinte:
usage: clufence [-d] [-[furs] <member>] -d Turn on debugging -f <member> Fence (power off) <member> -u <member> Unfence (power on) <member> -r <member> Reboot (power cycle) <member> -s <member> Check status of all switches controlling <member> |
Ao testar comutadores de energia, o primeiro passo é garantir que cada membro do cluster possa comunicar-se adequadamente com seu comutador de energia. O exemplo a seguir do output do comando clufence mostra que o membro do cluster é capaz de se comunicar com seu comutador de energia:
[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2 [23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4 [23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5 |
Os erros no output podem indicar algum dos seguintes tipos de problemas:
Para comutadores de energia seriais anexos:
Verifique se o arquivo especial do dispositivo da porta serial da conexão do comutador de energia remoto (ex.: /dev/ttyS0) está especificado corretamente no banco de dados do cluster, conforme estabelecido pela Ferramenta de Configuração do Cluster. Se for necessário, use um pacote de emulação do terminal, tal como o minicom, para testar se o sistema do cluster pode acessar a porta serial.
Assegure que um programa fora do cluster (ex.: um programa getty) não esteja usando a porta serial da conexão do comutador de energia remoto. Você pode usar o comando lsof para executar esta tarefa.
Verifique se a conexão do cabo do comutador de energia remoto está correta. Verifique o tipo de cabo usado (ex.: um comutador de energia RPS-10 requer um cabo de modem null) e de que todas as conexões estejam plugadas com segurança.
Verifique se todos os interruptores físicos dip ou interruptores rotatórios do comutador de energia estão ajustados apropriadamente.
Para comutadores de energia baseados na rede:
Verifique se a conexão de rede dos comutadores baseados na rede está operacional. A maioria dos comutadores tem uma luzinha que indica a conectividade.
Deve ser possível fazer ping no comutador de rede; se não for, talvez o comutador não esteja configurado apropriadamente em seus parâmetros de rede.
Verifique se a senha e nome de autenticação (login name), dependendo do tipo de comutador, foram especificados no banco de dados de configuração do cluster (conforme são estabelecidas pelo uso da Ferramenta de Configuração do Cluster). Um método de diagnóstico útil é verificar o acesso do Telnet ao comutador de rede, usando os mesmos parâmetros especificados na configuração do cluster.
Após verificar a comunicação com o comutador, tente passar os serviços (power cycle) para o outro membro. Antes de fazer isso, é recomendado verificar se o outro membro não está executando nenhuma atividade importante (tal como oferecer serviços do cluster para clientes ativos), executando o seguinte comando:
clufence -r clu3 |
O seguinte descreve uma operação 'power cycle' bem-sucedida:
Successfully power cycled host clu3. |