Red Hat Cluster Suite: Configurando e Administrando um Cluster | ||
---|---|---|
Anterior | Capítulo 2. Configuração do Cluster | Próxima |
Para assegurar que o software do cluster foi configurado corretamente, use as seguintes ferramentas localizadas no diretório /usr/sbin:
Teste as partições compartilhadas e assegure que estejam acessíveis.
Invoque o utilitário /usr/sbin/shutil com a opção -v para testar a acessibilidade das partições compartilhadas. Veja a Seção 2.11.1 para mais informações.
Teste a operação dos comutadores de energia.
Se os comutadores de energia são usados na configuração do hardware do cluster, execute o comando clufence em cada membro para garantir que estes podem assumir os serviços de outro membro. Não execute este comando enquanto o software do cluster estiver rodando. Veja a Seção 2.11.2 para mais informações.
Assegure que todos os membros estejam rodando a mesma versão do software.
Invoque o comando rpm -q clumanager e rpm -q redhat-config-cluster em cada membro para exibir a revisão dos RPMs do software do cluster instalado.
A seção a seguir explica os utilitários do cluster em maiores detalhes.
As partições compartilhadas devem referir ao mesmo dispositivo físico em todos os membros. Invoque o utilitário /usr/sbin/shutil com o comando -v para testar as partições compartilhadas e verificar se estão acessíveis.
Se o comando for bem-sucedido, execute o comando /usr/sbin/shutil -p /cluster/header em todos os membros para exibir um resumo da estrutura de dados do cabeçalho das partições compartilhadas. Se o output é diferente nos membros, as partições compartilhadas não apontam para os mesmos dispositivos em todos os membros. Certifique-se de que os dispositivos raw existam e estejam especificados corretamente no arquivo /etc/sysconfig/rawdevices. Veja a Seção 1.4.4.3 para mais informações.
O exemplo a seguir mostra que as partições compartilhadas referem ao mesmo dispositivo físico nos membros do cluster clu1.example.com e clu2.example.com através do comando /usr/sbin/shutil -p /cluster/header:
/cluster/header is 140 bytes long SharedStateHeader { ss_magic = 0x39119fcd ss_timestamp = 0x000000003ecbc215 (14:14:45 May 21 2003) ss_updateHost = clu1.example.com |
Todos os campos do output do comando /usr/sbin/shutil -p /cluster/header devem ser o mesmo quando executados em todos os membros do cluster. Se o output não é o mesmo em todos os membros, execute o seguinte:
Examine o arquivo /etc/sysconfig/rawdevices em cada membro e assegure que os dispositivos raw e de bloco para as partições compartilhada backup e primária foram especificadas corretamente. Se não forem os mesmos, edite o arquivo e corrija quaisquer erros. Então rode novamente a Ferramenta de Configuração do Cluster. Veja a Seção 2.5 para mais informações.
Assegure de ter criado os dispositivos raw para as partições compartilhadas em cada membro. Veja a Seção 1.4.4.3 para mais informações.
Para determinar a configuração do canal (bus) em cada membro, examine as mensagens de início (startup), rodando o dmesg |less no ponto onde o sistema detecta o sub-sistema SCSI. Verifique se todos os membros identificam os mesmos dispositivos de armazenamento compartilhado e se atribuem os mesmos nomes a eles.
Verifique se um membro não tenta montar um sistema de arquivo na partição compartilhada. Por exemplo: certifique-se de que o dispositivo corrente (ex.: /dev/sdb1) não está incluso em um arquivo /etc/fstab.
Após executar estas tarefas, re-execute o utilitário /usr/sbin/shutil com a opção -p.
Se comutadores anexos à rede ou seriais são empregados na configuração do hardware do cluster, instale o software do cluster e invoque o comando clufence para testar os comutadores de energia. Invoque este comando em cada membro para garantir que possam assumir os serviços de outro membro remotamente. Se o teste for bem-sucedido, o cluster pode ser inicializado.
O comando clufence pode testar um comutador de energia com acuracidade somente se o software do cluster não estiver rodando. Isto deve-se ao fato de que para comutadores seriais, somente um programa por vez pode acessar a porta serial que conecta o comutador de energia ao membro. Quando o comando clufence é submetido, verifica o estado do software do cluster. Se o software está rodando, o comando é terminado com uma mensagem pará-lo.
As opções do comando clufence são as seguintes:
-d — Ativa a depuração
-f — Desliga ('fence') o membro
-u — Liga ('unfence') o membro
-r — Reinicializa (power cycle) o membro
-s — Verifica o estado de todos os comutadores controlando o membro
Ao testar comutadores de energia, o primeiro passo é garantir que cada membro do cluster pode comunicar-se com seu comutador anexo. O output do comando clufence a seguir mostra que o membro do cluster pode comunicar-se com seu comutador de energia:
[27734] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com [27734] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com |
No caso de um erro no output do clufence, verifique o seguinte:
Para comutadores de energia seriais:
Verifique se o arquivo especial do dispositivo para a porta serial da conexão do comutador de energia remoto (ex.: /dev/ttyS0) está especificado corretamente no arquivo de configuração do cluster. Na Ferramenta de Configuração do Cluster, exiba a caixa de diálogo Controlador de Energia para checar o valor da porta serial. Se for necessário, use um pacote de emulação do terminal, como o minicom para testar se o membro do cluster pode acessar a porta serial.
Garanta que nenhum programa fora do cluster (ex.: um programa getty) está usando a porta serial para a conexão do comutador de energia remoto. Você pode usar o comando lsof para executar esta tarefa.
Verifique se o cabo da conexão ao comutador de energia remoto está correto. Certifique-se de que o tipo correto de cabo seja usado (ex.: um comutador de energia RPS-10 requer um cabo de modem null), e que todas as conexões estejam bem presas.
Certifique-se de que todos os comutadores dip físicos ou comutadores rotary estejam configurados apropriadamente no comutador de energia.
Para comutadores de energia baseados na rede:
Verifique se a conexão de rede aos comutadores baseados na rede está operacional. A maioria dos comutadores tem uma luzinha que indica a conectividade.
Deve ser possível fazer um ping no comutador da rede. Se não for, talvez o comutador não esteja configurado corretamente em seus parâmetros de rede.
Certifique-se de que o nome de autenticação (login) e senha (dependendo do tipo de comutador) estejam especificados no arquivo de configuração do cluster (conforme estabelecido na execução da Ferramenta de Configuração do Cluster e na visualização das propriedades especificadas na caixa de diálogo Controlador de Energia). Uma forma útil de diagnóstico é verificar o acesso do Telnet ao comutador de energia usando os mesmos parâmetros especificados na configuração do cluster.
Após verificar a comunicação com o comutador, tente fazer com que um membro assuma os serviços de outro. Antes de fazer isto, nós recomendamos verificar se o outro membro não está executando nenhum processo importante (como servindo clientes ativos). Executar o comando clufence -f clumember2.example.com exibe o seguinte output frente um desligamento apropriado e a operação controlar (significa que o sistema não recebe energia pelo comutador até que seja des-controlado):
[7397] info: STONITH: rps10 at /dev/ttyS0, port 0 controls clumember1.example.com [7397] info: STONITH: rps10 at /dev/ttyS0, port 1 controls clumember2.example.com [7397] notice: STONITH: clumember2.example.com has been fenced! |
Assegure que todos os membros cluster estejam rodando a mesma versão do software Red Hat Cluster Manager.
Para exibir a versão da Ferramenta de Configuração do Cluster e da the Ferramenta de Estado do Cluster, use um dos métodos a seguir:
Selecione Ajuda => Sobre. A caixa de diálogo Sobre exibe os números das versões.
Invoque os seguintes comandos:
rpm -q redhat-config-cluster rpm -q clumanager |
A versão do pacote clumanager também pode ser determinada invocando o comando clustat -v.