Introdução

O Red Hat Cluster Manager é uma coletânea de tecnologias que, juntas, oferecem a integridade de dados e a habilidade de manter a disponibilidade das aplicações no caso de uma falha. Usando hardware redundante, armazenamento de disco compartilhado, administração de energia e mecanismos robustos de comunicação do cluster e de transferência de aplicações, um cluster atende às necessidades do mercado corporativo.

Especialmente criado para aplicações de banco de dados, servidores de arquivo de rede e servidores web com conteúdo dinâmico, um cluster também pode ser usado em conjunto com a Piranha para o software de balanceamento de carga, que é baseado no projeto do Servidor Virtual do Linux (Linux Virtual Server, LVS). Usando o Red Hat Enterprise Linux com a Piranha, você pode empregar um site de comércio eletrônico altamente disponível que tenha integridade dos dados e disponibilidade de aplicações completa, além das capacidades de balanceamento de carga. Consulte o Capítulo 9 ao Capítulo 12 para mais informações.

Este guia assume que o usuário tem um conhecimento de trabalho avançado do Red Hat Enterprise Linux e entende os conceitos de computação em servidores. Para mais informações sobre o uso do Red Hat Enterprise Linux, consulte os seguintes recursos:

As versões HTML, PDF e RPM dos manuais estão disponíveis no CD de Documentação do Red Hat Enterprise Linux e online: http://www.redhat.com/docs/.

NotaNota
 

Apesar deste manual refletir as informações mais recentes possíveis, leia as Notas da Versão do Red Hat Enterprise Linux para acessar as informações que não estavam disponíveis antes da finalização de nossa documentação. Elas podem ser encontradas no CD 1 do Red Hat Enterprise Linux e online: http://www.redhat.com/docs/.

1. Visão Geral do Cluster

Para configurar um cluster, você deve conectar os sistemas membro (geralmente referenciados simplesmente como membros) ao hardware do cluster, e configurar os membros no ambiente do cluster. A base de um cluster é um algoritmo de associação de máquina avançada. Este algoritmo garante que o cluster mantenha sempre a integridade completa dos dados usando os seguintes métodos de comunicação entre os membros:

Para tornar uma aplicação e dados altamente disponíveis num cluster, você deve configurar um serviço (como uma aplicação e o armazenamento de disco compartilhado) como um grupo discreto e nomeado de propriedades e recursos, para os quais possa atribuir um endereço IP a fim de oferecer acesso transparente aos clientes. Por exemplo: você pode criar um serviço que oferece acesso a uma aplicação de banco de dados altamente disponível para clientes.

Você pode associar um serviço a um domínio de transferência (failover domain), um sub-conjunto de membros do cluster que são capazes de rodar o serviço. Em geral, qualquer membro pode rodar o serviço e acessar os dados do serviço no armazenamento de disco compartilhado. Entretanto, cada serviço pode rodar somente em um membro do cluster por vez, a fim de manter a integridade dos dados. Você pode especificar se os membros de um domínio de queda são ordenados por preferência. Também pode especificar se um serviço é restrito a rodar somente nos membros associados ao seu domínio de transferência. (Quando associado a um domínio de transferência irrestrito, o serviço pode ser iniciado em qualquer membro do cluster, caso não haja nenhum membro disponível no domínio de transferência.)

Você pode criar uma configuração ativa-ativa na qual os membros rodam serviços diferentes, ou uma configuração hot-standby na qual um membro primário roda todos os serviços, e um sistema do cluster backup assume somente se o sistema primário falhar.

A Figura 1 mostra um exemplo de um cluster em uma configuração ativa-ativa.

Figura 1. Exemplo de Um Cluster em Configuração Ativa-ativa

Se ocorrer uma falha no hardware ou no software, o cluster reinicia automaticamente os serviços do membro falho no membro funcional. Esta capacidade de queda e transferência do serviço (failover) garante que nenhum dado seja perdido e que haja interrupção mínima para os usuários. Quando o membro falho se recupera, o cluster pode re-balancear os serviços entre os membros.

Além disso, você pode parar os serviços de maneira limpa, rodando-os em um sistema do cluster e então reiniciando-os em outro sistema. Esta capacidade de realocação de serviços permite manter a disponibilidade da aplicação e dados quando um membro do cluster requerer manutenção.