Parmi les caractéristiques du cluster, on compte les points suivants :
Configuration du matériel à haute tolérance de panne
Les clusters peuvent inclure une matrice RAID contrôleur-double (dual-controller), une multiplicité de canaux de communication réseau et des systèmes redondants avec une alimentation électrique ininterrompue (UPS) afin d'assurer qu'aucune panne n'entraînera une période d'indisponibilité des applications ou une perte de données.
Sinon, un cluster meilleur marché peut être établi pour offrir une solution avec une disponibilité plus faible qu'un cluster à haute tolérance de panne. Par exemple, vous pouvez établir un cluster avec une matrice RAID contrôleur-simple (single-controller) et seulement un canal Ethernet.
![]() | Remarque |
---|---|
Certaines alternatives bon marché, comme le logiciel RAID et le parallèle SCSI initiateur-multiple (multi-initiator), ne sont pas compatibles ou appropriées pour l'utilisation sur le stockage partagé du cluster. Pour de plus amples informations, consultez la Section 1.1. |
Cadre de la configuration du service
Les clusters vous permettent de configurer facilement les services individuels pour donner une haute disponibilité aux données et aux applications. Pour créer un service, vous spécifiez les ressources utilisées dans le service et les propriétés du service, y compris le nom du service, le script de démarrage, d'arrêt et de statut de l'application, les partitions du disque dur, les points de montage et les membres du cluster sur lesquels vous préférez lancer le service. Après l'ajout d'un service, le logiciel de gestion du cluster stocke les informations dans le fichier de configuration du cluster sur le stockage partagé auquel les deux membres du cluster ont accès.
Le cluster offre un cadre facile à utiliser pour les applications de base de données. Par exemple, un service de base de données sert des données haute disponibilité à une application de base de données. L'application lancée sur un membre du cluster fournit l'accès réseau aux bases de données des systèmes clients comme les serveurs Web. Dans le cas d'une procédure de failover du service en faveur d'un autre membre, l'application est toujours en mesure d'accéder aux données partagées de la base de données. Un service de base de données accessible par le réseau se voit généralement attribuer une adresse IP, qui, comme le service en cas de failover, est transférée afin de maintenir un accès transparent pour les clients.
Le cadre du service du cluster peut aussi être facilement étendu aux autres applications.
Domaines de failover
En assignant un service au domaine de failover restreint, vous pouvez limiter les membres qui peuvent lancer un service dans le cas d'un failover. (Un service qui est assigné à un domaine de failover restreint ne peut pas être lancé sur un membre du cluster qui n'est pas inclus dans ce domaine.) Vous pouvez ordonner les membres d'un domaine de failover par préférence pour vous assurer que ce membre donné lancera bien le service (tant qu'il est actif). Si un service est assigné à un domaine de failover sans limites, le service sera lancé sur tout membre du cluster disponible (si aucun des membres du domaine de failover n'est disponible).
Garantie de l'intégrité des données.
Pour assurer l'intégrité des données, seul un membre peut faire tourner un service et accéder aux données du service à un moment donné. L'utilisation d'interrupteurs dans la configuration matérielle du cluster permet à chaque membre de prendre en relais un autre membre avant de redémarrer ses services lors de la procédure de failover. Ceci permet d'éviter que deux membres n'accèdent aux mêmes données et ne les corrompent. Bien que cette configuration ne soit pas nécessaire, il est recommandé d'utiliser des interrupteurs pour garantir l'intégrité des données dans tous les cas de panne. Les horloges chien-de-garde sont un moyen de surveillance de l'alimentation permettant d'assurer le bon déroulement de la procédure de failover du service.
Interface utilisateur pour l'administration du cluster
L'interface d'administration du cluster facilite la gestion des tâches telles que : la création, le démarrage et l'arrêt de services ; le relogement de services d'un membre à l'autre ; la modification de la configuration du cluster (pour ajouter ou supprimer des services ou des ressources) ; et le contrôle des membres et des services du cluster.
Liaison de canaux Ethernet
Afin de contrôler la santé des autres membres, chaque membre contrôle la santé de l'interrupteur distant, si il existe, et émet des pings de pulsation sur les canaux du réseau. Grâce à la liaison de canaux Ethernet, plusieurs interfaces Ethernet sont configurées de façon à agir comme une seule, réduisant ainsi le risque de point unique de panne dans une connexion Ethernet typique entre des systèmes.
Stockage partagé pour les informations de Quorum
Les informations d'état partagé définissent si le membre est actif. Les informations d'état de service spécifient si le service est en cours d'exécution et si le membre exécute le service. Chaque membre vérifie que le statut des autres membres est bien mis à jour.
Dans un cluster à deux membres, chaque membre écrit périodiquement une estampille et des informations sur l'état du cluster sur deux partitions du cluster partagé situées sur le stockage disque partagé. Afin d'assurer le bon fonctionnement du cluster, un membre ne sera pas autorisé à joindre le cluster, s'il ne peut pas communiquer avec les deux partitions primaire et secondaire du cluster partagé au moment du démarrage. De plus, si un membre ne met pas à jour son estampille et si les pulsations vers le système ne sont pas émises, le membre sera retiré du cluster.
La Figure 2 illustre la façon dont les membres communiquent dans une configuration de cluster. Notez que le serveur de terminal utilisé pour l'accès aux consoles du système via des ports série, n'est pas un composant absolument nécessaire du cluster.
Capacité de failover du service
Dans le cas d'une panne matérielle ou logicielle, le cluster prendra les mesures nécessaires pour maintenir la disponibilité des applications et l'intégrité des données. Par exemple, si un membre est complètement défaillant, un autre membre (dans le domaine de failover associé, si il est utilisé, ou dans le cluster) redémarrera ses services. Ainsi, les services déjà lancés sur ce système ne seront pas perturbés.
Lorsque le membre défaillant redémarre et peut communiquer avec les partitions du cluster partagé, il peut rejoindre le cluster et faire à nouveau tourner des services. Selon la configuration des services, le cluster peut rééquilibrer les services sur les deux membres.
Capacité de relogement manuel du service
En plus des capacités de failover automatique du service, un cluster vous permet d'arrêter nettement des services sur un membre et de les redémarrer sur un autre membre. Ceci vous permet d'effectuer des travaux de maintenance prévus sur un membre tout en assurant la disponibilité des applications et des données.
Fonction d'enregistrement des événements
Pour assurer l'identification et la résolution de problèmes avant qu'ils n'impactent sur la disponibilité du service, les démons du cluster enregistrent des messages en utilisant le sous-système conventionnel Linux syslog. Vous pouvez personnaliser le niveau de sévérité des messages enregistrés.
Surveillance des applications
L'infrastructure dans un cluster peut de façon optionnelle contrôler l'état et la santé d'une application. De cette manière, si une application particulière est défaillante, le cluster redémarrera automatiquement cette application. En réponse à la défaillance de l'application, cette dernière essaiera d'être relancée sur le membre sur lequel elle tournait à l'origine. Si ce n'est pas possible, elle redémarrera sur l'autre membre du cluster. Vous pouvez spécifier les membres qui peuvent exécuter un service en assignant un domaine de failover au service.
Précédent | Sommaire | Suivant |
Introduction | Niveau supérieur | Comment utiliser ce guide |