C.5. 常见行为:带有基于 IP 仲裁器的两个或四个成员的群集

网络分区

常见原因:网络转换器问题。

测试例:把一半成员连接到转换器 A。把另一半连接到转换器 B。使用 up-link 或跨接电缆连接转换器 A 和 B。把充当仲裁器 IP 地址的设备连接到转换器 A。启动群集服务。断开转换器 A 和 B 的连接。

预计行为:由恰好一半成员组成的所有的群集分区会给仲裁器 IP 地址发送 ping 分组。如果收到了回应,分区就会组成一个仲裁。在测试例中,这就意味着连接到转换器 A 的那一半成员会组成一个仲裁。因为群集管理器需要一个完全连接的子网,当两个分区都能够联络仲裁器 IP 时所发生的同等分割(或 split-brain)情况就不会被处理。

校验:在插入转换器 A 上的成员中运行 clustat。在输出的起始部分应该列举 Cluster Quorum Incarnation 号码。

失去到共享介质的存取能力

常见原因:共享介质断电;连接成员和共享介质的电缆被断开。

测试例:断开成员上的 SCSI 或光纤频道电缆。

预计行为:采取配置的行动(reboot/halt/stop/ignore)来解决无法存取共享贮存区的问题。默认为 reboot

群集成员上发生系统挂载或崩溃(panic)

测试例:杀死 cluquorumdclumembd 守护进程。

killall -STOP cluquorumd clumembd

预计行为:群集成员被另一个成员保护(fence)。服务失效转移。如果使用了监视计时器,它也会被引发。