常见原因:网络转换器问题
测试例:把大部分成员连接到转换器 A。把剩余的成员连接到转换器 B。使用 up-link 或跨接电缆连接转换器 A 和 B。启动群集服务。断开转换器 A 和 B。
预计行为:由多数成员组成的分区会继续运行,并且组成了一个新的群集仲裁的视图。在少数分区中的成员被保护(fence)。若可能,在少数分区中运行的服务会在多数分区中被启动。在测试例中,这就意味着连接到转换器 A 的那一半成员将会保护连接到转换器 B的成员。
校验:在连接到转换器 A 上的成员之一中运行 clustat。在输出的起始部分应该列举 Cluster Quorum Incarnation 号码。
测试例:杀死 clumembd 守护进程。
killall -STOP clumembd |
预计行为:群集成员被另一个成员保护(fence)。服务失效转移。如果配置了监视计时器,它也会被引发。
常见原因:共享介质失去电源,连接成员和共享介质的电缆被断开。
测试例:断开成员上的 SCSI 或光纤频道电缆。
预计行为:采取配置的行动(reboot/halt/stop/ignore)来解决无法存取共享贮存区的问题。默认为 reboot。