常见原因:失去网络连接。
测试例:断开成员的所有网络电缆。
预计行为:除非磁盘更新也丢失了,不会发生失效转移。在多数情况下,服务将无法被重新安置,这是由于锁服务器需要网络连接性。
校验:运行 clustat 来校验服务在成员上仍被标为运行,即便成员本身是不活跃的。日志中记录的消息会说该成员处于 PANIC 状态。
常见原因:共享介质失去电源,连接成员和共享介质的电缆被断开。
测试例:断开成员上的 SCSI 或光纤频道电缆。
预计行为:除非还失去了联网能力,不会发生失效转移。采取了配置的行动(reboot/halt/stop/ignore)来解决无法存取共享贮存区的问题。默认行动是 reboot。行动可能会随后导致失效转移。
测试例:杀死 cluquorumd 和 clumembd 守护进程。
killall -STOP cluquorumd clumembd |
预计行为:挂起的群集成员被另一个群集成员所保护(fence)。服务失效转移。被配置的监视计时器可能也会被引发。
常见原因:不良转换器;一个或全部成员都没有网络连接性
测试例:停止所有成员上的群集服务。断开一个成员上的所有网络电缆。在两个成员上都启动群集服务。
校验:不是所有服务都会启动,因为锁需要网络连接性。因为群集管理器需要完全连接的子网,这种情况是按照尽力而为的原则处理的,但是从技术角度上讲,它是一个不可操作的群集。