C.4. 常见行为:带有基于磁盘的仲裁器的双成员群集

失去到另一个成员的网络连接,共享介质仍可被存取

常见原因:失去网络连接。

测试例:断开成员的所有网络电缆。

预计行为:除非磁盘更新也丢失了,不会发生失效转移。在多数情况下,服务将无法被重新安置,这是由于锁服务器需要网络连接性。

校验:运行 clustat 来校验服务在成员上仍被标为运行,即便成员本身是不活跃的。日志中记录的消息会说该成员处于 PANIC 状态。

失去到共享介质的存取能力

常见原因:共享介质失去电源,连接成员和共享介质的电缆被断开。

测试例:断开成员上的 SCSI 或光纤频道电缆。

预计行为:除非还失去了联网能力,不会发生失效转移。采取了配置的行动(reboot/halt/stop/ignore)来解决无法存取共享贮存区的问题。默认行动是 reboot。行动可能会随后导致失效转移。

在成员 X 上出现系统挂起或崩溃(panic)

测试例:杀死 cluquorumdclumembd 守护进程。

killall -STOP cluquorumd clumembd

预计行为:挂起的群集成员被另一个群集成员所保护(fence)。服务失效转移。被配置的监视计时器可能也会被引发。

没经联网就启动群集服务

常见原因:不良转换器;一个或全部成员都没有网络连接性

测试例:停止所有成员上的群集服务。断开一个成员上的所有网络电缆。在两个成员上都启动群集服务。

校验:不是所有服务都会启动,因为锁需要网络连接性。因为群集管理器需要完全连接的子网,这种情况是按照尽力而为的原则处理的,但是从技术角度上讲,它是一个不可操作的群集。