以下章节中的信息能够协助您管理群集软件的配置。
群集使用几种群集内部通信机制来保证数据的完整性,并在失效发生时修正群集行为。群集使用这些机制来:
控制系统成为群集成员的时间
判定群集系统的状态
在失效发生时控制群集的行为
群集的通信机制如下:
共享(仲裁)分区
每隔一段时间,每个群集系统都把时间戳和系统状态写入主共享分区和备份共享分区,它们是位于共享贮存区上的原始分区。每个成员系统读取对方写入的时间戳和系统状态,从而判定它们是否是最新信息。成员试图从主共享分区中读取信息。如果这个分区被损坏了,成员就会从备份共享分区中读取信息,同时修补主分区。数据的一致性是通过校验和维护的,分区间的任何不一致之处会被自动修正。
如果成员重新引导后无法写入任何共享分区,这个系统将不会被准许加入群集。除此之外,如果某个现存的成员不能够再写入这两个共享分区,它会通过关机来退出群集。
共享分区只能被禁用了网络仲裁器的双成员群集用作通信机制。
删除电源开关监视
每个成员都定期监视远程电源开关连接(若有)的健康状况。成员使用这项信息来帮助判定另一个群集成员的状态。电源开关通信机制的完全失效不会自动导致失效转移。如果电源开关没有成功地重开挂起系统的电源,失效转移就不会发生,因为群集结构无法保证该成员当前的状况。
以太网心跳
群集成员使用“点到点”以太网线路互相连接。每个成员都定期通过这些线路发出心跳(ping)。群集使用这项信息来帮助判定成员的状态,并确保正确的群集操作。心跳通信机制的完全失效不会自动导致失效转移。
如果某成员判定另一个群集系统的仲裁时间戳不是最新的,它会检查心跳状态。如果到该系统的心跳仍能够进行,群集就不会采取任何行动。如果过了一段时间,某成员没有更新时间戳,并且对心跳 ping 命令毫无反应,这个成员就会被认为已不在运行。
即便所有其它的通信机制都失败了,但只要有一个群集成员能够写入共享分区,群集将会保持运行。
注意,共享分区只是在某些双成员配置中为备份目的而使用的。网络成员算式是决定哪些群集活跃哪些不活跃的主要因素。在这种配置中,除非 clumembd 报告说某个不更新其时间戳的成员已停止了,该成员不会导致失效转移。