监视群集和应用程序服务状态能够帮助识别和解决群集环境中的问题。以下工具可以在显示群集状态方面提供帮助:
clustat 命令
clufence 命令
日志文件消息
群集监视 GUI
注意,状态代表系统管理员在其上运行特定工具的群集系统。要获得所有群集成员的完整状态,在所有群集系统上运行工具。
![]() | 重要 |
---|---|
不在运行群集软件的成员不能够判定或报告群集上其它成员的状态。 |
群集和服务状态包括以下信息:
群集成员系统状态
心跳频道状态
服务状态以及哪个群集系统在运行该服务或拥有该服务
监视群集系统的服务状态
以下表格描述了如何分析群集状态工具和 clustat 命令中显示的状态信息。
服务状态 | 描述 |
---|---|
「运行」 | 服务资源在拥有它的群集系统上被配置了并可被利用。 |
「待用」 | 服务在成员上失效了,正在另一个服务上等待被启动。 |
「禁用」 | 服务被禁用了,没有被分派所有者。 |
「停止」 | 服务没有在运行;正在等待一个能够启动它的成员。 |
「失效」 | 服务没有被成功启动,而且群集无法成功的停止该服务。关于失效服务的详情请参阅第 3.8 节。 |
表 7-2. 服务状态
要在 shell 提示下显示当前群集状态的快照,启用 clustat 工具。其示例输出如下:
Cluster Status - clustertest 22:15:32 Quorum: Yes, view 36 Shared State: Shared Raw Device Driver v1.0 [Min. Size=1176064] Member Status ------------------ ---------- clu1 Active clu2 Active <-- You are here Service Status Owner (Last) Last Transition Chk Restarts -------------- -------- ---------------- --------------- --- -------- nfs_clutest started clu1 22:11:28 Jul 21 0 0 smb_clutest started clu2 22:13:06 Jul 21 0 0 |
要从 shell 提示下在指定时间段内监视群集并显示其状态,启用带有 -i time 选项的 clustat 命令。这里的 time 指定状态快照所间隔的秒数。例如:
clustat -i 10 |