C.7. 常见行为:群集服务守护进程

服务状态检查失败

常见原因:用户脚本报告了错误,clurmtabd 不在 NFS 服务上运行,smbdnmbd 不为带有 Samba 共享的服务运行。

测试例:创建带有初始脚本的服务,它返回 status 输出 1

预计行为:服务在当前的所有者成员上重新启动。

校验:参考系统日志中的系统重新启动事件。服务状态信息中的 restarts 字段应该被递增。

成员启动服务失败

常见原因:由于文件系统错误导致用户脚本返回错误。

测试例:创建一个服务,其用户脚本只在一个成员的 start 阶段返回1。试图启用该成员上的服务。

预计行为:服务被停止并在另一个成员上被启动(若服务被成功停止)。

服务在所有成员上启动失败

常见原因:用户脚本返回错误,文件系统错误。

测试例:创建一个带有用户脚本的服务,该脚本在所有成员的 start 阶段返回1。

预期行为:服务被放置在 disabled 状态中。

校验:运行 clustat,校验服务处于 disabled state

服务无法在某成员上停止

常见原因:脚本返回错误;文件系统无法被卸载。

测试例:创建一个服务脚本,它在 stop 阶段返回1。

预计行为:服务被放置在 failed 状态。此时,管理员必须参与来判定失效原因以及应采取的措施。然后在启用服务前它必须首先被禁用。

校验:运行 clustat 来校验服务已被放置在 failed 状态。