D.4. 使用 clufence 工具

如果群集硬件配置中使用了电源开关,在每个群集系统上运行 clufence 工具来确保它能够远程地重开其它群集成员的电源。

如果命令成功,在所有群集成员上运行 shutil -p 命令来显示仲裁分区的头数据结构的摘要。如果各成员上的输出不同,仲裁分区在各个成员上所指向的就不是同一个设备。请检查一下来确定原始设备的确存在,并且在 /etc/sysconfig/rawdevices 文件中被正确指定了。详情请参阅第 1.4.4.3 节

如果群集硬件配置中使用了网络连接的或串行连接的电源开关,安装群集软件并引发 clufence 命令来测试电源开关。在每个群集成员上引发该命令以便确保它能够重开其它群集成员上的电源。如果测试成功,群集就可以被启动。

clufence 命令能够准确地测试电源开关。clufence 命令的格式如下:

usage: clufence [-d] [-[furs] <member>]
  -d              Turn on debugging
  -f <member>     Fence (power off) <member>
  -u <member>     Unfence (power on) <member>
  -r <member>     Reboot (power cycle) <member>
  -s <member>     Check status of all switches controlling <member>

在测试电源开关的时候,第一步是确保每个群集成员都能够成功地和所连接的电源开关通信。以下 clufence 命令输出的例子显示了群集成员能够和它的电源开关通信:

[23750] info: STONITH: baytech at 192.168.1.31, port 1 controls clu2
[23750] info: STONITH: baytech at 192.168.1.31, port 2 controls clu3
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu4 controls clu4
[23750] info: STONITH: wti_nps at 192.168.1.29, port clu5 controls clu5

输出中的错误可以表明以下类型的问题:

成功地校验了和开关的通信后,试图重开其它成员的电源。在这么做之前,推荐你校验其它成员没有在执行任何重要的功能(如为活跃客户提供群集服务)。执行以下命令:

clufence -r clu3

以下描述了成功的重开电源操作:

Successfully power cycled host clu3.