Search

1、网络交换机,对于有些交换机型号(如CISCO)必须设定PORTFAST(可能是这么拼,我对交换机不熟悉)。而有些品牌的型号(如TPLINK)缺省就设定了PORTFAST。

2、fence_ilo的版本问题。我用RHCS 4.5,就出现了不断重启,下载了最新4.7的fence包,才解决的。

再详细说一下有关fence版本的问题,

在4.5中,fence_ilo xxxx -o off能正常关机,但fence_ilo xxxx -o on或者-o restart报错,不能重新启动机器。

假设A机正常工作,B机关着,那么A机的fenced服务会不断发fence信号(相当于 fence_ilo xxx -o restart,都是通过fence agent来发出的),让B机重启,但由于fence 不能在OFF的状态把B机启动,所以会一直报fence failure。而手动启动B机,刚启动,A机的fence信号又发过来,让B机RESTART,结果就是B机OFF以后不能START。

注:A机发fence 信号的周期是10秒左右,0秒发出fence 信号(fence node “nodename”),5秒就能返回失败信号(fence “nodename” failure),10秒再发出fence信号。以上过程在B机未能重启的情况下,一直重复。

二、fence_ilo 报“no route to host”错误

10楼遇到过此问题的。

解决这个问题要检查几个地方:

1、硬件连接:对于HP ILO作为fence 设备不能两个ILO直连。(IBM BMC好象可以)。对HP的ILO,它的fence信号是通过ETHO发出的,而不是ILO端口,所以不能直连。

2、配置:在fence设备配置中,HOSTNAME必须是ILO端口的地址或NAME,如果是NAME,在HOSTS文件中必须设定。

如果能在A机上PING通B机的ILO端口,就应该不会出现这个错误了。