冗余服务器数据不同步故障诊断

      公司有2台服务器互为冗余,把所有的客户机首选服务器分别设置到server1和server2底下,现在出现了服务器1和服务器2的客户端数据显示不一致,在拔掉服务器2的终端总线后,挂在server2下的客户机出现了翻页慢,没有数据的现象,插上服务器2的终端总线后恢复正常,数据不一致的原因是什么?

       Server2的终端总线拔掉后,挂在server2下的所有客户机没有自动切换到server1底下出现了没有数据且翻页慢的情况,把server2的终端总线插上后所有客户机恢复了正常,说明server1和server2冗余有问题。

      在server2的WINCC Explorer→Tool菜单中检查连接状态,发现server1连接状态为红色×(disconnect),接下来检查server1的网络连接,发现也是无连接,于是把server1的终端总线重新插拔,发现网络连接状态恢复正常,此时断开server2的终端总线,检查客户机正常,那么问题也就是因为server1的终端总线接触不良引起的两个服务器不切换。

       那两台服务器的数据为什么显示不一致呢?在打开两台服务器下的客户机时,发现同一个变量在分别在客户机上显示的趋势也是不一致的。初步怀疑是两台服务器时间不同造成的,于是检查服务器时间,发现两台服务器的时间相差了2分钟左右,那这个就是因为时间不同步造成了数据不一致。进一步的检查服务器的设置,发现server1和server2两台服务器“时间同步”(Time Synchronization) 编辑器的“通过系统总线同步(主站、从站)”(Synchronization via System Bus (Master/Slave)) 区域中全部激活“从站”(slaver) 选项,也就是中央工厂时钟没有在终端总线和工厂总线中传送时间帧,也没有协作时间主站。于是把两台服务器的时间手动改为一致后(时间只能往后调不能往前调),把server2重启后,又对server1进行了重启,然后把server1选择“主站”(Master) ,观察一段时间后,问题解决。

总结说来问题的原因有两点:

1、  server1的终端总线松动造成了2台服务器不冗余

2、 2台服务器没有设置时间主站造成了数据不同步

冗余服务器数据不同步故障诊断

相关文章:

你感兴趣的文章:

标签云: