问题背景:
在国内某大型石化现场的重要离心压缩机组安装本特利的System 1® 状态监测软件平台,该平台已将全厂的60多台3500振动传感器、转速传感器、电涡流位移传感器监测保护系统的数据全部接入,在System 1® 系统调试正常运行后,偶尔出现的网络波动或办公网与核心网断开时导致所有3500框架的3500/22M卡同时重启的现象。
查看3500的系统事件列表, 故障代码和描述如下
问题分析
▪ 根据上述故障代码分析,怀疑重启现象和持续的高流量网络请求有关。
▪ 现场的3500框架分布在多个FAR站,但是3500/22M卡却出现同时重启的现象。在办公网上有ARP广播风暴时、或者办公网和核心网之间网络中断时都会出现3500/22M卡重启。
现场3500与System 1® 连接的网络拓扑图如下,System 1® 部署在核心网,所有3500框架均部署在办公网:
处理措施
▪ 采用方案是在办公网的汇聚交换机划分VLAN,将3500框架与System 1® 划分在一个独立的虚拟局域网内。3500/22M卡重启现象发生频率降低很多,办公网络上的ARP广播不再会导致此现象出现。但偶尔出现办公网与核心网络中断时,仍然会有3500/22M重启。
▪ 第二次采用方案是在其中FAR1站的3500/22M与交换机之间增加防火墙(下图橙色圈内),防火墙规则设置只允许System 1® 通过专有端口访问3500/22M,其他端口和协议禁止。如下拓扑图:
当现场其他3500/22M出现重启时,FAR1的4台3500框架未出现重启现象,运行正常。
改进建议
此项目所有3500框架均部署在办公网上,在设计上不符合国际电工委员会(IEC)关于工控网络与系统信息安全标准。
▪ 鉴于现场客户要求最小程度的改变现有网络架构,因此建议每个FAR站增加防火墙并设置相应规则。
▪ 如果需要从根本上解决网络安全问题,可以参考工控网络与系统信息安全标准关于网络层级与区域划分的建议,对现有网络进行彻底改造。