SPPA-T3000系统通讯故障分析与处理

(整期优先)网络出版时间:2018-03-13
/ 1

SPPA-T3000系统通讯故障分析与处理

庄雷

(江苏华电仪征热电有限公司江苏省仪征市211417)

摘要:本文主要介绍了西门子SPPA-T3000系统,并对该系统的网络构架和组成进行了分析,针对#5燃机控制系统通讯故障进行分析,提出解决措施。

关键词:SPPA-T3000;DCS;网络;交换机

一、SPPA-T3000介绍

SPPA-T3000是西门子PG最新的DCS,替代上一代的TeleperM-XP的产品。SPPA-T3000系统具有实时数据显示、高速数据传输以及高性能的过程控制处理功能。工程设计视图形成了每个SPPA-T3000系统的基础。它直观、便于使用的图形界面使得可以在花费较少成本的情况下立即将工艺任务定义转换成高质量的I&C执行程序。

我公司为燃气-蒸汽联合循环机组,燃机TCS、汽机和余热锅炉DCS以及辅控系统皆采用SPPA-T3000系统,实现了控制一体化。

(一)TCS及主控DCS系统网络结构

系统网络分为两层,两层网络之间的通讯通过容错服务器来联接:

●应用数据层:主要负责操作员站OT、工程师站ES、打印机及OPC服务器之间的通讯和数据交换,有两台交换机。绿色网线连接操作员站OT、工程师站ES、打印机及OPC服务器,两对灰色光纤连接两台交换机组成环网,确保通讯冗余。

●自动数据层:主要负责燃机、汽机和余热锅炉各个控制器AP及CM的通讯,有四台交换机:燃机一对,汽机和余热锅炉共用一对。绿色网线连接控制器AP及CM,桔色光纤负责远程连接两对交换机,灰色光纤连接一对交换机组成环网,保证通讯冗余。

(二)控制器AP分配

TCS及DCS系统配有九对控制器AP,每对控制器之间通过现场总线保持冗余,控制器通过通讯卡153-2保持与下层I/O卡件的通讯,而每对控制器则通过通讯模块443-1与其他控制器组成了自动数据层,各AP的功能分配如下:

二、故障分析及处理

(一)故障现象

#5燃机运行过程中TCS监控画面参数显示出现大面积坏点,通过SPPA-T3000系统诊断得知AP311和AP312控制器出现“Bus1Error”和“Bus2Error”故障报警,即冗余的两条通讯线路皆故障,数据停止刷新,#5燃机处于失控状态,运行人员无法对燃机进行监控和操作,无法执行减负荷指令,无法执行停机顺控。20分钟后#5燃机画面数据自动恢复,4小时后又出现数据停止刷新情况,此种情况在随后2小时内反复出现,之后长时间数据未恢复刷新。在故障发生时,热控检修人员检查燃机的一对交换机,发现“RM”灯一直闪烁,表示交换机处于非冗余环网状态;“F”灯变红常亮,表示交换机故障。

(二)故障分析及预处理方案

根据故障现象,热控检修人员首先检查了DCS服务器,利用服务器自带的诊断工具,以及余热锅炉和汽机DCS画面参数未发生故障情况,综合判断服务器运行正常,应用数据层交换机正常。然后检查燃机侧两对控制器、汽轮机和余热锅炉侧DCS控制器,按照控制器LED灯显示情况,判断不是控制器故障。最后确定应为自动数据层燃机侧交换机故障,导致燃机监控数据无法传送,造成监控画面坏点。由此,制定三种解决方案:

1.根据SPPA-T3000系统控制的特点,控制逻辑在控制器中,网络只是传输指令和反馈的通道,交换机则是站点。暂不停机,切断交换机电源,重新启动交换机,尝试恢复数据通讯。

2.若方案1不能解除故障,在不停机的情况下,采纳西门子厂家建议,插拔冗余光纤(P13口),重新启动端口,尝试恢复数据通讯。

3.若方案2还是不能排除故障,则须停机,更换新的交换机。

在实际排除故障过程中,方案1没有效果,采用方案2后,恢复了部分数据的传输,未解决根本问题,但运行人员可以操作机组进行顺控停机。停机后,鉴于还有小部分数据传输无法恢复,随即更换了燃机侧一对交换机,全面恢复了数据传输。

(三)最终解决方案

通过与西门子公司沟通,系统工程师认为确实是自动数据层燃机侧交换机端口的故障,导致数据通讯堵塞,造成TCS监控画面出现数据坏点。西门子公司给出最终的方案是升级交换机的固件,优化通讯网络设置,确保不因端口故障,而停止数据的传输。系统工程师使用专用软件连接网络交换机,设置交换机IP地址,用IE登录交换机,进行升级和参数设置,令端口自动扫描,遇故障能够自动重启,而不会造成数据堵塞。

经过数月的运行验证,中间发生过一次端口故障,但在系统诊断未发现“Bus1Error”或“Bus2Error”,并且燃机控制画面未出现坏点,不影响运行。检修人员将燃机侧交换机端口P13的光纤插拔后,端口重启,故障消失。说明通过对交换机的固件升级和参数修改,能够有效解决之前的故障问题,减小燃机失控的风险。

三、结论

(一)技术人员对于DCS系统设置参数不了解,系统维护的技术力量不强。

(二)加强对系统设备状态的巡查,要熟知各个设备状态灯表示的意义,及时发现系统故障。

(三)利用机组停运机会,逐步升级其他两套机组的交换机,杜绝类似故障重复出现。