中国铁路集团北京局集团有限公司北京通信段 北京 100086
【摘要】:CTCS-3列车控制模式的正常与否直接影响到行车安全,如果发生CTCS-3降级,轻者可能导致列车降速,重者甚至会发生列车紧急制动,影响列车运行安全及列车运营正点率。为了保障高铁客专线的运行安全,C3监控、超时降级分析以及发生故障应急处理变得尤为重要。本文结合京包客专日常维护工作,对由于基站故障引发的典型列车超时降级原因进行了详细的总结分析。
【关键词】:基站硬件;超时降级原因定位;单通;典型案例
一.问题现象
2020年3月23日,12:25-13:26期间,京包客专K128+360对应基站HL-XHYB02A(怀来-下花园北02A)附近,北京局车体G9101、G2510、G2483、G9102 发生无线链接超时。
二.数据查询
以G9101数据为例,发现PRI(MSC至RBC之间的接口)接口数据中的现象为车载多次发送136位置信息包,RBC(无线闭塞中心)未回复24号包,RBC发送DISC:A,PRI口数据分析看到:列车进入到HL-XHYB02基站后,车载持续请求21号帧,但是RBC持续未发送21号帧,12:25:16.878,RBC下发DISC:A帧,拆除HDLC层的连接,而在拆除之前RBC接收上行消息正常。
(1)查看PRI接口数据显示:
PRI接口数据
数据显示从12:25:13.058开始,车载发送3个136号位置信息包,RBC未回复24号包,RBC发送DISC:A,后OBC发送DISCONNECT拆连。
(2)查看Abis接口数据,信令和切换均正常,测量报告显示:上、下行电平及质量均正常。
Abis接口测量报告
(3)查看A接口数据,信令交互正常。
A接口数据
三.基站侧日志分析
3.1告警日志分析
在问题发生的时候,无异常告警记录。
告警界面截图
3.2 HL-XHYB02基站网表配置情况
HL-XHYB02基站配置了一个主B载波,网表配置正常。
网表配置表
3.3单通日志分析
单通日志中仅仅记录了短话单,未记录到存在单通。
单通日志分析
3.4基站日志分析
基站日志中未见异常。
基站日志截图
四.现网测试分析
3月24日晚23点50,现场将主备基站进行倒换,通过2个手机同一个站点拨测时,复现故障现象,该站点下手机呼叫别的区域调度时,调度到手机语音不通,手机到调度正常。后现场对2个载频单板进行下电操作,对主控单板进行更换操作,更换之后呼叫正常。初步怀疑判断该主控单板存在问题。
五.GTMU单板硬件分析
5.1 GSM-R实验室复现分析
将该故障单板送到硬件分析实验室进行硬件分析,首先进行硬件引导加载,FPGA加载失败,单板反复重启,从这个分析结果看到,GTMU单板无法正常加载,导致该单板安装到基站上时无法正常工作,上报OML告警和小区退服告警。后续对该单板分别进行RAM和关键器件测试,通过测试可以看到FPGA芯片自检失败,说明FPGA内部资源块故障。如下为详细测试情况:
FPGA测试界面截图
5.2 FPGA芯片故障导致单通分析
FPGA(Field-Programmable Gate Array),即现场可编程门阵列,以硬件描述语言(Verilog或VHDL)所完成的电路设计。FPGA在产品上一般是作为转发器件来使用,即通过一个内部的转发表项将不同入口的数据转发到对应的出口,实现不同业务数据的正确传输。
从BSC发出的报文经过E1口进入GTMU单板后,在FPGA芯片内会进行判断,CSD/语音等业务报文会被送往CPRI口发往RRU/RFU处理,FPGA不同的资源块会控制报文发往的CPRI口不同、上下行的方向也不同。
硬件检测看到FPGA资源块故障会导致数据转发异常,对应数据无法转发到指定目的地,引起单通。
GTMU单板传输示意图
5.3 FPGA芯片和失效率介绍
GTMUb(03030LPM)单板的FPGA芯片的厂家,为A国ALTERA公司。
查询该FPGA失效率,可以得整体平均失效率为162ppm(百万分之162),2018年年失效率为26.622ppm, 2019年失效率14.929ppm,失效率极低。
六.结论
此次单通故障原因为HL-XHYB02A的主控板GTMU内部FPGA(场可编程门阵列)芯片故障,由于该芯片故障导致下行数据无法转发到对应的目的端口,引起下行方向的语音业务单通,从而引发列车发生超时降级。
如果在某基站小区下发生两次及以上C3降级时,可采取倒换主备主控板(现有基站AB两套代表两个主控板),倒换基站环、闭锁基站的方式进行应急处置。由于京包客专基站采用AB两套主备基站为一套基站的方式运用,倒换AB主备站(既倒换了主控板同时又倒换了基站环)。