动车组WTD数据质量对PHM模型的影响研究

(整期优先)网络出版时间:2024-07-31
/ 3

动车组WTD数据质量对PHM模型的影响研究

林有为

中国铁路北京局集团有限公司北京动车段 北京 102600

摘  要:基于动车组PHM系统的应用现状,对现阶段动车组WTD传输设备及数据质量现状进行了调研分析,阐述了WTD实时数据质量问题的常见形式,分析了产生数据质量问题可能的原因和情形,以及各类数据质量问题对PHM模型计算的影响,提出了在PHM模型开发层面的一般应对策略,同时也对动车组车载PHM系统及动车组非实时数据的应用前景进行了展望,最后对如何提高动车组PHM系统的应用水平进行了思考。

关键词:动车组;PHM;WTD;数据质量

研究背景

随着我国高速铁路的持续发展,我国动车组保有量已达3600余列,每日上线运行动车组近2600列,如何确保动车组安全上线运行则成为各级铁路部门的首要问题。一直以来,动车组车载数据的实时监控和分析应用对动车组故障诊断与健康监测起到了重要作用。动车组的检修模式也在由传统的“计划修”向“精准预防修”转变[1-2]。近几年,随着动车组对地通信的4G技术升级,更多的车载数据能够更快地传输至地面接收端;同时,各主机企业及铁路局集团公司也进行着动车组故障预测与健康管理系统(PHM)的研究与应用;2020年底,国铁集团动车组故障预测与健康管理系统(PHM)推广全路进行试用,至2024年,国铁集团PHM系统已完成多次升级和完善,为优化动车组检修策略、实现精准预防修提供了平台支持和技术保障。

自2020年底至今,国铁集团PHM系统已应用三年多,在此期间,北京局集团公司进行了全面的系统功能试用和模型验证,并提出多项功能及模型优化建议。在模型自主研发的过程中,我们发现动车组WTD车载数据存在传输延时、丢包、跳变等问题,对PHM模型的输出结果准确性造成严重影响。本文通过对动车组WTD数据现状的调查统计,分析现有数据质量对PHM模型的影响,并给出相应的解决方案,为现有数据质量下的模型开发提供思路和参考。

1 动车组实时数据现状

1.1 实时数据传输设备

现阶段,动车组的实时数据传输是由车载无线传输装置(Wireless Transmission Device,WTD)通过车载网络系统对列车故障信息、运行参数、实时位置数据等进行收集存储,再通过GPRS网络传输至地面服务器进行存储解析和应用[3]。显然,WTD设备在整个动车组实时数据传输过程中起着至关重要的作用。北京局配属的主要车型无线传输装置(WTD)供应商如表1所示。

表1 各车型无线传输装置(WTD)供应商对照表

序号

装用平台

供应商名称

备注

1

CRH380B

北京纵横机电科技有限公司

目前北京局配属动车组已全部完成4G通信技术升级改造

2

CRH380C

中车青岛四方车辆研究所有限公司

3

CR400BF

北京纵横机电科技有限公司

4

CRH5A

中车青岛四方车辆研究所有限公司

5

CRH380A

株洲中车时代电气股份有限公司

北京华高世纪科技股份有限公司

6

CR400AF

株洲中车时代电气股份有限公司

(注:个别车组特别型号未统计在内)

基于目前CR400AF、CR400BF平台动车组运用率较高,以及CRH3型、CR400BF平台动车组温度类预警报警较多的现状,我们针对这些车型的无线传输装置及实时数据质量进行研究。

1.2 实时数据质量调查

通过对CR400AF、CR400BF、CRH380B/CL平台动车组实时数据中运行参数的调研,发现数据质量主要存在延时、跳变、丢包等问题。

1.2.1 数据延时

数据延时是指地面接收到数据的时间与车载数据产生的时间之差,在动车组运用中一般认为数据延时时间在1分钟以内属于正常现象(在传输通道正常的情况下)。我们选取了部分CR400AF/AF-B、CR400BF/BF-A、CRH380B/CL型动车组在京沪、京广等线路上多天的运行参数进行研究,通过汇总分析发现CR400AF平台动车组与CR400BF、CRH380B/CL平台动车组的数据延时时长和延时占比均存在明显差异。具体统计数据见表2。

表2 不同车型实时数据延时情况统计

序号

车组号

日期

延时≤1min数据占比

延时≤5min数据占比

单日最大延时时间(min)

1

CR400AF-2004

5/1

70.82%

93.93%

16

5/3

77.18%

97.34%

11

5/4

74.15%

98.03%

8

5/5

74.85%

95.05%

18

2

CR400AF-2180

5/1

77.85%

97.74%

9

5/2

76.92%

98.60%

8

5/3

78.46%

98.27%

7

5/4

70.86%

97.92%

9

3

CR400AF-B-2206

5/1

73.49%

94.39%

14

5/2

84.69%

99.04%

6

5/4

78.53%

94.67%

13

5/5

74.57%

95.04%

11

4

CR400BF-A-3025

5/2

57.56%

70.47%

400

5/3

36.00%

52.80%

377

5/4

50.88%

67.20%

336

5/5

38.77%

54.13%

352

5

CR400BF-A-3052

5/3

58.59%

67.57%

274

5/4

41.08%

55.79%

373

5/9

55.89%

69.60%

392

5/10

35.01%

50.97%

348

6

CRH380B-5659

5/6

79.30%

86.35%

788

5/7

77.63%

84.14%

702

5/8

82.57%

89.34%

870

5/9

77.19%

85.51%

785

7

CRH380B-5741

5/10

81.36%

89.42%

726

5/11

83.87%

90.86%

698

5/12

83.80%

91.64%

549

5/13

84.25%

91.50%

399

8

CRH380CL-5604

5/13

2.69%

67.15%

167

5/14

4.91%

91.94%

37

5/15

17.23%

90.47%

61

5/16

19.82%

87.09%

126

9

CRH380CL-5607

3/1

17.08%

82.62%

61

3/2

16.08%

88.96%

46

3/3

10.23%

89.81%

51

3/4

2.50%

88.66%

47

由上述数据可以看出,CR400AF平台动车组延时大于5分钟的数据占比很少,且单日最大延时时间均在20分钟以内,整体数据质量较好;CR400BF平台动车组延时大于5分钟的数据占比平均接近50%,且单日最大延时时间在6个小时左右,可以说是延时数据多且延时时间长,数据质量较差;CRH380B平台动车组延时数据占比与CR400AF平台动车组类似,但单日最大延时时间最长达到了14.5小时,整体上延时数据较少,但一旦发生延时,延时时间较长;CRH380CL型动车组延时≤1分钟的数据占比很少,但5分钟之内大部分数据已接收完成,单日最大延时时间在1-2小时左右。总的来说,CR400AF平台动车组整体数据质量较好,而CR400BF、CRH380B/CL平台动车组数据质量均存在不同方面的问题。典型的数据延时情况见图1-图4。

CR400AF-B-2206 5.2

图1 CR400AF-B-2206动车组5月2日实时数据延时情况

CR400BF-A-3025动车组5月5日

图2 CR400BF-A-3025动车组5月5日实时数据延时情况

CRH380B-5659动车组5月8日

图3 CRH380B-5659动车组5月8日实时数据延时情况

CRH380CL-5607动车组3月1日

图4 CRH380CL-5607动车组3月1日实时数据延时情况

1.2.2 数据跳变

数据跳变是指数据脱离原有连续性而出现特异值的情况,一般电压、压力等数据跳变可能为正常现象,但温度类数据跳变基本不代表实际情况,我们对近几年的温度类预警信息进行了汇总统计,各车型温度类数据跳变情况见表3。

表3 各车型温度类数据跳变情况统计

车型

部件

跳变值(

CR400AF

牵引变压器油温

-50/205

CR400AF

牵引变流器冷却液温度

-100

CR400BF-C

轴箱轴承温度

-50

CRH380CL

轴箱轴承温度

-40/-50

CRH380CL

牵引电机(非)驱动端温度

-60

CRH5A

轴箱轴承温度

-40

CRH5A

牵引电机定子、(非)驱动端温度

-50

CRH6A

轴箱轴承温度

-50

经统计,各车型温度类数据跳变主要集中在轴箱轴承、牵引电机轴承及定子牵引变压器、牵引变流器等部件,跳变的特异值也是相对固定的。

另外,还存在少数的不规则的数据跳变,此类跳变的数值一般是不固定的、具有一段持续时间的,可能是受环境因素干扰或传感器自身异常导致。

1.2.3 数据丢包

数据丢包是指因动车组车载设备故障或通道阻塞等原因导致地面接收端未成功接收到数据的情况。数据丢包情况可以由动车组WTDS数据“完整率”进行表达,“完整率”定义为(该车当日交路时间内有效数据总时间/当日交路时间)×100%,有效数据应指成功接收到的数据,当日交路时间应指当前交路串中第一交路始发时间至最后交路终到时间。这里需要注意两点,一是一列动车组在一天内存在两个不连续的交路串时,“完整率”应分开计算,不能将中间列车未运行时间当做应该接收到数据的时间;二是要考虑不同车型实时数据的数据密度,例如CR400AF型动车组每10秒一个数据,CR400BF型动车组每30秒一个数据,实际上的完整率计算应是:当日交路时间内接收数据包解析出来的数据个数/(当日交路时间×数据密度)。

2 数据质量问题原因

对于数据延时问题,一是运行线路原因,数据传输质量受动车组运行环境因素影响较大,如过隧道或偏远地区网络信号较弱等情况;二是车辆发送端原因,如车辆WTD设备异常或车辆网络发生拥堵等;三是地面接收端原因,如地面接收服务器异常或解析数据卡滞等。

对于数据跳变问题,一种是特定值的跳变,一般是由于极值或空值加上偏移量转换而来;一种是非特定值的跳变,可能是受环境因素干扰或传感器自身异常导致。

对于数据丢包问题,一般是由于车辆WTD设备故障或车地传输通道长时间拥堵造成的。

3 对PHM模型的影响及应对策略

3.1 数据延时的影响及策略

数据延时主要影响的是模型报警信息的时效性,特别是温度类模型,因数据延时而滞后报出可能会导致低等级预警无法得到及时处置而升级为高等级报警甚至控车,给线上应急处置增加压力。另外延时出现的报警信息还会混淆在之前的报警列表中,导致监控人员无法及时发现和处置,因此PHM系统为报警信息增加了平台接入时间,监控人员按接入时间降序查看报警信息,即可查看到最新接入的报警信息,确保报警处置不遗漏。

数据延时还会对模型计算带来干扰,比如在做温度跳变或温升速率实时计算时,在正常数据流中混入了非本时间段的延时数据,就会造成计算结果错误。因此需要在计算时对数据的时间戳进行校验,过滤掉延时数据,以保证模型输出结果的准确性。

3.2 数据跳变的影响及策略

常见的数据跳变情况是单一数据点为特定的极大值或极小值,此类跳变一是会引起单阈值模型的误报警,二是会引起变化速率模型的误报警,三是会引起同车厢或同位置数据差值类模型的误报警;由于此类跳变的值比较固定,只需在模型逻辑中设置特定值过滤条件即可,例如CR400AF平台动车组牵引变压器油温在初送电时经常出现-50或205的跳变值,导致全列大量误报警,此时在模型逻辑中增加跳变值的过滤条件即可消除误报警。如果出现持续一段时间的、参数值无规则的跳变情况,还需要运用部门对相关部件及传感器进行现场检查确认。

3.3 数据丢包的影响及策略

数据丢包的影响取决于丢包数据的时长和数据量,且一般情况下丢包时间内的所有参数数据会全部丢失,丢包时间长或频繁丢包时对动车组在线运行数据监控的影响是很大的。

由于丢包数据无法再补传,我们只能在模型计算时充分完善计算逻辑以消除丢包对模型准确性的影响,例如齿轮箱轴承温度跳变实时计算的逻辑为:|齿轮箱轴承温度(非空)-前一个数据包的齿轮箱轴承温度(非空)|>20℃(两数据包时间差>20s时不计算,过滤-50℃),这里是要根据数据密度设置合适的允许丢包时间。又如在涉及有持续时间条件的模型计算时,如主空压机异常打风模型(主空压机持续工作时间超过30分钟),只判断持续时间内各数据满足条件,允许区间内存在丢包情况,以便减少丢包带来的影响。还有在做温升速率实时计算时,采用当前数据与前一分钟内所有数据分别做差值来判断每分钟温升速率,这样既能消除个别数据点丢失的影响,也可以最大程度上抓取到异常的温度上升情况。

4 动车组车载PHM系统

动车组车载PHM系统是将原来地面数据处理计算的过程转移到列车上的系统,主要由车载PHM主机、智能集成监控屏及手持移动终端三部分组成,采用以太网及车载WIFI进行通信,通过数据采集、数据处理和数据存储,实现车载实时状态数据显示、故障预警预测、寿命件动作次数统计预警等功能。相较于地面PHM模型,车载PHM模型具有数据密度大、数据质量高、数据时延小的优势,从根本上消除了车地传输通道的不稳定给数据质量造成的不良影响,是动车组故障预测与健康管理应用中一个重要的研究方向,目前在复兴号智能型动车组均配置了车载PHM系统,有效地提高了动车组在线运行安全保障能力。

5 动车组非实时数据

动车组非实时数据是指动车组在检修入库时通过动车所内WLAN局域网传输到动车所地面服务器的车载全量数据,要求动车所WLAN设施能够实现动车组在一级修有电作业时间内完成一个入库检修周期内的非实时数据自动下载,并及时上传国铁集团主数据中心全路联网应用。动车组非实时数据具有数据密度大、数据项更全面、数据广度大的特点,亦不用考虑数据传输延时和丢包的问题,很好地消除了数据质量对模型计算的不良影响,因此动车组非实时数据适用于视情维修类、趋势分析类等不要求实时计算的模型。但想要动车组非实时数据有良好的应用效果,还需要有稳定的局域网和服务器等硬件、智能的数据传输策略、完整的数据解析能力作为保障。基于数据在时间和空间上的广度,对于正在开发的PHM系统健康管理模块来说,动车组非实时数据也可以作为其中重要的数据源之一。随着各方面工作的推进,动车组非实时数据应用将是动车组故障预测与健康管理应用的又一重要组成部分。

6 结束语

本文结合动车组WTD数据质量问题分析了原因和影响,提出了应对措施和展望,希望给基于动车组WTD实时数据的PHM模型开发工作带来一定的启示,提高模型开发的效率和质量。对于如何提高动车组PHM系统的应用水平,我们还需要做好以下工作:

(1)大力推进动车组车载PHM系统和非实时数据的应用研究,发挥动车组数据不同载体不同形式下的优势。

(2)提高动车组运用检修部门对动车组数据的分析应用能力,重视对动车组故障原理和数据的自主分析,增强对PHM系统和模型研究的源动力。

参考文献:

[1] 李 燕,张 瑜,周军伟.动车组故障预测与健康管理系统方案研究[J].铁路计算机应用,2018,27(9):1-7.

[2] 李超旭,张惟娇,李 燕.基于大数据的动车组运维数据服务平台研究[J].铁道运输与经济,2019,41(11):52-57.

[3] 吴臻易.大数据技术在动车组故障预警中的应用[J].控制与信息技术,2021,5:91-96.