基于CEEMDAN和LSTM的滚动轴承剩余寿命预测

(整期优先)网络出版时间:2022-09-22
/ 4

基于CEEMDAN和LSTM的滚动轴承剩余寿命预测

邓海英

民航华东空中交通管理局  上海  200335

摘要:针对航空管制雷达驱动机构中的轴承实际工作环境中往往环境噪声较大,严重制约了信号的分析,影响最终的信号分析与判断的问题,本文提出了一种基于完全集合经验模态分解(Complete EEMD with Adaptive Noise,CEEMDAN)和长短期记忆网络(LSTM,Long Short-Term Memory)的滚动轴承剩余寿命预测方法。以PHM2012滚动轴承数据集为实验数据,利用采集到三种不同工况下的X轴和Y轴振动信号,利用 CEEMDAN对振动信号分解并筛选主要 IMF分量,计算前 7阶 IMF分量的能量熵作为特征向量;最后将特征向量LSTM进行寿命预测。实验结果表明本文提出的模型有效,为工程应用中滚动轴承剩余寿命预测提供参考。

关键词:滚动轴承;CEEMDAN;能量熵;LSTM;剩余寿命预测

1引言

航空机场雷达驱动机构有电机、减速箱、转盘组成,这些机械部件经年累月需要定期维护以保持设备长期连续可靠的运行。事实上,由于在工程实际中雷达驱动机构工作环境恶劣非常容易损坏,而工作环境恶劣同样导致采集到的信号噪声多,分析与判断困难,雷达故障停机导致的维护成本也非常高,而滚动轴承是雷达驱动机构中的的关键旋转部件,也是最容易损坏的零件之一,因此轴承的健康状态监测技术越来越得到重视,这对于保障机械装备的安全可靠运行、维护维修具有重要的工程实际意义[1][2]。胡启国等人[3]提出一种基于集合经验模态分解-核主成分分析(EEMD-KPCA)和改进的哈里斯鹰优化-最小二乘支持向量机(IHHO-LSSVM)的滚动轴承剩余寿命预测模型。张氢等人[4]一种基于振动信号时域特征,结合滚动轴承理论寿命值和具有处理时序特征功能的LSTM剩余使用寿命预测方法。王冉等人[5] 提出一种基于多尺度威布尔分布与隐马尔可夫模型(Hidden Markov model, HMM)的滚动轴承性能退化评估方法。甄冬等人[6] 提出了一种基于改进集成经验模态分解(IEEMD)和调制信号双谱(MSB)分析的故障特征提取方法用于滚动轴承的故障特征提取。许同乐等人[7] 提出一种基于集合经验模态分解(EEMD)的改进卷积神经网络的故障诊断方法。经验模态分解 (Empirical Mode Decomposition,EMD)是 Huang等[8]于 1998年提出的一种自适应信号处理方法,但是EMD存在模态混叠问题[9]。集合经验模态分解算法(Ensemble Empirical Mode Decomposition,EEMD)是Huang等[10]针对EMD的不足提出的方法。EEMD虽然解决了EMD出现的模式混叠问题,但是由于加入白噪声,因此也带来其他问题。首先,集总平均后的IMF可能不再符合IMF的要求(偏差一般较小,不影响瞬时频率的计算);其次,集总平均次数一般在几百次以上,非常耗时;最后一点,白噪声在集总平均之后基本抵消,但是仍存在残留,不可忽略。针对上述问题本文采用完全集合经验模态分解(Complete EEMD with Adaptive Noise,CEEMDAN)[11]融合长短期记忆网络(LSTM,Long Short-Term Memory)[12]对滚动轴承寿命进行预测。以PHM2012滚动轴承数据集作为实验数据,用 CEEMDAN对振动信号分解并筛选主要 IMF分量,计算前 7阶 IMF分量样本熵作为特征向量,再用LSTM进行滚动轴承的剩余寿命预测。

2 基于CEEMDAN和LSTM的模型

2.1完全集合经验模态分解

针对EMD算法分解信号存在模态混叠的问题,EEMD和CEEMD分解算法通过在待分解信号中加入成对正负高斯白噪声来减轻EMD分解的模态混叠。但是这两种算法分解信号得到的本征模态分量中总会残留一定的白噪声,影响后续信号的分析和处理。CEEMDAN 分解从两个方面解决了上述问题:1)加入经 EMD 分解后含辅助噪声的 IMF 分量,而不是将高斯白噪声信号直接添加在原始信号中;2) EEMD 分解和 CEEMD 分解是将经验模态分解后得到的模态分量进行总体平均,CEEMDAN 分解则在得到的第一阶 IMF分量后就进行总体平均计算,得到最终的第一阶 IMF分量,然后对残余部分重复进行如上操作,这样便有效地解决了白噪声从高频到低频的转移传递问题。

为经过 EMD 分解后得到的第个本征模态分量,CEEMDAN 分解得到的第个本征模态分量为为满足标准正态分布的高斯白噪声信号,为加入白噪声的次数,为白噪声的标准表,为待分解信号。CEEMDAN 分解步骤如下:

1)将高斯白噪声加入到待分解信号得到新信号,其中对新信号进行EMD分解,得到第一阶本征模态分量

      (1)

2)对产生的 N 个模态分量进行总体平均就得到CEEMDAN 分解的第 1个本征模态分量:

                        (2)

3)计算去除第一个模态分量后的残差:

                        (3)

4)在中加入正负成对的高斯白噪声得到新信号,以新信号为载体进行 EMD 分解,得到第一阶模态分量,由此可以得到 CEEMDAN 分解的第 2个本征模态分量:

                        (4)

5)计算去除第二个模态分量后的残差:

                        (5)

6)重复上述步骤,直到获得的残差信号为单调函数,不能继续分解,算法结束。此时得到的本征模态分量数量为 K,则原始信号被分解为:

                    (6)

2.2长短期记忆网络

长短期记忆网络(LSTM,Long Short-Term Memory)是为了解决RNN存在的长期依赖问题[13]。RNN训练时容易产生梯度消或梯度爆炸,为了解决这些问题刻意的调小梯度却会使模型失去捕捉长期依赖的能力。LSTM引入了门(gate)机制用于控制特征的流通和损失来解决上述的问题。LSTM是由一系列LSTM单元(LSTM Unit)组成,LSTM单元内部结构如下图。

图1 LSTM单元结构

在图1所示的单元结构中,

                         (7)

其中叫做遗忘门,表示的哪些特征被用于计算是一个向量,向量的每个元素均位于范围内。通常我们使用作为激活函数,的输出是一个介于区间内的值,但是当你观察一个训练好的LSTM时,你会发现门的值绝大多数都非常接近0或者1,其余的值少之又少。其中是LSTM最重要的门机制,表示之间的单位乘的关系。

                      (8)

表示单元状态更新值,由输入数据和隐节点经由一个神经网络层得到,单元状态更新值的激活函数通常使用叫做输入门,同一样也是一个元素介于区间内的向量,同样由经由激活函数计算而成,用于控制的哪些特征用于更新,使用方式和相同。

                       (9)

                  (10)

更新完单元状态后需要根据输入的来判断输出单元的哪些状态特征,这里需要将输入经过一个称为输出门的sigmoid层得到判断条件,然后将细胞状态经过得到一个范围内的向量,该向量与得到的判断条件相乘就得到了最终该LSTM单元的输出。

                      (11)

                         (12)

2.3模型构建

首先将采集到的滚动轴承振动信号分为训练集和测试集,对振动信号进行特征提取,经CEEMDAN分解后提出其IMF分量的能量熵,得到的能量熵构成了输入特征输入到LSTM中对模型进行训练,训练后的模型在测试集上进行性能测试。流程图如图2所示

图2 模型流程图

3实验验证

实验采用PHM 2012[14]数据挑战发布的轴承运行至故障数据集。数据采集自加速退化平台PRONOSTIA上,实验平台如图3所示。

图3 PRONOSTIA试验台

试验台水平和垂直放置两个加速度计,收集来自三种工况下的x和y两个方向的振动信号。采样率为25.6 kHz,每10 s记录0.1 s的数据。为安全起见,当振动数据幅值超过20 g (1g = 9.8 m/s2)时,停止实验。图四为三种工况下不同轴承的全寿命振动数据。

图4(a) 工况一轴承全寿命数据

图4(b) 工况二轴承全寿命数据

图4 不同工况下轴承全寿命数据

实验结果的评估采用三个性能指标,即平均绝对误差(MAE),均方根误差(RMSE),和

                                                      (13)

                                                  (14)

                         (15)

将数据集中的X轴信号和Y轴信号分别用CEEMDAN进行分解,各取前7阶IMF分量计算能量熵,图5为工况一全寿命数据CEEMDAN分解后的IMF分量,拼接后组成特征向量,维度为[n,14,1],每层LSTM之间添加BN层加快收敛速度,防止梯度消失和梯度爆炸,模型最终结构如图6所示。

图5 工况一轴承1的IMF分量图

图6 模型结构

模型中的优化器为Adam,Adam吸收了Adagrad(自适应学习率的梯度下降算法)和动量梯度下降算法的优点,既能适应稀疏梯度(即自然语言和计算机视觉问题),又能缓解梯度震荡的问题,可以根据历史梯度的震荡情况和过滤震荡后的真实历史梯度对变量进行更新。

Xavier普通初始化器用于初始化网络权值。学习率为0.001,小批大小为128,epoch为20。超参数设置如表1。

表1超参数设置

LSTM1

units=64

LSTM2

units=83,dropout rate=0.2

LSTM3

units=90,dropout rate=0.2

实验过程中采用交叉验证的方法,本文利用工况一和工况二的数据进行实验验证对于每种工况,均保留一个轴承用于测试时,其余的轴承用于训练模型,所有轴承都经过测试。图7为轴承1_5和轴承2_6的预测曲线

图7 (a) 轴承1_5以时域特征输入的寿命预测结果

图7(b) 本文方法轴承1_5的寿命预测结果

图7(c) 轴承2_6以时域特征输入的寿命预测结果

图7(d) 本文方法轴承1_5的寿命预测结果

图7 轴承1_5和轴承2_6的预测曲线

不同工况和不同模型下的实验最终结果如表2所示。

表2 轴承不同模型结果对比

时域特征训练的LSTM

本文

工况一

MAE

17.92

14.07

RMSE

21.13

17.34

0.62

0.87

工况二

MAE

24.17

20.61

RMSE

29.04

25.49

0.59

0.82

从图7和表2的结果比较可以看出,本文提出的方法优于将时域特征作为特征向量对LSTM训练的模型。

4、结论

(1)通过对轴承的振动信号进行CEEMDAN进行分解再求能量熵作为特征来对LSTM进行训练比端到端的对LSTM进行训练得到的模型更准确。

(2)滚动轴承的振动信号包含丰富的时频域信息,对其包含信息的充分挖掘,提取适当的特征是预测的关键,LSTM模型比一般的全连接网络有更好的处理时序数据的能力。

参考文献

[1]张小丽,王保建,马猛,陈雪峰.滚动轴承寿命预测综述[J].机械设计与制造,2015(10):221-224.DOI:10.19356/j.cnki.1001-3997.2015.10.057.

[2]李丹.轴承寿命预测方法综述[J].南方农机,2022,53(03):196-198.

[3]胡启国,何奇,曹历杰.采用EEMD-KPCA处理的IHHO-LSSVM滚动轴承寿命预测模型[J].华侨大学学报(自然科学版),2022,43(02):145-153.

[4]张氢,江伟哲,肖慧灵,孙远韬.基于LSTM的滚动轴承寿命预测[J].港口装卸,2021(05):1-5.

[5]王冉,周雁翔,胡雄,陈进.基于EMD多尺度威布尔分布与HMM的轴承性能退化评估方法[J].振动与冲击,2022,41(03):209-215.DOI:10.13465/j.cnki.jvs.2022.03.025.

[6]甄冬,田少宁,郭俊超,孟召宗,谷丰收.改进型EEMD和MSB解调方法及其在轴承故障特征提取中的应用[J/OL].振动工程学报:1-10

[7]许同乐,孟良,孔晓佳,苏元浩,孙砚飞.基于EEMD的ICNN故障诊断方法[J].北京邮电大学学报,2022,45(02):110-116.DOI:10.13190/j.jbupt.2021-128.

[8] Huang N E ,  Shen Z ,  Long S R , et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings Mathematical Physical & Engineering Sciences, 1998, 454(1971):903-995.

[9]胡爱军,孙敬敬,向玲.经验模态分解中的模态混叠问题[J].振动.测试与诊断,2011,31(04):429-434+532-533.DOI:10.16450/j.cnki.issn.1004-6801.2011.04.005.

[10] Huang N E . Ensemble empirical mode decomposition: A noise assisted dataanalysis method Center for Ocean land Atmosphere Studies[J]. Handbook of Systemic Autoimmune Diseases, 2006, 85.

[11] TORRES M E, COLOMINAS M A, SCHLOTTHAUER G, et al. A complete ensemble empirical mode decomposition with adaptive noise[C] // IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE, 2011 :4144-4147.

[12] Hochreiter, S, and J. Schmidhuber. “Long short-term memory.” Neural Computation 9.8(1997):1735-1780.

[13] Sussillo, D. (2014). Random walks: Training very deep nonlinear feed-forward networks with smart initialization.CoRR,abs/1412.6558. 248, 259, 260, 344

[14] Patrick Nectoux, Rafael Gouriveau, Kamal Medjaher, Emmanuel Ramasso, Brigitte Morello, Noureddine Zerhouni, Christophe Varnier. PRONOSTIA: An Experimental Platform for Bearings Accelerated Life Test. IEEE International Conference on Prognostics and Health Management, Denver, CO, USA, 2012.