成都航利 (集团 )实业有限公司,四川省 彭州市 611930
摘要:航空发动机技术越来越复杂,性能指标要求越来越高,加大了航空产品的研发和修理难度,传统修理模式越来难满足现在修理的要求,需要从“传统修理”到“数字预测修理”变革。为提高某型发动机加力调节器的装配速率,对多年来积累的加力调节器数据进行算法分析和机器学习建模,通过模型的训练得出模型参数,进而得出加力调节器的关键性能参数,再对加力调节器的整体性能进行数字化预测。加力调节器数字化仿真系统的应用,降低加力调节器装配过程选件的时间,减小维修延迟,节约维修成本。
关键词:数字预测;修理;数据模型;仿真
Keywords:digital predictive; repair; data model; simulation
1研究背景意义
“航空产品,质量第一”,坚持产品质量第一,优化提产品修理效益,进一步提升修理质量。数字化仿真是一门基于控制理论、系统论和信息技术的多学科综合技术[1],利用模型对实际过程进行模拟,辅助修理产品。从数据中获取有价值的隐含的关系,必须对数据进行对比分析,首先要做的就是对数据进行有效的收集。近年来,随着信息技术的推进,对多年来积累的数据进行数字化处理,通过传感器收集数据,为后期数字仿真修理提供了很好的发展机会。在航空发动机修理过程中,加力调节器有至关重要的作用,加力调节器在装配过程中,精度高、重复实验次数多、测量数据多,导致效率不高、工作量大、需要人员多,装配过程中不同部件组合对加力调节器的性能影响大,严重影响发动机的装配效率。针对该问题,提出了一种某型加力调节器的数据挖掘分析模拟仿真系统,首先得对收集的数据进行规范化处理,再通过python语言编写算法构建数字化模型,然后对长期积累的规范化数据集进行数据模型训练,最后得出加力调节的关键性能参数。为验证模型的有效性,开发一个加力调节器的数字化仿真系统,通过输入关键数据验证系统是否达到预期性能。加力调节器数字化模拟仿真系统采用绝对误差和均方误差评价,绝对误差为0.0038,均方误差为0.0052,达到较好的要求,应用上降低了重复装配次数、节约装配时间,提高了装配效率。
2数字化仿真系统总体设计
系统的总体设计是软件体系成功的关键,加力调节器数字化仿真系统由软件部分和硬件部分组成。硬件部分由加力调节器、传感器、测量器具、计算机;软件部分分为3层结构,由数据存储[2]、数据计算、数据展示层组成。数据存储层的作用相当于数据库,由训练数据集、测试集组成,训练数据集的作用是模型的训练,测试数据集的作用是验证训练集训练的模型;数据计算层的作用是编写算法模型,加力调节器数字化仿真系统采用python语言编写的算法,界面开发采用tkinter框架。模型的训练主要是对训练数据构建向量矩阵,计算各属性列的相关性,通过解矩阵向量获得属性列的系数向量矩阵。数据展示层主要实现与用户的交互的功能,用户通过输入关键数据到训练模型,点击模型优得到最终预测结果。加力调节器数字化仿真系统总体设计结构如图1.1所示:
图 1.1
3数据挖掘分析相关概念
数据挖掘(Data Mining,DM)是知识发现(Knowledge Discovery in Database )的过程[3]。数据挖掘是指一个从海量的数据资源中发现人们事先不知道的,在实际应用中隐含的有效的具有潜在价值的知识和信息。数据挖掘手段就是通过各种聚类算法、分类算法、关联规则[4]等方法发现数据间的关系,航空产品数据量大,结构复杂,直观视觉不能发现的信息以及数据间的关系,数据挖掘的目的就是发挥数据承载的价值,数据与数据的关系。数据挖掘的对象大多是来自数据库中结构化、半结构化和非结构化的数据[5],数据格式参差不齐、缺乏完整性,增加数据处理的难度。数据挖掘是一门非常重要的知识发现技术,数据规模越大,表现的规律性越强,数据中隐藏的价值的信息越高[6]。数据挖掘广泛应用在银行、新闻、市场营销和广告领域,并展现了他的实际应用价值。从海量的航空产品数据中发现有用的信息,为产品的修理提供支持性修理意见,对提高产品修理效率有非常关键的作用。
4数字化仿真系统功能实现
加力调节器数字化仿真系统主要实现的功能有数据采集、模型预测、预测数据对比,数据采集由传感器获取数据和用户输入数据两种方式,用户输入数据运行模型后会把数据保存到训练数据集,以增加数据的规模;模型预测是计算输出的数据得到预测结果;数据清洗后进行模型的训练,再应用数据分析技术,预测数据对比是去最后8条数据的预测结果实际结果进行对比,展示趋势,交互式系统界面如图1.3所示:
4.1 数据采集
数据采集又称数据获取,传感器数据采集是通过在线测量系统终端,自动测量仪器自动采集各种的数据。自动采集器可以有效降低个人读取数据的误差,使数据更加完整,误差更小的真实数据,保证数据的准确性。由于采集的数据种类多,各种数据格式不统一,单位不一样,需要对数据清洗,规范处理,再进行有效的存储。
4.2数据模型训练
数据训练是应用机器学习、统计分析等方法对前期准备好的数据进行建模,在试验过程中,将清洗后的数据按照1:5的比例分为测试集和训练集,训练集数据用于模型的训练,数据模型采用多元线性模型,首先计算数据向量的相关性,得出多元线性模型的相关系数,作为模型的相关性系数,实现对预测集数据的预测计算。
4.3 数据可视化及预测
数据可视化是将数据用统计图的方式呈现,给人以直观的感受,用于传递信息。折线图能更真切的反应实际值与预测值得变化趋势,试验过程中分别取测试数据的实际值与预测值分别作曲线对比图,如图1.2所示:
图 1.2
如图1.2所示,横轴表示某型令号发动机的加力调节器部件,纵轴表示该部件的值,与该部件的其他参数有关;红色实线表示该部件的实际测量值,波动较大,蓝线表示该部件的预测值,趋于稳定。因此,在装配过程中,可以调换不同部件,使测量值趋于稳定。
图 1.3
如图1.3所示,为系统的交互式界面,有9个相关测量项目,其关联性系数是该项压差的关联性大小,通过输入9个测量值,生产令号和实际压差,点击数据模型优化,计算出压差预测值,同时把该令号的测量值保存到后台数据集中,纳入训练数据集,优化各项的关联系数并实时更新。
4.4数据模型评价
验证模型的有效性,通过绝对误差和均方误差来评价该模型,绝对误差是衡量预测值与实际测量值的绝对值,均方误差反映预测量与实测值之间差异程度的一种度量;通过实验数据计算该模型绝对误差为0.0038,均方误差为0.0052,两者的值越低,说明该模型预测的准确率越高,模型性能佳。
5总结
本文通过对加力调节器的参数数据进行分析,发现数据间存在一定的关系;因此采用多元线性模型对数据进行初步分析,首先进行数据的收集,再对收集的数据确定关键影响属性,最后进行模型的训练,得出数据间的关联系数,并对验证结果进行预测。分析多元线性模型的绝对误差和均方误差,都能得到很好的效果,对前期装配过程有很好的指导意义,降低装配过程所需时间,提高装配效率,后面计划就用神经网络继续深入研究,进一步提高效率。
参考文献:
[1]李秀娟,甄冒发,徐振峰.“控制理论与仿真”模块教学的改革与探讨[J].教育现代化,2019,6(36):57-60.
[2]王东旭,沈益民,王志强.用B-P神经网络模型预测ERP的安全供货库存[J].计算机应用,2001(03):53-55.
[3]于福生. 基于用户Web访问日志聚类的推荐算法研究与应用[D].大连海事大学,2017.
[4]刘玲,王冠. 可视化技术在分类算法中的应用研究[C]. 中国运筹学会智能计算分会.第四届中国智能计算大会论文集.中国运筹学会智能计算分会:清华大学数学科学系,2010:123-126.
[5]高明,陆宏治,梁雪青.电力系统非结构化数据处理方法研究[J].现代信息科技,2019,3(17):9-11+14.
[6]赵文,霍旭轮.数据挖掘技术在高校网络运维管理中的应用研究[J].电脑与电信,2018(07):64-67.