青岛瑞源环保科技有限公司,山东青岛
摘要:电力工程数据的处理与分析因其数据规模、数据复杂度与数据处理手段等因素一直是相关学科的难点问题。本文从基于人工智能技术的数据挖掘算法出发,通过构建模糊神经网络模型,完成数据的预处理,并介绍参照仿真对象建立数据模型的手段,以期为数据技术的实际应用与工程管理的学科结合提供参考。
关键词:人工智能;电力工程;数据处理;模型建立
引言:我国电力工程的基础设施建设一直处于世界前列,而因地域跨度大、技术跨度大、发展不平均等因素,我国电力工程网络存在数据规模庞大、数据复杂度高、数据特征值表现形性不强等问题。伴随着信息化技术与人工智能技术的发展,新时代新形势下的学科结合思想为电力工程数据处理带来了崭新的解决方案。
1数据挖掘算法
电力工程数据的处理有着数据规模大、数据噪声多、特征值选取困难的特点,这是因为电力工程的数据多数是根据电力网络实际的运行情况进行记录与存储的,在这个过程中受制于工作环境与器材设备,常会导致数据失真、丢失、混淆等情况,严重影响了数据分析工作的推动进程。使用传统数据分析手段即便能得出一定的分析结果,数据结果起到的指导作用与其耗费的人力物力相比也显得较为有限。而借助基于人工智能技术的大数据挖掘手段,能对庞杂的日志数据进行整理、压缩与再构筑,完成对有效信息的提炼与获取[1]。综合考虑运行成本、后续升级与运行环境,本文以k-means算法作为主要数据挖掘算法,并将算法运行流程划分为抽样管理、数据整理、数据转化、模型挖掘与成果评估五个环节,在这个过程中数据将完成从相对离散的数据集到目的性特异输出数据的转化,为实际决策提供指导。
在开始计算后,首先需要使用k-means算法在原始数据集中的n个数据中随机选取a个作为初始聚类中心,然后将数据集中的其他数据根据与选定为初始类中心数据的距离进行分组,在初步完成整理后计算各个分组的平均值,对簇中心进行更新,然后继续分组活动,直到相对离散的数据集的测度函数逐渐收束,完成数据的初步挖掘。通过这一步操作,能获得电力工程数据的模糊系统参数与模糊规则参数,进而可以建立模糊神经网络模型。这个过程中需要注意各个模糊数据集之间的隶属函数计算与数据输出的准确度,并按照一定规则对子网络的隶属度参数进行标识。在充分对模型内代表不同隶属规则的子网络进行训练后确定最终输出,完成有规律、有特征的数据挖掘。
2工程数据预处理
在对电力工程的数据进行分析处理的过程中,一个重要的环节就是对数据分析过程中涉及到的大量数据信息进行分层、过滤与筛选。这个过程要求在保证原有数据集数据特征与信息特点的同时,将噪声数据、无用数据进行排除,避免其对工程数据属性分析的劣化影响,以此完成对具有特异性数据属性的数据集合的提纯获取。因工程要求与学科特性,电力系统的数据存储一般以数值的形式进行,数据在进行存储时一般将日志数据记录作为数据的值,而日志记录的单位则作为数据的一个属性,因此在对工程数据进行分层、过滤与筛选等预处理时,可借助人工智能技术,使用数学层面的统计方法来进行相关操作。本文综合考虑分类错误概率与分类风险,选用贝叶斯分类器作为数据预处理工具。
贝叶斯分类器的统计分类原理是将数据集看做一个整体对象,通过相关数据分析出该对象的先验概率,并经过贝叶斯公式计算出对象的后验概率,得出该对象具体属于某一类的概率,通过对对象属于不同类的概率进行比较后,将后验概率最大的类作为该对象的所属,从而完成分类。在进行实际应用的过程中,可利用高斯分布函数对贝叶斯分类器的后验概率计算公式进行修证优化,在完成计算后将各个数据节点的属性进行评估与规范化,从而完成数据的预处理操作。例如在对电力工程的数据利用贝叶斯分类器进行分类时,输入集若为{电压强度,线路回数,传输距离,地形系数,线路长度},输出集则为{运输工程,基础工程,架线工程,附件工程}。
3数据模型的建立
在通过各类型的数学统计手段对电力工程数据进行分层、筛选、排除等预处理后,不难发现因为电力工程数据在属性字段上的多样性,输入数据集与输出数据集均具有较多元素,切并不一一对应,简化为数学问题后即可发现电力工程数据的分析属于多元素非线性映射问题,这也符合自然发展与工程技术的普遍规律。因此在进行数据分析模型的建立时,相关工作人员可采用模糊神经网络算法作为数据处理的手段,从而完成电力工程的决策指导模型。模糊神经网络算法在处理电力工程数据这种大规模、高难度、结构复杂的数据有着独到的优势,一方面它具有神经网络的优点,能通过大规模并行操作与弹性拓扑保证高效、快速、强适应性的计算进程;另一方面得益于模糊理论在外延上的不确定性,进一步加强了系统的智能程度,保证了运算过程中的容错率,在处理工程数据这一类非线性工程问题上有着卓越的优越性
[2]。综合上文,模糊神经网络算法的流程是将输入属性利用k-means算法进行初步分类并按照所属进行存储划分,而后在利用神经网络进行训练的同时,借助数据统计手段对工程数据进行预处理,之后结合模糊神经网络模型网络的输出结果,将输出集进行整合,完成模型的构建,并在提取出数据规则后进行预测。
4模型仿真
模型仿真作为实现数据评估的最终阶段,在基于人工智能技术的电力工程数据分析过程中处于最为关键的地位。在模型仿真这一环节中,相关工作人员需要根据数据预处理的结果与数学化统计方法计算出的结果利用模拟神经网络对隶属度函数进行调整,在迭代计算后获取隶属度输出,并根据隶属度输出,在进行规则提取后对相关模拟数据进行计算,从而完成模型仿真。通过将模型仿真结果与实际值进行比较,一方面借助相对误差的计算可以根据相应规范标准确定数据分析处理结果的准确度,分析技术应用与理论建设等方面存在的问题;另一方面可以利用模型仿真过程中提取的特征数据、规则数据等对现有经营模式进行反馈,并为后续的建设工作在宏观角度上根据输入输出结果提供决策支持,对电力产业的工程建设、风险管控、资金流动、设备应用等日常生产活动有着极为现实的指导意义;除此之外,在仿真模型建立完成后,产业技术人员可根据电力网络运行过程中不断产生的工程数据对模型进行进一步的完善,从而实现产业数据完善模型,模型决策指导产业的良性循环,进一步加强我国电力产业对人工智能等高新技术的应用程度,促进学科融合在数据分析、产业管理、工程建设方面的进一步发展。
结论:通过借助人工智能技术的部分模型构建思想与数据处理手段,能有效排除噪声数据对数据整体特征的影响,挖掘出更有利用价值的数据,利于产业相关模型的建立,为相关决策与产业发展提供宏观意义上的指导。相关研究人员应加大研究力度,促进学科融合,为我国电力工程新时代新技术形势下的发展贡献力量。
参考文献:
[1]陈霆,陆明媛,顾群等.基于人工智能技术的电力工程审计系统研究[J].电子设计工程,2019,27(16):15-19.
[2]王向东,黄朝晖,武剑等.人工智能技术在电力系统状态估计的应用研究[J].自动化与仪器仪表,2020(3):179-183.