基于云计算的电力运行大数据异常值快速检测算法

(整期优先)网络出版时间:2021-01-11
/ 2


基于云计算的电力运行大数据异常值快速检测算法

张利伟 1杨斌 2

1杭州余杭水务控股集团有限公司 浙江省杭州市余杭区 311100;2杭州极能科技有限公司 浙江省杭州市余杭区311100

摘要:现阶段随着信息化的发展,智能电网的建设的全面开展,在电力系统运行、监控、管理等流程中产生了海量的且种类繁多的数据,即大数据。目前宣城供电公司变电站作为宣城电网中绝大部分电气设备的集合体,站内设备繁多,内部连接关系复杂。及时把控每台设备的运行状态,对设备的后期检修、工程技改及提高地区的供电可靠性尤为重要。但以目前的监控手段及信息获取方式,面临着数据量庞大、数据复杂度高、数据信息量冗余、多个系统之间数据无关联的弊端,常规的数据分析手段难以达到对各个变电站的供电性能进行快速、准确、有效的评估,所以加强基于大数据的调控运行数据的统一分析管理是很有必要的。

关键词:云计算;电力运行;大数据异常值;快速检测算法

引言

在大数据时代下,如果想要优化电力信息技术,就要加强对信息技术安全体系的建立,让数据平台得到真正的优化,从而满足电力行业发展的实际需求。从目前来看,电力行业已经逐步开始利用数据分析和数据平台,结合不同的数据挖掘技术,开展行业工作,但其中还存在一些问题有待解决。

1电力企业运营中的大数据概述

目前来说,我国部分电力企业已建成并拥有生产、GIS、投资计划、项目、物资、基建、财务、营销、人力资源、客户全方位等一批信息化管理系统,实现了业务全覆盖,并构建资产全生命周期管理、客户全方位服务等的企业管理体系。然而从企业管理的角度分析,目前的信息化平台建设仍有不足之处。首先,企业级运营管控体系缺少总体规划,各业务系统的核心数据未实现整合和应用,无法为企业管理层带来客观准确的业务定位、管理对象、监测及分析方法。其次,面向公司领导,企业经营指标等数据仍采用手工上报方式,无法实现指标的实时监控。最后,平台缺乏集约能力,无法合理地运用现代化技术去充分展示公司良好形象。因此,为提升电力企业运营效率和效益,需要结合国际先进的云大物智移技术,搭建专业级的数字化运营管理工具。

2云计算的电力运行大数据异常值快速检测算法分析

2.1随机矩阵理论建模

随机矩阵理论是基于电力系统运行过程中输出的各种不同种类的数据信息为样本,利用统计学原理对计算的电力系统数据信息的特征进行提取,计算各种数据类型特征之间的关系,通过这些关系的研究,衡量电力系统运行过程中容易受到某些因素的制约,用户在使用过程中,最大程度地避免这些影响因素。进而发现电力系统工作过程中存在的各种问题,为了更为准确地分析电力系统运行中的各种数据信息。

2.2监控的数据类型

电力运营监控系统主要监控的数据类型有电力企业的基本数据、电力企业的运营数据,电力企业的管理数据。其中,基本数据是指电力运行过程中出现的大量数据,包括电能、电量以及电压等信息。运营数据是指电力企业产生和执行业务过程中出现的数据。管理数据是指ERP和协助办公及企业一体化平台的数据。电力运营监控中心对其大量数据进行分析、整理、总结和处理,并提出解决对策,促进电力企业的发展。

2.3利用大数据完善电网的智能预警功能

大数据时代下,建立智能化电网是未来发展的必然趋势,有关工作人员要抓住这一机遇,构建出大数据运行框架,继而实现智能化网络控制,为国民提供稳定的电力供应服务。传统的电网运行方式已经无法满足新时期对电力行业提出的要求,建立起智能化的管控平台,提高管理数据的实效性是现阶段重视也是提高企业经济效益的关键。在实际发展过程中,电网人员需要掌握电网的整体运行情况,及时发现电网中可能存在的问题,在第一时间做出相应的处理。必要时,还要针对某些问题,建立完善的预警模式,让电网运行框架更加完善,为电力供应奠定基础。比如:某电力企业借助大数据技术,挖掘出电网数据中的关联性,打造出共享平台,让电网适应未来发展需要。不仅如此,该电力企业还建立了规范化的数据库以及数据平台架构,在系统中还加入了云计算技术,实现大范围数据采集和仿真计算。利用这一技术能够在第一时间对可能存在的隐患进行预警,有效预防电网事故,将停电的可能性降至最低。未来,智能化网络控制结构还会得到进一步发展,管理水平也会得到升级,真正实现电力信息技术项目。

2.4可视化技术

平台利用unity3D、css3,ThreeJs技术实现全景展示的3D建模渲染与首页星空旋转、内容进场动效、模块切换效果、界面点缀动效等视觉动效,大幅提高页面的性能与用户体验。同时,通过大屏系统的单时钟处理技术,保障所有信号在系统主时钟的控制下同时输出,实现拼接屏间图像完全同步、影像清晰。在拼接屏上可显示两个或多个信号源图像,完成在任意显示画面上叠加、裁剪、分割、拼接其他画面,形成画中画的显示效果。

2.5总体架构

系统采取多层分布式技术架构,从技术和功能实现上将整个系统架构分为:外部数据层、数据接入层、数据层、服务层与应用层。外部数据层:主要从前置采集机采集SCADA/OMS/PMS/电能量等系统中的一次设备台帐数据、负荷数据、电能量一次设备台账数据、表计数据、PMS一次设备台帐数据。数据接入层:包括数据抽取服务、数据转换服务和数据质量校检服务,分别获取外部的数据,和对数据进行清洗、质量校检,自动判断数据的正确性并转换为系统特定的数据格式。数据层:存储了系统的所有数据,主要包括抽取来的原始外部数据;被清洗、质量校检、转换后的模型数据;系统自动生成设备间联动数据;支撑系统运行的配置数据;另外,除保存原始的实时数据外,将通过实时数据分析服务对实时数据进行的计算数据,用于业务应用功能。数据处理层:为承载业务应用功能所需的基础服务,包括基础的数据管理服务;对设备台帐数据、负荷数据进行关联;按照预先设定好的模板进行。业务应用层:提供设备台账管理/设备状态分析/电网负荷检测/风险趋势预警/异常设备分析等业务功能。

2.6电力运行大数据获取

电力运行大数据异常值快速检测算法研究的首要环节是获取电力运行大数据。由于本算法主要针对电网的发、输、变、配、用电等5个电力运行环节的数据进行异常分析,这些环节的电力运行数据储存在不同数据源当中,因此需要进行集成。电力运行大数据的集成获取主要通过数据仓库技术来实现完成。数据仓库的目的是构建面向分析的集成化数据环境,为电网企业提供决策支持,而数据仓库发挥作用的关键则是ETL。ETL是数据仓库的流水线,也可以认为是数据仓库的血液,它维系着数据仓库中数据的新陈代谢,而数据仓库日常管理和维护工作的大部分精力就是用于保持ETL的正常和稳定运行。但是不同性能的数据仓库使用的ETL也不同,不同的ETL具有不同的特点,使用时需要根据具体情况而定,在这里不进行具体分析。

结语

为了提高电力运行的安全性,需要对电力运行大数据异常值进行检测,但传统检测算法的检测准确性较低,导致电力运行存在严重的安全隐患,因此,提出一种基于云计算的电力运行大数据异常值快速检测算法。该算法利用模糊C-均值聚类算法实现异常数据与正常数据的分类,从而实现异常值检测。最后经验证,比传统异常值检测算法测准确性和效率均有显著提升。

参考文献

[1]林志坚,杜旭昕,黄朝凯,等.电力企业基于准实时数据电价异常分析的设计与应用[J].电子设计工程,2017,25(22):58-61.

[2]马娟娟,潘泉,梁彦,等.基于改进Grassberger熵随机森林分类器的目标检测[J].中国激光,2019,46(7):230-238.

[3]李永攀,门锟,吴俊阳.基于低秩模型的电力状态数据异常检测[J].计算机工程与应用,2019,55(16):255-258.