大数据分析下用电信息采集运维优化分析

(整期优先)网络出版时间:2020-06-10
/ 2

大数据分析下用电信息采集运维优化分析

安宇新

国网内蒙古东部电力有限公司阿尔山市供电分公司 内蒙古 兴安盟乌兰浩特市   137800

摘要: 用电信息采集系统是完成对电力用户的用电信息采集的系统。受到电力系统智能化水平的提升,智能电力仪表设备的应用范围更为广泛,直接应用到用电信息采集系统中,可有效实现对电力用户用电信息的采集,转变传统抄核收的方式,在便利居民的同时也有助于改善电力企业的电力服务。随着电力用户的增多、采集系统采集范围的扩大,使得数据的规模逐渐增多。大数据环境下,用电信息采集系统的建设,需得更新与转变。故此,文章对大数据环境下用电信息采集系统建设展开研究与分析,对当前用电系统采集系统展开分析,再对大数据环境下的用电信息采集系统建设进行分析,最后对建设过程中的关键技术展开分析,旨在确保用电系统采集系统的功能与效果,提升电力企业电力服务质量,推动电力企业发展。

关键词: 大数据环境; 用电信息采集系统; 数据并行处理; 建设

1 用电信息采集系统的相关概述

随着近些年用电量的数量逐渐增加、规模逐步扩大,在很大程度上增加了我国用电数据的采集量,并且也提升了用电信息采集系统数据采集以及数据分析的难度。但是随着近些年大数据技术的快速发展以及应用能够很好地处理用电信息采集系统实时数据量较大的问题。从相关文献以及实践中可知,满足IEC国际通信标准的大数据用电信息采集系统能够同时满足千万级用户的需求,可以高效稳定地实现用电信息采集方面的功能,例如远程参数配置、数据实时采集、电能质量检测、停电检测等,从而进一步提升对用电客户的服务质量。

2 大数据技术应用

2.1 数据的存储

大数据技术在信息采集系统中的应用,可以通过分布式存储方式有效解决数据丢失的问题,避免出现严重的经济损失。同时分布式存储能够支持集群数据实施流计算,能够确保计算数据的实时性。相对于集中式数据采集系统来说,分布式数据采集系统的可靠性更强、更具有可操作性。

2.2数据挖掘技术

大数据环境下,数据挖掘技术的重要性不言而喻,借助数据挖掘技术,可有效获得目标信息,排除无效信息,保障数据处理效果。在具体用电信息采集系统中,随着电力用户数量增多,所采集的数据信息也明显增多,将具体数据挖掘算法融入到系统中,提升系统效果,为相关决策和管理提供数据支持,综合提升电力企业的电力服务质量提升。具体的数据挖掘中,研究报文日志,可完成对设备状态信息的分析,并确认设备是否处于良好的运行状态,为用电信息采集系统和电力系统的设备维护提供参考。此外,借助数据挖掘技术,可展开用电预测、反窃电分析等,全面推动电力企业的电力服务水平提升,实现电力企业的市场竞争力提升。

2.3 数据计算

数据计算是实现系统构建的关键,常规数据计算,可分为离线计算与实时计算两部分。其中离线计算是以Hadoop 为基础,实时计算则是建立在Storm 的基础上。传统计算机分析和处理,是在完成数据采集和整理后,存储到数据库中,之后在按照需求实施数据搜索,这属于一个相对高效的方式,然而其属于一个紧绷接口,可会造成时间浪费。而Hadoop 则是一个具有扩容能力强、成本低廉和运行效率良好、稳定可靠的效果,能够满足系统的计算需求。

3 大数据背景下用电信息采集系统建设

用电信息采集系统的总体架构主要包括3个部分,分别为采集对象、通信信道、系统主站等。传统的系统主要架构的读写较为集中,这就造成了数据库非常大的压力,从而使得很多报表分析等不能按时完成。而在大数据技术的支持下,用电信息采集系统的主站架构可以采取分布式计算方式与传统关系型数据库并存的方式,将Hadoop分布式计算框架当作现有主站系统的补充,从而提升系统的整体性能。在大数据技术的应用下可以将原有数据库进行扩展,形成生产数据库、业务应用库、历史数据库、大数据分布式集群所形成的全新架构。可以对业务实施必要的分割,形成符合传统数据库架构运行的事务处理业务以及满足大数据技术机构的分析统计业务,这样就能够有效缓解生产数据库的压力。

3.1 生产数据库

除了主站原有生产数据外,将其他功能进行剥离,只是进行系统采集数据的入库所用。生产数据库的重点在于数据的写入、业务操作以及数据查询(这些数据要和现场具有比较强的交互,具有较高的时效性)等方面,例如电价的巡检、实时费控等相关业务。一般情况下生产数据库可以储存3~6个月的数据。

3.2 业务应用库

业务应用库的作用在于数据的应用以及统计分析,不同于生产数据库的写入操作,业务应用库重点在于数据读取和上层的数据统计分析,从而建立起其他业务系统的统一数据接口。正常情况下此库所存储的数据主要有所有的档案数据、和生产数据库同步的原始采集数据、统计分析计算所得报表数据(主要是分布式计算所得)等。为了确保数据的准确性、可用性、及时性,要确保业务应用库的数据要和生产数据库的数据实时同步。

3.3 历史数据库

通过历史数据库的建设能够有效缓解生产数据库、业务应用库数据方面的压力,能够防止由于数据量较大的影响而造成的数据分析计算性能的降低。正常情况下历史数据库只需要保留业务应用库之前的原始采集数据即可。同样也要确保历史数据库和业务应用库的数据同步,一般可以采取存储过程定时抽取、ETL数据抽取等方式来进行。

3.4 大数据分布式集群

此部分的主要作用在于分析并计算数据存储层的基础数据内容,从而为上层业务的应用提供必要的数据支持。首先要通过前置采集服务器集群进行电力用户用电信息数据的采集,之后将其写入到大数据分布式集群进行相应的分析计算。

4 用电信息采集运维优化方法

4.1运维智能化派发与异常工单分析处理

从海量用电信息采集运维数据和历史数据进行多角度分析,判别各类采集设备异常的严重等级,输出用电信息采集运维效用值模型,采用该模型判定异常处理的优先顺序。具体过程如下所述:通常情况下,对于单个用电信息采集设备效用值来讲,主要受抄表日天数,运维异常持续时间以及当月平均用电量等影响。

通过对用电信息采集运维历史工单进行多角度、大数据量分析,发现不同维度下异常工单发生较大概率的异常原因,综合分析不同维度下相同异常原因所占概率,输出单一异常原因概率比重,对比不同异常原因相应比值的大小,对未来阶段类似异常情况起到预分析,提升用电信息采集运维效率。新生成的采集设备运维异常工单,可依据电能表设备类型、出产厂家多角度分析其异常原因发生几率, 确定运维作业异常工单产生的原因,并对比相应比值大小,预测出运维作业新异常工单可能的异常原因。

4.2通过运维难度系数模型的构建实现运维优

为了有效分配用电信息采集运维资源,引人用电信息采集运维优化难度系数, 其综合考虑运维工作人员# 担未成功采集电表数目、给定区域内运维人员分担电表数量,通过分析用电信息采集运维优化难度系数与用电信息采集成功率之间的关系,合理分配运维人员,使用电信息采集成功率达到稳定,实现运维优化。

结语

本文研究分析大数据环境下,用电信息采集系统的建设,先对当前电力企业用电信息采集系统现状进行分析,再在大数据环境下,对具体的用电信息采集系统的功能需求和设计要求进行阐述。研究具体的系统架构,解读具体系统模块使,从而明确系统的整体意义与价值。最后,综合分析大数据环境下用电信息采集系统建设的关键技术,分别对数据计算和数据挖掘的架构进行阐述,从而促使系统满足大数据环境下用电信息采集系统的建设需求,全面推动电力企业的电力服务质量和营销效果。

参考文献:

[1] 牟颖莹.用电信息采集系统大数据在电能表时钟管理研究中的应用[J].南方农机,2018(8):15-17.

[2] 刘亚骑,张昌栋,韩为民.大数据环境下的用电信息采集系统建设[J].自动化与仪器仪表,2018(5):18-19.