国网繁峙县供电公司 山西忻州 034300
摘 要:目前,很大部分电力管理系统只停留在业务处理层面,这一模式不能为电力企业提供更加便利、智能的决策。长期以来,我国电力企业在行业信息化建设中积累了大量的历史数据。将数据挖掘技术引入电力行业,进行电力分析和决策,为电力企业提供更加科学的管理决策,对预防、控制和化解电力企业的生产风险具有现实意义。介绍了数据挖掘的具体方法及其在电能质量分析、输变电管理、负荷预测和电网智能调度中的应用。
关键词:数据挖掘;负荷预测;输变电;电能质量
随着科技和工业的飞速发展,数据挖掘技术也在飞速发展。传统的分析技术和手段已不能满足实际需要。随着数据挖掘技术在电力设备故障诊断中的应用,不仅提高了故障诊断的质量,而且提高了故障诊断的效率。因此,本文深入分析了数据挖掘技术在电力设备故障诊断中的应用,为同行业的研究提供必要的依据。
一、数据挖掘技术综述
随着我国科技信息化水平的不断提高,数据挖掘技术也在迅速发展。数据挖掘技术在我国许多领域得到了广泛的应用,并取得了良好的应用效果。数据挖掘又称数据采矿,主要是指技术人员通过不同的算法对海量数据进行分析,得到隐藏的信息,这也是数据知识发现的重要内容。计算机技术与数据挖掘有着密切的关系。同时,数据挖掘涉及到搜索算法、建模技术、理论技术、人工智能、模式识别和统计等多个方面的知识。目前,数据挖掘技术在电力设备故障诊断中发挥着重要作用,大大提高了电力设备故障诊断的效率和质量。
数据挖掘技术的出现主要有两个原因:(1)随着我国计算机相关技术的快速发展,计算机信息技术在许多企业中发挥着重要作用,大大提高了数据的采集、存储和处理能力。(2) 虽然企业中存在大量的数据,但决策者需要从海量的数据中获取有价值的信息,即数据虽然丰富,但缺乏有效的信息。数据挖掘技术成为信息与数据之间的桥梁。数据挖掘的一般过程包括以下方面:
(1) 数据选择。从数据仓库或数据库中选择与挖掘过程任务相关的数据集,作为数据挖掘的基础,这一步非常重要。在无效数据空间中进行挖掘会大大降低数据挖掘的功能,同时会产生冗余数据,影响数据挖掘的结果。
(2) 数据预处理过程。对样本数据的集中处理包括去除噪声、删除无用数据、填充丢失域、保持数据的正确性和完整性以及对定时数据的排序和合并。
(3) 数据转换。转换数据以适应挖掘算法。
(4) 数据挖掘。作为系统的核心部分,采用智能方法提取数据模式。
(5) 解释。解释和评估数据挖掘的输出,以便用户能够理解。
(6) 综合分析。通过对前一步所获得的知识进行分析,处理和检验它们之间的关系,在实际的加工过程中也要检验上述步骤的有效性和正确性。
目前,数据挖掘在我国电力企业中的应用并不广泛。它在电力系统中的应用主要包括以下几个方面:电力系统负荷预测与分类、电力设备状态评估与分析、设备监测与故障诊断等。
二、安全需求分析
2.1信息安全形势监测
电力企业的营销、生产和管理信息系统很多。这些系统的安全稳定运行,直接关系到企业的正常运行和经济效益,也关系到国家和社会的基础设施和民生需求。这些信息系统一旦受到攻击或存在安全风险,不仅会对公司的运营和发展产生重大影响,还会给国民经济和基础设施造成损失,严重威胁电力系统的安全运行。因此,迫切需要对公司的信息安全状况进行实时监控和可视化,以便及时预测和防范风险。
2.2安全报警相关性分析
目前,用于安全监控和防御的各种安全系统和安全设备都是独立的。每种安全系统和设备只对特定类型的安全事件进行监视和防御,缺乏对公司安全状况的全面控制,更没有对安全事件进行联动分析,预测新的风险。因此,需要将各种安全系统和设备采集到的日志信息、网络流量等数据进行整合,利用大数据分析技术结合安全信息和资产数据库进行相关性分析,快速发现潜在的攻击过程,配合专业分析团队进行人工分析和处置,及时遏制威胁扩散。
2.3安全事故分析与处理
当发生安全事故时,公司目前采用离线处理方式,监控人员将直接通知相应责任人进行处理。这种事件处理模式既不利于安全事件的及时反应,也不利于对处理过程的严格控制。因此,该平台需要提供一套完整的安全事件处理流程,以增强安全事件调查处理能力。
三、大数据挖掘技术在审计中的应用
3.1 主要数据挖掘算法介绍
聚类分析是一种重要的数据挖掘算法,它是将所有数据对象划分成不同的子集(簇)的过程。其目的是使同一个簇中的对象尽可能相似,而不同簇中的对象则截然不同。聚类算法属于无监督学习方法,由于数据对象不提供类型标签信息,因此只能通过观察来学习,不能通过实例来学习。聚类可以发现数据的内在本质和规律,为进一步的数据分析提供依据。主要的聚类分析方法有分区法、层次法、密度法和网格法。
3.2 数据挖掘过程
一般来说,数据挖掘过程包括三个阶段:数据准备和数据预处理、数据挖掘模型构建、模型应用和评价。
基于数据挖掘的电力信息系统网络安全态势评估过程与性能测试
4.1网络安全态势评估过程
(1) 建立了较为完善的电力信息系统网络安全状况评价指标体系,收集了电力信息系统网络安全状况的历史样本。
(2) 确定了电力信息系统网络安全状况的评价指标权重。
(3) 根据电力信息系统网络安全态势评估权重,对历史样本进行有效处理,从而得到电力信息系统网络安全态势评估训练集和验证集。
(4) 同时,根据上述指标,学习了电力信息系统网络安全态势评估训练集。
(5) 根据交叉测试的方式获得电力信息系统网络安全状况评估结果,如果不能达到标准,就需要调整以上参数,然后继续学习。
(6) 开展电力信息系统网络安全态势评估模型的构建,并对验证样本进行测试分析。
4.2态势评估过程测试分析
(1) 由于AHP法属于线性分析法,不能有效地反映电力信息系统网络安全状况的随机性,因此用AHP法评价电力信息系统网络安全状况的准确率最低,错误率最高。该方法在电力信息系统网络安全状况判断中存在较大缺陷;
(2) 由于BP神经网络方法具有很好的非线性学习能力,能够有效地描述电力信息系统网络安全状况的变化,因此与AHP方法相比,BP神经网络方法具有很好的非线性学习能力,BP神经网络方法能够有效地描述网络安全态势的变化,神经网络方法大大提高了电力信息系统网络安全态势评估的准确性,能够有效地降低电力信息系统网络安全态势评估的误判率。但是,由于电力信息系统网络安全态势评估样本相对较少,采用BP神经网络方法进行电力信息系统网络安全态势评估会存在“过拟合”现象,评估精度也最高;
(3) 然而,利用支持向量机建立的电力信息系统网络安全态势评估模型具有更多的优点,能够更准确地反映电力信息系统网络安全态势变化的特点,能够有效地降低误判率。因此,与AHP和BPNN相比,采用支持向量机的电力信息系统网络安全态势评估方法具有更高的准确性。
结语:
总之,作为我国的基础企业,数据挖掘技术在大数据时代的良好应用,将明显提高电力系统的稳定性,为我国经济发展创造良好的环境。
参考文献:
[1]黄松,尚颖,马薇,吴婷婷.大数据挖掘技术在电力审计风险防范中的应用研究[J].中国内部审计,2020(05):32-39.
[2]周庆兰.大数据时代下数据挖掘技术在电力企业中的应用研究[J].计算机产品与流通,2019(12):86.
[3]傅世权.大数据时代下数据挖掘技术在电力企业中的应用探讨[J].信息记录材料,2019,20(11):128-129.