大唐滨州发电有限公司 山东省 滨州市256600
邮寄地址:山东省滨州市滨城区滨北办事处梧桐五路516号18981651854
摘要:本论文以东营风电场为试点,结合风电场历史风速数据、象心力预报数据和天玑预报数据,对比多模型得出预测准确率较高的N-BEATS预测模型,在此基础上提出N-MRDS模型,并结合相同数据集进一步进行参数组合寻优,得出更精准的预测模型,为中期预测准确率提升提供支持。
关键字:风功率预测 模型 算法寻优 准确率
0引言
随着全球能源需求的不断增长和气候变化问题的日益严重,可再生能源已经成为缓解这些挑战的关键策略之一。风能作为一种广泛可利用的可再生能源,得到了广泛的发展和应用。风力发电已经成为减少温室气体排放、减少对传统化石燃料的依赖的有效手段[1]。
风能是新能源利用的主要来源之一,具有较高的间歇性和随机性特点,在风电行业其功率预测的不可预见性明显,既增加了电网安全性风险,也增加了当前电力市场环境下的交易风险,提高风功率预测准确度成为风电行业必须面对的重点、难点和痛点,亟待突破[2]。
风力发电的不可预测性主要由风速的时空变化引起,这使得功率输出具有高度波动性[3]。为了解决这一问题,准确的风力功率预测变得至关重要[4]。中期功率预测,即数小时到数天的预测,对电力系统的稳定运行和电力规划至关重要。因此,提高风电场中长期功率预测的准确性和可靠性已经成为可再生能源领域的关键研究方向之一[5]。
本课题以东营风电场为试点,分别对象心力和中科天机的预测数据结合东营风电场历史数据进行深度学习预测模型寻优和算法优化工作,得出可靠的参数提高中期预测准确率,为新能源场站适应电力现货市场交易提供有效数据支撑。
1.深度学习预测模型应用现状
随着深度学习技术的发展,尤其是神经网络领域的进步,深度学习在风电场功率预测中引起了广泛的兴趣[6]。深度学习模型具有处理大规模数据和学习复杂非线性关系的能力,这使它们成为风力功率预测的有力工具。应用较为广泛的深度学习模型主要如下。
自回归移动平均模型(ARIMA)是一种时间序列分析中常用的统计模型,用于对时间序列数据进行建模和预测,包含自回归(AR)和移动平均(MA)两个组成部分,以及差分(I)的阶数,因此称为"ARIMA",主要目的是捕捉时间序列数据中的趋势、季节性和周期性,并用这些信息来进行未来数值的预测[7]。
Informer 的设计目标之一是有效地处理长序列数据。它采用了多种机制,包括自注意力机制,以捕捉时间序列中的长期依赖性,同时减少计算复杂性。结合了全局和局部的注意力机制,以便在保留全局依赖性的同时,可以更好地捕获局部模式和趋势。可以适应不同长度的时间序列,而不需要在训练时固定输入序列的长度。这使得它非常适用于可变长度的时间序列数据[13]。
深度学习方法在风力功率预测中取得的成就是显著的,但它们仍然面临一些挑战,如模型过拟合、数据不平衡等问题。因此,进一步研究深度学习模型的改进和优化是未来研究的重要方向。
2.数据采集及处理
本论文选用市场主流气象厂家象心力何中科天玑的天气预测数据,选择东营风电场作为试点,选用适宜的模型进行气象数据对比分析,得出中期预测模型适宜的参数模型,从而提高预测准确度。
2.1数据采集
东营风电场历史数据,从风电场监控系统中获取2022年2月至3月的5分钟平均风速数据。象心力天气预报数据,提供关于2022年10月份东营风电场周边天气情况预测数据,包括风速、温度、湿度等气象参数未来预测,时间颗粒度为1小时。中科天玑天气预报数据,提供的关于2022年10月份东营风电场周边天气预报数据,包括有关风速的预测信息。
2.2数据处理
在进行数据应用前,首先将东营风电场的历史异常数据进行处理,先后进行去除异常点或采集空缺点、数据按时间戳对齐、热力图、数据划分等处理,更有效用于深度学习模型的训练和测试。
2.2.1数据清洗
为使模型训练和测试更加有效,首先将传感器故障或其他问题导致的缺失或异常的数据点进行清洗,清洗前和清洗后的对比情况发生变化,清洗后的数据明显集中度更高,且大风速时刻的异常点已得到较好清洗,避免模型训练异常。
2.2.2数据对齐
东营风电场历史风速数据、象心力和天玑天气预报数据通常采集和报告的时间点不完全相同,为更好的进行比较和整合,本论文对采集的不同时间序列的数据按时间戳进行对齐处理,如图2所示。
图2.不同时间戳数据的对齐处理情况图
2.3特征工程
从原始数据中提取风速、温度、湿度等气象参数特征以及时间戳信息供深度学习模型使用,在使用过程中充分考虑了滞后特征,以帮助模型更好的捕捉时间序列。
2.4数据分类
为更好的训练和测试深度学习模型,需要将数据划分为训练集和测试集,主要是将大部分数据用于模型的训练,保留一部分数据用于模型的测试和验证。
上述数据采集和处理是确保后续深度学习模型能够利用历史数据和天气预报数据进行中期风力功率预测的关键。
3.模型选择
为实现中长期风力功率预测,本节对比分析了多种模型,包含机器学习模型以及深度学习模型,将多种模型在处理后的数据集上进行对比试验,根据试验结果选出最优基础模型,在此基础模型上进行模型优化。主要对比分析模型有自回归异动平均模型、多层感知器、循环神经网络、长短时记忆网络等,详情如下:
3.1基础模型选择
将上节划分的数据分别套用到上述模型进行训练测试,对预测模型在不同气象数据的预测准确率结果进行比较评估。通过不同数据组成的训练效果来看,历史数据结合天玑预测数据生成的数据集能提供更佳的训练效果。此外,通过基础模型对比试验可以得出,N-BEATS模型的预测效果最好,且在仅使用天玑天气预报时效果达到最优,因此选用N-BEATS作为基础模型,并在此基础上进行模型优化。
3.2基础模型参数优化
基于提高预测准确性目的,在N-BEATS模型基础上提出N-MRDS模型。N-MRDS模型是为进一步加强N-BEATS模型对序列数据的特征提取能力,在信号输入模型前,通过多速率采样方法,以不同速率捕捉输入信号的不同频率成分,将信号的不同频率成分重构为模型输入。此外,N-MRDS模型允许将预测分成多个不同频率和尺度的部分,从而在预测任务中实现更精确的分块,根据数据划分进行参数优化,通过比较不同参数配置下的试验结果,分析不同参数设置对试验结果的影响,有助于确定哪些参数对模型准确率最为关键,找到最佳参数设置,提高性能、准确率。
4结果和分析
使用相同周期的历史数据结合合天玑预测数据生成的数据集,使用N-BEATS模型和N-MRDS模型进行测试,采用预测准确率作为评估标准,加入象心力功率预测结果进行比较,
由预测结果可见,相较于象心力预测的89.87%和N-BEATS模型预测的91.07%,N-MRDS能获得更准确的功率预测效果,预测准确率较前两者分别高出1.44个百分点和0.24个百分点,此外,在试验过程中,通过对比象心力与天玑预测数据,除历史功率数据外,影响模型预测结果准确度的主要因素是预测风速数据,相较于象心力预测的风速数据,天玑预测的风速数据准确度更高,因此结合天玑预测数据的数据集在模型训练中能提供更大增益。
5.结论
本文对比分析多预测模型,在N-BEATS预测模型基础上提出了N-MRDS模型,结合象心力和天玑预测数据对比分析,得出影响预测准确度的主要原因是预测风速数据,同时可知天玑数据的准确度的相对较高,可为中期预测准确率提升提供更好的支持。
参考文献:
[1]房方,姚贵山,胡阳等.风力发电机组数字孪生系统[J].中国科学:技术科学,2022,52(10):1582-1594.
[2]罗永建,刘承锡,董旭柱.基于深度强化学习架构的多能互补微网日前经济调度研究[J].武汉大学学报(工学版),2023,56(11):1393-1404.
[3]侯倩,郝晓光,金飞等.基于混合深度学习的风电功率预测及一次调频应用[J].热能动力工程,2023,38(10):167-175.
[4]黄峰,喻跃林,扈菲宇等.基于IVMD-CS-LSTM的超短期风电功率预测算法设计[J].湖南工程学院学报(自然科学版),2023,33(03):1-7.