梁昌侯,龙 华,李 帅,周 筝,严北斗

(1.昆明理工大学信息工程与自动化学院,云南 昆明 650500;2.大唐云南发电有限公司,云南 昆明 650011)

0 引 言

近年来,随着风电场的不断发展,风力发电在全球范围内已经成为一种广泛使用的可再生能源。然而,由于风力发电的不确定性和不稳定性,对其进行精确的功率预测有利于维护电力系统的稳定性,优化风电发电计划,从而促进可再生能源的发展,实现可持续发展。

随着国内外对风电功率预测研究的不断深入,对风电功率预测方法已不局限于以往的物理法和统计法[1],基于组合预测模型已逐渐成为提高风电功率预测精度的重要方法。文献[2]中采用距离分析法对数据集中的特征进行选择,再结合LSTM 模型对风电功率进行预测。 针对风电功率的时变特性,文献[3]将卷积神经网络(CNN)和门控循环单元(GRU)组合在一起,用来对超短期风电功率进行预测,进一步探索风电时间序列波动特征的潜在信息。谢小瑜等人提出了一种基于注意力(Attention)机制的小波分解-双向长短时记忆网络(WBiLSTM)超短期风、光发电功率预测方法[4]。文献[5]中提出一种融合深度学习算法的风力发电功率预测方法,旨在解决预测精度低的问题。史加荣等人提出了一种新的风电功率预测方法,该方法采用鲁棒回归(RR)和变分模态分解(VMD)技术,结合长短时记忆模型实现[6]。文献[7]中使用数值天气预报数据,通过深度学习神经网络算法建立数值天气预报与风电功率之间的转换模型,并利用概率密度函数对风电出力概率区间进行预测。文献[8]中提出一种组合变分模态分解(VMD)、声搜索(HS)算法和最小二乘支持向量机(LSSVM)的短期风功率预测方法用来改善预测精度。文献[9]中提出一种基于EEMD-PSO-SVM 的短期风电功率组合预测模型,以解决风电功率预测精度不高的问题。

本文提出了一种基于MIC-VMD-GWO-LSTM 的短期风电功率预测方法。首先采用最大互信息系数法(MIC)选出与功率相关性高的特征变量,减少数据冗余;再利用变分模态分解(VMD)将风功率序列分解为不同频率的模态,抑制了模态混叠;将分解后的功率分量和选择出的特征变量输入到LSTM 网络中进行预测,并利用灰狼优化算法对模型的参数进行优化;最后将各模态的预测结果求和重构,得到最新的预测结果。

1 模型原理

1.1 MIC 特征提取

最 大 互 信 息 系 数 法(Maximal Information Coefficient, MIC)[10]不仅可以描述变量间的非线性关系,而且能够公平地量化大型数据集中的统计关联。鉴于最大互信息数法具有普适性和公平性,使用该方法来分析气象参数和风电功率之间的相关性。

在有限集合D⊂R2中,随机变量X和Y的数据点集合分布在二维空间中,将变量X划分为x个子区间,将变量Y划分为y个子区间,得到x·y个矩形网络。设DG为集合D中的数据点在网格G上的分布,从数据中估计互信息值I(DG),如下所示:

对于给定的两个正整数x和y,它们的最大互信息记为:

标准化最大互信息值I*(D,x,y)得到矩阵M(D),如下所示:

由于M(D)x,y∈[0,1],将最大互信息系数记为MIC(D),如下所示:

式中:B(N)表示网格划分上限,且B(N) =Nφ,N为数据样本个数,常数φ(0 <φ<1)的取值可根据经验或规模设置。

1.2 变分模态分解

变分模态分解(Variational Mode Decomposition,VMD)[11]是一种完全非递归的信号分解方法,它可以自动识别信号中存在的不同频率和时间尺度的特征,并将其分离出来。VMD 将时间序列y(t)分解为k个模态uk(t),每个模态uk(t)的中心频率为ωk,其目标是使得每个模态的估计带宽的和最小,约束条件是模态和等于输入信号。为了估计每个模态的带宽,建立如下变分优化模型:

为了找到最优解,引入拉格朗日乘子τ(t)和二阶惩罚因子α,将约束变分问题转化为无约束变分问题。构造的增广拉格朗日函数表达式如下:

利用交替方向乘子法(ADMM)来更新各分量及其中心频率,最终得到最佳解,所有的分量都可以根据下式的傅里叶变换得到:

式中:ω表示频率;、和分别对应的是y(t)、uk(t)和λ(t)的傅里叶变换。

更新中心频率:

最后更新拉格朗日乘子:

式中步长τ>0。

变分模态分解的迭代更新过程的主要步骤如下:

步骤1:给定时间序列y(t),初始化模式{uk}、中心频率{ωk}以及拉格朗日乘子λ(t)。

步骤2:根据公式(7)更新u^k(ω),k= 1,2,…,K。

步骤3:根据公式(8)更新ωk,k= 1,2,…,K。

步骤4:根据公式(9)更新λ^(ω)。

步骤5:重复步骤2~步骤4,如果满足停止条件,则终止迭代,输出;否则,转步骤2。

最后将上述迭代过程输出的进行傅里叶逆变换,得到uk(t)。

1.3 灰狼优化算法

灰狼优化算法(Grey Wolf Optimizer, GWO)[12]是一种启发式优化算法,受灰狼社会行为的启发而来。GWO结构中,首先需要对狼群进行不同分级,依次标记为α、β、γ、ω,其中α狼是狼群中的最优个体,其次是β狼和γ狼,其余的个体则为ω狼。内部等级由高到低,逐级下降。在狩猎过程中,α、β和γ狼负责引导和指导,而ω狼则服从高等级狼的指挥来完成捕猎任务。灰狼等级示意图如图1 所示。

图1 灰狼等级示意图

算法中的狼群捕猎行为可以分为如下3 个步骤:

1)跟踪目标,并追逐、接近猎物,将其围猎行为定义为:

式中:t表示灰狼群的迭代代数;tmax为最大迭代代数;(t)表示当前灰狼目标所处位置(t)和(t+ 1)分别为受(t)影响前后,各灰狼的所在位置向量;和是系数向量;a为收敛因子,其值在迭代过程中由2 逐渐下降到0为范围在[0,1]的随机向量。

2)灰狼包围猎物,将猎物限定在一定范围内且使其不再逃跑。

3)攻击猎物。由式(15)~式(17)综合判断出猎物的移动方向,通过不断迭代搜索,寻找全局最优解。

GWO 算法流程如图2 所示。

图2 GWO 算法流程

1.4 长短期记忆网络

长短期记忆(LSTM)神经网络[13]是RNN[14]的一种特殊变体形式。LSTM 网络比普通的循环神经网络在更长的序列中对长时间传递下来的信息进行筛选,更能挖掘时间序列的潜在规律,可以将较长时间之前的信息带给后面时间步长的细胞,利于预测时间间隔较大的信息,有较大的记忆容量。对于风电功率序列的随机性、突变性和长依赖性,LSTM 神经网络更适合用来做风电功率预测。LSTM 单元包含了记忆单元的状态以及三种门控制结构:遗忘门、输入门和输出门,基本结构见图3。

图3 LSTM 网络结构图

在图3 中,ht为t时刻的隐藏层向量,ct为t时刻的记忆细胞状态,σ为sigmoid 激活函数。输入门it、遗忘门ft、输出门ot的计算公式如下所示:

式中:Wi、Ui为输入门的权重矩阵;bi为输入门的偏置项;Wf、Uf为遗忘门的权重矩阵;bf为遗忘门的偏置项;Wo、Uo为输出门的权重矩阵;bo为输出门的偏置项。

在t时刻,记忆细胞更新状态为:

储存新细胞状态信息的候选值为:

式中:Wc、Uc为候选状态的权重矩阵;bc为候选状态的偏置项。隐藏层状态信息计算公式为:

2 MIC-VMD-GWO-LSTM 短期风电功率预测模型设计

2.1 MIC-VMD-GWO-LSTM 模型构建

本文提出一种基于MIC-VMD-GWO-LSTM 的组合模型进行风电功率预测,模型整体架构如图4 所示。

图4 预测模型框架

MIC-VMD-GWO-LSTM 组合预测模型主要包括以下部分:

1)数据预处理。由于原始风电数据存在异常值和缺失值,若直接采用原始数据进行风电功率预测,会导致预测结果误差偏大。因此,需要对原始数据进行预处理,采用四分位法对功率异常点进行识别,提高数据的质量。

2)MIC 特征选择。分别计算不同特征与功率之间的最大互信息系数,根据系数大小进行特征选择。

3)VMD 功率分解。采用VMD 将不稳定的风电功率分解为几个相对稳定的子序列,从而提高预测的精度。

4)基于GWO-LSTM 功率预测。针对功率分解后的各分量以及选取后的特征量构造LSTM 预测模型,并引入GWO 智能优化算法,得到网络模型的参数,优化预测模型。

5)预测结果。将每个分量的预测结果重构,得到最终的功率预测。

6)误差分析。通过误差评判指标对预测结果进行分析,并对模型性能进行评判。

2.2 评价指标

为了评估预测结果的准确性和可靠性,需要采用有效的方法进行评价。目前,最常用的误差评价指标有平均绝对百分比误差(MAPE)、平均绝对误差(MAE)和均方根误差(RMSE)等,计算公式如下:

式中:n表示样本量;i表示第i个样本;yi表示第i个样本的实际值表示第i个样本的预测值。

3 实例分析

为验证文中所提模型的优越性,采用云南某风电场中的一个风电机组在2019 年8—10 月共8 832 条的风电数据进行研究,相关信息为:数据集包括功率、风速、风向、温度、湿度、压强6 个维度,采样间隔为15 min。本文划分前90%的数据用于训练模型,后10%的数据用于测试。

3.1 MIC 特征选择结果

利用最大互信息系数法分析风电数据集中气象属性与风电功率之间的相关性,计算结果如表1 所示。

表1 气象属性与风电功率之间的互信息系数

根据表1 可知,风速与风电功率的最大互信息系数为0.87,而风向、湿度、温度、压强的最大互信息系数均低于风速。选取最大互信息系数前3 的特征变量作为后续预测过程中的输入变量。

3.2 基于VMD 的风电功率分解结果

为了进一步挖掘风电功率数据在时间序列上的细节特征,利用VMD 进行分解,结果如图5 所示。

图5 原始功率以及各分量曲线图

从图5 可以看出,u1、u2、u3、u4、u5、u6是经过VMD 对风电功率序列进行分解后的结果。每一个子序列都携带着原始序列的不同细节特征,其中序列u1是原始功率序列在低频上的变化趋势,而最高频率的u6反映了局部波动率的趋势。这种分解技术不仅保留了原始风电功率序列的特征,还抑制了模态混叠。

3.3 MIC-VMD-GWO-LSTM 模型预测结果

将经过MIC 和VMD 处理后的数据代入到GWOLSTM 预测模型中进行预测仿真。

通过GWO 对LSTM 模型进行训练,获得最优模型参数,隐藏层1 单元数为45,隐藏层2 单元数为32,学习率为0.073,迭代次数为28。使用优化后的预测模型进行预测,结果如图6 所示。

图6 MIC-VMD-GWO-LSTM 模型预测结果

由图6 可以看出,预测值非常接近真实值,说明MIC-VMD-GWO-LSTM 预测模型在对时间序列数据的预测中有很好的预测效果。为了进一步验证MIC-VMDGWO-LSTM 算法的预测性能,将该模型与其他预测模型的结果进行比较。各预测模型的误差评估结果如表2所示。

表2 各模型预测性能指标

从表2 中模型的预测误差可以看出:

1)单一预测模型的预测效果最差,其中误差最大的是BP 模型,其MAE、RMSE 和MAPE 分别为91.61 kW、105.60 kW 和52.14%。

2)经过VMD 处理后再预测的VMD-BP 模型相较于单一BP 模型的MAE、RMSE 和MAPE 分别降低30.68%、32.42%和7.73%;VMD-LSTM 模型相较于单一LSTM 模型的MAE、RMSE 和MAPE 分别降低47.54%、57.26%和18.58%。VMD 对预测效果的提升明显,这是因为VMD有自适应和完全非递归的特点,所以其鲁棒性更强、分解效果更好。

3)结合GWO 智能优化算法对VMD-LSTM 模型的参数优化后,预测精度进一步提升。VMD-GWO-LSTM模型的预测误差相较于VMD-LSTM 的MAE、RMSE 和MAPE 分别降低了53.02%、19.85%和12.56%;相较于单一的BP 和LSTM 模型,MAPE 分别降低43.16% 和31.14%。这是因为经过GWO 智能优化算法对LSTM 的超参数优化后,模型的学习效果得到改善,预测性能有所提升。

综上所述,LSTM 模型比BP 神经网络模型的预测效果好,并且使用VMD 分解后预测效果改善更显著;引入GWO 优化算法对LSTM 寻优并结合VMD 对风电功率预测,预测精度进一步得到提高,说明该方法能够有效改善功率预测的精度,更有利于电网安全稳定。

4 结 论

本文利用MIC 进行特征变量选择,降低数据冗余的同时也使得选出的特征变量具有更高的训练价值;然后利用VMD 将风电功率序列分解为不同频率的子序列,使其趋势更为平稳,将子序列与特征变量代入到LSTM进行训练,并引入GWO 算法优化模型的参数。仿真结果表明,经过特征选取、功率分解以及超参数寻优后的模型与LSTM、VMD-LSTM 模型查比,有明显的预测优势,较小的预测误差。