罗贤峰,何 宇,刘仲富,余振源,窦宇骁,孙兆荣

(中国民航大学,天津 300300)

随着民航运输业的高速发展,发动机作为飞机的核心部位对飞机的飞行安全及适航有着至关重要的作用。发动机电气附件的数据获取,传输以及运作和电气线路的完整性对航空发动机的正常运行有着重要的影响,而发动机电气附件的性能测试及预测成为了一个难题,能否快速测试分析电气附件的性能衰减状况和后期的预测,对发动机的维修效率有着巨大的影响。目前,发动机维修采用分立仪器对部分电气附件进行测试,测试时间长、效率低、存在人为差错,难以达到全覆盖测试,且在维修间隔期间,电气附件的性能难以监测,存在安全隐患,可能对发动机和维修人员造成潜在危险。对此我们通过该软件系统开发,并结合到硬件系统之中,形成一套完整的测试系统实现发动机整机电气附件的静态测试,形成全覆盖的数据测试,为发动机进一步性能测试提供有力的技术支持,为飞机安全高效运输提供有效保障,该系统的实现打破了传统对部分电气附件的测试方法,除去人工的测试部分,通过对标准大数据的采集,训练更加高效精准的测试与预测出所需要的电气附件数据。

LSTM神经网络作为一种特殊的RNN网络有着良好的训练与学习能力,众多学术研究者利用该神经网络在数据及器件性能预测方面展开了深入的研究。王鑫等[1]提出了基于LSTM循环神经网络的故障时间序列预测,发现LSTM模型相比典型时间序列预测模型,其拟合和预测性能整体更优;相比于RNN等循环神经网络,其拟合和预测精度整体更高。陆继翔等[2]利用CNN-LSTM混合神经网络模型在短期负荷预测中的应用,发现当LSTM输入数据是以时序序列的特征向量时,LSTM网络模型能较好地拟合负荷数据的时序性和复杂非线性关系。彭燕等[3]在基于LSTM的股票价格预测模型与分析中,发现适宜的LSTM网络层数和前馈网络层隐藏神经元个数可使股价数据预测准确率大大提高。武丽芬等[4]基于RNN模型与LSTM模型的机器作诗研究中对比了两种预测模型在建立时间序列数据间的非线性关系时的结果。RNN网络在训练过程中,随着递归层数的增加和计算梯度下降容易出现梯度爆炸和梯度消失的问题,只能处理短期依赖问题,而LSTM模型从神经单元的结构出发大大优化了上述问题,说明了LSTM在解决长期依赖问题方面明显优于RNN模型。张明岳等[5]RNN与LSTM方法用于滑坡位移动态预测的研究中指出LSTM算法结构更为复杂,精度更高,误差控制范围更小,两者训练时间LSTM明显多于RNN,说明LSTM在大量数据参与训练的情况下,训练及预测结果更为可靠。

本文提出运用LSTM长短期记忆神经网络训练构建一套预测模型用于测试发动机电气附件性能。在发动机电气附件庞大数据输入的前提下,该预测模型利用LSTM对数据进行记忆训练可大幅提高数据预测精准度,有效缓减了一般RNN循环网络的梯度爆炸和梯度消失问题。本次实验会将所得数据预测值与实际值作对比检验其预测精准度。

1 LSTM基本工作原理

LSTM是RNN-循环神经网络的一种演化形式,RNN(Recurrent Neural Network)[6]网络一般包含输入层,隐藏层和输出层,但是由于其在处理数据量较大的分析与预测时,可能会遗漏开头部分重要数据信息[7]使预测结果不准确,并且存在梯度爆炸和梯度消失的问题,导致其不具备良好的长期学习能力。当训练RNN模型时需要预先确定延迟窗口长度,然而实际应用中很难获取这一参数的最优值。1977年,霍克赖特首次提出了长短期记忆网络单元利用LSTM中的记忆细胞代替了一般网络中的隐藏层结构有效缓解了RNN网络的上述问题。一般的循环神经网络对于序列输入都是所有前序输入与当前输入的堆叠,但是RNN网络对所有前序输入没有选择性。而实际情况下,当前输入所决定的输出值可能只与(LSTM)模型前序输入中的某个值有关,而与其他值无关,或者相关性很小。为此LSTM通过对记忆单元的门处理,用更行门(Γu)遗忘门(Γf)以及输出门(Γo)来限制记忆细胞单元的值,从而来表示序列输入的相关性。相关公式如下:

式中,W[a,x]是简化表达,表示相关a,x参数堆叠后与相应权重参数相乘,c~<t>是来自上一层的记忆信息,Wu.f.o是相关参数的参数矩阵,Γu,f.o是用sigmoid函数得到的门值,bu.o.f是偏置参数,x<t>是当前输入的序列值,c<t>是当前输出的记忆信息,a<t>为当前序列输入产生的激活值,被用于下一次输入。不同于传统RNN,它是门输出值与记忆细胞的激活值相乘的结果。如图1所示。

图1 LSTM网络单元结构

当多个序列输入时,就是图1 LSTM单元相连的逻辑表示,如图2所示。

图2 LSTM网络单元相连结构

2 预测模型的设计与构建

2.1 设计思路

由于飞机在飞行过程中各部分的运行是具有一定关联性的,例如:飞行速度、空速、风速、飞行高度的变化等与发动机各部分运行具有一定关联,利用数据之间的关联性将使得算法在学习过程中更好地提取到数据特征,从而在很大程度上提高预测的精度,所以在本项目中主要体现为使用风速、飞行高度、发动机转速,飞行速度等数据作为训练数据,对发动机增压比(EPR)进行预测。具体设计思路为:使用某型飞机发动机从启动到停车过程中各项数据的记录以及发动机之外的其他数据的记录作为训练数据导入LSTM神经网络进行训练。包括飞行速度、发动机转速、空速等共计23项数据,完成训练后,对发动机增压比(EPR)等多项发动机指标进行预测,最后将预测值与实际值对比以检验该模型的准确性并对该模型做出评价。

2.2 数据的选取及预处理

现有主流机型均对飞机在飞行过程中各部分的运行有着详细且真实的记录,本项目将以某型飞机在一段航线共计203 min飞行中各个传感器所记录的数据(每秒记录一次)为实验数据。实验数据为时间序列,选取其中有关联的23列输入训练网络进行训练学习,每个时间序列即每个指标选取其中5 900个数据,23项共计135 700个数据。将其中某个单一序列的85%作为训练数据与其余22项数据一同作为训练数据导入LSTM神经网络进行训练,剩余15%作为测试数据参与预测,本文选取发动机增压比为预测对象进行数据预处理。

(1)数据归一化

为获得较好的拟合并防止训练过程发散,将训练数据标准化为零均值和单位方差,公式如下:

(2)反归一化

预测结束后,需根据先前的参数对预测值数据进行去标准化,公式如下:

式中,yk为归一化(反归一化)后的数据,ymean为数据均值,ystd为数据单位方差。

2.3 构建模型架构

本文所提出模型核心思想为多序列输入训练,单序列输出预测,通过这种方法可以在省去训练之前数据特征提取的同时完成训练与预测。该模型共有6层,分别为:输入层、LSTM层、全连接层1、丢弃层、全连接层2、回归输出层,具体模型如图3所示。

图3 模型流程图

关于模型中每层的解释如下:

(1)输入层

读取数据集中23个时间序列的数据并进行归一化预处理。

(2)LSTM层

该层的作用为学习导入各序列数据中各时间步长之间的长期相关性。

(3)全连接层1

综合LSTM层所学习的结果进行特征输入丢弃层。

(4)丢弃层

通过设置合适的丢弃率解决过拟合问题。

(5)全连接层2

综合丢弃层的数据特征输入回归输出层。

(6)回归输出层

对预测结果进行输出。

2.4 网络参数设置

飞机发动机电气附件的变化是由多方面因素影响的复杂非线性过程,故定义LSTM网络的初始化状态对整个训练过程有至关重要的作用。首先,设置网络的初始参数:网络中隐藏单元个数影响着训练效果,需要通过设置合适的隐藏单元数来降低误差,根据数据的特性与复杂程度利用转换函数将LSTM层的隐藏单元数定义为200,同时隐藏单元数还需要小于N-1(N为训练数据样本个数);后续为一大小为50的全连接层和丢弃概率为0.1的丢弃层;将学习率定义为0.001,每经过1 000步长,学习率衰减0.1;阈值为1以防止梯度爆炸。然后在以上参数的基础上定义大小为25的小批量进行400轮训练。

3 发动机增压比(EPR)预测

3.1 网络评价指标

本文研究目的是对航空发动机的各项运行指标进行预测,着重对发动机增压比预测。本文将以均方根误差(RMSE)和平均相对误差(MAPE)作为网络的评价指标进一步验证模型的精确程度,RESE和MAPE二者数值越小则表明预测值越准确,模型性能越优越。

具体公式如下:

式中,n为样本数据个数,yi为数据实际值,为预测值。

3.2 预测结果分析

发动机增压比(engine pressure ratio)是指涡扇发动机中压气机出气口与进气口的总压之比,公式如下:

其关乎到飞机发动机的运行状态以及燃油消耗效率。本次预测使用的是实采于某型航空发动机的发动机实际运行中增压比数据记录,为一时间序列。平稳飞行阶段实测与预测值的对比曲线图如图4所示。

图4 平稳飞行阶段预测值与实际值曲线图

可见使用LSTM所预测的结果与实际值基本符合,也验证了该网络用于时间序列预测的优越性以及在本项目中的高度适用性。上述预测的数据选取自飞机进入巡航高度后的较平稳飞行阶段,为进一步验证该网络的普适性以及准确性,再选取飞机起飞阶段的部分数据进行预测。起飞阶段的预测值与实际值对比曲线图如图5所示。

图5 起飞阶段预测值与实际值曲线图

观察图5所绘曲线可知该模型对于变化较为复杂的情况,虽然在部分时间点有数据预测偏差,但仍然在数据改变时刻能够预测其变化趋势及其走向,也具有较好的攀附性。

由表1可知,对飞机不同飞行阶段的预测具有很高的准确度。0~0.5 h的均方根误差为0.522 0,0.5~1 h的均方根误差为1.121 7,1~1.5 h均方根误差为1.426 5,由此可见该模型对于数据的预测虽有一定误差但仍具有较高的准确性。MAPE平均相对误差在3个时间段内均小于0.1,且随时间的变化逐渐减小,0.5~1 h与1~1.5 h两个时间段内均小于0.01,以MAPE为评价标准时,此模型具有相当高的预测精准度。

表1 不同飞行阶段的RMSE与MAPE值

同机型飞机在其他航线飞行数据预测对比,如图6所示,此部分数据选取自起飞一段时间后。去除起飞时部分奇异值后,此模型对于短序列有部分预测偏差,但是起飞一定时间后,预测性非常准确,这说明此网络的鲁棒性和稳健性很好。综合来看,网络对数据依赖性较大,同时对长期序列数据具有较大依赖性,对于其他不同于此环境的飞行情况、飞行高度、气流、天气因素等等预测都会有一定影响,此网络预测准度也必然会略有下降,同时对于某些情况值会出现准确度丢失,但对于一般飞行参数,此网络仍然有参考意义。

图6 其他航线预测对比

4 结束语

基于LSTM的航空发动机静态预测模型的设计,克服了航空发动机维修过程中电器附件性能难以检测,使用人工分立测试效率低,时间长等实际存在问题。该系统运用了LSTM(长短期神经网络)作为训练模型,解决了一般RNN网络无法长期学习和储存记忆的问题,其不仅开发周期短,设计成本低,还可快速集成测试和进行性能预测,及时监测到电气附件的性能衰减情况,方便为进一步的航空发动机维修提供指导策略,大大缩短了测试及预测时间,确保了所得数据的准确性与可靠性,解决了传统测试方法所存在的误差比较大等问题。