基于极限学习机的在线参数更新方法及工业应用

王再辰，程辉，赵亮

（华东理工大学能源化工过程智能制造教育部重点实验室，上海 200237）

0 引言

在过去的几十年里，单隐层前馈神经网络（SLFNs）和支持向量机（SVMs）等核学习一直是计算智能和机器学习界感兴趣的核心研究课题。在线学习方法比传统离线学习方法在工业建模应用中更具优势。传统离线学习方法因为不能及时融入过程的非线性和时变特性，在工业建模应用中的受限较大。相比之下，在线学习方法具有更高的计算效率、更准确的预测精度，能够更好地跟踪时变特性。石脑油裂解制乙烯在化工领域有着重要的意义，但是裂解过程中伴随着焦炭的产生并不断地堆积在反应器壁上，使总传热系数降低，反应器的压降变高[1]，裂解炉的结构参数发生改变。因此在该问题上在线学习成为了更好的选择。过去SLFNs 的现实应用中，多数采用的训练方法为批量学习模式。当有新的实例可用时，批量学习模型通常将新的实例与先前训练的实例相结合以完成模型的重新训练。这样的过程十分耗时，尤其在数据量很大、不断有新的数据产生时，这种模式就会十分低效[2]。

在解决上述问题时，在线学习受到了广泛的关注。徐贵斌等提出一种基于在线神经网络的状态依赖型故障的预测算法（ONN-SDFP），实现了实时故障检测[3]。增量和减量支持向量机（IDSVM）[4]是基于在线序列核的算法，通过增量更新Karsh-Kuhn-Tucker（KKT）条件来维持最优SVM 解决方案，然而，支持向量的潜在无限增长可能会限制其在大规模问题上的应用。武晨等基于径向基函数（RBF）提出一种超级基（HBF）在线学习算法，实现了非线性函数逼近和动态系统在线预测[5]。

为了实现ELM 的在线学习，Huang G B 等提出了OS-ELM 算法，该算法是一种速度快、准确率高的学习算法，但由于其采用最小二乘法计算输出，带来了计算复杂度过大的问题[6]。Huang G B 等在2011 年提出了核超限学习机（KELM），相比支持向量机，KELM 在回归问题上有更好的稳定性和相似的泛化性[7]。Deng W Y 等在2016 年提出在线序列简化核极限学习机（OS-RKELM），该算法在简化计算复杂度的同时具备在线学习的能力，但是该算法的在线学习能力不强，模型适应度还有提升空间[8]。本文提出了带有遗忘因子的在线序列简化核极限学习机（Forget Operator Online Sequential Reduced Kernel Extreme Learning Machine, FOS-RKELM），在OSRKELM 的基础上加入遗忘因子，提高了最近学习数据对模型的贡献，增强了模型的在线学习能力。

1 在线序列简化核极限学习机算法

1.1 基于原型聚类预处理的RKELM 算法

假设有数据集Φ= ((x;ti),xi∈Rn,ti∈Rm)N，其中xi=[xi1,xi2,…,xin]T为网络输入，ti=[ti1,ti2,…,tin]T为网络输出。ELM 的网络结构可以描述为：

式中：G(αi,bi,x)为第i个隐含层节点的输出。构造最小化误差为‖H-T‖，通过求解H=T的最小二乘可以得β= (HTH)-1HTT，其中：H为隐层节点输出；T为标签。

文献[8]提出RKELM 随机选取支持矢量（选取数量小于样本数）作为隐层节点，构建的核矩阵在高维空间中取得了良好的效果，但在隐层节点较少时，部分支持向量可能相关性较大，造成隐层节点浪费和识别不稳定的问题。文献[9]中将聚类算法得到的聚类中心集即原型向量集的数目作为RKELM 的隐层节点数目，提出一种基于原型聚类预处理的RKELM 算法，有效解决了上述问题。经过原型聚类预处理的RKELM 算法计算得到的输出权重和输出函数为：

式中：yi（i=1,2,…,N）为聚类中心；KL为核矩阵。

1.2 OS-RKELM 算法

RKELM 算法的相关结论在OS-RKELM 算法上是依然可用的[8]，本文OS-RKELM 算法的离线阶段采用原型聚类预处理的RKELM 算法，网络的输出权重为：

式中：Z0=I C+K0TT0，K0为式（2）中的KL。

对于OS-RKELM 的在线学习阶段，第k批数据可以表示为：

式中：Zk=I C+。

2 在线序列简化核极限学习机算法

在线学习模型可以动态改变模型参数，达到实时预测的目的。对于在线学习序列，距离当前数据越近的数据对于模型的影响越大，本文首次在OS-RKELM 的基础上加入遗忘因子，提出带有遗忘因子的在线序列精简的核极限学习机（FOS-RKELM），提高了最近学习数据对模型的贡献，增强了模型在线学习的能力。

同理，递推矩阵Wk+1=Wk++1中加入遗忘因子并结合Wk+1=WkTk，有如下推导：

令Gk+1=，结合公式Zk+1=λZk++1，简化求解后得到如下公式：

如果此批数据只有一个，则：

FOS-RKELM 在线预测流程如图1 所示。

图1 FOS-RKELM 在线预测流程

在Mackey 和Glass 提出的混沌Mackey-Glass 微分延迟方程[10]上展开对比实验，方程的参数配置与文献[11]保持一致，除FOS-RKELM 结果外，其他结果来自文献[8，11]。Mackey-Glass 时滞混沌序列的输入数据集有4 个特征，输出为1 维，训练集数据为4 000 条，测试集为500 条。不同算法在Mackey-Glass 时滞混沌序列上的表现如表1 所示。从表1 可以看出，FOS-RKELM 在测试RMSE 方面有优异的性能。

表1 不同算法在Mackey-Glass 时滞混沌序列上的表现

3 工业应用

为了验证FOS-RKELM 算法对解决该问题的可行性，以某工厂1 台裂解炉作为建模对象，选取石脑油为进料原料，对比了多种不同算法在乙烯等产物收率的预测情况。

3.1 背景介绍

现代大型乙烯生产装置通常采用管式裂解炉对石油烃进行高温裂解，以制取乙烯。随着生产的持续进行，结焦层不断在炉管内壁积累，炉管内径逐渐变小、物料压降增大、物料流速增大、热效率降低。因此在实际工业生产过程中需要定期停炉清焦，保证裂解炉的正常运行。2 次停炉清焦的间隔即为乙烯裂解炉的一个运行周期。乙烯裂解炉结焦过程使裂解炉结构参数发生改变，在线学习算法更适合对乙烯裂解过程建模[12]。本文通过仿真模拟乙烯裂解炉的全周期过程，分析带有遗忘因子的在线学习算法的实用性。

3.2 模型应用过程

本文使用COLISIM-CRAFT 工业软件对裂解炉模拟后产生足量的数据供建模使用。首先进行炉管配置，即配置裂解炉的工艺尺寸包括管程数、管的长度、管的内径、管壁的厚度等。然后通过配置进料原料和操作条件作为裂解炉输入即可得到各种产物的收率。

COILSIM-CRAFT 是比利时根特大学与华东理工大学联合开发的裂解炉反应模拟软件。在裂解炉产物收率模拟计算中广泛使用了COILSIM-CRAFT 软件[13]，证明了仿真结果的有效性。

用于模型训练的输入变量由裂解工艺决定，依次为裂解炉出口温度（COT）、进料流量（Feed）、汽烃比（DHR）、初馏点（IBP）、终馏点（FBP）、正构烷烃比例、异构烷烃比例，数据集的输出为乙烯、丙烯等产物收率。通过给定范围的输入数据可获取不同输入条件下的各产物收率。各输入变量的范围如表2 所示，共获取乙烯裂解炉训练数据200 组。使用乙烯裂解炉数据集完成改进RKELM 算法的离线建模。乙烯裂解炉全周期数据通过COLISIM-CRAFT 对裂解炉的全周期仿真生成，全周期天数为30 天，每24 h 取一次数据，共获取2 组全周期数据。全周期数据输入条件如表3 所示。

表3 全周期数据输入条件

本仿真实验在乙烯裂解炉的全周期过程中，控制裂解炉的操作条件和进料组分不变，加入扰动环节，产生的全周期数据集只受裂解炉运行天数的影响；并且全周期数据集根据乙烯裂解炉运行时间排列，再送入训练好的模型中。

3.3 仿真结果分析

乙烯裂解炉在全周期数据下的模型应用流程如图2 所示。

图2 建模应用流程

将FOS-RKELM 算法与OS-RKELM、KELM、BP 和RBF等算法比较，以平均绝对误差为比较标准，其公式为：

式中：y(j)为真实输出；y′(j)为预测输出；N为样本总数。RKELM、BP 和RBF 算法隐层神经元数量对平均绝对误差的影响见图3。由图3 可知，RKELM 的原型聚类中心数目即最佳隐层神经元数量为14，BP 和RBF 的隐层神经元的数量分别为32 和17。FOS-RKELM 和OSRKELM 算法在离线阶段，可以继承RKELM 算法的最优隐层节点个数，在现学习阶段采用全周期数据验证遗忘因子的取值。FOS-RKELM 的值与MAE 关系见图4。本文在0.96≤λ≤1 范围内选取最优值，由图4 可知，最优值为0.978。在完成上述算法的参数调试后，为了直观地比较算法输出与真实值之间的误差，分别绘制了不同算法在线数据训练曲线和不同算法下的绝对误差曲线，如图5和图6所示。不同算法的MAE值如表4所示。

表4 多种算法的MAE 值

图3 网络隐含层节点个数与MAE 的关系

图4 FOS-RKELM 算法的值与MAE 关系

图6 不同算法的绝对误差曲线

由表4、图5和图6可知，FOS-RKELM算法的拟合效果最佳，与OS-RKELM、RKELM、BP神经网络和径向基学习机（RBF）模型相比，其平均绝对误差得到了有效的控制。

4 结论

本文针对乙烯裂解炉结焦过程导致乙烯收率预测准确性降低的问题，引入OS-RKELM 在线学习算法，并将原型聚类预处理方法以及遗忘因子加入OS-RKELM算法中，提出FOS-RKELM 算法。利用乙烯裂解炉结焦过程的全周期数据展开FOS-RKELM 算法与BP、RBF、RKELM 和OS-RKELM 算法对比分析实验。结果表明：对于FOS-RKELM 算法引入聚类算法优化简化核极限学习机（RKELM），提高了算法的稳定性；将在线学习方法进行乙烯裂解炉建模，提高了模型的适配度；添加遗忘因子提高了最近学习数据对模型的贡献，增强了模型的在线学习能力。

最后，使用乙烯裂解炉数据对FOS-RKELM 算法建立的裂解炉模型进行验证，结果表明模型符合精度需求。后续可以将FOS-RKELM 算法应用于乙烯裂解炉的控制平台中，以验证其正确性。