王青宁,施均道,何旺容,蔡彦亮

(1.中国石化华东石油工程有限公司科技发展分公司,江苏 南京 210019;2.中国石化华东石油工程有限公司华美孚泰公司,北京 100101)

0 引 言

中国公路建设迅猛发展,截至2020 年末需要进行养护的公路里程占全国公路总里程的91%,但受检测手段影响,近一半的交通事故是由路面破损导致。其中裂缝是路面损坏的最常见现象,因外界环境影响,路面会出现不同类型病害,如坑槽、车辙、鼓包等。不同类型病害对应着不同的修补方案,如何改进传统检测算法只针对单一裂缝目标且适应性一般的问题是本文的研究重点。对此,国内外学者进行了广泛研究,由于神经网络具有学习能力强、记忆性好和鲁棒性强等特点,被应用在图像自动识别与分类领域中。

在国外研究中,文献[1]提出了将人工蜂群算法与人工神经网络相结合的路面裂缝检测与分类算法。实验结果证明ANN 的分类结果要比SVM 好,但方法性能仍有进一步改进的空间。文献[2]设计了一种基于密集连接和深度监督的像素级全卷积神经网络,该方法对细小裂缝检测效果较好但识别类型具有局限性。文献[3]提出了一种Crack-CADNet 通过引入具有上下文通道空间提升机制的自适应可变形卷积方法来处理,该方法考虑了裂缝的形状特征,其检测性能优于一般的语义分割。文献[4]利用数字图像处理方法开发了一个裂缝分类系统,该系统利用灰度共生矩阵进行特征提取,再使用SVM 将裂缝分为轻度、中度和重度三类,其准确率达到94.44%。但该方法只针对墙壁裂缝分类,是否适合路面裂缝有待进一步讨论。

国内研究中,文献[5]提出融合了CLAHE 与深度学习的卷积神经网络的检测方法,此方法增强了裂缝的细节信息,且提取裂缝的全面特征具有较好的泛化性能,但训练图片较多需要大量时间。文献[6]利用方向性特征对横纵裂缝与网状/不规则裂缝进行提取,根据分布密度特性进一步区分网状裂缝与不规则裂缝。该方法可以有效区分网状裂缝和不规则裂缝,分类精度为86%和88%,但实验发现裂缝检测的精准度会影响分类的精确度,因此还需进一步改进算法。文献[7]采用K-means改进样本选取,建立精细网络模型,但由于BP 神经网络本身的特性,计算复杂、学习速度慢,在训练收敛步数上还有待提高。文献[8]提出用稀疏矩阵表示分类的方法,该方法可以对裂缝有较好的检测,对裂缝分类不需要训练,但识别率有待提高。

本文利用核极限学习机具有计算简单、人为干预较少的特点,将降维后的二维经验模态分解提取的高频特征输入至核极限学习机进行分类,极大提高了计算成本。

1 特征提取与降维

1.1 BEMD 分解

经验模态分解(Empirical Mode Decomposition,EMD)本质上是一种对非平稳、非线性信号处理的方法,此方法可以自适应地将信号筛分为多个固有模态分量和一个残差项。由于此方法灵活可靠,被广泛地应用在语音、石油勘探等一维信号中。

二维经验模态分解(Bidimensional Empirical Mode Decomposition, BEMD)是在经验模态分解的基础上进行的推广,它把图像按自身特性分解成一系列子图像,分解后得到的子图像即为二维固有模态分量,这些固有模态分量包含原始图像的高频和低频信息。路面病害图像是二维的非平稳、非线性信号,因此本文利用二维经验模态分解提取图像高频细节特征。

求解二维固有模态分量步骤如下:

1)找出二维图像I(x,y)=hlo(x,y)的灰度极大值和极小值。

2)采用三角剖分插值法计算出极大值eupper(x,y)和极小值包络面elower(x,y)。

3)计算均值包络面emean(x,y)=[elower(x,y) +eupper(x,y) ]/2。

4)将原图与均值包络面相减得到中间面hlk(x,y),hlk(x,y)=hl(k-1)(x,y)-emean(x,y)。

5)采用Cauchy-type 收敛方法计算SD 截止条件,满足条件的中间面即为二维固有模态分量,记为Cj(x,y),,ξ∈[0.2,0.3],本文ξ取值为0.2,式中(x,y)是二维图像坐标,x,y分别是二维图像坐标的行数和列数。

6)将原图与BIMF 相减得到余项rL(x,y),再把余项转入步骤1)计算下一个BIMF,直到计算出所有BIMFs。

在上述步骤1)中采用形态学重建的方法计算极值,此方法利用结构元素对裂缝图像进行膨胀和腐蚀,原始图像与膨胀腐蚀后图像的差值即为极大值和极小值。

1.2 包络面确定

三角剖分和径向基函数是实现BEMD 分解的常用差值方法[9]。径向基函数插值法采用基函数对离散点进行插值重建,该方法适合极值点稀疏的情况;而三角剖分插值法则是将待求点划分为不同的三角区域进行插值处理并拟合成曲面,然后进行拼接得到包络曲面,适用于分解高频图像。因此本文采用三角剖分法进行插值。由于BEMD 在筛分数据时,数据的边界会有发散现象导致筛分结果失真。本文采用镜像延拓的方法消除端点效应。本文以车辙、松散、网状裂缝、坑洼病害为例,如图1 所示,对其进行BEMD 提取,结果如图2 所示。

图1 路面病害图像

图2 BEMD 分解结果

如图2 所示,上述方法将路面病害分解成3 个BIMFs内蕴模函数和1 个REF 残差项。BIMF1包含图像的 高 频 细 节 信 息,BIMF2、BIMF3依 次 按2 的负幂次方形式减少,而REF 包含图像噪声和边缘信息,随着分解层数的增加反映了其在不同尺度上的细节信息,并且可以看出图像逐渐模糊,所含有效特征也逐渐减少。

1.3 主成分分析

主成分分析(Principal Component Analysis, PCA)是基于多元统计的方法[10-12],它的实质是通过基变换把一系列存在相关性的变量转变为互不相关的变量,可以较好地区别关键信息与噪声,与此同时根据实际需要从众多变量中提取出综合性强的变量-主成分。

上述提取的固有模态分量数据量大、特征维数较多,本文利用PCA 线性拟合的思路对上述得出的BIMFs特征进行线性组合,构建其协方差矩阵,计算协方差矩阵的特征值和特征向量,将其按顺序排列,保留前k个特征值以及特征向量,尽可能多地反映原来各裂缝特征的信息,以有效缓解计算复杂度与时间消耗,便于实际工程应用。

首先对BEMD 提取的BIMFs按行排列组成m行n列的原始数据x,对其进行标准化处理,计算公式如下:

然后计算协方差矩阵Cx对应的特征值λ和特征向量w,计算公式如下:

最后计算贡献率Rk,即前k个主成分相对所有主成分占比,计算公式如下:

经PCA 处理后的数据可以在保留主要特征的同时减少冗余,因此寻找具有代表性的主成分数是关键。实验结果如图3 所示,随着主成分数的增加贡献率逐步降低,坑洼、松散、车辙和网状裂缝的最佳主成分数分别为3、3、4、3 时,其累积贡献率达85%以上,这些新特征可以代替原始特征信息并区别之间的差异。

图3 不同病害类型主成分与贡献率关系图

2 核极限学习机

2.1 KELM 原理

极限学习机(Extreme Learning Machine, ELM)与传统梯度下降的神经网络不同,它基于隐含层神经元个数进行学习,构成如图4 所示。

图4 ELM 原理图

x为输入样本的特征向量,wi为输入层与隐含层的连接权重,wi=[wi1,wi2,…,win]T,βi为隐含层与输出层的连接权重,βi=[βi1,βi2,…,βim]T,则ELM 输出计算公式如式(7)所示:

式中:g(·)为激活函数;bi为第i个隐含层单元的偏差。由于输入权重wi和隐含层偏差bi无需人为干预,随机给定。隐含层与输出层的连接权重可以将其转化为一个线性系统进行求解,如下所示:

H+为矩阵H的M-P 广义逆矩阵。将极限学习机作为分类器使用时,其决策方程如式(11)所示。用核函数K(u,v)代替公式中的h(x)HT和HHT,即为核极限学习机(KELM)[13]。

2.2 算法流程

考虑到采集图像通常是RGB 模型数据量大,首先在检测前进行RGB-YUV 灰度转化,然后对病害图像进行BEMD 分解,提取BIMFs将其作为特征值,采用PCA对特征值去噪降维,最后使用KELM 进行分类识别。该方法将BEMD 与KELM 结合,对提取的特征进行去噪降维,可以较好地适应对复杂病害的精确检测,算法流程如图5 所示。

图5 算法流程

2.3 实验结果与分析

选取大小为300×200 的路面病害图200 张,从中挑选车辙、松散、网状裂缝以及坑洼具有代表性的病害图片各25 张作为训练样本,经PCA 降维后在Matlab 2017b上进行实验。

由KELM 原理可知,核极限学习机的参数选择较为简单,只需对激励函数和隐含层节点数目进行设置即可。本文的激励函数为sigmoid 函数,为了让KELM 的分类性能达到最优,需要寻找最优隐含层节点数。不同隐含层神经元个数对分类准确性有影响,本文从50 个节点开始依次增加50 个迭代节点个数来寻找最高识别率隐含层神经元个数。

如图6 所示,经过PCA 处理的复杂病害在神经元个数为250 时,准确率达到极大值97.4%,而未经PCA 处理的数据则是在神经元个数为400 时达到极大值为90%,与经过PCA 处理的数据相比,隐含层个数增加150,准确率降低7%。

图6 隐含层神经元个数与准确率关系

通过多组实验表明,经PCA 降维后的样本所需隐含层神经元个数明显降低且随着隐含层个数的增加准确率波动幅度逐渐减小趋于平缓。

为进一步验证本文算法分类的准确性,将其与卷积耦合神经网络[14](PCNN)进行比较,结果如表1 所示。

从表1 中可以得出,本文算法对复杂病害识别准确率有较大提高,提高了约9.85%。

表1 不同算法对路面灾害识别结果 %

3 结 论

本文采用二维经验模态分解结合主成分分析进行特征提取,把提取到的特征向量用于复杂路面病害分类识别。该算法利用BEMD 将裂缝图像筛分为不同的BIMFs和余量,然后将分解后得到的特征通过PCA 进行降维,选择少数综合性强的特征向量代表原来的特征信息。把新得到的特征向量输入核极限学习机中进行训练,经过实验证明,本文算法的识别率达97.4%,与对比算法相比提高了9.85%,本文算法识别率有一定提升。但本文算法存在样本训练数较少,在对大量病害图像进行PCA 降维时,维数提取发生变化进而会对识别结果产生影响,后续将对此问题进行进一步讨论。