郑伟哲,韦 娟,郑浩南

(西安电子科技大学 通信工程学院,陕西 西安 710071)

0 引 言

压缩气体在航空航天、石化生产、汽车制造等领域发挥着重要作用,但泄漏气体占工业总耗气量的10%~20%,严重时达到50%,造成巨大的能源浪费和经济损失[1]。因此,对压缩气体泄漏信号进行识别具有极其重要的现实意义。

压缩气体泄漏初期,由于内外环境压差大、泄漏孔径小,产生超出人耳可听范围的超声信号,且不同孔径大小和形状产生的泄漏信号的频谱分布差异较大[2]。文献[3]的研究表明,泄漏信号与环境噪声的能量差值在40 kHz附近区分最明显,且随着频率继续增加,环境噪声的能量值迅速降低。因此,超声检测法成为目前主流的气密性检测方法[4⁃5],该方法利用40 kHz附近泄漏信号与环境噪声能量值相差最大的特点,采用设定阈值的方式判断是否有泄漏发生。

文献[6]将超声传声器和旋转平台结合,以声发射的方式检测泄漏信号,通过声压级和信噪比的检测阈值判断是否有泄漏发生。文献[7]利用波达角,提出基于贝叶斯推断的超声泄漏信号定位算法。文献[8]将泄漏信号的峰值包络系数、谱峭度和小波能量分数等特征融合构造支持向量,利用超声实现非侵入式泄漏检测。文献[9]通过40 kHz与60 kHz附近信号的功率谱幅值和均值等统计量判断泄漏发生。上述方法虽然可以检测泄漏,但存在判定法则简单、易受高频信号干扰等问题,且检测仪器需要根据实际应用场景匹配不同硬件设备,工业复杂环境时常依赖于人的主观判断。

综合上述分析,为提高泄漏超声信号的识别准确率,本文提出一种基于改进梅尔频率倒谱系数(Mel⁃Frequency Cepstrum Coefficient,MFCC)的识别方法。该方法使用信息熵优化经验模态分解(Empirical Mode Decomposition,EMD)的筛选条件和迭代条件,以改善频谱混叠,并根据泄漏超声信号的能量分布特点,对Mel变换函数进行改进,使Mel滤波器组的分布更具针对性。通过提取改进MFCC特征,使用支持向量机进行识别分类,最终实现对泄漏信号的检测目的。

1 改进EMD算法

EMD是一种常用的泄漏信号预处理方法,但泄漏信号频谱成分复杂,使用EMD会出现频谱混叠[10],不利于超声频段的信号提取。EMD的迭代条件是产生频谱混叠的主要原因[11],虽然通过引入高斯白噪声得到的集合经验模态分解能有效解决该问题,但泄漏信号超声频段的幅值较低,加入噪声不利于对其进行预处理。

熵是衡量系统混乱程度的指标[12],在信号分析中熵值Ent反映信号的频谱复杂程度,且Ent越小,信号成分越单一,信号越稳定。于是,引入熵计算对迭代终止条件和固有模态函数(Intrinsic Mode Function,IMF)的判定条件进行优化。

鉴于泄漏信号的特殊性,以频谱能量比为自变量进行熵计算。使用滤波器个数为N的Mel滤波器组对EMD中需要判决为IMF的信号频谱进行划分,并计算各滤波器所在频段的频谱能量ek以及整个频段的频谱能量E,则泄漏信号的熵为:

考虑到可能出现划分频段频谱能量过低,使ekE趋近于0而造成数值溢出的情况,将频段数N作为归一化因子对式(1)进行修正,确保数值有效。修正后的熵计算式为:

根据仿真及实验分析,使用EMD对气体泄漏信号进行分解时,IMF的判定条件改进为:IMF的Entmod低于阈值0.1,或前后两个IMF的Entmod的差值低于设定值10-3或为负;EMD的终止条件改进为:残余函数的Entmod低于阈值0.1,或满足单调性质。

改进EMD算法步骤为:

步骤1:根据原始泄漏信号x(t)的上下极值点,构造局部极大、极小值的上下包络线,并计算上下包络线的均值m(t);

步骤2:计算信号h(t)=x(t)-m(t),对h(t)进行傅里叶变换,计算滤波器组对应各划分频段的频谱能量ek以及频谱能量和E;

步骤3:根据式(2)计算信号熵值Ent,代入滤波器个数N、频谱能量ek、频谱能量和E;

步骤4:当分解信号的Entmod低于阈值0.1,或前后两次分解得到的Entmod的差值低于设定值10-3或差值为负时,继续步骤5,否则将h(t)视作x(t),执行步骤1;

步骤5:提取第i层IMF分量ci(t)=h(t),计算剩余信号序列r(t)=x(t)-h(t);

步骤6:当r(t)的最大值低于阈值0.1,或满足单调函数性质时,终止EMD分解,否则,令x(t)=r(t),继续步骤1。

EMD算法提取的超声频谱图如图1所示。

图1 EMD算法提取的超声频谱图

分析图1可知,处理泄漏信号时,EMD算法在0~15 kHz频段与15~45 k Hz的目标频段混叠较严重。由于超声的幅值衰减特性,泄漏信号的超声频段幅值较低,而低频段幅值较高,频谱混叠会使得目标超声段被掩盖,不利于泄漏特征的提取。而改进EMD算法对目标段信号进行了充分提取,增强了区分度,有效解决了频谱混叠问题。

2 泄漏信号特征提取

2.1 改进Mel变换函数

MFCC是基于人耳听觉机理的声音信号特征,具有描述准确和抗噪性强的特点[13]。MFCC主要针对低频信号,对中高频部分的信息采集较少。MFCC特征提取流程如图2所示。

图2 MFCC特征提取流程

泄漏超声频段频谱较宽,根据Mel滤波器组的分布特性,在超声频段两端的滤波器宽度相差较大,会导致对目标频段的信息采集严重不均衡。同时考虑应用场景以及漏孔孔径,过于密集或稀疏的滤波器分布都无法很好表征泄漏超声信号的频谱特征。为此,需要对Mel变换函数进行改进以提取更充分有效的特征。

为适用不同应用场景,提出了Mid⁃MFCC(Mid Mel Frequency Cepstrum Coefficient)、IMFCC(Inverted Mel Frequency Cepstrum Coefficient)。Mid⁃MFCC通过设置分段变换函数并调整参数,使滤波器组在2 000 Hz附近密集分布,在其他频率段稀疏分布[14]。IMFCC通过对变换函数进行平移和翻转,滤波器组在4 000 Hz附近分布密集,便于采集3 000~4 000 Hz频率范围内的信息。

Mid⁃MFCC、IMFCC根据提取的特征信息在频域的分布,通过修改Mel变换函数以满足不同场景信号的特征提取。但MFCC主要依赖于Mel变换函数对人耳听觉机理的声音信号特征,而Mid⁃MFCC、IMFCC仅是形式上的变换,缺少与人耳听觉机理的拟合,但不同滤波器组的设置思路为泄漏超声信号的特征提取提供了很好的启发。借鉴Mid⁃MFCC和IMFCC的设计思想,通过对Mel变换函数设置偏移量,使滤波器组的分布形式更加切合泄漏超声信号的频谱分布规律。为使提取的特征更加完整,构造如式(3)~式(5)所示的三种变换函数,分别对应不同的滤波器组分布形式:

式中:Fmel⁃1,Fmel⁃2和Fmel⁃3表示三种改进的Mel域标度;f为Hz频率。通过叠加三种不同分布的滤波器组可有效提取超声信号在不同频段处的特征信息,提高系统的鲁棒性和灵活性。

通过对变换函数设置偏移量,使MFCC的滤波器组的分布更加平滑,更适合泄漏信号的频谱分布规律,以便更有效提取泄漏信号特征。

2.2 改进算法流程

根据泄漏信号的频谱特性,改进MFCC特征提取流程如图3所示。由于预加重易破坏信号的完整性,使用改进EMD对泄漏超声信号进行预处理。在MFCC特征提取过程中,离散余弦变换的存储负担较大,改进算法采用主成分分析(Principal Component Analysis,PCA)方法[15],既能保证特征的准确率,又能降低特征维度。由于泄漏信号的频谱比较平滑,去除不必要的倒谱计算。分别使用三种Mel变换函数提取MFCC,将得到的MFCC进行拼接,形成改进MFCC。

图3 改进MFCC特征提取流程

3 实验与结果分析

在实验室环境下模拟压缩气体泄漏,获取泄漏超声信号,使用支持向量机(Support Vector Machine,SVM)完成泄漏检测。SVM的核函数采用径向基函数,核函数参数g=0.07,惩罚因子为100。采集泄漏信号时,用于收集泄漏超声信号的传声器阵列在距离泄漏点500 mm处,采样频率为192 kHz,泄漏孔径分别为0.2 mm和0.4 mm,内外压差为0.7 MPa。采样样本总数为1 000。将采集到的超声信号按帧长为1 024,帧移为512进行分帧处理。前期通过实验和仿真扩大和缩小目标频段的范围,检测改进MFCC设置的特征提取范围对检测准确率的影响,实验选择9.6~48 kHz作为超声目标频段。以空压机开启时的声音和背景噪声为干扰信号,根据孔径大小和是否存在干扰构建以下5类数据:0.4 mm泄漏信号+背景噪声;纯背景噪声;0.4 mm泄漏信号+空压机开启声音+背景噪声;空压机开启声音+背景噪声;0.2 mm泄漏信号+背景噪声。实验衡量指标为测试集的识别准确率(Acc),即测试集被正确分类的样本数占样本总数的百分比。

3.1 预加重对泄漏信号频谱分布的影响

预加重前后泄漏信号的频谱分布如图4所示。

图4 预加重前后泄漏信号的频谱分布

分析图4可知,泄漏信号的频谱分布复杂,预加重难以保证超声频段的完整性:根据泄漏信号的频谱特性,超声频段设为15~45 kHz,而预加重滤除了部分该范围内的信号,超声频段整体性被破坏,不利于信号特征的提取;并且对于更复杂的频谱分布,难以找到理想的参数进行预加重。经实验分析去除预加重部分。

3.2 改进MFCC与MFCC的识别准确率

为验证改进MFCC在泄漏超声信号中的分类效果,按各自的特征提取流程分别提取MFCC和改进MFCC,然后按不同的样本比例划分成训练集和测试集,进行模型训练和测试,识别分类结果如表1所示。

表1 改进MFCC和MFCC的识别准确率 %

分析表1可知:MFCC的识别准确率最大为88.19%,且在训练集和测试集的结果相差较大,出现过拟合现象,说明MFCC对泄漏超声信号的特征表征不够充分;而改进MFCC的识别准确率最大为93.17%,且在训练集和测试集上的准确率相差较小,说明改进的EMD和梅尔变换函数更契合泄漏超声的频谱分布,有效表征泄漏信号特征。

3.3 降维幅度对识别准确率的影响

为了验证PCA降维幅度对识别准确率的影响,通过设置不同的降维幅度,构建相应的特征集进行模型训练和测试,结果如图5所示。分析可知,降维幅度低于30%,对改进MFCC起到优化作用,在降低时间消耗的同时,还能提升识别准确率。但降维幅度高于40%,改进MFCC的识别准确率会急剧下降,说明降维幅度过大会对特征结构造成破坏。对于MFCC,识别准确率随降维幅度的增加而持续下降,说明泄漏信号的MFCC无法通过PCA进行降维优化。

图5 降维幅度对算法检测准确率的影响

3.4 不同方法识别准确率比较

为对比所提算法、超声检测法和MFCC等方法在泄漏信号识别中的效率,训练集与测试集的样本之比为9∶1。依据文献[7⁃9],超声检测的特征提取选择以40 kHz频点为中心,带宽为5 kHz的泄漏信号,将频谱能量、幅度均值及最大值作为识别特征。表2给出不同方法的识别准确率。

表2 不同检测方法的识别准确率 %

由表2可知:超声检测法识别准确率最低,仅为68.65%;改进EMD与MFCC的组合方法比MFCC的识别准确率高4.60%,比EMD与MFCC的组合方法的识别准确率高22.96%,说明使用熵判决改进的EMD切合泄漏超声信号的频谱分布,使用改进的EMD对信号进行预处理能够有效提高MFCC的识别效率。本文所提算法的识别准确率最高,为94.72%,比MFCC的识别准确率高7.76%,比改进EMD与MFCC组合方法的识别准确率高3.16%,表明改进EMD、去倒谱计算和PCA对MFCC的优化是有效的,能够提高MFCC在泄漏信号识别中的准确率。

4 结 论

为了提高压缩气体泄漏信号的识别准确率,根据泄漏超声信号的频谱特征,本文提出基于熵判决、EMD、PCA和MFCC的泄漏信号特征提取方法。通过实验分析进一步验证了改进MFCC充分考虑泄漏信号的频谱特性,是一种针对性更强、效率更高的特征。此外,通过改变Mel变换函数,丰富Mel滤波器组分布,能够有效提高泄漏识别效率。