孙毅

(中国民航大学,天津市 300300)

【摘 要】卷积神经网络主要由卷积层、池化层、全连接层构成。它在目标检测和计算机视觉、语音识别等领域成效卓然。本文主要简述卷积网络结构以及在各领域应用。

【关键词】卷积神经网络;卷积网络结构;各领域应用

一、卷积神经网络

卷积神经网络是一种人工神经网络,目前已成为图像识别、语音分析、目标检测等领域的研究热点。权值共享及池化操作有效的降低了网络复杂度,与深度学习中的MLP,DPN等网络相比,具有较少的可调参数,降低了学习复杂程度以及训练所需时间;卷积神经网络在处理二维图像时,具有位移、缩放即扭曲图像不变性。

二、卷积神经网络结构

卷积网络由输入层、卷积层、池化层、全连接层及输出层构成基本结构。卷积层和池化层一般成对交替出现。由于卷积层中特征面的神经元与其输入局部连接,通过相应的权值与局部输入进行加权求和再加上偏置值,得到该神经元输入值,该过程等同于卷积过程,卷积神经网络也由此命名。

(一)卷积层

卷积层(convolutional layer)由多个特征面组成,每个特征面由多个神经元组成,它的每一个神经元通过卷积核与上一层特征面的局部区域相连。卷积核是一个权值矩阵。卷积层通过卷积操作提取输入的不同特征,低层卷积层提取低级特征如边缘、线条、角落,更高层的卷积层提取更高级的特征。

(二)池化层

池化层(pooling layer,也称为取样层)在卷积层之后,由多个特征面组成,它的每一个特征面唯一对应于其上一层的一个特征面。卷积层的输出是池化层的输入,且池化层的神经元也与其输入层的局部接受域相连。池化层旨在通过降低特征面的分辨率来获得空间不变性的特征,池化层起到二次提取特征的作用。常用的池化方法有最大池化即取局部接受域中值最大的点、均值池化即对局部接受域中的所有值求均值、随机池化。

(三)全连接层

卷积网络结构中,最后一个池化层后连接着至少一个全连接层。全连接层中的每个神经元与其前一层的所有神经元进行全连接。全连接层可以整合卷积层或者池化层中具有类别区分性的局部信息。最后一层全连接层的输出值被传递给一个输出层,可以采用softmax逻辑回归进行分类,该层也可称为softmax层。

(四)特征面

特征面数目作为卷积网络的一个重要参数,通常是根据实际需求进行设置的,若特征面过少,可能会使一些特征被忽略掉,不利于网络的学习;但是如果特征面个数过多,训练参数个数及网络训练时间也会增加,也不利于学习网络模型。

三、实际应用

(一)图像识别

近年来,卷积网络已广泛应用于图像处理领域。利用机器学习的方法,使得计算机能够识别图像中的内容。模式识别中的一个主要领域是图像识别,主要涉及字符识别、人脸识别、物体识别等。在图像识别中,手写数字识别和人脸识别是被研宄的比较多的领域。手写数字识别可以被用于自动读取银行支票信息、信封上的邮政编码和一些文档中的数据等。

(二)音频检索

Hamid等结合隐马尔科夫建立了基于卷积网络的语音识别模型,并在标准语音数据库上进行实验,实验结果显示该模型的正确率相对于具有相同隐含层数和权值的常规神经网络模型提高了10%,表明卷积网络模型能够更好的应用于语音识别。

(三)目标检测

运动目标检测是视频监控的基本预处理步骤之一,通常是利用机器视觉等技术将目标从背景中分离出来。在一个实用的计算机视觉系统中跟踪目标的初始状态一般由目标检测结果给出,同时为语义层分析任务提供所需要的运动信息。因此,目标检测是高层理解与应用的基础任务,其性能的好坏将直接影响后续的目标跟踪、动作识别以及行为理解等后续任务的性能。按照算法处理对象的不同,目标检测大致可以分为基于背景建模的目标检测方法和基于前景建模目标检测方法两大类。其中, 基于背景建模的方法通过建立背景模型与时间的关联关系,间接地分离出运动前景,最后经过前景分割得到目标;基于前景目标建模的方法则是通过建立目标的表观模型,设计出适当的分类器对视频中的目标进行分类和检测。

四、总结

随着人工神经网络的飞速发展,卷积网络的共享权值、训练所需的设置参数少、鲁棒性强等优良特性使其成为了研究的热点。卷积网络通过权值共享减少了需要训练的参数个数、降低了网络的设计和计算复杂度,同时通过池化操作使得网络对输入的局部变换具有一定的不变性,提升了网络的泛化能力。卷积网络将原始数据直接输入到神经网络中,然后隐性地从数据中进行自主学习。虽然卷积网络所具有的这些特点使其已被广泛应用于各种领域中特别是模式识别与人工智能领域,但是卷积网络仍有许多工作需要进一步研究;如当处理一个具体的任务,很难确定需要多少个卷积层和池化层,每一层使用多大的卷积核和步速等才使得训练结果最优。

总的来说,卷积网络在模式识别与人工智能等领域中的发展与应用,使它在未来很长的一段时间内仍然是人们研究的一个热点。新的理论和技术的纳入以及新成果的出现会将卷积网络应用于更多新的领域中。

【参考文献】

[1] Yann LeCun, Leon Bottou, Yoshua Bengio, et al. Gradient-based learning applied to document recognition. Proceedings of the IEEE,1998, 86(11):2278-2324

[2] Gao Li-Gang, Chen Pai-Yu, Yu Shi-Meng. Demonstration of convolution kernel operation on resistive cross-point array. IEEE Electron Device Letters, 2016,37(7):870-873

[3]尹勰,闫磊.基于深度卷积神经网络的图像目标检测[J].工业控制计算机,2017,30(4):96-97