周 婧,秦伦明

(上海电力大学 电子与信息工程学院,上海 201306)

近年来废钢铁资源增长迅速,其重要性也与日俱增,然而钢铁企业对废钢铁的科学管理水平仍然较低。实现废钢自动分类,有利于提高钢铁企业的管理水平和废钢的回收效率。

废钢分类属于细粒度图像分类(Fine-grained Image Categorization)问题,即判断图像属于同一基类别下的哪个子类的问题。传统图像分类主要采用手动设计特征的方法,对于废钢分类,人为设计特征的难度很大,因此运用传统图像分类方法来进行废钢分类十分困难。

卷积神经网络(Convolutional Neural Network)[1]是一种特殊的神经网络,它的结构与特性有利于提取图像的特征,很适合用于解决废钢分类问题。而实现高精度废钢分类离不开大量数据,迁移学习等方法可以用于提高小数据集下的识别准确率,弥补废钢数据的不足。

1 废钢资源发展现状

1.1 废钢资源的重要性

铁矿石和废钢铁是钢铁企业开展生产的主要原料,其中废钢铁资源按其来源可分为自产废钢、加工废钢和折旧废钢3类。废钢铁是可再生资源,在生产过程中,对废钢资源进行合理管理与利用,提高废钢的回收利用率,可以节省铁矿石的投入,有效降低资源和能源消耗,减少大量废气废水排放[2]。

随着钢铁工业的迅速发展,废钢铁的需求量也在大幅增长[3]。而目前钢铁企业的废钢资源管理还存在较多问题,如废钢分类回收混乱、利用率较低等。因此,实现废钢自动分类对于钢铁企业而言日益重要。

1.2 废钢资源增长趋势

根据中国废钢铁应用协会的统计,2018年全国废钢铁资源总产量为2.1亿t,同比增涨10%。2019年全国废钢总产量为2.4亿t,同比增涨9%,废钢资源稳定增长。

根据有关数据的分析与预测,由于折旧废钢量的大增,2025年后废钢资源将进一步快速增长[4],废钢将成为我国高速发展的钢铁工业的重要支柱。而这对钢铁企业的废钢管理与利用水平提出了更高要求。

2 废钢分类研究综述

2.1 废钢分类研究分析

目前,国内关于废钢分类的研究还很少,仅有裴培等[5]人设计了废钢分类计量与管理系统,有效提高了废钢数据信息传输效率。废钢分类属于细粒度图像分类问题,由于细粒度图像的种类之间差距更小,实现废钢分类比一般的图像分类更具有挑战性。

2.2 传统图像分类方法

传统的图像分类方法,如词包模型[6](Bag of Words),其将图像特征表示为人工特征描述子,并对测试图像提取特征描述子后,与特征库进行匹配得到分类结果。词包模型使用全局特征来描述图像,运算简单快捷,消耗内存小,但难以识别存在背景干扰的复杂图像。

为了解决上述问题,图像分类研宄方向转向了图像中的局部特征,基于局部特征的尺度不变模型被提出。常用的局部特征描述算子有SIFT特征[7],HOG特征[8],LBP特征[9]等。基于局部特征的模型在有复杂背景的图像分类上取得了更好的效果,但由于其不能利用图像的空间位置信息,对于不同视角的同类物体,局部特征模型的泛化能力较差。

近些年,学者又提出了基于语义特征的图像分类模型。模型首先从图像中提取出相应特征,并对特征进行处理得到语义信息,然后将特征聚类为一类图像的语义特征。基于语义特征的图像分类模型更符合人类视觉对图像的识别过程,但其同样没有利用图像的空间位置信息。

对于废钢分类问题,由于细粒度图像的子类之间特征差异较小,传统图像分类模型提取的特征对于子类的分辨能力较弱。因此,传统图像分类模型应用于废钢分类问题的效果不够理想。

2.3 卷积神经网络发展综述

近年来,深度学习[10]领域卷积神经网络发展迅速。1998年,Lecun提出了LeNet[11]。LeNet是一个结构简单的卷积神经网络,但在进行手写数字识别时取得了98%以上的准确率,从而引发了卷积神经网络的研究热潮。

2012年,AlexNet[12]在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛中获得冠军,正确率远超第二名。AlexNet包含5个卷积层和3个全连接层,采用ReLU(Rectified Linear Units)激活函数来加速训练,是第一个真正意义上的深度神经网络。

2014年,牛津大学的Visual Geometry Group提出的VGGNet[13]获得ILSVRC竞赛亚军。VGGNet在AlexNet的基础上继续发展,层数更深,网络结构更广。同年,GoogLeNet[14]获得ILSVRC竞赛冠军,其通过构建和组合多个Inception模块,使得网络更深更广,同时减少了模型的参数量,解决了过拟合和梯度弥散(Gradient Vanishing)等问题。

2015年,Kaiming He提出的ResNet[15]获得ILSVRC竞赛冠军。He提出了短路连接机制以解决深层网络难以训练的问题,使网络的层数得以继续加深。同年,Gao Huang等人借鉴ResNet的思想提出了DenseNet[16]。其特点是网络的任意两层之间直接连接,使用这种密集连接机制实现了特征重用,减少了参数量。

2019年,谷歌提出了EfficientNet[17],同时提出了一种新的模型缩放方法,使用一个简单而高效的复合系数,从深度、广度和输入分辨率3个维度缩放网络,从而同时兼顾模型的运行速度与精度。

随着卷积神经网络的发展,其分类速度与精度不断提高,目前已逐渐成为图像分类的主流方法。卷积神经网络用于解决废钢分类问题具有可行性。

2.4 迁移学习方法

深度神经网络的训练需要大量图像数据,而废钢图像数据量非常有限。图像数据的不足将影响模型的分类效果,为了在数据有限的前提下取得较高的分类准确率,考虑使用迁移学习等方法弥补数据的不足。

迁移学习[18]是将从一个领域中学习到的知识,迁移应用到与之相关的新领域中的方法。深度神经网络有强大的特征提取能力,但其训练需要大量标注数据,如数据不足很容易陷入过拟合,难以取得理想的分类效果。如先利用大型数据集初步训练深度神经网络,再将网络习得的知识恰当地进行迁移应用,则可解决训练数据不足的问题,克服过拟合现象,同时节省大量运算成本,缩短训练时间。

迁移学习应用于图像分类或识别问题的具体实施方法为,使用在ImageNet数据集上训练的预训练模型(Pre-trained Model),将其特征提取层的结构和权重进行迁移,构建迁移学习模型并在实际训练数据上进行训练。ImageNet是一个包含1 500万张图片的大型图像分类数据库,共有2.2万个分类。预训练模型拥有在ImageNet上学习到的知识,已学会提取一些低端特征,如轮廓特征、纹理特征等,使用预训练模型进行迁移学习,可以使网络更快更好地学习小数据集,发挥深度神经网络特征提取的优势,同时节省收集更多数据的人力物力。目前,迁移学习已广泛应用于小数据集的图像分类问题中,如朱良宽等[19]人运用迁移学习提高植物叶片分类的准确率,谢小红等[20]人将迁移学习运用于服装分类的研究等。

3 结束语

本文总结了近些年废钢资源的增长趋势和利用情况,分析了传统图像分类方法不适用于废钢分类的原因,并展望了卷积神经网络应用于废钢分类的可行性及运用迁移学习等方法来弥补废钢图像数据不足的可能性。