徐一茹,刘翠玲,孙晓荣,吴胜男,董秀丽

(北京工商大学计算机与信息工程学院,北京 100048)

伴随我国人民的生活水平不断提高,生活质量由温饱型向营养型、精细型、科学型转化的趋势日益明显。面粉是日常主食中的重要一员;广大消费者和食品加工行业都对小麦粉的品质提出了更高的要求。水分、灰分和面筋是反映小麦粉品质最重要的3 个指标,与其性能息息相关。其中水分的多少决定面粉的稳定时间与拉伸强度;灰分是指样品灼烧后剩下的矿物质元素,灰分的多少会影响其内在品质和使用性能;面筋主要由蛋白质构成,面筋含量的多少间接反映出面粉中蛋白质含量的高低,是影响面粉品质好坏的决定因素。近年来小麦面粉市场上也出现了多种不安全因素[1],最常见的是将滑石或者其他面粉掺杂到小麦粉中,给消费者的健康带来严重威胁;同时,我国是一个农业大国,小麦粉的品质和性能也和国民经济的发展息息相关。

传统检测方法一般包括3 种:1)常压干燥法测定面粉中的水分含量[2]:此方法是基于样本中的水分受热以后,产生的蒸汽压高于在电热干燥箱中的空气分压,从而蒸发出食品中的水分;同时不断供给热能并排走水蒸气,以达到完全干燥的目的。样本中的水分一般是指在101~105 ℃直接干燥的情况下所失去物质的总量,此法适用于在101~105 ℃条件下,不含其他挥发性物质或含量甚微的样本。2)灼烧法测定面粉中的灰分含量[3]:一定质量的面粉样本经过高温灼烧,去除了有机物质后,残留的无机物质即为灰分,样本质量发生了改变,根据样本灼烧前后的质量变化,即可计算出总灰分的含量。3)洗出矫正法测定面粉中的面筋含量:面筋是一种复杂的蛋白质复合物,如干面筋就是由麦醇溶蛋白和麦谷蛋白,以及少量的其他蛋白质、糖类、脂类等组成[4]。面筋不溶于水,所以可以冲洗和好的面团,将可溶性物质除去,剩下的就是湿面筋。通过湿面筋的质量,换算得出面粉含水量为14%时的面筋含量。这些方法所需技术含量低,但操作繁琐,耗时较长,有些还存在环境污染以及安全隐患。

为了保障人民饮食安全,保护国家经济健康发展,寻找一种快速、简便的检测面粉品质的方法显得尤为重要。通过查阅和对比相关资料,发现红外光谱技术以其高效、无损、环保的优势被广泛应用于粮油产品的检测技术中[5-7]。本实验选取北京地区市场上最常见的北京某面粉厂的小麦粉为实验样本,并配制小麦粉掺杂滑石粉和玉米面的样本,以近红外光谱和中红外光谱技术为基础,通过优化建模,实现了小麦粉品质检测及掺杂鉴别[8-9]。

1 材料与方法

1.1 材料与仪器

1.1.1 用于定量分析的面粉样本

样本采自北京某面粉厂不同批次的各类产品,包括标准粉、富强粉、裹粉、家用粉、军供粉、麦心粉、面包粉、雪花粉等一共150 个样本。样本的近红外光谱叠加图如图1所示。

图1 150个面粉样本的近红外光谱叠加图Fig.1 Overlapped near-infrared spectra of 150 wheat flour samples

1.1.2 用于定型鉴别的掺杂面粉样本

表1 面粉秤取量及杂质称取量Table 1 Mixing ratios for wheat flour and adulterants

分别配制20 份纯小麦面粉样本、20 份小麦面粉掺滑石粉的样本、20 份小麦面粉掺玉米粉的样本,小麦粉与杂质质量比例见表1,将样本随机分为建模组及测试组,每种样本各10 个。采用近红外、中红外光谱技术进行分类鉴别。掺杂样本的近红外、中红外光谱叠加图如图2、3所示。

图2 面粉、面粉掺杂滑石粉、面粉掺杂玉米面的近红外光谱叠加图Fig.2 Overlapped near-infrared spectra of wheat flour, wheat flour adulterated with talcum powder and wheat flour adulterated with corn flour

图3 面粉、面粉掺杂滑石粉、面粉掺杂玉米面的中红外光谱叠加图Fig.3 Overlapped mid-infrared spectra of wheat flour, wheat flour adulterated with talcum powder and wheat flour adulterated with corn flour

1.1.3 仪器

本实验数据是用德国Bruker光谱仪器公司生产的VERTEX 70型傅里叶变换红外光谱仪[10]采集而来,并用仪器自带的OPUS软件进行光谱处理[11-12]。

1.2 方法

1.2.1 定量检测面粉品质

近红外光谱主要是合频吸收光谱,由有机分子含氢基团(C—H、N—H、O—H等)伸缩振动的各级倍频和这些基团的弯曲振动形成。光谱曲线蕴含大量信息,几乎能反映有机物的所有含氢基团的信息;能够反映出分子的结构以及组成状态,这就有可能通过近红外光谱,定性或者定量分析有机物样本[13]。

常规分析技术有透射光谱[14]和漫反射光谱[15]两大类,检验均匀透明的真溶液或固体样本时,一般采用透射光谱;在本研究中,要检测的样本是面粉,所以采集样本的透射光谱。仪器扫描样本得到的吸光度及光程与透射光经过样本前后强度之间的关系符合朗伯-比尔定律[16]:

式中:I0为入射的单色光强度;It为透射光强度;A为吸光度。在本研究中采集面粉样本的近红外光谱数据,建立基于偏最小二乘法的预测模型来定量检测面粉品质[17-18]。

1.2.2 定性鉴别面粉掺杂

在定性分析中,既要用到近红外光谱技术,也要用到中红外光谱技术。一般将2.5~25 μm的红外波段划为中红外区;若不考虑样本称量、溶液配制和槽厚引起的误差,测定吸光度所引起误差的最佳极限值是±1%,实际误差比其大,因而中红外光谱用得最多的是定性分析;一般包括已知物的鉴定、未知物的鉴定、分析新化合物的结构等[19]。

在本研究的定性分析中,用到的中红外光谱是衰减全反射光谱,采用聚类分析[20],依据是光谱间距离,它表明了不同谱图的相似度,如果在被比较的频率范围内两张谱图的光谱间距离为零,则表明它们是一样的;谱图差别随着光谱距离值的增大而增大[21-22]。

2 结果与分析

2.1 基于近红外光谱技术的定量分析

2.1.1 近红外光谱数据的预处理[23]

预处理部分首先是奇异样本的剔除,奇异样本主要是由于实验条件的改变、样本性质的变化以及仪器的噪声和人员操作失误产生的测量误差等。对于一个成功的建模而言,这个奇异样本会影响整体数据的分析,从而使校正模型的准确性降低。目前剔除奇异样本的方法主要有主成分分析法、马氏距离法、杠杆值法、半数重采样法等,本实验采用的是马氏距离法[24]。

表2 光谱数据的预处理参数(以灰分为例)Table 2 Spectral data pretreatment parameters (for ash)

为了更好地针对所测目标,减弱或者消除各种非目标因素对光谱的影响,对剔除了奇异样本的光谱数据进行进一步的预处理。本实验采用10 种方法分别对近红外光谱进行预处理,分别为消除常数偏移量、减去一条直线、矢量归一化(standard normal variate,SNV)、最小-最大归一化、多元散射矫正、一阶导数(17点平滑)、二阶导数、一阶导数(17点平滑)+减去一条直线、一阶导数(17点平滑)+SNV、一阶导数(17点平滑)+多元散射校正(multiplicative scatter correction,MSC)。用上述预处理结果如表2所示(以最稳定的灰分为例)。

从表2可以看出,不同的预处理方法得到的校正模型的决定系数R2和偏移量不同,即精度不同。对于灰分而言,减去一条直线、SNV、最小-最大归一化、多元散射校正、一阶导数(17点平滑)、一阶导数(17点平滑)+MSC等7种方法的决定系数R2均在95%以上,内部交叉相关系数也较高。综合考虑水分和面筋的预测结果,选取多元散射矫正预处理方法作为面粉样本数据的优化方法。

2.1.2 偏最小二乘法模型的建立及检验

用多元散射矫正方法,建立偏最小二乘法预测模型,对检验集样本进行预测分析[25],检验集样本真值与预测值的相关性如图4~6所示,10 个检验集样本预测结果如表3所示。

图4 检验集样本预测值与真值相关性(水分)Fig.4 Correlation between the predicted and actual values of moisture in validation set

图5 检验集样本预测值与真值相关性(灰分)Fig.5 Correlation between the predicted and actual values of ash in validation set

图6 检验集样本预测值与真值相关性(面筋)Fig.6 Correlation between the predicted and actual values of gluten in validation set

表3 检验集样本的检验结果Table 3 Correlation coefficients and square errors of prediction (SEP)

由表3可以看出,该模型的预测值与真值之间的相关系数水分R2为0.931 5,预测均方差(square errors of prediction,SEP)为0.279;灰分R2为0.950 6,SEP为0.024 8;面筋R2为0.823 2,SEP为0.147。由于面粉中水分含量受环境影响波动较大,所以模型预测的能力稍差,对于含量受环境影响较小的灰分和面筋而言,模型预测效果较好,可以成功检验待测样本。

2.2 基于近红外-中红外光谱技术的定性分析[26]

2.2.1 近红外-中红外光谱数据的预处理

光谱预处理的方法有:SNV、一阶导数(17点平滑)、一阶导数(17点平滑)+SNV、二阶导数(17点平滑)、二阶导数(17点平滑)+SNV。在进行预处理的时候选择标准法来计算光谱距离。首先对近红外光谱数据进行预处理,然后用同样的方法对中红外光谱数据进行预处理,处理结果如表4所示。

表4 近红外-中红外光谱预处理结果Table 4 The pretreatment results of near-and mid-infrared spectra

从表4可以看出,近红外光谱和中外光谱都是除了矢量归一化不能正确区分以外,其他预处理方法均有理想效果,现选择二阶导数(17点平滑)作为中红外模型的预处理方法,进行下一步的分析测试。

2.2.2 聚类分析模型的建立及检测

图7 近红外聚类分析模型测试结果Fig.7 The test results of near-infrared clustering analysis model

数据经过预处理矫正以后,使用标准法测光谱距离建立聚类分析模型,将其保存,以便测试时调用。现从测试组3 种样本中随机各选择一个,分别标记为:面粉(测试)、滑石粉(测试)、玉米面(测试)。将这3 个样本的光谱信息分别添加到近红外和中红外模型中,观察其分类效果,如图7、8所示。

图8 中红外聚类分析模型测试结果Fig.8 The test results of mid-infrared clustering analysis model

从图7、8可以清晰地看出,3 个测试样本均被准确无误地分到各自的类中,多次随机更换检验样本,都能得到相同结论,说明该聚类模型性能优秀。在实验中,一阶导数(17 点平滑)、一阶导数(17 点平滑)+SNV法、二阶导数(17 点平滑)+SNV法等预处理方法也能成功分类。

3 结 论

本实验首先基于近红外光谱技术深入探讨和研究了光谱数据采集和波长选择等关键问题,同时用消除常数偏移量、减去一条直线、一阶导数(17点平滑)、一阶导数(17点平滑)+SNV、一阶导数(17点平滑)+MSC多元散射校正等10 种光谱预处理方法对所采集的近红外光谱进行了预处理,最终确认多元散射的预处理方法效果最好。然后建立了基于偏最小二乘法的面粉水分、灰分、面筋含量的校正模型;经检验集检验之后,证明所建模型对灰分和面筋的检测效果可行,但水分受环境因素影响较大,检测效果不理想。然后用近红外与中红外两种光谱技术来鉴别面粉掺杂,通过制备样本、选择预处理方法、建立聚类分析模型、设计检验方案得出合理的结论。证明了近红外光谱技术和中红外光谱技术在定性分析方面都具有很强优势,两种光谱技术相互验证,同时也证明了聚类分析在鉴别掺杂方面的巨大潜力。

[1]董秀丽, 刘翠玲, 吴胜男.小麦面粉中不安全因素测定方法的研究进展[J].北京工商大学学报: 自然科学版, 2012, 30(6): 80-84.

[2]国家标准化管理委员会.GB 5009.3—2010 食品中水分的测定[S].北京: 中国标准出版社.

[3]国家标准化管理委员会.GB 5009.4—2010 食品中灰分的测定[S].北京: 中国标准出版社.

[4]陈倩婷.碱性蛋白酶水解小麦面筋蛋白的研究[J].饲料研究,2013(3): 4-5.

[5]王冬, 王纪华, 马智宏, 等.衰减全反射-中红外光谱法定量测定小麦粉中的石灰类添加物[J].农业工程学报, 2012, 28(4): 258-263.

[6]金华丽, 卞科.近红外光谱法检测小麦粉中的水分含量[J].中国粮油学报, 2010(8): 109-112.

[7]王家俊, 梁逸曾, 汪帆.偏最小二乘法结合傅里叶变换近红外光谱同时测定卷烟焦油, 烟碱和一氧化碳的释放量[J].分析化学, 2005,33(6): 793-797.

[8]孙晓荣, 刘翠玲, 吴静珠, 等.基于近红外光谱无损快速检测面粉品质的研究[J].北京工商大学学报: 自然科学版, 2011, 29(4): 68-70.

[9]DUPUY N, GALTIER O, OLLIVIER D, et al.Comparison between NIR, MIR, concatenated NIR and MIR analysis and hierarchical PLS model.Application to virgin olive oil analysis[J].Analytica Chimica Acta, 2010, 666(1): 23-31.

[10]顾聚兴.傅里叶变换红外光谱仪[J].红外, 2009, 30(6): 4.

[11]白雁, 宋瑞丽, 陈志红, 等.NIR 结合 OPUS 软件建立山药中尿囊素定量模型[J].中国医院药学杂志, 2008, 28(22): 1945-1948.

[12]ZHOU Lei, SHEN Dawa, HE Junquan, et al.Multispectroscopic studies for the identi fication of archaeological frankincense excavated in the underground palace of Bao’en Temple, Nanjing: near infrared,midinfrared, and Raman spectroscopies[J].Journal of Raman Spectroscopy, 2012, 43(10): 1504-1509.

[13]王多加, 周向阳, 金同铭, 等.近红外光谱检测技术在农业和食品分析上的应用[J].光谱学与光谱分析, 2004, 24(4): 447-450.

[14]肖昕, 谢新华, 毛兴学, 等.用近红外透射光谱技术测定精米蛋白质含量研究[J].分析测试学报, 2004, 23(4): 43-45.

[15]王伟明, 董大明, 郑文刚, 等.梨果糖浓度近红外漫反射光谱检测的预处理方法研究[J].光谱学与光谱分析, 2013(2): 359-362.

[16]李忠光.植物生理学实验中朗伯-比尔定律及其推导公式的探讨[J].植物生理学通讯, 2010(1): 73-74.

[17]叶莺, 陈崇帼, 林熙.偏最小二乘回归的原理及应用[J].海峡预防医学杂志, 2005, 11(3): 3-6.

[18]ARMENTA S.Partial least squares-near infrared determination of pesticides in commercial formulations[J].Cereal Chemistry, 2007,44(2): 273-278.

[19]赵升红, 黄毅, 刘多强.中红外光谱技术在油品分析中的应用[J].石油化工应用, 2009, 28(7): 6-7.

[20]FRALEY C, RAFTERY A E.How many clusters? Which clustering method? Answers via model-based cluster analysis[J].The Computer Journal, 1998, 41(8): 578-588.

[21]陈军辉, 谢明勇, 王凤美, 等.聚类分析法用于西洋参样品分类研究[J].分析测试学报, 2006, 25(2): 20-24.

[22]柴金朝, 金尚忠.近红外光谱技术在纺织布料聚类分析中的应用[J].红外, 2009, 30(1): 31-35.

[23]高荣强, 范世福, 严衍禄, 等.近红外光谱的数据预处理研究[J].光谱学与光谱分析, 2004, 24(12): 1563-1565.

[24]陈斌, 邹贤勇, 朱文静.PCA 结合马氏距离法剔除近红外异常样品[J].江苏大学学报: 自然科学版, 2008, 29(4): 277-279.

[25]HULLAND J.Use of partial least squares (PLS) in strategic management research: a review of four recent studies[J].Strategic Management Journal, 1999, 20(2): 195-204.

[26]刘福莉, 陈华才, 姜礼义, 等.近红外透射光谱聚类分析快速鉴别食用油种类[J].中国计量学院学报, 2008, 19(3): 278-282.