魏洁 黄发忠 辛化梅

摘 要:二维凝胶图像电泳过程中可能出现蛋白质点重叠和堆聚的现象,文章利用图像处理与分析技术设计了一种有效重叠蛋白质点分离的算法。利用多边形近似方法,将检测到的蛋白质点边缘转化成数字边界,对该数字边界用多边形进行有效近似,计算近似多边形顶点对应的内角,通过阈值的设定,得到边界上的凹点,对凹点进行匹配连线,从而实现对重叠蛋白质点的有效分割。

关键词:凝胶图像;重叠蛋白质点;多边形近似;凹点;分割

引言

在二维凝胶图像中,大量的蛋白质点以圆或者椭圆的形式存在,它们有着不同的大小,不同的蛋白质点有占有相同凝胶表面的趋势,这就导致了一些点的部分重叠,从而形成难以分析的点重叠区[1],影响蛋白质点的准确检测。利用数字图像处理与分析技术设计一种有效的重叠蛋白质点分离算法,对提高蛋白质点检测的精度和可信度具有重要的意义。

现有的蛋白质点检测方法主要可以分为基于模型、基于分割以及基于特定新理论的检测方法。其中基于模型的方法是采用某种数学模型,如高斯函数和扩散函数,拟合蛋白质点的灰度值,从而得到蛋白质点的边界和体积,实现蛋白质点的检测[2]。基于分割的方法是将凝胶图像分成多个小区域,每个区域理论上只包含一个蛋白质点[3]。基于特定新理论的检测方法,如基于水平集的检测方法,利用这一数学理论对能量函数进行极小值求解的曲线演化过程,最终获得目标轮廓边缘从而进行蛋白质点检测[4]。已有的蛋白质点检测方法未能很好的分离重叠蛋白质点,文章提出一种基于最小周长多边形近似[5](Minimum Perimeter Polygon,MPP)的重叠蛋白质点分割方法,用逼近蛋白质点数字边界的多边形来近似表示蛋白质点边界,再利用凹点匹配对得到的近似多边形的顶点进行匹配连线,达到有效分离重叠蛋白质点的效果。

1 基于区域跟踪的蛋白质点预分割方法

区域跟踪能给出二值图像中所有物体的内边界和外边界,在图像中寻找满足某种检测准则的点,将其全部邻点进行检查,将具有相似属性如强度,灰度级,纹理颜色等的相邻点及该点全部合并,从而产生小块目标区域。然后检查该区域的全部邻点,并把满足该检验准则的点并入该区域,经过迭代过程,直到处理完每个像素,形成不同的区域[6]。

基于区域跟踪算法,首先对图像1-(a)进行预处理并得到其二值图像,遍历该二值图像,标记第一个像素块的第一个前景像素(i,j);对该像素八邻域逆时针搜索,若搜索到前景像素,则将(i,j)更新为(i',j'),进行标记;不断执行上步直到再次遇见该像素块的第一个前景像素;继续遍历图像,直到处理完整幅图像,得到图1-(b)。

通过区域跟踪方法得到凝胶蛋白质点的初始外围轮廓信息,为后续重叠点的分离奠定了基础。

2 重叠蛋白点的判别

其中,L表示检测得到的蛋白质边界的周长,用边缘相邻像素间距离之和表示;S表示检测得到的蛋白质点的面积,可以用该区域内像素个数来表示。

对于蛋白质点重叠现象,可以分为三种情况:(1)单向双点重叠,两个蛋白质点相互重叠;(2)单向多点重叠,多个蛋白质点沿同一方向重叠;(3)多向重叠,蛋白质相互重叠部分的中心两两连线或其延长线组成一个多边形。

3 基于MPP算法的重叠蛋白质点分割

3.1 基于MPP算法的多边形近似方法

在重叠蛋白质点的判别中,我们已经将重叠蛋白质点区域提取出来,下一步需要对其进一步分离。

数字边界可以用多边形近似来逼近,多边形的计算可以用多边形边的线性关系来表示,这样有利于得到一个区域的近似值。多边形与链码及边界分段表示相比,具有更强抗噪声的能力,当边界上的点数与多边形的线段点数相同时,多边形能准确的表达边界。利用多边形近似不仅用最少的线段来表示边界,而且能够表达原图像边界的本质形状。

利用周长最小的多边形近似表示边界[8],将边界看作是介于多边形内外界墙之间的有弹性的线。当它在内外界限的限制之下收缩紧绷的时候,就可以得到最小边界,它使用单元条闭合了该区域。

3.2 凹点的判别

在凝胶图像的判别中,重叠蛋白质点都有一个共同特征,就是重叠区域会存在凹陷[9],因此,通过判断近似多边形顶点内角的大小来作为进一步判断蛋白质点是否发生重叠的分离依据。

近似多边形每个顶点对应的内角大小可以通过该点与前后点分别连接得到的向量的夹角大小来表示,该点与前点组成的向量和与后点组成的向量的夹角大于180°时,该点为凹点,当该夹角小于180°时,该点为凸点。如图3所示,I 为凸角对应凸点,II为为凹角对应凹点。

3.3 分离线的确定

在得到蛋白质边界的凹点之后,进行凹点的匹配,确定分离线[10],分割重叠蛋白质点。

当得到的凹点个数n=1时,判定该凹点为由噪声引起的凹陷;对单向双点重叠情况,只有一对凹点,直接连接两个凹点;对单向多点重叠的情况,将凹点分别向中心轴线做投影,投影点距离最近,且对应凹点连线距离最短为匹配的凹点[11];对多向重叠情况,要结合蛋白质点本身是圆形或者椭圆形[3],并且遵循凹点连线的延长线两两相交的原则匹配凹点。

3.4 实验结果及分析

从结果来看,图7较图1-(b)而言,分割更为准确,实现了蛋白质点中重叠部分的有效分割。文章分割方法有良好的抗噪性能,对于绝大多数重叠区域具有较好的分割效果,但对于极少数蛋白质点边缘不规则,与之粘连的蛋白质点的点径相当于其突起的情况,无法精确分离。改进的方法是在凹点检测和匹配时结合蛋白质点的形状、面积分布等进行匹配修正,寻找最匹配的点。

4 结束语

为了解决蛋白质点预分割之后,重叠蛋白质点的分离问题,提出了利用基于多边形近似蛋白质点进而寻找匹配凹点,对重叠蛋白质点进行分离的的算法。实际情况中存在非常复杂的蛋白质点重叠现象,要准确分割所有重叠蛋白质点需要考虑蛋白质的生物性质,间距等更多参数,进一步的工作是寻找一种自适应的分离方法来分割重叠情况更加复杂的蛋白质点。

参考文献

[1]Michalis Savelonas,Dimitris Maroulis,Eleftheria. segmentation of two-dimentional gel electrophoresis image containing overlapping spots [J].IEEE,2009.

[2]Serackis T, Kambhamettu C. An image analysis suite for spot detection and spot matching intwo-dimensional electrophoresis gels [J].Electrophoresis,2008,29(3):706-715.

[3]张超.基于模糊形态学和分水岭的蛋白质点检测方法研究[D].南昌航空大学.

[4]闫克裕.基于水平集的牛乳体细胞图像分割[D].内蒙古农业大学,2008.

[5]J Sklansky,R L Chazin,B J Hansen. Minimum perimeter polygons of digitized silhuettes[J].IEEE Trans. Computers,1972.

[6]张德丰.详解MATLAB数字图像处理[M].电子工业大学出版社:260-268.

[7]傅蓉.细胞重叠与融合性图像的分离与分割技术研究[D].南方医科大学,2007.

[8]Gonzalez Rafael C,Woods Richard E. Digital image processing [M].电子工业出版社,2007.

[9]韦冬冬,赵豫红.基于凹点匹配的重叠图像分割算法[J].计算机与应用化学,2010,27(1):99-102.

[10]苏娜,薛河儒.重叠牛乳体细胞判别和分割方法的研究[J].计算机工程,2011,37(7):231-233.

[11]刘伟华,隋青美.基于凹点搜索的重叠粉体颗粒的自动化分离算法[J].电子测量与仪器学报,2010,24(12):1095-1100.

作者简介:魏洁(1988-),女,山东潍坊,山东师范大学硕士研究生,研究方向为信号与信息处理。

黄发忠,男,山东济南,副教授,研究方向为信号与信息处理。

辛化梅,女,山东青岛,博士,副教授,研究方向为信号与信息处理。