一种基于边缘检测的生物芯片样点识别方法转让专利

申请号 : CN201110006888.6

文献号 : CN102073876B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 胡松严伟李艳丽

申请人 : 中国科学院光电技术研究所

摘要 :

本发明提出了一种基于边缘检测的生物芯片样点识别方法,该方法首先通过边缘提取、边缘连接、区域填充确定出样点的真实区域,再运用扫描法划分网格,自动获得样点行、列数及总数。最后将确定出的每个网格内的样点区域位置与原图对应,自动搜索获得原图中样点的面积及灰度均值;将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得到样点的自动识别结果。该方法具有很高的定位精确性,并且其软件实现较简单、算法时间短,操作方便、快捷,使生物芯片信息提取的完全自动化和智能化成为可能。

权利要求 :

1.一种基于边缘检测的生物芯片样点识别方法,其特征在于,该方法包括的步骤如下:步骤S1:对生物芯片连续拍摄多幅图,合成取其平均值作为原图;

步骤S2:对原图进行样点边缘提取,对样点边缘运用形态学中的膨胀运算进行边缘连接及对样点边缘内进行区域填充,将原图转化为样点区域为黑色,背景区域为白色的二值图像,以此来确定样点的真实区域;

步骤S3:运用扫描法对生物芯片图像进行网格划分,得到生物芯片的网格,保证每个网格内只有一个样点,并自动确定样点阵列的行、列数,根据生物芯片的网格对样点按行依次进行编号;

步骤S4:记录下二值图像中每个网格内黑色像素点的位置,每个网格内黑色像素点的位置它与原图中样点区域的位置一一对应;根据这些位置信息,获取并保存原图中样点的面积及灰度值;

步骤S5:将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得到样点的自动识别结果;

所述样点边缘提取的步骤是:

步骤S21:根据原图像的灰度梯度信息,运用自适应阈值的Canny算法自动提取原图中的样点边缘;

步骤S22:如果自动提取边缘失败,则转为手工描绘边缘;

所述自适应阈值确定的步骤如下:

步骤S211:将Canny运算中非极值抑制后的图像像素点划分为D1,D2,D3三个类别,其中D1包含梯度幅值为{t1,t2,.....tk}的像素,代表着原图中的非边缘点;D2包含梯度幅值为{tk+1,tk+2,.....tm}的像素,代表着原图中需要判断是否为边缘点的点;D3包含梯度幅值为{tm+1,tm+2,.....tl}的像素,代表着原图中的边缘点;

步骤S212:设原图中总的像素数为N,灰度梯度为ti对应的像素数为ni,则灰度梯度ti出现的概率为:pi=ni/N,i=1,2.....,l,则整幅图像素的灰度梯度幅值期望为发生在D1,D2,D3类内像素的梯度幅值期望e1(k)、e2(k,m)、e3(m)分别为:并且定义

定义评价函数

2 2 2 2

σ(k,m)=(e1(k)-E)·p(k)+(e2(k,m)-E)·p(k,m)+(e3(m)-E)·p(m)(4)即

对于一幅已知图,上式中的灰度梯度ti出现的概率pi通过它的梯度直方图求出,梯度等级l人为地确定;因此上式即为一个关于k和m的二元二次函数,k在[1,l]之间取值,2

m在[k+1,l]之间取值;σ(k,m)描述了类间方差,而类间方差最大化是数理统计意义上类2

间分离性最好的判据之一;因此能搜索σ(k,m)的最大值,其最大值对应的tk,tm的值即为D1,D2,D3区间的分界点,也即为所求的Canny算子的高、低阈值;p表示具体某个梯度出现的概率;D1,D2,D3是根据图像像素的灰度梯度划分的三个类别;t表示图像像素的灰度梯度;

i=1,2…k…m…l表示梯度等级,N表示图像总的像素;ni表示灰度梯度为ti对应的像素个数;p(k)表示第一类像素点出现的概率,p(k,m)表示第二类像素点出现的概率,p(m)表示第三类像素点出现的概率。

2.如权利要求1所述的基于边缘检测的生物芯片样点识别方法,其特征在于,确定所述样点面积及灰度值是将原图与二值图像进行对比,记录下二值图像中黑色像素点的位置,获取原图中相应位置处样点的面积及灰度值。

说明书 :

一种基于边缘检测的生物芯片样点识别方法

技术领域

[0001] 本发明属于图像识别技术领域,涉及一种生物芯片图像样点的识别方法,特别涉及一种基于边缘检测的生物芯片图像样点的识别方法。

背景技术

[0002] 生物芯片是在面积不大的基片表面上有序地点阵排列一系列固定于一定位置的可寻址的识别分子,而这些样点分子就携带了大量的生物信息。通过筛选与检测分析,人们可以快速地获取样品中的生物信息。因此生物芯片技术就成了生命科学工作者研究基因表达分析、疾病诊断、新药物发现等众多领域的重要工具。
[0003] 生物芯片信息处理过程就是对生物芯片的成像结果进行分析其样点的吸光度值、面积或吸光度比。通过对样点的吸光度进行统计分析提取出重要的生物信息。因此能否准确地提取出样点的吸光度值也即灰度值将直接影响到芯片检测结果的精确度。目前生物芯片还没有国际或行业标准,生物芯片的布局并不一致,在点样过程中由于点样仪或探针的抖动造成的点样飘移,点样误差等导致图像不一致。另外在芯片的制作过程中,反应、清洗或测定过程中难免会有灰尘或待测样品的碎片等的干扰,严重制约了生物芯片样点的自动识别,从而影响了生物芯片信息提取的准确性。目前大多数的商业化软件均采取了手动定位阵列样点的方法,该方法首先选择需要识别的区域,然后输入芯片阵列的行列数、样点半径和阵列的行列间距,接着由计算机自动产生一个圆圈阵列,调整圆圈阵列,将其套在样点阵列上,使每个圆圈内包含一个样点。由于样点飘移或者尺寸差别较大,最后需要手动对某些样点进行调整。这种手动定位的方法具有一定的灵活性,但是由于是手工操作,因此会加大操作的工作量,而且不利于实现整个芯片应用过程的自动化。多数情况下样点的形状并非绝对的圆形,如果仍以圆圈去包含每个样点,其计算的样点面积和吸光度值必定有误差,并且手工定位的随意性较大,数据重复性和可靠性难以得到保证。

发明内容

[0004] 针对现有技术需要人为的输入芯片阵列的行列数、样点半径和阵列的行列间距,对样点的定位不精确,其数据重复性和可靠性难以得到保证,且自动化程度不高的缺陷,本发明的目的是要提出一种基于边缘检测的生物芯片图像样点的识别方法。
[0005] 为实现所述目的,本发明提出基于边缘检测的生物芯片识别方法,该方法解决技术问题的技术方案包括步骤如下:
[0006] 步骤S1:对生物芯片连续拍摄多幅图,合成取其平均值作为原图;
[0007] 步骤S2:对原图进行样点边缘提取,对样点边缘运用形态学中的膨胀运算进行边缘连接及对样点边缘内进行区域填充,将原图转化为样点区域为黑色,背景区域为白色的二值图像,以此来确定样点的真实区域;
[0008] 步骤S3:运用扫描法对生物芯片图像进行网格划分,得到生物芯片的网格,保证每个网格内只有一个样点,并自动确定样点阵列的行、列数,根据生物芯片的网格对样点按行依次进行编号;
[0009] 步骤S4:记录下二值图像中每个网格内黑色像素点的位置,每个网格内黑色像素点的位置它与原图中样点区域的位置一一对应;根据这些位置信息,获取并保存原图中样点的面积及灰度值;
[0010] 步骤S5:将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得到样点的自动识别结果。
[0011] 本发明的优点在于运用样点边缘来确定样点的实际区域,避免了用圆圈包含非规则圆形样点时产生的误差,同时排除了背景噪声的干扰,真实的反应了样点的实际面积及灰度;自动获得样点行列数并对样点进行编号,让编号与样点识别结果一一对应,打印结果清晰明了,便于医学分析;同时对于大部分生物芯片图像,是可以较好地提取出其样点的边缘。对于少数图像,由于拍摄环境、光照及芯片样点本身的荧光度的影响,拍出的样点图像中个别样点可能对比度偏低、颜色偏浅,最终提取的边缘可能有较大的断裂,甚至无法提取。这时可以人为地描绘这些样点的边缘。虽然少数情况下仍然有人工干预,但相对于传统圆圈包含样点的方法,本发明大大提高了识别精度。对大部分图像,本发明完全实现了自动化,无需人为输入任何参数,减小了人为操作可能导致的误差。而且本发明方法的软件实现较简单、算法时间短,操作方便、快捷。综上所述,基于边缘检测的样点识别算法为生物芯片图像分析领域提供了一种方便有效地分析手段。

附图说明

[0012] 图1是一幅4×5的生物蛋白芯片的扫描图。
[0013] 图2是根据边缘检测方法确定的样点区域。
[0014] 图3是对二值化后图像运用行列扫描法所获得的列投影波形。
[0015] 图4是根据二值化图像的投影结果划分的网格。
[0016] 图5是本发明的总流程图。

具体实施方式

[0017] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0018] 附图5示出采用VC++ 6.0编程实现整个流程,并在EBS-1型便携式生物芯片检测2
系统中实现。其中便携式生物芯片检测系统的主要参数有均匀照明性1%@2CM,照明面积
2
2CM,图像采集速度24帧/秒。同时参照附图,对本发明作进一步详细说明。
[0019] 步骤S1:对生物芯片连续拍摄多幅图,合成取其平均值作为原图;
[0020] 步骤S2:对原图进行样点边缘提取,对样点边缘运用形态学中的膨胀运算进行边缘连接及对样点边缘内进行区域填充,将原图转化为样点区域为黑色,背景区域为白色的二值图像,以此来确定样点的真实区域;
[0021] 步骤S3:运用扫描法对生物芯片图像进行网格划分,得到生物芯片的网格,保证每个网格内只有一个样点,并自动确定样点阵列的行、列数,根据生物芯片的网格对样点按行依次进行编号;
[0022] 步骤S4:记录下二值图像中每个网格内黑色像素点的位置,每个网格内黑色像素点的位置它与原图中样点区域的位置一一对应;根据这些位置信息,获取并保存原图中样点的面积及灰度值;
[0023] 步骤S5:将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得到样点的自动识别结果。
[0024] 所述样点边缘提取的步骤是:
[0025] 步骤S21:根据原图像的灰度梯度信息,运用自适应阈值的Canny算法自动提取原图中的样点边缘;
[0026] 步骤S22:如果自动提取边缘失败,则转为手工描绘边缘。
[0027] 上述方案中,对自动提取边缘和手工描绘边缘的二值图像进行形态学腐蚀运算,再进行形态学开运算,最终确定出样点的真实区域。
[0028] 上述方案中,确定所述样点面积及灰度值是将原图与二值图像进行对比,记录下二值图像中黑色像素点的位置,获取原图中相应位置处样点的面积及灰度值。
[0029] 上述方案中,所述自适应阈值的确定步骤如下:
[0030] 步骤S211:将Canny运算中非极值抑制后的图像像素点划分为D1,D2,D3三个类别,其中D1包含梯度幅值为{t1,t2,……tk}的像素,代表着原图中的非边缘点;D2包含梯度幅值为{tk+1,tk+2,……tm}的像素,代表着原图中需要判断是否为边缘点的点;D3包含梯度幅值为{tm+1,tm+2,……tl}的像素,代表着原图中的边缘点;
[0031] S212:设原图中总的像素数为N,灰度梯度为ti对应的像素数为ni,灰度梯度ti出现的概率为:pi=ni/N,i=1,2……,l,则整个区间的梯度幅值期望为:
[0032]
[0033] 发生在D1,D2,D3类内像素的梯度幅值期望e1(k)、e2(k,m)、e3(m)分别为:
[0034]
[0035] 并且定义
[0036] 定义评价函数2 2 2 2
[0037] σ(k,m)=(e1(k)-E)·p(k)+(e2(k,m)-E)·p(k,m)+(e3(m)-E)·p(m)(4)即[0038]
[0039] 对于一幅已知图,上式中的灰度梯度ti出现的概率pi通过它的梯度直方图求出,梯度等级l人为地确定;因此上式即为一个关于k和m的二元二次函数,k在[1,l]之间取2
值,m在[k+1,l]之间取值;σ(k,m)描述了类间方差,而类间方差最大化是数理统计意义
2
上类间分离性最好的判据之一。因此可以搜索σ(k,m)的最大值,其最大值对应的tk,tm的值即为D1,D2,D3区间的分界点,也即为所求的Canny算子的高、低阈值。σ表示三个区间的类间方差;p表示具体某个梯度出现的概率;D1,D2,D3是根据图像像素的灰度梯度划分的三个类别;t表示图像像素的灰度梯度;i=1,2…k…m…l表示梯度等级,N表示图像总的像素;ni表示灰度梯度为ti对应的像素个数;p(k)表示第一类像素点出现的概率,p(k,
2
m)表示第二类像素点出现的概率,p(m)表示第三类像素点出现的概率;σ(k,m)表示三个类别的类间方差。
[0040] 本发明针对生物芯片的图像特征提出了一种基于边缘检测的生物芯片识别方法,首先运用自适应阈值的Canny算法对一幅4×5的生物蛋白芯片的扫描图进行边缘提取,再运用形态学中的膨胀运算进行边缘连接,接着对边缘内进行区域填充,然后对填充后的图像进行形态学的腐蚀运算,先膨胀后腐蚀相当于形态学闭操作,最后对腐蚀后的图像进行形态学开操作。先闭后开操作一方面去除了图像中的噪声,另一方面确保了样点区域的真实有效。对形态学滤波后的图像分别进行行、列投影,根据投影波形图,把相邻两个波峰之间距离的中点处确定为一条分界线,其划分结果如图4;网格划分后,就可以自动确定出样点阵列的行列数,并对网格进行编号,也即对网格内样点进行编号。再分别对每个网格内进行搜索,遇到黑色像素点,就记录下它的位置信息,此位置信息与原图中样点区域位置对应,因此可以获得原图中相应位置处样点的面积(像素个数)、灰度值。
[0041] 输出结果如下表:
[0042]
[0043] 由以上实施例可以看出,将边缘检测引入生物蛋白芯片的图像分析过程,能自动获得样点的精确位置、样点数、样点面积、样点灰度值。对于大部分生物芯片图像是可以成功地提取出其样点的边缘,只要边缘提取成功整个过程就完全实现了自动化,真正达到了生物芯片的自动识别。
[0044] 图1是对一幅4×5的生物蛋白芯片样点图进行多次扫描、合成再取其平均值后的结果图。
[0045] 图2是根据自适应阈值的Canny算法进行边缘检测确定出的样点区域。
[0046] 图3是对二值化后的图像(图2)运用行列扫描法所获得的列投影波形。
[0047] 图4是根据投影波形把相邻两个波峰之间距离的中点处确定为一条分界线,并对二值化后的图像进行网格划分的结果。
[0048] 以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。