一种基于梯度拟合的文本图像去模糊方法转让专利

申请号 : CN201310253116.1

文献号 : CN103337055B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 石敏郑宜鹏易清明

申请人 : 暨南大学

摘要 :

本发明公开了一种基于梯度拟合的文本图像去模糊方法,步骤如下:输入待处理的模糊文本图像;选取与待处理文本图像接近的清晰文本图像;统计选取的清晰文本图像梯度分布概率,确定梯度分布先验概率模型;初始化模糊核;计算待处理图像的梯度分布概率,并与模型比较,如果模型不相近,则对待处理文本图像和模糊核进行反卷积操作,然后根据复原效果决定是否进行再次迭代处理,如果需要则调整模糊核的大小和方向继续与模型比较,一旦与模型相近或者达到复原效果,则对复原的文本图像进行去噪处理,输出处理后的文本图像。本发明针对清晰文本图像的梯度分布特点进行建模,有效利用了文本图像的先验信息,更有利于针对模糊文本这类图像的复原处理。

权利要求 :

1.一种基于梯度拟合的文本图像去模糊方法,其特征在于,包括以下步骤:(1)输入待处理的模糊文本图像;

(2)选择与待处理的模糊文本图像相接近的清晰文本图像;相接近的清晰文本图像是指和模糊文本图像字体大小和间距接近的清晰文本图像;

(3)根据清晰文本图像得到梯度分布先验概率模型;

通过线性拟合构建梯度分布先验概率模型为:

其中, 为清晰文本图像的梯度值, 为各个梯度值出现的概率,x为横坐标轴上的梯度值,c0、c1为常数;k0、k1、k2表示构建的梯度分布先验概率模型的分段函数斜率,b0、b1、b2为分段直线函数截距;

(4)初始化模糊核尺寸和方向;

(5)判断待处理的模糊文本图像的梯度分布概率是否与步骤(3)得到的模型接近,如果是,进入步骤(9),否则进入步骤(6);

(6)将当前模糊核与输入的待处理模糊文本图像进行反卷积操作,得到复原图像;

(7)判断步骤(6)所得复原图像是否达到要求或者是否达到最大迭代次数,如果是,进入步骤(9),否则进入步骤(8);

(8)调整模糊核,然后重复步骤(5);

(9)对当前复原的文本图像进行去噪处理;

(10)输出步骤(9)处理得到的文本图像;

所述步骤(5)中判断待处理的模糊文本图像的梯度分布概率是否与步骤(3)得到的模型接近的方法是:设噪声为高斯噪声,则目标函数为:其中,I(x,y)表示要复原出的目标图像,B表示待处理的模糊文本图像,H表示当前模糊核,a表示高斯噪声方差,I表示每次迭代过程中得到的复原图像, 表示构建的梯度分布先验概率模型中的图像梯度值,k代表梯度分布先验概率模型中的k0、k1、k2, 表示2--范数的平方;迭代的终止条件是达到预定的阈值或者达到预定的最大迭代次数。

2.根据权利要求1所述的基于梯度拟合的文本图像去模糊方法,其特征在于,所述步骤(3)中,根据清晰文本图像得到梯度分布先验概率模型的方法是:将步骤(2)所得清晰文本图像转为灰度域图像,求水平或垂直方向的梯度值;统计各个梯度值出现的概率,并对概率值取对数;生成图像梯度分布图,采用最小二乘方法拟合分布曲线,用分段线性函数表示梯度分布先验概率模型。

3.根据权利要求1所述的基于梯度拟合的文本图像去模糊方法,其特征在于,所述步骤(9)中,进行去噪处理的步骤如下:首先是将图像进行二维小波分解,分别得到四层分量:水平分量、垂直分量、斜对角分量、低频分量;然后对前三层分量进行方差估计,确定小波门限阈值,并对每层分量的小波系数进行判断,得到新的小波系数,并重构这些新的小波系数,最后得到去噪的文本图像。

说明书 :

一种基于梯度拟合的文本图像去模糊方法

技术领域

[0001] 本发明涉及图像处理中图像复原研究领域,特别涉及一种基于梯度拟合的文本图像去模糊方法。

背景技术

[0002] 图像的运动模糊主要是拍摄时相机抖动或者拍摄物体的快速移动造成的,使得模糊图像的高频信息丢失,造成边缘模糊,不利于图像的保存和使用。目前图像的去模糊在遥感图像、交通监控等众多领域均有应用,对其研究也成为图像处理领域中的研究热点。
[0003] 图像的模糊退化过程可以理解为原图像与点扩散函数(即模糊核,表示成像系统的位移矢量函数表示式)的卷积操作和加噪过程,而图像的去模糊则为模糊图像与模糊核的反卷积操作。Fergus R,Singh B,Hertzmann A,等人于2006年在ACM Transactions on Graphics上发表的一篇文章“Removing camera shake from a single photograph”公开了一种图像复原方法,该方法主要利用清晰自然图像x轴方向(或者y轴方向)的梯度分布概率服从重尾分布等先验知识,通过判断复原图像的梯度分布是否最大限度的接近重尾分布,如果其接近程度的概率最大,则复原图像即为所求原图像。该算法是基于贝叶斯条件概率框架下的图像复原算法,通过迭代方式使条件概率逼近最大值,当该值满足设定的阈值后,得到的复原图像则认为为所要求的原图像。对于梯度分布如图1所示的自然图像来说,上述方法能够得到较好的复原效果。但是对于梯度分布不完全都服从重尾分布的图像来说,例如对于文本图像,其梯度分布如图2所示,图像复原效果不是很好。
[0004] 因此,寻求一种针对文本图像的、能够得到较好复原效果的图像去模糊方法具有较大的研究意义。

发明内容

[0005] 本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于梯度拟合的文本图像去模糊方法,该方法针对清晰文本图像的梯度分布特点进行建模,有效利用了文本图像的先验信息,更有利于针对模糊文本这类图像的复原处理,从而提升模糊文本图像的去模糊效果。
[0006] 本发明的目的通过以下的技术方案实现:一种基于梯度拟合的文本图像去模糊方法,包括:
[0007] 选择与待去模糊图像接近的清晰文本图像,得到该图像的梯度分布图;
[0008] 通过线性拟合构建梯度分布先验概率模型为:
[0009]
[0010] 其中, 为该清晰文本的图像梯度值, 为各个梯度值出现的概率,x为横坐标轴上的梯度值,c0、c1为常数;k0、k1、k2表示构建的梯度模型的分段函数斜率,b0、b1、b2为分段直线函数截距;
[0011] 根据该模型对待去模糊图像进行复原。
[0012] 具体包括以下步骤:
[0013] (1)输入待处理的模糊文本图像;
[0014] (2)选择与待处理的模糊文本图像相接近的清晰文本图像;
[0015] (3)根据清晰文本图像得到梯度分布先验概率模型;
[0016] (4)初始化模糊核尺寸和方向;
[0017] (5)判断待处理的模糊文本图像的梯度分布概率是否与步骤(3)得到的模型接近,如果是,进入步骤(9),否则进入步骤(6);
[0018] (6)将当前模糊核与输入的待处理模糊文本图像进行反卷积操作,得到复原图像;
[0019] (7)判断步骤(6)所得复原图像是否达到要求或者是否达到最大迭代次数,如果是,进入步骤(9),否则进入步骤(8);
[0020] (8)调整模糊核,然后重复步骤(5);
[0021] (9)对当前复原的文本图像进行去噪处理;
[0022] (10)输出文本图像。
[0023] 具体的,所述步骤(2)中,选取与待处理模糊文本图像接近的清晰文本图像,接近的图像是指和模糊文本图像字体大小和间距接近的清晰文本图像。在应用时,可以根据模糊图像的字体大小和间距,在word等编辑软件中进行编辑,然后截图得到,使输入接近模糊文本图像,这里的“接近”对输入的内容不限制,也不要求十分精确,只要差别不是太大,均可以满足实用的要求。
[0024] 具体的,所述步骤(3)中,根据清晰文本图像得到梯度分布先验概率模型的方法是:将步骤(2)所得清晰文本图像转为灰度域图像,求水平或垂直方向的梯度值;统计各个梯度值出现的概率,并对概率值取对数;生成图像梯度分布图,采用最小二乘方法拟合分布曲线,用分段线性函数表示梯度分布先验概率模型。
[0025] 优选的,所述步骤(5)中判断待处理的模糊文本图像的梯度分布概率是否与步骤(3)得到的模型接近的方法是:设噪声为高斯噪声,则目标函数为:
[0026]
[0027] 其中,I(x,y)表示要复原出的目标图像,B表示待处理的模糊文本图像,H表示当前模糊核,a表示高斯噪声方差,I表示每次迭代过程中得到的复原图像, 表示构建的梯度分布先验概率模型中的图像梯度值,k代表梯度分布先验概率模型中的k0、k1、k2;迭代的终止条件是达到预定的阈值或者达到预定的最大迭代次数。
[0028] 优选的,所述步骤(9)中,进行去噪处理的步骤如下:首先是将图像进行二维小波分解,分别得到四层分量:水平分量、垂直分量、斜对角分量、低频分量;然后对前三层分量进行方差估计,确定小波门限阈值,并对每层分量的小波系数进行判断,得到新的小波系数,并重构这些新的小波系数,最后得到去噪的文本图像。
[0029] 本发明与现有技术相比,具有如下优点和有益效果:
[0030] 1、本发明对模糊文本图像的复原具有更强的针对性。首先是根据清晰文本图像的梯度分布特点进行建模,有效的利用了文本图像梯度的分布先验信息,更有利于针对模糊文本图像的复原处理,从而提升模糊文本图像的去模糊效果。
[0031] 2、本发明中构建的梯度分布模型是用简单的线性分段函数表示,与传统构建的高次函数模型相比,降低了运算复杂度,有效地提升了算法的处理效率,加快了去模糊进程。

附图说明

[0032] 图1是自然图像梯度分布图;
[0033] 图2是文本图像梯度分布图;
[0034] 图3是本发明方法的流程图;
[0035] 图4是本实施例1中待处理的模糊文本图像;
[0036] 图5是图4图像接近的清晰文本图像的梯度分布图;
[0037] 图6是对图5的拟合示意图;
[0038] 图7是采用实施例1所述方法对图4复原后的效果图。

具体实施方式

[0039] 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
[0040] 实施例1
[0041] 相较于现有技术,本发明最大创新点是根据文本图像的梯度分布图特点,通过线性拟合构建一梯度分布先验概率模型,该模型为分段函数,根据该模型对待去模糊图像进行复原。结合图3流程图具体详述如下。
[0042] S1:输入待处理的模糊文本图像。
[0043] 如图4,其大小为185*846。清晰图像的模糊退化过程用下面式子(1)表示,式中B(x,y)表示模糊图像,I(x,y)表示原图像,N(x,y)表示噪声(相机拍摄主要考虑高斯噪声影响),H(x,y)表示模糊核。
[0044]
[0045] 在变换域里,卷积为乘法运算,如式(2)所示。
[0046] B(u,v)=H(u,v)I(u,v)+N(u,v)   (2)
[0047] S2:选择与待处理的模糊文本图像相接近的清晰文本图像。
[0048] 选取与待处理模糊文本图像接近的清晰文本图像。这里接近的图像可以是和模糊文本图像字体大小和间距较接近的清晰文本图像。本实施例中的清晰文本图像标本主要是通过word截图获得的,主要调整的是输入字体的大小和间距,使输入接近模糊文本图像,这里对输入的内容不限制,也不要求十分精确,但是不能差别太大,例如当待处理模糊文本图像所用字体(5号)较小时,而选择的相接近的清晰文本图像字体设为1号,则会影响到梯度模型建立的准确性。因此也要适度进行选择。
[0049] S3:根据清晰文本图像得到梯度分布先验概率模型。
[0050] 将步骤(2)所得清晰文本图像转为灰度域图像,求水平或垂直方向的梯度值;统计各个梯度值出现的概率,并对概率值取对数;生成图像梯度分布图,如图5所示,采用最小二乘方法拟合分布曲线,如图6所示,用分段线性函数表示梯度分布先验概率模型:
[0051]
[0052] 其中, 为文本图像的梯度值, 为各个梯度值出现的概率,c0、c1、k0、k1、k2、b0、b1、b2均通过拟合得到,x为横坐标轴上的梯度值,c0、c1为常数;k0、k1、k2表示构建的梯度模型的分段函数斜率,b0、b1、b2为分段直线函数截距。本实施例中先验概率模型为:
[0053]
[0054] S4:初始化模糊核尺寸和方向。可以随机生成大小和尺寸已知的模糊核。
[0055] S5:判断待处理的模糊文本图像的梯度分布概率是否与步骤(3)得到的模型接近,如果是,则认为该图像已为清晰图像或者通过本文的去模糊算法将得不到很好的复原效果,进入步骤(9),否则进入步骤(6)。求取目标复原图像I(x,y)的目标函数为:
[0056]
[0057] 由贝叶斯条件概率理论,上述过程可以等价地用式(4)表示:
[0058]
[0059] 为迭代过程中得到的复原图像,已知 式(4)中的 与噪声概率等价。假设噪声为高斯噪声,则有:
[0060]
[0061] 将式(3)和式(5)代入式(4)即可求出 如果 达到最大值,则认为复原出来的图像为所求图像。式(4)还可以将求最大值问题变换为求最小值问题,代入转化公式: 避免了指数运算,从而减少了计算量,变换后的公式如
式(6)所示。
[0062]
[0063] S6:将当前模糊核与输入的待处理模糊文本图像进行反卷积操作,得到复原图像。处理公式如下所示:
[0064] I(u,v)=B(u,v)/H(u,v)   (7)
[0065] S7:判断步骤(6)所得复原图像是否达到要求,或者是否达到最大迭代次数,如果是,进入步骤(9),否则进入步骤(8)。
[0066] S8:调整模糊核,然后重复步骤(5)。
[0067] S9:对当前复原的文本图像进行去噪处理。
[0068] 去噪处理首先是将图像进行二维小波分解,分别得到四层分量:水平分量、垂直分量、斜对角分量、低频分量。然后对前三层分量进行方差估计,可用式(8)表示:
[0069]
[0070] 采用式(9)确定小波门限阈值μ:
[0071]
[0072] 式中σ为式(9)计算得到的每层分量的方差估计值。接着根据式(10)对每层分量的小波系数进行判断,公式如下:
[0073]
[0074] 式中sgn表示w的符号。得到新的小波系数,并重构这些新的小波系数,最后得到去噪的文本图像。
[0075] S10:输出文本图像,如图7所示。
[0076] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。