文字识别中粘连字符的切分方法和装置转让专利

申请号 : CN201010114226.6

文献号 : CN102169542B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王琛

申请人 : 汉王科技股份有限公司

摘要 :

本发明公开了文字识别中粘连字符的切分方法和装置,属于文字识别领域。方法包括:预处理后获得行图像的连通域、平均字宽和平均字高。进行连通域分析,标记粘连的连通域,对选定的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域保存字块。根据预切分点对提取完毕的笔画进行合并,得到字块。保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列。根据参考信息对字块进行合并,输出识别结果。本发明依据预切分点对笔画进行合并得到字块,保证了更大范围的切分点被检测到;用轮廓信息预检测切分点的方式作为合并时的参数,避免了正确的切分点被合并而带来的合并错误。

权利要求 :

1.一种文字识别中粘连字符的切分方法,其特征在于,包括如下步骤:

对输入的行图像进行预处理,获得行图像的连通域、平均字宽和平均字高,所述预处理包括对行图像进行去噪,获得行图像的连通域,分别对连通域的宽度直方图和高度直方图进行平滑,取峰值作为平均字宽和平均字高;

进行连通域分析,标记粘连的连通域,对标记的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域直接保存字块;所述对标记的粘连的连通域进行笔画提取时,在标记的连通域内逐行对黑游程进行扫描,取当前黑游程在下一行的对应位置处,且始终点位置各偏移一个像素的范围内的所有黑游程,选择这些黑游程中游程中心与笔画的预测中心最近的黑游程作为待选游程,如果待选黑游程的中心与预测中心点的距离误差小于阈值Thr,则将待选黑游程加入到的该笔画的游程列表中,否则当前笔画提取完毕,开始下一笔画的跟踪,直至该连通域内所有笔画提取完毕;

根据预切分点对提取完毕的笔画进行合并,得到字块;

保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列;

根据参考信息对字块进行合并,输出识别结果。

2.根据权利要求1所述的方法,其特征在于,所述粘连的连通域为识别距离大于识别阈值或连通域的宽度大于平均字宽的1.5倍或连通域的宽度大于平均字高两倍的连通域。

3.根据权利要求2所述的方法,其特征在于,所述对粘连的连通域进行切分点检测时,选取连通域的投影的波谷作为预切分点。

4.根据权利要求1所述的方法,其特征在于,所述游程列表的属性中包括游程所在的行、游程的起始点和终止点。

5.根据权利要求1所述的方法,其特征在于,所述笔画的预测中心根据当前笔画方向预测得出。

6.根据权利要求5所述的方法,其特征在于,所述当前笔画方向根据笔画中的已有游程的中心拟合得出。

7.根据权利要求1所述的方法,其特征在于,所述阈值Thr的值为Thr=

0.5×a×tan(θ);其中,θ为笔画与竖直方向的夹角,a是笔画的竖直高度。

8.根据权利要求1所述的方法,其特征在于,所述对提取完毕的笔画进行合并时,如果两个笔画的外接矩形框在水平方向上相互包含比例在既定阈值之上,且两笔画的中心在预切分点的同侧,则对两笔画以及笔画对应的游程列表进行合并,作为一个字块。

9.根据权利要求8所述的方法,其特征在于,所述既定阈值为0.7。

10.根据权利要求1所述的方法,其特征在于,所述参考信息为语义和识别信息。

11.一种文字识别中粘连字符的切分装置,其特征在于,包括如下模块:

预处理模块:对输入的行图像进行预处理,获得行图像的连通域、平均字宽和平均字高,所述预处理包括对行图像进行去噪,获得行图像的连通域,分别对连通域的宽度直方图和高度直方图进行平滑,取峰值作为平均字宽和平均字高;

分析模块:进行连通域分析,标记粘连的连通域,对标记的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域直接保存字块;所述对标记的粘连的连通域进行笔画提取时,在标记的连通域内逐行对黑游程进行扫描,取当前黑游程在下一行的对应位置处,且始终点位置各偏移一个像素的范围内的所有黑游程,选择这些黑游程中游程中心与笔画的预测中心最近的黑游程作为待选游程,如果待选黑游程的中心与预测中心点的距离误差小于阈值Thr,则将待选黑游程加入到的该笔画的游程列表中,否则当前笔画提取完毕,开始下一笔画的跟踪,直至该连通域内所有笔画提取完毕;

合并模块:根据预切分点对提取完毕的笔画进行合并,得到字块;

字块输出模块:保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列;

结果输出模块:根据参考信息对字块进行合并,输出识别结果。

说明书 :

文字识别中粘连字符的切分方法和装置

技术领域

[0001] 本发明属于文字识别领域,涉及一种字符切分的方法和装置,具体涉及一种文字识别中粘连字符的切分方法和装置。

背景技术

[0002] 文字识别过程中,字符切分是很重要的一部分。文字识别,尤其是脱机手写文字识别一般采用过切分的方法,即首先检测多个可能的切分点,然后再通过几何、识别或语义等信息对切分点进行合并,搜索最优的切分路径。
[0003] 检测切分点的方法有很多种,印刷体文字识别中的切分点检测比较简单,但在手写体的文字识别中,手写粘连的情况较为复杂,轮廓中虚假的波峰、波谷很多,而且真正的切分点上可能在上轮廓和下轮廓均有粘连,使得轮廓变化反而比较平缓,所以仅仅通过轮廓信息确定切分点并不可靠。
[0004] 目前,脱机手写字符的切分点查找主要有如下两种方法,第一种是以连通域为基础,通过识别效果或者几何信息判断可能包含粘连字符的连通域,然后在可疑的连通域中使用轮廓等信息进行切分,这种方法的准确率依赖于识别效果和几何信息,对于手写字符识别来说并不可靠,而且根据轮廓信息进行切分也无法确定切分点。另一种方法以笔画切分为基础,对切分后的脱机手写字符中的笔画合并成笔画块,但合并时重叠的笔画有可能发生重叠,使两个连通域中的笔画由于位置重叠而被合并,造成合并不准确。

发明内容

[0005] 本发明所要解决的技术问题是提供一种文字识别中粘连字符的切分方法和装置,本方法首先对图像进行连通域分析,对一些疑似粘连的连通域检测预切分点,然后采用查找黑游程的方式对疑似粘连的连通域进行笔画切分,最后依据预切分点等信息对笔画进行合并得到字块。本方法采用笔画切分的方法,保证了更大范围的切分点被检测到;使用轮廓信息预检测切分点的方式作为合并时的参数,避免了正确的切分点被合并而带来的合并错误。
[0006] 本发明公开了一种文字识别中粘连字符的切分方法,包括以下步骤:
[0007] 对输入的行图像进行预处理,获得行图像的连通域、平均字宽和平均字高。
[0008] 进行连通域分析,标记粘连的连通域,对选定的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域直接保存字块。
[0009] 根据预切分点对提取完毕的笔画进行合并,得到字块。
[0010] 保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列。
[0011] 根据参考信息对字块进行合并,输出识别结果。
[0012] 所述预处理包括对行图像进行去噪,获得行图像的连通域,分别对连通域的宽度直方图和高度直方图进行平滑,取峰值作为平均字宽和平均字高。
[0013] 所述粘连的连通域为识别距离大于识别阈值或连通域的宽度大于平均字宽的1.5倍或连通域的宽度大于平均字高两倍的连通域。
[0014] 所述对粘连的连通域进行切分点检测时,选取连通域的投影的波谷作为预切分点。
[0015] 所述对粘连的连通域进行笔画提取时,在选定的连通域内逐行对黑游程进行扫描,取当前黑游程在下一行的对应位置处,且始终点位置各偏移一个像素的范围内的所有黑游程,选择这些黑游程中游程中心与笔画的预测中心最近的黑游程作为待选游程,如果待选黑游程的中心与预测中心点的距离误差小于阈值Thr,则将待选黑游程加入到的该笔画的游程列表中,否则当前笔画提取完毕,开始下一笔画的跟踪,直至该连通域内所有笔画提取完毕。
[0016] 所述游程列表的属性中包括游程所在的行、游程的起始点和终止点。
[0017] 所述笔画的预测中心根据当前笔画方向预测得出。
[0018] 所述当前笔画方向根据笔画中的已有游程的中心拟合得出。
[0019] 所述阈值Thr的值为Thr=0.5×a×tan(θ);其中,θ为笔画与竖直方向的夹角,a是笔画的竖直高度。
[0020] 所述对提取完毕的笔画进行合并时,如果两个笔画的外接矩形框在水平方向上相互包含比例在既定阈值之上,且两笔画的中心在预切分点的同侧,则对两笔画以及笔画对应的游程列表进行合并,作为一个字块。
[0021] 所述既定阈值为0.7。
[0022] 所述参考信息为语义和识别信息。
[0023] 本发明还公开了一种文字识别中粘连字符的切分装置,包括如下模块:
[0024] 预处理模块:对输入的行图像进行预处理,获得行图像的连通域、平均字宽和平均字高。
[0025] 分析模块:进行连通域分析,标记粘连的连通域,对选定的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域直接保存字块。
[0026] 合并模块:根据预切分点对提取完毕的笔画进行合并,得到字块。
[0027] 字块输出模块:保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列。
[0028] 结果输出模块:根据参考信息对字块进行合并,输出识别结果。
[0029] 从以上的步骤可以看出,本方法仅对疑似粘连连通域进行分析,与对整幅图像进行笔画提取等处理相比,极大的减少了运算时间和存储空间;本方法采用笔画切分时,对粘连的连通域进行切分点检测,选取连通域的投影的波谷作为预切分点,防止了由于位置重叠而带来的合并错误,使字符切分准确,取得了较好的效果。

附图说明

[0030] 图1为本发明文字识别中粘连字符的切分方法的流程图;
[0031] 图2为本发明文字识别中粘连字符的切分方法的实施例中输入的行图像;
[0032] 图3为本发明文字识别中粘连字符的切分方法的实施例中进行预处理后得到的连通域块;
[0033] 图4为本发明文字识别中粘连字符的切分方法的实施例中的连通域宽度直方图;
[0034] 图5为本发明文字识别中粘连字符的切分方法的实施例中的连通域高度直方图;
[0035] 图6为本发明文字识别中粘连字符的切分方法的实施例中连通域平滑后的宽度直方图;
[0036] 图7为本发明的文字识别中粘连字符的切分方法的实施例中连通域平滑后的高度直方图;
[0037] 图8为本发明文字识别中粘连字符的切分方法的实施例中输入的行图像,其中,框选的连通域为粘连的连通域;
[0038] 图9为本发明文字识别中粘连字符的切分方法实施例中一粘连的连通域图像;
[0039] 图10为本发明文字识别中粘连字符的切分方法实施例中一粘连的连通域轮廓图;
[0040] 图11为本发明文字识别中粘连字符的切分方法实施例中粘连的连通域中两笔画与预切分点关系示意图;
[0041] 图12为本发明文字识别中粘连字符的切分方法实施例中笔画游程列表示意图;
[0042] 图13为本发明文字识别中粘连字符的切分方法的实施例中笔画提取示意图;
[0043] 图14为本发明文字识别中粘连字符的切分方法实施例中粘连的连通域笔画提取结果;
[0044] 图15为本发明文字识别中粘连字符的切分方法实施例中粘连的连通域中粘连部分示例;
[0045] 图16为本发明文字识别中粘连字符的切分方法另一实施例中粘连的连通域中粘连部分示例;
[0046] 图17为本发明文字识别中粘连字符的切分方法实施例中粘连的连通域中笔画合并后结果;
[0047] 图18为本发明文字识别中粘连字符的切分方法实施例中输出的识别结果。

具体实施方式

[0048] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0049] 一种文字识别中粘连字符的切分方法,如图1所示,分为以下步骤:
[0050] 步骤1:对输入的行图像进行预处理,获得行图像的连通域、平均字宽和平均字高。如图2所示,为输入的某行图像,如图3所示,为该图像进行预处理后得到的连通域块。
[0051] 预处理包括对行图像进行去噪,获得行图像的连通域,分别对连通域的宽度直方图和高度直方图进行平滑,取峰值作为平均字宽和平均字高。
[0052] 将图2中的图像去噪后,按照直线扫描标记算法求取连通域,对得到的连通域进行投影,得到宽度直方图。为了消除连通域中的奇异点对平均字宽所造成的影响,将宽度直方图进行平滑,取其中的宽度直方图中峰值作为平均字宽;同理可求平均字高。如图4、图5分别为输入行图像的连通域宽度直方图和高度直方图,图6和图7为平滑后的宽度直方图和高度直方图,分别其峰值作为平均字宽W和平均字高H。本实施例中,平均字宽W为45px,平均字高H为65px。
[0053] 步骤2:进行连通域分析,标记粘连的连通域,对选定粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于不粘连的连通域直接保存字块。
[0054] 进行连通域分析,标记粘连的连通域。对每个连通域进行识别,如果某个连通域识别效果较差(识别距离大于识别阈值),或者连通域的宽度较大(连通域的宽度大于平均字宽的1.5倍或者连通域的宽度大于平均字高的两倍),则标记该连通域为粘连的连通域。本实施例中,识别阈值根据识别核心来确定,如图8所示,得到11个粘连的连通域,用矩形框进行标记。如果某个连通域识别效果较好(识别距离不大于识别阈值),或者连通域的宽度较小(连通域的宽度不大于平均字宽的1.5倍或者连通域的宽度不大于平均字高的两倍),则该连通域为非粘连的连通域,转到步骤4直接保存字块。
[0055] 切分点预检测时,使用轮廓、投影和宽高等信息对可疑连通域进行切分点检测。选取轮廓和投影的波谷作为切分点。图9为图8中的一个粘连的连通域图像,图10分别为该连通域的轮廓图,可以看出轮廓图的波谷点的水平方向坐标为38和66,表示这两个位置为字块间的粘连位置,该位置即被选中为预切分点。如图11中的P1位置所示,该位置为切分点预测的预测位置。在笔画合并前进行切分点预检测的好处是,一些切分点由于笔画的重叠,在笔画合并时容易被合并在一起,有了预检测的切分点,就可以防止重叠的笔画被误合并。
[0056] 对粘连的连通域进行笔画提取,本实施例中,采用黑游程跟踪的方法对粘连的连通域进行笔画提取。每一个笔画由若干个连续的黑游程组成,且每一个笔画对应一个游程列表,游程列表中记录各游程所在的行,以及游程的起始点和终止点。如图12所示,该游程列表包括行号、起始点、终止点属性,记录了一个笔画内所有的黑游程信息。
[0057] 本方法采用黑游程跟踪的方法对粘连的连通域进行笔画提取的过程如下:对粘连的连通域进行笔画提取时,在选定的连通域内逐行对黑游程进行扫描,取当前黑游程在下一行的对应位置处,且始终点位置各偏移一个像素的范围内的所有黑游程。本实施例中,在粘连的连通域内指定的当前黑游程,起始点为a,终止点为b,在当前黑游程的下一行的[a-1,b+1]范围内查找所有的水平黑游程。根据笔画中已有的游程的中心拟合出来当前笔画方向,得到笔画与竖直方向的夹角θ,然后得到笔画当前行的预测中心位置,选择这些黑游程游程中心与预测中心距离最近的某一黑游程作为待选游程,如果待选黑游程的中心与预测中心点的距离误差小于阈值Thr,则将待选黑游程加入到的笔画的游程列表中,否则当前笔画提取完毕,开始下一笔画的跟踪。
[0058] 阈值Thr的选取与当前笔画的方向有关。本实施例中,采用如下公式计算Thr=0.5×a×tan(θ),其中a是笔画的竖直方向高度。如图13所示,为笔画提取后的结果。本方法仅对疑似粘连的连通域进行笔画提取,与对整幅图像提取笔画的方法相比,极大的降低了运算时间和存储空间。
[0059] 本实施例中,图13为一个笔画的提取过程,其中n1行黑游程为的该笔画的第一条黑游程,当第n9行检索完毕时,当前的游程列表如图12所示,根据最小二乘法对n1到n9的游程列表各个游程中心点进行拟合得到笔画与竖直方向的夹角θ为29度,对应阈值为Thr为3,预测第n10行黑游程中心点的水平坐标为39,在第n10行检索到了两个黑游程,其中第二条黑游程的中心点水平坐标为38与预测中心点的距离较小,且距离L1等于1,比阈值Thr小,故将该黑游程加入到游程列表,然后进行下一行的黑游程搜索。当检测到第n25行时,当前游程列表各个游程的中心点拟合得到的笔画与竖直方向的夹角θ为44度,对应阈值Thr为12,预测第n25行黑游程中心点的水平坐标为50,但是检测得到第n25行黑游程中心点的水平坐标为33,与预测中心点的距离L2为18,大于阈值Thr,所以现在该笔画的提取结束,保存该笔画的黑游程列表,然后进行下一笔画的提取。
[0060] 步骤3:根据预切分点对提取完毕的笔画进行合并,得到字块。对提取完毕的笔画进行合并时,如果两个笔画的外接矩形框在水平方向上相互包含比例在既定阈值之上,且两笔画的中心在预切分点的同侧,则对两笔画以及笔画对应的游程列表进行合并,作为一个字块。
[0061] 本实施例中,如图14所示,设两个笔画的外接矩形框为R1、R2,当R1和R2在水平方向的投影上,R1包含R2或者R2包含R1,并且R1、R2的中心都在步骤2中预检测切分点的同侧,则对两个笔画进行合并。如果R1和R2在水平方向上,相互包含70%以上,并且R1,R2的中心都在步骤3中预检测切分点的同侧,则对两个笔画进行合并。
[0062] 如图15所示,图中为“发”与“村”的粘连部分是“发”的一捺和“村”中木子旁的一撇,两笔画的水平方向的重叠部分宽度D12为18,两笔画的水平宽度分别为D1=24,D2=23,D12≤0.7×D1并且D12≤0.7×D2,所以这两笔画的外接矩形框在水平方向的投影上,相互包含70%以上,则应该进行合并。但是得到的两笔画的中心点的水平方向投影坐标分别是35和41,如图11中的P2,P3所示,在步骤3中预测到的水平坐标为38的切分点两侧,如图11中的P1所示,所以不对两个笔画进行合并,如果没有预测切分点的限制,将对两笔画进行合并,导致笔画合并不正确。
[0063] 如图16所示,对于“村”字的右半部分一横一竖两个笔画来说,横笔画在水平方向上包括了竖笔画,即两个笔画的外接矩形框在水平方向上D2包含D1,比例在既定阈值0.7之上;两个笔画的中心都在预测切分点的右侧,则对两笔画以及笔画对应的游程列表进行合并,作为一个字块,并继续对图14中的其他笔画进行处理,从而得到该连通域的切分后的字块,如图17所示。
[0064] 步骤4:保存字块,转到下一连通域进行连通域分析,直至所有连通域遍历完毕后输出字块序列;如图17为最后保存的字块。从图17中看到,“发”的一捺和“村”中木子旁的一撇作为两个不同的字块,避免了正确的切分点被合并而带来的合并错误,而“村”字的右半部分一横一竖两个笔画,由于切分点的预判定使两个粘连的笔画有效地进行了合并,进而准确地对字块进行了判定。
[0065] 步骤5:根据语义和识别信息对字块进行合并,并调用识别引擎输出识别结果。识别结果为图18所示。
[0066] 本发明还公开了一种文字识别中粘连字符的切分装置,包括如下模块:
[0067] 预处理模块:对输入的行图像进行预处理,获得行图像的连通域、平均字宽和平均字高;
[0068] 分析模块:进行连通域分析,标记粘连的连通域,对选定的粘连的连通域进行笔画提取,并对粘连的连通域进行切分点检测,获得预切分点,对于非粘连的连通域直接保存字块;
[0069] 合并模块:根据预切分点对提取完毕的笔画进行合并,得到字块;
[0070] 字块输出模块:保存字块,转到下一连通域进行粘连的判断,直至所有连通域遍历完毕后输出字块序列;
[0071] 结果输出模块:根据参考信息对字块进行合并,输出识别结果。