一种用于文字识别的去噪增强方法转让专利

申请号 : CN202211186525.X

文献号 : CN115331211B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 何芸余伟

申请人 : 江苏巨信众汇数字科技有限公司

摘要 :

本发明涉及数据识别处理技术领域,具体涉及一种用于文字识别的去噪增强方法。该方法包括:获取拓印完成后的碑文图像对应的二值图像;获取二值图像中多个连通域以及连通域面积进而得到噪声阈值;基于噪声阈值将连通域分为小连通域和大连通域,根据所有小连通域的连通域面积得到噪声程度;根据预设的形态学结构元将小连通域融合相连以构建新直方图,基于新直方图以及噪声程度获取噪声衰减率;相应的,获取新噪声衰减率以及利用新形态学结构元对大连通域处理的相似性;基于相似性以及新噪声衰减率获取合适度,进而得到最优结构元,基于最优结构元得到修复图像;使得噪声去除后图像增强修复的效果较好,使得文字识别更加准确。

权利要求 :

1.一种用于文字识别的去噪增强方法,其特征在于,该方法包括以下步骤:获取拓印完成后的碑文图像,对所述碑文图像进行阈值分割得到对应的二值图像;

获取所述二值图像中多个连通域,基于连通域中像素点的数量得到连通域面积;根据连通域的数量以及连通域面积构建面积直方图,基于所述面积直方图得到噪声阈值;获取连通域面积小于所述噪声阈值的连通域为小连通域,连通域面积大于所述噪声阈值的连通域为大连通域;根据所有小连通域的连通域面积得到噪声程度;

根据预设的形态学结构元将小连通域融合相连得到新连通域,基于所有大连通域和新连通域的数量及其对应的连通域面积构建新直方图,基于所述新直方图以及所述噪声程度获取噪声衰减率;

根据新形态学结构元将小连通域融合相连得到多个第二连通域,基于所有大连通域和第二连通域的数量获取新噪声衰减率;利用新形态学结构元对大连通域处理,以得到面积的变化曲线,获取大连通域的原始曲线与所述变化曲线之间的相似性;

获取不同的形态学结构元处理后的合适度,所述合适度由所述相似性以及所述新噪声衰减率获取,所述合适度最小时的对应的形态学结构元为最优结构元,基于最优结构元对碑文图像进行处理得到修复图像;

其中,所述基于所述面积直方图得到噪声阈值的步骤,包括:

基于所述面积直方图获取最大连通域面积和最小连通域面积,根据最大连通域面积和最小连通域面积获取噪声阈值,所述噪声阈值的计算为:其中,表示噪声阈值; 表示最大连通域面积; 表示最小连通域面积;表示自然常数; 表示经验比例。

2.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述根据所有小连通域的连通域面积得到噪声程度的步骤,包括:将所有小连通域的连通域面积进行求和得到第一面积,将碑文图像中所有连通域的连通域面积进行求和得到第二面积,所述第一面积与所述第二面积的比值为所述噪声程度。

3.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述根据预设的形态学结构元将小连通域融合相连得到新连通域的步骤,包括:利用预设的形态学结构元对碑文图像进行开运算,对开运算处理后的图像进行闭运算,基于闭运算将存在关联的小连通域进行融合连接,融合连接后的小连通域为新连通域。

4.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述基于所述新直方图以及所述噪声程度获取噪声衰减率的步骤,包括:将所述新直方图中连通域面积小于噪声阈值的连通域记为第二区域,获取所有第二区域的连通域面积的求和结果;

获取新直方图中所有连通域面积的求和得到第二求和结果,计算所述求和结果与所述第二求和结果的第二比值;

所述噪声程度与所述第二比值的差值为所述噪声衰减率。

5.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述获取大连通域的原始曲线与所述变化曲线之间的相似性的步骤,包括:在所述变化曲线上进行均匀采样得到多个采样点,获取每个采样点在原始曲线中的Y轴坐标值以及每个采样点在变化曲线中的Y轴坐标值;

获取每个采样点对应的原始曲线中Y轴坐标值与变化曲线中的Y轴坐标值的差值,所有采样点的差值的均值为所述相似性。

6.根据权利要求1所述的一种用于文字识别的去噪增强方法,其特征在于,所述获取不同的形态学结构元处理后的合适度的步骤,包括:获取所述新噪声衰减率与所述相似性的求和的均值为所述合适度。

说明书 :

一种用于文字识别的去噪增强方法

技术领域

[0001] 本发明涉及数据识别处理技术领域,具体涉及一种用于文字识别的去噪增强方法。

背景技术

[0002] 拓片是记录中华古代文明的重要载体之一,如果原始的石碑损坏或丢失,拓片可以保留石碑原来的历史资料;相较于相机拍摄记录图像,拓片皆为正射影像,贴近被拓目标,可以清晰地展现碑文原有的线条,但相机拍摄可能会因为拍摄角度影响导致拍摄图像偏离真实的碑文。
[0003] 由于碑文经过时间的洗礼导致碑文表面会出现瑕疵,拓印出来的图像会存在瑕疵的干扰,因此拓印下来的碑文图像需要进行修复,去除瑕疵的干扰;传统修复方法通常是将孤立的小面积区域直接去除,但直接去除小面积会导致信息去除量太多,影响碑文拓印图像的质量;也有部分采用形态学进行瑕疵去除,但形态学处理时结构元的选取难以统一,导致处理不足或过处理,过处理会导致碑文原始的文字缺失,处理不足会导致瑕疵去除效果不良,从而使得文字识别的准确性低。

发明内容

[0004] 为了解决上述技术问题,本发明的目的在于提供一种用于文字识别的去噪增强方法,所采用的技术方案具体如下:
[0005] 第一方面,本发明一个实施例提供了一种用于文字识别的去噪增强方法,该方法包括以下步骤:
[0006] 获取拓印完成后的碑文图像,对所述碑文图像进行阈值分割得到对应的二值图像;
[0007] 获取所述二值图像中多个连通域,基于连通域中像素点的数量得到连通域面积;根据连通域的数量以及连通域面积构建面积直方图,基于所述面积直方图得到噪声阈值;
获取连通域面积小于所述噪声阈值的连通域为小连通域,连通域面积大于所述噪声阈值的连通域为大连通域;根据所有小连通域的连通域面积得到噪声程度;
[0008] 根据预设的形态学结构元将小连通域融合相连得到新连通域,基于所有大连通域和新连通域的数量及其对应的连通域面积构建新直方图,基于所述新直方图以及所述噪声程度获取噪声衰减率;
[0009] 根据新形态学结构元将小连通域融合相连得到多个第二连通域,基于所有大连通域和第二连通域的数量获取新噪声衰减率;利用新形态学结构元对大连通域处理,以得到面积的变化曲线,获取大连通域的原始曲线与所述变化曲线之间的相似性;
[0010] 获取不同的形态学结构元处理后的合适度,所述合适度由所述相似性以及所述新噪声衰减率获取,所述合适度最小时的对应的形态学结构元为最优结构元,基于最优结构元对碑文图像进行处理得到修复图像;
[0011] 其中,所述基于所述面积直方图得到噪声阈值的步骤,包括:
[0012] 基于所述面积直方图获取最大连通域面积和最小连通域面积,根据最大连通域面积和最小连通域面积获取噪声阈值,所述噪声阈值的计算为:
[0013]
[0014] 其中,表示噪声阈值; 表示最大连通域面积; 表示最小连通域面积;表示自然常数; 表示经验比例。
[0015] 优选的,所述根据所有小连通域的连通域面积得到噪声程度的步骤,包括:
[0016] 将所有小连通域的连通域面积进行求和得到第一面积,将碑文图像中所有连通域的连通域面积进行求和得到第二面积,所述第一面积与所述第二面积的比值为所述噪声程度。
[0017] 优选的,所述根据预设的形态学结构元将小连通域融合相连得到新连通域的步骤,包括:
[0018] 利用预设的形态学结构元对碑文图像进行开运算,对开运算处理后的图像进行闭运算,基于闭运算将存在关联的小连通域进行融合连接,融合连接后的小连通域为新连通域。
[0019] 优选的,所述基于所述新直方图以及所述噪声程度获取噪声衰减率的步骤,包括:
[0020] 将所述新直方图中连通域面积小于噪声阈值的连通域记为第二区域,获取所有第二区域的连通域面积的求和结果;
[0021] 获取新直方图中所有连通域面积的求和得到第二求和结果,计算所述求和结果与所述第二求和结果的第二比值;
[0022] 所述噪声程度与所述第二比值的差值为所述噪声衰减率。
[0023] 优选的,所述获取大连通域的原始曲线与所述变化曲线之间的相似性的步骤,包括:
[0024] 在所述变化曲线上进行均匀采样得到多个采样点,获取每个采样点在原始曲线中的Y轴坐标值以及每个采样点在变化曲线中的Y轴坐标值;
[0025] 获取每个采样点对应的原始曲线中Y轴坐标值与变化曲线中的Y轴坐标值的差值,所有采样点的差值的均值为所述相似性。
[0026] 优选的,所述获取不同的形态学结构元处理后的合适度的步骤,包括:
[0027] 获取所述新噪声衰减率与所述相似性的求和的均值为所述合适度。
[0028] 本发明具有如下有益效果:本发明实施例通过对碑文图像中连通域的分析得到噪声阈值,结合噪声的特点利用噪声阈值将所有的连通域划分为小连通域和大连通域,通过对小连通域进行形态学结构元运算,使得噪声去除的效果更好,且计算更加具有针对行;进一步的,利用形态学结构元对大连通域进行运算,得到处理后变化曲线与原始曲线之间的相似性,基于相似性计算此时的合适度,进而基于合适度得到最优结构元,使得碑文图像增强修复的效果最好,在去除噪声的同时使得大连通域的特征保留,后续文字识别的准确性较高。

附图说明

[0029] 为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0030] 图1为本发明一个实施例所提供的一种用于文字识别的去噪增强方法流程图;
[0031] 图2为本发明一个实施例所提供的一种碑文图像示意图;
[0032] 图3为本发明一个实施例所提供的一种碑文的二值图像示意图;
[0033] 图4为本发明一个实施例所提供的一种面积直方图示意图;
[0034] 图5为本发明一个实施例所提供的一种异常腐蚀的碑文示意图。

具体实施方式

[0035] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于文字识别的去噪增强方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0036] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0037] 本申请用于对拓印后碑文图像的增强修复,以增强修复后图像进行文字识别;下面结合附图具体的说明本发明所提供的一种用于文字识别的去噪增强方法的具体方案。
[0038] 请参阅图1,其示出了本发明一个实施例提供的一种用于文字识别的去噪增强方法流程图,该方法包括以下步骤:
[0039] 步骤S100,获取拓印完成后的碑文图像,对碑文图像进行阈值分割得到对应的二值图像。
[0040] 具体的,将拓印完成后的碑文置于平整桌面上,在桌面的正上方布置相机,以采集拓印完成后的碑文图像,相机应保证采集到的碑文图像为正射图像;然后通过自适应阈值分割方法对采集到的碑文图像进行阈值分割,从而得到碑文图像的二值图像;具体可参阅图2和图3,其分别示出一种碑文图像示意图和一种碑文的二值图像示意图。
[0041] 步骤S200,获取二值图像中多个连通域,基于连通域中像素点的数量得到连通域面积;根据连通域的数量以及连通域面积构建面积直方图,基于面积直方图得到噪声阈值;获取连通域面积小于噪声阈值的连通域为小连通域,连通域面积大于噪声阈值的连通域为大连通域;根据所有小连通域的连通域面积得到噪声程度。
[0042] 由于碑文破损等原因的影响,会导致碑文图像中存在较多的噪声,影响碑文图像的质量;在实际的碑文图像中,汉字通常为一个个连通域,部分汉字也存在部分笔画脱离汉字本体,形成单独的连通域,但整体而言,汉字所形成的连通域的面积相对于缺陷或噪声形成的连通域而言要较大,因此对图像中的连通域进行分析。
[0043] 具体的,由于二值图像中碑文部分的像素点的像素值非零,背景部分的像素点的像素值为0;在二值图像中任意选择一个非零像素点为种子点,采用区域生长法获取种子点所在的连通域,当区域生长不符合迭代条件时停止,此时随机选取下一个像素值非零的像素点作为种子点,以新的种子点继续进行区域生长,直至将所有像素值非零的像素点搜索完成后停止。
[0044] 需要说明的是,每次随机选取的下一个种子点时,选取范围不包括已经划分为连通域的像素点。
[0045] 每个连通域对应的连通域面积为该连通域中所有像素点的数量,基于每个连通域面积以及该连通域面积下对应的连通域数量构建面积直方图,该面积直方图的X轴表示不同的连通域面积,Y轴表示连通域的数量,请参阅图4,其示出一种面积直方图示意图。
[0046] 然后,根据面积直方图获取噪声阈值;由于不同的碑文图像中字体大小不同,故对应的噪声阈值也不相同,对于较大的字体而言,对应的噪声阈值可较大,对于较小的字体而言,对应的噪声阈值需较小,基于面积直方图获取最大连通域面积和最小连通域面积,根据最大连通域面积和最小连通域面积获取噪声阈值,则噪声阈值的计算为:
[0047]
[0048] 其中,表示噪声阈值; 表示最大连通域面积; 表示最小连通域面积;表示自然常数; 表示经验比例,本发明实施例中取经验值为100。
[0049] 根据噪声阈值将连通域划分为两种类型,将连通域面积小于噪声阈值的连通域记为小连通域,连通域面积大于噪声阈值的连通域记为大连通域;由于噪声以及缺陷的连通域较小,因此基于小连通域获取噪声程度,噪声程度的计算为:
[0050]
[0051] 其中,表示噪声程度; 表示第 个小连通域的面积; 表示碑文图像中第 个连通域的面积;表示碑文图像中所有连通域的数量;表示所有小连通域的数量。
[0052] 步骤S300,根据预设的形态学结构元将小连通域融合相连得到新连通域,基于所有大连通域和新连通域的数量及其对应的连通域面积构建新直方图,基于新直方图以及噪声程度获取噪声衰减率。
[0053] 考虑到小连通域也有可能为碑文表面风化所导致的破损,或者可能为字体本身的组成部分,故小连通域是否为噪声是不确定的,但部分小连通域与其他连通域之间是存在关联的,因此分析小连通域之间的关联性,并根据关联性进行小连通域的融合连接。
[0054] 首先,选用大小为 大小的R型结构元对碑文图像进行开运算,开运算可以去除孤立的小点和毛刺,通过开运算操作之后,一些小的孤立的小噪声被去除掉,同时一些毛刺被去除掉,避免影响关联性的获取。
[0055] 然后,对开运算之后的图像进行形态学闭运算,闭运算可以将有关联的小连通域进行连接融合,此时通过开运算和闭运算的组合操作后,会将部分有关联的小连通域进行融合,将融合连接后的小连通域标记为新连通域。
[0056] 利用形态学结构元进行开运算和闭运算之后,去除了部分孤立的噪声,同时将关联的连通域进行融合相连,此时碑文图像中包括了新连通域和原来的大连通域,因此基于此时新连通域和大连通域的连通域满级得到新的面积直方图记为新直方图;根据新直方图获取小于噪声阈值的连通域记为第二区域,基于所有第二区域的连通域面积以及噪声程度获取噪声衰减率,噪声衰减率的计算为:
[0057]
[0058] 其中, 表示噪声衰减率;表示噪声程度; 表示第 个第二区域的连通域面积;表示第二区域的数量; 表示小连通域融合后碑文图像中第 个连通域面积; 表示小连通域融合后碑文图像中所有连通域的数量。
[0059] 步骤S400,根据新形态学结构元将小连通域融合相连得到多个第二连通域,基于所有大连通域和第二连通域的数量获取新噪声衰减率;利用新形态学结构元对大连通域处理,以得到面积的变化曲线,获取大连通域的原始曲线与变化曲线之间的相似性。
[0060] 采用不同的形态学结构元进行开运算和闭运算后的结果不同,初始选择的大小的结构元为最小结构元,通过 大小的结构元处理之后去除了小的孤立的噪声点的同时,将有关联的连通域融合到一起,此时碑文拓印图像中的部分噪声点被去除,但噪声可能并没有被完全去除;因此通过改变形态学的结构元大小再次进行形态学的开闭运算的组合操作,获取对应大小结构元的噪声衰减率,例如:选用 大小的R型结构元对碑文图像中的小连通域进行开运算,对开运算的结果图像进行形态学闭运算,闭运算可以将存在新关联的小连通域进行连接融合,此时通过开闭运算的组合操作后,会将部分有关联的小连通域进行融合得到多个第二连通域,基于与步骤S300中计算噪声衰减率相同的方法,获取此时的新噪声衰减率 ,当新噪声衰减率 为0时说明噪声去除效果达到最好。
[0061] 但在实际操作过程中形态学结构元并非越大越好,当形态学的结构元大到某个程度时,会将字体原本的部分腐蚀掉,影响字体本身的完整性,例如图5所示的一种异常腐蚀的碑文示意图;因此在通过开运算和闭运算对碑文图像进行处理时,需要保证原本字体的完整性;开闭运算的组合运用对小面积的连通域影响较大,而对大面积的连通域影响较小,则当大连通域的变化情况较小时说明对应的结构元处理是合适的,当大连通域变化较大时说明对应的结构元处理不合适,影响了字体的完整性,因此利用新形态学结构元对大连通域进行开闭运算处理,通过处理融合后图像可构建新的直方图并可得到大连通域的面积的变化曲线;对比初始的面积直方图中大连通域的原始曲线,计算变化曲线与原始大面积连通域的变化曲线的相似性判断结构元的合适度,即通过统计直方图拟合变化曲线,在变化曲线上进行均匀采样,采样点的数量为 ,实施者可自行设定;相似性为:
[0062]
[0063] 其中,表示相似性;表示采样点数量; 表示第 个采样点在原始曲线的Y轴坐标值; 表示第 个采样点在变化曲线的Y轴坐标值。
[0064] 相似性 的值越趋近于0,说明对应的结构元越合适;本发明实施例设定经验阈值,当相似性 不大于经验阈值时,说明对应的结构元较为合适。
[0065] 步骤S500,获取不同的形态学结构元处理后的合适度,合适度由相似性以及新噪声衰减率获取,合适度最小时的对应的形态学结构元为最优结构元,基于最优结构元对碑文图像进行处理得到修复图像。
[0066] 当形态学结构元不断增大时,对不同大小的小连通域去除情况不同,随着开闭运算组合操作的次数增加,碑文图像中的小连通域不断减少,当减少到某一个程度时,噪声衰减率为0,此时噪声去除效果达到最好,但可能会导致图像中字体受到影响,因此在保证字体本身尽可能小的受到影响的情况下去除更多的噪声,此时的迭代次数为最优迭代次数;通过步骤S300和步骤S400中的开闭运算的组合操作得到不同结构元下对应的新噪声衰减率和相似性,则基于新噪声衰减率和相似性获取处理后的合适度为:
[0067]
[0068] 其中,表示合适度; 表示新噪声衰减率;表示相似性。
[0069] 合适度越小时,表明当前的迭代次数越佳,获取合适度 最小时的迭代次数作为最优迭代次数,此时合适度 对应的形态学结构元为最优结构元。
[0070] 将最优迭代次数下的处理图像与原图相减,得到多个孤立的连通域,该多个连通域即为对应的噪声,将相减后得到的噪声图像作为掩膜,噪声部位置为0,其他区域为1,与原图相乘,得到去除部分小连通域的去噪图像,最后选用最优迭代次数下的所用的最优结构元对去除噪声的碑文图像进行最终的开闭运算组合操作,修补字体中的空缺部分并去除字体边缘的毛刺,得到修复图像。
[0071] 通过上述操作之后可以去除大部分的小噪声,但有部分小面积难以通过上述操作去除,由于部分字体本身存在点的笔画,会与部分较大的小面积混淆在一起,为了防止字体本身的点被去除,同时可以去除其他相对较大的小面积噪声的影响,故采用瓦片分割的方式将带有小点的字体分割处理,将对应的字体输入字体库与模板字体进行对比,若对应位置存在点,则说明该点为字体本身的笔画,若对应位置不存在,则说明该点为面积较大的小面积噪声点,需要进行去除,最终在碑文拓印图像上去除相应的孤立点即可,从而根据操作后的修复图像进行文字识别。
[0072] 综上所述,本发明实施例通过对拓印完成后的碑文图像进行阈值分割得到对应的二值图像,基于二值图像得到图像中多个连通域,通过每个连通域的连通域面积构建面积直方图,进而基于面积直方图获取噪声阈值,通过噪声阈值将所有的连通域分为大连通域和小连通域,基于所有小连通域的连通域面积得到噪声程度;进一步的,对所有的小连通域进行形态学结构元运算进行融合得到多个新连通域,通过新连通域构建新直方图,结合噪声程度得到噪声衰减率;利用新形态学结构元对小连通域处理得到多个第二连通域,进而获取新噪声衰减率;进一步利用新形态学结构元对大连通域处理,以得到变化曲线,获取变化曲线与原始曲线的相似性,结合新噪声衰减率得到不同的形态学结构元处理后的合适度,基于合适度得到最优结构元,基于最优结构元对碑文图像进行处理得到修复图像,进而进行文字识别,排除了图像中噪声以及碑文缺陷的影响,对碑文图像进行增强,使得文字识别更加准确。
[0073] 需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0074] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
[0075] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。