一种去除票据印章的方法转让专利

申请号 : CN201711287401.X

文献号 : CN108146093B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 罗宝娟张成栋李进文严京旗

申请人 : 南通艾思达智能科技有限公司

摘要 :

本发明涉及一种去除票据印章的方法,包括以下步骤:步骤110,获取票据图像;步骤120,在步骤110后对票据图像进行预处理;步骤130,在步骤120后,通过对RGB各颜色通道的处理以及形态学处理提取出印章的候选区域;步骤140,步骤130后,在印章候选区域内通过颜色比例的方法得到印章的区域;步骤150,输出印章的mask图;获取所需票据图像后一次性去除票据上的印章,为后续票据的扫描扫除了部分障碍。

权利要求 :

1.一种去除票据印章的方法,其特征在于,包括以下步骤:步骤110,获取票据图像;

步骤120,对步骤110获取的票据图像进行预处理;

步骤130,在步骤120后,通过对RGB各颜色通道的处理以及形态学处理提取出印章的候选区域;

步骤140,步骤130后,在印章候选区域内通过颜色比例的方法得到印章的区域;

步骤150,输出印章的mask图;

所述步骤110是通过以下任意一种方法获得图像数据的:(1)用数码相机拍摄得到的图像数据;

(2)用手机拍摄得到的图像数据;

(3)用扫描仪得到的图像数据;

(4)打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据;

所述步骤120中所述预处理具体包括如下步骤:步骤210,去黑边:求图像RGB三通道的均值,在图像上下边界占图像高度5%的范围和图像左右边界占图像宽度5%的范围内判断像素是否属于黑边,若像素属于黑边就所求均值进行漫水填充,直至所有范围内的所有像素处理完;

步骤220,图像转正:步骤210后,利用LSD进行直线检测,合并水平距离在图像宽度1%以及角度在9度范围内的直线,选取最长的一条直线,计算其角度,并按计算出的角度旋转图像;

步骤230,尺寸归一化:步骤220后,定位票据票据的4个顶点,按照给定票据模板大小,归一化图像尺寸;

步骤240,亮度归一化:步骤230后,求票据方框内所有像素的平均亮度,将图像归一化到设定的平均亮度值;

所述步骤130通过所述RGB各颜色通道的处理以及形态学处理提取出印章的候选区域,具体包括如下步骤:步骤310,求B分量在RGB三分量中是最大值的区域;

步骤320,RGB转为HSV颜色空间,在步骤310得到的区域过滤掉灰色区域,HSV颜色空间部分灰色的H、S、V的范围是H>100、S>43且V>46;

步骤330,过滤掉小于5个像素的区域;

步骤340,步骤330后,对所得到的剩余区域做膨胀腐蚀操作,得到印章的候选区域;

所述步骤140具体包括如下步骤:

步骤410,分离RGB颜色通道,对B通道做OTSU操作,得到的区域记为otsu;

步骤420,计算图像的连通域,计算每个连通域的外接矩形,对每个矩形区域做步骤

430-步骤460的处理;

步骤430,矩形区域与otsu进行与操作,得到区域1;

步骤440,在区域1的范围求B通道的颜色在RGB颜色通道中的比例大于k值的部分,得到区域2,k在[0.33,1]之间;

步骤450,在区域1的范围求B通道的值大于thresh值的部分,得到区域3,thresh在[100,155]之间;

步骤460,合并区域2和区域3;

步骤470,合并区域1、区域2及区域3。

说明书 :

一种去除票据印章的方法

技术领域

[0001] 本发明属于图像处理领域,具体涉及一种去除票据印章的方法。

背景技术

[0002] 票据扫描识别技术,在一定条件下提高了票据的数字化效率,降低业务人员的工作强度,有效地提高数据的准确性或精细化。然而印章因其有维护票据法律有效性,被广泛应用,其形状和颜色的多样性,给票据图像字符识别带来了不小的挑战。票据图像字符识别是票据自动处理中的核心技术,如何得到尽可能干净的字符是图像字符识别的关键步骤,直接关系着后续字符的识别率;因此提供一种去除票据印章的方法成为本领域人员亟需解决的一个问题。

发明内容

[0003] 为解决上述技术问题,本发明提供一种去除票据印章的方法,包括以下步骤:
[0004] 步骤110,获取票据图像;
[0005] 步骤120,对步骤110获取的票据图像进行预处理;
[0006] 步骤130,在步骤200后,通过对RGB各颜色通道的处理以及形态学处理提取出印章的候选区域;
[0007] 步骤140,步骤130后,在印章候选区域内通过颜色比例的方法得到印章的区域;
[0008] 步骤150,输出印章的mask图。
[0009] 采用上述方案的有益效果是:获取所需票据图像后一次性去除票据上的印章,为后续票据的扫描扫除了部分障碍。
[0010] 进一步的,所述步骤100具体包括以下步骤:
[0011] 步骤110,获取票据图像数据;该步骤是通过以下任意一种方法获得图像数据的:
[0012] (1)用数码相机拍摄得到的图像数据;
[0013] (2)用手机拍摄得到的图像数据;
[0014] (3)用扫描仪得到的图像数据;
[0015] (4)打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据。
[0016] 进一步的,步骤120具体包括以下步骤:
[0017] 步骤210,去黑边:求图像RGB三通道的均值,在图像上下边界占图像高度5%的范围和图像左右边界占图像宽度5%的范围内判断像素是否属于黑边,若像素属于黑边就所求均值进行漫水填充,直至所有范围内的所有像素处理完。
[0018] 步骤220,图像转正:步骤210后,利用LSD进行直线检测,合并水平距离在图像宽度1%以及角度在9度范围内的直线,选取最长的一条直线,计算其角度,并按计算出的角度旋转图像。
[0019] 步骤230,尺寸归一化:步骤220后,定位票据票据的4个顶点,按照给定票据模板大小,归一化图像尺寸。
[0020] 步骤240,亮度归一化:步骤230后,求票据方框内所有像素的平均亮度,将图像归一化到设定的平均亮度值。采用上述进一步方案的有益效果是:对图像的黑边进行处理,去除了黑边对于去除印章的影响,调正方向后对票据进行定位并进行尺寸和亮度的归一化,使票据得以在稳定的状态下进行印章的去除。
[0021] 进一步的,步骤130具体包括如下步骤:
[0022] 步骤310,求B分量在RGB三分量中是最大值的区域;
[0023] 步骤320,RGB转为HSV颜色空间,在步骤310得到的区域过滤掉灰色区域,HSV颜色空间部分灰色的H、S、V的范围是H>100、S>43且V>46。
[0024] 步骤330,过滤掉小于5个像素的区域。
[0025] 步骤340,步骤330后,对所得到的区域做膨胀腐蚀操作,得到印章的候选区域。采用上述进一步方案的有益效果是:得到预处理印章的候选区域,为后续的除章工作做铺垫。
[0026] 进一步的,步骤140,具体包括如下步骤:
[0027] 步骤410,分离RGB颜色通道,对B通道做OTSU操作,得到的区域记为otsu。
[0028] 步骤420,计算图像的连通域,计算每个连通域的外接矩形,对每个矩形区域做步骤430-步骤460的处理;
[0029] 步骤430,矩形区域与otsu进行与操作,得到区域1;
[0030] 步骤440,在区域1的范围求B通道的颜色在RGB颜色通道中的比例大于k值的部分,得到区域2,k在[0.33,1]之间;
[0031] 步骤450,在区域1的范围求B通道的值大于thresh值的部分,得到区域3,thresh在[100,155]之间;
[0032] 步骤460,合并区域2和区域3;
[0033] 步骤470,合并所有得到的区域。
[0034] 步骤150,输出印章的mask图。
[0035] 本发明的有益效果是:本发明提供一种去除票据印章的方法,利用图像处理技术准确定位印章所在位置并且提取出印章,输出印章的mask图,为后续的票据识别扫除了部分障碍。

附图说明

[0036] 图1为本发明去除医疗票据中蓝色印章的流程图;
[0037] 图2为步骤120医疗票据图像的预处理的具体步骤;
[0038] 图3为步骤130获取蓝色印章的候选区域的具体步骤;
[0039] 图4为步骤140获取最后蓝色印章的具体步骤;
[0040] 图5为扫描到医疗票据示意图;
[0041] 图6为医疗票据图像预处理后的图像;
[0042] 图7为蓝色印章印章候选区域示意图;
[0043] 图8为经本发明处理后得到的蓝色印章区域示意图。

具体实施方式

[0044] 下面结合附图和实施例对本发明的进行详细的描述。
[0045] 实施例一
[0046] 请参阅图1,本发明揭示了一种去除票据印章的方法,所述方法包括如下步骤:
[0047] 【步骤110】获取医疗票据图像数据。
[0048] 获取图像数据的方法包括以下两种之一:
[0049] 方法之一是用扫描仪得到的图像数据;
[0050] 方法之二是打开一个预先存在的包含有图像数据的文件,读取该文件中的数据并按照标准算法解压缩后得到的图像数据。
[0051] 【步骤120】医疗票据图像的预处理。
[0052] 请参阅图2,步骤120具体包含如下步骤:
[0053] 步骤210,去黑边:求图像RGB三通道的均值,在图像上下边界占图像高度5%的范围和图像左右边界占图像宽度5%的范围内判断像素是否属于黑边,若像素属于黑边就所求均值进行漫水填充,直至所有范围内的所有像素处理完;
[0054] 步骤220,图像转正:步骤210后,利用LSD进行直线检测,合并水平距离在图像宽度1%以及角度在9度范围内的直线,选取最长的一条直线,计算其角度,并按计算出的角度旋转图像;
[0055] 步骤230,尺寸归一化:步骤220后,定位票据表格的4个顶点,按照给定表格模板大小,归一化图像尺寸;
[0056] 步骤240,亮度归一化:步骤230后,求表格方框内所有像素的平均亮度,将图像归一化到设定的平均亮度值。
[0057] 【步骤130】在步骤120后,通过对RGB各颜色通道的处理以及形态学处理提取出蓝色印章的候选区域。
[0058] 请参阅图3,步骤130具体包含如下步骤:
[0059] 步骤310,求B分量在RGB三分量中是最大值的区域;
[0060] 步骤320,RGB转为HSV颜色空间,在步骤310得到的区域过滤掉灰色区域,HSV颜色空间,部分灰色的H、S、V的范围是H>100且S>43且V>46;
[0061] 步骤330,过滤掉小于5个像素的区域;
[0062] 步骤340,步骤330后,对所得到的区域做膨胀腐蚀操作,得到蓝色印章的候选区域。
[0063] 【步骤140】步骤130后,在蓝色印章候选区域内通过颜色比例的方法得到蓝色印章的区域。
[0064] 请参阅图4,步骤140的具体步骤包含:
[0065] 步骤410,分离RGB颜色通道,对B通道做OTSU操作,得到的区域记为otsu。
[0066] 步骤420,计算图像的连通域,计算每个连通域的外接矩形,对每个矩形区域做步骤430-步骤460的处理;
[0067] 步骤430,矩形区域与otsu进行与操作,得到区域1;
[0068] 步骤440,在区域1的范围求B通道的颜色在RGB颜色通道中的比例大于k值的部分,得到区域2,k在[0.33,1]之间;
[0069] 步骤450,在区域1的范围求B通道的值大于thresh值的部分,得到区域3,thresh在[100,155]之间;
[0070] 步骤460,合并区域2和区域3;
[0071] 步骤470,合并所有得到的区域。
[0072] 【步骤150】结束,输出。
[0073] 实施例二
[0074] 在一般的计算机上,对扫描得到的上海市医疗门(急)诊收费票据如图5所示(图中对涉及个人隐私信息做了擦除处理),使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120图像预处理后的结果如图6所示,步骤130处理后的结果如图7所示,执行完步骤140得到的蓝色印章的mask图,如图8所示。
[0075] 实施例三
[0076] 在智能手机上,该手机自带1200万像素的摄像头,使用本发明的方法,对拍摄得到的医疗票据图像,能够自动去除蓝色印章。
[0077] 本发明提供一种去除票据图像上印章的方法,利用图像处理技术准确定位印章所在位置并且提取出印章,输出印章的mask图,为后续的票据识别扫除了部分障碍。
[0078] 这里本发明的描述和应用都只是说明性的,并非是想要将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是完全可能的,对于那些本领域的普通技术人员来说,实施例的替换和等效的各种部件均是公知的。本领域技术人员还应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现,以及在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。