基于含噪图像中矩形包围框的精确提取和定位方法转让专利

申请号 : CN201710991269.4

文献号 : CN107633253B

文献日 : 2020-03-17

相似专利: 请登录后查看

本发明公开了一种基于含噪图像中矩形包围框的精确提取和定位方法，其主要包括图像清晰度判定、图像膨胀腐蚀和八点填充联合预处理、对包围框的投影求得矩形框的四个顶点等步骤，克服了影像寻找外包围矩形框不精确或失败的问题；本方法针对图像有噪的情况，能够极大提升外围矩形框提取的成功率和准确率，针对图像过爆或偏暗导致的影像图像失真；图像原件扫描时重影、模糊；图像本身就污点噪声等情况能够准确提取外围包围框。

1.一种基于含噪图像中矩形包围框的精确提取和定位方法，其特征在于包括以下步骤：

步骤一：设定清晰度阈值Thr，通过Laplace边缘检测+Sobel边缘检测融合检测算法，确定图像的边缘线；计算边缘线附近像素点的差值Diff，若DiffThr，说明图像清晰；

步骤二：如果图像不清晰，将图像转换到DCT域，保留DCT域中的高频部分，将导致模糊的低频部分去除，实现图像增强；

步骤三：图像自适应二值化处理，将彩色图像转成黑白二值图像，提取图像的外围粗轮廓，由于粗轮廓提取时受到干扰噪声，导致轮廓毛刺多且轮廓是非矩形的，选取最大面积的外围轮廓；

步骤四：对粗提取的外围轮廓进行预处理一：判断外围轮廓是否闭合，如果不闭合，对图像进行先膨胀后腐蚀操作，连接邻近像素点、平滑边界；设定次数Num，预处理的结束条件是：预处理循环次数达Num或外围轮廓已闭合；

步骤五：对粗提取的外围轮廓进行预处理二：对外围轮廓进行“八点填充”：当外围轮廓以外的任意一点的周围八个点中有四点是外围轮廓上的点，则把该点也加入外围轮廓线上的点；

步骤六：外围轮廓旋转校正：根据预处理好的外围轮廓，计算出其中的最长直线，以包围框的左上顶点为原点，以包围框的水平向右方向为X轴正方向，以包围框的垂直向下方向为Y轴正方向，计算所有线段与X轴正方向的夹角，若夹角大于90度，则用180减去该角度，选取最小的夹角，将最小的夹角作为待检测表格图像旋转的角度，若该夹角线段与X轴正方向的夹角大于90度，采用逆时针旋转，否则采用顺时针旋转，最终完成对外围轮廓进行倾斜校正；

步骤七：针对旋转后的外围轮廓，将其按x轴进行投影，y轴进行投影，设定寻找像素范围Range，找到对应x轴上[x-Range，x+Range]范围内，投影点数最多的两个范围，并取两者范围中点位置：x0，x1；同理，找到对应y轴上[y-Range，y+Range]范围内点数最多的两个范围的中点：y0，y1；

步骤八：通过x0，x1，y0，y1四个位置可以确定矩形的四点，分别是(x0，y0)、(x0，y1)、(x1，y0)和(x1，y1)，画出精确的轮廓；

步骤九：逆向旋转：根据步骤八精确的轮廓进行逆向旋转，得到原始图像的精确轮廓位置。

2.根据权利要求1所述的一种基于含噪图像中矩形包围框的精确提取和定位方法，其特征在：所述步骤一中当DiffThr时，图像清晰，不做处理。

3.根据权利要求1所述的一种基于含噪图像中矩形包围框的精确提取和定位方法，其特征在：所述步骤四中：对粗提取的外围轮廓进行预处理一：设定面积最小值AreaMin和膨胀腐蚀次数Num，计算外围粗轮廓的内部面积，对非闭合轮廓，计算的是线所占的像素面积，闭合轮廓计算的是其内部的像素面积；如果外围粗轮廓的内部面积小于AreaMin，认为外围粗轮廓不闭合，需要通过图像的膨胀、腐蚀对外围轮廓进行补充，再次检测外围轮廓是否闭合，如果不闭合，再次膨胀、腐蚀进行轮廓补充，直到外围轮廓形成闭合框或膨胀腐蚀次数达到Num。

基于含噪图像中矩形包围框的精确提取和定位方法

技术领域

[0001] 本发明涉及一种图像处理方法，特别是一种基于含噪图像中矩形包围框的精确提取和定位方法。

背景技术

[0002] 随着大数据时代的来临和云计算的发展，人们将非结构化的数据转变成结构化数据的需求日益迫切,将票据、表格等原件信息转变成结构化的字符信息用于之后的大数据分析是其中非常重要的部分。

[0003] 中国专利公开号CN101576958公开了一种基于形状特征的带边框矩形印章图形提取方法，按照以下步骤:(1)对目标图像前景层连通分支进行筛选,去除目标图像中不满足印章尺寸规格的小连通分支；(2)对目标图像背景层连通分支进行筛选,剔除目标图像背景层连通分支远大于或远小于印章尺寸规格的连通分支；(3)采用图像分割中的分水岭算法来提取目标图像中封闭图形的骨架,利用骨架点在印章内部的最长游长来判断直线方向和去除毛刺；(4)根据用户提供的印章尺寸规格进行印章提取。

[0004] 中国专利公开号CN 101576958公开了一种基于形状特征的带边框矩形印章图形的提取方法，其特征在于，按照以下步骤：(1)对目标图像前景层连通分支进行筛选，去除目标图像中不满足印章尺寸规格的小连通分支；(2)对目标图像背景层连通分支进行筛选，剔除目标图像背景层连通分支远大于或远小于印章尺寸规格的连通分支；(3)采用图像分割中的分水岭算法来提取目标图像中封闭图形的骨架，利用骨架点在印章内部的最长游长来判断直线方向和去除毛刺；(4)根据用户提供的印章尺寸规格进行印章提取。

[0005] 由于票据、表格等原件需要先经过扫描转换成影像文件，再进行外包围矩形框的查找，根据外包围矩形框定位关键信息的位置，然后进行票据的识别。而在图片原件本身的使用以及扫描成影像文件的过程中经常会造成噪声的产生，例如由于原件本身的污点、折痕导致扫描影像的噪声；扫描过程中出现重影导致的噪声；扫描过程中光线的明暗出现噪点或颜色失真产生的噪声等因素，都会导致扫描影像含噪，导致使用现有技术的矩形框提取方法寻找外包围矩形框不精确或失败。

发明内容

[0006] 本方法针对影像寻找外包围矩形框不精确或失败的问题，提出了一种新的提取外围框的方案，该提取算法不仅能应用于票据、表格的定位，还能用于智能驾驶中的车辆定位。

[0007] 本发明采取的技术方案是：一种基于含噪图像中矩形包围框的精确提取和定位方法，其包括以下步骤：

[0008] 步骤一：设定清晰度阈值Thr，通过Laplace边缘检测+Sobel边缘检测融合检测算法，确定图像的边缘线；计算边缘线附近像素点的差值Diff，若DiffThr，说明图像清晰。

[0009] 步骤二：如果图像不清晰，将图像转换到DCT域，保留DCT域中的高频部分，将导致模糊的低频部分去除，实现图像增强。

[0010] 步骤三：图像自适应二值化处理，将彩色图像转成黑白二值图像，提取图像的外围轮廓粗，由于粗轮廓提取时受到干扰噪声，导致轮廓毛刺多且轮廓是非矩形的，选取最大面积的外围轮廓。

[0011] 步骤四：对粗提取的外围轮廓进行预处理一：设定面积最小值AreaMin和膨胀腐蚀次数Num，计算外围粗轮廓的内部面积，对非闭合轮廓，计算的是线所占的像素面积(非常小)，闭合轮廓计算的是其内部的像素面积。如果外围粗轮廓的内部面积小于AreaMin，认为外围粗轮廓不闭合，需要通过图像的膨胀、腐蚀对外围轮廓进行补充，再次检测外围轮廓是否闭合，如果不闭合，再次膨胀、腐蚀进行轮廓补充，直到外围轮廓形成闭合框或膨胀腐蚀次数达到Num。

[0012] 步骤五：对粗提取的外围轮廓进行预处理二：对外围轮廓进行“八点填充”：当外围轮廓以外的任意一点的周围八个点中有四点是外围轮廓上的点，则把该点也加入外围轮廓线上的点。

[0013] 步骤六：外围轮廓旋转校正：根据预处理好的外围轮廓，计算出其中的最长直线，以包围框的左上顶点为原点，以包围框的水平向右方向为X轴正方向，以包围框的垂直向下方向为Y轴正方向，计算所有线段与X轴正方向的夹角(0-180度)，若夹角大于90度，则用180减去该角度，选取最小的夹角，将最小的夹角作为待检测表格图像旋转的角度，若该夹角线段与X轴正方向的夹角大于90度，采用逆时针旋转，否则采用顺时针旋转，最终完成对外围轮廓进行倾斜校正。

[0014] 步骤七：针对旋转后的外围轮廓，将其按x轴进行投影，y轴进行投影，设定寻找像素范围Range，找到对应x轴上[x-Range，x+Range]范围内，投影点数最多的两个范围，并取两者范围中点位置：x0，x1；同理，找到对应y轴上[y-Range，y+Range]范围内点数最多的两个范围的中点：y0，y1。

[0015] 步骤八：通过x0，x1，y0，y1四个位置可以确定矩形的四点，分别是(x0，y0)、(x0，y1)、(x1，y0)和(x1，y1)，画出精确的轮廓。

[0016] 步骤九：逆向旋转：根据步骤六精确的轮廓进行逆向旋转，得到原始图像的精确轮廓位置。

[0017] 优选的，步骤一中当DiffThr时，图像清晰，不做处理。

[0018] 本发明的有益效果是：本方法针对图像有噪的情况，能够极大提升外围矩形框提取的成功率和准确率。针对图像过爆或偏暗导致的影像图像失真；图像原件扫描时重影、模糊；图像本身就污点噪声等情况能够准确提取外围包围框。

[0019] 本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

[0020] 图1是本发明的流程示意图。

具体实施方式

[0021] 下面结合附图和具体实施例对本发明进行详细说明。

[0022] 实施例。

[0023] 一种基于含噪图像中矩形包围框的精确提取和定位方法，其实施步骤如下：

[0024] 1.判断图像清晰度：

[0025] 设定清晰度阈值Thr，通过Laplace边缘检测+Sobel边缘检测融合检测算法，确定图像的边缘线；计算边缘线附近像素点的差值Diff，若DiffThr，说明图像清晰。

[0026] 2.如果图像不清晰，将图像转换到DCT域，保留DCT域中的高频部分，将导致模糊的低频部分去除，实现图像增强。

[0027] 3.图像自适应二值化处理，将彩色图像转成黑白二值图像。

[0028] 4.提取图像的外围轮廓粗，由于粗轮廓提取时受到干扰噪声，导致轮廓毛刺多且轮廓是非矩形的，选取最大面积的外围轮廓。

[0029] 5.对粗提取的外围轮廓进行预处理一：

[0030] 判断外围轮廓是否闭合，如果不闭合，对图像进行先膨胀后腐蚀操作，连接邻近像素点、平滑边界；设定次数Num，预处理的结束条件是：预处理循环次数达Num或外围轮廓已闭合。

[0031] 6.对粗提取的外围轮廓进行预处理二：

[0032] 对外围轮廓进行“八点填充”，如果一个点周围的八个点有四点是外围轮廓上的点，则把该点也加入外围轮廓线上，实现轮廓线的还原。

[0033] 7.外围轮廓旋转校正：

[0034] 根据上面预处理好的外围轮廓，计算出其中的最长直线，并根据最长直线与水平线的夹角，计算出其旋转角度Apha0，按旋转角度对外围轮廓进行倾斜校正。

[0035] 8.针对旋转后的外围轮廓，将其按x轴进行投影，y轴进行投影，设定寻找像素范围Range，找到对应x轴上[x-Range，x+Range]范围内，投影点数最多的两个范围，并取两者范围中点位置：x0，x1；同理，找到对应y轴上[y-Range，y+Range]范围内点数最多的两个范围的中点：y0，y1。

[0036] 9.通过x0，x1，y0，y1四个位置可以确定矩形的四点，分别是(x0，y0)、(x0，y1)、(x1，y0)和(x1，y1)，画出精确的轮廓。

[0037] 10.逆向旋转：

[0038] 根据旋转角度Apha0对精确的轮廓进行逆向旋转，得到原始图像的精确轮廓位置。

[0039] 以上显示和描述了本发明的基本原理、主要特征和优点。本领域的普通技术人员应该了解，上述实施例不以任何形式限制本发明的保护范围，凡采用等同替换等方式所获得的技术方案，均落于本发明的保护范围内。

[0040] 本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

基于含噪图像中矩形包围框的精确提取和定位方法转让专利

申请号 : CN201710991269.4

文献号 : CN107633253B

文献日 : 2020-03-17

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 于志文 , 车少帅 , 胡笳

申请人 : 江苏鸿信系统集成有限公司

摘要 :

权利要求 :

说明书 :