基于SVM的票据图像分类方法转让专利

申请号 : CN201610593126.3

文献号 : CN106096667B

文献日 : 2017-11-10

本发明公开了基于SVM的票据图像分类方法，包括：进行样本训练，得到性能优化的SVM分类器；制作公章模板；通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线从而判断待识别的原图像是否为非识别票据图像，对待识别的原图像进行倾斜校正；选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素，判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点，剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓；将公章轮廓与公章模板进行匹配，若匹配成功，则提取公章轮廓的HOG特征作为性能优化的SVM分类器的输入，得出待识别的原图像的票据类型。本发明分类的速度快，准确性高。

1.基于SVM的票据图像分类方法，其特征在于：包括以下步骤：

（1）选取多张标准票据图像，作为样本进行SVM分类器训练，得到性能优化的SVM分类器；截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板；

（2）对待识别的原图像进行二值化，通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线，设定两条直线之间的距离阈值，将图像中直线之间的距离小于距离阈值的两条直线合并成一条直线；设定直线数目的最大数目阈值和最小数目阈值，若图像中所有直线的数目不在最大数目阈值和最小数目阈值之间，则将此待识别的原图像分类为非识别票据图像，否则执行步骤（3）；

（3）对待识别的原图像进行倾斜校正；

（4）根据公章的亮度特征设定公章的最大灰度阈值和最小灰度阈值，选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素，判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合，从轮廓集合中剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓；

（5）将步骤（4）得到的公章轮廓与步骤（1）得到的公章模板进行匹配，若匹配不成功，则将待识别的原图像分类为非识别票据图像，若匹配成功，则执行步骤（6）；

（6）提取公章轮廓的HOG特征，作为步骤（1）中性能优化的SVM分类器的输入，得出待识别的原图像的票据类型；

所述对待识别的原图像进行倾斜校正，包括：

以待识别的原图像的左上角为原点，待识别的原图像的水平向右方向为X轴的正方向，待识别的原图像的垂直向下方向为Y轴的正方向，建立坐标系；

通过Hough变换检测直线的方法提取待识别的原图像中的所有直线，将待识别的原图像中的直线与X轴的正方向的夹角作为直线角度；

查找待识别的原图像中两条直线之间的夹角为90度的所有直线对，将所有直线对中角度最小的直线角度作为待识别的原图像的旋转角度，将待识别的原图像进行逆时针旋转，实现待识别的原图像的倾斜较正；

若没有查找到待识别的原图像中的夹角为90度的直线对，通过Hough变换检测直线的方法选取待识别的原图像的所有直线中的最长直线，选取最长直线与X轴的正方向的夹角作为待识别的原图像的旋转角度，将待识别的原图像进行逆时针旋转，实现待识别的原图像的倾斜较正。

2.根据权利要求1所述的基于SVM的票据图像分类方法，其特征在于：所述对待识别的原图像进行二值化，包括：设定灰度阈值，将待识别的原图像中灰度值低于灰度阈值的像素点的灰度值设置为1，将待识别的原图像中灰度值高于灰度阈值的像素点的灰度值设置为0，从而实现待识别的原图像的二值化。

3.根据权利要求1所述的基于SVM的票据图像分类方法，其特征在于：所述判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合，包括：将待识别的原图像的RGB颜色空间转换到HSV颜色空间，根据HSV颜色空间中的三个颜色分量的值判断选取的每个像素的颜色；

过滤不属于公章部分的颜色范围的像素点从而得到轮廓集合。

4.根据权利要求1所述的基于SVM的票据图像分类方法，其特征在于：所述选取多张标准票据图像，作为样本进行SVM分类器训练，得到性能优化的SVM分类器，包括：设定SVM分类器的数目，准备训练样本集合，包括正样本集和负样本集，正样本集为多张一种类别标准票据的图像，负样本集为多张其它类别标准票据的图像；

手动截取所有正样本集中的公章轮廓和负样本集中的公章轮廓；

提取所有正样本集中的公章轮廓的HOG特征和负样本集中的公章轮廓的HOG特征，进行SVM分类器训练，得到性能优化的SVM分类器。

基于SVM的票据图像分类方法

技术领域

[0001] 本发明属于图像处理领域，尤其涉及一种基于SVM的票据图像分类方法。

背景技术

[0002] 在票据的管理上，传统票务管理依靠人工，人力成本较高，效率低，而且在票据比较多，任务比较紧的时候，传统的方法需人力熬夜加班，甚至都无法完成指标，因此票据自动分类系统应运而生。

[0003] 票据自动分类通过对票据扫描成的票据图像的分析，采用图像处理方法自动分类票据。目前的票据自动分类方法主要分为两类，第一类是采用模板匹配方法，此方法通过将每一种类型的票据标准图像制作成模板图像，通过将待识别的图像和每类模板进行模板匹配，将票据识别为匹配率最高的那一类；第二类是通过OCR的方法，识别票据中的特殊的数字和字母，对识别出的数字和字母进行类型识别，完成图像的分类。但现有的票据分类方法存在一定的问题：首先第一类的方法和第二类的方法均从整幅图像出发，复杂性高，时间成本高；第一类的方法和第二类的方法没有倾斜校正的机制，若图像中的目标物体位置倾斜，会影响图像的匹配结果以及OCR字段识别，此时误检率较高；第一类采用模板匹配的方法需要将票据同每一类的模板进行匹配，耗时高，尤其是当票据种类较多时，此类方法呈现明显的弱势；第二类通过OCR的方法，识别图像的特殊字段来分类票据，由于不同的票据有可能包含相同的标题字段，从而造成较高概率的错误分类；第一类的方法和第二类的方法中，没有错误分类机制，它们将待识别的每一幅图像都分成我们要处理的票据类别，而实际财务处理中，会出现很多不是我们需要的票据，将这些票据加入到财务系统不仅不会减轻财务人员的工作，反而无形中增加了劳动成本。

发明内容

[0004] 本发明所要解决的技术问题是针对上述现有技术的不足提供一种基于SVM的票据图像分类方法，基于SVM的票据图像分类方法能准确的去除不属于用户需要的票据图像，即提供了去除非待识别票据图像的机制，使票据图像的管理更加系统化，完善化；对票据图像的公章区域进行处理，克服了从票据图像整体进行处理的缺陷，提高了检测的速度；对票据图像进行倾斜校正，克服了由于票据图像的倾斜而造成识别错误的情况；采用SVM分类方法，分类结果更加准确。

[0005] 为实现上述技术目的，本发明采取的技术方案为：

[0006] 基于SVM的票据图像分类方法，包括以下步骤：

[0007] (1)选取多张标准票据图像，作为样本进行SVM分类器训练，得到性能优化的SVM分类器；截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板；

[0008] （2）对待识别的原图像进行二值化，通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线，设定两条直线之间的距离阈值，将图像中直线之间的距离小于距离阈值的两条直线合并成一条直线；设定直线数目的最大数目阈值和最小数目阈值，若图像中所有直线的数目不在最大数目阈值和最小数目阈值之间，则将此待识别的原图像分类为非识别票据图像，否则执行步骤（3）；

[0009] （3）对待识别的原图像进行倾斜校正；

[0010] （4）根据公章的亮度特征设定公章的最大灰度阈值和最小灰度阈值，选取待识别的原图像中灰度值在最大灰度阈值和最小灰度阈值之间的所有像素，判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合，从轮廓集合中剔除面积较小的轮廓从而得到待识别的原图像中公章的轮廓；

[0011] （5）将步骤（4）得到的公章轮廓与步骤（1）得到的公章模板进行匹配，若匹配不成功，则将待识别的原图像分类为非识别票据图像，若匹配成功，则执行步骤（6）；

[0012] （6）提取公章轮廓的HOG特征，作为步骤（1）中性能优化的SVM分类器的输入，得出待识别的原图像的票据类型。

[0013] 作为本发明进一步解决的技术方案，所述对待识别的原图像进行倾斜校正，包括：

[0014] 以待识别的原图像的左上角为原点，待识别的原图像的水平向右方向为X轴的正方向，待识别的原图像的垂直向下方向为Y轴的正方向，建立坐标系；

[0015] 通过Hough变换检测直线的方法提取待识别的原图像中的所有直线，将待识别的原图像中的直线与X轴的正方向的夹角作为直线角度；

[0016] 查找待识别的原图像中两条直线之间的夹角为90度的所有直线对，将所有直线对中角度最小的直线角度作为待识别的原图像的旋转角度，将待识别的原图像进行逆时针旋转，实现待识别的原图像的倾斜较正；

[0017] 若没有查找到待识别的原图像中的夹角为90度的直线对，通过Hough变换检测直线的方法选取待识别的原图像的所有直线中的最长直线，选取最长直线与X轴的正方向的夹角作为待识别的原图像的旋转角度，将待识别的原图像进行逆时针旋转，实现待识别的原图像的倾斜较正。

[0018] 作为本发明进一步解决的技术方案，所述对待识别的原图像进行二值化，包括：

[0019] 设定灰度阈值，将待识别的原图像中灰度值低于灰度阈值的像素点的灰度值设置为1，将待识别的原图像中灰度值高于灰度阈值的像素点的灰度值设置为0，从而实现待识别的原图像的二值化。

[0020] 作为本发明进一步解决的技术方案，所述判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合，包括：

[0021] 将待识别的原图像的RGB颜色空间转换到HSV颜色空间，根据HSV颜色空间中的三个颜色分量的值判断选取的每个像素的颜色；

[0022] 过滤不属于公章部分的颜色范围的像素点从而得到轮廓集合。

[0023] 作为本发明进一步解决的技术方案，所述选取多张标准票据图像，作为样本进行SVM分类器训练，得到性能优化的SVM分类器，包括：

[0024] 设定SVM分类器的数目，准备训练样本集合，包括正样本集和负样本集，正样本集为多张一种类别标准票据的图像，负样本集为多张其它类别标准票据的图像；

[0025] 手动截取所有正样本集中的公章轮廓和负样本集中的公章轮廓；

[0026] 提取所有正样本集中的公章轮廓的HOG特征和负样本集中的公章轮廓的HOG特征，进行SVM分类器训练，得到性能优化的SVM分类器。

[0027] 本发明对票据图像的公章区域进行处理，克服了从票据图像整体进行处理的缺点，提高了分类速度；对票据图像进行倾斜校正，克服了由于票据图像的倾斜而导致分类错误的情况；每种票据图像的公章区域是最明显的分类特征，对票据图像的公章区域采用SVM分类方法，相对于采用现有的OCR识别方法进行票据图像分类，本发明的准确性更高；本发明有效的去除匹配不成功的公章轮廓的票据图像，去除所有直线的数目不在最大数目阈值和最小数目阈值之间的票据图像，因此本发明提供了去除非待识别票据图像的机制，使票据图像的管理更加系统化和完善化；本发明对票据图像的分类是基于票据类型的，因此本发明对票据图像进行分类，可以为之后的票据自动处理提供基础。

附图说明

[0028] 图1为本发明的工作流程图。

具体实施方式

[0029] 下面根据图1对本发明的具体实施方式作出进一步说明：

[0030] 参见图1，基于SVM的票据图像分类方法，包括以下步骤：

[0031] (1)选取多张标准票据图像，作为样本进行SVM分类器训练，得到性能优化的SVM分类器；标准票据都包含公章，而且公章的规格都是严格规定的，截取每一种类型的标准票据中的公章图像并将所有的公章图像组合成一幅公章模板；（2）对待识别的原图像进行二值化，通过Hough变换检测直线的方法提取二值化后的图像中的所有的直线，根据票据图像的线框特点设定两条直线之间的距离阈值L，将图像中直线之间的距离小于距离阈值L的两条直线合并成一条直线, 从而解决由于票据图像质量问题而造成的直线断连的问题；根据票据图像的线框的几何特征设定直线数目的最大数目阈值N1和最小数目阈值N2，通过Hough变换检测直线的方法提取已解决直线断连的问题的图像中的所有直线并统计所有直线的数目，若图像中所有直线的数目不在最大数目阈值N1和最小数目阈值N2之间，则将此待识别的原图像分类为非识别票据图像，否则执行步骤（3）；（3）对待识别的原图像进行倾斜校正；（4）根据公章的亮度特征设定公章的最大灰度阈值G1和最小灰度阈值G2，选取待识别的原图像中灰度值在最大灰度阈值G1和最小灰度阈值G2之间的所有像素，去除待识别的原图像中灰度值不在最大灰度阈值G1和最小灰度阈值G2之间的所有像素；判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合，从轮廓集合中剔除面积较小的轮廓的干扰从而得到待识别的原图像中公章的轮廓；（5）将步骤（4）得到的公章轮廓与步骤（1）得到的公章模板进行匹配，设定匹配阈值M，当公章轮廓与公章模板的匹配度超过匹配阈值M时则认为匹配成功；当公章轮廓与公章模板的匹配度低于匹配阈值M时则认为匹配不成功；若匹配不成功，则将待识别的原图像分类为非识别票据图像，若匹配成功，则执行步骤（6）；（6）提取匹配成功的公章轮廓的HOG特征，作为步骤（1）中性能优化的SVM分类器的输入，得出待识别的原图像的票据类型。

[0032] 进一步地，所述对待识别的原图像进行倾斜校正，包括：以待识别的原图像的左上角为原点，待识别的原图像的水平向右方向为X轴的正方向，待识别的原图像的垂直向下方向为Y轴的正方向，建立坐标系；通过Hough变换检测直线的方法提取待识别的原图像中的所有直线，将待识别的原图像中的直线与X轴的正方向的夹角作为直线角度；查找待识别的原图像中两条直线之间的夹角为90度的所有直线对，如果查找到满足条件的直线对，将所有直线对中角度最小的直线角度作为待识别的原图像的旋转角度，将待识别的原图像进行逆时针旋转，实现待识别的原图像的倾斜较正；如果没有查找到待识别的原图像中夹角为90度的直线对，通过Hough变换检测直线的方法选取待识别的原图像的所有直线中的最长直线，选取最长直线与X轴的正方向的夹角作为待识别的原图像的旋转角度，将待识别的原图像进行逆时针旋转，实现待识别的原图像的倾斜较正。

[0033] 进一步地，所述对待识别的原图像进行二值化，包括：设定图像的灰度阈值G3，将待识别的原图像中灰度值低于灰度阈值G3的像素点的灰度值设置为1，将待识别的原图像中灰度值高于灰度阈值G3的像素点的灰度值设置为0，从而实现待识别的原图像的二值化。

[0034] 进一步地，所述判断选取的每个像素的颜色并过滤不属于公章部分颜色范围的像素点从而得到轮廓集合，包括：将待识别的原图像的RGB颜色空间转换到HSV颜色空间，根据HSV颜色空间中的三个颜色分量的值判断选取的每个像素的颜色；过滤不属于公章部分的颜色范围的像素点从而得到轮廓集合。

[0035] 进一步地，所述选取多张标准票据图像，作为样本进行SVM分类器训练，得到性能优化的SVM分类器，包括：设定SVM分类器的数目，由于SVM分类器是一个两类的分类器，对于多种类别我们需要训练多个SVM分类器来实现分类，则如果需要识别分类的票据图像的种类总数为A，则需要训练得到的SVM分类器的数目为A，此时每个SVM分类器的作用为判断票据是否属于A种类别发票中的其中一类；针对于每个分类器，选取A种类别发票中的其中一种类别的多张标准票据图像作为正样本集，选取A种类别发票中的其它类别的多张标准票据图像作为负样本集；手动裁剪所有正样本集中的公章轮廓和负样本集中的公章轮廓，将所有正样本集的公章轮廓放在一个文件夹中，将所有负样本集中的公章轮廓放在另一个文件夹中，将所有的正样本集和所有负样本集缩放到同样的尺寸大小，提取所有的正样本集的HOG特征，提取所有负样本集的HOG特征，并对所有的正样本集和所有负样本集赋予样本标签，例如若将国税票据作为正样本集，其他类型的票据作为负样本集，则正样本集标记为国税票据，所有负样本集标记为非国税票据；将所有的正样本集的HOG特征和所有负样本集的HOG特征，所有的正样本集的标签和所有负样本集的标签，都输入到SVM分类器中进行训练；则得到识别其中一类的性能较优化的一个SVM分类器，重复上述操作，得到性能较优化的A个SVM分类器。提取所述步骤（5）中匹配成功的公章轮廓的HOG特征作为性能优化的A个SVM分类器的输入，得出待识别的原图像的票据类型。

[0036] 本发明的保护范围包括但不限于以上实施方式，本发明的保护范围以权利要求书为准，任何对本技术做出的本领域的技术人员容易想到的替换、变形、改进均落入本发明的保护范围。

基于SVM的票据图像分类方法转让专利

申请号 : CN201610593126.3

文献号 : CN106096667B

文献日 : 2017-11-10

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 邵一婷 , 车少帅 , 于志文 , 胡笳 , 沈宇

申请人 : 江苏鸿信系统集成有限公司

摘要 :

权利要求 :

说明书 :