基于OCR的无线扫描输入装置和方法转让专利

申请号 : CN200810239537.8

文献号 : CN101751121B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 朱军民

申请人 : 汉王科技股份有限公司

摘要 :

本发明涉及一种基于OCR的无线扫描输入装置和方法,属于光学字符识别技术领域,该装置包括扫描装置和主机,所述扫描装置用于对图像进行扫描采集和处理并将图像数据发送给所述主机,所述扫描装置和所述主机之间通过无线通信装置连接,所述无线通信装置包括:无线发送装置,将经过采集和处理的所述图像数据或指令发送出去;以及无线接收装置,接收所述无线发送装置发送来的所述图像数据或指令。本发明摆脱了USB线的困扰,能够实现远距离输入,极大的方便了远距离输入的需要。

权利要求 :

1.一种基于OCR的无线扫描输入装置,包括扫描装置和主机,所述扫描装置用于对图像进行扫描采集和处理并将图像数据发送给所述主机,其特征是:所述扫描装置和所述主机之间通过无线通信装置连接,所述无线通信装置包括:

无线发送装置,将经过采集和处理的所述扫描装置输出的压缩二值化图像数据或指令发送出去;

无线接收装置,接收所述无线发送装置发送来的所述压缩二值化图像数据或指令;

所述主机包括:

图像拼接装置,接收所述无线接收装置发送来的所述压缩二值化图像数据并进行解码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接,在一边图像传输的同时,一边进行帧图像的拼接工作,当扫描装置发送图像采集终止,则完成了所有的图像帧的拼接工作,得到一幅完整的二值化图像;

文字行提取装置,通过分段行切分将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像;

OCR识别装置,包括OCR引擎,将所述完整的二值化图像转换为可编辑字符流。

2.如权利要求1所述的装置,其特征是:所述扫描装置和所述主机之间通过蓝牙装置连接,所述无线通信装置为蓝牙装置,其中所述无线发送装置是蓝牙发送装置,所述无线接收装置是蓝牙接收装置。

3.如权利要求1或2所述的装置,其特征是所述扫描装置包括:图像采集装置,包括面阵图像传感器、以及光学系统,通过预定时间间隔对所述图像进行采集获得一系列二维帧图像;

图像处理装置,对于所述图像采集装置送入的每帧二维图像进行滤波去噪、图像二值化、编码压缩,以形成压缩二值化图像数据并传输给所述无线发送装置。

4.如权利要求1所述的装置,其特征是:所述OCR识别装置还包括输出装置,将所述可编辑字符流输出到用户指定位置。

5.如权利要求3所述的装置,其特征是:所述面阵图像传感器为OV6130 COMS传感器,所述预定时间间隔为1/60秒。

6.如权利要求3所述的装置,其特征是:所述滤波采用3x3的均值滤波,所述图像二值化采用分块的OTSU,所述二值化图像的编码采用游程编码或JBIG-2编码。

7.如权利要求1所述的装置,其特征是:所述无线发送装置设置于所述扫描装置内;所述无线接收装置设置于所述主机内。

8.如权利要求4所述的装置,其特征是:所述输出装置的用户指定位置是光标所在位置、用户指定的文件或手机短信。

9.一种基于OCR的无线扫描输入方法,采用如权利要求1至8任何一项所述的装置,其特征是:所述方法包括以下步骤:步骤(a)、所述扫描装置对图像进行扫描采集和处理;

步骤(b)、通过无线发送方式将图像数据发送给所述主机,

步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像数据;

步骤(d)、接收所述无线接收装置发送来的所述压缩二值化图像数据并进行解码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接,在一边图像传输的同时,一边进行帧图像的拼接工作,当扫描装置发送图像采集终止,则完成了所有的图像帧的拼接工作,得到一幅完整的二值化图像;

步骤(e)、通过分段行切分将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像;

步骤(f)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。

说明书 :

基于OCR的无线扫描输入装置和方法

技术领域

[0001] 本发明涉及光学字符识别(OCR,Optical Character Recognition)技术领域,尤其是一种基于OCR的无线扫描输入装置和方法。

背景技术

[0002] 目前电脑基本上是通过键盘输入,也有的采用手写笔进行输入,但是输入速度都比较慢,很难超过5字/秒。随着OCR技术出现,目前字符录入速度可以达到70字/秒以上。OCR技术通过与高速扫描仪的有机集成,有效解决了纸质文档的录入问题。但是由于扫描仪一般体积比较大,质量比较重,不方便随身携带,而且价钱比较昂贵,以至于无法大面积的普及使用。此后有人提出了一种带USB线的扫描笔的输入方法,使OCR输入法摆脱了扫描仪的束缚,但是该方法的弊端是需要通过USB线连接到电脑,USB传输距离有限,而且到哪里总要带着一根USB数据线,非常不方便。

发明内容

[0003] 本发明的目的是克服现有技术中扫描输入装置的不方便,提出一种基于OCR的无线扫描输入装置和方法,通过无线通信装置在扫描装置和主机或其他带蓝牙的智能设备之间进行数据传输,摆脱了USB线的困扰,能够实现远距离输入。
[0004] 为了实现上述目的,本发明提供了一种基于OCR的无线扫描输入装置,包括扫描装置和主机,所述扫描装置对图像进行扫描采集和处理并将图像数据发送给所述主机,所述扫描装置和所述主机之间通过无线通信装置连接,所述无线通信装置包括:
[0005] 无线发送装置,将经过采集和处理的所述图像数据或指令据发送出去;
[0006] 无线接收装置,接收所述无线发送装置发送来的所述图像数据或指令。
[0007] 优选地,所述扫描装置和所述主机之间通过蓝牙装置连接,所述无线通信装置为蓝牙装置,其中所述无线发送装置是蓝牙发送装置,所述无线接收装置是蓝牙接收装置。
[0008] 优选地,所述扫描装置包括:
[0009] 图像采集装置,包括面阵图像传感器、以及光学系统,通过预定时间间隔对所述图像进行采集获得一系列二维帧图像;
[0010] 图像处理装置,对于所述图像采集装置送入的每帧二维图像进行滤波去噪、图像二值化、编码压缩,以形成压缩二值化图像数据并传输给所述无线发送装置;
[0011] 所述主机包括:
[0012] 图像拼接装置,接收所述无线接收装置发送来的所述压缩二值化图像数据并进行解码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接工作,得到一幅完整的二值化图像;
[0013] OCR识别装置,包括OCR引擎,将所述完整的二值化图像转换为可编辑字符流。
[0014] 优选地,其中所述图像拼接装置和所述OCR识别装置之间还包括文字行提取装置,所述文字行提取装置通过分段行切分将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像。
[0015] 优选地,其中所述OCR识别装置后面还包括输出装置,将所述可编辑字符流输出到用户指定位置。
[0016] 优选地,其中所述面阵图像传感器为OV6130 COMS传感器,所述预定时间间隔为1/60秒。
[0017] 优选地,其中所述滤波采用3×3的均值滤波,所述图像二值化采用分块的OTSU,所述二值化图像的编码采用游程编码或JBIG-2编码。
[0018] 优选地,所述无线发送装置设置于所述扫描装置内;所述无线接收装置设置于所述主机内。
[0019] 优选地,其中所述OCR识别装置包括汉王OCR识别引擎。
[0020] 优选地,其中所述输出装置的用户指定位置是光标所在位置、用户指定的文件或手机短信。
[0021] 为实现上述目的,本发明还提供了一种基于OCR的无线扫描输入方法,包括以下步骤:
[0022] 步骤(a)、所述扫描装置对图像进行扫描采集和处理;
[0023] 步骤(b)、通过无线发送方式将图像数据或指令发送给所述主机,[0024] 步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像数据或指令;
[0025] 步骤(d)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。
[0026] 本发明的基于OCR的无线扫描输入装置和方法通过无线通信装置如蓝牙通信装置进行数据传输,摆脱了USB线的困扰,能够实现远距离输入。只要在无线通信装置如蓝牙通信装置覆盖的有效范围之内都可以使用本输入法,极大的方便了远距离输入的需要。

附图说明

[0027] 图1为本发明的基于OCR的无线扫描输入装置的功能方框图;
[0028] 图2为本发明一个实施例的被处理图像的示意图。

具体实施方式

[0029] 下面结合附图详细说明本发明的基于OCR的无线扫描输入装置和方法。
[0030] 如图1所示,为本发明一个实施例的基于OCR的无线扫描输入装置,主要包括两个部分:扫描装置100、和主机200,两者之间通过无线连接进行信号的发送和接收。扫描装置100的作用是对纸质文档进行扫描,该装置可以是任何种类的扫描输入设备,如扫描笔、扫描仪等;而主机200则可以是PC机或智能设备等。
[0031] 在一个实施例中,扫描装置100采用了扫描笔,请同时参见图2,为本发明一个实施例的被处理图像的示意图。如图1所示,扫描装置100包括:
[0032] 图像采集装置110:采用面阵图像传感器、以及光学系统获得二维图像,其中面阵图像传感器可以选择的种类很多,如CCD或CMOS方式的面阵图像传感器均可,在一个具体实施例中本发明采用了OV6130 COMS传感器。图像采集装置110每隔一定的时间间隔采集一次,每次采集的图像称为一帧图像,例如1/60秒采集一次,帧图像的大小如144*176像素,所得到如图2中310所示的自左至右的一系列帧图像。通过扫描笔笔尖的压力感应器来触发和终止图像采集过程。
[0033] 图像处理装置120:对于图像采集装置送入的每帧图像进行滤波去噪、图像二值化、编码压缩,然后形成压缩二值化图像数据。在一个实施例中图像编码压缩选择了游程编码,在另一个实施例中也可以选择JBIG-2编码技术。在一个实施例中滤波可以采用3×3的均值滤波,图像二值化采用分块的OTSU(最大类间方差),每一帧图像经过图像处理(去噪、二值化)得到图2中的320中所示的自左至右的一系列的帧图像,这些二值化图像的编码采用游程编码,然后经过作为无线通信装置的蓝牙装置发送出去,该蓝牙装置可包括蓝牙发送装置130和蓝牙接收装置210,蓝牙发送装置130和蓝牙接收装置210分别作为无线发送装置和无线接收装置,无线发送装置可以设置于扫描装置100内;无线接收装置可以设置于主机200内。
[0034] 蓝牙发送装置130:将压缩的二值化图像数据或者一些相关指令(如开始扫描、扫描完成等)通过无线蓝牙发送装置发送出去。蓝牙装置是一个标准模块,可以选择10m和100m两种不同传输范围的蓝牙模块,如可选用南京国春电器设备有限公司的GC-05插针式
100米蓝牙模块。
[0035] 主机200,采用PC端或智能设备端,包括:
[0036] 蓝牙接收装置210:接收压缩二值化图像数据,取出帧图像。同样可以选择南京国春电器设备有限公司的GC-05插针式100米蓝牙模块。
[0037] 图像拼接装置220:调用同扫描装置端对应的图像解码算法,对压缩的帧图像进行解码,得到展开的二值化图像,如图2中的330中所示的自左至右的一系列的帧图像,经过对比可见,330中的图像与320是一一对应的,这证明图像得到了很好的还原;然后利用前后帧的相关性完成图像(帧)的拼接工作。本发明在一边图像传输的同时,一边进行帧图像的拼接工作,当扫描装置发送图像采集终止,本装置就完成了所有的图像(帧)的拼接工作,得到一幅完整的二值化图像,如图2中的340即拼接完成后的一幅图像。其中图像拼接算法可以选择基于相关分析的算法,也可以选择LM(Levenberg-Marquardt)算法及其变种。
[0038] 文字行提取装置230:选择合适的行提取算法,该装置的作用是尽量减少噪声行和不完整行,以提高OCR引擎的识别速度和正确性。在一个优选实施例中,选择分段行切分的方法,将图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间较完整的文字行图像,以供OCR识别。行提取算法也可以采用基于连通域分析或基于行投影的算法,在实施中通过比较发现分段行切分的方法效果最佳。在图2的实施例中上一步骤得到的图像340经过文字行提前处理,得到图像350,该图中去除了边缘的噪声即图像340中上面和下面的不完整的文字,保留了中间的具有完整意义的文字行。当然,在一个可选的实施例中,文字行提取装置230是可以省略的,但这会增加后续装置和步骤的数据处理负担。
[0039] OCR识别装置240:将文字行图像送入光学字符识别OCR引擎,对图像进行字符切分并转换为可编辑字符流,以及识别结果字符流后处理等操作。OCR识别装置可以采用目前市场上可以采购的识别引擎,例如汉王OCR识别引擎,该引擎可以支持Windows,Linux平台,也可以支持嵌入式WinCE、Linux、Symbian、MTK等,而且可以识别多种语言,包括中、日、韩、英以及其他的西欧语种。图2的实施例中将图像350输入OCR引擎,经过识别得到图像360中的可编辑字符流,由图中可见,经过识别得到的文字是完整清晰的。
[0040] 输出装置250,将可编辑字符流输出到用户指定位置,在一个实施例中将OCR识别结果直接输出到光标所在位置,或也可以保存到用户指定的文件中。对于手机用户还可以输出到短信,将识别后的内存通过短信发送。
[0041] 本发明有着极为广泛的应用,以下是两个实例:
[0042] 1.PC(personal computer,个人电脑)应用:图书馆阅览室,用户笔记本在书桌上,而此时用户想到书架上想输入一些参考资料到PC上,他就可以使用本产品自由的在书架上进行扫描,识别结果自动的保存到其电脑之中,而无需将参考书籍拿到书桌上进行输入。
[0043] 2.手机应用:用户有一个带蓝牙的手机,只要用户手机上安装有本发明的输入法程序以及图1所示的装置,他就可以利用扫描笔随时随地的进行输入,比如他看到一个笑话,想跟亲人朋友共享,他可以通过扫描笔进行输入到短信,然后发给他们,非常方便。
[0044] 本发明实施例中还提供了一种基于OCR的无线扫描输入方法,采用上述技术方案中的装置,包括以下步骤:
[0045] 步骤(a)、所述扫描装置对图像进行扫描采集和处理;
[0046] 步骤(b)、通过无线发送方式将图像数据发送给所述主机,
[0047] 步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像数据;
[0048] 步骤(d)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。
[0049] 进一步地,所述步骤(b)和所述步骤(c)中的所述无线发送方式和无线接收方式为蓝牙发送和接收方式。
[0050] 进一步地,所述步骤(a)的采集和处理包括:先通过预定时间间隔对所述图像进行采集并转换为一系列二维帧图像,再对所述二维帧图像进行滤波去噪、图像二值化、编码压缩,以形成压缩二值化图像数据并传输给所述无线发送装置;
[0051] 进一步地,所述步骤(d)包括:对所述无线接收装置发送来的所述压缩二值化图像数据进行解码,得到展开的二值化图像,然后利用前后帧的相关性完成图像的拼接,得到一幅完整的二值化图像;接着将所述完整的二值化图像转换为可编辑字符流。
[0052] 进一步地,所述步骤(d)进一步包括:所述图像拼接后先将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像后,再转换为可编辑字符流。
[0053] 具体地,所述步骤(a)的采集选择面阵图像传感器,所述预定时间间隔为1/60秒;所述滤波采用3×3的均值滤波,所述图像二值化采用分块的OTSU,所述二值化图像的编码采用游程编码或JBIG-2编码。
[0054] 具体地,所述步骤(d)中的所述图像拼接算法为基于相关分析的算法、或LM算法、或LM算法的变种。具体地,所述步骤(d)中的所述OCR识别方法包括采用汉王OCR识别引擎。
[0055] 本发明的上述实施例中,通过无线通信装置如蓝牙装置进行数据传输,摆脱了USB线的困扰,能够实现远距离输入。只要在无线蓝牙覆盖的有效范围之内都可以使用本输入法,极大的方便了远距离输入的需要。典型应用如在图书馆,接受输入PC远在书桌上,而我们可以在书架边进行文字摘抄。
[0056] 当然,以上只是通过实施例对本发明进行了阐述,上述实施例是示例而非限制本发明,例如其中的蓝牙装置也可以被其他形式的无线电技术所替代,本领域技术人员将能够设计很多替代实施例而不脱离附后的权利要求书的范围。