使用已安装字体辨识画面文字的系统及方法转让专利

申请号 : CN201810972017.1

文献号 : CN110858305A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王磊

申请人 : 英业达科技有限公司英业达股份有限公司

摘要 :

本发明提供一种使用已安装字体辨识画面文字的系统及方法,其通过依据操作系统中的字体判断被显示于目标范围内的文字的字型属性,并依据所判断出的字型属性辨识目标范围内的文字的技术手段,可以同时满足维护复杂度与辨识准确度的需求,达成以效率高的简单维护获得高准确度的文字辨识结果的技术功效。

权利要求 :

1.一种使用已安装字体辨识画面文字的方法,其特征在于,该方法至少包含下列步骤:由显示画面中选择目标范围;

撷取该目标范围的目标影像;

比对操作系统中的至少一字体及该目标影像,以判断该目标范围中的文字的字型属性;及依据该字型属性辨识该目标范围中的文字。

2.如权利要求1所述的使用已安装字体辨识画面文字的方法,其特征在于,比对操作系统中的该至少一字体判断该目标范围中的文字的该字型属性的步骤为先使用至少一常用字体比对该目标影像以判断该字型属性,并在无法依据该至少一常用字体判断出该字型属性时,再使用操作系统中的所有字体比对该目标影像以判断该字型属性。

3.如权利要求2所述的使用已安装字体辨识画面文字的方法,其特征在于,该方法于使用操作系统中的所有字体比对该目标范围中的文字以判断该字型属性的步骤前,还包含显示该目标影像并提供输入该目标范围中的全部或部分文字的步骤。

4.如权利要求1所述的使用已安装字体辨识画面文字的方法,其特征在于,比对操作系统中的该至少一字体及该目标影像,以判断该目标范围中的文字的该字型属性的步骤前,还包含判断该目标影像的前景色与背景色,并依据判断结果将该目标影像去背的步骤。

5.如权利要求1所述的使用已安装字体辨识画面文字的方法,其特征在于,该方法于由该显示画面中选择该目标范围的步骤前,还包含提供由该显示画面中选择一监测区域,并分析该监测区域以判断出包含该目标范围的至少一监测目标的步骤。

6.一种使用已安装字体辨识画面文字的系统,其特征在于,该系统至少包含:区域选择模块,用以由显示画面中选择目标范围;

影像撷取模块,用以撷取该目标范围的目标影像;

属性判断模块,用以比对操作系统中的至少一字体及该目标影像,以判断该目标范围中的文字的字型属性;及文字辨识模块,用以依据该字型属性辨识该目标范围中的文字。

7.如权利要求6所述的使用已安装字体辨识画面文字的系统,其特征在于,该属性判断模块是先使用至少一常用字体比对该目标影像以判断该字型属性,及若无法依据该至少一常用字体判断出该字型属性,再使用操作系统中的所有字体比对该目标影像以判断该字型属性。

8.如权利要求7所述的使用已安装字体辨识画面文字的系统,其特征在于,该系统还包含提示模块,用以于该属性判断模块无法依据该至少一常用字体判断出该字型属性时,显示该目标影像并提供输入该目标范围中的全部或部分文字。

9.如权利要求6所述的使用已安装字体辨识画面文字的系统,其特征在于,该系统还包含图像处理模块,用以判断该目标影像的前景色与背景色,并依据判断结果将该目标影像去背。

10.如权利要求6所述的使用已安装字体辨识画面文字的系统,其特征在于,该区域选择模块还用以提供由该显示画面中选择监测区域,并分析该监测区域以判断出包含该目标范围的至少一监测目标。

说明书 :

使用已安装字体辨识画面文字的系统及方法

技术领域

[0001] 本发明涉及一种文字辨识系统及其方法,特别指一种使用已安装字体辨识画面文字的系统及其方法。

背景技术

[0002] 光学字符识别(Optical Character Recognition,OCR)是指对包含文字的图像档案进行分析识别处理,以取得图像档案中的文字的过程。目前,光学字符识别大多使用模板比对或特征提取等方法将图像档案所包含的文字转换为文字数据。
[0003] 事实上,不论使用模板比对或是特征提取的方法,都需要在进行光学字符识别之前,先建立并维护模板数据或特征数据,以提供模板比对或特征比对时使用。若模板数据或特征数据的数据量够大,则光学字符识别的结果的准确度可以提高,而若模板数据或特征数据的数据量较少,则光学字符识别的结果的准确地将会降低。
[0004] 也就是说,目前若希望光学字符识别有较高的准确度,则必须要建立大量的模板数据或特征数据,但维护大量的模板数据或特征数据不仅非常麻烦,还需要大量的储存空间。
[0005] 综上所述,可知现有技术中长期以来一直存在光学字符识别需要取舍维护复杂度与辨识准确度的问题,因此有必要提出改进的技术手段,来解决此问题。

发明内容

[0006] 有鉴于现有技术存在光学字符识别需要在维护复杂度与辨识准确度上做取舍的问题,本发明公开一种使用已安装字体辨识画面文字的系统及方法,其中:
[0007] 本发明所公开的使用已安装字体辨识画面文字的系统,至少包含:区域选择模块,用以由显示画面中选择目标范围;影像撷取模块,用以撷取目标范围的目标影像;属性判断模块,用以比对操作系统中的字体及目标影像以判断目标范围中的文字的字型属性;文字辨识模块,用以依据字型属性辨识目标范围中的文字。
[0008] 本发明所公开的使用已安装字体辨识画面文字的方法,其步骤至少包括:由显示画面中选择目标范围;撷取目标范围的目标影像;比对操作系统中的字体及目标影像,以判断目标范围中的文字的字型属性;依据字型属性辨识目标范围中的文字。
[0009] 本发明所公开的系统与方法如上,与现有技术之间的差异在于本发明通过依据操作系统中的字体判断被显示于目标范围内的文字的字型属性,并依据所判断出的字型属性辨识目标范围内的文字,藉以解决先前技术所存在的问题,并可以达成以效率高的简单维护即可以获得高准确度的文字辨识结果的技术功效。

附图说明

[0010] 图1为本发明所述的使用已安装字体辨识画面文字的系统架构图。
[0011] 图2A为本发明所述的使用已安装字体辨识画面文字的方法流程图。
[0012] 图2B为本发明所述的使用字体辨识文字的字型属性的方法流程图。
[0013] 图3A为本发明实施例所述的选择目标范围的示意图。
[0014] 图3B为本发明实施例所述的确认字型属性的窗口或对话框的示意图。
[0015] 图3C为本发明实施例所述的输入目标范围的文字的窗口或对话框的示意图。
[0016] 图4为本发明实施例所述的提供选择监测区域的示意图。
[0017] 符号说明:
[0018] 102 字体库
[0019] 110 区域选择模块
[0020] 120 影像撷取模块
[0021] 130 图像处理模块
[0022] 150 属性判断模块
[0023] 160 提示模块
[0024] 170 文字辨识模块
[0025] 300 显示画面
[0026] 310~330 窗口
[0027] 321 目标影像
[0028] 323 结果字段
[0029] 324~325、335 按键
[0030] 400 监测区域
[0031] 411~414 目标范围
[0032] 421~422 目标范围
[0033] 步骤220 由显示画面中选择目标范围
[0034] 步骤230 撷取目标范围的目标影像
[0035] 步骤240 依据目标影像的前景色与背景色将目标影像去背
[0036] 步骤250 比对操作系统中的字体及目标影像藉以判断目标范围中的文字的字型属性
[0037] 步骤251 使用常用字体比对目标影像以判断字型属性
[0038] 步骤253 显示字型属性
[0039] 步骤255 确认字型属性是否正确
[0040] 步骤257 提供输入目标范围中的全部或部分文字
[0041] 步骤259 使用所有字体比对目标影像以判断字型属性
[0042] 步骤260 依据字型属性辨识目标范围中的所有文字
[0043] 步骤270 是否结束监视

具体实施方式

[0044] 以下将配合附图及实施例来详细说明本发明的特征与实施方式,内容足以使任何本领域技术人员能够轻易地充分理解本发明解决技术问题所应用的技术手段并据以实施,由此实现本发明可达成的功效。
[0045] 本发明可以使用安装于操作系统中的字体来辨识被显示于目标范围内的文字,藉以监控目标范围内所显示的信息。
[0046] 以下先以图1本发明所述的使用已安装字体辨识画面文字的系统架构图来说明本发明的系统运作。如图1所示,本发明的系统含有区域选择模块110、影像撷取模块120、属性判断模块150、文字辨识模块170,以及可以附加的图像处理模块150、及提示模块160。
[0047] 区域选择模块110负责由显示画面(图中未示)中选择目标范围(图中未示)。区域选择模块110可以提供直接输入显示画面中的坐标的方式来选择目标范围,也可以在显示画面中提供点击与拖放的方式在显示画面中框选出目标范围,或可以在显示画面中提供双击并将围起被双击的位置的区域作为目标范围,但本发明并不以此为限,凡可以提供用户在显示画面中选择监测区域的方式都可以在本发明中被使用。区域选择模块110可以在选择目标范围后,对所选择的目标范围定义范围识别数据,其中,范围识别数据可以由任意数量的文字、字母、数字、与符号任意排列产生,一般而言,范围识别数据不会重复,也就是说,一个范围识别数据可以表示一个目标范围。
[0048] 在部分的实施例中,区域选择模块110也可以提供由显示画面中选择一个监测区域(图中未示),并可以对所选出的监测区域进行分析,以由监测区域中判断出一个或多个监测目标。其中,区域选择模块110可以由所判断出的所有监测目标中选择一个监测目标,使得区域选择模块110所选出的监测目标在显示画面中所涵盖的范围即为目标范围。
[0049] 其中,区域选择模块110可以依据监测区域在显示画面中的色块及/或线条判断监测目标,例如,将监测区域中的不同色块判断为不同的监测目标、将监测区域中被线条分隔的部分判断为不同的监测目标、将监测区域中线条粗细不同的部分判断为不同的检测目标等,但区域分析模块120由监测区域中判断监测目标的方式并不以上述为限,例如,区域选择模块110也可以依据监测区域中的控制组件或其他对象由监测区域中判断出监测目标。
[0050] 影像撷取模块120负责由显示画面中撷取出区域选择模块110所选出的目标范围所涵盖的影像。其中,影像撷取模块120所撷取出的影像在本发明中被称为目标影像。
[0051] 影像撷取模块120可以先撷取包含整个显示画面的画面影像后,再依据目标范围的位置数据由画面影像中撷取出目标影像;影像撷取模块120也可以直接依据目标范围的位置数据由显示画面中撷取出目标影像。其中,本发明所述的位置数据可以表示目标范围在显示画面中的位置,例如目标范围的左上角与右下角的坐标,又如目标范围的左上角的坐标以及目标范围的宽度与高度等,但本发明并不以上述为限。
[0052] 图像处理模块130可以判断影像撷取模块120所撷取的目标影像的前景色与背景色,并依据判断结果将影像撷取模块120所撷取的目标影像的背景去除(去背),以强调目标影像中的线条,进而降低属性判断模块13误判的可能性。
[0053] 属性判断模块150负责比对操作系统中的字体及影像撷取模块120所撷取的目标影像,以判断被显示于区域选择模块110所选出的目标范围中的文字的字型属性。属性判断模块150所判断出的字型属性包含但不限于字型、大小、是否为粗体、是否为斜体、是否有底线、是否有删除线等。其中,由于操作系统必定是使用已安装的字体显示监测区域中的文字,且操作系统所显示的同一文字的字型属性相同时,在显示画面中被显示的样式与特征都是固定的,因此,属性判断模块150可以通过已安装于操作系统的字体库102中的各个字体的不同大小来判断被显示于目标范围中的文字的字型属性。
[0054] 属性判断模块150可以先使用一种或多种常用字体与目标影像进行比对,以判断目标范围中的文字的字型属性。其中,本发明所述的常用字体可以是由操作系统所定义,也可以是由特定的外部应用程序所定义,或可以是由属性判断模块150所定义,本发明没有特别的限制。例如,属性判断模块150可以在每一次判断出字型属性时,累计所判断出的字体的次数,并可以将累积次数达到门坎值的字体定义为常用字体,或可以将或是累积次数较多的数个字体定义为常用字体。
[0055] 在部分的实施例中,常用字体也可以是属性判断模块150所判断出的同一显示画面中不同目标范围中的文字所使用的字体,例如,若显示画面中包含两个目标范围,属性判断模块150可以在完成第一个目标范围中的文字的字体的判断后,在判断第二个目标范围中的文字的字体时,可以优先使用所判断出的第一个目标范围中的文字的字体来与依据第二个目标范围所撷取出的目标影像进行比对,若比对结果表示依据第二个目标范围所撷取出的目标影像所包含的文字与第一个目标范围中的文字所使用的字体相同,则第二个目标范围中的文字与第一个目标范围中的文字使用相同的字体;而若依据第二个目标范围所撷取出的目标影像所包含的文字与第一个目标范围中的文字所使用的字体不同,表示第二个目标范围中的文字与第一个目标范围中的文字使用不同的字体,则属性判断模块150可以继续比对其他的常用字体与目标影像,以判断目标范围中的文字的字型属性。
[0056] 属性判断模块150也可以在无法由常用字体判断出目标范围中的文字的字型属性时,再使用安装于操作系统的字体库102中的所有其他字体来判断区域选择模块110所选出的目标范围中的文字的字型属性。与使用常用字体相似的,属性判断模块150可以逐一比对字体库102中的每一个字体与影像撷取模块120所撷取的目标影像,以判断目标范围中的文字的字型属性。
[0057] 在部分的实施例中,属性判断模块150也可以由字体库102中的所有字体中撷取出提示模块160提供输入的文字的样板或特征,并使用所撷取出的样本或特征与目标影像进行比对,以加快比对的速度。
[0058] 提示模块160可以显示图像处理模块130所判断出的前景色与背景色并提供确认,提示模块160也可以显示属性判断模块150所判断出的字型属性并提供确认。一般而言,提示模块160可以弹出对话框或对话窗口的方式显示前景色与背景色、或字型属性等信息;提示模块160也可以在对话框或对话窗口中使用所判断出的字型属性显示与目标影像321所表示的文字,藉以提供确认字型属性是否正确,但本发明并不以此为限。
[0059] 提示模块160也可以在属性判断模块150无法依据常用字体判断出目标范围中的文字的字型属性时,弹出显示目标影像的对话框或对话窗口,并提供在所显示的对话框或对话窗口中输入目标影像所表示的全部或部分文字,也就是提供输入目标范围中的完整文字或部分文字。
[0060] 文字辨识模块170负责依据属性判断模块150所判断出的字型属性辨识区域选择模块110所选出的目标范围中的文字。更详细的,文字辨识模块170可以依据属性判断模块150所判断出的字型属性对目标影像进行文字辨识。一般而言,文字辨识模块170可以对影像撷取模块120所撷取出的目标影像进行文字辨识,也可以自行撷取目标影像,本发明没有特别的限制。
[0061] 在部分的实施例中,文字辨识模块170可以记录区域选择模块110所选出的目标范围与属性判断模块150所判断出的字型属性的对应关系,例如,记录目标范围的左上角的坐标以及相对应的字型属性或是记录目标范围的识别数据以及相对应的字型属性等,但本发明并不以此为限。
[0062] 文字辨识模块170也可以持续依据字型属性与目标范围的对应关系,使用相对应的字型属性辨识各个目标范围中的文字。其中,文字辨识模块170可以每隔一段固定时间或是在每个预定的时间辨识目标范围中的文字,但本发明并不以此为限。
[0063] 接着以一个实施例来解说本发明的运作系统与方法,并请参照图2A本发明所述的使用已安装字体辨识画面文字的方法流程图。在本实施例中,假设本发明应用于监控显示画面的系统中。
[0064] 首先,区域选择模块110可以选择目标范围(步骤220)。在本实施例中,假设区域选择模块110可以提供用户使用鼠标在如图3A所示的显示画面300中选择目标范围,例如,用户可以通过区域选择模块110在显示画面300中进行点击与拖放来选择被显示在前景的窗口310的实时状态监测表中的一个单元格(cell)作为目标范围413;用户也可以操作鼠标在目标范围413中的任一位置双击,使得区域选择模块110可以在侦测到双击的事件产生后,取得被双击的位置并判断围起被双击的位置的区域,以选择目标范围413。
[0065] 在区域选择模块110选择出目标范围413后,影像撷取模块120可以撷取目标范围413所涵盖的目标影像(步骤230)。
[0066] 需要特别说明的是,在本发明中,区域选择模块110可以直接在当前的显示画面中选择目标范围后,由影像撷取模块120依据区域选择模块110所选择的目标范围的位置数据对显示画面撷取目标影像;也可以是由影像撷取模块120先对当前的显示画面撷取画面影像后,区域选择模块110在影像撷取模块120所撷取的画面影像中选出目标范围,影像撷取模块120再依据区域选择模块110所选择的目标范围的位置数据由画面影像中撷取出目标影像。
[0067] 在影像撷取模块120撷取目标影像(步骤230)后,属性判断模块150可以比对操作系统中的字体与影像撷取模块120所撷取到的目标影像,以判断区域选择模块110所选出的目标范围中的文字的字型属性(步骤250)。在本实施例中,假设属性判断模块150可以先使用Arial、Times New Roman、新细明体、标楷体等常用字体与目标影像进行比对以判断目标范围413内的文字的字型属性(步骤251),若属性判断模块150可以由常用字体判断出目标范围413内的文字的字型属性,则字辨识模块170可以开始执行。
[0068] 而若属性判断模块150无法由常用字体判断出目标范围413内的文字的字型属性,则属性判断模块150可以使用已安装于操作系统的字体库102中的所有字体来判断目标范围413中的文字的字型属性,以完成目标范围413内的文字的字型属性的判断。
[0069] 在属性判断模块150判断出区域选择模块110所选出的目标范围413中的文字的字型属性(步骤250)后,文字辨识模块170可以依据属性判断模块150所判断出的字型属性辨识目标范围413内的文字(步骤260)。在本实施例中,假设文字辨识模块170可以记录区域选择模块110所选出的目标范围413以及属性判断模块150所判断出的字型属性的对应关系,也就是将目标范围413的范围识别数据以及相对应的字型属性记录为一笔数据,之后,文字辨识模块170可以先依据相对应的字型属性辨识目标范围413内的文字。
[0070] 实务上,在文字辨识模块170依据属性判断模块150所判断出的字型属性辨识目标范围413内的文字(步骤260)后,可以判断是否结束监视(步骤270)。若是,则本发明结束执行,若否,则文字辨识模块170可以在隔一段时间后,依据所记录的与目标范围413对应的字型属性辨识目标范围413中的文字(步骤270),直到判断结束监视为止。
[0071] 如此,通过本发明,不再如现有文字辨识软件需要额外维护样板或特征即可以准确的辨识出目标范围中的文字。
[0072] 上述实施例中,若包含图像处理模块130,则在影像撷取模块120撷取目标影像后,图像处理模块130可以对目标影像进行分析,藉以判断目标影像中的前景色与背景色,并可以依据所判断出的前景色与背景色将目标影像去背(步骤240),使得属性判断模块150在比对目标影像与安装于操作系统的字体库102中的字体时,可以获得更正确的比对结果而准确的判断出目标范围中的文字的字型属性。
[0073] 另外,上述实施例中,若包含提示模块160,则如图2B的流程所示,在属性判断模块150比对常用字体与影像撷取模块120所撷取(或图像处理模块130去背完成)的目标影像以判断区域选择模块110所选出的目标范围413内的文字的字型属性(步骤251)后,提示模块
160可以显示如图3B的窗口或对话框320,以显示属性判断模块150所判断出的字型属性(步骤253),同时提供用户确认属性判断模块150所判断出的字型属性是否正确(步骤255),也就是提供使用者依据比对结果字段323所显示的结果文字是否与目标影像321所表示的文字相同来确认属性判断模块150所判断出的字型属性是否正确。若用户确认两文字不同,表示属性判断模块150判断错误,则用户可以操作鼠标等输入设备点选表示错误的按键324,而若用户确认两文字相同,表示属性判断模块150判断正确,则使用者可以点选表示正确的按键325。
[0074] 若用户点选表示属性判断模块150判断错误的按键324,则属性判断模块150可以比对安装于操作系统的字体库102中的所有字体与目标影像321,以判断目标范围413内的文字的字型属性(步骤259),而若用户点选表示属性判断模块150判断正确的按键325,则文字辨识模块170可以开始依据属性判断模块150所判断出的字型属性辨识目标范围413中的文字。
[0075] 其中,在属性判断模块150比对安装于操作系统的字体库102中的所有字体与目标影像321,以判断目标范围413内的文字的字型属性(步骤259)前,提示模块160可以显示如图3C所示的窗口或对话框330,以提供用户输入目标影像321所表示的文字中的全部或部分内容,也就是提供用户输入目标范围413内的全部或部分的文字(步骤257),使得属性判断模块150再判断目标范围413内的文字的字型属性时,可以由安装于字体库102中的所有字体中抽取出被输入的文字的样板或特征,并使用所抽取出的样本或特征与目标影像321进行比对,以加快判断出目标范围413内的文字的字型属性的速度。
[0076] 此外,上述实施例中,在区域选择模块110选择目标范围(步骤220)前,区域选择模块110可以提供用户选择监测区域,并对用户所选择的监测区域进行分析,以判断出一个或多个监测目标。如图4所示,区域选择模块110可以提供用户选择窗口310的实时状态监测表做为监测区域400,之后,区域选择模块110可以依据监测区域400中的线条与色块判断出监测区域400中的监测目标,也就是目标范围411~414、421~422等,并逐一选择一个目标范围重复上述步骤220至步骤270以辨识各个目标范围中的文字。
[0077] 其中,若目标范围413为第一个被区域选择模块110选择的目标范围,则在区域选择模块110选择其他目标范围(步骤220)后,属性判断模块150在比对安装于操作系统的字体库102中的字体与影像撷取模块120所撷取的目标影像(步骤250)时,可以优先使用目标范围413的文字所使用的字体来与目标影像进行比对。若目标范围413的文字所使用的字体的样板或特征与目标影像所表示的文字相符,则属性判断模块150可以判断区域选择模块110所选择的其他目标范围的文字也使用相同的字体,而若目标范围413的文字所使用的字体的样板或特征与目标影像所表示的文字相符,则属性判断模块150可以使用上述步骤251至步骤259来判断区域选择模块110所选择的其他目标范围的文字的字型属性,使得文字辨识模块170可以依据属性判断模块150所判断出的字型属性辨识目标区域中的文字(步骤
260)。
[0078] 综上所述,可知本发明与现有技术之间的差异在于具有依据操作系统中的字体判断被显示于目标范围内的文字的字型属性,并依据所判断出的字型属性辨识目标范围内的文字的技术手段,由此技术手段可以解决现有技术所存在光学字符识别需要在维护复杂度与辨识准确度上做取舍的问题,进而达成以效率高的简单维护即可以获得高准确度的文字辨识结果的技术功效。
[0079] 再者,本发明的使用已安装字体辨识画面文字的方法,可实现于硬件、软件或硬件与软件的组合中,也可在计算机系统中以集中方式实现或以不同组件散布于若干互连的计算机系统的分散方式实现。
[0080] 虽然本发明所说明的实施方式如上,惟所述的内容并非用以直接限定本发明的专利保护范围。任何本发明所属技术领域中的本领域技术人员,在不脱离本发明所公开的精神和范围的前提下,对本发明的实施的形式上及细节上作些许的更动润饰,均属于本发明的专利保护范围。本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。