一种英文图像区域识别方法及装置转让专利
申请号 : CN202110488163.9
文献号 : CN112906696B
文献日 : 2021-08-13
发明人 : 苏琳
申请人 : 北京惠朗时代科技有限公司
摘要 :
权利要求 :
1.一种英文图像区域识别方法,其特征在于,包括如下步骤:获取待识别图像区域;
分别提取预先选取的图片和所述待识别图像区域的GIST特征,以得到与所述图片和所述待识别图像区域对应的全局表征结果;
根据所述全局表征结果,利用所述图片与所述待识别图像区域进行匹配,得到匹配结果;
根据所述匹配结果判断所述待识别图像区域是否为非英文图像区域;
所述根据所述匹配结果判断所述待识别图像区域是否为非英文图像区域的步骤包括以下步骤:
当与所述待识别图像区域匹配到的所述图片的数量低于预设数量时,判定所述待识别图像区域为非英文图像区域;
当与所述待识别图像区域匹配到的所述图片的数量不低于预设数量时,对所述待识别图像区域进行二次判定;
所述对所述待识别图像区域进行二次判定的步骤包括以下步骤:计算所述待识别图像区域和样本表征结果的空间距离,以得到计算结果;
根据所述计算结果,多次查询所述空间距离与所述待识别图像区域的空间距离邻近的不同数量的样本表征结果及其对应的样本,以得到多个判别结果;
比较多个所述判别结果,得到比较结果;
根据所述比较结果判断所述待识别图像区域是否为非英文图像区域。
2.根据权利要求1所述的英文图像区域识别方法,其特征在于,所述对所述待识别图像区域进行二次判定的步骤之前,所述方法还包括以下步骤:获取样本;
提取所述样本的GIST特征,以得到样本表征结果。
3.根据权利要求2所述的英文图像区域识别方法,其特征在于,所述样本包括正训练样本和负训练样本,所述正训练样本为英文图像区域,所述负训练样本为非英文图像区域。
4.一种英文图像区域识别装置,其特征在于,包括:待识别图像区域获取模块,用于获取待识别图像区域;
GIST特征提取模块,用于分别提取预先选取的图片和所述待识别图像区域的GIST特征,以得到与所述图片和所述待识别图像区域对应的全局表征结果;
匹配模块,用于根据所述全局表征结果,利用所述图片与所述待识别图像区域进行匹配,得到匹配结果;
判定模块,用于根据所述匹配结果判断所述待识别图像区域是否为非英文图像区域;
所述判定模块包括:
图像区域判定单元,用于当与所述待识别图像区域匹配到的所述图片的数量低于预设数量时,判定所述待识别图像区域为非英文图像区域;
二次判定单元,用于当与所述待识别图像区域匹配到的所述图片的数量不低于预设数量时,对所述待识别图像区域进行二次判定;
所述二次判定单元包括:
第一子单元,用于计算所述待识别图像区域和样本表征结果的空间距离,以得到计算结果;
第二子单元,用于根据所述计算结果,多次查询所述空间距离与所述待识别图像区域的空间距离邻近的不同数量的所述样本表征结果及其对应的样本,以得到多个判别结果;
第三子单元,用于比较多个所述判别结果,得到比较结果;
第四子单元,用于根据所述比较结果判断所述待识别图像区域是否为非英文图像区域。
5.一种电子设备,其特征在于,包括:存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1‑2中任一项所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑2中任一项所述的方法。
说明书 :
一种英文图像区域识别方法及装置
技术领域
背景技术
我们想要对图像中的英文进行识别和编辑时,精准地判断出图片中哪部分是英文图像区域
是一个非常重要的环节。然而,目前的技术无法较为准确的识别出图像的某一区域是否为
英文图像区域。
发明内容
和待识别图像区域对应的全局表征结果。根据全局表征结果,利用图片与待识别图像区域
进行匹配,得到匹配结果,匹配结果即与待识别图像区域相匹配的图片的数量。根据匹配结
果判断待识别图像区域是否为非英文图像区域,也就可以较为准确的识别出待识别图像区
域是否为英文图像区域。
时,判定待识别图像区域为非英文图像区域。当与待识别图像区域匹配到的图片的数量不
低于预设数量时,对待识别图像区域进行二次判定。上述实现过程中,通过与待识别图像区
域匹配到的图片的数量可以确定待识别图像区域是否为非英文图像区域,若无法直接将待
识别图像区域判定为非英文图像区域,则需要二次判定,从而使得识别结果更加准确。
多次查询空间距离与待识别图像区域的空间距离邻近的不同数量的样本表征结果及其对
应的样本,以得到多个判别结果。比较多个判别结果,得到比较结果。根据比较结果判断待
识别图像区域是否为非英文图像区域。通过上述二次判定得到更为准确的比较结果,进而
使得到的待识别图像区域的识别结果可以更加准确。
可以实现获取样本并对样本进行GIST特征提取,得到样本表征结果的目的。
本可以使得样本图像信息更加完整,从而在进行二次判定时,得到待识别图像区域的识别
结果可以更加准确。
和待识别图像区域的GIST特征,以得到与图片和待识别图像区域对应的全局表征结果。匹
配模块,用于根据全局表征结果,利用图片与待识别图像区域进行匹配,得到匹配结果。判
定模块,用于根据匹配结果判断待识别图像区域是否为非英文图像区域。上述实现过程中,
根据与待识别图像区域相匹配的图片的数量,可以对待识别图像区域进行判断,也就可以
较为准确的识别出待识别图像区域是否为英文图像区域。
域。二次判定单元,用于当与待识别图像区域匹配到的图片的数量不低于预设数量时,对待
识别图像区域进行二次判定。上述实现过程中,判断模块可以通过匹配到的图片的数量可
以确定待识别图像区域是否为非英文图像区域,若无法将待识别图像区域判定为非英文图
像区域,则需要二次判定,从而使得识别结果更加准确。
多次查询空间距离与待识别图像区域的空间距离邻近的不同数量的样本表征结果及其对
应的样本,以得到多个判别结果。第三子单元,用于比较多个判别结果,得到比较结果。第四
子单元,用于根据比较结果判断待识别图像区域是否为非英文图像区域。通过上述二次判
定单元,可以得到更为准确的比较结果,从而使得到的待识别图像区域的识别结果可以更
加准确。
过上述样本获取单元和上述样本表征结果获取单元可以得到的样本表征结果,以突出样本
图像的细节信息。
过程中,正训练样本和负训练样本使得样本图像信息更加完整,继而在进行二次判定时,使
得对待识别图像区域的识别结果可以更加准确。
附图说明
范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这
些附图获得其他相关的附图。
具体实施方式
本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施
例的组件可以以各种不同的配置来布置和设计。
技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范
围。
描述中,若出现术语“第一”、“第二”、“第三”、“第四”等仅用于区分描述,而不能理解为指示
或暗示相对重要性。
在任何这种实际的关系或者顺序。而且,若出现术语“包括”、“包含”或者其任何其他变体意
在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那
些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者
设备所固有的要素。在没有更多限制的情况下,若出现由语句“包括一个……”限定的要素,
并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元
件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可
以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语
在本申请中的具体含义。
理,以得到更为清晰的待识别图像区域,使得后续对待识别图像区域的识别结果更加准确。
类。
片的数量,也就是匹配结果。
图像区域的目的。
作为待识别图片,使得从待识别图片确定的待识别图像区域可以更加清晰。
的每个网格均值级联起来,得到图像的GIST特征。
到26个英文字母图片和待识别图像区域的全局表征结果。然后根据全局表征结果,可以计
算出26个英文字母图片与待识别图像区域的欧式距离,通过欧式距离对26个英文字母图片
和待识别图像区域进行匹配,得到匹配结果,最后根据匹配结果判断待识别图像区域是否
为非英文图像区域。
量时,判定待识别图像区域为非英文图像区域。当与待识别图像区域匹配到的图片的数量
不低于预设数量时,对待识别图像区域进行二次判定。具体的,通过与待识别图像区域匹配
到的图片的数量可以确定待识别图像区域是否为非英文图像区域,若无法直接将待识别图
像区域判定为非英文图像区域,则需要二次判定,以使得识别结果更加准确。
时,则将待识别图像区域直接认定为非英文图像区域。若待识别图像区域匹配到的26个英
文字母图片的数量不低于10个,则需要对待识别图像区域进行二次判定,以使得到的识别
结果更为准确。
果,多次查询空间距离与待识别图像区域的空间距离邻近的不同数量的样本表征结果及其
对应的样本,以得到多个判别结果,具体的,上述样本表征结果为样本的GIST特征提取结
果。比较多个判别结果,得到比较结果。根据比较结果判断待识别图像区域是否为非英文图
像区域。上述步骤为对待识别图像区域进行二次判定。通过上述二次判定得到更为准确的
比较结果,进而使得到的待识别图像区域的识别结果可以更加准确。
距离计算出待识别图像区域和样本表征结果的空间距离,接着以待识别图像区域为基准,
选择与待检测图像相邻的10个样本表征结果,当这10个样本表征结果中的超过5个样本表
征结果对应的样本为正训练样本时,则判定待识别图像区域为英文图像区域。反之,当这10
个样本中正训练样本的数量不超过5个时,则判定待识别图像区域为非英文图像区域。接着
再以待识别图像区域为基准,选择与待识别图像区域相邻的20个样本表征结果,当这20个
样本表征结果中的超过10个样本表征结果对应的样本为正训练样本时,则判定待识别图像
区域为英文图像区域。反之,当这20个样本表征结果中正训练样本的数量不超过10个时,则
待识别图像区域为非英文图像区域。然后依然以待识别图像区域为基准,选择与待识别图
像区域相邻的30个样本表征结果,当这30个样本表征结果中的超过15个样本表征结果对应
的样本为正训练样本时,则判定待识别图像区域为英文图像区域。反之,当这30个样本表征
结果中正训练样本的数量不超过15个时,则判定待识别图像区域为非英文图像区域。接着
以待识别图像区域为基准,选择与待识别图像区域相邻的40个样本表征结果,当这40个样
本表征结果中的超过20个样本表征结果对应的样本为正训练样本时,则判定待识别图像区
域为英文图像区域。反之,当这40个样本表征结果中正训练样本的数量不超过20个时,则判
定待识别图像区域为非英文图像区域。最后依然以待识别图像区域为基准,选择与待识别
图像区域相邻的50个样本表征结果,当这50个样本表征结果中的超过25个样本表征结果对
应的样本为正训练样本时,则判定待识别图像区域为英文图像区域。反之,当这50个样本表
征结果中正训练样本的数量不超过25个时,则判定待识别图像区域为非英文图像区域。当
经过上述五次判别后,若待识别图像区域有三次及以上被判定为英文图像区域,则最终判
定待识别图像区域为英文图像区域。反之,若待识别图像区域有三次及以上被判定为非英
文图像区域,则最终判定为非英文图像区域。
步骤可以在获取样本后,通过对样本进行GIST特征提取,从而得到样本表征结果。
样本图像信息更加完整,从而在进行二次判定时,对待识别图像区域进行识别的识别结果
可以更加准确。
取待识别图像区域,具体的,可以通过摄像头获取待识别图片,通过待识别图片确定待识别
图像区域。GIST特征提取模块120,用于分别提取预先选取的图片和待识别图像区域的GIST
特征,以得到与图片和待识别图像区域对应的全局表征结果。匹配模块130,用于根据全局
表征结果,利用图片与待识别图像区域进行匹配,得到匹配结果。具体的,通过图片与待识
别图像区域的欧式距离进行匹配,最后得到与待识别图像区域相匹配的图片的数量,也就
是匹配结果。判定模块140,用于根据匹配结果判断待识别图像区域是否为非英文图像区
域。具体的,根据与待识别图像区域相匹配的图片的数量,可以判断待识别图像区域是否为
非英文图像区域,也就可以较为准确的识别出待识别图像区域是否为英文图像区域。
图像区域。二次判定单元,用于当与待识别图像区域匹配到的图片的数量不低于预设数量
时,对待识别图像区域进行二次判定。上述实现过程中,判断模块可以通过匹配到的图片的
数量确定待识别图像区域是否为非英文图像区域,若不能直接将待识别图像区域判定为非
英文图像区域,则需要对待识别图像区域进行二次判定,从而使得识别结果更加准确。
果,多次查询空间距离与待识别图像区域的空间距离邻近的不同数量的样本表征结果及其
对应的样本,以得到多个判别结果。第三子单元,用于比较多个判别结果,得到比较结果。第
四子单元,用于根据比较结果判断待识别图像区域是否为非英文图像区域。通过对待识别
图像区域进行上述二次判定,可以得到更为准确的比较结果,从而使得到的待识别图像区
域的识别结果可以更加准确。
结果。通过上述样本获取单元和上述样本表征结果获取单元可以得到的样本表征结果,以
突出样本图像的细节信息。
述实现过程中,正训练样本和负训练样本可以使得样本图像信息更加完整,继而在进行二
次判定时,使得对待识别图像区域的识别结果可以更加准确。
之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一
条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本申
请实施例所提供的英文图像区域识别装置100对应的程序指令/模块,处理器102通过执行
存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口
103可用于与其他节点设备进行信令或数据的通信。
Read‑Only Memory,PROM),可擦除只读存储器101(Erasable Programmable Read‑Only
Memory,EPROM),电可擦除只读存储器101(Electric Erasable Programmable Read‑Only
Memory,EEPROM)等。
(Network Processor,NP)等;还可以是数字信号处理器102(Digital Signal Processing,
DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门
阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶
体管逻辑器件、分立硬件组件。
合实现。
了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能
和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部
分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行
指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附
图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可
以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个
方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于
硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个
人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
而前述的存储介质包括:U盘、移动硬盘、只读存储器101(ROM,Read‑Only Memory)、随机存
取存储器101(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介
质。
到与图片和待识别图像区域对应的全局表征结果。根据全局表征结果,利用图片与待识别
图像区域进行匹配,得到匹配结果,匹配结果即与待识别图像区域相匹配的图片的数量。根
据匹配结果判断待识别图像区域是否为非英文图像区域,也就可以较为准确的识别出待识
别图像区域是否为英文图像区域。
改、等同替换、改进等,均应包含在本申请的保护范围之内。
从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权
利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有
变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。