一种基于模板匹配的目标定位方法、系统、装置及介质转让专利

申请号 : CN202110257976.7

文献号 : CN113128554B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 彭绍湖朱希诚胡晓刘长红杨兴鑫

申请人 : 广州大学

摘要 :

本发明公开了一种基于模板匹配的目标定位方法、系统、装置及介质,方法包括:构建模板图像金字塔,并构建第一网格;选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格;确定第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据第一梯度幅度和第一梯度方向熵值确定第一局部特征点,并根据第一局部特征点建立第一LBP直方图特征向量;建立目标图像金字塔的第二LBP直方图特征向量,再根据第一LBP直方图特征向量和第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度。本发明减少了对系统算力的要求,克服了现有技术受旋转影响大的缺点,提高了目标定位的准确度,可广泛应用于计算机视觉技术领域。

权利要求 :

1.一种基于模板匹配的目标定位方法,其特征在于,包括以下步骤:

获取模板图像,根据所述模板图像构建模板图像金字塔,并根据所述模板图像金字塔构建第一网格;

确定所述第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格;

确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据所述第一梯度幅度和所述第一梯度方向熵值确定第一局部特征点,并根据所述第一局部特征点建立第一LBP直方图特征向量;

获取目标图像,根据所述目标图像构建目标图像金字塔,并确定所述目标图像金字塔的第二局部特征点,进而根据所述第二局部特征点建立第二LBP直方图特征向量,再根据所述第一LBP直方图特征向量和所述第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度;

所述获取目标图像,根据所述目标图像构建目标图像金字塔,并确定所述目标图像金字塔的第二局部特征点,进而根据所述第二局部特征点建立第二LBP直方图特征向量,再根据所述第一LBP直方图特征向量和所述第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度这一步骤,其具体包括:获取目标图像,根据所述目标图像构建目标图像金字塔,并根据所述目标图像金字塔构建第三网格;

确定所述第三网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第四阈值的第三网格作为第四网格;

确定所述第四网格中所有像素点的第二梯度幅度和第二梯度方向熵值,并根据所述第二梯度幅度和所述第二梯度方向熵值确定第二局部特征点,并根据所述第二局部特征点建立第二LBP直方图特征向量;

计算所述模板图像金字塔和所述目标图像金字塔中每一层的第一LBP直方图特征向量和对应位置的第二LBP直方图特征向量的相似度,从顶层到底层依次进行相似度匹配,并将相似度小于预设的第五阈值的第二局部特征点舍去,进而在所述目标图像金字塔的底层筛选出相似度大于等于所述第五阈值的第二局部特征点,从而确定待定位目标的位置和旋转角度。

2.根据权利要求1所述的一种基于模板匹配的目标定位方法,其特征在于,所述获取模板图像,根据所述模板图像构建模板图像金字塔,并根据所述模板图像金字塔构建第一网格这一步骤,其具体包括:获取模板图像,对所述模板图像的宽和高进行扩展得到扩展模板图像;

对所述扩展模板图像进行下采样,生成模板图像金字塔;

提取所述模板图像金字塔中每一层的第一金字塔图像,并根据所述第一金字塔图像通过四叉树分割自适应构建第一网格;

其中,所述第一金字塔图像被对应的第一网格所覆盖。

3.根据权利要求2所述的一种基于模板匹配的目标定位方法,其特征在于,所述根据所述第一金字塔图像通过四叉树分割自适应构建第一网格这一步骤中,当所述第一网格的宽或高小于预设的第六阈值时,不再进行四叉树分割,所述第六阈值满足以下条件:其中,μs表示第六阈值,WTL表示模板图像金字塔的顶层图像的宽,HTL表示模板图像金字塔最顶层图像的高。

4.根据权利要求1所述的一种基于模板匹配的目标定位方法,其特征在于,所述确定所述第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格这一步骤,其具体包括:计算所述第一网格中所有像素点的梯度幅度总和,并根据所述第一网格中像素点的数量和所述梯度幅度总和确定平均梯度幅度;

确定平均梯度幅度大于等于所述第一阈值,则获取对应的第一网格作为第二网格。

5.根据权利要求1所述的一种基于模板匹配的目标定位方法,其特征在于,所述确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据所述第一梯度幅度和所述第一梯度方向熵值确定第一局部特征点,并根据所述第一局部特征点建立第一LBP直方图特征向量这一步骤,其具体包括:确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值;

获取预设的第二阈值和第三阈值,选取所述第一梯度幅度大于等于所述第二阈值且所述第一梯度方向熵值大于等于所述第三阈值的像素点作为第一局部特征点;

将所述第一局部特征点作为中心像素点提取出第一LBP直方图特征向量。

6.根据权利要求5所述的一种基于模板匹配的目标定位方法,其特征在于,所述将所述第一局部特征点作为中心像素点提取出第一LBP直方图特征向量这一步骤,其具体为:将所述第一局部特征点作为中心像素点,并结合LBP等价模式下uniform≤2的九种模式,建立第一局部特征点的第一LBP直方图特征向量。

7.一种基于模板匹配的目标定位系统,其特征在于,包括:

网格构建模块,用于获取模板图像,根据所述模板图像构建模板图像金字塔,并根据所述模板图像金字塔构建第一网格;

网格选取模块,用于确定所述第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格;

LBP直方图特征向量建立模块,用于确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据所述第一梯度幅度和所述第一梯度方向熵值确定第一局部特征点,并根据所述第一局部特征点建立第一LBP直方图特征向量;

相似度匹配模块,用于获取目标图像,根据所述目标图像构建目标图像金字塔,并确定所述目标图像金字塔的第二局部特征点,进而根据所述第二局部特征点建立第二LBP直方图特征向量,再根据所述第一LBP直方图特征向量和所述第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度;

所述相似度匹配模块具体用于:

获取目标图像,根据所述目标图像构建目标图像金字塔,并根据所述目标图像金字塔构建第三网格;

确定所述第三网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第四阈值的第三网格作为第四网格;

确定所述第四网格中所有像素点的第二梯度幅度和第二梯度方向熵值,并根据所述第二梯度幅度和所述第二梯度方向熵值确定第二局部特征点,并根据所述第二局部特征点建立第二LBP直方图特征向量;

计算所述模板图像金字塔和所述目标图像金字塔中每一层的第一LBP直方图特征向量和对应位置的第二LBP直方图特征向量的相似度,从顶层到底层依次进行相似度匹配,并将相似度小于预设的第五阈值的第二局部特征点舍去,进而在所述目标图像金字塔的底层筛选出相似度大于等于所述第五阈值的第二局部特征点,从而确定待定位目标的位置和旋转角度。

8.一种基于模板匹配的目标定位装置,其特征在于,包括:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1至6中任一项所述的一种基于模板匹配的目标定位方法。

9.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1至6中任一项所述的一种基于模板匹配的目标定位方法。

说明书 :

一种基于模板匹配的目标定位方法、系统、装置及介质

技术领域

[0001] 本发明涉及计算机视觉技术领域,尤其是一种基于模板匹配的目标定位方法、系统、装置及介质。

背景技术

[0002] 模板匹配在计算机视觉和图像处理领域中属于经典的方法,通过给定模板图像和目标图像,提取图像的特征向量,计算模板图像与目标图像中候选窗口的相似度,与模板图像最相似的候选窗口则为匹配结果。
[0003] LBP(Local Binary Patterns)算法,自从2002年被Timo Ojala等人提出,通过比较像素点与八邻域的灰度值大小,共有36组二值模式用于表示像素点的旋转不变性,其中uniform≤2的9个二值模式被称为等价模式,其余二值模式被称为混合模式。基于LBP的变式也不断在创新,但是基于LBP算法的核心都是局部像素点的二值模式。Li Liu等人提出的MRELBP算法,包括基于中心强度的ELBP_CI方法、基于邻域强度的ELBP_NI方法、基于径向差异的ELBP_RD方法和基于角差的ELBP_AD方法,并且在ELBP的基础上,使用中值滤波器的响应来代替单个像素的值,最终在从混合模式中挑选出5个具有对称性的模式与等价模式的9个模式合并,但是混合模式中旋转不变稳定性不够,受旋转的影响大。Ioan Buciu等人提出的LBP‑NMF算法针对面部表情,提取双眼、鼻子和嘴部这四个部分的图片的LBP直方图特征做模板匹配,因为区域内每个点的LBP直方图信息都需要被用于计算,所以计算消耗的时间一定更多,并且结果的准确性也与这四个部分的位置划分相关。

发明内容

[0004] 本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
[0005] 为此,本发明实施例的一个目的在于提供一种基于模板匹配的目标定位方法,该方法一方面根据筛选出的局部特征点建立LBP直方图特征向量,无需对图像内每个像素点都进行计算,减少了对系统算力的要求,另一方面根据LBP直方图特征向量的相似度匹配确定出稳定像素点,克服了现有技术受旋转影响大的缺点,提高了目标定位的准确度。
[0006] 本发明实施例的另一个目的在于提供一种基于模板匹配的目标定位系统。
[0007] 为了达到上述技术目的,本发明实施例所采取的技术方案包括:
[0008] 第一方面,本发明实施例提供了一种基于模板匹配的目标定位方法,包括以下步骤:
[0009] 获取模板图像,根据所述模板图像构建模板图像金字塔,并根据所述模板图像金字塔构建第一网格;
[0010] 确定所述第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格;
[0011] 确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据所述第一梯度幅度和所述第一梯度方向熵值确定第一局部特征点,并根据所述第一局部特征点建立第一LBP直方图特征向量;
[0012] 获取目标图像,根据所述目标图像构建目标图像金字塔,并确定所述目标图像金字塔的第二局部特征点,进而根据所述第二局部特征点建立第二LBP直方图特征向量,再根据所述第一LBP直方图特征向量和所述第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度。
[0013] 进一步地,在本发明的一个实施例中,所述获取模板图像,根据所述模板图像构建模板图像金字塔,并根据所述模板图像金字塔构建第一网格这一步骤,其具体包括:
[0014] 获取模板图像,对所述模板图像的宽和高进行扩展得到扩展模板图像;
[0015] 对所述扩展模板图像进行下采样,生成模板图像金字塔;
[0016] 提取所述模板图像金字塔中每一层的第一金字塔图像,并根据所述第一金字塔图像通过四叉树分割自适应构建第一网格;
[0017] 其中,所述第一金字塔图像被对应的第一网格所覆盖。
[0018] 进一步地,在本发明的一个实施例中,所述根据所述第一金字塔图像通过四叉树分割自适应构建第一网格这一步骤中,当所述第一网格的宽或高小于预设的第六阈值时,不再进行四叉树分割,所述第六阈值满足以下条件:
[0019]
[0020] 其中,μs表示第六阈值,WTL表示模板图像金字塔的顶层图像的宽,HTL表示模板图像金字塔最顶层图像的高。
[0021] 进一步地,在本发明的一个实施例中,所述确定所述第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格这一步骤,其具体包括:
[0022] 计算所述第一网格中所有像素点的梯度幅度总和,并根据所述第一网格中像素点的数量和所述梯度幅度总和确定平均梯度幅度;
[0023] 确定平均梯度幅度大于等于所述第一阈值,则获取对应的第一网格作为第二网格。
[0024] 进一步地,在本发明的一个实施例中,所述确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据所述第一梯度幅度和所述第一梯度方向熵值确定第一局部特征点,并根据所述第一局部特征点建立第一LBP直方图特征向量这一步骤,其具体包括:
[0025] 确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值;
[0026] 获取预设的第二阈值和第三阈值,选取所述第一梯度幅度大于等于所述第二阈值且所述第一梯度方向熵值大于等于所述第三阈值的像素点作为第一局部特征点;
[0027] 将所述第一局部特征点作为中心像素点提取出第一LBP直方图特征向量。
[0028] 进一步地,在本发明的一个实施例中,所述将所述第一局部特征点作为中心像素点提取出第一LBP直方图特征向量这一步骤,其具体为:
[0029] 将所述第一局部特征点作为中心像素点,并结合LBP等价模式下uniform≤2的九种模式,建立第一局部特征点的第一LBP直方图特征向量。
[0030] 进一步地,在本发明的一个实施例中,所述获取目标图像,根据所述目标图像构建目标图像金字塔,并确定所述目标图像金字塔的第二局部特征点,进而根据所述第二局部特征点建立第二LBP直方图特征向量,再根据所述第一LBP直方图特征向量和所述第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度这一步骤,其具体包括:
[0031] 获取目标图像,根据所述目标图像构建目标图像金字塔,并根据所述目标图像金字塔构建第三网格;
[0032] 确定所述第三网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第四阈值的第三网格作为第四网格;
[0033] 确定所述第四网格中所有像素点的第二梯度幅度和第二梯度方向熵值,并根据所述第二梯度幅度和所述第二梯度方向熵值确定第二局部特征点,并根据所述第二局部特征点建立第二LBP直方图特征向量;
[0034] 计算所述模板图像金字塔和所述目标图像金字塔中每一层的第一LBP直方图特征向量和对应位置的第二LBP直方图特征向量的相似度,从顶层到底层依次进行相似度匹配,并将相似度小于预设的第五阈值的第二局部特征点舍去,进而在所述目标图像金字塔的底层筛选出相似度大于等于所述第五阈值的第二局部特征点,从而确定待定位目标的位置和旋转角度。
[0035] 第二方面,本发明实施例提供了一种基于模板匹配的目标定位系统,包括:
[0036] 网格构建模块,用于获取模板图像,根据所述模板图像构建模板图像金字塔,并根据所述模板图像金字塔构建第一网格;
[0037] 网格选取模块,用于确定所述第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格;
[0038] LBP直方图特征向量建立模块,用于确定所述第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据所述第一梯度幅度和所述第一梯度方向熵值确定第一局部特征点,并根据所述第一局部特征点建立第一LBP直方图特征向量;
[0039] 相似度匹配模块,用于获取目标图像,根据所述目标图像构建目标图像金字塔,并确定所述目标图像金字塔的第二局部特征点,进而根据所述第二局部特征点建立第二LBP直方图特征向量,再根据所述第一LBP直方图特征向量和所述第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度。
[0040] 第三方面,本发明实施例提供了一种基于模板匹配的目标定位装置,包括:
[0041] 至少一个处理器;
[0042] 至少一个存储器,用于存储至少一个程序;
[0043] 当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的一种基于模板匹配的目标定位方法。
[0044] 第四方面,本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行上述的一种基于模板匹配的目标定位方法。
[0045] 本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
[0046] 本发明实施例基于梯度幅度和梯度方向熵值筛选出金字塔图像中属于边缘和纹理的局部特征点,并根据局部特征点建立LBP直方图特征向量,进而根据LBP直方图特征向量的相似度匹配确定出稳定像素点,从而获取待定位目标的位置和旋转角度,本发明实施例相较现有技术而言,一方面根据筛选出的局部特征点建立LBP直方图特征向量,无需对图像内每个像素点都进行计算,减少了对系统算力的要求,另一方面根据LBP直方图特征向量的相似度匹配确定出稳定像素点,克服了现有技术受旋转影响大的缺点,提高了目标定位的准确度。

附图说明

[0047] 为了更清楚地说明本发明实施例中的技术方案,下面对本发明实施例中所需要使用的附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
[0048] 图1为本发明实施例提供的一种基于模板匹配的目标定位方法的步骤流程图;
[0049] 图2为本发明实施例提供的一种基于模板匹配的目标定位系统的结构框图;
[0050] 图3为本发明实施例提供的一种基于模板匹配的目标定位装置的结构框图。

具体实施方式

[0051] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0052] 在本发明的描述中,多个的含义是两个或两个以上,如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外,除非另有定义,本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。
[0053] 参照图1,本发明实施例提供了一种基于模板匹配的目标定位方法,具体包括以下步骤:
[0054] S101、获取模板图像,根据模板图像构建模板图像金字塔,并根据模板图像金字塔构建第一网格;
[0055] 具体地,模板图像金字塔中每一层均有对应的金字塔图像,第一网格用于覆盖该金字塔图像,第一网格中包含该金字塔图像的所有像素点,便于后续根据第一网格进行筛选以及确定属于边缘和纹理的局部特征点。步骤S101包括以下步骤:
[0056] S1011、获取模板图像,对模板图像的宽和高进行扩展得到扩展模板图像;
[0057] S1012、对扩展模板图像进行下采样,生成模板图像金字塔;
[0058] S1013、提取模板图像金字塔中每一层的第一金字塔图像,并根据第一金字塔图像通过四叉树分割自适应构建第一网格;
[0059] 其中,第一金字塔图像被对应的第一网格所覆盖。
[0060] 具体地,获取模板图像,分别对模板图像的宽和高进行扩展,扩展为最接近的2的幂次方。对扩展后的图像以比例因子为2的高斯平滑进行下采样,生成模板图像金字塔。
[0061] 对模板图金字塔中每一层的图像,以Anglej角度进行旋转,Anglej角度通过下式计算:
[0062]
[0063] 其中,Angles是旋转的起始角度,AngleE是旋转的终止角度,旋转角度基准步长μA被模板图金字塔的层数和旋转角度的范围限制,因此当旋转角度的范围小,μA的值也应该减小,而当金字塔的总层数小,μA的值应该增大。自金字塔顶层往下的每一层,旋转角度步长dAi相应减小,精确角度的同时减少计算所耗时间,通常μA设置为1。
[0064] 模板图金字塔的顶层图像的尺寸越小,与目标图匹配的计算耗时越短,但是匹配结果的正确率也降低,当金字塔上一层的结果在下一层匹配得分未高于阈值,则意味着该结果的下采样匹配的终止。
[0065] 进一步作为可选的实施方式,根据第一金字塔图像通过四叉树分割自适应构建第一网格这一步骤中,当第一网格的宽或高小于预设的第六阈值时,不再进行四叉树分割,第六阈值满足以下条件:
[0066]
[0067] 其中,μs表示第六阈值,WTL表示模板图像金字塔的顶层图像的宽,HTL表示模板图像金字塔最顶层图像的高。
[0068] 具体地,提取模板图像金字塔中所有图像,包括以一定角度旋转每层金字塔图像获得的图像,基于四叉树原理自适应构建第一网格。
[0069] 网格尺寸大小可为3*3,同时所有图像需要被构建的相应第一网格完全覆盖。
[0070] 第六阈值μs越小,通过筛选的网格越多,提取特征像素点的范围增加,更多的特征像素点能使匹配的精度提升,但会浪费计算与内存资源。同时更多信息量不够的像素点也随之包含在了特征像素点中,这将会导致匹配结果不稳定。第六阈值μs越大,通过筛选的网格越少,特征像素点的个数一定会减少,匹配计算的耗时相应减少,但用于匹配的特征像素点可能不够充足,导致匹配结果不准确。因此设定的第六阈值μs,应使得金字塔顶层图像至少能建立三层四叉树进行分割。
[0071] S102、确定第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格。
[0072] 具体地,平均梯度幅度大于等于第一阈值的第一网格可初步确定包含边缘和纹理的局部特征点,通过第一阈值的设定筛选出第二网格用于后续确定局部特征点。步骤S102具体包括以下步骤:
[0073] S1021、计算第一网格中所有像素点的梯度幅度总和,并根据第一网格中像素点的数量和梯度幅度总和确定平均梯度幅度;
[0074] S1022、确定平均梯度幅度大于等于第一阈值,则获取对应的第一网格作为第二网格。
[0075] 具体地,计算第一网格中所有像素点的梯度幅度总和,梯度幅度总和除以网格中的像素点个数得到的平均梯度幅度,选取出的第二网格的平均梯度幅度应当大于等于第一阈值。
[0076] 平均梯度幅度小于第一阈值,则很有可能为背景,或者是图像中缺少纹理和边缘的部分,在这些部分中无法提取出有充足信息量的特征点。
[0077] 本发明实施例使用平均梯度幅度进行筛选,相当于图像的全局滤波器,过滤平均梯度幅度较小的网格,相当于不考虑图像中的少边缘少纹理或者无边缘无纹理的区域,缩小从图像中提取强特征点的范围。
[0078] S103、确定第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据第一梯度幅度和第一梯度方向熵值确定第一局部特征点,并根据第一局部特征点建立第一LBP直方图特征向量;
[0079] 具体地,针对每一个筛选出的第二网格,基于梯度幅度和梯度方向熵值评估第二网格中像素点的特征信息量,检测出图像中属于边缘和纹理的局部特征点,然后根据该局部特征点建议LBP直方图特征向量。步骤S103具体包括以下步骤:
[0080] S1031、确定第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值;
[0081] S1032、获取预设的第二阈值和第三阈值,选取第一梯度幅度大于等于第二阈值且第一梯度方向熵值大于等于第三阈值的像素点作为第一局部特征点;
[0082] S1033、将第一局部特征点作为中心像素点提取出第一LBP直方图特征向量。
[0083] 具体地,对于每一个筛选出的第二网格,一种基于梯度幅度和梯度方向熵方法被用于检测图像中属于边缘和纹理的局部特征点。一个像素点的梯度幅度越大,这个像素点包含的梯度信息越丰富;图像某一区域的梯度方向熵值越大,该区域的像素点的梯度方向变化越大,则图像角点存在于该区域的可能性加大,而角点处通常意味着目标轮廓改变,这能为模板匹配提供更多的特征信息。
[0084] 计算像素点的梯度方向熵,以该像素点为n*n区域的中心,n可设为3,即计算9个像素点的梯度方向的熵值。
[0085] 在每个第二网格中选择出梯度幅度和梯度方向熵分别大于对应阈值的像素点,作为局部特征点。
[0086] 进一步作为可选的实施方式,将第一局部特征点作为中心像素点提取出第一LBP直方图特征向量这一步骤,其具体为:
[0087] 将第一局部特征点作为中心像素点,并结合LBP等价模式下uniform≤2的九种模式,建立第一局部特征点的第一LBP直方图特征向量。
[0088] 具体地,将LBP等价模式下uniform≤2的九种模式,作为稳定旋转模式,共有9类。其余不属于稳定旋转模式都归为另一类,因此共有10类二值模式用于提取区域内中心像素点的直方图特征向量。
[0089] 图像的一个3*3区域内,中心像素点的灰度值与周围8个像素点进行比较,周围像素点比中心像素点的灰度值大则标记为1,否则标记为0。因此8个像素点中连续被标记为1的个数会有0、1、2...8,共9类,分别对应着LBP等价模式下uniform≤2的九种模式,作为稳定旋转模式。其余不属于稳定旋转模式都归为另一类,因此共有10类二值模式用于提取每个局部特征点的直方图特征向量。
[0090] 同样,半径为r的区域大小为Rr*Rr,r=1,2,3,...,Rr=2r+1,则每一个半径为r的区域都有Rr*Rr个像素,除中心像素点以外,区域内共有Rr*Rr‑1个像素点通过10类二值模式提取中心像素点的直方图特征向量。
[0091] 对模板图金字塔中的所有图像检测局部特征点,每个局部特征点作为提取LBP特征区域的中心像素点,提取中心像素点的第一LBP直方图特征向量。
[0092] 获取第一LBP直方图特征向量的区域半径越大,包含的信息越丰富,但是提取特征向量所需的时间增加。
[0093] 对模板图金字塔中的所有图像检测局部特征点,以每个局部特征点为区域中心,提取改进LBP直方图特征向量。
[0094] S104、获取目标图像,根据目标图像构建目标图像金字塔,并确定目标图像金字塔的第二局部特征点,进而根据第二局部特征点建立第二LBP直方图特征向量,再根据第一LBP直方图特征向量和第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度。
[0095] 具体地,对目标图像的处理与模板图像处理类似,同样先构建目标图像金字塔,然后确定第二局部特征点,进而建议第二LBP直方图特征向量,然后进行相似度匹配,根据匹配的结果确定待定位目标的位置和旋转角度。步骤S104具体包括以下步骤:
[0096] S1041、获取目标图像,根据目标图像构建目标图像金字塔,并根据目标图像金字塔构建第三网格;
[0097] S1042、确定第三网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第四阈值的第三网格作为第四网格;
[0098] S1043、确定第四网格中所有像素点的第二梯度幅度和第二梯度方向熵值,并根据第二梯度幅度和第二梯度方向熵值确定第二局部特征点,并根据第二局部特征点建立第二LBP直方图特征向量;
[0099] S1044、计算模板图像金字塔和目标图像金字塔中每一层的第一LBP直方图特征向量和对应位置的第二LBP直方图特征向量的相似度,从顶层到底层依次进行相似度匹配,并将相似度小于预设的第五阈值的第二局部特征点舍去,进而在目标图像金字塔的底层筛选出相似度大于等于第五阈值的第二局部特征点,从而确定待定位目标的位置和旋转角度。
[0100] 应当认识到,第二LBP直方图特征向量的建立过程与前述第一LBP直方图特征向量的建立过程基本类似,在此不做赘述。
[0101] 具体地,获取待定位的目标图像后,构建与模板图像金字塔相同金字塔层数的目标图像金字塔,建立目标图像金字塔的第二LBP直方图特征向量,从目标图像金字塔和模板图像金字塔的顶层开始,在目标图像上滑动候选窗口,候选窗口中已记录模板图像中所有局部特征点的相对位置信息,不断将候选窗口的局部特征点的特征向量和对应目标图像上的特征向量进行匹配,通过模板图像的所有局部特征点的直方图特征向量(即第一LBP直方图特征向量)与目标图像对应位置的特征点的直方图特征向量(即第二LBP直方图特征向量)计算相似度。
[0102] 每一层可能有多个结果,对于相似度低于设定的第五阈值的结果舍去,最终在金字塔底层的相似度匹配完成后检测出相似度高且稳定的局部特征点,从而根据该局部特征点获得定待位目标的位置和旋转角度。
[0103] 以上对本发明实施例的方法步骤进行了说明。本发明实施例提供了一种基于模板匹配的目标定位方法,首先,基于梯度幅度和梯度方向,检测出目标图像和模板图像中属于边缘和纹理的特征点;其次,使用一种LBP改进算法,从检测出的特征点中筛选出旋转稳定的局部特征点并建立LBP直方图特征向量;最后,采用一种缩小范围的搜索方法,基于检测出的稳定局部特征点,从金字塔顶层到底层逐层筛选,确定出相似度高于预设阈值且稳定的局部特征点,从而获得准确的目标位置和旋转角度。本发明实施例能够在目标图像存在模糊、遮挡、噪声、复杂的背景以及角度旋转的情况下,准确计算出目标位置和目标旋转角度。
[0104] 本发明实施例基于梯度幅度和梯度方向熵值筛选出金字塔图像中属于边缘和纹理的局部特征点,并根据局部特征点建立LBP直方图特征向量,进而根据LBP直方图特征向量的相似度匹配确定出稳定像素点,从而获取待定位目标的位置和旋转角度,本发明实施例相较现有技术而言,一方面根据筛选出的局部特征点建立LBP直方图特征向量,无需对图像内每个像素点都进行计算,减少了对系统算力的要求,另一方面根据LBP直方图特征向量的相似度匹配确定出稳定像素点,克服了现有技术受旋转影响大的缺点,提高了目标定位的准确度。
[0105] 参照图2,本发明实施例提供了一种基于模板匹配的目标定位系统,包括:
[0106] 网格构建模块,用于获取模板图像,根据模板图像构建模板图像金字塔,并根据模板图像金字塔构建第一网格;
[0107] 网格选取模块,用于确定第一网格中所有像素点的平均梯度幅度,并选取平均梯度幅度大于等于预设的第一阈值的第一网格作为第二网格;
[0108] LBP直方图特征向量建立模块,用于确定第二网格中所有像素点的第一梯度幅度和第一梯度方向熵值,并根据第一梯度幅度和第一梯度方向熵值确定第一局部特征点,并根据第一局部特征点建立第一LBP直方图特征向量;
[0109] 相似度匹配模块,用于获取目标图像,根据目标图像构建目标图像金字塔,并确定目标图像金字塔的第二局部特征点,进而根据第二局部特征点建立第二LBP直方图特征向量,再根据第一LBP直方图特征向量和第二LBP直方图特征向量的相似度匹配确定待定位目标的位置和旋转角度。
[0110] 上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0111] 参照图3,本发明实施例提供了一种基于模板匹配的目标定位装置,包括:
[0112] 至少一个处理器;
[0113] 至少一个存储器,用于存储至少一个程序;
[0114] 当上述至少一个程序被上述至少一个处理器执行时,使得上述至少一个处理器实现上述的一种基于模板匹配的目标定位方法。
[0115] 上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0116] 本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,该处理器可执行的程序在由处理器执行时用于执行上述一种基于模板匹配的目标定位方法。
[0117] 本发明实施例的一种计算机可读存储介质,可执行本发明方法实施例所提供的一种基于模板匹配的目标定位方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
[0118] 本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
[0119] 在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0120] 此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
[0121] 上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0122] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0123] 计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序,然后将其存储在计算机存储器中。
[0124] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0125] 在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0126] 尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
[0127] 以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。