一种模板匹配方法和装置以及手势识别方法和装置转让专利

申请号 : CN201610901954.9

文献号 : CN106548133B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 崔会会

申请人 : 歌尔科技有限公司

摘要 :

本发明公开了一种模板匹配方法和装置以及手势识别方法和装置,模板匹配方法包括:预设多组模板;计算输入图像与第一组模板的最小累计距离;(a)判断距离与拒绝阈值的关系;若都大于拒绝阈值,输出不在模板范围内;若有一个距离小于拒绝阈值,计算输入图像与后面多组模板中的对应模板的最小累计距离,判断是否所有距离都小于拒绝阈值,若是,输出对应模板;若否,输出不在模板范围内;若有两个及以上距离小于拒绝阈值,获取最小值,计算最小值与其他距离的差值,判断是否所有的差值均大于差别阈值;若是,输出对应模板;若否,计算输入图像与下一组模板对应模板的最小累计距离,返回(a)。本发明提高了模板匹配精度,降低了手势识别误判率。

权利要求 :

1.一种模板匹配方法,其特征在于:所述匹配方法包括:预设多组模板,每组模板包括多个模板;

利用DTW算法分别计算输入图像的特征向量与第一组模板的多个模板之间的最小累计距离;

(a)判断计算出的最小累计距离与拒绝阈值的关系;

(a1)若所有的距离都大于拒绝阈值,则输出该输入图像不在模板范围内;

(a2)若只有一个距离小于拒绝阈值,则计算输入图像的特征向量与后面多组模板中的对应模板的最小累计距离,并判断计算出的所有距离是否都小于拒绝阈值,若是,则输出对应的模板;若否,输出该输入图像不在模板范围内;

(a3)若有两个或两个以上的距离小于拒绝阈值,则获取其中的最小值,计算该最小值与其他距离的差值,判断是否所有的差值均大于差别阈值;

若是,则输出最小值对应的模板;

若否,则计算输入图像的特征向量与下一组模板中的对应模板之间的最小累计距离,返回步骤(a),直至输出结果。

2.根据权利要求1所述的模板匹配方法,其特征在于:预设模板组数为3~5组。

3.一种模板匹配装置,其特征在于:所述匹配装置包括:预设单元,用于预设多组模板,每组模板包括多个模板;

最小累计距离计算单元,利用DTW算法分别计算输入图像的特征向量与第一组模板的多个模板之间的最小累计距离;

判断输出单元,用于判断计算出的最小累计距离与拒绝阈值的关系;

在所有的距离都大于拒绝阈值时,输出该输入图像不在模板范围内;

在只有一个距离小于拒绝阈值时,计算输入图像的特征向量与后面多组模板中的对应模板的最小累计距离,判断计算出的所有距离是否都小于拒绝阈值,若是,则输出对应的模板;若否,输出该输入图像不在模板范围内;

在两个或两个以上的距离小于拒绝阈值时,获取其中的最小值,计算该最小值与其他距离的差值;判断是否所有的差值均大于差别阈值,若是,则输出最小值对应的模板;若否,则计算输入图像的特征向量与下一组模板中的对应模板之间的最小累计距离。

4.一种基于权利要求1所述的模板匹配方法的手势识别方法,其特征在于:所述方法包括:输入图像预处理;

输入图像特征向量提取;

采用所述的模板匹配方法对输入图像的特征向量进行模板匹配。

5.根据权利要求4所述的手势识别方法,其特征在于:在所述模板匹配方法中,预设模板组数为3~5组。

6.一种基于权利要求3所述的模板匹配装置的手势识别装置,其特征在于:所述手势识别装置包括:预处理单元,用于对输入图像进行预处理;

特征向量提取单元,用于对输入图像进行特征向量提取;

所述的模板匹配装置,用于对输入图像的特征向量进行模板匹配。

说明书 :

一种模板匹配方法和装置以及手势识别方法和装置

技术领域

[0001] 本发明属于模板匹配技术领域,具体地说,是涉及一种模板匹配方法和装置,以及手势识别方法和装置。

背景技术

[0002] DTW算法是一种模板匹配算法,是把时间规整和距离测度计算结合起来的一种非线性规整技术,能够对全局或局部扩展、压缩或者变形的模板完成匹配的过程。它采用满足一定条件的时间规整函数通过计算输入数据与一组参考模板之间的最小累积距离(以下简称距离)来描述输入数据和参考模板的相似程度。传统的DTW算法,只选取一组模板对输入图像进行匹配,虽然简单,但是匹配精度不高,在手势识别过程中误判的几率相对较大。

发明内容

[0003] 本发明提供了一种模板匹配方法,提高了匹配精度。
[0004] 为解决上述技术问题,本发明采用下述技术方案予以实现:
[0005] 一种模板匹配方法,所述匹配方法包括:
[0006] 预设多组模板,每组模板包括多个模板;
[0007] 利用DTW算法分别计算输入图像的特征向量与第一组模板的多个模板之间的最小累计距离;
[0008] (a)判断计算出的最小累计距离与拒绝阈值的关系;
[0009] (a1)若所有的距离都大于拒绝阈值,则输出该输入图像不在模板范围内;
[0010] (a2)若只有一个距离小于拒绝阈值,则计算输入图像的特征向量与后面多组模板中的对应模板的最小累计距离,并判断计算出的所有距离是否都小于拒绝阈值,若是,则输出对应的模板;若否,输出该输入图像不在模板范围内;
[0011] (a3)若有两个或两个以上的距离小于拒绝阈值,则获取其中的最小值,计算该最小值与其他距离的差值,判断是否所有的差值均大于差别阈值;
[0012] 若是,则输出最小值对应的模板;
[0013] 若否,则计算输入图像的特征向量与下一组模板中的对应模板之间的最小累计距离,返回步骤(a),直至输出结果。
[0014] 更进一步的,预设模板组数为3~5组。
[0015] 一种模板匹配装置,包括:预设单元,用于预设多组模板,每组模板包括多个模板;最小累计距离计算单元,利用DTW算法分别计算输入图像的特征向量与第一组模板的多个模板之间的最小累计距离;判断输出单元,用于判断计算出的最小累计距离与拒绝阈值的关系;在所有的距离都大于拒绝阈值时,输出该输入图像不在模板范围内;在只有一个距离小于拒绝阈值时,计算输入图像的特征向量与后面多组模板中的对应模板的最小累计距离,判断计算出的所有距离是否都小于拒绝阈值,若是,则输出对应的模板;若否,输出该输入图像不在模板范围内;在两个或两个以上的距离小于拒绝阈值时,获取其中的最小值,计算该最小值与其他距离的差值;判断是否所有的差值均大于差别阈值,若是,则输出最小值对应的模板;若否,则计算输入图像的特征向量与下一组模板中的对应模板之间的最小累计距离。
[0016] 一种手势识别方法,所述方法包括:
[0017] 输入图像预处理;
[0018] 输入图像特征向量提取;
[0019] 采用所述的模板匹配方法对输入图像的特征向量进行模板匹配。
[0020] 更进一步的,在所述模板匹配方法中,预设模板组数为3~5组。
[0021] 一种手势识别装置,包括:预处理单元,用于对输入图像进行预处理;特征向量提取单元,用于对输入图像进行特征向量提取;模板匹配装置,用于对输入图像的特征向量进行模板匹配。
[0022] 与现有技术相比,本发明的优点和积极效果是:本发明的模板匹配方法和装置以及手势识别方法和装置,通过采用预设的多组模板、拒绝阈值、差别阈值对输入图像进行匹配,解决了现有技术中匹配精度低、误判率高的问题,提高了模板匹配的精度和准确度,提高了手势识别的准确度,降低了手势识别的误判率。
[0023] 结合附图阅读本发明的具体实施方式后,本发明的其他特点和优点将变得更加清楚。

附图说明

[0024] 图1是本发明提出的模板匹配方法的一个实施例的流程图;
[0025] 图2是本发明提出的模板匹配装置的一个实施例的结构示意图;
[0026] 图3是本发明提出的手势识别方法的一个实施例的流程图;
[0027] 图4是本发明提出的手势识别装置的一个实施例的结构示意图。

具体实施方式

[0028] 为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合附图和实施例,对本发明作进一步详细说明。
[0029] 本实施例的模板匹配方法和装置以及手势识别方法和装置,通过采用预设的多组模板,并设置拒绝阈值和差别阈值,提高了匹配算法的识别精度,提高匹配结果准确度,降低了误判率。下面,通过具体实施例,对模板匹配方法和装置以及手势识别方法和装置进行详细说明。
[0030] 本实施例的模板匹配方法,具体包括下述步骤,参见图1所示。
[0031] 步骤S1:预设多组模板,每组模板包括多个模板。
[0032] 由于用户在不同时刻做相同手势时,手势角度可能会发生变化,因此需要预设多组模板。
[0033] 例如,预设3组模板,每组模板包括3个模板(即3个手势)。第一组模板的3个模板为A1、B1、C1,第二组模板的3个模板为A2、B2、C2,第三组模板的3个模板为A3、B3、C3。
[0034] A1、A2、A3均代表“拳头”,但是“拳头”的角度可能不同;B1、B2、B3均代表“布”,但“布”的角度可能不同;C1、C2、C3均代表“剪刀”,但“剪刀”的角度可能不同。
[0035] 不同组模板中的相同模板(手势)为对应模板,如A1、A2、A3为对应模板,B1、B2、B3为对应模板,C1、C2、C3为对应模板。
[0036] 步骤S2:利用DTW算法分别计算输入图像的特征向量与第一组模板的多个模板之间的最小累计距离。
[0037] 步骤S3:判断计算出的最小累计距离与拒绝阈值m的关系。
[0038] 若计算出的所有的最小累计距离中,有两个或两个以上小于拒绝阈值,则执行步骤S4。
[0039] 若计算出的所有的最小累计距离中,只有一个小于拒绝阈值,则执行步骤S10。
[0040] 若计算出的所有的最小累计距离都大于拒绝阈值,则认为输入图像与该模板不匹配,则执行步骤S15。
[0041] 在本实施例中,拒绝阈值m的取值范围可根据实际情况进行选取。通过设置拒绝阈值,既能快速滤除不匹配的模板,又能保证匹配精度。
[0042] 步骤S4:获取所有的最小累计距离中的最小值。
[0043] 步骤S5:判断该组模板是否为最后一组模板。
[0044] 若是,则该最小值对应的模板为输出模板,执行步骤S8;
[0045] 若否,则执行步骤S6。
[0046] 步骤S6:计算该最小值与其他最小累计距离的差值。
[0047] 步骤S7:判断是否所有的差值均大于差别阈值e。
[0048] 若是,则执行步骤S8。
[0049] 若否,则执行步骤S9。
[0050] 在本实施例中,差别阈值e的取值范围可根据实际情况进行选取。通过设置差别阈值,既能避免匹配时间长、速度慢,又能保证匹配精度。
[0051] 步骤S8:输出对应的模板,退出。
[0052] 步骤S9:计算输入图像的特征向量与下一组模板中的对应模板之间的最小累计距离,返回步骤S3,直至输出结果。
[0053] 步骤S10:判断该组模板是否为最后一组模板。
[0054] 若是,则小于拒绝阈值的最小累计距离对应的模板为输出模板,执行步骤S13。
[0055] 若否,则执行步骤S11。
[0056] 步骤S11:计算输入图像的特征向量与后面多组模板中的对应模板的最小累计距离。
[0057] 后面多组模板是指,没有计算过与输入图像特征向量的最小累计距离的多组模板。
[0058] 步骤S12:判断S11计算出的所有最小累计距离是否都小于拒绝阈值m。
[0059] 若是,则认为输入图像与该模板匹配,执行步骤S13。
[0060] 若否,则认为输入图像与该模板不匹配,则执行步骤S14。
[0061] 步骤S13:输出对应的模板,退出。
[0062] 步骤S14:输出该输入图像不在模板范围内,退出。
[0063] 步骤S15:输出该输入图像不在模板范围内,退出。
[0064] 本实施例的模板匹配方法,通过采用预设的多组模板、拒绝阈值、差别阈值对输入图像进行匹配,解决了现有技术中匹配精度低、误判率高的问题,使得模板匹配的精度进一步得到了提高,提高了模板匹配准确度,提高了手势识别的准确度,降低了手势识别中对手势的误判率;且方法简单、易于实现。
[0065] 在本实施例中,预设模板的组数为3~5组,既保证了具有足够多的模板对输入图像进行匹配,保证匹配精度,又避免模板组数过多影响匹配速度。
[0066] 下面,以预设3组模板进行具体说明。例如,预设3组模板,每组模板包括3个模板(即3个手势)。即第一组模板的3个模板为A1、B1、C1,第二组模板的3个模板为A2、B2、C2,第三组模板的3个模板为A3、B3、C3。其中,A1、A2、A3代表“拳头”,B1、B2、B3代表“布”,C1、C2、C3代表“剪刀”。
[0067] (21)利用DTW算法分别计算输入图像的特征向量(假设是E)与第一组模板之间的最小累计距离,分别记为
[0068] (22)判断计算出的所有最小累计距离与拒绝阈值m的关系。
[0069] a1、若所有最小累计距离 都大于拒绝阈值m,则输出该输入图像不在模板范围内,退出。
[0070] a2、若所有最小累计距离中,只有一个(假设是 )小于拒绝阈值,则继续计算输入图像的特征向量E与后两组模板中对应的模板(A2、A3)的最小累计距离 和
若 和 都小于拒绝阈值m,则认为输入图像与该模板匹配,输出对应的模板(A1、A2、或A3),退出;否则,输出该输入图像不在模板范围内,退出。
[0071] a3、若所有最小累计距离中,有两个或者两个以上小于拒绝阈值,假设都小于m,则获取所有最小累计距离中的最小值(例如最小值是 ),计算该最
小值与其他最小累计距离的差值,计算公式为 判断所
有的差值是否都大于差别阈值e,若是,则输出对应的模板(A1、A2、或A3);若否,即在所有差值中存在小于e的情况(例如 ),则计算输入图像的特征向量与下一组模板中的对应
模板(A2,C2)的最小累计距离 和 循环(22),具体步骤为:
[0072] 判断 与拒绝阈值m的关系。
[0073] b1、若 和 都大于m,则输出该图像不在模板范围内,退出。
[0074] b2、若只有一个小于m,假设是 则计算特征向量E与下一组模板中对应的模板(A3)的最小累计距离 若 小于m,则输出对应的模板(A1、A2、或A3),退出;否则,输出该图像不在模板范围内,退出。
[0075] b3、若 和 都小于m,获取两者中的最小值(假设是 ),计算该最小值与的差值, 若该差值大于差别阈值e,则输出对应的模板(A1、A2、或
A3);若该差值小于差别阈值e,则计算输入图像的特征向量与下一组模板中的对应模板(A3,C3)的最小累计距离 和 继续循环(22),具体步骤为:
[0076] 判断 和 与拒绝阈值m的关系。
[0077] c1、若 和 都大于m,则输出该图像不在模板范围内,退出。
[0078] c2、若只有一个小于m,假设是 由于该组模板为最后一组模板,则直接输出对应的模板(A1、A2、或A3),退出。
[0079] c3、若 和 都小于m,获取两者中的最小值(假设是 ),由于该组模板为最后一组模板,则直接输出对应的模板(A1、A2、或A3),退出。
[0080] 至此,得出了输出结果,输出对应的模板或输出该图像不在模板范围内。
[0081] 基于上述模板匹配方法的设计,本实施例还提出了一种模板匹配装置,所述模板匹配装置主要包括预设单元、最小累计距离计算单元、判断输出单元,参见图2所示。
[0082] 预设单元,用于预设多组模板,每组模板包括多个模板。
[0083] 最小累计距离计算单元,利用DTW算法分别计算输入图像的特征向量与第一组模板的多个模板之间的最小累计距离。
[0084] 判断输出单元,用于判断计算出的最小累计距离与拒绝阈值的关系;在所有的距离都大于拒绝阈值时,输出该输入图像不在模板范围内;在只有一个距离小于拒绝阈值时,计算输入图像的特征向量与后面多组模板中的对应模板的最小累计距离,判断计算出的所有距离是否都小于拒绝阈值,若是,则输出对应的模板;若否,输出该输入图像不在模板范围内;在两个或两个以上的距离小于拒绝阈值时,获取其中的最小值,计算该最小值与其他距离的差值;判断是否所有的差值均大于差别阈值,若是,则输出最小值对应的模板;若否,则计算输入图像的特征向量与下一组模板中的对应模板之间的最小累计距离。
[0085] 具体的模板匹配装置的工作过程,已经在上述模板匹配方法中详述,此处不予赘述。
[0086] 本实施例的模板匹配装置,通过采用预设的多组模板、拒绝阈值、差别阈值对输入图像进行匹配,解决了现有技术中匹配精度低、误判率高的问题,使得模板匹配的精度进一步得到了提高,提高了模板匹配准确度,提高了手势识别的准确度,降低了手势识别中对手势的误判率。
[0087] 基于上述模板匹配方法的设计,本实施例还提出了一种手势识别方法,具体包括下述步骤,参见图3所示。
[0088] 步骤S31:输入图像预处理。
[0089] 步骤S32:输入图像特征向量提取。
[0090] 步骤S33:采用上述的模板匹配方法对输入图像的特征向量进行模板匹配。
[0091] 在模板匹配方法中,预设模板的组数为3~5组。
[0092] 基于上述手势识别方法的设计,本实施例还提出了一种手势识别装置,所述手势识别装置主要包括预处理单元、特征向量提取单元、模板匹配装置,参见图4所示。
[0093] 预处理单元用于对输入图像进行预处理;特征向量提取单元用于对输入图像进行特征向量提取;模板匹配装置用于对输入图像的特征向量进行模板匹配。所述模板匹配装置主要包括预设单元、最小累计距离计算单元、判断输出单元,参见图2所示,具体可参见上述说明,此处不再赘述。
[0094] 本实施例的手势识别方法及装置,采用上述的模板匹配方法对输入图像的特征向量进行模板匹配,在模板匹配方法中,通过预设多组模板,并设置拒绝阈值和差别阈值,提高了模板匹配的精度和准确度,从而提高了手势识别的准确度,降低了手势识别的误判率。
[0095] 以上实施例仅用以说明本发明的技术方案,而非对其进行限制;尽管参照前述实施例对本发明进行了详细的说明,对于本领域的普通技术人员来说,依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明所要求保护的技术方案的精神和范围。