基于SURF高效匹配核的人体检测方法转让专利

申请号 : CN201210196526.2

文献号 : CN102810159B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 韩红王瑞谢福强李晓君顾建银张红蕾韩启强刘三军郭玉言甘露

申请人 : 西安电子科技大学

摘要 :

本发明提出了一种基于SURF高效匹配核人体检测方法,主要解决现有方法不能较好处理图像背景混杂的问题。其实现过程是:在INRIN数据库中通过自举获得负样本,与数据库中正样本一起构成整个人体的训练样本集;对训练样本在不同图像尺度下提取SURF描述子特征点;随机采样提取特征点构成视觉词汇的初始向量基;对初始向量基使用带约束的奇异值分解获得最大核函数特征;对不同图像尺度下的最大核函数特征进行加权获得所有图像尺度下的特征;对得到的特征利用SVM分类器进行分类训练,得到检测分类器;将待检测图像输入到分类器中得到最终的检测结果。本发明能够准确检测人体,可用于智能监控、驾驶员辅助系统和虚拟视频。

权利要求 :

1.一种基于SURF高效匹配核的人体检测方法,包括如下步骤:(1)从法国国家信息与自动化研究所INRIA数据库中通过自举操作获取负样本,并与数据库中其它的正样本一起构成整个人体训练样本集;

(2)将每幅训练样本图像分割为8×8像素格子,每个格子分别按16和25像素大小的图像尺度采样,提取所有训练图像的SURF Speed Up Robust Feature描述子特征点F;

(3)通过对所有训练图像的SURF描述子特征点F进行随机采样,获得整个训练样本

350维的视觉词汇,用获得的350维视觉词汇构成初始基向量R;

(4)将初始基向量R,利用带约束的核奇异值分解CKSVD进行字典学习,得到最大核函数特征r;

(5)通过最大化特征值提取法,抑制相似的最大核函数特征r,并按降序提取核函数特征值,删除最大值一样的元素,得到特征向量G,对每个不同图像尺度的图像特征G进行加权求和,得到所有图像尺度的特征G':G'=G×Al,

其中,Al为不同图像尺度的权重,l=[1,2], wl=1/pl,p是提取的SURF特征点的图像尺度的像素大小,p={16,25},pl是p中的第l个元素;

(6)储存所有图像尺度的特征G',选择G'中类似高斯分布的低维特征h,作为最终图像的SURF高效匹配核特征X;

(7)使用支持矢量机SVM分类器对所得到的SURF高效匹配核特征X进行分类训练,得到最终用于检测的分类器;

(8)输入待检测图像,利用已经得到的分类器确定最终的检测结果。

2.根据权利要求1所述的方法,其中步骤2)中所述的提取所有训练图像的SURF描述子特征点F,按如下步骤进行:

2a)将第j幅训练图像分割为8×8像素格子,每个格子分别按16和25像素大小的图像尺度采样,获得第j幅训练图像的SURF Speed Up Robust Feature特征点Fj;

2b)按照步骤2a)提取所有训练图像的SURF描述子特征点F,其中,F={F1...,Fj...,FM},j∈[1,M],M为训练样本数。

3.根据权利要求1所述的方法,其中步骤(3)中所述的获得整个训练样本350维的视觉词汇,按如下步骤进行:

3a)对每一幅训练样本图像,在8×8的图像格子上,按照16,25个像素大小尺度,分别随机抽样15个由步骤(2)得到的SURF特征点,记为Fi',i表示第i幅训练图像;

3b)重复步骤3a),提取所有的训练样本的SURF特征点,记为F',定义350个聚类中心,利用k-means聚类方法对F'中相似的SURF特征点进行聚类,获得整个训练样本350维的视觉词汇。

4.根据权利要求1所述方法,其中步骤(8)所述的输入待检测图像,利用已经得到的分类器确定最终的检测结果,按如下步骤进行:(8a)输入被检测的图像,将被检测图像左上角的一个大小为128×64像素的区域作为第一个扫描窗口,每向右平移8个像素或向下平移16个像素作为一个新的扫描窗口,由此得到一组扫描窗口,输入步骤(7)所得分类器,得到各个扫描窗口的分类器分数;

(8b)根据扫描窗口的分类器分数判断被测图像中是否包含人体,若分类器输出的扫描窗口含有人体,则从所有的含有人体的扫描窗口中,找出分类器分数最高的扫描窗口作为主窗口;

(8c)对主窗口与其他人体窗口进行组合判定,当其他人体窗口处于主窗口周围且重叠大于1/2时,将此窗口与主窗口组合,获得组合后的人体窗口;

(8d)保留组合后的人体窗口,删除主窗口及所有参与组合的人体窗口;

(8e)若还有剩余的人体窗口,则再找出其中分类器分数最高的人体窗口作为主窗口,并重复步骤(8b)-(8d);

(8f)在被测人体图像上标出所有检测结果,作为被测图像最终的人体检测结果,采用矩形框表示检测结果,将被检测出的人体处于矩形框内。

说明书 :

基于SURF高效匹配核的人体检测方法

技术领域

[0001] 本发明属于图像处理技术领域,涉及静态人体检测方法,可用于智能监控、驾驶员辅助系统、人体运动捕捉、色情图片过滤和虚拟视频。

背景技术

[0002] 在计算机视觉领域中人体检测是一门应用前景十分广阔的技术,人体检测在多个领域都有较好的应用前景,但是由于人体姿态的多样性,背景的混杂以及衣服纹理,光照条件,自身遮挡等多方面的因素导致人体检测成为一个非常困难的问题。目前,静态图像中人体检测的方法主要有基于运动特性的检测方法、基于人体模型的方法和基于统计分类的方法。
[0003] 基于运动特性的检测方法是利用人体稳定时的姿态变化以及人体的对称性呈周期变化这一特性,在时域里构造自相似矩阵,通过人体周期性的运动变化反映出不同与其他物质运动的性质,并利用这种分析方法把运动人体检测出来,但是该方法算法复杂度大,对人体运动稳定性要求较高。
[0004] 基于人体模型的方法,要有明确的人体模型,然后根据模型构造的各个部位与人体之间的关系进行人体识别。这种方法可以处理遮挡问题,并且可以推断出人体的姿态。但是这种方法的不足是模型的构建困难,求解复杂。
[0005] 基于统计分类的方法,通过机器学习从一系列训练数据中学习得到一个分类器,用该分类器来表示人体,然后利用该分类器对输入进行分类及识别。基于统计分类的方法的优点是检测结果稳定,效果较好,缺点是需要很多训练数据,并且很难解决光线不足和背景混杂的问题。其中基于SURF Speed Up Robust Feature高效匹配核的人体检测方法,其输入分类器的图像特征是一种基于局部的图像表征方法,能避免传统的背景复杂问题,可以得到更好的人体检测结果。

发明内容

[0006] 本发明目的是针对上述已有技术的不足,提出的一种基于SURF高效匹配核的人体检测方法,以降低图像特征提取的复杂度,提高特征的表征能力,有效的提高人体检测的正确率。
[0007] 本发明的技术方案通过如下步骤实现:
[0008] (1)从法国国家信息与自动化研究所INRIA数据库中通过自举操作获取负样本,并与数据库中其它的正样本一起构成整个人体训练样本集;
[0009] (2)将每幅训练样本图像分割为8×8像素格子,每个格子分别按16和25像素大小的图像尺度采样,提取所有训练图像的SURF描述子特征点F;
[0010] (3)通过对所有训练图像的SURF描述子特征点F进行随机采样,获得整个训练样本350维的视觉词汇,用获得的350维视觉词汇构成初始基向量R;
[0011] (4)将初始基向量R,利用带约束的核奇异值分解CKSVD进行字典学习,得到最大核函数特征r;
[0012] (5)通过最大化特征值提取抑制相似的最大核函数特征r,并按降序提取核函数特征值,删除最大值一样的元素,得到特征向量G,对每个不同图像尺度的图像特征G进行加权求和,得到所有图像尺度的特征G′:
[0013] G′=G×Al,
[0014] 其中,Al为不同图相尺度的权重,l=[1,2], wl=1/pl,p是提取的SURF特征点的图像尺度的像素大小,p={16,25};
[0015] (6)储存所有图像尺度的特征G′,选择G′中类似高斯分布的低维特征h,作为最终图像的SURF高效匹配核特征X;
[0016] (7)使用支持矢量机SVM分类器对所得到的SURF高效匹配核特征X进行分类训练,得到最终用于检测的分类器;
[0017] (8)输入待检测图像,利用已经得到的分类器确定最终的检测结果。
[0018] 本发明与现有的技术相比具有以下优点:
[0019] 1、本发明中由于使用的SURF高效匹配核的图像特征能避免传统的基于边缘的和基于轮廓的图像表示方法产生的表示模糊,可以得到更好的人体检测结果。
[0020] 2、本发明由于提取的图像特征信息较传统的图像描述方法维度低,能有效缩减提取特征时间和数据计算量。
[0021] 3、本发明由于是基于局部视觉特征信息的人体检测方法,在处理混杂背景图像时,可以取得较好结果。

附图说明

[0022] 图1是本发明的流程示意图;
[0023] 图2是本发明中使用的部分正样本图像;
[0024] 图3是本发明中使用的部分负样本图像;
[0025] 图4是用本发明与现有方法的检测性能比较图;
[0026] 图5是用本发明对人体图像检测的结果图。

具体实施方式

[0027] 参照图1,本发明的具体实施步骤如下:
[0028] 步骤一,从法国国家信息与自动化研究所INRIA数据库中,通过自举操作获取的大量的负样本图像,并与数据库中其它的正样本图像一起构成训练样本集,其中负样本图像如图2所示,正样本图像如图3所示。
[0029] 步骤二,提取训练样本集的SURF描述子特征点F。
[0030] 2a)将第j幅训练图像分割为8×8像素格子,每个格子分别按16和25像素大小的图像尺度采样,获得第i幅训练图像的SURF Speed Up Robust Feature描述子特征点Fj;
[0031] 2b)按 照步 骤2a)提 取 所有 训 练图 像 的SURF描 述 子特 征 点F,其中,F={F1...,Fj...,FN},j∈[1,M],M为训练样本数。
[0032] 步骤三,获得视觉词汇的初始基向量R。
[0033] 3a)对每一幅训练样本图像,在8×8的图像格子上,按照16,25个像素大小尺度,分别随机抽样15个由步骤(2)得到的SURF特征点,记为 i表示第i幅训练图像;
[0034] 3b)重复步骤3a),随机提取所有的训练样本的SURF特征点,记为F′;利用k-means聚类方法对F′中相似的SURF特征点进行聚类,定义350个聚类中心,获得整个训练图像350维的视觉词汇,构成视觉词汇的初始基向量R。
[0035] 步骤四,获得初始基向量R的最大核函数特征向量r。
[0036] 4a)将初始基向量R使用投影系数v,投影到一个350维的空间上,获得R的投影R′:
[0037] R′=Rv,
[0038] v=[v1,...vi...,vN]T -1 T
[0039] vi=(RR) (Rri),i∈[1,N],
[0040] 其中,ri是一幅图像中提取的第i个特征点的最大核特征,vi是一幅图像中提取的第i个特征点的低维投影系数,N是一幅图像中随机选取的特征点的数量;
[0041] 4b)在投影空间上将最大核函数特征向量r逼近初始基向量R的投影R′,获得逼近函数f(r):
[0042] f(r)=arg min‖r-R′‖,
[0043] 将R′=Rv代入上式,得:
[0044] f(r)=arg min‖r-Rv‖,
[0045] 其中,‖·‖表示2范数,arg min‖·‖表示求最小值;
[0046] 4c)将f(r)=arg min‖r-Rv‖中的v和r展开,得到最大核函数特征向量r对初始基向量R的2次逼近函数f(v,r):
[0047]
[0048] 其中,r=[r1,...ri...,rN],表示最大核函数特征向量;
[0049] 4d)使用随机梯度下降法求解逼近函数f(v,r),得到最大核函数特征向量r。
[0050] 步骤五,按降序排列最大核函数特征向量r中的元素,删除最大核函数特征向量r中最大值一样的元素,得到特征向量G,对每个不同图像尺度下的特征向量G进行加权求和,得到所有图像尺度上的图像特征G′:
[0051] G′=G×Al,
[0052] 其中,Al为不同图相尺度的权重,l=[1,2], wl=1/pl,p是提取SURF描述子特征点的图像尺度的像素大小,p={16,25}。
[0053] 步骤六,储存所有图像尺度下的图像特征G′,选择图像特征G′中类似高斯分布的低维特征h,作为最终图像的SURF高效匹配核特征X。
[0054] 步骤七,使用支持矢量机SVM分类方法对已经得到的SURF高效匹配核特征X进行分类学习,得到最终用于人体检测的分类器。
[0055] 步骤八,使用已经得到的用于人体检测的分类器,确定最终的检测结果。
[0056] (8a)输入待检测的图像,将待检测图像左上角的一个大小为128×64像素的区域作为第一个扫描窗口,每向右平移8个像素或向下平移16个像素作为一个新的扫描窗口,由此得到一组扫描窗口,输入步骤(7)所得分类器,得到各个扫描窗口的分类器分数;
[0057] (8b)根据扫描窗口的分类器分数判断被测图像中是否包含人体,若分类器输出的扫描窗口含有人体,则从所有的含有人体的扫描窗口中,找出分类器分数最高的扫描窗口作为主窗口;
[0058] (8c)对主窗口与其他人体窗口进行组合判定,当其他人体窗口处于主窗口周围且重叠大于1/2时,将此窗口与主窗口组合,获得组合后的人体窗口;
[0059] (8d)保留组合后的人体窗口,删除主窗口及所有参与组合的人体窗口;
[0060] (8e)若还有剩余的人体窗口,则再找出其中分类器分数最高的人体窗口作为主窗口,并重复步骤(8b)-(8d);
[0061] (8f)在被测人体图像上标出所有检测结果,作为被测图像最终的人体检测结果,采用矩形框表示检测结果,被检测出的人体处于矩形框内。
[0062] 本发明的效果可以通过以下仿真实验得到验证:
[0063] 1)仿真实验条件设置:本发明的仿真实验在Matlab 2009a上编译完成,执行环境为Windows框架下的HP工作站。实验所需的正样本和负样本均取自于法国国家信息与自动化研究所INRIA数据库。使用2416个正样本与13500个负样本作为训练集,1132个正样本与4050个负样本作为测试集,正样本与负样本图像的大小均为128×64像素,图2给出了其中部分正样本图像,图3为部分负样本图像。
[0064] 2)仿真内容及结果分析
[0065] 仿真一:分别使用本发明与现有方法对图像特征进行分类,分类性能如图4所示。图4中,上面的曲线为本发明的分类性能曲线,下面的曲线为现有方法的分类性能曲线,从图4可以看出,本发明的分类性能高于现有方法的分类性能。
[0066] 仿真二:分别使用本发明方法和现有方法对同一幅来自麻省理工MIT数据库的图像进行人体检测,检测结果如图5所示。其中,图5(a)是使用现有方法进行人体检测,进行窗口融合前的实验结果,图5(b)为现有方法的最终检测结果,图5(c)表示采用本方法进行人体检测,进行窗口融合前的实验结果,图5(d)为本方法的最终检测结果。从图5可以看出本发明的方法具有更高的人体检测正确率。
[0067] 综上,本发明在降低图像特征提取的复杂度的同时,提高了特征的表达能力,从而使本方法非常适合于静态图像的人体检测,同时与现有方法相比,本方法能极大的降低了人体检测的虚景率。