基于在线学习支持向量机性别分类的方法转让专利

申请号 : CN201210373327.4

文献号 : CN103514454B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周龙沙邵诗强

申请人 : TCL集团股份有限公司

摘要 :

一种基于在线学习支持向量机性别分类的方法,利用支持向量机算法寻找到原始样本集中的性别样本的最优的分类面;获取测试目标的人脸特征,根据最优分类面对当前人脸特征进行估计并给出其所属性别的结果;计算人脸特征偏离最优分类面的偏离值,将该偏离值大于预设的阈值的人脸特征和对该人脸特征得到的性别分类结果加入到原始样本集形成新的原始样本集并重新计算新的最优分类面,对测试目标的人脸特征进行性别分类估计直到结束。本发明利用在线获取的人脸特征样本对原始样本集进行增量扩充,通过定量更新原始样本集,形成新的支持向量机参数和支持向量,提高了原始样本的鲁棒性,新的样本集提高了对外界环境的泛化能力,能够有更好的性别识别能力。

权利要求 :

1.一种基于在线学习支持向量机性别分类的方法,其特征在于,包括如下步骤:

A、将基于性别的人脸特征作为性别样本存储至原始样本集;

B、利用支持向量机算法对原始样本集中的性别样本进行学习和分类,寻找到最优的分类面,并得到原始样本集的支持向量;

C、获取测试目标的人脸并相应提取人脸特征,根据原始样本集的最优分类面对该人脸特征进行估计,同时利用支持向量机算法对该人脸特征进行性别分类;再计算测试目标的人脸特征偏离所述最优分类面的偏离值,并将该偏离值与预设的阈值进行比较,若所述偏离值大于预设的阈值,则将该人脸特征和对该人脸特征得到的性别分类结果作为性别样本加入到原始样本集构成新的样本集,并采用支持向量机算法计算新的样本集的最优分类面,以及得到新的样本集的支持向量;否则进入下一测试目标的人脸特征识别;

所述计算测试目标的人脸特征偏离所述最优分类面的偏离值的公式为:

,其中 表示测试目标的人脸特征; 表示样本中

取对应的i(i=1…n)所得到对应的最优lagrange系数、样本标签和样本特征向量;值为寻找到最优分类面的数值;

所述预设的阈值的取值范围为: ~ ,其中 为最优分类面的

距离;β 的取值范围为0.5~2。

2.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤A中基于性别的人脸特征包括人脸特征及其性别特征标签。

3.根据权利要求2所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述基于性别的人脸特征中的人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现人脸特征的表达。

4.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤B中寻找最优分类面中对于所形成的低维特征空间是采用RBF函数将低维特征空间映射到相应的高维特征空间实现的。

5.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤C获取测试目标的人脸并相应提取人脸特征中提取人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现。

6.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤C还进一步包括,当测试目标的数量等于原始样本集中样本的数量二分之一时,则将偏离值大于预设阈值的测试目标的人脸特征和对该人脸特征得到的性别分类结果加入到原始样本集更新为新的原始样本集以扩充原始样本集的样本数量,再根据该更新后的新的原始样本集进行下一测试目标的性别分类。

说明书 :

基于在线学习支持向量机性别分类的方法

技术领域

[0001] 本发明涉及智能信息处理技术,尤其涉及基于向量机方法的性别分类的方法,特别是一种基于在线学习支持向量机性别分类的方法。

背景技术

[0002] 现有技术性别识别分类过程中都是基于统计学原理的统计方法进行的。在统计学习过程中都是利用静态学习方法来实现的,也就是通过已经给定的样本进行学习,然后利用学习到的给定样本对未知环境中的情况进行估计和分析,进而得出分析结果。由于性别学习过程中存在大量的样本,人姿态的变化会造成样本本身的多样性和可变性,使得对样本的学习造成一定的困难,或者说难于用一个规定法则来描述所学习到的性别特征,所以,人们将性别学习确定在一定量的样本中进行,针对一定量的小样本学习,支持向量机(support vector machine,SVM)是目前最有效的方法。现有技术基于SVM方法进行性别识别是根据给定的定量静态性别人脸进行学习,针对定量样本的最优分类参数在实际环境中应用。然而,由于环境的未知性和人脸本身特征、姿态的变化使得这些最优参数在应用过程中难免会出现错误或者无法分类的情况,使性别分类器的泛化性受到影响,在实际环境中的鲁棒性不高。
[0003] 因此,现有技术还有待于改进和发展。

发明内容

[0004] 鉴于上述现有技术的不足之处,本发明为解决现有技术的缺陷和不足,提出一种基于在线学习支持向量机性别分类的方法及系统,能够很好的对外界环境中具有一定变化的性别样本进行选择性学习。
[0005] 本发明解决技术问题所采用的技术方案如下:
[0006] 一种基于在线学习支持向量机性别分类的方法,包括如下步骤:
[0007] A、将基于性别的人脸特征作为性别样本存储至原始样本集;
[0008] B、利用支持向量机算法对原始样本集中的性别样本进行学习和分类,寻找到最优的分类面,并得到原始样本集的支持向量;
[0009] C、获取测试目标的人脸并相应提取人脸特征,根据原始样本集的最优分类面对该人脸特征进行估计,同时利用支持向量机算法对该人脸特征进行性别分类;再计算测试目标的人脸特征偏离所述最优分类面的偏离值,并将该偏离值与预设的阈值进行比较,若所述偏离值大于预设的阈值,则将该人脸特征和对该人脸特征得到的性别分类结果作为性别样本加入到原始样本集构成新的样本集,并采用支持向量机算法计算新的样本集的最优分类面,以及得到新的样本集的支持向量;否则进入下一测试目标的人脸特征识别。
[0010] 所述步骤A中基于性别的人脸特征包括人脸特征及其性别特征标签。
[0011] 所述基于性别的人脸特征中的人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现人脸特征的表达。
[0012] 所述步骤B中寻找最优分类面中对于所形成的低维特征空间是采用RBF函数将低维特征空间映射到相应的高维特征空间实现的。
[0013] 所述步骤C获取测试目标的人脸并相应提取人脸特征中提取人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现。
[0014] 所述步骤C还进一步包括,当测试目标的数量等于原始样本集中样本的数量二分之一时,则将偏离值大于预设阈值的测试目标的人脸特征和对该人脸特征得到的性别分类结果加入到原始样本集更新为新的原始样本集以扩充原始样本集的样本数量,再根据该更新后的新的原始样本集进行下一测试目标的性别分类。
[0015] 与现有技术相比较,本发明采用在线学习的方法将现有技术性别识别分类的静态学习过程改为动态学习过程,利用在线实时获取的人脸特征样本对原始样本集进行增量扩充,在扩充的过程中采用最优参数来对在线实时获取的人脸特征样本进行学习和分类,扩充的新的样本集获取新的最优参数及支持向量,通过定量更新原始样本集,形成新的支持向量机参数和支持向量,扩充了原始样本的鲁棒性,新的样本集提高了对外界环境的泛化能力,能够有更好的性别识别能力。

附图说明

[0016] 图1是本发明基于在线学习支持向量机性别分类的方法处理流程图。

具体实施方式

[0017] 为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0018] 本发明方法应用的范围包括在数码产品、智能家庭数字平台以及移动终端中利用摄像设备对人脸进行识别过程中需要进行性别识别的应用场合。利用在线学习的手段将性别识别的静态学习方法改为动态学习,即在进行人脸的性别分类过程中对基于性别的人脸特征的原始样本集进行人脸特征的添加,利用增量的原始样本集来对后续的测试目标的人脸特征进行支持向量机训练,不断提高原始样本集中的样本数量,实现动态学习的功能。本发明中所说的测试目标是指进入产品视域范围的人脸,能够根据人脸进行性别识别。
[0019] 图1所示为本发明基于在线学习支持向量机性别分类的方法处理流程图,该处理流程图示出了在线学习的基本过程,其实现步骤如下:
[0020] 步骤S100,将基于性别的人脸特征作为性别样本存储至原始样本集;
[0021] 步骤S101,利用支持向量机算法对原始样本集中的性别样本进行学习和分类,寻找到最优的分类面,并得到原始样本集的支持向量;
[0022] 步骤S102,获取测试目标的人脸并相应提取人脸特征,根据原始样本集的最优分类面对该人脸特征进行估计,同时利用支持向量机算法对该人脸特征进行性别分类;
[0023] 步骤S103,计算测试目标的人脸特征偏离所述最优分类面的偏离值,并将该偏离值与预设的阈值进行比较;
[0024] 步骤S104,判断偏离值是否大于预设的阈值,如果大于,执行步骤S105,否则执行步骤S106;
[0025] 步骤S105,将该人脸特征作为性别样本加入到原始样本集构成新的样本集,并采用支持向量机算法计算新的样本集的最优分类面,以及得到新的样本集的支持向量;
[0026] 步骤S106,判断是否有下一测试目标,如有,返回执行步骤S102,否则执行步骤S107;
[0027] 步骤S107,结束。
[0028] 下面对以上步骤结合具体实现中采用的算法进行详细阐述本发明方法的实现过程。
[0029] 首先如步骤S100存储基于性别的人脸特征的性别样本至原始样本集中,获取原始样本集为 ,其中 为每个性别样本的特征表达,R表示x属于一个d维度的空间集合,说明x是一个d维度的向量。原始样本集获取的是基于性别的人脸特征,人脸特征的提取可以有多种不同的方法如:LBP(Local Binary Pattern,局部二值模式)、IDP(Interlaced Derivative Pattern,交错导数模式)、Gabor小波变换、PCA(Principal component analysis,主成分分析)降维、Fisher(费歇尔算法)等,为每个样本特征的性别标签值,用于区分男性和女性(+1表示男性,-1表示女性)。
[0030] 步骤S101中对原始样本集进行学习和分类是采用支持向量机SVM算法对这类带有标签的性别样本特征集,即对原始样本集Soriginal进行学习和分类,寻找到最优的分类面,即是寻找下面的式1中最优的 和 值,
[0031]               式1
[0032] 这里面 和 值为寻找到最优分类面的数值(属于现有技术方法,对该值进行计算的过程不赘述),为松弛变量,主要是为高维数据线性不可分使用的,通过这个松弛变量的引入,可以解决高维数据中少数不可分的离群点。对于低维空间,采用RBF核函数,把其对应到相应的高纬空间中,这样有利于在高维空间进行线性的可分性,同时,最优分类面的距离为: ,为此可建立Lagrange函数用于求解上述最优分类面距离的最小值(式2):
[0033]         式2
[0034] 要获取最优分类面可以表示成如下的约束优化问题,也就是在式1的约束下,求函数:
[0035]    式1-2
[0036] 的最小值。在数学中可以建立Lagrange函数来解决:
[0037]   式1-3
[0038] 其中 ,αi为Lagrange系数(采用Lagrange函数来求解极值问题是数学中求解有约束优化问题常采用的方法)。
[0039] 对w和b求取lagrange极小值,通过转化为简单的对偶问题,在约束条件(式3)下[0040]              式 3
[0041] 在式3的约束条件下求取下列式4函数的最大值:
[0042]         式4
[0043] 式4中参数 和参数 均表示样本中取对应的i、j(i=1…n;j=1…n)所得到对应的lagrange系数、样本标签和样本特征向量。
[0044] 用内积 代替各特征向量的点积 ,其中内积为径向基(RBF)内积函数(式5):
[0045]              式5
[0046] 则获取的最优分类面的权系数向量为(若得到 为最优解):
[0047]                       式6
[0048] 其中,步骤S102中提取人脸特征是采取如步骤S100中的LBP、IDP、Gabor小波变换、PCA降维、Fisher等算法实现;获取到测试目标的人脸特征后,使测试目标的人脸特征作为一个测试目标 进入上述分类器时,得到对应的最优分类函数为:
[0049]             式7
[0050] 步骤S103中测试目标偏离值的计算,即偏离最优分类面的值通过式7来计算,此处测试目标 表示测试目标的人脸特征,式7的最优分类函数刻画了 的偏离程度,即测试目标的人脸特征偏离最优分类面的偏离值。
[0051] 同时,步骤S104中的判断过程是通过设置预设的一定阈值(该阈值的取值范围: ~ ,其中β 根据经验值取值为0.5~2)来衡量一个测试量(即测试目标的人脸特征表达)的偏离程度,从而对该测试目标能否作为最后的样本进行学习进行取舍。SVM自身的算法和训练得到适应于当前测试目标样本Sample的最优参数值 (这里的表示的是选取的一组最优值,如:选用RBF核函数则对应最优值c(为支持向量机中指定的某常数,控制对错样本惩罚的对错作用)和g(为径向基内积函数中的参数 值)),同时也得到基于该样本条件下的支持向量SVM_sample_only_sv,即为步骤S101中所指的得到原始样本集的支持向量。
[0052] 具体而言,当需要对一个新的测试目标的人脸face1进行分类(指一个测试目标的人脸进入到产品视域范围内时获取了该人脸的图像,根据该人脸的图像进行分类处理),采用与步骤S100中人脸特征提取的方法对测试目标进行人脸特征的提取,利用已经形成的最优参数值(即上述最优分类面的数值)对当前样本(即人脸face1)进行估计,同时把该样本所属的类别结果给出,对于face1给予SVM算法得到的估计标签 (性别标签),对于测试集 (测试目标的人脸face1的人脸特征集合),带入式7中得到对应的偏离值 ,判断该偏离值是否大于指定的阈值( 根据实验的经验确定),若不大于指定阈值 ,则进入下一个人脸测试;若大于指定阈值 ,则并把该测试集 (包括测试目标的人脸特征集合及其性别标签)放入原始样本集中构成新的样本集合 ,同时对样本集合 同样采用SVM算法求取 中对应的最优参数 和支持向量SVM_1_only_sv。
[0053] 完成对face1的执行,如果还有后续的测试目标进来,则继续对后续测试目标做与face1进行的相同的计算工作,以进入的下一测试目标的第2幅人脸face2为例,对于测试人脸face2进入时,利用最优参数 ,同样调用SVM算法对该测试人脸进行分类,得到测试人脸face2的估计结果 ,同样判断 输出是否大于指定阈值 ,若不大于 进入下一个人脸测试;若大于 则把测试人脸face2加入到新的样本集 中,再得到新的样本集。同样对 用SVM算法获取到最优参数 和支持向量SVM_2_only_sv。
[0054] 根据测试目标依照上面的方法依次类推,直到第n个测试目标的人脸,对第n个测试目标的人脸进行类似上面的SVM计算得到估计标签 、计算 并与预设的阈值 做判断,当不大于阈值 ,进入下一步;若大于阈值 则再构成新的集合(其中 表示在前n-1次测试过程中每次计算得到的偏离值大于指定阈值 所构成的人脸测试集合)并利用SVM算法获取集合 下的最优参数 和支持向量SVM_n_only_sv。单个性别测试往往对SVM的泛化能力不是很好,通过定量的更新原始样本库,并形成一组新的SVM参数和支持向量,这样对外界的泛化能力会提高很多,所以这里把1至n个中满足大于指定阈值 的测试图像与原始样本 放在一起,得到新的样本集
,再次对样本
进行SVM计算得到最优参数 和支持向量SVM_S_new1_only_sv。
[0055] 利用上面步骤所获取的最优参数 对下一次的测试目标的人脸 进行分类估计。
[0056] 应当说明的是,作为一种优选的手段,当测试目标的数量等于原始样本集中样本的数量二分之一时,则将偏离值大于预设阈值的测试目标的人脸特征加入到原始样本集的新的样本集更新为新的原始样本集以扩充原始样本集的样本数量,再根据该更新后的新的原始样本集进行下一测试目标的性别分类。这提高了后续分类识别过程的鲁棒性,简言之,新生成的样本集对外界环境有更好的适应能力。
[0057] 应当理解的是,以上所述仅为本发明的较佳实施例而已,并不足以限制本发明的技术方案,对本领域普通技术人员来说,在本发明的精神和原则之内,可以根据上述说明加以增减、替换、变换或改进,而所有这些增减、替换、变换或改进后的技术方案,都应属于本发明所附权利要求的保护范围。