用于人脸识别的基于虚拟样本的核鉴别方法转让专利

申请号 : CN201110087710.9

文献号 : CN102142082B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 荆晓远姚永芳李升卞璐莎吕燕燕唐辉

申请人 : 南京邮电大学

摘要 :

本发明公开了一种用于人脸识别的基于虚拟样本的核鉴别方法,其为一种基于虚拟样本的快速核方法。该方法在对训练样本集进行核矩阵构造前,先对训练样本集一次性构造虚拟样本集,再以虚拟样本集为基础,通过核矩阵理论进行训练/测试;由于虚拟样本集为训练样本集的特征样本集(MES)和公共向量样本集(MCS)的集合,因此,虚拟样本集无论对于已知的训练样本集,还是对于未知的测试样本集来说,都具有极强的描述能力;将本发明所述的方法在FERET数据库上的实验验证了所提方法是快速有效的;其大幅地提高了核方法的计算速度,同时,与传统的核方法相比,本发明还提高了识别率。

权利要求 :

1.一种用于人脸识别的基于虚拟样本的核鉴别方法,其特征在于,包括以下步骤:(1)利用训练样本集X1构造虚拟样本集V——虚拟样本集V定义为已知类别属性的训练样本集X1的特征样本集 或该已知类别属性的训练样本集X1的公共向量样本集A,其表d达式为V={vk∈□ |k=1,...,l},特征样本集 的抽提通过对训练样本集X1采用主成分分析方法进行,公共向量样本集A的抽提则通过对训练样本集X1使用鉴别公共向量方法进行,其中:特征样本集 以及公共向量样本A分别满足下式:(2)利用虚拟样本集V计算训练样本集X1的核矩阵K1——将虚拟样本集V以及训练样Ф本集X1通过核映射函数投影到核空间,以获得由l个虚拟样本组成的投影虚拟样本集V 构Ф建的核矩阵K1,其中:V ={φ(vk)∈H|k=1,...,l};

Φ

(3)在核空间计算特征向量V ——根据核重构理论,利用步骤(2)所构建的核矩阵来φ线性表示核空间的特征向量w ,其中: 而

Ψ=[φ(v1),…,φ(vl)],β=(β1,β2,…,βl)T;

(4)将训练样本集X1投影到特征向量WФ上得到数据集Y1,

(5)利用步骤(1)中通过训练样本集X1所构建的虚拟样本集V,将虚拟样本集V以及待识别测试样本集X2通过核映射函数计算出待识别测试样本集X2的核矩阵K2;然后将待Ф识别测试样本集X2投影到特征向量W 上得到数据集Y2,

(6)通过最近邻分类器,根据步骤(4)获得的数据集Y1和步骤(5)获得的数据集Y2,输出识别结果;

d

步骤(1)至(6)中:□ 表示d维空间;l表示虚拟样本的个数;n表示训练样本的个数;μi表示对训练样本集X1做主成分分析后,第i个PCA主分量对应的特征值; 是挑选出的PCA主分量所对应的特征值; 表示使用鉴别公共向量DCV方法从训练样本集X1中抽取的第i类的公共向量;c表示训练样本集X1中的类别数;H表示核空间;φ表示核映射函数;φ(vk)是虚拟样本vk采用核映射函数φ投影到核空间H后的表示,即映射虚拟样本;Ψ是l个映射虚拟样本的集合;β是用映射虚拟样本来重构核空间中特征向量的重构系数。

2.根据权利要求1所述用于人脸识别的基于虚拟样本的核鉴别方法,其特征在于,所述步骤(2)和步骤(5)中所采用的核映射函数皆为高斯核映射函数;进行步骤(2)中训练样本集X1的核矩阵K1的构建时,核矩阵K1的第i行第j列上的元素K1(i,j)由训练样本集中的第i个训练样本和虚拟样本集中的第j个虚拟样本代入核映射函数中计算得到;进行步骤(5)中待识别测试样本集X2的核矩阵K2的构建时,核矩阵K2的第i行第j列上的元素K2(i,j)由待识别测试样本集中的第i个测试样本和虚拟样本集中的第j个虚拟样本代入核映射函数中计算得到。

3.根据权利要求2所述用于人脸识别的基于虚拟样本的核鉴别方法,其特征在于,重T构系数β由矩阵XX的最大若干个特征值所对应的特征向量构成,其中X=(I-W)K1,I是单位矩阵,W是所有元素都为 的方阵,n表示训练样本的个数;K1为训练样本X1采用虚拟样本V通过核映射函数计算出的核矩阵。

4.根据权利要求2所述用于人脸识别的基于虚拟样本的核鉴别方法,其特征在于,重构系数β由矩阵(XTX)-1YTY的非零特征值所对应的特征向量构成,其中X=(I-W)K1,Y=(L-P)K1,I是单位矩阵,W是所有元素都为 的方阵,n表示训练样本的个数;

式中:I=1,…,c;j=1,…,ni,ni表示训练

样本集中第i类的样本数;P=[P1 P2…Pc],Pi(i=1,…,c)是包含n个元素的列向量,其中每个元素的值都为

说明书 :

用于人脸识别的基于虚拟样本的核鉴别方法

技术领域

[0001] 本发明涉及一种核鉴别方法,其基于虚拟样本建立,用于人脸识别的特征提取,属于模式识别中的人脸识别领域。

背景技术

[0002] (1)研究背景:
[0003] 人脸识别包括图像预处理、特征提取和识别三个环节。其中特征抽取是模式识别研究中最基本问题之一。对图象识别而言,抽取有效的图象特征是完成图象识别的首要任务。基于核的特征抽取方法是当今很热门的一种有效的非线性特征提取方法。核方法的基本思想是利用一个非线性映射,把在输入空间R中线性不可分的样本映射至一个隐性特征空间中,使得样本在空间F上线性可分。在核方法中并不需要显式的计算映射,只需要通过一个核映射函数κ来计算在隐特征空间F中两两向量的内积即可。即使变化后空间的维数增加很多甚至于达到无穷维,问题的计算复杂度并没有增加多少,且与特征空间的维数无关。
[0004] (2)现有人脸识别中的核鉴别方法——核主成分分析方法(KPCA)和广义判别分析方法(GDA)。
[0005] KPCA的基本思想是通过非线性映射将非线性可分的原始样本输入空间变换到一个线性可分的高维特征空间F,然后在F空间中完成主成分分析。为避免维数灾难问题,引用核技术,即用满足Mercer条件的核映射函数来替换特征空间中样本的内积运算,它可以把在输入空间无法线性分类的数据变换到特征空间来实现线性分类。即求满足下式的V:
[0006]
[0007] 其中 为在高维特征空间中训练样本集的协方差矩阵,λ为V对应的非零特征值。
[0008] GDA在线性鉴别分析方法(LDA)方法的基础上将原始空间投影到一个非线性的高维空间F,使得不同类的特征向量投影过后的值越分开越好,即投影过后的平均值差越大越好;而同一类的特征向量,投影过后的值越集中越好,即投影后离散度越小越好。即在F空间中求得使得下式最大的
[0009]
[0010] 其中 和 为非线性空间的类间散度矩阵和类内散度矩阵,符号T表示矩阵转置。
[0011] 非线性加速核特征提取方法:Greedy方法、Nystrom方法、稀疏核特征分析方法(SKFA)及缩减集方法(RSS和RSC)等。
[0012] Greedy方法是通过最小化近似误差得到一组子投影样本Γr=[φ(r1),…,φ(rm)]来近似原始投影样本集Γ=[φ(x1),…,φ(xn)],其中m<n。近似误差表示如下:
[0013] se(x)=k(x,x)-2kr(x)Tβ+βTKrβ, (3)
[0014] 其中核矩阵 kr(x)=[k(x,r1),…,k(x,rm)],
[0015] Nystrom方法是一种被用于加速核机器学习的加速方法,它利用训练样本集的部分行向量和低阶重构近似理论对计算量较大的矩阵进行特征分解和降维。对于一个给定的核矩阵K,可得如下的特征值分解:
[0016]
[0017] 其中∑K为K的非零特征值,UK为所对应的特征向量。Nystrom挑选其中l(l<n)个行向量元素和其对应的列向量元素来重新表示核矩阵K,表示为
[0018]
[0019] 其中
[0020] 缩减集方法的主要思想是通过计算核空间中的稀疏系数最小化重构误差。其中计算稀疏系数时主要有两种方法:一种是挑选一组投影训练样本来计算,即缩减集挑选方法(RSS);还有一种是构建一组原图像来近似计算稀疏系数,即缩减集挑选构造方法(RSC)。
[0021] 缩减集方法旨在找到一组缩减了的向量集 来近似Ψ,获得的 需最小化重构误差,即满足下式:
[0022]
[0023] RSS方法计算一组稀疏系数βi最小化如下定义的误差:2
[0024] ρ(βi,n)=‖αnφ(xn)-∑j≠nβiφ(xj)|| (7)
[0025] 而RSC通过构造原图像来计算稀疏系数,每一步的对系数的迭代计算将影响到前面所计算出的稀疏系数值,因此稀疏系数不断更新。
[0026] (3)现有方法不足、改进点:
[0027] 核特征提取方法虽能把原始空间的线性不可分的问题转化为高维空间的线性可分的问题,但其投影向量是由所有训练样本线性展开的,如核主成分分析方法(KPCA)和广义判别分析方法(GDA),尤其在多类的情况下,需耗费大量的时间来计算庞大的核矩阵,从而使核方法的计算量变得很大。为了解决这一问题,一些核加速算法被提出,如Greedy方法、Nystrom方法、稀疏核特征分析方法(SKFA)及缩减集方法(RSS和RSC)等,但这些加速算法搜索投影向量展开元素十分耗时。为了减少展开元素,这些加速方法使用迭代算法从原始样本集中逐个选择展开元素,这是一个十分耗时的过程,尤其考虑每个核映射函数的计算量,计算量就更加巨大了。而且由于舍弃了部分样本信息,这些加速核方法的识别能力均有所下降。

发明内容

[0028] 本发明针对现有技术的不足,提供一种用于人脸识别的基于虚拟样本的核鉴别方法,其为一种基于虚拟样本的快速核方法。该方法在对训练样本集进行核矩阵构造前,先对训练样本集一次性构造虚拟样本集,再以虚拟样本集为基础,通过核矩阵理论进行训练/测试;由于虚拟样本集为训练样本集的特征样本(MES)和公共向量样本(MCS)的集合,因此,虚拟样本集无论对于已知的训练样本集,还是对于未知的测试样本集来说,都具有极强的描述能力;将本发明所述的方法在FERET数据库上的实验验证了所提方法是快速有效的;其大幅地提高了核方法的计算速度,同时,还提高了识别率。
[0029] 为实现以上的技术目的,本发明将采取以下的技术方案:
[0030] 一种用于人脸识别的基于虚拟样本的核鉴别方法,包括以下步骤:(1)利用训练样本集X1构造虚拟样本集V——虚拟样本集V定义为已知类别属性的训练样本集X1的特征样本集 或公共向量样本集A,其表达式为 特征样本集 的抽提通过对训练样本集X1采用主成分分析方法进行,公共向量样本集A的抽提则通过对训练样本集X1使用鉴别公共向量方法进行,其中:特征样本集 以及公共向量样本A分别满足下式:
(2)利用虚拟样本集V计算训练样本集X1的
核矩阵——将虚拟样本集V以及训练样本集X1通过核映射函数投影到核空间,以获得由l个虚拟样本组成的投影虚拟样本集VΦ构建的核矩阵,其中:VΦ={φ(vk)∈H|k=1,...,l};(3)在核空间计算特征向量WФ——根据核重构理论,利用步骤(2)所构建的核矩阵来φ
线性表示核空间的特征向量w ,其中: (4)将训练样本集X1投影到
Φ
特征向量W 上得到数据集Y1, (5)利用步骤(1)中通过训练样本集X1所构建的虚拟样本集V,将虚拟样本集V以及待识别测试样本集X2通过核映射函数计算出待识别测Ф
试样本集X2的核矩阵;然后将待识别测试样本集X2投影到特征向量W 上得到数据集Y2,(6)通过最近邻分类器,根据步骤(4)获得的数据集Y1和步骤(5)获得的数据集Y2,输出识别结果;步骤(1)至(6)中: 表示d维空间;l表示虚拟样本的个数;n表示训练样本的个数;μl表示对训练样本集X1做主成分分析后,第i个PCA主分量对应的特征值;是挑选出的PCA主分量所对应的特征值; 表示使用鉴别公共向量DCV方法从X1中抽取的第i类的公共向量;c表示X1中的类别数;H表示核空间;φ表示核映射函数;φ(vk)是虚拟样本vk采用核映射函数φ投影到核空间H后的表示,即映射虚拟样本;Ψ是l个映射虚拟样本的集合;β是用映射虚拟样本来重构核空间中特征向量的重构系数。
[0031] 进一步地,所述步骤(2)和步骤(5)中所采用的核映射函数皆为高斯核映射函数;进行步骤(2)训练样本集X1的核矩阵K1的构建时,核矩阵K1的第i行第j列上的元素K1(i,j)由训练样本集中的第i个训练样本和虚拟样本集中的第j个虚拟样本代入核映射函数中计算得到;进行步骤(5)中待识别测试样本集X2的核矩阵K2的构建时,核矩阵K2的第i行第j列上的元素K2(i,j)由待识别测试样本集中的第i个测试样本和虚拟样本集中的第j个虚拟样本代入核映射函数中计算得到。
[0032] 进一步地,重构系数β由矩阵XTX的最大若干个特征值所对应的特征向量构成,其中X=(I-W)K1,I是单位矩阵,W是所有元素都为 的方阵,n表示训练样本的个数;K1为训练样本X1采用虚拟样本V通过核映射函数计算出的核矩阵。
[0033] 进一步地,重构系数β由矩阵(XTX)-1YTY的非零特征值所对应的特征向量构成,其中X=(I-W)K1,Y=(L-P)K1,I是单位矩阵,W是所有元素都为 的方阵,n表示训练样本的个数; 式中:i=1,…,c;j=1,…,ni,ni表示训练样本集中第i类的样本数;P=[P1 P2…Pc],Pi(i=1,…,c)是包含n个元素的列向量,其中每个元素的值都为
[0034] 根据以上的技术方案,可以实现以下的有益效果:
[0035] 与传统的核方法相比,本发明在对训练样本集进行核矩阵构造前,先对训练样本集一次性构造虚拟样本集,再以虚拟样本集为基础,通过核矩阵理论进行训练/测试;由于虚拟样本集为训练样本集的特征样本(MES)和公共向量样本(MCS)的集合,因此,虚拟样本集无论对于已知的训练样本集,还是对于未知的测试样本集来说,都具有极强的描述能力;在FERET数据库上的实验验证了本发明所提方法是快速有效的,且在加速后识别率优于传统的一些核方法,这是其他加速方法所难以达到的。所提出的核鉴别框架还被应用在一些经典核鉴别方法上,均获得了快速有效的识别效果。

附图说明

[0036] 图1是本发明所提出的用于人脸识别的基于虚拟样本的核鉴别方法的流程示意图。

具体实施方式

[0037] 以下将结合附图详细地说明本发明的技术方案。
[0038] 如图1所示,本发明所述的用于人脸识别的基于虚拟样本的核鉴别方法,包括以下步骤:(1)利用训练样本集X1构造虚拟样本集V——虚拟样本集V定义为训练样本集X1的特征样本集 或公共向量样本集A,其表达式为 特征样本集 通过对训练样本集X1采用主成分分析方法进行抽提,即特征样本集 的抽提采用核主成份分析方法(PCA),公共向量样本集A通过对该训练样本集X1使用鉴别公共向量方法进行抽提,即公共向量样本集A的抽提采用鉴别公共向量方法(DCV),其中:特征样本集 以及公共向量样本A分别满足下式: (2)利用虚拟样本集V
计算训练样本集X1的核矩阵——将虚拟样本集V以及训练样本集X1通过核映射函数投影Φ
到核空间,以获得由l个虚拟样本组成的投影虚拟样本集V 构建的核矩阵,训练样本集X1的核矩阵的第i行第j列上的元素K1(i,j)由训练样本集中的第i个训练样本和虚拟样本集中的第j个虚拟样本代入核映射函数中计算得到,本发明所采用的核映射函数为高斯核映
2 2 Φ
射函数:k(x,y)=exp(-||x-y||/2δ),δ是可调节的参数;其中:V ={φ(vk)∈H|kФ
=1,...,l};(3)在核空间计算最佳鉴别向量W ——根据核重构理论,利用步骤(2)所构φ
建的核矩阵来线性表示核空间的特征向量w ,其中: (4)将训练样本
Ф
集X1的核矩阵投影到最佳鉴别特征向量W 上得到数据集Y1;投影是通过矩阵乘法运算来φ
实现的,X1和W 最终都以矩阵的形式表示,投影的过程可用公式表示为: (5)利用步骤(1)中通过训练样本集X1所构建的虚拟样本集V,通过核映射函数计算出待识别测试样本集X2的核矩阵,具体为:测试样本集X2的核矩阵中第i行第j列上的元素K2(i,j)由测试样本集中的第i个测试样本和虚拟样本集中的第j个虚拟样本代入核映射函数中计算
2 2
得到,该步骤所采用的核映射函数也为高斯核映射函数:k(x,y)=exp(-||x-y||/2δ);
然后将待识别测试样本集X2投影到特征向量WФ上得到数据集Y2, (6)通过最近邻分类器,根据步骤(4)获得的数据集Y1和步骤(5)获得的数据集Y2,输出识别结果;步骤(1)至(6)中: 表示d维空间;l表示虚拟样本的个数;n表示训练样本的个数;μi表示对训练样本集X1做主成分分析后,第i个PCA主分量对应的特征值;是挑选出的PCA主分量所对应的特征值; 表示使用鉴别公共向量DCV方法从X1中抽取的第i类的公共向量;c表示X1中的类别数;H表示核空间;φ表示核映射函数;φ(vk)是虚拟样本vk采用核映射函数φ投影到核空间H后的表示,即映射虚拟样本;Ψ是l个映射虚拟样本的集合;
β是用映射虚拟样本来重构核空间中特征向量的重构系数。
[0039] 以下将详细地说明本发明的原理:
[0040] 1.构造虚拟样本
[0041] 1.1构造特征样本
[0042] 本发明采用主成分分析方法(PCA)进行原始样本集X的特征样本集的提取。
[0043] 设有n个样本,原始样本集为X=[x1,...,xn],反映原始样本分布信息的总体散布矩阵St可表示如下:
[0044]
[0045] 其中,n为样本总数,m为样本总均值。
[0046] 由于St为实对称矩阵,因此可以对St对角化,即
[0047]
[0048] 其中Λ=diag(μ1,μ2,...,μn-1),μi表示St的非零特征值,Q=(e1,e2,...,en-1)为St的n-1个非零特征值对应的特征向量,el即为特征样本。特征样本是本发明所提出的虚拟样本的一种形式。
[0049] 为了减少核方法的计算量,需要从这些特征样本中选择一部分来尽可能的逼近原始样本的分布。已经选出一个包含l(l<<n-1)个元素的子集 那么,可以只用这l个特征样本来构造新的总体散布矩阵
[0050]
[0051] l个特征样本的总体散布矩阵 最大程度的逼近原始样本空间的总体散布矩阵St,当且仅当 是St前l个最大特征值所对应的加权特征向量。其中,l的取值由总体散布量的逼近程度的阈值来确定。
[0052] 由于总体散布矩阵的迹可以作为衡量总体散布量的标准,要使 与St总体散布量的误差最小,等价于使下面的表达式达到最大值:
[0053]
[0054] 令 由矩阵迹的定义以及实对称阵St的性质可知,Δ可展开为:
[0055] (12)
[0056]
[0057] 其中,λi和λk分别为 和St矩阵所对应的非零特征值。
[0058] 1.2构造公共向量样本
[0059] 本发明采用使用鉴别公共向量方法(DCV)从原始样本集中提取公共向量样本。
[0060] 原始样本集X的类内散度矩阵Sw定义为:
[0061]
[0062] 其中 ni为第i类样本的个数。
[0063] 设T为SW的非零空间,则T⊥为Sw的零空间,则:
[0064] T=span{αk|SWαk≠0,k=1,...,r}
[0065] (14)
[0066] T⊥=span{αk|SWαk=0,k=r+1,...,d}
[0067] r为Sw的秩,d为Sw空间的维数,{α1,...,αr}为Sw的非零特征值。
[0068] 由于 每一个样本 可被分解为如下两部分:
[0069]
[0070] 其中 和 分别为 的非共向量和公共向量。
[0071] 已证明对所有样本集的每类样本的公共向量部分都相同。因此,对每一个样本的都是相同的:
[0072]
[0073] 由此,我们得到公共向量样本为: 个数为类别数c。公共向量样本是本发明所提出的虚拟样本的另一种形式。
[0074] 2.投影虚拟样本
[0075] 将得到的虚拟样本集(特征样本集或公共向量样本集)统一表示为通过核映射函数映射到核空间中,得到VΦ={φ(vk)∈H|k=
1,...,l}。其中的φ(vk)即为所构造的投影虚拟样本。
[0076] 根据核重构理论,我们用核空间中l个虚拟样本组成的新的样本集VΦ来线性表示特征向量wφ:
[0077]
[0078] 其中Ψ=[φ(v1),…,φ(vi)],β=(β1,β2,…,βi)T。
[0079] 在基于虚拟样本的核主成分分析(MES-KPCA或MCS-KPCA)方法中,β由矩阵XTX最大若干个特征值所对应的特征向量构成,其中X=(I-W)K1,I是单位矩阵,W是所有元素都为 的方阵,。
[0080] 在基于虚拟样本的广义鉴别分析(MES-GDA或MCS-GDA)方法中,β由矩阵T -1 T(XX) YY非零特征值所对应的特征向量构成,其中X=(I-W)K1,Y=(L-P)K1,I是单位矩阵,W是所有元素都为 的方阵。上述表达式中的L和P是特殊的系数矩阵,其中,(i=1,…,c;j=1,…,ni),是包含ni个元素的列向
量,nl表示样本集中第i类的样本数;P=[P1 P2…Pc],Pi(i=1,…,c)是包含n个元素的列向量,其中每个元素的值都为
[0081] 将本发明所述的核鉴别方法在FERET数据库上实验,并将实验结果和相关核方法,如KPCA、GDA、CKFD方法及加速方法Greedy方法、Nystrom方法、缩减集方法(RSS和RSC)进行对比分析。
[0082] FERET数据中人脸图像的维数为3000,类别数c为200。试验中挑选每类训练样本数从2到6,则训练样本总数为400到1200,剩余为测试样本。
[0083] 与此同时,我们所提出的基于虚拟样本的快速核鉴别方法的有效性也在FERET人脸数据库上得到了有力的证明,在此方法下的基于虚拟样本的KPCA方法(MES-based KPCA和MCS-based KPCA)和基于虚拟样本的GDA方法(MES-based GDA和MCS-based GDA)都取得了很好的实验效果,说明了这种框架可以得到有意义的推广。
[0084]
[0085] 表1基于虚拟样本的核方法和相关比较方法的识别率(%)
[0086] 由表1可看出:基于虚拟样本的核鉴别分析方法MES-KPCA、MES-GDA、MCS-KPCA、MCS-GDA和MCS-CKFD均优于原始KPCA和GDA方法,其中基于MES的方法实验效果最优。在KPCA系列方法中,MES-KPCA方法较原KPCA方法识别率提高了2.7%;GDA系列方法中,MES-GDA方法较原GDA方法识别率提高了1.7%。且基于虚拟样本的核鉴别分析方法(MES和MCS)均优于Greedy方法、Nystrom方法和缩减集方法(RSS和RSC方法)等相关核加速方法。
[0087] 实验结果表明,本申请所述的核鉴别方法优于传统的核方法以及其它加速方法的识别效果,是一种快速有效的核鉴别分析方法。
[0088] 本发明不只应用于人脸识别领域。除了人脸之外,对于其他维数较高的图像样本,例如掌纹图像等,本方法同样适用。