基于混合扩展块字典稀疏表示的单样本人脸识别方法转让专利
申请号 : CN202110321267.0
文献号 : CN113158812B
文献日 : 2022-02-08
发明人 : 童莹 , 马杲东 , 曹雪虹 , 陈瑞 , 赵小燕
申请人 : 南京工程学院
摘要 :
权利要求 :
1.基于混合扩展块字典稀疏表示的单样本人脸识别方法,其特征在于:包括以下步骤,步骤(S1):构建非目标对象的通用数据集X,将非目标对象的通用数据集X划分为B个非目标对象的通用块样本集 在对应块样本空间上学习KDA算法,得到KDA投影矩阵所述非目标对象的通用数据集X指受表情、光照、遮挡各种干扰因素影响的图像的集合,而非目标对象的通用块样本集 其中,c为样本类别数, 表示第i类样本的第 个块图像集, 中每个块图像用d维列向量表示,共ni个块图像,则 的总样本数为n1+n2+...+nc=n,依次学习B个非目标对象通用块样本集的高维空间分布,得到B个KDA投影矩阵步骤(S2):构建目标对象标准样本集N,并同理步骤(S1)将其划分为B个目标对象标准块样本集 根据式(1)采用步骤(S1)得到KDA投影矩阵 分别对相同局部区域的目标对象标准块样本集 进行低维投影,得到对应的目标对象的低维基本块字典其中, 表示采用非线性核函数对数据进行高维映射,该非线性核函数为径向基核函数,T表示矩阵的转置运算;
MN×s
步骤(S3):构建测试样本集Y=[y1,y2,...,ys]∈R ;
MN×s
其中R为实数集合,MN表示样本的列向量维数,s表示样本个数,Y∈R 表示测试样本集Y中包含s个样本,每个样本用维数为MN的列向量表示,列向量的所有元素从实数集R中取值;
步骤(S4):采用KDA算法分别提取非目标对象通用数据集X的遮挡信息和类内变化信息,构建非目标对象的遮挡块字典 和类内差异块字典 得到B个混合完备扩展块字典
步骤(S5):根据混合完备扩展块字典 采用SRC模型中的加权块稀疏表示分类器对目标对象待测样本y的B个块图像 进行线性稀疏表示,根据最小残差划分类别,从而进行该待测样本的遮挡人脸识别。
2.根据权利要求1所述的基于混合扩展块字典稀疏表示的单样本人脸识别方法,其特征在于:步骤(S2)中:目标对象标准块样本集 是指从m个对象中各取出一张无干扰正脸图像,然后将每张无干扰正脸图像均划分为B块,构建B个目标对象标准块样本集其中, 为第i个对象
d×1
的第 个块图像的列向量表示,d为样本的列向量维数,R 表示 是一个维数为d的列向量,列向量的元素从实数集R中取值。
3.根据权利要求1所述的基于混合扩展块字典稀疏表示的单样本人脸识别方法,其特征在于:步骤(S4):包括以下步骤:(S41):选择只受遮挡干扰因素影响的图像构建非目标对象的遮挡数据集XO和与遮挡图像同类别的正脸无干扰图像标准数据集XN,并同理步骤(S1)将两者分别划分为B个遮挡块样本集 和标准块样本集
(S42):基于式(2)采用步骤(S1)得到的KDA投影矩阵 对遮挡块样本集 和标准块样本集 进行低维映射并相减,则得到非目标对象的遮挡块字典(S43):选择受光照、表情、姿态非遮挡干扰因素影响的图像构建非目标对象的类内变化数 据 集 X V ,并 同理 步 骤 ( S1 ) 将 其 划分 为 B个 类 内 变 化块 样 本 集其中, 表示第i类样本的第 个类内块样本集;
(S44):根据式(3)采用步骤(S1)得到的KDA投影矩阵 对 进行低维映射,得到低维矩阵 如式(3)所示,其中, 为 在KDA上的低维投影矩阵(i=1,
2,...,C),
(S45):将步骤(S44)中的每一类的低维投影矩阵减去其均值,得到非目标对象的类内差异块字典 如式(4)所示,
其中 为 的均值矩阵,将 中所有列向量相加取平均,得到一个平均列向量 取 且 与 大小相同;
(S46):将非目标对象的遮挡块字典 和类内差异块字典 相结合得到B个混合完备扩展块字典
4.根据权利要求1所述的基于混合扩展块字典稀疏表示的单样本人脸识别方法,其特征在于:步骤(S5)中:根据混合完备扩展块字典 采用SRC模型中的加权块稀疏表示分类器对目标对象待测样本y的B个块图像 进行线性稀疏表示,根据最小残差划分类别,包括以下步骤:
(S51):从测试样本集Y中任取一待测样本y,将其分割成B个块图像并采用步骤(S1)得到KDA投影矩阵 对它们进行低维映射;
(S52):基于以下SRC的目标函数式(5)依次优化求解步骤(S51))所有块图像的稀疏编码系数;
其中, 为目标对象的低维基本块字典, 为非目标对象的混合完备扩展块字典, 为对应目标对象低维基本块字典 的编码系数, 为对应非目标对象混合完备扩展块字典 的编码系数,λ为x正则化系数;
(S53):并根据以下式(6)计算待测样本与每一类重构样本的残差,依据最小残差划分类别:
其中, 表示对应目标对象低维基本块字典 的编码系数 中的第j类系数(j=1,2,...,c), 表示对应非目标对象混合完备扩展块字典 的编码系数,表示判定待测样本y的标签为最小ej值对应的标签。
说明书 :
基于混合扩展块字典稀疏表示的单样本人脸识别方法
技术领域
背景技术
景中,由于存储空间的限制以及个人隐私保护,一些人脸识别系统仅包含每个人的一张或
少量正脸标准图像(即不受光照、表情、遮挡等外界因素干扰的无拍摄角度偏移的正脸图
像),例如,门禁系统、身份证闸机系统、护照验证系统等。传统的人脸识别算法在这些系统
中识别效果不佳。究其原因,真实环境采集的人脸图像可能受光照、表情、配饰遮挡、姿态,
甚至采集数据的时间跨度等因素的影响,这导致目标对象的待测图像可能与系统中的标准
图像存在很大差异,而传统人脸识别算法无法从少量标准样本中提取出有效的类内变化信
息,因此也无法对可能存在各种外界干扰因素的待测样本进行准确预测。这就产生了单样
本人脸识别问题,这也是目前人脸识别研究中一个具有挑战性且极富实用价值的研究课
题。
methods)。基于数据扩增的方法主要是利用真实样本合成虚拟样本或将人脸图像分割成重
叠或不重叠的图像块进行识别,其目的均是为了增加训练样本的数量,用以解决传统算法
在单样本人脸识别中的局限性。代表方法有SPCA、 SVD‑LDA、Modular PCA、Modular LDA、
DMMA、SDMME等。这类方法虽然在单样本人脸识别中起到一定作用,但仍存在两个致命缺陷:
(1)合成产生的虚拟样本与标准样本是高度相关的,因此不能作为独立样本使用,提取出的
类内变化信息不具有表征性。(2)将人脸图像分块识别时通常假设待测样本的块图像与训
练样本在同一位置上的块图像具有相似的人脸结构特征,然而实际应用中,由于人脸姿态
的变化或者配饰遮挡的影响,相同位置的待测样本与训练样本的块图像可能存在很大差
异,导致上述假设不成立,单样本人脸识别效果不佳。
集,对目标对象中存在的干扰信息进行准确建模,再结合标准样本描述的人脸类别结构特
征对目标对象的待测样本进行准确预测,有效解决了单样本人脸识别中目标对象的变化样
本不足的局限性。2009年Wright提出的稀疏表示分类(sparse representation based
classification,SRC)算法最具代表性。它首次引入稀疏表示(Sparse Representation,
SR)理论,用单位矩阵构建扩展字典,用来弥补待测样本与标准样本之间可能存在的像素差
异,再结合样本字典对待测样本进行线性稀疏重构,计算待测样本与每类近似重构样本的
残差,根据最小残差划分类别。这种分类思想受到了国内外学者们的广泛关注,提出了许多
改进算法。例如,2012年,Deng等提出了一种扩展稀疏表示分类 (extended sparse
representation‑based classifier,ESRC)算法,它用标准样本(正脸无干扰人脸图像)与
变化样本(存在遮挡、表情、光照等干扰的人脸图像) 的差值构建扩展字典,相比SRC算法中
采用的单位矩阵,ESRC的扩展字典描述了更丰富的类内变化信息,有助于进一步提高待测
样本的预测准确性。2013 年,Yang等提出了稀疏变化字典学习(Sparse Variation
Dictionary Learning, SVDL)方法,2015年,Wei等提出了鲁棒辅助字典学习(Robust
Auxiliary Dictionary Learning,RADL)方法,它们均是从非目标对象的变化样本中学习
更具表征性的类内变化字典,在不引入人脸遮挡部分先验信息的前提下,有效提高了单样
本人脸识别的准确性。2016年,Chen等又采用迭代加权鲁棒主成分分析方法自适应提取待
测样本中可能存在的各种干扰信息,再联合无遮挡的训练样本,构建待测样本的自适应噪
声字典(Adaptive Noise Dictionary,AND),实现待测样本的准确预测。
行准确建模,从而进一步提高具有各种面部变化情况的待测样本的线性稀疏表示的准确
性。上述基于通用学习的方法虽然在单样本人脸识别中取得了令人瞩目的效果,但仍存在
以下问题:
而,在实际应用中,要收集到足够多的满足各种变化的通用样本是一项艰巨的任务。
子是由二维图像转换为一维列向量表示,这也导致字典原子的维度远远大于原子个数,容
易出现“小样本”问题,不能保证在解空间获得最优稀疏解。
稀疏重构误差处理,可以克服上述问题,但这类算法的计算复杂度较高,在实际应用中也缺
乏可操作性。
发明内容
遮挡块字典和类内差异块字典,最后采用加权块稀疏表示分类器对待测样本进行准确预
测,有效提高了单样本人脸识别的准确性。
Discriminant Analysis,KDA)算法,得到KDA投影矩阵
域的目标对象标准块样本集 进行低维投影,得到对应的目标对象的低维基本块字典
中取值;
字典
而进行该待测样本的遮挡人脸识别。
其中,c为样本类别数, 表示第i类
样本的第 个块图像集, 中每个块图像用d维列向量表示,共ni个块图像,则
的总样本数为n1+n2+...+nc=n,依次学习B个非目
标对象通用块样本集的高维空间分布,得到B个KDA投影矩阵
本集 其中, 为第i个
d×1
对象的第 个块图像的列向量表示,d为样本的列向量维数,R 表示 是一个维数为d的
列向量,列向量的元素从实数集R中取值。
遮挡块样本集 和标准块样本集
其中, 表示第i类样本的第 个类
内块样本集;
2,...,C),
差划分类别,包括以下步骤:
映射;
对应非目标对象混合完备扩展块字典 的编码系数,λ为x正则化系数;
表示判定待测样本y的标签为最小ej值对应的标签。
注人脸结构特征或遮挡信息,更有利于人脸的准确识别。同时,将图像分块也有助于弥补单
样本人脸识别中样本数不足的缺陷。
非线性不可分的情况,因此,本发明采用核判别分析(kernel discriminant analysis,
KDA)算法计算各个块图像空间的最佳低维投影方向,得到更具判别性的低维子空间。
了模型的运算效率,保证在解空间中获得最优稀疏解。
遮挡字典,以及描述光照、表情、姿态等变化的类内差异字典,旨在消除像素间冗余信息和
人脸结构特征,使遮挡字典和类内差异字典更具表征性。同时也克服了传统方法中需要假
设非目标对象与目标对象具有相同遮挡信息的不足。
字典更具判别性,仅包含人脸结构特征,而不含有像素冗余信息和干扰信息,同时,使遮挡
字典和类内差异字典更具表征性,仅包含遮挡信息以及光照、表情等类内干扰信息,而无人
脸结构特征。鉴于此,本发明用目标对象的基本字典描述人脸结构特征,用非目标对象的遮
挡字典和类内差异字典描述人脸识别中可能存在的各种干扰信息,两者相结合,可以解决
单样本人脸识别中目标对象面部变化情况不足的缺陷,有效提高单样本人脸识别的准确
性。
附图说明
具体实施方式
阵 本发明中涉及的KDA算法指核判别分析 (kernel discriminant analysis,
KDA)算法;
域的目标对象标准块样本集 进行低维投影,得到对应的目标对象的低维基本块字典
中取值;
字典
而进行该待测样本的遮挡人脸识别。
其中,c为样本类别数, 表示第i类样本
的第 个块图像集, 中每个块图像用d维列向量表示,共ni个块图像,则
的总样本数为n1+n2+...+nc=n,依次学习B个非目标对象
通用块样本集的高维空间分布,得到B个KDA投影矩阵
集 其中, 为第i个对象的第 个
d×1
块图像的列向量表示,d为样本的列向量维数,R 表示 是一个维数为d的列向量,列向
量的元素从实数集R中取值。
遮挡块样本集 和标准块样本集
其中, 表示第i类样本的第 个
类内块样本集;
2,...,C),
划分类别,包括以下步骤:
映射;
对应非目标对象混合完备扩展块字典 的编码系数,λ为 x正则化系数;
表示判定待测样本y的标签为最小ej值对应的标签。
化条件,部分人脸图像具有背景、距离和时间跨度的变化。本发明选择了其中9031张图像进
行实验,部分样本图像如图3所示,图像尺寸为120×100像素。
260张标准样本,它们共同组成了非目标对象的通用数据集。
本发明无论是否采用分块方式,单样本人脸识别效果均优于其他技术。当采用分开3方式
时,本发明识别效果最佳,达到96.15%的识别准确率,比经典ESRC方法提高了5.57%。
叠率为0.5时,单样本人脸识别率最高,达到98.13%,比不分块时又高出了1.98%。究其原
因,从图5中可以看出,当重叠率为0.5时,图像分块个数由4块扩增到9块,且块与块之间有
部分人脸结构重叠。当对每一块图像进行稀疏编码时,可以起到特征信息相互补充的作用,
有效提高了单样本人脸识别的准确性。
挡图像3张,围脖遮挡3张。本发明选取了100类人进行实验,并对图像进行裁剪及归一化处
理,裁剪后的尺寸大小为120×100 像素。
成,共490张样本。
达到96.93%,远远高于其他方法。这说明了,分别构建遮挡字典和类内差异字典有助于对
具有各种面部变化情况的目标对象的待测样本进行准确建模,弥补了单样本人脸识别中仅
有一张标准人脸图像的不足。同时,我们也发现,本发明采用不分块方式时,识别率仅
88.93%,比分块时降低了8%,如表5所示。这也进一步说明了,在单样本人脸识别中对图像
进行分块处理可以扩充样本数量,弥补了目标对象变化样本不足的局限性,有助于提高单
样本人脸识别的准确率。
图像,包含了光照、表情、姿态、遮挡、年龄、种族等多种混合干扰,对于准确人脸识别更具有
挑战性。本发明从中选取包含10张以上图像的人进行辨识,得到158类人。为了便于实验,这
里选取每类人10张图像,供1580 张样本进行实验。部分样本如图6所示,图像尺寸为120×
100像素。
准数据集,非目标对象的通用数据集和混合干扰数据集,具体如下:
本发明提出的混合扩展块字典更有助于解决真实环境下的单样本人脸识别问题。
含部分遮挡(眼镜、帽子等饰物)、极端光照、较大的姿势变换(>45°)、不同种族、年龄等干扰
因素。本发明从PubFig数据库中随机选取100 类人,每类人20张图像进行实验仿真。部分样
本如图7所示,图像尺寸为 120×100像素。
中仅构建目标对象的标准数据集,非目标对象的通用数据集和混合干扰数据集,具体如下:
见,本发明提出的混合扩展块字典更有助于解决真实环境下的单样本人脸识别问题。
验数据库和真实数据库上的实验结果均验证了,本发明与现有技术相比,其创新点在解决
单样本人脸识别问题上是有效的、可行的,具体归纳如下:
信息,使低维特征数据更具判别性;另一方面采用本发明改进的字典构建方法,也使本发明
的样本字典更具判别性,遮挡字典和类内差异字典更具表征性,两者相结合,可以解决单样
本人脸识别中目标对象面部变化情况不足的缺陷,有效提高单样本人脸识别的准确性。
问题,具有实用价值。
率高,利于实用推广。
理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进
都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界
定。