基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备转让专利
申请号 : CN202110713814.X
文献号 : CN113343898B
文献日 : 2022-02-11
发明人 : 苟建平 , 熊祥硕 , 欧卫华 , 夏书银 , 柯佳 , 陈潇君
申请人 : 江苏大学
摘要 :
权利要求 :
1.基于知识蒸馏网络的口罩遮挡人脸识别方法,其特征在于,包括:基于口罩遮挡人脸图像构建训练集和测试集,所述训练集还包括对应的真实标签数据;
基于所述训练集构建口罩遮挡人脸识别网络;
将所述测试集输入所述口罩遮挡人脸识别网络中进行识别;
其中,基于所述训练集构建口罩遮挡人脸识别网络包括:构建教师网络和第一学生网络、第二学生网络,所述第一学生网络与所述第二学生网络结构相同;
对所述教师网络和所述第二学生网络进行预训练;
将所述训练集分别输入所述教师网络和所述第二学生网络获得所述教师网络输出的第一软标签数据、所述第二学生网络输出的第二软标签数据;
基于所述真实标签数据、所述第一软标签数据和所述第二软标签数据确定蒸馏损失函数;
基于所述蒸馏损失函数对所述第一学生网络进行迭代训练获得所述口罩遮挡人脸识别网络;
其中,基于所述第一软标签数据、所述第二软标签数据和所述真实标签数据确定蒸馏损失函数包括:
基于所述真实标签数据确定第一损失函数;
基于所述第一软标签数据确定第二损失函数;
基于所述第二软标签数据确定第三损失函数;
将所述第一损失函数、所述第二损失函数和所述第三损失函数加权求和获得蒸馏损失函数。
2.根据权利要求1所述的基于知识蒸馏网络的口罩遮挡人脸识别方法,其特征在于,所述第一损失函数为:
其中,LCE表示第一损失函数,X={x1,x2,x3,…,xn}表示训练集,σi(Z,1)表示第一学生网络在温度参数为T=1的条件下经过Softmax函数的输出结果,Z={z1,z2,z3,…,zm}表示第一学生网络经过Logits函数的输出结果,T表示温度参数。
3.根据权利要求1所述的基于知识蒸馏网络的口罩遮挡人脸识别方法,其特征在于,所述第二损失函数为:
t
其中,LKL1表示第二损失函数,σi(Z ,T1)表示教师网络在温度参数为T1的条件下经过t
Softmax函数的输出结果,Z表示教师网络经过Logits函数的输出结果。
4.根据权利要求1所述的基于知识蒸馏网络的口罩遮挡人脸识别方法,其特征在于,所述第三损失函数为:
s
其中,LKL2表示第三损失函数,σi(Z ,T2)表示第二学生网络在温度参数为T2的条件下经s
过Softmax函数的输出结果,Z表示第二学生网络经过Logits函数的输出结果。
5.根据权利要求1所述的基于知识蒸馏网络的口罩遮挡人脸识别方法,其特征在于,所述预训练包括:
获取待训练网络,所述待训练网络为教师网络或第二学生网络;
将所述训练集输入所述待训练网络中获取所述待训练网络的输出结果;
基于所述待训练网络的输出结果和所述真实标签数据确定交叉熵损失函数;
基于所述交叉熵损失函数对所述待训练网络进行迭代训练。
6.一种基于多重知识迁移的知识蒸馏装置,其特征在于,包括:数据采集模块,所述数据采集模块用于基于口罩遮挡人脸图像构建训练集和测试集,所述训练集还包括对应的真实标签数据;
模型构建模块,所述模型构建模块用于基于所述训练集构建口罩遮挡人脸识别网络;
人脸识别模块,所述人脸识别模块用于将所述测试集输入所述口罩遮挡人脸识别网络中进行识别;
其中,基于所述训练集构建口罩遮挡人脸识别网络包括:构建教师网络和第一学生网络、第二学生网络,所述第一学生网络与所述第二学生网络结构相同;
对所述教师网络和所述第二学生网络进行预训练;
将所述训练集分别输入所述教师网络和所述第二学生网络获得所述教师网络输出的第一软标签数据、所述第二学生网络输出的第二软标签数据;
基于所述真实标签数据、所述第一软标签数据和所述第二软标签数据确定蒸馏损失函数;
基于所述蒸馏损失函数对所述第一学生网络进行迭代训练获得所述口罩遮挡人脸识别网络;
其中,基于所述第一软标签数据、所述第二软标签数据和所述真实标签数据确定蒸馏损失函数包括:
基于所述真实标签数据确定第一损失函数;
基于所述第一软标签数据确定第二损失函数;
基于所述第二软标签数据确定第三损失函数;
将所述第一损失函数、所述第二损失函数和所述第三损失函数加权求和获得蒸馏损失函数。
7.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的基于知识蒸馏网络的口罩遮挡人脸识别方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的基于知识蒸馏网络的口罩遮挡人脸识别方法的步骤。
说明书 :
基于知识蒸馏网络的口罩遮挡人脸识别方法、装置及设备
技术领域
背景技术
进行分析学习的神经网络,能不断的模仿人脑进行声音、图像等复杂数据处理与表达。虽然
深度学习网络在很多领域获得了许多优秀的成果,但是在实际工业应用中还是有一些缺陷
和不足。从2012年提出的AlexNet到2016年提出的DenseNet,这些优秀的神经网络虽然获得
了更好的性能,但是需要神经网络变得更广更深,网络的结构变得更加复杂。更加复杂的神
经网络结构,意味着需要更长的时间进行推理,但这并不能适用工业环境。AlexNet和
DenseNet神经网络提高了网络的准确性,忽略了工业中的实时响应性。为了能够保持网络
的高准确性和降低网络的复杂度,从而出现了神经网络压缩方向。神经网络压缩是目前深
度学习研究的一个热门方向,其主要的研究方向是蒸馏、网络结构搜索、量化等。知识蒸馏
(KD)技术,就是模型压缩领域中一个特别重要的技术。
型的网络是“教师”,小型的网络是“学生”。实际上就是让学生模型去学习已经在目标数据
集上训练过的老师模型的输出。训练出的学生模型在压缩的同时,网络精度也提升了。这样
的小型网络,可以很容易的应用在小型终端设备中,在有限的计算资源下能够发挥更好的
效益。
情况下,戴上口罩后无法进行人脸识别,给控制疫情也带来了许多不便,因此开发口罩遮挡
人脸的识别技术是很有必要的,对此提出了基于知识蒸馏网络的口罩遮挡人脸识别应用研
究,在满足准确性的同时,也要提高识别的速度,可以利用知识蒸馏网络技术进行提高模型
的识别性能。
发明内容
特征进行识别,在低算力设备上也能达到较高的性能,具体包括以下技术方案:
出,克服了以往教师学生知识蒸馏和自学习知识蒸馏的单一性,这样不仅能够有效的压缩
学生网络模型,也能让学生网络的性能进一步提升,甚至超越大型教师网络的性能。通过这
种方式,可以使轻量级网络有效的提取被口罩遮挡住的人脸特征进行识别,在低算力设备
上也能达到较高的性能,这对于人脸识别技术无疑是一个重大突破。
附图说明
具体实施方式
开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术
人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
实标签数据;基于训练集构建口罩遮挡人脸识别网络;将测试集输入口罩遮挡人脸识别网
络中进行识别。
自动对焦、美化等,因此需要一个体积小、运行快的用于目标检测的卷积神经网络模型,进
而给用户带来更好的用户体验并提升手机产品品质。
像头会拍摄人脸图像并使用卷积神经网络抽取特征,然后和存储在系统中的身份证件的图
像特征进行相似度计算;如果相似度高就验证成功。其中,通过卷积神经网络抽取特征是最
耗时的,因此需要能够快速进行人脸验证和特征提取的高效的卷积神经网络模型。
摄像头会拍摄人脸图像并使用卷积神经网络抽取特征,然后和存储在系统中的员工身份信
息的图像特征进行相似度计算;如果相似度高就验证成功。其中,通过卷积神经网络抽取特
征是最耗时的,因此需要能够快速进行人脸验证和特征提取的高效的卷积神经网络模型。
适用的图像采集设备,比如相机或摄像头等;
集得到的预测数据,其性质接近真实标签数据,但与真实标签数据存在不同,因此称为软标
签数据。
的参数,通过对协同网络进行多次迭代训练,以逐步协同网络的参数值趋向于拟合,该训练
过程即监督学习的过程。
蒸馏的单一性,这样不仅能够有效的压缩学生网络模型,也能让学生网络的性能进一步提
升,甚至超越大型教师网络的性能。通过这种方式,可以使轻量级网络有效的提取被口罩遮
挡住的人脸特征进行识别,在低算力设备上也能达到较高的性能。
第一学生网络经过Logits函数的输出结果,T表示温度参数。
过Softmax函数的输出结果,Z表示教师网络经过Logits函数的输出结果。
下经过Softmax函数的输出结果,Z表示第二学生网络经过Logits函数的输出结果。
输入教师网络、第一学生网络和第二学生网络,获得如图5所示的各网络的识别准确率。
96.95%。
1.42%,相比于预训练的教师模型提升了0.30%和1.3%,从而验证了所提知识蒸馏方法的
有效性。
的口罩遮挡人脸识别方法的步骤。
行人机交互。
机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只
读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器可以是所述计算
机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,所述存储器
也可以是所述计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能
存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)
等。当然,所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设
备。本实施例中,所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软
件,例如基于知识蒸馏网络的口罩遮挡人脸识别方法的程序代码等。此外,所述存储器还可
以用于暂时地存储已经输出或者将要输出的各类数据。
机设备的总体操作。本实施例中,所述处理器用于运行所述存储器中存储的程序代码或者
处理数据,例如运行所述基于知识蒸馏网络的口罩遮挡人脸识别方法的程序代码。
络的口罩遮挡人脸识别方法的步骤。
人脸识别方法的程序代码的步骤。
前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做
出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质
(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服
务器或者网络设备等)执行本申请各个实施例所述的方法。
其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应
包含在本发明的保护范围内。