一种图像检测方法转让专利
申请号 : CN202111053859.5
文献号 : CN113516107B
文献日 : 2022-02-15
发明人 : 李永凯 , 王宁波 , 朱树磊 , 殷俊 , 郝敬松
申请人 : 浙江大华技术股份有限公司
摘要 :
权利要求 :
1.一种图像检测方法,其特征在于,包括:获取待检测图像;
通过训练好的活体检测网络对所述待检测图像进行检测,得到所述待检测图像的输出结果;所述输出结果表示所述待检测图像是否为活体人脸图像;所述训练好的活体检测网络是通过以下方法进行N次训练得到的;所述N是预设的,且N是正整数;
其中,将已知数据集中的第一图像和所述第一图像的第一标签作为所述活体检测网络的第一输入,将所述第一图像为活体人脸图像的概率作为所述活体检测网络的第一输出;
所述第一标签表示输入的图像为活体人脸图像;以及,将生成器根据随机生成的高斯分布数据源生成的第二图像作为所述活体检测网络的第二输入,将所述第二图像为活体人脸图像的概率作为所述活体检测网络的第二输出;根据所述第一输出的损失和所述第二输出的损失,对所述活体检测网络进行第n次训练,得到所述训练好的活体检测网络;n是小于或等于N,且大于0的整数;
所述生成器是预先训练好的生成器;所述生成器是根据以下方法训练N次得到的;
将所述生成器根据随机生成的高斯分布数据源生成的第三图像和所述第三图像的第二标签作为鉴别器的输入;所述第二标签表示输入的图像为已知图像;将所述第三图像为已知图像的概率作为所述鉴别器的输出;将所述第三图像作为第n‑1次训练得到的活体检测网络的输入,将所述第三图像为活体人脸图像的概率作为所述第n‑1次训练得到的活体检测网络的输出;根据所述鉴别器的输出的损失和所述第n‑1次训练得到的活体检测网络的输出的损失,对所述生成器进行第n次训练;
所述鉴别器是预先训练好的鉴别器;所述鉴别器是根据以下方法训练N次得到的;
将所述第一图像和所述第二标签作为所述鉴别器的第三输入,将所述第一图像为已知图像的概率作为所述鉴别器的第三输出;以及,将第n‑1次训练得到的生成器根据随机生成的高斯分布数据源生成的第三图像和所述第三图像的第三标签作为所述鉴别器的第四输入,将所述第三图像为已知图像的概率为所述鉴别器的第四输出;所述第三标签表示输入的图像为未知图像;根据所述第三输出的损失和所述第四输出的损失,对所述鉴别器进行第n次训练。
2.根据权利要求1所述的方法,其特征在于,所述第一输出的损失Lcls满足以下公式:代表第一图像数量, 是活体检测网络预测第j个第一图像为活体人脸图像的概率, 是第 个第一图像的第一标签;
所述第二输出的损失 满足以下公式:Z为输入的所述第二图像的数量, 表示预测输入的第i个第二图像为活体人脸图像uniform
的概率,y 为预设类别均匀概率分布。
3.根据权利要求1或2所述的方法,其特征在于,根据所述第一输出的损失和所述第二输出的损失,对所述活体检测网络进行N次训练,得到所述训练好的活体检测网络,包括:确定所述第一图像的中心损失;所述中心损失Lcenter满足以下公式:M为已知数据集中第一图像的数量, 表示已知数据集中的第i个第一图像, 为预设的类中心;
根据所述中心损失、所述第一输出的损失和所述第二输出的损失对所述活体检测网络进行N次训练,得到所述训练好的活体检测网络。
4.根据权利要求1所述的方法,其特征在于,所述鉴别器的输出的损失LeerG满足以下公式:
C代表第三图像数量, 是鉴别器预测第j个第三图像为已知图像的概率, 是第j个第三图像的第二标签;
所述第n‑1次训练时的活体检测网络的输出的损失 满足以下公式:
N为第三图像的数量, 表示输入的第i个第三图像为活体人脸图像的概率, 为预设类别均匀概率分布。
5.根据权利要求1所述的方法,其特征在于,所述第三输出的损失Lin满足以下公式:C代表第一图像数量, 是鉴别器预测第j个第一图像为已知图像的概率, 是第j个第一图像的第二标签;
所述第四输出的损失 满足以下公式:C代表第三图像数量, 是鉴别器预测第j个第三图像为已知图像的概率, 是第j个第三图像的第三标签。
6.一种图像检测装置,其特征在于,包括:获取单元,用于获取待检测图像;
处理单元,用于通过训练好的活体检测网络对所述待检测图像进行检测,得到所述待检测图像的输出结果;所述输出结果表示所述待检测图像是否为活体人脸图像;所述训练好的活体检测网络是通过以下方法进行N次训练得到的;所述N是预设的,且N是正整数;
其中,将已知数据集中的第一图像和所述第一图像的第一标签作为所述活体检测网络的第一输入,将所述第一图像为活体人脸图像的概率作为所述活体检测网络的第一输出;
所述第一标签表示输入的图像为活体人脸图像;以及,将生成器根据随机生成的高斯分布数据源生成的第二图像作为所述活体检测网络的第二输入,将所述第二图像为活体人脸图像的概率作为所述活体检测网络的第二输出;根据所述第一输出的损失和所述第二输出的损失,对所述活体检测网络进行第n次训练,得到所述训练好的活体检测网络;n是小于或等于N,且大于0的整数;
所述生成器是预先训练好的生成器;所述生成器是根据以下方法训练N次得到的;
将所述生成器根据随机生成的高斯分布数据源 生成的第三图像和所述第三图像的第二标签作为鉴别器的输入;所述第二标签表示输入的图像为已知图像;将所述第三图像为已知图像的概率作为所述鉴别器的输出;将所述第三图像作为第n‑1次训练得到的活体检测网络的输入,将所述第三图像为活体人脸图像的概率作为所述第n‑1次训练得到的活体检测网络的输出;根据所述鉴别器的输出的损失和所述第n‑1次训练得到的活体检测网络的输出的损失,对所述生成器进行第n次训练;
所述鉴别器是预先训练好的鉴别器;所述鉴别器是根据以下方法训练N次得到的;
将所述第一图像和所述第二标签作为所述鉴别器的第三输入,将所述第一图像为已知图像的概率作为所述鉴别器的第三输出;以及,将第n‑1次训练得到的生成器根据随机生成的高斯分布数据源生成的第三图像和所述第三图像的第三标签作为所述鉴别器的第四输入,将所述第三图像为已知图像的概率为所述鉴别器的第四输出;所述第三标签表示输入的图像为未知图像;根据所述第三输出的损失和所述第四输出的损失,对所述鉴别器进行第n次训练。
7.如权利要求6所述的装置,其特征在于,所述第一输出的损失Lcls满足以下公式:C代表第一图像数量, 是活体检测网络预测第j个第一图像为活体人脸图像的概率, 是第j个第一图像的第一标签;
所述第二输出的损失 满足以下公式:Z为输入的所述第二图像的数量, 表示预测输入的第i个第二图像为活体人脸图像uniform
的概率, y 为预设类别均匀概率分布。
8.如权利要求6或7所述的装置,其特征在于,根据所述第一输出的损失和所述第二输出的损失,对所述活体检测网络进行N次训练,得到所述训练好的活体检测网络,包括:确定所述第一图像的中心损失; 所述中心损失Lcenter满足以下公式:M为已知数据集中第一图像的数量, 表示已知数据集中的第i个第一图像, 为预设的类中心;
根据所述中心损失、所述第一输出的损失和所述第二输出的损失对所述活体检测网络进行N次训练,得到所述训练好的活体检测网络。
9.如权利要求6所述的装置,其特征在于,所述鉴别器的输出的损失LeerG满足以下公式:C代表第三图像数量, 是鉴别器预测第j个第三图像为已知图像的概率, 是第j个第三图像的第二标签;
所述第n‑1次训练时的活体检测网络的输出的损失 满足以下公式:
N为第三图像的数量, 表示输入的第i个第三图像为活体人脸图像的概率, 为预设类别均匀概率分布。
10.如权利要求6所述的装置,其特征在于,所述第三输出的损失Lin满足以下公式:C代表第一图像数量, 是鉴别器预测第j个第一图像为已知图像的概率, 是第j个第一图像的第二标签;
所述第四输出的损失 满足以下公式:C代表第三图像数量, 是鉴别器预测第j个第三图像为已知图像的概率, 是第j个第三图像的第三标签。
11.一种电子设备,其特征在于,包括:存储器,用于存储计算机指令;
处理器,与所述存储器连接,用于执行所述存储器中的计算机指令,且在执行所述计算机指令时实现如权利要求1至5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1至5中任一项所述的方法。
说明书 :
一种图像检测方法
技术领域
背景技术
支付等。但是人脸识别系统有被使用伪装用户人脸进行攻击的风险,一旦用户人脸图像被
窃取,系统非常容易受到攻击。
追踪等技术,验证用户是否为真实活体本人操作。可有效抵御照片、换脸、面具、遮挡以及屏
幕翻拍等常见的攻击手段,从而帮助用户甄别欺诈行为,保障用户的利益。因此针对活体检
测的研究逐渐成为人脸检测中的重要研究任务。
发明内容
述输出结果表示所述待检测图像是否为活体人脸图像;所述训练好的活体检测网络是通过
以下方法进行N次训练得到的;所述N是预设的,且N是正整数;其中,将已知数据集中的第一
图像和所述第一图像的第一标签作为所述活体检测网络的第一输入,将所述第一图像为活
体人脸图像的概率作为所述活体检测网络的第一输出;所述第一标签用于表示所述第一图
像为活体人脸图像;以及,将生成器根据随机生成的高斯分布数据源生成的第二图像作为
所述活体检测网络的第二输入,将所述第二图像为活体人脸图像的概率作为所述活体检测
网络的第二输出;根据所述第一输出的损失和所述第二输出的损失,对所述活体检测网络
进行第n次训练,得到所述训练好的活体检测网络;n是小于或等于N,且大于或等于0的整
数。
模有限情况下提升活体检测网络,相对于领域自适应类方法而言,该方法需要的数据量更
少,需要的数据类别少,不需要对训练数据进行领域划分,该方法生成的未知攻击类型图像
覆盖面更广。
图像的概率, y 为预设类别均匀概率分布。
行约束,使用相对熵损失可以度量输出分布与类别均匀分布的差异性。
像的中心损失;所述中心损失是通过中心损失函数确定的;所述中心损失Lcenter满足以下公
式:
一输出的损失和第二输出的损失相结合,有效的提高了网络的鲁棒性,相对现有技术而言
考虑更加全面。
像和所述第三图像的第二标签作为鉴别器的输入;所述第二标签用于表示所述第三图像为
已知图像;将所述第三图像为已知图像的概率作为所述鉴别器的输出;将所述第三图像作
为n‑1次训练得到的活体检测网络的输入,将所述第三图像为活体人脸图像的概率作为所
述n‑1次训练得到的活体检测网络的输出;根据所述鉴别器的输出的损失和所述n‑1次训练
得到的活体检测网络的输出的损失,对所述生成器进行第n次训练。
网络的输出的损失 满足以下公式:
束,使用相对熵损失可以度量输出分布与类别均匀分布的差异性。
将所述第一图像为已知图像的概率作为所述鉴别器的第三输出;以及,将第n‑1次训练得到
的生成器根据随机生成的高斯分布数据源生成的第四图像和所述第四图像的第三标签作
为所述鉴别器的第四输入,将所述第四图像为已知图像的概率为所述生成器的第四输出;
所述第三标签表示所述第四图像为未知图像;根据所述第三输出的损失和所述第四输出的
损失,对所述鉴别器进行第n次训练。
训练好的活体检测网络是通过以下方法进行N次训练得到的;所述N是预设的,且N是正整
数;
出;所述第一标签表示输入的图像为活体人脸图像;以及,将生成器根据随机生成的高斯分
布数据源生成的第二图像作为所述活体检测网络的第二输入,将所述第二图像为活体人脸
图像的概率作为所述活体检测网络的第二输出;根据所述第一输出的损失和所述第二输出
的损失,对所述活体检测网络进行第n次训练,得到所述训练好的活体检测网络;n是小于或
等于N,且大于0的整数。
图像的概率, y 为预设类别均匀概率分布。
络,包括:
像为已知图像的概率作为所述鉴别器的输出;
生成的高斯分布数据源生成的第三图像和所述第三图像的第三标签作为所述鉴别器的第
四输入,将所述第三图像为已知图像的概率为所述鉴别器的第四输出;所述第三标签表示
输入的图像为未知图像;
面或第二方面中任一项所述的方法。
复赘述。
附图说明
实施例。
具体实施方式
术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普
通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方
案保护的范围。
列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选
地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的
其它步骤或单元。本申请中的“多个”可以表示至少两个,例如可以是两个、三个或者更多
个,本申请实施例不做限制。
外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
常容易受到攻击。由于非活体图像的类型越来越多,比如使用黑白打印照片,彩色图像套
袋,使用不同材质制作的3D头模,因此活体检测系统除了需要针对常见的非活体图像进行
检测,还需要针对没有见过的未知攻击类型图像进行检测。而目前相关技术中,在网络训练
过程中仅仅使用现有的图像,很难实现让活体检测网络学习到共同的泛化特征。如何对活
体检测网络进行加强,增强其对未知类型图像的检测能力亟待解决。
是,非活体图像中可以包含人脸,也可以不包含人脸。如图1所示,可以是海报上的人脸,或
者也可以是通过手机拍摄的图像,或者也可以是其他不包含人脸的图像数据。
取。本申请实施例提及的未知数据集是除上述已知数据集以外的其他数据构成的集合。例
如,可以是生成器随机生成的图像,或者可以是生成器通过随机生成的高斯分布数据源生
成的图像等,或者还可以是在人脸检测过程中受到攻击时的非活体图像。
法穷尽,未知攻击类型图像几乎均为各种各样非活体图像,包括3D攻击和特殊材质的海报
打印纸张攻击。因此可以在活体检测网络训练过程中,通过训练生成器实时生成未知攻击
类型图像对活体检测网络进行加强,从而提高其鲁棒性,而且增强其对未知攻击类型图像
的检测能力。
人脸的输出结果。其中,训练好的活体检测网络可以是通过前述已知数据集中的图像以及
生成器生成的未知攻击类型图像训练得到的。因此,可以增强活体检测网络的效果。
头获取待检测图像。
过N次训练得到的。其中,N是预设的,且N是正整数;
输出,并计算第一输出的损失。其中,第一标签表示该第一图像是否为活体人脸图像,第一
输出表示预测第一图像为活体人脸图像的概率,第一输出的损失为第一输出与第一图像的
第一标签的分类交叉熵损失,计算公式如下公式1所示:
脸图像,则 取值为1,否则取值为0。通过分类交叉熵损失函数可以表示在活体检测网络
中实际输出的检测结果与第一图像的预设的第一标签之间的差异。
像,第二输出为预测第二图像为活体人脸图像的概率,第二输出的损失表示第二输出和预
设的类别均匀概率分布之间的相对熵损失,计算公式如下公式2所示:
设类别均匀概率分布。
请实施例对此不作要求。
后判断训练次数是否大于N,若不是,则再次进行训练过程,直至第N次训练完成,结束训练。
其中,N为预设的最大迭代次数。可选地,N的值可以为10、20或30等,本申请实施例不做限
制。
网络规模有限情况下提升活体检测网络,相对于领域自适应类方法而言,该方法需要的数
据量更少,需要的数据类别少,不需要对训练数据进行领域划分,该方法生成的分布外数据
覆盖面更广。
器,生成器训练过程中使用生成对抗训练,其训练步骤如下:
中,第二标签用于表示第三图像为已知图像,鉴别器的输出表示鉴别器预测第三图像为已
知图像的概率,鉴别器的输出的损失表示鉴别器的输出与第二标签的分类交叉熵损失,计
算公式如下公式5所示:
表示在鉴别器中实际输出的检测结果与已知图像的预设标签之间的差异。
检测网络的输出的损失表示该输出和类别均匀概率分布之间的相对熵损失,计算公式如下
公式6所示:
预设类别均匀概率分布。通过相对熵损失来度量生成器生成的未知攻击类型图像为活体人
脸图像的概率和类别均匀概率分布之间的差异。
体检测网络的输出的损失调整活体检测网络中的参数,然后判断训练次数是否大于N,若不
是,则再次进行训练过程,直至第N次训练完成,结束训练。计算公式如下公式7所示:
重。应了解, 和 应根据实际情况取值,本申请实施例对此不作要求。
标签表示第一图像为已知图像,第三输出表示预测第一图像为已知图像的概率,第三输出
的损失表示第三输出与第二标签的分类交叉熵损失。计算公式如下公式8所示:
1,否则取值为0。通过分类交叉熵损失函数可以表示在鉴别器中实际输出的检测结果与已
知图像的预设标签之间的差异。
测第三图像为已知图像的概率,第四输出的损失表示第四输出与第三标签的分类交叉熵损
失,计算公式如下公式9所示:
示在鉴别器中实际输出的结果与输入数据的预设标签之间的差异。
检测网络中的参数,然后判断训练次数是否大于N,若不是,则再次进行训练过程,直至第N
次训练完成,结束训练。计算公式如下公式10所示:
例中的相关说明,此处不再赘述。
可以参见如图2所示的方法实施例中的相关说明,此处不再赘述。
所示的方法实施例中的相关说明,此处不再赘述。
示的方法实施例中的相关说明,此处不再赘述。
失计算方法可以参见如图2所示的方法实施例中的相关说明,此处不再赘述。
不再赘述。
见如图2所示的方法实施例中的相关说明,此处不再赘述。
括获取单元401和处理单元402。
测网络是通过以下方法进行N次训练得到的;所述N是预设的,且N是正整数;
出;所述第一标签表示输入的图像为活体人脸图像;以及,将生成器根据随机生成的高斯分
布数据源生成的第二图像作为所述活体检测网络的第二输入,将所述第二图像为活体人脸
图像的概率作为所述活体检测网络的第二输出;根据所述第一输出的损失和所述第二输出
的损失,对所述活体检测网络进行第n次训练,得到所述训练好的活体检测网络;n是小于或
等于N,且大于0的整数。
图像的概率, y 为预设类别均匀概率分布。
络,包括:
像为已知图像的概率作为所述鉴别器的输出;
生成的高斯分布数据源生成的第三图像和所述第三图像的第三标签作为所述鉴别器的第
四输入,将所述第三图像为已知图像的概率为所述鉴别器的第四输出;所述第三标签表示
输入的图像为未知图像;
连接,用于执行所述存储器中的计算机指令,且在执行所述计算机指令时实现上述任一方
法的步骤。
序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或
者光盘等各种可以存储程序代码的介质。
离本申请的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更
和修改均落入本申请的保护范围。尽管已描述了本申请的优选实施例,但本领域内的技术
人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权
利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
本申请也意图包含这些改动和变型在内。