人脸检测方法及装置转让专利

申请号 : CN201710079126.6

文献号 : CN106951826B

文献日 : 2019-09-20

本发明提供一种人脸检测方法及装置，属于图像识别技术领域。该方法包括：获取原始图像中人脸校正候选区域的位置响应特征图；对位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量；基于区域特征向量，输出原始图像中最终包含人脸的区域。由于为位置响应特征图中不同方格类型引入了不同人脸部位的权重，从而能够减少复杂场景下外在条件对对检测结果的影响。因此，人脸检测的准确率较高，且提高了人脸检测的适用性。

1.一种人脸检测方法，其特征在于，所述方法包括：步骤1，获取原始图像中人脸校正候选区域的位置响应特征图，所述位置响应特征图中不同区域对应人脸的不同部位；

步骤2，对所述位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；

步骤3，按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；

步骤4，基于每一方格对应的特征向量及权重，计算所述人脸校正候选区域对应的区域特征向量，所述区域特征向量与所述特征向量的长度一致；

步骤5，基于所述区域特征向量，输出所述原始图像中最终包含人脸的区域；

所述步骤1，包括：

提取所述原始图像对应的特征图；

根据所述特征图，确定所述原始图像中的人脸校正候选区域；

将所述人脸校正候选区域对应在所述特征图中的分块区域，经过深度神经网络模型中第三层全卷积神经网络，获取所述人脸校正候选区域的位置响应特征图。

2.根据权利要求1所述的方法，其特征在于，所述根据所述特征图，确定所述原始图像中的人脸校正候选区域，包括：将所述特征图划分为相应数量的分块区域；

基于所述原始图像与所述特征图之间的映射关系，对于每一分块区域，将每一分块区域映射至所述原始图像，并将映射得到的正方形区域作为每一分块区域对应的候选区域，分块区域与候选区域的数量一致；

基于每一候选区域，确定所述原始图像中的人脸校正候选区域。

3.根据权利要求2所述的方法，其特征在于，所述基于每一候选区域，确定所述原始图像中的人脸校正候选区域，包括：对于任一候选区域，计算所述任一候选区域中包含人脸的第一置信度；

当所述第一置信度大于第一预设阈值时，将所述任一候选区域作为人脸候选区域，对所述人脸候选区域进行校正，得到相应的人脸校正候选区域。

4.根据权利要求3所述的方法，其特征在于，所述对所述人脸候选区域进行校正，得到相应的人脸校正候选区域，包括：计算所述人脸候选区域进行校正时的平移量及缩放变化量，并作为第一校正向量；

根据所述第一校正向量，校正所述人脸候选区域，得到相应的人脸校正候选区域。

5.根据权利要求1所述的方法，其特征在于，所述步骤2中按照每一方格所处的位置，区分所有方格的方格类型，包括：对于所述位置响应特征图中划分后的所有方格，将位于中间部位的方格作为中心方格，将与中心方格直接相邻的方格作为次中心方格，将剩下的方格作为边缘方格。

6.根据权利要求1所述的方法，其特征在于，所述步骤4，包括：基于每种方格类型下每一方格对应的特征向量，计算每种方格类型对应的平均特征向量；

根据每种方格类型对应的权重及平均特征向量，计算所述人脸校正候选区域对应的区域特征向量。

7.根据权利要求1所述的方法，其特征在于，所述步骤5，包括：根据所述区域特征向量，计算所述人脸校正候选区域中包含人脸的第二置信度；

当所述第二置信度大于第二预设阈值时，对所述人脸校正候选区域作进一步校正；

输出最终的校正结果，并作为所述原始图像中包含人脸的区域。

8.根据权利要求7所述的方法，其特征在于，所述对所述人脸校正候选区域作进一步校正，包括：获取所述人脸校正候选区域进行校正时的平移量及缩放变化量，并作为第二校正向量；

根据所述第二校正向量，进一步校正所述人脸校正候选区域。

9.一种人脸检测装置，其特征在于，所述装置包括：获取模块，用于获取原始图像中人脸校正候选区域的位置响应特征图，所述位置响应特征图中不同区域对应人脸的不同部位；

划分模块，用于对所述位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；

确定模块，用于按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；

计算模块，用于基于每一方格对应的特征向量及权重，计算所述人脸校正候选区域对应的区域特征向量，所述区域特征向量与所述特征向量的长度一致；

输出模块，用于基于所述区域特征向量，输出所述原始图像中最终包含人脸的区域；

获取模块，包括：

提取单元，用于提取原始图像对应的特征图；

确定单元，用于根据特征图，确定原始图像中的人脸校正候选区域；

获取单元，用于将所述人脸校正候选区域对应在所述特征图中的分块区域，经过深度神经网络模型中第三层全卷积神经网络，获取所述人脸校正候选区域的位置响应特征图。

人脸检测方法及装置

技术领域

[0001] 本发明涉及图像识别技术领域，更具体地，涉及一种人脸检测方法及装置。

背景技术

[0002] 近年来，人脸检测技术已经广泛应用到了身份辨认、账户注册、金融支付及安全防控等诸多领域。人脸检测技术，即检测出一张图片或一段视频中人脸的位置。现有的人脸检测方法主要是基于Haar特征和Adaboost分类器进行人脸检测，即先确定原始图像中的人脸候选区域，在人脸候选区域中计算若干个矩形特征，训练出与这些矩形特征对应的弱分类器。接着，让每一候选区域逐级通过弱分类器，如果置信度低于阈值，则不再进行下一步判断并将该候选区域作为非人脸区域。反之，通过所有弱分类器的候选区域会被作为人脸区域。其中，原始图像为包含人脸的待检测图像。

[0003] 在实现本发明的过程中，发现现有技术至少存在以下问题：由于于Haar特征表征能力较弱，而人脸检测的应用场景逐渐趋于复杂多变，基于Haar特征的人脸检测过程并不能满足复杂场景的应用需求，从而在复杂应用场景下人脸检测的准确率较低。

发明内容

[0004] 本发明提供一种克服上述问题或者至少部分地解决上述问题的人脸检测方法及装置。

[0005] 根据本发明的一方面，提供了一种人脸检测方法，该方法包括：

[0006] 获取原始图像中人脸校正候选区域的位置响应特征图，位置响应特征图中不同区域对应人脸的不同部位；

[0007] 对位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；

[0008] 按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；

[0009] 基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量，区域特征向量与特征向量的长度一致；

[0010] 基于区域特征向量，输出原始图像中最终包含人脸的区域。

[0011] 根据本发明的另一方面，提供了一种人脸检测装置，该装置包括：

[0012] 获取模块，用于获取原始图像中人脸校正候选区域的位置响应特征图，位置响应特征图中不同区域对应人脸的不同部位；

[0013] 划分模块，用于对位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；

[0014] 确定模块，用于按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；

[0015] 计算模块，用于基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量，区域特征向量与特征向量的长度一致；

[0016] 输出模块，用于基于区域特征向量，输出原始图像中最终包含人脸的区域。

[0017] 本申请提出的技术方案带来的有益效果是：

[0018] 通过获取原始图像中人脸校正候选区域的位置响应特征图，对位置响应特征图进行划分，得到相应数量的方格。按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重。基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量。基于区域特征向量，输出原始图像中最终包含人脸的区域。由于为位置响应特征图中不同方格类型引入了不同人脸部位的权重，权重大的人脸部位对人脸检测结果影响较大，权重小的人脸部位对检测结果影响较小，从而在计算区域特征向量时，能够减少复杂场景下外在条件对计算结果的影响，进而减少了对检测结果的影响。因此，在复杂应用场景下人脸检测的过程具有更强的表征能力，人脸检测的准确率较高，且提高了人脸检测的适用性。

附图说明

[0019] 图1为本发明实施例的一种人脸检测方法的流程示意图；

[0020] 图2为本发明实施例的一种人脸检测方法的流程示意图；

[0021] 图3为本发明实施例的一种人脸检测装置的流程示意图。

具体实施方式

[0022] 下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

[0023] 近年来，以人脸检测为代表的生物特征检测识别已经广泛应用到了身份辨认、账户注册、金融支付及安全防控等诸多领域。人脸检测识别的应用场景也逐渐从主动配合式场景逐渐向开放式场景发展。其中，开放式场景主要指的是更加复杂多变的应用场景，如光照、姿态、尺度、表情或遮挡物的变化。相应地，这对人脸检测技术提出了更高的要求。

[0024] 人脸检测技术主要指的是检测出一张图片或一段视频中人脸的位置。现有的人脸检测方法主要依赖尺度、位置变化的检测窗口产生人脸候选区域，即提取人工设计的特征训练分类器，判断候选区域是否为人脸。其中，最具代表性的是基于Haar特征和Adaboost分类器的人脸检测方法。该方法在候选区域中计算若干个矩形特征，训练出与这些矩形特征对应的弱分类器。每一个候选区域逐级通过弱分类器，如果置信度低于阈值，则不再进行下一步判断。反之，通过所有弱分类器的候选区域会被作为人脸区域。这种人脸检测方法可基本满足简单的实时应用，但对于复杂多变的应用场景，由于Haar特征表征能力较弱，从而不能满足此类场景的应用需求。因此，人脸检测的适用性较差。

[0025] 针对现有技术中的问题，本发明实施例提供了一种人脸检测方法。由于本实施例及后续实施例涉及到提取特征图、计算置信度等过程，从而在执行本实施例及后续实施例之前，还可训练得到人脸检测的深度神经网络模型。本实施例不对训练得到深度神经网络模型的方式作具体限定，包括但不限于：收集网络中图片和视频中人脸图像，并标定人脸的位置作为人脸训练图像；利用大规模物体检测及分类数据集，对提取特征的深度神经网络进行预训练；根据收集得到的人脸训练图像，对进行预训练后的深度神经网络进行再训练，得到人脸检测的深度神经网络模型。

[0026] 基于训练得到的深度神经网络模型，参见图1，该方法包括：101、获取原始图像中人脸校正候选区域的位置响应特征图；102、对位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；103、按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；104、基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量；105、基于区域特征向量，输出原始图像中最终包含人脸的区域。

[0027] 其中，位置响应特征图中不同区域对应人脸的不同部位。如果人脸校正候选区域中包含人脸，则位置响应特征图对应区域的特征值也就越大，特征响应越突出。另外，区域特征向量与特征向量的长度一致。

[0028] 本发明实施例提供的方法，通过获取原始图像中人脸校正候选区域的位置响应特征图，对位置响应特征图进行划分，得到相应数量的方格。按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重。基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量。基于区域特征向量，输出原始图像中最终包含人脸的区域。由于为位置响应特征图中不同方格类型引入了不同人脸部位的权重，权重大的人脸部位对人脸检测结果影响较大，权重小的人脸部位对检测结果影响较小，从而在计算区域特征向量时，能够减少复杂场景下外在条件对计算结果的影响，进而减少了对检测结果的影响。因此，在复杂应用场景下人脸检测的过程具有更强的表征能力，人脸检测的准确率较高，且提高了人脸检测的适用性。

[0029] 作为一种可选实施例，获取原始图像中人脸校正候选区域的位置响应特征图，包括：

[0030] 提取原始图像对应的特征图；

[0031] 根据特征图，确定原始图像中的人脸校正候选区域；

[0032] 基于特征图及人脸校正候选区域，获取人脸校正候选区域的位置响应特征图。

[0033] 作为一种可选实施例，根据特征图，确定原始图像中的人脸校正候选区域，包括：

[0034] 将特征图划分为相应数量的分块区域；

[0035] 基于原始图像与特征图之间的映射关系，对于每一分块区域，将每一分块区域映射至原始图像，并将映射得到的正方形区域作为每一分块区域对应的候选区域，分块区域与候选区域的数量一致；

[0036] 基于每一候选区域，确定原始图像中的人脸校正候选区域。

[0037] 作为一种可选实施例，基于每一候选区域，确定原始图像中的人脸校正候选区域，包括：

[0038] 对于任一候选区域，计算任一候选区域中包含人脸的第一置信度；

[0039] 当第一置信度大于第一预设阈值时，将任一候选区域作为人脸候选区域，对人脸候选区域进行校正，得到相应的人脸校正候选区域。

[0040] 作为一种可选实施例，对人脸候选区域进行校正，得到相应的人脸校正候选区域，包括：

[0041] 计算人脸候选区域进行校正时的平移量及缩放变化量，并作为第一校正向量；

[0042] 根据第一校正向量，校正人脸候选区域，得到相应的人脸校正候选区域。

[0043] 作为一种可选实施例，按照每一方格所处的位置，区分所有方格的方格类型，包括：

[0044] 对于位置响应特征图中划分后的所有方格，将位于中间部位的方格作为中心方格，将与中心方格直接相邻的方格作为次中心方格，将剩下的方格作为边缘方格。

[0045] 作为一种可选实施例，基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量，包括：

[0046] 基于每种方格类型下每一方格对应的特征向量，计算每种方格类型对应的平均特征向量；

[0047] 根据每种方格类型对应的权重及平均特征向量，计算人脸校正候选区域对应的区域特征向量。

[0048] 作为一种可选实施例，基于区域特征向量，输出原始图像中最终包含人脸的区域，包括：

[0049] 根据区域特征向量，计算人脸校正候选区域中包含人脸的第二置信度；

[0050] 当第二置信度大于第二预设阈值时，对人脸校正候选区域作进一步校正；

[0051] 输出最终的校正结果，并作为原始图像中包含人脸的区域。

[0052] 作为一种可选实施例，对人脸校正候选区域作进一步校正，包括：

[0053] 获取人脸校正候选区域进行校正时的平移量及缩放变化量，并作为第二校正向量；

[0054] 根据第二校正向量，进一步校正人脸校正候选区域。

[0055] 上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

[0056] 基于上述图1对应实施例所提供的深度神经网络模型，本发明实施例提供了一种人脸检测方法。参见图2，该方法包括：201、获取原始图像中人脸校正候选区域的位置响应特征图；202、对位置响应特征图进行划分，得到相应数量的方格；203、按照每一方格所处的位置，区分所有方格的方格类型；204、按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；205、基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量；206、基于区域特征向量，输出原始图像中最终包含人脸的区域。

[0057] 其中，201、获取原始图像中人脸校正候选区域的位置响应特征图。

[0058] 在本步骤中，位置响应特征图中不同区域对应人脸的不同部位。如果人脸校正候选区域中包含人脸，则位置响应特征图对应区域的特征值也就越大，即特征响应越突出。反之，则位置响应特征图对应区域的特征值也就越小，即特征响应越不明显。

[0059] 本实施例不对获取原始图像中人脸校正候选区域的位置响应特征图的方式作具体限定，包括但不限于：提取原始图像对应的特征图；根据特征图，确定原始图像中的人脸校正候选区域；基于特征图及人脸校正候选区域，获取人脸校正候选区域的位置响应特征图。

[0060] 在提取原始图像对应的特征图时，可将原始图像经过深度神经网络模型中第一层全卷积神经网络，从而提取到对应的特征图。具体地，通过第一层全卷积神经网络对应的卷积核，在对原始图像中每一像素点值进行卷积运算后，可得到对应的特征图。由于在将原始图像转化为特征图后，特征图相比于原始图像的尺寸大大较小，从而极大地降低了计算复杂度。因此，提高了后续人脸检测的效率。

[0061] 在得到特征图后，可确定原始图像中的人脸校正候选区域。本实施例不对根据特征图，确定原始图像中的人脸校正候选区域的方式作具体限定，包括但不限于：将特征图划分为相应数量的分块区域；基于原始图像与特征图之间的映射关系，对于每一分块区域，将每一分块区域映射至原始图像，并将映射得到的正方形区域作为每一分块区域对应的候选区域，分块区域与候选区域的数量一致；基于每一候选区域，确定原始图像中的人脸校正候选区域。

[0062] 在将特征图划分为相应数量的分块区域时，分块区域可以为正方形。在通过第一层全卷积神经网络从原始图像中提取特征图时，原始图像与特征图之间相应像素点存在一定的映射关系。基于这种映射关系，对于任一分块区域，可将任一分块区域的中心作为映射中心，将任一分块区域映射至原始图像，从而得到对应的候选区域。其中，候选区域为正方形区域。

[0063] 在得到候选区域后，可先确定原始图像中的人脸候选区域。本实施例不对确定原始图像中的人脸候选区域的方式作具体限定，包括但不限于：对于任一候选区域，计算任一候选区域中包含人脸的第一置信度；当第一置信度大于第一预设阈值时，将任一候选区域作为人脸候选区域。

[0064] 其中，第一置信度中的“第一”只是为了区后续过程中其它计算得到的置信度，并不带有任何限定含义。在计算候选区域中包含人脸的第一置信度时，可通过深度神经网络模型中第二层全卷积神经网络的一个分支进行计算，本实施例对此不作具体限定。在计算得到每一候选区域的第一置信度后，对于第一置信度大于第一预设阈值的候选区域，可将该类候选区域作为人脸候选区域。对于第一置信度小于第一预设阈值的候选区域，可不再对这类候选区域作后续处理。

[0065] 考虑到相对于原始图像中的真实人脸区域，通过上述过程得到的人脸候选区域可能还不够对齐，从而在得到人脸候选区域后，还可对人脸候选区域进行校正。关于对人脸候选区域进行校正的方式，本实施例对此不作具体限定，包括但不限于：计算人脸候选区域进行校正时的平移量及缩放变化量，并作为第一校正向量；根据第一校正向量，校正人脸候选区域，得到相应的人脸校正候选区域。

[0066] 其中，第一校正向量中的“第一”同第一置信度中的“第一”，主要是为了区分后续计算得到的校正向量。在计算第一校正向量时，可通过深度神经网络模型中第二层全卷积神经网络的另一个分支进行计算，本实施例对此不作具体限定。

[0067] 在得到人脸校正候选区域后，由于人脸校正候选区域相对于校正前的人脸候选区域进行了平移及缩放，为了进一步地保证人脸检测的准确率，可再次计算人脸校正候选区域中包含人脸的置信度，从而筛选掉置信度小于第一预设阈值的人脸校正候选区域，本实施例对此不作具体限定。

[0068] 在确定原始图像中人脸校正候选区域后，可基于特征图及人脸校正候选区域，获取人脸校正候选区域的位置响应特征图。在获取人脸校正候选区域的位置响应特征图时，可将人脸校正候选区域对应在特征图中的分块区域，经过深度神经网络模型中第三层全卷积神经网络，从而得到相应的位置响应特征图。

[0069] 其中，202、对位置响应特征图进行划分，得到相应数量的方格。

[0070] 在执行本步骤时，可按照预设行列数对对位置响应特征图进行划分，本实施例对此不作具体限定。例如，可按照6*6或8*8的方式将位置响应特征图划分为一个个方格。

[0071] 其中，203、按照每一方格所处的位置，区分所有方格的方格类型。

[0072] 本实施例不对按照每一方格所处的位置，区分所有方格的方格类型的方式作具体限定，包括但不限于：对于位置响应特征图中划分后的所有方格，将位于中间部位的方格作为中心方格，将与中心方格直接相邻的方格作为次中心方格，将剩下的方格作为边缘方格。

[0073] 其中，中心方格对应人脸中的眼睛、鼻子等中心部位，中心方格对于人脸检测的贡献程度最大。次中心方格对应人脸中的嘴唇、额头、颧骨等部位，对于人脸检测的贡献程度次之。边缘方格对应人脸的脸部边界，且可能会引入其它的噪声信息，从而其对于人脸检测的贡献程度最小。

[0074] 例如，以将位置响应特征图划分为6*6的方格为例。正中间2*2的4个方格可作为中心方格，与正中间2*2的方格直接相邻的8个方格可作为次中心方格，剩下的24个方格可均作为边缘方格。

[0075] 其中，204、按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重。

[0076] 基于上述步骤203中的内容可知，不同方格类型对应人脸检测的贡献程度不同，从而在本步骤中可根据每种方格类型对应人脸检测贡献程度的大小，确定每种方格类型对应的权重。其中，每种方格类型对应权重的累加和为1。

[0077] 其中，205、基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量。

[0078] 本实施例不对基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量的方式作具体限定，包括但不限于：基于每种方格类型下每一方格对应的特征向量，计算每种方格类型对应的平均特征向量；根据每种方格类型对应的权重及平均特征向量，计算人脸校正候选区域对应的区域特征向量。

[0079] 例如，以将位置响应特征图划分为6*6的方格为例。对于正中间2*2的4个方格，可累加每一方格的特征向量，将累加和除以4可以得到中心方格对应的平均特征向量。同理，可分别计算得到次中心方格及边缘方格对应的平均特征向量。

[0080] 对于每种方格类型对应的权重及平均特征向量，可将两者相乘，从而可得到每种方格类型对应的乘积。将每种方格类型对应的乘积进行叠加，可得到人脸校正候选区域的区域特征向量。

[0081] 其中，206、基于区域特征向量，输出原始图像中最终包含人脸的区域。

[0082] 本实施例不对基于区域特征向量，输出原始图像中最终包含人脸的区域的方式作具体限定，包括但不限于：根据区域特征向量，计算人脸校正候选区域中包含人脸的第二置信度；当第二置信度大于第二预设阈值时，对人脸校正候选区域作进一步校正；输出最终的校正结果，并作为原始图像中包含人脸的区域。

[0083] 其中，第二置信度及第二预设阈值中的“第二”只是为了区分前面步骤中的第一置信度及第一预设阈值。第一预设阈值与第二预设阈值可以相同，也可以不同，本实施例对此不作具体限定。在计算人脸校正候选区域中包含人脸的第二置信度时，可基于区域特征向量训练softmax分类器，从而通过训练得到的softmax分类器，得到人脸校正候选区域中包含人脸的第二置信度。其中，分类器除了softmax分类器之外，还可以采用其它的分类器，本实施例对此不作具体限定。

[0084] 关于对人脸校正候选区域作进一步校正的方式，本实施例对此不作具体限定，包括但不限于：获取人脸校正候选区域进行校正时的平移量及缩放变化量，并作为第二校正向量；根据第二校正向量，进一步校正人脸校正候选区域。

[0085] 其中，可将区域特征向量经过深度神经网络模型中第四层全卷积神经网络，从而得到人脸校正候选区域的第二校正向量。通过进一步校正置信度大于预设阈值的人脸校正候选区域，可使得最终得到的人脸区域窗口更加准确。

[0086] 本发明实施例提供的方法，通过获取原始图像中人脸校正候选区域的位置响应特征图，对位置响应特征图进行划分，得到相应数量的方格。按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重。基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量。基于区域特征向量，输出原始图像中最终包含人脸的区域。由于为位置响应特征图中不同方格类型引入了不同人脸部位的权重，权重大的人脸部位对人脸检测结果影响较大，权重小的人脸部位对检测结果影响较小，从而在计算区域特征向量时，能够减少复杂场景下外在条件对计算结果的影响，进而减少了对检测结果的影响。因此，在复杂应用场景下人脸检测的过程具有更强的表征能力，人脸检测的准确率较高，且提高了人脸检测的适用性。

[0087] 其次，由于是以特征图为基础产生候选区域，而特征图相比于原图尺寸大大减小，从而候选区域的个数也大大减小，进而减少了后续的计算复杂度。因此，提高了人脸检测的效率。

[0088] 另外，由于深度神经网络模型采用了全卷积神经网络，大大压缩了模型的体积，从而降低了硬件的要求。

[0089] 最后，由于在进行人脸检测时，通过置信度与预设阈值的比对过程，筛选掉了包含人脸可能性低的候选区域，从而提高了人脸检测的准确率。在筛选出置信度高的候选区域后，还对候选区域进行了校正，从而保证检测得到的人脸区域窗口更加准确。

[0090] 基于上述图1或图2对应实施例所提供的人脸检测方法，本发明实施例提供了一种人脸检测装置。参见图3，该装置包括：

[0091] 获取模块301，用于获取原始图像中人脸校正候选区域的位置响应特征图，位置响应特征图中不同区域对应人脸的不同部位；

[0092] 划分模块302，用于对位置响应特征图进行划分，得到相应数量的方格，并按照每一方格所处的位置，区分所有方格的方格类型；

[0093] 确定模块303，用于按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重；

[0094] 计算模块304，用于基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量，区域特征向量与特征向量的长度一致；

[0095] 输出模块305，用于基于区域特征向量，输出原始图像中最终包含人脸的区域。

[0096] 作为一种可选实施例，获取模块301，包括：

[0097] 提取单元，用于提取原始图像对应的特征图；

[0098] 确定单元，用于根据特征图，确定原始图像中的人脸校正候选区域；

[0099] 获取单元，用于基于特征图及人脸校正候选区域，获取人脸校正候选区域的位置响应特征图。

[0100] 作为一种可选实施例，确定单元，包括：

[0101] 划分子单元，用于将特征图划分为相应数量的分块区域；

[0102] 映射子单元，用户与基于原始图像与特征图之间的映射关系，对于每一分块区域，将每一分块区域映射至原始图像，并将映射得到的正方形区域作为每一分块区域对应的候选区域，分块区域与候选区域的数量一致；

[0103] 确定子单元，用于基于每一候选区域，确定原始图像中的人脸校正候选区域。

[0104] 作为一种可选实施例，确定子单元，用于对于任一候选区域，计算任一候选区域中包含人脸的第一置信度；当第一置信度大于第一预设阈值时，将任一候选区域作为人脸候选区域，对人脸候选区域进行校正，得到相应的人脸校正候选区域。

[0105] 作为一种可选实施例，确定子单元，用于计算人脸候选区域进行校正时的平移量及缩放变化量，并作为第一校正向量；根据第一校正向量，校正人脸候选区域，得到相应的人脸校正候选区域。

[0106] 作为一种可选实施例，划分模块302，用于对于位置响应特征图中划分后的所有方格，将位于中间部位的方格作为中心方格，将与中心方格直接相邻的方格作为次中心方格，将剩下的方格作为边缘方格。

[0107] 作为一种可选实施例，计算模块304，用于基于每种方格类型下每一方格对应的特征向量，计算每种方格类型对应的平均特征向量；根据每种方格类型对应的权重及平均特征向量，计算人脸校正候选区域对应的区域特征向量。

[0108] 作为一种可选实施例，输出模块305，包括：

[0109] 计算单元，用于根据区域特征向量，计算人脸校正候选区域中包含人脸的第二置信度；

[0110] 校正单元，用于当第二置信度大于第二预设阈值时，对人脸校正候选区域作进一步校正；

[0111] 输出单元，用于输出最终的校正结果，并作为原始图像中包含人脸的区域。

[0112] 作为一种可选实施例，校正单元，用于获取人脸校正候选区域进行校正时的平移量及缩放变化量，并作为第二校正向量；根据第二校正向量，进一步校正人脸校正候选区域。

[0113] 本发明实施例提供的装置，通过获取原始图像中人脸校正候选区域的位置响应特征图，对位置响应特征图进行划分，得到相应数量的方格。按照每种方格类型对应的人脸检测贡献程度，确定每种方格类型对应的权重。基于每一方格对应的特征向量及权重，计算人脸校正候选区域对应的区域特征向量。基于区域特征向量，输出原始图像中最终包含人脸的区域。由于为位置响应特征图中不同方格类型引入了不同人脸部位的权重，权重大的人脸部位对人脸检测结果影响较大，权重小的人脸部位对检测结果影响较小，从而在计算区域特征向量时，能够减少复杂场景下外在条件对计算结果的影响，进而减少了对检测结果的影响。因此，在复杂应用场景下人脸检测的过程具有更强的表征能力，人脸检测的准确率较高，且提高了人脸检测的适用性。

[0114] 其次，由于是以特征图为基础产生候选区域，而特征图相比于原图尺寸大大减小，从而候选区域的个数也大大减小，进而减少了后续的计算复杂度。因此，提高了人脸检测的效率。

[0115] 另外，由于深度神经网络模型采用了全卷积神经网络，大大压缩了模型的体积，从而降低了硬件的要求。

[0116] 最后，由于在进行人脸检测时，通过置信度与预设阈值的比对过程，筛选掉了包含人脸可能性低的候选区域，从而提高了人脸检测的准确率。在筛选出置信度高的候选区域后，还对候选区域进行了校正，从而保证检测得到的人脸区域窗口更加准确。

[0117] 最后，本申请的方法仅为较佳的实施方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

人脸检测方法及装置转让专利

申请号 : CN201710079126.6

文献号 : CN106951826B

文献日 : 2019-09-20

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 王生进 , 舒晗

申请人 : 清华大学

摘要 :

权利要求 :

说明书 :