基于人脸识别和语音识别的考勤系统转让专利

申请号 : CN201710151379.X

文献号 : CN106940904B

文献日 : 2019-02-19

本发明提供了基于人脸识别和语音识别的考勤系统，包括人脸图像识别处理模块、语音识别处理模块和考勤模块，所述人脸图像识别处理模块用于获取人脸图像，并对人脸图像进行处理识别，输出人脸图像识别结果；所述语音识别处理模块用于对录入语音并对语音进行处理识别，输出语音识别结果；所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时，将考勤时间录入设定的考勤数据库。本发明采用基于语音和人脸图像的识别的方式进行考勤，对主体身份识别的真实性高，安全性好，考勤更精确。

1.基于人脸识别和语音识别的考勤系统，其特征是，包括人脸图像识别处理模块、语音识别处理模块和考勤模块，所述人脸图像识别处理模块用于获取人脸图像，并对人脸图像进行处理识别，输出人脸图像识别结果；所述语音识别处理模块用于对录入语音并对语音进行处理识别，输出语音识别结果；所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时，将考勤时间录入设定的考勤数据库；所述人脸图像识别处理模块包括依次连接的人脸图像采集单元、人脸图像过滤单元、人脸图像预处理单元、人脸图像后处理单元、人脸图像识别单元；所述人脸图像采集单元用于获取多张人脸图像；所述人脸图像过滤单元用于多张人脸图像中筛选有效的人脸图像，对其余的人脸图像进行过滤；所述人脸图像预处理单元用于对筛选出的人脸图像进行初步预处理，去除人脸图像的随机噪声；所述人脸图像后处理单元用于对人脸图像进行分割处理，获取人脸图像的人脸特征；所述人脸图像识别单元用于对人脸图像的人脸特征进行识别；所述人脸图像过滤单元在筛选人脸图像时按照自定义的图像筛选函数进行筛选，选取图像筛选函数的值最大的人脸图像作为优选人脸图像，对剩余的人脸图像进行删除，其中自定义的图像筛选函数为：式中，W表示自定义的图像筛选函数，ζi为第i张人脸图像的设定区域的平均灰度值，ζ为根据实际情况设定的灰度值阈值，ηi为第i张人脸图像的边缘锐度，η为根据实际情况设定的边缘锐度阈值，为人脸图像的数量。

2.根据权利要求1所述的基于人脸识别和语音识别的考勤系统，其特征是，还包括考勤结果显示模块，该考勤结果显示模块在人脸图像识别结果和语音识别结果皆为已经识别时，通过显示屏显示考勤成功，在人脸图像识别结果或语音识别结果为识别失败时通过显示屏显示考勤失败。

3.根据权利要求2所述的基于人脸识别和语音识别的考勤系统，其特征是，所述语音识别处理模块对语音进行处理识别，包括：对录入语音进行降噪处理，将降噪后的录入语音与语音数据库的语音样本进行一一比对，根据降噪后的录入语音和语音数据库的语音样本的距离判断，若该距离小于设定的阈值，则输出语音识别结果为已经识别，否则输出语音识别结果为识别失败。

4.根据权利要求1所述的基于人脸识别和语音识别的考勤系统，其特征是，所述对人脸图像进行分割处理，包括：

(1)采用OTSU算法对人脸图像进行全局分割阈值估计，得到优选全局分割阈值；

(2)将整个人脸图像划分为大小相同的多个子图像；

(3)采用OTSU算法对子图像进行局部分割阈值估计，获得各子图像的优选局部分割阈

值；

(4)对不同位置的子图像使用不同的分割阈值进行分割，定义子图像的分割阈值的计

算公式为：

式中，H为优选全局分割阈值，Hij′为第i行第j列的子图像的优选局部分割阈值，ρ表示整个人脸图像的灰度方差，ρij表示第i行第j列的子图像的灰度方差，δij表示第i行第j列的子图像的灰度均值，δ表示整个人脸图像的灰度均值，min(λ1H,λ2Hij′)表示从λ1H、λ2Hij′中选择最小值，λ1、λ2为设定的权重因子，λ1+λ2＝1；λk表示λ1H、λ2Hij′所对应的权重因子，当λ1H的值为最小时λk＝λ1，当λ2Hij′最小时λk＝λ2。

基于人脸识别和语音识别的考勤系统

技术领域

[0001] 本发明涉及人脸检测技术领域，具体涉及基于人脸识别和语音识别的考勤系统。

背景技术

[0002] 相关技术中的考勤系统通过指纹进行识别考勤，当指纹受损时，会直接影响考勤结果，另外，指纹容易被伪造，对主体身份的识别的真实性差。

[0003] 相关技术中，采用对人脸特征进行识别处理的方式获取人脸图像信息。对人脸图像进行增强处理，可以突显边缘和细节信息，同时抑制噪声，改善人脸图像的视觉效果。目前，小波变换在图像增强方面取得一定的效果，但小波变换不能“最优”表示含“线”或“面”奇异的高维函数。Contourlet变换是一种真正的二维图像表示方法，该变换是一种多分辨的、局域的、多方向的图像表示方法。该变换将多尺度分析与方向分析分开进行，可较好地表达细小有方向的轮廓和线段，能很好地用于图像增强处理。然而，Contourlet变换存在下采样，其并不存在平移不变性，在处理后的图像中会产生伪影现象。NSCT(Nonsubsampled Contourlet transform，非下采样Contourlet变换)是Contourlet变换的一种改进方式，该变换取消了Contourlet变换中的下采样环节，其具有多尺度，多方向、局域性及平移不变性等特点而适合于图像增强技术中。

[0004] 在图像分割处理方面，已经有了很多种非常好的分割方法，例如直方图阈值分割方法，迭代法阈值分割和OTSU算法(最大类间方差法)，这些阈值分割方法都能得到非常好的分割效果，其中OTSU算法能自动算出输入图像的阈值，再与输入图像中的每一个像素点进行比对，最后能分割出输入图像中的目标部分和背景部分，其运算速度比较快。

发明内容

[0005] 针对上述问题，本发明旨在提供基于人脸识别和语音识别的考勤系统。

[0006] 本发明的目的采用以下技术方案来实现：

[0007] 基于人脸识别和语音识别的考勤系统，包括人脸图像识别处理模块、语音识别处理模块和考勤模块，所述人脸图像识别处理模块用于获取人脸图像，并对人脸图像进行处理识别，输出人脸图像识别结果；所述语音识别处理模块用于对录入语音并对语音进行处理识别，输出语音识别结果；所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时，将考勤时间录入设定的考勤数据库。

[0008] 本发明的有益效果为：采用基于语音和人脸图像的识别的方式进行考勤，对主体身份识别的真实性高，安全性好，考勤更精确。

附图说明

[0009] 利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

[0010] 图1本发明的框架结构图；

[0011] 图2是本发明人脸图像识别处理模块的框架结构图。

[0012] 附图标记：

[0013] 人脸图像识别处理模块1、语音识别处理模块2、考勤模块3、考勤结果显示模块4、人脸图像采集单元10、人脸图像过滤单元11、人脸图像预处理单元12、人脸图像后处理单元13、人脸图像识别单元14。

具体实施方式

[0014] 结合以下应用场景对本发明作进一步描述。

[0015] 参见图1，本实施例的基于人脸识别和语音识别的考勤系统，包括人脸图像识别处理模块1、语音识别处理模块2和考勤模块3，所述人脸图像识别处理模块1用于获取人脸图像，并对人脸图像进行处理识别，输出人脸图像识别结果；所述语音识别处理模块2用于对录入语音并对语音进行处理识别，输出语音识别结果；所述考勤模块3用于在人脸图像识别结果和语音识别结果皆为已经识别时，将考勤时间录入设定的考勤数据库。

[0016] 进一步地，所述基于人脸识别和语音识别的考勤系统还包括考勤结果显示模块4，该考勤结果显示模块4在人脸图像识别结果和语音识别结果皆为已经识别时，通过显示屏显示考勤成功，在人脸图像识别结果或语音识别结果为识别失败时通过显示屏显示考勤失败。

[0017] 优选地，所述语音识别处理模块2对语音进行处理识别，包括：对录入语音进行降噪处理，将降噪后的录入语音与语音数据库的语音样本进行一一比对，根据降噪后的录入语音和语音数据库的语音样本的距离判断，若该距离小于设定的阈值，则输出语音识别结果为已经识别，否则输出语音识别结果为识别失败。

[0018] 优选地，参见图2，所述人脸图像识别处理模块1包括依次连接的人脸图像采集单元10、人脸图像过滤单元11、人脸图像预处理单元12、人脸图像后处理单元13、人脸图像识别单元14；所述人脸图像采集单元10用于获取多张人脸图像；所述人脸图像过滤单元11用于多张人脸图像中筛选有效的人脸图像，对其余的人脸图像进行过滤；所述人脸图像预处理单元12用于对筛选出的人脸图像进行初步预处理，去除人脸图像的随机噪声；所述人脸图像后处理单元13用于对人脸图像进行分割处理，获取人脸图像的人脸特征；所述人脸图像识别单元14用于对人脸图像的人脸特征进行识别。

[0019] 本发明上述实施例，采用基于语音和人脸图像的识别的方式进行考勤，对主体身份识别的真实性高，安全性好，考勤更精确。

[0020] 优选地，所述人脸图像过滤单元11在筛选人脸图像时按照自定义的图像筛选函数进行筛选，选取图像筛选函数的值最大的人脸图像作为优选人脸图像，对剩余的人脸图像进行删除，其中自定义的图像筛选函数为：

[0021]

[0022] 式中，W表示自定义的图像筛选函数，ζi为第i张人脸图像的设定区域的平均灰度值，ζ为根据实际情况设定的灰度值阈值，ηi为第i张人脸图像的边缘锐度，η为根据实际情况设定的边缘锐度阈值，为人脸图像的数量。

[0023] 本优选实施例，设置人脸图像过滤单元11，筛选出最优的人脸图像进行人脸图像识别检测，能够大大节约系统存储空间，提高人脸图像识别检测的速度和精度。

[0024] 优选地，所述去除人脸图像的随机噪声，包括：

[0025] (1)对筛选出的人脸图像进行NSCT变换(非下采样Contourlet变换)，得到该人脸图像的低频子带系数和高频子带系数；

[0026] (2)采用方向滤波器对分解后的高频子带系数进行处理，提高分解后的高频子带系数的稀疏性，再采用伪随机傅里叶矩阵对高频子带系数进行观测采样，得到观测值，对于观测值，采用交互分裂Bregman迭代方法进行重构，得到最优高频子带系数；

[0027] (3)将最优高频子带系数和所述低频子带系数一起进行图像重构，即得到滤波后的人脸图像。

[0028] 本优选实施例，采用上述方式对筛选出的人脸图像进行去噪，能够清晰全面的表示人脸图像的边缘信息以及其细节特征，从而实现有效的图像去噪，并最大限度的保留了人脸图像的细节信息。

[0029] 优选地，所述对人脸图像进行分割处理，包括：

[0030] (1)采用OTSU算法对人脸图像进行全局分割阈值估计，得到优选全局分割阈值；

[0031] (2)将整个人脸图像划分为大小相同的多个子图像；

[0032] (3)采用OTSU算法对子图像进行局部分割阈值估计，获得各子图像的优选局部分割阈值；

[0033] (4)对不同位置的子图像使用不同的分割阈值进行分割，定义子图像的分割阈值的计算公式为：

[0034]

[0035] 式中，H为优选全局分割阈值，Hij′为第i行第j列的子图像的优选局部分割阈值，ρ表示整个人脸图像的灰度方差，ρij表示第i行第j列的子图像的灰度方差，δij表示第i行第j列的子图像的灰度均值，δ表示整个人脸图像的灰度均值，min(λ1H,λ2Hij′)表示从λ1H、λ2Hij′中选择最小值，λ1、λ2为设定的权重因子，λ1+λ2＝1；λk表示λ1H、λ2Hij′所对应的权重因子，当λ1H的值为最小时λk＝λ1，当λ2Hij′最小时λk＝λ2。

[0036] 其中，所述对人脸图像进行全局分割阈值估计，具体为：获取人脸图像的灰度级，并根据所述灰度级确定灰度范围，在所述灰度范围中，选定人脸图像的初始分割阈值；遍历所述人脸图像中像素的灰度值，选取所述灰度值大于所述初始分割阈值的像素，作为前景图像，选取所述灰度值小于所述初始分割阈值的像素，作为背景图像，计算所述前景图像的灰度均值，所述前景图像的像素数占总像素数目的比例，所述背景图像的灰度均值、所述背景图像的像素数占总像素数目的比例和所述人脸图像的灰度均值；所述灰度范围内，增加所述人脸图像的分割阈值，使前景图像和背景图像的差异值达到最大，选取前景图像和背景图像的差异值达到最大时的分割阈值作为优选全局分割阈值。

[0037] 本优选实施例中，对图像进行分割时，对每个子图像采用不同的分割阈值进行分割，更加贴近实际情况，能够实现更好的分割效果，其中子图像的分割阈值由OSTU算法和子图像的灰度特点共同决定，考虑了图像局部灰度的变化，能够克服由光照不均、纹理干扰、人脸图像与背景灰度对比度弱等问题对人脸图像分割造成的影响，从而提高图像分割的精度，便于后续的人脸图像识别，使得考勤系统更加精确。

[0038] 最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

基于人脸识别和语音识别的考勤系统转让专利

申请号 : CN201710151379.X

文献号 : CN106940904B

文献日 : 2019-02-19

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 不公告发明人

申请人 : 网思科技股份有限公司

摘要 :

权利要求 :

说明书 :