基于单个图像传感器的人脸纹理结构数据采集方法转让专利

申请号 : CN201911407515.2

文献号 : CN111160278B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 侯宗庆李慧斌马可

申请人 : 陕西西图数联科技有限公司

摘要 :

本发明涉及一种基于单个图像传感器的人脸纹理结构数据采集方法,包括以下步骤:S1:获取图像数据和深度数据;S2:点云数据预处理,将三维数据处理成可应用的数据类型;S3:人脸检测与表情识别,裁切出人脸区域;S4:采集人员索引,输入采集人脸的个体标识;S5:根据不同的距离、人员、表情存储原始数据和裁切出的数据。本发明的数据采集方法能够解决采集人脸数据类型不完全,采集设备要求高、成本昂贵,采集环境要求高等问题,能够降低采集成本,同时可以在包括室外的开放环境的多种场景中方便使用,并能够保证多种采集数据类型的采集,避免数据缺失。

权利要求 :

1.基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:包括以下步骤:S1:获取图像数据和深度数据;

S2:点云数据预处理,将三维数据处理成可应用的数据类型,具体地:通过下述公式将三维点云数据P投影到像素坐标系上,得到投影后的深度图D和点云投影RGB数据I’;

公式中的u、v为像素坐标系中的坐标,x、y为世界坐标系中的坐标,u0、v0、dx和dy为相机内部参数,最后通过下述双线性差值公式补全投影后的数据D和I’;

公式中的x和y为图像坐标系坐标,f为坐标为(x,y)上的数据,深度图D上为原点云数据P的z轴信息,点云投影RGB数据I’包含的数据为点云附带的R、G、B三通道的像素值;

S3:人脸检测与表情识别,裁切出人脸区域,具体地:

将投影后的数据I’作为输入,通过全卷积网络N1生成人脸候选窗和对应的分数,将所有检出的人脸候选窗根据分数做降序排列得到一个降序的列表L,从列表L中开始,计算人脸候选窗与其他人脸候选窗的IoU,若IoU大于阈值T,则剔除该人脸候选窗,对剩余的人脸候选窗,重复上述迭代操作,直至列表L中所有人脸候选窗都完成筛选,再使用一个全卷积网络输出最终的人脸候选窗和5个关键点位置,得到数据I’上人脸的5个关键点的坐标((x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)以及(x5,y5))后,通过5个关键点坐标裁剪投影后的红外数据IR、RGB数据I’和深度数据D和出人脸数据IRf,If,Df,将If作为输入,通过一个全卷积网络N2得到输入数据If的人脸表情类型E;

S4:采集人员索引,输入采集人脸的个体标识;

S5:根据不同的距离、人员、表情存储原始数据和裁切出的数据。

2.如权利要求1所述基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:所述步骤S1具体为:通过采集设备获取附带颜色信息的三维点云数据P、红外图像数据IR以及RGB图像数据I。

3.如权利要求2所述基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:所述采集设备为结构光、TOF或双目等深度相机。

4.如权利要求1所述基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:所述全卷积网络N1为MTCNN结构的全卷积网络,全卷积网络N2为resnet50结构的全卷积网络。

5.如权利要求1所述基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:所述阈值=0.6。

6.如权利要求1所述基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:所述5个关键点位置分别为左眼中心点,右眼中心点,鼻尖点,左嘴角和右嘴角。

7.如权利要求1所述基于单个图像传感器的人脸纹理结构数据采集方法,其特征在于:步骤S5具体为:根据点云数据P的深度信息Z、采集人员索引ID以及人脸表情E,按ID/Z/E的规则生成对应的文件夹,在文件夹中存储采集到的原始数据P、I、R和裁切后的数据IRf,If,Df。

说明书 :

基于单个图像传感器的人脸纹理结构数据采集方法

技术领域

[0001] 本发明涉及图像处理技术领域,具体涉及基于单个图像传感器的人脸纹理结构数据采集方法。

背景技术

[0002] 现有的大部分人脸数据采集系统多用于采集图像纹理,被采集人员在固定场景通过图像传感器采集人脸数据,存在如下缺点:1、数据类型不完整,局限于三维或是二维单个数据类型。2、对采集设备、采集环境要求高,流程复杂,不适用与开放环境。这些方法如:基于图像传感器阵列的三维人脸数据采集系统(201511016389.X),人脸采集系统和人脸采集方法(201610096506.6),人脸图像采集系统及方法(201710600829.9)。

发明内容

[0003] 本发明的目的是为解决上述技术问题的不足,提供基于单个图像传感器的人脸纹理结构数据采集方法。
[0004] 本发明为解决上述技术问题的不足,所采用的技术方案是:基于单个图像传感器的人脸纹理结构数据采集方法,包括以下步骤:
[0005] S1:获取图像数据和深度数据;
[0006] S2:点云数据预处理,将三维数据处理成可应用的数据类型;
[0007] S3:人脸检测与表情识别,裁切出人脸区域;
[0008] S4:采集人员索引,输入采集人脸的个体标识;
[0009] S5:根据不同的距离、人员、表情存储原始数据和裁切出的数据。
[0010] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述步骤S1具体为:通过采集设备获取附带颜色信息的三维点云数据P、红外图像数据IR以及RGB图像数据I。
[0011] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述采集设备为结构光、TOF或双目等深度相机。
[0012] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述步骤S2具体为:通过下述公式将三维点云数据P投影到像素坐标系上,得到投影后的深度图D和点云投影RGB数据I’;
[0013] ;
[0014] 公式中的u、v为像素坐标系中的坐标,x、y为世界坐标系中的坐标,u0、v0、dx和dy为相机内部参数,最后通过下述双线性差值公式补全投影后的数据D和I’;
[0015] ;
[0016] 公式中的x和y为图像坐标系坐标,f为坐标为(x,y)上的数据,深度图D上为原点云数据P的z轴信息,点云投影RGB数据I’包含的数据为点云附带的R、G、B三通道的像素值。
[0017] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述步骤S3具体为:将投影后的数据I’作为输入,通过全卷积网络N1生成人脸候选窗和对应的分数,将所有检出的人脸候选窗根据分数做降序排列得到一个降序的列表L,从列表L中开始,计算人脸候选窗与其他人脸候选窗的IoU,若IoU大于阈值T,则剔除该人脸候选窗,对剩余的人脸候选窗,重复上述迭代操作,直至列表L中所有人脸候选窗都完成筛选,再使用一个全卷积网络输出最终的人脸候选窗和5个关键点位置,得到数据I’上人脸的5个关键点的坐标((x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)以及(x5,y5))后,通过5个关键点坐标裁剪投影后的红外数据IR、RGB数据I’和深度数据D和出人脸数据IRf,If,Df,将If作为输入,通过一个全卷积网络N2得到输入数据If的人脸表情类型E。
[0018] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述全卷积网络N1为MTCNN结构的全卷积网络,全卷积网络N2为resnet50结构的全卷积网络。
[0019] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述阈值=0.6。
[0020] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:所述5个关键点位置分别为左眼中心点,右眼中心点,鼻尖点,左嘴角和右嘴角。
[0021] 作为本发明一种基于单个图像传感器的人脸纹理结构数据采集方法的进一步优化:步骤S5具体为:根据点云数据P的深度信息Z、采集人员索引ID以及人脸表情E,按ID/Z/E的规则生成对应的文件夹,在文件夹中存储采集到的原始数据P、I、R和裁切后的数据IRf,If,Df。
[0022] 有益效果
[0023] 一、本发明的数据采集方法能够解决采集人脸数据类型不完全,采集设备要求高、成本昂贵,采集环境要求高等问题,能够降低采集成本,同时可以在包括室外的开放环境的多种场景中方便使用,并能够保证多种采集数据类型的采集,避免数据缺失;
[0024] 二、本发明的采集流程根据检测算法、表情识别算法创建存储数据地址,因此无需人员参与,降低了采集过程中的因为人为因素导致的数据缺失。

附图说明

[0025] 图1为本发明数据采集方法的基本原理框图;
[0026] 图2为本发明数据采集方法中将三维点云数据P投影到像素坐标系上得到投影后的深度图D。

具体实施方式

[0027] 以下结合具体实施方式进一步对本发明的技术方案进行阐述。
[0028] 如图1所示:基于单个图像传感器的人脸纹理结构数据采集方法,包括以下步骤:
[0029] S1:获取图像数据和深度数据;
[0030] 通过采集设备获取附带颜色信息的三维点云数据P、红外图像数据IR以及RGB图像数据I,采集设备为结构光、TOF或双目等深度相机。
[0031] S2:点云数据预处理,将三维数据处理成可应用的数据类型;
[0032] 通过下述公式将三维点云数据P投影到像素坐标系上,得到投影后的深度图D和点云投影RGB数据I’;
[0033] ;
[0034] 公式中的u、v为像素坐标系中的坐标,x、y为世界坐标系中的坐标,u0、v0、dx和dy为相机内部参数,最后通过下述双线性差值公式补全投影后的数据D和I’;
[0035] ;
[0036] 公式中的x和y为图像坐标系坐标,f为坐标为(x,y)上的数据,深度图D上为原点云数据P的z轴信息,点云投影RGB数据I’包含的数据为点云附带的R、G、B三通道的像素值。因为捕捉点云数据与红外数据IR使用同一采集设备,因此投影后的RGB数据I’、深度数据D和红外数据IR数据坐标一一对应。
[0037] S3:人脸检测与表情识别,裁切出人脸区域;
[0038] 将投影后的数据I’作为输入,通过全卷积网络N1(全卷积网络N1为MTCNN结构的全卷积网络)生成人脸候选窗和对应的分数,将所有检出的人脸候选窗根据分数做降序排列得到一个降序的列表L,从列表L中开始,计算人脸候选窗与其他人脸候选窗的IoU(交并比,人脸候选窗和真实的边框的交集和并集的比值),若IoU大于阈值T(阈值T根据确定根据经验和实际场景设定,一般为0.6),则剔除该人脸候选窗,对剩余的人脸候选窗,重复上述迭代操作,直至列表L中所有人脸候选窗都完成筛选,再使用一个全卷积网络输出最终的人脸候选窗和5个关键点位置,得到数据I’上人脸的5个关键点的坐标((x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)以及(x5,y5))后,通过5个关键点坐标裁剪投影后的红外数据IR、RGB数据I’和深度数据D和出人脸数据IRf,If,Df,将If作为输入,通过一个全卷积网络N2(全卷积网络N2为resnet50结构的全卷积网络)得到输入数据If的人脸表情类型E。
[0039] S4:采集人员索引,输入采集人脸的个体标识;
[0040] S5:根据不同的距离、人员、表情存储原始数据和裁切出的数据;
[0041] 根据点云数据P的深度信息Z、采集人员索引ID以及人脸表情E,按ID/Z/E的规则生成对应的文件夹,在文件夹中存储采集到的原始数据P、I、R和裁切后的数据IRf,If,Df。
[0042] 以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。