动态场景光场重建方法及装置转让专利
申请号 : CN202111090962.7
文献号 : CN113538667B
文献日 : 2021-12-24
发明人 : 方璐 , 仲大伟
申请人 : 清华大学
摘要 :
权利要求 :
1.一种动态场景光场重建方法,其特征在于,所述方法包括以下步骤:通过预训练的语义分割的网络获取人体分割的结果,根据预先获取的场景背景获取物体分割结果;
融合所述人体分割的结果和所述物体分割结果的多帧深度图得到几何模型,根据预训练的人体模型补全网络得到完整的人体模型,通过点云配准对准并将对准后的模型进行融合得到融合后的物体模型,以获得具有几何细节并完整的人体模型和物体模型;
通过所述点云配准跟踪刚性物体的运动;以及通过人体骨架的先验和非刚性点云跟踪重建所述具有几何细节并完整的人体模型;
在获得所述具有几何细节并完整的人体模型的运动场和所述刚性物体的运动后,在时间序列上进行融合操作,通过所述融合操作得到重建后的人体模型和重建后的刚性物体模型;
通过优化函数求解得到所述刚性物体的运动;
所述点云配准的优化函数包含颜色和几何两个优化项,所述优化函数表达式如下:其中,N是物体的数量,R是通过最近搜索找到的对应点集合,p、q是帧t和帧t−1的对应点,函数C返回点的颜色q,Cp是一个点p的切面上连续的预计算函数,函数f将三维点投影到切线平面,Ti为刚性物体的运动,λcolor是颜色优化项的系数,设置为0.1,λgeo是几何优化项的系数,设置为0.9,Ecolor是颜色优化项的计算表达式,由邻近点的颜色差异计算得到,Egeo是几何优化项的计算表达式,由邻 近点的空间位置差异计算得到;
所述通过人体骨架跟踪包括:通过人体骨架的先验和非刚性点云跟踪,并在求解人体骨架节点的位置时加入新的约束项:在求解人体骨架节点的位置时加入新的约束项:其中,Egmm是在人与物体交互的情况下采集的人体姿态数据,Elstm是通过时序上的约束项,Esp_h是几何上的交叉项,λgmm,λlstm,λsp_h1分别是优化项的系数;
所述通过人体表面节点的非刚性跟踪,包括:通过联合求解优化方程,优化变量为体型: ,姿势: ,ED非刚性运动场: ,所述优化方程为:
其中,第一项,体素数据项,λvd是优化系数, 描述的是SMPL型和重建的几何模型之间的误差:其中, 的输入为一个点坐标,输出为这个点坐标在TSDF体里面的双线性插值的SDF值, 表示 罚函数。
2.根据权利要求1所述的动态场景光场重建方法,其特征在于,所述方法还包括:根据重建的刚性物体在当前视角下投影的结果,去除所述人体分割的结果中错误的部分。
3.根据权利要求1所述的动态场景光场重建方法,其特征在于,所述根据预训练的人体模型补全网络得到完整的人体模型,包括:当所述几何模型的平均权重达到特定预设阈值时,触动当前帧的人体模型经过一个训练好的深度学习网络,得到一个完整的人体模型。
4.根据权利要求1所述的动态场景光场重建方法,其特征在于,相互作用项 ,由如下的点到面距离表示:
其中,C为SMPL上的点 和
完整模型上的点u的最近点对集合,P为部分模型的顶点 和完整模型上的点u最近点对集合, 是点的法向量。
5.根据权利要求1所述的动态场景光场重建方法,其特征在于,对每个3D体素 , 表示通过ED非刚性运动变形后的位置, 表示这个体素周围非空体素的数量; 表示v的TSDF值;
计算当前的SDF值 和更新权重,由下面公式计算:其中,u是与 对应的在完整上的模型的三维点, 是它的法向量, 是符号函数,由SDF值的正负决定。
6.根据权利要求5所述的动态场景光场重建方法,其特征在于,通过所述SDF值和更新权重,根据融合策略进行融合,通过marching cubes算法,得到完整并且有几何细节的网格模型,所述融合策略为:
其中, 表示v的TSDF值,W(v)表示当前累积的权重。
7.一种动态场景光场重建装置,其特征在于,包括:分割模块,用于通过预训练的语义分割的网络获取人体分割的结果,根据预先获取的场景背景获取物体分割结果;
配准模块,用于融合所述人体分割的结果和所述物体分割结果的多帧深度图得到几何模型,根据预训练的人体模型补全网络得到完整的人体模型,通过点云配准对准并将对准后的模型进行融合得到融合后的物体模型,以获得具有几何细节并完整的人体模型和物体模型;
跟踪模块,用于通过所述点云配准跟踪刚性物体的运动;以及,重建模块,用于通过人体骨架的先验和非刚性点云跟踪重建所述具有几何细节并完整的人体模型;
融合模块,在获得所述具有几何细节并完整的人体模型的运动场和所述刚性物体的运动后,在时间序列上进行融合操作,通过所述融合操作得到重建后的人体模型和重建后的刚性物体模型;
通过优化函数求解得到所述刚性物体的运动;
所述点云配准的优化函数包含颜色和几何两个优化项,所述优化函数表达式如下:其中,N是物体的数量,R是通过最近搜索找到的对应点集合,p、q是帧t和帧t−1的对应点,函数C返回点的颜色q,Cp是一个点p的切面上连续的预计算函数,函数f将三维点投影到切线平面,Ti为刚性物体的运动,λcolor是颜色优化项的系数,设置为0.1,λgeo是几何优化项的系数,设置为0.9,Ecolor是颜色优化项的计算表达式,由邻近点的颜色差异计算得到,Egeo是几何优化项的计算表达式,由临近点的空间位置差异计算得到;
所述重建模块,还用于通过人体骨架的先验和非刚性点云跟踪,并在求解人体骨架节点的位置时加入新的约束项:
在求解人体骨架节点的位置时加入新的约束项:其中,Egmm是在人与物体交互的情况下采集的人体姿态数据,Elstm是通过时序上的约束项,Esp_h是几何上的交叉项,λgmm,λlstm,λsp_h1分别是优化项的系数;
所述重建模块,还用于:
通过联合求解优化方程,优化变量为体型: ,姿势: ,ED非刚性运动场: ,所述优化方程为:
其中,第一项,体素数据项,λvd是优化系数, 描述的是SMPL型和重建的几何模型之间的误差:其中, 的输入为一个点坐标,输出为这个点坐标在TSDF体里面的双线性插值的SDF值, 表示 罚函数。
说明书 :
动态场景光场重建方法及装置
技术领域
背景技术
场重建仍难是一个困难的问题。以往的方法需要使用复杂且昂贵的相机阵列采集数据,然
后通过专用服务器进行离线计算来获取高质量的重建结果,然而这样的设备难以推广使
用。
时候,重建结果会不稳定。早期的基于模型的方法都会受到预扫描的模板或低效的运行时
性能不适用于日常交互应用程序。通过大量的相机和专门的计算服务器高端可以提供高质
量的人体重建解决方案这些方法通过大量的相机,借助多视图几何的计算以解决具有挑战
性的交互和遮挡模糊问题。然而,它们的计算效率低而且需要昂贵,繁琐的数据采集设备,
导致不能应用到日常使用中。单目立体视觉方法采用最轻便的商用RGBD摄像机采集数据,
通过时间上的融合管道来构建完整模型。早期处理一般的动态场景的方法没有利用人体的
先验信息,重建的动态物体需要运动非常缓慢,而且不能有严重遮挡,结果非常不鲁棒。为
了增强对人体重建的鲁棒性,新的工作引入了人体参数模型的先验来处理更复杂的运动,
不过这些方法不能重建人与物体交互的情况,在有物体遮挡的时候容易失败。
间序列上缺少平滑性。
信息的方法不能将与人交互的物体重建出来,而且在有物体遮挡的时候容易跟踪失败。
发明内容
进行了优化处理,在重建动态人体的同时将刚性物体也重建出来,通过重建的物体模型的
先验信息来提升遮挡情况下人体模型的鲁棒性。同时在人体骨架跟踪上引入时序信息的先
验来提升鲁棒性。
行融合得到融合后的物体模型,以获得具有几何细节并完整的人体模型和物体模型;
体模型。
影到切线平面,Ti为刚性物体的运动,λcolor是颜色优化项的系数,设置为0.1,λgeo是几何优
化项的系数,设置为0.9,Ecolor是颜色优化项的计算表达式,由邻近点的颜色差异计算得到;
Egeo是几何优化项的计算表达式,由临近点的空间位置差异计算得到。
节点的位置时加入新的约束项:
的点u最近点对集合, 是点的法向量。
为:
割结果的多帧深度图得到几何模型,根据预训练的人体模型补全网络得到完整的人体模
型,通过点云配准对准并将对准后的模型进行融合得到融合后的物体模型,以获得具有几
何细节并完整的人体模型和物体模型;通过点云配准跟踪刚性物体的运动;以及通过人体
骨架的先验和非刚性点云跟踪重建具有几何细节并完整的人体模型;在获得具有几何细节
并完整的人体模型的运动场和刚性物体的运动后,在时间序列上进行融合操作,通过融合
操作得到重建后的人体模型和重建后的刚性物体模型。本发明通过在人和物体交互的动态
场景下,对刚性物体进行点云跟踪并重建出三维模型,在得到三维模型之后根据模型的先
验信息约束人体骨架的跟踪,提升在人与物体交互场景下的动态光场重建的鲁棒性;利用
时序信息的先验和采集的人与物体交互的pose先验来增强物体遮挡情况下的人体骨架跟
踪效果,在得到遮挡情况下鲁棒的人体骨架跟踪,可以实现在遮挡情况下动态场景的光场
重建。
对准后的模型进行融合得到融合后的物体模型,以获得具有几何细节并完整的人体模型和
物体模型;
重建后的刚性物体模型。
融合人体分割的结果和物体分割结果的多帧深度图得到几何模型,根据预训练的人体模型
补全网络得到完整的人体模型,通过点云配准对准并将对准后的模型进行融合得到融合后
的物体模型,以获得具有几何细节并完整的人体模型和物体模型;跟踪模块,用于通过点云
配准跟踪刚性物体的运动;以及,重建模块,用于人体骨架的先验和非刚性点云跟踪重建具
有几何细节并完整的人体模型;融合模块,用于在获得具有几何细节并完整的人体模型的
运动场和刚性物体的运动后,在时间序列上进行融合操作,通过融合操作得到重建后的人
体模型和重建后的刚性物体模型。本发明通过在人和物体交互的动态场景下,对刚性物体
进行点云跟踪并重建出三维模型,在得到三维模型之后根据模型的先验信息约束人体骨架
的跟踪,提升在人与物体交互场景下的动态光场重建的鲁棒性;利用时序信息的先验和采
集的人与物体交互的pose先验来增强物体遮挡情况下的人体骨架跟踪效果,在得到遮挡情
况下鲁棒的人体骨架跟踪,可以实现在遮挡情况下动态场景的光场重建。
的、高质量的动态人体3D模型和刚性物体模型。具体包括:
附图说明
具体实施方式
图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
得到重建的刚性物体后通过在空间上的优化项来限制人体模型的位置,防止人体模型插入
到物体模型中。同时通过重建的刚性物体模型调整原始数据中人体mask提取的结果。如图2
所示。
行融合得到融合后的物体模型,以获得具有几何细节并完整的人体模型和物体模型。
例如(1 3s的人体正面视频得到的人体前面的部分模型)。
~
如下:
到尺度以及人体姿态和真实情况(也就是上述融合的几何模型)更逼近的模型。训练数据集
可以通过大量的3D人体模型,渲染得到Depth和RGB,经过人体部分分割得到human parsing
得到,然后通过该改变的Pifu网络训练得到这个深度学习模型。
一起构成既有几何细节又完整的人体模型。
投影到切线平面。通过优化上面的误差函数可以求解得到Ti,即刚性物体的运动,λcolor是颜
色优化项的系数,设置为0.1,λgeo是几何优化项的系数,设置为0.9,Ecolor是颜色优化项的计
算表达式,由邻近点的颜色差异计算得到,Egeo是几何优化项的计算表达式,由临近点的空
间位置差异计算得到。
与高斯混合模型的先验信息尽量保持一致;
物体遮挡的情况下可以根据时序上的连续性来实现较好的骨架运动估计;Esp_h是几何上
的交叉项,在得到刚性物体的模型之后,约束人体与物体模型不能在空间中交叉,避免在遮
挡的情况下人体模型错误的插入到物体中。
估计非刚性运动G。我们使用ED node graph和SMPL模型表示整体的人体模型,对于任意3D
顶点 , 表示的是通过ED node graph变形后的位置, 是非刚性运动场。对
于SMPL模型, 是统一模板, 是通过形状和姿态参数变形后的模板,其中β表示的
是形状参数(体型),θ表示的是姿态参数,对于任顶点 , 是通
过变形后的3D坐标位置。
mesh): 。优化方程为:
型)之间的误差:
最近点对集合, 是点的法向量,λmdata是相互作用项的系数。
型。
型。
模型的一点点融合,从中间到边缘这个数越来越小,所以用它的反比表示融合权重可以达
到无缝融合的效果。 表示v的TSDF值, 表示的则是他的当前累积的权重。我们按照
如下公式计算对应的当前的SDF值 ,和更新权重:
体分割结果的多帧深度图得到几何模型,根据预训练的人体模型补全网络得到完整的人体
模型,通过点云配准对准并将对准后的模型进行融合得到融合后的物体模型,以获得具有
几何细节并完整的人体模型和物体模型;通过点云配准跟踪刚性物体的运动;以及通过人
体骨架的先验和非刚性点云跟踪重建具有几何细节并完整的人体模型;在获得具有几何细
节并完整的人体模型的运动场和刚性物体的运动后,在时间序列上进行融合操作,通过融
合操作得到重建后的人体模型和重建后的刚性物体模型。本发明通过在人和物体交互的动
态场景下,对刚性物体进行点云跟踪并重建出三维模型,在得到三维模型之后根据模型的
先验信息约束人体骨架的跟踪,提升在人与物体交互场景下的动态光场重建的鲁棒性;利
用时序信息的先验和采集的人与物体交互的pose先验来增强物体遮挡情况下的人体骨架
跟踪效果,在得到遮挡情况下鲁棒的人体骨架跟踪,可以实现在遮挡情况下动态场景的光
场重建。
后的模型进行融合得到融合后的物体模型,以获得具有几何细节并完整的人体模型和物体
模型;
刚性物体模型。
模块,用于融合人体分割的结果和物体分割结果的多帧深度图得到几何模型,根据预训练
的人体模型补全网络得到完整的人体模型,通过点云配准对准并将对准后的模型进行融合
得到融合后的物体模型,以获得具有几何细节并完整的人体模型和物体模型;跟踪模块,用
于通过点云配准跟踪刚性物体的运动;以及,重建模块,用于人体骨架的先验和非刚性点云
跟踪重建具有几何细节并完整的人体模型;融合模块,用于在获得具有几何细节并完整的
人体模型的运动场和刚性物体的运动后,在时间序列上进行融合操作,通过融合操作得到
重建后的人体模型和重建后的刚性物体模型。本发明通过在人和物体交互的动态场景下,
对刚性物体进行点云跟踪并重建出三维模型,在得到三维模型之后根据模型的先验信息约
束人体骨架的跟踪,提升在人与物体交互场景下的动态光场重建的鲁棒性;利用时序信息
的先验和采集的人与物体交互的pose先验来增强物体遮挡情况下的人体骨架跟踪效果,在
得到遮挡情况下鲁棒的人体骨架跟踪,可以实现在遮挡情况下动态场景的光场重建。
隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三
个等,除非另有明确具体的限定。
点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任
一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技
术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结
合和组合。
实施例进行变化、修改、替换和变型。