一种基于图像变形的不规则视频矩形化矫正方法转让专利

申请号 : CN201510180896.0

文献号 : CN104822030B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄华刘彩虹

申请人 : 北京理工大学深圳研究院北京理工大学

摘要 :

本发明涉及一种视频矫正方法,特别涉及一种基于图像变形的视频矩形化矫正方法,属于视频处理领域。本发明首先对所有视频帧进行局部变形;在变形后矩形视频帧上设置网格,再依据坐标映射关系,将网格放置在原不规则视频帧上,对所有帧网格对应坐标取均值,即初始网格;对初始网格做时域空域约束建立稀疏线性方程组,并求解得到校正后的视频各帧网格点;根据每一视频帧矫正前后网格进行双线性插值得到矫正后的视频帧。该方法在已有图像矫正方法的基础上,增加时域约束条件,实现了视频的矩形化矫正。

权利要求 :

1.一种基于图像变形的不规则视频矩形化矫正方法,其特征在于,包括以下步骤:步骤一、对每个视频帧进行局部变形

对于视频中不规则边界的每一帧,利用seam carving算法,通过不断插入长短不一的seam的方式,填充缺失像素,得到规则矩形边界的视频帧,插入的同时记录插入后每个像素点所在原图的位置坐标;

步骤二、设置网格,并将网格变形回原图

对步骤一中得到的每一规则视频帧,将其均匀划分为若干矩形区域,并获得网格角点的坐标,然后利用步骤一中记录的位置信息,获得每个网格角点所在原图的位置坐标,即可将每帧网格变形回原图;

步骤三、网格归一化

对得到的所有覆盖视频帧不规则有效区域的网格,对应位置坐标取均值,得到归一化网格,即是每帧初始网格,记为 对于所有帧,初始网格坐标相同;

步骤四、计算能量函数中的保形项Es

为获得与原视频帧尽可能相近的图像,尽可能减少其形状失真,因此在原视频帧网格和矫正后的视频帧对应网格之间应保持一个相似变换,变形后网格记为Vt,其中则保形能量函数定义为:其中上标t为视频帧索引,下标q是每帧网格的方格索引,N是网格的方格数,Aq为8*4的矩阵,Vq为8*1的矩阵, 为网格变形前一个方格四个顶点对应四对坐标,而(x0,y0),…,(x3,y3)为相应的变形后对应四对坐标;

步骤五、计算能量函数中的直线保持项El

为减少直线失真,保持视频矫正前后直线的平行性和平直性,定义直线保持项,具体计算过程如下:首先对视频中每帧进行直线检测,并对检测得到的所有直线依据网格对其进行分割,使得每个子线段只在一个方格中,对所有线段按其倾斜角分为m组,这样同组的线段倾斜角基本相同;然后设计能量函数约束倾斜角相似的线段(即是同组的线段)在矫正过程中旋转角尽可能一致,这样变形后直线的倾斜角依然保持基本相同,从而实现保持直线的平行性和平直性,其能量函数定义为:其中,Vt同步骤四,R是旋转矩阵,{θmt}是m组线段的旋转角集合,是方格中线段对应向量,表示变形前线段,而e表示变形后线段,可采用Vt线性表示,NL是线段总数,j是线段索引,q(j)表示线段所在方格索引,m(j)表示线段所在组号;

步骤六、计算能量函数中的边界约束项Eb

为使得变形后视频每帧边界严格为矩形,约束其变形后网格四个边界上的 点在图像边界上,其能量函数定义如下:其中Vt, 同步骤四,w,h分别表示为图像的宽和高,L、R、T、B分别表示左、右、上、下边界像素坐标集合;

步骤七、计算能量函数中的特征点位移约束项Ep

为保持变形后视频的时域上的连续性,减少抖动等失真现象,设计特征点位移约束项。

即对原始视频当前帧和前一帧提取特征点,并利用光流法得到两帧中特征点的匹配点对位置,即 和 利用前一帧已计算网格,则可得 变形后对应坐标Pt-1, 变形后对应点Pt可由Vt线性表示,约束特征点在变形前后的相对位移尽可能不变,则可得能量函数为:其中Vt定义同上,Np是检测得到特征点的个数, 分别表示第t帧变形前后第j个特征点坐标, 则分别表示第t-1帧的相应点;

步骤八、计算能量函数中的网格点位置约束项Ev

为增强时域连续性约束效果,进一步减少不连续的失真,约束相邻帧对应网格点变形前后坐标保持时域上连续,网格点位置约束项定义为:其中,Vt定义同上, 和 分别表示变形后第t帧和第t-1帧的第i个网格点位置坐标;

步骤九、能量函数优化求解

将上述约束条件分别赋予权重,建立用于求解矫正后网格角点位置的能量 函数,公式化表示为:E(Vt,{θmt})=w1Es+w2El+w3Ep+w4Ev+w5Eb由于函数中每帧计算只需前一帧的相关信息,故逐帧使用迭代求解稀疏线性方程组的方法求解该能量函数最小化问题即可,得到稳定后的网格点坐标Vt;

步骤十、图像变形

对每帧根据矫正前的网格和矫正后的网格进行插值,即可获得矫正后的每个视频帧。

说明书 :

一种基于图像变形的不规则视频矩形化矫正方法

技术领域

[0001] 本发明涉及一种视频矫正方法,特别涉及一种基于图像变形的视频矩形化矫正方法,属于视频处理领域。

背景技术

[0002] 随着互联网技术的发展和数码摄像设备的大范围使用,视频数据的采集非常容易,广泛存在于生活中的各个方面。随着图像和视频拼接技术的发展,人们越来越不满足于普通摄像机得到的有限视角的视频,期望获得更宽视角的视频以获得更好的视觉效果。然后由于采集的视频数据的视角差异或者普通数码摄像机的随意移动,都会造成拼接后视频的边界不规则。
[0003] 本方法所用已有技术包括seam carving的图像缩放技术(Avidan,S.,Shamir,A.2007.Seam carving for content-aware image resizing.In SIGGRAPH 2007.)在本方法中利用seam carving技术填充的所有不规则视频帧得到初步的矩形视频帧,进行网格的设置,再进行后续操作。
[0004] 另外是不规则全景图像矫正技术(He,K.,Chang,H.,Sun,J.2013.Rectangling Panoramic Images via Warping.In SIGGRAPH 2013),本方法是对该方法的一个扩展,增加了时域上的连续性约束,得到视觉上合理的矩形规则视频。

发明内容

[0005] 本发明的目的是针对拼接后不规则的视频数据,提出的一种视频矫正方法,使用户获得较舒适的观看感受。
[0006] 本发明技术方案的思想是首先对所有视频帧进行局部变形;在变形后矩形视频帧上设置网格,再依据坐标映射关系,将网格放置在原不规则视频帧上,对所有帧网格对应坐标取均值,即初始网格;对初始网格做时域空域约束建立稀疏线性方程组,并求解得到校正后的视频各帧网格点;根据每一视频帧矫正前后网格进行双线性插值得到矫正后的视频帧。该方法在已有图像矫正方法的基础上,增加时域约束条件,实现了视频的矩形化矫正。
[0007] 本发明的目的是通过下述技术方案实现的。
[0008] 一种基于全局优化的视频稳定方法,包括以下步骤:
[0009] 步骤一、对每个视频帧进行局部变形
[0010] 对于视频中不规则边界的每一帧,利用seam carving算法,通过不断插入长短不一的seam的方式,填充缺失像素,得到规则矩形边界的视频帧,插入的同时记录插入后每个像素点所在原图的位置坐标;
[0011] 步骤二、设置网格,并将网格变形回原图
[0012] 对步骤一中得到的每一规则视频帧,将其均匀划分为若干矩形区域,并获得网格角点的坐标,然后利用步骤一中记录的位置信息,获得每个网格角点所在原图的位置坐标,即可将每帧网格变形回原图;
[0013] 步骤三、网格归一化
[0014] 对得到的所有覆盖视频帧不规则有效区域的网格,对应位置坐标取均值,得到归一化网格,即是每帧初始网格,记为 对于所有帧,初始网格坐标相同;
[0015] 步骤四、计算能量函数中的保形项Es
[0016] 为获得与原视频帧尽可能相近的图像,尽可能减少其形状失真,因此在原视频帧网格和矫正后的视频帧对应网格之间应保持一个相似变换,变形后网格记为Vt,其中则保形能量函数定义为:
[0017]
[0018]
[0019] 其中上标t为视频帧索引,下标q是每帧网格的方格索引,N是网格的方格数,Aq为8*4的矩阵,Vq为8*1的矩阵, 为网格变形前一个方格四个顶点对应四
对坐标,而(x0,y0),…,(x3,y3)为相应的变形后对应四对坐标;
[0020] 步骤五、计算能量函数中的直线保持项El
[0021] 为减少直线失真,保持视频矫正前后直线的平行性和平直性,定义直线保持项。具体计算过程如下:首先对视频中每帧进行直线检测,并对检测得到的所有直线依据网格对其进行分割,使得每个子线段只在一个方格中,对所有线段按其倾斜角分为m组,这样同组的线段倾斜角基本相同;然后设计能量函数约束倾斜角相似的线段(即是同组的线段)在矫正过程中旋转角尽可能一致,这样变形后直线的倾斜角依然保持基本相同,从而实现保持直线的平行性和平直性,其能量函数定义为:
[0022]
[0023]
[0024] 其中,Vt同步骤四,R是旋转矩阵,{θmt}是m组线段的旋转角集合,是方格中线段对应向量,表示变形前线段,而e表示变形后线段,可采用Vt线性表示,NL是线段总数,j是线段索引,q(j)表示线段所在方格索引,m(j)表示线段所在组号;
[0025] 步骤六、计算能量函数中的边界约束项Eb
[0026] 为使得变形后视频每帧边界严格为矩形,约束其变形后网格四个边界上的点在图像边界上,其能量函数定义如下:
[0027]
[0028] 其中Vt, 同步骤四,w,h分别表示为图像的宽和高,L、R、T、B分别表示左、右、上、下边界像素坐标集合;
[0029] 步骤七、计算能量函数中的特征点位移约束项Ep
[0030] 为保持变形后视频的时域上的连续性,减少抖动等失真现象,设计特征点位移约束项。即对原始视频当前帧和前一帧提取特征点,并利用光流法得到两帧中特征点的匹配点对位置,即 和 利用前一帧已计算网格,则可得 变形后对应坐标Pt-1, 变形后对应点Pt可由Vt线性表示,约束特征点在变形前后的相对位移尽可能不变,则可得能量函数为:
[0031]
[0032] 其中Vt定义同上,Np是检测得到特征点的个数, 分别表示第t帧变形前后第j个特征点坐标, 则分别表示第t-1帧的相应点;
[0033] 步骤八、计算能量函数中的网格点位置约束项Ev
[0034] 为增强时域连续性约束效果,进一步减少不连续的失真,约束相邻帧对应网格点变形前后坐标保持时域上连续,网格点位置约束项定义为:
[0035]
[0036] 其中,Vt定义同上, 和 分别表示变形后第t帧和第t-1帧的第i个网格点位置坐标;
[0037] 步骤九、能量函数优化求解
[0038] 将上述约束条件分别赋予权重,建立用于求解矫正后网格角点位置的能量函数,形式化表示为:
[0039] E(Vt,{θmt})=w1Es+w2El+w3Ep+w4Ev+w5Eb
[0040] 由于函数中每帧计算只需前一帧的相关信息,故逐帧使用迭代求解稀疏线性方程组的方法求解该能量函数最小化问题即可,得到稳定后的网格点坐标Vt,其中,w5需足够大严格约束其边界为矩形;
[0041] 步骤十、图像变形
[0042] 对每帧根据矫正前的网格和矫正后的网格进行插值,即可获得矫正后的每个视频帧。
[0043] 有益效果:
[0044] (1)对于视频拼接过程中产生的不规则视频,本发明提出了一种切实有效可行的视频矫正方案,方案中采用了内容感知的方法进行视频帧变形,在保持视频内容的情况下实现了不规则视频的矫正。
[0045] (2)对于时域连续性保持,本发明提出了两个有效的能量约束项,基于光流的特征点位移约束和保持网格坐标连续约束,有效的保持了矫正后视频时域上平滑连续的视觉效果。

附图说明

[0046] 本发明基于图像变形视频矫正方法的流程图。

具体实施方式

[0047] 下面结合附图对本发明方法的实施方式做详细说明。
[0048] 如图所示,一种基于全局优化的视频稳定方法,具体实现步骤如下:
[0049] 步骤一、对视频每帧进行局部变形
[0050] 局部变形主要基于Seam carving算法,即对于视频中不规则边界的每一帧,利用seam carving算法,通过不断插入长短不一的seam的方式,填充缺失像素,得到规则矩形边界的视频帧,插入的同时记录插入后每个像素点所在原图的位置坐标;
[0051] 步骤二、设置网格,并将网格变形回原图
[0052] 对步骤一中得到的每一规则视频帧,将其均匀划分为若干矩形区域,并获得网格角点的坐标,然后利用步骤一中记录的位置信息,获得每个网格角点所在原图的位置坐标,即可将每帧网格变形回原图;
[0053] 步骤三、网格归一化
[0054] 对得到的所有覆盖视频帧不规则有效区域的网格,对应位置坐标取均值,得到归一化网格,即是每帧初始网格,记为 对于所有帧,初始网格坐标相同;
[0055] 步骤四、计算能量函数中的保形项Es
[0056] 为获得与原视频帧尽可能相近的图像,尽可能减少其形状失真,因此在原视频帧网格和矫正后的视频帧对应网格之间应保持一个相似变换,变形后网格记为Vt,其中则保形能量函数定义为:
[0057]
[0058]
[0059] 其中上标t为视频帧索引,下标q是每帧网格的方格索引,N是网格的方格数,Aq为8*4的矩阵,Vq为8*1的矩阵, 为网格变形前一个方格四个顶点对应四
对坐标,而(x0,y0),…,(x3,y3)为相应的变形后对应四对坐标;
[0060] 步骤五、计算能量函数中的直线保持项El
[0061] 为减少直线失真,保持视频矫正前后直线的平行性和平直性,定义直线保持项。具体计算过程如下:首先对视频中每帧进行直线检测,并对检测得到的所有直线依据网格对其进行分割,使得每个子线段只在一个方格中,对所有线段按其倾斜角分为m组,这样同组的线段倾斜角基本相同;然后设计能量函数约束倾斜角相似的线段(即是同组的线段)在矫正过程中旋转角尽可能一致,这样变形后直线的倾斜角依然保持基本相同,从而实现保持直线的平行性和平直性,其能量函数定义为:
[0062]
[0063]
[0064] 其中,R是旋转矩阵,{θmt}是m组线段的旋转角集合,是方格中线段对应向量,表示变形前线段,是Vq的线性函数,而e表示变形后线段,NL是线段总数,j是线段索引,q(j)表示线段所在方格索引,m(j)表示线段所在组号;
[0065] 步骤六、计算能量函数中的边界约束项Eb
[0066] 为使得变形后视频每帧边界严格为矩形,约束其变形后网格四个边界上的点在图像边界上,其能量函数定义如下:
[0067]
[0068] 其中Vt, 同步骤四,w,h分别表示为图像的宽和高,L、R、T、B分别表示左、右、上、下边界像素坐标集合;
[0069] 步骤七、计算能量函数中的特征点位移约束项Ep
[0070] 为保持变形后视频的时域上的连续性,减少抖动等失真现象,设计特征点位移约束项。即对原始视频当前帧和前一帧提取特征点,并利用光流法得到两帧中特征点的匹配点对位置,即 和 利用前一帧已计算网格,则可得 变形后对应坐标Pt-1, 变形后对应点Pt可由Vt线性表示,约束特征点在变形前后的相对位移尽可能不变,则可得能量函数为:
[0071]
[0072] 其中Vt定义同上,Np是检测得到特征点的个数, 分别表示第t帧变形前后第j个特征点坐标, 则分别表示第t-1帧的相应点;
[0073] 步骤八、计算能量函数中的网格点位置约束项Ev
[0074] 为增强时域连续性约束效果,进一步减少不连续的失真,约束相邻帧对应网格点变形前后坐标保持时域上连续,网格点位置约束项定义为:
[0075]
[0076] 其中,Vt定义同上, 和 分别表示变形后第t帧和第t-1帧的第i个网格点位置坐标;
[0077] 步骤九、能量函数优化求解
[0078] 将上述约束条件分别赋予权重,建立用于求解矫正后网格角点位置的能量函数,形式化表示为:
[0079] E(Vt,{θmt})=w1Es+w2El+w3Ep+w4Ev+w5Eb
[0080] 由于函数中每帧计算只需前一帧的相关信息,故逐帧使用迭代求解稀疏线性方程组的方法求解该能量函数最小化问题即可,得到稳定后的网格点坐标Vt;
[0081] 其中,w5需足够大严格约束其边界为矩形,该实施例中各权重设置为w1=1,w2=100,w3=30,w4=1,w5=100000000.0;
[0082] 步骤十、图像变形
[0083] 对每帧根据矫正前的网格和矫正后的网格进行插值,该实施例中使用的是双线性插值的方法,即可获得矫正后的每个视频帧。
[0084] 为了说明本发明的内容及实施方法,本说明书给出了一个具体实施例。在实施例中引入细节的目的不是限制权利要求书的范围,而是帮助理解本发明所述方法。本领域的技术人员应理解:在不脱离本发明及其所附权利要求的精神和范围内,对最佳实施例步骤的各种修改、变化或替换都是可能的。因此,本发明不应局限于最佳实施例及附图所公开的内容。