一种分区域的3D视频编码方法转让专利

申请号 : CN201510509321.9

文献号 : CN105141940B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王安红邢志伟金鉴武迎春

申请人 : 太原科技大学

摘要 :

一种基于分区域的3D视频编码技术,属于3D视频编码技术领域,其特征是:第一通过虚拟视点合成技术确定原始视点的区域划分,以此将原始视点划分为不同区域;第二根据区域的重要性进行编码,随机选择一个视点作为主视点,对划分的区域分为重要区域和非重要区域;然后对非重要区域采用较低的BCS观测率,而重要区域则采用较高的BCS观测率。优点是对原始视点进行分区域,然后对区域中的像素进行不同压缩处理,避免无效信息的重复编码,在相同观测率下,虚拟视点质量得到提高。

权利要求 :

1.一种分区域的3D视频编码方法,其特征在于具体操作方法为:第一步:计算阈值:3D视频两个相邻视点的纹理图和深度图,即摄像机获取的两个视点分别记为第一视点(1)和第二视点(3),假设用第一视点(1)和第二视点(3)来合成中间的虚拟视点(2),我们通过计算一个阈值来确定第一视点(1)和第二视点(3)中区域的边界,阈值由公式(1)求:其中,znear和zfar是自然场景与摄像机之间的距离范围,也称为深度范围,L是第一视点(1)和第二视点(3)之间的距离,即基线长度,fx是摄像机焦距;

第二步:从第一视点(1)和第二视点(3)中任选取一个视点为主视点,根据主视点深度图分别对第一视点(1)和第二视点(3)进行分区域:首先从第一视点(1)和第二视点(3)中任选取一个视点为主视点,计算主视点深度图中每两个相邻像素之间的深度值之差ΔZ,然后利用公式(2)、(3)进行感兴趣边界检测,d(x,y)代表(x,y)处的深度值,Bl(x,y)代表深度图左边界,同理,Br(x,y)代表右边界,

(1)如果Bl(x,y)=1,则认为(x,y)和(x-1,y)之间有一个左边界,(x,y)属于前景,(x-

1,y)属于背景;

(2)如果Br(x,y)=1,认为(x+1,y)和(x,y)之间有一个右边界,(x,y)属于前景,(x+1,y)属于背景;

(3)如果Bl(x,y)或者Br(x,y)等于0,则相邻像素之间没有边界;

第三步:根据虚拟视点(2)合成规则对第一视点(1)和第二视点(3)执行区域分割,并判定是否为重要区域:因背景平面(Q)与成像平面(P)平行,因此只考虑背景(Q)作为平面;本发明只考虑1D模型,即第一视点(1)和第二视点(3)的照相机平行放置,成像平面(P)仅有水平视差没有垂直视差;根据深度图所描述的实际场景信息对成像平面(P)进行区域划分,第一视点(1)和第二视点(3)代表原始视点,虚拟视点(2)代表需要使用第一视点(1)和第二视点(3)来合成的视点,区域MN和AJ分别表示前景和背景,第一视点(1)和第二视点(3)之间的基线长度为L,fx是摄像机的焦距长度;

假设第一视点(1)被选为主视点,根据3D映射过程按照虚拟视点(2)所需的区域“从左到右”顺序进行,分为四个步骤:

1)计算区域AB在第一视点(1)中的长度CAB

由于区域AB超出了虚拟视点(2)的视觉范围,为非重要区域,所以将其在第一视点(1)中的对应区域进行低BCS观测率采样,设CAB代表区域AB在第一视点(1)中的长度,dA代表A点对应的视差值,znear和zfar分别代表场景最近值和最远值,

2)计算左边界区域DE在第一视点(1)中的长度CDE

由于区域DE被前景MN所遮挡,导致虚拟视点(2)对此区域不可见,因此为非重要区域,对此区域采用低BCS观测率采样,其中,dM、dE的表示意义同上述dA,第一视点(1)中除以上两个区域外的所有区域均为重要区域,在编码时对其采用高BCS观测率采样;

3)计算区域FG在第二视点(3)中的长度CFG

因为虚拟视点(2)需要的FG区域在第一视点(1)中被遮挡,因此我们需要从第二视点(3)中寻找对应的区域,因此此区域为重要区域,需要采用高BCS观测率,区域FG可由公式(6)求得:其中,dN、dF的求取方法同上述dA;

4)计算第二视点(3)中区域IJ的长度CIJ

最后,对于虚拟视点(2)需要的区域IJ,由于在第一视点(1)中不可得,因此我们需要从第二视点(3)的相应区域来得到,因此此区域为重要区域,需要采用高BCS观测率,区域长度CIJ通过公式(7)计算,其中,dI的求取方法同上述dA,第二视点(3)中除区域FG、区域IJ外的所有区域均为非重要区域,在编码时采用低BCS观测率采样;

如果第二视点(3)被选为主视点,区域划分方法和求取方法相同,只是改变了重要性规则;

第四步:对不同的区域进行观测率分配

在上一步中对第一视点(1)和第二视点(3)进行了区域划分,在这一步则根据区域重要性进行不同的CS观测率分配:对重要区域分配了较高的CS观测率,对非重要区域则分配较低观测率;

根据压缩感知(CS)理论,对于一个稀疏信号x,通过使用一个矩阵Φ得到一个观测值向T量,这个矩阵通常是标准正交的,即φφ=I,观测值y由公式(8)得到:y=φx              (8)

在CS重建的过程中,假设存在一个稀疏变换参数阵使得x′=Ψx,最理想的恢复是找到和y具有最小零范数的x′,其中Ψ-1代表逆变换;

由于选择第一视点(1)为主视点,所以第一视点(1)中大部分区域都是重要区域,而第二视点(3)中只有以上求取的区域为重要区域,其余均为非重要区域;

对重要区域应用观测率为R1,对非重要区域观测率则为R2,如公式(10)所示,分配不同观测率后,对比方法中视点的观测率由以上观测率求得,即等效观测率;

其中col和row分别代表当前帧的宽度和高度,region_size代表当前帧中每个区域的大小,subrate代表对应的观测率。

说明书 :

一种分区域的3D视频编码方法

技术领域

[0001] 本发明属于3D视频编码技术领域,具体涉及一种分区域的3D视频编码方法。

背景技术

[0002] 在3D视频中,对原始视点的编码是一项很重要的技术。3D视频,即三维视频,其格式主要分为多视点和多视点加深度两种常见格式。多视点加深度格式由于能利用纹理信息个深度信息合成任意位置虚拟视点,因此是目前最广泛使用的3D视频格式。
[0003] 目前最新的三维视频编码标准是3D-HEVC,即三维的高效视频编码技术,利用了视点间相关性、视点内的相关性,和纹理和深度之间的相关性以压缩视频序列。但是3D-HEVC只是从原始视点的角度考虑如何尽可能的压缩视频数据,没有考虑对虚拟视点质量的影响。因为在某些使用场景,虚拟视点可能比原始视点更为重要。在有限的传输带宽下,牺牲原始视点的质量以满足虚拟视点的高质量也是可行的。
[0004] Cheon Lee,Yo-Sung Ho等人提出了一种利用视点合成预测的视频编码的框架,这个框架同时压缩视频图像和深度图像,并根据视点位置设计了四中类型的视点合成预测方法,但是这种方法非常复杂,运算量大,因为在编码段和解码端都要合成一个新的虚拟视点。
[0005] 目前大多数采用DIBR(Depth-image-based Rendering,即基于深度图像的绘制)技术来合成虚拟视点。DIBR的核心是利用深度信息和摄像机参数把像素从已知的原始视点映射到未知的合成视点。DIBR一般包括三个步骤:(1)3D映射;(2)空洞填补;(3)视点融合。

发明内容

[0006] 本发明的目的是提供一种分区域的3D视频编码方法,在相同BCS观测率条件下能够有效地提高合成的虚拟视点的质量。
[0007] 本发明是这样实现的,其特征是包括下列步骤:如附图2所示:
[0008] 第一步:计算阈值:3D视频两个相邻视点的纹理图和深度图,即摄像机获取的两个视点分别记为第一视点1和第二视点3,假设用第一视点1和第二视点3来合成中间的虚拟视点2。我们通过计算一个阈值来确定第一视点1和第二视点3中区域的边界,阈值由公式(1)可求,
[0009]
[0010] 其中,znear和zfar是自然场景与摄像机之间的距离范围,也可称为深度范围,L是第一视点1和第二视点3之间的距离,即基线长度,fx是摄像机焦距。
[0011] 第二步:从第一视点1和第二视点3中任选取一个视点为主视点,根据主视点深度图分别对第一视点1和第二视点3进行分区域。
[0012] 首先从第一视点1和第二视点3中任选取一个视点为主视点,计算主视点深度图中每两个相邻像素之间的深度值之差ΔZ,然后利用公式(2)、(3)进行感兴趣边界检测,d(x,y)代表(x,y)处的深度值,Bl(x,y)代表深度图左边界,
[0013]
[0014] 同理,Br(x,y)代表右边界,
[0015]
[0016] (1)如果Bl(x,y)=1,则认为(x,y)和(x-1,y)之间有一个左边界,(x,y)属于前景,(x-1,y)属于背景;
[0017] (2)如果Br(x,y)=1,认为(x+1,y)和(x,y)之间有一个右边界,(x,y)属于前景,(x+1,y)属于背景;
[0018] (3)如果Bl(x,y)或者Br(x,y)等于0,则相邻像素之间没有边界。
[0019] 第三步:根据虚拟视点2合成规则对第一视点1和第二视点3执行区域分割,并判定是否为重要区域。
[0020] 我们对不同区域采用不同的处理方法以节省码率,考虑背景平面Q与成像平面P平行的情况,由于本方法对区域要求可以不用很精确,因此只考虑背景Q作为平面的情况。本发明只考虑1D模型,即第一视点1和第二视点3的照相机平行放置,成像平面P仅有水平视差没有垂直视差。根据深度图所描述的实际场景信息对成像平面P进行区域划分,第一视点1和第二视点3代表原始视点,虚拟视点2代表需要使用第一视点1和第二视点3来合成的视点,区域MN和AJ分别表示前景和背景。第一视点1和第二视点3之间的基线长度为L,fx是摄像机的焦距长度。
[0021] 假设第一视点1被选为主视点。根据3D映射过程按照虚拟视点2所需的区域“从左到右”顺序进行,可分为四个步骤:
[0022] 1)计算区域AB在第一视点1中的长度CAB。
[0023] 由于区域AB超出了虚拟视点2的视觉范围,为非重要区域,所以将其在第一视点1中的对应区域进行低BCS观测率采样。设CAB代表区域AB在第一视点1中的长度,dA代表A点对应的视差值,znear和zfar分别代表场景最近值和最远值,
[0024]
[0025] 2)计算左边界区域DE在第一视点1中的长度CDE。
[0026] 由于区域DE被前景MN所遮挡,导致虚拟视点2对此区域不可见,因此为非重要区域,对此区域采用低BCS观测率采样,
[0027]
[0028] 其中,dM、dE的表示意义同上述dA。第一视点1中除以上两个区域外的所有区域均为重要区域,在编码时对其采用高BCS观测率采样。
[0029] 3)计算区域FG在第二视点3中的长度CFG。
[0030] 因为虚拟视点2需要的FG区域在第一视点1中被遮挡,因此我们需要从第二视点3中寻找对应的区域,因此此区域为重要区域,需要采用高BCS观测率,区域FG可由公式(6)求得:
[0031]
[0032] 其中,dN、dF的求取方法同上述dA。
[0033] 4)计算第二视点3中区域IJ的长度CIJ。
[0034] 最后,对于虚拟视点2需要的区域IJ,由于在第一视点1中不可得,因此我们需要从第二视点3的相应区域来得到,因此此区域为重要区域,需要采用高BCS观测率。区域长度CIJ可以通过公式(7)计算,
[0035]
[0036] 其中,dI的求取方法同上述dA。第二视点3中除区域FG、区域IJ外的所有区域均为非重要区域,在编码时采用低BCS观测率采样。
[0037] 如果第二视点3被选为主视点,区域划分方法和求取方法相同,只是改变了重要性规则。
[0038] 第四步:对不同的区域进行观测率分配。
[0039] 在上一步中对第一视点1和第二视点3进行了区域划分,在这一步则根据区域重要性进行不同的CS观测率分配:对重要区域分配了较高的CS观测率,对非重要区域去则分配较低观测率。
[0040] 根据压缩感知(CS)理论,对于一个稀疏信号x,通过使用一个采样矩阵Φ可得一个观测值向量,这个矩阵通常是标准正交的,即ΦΦT=I。观测值y可由公式(8)得到:
[0041] y=Φx      (8)
[0042] 在CS重建的过程中,假设存在一个稀疏变换参数阵使得x′=Ψx,最理想的恢复是找到和y具有最小零范数的x′,
[0043]
[0044] 其中Ψ-1代表逆变换。
[0045] 当CS应用到二维图像领域的时候,CS面临很多问题,例如较大的观测矩阵和复杂耗时的重建过程等。由于以上问题,分块压缩感知(BCS)被提出。一幅图像被分为几个不重叠的块,每个块都由一个相同的观测矩阵ΦB进行观测,等同于原始图像被一个对角阵Φ进行观测,
[0046]
[0047] 由于ΦB的大小远小于Φ,储存观测矩阵所用的空间大大减小,重建过程的速度也大大提高。
[0048] 由于选择第一视点1为主视点,所以第一视点1中大部分区域都是重要区域,而第二视点3中只有以上求取得区域为重要区域,其余均为非重要区域。
[0049] 对重要区域应用观测率为R1,对非重要区域观测率则为R2,如公式(11)所示,[0050]
[0051] 分配不同观测率后,对比方法中视点的观测率可以由以上观测率求得,即等效观测率。
[0052]
[0053] 其中col和row分别代表当前帧的宽度和高度,region_size代表当前帧中每个区域的大小,subrate代表对应的观测率。
[0054] 本发明的优点及积极效果是:
[0055] 1)本方法基于分区域映射思想,充分利用了原始视点中不同区域对虚拟视点的重要性做3D视频编码,减少了不必要区域的编码;
[0056] 2)在原始视点相同的观测率下,合成的虚拟视点质量有较大的提高。

附图说明

[0057] 图1是本发明的基本流程框图;
[0058] 图2是本发明中的区域划分示意图;
[0059] 图3是本发明kendo序列的峰值信噪比(PSNR)对比图;
[0060] 图4是本发明bookarrival序列的峰值信噪比(PSNR)对比图;
[0061] 图5是本发明的实验结果视觉效果对比图,图中(A)为kendo序列,(B)为bookarrival序列,上图为原始图像,中图为未分区域合成的虚拟视点图像,下图为分区域合成的虚拟视点图像;

具体实施方式

[0062] 对本发明提出的分区域3D视频编码方案,我们做了初步的测试实验。采用标准测试序列作为输入,即kendo序列和bookarrival序列,取了前10帧做测试,序列分辨率1024*768。使用dell工作站做仿真,工作站参数为:Intel(R),Xeon(R)Quad-Core CPU,2.8GHz,
4.00GB-DDR3内存。软件平台为MATLAB 2010b,用MATLAB编程实现了本方案。
[0063] 本实例是这样实现的,其过程包括下列步骤:如附图2所示:
[0064] 第一步:计算阈值:3D视频两个相邻视点的纹理图和深度图,即摄像机获取的两个视点分别记为第一视点1和第二视点3,假设用第一视点1和第二视点3来合成中间的虚拟视点2。我们通过计算一个阈值来确定第一视点1和第二视点3中区域的边界,由公式(1)计算得到:Kendo阈值ΔZmax=21;Bookarrival阈值ΔZmax=26。
[0065] 第二步:从第一视点1或者第二视点3中任选取一个视点为主视点,本发明选取第一视点1做为主视点,根据主视点深度图分别对第一视点1和第二视点3进行分区域。
[0066] 首先选取第一视点1做为主视点,计算主视点深度图中每两个相邻像素之间的深度值之差ΔZ,然后进行感兴趣边界检测,d(x,y)代表(x,y)处的深度值,Bl(x,y)代表深度图左边界,Br(x,y)代表右边界,
[0067] (1)如果Bl(x,y)=1,则认为(x,y)和(x-1,y)之间有一个左边界,(x,y)属于前景,(x-1,y)属于背景;
[0068] (2)如果Br(x,y)=1,认为(x+1,y)和(x,y)之间有一个右边界,(x,y)属于前景,(x+1,y)属于背景;
[0069] (3)如果Bl(x,y)或者Br(x,y)等于0,则相邻像素之间没有边界。
[0070] 第三步:根据虚拟视点2合成规则对第一视点1和第二视点3执行区域分割,并判定是否为重要区域。
[0071] 我们对不同区域采用不同的处理方法以节省码率,考虑背景平面Q且与成像平面P平行的情况,由于本方法对区域要求可以不用很精确,因此只考虑背景Q作为平面的情况。本发明只考虑1D模型,即第一视点1和第二视点3的照相机平行放置,成像平面P仅有水平视差没有垂直视差。根据深度图所描述的实际场景信息对成像平面P进行区域划分,第一视点
1和第二视点3代表原始视点,虚拟视点2代表需要使用第一视点1和第二视点3来合成的虚拟视点,区域MN和AL分别表示前景和背景。第一视点1和第二视点3之间的基线长度为L,fx是摄像机的焦距长度。
[0072] 本实施例选取第一视点1为主视点。根据3D映射过程按照虚拟视点2所需的区域“从左到右”顺序进行,可分为四个步骤:
[0073] 1)计算区域AB在第一视点1中的长度CAB。
[0074] 由于区域AB超出了虚拟视点2的视觉范围,为非重要区域,所以将其在第一视点1中的对应区域进行低BCS观测率采样。区域宽度可由公式(4)求得。
[0075] 2)计算左边界区域DE在第一视点1中的长度CDE。
[0076] 由于区域DE被前景MN所遮挡,导致虚拟视点2对此区域不可见,因此为非重要区域,对此区域采用低BCS观测率采样,此区域宽度可由公式(5)求得。
[0077] 第一视点1中除以上两个区域外的所有区域均为重要区域,在编码时对其采用高BCS观测率采样。
[0078] 3)计算区域FG在第二视点3中的长度CFG。
[0079] 因为虚拟视点2需要的FG区域在第一视点1中被遮挡,因此我们需要从第二视点3中寻找对应的区域,因此此区域为重要区域,需要采用高BCS观测率,区域HI可由公式(6)求得。
[0080] 4)计算第二视点3中区域IJ的长度CIJ。
[0081] 最后,对于虚拟视点2需要的区域IJ,由于在第一视点1中不可得,因此我们需要从第二视点3的相应区域来得到,因此此区域为重要区域,需要采用高BCS观测率。区域长度CIJ可以通过公式(7)计算。
[0082] 第二视点3中除区域FG、区域IJ外的所有区域均为非重要区域,在编码时采用低BCS观测率采样。如果第二视点3被选为主视点,区域划分方法和求取方法相同,只是改变了重要性规则。
[0083] 第四步:对不同的区域进行观测率分配。
[0084] 在上一步中对原始视点进行了区域划分,在这一步则根据区域重要性进行不同的CS观测率分配:对重要区域分配了较高的CS观测率,对非重要区域去则分配较低观测率。由于选择第一视点1为主视点,所以第一视点1中大部分区域都是重要区域,而第二视点3中只有以上求取得区域为重要区域,其余均为非重要区域。
[0085] 对重要区域应用观测率为R1,对非重要区域观测率则为R2,本实施例我们采用了八组观测率,如表1所示,分别为
[0086] 表1
[0087]组别 1 2 3 4 5 6 7 8
R1 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
R2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
[0088] 分配不同观测率后,对比方法的观测率可以由以上观测率根据实际原始视频特性求得,即等效观测率。对应以上八组求得的等效观测率如表2所示:
[0089] 表2
[0090]组别 1 2 3 4 5 6 7 8
等效观测率 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90
[0091] 完成以上步骤后,我们对原始视点的采样值进行了BCS-SPL恢复,然后进行虚拟视点的合成;对比组采用等效观测率进行BCS采样,而后进行BCS-SPL恢复,同样进行了虚拟视点的合成。最后比较了虚拟视点的合成质量。
[0092] 对应虚拟视点峰值信噪比对比图参照附图3、附图4,其中附图3为kendo序列,附图4为bookarrival序列,根据图中曲线可以看出本方案相较于未分区域的BCS-SPL提升接近
1dB。质量视觉质量对比图参照附图5,其中(A)列为kendo序列,(B)列为bookarrival序列,上图为原始图像,中图为未分区域的原始视点合成的虚拟视点图像,下图为分区域的原始视点合成的虚拟视点图像。