基于视觉特性的视频编码系统转让专利

申请号 : CN200910273190.3

文献号 : CN101710995B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 胡瑞敏夏洋苏引胡金晖黄振坤钟睿

申请人 : 武汉大学

摘要 :

本发明涉及视频编解码技术领域,尤其涉及一种基于视觉特性的视频编码系统。本发明包括变换域的基于关注度的最小可察觉失真阈值计算模块、编码模块,其中,基于关注度的最小可察觉失真阈值计算模块包括关注点提取子模块、关注度调制因子计算字模块、最小可察觉失真阈值计算子模块、基于关注度的最小可察觉失真阈值计算子模块,编码模块包括空间/时间预测编码子模块、变换子模块、变换域滤波子模块、量化子模块、熵编码子模块、率失真优化子模块,本发明通过建立DCT域的Foveated?JND模型,并将其运用到视频编码框架中DCT域的滤波和率失真优化模块,力求在主观质量保持不变的情况下,大幅降低了编码码率。

权利要求 :

1.一种基于视觉特性的视频编码系统,其特征在于,包括:-变换域的基于关注度的最小可察觉失真阈值计算模块(1),该模块进一步包括:关注点提取子模块(11);

关注度调制因子计算子模块(12),用于通过计算图像的分块和距离此分块最近的关注点所在分块之间的偏心率,计算出关注度调制因子;

最小可察觉失真阈值计算子模块(13),用于通过考虑空间域对比敏感度函数,局部背景的亮度掩蔽效应和纹理掩蔽效应,计算出变换域的最小可察觉失真阈值;

基于关注度的最小可察觉失真阈值计算子模块(14),用于将图像分块的最小可察觉失真阈值和关注度调制因子的乘积作为图像分块的基于关注度的最小可察觉失真阈值;

-编码模块(2),该模块进一步包括:

空间/时间预测编码子模块(21)用于对视频图像执行空间/时间预测编码;

变换子模块(22),用于对通过空间/时间预测编码部分的信号进行预定的变换;

变换域滤波子模块(23),用于利用变换域的基于关注度的最小可察觉失真阈值,对通过变换部分的信号进行滤波,小于阈值的变换域系数被置为零;

量化子模块(24),用于对通过变换域滤波部分的信号进行预定的量化;

熵编码子模块(25),用于对于量化后的信息进行熵编码;

率失真优化子模块(26),用于比较各种编码模式下的代价函数,选择最优的编码模式。

2.根据权利要求1所述的基于视觉特性的视频编码系统,其特征在于:所述最小可察觉失真阈值计算子模块进一步包括空域对比敏感度阈值计算子模块、时域对比敏感度因子计算子模块、亮度掩蔽因子计算子模块、纹理掩蔽因子计算子模块。

说明书 :

基于视觉特性的视频编码系统

技术领域

[0001] 本发明涉及视频编解码技术领域,尤其涉及一种基于视觉特性的视频编码系统。

背景技术

[0002] 目前典型的视频编码方法是以数字信号处理理论和香农信息论为基础的基于变换/预测的混合编码框架。但是,该技术框架发展到现在遇到巨大瓶颈,其编码效率的提高主要依赖于复杂度的大幅增加,如果继续延续这一思路很难有大的提升空间。
[0003] 视频编码的根本目的是在降低码率的同时能够提供高质量的视觉效果,编码和传输人类视觉不能察觉到或者不感兴趣的信息对于网络带宽和终端设备来说是一种浪费。最小可察觉失真(Just-noticeable difference,JND)是指人眼所不能感知到的图像最大失真,其在一定程度上定量描述了人眼感受图像的特性,利用JND指导视频压缩,在保持图像主观感知效果基本不变的条件下尽可能的降低码率,成为进一步提升压缩效率的可行途径。
[0004] 图像JND模型一般考虑人眼的对比敏感度,亮度掩蔽效应,纹理掩蔽效应等因素。文献1-2中分别提出了考虑空间域对比敏感度(contrast sensitivity function,CSF)函数,局部背景的亮度掩蔽效应和纹理掩蔽效应的DCT域JND模型;针对视频序列,时间域的CSF函数也被纳入JND模型中;在时空域CSF函数的模型之上,文献3中考虑了本地背景亮度和对比度掩蔽效应等其他因素,提出了面向视频信号的JND模型。文献4在文献3的基础之上考虑了JND模型中运动因素的方向性,进一步提升了时域JND模型的准确性;文献5-6利用JND模型分别在像素域和DCT域对预测残差信号做了滤波,大幅降低了编码码率。
[0005] 以上的JND模型假设人眼对整幅图像的视觉分辨率保持恒定,但事实并非如此。视网膜的感光细胞并不是均匀分布的,视网膜的中心凹的感光细胞密度最高,离中心凹的距离越远,视网膜的感光细胞密度越低。当一个视觉激励投射到中心凹上时,其具有最高的视觉敏感度。投影离中心凹的距离越远,其视觉敏感度低。因此视觉敏感度是空域变化的,而JND模型应该是光源投影到视网膜上位置的函数。
[0006] 本发明专利申请首次提出DCT域的Foveated JND模型,并将其运用到视频编码框架中DCT域的滤波和率失真优化模块,力求在主观质量保持不变的情况下,大幅降低了编码码率。
[0007] 文 献 1:X.Zhang,W.S.Lin,and P.Xue,“Improved estimation for just-noticeable visualdistortion,”Signal Processing,vol.85,pp.795-808,2005.[0008] 文献2:Zhenyu Wei and King N.Ngan,“Spatial Just Noticeable Distortion Profile for Imagein DCT Domain,”IEEE Int.Conf.,Multimedia and Expo.2008.[0009] 文 献 3:Y.Jia,W.Lin,and A.A.Kassim,“Estimating just noticeable distortion for video,”IEEE Transactions on Circuits and Systems for Video Technology,vol.16,no.7,pp.820-829,July2006.
[0010] 文 献 4:Zhenyu Wei,King N.Ngan,”A TEMPORAL JUST-NOTICEABLE DISTORTIONPROFILE FOR VIDEO IN DCT DOMAIN”,15th IEEE International Conference on ImageProcessing,pp:1336-1339 Oct.2008.
[0011] 文 献 5:Xiaokang Yang,Weisi Lin,Zhongkhang Lu,EePing Ong,and Susu Yao,”Motion-Compensated Residue Preprocessing in Video Coding Based on Just-Noticeable-DistortionProfile”,IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY,VOL.15,NO.6,JUNE 2005.
[0012] 文 献 6:Chun-Man Mak,and King Ngi Ngan,”ENHANCING COMPRESSION RATE BYJUSTNOTICEABLE DISTORTION MODEL FOR H.264/AVC”,ISCAS,2009.

发明内容

[0013] 本发明的目的是提供一种基于视觉特性的视频编码系统,以在传输带宽或者存储容量一定的情况下,利用视觉编码的方法提升压缩效率。
[0014] 为达到上述目的,本发明采用如下的技术方案:
[0015] 一种基于视觉特性的视频编码系统,包括:
[0016] -变换域的基于关注度的最小可察觉失真阈值计算模块,该模块进一步包括:
[0017] 关注点提取子模块;
[0018] 关注度调制因子计算子模块,用于通过计算图像的分块和距离此分块最近的关注点所在分块之间的偏心率,计算出关注度调制因子;
[0019] 最小可察觉失真阈值计算子模块,用于通过考虑空间域对比敏感度函数,局部背景的亮度掩蔽效应和纹理掩蔽效应,计算出变换域的最小可察觉失真阈值;
[0020] 基于关注度的最小可察觉失真阈值计算子模块,用于将图像分块的最小可察觉失真阈值和关注度调制因子的乘积作为图像分块的基于关注度的最小可察觉失真阈值;
[0021] -编码模块,该模块进一步包括:
[0022] 空间/时间预测编码子模块用于对视频图像执行空间/时间预测编码;
[0023] 变换子模块,用于对通过空间/时间预测编码部分的信号进行预定的变换;
[0024] 变换域滤波子模块,用于利用变换域的基于关注度的最小可察觉失真阈值,对通过变换部分的信号进行滤波,小于阈值的变换域系数被置为零;
[0025] 量化子模块,用于对通过变换域滤波部分的信号进行预定的量化;
[0026] 熵编码子模块,用于对于量化后的信息进行熵编码;
[0027] 率失真优化子模块,用于比较各种编码模式下的代价函数,选择最优的编码模式。
[0028] 所述最小可察觉失真阈值计算子模块进一步包括空域对比敏感度阈值计算子模块、时域对比敏感度因子计算子模块、亮度掩蔽因子计算子模块、纹理掩蔽因子计算子模块。
[0029] 本发明具有以下优点和积极效果:
[0030] 1)在传输带宽和存储空间有限的情况下,通过建立DCT域的Foveated JND模型,并将其运用到视频编码框架中DCT域的滤波和率失真优化模块,对于H.264JM代码能将降低30.5%的码率开销;
[0031] 2)重建图像的主观质量保持不变,本发明采用对比法进行主观测试,即主观上打出差别分。当主观分数接近0时,说明两种方法的主观质量越接近。本发明的主观分数为0.25,因此说明本发明的主观质量与同量化系数下H.264 JM参考代码相当;
[0032] 3)和现有视频编码标准兼容,本发明属于编码端的优化方法,不涉及修改码流结构,因此可以与现有视频编码标准兼容;
[0033] 4)复杂度不大,本发明没有增加任何高复杂度的编码模块,不会带来复杂度上的提高,复杂度与传统编码方式相当。

附图说明

[0034] 图1是本发明提供的基于视觉特性的视频编码系统的结构图。
[0035] 图2是本发明的基于最小可察觉失真阈值的计算框图。
[0036] 图3是本发明基于Foveated JND视频编码框图。
[0037] 其中,
[0038] 1-变换域的基于关注度的最小可察觉失真阈值计算模块,2-编码模块,11-关注点提取子模块,12-关注度调制因子计算字模块,13-最小可察觉失真阈值计算子模块,14-基于关注度的最小可察觉失真阈值计算子模块,21-空间/时间预测编码子模块,22-变换子模块,23-变换域滤波子模块,24-量化子模块,25-熵编码子模块,26-率失真优化子模块,3-原始序列,4-视频流。

具体实施方式

[0039] 下面以具体实施例结合附图对本发明作进一步说明:
[0040] 本发明提供的基于视觉特性的视频编码系统,具体采用如下技术方案,参见图1,包括以下组成部分:
[0041] ①变换域的基于关注度的最小可察觉失真阈值计算模块1,该模块进一步包括关注点提取子模块11、关注度调制因子计算字模块12、最小可察觉失真阈值计算子模块13、以及基于关注度的最小可察觉失真阈值计算子模块14;
[0042] 其中,关注度调制因子计算字模块12,用于通过计算图像的分块和距离此分块最近的关注点所在分块之间的偏心率,计算出关注度调制因子;
[0043] 最小可察觉失真阈值计算子模块13,用于通过考虑空间域对比敏感度函数,局部背景的亮度掩蔽效应和纹理掩蔽效应,计算出变换域的最小可察觉失真阈值;
[0044] 基于关注度的最小可察觉失真阈值计算子模块14,用于将图像分块的最小可察觉失真阈值和关注度调制因子的乘积作为图像分块的基于关注度的最小可察觉失真阈值;
[0045] ②编码模块2,该模块用于通过变换域的基于关注度的最小可察觉失真阈值,对视频图像进行视觉优化编码,该模块进一步包括空间/时间预测编码子模块21、变换子模块22、变换域滤波子模块23、量化子模块24、熵编码子模块25、率失真优化子模块26;
[0046] 其中,空间/时间预测编码子模块21用于对视频图像执行空间/时间预测编码;
[0047] 变换子模块22,用于对通过空间/时间预测编码部分的信号进行预定的变换;
[0048] 变换域滤波子模块23,用于利用变换域的基于关注度的最小可察觉失真阈值,对通过变换部分的信号进行滤波,小于阈值的变换域系数被置为零;
[0049] 量化子模块24,用于对通过变换域滤波部分的信号进行预定的量化;
[0050] 熵编码子模块25,用于对于量化后的信息进行熵编码;
[0051] 率失真优化子模块26,用于比较各种编码模式下的代价函数,选择最优的编码模式;利用变换域的基于关注度的最小可察觉失真阈值,修改代价函数中的失真部分;首先,将失真信号进行变换;然后,对变换后的失真信号进行滤波,小于阈值的失真信号被置为零;最后,对滤波后的失真信号进行反变换,得到新的失真信号,并参与率失真优化;
[0052] 本系统输入端输入原始序列3,输入端输出编码后的视频流4。
[0053] 下面进一步详细描述本发明所示系统的子模块的实施过程:
[0054] 1、关注点提取子模块
[0055] 对于视频信号,人们往往关注图像中的变化信息。为了降低计算复杂度,本发明将这些变化信息定义为运动信息和对比度信息。本方法将图像分成4x4块,根据其运动特征和图像内容,将显著运动的4x4块或者边缘4x4块设定成关注块,块的几何中心设置成关注点。
[0056] 为了度量块的运动特性,本方法利用块的运动强度和时空域运动的一致性判断宏块的运动情况。
[0057] 首先,计算当前块的运动强度。将当前块和前一帧图像做运动估计,得到当前块的运动矢量,并进行归一化得运动矢量强度I(i,j)。
[0058]
[0059] 其中,dxi,jdyi,j分别为当前块水平和垂直方向上的运动矢量,MaxI为本帧运动矢量强度最大值
[0060] 其次,计算时空域的运动一致性。通过统计当前块时空域相邻块的运动矢量的方向,利用信息熵度量当前块与相邻块运动的一致性,提升判定宏块运动的准确性。空域运动一致性的度量如下:
[0061]
[0062]
[0063] 其中,Cs(i,j)代表空域运动方向分布的一致性,ps(t)表示空域运动方向的分布概率,Ct(i,j)代表空域运动方向分布的一致性,pt(t)表示空域运动方向的分布概率[0064] 最终,宏块的运动显著度图定义如下:
[0065] B(i,j)=I(i,j)×Ct(i,j)×(1-I(i,j)×Cs(i,j))
[0066] 为了度量块的对比度信息,我们利用当前块与其周围块的最大亮度对比度强度、最大红绿对比度强度和最大蓝黄对比度强度来度量对比度强度。
[0067]
[0068]
[0069] 其中,CIi,j为亮度对比度显著度图,CRGi,j为红绿对比度显著度图,CBYi,j为蓝黄对比度显著度图,pi,j指当前块,q指其相邻块,I(.)指分块的亮度分量的平均值,RG(.)指分块的红绿分量的平均值,BY(.)指分块蓝黄分量的平均值。
[0070] 最终将运动显著度图和对比度显著度归一化后,进行线性融合,得到最终的显著度图:
[0071] Si,j=(N(Bi,j)+N(CIi,j)+N(CRGi,j)+N(CBYi,j))/4
[0072] 其中,N(.)是归一化运算操作符
[0073] 由此得到关注块:
[0074]
[0075] 2、关注度调制因子计算子模块
[0076] 在得到关注块的基础上,计算图像中每个分块的偏心率,其计算公式如下:
[0077]
[0078] 其中,x,y为当前块的坐标,xf,yf为离当前块最近的关注块的坐标,V为观测距离。根据所的偏心率,计算各个分块的视觉敏感度频率:
[0079]
[0080] 其中,CT0、e2、α均为常数。
[0081] 由于大于视觉敏感度频率的视频信息无法感知,最终可得关注度调制因子:
[0082]
[0083] 3、最小可察觉失真阈值计算子模块
[0084] 如图2所示,JND阈值分为空域对比敏感度阈值计算子模块、时域对比敏感度因子计算子模块、亮度掩蔽因子计算子模块,以及纹理掩蔽因子计算子模块。
[0085] 1)空域对比敏感度阈值计算子模块
[0086] 空域对比敏感度阈值TBasic(n,i,j)由T(n,i,j)和叠加因子s的乘积得到,其中s为常数,取0.25.
[0087] TBasic(n,i,j)=s×T(n,i,j)
[0088] T(n,i,j)由下式计算得到:
[0089]
[0090] 其中,wij为DCT系数向量所代表的频率的长度, 为DCT系数向量所代表的频率的角度,其余参数为常数,r为0.6,a为1.33,b为0.11,c为0.18,φi为DCT系数归一化因子。
[0091]
[0092] 而wij的计算方式如下:
[0093]
[0094]
[0095] 其中,R一般为3,Pich为图像高度。
[0096] 另外,在得到wij基础上,的计算方式如下:
[0097]
[0098] 2)亮度掩蔽因子计算子模块
[0099]
[0100] 其中,是当前块的平均亮度。
[0101] 3)纹理掩蔽因子计算子模块
[0102] 利用已经得到的边缘像素个数占块内总像素的比率ρedgel,并按照ρedgel将图像划分成平坦块,纹理块和边缘块,根据不同的块类型设置不同的掩蔽因子
[0103]
[0104] 根据BlockType,得到3种块类型的加权因子ψ
[0105]
[0106] 最后,对于高频分量的加权因子做细微调整,得到纹理掩蔽因子
[0107]
[0108] 其中,C(n,i,j)为DCT系数。
[0109] 4)时域对比敏感度因子计算子模块
[0110] 时域对比敏感度因子的计算方法如下:
[0111]
[0112] 其中时间频率ft=fsxvx+fsyvy,fsx、fsy空间频率的水平和垂直分量,vx,vy为物体运动速度
[0113] fsx、fsy计算方法为:
[0114] θ的计算方法同上。
[0115] vx,vy的计算方法如下:
[0116] vh=vIh-vEh(h=x,y)
[0117] 其中,vEh=min[gspem×vIh+vMin,vMax],vIh=ftr×MVh×θh(h=x,y)[0118] gspem为0.98,vMax为80,vMin 0.15,ftr为帧率,MVh为每个块的运动矢量,可由运动估计得到。
[0119] 最终得到时空域JND:
[0120] JND(n,i,j)=TBasic(n,i,j)×Flum(n)×Fcontrast(n,i,j)×FT[0121] 4、基于关注度的最小可察觉失真阈值计算子模块
[0122] 在得到关注度调制因子和JND阈值之后,可得Foveated JND阈值。
[0123] FJND(x,y,t,v,e)=JND(x,y,t)×F(x,y,v,e)
[0124] 其中FJND(x,y,t,v,e)、JND(x,y,t)、F(x,y,v,e)分别对应着Foveated JND阈值,JND阈值,关注度调制因子,v是观测距离,e是距关注点的偏心率。
[0125] 5、基于Foveated JND的视频编码
[0126] 如图3所示,本发明将Foveated JND运用到DCT域的滤波和率失真优化中。首先,如果DCT域残差系数小于Foveated JND,则其可以被丢弃,以此达到节省码率的目的。其次,如果,DCT域信号失真小于Foveated JND,则其可以被置零,用主观失真代替客观失真,优化率失真性能,达到节省码率的目的。本发明在H.264上进行了代码验证,首先得到运动补偿或者帧内预测后的DCT域残差信号Y,对Y进行滤波得:
[0127]
[0128] 本文定义新的率失真模型:
[0129] RDcost=R+λDjnd
[0130] 本文将失真信号D进行DCT变换,得到E,并对E进行滤波后反变换,得到Djnd。其滤波过程为:
[0131]
[0132] 本发明通过建立DCT域的Foveated JND模型,并将其运用到视频编码框架中DCT域的滤波和率失真优化模块,力求在主观质量保持不变的情况下,大幅降低了编码码率,如下表所示显示了本发明的实验结果:
[0133]
[0134]