基于极大极小MV差值的H.264帧间模式优化方法转让专利

申请号 : CN201210143987.3

文献号 : CN102647598B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 罗钧刘衍军杨晓花徐世成姜忠兵

申请人 : 重庆大学

摘要 :

本发明公开了一种基于极大极小MV差值的H.264帧间模式优化方法,包括以下步骤:步骤一:读取待编码的视频帧,并将其划分为16×16的宏块;步骤二:对当前需要编码的宏块进行SKIP模式的多次优先判决,如果其最佳编码模式为SKIP模式,则进入步骤四;如果其最佳编码模式不为SKIP模式,则进入步骤三;步骤三:根据本发明的基于极大极小MV差值判决方法,缩小帧间模式选取范围,最后根据率失真优化理论选择最佳编码模式;步骤四:根据确定的最佳编码模式完成对当前编码块的编码,继续下一编码块。应用本方法可以在保证视频编码质量的前提下,同时极大地降低算法复杂度和视频压缩码率,满足编码实时性要求。

权利要求 :

1.基于极大极小MV差值的H.264帧间模式优化方法,其特征在于:所述优化方法包括以下步骤:步骤一:读取待编码的视频帧,并将其划分为16×16的宏块;

步骤二:对当前需要编码的宏块进行SKIP模式的多次优先判决,如果其最佳编码模式为SKIP模式,则进入步骤四;如果其最佳编码模式不为SKIP模式,则进入步骤三;

步骤三:在对当前编码块进行帧间编码时,根据相邻已编码块的分割信息与运动矢量MV差值信息,可以判定当前编码块的运动剧烈情况,进而缩小搜索模式范围,选取最佳编码模式;

步骤四:根据确定的最佳编码模式完成对当前编码块的编码,继续下一编码块;

所述步骤二的最佳编码模式判断包括以下步骤:

步骤21:根据已编码块的SAD信息,定义用于判定宏块编码模式的阈值TH1、TH2;

步骤22:将当前需要编码的宏块与前一帧图像的相同位置的图像进行比较,如果像素差满足Δ≤TH1,则认为当前编码块是静止块,采取SKIP模式编码;

否则,计算16×16模式的绝对差值和SAD,将SAD与阈值TH2比较,若SAD≤TH2,则采用SKIP模式;否则,计算16×16模式与SKIP模式的匹配误差函数值J,若JSKIP≤J16×16,仍然采用SKIP模式编码;

步骤23:若JSKIP>J16×16,则判断SKIP模式不是其最佳编码模式;

所诉步骤三的最佳编码模式判断包括以下步骤:

步骤31:根据相邻已编码块的MV信息,将MV分解到x和y分量,那么MV在x与y分量的差值大小就可以反映当前编码块的运动情况;

步骤32:求取MV在x与y分量的极大极小值MVxmax、MVxmin、MVymax、MVymin,那么就可以得到极大极小差值|MVxmax-MVxmin|与|MVymax-MVymin|,如果这两个差值表明临近已编码块的运动矢量较小,运动比较平缓,那么根据图像块的空间相关性与运动连续性,判定当前编码块的运动幅度比较小;

步骤33:如果极大极小差值满足|MVxmax-MVxmin|≤THx与|MVymax-MVymin|≤THy,那么就可以判断当前编码块的运动比较平缓,从而把搜索范围限制在16×16、16×8、8×16的大尺寸里,否则限制在8×8、8×4、4×8、4×4小尺寸范围里;

步骤34:根据率失真优化理论选取最优编码模式,即选取代价函数值最小的作为最佳编码模式;

在帧间模式选取过程中,SAD与J通过以下公式计算得到:

J(MV,λ)=SAD(s,c(MV))+λ*R(MV-PMV),其中:SAD是绝对差值和,J是匹配误差函数,S是当前编码块的原始数据,c是已编码重建的用于进行搜索运动补偿的参考帧的数据,MV是当前模式下搜索的运动矢量,λ为拉格朗日常数,PMV为中值预测矢量。

说明书 :

基于极大极小MV差值的H.264帧间模式优化方法

技术领域

[0001] 本发明涉及的是视频编码压缩领域,主要是针对高清视频数据量大、处理速度慢、在实际应用中局限性大以及H.264算法在提高编码效率同时增大计算复杂度的缺点而提出的。

背景技术

[0002] 高清视频的优越性是公认的,它具有直观性、确切性、高效性、广泛性等优点。但是由于其信息量的庞大,存储与传输高清视频信息就会付出很大的代价,因此高效的对其进行压缩编码是一个关键问题。
[0003] 传统的视频压缩编码标准主要有H.261、MPEG-1、H.262、MPEG-2、MPEG-3、H.263、MPEG-4等,这些标准都可以在满足一定的视频质量前提下达到压缩编码的目的。MPEG和VCEG联合开发一个比早期研发的MPEG和H.263性能更好的视频压缩编码标准,即H.264。H.264通过采用一些关键技术,如多模式帧内帧间预测、SP/SI帧技术、整数变换、CAVLC和CABAC熵编码等,可以大大提升编码性能。
[0004] H.264采用块大小可变的如图1所示的7种运动估计模式的穷尽搜索算法。在进行帧间模式判决时,对每一种模式进行搜索,最后根据率失真理论选择最优模式编码,虽然提高了率失真性能,但同时也大大提高算法复杂度,降低了编码实时性。而且运动估计占据整个编码计算量的一半以上,它直接影响视频压缩的编码效率和质量。

发明内容

[0005] 有鉴于此,本发明的目的是提供一种基于极大极小MV差值的H.264帧间模式优化方法,可以平衡失真度和运算复杂度,在保证编码质量的前提下,降低算法复杂度,达到编码实时性要求。
[0006] 本发明的目的是通过以下技术方案实现的:
[0007] 该种基于极大极小MV差值的H.264帧间模式优化方法,包括以下步骤:
[0008] 步骤一:读取待编码的视频帧,并将其划分为16×16的宏块;
[0009] 步骤二:对当前需要编码的宏块进行SKIP模式的多次优先判决,如果其最佳编码模式为SKIP模式,则进入步骤四;如果其最佳编码模式不为SKIP模式,则进入步骤三;
[0010] 步骤三:在对当前编码块进行帧间编码时,根据相邻已编码块的分割信息与运动矢量MV差值信息,可以判定当前编码块的运动剧烈情况,进而缩小搜索模式范围,选取最佳编码模式。
[0011] 步骤四:根据确定的最佳编码模式完成对当前编码块的编码,继续下一编码块。
[0012] 进一步,所述步骤二的最佳编码模式判断包括以下步骤:
[0013] 步骤1:根据已编码块的SAD信息,定义用于判定宏块编码模式的阈值TH1、TH2;
[0014] 步骤2:将当前需要编码的宏块与前一帧图像的相同位置的图像进行比较,如果像素差满足Δ≤TH1,则认为当前编码块是静止块,采取SKIP模式编码;
[0015] 否则,计算16×16模式的绝对差值和SAD,将SAD与阈值TH2比较,若SAD≤TH2,则采用SKIP模式;否则,计算16×16模式与SKIP模式的匹配误差函数值J,若JSKIP≤J16×16,仍然采用SKIP模式编码;
[0016] 步骤3:若JSKIP>J16×16,则判断SKIP模式不是其最佳编码模式。
[0017] 进一步,所述步骤三的最佳编码模式判断包括:
[0018] 步骤1:根据相邻已编码块的MV信息,将MV分解到x和y分量,那么MV在x与y分量的差值大小就可以反映当前编码块的运动情况;
[0019] 步骤2:求取MV在x与y分量的极大极小值MVxmax、MVxmin、MVymax、MVymin,那么就可以得到极大极小差值|MVxmax-MVxmin|与|MVymax-MVymin|,如果这两个差值表明临近已编码块的运动矢量较小,运动比较平缓,那么根据图像块的空间相关性与运动连续性,判定当前编码块的运动幅度比较小;
[0020] 步骤3:如果极大极小差值满足|MVxmax-MVxmin|≤THx与|MVymax-MVymin|≤THy,那么就可以判断当前编码块的运动比较平缓,从而把搜索范围限制在16×16、16×8、8×16的大尺寸里,否则限制在8×8、8×4、4×8、4×4小尺寸范围里;
[0021] 步骤4:根据率失真优化理论选取最优编码模式,即选取代价函数值最小的作为最佳编码模式。
[0022] 进一步,在帧间模式选取过程中,SAD与J通过以下公式计算得到:
[0023]
[0024] J(MV,λ)=SAD(s,c(MV))+λ*R(MV-PMV);
[0025] 其中:SAD是绝对差值和,J是匹配误差函数,S是当前编码块的原始数据,c是已编码重建的用于进行搜索运动补偿的参考帧的数据,MV是当前模式下搜索的运动矢量,λ为拉格朗日常数,PMV为中值预测矢量。
[0026] 本发明的有益效果是:
[0027] 应用该方案可以在保证编码质量的前提下,保证高清视频质量,同时极大地降低了算法复杂度和视频压缩码率。在高清视频的压缩编码领域里可以应用本发明减少编码时间,满足实时通信,解决高清视频数据量大难以满足实时性的瓶颈问题。
[0028] 本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

[0029] 为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
[0030] 图1运动估计分割模式示意图;
[0031] 图2图像的空间相关性示意图;
[0032] 图3帧间模式判决优化流程图。

具体实施方式

[0033] 以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
[0034] 传统的帧间模式预测是对7种模式按照16×16到4×4进行运动估计和运动补偿,然后根据率失真理论获取最优的预测模式。但是各种分块模式在图像压缩编码里不是等概率分布,往往差别还很大,那么如果提前限制预测模式的范围,就可以大大减少搜索时间与计算量。本发明就是基于这种思想,根据一定的阈值比较结果,提前排除一些小概率的预测模式。
[0035] 根据统计表明一幅图像的平坦部分一般占据了大部分,而细节部分只有小部分。对于这些图像的多数编码块图像进行残差变换、量化、编码的结果会全是零或接近于零,使得所有的编码操作都是冗余的。那么优先进行这种SKIP模式多次判决就可以最快得到最优预测模式,去除后面不必要的模式判断。
[0036] 在帧间模式的7种模式里,可以分为16×16、16×8、8×16大尺寸分割与8×8、8×4、4×8、4×4小尺寸两种分割模式。对于运动平缓的块,可以在大尺寸模式范围里搜索,反之,对于运动剧烈的块就可在小尺寸模式范围里搜索。如图1所示的预测模式里,对于细节较多的编码块可以选取小尺寸模式,对于细节较少的编码块可以选取大尺寸模式,这样就可以使得MV、分割类型、残差信息等的比特数最少,达到压缩的目的。
[0037] 对于不同的尺寸分割,基于运动矢量MV、分割类型比特数与残差比特数的平衡,快速选取最优预测模式是一个提高编码效率与性能的关键问题。一幅图像的空间相邻块具有如图2所示的相关性,所以它们的运动趋势也是具有相关性的。根据相邻已编码块的模式信息可以判断当前编码块的运动情况,从而确定预测模式范围。
[0038] 本发明根据上述优化思想提出基于极大极小MV差值的H.264帧间模式优化方案,应用该方案可以保证高清视频质量,同时极大降低算法复杂度和视频压缩码率。
[0039] 如图3所示,本发明的优化方法包括以下步骤:
[0040] 步骤一:读取待编码的视频帧,并将其划分为16×16的宏块;
[0041] 步骤二:对当前需要编码的宏块进行SKIP模式的多次优先判决,如果其最佳编码模式为SKIP模式,则进入步骤四;如果其最佳编码模式不为SKIP模式,则进入步骤三;
[0042] 步骤三:在对当前编码块进行帧间编码时,根据相邻已编码块的分割信息与运动矢量MV差值信息,可以判定当前编码块的运动剧烈情况,进而缩小搜索模式范围,选取最佳编码模式;
[0043] 步骤四:根据确定的最佳编码模式完成对当前编码块的编码,继续下一编码块。
[0044] 其中,上述步骤二的最佳编码模式判断可以采用多种方法,如图像数据块的均匀性检验、图像的纹理特征、编码模式的统计分类选择等,本实施例中采用的方法包括以下步骤:
[0045] 步骤1:根据已编码块的SAD信息,定义用于判定宏块编码模式的阈值TH1、TH2;
[0046] 步骤2:将当前需要编码的宏块与前一帧图像的相同位置的图像进行比较,如果像素差满足Δ≤TH1,则认为当前编码块是静止块,采取SKIP模式编码;
[0047] 否则,计算16×16模式的绝对差值和SAD,将SAD与阈值TH2比较,若SAD≤TH2,则采用SKIP模式;否则,计算16×16模式与SKIP模式的匹配误差函数值J,若JSKIP≤J16×16,仍然采用SKIP模式编码;
[0048] 步骤3:若JSKIP>J16×16,则判断SKIP模式不是其最佳编码模式。
[0049] 本实施例中,上述步骤三的最佳编码模式判断包括以下步骤:
[0050] 步骤1:根据相邻已编码块的MV信息,将MV分解到x和y分量,那么MV在x与y分量的差值大小就可以反映当前编码块的运动情况;
[0051] 步骤2:求取MV在x与y分量的极大极小值MVxmax、MVxmin、MVymax、MVymin,那么就可以得到极大极小差值|MVxmax-MVxmin|与|MVymax-MVymin|,如果这两个差值表明临近已编码块的运动矢量都比较小,运动比较平缓,根据图像块的空间相关性与运动连续性,判定当前编码块的运动幅度比较小;
[0052] 步骤3:如果极大极小差值满足|MVxmax-MVxmin|≤THx与|MVymax-MVymin|≤THy,那么就可以判断当前编码块的运动比较平缓,从而把搜索范围限制在16×16、16×8、8×16的大尺寸里,否则限制在8×8、8×4、4×8、4×4小尺寸范围里;
[0053] 步骤4:根据率失真优化理论选取最优编码模式,即选取代价函数值最小的作为最佳编码模式,需要说明的是根据率失真优化理论选择最佳编码模式的方法是H.264里的常用方法,在此不再赘述。
[0054] 在上述的帧间模式选取过程中,SAD与J通过以下公式计算得到:
[0055]
[0056] J(MV,λ)=SAD(s,c(MV))+λ*R(MV-PMV);
[0057] 其中:SAD是绝对差值和,J是匹配误差函数。S是当前编码块的原始数据,c是已编码重建的用于进行搜索运动补偿的参考帧的数据,MV是当前模式下搜索的运动矢量,λ为拉格朗日常数,PMV为中值预测矢量。
[0058] 最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。