候选者,可实现改进的压缩。在视频译码中用于双向预测帧间模式的运动向量预测符(MVP)转让专利

申请号 : CN201280012024.8

文献号 : CN103430540B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑云非钱威俊马尔塔·卡切维奇

申请人 : 高通股份有限公司

摘要 :

本发明描述适用于使用自适应运动向量预测AMVP的双向预测帧间模式的视频译码技术。特定来说,本发明描述用于编码或解码视频数据的技术,其中使用AMVP来译码与以所述双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。更具体来说,本发明描述若干技术,其中可使用双向预测视频块的一个运动向量来界定用于预测所述双向预测视频块的另一运动向量的候选运动向量预测符MVP。在许多实例中,将所述双向预测视频块的所述第一运动向量的缩放版本用作用于所述双向预测视频块的所述第二运动向量的所述MVP。通过界定用于双向预测视频块的所述第二运动向量的额外MVP(56)对比文件Yunfei Zheng_et_al.Extended MotionVector Prediction for Bi predictive Mode.《Joint Collaborative Team on Video Coding(JCT-VC) of ITU-T SG16 WP3 and ISO/IECJTC1/SC29/WG11》.2011,Yunfei Zheng_et_al.Extended MotionVector Prediction for Bi predictive Mode.《Joint Collaborative Team on Video Coding(JCT-VC) of ITU-T SG16 WP3 and ISO/IECJTC1/SC29/WG11》.2011,Guillaume Laroche _et_al.RD OptimizedCoding for Motion Vector PredictorSelection《.Circuits and Systems for VideoTechnology》.2008,第18卷(第12期),Guillaume Laroche _et_al.RD OptimizedCoding for Motion Vector PredictorSelection《.Circuits and Systems for VideoTechnology》.2008,第18卷(第12期),

权利要求 :

1.一种解码视频数据的方法,其中使用自适应运动向量预测AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量,所述方法包含:接收与所述第一运动向量相关联的第一运动向量差异MVD;

接收识别第一运动向量预测符MVP的第一索引;

基于所述第一MVD和所述第一MVP而产生所述第一运动向量;

接收与所述第二运动向量相关联的第二MVD;

接收识别第二MVP的第二索引,其中基于所述第一运动向量来界定所述第二MVP;以及基于所述第二MVD和所述第二MVP而产生所述第二运动向量;

其中所述第一运动向量与第一列表相关联,并且所述第二运动向量与第二列表相关联;以及其中所述第二MVP包含所述第一运动向量的缩放版本。

2.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量和所述第二运动向量指向与同一预测帧相关联的数据,且所述第二MVP为所述第一运动向量。

3.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与另一先前帧相关联的数据。

4.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与另一后续帧相关联的数据。

5.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,其中所述先前帧相对于当前帧的时间距离与所述后续帧相对于所述当前帧的时间距离相同。

6.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,其中所述后续帧相对于当前帧的时间距离与所述先前帧相对于所述当前帧的时间距离相同。

7.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,其中所述先前帧相对于当前帧的时间距离不同于所述后续帧相对于所述当前帧的时间距离。

8.根据权利要求1所述的解码视频数据的方法,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,其中所述后续帧相对于当前帧的时间距离不同于所述先前帧相对于所述当前帧的时间距离。

9.根据权利要求1所述的解码视频数据的方法,其中所述当前视频块包含根据高效率视频译码HEVC标准而界定的译码单元CU,其中根据四叉树分割方案相对于最大译码单元LCU来界定所述CU,所述方法进一步包含:接收界定所述四叉树分割方案的LCU语法数据;以及

接收所述CU的模式信息,其界定所述双向预测帧间模式。

10.根据权利要求1所述的解码视频数据的方法,其中所述当前视频块包含译码单元CU的预测单元PU,根据高效率视频译码HEVC标准来界定所述预测单元PU,所述方法进一步包含:接收所述PU的模式信息,其界定所述双向预测帧间模式。

11.根据权利要求1所述的解码视频数据的方法,所述方法进一步包含:基于所述第一运动向量和所述第二运动向量来预测地解码所述当前视频块。

12.一种编码视频数据的方法,其中使用自适应运动向量预测AMVP来译码与根据双向预测帧间模式的当前视频块相关联的第一运动向量和第二运动向量,所述方法包含:确定待用于以所述双向预测帧间模式来译码所述当前视频块的所述第一运动向量;

基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一运动向量预测符MVP;

产生识别所述第一MVP的第一索引;

基于所述第一运动向量和所述第一MVP而产生第一运动向量差异MVD;

确定待用于以所述双向预测帧间模式来译码所述当前视频块的所述第二运动向量;

基于运动向量的第二集合来识别第二MVP,其中运动向量的所述第二集合包括与所述相邻视频块中的一者或一者以上相关联的运动向量和基于所述第一运动向量的候选者,且其中所述第二MVP是基于所述第一运动向量的所述候选者;

产生识别所述第二MVP的第二索引;

基于所述第二运动向量和所述第二MVP而产生第二MVD;以及将所述第一索引、所述第一MVD、所述第二索引和所述第二MVD作为所述当前视频块的经编码位流的部分而输出;

其中所述第一运动向量与第一列表相关联,并且所述第二运动向量与第二列表相关联;以及其中所述第二MVP包含所述第一运动向量的缩放版本。

13.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量和所述第二运动向量指向与同一预测帧相关联的数据,且所述第二MVP是所述第一运动向量。

14.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与另一先前帧相关联的数据。

15.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与另一后续帧相关联的数据。

16.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,且其中所述先前帧相对于当前帧的时间距离与所述后续帧相对于所述当前帧的时间距离相同。

17.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,且其中所述后续帧相对于当前帧的时间距离与所述先前帧相对于所述当前帧的时间距离相同。

18.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,且其中所述先前帧相对于当前帧的时间距离不同于所述后续帧相对于所述当前帧的时间距离。

19.根据权利要求12所述的编码视频数据的方法,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,且其中所述后续帧相对于当前帧的时间距离不同于所述先前帧相对于所述当前帧的时间距离。

20.根据权利要求12所述的编码视频数据的方法,其中所述当前视频块包含以下各者中的一者:译码单元CU,其是根据高效率视频译码HEVC标准而界定,其中根据四叉树分割方案相对于最大译码单元LCU来界定所述CU;以及所述CU的预测单元PU,其是根据所述HEVC标准而界定。

21.一种解码视频数据的视频解码装置,所述视频解码装置包含:视频解码器,其经配置以:

接收与第一运动向量相关联的第一运动向量差异MVD;

接收识别第一运动向量预测符MVP的第一索引;

基于所述第一MVD和所述第一MVP而产生所述第一运动向量;

接收与第二运动向量相关联的第二MVD;

接收识别第二MVP的第二索引,其中所述第二MVP是基于所述第一运动向量而界定;以及基于所述第二MVD和所述第二MVP而产生所述第二运动向量;

其中所述第一运动向量与第一列表相关联,并且所述第二运动向量与第二列表相关联;以及其中所述第二MVP包含所述第一运动向量的缩放版本。

22.根据权利要求21所述的视频解码装置,其中所述第一运动向量和所述第二运动向量指向与同一预测帧相关联的数据,且所述第二MVP为所述第一运动向量。

23.根据权利要求21所述的视频解码装置,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与另一先前帧相关联的数据。

24.根据权利要求21所述的视频解码装置,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与另一后续帧相关联的数据。

25.根据权利要求21所述的视频解码装置,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,其中所述先前帧相对于当前帧的时间距离与所述后续帧相对于所述当前帧的时间距离相同。

26.根据权利要求21所述的视频解码装置,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,其中所述后续帧相对于当前帧的时间距离与所述先前帧相对于所述当前帧的时间距离相同。

27.根据权利要求21所述的视频解码装置,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,其中所述先前帧相对于当前帧的时间距离不同于所述后续帧相对于所述当前帧的时间距离。

28.根据权利要求21所述的视频解码装置,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,其中所述后续帧相对于当前帧的时间距离不同于所述先前帧相对于所述当前帧的时间距离。

29.根据权利要求21所述的视频解码装置,其中当前视频块包含根据高效率视频译码HEVC标准而界定的译码单元CU,其中所述CU是根据四叉树分割方案相对于最大译码单元LCU而界定,所述视频解码装置进一步:接收界定所述四叉树分割方案的LCU语法数据;以及

接收所述CU的模式信息,其界定双向预测帧间模式。

30.根据权利要求21所述的视频解码装置,其中当前视频块包含译码单元CU的预测单元PU,所述预测单元PU是根据高效率视频译码HEVC标准而界定,其中所述视频解码器:接收所述PU的模式信息,其界定双向预测帧间模式。

31.根据权利要求21所述的视频解码装置,其中所述视频解码器基于所述第一运动向量和所述第二运动向量来预测地解码当前视频块。

32.根据权利要求21所述的视频解码装置,其中所述视频解码器包括:熵解码单元,其经配置以接收并熵解码所述第一MVD、所述第一索引、所述第二MVD和所述第二索引;以及预测单元,其经配置以基于所述第一MVD和所述第一MVP而产生所述第一运动向量,且基于所述第二MVD和所述第二MVP而产生所述第二运动向量。

33.根据权利要求21所述的视频解码装置,其中所述视频解码装置包含以下各者中的一者或一者以上:集成电路;

微处理器;以及

包括视频解码器的无线通信装置。

34.一种编码视频数据的视频编码装置,所述视频编码装置包含:视频编码器,其经配置以:

确定待用于以双向预测帧间模式来译码当前视频块的第一运动向量;

基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一运动向量预测符MVP;

产生识别所述第一MVP的第一索引;

基于所述第一运动向量和所述第一MVP而产生第一运动向量差异MVD;

确定待用于以所述双向预测帧间模式来译码所述当前视频块的第二运动向量;

基于运动向量的第二集合来识别第二MVP,其中运动向量的所述第二集合包括与所述相邻视频块中的一者或一者以上相关联的运动向量和基于所述第一运动向量的候选者,且其中所述第二MVP是基于所述第一运动向量的所述候选者;

产生识别所述第二MVP的第二索引;

基于所述第二运动向量和所述第二MVP而产生第二MVD;以及将所述第一索引、所述第一MVD、所述第二索引和所述第二MVD作为所述当 前视频块的经编码位流的部分而输出;

其中所述第一运动向量与第一列表相关联,并且所述第二运动向量与第二列表相关联;以及其中所述第二MVP包含所述第一运动向量的缩放版本。

35.根据权利要求34所述的视频编码装置,其中所述第一运动向量和所述第二运动向量指向与同一预测帧相关联的数据,且所述第二MVP是所述第一运动向量。

36.根据权利要求34所述的视频编码装置,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与另一先前帧相关联的数据。

37.根据权利要求34所述的视频编码装置,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与另一后续帧相关联的数据。

38.根据权利要求34所述的视频编码装置,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,且其中所述先前帧相对于当前帧的时间距离与所述后续帧相对于所述当前帧的时间距离相同。

39.根据权利要求34所述的视频编码装置,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,且其中所述后续帧相对于当前帧的时间距离与所述先前帧相对于所述当前帧的时间距离相同。

40.根据权利要求34所述的视频编码装置,其中所述第一运动向量指向与先前帧相关联的数据,且所述第二运动向量指向与后续帧相关联的数据,且其中所述先前帧相对于当前帧的时间距离不同于所述后续帧相对于所述当前帧的时间距离。

41.根据权利要求34所述的视频编码装置,其中所述第一运动向量指向与后续帧相关联的数据,且所述第二运动向量指向与先前帧相关联的数据,且其中所述后续帧相对于当前帧的时间距离不同于所述先前帧相对于所述当前帧的时间距离。

42.根据权利要求34所述的视频编码装置,其中所述当前视频块包含以下各者中的一者:译码单元CU,其是根据高效率视频译码HEVC标准而界定,其中所述CU是根据四叉树分割方案相对于最大译码单元LCU而界定;以及所述CU的预测单元PU,其是根据所述HEVC标准而界定。

43.根据权利要求34所述的视频编码装置,其中所述视频编码装置包含以下各者中的一者或一者以上:集成电路;

微处理器;以及

包括视频编码器的无线通信装置。

44.一种用于解码视频数据的装置,其中使用自适应运动向量预测AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量,所述装置包含:用于接收与所述第一运动向量相关联的第一运动向量差异MVD的装置;

用于接收识别第一运动向量预测符MVP的第一索引的装置;

用于基于所述第一MVD和所述第一MVP而产生所述第一运动向量的装置;

用于接收与所述第二运动向量相关联的第二MVD的装置;

用于接收识别第二MVP的第二索引的装置,其中所述第二MVP是基于所述第一运动向量而界定;以及用于基于所述第二MVD和所述第二MVP而产生所述第二运动向量的装置;

其中所述第一运动向量与第一列表相关联,并且所述第二运动向量与第二列表相关联;以及其中所述第二MVP包含所述第一运动向量的缩放版本。

45.一种用于编码视频数据的装置,其中使用自适应运动向量预测AMVP来译码与根据双向预测帧间模式的当前视频块相关联的第一运动向量和第二运动向量,所述装置包含:用于确定待用于以所述双向预测帧间模式来译码所述当前视频块的所述第一运动向量的装置;

用于基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一运动向量预测符MVP的装置;

用于产生识别所述第一MVP的第一索引的装置;

用于基于所述第一运动向量和所述第一MVP而产生第一运动向量差异MVD的装置;

用于确定待用于以所述双向预测帧间模式来译码所述当前视频块的所述第二运动向量的装置;

用于基于运动向量的第二集合来识别第二MVP的装置,其中运动向量的所述第二集合包括与所述相邻视频块中的一者或一者以上相关联的运动向量和基于所述第一运动向量的候选者,且其中所述第二MVP是基于所述第一运动向量的所述候选者;

用于产生识别所述第二MVP的第二索引的装置;

用于基于所述第二运动向量和所述第二MVP而产生第二MVD的装置;以及用于将所述第一索引、所述第一MVD、所述第二索引和所述第二MVD作为所述当前视频块的经编码位流的部分而输出的装置;

其中所述第一运动向量与第一列表相关联,并且所述第二运动向量与第二列表相关联;以及其中所述第二MVP包含所述第一运动向量的缩放版本。

说明书 :

在视频译码中用于双向预测帧间模式的运动向量预测符

(MVP)

[0001] 本申请案主张2011年3月8日申请的第61/450,537号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。

技术领域

[0002] 本发明涉及用以压缩视频数据的视频译码技术,且更特定来说涉及用于视频压缩中的自适应运动向量预测(AMVP)。

背景技术

[0003] 数字视频能力可被并入到广泛范围的视频装置中,所述视频装置包括数字电视、数字直播系统、无线通信装置(例如无线电话手持机、无线广播系统)、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台、个人多媒体播放器和其类似者。这些视频装置可实施视频压缩技术(例如MPEG-2、MPEG-4或ITU-T H.264/MPEG-4部分10高级视频译码(AVC)中所描述的视频压缩技术),以便压缩视频数据。视频压缩技术执行空间和/或时间预测以减少或移除视频序列中固有的冗余。新的视频标准(例如正由“联合合作团队-视频译码”(JCTVC)开发的高效率视频译码(HEVC)标准,其为MPEG与ITU-T之间的合作)不断涌现和演变。有时将所述新兴的HEVC标准称为H.265。
[0004] 这些和其它视频译码标准和技术使用基于块的视频译码。基于块的视频译码技术将视频帧(或其部分)的视频数据划分为视频块,且接着使用基于预测块的压缩技术来编码所述视频块。可进一步将所述视频块划分为视频块分区。视频块(或其分区)可称为译码单元(CU)或预测单元(PU),且可使用一种或一种以上视频特定编码技术以及一股数据压缩技术来编码。可选择和使用不同模式来译码视频块。
[0005] 通过新兴的HEVC标准,可根据四叉树分割方案将最大译码单元(LCU)划分为越来越小的CU。可基于所谓的PU来预测所述CU,所述PU可具有对应于所述CU的大小或小于所述CU的大小的分区块大小,使得可使用多个PU来预测给定CU。
[0006] 可使用不同模式来编码CU。举例来说,可基于同一帧或切片内的预测数据而使用 不同帧内编码模式来译码CU以便利用视频帧内的空间冗余。替代地,可基于来自另一帧或切片的预测数据而使用帧间译码模式来译码CU,以便利用跨越视频序列的帧的时间冗余。在根据所选模式来执行预测译码之后,可执行变换译码,例如离散余弦变换(DCT)、整数变换或其类似者。通过HEVC,可关于变换单元(TU)而发生变换译码,所述TU还可在HEVC标准中具有变化的变换大小。还可执行变换系数的量化、经量化变换系数的扫描和熵编码。语法信息与经编码的视频数据一起被用信号发送(例如,在视频切片标头或视频块标头中),以便向解码器通知如何解码视频数据。其中,所述语法信息可识别在对不同视频块进行视频译码中所使用的模式。

发明内容

[0007] 本发明描述适用于使用自适应运动向量预测(AMVP)的双向预测帧间模式的视频编码和解码技术。具体来说,本发明描述用于编码或解码视频数据的技术,其中使用AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。更具体来说,本发明描述若干技术,其中可使用双向预测视频块的一个运动向量来界定用于预测所述双向预测视频块的另一运动向量的候选运动向量预测符(MVP)。在许多实例中,将双向预测视频块的第一运动向量的缩放版本用作用于所述双向预测视频块的第二运动向量的MVP。以此方式,通过界定用于双向预测视频块的第二运动向量的额外MVP候选者,可实现改进的压缩。
[0008] 在一个实例中,本发明描述一种解码视频数据的方法,其中使用AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。所述方法包含:接收与第一运动向量相关联的第一运动向量差异(MVD);接收识别第一MVP的第一索引;以及基于所述第一MVD和所述第一MVP而产生第一运动向量。所述方法还包含:接收与第二运动向量相关联的第二MVD;接收识别第二MVP的第二索引,其中所述第二MVP是基于第一运动向量而界定;以及基于所述第二MVD和所述第二MVP而产生第二运动向量。
[0009] 在另一实例中,本发明描述一种编码视频数据的方法,其中使用AMVP来译码与根据双向预测帧间模式的当前视频块相关联的第一运动向量和第二运动向量。所述方法包含:确定待用于以双向预测帧间模式来译码当前视频块的第一运动向量;基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一MVP;产生识别所述第一MVP的第一索引;以及基于所述第一运动向量和所述第一MVP而产生第一MVD。所述方法还包含:确定待用于以双向预测帧间模式来译码当前视频块的第二运动向量;基 于运动向量的第二集合来识别第二MVP,其中运动向量的第二集合包括与相邻视频块中的一者或一者以上相关联的运动向量和基于第一运动向量的候选者;产生识别第二MVP的第二索引;基于所述第二运动向量和所述第二MVP而产生第二MVD;以及将第一索引、第一MVD、第二索引和第二MVD作为当前视频块的经编码位流的部分而输出。
[0010] 在另一实例中,本发明描述解码视频数据的视频解码装置。所述视频解码装置包含视频解码器,所述视频解码器经配置以:接收与第一运动向量相关联的第一MVD;接收识别第一MVP的第一索引;以及基于所述第一MVD和所述第一MVP而产生第一运动向量。所述视频解码器还经配置以:接收与第二运动向量相关联的第二MVD;接收识别第二MVP的第二索引,其中所述第二MVP是基于第一运动向量而界定;以及基于所述第二MVD和所述第二MVP而产生第二运动向量。
[0011] 在另一实例中,本发明描述编码视频数据的视频编码装置。所述视频编码装置包含视频编码器,所述视频编码器经配置以:确定待用于以双向预测帧间模式来译码当前视频块的第一运动向量;基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一MVP;产生识别所述第一MVP的第一索引;以及基于所述第一运动向量和所述第一MVP而产生第一MVD。所述视频编码器还经配置以:确定待用于以双向预测帧间模式来译码当前视频块的第二运动向量;基于运动向量的第二集合来识别第二MVP,其中运动向量的第二集合包括与相邻视频块中的一者或一者以上相关联的运动向量和基于第一运动向量的候选者;产生识别第二MVP的第二索引;基于所述第二运动向量和所述第二MVP而产生第二MVD;以及将第一索引、第一MVD、第二索引和第二MVD作为当前视频块的经编码位流的部分而输出。
[0012] 在另一实例中,本发明描述一种用于解码视频数据的装置,其中使用AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。所述装置包含:用于接收与第一运动向量相关联的第一MVD的装置;用于接收识别第一MVP的第一索引的装置;用于基于所述第一MVD和所述第一MVP而产生第一运动向量的装置;用于接收与第二运动向量相关联的第二MVD的装置;用于接收识别第二MVP的第二索引的装置,其中所述第二MVP是基于第一运动向量而界定;以及用于基于所述第二MVD和所述第二MVP而产生第二运动向量的装置。
[0013] 在另一实例中,本发明描述一种用于编码视频数据的装置,其中使用AMVP来译码与根据双向预测帧间模式的当前视频块相关联的第一运动向量和第二运动向量。所述装置包含:用于确定待用于以双向预测帧间模式来译码当前视频块的第一运动向量的装置;用于基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一 MVP的装置;用于产生识别所述第一MVP的第一索引的装置;用于基于所述第一运动向量和所述第一MVP而产生第一MVD的装置;用于确定待用于以双向预测帧间模式来译码当前视频块的第二运动向量的装置;用于基于运动向量的第二集合来识别第二MVP的装置,其中运动向量的第二集合包括与相邻视频块中的一者或一者以上相关联的运动向量和基于第一运动向量的候选者;用于产生识别第二MVP的第二索引的装置;用于基于所述第二运动向量和所述第二MVP而产生第二MVD的装置;以及用于将第一索引、第一MVD、第二索引和第二MVD作为当前视频块的经编码位流的部分而输出的装置。
[0014] 可以硬件、软件、固件或其任何组合来实施本发明中所描述的技术。举例来说,各种技术可通过一个或一个以上处理器来实施或执行。如本文中所使用,处理器可指代微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP),或其它等效集成电路或离散逻辑电路。软件可通过一个或一个以上处理器来执行。包含执行所述技术的指令的软件可最初存储于计算机可读媒体中,且通过处理器加载并执行。
[0015] 因此,本发明还预期包含指令的计算机可读存储媒体,所述指令致使处理器执行本发明中所描述的任何所述技术。在一些状况下,计算机可读存储媒体可形成计算机程序存储产品的部分,可将所述计算机程序存储产品售卖给制造商和/或用于装置中。计算机程序产品可包括计算机可读媒体,且在一些状况下还可包括封装材料。
[0016] 具体来说,本发明还描述一种包含指令的计算机可读媒体,所述指令在执行后即刻致使处理器解码视频数据,其中使用AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。所述指令致使处理器在接收到与第一运动向量相关联的第一MVD后且在接收到识别第一MVP的第一索引后即刻基于所述第一MVD和所述第一MVP而产生第一运动向量。另外,所述指令致使处理器在接收到与第二运动向量相关联的第二MVD后且在接收到识别第二MVP(其中所述第二MVP是基于第一运动向量而界定)的第二索引后即刻基于所述第二MVD和所述第二MVP而产生第二运动向量。
[0017] 在又一实例中,本发明描述一种包含指令的计算机可读媒体,所述指令在执行后即刻致使处理器编码视频数据,其中使用AMVP来译码与根据双向预测帧间模式的当前视频块相关联的第一运动向量和第二运动向量。所述指令致使处理器:确定待用于以双向预测帧间模式来译码当前视频块的第一运动向量;基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一MVP;产生识别所述第一MVP的第一索引;基于所述第一运动向量和所述第一MVP而产生第一MVD;确定待用于以双向预测帧间模 式来译码当前视频块的第二运动向量;基于运动向量的第二集合来识别第二MVP,其中运动向量的第二集合包括与相邻视频块中的一者或一者以上相关联的运动向量和基于第一运动向量的候选者;产生识别第二MVP的第二索引;基于所述第二运动向量和所述第二MVP而产生第二MVD;以及将第一索引、第一MVD、第二索引和第二MVD作为当前视频块的经编码位流的部分而输出。
[0018] 本发明的一个或一个以上方面的细节陈述于附图和下文的描述中。本发明中所描述的技术的其它特征、目标和优点将从所述描述和图式且从权利要求书而显而易见。

附图说明

[0019] 图1为方框图,其说明可实施本发明的技术中的一者或一者以上的一个示范性视频编码和解码系统。
[0020] 图2为概念图,其说明与本发明的技术一致的译码单元(CU)的四叉树分割。
[0021] 图3为方框图,其说明可实施本发明的技术的视频编码器。
[0022] 图4为方框图,其说明与本发明的一个或一个以上实例一致的编码器的示范性预测单元。
[0023] 图5为方框图,其说明可实施本发明的技术的视频解码器。
[0024] 图6为概念图,其说明与本发明一致的不同相邻视频块相对于当前视频块的位置使得当前视频块可在双向预测帧间模式中使用一个或一个以上不同相邻视频块的信息。
[0025] 图7为另一概念图,其说明与本发明一致的相对于当前视频块的相邻视频块使得当前视频块可在双向预测帧间模式中使用一个或一个以上不同相邻视频块的信息。
[0026] 图8到12为概念图,其说明可如何使用经双向预测视频块的一个运动向量来界定用于所述经双向预测视频块的另一运动向量的候选MVP。
[0027] 图13和14为流程图,其说明与本发明一致的技术。

具体实施方式

[0028] 本发明描述适用于使用自适应运动向量预测(AMVP)的双向预测帧间模式的视频编码和解码技术。通过AMVP,运动向量被编码为相对于其它运动向量(例如与相邻块相关联的运动向量)的差异值(即,差量)。可使用索引来界定哪一相邻视频块被用于根据AMVP来编码当前运动向量。具体来说,本发明描述用于编码或解码视频数据的技术,其中使用自适应AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。双向预测帧间模式是指其中基于与两个预测视频块相关联的 两个不同运动向量来译码视频块的任何视频译码模式。
[0029] 更具体来说,本发明描述若干技术,其中可使用双向预测视频块的一个运动向量来界定用于预测所述双向预测视频块的另一运动向量的候选运动向量预测符(MVP)。在许多实例中,将双向预测视频块的第一运动向量的缩放版本用作用于所述双向预测视频块的第二运动向量的MVP。以此方式,通过界定用于双向预测视频块的第二运动向量的额外MVP候选者,可实现改进的压缩。
[0030] 在大多数视频译码系统中,使用运动估计和运动补偿来减少视频序列中的时间冗余,以便实现数据压缩。在此状况下,可产生运动向量以便识别视频数据的预测块(例如,从另一视频帧或切片),所述预测块可用以预测正被译码的当前视频块的值。从当前视频块的值减去预测视频块的值以产生残余数据的块。将运动向量连同残余数据一起从编码器传送到解码器。解码器可寻找同一预测块(基于运动向量)的位置且通过将残余数据与预测块的数据组合来重构经编码的视频块。还可使用许多其它压缩技术(例如变换和熵译码),以进一步改进视频压缩。
[0031] 通常在编码器处完成运动估计过程。运动信息(例如运动向量、运动向量索引、预测方向或其它信息)可被包括于经编码位流中,所述经编码位流可由解码器存储和存取或从编码器发射到解码器。基于经编码位流中的运动信息,解码器可识别用以编码给定视频块的预测块。
[0032] 在一些状况下,应用运动向量的预测译码以进一步减少传送运动向量所需的数据量。在此状况下,编码器编码和传送相对于已知(或可知)运动向量的运动向量差异(MVD),而非编码和传送运动向量自身。在一些状况下,可通过所谓的运动向量预测符(MVP)来界定已知的运动向量(其可与MVD一起用以界定当前运动向量),所述MVP可经导出为与相邻块(例如图6中所示的相邻块X、Y和Z)相关联的运动向量的中值。为成为有效的候选MVP,可能需要给定运动向量指向与当前正通过MVP和MVD译码的运动向量相同的视频帧。
[0033] 已提议一种更先进的技术(称为自适应运动向量预测(AMVP))以通过包括空间和时间方向上的若干相邻块作为MVP的候选者来建立运动向量候选者集合。在此状况下,编码器可基于对编码速率和失真的分析(例如,使用所谓的速率-失真成本分析)而从候选者集合选择最精确的预测符。可将运动向量预测符索引(mvp_idx)发射到解码器以向解码器通知在何处定位MVP。索引一股指代从MVP候选者的集合识别MVP的任何信息。还传送MVD。解码器可将MVD与MVP(由运动向量预测符索引界定)组合以便重构运动向量。解码器(与编码器一样)可基于各种准则来界定候选MVP的集合(索引被应用于 候选MVP的所述集合)。编码器和解码器可经编程以知晓索引如何映射到MVP候选者,且这些映射可甚至随时问而进行调适(例如,基于使用AMVP的先前经译码的视频块的统计数据)。
[0034] 一些视频编码模式为两个不同运动向量作准备以便预测一个视频块。所谓的双向预测(例如)可允许基于两个不同的预测视频块的组合(有时被加权)来建立预测视频块。因此,通过此些双向预测帧间模式,两个不同运动向量用于预测过程。
[0035] 本发明描述若干技术,其中可使用双向预测视频块的一个运动向量来界定用于预测所述双向预测视频块的另一运动向量的候选MVP。在许多实例中,将双向预测视频块的第一运动向量的缩放版本用作用于所述双向预测视频块的第二运动向量的MVP。以此方式,通过界定用于双向预测视频块的第二运动向量的额外MVP候选者,可实现改进的压缩。
[0036] 图1为方框图,其说明可实施本发明的技术的示范性视频编码和解码系统10。如图1中所示,系统10包括源装置12,源装置12经由通信信道15将经编码的视频发射到目的地装置16。源装置12和目的地装置16可包含广泛范围的装置中的任一者。在一些状况下,源装置
12和目的地装置16可包含无线通信装置手持机,例如所谓的蜂窝式电话或卫星无线电电话。然而,可将本发明的技术(其一股应用于以双向预测帧间模式来编码和解码视频块)应用于包括视频编码和/或解码能力的非无线装置。源装置12和目的地装置16仅为可支持本文中所描述的技术的译码装置的实例。举例来说,可由编码装置来应用所述技术以便存储经编码位流,或可由解码装置关于所存储或传送(例如,串流传输)的位流来应用所述技术。
[0037] 在图1的实例中,源装置12可包括视频源20、视频编码器22、调制器/解调器(调制解调器)23和发射器24。目的地装置16可包括接收器26、调制解调器27、视频解码器28和显示装置30。根据本发明,源装置12的视频编码器22可经配置以根据双向预测帧间模式来编码一个或一个以上视频块。通过使用AMVP的双向预测帧间模式,可基于两个不同运动向量来预测视频块。所述运动向量可通过界定运动向量的MVP的索引值且通过界定运动向量相对于MVP的差异(或差量)的运动向量差异(MVD)来界定。解码器可将MVP与对应的MVD组合以界定给定运动向量。可在视频编码器22处产生语法元素以便识别MVP的索引并界定用于不同所预测运动向量的MVD。视频解码器可基于MVP和由语法元素界定的MVD来重构双向预测视频块。
[0038] 更具体来说,视频编码器22可选择用于编码当前视频块的双向预测帧间模式,并识别用于运动向量的两个不同MVP。视频编码器22可产生MVD作为所述运动向量与 用以译码所述运动向量的对应MVP之间的差异。视频编码器22可产生一个或一个以上语法元素以向视频解码器识别MVP和MVD。再次,本发明描述若干技术,其中可使用双向预测视频块的一个运动向量来界定用于预测所述双向预测视频块的另一运动向量的候选MVP。举例来说,将双向预测视频块的第一运动向量的缩放版本用作用于所述双向预测视频块的第二运动向量的MVP,此可改进数据压缩。下文更详细地解释许多不同缩放技术。
[0039] 视频源20可包含视频捕获装置,例如摄像机、含有先前捕获的视频的视频存档、来自视频内容提供者或另一视频源的视频馈送。作为另一替代例,视频源20可产生基于计算机图形的数据作为源视频,或实况视频、经存档视频和计算机产生的视频的组合。在一些状况下,如果视频源20为摄像机,则源装置12和目的装置16可形成所谓的相机电话或视频电话。在每一种状况下,可由视频编码器22来对所捕获、预先捕获或计算机产生的视频进行编码。
[0040] 一旦视频数据由视频编码器22编码,经编码视频信息便可接着由调制解调器23根据通信标准(例如码分多址(CDMA)、正交频分多路复用(OFDM)或任何其它通信标准或技术)来调制。经编码和调制的数据可接着经由发射器24被发射到目的地装置16。调制解调器23可包括各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包括经设计以用于发射数据的电路,包括放大器、滤波器和一个或一个以上天线。目的地装置16的接收器26经由信道15接收信息,且调制解调器27解调所述信息。
[0041] 由视频解码器28执行的视频解码过程可包括与由视频编码器22执行的编码技术互逆的技术。具体来说,视频解码器28可接收当前视频块的一个或一个以上语法元素,其中所述当前视频块是根据双向预测帧间模式而被编码,且基于所述一个或一个以上语法元素来识别MVP和MVD。视频解码器可使用所接收的MVP和MVD以根据双向预测帧间模式来解码当前视频块。
[0042] 仅为说明性目的而展示通信信道15,且其在许多实例中是不必要的。在图1中,通信信道15可包含任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理传输线,或无线与有线媒体的任何组合。通信信道15可形成基于包的网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信信道15一股表示任何合适的通信媒体或不同通信媒体的集合,以用于将视频数据从源装置12发射到目的地装置16。再次,图1仅为示范性的,且本发明的技术可应用于不一定包括编码装置与解码装置之间的任何数据通信的视频译码环境(例如,视频解码或视频解码)。在其它实例中,数据可从本 地存储器检索、经由网络而串流传输,或类似者。
[0043] 在一些状况下,视频编码器22和视频解码器28可大体上根据视频压缩标准(例如新兴的HEVC标准)来操作。然而,还可在多种其它视频译码标准(包括一些旧标准或者新的或新兴的标准)的背景下应用本发明的技术。虽然图1中未展示,但在一些状况下,视频编码器22和视频解码器28可各自与音频编码器和解码器集成,且可包括适当的MUX-DEMUX单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频与视频两者的编码。如果适用,则MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
[0044] 视频编码器22和视频解码器28各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件,或其组合。视频编码器22和视频解码器28中的每一者可包括于一个或一个以上编码器或解码器中,其任一者可被集成为相应移动装置、订户装置、广播装置、服务器或类似者中的组合编码器/解码器(编解码器(CODEC))的部分。在本发明中,术语译码器指代编码器、解码器或CODEC,且术语译码器、编码器、解码器和CODEC皆指代与本发明一致的经设计以用于译码(编码和/或解码)视频数据的特定机器。
[0045] 在一些状况下,装置12、16可以大体上对称的方式操作。举例来说,装置12、16中的每一者可包括视频编码和解码组件。因此,系统10可支持视频装置12、16之间的单向或双向视频发射,例如,用于视频串流传输、视频回放、视频广播或视频电话。
[0046] 在编码过程期间,视频编码器22可执行许多译码技术或操作。一股而言,与HEVC标准一致,视频编码器22对视频数据的块进行操作。与HEVC一致,所述视频块被称作译码单元(CU),且许多CU存在于个别视频帧(或其它独立界定的视频单元(例如切片))内。可将帧、切片、帧部分、图像群组或其它数据结构界定为包括多个CU的视频信息单元。与HEVC标准一致,所述CU可具有变化的大小,且位流可将最大译码单元(LCU)界定为CU的最大大小。可使用双向预测帧间模式来编码LCU、CU或可能的其它类型的视频块。通过HEVC标准,可根据四叉树分割方案而将LCU划分为越来越小的CU,且可将所述方案中所界定的不同CU进一步分割为所谓的预测单元(PU)。LCU、CU和PU在本发明的意义内皆为视频块。
[0047] 视频编码器22可执行预测译码,其中使正被译码的视频块(例如,LCU内的CU的PU)与一个或一个以上预测候选者进行比较以便识别预测块。此预测译码过程可为帧内过程(在所述状况下,基于同一视频帧或切片内的相邻帧内数据来产生预测数据)或帧间过程(在所述状况下,基于先前或后续帧或切片中的视频数据来产生预测数据)。可支持 许多不同译码模式,且视频编码器22可选择所要的视频译码模式。根据本发明,可使用本文中所描述的双向预测帧间模式来译码至少一些视频块。双向预测帧间模式可指代若干可能的双向预测帧间模式中的任一者,所述双向预测帧间模式可针对由两个运动向量识别的两个预测块的不同块大小或不同加权分配而以不同方式加以界定。
[0048] 通过双向预测帧间模式,可产生预测块以作为两个预测块的组合(例如,可能为经加权的组合)。基于第一运动向量而产生第一预测块,且基于第二运动向量而产生第二预测块。通过界定MVP和MVD的索引来界定所述第一运动向量,且通过界定另一MVP和另一MVD的另一索引来界定所述第二运动向量。根据本发明,可基于第一运动向量而产生用于第二运动向量的MVP候选者中的至少一者。
[0049] 在产生预测块之后,译码正被译码的当前视频块与预测块之间的差异以作为残余块,且使用预测语法来识别预测块。通过本文中所描述的双向预测帧间模式,预测语法(例如,语法元素)可向视频解码器识别MVD和MVP。因此,解码器可使用所述MVD和MVP以根据双向预测帧间模式来解码当前视频块。
[0050] 可变换和量化残余块。变换技术可包含DCT过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。在DCT过程中,作为一实例,变换过程将像素值(例如,残余像素值)的集合转换成变换系数,所述变换系数可表示频域中像素值的能量。HEVC标准允许根据变换单元(TU)的变换,其可针对不同CU而不同。具体来说,可使用称为“残余四叉树”(RQT)的四叉树结构而将对应于CU的残余样本细分为较小单元。可将RQT的叶节点称为TU。可变换和量化所述TU。
[0051] 可将量化应用于变换系数,且其一股涉及限制与任一给定变换系数相关联的位数目的过程。更具体来说,可根据在LCU层级处界定的量化参数(QP)来应用量化。因此,可将相同层级的量化应用于TU中的与LCU内的CU的不同PU相关联的所有变换系数。然而,可用信号发送QP的改变(即,增量)和LCU以指示相对于先前LCU的QP的QP改变,而非用信号发送QP自身。
[0052] 在变换和量化之后,可对经量化和经变换的残余视频块执行熵译码。语法元素还可被包括于经熵译码码的位流中。一股而言,熵译码包含共同地压缩经量化的变换系数和/或其它语法信息的序列的一个或一个以上过程。可对经量化的变换系数执行扫描技术以便界定来自二维视频块的系数的一个或一个以上经串行化一维向量。接着(例如)经由内容自适应可变长度译码码(CAVLC)、上下文自适应二进制算术译码(CABAC)或另一熵译码过程来熵译码经扫描的系数连同任何语法信息。
[0053] 作为编码过程的部分,可解码经编码视频块以便产生用于随后对后续视频块进行基 于预测的译码的视频数据。此经常被称为编码过程的解码循环,且一股模仿由解码器装置执行的解码。在编码器或解码器的解码循环中,可使用滤波技术来改进视频质量且(例如)使像素边界平滑且可能从经解码的视频移除假影。此滤波可为循环内滤波或循环后滤波。通过循环内滤波,经重构的视频数据的滤波发生于译码循环中,此意味着经滤波的数据由编码器或解码器存储以供随后用于后续图像数据的预测中。相比而言,通过循环后滤波,经重构的视频数据的滤波发生于译码循环之外,此意味着数据的未经滤波版本由编码器或解码器存储以供随后用于后续图像数据的预测中。循环内或循环后滤波经常在单独的解块滤波过程之后,所述解块滤波过程通常将滤波应用于在邻近视频块的边界上或边界附近的像素以便移除出现在视频块边界处的块效应假影。还可在循环内或循环后执行解块滤波。
[0054] 相对于先前的译码标准,新兴的HEVC标准引入新的术语和视频块的块大小。具体来说,HEVC指代译码单元(CU),所述CU可根据四叉树分割方案而被分割。“LCU”指代给定情形中所支持的最大大小的译码单元(例如,“最大译码单元”)。LCU大小可自身作为位流的部分(例如,作为序列层级语法)被用信号发送。LCU可被分割为较小的CU。可将CU分割为预测单元(PU)以用于预测的目的。尽管还可使用其它形状,但PU可具有方形或矩形形状。变换在新兴的HEVC标准中是不固定的,而是根据变换单元(TU)大小来界定,所述TU大小可为与给定CU相同的大小,或可能更小。可在TU中传送给定CU的残余数据。可在LCU层级、CU层级、PU层级和TU层级处界定语法元素。
[0055] 为说明根据HEVC标准的视频块,图2在概念上展示深度为64×64的LCU,所述LCU接着根据四叉树分割方案而被分割为较小CU。被称为“分裂旗标”的元素可被包括作为CU层级语法以指示任一给定CU是否自身被细分为另外四个CU。在图2中,CU0可包含LCU,CU1到CU4可包含所述LCU的子CU。如本发明中所描述,可在CU层级(或可能在LCU未被分裂为较小CU的情况下的LCU层级)处界定双向预测帧间模式语法元素。在一些实例中,还可针对CU的PU而支持双向预测帧间模式。
[0056] 图3为说明与本发明一致的视频编码器50的方框图。视频编码器50可对应于装置20的视频编码器22或不同装置的视频编码器。如图3中所示,视频编码器50包括预测编码单元32、四叉树分割单元31、加法器48和51,以及存储器34。视频编码器50还包括变换单元38和量化单元40以及逆量化单元42和逆变换单元44。视频编码器50还包括熵译码单元46和滤波器单元47,滤波器单元47可包括解块滤波器和循环后和/或循环内滤波器。可将经编码的视频数据和界定编码方式的语法信息传送到熵编码单元46,熵编码单元46对位流执行熵编码。
[0057] 如图3中所示,预测编码单元32可在视频块的编码中支持多个不同译码模式35。模式35可包括界定来自不同视频帧(或切片)的预测数据的帧间译码模式。所述帧间译码模式可为双向预测,其意味着使用预测数据(和通常两个不同运动向量)的两个不同列表(例如,列表0和列表1)来识别预测数据。帧间译码模式可替代地为单向预测,其意味着使用预测数据(和通常一个运动向量)的一个列表(例如,列表0)来识别预测数据。可结合预测数据的产生来执行内插、偏移或其它技术。还可支持所谓的SKIP模式和DIRECT模式,其继承与另一帧(或切片)的位于同一地点的块相关联的运动信息。SKIP模式块不包括任何残余信息,而DIRECT模式块包括残余信息。还可支持MERGE模式,其可继承来自相邻视频块的运动信息。
[0058] 另外,模式35可包括帧间译码模式,所述帧间译码模式基于在与正被译码的视频帧(或切片)相同的视频帧(或切片)内的数据来界定预测数据。帧内译码模式可包括:定向模式,其基于在同一帧内的特定方向上的数据来界定预测数据;以及DC和/或平面模式,其基于相邻数据的平均值或加权平均值来界定预测数据。预测编码单元32可基于一些标准(例如基于速率-失真分析或块的某些特性(例如块大小、纹理或其它特性))来选择用于给定块的模式。
[0059] 根据本发明,预测编码单元32支持双向预测帧间模式35X。通过所描述的双向预测帧间模式35X,正被译码的视频块基于与两个不同预测视频块相关联的预测数据而经双向预测。可以另一方式(例如经由不同像素值的某一加权总和)对所述两个预测视频块求平均或将其组合。可通过两个不同运动向量来识别所述两个预测视频块,所述两个运动向量自身是基于MVP而被预测。因此,通过双向预测帧间模式35X,预测编码单元32可产生用以识别MVP中的每一者的索引,且可产生表示正被译码的运动向量与用以译码运动向量的对应MVP之间的差异的MVD。双向预测帧间模式35X可实际上对应于许多双向预测帧间模式中的一者,所述双向预测帧间模式可针对由两个运动向量识别的两个预测块的不同块大小或不同加权分配而以不同方式加以界定。换句话说,虽然图3展示一个双向预测帧间模式35X,但可支持许多双向预测帧间模式,且此些模式中的一些或全部可使用本发明的技术。
[0060] 此外,根据本发明,可针对以双向预测帧间模式35X译码的两个运动向量中的至少一者而扩展MVP候选者。举例来说,可基于由一个或一个以上相邻视频块的运动向量界定的MVP候选者来译码运动向量中的第一者。然而,一旦运动向量中的所述第一者已被译码,便可使用那个运动向量自身来界定用于以双向预测帧间模式35X来译码当前视频块的运动向量中的第二者的又一MVP候选者。以此方式,扩展了用于译码第二运 动向量的MVP候选者的数目,从而有可能导致改进的视频压缩。用于译码第二运动向量的新MVP候选者可包含第一运动向量或(可能地)第一运动向量的缩放版本。如果两个运动向量不指向预测视频数据的同一列表,则可执行缩放。缩放可相对于第一运动向量而延长MVP的长度,且/或可在不同方向(例如,前向方向而非反向方向)上延长运动向量。可将与双向预测帧间模式相关联的预测块组合为一个双向预测块(可能使用加权因子),且可从正被译码的当前块减去所述双向预测块(经由求和器48)以界定与以双向预测帧间模式译码的块相关联的残余数据。
[0061] 在应用双向预测帧间模式35X中,预测编码单元32可:确定待用于以双向预测帧间模式来译码当前视频块的第一运动向量;基于与一个或一个以上相邻视频块相关联的运动向量的第一集合来识别第一MVP;产生识别所述第一MVP的第一索引;以及基于所述第一运动向量和所述第一MVP而产生第一MVD。另外,预测编码单元32可:确定待用于以双向预测帧间模式来译码当前视频块的第二运动向量;基于运动向量的第二集合来识别第二MVP,其中运动向量的第二集合包括与相邻视频块中的一者或一者以上相关联的运动向量和基于第一运动向量的一候选者;产生识别第二MVP的第二索引;以及基于所述第二运动向量和所述第二MVP而产生第二MVD。预测编码单元32可将第一索引、第一MVD、第二索引和第二MVD作为当前视频块的经编码位流的部分而输出。下文描述许多实例以论证可如何界定基于第一运动向量的候选者以用于对第二运动向量进行MVP译码的目的。
[0062] 在HEVC的状况下,正被译码的当前视频块可包含相对于LCU根据四叉树分割方案来界定的所谓的CU。在此状况下,四叉树分割单元31可产生界定四叉树分割方案的LCU语法数据,且预测编码单元32可产生CU的模式信息,所述模式信息界定双向预测帧间模式,其中一个或一个以上预测元素(其为MVP和MVD)包括于CU的模式信息中。所描述的双向预测帧间模式可增加在译码两个双向预测运动向量中的一者的背景下所使用的MVP候选者的数目。
[0063] 一股而言,在编码过程期间,视频编码器50接收输入视频数据。预测编码单元32对视频块(例如,CU和PU)执行预测译码技术。四叉树分割单元31可根据上文参看图2所解释的HEVC分割而将LCU分解为较小的CU和PU。对于帧间译码而言,预测编码单元32将CU或PU与一个或一个以上视频参考帧或切片(例如,参考数据的一个或一个以上“列表”)中的各种预测候选者进行比较以便界定预测块。对于帧内译码而言,预测编码单元32基于同一视频帧或切片内的相邻数据而产生预测块。预测编码单元32输出预测块,且加法器48从正被译码的CU或PU减去所述预测块以便产生残余块。再次, 可使用本文中所描述的双向预测帧间模式来译码至少一些视频块。
[0064] 图4更详细地说明视频编码器50的预测编码单元32的一个实例。预测编码单元32可包括模式选择单元75,模式选择单元75从模式35(包括作为一种可能性的双向预测帧间模式35X)选择所要模式。对于帧间译码而言,预测编码单元32可包含运动估计(ME)单元76和运动补偿(MC)单元77,运动估计(ME)单元76和运动补偿(MC)单元77识别指向预测数据的一个或一个以上运动向量且基于所述一个或一个以上运动向量而产生预测块。通常,运动估计被视为产生一个或一个以上运动向量(其估计运动)的过程。举例来说,所述一个或一个以上运动向量可指示预测帧内的一个或一个以上预测块相对于当前帧内的正被译码的当前块的位移。在双向预测帧间模式35X的状况下,两个运动向量经组合以产生双向预测。本发明的技术特别地关注运动向量自身被译码的方式(例如,允许使用所述运动向量中的一者来界定用于预测所述运动向量中的另一者的MVP)。再次,双向预测帧间模式35X可实际上对应于许多双向预测帧间模式中的一者,所述双向预测帧间模式可针对由两个运动向量识别的两个预测块的不同块大小或不同加权分配而以不同方式加以界定。换句话说,虽然图4展示一个双向预测帧间模式35X,但可支持许多双向预测帧间模式,且此些模式中的一些或全部可使用本发明的技术。
[0065] 运动补偿通常被视为基于由运动估计确定的一个或一个以上运动向量来获取或产生预测块(或若干块)的过程。在一些状况下,用于帧间译码的运动补偿可包括到子像素分辨率的内插,其准许运动估计过程估计视频块到此子像素分辨率的运动。还可使用两个块的加权组合(在双向预测的状况下)。
[0066] 对于帧内译码而言,预测编码单元32可包含帧内预测单元78。在此状况下,可基于当前视频块(例如,邻近于正被译码的视频块)内的数据而产生预测数据。再次,帧内译码模式可包括:定向模式,其基于在同一帧内的特定方向上的数据来界定预测数据;以及DC和/或平面模式,其基于相邻数据的平均值或加权平均值来界定预测数据。
[0067] 速率-失真(R-D)单元79可比较在不同模式中视频块(例如,CU或PU)的译码结果。另外,R-D单元79可允许其它类型的参数调整,例如对内插、偏移、量化参数或可影响译码速率的其它因素的调整。模式选择单元75可就译码速率(即,所需的用于块的译码位)和失真(例如,表示经译码块相对于原始块的视频质量)来分析译码结果以便针对视频块作出模式选择。以此方式,R-D单元79提供对不同模式的结果的分析以允许模式选择单元75针对不同视频块而选择所要模式。与本发明一致,当R-D单元79将双向预测帧间模式35X识别为用于给定视频块的所要模式(例如,归因于译码增益或译码效率)时,可选择所述双向预测帧间模式35X。
[0068] 再次参看图3,在预测编码单元32输出预测块之后,且在加法器48从正被译码的视频块减去所述预测块以便产生残余像素值的残余块之后,变换单元38将变换应用于所述残余块。变换可包含离散余弦变换(DCT)或概念上类似的变换,例如由ITU H.264标准或HEVC标准界定的变换。可界定所谓的“蝴蝶”结构以执行变换,或还可使用基于矩阵的乘法。在一些实例中,与HEVC标准一致,变换的大小可针对不同CU而变化(例如,取决于关于给定LCU而发生的分割的层级)。可界定变换单元(TU)以便设定由变换单元38应用的变换大小。还可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换单元将变换应用于残余块,从而产生残余变换系数的块。一股而言,变换可将残余信息从像素域转换到频域。
[0069] 量化单元40接着量化残余变换系数以进一步减小位速率。量化单元40(例如)可限制用以译码所述系数中的每一者的位的数目。特定来说,量化单元40可应用经界定以用于LCU的QP增量以便界定要应用的量化的层级(例如通过将QP增量与先前LCU的QP或某一其它已知QP组合)。在对残余样本执行量化之后,熵译码单元46可对数据进行扫描和熵编码。
[0070] CAVLC为由ITU H.264标准和新兴的HEVC标准支持的一种类型的熵译码技术,其可由熵编码单元46在向量化基础上加以应用。CAVLC以有效地压缩系数和/或语法元素的串行化“行程”的方式来使用可变长度译码(VLC)表。CABAC为由ITU H.264标准或HEVC标准支持的另一种类型的熵译码技术,其可由熵译码单元46在向量化基础上加以应用。CABAC可涉及若干级,包括二进制化、上下文模型选择和二进制算术译码。在此状况下,熵译码单元46根据CABAC来译码系数和语法元素。还存在许多其它类型的熵译码技术,且新的熵译码技术将很可能在将来出现。本发明并不限于任何特定熵译码技术。
[0071] 在通过熵译码单元46进行的熵译码之后,可将经编码的视频发射到另一装置或加以存档以供稍后发射或检索。所述经编码的视频可包含经熵译码的向量和各种语法信息(包括界定双向预测帧间模式、MVP索引和MVD的语法信息)。可由解码器使用此信息以恰当地配置解码过程。逆量化单元42和逆变换单元44分别应用逆量化和逆变换,以在像素域中重构残余块。加法器51将经重构的残余块加到通过预测编码单元32产生的预测块以产生经重构的视频块以供存储于存储器34中。然而,在此存储之前,滤波器单元47可将滤波应用于所述视频块以改进视频质量。由滤波器单元47应用的滤波可减少假影且使像素边界平滑。此外,滤波可通过产生包含与正被译码的视频块的压缩匹配的预测视频块而改进压缩。
[0072] 根据本发明,支持双向预测帧间模式35X,其中运动向量中的至少一者是基于由所述运动向量中的另一者界定的MVP而被预测。以此方式,可针对以双向预测帧间模式35X译码的两个运动向量中的至少一者来扩展MVP候选者。举例来说,可基于由一个或一个以上相邻视频块的运动向量界定的MVP候选者来译码运动向量中的第一者。然而,一旦运动向量中的第一者已被译码,便可使用那个运动向量自身来界定用于以双向预测帧间模式35X来译码当前视频块的运动向量中的第二者的又一MVP候选者。以此方式,扩展了用于译码第二运动向量的MVP候选者的数目,从而有可能导致改进的视频压缩。用于译码第二运动向量的新MVP候选者可包含第一运动向量,或(可能地)第一运动向量的缩放版本。下文更详细地论述不同类型的缩放的额外细节。在任何状况下,R-D单元79(图4)可相对于其它模式而将双向预测帧间模式35X识别为最想要的译码模式(归因于通过此模式实现的译码增益)。在此些状况下,模式选择单元75可选择双向预测帧间模式35X来用于译码给定视频块。
[0073] 图5为说明视频解码器60的一实例的方框图,视频解码器60解码以本文中所述方式而被编码的视频序列。在一些实例中,可通过视频解码器60来执行本发明的技术。具体来说,视频解码器60可解码视频数据,其中使用AMVP来译码与以双向预测帧间模式译码的当前视频块相关联的第一运动向量和第二运动向量。在此状况下,视频解码器60可:接收与第一运动向量相关联的第一MVD;接收识别第一MVP的第一索引;基于所述第一MVD和所述第一MVP而产生第一运动向量;接收与第二运动向量相关联的第二MVD;接收识别第二MVP的第二索引,其中所述第二MVP是基于第一运动向量而界定;以及基于所述第二MVD和所述第二MVP而产生第二运动向量。
[0074] 在视频解码器60处接收的视频序列可包含图像帧的经编码集合、帧切片的集合、共同译码的图像群组(GOP)或广泛多种视频信息单元(其包括编码的LCU(或其它视频块)和用以界定如何解码此些LCU的语法信息)。解码LCU的过程可包括解码译码模式的指示,所述译码模式可为本文中所描述的双向预测帧间模式。
[0075] 视频解码器60包括熵解码单元52,熵解码单元52执行由图2的熵编码单元46执行的编码的互逆解码功能。具体来说,熵解码单元52可执行CAVLC或CABAC解码,或由视频编码器50使用的任何其它类型的熵解码。熵解码单元52可接收包括经熵译码的数据的位流。熵解码单元52解析数据以产生包括本文中所描述的索引和MVD的各种语法元素。
[0076] 视频解码器60还包括预测解码单元54、逆量化单元56、逆变换单元58、存储器62和求和器64。具体来说,与视频编码器50一样,视频解码器60包括预测解码单元 54和滤波器单元57。视频解码器60的预测解码单元54可包括解码经帧间译码的块的运动补偿单元86且可能包括用于运动补偿过程中的子像素内插的一个或一个以上内插滤波器。预测解码单元54还可包括用于解码帧内模式的帧内预测单元。预测解码单元54可支持多个模式35(包括双向预测帧间模式55X)。滤波器单元57可对求和器64的输出进行滤波,且可接收经熵解码的滤波器信息以便界定应用于循环滤波中的滤波器系数。双向预测帧间模式55X可实际上对应于由预测解码单元54支持的许多双向预测帧间模式中的一者。例如,可针对由两个运动向量识别的两个预测块的不同块大小或不同加权分配而以不同的方式来界定不同双向预测帧间模式。因此,虽然图5仅展示一个双向预测帧间模式55X,但可支持许多双向预测帧间模式,且此些模式中的一些或全部可使用本发明的技术。
[0077] 在接收到经编码视频数据后,熵解码单元52即刻执行与由(图4中的编码器50的)熵编码单元46执行的编码互逆的解码。在解码器处,熵解码单元52解析位流以确定LCU和与LCU相关联的对应分割。在一些实例中,LCU或所述LCU的CU可界定所使用的译码模式,且这些译码模式可包括双向预测帧间模式。因此,熵解码单元52可将语法信息转发到识别双向预测帧间模式的预测单元。在此状况下,语法信息可包括识别MVP和MVD的一个或一个以上语法元素。预测解码单元54的MC单元86可使用MVP和MVD来重构预测块。即,MC单元86可基于MVP和MVD来重构两个运动向量,且接着获取由所述运动向量识别的预测数据。所获取的数据可由MC单元86组合(可能地以某种加权方式)以界定用于以双向预测帧间模式来解码当前视频块的预测视频块。
[0078] 如本文中所解释,可使用AMVP以通过包括空间和时间方向上的若干相邻块作为MVP的候选者来建立运动向量候选者集合。编码器可基于对编码速率和失真的分析(例如,使用所谓的速率-失真成本分析)而从所述候选者集合选择最精确的预测符。可将运动向量预测符索引(mvp_idx)发射到解码器以向解码器通知在何处定位MVP。还传送MVD。解码器可将MVD与MVP(由运动向量预测符索引界定)组合以便重构运动向量。解码器(与编码器一样)可基于各种标准来界定候选MVP的集合(索引被应用于候选MVP的集合)。编码器和解码器可经编程以知晓索引如何映射到MVP候选者,且这些映射可甚至随时问而进行调适(例如,基于使用AMVP的先前经译码视频块的统计数据)。
[0079] 图6为概念图,其展示可用以界定MVP的可能的相邻块(相邻者X、Y和Z)的一个实例。还可从位于不同(已经被编码/解码)帧中的块(例如,与来自一个或一个以上先前经译码帧的块E位于同一地点的块的运动向量)来界定候选MVP。在AMVP模式中,可基于相邻块的运动向量来界定候选MVP。
[0080] 图7为另一概念图,其展示可用以界定用于所谓的“顶部预测符”的MVP的可能块(A、B、C、D和E)和可用以界定用于所谓的“左预测符”的MVP的可能块(I、H、G和F)。通过单向预测,与AMVP相关联的MVP的整个候选集合可包括三个候选者。第一潜在候选MVP可包含顶部预测符,且可包含来自A、B、C、D或E的第一识别的运动向量,其具有与正被译码的当前运动向量相同的参考列表和相同的参考索引(因此指向同一参考帧)。第二潜在候选MVP为左预测符,且包含与块F、G、H或I相关联的第一运动向量,其具有与正被译码的当前运动向量相同的参考列表和相同的参考索引。第三潜在候选MVP为和与当前视频块位于同一地点的块相关联的运动向量,其中所述位于同一地点的块位于另一(例如,先前经译码)帧中。与其它候选者一样,与位于同一地点的块相关联的候选者可需要界定与正被译码的当前运动向量相同的参考列表和相同的索引,以便成为有效候选者。
[0081] 如果潜在MVP候选者中无一者指向与正被译码的当前运动向量相同的视频帧(即,如果潜在MVP候选者中无一者具有与正被译码的当前运动向量相同的参考列表和相同的参考索引),则可将MVP设定到某一默认值(例如零)。在此状况下(例如,如果将MVP的默认值设定到零),则MVD将对应于运动向量,且应用于运动向量的预测技术将不导致任何数据压缩。
[0082] 在一些状况下,可使用两个不同运动向量来预测与一个视频块相关联的数据。这通常被称作双向预测。虽然短语双向预测(bi-directiona1 prediction)有时与双向预测(bi-prediction)同义使用,但短语“双向预测(bi-directional prediction)”在两个运动向量通常并不限于任何定向要求的范围内经常为误称。换句话说,在双向预测(bi-prediction)(双向预测(bi-directional prediction))下,可允许两个运动向量指向与一个或一个以上先前视频帧和/或一个或一个以上后续视频帧相关联的数据。
[0083] 在H.264/AVC中,将预测帧组织为两个参考列表。举例来说,列表0可包含预测视频数据的前向列表,且列表1可包含预测数据的后向列表。然而,再次,在一些状况下,列表0和列表1可指向两个不同前向列表、两个不同后向列表,或可能甚至预测数据的两个相同列表。
[0084] 图8为概念图,其说明可如何使用经双向预测视频块的一个运动向量来界定用于所述经双向预测视频块的另一运动向量的候选MVP。如图8中的左部分中所示,将三个连续视频帧标记为帧0、4和8。因此,图8中所示的此些帧的显示次序为0->4->8。此意味着在显示次序中帧0在帧4前面,且在显示次序中帧8在帧4之后。然而,在编码期间,编码次序可不同于显示次序。举例来说,图8中所示的帧的编码次序可为0->8- >4以实现更佳的译码性能。
[0085] 图8的右部分在概念上说明帧4的编码,帧4在显示次序中可为中间帧且在编码次序中可为最后帧。在此状况下,存在两个参考帧(即,帧0和帧8)。可将所述两个参考帧(或其部分)组织为两个参考列表(列表L0和列表L1),但数据可与不同参考索引(Refidx)一起存储,如图8中所示。
[0086] 帧4中的当前视频块可从来自列表L0的数据进行预测、从来自列表L1的数据进行预测或从两个列表中的数据的组合进行预测。如果预测为来自两个不同参考列表的预测的组合,则可将模式称为双向预测帧间模式。在双向预测帧间模式中,将两个运动向量发送到解码器以指示来自两个不同列表的对应的两个预测。此外,如果使用AMVP来编码运动向量,则可在用于两个运动向量中的每一者的候选MVP当中选择一MVP,且可编码MVP的索引以作为经编码位流的部分。
[0087] 本发明的技术描述使用双向预测视频块的一个运动向量来界定用于所述双向预测视频块的另一运动向量的MVP。举例来说,参看图8,可使用mv0的缩放版本来预测mv1。在此实例中,缩放可改变MVP的定向和方向以便指向参考帧8而非参考帧0(例如,在图8的状况下,其中mv1指向参考帧0,但mv2指向参考帧8)。缩放可取决于图片次序计数(POC)编号、参考索引、预测的局部图片结构或mv0自身。以此方式,可在双向预测模式中实现改进的数据压缩。
[0088] 本发明的技术依赖于与确定AMVP的MVP相关的AMVP构架。然而,本发明描述用于扩展AMVP的MVP候选者的列表的技术。如此做可改进运动向量的压缩。
[0089] 更具体来说,本发明描述若干技术,其中可将经双向预测视频块的一个运动向量的缩放版本用作用于预测所述经双向预测视频块的另一运动向量的MVP。举例来说,可将经双向预测视频块的第一运动向量的缩放版本用作用于双向预测的第二运动向量的MVP。
[0090] 经双向预测视频块可包含与ITU-H.264标准或另一新兴标准(例如高效率视频译码(HEVC))一致的所谓的B视频块。替代地或另外,经双向预测视频块可包含所谓的GPB块,其为所提议的用以组合B视频块和P视频块的若干方面的块类型。GPB块是基于预测数据的两个列表来预测,但所述列表可为相同的。
[0091] 图9为另一概念图,其说明可如何使用经双向预测视频块的一个运动向量来界定用于所述经双向预测视频块的另一运动向量的候选MVP。如图9中所示,两个不同运动向量(例如,一个与列表0相关联,且一个与列表1相关联)分别由mv0和mv1来表示。可首先编码或解码mv0运动向量,且可经由正常AMVP技术来预测所述mv0运动向量。 接下来,可编码或解码mv1(此在mv0的编码或解码之后)。
[0092] 在图9的实例中,mv0指向与先前帧(即,由图片次序计数(POC)0识别)相关联的数据,而mv1指向与后续帧(即,由POC8识别)相关联的数据。具体来说,mv0可识别列表0的refidx0中的数据,所述数据指代在POC0处的先前帧的数据,而mv1可识别列表1的refidx0中的数据,所述数据指代在POC0处的后续帧的数据。在此状况下,第一运动向量指向与先前帧相关联的数据,且第二运动向量指向与后续帧相关联的数据。因此,第二MVP(其用以预测第二运动向量)可包含第一运动向量的缩放版本,其中先前帧相对于当前帧的时间距离与后续帧相对于当前帧的时间距离相同。
[0093] 类似于图9的实例,还有可能第一运动向量可指向与后续帧相关联的数据,且第二运动向量可指向与先前帧相关联的数据。在此状况下,第二MVP(其用以预测第二运动向量)可包含第一运动向量的缩放版本,其中后续帧相对于当前帧的时间距离与先前帧相对于当前帧的时间距离相同。
[0094] 图10为另一概念图,其说明可如何使用经双向预测视频块的一个运动向量来界定用于所述经双向预测视频块的另一运动向量的候选MVP。在此实例中,第一运动向量(mv0)和第二运动向量(mv1)指向与同一预测帧(即,先前帧的预测帧)相关联的数据。在此状况下,第二MVP(其用以预测第二运动向量)可包含第一运动向量。当mv0与mv1两者指向与同一预测帧(在显示次序中,其在当前帧之后)相关联的数据时,还可应用类似的技术。
[0095] 图11为另一概念图,其说明可如何使用经双向预测视频块的一个运动向量来界定用于所述经双向预测视频块的另一运动向量的候选MVP。在此实例中,第一运动向量(mv0)指向与先前帧相关联的数据,且第二运动向量(mv1)指向与另一先前帧相关联的数据。在此状况下,第二MVP(其用以预测第二运动向量)可包含第一运动向量的缩放版本,其中缩放相对于当前帧扩展相对于先前帧的第二运动向量方向的MVP(如通过图11中的“缩放”所说明)。当mv0与mv1两者指向与同一预测帧(在显示次序中,其在当前帧之后)相关联的数据时,还可应用类似的技术。
[0096] 图12为另一概念图,其说明可如何使用经双向预测视频块的一个运动向量来界定用于所述经双向预测视频块的另一运动向量的候选MVP。在此实例中,第一运动向量(mv0)指向与先前帧相关联的数据,且第二运动向量(mv1)指向与后续帧相关联的数据。然而,在此状况下,先前帧相对于当前帧的时间距离不同于后续帧相对于当前帧的时间距离。即,后续帧距当前帧的时间距离比先前帧到当前帧的时间距离远。在此状况下,第二MVP(其用以预测第二运动向量)可包含第一运动向量的缩放版本,其中缩放不仅改 变第二MVP相对于第一运动向量的方向,还延长第二MVP相对于第一运动向量的距离。当第一运动向量(mv0)指向与后续帧相关联的数据、第二运动向量(mv1)指向与先前帧相关联的数据且后续帧相对于当前帧的时间距离不同于先前帧相对于当前帧的时间距离时,还可应用类似的技术。
[0097] 再次参看图8和9,假定当前帧界定POC=4(即,当前帧POC编号为4)。在此状况下,mv0可为(5,2),且refPOC_L0可为0(意味着mv0的参考帧POC编号为0,且列表0预测来自帧0)。而且,在此状况下,mv1可为(-8,-1),且refPOC_L1可为8(意味着mv1的参考帧POC编号为
8,且列表1预测来自帧8)。
[0098] 假定MVP_mv1={(0,0),(-1,-6)}(即,存在mv1的两个预测符候选者)。在此状况下,一旦编码或解码mv0,便可根据POC编号的距离来对其进行缩放以便界定用于预测mv1的MVP。因此,可将mv0的缩放版本(其被用作mv1的MVP候选者)表示为:
[0099] Scaled_mv0=(RefPoc_L1-CurPoc)*mv0/(RefPoc_L0-CurPoc)=(8-4)*mv0/(0-4)=-mv0=(-5,-2)
[0100] 接着可通过加上scaled_mv0来更新MVP_mv1以作为MVP候选者,此如下扩展可能的MVP候选者的列表:
[0101] MVP_mv1={(0,0),(-1,-6),(-5,-2)}。
[0102] 因此,可基于新候选者列表MVP_mv1来编码mv1。在此状况下,如果编码器比较三个候选者的MVD(mv1-MVP_mv1(i),i=0,1,2),则可将MVD结果表示为{(-8,-1),(-7,5),(-3,1)}。因此,在此实例中,所加的预测符(即,用以预测mv1的mv0的缩放版本)提供最小MVD,此可导致改进的译码效率。因此,在scaled_mv0相对于其它可能的MVP候选者而实现最佳压缩的状况下,可将索引作为经编码位流的部分而输出,使得解码器可识别、产生和使用scaled_mv0以预测mv1。
[0103] 图13为说明与本发明一致的解码技术的流程图。虽然其它装置可执行类似的技术,但将从图5的视频解码器60的角度来描述图13。如图13中所示,预测解码单元54的MC单元86接收第一MVD(1301)且接收识别第一MVP的第一索引(1302)。MC单元86基于所述第一MVD和所述第一MVP而产生第一运动向量(MV)(1303)。另外,预测解码单元54的MC单元86接收第二MVD(1304)且接收识别第二MVP的第二索引(1305)。MC单元86接着基于所述第一MVD和所述第一MVP而产生第二MV(1306)。如本发明中所解释,由第二索引识别的第二MVP可基于第一MV。
[0104] 视频解码器60可接着基于第一MV和第二MV来解码当前视频块(1307)。具体来说,MC单元86可基于第一MV和第二MV而产生预测数据且组合此数据(可能以加权方式) 以形成预测块。通过加法器64将所述预测块与残余块组合,且可通过滤波器单元57来对结果滤波以产生经重构的视频块以供存储于存储器62中。可接着将经重构的视频块输出到再现装置以用于作为视频序列的经解码视频帧的部分进行呈现。
[0105] 图14为说明与本发明一致的编码技术的流程图。虽然其它装置可执行类似的技术,但将从图3的视频编码器50的角度来描述图14。如图14中所示,预测编码单元32可确定第一MV(1401),且基于与相邻者相关联的MV的第一集合来确定第一MVP(1402)。具体来说,可将第一MVP界定为MV的第一集合中最紧密接近于第一MV的候选者。预测编码单元32可产生用以识别第一MVP的第一索引(1403),且可基于第一MV和第一MVP而产生第一MVD(1404)。具体来说,第一MVD可包含第一MV与第一MVP之间的差异值(或增量)。
[0106] 接下来,预测编码单元32可确定第二MV(1405),且基于MV的第二集合来确定第二MVP,其中MV的第二集合包括与相邻者相关联的MV和基于第一MV的候选者(1406)。如本文中所描述,可使用缩放来界定MV的第二集合中的基于第一MV的候选者。可将第二MVP界定为MV的第二集合中最紧密接近于第二MV的候选者。预测编码单元32可产生用以识别第二MVP的第二索引(1407),且可基于第二MV和第二MVP而产生第二MVD(1408)。具体来说,第二MVD可包含第二MV与第二MVP之间的差异值(或增量)。视频编码器50可将第一索引、第一MVD、第二索引和第二MVP作为经编码位流的部分而输出。具体来说,预测单元32可将第一索引、第一MVD、第二索引和第二MVP输出到熵编码单元46。熵编码单元46可对第一索引、第一MVD、第二索引和第二MVP(连同来自预测编码单元32的其它语法信息和来自量化单元40的残余数据)执行熵译码以便产生经编码位流,可输出所述经编码位流以供存储或发射到另一装置。以此方式,视频编码器50将第一MVP、第一MVD、第二MVP和第二MVD作为经编码位流的部分而输出(1409)。
[0107] 本发明的技术可在广泛多种装置或设备中实现,所述装置或设备包括无线手持机和集成电路(IC)或一组IC(即,芯片组)。提供已描述的任何组件、模块或单元以强调功能性方面,且不一定要求通过不同硬件单元来实现。
[0108] 因此,可以硬件、软件、固件或其任何组合来实施本文所描述的技术。描述为模块或组件的任何特征可一起实施于集成逻辑装置中或单独地实施为离散但可互操作的逻辑装置。如果以软件来实施,则可至少部分地通过包含在执行时执行上文所描述的方法中的一者或一者以上的指令的计算机可读媒体来实现所述技术。计算机可读数据存储媒体可形成计算机程序产品的部分,所述计算机程序产品可包括封装材料。
[0109] 计算机可读媒体可包含有形计算机可读存储媒体,例如随机存取存储器(RAM)(例如同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体和类似者。另外或替代地,所述技术可至少部分地通过载运或传送呈指令或数据结构的形式的代码且可由计算机存取、读取和/或执行的计算机可读通信媒体来实现。
[0110] 可通过一个或一个以上处理器来执行所述指令,例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。如本文中所使用,术语“处理器”可指代上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置以用于编码和解码的专用软件模块或硬件模块内,或并入于组合的视频编码器-解码器(CODEC)中。而且,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
[0111] 已描述本发明的各种方面。此些和其它方面在所附权利要求书的范围内。