用于时间视频压缩中运动矢量预测的方法和设备专利检索-运动矢量电脑图像专利检索查询-专利查询网

积极推动地理标志专门立法

2022-03-10 地理标志，立法，知识产权
保护知识产权是对创新最大的激励

2022-03-10 保护知识产权，创新，激励
谢商华：加快制定知识产权基本法

2022-03-10 知识产权基本法
擦亮“双奥之城”品牌

2022-03-10 双奥，知识产权
让冰雪运动“热”力全开

2022-03-10 冰雪运动，知识产权
携手共奋进　走好强国路

2022-03-10 强国，知识产权
坚持创新引领　方能稳中求进

2022-03-10 创新，稳中求进，知识产权
答好“两张卷” 奋进新征程

2022-03-10 知识产权
专家解读政府工作报告中的创新和知识产权相关部署

2022-03-10 政府工作报告，创新，知识产权
今年政府工作报告指出：加强知识产权保护和运用

2022-03-10 政府工作报告，知识产权保护

用于时间视频压缩中运动矢量预测的方法和设备

阅读：554发布：2021-02-26

IPRDB可以提供用于时间视频压缩中运动矢量预测的方法和设备专利检索，专利查询，专利分析的服务。并且公开了一种用于对当前块进行运动矢量预测的方法，所述当前块具有一组相邻块，所述相邻块组包括不具有相关运动矢量的块。该方法包括为该相邻块组中不具有相关运动矢量的每个块获得候选运动矢量；及使用该相邻块组中不具有相关运动矢量的每个块的候选运动矢量来为当前块预测当前运动矢量。还公开了一种用于执行该方法的设备。，下面是用于时间视频压缩中运动矢量预测的方法和设备专利的具体信息内容。

权利要求

1、一种用于对视频帧中的一个区域进行运动矢量预测的方法，所述视频帧包括多个区域，所述方法包括：为所述视频帧中的所述多个区域中的另一区域生成候选运动矢量，所述另一区域与所述视频帧的所述一个区域相邻且缺少相关的运动矢量；以及使用所述候选运动矢量来为所述视频帧的所述一个区域预测当前运动矢量。

2、如权利要求1所述的方法，其中，为所述视频帧中的多个区域中的另一区域生成所述候选运动矢量的步骤包括：使用从由运动估计、色度和亮度检测、运动矢量平滑和先前被解码运动矢量的变换组成的组中选出的至少一种运动矢量处理技术，来执行运动矢量处理；

对每种所使用的运动矢量处理技术进行分级；

对每种所使用的运动矢量处理技术根据其分级进行加权；以及采用非线性选择算法选择所使用的运动矢量处理技术中的一种，来创建所述候选运动矢量。

3、如权利要求2所述的方法，其中，所述运动估计运动矢量处理技术包括：对所述视频帧进行下采样并创建较低分辨率的视频帧；

从所述较低分辨率的视频帧中创建一组运动矢量；以及将所述运动矢量组中的每个运动矢量映射到所述视频帧中的所述多个区域中的至少一个区域上。

4、如权利要求3所述的方法，其中，所述较低分辨率视频帧包括一组块，并且从所述较低分辨率的视频帧中创建所述运动矢量组的步骤包括，对所述较低分辨率的视频帧的块组执行运动估计，以创建一组较为粗略的运动矢量。

5、如权利要求2所述的方法，其中，所述色度和亮度检测运动矢量处理技术包括：获得色度运动矢量；

为所述色度运动矢量计算差值绝对值之和(SAD)；以及将所述色度运动矢量的SAD值并入运动矢量预测过程中。

6、如权利要求2所述的方法，其中，先前被解码运动矢量的变换运动矢量处理技术包括：接收使用第一编解码器所编码的编码视频流；

对所述编码视频流进行解码，以提取与所述视频帧中的所述多个区域中缺少相关运动矢量的所述另一区域相关联的至少第一运动矢量；以及使用第二编解码器将被解码的视频流编码到第二编码视频流中，并且将所述第一运动矢量用作在所述第二编码视频流中的视频帧的候选运动矢量。

7、如权利要求2所述的方法，其中，所述运动矢量平滑运动矢量处理技术包括：创建包括多个运动矢量的运动矢量场；

通过将在所述多个运动矢量中的运动矢量和其相邻运动矢量相比较，确定所述运动矢量是否是离群值运动矢量；以及移除所述离群值运动矢量。

8、其上存储有指令的一种计算机可读介质，所存储的指令使得计算机执行一种用于对当前块进行运动矢量预测的方法，所述当前块具有一组相邻块，所述相邻块组包含不具有相关运动矢量的块，所述方法包括：为所述相邻块组中不具有相关运动矢量的每个块获得候选运动矢量；以及使用所述相邻块组中不具有相关运动矢量的每个块的候选运动矢量来预测所述当前块的当前运动矢量。

9、如权利要求8所述的计算机可读取介质，其中，为所述视频帧中的多个区域搜索块中的另一区域生成所述候选运动矢量的步骤包括：使用从由运动估计、色度和亮度检测、运动矢量平滑和先前被解码运动矢量的变换组成的组中选出的至少一种运动矢量处理技术，来执行运动矢量处理；

对每种所使用的运动矢量处理技术进行分级；

10、如权利要求9所述的计算机可读取介质，其中，所述运动估计运动矢量处理技术包括：对所述视频帧进行下采样并创建较低分辨率的视频帧；

从所述较低分辨率的视频帧中创建一组运动矢量；以及将所述运动矢量组中的每个运动矢量映射到所述视频帧中的所述多个区域中的至少一个区域上。

11、如权利要求10所述的计算机可读取介质，其中，所述较低分辨率视频帧包括一组块，并且从所述较低分辨率的视频帧中创建所述运动矢量组的步骤包括，对所述较低分辨率视频帧的块组执行运动估计，以创建一组较为粗略的运动矢量。

12、如权利要求9所述的计算机可读取介质，其中，所述色度和亮度检测运动矢量处理技术包括：获得色度运动矢量；

为所述色度运动矢量计算差值绝对值之和(SAD)；以及将所述色度运动矢量的SAD值并入运动矢量预测过程中。

13、如权利要求9所述的计算机可读取介质，其中，先前被解码运动矢量的变换运动矢量处理技术包括：接收使用第一编解码器所编码的编码视频流；

14、如权利要求9所述的计算机可读取介质，其中，所述运动矢量平滑运动矢量处理技术包括：创建包括多个运动矢量的运动矢量场；

通过将在所述多个运动矢量中的一个运动矢量和其相邻运动矢量相比较，确定所述运动矢量是否是离群值运动矢量；以及移除所述离群值运动矢量。

15、一种用于为当前块预测运动矢量的设备，所述当前块具有一组相邻块，所述相邻块组包含不具有相关运动矢量的块，所述设备包括：用于为所述相邻块组中不具有相关运动矢量的每个块获得候选运动矢量的装置；以及用于使用所述相邻块组中不具有相关运动矢量的每个块的候选运动矢量来为所述当前块预测当前运动矢量的装置。

16、如权利要求15所述的设备，其中，为所述视频帧中的多个区域中的另一区域生成所述候选运动矢量的装置包括：用于使用从由运动估计、色度和亮度检测、运动矢量平滑和先前被解码运动矢量的变换组成的组中选出的至少一种运动矢量处理技术来执行运动矢量处理的装置；

用于对每种所使用的运动矢量处理技术进行分级的装置；

用于对每种所使用的运动矢量处理技术根据其分级进行加权的装置；以及用于采用非线性选择算法选择所使用的运动矢量处理技术中的一种来创建所述候选运动矢量的装置。

17、如权利要求16所述的设备，其中，所述当前块包含在当前帧中，并且用于运动估计运动矢量处理技术的装置包括：用于对所述当前帧进行下采样并创建较低分辨率的帧的装置；

用于从所述较低分辨率的帧中创建一组运动矢量的装置；以及用于将所述运动矢量组中的每个运动矢量映射到所述视频帧中的相邻块组中的多个区域搜索块中不具有相关运动矢量的至少一个区域上。

18、如权利要求17所述的设备，其中，所述较低分辨率视频帧包括一组块，并且用于从所述较低分辨率的视频帧中创建所述运动矢量组的装置包括，用于对所述较低分辨率的视频帧的块组执行运动估计以创建一组较为粗略的运动矢量的装置。

19、如权利要求16所述的设备，其中，用于色度和亮度检测运动矢量处理技术的装置包括：用于获得色度运动矢量的装置；

用于为所述色度运动矢量计算差值绝对值之和(SAD)的装置；以及用于将所述色度运动矢量的SAD值合并入运动矢量预测过程中的装置。

20、如权利要求16所述的设备，其中，用于先前被解码运动矢量的变换运动矢量处理技术的装置包括：用于接收使用第一编解码器所编码的编码视频流的装置；

用于对所述编码视频流进行解码以提取与所述视频帧中的多个区域中缺少相关运动矢量的所述另一区域相关联的至少第一运动矢量的装置；以及用于使用第二编解码器将被解码的视频流编码到第二编码视频流中，并且将所述第一运动矢量用作在所述第二编码视频流中的视频帧的候选运动矢量的装置。

21、如权利要求16所述的设备，其中，用于运动矢量平滑运动矢量处理技术的装置包括：用于创建包括多个运动矢量的运动矢量场的装置；

用于通过将在所述多个运动矢量中的一个运动矢量和其相邻运动矢量相比较来确定所述运动矢量是否是离群值运动矢量的装置；以及用于移除所述离群值运动矢量的装置。

22、配置为实现一种用于对视频帧当前块中的一个区域进行运动矢量预测的方法的至少一个处理器，所述视频帧包括具有相邻块的多个区域组的当前块，所述相邻块中包括不具有相关运动矢量的块，所述方法包括：为所述视频帧中的多个区域中的另一区域生成候选运动矢量，所述另一区域与所述视频帧的所述一个区域相邻且缺少相关的运动矢量；以及使用所述候选运动矢量来为所述视频帧的所述一个区域预测当前运动矢量。

23、如权利要求22所述的至少一个处理器，其中，为所述视频帧中的多个区域中的另一区域生成所述候选运动矢量的步骤包括：使用从由运动估计、色度和亮度检测、运动矢量平滑和先前被解码运动矢量的变换组成的组中选出的至少一种运动矢量处理技术，来执行运动矢量处理；

对每种所使用的运动矢量处理技术进行分级；

24、如权利要求23所述的至少一个处理器，其中，所述当前块包含在当前帧中，并且所述运动估计运动矢量处理技术包括：对所述视频帧进行下采样并创建较低分辨率的视频帧；

从所述较低分辨率视频帧中创建一组运动矢量；以及将所述运动矢量组中的每个运动矢量映射到所述视频帧中的所述多个区域中的至少一个区域上。

25、如权利要求24所述的至少一个处理器，其中，所述较低分辨率视频帧包括一组块，并且从所述较低分辨率视频帧中创建所述运动矢量组的步骤包括，对所述较低分辨率视频帧的块组执行运动估计，以创建一组较为粗略的运动矢量。

26、如权利要求23所述的至少一个处理器，其中，所述色度和亮度检测运动矢量处理技术包括：获得色度运动矢量；

为所述色度运动矢量计算差值绝对值之和(SAD)；以及将所述色度运动矢量的SAD值并入运动矢量预测过程中。

27、如权利要求23所述的至少一个处理器，其中，先前被解码运动矢量的变换运动矢量处理技术包括：接收使用第一编解码器所编码的编码视频流；

对所述编码视频流进行解码，以提取与所述视频帧中的多个区域中缺少相关运动矢量的所述另一区域相关联的至少第一运动矢量；以及使用第二编解码器将被解码的视频流编码到第二编码视频流中，并且将所述第一运动矢量用作在所述第二编码视频流中的视频帧的候选运动矢量。

28、如权利要求23所述的至少一个处理器，其中，所述运动矢量平滑运动矢量处理技术包括：创建包括多个运动矢量的运动矢量场；

通过将在所述多个运动矢量中的一个运动矢量与其相邻运动矢量相比较，确定所述运动矢量是否是离群值运动矢量；以及移除所述离群值运动矢量。

说明书全文

技术领域

本发明通常涉及视频压缩，更具体而言，涉及在时间视频压缩中运动矢量预测的方法和设备。

背景技术

在利用视频序列中的时间冗余度的视频编码系统中，运动估计是一个关键要素。运动估计是根据在先前解码的帧中的块来估计要预测的帧中的当前宏块(或块)的过程。通常，该过程包括根据为最小化失真而进行的测量，搜索预测帧来寻找与当前块相匹配的块。例如，当前所使用的测量包括差值绝对值之和(SAD)和差值平方和(SSD)。通常，搜索基于采用运动矢量预测得到的初始估计(在参考帧中的位置)而开始。
在视频编解码在运动矢量预测中结合了多个参考帧和多种宏块类型的情况中，运动矢量预测过程引入了极大的计算量。实验证明，运动估计会占用总编码时间的60％(一个参考帧)至90％(5个参考帧)。减小运动估计中的计算复杂度并同时保持失真率是具有挑战性的课题。当前，相关研究集中在获得更准确的运动矢量预测值，以及通过检测到零块来实现及早的终止，以便减少处理时间或者甚至跳过像素搜索步骤。在控制总运动估计时间中，所预测的运动矢量的准确度是至关重要的。在由ISO/IEC MPEG & ITU-T VCEG(ISO/IEC JTC1/SC29/WG11和ITU-T SG16 Q.6)的视频联合工作组(JVT)2003 年9月第9次会议JVT-I050(JVT标准)所提出的H.264视频编解码中的有关运动矢量预测的标准中，采用了多种方法，通过引入更多运动矢量候选来改进运动矢量的预测。
例如，如图1所示，使用在当前块102的左方，上方，和右上方的相邻块来预测当前块的运动矢量：
pre_mv＝median(mv_A，mv_B，mv_C) 在此，pred_mv定义为中值预测值，mv_A，mv_B，mv_C分别是块 A 104、B 106、C 108的运动矢量。为了更好地利用在7个帧间预测模式之间的运动关系，一种方案使用了从模式1到7的分层搜索次序，而不是在JVT标准中所建议的搜索次序。在图2中示出了当前块的上层的运动矢量，其被视为用于预测当前块运动矢量的候选。其它方案通过考虑相应相邻块和所有参考帧的运动矢量，而在时间序列中使用了更多的运动矢量候选。如在图3和图4中所示，先前参考帧和其它参考帧的相应运动矢量也用作预测候选。应注意，在图4的多参考帧模型中，参考帧中的运动矢量是根据其与当前帧的时间距离来定标的。
运动矢量预测的精确性在控制计算量减少的步骤中，例如在运动估计中的及早终止、快速搜索方法以及快速模式判定(例如，跳过模式)中，起到关键作用。

发明内容

在此描述的实施例提供了用于运动矢量预测的4种方法，以及将这些方法合并的方案，以实现在失真率方面的性能改善。在此所述的方法和设备提高了运动矢量预测的准确度。在一个实施例中，通过使用从原始视频帧的较低分辨率形式而来的更多空间相关信息，将当前块的所有非因果关系块的运动矢量并入到对运动矢量预测值的计算中。在另一个实施例中，将色度分量与亮度分量相结合，通过使用颜色信息来预测更准确的运动矢量。在再一个实施例中，系统考虑了可能存在于视频流传输系统中MPEG-2元数据(metadata)流中的运动矢量信息。在再另一个实施例中，采用了运动矢量处理技术来消除 (即，平滑)错误的运动矢量，以提高该技术的准确度。
从随后的详细说明中，其它目的、特征和优点对于本领域技术人员而言将变得显而易见。然而，要理解的是，详细描述和特定示例虽然指示了本发明的实施例，但是是以说明的方式给出的而不具有局限性。在不脱离本发明的精神的情况下，可以在本描述的范围内进行各种改变和修改，并且本发明包括所有的这些修改。

附图说明

通过参考附图，本发明将更加容易理解，其中：
图1示出了现有技术的使用特定相邻块的运动矢量预测方案；
图2示出了使用分层搜索方案的运动矢量预测方案；
图3示出了使用来自先前参考帧的运动矢量的运动矢量预测方案；
图4示出了使用来自先前参考帧的运动矢量的运动矢量预测方案；
图5示出了用于运动矢量预测的非因果关系参考块的位置；
图6是示出用于运动矢量预测的非因果关系参考块的使用的流程图；
图7是示出来自下采样视频帧的较为粗略的运动矢量的创建的示意图；
图8示出了在视频传输系统中的数据流；
图9示出了使用元数据来预测在下一帧中的相应块的运动矢量；
图10示出了在彩色图像中的亮度分量和色度分量；
图11示出了在运动矢量预测之后三个典型运动矢量场的排列；以及
图12是无线系统的接入终端和接入点的方框图。
在附图中类似的数字表示类似的元件。

具体实施方式

运动矢量预测的精确性在控制以下的计算量减少步骤，例如及早终止、快速搜索方法以及快速模式决定(例如跳过模式)中起到关键作用。本方法提出了四种新方法来改进在视频编解码中的运动矢量的创建。在一个实施例中，利用了宏块之间的空间相关性，首先对视频帧进行下采样以创建较低分辨率形式的视频帧，并对该较低分辨率的视频帧执行运动估计。因此获得一组运动矢量，称为“较为粗略”的运动矢量。将较为粗略的运动矢量映射到原始视频帧。因此，能够将包括较为粗略的运动矢量(源自较低分辨率视频帧)和因果关系运动矢量在内的所有相邻块的运动矢量用作候选运动矢量。在另一个实施例中，使用了从上游MPEG-2编码器输入给视频编解码器的元数据信息，所述元数据信息包含每个宏块的MPEG-2运动矢量信息，其可以用于预测相应块的运动矢量。在又一个实施例中，将亮度分量并入到对运动矢量的计算中，以充分利用颜色信息。在再另一个实施例中，使用了运动矢量平滑技术，以尽可能纠正错误预测的运动矢量并去除噪声。
1.非因果关系运动矢量
图5示出了采用非因果关系运动矢量来在如图6的流程图中所示的预测过程600中预测当前帧500的当前块502的运动矢量。在上述 JVT标准中，在预测中只使用了3个因果关系块，与JTV标准相比，在一个实施例中，所有与当前块502相邻的块504-518都可以用作在帧序列中除帧内帧(I帧)之外所有帧的运动矢量预测的候选，如在步骤602和步骤604所示。对于I帧不执行预测，因为对于此类帧无需运动矢量预测。然而，如在以下步骤中所述，对于所有其它帧，通过“较为粗略”运动矢量的创建，使得所有相邻块的运动矢量都可用。因此，当视频帧不是I帧时，对该视频帧进行下采样，以创建较低分辨率帧702，在帧702中确定因果关系运动矢量是否可用。参照图5作为实例，因果关系运动矢量仅对块504(A)、块506(B)、和块508(C)及块510(H)是可用的，因为块512(D)，块518(E)，块516(F)和块514(G)按照扫描次序还没有被处理。因此，操作会继续到步骤608，在此对视频帧500进行下采样以创建较低分辨率帧702，如图7中所示。随后，在步骤608，对该较低分辨率视频帧 702执行运动估计，得到一组运动矢量，称为一组“较为粗略”的运动矢量，随后在步骤610中，将该运动矢量组映射回原始视频帧中，其在图7中示出。
因此，即使因果关系运动矢量不可用时，由于可以使用较为粗略的运动矢量，在步骤612中可以执行运动矢量预测。例如，参照图6，在一个实施例中，使用关于因果关系运动矢量的当前标准中的模式来执行当前块502的预测，在该标准中只有块510(H)、块506(B) 和块508(C)用于预测，但也使用了从非因果关系块得到的另外的矢量(即，从中得到的较为粗略的运动矢量)。尤其是，为块510(H)、块506(B)和块508(C)的三个运动矢量所设定的值按照如下来确定：
1.如果H不可用(位于图像之外)，则将其MV设定为(0，0)。
2.如果C不可用，则将其MV设定为A。
3.如果B和C都不可用，则将两个MV都设定为(0，0)。
这些运动矢量与来自块512(D)、块518(E)、块516(F)和块 514(G)的较为粗略的运动矢量组合来计算中值预测值。
在另一实施例中，所使用的参考块包括所有块(即块504(A)、块506(B)、块508(C)、块512(D)、块518(E)、块516(F)和块514(G)、及块510(H))。于是，中值预测值计算为：
pred_mv＝median(mv_A，mv_B，mv_C，mv_D，mv_E，mv_F，mv_G，
mv_H，mv_PrevCurrent)
在此，mv_PrevCurrent定义为在先前参考帧中的相应块的运动矢量。
2.来自MPEG-2上游元数据的运动矢量信息
图8示出了视频传输系统800的数据流，在此，输入视频编解码器806的视频数据源是从来自MPEG-2解码器802的被解码MPEG-2 视频流传输而来的。在一个实施例中，所有原始源视频数据都作为 MPEG-2流进行传输，并随后进行解码。由预处理器804对被解码的原始视频数据进行进一步处理并将其按比例减小为1/4的VGA大小 (QVGA)，并将其提供给视频编解码器806来将其编码为新的格式，例如H.264。视频编解码器806还接收诸如帧大小，帧速率，每个宏块的宏块类型和运动矢量之类的MPEG-2元数据。在一个实施例中，在编码过程中，视频编解码器806由此将MPEG-2运动矢量用作相应宏块的运动矢量预测候选。在一个实施例中，在宏块的大小是16× 16的块大小的情况中，MPEG-2运动矢量还被视为所有子层块的上层运动矢量。
在一个实施例中，使用从先前格式到新格式的元数据的概念仅用于这样的代码转换情况中：在目标编码器中，例如视频编解码器806 中，可以采用来自输入格式解码的编码参数和边信息。此外，由于运动矢量是从先前帧为P和B帧预测的，因此其只适于从紧随其后的未来帧的元数据中预测运动矢量。如在图9中所示，序列中在时间t-1 处的运动矢量只用于预测序列中在时间t处的对应块的运动矢量。在一个实施例中，当前帧的参考帧号用于定位与先前参考帧的元数据有关联的运动矢量。
3.颜色运动估计
在当前视频编解码标准中，例如MPEG-4和H.264中，两个色度分量(Cb和Cr)的运动矢量源自相应的亮度分量(Y)。由于假定亮度分量能够提供足够的信息且无需额外的开销来预测色度，因此随后在速率失真(RD)和运动矢量预测过程中省略了色度分量。然而，对于具有低亮度或复杂颜色信息的视频序列而言，色度分量对于更准确的运动矢量预测而言是有用的。因此，在一个实施例中，运动估计采用亮度分量和两个色度分量。例如，当在具有带有丰富颜色信息的对象的视频帧中取出色度信息时，对象的运动会更加难以预测。因此，使用颜色运动预测所预测的视频帧很可能会比仅采用亮度分量运动预测所预测的视频帧具有较少的伪像。
如在图10中所示，将色度分量半采样到对应于亮度分量的水平和垂直坐标上。如果只考虑帧编码，则色度分量的运动矢量按照如下来计算：
MVC_X＝1/2*MVL_X
MVC_Y＝1/2*MVL_Y
在此，(MVL_X，MVL_Y)是亮度运动矢量，(MVC_X，MVC_Y)是色度运动矢量。在一个实施例中，色度运动矢量用于为合并到运动矢量预测和RD优化中的色度运动矢量计算差值绝对值之和(SAD)。对于仅仅亮度的RD优化方程为：
L＝R+λD
因此，运动预测能够视为使得该拉格朗日代价函数最小。这里，失真D表示作为亮度分量的SAD来测量的预测误差，R是比特数量，拉格朗日乘法器与量化参数(QP)相关联，其值控制RD折衷。考虑色度分量，则引入了以下的代价函数：
L＝R+λ(W1*DL+W2*DC)
W1∈(1，2)，W2∈(0，1)
其中DL和DC分别表示在亮度分量和色度分量中的失真，W1和W2 是根据实验得到的适合于特定视频序列的加权参数。在一个实施例中，因为色度分量具有较少信息，因此其SAD计算仅使用了整数值的运动矢量，因此无需插值。
4.运动矢量平滑
在视频捕捉和编码的视频序列传输期间所遇到的任何噪声或丢帧经常转化为在重放期间序列质量的降低。另外，在运动矢量预测中，块匹配运动矢量预测过程也引入了误差。矢量中值滤波(VMF)可以用作另一种有效的方法来提高运动矢量预测准确度并减小噪声，同时保留视频序列细节。VMF的基本概念是在自然视频序列中的相邻运动矢量总是彼此相关的。如在图11中所示，在运动矢量预测过程之后，会出现三种类型的运动矢量场，包括平滑区域运动矢量场1110、在运动矢量场1120中的离群值(outlier)运动矢量1122、和示出由多个运动矢量1132(a)-(c)所定义的对象边缘的运动矢量场1130，其中，运动矢量1132(a)-(c)的方向与运动矢量场1130中其它运动矢量方向相反。
在一个实施例中，选择3×3的块大小来执行中值操作。继续参照图11，在离群值运动矢量场1120中，“错误”(或离群值)运动矢量能够被纠正。然而，当对象边界出现在块内部时，例如在运动矢量场1130中时，就不能使用VMF。在一个实施例中，边缘检测和对象分割方法可以用于处理此情况。
所提出的每种运动矢量预测方法能够单独或组合使用。例如，在一个实施例中，在代码转换期间，提取并保存在输入视频比特流中可用的运动矢量数据，以在目标编码器中，例如视频编解码器806中使用。该数据从属于输入视频帧。将运动矢量数据重新映射到输入到目标编码器的源帧上。在使用单一参考帧的过程中，能够模拟在先前N 个帧上的运动矢量数据，以找到在这N个帧上的运动轨迹。然后能够采用运动矢量平滑来移除离群值并提高轨迹的准确度。对轨迹进行外插得到对要进行编码的块的运动矢量的更准确估计。另外，从输入视频比特流中提取的运动矢量数据可以是也可以不是真实运动矢量。这些运动矢量的准确度通常取决于在上游源编码器中所使用的运动搜索算法。根据这些运动矢量来获得每个被解码帧的运动场，并应用合适的运动矢量平滑技术，这将会有助于消除离群值。当不能确定运动矢量的准确度时，能采用其它方法，例如基于空间相邻或并列相邻的方法。
如果可以得到足够的信息以实现一种以上的所提出的方法，则建议在获得运动矢量估计时采用以下优先级别：
1.根据从元数据或预处理功能中得到的附加信息来对每种方法的准确度进行分级(例如使用从0-1的范围)。例如，如果将解交错或反向电视电影处理(telecine)用作预处理的部分，则就需要对运动矢量进行适当的映射。如果运动矢量平滑的结果是不确定的，则该方法的准确度就较差。如果所提取的运动矢量、经过运动矢量平滑的运动矢量和经过预处理和和重新映射的运动矢量很接近，则该运动矢量估计的准确度就很高。此外，对于色度运动估计而言，准确度取决于在源内容中色度信息相对于亮度信息的比例。当可能时，会使用来自所有参考帧的非因果关系运动矢量和因果关系运动矢量。
2.根据其排列顺序，对每种方法进行加权。
3.使用非线性选择算法来选择方法。
对视频编解码器的上述附加方法尽可能提高运动矢量预测过程的准确度。尽管在每种方法的实现中都包含了计算，但运动矢量预测准确度的提高会减少在像素搜索步骤、SAD计算和RD优化中的计算量。因此，总编码时间将会减小，并会实现更好的视频质量。
图12示出了在无线系统中接入终端1202x和接入点1204x的方框图，其中每个都可以实现在此所述的运动矢量预测过程。在此所述的“接入终端”指的是为用户提供语音和/或者数据连接的设备。接入终端可以连接到诸如膝上型计算机或者桌面型计算机之类的计算设备，或者其可以是独立设备，例如个人数字助理。接入终端还可以指用户单元、移动站点、移动设备(mobile)、远程站点、远程终端、用户终端、用户代理、或者用户设备。接入终端可以是用户站点、无线设备、蜂窝电话、PCS电话、无绳电话、会话发起协议(SIP)电话、无线本地环路(WLL)站点、个人数字助理(PDA)、具有无线连接功能的手持设备、或者连接到无线调制解调器上的其他处理设备。在此所述的“接入点”指的是通过空中接口经过一个或多个扇区与接入终端进行通信的接入网络中的设备。接入点通过将所接收的空中接口帧转换为IP分组，来充当在接入终端与包括IP网络在内的接入网络的其他部分之间的路由器。接入点还协调空中接口的属性管理。
对于反向链路而言，在接入终端1202x，发射(TX)数据处理器 1214接收来自数据缓冲器1212的通信量数据，根据所选择的编码和调制方案来处理(例如，编码、交错、以及符号映射)每个数据分组，并提供数据符号。数据符号是数据的调制符号，导频符号(pilot symbol)是导频(其已知为先验的)的调制符号。调制器1216接收数据符号、导频符号，并且可能还有反向链路的信令，执行系统所指定的(例如OFDM)调制和/或者其他处理，并提供输出芯片的流。发射器单元(TMTR)1218处理(例如转换为模拟、滤波、放大、和频率上转换)输出芯片流并生成经过调制的信号，该信号是从天线 1220发射的。
在接入点1204x，由与接入点1204x通信的接入终端1202x和其他终端所发射的经过调制的信号被天线1252接收。接收器单元 (RCVR)1254处理(例如，调节和数字化)来自天线1252的所接收信号，并提供所接收采样。解调器(Demod)1256处理(例如，解调和检测)所接收采样，并提供所检测的数据符号，其是由终端发射到接入点1204x的数据符号的噪声估计。接收(RX)数据处理器 1258处理(例如，符号解映射、解交错和解码)每个终端的所检测的数据符号，并提供该终端的被解码数据。
对于前向链路，在接入点1204x，由TX数据处理器1260处理通信量数据以生成数据符号。调制器1262接收数据符号、导频符号、和前向链路的信令，执行(例如OFDM)调制和/或者其他相关处理，并提供输出芯片流，所述芯片流由发射器单元1264进行进一步调节，并从天线1252发射。前向链路信令可以包括由控制器1270对所有终端所产生的功率控制命令，其在反向链路上发射到接入点1204x。在接入终端1202x，由接入点1204x所发射的被调制信号由天线1220 所接收，由接收器单元1222进行调节和数字化，并由解调器1224进行处理，以获得所检测的数据符号。RX数据处理器1226处理所检测的数据信号，并为终端提供被解码数据并提供前向链路信令。控制器 1230接收功率控制命令，并控制在反向链路上到接入点1204x的数据传输和发射功率。控制器1230和1270分别控制接入终端1202x和接入点1204x的操作。存储器单元1232和1272分别存储控制器1230 和1270所使用的程序代码和数据。
所公开的实施例可以应用到以下技术中的任意一种或者其组合：码分多址(CDMA)系统、多载波CDMA(MC-CDMA)、宽带CDMA (W-CDMA)、高速下行链路分组接入(HSDPA)、时分多址(TDMA) 系统、频分多址(FDMA)系统和正交频分多址(OFDMA)系统。
与在此所公开的实施例有关的所述方法和算法的步骤可以直接用硬件、由处理器执行的软件模块或者两者的结合来实现。软件模块可以驻留在RAM存储器中、闪存存储器中、ROM存储器中、EPROM 存储器中、EEPROM存储器中、寄存器中、硬盘中、可移动磁盘中、 CD-ROM中或者现有技术中已知的任何存储介质中。示例性的存储介质耦合到处理器，从而使得存储器能够从存储介质中读出信息，并将信息写入存储介质中。可替换的，存储介质可以集成到处理器中。处理器和存储介质可以位于ASIC中。ASIC可以位于用户终端中。可替换的，处理器和存储介质可以作为分立部件而位于用户终端中。
应该注意的是，在此所述的方法可以在本领域技术人员已知的各种通信硬件、处理器和系统上实现。例如，对于客户机按照在此所述进行操作的通常要求是，客户机具有用于显示内容和信息的显示器、用于控制客户机操作的处理器和用于存储与客户机操作相关的数据和程序的存储器。在一个实施例中，客户机是蜂窝电话。在另一实施例中，客户机是具有通信能力的手持计算机。在再一实施例中，客户机是具有通信能力的个人计算机。另外，诸如GPS接收器之类的硬件可以按照需要结合到客户机中，来实现各种实施例。与在此所公开的实施例有关的各种示意性逻辑电路、逻辑块、模块和电路可以采用通用处理器、数字信号处理器(DSP)、特定用途集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立的门或晶体管逻辑电路、分立的硬件部件、或者被设计为执行在此所述功能的以上的任何组合来实现或者执行。通用处理器可以是微处理器，但是可替换的是，该处理器可以是任何传统的处理器、控制器、微控制器或者状态机。处理器还可以实现为计算器件的组合，例如，DSP 和微处理器的组合、多个微处理器的组合、与DSP核协作的一个或多个微处理器，或者任何其他的这种配置。
与在此所公开的实施例有关的各种示意性逻辑电路、逻辑块、模块和电路可以采用通用处理器、数字信号处理器(DSP)、特定用途集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立的门或晶体管逻辑电路、分立的硬件部件、或者被设计为执行在此所述功能的以上的任何组合来实现或者执行。通用处理器可以是微处理器，但是可替换的是，处理器可以是任何传统的处理器、控制器、微控制器或者状态机。处理器还可以实现为计算器件的组合，例如，DSP和微处理器的组合、多个微处理器的组合、与DSP核协作的一个或多个微处理器，或者任何其他的这种配置。
上述实施例是示例性的实施例。在不脱离在此所公开的发明性概念的情况下，本领域技术人员可以实现上述实施例的许多用途和改变。对于这些实施例的各种修改对于本领域技术人员是显而易见的，并且在此所定义的一般原理可以应用到其他实施例而不会脱离所述实施例的精神和范围，例如，应用在即时消息服务中或者任何普通无线数据通信应用中。因此，本描述的范围不是要局限于在此所示的实施例，而是要对其给予与在此所公开的原理和新颖特征相一致的最大范围。单词“示例性”在此专用于“用作示例、实例或者举例说明” 的意思。在此作为“示例性”所述的任何实施例不是必须要构建为优于其他实施例的。
在35 U.S.C§119下的优先权要求
本专利申请要求分配给同一代理人的于2004年7月20日提交的题目为“Method and Apparatus for Motion Vector Prediction in Temporal Video Compression”的临时专利申请No.60/589,818，因此在此将其引入作为参考。

标题	发布/更新时间	阅读量
运动矢量预测设计简化-专利编号CN103797795A	2020-05-13	416
运动矢量选择-专利编号CN101627626A	2020-05-11	833
仿射的运动矢量差精度-专利编号CN110809165A	2020-05-12	1055
运动矢量精度细化-专利编号CN110581997A	2020-05-12	1184
运动矢量预测和细化-专利编号CN102668562B	2020-05-13	1092
运动矢量处理-专利编号CN103891290A	2020-05-11	1142
运动矢量处理-专利编号CN103891290B	2020-05-11	872
运动矢量场校正-专利编号CN101322409A	2020-05-11	573
运动矢量的解码方法-专利编号CN108924562A	2020-05-12	416
运动矢量的解码方法-专利编号CN108600766A	2020-05-13	226

用于时间视频压缩中运动矢量预测的方法和设备

技术领域

背景技术

发明内容

附图说明

具体实施方式

IPRDB

热门服务

关于我们

友情链接

联系方式