视频压缩的设备和方法转让专利

申请号 : CN200510076486.8

文献号 : CN1717033B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 让-罗南·维古鲁努尔-埃丁·塔扎

申请人 : 汤姆森许可贸易公司

摘要 :

本发明涉及一种压缩视频文档的设备和方法。所述方法包括步骤:将视频文档分解为镜头(1);提取代表所述镜头的图像(2);测量所述代表图像之间的距离(3,4);将其距离小于预定阈值的图像一起组合为图像组(5);计算每一个图像相对于图像组中的其他图像的相对编码成本(6);根据本发明,所述方法还包括步骤:计算使每一个图像组的编码成本最小的每一个图像组的最小生成树(7);通过按照由所述生成树所给出的次序来浏览图像,对每一个图像组进行编码(8)。本发明适合于视频归档。

权利要求 :

1.一种压缩视频文档的方法,包括步骤:-将视频文档分割为镜头(1);

-提取代表所述镜头的图像(2);

-测量所述代表图像之间的距离(3,4);

-将其距离小于预定阈值的图像组合为图像组(5);

-计算图像组中每一个图像相对于该图像组中的其他图像的相对编码成本(6);

其特征在于所述方法包括步骤:-计算使每一个图像组的编码成本最小的每一个图像组的最小生成树(7);

-通过按照由所述最小生成树所给出的次序来浏览图像,对每一个图像组进行编码(8)。

2.根据权利要求1所述的方法,其特征在于:以帧内模式对最小生成树的第一编码图像进行编码。

3.根据权利要求2所述的方法,其特征在于在最小生成树中相对于在先图像,以预测模式对除了第一编码图像之外的图像进行编码。

4.根据权利要求1所述的方法,其特征在于以帧内模式对最小生成树中分隔的多个图像进行编码。

5.一种压缩文档的设备,包括:处理单元(9),所述处理单元(9)用于:-将视频文档分割为镜头;

-提取代表所述镜头的图像;

-测量所述代表图像之间的距离;

-将其距离小于预定阈值的图像组合为图像组;

-计算图像组中每一个图像相对于该图像组中的其他图像的相对编码成本(6);

其特征在于:

所述处理单元(9)计算使每一个图像组的编码成本最小的每一个图像组的最小生成树;以及-所述压缩文档的设备还包括编码器(12),通过按照由所述最小生成树所给出的次序来浏览图像,对每一个图像组进行编码。

说明书 :

视频压缩的设备和方法

技术领域

[0001] 本发明涉及一种压缩视频文档的设备和方法。更具体地,本发明涉及一种适合于归档(archiving)的视频压缩。

背景技术

[0002] 与当涉及压缩用于传输的视频时相比,当涉及对视频进行归档时,视频文档的压缩限制不太明显。
[0003] 具体地,必须通过按照时间次序逐个获取图像,来压缩实时压缩、传送和解压所需的视频,如MPEG-2等编码方法那样。
[0004] 当需要将图像记录在存储介质上以便长时间存储时,例如硬盘,能够以任意次序来压缩其,从而优化所存储的信息量,并因而使所需的存储资源最小。因此,压缩限制与实时编码/解码的情况并不相同。
[0005] 因此,本发明涉及在编码之前对视频文档的图像进行排序,从而增加压缩度。实际上,多种数据压缩方法使用到群簇(cluster)的组合(grouping)。然而,一旦已经最终形成了群簇,则按照其时间次序直接对图像进行编码。
[0006] 本发明能够避开该时间次序,并且在获得最佳压缩度的同时对图像进行编码。

发明内容

[0007] 出于这个目的,本发明涉及一种压缩视频文档的方法,包括步骤:
[0008] -将视频文档分解为镜头(shot);
[0009] -提取代表所述镜头的图像;
[0010] -测量所述代表图像之间的距离;
[0011] -将其距离小于预定阈值的图像一起组合为图像组;
[0012] -计算每一个图像相对于图像组中的其他图像的相对编码成本。
[0013] 根据本发明,所述方法包括步骤:
[0014] -计算使每一个图像组的编码成本最小的每一个图像组的最小生成树;
[0015] -通过按照由所述生成树所给出的次序来浏览图像,对每一个图像组进行编码。
[0016] 最小生成树能够修改图像的编码次序,因而提高压缩度。这特别适合于(但并非专门用于)归档所需的压缩,在所述归档中,编码时间并不重要且编码次序也并不重要。
[0017] 根据优选实施例,以帧内模式(intra mode)对生成树的第一编码图像进行编码。
[0018] 根据优选实施例,在最佳生成树中相对于在先图像,以预测模式对除了第一图像之外的图像进行编码。
[0019] 根据优选实施例,以帧内模式对生成树中分隔的多个图像进行编码。

附图说明

[0020] 参考附图,通过完全非限定性的优选方式的实施例和实现,本发明将得到更好地理解和说明,其中:
[0021] -图1示出了将视频分解到代表图像的组中;
[0022] -图2示出了根据本发明的处理的步骤;
[0023] -图3示出了最小生成树;
[0024] -图4示出了根据本发明的设备。

具体实施方式

[0025] 视频文档由一连串图像构成,图像自身经常能够组合为镜头,所述镜头对应于画面断片。
[0026] 图1示出了将视频文档分解为镜头P1、P2、P3、……、P10。将与图2并行地描述图1,图2示出了能够获得图1所示的视频文档的分割的处理步骤。
[0027] 存在将视频分解为镜头的各种方法,如图2的步骤1所示。在以Thomson Licensing SA的名义于2002年10月28日递交的法国专利申请0213978中具体描述了这样的方法。该专利申请也描述了提取针对每一个镜头的关键(key)图像(图2的步骤2)。可以从每一个镜头中提取一个和多个关键图像,这取决于镜头的运动量,镜头表现出能够以多于一个关键图像为特征的显著运动。
[0028] 之后,作为其相似性的函数,将关键图像组合在一起(图2的步骤4)。
[0029] 通过测量图像之间的距离来计算该相似性。测量图像之间的距离基于属性F之间的距离。
[0030] 作为非限定性说明,F代表从纹理、颜色中所选的图像的特征。作为可选方案,可以采用小波变换的主要系数作为属性。
[0031] 存在各种计算属性的方法(图2中的步骤3),并且这些方法是本领域的技术人员所公知的。
[0032] 作为说明,计算出的距离D可以是欧几里得型距离。
[0033] 当距离D小于预定阈值ε(例如,其可以固定为视频文档类型的函数)时,将这些图像一起组合为组或“群簇”(图2的步骤5)。然后,这些图像组表现出显著的视觉相似性。
[0034] 当从同一镜头中提取了多个关键图像时,并且当在组合到群簇中的步骤期间,其并未以相同的群簇为特征时,对其所述的群簇进行合并。
[0035] 所获得的群簇数量取决于相似性测量的预定阈值ε和用于组合到群簇中的方法。
[0036] 每一个群簇包括特定数量的镜头中的所有图像。
[0037] 因此,对于每一个群簇中的每一对图像,计算编码成本。
[0038] 逐一选择每一个图像,并且相对于其他图像评估与每一个图像相关的编码成本(图2中的步骤6)。
[0039] 之后,根据这些编码成本,针对每一个群簇来计算最小生成树(图2中的步骤7)。该最小生成树能够找到用于浏览使编码成本最小的群簇中的图像的整个集合的路径。
[0040] 在用于计算最小生成树的算法中,使用Kruskal算法。
[0041] 在其他实施例中,还可以使用Prim算法。
[0042] 在图3中给出了这样的生成树的一个示例,其中的点表示群簇的图像。
[0043] 群簇Ci包括编号为I1到I7的七个图像。
[0044] 群簇内同一镜头的图像I1到I7是连续的。
[0045] 应用于群簇I1到I7的克鲁斯卡尔算法给出了生成树,在图3的右手部分给出。
[0046] 该生成树给出了必须对图像进行编码以获得最小编码成本(即,允许对视频序列进行最大压缩的编码成本)的次序。
[0047] 当针对每一个群簇来计算生成树时,按照与生成树兼容的次序对图像进行编码(步骤8,图2)。原始图像的选择是任意的;最有利的选择是采用具有最短在内编码的图像。一旦已经选择了原始图像,则在所述树中按照降序对剩余图像进行排序。
[0048] 根据该示例,图像I4是将被编码的第一图像。因此,根据编码的在内模式对该图像进行编码,即仅在空间上。
[0049] 相对于所述树中的在先图像,根据预测模式对后续图像进行编码。相对于图像I7对图像I7进行编码,相对于图像I3以及图像I2对图像I6进行编码。相对于图像12对图像I1进行编码,并且相对于图像I1对图像I5进行编码。
[0050] 在其他示例中,能够以在内模式对多个图像进行编码。这特别出现在所述群簇包括大量图像的情况下。在这种情况下,对特定图像进行选择,在生成树中有规则地分隔,以便以在内模式来进行编码。
[0051] 可以设想用于预测编码的多个策略。特别地,在所提出的实施例中,根据符合MPEG-2或MPEG-4标准的编码策略对这些图像进行编码。
[0052] 一旦已编码,则将图像归档在诸如硬盘等存储介质中,以及群簇和树的结构描述能够重新构造全局视频。
[0053] 由时标(time lable)来识别每一个图像,所述时标能够在解码期间对图像进行排序并重新构造视频流。
[0054] 例如,本发明特别适合于其中镜头有规则地返回的节目。特别地,在其中图像有规则地包括展示该传输的新闻记者的镜头的电视播送杂志或新闻报纸的情况下,也是如此。
[0055] 图4示出了其中实现了本发明的系统。
[0056] 所述系统包括摄像机11。所述摄像机捕获事件并将视频信息传送到处理单元9。
[0057] 所述处理单元9适合于:
[0058] ·将视频文档分解为镜头;
[0059] ·提取所述镜头的代表图像;
[0060] ·测量所述代表图像之间的距离;
[0061] ·将其距离小于预定阈值的图像一起组合为图像组;
[0062] ·计算每一个图像相对于图像组中的其他图像的相对编码成本;
[0063] ·计算使每一个图像组的编码成本最小的每一个图像组的最小生成树。
[0064] 一旦已经这样做,则将图像排序信息传送到编码设备12。所述编码设备12适合于在将其传送到归档单元10(可以是硬盘、DVD等)之前,对视频图像进行编码。