处理多层数据流的装置和方法、编码器和方法及存储介质转让专利
申请号 : CN201910182087.1
文献号 : CN110139110B
文献日 : 2021-11-05
发明人 : 卡斯滕·聚林 , 托马斯·席尔 , 德特勒夫·马佩 , 罗伯特·斯库平 , 亚戈·桑切斯德拉富恩特 , 格哈德·特克
申请人 : GE视频压缩有限责任公司
摘要 :
权利要求 :
1.一种配置为处理多层数据流(10)的装置,使用层间预测在对应于信息量的不同等级的不同层上将视频材料编码入所述多层数据流,所述多层数据流包括多个数据包(12),每个数据包与所述不同层中的一层相关联,每层由基础层ID(20)、或基础层ID(20)和扩展层ID(22)索引,所述装置配置为:从所述多层数据流中读取第一相互依赖性语法结构(24),表示对于所述基础层ID(20)能表示的每一对不同值i和j,i
对于每一对(j,k),从所述多层数据流中读取第二相互依赖性语法结构(26)的实例化,表示对于所述扩展层ID(22)能表示的每对不同值p和q,p≠q,具有基础层ID j和扩展层q的层是否依赖于具有基础层ID i和扩展层p的层,所述第一相互依赖性语法结构对于所述每一对表示存在至少一对层,所述至少一对层中的一层具有基础层ID i,并且所述至少一对层中的另一层具有基础层ID j并且依赖于具有基础层ID i的层,并且基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构的实例化,构造显示在不同层之间的可能层间预测依赖性的层间依赖性描述(14)。
2.根据权利要求1所述的装置,其中,所述扩展层ID(22)能表示的值的数量是M,并且所述装置配置为通过从所述数据流中读取以下内容来为对(j,k)读取所述第二相互依赖性语法结构的实例化:
每对(p,q)的一个二进制值。
3.根据权利要求1或2中任一项所述的装置,其中,所述装置配置为基于所述第一相互依赖性语法结构和数据包的基础层ID,丢弃以层组为单位的数据包,每个数据包具有共同的基础层ID。
4.根据权利要求3所述的装置,配置为基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构和数据包的基础层ID以及数据包的扩展层ID,丢弃进一步的单独层。
5.根据权利要求1所述的装置,其中,所述装置被进一步配置为:对于所述基础层ID(20)能表示的值j,从所述多层数据流中读取第二相互依赖性语法结构(26)的另一个实例化,表示对于所述扩展层ID(22)能表示的每一对不同值p和q,p
6.根据权利要求1所述的装置,其中,所述装置是视频解码器,配置为使用所述层间预测和所述层间依赖性矩阵,解码多层视频信号,或者
网络元件,配置为基于所述层间依赖性矩阵,丢弃所述多层视频信号的数据包。
7.根据权利要求1所述的装置,其中,多层视频信号具有使用层间预测在不同层上编码入所述多层视频信号的视频材料,以便从另一层中层间预测的任何层增加以下中的一个或多个:
进一步视图;
深度信息;
阿尔法混合信息;
颜色分量信息;
空间分辨率细化;以及
SNR分辨率细化。
8.一种编码器,配置为使用层间预测在对应于信息量的不同等级的不同层上将视频材料编码入多层数据流10,所述多层数据流包括多个数据包(12),每个数据包与所述不同层中的一层相关联,每层由基础层ID(20)、或基础层ID(20)和扩展层ID(22)索引,所述编码器配置为:
在所述多层数据流内插入第一相互依赖性语法结构(24),表示对于所述基础层ID(20)能表示的每一对不同值i和j,i
对于每一对(j,k),从所述多层数据流中读取第二相互依赖性语法结构(26)的实例化,表示对于所述扩展层ID(22)能表示的每对不同值p和q,p≠q,具有基础层ID j和扩展层q的层是否依赖于具有基础层ID i和扩展层p的层,所述第一相互依赖性语法结构对于所述每一对表示存在至少一对层,所述至少一对层中的一层具有基础层ID i,并且所述至少一对层中的另一层具有基础层ID j并且依赖于具有基础层ID i的层,并且通过设置所述第一相互依赖性语法结构和所述第二相互依赖性语法结构的实例化,使得基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,能构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述(14)。
9.一种用于使用层间预测在对应于信息量的不同等级的不同层上将视频材料编码入多层数据流(10)的方法,所述多层数据流包括多个数据包(12),每个数据包与所述不同层中的一层相关联,每层由基础层ID(20)、或基础层ID(20)和扩展层ID(22)索引,所述方法包括:
在所述多层数据流内插入第一相互依赖性语法结构(24),表示对于所述基础层ID(20)能表示的每一对不同值i和j,i
对于每一对(j,k),从所述多层数据流中读取第二相互依赖性语法结构(26)的实例化,表示对于所述扩展层ID(22)能表示的每对不同值p和q,p≠q,具有基础层ID j和扩展层q的层是否依赖于具有基础层ID i和扩展层p的层,所述第一相互依赖性语法结构对于所述每一对表示存在至少一对层,所述至少一对层中的一层具有基础层ID i,并且所述至少一对层中的另一层具有基础层ID j并且依赖于具有基础层ID i的层,并且通过设置所述第一相互依赖性语法结构和所述第二相互依赖性语法结构的实例化,使得基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,能构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述(14)。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有具有程序代码的计算机程序,配置为在计算机上运行时,执行根据权利要求9所述的方法。
11.一种配置为处理表示多层信号的数据流的装置,使用层间预测将视频编码入所述多层信号作为对应于信息量的不同等级的不同层,所述数据流包括多个数据包,每个数据包与所述不同层之一相关联,每层由基础层ID、或基础层ID和扩展层ID索引,所述装置配置为:
从所述数据流中读取
第一相互依赖性语法结构,表示由所述基础层ID能表示的几对不同值之间的相互依赖性,以及
第二相互依赖性语法结构,表示由所述扩展层ID能表示的几对不同值之间的相互依赖性,其中,所述第二相互依赖性语法结构的实例化表示(a)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与相同的基础层ID和不同的扩展层ID相关联,或者(b)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与不同的基础层ID和不同的扩展层ID相关联;并且基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述。
12.根据权利要求11所述的装置,其中,所述装置配置为:通过有条件地根据表示在对(j,k)之间存在或不存在相互依赖性的所述第一相互依赖性语法结构,从用于对(j,k)的数据流中,读取或者抑制读取所述第二相互依赖性结构,以从所述数据流中读取所述第二相互依赖性结构的多个实例化,即用于所述基础层ID能表示的值0
13.根据权利要求11所述的装置,其中,所述装置配置为:从所述数据流中读取所述第二相互依赖性结构的实例化,以及对于所述第二相互依赖性结构的每个实例化,读取使所述第二相互依赖性结构的各实例化与所述基础层ID能表示的值0
14.根据权利要求13所述的装置,其中,所述关联语法结构包括用于每对(j,k)的标志,并且所述装置配置为:
通过跳过值0
15.根据权利要求11所述的装置,其中,所述扩展层ID能表示的值的数量是M,并且所述第二相互依赖性语法结构包括
对于扩展值0
16.根据权利要求11所述的装置,其中,所述装置配置为在数据流中从在所述基础层ID能表示的N值之中的最大假定值的明确信令中获得n,和/或在数据流中从在所述扩展层ID能表示的M值之中的最大假定值的明确信令中获得m。
17.根据权利要求11所述的装置,其中,所述第一相互依赖性语法结构定义不同层组之间的相互依赖性,每个不同组与唯一基础层ID相关联。
18.根据权利要求11所述的装置,其中,所述装置配置为基于所述第一相互依赖性语法结构和数据包的基础层ID,丢弃以层组为单位的数据包,每个数据包包括共同的基础层ID。
19.根据权利要求18所述的装置,其中,所述装置配置为基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构和数据包的基础层ID以及数据包的扩展层ID,丢弃进一步的单独层。
20.根据权利要求11所述的装置,其中,所述装置是视频解码器,配置为使用所述层间预测和所述层间依赖性矩阵,解码多层视频信号,或者
网络元件,配置为基于所述层间依赖性矩阵,丢弃所述多层视频信号的数据包。
21.根据权利要求11所述的装置,其中,多层视频信号具有使用层间预测在不同层上编码入所述多层视频信号的视频,以便从另一层中层间预测的任何层增加以下中的一个或多个:
进一步视图;
深度信息;
阿尔法混合信息;
颜色分量信息;
空间分辨率细化;以及
SNR分辨率细化。
22.一种用于处理表示多层信号的数据流的方法,使用层间预测将视频编码入所述多层信号作为对应于信息量的不同等级的不同层,所述数据流包括多个数据包,每个数据包与所述不同层之一相关联,每层由基础层ID、或基础层ID和扩展层ID索引,所述方法包括:从所述数据流中读取
第一相互依赖性语法结构,表示由所述基础层ID能表示的几对不同值之间的相互依赖性,以及
第二相互依赖性语法结构,表示由所述扩展层ID能表示的几对不同值之间的相互依赖性,其中,所述第二相互依赖性语法结构的实例化表示(a)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与相同的基础层ID和不同的扩展层ID相关联,或者(b)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与不同的基础层ID和不同的扩展层ID相关联;并且基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述。
23.根据权利要求22所述的方法,还包括:通过有条件地根据表示在对(j,k)之间存在或不存在相互依赖性的所述第一相互依赖性语法结构,从用于对(j,k)的多层数据流中,读取或者抑制读取所述第二相互依赖性结构,以
从所述数据流中读取所述第二相互依赖性结构的多个实例化,即用于所述基础层ID能表示的值0
24.根据权利要求22所述的方法,还包括:从所述数据流中读取所述第二相互依赖性结构的实例化,以及对于所述第二相互依赖性结构的每个实例化,读取使所述第二相互依赖性结构的各实例化与所述基础层ID能表示的值0
25.根据权利要求24所述的方法,其中,所述关联语法结构包括用于每对(j,k)的标志,并且所述方法还包括:
通过跳过值0
26.根据权利要求22所述的方法,其中,所述扩展层ID能表示的值的数量是M,并且所述第二相互依赖性语法结构包括
对于扩展值0
27.根据权利要求22所述的方法,还包括基于所述第一相互依赖性语法结构和数据包的基础层ID,丢弃以层组为单位的数据包,每个数据包包括共同的基础层ID。
28.根据权利要求27所述的方法,还包括基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构和数据包的基础层ID以及数据包的扩展层ID,丢弃进一步的单独层。
29.一种编码器,配置为编码入表示多层信号的数据流,使用层间预测将视频编码入所述多层信号作为对应于信息量的不同等级的不同层,所述数据流包括多个数据包,每个数据包与所述不同层之一相关联,每层由基础层ID、或基础层ID和扩展层ID索引,所述编码器配置为:
在所述数据流内插入
第一相互依赖性语法结构,表示由所述基础层ID能表示的几对不同值之间的相互依赖性,以及
第二相互依赖性语法结构,表示由所述扩展层ID能表示的几对不同值之间的相互依赖性,其中,所述第二相互依赖性语法结构的实例化表示(a)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与相同的基础层ID和不同的扩展层ID相关联,或者(b)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与不同的基础层ID和不同的扩展层ID相关联,通过设置所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,使得基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,能构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述。
30.根据权利要求29所述的编码器,其中,多层视频信号具有使用层间预测在不同层上编码入所述多层视频信号的视频,以便从另一层中层间预测的任何层增加以下中的一个:进一步视图;
深度信息;
阿尔法混合信息;
颜色分量信息;
空间分辨率细化;以及
SNR分辨率细化。
31.一种用于编码入表示多层信号的数据流的方法,使用层间预测将视频编码入所述多层信号作为对应于信息量的不同等级的不同层,所述数据流包括多个数据包,每个数据包与所述不同层之一相关联,每层由基础层ID、或基础层ID和扩展层ID索引,所述方法包括:
在所述数据流内插入
第一相互依赖性语法结构,表示由所述基础层ID能表示的几对不同值之间的相互依赖性,以及
第二相互依赖性语法结构,表示由所述扩展层ID能表示的几对不同值之间的相互依赖性,其中,所述第二相互依赖性语法结构的实例化表示(a)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与相同的基础层ID和不同的扩展层ID相关联,或者(b)在层间预测的方面,依赖于第二层的第一层,其中,所述第一层和所述第二层与不同的基础层ID和不同的扩展层ID相关联,通过设置所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,使得基于所述第一相互依赖性语法结构和所述第二相互依赖性语法结构,能构造显示在所述不同层之间的可能层间预测依赖性的层间依赖性描述。
32.一种非暂时性数字存储介质,其上存储有计算机可读代码,当所述存储介质由计算机运行时,执行根据权利要求22所述的方法。
33.一种非暂时性数字存储介质,其上存储有计算机可读代码,当所述存储介质由计算机运行时,执行根据权利要求31所述的方法。
说明书 :
处理多层数据流的装置和方法、编码器和方法及存储介质
技术领域
背景技术
要随时可用,比较在图1中的表格中提供的HEVC中的den NAL单元报头(nuh_layer_id)内的
层标识符。
个视图或32个视图加上深度的组合限制为最大。虽然这对于很多共同的立体视图场景和其
他应用充分,但是对于应用(例如,光场成像【4】、【5】或全息显示【6】)具有不止100个视图的
大型摄像头阵列需要可扩展机构,用于信令层标识符的更大空间。
种信息,需要无法容忍的计算资源,所以在构成的层标识符空间内提供编码依赖性的紧凑
表示,也具有优点。
发明内容
生的独立权利要求的主题实现这个目标。
结构以及表示在扩展层ID能表示的几对不同值之间的相互依赖性的第二相互依赖性语法
结构的方式描述层间依赖性,发现在一方面的层间依赖性的潜在多样性的太密集限制与另
一方面的层间依赖性的太复杂信令之间的良好折衷,所述基础层ID和扩展层ID索引与所述
多层数据流的部分相关联的层。根据该概念,可在一方面的可信令层间依赖性的增加的多
样性与另一方面的用于信令所述层间依赖性的减小的边信息开销之间转移重点:例如,分
别调用具有共同的基础层ID的层的组,即,“集群”,所述相同的第二相互依赖性语法结构可
用于单独在所有集群内并且在通过所述第一相互依赖性语法结构彼此相关的所有集群之
间调节所述相互依赖性。可替换地,所述第二相互依赖性语法结构的两个实例化可用于描
述一方面在所述集群内并且另一方面在不同集群的层之间的层的相互依赖性。无论是将重
点放在增加的多样性还是减小的边信息开销上,所述相互依赖性信令理念的结果是保持低
信令开销。
向后兼容性,基础层ID字段的某个值限制为不可扩展,例如,在基础层ID字段内的基础层ID
值0。并非特别相对于该不可扩展的基础层ID值避开该限制,通过将基础层ID字段细分成第
一子字段和第二子字段,通过可扩展的方式信令多层数据流的部分的层ID:每当基础层ID
字段的第一子字段满足预定标准,提供扩展层ID字段,并且如果基础层ID字段的第一子字
段不满足预定标准,那么省略扩展层ID字段。上述不可扩展基础层ID值“隐藏”在这组基础
层ID值内,其中,基础层ID字段的第一子字段不满足预定标准,因此,这个不可扩展基础层
ID值不单独处理,而是渲染前一个组的一部分。确切地说,如果基础层ID字段的第一子字段
满足预定标准,那么从在多层数据流内信令的扩展层ID字段中获得扩展值,以便这同样位
于扩展值的域的第一子集内,并且如果基础层ID字段的第一子字段不满足预定标准,那么
该扩展值设置为与扩展值的域的第一子集不相交的值。然后,使用扩展值以及从基础层ID
字段的第二子字段中获得的集群值,索引与相应部分相关联的层。总而言之,尽管保持向后
兼容性,也未丧失信令效率。
结构的信令。根据该方面,在多层视频信号内信令最大语法元素,以指示多层视频信号的数
据包的扩展层ID字段的最大使用值,例如,最大语法元素的范围是(例如)延伸穿过多层视
频信号的几个部分的多层视频信号的预定部分。因此,根据该方面,对于接收多层视频信号
的装置(例如,解码器或网络元件),可行的是为多层视频信号的较大预定部分获得关于扩
展层ID字段可信令的可能值的可能域的实际消耗部分的知识,并且不需要为基础层ID字段
值和扩展层ID字段值的每个组合信令至少一个特征,更确切地说,足以为基于最大假定值
确定的最大层数信令所述至少一个特征。因此,不需要为具有层ID的层传输/信令所述至少
一个特征,所述层的扩展层ID不在多层视频信号的预定部分内发生。除此以外,根据进一步
实施方式,最大假定值的知识可用于减少用于信令每个部分的层ID的边信息开销,即,用于
减少在多层视频信号的数据包内信令扩展层ID字段所需要的位。
附图说明
概念或任何组合改进;
ID字段,并且使用layerID表示层ID,并且扩展层ID字段的能表示值的数量由max_layer_
id_ext(加上1)表示,通过将扩展长度设置为等于2,将扩展层ID字段的长度选择为2,该数
量在此处例证地设置为3;
具体实施方式
这个概述不理解为限制下面进一步概述的实施方式,但是相对于以下附图示例性提供的细
节和功能被视为描述下面进一步概述的实施方式的大量可能扩展,以便产生更详细的实施
方式。在任何情况下,在后文中提出的说明性多层视频编解码器环境使得更容易理解下面
概述的实施方式的优点。
例如,视频的每个图片的纹理和深度。一般而言,视频材料202能表示一个场景的多维取样。
一个维度可能是时间t。即,视频材料202在时间上给该场景取样,从而为每个时刻产生一个
图片。而且,可从不同的视角捕捉该场景,从而在每个时刻为每个视图产生一个视频或者为
每个视图产生一个图片。进一步,除了场景的纹理的空间取样,即,场景的颜色的空间取样,
视频材料202还为每个视图或者视图的每个子集提供场景的深度图,用于相应的视图。例
如,图2在使用阴影线说明的深度图与没有阴影线绘制的纹理图或图像之间区分。然而,应
注意的是,应注意的是,下面进一步概述的实施方式都不限于这种多视图材料。确切地说,
提供在图2中的说明,仅仅为了减轻下面提出的描述。
频材料编码入多层数据流204。这表示以下内容。多层视频编码器200生成多层数据流,以便
多层数据流包括多个数据包206,每个数据包与不同层中的一层相关联。例如,多层视频编
码器200将视频材料202的信息量的某个基础等级编码入某个基础层的数据包206,例如,仅
仅一个视图的纹理等。例如,从在每个数据包206内的层识别语法元素结构208中可获得数
据包206与各种层中的任何层的关联,其中,例如,层识别语法元素结构208可包含在相应数
据包206的报头210内。例如,为了说明的目的,数字1、2以及3显示为刻入数据包206内,从而
分别使用层ID 1、2以及3说明层。在这些层之中,例如,具有层ID1的层可形成最低或者基础
层,提供信息量的基础等级。其他层的数据包206可仅仅在一个或多个或各种信息类型的方
面提高在基础层的数据包206上可用的信息量。例如,除了在基础或参考层的数据包206内
已经编码的视图,某个层的数据包206还可具有在其内编码的进一步视图。可替换地,某个
层的数据包206可具有关于视频材料202的场景的深度信息,例如,示图的深度信息,该信息
的纹理已经编码入可能是任何更低层的基础或者(更具体而言)参考层的数据包。同样,表
面反射率信息可编码入进一步层的数据包,即,相对于在该场景内的对象的表面反射率的
场景的空间取样,与照明环境无关。并且甚至进一步地,阿尔法(alpha)混合信息可编码入
进一步层的数据包,即,对应于单独图片样本的场景点的透明度的空间取样。某个层的数据
包206还可在某个颜色分量上增加信息,或者可增大空间分辨率,即,提供空间分辨率细化。
同样,某个层的数据包206可仅仅提供SNR分辨率细化,即,提高编码的视频材料的信噪比。
为了就各种层而言,在多层数据流204内避免冗余,多层视频编码器200使用层间预测:即,
某个层的数据包206相对于从一个或多个其他层(相对于前一层称为参考层)中获得的层间
预测在其内编码预测残差。层间预测可应用于不同的实体中,例如,描述视频材料202的语
法元素和参数。例如,描述由某个层的数据包206传输的预测残差可校正逐个像素地在空间
域内从所述一个或多个参考层中获得的层间预测。可替换地,例如,多层视频编码器200可
使用变换残差编码,并且例如,可在变换域(例如,DCT域)中逐个变换系数地发生层间预测
校正。可替换地或者此外,多层视频编码器200可能是使用空间和/或时间预测的混合视频
编解码器型,并且例如,此外或者可替换地,层间预测可属于运动向量的细化。甚至进一步
地,多层视频编码器200可使用分层多树细分,以便将视频材料202的图片细分成:编码块,
以所述编码块为单位,应用不同的预测模式,例如,空间和时间预测;变换块,以所述变换块
为单位,在预测残差上执行上述变换;和/或其他块体,以所述其他块体为单位,设置某些编
码参数,用于编码视频材料202,而非重新为进一步层信令细分信息,可从所述一个或多个
基础层中的任一个中完全采用所述细分,或者可信令相对于该细分信息的细化。
依赖性树212的信息在解码侧上可用,多层视频信号204可具有编码入该信号的关于该信号
的信息。
层间依赖性。
言,虽然对于很多应用,中等数量的层足以形成多层视频信号204,但是一些其他应用可经
受层识别语法元素结构208可信令的太少数量的层。换言之,构成层识别语法元素结构208,
以便对需要这种大量层的那些应用,这也会容纳大量层,在考虑应用的整体多重性时,会不
利地造成高边信息开销,并且解释层识别语法元素结构208,以便这同样仅仅容纳中等数量
的层,这会拒绝其他应用由位于数据流204之下的多层视频编解码器充分支持。因此,可使
用某个扩展机构,以便能够在层识别语法元素结构208仅仅容纳较低的中等数量的层的数
据流204的模式与层识别语法元素结构甚至容纳大量层的模式之间切换,并且信息214可另
外或者可替换地参与在这些模式之间切换。
体相关,每个块体是图片序列。例如,使用DASH或另一个合适的流协议,多层视频编码器200
可能以刚刚提及预定部分为单位,改变编码入位流204的层数、具有树结构212的形式的层
间依赖性和/或相对于层识别语法元素结构208在扩展或非扩展之间的切换。在任何情况
下,定期传输高级语法数据包216使接收者能够在随机访问的基础上具有多个随机访问时
间实例,以开始在其间解码多层视频信号214。
图2还示出了配置为解码多层视频数据流204的多层视频解码器220。这两个实体(即,网络
元件218和多层视频解码器220)形成用于处理多层数据流204的装置的实例。
树21限定的在其间的层间依赖性相关联的数据包206。例如,网络元件218丢弃与层相关联
的数据流204的数据包206,其中,例如,由于在链路内的比特率缺点,即,接收者不能再现额
外信息量等,所以分别在网络元件218与多层视频解码器220之间的进一步链路内初步不需
要所提供的额外信息量。同样,多层视频解码器220还可决定丢弃响应于外部参数(例如,当
前可用的计算功率)、再现装置的显示性能(例如,空间分辨率)、最大数量的输入视图等的
某些层的一些数据包206。即,装置218/220能够读取数据包206的层识别语法元素结构208,
并且如果存在的话,那么能够从信息214中获得在层之间的层间依赖性,和/或能够相对于
响应于信息214的层识别语法元素结构208,在扩展模式或非扩展模式之间切换,和/或能够
从信息214中相对于层读取其他特征。
202,直到某个等级(参照树结构212)。即,如上所述,多层视频解码器220可使用某个层的数
据包206,作为相对于多层视频解码器220从该层的一个或多个参考层的数据包206中获得
的层间预测的预测残差。在这方面,如上所述,多层视频解码器220还可能是使用变换残差
解码、混合视频解码、分层多树细分和/或其他编码概念的解码器。
不彼此交错,以便在每个时刻形成连续访问单元222,每个访问单元收集属于该访问单元
222的相应时刻的数据包206,以便在该访问单元222之前或之后,属于任何其他时刻的数据
包206在数据流204内。然而,应注意的是,选择该限制,仅仅用于说明的目的,并且可替换地
选择在数据流204内的数据包206的更松弛的设置。
群并且另一方面是在集群内的层之中的层间依赖性。在这范围内,下面提出的描述表示实
现图2的信息214的可能性,以便信令层间依赖性212,但是如上所述,在后文中相对于图3描
述的细节不应限于在图2中陈述的细节。确切地说,图2应被视为相对于图3的描述的可能实
现储层。
更容易理解,人们可考虑每层给数据流10增加某个视图。然而,这并非表示限于图3的描述。
可替换地,每层可对应于信息量的不同测度的组合,例如,多个视图和空间分辨率等。
号10的单独图片,所述子流可反过来由更小的单元构成,例如,NAL单元、薄片等。然而,同时
主张图2和图3的数据包12或数据包206也可能是NAL单元、薄片或其他单元。
包中。如在14中所示,对于每层,由小圆点说明“更低层”。
成层ID。具体而言,接收多层数据流10的网络装置对每个数据包12读取使用在图2中的参考
符号208表示的层ID语法结构,但是在此处由基础层ID字段20以及有条件地(例如,有条件
地根据基础层ID字段或高级语法元素打开和关闭扩展机构)扩展层ID字段22构成。示例性
地,在图中仅仅示出了具有这两个字段的数据包12。但是如上所述,基础层ID字段20的一个
或多个值可信令相应数据包12的字段22的不存在。例如,整个扩展功能可以通过在数据流
内的扩展标志在数据流内打开/关闭,并且需要或者不需要扩展层ID字段的可能条件可能
在于,如上所述,基础层ID字段是0,是或者具有设置或未设置的某个位,或者采用在字段20
或者具有大于或小于某个值的值的基础层ID字段的子部分内的某个值。下面陈述进一步实
例。
direct_dependency_flag的第一相互依赖性语法结构以及包含(例如)下面表示的direct_
ext_dependency_flag和/或general_direct_ext_dependency_flag的第二相互依赖性语
法结构。第一相互依赖性语法结构通过二进制的方式表示在基础层ID字段20能表示的几对
不同值之间的相互依赖性,而第二相互依赖性语法结构通过二进制的方式表示在扩展层ID
字段能表示的几对不同值之间的相互依赖性。基于这两个相互依赖性语法结构,然后,网络
装置18形成显示在不同层之间的层间预测依赖性的层间依赖性矩阵,例如,在图中的14中
描述的矩阵。下面使用伪码说明可进行导出的方式,所述伪码使用涉及第一和第二相互依
赖性语法结构的接下来的循环,并且还相对于以下示图解释该方式。然而,应注意的是,所
述信令的层间预测依赖性不需要实际上用于数据流内。确切地说,可能的层间预测依赖性
的信令用于指导解码器或其他网络装置采用必要的步骤,相关的数据包按照合适的顺序可
用,即,在参考数据包之前其他数据包根据层间预测依赖性参考的数据包。
同值中获得的并且从而与该值相关联的层ID的层之间的层间预测依赖性相关。根据下面也
更详细地描述的另一个实施方式,第二相互依赖性语法结构从位流10中读取并且在位流内
传输几次,例如,单独用于基础层ID字段20的每个可能值或者用于基础层ID字段20的可能
值的子集,同时使用索引,例如,在下面提出的实例中使用included_nuh_layer_id,使第二
相互依赖性语法结构的各种实例化与基础层ID字段20的可能值相关联。在甚至其他实施方
式中,该结构概括为允许所有可能的层间预测依赖性,并且通过第二相互依赖性语法结构
可描述,即,通过为基础层ID字段的每对不同值传输该结构,其中,第一相互依赖性语法结
构表示相互依赖性存在。
个相互依赖性语法结构24和26的范围之间的界面与由在数据流的每个数据包内的字段20
和22提供的基础层ID和扩展层ID的范围之间的界面一致。由字段20和22提供的基础层ID和
扩展层ID独特地限定包括字段20和22的相应数据包的层ID。这组扩展层ID和基础层ID的组
合能表示的所有能表示的层ID在圆圈28内由圆点30表示。即,每个圆点30对应于不同的一
对基础层ID和扩展层ID。例如,层ID可能是基础层ID和扩展层ID的串联。仅仅使用字段20提
供的基础层ID,整组28层ID 30细分成层ID的不相交的组32,在下面称为集群32,其中,属于
某个集群32的所有层ID具有相同的基础层ID。如上面相对于图2所述,由于在图4中使用在
圆点30之间的虚线说明具有这些层间依赖性的层间预测,所以与层ID 30相关联的层通过
树状方式彼此链接。为了容易理解,仅仅在图4中说明实际的层间依赖性的子集。
语法结构24粗糙地或者按照集群的方式描述在层之间的相互依赖性。在图4中,使用在集群
32之间的连续线路说明这些相互依赖性。第一和第二集群32的所有对(其中,第一集群的至
少一层与在第二集群内的一个集群链接)互连,因此,在第一相互依赖性语法结构24中表
示。然后,第二相互依赖性语法结构26阐明表示为由第一相互依赖性语法结构24互连的几
对集群32中的哪些层实际上通过层间预测彼此相关。即,第二相互依赖性语法结构26阐明
细粒度相互依赖性。然而,第二相互依赖性语法结构26也单独限定在每个集群32内的层之
间的相互依赖性,即,在层之间的集群内依赖性。在图4中,例如,示出了6个集群32,从而产
生第二相互依赖性语法结构26调节在不同集群32的层之间的细粒度相互依赖性的可能15
对集群32加上第二相互依赖性语法结构26可在内部调节相互依赖性的6个集群。如上所述
并且如下面进一步所述,因此,最大可具有第二相互依赖性语法结构的1到21个实例化34,
即,每个集群单独具有1个并且互连的每对集群32具有一个。显然,不需要为信令为通过第
一相互依赖性语法结构24不链接的几对集群32,信令第二相互依赖性语法结构26,从而保
存有价值的边信息比特率。应注意的是,在使用第二相互依赖性语法结构26,以便描述不同
的几对集群32的层的层间依赖性的情况下,对于所有集群32,每个集群32的层数应相等。如
果使用基础层ID和扩展层ID的串联描述层ID,那么这是这种情况。然而,应提及的是,在理
论上,集群32的层数可以在集群32之间变化。在这种情况下,例如,第二相互依赖性语法结
构26的单独实例化34会在数据流内为互连的每对集群32信令,并且会为每个集群尺寸传输
至少一个实例化34。
在一个集群内的层的层间依赖性并且另一个实例化34用于描述在不同集群的层之间的依
赖性的示例性情况。为了完整性,要注意的是,图3的矩阵14具有与层ID一样多的行和列。仅
仅填充在对角线之下的下半部分,这是因为任何层可仅仅通过层间预测取决于任何先前的
(即,分层次更低的)层。在图3的实例中,列数对应于层的层ID,通过使用层间预测,所述层
ID取决于进一步层,即,基础层,这些基础层由(例如)二进制层表示,而二进制零表示不参
与层间预测相应层的层,所述层的层ID对应于当前列。在该范围内,在图3的实施方式中,第
二相互依赖性语法结构26几乎描述矩阵14的子矩阵。
描述的层集群之间的相互依赖性。例如,具有基础层ID 2的集群取决于具有基础层ID 2和1
的集群。
调节不同集群的层的逐层相互依赖性的第二相互依赖性语法结构26的实例化34。具体而
言,第二实例化可通过对于被参考集群的每个增强层ID具有一行并且对于参考集群的每个
增强层ID具有一列的子矩阵40描述在不同集群的层之间的依赖性。
且子矩阵40放在矩阵36通过“1”表示在不同的基础层ID的集群之间的相互依赖性的位置。
在42中示出结果。
方式可如下:第一相互依赖性语法结构24可信令在对角线之下并且包括对角线的矩阵36的
每个系数的二进制值。表示矩阵38的第二相互依赖性语法结构26的实例化34可信令在对角
线之下并且不包括对角线的矩阵38的每个系数的二进制值。表示矩阵40的第二相互依赖性
语法结构26的实例化34可信令矩阵40的所有系数的二进制值。
造成集群,可允许在单独集群内具有相等构造的编码依赖性的集群,即,在所有限定的集群
内或者限定的集群的子集内的编码依赖性相同。如在图6中所述,可在集群内作为额外一组
依赖性标志信令依赖性并且组合所述依赖性和现有依赖性信令(比较在HEVC扩展的VPS扩
展内的direct_dependency_flag),以确定特定层的参考层。
定具有扩展索引j的层可能是在相同集群内具有扩展索引i的层的直接参考层。在对于在0
到(1<
形。下面提供语法实例,用于根据以上内容通过多种方式信令限定集群依赖性组。
有索引j的层或集群可能是具有索引i的层或参考集群的直接参考层或参考集群。在对于在
0到vps_max_layers_minus1的范围内的i和j,不存在direct_dependency_flag[i][j]时,
推断出等于0。
dependency_flag[i][j]规定具有扩展索引j的层可能是在相同集群内具有扩展索引i的层
的直接参考层。在对于在0到max_layer_id_ext的范围内的i和j,不存在general_direct_
ext_dependency_flag[i][j]时,推断出等于0。
[j][k]规定具有扩展索引k的层可能是在第i集群内具有扩展索引j的层的直接参考层。在
对于在0到max_layer_id_ext的范围内的i、j以及k,不存在direct_ext_dependency_flag
[i][j][k]时,推断出等于0。
性、在每个集群依赖性组内的编码依赖性(direct_ext_dependency_flag)以及应用集群
(由规定的语法元素included_nuh_layer_id通过其相应nuh_layer_id的积极标志示例性
识别)。
有索引j的层或集群可能是具有索引i的层或参考集群的直接参考层或参考集群。在对于在
0到vps_max_layers_minus1的范围内的i和j,不存在direct_dependency_flag[i][j]时,
推断出等于0。
令层的依赖性。
[l]规定在第j集群内的第l层可能是在第i集群内的第k层的直接参考层。在不存在时,
direct_ext_dependency_flag[i][j][k][l]推断出等于0。
有索引j的层或集群可能是具有索引i的层或参考集群的直接参考层或参考集群。在对于在
0到vps_max_layers_minus1的范围内的i和j,不存在direct_dependency_flag[i][j]时,
推断出等于0。
令层的依赖性。
考层。在dependency_set_applies_flag[n][i][j]等于1时,等于1的direct_ext_
dependency_flag[n][k][l]规定在第j集群内的第l层可能是在第i集群内的第k层的直接
参考层。
dependency_set_applies_flag[n][i][j]规定在第i集群内的层与在第j集群内的层之间
的依赖性由direct_ext_dependency_flag[n][k][l]规定。在不存在时,dependency_set_
applies_flag[n][i][j]推断出等于0。在对于在0到(number_of_cluster_dependency_
sets–1)的范围内(包括0和number_of_cluster_dependency_sets–1)的i和j以及所有n的
特定组合,dependency_set_applies_flag[n][i][j]等于0时,在第j集群内的层并非在第i
集群内的任何层的直接参考层。
列参数组。根据图7的语法实例,对于每对集群i、j(i≤j),使用语法元素direct_
dependency_flag,信令第一相互依赖性语法结构24,其中,vps_max_layers_minus1是基础
层ID的最大数量减去1。因此,例如,语法元素显示图5的粗糙矩阵36。称为unique_cluster_
dependencies_flag的语法元素44在两个选择之间区分:第二相互依赖性语法结构26的一
个实例化提交给并且应用于所有基础层ID,或者为每个基础层ID i,传输一个实例化。在第
一种情况下,标志general_direct_ext_dependency_flag根据每个基础层ID的38共同建立
子矩阵,并且在第二种情况下,标志direct_ext_dependency_flag根据每个基础层ID的38
单独建立子矩阵。unique_cluster_dependencies_flag在两个选择之间切换。因此,在图7
的情况下,如果unique_cluster_dependencies_flag等于0,那么所产生的子矩阵38对应于
相等的参考和被参考集群ID的每个位置放在矩阵36内,其中,1由direct_dependency_flag
表示。可默认使用预定的子矩阵,即,所有参与装置(例如,编码器、网络元件以及多层视频
解码器)已知的子矩阵,填充剩余位置,其中,第一相互依赖性语法结构24表示在不同集群
ID的集群之间的相互依赖性。在unique_cluster_dependencies_flag等于1的情况下,对于
第一相互依赖性语法结构24在相等的被参考和参考集群ID的位置表示1的每个位置,在矩
阵42内的相应位置信令并且定位正好这个集群ID的单独子矩阵。因此,max_layer_id_ext
对应于在每个vps_max_layers_minus1集群内的层数。
dependency_sets_present_flag 46在如上所述使用语法元素general_direct_ext_
dependency_flag的图7的第一选择与不同模式之间切换,根据所述模式,使用称为集群依
赖性组的数量的语法元素,明确信令使用语法元素direct_ext_dependency_flag在数据流
内提交的第二相互依赖性语法结构26的实例化的数量。然后,通过使用语法元素included_
nuh_layer_id 50明确列出每个实例化适用的集群ID,这些实例化与这些实例化适用的集
群ID相关联。通过该措施,不为每个集群ID提交第二相互依赖性语法结构26的实例化34。确
切地说,在cluster_dependency_sets_present_flag等于1的情况下,仅仅提交第二相互依
赖性语法结构26的更少量的实例化,使每个实例化与和该实例化相关联的集群ID相关联。
而且,就相互依赖的几对不同集群而言,默认规则可用于在这种位置填充矩阵42(在集群对
角线之下)。
在图9的实施方式中,为每对(相等的或不相等的)集群ID提交子矩阵38或40,即,第二相互
依赖性语法结构26的实例化34,其中,第一相互依赖性语法结构24表示集群间依赖性。从语
法实例中可推论出,子矩阵40的传输消耗比子矩阵38更多的位direct_ext_dependency_
flag。这分别从条件条款52和条件条款54中可推论。换言之,在传输用于集群内部相互依赖
性调节的第二相互依赖性语法结构26的实例化时,其中,由计数i表示的参考集群ID等于由
j表示的被参考集群ID,仅仅传输direct_ext_dependency_flag,用于参考和被参考层的增
强层ID的组合,其中,被参考层的增强层ID(在此处是l)小于参考层的增强层ID(在此处是
k)。即,在子矩阵38之中,仅仅为在子矩阵38的对角线之下的位置传输direct_ext_
dependency_flag。在其他情况下,即,对于相互依赖的集群对i≠j的第二相互依赖性语法
结构26的实例化,传输整个子矩阵,即,用于子矩阵40的每个位置的标志direct_ext_
dependency_flag。
然后,这些实例化中的每个与矩阵36的网格站点相关联,其中,例如,通过1应用第二相互依
赖性语法结构26的各实例化(在第一语法结构24表示集群依赖性的存在的实例化之中(比
较56))。
令,以便限制传输开销。穿过所述对(j,k)(在图9中的24中见在i和j之上的循环),并且有条
件地根据表示在该对之间存在或不存在相互依赖性的所述第一相互依赖性语法结构,为所
述对(j,k)执行或者抑制读取第二相互依赖性结构(在图9中见“如果direct_dependency_
flag[i,j]”,其中,i、j分别对应于j和k),其中,为对j=k的(j,k)读取的所述第二相互依赖
性结构26的实例化34表示在具有基础层ID j的层之中的哪些层是依赖于在具有基础层ID
j的层之中的其他层的层间预测,并且为一对不同值k
k的层之中的层的层间预测。与图7相似,然而,第二相互依赖性结构26的一个实例化也可能
从多层数据流中读取,第二相互依赖性结构26的所述一个实例化分别对于每个集群值(j,
j)对,共同表示在具有基础层ID j的层之中的哪些层是依赖于在具有基础层ID j的层之中
的其他层的层间预测,与图7中的情况一样(如果unique_cluster_dependencies_flag等于
0),或者共同对于对(j,k)(j不等于k)(其中,第一相互依赖性语法结构24表示在相应对之
间的相互依赖性的存在),表示在具有基础层ID j的层之中的哪些层是依赖于在具有基础
层ID k的层之中的层的层间预测。扩展层ID 22能表示的值的数量表示为M,第二相互依赖
性语法结构可包括用于扩展值为0
有基础层ID i的层之中的哪些层是依赖于在具有基础层ID i的层之中的其他层的层间预
测,以及用于每对扩展值0层ID j的哪个层是依赖于具有扩展值q并且具有基础层ID k的层的层间预测。而且,如在说
明书中的别处所述,m可设置为M,但是也如在本文中所述,可使用实际上使用的扩展基数的
明确信令,以便限制传输开销。进一步,如在图8和图10中所示,可使用索引语法结构50,以
便使第二相互依赖性结构的实例化与基础层ID值的单独对(j,k)相关联。在此处,图10显示
了关联语法结构可包括用于每对(j,k)的标志,并且所述关联语法结构的解析可涉及跳过
值0相互依赖性(独立性)。
别的位流的数据包,用于解码。然而,可替换地,该装置可以是能够基于外部因素(例如,网
络利用率、关于解码器的知识等)丢弃由(扩展的)layerID识别的位流的数据包的网络元
件。
码入多层数据流10,所述多层数据流包括多个数据包12,每个数据包与所述不同层中的一
层相关联,每层由基础层ID 20或基础层ID 20和扩展层ID 22索引,并且在所述多层数据流
内插入表示在所述基础层ID 20能表示的几对不同值之间的相互依赖性的第一相互依赖性
语法结构24以及表示在所述扩展层ID 22能表示的几对不同值之间的相互依赖性的第二相
互依赖性语法结构26,设置所述第一相互依赖性语法结构和第二相互依赖性语法结构,以
便基于所述第一相互依赖性语法结构和第二相互依赖性语法结构,能构造显示在所述不同
层之间的可能层间预测依赖性的层间依赖性描述14。
使用上面通常提出的情况,根据该情况,每个数据包206(比较图2)包括的层识别语法元素
结构208由基础层ID字段108和扩展层ID字段112构成,如在图11中所述。图11示出了用于处
理多层数据流(例如,网络元件218)或多层视频解码器202的装置100,如在图2中所示。装置
100显示为包括接收器102,所述接收器配置为接收由一系列数据包构成的多层视频信号,
每个数据包包括层识别语法元素。
208),该结构包括至少基础层ID字段108并且无条件地或者有条件地取决于高级语法元素
或基础层ID字段108、扩展层ID字段112的值。
包括的层识别扩展器110从多层视频信号中读取最大语法元素,表示多层视频信号的预定
部分113包括的数据包108的扩展层ID字段112的最大假定值。例如,预定部分113可能是编
码的视频序列、块体、图片组等。最大语法元素114可包含在部分113的特殊数据包内,例如,
VPS NAL单元。对于在预定部分113内的每个数据包,扩展器110基于由108并且有条件地112
构成的层ID语法结构,确定相应数据包的层ID。例如,这两个语法元素108和112的两个值的
串联可造成层ID。
数。
字段108的最大假定值,并且组合这两个最大假定值,用于确定最大层数。
个特征,即,并非用于扩展层ID字段112的整个基数,而是仅仅用于在该基数之中的实际上
使用的子部分。此外,可甚至使用最大语法元素114,以便如上所述,获得在数据流104内的
扩展层ID字段112的表示位的数量。例如,“特征”可能是对其他层等的层内预测。
N
确信号作用。例如,假设扩展层ID字段112是N位的字段,那么2扩展层ID 120由扩展层ID字
段112能表示。字段112的长度可通过在图12中使用虚线122表示的某个高级语法元素固定
或者可信令并且设置在数据流内。然而,由于某种原因,并非所有可用扩展层ID字段可用于
兴趣预定部分113内。在图12中,例如,说明了仅仅使用7个能表示的扩展层ID,即,通过阴影
线。
展层ID字段112的能表示值的整个数量,将层特定的信息插入数据流内。因此,如在图12中
的122中所示,例如,解析多层视频信号的装置可解析多层视频信号的某个层表征语法部分
124,解析的次数仅仅等于由语法元素114表示的最大层数,而非扩展层ID字段的实际可用/
能表示值的整个数量。因此,通过数据流消耗的边信息量可保持更低。例如,在图6到图10的
实例中,可行的是,将max_layer_id_ext设置为等于由语法元素114表示的扩展状态的最大
假定数量,而非将该值设置为等于扩展层ID字段112的能表示值的整个数量。因此,“表征语
法部分”124可由先前提出的标志direct_ext_dependency_flag体现。
实际使用的/活动的扩展层ID的数量的粒度/保真度增大。优选地,语法元素114表示扩展层
ID字段112的实际假定值的数量的保真度或粒度足够精细,以便表示实际假定值的精确数
量。可替换地,由语法元素122提供的在1与字段112的可用/能表示值的最大数量的信号作
用的保真度/粒度之间的某个地方的保真度/粒度也可行。换言之,最大语法元素114能表示
2
扩展层ID字段108的最大假定值,以小于(n‑1)为单位,n是扩展层ID字段的位长度,或者可
能甚至是1。
104,每个数据包包括层识别语法元素结构,该结构由基础层ID字段并且可能仅仅有条件地
扩展层ID字段112构成,其中,对于包括在这系列数据包106之中的多个数据包106的多层视
频信号的预定部分113,层识别扩展器110配置为从多层视频信号104中读取最大语法元素
114,最大语法元素114表示在预定部分113包括的数据包106之中的扩展层ID字段112的最
大假定值。对于在预定部分113内的每个数据包106,扩展器110基于层识别语法元素结构,
确定相应数据包106的层ID,例如,通过如上所述,串联字段108和112的基础层ID和扩展层
ID。扩展器110还基于最大假定值,确定在预定部分113内的最大层数,并且通过等于最大层
数的多次反复解析层表征语法部分104,确定最大层数的每层的至少一个特征。在组合图11
和12的实施方式和上面相对于图2到图10概述的实施方式时,“最大层数”能表示每个集群
的最大层数,在这种情况下,例如,“最大层数”的确定直接将最大假定值用作“最大层数”,
并且“至少一个特征”可能是表示在第二相互依赖性语法结构内的层间依赖性的标志的数
量。然而,特定的另一个实例也可能是在单独层ID的相应编码参数组的数据流内的信号作
用。在这种情况下,“最大层数”可确定为等于所使用的或者能表示的基础层ID的数量乘以
最大假定值,即,实际上使用的/假定的扩展层ID的数量。其他实例也可行。在任何情况下,
通过语法元素114传输实际假定值,能够保存有价值的边信息比特率。
成特定数据包的新变量LayerId,以用于其识别。
层,从而与仅仅基础层传统装置保持兼容。在视频或元数据包属于基础层,但是由增强层处
理能力装置处理时,可假设默认值用于layer_id_ext。
如,数学运算可将nuh_layer_id的位用作LayerId变量的MSB,并且将layer_id_ext用作
LSB,反之亦然,例如,如下。
数据量。图14提供在元数据包(例如,HEVC视频参数组扩展语法)中信令的
LengthOfExtension值的示例性语法和语义。
载荷的某个部分内传输额外信息(比较上面的LengthOfExtension)所需要的最低可能的位
的量,以便有效利用传输的数据量。图15提供在元数据包(例如,HEVC视频参数组扩展语法)
中信令的layer_id_ext语法元素值的最大值的示例性语法和语义。
值范围),如在图17中的视频参数组扩展的语法表格示例性提供的,其中,如下示例性提供
变量VpsMaxNumLayers。
layers_minus1)*2 .+1,
layer_id_in_nalu[i]的值推断为等于i。
NumScalabilityTypes‑1(包括0和NumScalabilityTypes‑1)的范围内的i,在不存在时,
dimension_id[i][j]推断为等于((layer_id_in_nalu[i]&((1<
[i]]、以及规定第i层是否是视图可扩展性扩展层的变量ViewScalExtLayerFlag:
数据包包括由基础层ID字段108和扩展层ID字段112构成的层识别语法元素结构,并且对于
包括多个数据包的多层视频信号的预定部分113,将最大语法元素114插入多层视频信号
内,表示多层视频信号的预定部分113包括的数据包的扩展层ID字段112构的最大假定值,
基于最大假定值,确定在多层视频信号的预定部分内的最大层数,并且通过等于最大层数
的次数,反复写入多层视频信号的层表征语法部分124,来信令在多层数据信号104内的最
大层数中的每层的至少一个特征。例如,编码器延迟流104的输出,直到完成部分113的编
码。
性的情况下,实现使用扩展机构有效信令该层ID的可能性,而不危及向后兼容性。后面的必
要性造成以下不对称:对于基础层ID的几乎所有可能值,附加扩展层ID是可行的。这造成以
下不对称:对于基础层ID的几乎所有值,附加扩展层ID是可行的,从而造成基础层ID的这些
几乎所有值的数量乘以扩展层ID能表示层ID值的能表示值的数量。然而,限制的基础层ID
值不包括附加任何扩展层ID的可能性。因此,接受这个不对称,或者在使用扩展机构的情况
下,不使用基础层ID的禁止值。下面陈述的解决方案通过更有效的方式解决了这个问题。
在任何层指示扩展机构上施加相似的限制。
layer_id相关联的集群可以仅仅包括基础层本身。在不同集群内的这种不相等数量的层可
能不可取。
展为不等于0的其他nuh_layer_id值。然后,属于这些限制的nuh_layer_id值的层与未限制
的nuh_layer_id值的层组合,以形成具有相等层数的集群。
值的存在(因此,用于确定多层是否可以属于nuh_layer_id值)并且确定在LayerId推导中
与layer_id_ext_value的额外偏移。
3的示例性情况(LengthOfExtension等于2)。
layer_id_ext的层。否则,如果最低有效位等于1,那么多层属于nuh_layer_id值。对于每
层,明确信令layer_id_ext,并且每层属于由5个最高有效位规定的集群。
法元素的长度。
位nuh_layer_id语法元素的6‑add_layer_id_ext_len)最高有效位用于确定集群。最低有
效位add_layer_id_ext_len规定是否推断layer_id_ext,而且,固定添加到layer_id_ext
值中的偏移。图20A和20B的语法表格用于演示该实施方式:
其中,LengthOfExtension是在位方面的layer_id_ext语法元素的长度。
息量的不同等级的不同层上将视频材料编码入所述多层数据流,该装置进行以下操作,对
于所述多层数据流包括的每个数据包,每个数据包与不同层中的一层相关联,如上所述。
一子字段可由字段308的一个或多个最低有效位构成,而第二子字段308b由字段308的其他
最高有效位构成。如在图20B的实例中所指示的,称为add_layer_id_ext_len 310的更高级
语法元素可限定子字段308a的长度。
准的情况下,装置在步骤318中从数据流中(或者更确切地说,从当前数据包中)读取扩展层
ID字段316,并且在步骤320中使用扩展层ID字段获得扩展值,以便扩展值位于扩展值的域
的第一子集内。在步骤320中的推导可对应于在字段316内的位表示的单纯复制。数据流的
要求可能在于,在扩展层ID字段316内的值不采用某个值,例如,0。为基础层ID字段308子字
段308a不满足下面进一步概述的标准的情况,预留后一个值。
群和扩展值,索引与当前数据包相关联的层(即,包括字段308和316的层)。例如,集群和扩
展值彼此仅仅串联,例如,使用最高有效位的集群值。例如,基于子字段308b的集群值322的
推导还可由子字段308b的位的直接使用构成,作为集群值的二进制表示。
的第一子集不相交的值上设置扩展值,例如,通过将扩展值设置为0,并且通过在集群值的
域上从第二子字段308b的可能值的域中映射,从第二子字段308b中获得集群值。使用相同
的映射,可执行在步骤322和328中的推导。然后,从在步骤326和328中设置和推导的集群和
扩展值中,确定当前数据包的层ID,其中,再次通过相同的方式执行层ID的确定,犹如在步
骤320和322中获得集群和扩展值。
长,所以如果赢得该LSB 308a,并且扩展层ID字段316跨过的扩展值的上述域是{0,1,2,3},
那么可满足预定标准。因此,扩展值的域的第一子集(即,在步骤320中的推导的上域)是{1,
2,3}。具体而言,在图18的实例中,在步骤320中的推导通过应用于扩展层ID字段中的单式
矩阵体现。可替换地,可使用某个其他计算,例如,将第一子字段308a的值加入单式矩阵应
用的结果中。因此,在步骤326中,扩展值设置为与{1,2,3}不相交的值,即,0。在推导322和
328中使用的映射可相同,但是可替换地不同。具体而言,映射是双射的。
层ID字段308)是1的情况下,仅仅存在layer_id_ext字段(即,扩展层ID字段316)。否则,
layer_id_ext字段推断为0。因此,层ID到layer_id_ext和nuh_layer_id的组合的映射完全
对称,并且没有未使用的位表示。通过传输layer_id_ext,layer_id_ext的推断值可用于数
据流中,以便用于传输layer_id_ext的在数据流内跨过的位减少,以便解释layer_id_ext
实际上仅仅采用3个不同值{1,2,3}这一事实。例如,二进制一元码可用于在二进制串上映
射3个元素{1,2,3},例如,然后,所述二进制串编码入数据流,并且使用熵编码/解码,从中
解码。
流,所述多层数据流包括多个数据包,每个数据包与所述不同层中的一层相关联,所述装置
配置为对于多层数据流的每个数据包,从所述多层数据流中读取基础层ID字段,所述基础
层ID字段包括第一子字段和第二子字段;检查基础层ID字段的第一子字段是否满足预定标
准,并且
内,并且通过在集群值的域上从第二子字段的可能值的域中映射,从第二子字段中获得集
群值;并且
集群值的域上从第二子字段的可能值的域中映射,从第二子字段中获得集群值,
“预定标准”可能是“如果一个”,“扩展值的域”可能是(例如){0,1,2,3},“第一子字段”可能
是{1,2,3},“使用扩展层ID字段”可能是应用于扩展层ID字段中的单式矩阵,可替换地:将
第一子字段的值加入单式矩阵应用的结果中,“将扩展值设置为不相交的值”可能是“到0”
的设置;“在集群值的域上从第一子字段的可能值的域中映射”可能对于这两种情况相同,
但是可替换地不同;映射可能是双射的,并且“使用集群和扩展值索引与相应数据包相关联
的层”可涉及使用(例如)用于设置更高有效数位的集群值以及用于设置更低有效数位的扩
展值。
包206,每个数据包与所述不同层中的一层相关联,其中,与相应数据包相关联的层由集群
和扩展值独特地相关联,编码器配置为对于多层数据流的每个数据包206,如果扩展值在扩
展值的域的第一子集内,那么在所述多层数据流内插入基础层ID字段308,所述基础层ID字
段包括第一子字段308a和第二子字段308b,使用集群值设置第二子字段,并且设置第一子
字段,以便满足预定条件;并且在所述多层数据流内插入扩展层ID字段,使用扩展值设置扩
展层ID;并且如果扩展值等于与扩展值的域的第一子集不相交的值,那么抑制将扩展层ID
字段插入并且将基础层ID字段308插入312多层数据流内,基础层ID字段包括第一子字段
308a和第二子字段308b,使用集群值设置第二子字段,并且设置第一子字段,以便不满足预
定条件。即,编码器生成数据流,以便解码器通过上述方式获得正确的层ID,并且为此,使用
逆映射,与相对于解码或接收侧的上述映射相比较。
别分层编码场景的基础层。
置可以是能够基于外部因素(例如,网络利用率、关于解码器的知识等)丢弃由(扩展的)
layerID识别的位流的数据包的网络元件。
多个:进一步视图;深度信息;表面反射率信息;颜色分量信息;空间分辨率细化;以及SNR分
辨率细化。
述的方面也表示相应设备的相应块体或物品或特征的描述。一些或所有方法步骤可由(或
使用)硬件设备执行,例如,微处理器、可编程计算机或电子电路。在一些实施方式中,某一
个或多个最重要的方法步骤可由这种设备执行。
EEPROM或FLASH存储器,电子可读控制信号储存在该数字存储器介质其上,这些信号与可编
程计算机系统配合(或者能够与其配合),以便执行相应方法。因此,数字存储器介质内可能
是计算机可读的。
机器可读载体上。
体、数字存储器介质或记录介质通常是有形和/或非过渡的。
接来传输,例如,通过互联网。
机、移动装置、存储器装置等。例如,该设备或系统可包括文件服务器,用于将计算机程序传
输给接收器。
配合,以便执行在本文中描述的一种方法。通常,这些方法优选地由任何硬件设备执行。
权利要求的范围限制限制,而不由通过在本文中的实施方式的描述和解释提出的具体细节
限制。
(12),每个数据包与所述不同层中的一层相关联,每层由基础层ID(20)、或基础层ID(20)和
扩展层ID(22)索引,所述装置配置为:
表示为由第一相互依赖性语法结构互连几对组中的层之间的相互依赖性。
结构(26),以
间预测,并且为对k
与所述基础层ID能表示的值0
测。
的M值之中的最大假定值的明确信令中获得m。
个:
(12),每个所述数据包与所述不同层中的一层相关联,每层由基础层ID(20)、或基础层ID
(20)和扩展层ID(22)索引,所述方法包括:
表示为由第一相互依赖性语法结构互连几对组中的层之间的相互依赖性。
述不同层中的一层相关联,每层由基础层ID(20)、或基础层ID(20)和扩展层ID(22)索引,所
述编码器配置为:
预测依赖性的层间依赖性描述(14),
表示为由第一相互依赖性语法结构互连几对组中的层之间的相互依赖性。
同层中的一层相关联,每层由基础层ID(20)、或基础层ID(20)和扩展层ID(22)索引,所述方
法包括:
预测依赖性的层间依赖性描述(14),
表示为由第一相互依赖性语法结构互连几对组中的层之间的相互依赖性。
CH,Jan.2013
Contents.2010.S.7‑10.