对压缩的高阶高保真立体声(HOA)表示进行解码的方法和装置以及介质转让专利
申请号 : CN202010011894.X
文献号 : CN111182442B
文献日 : 2021-08-27
发明人 : S·科尔多恩 , A·克鲁格 , O·伍埃博尔特
申请人 : 杜比国际公司
摘要 :
权利要求 :
1.一种对声音或声场的压缩的高阶高保真立体声(HOA)表示进行解码的方法,所述方法包括:
接收包含压缩的HOA表示的位流,包括压缩的基本层位流和压缩的增强层位流;
确定是否存在与压缩的HOA表示有关的多个层;
基于确定存在多个层,对压缩的基本层位流进行解复用以获得第一感知编码的输送信号和第一副信息,并且对压缩的增强层位流进行解复用以获得第二感知编码的输送信号和第二副信息;
对所述第一感知编码的输送信号进行解码以获得第一感知解码的输送信号,并且对所述第二感知编码的输送信号进行解码以获得第二感知解码的输送信号;
基于所述第一副信息将所述第一感知解码的输送信号变换为第一增益校正的信号帧,并且,基于所述第二副信息将所述第二感知解码的输送信号变换为第二增益校正的信号帧;
根据环境分配矢量将所述第一增益校正的信号帧和所述第二增益校正的信号帧重新分布给I个通道以便重构主导声音信号的帧,并且其中,修正的环境HOA分量被获得,其中,所述重新分布进一步包括产生修正的环境HOA分量的系数序列的第一索引集合以及修正的环境HOA分量的系数序列的第二索引集合,其中所述修正的环境HOA分量的系数序列的第一索引集合对应于在第k帧中起作用的HOA分量,所述修正的环境HOA分量的系数序列的第二索引集合对应于在第(k‑1)帧中必须被启用、被禁用以及保持起作用的HOA分量,其中,所述第一索引集合基于OMIN个通道,从所述主导声音信号和所述第二索引集合来合成主导HOA声音分量的HOA表示;
从所述修正的环境HOA分量和所述第一索引集合来合成环境HOA分量;以及从所述主导HOA声音分量和所述环境HOA分量的HOA表示复合得到重构HOA表示,其中,所述第一索引集合为1≤n≤OMIN,并且所述第二索引集合为OMIN+1≤n≤O,其中,O指示通道的总数,并且OMIN指示1和O之间的数。
2.一种对声音或声场的压缩的高阶高保真立体声(HOA)表示进行解码的装置,所述装置包括:
接收器,用于接收包含压缩的HOA表示的位流,包括压缩的基本层位流和压缩的增强层位流;
音频解码器,用于基于确定存在多个层,从所述位流解码压缩的HOA表示,包括:基于确定存在多个层,对压缩的基本层位流进行解复用以获得第一感知编码的输送信号和第一副信息,并且对压缩的增强层位流进行解复用以获得第二感知编码的输送信号和第二副信息;
对所述第一感知编码的输送信号进行解码以获得第一感知解码的输送信号,并且对所述第二感知编码的输送信号进行解码以获得第二感知解码的输送信号;
基于所述第一副信息将所述第一感知解码的输送信号变换为第一增益校正的信号帧,并且,基于所述第二副信息将所述第二感知解码的输送信号变换为第二增益校正的信号帧;
根据环境分配矢量将所述第一增益校正的信号帧和所述第二增益校正的信号帧重新分布给I个通道以便重构主导声音信号的帧,并且其中,修正的环境HOA分量被获得,其中,所述重新分布进一步包括产生修正的环境HOA分量的系数序列的第一索引集合以及修正的环境HOA分量的系数序列的第二索引集合,其中所述修正的环境HOA分量的系数序列的第一索引集合对应于在第k帧中起作用的HOA分量,所述修正的环境HOA分量的系数序列的第二索引集合对应于在第(k‑1)帧中必须被启用、被禁用以及保持起作用的HOA分量,其中,所述第一索引集合基于OMIN个通道,
从所述主导声音信号和所述第二索引集合来合成主导HOA声音分量的HOA表示;
从所述修正的环境HOA分量和所述第一索引集合来合成环境HOA分量;以及从所述主导HOA声音分量和所述环境HOA分量的HOA表示复合得到重构HOA表示,其中,所述第一索引集合为1≤n≤OMIN,并且所述第二索引集合为OMIN+1≤n≤O,其中,O指示通道的总数,并且OMIN指示1和O之间的数。
3.一种包含有指令的非暂时性计算机可读存储介质,所述指令在被处理器执行时实行以下方法,所述方法包括:
接收包含压缩的HOA表示的位流,包括压缩的基本层位流和压缩的增强层位流;
确定是否存在与压缩的HOA表示有关的多个层;
基于确定存在多个层,对压缩的基本层位流进行解复用以获得第一感知编码的输送信号和第一副信息,并且对压缩的增强层位流进行解复用以获得第二感知编码的输送信号和第二副信息;
对所述第一感知编码的输送信号进行解码以获得第一感知解码的输送信号,并且对所述第二感知编码的输送信号进行解码以获得第二感知解码的输送信号;
基于所述第一副信息将所述第一感知解码的输送信号变换为第一增益校正的信号帧,并且,基于所述第二副信息将所述第二感知解码的输送信号变换为第二增益校正的信号帧;
根据环境分配矢量将所述第一增益校正的信号帧和所述第二增益校正的信号帧重新分布给I个通道以便重构主导声音信号的帧,并且其中,修正的环境HOA分量被获得,其中,所述重新分布进一步包括产生修正的环境HOA分量的系数序列的第一索引集合以及修正的环境HOA分量的系数序列的第二索引集合,其中所述修正的环境HOA分量的系数序列的第一索引集合对应于在第k帧中起作用的HOA分量,所述修正的环境HOA分量的系数序列的第二索引集合对应于在第(k‑1)帧中必须被启用、被禁用以及保持起作用的HOA分量,其中,所述第一索引集合基于OMIN个通道,
从所述主导声音信号和所述第二索引集合来合成主导HOA声音分量的HOA表示;
从所述修正的环境HOA分量和所述第一索引集合来合成环境HOA分量;以及从所述主导HOA声音分量和所述环境HOA分量的HOA表示复合得到重构HOA表示,其中,所述第一索引集合为1≤n≤OMIN,并且所述第二索引集合为OMIN+1≤n≤O,其中,O指示通道的总数,并且OMIN指示1和O之间的数。
说明书 :
对压缩的高阶高保真立体声(HOA)表示进行解码的方法和装
置以及介质
信号的装置以及用于解压缩压缩的HOA信号的装置”的发明专利申请的分案申请。
技术领域
背景技术
立于特定扩音器设置的优点。然而,该灵活性是以HOA表示在特定扩音器设置上的回放需要
解码处理为代价的。与所需扩音器的数量通常非常大的WFS方法相比,HOA也可以被渲染到
仅由少量扩音器组成的设置。HOA的进一步的优点是,相同的表示也可以被没有任何修正地
用于对于耳机的双耳渲染。
地,整个HOA声场表示实际上可以被假定为由O个时域函数组成,其中,O表示展开系数的数
量。在下面,这些时域函数将被等同地称为HOA系数序列或HOA 通道。通常,使用球坐标系,
T
在球坐标系中,x轴指向前向的位置,y轴指向左边,z轴指向顶部。空间x=(r,θ,φ)中的位
置用半径r>0(即,到坐标原点的距离)、从极轴z测量的倾角θ∈[0,π]、以及在x‑y平面中从
T
x轴逆时针测量的方位角φ∈[0,2π[表示。此外,(·) 表示转置。
被展开为球谐函数的级数。
决于角波数k。注意到,已经隐含地假定声压在空间上是带限的。因此,级数关于阶次索引n
在上限N处被截断,阶次索引n被称为HOA表示的阶次。如果声场用不同角频率ω的并且从角
度元组(θ,φ)指定的所有可能的方向到达的无限个谐波平面波的叠加来表示,则相应的平
面波复振幅函数C(ω,θ,φ)可以用以下球谐函数展开来表达:
矢量c(t)中。时域函数 在矢量c(t)内的位置索引由n(n+1)+1+m给出。矢量c(t)中的元
2
素的总数由O=(N+1) 给出。函数 的离散时间版本被称为高保真立体声系数序列。基于
帧的HOA表示通过将所有这些序列划分为如下的长度为B、索引为k的帧C(k)而获得:
2
长,具体为O=(N+1) .。例如,典型的使用阶次N=4的HOA表示需要O=25个HOA(展开)系数。
根据这些考虑,给定期望的单通道采样速率fS和每个采样的位数Nb,用于传输 HOA表示的总
位速率由O·fS·Nb确定。因此,每个采样利用Nb=16个位、以fS=48kHz的采样速率传输阶
次N=4的HOA表示导致19.2MBits/s的位速率,该位速率对于许多实际的应用(例如流传输)
是非常高的。因此, HOA表示的压缩是非常希望的。
示分解为方向分量和残差环境分量。
加副信息,该副信息对于从 HOA表示的压缩版本重构HOA表示是必需的。
主导声音分量。作为方向分量,主导声音分量被假定为部分地用方向信号(即,具有对应方
向的单耳信号,这些单耳信号被假定为从该方向传到收听者)、连同用于从方向信号预测原
始HOA表示的各部分的一些预测参数来表示。
表示由I个量化的单耳信号和某些附加的副信息构成,其中,这些I个量化的单耳信号中的
固定数量OMIN个单耳信号表示环境HOA分量CAMB(k‑2).的前OMIN个系数序列的空间变换版本。
其余的I‑OMIN个信号的类型在连续的帧之间可以有所变化,并且可以是方向的、基于矢量
的、空的、或者表示环境HOA 分量CAMB(k‑2)的附加系数序列。
括在方向和矢量估计模块101中执行HOA信号的方向和矢量估计处理,其中,包括关于方向
信号的第一元组集合 和关于基于矢量的信号的第二元组集合 的数据被获
得。第一元组集合中的每个包括方向信号的索引和相应的量化方向,第二元组集合中的每
个包括基于矢量的信号的索引和限定信号的方向分布的矢量。下一个步骤是将HOA系数序
列的每个输入时间帧分解103为多个主导声音信号XPS(k‑1)的帧和环境 HOA分量CAMB(k‑1)
的帧,其中,主导声音信号XPS(k‑1)包括所述方向声音信号和所述基于矢量的声音信号。分
解进一步提供预测参数ζ(k‑1)和目标分配矢量vA,T(k‑1)。预测参数ξ(k‑1)描述如何从主导声
音信号XPS(k‑1)内的方向信号预测HOA信号表示的各部分以便丰富主导声音HOA分量,目标
分配矢量vAT(k‑1)包含关于如何将主导声音信号分配给给定数量I 个通道的信息。根据目标
分配矢量vA,T(k‑1)提供的信息修正104环境 HOA分量CAMB(k‑1),其中,确定环境HOA分量的
哪些系数序列将在给定数量I个通道中传输,这取决于有多少个通道被主导声音信号占据。
修正的环境HOA分量CM,A(k‑2)和时间预测的修正的环境HOA分量CP,MA(k‑1)被获得。此外,最
终的分配矢量vA(k‑2)从目标分配矢量 vA,T(k‑1)中的信息获得。使用最终的分配矢量vA(k‑
2)提供的信息将通过分解获得的主导声音信号XPS(k‑1)以及所确定的修正的环境HOA分量
CM,A(k‑2)和时间预测的修正的环境HOA分量CP,M,A(k‑1)的系数序列分配到给定数量的通道,
其中,输送信号yi(k‑2),i=1,...,I和预测的输送信号 yP,i(k‑2),i=1,...,I被获得。然
后,对输送信号yi(k‑2)和预测的输送信号 yP,i(k‑2)执行增益控制(或规范化),其中,增益
修正的输送信号zi(k‑2)、指数ei(k‑2)和异常标志βi(k‑2)被获得。
包括所述指数ei(k‑2)和异常标志βi(k‑2)、第一元组集合 和第二元组集合
预测参数ζ(k‑1)和最终的分配矢量vA(k‑2),并且编码的副信息 被获得。最后,感知编
码的输送信号 和编码的副信息被复用到位流中。
发明内容
质量基本层(BL)和高质量增强层(EL)。基本层被假设为提供HOA表示的低质量压缩版本,该
版本可以被独立于增强层进行解码。这样的BL对传输误差通常应是高度鲁棒的,并且应被
以低数据速率传输以便即使在不良传输状况下也保证解压缩的HOA表示的某个最低质量。
EL包含改进解压缩的HOA表示的质量的附加信息。
缩方法以便能够对根据本发明压缩的至少包括低质量基本层的压缩表示进行解码的解决
方案。
层。选择前OMIN个通道形成基本层的优点是它们的时不变类型。然而,照惯例,各个信号缺少
声音场景必需的任何主导声音分量。这从环境HOA分量CAMB(k‑1)的常规计算也是清楚的,环
境HOA分量CAMB(k‑1)的常规计算是通过根据下式从原始HOA表示C(k‑1)减去主导声音HOA表
示CPS(k‑1)来进行的:
发明的空间HOA编码器中的 HOA分解处理输出的环境HOA分量CAMB(k‑1)被其修正版本取代。
修正的环境HOA分量将原始HOA分量的系数序列包括在被假设总是以空间变换形式传输的
前OMIN个系数序列中。HOA分解处理的这个改进可以被看作使HOA压缩在分层模式(例如双层
模式)下工作的初始操作。该模式提供例如两个位流、或者可以被划分为基本层和增强层的
单个位流。使用或者不使用该模式是由总位流的访问单元中的模式指示位(例如,单个位)
来信号告知的。
2),i=1,...,OMIN构成。其余的感知编码的信号 i=OMIN+1,...,O和编码的其余的
副信息被包括到增强层位流中。在一个实施例中,代替前述总位流 基本层位流
和增强层位流 然后被联合传输。
表示的装置在权利要求10中公开。
信号表示的装置在权利要求18中公开。
附图说明
具体实施方式
有对应方向的单耳信号,这些单耳信号被假定为从该方向传到收听者)、连同用于从方向信
号预测原始HOA表示的各部分的一些预测参数来表示。另外,主导声音分量被假设为用所谓
的基于矢量的信号来表示,基于矢量的信号意指具有对应矢量的单耳信号,该矢量限定了
基于矢量的信号的方向分布。[4]中提议的HOA压缩器的总体架构在图1中示出。它可以被再
分为图1a中描绘的空间HOA编码部分与图1b中描绘的感知和源编码部分。空间HOA编码器提
供第一压缩HOA表示,该第一压缩HOA 表示由I个信号连同描述如何创建其HOA表示的副信
息构成。在感知和副信息源编码器中,对所提及的I个信号进行感知编码,并且对副信息进
行源编码,之后对该两个编码的表示进行复用。
第二元素表示相应的量化方向的元组构成。元组集合 由其第一元素指示基于矢量
的信号的索引、其第二元素表示限定信号的方向分布的矢量(即,基于矢量的信号的HOA 表
示如何被计算)的元组构成。
CAMB(k‑1)。注意到分别有一个帧的延迟,该延迟是由于为了避免成块效应的重叠相加处理
而导致的。此外,HOA分解被假定输出一些预测参数ζ(k‑1),这些预测参数描述如何从方向
信号预测原始HOA表示的各部分以便丰富主导声音HOA分量。另外,目标分配矢量vA,T(k‑1)
被提供,该目标分配矢量vA,T(k‑1)包含关于在HOA分解处理模块中确定的主导声音信号对
于I个可用通道的分配的信息。受到影响的通道可以被假定被占据,这意味着它们不可用于
在相应时间帧中输送环境HOA分量的任何系数序列。
输,这尤其取决于关于哪些通道是可用的、但尚未被主导声音信号占据的信息(该信息包含
在目标分配矢量vA,T(k‑1)中)。另外,如果被选系数序列的索引在连续的帧之间变化,则系
数序列的淡入或淡出被执行。
并且被传输,其中,OMIN=(NMIN+1) ,NMIN≤N通常是比原始HOA表示的阶次小的阶次。为了使
这些HOA系数序列去相关,提出了将它们变换为从一些预定义方向ΩMIN,d,d=1,...,OMIN传
来的方向信号(即,一般平面波函数)。连同修正的环境HOA分量CMA(k‑1)一起,时间预测的修
正的环境HOA分量CPM,A(k‑1)被计算以供以后用在增益控制处理模块中以便允许有合理的
前瞻。
标分配矢量vA,T(k‑1)中所包含的信息。
所包含的和CP,AMB(k‑1)中所包含的适当信号也被分配给I个可用通道,得到预测信号yP,i(k‑
2),i=1,...,I。信号yi(k‑2), i=1,...,I中的每个最后均被增益控制进行处理,其中,信
号增益被平滑地修正以实现适合于感知编码器的值范围。预测信号帧yP,i(k‑2), i=
1,...,I允许有一种前瞻以便避免连续的块之间的严重的增益变化。增益修正被假定在空
间解码器中通过增益控制副信息被恢复,增益控制副信息由指数ei(k‑2)和异常标志βi(k‑
2),i=1,...,I构成。
描绘的感知和源解码部分与图2b)中描绘的空间HOA解码部分。
和副信息的解码。然后,空间HOA解码器从所述I个信号和副信息创建重构的HOA表示。
增益控制处理提供增益校正的信号帧
在上文被定义(针对空间HOA编码),分配矢量vAMB,ASSIGN(k)由I个分量构成,这些
分量对于每个传输通道指示它是否包含环境HOA分量的系数序列以及它包含环境HOA分量
的哪个系数序列。在通道再分配中,增益校正的信号帧 被重新分布以重构所有的主导
声音信号(即,所有的方向信号和基于矢量的信号) 的帧 以及环境HOA分量的中间表
示的帧CI,AMB(k)。另外,环境HOA 分量的在第k帧中起作用的系数序列的索引集合
以及环境 HOA分量的在第(k‑1)帧中必须被启用、被禁用以及保持起作用的系数
索引集合 和 被提供。
导声音分量 的HOA表示。
有一帧的延迟,该延迟是由于与主导声音HOA分量的同步而引入的。最后,在HOA复合中,环
境HOA 分量帧 和主导声音HOA分量的帧 被叠加以提供解码的HOA帧
耳信号表示环境HOA分量 CAMB(k‑2)的前OMIN个系数序列的空间变换版本。其余的I‑OMIN个信
号的类型可在连续的帧之间变化,是方向的、基于矢量的、空的、或者表示环境HOA分量CAMB
(k‑2)的附加系数序列。照其原样来看,压缩的HOA 表示意在于是整体式的。具体地说,一个
问题是如何将所描述的表示划分为低质量基本层和增强层。
低质量基本层的良好选择的是它们的时不变类型。然而,相应的信号缺少声音场景必需的
任何主导声音分量。这从环境HOA分量CAMB(k‑1)的常规计算也可以看出,环境 HOA分量CAMB
(k‑1)的常规计算是通过根据下式从原始HOA表示C(k‑1) 减去主导声音HOA表示CPS(k‑1)来
进行的:
器(参见图1a)中的HOA 分解处理输出的环境HOA分量CAMB(k‑1)被修正版本取代:
的位流。使用或者不使用该模式是由总位流的访问单元中的单个位以信号告知的。
成。其余的感知编码的信号 i=OMIN+1,...,O和编码的其余的副信息被包括到增强
层位流中。代替前述总位流 基本层位流 和增强层位流 然后
被联合传输。
随后的感知编码的空间HOA编码和感知编码部分(该部分在图3中示出)以及用于源编码的
源编码器部分(该部分在图4中示出)。空间HOA编码和感知编码部分包括方向和矢量估计模
块301、HOA分解模块303、环境分量修正模块304、通道分配模块305以及多个增益控制模块
306。
据被获得,第一元组集合 中的每个包括方向信号的索引和相应的量化方向,第二元
组集合 中的每个包括基于矢量的信号的索引和限定信号的方向分布的矢量。
声音信号和所述基于矢量的声音信号,并且其中,环境HOA分量 包括表示输入
HOA表示和主导声音信号的HOA表示之间的残差的HOA系数序列,并且其中,分解进一步提供
预测参数ξ(k‑1)和目标分配矢量vA,T(k‑1)。预测参数ζ(k‑1)描述如何从主导声音信号XPS
(k‑1)内的方向信号预测HOA信号表示的各部分以便丰富主导声音HOA分量,目标分配矢量
vA,T(k‑1)包含关于如何将主导声音信号分配给给定数量I个通道的信息。
传输,这取决于有多少个通道被主导声音信号占据,并且其中,修正的环境HOA分量CMA(k‑2)
和时间预测的修正的环境HOA分量CP,MA(k‑1)被获得,并且其中,最终的分配矢量vA(k‑2)从
目标分配矢量vA,T(k‑1)中的信息获得。
HOA分量CP,M,A(k‑1)的系数序列分配给给定数量I个通道,其中,输送信号yi(k‑2),i=
1,...,I和预测的输送信号yP,i(k‑2),i=1,...,I被获得。
被获得。
息源编码器320和增强层副信息编码器330)的副信息源编码器模块、以及两个复用器340、
350 (即,基本层位流复用器340和增强层位流复用器350)。副信息源编码器可以在单个副
信息源编码器模块中。
1)和所述最终的分配矢量vA(k‑2),其中,编码的副信息 被获得。
HOA表示cn(k‑1)的在OMIN个最低位置(具有最低索引的那些位置)的第一HOA系数序列、以及
在其余的较高位置上的第二HOA系数序列cAMB,n(k‑1)。如下面关于式(4)‑(6)说明的,第二
HOA系数序列是输入HOA表示和主导声音信号的HOA表示之间的残差的HOA表示的一部分。此
外,前OMIN个指数ei(k‑2),i=1,...,OMIN和异常标志βi(k‑2),i=1,...,OMIN在基本层副信息
源编码器320中被编码,其中,编码的基本层副信息 被获得,并且其中,OMIN=
2 2
(NMIN+1) , O=(N+1) ,NMIN≤N并且OMIN≤I,NMIN是预定义整数值。前OMIN个感知编码的输送信
号 i=1,...,OMIN和编码的基本层副信息 在基本层位流复用器340(其
是所述复用器之一)中被复用,其中,基本层位流 被获得。基本层副信息源编
码器320是副信息源编码器之一,或者它在副信息源编码器模块内。其余的I‑OMIN个指数 ei
(k‑2),i=OMIN+1,...,I和异常标志βi(k‑2),i=OMIN+1,...,I、所述第一元组集合
和第二元组集合 所述预测参数ζ(k‑1)以及所述最终的分配矢量vA
(k‑2)在增强层副信息编码器330中被编码,其中,编码的增强层副信息 被获得。
增强层副信息源编码器330是副信息源编码器之一,或者在副信息源编码器模块内。
层位流 被获得。此外,模式指示LMFE被添加在复用器或指示插入模块中。模式指
示LMFE以信号告知分层模式的使用,分层模式用于压缩的信号的正确的解压缩。
仅包括表示输入HOA 表示和主导声音信号的HOA表示之间的残差的HOA系数序
列(即,不包括输入HOA表示的系数序列)。
息的编码表示和感知编码的信号被解码以一方面提供指数ei(k)和异常标志、另一方面提
供感知解码的信号。类似地,增强层位流被解复用并且被解码以提供感知解码的信号和其
余的副信息(参见图5)。就该分层模式而言,空间HOA 解码部分也必须被修正以考虑空间
HOA编码中的环境HOA分量CAMB (k‑1)的修正。修正在HOA复合中实现。
时,感知编码的信号 i=OMIN+1,...,O是不可用的。解决这种情况的可能的方式是
将信号 i=OMIN+1,...,O设置为零,这自动地使重构的主导声音分量CPS(k‑1)为零。
中间表示的帧CL,AMB(k)。注意到,环境HOA分量的在第k帧中起作用的系数序列的索引集合
仅包含索引1,2,...,OMIN。在环境合成中,前OMIN个系数序列的空间变换被恢复以
提供环境HOA分量帧CAMB(k‑1)。最后,根据式(6)计算重构的HOA 表示。
分层模式指示LMFD的模式检测器,分层模式指示LMFD指示压缩的HOA信号包括压缩的基本层
位流 和压缩的增强层位流。
解码器540和增强层感知解码器550、基本层副信息源解码器530和增强层副信息源解码器
560。
520适于对压缩的增强层位流 进行解复用,其中,第二感知编码的输送信号 i
=OMIN+1,...,I和第二编码的副信息 被获得。
感知解码器540中,基本层的所述第一感知编码的输送信号 i=1,...,OMIN被解码,并
且第一感知解码的输送信号 i=1,...,OMIN被获得。在增强层感知解码器550中,增强
层的所述第二感知编码的输送信号 i=OMIN+1,...,I被解码,并且第二感知解码的输
送信号 i=OMIN+1,...,I被获得。
进一步的数据被获得。进一步的数据包括关于方向信号的第一元组集合 和关于
基于矢量的信号的第二元组集合 第一元组集合 的每个元组包括方
向信号的索引和相应的量化方向,第二元组集合 的每个元组包括基于矢量的信
号的索引和限定基于矢量的信号的方向分布的矢量。此外,预测参数ξ(k+1)和环境分配矢
量vAMB,ASSIGN(k)被获得,其中,环境分配矢量vAMB,ASSIGN(k)包括对于每个传输通道指示它是否
包含环境 HOA分量的系数序列以及它包含环境HOA分量的哪个系数序列的分量。
模块606、环境合成模块 607、HOA复合模块608。
1,...,OMIN被变换为第一增益校正的信号帧 i=1,...,OMIN,并且其中,第二感知解码
的输送信号 i=OMIN+1,...,I根据第二指数ei(k),i=OMIN+1,...,I和第二异常标志βi
(k),i=OMIN+1,...,I被变换为第二增益校正的信号帧 i=OMIN+1,...,I。
基于矢量的信号,并且其中,修正的环境HOA分量 被获得,并且其中,分配是根据所
述环境分配矢量vAMB,ASSIGN(k)以及所述第一和第二元组集合 进行
的。
用、被禁用以及保持起作用的系数序列的第二索引集合
参数ζ(k+1)以及第二索引集合 被使用。
被使用,第一索引集合是环境 HOA分量的在第k帧中起作用的系数序列的索
引。
列、以及在其余的较高位置包括作为残差的HOA表示的一部分的系数序列。该残差是解压缩
的HOA信号 和主导HOA声音分量 的HOA表示之间的残差。
的HOA表示之间的残差。
系数相加,并且其中,解压缩的HOA信号 被获得,并且其中,
缩的HOA信号 的最低的OMIN个系数通道是从环境HOA分量 复制的。另
一方面,如果分层模式指示LMFD指示单层模式,则解压缩的HOA信号 的所有的系数
通道通过主导HOA声音分量 和环境HOA分量 的相加获得。
感知编码和源编码。
数据被获得,第一元组集合 中的每个包括方向信号的索引和相应的量化方向,第二
元组集合中 的每个包括基于矢量的信号的索引和限定信号的方向分布的矢量;
向声音信号和所述基于矢量的声音信号,并且其中,环境HOA分量 包括表示输入
HOA表示和主导声音信号的HOA表示之间的残差的HOA系数序列,并且其中,分解702进一步
提供预测参数ξ(k‑1)和目标分配矢量vA,T(k‑1),预测参数ξ(k‑1)描述了如何从主导声音信
号XPS(k‑1)内的方向信号预测HOA信号表示的各部分以便丰富主导声音HOA分量,目标分配
矢量vA,T(k‑1)包含关于如何将主导声音信号分配给给定数量I个通道的信息;
道中传输,这取决于有多少个通道被主导声音信号占据,并且其中,修正的环境HOA分量CM,A
(k‑2)和时间预测的修正的环境HOA分量CP,M,A(k‑1)被获得,并且其中,最终的分配矢量vA
(k‑2)从目标分配矢量vA,T(k‑1)中的信息获得;
量CP,M,A(k‑1)的确定的系数序列分配给804给定数量I个通道,其中,输送信号yi(k‑2),i=
1,...,I和预测的输送信号yP,i(k‑2),i=1,...,I被获得;
获得。
述预测参数ζ(k‑1)和所述最终的分配矢量vA(k‑2),其中,编码的副信息 被获得;以
及
置的第二HOA系数序列 cAMB,n(k‑1)。第二系数序列是输入HOA表示和主导声音信号的HOA表
示之间的残差的HOA表示的一部分。
2 2
OMIN=(NMIN+1) ,O=(N+1) ,NMIN≤N并且OMIN≤I,NMIN是预定义整数值。
得。
所述最终的分配矢量vA(k‑2)(在图中也被示为vAMB,ASSIGN(k))在增强层副信息编码器330中
被编码,其中,编码的增强层副信息 被获得。
得。
知解码和源解码以及随后的空间HOA解码,并且所述方法包括检测901分层模式指示LMFD的
步骤,分层模式指示LMFD指示压缩的高阶高保真立体声(HOA) 信号包括压缩的基本层位流
和压缩的增强层位流
输送信号 i=1,...,OMIN被解码,并且第一感知解码的输送信号 i=1,...,OMIN被
获得,并且其中,在增强层感知解码器550中,增强层的所述第二感知编码的输送信号
i=OMIN+1,...,I被解码,并且第二感知解码的输送信号 i=OMIN+1,...,I被获
得;
进一步的数据被获得,进一步的数据包括关于方向信号的第一元组集合 和关于
基于矢量的信号的第二元组集合 第一元组集合 的每个元组包括方
向信号的索引和相应的量化方向,第二元组集合 的每个元组包括基于矢量的信
号的索引和限定基于矢量的信号的方向分布的矢量,并且进一步其中,预测参数ζ(k+1)和
环境分配矢量vAMB,ASSIGN(k)被获得。环境分配矢量vAMB,ASSIGN(k)包括对于每个传输通道指示
它是否包含环境 HOA分量的系数序列以及它包含环境HOA分量的哪个系数序列的分量。
一增益校正的信号帧 i=1,...,OMIN,并且其中,所述第二感知解码的输送信号 i
=OMIN+1,...,I根据所述第二指数 ei(k),i=OMIN+1,...,I和所述第二异常标志βi(k),i=
OMIN+1,...,I被变换为第二增益校正的信号帧 i=OMIN+1,...,I;
基于矢量的信号,并且其中,修正的环境HOA分量 被获得,并且其中,分配是根据所
述环境分配矢量vAMB,ASSIGN(k)以及所述第一和第二元组集合 进行
的;
以及保持起作用的系数序列的第二索引集合
参数ξ(k+1)以及第二索引集合 被使用;
被使用,第一索引集合是环境 HOA分量的在第k帧中起作用的系数序列的索
引,其中,环境HOA 分量具有至少两种不同配置之一,这取决于分层模式指示LMFD;以及
相加,并且其中,解压缩的HOA信号 被获得,并且其中,以下条件适用:
缩的HOA信号 的最低的 OMIN个系数通道是从环境HOA分量 复制的。否
则,如果分层模式指示LMFD指示单层模式,则解压缩的HOA信号 的所有的系数通道
通过主导HOA声音分量 和环境HOA分量 的相加获得。
下的系数序列,该系数序列是主导HOA声音分量 的HOA表示和解压缩的HOA信号
之间的残差的HOA表示的一部分。
层位流 所述压缩的增强层位流 以及所述分层模式指示LMFD被获得。
将第一和第二增益校正的信号帧 i=1,...,I重新分布911给I个通道是非常简单的,
因为主导声音信号 的帧是空的。修正的环境HOA分量的在第(k‑1)帧中必须被启用、
被禁用以及保持起作用的系数序列的第二索引集合 被设置
为零。在主导声音合成模块606中从主导声音信号 合成912主导HOA声音分量
的HOA表示因此可以被跳过,并且在环境合成模块607中从修正的环境HOA分量
合成913环境HOA分量 对应于常规的HOA合成。
是原始HOA表示和方向HOA表示之间的差值)的空间变换的前OMIN个系数序列、而不是原始
HOA分量C的空间变换的系数序列进行感知编码的主要优点是,在前一种情况下,将被感知
编码的所有信号之间的互相关性降低。信号zi, i=1,...,I之间的任何互相关性可以引起
空间解码处理期间感知编码噪声的建设性叠加,同时无噪声的HOA系数序列在叠加时被取
消。这种现象被称为感知噪声揭露。
修正的系数序列包括方向HOA分量的信号(参见式3)。相反,对于原始的非分层模式来说情
况并非如此。因此可以推断由分层模式引入的传输鲁棒性可能是以压缩质量为代价的。然
而,压缩质量的降低与传输鲁棒性的提高相比低。以上已经表明,提出的分层模式至少在上
述情况下是有利的。
述的装置和方法中、在所公开的设备的形式和细节上以及在它们的操作中做出各种省略、
替换和改变。明确的意图是,以基本上相同的方式执行基本上相同的功能以实现相同结果
的那些元件的所有组合都在本发明的范围内。从所描述的一个实施例对于另一个描述的实
施例的元件的替换也被充分预期和设想。
现。连接可以在适用的情况下可以实现为无线连接或有线(不一定是直接的或专用的)连
接。