音频信号编码或解码转让专利

申请号 : CN200910128606.2

文献号 : CN101540171B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : L·F·维勒莫斯P·厄克斯特兰德H·普恩哈根E·G·P·舒贾斯F·M·J·德邦特

申请人 : 皇家飞利浦电子股份有限公司多尔比国际有限公司

摘要 :

本发明提供一种组合参数化立体声和谱带复制增强的音频编码方法,其包括:将时域立体声输入信号转换成子带域;为子带域中的立体声输入信号计算参数化立体声参数,以便获得参数化立体声比特流;创建子带域中的单声道向下混合;估计子带域中的单声道向下混合的谱带复制参数,以便获得谱带复制比特流;将单声道向下混合从子带域转换到时域中;以及对时域单声道向下混合进行核心编码以便获得核心比特流。本发明还提供一种组合参数化立体声和谱带复制增强的音频编码器。此外,本发明还提供一种用于对编码输入信号进行组合参数化立体声和谱带复制增强的音频解码的方法以及一种组合参数化立体声和谱带复制增强的音频解码器。

权利要求 :

1.组合参数化立体声和谱带复制增强的音频编码器,包括:两个64频带分析滤波器组,用于将双声道立体声输入信号转换到子带域;

参数化立体声计算单元,用于为子带域中的双声道立体声输入信号计算参数化立体声参数以获得参数化立体声比特流,以及用于创建子带域中的单声道向下混合;

谱带复制参数估计单元,用于估计子带域中的单声道向下混合的谱带复制参数,以获得谱带复制比特流;

一个32频带合成滤波器组,用于将单声道向下混合从子带域转换到时域;和核心编码器,用于对时域单声道向下混合进行编码,以获得核心比特流。

2.组合参数化立体声和谱带复制增强的音频编码的方法,包括:使用两个64频带分析滤波器组将双声道立体声输入信号转换到子带域;

为子带域中的双声道立体声输入信号计算参数化立体声参数,以获得参数化立体声比特流;

创建子带域中的单声道向下混合;

估计子带域中的单声道向下混合的谱带复制参数,以获得谱带复制比特流;

使用一个32频带合成滤波器组将单声道向下混合从子带域转换到时域;以及对时域单声道向下混合进行核心编码,以获得核心比特流。

3.组合参数化立体声和谱带复制增强的音频解码器,其用于对包括核心编码的音频信号、谱带复制参数和参数化立体声参数的编码输入信号进行解码,该解码器包括:核心解码器,用于对核心编码的音频信号进行核心解码,以获得解码的音频信号;

32频带分析QMF组,用于将解码的音频信号时频转换到子带域;

高频产生器和包络调整器,用于使用子带域中的谱带复制参数来产生全带宽子带域信号;

参数化立体声合成单元,用于使用参数化立体声参数将全带宽于带域信号转换成子带域中的双声道立体声音频信号;以及两个64频带合成QMF组,用于将子带域中的双声道立体声音频信号从子带域转换到时域。

4.用于对编码输入信号进行组合参数化立体声和谱带复制增强音频解码的方法,所述编码输入信号包括核心编码的音频信号、谱带复制参数和参数化立体声参数,该方法包括:对核心编码的音频信号进行核心解码,以获得解码的音频信号;

使用32频带分析QMF组将解码的音频信号时频转换到子带域;

使用子带域中的谱带复制参数来产生全带宽子带域信号;

使用参数化立体声参数将全带宽子带域信号转换成子带域中的双声道立体声音频信号;以及使用两个64频带合成QMF组将子带域中的双声道立体声音频信号从子带域转换到时域。

说明书 :

音频信号编码或解码

[0001] 本发明涉及对音频信号进行编码或者对已编码音频信号进行解码。
[0002] Erik Schuijers、Werner Oomen、Bert den Brinker 和 JeroenBreebaart 的“Advances in Parameric Coding for High-Quality Audio(用于高质量音频的参数化编码的进展)”(Preprint 5852,114th AESConvention,Amsterdam,The Netherlands,22-25March 2003)公开了一种参数化编码方案,该方案使用了用于立体图像的高效参数化表示。两个输入信号被合并成一个单声道音频信号。感觉上相关的空间方位信息(spatial cue)被明确地模拟,如图1所示。该合并的信号使用单声道参数化编码器来编码。声道间强度差(IID)、声道间时间差(ITD)和声道间互相关(ICC)等立体声参数被量化、编码并和经量化及编码的单声道音频信号一起被复用成一个比特流。在解码器侧,该比特流被解复用为一个已编码单声道信号和各立体声参数。该已编码单声道音频信号被解码,从而获得已解码单声道音频信号m’(参见图2)。使用产生感觉去相关的滤波器D、从该单声道时域信号来计算经过去相关的信号。该单声道时域信号m’和经过去相关的信号d被变换到频域。然后在一个参数处理单元中,利用IID、ITD和ICC等参数、通过分别进行缩放、相位修改和混合来处理该频域立体声信号,以便获得已解码立体声对l’和r’。最终得到的频域表示被变换回时域。
[0003] 本发明的一个目的是使用空间参数提供有利的音频编码或解码。为此,本发明提供一种如独立权利要求中所限定的编码方法、音频编码器、用于传送或存储的设备、解码方法、音频解码器、再现设备和计算机程序产品。在从属权利要求中限定各有利实施例。
[0004] 根据本发明的第一个方面,一个音频信号被编码,该音频信号包括第一音频声道和第二音频声道,该编码包括:在一个复数调制滤波器组中对第一音频声道和第二音频声道当中的每一个进行子带滤波,以便为第一音频声道提供第一多个子带信号并为第二音频声道提供第二多个子带信号;对所述子带信号当中的每一个进行向下采样,以便提供第一多个向下采样的子带信号和第二多个向下采样的子带信号;在另一个滤波器组中对至少一个经向下采样的子带信号进行进一步的子带滤波,以便提供多个次子带(sub-subband)信号;从所述次子带信号以及从那些没有被进一步子带滤波的经向下采样的子带信号中导出空间参数;以及导出一个单声道音频信号,该单声道音频信号包含从第一多个经向下采样的子带信号和第二多个经向下采样的子带信号中所导出的导出子带信号。通过在子带中提供进一步的子带滤波,提高了所述子带的频率分辨率。提高频率分辨率的优点在于,可以以高效的实现方式(因为只有很少的几个频带必须被变换)获得更高的音频质量(在人类听觉系统中,单个子带信号的带宽通常比临界频带的带宽高的多)。该参数化空间编码器试图模拟双耳方位信息(cue),所述双耳方位信息在非统一频率尺度上被感知,该非统一频率尺度类似于等效矩形频带(ERB)尺度。该单声道音频信号可以从第一多个经向下采样的子带信号和第二多个经向下采样的子带信号中直接导出。然而,该单声道音频信号有利地从对应于那些被进一步子带滤波的经向下采样的子带的次子带信号中导出,在这种情况下,每个子带的次子带信号被相加以便形成新的子带信号,并且其中该单声道音频信号从这些新的子带信号以及来自没有被进一步滤波的所述第一和第二多个子带的子带中导出。
[0005] 根据本发明的另一个主要方面,提供了对已编码音频信号的音频解码,该已编码音频信号包括一个已编码单声道音频信号和一组空间参数,该音频解码包括:解码该已编码单声道音频声道以便获得多个经向下采样的子带信号;在另一个滤波器组中进一步子带滤波所述多个经向下采样的子带信号当中的至少一个,以便提供多个次子带信号;以及从所述空间参数、次子带信号和那些没有被进一步子带滤波的子带的经向下采样的子带信号中导出两个音频声道。通过在子带中提供进一步的子带滤波,提高了所述子带的频率分辨率,从而可以获得更高质量的音频解码。
[0006] 本发明这些方面的其中一个主要优点在于:参数化空间编解码可以和谱带复制(“SBR”)技术容易地结合。SBR可以从以下文献中获知:Martin Dietz、Lars Liljeryd、Kristofer Kjorling和Oliver Kunz的“Spectral Band Replication,a novel approach thin audio coding(谱带复制:音频编解码领域中的新颖方法)”(Preprint 5553,112 AESConvention,Munich,Germany,10-13May 2002) 以 及 Per Ekstrand 的“Bandwidth extension of audio signals by spectral band replication(通过谱带复制来扩展音频信号的带宽)”(Proc.1st IEEE BeneluxWorkshop on Model based Processing and Coding of Audio(MPCA-2002),pp.53-58,Leuven,Belgium,November 15,2002)。其他参考文献有:
MPEG-4标准ISO/IEC 14496-3:2001/FDAM1,JTC1/SC29/WGll,Coding of Moving Pictures and Audio,BandwidthExtension(其描述利用SBR的音频编解码器)。
[0007] SBR基于这样的概念:音频信号中低频和高频之间通常具有大的相关性。因此,SBR处理包括将频谱的较低部分复制到较高部分,然后使用在比特流中编码的很少信息为频谱的较高部分调整频谱包络。这种经SBR增强的解码器的简化框图如图3所示。该比特流被解复用并被解码成核心数据(例如MPEG-2/4高级音频编码(AAC))和SBR数据。使用该核心数据,该信号在全带宽信号的一半采样频率下被解码。该核心解码器的输出借助于一个32频带复数(伪)正交镜像滤波器(QMF)组而被分析。这32个频带然后被扩展到全带宽,即64个频带,其中通过复制部分较低频带而产生高频(HF)内容。根据SBR数据调整为之产生HF内容的频带的包络。最后,借助于一个64频带复数QMF合成组,重建PCM输出信号。
[0008] 图3所示的SBR解码器是所谓的双速率解码器。这表示核心解码器在一半采样频率下运行,因此只使用了一个32频带分析QMF组。其中核心编码器以全采样频率运行并且分析QMF组包含64个频带的单速率解码器也是可能的。实际上,通过(伪)复数QMF组完成重建。因为复数QMF滤波器组并不是被临界采样的,因此不需要额外的规定来考虑混叠。应注意到,在Ekstrand公开的SBR解码器中,分析QMF组只包含32个频带,而合成QMF组包括64个频带,与整个音频解码器相比,核心解码器运行在一半采样频率下。但是在相应的编码器中,使用一个64频带分析QMF组来覆盖整个频率范围。
[0009] 虽然本发明尤其有利于立体声音频编解码,但是本发明还有利于对具有大于2个音频声道的信号进行编解码。
[0010] 本发明的这些和其他方面将通过以下所述的实施例变得显而易见并且得到阐述。
[0011] 在附图中:
[0012] 图1显示了在参数化立体声(“PS”)编码器中使用的用于立体声参数提取的单元的框图;
[0013] 图2显示了在PS解码器中使用的用于立体声信号重建的单元的框图;
[0014] 图3显示了频带复制(“SBR”)解码器的框图;
[0015] 图4显示了根据本发明一个实施例的、组合的PS及经SBR增强的编码器的框图;
[0016] 图5显示了根据本发明一个实施例的、组合的PS及经SBR增强的解码器的框图;
[0017] 图6显示了一个M频带经向下采样的复数QMF分析(左)和合成组(右);
[0018] 图7显示了原型滤波器的以dB为单位的幅度响应;
[0019] 图8显示了64个未经向下采样的复数已调制分析滤波器中的前4个的以dB为单位的幅度响应;
[0020] 图9显示了具有平凡(trivial)合成的Q频带滤波器组的框图;
[0021] 图10显示了第一个未经向下采样的已调制QMF滤波器和8频带复数已调制滤波器组的以dB为单位的组合幅度响应;
[0022] 图11显示了根据本发明一个实施例的4频带偶数堆叠滤波器组(上)和奇数堆叠滤波器组(下)的固定格式的幅度响应;
[0023] 图12显示了根据本发明一个实施例的基于64频带复数分析QMF的77频带非统一混合分析滤波器组;
[0024] 图13显示了在音频解码器中使用的基于64频带复数分析QMF的71频带非统一混合分析滤波器组;以及
[0025] 图14显示了复数已调制分析滤波器组的高效实现方式的框图。
[0026] 附图仅仅显示了那些对于理解本发明而言是必要的元件。
[0027] 将SBR和PS相结合潜在地产生了非常强大的编解码器。SBR和PS都是在结构非常相似(即某种形式的时频转换、处理以及最后进行频时转换)的解码器中的后处理算法。当将这两种算法相结合时,要求这两个算法能同时在例如DSP应用上运行。因此,有利的是尽可能多的为另一个编解码器重复使用一个编解码器所计算的中间结果。在将PS和SBR相结合的情况下,这导致了为PS处理重复使用复数(伪)QMF子带信号。在一个组合编码器中(参见图4)中,借助于两个64频带分析滤波器组来分析立体声输入信号。使用该复数子带域表示,PS计算单元估计立体声参数并创建一个单声道(子带)向下混合。然后该单声道向下混合被馈送到SBR参数估计单元。最后,该单声道向下混合被一个32频带合成滤波器组转换回时域,以使其能够被核心解码器解码(核心解码器仅仅需要一半带宽)。
[0028] 在图5所示的组合解码器中,不管使用的是双速率还是单速率系统,在包络调整之后的全带宽(64个频带)子带域信号根据所述立体声参数被转换成一个立体声子带域信号组。这两组子带信号最后被所述64频带合成QMF组转换到时域。如果仅仅将PS和SBR相结合,那么QMF滤波器的较低频带的带宽大于高质量立体声表示所需的带宽。因此,为了能够给出立体声图像的高质量表示,根据本发明的有利实施例,将执行对所述较低子带信号的进一步细分。
[0029] 为了更好的理解本发明,首先解释复数QMF子带滤波器的理论。
[0030] QMF子带滤波器
[0031] 以下将描述QMF分析子带滤波器。在给出一个实数值线性相位原型滤波器p(v)的情况下,一个M频带复数已调制分析滤波器组可以由以下分析滤波器定义:
[0032]
[0033] 其中k=0,1,...,M-1。相位参数θ对于接下来的分析并不重要,但是通常的选择是(N+M)/2,其中N是原型滤波器的阶数。在给出一个实数值离散时间信号x(v)的情况下,通过用hk(v)对x(v)进行滤波(卷积)而获得子带信号vk(n),然后使用因子M对其结果进行向下采样(参见图6的左侧)。
[0034] 合成操作包括:首先使用因子M对QMF子带信号进行向上采样,然后使用类型(1)的复数已调制滤波器进行滤波,将结果相加,以及最后获取两倍的实数部分(参见图6的右侧)。然后通过适当设计实数值线性相位原型滤波器p(v)来获得对实数值信号的近乎完美的重建。在64个频带的情况下,在(上述)MPEG-4标准的SBR系统中使用的原型滤波器的幅度响应如图7所示。通过将原型滤波器p(v)的幅度响应偏移 而获得64个复数已调制分析滤波器的幅度响应。这些响应的一部分显示在图8中。应注意到,只有正频率被滤波,除了k=0以及k=M-1之外。因此,在向下采样之前,子带信号是接近解析的,从而有利于对实数值正弦进行容易的振幅和相位修改。相位修改也可以用于第一和最后一个频带,只要驻留在这些频带中的正弦具有大于π/2M或者小于π-π/2M的频率。对于在该区域之外的频率,由于负频率的干扰,相位修改的性能急剧恶化。
[0035] 从上述的QMF分析滤波器开始,在本发明的各实施例中,通过进一步将经过向下采样的子带信号vk(n)滤波成Qk次子带而获得更精细的频率分辨率。以下将导出该进一步子带滤波的特性。
[0036] 在复数QMF子带域中的信号修改
[0037] 以下,让 成为对离散时间信号z(n)的离散时间傅立叶变换。假设上述近乎完美的重建特性以及这样一个设计,其中p(v)的傅立叶变换P(ω)基本上在频率区间[-π/M,π/M]之外消失,这就是上述原型滤波器p(v)的情况,下一步就是考虑一个系统,其中子带信号vk(n)在合成之前被修改。现在,通过使用滤波器Bk(ω)进行滤波来修改每个子带k。使用以下的扩展定义:
*
[0038] Bk(ω)=B-1-k(-ω)for k<0(2)
[0039] 其中*表示复共轭,然后可以示出(忽略总体延迟,假设实数值输入和单速率系统)所得到的系统包括对应于使用以下滤波器进行滤波的滤波器组合成:
[0040]
[0041] 根据有关P(ω)的特性的假设,对于(3)式中所有的k插入Bk(ω)=1导致B(ω)=1,从而对于经偏移的原型滤波器响应得到一个平方和恒等式。通过选择实数值常数Bk(ω)=bk≥0,该系统起到均衡器的作用,其在频率π(k+1/2)/M处内插增益值bk。具有吸引力的特征就是整个系统是时不变的,即不会有混叠,尽管其中使用了向下和向上采样。当然,这只有在与所述原型滤波器假设的偏差量之内才成立。
[0042] 为了导出单声道音频信号,对复数子带信号的附加子滤波不应该仅仅保持这些特性,还应该将这些特性扩展到对已滤波子带信号的操作。保持这些特性的子滤波能够利用对被称为第M频带滤波器的修改来执行,所述滤波器参见P.P.Vaidyanathan的“Multirate systems andfilter banks(多速率系统及滤波器组)”(Prentice Hall SignalProcessing Series,1993,sections 4.6.1-4.6.2)。
[0043] 具有平凡合成的已调制滤波器组
[0044] 离散时间信号v(n)可以被一组具有脉冲响应gq(n),q=0,1,...,Q-1的滤波器分解为Q个不同的信号,如图9所示。令相应的分析输出为yq(n),并考虑该平凡合成操作:
[0045]
[0046] 然后通过选择滤波器来获得完美重建y(n)=v(n),其中使得:
[0047]
[0048] 其中如果n=0则δ(n)=1,如果n≠0则δ(n)=0。对于因果滤波器,式(5)的右侧将必须被δ(n-d)代替,其中d是正延迟,但是为了清楚起见省略了该直接的修改。
[0049] 滤波器gq(n)可以通过下式被选择成对原型滤波器g(n)的复数调制:
[0050]
[0051] 在本发明的该优选实施例中,滤波器被奇数堆叠(因子q+1/2)。该优选实施例的优点将在后面解释。当且仅当满足下式时获得完美重建(5):
[0052] g(Qn)=δ(n)/Q (7)
[0053] 该式的一个变型是实数值余弦调制:
[0054]
[0055] 其中实数值原型滤波器g(m)满足:
[0056] g(2Qn)=δ(n)/Q (9)
[0057] (这在考虑了(6)式中的gq(n)+gQ-1-q(n)时能简单的实现。)
[0058] 对复指数已调制滤波器组进行子滤波
[0059] 从上述的QMF分析滤波器开始,通过使用上面(6)或(8)式的已调制结构当中的一个将每个经向下采样的子带信号vk(n)进一步滤波成Qk个次子带而获得更精细的频率分q k辨率。将所得到的输出信号表示为yk(n),并用gq(n)描述在子带k中采用的滤波器组。如果Qk=1,那么就没有滤波并且 一个典型的应用实例是:M=64,Q0=8,Qk=
4(其中k=1,2),以及Qk=1(其中k>2)。
[0060] 从x(v)到yqk(n)的两个滤波器组的组合效果可以被描述为利用滤波器Fqk(ω)的滤波,其后是利用因子M的向下采样,其中:
[0061]
[0062] 如果原型滤波器响应P(ω)在区间[-π/M,π/M]之外基本上是0的话(SBR分析k滤波器就是这样的情况(参见图7)),那么滤波器Fq(ω)具有单个标称中心频率,该标称中心频率在复数已调制的情况下由下式定义:
[0063]
[0064] 其中s是整数,其被选择成使得 例如,如图10所示,如果k=0并且Q0=8,那么ω0,0,ω0,1,...,ω0,7的值是
[0065]
[0066] 具有非统一频率分辨率的信号修改
[0067] 如上所述的次子带滤波器组的插入不引入进一步的向下采样,这样就保持了如上所示的仅在复数QMF情况下的信号修改的无混叠性能。考虑到下面的通常的组合操作:M子带分析,在子带k中使用Qk个次子带进行进一步的子带滤波,由滤波器Ak,q(ω)对每个次子k带信号yq(n)进行滤波,在每个子带k中通过加法进行合成,以及最后通过M频带合成组进行合成。该系统的总体转移函数由等式(3)给出,其中k≥0,
[0068]
[0069] 从而对于ω>π/(2M)给出:
[0070]k 2
[0071] 这样,次子带(k,q)的吞吐量响应是Gq(Mω)|P(ω-π(k+1/2)/M)|。对于|ω|≤π/(2M),由于等式(2)所以必须多加注意。在该频率范围中,下式成立:2 * 2
[0072] B(ω)=B0(Mω)|P(ω-π/(2M))|+B0(-Mω)|P(ω+π/(2M))| (14)[0073] 并且假设实数次子带原型滤波器系数,则下式成立:
[0074]
[0075] 因此如果如下选择修改滤波器,
[0076]
[0077] 则有B0(-Mω)*=B0(Mω),并且结合式(3)所提及的平方和恒等式导致下式:
[0078]0
[0079] 其中对于|ω|≤π/(2M),其对应于次子带(0,q)的吞吐量响应Gq(Mω)。
[0080] 等式(15)到(17)表明希望区分正频率和负频率。这就是为什么奇数堆叠的(复数)滤波器被用于对QMF次子带信号进行子滤波,而不是使用偶数堆叠的(复数)滤波器(参见图11)。对于偶数堆叠的滤波器,不可能应用驻留在中心滤波器(即中心频率为0的滤波器)中的正弦的相位修改,因为正、负频率不可能被区分。假设原型滤波器具有限制到[-2π/Q,2π/Q]的响应G(ω)频带,其中Q是频带数量,对于偶数堆叠的情况,可近似应用相位修改的下限是2π/Q,而对于奇数堆叠的情况,可近似应用相位修改的下限是π/Q。
[0081] 如导言中所述,对于PS合成,上述重要的特殊情况是均衡化和相位修改。对于均衡化,Ak,q(ω)=ak,q≥0以及条件(16)简化为:
[0082]
[0083] 相位修改情况对应于Ak,q(ω)=exp(iαk,q),在该情况下,如果下式成立就满足条件(16):
[0084]
[0085] 立体声参数估计
[0086] 如上所述,非统一复数滤波器组(即QMF组,接下来是进一步子带滤波)可以用来估计下述立体声参数:声道间强度差(IID),声道间相位差(IPD)和声道间互相关(ICC)。应注意到,在该实际实施例中,IPD被用作ITD的实际等效替代,在Schuijers等的论文中使用的是ITD。在组合的PS编码器中(参见图4)中,前3个复数QMF声道被子滤波,这样获得总共77个复数值信号(参见图12)。
[0087] 从此,根据yqk(n)的索引,77个复数值的时间对准的左、右次子带信号被分别表示k k为lq(n)和rq(n)。
[0088] 为了估计在某一子带样本位置n′处的立体声参数,所述左、右和非归一化跨声道激励被计算如下:
[0089]
[0090]
[0091]
[0092] 对于每个立体声元(stereo bin)b,h(n)是长度为L的子带域窗口,ε是防止被0除的非常小的值(例如ε=1e-10),lqk(n)和rqk(n)是左、右次子带域信号。在20个立体声元的情况下,从kl到kh(包括kh)以及从ql到qh(包括qh)的加法被显示在下表中。应注意到,“负”频率(例如k=0,其中q=4...7)没有包括在(20)的参数估计中。
[0093] 表1:在k和q上的加法的开始和结束索引
[0094]b kl kh ql qh 通带频率区域
0 0 0 0 0 0-π/256
1 0 0 1 1 π/256-2π/256
2 0 0 2 2 2π/256-3π/256
3 0 0 3 3 3π/256-π/64
4 1 1 2 2 π/64-3π/128
5 1 1 3 3 3π/128-2π/64
6 2 2 0 0 2π/64-5π/128
7 2 2 1 1 5π/128-3π/64
8 3 3 0 0 3π/64-4π/64
9 4 4 0 0 4π/64-5π/64
10 5 5 0 0 5π/64-6π/64
11 6 6 0 0 6π/64-7π/64
12 7 7 0 0 7π/64-8π/64
13 8 8 0 0 8π/64-9π/64
14 9 10 0 0 9π/64-11π/64
15 11 13 0 0 11π/64-14π/64
16 14 17 0 0 14π/64-18π/64
17 18 22 0 0 18π/64-23π/64
18 23 34 0 0 23π/64-35π/64
19 35 63 0 0 35π/64-π
[0095] 计算el(b)、er(b)和eR(b)的加法被对准,这样,这些信号在加法中的中点与参数位置一致,因此偏移 从表1中清楚看出,只有具有正中心频率的次子带信号和子带信号被用来估计立体声参数。
[0096] 对于每个立体元b,IID(记为I(b))、IIC(记为C(b))和IPD(记为P(b))被如下计算:
[0097]
[0098]
[0099] P(b)=∠eR(b)
[0100] 在等式P(b)=∠eR(b)中的角度是使用给出在-π和π之间的值的4象限arctangent(反正切)函数来计算的。根据目标比特率和应用,这些参数或者这些参数的一个子集被量化,并被编码到比特流的PS部分中。
[0101] 立体声信号合成
[0102] 为了将解码器中的计算成本(在RAM使用方面)保持得尽可能低,使用了一个类似的分析结构。然而,第一频带仅仅是部分复数的(参见图13)。这是通过将各中间频带对G20(ω)和G50(ω)以及G30(ω)和G40(ω)进行相加而获得的。此外,第二和第三频带是两频带实数值滤波器组,这是通过对G0k(ω)和G3k(ω)的输出进行相加以及对G1k(ω)和G2k(ω)的输出进行相加而获得的(也参见有关已调制滤波器组的章节的讨论)。使用解码器滤波器组结构的这一简化,通过对第一子带滤波器进行细分保持了正、负频率之间的可区分特征。该解码器分析滤波器组被显示在图13中。应注意到,第一QMF已滤波(次)子带信号的索引根据频率被存储。
[0103] 单个帧的立体声(次)子带信号被如下构造:
[0104] lk(n)=Λ11sk(n)+Λ21dk(n) (22)
[0105] rk(n)=Λ12sk(n)+Λ22dk(n)
[0106]
[0107] (23)
[0108]
[0109] 其中sk(n)是单声道(次)子带信号,dk(n)是从单声道(次)子带信号sk(n)导出的用来合成ICC参数的单声道去相关(次)子带信号,k是子带索引,k=0,...,K-1(K是子带的总数,即K=71),QMF子带样本索引是n=0,...,N-1,N是一个帧的子带样本的数量,Λ11,Λ12,Λ21,Λ22是操作矩阵的尺度因子,并且Prt是相位旋转操作矩阵。该操作矩阵被定义为时间和频率的函数,并且可以从操作矢量中直接导出,这在MPEG-4标准ISO/IEC 14496-3:2001/FPDAM2,JTC1/SC29/WG11,Coding ofMoving Pictu res and Audio,Extension 2中被描述。
[0110] 根据图12,sk(n)被定义为图13的结果:
[0111]
[0112]
[0113]
[0114]
[0115]
[0116]
[0117]
[0118]
[0119]
[0120]
[0121] k=10...70
[0122] 立体声参数的合成根据表1的索引进行。
[0123] 表1:参数索引表
[0124]k i(k) 通带频率区域
0 1* -2π/256--π/256
1 0* -π/256-0
2 0 0-π/256
3 1 π/256-2π/256
4 2 2π/256-3π/256
5 3 3π/256-π/64
6 5 3π/128-2π/64
7 4 2π/128-3π/128
8 6 4π/128-5π/128
9 7 5π/128-6π/128
10 8 3π/64-4π/64
11 9 4π/64-5π/64
12 10 5π/64-6π/64
13 11 6π/64-7π/64
14 12 7π/64-8π/64
15 13 8π/64-9π/64
16-17 14 9π/64-11π/64
18-20 15 11π/64-14π/64
21-24 16 14π/64-18π/64
25-29 17 18π/64-23π/64
30-41 18 23π/64-35π/64
42-70 19 35π/64-π
[0125] 该合成等式因此可以变成:
[0126] lk(n)=Λ11(i(k),n)sk(n)+Λ21(i(k),n)dk(n) (25)
[0127] rk(n)=Λ12(i(k),n)sk(n)+Λ22(i(k),n)dk(n)
[0128]
[0129] (26)
[0130]
[0131] 应注意到,在表格中如果遇到了a*,那么在上面等式中Prt的符号就改变。因此这就是等式(19),即对于负频率必须应用反向相位旋转。
[0132] 具有平凡合成的已调制滤波器的高效实现方式
[0133] 在给定具有长度为L的原型滤波器的已调制滤波器组的情况下,一种直接形式的实现方式对于每个输入样本将要求QL操作,但等式(6)中的调制是对于周期Q反周期的(antiperiodic)这一事实可以用来将所述滤波分解成长度为L的多相加窗操作,其后是对于每个输入样本的大小为Q的变换。应当注意,上述多相表示可从以下文献中获知:P.P.Vaidyanathan的“Multirate systems and filter banks多速率系统及滤波器组”(Prentice Hall Signal Processing Series,1993,section4.3)。以下根据本发明的一个优选实施例提供该多相表示的有利应用。
[0134] 所述变换是DFT,之后是相位旋转(twiddle),当Q是2的幂时,其具有Qlog2Q的阶数。因此,在其中L远远大于log2Q的通常情况下能获得大量的节省。在实数已调制的情况下(8),与围绕n=0和n=Q的偶数/奇数对称性相结合的对于2Q的周期的反周期性可以被再次用于多相加窗,并且该变换内核是类型III的DCT。以下将给出该复数调制情况的详细说明。
[0135] 使用FFT核心处理的次子滤波(sub-subfiltering)的有效实现方式可以利用其后跟随着调制的原型滤波器的多相分解来实现。假设原型滤波器g(n)的阶数为N,其中N=mQ,m是正整数。该条件并不是限制性的,因为任意阶数的原型滤波器可以被零填充(zero padded),以便满足该约束条件。被设计用于复数已调制系统(6)的原型滤波器的Z变换如下:
[0136]
[0137] 这可以表示为多相符号:
[0138]
[0139] 其中
[0140]
[0141] 该滤波器组的所有滤波器都是原型滤波器的频率已调制版本。滤波器gq(n)的Z变换如下:
[0142]
[0143] 其中
[0144]
[0145] 从一个滤波器的输出表示为:
[0146]
[0147]
[0148]
[0149] 通过识别最后的合的各分量,可以看出各多相分量处理输入信号的延迟版本,其随后被乘以一个复指数。最后,通过应用逆FFT(不需要缩放因子)来找到所有的输出信号Yq(z),q=1...Q-1。图14显示了分析滤波器组的布局。因为(29)中的多相滤波器是非因果的,因此一个适量的延迟必须被添加到所有的多相分量中。
[0150] 应当注意,上述实施例说明而不是限制本发明,在不背离所附权利要求书的范围的情况下,本领域的技术人员将能够设计许多替换实施例。在权利要求书中,括号里面的任何附图标记并不限制该权利要求。“包括”一词并不排除在权利要求中列出的元件或步骤之外的其它元件或步骤的存在。本发明可以通过包括若干不同元件的硬件和适当编程的计算机来实现。在列举几个装置的设备权利要求中,这些装置当中的几个可以被同一硬件项实现。在彼此不同的从属权利要求中引述某些措施这一事实,并不表示不能使用这些措施的组合来获益。