预测残差信号的量化编码方法及装置转让专利

申请号 : CN201010175717.1

文献号 : CN102243876B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郎玥吴文海苗磊

申请人 : 华为技术有限公司

摘要 :

本发明公开了一种预测残差信号的量化编码方法及装置,其中的方法包括以下步骤:根据左右声道信号获取两路信号,并分别将两路信号变换到频域,采用频域的两路信号进行预测残差编码,得到预测残差信号;根据所述两路信号计算频域内的左右声道信号的特征参数;将所述特征参数与设定的阈值比较,根据比较结果选择不同的量化算法对预测残差信号进行量化编码。本发明实施例使得重建的立体声信号可以在声场的稳定性和增强的频谱范围之间做出比较好的折中,而获得较好的立体声重建质量。

权利要求 :

1.一种预测残差信号的量化编码方法,其特征在于,包括:根据左右声道信号获取两路信号,并分别将两路信号变换到频域,计算频域内的左右声道信号的特征参数,并由第一路信号预测第二路信号,比较第二路信号和预测得到的第二路信号,得到预测残差信号;

将所述特征参数与设定的阈值比较,根据比较结果选择不同的量化编码方式对所述预测残差信号进行量化编码。

2.根据权利要求1所述方法,其特征在于,所述左右声道信号的特征参数包括左右声道信号的声道电平差。

3.根据权利要求2所述方法,其特征在于,所述根据比较结果选择不同的量化算法对预测残差信号进行量化编码包括:当左右声道信号的声道电平差的绝对值大于或等于所述设定的阈值时,采用高速率或高精度量化算法对所述预测残差信号进行量化编码,当左右声道信号的声道电平差的绝对值小于所述设定的阈值时,采用低速率或低精度量化算法对所述预测残差信号进行量化编码。

4.根据权利要求2所述方法,其特征在于,所述左右声道信号的声道电平差如下获得:采用所述两路信号的频谱系数,计算左声道信号能量以及右声道信号能量;

根据所述左声道信号能量和右声道信号能量获得所述左右声道信号的声道电平差。

5.根据权利要求1所述方法,其特征在于,所述左右声道信号的特征参数包括左右声道信号的相关值。

6.根据权利要求5所述方法,其特征在于,所述根据比较结果选择不同的量化算法对预测残差信号进行量化编码包括:当左右声道信号的相关值的绝对值小于或等于阈值时,采用高速率或高精度量化算法对所述预测残差信号进行量化编码,当左右声道信号的相关值的绝对值大于阈值时,采用低速率或低精度量化算法对所述预测残差信号进行量化编码。

7.根据权利要求5所述方法,其特征在于,所述左右声道信号的相关值如下获得:采用所述两路信号的频谱系数,计算左声道信号与右声道信号的相关值。

8.根据权利要求1至7任一项所述方法,其特征在于,所述两路信号中的第一路信号为左右声道下混生成的单声道信号,第二路信号为边带信号、左声道信号或者右声道信号。

9.根据权利要求8所述方法,其特征在于,所述由第一路信号预测第二路信号,得到预测残差信号包括:由单声道信号预测边带信号、左声道信号或者右声道信号,得到预测信号;

由边带信号、左声道信号或者右声道信号与预测信号之间的差得到预测残差信号。

10.一种预测残差信号的量化编码装置,其特征在于,包括:信号获取单元,用于根据左右声道信号获取两路信号;

频域变换单元,用于分别将两路信号变换到频域;

预测残差信号获取单元,用于利用第一路信号预测第二路信号,比较第二路信号和预测得到的第二路信号,得到预测残差信号;

特征参数计算单元,用于计算频域内的左右声道信号的特征参数;

判决单元,用于将所述特征参数与设定的阈值进行比较;

量化编码执行单元,根据所述判决单元的比较结果,采取不同的量化算法对预测残差信号进行量化编码。

11.根据权利要求10所述装置,其特征在于,所述特征参数计算单元计算的左右声道信号的特征参数是指左右声道信号的声道电平差或者是左右声道信号的相关值。

12.根据权利要求10所述装置,其特征在于,

所述量化编码执行单元,

当左右声道信号的声道电平差的绝对值大于等于阈值或者左右声道信号的相关值的绝对值小于等于阈值时,采用高速率或高精度量化算法对所述预测残差信号进行量化编码,当左右声道信号的声道电平差的绝对值小于阈值或者左右声道信号的相关值的绝对值大于阈值时,采用低速率或低精度量化算法对所述预测残差信号进行量化编码。

13.根据权利要求10、11或12所述装置,其特征在于,所述信号获取单元获取的两路信号中的第一路信号为单声道信号,第二路信号为边带信号、左声道信号或者右声道信号。

说明书 :

预测残差信号的量化编码方法及装置

技术领域

[0001] 本发明涉及信号处理技术领域,尤其涉及一种预测残差信号的量化编码方法及装置。

背景技术

[0002] 在各种采用声道间预测算法的立体声编码器中,为了增强立体声的声场效果,常常需要对预测残差信号进行量化编码处理,其中,为了实现立体声编码器的可扩展性,预测残差信号一般会在增强层中进行量化编码。
[0003] 参见图1,为现有技术预测残差信号的量化编码示意图。其中,L表示左声道信号,R表示右声道信号,首先,通过对左右声道信号下混处理得到单声道信号(mono)M和边带信号S,具体地,M=(L+R)/2,S=(L-R)/2;通过单声道信号M对边带信号S进行预测得到预测信号F,边带信号S与预测信号F之间的差为残差信号R;最后,对残差信号R进行编码传输。
[0004] 本发明人在研究过程中发现,预测残差信号对量化的精度要求较高,尤其在低频部分,如果比特数不足,对残差信号的量化失真会使得重建的立体声声场不稳定。所以目前的立体声编码器中对预测残差信号进行量化编码时,一般需要较多的比特数,或者仅对预测残差信号的高频部分进行量化编码。这种做法在某种程度上限制了基于预测的立体声编码器通过量化残差信号来提升重建质量的能力。

发明内容

[0005] 本发明提供一种预测残差信号的量化编码方法及装置,以得到较好的立体声重建质量。
[0006] 为此,本发明实施例采用如下技术方案:
[0007] 一种预测残差信号的量化编码方法,包括:根据左右声道信号获取两路信号,并分别将两路信号变换到频域,计算频域内的左右声道信号的特征参数,并由第一路信号预测第二路信号,比较第二路信号和预测得到的第二路信号,得到预测残差信号;将所述特征参数与设定的阈值比较,根据比较结果选择不同的量化算法对预测残差信号进行量化编码。
[0008] 一种预测残差信号的量化编码装置,包括:信号获取单元,用于根据左右声道信号获取两路信号;频域变换单元,用于分别将两路信号变换到频域;预测残差信号获取单元,用于利用第一路信号预测第二路信号,比较第二路信号和预测得到的第二路信号,得到预测残差信号;特征参数计算单元,用于计算频域内的左右声道信号的特征参数;判决单元,用于将所述特征参数与设定的阈值进行比较;量化编码执行单元,根据所述判决单元的比较结果,采取不同的量化算法对预测残差信号进行量化编码。
[0009] 可见,本发明实施例依据左右声道信号的特征参数,判断立体声信号的特性,动态的选取量化算法对预测残差信号进行量化编码,由此,使得重建的立体声信号可以在声场的稳定性和增强的频谱范围之间做出比较好的折中,而获得较好的立体声重建质量。

附图说明

[0010] 图1为现有技术预测残差信号量化编码示意图;
[0011] 图2为本发明实施例预测残差信号的量化编码方法流程图;
[0012] 图3为本发明实施例预测残差信号的量化编码示意图;
[0013] 图4为本发明实施例预测残差信号的量化编码实例1示意图;
[0014] 图5为本发明实施例预测残差信号的量化编码实例2示意图;
[0015] 图6为本发明实施例预测残差信号的量化编码实例3示意图;
[0016] 图7为本发明实施例预测残差信号的量化编码实例4示意图;
[0017] 图8为本发明实施例预测残差信号的量化编码装置结构示意图。

具体实施方式

[0018] 基于上述分析,本发明实施例提出一种预测残差信号的量化编码方法,参见图2,包括以下步骤:
[0019] S201:根据左右声道信号获取两路信号,并分别将两路信号变换到频域,计算频域内的左右声道的特征参数,并由一路信号预测另一路信号,得到预测残差信号;
[0020] S202:将所述特征参数与设定的阈值进行比较,根据比较结果选择不同的量化算法对预测残差信号进行量化编码。
[0021] 参见图3,为本发明实施例预测残差信号的量化编码示意图,首先,根据左右声道信号获取两路信号:第一路信号特指单声道信号,第二路信号可以是边带信号、左声道信号或右声道信号,随后,将两路信号分别进行时频变换,变换到频域;再然后,通过预测算法,用第一路信号预测第二路信号,得到预测信号,继而,第二路信号与预测信号的差为预测残差信号,同时,根据两路信号计算频域内的左右声道信号的特征参数或者直接根据左右声道信号计算出频域内的左右声道信号的特征参数;最后,依据左右声道信号的特征参数,判断立体声信号的特性,动态的选择采用高速率或高精度量化算法(例如SQ(标量量化算法,Scalar Quantization)))或是低速率或低精度量化算法(例如,VQ(矢量量化算法,Vector Quantization)对预测残差信号进行量化编码,由此,使得重建的立体声信号可以在声场的稳定性和增强的频谱范围之间做出比较好的折中,而获得较好的立体声重建质量。
[0022] 在本发明实施例中,左右声道信号的特征参数具体形式不限,只要能表征立体声的信号特性即可,比较典型的例子是,左右声道信号的声道电平差,或者,左右声道信号的相关值,具体地,当左右声道信号的声道电平差的绝对值大于或等于所述设定的阈值时,采用高速率或高精度量化算法对所述预测残差信号进行量化编码,当左右声道信号的声道电平差的绝对值小于所述设定的阈值时,采用低速率或低精度量化算法对所述预测残差信号进行量化编码。
[0023] 下面以这两种情况对本发明实施例的具体实例进行详细介绍:实例1和实例2是根据左右声道信号的声道电平差对预测残差信号进行量化编码的方案,实例3和实例4是根据左右声道信号的相关值对预测残差信号进行量化编码的方案。
[0024] 实例1:
[0025] 参见图4,为本发明实施例预测残差信号的量化编码实例1示意图。其实现过程介绍如下:
[0026] (1)对左声道信号L和右声道信号R进行下混处理,得到两路信号,分别是单声道信号M和边带信号S:
[0027] M=(L+R)/2;S=(L-R)/2
[0028] (2)单声道信号M通过单声道编码器后在本地进行解码,解码后的M信号通过MDCT(Modified Discrete Cosine Transform,改进离散余弦变换)变换到频域;边带信号S通过延时之后,同样进行MDCT变换到频域。
[0029] (3)根据信号M和信号S计算频域内的左右声道信号的声道电平差,具体又包括以下子步骤:
[0030] (3.1)根据信号M和信号S的频谱系数,计算左声道信号能量以及右声道信号能量:
[0031] 例如,采用如下公式1、2分别计算左声道信号能量和右声道信号能量。
[0032] 左声道信号能量:
[0033] ……………公式1
[0034] 右声道信号能量:
[0035] ……………公式2
[0036] 其中,m(k)是单声道信号的频谱系数,s(k)为边带信号的频谱系数,k为频谱索引,N(band)第band频带的下边界。
[0037] (3.2)根据左声道信号能量和右声道信号能量计算声道电平差系数(Channel Level Difference,CLD):
[0038] 例如,采用如下公式3计算声道电平差系数。
[0039] cld[band]=10*log10(c[band][l][l]/c[band][r][r])
[0040] ……………公式3[0041] 其中,cld[band]即表示声道电平差系数。
[0042] 其中,该实施例是根据信号M和信号S计算CLD系数,实际上,可以直接根据左右声道信号来计算得到CLD,此处仅是一处实例而已。
[0043] (3.3)对cld[band]进行量化处理得到量化后的左右声道信号的声道电平差cld_q[band]。
[0044] (4)利用量化后的CLD系数cld_q[band]进行预测,得到预测残差信号。
[0045] 其中,预测过程可遵循以下公式:
[0046] b[band]=10cld_q[band]/20
[0047] ………………………公式4
[0048]
[0049] ……………………公式5
[0050] 其中,res[k]即表示预测残差信号。
[0051] 对如前描述的“用一路信号预测另一路信号”含义解释如下:“用信号A预测信号B”的含义是,采用与信号B最接近的信号αA与信号B作差,α满足的条件是,(αA-B)2(能量)最小。
[0052] 具体到本实施例的上述公式5中,m(k)为第一路信号, ,s(k)是第二路信号。
[0053] 可见,公式5仅是一个例子而已,其中的α取值可变,因此实际实现方式并不仅限于此。
[0054] (5)根据左右信号的声道电平差cld_q[band],确定选择何种量化算法对预测残差信号res[k]进行量化编码:
[0055] 例如:判断是否满足如下公式6:
[0056] |cld_q[band]|≤threshold
[0057] ………………………公式6[0058] 其中,threshold表示预先设定的声道电平差阈值,每个频带的threshold可以相同也可以不相同。
[0059] 当cld_q[band]满足上述公式6时,采用VQ等低速率或低精度量化算法来量化相应频带内的预测残差信号res[k],否则,采用SQ等高速率或高精度量化算法对res[k]进行量化。
[0060] 实例2:
[0061] 参见图5,为本发明实施例预测残差信号的量化编码实例2示意图,与实例1主要区别在于,实例2中的两路信号一路是单声道信号M,另一路是左右声道信号中的一路,本实例2以左声道信号L为例。其实现主要过程介绍如下:
[0062] (1)对左声道信号L和右声道信号R进行下混处理,得到单声道信号M:M=(L+R)/2;
[0063] 确定两路信号为信号M和左声道信号L。
[0064] (2)单声道信号M通过单声道编码器后在本地进行解码,解码后的M信号通过MDCT变换到频域;左声道信号L通过延时之后,同样进行MDCT变换到频域。
[0065] (3)根据信号M和信号L计算频域内的左右声道信号的声道电平差,具体又包括以下子步骤:
[0066] (3.1)根据信号M和信号L的频谱系数,计算左声道信号能量以及右声道信号能量:
[0067] 例如,采用如下公式7、8分别计算左、右声道信号能量。
[0068] 左声道信号能量:
[0069] ……………公式7
[0070] 右声道信号能量:
[0071] ……………公式8
[0072] 其中,m(k)是单声道信号的频谱系数,l(k)为左声道信号的频谱系数,k为频谱索引,N(band)第band频带的下边界。
[0073] (3.2)根据左声道信号能量和右声道信号能量计算声道电平差系数(Channel Level Difference,CLD):
[0074] 例如,采用如下公式3计算CLD。
[0075] cld[band]=10*log10(c[band][l][l]/c[band][r][r])
[0076] ……………公式3[0077] 其中,cld[band]即表示声道电平差系数。
[0078] (3.3)对cld[band]进行量化处理得到量化后的左右声道信号的声道电平差cld_q[band]。
[0079] (4)利用量化后的CLD系数cld_q[band]进行预测,得到预测残差信号。
[0080] 其中,预测过程中遵循的以下规则:
[0081] b[band]=10cld_q[band]/20
[0082] ………………………公式4[0083]
[0084] ………………………公式5[0085] 其中,res[k]即表示预测残差信号。
[0086] (5)根据左右信号的声道电平差cld_q[band],确定选择何种量化算法对预测残差信号res[k]进行量化编码:
[0087] 例如,判断是否满足如下公式6:
[0088] |cld_q[band]≤threshold
[0089] ………………………公式6[0090] 其中,threshold表示预先设定的声道电平差阈值,每个频带的threshold可以相同也可以不相同。
[0091] 当cld_q[band]满足上述公式6时,采用VQ等低速率或低精度量化算法来量化相应频带内的预测残差信号res[k],否则,采用SQ等高速率或高精度量化算法对res[k]进行量化。
[0092] 可见,实例2与实例1的主要区别在于(1)、(2)和(3.1),其余类似。
[0093] 通过实例1和实例2,当左右声道信号能量相差较大时,预测残差信号对量化失真比较敏感,这时采用SQ等高速率或高精度量化算法进行量化,由此,在比特数一定的情况下,虽然量化的点数较少,但是精度较高,可以很好地保持重建立体声的声场,当左右声道信号能量相差较小时,预测残差信号对量化失真敏感度较小,采用VQ等低速率或低精度量化算法进行量化,可以保证重建声场的稳定性,又可以量化尽可能多的点数。
[0094] 实例3:
[0095] 参见图6,为本发明实施例预测残差信号的量化编码实例3示意图,其实现过程介绍如下:
[0096] (1)对左声道信号L和右声道信号R进行下混处理,得到两路信号,分别是单声道信号M和边带信号S:
[0097] M=(L+R)/2;S=(L-R)/2
[0098] (2)单声道信号M经过单声道编码器后在本地进行解码,解码后的M信号通过MDCT变换到频域;边带信号S通过延时之后,同样进行MDCT变换到频域。
[0099] (3)利用频域相关预测算法获得预测残差信号。
[0100] 此步骤可采用任何频域相关预测的算法进行计算,不多赘述。
[0101] (4)根据信号M和信号S计算频域内的左右声道信号的相关值,具体地,通过以下公式计算:
[0102]
[0103] ……………公式9
[0104] 其中,c[band][l][r]是左右声道信号的相关值,m(k)是单声道信号的频谱系数,s(k)为边带信号的频谱系数,k为频谱索引,N(band)第band频带的下边界。
[0105] (5)根据左右信号的相关值c[band][l][r],确定选择何种量化算法对预测残差信号进行量化编码:
[0106] 例如,判断是否满足如下公式10:
[0107] |c[band][l][r]≤threshold
[0108] ………………………公式10[0109] 其中,threshold表示预先设定的相关值阈值,每个频带的threshold可以相同也可以不相同。
[0110] 当c[band][l][r]满足上述公式10时,采用SQ等高速率或高精度量化算法来量化相应频带内的预测残差信号,否则,采用VQ等低速率或低精度量化算法对进行量化。
[0111] 实例4:
[0112] 参见图7,为本发明实施例预测残差信号的量化编码实例4示意图,与实例3主要区别在于,实例4中的两路信号一路是单声道信号M,另一路是左右声道信号中的一路,本实例4以右声道信号R为例。其实现主要过程介绍如下:
[0113] 其实现过程介绍如下:
[0114] (1)对左声道信号L和右声道信号R进行下混处理,得到单声道信号M:M=(L+R)/2;
[0115] 确定两路信号为信号M和右声道信号R。
[0116] (2)单声道信号M经过单声道编码器后在本地进行解码,解码后的M信号通过MDCT变换到频域;右声道信号R通过延时之后,同样进行MDCT变换到频域。
[0117] (3)利用频域相关预测算法获得预测残差信号。
[0118] 此步骤可采用任何频域相关预测的算法进行计算,不多赘述。
[0119] (4)根据信号M和信号R计算频域内的左右声道信号的相关值,例如,具体地,通过以下公式计算:
[0120]
[0121] ……………公式11[0122] 其中,c[band][l][r]是左右声道信号的相关值,m(k)是单声道信号的频谱系数,r(k)为边带信号的频谱系数,k为频谱索引,N(band)第band频带的下边界。
[0123] (5)根据左右信号的相关值c[band][l][r],确定选择何种量化算法对预测残差信号进行量化编码:
[0124] 例如,判断是否满足如下公式10:
[0125] |c[band][l][r]|≤threshold
[0126] ………………………公式10[0127] 其中,threshold表示预先设定的相关值阈值,每个频带的threshold可以相同也可以不相同。
[0128] 当c[band][l][r]满足上述公式10时,采用SQ等高速率或高精度量化算法来量化相应频带内的预测残差信号,否则,采用VQ等低速率或低精度量化算法对进行量化。
[0129] 通过实例3和实例4,当左右声道信号相关性较小时,预测残差信号对量化失真比较敏感,这时采用SQ等高速率或高精度量化算法进行量化,由此,在比特数一定的情况下,虽然量化的点数较少,但是精度较高,可以很好地保持重建立体声的声场,当左右声道信号相关性较大时,预测残差信号对量化失真敏感度较小,采用VQ等低速率或低精度量化算法进行量化,可以保证重建声场的稳定性,又可以量化尽可能多的点数。
[0130] 除了上述介绍的方法,本发明实施例还提供一种预测残差信号的量化编码装置,具体地,该装置可以是指位于立体声编码器内部的功能实体,也可以是指立体声编码器设备本身,可以通过软件、硬件或软硬件结合实现。
[0131] 参见附图8,该装置包括信号获取单元801、频域变换单元802、预测残差信号获取单元803、特征参数计算单元804、判决单元805以及量化编码执行单元806,各单元功能介绍如下:
[0132] 信号获取单元801,用于根据左右声道信号获取两路信号;
[0133] 频域变换单元802,用于分别将信号获取单元801获取的两路信号变换到频域;
[0134] 预测残差信号获取单元803,用于利用一路信号预测另一路信号,得到预测残差信号;
[0135] 特征参数计算单元804,用于计算频域内的左右声道信号的特征参数;
[0136] 判决单元805,用于将特征参数计算单元804确定的特征参数与设定的阈值进行比较;
[0137] 量化编码执行单元806,根据判决单元805的比较结果,采取不同的量化算法对预测残差信号获取单元803确定的预测残差信号进行量化编码。
[0138] 其中,特征参数计算单元804计算的左右声道信号的特征参数是指左右声道信号的声道电平差或者是左右声道信号的相关值。
[0139] 当左右声道信号的特征参数是指左右声道信号的声道电平差时,量化编码执行单元806的工作过程为:当左右声道信号的声道电平差的绝对值大于等于阈值或者左右声道信号的相关值的绝对值小于等于阈值时,采用高速率或高精度量化算法对所述预测残差信号进行量化编码,
[0140] 当左右声道信号的特征参数是指左右声道信号的相关值时,量化编码执行单元806的工作过程为:当左右声道信号的声道电平差的绝对值小于阈值或者左右声道信号的相关值的绝对值大于阈值时,采用低速率或低精度量化算法对所述预测残差信号进行量化编码。
[0141] 其中,信号获取单元801获取的两路信号中的一路信号为单声道信号,另一路信号为边带信号、左声道信号或者右声道信号。
[0142] 有关装置的具体实现过程可参见方法实施例,不再赘述。
[0143] 可见,本发明实施例依据左右声道信号的特征参数,判断立体声信号的特性,动态的选取量化算法对预测残差信号进行量化编码,由此,使得重建的立体声信号可以在声场的稳定性和增强的频谱范围之间做出比较好的折中,而获得较好的立体声重建质量。
[0144] 本领域普通技术人员可以理解,实现上述实施例的方法的过程可以通过程序指令相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程序在执行时执行上述方法中的对应步骤。所述的存储介质可以如:ROM/RAM、磁碟、光盘等。
[0145] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。