语音解码中噪音增强后处理的方法和装置转让专利

申请号 : CN200810028014.9

文献号 : CN101582263B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 胡瑞敏程苗杨玉红方圆张勇

申请人 : 华为技术有限公司武汉大学

摘要 :

本发明实施例公开了一种语音解码中噪音增强后处理方法,根据语音帧的谱包络和长时平均谱包络获得噪音因子;判断所述噪音因子大于预设的门限值;根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑;根据平滑后的固定码矢的能量获得平滑后的固定码矢。本发明还公开了一种噪音增强后处理装置。采用本发明,可以降低语音解码中噪音增强后处理的计算复杂度。

权利要求 :

1.一种语音解码中噪音增强后处理方法,其特征在于,所述方法包括:根据语音帧的谱包络和长时平均谱包络获得噪音因子;

判断所述噪音因子大于预设的门限值;

根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑;

根据平滑后的固定码矢的能量获得平滑后的固定码矢。

2.如权利要求1所述的方法,其特征在于,所述根据语音帧的谱包络和长时平均谱包络获得噪音因子包括:获取所述语音帧的谱包络和长时平均谱包络之间的距离;

根据所述距离计算噪音因子。

3.如权利要求2所述的方法,其特征在于,所述谱包络和长时平均谱包络之间的距离为:其中

其中, 为第n帧的第m子帧的导谱对系数,j的取值为:0,1,...,Np-1, 为第n帧的长时平均导谱对系数,j的取值为:0,1,...,Np-1,Np为线性预测阶数,Nsfr为一帧中子帧的总数, 即为第n帧的当前谱包络和长时平均谱包络之间的距离,第n帧为所述语音帧,βq为平滑因子, 为第n帧的第Nsfr-1子帧的导谱对系数。

4.如权利要求3所述的方法,其特征在于,所述噪音因子为:γn=a-(dq/b),且1≤γn≤1.3其中γn为所述语音帧的噪音因子,dq为所述语音帧的当前谱包络和长时平均谱包络之间的距离,a、b为预先确定的参数。

5.如权利要求1至4中任一项所述的方法,其特征在于,所述根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑包括:根据所述语音帧的噪音因子和自适应码本增益获得所述语音帧的能量平滑因子;

根据所述语音帧的能量平滑因子、所述语音帧的固定码矢能量值以及前一帧的固定码矢能量值对所述语音帧的固定码矢的能量进行平滑。

6.如权利要求5所述的方法,其特征在于,所述能量平滑因子为:其中, 为所述语音帧的自适应码本增益,γn为所述语音帧的噪音因子,es即为所述语音帧的能量平滑因子。

7.如权利要求6所述的方法,其特征在于,所述根据所述语音帧的能量平滑因子、所述语音帧的固定码矢能量值以及前一帧的固定码矢能量值对所述语音帧的固定码矢能量进行平滑为:即,如果在上式中,按(a)情况计算得到了 如果有 则 如果在上式中,按(b)情况计算得到了 如果有 则

其中, 即为所述语音帧的平滑后的固定码矢能量,E0为所述语音帧的前一帧的固定码矢能量,Ec为所述语音帧的固定码矢的能量。

8.如权利要求5所述的方法,其特征在于,所述根据平滑后的固定码矢的能量获得平滑后的固定码矢包括:将平滑后的固定码矢的能量与未平滑的固定码矢的能量的比值进行开平方获得固定码矢缩放因子;

将固定码矢乘上所述固定码矢缩放因子获得经过能量平滑后的固定码矢。

9.一种噪音增强后处理装置,所述装置用于语音解码设备中,其特征在于,所述装置包括:获取单元,用于根据语音帧的谱包络和长时平均谱包络获得噪音因子;

判断单元,用于判断所述噪音因子是否大于预设的门限值,并获得判断结果;

第一平滑单元,用于当所述判断结果为噪音因子大于预设的噪音门限值时,根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑;

第二平滑单元,用于根据平滑后的固定码矢能量获得平滑后的固定码矢。

10.如权利要求9所述的装置,其特征在于,所述获取单元包括:第一获取子单元,用于获取所述语音帧的谱包络和长时平均谱包络之间的距离;

第二获取子单元,用于根据所述距离获取噪音因子。

11.如权利要求10所述的装置,其特征在于,噪音因子为:γn=a-(dq/b),且1≤γn≤1.3其中γn为所述语音帧的噪音因子,dq为所述语音帧的当前谱包络和长时平均谱包络之间的距离,a、b为预先确定的参数。

12.如权利要求9至11中任一项所述的装置,其特征在于,所述第一平滑单元包括:第三获取子单元,用于根据所述语音帧的噪音因子和自适应码本增益获得所述语音帧的能量平滑因子;

第一平滑子单元,用于根据所述语音帧的能量平滑因子、所述语音帧的固定码矢能量值以及前一帧的固定码矢能量值对所述语音帧的固定码矢能量进行平滑。

13.如权利要求12所述的装置,其特征在于,所述能量平滑因子为:其中, 为所述语音帧的自适应码本增益,γn为所述语音帧的噪音因子,es即为所述语音帧的能量平滑因子;

所述语音帧的平滑后的固定码矢能量 为:

即,如果在上式中,按(a)情况计算得到了 如果有 则 如果在上式中,按(b)情况计算得到了 如果有 则

其中,E0为所述语音帧的前一帧的固定码矢能量,Ec为所述语音帧的固定码矢的能量。

14.如权利要求12所述的装置,其特征在于,所述第二平滑单元包括:第一运算子单元,用于对平滑后的固定码矢的能量与未平滑的固定码矢的能量的比值进行开平方获得固定码矢缩放因子;

第二运算子单元,用于将固定码矢乘上所述固定码矢缩放因子获得经过能量平滑后的固定码矢。

说明书 :

语音解码中噪音增强后处理的方法和装置

技术领域

[0001] 本发明涉及通信领域,尤其涉及语音解码中噪音增强后处理方法和装置。

背景技术

[0002] 在通信系统传输语音信号时,为了有效的压缩语音信号使其适合传输和存储,需要将语音信号进行编码和解码。比如,在数字系统中,先将语音信号转化成数字语音信号,然后语音编码器对数字语音信号进行编码获得压缩的比特流;压缩的比特流通过信道传输,在接收端,语音解码器将压缩的比特流重构成语音信号。
[0003] 在编码激励的线性预测(Code Excited Linear Prediction,CELP)编码中,数字语音信号是以帧为单位进行处理的。对于每帧数字语音信号,编码器从数字语音信号中抽取多个编码参数,并将这些参数发送/存储。CELP解码器处理所接收的参数,重构合成数字语音信号的指定帧。
[0004] 通常CELP编/解码器需要计算编码的参数有:
[0005] -线性预测(LPC)系数;
[0006] -基音参数,包括基音延迟和基音增益;
[0007] -固定激励参数,包括固定码本索引和增益。
[0008] 其中,线性预测系数是以帧为单位进行计算及传输的,基音参数和固定激励参数是以子帧为单位计算及传输的。
[0009] 通常在解码端为了提高解码后合成语音的质量,通常会在解码端进行一些增强后处理。在CELP编码中,其激励产生的二元模型中包括了模拟浊音特性的自适应码本激励和模拟清音特性的固定码本激励,其总的激励为自适应码本激励和固定码本激励的和,最后总的激励通过一个合成滤波器得到合成语音。当输入的语音信号趋向清音特性时,在解码端对模拟清音特性的固定码本激励进行一定的噪音增强可以提高最后的合成语音的质量。
[0010] 现有的进行噪音增强的一种基于CELP模型的背景噪音后处理方法:通过对当前帧的导谱对(Immittance Spectrum Pair,ISP)系数计算得到一个长时平均距离,将此长时平均距离与预设的第一门限值进行比较,如果所述长时平均距离小于或等于所述门限值,则当前帧为非语音帧,进一步计算长时平均距离的长时平均值,得到一个平均后的距离值,并根据该距离值对当前帧进行分类:若该距离值小于等于预设的第二门限值,则判断该非语音帧为具有稳定噪声的非语音帧。对于具有稳定噪声的非语音帧需要对激励信号进行平滑处理。
[0011] 在实现本发明过程中,发明人发现上述技术中对噪音的判决较复杂(先判决语音/非语音,再判决稳定噪声/非稳定噪声,此判决过程较繁锁,计算复杂度较高),同时,在对噪声进行能量平滑以及ISP系数平滑过程中,其平滑复杂度较高,降低了了噪音增强后处理的效率。

发明内容

[0012] 本发明所要解决的技术问题在于,提供一种语音解码中噪音增强后处理方法和装置。可在即保持合理的计算复杂度的情况下获得较好的语音处理效果。
[0013] 本发明的实施例提供了一种语音解码中噪音增强后处理方法,包括:根据语音帧的谱包络和长时平均谱包络获得噪音因子;判断所述噪音因子大于预设的门限值;根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑;根据平滑后的固定码矢的能量获得平滑后的固定码矢。
[0014] 另一方面,本发明的实施例提供了一种噪音增强后处理装置,所述装置用于语音解码设备中,所述装置包括:获取单元,用于根据语音帧的谱包络和长时平均谱包络获得噪音因子;判断单元,用于判断所述噪音因子是否大于预设的门限值,并获得判断结果;第一平滑单元,用于当所述判断结果为噪音因子大于预设的噪音门限值时,根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑;第二平滑单元,用于根据平滑后的固定码矢能量获得平滑后的固定码矢。
[0015] 在本发明实施例中,通过噪音因子判断是否需要进行平滑处理,降低了计算复杂度。并通过对固定码矢的能量进行平滑的方式实现最终的平滑处理,也在一定程度上降低了计算复杂度。

附图说明

[0016] 图1是本发明中语音解码的流程示意图;
[0017] 图2是本发明实施例中一种语音解码中噪音增强后处理方法的流程示意图;
[0018] 图3是本发明实施例中一种语音解码中噪音增强后处理装置的组成示意图;
[0019] 图4是本发明中噪音增强处理前后的固定码矢能量对比图。

具体实施方式

[0020] 下面参考附图对本发明的实施例进行描述。
[0021] 为了帮助对本发明中提供的实施例的理解,先说明一下噪音增强后处理在语音解码中的意义。如图1所示,为CELP解码原理示意图。解码过程包括:
[0022] 步骤1,线性预测滤波器参数解码。
[0023] 在解码ISP模块01接收到来自信道的ISP索引后,对其进行解码、插值后,再根据索引值重构获得线性预测滤波器系数,如为
[0024] 步骤2,进行自适应码本矢量解码。
[0025] 由图中的解码自适应码本模块02进行自适应码本矢量解码,具体可以根据收到的自适应码本索引寻找基因延时的整数和分数部分,并通过内插过去的激励(即以前的激励)u(n)以得到自适应码本矢量v(n);
[0026] 步骤3,进行固定码本矢量解码。
[0027] 在解码固定码本模块03中,根据从收到的码流中解析获得的固定码本索引得到固定码本矢量c(n)。
[0028] 步骤4,进行自适应码本和固定码本的增益解码。
[0029] 在增益解码模块04中,根据收到的增益码本序号确定自适应码本增益 和固定码本增益相关因子 进而确定当前帧n的固定码本预测能量,相应的计算公式如下:
[0030]
[0031] 其中,可设定[b1,b2,b3,b4]=[0.5,0.4,0.3,0.2],其中[b1,b2,b3,b4]是滑动平均预测器的系数, 为子帧k的预测误差的量化值;
[0032] 令固定码本的平均能量贡献为: 则固定码本预测增益g′。的计算公式为:
[0033] 固定码本增益gc的计算公式为:
[0034] 步骤5,进行固定码矢能量平滑处理,即本发明具体实施例中所提供的噪音增强后处理。
[0035] 步骤6,生成重构合成激励信号;
[0036] 具体可以由自适应码本激励v(n)、固定码本激励c(n)、能量平滑因子k,自适应码本增益 以及量化后的固定码本增益 共同生成当前帧的激励信号u(u)。
[0037] 步骤7,生成重构语音信号;
[0038] 具体可以由合成激励信号u(n)通过合成滤波器05得到重构语音信号。
[0039] 如上所述,即为一个完整的语音信号的解码过程。本发明实施例解决的是步骤5中的语音解码中噪音增强后处理方法。具体参见图2,噪音增强后处理方法包括:
[0040] 201、根据语音帧(称需要解码的语音信号的一帧为语音帧,下同)的谱包络和长时平均谱包络计算获得噪音因子。首先计算语音帧的谱包络和长时平均谱包络之间的距离;然后根据所述距离计算该语音帧的噪音因子。
[0041] 其中,所述谱包络和长时平均谱包络之间的距离可通过语音帧的ISP系数计算获得,具体为:
[0042] 其中
[0043] 式中, (j=0,...,Np-1)为第n帧的第m子帧的ISP系数, (j=0,...,Np-1)为第n帧的长时平均ISP系数,Np为线性预测阶数,Nsfr为一帧中子帧的总数, 即为第n帧的当前谱包络和长时平均谱包络之间的距离,βq为平滑因子, 为第n帧的第Nsfr-1子帧的导谱对系数。
[0044] 鉴于aq数值比较大,通过实验测试,噪音因子具体可为
[0045] γn=1.35-(dq/50),且1≤γn≤1.3
[0046] 其中dq为需要解码的语音帧的当前谱包络和长时平均谱包络之间的距离,则γn即为该帧的噪音因子。式中各具体的数值(如1.35和50)均为经实践测试后获得的经验值,具体使用时也可以是其他合适的数值,如,在式γn=a-(dq/b)中,由于dq的范围有限,通过适当的选择系数a和b可以将γn-1的动态范围控制在0~0.3,即γn的范围限定在1~1.3中,如在上式中令a=1.35,b=50。
[0047] 202、判断所述噪音因子大于预设的门限值则执行203。
[0048] 当噪音因子值较小时,说明当前帧语音特性比较强,此时不需要进行噪音增强处理;当噪音因子值较大时,说明当前帧噪声特性比较强,此时需要进行噪音增强处理。因此,可对噪音因子设置一个门限值th(该门限值为一个经验值,比如可以为1),当噪音因子大于此门限值时,则执行203。
[0049] 203、根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢能量进行平滑。
[0050] 该平滑处理具体可分为两步:首先,根据所述噪音因子和所述语音帧的自适应码本增益计算能量平滑因子;然后根据上步中计算获得的能量平滑因子、所述语音帧的固定码矢能量值以及所述语音帧的前一帧的固定码矢能量值计算所述语音帧的平滑后的固定码矢能量。
[0051] 其中,能量平滑因子具体为:
[0052]
[0053] 式中, 为自适应码本增益,γn为噪音因子,es即为能量平滑因子。而根据能量平滑因子对能量进行平滑处理分为两种情况:
[0054] 1.
[0055] 2.如果在1中,按(a)情况计算得到了 如果有 则 如果在1中,按(b)情况计算得到了 如果有 则
[0056] 其中, 即为所述语音帧的平滑后的固定码矢能量,E0为所述语音帧的前一帧的固定码矢能量,Ec为所述语音帧的固定码矢的能量,为 为固定码本增益;c(n)为固定码本激励。
[0057] 204、根据平滑后的固定码矢能量获得平滑后的固定码矢。具体可为,将平滑后的固定码矢的能量与未平滑的固定码矢的能量的比值进行开平方获得固定码矢缩放因子k,即 再将固定码矢乘上所述固定码矢缩放因子获得经过能量平滑后的固定码矢。
[0058] 在本发明实施例中,通过噪音因子判断是否需要进行平滑处理,降低了计算复杂度。并通过对固定码矢的能量进行平滑的方式实现最终的平滑处理,也在一定程度上降低了计算复杂度。
[0059] 相应的,本发明实施例还提供了用于语音解码的一种噪音增强后处理装置,如图3所示,该装置包括:
[0060] 获取单元1,用于根据语音帧的谱包络和长时平均谱包络计算获得噪音因子。该获取单元1可进一步包括:第一获取子单元,用于获取所述语音帧的谱包络和长时平均谱包络之间的距离;第二获取子单元,用于根据所述距离获取噪音因子,其中,噪音因子具体可为:
[0061] γn=1.35-(dq/50),且0≤γn≤1.3
[0062] 式中dq为需要解码的语音帧的当前谱包络和长时平均谱包络之间的距离,γn为该帧的噪音因子。
[0063] 判断单元2,用于判断所述噪音因子是否大于预设的门限值,并获得判断结果。当噪音因子值较小时,说明当前帧语音特性比较强,此时不需要进行噪音增强处理;当噪音因子值较大时,说明当前帧噪声特性比较强,此时需要进行噪音增强处理。因此,可对噪音因子设置一个门限值th(该门限值为一个经验值,比如可以为1),当判断出噪音因子大于此门限值时,需要相应单元进行噪音的平滑处理。
[0064] 第一平滑单元3,用于当所述判断结果为噪音因子大于预设的噪音门限值时,根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑。该第一平滑单元3可进一步包括:第三获取子单元,用于根据所述语音帧的噪音因子和自适应码本增益获得所述语音帧的能量平滑因子;第一平滑子单元,用于根据所述语音帧的能量平滑因子、所述语音帧的固定码矢能量值以及前一帧的固定码矢能量值对所述语音帧的固定码矢能量进行平滑。
[0065] 其中能量平滑因子可为:
[0066]
[0067] 式中 为自适应码本增益,γn为噪音因子,es即为能量平滑因子;当前帧的平滑后的固定码矢能量可为:
[0068] 1.
[0069] 2.如果在1中,按(a)情况计算得到了 如果有 则 如果在1中,按(b)情况计算得到了 如果有 则
[0070] 其中, 即为所述语音帧的平滑后的固定码矢能量,E0为所述语音帧的前一帧的固定码矢能量,Ec为所述语音帧的固定码矢的能量。
[0071] 第二平滑单元4,用于根据平滑后的固定码矢能量获得经过能量平滑后的固定码矢。该第二平滑单元4可进一步包括:第一运算子单元,用于对平滑后的固定码矢的能量与未平滑的固定码矢的能量的比值进行开平方获得固定码矢缩放因子;第二运算子单元,用于将固定码矢乘上所述固定码矢缩放因子获得经过能量平滑后的固定码矢。
[0072] 如图4所示,为利用本发明实施例中所述的方法进行噪音增强处理前后的固定码矢能量对比图。
[0073] 该图中实线部分是在使用本发明实施例中所述方法进行噪音增强处理后的固定码矢能量,虚线部分是在屏蔽本发明方法的情况下测试得到的固定码矢能量。
[0074] 在图4中,横坐标代表子帧数,纵坐标代表该子帧的固定码矢能量值。需要说明的是,实际中由于一帧的数据较大,通常会将一帧分成很多子帧,则所述的固定码矢可以是对一帧而言的固定码矢,也可以是对每一子帧而言的固定码矢。
[0075] 众所周知,固定码矢表征去掉长时相关和短时相关后的白噪声信号,在解码端对模拟清音特性的固定码本激励进行一定的平滑处理可以提高合成语音的质量,从图中可以看出,根据虚线和实线部分比较,得出当固定码本能量出现突增或突减时,噪音增强处理平滑了固定码本能量的变化(提升了突降部分的能量,压低了突减部分的能量),这可以避免重建的信号中出现突变的人耳“可闻”的噪声,降低合成信号的质量。通过本发明方法将固定码矢能量根据输入信号帧的噪音特性进行平滑处理,起到了音质增强的目的。
[0076] 通过上述描述可以发现,与现有技术相比,本发明的实施例中仅对噪音因子进行一次判断,以决定是否需要进行平滑处理以达到噪音增强的目的,在降低计算复杂度的同时保持了较好的处理效果。同时,在平滑处理时,不需要进行ISP系数平滑,也在一定程度上降低了计算复杂度。
[0077] 以上所揭露的仅为本发明的实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。