一种背景噪声编码/解码装置、方法和通信设备转让专利

申请号 : CN201210194567.8

文献号 : CN102760441B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王喆张立斌

申请人 : 华为技术有限公司

摘要 :

本发明实施例提供一种背景噪声编码/解码装置、方法和通信设备,以实现根据通信环境的背景噪声情况灵活调整SID帧编码方式和非连续传输机制。本发明技术方案可以根据背景噪声的不同类型灵活采用不同的SID帧编码方法和非连续传输机制,在合理利用通信系统实际资源的情况下自适应于不同类型背景噪声所要求的编码精度和时间分辨力,来达到在合理利用信道资源的前提下在解码端高质量的提供各种类型背景噪声的目的。

权利要求 :

1.一种背景噪声编码装置,其特征在于,包括:

背景噪声分析单元,用于获取背景噪声信号的至少一个信号特征参数值;所述背景噪声信号包括背景噪声,所述背景噪声包括白噪声、背景嘈杂声和静音;

背景噪声分类单元,用于根据所述至少一个信号特征参数值确定背景噪声类型;

编码切换单元和至少两个非连续传输单元,所述编码切换单元用于根据所述背景噪声类型将背景噪声信号输入对应的非连续传输单元,每一个非连续传输单元用于将背景噪声信号编码为包含非连续传输单元指示信息的静音描述帧并非连续传输,其中各非连续传输单元的静音描述帧编码方式和/或静音描述帧非连续传输机制不相同,各非连续传输单元的静音描述帧编码方式不相同具体为:不同静音描述帧的编码参数不相同,或者同一编码参数不同静音描述帧的量化精度不相同,各非连续传输单元的静音描述帧非连续传输机制不相同具体为:发送的相邻两个静音描述帧的传输间隔不相同。

2.如权利要求1所述的背景噪声编码装置,其特征在于,还包括:指令接收单元,用于接收切换模式控制指令并转发给编码切换单元,所述切换模式控制指令用于指示编码切换单元使用一种切换模式,任意两个切换模式之间至少有一个背景噪声类型对应不同的非连续传输单元。

3.如权利要求1所述的背景噪声编码装置,其特征在于,还包括:语音编码器,所述编码切换单元根据背景噪声分类单元识别出的其中一种指定背景噪声类型,将背景噪声信号输入语音编码器编码为语音帧并连续输出。

4.如权利要求1、2或3所述的背景噪声编码装置,其特征在于,所述非连续传输单元具体包括:非语音编码器,用于将背景噪声信号编码为静音描述帧;

静音描述帧发送器,用于非连续发送所述静音描述帧。

5.一种对权利要求1所述背景噪声编码装置输出的静音描述帧进行解码的背景噪声解码装置,其特征在于,包括:第一识别单元,用于识别静音描述帧中的非连续传输单元指示信息;

解码切换单元和至少两个舒适噪声生成单元,所述解码切换单元用于根据所述识别单元的识别结果,将所述静音描述帧输入对应的舒适噪声生成单元,每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧,并重构背景噪声信号。

6.如权利要求5所述的背景噪声解码装置,其特征在于,还包括:

第二识别单元,所述第二识别单元用于识别语音帧和静音描述帧,并将所述静音描述帧送入第一识别单元,或者在识别出语音帧时通知所述解码切换单元;

语音解码器,所述解码切换单元将第二识别单元识别出的语音帧送入语音解码器解码并连续输出。

7.如权利要求6所述的背景噪声解码装置,其特征在于,所述第一识别单元和第二识别单元合并设置。

8.一种通信设备,包括:

第一语音检测器,用于检测采集的信号中是否包含有效语音并分类输出;

第一语音编码器,用于将包含有效语音的信号编码为语音帧并连续输出;

其特征在于,还包括背景噪声编码装置,该背景噪声编码装置具体包括:背景噪声分析单元,用于获取不包含有效语音的背景噪声信号的至少一个信号特征参数值;所述背景噪声信号包括背景噪声,所述背景噪声包括白噪声、背景嘈杂声和静音;

背景噪声分类单元,用于根据所述至少一个信号特征参数值确定背景噪声类型;

编码切换单元和至少两个非连续传输单元,所述编码切换单元用于根据所述背景噪声类型将背景噪声信号输入对应的非连续传输单元,每一个非连续传输单元用于将背景噪声信号编码为包含非连续传输单元指示信息的静音描述帧并非连续传输,其中各非连续传输单元的静音描述帧编码方式和/或静音描述帧非连续传输机制不相同,各非连续传输单元的静音描述帧编码方式不相同具体为:不同静音描述帧的编码参数不相同,或者同一编码参数不同静音描述帧的量化精度不相同,各非连续传输单元的静音描述帧非连续传输机制不相同具体为:发送的相邻两个静音描述帧的传输间隔不相同。

9.如权利要求8所述的通信设备,其特征在于,所述背景噪声编码装置还包括:指令接收单元,用于接收切换模式控制指令并转发给编码切换单元,所述切换模式控制指令用于指示编码切换单元使用一种切换模式,任意两个切换模式之间至少有一个背景噪声类型对应不同的非连续传输单元。

10.如权利要求8所述的通信设备,其特征在于,所述编码切换单元还连接所述第一语音编码器,所述编码切换单元根据背景噪声分类单元识别出的其中一种指定背景噪声类型,将背景噪声信号输入第一语音编码器编码为语音帧并连续输出。

11.如权利要求8所述的通信设备,其特征在于,所述背景噪声编码装置还包括:第二语音编码器,所述编码切换单元根据背景噪声分类单元识别出的其中一种指定背景噪声类型,将背景噪声信号输入第二语音编码器编码为语音帧并连续输出。

12.如权利要求8、9、10或11所述的通信设备,其特征在于,所述非连续传输单元具体包括:非语音编码器,用于根据设定的静音描述帧编码方式将背景噪声信号编码为静音描述帧;

静音描述帧发送器,用于根据设定的非连续传输机制发送所述静音描述帧。

13.如权利要求8所述的通信设备,其特征在于,还包括:

第一识别单元,用于识别静音描述帧中的非连续传输单元指示信息;

解码切换单元和至少两个舒适噪声生成单元,所述解码切换单元用于根据所述识别单元的识别结果,将所述静音描述帧输入对应的舒适噪声生成单元,每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧,并重构背景噪声信号。

14.如权利要求13所述的通信设备,其特征在于,还包括:

第二识别单元,所述第二识别单元用于识别语音帧和静音描述帧,并将所述静音描述帧送入第一识别单元,或者在识别出语音帧时通知所述解码切换单元;

语音解码器,所述解码切换单元将第二识别单元识别出的语音帧送入语音解码器解码并连续输出。

15.如权利要求14所述的通信设备,其特征在于,所述第一识别单元和第二识别单元合并设置。

16.一种通信设备,包括背景噪声解码装置,其特征在于,所述背景噪声解码装置包括:第一识别单元,用于识别静音描述帧中的非连续传输单元指示信息;

解码切换单元和至少两个舒适噪声生成单元,所述解码切换单元用于根据所述识别单元的识别结果,将所述静音描述帧输入对应的舒适噪声生成单元,每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧,并重构背景噪声信号;所述背景噪声信号包括背景噪声,所述背景噪声包括白噪声、背景嘈杂声和静音。

17.如权利要求16所述的通信设备,其特征在于,还包括:

第二识别单元,所述第二识别单元用于识别语音帧和静音描述帧,并将所述静音描述帧送入第一识别单元,或者在识别出静音描述帧时通知所述解码切换单元;

语音解码器,所述解码切换单元将第二识别单元识别出的语音帧送入语音解码器解码并输出。

18.如权利要求17所述的通信设备,其特征在于,所述第一识别单元和第二识别单元合并设置。

19.一种背景噪声编码方法,其特征在于,包括:

获取背景噪声信号的至少一个信号特征参数值;所述背景噪声信号包括背景噪声,所述背景噪声包括白噪声、背景嘈杂声和静音;

根据所述至少一个信号特征参数值确定背景噪声类型;

根据所述背景噪声类型选择一种非连续传输机制将背景噪声信号编码为包含非连续传输机制指示信息的静音描述帧并非连续发送,其中每一种非连续传输机制中的静音描述帧编码方式和/或静音描述帧非连续发送方式不相同,各非连续传输单元的静音描述帧编码方式不相同具体为:不同静音描述帧的编码参数不相同,或者同一编码参数不同静音描述帧的量化精度不相同,各非连续传输单元的静音描述帧非连续传输机制不相同具体为:发送的相邻两个静音描述帧的传输间隔不相同。

20.如权利要求19所述的编码方法,其特征在于,所述根据背景噪声类型选择一种非连续传输机制是:根据设定的非连续传输机制选择模式中背景噪声类型和非连续传输机制之间的对应关系进行选择的,任意两个切换模式之间至少有一个背景噪声类型对应的非连续传输机制不相同。

21.如权利要求19所述的编码方法,其特征在于,还包括:当所述至少一个信号特征参数值满足设定条件时,将背景噪声信号编码为全速率的语音帧并连续发送。

22.如权利要求19、20或21所述的编码方法,其特征在于,所述信号特征参数包括如下之一或任意组合:长时SNR、背景噪声估计电平、背景噪声能量波动估计、背景噪声谱波动估计和背景噪声波动频率。

23.如权利要求22所述的编码方法,其特征在于,根据各信号特征参数值的大小,所述背景噪声类型包括稳态背景噪声信号和非稳态背景噪声信号。

24.如权利要求23所述的编码方法,其特征在于,当所述信号特征参数包括长时SNR时:所述稳态背景噪声信号进一步包括:稳态大SNR背景噪声信号和稳态小SNR背景噪声信号;

所述非稳态背景噪声信号进一步包括:非稳态大SNR背景噪声信号和非稳态小SNR背景噪声信号。

25.如权利要求19所述的编码方法,其特征在于,不同静音描述帧编码方式之间的区别包括:至少一个静音描述帧编码参数不相同,或者同一静音描述帧编码参数的量化精度不相同。

26.如权利要求25所述的编码方法,其特征在于,所述的静音描述帧编码参数包括合成滤波器参数和激励参数。

27.如权利要求26所述的编码方法,其特征在于,所述的激励参数包括自适应码本参数和/或固定码本参数。

28.如权利要求19所述的编码方法,其特征在于,不同静音描述帧非连续发送方式之间的区别包括:发送的相邻两个静音描述帧之间的传输间隔不相同。

29.如权利要求28所述的编码方法,其特征在于,所述的传输间隔根据背景信号的变化自适应确定,并且不同静音描述帧非连续发送方式之间的最小间隔不相同。

30.如权利要求28所述的编码方法,其特征在于,各静音描述帧非连续发送方式的传输间隔为不相同的固定值。

31.一种对权利要求19所述方法生成的静音描述帧进行解码的方法,其特征在于,包括:识别静音描述帧中的非连续传输机制指示信息,其中每一种非连续传输机制中的静音描述帧编码方式不相同;

根据所述非连续传输机制指示信息,采用对应的解码方式解码静音描述帧,并重构为背景噪声信号。

说明书 :

一种背景噪声编码/解码装置、方法和通信设备

技术领域

[0001] 本发明涉及语音通信技术,特别涉及一种背景噪声编码/解码装置、方法和通信设备。

背景技术

[0002] 语音通信过程中,被传输的语音信号可以分为有声信号和无声信号两类,其中:有声信号是在检测到有效语音时发送的语音信号,主要包括通信方的语音以及当时的背景噪声等信息;无声信号在没有检测到有效语音的间隙发送的背景噪声信号,主要包括各种背景噪声,比如白噪声、背景嘈杂声和静音等。对通信双方来说,有声信号为有用信号,是主要通信信息的载体,而无声信号为无用信号,不包含主要通信信息。
[0003] 在语音通信过程中,由于通信双方主要关注的是有用的有声信号,因此考虑到带宽的压力,不希望传送无用的无声信号,以降低传输带宽,增加系统容量。但是如果只传有声信号,会导致背景噪声的不连续,使收听的一方感觉非常不舒服,尤其在背景噪声较强的情况下更加明显,甚至会令语音难以理解,所以只能尽量减少传送无用的无声信号,在保证用户感受度的基础上尽量降低带宽,为此应运而生了CNG(Comfort Noise generation,舒适噪声生成)技术,CNG技术中,发送端在无声信号阶段采用静音压缩编码技术编码背景噪声帧,并采用DTX(Discontinuous Transmission,非连续传输)方式传输,接收端采用内插的方式产生连续的背景噪声信号,以增加收听方的舒适感。
[0004] 如图1所示,为采用静音压缩编码技术的通信系统原理示意图,其中,发送端包括:
[0005] VAD(Voice Activity Detector,语音检测器),原始信号经一定预处理后输入VAD,VAD通常根据每一帧信号的特征值,例如信噪比,检测信号中是否包含有效语音,并根据检测结果将信号送入不同的编码器进行编码;
[0006] 语音编码器,用于将包含有效语音的有声信号编码为语音帧并输出,语音帧通过通信信道被传输给接收端;
[0007] 非语音编码器,采用静音压缩技术将不包含有效语音的无声信号编码为背景噪声帧;
[0008] 背景噪声帧发送器,采用设定的DTX方式将背景噪声帧通过通信信道传输给接收端,例如每隔几帧发送一个背景噪声帧,或者根据背景噪声的特征参数变化情况决定是否发送一个背景噪声帧;
[0009] 相应的,接收端包括:
[0010] 语音解码器,用于解码从通信信道接收的语音帧,并重构为有声信号后输出;
[0011] 非语音解码器,用于解码从通信信道接收的背景噪声帧;
[0012] 重构器,用于采用内插的方式将解码数据重构为连续的背景噪声信号,以增加收听方的舒适感。
[0013] 发送端的非语音编码器和背景噪声帧发送器组成DTX单元,接收端的非语音解码器和重构器组成CNG单元,静音压缩技术通过位于发送端的VAD和DTX,以及位于接收端的CNG实现。
[0014] 以常用的CELP(Code-Excited Linear Prediction,码激励线性预测)语音编码技术为例,CELP是一种高效率的语音编码技术。由于采用了感觉加权、分析合成、矢量量化和后滤波等技术,CELP能够在中低速率上给出高质量的合成语音。CELP语音编码技术中,在发送端进行语音信号分析以获取语音的特征参数,将语音的特征参数编码到码流中发送;接收端根据码流中的特征参数进行语音合成,重构语音信号。语音信号s(n)被分成短的时间段,称为帧,发送端的语音分析和接收端的语音合成都是逐帧进行的。
[0015] 在发送端,原始信号s(n)可以看成是一个激励信号e(n)激励一个滤波器v(n)所产生的输出,即s(n)=e(n)*v(n),接收端使用相同的滤波器对语音进行合成,称为合成滤波器。因此语音信号的编码码流中传输的特征参数包括合成滤波器参数和激励参数,其中:合成滤波器参数主要为线谱频率LSF(Line Spectrum Frequency)量化参数,而激励信号参数包括:自适应码本参数(包括基音延迟参数和基音增益参数)和固定码本参数(包括固定码本中非零脉冲的位置和符号以及固定码本增益参数)。
[0016] 与语音编码参数不同,背景噪声编码参数描述的是背景噪声特性,由于背景噪声的激励信号可以认为是简单的噪声随机序列,而这些序列在编解码端均可以简单的用随机噪声产生装置产生,然后用能量参数控制这些序列的幅度,就可产生最终的激励信号,因此激励信号特征参数可以简单的用能量参数来表示,而不需要用其它的一些特征参数来进一步描述,所以在背景噪声编码码流中与语音帧不同的是,其激励参数为当前背景噪声帧的能量参数;而背景噪声编码码流中与语音帧相同的是,编码码流中的合成滤波器参数也为线谱频率LSF量化参数,只是具体的量化方法有所差别。通过以上分析,可以认为对背景噪声的编码方式本质上就是一种简单的语音编码方式。
[0017] 经DTX压缩编码并被非连续传输的背景噪声帧一般称为SID(Silence Descriptor,静音描述帧)帧。在当前的各种语音编码系统中,每一系统内的背景噪声信号都使用SID帧格式和非连续传输机制。
[0018] 其中,G.729B静音压缩方案是一种具有代表性的静音压缩技术,G.729B是基于CELP算法模型的,因此其所传输的背景噪声参数也是基于CELP模型获取的,包括用于描述背景噪声的合成滤波器参数与激励参数。在编码端,例如VAD的判决结果为0时,表示当前的信号为噪声,则经一定预处理的原始信号被送入背景噪声编码装置,在背景噪声编码装置对背景噪声参数进行提取和量化,组成SID帧,然后背景噪声编码装置根据SID帧内的参数变化情况来决定是否发送一帧SID帧,例如SID帧中的滤波器参数和能量参数变化较大时发送一帧SID帧。G.729B中,两个相邻SID帧的间隔至少为2帧。在解码端,若进入背景噪声解码重构阶段,则在背景噪声解码装置中根据接收的SID帧合成出描述编码端背景噪声特性的舒适噪声。G.729B的SID帧中为各参数分配的比特数如下表1所示:
[0019] 表1.
[0020]比特分配(从高位到低位) 参数描述
S1 量化预测器索引
S2-S6 一级LSF量化矢量索引
S7-S10 二级LSF量化矢量索引
S11-S15 增益(能量)
[0021] AMR(Adaptive Multi-Rate speech codec,自适应多码率语音编码器)和AMR-WB(Adaptive Multi-Rate Wide Band speech codec,宽带自适应多码率语音编码器)静音压缩方案中的DTX则采用固定的发送机制,无论背景噪声的特性如何变化,每8帧发送一次SID帧。AMR的SID帧中为各参数分配的比特数如下表2所示,AMR-WB的SID帧中为各参数分配的比特数如下表3所示。
[0022] 表2.
[0023]比特分配(从高位到低位) 参数描述
S1-S3 量化预测器索引
S4-S11 一级LSF量化矢量索引
S12-S20 二级LSF量化矢量索引
S21-S29 三级LSF量化矢量索引
S30-S35 对数帧能量索引
[0024] 表3.
[0025]比特分配(从高位到低位) 参数描述
S1-S6 一级LSF量化矢量索引
S7-S12 二级LSF量化矢量索引
S13-S18 三级LSF量化矢量索引
S19-S23 四级LSF量化矢量索引
S24-S28 五级LSF量化矢量索引
S29-S34 对数帧能量索引
S35 抖动标志
[0026] 现有的背景噪声编码方式可对背景噪声进行简单编码,并在解码端合成出简单的舒适背景噪声,可以在一定程度上较好满足接听质量的要求。然而随着通信技术的发展,语音编码质量越来越高,相应的,有声阶段的背景噪声的编码质量也越来越高,在这种情况下,为使得语音通信时的背景噪声更加连续,也需要提高无声阶段背景噪声的编码质量。现有较为单一的SID帧编码方式和非连续传输机制显然无法满足多种通信环境的具体要求。

发明内容

[0027] 本发明实施例提供一种背景噪声编码/解码装置、方法和通信设备,以实现根据通信环境的背景噪声情况灵活调整SID帧编码方式和非连续传输机制。
[0028] 一种背景噪声编码装置,包括:
[0029] 背景噪声分析单元,用于获取背景噪声信号的至少一个信号特征参数值;
[0030] 背景噪声分类单元,用于根据所述至少一个信号特征参数值确定背景噪声类型;
[0031] 编码切换单元和至少两个非连续传输单元,所述编码切换单元用于根据所述背景噪声类型将背景噪声信号输入对应的非连续传输单元,每一个非连续传输单元用于将背景噪声信号编码为包含非连续传输单元指示信息的静音描述帧并非连续传输,其中各非连续传输单元的静音描述帧编码方式和/或静音描述帧非连续传输机制不相同。
[0032] 一种背景噪声解码装置,包括:
[0033] 第一识别单元,用于识别静音描述帧中的非连续传输单元指示信息;
[0034] 解码切换单元和至少两个舒适噪声生成单元,所述解码切换单元用于根据所述识别单元的识别结果,将所述静音描述帧输入对应的舒适噪声生成单元,每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧,并重构背景噪声信号。
[0035] 一种通信设备,包括:
[0036] 第一语音检测器,用于检测采集的信号中是否包含有效语音并分类输出;
[0037] 语音编码器,用于将包含有效语音的信号编码为语音帧并连续输出;
[0038] 还包括背景噪声编码装置,该背景噪声编码装置具体包括:
[0039] 背景噪声分析单元,用于获取不包含有效语音的背景噪声信号的至少一个信号特征参数值;
[0040] 背景噪声分类单元,用于根据所述至少一个信号特征参数值确定背景噪声类型;
[0041] 编码切换单元和至少两个非连续传输单元,所述编码切换单元用于根据所述背景噪声类型将背景噪声信号输入对应的非连续传输单元,每一个非连续传输单元用于将背景噪声信号编码为包含非连续传输单元指示信息的静音描述帧并非连续传输,其中各非连续传输单元的静音描述帧编码方式和/或静音描述帧非连续传输机制不相同。
[0042] 一种通信设备,包括背景噪声解码装置,所述背景噪声解码装置包括:
[0043] 第一识别单元,用于识别静音描述帧中的非连续传输单元指示信息;
[0044] 解码切换单元和至少两个舒适噪声生成单元,所述解码切换单元用于根据所述识别单元的识别结果,将所述静音描述帧输入对应的舒适噪声生成单元,每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧,并重构背景噪声信号。
[0045] 一种背景噪声编码方法,包括:
[0046] 获取背景噪声信号的至少一个信号特征参数值;
[0047] 根据所述至少一个信号特征参数值确定背景噪声类型;
[0048] 根据所述背景噪声类型选择一种非连续传输机制将背景噪声信号编码为包含非连续传输机制指示信息的静音描述帧并非连续发送,其中每一种非连续传输机制中的静音描述帧编码方式和/或静音描述帧非连续发送方式不相同。
[0049] 一种解码方法,包括:
[0050] 识别静音描述帧中的非连续传输机制指示信息,其中每一种非连续传输机制中的静音描述帧编码方式不相同;
[0051] 根据所述非连续传输机制指示信息,采用对应的解码方式解码静音描述帧,并重构为背景噪声信号。
[0052] 应用本发明技术方案,可以根据背景噪声的不同类型灵活采用不同的SID帧编码方法和非连续传输机制,在合理利用通信系统实际资源的情况下自适应于不同类型背景噪声所要求的编码精度和时间分辨力,来达到在合理利用信道资源的前提下在解码端高质量的提供各种类型背景噪声的目的。

附图说明

[0053] 图1为现有采用静音压缩编码技术的通信系统原理示意图;
[0054] 图2、图3、图5和图6分别为本发明实施例提供的一种背景噪声编码装置主要结构示意图;
[0055] 图4为本发明实施例提供的切换模式原理示意图;
[0056] 图7、图8和图9分别为本发明实施例提供的一种通信设备主要结构示意图。

具体实施方式

[0057] 进一步分析现有背景噪声编码,每一种编解码系统中都采用单一的背景噪声帧编码方式,无法针对性的描述各种特性的通信环境的具体背景噪声信号,从而满足通信环境多样性的需求;单一非连续传输机制也无法对不同特性的背景噪声帧有针对性的传输背景噪声帧,以至无法在解码端针对性的产生较好的舒适噪声;并且非连续传输机制的单一性也无法自适应于通信系统的实际状况,例如通信带宽,以至通信系统的资源不能被合理应用。
[0058] 因此,本发明实施例提供的一种编解码技术方案,可以针对性的根据背景噪声特性进行相应处理,在编码端对背景噪声进行分析,根据背景噪声的特性采用不同的DTX方案编码发送SID帧,并在接收端采用相对应的CNG方案重构背景噪声信号。
[0059] 如图2所示,为本发明实施例提供的一种背景噪声编码装置20,该背景噪声编码装置20用于静音压缩编码通信系统中,主要结构包括:
[0060] 至少两个DTX单元21,包括DTX单元211、DTX单元2 12......DTX单元21n,各DTX单元21用于根据不同的DTX机制将背景噪声信号编码为SID帧并非连续输出,其中,不同的DTX机制之间的区别包括:SID帧编码方式不相同、SID帧非连续传输机制不相同,或者二者都不相同;
[0061] 背景噪声分析单元22,用于根据背景噪声信号计算至少一个信号特征参数值;
[0062] 背景噪声分类单元23,用于根据所述至少一个信号特征参数值确定背景噪声类型;
[0063] 编码切换单元24,用于根据所述背景噪声类型将接收的背景噪声信号输入对应的DTX单元21。
[0064] 背景噪声分析单元22的功能是分析输入的背景噪声信号以获得背景信号的特征参数,分析方法是计算出一个或多个能够表征背景噪声信号的信号特征参数值,这些信号特征参数可以是如下参数之一或任意组合:长时SNR(signal to Noise Ratio)、背景噪声估计电平、背景噪声能量波动估计、背景噪声谱波动估计、背景噪声波动频率等。其它可以表征信号背景的大小、种类(稳态/非稳态,变化大小,变化快慢)、SNR(长时,短时,峰值)的参数也可以被计算出来用于分析。除将背景噪声信号输入背景噪声分析单元22外,还可以将VAD判决当前信号是背景信号的指示信号输入背景噪声分析单元22,背景噪声分析单元22根据背景噪声信号指示信息触发计算信号特征参数值。
[0065] 背景噪声分类单元23的功能是根据背景噪声分析单元22计算得到的信号特征参数值,划分当前背景噪声信号的类型。背景噪声类型至少定义两种,可以根据背景噪声的稳定与否定义,例如:将背景噪声划分为稳态背景噪声信号和非稳态背景噪声信号两类;又如根据背景噪声的稳定与否及长时SNR的大小定义:将背景噪声划分为稳态大SNR背景噪声信号、稳态小SNR背景噪声信号、非稳态大SNR背景噪声信号、非稳态小SNR背景噪声信号四类。还可以根据背景噪声所包含信息意义的大小定义背景噪声类型,比如背景噪声信号可被分为悦耳背景噪声信号(如音乐,流水,鸟语等)、环境背景噪声信号(如酒会,街边,机场等)或其它背景噪声信号三类。总之,背景噪声的划分类型可以根据需要设定,并不限定本发明技术方案的实施。
[0066] 编码切换单元24中预先存储了每一种背景噪声类型适用的DTX单元21,根据背景噪声分类单元23确定的背景噪声类型,在至少两个DTX单元21之间进行切换,选择和当前背景噪声类型相对应的DTX单元21进行处理。
[0067] 一般情况下各背景噪声类型分别对应一种不同的DTX方案,但是考虑到具体通信场景的需求或通信信道资源变化情况,还可以设定不同的切换模式,每一种切换模式对应不同的切换控制方案,可以将每一种切换模式所对应的具体切换控制方案预先存储到编码切换单元24中,并通过切换模式控制指令指示编码切换单元24所需的切换模式,切换模式控制指令可以是反映当前信道资源状况的有限个指令集,每一特定的切换模式控制指令对应一种切换模式,即一种DTX单元的分配方法。也可以在每一次切换模式控制指令时,将所需的切换模式对应的具体切换控制方案同时发送给编码切换单元24。
[0068] 编码切换单元24根据具体原因的指示信息确定出对应切换模式。对于本领域技术人员来说,具体的切换模式转换控制方法很多,这里不再一一列举。
[0069] 因此如图3所示,图2所示背景噪声编码装置20中还可以增加设置指令接收单元25,接收切换模式控制指令并转发给编码切换单元24,切换模式控制指令可以是操作人员从外部输入的,也可以是发送端根据检测的信道资源情况产生等。
[0070] 编码切换单元24可以根据切换模式控制指令选择恰当的切换模式,任意两个切换模式之间至少有一个背景噪声类型对应的DTX单元21不相同。以背景噪声编码装置20中包括四个DTX单元21为例,切换模式的设定例如图4所示:
[0071] 当没有设置指令接收单元25时,编码切换单元24仅根据背景噪声类型为背景噪声选择恰当的DTX单元,例如切换模式1;
[0072] 当设置有指令接收单元25时,编码切换单元24根据切换模式控制指令确定选择DTX单元的模式。例如:
[0073] 接收到切换模式控制指令1时,根据切换模式1进行切换;
[0074] 接收到切换模式控制指令2时,根据切换模式2进行切换;
[0075] 接收到切换模式控制指令3时,根据切换模式3进行切换。
[0076] 切换模式控制指令可以根据当前信道资源情况发出,例如当前信道资源紧张时,其中部分背景噪声类型的背景噪声可能使用同一个较低速率的DTX单元,甚至所有的背景噪声类型都使用最低速率DTX单元。又例如,当没有切换模式控制指令时,只有其中部分DTX单元会被使用,但当切换模式控制指令表示当前信道资源充裕或紧张时,另一部分DTX单元被使用。
[0077] 由图4所示的例子可见:
[0078] 指令1指示进入切换模式1,此时每一种背景噪声类型都对应一种不同的DTX单元,指令1可以是表示当前的信道资源正常;
[0079] 指令2指示进入切换模式2,此时部分背景噪声类型会对应相同的DTX单元,如背景噪声类型1和背景噪声类型2均对应DTX单元212,背景噪声类型3和背景噪声类型4均对应DTX单元214,指令2可以表示当前信道资源较丰富(DTX单元212较DTX单元211编码速率高,占用资源多;DTX单元214较DTX单元213编码速率高,占用资源多),或者可以表示当前信道资源较紧张(DTX单元212较DTX单元211编码速率的低,占用资源少;DTX单元214较DTX单元213编码速率低,占用资源少);
[0080] 指令3指示进入切换模式3,此时所有的背景噪声类型均只对应DTX单元214,指令3可以表示当前信道资源十分丰富(DTX单元214编码速率最高,占用资源最多),或者可以表示当前信道资源十分紧张(DTX单元214编码速率最低,占用资源最少)。
[0081] 如图5所示,在当前信道资源非常充足或者背景噪声特别悦耳时,还可以在背景噪声编码装置20中再设置语音编码器,利用语音编码器对特定背景噪声进行全速率编码。特定背景噪声的信号特征参数值满足设定条件,背景噪声分类单元23根据至少一个信号特征参数值是否满足设定条件来判断特定背景噪声类型,并指示编码切换单元24在特定背景噪声时切换到语音编码器,语音编码器将该特定背景噪声信号编码为语音帧并连续输出。当然,也可以利用发送端已有的语音编码器承担该功能。
[0082] 参阅图1所示,每一个DTX单元21中包括两部分,其一为非语音编码器,用于将背景噪声信号编码为SID帧,其二为背景噪声帧发送器,用于根据设定的非连续方式发送背景噪声帧。DTX单元间的不同可以是SID帧编码方式的不同,也可以是非连续传输机制的不同,或者二者皆不同。其中:SID帧编码方式的不同可以体现在以下几个方面:
[0083] 1、编码参数的不同
[0084] 不同的SID帧可以采用不同种类的参数和不同数量的参数;
[0085] 2、相同参数量化精度的不同
[0086] 对于同一参数不同SID帧可以采用不同的量化精度;
[0087] 因此,不同SID帧编码方式产生的SID帧的结构和长度可能不同,例如:稳态背景噪声信号噪声的编码参数可以相对简单,参数的量化精度可以相对较低,SID帧的长度可以相对较短。相对应的,非稳态背景噪声信号的编码参数可以相对较多,一种方法是在现有的SID帧中增加语音编码参数中的激励参数,如自适应码本参数(基音延迟和增益)和固定码本参数(非零脉冲的位置和符号以及增益)等,参数的量化精度可以相对较高,如增加现有SID帧中滤波器参数和激励参数的量化精度等,SID帧的长度也可相应增加。又如,悦耳背景噪声信号的SID帧应使用最复杂的编码方式(可以是全速率编码),环境背景噪声信号的SID帧使用次复杂的编码方式,其它背景噪声信号的SID帧则使用较简单的编码方式。
[0088] 不同的背景噪声类型还可以使用不同的非连续传输机制,不同背景噪声类型的SID帧发送机制的不同主要体现在相邻两个SID帧的传输间隔上。例如对于稳态背景噪声信号,由于背景的变动较小,人类听觉系统对该类背景噪声经DTX/CNG之后的质量下降敏感度不高,只需用相对较长的非连续传输间隔即可。对于非稳态背景噪声信号,由于背景在时间上的变动较大,为了保证该类背景噪声经DTX/CNG之后能拥有一个较高的主观质量,需要使用相对较短的非连续传输间隔甚至是连续的传输。又如,对于悦耳背景,由于其本身的非噪声性质,主观质量的要求相当高,因此DTX系统就需要将其进行连续的传输。对于环境背景噪声,由于其本身携带了一定的环境信息,为了确保不丢失这些信息,DTX系统也需要以较高的速度来更新SID帧。对于其它背景噪声,由于还原背景的真实面貌并非主要的目的,因此DTX系统就可以相对较慢的进行SID帧的更新。
[0089] SID帧的传输间隔分为固定传输间隔和自适应传输间隔两种。在固定传输间隔的机制下,相邻两个SID帧间的间隔是固定的,间隔的大小就取决于背景噪声的类型。在自适应传输间隔的机制下,虽然SID帧的发送是自适应于噪声变化的快慢,但也有最小传输间隔的限制。本发明实施例中,根据不同背景噪声类型可决定采用不同的最小间隔。
[0090] 如图6所示,为本发明提供的第一种通信设备的主要结构示意图,包括:VAD10、背景噪声编码装置20、语音编码器30和通信接口40,其中:
[0091] VAD10用于检测有效语音,将有声信号送入语音编码器30编码为语音帧,通信接口通过通信信道发送语音帧;将背景噪声信号送入背景噪声编码装置20,背景噪声编码装置20输出SID帧,通信接口通过通信信道发送SID帧。
[0092] 背景噪声编码装置20中,编码切换单元24根据背景噪声信号的类型切换适用的DTX单元21。
[0093] 如图7所示,为本发明实施例提供的第二种通信设备主要结构示意图,其中:背景噪声编码装置20中的编码切换单元24根据指令接收单元25的指令确定切换模式,并根据背景噪声信号的类型以及当前使用的切换模式切换适用的DTX单元21。
[0094] 参见图5所示,图6和图7所示的通信设备中的背景噪声编码装置20中还可以设置语音编码器,语音编码器完成背景噪声的全速率编码。
[0095] 如图8所示,如果利用已有的语音编码器30完成背景噪声的全速率编码,则编码切换单元24连接到语音编码器30上,将背景噪声信号送入语音编码器30中编码为全速率的语音帧并连续输出。
[0096] 采用本发明实施例提供的技术方案,需要对应每一种SID帧的编码发送方式,在SID帧中设置相应的DTX单元指示信息,DTX单元指示信息供解码端确定对应的解码重构方案。对于语音帧,由语音解码器进行解码并连续输出。
[0097] 由于背景噪声分析单元22对计算背景特征参数值的计算和各DTX单元21在编码SID帧时的部分计算相同,因此背景噪声分析单元22还可以连接各DTX单元21,将分析计算结果输出给各DTX单元21,从而部分减少DTX单元21的计算量。
[0098] 如图9所示,为本发明实施例提供的一种通信设备结构示意图,完成接收端功能的单元主要包括:背景噪声解码装置50、识别单元60、解码切换单元70、语音解码器80以及通信接口,其中:
[0099] 该背景噪声解码装置50中包括至少两个CNG单元(51、52...5n),每一个CNG单元根据一种设定的解码重构方案解码SID帧并重构为背景噪声;
[0100] 识别单元60,用于识别通过通信接口所接收的语音帧和SID帧,并进一步识别SID帧中的DTX单元指示信息;
[0101] 解码切换单元70,用于根据识别单元60的识别结果进行切换,将语音帧送入语音解密器80,将SID帧送入对应的CNG单元进行解码重构。
[0102] 其中,参阅图1所示,每一个CNG单元中包括非语音解码器,用于解码从通信信道接收的背景噪声帧;重构器,用于采用内插的方式将解码数据重构为连续的背景噪声信号,以增加收听方的舒适感。
[0103] 识别单元60首先识别接收到的编码帧是全速率编码的语音帧还是SID帧并且若是SID帧,进一步识别该SID帧中的DTX单元指示信息。在这里,SID帧的码流中应存在1或几个用于携带DTX单元指示信息的比特位,比特位的位置既可在SID帧的开头也可在末尾,或者在SID帧的其它指定位置,例如下表3或表4所示:
[0104] 表3.
[0105]比特分配(从高位到低位) 参数描述
S1 DTX单元指示信息
S2 量化预测器索引
S3-S7 一级LSF量化矢量索引
S8-S11 二级LSF量化矢量索引
S12-S16 增益(能量)
[0106] 表4.
[0107]比特分配(从高位到低位) 参数描述
S1 量化预测器索引
S2-S6 一级LSF量化矢量索引
S7-S10 二级LSF量化矢量索引
S11-S15 增益(能量)
S16-S17 DTX单元指示信息
[0108] 识别单元60中可以包括两个识别子单元,一个识别子单元用于识别接收到的编码帧是全速率编码的语音帧还是SID帧,如果识别出语音帧则通知解码切换单元70,解码切换单元将语音帧送入语音解码器80解码并连续输出;如果识别出是SID帧,则将SID帧送入另一个识别子单元进一步识别SID帧中的DTX单元指示信息。
[0109] 由于不同的背景噪声类型有不同的SID帧格式或更新机制,根据DTX单元指示信息选择适当的DTX解码方案解码SID帧,不同解码方案中中的噪声内插方法不同,最终得到恢复出的舒适噪声。
[0110] 通信设备可以即具备发送端功能,也可以具体接收端功能,图9所示结构通常和图7或图8所示结构合并设置在一个通信设备中。
[0111] 下面再以具体实施例进行详细说明。
[0112] 实施例一
[0113] 在编码端,背景噪声信号被逐帧输入背景噪声分析单元22,背景噪声分析单元22计算每一个当前信号帧的子带电平level[k,i],其中k和i分别表示是第i帧第k子带的电平并保存在内存中。子带的计算可以通过滤波器组实现也可以通过变换的方法实现。
[0114] 当信号帧积累够一定数量时,背景噪声分析单元22开始根据保存在内存中的子带电平,计算背景噪声谱波动参数spec_var[i],并在之后收到每一帧背景噪声帧时更新计算结果。
[0115] 背景噪声谱波动参数spec_var[i]的计算方法为:
[0116]
[0117] 其中N为子带的数量,L为被选为做长时平均的背景噪声信号帧数量。背景噪声谱波动参数spec_var[i]的计算也可以是基于LSF系数,即:
[0118]
[0119] 其中lsf[k,i]表示第i帧的第k个lsf系数,N为lsf系数数量,L为被选为做长时平均的背景噪声信号帧数量。
[0120] 背景噪声分析单元22将计算得到的背景噪声谱波动参数输出至背景噪声分类单元23。
[0121] 编码切换单元24根据背景噪声分类单元23输出的背景噪声类型信息为当前背景噪声帧选择对应的DTX单元。
[0122] 本实施例中,定义了两种背景类型:稳态背景噪声信号和非稳态背景噪声信号。背景噪声分类单元23通过将背景噪声谱波动参数与一个门限spec_var_thr做比较将当前背景噪声划归为稳态或非稳态中的一种。若spec_var[i]<spec_var_thr,当前背景噪声信号被归为稳态背景噪声信号,否则被归为非稳态背景噪声信号。
[0123] 本实施例中,DTX系统有两种不同的工作方案:
[0124] 方案一采用每8帧发送一个SID帧的非连续传输机制,SID帧中只包含滤波器和能量参数;
[0125] 方案二采用每3帧发送一个SID帧的非连续传输机制,SID帧中除了包含滤波器,能量参数外还增加了固定码本参数(属于激励参数)。
[0126] 当前背景噪声属于稳态类时,编码切换单元24选择工作方案一。当前背景噪声属于非稳态类时,编码切换单元24选择工作方案二。
[0127] 每种SID帧组装时在帧内设置一个DTX单元指示信息以声明该SID帧属于哪种DTX单元。本实施例中,DTX单元指示信息可以用1比特来表示,0和1分别表示DTX单元一和DTX单元二。
[0128] 在解码端,识别单元60首先根据SID帧中的DTX单元指示信息判断出该SID帧所属的DTX单元,解码切换单元70将SID帧输入对应的CNG单元50进行解码重构。其中:
[0129] 若DTX单元指示信息为0,对应的CNG单元则按照上述DTX工作方案一中的SID帧格式解码得到滤波器参数和能量参数并对其后的8个背景噪声信号帧进行内插;
[0130] 若DTX单元指示信息为1,对应的CNG单元则按照上述DTX工作方案二中的SID帧格式解码得到滤波器参数、能量参数和固定码本参数并对其后的3个背景噪声信号帧进行内插。
[0131] 实施例二
[0132] 在编码端,背景噪声信号被逐帧输入至背景噪声分析单元22,背景噪声分析单元22计算当前背景噪声信号帧的子带电平level[k,i],帧能量pow[i]和短时信噪比snr[i],并保存在内存中。其中:
[0133] 子带电平level[k,i]的计算可以通过滤波器组实现也可以通过变换的方法实现;
[0134] 帧能量的计算方式为: 其中N表示总的子带数;
[0135] 短时信噪比的计算方式为: 其中bckr_noise_pow[i]为长时背景噪声能量估计。
[0136] 当背景噪声信号帧积累够一定数量时,背景噪声分析单元22开始根据保存在内存中的短时特征参数(子带电平,帧能量,短时信噪比)计算背景噪声能量波动pow_var[i]、长时信噪比snr_long[i]、长时背景噪声能量估计bckr_noise_pow[i],并在收到每一个背景噪声信号帧时更新计算结果。
[0137] 除长时信噪比以外,其余参数计算结果的更新仅发生在当前信号帧为背景噪声信号帧时,长时信噪比的更新仅发生在当前信号帧为非背景噪声信号帧时。
[0138] 长时信噪比snr_long[i]的计算方法为:
[0139] 其中L为被选为做长时平均的非背景噪声信号帧数量。
[0140] 背景噪声能量波动pow_var[i]的计算方法为:
[0141] 其中L为被选为做长时平均的背景噪声信号帧数量。
[0142] 长时背景噪声能量估计bckr_noise_pow[i]的计算方法为:
[0143] bckr_noise_pow[i]=(1-α)*bckr_noise_pow[i-1]+α*pow[i],其中α为一个0到1间的比例因子,本实施例中取值为5%。
[0144] 背景噪声分析单元22将计算得到的背景噪声能量波动pow_var[i],长时信噪比snr_long[i]输出至背景噪声分类单元23。
[0145] 本实施例中,定义了四种背景类型:稳态大SNR背景噪声信号、稳态小SNR背景噪声信号、非稳态大SNR背景噪声信号和非稳态小SNR背景噪声信号。
[0146] 背景噪声分类单元23通过将pow_var[i]和snr_long[i]分别与一个能量波动门限pow_var_thr和一个信噪比门限snr_thr做比较,将当前背景噪声划归为4种背景噪声类型种的一类,其中:
[0147] 当pow_var[i]>pow_var_thr且snr_long>snr_thr时,当前背景为非稳态大SNR背景噪声信号;
[0148] 当pow_var[i]>pow_var_thr且snr_long<snr_thr时,当前背景为非稳态小SNR背景噪声信号;
[0149] 当pow_var[i]<pow_var_thr且snr_long>snr_thr时,当前背景为稳态大SNR背景噪声信号;
[0150] 当pow_var[i]<pow_var_thr且snr_long<snr_thr时,当前背景为稳态小SNR背景噪声信号。
[0151] 本实施例中,一共有四种不同的DTX单元,其中:
[0152] DTX单元一采用每8帧发送一个SID帧的非连续传输机制,SID帧中只包含滤波器参数和能量参数;
[0153] DTX单元二采用每8帧发送一个SID帧的非连续传输机制,SID帧中除包含滤波器参数和能量参数外还包含固定码本参数;
[0154] DTX单元三采用每3帧发送一个SID帧的非连续传输机制,SID帧中除包含滤波器参数和能量参数外还包含固定码本参数;
[0155] DTX单元四采用全速率编码的连续传输机制。
[0156] 编码切换单元24除了接收背景噪声分类单元23的背景噪声类型信息外,还与一个切换模式控制指令接口相连。切换模式控制指令有5种指示,分别表示带宽正常、带宽较多、带宽较少、带宽很多和带宽很少。
[0157] 切换模式控制指令与DTX系统的切换模式关系如下:
[0158] 当切换模式控制指令表示带宽正常时,DTX系统的切换模式为:对稳态大SNR类背景采用DTX单元一;对稳态小SNR类背景采用DTX单元二;对非稳态大SNR类背景采用DTX单元三;对非稳态小SNR类背景采用DTX单元四。
[0159] 当切换模式控制指令表示带宽较多时,DTX系统的切换模式为:对稳态大SNR类背景和稳态小SNR类背景均采用DTX单元二;对非稳态大SNR类背景和非稳态小SNR类背景均采用DTX单元四;
[0160] 当切换模式控制指令表示带宽较少时,DTX系统的切换模式为:对稳态大SNR类背景和稳态小SNR类背景均采用DTX单元一;对非稳态大SNR类背景和非稳态小SNR类背景均采用DTX单元三;
[0161] 当切换模式控制指令表示带宽很多时,DTX系统的切换模式为:对四种背景噪声类型 均采用DTX单元四;
[0162] 当切换模式控制指令表示带宽很少时,DTX系统的切换模式为:对四种背景噪声类型 均采用DTX单元一。
[0163] 每种SID帧组装时在帧内设置一个DTX单元指示信息以声明该SID帧属于哪种DTX单元。本实施例中的DTX单元指示信息可用2比特来表示,其中:00、01和10分别表示DTX单元一、DTX单元二和DTX单元三,方案四由于是全速率编码所以无需标识出来。
[0164] 在解码端,识别单元60首先根据SID帧中的DTX单元指示信息判断出该SID帧所属的DTX单元,并指示对应的CNG单元解码重构,其中:
[0165] 若DTX单元指示信息为00,则按照上述DTX工作方案一中的SID帧格式解码得到滤波器参数和能量参数并对其后的8个背景噪声信号帧进行内插;
[0166] 若DTX单元指示信息为01,则按照上述DTX工作方案二中的SID帧格式解码得到激励参数,滤波器参数和能量参数并对其后的8个背景噪声信号帧进行内插。
[0167] 若DTX单元指示信息为10,则按照上述DTX工作方案三中的SID帧格式解码得到滤波器参数、能量参数和固定码本参数并对其后的3个背景噪声信号帧进行内插。
[0168] 本领域技术人员可以灵活根据信号特征参数划分背景噪声类型,并设定切换模式,这里不再一一列举。
[0169] 综上所述,本发明实施例提供一种编码方法,包括:
[0170] 获取待发送背景噪声信号的至少一个信号特征参数值;
[0171] 根据所述至少一个信号特征参数值确定背景噪声类型;
[0172] 根据所述背景噪声类型选择一种DTX机制将背景噪声信号编码为包含DTX机制指示信息的SID帧并非连续发送,其中每一种DTX机制中的SID帧编码方式和/或SID帧非连续发送方式不相同。
[0173] 进一步,所述编码方法还包括:设定不同的DTX机制选择模式,即不同的切换模式,任意两个DTX机制选择模式之间至少有一个背景噪声类型对应的DTX机制不相同;并根据选定的DTX机制选择模式,为各背景噪声类型确定对应的DTX机制。
[0174] 更近一步,所述方法还包括:当所述至少一个信号特征参数值为的设定值时,将背景噪声信号编码为全速率的语音帧并连续发送。
[0175] 其中,信号特征参数值包括如下之一或任意组合:长时SNR、背景噪声估计电平、背景噪声能量波动估计、背景噪声谱波动估计和背景噪声波动频率。
[0176] 本发明实施例还提供一种对对应的SID帧进行解码的方法,包括:
[0177] 识别SID帧中的DTX机制指示信息,其中每一种DTX机制中的SID帧编码方式不相同;
[0178] 根据所述DTX机制指示信息,采用对应的解码方式解码SID帧,并重构为背景噪声信号。
[0179] 应用本发明实施例提出的技术方案,可以根据背景噪声的不同类型以及通信系统的实际状况,采用不同的SID帧编码方法和非连续传输机制,在合理利用通信系统实际资源的情况下自适应于不同类型背景噪声所要求的编码精度和时间分辨力,来达到在合理利用信道资源的前提下在解码端高质量的提供各种类型背景噪声的目的。
[0180] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。