回声抑制方法及回声抑制设备转让专利

申请号 : CN201010235614.X

文献号 : CN101964670B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘恩彩

申请人 : 雅马哈株式会社

摘要 :

本发明公开了回声抑制方法及回声抑制设备,在该回声抑制设备中,自适应滤波器估计近端的回声路径,并产生从远端接收的接收信号的伪回声信号。减法器从包括接收信号的回声信号、近端声音和背景噪声的近端信号中减去伪回声信号,从而产生回声消除信号。背景噪声估计单元估计背景噪声的谱。非线性处理单元执行减谱来从回声消除信号的谱中减去估计的背景噪声的谱,并响应于减谱结果来控制回声消除信号的谱的增益,从而得到传输到远端的传输信号的谱。阈值计算单元计算用于确定回声消除信号中是否存在残留回声的阈值。非线性处理单元比较减谱结果和阈值,随后,在减谱结果高于阈值时以高增益控制回声消除信号的谱,并在减谱结果不高于阈值时以低增益控制回声消除信号的谱。

权利要求 :

1.一种回声抑制设备,包括:

自适应滤波器单元,其估计近端的回声路径,并产生从远端接收的接收信号的伪回声信号;

减法器,其从包括接收信号的回声信号、近端声音和背景噪声的近端信号中减去伪回声信号,并产生回声消除信号作为减法的结果;

背景噪声估计单元,其估计背景噪声的谱;

非线性处理单元,其执行减谱来从回声消除信号的谱中减去估计的背景噪声的谱,并响应于减谱结果来针对回声消除信号的谱的每个频带来控制回声消除信号的谱的增益,从而得到传输到远端的传输信号的谱;和阈值计算单元,其针对每个频带计算阈值,所述阈值用于确定回声消除信号中是否存在残留回声,其中非线性处理单元将减谱结果与每个频带中的阈值相比较,随后,在减谱结果高于阈值的一个频带中以被设置为固定值的高增益来控制回声消除信号的谱,并在减谱结果不高于阈值的另一频带中以具有可变值的低增益来控制回声消除信号的谱,所述可变值由下述表达式表示:预定增益×(估计的背景噪声的谱÷回声消除信号的谱),并且所述低增益被设置为低于所述高增益。

2.根据权利要求1的回声抑制设备,其中非线性处理单元包括:第一计算器,其从回声消除信号的谱中减去估计的背景噪声的谱,以提供减谱结果;第二计算器,其根据所述表达式计算低增益的可变值;选择器,其选择高增益的固定值和低增益的可变值中的一个;和放大器,其以固定值利可变值中所选出的那一个值来放大回声消除信号的谱。

3.根据权利要求2的回声抑制设备,其中非线性处理单元包括对第二计算器计算的可变值进行平均或平滑的另一个单元,从而放大器以平均或平滑后的可变值来放大回声消除信号。

4.根据权利要求1至3中任一个的回声抑制设备,还包括噪声抑制单元,该噪声抑制单元根据非线性处理单元的输出信号来估计在非线性处理单元的输出信号中包含的噪声信号,并且对包含在输出信号中的噪声信号进行抑制以向远端提供传输信号。

5.根据权利要求1至4中任一个的回声抑制设备,其中阈值计算单元通过将自适应滤波器单元中执行的卷积计算的结果乘以预定系数来产生针对每个频带的阈值,所述卷积计算通过在频域中将接收信号与自适应滤波器单元的滤波系数进行卷积来执行。

6.一种回声抑制方法,包括:

自适应滤波步骤,估计近端的回声路径并产生从远端接收的接收信号的伪回声信号;

减法步骤,从包括接收信号的回声信号、近端声音和背景噪声的近端信号中减去伪回声信号,并产生回声消除信号作为减法的结果;

背景噪声估计步骤,估计背景噪声的谱;

非线性处现步骤,执行减谱来从回声消除信号的谱中减去估计的背景噪声的谱,并响应于减谱结果来针对回声消除信号的谱的每个频带来控制回声消除信号的谱的增益,从而得到传输到远端的传输信号的谱;和阈值计算步骤,针对每个频带计算阈值,所述阈值用于确定回声消除信号中是否存在残留回声,其中非线性处理步骤将减谱结果与每个频带中的阈值相比较,随后,在减谱结果高于阈值的一个频带中以被设置为固定值的高增益来控制回声消除信号的谱,并在减谱结果不高于阈值的另一频带中以具有可变值的低增益来控制回声消除信号的谱,所述可变值由下述表达式表示:预定增益×(估计的背景噪声的谱÷回声消除信号的谱),并且所述低增益被设置为低于所述高增益。

说明书 :

回声抑制方法及回声抑制设备

技术领域

[0001] 本发明涉及一种用于移动电话、电视电话系统、语音会议系统、电话线等的回声抑制方法和设备,更具体地涉及一种用于在即使背景噪声电平很高的情况下也可在回声消除处理之后将要执行的非线性处理期间准确地抑制残留回声的方法和设备。

背景技术

[0002] 在下面的专利参考文献1和2中已经披露了传统的回声抑制设备。图2中示出专利参考文献1的回声抑制设备。图2中所示的回声抑制设备根据传输信号能量M和接收信号能量D估计回声返回损失R,并利用等式“E=D×R”来计算一定时刻的回声信号的估计的能量E。如果传输信号能量M高于估计的能量E,则确定该传输信号是近端语音信号,于是开关10接通,从而传输信号被传输到远端。如果传输信号能量M不高于估计的能量E,则确定该传输信号是回声,于是开关10断开,从而回声信号不被传输到远端。
[0003] 图3中示出专利参考文献2的回声抑制设备。自适应滤波器单元12利用自适应滤波器估计回声路径的脉冲响应(传递函数),根据估计的脉冲响应产生伪回声信号,从传输信号中减去伪回声信号,从而执行回声消除。未被自适应滤波器单元12消除的残留回声通过非线性处理(NLP)衰减单元14衰减。即,NLP衰减单元14对通过自适应滤波器单元12进行了回声消除之后产生的信号(下文称为“回声消除信号”)分配特定的损失(例如
30dB的损失值)。NLP衰减单元14以不产生回声时没有损失(例如损失值为0dB)的方式进行操作。通过上述操作,在将损失分配给所述信号的情况下,可以将残留回声衰减到用户不可能听到该残留回声的特定电平。为了减小NLP操作导致的背景噪声的不连续性,将与背景噪声具有相同电平和相同频率成分的伪背景噪声插入传输信号中,并将所得传输信号传输到远端。
[0004] [专利参考文献1]公开号为昭59-80029的日本专利申请公开
[0005] [专利参考文献2]公开号为2000-138619的日本专利申请公开
[0006] [非专利参考文献1]J.-S.Soo和K.Pang发表于1990年2月的IEEE Trans.Acoust.Speech signal Process.,vol.ASSP-38,No.2,pp.373-376 上 的“Multidelay block frequency domain adaptivefilter”。
[0007] [非专 利参 考文 献2]Doblinger G.发 表于1995年 Proc.Eurospeech,2,pp.1513-1516 上 的“Computationally efficientspeech enhancement by spectral minima tracking in subbands”。
[0008] 专利参考文献1中披露的回声抑制设备中,在传输信号中包含了近端背景噪声的情况下,根据开关10的接通/断开操作来传输或阻止背景噪声,从而远端背景噪声变成不自然的断断续续,从而会大大降低通话质量或讲话质量。
[0009] 专利参考文献2中披露的回声抑制设备将伪背景噪声插入被NLP操作衰减的信号中,从而可以解决背景噪声的传输/阻止所导致的问题。然而,事实上,利用伪背景噪声不可能充分再现真实背景噪声,从而伪背景噪声不可能完全解决由NLP操作导致的背景噪声声音质量不自然的问题。
[0010] 另外,专利参考文献1和2中披露的回声抑制设备在确定是否传输或阻止(或衰减)所有传输信号时不考虑背景噪声的影响。例如,在专利参考文献1披露的回声抑制设备的情况下,如果包含在传输信号中的背景噪声处于高电平,则尽管传输信号不是近端语音而是残留回声信号,开关10也接通,从而增加了不作任何改变就将残留回声信号传输到远端的可能性。

发明内容

[0011] 已经作出本发明来克服上述问题,本发明的一个目的是提供用于即使在背景噪声电平很高时也能准确抑制残留回声的回声抑制设备和方法。
[0012] 为了解决上述问题,根据本发明的回声抑制设备包括:自适应滤波器单元,其估计近端的回声路径,并产生从远端接收的接收信号的伪回声信号;减法器,其从包括接收信号的回声信号、近端声音和背景噪声的近端信号中减去伪回声信号,并产生回声消除信号作为减法的结果;背景噪声估计单元,其估计背景噪声的谱;非线性处理单元,其执行减谱来从回声消除信号的谱中减去估计的背景噪声的谱,并响应于减谱结果来针对回声消除信号的谱的每个频带(例如,通过离散傅立叶变换划分的每个频带)来控制回声消除信号的谱的增益,从而得到传输到远端的传输信号的谱;和阈值计算单元,其针对每个频带计算阈值,所述阈值用于确定回声消除信号中是否存在残留回声,其中非线性处理单元将减谱结果与每个频带中的阈值相比较,随后,在减谱结果高于阈值的一个频带中以高增益来控制回声消除信号的谱,并在减谱结果不高于阈值的另一频带中以低增益来控制回声消除信号的谱,所述低增益被设置为低于所述高增益。
[0013] 根据本发明实施例的回声抑制设备估计背景噪声的谱,从回声消除信号谱中减去估计的背景噪声的谱,并响应于减谱结果在每个频带处执行回声消除信号谱的增益控制,从而非线性处理单元可以执行增益控制,而不会受到背景噪声的影响。阈值计算单元对每个频带计算阈值,以确定回声消除信号中是否存在残留回声。非线性处理单元比较减谱结果和每个频带中的阈值。与减谱结果高于阈值的特定频带相关联,非线性处理单元确定回声消除信号是近端讲话者声音,从而利用相对高的增益来控制与该特定频带相关的回声消除信号谱。与减谱结果不高于阈值的另一特定频带相关联,非线性处理单元确定回声消除信号是残留回声,从而利用相对低的增益来控制回声消除信号谱。结果,即使背景噪声处于高电平,也能够抑制残留回声。
[0014] 在一个优选形式中,阈值计算单元通过将自适应滤波器单元中执行的卷积计算的结果乘以预定系数来产生每个频带的阈值,所述卷积计算通过在频域中将接收信号与自适应滤波器单元的滤波系数进行卷积来执行。结果,能够有效利用自适应滤波处理的卷积运算结果,从而可以简化阈值计算处理。
[0015] 在本发明的一个优选形式中,非线性处理单元在减谱结果高于阈值时以被设置为固定值(例如值1)的高增益来控制回声消除信号的谱,并且在减谱结果不高于阈值时以具有可变值的低增益来控制回声消除信号的谱,所述可变值由表达式[预定增益×(估计的背景噪声的谱÷回声消除信号的谱)]来表示。
[0016] 如果减谱结果不高于阈值,则抑制残留回声以使得背景噪声理想地以其本身的原始电平输出。结果,不会产生由增益控制导致的背景噪声的音量波动或间断,残留回声被抑制,因此防止了通话质量下降。另外,输出了与实际背景噪声非常相似的背景噪声。因此,本发明的实施例能够使在远端听到的背景噪声的声音质量与采用人造伪背景噪声来处理和输出声音的其它情况相比更为自然。
[0017] 所述回声抑制设备还包括噪声抑制单元,该噪声抑制单元根据非线性处理单元的输出信号来估计在非线性处理单元的输出信号中包含的噪声信号,并且对包含在输出信号中的噪声信号进行抑制以向远端提供传输信号。
[0018] 因此,可以将经过了噪声抑制之后的信号传输到远端。在这种情况下,由于非线性处理单元在减谱结果不高于阈值时利用由表达式[预定增益×(估计的背景噪声谱÷回声消除信号谱)]表示的增益来控制回声消除信号,因此抑制了由增益控制引起的音量波动。结果,在后续噪声抑制处理中,可以更准确地估计噪声信号,从而可以稳定地抑制噪声。
[0019] 在本发明的实施例中,非线性处理单元包括:第一计算器,其从回声消除信号的谱中减去估计的背景噪声的谱,以提供减谱结果;第二计算器,其根据所述表达式计算低增益的可变值;选择器,其选择高增益的固定值和低增益的可变值中之一;和放大器,其以固定值和可变值中被选中的那一个值来放大回声消除信号的谱。非线性处理单元包括对第二计算器计算的可变值进行平均或平滑的另一个单元,从而放大器以平均或平滑后的可变值来放大回声消除信号。
[0020] 结果,减小了由突然的增益变化产生的声音调制,从而可以提高远端的声音质量。

附图说明

[0021] 图1是说明根据本发明实施例的用于语音会议系统中的近端系统的示意框图。
[0022] 图2是说明传统回声抑制设备的框图。
[0023] 图3是说明另一传统回声抑制设备的框图。
[0024] 图4是说明图1所示自适应滤波器单元和阈值计算单元的示例配置的框图。
[0025] 图5是说明图1所示非线性处理(NLP)单元的处理细节的功能框图。
[0026] 图6是说明在将非线性处理(NLP)单元配置为图4所示的情况下图1所示非线性处理(NLP)单元和噪声抑制单元的操作的操作波形示图。

具体实施方式

[0027] 现在将参考附图描述本发明的实施例。每个图中相应的部件由相似参考数字代表,重复的描述将省略。图1是说明根据本发明实施例的用于语音会议系统中的近端的配置的示意框图。参考图1,从远端提供并由近端接收的声音信号x(n)(时域采样信号)被数字/模拟(D/A)转换器转换为模拟信号,从而通过扬声器20再现该模拟信号。麦克风22接收近端扬声器的语音信号、通过扬声器单元20再现的另一语音信号的声音回声以及近端背景噪声。麦克风22的声音采集信号由模拟/数字(A/D)转换器转换为时域采样信号d(n)。在近端对时域采样信号d(n)执行预定信号处理,将结果所得信号传输到远端。
[0028] 下面将参考附图描述要对麦克风22的声音采集信号d(n)执行的信号处理。紧接的是自适应滤波器单元24估计回声路径的脉冲响应(传递函数),在估计的脉冲响应与接收信号x(n)之间执行卷积运算,从而产生伪回声信号y(n)。可以对自适应滤波器单元24采用公知的自适应算法。例如,可以采用在非专利参考文献1中示出的多延迟分块频域自适应滤波器(multidelay block frequency domainadaptive filter,MDF)、无约束多延迟分块频域自适应滤波器(unconstrained multidelay block frequency domain adaptivefilter,UMDF)、和可选择无约束多延迟分块频域自适应滤波器(alternative unconstrained multidelay block frequency domainadaptive filter,AUMDF)。减法器26从麦克风信号d(n)中减去伪回声信号y(n),从而消除了麦克风信号d(n)中包含的回声,并产生回声消除信号e(n)。在自适应滤波器单元24能够正确估计回声路径的脉冲响应的情况下,伪回声信号y(n)变得完全与真实回声信号相同,从而从麦克风信号d(n)中完全去除了回声信号。然而,事实上,在麦克风信号d(n)中可能存在干扰信号,比如近端扬声器语音信号(即近端语音信号)和背景噪声,从而自适应滤波器单元24难以完全估计出回声路径的脉冲响应,因此在回声消除信号e(n)中包含了残留回声(即消除处理之后剩下的回声)。因此,回声消除信号e(n)包括近端扬声器语音信号、近端背景噪声和残留回声。
[0029] 快速傅立叶变换(FFT)单元28对回声消除信号e(n)执行FFT处理,从而将FFT处理后的结果信号转换为频域信号。背景噪声估计单元30从FFT单元28接收回声消除信号的频谱E(k)(复数),并估计频域中的近端背景噪声的幅谱N(k)(实数)。在这种情况下,幅谱N(k)包含在回声消除信号E(k)的绝对值(实数)幅谱|E(k)|中。已经提出了关于背景噪声估计方法的各种算法。例如,非专利参考文献2中披露的方法可以用作代表性的背景噪声估计方法。
[0030] 阈值计算单元32利用自适应滤波器单元24的中间结果(频域的卷积运算结果),从而计算在由FFT处理划分的每个频带中的非线性处理的阈值TH(k)(残留回声估计能量(幅谱)(实数))。在将非专利参考文献1中所示的组成部件用作自适应滤波器单元24的情况下,可以将阈值TH(k)设置成通过下面等式1和2计算的特定值。
[0031] [等式1]
[0032] TH(k)=γ|Y(k)|
[0033] 在等式1中,Y(k)是频域中接收信号x(n)与自适应滤波器系数的卷积运算结果。
[0034] [等式2]
[0035]
[0036] 在等式1中,|Y(k)|是卷积运算结果Y(k)的绝对值(实数),并代表幅谱。“γ”可以被设置为比残留回声与绝对值|Y(k)|的比值(即残留回声÷|Y(k)|)略高的常数或者预定系数,从而可以将阈值TH(k)设置为略高于残留回声的值。例如,假设通过上述表达式“残留回声÷|Y(k)|”得到的结果值是“0.1”,“γ”可以被设置为“γ=0.125~0.15”,从而阈值TH(k)可以被设置为略高于残留回声,并且下面将描述的非线性处理单元34可以抑制残留回声。另外,参考等式2,X(m,k)是在接收信号x(n)的第m个块(用于在时间轴方向上划分接收信号x(n)以执行FFT处理的一个部分。FFT帧)的第k个频率窗口(frequency bin)处得到的快速傅立叶变换(FFT)结果,并且W(m,k)是在接收信号x(n)的第m个块的第k个频率窗口处的自适应滤波系数,“M”是块的总数量。并且,不仅可以通过在等式1中示出的上述方法,还可以通过将专利参考文献1中所示的回声信号估计能量E乘以适当系数的另一方法来计算阈值TH(k),或者还可以通过根据需要的其它可用方法来计算阈值TH(k)。
[0037] 在利用非专利参考文献1所示方法作为自适应滤波器单元24的算法并且阈值计算单元32利用自适应滤波器单元24的中间结果来执行等式1和2的计算处理的情况下,可以如图4所示来配置自适应滤波器单元24和阈值计算单元32。参考图4,在自适应滤波器单元24中,FFT单元40对从远端提供的声音信号x(n)(时域的采样信号)执行FFT处理以将该声音信号x(n)转换成频域信号。在时间轴方向上将FFT处理后的信号X(m,k)逐块地延迟一个块的延迟(42-1、42-2、...、42-n-1)。在系数单元(44-1、44-2、...、44-n)中,乘以自适应滤波系数,并通过加法器46将乘法结果相加,从而对声音信号x(n)的第k个频带施加了卷积运算。由IFFT单元48对卷积运算结果Y(k)进行IFFT处理(逆FFT处理),从而返回到时域信号。剪切部分50从接收自IFFT单元48的时域采样信号中剪切掉不需要的后一半部分,随后将前一半作为伪回声信号y(n)输出。减法器26如上所述从麦克风信号d(n)减去伪回声信号y(n),消除麦克风信号d(n)中包含的回声,从而产生回声消除信号e(n)。
[0038] 阈值计算单元32接收作为自适应滤波器单元24的中间结果的卷积运算结果Y(k),绝对值单元52将接收的结果值变为绝对值,从而得出|Y(k)|。乘法器54将值|Y(k)|乘以常数(γ),来计算等式1的阈值TH(k)。
[0039] 在图1中,非线性处理单元(残留回声抑制处理器)34接收背景噪声幅谱H(k)和阈值TH(k),保留每个频带的回声消除信号幅谱|E(k)|中包含的背景噪声成分N(k),并同时衰减(抑制)残留回声成分(残留回声幅谱)。噪声抑制单元36从非线性处理单元34接收具有衰减的残留回声成分的回声消除信号谱(E’(k)),利用接收到回声消除信号谱(E’(k))估计噪声成分(噪声信号幅谱),并抑制噪声成分。背景噪声成分N(k)理论上没有任何改变地保留在噪声抑制单元36的输入信号中,并且不存在由残留回声抑制引起的背景噪声成分N(k)的音量波动,从而噪声抑制单元36以高准确水平估计噪声成分,因此稳定地执行噪声抑制。该噪声抑制处理可以利用公知方法。例如,可以利用减谱法或基于维纳滤波器的方案。噪声抑制单元36的输出信号具有抑制的残留回声和抑制的背景噪声,由IFFT单元38进行IFFT处理,返回到时域信号,并随后传输到远端。另外,可以适当地将人造伪背景噪声添加到上述传输信号中,并且传输添加后所得的信号。
[0040] 图5中示出非线性处理单元34的处理。该处理可以在由FFT划分的每个频带中执行。计算单元60(第一计算器)接收回声消除信号幅谱|E(k)|和背景噪声幅谱N(k),对接收的谱执行减谱,计算|E(k)|-αN(k)的结果。结果,去除了包含在回声消除信号幅谱|E(k)|中的背景噪声幅谱N(k)。在这种情况下,α是减法系数,并由图1所示背景噪声估计单元30中使用的噪声估计算法的估计准确度进行调节。例如,在噪声估计算法倾向于高估背景噪声幅谱N(k)的情况下,α由“0<α<1”代表。否则,如果噪声估计算法倾向于低估背景噪声幅谱N(k),则α由“α>1”代表。如果噪声估计算法可以准确估计背景噪声幅谱N(k),则α正好被设置为α=1。比较器62将减谱结果(|E(k)|-αN(k))与每个频带k的阈值TH(k)进行比较,并确定减谱结果|E(k)|-αN(k)是由“|E(k)|-αN(k)>TH(k)”代表还是由“|E(k)|-αN(k)≤TH(k)”代表。计算单元64(第二计算器)计算背景噪声谱N(K)与回声消除信号幅谱|E(k)|之比(βN(k)÷|E(k)|)。在该情况下,β是用于调节非线性处理单元34的残留回声抑制的程度或深度的参数,其可以被统计性地预设为实验确定的值,或者还可以建立在外部输入的基础上。如果需要,在采用上述回声抑制设备的情况下还可以由用户可变地建立β。例如,β可以被设置为“1”。
[0041] 回声消除信号谱E(k)的增益可由可变衰减单元(可变放大器)66控制。增益控制器(增益选择器)68响应于比较器62和计算单元64的输出信号利用以下等式3a和3b来可切换地控制可变衰减单元66的增益G(k)。
[0042] [等式3a]
[0043] G(k)=1(如果|E(k)|-αN(k)>TH(k))
[0044] [等式3b]
[0045] G(k)=βN(K)÷|E(k)|(如果|E(k)|-αN(k)≤TH(k))
[0046] 在等式3a和3b中,G(k)是赋予第k个频率窗口的增益(残留回声抑制增益),|E(k)|是在第k个频率窗口处的非线性处理的输入信号幅谱(回声消除信号幅谱),N(k)是在第k个频率窗口处估计的背景噪声幅谱,TH(k)是估计的残留回声能量(幅谱)并代表非线性处理的阈值,α是减法系数,β是用于调节残留回声抑制的程度或者深度的参数。
[0047] 在等式3a中,在减谱结果值(|E(k)|-αN(k))高于阈值TH(k)的情况下,回声消除信号e(n)被认为是近端讲话者的语音或声音,从而回声消除信号谱E(k)不经过任何改变就通过可变衰减单元66。在等式3b中,在减谱结果值(|E(k)|-αN(k))低于阈值TH(k)的情况下,回声消除信号e(n)被认为是残留回声,从而回声消除信号谱E(k)被衰减并输出。在等式3b中,在回声消除信号谱E(k)被衰减并输出的情况下,增益G(k)被计算为背景噪声幅谱N(k)和回声消除信号幅谱之比(βN(K)÷|E(k)|),从而可以将回声消除信号E(k)抑制到背景噪声幅谱N(k)的电平。即,其中回声消除信号谱E(k)被衰减的信号谱E’(k)由下面的表达式表示。
[0048] [表达式]
[0049] E’(k)=E(k)×(βN(K)÷|E(k)|)
[0050] =E(k)÷|E(k)|×βN(K)
[0051] 在上面的表达式中,(E(k)÷|E(k)|)表明幅度设置为1并且相位等于回声消除信号E(k)的相位,从而衰减信号谱E’(k)示出背景噪声幅谱N(k)的幅度没有改变,并且其相位设置为回声消除信号E(k)的相位。因此,不管是由阈值TH(k)引起的增益G(k)转换还是由比值(βN(K)÷|E(k)|)引起的增益G(k)改变,背景噪声幅谱N(k)都没有任何改变地被输出,从而不产生背景噪声的音量波动或间断,同时可以抑制残留回声。
[0052] 可变衰减单元66输出其中的残留回声被增益G(k)的控制所抑制的残留回声抑制信号谱E’(k),从而残留回声抑制信号谱E’(k)的非线性处理单元34的输出信号成为非线性处理单元34的输出信号。为了通过减小由增益G(k)的突然改变而产生的调制来提高近端的声音质量,将平均或平滑处理单元70布置在增益控制器68的输出端,如图5的虚线所示。通过等式3a和3b计算的增益G(k)可以在时间轴方向和/或频率轴方向上进行平均处理或平滑处理。
[0053] 在专利参考文献1中示出的非线性处理引起的增益可以由下列等式4a和4b表示。
[0054] [等式4a]
[0055] G(k)=1(如果|E(k)|>TH(k))
[0056] [等式4b]
[0057] G(k)=0(如果|E(k)|≤TH(k))
[0058] 如果在近端中没有背景噪声,则可以利用专利参考文献1中示出的技术方法而没有任何问题。如果在近端中存在背景噪声,则专利参考文献1中示出的方法在判定一个信号是近端讲话者的语音还是回声时具有很高可能性会产生由于近端背景噪声而导致的误操作,从而传输没有得到抑制的回声的可能性非常高。按照专利参考文献1中示出的方法,增益G(k)仅被设置为“1”或“0”,从而传输到远端的背景噪声变得间断,从而从远端产生的声音非常不中听。相反,在本发明实施例中使用的方法估计近端背景噪声,并根据没有背景噪声的回声消除信号幅谱来确定声音信号是近端讲话者的声音还是残留回声,由此避免了目标信号受到近端背景噪声的影响。即使在近端背景噪声处于高电平时,本发明的实施例也不会导致误操作,从而可以高准确度地抑制残留回声。非线性处理单元34即使在其确定回声消除信号为残留回声并且残留回声被抑制时也输出原始电平的背景噪声。结果,不会产生背景噪声的音量波动或间断,同时可以抑制残留回声。因此,在后续阶段的噪声抑制单元36处可以高准确度地估计噪声信号,从而可以稳定地执行噪声抑制。
[0059] 图6示出了当将非线性处理单元34配置为如图4所示时非线性处理单元34和噪声抑制单元36的操作。为描述方便,图6中所示各个信号由时域波形代表。图6(a)示出回声消除信号幅谱|E(k)|、包含在回声消除信号E(k)中的背景噪声幅谱N(k)、和阈值TH(k)。图6(a)示出背景噪声幅谱N(k)处于高电平,回声消除信号幅谱|E(k)|与阈值TH(k)之间的比较不能识别没有近端讲话者声音的特定时间段,从而该特定时间段中相应信号的残留回声没有受到抑制,并没有任何抑制地传输到远端。
[0060] 图6(b)不仅示出从第一计算单元60产生的幅度减谱结果(|E(k)|-αN(k)),还示出阈值TH(k)。在图6(b)中,将从回声消除信号幅谱|E(k)|减去背景噪声幅谱N(k)时得到的信号与阈值TH(k)比较,从而正确识别处没有近端讲话者声音的时间段。
[0061] 图6(c)示出由图6(b)的比较结果控制的可变衰减单元66。在图6(c)中,在具有近端讲话者声音的部分中将增益G(k)设置为“1”,并在没有近端讲话者声音的另一部分中将增益G(k)设置为“βN(k)÷|E(k)|”。
[0062] 图6(d)示出在增益控制下的可变衰减单元66的输出信号的幅谱|E’(k)|。在图6(d)中,阴影部分代表幅谱|E’(k)|中包含的背景噪声的幅谱N(k)。在具有近端讲话者声音的部分中,回声消除信号E(k)没有任何改变地通过可变衰减单元66。在没有近端讲话者声音的另一部分中,残留回声被抑制,同时背景噪声没有被抑制并从可变衰减单元66输出。因此,尽管增益改换或波动,还是没有背景噪声的音量波动。图6(e)示出噪声抑制单元36的输出信号(见图1)的幅谱。
[0063] 在图6(e)中,背景噪声N(k)在整个部分中受到抑制,从而仅输出近端讲话者声音。抑制了其中的残留回声和背景噪声的近端讲话者声音被IFFT单元38进行IFFT处理,并返回到时域信号,并且将该时域信号传输到远端。
[0064] (其它实施例)
[0065] 虽然上述实施例利用了非线性处理单元34的计算处理中的幅谱,然而应当注意的是还可以使用功率谱。在利用功率谱的情况下,利用下面的等式1’示出的阈值TH’(k)来替代等式1中示出的上述阈值TH(k)。
[0066] [等式1’]
[0067] TH’(k)=γ’|Y(k)|2
[0068] 在等式1’中,γ’是略低于残留回声与|Y(k)|的值之比的常数或预定系数,并通过实验确定。Y(k)由等式2计算。另外,在利用功率谱的情况下,可以通过下面的等式3a’和3b’来控制可变衰减单元66的增益G(k)。
[0069] [等式3a’]
[0070] G(k)=1(在|E(k)|2-α|N(k)|2>TH’(k)的情况下)
[0071] [等式3b’]
[0072] G(k)=β(|N(k)|2÷|E(k)|2)1/2(在|E(k)|2-α|N(k)|2≤TH’(k)的情况下)[0073] 在等式3a和3b中,|E(k)|2是在第k个频率窗口处的非线性处理的输入信号功率谱(回声消除信号功率谱),N(k)是在第k个频率窗口处估计的背景噪声功率谱。
[0074] 按照本发明的上述实施例,虽然背景噪声估计单元30已经根据回声消除之后得出的信号e(n)估计了背景噪声,然而应当注意的是背景噪声估计单元30还可以根据在回声消除之前得出的信号d(n)来估计背景噪声。另外,虽然上述实施例操作使得非线性处理单元34的输出信号受到噪声抑制单元36的噪声抑制并随后被传输到远端,然而应当注意的是,非线性处理单元34的输出信号在没有进行噪声抑制的情况下也可以被传输到远端。