噪音抑制装置转让专利

申请号 : CN201280067805.7

文献号 : CN104067339B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 古田训

申请人 : 三菱电机株式会社

摘要 :

概率密度函数控制部(7)求出与输入信号是像声音还是像噪音的样式对应的概率密度函数、即与声音区间以及噪音区间中的声音信号的分布状态适合的概率密度函数,抑制量计算部(8)使用该概率密度函数来计算谱抑制量。

权利要求 :

1.一种噪音抑制装置,将时域的输入信号变换为作为频域的信号的功率谱,使用所述功率谱以及根据所述输入信号另行推测出的推测噪音谱来计算用于抑制噪音的抑制量,根据所述抑制量来进行所述功率谱的振幅抑制,并将该振幅抑制了的功率谱变换到时域而得到噪音抑制信号,其特征在于,具备概率密度函数控制部,该概率密度函数控制部分析所述输入信号,计算表示所述输入信号是像声音还是像噪音的第一指标,并根据该第一指标来控制对声音的分布状态进行定义的概率密度函数,除了所述功率谱和所述噪音推测谱以外,还使用所述概率密度函数来计算所述抑制量。

2.根据权利要求1所述的噪音抑制装置,其特征在于,所述概率密度函数控制部具有:

SN比计算部,推测所述输入信号的按频率的SN比;以及控制系数计算部,将由所述SN比计算部推测出的SN比用于所述第一指标,控制所述概率密度函数。

3.根据权利要求2所述的噪音抑制装置,其特征在于,所述概率密度函数控制部具有加权SN比计算部,该加权SN比计算部根据表示所述输入信号是像声音还是像噪音的第二指标,对所述按频率的SN比进行加权,所述控制系数计算部将由所述加权SN比计算部计算出的加权SN比用于所述第一指标,控制所述概率密度函数。

4.根据权利要求3所述的噪音抑制装置,其特征在于,所述第二指标是使用所述输入信号的功率谱和推测噪音谱计算出的SN比、根据所述输入信号的功率谱所判定的声音区间和噪音区间的判定结果、以及对所述输入信号中的声音的谐波构造进行分析而得到的分析结果中的至少一个。

5.根据权利要求3所述的噪音抑制装置,其特征在于,所述概率密度函数控制部具有权重系数计算部,该权重系数计算部根据所述输入信号的样式,控制所述加权SN比计算部的加权的强度。

6.根据权利要求3所述的噪音抑制装置,其特征在于,所述概率密度函数控制部具有权重系数计算部,该权重系数计算部按频率来控制所述加权SN比计算部的加权的强度。

7.根据权利要求1所述的噪音抑制装置,其特征在于,所述概率密度函数控制部具有:

周期分量推测部,分析所述输入信号中的声音的谐波构造;以及控制系数计算部,将所述周期分量推测部的分析结果用于所述第一指标,控制所述概率密度函数。

8.根据权利要求4所述的噪音抑制装置,其特征在于,所述第二指标是使用所述输入信号中的、SN比高于规定的阈值的频带的信号分量而计算出的。

9.根据权利要求3所述的噪音抑制装置,其特征在于,所述概率密度函数控制部具有周期分量推测部,该周期分量推测部分析所述输入信号中的声音的谐波构造,所述加权SN比计算部将所述周期分量推测部的分析结果用于所述第二指标,进行以增大所述输入信号的功率谱的峰值部分的SN比的方式加权、以减小该功率谱的谷值部分的SN比的方式加权中的至少某一方。

10.根据权利要求2所述的噪音抑制装置,其特征在于,所述控制系数计算部使用规定的频带的平均SN比,在该频带中总体地控制所述概率密度函数。

说明书 :

噪音抑制装置

技术领域

[0001] 本发明涉及对重叠于输入信号的背景噪音进行抑制的噪音抑制装置。

背景技术

[0002] 伴随近年来的数字信号处理技术的发展,利用便携电话进行的室外的声音通话、汽车内的免提声音通话、以及基于声音识别的免提操作得到广泛普及。实现这些功能的装置在高噪音环境下使用的情况较多,所以背景噪音也与声音一起被输入到麦克风,导致通话声音的劣化以及声音识别率的降低等。因此,为了实现舒适的声音通话以及高精度的声音识别,需要对混入到输入信号中的背景噪音进行抑制的噪音抑制装置。
[0003] 作为以往的噪音抑制装置,例如有如下方法:将时域的输入信号变换为作为频域的信号的功率谱,使用输入信号的功率谱以及根据输入信号而另行推测出的推测噪音谱,假设为声音谱遵从超高斯分布(super Gaussian distribution)、且噪音谱遵从高斯分布,通过MAP(后验概率最大化)推测法来计算用于抑制噪音的抑制量,使用所得到的抑制量而对输入信号进行功率谱的振幅抑制,将抑制了振幅的功率谱和输入信号的相位谱变换到时域而得到噪音抑制信号(例如,参照非专利文献1)。
[0004] 而且,作为现有技术,公开了例如专利文献1。在该以往的噪音抑制装置中,对利用统计分布模型来近似频率谱中包含的声音谱的实部以及虚部的每一个的出现概率从而导出的声音谱的推测式进行偏微分而设为零,并且依照把将相位谱设为φ时的|cosφ|+|sinφ|近似为常数的运算式来计算噪音抑制量,从而实现了高品质的噪音抑制装置。
[0005] 另外,作为其他现有技术,例如有如下方法:利用组合了多个概率密度函数的混合分布模型来近似声音谱和噪音谱的出现概率,从而进行高精度的噪音抑制(例如,参照非专利文献2)。
[0006] 专利文献1:日本特开2005-202222号公报(第6~11页、图1)
[0007] 非专利文献1:T.Lotter,P.Vary,“Speech Enhancement by MAP Spectral Amplitude Estimation Using a Super-Gaussian Speech Model”,EURASIP Journal on Applied Signal Processing,pp.1110-1126,No.7,2005
[0008] 非专利文献2:藤本、有木、“GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧”(“使用了GMM和EM算法的加法性噪音以及乘法性失真的抑制”)、電子情報通信学会技術報告(电子信息通信学会技术报告)、SP2003-117、pp.25-30、2003年12月发明内容
[0009] 在上述以往方法中,有以下叙述的课题。
[0010] 在上述非专利文献1公开的以往的噪音抑制装置中,决定概率密度函数的分布形状的参数是1个,另外该参数不依赖于输入信号的样式而是固定的,所以存在如下课题:针对各种输入信号,噪音抑制量的推测精度低。
[0011] 另外,在上述专利文献1公开的以往的噪音抑制装置中,为了决定概率密度函数的分布形状而使用了输入信号的相位谱,所以为了进行高品质的噪音抑制,需要高精度地分析声音信号的相位谱。另外,不使定义分布形状的参数(在该文献中称为用于近似的设定值λ)根据输入信号的样式来变化而是固定,所以存在如下课题:在作为输入信号的声音以及噪音发生超过用于近似的设定值那样的变动等引起了设想外的急剧的变动的情况下,噪音抑制量的推测无法追踪。
[0012] 另外,在上述非专利文献2公开的以往的噪音抑制装置中,通过使用组合了多个概率密度函数的混合分布模型而能够实现高精度的噪音抑制,但存在需要庞大的处理量的课题。
[0013] 本发明是为了解决上述课题而完成的,其目的在于通过简便的处理来提供高品质的噪音抑制装置。
[0014] 本发明的噪音抑制装置具备概率密度函数控制部,该概率密度函数控制部分析输入信号,计算表示输入信号是像声音还是像噪音的第一指标,根据该第一指标来控制对声音的分布状态进行定义的概率密度函数,噪音抑制装置除了功率谱和噪音推测谱以外,还使用概率密度函数来计算抑制量。
[0015] 根据本发明,使用根据表示输入信号是像声音还是像噪音的第一指标进行了控制的概率密度函数,计算用于抑制噪音的抑制量,从而能够通过简便的处理来进行不存在噪音区中的不协调感、并且声音的失真也少的高品质的噪音抑制。

附图说明

[0016] 图1是示出本发明的实施方式1的噪音抑制装置的结构的框图。
[0017] 图2是示出实施方式1中的概率密度函数控制部的内部结构的框图。
[0018] 图3是说明实施方式1中的概率密度函数的变化的曲线图。
[0019] 图4是示出本发明的实施方式2的噪音抑制装置的结构的框图。
[0020] 图5是示出实施方式2中的概率密度函数控制部的内部结构的框图。
[0021] 图6是示意地示出实施方式2中的由周期分量推测部推测的声音的谐波构造的检测方法的曲线图。
[0022] 图7是示意地示出实施方式2中的由周期分量推测部推测的声音的谐波构造的校正方法的曲线图。
[0023] 图8是示出实施方式2中的在加权SN比计算部计算第一加权后验SN比时使用的非线性函数的曲线图。
[0024] 图9是实施方式2的噪音抑制装置的输出结果的一个例子,示出不进行后验SN比(posteriori SN ratio)的加权的情况。
[0025] 图10是实施方式2的噪音抑制装置的输出结果的一个例子,示出进行后验SN比的加权的情况。
[0026] 图11是示出本发明的实施方式4的噪音抑制装置的结构的框图。
[0027] (符号说明)
[0028] 1:输入端子;2:傅立叶变换部;3:功率谱计算部;4:声音/噪音区间判定部;5:噪音谱推测部;6:SN比计算部;7、7a、7b:概率密度函数控制;8:抑制量计算部;9:谱抑制部;10:逆傅立叶变换部;11:输出端子;71:第二SN比计算部;72:控制系数计算部;73:周期分量推测部;74:权重系数计算部;75:加权SN比计算部。

具体实施方式

[0029] 以下,为了更详细地说明本发明,依照附图来说明用于实施本发明的方式。
[0030] 实施方式1.
[0031] 图1是示出本实施方式1的噪音抑制装置的整体结构的框图。本实施方式1的噪音抑制装置包括输入端子1、傅立叶变换部2、功率谱计算部3、声音/噪音区间判定部4、噪音谱推测部5、SN比计算部6、概率密度函数控制部7、抑制量计算部8、谱抑制部9、逆傅立叶变换部10、输出端子11。
[0032] 以下,根据附图,说明该噪音抑制装置的动作原理。
[0033] 首先,在对通过麦克风(未图示)等而取入的声音、音乐等进行了A/D(模拟/数字)变换之后,按照规定的采样频率(例如,8kHz)进行采样,并且按照帧单位(例如,10ms)进行分割,并经由输入端子1输入到本实施方式1的噪音抑制装置。
[0034] 傅立叶变换部2在对输入信号附加了例如汉宁窗之后,例如如下式(1)那样进行256点的快速傅立叶变换,从时域的信号x(t)变换为作为频域的信号的谱分量X(λ,k)。
[0035] X(λ,k)=FT[x(t)]   (1)
[0036] 此处,t表示采样时间,λ表示对输入信号进行了帧分割时的帧编号,k表示对谱的频带的频率分量进行指定的编号(以下称为谱编号),FT[·]表示傅立叶变换处理。
[0037] 在功率谱计算部3中,使用下式(2),根据输入信号的谱分量X(λ,k)得到功率谱Y(λ,k)。
[0038]
[0039] 此处,Re{X(λ,k)}以及Im{X(λ,k)}分别表示傅立叶变换后的输入信号谱的实数部以及虚数部。
[0040] 声音/噪音区间判定部4判定当前帧的输入信号是声音还是噪音。首先,使用下式(3),根据功率谱Y(λ,k),求出标准化自相关函数ρN(λ,τ)。
[0041] ρ(λ,τ)=FT[Y(λ,k)],
[0042]
[0043] 此处,τ是延迟时间,FT[·]表示傅立叶变换处理,按照例如与上式(1)相同的点数=256l来进行快速傅立叶变换即可。另外,式(3)是维纳-辛钦(Wiener-Khintchine)的定理,所以说明省略。
[0044] 接下来,声音/噪音区间判定部4使用下式(4),求出标准化自相关函数的最大值ρmax(λ)。此处,式(4)意味着在16≤τ≤96的范围内检索ρ(λ,τ)的最大值。
[0045] ρmax(λ)=max[ρ(λ,τ)],16≤τ≤96   (4)
[0046] 接下来,声音/噪音区间判定部4输入功率谱计算部3所输出的功率谱Y(λ,k)、通过上述处理所得到的标准化自相关函数的最大值ρmax(λ)、以及后述的噪音谱推测部5所输出的推测噪音谱N(λ,k),判定当前帧的输入信号是声音还是噪音,并将其结果作为判定标志而输出。作为声音区间和噪音区间的判定方法,例如在满足下式(5)的条件的情况下,设为是声音而将判定标志Vflag设置为“1(声音)”,在除此以外的情况下,设为是噪音而将判定标志Vflag设置为“0(噪音)”而输出。
[0047]
[0048] 其中,
[0049] 此处,在式(5)中,N(λ,k)是推测噪音谱,Spow和Npow分别表示输入信号的功率谱的总和和推测噪音谱的总和。另外,THFE_SN以及THACF是判定用的规定的常数阈值,作为优选的例子是THFR_SN=3.0以及THACF=0.3,但也可以根据输入信号的状态以及噪音等级而适当变更。
[0050] 另外,在本实施方式1中,作为声音/噪音区间判定方法,使用了自相关函数法和输入信号的平均SN比,但不限于此,也可以使用倒谱分析等公知的方法。另外,也可以由本领域技术人员随意酌情地组合各种公知的方法,从而提高判定精度。
[0051] 噪音谱推测部5输入功率谱计算部3所输出的功率谱Y(λ,k)、以及声音/噪音区间判定部4所输出的判定标志Vflag,依照下式(6)和判定标志Vflag进行噪音谱的推测和更新,输出推测噪音谱N(λ,k)。
[0052]
[0053] 此处,N(λ-1,k)是前帧中的推测噪音谱,被保持到噪音谱推测部5内的例如RAM(Random Access Memory,随机存取存储器)等存储单元(未图示)中。α是更新系数,是0<α<1的范围的规定的常数。作为优选的例子是α=0.95,但也可以根据输入信号的状态以及噪音等级而适当变更。
[0054] 在上式(6)中,在判定标志Vflag=0的情况下,当前帧的输入信号被判定为噪音,所以使用输入信号的功率谱Y(λ,k)和更新系数α,更新前帧的推测噪音谱N(λ-1,k)。
[0055] 另一方面,在判定标志Vflag=1的情况下,当前帧的输入信号是声音,将前帧的推测噪音谱N(λ-1,k)原样地作为当前帧的推测噪音谱N(λ,k)而输出。
[0056] SN比计算部6使用功率谱计算部3所输出的功率谱Y(λ,k)、噪音谱推测部5所输出的推测噪音谱N(λ,k)、以及后述的抑制量计算部8所输出的前帧的谱抑制量G(λ-1,k),计算每个谱分量的后验SN比(a posteriori Signal to Noise Ratio,后验信噪比)和先验SN比(a priori Signal to Noise Ratio,先验信噪比)。
[0057] 使用功率谱Y(λ,k)和推测噪音谱N(λ,k),根据下式(7)求出后验SN比γ(λ,k)。
[0058] 另外,使用前帧的谱抑制量G(λ-1,k)和前帧的后验SN比γ(λ,k),根据下式(8)求出先验SN比ξ(λ,k)。
[0059]
[0060] ξ(λ,k)=δ·γ(λ-1,k)·G2(λ-1,k)+(1-δ)·F[γ(λ,k)-1]   (8)[0061] 其中,
[0062] 此处,δ是0<δ<1的范围的规定的常数,在本实施方式中,优选为δ=0.98。另外,F[·]意味着半波整流,在后验SN比γ(λ,k)以分贝值是负的情况下向下取整(floor)为零。
[0063] 将以上所得到的后验SN比γ(λ,k)和先验SN比ξ(λ,k)从SN比计算部6输出到谱抑制部9。
[0064] 概率密度函数控制部7使用功率谱计算部3所输出的功率谱Y(λ,k)和噪音谱推测部5所输出的推测噪音谱N(λ,k),决定与当前帧的输入信号的样式对应的概率密度函数的形状(分布状态),将第一控制系数ν(λ,k)和第二控制系数μ(λ,k)输出到抑制量计算部8。在后面叙述该概率密度函数控制部7的详细的动作。
[0065] 抑制量计算部8输入SN比计算部6所输出的先验SN比ξ(λ,k)和后验SN比γ(λ,k)、以及概率密度函数控制部7所输出的第一控制系数ν(λ,k)和第二控制系数μ(λ,k),求出作为每个谱的噪音抑制量的谱抑制量G(λ,k),并输出到谱抑制部9。
[0066] 作为求出谱抑制量G(λ,k)的方法,能够应用例如Joint MAP方法。Joint MAP方法是将噪音信号和声音信号假设为是高斯分布而推测谱抑制量G(λ,k)的方法,使用先验SN比ξ(λ,k)以及后验SN比γ(λ,k),求出使附带条件的概率密度函数成为最大的振幅谱和相位谱,并将其值作为推测值来利用。能够将决定概率密度函数的形状的第一控制系数ν(λ,k)和第二控制系数μ(λ,k)作为参数,用下式(9)以及式(10)表示谱抑制量G(λ,k)。另外,关于Joint MAP方法中的谱抑制量导出方法的详细内容,参照非专利文献1,此处省略。
[0067]
[0068]
[0069] 谱抑制部9依照下式(11),针对输入信号的每个谱,仅抑制谱抑制量G(λ,k),求出抑制了噪音的声音信号谱S(λ,k),并输出到逆傅立叶变换部10。
[0070] S(λ,k)=G(λ,k)·Y(λ,k)   (11)
[0071] 以上,将所得到的声音谱S(λ,k)通过逆傅立叶变换部10进行逆傅立叶变换,并与前帧的输出信号进行重叠处理之后,从输出端子11输出抑制了噪音的声音信号s(t)。
[0072] 接下来,说明作为本发明的主要部分的概率密度函数控制部7的动作。图2示出概率密度函数控制部7的内部结构。
[0073] 该概率密度函数控制部7使用功率谱计算部3所输出的功率谱Y(λ,k)、和噪音谱推测部5所输出的推测噪音谱N(λ,k),决定与输入信号的样式对应的概率密度函数的形状,并且输出抑制量计算部8用于计算谱抑制量G(λ,k)所需的第一控制系数ν(λ,k)和第二控制系数μ(λ,k)。
[0074] 首先,为了说明本处理的内容,在式(12)中示出对上述式(9)以及式(10)附加了定义的、Joint MAP方法中的声音谱的振幅|X|的概率密度函数p(|X|)。
[0075]
[0076] 此处,Γ(·)是伽马函数、σx是声音谱的方差。另外,μ以及ν分别是决定概率密度函数的分布的陡度、分布的扩展的常数系数,通过变更这2个系数,能够控制概率密度函数的形状。因此,通过根据输入信号的样式来变更μ以及ν,能够得到与输入信号的样式对应的概率密度函数。为了根据输入信号的样式来控制概率密度函数,例如能够使用上述式(7)的后验SN比γ(λ,k)。
[0077] 第二SN比计算部71使用功率谱Y(λ,k)和推测噪音谱N(λ,k)来取得对数,计算如下式(13)那样用分贝值表现的第二后验SN比γp(λ,k)。
[0078]
[0079] 控制系数计算部72使用由第二SN比计算部71得到的第二后验SN比γp(λ,k),如下式(14)~(16)那样计算第一控制系数ν(λ,k)、第二控制系数μ(λ,k),并分别输出到抑制量计算部8。
[0080]
[0081]
[0082] 其中,
[0083]    (16)
[0084] Kv(k)=(1+0.2·k/128)·Cv,Kμ(k)=(1+0.2·k/128)·Cμ
[0085] 此处,νMAX、νMIN以及μMAX、μMIN分别是决定第一控制系数ν(λ,k)的上限、下限的规定的常数、以及决定第二控制系数μ(λ,k)的上限、下限的规定的常数,作为本实施方式中的优选的一个例子,是νMAX=2.0,νMIN=0.0,μMAX=10.0,μMIN=1.0,但能够根据输入信号中的声音以及噪音的样式而适当变更。
[0086] 另外,上式(16)的Kν(k)以及Kμ(k)是将第二后验SN比和控制系数对应起来的函数,随着频率变高,以相对第二后验SN比γp(λ,k)的值而使第一控制系数ν(λ,k)或者第二控制系数μ(λ,k)更大地变化的方式动作。由此,例如具有防止将高频带的辅音等振幅小的声音误认为噪音而抑制的效果。
[0087] 另外,Cν以及Cμ是通过实验得到的规定的常数,作为本实施方式中的优选的一个例子,是Cν=0.1,Cμ=-10,但它们也能够根据输入信号中的声音以及噪音的样式而适当变更。
[0088] 根据上述式(14)~(16),随着第二后验SN比γp(λ,k)变大,第一控制系数ν(λ,k)变大,即方差程度扩大,另一方面,第二控制系数μ(λ,k)变小,分布的锐度变小。其结果,概率密度函数p(|X|)的分布的形状成为坡度小的倾斜,与声音区间中的声音信号的分布状态近似。
[0089] 另一方面,随着第二后验SN比γp(λ,k)变小,第一控制系数ν(λ,k)变小而方差程度变窄,另一方面,第二控制系数μ(λ,k)变大而分布的锐度变大。其结果,概率密度函数p(|X|)的分布的形状成为陡峭的倾斜,与噪音区间中的声音信号的分布状态(不存在声音、或者存在小振幅的声音的状态)近似。
[0090] 图3示出使第二控制系数μ(λ,k)固定而使第一控制系数ν(λ,k)变化了的情况的概率密度函数p(|X|)的分布状态的一个例子。在图3中,横轴是声音谱的振幅|X|、纵轴是概率密度函数p(|X|)的值。根据图3可知,随着第一控制系数ν(λ,k)变小,概率密度函数p(|X|)的形状变窄且变尖锐,从声音信号的分布状态变化为噪音信号混合存在时的声音信号的分布状态。通过将上述得到的第一控制系数ν(λ,k)以及第二控制系数μ(λ,k)代入到上式(12)以及式(13),能够进行与输入信号的样式对应的高精度的谱抑制量G(λ,k)的计算,能够实现高品质的噪音抑制。
[0091] 以上,根据本实施方式1,噪音抑制装置构成为具备:输入端子1,输入输入信号;傅立叶变换部2,将时域的输入信号变换为频域的信号;功率谱计算部3,根据频域的信号,计算功率谱;声音/噪音区间判定部4,根据输入信号的功率谱,判定声音区间和噪音区间;噪音谱推测部5,根据功率谱和判定结果,推测推测噪音谱;SN比计算部6,根据功率谱和推测噪音谱,计算SN比;概率密度函数控制部7,根据表示输入信号是像声音还是像噪音的第一指标,控制对声音的分布状态进行定义的概率密度函数;抑制量计算部8,根据SN比和概率密度函数,计算用于抑制噪音的抑制量;谱抑制部9,根据抑制量,进行功率谱的振幅抑制;逆傅立叶变换部10,将抑制了振幅的功率谱变换到时域而得到噪音抑制信号;以及输出端子11,输出噪音抑制信号,概率密度函数控制部7具有:第二SN比计算部71,推测输入信号的按频率的SN比(第二后验SN比);以及控制系数计算部72,将由第二SN比计算部71推测出的SN比用于第一指标来控制概率密度函数。因此,在计算谱抑制量时,能够应用与输入信号的样式对应的概率密度函数、即与声音区间以及噪音区间中的声音信号的分布状态适合的概率密度函数,所以能够通过简便的处理,进行不会感觉到噪音区间中的异常噪音、并且声音的失真也少的高品质的噪音抑制。
[0092] 另外,在实施方式1中,针对第一控制系数ν(λ,k)以及第二控制系数μ(λ,k)这两方,进行了与输入信号的样式对应的控制,但也可以仅进行某一方的控制,即使单独进行也起到同样的效果。
[0093] 实施方式2.
[0094] 在上述实施方式1中,通过使用后验SN比而进行了与输入信号的样式对应的概率密度函数的控制,但例如还能够对该后验SN比进行加权。其目的在于,虽然有声音信号被噪音淹没了的情况等尽管存在声音但SN比也低的情况,但对于存在声音的可能性高的频带,以使其后验SN比变高的方式进行加权校正,从而防止错误地抑制被噪音淹埋了的声音信号。
[0095] 图4是示出本实施方式2的噪音抑制装置的整体结构的框图,图5是示出其中的概率密度函数控制部7a的内部结构的框图。图4所示的概率密度函数控制部7a输入功率谱计算部3的功率谱Y(λ,k)、声音/噪音区间判定部4的判定标志Vflag、噪音谱推测部5的推测噪音谱N(λ,k)、以及SN比计算部6的先验SN比ξ(λ,k)。关于其他结构,与图1相同。
[0096] 在图5所示的概率密度函数控制部7a中,作为与图2的概率密度函数控制部7不同的结构,是周期分量推测部73、权重系数计算部74、加权SN比计算部75。关于其他结构,与图2相同。
[0097] 周期分量推测部73输入功率谱计算部3所输出的功率谱Y(λ,k),分析输入信号谱的谐波构造。在谐波构造的分析中,如图6所示,通过检测功率谱所构成的谐波构造的波峰(以后称为谱峰值)来进行。具体而言,为了去除与谐波构造无关的微小峰值分量,例如在从各功率谱分量减去功率谱的最大值的20%程度的值之后,从低频带起依次进行循迹而求出功率谱的谱包络的极大值。另外,关于图6的功率谱例子,为了易于说明,将声音谱和噪音谱记载为不同的分量,但在实际的输入信号中,在声音谱中重叠(相加)有噪音谱,无法观测到功率比噪音谱小的声音谱的峰值。
[0098] 在探索谱峰值之后,在周期分量推测部73中,作为周期性信息p(λ,k),如果是功率谱的极大值(是谱峰值),则设为p(λ,k)=1,否则设为p(λ,k)=0而针对每个谱编号k设置值。另外,在图6的例子中,抽出所有的谱峰值,但例如也可以仅限于SN比良好的带宽等特定的频带而进行。
[0099] 接下来,周期分量推测部73根据所观测的谱峰值的高次谐波周期,推测被噪音谱淹没了的声音谱的峰值。具体而言,例如如图7那样,在未观测到谱峰值的区间(被噪音淹没了的低频带部分以及高频带部分)中,视为按照观测到的谱峰值的高次谐波周期(峰值间隔)存在谱峰值,设置该谱编号的周期性信息p(λ,k)=1。另外,在极低的频带(例如,120Hz以下)中存在声音分量的情况是稀少的,所以还能够在该带宽中不对周期性信息p(λ,k)设置“1”。在极高的频带中也能够同样。实施以上的处理,从周期分量推测部73向权重系数计算部74输出周期性信息p(λ,k)。
[0100] 权重系数计算部74输入周期分量推测部73所输出的周期性信息p(λ,k)、噪音谱推测部5所输出的判定标志Vflag、以及SN比计算部6所输出的先验SN比ξ(λ,k),针对由后述的加权SN比计算部75计算的后验SN比,计算用于进行每个谱分量的加权的谐波构造权重系数Wh(λ,k)。
[0101]
[0102] 此处,Wh(λ-1,k)是前帧的谐波构造权重系数,β是用于平滑化的规定的常数,优选为例如β=0.8。另外,wp(k)是周期性信息p(λ,k)=1时的加权常数,例如如下式(18)那样根据判定标志Vflag和先验SN比ξ(λ,k)而被决定,并根据该谱编号下的值和邻接的谱编号的值而被平滑化。通过与邻接的谱分量进行平滑化,存在如下效果:抑制加权系数的陡度化以及吸收谱峰值分析的误差。
[0103] 另外,关于周期性信息p(λ,k)=0时的加权常数wz(k),通常可以原样地为1.0而不进行加权,但也可以根据需要,与下式(18)的wp(k)同样地,根据判定标志Vflag和先验SN比ξ(λ,k)进行控制。
[0104]
[0105] 其中,
[0106] 在周期性信息p(λ,k)=1、并且判定标志Vflag=1(声音)的情况下,
[0107]
[0108] 在周期性信息p(λ,k)=1、并且判定标志Vflag=0(噪音)的情况下,
[0109]
[0110] 此处,THSB_SNR是规定的常数阈值。通过如上式(18)那样利用判定标志和先验SN比来控制加权常数wp(k),在由声音/噪音区间判定部4判定为输入信号是声音的情况下,能够对声音被噪音淹没那样的带宽的谱峰值(谱的谐波构造的波峰部分)进行大的加权,并且不会对SN比本来高的带宽的谱分量进行过度的加权。
[0111] 另一方面,在由声音/噪音区间判定部4判定为输入信号是噪音的情况下,通过抑制加权(将加权常数wp(k)设为1.0),并且对于被推测为SN比高的谱分量进行加权,例如即使在当前帧虽然是声音但判定标志错误地成为噪音的情况下,也能够进行加权。另外,还能够根据输入信号的状态以及噪音等级,适当变更阈值THSB_SNR。
[0112] 加权SN比计算部75求出由控制系数计算部72用于计算第一控制系数ν(λ,k)以及第二控制系数μ(λ,k)所需的加权后验SN比。首先,根据输入信号的功率谱Y(λ,k)和推测噪音谱N(λ,k),通过下式(19),求出临时的后验SN比γt(λ,k)。
[0113]
[0114] 接下来,加权SN比计算部75参照图8所示的非线性函数,计算与临时的后验SN比γt(λ,k)对应的权重系数W(λ,k)。如图8所示,关于权重系数W(λ,k),采用如下那样的函数,即,临时的后验SN比γt(λ,k)越小其越大、另一方面在临时的后验SN比γt(λ,k)大到(或者小到)某种程度的情况下成为恒定的权重那样的函数。另外,图8中的WMIN是决定权重系数W(λ,k)的下限的规定的常数,γ0上帽(hat)以及γ1上帽(由于电子申请的关系,将希腊文字上的“^”记载为“上帽”)是规定的常数,作为本实施方式中的优选的一个例子,是WMIN=0.25、γ0上帽=3(dB)、γ1上帽=12(dB),但能够根据输入信号中的声音以及噪音的样式而适当变更。
[0115] 以上,使用所得到的权重系数W(λ,k)对推测噪音谱N(λ,k)进行加权,如下式(20)那样计算第一加权后验SN比γw1(λ,k)。
[0116]
[0117] 通过进行上式(20)所示的加权处理,能够以将SN比低的带宽的后验SN比推测得较高的方式进行了校正之后,控制概率密度函数,所以能够限制声音的过度抑制,能够进行高品质的噪音抑制。
[0118] 接下来,加权SN比计算部75如下式(21)所示,使用高次谐波构造权重系数Wh(λ,k),以在存在声音的高次谐波分量的可能性高的带宽中将通过上式(20)所得到的第一加权后验SN比γw1(λ,k)推测得较高的方式进行校正,计算第二加权后验SN比γW2(λ,k)。
[0119] γw2(λ,k)=Wh(λ,k)·γw1(λ,k)   (21)
[0120] 通过进行上式(21)所示的加权处理,能够以将存在声音的谐波分量的可能性高的带宽的后验SN比推测得较高的方式进行了校正之后,控制概率密度函数,所以能够限制声音的过度抑制,能够进行高品质的噪音抑制。
[0121] 将以上所得到的第二加权后验SN比γW2(λ,k)从加权SN比计算部75输出到控制系数计算部72。
[0122] 图9以及图10是作为本实施方式2的噪音抑制装置的输出结果的一个例子而示意地示出声音区间中的输出信号的谱和对应的后验SN比的曲线图。图9(a)示出在将图6所示的谱作为输入信号的情况下不进行加权时的后验SN比,图9(b)示出作为此时的噪音抑制处理结果的输出信号谱。另一方面,图10(a)示出进行上式(20)以及式(21)所示的加权时的后验SN比,图10(b)示出作为此时的噪音抑制处理结果的输出信号谱。
[0123] 另外,在图9(a)、图10(a)中,用分贝值表示了后验SN比,在后验SN比的分贝值成为负的情况下,省略显示而向下取整为零。
[0124] 在观察图9(a)、(b)时,被噪音淹没或者SN比低的带宽的声音的功率衰减,相对于此,在图10(a),(b)中被校正为以使被噪音淹没或者SN比低的带宽的声音的后验SN比被推测得较高,所以可知该带宽的声音功率得到恢复,能够进行更良好的噪音抑制。
[0125] 以上,根据该实施方式2,噪音抑制装置的概率密度函数控制部7a具有加权SN比计算部75,该加权SN比计算部75推测输入信号的按频率的SN比(临时的后验SN比),并根据表示输入信号是像声音还是像噪音的第二指标而对该按频率的SN比进行加权,控制系数计算部72构成为将由加权SN比计算部75计算出的加权SN比(第二加权后验SN比)用于第一指标,控制概率密度函数。因此,能够限制声音的过度抑制,能够进行高品质的噪音抑制。
[0126] 另外,在该实施方式2中,加权SN比计算部75构成为推测输入信号的按频率的SN比,并对该SN比进行加权,但不限于此,也可以从加权SN比计算部75分离用于推测SN比的功能,而另行构成与上述实施方式1的第二SN比计算部71相当的SN比计算部。在该构成的情况下,加权SN比计算部75根据表示输入信号是像声音还是像噪音的第二指标,对按频率的SN比进行加权。
[0127] 另外,根据本发明的实施方式2,作为第二指标,使用加权SN比计算部75使用输入信号的功率谱和推测噪音谱来计算出的临时的后验SN比,即使在声音被噪音淹没而SN比成为负那样的带宽中,也为了保持声音而在校正了后验SN比之后控制概率密度函数,所以能够限制声音的过度抑制,能够进行高品质的噪音抑制。
[0128] 另外,根据该实施方式2,作为第二指标,使用SN比计算部6使用输入信号的功率谱和推测噪音谱来计算出的先验SN比、以及声音/噪音区间判定部4根据输入信号的功率谱而判定了的声音区间和噪音区间的判定结果,进行后验SN比的加权控制,所以具有能够在噪音区间、SN比高的带宽中抑制不必要的加权的效果,能够进行更高品质的噪音抑制。
[0129] 另外,根据该实施方式2,概率密度函数控制部7a具有对输入信号中的声音的谐波构造进行分析的周期分量推测部73,加权SN比计算部75构成为将周期分量推测部73的分析结果用于第二指标,以使输入信号的功率谱的峰值部分的SN比变大的方式进行加权。因此,即使在声音被噪音淹没那样的带宽中,也能够校正后验SN比以保持声音,能够进行更高品质的噪音抑制。
[0130] 另外,在该实施方式2中,进行了所有带宽的后验SN比的校正,但不限于此,也可以根据需要进行仅低频带或者仅高频带的校正,也可以进行例如仅500~800Hz附近等特定的频带的校正。这样的频带的校正对例如被风燥、汽车引擎音等窄带性噪音淹没了的声音的校正是有效的。
[0131] 另外,在该实施方式2中,进行了式(20)所示的SN比低的带宽的加权处理、和式(21)所示的基于声音的谐波构造的加权处理这两方的加权处理,但不限于此,也可以仅进行某一方的加权处理,起到在各个加权处理中叙述的效果。
[0132] 实施方式3.
[0133] 在上述实施方式3的式(18)中,将加权的值(加权常数wp(k)、wz(k))在频率方向上设为恒定,但也可以按频率而设为不同的值。在权重系数计算部74中,例如作为声音的一般的特征,低频带的谐波构造更清楚(谱的峰值和谷值之差大),所以能够增大加权,并随着频率变高而减小加权。
[0134] 根据该实施方式3,权重系数计算部74构成为按频率来控制加权SN比计算部75的加权的强度,所以能够进行适合于声音的频率特性的加权,能够进行更高品质的噪音抑制。
[0135] 实施方式4.
[0136] 另外,在上述实施方式2的式(18)中,将加权的值(加权常数wp(k)、wz(k))设为规定的常数,但例如也可以根据输入信号的像声音的指标而切换使用多个加权常数、或者使用规定的函数来进行控制。
[0137] 图11是示出本实施方式4的噪音抑制装置的整体结构的框图。图11所示的概率密度函数控制部7b输入功率谱计算部3的功率谱Y(λ,k)、声音/噪音区间判定部4的判定标志Vflag及标准化自相关函数的最大值ρmax(λ)、噪音谱推测部5的推测噪音谱N(λ,k)、以及SN比计算部6的先验SN比ξ(λ,k)。关于其他结构,与图4相同。另外,概率密度函数控制部7b是与图5同样的内部结构。
[0138] 在本实施方式4的噪音抑制装置中,作为输入信号的像声音的指标、即输入信号的样式的控制主要原因,将例如声音/噪音区间判定部4所输出的标准化自相关函数的最大值ρmax(λ)输入到概率密度函数控制部7b的权重系数计算部74(如图5所示)。该权重系数计算部74能够在上式(4)中的标准化自相关函数的最大值ρmax(λ)高的情况、即输入信号的周期构造清楚的情况下(输入信号是声音的可能性高),增大权重,在低的情况下减小权重。
[0139] 另外,也可以一并使用标准化自相关函数的最大值ρmax(λ)和声音/噪音区间的判定标志Vflag。
[0140] 而且,也可以组合上述实施方式3。
[0141] 以上,根据该实施方式4,权重系数计算部74构成为根据输入信号的样式来控制加权SN比计算部75的加权的强度,所以在输入信号是声音的可能性高的情况下,能够以使声音的周期性构造变得显著的方式进行加权,声音的劣化变少,能够进行更高品质的噪音抑制。
[0142] 实施方式5.
[0143] 本实施方式5的噪音抑制装置在附图方面是与上述实施方式2的图4以及图5所示的噪音抑制装置同样的结构,所以以下援用图4以及图5来说明。
[0144] 在上述实施方式2的图6的说明中,为了推测周期分量,对所有的谱峰值进行了检测,但例如也可以将SN比计算部6所输出的先验SN比ξ(λ,k)输入到周期分量推测部73,使用该先验SN比ξ(λ,k),仅在SN比高于规定的阈值的带宽中检测谱峰值。
[0145] 同样地,即使在声音/噪音区间判定部4的标准化自相关函数ρN(λ,k)的计算中,也能够仅在SN比高于规定的阈值的带宽中进行计算。
[0146] 以上,根据该实施方式5,构成为利用使用输入信号中的SN比高于规定的阈值的频带的信号分量来计算出的第二指标。因此,仅在SN比高的带宽中进行谱峰值的检测、以及标准化自相关函数的计算,能够提高谱峰值的检测精度以及声音/噪音区间的判定精度,能够进行更高品质的噪音抑制。
[0147] 实施方式6.
[0148] 本实施方式6的噪音抑制装置在附图方面是与上述实施方式2的图4以及图5、或者上述实施方式4的图11所示的噪音抑制装置同样的结构,所以以下援用图4、图5以及图11来说明。
[0149] 在上述实施方式2~5中,概率密度函数控制部7a、7b以强调谱峰值的方式进行了SN比的加权,但相反地也可以以强调谱的谷值部分的方式进行加权、即在谱的谷值中进行使SN比变小那样的加权。作为利用周期分量推测部73检测谱的谷值的检测方法,例如能够将谱峰值之间的谱编号的中央值设为谱的谷值部分。
[0150] 以上,根据该实施方式6,构成为概率密度函数控制部7a、7b具有对输入信号中的声音的谐波构造进行分析的周期分量推测部73,加权SN比计算部75将周期分量推测部73的分析结果用于第二指标,除了输入信号的功率谱以外,以减小部分的SN比的方式进行加权。因此,能够使声音的周期性构造变得显著,能够进行更高品质的噪音抑制。
[0151] 实施方式7.
[0152] 本实施方式7的噪音抑制装置在附图方面是与上述实施方式1的图1、上述实施方式2的图4、或者上述实施方式4的图11所示的噪音抑制装置同样的结构,所以以下援用图1、图4以及图11来说明。
[0153] 在上述实施方式1~6中,概率密度函数控制部7、7a、7b针对每个谱分量进行了概率密度函数的控制,但例如关于3~4kHz的高频带,也可以并非进行基于每个谱分量的后验SN比的控制,而进行基于该带宽的后验SN比的平均值的总体控制。
[0154] 以上,根据该实施方式7,构成为概率密度函数控制部7、7a、7b的控制系数计算部72使用规定的频带的平均SN比而在该频带中总体地控制概率密度函数,所以能够实现高品质的噪音抑制,而且能够削减处理量。
[0155] 实施方式8.
[0156] 本实施方式8的噪音抑制装置在附图方面是与上述实施方式1的图1、上述实施方式2的图4或者上述实施方式4的图11所示的噪音抑制装置同样的结构,所以以下援用图1、图4以及图11来说明。
[0157] 在上述实施方式1~7中,概率密度函数控制部7、7a、7b将输入信号的后验SN比用于第一指标来控制概率密度函数,但不限于此,能够使用表示输入信号是像声音还是像噪音的其他指标。例如,能够将输入信号谱的方差、输入信号谱的谱熵、自相关函数、零交叉数等通过公知的分析单元得到的指标单独地使用或者组合多个而使用。
[0158] 例如,在将输入信号谱的方差用于第一指标的情况下,在概率密度函数控制部7、7a、7b中,在方差大的情况下声音的可能性高,所以进行增大第一控制系数ν(λ,k)且减小第二控制系数μ(λ,k)那样的控制。在方差小的情况下,相反地进行减小第一控制系数ν(λ,k)且增大第二控制系数μ(λ,k)那样的控制即可。另外,能够观察指标和控制系数的对应状态,实验性地求出将作为指标的输入信号谱的方差和控制系数对应起来的函数。
[0159] 以上,根据该实施方式8,即使作为表示输入信号的样式的第一指标而使用后验SN比以外的指标,也能够应用与声音区间以及噪音区间中的声音信号的分布状态适合的概率密度函数,所以能够通过简便的处理,进行不存在噪音区间中的异常噪音感觉、并且声音的失真也少的高品质的噪音抑制。另外,能够通过组合多个指标来提高概率密度函数的控制精度,能够进行更高品质的噪音抑制。
[0160] 实施方式9.
[0161] 本实施方式9的噪音抑制装置在附图方面是与上述实施方式2的图4以及图5、或者上述实施方式4的图11所示的噪音抑制装置同样的结构,所以以下援用图4以及图5来说明。
[0162] 在上述实施方式2中,权重系数计算部74根据声音的谐波构造的分析结果来计算谐波构造权重系数,加权SN比计算部75利用该谐波构造权重系数Wh(λ,k)对后验SN比进行加权,控制系数计算部72使用加权了的后验SN比来控制概率密度函数,但例如也可以根据声音的谐波构造的分析结果,直接控制概率密度函数。
[0163] 具体而言,将周期分量推测部73所输出的周期性信息p(λ,k)直接输入到控制系数计算部72。在控制系数计算部72中,在周期性信息p(λ,k)=1的情况下,其带宽是声音的可能性高,所以进行增大第一控制系数ν(λ,k)且减小第二控制系数μ(λ,k)那样的控制。另一方面,在周期性信息p(λ,k)=0的情况下,其带宽是噪音的可能性高,所以相反地进行减小第一控制系数ν(λ,k)且增大第二控制系数μ(λ,k)那样的控制。另外,能够观察控制主要原因和控制系数的对应状态,实验性地求出将作为控制主要原因的周期性信息和控制系数对应起来的函数。
[0164] 在该结构的情况下,可省略图5的概率密度函数控制部7a中的权重系数计算部74以及加权SN比计算部75。
[0165] 以上,根据该实施方式9,构成为概率密度函数控制部7a、7b具备:周期分量推测部73,分析输入信号中的声音的谐波构造;以及控制系数计算部72,将周期分量推测部73的分析结果用于第一指标而控制概率密度函数。因此,能够应用与声音区间以及噪音区间中的声音信号的分布状态适合的概率密度函数,所以能够通过简便的处理,进行不存在噪音区间中的异常噪音感觉、并且声音的失真也少的高品质的噪音抑制,而且能够省略后验SN比计算等处理,所以具有处理量削减的效果。
[0166] 在以上的所有实施方式1~9中,作为噪音抑制的方法,使用最大后验概率法(Joint MAP方法)进行了说明,但还能够应用于其他方法(例如,最小均方误差短时间谱振幅法)。例如在“Speech Enhancement Using a Minimum-Mean Square Error Short-Time Spectral Amplitude Estimator”(Y.Ephraim,D.Malah,IEEE Trans.ASSP,vol.ASSP-32,No.6Dec.1984)中详述了最小均方误差短时间谱振幅法,所以省略说明。
[0167] 另外,在以上的所有实施方式1~9中,说明了窄带电话(0~4000Hz)的情况,但不限于窄带电话声音,例如还能够应用于0~8000Hz等宽带电话声音以及音乐等音响信号。
[0168] 另外,在以上的所有实施方式1~9中,将抑制了噪音的输出信号以数字数据形式传送到声音编码装置、声音识别装置、声音储存装置、免提通话装置等各种声音音响处理装置,但也可以将本实施方式1~9的噪音抑制装置单独或者与上述其他装置一起通过DSP(数字信号处理处理器)来实现、或者作为软件程序而执行来实现。关于程序,既可以存储到执行软件程序的计算机的存储装置中,也可以是通过CD-ROM等存储介质发布的形式。另外,还能够通过网络来提供程序。而且,除了向各种声音音响处理装置传送以外,还能够在D/A(数字/模拟)变换之后,通过放大装置来放大,并从扬声器等直接作为声音信号而输出。
[0169] 除了上述以外,本申请发明能够在本发明的范围内实现各实施方式的自由的组合、或者各实施方式的任意的构成要素的变形、或者各实施方式中的任意的构成要素的省略。
[0170] 产业上的可利用性
[0171] 如以上那样,本发明的噪音抑制装置能够实现高品质的噪音抑制,所以适用于声音通信、声音储存、声音识别系统被导入了的车辆导航、便携电话、对讲机等声音通信系统、免提通话系统、TV会议系统、监视系统等的音质改善以及声音识别系统的识别率的提高。