信号处理方法和装置转让专利

申请号 : CN200580047603.6

文献号 : CN100593197C

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 松原光良大谷猛远藤香绪里大田恭士

申请人 : 富士通株式会社

摘要 :

本发明提供了一种信号处理方法和装置,该信号处理方法和装置在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度,并且在语音分段中很少产生由于语音的影响而导致的噪声频谱的估算误差,在该信号处理方法和装置中,提取作为输入信号的抽样数据的时域信号,按帧将该时域信号转换成频域信号,并计算输入频谱。此外,获得输入频谱的最小值,以估算噪声频谱,所述噪声频谱是包括在输入语音信号中的噪声分量的频域信号。此外,将该输入频谱与该噪声频谱进行比较,以确定分段是在噪声分段还是混合了语音与噪声的混合分段中。

权利要求 :

1、一种信号处理方法,该信号处理方法包括:

时域信号提取步骤,用于提取时域信号,所述时域信号是输入信号 的抽样数据;

频域信号分析步骤,用于按帧将所述时域信号转换成频域信号并计 算输入频谱;

噪声估算步骤,用于通过利用所述输入频谱的最小分量来估算噪声 频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号;

分段确定步骤,用于对所述噪声频谱与所述输入频谱进行比较,并 确定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段 中;以及抑制量计算步骤,用于根据所述分段确定步骤的确定结果,基于所 述噪声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量,并抑 制所述输入信号的噪声。

2、根据权利要求1所述的信号处理方法,其中,所述噪声估算步骤 包括获得每帧的瞬时噪声频谱作为所述噪声频谱。

3、根据权利要求2所述的信号处理方法,其中,所述噪声估算步骤 包括获得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。

4、根据权利要求3所述的信号处理方法,其中,当在所述分段确定 步骤中直到前一帧的确定结果表示混合分段时,所述噪声估算步骤包括 通过利用所述瞬时噪声频谱来获得所述平均噪声频谱,而当所述确定结 果表示噪声分段时,所述噪声估算步骤包括通过利用所述输入频谱来获 得所述平均噪声频谱。

5、根据权利要求1到4中的任意一项所述的信号处理方法,其中, 所述输入信号包括语音信号。

6、一种信号处理装置,该信号处理装置包括:

时域信号提取部,用于提取时域信号,所述时域信号是输入信号的 抽样数据;

频域信号分析部,用于按帧将所述时域信号转换成频域信号并计算 输入频谱;

噪声估算部,用于通过利用所述输入频谱的最小分量来估算噪声频 谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号;

分段确定部,用于对所述噪声频谱和所述输入频谱进行比较,并确 定所述帧是在混合了语音和噪声的分段中还是在没有语音的噪声分段 中;以及抑制量计算部,用于根据所述分段确定部的确定结果,基于所述噪 声频谱和所述输入频谱对所述输入信号计算每带宽的抑制量,并抑制所 述输入信号的噪声。

7、根据权利要求6所述的信号处理装置,其中,所述噪声估算部获 得每帧的瞬时噪声频谱作为所述噪声频谱。

8、根据权利要求7所述的信号处理装置,其中,所述噪声估算部获 得多个帧的瞬时噪声频谱的平均噪声频谱作为所述噪声频谱。

9、根据权利要求8所述的信号处理装置,其中,当在所述分段确定 部中直到前一帧的确定结果表示混合分段时,所述噪声估算部通过利用 所述瞬时噪声频谱来获得所述平均噪声频谱,而当所述确定结果表示噪 声分段时,所述噪声估算部通过利用所述输入频谱来获得所述平均噪声 频谱。

10、根据权利要求6到9中的任意一项所述的信号处理装置,其中, 所述输入信号包括语音信号。

说明书 :

技术领域

本发明涉及信号处理方法和装置,具体地说,涉及例如用于数字移 动电话的噪声消除器、VAD(语音活动检测)等中的语音信号处理所需 的方法和装置。

背景技术

作为一种在数字移动电话等中抑制通信语音中的背景噪声以使得能 够容易地听到语音的技术,噪声消除器可以被提及。同样,作为一种通 过根据语音的存在/不存在而打开/关闭发射输出来节省发射部的电力的 技术,VAD可以被提及。对于噪声消除器、VAD等,需要在通信过程中 确定语音存在的分段或者没有语音存在的分段。
作为确定这分段的方法,例如可以提及下述的方法,即,通过将过 去计算出的长期的平均功率看作噪声的功率,将噪声功率与当前分段中 的功率进行比较,以将功率较大的当前分段确定或判定为语音分段。然 而,仅通过这种简单的功率比较,当背景噪声电平很高并且信噪比SNRn 很小时,存在语音被错认为噪声的情况。
作为对于这种情况的措施,已经提出了通过利用语音的频域信号来 执行分段确定的方法(例如参见专利文献1)。在下文中,将对这种技术 进行描述。
对输入信号周期性地执行时间-频率转换。计算输入信号的频域信号 (在下文中,称为输入频谱)。把过去计算出的长期的平均输入频谱看作 噪声频谱(在下文中,称为平均噪声频谱)。为平均噪声频谱和输入频谱 中的每一个计算每带宽的信噪比SNRn,以便在所需带宽下计算每带宽的 信噪比SNRn的平均值、正(负)变化量、离差值(dispersion value)等。 通过利用这些值,来执行分段确定。同样,仅在通过上述分段确定将该 分段确定为噪声分段时,才利用输入频谱对平均噪声频谱进行更新。因 此,实现了更精确的分段确定。
专利文献1:日本专利申请特开No.2001-265367

发明内容

然而,如在专利文献1中所述的现有技术中,仅在噪声分段中对平 均噪声频谱进行更新。因此,当噪声电平急剧上升时,噪声分段被错认 为语音分段,此后不对平均噪声频谱进行更新,从而不利地持续错误的 确定。
为了避免这种错误的确定,专利文献1还公开了下述的方法,即, 根据每带宽的信噪比SNRn来控制噪声更新的时间常数,以与分段确定的 结果无关地对噪声进行更新。
然而,当在语音分段中对平均噪声频谱进行更新时,由于语音的影 响而对平均噪声频谱明显估计过高。因此,出现了一个新的问题,即, 低电平的语音分段很容易被错认为噪声分段。
因此,本发明的一个目的是提供一种信号处理方法和装置,其中, 在具有急剧上升的噪声电平的分段中,提高所估算的噪声的跟踪速度 (following speed),以使得在信号分段中几乎不产生由于语音的影响而 导致的噪声频谱的估算误差。
(1)为了实现上述目的,根据本发明的信号处理方法包括:时域信 号提取步骤,用于提取时域信号,所述时域信号是输入信号的抽样数据; 频域信号分析步骤,用于按帧将所述时域信号转换成频域信号,并计算 输入频谱;以及噪声估算步骤,通过利用所述输入频谱的最小分量来估 算噪声频谱,所述噪声频谱是包括在所述输入信号中的噪声分量的频域 信号。将参照附图对这种方法进行描述。
首先,采用如图1所示的输入信号(叠加了噪声的语音)作为示例。 在图1中,分段(i)与(iv)是“噪声独占分段”(在下文中,称为噪声 分段)。在分段(iii)中,出现了噪声电平的急剧上升。分段(ii)与(v) 是“混合了语音与噪声的混合分段”(在下文中称为混合分段)。图2示 出了上述分段(i)、(ii)、(iv)以及(v)的典型输入频谱。
当将图2中的分段(i)的输入频谱A与分段(ii)的输入频谱A进 行比较时,分段(ii)中的“语音和噪声的混合分段”中的输入频谱A的 最小部分(图2中的实心圆)被所叠加的噪声屏蔽,其中噪声的贡献程 度很高。因此,这些最小部分变得在值方面等于作为“噪声独占分段” 的分段(i)中的输入频谱的最小部分。对于噪声电平增加的情况也是一 样,以使得作为“噪声独占分段”的分段(iv)中的频谱的最小部分的值 变得等于作为“语音和噪声的混合分段”的分段(v)中的频谱的最小部 分的值。在下文中,用直线来连接输入频谱的最小部分,这将被称为如 图2所示的最小频谱B。
基于这种原理,在本发明的时域信号提取步骤与频域信号分析步骤 中,根据预定分段的时域的输入信号计算作为频域信号的输入频谱A。 在噪声估算步骤中,通过利用输入频谱A的最小值来获得最小频谱B, 以估算作为当前帧内的噪声分量的频域信号的噪声频谱。
因此,在本发明中通过利用频谱的最小部分来计算所估算的噪声, 以使得几乎不产生由于语音信号的影响而导致的噪声频谱的估算误差, 并且可以在噪声电平的急剧上升分段中提高所估算的噪声的跟踪速度。
(2)在上述的(1)中,在噪声估算步骤中,可以获得每帧的瞬时 噪声频谱作为噪声频谱。
因此,由于在该帧内结束或完成了噪声频谱的估算步骤,所以使得 较高敏感度的噪声估算成为可能。同样,利用相对小规模的电路结构的 实现也成为可能。
(3)在上述的(2)中,在噪声估算步骤中,可以获得多个帧的瞬 时噪声频谱的平均噪声频谱作为噪声频谱。
因此,在长时间内对所估算的噪声频谱进行平均,以使得更稳定的 噪声估算成为可能。
(4)上述(1)-(3)中的任何一个可以进一步包括分段确定步骤, 用于对所述噪声频谱与所述输入频谱进行比较,并确定该帧是在混合了 语音和噪声的分段中还是在没有语音的噪声分段中。
也就是说,如图1和2所示,对基于输入频谱A和最小频谱B的瞬 时噪声频谱相互进行比较,由此可以指定混合分段和噪声分段,并且可 以构造在噪声抑制和节能方面优异的系统。
(5)在上述的(4)中,在噪声估算步骤中,当在分段确定步骤中 直到最后一帧的确定结果表示混合分段时,可以通过利用瞬时噪声频谱 来获得平均噪声频谱,而当确定结果表示噪声分段时,可以通过利用输 入频谱来获得平均噪声频谱。
也就是说,当在分段确定步骤中直到最后一帧的确定结果表示混合 分段时,通过如上所述利用瞬时噪声频谱来获得平均噪声频谱。另一方 面,当确定结果表示噪声分段时,不需要利用瞬时噪声频谱而只需要利 用输入频谱。因此,基于输入频谱来获得平均噪声频谱。
(6)上述的(4)可以进一步包括抑制量计算步骤,用于在考虑了 分段确定步骤中的确定结果的情况下,基于噪声频谱与输入频谱对输入 信号计算每带宽的抑制量,并抑制输入信号的噪声。
因此,基于噪声频谱与输入频谱计算输入信号的抑制量。然而,考 虑到分段确定步骤中的确定结果,如果在例如混合分段的情况下减小抑 制量,而在噪声分段的情况下增大抑制量,则可以进行更有效的噪声抑 制。
因此,具有灵敏度与稳定性之间的平衡的噪声估算成为可能。
(7)在上述(1)-(6)中的任何一个中,输入信号可以包括语音 信号。在这种情况下,可以提供有效的应用。
应当注意,可以实现用于分别执行在上述(1)-(7)中描述的信号 处理方法的信号处理装置。
根据本发明,在噪声电平的急剧上升分段中提高了所估算的噪声的 跟踪速度,并且在混合分段中减小了由于语音的影响而导致的噪声频谱 的估算误差,从而可以执行精确的分段确定。

附图说明

图1是用于说明本发明的原理的波形图,其示出了每分段的输入语 音信号的变化;
图2是示出了图1中的每分段的输入语音信号的频谱的频谱图;
图3是示出了根据本发明的第一实施方式的信号处理装置的构造框 图;
图4是示出了由本发明的第一实施方式的信号处理装置计算出的最 小频谱的示例的频谱图;
图5是用于说明校正系数的计算的频谱图,该校正系数用于与由根 据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘;
图6是用于说明校正系数的计算的关系图,该校正系数用于与由根 据本发明的第一实施方式的信号处理装置计算出的最小频谱相乘;
图7是示出了根据本发明的第二实施方式的信号处理装置的构造框 图;
图8是示出了本发明的第三实施方式的信号处理装置的配置框图;
图9是示出了用作本发明的第四实施方式的噪声抑制装置的信号处 理装置的构造框图。
标号的说明
1时域信号提取部
2频域信号分析部
3a、3b、3c噪声估算装置
4a、4b、4c分段确定装置
5抑制量计算部
7时域信号合成部
31瞬时噪声估算部
32b、32c平均噪声估算部
41a、41b、41c用于噪声/语音确定的参数计算部
42噪声/语音确定部
在所有附图中,相同的标号表示相同或相应的组件。

具体实施方式

在下文中,将参照附图对本发明的实施方式进行描述。
第一实施方式
图3是示出了根据本发明的第一实施方式的信号处理装置的构造框 图,该信号处理装置用作噪声估算装置和噪声分段确定装置。该信号处 理装置包括时域信号提取部1、频域信号分析部2、噪声估算装置3a、以 及分段确定装置4a。在下文中,将对该信号处理装置的各个块进行详细 描述。
时域信号提取部1对模拟输入语音信号进行量化,并从中提取时域 信号xn(k)(其中“n”表示帧编号)作为每单位时间(帧)的抽样数据。 同样,频域信号分析部2通过利用例如FFT(快速傅立叶变换)来执行 对时域信号xn(k)的频率分析,并计算输入频谱Xn(f)(与图2中的输入频 谱A相对应),输入频谱Xn(f)是输入信号的频谱幅值。在“Digital signal processing series vol.1:Digital signal processing(Tujii & Kamata),P94-P120, Shoukoudou”、“Computer music(Curtis Roads著,Aoyagi等编译), P452-P457,Tokyo Denki University Press”等中对FFT进行了详细描述。
应当注意,输入频谱Xn(f)可以被分成多个带宽,在各个带宽中可以 用通过加权平均等计算出的带宽频谱来替代输入频谱。
同样,可以用通过BPF(带通滤波器)计算出的每带宽的输入振幅 来替代输入频谱Xn(f)。通过下列过程来计算每带宽的输入振幅
首先,通过下列方程将输入信号xn(t)分成带宽信号
x ^ n ( i , t ) = Σ j = 0 M - 1 ( BPF ( i , j ) × x n ( t - j ) ) 方程(1)
BPF(i,j):用于带宽划分的FIR滤波器系数
M:FIR滤波器级数(degree)
i:带宽号
然后,按帧通过下列方程计算每带宽的输入幅值
X ^ n ( i ) = 1 N Σ l = 0 N - 1 x ^ n 2 ( i , t - l ) (N:帧长)                        方程(2)
向噪声估算装置3a和分段确定装置4a中输入这样获得的输入频谱。
噪声估算装置3a具有瞬时噪声估算部31,瞬时噪声估算部31根据 输入频谱Xn(f)的近似形式来估算瞬时噪声频谱Nn(f),该瞬时噪声频谱 Nn(f)是当前帧的噪声频谱,该输入频谱Xn(f)是由频域信号分析部2计算 的。通过下列过程来计算瞬时噪声频谱Nn(f):
首先,从输入频谱Xn(f)中选择频谱的最小值mn(k)。例如,选择满 足下列条件式的输入频谱Xn(f)作为最小值mn(k):
Xn(f)<Xn(f-1)并且Xn(f)<Xn(f+1)            方程(3)
然后,根据最小值mn(k)计算最小频谱Mn(f)(与图2中的最小频谱 B相对应)。如果假定第k个频率是mn(k),则可以用最小值mn(k)与fk的 函数来表示最小频谱Mn(f)。例如,当例如最小频谱Mn(f)是如图4所示 的函数时,可以用下列方程来表示最小频谱Mn(f):
M n ( f ) = m n ( k - 1 ) + ( m n ( k ) - m n ( k - 1 ) ) ( f k - f k - 1 ) × ( f - f k - 1 ) 方程(4)
应当注意,虽然图4示出了利用非线性函数来计算最小频谱Mn(f) 的示例,但是也可以利用高阶多项式方程、线性函数等。
然后,通过利用这样获得的最小频谱Mn(f)来计算瞬时噪声频谱 Nn(f)。应当注意,可以通过将校正系数αn(f)与最小频谱Mn(f)相加或相乘 来具体计算瞬时噪声频谱Nn(f)。
校正系数αn(f)可以是预先根据经验从实际噪声中获得的常数(考虑 到噪声的离差等),或者可以是对每帧计算的变量。在下文中,αn(f)是变 量的情况被表示为计算示例1和2。
作为计算示例1,在被随后的噪声/语音确定部42确定为噪声分段的 过去的分段中,初步计算输入频谱Xn(f)的离差值σn(f),以根据离差值 σn(f)计算校正系数αn(f)。可以计算每频率带宽的离差值σn(f),或者可 以在某个特定的带宽中通过加权平均等计算离差值σn(f)。
作为用离差值σn(f)计算校正系数αn(f)的一个示例,可以利用下列方 程:
αn(f)=γn(f)×σn(f)                     方程(5)
系数γn(f)是通过实验获得的经验值。
作为计算示例2,根据输入频谱Xn(f)与最小频谱Mn(f)之间的比率的 积分值Rxmn来计算校正系数αn(f)。用下列方程来表示积分值Rxmn:
Rxm n = Σ f = 0 L - 1 ( X n ( f ) M n ( f ) ) (L:频率带宽的数量)                   方程(6)
积分值Rxmn与图5中的阴影区域的面积相对应。在图5(1)示出 的噪声独占分段中,积分值Rxmn很小,而在图5(2)示出的语音和噪 声的混合分段中,积分值Rxmn很大。因此,将校正系数αn(f)规定为例 如图6所示的积分值Rxmn的函数,基于瞬时噪声计算的校正系数αn(f)根 据语音信号在输入信号中的贡献程度而改变,以使得可以估算更接近于 实际情况的噪声频谱。
此时,可以在某个特定的带宽中计算积分值Rxmn。同样,可以对频 率带宽中的Rxm-1、Rxm-2、α-1(f)以及α-2(f)使用不同的值,或者可以 在某个特定的带宽中使用相同的值。应当进行适当的选择,以便与实际 的噪声频谱相对应。
从噪声估算装置3a输出由瞬时噪声估算部31这样估算出的瞬时噪 声频谱Nn(f)。
同时,向分段确定装置4a发送瞬时噪声频谱Nn(f),分段确定装置 4a具有噪声/语音确定部42和用于噪声/语音确定的参数计算部41a。用 于噪声/语音确定的参数计算部41a通过利用瞬时噪声估算部31计算出的 瞬时噪声频谱Nn(f)和来自频域信号分析部2的输入频谱Xn(f)来计算用于 分段确定的参数。
作为用于分段确定的参数,根据例如输入频谱Xn(f)计算输入信号的 功率,并且根据瞬时噪声频谱Nn(f)计算瞬时噪声的功率。根据各个功率 计算出的信噪比SNRn被用作用于分段确定的参数。同样,根据输入频谱 Xn(f)和瞬时噪声频谱Nn(f)计算出的每带宽的信噪比的积分值Rn等也可 以被用作用于分段确定的参数。可以用下列方程来表示积分值Rn:
R n = Σ f = 0 L - 1 ( X n ( f ) N n ( f ) ) (L:频率带宽的数量)                             方程(7)
应当注意,用于获得积分值Rn的频率的积分范围可以被限于用于计 算的某个特定的带宽。
噪声/语音确定部42通过对分段确定参数和阈值进行比较来执行分 段确定,并输出确定结果vad_flag,该分段确定参数是由用于噪声/语音 确定的参数计算部41a计算的。也就是说,如果确定结果vad_flag是 FALSE,则意味着该帧是包括语音的混合分段,而如果确定结果vad_flag 是TRUE,则意味着该帧是没有语音的噪声分段。
作为分段确定参数,可以使用由用于噪声/语音确定的参数计算部 41a计算出的信噪比SNRn或者使用积分值Rn。为了更有效的实现,可以 将用于噪声/语音确定的参数计算部41a设置为计算信噪比SNRn和积分 值Rn两者,其中,分段确定参数被计算为信噪比SNRn和积分值Rn的函 数,以用于确定。
第二实施方式
图7示出了根据本发明的第二实施方式的信号处理装置,该信号处 理装置用作噪声估算装置和噪声分段确定装置。以与根据第一实施方式 的信号处理装置相同的方式,该信号处理装置包括时域信号提取部1、频 域信号分析部2、噪声估算装置3b、以及分段确定装置4b。在该第二实 施方式中,与第一实施方式不同,未发生变化的瞬时噪声频谱不被假定 为估算噪声频谱,而是被用来计算平均噪声频谱,该平均噪声频谱被输 出为估算噪声频谱。应当注意,具有与图3中相同的标号的块与第一实 施方式中的块相同,因此将在下文中省略对其的描述。
也就是说,噪声估算装置3b中的平均噪声估算部32b通过利用由瞬 时噪声估算部31计算出的瞬时噪声频谱Nn(f)来计算平均噪声频谱 Nn(f)。在下文中,作为平均噪声频谱Nn(f)的实施方式,可以提及下列 的计算1和2。
作为计算示例1,通过利用FIR滤波器来计算平均噪声频谱Nn(f)。 此时,通过对包括当前帧的过去的K帧的瞬时噪声频谱Nn(f)进行加权平 均来计算平均噪声频谱Nn(f)。这可以用下列方程来表示:
N n ( f ) = Σ n = 0 K - 1 β n ( f ) × N n ( f ) βn(f):加权系数                               方程(8)
加权系数βn(f)可以被设定为对于每一频率不同的值。
作为计算示例2,通过IIR滤波器来计算平均噪声频谱。此时,以瞬 时噪声频谱Nn(f)的长期平均来计算平均噪声频谱Nn(f)。这可以用下列方 程来表示:
Nn(f)=λ(f)×Nn-1(f)+(1-λ(f))×Nn(f)
λ(f):加权系数                            方程(9)
加权系数λn(f)可以被设定为对于每一频率不同的值。
已接收到由平均噪声估算部32b这样获得的平均噪声频谱Nn(f)的 用于噪声/语音确定的参数计算部41b可以通过利用平均噪声频谱Nn(f) 而不是瞬时噪声频谱Nn(f)来类似地计算在第一实施方式的用于噪声/语 音确定的参数计算部41a中描述的信噪比SNRn和每频带的信噪比的积分 值Rn。噪声/语音确定部42中的后续处理与第一实施方式中的相同。
第三实施方式
图8示出了本发明的第三实施方式的用作噪声估算装置和噪声分段 确定装置的信号处理装置。以与根据第一实施方式的信号处理装置相同 的方式,该信号处理装置包括时域信号提取部1、频域信号分析部2、噪 声估算装置3c、以及分段确定装置4c。然而,该实施方式与第二实施方 式的不同之处在于,被确定为噪声分段的分段的输入频谱未发生变化地 用于后续帧中的平均噪声频谱的计算。应当注意,具有与图3中相同的 标号的块与第一实施方式中的块相同,因此将在下文中省略对其的描述。
平均噪声估算部32c计算平均噪声频谱Nn(f)。为了计算平均噪声频 谱Nn(f),在分段确定装置4c中通过利用输入频谱Xn(f)和直到最后一帧 的平均噪声频谱Nn-1(f)来执行分段确定。
结果,在被确定为混合分段(vad_flag=FALSE)的分段中利用瞬时 噪声频谱Nn(f)来计算平均噪声频谱Nn(f),并且在被确定为噪声分段 (vad_flag=TRUE)的分段中利用输入频谱Xn(f)来计算平均噪声频谱 Nn(f)。
也就是说,当确定结果表示噪声分段时,输入信号是噪声分量本身, 因此如上所述,只需要利用输入频谱而不需要利用瞬时噪声频谱。
用于噪声/语音确定的参数计算部41c通过用在平均噪声估算部32c 中计算的直到最后一帧的平均噪声频谱Nn-1(f)代替瞬时噪声频谱Nn(f)来 计算由第一实施方式的用于噪声/语音确定的参数计算部41a计算的信噪 比SNRn和每频带的信噪比的积分值Rn。
第四实施方式(噪声抑制装置)
图9示出了根据本发明的第四实施方式的用作噪声抑制装置的信号 处理装置。该噪声抑制装置包括时域信号提取部1、频域信号分析部2、 噪声估算装置3a、以及分段确定装置4a,这些组件都已在根据第一实施 方式的信号处理装置中进行了描述。根据第四实施方式的噪声抑制装置 进一步具有抑制量计算部5、抑制部6、以及时域信号合成部7。
首先,频域信号分析部2通过利用FFT来产生输入频谱Xn(f)。抑制 量计算部5通过利用由频域信号分析部2计算出的输入频谱Xn(f)和由瞬 时噪声估算部31计算出的瞬时噪声频谱Nn(f)来计算每带宽的抑制系数 Gn(f)。通过下列方程来计算抑制系数Gn(f):
G n ( f ) = W n ( f ) ( 1 - N n ( f ) X n ( f ) ) , ( 0 < G n ( f ) < 1 ) 方程(10)
应当注意,当噪声/语音确定部42中的确定结果vad_flag表示混合 分段时,减小方程(10)中的系数Wn(f),并且当确定结果表示噪声分段 时,增大系数Wn(f),从而使得噪声分段中的抑制系数变得大于混合分段 中的抑制系数。因此,可以增加抑制量。
抑制部6通过利用输入频谱Xn(f)和由抑制量计算部5计算出的抑 制系数Gn(f)而在噪声抑制后计算每带宽的振幅谱Yn(f)。通过下列方程计 算振幅谱Yn(f):
Yn(f)=Xn(f)×Gn(f)                  方程(11)
时域信号合成部7通过IFFT(快速傅立叶逆变换)把振幅谱Yn(f) 从频域逆变换到时域,以计算输出信号yn(t)。
虽然图9利用了第一实施方式中示出的噪声估算装置3a和分段确定 装置4a,但是也可以利用在第二实施方式和第三实施方式中示出的噪声 估算装置3a和分段确定装置4a。此时,抑制量计算部5通过用平均噪声 频谱Nn(f)代替瞬时噪声频谱Nn(f)来计算抑制系数Gn(f)。
虽然已通过上述的实施方式对本发明进行了详细描述,但是显而易 见的是,本发明不限于上述实施方式。在不脱离权利要求的描述所确定 的目的和范围的情况下,本发明的装置可以被实现为经修正的和经修改 的方式。
例如,在根据本发明的第四实施方式的噪声抑制装置中,当用FIR 滤波器计算出的每带宽的输入幅值代替用FFT计算出的输入频谱 Xn(f)时,可以通过利用与每带宽的输入幅值相对应的逆变换而不是IFFT 来计算时域的输出信号yn(t)。