语音增强方法、装置及头戴式降噪通信耳机转让专利

申请号 : CN201110381933.6

文献号 : CN102411936B

文献日 : 2012-11-14

本发明公开了一种语音增强方法、装置及头戴式降噪通信耳机。在本发明的方案中，利用具有特定相对位置关系的主振动传声器和辅振动传声器，分别拾取通过耦合振动方式传过来的使用者的语音信号和从空气中传播进来的外界环境噪声信号的第一声音信号，和拾取主要从空气中传播进来的外界环境噪声信号的第二声音信号，且两振动传声器拾取的外界环境噪声信号具有相关性；根据第一声音信号和第二声音信号确定控制自适应滤波器更新速度的控制参数；根据第二声音信号和控制参数对第一声音信号进行降噪滤波；对降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。本发明的技术方案，能够有效提升高强度噪声环境下的语音信噪比和语音质量。

1.一种语音增强装置，其特征在于，该装置包括：声学语音增强单元和电子语音增强单元；其中，声学语音增强单元包括：具有特定相对位置关系的主振动传声器和辅振动传声器；所述特定相对位置关系使得主振动传声器拾取通过耦合振动方式传过来的使用者的语音信号和从空气中传播进来的外界环境噪声信号，辅振动传声器主要拾取从空气中传播进来的外界环境噪声信号，并且主振动传声器和辅振动传声器所拾取的从空气中传播进来的外界环境噪声信号具有相关性；

电子语音增强单元包括：语音检测模块、自适应滤波模块和后处理模块；其中，语音检测模块，用于根据所述主振动传声器和辅振动传声器输出的声音信号确定所述自适应滤波模块的更新速度并输出控制参数；

自适应滤波模块，用于根据所述辅振动传声器输出的声音信号和所述语音检测模块输出的控制参数对所述主振动传声器输出的声音信号进行降噪滤波，并输出降噪滤波后的语音信号；

后处理模块，用于对所述自适应滤波模块输出的降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。

2.根据权利要求1所述的装置，其特征在于，

所述主振动传声器由麦克风放在密闭的胶套中构成，并且麦克风的振膜与胶套之间设置有密闭空气腔；

所述辅振动传声器的结构与所述主振动传声器的结构相同。

3.根据权利要求1所述的装置，其特征在于，

所述主振动传声器和辅振动传声器分别放置在传声器支杆的正反两面，且主振动传声器和辅振动传声器之间有隔振处理结构。

4.根据权利要求1所述的装置，其特征在于，所述后处理模块包括：单通道降噪子模块，用于统计出自适应滤波模块输出的降噪滤波后的语音信号中残留的平稳噪声的能量，并从自适应滤波模块输出的降噪滤波后的语音信号中减去这部分噪声能量，然后输出给语音高频增强子模块；

语音高频增强子模块，用于对单通道降噪子模块降噪处理后的语音信号进行高频成分的增强处理。

5.根据权利要求1所述的装置，其特征在于，

所述语音检测模块，用于通过计算在低频范围内的主振动传声器输出的声音信号和辅振动传声器输出的声音信号的统计能量比值来确定所述控制参数；其中统计能量比值越大，所述控制参数的值越小，且所述控制参数的取值范围为0到1；

或者，

所述语音检测模块，用于通过计算主振动传声器输出的声音信号和辅振动传声器输出的声音信号在每个频率子带的统计能量比值来确定每个频率子带的控制参数；其中频率子带的统计能量比值越大，该频率子带对应的控制参数的值越小，且每个频率子带对应的控制参数的取值范围为0到1。

6.根据权利要求1所述的装置，其特征在于，所述自适应滤波模块包括：自适应滤波器和减法器；其中，自适应滤波器，用于在所述控制参数的控制下对辅振动传声器输出的声音信号进行滤波，并输出给减法器；

减法器，用于将主振动传声器输出的声音信号与自适应滤波器输出的信号相减后输出降噪滤波后的语音信号，并且将该降噪滤波后的语音信号反馈给自适应滤波器。

7.一种头戴式降噪通信耳机，其特征在于，该通信耳机包括语音信号传送端口和如权利要求1-6中任一项所述的语音增强装置；

所述语音信号传送端口，用于接收所述语音增强装置降噪后的语音信号，并传送给远端用户。

8.一种语音增强方法，其特征在于，该方法包括：

利用具有特定相对位置关系的主振动传声器和辅振动传声器，分别拾取第一声音信号和第二声音信号；所述特定相对位置关系使得所述第一声音信号包括通过耦合振动方式传过来的使用者的语音信号和从空气中传播近来的外界环境噪声信号，所述第二声音信号主要为从空气中传播进来的外界环境噪声信号，并且所述第一声音信号和第二声音信号中的外界环境噪声信号具有相关性；

根据所述第一声音信号和第二声音信号确定控制自适应滤波器更新速度的控制参数；

根据所述第二声音信号和所述控制参数对所述第一声音信号进行降噪滤波，输出降噪滤波后的语音信号；

对所述降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。

9.根据权利要求8所述的方法，其特征在于，对所述降噪滤波后的语音信号做进一步的降噪和语音高频增强处理包括：统计出所述降噪滤波后的语音信号中残留的平稳噪声的能量，并从所述降噪滤波后的语音信号中减去这部分噪声能量，然后再进行高频成分的增强处理。

10.根据权利要求8或9所述的方法，其特征在于，所述根据所述第一声音信号和第二声音信号确定控制自适应滤波器更新速度的控制参数包括：通过计算在低频范围内的第一声音信号和第二声音信号的统计能量比值来确定所述控制参数，其中统计能量比值越大，所述控制参数的值越小，且所述控制参数的取值范围为

0到1；

或者，

通过计算第一声音信号和第二声音信号的在每个频率子带的统计能量比值来确定每个频率子带的控制参数，其中频率子带的统计能量比值越大，该频率子带对应的控制参数的值越小，且每个频率子带对应的控制参数的取值范围为0到1。

语音增强方法、装置及头戴式降噪通信耳机

技术领域

[0001] 本发明涉及语音信号处理技术领域，更为具体地，涉及一种送话端的语音增强方法、装置和头戴式降噪通信耳机。

背景技术

[0002] 随着技术的进步和社会信息化程度的提高，人与人之间的通信交流方式也越来越快捷和方便，各种各样的通信设备和技术的广泛应用极大地方便了人们的生活和提高了工作效率。但是，伴随社会的发展而随之产生的噪声问题也严重影响到通信语音的清晰度和可懂度，当噪声高到一定程度时，不但通信根本就无法进行，而且会伤害到人的听力和身心健康。尤其是在一些特殊的地方，如机场、车站、大型工业工厂车间等场合，对通信的实时性和通信语音的清晰度和可懂度要求非常高，然而在这些特殊场合，外界噪声的强度往往都会达到100分贝以上，在这种极限噪声情况下进行送话，远端用户接受到的语音信号会完全被环境噪声淹没，根本得不到任何有用的信息。因此有必要在通信设备的送话端采取有效的语音增强方法来提高送话端语音的信噪比。

[0003] 目前常用的通信设备送话端的语音增强方法包括两大类，一类是采用单个或多个普通麦克风拾取信号，然后采用声学信号处理方法来达到语音增强的目的；另一类是采用特殊声学传声器，如近讲麦克风和振动传声器来达到有效拾取语音信号和抑制噪声的目的。

[0004] 单个麦克风语音增强一般称之为单通道谱减语音增强技术(参见中国发明专利申请公开说明书CN1684143A，CN101477800A)，这种技术一般通过对历史数据的分析来估计当前语音中噪声的能量，然后通过频谱相减的方法消除语音中的噪声来达到语音增强的目的。采用两个或多个麦克风组成的麦克风阵列语音增强技术(参见中国发明专利申请公开说明书CN101466055A，CN1967158A)则通常是用一个麦克风接收到的信号作为参考信号，通过自适应滤波的方法实时的估计并抵消另外一个麦克风拾取信号中的噪声成分，保留语音成分，从而达到语音增强的目的。采用单个或多个普通麦克风的语音增强方法，其性能很大程度上依赖于对语音状态的检测和判断，否则不但不能很好的消除噪声，而且还会给语音信号带来较大的损伤。在低噪声环境中，对语音状态的检测和判断是可行和准确的，但在强噪声环境中，语音信号将会完全被噪声所淹没，在这种极低信噪比情况下，采用普通麦克风的语音增强技术将得不到较好效果或者根本无法适用。

[0005] 另一类是采用一些特殊的声学传声器，如近讲麦克风、振动传声器等，以在噪声环境下提高拾取语音信噪比，从而达到语音增强的目的。近讲麦克风又称之为降噪麦克风，是采用压差原理进行设计的麦克风，具有指向性和“近讲效应”，对噪声尤其是远场低频噪声有大约15dB左右的降噪效果，现在一般的话务耳机和一些专业通信领域的耳机较多采用近讲麦克风。振动传声器需要与振动面有较好耦合来拾取有用信号，对空气传导过来的噪声信号则有20～30dB的降噪效果。但近讲麦克风的降噪量有限并且不能有效抑制风噪声；振动传声器(参见中国实用新型专利说明书CN2810077Y)虽然对噪声(包括风噪声)在全频带有20～30dB的降噪量，但其频响特性差，不能有效拾取语音的高频信息，通话语音的自然度和可懂度不能保证，因此这两类特殊的声学传声器都不能较好应用于高强度噪声环境下的通信耳机。

发明内容

[0006] 鉴于上述问题，本发明的目的是提供一种能够有效结合振动传声器和声学信号处理技术的语音增强方案，用来提升高强度噪声环境下通信送话端的语音信噪比和语音质量。

[0007] 本发明公开了一种语音增强装置，该装置包括：声学语音增强单元和电子语音增强单元；其中，

[0008] 声学语音增强单元包括：具有特定相对位置关系的主振动传声器和辅振动传声器；所述特定相对位置关系使得主振动传声器拾取通过耦合振动方式传过来的使用者的语音信号和从空气中传播进来的外界环境噪声信号，辅振动传声器主要拾取从空气中传播进来的外界环境噪声信号，并且主振动传声器和辅振动传声器所拾取的从空气中传播进来的外界环境噪声信号具有相关性；

[0009] 电子语音增强单元包括：语音检测模块、自适应滤波模块和后处理模块；其中， [0010] 语音检测模块，用于根据所述主振动传声器和辅振动传声器输出的声音信号确定所述自适应滤波模块的更新速度并输出控制参数；

[0011] 自适应滤波模块，用于根据所述辅振动传声器输出的声音信号和所述语音检测模块输出的控制参数对所述主振动传声器输出的声音信号进行降噪滤波，并输出降噪滤波后的语音信号；

[0012] 后处理模块，用于对所述自适应滤波模块输出的降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。

[0013] 本发明还公开了一种头戴式降噪通信耳机，该通信耳机包括语音信号传送端口和如上所述的语音增强装置；

[0014] 所述语音信号传送端口，用于接收所述语音增强装置降噪后的语音信号，并传送给远端用户。

[0015] 本发明还公开了一种语音增强方法，该方法包括：

[0016] 利用具有特定相对位置关系的主振动传声器和辅振动传声器，分别拾取第一声音信号和第二声音信号；所述特定相对位置关系使得所述第一声音信号包括通过耦合振动方式传过来的使用者的语音信号和从空气中传播近来的外界环境噪声信号，所述第二声音信号主要为从空气中传播进来的外界环境噪声信号，并且所述第一声音信号和第二声音信号中的外界环境噪声信号具有相关性；

[0017] 根据所述第一声音信号和第二声音信号确定控制自适应滤波器更新速度的控制参数；

[0018] 根据所述第二声音信号和所述控制参数对所述第一声音信号进行降噪滤波，输出降噪滤波后的语音信号；

[0019] 对所述降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。 [0020] 由上述可见，在本发明的技术方案中，对送话端的语音在声学层面和电子层面分别进行了语音增强。具体来说：在声学层面上，利用具有特定相对位置关系的主振动传声器和辅振动传声器，分别拾取包括使用者的语音信号和外界环境噪声信号的第一语音信号和以外界环境噪声信号为主的第二声音信号，由于采用了振动传声器结构，因此在拾取时就能将外界噪声衰减 20～30dB，并且第一声音信号和第二声音信号的外界环境噪声具有高度的相关性，这为电子层面上的语音增强算法提供了较好的噪声参考信号；在电子层面上首先根据第一声音信号和第二声音信号，确定控制自适应滤波器更新速度的控制参数，然后根据第二声音信号和所述控制参数对所述第一声音信号进行降噪滤波得到信噪比较高的语音信号，最后对降噪滤波后的语音信号做进一步的降噪和语音高频增强处理，从而大大改善了送话端语音的可懂度和清晰度。可见通过上述的声学层面和电子层面的语音增强处理，最终能够在通信的送话端提供高达40～50dB的降噪量，极大地提高通信送话端的语音信噪比，并较好地改善了送话端语音的自然度和可懂度，极大提高了高强度噪声环境下的语音信噪比和语音质量。

附图说明

[0021] 图1为带有胶套的麦克风构成的振动传声器的结构示意图；

[0022] 图2为根据本发明的语音增强装置中装配在支杆上的主、辅振动传声器的结构示意图；

[0023] 图3A为主振动传声器与耳机佩戴者头部耦合位置示意图；

[0024] 图3B为应用本发明的带有传声器支杆的耳机与佩戴者腮部耦合的效果示意图； [0025] 图4为本发明中电子层面语音增强的系统方框图；

[0026] 图5为本发明的语音增强方法的具体流程示意图；

[0027] 图6为本发明的语音增强装置的方框图；

[0028] 图7为本发明的头戴式降噪通信耳机的方框图。

[0029] 在所有附图中相同的标号指示相似或相应的特征或功能。

具体实施方式

[0030] 以下将结合附图对本发明的具体实施例进行详细描述。

[0031] 本发明的语音增强方法包括两大部分，第一部分是声学层面上进行语音增强，并为电子层面上的语音增强算法提供较好信噪比的主信号和与主信号具有高度相关性的噪声参考信号；第二部分是采用声学信号处理方法，进一步对信号进行语音增强处理，提高语音的信噪比，改善送话端语音的可懂度和舒适度。下面将对声学层面和电子层面上的语音增强技术方案分别进行阐述。

[0032] 在声学层面上，本发明采用双振动传声器结构，主振动传声器和辅振动传声器具有相似的结构并且在空间位置上相互靠近，即主振动传声器和辅振动传声器具有特定相对位置关系。该特定相对位置关系使得主振动传声器拾取通过耦合振动方式传过来的使用者的语音信号和从空气中传播进来的外界环境噪声信号，而辅振动传声器主要拾取从空气中传播进来的外界环境噪声信号，并且分别从空气中传播进主振动传声器和辅振动传声器的外界环境噪声信号具有相关性。具体来说，主振动传声器与耳机佩戴者直接接触，通过耦合振动的方式有效拾取耳机佩戴者的语音信号，辅振动传声器不与耳机佩戴者直接接触，不耦合通过振动传过来的语音信号。对于空气中传播过来的噪声信号，主、辅振动传声器都会大约20～30dB的衰减，并且通过调整主、辅传声器的位置可以保证两个振动传声器拾取到的噪声信号有比较好的相关性。

[0033] 在本发明的一个具体实施方式中，采用具有密闭胶套结构的麦克风作为振动传声器。图1为麦克风放在密闭胶套中构成振动传声器的结构示意图，如图1所示，麦克风(MIC)10放置在密闭胶套20中，并且在麦克风10的振膜与胶套20之间保留一定的密闭空气腔30以供声音信号通过。从空气当中传播过来的外界环境噪声因为要经过胶套20的衰减才能被麦克风10的振膜拾取到，所以噪声会被大大降低；而对于耦合在胶套20上表面的振动信号，胶套20表面的振动会直接导致密闭空气腔30体积的变化，从而引起麦克风10振膜的振动，所以胶套20上表面的振动信号会被麦克风10有效的拾取到。 [0034] 另外，带有胶套20的麦克风10在隔离外界噪声的同时必须有效耦合耳机佩戴者的语音信号，一般人讲话时，人头部的很多部分都会包含一定的语音振动信号(尤其是低频信息)，而这其中又以喉部和腮部振动包含的语音频谱信息较丰富。因此，考虑到耳机的佩戴方便和美观，在本发明的一个优选实施方式中，设计如图2所示的传声器支杆，支杆头部的正反两面各放置一个带有胶套的麦克风，分别称为主振动传声器112和辅振动传声器114，其中主振动传声器112设置在贴近佩戴者面部的一面，辅振动传声器114设置在与主振动传声器112相背的另一面。主振动传声器112与耳机佩戴者头部的耦合位置可以有多种选择，图3A示出了主振动传声器与头部耦合的可能位置示意图，包括头顶301、额部302、腮部303、鬓部304、耳内305、耳后306、喉部307等，带有传声器支杆的耳机与佩戴者腮部耦合效果如图3B所示。主振动传声器112的胶套正面与耳机佩戴者的腮部保持较好的耦合，从而能较好拾取耳机佩戴者的语音信息。而辅振动传声器114不与人脸直接耦合，所以对耳机佩戴者语音信号不敏感。

[0035] 并且，采用如图1所示的胶套结构和如图2、图3B所示的支杆和耳机佩戴方式，能够保证主振动传声器112拾取到的是较好的语音信号和被衰减大约20～30dB的外界噪声信号，辅振动传声器114拾取到的主要是被衰减大约20～30dB的外界噪声信号，辅振动传声器114拾取到的较纯净的外界噪声信号可以为下一步电子层面的降噪提供较好的外界噪声参考信号。在空间上主振动传声器112、辅振动传声器114距离相对较近，并有相似的胶套结构，保证泄露进两个胶套的外界噪声信号具有较好的相关性，以确保电子层面对噪声信号能够进一步降低。

[0036] 另外为了避免辅振动传声器114拾取到较多的振动语音信号，从而导致在电子层面损伤主振动传声器112中的语音信号，最好能够在主振动传声器112、辅振动传声器114之间采取较好的隔振处理措施。在本发明的一个优选实施方式中，采用在主、辅传声器胶套之间增加一些垫片来达到隔振的目的。

[0037] 经过声学层面的语音增强后，主振动传声器112中信号的信噪比有了大约20dB提高，但还是不能满足在极限噪声情况下通信的要求。所以在本发明中，采用声学信号处理的技术进一步提高语音信号的信噪比，并改善通过振动拾取的语音信号的自然度和清晰度。 [0038] 需要说明的是，本发明中的振动传声器并不仅限于上述具有密闭胶套结构的麦克风，也可以采用现有的骨导传声器，或者采用普通的驻极体(ECM)麦克风增加特殊声学结构设计来达到类振动传声器的效果。本发明后续会针对采用普通麦克风加特殊声学结构设计来阐述。

[0039] 图4为对经过声学层面语音增强后的信号进行电子层面语音增强的系统方框图。如图4所示，电子层面的语音增强，主要包括语音检测模块210、自适应滤波模块220和后处理模块230，其中语音检测模块210用于根据主振动传声器112和辅振动传声器114输出的声音信号确定自适应滤波模块220的更新速度并输出控制参数α；自适应滤波模块220则根据辅振动传声器114输出的声音信号和语音检测模块210输出的控制参数α对主振动传声器112输出的声音信号进行降噪滤波，并输出降噪后的语音信号；后处理模块
230用于对采用自适应滤波模块220输出的降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。

[0040] 当存在语音信号时，主振动传声器112直接耦合佩戴者腮部的振动拾取到较大的语音信号；虽然辅振动传声器114不与腮部直接耦合，但因为其与佩戴者嘴部距离较近，当佩戴者大声讲话时，通过空气泄露而被辅振动传声器114拾取到的语音信号也不能够被忽略。这时如果把辅振动传声器114的信号直接作为滤波参考信号来更新自适应滤波器并进行滤波，将有可能对语音造成损伤，所以必须先由语音检测模块210根据主振动传声器112和辅振动传声器114输出的声音信号确定自适应滤波模块220中自适应滤波器的更新速度，并输出表示控制自适应滤波器221更新速度的控制参数α。

[0041] 在本发明的一个具体实施方式中，控制参数α的值是采用计算在低频范围内主振动传声器112与辅振动传声器114的统计能量比值P_ratio来确定的，能量比值P_ratio越大表示主振动传声器112所拾取的声音信号中存在目标语音的比例越大，α的值就越小，自适应滤波器的更新速度就越慢；反之，能量比值P_ratio越小则表示表示主振动传声器112所拾取的声音信号中存在目标语音的比例越小、存在环境噪声的比例越大，α的值就越大，自适应滤波器221的更新速度就越快。低频范围是指500Hz以下的频率范围。α的取值范围为0≤α≤1，在本发明的一个优选实施方式中，设定P_ratio大于10dB时，认为主振动传声器112所拾取的声音信号全部为目标语音信号，α＝0，自适应滤波器停止更新；P_ratio小于0dB时，认为主振动传声器112所拾取的声音信号全部为环境噪声信号，α＝1，自适应滤波器以最快速度更新。

[0042] 自适应滤波模块220包括一个自适应滤波器221和一个减法器222，在本发明的一个具体实施方式中，采用一个阶长为P(P≥1)的FIR滤波器作为降噪滤波的自适应滤波器，滤波器的权值是本实施方案P＝64，阶长主要取决于系统采样频率和主、辅传声器之间声学传递路径的复杂性。

[0043] 假设主振动传声器112和辅振动传声器114所拾取并输出的声音信号分别为第一声音信号s1(n)和第二声音信号s2(n)，自适应滤波器221的输入信号为辅振动传声器114所拾取的声音信号s2(n)，在控制参数α的更新速度控制下，自适应滤波器221滤波输出信号s3(n)，减法器222将s3(n)与主振动传声器112所拾取的声音信号s1(n)相减得到噪声抵消后的信号y(n)，y(n)反馈回自适应滤波器221进行滤波器权值的再次更新。 [0044] 自适应滤波器221的更新速度受控制参数α的控制，当α＝1，即s1(n)、s2(n)中全是噪声成分，自适应滤波器221快速收敛到噪声从辅振动传声器114到主振动传声器112的传递函数H_noise，使得s3(n)与s1(n)相同，抵消后的y(n)很小，从而消除噪声。
当α＝0，即s1(n)、s2(n)中全是目标语音成分，自适应滤波器停止更新，从而自适应滤波器不会收敛到语音从辅振动传声器114到主振动传声器112的传递函数H_speech，s3(n)与s1(n)不同，从而相减后的语音成分不会被抵消，输出y(n)保留了语音成分。当0＜α＜1时，即主振动传声器112所拾取到的声音信号中同时有语音成分和环境噪声成分，这时自适应滤波器221的更新速度由语音成分和环境噪声成分的多少来控制，以保证消除噪声的同时保留语音成分。

[0045] 另外，由于噪声从辅振动传声器114到主振动传声器112的传递函数H_noise与语音从辅传声器114到主振动传声器112的传递函数H_speech有相似性，因此即使自适应滤波器221收敛到H_noise仍然会对语音造成一定程度的损害，因此需要采用α来约束自适应滤波器221的权值。在本发明的一个具体实施方式中所做的约束是当α＝1，即认为主振动传声器112所拾取到的声音信号中全是环境噪声成分，自适应滤波器221不做约束，环境噪声被完全消除；当α＝0，即认为主振动传声器112所拾取到的声音信号中全是语音成分，自适应滤波器221完全约束，语音完全保留；当0＜α＜1时，即认为主振动传声器112所拾取到的声音信号中同时有语音成分和环境噪声成分，自适应滤波器221部分约束，环境噪声部分消除而将语音完全保留，通过这种处理方式达到在降噪的同时很好地保护语音的效果。

[0046] 需要说明的是，虽然在上述具体实施方式中是利用时域自适应滤波器进行降噪，但本领域技术人员应当明了，在滤波时所采用的滤波器并不限于时域自适应滤波器，也可利用频域(子带)自适应滤波器降噪，进一步可通过主振动传声器112与辅振动传声器114的每个频率子带的统计能量比P_ratioi得到每个频率子带的控制参数αi，并独立控制频率自适应滤波器每个频率子带的更新。i为频率子带的标识，其中每个频率子带的统计能量比越大，该频率子带对应的αi的值越小，αi的取值范围为0≤αi≤1，即αi的取指范围为0到1。

[0047] 在本发明的一个优选实施方式中，后处理模块230包括单通道降噪子模块231和语音高频增强子模块232。单通道降噪子模块231首先根据噪声平稳的特性统计出自适应滤波模块220的输出信号y(n)中残留的平稳噪声的能量；另外，由于振动方式拾取到的语音信号高频能量较小，导致处理后的语音的清晰度和可懂度不高，因此再采用语音高频增强子模块232对经过单通道降噪子模块231做单通道降噪处理后的语音信号进行高频成分的增强，从而极大的改善输出语音信号的清晰度和可懂度，使得用户获得足够清晰的语音信号。

[0048] 在本发明的一个具体实施方式中，单通道降噪子模块231利用平滑平均的方法统计出噪声能量，并在信号y(n)中减去这部分噪声能量，从而进一步降低自适应滤波模块220所输出的y(n)中的噪声成分并保留其中的语音成分，以达到提高语音信号信噪比的效果。

[0049] 结合上述对本发明的技术方案的表述，图5为本发明提供的语音增强方法的具体流程示意图。如图5所示，本发明的语音增强方法包括如下步骤：

[0050] 首先，在步骤S510中，利用主振动传声器112和辅振动传声器114分别拾取第一声音信号s1(n)和第二声音信号s2(n)，其中第一声音信号s1(n)包括通过耦合振动方式传过来的使用者的语音信号和从胶套泄露进麦克风的外界环境噪声信号，第二声音信号s2(n)主要为从胶套泄露进麦克风的外界环境噪声信号，并且由于振动传声器的位置设置使得第一声音信号s1(n)和第二声音信号s2(n)中的外界环境噪声信号具有相关性； [0051] 在步骤S520中，根据第一声音信号s1(n)和第二声音信号s2(n)确定自适应滤波器的更新速度并输出控制参数α，0≤α≤1；

[0052] 在步骤S530中，根据第一声音信号s1(n)、第二声音信号s2(n)和所述控制参数α利用自适应滤波器对第一声音信号s1(n)进行降噪处理；

[0053] 在S540中，进一步消除自适应滤波器进行降噪处理后的声音信号中残留的平稳噪声的能量；

[0054] 最后，在步骤S550中，对上述消除残留的平稳噪声的能量后的声音信号进行高频成分的增强。

[0055] 本发明的上述语音增强方法，采用软件和硬件组合的方式实现。 [0056] 图6示出了本发明的与上述语音增强方法相对应的语音增强装置的逻辑结构示意图。如图6所示，本发明提供的语音增强装置600包括声学语音增强单元610和电子语音增强单元620。

[0057] 其中，声学语音增强单元610包括主振动传声器112和辅振动传声器114。主振动传声器112用于拾取通过耦合振动方式传过来的使用者的语音信号和从空气中传播进来的外界环境噪声信号；辅振动传声器114用于拾取从空气中传播进来的外界环境噪声信号；并且分别从空气中传播进主振动传声器112和辅振动传声器114的外界环境噪声信号具有相关性。

[0058] 电子语音增强单元620包括语音检测模块210、自适应滤波模块220和后处理模块230，其中，语音检测模块210用于根据所述主振动传声器112和辅振动传声器114输出的声音信号确定所述自适应滤波模块220的更新速度并输出控制参数α；自适应滤波模块220根据所述辅振动传声器114输出的声音信号和所述语音检测模块210输出的控制参数α对所述主振动传声器112输出的声音信号进行降噪滤波，并输出降噪滤波后的语音信号；所述后处理模块230用于对所述自适应滤波模块220输出的降噪滤波后的语音信号做进一步的降噪和语音高频增强处理。

[0059] 这里需要说明的是：

[0060] 当自适应滤波器221为时域自适应滤波器时：语音检测模块210，用于通过计算在低频范围内的主振动传声器112输出的声音信号和辅振动传声器 114输出的声音信号的统计能量比值来确定自适应滤波器221的控制参数；其中统计能量比值越大，所述控制参数的值越小，且所述控制参数的取值范围为0到1；

[0061] 当自适应滤波器221为频域自适应滤波器时：语音检测模块21α，用于通过计算主振动传声器112输出的声音信号和辅振动传声器114输出的声音信号在每个频率子带的统计能量比值来确定每个频率子带的控制参数αi；其中频率子带的统计能量比值越大，该频率子带对应的控制参数αi的值越小，且每个频率子带对应的控制参数αi的取值范围为0到1。

[0062] 语音增强装置600各组成结构间的具体工作流程与前述对图4以及图5中所表述的工作流程完全相同，在此不再赘述。

[0063] 图7示出了具有根据本发明的语音增强装置的头戴式降噪通信耳机700的方框图。

[0064] 如图7所示，所述头戴式降噪通信耳机700包括语音信号传送端口701以及如图6所示的所述语音增强装置600，其中语音信号传送端口701用于把近端语音信号传送到远端用户，即接收采用语音增强装置600降噪后的语音信号，然后采用有线或者是无线的方式发送给远端用户。所述语音增强装置600的各个组成部件的功能及其描述与上面针对图
4以及图6进行的描述完全相同，在此不再进行描述。

[0065] 综合来讲，本发明能够从声学层面和电子层面消除环境噪声，极大提高高强度噪声环境下语音信噪比和语音质量原因如下：

[0066] 1)双振动传声器能有效隔离外界从空气中传播过来的噪声；并且对于泄露进来的噪声，因为主、辅振动传声器具有相似的结构和相互靠近的空间位置，所以泄露进主、辅振动传声器的外界噪声信号具有很好的相关性。

[0067] 2)对于耳机佩戴者讲话时的有用的语音信号，因为主振动传声器是直接和人的头部耦合的，而且主、辅振动传声器之间较好隔离，所以主振动传声器能较好拾取耳机佩戴者的振动语音信号，而辅振动传声器只能拾取泄露进来的语音信号。

[0068] 3)经过声学层面的语音增强，得到较高信噪比的语音信号和较纯净的外界噪声参考信号，在电子层面采用自适应噪声消除技术和单通道语音增强技术进一步提高语音信号的信噪比。

[0069] 4)在电子层面对经过语音增强后的语音信号进行高频成分的增强，从而极大的改善输出语音信号的清晰度和可懂度，使得用户获得足够清晰的语音信号。 [0070] 5)与采用近讲麦克风作为送话器的通信耳机相比，本发明对噪声的方向性和所处位置不敏感，对近、远场的各个方向的噪声都有稳定的降噪量，而且对风噪声也有较好的降噪效果。

[0071] 如上参照附图以示例的方式描述根据本发明的语音增强方法、装置和降噪耳机。但是，本领域技术人员应当理解，对于上述本发明所提出的语音增强方法、装置和降噪耳机，还可以在不脱离本发明内容的基础上做出各种改进。因此，本发明的保护范围应当由所附的权利要求书的内容确定。

语音增强方法、装置及头戴式降噪通信耳机转让专利

申请号 : CN201110381933.6

文献号 : CN102411936B

文献日 : 2012-11-14

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 赵剑 , 刘崧 , 李波 , 华洋

申请人 : 歌尔声学股份有限公司

摘要 :

权利要求 :

说明书 :