一种语音处理方法及装置转让专利

申请号 : CN201810496822.1

文献号 : CN108766456B

文献日 : 2020-01-07

本发明提供了一种语音处理方法及装置，该方法包括：通过麦克风阵列获取至少一路近端信号；对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；对所述非线性回声抑制输出信号进行降噪和增益处理。因此，本发明提供的方案可以提高信噪比。

1.一种语音处理方法，其特征在于，包括：通过麦克风阵列获取至少一路近端信号；

对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；

分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；

对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；

对所述非线性回声抑制输出信号进行降噪和增益处理；

所述通过麦克风阵列获取至少一路近端信号，包括：利用所述麦克风阵列对近端语音进行定向；

对定向后的近端语音进行波束成形；

从波束成形后的近端语音中获取所述至少一路近端信号。

2.根据权利要求1所述的语音处理方法，其特征在于，所述对所述非线性回声抑制输出信号进行降噪和增益处理，包括：确定所述非线性回声抑制输出信号的信噪比；

通过第一公式，确定出所述非线性回声抑制输出信号对应的降噪输出信号；

所述第一公式包括：

其中，所述T表征所述降噪输出信号；所述P表征所述非线性回声抑制输出信号；所述S表征所述信噪比。

3.根据权利要求2所述的语音处理方法，其特征在于，所述对所述非线性回声抑制输出信号进行降噪和增益处理，包括：确定所述降噪输出信号对应的至少一个频点；

根据第二公式，确定出每一个所述频点分别对应的第一增益值；

所述第二公式包括：

其中，所述Ni表征第i个所述频点对应的第一增益值；所述Hi表征第i个所述频点对应的峰值；所述K1表征第一常数；所述K2表征第二常数；

利用每一个所述频点分别对应的第一增益值，确定每一个所述频点分别对应的增益输出信号。

4.根据权利要求1-3中任一所述的语音处理方法，其特征在于，所述对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号，包括：利用预设的至少一个滤波器对参考信号进行滤波处理，得到估计回声信号；

针对每一路所述近端信号均执行：在所述近端信号中消除掉所述估计回声信号，得到所述近端信号对应的残余回声信号。

5.根据权利要求1-3中任一所述的语音处理方法，其特征在于，所述分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理，包括：对所述至少一路近端信号以及所述至少一路残余回声信号分别进行时延调整；

对时延调整后的所述至少一路近端信号进行波束成形，得到一路波束成形近端信号；

对时延调整后的所述至少一路残余回声信号进行波束成形，得到一路波束成形残余回声信号。

6.一种语音处理装置，其特征在于，包括：获取模块，用于通过麦克风阵列获取至少一路近端信号；

回声消除模块，用于对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；

波束成形模块，用于分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；

非线性回声抑制模块，用于对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；

处理模块，用于对所述非线性回声抑制输出信号进行降噪和增益处理；

所述获取模块，用于利用所述麦克风阵列对近端语音进行定向；对定向后的近端语音进行波束成形；从波束成形后的近端语音中获取所述至少一路近端信号。

7.根据权利要求6所述的语音处理装置，其特征在于，所述处理模块，包括：降噪子模块；

所述降噪子模块，用于确定所述非线性回声抑制输出信号的信噪比；通过第一公式，确定出所述非线性回声抑制输出信号对应的降噪输出信号；

所述第一公式包括：

其中，所述T表征所述降噪输出信号；所述P表征所述非线性回声抑制输出信号；所述S表征所述信噪比。

8.根据权利要求7所述的语音处理装置，其特征在于，所述处理模块，包括：增益子模块；

所述增益子模块，用于确定所述降噪输出信号对应的至少一个频点；根据第二公式，确定出每一个所述频点分别对应的第一增益值；利用每一个所述频点分别对应的第一增益值，确定每一个所述频点分别对应的增益输出信号；

所述第二公式包括：

其中，所述Ni表征第i个所述频点对应的第一增益值；所述Hi表征第i个所述频点对应的峰值；所述K1表征第一常数；所述K2表征第二常数。

9.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求5中任意一项所述的语音处理方法。

10.一种电子设备，其特征在于，所述电子设备中包括处理器、存储器和总线；所述处理器、所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行权利要求1至权利要求5中任意一项所述的语音处理方法。

一种语音处理方法及装置

技术领域

[0001] 本发明实施例涉及语音处理技术领域，特别是涉及一种语音处理方法及装置。

背景技术

[0002] 智能语音技术目前应用的越来越广泛，各个智能语音设备可以利用智能语音技术与用户进行交互。智能语音设备接收到的语音信号可以包括近端信号和参考信号。语音终端接收到的参考信号经扬声器发声后，该参考信号会形成回声。

[0003] 目前，为了降低回声通常会对回声进行语音处理。但是在语音处理过程中在减小残余回声的同时，通常会导致近端语音失真。使得声音听起来不平缓，比较刺耳。可见，现有的方式，语音处理的过程导致信噪比较低。

发明内容

[0004] 有鉴于此，本发明实施例提出了一种语音处理方法及装置，主要目的在于可以提高信噪比。

[0005] 第一方面，本发明实施例提供了一种语音处理方法，该语音处理方法包括：

[0006] 通过麦克风阵列获取至少一路近端信号；

[0007] 对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；

[0008] 分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；

[0009] 对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；

[0010] 对所述非线性回声抑制输出信号进行降噪和增益处理。

[0011] 可选的，

[0012] 所述对所述非线性回声抑制输出信号进行降噪和增益处理，包括：

[0013] 确定所述非线性回声抑制输出信号的信噪比；

[0014] 通过公式(1)，确定出所述非线性回声抑制输出信号对应的降噪输出信号；

[0015]

[0016] 其中，所述T表征所述降噪输出信号；所述P表征所述非线性回声抑制输出信号；所述S表征所述信噪比。

[0017] 可选的，

[0018] 所述对所述非线性回声抑制输出信号进行降噪和增益处理，包括：

[0019] 确定所述降噪输出信号对应的至少一个频点；

[0020] 根据公式(2)，确定出每一个所述频点分别对应的第一增益值；

[0021]

[0022] 其中，所述Ni表征第i个所述频点对应的第一增益值；所述Hi表征第i个所述频点对应的峰值；所述K1表征第一常数；所述K2表征第二常数；

[0023] 利用每一个所述频点分别对应的第一增益值，确定每一个所述频点分别对应的增益输出信号。

[0024] 可选的，

[0025] 所述对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号，包括：

[0026] 利用预设的至少一个滤波器对参考信号进行滤波处理，得到估计回声信号；

[0027] 针对每一路所述近端信号均执行：在所述近端信号中消除掉所述估计回声信号，得到所述近端信号对应的残余回声信号。

[0028] 可选的，

[0029] 所述分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理，包括：

[0030] 对所述至少一路近端信号以及所述至少一路残余回声信号分别进行时延调整；

[0031] 对时延调整后的所述至少一路近端信号进行波束成形，得到一路波束成形近端信号；

[0032] 对时延调整后的所述至少一路残余回声信号进行波束成形，得到一路波束成形残余回声信号。

[0033] 可选的，

[0034] 所述通过麦克风阵列获取至少一路近端信号，包括：

[0035] 利用所述麦克风阵列对近端语音进行定向；

[0036] 对定向后的近端语音进行波束成形；

[0037] 从波束成形后的近端语音中获取所述至少一路近端信号。

[0038] 第二方面，本发明实施例提供了一种语音处理装置，该语音处理装置包括：

[0039] 获取模块，用于通过麦克风阵列获取至少一路近端信号；

[0040] 回声消除模块，用于对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；

[0041] 波束成形模块，用于分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；

[0042] 非线性回声抑制模块，用于对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；

[0043] 处理模块，用于对所述非线性回声抑制输出信号进行降噪和增益处理。

[0044] 可选的，

[0045] 所述处理模块，包括：降噪子模块；

[0046] 所述降噪子模块，用于确定所述非线性回声抑制输出信号的信噪比；通过公式(1)，确定出所述非线性回声抑制输出信号对应的降噪输出信号；

[0047]

[0048] 其中，所述T表征所述降噪输出信号；所述P表征所述非线性回声抑制输出信号；所述S表征所述信噪比。

[0049] 可选的，

[0050] 所述处理模块，包括：增益子模块；

[0051] 所述增益子模块，用于确定所述降噪输出信号对应的至少一个频点；根据公式(2)，确定出每一个所述频点分别对应的第一增益值；利用每一个所述频点分别对应的第一增益值，确定每一个所述频点分别对应的增益输出信号。

[0052]

[0053] 其中，所述Ni表征第i个所述频点对应的第一增益值；所述Hi表征第i个所述频点对应的峰值；所述K1表征第一常数；所述K2表征第二常数。

[0054] 第三方面，本发明实施例提供了一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的语音处理方法。

[0055] 第四方面，本发明实施例提供了一种电子设备，所述电子设备中包括处理器、存储器和总线；所述处理器、所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行上述中任意一项所述的语音处理方法。

[0056] 本发明实施例提供了一种语音处理方法及装置，通过麦克风阵列获到一路或多路近端信号，并对各路近端信号进行回声消除处理，得到一路或多路残余回声信号。然后分别对各路近端信号以及各路残余回声信号进行波束成形处理，并对波束成形处理后的各路近端信号以及各路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号。最后对非线性回声抑制输出信号进行降噪和增益处理。通过上述可知，在麦克风阵列获取到近端信号时，对近端信号进行了回声消除处理、波束成形处理、非线性回声抑制处理以及降噪和增益处理。在抑制回声的同时，最大限度的使得声音不失真。因此，本发明实施例提供的方案可以提高信噪比。

[0057] 上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

[0058] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0059] 图1示出了本发明一个实施例提供的一种语音处理方法的流程图；

[0060] 图2示出了本发明另一个实施例提供的一种语音处理方法的流程图；

[0061] 图3示出了本发明一个实施例提供的一种语音处理装置的结构示意图；

[0062] 图4示出了本发明另一个实施例提供的一种语音处理装置的结构示意图；

[0063] 图5出了本发明一个实施例提供的一种电子设备的结构示意图。

具体实施方式

[0064] 下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

[0065] 如图1所示，本发明实施例提供了一种语音处理方法，该语音处理方法包括：

[0066] 步骤101：通过麦克风阵列获取至少一路近端信号；

[0067] 步骤102：对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；

[0068] 步骤103：分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；

[0069] 步骤104：对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；

[0070] 步骤105：对所述非线性回声抑制输出信号进行降噪和增益处理。

[0071] 根据图1所示的实施例，通过麦克风阵列获到一路或多路近端信号，并对各路近端信号进行回声消除处理，得到一路或多路残余回声信号。然后分别对各路近端信号以及各路残余回声信号进行波束成形处理，并对波束成形处理后的各路近端信号以及各路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号。最后对非线性回声抑制输出信号进行降噪和增益处理。通过上述可知，在麦克风阵列获取到近端信号时，对近端信号进行了回声消除处理、波束成形处理、非线性回声抑制处理以及降噪和增益处理。在抑制回声的同时，最大限度的使得声音不失真。因此，本发明实施例提供的方案可以提高信噪比。

[0072] 在本发明一个实施例中，上述图1所示流程图中的步骤101通过麦克风阵列获取至少一路近端信号，可以包括：

[0073] 利用所述麦克风阵列对近端语音进行定向；

[0074] 对定向后的近端语音进行波束成形；

[0075] 从波束成形后的近端语音中获取所述至少一路近端信号。

[0076] 在本实施例中，麦克风阵列中包括麦克风的数量和型式均可以根据业务要求确定。比如，麦克风阵列中包括有4个麦克风。

[0077] 在本实施例中，麦克风阵列中包括的各个麦克风可以均为全向收声。为了更好的获取到近端信号，在存在近端语音时需要对近端语音进行定向。并根据定向后的近端语音进行波束成形，以对定向后的方向进行增益，对非定向对应的方向的语音进行抑制。并根据波束成形后的近端语音利用各个麦克风来获取到近端信号。

[0078] 在本实施例中，麦克风阵列中包括有N路麦克风时，则获取到N路近端信号。

[0079] 根据上述实施例，在存在近端语音时，首先利用麦克风阵列对近端语音进行定向，并对定向后的近端语音进行波束成形，并从波束成形后的近端语音中获取一路或多路近端信号。由于利用波束成形对近端语音信号进行有针对方向的增益和抑制，因此获取到的近端信号中的噪音较低。

[0080] 在本发明一个实施例中，上述图1所示流程图中的步骤102对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号，可以包括：

[0081] 利用预设的至少一个滤波器对参考信号进行滤波处理，得到估计回声信号；

[0082] 针对每一路所述近端信号进行执行：在所述近端信号中消除掉所述估计回声信号，得到所述近端信号对应的残余回声信号。

[0083] 在本实施例中，滤波器的型式和数量均可以根据业务要求确定。在滤波器为一个时，滤波器可以利用自身的滤波方法对参考信号进行滤波处理，并得到估计回声信号。在滤波器为两个或多个时，各个滤波器均对参考信号进行滤波处理，并根据滤波结果确定出优选滤波器，利用优选地的滤波器得到估计回声信号。

[0084] 在本实施例中，任一路近端信号对应的残余回声信号的确定方法均可以为：在近端信号中除掉估计回声信号，便可以得到残余回声信号。

[0085] 根据上述实施例，利用滤波器对参考信号进行滤波处理得到估计回声信号，并在每一路近端信号中分别消除掉了估计回声信号得到每一路近端信号分别对应的残余回声信号。由于每一个路近端信号中均消除掉了估计回声信号，因此可以减少回声。

[0086] 在本发明一个实施例中，在上一个实施例中所涉及的步骤近端信号中消除掉所述估计回声信号，得到所述近端信号对应的残余回声信号之后，可以进一步包括：

[0087] 确定所述近端信号对应的第二增益值；

[0088] 利用所述第二增益值对所述残余回声信号进行回声压缩处理。

[0089] 在本实施例中，确定近端信号对应的第二增益值的方法可以为：以一路近端信号为例进行说明，确定该路近端信号对应的至少一个频点，并根据该路的近端信号以及残余回声信号，确定出至少一个频点对应的至少一个相关系数。针对每一个频点均执行：确定频点的频点增益值为频点对应的相关系数。对得到的频点增益值进行过载处理和平滑处理得到第二增益值。然后将利用第二增益值对残余回声信号进行压缩处理，得到回声压缩后的回声压缩输出。

[0090] 根据上述实施例，由于利用了近端信号对应的第二增益值对残余回声信号进行回声压缩处理。因此，可以最大限度的减少回声。

[0091] 在本发明一个实施例中，上述图1所示流程图中的步骤103分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理，可以包括：

[0092] 对所述至少一路近端信号以及所述至少一路残余回声信号分别进行时延调整；

[0093] 对时延调整后的所述至少一路近端信号进行波束成形，得到一路波束成形近端信号；

[0094] 对时延调整后的所述至少一路残余回声信号进行波束成形，得到一路波束成形残余回声信号。

[0095] 在本实施例中，由于各路近端信号获取时间不同，因此需要对各路近端信号分别进行时延调整，以分别统一各路近端信号的时间。对时延调整后的各路近端信号进行波束成形，得到一路波束成形近端信号。得到的波束成形近端信号更为清晰。

[0096] 在本实施例中，由于各路残余回声信号获取时间不同，因此需要对各路残余回声信号分别进行时延调整，以分别统一各路残余回声信号的时间。对时延调整后的各路残余回声信号进行波束成形，得到一路波束成形残余回声信号。得到的波束成形残余回声信号更为清晰。

[0097] 根据上述实施例，对各路近端信号以及各路残余回声信号分别进行时延调整，并对各路近端信号以及各路残余回声信号分别进行波束成形，得到一路波束成形近端信号和一路波束成形残余回声信号。因此，得到的波束成形近端信号和波束成形残余回声信号更为清晰。

[0098] 在本发明一个实施例中，上述图1所示流程图中的步骤104对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号，可以包括：

[0099] 对一路所述波束成形近端信号以及一路所述波束成形残余回声信号进行非线性回声抑制处理，得到所述非线性回声抑制输出信号。

[0100] 根据上述实施例，对波束成形近端信号以及波束成形残余回声信号进行非线性回声抑制处理得到非线性回声抑制输出信号。因此可以进一步的减少回声。

[0101] 在本发明一个实施例中，上述图1所示流程图中的步骤105对所述非线性回声抑制输出信号进行降噪和增益处理，可以包括：

[0102] 确定所述非线性回声抑制输出信号的信噪比；

[0103] 通过公式(1)，确定出所述非线性回声抑制输出信号对应的降噪输出信号；

[0104]

[0105] 其中，所述T表征所述降噪输出信号；所述P表征所述非线性回声抑制输出信号；所述S表征所述信噪比。

[0106] 在本实施例中，确定非线性回声抑制输出信号的信噪比的方法可以为：确定出波束成形近端信号以及波束成形残余回声信号对应的总能量，并确定出总能量与波束成形残余回声信号对应的能量之间的商。该商便为信噪比。

[0107] 根据上述实施例，由于信噪比对非线性回声抑制输出信号进行了降噪处理，因此可以最大限度的降低噪声。

[0108] 在本发明一个实施例中，上述图1所示流程图中的步骤105对所述非线性回声抑制输出信号进行降噪和增益处理，可以包括：

[0109] 确定所述降噪输出信号对应的至少一个频点；

[0110] 根据公式(2)，确定出每一个所述频点分别对应的第一增益值；

[0111]

[0112] 其中，所述Ni表征第i个所述频点对应的第一增益值；所述Hi表征第i个所述频点对应的峰值；所述K1表征第一常数；所述K2表征第二常数；

[0113] 利用每一个所述频点分别对应的第一增益值，确定每一个所述频点分别对应的增益输出信号。

[0114] 在本实施例中，K1和K2均为预设设定的一个区间内的两个端点值，比如，该区间为[K1，K2]。K1和K2的数值均可以根据业务要求确定。比如，K1为0.9；K2为0.99。

[0115] 在本实施例中，从公式(2)中可以看出，在任一频点对应的峰值不位于设定的区间内时，且小于区间内的任一数值时，此时可以确定出较大的增益值，以对该频点对应的非线性回声抑制输出信号进行增强。在任一频点对应的峰值不位于设定的区间内时，且大于区间内的任一数值时，此时可以确定出较小的增益值，以对该频点对应的非线性回声抑制输出信号进行增益后，增益后的峰值可以位于该区间内，以保证增益输出信号不失真。

[0116] 根据上述实施例，由于对非线性回声抑制输出信号对应的各个频点进行有针对性的进行增益，因此信噪比较高。

[0117] 下面麦克风阵列中包括4个麦克风为例，对语音处理方法进行说明。如图2所示，该语音处理方法包括：

[0118] 步骤201：利用麦克风阵列对近端语音进行定向。

[0119] 步骤202：对定向后的近端语音进行波束成形。

[0120] 在本步骤中，根据定向后的近端语音进行波束成形，以对定向后的方向进行增益，对非定向对应的方向的语音进行抑制。

[0121] 步骤203：利用麦克风阵列从波束成形后的近端语音中获取至少一路近端信号。

[0122] 在本步骤中，利用4个麦克风获取到4路近端信号。

[0123] 步骤204：利用预设的至少一个滤波器对参考信号进行滤波处理，得到估计回声信号。

[0124] 在本步骤中，滤波器可以利用自身的滤波方法对参考信号进行滤波处理，并得到估计回声信号。在近端信号中除掉估计回声信号，便可以得到残余回声信号。

[0125] 步骤205：针对每一路近端信号进行执行：在近端信号中消除掉估计回声信号，得到近端信号对应的残余回声信号；确定近端信号对应的第二增益值，并利用第二增益值对残余回声信号进行回声压缩处理。

[0126] 步骤206：对各路近端信号以及各路残余回声信号分别进行时延调整。

[0127] 在本步骤中，由于各路近端信号获取时间不同，因此需要对各路近端信号分别进行时延调整，以分别统一各路近端信号的时间。

[0128] 步骤207：对时延调整后的各路近端信号进行波束成形，得到一路波束成形近端信号。

[0129] 步骤208：对时延调整后的各路残余回声信号进行波束成形，得到一路波束成形残余回声信号。

[0130] 步骤209：对一路波束成形近端信号以及一路波束成形残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号。

[0131] 步骤210：确定非线性回声抑制输出信号的信噪比。

[0132] 在本步骤中，确定出波束成形近端信号以及波束成形残余回声信号对应的总能量，并确定出总能量与波束成形残余回声信号对应的能量之间的商。该商便为信噪比。

[0133] 步骤211：根据信噪比确定出非线性回声抑制输出信号对应的降噪输出信号。

[0134] 在本步骤中，利用公式(1)确定出非线性回声抑制输出信号对应的降噪输出信号。

[0135] 步骤212：确定降噪处理后的非线性回声抑制输出信号对应的至少一个频点。

[0136] 步骤213：确定出每一个频点分别对应的第一增益值。

[0137] 在本步骤中，根据公式(2)确定出每一个频点分别对应的第一增益值。

[0138] 在本步骤中，在任一频点对应的峰值不位于设定的区间内时，且小于区间内的任一数值时，此时可以确定出较大的增益值，以对该频点对应的非线性回声抑制输出信号进行增强。在任一频点对应的峰值不位于设定的区间内时，且大于区间内的任一数值时，此时可以确定出较小的增益值，以对该频点对应的非线性回声抑制输出信号进行增益后，增益后的峰值可以位于该区间内，以保证增益输出信号不失真。

[0139] 步骤214：利用每一个频点分别对应的第一增益值，确定每一个频点分别对应的增益输出信号。

[0140] 如图3所示，本发明实施例提供了一种语音处理装置，该语音处理装置包括：

[0141] 获取模块301，用于通过麦克风阵列获取至少一路近端信号；

[0142] 回声消除模块302，用于对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；

[0143] 波束成形模块303，用于分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；

[0144] 非线性回声抑制模块304，用于对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；

[0145] 处理模块305，用于对所述非线性回声抑制输出信号进行降噪和增益处理。

[0146] 根据图3所示的实施例，在本方案中在麦克风阵列获取到近端信号时，对近端信号进行了回声消除处理、波束成形处理、非线性回声抑制处理以及降噪和增益处理。在抑制回声的同时，最大限度的使得声音不失真。因此，本发明提供的实施例可以提高信噪比。

[0147] 在本发明一个实施例中，如图4所示，所述处理模块305可以包括降噪子模块3051，用于确定所述非线性回声抑制输出信号的信噪比；通过公式(1)，确定出所述非线性回声抑制输出信号对应的降噪输出信号；

[0148]

[0149] 其中，所述T表征所述降噪输出信号；所述P表征所述非线性回声抑制输出信号；所述S表征所述信噪比。

[0150] 在本发明一个实施例中，如图4所示，所述处理模块305可以包括增益子模块3052，用于确定所述降噪输出信号对应的至少一个频点；根据公式(2)，确定出每一个所述频点分别对应的第一增益值；利用每一个所述频点分别对应的第一增益值，确定每一个所述频点分别对应的增益输出信号。

[0151]

[0152] 其中，所述Ni表征第i个所述频点对应的第一增益值；所述Hi表征第i个所述频点对应的峰值；所述K1表征第一常数；所述K2表征第二常数。

[0153] 在本发明一个实施例中，所述回声消除模块302，用于利用预设的至少一个滤波器对参考信号进行滤波处理，得到估计回声信号；针对每一路所述近端信号进行执行：在所述近端信号中消除掉所述估计回声信号，得到所述近端信号对应的残余回声信号。

[0154] 在本发明一个实施例中，所述回声消除模块302，进一步用于确定所述近端信号对应的第二增益值；利用所述第二增益值对所述残余回声信号进行回声压缩处理。

[0155] 在本发明一个实施例中，所述波束成形模块303，用于对所述至少一路近端信号以及所述至少一路残余回声信号分别进行时延调整；对时延调整后的所述至少一路近端信号进行波束成形，得到一路波束成形近端信号；对时延调整后的所述至少一路残余回声信号进行波束成形，得到一路波束成形残余回声信号。

[0156] 在本发明一个实施例中，所述非线性回声抑制模块304，用于对一路所述波束成形近端信号以及一路所述波束成形残余回声信号进行非线性回声抑制处理，得到所述非线性回声抑制输出信号。

[0157] 在本发明一个实施例中，所述获取模块301，用于利用所述麦克风阵列对近端语音进行定向；对定向后的近端语音进行波束成形；从波束成形后的近端语音中获取所述至少一路近端信号。

[0158] 在本发明一个实施例提供了一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的语音处理方法。

[0159] 在本发明一个实施例提供了一种电子设备，如图5所示，所述电子设备中包括处理器401、存储器402和总线403；所述处理器401、所述存储器402通过所述总线403完成相互间的通信；所述处理器401用于调用所述存储器402中的程序指令，以执行上述中任意一项所述的语音处理方法。

[0160] 上述装置内的各单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

[0161] 本发明各个实施例至少具有如下有益效果：

[0162] 1、在本发明实施例中，通过麦克风阵列获到一路或多路近端信号，并对各路近端信号进行回声消除处理，得到一路或多路残余回声信号。然后分别对各路近端信号以及各路残余回声信号进行波束成形处理，并对波束成形处理后的各路近端信号以及各路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号。最后对非线性回声抑制输出信号进行降噪和增益处理。通过上述可知，在本方案中在麦克风阵列获取到近端信号时，对近端信号进行了回声消除处理、波束成形处理、非线性回声抑制处理以及降噪和增益处理。在抑制回声的同时，最大限度的使得声音不失真。因此，本发明实施例提供的方案可以提高信噪比。

[0163] 2、在本发明实施例中，在存在近端语音时，首先利用麦克风阵列对近端语音进行定向，并对定向后的近端语音进行波束成形，并从波束成形后的近端语音中获取一路或多路近端信号。由于利用波束成形对近端语音信号进行有针对方向的增益和抑制，因此获取到的近端信号中的噪音较低。

[0164] 3、在本发明实施例中，利用滤波器对参考信号进行滤波处理得到估计回声信号，并在每一路近端信号中分别消除掉了估计回声信号得到每一路近端信号分别对应的残余回声信号。由于每一个路近端信号中均消除掉了估计回声信号，因此可以减少回声。

[0165] 4、在本发明实施例中，由于利用了近端信号对应的第二增益值对残余回声信号进行回声压缩处理。因此，可以最大限度的减少回声。

[0166] 5、在本发明实施例中，对各路近端信号以及各路残余回声信号分别进行时延调整，并对各路近端信号以及各路残余回声信号分别进行波束成形，得到一路波束成形近端信号和一路波束成形残余回声信号。因此，得到的波束成形近端信号和波束成形残余回声信号更为清晰。

[0167] 6、在本发明实施例中，对波束成形近端信号以及波束成形残余回声信号进行非线性回声抑制处理得到非线性回声抑制输出信号。因此可以进一步的减少回声。

[0168] 7、在本发明实施例中，由于信噪比对非线性回声抑制输出信号进行了降噪处理，因此可以最大限度的降低噪声。

[0169] 8、在本发明实施例中，由于对非线性回声抑制输出信号对应的各个频点进行有针对性的进行增益，因此信噪比较高。

[0170] 需要说明的是，在本文中，诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个······”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

[0171] 本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储在计算机可读取的存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。

[0172] 最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

一种语音处理方法及装置转让专利

申请号 : CN201810496822.1

文献号 : CN108766456B

文献日 : 2020-01-07

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 周舒然 , 李志飞

申请人 : 出门问问信息科技有限公司

摘要 :

权利要求 :

说明书 :