会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学 / 语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码 / 基于Unet深度卷积的混合声音滤除无人机噪声方法及系统

基于Unet深度卷积的混合声音滤除无人机噪声方法及系统

申请号 CN202311652135.1 申请日 2023-12-05 公开(公告)号 CN117912491A 公开(公告)日 2024-04-19
申请人 广西电网有限责任公司电力科学研究院; 发明人 易辰颖; 李锐; 张磊; 陈梁远; 芦宇峰; 苏毅; 潘绍明;
摘要 本 发明 公开了基于Unet深度卷积的混合声音滤除无人机噪声方法及系统,包括:采集混合声音,对混合声音进行预处理,通过U型深度卷积网络得到反映目标声音显著程度的掩膜;根据维纳 滤波器 的输出得到滤除噪声后的混合声音, 迭代 滤除无人机自噪声,获得目标声音的 频域特征 ;将目标声音的频域特征进行傅里叶逆变换和 加窗 ,得到目标声音的时域特征,完成无人机噪声的滤除。本发明通过U型网络结构提取声音特征,并利用维纳滤波器精确滤除噪声,能够在复杂背景下显著提高目标声音的提取纯度。迭代机制进一步优化了声音 信号 ,确保了噪声滤除过程的高效性和低误差性,最终通过逆傅里叶变换精确恢复出目标声音的时域特征。
权利要求

1.基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于,包括:
采集混合声音,对混合声音进行预处理,通过U型深度卷积网络得到反映目标声音显著程度的掩膜;
根据维纳滤波器的输出得到滤除噪声后的混合声音,迭代滤除无人机自噪声,获得目标声音的频域特征
将目标声音的频域特征进行傅里叶逆变换和加窗,得到目标声音的时域特征,完成无人机噪声的滤除。
2.如权利要求1所述的基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于:所述混合声音包括,利用麦克阵列收集包含目标声音和无人机自噪声的混合声音,考虑目标声音传播到麦克风时衰减和延迟的脉冲响应,混合声音表示为,
xm(n)=hm(n)*s(n)+vm(n)
其中,xm(n)表示第m个麦克风采集到的混合声音;hm(n)表示目标声音传播到第m个麦克风时衰减和延迟的脉冲响应;s(n)表示目标声源信号;vm(n)表示第m个麦克风采集到的无人机噪声。
3.如权利要求2所述的基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于:所述预处理包括,使用窗口截取输入信号,然后对分段信号进行短时傅里叶变换,合并后得到频域特征,
Xm(l,k)=Hm(k)S(l,k)+Vm(l,k)
其中,Xm(l,k)表示第m个麦克风在第l的频域特征;Hm(k)表示目标声音传播到第m个麦克风时的衰减和延迟;S(l,k)表示目标声源信号在第l帧的频域特征;Vm(l,k)表示第m个麦克风采集到的无人机噪声在第l帧的频域特征。
4.如权利要求3所述的基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于:所述U型深度卷积网络包括,对数压缩声音信号,再将压缩后的m个通道的L个连续帧声音信息通入U型深度卷积网络,
其中,Mm(l,k)表示第m个麦克风对应的在第l帧和第k频点的掩膜值。
5.如权利要求4所述的基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于:所述维纳滤波器包括,
T
Y(l,k)=W(l,k)X(l,k)
真实的φx和φs无法直接得到,对m个麦克风对应的掩膜Mm(l,k)进行最大池化,得到掩膜M(l,k),估算φx和φs,
H
φs(l,k)=αφs(l‑1,k)+(1‑α)M(l,k)X(l,k)X(l,k)
H
φx(l,k)=αφx(l‑1,k)+(1‑α)X(l,k)X(l,k)
T
其中,Y(l,k)表示维纳滤波器输出的混合声音;W(l,k)表示权重矩阵;φs(l,k)表示目标声音空间协方差矩阵;φx(l,k)表示混合声音空间协方差矩阵;el表示第l项为1其余项为
0的列向量;α表示固定的时间平均系数。
6.如权利要求5所述的基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于:所述迭代滤除无人机自噪声包括,将维纳滤波器输出的混合声音作为U型深度卷积网络的输入,计算新的掩膜和维纳滤波器输出,迭代重复,并计算均方误差,其中,MSE表示均方误差;NL表示数据总数; 表示Y(l,k)对应的真实值;当MSE达到最小值或达到设置的最大迭代次数时,判断为无人机噪声完全滤除,获得目标声音的频域特征。
7.如权利要求6所述的基于Unet深度卷积的混合声音滤除无人机噪声方法,其特征在于:所述目标声音的时域特征包括,维纳滤波器输出的是目标声音的l帧频域特征,对每帧分别进行傅里叶逆变换和加窗,与预处理时的加窗位置、类型、窗长、重叠宽度保持一致,然后叠加加窗后的l帧时域信号,两帧重叠部分取均值,得到目标声音的时域特征。
8.一种采用如权利要求1~7任一所述方法的基于Unet深度卷积的混合声音滤除无人机噪声系统,其特征在于,包括,
混合声音处理模,将采集的混合声音进行加窗和傅里叶变换;
迭代模块,通过U型深度卷积网络得到反映目标声音显著程度的掩膜,通过维纳滤波器滤除无人机噪声,迭代进行直到均方误差达到最小值或达到设置的最大迭代次数;
目标声音输出模块,将迭代完成的目标声音的时域特征进行傅里叶逆变换和加窗,得到目标声音的时域特征并输出。
9.一种计算设备,包括:存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至7任一项所述的方法的步骤。

说明书全文

基于Unet深度卷积的混合声音滤除无人机噪声方法及系统

技术领域

[0001] 本发明涉及信号处理技术领域,具体为基于Unet深度卷积的混合声音滤除无人机噪声方法及系统。

背景技术

[0002] 随着社会的不断发展和电需求的增长,电力系统的安全、稳定运行变得至关重要。电网噪音作为电力系统中的一个重要参数,与设备的运行状态息息相关。传统的电网噪音监测主要依赖于固定式噪音传感器或手持式测量仪器,但前者只能覆盖有限的范围,后者又耗时间又耗人力。无人机能够在短时间内覆盖大范围的电力设施,并能轻松飞越难以人工进入的区域,因此使用无人机搭载声学传感器测量电网噪音成为一项创新且有效的监测手段。
[0003] 然后,目前还没有出现利用无人机测量声音信号的先例。这是因为无人机本身在运行时旋翼会发出巨大的噪声,严重干扰目标声音的测量。无人机工作时旋翼发出的噪声频率为0‑5kHz的宽频噪声,电力设备的振动噪声基频为电流二倍频,电力设备噪声的基频以及5、7、11、13等倍频均与无人机工作噪声频域重合,这使得难以直接使用传统滤波器滤掉无人机自噪声。因此噪声处理的算法是最核心的部分,也是最大的难点,当前主要的降噪方法包括采样降噪和自适应降噪。采样降噪是一种有效的处理具有空白噪声的场景的方法,该算法通过学习空白噪声的特征,然后应用这些学到的信息来削减目标信号中的底噪;自适应降噪则具有灵活性,能够适应不同环境和输入条件,适用于没有事先提供空白噪声的情况,该方法允许算法自主识别和分析输入信号中的底噪,然后有针对性地实施降噪。

发明内容

[0004] 鉴于上述存在的问题,提出了本发明。
[0005] 因此,本发明解决的技术问题是:电力设备的振动噪声与无人机工作噪声频域重合,难以直接使用传统滤波器滤掉无人机自噪声。
[0006] 为解决上述技术问题,本发明提供如下技术方案:基于Unet深度卷积的混合声音滤除无人机噪声方法,包括:采集混合声音,对混合声音进行预处理,通过U型深度卷积网络得到反映目标声音显著程度的掩膜;根据维纳滤波器的输出得到滤除噪声后的混合声音,迭代滤除无人机自噪声,获得目标声音的频域特征;将目标声音的频域特征进行傅里叶逆变换和加窗,得到目标声音的时域特征,完成无人机噪声的滤除。
[0007] 作为本发明所述的基于Unet深度卷积的混合声音滤除无人机噪声方法的一种优选方案,其中:所述混合声音包括,利用麦克阵列收集包含目标声音和无人机自噪声的混合声音,考虑目标声音传播到麦克风时衰减和延迟的脉冲响应,混合声音表示为,[0008] xm(n)=hm(n)*s(n)+vm(n)
[0009] 其中,xm(n)表示第m个麦克风采集到的混合声音;hm(n)表示目标声音传播到第m个麦克风时衰减和延迟的脉冲响应;s(n)表示目标声源信号;vm(n)表示第m个麦克风采集到的无人机噪声。
[0010] 作为本发明所述的基于Unet深度卷积的混合声音滤除无人机噪声方法的一种优选方案,其中:所述预处理包括,使用窗口截取输入信号,然后对分段信号进行短时傅里叶变换,合并后得到频域特征,
[0011] Xm(l,k)=Hm(k)S(l,k)+Vm(l,k)
[0012] 其中,Xm(l,k)表示第m个麦克风在第l的频域特征;Hm(k)表示目标声音传播到第m个麦克风时的衰减和延迟;S(l,k)表示目标声源信号在第l帧的频域特征;Vm(l,k)表示第m个麦克风采集到的无人机噪声在第l帧的频域特征。
[0013] 作为本发明所述的基于Unet深度卷积的混合声音滤除无人机噪声方法的一种优选方案,其中:所述U型深度卷积网络包括,对数压缩声音信号,再将压缩后的m个通道的L个连续帧声音信息通入U型深度卷积网络,
[0014]
[0015] 其中,Mm(l,k)表示第m个麦克风对应的在第l帧和第k频点的掩膜值。
[0016] 作为本发明所述的基于Unet深度卷积的混合声音滤除无人机噪声方法的一种优选方案,其中:所述维纳滤波器包括,
[0017] Y(l,k)=WT(l,k)X(l,k)
[0018]
[0019] 真实的φx和φs无法直接得到,对m个麦克风对应的掩膜Mm(l,k)进行最大池化,得到掩膜M(l,k),估算φx和φs,
[0020] φs(l,k)=αφs(l‑1,k)+(1‑α)M(l,k)X(l,k)XH(l,k)
[0021] φx(l,k)=αφx(l‑1,k)+(1‑α)X(l,k)XH(l,k)
[0022] 其中,Y(l,k)表示维纳滤波器输出的混合声音;WT(l,k)表示权重矩阵;φs(l,k)表示目标声音空间协方差矩阵;φx(l,k)表示混合声音空间协方差矩阵;el表示第l项为1其余项为0的列向量;α表示固定的时间平均系数。
[0023] 作为本发明所述的基于Unet深度卷积的混合声音滤除无人机噪声方法的一种优选方案,其中:所述迭代滤除无人机自噪声包括,将维纳滤波器输出的混合声音作为U型深度卷积网络的输入,计算新的掩膜和维纳滤波器输出,迭代重复,并计算均方误差,[0024]
[0025] 其中,MSE表示均方误差;NL表示数据总数; 表示Y(l,k)对应的真实值;当MSE达到最小值或达到设置的最大迭代次数时,判断为无人机噪声完全滤除,获得目标声音的频域特征。
[0026] 作为本发明所述的基于Unet深度卷积的混合声音滤除无人机噪声方法的一种优选方案,其中:所述目标声音的时域特征包括,维纳滤波器输出的是目标声音的l帧频域特征,对每帧分别进行傅里叶逆变换和加窗,与预处理时的加窗位置、类型、窗长、重叠宽度保持一致,然后叠加加窗后的l帧时域信号,两帧重叠部分取均值,得到目标声音的时域特征。
[0027] 第二方面,本发明还提供了基于Unet深度卷积的混合声音滤除无人机噪声系统,包括,混合声音处理模,将采集的混合声音进行加窗和傅里叶变换;迭代模块,通过U型深度卷积网络得到反映目标声音显著程度的掩膜,通过维纳滤波器滤除无人机噪声,迭代进行直到均方误差达到最小值或达到设置的最大迭代次数;目标声音输出模块,将迭代完成的目标声音的时域特征进行傅里叶逆变换和加窗,得到目标声音的时域特征并输出。
[0028] 第三方面,本发明还提供了一种计算设备,包括:存储器和处理器;
[0029] 所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现所述基于Unet深度卷积的混合声音滤除无人机噪声方法的步骤。
[0030] 第四方面,本发明还提供了一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现所述基于Unet深度卷积的混合声音滤除无人机噪声方法的步骤。
[0031] 本发明的有益效果:本发明通过U型网络结构提取声音特征,并利用维纳滤波器精确滤除噪声,能够在复杂背景下显著提高目标声音的提取纯度。迭代机制进一步优化了声音信号,确保了噪声滤除过程的高效性和低误差性,最终通过逆傅里叶变换精确恢复出目标声音的时域特征,不仅提高了无人机监测和其他应用场景的音质清晰度,还有助于增强声音信号处理的实际应用价值。附图说明
[0032] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。其中:
[0033] 图1为本发明一个实施例提供的基于Unet深度卷积的混合声音滤除无人机噪声方法的整体流程图
[0034] 图2为本发明第二个实施例提供的基于Unet深度卷积的混合声音滤除无人机噪声方法中的工作流程图。

具体实施方式

[0035] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
[0036] 实施例1
[0037] 参照图1,为本发明的一个实施例,提供了基于Unet深度卷积的混合声音滤除无人机噪声方法,包括:
[0038] S1:采集混合声音,对混合声音进行预处理,通过U型深度卷积网络得到反映目标声音显著程度的掩膜。
[0039] 进一步的,在小旋翼无人机上搭载麦克风阵列,包含m个麦克风。麦克风阵列收集到的是m组包含目标声音和无人机自噪声的混合声音。考虑目标声音传播到麦克风时衰减和延迟的脉冲响应,混合声音表示为,
[0040] xm(n)=hm(n)*s(n)+vm(n)
[0041] 其中,xm(n)表示第m个麦克风采集到的混合声音;hm(n)表示目标声音传播到第m个麦克风时衰减和延迟的脉冲响应;s(n)表示目标声源信号;vm(n)表示第m个麦克风采集到的无人机噪声。
[0042] 更进一步的,在进行傅里叶变换时,由于信号在时间上被突然截断,造成频域中的泄漏,即非目标频率成分的出现,会干扰频域特征的准确性,因此使用L个窗口截取输入信号,确保每个信号帧在重叠和叠加时可以平滑过渡,减少因为信号分段处理带来的边界效应,最终使得恢复的时域信号尽可能地接近原始信号,对分段信号进行短时傅里叶变换,合并后得到频域特征,
[0043] Xm(l,k)=Hm(k)S(l,k)+Vm(l,k)
[0044] 其中,Xm(l,k)表示第m个麦克风在第l帧的频域特征;Hm(k)表示目标声音传播到第m个麦克风时的衰减和延迟;S(l,k)表示目标声源信号在第l帧的频域特征;Vm(l,k)表示第m个麦克风采集到的无人机噪声在第l帧的频域特征。
[0045] 再进一步的,由于信噪比低,需要先对数压缩声音信号,再将压缩后的m个通道的L个连续帧声音信息通入U型深度卷积网络,训练后得到反映目标声音显著程度的掩膜,其值在[0,1]之间。
[0046]
[0047] 其中,Mm(l,k)表示第m个麦克风对应的在第l帧和第k频点的掩膜值。
[0048] 所使用的U型网络是编码器解码器结构,包含卷积层,池化层,反卷积层,反池化层和全连接层。为确保网络的收敛性,对每一层进行批量规范化。在输出处引入全连接层,它结合了倒数第二层的输出,从而产生与当前输入帧相对应的理想比率掩膜Mm(l,k)。
[0049] S2:根据维纳滤波器的输出得到滤除噪声后的混合声音,迭代滤除无人机自噪声,获得目标声音的频域特征。
[0050] 进一步的,U型网络的输出是一个掩膜,用于区分目标声音和背景噪声。然而,仅有掩膜还不足以直接提取高质量的目标声音,因为掩膜仅仅提供了声音源在不同频率和时间点上的重要性权重,而非直接的声音信号。
[0051] 波束形成器的作用是利用掩膜来指导如何从多个麦克风收集的混合声音中提取目标声音,使用掩膜估计的声音源的空间协方差矩阵和混合声音的空间协方差矩阵,计算维纳滤波器的自适应权重,用于加权合成麦克风阵列中的信号,以增强目标声音并抑制来自无人机的噪声及其他非目标声音,波束形成器使用自适应多通道维纳滤波器,[0052] Y(l,k)=WT(l,k)X(l,k)
[0053]
[0054] 真实的φx和φs无法直接得到,对m个麦克风对应的掩膜Mm(l,k)进行最大池化,得到掩膜M(l,k),估算φx和φs,
[0055] φs(l,k)=αφs(l‑1,k)+(1‑α)M(l,k)X(l,k)XH(l,k)
[0056] φx(l,k)=αφx(l‑1,k)+(1‑α)X(l,k)XH(l,k)
[0057] 其中,Y(l,k)表示维纳滤波器输出的混合声音;WT(l,k)表示权重矩阵;φs(l,k)表示目标声音空间协方差矩阵;φx(l,k)表示混合声音空间协方差矩阵;el表示第l项为1其余项为0的列向量;α表示固定的时间平均系数。
[0058] 更进一步的,为了继续降低无人机自噪声残留,将维纳滤波器输出的混合声音作为U型深度卷积网络的输入,计算新的掩膜和维纳滤波器输出,迭代重复,并计算均方误差,[0059]
[0060] 其中,MSE表示均方误差;NL表示数据总数; 表示Y(l,k)对应的真实值;当MSE达到最小值或达到设置的最大迭代次数时,判断为无人机噪声完全滤除,获得目标声音的频域特征。
[0061] S3:将目标声音的频域特征进行傅里叶逆变换和加窗,得到目标声音的时域特征,完成无人机噪声的滤除。
[0062] 进一步的,对波束形成器输出的每帧目标声音的频域特征分别进行傅里叶逆变换和加窗,每个分段(或帧)会单独进行逆变换,加窗的目的是减少帧与帧之间的不连续性,不连续性可能会在重建信号时产生失真,最后叠加加窗后的l帧时域信号,两帧重叠部分取均值,得到目标声音的时域特征。
[0063] 需要说明的是,加窗时要与分帧时的加窗位置、类型、窗长、重叠宽度保持一致,窗函数的类型和参数直接影响到信号的相位信息,而且具有重叠部分,如果分帧和逆变换时的窗函数不一致,可能会导致相位失真,影响信号的时域表示,加窗的一致性确保了分析(正变换)和合成(逆变换)过程的对称性,这对于信号的准确重建至关重要。
[0064] 本实施例还提供一种基于Unet深度卷积的混合声音滤除无人机噪声系统,包括,混合声音处理模块,将采集的混合声音进行加窗和傅里叶变换;迭代模块,通过U型深度卷积网络得到反映目标声音显著程度的掩膜,通过维纳滤波器滤除无人机噪声,迭代进行直到均方误差达到最小值或达到设置的最大迭代次数;目标声音输出模块,将迭代完成的目标声音的时域特征进行傅里叶逆变换和加窗,得到目标声音的时域特征并输出。
[0065] 本实施例还提供一种计算设备,包括,存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的实现基于Unet深度卷积的混合声音滤除无人机噪声方法。
[0066] 本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的基于Unet深度卷积的混合声音滤除无人机噪声方法。
[0067] 本实施例提出的存储介质与上述实施例提出的基于Unet深度卷积的混合声音滤除无人机噪声方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
[0068] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘只读存储器(ReadOnly,Memory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
[0069] 实施例2
[0070] 参照图2,为本发明的一个实施例,提供了基于Unet深度卷积的混合声音滤除无人机噪声方法,为了验证本发明的有益效果,通过仿真实验进行科学论证,实验流程如下。
[0071] 在小旋翼无人机上搭载麦克风阵列,包含4个指向不同方向的麦克风。麦克风阵列收集到4组包含目标声音和无人机自噪声的混合声音,本实施例的数据选取一号麦克风的频率点,如下表所示。
[0072] 表1混合声音数据
[0073]频率点 混合信号实部 混合信号虚部
1 1.944788 0.0
2 1.408798 0.0
3 1.148115 0.0
4 1.602366 0.0
[0074] 对于4个麦克风收集到的4组输入信号,分别使用30个窗口截取,重叠部分是窗长的1/5,然后对分段信号进行短时傅里叶变换,合并后得到4组频域特征。
[0075] 由于信噪比低,需要先对数压缩声音信号,再将压缩后的4个通道各自的30个连续帧声音信息通入U型深度卷积网络,训练后得到反映目标声音显著程度的4组掩膜。
[0076] 表2掩膜数据表
[0077] 频率点 掩膜值1 0.733055
2 0.552359
3 0.767044
4 0.205493
[0078] 所使用的U型网络是编码器‑解码器结构,包含卷积层,池化层,反卷积层,反池化层和全连接层。卷积操作使用5×7卷积核,池化操作使用1×2最大池化,填充时使用零填充。为确保网络的收敛性,对每一层进行批量规范化。在输出处引入全连接层,它结合了倒数第二层的输出,从而产生与当前输入帧相对应的理想比率掩膜。
[0079] 波束形成器使用自适应多通道维纳滤波器,输出为目标声音。通过Unet产生的掩膜来估计混合声音和目标声音空间协方差矩阵。为获得更可靠的估计,对4个麦克风对应的掩膜进行最大池化,得到掩膜,使用公式计算时,α取0.85。
[0080] 为了继续降低无人机自噪声残留,根据维纳滤波器的输出得到滤除噪声后的混合声音,此时信噪比较高可以不进行对数压缩,通过相同的U型网络,得到改进后的掩膜。改进空间协方差矩阵,得到改进后的维纳滤波器输出。经过3次重复时均方误差最小,可认为无人机自噪声已被滤除。
[0081] 表3目标声音特征表
[0082]频率点 目标信号实部 目标信号虚部
1 ‑14.672330 0.0
2 44.144850 ‑7.862340
3 ‑0.014993 11.234232
4 4.174627 ‑9.449806
[0083] 波束形成器得到的是目标声音的30帧频域特征。对每帧分别进行傅里叶逆变换和加窗(与分帧时的加窗位置、类型、窗长、重叠宽度保持一致),然后叠加加窗后的30帧时域信号,两帧重叠部分取均值,就得到目标声音的时域特征。
[0084] 应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。