一种实现阵列麦克风波束形成的方法转让专利
申请号 : CN201911213687.6
文献号 : CN110913306B
文献日 : 2021-07-02
发明人 : 杨振华 , 曹忻军 , 陈洪顺 , 曹庆 , 徐统业
申请人 : 北京飞利信电子技术有限公司
摘要 :
权利要求 :
1.一种实现阵列麦克风波束形成的方法,其特征在于,包括以下步骤,
1)将需处理的声音范围分为高频部分a-b和低频部分b-c,其中a>b>c,a的取值范围为[4kHz,16kHz],b的取值范围为[850Hz,3.4kHz],c的取值范围为[20Hz,1kHz];
m n
2)选取比例常数R=1.509,使c×R=b,b×R=a,其中,m、n为正整数;
0 1 2 n
3)以[b×R],[b×R],[b×R],.....,[b×R]分别为中心频率,计算每个中心频率对应的二元阵孔径 得
到包括n+2个阵元的阵列麦克风,其中最左侧阵元为参考阵元,其右侧n+1个阵元分别与参考阵元组合成n+1个子阵,n+1个子阵的孔径分别为d0,d1,d2,.....,dn;
0 1 2 m 1 2 n
4)以[c×R ],[c×R ],[c×R],.....,[c×R],[b×R],[b×R ],.....,[b×R]为中m 0
心频率将阵列麦克风每个阵元分解成子带信号,其中[c×R]=[b×R],对于其中高频部分
0 1 2 n
[b×R ],[b×R],[b×R],.....,[b×R]的n+1个子带按照二阵元直接相加,低频部分[c
0 1 2 m‑1
×R],[c×R],[c×R ],.....,[c×R ]的m个子带按照n+2个阵元加权相加,低频部分的m个子带按照n+2个阵元加权相加的方法为线性约束最小方差(LCMV)方法;
5)对步骤4)中所有子带按照汉明窗平滑合成,得到了在a-c频率范围内的空间响应。
2.根据权利要求1所述的一种实现阵列麦克风波束形成的方法,其特征在于,所述的a为8000Hz,b为1543Hz,c为131Hz,所述的比例常数R为1.509,可以得到中心频率分别为
131Hz、197Hz、298Hz、450Hz、678Hz、1022Hz、1543Hz、2328Hz、3513Hz、5302Hz和8000Hz,6个阵元中一个为参考阵元,其余阵元距参考阵元的孔径距离分别为2.13cm、3.21cm、4.84cm、
7.30cm和11.02cm。
说明书 :
一种实现阵列麦克风波束形成的方法
技术领域
背景技术
信号失真而降低了语音质量和可理解性。人们在借鉴雷达、天线等阵列的应用后,设计出带
有指向性的阵列麦克风。阵列麦克风有诸多优点,例如不需要鹅颈话筒因而更加美观,具有
指向性因而有助于抑制会场噪声的干扰,抑制音响设备与发言设备之间可能产生的啸叫等
等。阵列麦克风的语音增强算法一般采用波束形成噪音抑制方法,其思想是期望在阵列中
心到目标语音间形成一个波束,而波束外的信号被抑制掉,然后对波束内渗入的噪音采用
单道噪音抑制算法进行处理,得到最终的目标语音输出。
适应非常宽泛的电磁波谱。而人耳能明确感知的声波主要在130Hz-8000Hz,语音信号主要
在300Hz-3400Hz。虽然声音信号的频率跨度非常大,难以在阵列麦克风有限的阵列尺寸和
阵元个数下,使其空间响应在整个频带达到理想的一致性。但也不能简单地认为采用固定
或自适应波束成形算法就能实现阵列麦克风语音交互的良好效果,毕竟人耳接收的不是冰
冷的电平,而是有很大的主观性。
实现一致的空间响应。查阅国内外文献,还不存在相关技术方法。
发明内容
形成的方法还原宽带信号,能够使用较少的麦克风单元和较小的阵列尺寸,在语音的频率
范围内实现一致的空间响应,并具有很好的语音还原质量。
得到包括n+2个阵元的阵列麦克风,其中最左侧阵元为参考阵元,其右侧n+1个阵元分别与
参考阵元组合成n+1个子阵,n+1个子阵的孔径分别为d0,d1,d2,.....,dn;
为中心频率将阵列麦克风每个阵元分解成子带信号,其中[c×R]=[b×R],对于其中高频
0 1 2 n
部分[b×R],[b×R],[b×R ],.....,[b×R ]的n+1个子带按照二阵元直接相加,低频部
0 1 2 m‑1
分[c×R],[c×R],[c×R],.....,[c×R ]的m个子带按照n+2个阵元加权相加;
2328Hz、3513Hz、5302Hz和8000Hz,6个阵元中一个为参考阵元,其余阵元距参考阵元的孔径
距离分别为2.13cm、3.21cm、4.84cm、7.30cm和11.02cm。
风孔径,对于高频部分子带按照二阵元直接相加的方法处理,对于低频子带采用LCMV
(Linear Constraint Minimal Variance)方法波束形成,得到了在整个频率范围内的空间
响应;2)以不同尺寸的子阵处理高频部分,以不同权矢量处理低频部分,通过两种方法的综
合,扩大了波束形成的频率范围,在130Hz至8000Hz,超过60倍的频率范围内实现了一致性
较好的空间响应;3)通过汉明窗平滑合成的方法,使子带之间平滑过渡,进一步提高了空间
响应的一致性;4)在划分子带时,使各相邻子带之间部分重叠,然后利用汉明窗使重叠部分
加权叠加,因此抵消了子带之间响应曲线的变化,使子带合成结果更加平滑,增强了空间响
应的一致性;5)本发明以LCMV方法处理低频子带,降低了对阵列尺寸的需求。另外,嵌套的
阵列结构使多个二阵元子阵共用一个参考阵元,进一步降低了阵列尺寸,也大大地减少了
算法计算量。
好的语音还原质量。
附图说明
具体实施方式
于a的取值范围,我们知道人耳的敏感频率范围上限约为4kHz,在高音质需求中可以扩展上
限,但通常不有关会超过16kHz。对于b的取值范围,我们一般认为与我们阵列最大孔径dmax
有关,考虑物理设备的限制和人类语音的中间范围,对应的阵列麦克风的尺寸一般在5cm至
20cm范围内,根据340/(2*dmax)转化成对应的取值范围。对于c的取值范围,因为人耳的敏感
频率范围下限约为1kHz,在高音质需求中可以扩展其下限,但极限情况也不会低于20Hz;
得到包括n+2个阵元的阵列麦克风,其中最左侧阵元为参考阵元,其右侧n+1个阵元分别与
参考阵元组合成n+1个子阵,n+1个子阵的孔径分别为d0,d1,d2,.....,dn;
为中心频率将阵列麦克风每个阵元分解成子带信号,其中[c×R]=[b×R],对于其中高频
0 1 2 n
部分[b×R],[b×R],[b×R ],.....,[b×R ]的n+1个子带按照二阵元直接相加,低频部
0 1 2 m‑1
分[c×R],[c×R],[c×R],.....,[c×R ]的m个子带按照n+2个阵元加权相加;
5302‑2328Hz、3513‑1543Hz、2328‑1022Hz共5个子带,将低频部分分为中心频率为1022Hz、
678Hz、450Hz、298Hz、197Hz、131Hz的1543‑678Hz、1022‑450Hz、678‑298Hz、450‑197Hz、298‑
131Hz、197‑131Hz共6个子带。在划分子带时,使高频部分的子带2328‑1022Hz与低频部分的
1543‑678Hz有部分重合,这是为了在最后波束形成时有平滑的过渡。
信号形成如图3右侧的空间响应,其中340m/s是声速。该响应曲线符合我们对阵列麦克风指
向性的要求:在保护方向上形成一个增益为1且宽度合适的主瓣,在抑制方向上形成增益为
0的零点。
子带,系统的复杂度和计算量会很大。本实施例中比例常数R=1.509。
个子带,其中心频率依次为8000Hz、5302Hz、3513Hz、2328Hz和1543Hz,第1子带没有高于
8000Hz的部分,以8000Hz为截止频率。
套结构,它包含6个阵元,以最左侧阵元为参考阵元,其右侧5个阵元分别与之组合成5个子
阵。
化问题:
优解称为最优权矢量Wopt,对应的空间响应称为最优空间响应。
出最优权矢量。LCMV方法需要的阵列孔径明显更小,这正是本发明的方法在低频部分应用
LCMV方法的原因。
中心频率为3513Hz的第3子带在五个频率点上的空间响应,在中心频率处的响应曲线最理
想,越往边界处变形越严重。图5中B行和C行分别展示了中心频率为5302Hz的第2子带及中
心频率为2328Hz的第4子带与第3子带的重叠部分在相同频率点上的响应曲线。可以见到,
若在5302Hz处取B曲线;在4408Hz处取A和B曲线的平均;在3513Hz处取A曲线;在2920Hz处取
A和C曲线的平均;在2328Hz处取C曲线,则可以在这五个频率上得到较一致的空间响应。为
了达到这一效果,一般应用汉明窗进行平滑合成。附图5中D展示了我们使用的汉明窗,将各
子带做波束形成的结果按汉明窗相乘叠加,可以使空间响应在整个频率范围内达到很好的
一致性。附图6展示了第3子带内各频率的响应曲线的变化,左侧是做汉明窗叠加之前的,其
变化范围很大,右侧是做汉明窗叠加之后的,所有曲线都收敛到了理想响应附近,一致性显
著提高。应用汉明窗平滑合成方法,高频部分5个子带的合成结果如附图7所示。
六阵元加权相加的方法处理。对所有子带按照汉明窗平滑合成,得到了在整个频率范围内
的空间响应,如附图8所示。
因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。