会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 信号处理 / 信噪比 / 一种基于频点信噪比和偏置软判决的阵列声源定位方法

一种基于频点信噪比和偏置软判决的阵列声源定位方法

阅读:211发布:2021-02-24

IPRDB可以提供一种基于频点信噪比和偏置软判决的阵列声源定位方法专利检索,专利查询,专利分析的服务。并且本发明公开了一种基于频点信噪比和偏置软判决的阵列声源定位方法,通过传声器阵列采集声源信号,在时域分割为单帧信号,加窗和离散傅里叶变换为频域信号,同时继续将单帧信号分割为子帧信号,加窗和离散傅里叶变换为频域信号,计算频点信噪比,映射为偏置软判决值,计算候选方位的修正可控响应功率值,估计可控响应功率值最大的候选方位为声源方位。本发明使用麦克风组成阵列,实现立体定位,对整个频带的每个频点估计信噪比,不用考虑声源到达两个传声器的时延差,直接定位,使用Sigmoid函数增加偏置,实现软修正,参考信噪比对特定频点进行抑制,不需要信号统计特性的先验信息,无需利用静音帧的数据估计噪声功率谱,适用于噪声变换较快的环境,在定位成功率和均方误差根RMSE指标上表现更优秀,在中低信噪比环境下定位成功率优明显提升,算法鲁棒性更好。,下面是一种基于频点信噪比和偏置软判决的阵列声源定位方法专利的具体信息内容。

1.一种基于频点信噪比和偏置软判决的阵列声源定位方法,包括:通过传声器阵列采集声源信号,在时域将阵列采集的声源信号分割为单帧信号,通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号;

在时域将每个单帧信号分割为子帧信号,通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号;

由子帧信号的频域信号计算单帧信号的频点信噪比,将频点信噪比映射为偏置软判决值;

根据单帧信号的频域信号和频率软判决值计算候选方位的修正可控响应功率值,将可控响应功率最大值对应的候选方位估计为声源方位。

2.根据权利要求1所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的通过传声器阵列采集声源信号,包括:阵列由阵元组成,阵元的数量为M,序号为m,m=1...M,阵列采集声源信号的数量为M,第m个阵元采集的的声源信号为xm(t)。

3.根据权利要求2所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的在时域将阵列采集的声源信号分割为单帧信号,包括:在时域将声源信号xm(t)分割为单帧信号,单帧信号的数量为I,长度为N,序号为i,i=

1...I,单帧内的采样序号为n,0≤n<N,第i个单帧第n个采样信号为xm(iN+n)。

4.根据权利要求3所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号,包括:用窗信号 对xm(iN+n)进行加窗处理,

得到xm(i,n)=wH(n)xm(iN+n),xm(i,n)为第m个阵元第i个单帧第n个采样信号的加窗信号;

用离散傅里叶变换函数DFT对xm(i,n)进行离散傅里叶变换,变换的长度为K,频点为k,0≤k<K,得到 表示第m个阵元第i个单帧第k个频点的频域信号,Xm(i,k)为时域信号xm(i,n)对应的频域信号。

5.根据权利要求3所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的在时域将每个单帧信号分割为子帧信号,包括:将单帧信号xm(iN+n)分割为子帧信号,子帧信号的数量为Lsub,长度为Nsub=N/Lsub,序号为l,1≤l≤Lsub,子帧内的采样序号为nsub,0≤nsub<Nsub,第l个子帧第nsub个采样信号为xm(iN+(l-1)Nsub+nsub)。

6.根据权利要求5所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号,包括:用窗信号 对xm(iN+(l-1)

Nsub+nsub)进行加窗处理,得到xm(i,l,nsub)=wH(nsub)xm(iN+(l-1)Nsub+n),xm(i,l,nsub)为第m个阵元第i个单帧第l个子帧第nsub个采样信号的加窗信号;

用离散傅里叶变换函数DFT对xm(i,l,nsub)进行离散傅里叶变换,得到表示第m个阵元第i个单帧第l个子

帧第k个频点的频域信号,Xm(i,l,k)为时域信号xm(i,l,nsub)对应的频域信号。

7.根据权利要求6所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的由子帧信号的频域信号计算单帧信号的频点信噪比,包括:将Xm(i,l,k)表示为向量形式X(i,l,k)=[X1(i,l,k) X2(i,l,k)...XM(i,l,k)]T,将Xm(i,k)表示为向量形式X(i,k)=[X1(i,k) X2(i,k)...XM(i,k)]T,用X(i,l,k)计算第i个单帧信号第k个频点X(i,k)的协方差矩阵计算第i个单帧信号第k个频点的信号功率 和噪声功

率 Rpq(i,k)为协方差矩阵R(i,k)第p行第q列的数值;

由信号功率Ps(i,k)和噪声功率σ2(i,k)计算第i个单帧信号第k个频点的信噪比

8.根据权利要求7所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的将频点信噪比映射为偏置软判决值,包括:将 代入Sigmoid函数,映射为第i个单帧信号第k个频点的偏置软判决值 α为Sigmoid函数的斜率,β为信噪比偏置

值。

9.根据权利要求8所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的根据单帧信号的频域信号和频率软判决值计算候选方位的修正可控响应功率值,包括:计算候选方位到第m个阵元的导引时延τm0(r),候选方位的声源位置为r,阵列中心的位置为r0,第m个阵元的位置为rm,空气中的声速为c,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第m个阵元的声传播时延为τm(r),候选方位到第m个阵元的导引时延计算阵列的PHAT可控响应输出YPHAT(i,k,r),信号采样率为fs,将τm0(r)和Xm(i,k)代入,得到由YPHAT(i,k,r)和SD(i,k)得到第i个单帧信号在每个候选方位r的修正PHAT可控响应功率值

10.根据权利要求9所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的将可控响应功率最大值对应的候选方位估计为声源方位,包括:第i帧信号的声源方位估计值为 可控响应功率最大值对应的候选方位估计值为声源方位估计值,估计公式为

说明书全文

一种基于频点信噪比和偏置软判决的阵列声源定位方法

技术领域

[0001] 本发明涉及信号处理技术领域,具体涉及一种声源定位方法。

背景技术

[0002] 相位变换加权的可控响应功率SRP-PHAT声源定位算法,不需要信号和噪声的先验知识,只需要20-30ms数据就可以估计声源的位置,是一种可以实时实现的声源定位算法,具有较强的抗混响能力,但是传统的SRP-PHAT声源定位方法,在复杂声学环境下定位性能不能令人满意,尤其是噪声增大时,定位性能下降明显。
[0003] 为提高噪声和混响环境下的声源定位成功率,本方法采用了频点信噪比和偏置软判决,估计每个频率点的信号和噪声功率谱密度,计算每个频点的信噪比,将频率信噪比映射为带偏置的频率软判决值,修正传统的可控响应功率计算公式,信噪比高的频谱权重大,信噪比低的频谱权重小,利用可控响应功率来定位声源,由频率软判决值和频率信号计算每个候选位置的可控响应功率值,实现鲁棒的声源定位。

发明内容

[0004] 本发明为了解决现有技术存在的问题,提出了一种基于频点信噪比和偏置软判决的阵列声源定位方法,为了实现上述目的,本发明采用了以下技术方案。
[0005] 通过传声器阵列采集声源信号,阵列由阵元组成,阵元的数量为M,序号为m,m=1...M,阵列采集声源信号的数量为M,第m个阵元采集的的声源信号为xm(t)。
[0006] 在时域将阵列采集的声源信号xm(t)分割为单帧信号,单帧信号的数量为I,长度为N,序号为i,i=1...I,单帧内的采样序号为n,0≤n<N,第i个单帧第n个采样信号为xm(iN+n)。
[0007] 通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号,用窗信号对xm(iN+n)进行加窗处理,得到xm(i,n)=wH(n)xm(iN+n),xm(i,n)为第m个阵元第i个单帧第n个采样信号的加窗信号,用离散傅里叶变换函数DFT对xm(i,n)进行离散傅里叶变换,变换的长度为K,频点为k,0≤k<K,得到表示第m个阵元第i个单帧第k个频点的频域
信号,Xm(i,k)为时域信号xm(i,n)对应的频域信号。
[0008] 在时域将每个单帧信号xm(iN+n)分割为子帧信号,子帧信号的数量为Lsub,长度为Nsub=N/Lsub,序号为l,1≤l≤Lsub,子帧内的采样序号为nsub,0≤nsub<Nsub,第l个子帧第nsub个采样信号为xm(iN+(l-1)Nsub+nsub)。
[0009] 通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号,用窗信号对xm(iN+(l-1)Nsub+nsub)进行加窗处理,得到xm(i,l,nsub)=wH(nsub)xm(iN+(l-1)Nsub+n),xm(i,l,nsub)为第m个阵元第i个单帧第l个子帧第nsub个采样信号的加窗信号,用离散傅里叶变换函数DFT对xm(i,l,nsub)进行离散傅里叶变换,得到 表示第m
个阵元第i个单帧第l个子帧第k个频点的频域信号,Xm(i,l,k)为时域信号xm(i,l,nsub)对应的频域信号。
[0010] 由子帧信号的频域信号计算单帧信号的频点信噪比,将Xm(i,l,k)表示为向量形式X(i,l,k)=[X1(i,l,k) X2(i,l,k) ... XM(i,l,k)]T,将Xm(i,k)表示为向量形式X(i,k)T=[X1(i,k) X2(i,k) ... XM(i,k)] ,用X(i,l,k)计算第i个单帧信号第k个频点X(i,k)的协方差矩阵 计算第i个单帧信号第k个频点的信号功率
和噪声功率 Rpq(i,
k)为协方差矩阵R(i,k)第p行第q列的数值;由信号功率Ps(i,k)和噪声功率σ2(i,k)计算第i个单帧信号第k个频点的信噪比
[0011] 将频点信噪比映射为偏置软判决值,将 代入Sigmoid函数,映射为第i个单帧信号第k个频点的偏置软判决值
α为Sigmoid函数的斜率,β为信噪比偏置值。
[0012] 根据单帧信号的频域信号和频率软判决值计算候选方位的修正可控响应功率值,计算候选方位到第m个阵元的导引时延τm0(r),候选方位的声源位置为r,阵列中心的位置为r0,第m个阵元的位置为rm,空气中的声速为c,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第m个阵元的声传播时延为τm(r),候选方位到第m个阵元的导引时延计算阵列的PHAT可控响应输出YPHAT(i,k,r),信号采
样率为fs,将τm0(r)和Xm(i,k)代入,得到 由YPHAT(i,k,
r)和SD(i,k)得到第i个单帧信号在每个候选方位r的修正PHAT可控响应功率值
[0013] 可控响应功率最大值对应的候选方位为声源方位,第i帧信号的声源方位估计为声源方位的估计公式为
[0014] 本发明使用多个传声器组成圆形阵列,相当于多个声学传感器,实现立体定位;对声源信号的整个频带的每个频点估计信噪比,极大的提高了计算精度;不用考虑声源到达两个传声器的时延差,直接定位,使用Sigmoid函数实现软修正;对Sigmoid函数增加了偏置,参考信噪比对特定频点进行抑制;不需要信号统计特性的先验信息,无需利用静音帧的数据估计噪声功率谱;适用于噪声变换较快的环境,应用场合更为广泛;经过混响时间T60=0.3s和T60=0.6s实验,在定位成功率和均方误差根RMSE指标上表现更优秀;在中低信噪比环境下定位成功率优明显提升,算法鲁棒性更好。

附图说明

[0015] 图1是本方法的流程图,图2是Sgmoid函数在β=0改变α时的曲线,图3是Sgmoid函数在α=0.5改变β时的曲线,图4是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的成功率比较图,图5是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的均方误差根RMSE比较图,图6是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的成功率比较图,图7是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的均方误差根RMSE比较图。

具体实施方式

[0016] 以下结合附图对本发明的技术方案做具体的说明。
[0017] 一种基于频点信噪比和偏置软判决的阵列声源定位方法,如图1所示:使用多个麦克风组成传声器阵列,接收语音,采集声源信号;在时域进行分帧,将麦克风阵列采集的声源信号分割为单帧信号;对单帧信号分别做两种处理,一种是加窗和离散傅里叶变换DFT,将每个单帧信号转换为频域信号,另一种是继续在时域进行分帧,将每个单帧信号分割为子帧信号;对于后一种处理得到的子帧信号,继续加窗和离散傅里叶变换DFT,将每个子帧信号转换为频域信号;对子帧信号的频域信号,使用频率信噪比估计算法,得到单帧信号的频点信噪比;使用Sigmoid函数,将频点信噪比映射为带偏置的频率软判决值;根据单帧信号的第一种处理得到的频域信号,和第二种处理得到的频率软判决值,参考每个候选方位到每个麦克风的导引时延,计算每个候选方位的修正可控响应功率值;选择可控响应功率最大值对应的候选方位,估计声源位置。
[0018] 选用6个全向麦克风,组成均匀的圆形阵列,通过圆形麦克风阵列接收语音,采集声源信号,语音信号的采样率fs设置为16kHz,阵列半径设置为0.1m,每个麦克风作为一个阵元,阵列采集声源信号的数量和阵元的数量均为M=6,序号为m=1...M,第m个阵元采集的的声源信号为xm(t)。
[0019] 在时域将xm(t)分割为单帧信号,单帧信号的数量为I,长度为N=512(32ms),帧移设置为0,序号为i,i=1...I,单帧内的采样序号为n,0≤n<N,第i个单帧第n个采样信号为xm(iN+n)。
[0020] 对每个单帧信号进行加窗处理,用窗信号对xm(iN+n)加窗,得到xm(i,n)=wH(n)xm
(iN+n),xm(i,n)为第m个阵元第i个单帧第n个采样信号的加窗信号。
[0021] 将单帧信号的加窗信号从时域变换到频域,用离散傅里叶变换函数DFT对xm(i,n)进行离散傅里叶变换,变换的长度为K,设置K=2N=1024,频点为k,0≤k<K,得到表示第m个阵元第i个单帧第k个频点的频域信号,Xm(i,k)为时域信号xm(i,n)对应的频域信号。
[0022] 在时域将每个单帧信号xm(iN+n)继续分割为子帧信号,子帧信号的数量设置为Lsub=8,长度为Nsub=N/Lsub=64,序号为l,1≤l≤Lsub,子帧内的采样序号为nsub,0≤nsub<Nsub,第l个子帧第nsub个采样信号为xm(iN+(l-1)Nsub+nsub)。
[0023] 对每个子帧信号进行加窗处理,用窗信号对xm(iN+(l-1)Nsub+nsub)加窗,
得到xm(i,l,nsub)=wH(nsub)xm(iN+(l-1)Nsub+n),xm(i,l,nsub)为第m个阵元第i个单帧的第l个子帧第nsub个采样信号的加窗信号。
[0024] 将子帧信号的加窗信号从时域变换到频域,用离散傅里叶变换函数DFT对xm(i,l,nsub)进行离散傅里叶变换,得到 表示第m个阵元第i个单帧第l个子帧第k个频点的频域信号,Xm(i,l,k)为时域信号xm(i,l,nsub)对应的频域信号。
[0025] 将Xm(i,l,k)表示为向量形式X(i,l,k)=[X1(i,l,k) X2(i,l,k)  ... XM(i,l,k)]T,将Xm(i,k)表示为向量形式X(i,k)=[X1(i,k) X2(i,k)  ... XM(i,k)]T,用X(i,l,k)计算第i个单帧信号第k个频点X(i,k)的协方差矩阵 计算第i个单帧信号第k个频点的信号功率 和噪声功率
Rpq(i,k)为协方差矩阵R(i,k)第p行第q列的数值,由
信号功率Ps(i,k)和噪声功率σ2(i,k)计算第i个单帧信号第k个频点的信噪比
[0026] 将频点信噪比 代入Sigmoid函数,映射为第i个单帧信号第k个频点的偏置软判决值 α为Sigmoid函数的斜
率,影响函数曲线的陡峭程度,β为信噪比偏置值,影响曲线左右平移。
[0027] 设置β=0改变α的数值,软判决值SD与信噪比SNR之间的关系,如图2所示,α取值越小,比如取值0.2,软判决值SD的曲线越平坦,说明对不同信噪比的频点加权区分度不大,极限情况是α=0,此时SD=1/2,所有频点的权重相同,修正算法等同于原始算法,或者说原始算法是修正算法的一个特例,随着α取值越来越大,曲线越来越陡峭,对低信噪比的频谱抑制越明显,极限情况是当α=∞,此时SD是一个阶跃函数,修正算法将抑制掉所有信噪比低于0dB的频点,而保留所有信噪比高于0dB的频率点,且对信噪比大于0dB的频点没有加权区分。
[0028] 设置α=0.5改变β的数值,软判决值SD与信噪比SNR之间的关系,如图3所示,曲线的拐点位于(β,0.5)处,信噪比低于β的频点被明显抑制,当β取值过大时,大多数频点被明显抑制,可用的频点过少,当β取值过小时,信噪比低的频点没有被明显抑制。
[0029] 综上所述,β的取值影响函数曲线的左右平移,α取值过小,曲线平坦,对不同信噪比的频率加权区分度太小,修正作用不明显,α取值过大,曲线过于陡峭,几乎完全抑制信噪比小于β的频点,保留信噪比大于β的频点,且信噪比大于β的频点之间加权区分度也很小,当α取值为0.5,β取值为2时,定位性能最好。
[0030] 计算候选方位的声源到接收麦克风的导引时延,空气中的声速为c,常温下约342m/s,假设候选方位的声源位置为r,阵列中心的位置为r0,第m个阵元的位置为rm,候选方位到阵列中心的声传播时延为τ0(r),到第m个阵元的声传播时延为τm(r),那么候选方位到第m个阵元的导引时延
[0031] 假设声源与麦克风阵列处于同一水平面,声源位于阵列的远场,声源位置由方位角θ表示,定义水平面的正前方为0°,θ的范围为[-180°,180°],间隔为1°,其中,-90°表示正左方,90°表示正右方,则导引时延的等价计算公式为 其中ξ=[cosθ,sinθ]T,由于τm0(r)与接收信号无关,可以离线计算后保存于内存中。
[0032] 假设声源与麦克风阵列不在同一水平面,方位角由水平角θ和俯仰角 共同决定,仍然可以确定对声源的位置。
[0033] 根据单帧信号的频域信号和频率软判决值计算候选方位的可控响应功率值,信号采样率为fs,将τm0(r)和Xm(i,k)代入,计算阵列的PHAT可控响应输出YPHAT(i,k,r),得到由YPHAT(i,k,r)和SD(i,k)得到第i个单帧信号在每个候选方位r的修正PHAT可控响应功率值
[0034] 可控响应功率最大值对应的候选方位为声源方位,第i帧信号的声源方位估计为声源方位的估计公式为
[0035] 分别设置混响时间T60=0.3s和T60=0.6s,测试不同信噪比和混响的环境中,本声源定位方法的性能,如图4至7所示,横坐标表示信噪比,纵坐标分别表示定位成功率和RMSE,在定位成功率和均方根误差RMSE的指标上,本方法均比传统SRP-PHAT算法有显著提升,尤其在中低信噪比环境中的定位成功率提升明显,验证了本方法的鲁棒性。
[0036] 上述作为本发明的实施例,并不限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用