一种基于智能手机的被动声源定位方法转让专利

申请号 : CN201510613502.6

文献号 : CN105277921B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王智方文浩文祥计张磊

申请人 : 浙江大学

摘要 :

本发明公开了一种基于智能手机的被动声源定位方法,该方法以智能手机替代定制硬件作为网络节点,以纯软件的方式,控制手机的麦克风和扬声器,依次发送2k‑6kHz的线性调频声信号(LFM),同时,以固定频率(44.1kHz)对其采样,以广义互相关的方式对采样波形检波,借助TPSN的思想,实现不同手机节点同步。之后,各手机节点可以对被动目标声源发出的声信号采样,本发明采用改进后的统计判决理论和语音活动性检测(VAD)结合的方法,估计目标声源信号的到达时间以获得波达时间差(TDOA),最后实现对其位置的估计。该方法不需要定制硬件模块,可规避节点间无线同步到声信号采集间的时间延迟不确定性,可用采样点数对声信号到达时间精确估计,精度高,成本低,组网方便,前景广泛。

权利要求 :

1.一种基于智能手机的被动声源定位方法,其特征在于,包括以下步骤:

(1)将智能手机作为声阵列传感器网络的节点,对声阵列传感器网络进行系统部署,组建无线局域网;

(2)对不同手机节点进行时钟同步:将其中一部智能手机作为控制节点,在其他手机节点的麦克风打开之后,控制它们依次发送和采样LFM,对采样信号做预处理,之后以广义互相关的方式对采样波形检波,借助TPSN的思想,实现不同手机节点同步;

(3)采用改进后的统计判决理论和语音活动性检测(VAD)结合的方法,估计目标声源信号的到达时间以获得TDOA;

(4)利用基于TDOA双曲线模型的伪线性最小二乘定位算法定位被动目标。

2.根据权利要求1所述一种基于智能手机的被动声源定位方法,其特征在于,所述步骤(1)具体为:选择其中一部手机作为控制节点,通过热点共享的方式,建立无线局域网,并将其他节点接入该局域网;当接入手机节点的个数超过上限时,借助无线路由器建立无线局域网,此时,也可从传输数据的便利性出发,将PC接入该局域网。

3.根据权利要求1所述一种基于智能手机的被动声源定位方法,其特征在于,所述步骤(2)具体为:让作为控制节点的手机控制其他手机节点实现多路感知协议,即在确保其他手机节点的麦克风打开之后,依次通过扬声器发出2k-6kHz的LFM信号,同时,各手机节点的麦克风对其进行采样,对采样信号做预处理,之后以广义互相关的方式对采样波形检波,借助TPSN的思想,实现不同手机节点同步。

4.根据权利要求1所述一种基于智能手机的被动声源定位方法,其特征在于,所述步骤(3)包括以下子步骤:(3.1)由于被动声源信号不可知,不能采用互相关的方法对其到达时间进行估计,可以采用基于统计判决理论的检波手段,来达到估计信号到达时间的目的,具体为:假设手机麦克风采样得到的序列为X={x1、x2…xN},其中N表示采样序列的长度;由二元信号假设检验的方法将基于统计判决理论的检波问题描述为:其中,xi∈X,ω0是背景噪声的概率密度函数,ω1是有用信号的概率密度函数;在Δτ时刻,序列元素xΔτ拒绝H0,接受H1,所服从的概率密度函数将从ω0变为ω1;

取似然函数l(xi)=(xi-μ),其中μ是背景噪声的均值,则到达时间τd=inf(k|Sk≥h),满足Sm≥h,m=k,…k+W,其中Sk=max{Sk-1+l(xk),0},S0=0  (9)

而h是判定阈值,W是为降低虚警误差而设置的检测窗口;对得到的Sk序列做能量谱分析,在归一化之后选定判定阈值h,0

(3.2)鉴于步骤(3.1)中所得到达时间结果总是略早,引入语音信号检测中的VAD判决方法得到到达时间,对τd进行加权修正,VAD的具体方法为:选用短时能量E和单帧信号短时过零率ZCR作为判决特征:

其中N为单帧帧长,x(n)表示单帧信号序列中的第n个值,引入Hangover算法对判决门限进行优化。

说明书 :

一种基于智能手机的被动声源定位方法

技术领域

[0001] 本发明涉及一种声源定位方法,尤其涉及一种基于智能手机的被动声源定位方法。

背景技术

[0002] 被动式目标定位技术能根据非合作式被检测目标特性,实现对其精确定位。与主动式或协同式目标定位不同,被动式目标定位技术在军事、移动通讯和无线电监测等领域的应用更为广泛,意义更为重大,如枪声定位、移动机器人定位和智能会议等。相对于无线信号和超声波来说,基于声信号传播时间进行测量的定位技术具有低频、低速、低能耗、易同步的优点,且声学特征明显不易消除,更容易满足被动式目标的高精度定位的需求,而且无需额外的定制硬件的支持、成本低廉。常用的基于测量信号传播时间的定位技术有波达时间(TOA)、波达时间差(TDOA)和波达方向角(AOA)等算法,分别是在实现信标节点时钟同步的基础上,对被动式声源信号到信标节点的波达时间或波达方向角进行量测,进而获得目标声源位置信息的估计。其中,TDOA和AOA更适合应用在被动式目标定位中。AOA是基于相位获得波达方向角的估计,它可以实现多目标定位,但是数学模型是在远场假设下建立的,应用受限,定位精度较差,不满足高精度的需求。相比较而言,TDOA能够基于时延获得到达时间差的估计,实现单目标或者非临近可区分的多目标定位,适用范围更广,而且精度高。
[0003] 国内外研究机构针对目标声源的定位提出了许多实用的技术方案,根据硬件平台特性可归结为两类:第一类,设计专用硬件模块,并借助无线信号或者超声波等其他类型信号实现目标声源的定位,成本高,能耗大。第二类,采用通用的智能手机为节点,利用手机内置的麦克风和扬声器,但仅能实现主目标声源的定位。需要特别指出的,现有的需要节点之间时钟同步的技术方案,无法规避节点间无线同步到声信号采集间的时间延迟不确定性引起的测量误差。

发明内容

[0004] 本发明的目的在于针对现有技术上的不足之处,提供一种基于智能手机的被动声源定位方法。
[0005] 为了实现上述的目的,本发明采取如下技术方案:一种基于智能手机的被动声源定位方法,包括以下步骤:
[0006] (1)将智能手机作为声阵列传感器网络的节点,对声阵列传感器网络进行系统部署,组建无线局域网;
[0007] (2)对不同手机节点进行时钟同步:将其中一部智能手机作为控制节点,在其他手机节点的麦克风打开之后,控制它们依次发送和采样LFM,对采样信号做预处理,之后以广义互相关的方式对采样波形检波,借助TPSN的思想,实现不同手机节点同步;
[0008] (3)采用改进后的统计判决理论和语音活动性检测(VAD)结合的方法,估计目标声源信号的到达时间以获得TDOA;
[0009] (4)利用基于TDOA双曲线模型的伪线性最小二乘定位算法定位被动目标。
[0010] 进一步地,所述步骤(1)具体为:选择其中一部手机作为控制节点,通过热点共享的方式,建立无线局域网,并将其他节点接入该局域网;当接入手机节点的个数超过上限时,借助无线路由器建立无线局域网,此时,也可从传输数据的便利性出发,将PC接入该局域网。
[0011] 进一步地,所述步骤(2)具体为:让作为控制节点的手机控制其他手机节点实现多路感知协议,即在确保其他手机节点的麦克风打开之后,依次通过扬声器发出2k-6kHz的LFM信号,同时,各手机节点的麦克风对其进行采样,对采样信号做预处理,之后以广义互相关的方式对采样波形检波,借助TPSN的思想,实现不同手机节点同步。
[0012] 进一步地,所述步骤(3)包括以下子步骤:
[0013] (3.1)由于被动声源信号不可知,不能采用互相关的方法对其到达时间进行估计,可以采用基于统计判决理论的检波手段,来达到估计信号到达时间的目的,具体为:
[0014] 假设手机麦克风采样得到的序列为X={x1、x2…xN},其中N表示采样序列的长度。由二元信号假设检验的方法将基于统计判决理论的检波问题描述为:
[0015] H0:xi~ω0  (8)
[0016] H1:xi~ω1
[0017] 其中,xi∈X,ω0是背景噪声的概率密度函数,ω1是有用信号的概率密度函数;在Δτ时刻,序列元素xΔτ拒绝H0,接受H1,所服从的概率密度函数将从ω0变为ω1。
[0018] 取似然函数l(xi)=(xi-μ),其中μ是背景噪声的均值,则到达时间τd=inf(k|Sk≥h),满足Sm≥h,m=k,…k+W,其中
[0019] Sk=max{Sk-1+l(xk),0},S0=0  (9)
[0020] 而h是判定阈值,W是为降低虚警误差而设置的检测窗口。对得到的Sk序列做能量谱分析,在归一化之后选定判定阈值h,0
[0021] (3.2)鉴于步骤(3.1)中所得到达时间结果总是略早,引入语音信号检测中的VAD判决方法得到到达时间,对τd进行加权修正,VAD的具体方法为:
[0022] 选用短时能量E和单帧信号短时过零率ZCR作为判决特征:
[0023]
[0024]
[0025] 其中N为单帧帧长,x(n)表示单帧信号序列中的第n个值,引入Hangover算法对判决门限进行优化。
[0026] 本发明的有益效果是:本发明以通用的智能手机为硬件支持,替代专门的定制硬件模块做节点,不仅适用于主动目标声源,也适用于被动目标声源。本发明单一化的利用声信号,简化了系统的复杂度,而且规避节点间无线同步到声信号采集间的时间延迟不确定性,可用采样点数对声信号到达时间精确估计,精度高,成本低,组网方便,前景广泛。

附图说明

[0027] 图1是本发明中两部手机为例的同步过程;
[0028] 图2是本发明中FIR带通滤波器的频率响应,(a)为FIR带通滤波器的幅频响应,(b)为FIR带通滤波器的相频响应;
[0029] 图3是本发明中维纳滤波前后信号的时域和时频域的对比图,(a)为处理前的含噪信号,(b)为维纳滤波后的信号,(c)为处理前的含噪信号谱图,(d)为维纳滤波后的信号谱图;
[0030] 图4是本发明中序列Sk;
[0031] 图5是本发明中序列Sk的归一化能量谱;
[0032] 图6是本发明中VAD流程图;
[0033] 图7是本发明中VAD检测结果示例;
[0034] 图8是本发明中信标和未知结点的坐标和分布图;
[0035] 图9是本发明中三个目标的TDOA误差CDF图,(a)为目标一的TDOA估计误差CDF图,(b)为目标二的TDOA估计误差CDF图,(c)为目标三的TDOA估计误差CDF图;
[0036] 图10是本发明中目标结点的定位误差的CDF图。

具体实施方式

[0037] 本发明在原有的采用预先设置好的线性调频信号,基于智能手机的声阵列主动性自定位的基础上,采用统计判决理论和语音活动性检测(VAD),对观测到的声源信号进行联合检波并获得被动目标声源到手机间的TDOA,精度高,成本低,灵活性强。
[0038] 本发明基于智能手机的被动声源定位方法,包括以下步骤:
[0039] 1、将智能手机作为声阵列传感器网络的节点,对声阵列传感器网络进行系统部署,组建无线局域网;
[0040] 该方法包括一个控制节点和若干个位置固定的信标节点组成的传感器网络,每个节点即一部智能手机。由于智能手机内嵌麦克风和扬声器的性能所限,节点的感知半径最大可以达到50m,区域可以设置为45m×45m,系统部署完成后,对其进行初始化。初始化的过程,即让其中一部手机为控制节点,通过热点共享的方式,建立无线局域网,并将其他节点接入该局域网。考虑到用手机来提供热点时,接入手机节点的各数上限为8个,可以借助无线路由器建立无线局域网,此时,也可从传输数据的便利性出发,将PC接入该局域网。
[0041] 2、对不同手机节点进行时钟同步:通过其中一部智能手机作为控制节点,在其他手机节点的麦克风打开之后,控制它们依次发送和采样LFM,对采样信号做预处理,之后以广义互相关的方式对采样波形检波,借助TPSN的思想,实现不同手机节点同步;
[0042] 2.1)信标节点时钟同步的过程
[0043] 由于采样频率固定(44.1kHz),所以可以采用样本计数的方法,规避了传统中被动式目标的TDOA定位算法中无线同步到声信号采集中间的时间延迟不确定性,从而更精确的对信号的到达时间进行量测。在对被动声源目标进行定位时,无需在不同节点之间进行交互通信,所需做的仅仅是打开各个节点的麦克风来观测环境中的声信号而已。这样一方面省去了不同节点间交互通信的时延,另一方面操作简单,方便实现。如图1,以两部手机为例表示时间同步的原理。根据图1有推导过程如下:
[0044]
[0045]
[0046] 其中,Δt为感知节点之间的时钟偏差, 是空气中的声速,T是环境的摄温度;d分别表示感知节点A与B的间距。(1)-(2)有:
[0047]
[0048] 根据式(3),可以进一步推广到多个信标节点之间的时钟同步。
[0049] 2.2)采样信号的预处理
[0050] 市面上通用智能手机仅能收发人耳能够捕捉到的声信号,其频段为200Hz-20kHz。从避免噪声扰民的角度出发,选择15kHz-20kHz作为最优带宽。对智能手机做频率响应分析,从抑制多径衰落的角度出发,选择衰减较小的2kHz-6kHz的频段作为最优带宽。本发明综合上述两个出发点,考虑到选取的LFM信号长度仅有50ms(序列长度为2205),并不会造成太大的扰民噪声,选择2kHz-6kHz的频段。
[0051] 为了抑制环境噪声的影响,以提高信噪比,进一步提高LFM信号传播时间的量测精度,本发明对检测信号作预处理操作。考虑到所采用的线性调频信号的带宽,本发明设计了一个FIR数字带通滤波器。这是因为FIR数字滤波器的单位冲激响应是有限长的,而具有稳定性。它不仅能用因果系统实现,而且可以利用快速傅里叶算法实现滤波,使得运算效率得到了大幅度的提升。如何选定FIR数字滤波器的参数,是整个数字带通滤波器实现的关键。在过渡带宽Δw和阻带衰减δ已知的情况下,可以通过下式计算凯泽窗FIR滤波器的阶数N和形状参数β:
[0052]
[0053]
[0054] 其中Δw=2πΔf/fs。
[0055] 本发明采用的调频信号的频段为2kHz-6kHz,系统的采样频率fs=44100Hz,因此可以初步选定FIR数字带通滤波器的两个通带截止频率分别为fp1=2×103Hz、fp2=6×103Hz,两个阻带起始频率fst1=1.9×103Hz,fst2=6.1×103Hz,阻带起伏as1=0.1,as2=
0.001,通带峰值起伏ap=0.01。经过计算得出阻带最小衰减为60dB,采用凯泽窗函数设计的带通滤波器,如图2所示。需要注意的是,FIR滤波器的线性时延,其与频率无关,是一个常量τ=(N-1)/fs,其中N为滤波器的阶数。值得注意的一点是,在实际应用中,FIR数字带通滤波器对原始信号产生的线性时延会因作差操作而抵消而不必再去考虑。
[0056] 采样信号经过预处理之后,可以采用广义互相关的方法检波,通过阈值法和时频分析相结合的方法抑制多径,获得高精度的线性调频声信号的达到时间,从而实现不同节点之间的时钟同步。
[0057] 3、采用改进后的统计判决理论和语音活动性检测(VAD)结合的方法,估计目标声源信号的到达时间以获得TDOA;
[0058] 3.1)信号预处理
[0059] 考虑到被动目标声源信号的未知性,常常不能预先获得信号和噪声的频谱特性,或者信号和噪声的频谱在频域是不可分开的。在这种情形下,经典滤波器是不适用的。与经典滤波器不同的是,现代滤波器是基于信号和噪声的统计特性进行设计的,能够从含有噪声的观测信号中估计出有用信号或者有用信号的重要特征。
[0060] 对观测数据y(t)=s(t)+n(t),通过滤波器H(ω)实现对信号s(t)的估计,即:
[0061]
[0062] 在均方误差,即:
[0063]
[0064] 最小的准则下,通过选取合适的信号帧长,设计合适的维纳滤波器,可以得到如图3所示的结果对比图。
[0065] 3.2)信号检测
[0066] A)基于统计判决理论的检波
[0067] 由于被动声源信号不可知,不能采用互相关的方法对其到达时间进行估计,可以采用基于统计判决理论的检波手段,来达到估计信号到达时间的目的。
[0068] 假设手机麦克风采样得到的序列为X={x1、x2…xN},其中N表示采样序列的长度。由二元信号假设检验的方法将基于统计判决理论的检波问题描述为:
[0069] H0:xi~ω0  (8)
[0070] H1:xi~ω1
[0071] 其中,xi∈X,ω0是背景噪声的概率密度函数,ω1是有用信号的概率密度函数;在Δτ时刻,序列元素xΔτ拒绝H0,接受H1,所服从的概率密度函数将从ω0变为ω1。
[0072] 需要注意地是,背景噪声的概率分布可以估计出来,但是由于被动声源信号的不可预知性,决定其概率分布不能估计出。取似然函数l(xi)=(xi-μ),其中μ是背景噪声的均值,则到达时间τd=inf(k|Sk≥h),满足Sm≥h,m=k,…k+W,其中
[0073] Sk=max{Sk-1+l(xk),0},S0=0  (9)
[0074] 而h是判定阈值,W是为降低虚警误差而设置的检测窗口。在实际应用中,由于得到的Sk序列如图4所示,选定合适的h和W是困难的,所以本发明对得到的Sk序列做能量谱分析,在归一化之后选定合适的阈值即可,一般0
[0075] B)基于语音活动性检测(VAD)的检波
[0076] 在被动声源信号未知的情况下,可以采用基于VAD的检波手段,来达到估计信号到达时间的目的。该方法需要提取声信号的特征,常用的特征有短时能量、短时过零率和短时自相关等。由于观测信号从噪声过渡到有用信号其短时能量和短时过零率会骤增,本发明选用这两个特征来设置判决门限;
[0077] 短时能量E:
[0078]
[0079] 单帧信号短时过零率ZCR:
[0080]
[0081] 其中N为单帧帧长,x(n)表示单帧信号序列中的第n个值。为降低误判率,引入Hangover算法进行优化,检波流程如图6所示。以汽车鸣笛信号为例,检测结果如图7所示。
[0082] 综上,容易看出基于统计判决理论的检波方法对达到时间的估计略早,而基于语音活动性检测(VAD)的检波方法对到达时间的估计略晚。在实际应用中,我们选择合适的权值对两者进行加权平均,这样不仅可以突破采样的最小粒度,而且进一步提高了信号到达时间的估计精度。
[0083] 4、利用基于TDOA双曲线模型的伪线性最小二乘定位算法定位被动目标。
[0084] 为了评估本发明所提出的被动式目标定位方法的性能,在噪声为50dB的室内设计实验,被动声源选择汽车鸣笛信号。设计如图8所示的简单系统,其中四个智能手机组成的阵列位置固定且已知,对三个目标位置进行估计。
[0085] 分别设计50组实验来估计每个目标结点的位置,每组实验的过程如下:打开控制节点和手机阵列上安装好的APP;打开并设置控制节点的WLAN热点;将手机阵列连入控制节点建立的WLAN;通过控制节点按照协议控制阵元结点依次发声;采样目标声源,结束录音。实验结束后,将数据通过WiFi上传到PC上进行处理。
[0086] 被动声源目标的TDOA估计误差的CDF如图9所示,其中TDOA1、TDOA2和TDOA3分别表示目标到信标2、3以及4与目标到信标1之间的TDOA。被动声源目标定位误差的CDF如图10所示,由图可知,本发明方法定位百分误差小于10%的概率大于80%。