一种基于分布式扩散策略的反馈粒子滤波方法转让专利

申请号 : CN202010042906.5

文献号 : CN111211760B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 夏威孙美秋周卓阳

申请人 : 电子科技大学

摘要 :

本发明属于信号处理领域,涉及信号处理领域的目标跟踪问题,具体为一种基于分布式扩散策略的反馈粒子滤波方法。本发明基于分布式网络框架,网络中的每个节点通过与邻居节点交换信息完成对目标的跟踪,降低了网络运算负担,且具有更强的稳健性;同时,本发明通过引入由目标状态的真实后验分布与粒子后验分布之间的Kullback‑Leibler(K‑L)散度定义代价函数,使每个粒子在基于其自身状态和经验分布特征的反馈控制下演化,从而不需要再构造建议分布和进行重采样过程;另外,本发明与经典分布式粒子滤波方法相比,能够实现更高的跟踪精度,更好的跟踪性能,且对粒子数变化敏感度低,稳定性更好。

权利要求 :

1.一种基于分布式扩散策略的反馈粒子滤波方法,其特征在于,包括以下步骤:步骤1:在k时刻,构建传感器l上的局部观测值其中, 表示在k时刻传感器l的第j个邻居传感器的观测值;

步骤2:计算反馈滤波中第l个传感器上第m个粒子的修正形式的新息过程其中,表示在k时刻第l个传感器上第m个粒子;

步骤3:计算反馈滤波中第l个传感器上第m个粒子的增益函数其中,

Rii表示矩阵 的第i行第i列的元素,Rk为观测噪声ηk的方差;

步骤4:粒子更新,得到k+1时刻第l个传感器上的第m个粒子 的表达式如下:其中,映射函数a(·): 表示在k时刻第l个传感器上第m个粒子的系统噪声Qk表示状态空间模型的系统噪声ξk的方差;

步骤5:计算k时刻传感器l的中间状态估计值αl,k:

说明书 :

一种基于分布式扩散策略的反馈粒子滤波方法

技术领域

[0001] 本发明属于信号处理领域,涉及信号处理领域的目标跟踪问题,特别是涉及到分布式架构下的反馈粒子滤波目标跟踪问题,具体为一种基于分布式扩散策略的反馈粒子滤波方法。

背景技术

[0002] 粒子滤波是一类基于递推贝叶斯法则,利用样本统计量对系统状态进行估计的方法,在处理非高斯非线性系统的参数/状态滤波问题方面具有独特的优势,已被广泛应用于目标跟踪、通信信号处理以及计算机视觉等领域。
[0003] 一般针对粒子滤波方法研究主要基于文献“Gordon N J,Salmond D J,Smith A F M.Novel Approach to Nonlinear/Non‑Gaussian Bayesian State Estimation[J].Radar and Signal Processing,IEE Proceedings F,1993,140(2):107‑113.”中提出的自举滤波(Bootstrap Filter)框架,即序列重要性采样(Sequential Importance Sampling,SIS)或建议分布采样‑重要性再采样(Sampling‑Importance Resampling,SIR),如果建议分布产生的样本不能足量覆盖后验分布样本,则容易导致粒子贫化。针对贫化问题已有大量改进算法,主要针对重采样改进或(和)建议分布改进;重采样改进,如马尔科夫蒙特卡洛(MCMC)采样、辅助粒子滤波(APF)、正则化粒子滤波(RPF)等,目的在于从建议样本中更准确的抽取后验样本,并未从根本上克服贫化问题;建议分布改进,如无迹卡尔曼‑粒子滤波(UKF‑PF)、容积卡尔曼‑粒子滤波(CKF‑PF)及混合粒子滤波(MPF)等,目的是构造更接近后验概率密度的建议分布,这类改进方法对于不同系统模型的性能差异较大,难以达到贝叶斯意义下的最优估计。
[0004] 近年来,文献“Yang T,Laugesen R  S,Mehta P G,et al.Multivariable feedback particle filter[C]2016:10‑23.”中提出了一种反馈粒子滤波(Feedback Particle Filter,FPF)方法,反馈粒子滤波是一种基于平均场博弈论(mean‑field game theory)的近似非线性滤波新方法;通过对先验样本构造反馈,采用Kullback‑Leibler Divergence(KLD)来度量反馈后概率分布与真实后验分布之间的差异,将最小化KLD等效为欧拉‑拉格朗日边值问题求解反馈增益,使得由先验样本能够直接得出后验样本,每个粒子在基于其自身状态和经验分布特征的反馈控制下演化,从而不需要再构造建议分布和进行重采样过程。
[0005] 目前,反馈粒子滤波方法都基于集中式架构,即将网络中各接收机接收的信号都传递到融合中心,在该特定的接收机上进行运算,即集中式的处理方式;然而,集中式处理方式扩展性较差,存在多跳通信问题,对网络的通信带宽要求较高,以及因为存在融合中心接收机和参考信号导致鲁棒性较差;同时,因为所有的位置估计运算都在融合中心接收机进行,所以融合中心接收机的运算负担和能量消耗都很大。
[0006] 基于此,本发明提出一种基于分布式扩散策略的反馈粒子滤波方法。

发明内容

[0007] 本发明的目的在于针对上述集中式反馈粒子滤波方法所存在的问题,提出一种基于分布式扩散策略的反馈粒子滤波方法。为实现该目的,本发明采用的技术方案如下。
[0008] 一种基于分布式扩散策略的反馈粒子滤波方法,其特征在于,包括以下步骤:
[0009] 步骤1:在k时刻,构建传感器l上的局部观测值
[0010]
[0011] 其中, 表示在k时刻传感器l的第j个邻居传感器的观测值;
[0012] 步骤2:计算反馈滤波中第l个传感器上第m个粒子的修正形式的新息过程[0013]
[0014] 其中,
[0015]
[0016]
[0017] 表示在k时刻第l个传感器上第m个粒子;
[0018] 步骤3:计算反馈滤波中第l个传感器上第m个粒子的增益函数
[0019]
[0020] 其中,
[0021]
[0022] Rii表示矩阵 的第i行第i列的元素,Rk为观测噪声ηk的方差;
[0023] 步骤4:粒子更新,得到k+1时刻第l个传感器上的第m个粒子 的表达式如下:
[0024]
[0025] 其中,映射函数 表示在k时刻第l个传感器上第m个粒子的系统噪声 Qk表示状态空间模型的系统噪声ξk的方差;
[0026] 步骤5:计算k时刻传感器l的中间状态估计值αl,k:
[0027]
[0028] 本发明的有益效果在于:
[0029] 本发明提出的一种基于分布式扩散策略的反馈粒子滤波方法,具有如下优点:
[0030] 1、本发明具有更强的稳健性;对集中式而言,当融合处理中心出现问题时,整个系统将会瘫痪,而分布式算法能有效避免融合中心出问题时整个系统崩溃的风险;
[0031] 2、在大型的传感器网络中,带宽限制了邻居传感器之间的信息传输数量,每个节点处只需同其邻点交换信息,本发明提出的基于分布式网络框架的方法不需要网络所有节点的信息送至融合中心进行处理,允许网络中的每个节点通过与邻居节点交换信息完成对目标的跟踪,降低了网络运算负担;
[0032] 3、本发明提出的方法是基于最优控制和平均场博弈论的概念的新型非线性分布式滤波粒子滤波方法,引入由目标状态的真实后验分布与粒子后验分布之间的Kullback‑Leibler(K‑L)散度定义的代价函数,最小化该代价函数,得到最优反馈增益函数 进而使每个粒子在反馈控制下不断演化,从而不需要再构造建议分布和进行重采样过程;
[0033] 4、本发明提出的反馈粒子滤波方法与经典分布式粒子滤波方法相比,能够实现更高的跟踪精度,更好的跟踪性能;同时,受粒子数影响更小,稳定性更好。

附图说明

[0034] 图1为本发明基于分布式扩散策略的反馈粒子滤波方法的流程图。
[0035] 图2为本发明实施例中传感器网络示意图。
[0036] 图3为本发明实施例中使用的网络拓扑结构图。
[0037] 图4~图7为本发明实施例中仿真结果图。

具体实施方式

[0038] 下面结合附图对本发明作进一步说明:
[0039] 本发明提供一种基于分布式扩散策略的反馈粒子滤波方法,考虑动态系统的状态空间模型为:
[0040] xk+1=a(xk)+ξk,
[0041] zk=h(xk)+ηk,
[0042] 其中,k时刻: (表示xk是实数域内d维列向量、d为目标状态向量的维度)为目标状态向量, 为观测向量;映射函数 映射函数 N为观测向量的维度; 分别为系统噪声和观测噪声,均服从互不相关的零均值
高斯分布,其协方差矩阵表示为:
[0043]
[0044] 其中,(·)T表示矩阵/向量的转置,δki为克罗内克尔记号;
[0045] 在传感器个数为L的无线传感器网络中,在起始k=1时刻,根据状态向量x1的初始分布p(x1)随机采样M个随机预测粒子 具体为:
[0046]
[0047] 本实施例中,传感器网络中有L个传感器,如图2所示,将传感器l及其邻居传感器(包括传感器l)的集合记为 记 表示集合 的基数、即nl表示传感器l的邻居传感器数目(包含传感器l);即传感器l的邻居传感器集合 由传感器2、3、4、l及j组成;基于分布式扩散策略的反馈粒子滤波方法的流程如图2所示,具体包括以下步骤:
[0048] 步骤1:在k时刻,构建传感器l上的局部观测值
[0049]
[0050] 其中, 表示在k时刻传感器l的第j个邻居传感器的观测值,col{·}表示将括号内的向量罗列起来形成列向量;在k时刻,传感器l只能与邻居传感器相互交换信息;
[0051] 步骤2:在k时刻,计算反馈滤波中第l个传感器上第m个粒子的修正形式的新息过程
[0052]
[0053] 其中,
[0054]
[0055]
[0056] 表示在k时刻第l个传感器上第m个粒子,E[·]表示求数学期望;
[0057] 在实际应用时, 常用下式进行估计:
[0058]
[0059] 步骤3:在k时刻,计算反馈滤波中第l个传感器上第m个粒子的增益函数[0060]
[0061] 其中, 由下式计算:
[0062]
[0063] 其中,Rii表示矩阵 的第i行第i列的元素,Rk为观测噪声ηk的方差;[·]i表示括号内向量的第i个元素;
[0064] 步骤4:粒子更新,得到k+1时刻第l个传感器上的第m个粒子 的表达式如下:
[0065]
[0066] 其中, 表示在k时刻第l个传感器上第m个粒子的系统噪声 服从标准正太分布采样 是相互独立的零均值高斯白噪声;Qk表示状态空间模型的系统噪声ξk的方差;
[0067] 步骤5:计算k时刻传感器l的本地中间状态估计值
[0068]
[0069] 步骤6:分布式扩散融合阶段,传感器l与邻居传感器交换本地中间状态估计值将传感器l所有邻居节点的本地中间状态估计值线性组合,得到k时刻传感器l的局部状态估计值,即:
[0070]
[0071] 其中,[·]j表示方括号内的向量的第j个元素;组合系数向量并且满足下式
[0072]
[0073] 仿真测试:
[0074] 下面构建一个典型的基于距离的系统模型,将本发明方法(简称分布式反馈粒子滤波)与文献“Mohammadi A,Asif A.Diffusive Particle Filtering for Distributed Multisensor Estimation[J].Acoustics,Speech,and Signal Processing,1988.ICASSP‑88.1988International Conference on,2016.”中提出的一种经典的分布式粒子滤波方法(简称分布式粒子滤波)对比来说明本发明方法的可行性、优越性。
[0075] 仿真条件:
[0076] (1)信号模型:采用包含L个节点的分布式网络,网络拓扑结构如图2所示,假定目标在x‑y平面移动,假设目标做匀速直线运动,目标状态为 目标运动过程中必然受到风力、摩擦力等因素的干扰,这个干扰噪声可以认为随机加速度,采样间隔为T=1,因此状态方程的具体形式如下:
[0077] xk+1=Φxk+Γξk,
[0078]
[0079] 假设L个观测站的位置为 则根据观测距离模型可知观测方程的具体形式如下:
[0080] zl,k=hl(xk)+ηl,k,
[0081]
[0082] (2)参数设置:网络中共有13个传感器,粒子初始估计位置[60,3,60,3];目标初始真实位置[‑100,10,100,10];观测噪声方差为100;最大邻居节点数目4;邻域最大半径2000;分布式粒子滤波方法与分布式反馈粒子滤波方法都使用静态的扩散组合系数(Uniform)进行仿真,蒙特卡罗实验50次。
[0083] 位置NRMSE(Network Root Mean Square Error)定义为:
[0084]
[0085]
[0086] 其中, 和 分别是时刻k第ι次独立实验x‑和y‑方向目标位置 的估计结果,是独立实验次数,速度的NRMSE计算方式被类似定义。
[0087] 每个传感器上的粒子数设为50时,分布式粒子滤波方法与分布式反馈粒子滤波方法的位置误差仿真结果如图3所示,二者速度误差的仿真结果如图4所示。
[0088] 每个传感器上的粒子数设为200时,分布式粒子滤波方法与分布式反馈粒子滤波方法的位置误差仿真结果如图5所示,二者速度误差的仿真结果如图6所示。
[0089] 由图4、5、6、7表明,本发明方法(即分布式反馈粒子滤波方法)在基于距离的观测模型下,相对于文献“Diffusive Particle Filtering for Distributed Multisensor Estimation”中的分布式粒子滤波方法,位置和速度的NRMSE结果具有更快的收敛速度以及更低的稳态,这意味着本发明方法(即分布式反馈粒子滤波方法)跟踪目标的准确度和速度方面明显优于文献“Diffusive Particle Filtering for Distributed Multisensor Estimation”中的分布式粒子滤波方法。
[0090] 进一步对比图4、5与图6、7可见,在粒子数设置为50和200时,相对于文献“Diffusive Particle Filtering for Distributed Multisensor Estimation”中的分布式粒子滤波方法,本发明方法(即分布式反馈粒子滤波方法)位置和速度的NRMSE结果差异不大,因此,本发明方法对粒子数变化不敏感,稳定性更强。
[0091] 以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。