基于无限最大间隔线性判别投影模型的雷达目标识别方法转让专利

申请号 : CN201710351886.8

文献号 : CN107219510B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈渤刘宁文伟刘宏伟

申请人 : 西安电子科技大学

摘要 :

本发明提出了一种基于无限最大间隔线性判别投影模型的雷达目标识别方法,用于解决现有雷达目标识别方法中存在的识别率低的技术问题。实现步骤为:获取功率谱特征训练样本集X和其对应的类别标号集y;构建无限最大间隔线性判别投影模型;定义无限最大间隔线性判别投影模型联合伪后验分布的表达式;设定无限最大间隔线性判别投影模型联合伪后验分布的表达式中各个参数的初始值;表示无限最大间隔线性判别投影模型联合伪后验分布中各个参数的条件后验分布;对表示出的各个参数的条件后验分布进行采样;获取功率谱特征测试样本集和其对应的测试类别标号集获取雷达目标的识别率。本发明可用于对雷达高分辨距离像进行检测识别。

权利要求 :

1.一种基于无限最大间隔线性判别投影模型的雷达目标识别方法,包括以下步骤:(1)获取功率谱特征训练样本集X和其对应的类别标号集y:(1a)雷达接收N个C类目标的高分辨距离像,得到N个高分辨距离像;

(1b)提取N个高分辨距离像中每个高分辨距离像的功率谱特征,得到功率谱特征训练样本集X={x1,x2,···,xn,···,xN},并将功率谱特征训练样本集X对应的类别标号通过类别标号集y表示:y={y1,y2,···,yn,···,yN},N表示训练样本的总个数,xn表示第n个样本,yn表示第n类样本的类别标号yn∈{1,2,···,C};

(2)构建无限最大间隔线性判别投影模型:将狄利克雷过程DP混合模型、投影模型和隐变量SVM分类器统一在Bayesian模型框架下,得到无限最大间隔线性判别投影模型,实现步骤为:(2a)表示基于Stick-breaking构造的狄利克雷过程DP混合模型:υc|α~Beta(1,α),θc|G0~G0,c=1,2,…,∞hn|π(υ)~Mult(π(υ)),xn|hn=c;θc~p(x|θc),n=1,...,N其中,υc为截棍比例参数, 表示每次截棍长度,α为υc的先验分布参数α~Ga(e0,f0);θc表示xn的分布参数,θc的分布为G0,G0表示基分布,设基分布为Normal-Wishart分布,即G0~NW({μc,Σc}|μ0,W0,ν0,β0);hn是xn的指示因子,当hn=c时表示xn属于第c类,即xn~p(x|θc);

(2b)表示每个聚类中的投影模型:

基于MMLDP模型的投影模型可以表示为:zn~N(AΤxn,I), κk~Ga(c0,d0),其中,A表示全局投影矩阵A=[a1,a2,…,ak],ak表示A的第k列,xn表示第n个样本,κk为ak的先验分布参数,c0和d0为κk参数的超参数;

则每个聚类中的投影模型可以表示为:

zn|hn=c,Ac~N(AcΤxn,Ip),Ac=[ac1,ac2,…,ack,…,acK]κk~Ga(c0,d0)

其中,当聚类指示变量hn等于c的时候,zn就服从均值为AcΤxn,协方差矩阵为Ip的正态分布,p表示单位矩阵I的维度;

(2c)表示每个聚类中隐变量SVM分类器的模型:

设定第c个隐变量SVM分类器的参数服从先验分布为 将每个隐变量SVM分类器的先验分布分别带入到每个隐变量SVM分类器中,得到每个聚类中隐变量分类器的模型,可以表示为:βc~Ga(a0,b0)

其中,λ=[λ1,λ2,…,λc,…,λC]表示隐变量SVM分类器中的隐变量,λc表示第c个隐变量SVM分类器中的隐变量;

(2d)将狄利克雷过程DP混合模型、投影模型和隐变量SVM分类器统一在Bayesian模型框架下,得到无限最大间隔线性判别投影模型,其层次化结构式为:υc|α~Beta(1,α);α~Ga(e0,f0)hn|π(υ)~Disc(π(υ))

xn|hn=c,{μc,Σc}~p(xn|{μc,Σc}),n=1,...,N.

Ac=[ac,1,...,ac,K]

yn,{λn}c|{zn,hn=c},ωc~φ(yn,λn|ωc,zn),c=1,...,∞β~Gama(a0,b0)

κc,k~Gama(c0,d0)

{μc,Σc}~NW(μ0,W0,ν0,β0)

其中,根据上式的层次化表达式,得到第n个样本xn的似然分布函数:(3)定义无限最大间隔线性判别投影模型联合伪后验分布,其表达式为:其中,ωc表示第c类分类器参数,分布服从N(0,βc-1I),分类器超参数βc~Ga(a0,b0),c∈{1,2,…,D},D表示初始总聚类个数;Ac=[ac1,ac2,…,ack,…,acK]表示第c类样本的投影矩阵,c∈{1,2,…,D},ack表示Ac的第k列 κk~Ga(c0,d0),K表示Ac的总列数;Z=[z1,z2,…,zn,…,zN]表示样本集X经过投影后得到的特征样本集,同时也是隐变量SVM分类器的输入,zn表示第n个样本xn经过投影后得到的特征样本,zn的初始分布为N(AΤxn,Ι);

{μc,∑c}表示第c类样本的分布参数,μc表示第c类样本的均值,∑c表示第c类样本的协方差矩阵,第c类聚类分布参数{μc,Σc}的初始分布为Normal-Wishart分布,即{μc,Σc}~NW({μc,Σc}|μ0,W0,ν0,β0),其中μ0,W0,ν0,β0为初始分布参数;h=[h1,h2,…,hn,…,hN]表示聚类指示变量集,hn表示训练样本xn属于哪一类,hn∈{1,2,…,D};υ=[υ1,υ2,…,υc,…,υC]表示基于Stick-breaking构造的狄利克雷过程DP混合模型的参数,υ的分布为Beta(1,α),α的分布为Ga(e0,f0);X表示训练样本,y表示训练样本对应的类别标号;N(·)表示高斯分布、GaT(·)表示Gamma分布、NW(·)表示Normal-Wishart分布,(·)表示转置操作,a0,b0为βc的超参数,c0,d0为κk参数的超参数,e0,f0为α的超参数;

(4)设定无限最大间隔线性判别投影模型联合伪后验分布的表达式中各个参数的初始值:设定第c类分类器参数ωc的初始值为一个服从N(0,1)分布的K+1维的随机矩阵,第c类分类器参数ωc协方差精度β的初始值为服从Ga(103,1)分布的随机向量,第c类样本投影矩阵Ac的初始值为训练样本集X的协方差矩阵前K个大的特征值对应的特征向量,特征样本集Z的初始值为一个服从N(0,1)分布的K×N维的随机矩阵,第c类分布参数{μc,Σc}的初始值为一个服从Normal-Wishart分布NW({μc,Σc}|μ0,W0,v0,β0)的随机矩阵,其中μ0=0,W0=10-5I,ν0=K+1,β0=10-3,狄利克雷过程DP混合模型的参数υ的初始分布为Beta(1,1)设聚集参数α的初始值为一个服从Ga(1,10-10)分布的随机数;

(5) 表示无限最大间隔线 性判别投影模型联合伪后验分布 表达式各个参数的条件后验分布:第c类分类器参数ωc的条件后验分布p(ωc|-)、第c类样本投影矩阵Ac的第k列ac,k的条件后验分布p(ac,k|-)、特征样本集Z的第n个样本第k行zk,n的条件后验分布p(zk,n|-)、第c类分布参数{μc,Σc}的条件后验分布p({μc,Σc}|-)、聚类指示变量h的条件后验分布p(h|-)、狄利克雷过程DP混合模型的参数υ的条件后验分布p(υ|-);

(6)对步骤(5)表示出的各个参数的条件后验分布进行采样:按照Gibbs采样方法,对步骤(5)表示出的无限最大间隔线性判别投影模型联合伪后验分布表达式各个参数的条件后验分布,依次进行I0次循环采样,其中I0为自然数,从第I0+1次开始每间隔SP次保存每个投影子空间中的参数ωc,Ac,分布参数的采样结果,并保存T0次参数的采样结果;

(7)获取功率谱特征测试样本集 和其对应的测试类别标号集(7a)雷达接收 个C类目标的高分辨距离像,得到 个高分辨距离像;

(7b)提取 个高分辨距离像中每个高分辨距离像的功率谱特征,得到功率谱特征测试样本集 并将测试样本集 对应的类别标号通过测试类别标号集表示: 其中, 表示测试样本的总个数, 表示第n个样本, 表示第n类样本的类别标号

(8)获取雷达目标的识别率:

(8a)采用聚类指示变量hn对测试样本集 进行聚类,并将聚类结果通过第c类样本投影矩阵Ac投影到无限最大间隔线性判别投影模型的投影子空间中,得到测试特征样本集 其中,测试特征样本集 中包含多个子集;

(8b)通过保存的第c类分类器参数ωc的采样结果,对测试特征样本集 进行分类,得到测试样本集 的类别标号集(8c)将测试类别标号集 与测试样本集 的类别标号集 进行比对,得到雷达目标的识别率。

2.根据权利要求1所述的基于无限最大间隔线性判别投影模型的雷达目标识别方法,其特征在于,步骤(3)中所述的定义无限最大间隔线性判别投影模型联合伪后验分布,其具体表现形式为:

3.根据权利要求书1中所述的基于无限最大间隔线性判别投影模型的雷达目标识别方法,其特征在于,步骤(5)中所述的表示无限最大间隔线性判别投影模型联合伪后验分布表达式 各个参数的条件后验分布,实现步骤为:(5a)表示第c类分类器参数ωc的条件后验分布,其表现形式为:其中:

βc为第c类分类器的超参数;

(5b)表示第c类样本投影矩阵Ac的第k列ac,k条件后验分布,其表现形式为:其中:

xn指的是第c类样本,κc,k表示ac,k先验分布里面的参数,κck~Ga(c0,d0);

(5c)表示特征样本集Z的第n个样本的第k行zk,n的条件后验分布,其表现形式为:其中:

其中 和 分别对应条件后验分布的均值和协方差矩阵;

(5d)表示第c类样本的分布参数{μc,Σc}的条件后验分布,其表现形式为:其中:

υ'c=υ0+Nc

β′c=β0+Nc

Nc表示第c类样本的数量, 表示第c类样本的均值, 表示第c类样本的协方差矩阵的均值;

(5e)表示聚类指示变量的条件后验分布,其表现形式为:p(h|-)=Disc(h;π)

且πc服从约束为

(5f)表示υ的条件后验分布,其表现形式为:

p(υc|-)∝p(h|υ)Beta(υc;1,α)~Beta(υc;ρa,ρb)其中ρa=1+Nc, Nk表示第k类样本的数量;

(5g)表示隐变量SVM分类器的隐变量λn的条件后验分布,其表现形式为:其中IG(.)表示逆高斯分布;

(5h)表示βc的条件后验分布,其表现形式为:

其中

(5i)表示κc,k的条件后验分布,其表现形式为:其中

(5j)表示α的条件后验分布,其表现形式为:

其中e'0=e0+D-1,

4.根据权利要求书1中所述的基于无限最大间隔线性判别投影模型的雷达目标识别方法,其特征在于,步骤(8b)所述的对测试特征样本集 进行分类,得到测试样本集 的类别标号集 实现步骤为:ρ=[ρ1,ρ2,...,ρc,...,ρD]

其中, 表示测试样本 的预测类别标号, 表示第t次采样的第c个聚类中隐变量SVM分类器的权值系数,m=1,2,...,C,t=1,2,...,T0,ρc表示第c个隐变量SVM分类器的平均输出, 表示求解最大值对应的m值。

说明书 :

基于无限最大间隔线性判别投影模型的雷达目标识别方法

技术领域

[0001] 本发明属于雷达技术领域,涉及一种雷达目标识别方法,具体涉及一种无限最大间隔线性判别投影模型的雷达的目标识别方法,可用于对雷达高分辨距离像进行检测识别。

背景技术

[0002] 雷达目标识别是雷达采用的一种技术手段,用来辨认其搜索体积内已被发现的目标,其原理就是利用目标的雷达回波信号,实现对目标类型的判定。宽带雷达通常工作在光学区,此时雷达目标可以看作是由大量强度不同的散射点构成,高分辨距离像HRRP是用宽带雷达信号获取目标体上各散射点回波信号的矢量和。它反映了目标体上散射点沿雷达视线的分布情况,包含了目标重要的结构信息,比如目标尺寸、散射点结构等。因此在二十世纪末,一些学者提出了利用HRRP完成雷达目标自动识别的技术,见[S.P.Jacobs.Automatic target recognition using high-resolution radar range profiles.PhD dissertation,Washington Univ.,St.Louis,MO,1999].进入二十一世纪后,这一技术在雷达领域引起了人们的广泛关注。
[0003] 在高频区时,散射中心模型描述了目标电磁散射特性。根据该模型,当目标姿态有较大变化时,会发生散射中心距离单元走动MTRC,即部分散射中心会从一个距离单元移动到另一个距离单元,引起目标HRRP的剧烈变化;而姿态发生较小的变化时,即不出现MTRC。如上所述,HRRP敏感于目标姿态,且同一目标的HRRP具有多模分布特性,这往往使数据在HRRP空间中的分布具有非线性可分性,这影响了常用目标识别方法的效果与应用。HRRP自动识别方法分为三类:基于模板匹配的方法、基于压缩感知的方法和基于分类器模型的方法。基于模板匹配的方法是从已标记的训练图像构建一系列参考图像即模板,将测试图像与模板分别进行匹配,归到与之最相近的模板所在类别中,由于存储的模板数量和维数一般较大,这种方法复杂度较高;基于压缩感知的方法构建过完备库,计算测试样本在训练样本上的稀疏表示,进行图像重构并按重构误差最小准则进行分类识别,但该方法的识别率很大程度上会由于HRRP中噪声或遮挡物的影响而下降;基于分类器模型的方法首先对目标区域切片进行特征提取得到训练样本集和测试样本集,通过带有标号的训练样本构建分类器模型并进行参数计算,然后将无标号的测试样本输入到分类器模型中计算类别标号,完成目标识别,基于分类器模型的目标识别方法有较好的鲁棒性和较高的识别率。
[0004] 在现有的机器学习理论中,主成分分析(PCA)、独立成分分析(ICA)因子分析(FA)等都是无监督的特征提取方法,用这些技术提取的特征不一定适合后端的分类任务;为了充分利用类别信息,大量监督类的特征提取方法提了出来,具有代表性的方法有线性判别分析(LDA),LDA使样本经过投影后的类间距离最大化,同时最小化类内距离,可以有效的提高数据的可分性。但是,LDA高度依赖数据的分布,这就限制了LDA的应用,针对这一问题,大量学者提出了不同的解决办法,其中比较有代表性的有子类判别分析(SDA)方法,该方法将原始数据划分为若干子类,对类内、类间协方差矩阵进行修正,提升了LDA方法的适用范围,虽然这类方法在一些数据集上获得了良好的效果,但是这类方法均是两阶段特征提取方法,没有和后端的分类任务紧密结合在一起,可能会导致分类性能的损失,为了避免这种损失[B.Chen,H.Zhang,X.Zhang et.al.,Max-margin discriminant projection via data augmentation[J].IEEE Transactions on Knowledge and Data Engineering.2015,27(7):1964-1976]文章提出了MMLDP模型,该模型联合Bayesian SVM,将投影特征作为隐变量SVM分类器的输入,在Bayesian模型的框架下,对投影空间和SVM分类器进行联合学习,有效避免了分阶段学习带来的性能损失,提高了目标的识别率。
[0005] 上述方法中,无论是分阶段学习还是联合学习,它们都存在一个共同的问题:这类方法均属于全局类特征提取方法,即期望通过一个全局投影矩阵,使样本在投影空间实现可分。然而这类方法对于非线性可分的数据,尤其是对多模分布结构的数据,由于其忽略了数据内部隐含的结构信息,全局投影方法可能会带来分类性能的损失,导致识别率低。

发明内容

[0006] 本发明的目的在于克服现有技术存在的不足,提出了一种基于无限最大间隔线性判别投影模型的雷达的目标识别方法,用于解决现有雷达目标识别方法中存在的识别率低的技术问题。
[0007] 本发明的技术思路是:针对多模分布的数据,将混合专家模型的思想引入到MMLDP模型中提出了一种无限最大边界线性判别投影模型(infinite max-margin linear discriminant projection,iMMLDP)。具体的说,IMMLDP通过DP(Dirichlet Process)混合模型将数据集划分成‘无限’个子集,在每个子集上学习一个局部的MMLDP分类器,组合各个局部分类器实现全局的非线性投影和分类。另外,IMMLDP将数据集的划分、投影子空间的学习和分类器的学习统一在Bayesian 模型的框架下,通过分类误差来指导数据集的划分和投影子空间的学习,较好保证了各个局部区域的线性可分性。
[0008] 根据上述技术思路,实现本发明目的采取的技术方案包括如下步骤:
[0009] (1)获取功率谱特征训练样本集X和其对应的类别标号集y:
[0010] (1a)雷达接收N个C类目标的高分辨距离像,得到N个高分辨距离像;
[0011] (1b)提取N个高分辨距离像中每个高分辨距离像的功率谱特征,得到功率谱特征训练样本集X={x1,x2,…,xn,…,xN},并将功率谱特征训练样本集X对应的类别标号通过类别标号集y表示:y={y1,y2,…,yn,…,yN},N表示训练样本的总个数,xn表示第n个样本,yn表示第n类样本的类别标号yn∈{1,2,…,C};
[0012] (2)构建无限最大间隔线性判别投影模型:将狄利克雷过程DP混合模型、投影模型和隐变量SVM分类器统一在Bayesian模型框架下,得到无限最大间隔线性判别投影模型;
[0013] (3)定义无限最大间隔线性判别投影模型联合伪后验分布,其表达式为:
[0014]
[0015] 其中,ωc表示第c类分类器参数,分布服从N(0,βc-1I),分类器超参数βc~Ga(a0,b0),c∈{1,2,…,D},D表示初始总聚类个数;Ac=[ac1,ac2,…,ack,…,acK]表示第c类样本的投影矩阵,c∈{1,2,…,D},ack表示Ac的第k列 κk~Ga(c0,d0),K表示Ac的总列数;Z=[z1,z2,…,zn,…,zN]表示样本集X经过投影后得到的特征样本集,同时也是隐变量SVM分类器的输入,zn表示第n个样本xn经过投影后得到的特征样本,zn的初始分布为N(AΤxn,Ι);{μc,∑c}表示第c类样本的分布参数,μc表示第c类样本的均值,∑c表示第c类样本的协方差矩阵,第c类聚类分布参数{μc,Σc}的初始分布为Normal-Wishart分布,即{μc,Σc}~NW({μc,Σc}|μ0,W0,ν0,β0),其中μ0,W0,ν0,β0为初始分布参数;h=[h1,h2,…,hn,…,hN]表示聚类指示变量集,hn表示训练样本xn属于哪一类,hn∈{1,2,…,D};υ=[υ1,υ2,…,υc,…,υC]表示基于Stick-breaking构造的狄利克雷过程DP混合模型的参数,υ的分布为Beta(1,α),α的分布为Ga(e0,f0);X表示训练样本,y表示训练样本对应的类别标号;N(·)表示高斯T
分布、Ga(·)表示Gamma分布、NW(·)表示Normal-Wishart分布,(·) 表示转置操作;
[0016] (4)设定无限最大间隔线性判别投影模型联合伪后验分布的表达式中各个参数的初始值:
[0017] 设定第c类分类器参数ωc的初始值为一个服从N(0,1)分布的K+1维的随机矩阵,3
第c类分类器参数ωc协方差精度β的初始值为服从Ga(10 ,1)分布的随机向量,第c类样本投影矩阵Ac的初始值为训练样本集X的协方差矩阵前K个大的特征值对应的特征向量,特征样本集Z的初始值为一个服从N(0,1)分布的K×N维的随机矩阵,第c类分布参数{μc,Σc}的初始值为一个服从Normal-Wishart分布NW({μc,Σc}|μ0,W0,ν0,β0)的随机矩阵,其中μ0=0,W0-5 -3
=10 I,ν0=K+1,β0=10 ,狄利克雷过程DP混合模型的参数υ的初始分布为Beta(1,1)设聚集参数α的初始值为一个服从Ga(1,10-10)分布的随机数;
[0018] (5)表示无限最大间隔线性判别投影模型联合伪后验分布表达式各个参数的条件后验分布:第c类分类器参数ωc的条件后
验分布p(ωc|-)、第c类样本投影矩阵Ac的第k列ac,k的条件后验分布p(ac,k|-)、特征样本集Z的第n个样本第k行zk,n的条件后验分布p(zk,n|-)、第c类分布参数{μc,Σc}的条件后验分布p({μc,Σc}|-)、聚类指示变量h的条件后验分布p(h|-)、狄利克雷过程DP混合模型的参数υ的条件后验分布p(υ|-);
[0019] (6)对步骤(5)表示出的各个参数的条件后验分布进行采样:按照Gibbs采样方法,对步骤(5)表示出的无限最大间隔线性判别投影模型联合伪后验分布表达式各个参数的条件后验分布,依次进行I0次循环采样,其中
I0为自然数,从第I0+1次开始每间隔SP次保存每个投影子空间中的参数ωc,Ac,分布参数采样结果,并保存T0次参数的采样结果;
[0020] (7)获取功率谱特征测试样本集 和其对应的测试类别标号集
[0021] (7a)雷达接收 个C类目标的高分辨距离像,得到 个高分辨距离像;
[0022] (7b)提取 个高分辨距离像中每个高分辨距离像的功率谱特征,得到功率谱特征测试样本集 并将测试样本集 对应的类别标号通过测试类别标号集 表示: 其中, 表示测试样本的总个数, 表示第n个样本,
表示第n类样本的类别标号
[0023] (8)获取雷达目标的识别率:
[0024] (8a)采用聚类指示变量hn对测试样本集 进行聚类,并将聚类结果通过第c类样本投影矩阵Ac投影到无限最大间隔线性判别投影模型的投影子空间中,得到测试特征样本集 其中,测试特征样本集 中包含多个子集;
[0025] (8b)通过保存的第c类分类器参数ωc的采样结果,对测试特征样本集 进行分类,得到测试样本集 的类别标号集
[0026] (8c)将测试类别标号集 与测试样本集 的类别标号集 进行比对,得到雷达目标的识别率。
[0027] 本发明与现有技术相比,具有以下优点:
[0028] 1)本发明通过DP过程将HRRP雷达高分辨距离像数据集划分为‘无限’个子集,在每个子集里面学习一个MMLDP模型,由于聚类和分类是联合学习的,因而可以有效的挖掘数据中隐藏的线性结构。与现有雷达的目标识别技术相比,提高了雷达目标的识别率,尤其目标具有多模分布特性的情况下,效果更加明显。
[0029] 2)本发明将数据集的划分、投影子空间和SVM分类器的学习统一在Bayesian的框架下,进行联合学习,避免了两阶段分类方法带来的分类性能损失。同时在每个子集上分别学习简单的投影模型和分类器,与现有技术在整个数据集上单独训练一个投影模型和分类器相比,降低了模型的复杂度。

附图说明

[0030] 图1为本发明的实现流程图;
[0031] 表示整个实验的流程。
[0032] 图2为实测数据实验中聚类后验数量结果。
[0033] 具体实施方式(对技术方案进行解释和说明)
[0034] 以下结合附图和具体实施例,对本发明进行详细说明:
[0035] 参照图1,基于无限最大间隔线性判别投影模型的雷达目标识别方法,包括以下步骤:
[0036] 步骤(1)获取功率谱特征训练样本集X和其对应的类别标号集y:
[0037] (1a)雷达接收600个3类目标的高分辨距离像,得到600个高分辨距离像。
[0038] (1b)提取600个高分辨距离像中每个高分辨距离像的功率谱特征,得到功率谱特征训练样本集X={x1,x2,…,xn,…,xN},并将功率谱特征训练样本集X对应的类别标号通过类别标号集y表示:y={y1,y2,…,yn,…,yN},xn表示第n个样本,yn表示第n类样本的类别标号yn∈{1,2,3}。
[0039] 步骤(2)构建无限最大间隔线性判别投影模型,实现步骤为:
[0040] (2a)表示基于Stick-breaking构造的狄利克雷过程DP混合模型:
[0041] υc|α~Beta(1,α),θc|G0~G0,c=1,2,…,∞
[0042] hn|π(υ)~Mult(π(υ)),xn|hn=c;θc~p(x|θc),n=1,...,N
[0043] 其中,υc为截棍比例参数, 表示每次截棍长度,α为υc的先验分布参数α~Ga(e0,f0);θc表示xn的分布参数,θc的分布为G0,G0表示基分布,设基分布为Normal-Wishart分布,即G0~NW({μc,Σc}|μ0,W0,ν0,β0);hn是xn的指示因子,当hn=c时表示xn属于第c类即xn~p(x|θc)。
[0044] (2b)表示每个聚类中的投影模型:
[0045] 基于MMLDP模型的投影模型可以表示为:zn~N(AΤxn,I), κk~Ga(c0,d0),其中,A表示全局投影矩阵A=[a1,a2,…,ak],ak表示A的第k列,xn表示第n个样本,κk为ak的先验分布参数,c0和d0为κk参数的超参数。
[0046] 则每个聚类中的投影模型可以表示为:
[0047] zn|hn=c,Ac~N(AcΤxn,Ip),Ac=[ac1,ac2,…,ack,…,acK]
[0048]
[0049] 其中,当聚类指示变量hn等于c的时候,zn就服从均值为AcΤxn,协方差矩阵为Ip的正态分布,p表示单位矩阵I的维度。
[0050] (2c)表示每个聚类中隐变量SVM分类器的模型:
[0051] 设定第c个隐变量SVM分类器的参数服从先验分布为 将每个隐变量SVM分类器的先验分布分别带入到每个隐变量SVM分类器中,得到每个聚类中隐变量分类器的模型,可以表示为:
[0052]
[0053]
[0054] 其中,λ=[λ1,λ2,…,λc,…,λC]表示隐变量SVM分类器中的隐变量,λc表示第c个隐变量SVM分类器中的隐变量。
[0055] (2d)将狄利克雷过程DP混合模型、投影模型和隐变量SVM分类器统一在Bayesian模型框架下,得到无限最大间隔线性判别投影模型,其层次化结构式为:
[0056]
[0057] hn|π(υ)~Disc(π(υ))
[0058] xn|hn=c,{μc,Σc}~p(xn|{μc,Σc}),n=1,...,N.
[0059]
[0060] yn,{λn}c|{zn,hn=c},ωc~φ(yn,λn|ωc,zn),c=1,...,∞
[0061]
[0062]
[0063] {μc,Σc}~NW(μ0,W0,ν0,β0)
[0064] 其中,根据上式的层次化表达式,得到第n个样本xn的似然分布函数:
[0065]
[0066] 步骤(3)定义无限最大间隔线性判别投影模型联合伪后验分布,其具体表现形式为:
[0067]
[0068] 步骤(4)设定无限最大间隔线性判别投影模型联合伪后验分布的表达式中各个参数的初始值:
[0069] 设定第c类分类器参数ωc的初始值为一个服从N(0,1)分布的K+1维的随机矩阵,第c类分类器参数ωc协方差精度β的初始值为服从Ga(103,1)分布的随机向量,第c类样本投影矩阵Ac的初始值为训练样本集X的协方差矩阵前K个大的特征值对应的特征向量,特征样本集Z的初始值为一个服从N(0,1)分布的K×N维的随机矩阵,第c类分布参数{μc,Σc}的初始值为一个服从Normal-Wishart分布NW({μc,Σc}|μ0,W0,ν0,β0)的随机矩阵,其中μ0=0,W0=10-5I,ν0=K+1,β0=10-3,狄利克雷过程DP混合模型的参数υ的初始分布为Beta(1,1)设聚集参数α的初始值为一个服从Ga(1,10-10)分布的随机数。
[0070] 步骤(5)表示无限最大间隔线性判别投影模型联合伪后验分布表达式各个参数的条件后验分布,实现步骤为:
[0071] (5a)表示第c类分类器参数ωc的条件后验分布,其表现形式为:
[0072]
[0073] 其中:
[0074]
[0075] βc为第c类分类器的超参数。
[0076] (5b)表示第c类样本投影矩阵Ac的第k列ac,k条件后验分布,其表现形式
[0077] 为:
[0078] 其中:
[0079]
[0080] xn指的是第c类样本,κc,k表示ac,k先验分布里面的参数,κck~Ga(c0,d0)。
[0081] (5c)表示特征样本集Z的第n个样本的第k行zk,n的条件后验分布,其表现形式为:
[0082] 其中:
[0083]
[0084] 其中 和 分别对应条件后验分布的均值和协方差矩阵。
[0085] (5d)表示第c类样本的分布参数{μc,Σc}的条件后验分布,其表现形式为:
[0086]
[0087] 其中:
[0088]
[0089]
[0090] υ'c=υ0+Nc
[0091] β'c=β0+Nc
[0092] Nc表示第c类样本的数量, 表示第c类样本的均值, 表示第c类样本的协方差矩阵的均值。
[0093] (5e)表示聚类指示变量的条件后验分布,其表现形式为:
[0094] p(h|-)=Disc(h;π)
[0095] 且πc服从约束为
[0096] (5f)表示υ的条件后验分布,其表现形式为:
[0097] p(υc|-)∝p(h|υ)Beta(υc;1,α)~Beta(υc;ρa,ρb)
[0098]
[0099] 其中ρa=1+Nc, Nk表示第k类样本的数量。
[0100] (5g)表示隐变量SVM分类器的隐变量λn的条件后验分布,其表现形式为:
[0101]
[0102] 其中IG(.)表示逆高斯分布。
[0103] (5h)表示βc的条件后验分布,其表现形式为:
[0104]
[0105] 其中
[0106] (5i)表示κc,k的条件后验分布,其表现形式为:
[0107]
[0108] 其中
[0109] (5j)表示α的条件后验分布,其表现形式为:
[0110]
[0111] 其中e'0=e0+D-1,
[0112] (6)对步骤(5)表示出的各个参数的条件后验分布进行采样:按照Gibbs采样方法,对步骤(5)表示出的无限最大间隔线性判别投影模型联合伪后验分布表达式各个参数的条件后验分布,依次进行400次循环采样,从第
401次开始每间隔10次保存每个投影子空间中的参数ωc,Ac,分布参数 采样结果,并保存10次参数的采样结果。
[0113] 步骤(7)获取功率谱特征测试样本集 和其对应的测试类别标号集
[0114] (7a)雷达接收2400个3类目标的高分辨距离像,得到2400个高分辨距离像。
[0115] (7b)提取2400个高分辨距离像中每个高分辨距离像的功率谱特征,得到功率谱特征测试样本集 并将测试样本集 对应的类别标号通过测试类别标号集 表示: 其中, 表示第n个样本, 表示第n类样本的类别标

[0116] (8)获取雷达目标的识别率:
[0117] (8a)采用聚类指示变量hn对测试样本集 进行聚类,并将聚类结果通过第c类样本投影矩阵Ac投影到无限最大间隔线性判别投影模型的投影子空间中,得到测试特征样本集 其中,测试特征样本集 中包含多个子集;聚类指示变量hn决定 的子集大小和数量,hn表达式如下所示:
[0118] p(hn|-)=Disc(hn;π)且
[0119] 步骤(8b)通过保存的第c类分类器参数ωc的采样结果,对测试特征样本集 进行分类,得到测试样本集 的类别标号集 实现步骤为:
[0120]
[0121] ρ=[ρ1,ρ2,...,ρc,...,ρD]
[0122]
[0123]
[0124] 其中, 表示第t次采样的第c个聚类中隐变量SVM分类器的权值系数,m=1,2,3,t=1,2,...,10,ρc表示第c个隐变量SVM分类器的平均输出, 表示求解最大值对应的m值。
[0125] (8c)将测试类别标号集 与测试样本集 的类别标号集 进行比对,得到雷达目标的识别率。
[0126] 以下结合仿真实验和实测数据实验,对本发明的技术效果作详细说明:
[0127] 1.仿真实验
[0128] (1)实验条件
[0129] 本实验采用的数据集为从UCI Machine Learning Repository中Benchmark数据集,从中选取了Heart、Splice、Twonorm三个比较复杂的数据集。
[0130] (2)实验内容及结果分析
[0131] 本实验采用原始数据作为模型的输入,采用LDA+SVM、MMLDP、k-mean+MMLDP和IMMLDP四个方法对数据集进行分类、识别,本实验每类方法重复10次,每次方法随机抽取50%作为训练样本,剩余的做测试样本。在不同的隐空间维度下取10次的平均识别性能作为最终的识别率,将各个方法在不同隐空间维度下最优识别率列于表1。
[0132] 表1,不同方法在不同数据上的识别率
[0133]
[0134] 从表1中我们可以看到IMMLDP在不同数据集上的分类性能都优于其他方法。IMMLDP模型与MMLDP模型识别率相比表明,将数据先聚类,在每个聚类内学习一个投影模型要优于全局投影模型方法。IMMLDP模型与Km+MMLDP模型识别率相比表明,IMMLDP将聚类、分类器和投影进行联合学习的,揭示了数据的隐含结构,因而获得识别性能的显著提升。
[0135] 2实测数据实验
[0136] (1)实验条件
[0137] 本发明采用c波段雷达对三类飞机目标的实测HRRP数据进行处理。采用模2范数归一的方法消除HRRP的幅度敏感性,并提取其功率谱特征消除其平移敏感性,即我们得到的样本数据集为HRRP的功率谱特征,实验中,我们采取的截棍上限设置为10。
[0138] (2)实验内容及结果分析
[0139] 选取600个功率谱特征作为训练样本,2400个功率谱特征作为测试样本,在3维隐空间的维度下,得到识别结果如表2所示。
[0140] 表2,IMMLDP在雷达高分辨距离像上聚类和性能分析
[0141]
[0142] IMMLDP获得的聚类后验数量如图2所示,可以看出有效聚类数量为三类,从表2中我们可以看出每个聚类内部都获得了较好的分类精度,这得益于我们将聚类子空间和分类器进行联合学习,保证了每个聚类内良好的分类性能,从而实现全局分类性能的提升,提高了对雷达目标的识别率。