基于稀疏最小二乘支撑向量机的SAR目标识别方法转让专利

申请号 : CN200910022648.8

文献号 : CN101551856B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张向荣焦李成张一凡侯彪王爽杨淑媛周伟达马文萍

申请人 : 西安电子科技大学

摘要 :

本发明公开了一种基于稀疏最小二乘支撑向量机的SAR目标识别方法,它属于图像处理技术领域,主要解决现有方法识别SAR目标时间长的问题。其实现过程为:首先从选定的已知类别信息的目标图像和待识别图像分别进行特征提取,得到训练样本和测试样本;然后对训练样本采用增量学习和逆学习相结合的方法进行迭代训练,选出稀疏的支撑向量集合,得到该集合中支撑向量所对应的拉格朗日乘子和偏斜量;最后根据求出的支撑向量集合,支撑向量所对应的拉格朗日乘子和偏斜量,用分类决策函数对测试样本进行识别。本发明具有在识别精度相当的条件下,减少识别时间的优点,可用于SAR目标的检测和识别。

权利要求 :

1.一种基于稀疏最小二乘支撑向量机的SAR目标识别方法,包括如下过程:

(1)对选定的已知类别信息的SAR目标图像,采用核主分量分析方法进行特征提取,得到训练样本集 其中n是训练样本集的样本个数,xk表示第k个训练样本,用一个行向量表示,yk是与样本xk相对应的标签;

(2)对SAR目标待识别图像,采用核主分量分析方法进行特征提取,得到测试样本集 n′是测试样本集的样本个数, 表示第k个测试样本,用一个行向量表示;

(3)对特征提取之后的训练样本集,采用增量学习和逆学习相结合的方法按如下过程进行迭代训练,得到支撑向量集合 和该集合中所有支撑向量所对应的拉格朗日乘子向量 和偏斜量b,其中ps为当前支撑向量集合中第s个支撑向量, 为当前支撑向量集合中第s个支撑向量所对应的类别标签, 是当前支撑向量集合中第s个支撑向量所对应的拉格朗日乘子,b是一个标量:(3a)选择第一个训练样本作为支撑向量,由此得到一个初始的支撑向量集Pm={x1,y1},m=1,通过最小二乘支撑向量机的求解线性方程组的方法得到该支撑向量集相应的拉格朗日乘子向量 和偏斜量bm,由Pm、 和bm构成一个初始的分类器: (3b)用得到的分类器对剩下的训练样本进行分类,每次从分错的样本和离类边界比较近的样本中选择一个样本作为新的支撑向量,把这个样本和其相对应的标签加到支撑向量集合Pm中,得到Pm+1,其中m+1是更新后的支撑向量集中支撑向量的个数,并通过最小二乘支撑向量机的求解线性方程组的方法,计算得到该集合中支撑向量所对应的拉格朗日乘子向量 和偏斜量bm+1,得到一个新的分类器: 所述的每次从分错的样本和离类边界比较近的样本中选择一个样本作为新的支撑向量,是用得到的分类器对未被挑选为支撑向量的训练样本 进行分类,得到对应的类别标签 然后计算分类标签和实际标签的乘积函数 的值, 是与 相对应的实际标签,找出h中最小值对应的标号v所对应的训练样本 和标签 (3c)更新变量m=m+1;

(3d)重复过程(3b)和(3c)L次,得到一个新的分类器:

(3e)找出拉格朗日乘子向量 中绝对值最小的拉格朗日乘子,并删除掉其所对应的那个支撑向量,通过最小二乘支撑向量机的求解线性方程组的方法计算得到删除后支撑向量集合所对应的拉格朗日乘子向量 和偏斜量bm-1,得到一个新的分类器: (3f)更新变量m=m-1;

(3g)循环第(3b)步到第(3f)步直到满足停止的条件h,得到稀疏的支撑向量集合Pm,并通过最小二乘支撑向量机的求解线性方程组的方法计算得到稀疏支撑向量集合的拉格朗日乘子向量 和偏斜量b,其中 是支撑向量集合中第s个支撑向量所对应的拉格朗日乘子,h大于0.5;

(4)根据训练得到的支撑向量集合Pm、拉格朗日乘子向量α和偏斜量b,用分类决策函数对测试样本进行识别,得到测试样本所属的类别 其中 表示第k个测试样本所对应的类别标签,所述的分类决策函数为: 其中x′是测试样本,

是支撑向量集合中第s个支撑向量所对应的拉格朗日乘子,ps是支撑向量 集合中第s个支撑向量, 是支撑向量集合中第s个支撑向量所对应的类别标签,K是一个核函数,该核函数K为: x、y分别是一个样本向量,σ2是核函数的参数,通过网格搜索法求出。

说明书 :

基于稀疏最小二乘支撑向量机的SAR目标识别方法

技术领域

[0001] 本发明属于图像处理技术领域,涉及目标识别,可应用于对合成孔径雷达Synthetic Aperture Radar,SAR目标的识别。

背景技术

[0002] SAR图像与普通光学图像相比,不仅具有全天候、全天时的工作能力,而且特征信号丰富,含有幅度、相位和极化等多种信息。由于其在地球科学遥感领域独特的对地观测优势,以及其在军事和民用领域的广阔应用前景,使得基于高分辨率的二维SAR图像的目标识别技术越来越受到人们的重视。一般以目标识别为最终目的的SAR图像解译系统主要包括以相干斑抑制、边缘提取、区域分割为主要内容的预处理模块,地物分类与目标识别模块,算法性能评估模块以及解译过程中需要利用到的目标的物理模型及所对应的数学模型,用于模板和特征匹配的目标数据库、目标先验数据库、用于性能评估的测试数据库等模块。基于二维SAR图像的自动目标识别主要分为三个部分:预处理、特征选择和识别。预处理的目的是降低目标几何特性的灵敏度和提高识别精度;特征选择是为了从原始的数据中获得有代表性的信息,一般的特征提取方法有基于K-L变换、Radon变换、主成分分析PrincipleComponent Analysis,PCA等;而识别则是选择一个有效的分类器对目标进行识别。传统的识别方法包括模板匹配方法、基于Bayes网络的方法、基于隐Markov模型的识别方法、神经网络、以及支撑向量机Support Vector Machine,SVM等。目前许多研究都是在美国国防部高级研究计划局和空军研究室提供的实测SAR地面目标数据——基于运动、静止目标探测和识别Moving and Stationary Target Acquisition andRecognition,MSTAR数据库上进行的。
[0003] 主分量分析PCA是统计分析法中的一种重要方法,它从原始的高维数据中提取低维的特征数据,在最小均方意义下用低维数据来代表原始数据。PCA是描述数据的坐标系的一种正交变换,变换后通常只用少数几个主分量就能够充分的解释原始数据的结构。PCA能较好地克服由于图像尺寸、方向、部分场景内容变化以及噪声干扰等影响,被广泛应用于各个领域。然而PCA只考虑了图像数据中的二阶统计信息,未能利用数据中的高阶统计信息,所以只能提取数据集的线性特征。而大部分的真实数据都是非线性分布的,数据非线性特征的提取非常重要。核主分量分析KPCA就是一种在PCA的基础上引入核技巧的一种非线性特征提取方法,利用数据中的高阶统计信息,描述多个像素间的相关性,并且具有鲁棒性。与其他非线性特征提取方法相比,它不需要解决非线性优化问题而只涉及矩阵的特征值分解计算。
[0004] 最小二乘支撑向量机Least Squares Support Vector Machine,LSSVM是SVM的一种最小二乘形式,它用等式约束代替不等式约束,同时引入二次损失函数,兼顾了训练误差和类间边缘,把求解问题变成求解一组等式方程,从而避免了求解相对耗时的二次规划问题。但是,由于二次损失函数的加入,使得通过Karush-Kuhn-Tucker,KKT条件所求的拉格朗日乘子与误差成正比关系,这样几乎所有的样本都会被保存下来作为支撑向量,从而造成稀疏性的缺失,导致SAR目标识别的识别时间增长。

发明内容

[0005] 本发明的目的在于克服上述现有技术的不足,提出了一种基于稀疏最小二乘支撑向量机的SAR目标识别方法,在识别精度相当的条件下,缩短SAR目标的识别时间。
[0006] 本发明的技术方案是:对最小二乘支撑向量机进行稀疏,用该稀疏最小二乘支撑向量机,对SAR目标进行识别,其实现过程包括:
[0007] (1)对选定的已知类别信息的SAR目标图像,进行特征提取,得到训练样本集{xk,nyk}k=1,其中n是训练样本集的样本个数,xk表示第k个样本,用一个行向量表示,yk是与样本xk相对应的标签;
[0008] (2)对SAR目标待识别图像,进行特征提取,得到测试样本集{x′k}k=1n′,n′是测试样本集的样本个数,x′k表示第k个样本,用一个行向量表示;
[0009] (3)对特征提取之后的训练样本集,采用增量学习和逆学习相结合的方法进行迭代训练,得到支撑向量集合 和该集合中所有支撑向量所对应的拉格朗日乘子向量 和偏斜量b,其中ps为当前支撑向量集合中第s个支撑向量, 为当前支撑向量集合中第s个支撑向量所对应的类别标签, 是当前支撑向量集合中第s个支撑向量所对应的拉格朗日乘子,b是一个标量;
[0010] (4)根据训练得到的支撑向量集合Pm、拉格朗日乘子向量α和偏斜量b,用分类决n策函数对测试样本进行识别,得到测试样本所属的类别{y′k}k=1′,其中y′k表示第k个测试样本所对应的类别标签。
[0011] 本发明与现有的技术相比具有以下优点:
[0012] 1、由于本发明在训练过程中对矩阵的求逆运算采用了块矩阵的迭代求逆方法,从而减少了矩阵求逆的计算量;
[0013] 2、由于本发明充分考虑了最小二乘支撑向量机的稀疏性,并用增量学习和逆学习来求解稀疏性,在识别精度相当的条件下,节省了识别时间;

附图说明

[0014] 图1是本发明的流程示意图;
[0015] 图2是本发明仿真所采用的MSTAR数据中俯视角为17°的部分目标训练图像;
[0016] 图3是本发明仿真所采用的MSTAR数据中俯视角为15°的部分目标测试图像;
[0017] 图4是采用不同方法对BMP2目标的识别精度比较图;
[0018] 图5是采用不同方法对RTR70目标的识别精度比较图;
[0019] 图6是采用不同方法对T72目标的识别精度比较图;
[0020] 图7是采用不同方法对三个目标总体的识别精度比较图;
[0021] 图8是采用不同方法的支撑向量数的比较图;
[0022] 图9是本发明方法在不同(yita,L)组合下的识别精度图;
[0023] 图10是本发明方法在不同(yita,L)组合下的支撑向量数图。

具体实施方式

[0024] 参照图1,本发明的具体实现步骤如下:
[0025] 步骤1,对输入的MSTAR数据中17°俯视角的图像,从原始128×128的图像中心n截取60×60的区域,采用核主分量分析方法进行特征提取,得到训练样本集{xk,yk}k=1,其中n是训练样本集的样本个数,xk表示第k个样本,用一个行向量表示,yk是与样本xk相对应的标签。
[0026] 步骤2,对输入的MSTAR数据中15°俯视角的图像,从原始128×128的图像中心截取60×60的区域,采用核主分量分析方法进行特征提取,得到测试样本集{x′k,y′k}kn=1′,其中n′是训练样本集的样本个数,x′k表示第k个样本,用一个行向量表示,y′k是与样本x′k相对应的标签。
[0027] 步骤3,对特征提取之后的训练样本集,采用增量学习和逆学习相结合的方法进行迭代训练,得到支撑向量集合 和该集合中所有支撑向量所对应的拉格朗日乘子向量 和偏斜量b,其中ps为当前支撑向量集合中第s个支撑向量, 为当前支撑向量集合中第s个支撑向量所对应的类别标签, 是当前支撑向量集合中第s个支撑向量所对应的拉格朗日乘子,b是一个标量;
[0028] 具体实现步骤如下:
[0029] (3a)把第一个训练样本选为支撑向量,得到一个初始的支撑向量集合Pm={x1,y1},m=1,是选择的支撑向量的个数;
[0030] (3b)由初始支撑向量集合中的支撑向量x1及其所对应的标签y1计算核相关矩阵[0031] 其中Rm+1-1是一个(m+1)×(m+1)的矩阵,γ是正则参数,通过网格搜索法求出,K2
是一个核函数,该核函数K为: x、y分别是一个样本向量,σ
是核函数的参数,通过网格搜索法求出;
[0032] (3c)通过求出的核相关矩阵Rm+1-1计算支撑向量集合所对应的拉格朗日乘子向量 和偏斜量bm: 由Pm、 和bm构成一个初始的分类器:
[0033] (3d)用得到的分类器对未被挑选为支撑向量的训练样本 进行分类,得到对应的类别标签 然后计算分类标签和实际标签的乘积函数的值, 是与 相对应的实际标签,找出h中最小值对应的标号v所对应的训练样本 和标签
[0034] (3e)由支撑向量集合Pm、 和(3b)中求出的核相关矩阵Rm+1-1,计算-1(m+2)×(m+2)的核相关矩阵Rm+2 :
[0035]
[0036] 其 中,θ 是 一 个 列 向 量, c 也 是 一 个 列 向 量,是支撑向量集
合Pm中支撑向量所对应的标签,τ是一个标量, d也是一个标
-1
量,d=Ωv,v+γ , ,正则参数γ的值由(3a)求得,K是一个核函
2
数,该核函数K为: x、y分别是一个样本向量,σ 是核函数
的参数,通过网格搜索法求出;
-1
[0037] (3f)由核相关矩阵Rm+2 ,根据公式计算列向量 和标量bm+1:
[0038]
[0039]
[0040]
[0041] 其中1=[1,1,...,1]T,更新支撑向量集合 得到新的分类器:
[0042] (3g)更新变量m=m+1;
[0043] (3h)重复过程(3b)到(3g)L次,得到一个新的分类器:
[0044] (3i)找出拉格朗日乘子向量 中具有最小 所对应的拉格朗日-1
乘子的标号u,并删除其所对应的支撑向量 ,更新 通过Rm+1
-1
计算核相关矩阵Rm :
[0045]
[0046] Rm+1-1是由(3e)求得的核相关矩阵, i,j=1,...,m+1;s1是一个m维的列向量, s2是一个行向量,它是s1的转至,s2=T
s1,S是一个m×m的矩阵,
[0047] (3j)由求得的Rm-1计算列向量 标量bm-1:
[0048]T
[0049] 1是一个m-1维的列向量,1=[1,1,...,1],得到删减后的 分类器:
[0050] (3k)更新变量m=m-1;
[0051] (3l)循环第(3d)到(3k)直到满足停止迭代条件为止,停止条件为:h的最小值大于0.5,得到稀疏支撑向量集合Pm、该集合的拉格朗日乘子向量 和偏斜量b,其中 是支撑向量集合中第s个支撑向量所对应的拉格朗日乘子。
[0052] 步骤4,根据训练得到的支撑向量集合Pm、拉格朗日乘子向量α和偏斜量b,用分n类决策函数对测试样本进行识别,得到测试样本所属的类别{y″k}k=1′,其中y″k表示第k个测试样本所对应的类别标签。
[0053] 分类决策函数为: 其中x′是测试样本,是支撑向量集合中第s个支撑向量所对应的拉格朗日乘子,ps是支撑向量集合中第s个支撑向量, 是支撑向量集合中第s个支撑向量所对应的类别标签,K是一个核函数,该核函
2
数K为: x、y分别是一个样本向量,σ 是核函数的参数,通过
网格搜索法求出。
[0054] 为了验证本发明方法的优越性,我们将其与支撑向量机SVM、最小二乘支撑向量机LSSVM,剪枝最小二乘支撑向量机PLSSVM及快速稀疏逼近的最小二乘支撑向量机FSALSSVM2 9
的方法通过实验进行了性能比较。在实验中采用的参数设置为:γ=32,σ =10,yita=0.5,L=2。
[0055] 1.实验内容
[0056] A.稀疏最小二乘支撑向量机在不同目标上与其他方法的识别精度的比较,如图4、图5和图6所示。
[0057] 参照图4,它是不同方法对BMP2装甲车进行识别的精度比较图。本实验用到的训练图像为MSTAR数据库中俯视角为17°的目标图像,测试图像为MSTAR数据库中俯视角为15°的BMP2装甲车目标图像。图4中横坐标点1,2,3,4,5分别表示SVM,LSSVM,PLSSVM,FSALSSVM和本发明方法。
[0058] 参照图5,它是不同方法对RTR70装甲车进行识别的精度比较图。本实验用到的训练图像为MSTAR数据库中俯视角为17°的目标图像,测试图像为MSTAR数据库中俯视角为15°的RTR70装甲车目标图像。图5中横坐标点1,2,3,4,5分别表示SVM,LSSVM,PLSSVM,FSALSSVM和本发明方法。
[0059] 参照图6,它是不同方法对T72坦克进行识别的精度比较图。本实验用到的训练图像为MSTAR数据库中俯视角为17°的目标图像,测试图像为MSTAR数据库中俯视角为15°的T72坦克目标图像。图6中横坐标点1,2,3,4,5分别表示SVM,LSSVM,PLSSVM,FSALSSVM和本发明方法。
[0060] B.稀疏最小二乘支撑向量机在全部目标上与其他方法的识别结果比较,如图7、图8和表1所示。
[0061] 参照图7,它是不同方法在全部目标上的识别精度比较图。本实验用到的训练图像为MSTAR数据库中俯视角为17°的目标图像,测试图像为MSTAR数据库中俯视角为15°的目标图像。图7中横坐标点1,2,3,4,5分别表示SVM,LSSVM,PLSSVM,FSALSSVM和本发明方法。
[0062] 参照图8,它是不同方法用MSTAR数据库中俯视角为17°的目标图像去训练分类器而得到的支撑向量数的比较。图8中横坐标点1,2,3,4,5分别表示SVM,LSSVM,PLSSVM,FSALSSVM和本发明方法。
[0063] 参照表1,它是不同方法在MSTAR数据库中俯视角为15°的目标图像上进行识别所需要的时间比较。
[0064] 表1 不同方法的识别时间比较
[0065]方法 SVM LSSVM PLSSVM FSALSSVM 本发明方法
时间(秒) 0.300 0.484 0.437 0.078 0.078
[0066] C.稀疏最小二乘支撑向量机的参数分析,如图9和图10所示。
[0067] 参照图9,它是本发明方法用MSTAR数据库中俯视角为17°的目标图像在不同(yita,L)组合下训练分类器得到的识别精度比较图。
[0068] 参照图10,它是本发明方法用MSTAR数据库中俯视角为17°的目标图像在不同(yita,L)组合下训练分类器得到的支撑向量数比较图。
[0069] 2.实验结果分析
[0070] 从图4可以看出:本发明方法在目标BMP2装甲车上的识别率要优于SVM,LSSVM,PLSSVM和FSALSSVM方法。
[0071] 从图5可以看出:本发明方法在目标RTR70装甲车上的识别率和LSSVM,PLSSVM和FSALSSVM是一样的,都是100%,但是要比SVM方法的识别率高。
[0072] 从图6可以看出:本发明方法在目标T72坦克上的识别率比SVM,PLSSVM和FSALSSVM好,并达到了97%以上,但略差于LSSVM。
[0073] 从图7可以看出:本发明方法在全部目标的整体识别率要比SVM,LSSVM,PLSSVM和FSALSSVM方法高。
[0074] 从图8可以看出:本发明方法的支撑向量数要比SVM,LSSVM,PLSSVM少的多,也比FSALSSVM的支撑向量数少,但差别不大,仅仅少了2个而已。
[0075] 从表1可以看出:本发明方法的识别时间比SVM,LSSVM和PLSSVM要少的多,与FSALSSVM的识别时间相同,这是因为本发明方法和FSALSSVM的支撑向量数相差不大。
[0076] 从图9和图10可以看出:yita参数过小虽然会获得较少的支撑向量,但对于不同的迭代次数L,识别精度的鲁棒性不强,yita参数过大虽然对于不同的迭代次数L识别精度的鲁棒性较好,但会导致支撑向量太多,从而所需识别时间增多。因此需要选择一个折衷的(yita,L)组合。
[0077] 综上,本发明方法能获得较少支撑向量数,在识别精度相当的情况下,节省了识别时间。