基于稀疏低秩的判别谱聚类的极化SAR图像分类方法转让专利

申请号 : CN201811045329.4

文献号 : CN109359525B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张向荣焦李成于心源唐旭侯彪白静马文萍马晶晶

申请人 : 西安电子科技大学

摘要 :

本发明公开了一种基于稀疏低秩的判别谱聚类的极化SAR图像分类方法,主要解决现有技术的分类精度低和区域一致性差的问题。其实现方案为:对极化SAR图像进行相似性处理,在稀疏、低秩的约束下,引入判别损失函数,定义新的目标函数,并构造其对应的增广拉格朗日方程;在增广拉格朗日乘子法的基础上利用矩阵奇异值分解算法,得到迭代方程并利用其进行迭代求解;对迭代求解结果进行谱聚类得到极化SAR图像的最终分类结果。实验结果表明,本发明分类精度高,区域一致性好,比现有的方法具有更好的性能。可用于极化SAR图像的目标分类、检测与识别。

权利要求 :

1.基于稀疏低秩的判别谱聚类的极化SAR图像分类方法,包括:(1)输入数据集X={xi},定义一个加权图G={X,E,S},将数据集X作为加权图G的顶点集;设E={(xi,xj),i≠j}是加权图边集;S=(Sij)n×n为加权图的相似矩阵,Sij表示数据点xi和xj之间的相似度, 其中n是数据点的个数,||.||2表示l2范数,σ2为X的标准差;

(2)定义P是加权图G上随机游动的概率转移矩阵,P=D-1S,其中D是一个对角矩阵,D的对角元(3)将概率转移矩阵P分解为真实概率转移矩阵 和偏移误差矩阵E1两个部分,即(4)根据(3)的结果,在低秩和稀疏约束下构造如下目标函数:其中 是 的秩,||E1||0表示E1的零范数,λ是非负平衡参数,取值为λ=0.05;

(5)定义判别聚类项的损失函数E2=E(Y,W|X),Y表示类标签,W表示分类器;损失函数具体表达式为:其中,e为自然常数,分类器W=(Wpq)c×c=[W1,W2,...,Wq,...,Wc]T,Wpq是W的第p行第q列的元素,Wq是第q类的分类器参数向量,类标签 表示数据点xi的标签;

是指示函数,当 时该指示函数取值为1,其他情况取值为0;Nq表示第q类所包含的数据点的个数, c表示标签个数,ξ为正则化参数,取值为ξ=5×10-5;

(6)设定辅助变量Q,根据损失函数E2,将(4)中的目标函数转换成如下等价形式:其中,β是非负平衡参数,取值为β=0.001,||.||1表示l1范数,||·||*表示迹范数;

(7)构造与式<2>对应的增广拉格朗日函数:

其中H为拉格朗日算子,<·,·>表示矩阵的内积运算,μ是自适应惩罚参数,取值为μ=10-7,||.||F表示F范数;

(8)设置迭代停止条件设立为: 或者达到最大迭

代次数t,其中,ε为给定的精确度,取t=1000,ε=10-8,||.||∞表示无穷范数;对式<3>进行迭代求解,当方程的近似解满足迭代停止条件时,停止迭代,得到偏移误差矩阵E1、判别损失函数E2和真实概率转移矩阵(9)利用真实概率转移矩阵 通过马尔可夫链算法对极化SAR图像进行谱聚类,得到极化SAR图像的分类结果。

2.根据权利要求1所述的方法,其中步骤(8)中迭代求解辅助变量Q,是在式<3>的增广拉格朗日函数中固定除辅助变量Q以外的其余变量,得到Q的最小化求解方程:其中,U'∑VT为 的SVD分解结果。

3.根据权利要求1所述的方法,其中步骤(8)中迭代求解偏移误差E1,是在式<3>的增广拉格朗日函数中固定除偏移误差E1以外的其余变量,将最小化E1的目标函数化简为:得到E1的近似解为:

4.根据权利要求1所述的方法,其中步骤(8)中迭代求解真实概率转移矩阵 是在式<3>的增广拉格朗日函数中固定除真实概率转移矩阵 以外的其余变量,得到 的更新方程为:

5.根据权利要求1所述的方法,其中步骤(9)中通过马尔可夫链算法对极化SAR图像进行谱聚类,实现步骤包括如下:(9a)根据真实概率转移矩阵 与加权图G存在唯一平稳分布π的特性,设Π为平稳分布π对角元素所组成的对角矩阵,构造拉格朗日函数 其中T表示转置;

(9b)求解拉格朗日函数L'的前c个最小的广义特征值所对应的特征向量:{U1,U2...,TUc},组成矩阵U=[U1,U2...,Uc];

(9c)对矩阵U进行k均值聚类,得到最终数据点的分类结果。

说明书 :

基于稀疏低秩的判别谱聚类的极化SAR图像分类方法

技术领域

[0001] 本发明属于图像处理技术领域,更进一步涉及一种极化SAR图像分类方法,可用于极化SAR图像的目标检测与目标识别。

背景技术

[0002] 随着计算机软硬件技术的不断提高,遥感系统越来越先进,获取地物信息的方式越来越多样化,先进的遥感手段促进了对地观察技术的发展。合成孔径雷达SAR是获取地物信息的一种重要工具,它能在任何气候下不分白天黑夜的工作,在获取地物信息上比其它传统方式更具有优势。而极化SAR能同时获取地物目标的四个不同极化通道的散射特征,既包含了振幅信息,也包含了相位信息,比常规SAR包含更多的地物信息,如极化度、同极化比、交叉极化比、散射熵及同极化相位差等。这些极化信息揭示了地物的散射差别,有助于进一步进行信息挖掘,为地物分类研究提供了基础条件。
[0003] 极化SAR图像的分类是指将图像的像元按其性质分为若干个类别的过程,目前极化SAR图像分类主要分为三种方法:
[0004] 第一种是基于统计分布模型的贝叶斯分类方法。例如,李仲森等人1994年在International Journal of Remote Sensing的第15卷第11期上发表的《Classification of multi-look polarmetric SAR imagery based on complex Wishart distribution》,该文献提出一种基于Wishart距离的分类方法,成为最经典的方法之一,但是该方法只考虑了单个像素的信息,分类的区域一致性较差。
[0005] 第二种是基于机器学习的分类方法。例如,Pierre-Louis Frison等人2009年在IEEE Transactions on Geoscience and Remote Sensing的第47卷第12期上发表的《Support vector machine for multifrequency SAR polarmetric data classificatio n》,该文献提出一种基于支持向量机的分类方法,该方法需要人工提取特征,然而人工提取的特征不是最适合分类的特征,从而导致分类精度不高。
[0006] 第三种方法是基于深度学习的分类方法。例如,谢慧明等人2014年在IEEE I nternational Geoscience and Remote Sensing Symposium上发表的《Multilayer feat ure learning for polarimetric synthetic radar data classification》,该文献提出了一种基于多层特征学习的分类方法,该方法首先对待分类极化SAR图像进行滤波,然后获取每个像素点的原始特征,选取训练数据集和测试数据集,将训练数据集输入到多层自编码器中进行训练,最后将测试数据集输入到多层自编码器中进行预测分类。该方法只研究单个像素的信息,会受到相干斑噪声的影响,从而影响区域内的一致性和分类精度。同时,该方法中的训练数据集较小,导致深度学习模型的过拟合,从而影响分类精度。

发明内容

[0007] 本发明的目的在于针对上述已有技术的不足,提出一种基于稀疏低秩的判别谱聚类的极化SAR图像分类方法,以提高分类区域内一致性和分类精度。
[0008] 为实现上述目的,本发明采取的技术方案包括如下:
[0009] 1.基于判别谱聚类的极化SAR图像分类方法,包括:
[0010] (1)输入数据集X={xi},定义一个加权图G={X,E,S},将数据集X作为加权图G的顶点集;设E={(xi,xj),i≠j}是加权图边集;S=(Sij)n×n为加权图的相似矩阵,Sij表示数据点xi和xj之间的相似度, Sij≥0,i,j=1,2,...,n,其中n是数据点的个数,||.||2表示l2范数,σ2为X的标准差;
[0011] (2)定义P是加权图G上随机游动的概率转移矩阵,P=D-1S,其中D是一个对角矩阵,D的对角元
[0012] (3)将概率转移矩阵P分解为真实概率转移矩阵 和偏移误差矩阵E1两个部分,即[0013] (4)根据(3)的结果,在低秩和稀疏约束下构造如下目标函数:
[0014]
[0015]
[0016] 其中 是 的秩,||E1||0表示E1的零范数,λ是非负平衡参数,取值为λ=0.05;
[0017] (5)定义判别聚类项的损失函数E2=E(Y,W|X),Y表示类标签,W表示分类器;
[0018] (6)设定辅助变量Q,根据判别损失函数E2,将(4)中的目标函数转换成如下等价形式:
[0019]
[0020]
[0021] 其中,β是非负平衡参数,取值为β=0.001,||.||1表示l1范数,||·||*表示迹范数;
[0022] (7)构造与式<2>对应的增广拉格朗日函数:
[0023]
[0024]
[0025] 其中H为拉格朗日算子,<·,·>表示矩阵的内积运算,μ是自适应惩罚参数,取值为μ=10-7,||.||F表示F范数;
[0026] (8)设置迭代停止条件设立为: 或者达到最大迭代次数t,其中,ε为给定的精确度,取t=1000,ε=10-8,||.||∞表示无穷范数;对式<3>进行迭代求解,当方程的近似解满足迭代停止条件时,停止迭代,得到偏移误差矩阵E1、判别损失函数E2和真实概率转移矩阵
[0027] (9)利用真实概率转移矩阵 通过马尔可夫链算法对极化SAR图像进行谱聚类,得到极化SAR图像的分类结果。
[0028] 本发明与现有技术相比,具有如下优点:
[0029] 第一,本发明充分利用低秩与稀疏约束,并引入判别信息对数据进行分类,通过数据特征得到相似度矩阵,结合相似度矩阵得到概率转移矩阵,将其中需要的聚类特征利用增广拉格朗日求得,有效地克服了原始信息中误差的影响,提高了分类精度。
[0030] 第二,本发明在分类算法中加入了判别信息,利用其对数据进行划分,使数据的信息得到更有效的利用,分类更准确。

附图说明

[0031] 图1是本发明的实现流程图;
[0032] 图2是本发明适用的极化SAR图像;
[0033] 图3是本发明仿真所用的极化SAR图像真实的地物标记图;
[0034] 图4是利用本发明对仿真所用极化SAR图像的分类结果图;
[0035] 图5是利用现有技术对仿真所用极化SAR图像的分类结果图。

具体实施方式

[0036] 以下结合附图对本方法进行详细说明。
[0037] 参照图1,基于稀疏低秩的判别谱聚类的极化SAR图像分类方法,包括如下步骤:
[0038] 步骤1,输入待分类的极化SAR图像。
[0039] 本实施例输入一幅如图2所示的极化SAR图像,该图像的像素集为X={x1,x2,...,xi,...,xn},其中xi表示极化SAR图像里的第i个像素,i=1,2,...,n,n表示极化SAR图像的像素个数。
[0040] 步骤2,对极化SAR图像进行相似性处理。
[0041] 对待分类的极化SAR图像进行相似性处理,得到相似矩阵S=(Sij)n×n,其中Sij表示第i个数据点xi和第j个数据点xj之间的相似度, i,j=1,2,...,n,,||.||2表示l2范数,σ2为X的标准差;
[0042] 通过相似矩阵S得到概率转移矩阵:P=D-1S,其中D是一个对角矩阵,D的对角元[0043] 步骤3,引入判别信息。
[0044] 定义判别损失函数E2=E(Y,W|X),其表示为:
[0045]
[0046] 其中,Y为类标签,W为分类器,W=(Wpq)c×c=[W1,W2,...,Wq,...,Wc]T,Wpq是W的第p行第q列的元素,Wq是第q类的分类器参数向量,类标签 表示数据点xi的标签;是指示函数,当 时该指示函数取值为1,其他情况取值为0;Nq表示第q类所
包含的数据点的个数, c表示标签个数,e为自然常数,ξ为正则化参数,取值为ξ=5×10-5。
[0047] 步骤4,定义目标函数。
[0048] 设定辅助变量Q,根据判别损失函数E2,定义目标函数:
[0049]
[0050]
[0051] 其中, 表示真实概率转移矩阵,E1表示偏移误差矩阵,λ是E1的非负平衡参数,取值为λ=0.05,β是E2的非负平衡参数,取值为β=0.001,||.||1表示l1范数,||·||*表示迹范数。
[0052] 步骤5,构造增广拉格朗日函数。
[0053] 本实例是根据已知拉格朗日函数式 构造增广拉格朗日函数,即通过在拉格朗日函数式 中增加判别损失函数E2实现:
[0054]
[0055] 在该式中加入判别损失函数E2后,得到新的增广拉格朗日函数 为:
[0056]
[0057]
[0058] 其中,H为拉格朗日算子,<·,·>表示矩阵的内积运算,μ是自适应惩罚参数,取值为μ=10-7,||.||F表示F范数;
[0059] 由 于 判 别 损失 函 数 E 2 包 含 有 判 别 项 信息 ,即 E 2 表 达 式 中的为判别项信息,因而将E2引入增广拉格朗日函数中后,增加了聚类计算的信息量,在迭代求解时可以减少原始的极化SAR图像中误差项的影响,提高最终分类的准确度。
[0060] 步骤6,利用增广拉格朗日函数 求解辅助变量Q,偏移误差E1,判别损失函数E2和真实概率转移矩阵 的迭代方程。
[0061] 通过增广拉格朗日乘子算法来求解迭代方程的方法在许多矩阵学习问题中都表现出了良好的效率与准确性之间的平衡,因而本发明利用增广拉格朗日乘子法得到辅助变量Q,偏移误差E1,判别损失函数E2和真实概率转移矩阵 的迭代方程,再通过迭代方程进行迭代求解得到 E1和E2的具体函数值。
[0062] (6a)在增广拉格朗日函数中固定 E1和E2,得到辅助变量Q的目标函数:
[0063]
[0064] 由于Q的目标函数符合现有的奇异值分解公式,故可得到辅助变量Q的最小化求解方程:
[0065]
[0066] 对 进行奇异值分解可得 其中,U'为 的左奇异矩阵,∑是 的奇异值矩阵,VT为 的右奇异矩阵;
[0067] (6b)在增广拉格朗日函数中固定 Q和E2,得到偏移误差E1的目标函数为:
[0068]
[0069] 可将其化简为:
[0070]
[0071] 化简后的目标函数符合现有的奇异值求解公式,对E1进行奇异值分解,在稀疏、低秩的约束下,E1的左、右奇异矩阵可以忽略不计,E1的奇异值矩阵为 因此求解得到E1的近似解为:
[0072]
[0073] (6c)在增广拉格朗日函数中固定 Q和E1,得到最小化判别损失函数E2的求解方程如下:
[0074]
[0075] (6d)在增广拉格朗日函数中固定Q、E1和E2,得到最小化真实概率转移矩阵 的更新方程:
[0076]
[0077] 步骤7,迭代求解真实概率转移矩阵 偏移误差矩阵E1和判别损失函数E2的具体函数值。
[0078] 利用真实概率转移矩阵 偏移误差矩阵E1和判别损失函数E2的更新方程进行迭代,更新 E1和E2,得到它们的具体函数值:
[0079] (7a)输入E1的非负平衡参数λ=0.05,E2的非负平衡参数β=0.001,自适应惩罚参-7 -8数μ=10 ,精确度ε=10 ,以及概率转移矩阵P;
[0080] (7b)初始化 Q=0,H=0,Y=0,W=0,E1=0,E2=0;
[0081] (7c)设置初始迭代次数t=1,最大迭代次数为1000;
[0082] (7d)根据公式 更新Q;
[0083] (7e)根据公式 更新E1;
[0084] (7f)根据公式 更新E2;
[0085] (7g)根据公式 更新
[0086] (7h)迭代次数增加1,即t=t+1;
[0087] (7i)重复步骤(7d)~(7h),直到达到最大迭代次数1000或者达到时停止迭代,其中,ε为给定的精确度,||.||∞表示无
穷范数;
[0088] (7k)输出真实概率转移矩阵 偏移误差矩阵E1和判别损失函数E2的具体函数值。
[0089] 步骤8,对极化SAR图像进行谱聚类。
[0090] 谱聚类算法与传统的聚类算法相比,具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点,其数据分布的适应性更强,聚类精确度高的同时聚类的计算量也小,因此对极化SAR图像进行谱聚类,实现步骤包括如下:
[0091] (8a)根据真实概率转移矩阵 与加权图G存在唯一平稳分布π的特性,即设Π为平稳分布π对角元素所组成的对角矩阵,构造拉格朗日函数 其中T表示转置;
[0092] (8b)求解拉格朗日函数L'的前c个最小的广义特征值所对应的特征向量:{U1,U2...,Uc},组成矩阵U=[U1,U2...,Uc]T;
[0093] (8c)对矩阵U进行k均值聚类,得到最终像素点的分类结果。
[0094] 1、仿真条件
[0095] 仿真软件:使用MATLAB R2017a;
[0096] 实验数据为1989年获得的Flevoland地区农田数据,如图2所示,图像的大小为750×1024,对图2极化SAR图像进行真实的地物标记,如图3。
[0097] 2.仿真内容
[0098] 仿真1,利用本发明的方法对图2所示的极化SAR图像进行分类,得到的分类结果如图4所示。
[0099] 仿真2,利用现有的基于马尔科夫随机场方法MRF对图2所示的极化SAR图像进行分类,得到的分类结果如图5所示。
[0100] 对比图4和图5可见,利用本发明的方法得到的分类结果图的边缘较清晰,区域内一致性较好,表明本发明可以有效解决极化SAR图像的分类问题。
[0101] 通过图3所示的真实地物标记可知每个像素点的真实分类,得到的各个类别中分类正确的像素点,分别用仿真1和仿真2中得到的各个类别中分类正确的像素点个数除以该类别总的像素点个数,得到两种方法的分类精度,如表1所示。
[0102] 表1分类精度对比
[0103] 类别 本发明 MRFWater 99.40 99.14
Forest 99.41 88.79
Lucerne 99.17 96.85
Grasses 97.52 90.13
Peas 99.11 95.34
Barley 98.43 96.26
Bare soil 99.46 92.83
Beet 98.07 94.66
Wheat2 98.81 80.79
Wheat3 99.07 93.64
Stembeans 98.89 96.84
Rapeseed 97.70 83.86
Wheat 99.07 91.24
Buildings 96.13 81.23
Potatoes 99.03 87.11
Total 98.85 91.93
[0104] 从表一可见,利用本发明的方法得到的分类精度明显高于现有的基于马尔科夫随机场方法MRF,验证了本发明对极化SAR图像分类具有的良好效果。