基于字典迁移聚类的SAR图像分割方法转让专利

申请号 : CN201110048972.4

文献号 : CN102122386B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 缑水平焦李成庄广安王爽田小林张向荣李阳阳乔鑫

申请人 : 西安电子科技大学

摘要 :

本发明公开了一种基于字典学习的迁移聚类SAR图像分割方法,主要解决现有的人工标记SAR图像成本高,且已有无标记SAR图像无法用于辅助目标SAR图像分割的问题。其实现过程是:1)对目标SAR图像和无标记辅助SAR图像提取小波特征;2)设定循环终止次数,使用k-means方法对目标SAR图像进行初始划分;3)对每一类目标SAR图像数据训练一个字典;4)从辅助SAR图像数据中为每一类目标SAR数据迁移一组样本;5)利用谱聚类集成方法去除标签不稳定的辅助数据样本;6)用净化后的每一批辅助样本训练一个辅助字典;7)根据目标字典与辅助字典以及对应聚类中心更新样本标签并输出聚类分割结果。本发明具有分割效果好的优点,可用于进一步的SAR图像目标识别。

权利要求 :

1.一种基于字典学习的迁移聚类SAR图像分割方法,包括以下步骤:

(1)对目标SAR图像和无标记辅助SAR图像的每一个像素点取M×N窗口进行3层平稳小波变换,提取小波特征,所述的无标记辅助SAR图像是指与目标任务图像相关而且可分性较好的已有无标记图像;

(2)设循环次数变量t的初值为1,利用k-means算法对提取特征后的目标SAR图像数据聚类,得到目标图像数据的划分类别Yit,i=1,2,3,...k,以及对应每一类的聚类中心Cit,i=1,2,3,...k,其中k为数据类数;

(3)对划分后的目标图像数据中的每一类数据利用K-SVD算法训练一个字典,分别得到目标字典Dit,i=1,2,3,...,k;

(4)利用目标图像数据划分后得到的聚类中心Cit,i=1,2,3,...k,使用欧式距离按照最近邻原则从已有无标记SAR图像数据中为每一聚类中心寻找一批可用于辅助目标图像数据划分的样本Y′it,i=1,2,3,...k;

(5)利用谱聚类集成算法,对寻找到的所有辅助数据样本聚类集成,并通过标签匹配后,删除寻找得到的每一类数据中标签不稳定的样本,得到净化后的辅助样本数据Y″it,i=1,2,3,...k;

(6)使用K-SVD算法对净化后的每一批辅助数据样本Y″it,i=1,2,3,...k分别训练辅助字典D′it,i=1,2,3,...k;

(7)根据每一类目标字典Dit和对应的辅助字典D′it,利用正交匹配追踪算法得到每一个样本y对应的目标稀疏系数xtar和辅助稀疏系数xsou,并按照下式计算每一个样本y对应k个数据类的值其中:λ1为目标可调参数、λ2为辅助可调参数、λ3为距离可调参数;

(8)对每一个样本y,找出k个数据中的最小值,并将该最小值所对应的类别标签赋予样本y,更新目标任务样本标签,进一步更新聚类中心;

(9)判断循环次数t是否满足t≥T,T为预设定终止循环次数,若满足则执行步骤(10),否则t=t+1,返回步骤(3);

(10)输出目标SAR图像的最终分割结果。

2.根据权利要求1所述的迁移聚类SAR图像分割方法,其中步骤(2)所述的 利用k-means算法对提取特征后的目标SAR图像数据聚类,按如下步骤进行:(2a)根据目标SAR图像数据的需要划分类别k,在所有目标SAR图像数据样本中随机选择k个初始聚类中心;

(2b)计算所有目标SAR图像数据样本到k个聚类中心的欧氏距离;

(2c)比较每一个样本到k个聚类中心的距离,选择其中最小值,将该最小值对应类别标签赋予样本,得到所有目标数据样本标签;

(2d)计算每一类目标数据的平均值,得到新的聚类中心;

(2e)将新聚类中心值与原聚类中心值进行比较,若比较结果没有发生变化,则得到目标SAR图像数据的初始划分Yit,i=1,2,3,...k,以及对应每一类的聚类中心Cit,t,i=

1,2,3,...k,否则返回步骤(2b)。

3.根据权利要求1所述的迁移聚类SAR图像分割方法,步骤(4)中所述的使用欧式距离按照最近邻原则从已有无标记SAR图像数据中为每一聚类中心寻找一批可用于辅助目标图像数据划分的样本Y′it,i=1,2,3,...k,按如下步骤进行:(4a)分别计算所有辅助SAR图像数据样本到聚类中心Cit,i=1,2,3,...k的欧式距离;

(4b)将所有辅助SAR图像数据样本到聚类中心Cit的距离由小到大排序;

(4c)从距离聚类中心最近样本开始,选择到聚类中心Cit距离小于到其他聚类中心距离的辅助数据样本作为聚类中心Cit的可利用辅助划分数据Y′it;

(4d)返回步骤(4b)直到得到所有聚类中心Cit,i=1,2,3,...k可利用辅助数据Y′it,i=1,2,3,...k。

4.根据权利要求1所述的迁移聚类SAR图像分割方法,其中步骤(5)所述的删除寻找得到的每一类数据中标签不稳定的样本,是根据多次聚类标签的匹配结果,判断样本标签是否稳定,若某一样本的多次聚类结果得到标签基本一致,则该样本标签是稳定的,保留该样本,否则样本标签不稳定,删除标签不稳定样本,得到净化的可利用辅助数据样本Y″it,i=1,2,3,...k。

5.根据权利要求1所述的迁移聚类SAR图像分割方法,其中步骤(7)中所述的根据每一类目标字典Dit和对应的辅助字典D′it,利用正交匹配追踪算法得到每一个样本y对应的目标稀疏系数xtar和辅助稀疏系数xsou,是在目标字典Dit和对应辅助字典D′it已知的情形下利用正交匹配追踪算法分别通过利用下式完成对样本y的稀疏表示,得到目标稀疏系数xtar和辅助稀疏系数xsou;

y=Ditxtar,s.t.|xtar|0≤t0

y=D′itxsau,s.t.|xsau|0≤t0

其中t0为预设定常数称为稀疏度。

说明书 :

基于字典迁移聚类的SAR图像分割方法

技术领域

[0001] 本发明属于图像处理技术领域,可用于SAR图像分割,作为进一步SAR图像理解和解译的基础。

背景技术

[0002] 合成孔径雷达SAR成像技术克服了普通成像技术在必须一定光照条件下成像的被动成像缺点,它通过主动发射和接受电磁波,根据物体的反射、散射特性成像。SAR利用合成孔径原理提高方位分辨率,在遥感领域具有独特的优势。由于SAR具有全天时、全天候的探测与侦察能力,SAR图像的解译受到越来越多的国防和民用的重视。作为SAR图像解译非常重要的一个步骤的SAR图像分割,也就显得愈加重要。现有的SAR图像分割方法大致可以分为基于区域的分割方法和基于边界的分割方法,如阈值分割、形态学的方法、聚类的方法、及随机场的方法等。
[0003] 目前有许多聚类算法应用于SAR图像的分割,传统的k-means、FCM、谱聚类算法,以及使用少量标签数据指导数据划分的半监督聚类算法。由于SAR图像成像机理的特殊性以及复杂性,所成图像中有大量相干斑噪声,导致SAR图像的可分性较差,传统方法得到分割结果不够理想。半监督聚类算法可以得到相比传统聚类算法更好的结果,但是半监督分割方法则需要一定数量标签数据,SAR图源本身已经比较稀缺,标记过的数据更少,加之SAR覆盖范围广,若要标记新的SAR图像数据则需要花费大量人力物力,代价太大。

发明内容

[0004] 本发明的目的在于针对上述已有技术的不足,提出一种基于字典迁移聚类的SAR图像分割方法,以在不需要标记SAR图像数据的情形下,充分利用已有无标记SAR图像数据,在传统方法分割结果基础上进一步改善SAR分割结果。
[0005] 实现本发明目的地技术思路是:根据迁移学习思想,从与目标任务图像相关而且可分性较好的已有无标记图像中迁移知识,辅助目标图像的分割。具体步骤包括如下:
[0006] (1)对目标SAR图像和无标记辅助SAR图像的每一个像素点取M×N窗口进行3层平稳小波变换,提取小波特征;
[0007] (2)设循环次数变量t的初值为1,利用k-means算法对提取特征后的目标SAR图像数据聚类,得到目标图像数据的划分类别Yiti=1,2,3,...k,以及对应每一类的聚类中心Citi=1,2,3,...k,其中k为数据类数;
[0008] (3)对划分后的目标图像数据中的每一类数据利用K-SVD算法训练一个字典,分别得到目标字典Diti=1,2,3,...,k;
[0009] (4)利用目标图像数据划分后得到的聚类中心Citi=1,2,3,...k,使用欧式距离按照最近邻原则从已有无标记SAR图像数据中为每一聚类中心寻找一批可用于辅助目标图像数据划分的样本Yit′i=1,2,3,...k;
[0010] (5)利用谱聚类集成算法,对寻找到的所有辅助数据样本聚类集成,并通过标签匹配后,删除寻找得到的每一类数据中标签不稳定的样本,得到净化后的辅助样本数据Yit″i=1,2,3,...k;
[0011] (6)使用K-SVD算法对净化后的每一批辅助数据样本Yit″i=1,2,3,...k分别训练辅助字典Dit′i=1,2,3,...k;
[0012] (7)根据每一类目标字典Dit和对应的辅助字典Dit′,利用OMP算法得到每一个样本y对应的目标稀疏系数xtar和辅助稀疏系数xsou,并按照下式计算每一个样本y对应k个数据类的值
[0013]
[0014] 其中:λ1为目标可调参数、λ2为辅助可调参数、λ3为距离可调参数;
[0015] (8)对每一个样本y,找出k个数据中的最小值,并将该最小值所对应的类别标签赋予样本y,更新目标任务样本标签,进一步更新聚类中心;
[0016] (9)判断循环次数t是否满足t≥T,T为预设定终止循环次数,若满足则执行步骤(10),否则t=t+1,返回步骤(3);
[0017] (10)输出目标SAR图像的最终分割结果。
[0018] 本发明与现有的技术相比具有以下优点:
[0019] 1)本发明充分利用与目标SAR图像相关的已有无标记SAR图像数据辅助改善目标SAR图像的划分,而现有的许多半监督方法使用标记数据才可以达到辅助目标数据改善划分的目的,所以能够节省大量的标记SAR图像所花费的时间和金钱;
[0020] 2)本发明是在传统聚类算法的基础上利用无标记辅助数据改善调整样本标签,能够得到比传统聚类算法更好的SAR图像分割结果;
[0021] 仿真实验结果表明,本发明基于字典学习的迁移聚类方法可以有效的用于SAR图像分割,使后续SAR图像的理解和解译能够更好进行。

附图说明

[0022] 图1是本发明的实现流程图;
[0023] 图2本发明和现有方法对二类SAR图像分割结果;
[0024] 图3本发明和现有方法对三类SAR图像分割结果。

具体实施方式

[0025] 参照图1,本发明的具体实施步骤如下:
[0026] 步骤1.提取目标SAR图像和辅助SAR图像的小波特征。
[0027] 对目标SAR图像和辅助SAR图像的每一个像素点取M×N窗口并对该窗口进行3层平稳小波分解,根据小波分解得到三层子带系数,计算每个像素点的小波能量特征,若图像像素点总个数为n,通过下式对每个像素点提取出10维能量特征,构成大小为n×10的输入数据样本E:
[0028]
[0029] 其中,M×N为对每个像素点提取的滑动窗口大小,这里取值为16×16,coef(i,j)为平稳小波子带中第i行第j列的系数值。
[0030] 步骤2.对提取特征后的目标SAR图像数据进行初始划分。
[0031] (2a)确定目标图像所要划分的类数k,设循环次数变量t初值为1;
[0032] (2b)根据目标SAR图像数据的需要划分类别k,在所有目标SAR图像数据样本中随机选择k个初始聚类中心;
[0033] (2c)计算所有目标SAR图像数据样本到k个聚类中心的欧式距离;
[0034] (2d)比较每一个样本到k个聚类中心的距离,选择其中最小值,将该最小值对应类别标签赋予样本,得到所有目标数据样本标签;
[0035] (2e)计算每一类目标数据的平均值,得到新的聚类中心;
[0036] (2f)将新聚类中心值与原聚类中心值进行比较,若比较结果没有发生变化,则得到目标SAR图像数据的初始划分结果Yiti=1,2,3,...k,并将原聚类中心作为最终聚类中心Citi=1,2,3,...k,否则返回步骤(2b)。
[0037] 步骤3.利用K-SVD算法对划分后的每一类目标SAR图像数据进行训练,得到目标字典Diti=1,2,3,...,k。
[0038] (3a)对目标SAR图像数据的初始划分结果Yiti=1,2,3,...k,选择距离聚类中心Cit最近的一批样本,若该类样本数少于500则使用全部样本来训练目标字典Dit,若该类数据样本数大于500则选取距离中心最近的500个样本作为训练数据,得到n0个训练样本的数据集合Y;
[0039] (3b)将选取的n0个训练样本利用K-SVD字典学习方法训练一个目标字典Dit,该K-SVD算法包括稀疏编码和原子更新两个阶段;
[0040] (3b1)根据下式利用正交匹配追踪OMP方法,完成对样本集合的稀疏编码:
[0041] Y=DXs.t.|xi|0≤t0
[0042] 其中Y为需要稀疏表示的样本集合,D为用来稀疏表示的字典,本发明中是从样本集合Y中选取距离对应聚类中心最近的一部分样本作为初始字典,X为样本经字典稀疏表示后的得到稀疏矩阵;xi为稀疏矩阵的第i列,t0为预设定稀疏向量中的非零元素个数,称为稀疏度;
[0043] (3b2)对字典中所有原子di=1,2,3...k进行如下更新,该原子di指字典中的第i个列向量:
[0044] 首先,从所有训练样本Y中找出使用原子di样本集合:ωi={k|1≤k≤n0,i ix(k)≠0},集合ωi共有nω个元素,其中x 为对样本集Y稀疏编码后得到稀疏矩阵X的第i行;
[0045] 接着,去除原子di的影响,并计算字典与稀疏矩阵乘积对所有训练样本Y的重构误差矩阵Ei:
[0046]
[0047] 然后,依据集合ωi中数据,选取误差矩阵Ei中对应的nω个列向量,组成特异误差矩阵
[0048] 最后,对特异误差矩阵 应用矩阵奇异值分解 并用矩阵U的第一列替换所要更新的原子di,用数据Δ(1,1)乘以矩阵V的第一个列向量得到一个新的向量,利用i i该新的向量替换x,x 为稀疏矩阵X的第i行;
[0049] (3c)判断循环次数是否满足预定终止循环次数,若满足,得到目标字典Dit,否则返回步骤(3a)。
[0050] 步骤4.利用聚类中心Citi=1,2,3,...k从辅助SAR图像数据中寻找对目标SAR图像划分有用的辅助数据Yit′i=1,2,3,...k。
[0051] (4a)分别计算所有辅助SAR图像数据样本到聚类中心Citi=1,2,3,...k的欧式距离;
[0052] (4b)将所有辅助SAR图像数据样本到聚类中心Cit的距离由小到大排序;
[0053] (4c)从距离聚类中心最近样本开始,选择到聚类中心Cit距离小于到其他聚类中心距离的辅助数据样本作为聚类中心Cit的可利用辅助划分数据Yit′;
[0054] (4d)返回步骤(4b)寻找另一聚类中心对应辅助SAR图像数据,重复步骤(4b)-(4c)直到得到所有聚类中心Citi=1,2,3,...k对应可利用辅助数据Yit′i=1,2,3,...k。
[0055] 步骤5.净化得到的辅助样本数据。
[0056] 利用谱聚类集成方法,对寻找得到的所有辅助样本Yit′i=1,2,3,...k进行多次聚类,然后将多次聚类得到的结果标签进行匹配,从中去除标签不稳定的样本,在本发明中根据多次聚类标签的匹配结果,判断样本标签是否稳定,若某一样本的多次聚类结果得到标签基本一致,则该样本标签是稳定的,保留该样本,否则样本标签不稳定,删除标签不稳定样本,得到净化的可利用辅助数据样本Yit″i=1,2,3,...k。
[0057] 步骤6.对净化后的辅助样本Yit″i=1,2,3,...k分别训练辅助字典D′iti=1,2,3,...k。
[0058] 将净化后的辅助样本Yit″i=1,2,3,...k利用K-SVD算法分别训练一个辅助字典,得到辅助字典D′iti=1,2,3,...k。
[0059] 步骤7.更新目标图像样本数据标签。
[0060] (7a)在目标字典Dit和对应辅助字典Dit′已知的情形下利用OMP算法分别通过利用下式完成对样本y的稀疏表示,得到目标稀疏系数xtar和辅助稀疏系数xsou;
[0061] y=Ditxtars.t.|xtar|0≤t0
[0062] y=Dit′xsaus.t.|xsau|0≤t0
[0063] 其中t0为预设定常数称为稀疏度;
[0064] (7b)根据得到的目标稀疏系数xtar和辅助稀疏系数xsou,同时计算样本到对应聚类中心的欧式距离,按照下面表达式计算每一个样本y对应k个数据类的值;
[0065]
[0066] 其中λ1为目标可调参数、λ2为辅助可调参数、λ3为距离可调参数;
[0067] 步骤8对每一个样本y,找出步骤7中得到的k个数据中的最小值,并将该最小值所对应的类别标签赋予样本y,更新目标任务样本标签,进一步更新聚类中心。
[0068] 步骤9.判断是否满足终止条件。
[0069] 判断循环次数是否满足t≥T,T为预设定程序终止循环次数,若满足则执行下一步骤(10),否则进入下一次循环,即t=t+1,转步骤(3),继续改善目标SAR图像样本数据的划分,直到满足t≥T;
[0070] 步骤10.输出最终聚类分割结果。
[0071] 本发明的效果可以通过如下仿真实验进行验证。
[0072] (一)实验条件设置
[0073] 实验使用的二类目标SAR图像是从华盛顿特区的一幅ku波段的1m分辨率的SAR图像中截取出来的400×600的piers图像,如图2(a)所示;
[0074] 实验使用的该二类SAR图像的辅助SAR图像同样为从华盛顿特区的一幅ku波段的1m分辨率的SAR图像截取出来的400×600的roosbrdg图像,如图2(e)所示。
[0075] 实验使用的三类目标SAR图像是美国新墨西哥州Albuquerque地区附近的Kirtland空军基地关于M-47坦克的4英寸分辨率的RTV SAR图像,如图3(a)所示,图像大小为500×600。该三类SAR图像的辅助SAR图像为从华盛顿特区的一幅ku波段的1m分辨率的SAR图像中截取出来的400×600的图像,如图3(e)所示。
[0076] 仿真 谱聚类算法时选取的采样点个数为100,尺度参数σ=2。
[0077] 本发明所提出的每一目标任务字典和迁移字典原子数皆为为20个,其中目标可调参数取λ1=0.15、辅助可调参数取λ2=1.0、距离可调参数取λ3=0.05。
[0078] (二)实验结果及分析
[0079] 通过仿真实验给出已有k-means聚类算法和 谱聚类算法的对所选取的两幅目标SAR图像分割结果与本发明对目标SAR图像的分割结果。其中,对k-means聚类算法和 谱聚类算法选取的是10次实验中视觉效果最好的分割结果,选取的本发明的分割结果同样也为10次试验结果中视觉效果最好的。
[0080] 图2(b)为现有的k-means聚类方法的分割结果,从图2(b)可以看出,码头延伸入河流的部分没有分割出来,而且城市中的道路楼房等没有任何细节分割出来。
[0081] 图2(c)为现有的 近似方法的分割结果,从图2(c)可以看出,虽然分割出了城市伸入河流的码头区域,但是将码头与河流分为了一类,码头之间的空隙应该划分为河流一类,却与城市划分为一类,而且城市区域分割的比较杂乱。
[0082] 图2(d)是本发明的基于字典学习的迁移聚类方法的分割结果,从图2(d)可以看到,经过迁移后,码头延伸入河流的部分较好的分割出来,而且城市中的部分道路也得以分割出来。
[0083] 图3(b)为现有的k-means聚类方法的分割结果,2从图3(d)可以看到,背景区域以及两排坦克之间的沟壑区域杂点较多,分割效果较差。
[0084] 图3(c)为现有的 近似方法的分割结果,从图3(c)可以看到,谱聚类方法对该图的分割结果已经相对不错,但是分割后两排坦克之间的沟壑区域的左侧部分的杂点仍然较多。
[0085] 图3(d)为本发明的基于字典学习的迁移聚类方法的分割结果,从图3(d)可以看到它有效的去除了背景区域以及沟壑区域的杂点,使各个区域划分的更加干净,目标坦克更加突出。