一种基于稀疏表示的冠层植物高光谱图像分类方法转让专利

申请号 : CN201910916938.0

文献号 : CN110751144B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 徐平马凤娟陈秉强薛凌云赵晓东孔亚广陈张平邹洪波张帆

申请人 : 杭州电子科技大学

摘要 :

本发明公开一种基于稀疏表示的冠层植物高光谱图像分类方法。本发明引入一种新的加权稀疏表示模型,将高光谱数据中的任一光谱表示为预先训练好的字典中若干原子的线性组合。任一光谱的稀疏表示被表示为稀疏向量,其非零值对应于所选训练样本的权重。通过求解稀疏约束优化问题来恢复稀疏向量,并且可以直接确定测试样本的类标签。引入相关系数与阈值的概念,该模型根据相邻光谱与当前光谱的相关性对相邻光谱赋予不同的权重值,从而改变邻域内不同光谱对当前光谱归属的约束程度,这种改变对不同对象交界处光谱的分类有着显著改善。

权利要求 :

1.一种基于稀疏表示的冠层植物高光谱图像分类方法,其特征在于包括以下步骤:步骤(1)、数据预处理

1.1获取待分类植物高光谱图像

1.2光谱单位化:

对上述植物高光谱图像中每一条光谱进行单位化处理;

1.3划分训练样本与测试样本:

在步骤1.2单位化处理的高光谱图像数据按照样本包含M类地物中的每类对象15%比例作为训练样本A,其余85%为测试样本;

其中A的矩阵大小为D×N, Nm表示第m类地物的光谱数目;Am表示第m类对象样本构成的字典,大小为D×Nm;

是第m类对象的第Nm条光谱

αm表示与第m类对象训练样本对应的所有稀疏系数组成的稀疏矩阵,该矩阵只包含少数非零值;

步骤(2)、建立加权联合稀疏模型

假设相邻的高光谱光谱xi和xj由不同的对象构成;

xi由构建的字典Ai表示为:

xi=Aiαi

xj由构建的字典Aj表示为:

xj=Ajαj

假设相邻光谱Nε包含T条光谱,令X=[w1x1 w2x2 … wTxT],为D×T矩阵,其中{xt}t=1,…T∈Nε为高光谱空间相邻光谱,故X可以表示为:X=[w1x1 w2x2 … wTxT]=[A1S1 A2S2 … AMSM]=[A1 A2 … AM][S1 S2 … SM]=AS其中x1为当前待分类的光谱,x2…xT为以x1为中心的方形区域内的邻近光谱;wi表示第i条光谱的权重,T表示高光谱空间相邻光谱的个数,M表示对象的种类数,SM是X在第AM个训练字典下的稀疏向量;S是稀疏向量组成的稀疏矩阵;thr是判断相邻光谱是否有效的一个阈值;

步骤(3)、求解稀疏矩阵

给定训练字典A,矩阵S可以由下式的联合稀疏重构问题求得;

minimize ||S||row,0subjectto:AS=X

其中符号||S||row,0表示稀疏矩阵S中非零行的个数;S的最优解 D×M的稀疏矩阵仅有少量非零行构成;根据实际情况,考虑到误差的影响,对 的求解也可写成以下形式:其中||·||F表示Frobenius范数;σ表示其误差容限,K0表示其稀疏条件的限制,表示非零元素的个数;与单光谱的稀疏表示重构一样,加权联合稀疏表示的求解问题也是一个NP‑Hard问题,可以通过联合正交匹配追踪算法进行稀疏重构问题的求解;

步骤(4)、光谱分类

通过求解稀疏矩阵S,进而计算所有类别训练字典得到x的重构误差;那么x被第m类对象的训练字典重构的误差为:表示第m类训练字典得到的稀疏矩阵的最优解;那么x的最终分类结果是重构误差最小的那类对象,即:其中,rm(x)表示测试样本x与x在第m类对象中的稀疏表示 的二范数。

说明书 :

一种基于稀疏表示的冠层植物高光谱图像分类方法

技术领域

[0001] 本发明属于图像识别技术领域,更具体地,涉及一种基于稀疏表示的高光谱图像分类方法。

背景技术

[0002] 传统的目标分类方法需要假设数据明确的统计分布特性,另外利用一个单一的目标光谱来表示目标的光谱特性是不充分的,因为目标的光谱是随着环境条件而变化的。在实际高光谱目标分类中,我们很难只通过某一个特征空间就能得到较好的分类结果。遥感技术作为一种快速、宏观的地表资源监测技术手段,较之传统的地面调查,具有客观、无损以及实时获取信息的优势,尤其是高光谱遥感技术的出现和发展,为区分不同对象提供了一种可行的方法。高光谱遥感可以提供多个特征空间,通过联合处理高光谱数据的光谱信息与空间信息,来提高目标分类的性能。
[0003] 作物冠层能够反映以及预测植被与生态系统的功能状态,显示初级生产力以及氮循环的变化过程。所以其冠层信息经常作为生态系统中的功能与生物多样性的指示指标。利用植被冠层高光谱经常与叶片光合色素、水分、氮素以及纤维素等信息相结合,可反映作物的生长状况。然而,由于高光谱图像内部的光谱信息对受大气、光照强度、以及地表辐射等条件的制约,真实的高光谱图像内部的光谱信息无法做到与光谱信息库中的光谱信息完全匹配。同时,在高光谱图像中的目标一般以低概率形式存在,目标的出露概率低也成为分类的难点。因此对原始的高光谱图像进行的量化处理就显尤为重要。而近年来发展起来的稀疏表示理论,以其较好的信号表示能力,在高光谱图像分类领域可以得到很好的应用。利用稀疏表示理论将原始的高光谱用一组基底或是过完备字典中极少量原子线性组合的形式进行表示,来对高光谱图像内部丰富的结构特性进行分析。通常认为,高光谱图像中的每条光谱均可由一组基底进行线性表示,基底通常为目标或背景的光谱特性曲线,一般由光谱信息库所提供。Yi Chen等人提出的基于稀疏表示的高光谱图像自动分类算法区别于传统分类方法,这种方法的特别之处在于其将近年来发展的稀疏表示理论成功引入了分类理论中,有效地改善了传统分类方法的不足之处。
[0004] 物质的光谱反射率曲线都是独一无二的,包含本身特有的光谱信息,光谱反射率曲线的独特性正是物质区分的基础。然而由于现实中存在诸多的干扰因素导致会出现同谱异物或者同物异谱的情况,给实际对象区分带来诸多困难。
[0005] 常见的高光谱图像的分类模型有欧氏距离模型、统计概率模型以及空间模型。由于高光谱图像中对象的光谱特性不确定因素影响,基于欧式距离模型的分类算法的分类效果并不理想。采用子空间模型进行分类通常会对背景进行抑制,由于基本采取全局方法,能够降低背景的复杂度,抑制背景以提高目标的残差能量,加强分类的效果,但是无法实现对小目标的分类。大部分现有的分类算法均利用检测图像全部波段的光谱信息,而没有考虑相邻像元之间存在的空间相似性。然而由于高光谱遥感图像的光谱分辨率极高,以至于图像的相邻波段呈现出极大的相似性或冗余性。在这种情况下相邻单波段像元之间既包含冗余信息又包含分辨信息,而冗余的光谱信息妨碍分类的有效进行。由于现实进行分类时,遥感成像的距离较远、目标的出露概率较低导致目标会出现亚像元状态,稀疏表示理论的引入可以实现高光谱图像中亚像元以及隐蔽像元的分类工作。
[0006] 传统的稀疏表示模型存在混合像元和异物同谱等缺点,针对这些缺点提出的联合稀疏表示模型利用相邻光谱具备高度空间相关性这一特点,用相邻光谱在训练中的归属情况约束当前光谱的归属,却带来了另外一个难题—即不同对象交界处光谱分类混乱的现象。为解决这一问题,本发明提出了一种新的加权稀疏表示模型,将观察到的高光谱像素可以由来自结构化字典的一些训练样本的线性组合稀疏表示。未知像素的稀疏表示被表示为稀疏向量,其非零条目对应于所选训练样本的权重。通过求解稀疏约束优化问题来恢复稀疏向量,并且可以直接确定测试样本的类标签。引入相关系数与阈值的概念,该模型根据相邻光谱与当前光谱的相关性对相邻光谱赋予不同的权重值,从而改变邻域内不同光谱对当前光谱归属的约束程度,这种改变对不同对象交界处光谱的分类有着显著改善。

发明内容

[0007] 本发明是针对现有的高光谱图像分类方法中不同对象交界处光谱分类混乱的不足,提供一种基于稀疏表示的冠层植物高光谱图像分类方法。本发明使用SOMP算法,充分利用信号的稀疏性和光谱间的相关性,对不同对象交界处光谱的分类有着显著改善。
[0008] 本发明方法具体包括以下步骤:
[0009] 步骤(1)、数据预处理。
[0010] 1.1获取待分类植物高光谱图像
[0011] 1.2光谱单位化:
[0012] 对上述植物高光谱图像中每一条光谱进行单位化处理。
[0013] 1.3划分训练样本与测试样本:
[0014] 在步骤1.2单位化处理的高光谱图像数据按照样本包含M类对象中的每类对象15%比例作为训练样本A,其余85%为测试样本。
[0015]
[0016] 其中A的矩阵大小为D×N, Nm表示第m类对象的像元数目;Am表示第m类对象样本构成的字典,大小为D×Nm。
[0017]
[0018] 是第m类对象的第Nm条光谱
[0019]
[0020] αm表示与第m类对象训练样本对应的所有稀疏系数组成的稀疏矩阵,该矩阵只包含少数非零值。
[0021] 步骤(2)、建立加权联合稀疏模型
[0022] 相邻光谱的稀疏表示是基于相同的稀疏模型,具有相似的稀疏系数。空间相邻的高光谱遥感图像光谱可以近似通过一个构建的字典中若干原子的稀疏线性组合进行表示,但它们的表示系数是不同的。
[0023] 加权联合稀疏模型中,在交界处,我们认为相邻的高光谱光谱xi和xj由不同的对象构成。xi由构建的字典Ai表示为:
[0024] xi=Aiαi
[0025] xj由构建的字典Aj表示为:
[0026] xj=Ajαj
[0027] 同理,我们延伸到相邻光谱Nε包含T条光谱,采用同样的训练样本进行线性表示。在对高光谱图像对象交界处的对象类别进行判断时,常规的联合稀疏表示模型往往会忽略交界处相邻光谱间的差异,缺少对有效光谱与无效相邻光谱进行正确的判断,使得最终对对象交界处的对象类别进行了错误的判断。这里,我们引入了权重wi的概念,如图4所示。令X=[w1x1w2x2…wTxT],为D×T矩阵,其中{xt}t=1,...T∈Nε为高光谱空间相邻光谱。故X可以表示为:
[0028] X=[w1x1w2x2…wTxT]=[A1S1A2S2…AMSM]=[A1A2…AM][S1S2…SM]=AS[0029]
[0030] 其中,x1为当前待分类的光谱,x2…xT为以x1为中心的方形区域内的邻近光谱。wi表示第i条光谱的权重,T表示高光谱空间相邻光谱的个数,M表示对象的种类数,SM是X在第AM个训练字典下的稀疏向量。S是稀疏向量组成的稀疏矩阵。thr是判断相邻光谱是否有效的一个阈值,人为设定。对于x1和xi之间的相关系数不小于thr的光谱,我们认为它们与中心测试光谱非常形似,因此他们是有效光谱。因此,它们的权值被重置为1。对于x1和xi之间的相关系数小于thr的光谱,被认为是无效的相邻光谱,因此,它们的权值被重置为0。
[0031] 步骤(3)、求解稀疏矩阵
[0032] 给定训练字典A,矩阵S可以由下式的联合稀疏重构问题求得。
[0033] minimize||S||row,0
[0034] subjectto:AS=X
[0035] 其中符号||S||row,0表示稀疏矩阵S中非零行的个数。现在需要求S的最优解D×M的稀疏矩阵仅有少量非零行构成。根据实际情况,考虑到误差的影响,对 的求解也可写成以下形式:
[0036]
[0037]
[0038] 其中||·||F表示Frobenius范数。σ表示其误差容限,K0表示其稀疏条件的限制,表示非零元素的个数。与单光谱的稀疏表示重构一样,加权联合稀疏表示的求解问题也是一个NP‑Hard问题,可以通过联合正交匹配追踪算法(SOMP)进行稀疏重构问题的求解。
[0039] 步骤(4)、光谱分类
[0040] 一旦求得稀疏矩阵S,我们可以计算所有类别训练字典得到x的重构误差。那么x被第m类对象的训练字典重构的误差为:
[0041]
[0042] 表示第m类训练字典得到的稀疏矩阵的最优解。那么x的最终分类结果是重构误差最小的那类对象,即:
[0043]
[0044] 其中,rm(x)表示测试样本x与x在第m类对象中的稀疏表示 的二范数,该值越小,说明x越接近于第M类对象。
[0045] 本发明的有益效果:
[0046] 本发明引入一种新的加权稀疏表示模型,将观察到的高光谱像素可以由来自结构化字典的一些训练样本的线性组合稀疏表示,未知像素的稀疏表示被表示为稀疏向量,其非零条目对应于所选训练样本的权重,通过求解稀疏约束优化问题来恢复稀疏向量,并且可以直接确定测试样本的类标签,引入相关系数与阈值的概念,该模型根据相邻光谱与当前光谱的相关性对相邻光谱赋予不同的权重值,从而改变领域内不同光谱对当前光谱归属的约束程度,这种改变对不同对象交界处光谱的分类有着显著改善。附图说明:
[0047] 图1为加权联合稀疏表示模型;
[0048] 图2为权值的重置分布;(a)一小块土地的真实情况,浅灰色像素属于A类,深灰色像素属于b类;(b)理想分布;
[0049] 图3为示例数据的高光谱图像;
[0050] 图4为对象光谱随机抽样组成的字典;
[0051] 图5为示例数据用本发明所提方法得到的分类结果。

具体实施方式

[0052] 下面结合具体示例与附图对本发明作进一步的分析。
[0053] 本示例中,采用示例数据合成植物高光谱数据的高光谱图像,如图3所示。
[0054] 步骤(1)、数据预处理。
[0055] 1.1获取待分类植物高光谱图像。
[0056] 1.2光谱单位化:
[0057] 对上述植物高光谱图像中每一条光谱进行单位化处理。
[0058] 1.3划分训练样本与测试样本:
[0059] 在步骤1.2单位化处理的高光谱图像数据按照样本包含M类对象中的每类对象30%比例作为训练样本A,其余70%为测试样本(如图4所示)。
[0060]
[0061] 其中A的矩阵大小为D×N, Nm表示第m类对象的光谱数目;Am表示第m类对象样本构成的字典,大小为D×Nm。
[0062]
[0063] 是第m类对象在第Nm个光谱 αm表示与第m类对象训练样本对应的所有稀疏系数组成的稀疏矩阵,该矩阵只包含少数非零值。
[0064] 步骤(2)、建立加权联合稀疏模型
[0065] 相邻光谱的稀疏表示是基于相同的稀疏模型,具有相似的稀疏系数。空间相邻的高光谱遥感图像光谱可以近似通过一个构建的字典中若干原子的稀疏线性组合进行表示,但它们的表示系数是不同的。
[0066] 加权联合稀疏模型(如图1)中,在交界处,我们认为相邻的高光谱光谱xi和xj由不同的对象构成。xi由构建的字典Ai表示为:
[0067] xi=Aiαi
[0068] xj由构建的字典Aj表示为:
[0069] xj=Ajαj
[0070] 同理,我们延伸到相邻光谱Nε包含T条光谱,采用同样的训练样本进行线性表示。在对高光谱图像对象交界处的对象类别进行判断时,常规的联合稀疏表示模型往往会忽略交界处相邻光谱间的差异,缺少对有效光谱与无效相邻光谱进行正确的判断,使得最终对对象交界处的对象类别进行了错误的判断。这里,我们引入了权重wi的概念,如图2所示。令X=[w1x1w2x2…wTxT],为D×T矩阵,其中{xt}t=1,...T∈Nε为高光谱空间相邻光谱。故X可以表示为:
[0071] X=[w1x1w2x2…wTxT]=[A1S1A2S2…AMSM]=[A1A2…AM][S1S2…SM]=AS[0072]
[0073] 其中,x1为当前待分类的光谱,x2…xT为以x1为中心的方形区域内的邻近光谱。xi表示第i个测试样本,wi表示第i个测试样本的权重,T表示高光谱空间相邻光谱的个数,M表示对象的种类数,SM是X在第AM个训练样本下的稀疏向量。S是稀疏向量组成的稀疏矩阵。wi为不同光谱的权值。thr是判断相邻光谱是否有效的一个参数。对于x1和xi之间的相关系数不小于thr的光谱,我们认为它们与中心测试光谱非常形似,因此他们是有效光谱。因此,它们的权值被重置为1。对于x1和xi之间的相关系数小于thr的光谱,被认为是无效的相邻光谱,因此,它们的权值被重置为0。
[0074] 步骤(3)、求解稀疏矩阵
[0075] 给定训练字典A,矩阵S可以由下式的联合稀疏重构问题求得。
[0076] minimize||S||row,0
[0077] subject to:AS=X
[0078] 其中符号||S||row,0表示稀疏矩阵S中非零行的个数。现在需要求D×M的稀疏矩阵仅有少量非零行构成。根据实际情况,考虑到误差的影响,对 的求解也可写成以下形式:
[0079]
[0080]
[0081] 其中||·||F表示Frobenius范数。σ表示其误差容限,K0表示其稀疏条件的限制,表示非零元素的个数。与单光谱的稀疏表示重构一样,加权联合稀疏表示的求解问题也是一个NP‑Hard问题,可以通过联合正交匹配追踪算法(SOMP)进行稀疏重构问题的求解。
[0082] 步骤(4)、光谱分类
[0083] 一旦求得稀疏矩阵S,我们可以计算所有类别训练字典得到x的重构误差。那么x被第m类对象的训练字典重构的误差为:
[0084]
[0085] 表示第m类训练字典得到的稀疏矩阵的最优解。那么x的最终分类结果是重构误差最小的那类对象,即:
[0086]
[0087] 其中,rm(x)表示测试样本x与x在第m类对象中的稀疏表示 的二范数,该值越小,说明x越接近于第M类对象。结果如图5所示。
[0088] 综上所述,本发明提出的方法极大的解决了植物高光谱图像传统稀疏表示分类中存在的混合光谱和异物同谱现象,也极大程度上改善了联合稀疏表示分类中存在的不同对象交界处光谱的分类困难的问题,为将来高精确的植物高光谱图像分类的发展提供了极大的支持。