一种基于改进支持向量机相关反馈的遥感图像检索方法转让专利

申请号 : CN201010552367.6

文献号 : CN102467564B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 唐家奎赵理君于新菊米素娟张成雯李勇志王后茂王春磊

申请人 : 中国科学院烟台海岸带研究所

摘要 :

本发明涉及一种基于改进支持向量机相关反馈的遥感图像检索方法包括以下步骤:建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离,并按照该距离大小,从小到大排序返回规定数目的遥感图像作为初始检索的结果;相关反馈:对初始检索的结果进行评价,如果满意则检索结束。本发明很好地解决了原有基于支持向量机的相关反馈算法在检索结果排序上存在的问题,可用于遥感图像检索相关的多个应用领域,尤其是高维特征空间的分类识别问题,可有效提高遥感图像检索的精度和检索结果排序的合理性。

权利要求 :

1.一种基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于包括以下步骤:(1)建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;

(2)在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;

(3)基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离,并按照该距离大小,从小到大排序返回规定数目的遥感图像作为初始检索的结果;

(4)相关反馈:对初始检索的结果进行评价,如果满意则检索结束;遥感图像特征提取包括以下步骤:(2-1)颜色特征提取:从遥感图像数据库的所有遥感图像中选择三个波段作为彩色空间中R,G,B三个通道的分量,分别计算遥感图像数据库中每个遥感图像三个颜色分量的均值和方差,并以此构造颜色特征向量;

(2-2)Gabor纹理特征提取:分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,并构成Gabor纹理特征向量;

(2-3)小波纹理特征:对遥感图像数据库中所有遥感图像进行多级小波分解,并舍去低频信息的子图像,对剩余的子图像计算其熵值和能量值构成小波纹理特征向量;

(2-4)灰度共生矩阵的纹理特征提取:分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向、相邻距离为d的灰度共生矩阵,然后基于所得到的灰度共生矩阵分别计算其对比度,能量和相关性构成灰度共生矩阵的纹理特征向量,d为正整数;

(2-5)光谱特征提取:分别计算遥感图像数据库中所有遥感图像的各种光谱指数,并构成光谱特征向量。

2.按权利要求1所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于所述相关反馈的步骤如下:(4-1)用户反馈:由用户标记出与查询遥感图像相似的相关遥感图像和与查询遥感图像不相似的不相关遥感图像;

(4-2)构造训练样本:将相关遥感图像作为正类样本,不相关遥感图像作为负类样本;

(4-3)训练SVM分类器:将上述正类样本和负类样本作为训练样本进行SVM学习,得到一个代表用户检索目标的SVM分类器;

(4-4)图像数据库图像分类:利用SVM分类器对遥感图像数据库中的所有遥感图像进行分类,得到正类和负类两个类别;

(4-5)运用相关反馈的相似性度量准则,针对正类和负类遥感图像分别运用不同的相似性度量计算公式,计算得到图像库中遥感图像与查询图像的相似度。

3.按权利要求2所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于:相关反馈中计算正类遥感图像的相似性的公式为:

D(I)=wSVMDSVM(I)+wSimDSim(I)DSVM(I)=1/f(x),f(x)≥0

相关反馈中计算负类遥感图像的相似性的公式为:

D(I)=wSVM DSVM(I)+wSim DSim(I)-f(x)

DSVM(I)=e ,f(x)<0

其中,I为遥感图像库中的遥感图像;D(I)为相关反馈中的相似性度量函数;f(x)为SVM的分类超平面函数;DSVM(I)为关于SVM的分类超平面函数的函数,用于衡量图像I与查询图像的相似度;DSim(I)为欧式空间中度量视觉特征相似性的距离函数,用于计算图像I与查询图像的相似性距离;wSVM和wSim分别是DSVM(I)和DSim(I)的权值。

4.按权利要求2所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于:如果正类遥感图像数多于所需的相似图像数目,则只对正类图像运用针对正类的相似性度量公式,否则,在对正类图像进行相似性计算排序后,再对负类图像运用其相应的相似性度量公式,并进行相似性排序,在正类图像之后依序补充不足所需的相似图像数目的部分。

5.按权利要求1所述的基于改进支持向量机相关反馈的遥感图像检索方法,其特征在于所述的检索结果评价包括如下评价指标:(i) (i)

假设Q1,…,Qq为查询图像,对第i个查询图像Qi,I1 ,…,Iai 为正确的检索结果,(i) (i) (i) (i)J1 ,…,Jbi 为错误的检索结果,设rank(Ij )为Ij 在检索结果的排序值,则(5-1)查准率 该指标指平均每一次相关反馈中正确的检索结果(即相关图像)数占所返回结果中图像总数目(包括正确的检索结果数和错误的检索结果数)的百分比;

该指标定义了所有相关图像在结果中排在靠

前位置的紧密程度;

该指标反映的是所有相关图像在检索结果中

的排序平均值,该值越小越好。

说明书 :

一种基于改进支持向量机相关反馈的遥感图像检索方法

技术领域

[0001] 本发明涉及计算机图像检索技术领域,具体的说是一种基于改进支持向量机相关反馈的遥感图像检索方法。

背景技术

[0002] 基于内容的遥感图像检索(Content-based Remote Sensing Image Retrieval,CBRSIR),即所谓的“图找图”,它是在基于内容的图像检索(Content-based ImageRetrieval,CBIR)的基础上发展起来的一种新的媒体信息检索技术。它通过提取遥感图像中的视觉特征(颜色、形状、纹理、光谱等)来表达图像的内容。从媒体内容中提取信息线索,利用近似匹配技术,以相关反馈为有效手段,实现在大型数据库的快速检索。而要想满足遥感图像检索的精度要求,必须加入相关反馈技术,由简单的一次检索转向交互学习的多次检索。(参考文献:R.LUO,Y.S.ZHANG,Y.H.FAN,et al.Research on content-based remote sensing image retrieval the strategy for visual feature selection,
extraction,description and similarity measurement[C]//2001 International
Conferences on Info-tech and Info-net,Beijing,2001,vol.1:321-325.[罗睿,张永生,范永红,等.基于内容的遥感图像检索研究:视觉特征选择,提取,描述和相似性度量策略[C]//2001年国际信息科技与信息网络大会,北京,2001,第1卷:321-325.])
[0003] 相关反馈(Relevance Feedback,RF)是指按照最初的查询条件,查询系统返回给用户查询结果,用户可以人为介入(或者自动)来选择几个最符合他查询意图的返回结果(正反馈),也可以选择最不符合他查询意图的几个返回结果(负反馈)。这些反馈信息被送入系统用来更新查询条件,重新进行查询。从而让随后的搜索更符合查询者的真实意图。图像检索中的相关反馈也是一个人机交互的过程,用户根据系统的初始检索结果,标记出相关和不相关图像,检索系统根据这个反馈信息调整检索方式,再次给出检索结果,如此反复,直到用户满意为止。通过相关反馈过程,图像检索的精度可以得到有效地提高。(参考文献:Yong Rui,T.S.Huang,M.Ortega,S.Mehrotra.Relevance feedback:a power tool for interactive content-based image retrieval[J].IEEE Transactions on Circuits and Systems for Video Technology,1998,8(5):644-655.[芮勇,托马斯·黄,迈克尔·奥尔特加,沙拉德特拉·贝克曼.相关反馈:交互式基于内容图像检索的强大工具[J].
IEEE会刊——关于视频技术的电路与系统,1998,8(5):644-655.];Karthik P.Suman,C.V.Jawahar.Analysis of Relevance Feedback in Content Based Image Retrieval.[C]//9th International Conference on Control,Automation,Robotics and Vision,Singapore,2006:1-6.[卡斯克·皮·苏曼,贾瓦.基于内容的图像检索的相关反馈分析[C]//第九届国际控制,自动化,机器人及视觉大会,新加坡,2006:1-6.])
[0004] 视觉特征相似性度量是一个距离函数,通过遥感图像特征值的之间的距离来判断图像之间的相似性。它将数据库中每幅遥感图像看作高维空间中的一个点,使用欧几里德距离(欧式距离)等距离公式计算查询图像和数据库中遥感图像的视觉特征的相似度。距离较近的遥感图像与查询图像的特征较相似,距离较远的图像则与查询图像的特征差异较大。现在常用的相似性度量方法有:欧几里得距离(Euclid)、马氏距离(Mahalanobis)、二次式距离(Quadratic)以及直方图交(Histogram Intersection)等。(参考文献:Q.BAO,P.GUO.Comparative studies on similarity measures for remote sensing imageretrieval[C]//IEEE International Conference on Systems,Man and Cybernetics,Hague,2004:1112-1116.[包倩,郭平.遥感图像检索中相似性度量方法的比较研究[J].IEEE国际系统,人类与控制论大会,海牙(荷兰),2004:1112-1116.];陈兴峰.基于内容的遥感图像数据库检索研究及实现[D].电子科技大学,2008.)
[0005] 支持向量机(Support Vector Machine,SVM)是Vladimir N.Vapnik等人提出的一种基于统计学习理论的机器学习算法。由于SVM有统计学习理论作为其坚实的数学基础,是基于结构风险最小化准则的,因此其推广能力明显优于一些传统的学习方法,可以较好地解决小样本、非线性问题以及克服维数灾难和过拟合等传统算法所不可规避的问题。其核心思想是采用最大间隔分类面思想和基于核的方法,通过在原空间或经投影后在高维空间中构造最优分类面,将给定的属于两个类别的训练样本分开,构造超平面的依据是两类样本离超平面的距离最大化,表现出了很好的泛化能力。(参考文献:Vapnik V N.Statistical Learning Theory[M].New York:Wiley,1998.[弗拉基米尔·维普尼克.统计学习理论[M].纽约:威利,1998.];Vapnik V N.The nature of statistical learning theory[M].New York:Springer-Verlag,1999.[弗拉基米尔·维普尼克.统
计学习理论的本质[M].纽约:斯普林格出版社,1999.];Cristianini N,Shawe Taylor J.An introduction to support vector machine[M].New York:Cambridge University Press,2000.[克里斯蒂亚尼尼,绍依·泰勒.支持向量机导论[M].纽约:剑桥大学出版社,
2000.])
[0006] 基于支持向量机的相关反馈是将支持向量机理论与传统的遥感图像检索相关反馈过程相结合的产物,将遥感图像检索的相关反馈过程看作模式识别的二分类问题,从而很好地发挥支持向量机的强大分类学习功能。具体来讲,就是将检索结果图像作为训练样本,由用户标记出正例样本(其他为反例样本),并与旧的正例集合组成一个新的正例集合,而反例样本则与旧的反例集合组成一个新的反例集合。通过对这些正例和反例进行SVM学习,可以得到一个代表用户检索目标的SVM分类器。然后用该分类器对图像库中的所有遥感图像进行分类,对于分为正类的遥感图像,求出每幅图像相对于分类面的距离,离分类面越远的图像就越接近查询样例,按此距离从大到小再次排序返回结果。目前,这种基于支持向量机相关反馈的遥感图像检索技术能够充分挖掘用户的语义信息,根据用户提供的反馈信息来学习用户的检索要求,从而进一步提高遥感图像检索的精度。(参考文献:Lei Zhang,Fuzong,Lin Bo.Support vector machine learning for image retrieval[C]//Proceedings of 2001 International Conference on Image Processing,Thessaloniki,2001,vol.2:721-724.[张磊,林福宗,博林.图像检索的支持向量机学习[C]//2001年国际图像处理大会,萨罗尼加(希腊),2001,第2卷:721-724.];Xuejun Wang,Lingling Yang.Application of SVM Relevance Feedback Algorithms in Image Retrieval[C]//International Symposium on Information Science and Engineering,Shanghai,2008,vol.1:210-213.[王学军,杨玲玲.基于支持向量机的相关反馈算法在图像检索中的应用[C]//国际信息科学与工程专题论文集,上海,2008,第1卷:210-213.])
[0007] 虽然这种基于支持向量机相关反馈的遥感图像检索算法能够根据用户提供的小样本进行学习并构造代表用户检索目标的分类器,并通过这一分类器对图像库中的所有图像进行相似性大小的判别,进而有效地提高图像检索的精度,很好地解决了图像低层视觉特征与用户查询的高层语义特征之间的“鸿沟”。但是,该算法没有考虑到返回的检索结果图像在排序上的先后顺序问题,即这种策略有时在返回检索结果时,会将不相关遥感图像排在前面,而相关遥感图像则被排在了后面。
[0008] 视觉特征相似性度量函数能够抓住遥感图像的视觉特征信息,对于具有相似特征的同类图像具有很好的聚类作用,且在特征区分度较高的情况下,能够将视觉特征相似的遥感图像排序在一起。尽管这种方法对于特征差异明显的遥感图像能够很好地在欧式空间中进行区分,但对于特征相近但语义类别不同的遥感图像则区分效果欠佳。与基于支持向量机的相关反馈分类方法相比,缺少通过对特征空间维度变化来增加特征区分度的能力。

发明内容

[0009] 针对上述现有技术中存在的遥感图像检索及模式识别领域的问题,由于往往因为相关反馈的相似性度量策略不同,其反馈检索的结果在内容和顺序上具有一定的差异,本发明要解决的技术问题是提供一种既提高遥感图像检索精度,又能够将检索结果进行合理排序的相关反馈策略的基于改进支持向量机相关反馈的遥感图像检索方法。
[0010] 为解决上述技术问题,本发明采用的技术方案是:
[0011] 本发明一种基于改进支持向量机相关反馈的遥感图像检索方法包括以下步骤:
[0012] (1)建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;
[0013] (2)在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;
[0014] (3)基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离,并按照该距离大小,从小到大排序返回规定数目的遥感图像作为初始检索的结果;
[0015] (4)相关反馈:对初始检索的结果进行评价,如果满意则检索结束。
[0016] 遥感图像特征提取包括以下步骤:
[0017] (2-1)颜色特征提取:从遥感图像数据库的所有遥感图像中选择三个波段作为彩色空间中R,G,B三个通道的分量,分别计算遥感图像数据库中每个遥感图像三个颜色分量的均值和方差,并以此构造颜色特征向量;
[0018] (2-2)Gabor纹理特征提取:分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,并构成Gabor纹理特征向量;
[0019] (2-3)小波纹理特征:对遥感图像数据库中所有遥感图像进行多级小波分解,并舍去低频信息的子图像,对剩余的子图像计算其熵值和能量值构成小波纹理特征向量;
[0020] (2-4)灰度共生矩阵的纹理特征提取:分别计算遥感图像数据库中所有遥感图像在图像坐标多个方向、相邻距离为d的灰度共生矩阵,然后基于所得到的灰度共生矩阵分别计算其对比度,能量和相关性构成灰度共生矩阵的纹理特征向量,d为正整数;
[0021] (2-5)光谱特征提取:分别计算遥感图像数据库中所有遥感图像的各种光谱指数,并构成光谱特征向量。
[0022] 所述相关反馈的步骤如下:
[0023] (4-1)用户反馈:由用户标记出与查询遥感图像相似的相关遥感图像和与查询遥感图像不相似的不相关遥感图像;
[0024] (4-2)构造训练样本:将相关遥感图像作为正类样本,不相关遥感图像作为负类样本;
[0025] (4-3)训练SVM分类器:将上述正类样本和负类样本作为训练样本进行SVM学习,得到一个代表用户检索目标的SVM分类器;
[0026] (4-4)图像数据库图像分类:利用SVM分类器对遥感图像数据库中的所有遥感图像进行分类,得到正类和负类两个类别;
[0027] (4-5)运用相关反馈的相似性度量准则,针对正类和负类遥感图像分别运用不同的相似性度量计算公式,计算得到图像库中遥感图像与查询图像的相似度。
[0028] 相关反馈中计算正类遥感图像的相似性的公式为:
[0029] D(I)=wSVMDSVM(I)+wSimDSim(I)
[0030] DSVM(I)=1/f(x),f(x)≥0
[0031] 相关反馈中计算负类遥感图像的相似性的公式为:
[0032] D(I)=wSVMDSVM(I)+wSimDSim(I)
[0033] DSVM(I)=e-f(x),f(x)<0
[0034] 其中,I为遥感图像库中的遥感图像;D(I)为相关反馈中的相似性度量函数;f(x)为SVM的分类超平面函数;DSVM(I)为关于SVM的分类超平面函数的函数,用于衡量图像I与查询图像的相似度;DSim(I)为欧式空间中度量视觉特征相似性的距离函数,用于计算图像I与查询图像的相似性距离;wSVM和wSim分别是DSVM(I)和DSim(I)的权值。
[0035] 如果正类遥感图像数多于所需的相似图像数目,则只对正类图像运用针对正类的相似性度量公式,否则,在对正类图像进行相似性计算排序后,再对负类图像运用其相应的相似性度量公式,并进行相似性排序,在正类图像之后依序补充不足所需的相似图像数目的部分。
[0036] 所述的检索结果评价包括如下评价指标:
[0037] 假设Q1,…,Qq为查询图像,对第i个查询图像Qi,I1(i),…,Iai(i)为正确的检索(i) (i)结果,J1 ,…,Jbi 为错误的检索结果,设 为 在检索结果的排序值,则
[0038] (5-1)查准率 该指标指平均每一次相关反馈中正确的检索结果(即相关图像)数占所返回结果中图像总数目(包括正确的检索结果数和错误的检索结果数)的百分比;
[0039] (5-2) 该指标定义了所有相关图像在结果中排在靠前位置的紧密程度;
[0040] (5-3) 该指标反映的是所有相关图像在检索结果中的排序平均值,该值越小越好。
[0041] 本发明具有以下有益效果及优点:
[0042] 1.解决了遥感图像检索中单纯依靠视觉特征相似性度量函数进行检索时出现的“相似特征,不同类别图像”的问题,以及单纯基于支持向量机相关反馈过程中的依靠分类器决策函数作为相似性度量准则在检索结果排序上的缺陷。本发明采用了将SVM中分类超平面函数和视觉特征相似性的距离度量函数线性加权相结合,既利用了SVM核函数的思想将原特征空间中的点投影到一个高维空间中去,使这些点在该高维空间中可以更加容易地区分开来,进而利用了SVM分类器的分类结果,又考虑到了图像本身的视觉特征信息,从而很好地解决了原有基于支持向量机的相关反馈算法在检索结果排序上存在的问题。
[0043] 2.广泛的应用。本发明方法可以用于遥感图像检索相关的多个应用领域,尤其是高维特征空间的分类识别问题,如遥感图像地物判别、图像目标识别等,可有效提高遥感图像检索的精度和检索结果排序的合理性。

附图说明

[0044] 图1为本发明检索方法流程图;
[0045] 图2为本发明方法中相关反馈过程中相似性度量策略示意图;
[0046] 图3A为以TM(Thematic Mapper,一种卫星传感器)遥感图像4、3、2波段合成的查询图像;
[0047] 图3B为以TM遥感图像4、3、2波段合成的基于图像视觉特征相似性度量的初始检索结果;
[0048] 图3C为以TM遥感图像4、3、2波段合成的仅基于SVM相关反馈的结果图像;
[0049] 图3D为以TM遥感图像4、3、2波段合成的基于SVM决策函数和视觉特征相似性度量相结合的相关反馈的结果图像。

具体实施方式

[0050] 本发明提出了一种基于内容遥感图像检索相关反馈过程中相似性度量策略的新方法,即将SVM和视觉特征相似性度量相结合。其目的是在保证相关反馈的检索精度的同时,增强对检索结果图像的排序能力,针对特征相似性度量方法和基于SVM的相关反馈方法各自所存在的优缺点,将两种遥感图像相似性度量策略相结合,提出了将SVM中分类超平面函数同视觉特征相似性度量的距离函数线性加权的遥感图像检索的相关反馈方法。该方法可使相关反馈后的检索结果在保证检索精度的情况下,在排序上更加合理,并符合用户的检索目标。本发明实现方法首先对遥感图像进行特征提取,包括颜色、纹理、光谱等特征,然后利用视觉特征相似性度量函数计算图像库中的遥感图像与查询图像在特征空间的距离,按照相似性从大到小(距离从小到大)依次排列返回给用户,完成初始检索。然后由用户对初始检索结果进行反馈,为SVM的训练分类器提供训练样本,从而利用训练得到的SVM分类器对遥感图像库中的所有图像进行分类,判别得到正类和负类的遥感图像,再将SVM中分类超平面函数同视觉特征相似性度量的距离函数线性加权作为相关反馈过程的相似性度量策略,针对正类和负类遥感图像分别采用相应的相似度计算表达式进行相似性排序再次将检索结果返回给用户。对TM多光谱遥感图像(如图3A所示)进行基于视觉特征相似性度量的初始检索(如图3B所示),然后分别采用基于SVM的相关反馈策略(如图3C
所示)和本发明提出的基于SVM和视觉特征相似性度量相结合的反馈策略(如图3D所示)
进行相关反馈,并给出了检索及反馈结果的评价方法。实验结果表明,基于SVM和视觉特征相似性度量相结合的相关反馈方法能够在保证检索精度的同时,更加合理地对检索结果图像进行排序,使用户需要的相关图像排在不相关图像之前,实现面向用户需求的检索目标。
[0051] 下面结合说明书附图对本发明作进一步阐述。
[0052] 如图1所示,基于改进支持向量机相关反馈的遥感图像检索方法包括以下步骤:
[0053] (1)建立遥感图像数据库,并从库中选择一幅满足检索目标的图像作为查询图像;
[0054] 用户首先需要建立待检索遥感图像库,以TM(Thematic Mapper,一种卫星传感器)遥感图像为例,选取分辨率、图像大小、波段数目均相同的TM遥感图像多幅,组成待检索图像库;
[0055] (2)在上述遥感图像数据库中进行遥感图像特征提取,得到特征向量;
[0056] (3)基于上述特征向量,计算遥感图像库中图像与查询图像特征向量的欧式距离,并按照该距离大小,从小到大排序返回遥感图像库中的遥感图像,数目为K(本实施例取K=20),K为正整数;
[0057] (4)相关反馈:由用户对上述查询的结果进行评价,如果满意则检索结束;否则,由用户进行结果反馈。
[0058] 步骤(2)遥感图像特征提取包括以下步骤:
[0059] (2-1)颜色特征提取:从遥感图像数据库的所有遥感图像中选择三个波段作为彩色空间中R,G,B三个通道的分量(本实施例采用TM4,3,2波段),分别计算每个遥感图像三个颜色分量的均值和方差,并以此构造颜色特征向量;
[0060] (2-2)Gabor纹理特征提取:分别计算遥感图像数据库中的所有遥感图像在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,并构成Gabor纹理特征向量;本实施例用四个方向上(0,π/4,π/2,3π/4),三种空间频率;
[0061] (2-3)小波纹理特征:对遥感图像数据库中的所有遥感图像进行多级(本实施例为三级)小波分解,并舍去低频信息的子图像,对剩余的子图像计算其熵值和能量值构成小波纹理特征向量;
[0062] (2-4)灰度共生矩阵的纹理特征提取:分别计算遥感图像数据库中的所有遥感图像在多个方向(本实施例用四个方向:0,π/4,π/2,3π/4)、相邻距离为d(本实施例取d=5)的灰度共生矩阵,然后基于所得到的灰度共生矩阵分别计算其对比度,能量和相关性构成灰度共生矩阵的纹理特征向量向量,其中d为正整数;
[0063] (2-5)光谱特征提取:分别计算遥感图像数据库中的所有遥感图像的各种光谱指数,并构成光谱特征向量;如表达植被特征的指数NDVI(Normalized Difference of Vegetation Index),描述建筑物特征的指数NDBI(Normalized Difference of Building Index),表达水体光谱特征的NDWI(Normalized Difference of Water Index),则:
[0064]
[0065]
[0066] NDWI=(DNTM2+DNTM3)-(DNTM4+DNTM5)
[0067] 其中,DNTM2、DNTM3、DNTM4、DNTM5分别是TM遥感图像第2、3、4、5波段的灰度值。
[0068] 步骤(4)相关反馈的实现流程如图2所示:
[0069] (4-1)用户反馈:由用户标记出与查询图像相似的相关图像和与查询图像不相似的不相关图像;
[0070] (4-2)构造训练样本:将相关的遥感图像作为正类样本,不相关的作为负类样本;
[0071] (4-3)训练SVM分类器:根据训练样本进行SVM学习,得到一个代表用户检索目标的SVM分类器f(x);
[0072] (4-4)图像库图像分类:利用SVM分类器对图像库中的所有遥感图像进行分类,得到正类和负类两个类别;
[0073] (4-5)运用相关反馈的相似性度量准则:针对正类和负类遥感图像分别运用不同的相似性度量计算公式,如果正类图像数多于K幅,则只对正类图像运用针对正类的相似性度量公式,否则,在对正类图像进行相似性计算排序后,再对负类图像运用其相应的相似性度量公式,并进行相似性排序,在正类图像之后依序补充不足K幅的部分;
[0074] 相关反馈中计算正类图像的相似性的公式为:
[0075] D(I)=wSVMDSVM(I)+wSimDSim(I)
[0076] DSVM(I)=1/f(x),f(x)≥0
[0077] 相关反馈中计算负类图像的相似性的公式为:
[0078] D(I)=wSVMDSVM(I)+wSimDSim(I)
[0079] DSVM(I)=e-f(x),f(x)<0
[0080] 其中,I是遥感图像库中的图像;D(I)是本发明提出的相关反馈中的相似性度量函数;f(x)是SVM的分类超平面函数;DSVM(I)是关于SVM的分类超平面函数的函数,用于衡量图像I与查询图像的相似度;DSim(I)是欧式空间中度量视觉特征相似性的距离函数,用于计算图像I与查询图像的相似性距离;wSVM和wSim分别是DSVM(I)和DSim(I)的权值。
[0081] 步骤(5)检索结果评价包括如下评价指标:
[0082] 假设Q1,…,Qq为查询图像,对第i个查询图像Qi,I1(i),…,Iai(i)为正确的检索结果,k为返回的遥感图像的数目,设 为 在检索结果的排序值,则
[0083] (5-1)查准率 该指标指平均每一次相关反馈中被正确判别为与查询图像相似的遥感图像数占所返回的遥感图像(包括被正判和错判为与查询图像相似的遥感图像)总数目k的百分比;
[0084] (5-2) 该指标定义了所有相关图像在结果中排在靠前位置的紧密程度,如果全部排在最前面,则该指标为1.0;
[0085] (5-3) 该指标反映的是所有相关图像在检索结果中的排序平均值,该值越小越好。
[0086] 图3A~3D为本发明中以TM多光谱图像为例的遥感图像检索相关反馈结果图像,其中图3A为以4、3、2波段合成的查询图像;图3B为以4、3、2波段合成的基于图像视觉特征相似性度量的初始检索结果;图3C为以4、3、2波段合成的仅基于SVM相关反馈的结果图像;图3D为以4、3、2波段合成的基于SVM决策函数和视觉特征相似性度量相结合的相关反馈的结果图像。
[0087] 本发明方法的实现原理如下:
[0088] 视觉特征相似性度量的理论基础
[0089] 视觉特征相似性度量是一个距离函数,通过遥感图像特征值的之间的距离来判断图像之间的相似性。它将数据库中每幅遥感图像看作高维空间中的一个点,使用欧几里德距离等距离公式计算查询图像和数据库中遥感图像的视觉特征的相似度。距离较近的遥感图像与查询图像的特征较相似,距离较远的图像则与查询图像的特征差异较大。
[0090] 假设遥感图像的特征向量为F=[fcolor,fgabor,fwavelet,fco-occurrence,fspectrum],其中F中的各特征分量fcolor,fgabor,fwavelet,fco-occurrence和fspectrum分别颜色特征向量,Gabor纹理特征向量,小波纹理特征向量,灰度共生矩阵的纹理特征向量和光谱特征向量,且均为行向量,则两幅遥感图像之间视觉特征相似性度量的计算可以表示为:
[0091]
[0092] 其中:F1和F2分别为两幅遥感图像的特征向量,DSim为这两幅遥感图像之间视觉特征的相似度。
[0093] SVM的理论基础
[0094] SVM是一种基于统计学习理论的机器学习算法,其核心思想是采用最大间隔分类面思想和基于核的方法,通过在原空间或经投影后在高维空间中构造最优分类面,将给定的属于两个类别的训练样本分开,构造超平面的依据是两类样本离超平面的距离最大化,表现出了很好的泛化能力。n l n
[0095] 给定训练集T={x1,y1),…,(xl,yl)}∈(R×Y),其中训练数据xi∈R,其相应的类标号yi∈Y={1,-1},i=1,…,l。这样,求解最优分类超平面的问题可以归结为以下的二次规划问题:
[0096]
[0097]
[0098] ξi≥0,i=1,…,l
[0099] 其中,Φ(x)是一个从输入空间Rn到特征空间的映射,用于将训练数据x投影到一个高维空间中去;ξi是松弛系数,它允许出现错分的样本;C是惩罚参数,它控制着对错分样本的惩罚程度。最后,可以得到上述公式(1)的对偶形式为:
[0100]
[0101]
[0102] 0≤αi≤C,i=1,…,l
[0103] 其中,K(xi,xj)是核函数,可表示为K(xi,xj)=Φ(xi)·Φ(xj)。通过求解(2),*可以得到 选取位于区间(0,C)中的α 的分量 据此可计算出分类超
平面函数为:
[0104]
[0105]
[0106] 基于SVM的相关反馈的理论基础
[0107] 基于SVM的相关反馈将遥感图像检索的相关反馈过程看作模式识别中的二分类问题,将相关遥感图像构成正类集合,将不相关图像构成负类集合,通过对这些正类和负类样本的学习,得到一个代表用户检索目标的SVM分类器。
[0108] 本发明对传统的基于SVM的相关反馈方法进行了改进,与传统反馈方法的不同之处在于相关反馈过程中相似性度量策略。将基于SVM的相关反馈过程中的遥感图像相似性度量策略进行了改进,将原有的SVM分类超平面函数与视觉特征相似性度量函数进行线性加权相结合,权重根据具体的应用进行经验调整,以结合后的相似性度量策略进行遥感图像的相似性排序。因为本发明既利用了SVM核函数的思想将原特征空间中的点投影到一个高维空间中去,使这些点在该高维空间中可以更加容易地区分开来,进而利用了SVM分类器的分类结果,又考虑到了图像本身的视觉特征信息,从而很好地解决了原有基于支持向量机的相关反馈算法在检索结果排序上存在的问题。