一种基于经验模态分解的多分组图像有监督分类方法转让专利

申请号 : CN201010102438.2

文献号 : CN101799873B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 沈毅张淼王艳金晶林玉荣

申请人 : 哈尔滨工业大学

摘要 :

一种基于经验模态分解的多分组图像有监督分类方法,属于图像处理领域,本发明为解决现有的有监督分类方法对特征利用不充分,分类精度低的问题。本发明方法包括以下步骤:一、对各像素的特征向量进行经验模态分解,得到扩展特征向量;二、将各像素的原始特征向量及其扩展特征向量按统一规则结合,得到扩维特征向量;三、对支持向量机进行训练,然后对扩维测试特征向量的类别进行归属判定,形成多个支持向量机子分类器;四、构建基于一对一策略的多分类器对各像素的归属类别作出决策,完成多分组图像的分类。本发明用于需要高精度分类的多分组图像模式识别应用。

权利要求 :

1.一种基于经验模态分解的多分组图像有监督分类方法,其特征在于,该方法包括以下步骤:步骤一:对多分组图像中训练向量的各像素特征曲线所构成的训练特征向量进行经验模态分解,得到训练向量各像素的扩展训练特征向量;

对多分组图像中测试向量的各像素特征曲线所构成的测试特征向量进行经验模态分解,得到测试向量各像素的扩展测试特征向量;

获得扩展训练特征向量或扩展测试特征向量的方法为:

设定输入向量信号为x(t),其中,1≤t≤N,N为多分组图像的波段总数,设定rn(t)为第n次本征模态函数分解的剩余趋势函数,hnk(t)为第n次分解的剩余趋势函数中经过第k次筛选后的剩余函数,步骤a、初始化n=0,且输入信号x(t)未经过本征模态函数分解的剩余趋势函数r0(t)=x(t),步骤b、初始化k=0,且输入信号x(t)经过第1次本征模态函数分解中第0次筛选后的剩余函数h10(t)=r0(t),步骤c、根据筛选程序获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k次筛选后的剩余函数hnk(t),步骤d、采用标准偏差准则判断输入信号x(t)经过第n次本征模态函数分解中经过第k次筛选后的剩余函数hnk(t)是否满足本征模态函数的条件,即是否小于阈值T,0.2≤T≤0.3;

判断结果为是,执行步骤e,判断结果为否,则k=k+1,然后执行步骤c,步骤e、提取一个本征模态函数分量cn(t)=hnk(t),步骤f、获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数rn(t)=rn-1(t)-cn(t),步骤g、判断剩余趋势函数rn(t)是否为单调函数,

判断结果为否,则n=n+1,然后执行步骤b,判断结果为是,获得结果向量为rn(t);

当输入向量信号x(t)为训练特征向量时,获得的结果向量rn(t)为扩展训练特征向量;输入向量信号x(t)为测试特征向量时,获得的结果向量rn(t)为扩展测试特征;

步骤二:将多分组图像中训练向量各像素的原始训练特征向量及与其对应的扩展训练特征向量结合成平滑的扩维特征训练向量;

将多分组图像中测试向量各像素的原始测试特征向量及与其对应的扩展测试特征向量结合成平滑的扩维特征测试向量;

步骤三:利用扩维特征训练向量及其所对应像素的归属类别对支持向量机进行训练,获得支持向量机的相关参数,即:支持向量和拉格朗日乘子,然后结合所述相关参数,并利用已训练完毕的支持向量机对扩维特征测试向量所对应像素的类别进行归属判定,形成多个支持向量机子分类器;

步骤四:利用所述多个支持向量机子分类器构建基于一对一策略的多分类器,并依据决策函数对扩维测试特征向量的各像素的归属类别作出决策,完成多分组图像的分类。

2.根据权利要求1所述的一种基于经验模态分解的多分组图像有监督分类方法,其特征在于,步骤c根据筛选程序获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k次筛选后的剩余函数hnk(t)的过程为:步骤c1、利用三次样条函数获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k-1次筛选后的剩余函数hn(k-1)(t)的上、下包络,步骤c2、计算所述剩余函数hn(k-1)(t)上、下包络曲线在各个t的均值步骤c3、获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k次筛选后的剩余函数

3.根据权利要求1所述的一种基于经验模态分解的多分组图像有监督分类方法,其特征在于,步骤d中T=0.25。

4.根据权利要求1所述的一种基于经验模态分解的多分组图像有监督分类方法,其特征在于,步骤二获取扩维特征训练向量的方法为:将多分组图像中训练向量每个像素的扩展训练特征向量的曲线左右翻转后连接在该像素的原始训练特征向量的曲线右侧。

获取扩维特征测试向量的方法为:

将多分组图像中测试向量每个像素的扩展测试特征向量的曲线左右翻转后连接在该像素的原始测试特征向量的曲线右侧。

5.根据权利要求1所述的一种基于经验模态分解的多分组图像有监督分类方法,其特征在于,步骤三中支持向量和拉格朗日乘子的获取方法为:步骤31、支持向量机分类器的基本核函数选取径向基函数KRBF(x,x′):利用扩维特征训练向量通过筛选确定支持向量机的径向基函数的参数σ,步骤32、由KRBF(x,x′)所构成的支持向量机子分类器fij(x)为:其中αt=(α1,α2,......,αM)为拉格朗日乘子,yt∈{-1,1}为归属类别,利用扩维特征训练向量及其所对应像素的归属类别对支持向量机进行训练,获得各支持向量和拉格朗日乘子,步骤三中形成多个支持向量机子分类器的方法为:根据获取的各支持向量和拉格朗日乘子,将扩维特征训练向量不同类别对应的特征数据输入支持向量机子分类器fij(x),形成多个支持向量机子分类器。

6.根据权利要求1所述的一种基于经验模态分解的多分组图像有监督分类方法,其特征在于,步骤四所述决策函数采用得分最多者获胜的原则,并按下式求出扩维测试特征向*量所对应像素的最终归属类别i :

其中,评分函数Fi(x)可表示为:

U为扩维特征测试向量区分类别总数量。

说明书 :

一种基于经验模态分解的多分组图像有监督分类方法

技术领域

[0001] 本发明涉及一种基于经验模态分解的多分组图像有监督分类方法,属于图像处理领域。

背景技术

[0002] 多分组图像是一组具有较高相关性的多波段图像,在地球观测、医学诊断、雷达探测等领域都存在大量的物理原型,例如高光谱图像、医学超声图像、海平面波动图像等。它们一般是针对同一区域的连续观测或多光谱分光观测,往往包含成百上千个波段的图像,各波段图像之间普遍具有较高的相关性,因此多分组图像既包含观察区域的多分辨信息,又存在大量的冗余信息。
[0003] 多分组图像中的每个像素都对应一条覆盖了各个波段的特征曲线,直接利用各像素的特征曲线作为特征向量进行分类识别是多分组图像分类有别于其它分类方法的根本区别。现有的有监督分类方法仅输入原始特征,而原始特征曲线的维数往往受限于多分组成像设备的连续采集能力或多光谱分光能力,因此尽管支持向量机分类器对高维输入空间并不敏感,也无法为分类器的输入端提供更高维的特征向量以实现提高分类精度的目的。现有的有监督分类方法对特征利用不充分,分类精度低。

发明内容

[0004] 本发明目的是为了解决现有的有监督分类方法对特征利用不充分,分类精度低的问题,提供了一种基于经验模态分解的多分组图像有监督分类方法。
[0005] 本发明的方法包括以下步骤:
[0006] 步骤一:对多分组图像中训练向量的各像素特征曲线所构成的训练特征向量进行经验模态分解,得到训练向量各像素的扩展训练特征向量;
[0007] 对多分组图像中测试向量的各像素特征曲线所构成的测试特征向量进行经验模态分解,得到测试向量各像素的扩展测试特征向量;
[0008] 步骤二:将多分组图像中训练向量各像素的原始训练特征向量及与其对应的扩展训练特征向量结合成平滑的扩维特征训练向量;
[0009] 将多分组图像中测试向量各像素的原始测试特征向量及与其对应的扩展测试特征向量结合成平滑的扩维特征测试向量;
[0010] 步骤三:利用扩维特征训练向量及其所对应像素的归属类别对支持向量机进行训练,获得支持向量机的相关参数,即:支持向量和拉格朗日乘子,
[0011] 然后结合所述相关参数,并利用已训练完毕的支持向量机对扩维特征测试向量所对应像素的类别进行归属判定,形成多个支持向量机子分类器;
[0012] 步骤四:利用所述多个支持向量机子分类器构建基于一对一策略的多分类器,并依据决策函数对扩维测试特征向量的各像素的归属类别作出决策,完成多分组图像的分类。
[0013] 1998 年 美 国 国 家 航 空 航 天 管 理 局 (National Aeronautics and SpaceAdministration,NASA)的黄 锷博 士 发表 了经 验模 态分 解法 (Empirical ModeDecomposition,EMD),利用信号内部时间尺度的变化做能量与频率的解析,将信号展开成数个本征模态函数(Intrinsic Mode Function,IMF),再利用希尔伯特变换(Hilbert Transform,HT)获得IMF的瞬时频率和振幅,上述过程总称为希尔伯特黄转换(Hilbert-Huang Tramsform,HHT)。
[0014] EMD是HHT算法的重要步骤,不同于使用固定形态窗口为分界基底函数的传统方法,EMD的基底函数是从信号中提取得到的,即使用IMF作基底。而IMF必须满足下列条件:
[0015] 1)在整个函数中,极值点的数目与穿越零点的数目相等或者相差1;
[0016] 2)在任何时刻,由局部极值包络线所定义的包络线局部均值为零。
[0017] 其中,第一个条件与传统高斯平稳过程中窄频宽的要求类似。第二个条件是一个新的想法:将整体性要求改变为局部性要求,使得瞬时频率不会因为不对称波形的存在而导致不必要的晃动。依托这两个条件构建起来的EMD及HHT被认为是强有力地求解非线性、非平稳信号的自适应方法,是近年来对以傅立叶变换为基础的线性及稳态谱分析的重大突破,并得到了广泛的应用。
[0018] 考虑到多分组图像是对观测区域的多次重复成像,这些成像之间只是存在时间上或谱段上的差异,因此从各幅图像中提取出同一位置像素点的特征向量不可避免地存在高频扰动。去除各特征向量的高频扰动可以得到一个扩展的特征向量,与原特征向量相结合后可以得到扩维的特征向量,以期获得更好的分类效果。而HHT从瞬时频率的定义和解法出发,定义了EMD方法和IMF的概念,通过EMD方法可以将任意信号分解为从高频到低频的IMF分量的信号叠加,为多分组图像高精度分类中的特征扩展提供了隔离高频扰动以提高分类精度的新思路。
[0019] 本发明的优点:
[0020] 1)本发明所提出的分类方法利用经验模态分解对多分组图像进行特征扩展从而增加了分类器的输入信息,同时利用对输入空间高维数不敏感的支持向量机构成基于一对一策略的多分类器,与仅输入原始特征的多分类方法相比,可在不增加运算复杂度的基础上有效提升分类精度。
[0021] 2)本发明所提出的分类方法无需增加训练向量的数量,只是在原训练向量与测试向量的基础上通过特征扩展更充分地利用多波段图像信息,因此该分类方法与原始特征输入的分类方法在结构上保持了较好的一致性,无需改变已有训练向量知识库以及训练向量的采集方法,有利于本发明方法的推广应用。

附图说明

[0022] 图1是本发明方法流程图,图2是本发明方法流程原理图,图3是经验模态分解流程图,图4是经验模态分解中实现步骤c的流程图,图5是像素(100,130)的原始特征曲线,图6是像素(100,130)的经过经验模态分解的第1个本征模态函数,图7是像素(100,130)的剩余趋势函数,图8是像素(100,130)的扩维后的特征曲线,图9是基于原始特征方法的分类结果散点示意图,图10是本发明方法的分类结果散点示意图。

具体实施方式

[0023] 具体实施方式一:下面结合图1至图10说明本实施方式,本实施方式包括以下步骤:
[0024] 步骤一:对多分组图像中训练向量的各像素特征曲线所构成的训练特征向量进行经验模态分解,得到训练向量各像素的扩展训练特征向量;
[0025] 对多分组图像中测试向量的各像素特征曲线所构成的测试特征向量进行经验模态分解,得到测试向量各像素的扩展测试特征向量;
[0026] 获得扩展训练特征向量或扩展测试特征向量的方法为:
[0027] 设定输入向量信号为x(t),其中,1≤t≤N,N为多分组图像的波段总数,[0028] 设定rn(t)为第n次本征模态函数分解的剩余趋势函数,hnk(t)为第n次分解的剩余趋势函数中经过第k次筛选后的剩余函数,
[0029] 步骤a、初始化n=0,且输入信号x(t)未经过本征模态函数分解的剩余趋势函数r0(t)=x(t),
[0030] 步骤b、初始化k=0,且输入信号x(t)经过第1次本征模态函数分解中第0次筛选后的剩余函数h10(t)=r0(t),
[0031] 步骤c、根据筛选程序获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k次筛选后的剩余函数hnk(t),
[0032] 步骤c1、利用三次样条函数获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k-1次筛选后的剩余函数hn(k-1)(t)的上、下包络,[0033] 步骤c2、计算所述剩余函数hn(k-1)(t)上、下包络曲线在各个t的均值mn(k-1)(t),[0034] 步骤c3、获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数中经过第k次筛选后的剩余函数hnk(t)=hn(k-1)(t)-mn(k-1)(t)。
[0035] 步骤d、采用标准偏差准则判断输入信号x(t)经过第n次本征模态函数分解中经2
过第k次筛选后的剩余函数hnk(t)是否满足本征模态函数的条件,即(hn(k-1)(t)-hnk(t))/
2
hn(k-1)(t)是否小于阈值T,0.2≤T≤0.3;
[0036] 判断结果为是,执行步骤e,判断结果为否,则k=k+1,然后执行步骤c,[0037] 步骤e、提取一个本征模态函数分量cn(t)=hnk(t),
[0038] 步骤f、获取输入信号x(t)经过第n次本征模态函数分解的剩余趋势函数rn(t)=rn-1(t)-cn(t),
[0039] 步骤g、判断剩余趋势函数rn(t)是否为单调函数,
[0040] 判断结果为否,则n=n+1,然后执行步骤b,判断结果为是,获得结果向量为rn(t);
[0041] 当输入向量信号x(t)为训练特征向量时,获得的结果向量rn(t)为扩展训练特征向量;输入向量信号x(t)为测试特征向量时,获得的结果向量rn(t)为扩展测试特征。
[0042] 对于一般的特征曲线,只需分解出第1个本征模态函数分量(以下简称IMF分量)c1(t)后即可停止,若特征空间中干扰成分较大则需要多进行几次IMF提取,最后,获得的剩余趋势函数rn(t)即是特征曲线x(t)的扩展特征曲线——扩展训练特征向量或扩展测试特征向量构成的曲线。本步骤需要对所有训练特征向量和测试特征向量执行。
[0043] 步骤二:将多分组图像中训练向量各像素的原始训练特征向量及与其对应的扩展训练特征向量结合成平滑的扩维特征训练向量;
[0044] 将多分组图像中测试向量各像素的原始测试特征向量及与其对应的扩展测试特征向量结合成平滑的扩维特征测试向量;
[0045] 获取扩维特征训练向量的方法为:
[0046] 将多分组图像中训练向量每个像素的扩展训练特征向量的曲线左右翻转后连接在该像素的原始训练特征向量的曲线右侧。
[0047] 获取扩维特征测试向量的方法为:
[0048] 将多分组图像中测试向量每个像素的扩展测试特征向量的曲线左右翻转后连接在该像素的原始测试特征向量的曲线右侧。
[0049] 这样的合并方式可以有效避免原始特征与扩展特征之间的数据不连续现象。该步骤需要对所有训练特征向量和测试特征向量统一实施,以保证其维数一致,即特征向量的维数均扩大了1倍。
[0050] 步骤三:利用扩维特征训练向量及其所对应像素的归属类别对支持向量机进行训练,获得支持向量机的相关参数,即:支持向量和拉格朗日乘子,
[0051] 然后结合所述相关参数,并利用已训练完毕的支持向量机对扩维特征测试向量所对应像素的类别进行归属判定,形成多个支持向量机子分类器;
[0052] 支持向量和拉格朗日乘子的获取方法为:
[0053] 步骤31、支持向量机分类器的基本核函数选取径向基函数KRBF(x,x′):
[0054]
[0055] 利用扩维特征训练向量通过筛选确定支持向量机的径向基函数的参数σ,[0056] 步骤32、由KRBF(x,x′)所构成的支持向量机子分类器fij(x)为:
[0057]
[0058] 其中αt=(α1,α2,……,αM)为拉格朗日乘子,yt∈{-1,1}为归属类别,[0059] 利用扩维特征训练向量及其所对应像素的归属类别对支持向量机进行训练,获得各支持向量和拉格朗日乘子。
[0060] 形成多个支持向量机子分类器的方法为:根据获取的各支持向量和拉格朗日乘子,将扩维特征训练向量不同类别对应的特征数据输入支持向量机子分类器fij(x),形成多个支持向量机子分类器。
[0061] 步骤四:利用所述多个支持向量机子分类器构建基于一对一策略的多分类器,并依据决策函数对扩维测试特征向量的各像素的归属类别作出决策,完成多分组图像的分类。
[0062] 所述决策函数采用得分最多者获胜的原则,并按下式求出扩维测试特征向量所对*应像素的最终归属类别i :
[0063]
[0064] 其中,评分函数Fi(x)可表示为:
[0065]
[0066] U为扩维特征测试向量区分类别总数量。
[0067] 鉴于多分组图像来自于对特定区域的连续性观测,待分类的像素呈现复杂的多样性特点,因此多分组图像分类是典型的多分类任务。而支持向量机本质上只能分辨两种类别,为了完成多分类任务便需要利用多个支持向量机结合一定的策略来构造多分类器。鉴于不同类别所对应的像素数目不可预计,采用一对一(One Against One,OAO)策略来构建多分类器,其优势在于每个子分类器的训练时间不会因为两种类别像素数目的差别较大而变得过长,从而确保分类任务的可执行性。
[0068] 对基于一对一策略的多分类器,任意两种类别都需要构造一个支持向量机子分类器来处理。区分类别总数为U的多分类任务,需要构造U(U-1)/2个子分类器fhk(x)来分别处理类别p和类别q之间的分类任务,这也意味着步骤三实际上要执行U(U-1)/2次,而且各子分类器所对应的训练样本与测试样本均不同。最终决策前,需要计算每一类别的评分函数Fi(x),该函数统计了各子分类器的正负得分。评分函数Fi(x)可表示为:
[0069]
[0070] 决策函数采用得分最多者获胜的原则并按下式求出测试向量所对应像素的最终*归属类别i :
[0071]
[0072] 下面结合92AV3C高光谱图像的多分类实施例阐述本发明的具体实施方式:
[0073] 高光谱图像是典型的多分组图像之一。92AV3C高光谱图像来自于AVIRIS(Airborne Visible/Infrared Imaging Spectrometer)传感器对美国印地安那州西北部某农业地区的遥感观测。该数据集合包含220个波段(另有4个波段全为0值而被丢弃),从0.40μm到2.45μm大约每隔10nm一个波段,并附带通过实地考察所标定的各像素归属类别参考图,可利用该参考图辅助构建训练集合以及计算分类方法关于测试集合的分类精度。本实施例中安排了92AV3C高光谱图像中7种像素最多的类别,为交叉验证实验提供了充足的数据基础。实验采用高达5折的交叉验证(5-fold cross validation)实验来计算分类精度,使得结果更加具有说服力。
[0074] 执行步骤一:对92AV3C高光谱图像中各像素特征曲线所构成的特征向量进行经验模态分解,得到各像素的扩展特征向量。
[0075] 以像素(100,130)为例,其对应的特征曲线如图5所示,可见原始特征向量的维数为220维;进行经验模态分解之后得到的第1个本征模态函数(IntrinsicMode Function,IMF)和此时剩余趋势函数分别如图6和图7所示(皆为220维),可见第1个IMF即光谱中的高频特性,所反映的主要是AVIRIS高光谱传感器的干扰信息,而剩余趋势函数即该像素的扩展特征曲线。需要对所有训练特征向量和测试特征向量执行该步骤。
[0076] 执行步骤二:将92AV3C高光谱图像中各像素的原始训练特征向量及其扩展训练特征向量按统一规则进行结合,得到扩维训练特征向量与扩维测试特征向量。
[0077] 将该像素(100,130)的扩展特征曲线左右翻转,并连接在该像素的原始特征曲线之后,形成新的特征曲线。其扩维后的特征曲线如图8所示,可见两部分曲线过渡平滑。需要对所有扩展训练特征向量和扩展测试特征向量统一实施该步骤,以保证其维数均由220维扩展为440维。
[0078] 执行步骤三:利用扩维特征训练向量及其所对应像素的归属类别对支持向量机进行训练,再利用参数已训练完毕的支持向量机对扩维特征测试向量所对应像素的类别进行归属判定。
[0079] 支持向量机的基本核函数为径向基函数:
[0080]
[0081] 利用训练向量进行筛选择优之后,支持向量机的惩罚因子选取60,径向基核函数的参数σ选取0.4。令α=(α1,α2,L,αM)为拉格朗日乘子,yt∈{-1,1}为归属类别,由KRBF(x,x′)所构成的支持向量机分类器为:
[0082]
[0083] 本实施例采用一对一策略构建7类地面物种的多分类器,共需要7×(7-1)/2=21个支持向量机子分类器分别处理其中两两类别之间的鉴别任务,因此本步骤需要执行21次。
[0084] 执行步骤四:利用多个支持向量机子分类器构建基于一对一策略的多分类器,并依据决策函数对各像素的归属类别作出决策。
[0085] 最终决策前,首先统计各子分类器的结果中关于7种类别的正、负得分情况,评分函数Fi(x)的计算公式如下:
[0086]
[0087] 决策函数采用得分最多者获胜的原则并按下式求出扩维测试特征向量所对应像素的最终归属类别i*:
[0088]
[0089] 由于实验所用92AV3C高光谱图像自带归属类别参考图,因此我们实际上已经知道了各测试特征向量所对应像素的真实类别,因此可统计出本发明方法的实际分类精度。此外,我们还选取基于原始特征向量的一对一策略支持向量机多分类器,也对同样的数据集合进行了分类实验并得出了该传统方法的分类精度,用来与本发明方法的分类效果进行对比,详细的分类精度对比见表1,两种方法的分类结果散点图见图9和图10,其中黑色区域为实验所涉及的7类地面物种,黑色区域中的白色散点表示测试集合中被错误分类的像素,其他大面积的浅灰色区域为实验未涉及的图像区域。
[0090] 从表1中的分类精度对比可知:对原始特征向量进行扩展之后,具体7类地面物种的分类精度中除Soybean-clean till外均得到提高,平均精度提高了1.72%。从两种方法的分类结果散点图来看,图10的错误分类像素(白色散点区域)在大多数子类别区域的密度是低于图9的,这说明本发明方法对输入特征向量进行扩维之后能够有效提高分类精度。
[0091] 表1两种分类方法的分类精度比较
[0092]
[0093] 具体实施方式二、本实施方式与具体实施方式一的不同之处在于,T=0.25,其它与实施方式一相同。