三度分离引导的模糊聚类的有效性指标的图像分割方法及系统转让专利

申请号 : CN202110974971.6

文献号 : CN113674295B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 唐益明李冰黄佳佳孙晓李书杰吴文斌陈锐

申请人 : 合肥工业大学

摘要 :

本发明公开了一种基于三度分离引导的模糊聚类的有效性指标的图像分割方法及系统,该方法包括:1利用模糊C均值聚类算法对图像中的像素点进行划分;2建立目标函数,设定终止条件或达到最大迭代次数;3初始化并更新迭代隶属度矩阵和聚类中心,并判断是否达到终止条件或达到最大迭代次数;4从三个层面的分离关系计算类间分离性数值,通过模糊加权距离和模糊簇的基数来获得类内紧致性数值数值,用后者和前者比值得到出该指标值;5比较所有类的有效性指标,选择最大有效性指标对应的聚类数和相应的隶属度矩阵进行图像分割。本发明能对图像进行有效的分割,将像素点进行聚类,得到一个有效的聚类结果,且适用于复杂、重叠、有噪声点的像素集合。

权利要求 :

1.一种三度分离引导的模糊聚类有效性指标的图像分割方法,其特征是按如下步骤进行:步骤1、利用模糊C均值聚类算法对任意一幅图像X中的像素点集合{x1,x2,…,xi,…,xN}划分为K个类,并获得隶属度矩阵U={μik|i=1,2,...,N;k=1,2,...,K}和聚类中心V={v1,v2,…,vk,…,vK};其中,xi表示图像X中的第i个像素点,μik表示第i个像素点xi隶属于第k个类Ck的隶属度值,且0≤μik≤1, vk表示第k个类的聚类中心;i=1,2,…,N;k=1,2,…,K;

N表示图像X中的像素点数;

设定最大的迭代次数为M,迭代的终止条件误差为ε,初始化K=2;

步骤2、利用式(1)构建FCM模糊算法的第iter次迭代目标函数式(1)中, 表示第iter次迭代的第k个类的聚类中心, 表示第iter次迭代的第i个像素点xi与第k个类的聚类中心 之间的距离, 表示第iter次迭代的第i个像素点xi属于第k个类的隶属度,m为加权指数,表示聚类模糊程度;

0

步骤3、令初始迭代次数iter=0,并以隶属度矩阵U和聚类中心V作为初始隶属度矩阵U0

和初始聚类中心V;

iter

步骤4、利用式(2)更新第iter次隶属度矩阵U ,得到第iter+1次隶属度矩阵iter+1

式(2)中, 表示第iter+1次隶属度矩阵U 中第i个像素点xi属于第k个类的隶属度;vj表示第j个类的聚类中心,j=1,2,…,K;j≠k;

iter

步骤5、利用式(3)更新第iter次聚类中心V ,得到第iter+1次聚类中心iter+1

式(3)中, 表示第iter+1次聚类中心V 中第k个类的聚类中心;

iter+1 iter

步骤6、如果||V ‑V ||<ε,则停止迭代,否则令iter+1赋值给iter后,返回步骤4,直到iter=M为止;

步骤7、通过模糊加权距离和模糊簇的基数,以此来计算类内的紧密关系fcp(K):步骤7.1、令k=1,定义第k类对应的紧密关系为fcp(k),并初始化fcp(k)=0;

步骤7.2、令k+1赋值给k后,判断k>K是否成立,若成立,则表示得到类内的紧密关系fcp(K),否则,计算 并赋值给fcp(k)后,返回步骤

7.2:

步骤8、利用式(4)计算类间的第一层面的分离关系fsp1(K):式(4)中,表示K个聚类中心的中值;

步骤9、利用式(5)计算类间的第二层面的分离关系fsp2(K):式(5)中,mean表示求均值函数;

步骤10、利用式(6)计算类间的第三层面的分离关系fsp3(K):式(5)中,min表示求最小值函数;

步骤11、利用式(7)获得K个类的三度分离指标VTDS(K):步骤12、将K+1赋值给K,并判断 是否成立,若成立,则表示获得所有K个类的有效性指标,并执行步骤13;否则,返回步骤2执行;

步骤13、比较所有K个类的有效性指标,并选择最大有效性指标所对应的聚类数和相应的隶属度矩阵对图像X进行分割,从而得到图像X的分割结果。

2.一种三度分离引导的模糊聚类有效性指标的图像分割系统,其特征在于,所述图像分割系统用于实现如权利要求1所述的三度分离引导的模糊聚类有效性指标的图像分割方法,并包括:图像获取模块:用于获取图像X的像素点集合;

聚类初始化模块:用于初始化图像分割的参数并构建目标函数;所述参数包括:终止条件或达到最大迭代次数,初始隶属度矩阵和初始聚类中心;

聚类计算模块:用于更新和迭代隶属度矩阵和聚类中心,从而得到最终的隶属度矩阵和聚类中心;

指标形成模块:计算类内紧密关系和类间分离关系,所述类间分离关系包括:第一层类间分离关系,第二层分离关系和第三层分离关系,并将类内紧致关系作为分子,将三个类间分离关系之积作为分母,从而得到有效性指标;

指标检验模块:用于所有类的有效性指标的比较,并获取最大有效性指标所对应的聚类数和相应的隶属度矩阵,用于对图像X进行聚类分割。

说明书 :

三度分离引导的模糊聚类的有效性指标的图像分割方法及

系统

技术领域

[0001] 本发明属于数据挖掘领域,具体地说是一种三度分离引导的模糊聚类的有效性指标的图像分割方法及其系统。

背景技术

[0002] 图像分割的目的是把特定的目标从复杂的图像中抽取出来,是图像识别,图像理解以及图像分析的重要依据。随着技术的发展,基于模糊聚类的图像分割已经广泛的使用在众多领域,如医学图像处理,人脸识别,交通道路分析等。因此,越来越多的学者研究各种关于评价相关的图像分割算法的指标,用来判定算法的好坏。指标可以客观分析出聚类算法在某些场景的实用程度。当然,在一种指标的衡量下的结果并不能说明一切问题,也需要各种指标的综合考察。经过无数的学者研究与探讨,已经提出了很多种基于模糊聚类改进的算法指标。
[0003] 聚类有效性指标可以分为三类:内部有效性指标、外部有效性指标和相对有效性指标。聚类有效性问题是通过建立一个聚类有效性指标函数,分别在不同的情形下运行此函数,然后取函数最优值时所对应的情况为最优划分。具体而言,在不同聚类数下,运行一个聚类算法,使得聚类有效性指标函数最优时即为最佳聚类数。
[0004] 现有的模糊聚类指标应用于图像分割领域时存在的问题主要有如下3个:
[0005] 1)有些有效性指标只考虑了几何结构信息,比如CH指标用类内离差矩阵和类间离差矩阵分别描述紧密度和分离度。DB指标用类内样本点到其聚类中心的距离描述类内紧致性,用聚类中心之间的距离表示类间的分离性。
[0006] 2)有些聚类有效性指标只对隶属度进行了分析,如最早提出的用于模糊聚类的有效性指标分离系数PC和分离熵PE指标,仅仅考虑了隶属度信息,在设计指标时并没有考虑到其他的数据结构等样本信息。标准分离系数NPC指标,仅仅是为了克服PC指标的单调变化的缺点,也没有真正考虑综合的样本集的信息。
[0007] 3)还有,同时考虑数据集的结构信息和隶属度的指标,比如XBI指标、FS指标。XBI指标是比值型模糊聚类有效性指标,通过引入的比例因子对紧致性和分离性进行不同程度的缩放,虽然其性能是在一定程度上提高了,但是指标的性能不是很稳定。后来的WLI指标是在XBI指标的基础上加入了聚类中心之间的中值距离,可以取得较好的聚类结果。VCVI指标虽然在一些情况下能取得较好的聚类结果,但是在数据集含有较多噪声点的时候效果差强人意。

发明内容

[0008] 本发明为了克服上述现有技术存在的不足之处,提出一种三度分离引导的模糊聚类的有效性指标的图像分割方法及系统,以期能对像素点集合进行准确的划分,且适用于高维、复杂、重叠、有噪声点的像素集合,从而能达到图像良好的分割效果。
[0009] 为了实现上述发明目的,本发明采用如下技术方案:
[0010] 本发明一种三度分离引导的模糊聚类有效性指标的图像分割方法的特点是按如下步骤进行:
[0011] 步骤1、利用模糊C均值聚类算法对任意一幅图像X中的像素点集合{x1,x2,…,xi,…,xN}划分为K个类,并获得隶属度矩阵U={μik|i=1,2,...,N;k=1,2,...,K}和聚类中心V={v1,v2,…,vk,…,vK};其中,xi表示图像X中的第i个像素点,μik表示第i个像素点xi隶属于第k个类Ck的隶属度值,且0≤μik≤1, vk表示第k个类的聚类中心;i=1,2,…,N;k=1,2,…,K;N表示图像X中的像素点数;
[0012] 设定最大的迭代次数为M,迭代的终止条件误差为ε,初始化K=2;
[0013] 步骤2、利用式(1)构建FCM模糊算法的第iter次迭代目标函数
[0014]
[0015] 式(1)中, 表示第iter次迭代的第k个类的聚类中心, 表示第iter次迭代的第i个像素点xi与第k个类的聚类中心 之间的距离, 表示第iter次迭代的第i个像素点xi属于第k个类的隶属度,m为加权指数,表示聚类模糊程度;
[0016] 步骤3、令初始迭代次数iter=0,并以隶属度矩阵U和聚类中心V作为初始隶属度0 0
矩阵U和初始聚类中心V;
[0017] 步骤4、利用式(2)更新第iter次隶属度矩阵Uiter,得到第iter+1次隶属度矩阵[0018]iter+1
[0019] 式(2)中, 表示第iter+1次隶属度矩阵U 中第i个像素点xi属于第k个类的隶属度;vj表示第j个类的聚类中心,j=1,2,…,K;j≠k;
[0020] 步骤5、利用式(3)更新第iter次聚类中心Viter,得到第iter+1次聚类中心[0021]iter+1
[0022] 式(3)中, 表示第iter+1次聚类中心V 中第k个类的聚类中心;
[0023] 步骤6、如果||Viter+1‑Viter||<ε,则停止迭代,否则令iter+1赋值给iter后,返回步骤4,直到iter=M为止;
[0024] 步骤7、通过模糊加权距离和模糊簇的基数,以此来计算类内的紧密关系fcp(K):
[0025] 步骤7.1、令k=1,定义聚类数目k对应的紧密关系为fcp(k),并初始化fcp(k)=0;
[0026] 步骤7.2、令k+1赋值给k后,判断k>K是否成立,若成立,则表示得到类内的紧密关系fcp(K),否则,计算 并赋值给fcp(k)后,返回步骤7.2:
[0027] 步骤8、利用式(4)计算类间的第一层面的分离关系fsp1(K):
[0028]
[0029] 式(4)中,表示K个聚类中心的中值;
[0030] 步骤9、利用式(5)计算类间的第二层面的分离关系fsp2(K):
[0031]
[0032] 式(5)中,mean表示求均值函数;
[0033] 步骤10、利用式(6)计算类间的第三层面的分离关系fsp3(K):
[0034]
[0035] 式(5)中,min表示求最小值函数;
[0036] 步骤11、利用式(7)获得K个类的三度分离指标VTDS(K):
[0037]
[0038] 步骤10、将K+1赋值给K,并判断 是否成立,若成立,则表示获得所有K个类的有效性指标,并执行步骤11;否则,返回步骤2执行;
[0039] 步骤11、比较所有K个类的有效性指标,并选择最大有效性指标所对应的聚类数和相应的隶属度矩阵对图像X进行分割,从而得到图像X的分割结果。
[0040] 本发明一种三度分离引导的模糊聚类有效性指标的图像分割系统的特点在于,包括:
[0041] 图像获取模块:用于获取图像X的像素点集合;
[0042] 聚类初始化模块:用于初始化图像分割的参数并构建目标函数;所述参数包括:终止条件或达到最大迭代次数,初始隶属度矩阵和初始聚类中心;
[0043] 聚类计算模块:用于更新和迭代隶属度矩阵和聚类中心,从而得到最终的隶属度矩阵和聚类中心;
[0044] 指标形成模块:计算类内紧密关系和类间分离关系,所述类间分离关系包括:第一层类间分离关系,第二层分离关系和第三层分离关系,并将类内紧致关系作为分子,将三个类间分离关系之积作为分母,从而得到有效性指标;
[0045] 指标检验模块:用于所有类的有效性指标的比较,并获取最大有效性指标所对应的聚类数和相应的隶属度矩阵,用于对图像X进行聚类分割。
[0046] 与已有技术相比,本发明的有益效果体现在:
[0047] 1、本发明采用分离性和紧凑性比例因子方法,集中了模糊聚类(FCM)指标方法的优点,同时减少了分类数较多对于实验结果的影响,使聚类结果更加准确。
[0048] 2、本发明通过计算每个类的聚类中心和平均聚类中心之间的距离和两个类之间最小聚类中心距离的处理步骤,解决了现有指标对重叠类数据、高维数据集、含有噪声较多的数据集以及质心分布较为接近的数据集的分类结果不准确的问题,并能够在复杂分散的数据集中兼顾集群和个别数据,也充分考虑了数据集各个聚类中心的位置,在一定程度上防止了不同聚类中心分布很近的时候的情况,使得TDS指标表达模式更加饱满、立体,在一定程度上允许质心分配相近的簇,对于簇中心分布很接近的数据集效果更佳。
[0049] 3、本发明通过模糊聚类方法,能更加准确的判断聚类数,不同聚类中心之间的距离对分类准确性的影响力也越来越小,因此,本方法比其他方法更适合于多维和分布复杂的数据集。

附图说明

[0050] 图1为本发明方法流程图;
[0051] 图2a为本发明二类原图像;
[0052] 图2b为本发明二类噪声图像;
[0053] 图2c为本发明二类分割图像;
[0054] 图3a为本发明三类原图像;
[0055] 图3b为本发明三类噪声图像
[0056] 图3c为本发明三类分割图像;
[0057] 图4a为本发明自然图像原图像;
[0058] 图4b为本发明自然图像噪声图像;
[0059] 图4c为本发明自然图像分割图像;
[0060] 图5a为本发明自然图像Coins原图像;
[0061] 图5b为本发明自然图像Coins噪声图像;
[0062] 图5c为本发明自然图像Coins分割图像。

具体实施方式

[0063] 本实施例中,如图1所示,一种三度分离引导的模糊聚类的有效性指标的图像分割方法是按照如下步骤进行:
[0064] 步骤1、利用模糊C均值聚类算法对任意一幅图像X中的像素点集合{x1,x2,…,xi,…,xN}划分为K个类,并获得隶属度矩阵U={μik|i=1,2,...,N;k=1,2,...,K}和聚类中心V={v1,v2,…,vk,…,vK};其中,xi表示图像X中的第i个像素点,μik表示第i个像素点xi隶属于第k个类Ck的隶属度值,且0≤μik≤1, vk表示第k个类的聚类中心;i=1,2,…,N;k=1,2,…,K;N表示图像X中的像素点数;
[0065] 设定最大的迭代次数为M,迭代的终止条件误差为ε,初始化K=2;
[0066] 步骤2、利用式(1)构建FCM模糊算法的第iter次迭代目标函数
[0067]
[0068] 式(1)中, 表示第iter次迭代的第k个类的聚类中心, 表示第iter次迭代的第i个像素点xi与第k个类的聚类中心 之间的距离, 表示第iter次迭代的第i个像素点xi属于第k个类的隶属度,m为加权指数,表示聚类模糊程度;
[0069] 具体试验中参数的设置为,m在试验中设置范围介于1.5到2.5之间浮动设置,本发明设置为2;
[0070] J值最小时对应的聚类中心是最优的,图像分割的效果也是最好的。图2a是二类图像的原图像,图2b是添加10%的椒盐噪声之后的图像,图2c是FCM算法对二类图像的分割效果;图3a是分为三类的原始图像,图3b为添加10%高斯噪声后的图像,图3c为FCM算法对三类图像的分割效果;通过本发明的运行过程可以得到三度分离引导的模糊聚类的有效性指标的图像分割方法要明显优于传统技术上的模糊C均值聚类算法。
[0071] 步骤3、令初始迭代次数iter=0,并以隶属度矩阵U和聚类中心V作为初始隶属度0 0
矩阵U和初始聚类中心V;
[0072] 步骤4、利用式(2)更新第iter次隶属度矩阵Uiter,得到第iter+1次隶属度矩阵[0073]
[0074] 式(2)中, 表示第iter+1次隶属度矩阵Uiter+1中第i个像素点xi属于第k个类的隶属度;vj表示第j个类的聚类中心,j=1,2,…,K;j≠k;
[0075] 步骤5、利用式(3)更新第iter次聚类中心Viter,得到第iter+1次聚类中心[0076]iter+1
[0077] 式(3)中, 表示第iter+1次聚类中心V 中第k个类的聚类中心;
[0078] 步骤6、如果||Viter+1‑Viter||<ε,则停止迭代,否则令iter+1赋值给iter后,返回步骤4,直到iter=M为止;
[0079] 步骤7、计算类内的紧密关系fcp(K):
[0080] 步骤7.1、令k=1,定义聚类数目k对应的紧密关系为fcp(k),并初始化fcp(k)=0;
[0081] 步骤7.2、令k+1赋值给k后,判断k>K是否成立,若成立,则表示得到类内的紧密关系fcp(K),否则,计算 并赋值给fcp(k)后,返回步骤7.2:
[0082] 步骤8、利用式(4)计算类间的第一层面的分离关系fsp1(K):
[0083]
[0084] 式(4)中,表示K个聚类中心的中值;
[0085] 表1本发明在SPECTF heart上实验数据表
[0086] 指标 2类 3类 4类 5类 6类 7类 8类 9类 10类CH+ 0.5428 0.5543 0.2706 0.2549 0.1243 0.1155 0.1213 0.1067 0.0928
DB‑ 109.2186 292.9729 207.8232 266.7252 557.1038 101.6500 105.7082 104.1051 119.9793PC+ 0.5000 0.3334 0.2501 0.2001 0.1668 0.1429 0.1250 0.1112 0.1001
PE‑ 0.9999 0.5727 1.9998 2.3216 0.8087 2.8069 2.9995 3.1697 1.0354
FS‑ 7690.6 5087.8 3817.7 3056.3 2521.5 2180.4 1905.7 1681.9 1515.1
XB‑ 36.2452 51.2162 30.8201 64.3935 48.9373 79.4901 101.7217 81.0978 90.7100NPC+ ‑0.6968 ‑1.1059 ‑1.3974 ‑1.6241 ‑1.8100 ‑1.9682 ‑2.1056 ‑2.2274 ‑2.3366WLI‑ 24.6578 21.1556 26.9917 34.6935 25.1479 37.6424 23.1215 34.5336 29.7515VCVI‑ 56.8260 56.2808 55.9367 56.6848 54.9396 52.2441 51.5878 54.5937 53.2441TCR‑ 31.6301 33.7628 87.7579 71.4417 39.6394 33.0926 50.1074 87.0055 45.7900[0087] 表1给出了本文中用于比较的一些指标在6个数据集中的聚类结果。该数据集的维数很多,大多数指标判断的划分结果是错误的;且存在两个类之间聚类中心距离很小的情况,并且两个数据簇之间的重叠度非常大,导致分割不准确,而本发明的指标采用了平均聚类中心和任意两个类之间聚类中心最小值均参与分离性度量的方法,解决了上述的问题,得到了很好的分割结果。
[0088] 步骤9、利用式(5)计算类间的第二层面的分离关系fsp2(K):
[0089]
[0090] 式(5)中,mean表示求均值函数;
[0091] 步骤10、利用式(6)计算类间的第三层面的分离关系fsp3(K):
[0092]
[0093] 式(5)中,min表示求最小值函数;
[0094] 为了验证所提算法在自然图像下的分割效果,采用最常使用的Camerman与Coins图像进行实验。图4a自然图像Camerman原图像,图4b是自然图像Camerman添加10%的椒盐噪声图像,图4c是自然图像Camerman的分割图像;参数设置k=3,m=2,a的大小设置为1.0,L设置为5.0,ε设置为0.001,迭代次数100次,窗口大小设置为3×3,从以下的图3a‑图3c可以看出,该发明的方法更好地保持图像的细节特征而且对于天空和草地也可以分割出来。
[0095] 图5a为自然图像Coins原图像,图5b为自然图像Coins添加10%的椒盐噪声图像,图5c为自然图像Coins的分割图像。通过本方法进行处理,也取得了良好的分割效果。
[0096] 步骤11、比较所有K个类的有效性指标,并选择最大有效性指标所对应的聚类数和相应的隶属度矩阵对图像X进行分割,从而得到图像X的分割结果。
[0097] 本实施例中,一种三度分离引导的模糊聚类有效性指标的图像分割系统,包括:
[0098] 图像获取模块:用于获取图像X的像素点集合;
[0099] 聚类初始化模块:用于初始化图像分割的参数并构建目标函数;所述参数包括:终止条件或达到最大迭代次数,初始隶属度矩阵和初始聚类中心;
[0100] 聚类计算模块:用于更新和迭代隶属度矩阵和聚类中心,从而得到最终的隶属度矩阵和聚类中心;
[0101] 指标形成模块:计算类内紧密关系和类间分离关系,所述类间分离关系包括:第一层类间分离关系,第二层分离关系和第三层分离关系,并将类内紧致关系作为分子,将三个类间分离关系之积作为分母,从而得到有效性指标;
[0102] 指标检验模块:用于所有类的有效性指标的比较,并获取最大有效性指标所对应的聚类数和相应的隶属度矩阵,用于对图像X进行聚类分割。
[0103] 为了验证三度分离引导的模糊聚类有效性指标的有效性,进行一些实验。实验平台为Window10系统,编译环境是Intel(R)Core(TM)5‑7400 CPU@300GHz 3.00GHz以及RAM8.00GB和Windows 10OS,编程语言为Matlab2018b。在实验的过程中,需要和之前出现的一些相对来说表现良好的指标进行横向比较,其中涉及的指标有CHI(+)、DBI(‑)、PC(+)、PE(‑)、FSI(‑)、XBI(‑)、NPC(+)、WLI(‑)、VCVI(‑)、TDS(‑)。有六个数据集用于验证,涉及的数据集有Pima数据集、WDBC数据集、Hayes‑Roth数据集、Austra数据集、Monk数据集、SPECTF heart数据集。如表1所示,实验最后得出三度分离引导的模糊聚类有效性指标的表现最为优秀,然后选择该有效性指标所对应的聚类数和相应的隶属度矩阵对图像进行分割,从而得到图像分割结果。
[0104] 表2本发明在多个数据集中的实验结果
[0105]
[0106] 如表2所示,对实验结果进行分析可知:在复杂的分布数据集的情况下,没有任何一个指标可以对这些具有不同特点的数据集有良好的效果,CH、PE和DB指标在Hayes‑Roth数据集和SPECTF heart数据集上的得到了错误的结果,这两个数据集的不同数据簇之间重叠度较高;PC和NPC指标在Hayes‑Roth数据集上出现了聚类结果偏差;FS只在Pima和WDBC数据集上得到了正确的分类结果;XB指标在Austra和SPECTF heart数据集上得到了错误的聚类结果,这两个数据集的不同数据簇之间重叠度较高;VCVI在Pima和SPECTF heart数据集上得到了错误的聚类结果,这两个数据集的聚类中心分布非常接近,并且不同的类重叠度也高,具有一些噪声点;在其他指标没有得到很好效果的情况下,而新指标三度分离引导的模糊聚类的有效性指标均得到了正确的结果,说明新指标具有很好的特性。本发明三度分离引导的模糊聚类的有效性指标把Austra、Hayes‑Roth、Monk数据集分为2类,说明该指标实现了有重叠数据的正确聚类;Pima、WDBC、和SPECTF heart这三种数据集各自拥有不同的特点,SPECTF heart数据集是一个样本个数相对较少但维数较多的数据集,WDBC数据集虽然样本数量不是很多,但是样本属性繁多,Monk数据集属性个数与样本数量相对较均衡,而三度分离引导的模糊聚类的有效性指标却都得到了正确的结果。由此,可以得出三度分离引导的模糊聚类的有效性指标具有很强的适应能力。由此,本发明对图像分割可以取得更好的效果。