一种基于优化K-means聚类的风机叶片故障诊断方法转让专利

申请号 : CN201910603546.9

文献号 : CN110259648B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李志军王宇星张家安李经纬王华君

申请人 : 河北工业大学

摘要 :

本发明提出一种基于优化K‑means聚类的风机叶片故障诊断方法,该方法通过对某一风机故障帧和非故障帧的频域对比来确定该台风机的故障频率带。该方法基于廓系数优化K‑means聚类的效果,将一段声音信号的故障帧和非故障帧进行区分,并将特征帧的样本标签在时域上刻画条形图,综合分析同类特征帧的周期特性来判断某台风机的叶片是否故障。本申请无需大量样本,而且不必在桨叶上安装额外的装置,可以任意采集某台风机几个旋转周期的声音信号,通过本发明提出的方法进行诊断既可以判断该台风机叶片是否该故障,又可以确定故障的频率带的具体数值,对于单台风机的叶片故障诊断具有普适性。

权利要求 :

1.一种基于优化K-means聚类的风机叶片故障诊断方法,该方法包括以下步骤:步骤1.针对单台风机的风机叶片的一段声音信号,采用能够表征声音特征的梅尔频率倒谱系数法将该段声音信号分成M个样本特征帧;

步骤2.利用K-means聚类算法对M个样本特征帧进行二聚类处理,所有样本特征帧经过聚类后会被分成两个簇,通过轮廓系数对最后聚类效果进行优化,使二聚类结果最优,此时整体样本数据的综合轮廓系数达到最大,簇团边界样本点被正确聚类;

步骤3.将所有样本特征帧的两个簇的类别标签在时域上画出条形图,观察条形图是否具有周期性,如果具有明显的周期性特征,则判断风机叶片为故障,否则为非故障;

步骤4.通过步骤3后,如果风机叶片被判定为故障,则两类特征帧中分别任意取一帧信号,并做快速傅里叶变换,在频域上通过对比两帧信号的振幅差别,找到两帧信号振幅具有明显差别的频率区域为叶片故障的频率带,并以频率带中振幅相对较大的帧信号所属类别为故障帧类别,以频率带中振幅相对较小的帧信号所属类别为非故障帧类别。

2.如权利要求1所述的故障诊断方法,其特征在于,步骤2中轮廓系数的计算公式为:其中a(i)是样本i的簇内不相似度,i为帧信号,b(i)为样本i的簇间不相似度,定义S为N个样本聚类效果的综合度量,N≤M,S的计算公式为式(2):其中轮廓系数s(i)的取值范围是[-1,1],轮廓系数接近-1,证明某个或某一类样本应该被分到另一类,接近1,则说明被评价的某个或某类样本分类正确,聚类效果较好,如果接近0,则说明被评价的某个或某类样本是簇间的边界点。

3.如权利要求1所述的故障诊断方法,其特征在于,通过轮廓系数对最后聚类效果进行优化的具体操作步骤是:

1)根据轮廓系数的计算公式,分别算出K-means聚类算法后的每个簇的轮廓系数S1和S2;

2)从S1和S2中找出最小值,则最小值对应的簇即为需要将其边界的点进行优化归类的簇团Cj,j的取值为1或2;

3)设定阈值为a,其中a=qε,q表示第q次对聚类进行优化,初始值为1,ε设置的固定常数,取值范围定义为[0,0.1],作为每次增大a的固定常数值;

在每次优化过程中,将簇团Cj中小于a的样本重新分到另一簇,然后重新计算所有样本的综合轮廓系数sq,当a小于簇团Cj中所有样本轮廓系数中的最大值时,增大a,继续优化聚类,当a的值大于簇团Cj中所有样本轮廓系数中的最大值时,则优化过程结束,整个流程结束后生成一组综合轮廓系数指标数据集,即{s1,s2,...,sq};

4)从数据集{s1,s2,...,sq}找出最大值对应的针对簇团Cj的优化结果,这个结果即为提出的基于轮廓系数对聚类后效果的优化的最佳结果,此时整体样本数据的轮廓系数达到最大,簇团边界样本点被正确聚类,聚类效果最优。

4.如权利要求1所述的故障诊断方法,其特征在于,步骤3中,所述条形图的绘制过程是:每个特征帧在原始的风机叶片声音信号中都有自己经过的时间段和开始的时间点,当每个特征帧被划定了类别后,将每帧的类别标签作为纵坐标,以每个特征帧开始的时间点为横坐标,在时域图上画出条形图。

5.如权利要求1所述的故障诊断方法,其特征在于,每个样本特征帧的长度为20~

30ms。

说明书 :

一种基于优化K-means聚类的风机叶片故障诊断方法

技术领域

[0001] 本发明属于风机故障识别技术领域,具体涉及一种基于优化K-means聚类的风机叶片故障诊断方法。

背景技术

[0002] 风机长期运行在交变载荷的恶劣环境下,叶片极易发生裂纹、腐蚀等故障,不但降低叶片的使用寿命,而且影响风机对风能的捕获,所以做到叶片的故障的早期诊断和维修对于风机的安全健康运行具有极大意义。目前对于风机叶片的故障诊断主流做法是采集风机的声发射、振动等信号建立基于大量风机样本的故障预测模型,如文献(范思遐,吴斌,李友钊.一种基于K均值聚类分析的风机退化模态识别[J].机械设计与制造,2018,No.330(08):207-209+213.)利用小波包提取风机齿轮箱特征后再用K-means建立预测模型;文献2(叶永恩,王欣,黄浩.基于密度峰值优化初始中心K-means算法在风力发电系统的故障诊断分析[J].新型工业化,2017(10):17-23.)]优化初始的聚类中心来优化聚类效果,上述均是利用K-means当做分类器来建立针对不同样本类的预测模型,这需要大量的故障风机叶片的信号样本,实际中风机叶片的故障类型、程度与部位的不同都将导致叶片故障数据集收集不够全面,从而影响所建模型的准确度。

发明内容

[0003] 针对现有技术的不足,本发明旨在研究一种基于优化K-means聚类的风机叶片故障诊断方法,该方法基于廓系数优化K-means聚类的效果,将一段声音信号的故障帧和非故障帧进行区分,并将特征帧的样本标签在时域上刻画条形图,综合分析同类特征帧的周期特性来判断某台风机的叶片是否故障。
[0004] 本发明采用的技术方案是:
[0005] 一种基于优化K-means聚类的风机叶片故障诊断方法,该方法包括以下步骤:
[0006] 步骤1.针对单台风机的一段声音信号,采用能够表征声音特征的梅尔频率倒谱系数法(Mel Frequency Cepstrum Coefficient,MFCC)将该段声音信号分成M个样本特征帧;
[0007] 步骤2.利用K-means聚类算法对M个样本特征帧进行二聚类处理,所有特征帧经过聚类后会被分成两个簇,通过轮廓系数对最后聚类效果进行优化,使二聚类结果最优,此时整体样本数据的轮廓系数达到最大,簇团边界样本点被正确聚类;
[0008] 步骤3.将所有特征帧的以两个簇的类别标签在时域上画出条形图,观察条形图是否具有周期性,如果具有明显的周期性特征,则判断风机叶片为故障,否则为非故障;
[0009] 步骤4.通过步骤3后,如果风机叶片被判定为故障,则两类特征帧中分别任意取一帧信号,并做快速傅里叶变换,在频域上通过对比两帧信号的振幅差别,找到两帧信号振幅具有明显差别的频率区域为叶片故障的频率带,并以频率带中振幅相对较大的帧信号所属类别为故障帧类别,以频率带中振幅相对较小的帧信号所属类别为非故障帧类别。
[0010] 步骤2中轮廓系数的计算公式为:
[0011]
[0012] 其中a(i)是样本i的簇内不相似度,i为帧信号,b(i)为样本i的簇间不相似度,[0013] 定义S为N个样本聚类效果的综合度量,N≤M,S的计算公式为式(2):
[0014]
[0015] 其中轮廓系数s(i)的取值范围是[-1,1],轮廓系数接近-1,证明某个或某一类样本应该被分到另一类,接近1,则说明被评价的某个或某类样本分类正确,聚类效果较好,如果接近0,则说明被评价的某个或某类样本是簇间的边界点。
[0016] 通过轮廓系数对最后聚类效果进行优化的具体操作步骤是:
[0017] 1)根据轮廓系数的计算公式,分别算出K-means聚类算法后的每个簇的的轮廓系数S1和S2;
[0018] 2)从S1和S2中找出最小值,则最小值对应的簇即为需要将其边界的点进行优化归类的簇团Cj,j的取值为1或2,待优化归类的簇团中样本特征帧的个数为k;
[0019] 3)设定阈值为a,其中a=qε,q表示第q次对聚类进行优化,初始值为1,ε设置的固定常数,取值范围定义为[0,0.1],作为每次增大a的固定常数值;
[0020] 在每次优化过程中,将簇团Cj中的所有样本轮廓系数小于a的值重新分到另一类,然后重新计算M个所有样本特征帧的轮廓系数sq,当a小于簇团Cj中k个样本轮廓系数中的最大值时,增大a,继续优化聚类,当a的值大于簇团Cj中k个样本轮廓系数中的最大值时,则优化过程结束,整个流程结束后生成一组轮廓系数系数指标数据集,即{s1,s2,...,sq};其中,簇团Cj中k个样本轮廓系数构成的集合为{s1j,s2j,...,skj};
[0021] 4)从数据集{s1,s2,...,sq}找出最大值对应的针对簇团Cj的优化结果,这个结果即为提出的基于轮廓系数对聚类后效果的优化的最佳结果,此时整体样本数据的轮廓系数达到最大,簇团边界样本点被正确聚类,聚类效果最优。
[0022] 步骤3中,所述条形图的绘制过程是:每个特征帧在原始的风机叶片声音信号中都有自己经过的时间段和开始的时间点,当每个特征帧被划定了类别后,将每帧的类别标签作为纵坐标,以每个特征帧开始的时间点为横坐标,在时域图上画出条形图。
[0023] 每个样本特征帧的长度为20~30ms。
[0024] 与现有技术相比,本发明的有益效果是:
[0025] 针对某一新建风场而言,多种叶片故障的风机的大量样本信息采集很困难,建立某一风场的风机的故障预测模型需要很长的时间周期,而本发明提出的一种基于优化K-means聚类的风机叶片故障诊断方法相比于上述方法而言无需大量样本,而且不必在桨叶上安装额外的装置,可以任意采集某台风机几个旋转周期的声音信号,通过本发明提出的方法进行诊断既可以判断该台风机叶片是否该故障,又可以确定故障的频率带的具体数值,所以对于单台风机的叶片故障诊断具有普适性。
[0026] 该方法通过区分对比一台风机故障段声音和非故障段声音信号,确定了该台风机叶片故障的频率带,是一种非接触式的检测方法。本发明方法利用K-means算法是为了区分故障样本和非故障样本,然后对样本标签进行时域上周期性分析,而不是单纯当作建立针对不同样本类的预测模型的分类器;本发明是对K-means聚类后的样本结果进行优化,是对边界样本点进行更加正确的划分,能够提高对单台风机故障诊断的准确率。

附图说明

[0027] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028] 图1为本发明公开的一种基于优化K-means聚类的风机叶片故障诊断方法流程图;
[0029] 图2为本发明基于轮廓系数优化聚类结果流程图;
[0030] 图3为本发明5号风机a=0.1时样本散点图;
[0031] 图4为本发明5号风机a=0.2时样本散点图;
[0032] 图5为本发明5号风机a=0.3时样本散点图;
[0033] 图6为本发明5号风机a=0.45时样本散点图;
[0034] 图7为13号风机类别标签条形图;
[0035] 图8为本发明5号聚类优化后类别标签条形图;
[0036] 图9为本发明5号风机故障帧与非故障帧频域对比图;
[0037] 图10为本发明13号风机样本帧散点图;

具体实施方式

[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039] 如图1所示,为本发明一种基于优化K-means聚类的风机叶片故障诊断方法流程图,其步骤包括:
[0040] 步骤1.针对单台风机的声音信号,采用能够表征声音特征的梅尔频率倒谱系数法(Mel Frequency Cepstrum Coefficient,MFCC)将该段声音信号分成一定数目(帧长通常取20-30ms,通过MFCC算法自动分成固定数目的样本特征帧,样本特征帧的个数为M)的特征帧;
[0041] 步骤2.利用K-means聚类算法对样本特征帧进行二聚类处理,对最后聚类的效果通过轮廓系数进行优化,使二聚类结果最优,基于轮廓系数优化聚类结果流程图如图2所示,具体的操作如下:
[0042] 1)针对K-means聚类后的两个簇,根据轮廓系数的计算公式,分别计算每个簇的轮廓系数S1和S2;
[0043] 轮廓系数的计算公式为:
[0044]
[0045] 其中a(i)是样本i的簇内不相似度,i为帧信号,b(i)为样本i的簇间不相似度,[0046] 定义S为N个样本聚类效果的综合度量,N≤M,S的计算公式为式(2):
[0047]
[0048] 其中轮廓系数的取值范围是[-1,1],轮廓系数接近-1,证明某个或某一类样本应该被分到另一类,接近1,则说明被评价的某个或某类样本分类正确,聚类效果较好,如果接近0,则说明被评价样本是簇间的边界点。
[0049] 2)从S1,S2中找出最小值,则最小值对应的簇即为需要将其边界的点进行优化归类的簇团Cj,j的取值为1或2,待优化归类的簇团中样本特征帧的个数为k;
[0050] 3)设定阈值为a,其中a=qε,q表示第q次对聚类进行优化,ε设置的固定常数,取值范围定义为[0,0.1],作为每次增大a的固定常数值;q初始值为1,根据轮廓系数的计算公式计算当前簇团Cj中每个样本特征帧的轮廓系数及公式(2)计算M个样本特征帧的综合轮廓系数sq,当前簇团Cj中样本轮廓系数构成的集合为{s1j,s2j,...,skj},判断当前a是否大于当前簇团Cj中样本轮廓系数构成的集合{s1j,s2j,...,skj}中的最大值,若不大于,则q=q+1,将簇团Cj中小于a的样本重新分到另一簇中,进行下一次优化过程;若大于,则进行步骤
4);
[0051] 在每次优化过程中,将簇团Cj中小于当前阈值a的样本重新分到另一簇中,然后重新计算M个样本特征帧的综合轮廓系数sq,当a小于簇团Cj中所有样本轮廓系数中的最大值时,增大a,继续优化聚类,当a的值大于簇团Cj所有样本轮廓系数中的最大值时,则优化过程结束,整个流程结束后生成一组综合轮廓系数指标数据集,即{s1,s2,...,sq},综合轮廓系数由公式(2)计算得到。
[0052] 4)从数据集{s1,s2,...,sq}找出最大值对应的针对簇团Cj的优化结果,这个结果即为提出的基于轮廓系数对聚类后效果的优化的最佳结果,此时整体样本数据的轮廓系数达到最大,簇团边界样本点被正确聚类,聚类效果最优,同时得到最优轮廓系数阈值。
[0053] 步骤3.将所有特征帧的两个簇的类别标签在时域上画出条形图,观察条形图是否具有周期性,如果具有明显的周期性特征,则判断风机叶片为故障,否则为非故障;
[0054] 步骤4.通过步骤3后,如果风机叶片被判定为故障,则从两类特征帧中分别任意取一帧信号,并做快速傅里叶变换,在频域上通过对比两帧信号,振幅变化明显较大的频率带即为该风机叶片故障的频率带;并以频率带中振幅相对较大的帧信号所属类别为故障帧类别,以频率带中振幅相对较小的帧信号所属类别为非故障帧类别。其中在较高频率处振幅较大的帧信号所属类别可以判定为故障帧类别,另一帧所属的类别为非故障帧信号类别。
[0055] 实验分析
[0056] 为验证本发明的有效性,以某风场中的两个风机为例进行研究,其中5号风机为故障风机,13号风机为非故障风机。
[0057] 算例1.采集某风场有一叶片故障的5号风机稳定运行时的叶片扫风声作为待处理的信号,其中风机的型号是1.5MW的双馈风机,风速为6m/s,声音信号的的时间长度为取21.6s,采样频率为48000,提取这段声音的特征样本帧,生成3450*12的特征样本帧;M=
3450,
[0058] 采用K-means对3450个样本做二聚类,并基于轮廓系数对聚类的结果进行优化,具体的过程见图3到图6,可以看出随着α的逐渐增大,边界点被逐渐被化分到正确的一类中,但是当α值过大并取到0.45时可以看到原本正确的分类点被错划分到了另一类中,由图表1中可知整体轮廓系数中存在一个最大值,即当α=0.3时,聚类的效果最好;
[0059] 将优化聚类后样本的类别标签在时域上刻画条形图,如图8所示,风机叶片旋转一周的时间大约为6s,可以看出在一个周期内,风机叶片有两种不同的声音信号出现,且呈现周期性,结合实际中采集声音信息的位置在风机塔筒的正下方,有故障的桨叶在在经过塔筒最下方时故障频率能量被采集的更全面,当该叶片在其他位置时,由于故障频率分量的衰减导致传感器几乎采集不到故障的声音,综合分析以上,属于2类的特征样本帧即为风机的故障帧;
[0060] 从5号风机的两种类别帧中中分别任意取一帧信号,并做快速傅里叶变换,如图9所示,可以看到故障帧相比于非故障帧而言,在5000Hz附近,故障帧信号出现了异常,从而确定该风机叶片的故障频率在5000Hz附近的频带内,而故障帧所属的看类别为故障样本类别,即第二类样本,而正常帧类别为第一类,符合实际。
[0061] 算例2.采集同一风场13号无故障风机按上述流程进行故障诊断,为了排除聚类随机性对结果的影响,对样本帧进行了4次二聚类,保证K-means聚类算法稳定性,对二聚类的结果优化,所有样本特征帧的综合轮廓系数如表2所示,此时综合轮廓系数相比于5号风机来说比较低,样本帧的散点图如图10所示,并无明显簇的分类,由聚类后刻画的样本类别条形图7可知,两类信号并无明显的周期性特征,综上所述可以判断13号风机无故障,与实际相符。
[0062] 经过上面的两个算例分析可知,本发明所提出的基于优化K-means聚类的风机叶片故障诊断方法是有效的。
[0063] 表1. 5号风机优化过程中综合轮廓系数渐变表
[0064]
[0065] 表2. 13号风机综合轮廓系数表
[0066]a 0.1 0.15 0.2 0.25
综合轮廓系数 0.1492 0.136 0.1468 0.1426
[0067] 本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
[0068] 本发明未述及之处适用于现有技术。