一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨识方法转让专利

申请号 : CN201610555741.5

文献号 : CN106446500B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 季云峰匡亮

申请人 : 江苏信息职业技术学院

摘要 :

本发明公开了一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨识方法,利用样本的标签信息来调整样本点与点之间的距离以形成新的距离矩阵,通过新的距离矩阵进行邻域构建,同时利用局部集聚系数进行邻域参数的自适应调整,能够获得辨识度更高的低维特征,以低维特征作为支持向量机(SVM)的输入来实现故障诊断,可以有效的将不同故障状态的样本进行分离。

权利要求 :

1.一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨识方法,其特征在于,包括以下步骤:步骤一:

机械振动将原始信号的均值、峰值指标、标准差、斜度、均方根、峭度波形因子、裕度指标7个时域特征,均值频率、均方根频率、标准差频率、方差频率4个频域特征,以及基于EEMD模糊熵的复杂度特征构成混合特征集以全面的表征机械故障信息;

提取机械振动信号中7个时域特征和4个频域,构造维数为11的故障特征集T1;

步骤二:

对原始信号进行EEMD分解,并求取前m个IMF分量的模糊熵,构造维数为m的故障特征集T2;

步骤三:转换矩阵A的获取;

通过正交邻域保持嵌入ONPE算法获取转换矩阵A,步骤如下:

1)主成分分析投影,使用PCA将数据集映射到主体子空间,用APCA表示PCA的转换矩阵,用X表示PCA子空间数据集;

2)构造邻域图,采用KNN法构造邻近图,再寻找数据的k个近邻点;

3)选择权值,

边界权值计算公式: 其中,W表示权值矩阵,Wij表示节点i和j之间的边界权值,xj和xi越近,Wij就越大,K×K维局部协方差矩阵计算公式: K为邻域大小由K×K维局部协方差矩阵和拉格朗日乘数法得到最优权值计算公式:其中,Wij为W的第i行j列元素,由Wij可构造m×m维稀疏矩阵s;

4)计算ONPE,

令{a1,a2,…,ak}为ONPE,定义A(k-1)=[a1,…,ak-1]

S(k-1)=[A(k-1)]T(XXT)-1A(k-1)则向量组{a1,a2,…,ak}可迭代计算如下:a1为(XXT)XMXT最小特征值对应的特征向量,其中M=(I-W)T(I-W),ak为J(k)={I-(XXT)-1A(k-1)[S(k-1)]-1[A(k-1)]T}(XXT)-1XMXT的最小特征值所对应的特征向量;

5)ONPE投影,令AONPE=[a1,a2,…,ad],嵌入式如下:XORG→Y=ATXORG

A=APCAAONPE

其中,Y为XORG的d维表示,A为转换矩阵,AONPE的列向量为标准正交基向量;

步骤四:改进的有监督正交邻域保持嵌入Improved supervised ONPE,IS-ONPE算法设计,重新定义矩阵距离其中,d为样本间的原始距离,D为重新定义后的矩阵距离, 为样本间的距离d的平均值,其作用是避免D在d较大时增长过快,σ∈[0,1]为调控系数以确保各类之间的关联性,li∈{Lj,j=1,2…,C}为样本的类别标签;

步骤五:邻域参数的自适应调整

通过计算局部集聚系数进行自适应邻域选择,设xij为xi向量邻域Ni={N(xi)|xi∈X}中的第j个点,j=1,2,…,k,则xij的局部集聚系数为:其中,Eij为xij与邻域点互为邻域的次数,如果xij同时也是N(xi)的邻域,则Eij=Eij+1;

设xi i=1,2,…,n的初始k个邻域数据为xij,j=1,2,…,k,xi与邻域数据的平均欧式距离为:整体流行结构的平均欧式距离为:

自适应邻域个数为:

ki=kDm/di

步骤六:IS-ONPE算法:

输入:高维空间数据样本集X={(x1,l1),(x2,l2),…(xc,lc)},xi∈RD,li∈R为数据样本类别信息,目标低维特征空间维数d,邻域参数初始值k,输出:低维特征向量Y,转换矩阵A,步骤如下:

1)根据步骤四中获得的重新定义后的距离,计算高维空间数据点的距离矩阵,并对距离矩阵进行归一化;

2)设定邻域参数初始值k,根据局部集聚系数计算调整后的邻域参数ki;

3)根据ki重新确定数据点xi的局部邻域空间,按照步骤三中的最优权值计算公式、ONPE和ONPE投影嵌入式得到转换矩阵A,最终可得低维空间坐标Y=AXORG;

步骤七:基于IS-ONPE的故障辨识方法:通过转换矩阵A对训练样本和测试样本进行维数约简,得到的d维特征输入SVM进行故障辨识。

说明书 :

一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨

识方法

技术领域

[0001] 本发明涉及一种正交邻域保持嵌入的故障辨识方法,尤其涉及一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨识方法。

背景技术

[0002] 正交邻域保持嵌入[1]Orthogonal neighborhood preserving embedding,ONPE作为流行学习算法的一种,可有效对高维数据集进行约简,尤其是在多维故障特征集的维数约简中取得了不错的降维效果,提高了故障诊断的精度,具有一定的优势。然而,ONPE是一种无监督特征约简方法,只侧重于保持数据集的本征结构,而完全没有考虑类别信息,导致故障解耦不完全,故障间仍然存在混叠;另一方面,ONPE使用的是全局统一的邻域参数,即算法在维数约简的过程中,其邻域参数的设定往往依据经验,导致无法充分实现流形学习算法的优势,使得提取的低维故障特征的区分度并不高。

发明内容

[0003] 为了解决现有技术中存在的不足,本发明提供了一种基于改进的有监督正交邻域保持嵌入Improved supervised ONPE,IS-ONPE维数约简的故障辨识方法。
[0004] 本发明的技术方案如下:一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨识方法,包括以下步骤:
[0005] 步骤一:
[0006] 机械振动将原始信号的均值、峰值指标、标准差、斜度、均方根、峭度波形因子、裕度指标7个时域特征,均值频率、均方根频率、标准差频率、方差频率4个频域特征,以及基于EEMD模糊熵的复杂度特征构成混合特征集以全面的表征机械故障信息。
[0007] 提取机械振动信号中7个时域特征和4个频域,构造维数为11的故障特征集T1;
[0008] 步骤二:
[0009] 对原始信号进行EEMD分解,并求取前m个IMF分量的模糊熵,构造维数为m的故障特征集T2;
[0010] 步骤三:转换矩阵A的获取,
[0011] 通过正交邻域保持嵌入ONPE算法获取转换矩阵A,步骤如下:
[0012] 1)主成分分析投影,使用PCA将数据集映射到主体子空间,用APCA表示PCA的转换矩阵,用X表示PCA子空间数据集;
[0013] 2)构造邻域图,采用KNN法构造邻近图,再寻找数据的k个近邻点;
[0014] 3)选择权值,
[0015] 边界权值计算公式:
[0016] 其中,W表示权值矩阵,Wij表示节点i和j之间的边界权值,xj和xi越近,Wij就越大,K×K维局部协方差矩阵计算公式: k为邻域大小由K×K维局部协方差矩阵和拉格朗日乘数法得到最优权值计算公式:
[0017] 其中,Wij为W的第i行j列元素,由Wij可构造m×m维稀疏矩阵s;
[0018] 4)计算ONPE,
[0019] 令{a1,a2,…,ak}为ONPE,定义
[0020] A(k-1)=[a1,…,ak-1]
[0021] S(k-1)=[A(k-1)]T(XXT)-1A(k-1)
[0022] 则向量组{a1,a2,…,ak}可迭代计算如下:
[0023] a1为(XXT)XMXT最小特征值对应的特征向量,其中M=(I-W)T(I-W),
[0024] ak为J(k)={I-(XXT)-1A(k-1)[S(k-1)]-1[A(k-1)]T}(XXT)-1XMXT的最小特征值所对应的特征向量;
[0025] 5)ONPE投影,令AONPE=[a1,a2,…,ad],嵌入式如下:
[0026] XORG→Y=ATXORG
[0027] A=APCAAONPE
[0028] 其中,Y为XORG的d维表示,A为转换矩阵,AONPE的列向量为标准正交基向量;
[0029] 步骤四:改进的有监督正交邻域保持嵌入Improved supervised ONPE,IS-ONPE算法设计,
[0030] 重新定义矩阵距离
[0031]
[0032] 其中,d为样本间的原始距离,D为重新定义后的矩阵距离,为样本间的距离d的平均值,其作用是避免D在d较大时增长过快,σ∈[0,1]为调控系数以确保各类之间的关联性,li∈{Lj,j=1,2…,C}为样本的类别标签。
[0033] 步骤五:邻域参数的自适应调整
[0034] 通过计算局部集聚系数进行自适应邻域选择,
[0035] 设xij为xi向量邻域Ni={N(xi)|xi∈X}中的第j个点,j=1,2,…,k,则xij的局部集聚系数为:
[0036]
[0037] 其中,Eij为xij与邻域点互为邻域的次数,如果xij同时也是N(xi)的邻域,则Eij=Eij+1。
[0038] 设xi i=1,2,…,n的初始k个邻域数据为xij,j=1,2,…,k,xi与邻域数据的平均欧式距离为:
[0039]
[0040] 整体流行结构的平均欧式距离为:
[0041]
[0042] 自适应邻域个数为:
[0043] ki=kDm/di
[0044] 步骤六:IS-ONPE算法:
[0045] 输入:高维空间数据样本集X={(x1,l1),(x2,l2),…(xc,lc)},xi∈RD,li∈R为数据样本类别信息,目标低维特征空间维数d,邻域参数初始值k,输出:低维特征向量Y,转换矩阵A,
[0046] 步骤如下:
[0047] 1)根据步骤四中获得的重新定义后的距离,计算高维空间数据点的距离矩阵,并对距离矩阵进行归一化;
[0048] 2)设定邻域参数初始值k,根据局部集聚系数计算调整后的邻域参数ki;
[0049] 3)根据ki重新确定数据点xi的局部邻域空间,按照步骤三中的最优权值计算公式、ONPE和ONPE投影嵌入式得到转换矩阵A,最终可得低维空间坐标Y=AXORG;
[0050] 步骤七:基于IS-ONPE的故障辨识方法
[0051] 通过转换矩阵A对训练样本和测试样本进行维数约简,得到的d维特征输入SVM进行故障辨识。
[0052] 本发明达到的有益效果是:本发明在维数约简时,利用带有类别信息的样本重构原始特征空间样本点间的距离矩阵,使同类样本点间的距离更近,异类样本点间的距离更远,改善数据的区分度;同时,针对ONPE算法中采用统一邻域参数的不足,根据样本空间局部集聚系数的大小自适应地调整邻域参数,可更有效地获取数据的低维本质流行。

附图说明

[0053] 本实用新型将通过例子并参照附图的方式说明,其中:
[0054] 图1是基于IS-ONPE故障辨识的流程图。

具体实施方式

[0055] 以下结合附图和具体实施方式对本发明作进一步的详细描述:
[0056] 一种基于改进的有监督正交邻域保持嵌入维数约简的故障辨识方法,包括以下步骤:
[0057] 步骤一:
[0058] 机械振动将原始信号的均值、峰值指标、标准差、斜度、均方根、峭度波形因子、裕度指标7个时域特征,均值频率、均方根频率、标准差频率、方差频率4个频域特征,以及基于EEMD模糊熵的复杂度特征构成混合特征集以全面的表征机械故障信息。
[0059] 提取机械振动信号中7个时域特征和4个频域,构造维数为11的故障特征集T1;
[0060] 步骤二:
[0061] 对原始信号进行EEMD分解,并求取前m个IMF分量的模糊熵,构造维数为m的故障特征集T2;
[0062] 步骤三:转换矩阵A的获取,步骤如下:
[0063] ONPE的主要思想是寻找转换矩阵A,通过A将给定的一组RD空间中的含噪数据集xORG1,…,xORGm映射为Rd(d<D)空间中的一组点集,即用Y代表XORG,其中Y=ATXORG,[0064] 1)主成分分析投影,使用PCA将数据集映射到主体子空间,用APCA表示PCA的转换矩阵,用X表示PCA子空间数据集;
[0065] 2)构造邻域图,采用KNN法构造邻近图,再寻找数据的k个近邻点;
[0066] 3)选择权值,
[0067] 边界权值计算公式:
[0068] 其中,W表示权值矩阵,Wij表示节点i和j之间的边界权值,xj和xi越近,Wij就越大,K×K维局部协方差矩阵计算公式: K为邻域大小由K×K维局部协方差矩阵和拉格朗日乘数法得到最优权值计算公式:
[0069] 其中,Wij为W的第i行j列元素,由Wij可构造m×m维稀疏矩阵s;
[0070] 4)计算ONPE,
[0071] 令{a1,a2,…,ak}为ONPE,定义
[0072] A(k-1)=[a1,…,ak-1]
[0073] S(k-1)=[A(k-1)]T(XXT)-1A(k-1)
[0074] 则向量组{a1,a2,…,ak}可迭代计算如下:
[0075] a1为(XXT)XMXT最小特征值对应的特征向量,其中M=(I-W)T(I-W),
[0076] ak为J(k)={I-(XXT)-1A(k-1)[S(k-1)]-1[A(k-1)]T}(XXT)-1XMXT的最小特征值所对应的特征向量;5)ONPE投影,令AONPE=[a1,a2,…,ad],嵌入式如下:
[0077] XORG→Y=ATXORG
[0078] A=APCAAONPE
[0079] 其中,Y为XORG的d维表示,A为转换矩阵,AONPE的列向量为标准正交基向量;
[0080] 步骤四:改进的有监督正交邻域保持嵌入Improved supervised ONPE,IS-ONPE算法设计,
[0081] 工程实际中,样本的类别标签信息往往是可以获取的。而ONPE在构造局部邻域时,是通过样本间的欧式距离大小来确定样本的近邻点,完全没有考虑样本的类别信息,这就直接造成了无监督的基本属性,导致了维数约简过程的盲目性,无法得到最优的故障特征降维效果。因此,我们重新定义了矩阵距离,既可以根据类判别信息将样本间的距离控制在一定的范围内来压制干扰噪声,同时也拉伸了异类样本间的距离且压缩了同类样本间的距离。
[0082] 重新定义矩阵距离
[0083]
[0084] 其中,d为样本间的原始距离,D为重新定义后的矩阵距离,为样本间的距离d的平均值,其作用是避免D在d较大时增长过快,σ∈[0,1]为调控系数以确保各类之间的关联性,li∈{Lj,j=1,2…,C}为样本的类别标签。
[0085] 从式步骤三中的ONPE投影计算公式可以看出,具有相同类别标签的样本之间的距离被压缩且取值范围为[0,1],具有不同类别标签的样本之间的距离被拉伸且取值范围为[1-σ,+∞],这样就保证了异类样本点类间距离比同类样本点类内距离要大。也就是说,在维数约简过程中,样本的局部领域结构主要由同类样本点决定,这就增加了同类样本之间的相似性。同时,通过设置合理的参数σ,则不同类样本间的距离也可能小于同类样本间的距离,这就增加了不同故障类别之间的关联性,能够最大程度的保持高维数据的本质流行结构。
[0086] 步骤五:邻域参数的自适应调整
[0087] 在ONPE算法中邻域参数的选取对降维结果起着直接的影响。一般情况下,ONPE采用的是全局统一的参数,而实际中数据点的局部空间分布往往并不均匀,选取全局统一的邻域参数必然会降低算法的维数约减能力。若能根据数据点的局部空间分布自适应地调整邻域参数,则将会提高算法的降维能力,得到的低维数据也更能反映高维数据的本质流行。局部集聚系数是一种刻画样本平均集聚程度和关联程度的参数,能保证样本的局部重叠性,满足邻域选择要求。
[0088] 通过计算局部集聚系数进行自适应邻域选择,
[0089] 设xij为xi向量邻域Ni={N(xi)|xi∈X}中的第j个点,j=1,2,…,k,则xij的局部集聚系数为:
[0090]
[0091] 其中,Eij为xij与邻域点互为邻域的次数,如果xij同时也是N(xi)的邻域,则Eij=Eij+1,
[0092] 设xi i=1,2,…,n的初始k个邻域数据为xij,j=1,2,…,k,xi与邻域数据的平均欧式距离为:
[0093]
[0094] 平均邻域距离di越大,表明xi邻域数据越稀疏,反之表明xi邻域数据越密集,[0095] 整体流行结构的平均欧式距离为:
[0096]
[0097] 自适应邻域个数为:
[0098] ki=kDm/di
[0099] 从自适应邻域个数计算公式来看,自适应邻域ki与平均邻域距离di成反比,di越大选取的邻域应该越小,避免非进邻数据或者噪声数据作为邻域点,形成错误映射,影响流行结构的恢复;反之,当di越小时,选取的邻域应该越大,避免邻域间因数据稀疏和关联性而引起的结构扭曲。
[0100] 根据计算各点的局部集聚系数Cij,当ki<k时,在原邻域Ni中剔除掉Cij较小的p(k-ki)个点,并按照欧式距离剔除距离较大的(1-p)p(k-ki)个数据点。当ki>k时,保留原邻域Ni中所有的邻域数据,并在(Nmax-Ni)中添加Cij较大的p(k-ki)个点,按照欧式距离添加距离较小的(1-p)p(k-ki)数据点。
[0101] 步骤六:IS-ONPE算法:
[0102] 输入:高维空间数据样本集X={(x1,l1),(x2,l2),…(xc,lc)},xi∈RD,li∈R为数据样本类别信息,目标低低维特征空间维数d,邻域参数初始值k,输出:低维特征向量Y,转换矩阵A,
[0103] 步骤如下:
[0104] 1)根据步骤四中获得的重新定义后的距离,计算高维空间数据点的距离矩阵,并对距离矩阵进行归一化;
[0105] 2)设定邻域参数初始值k,根据局部集聚系数计算调整后的邻域参数ki;
[0106] 3)根据ki重新确定数据点xi的局部邻域空间,按照步骤三中的最优权值计算公式、ONPE和ONPE投影嵌入式得到转换矩阵A,最终可得低维空间坐标Y=AXORG;
[0107] 步骤七:基于IS-ONPE的故障辨识方法
[0108] 通过转换矩阵A对训练样本和测试样本进行维数约简,得到的d维特征输入SVM进行故障辨识。
[0109] 综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。