基于丛流形核线性判别分析的工业过程故障监测方法转让专利

申请号 : CN201711053890.2

文献号 : CN107817745B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张颖伟黄喆冯琳

申请人 : 东北大学

摘要 :

本发明提供一种基于丛流形核线性判别分析的工业过程故障监测方法,涉及故障监测与诊断技术领域。该方法在电熔炉运行时采集同一时刻的电流数据和图像数据并作向量化处理,得到的样本矩阵,用基于从流形核线性判别分析方法建模并求出模型的特征矩阵,利用特征矩阵对电熔镁炉过程进行故障诊断,根据新样本的投影离各类别数据投影中心的距离判断新样本数据是否为正常数据。本发明主要解决数据的非线性和带标签样本过少及故障有多类的问题,在对多类别数据进行故障诊断时有效降低了误报率,且对故障所属类别判定的准确率有明显提高。

权利要求 :

1.一种基于丛流形核线性判别分析的工业过程故障监测方法,其特征在于:包括以下步骤:步骤1:在电熔镁炉运行时采集若干组样本数据,这些样本数据有三个类别,分别是正常数据、喷炉数据、漏炉数据,对前N个采样样本,利用人工先验经验对其中l个样本做上类别标记,剩下u个未标记样本;具体采集方法为:在电熔镁的工业过程中利用摄像头采集电熔镁炉炉面图像数据,且在同一时刻采集电熔镁炉的三个电极的电流数据I=[I1,I2,I3];对图像数据中的每幅图片分别计算其0°、

45°、90°和135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算其对比度、相关性、能量、同质性、熵五个特征值,每一幅图片得到一个20维的向量P=[p1,p2,…,p20];将I和P组合起来得到N个采样样本的最终建模矩阵为X=[x1,x2,…,xl,xl+1,…,xl+u],其中l+u=N,xi=[pi1,pi2,…,pi20,Ii1,Ii2,Ii3],i=1,2,…,N;

步骤2:构建丛流形的邻接图矩阵;

用步骤1得到的前N个采样样本x1,x2,…,xN,建立邻接图矩阵W∈N×N,如下式所示;

W=(1-γ)W1+γW2;

其中,γ为线性系数,0≤γ≤1;W1∈N×N和W2∈N×N为邻接图矩阵W的两个部分;

为矩阵W1第i行第j列上的值,由如下公式求得;

其中, 是第i个采样样本xi的第k个最近邻的点,k(xi)是xi的k个最近邻的点的集合;在此,欧式距离||xi-xj||为两点xi和xj的距离,距离越小则两点越接近;

W2=ATA,矩阵A∈N×N,aij为矩阵A第i行第j列上的值,矩阵A由如下公式,利用二次规划解得;

其中, 且 和xi属于同一类;在此,两点xi和xj之间的距离由矩阵W1决定,即W1第i行第j列上的值 越大,两点之间距离越近;

步骤3:在丛流形上利用核线性判别分析方法由如下公式求得特征矩阵α;

其中,γI为线性系数,0≤γI≤1;

K∈N×N,是核矩阵,其第i行j列上的值kij=φ(xi,xj),φ(·)为核函数;L∈N×N,为拉普拉斯矩阵,L=D-W;D∈N×N,是一个对角矩阵,其对角元素为矩阵W第i行元素之和;q=3,为数据类别数;mc为带标签样本中第c类的样本数;1c为一个N×1的列向量,其中对应的第c类数据处的值为1,其余位置的值为0;1l为一个N×1的列向量,其中对应的有标签数据处的值为1,其余位置的值为0;

步骤4:利用特征矩阵α对电熔镁过程中产生的数据进行故障检测与诊断,新产生的图片及电流数据经特征提取后得到的向量为xnew,通过下式求得其投影tnew;

tnew=αTΦ(X,xnew);

其中,Φ(X,xnew)∈N×1,其第i行上的元素为φ(xi,xnew),X∈23×N为样本矩阵,xi为该矩阵第i列向量;

根据之前带标签的样本点的位置即可判断新样本所属类别;计算新样本的投影离各类别数据投影中心点的距离并进行比较,如果新样本的投影离正常样本的投影的中心点最近,则电熔镁炉在该时刻运行正常,如果新样本的投影离某一类故障样本的投影的中心点最近,则电熔镁炉在该时刻发生该类故障。

说明书 :

基于丛流形核线性判别分析的工业过程故障监测方法

技术领域

[0001] 本发明涉及故障监测与诊断技术领域,尤其涉及一种基于丛流形核线性判别分析的工业过程故障监测方法。

背景技术

[0002] 大结晶电熔镁是用纯天然轻烧镁粉经超高温电熔烧制而成的。由于理化性能稳定等特点,大晶体电熔镁成为一种优良的高温电气绝缘材料,主要应用于冶金、化工、电器、航天和国防等工业领域。超高温冶金产品是中国工业发展的重大需求。与低温工业流程相比,超高温冶炼流程更加复杂,且生产条件差、安全防护措施少,气、液、固的同时存在使得喷炉、爆炸等灾难性事故极易发生
[0003] 随着现代工业的迅速发展,现代企业中生产设备日趋大型化、连续化、高速化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各部门之间的联系也特别密切。实际的电熔镁生产过程是非常复杂的非线性过程。针对非线性的过程,一般采用核方法把低维数据映射到高维特征空间使其线性可分,或者采用一些流形学习方法对其进行降维。
[0004] 由于电熔镁过程的特殊性,在该过程中能监测到的传统物理变量十分有限,如果仅利用电流变量进行建模会造成信息提取不充分从而导致模型对电熔镁过程故障诊断效果不佳。因此除传统的电流变量外还需要额外对电熔镁过程中产生的图像数据进行监测。但是已有的研究成果局限于把物理变量数据和多媒体异构数据分开建模分别诊断,其做法忽视了大数据之间必然的联系,失去了大数据固有的优势。
[0005] 由于图像数据的特殊性且电熔镁过程图像具有多类别的特点,获取大量图像数据的标签是十分困难的。如果建模样本过少会导致所得模型过拟合且泛化能力减弱。解决标记样本不足的问题,一般采用半监督的方法,但传统半监督的方法没有考虑样本多类别的特点,对多样本数据建模时容易出现误分类的问题。

发明内容

[0006] 本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于丛流形核线性判别分析的工业过程故障监测方法,实现在数据是非线性和多类别的情况下降低误报警率的目的。
[0007] 为解决上述技术问题,本发明所采取的技术方案是:
[0008] 一种基于丛流形核线性判别分析的工业过程故障监测方法,包括以下步骤:
[0009] 步骤1:在电熔镁炉运行时采集若干组样本数据,这些样本数据有三个类别,分别是正常数据、喷炉数据、漏炉数据,对前N个采样样本,利用人工先验经验对其中l个样本做上类别标记,剩下u个未标记样本;具体采集方法为:
[0010] 在电熔镁的工业过程中利用摄像头采集电熔镁炉炉面图像数据,且在同一时刻采集电熔镁炉的三个电极的电流数据I=[I1,I2,I3];对图像数据中的每幅图片分别计算其0°、45°、90°和135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算其对比度、相关性、能量、同质性、熵五个特征值,每一幅图片得到一个20维的向量P=[p1,p2,…,p20];将I和P组合起来得到N个采样样本的最终建模矩阵为X=[x1,x2,…,xl,xl+1,…,xl+u],其中l+u=N,xi=[pi1,pi2,…,pi20,Ii1,Ii2,Ii3],i=1,2,…,N;
[0011] 步骤2:构建丛流形的邻接图矩阵;
[0012] 用步骤1得到的前N个采样样本x1,x2,…,xN,建立邻接图矩阵W∈N×N,如下式所示;
[0013] W=(1-γ)W1+γW2;
[0014] 其中,γ为线性系数,0≤γ≤1;W1∈N×N和W2∈N×N为邻接图矩阵W的两个部分;
[0015] 为矩阵W1第i行第j列上的值,由如下公式求得;
[0016]
[0017] 其中, 是第i个采样样本xi的第k个最近邻的点,k(xi)是xi的k个最近邻的点的集合;在此,欧式距离||xi-xj||为两点xi和xj的距离,距离越小则两点越接近;
[0018] W2=ATA,矩阵A∈N×N,aij为矩阵A第i行第j列上的值,矩阵A由如下公式,利用二次规划解得;
[0019]
[0020]
[0021] 其中, 且 和xi属于同一类;在此,两点xi和xj之间的距离由矩阵W1决定,即W1第i行第j列上的值 越大,两点之间距离越近;
[0022] 步骤3:在丛流形上利用核线性判别分析方法由如下公式求得特征矩阵α;
[0023]
[0024] 其中,γI为线性系数,0≤γI≤1;K∈N×N,是核矩阵,其第i行j列上的值kij=φ(xi,xj),φ(·)为核
函数;L∈N×N,为拉普拉斯矩阵,L=D-W;D∈N×N,是一个对角矩阵,其对角元素为矩阵W第i行元素之和;q=3,为数据类别数;mc为带标签样本中第c类的样本数;1c为一个N×1的列向量,其中对应的第c类数据处的值为1,其余位置的值为0;1l为一个N×1的列向量,其中对应的有标签数据处的值为1,其余位置的值为0;
[0025] 步骤4:利用特征矩阵α对电熔镁过程中产生的数据进行故障检测与诊断,新产生的图片及电流数据经特征提取后得到的向量为xnew,通过下式求得其投影tnew;
[0026] tnew=αTΦ(X,xnew);
[0027] 其中,Φ(X,xnew)∈N×1,其第i行上的元素为φ(xi,xnew),X∈23×N为样本矩阵,xi为该矩阵第i列向量;
[0028] 根据之前带标签的样本点的位置即可判断新样本所属类别;计算新样本的投影离各类别数据投影中心点的距离并进行比较,如果新样本的投影离正常样本的投影的中心点最近,则电熔镁炉在该时刻运行正常,如果新样本的投影离某一类故障样本的投影的中心点最近,则电熔镁炉在该时刻发生该类故障。
[0029] 采用上述技术方案所产生的有益效果在于:本发明提供的一种基于丛流形核线性判别分析的工业过程故障监测方法,主要解决数据的非线性和带标签样本过少及故障有多类的问题。相比传统的核线性判别分析方法,该方法在对多类别数据进行故障诊断时有效降低了误报率,且对故障所属类别判定的准确率有明显提高。

附图说明

[0030] 图1为电镕镁炉生产过程结构示意图;
[0031] 图2为本发明实施例提供的基于丛流形核线性判别分析的工业过程故障监测方法的流程图;
[0032] 图3为本发明实施例提供的基于丛流形核线性判别分析的工业过程故障监测方法对样本一的监测投影图;
[0033] 图4为本发明实施例提供的基于丛流形核线性判别分析的工业过程故障监测方法对样本二的监测投影图;
[0034] 图5为本发明实施例提供的基于丛流形核线性判别分析的工业过程故障监测方法对样本一的分类信息图;
[0035] 图6为本发明实施例提供的基于丛流形核线性判别分析的工业过程故障监测方法对样本二的分类信息图;
[0036] 图7为本发明实施例提供的传统核线性判别分析方法对样本一的监测投影图;
[0037] 图8为本发明实施例提供的传统核线性判别分析方法对样本二的监测投影图。
[0038] 图中:1、变压器;2、短网;3、电极升降装置;4、电极;5、炉壳;6、车体;7、电弧;8、炉料。

具体实施方式

[0039] 下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0040] 电熔镁炉的结构如图1所示,电熔镁炉主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。
[0041] 基于丛流形核线性判别分析的工业过程故障监测方法,如图2所示,本实施例的方法如下所述。
[0042] 步骤1:在电熔镁的工业过程中利用摄像头采集电熔镁炉炉面图像数据,且在同一时刻采集电熔镁炉的三个电极的电流数据I=[I1,I2,I3]。对图像数据中的每幅图片分别计算其0°、45°、90°、135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算其对比度、相关性、能量、同质性、熵等五个特征值。特征计算公式如下:
[0043]
[0044]
[0045]
[0046]
[0047]
[0048] 其中,p(i,j)是灰度共生矩阵第i行第j列上的值;ui和uj分别是灰度共生矩阵第i行和第j行的均值。ρi和ρj分别是灰度共生矩阵第i行和第j行的标准差。这样一幅图片可以得到一个20维的向量P=[p1,p2,…,p20]。将I和P组合起来,即可得到某时刻的最终建模向量为xi=[pi1,pi2,…,pi20,Ii1,Ii2,Ii3],i=1,2,…,N。对前N个采样样本,利用人工先验经验对其中l个样本做上类别标记,剩下u个未标记样本。这样最终得到的建模矩阵为X=[x1,x2,…,xl,xl+1,…,xl+u],其中l+u=N。 为标记数据, 为未标记数据。每个标记数据的信息记为yi∈{1,2,...q},其中q为分类类别数,q的值为3,分别为正常数据、喷炉数据和漏炉数据。
[0049] 本实施例中,在2个不同时刻采集2组数据,每组数据包含199个样本,第1-42个样本为正常数据,第43-141个样本为喷炉数据,第142-199为漏炉数据。每类数据有20组数据是带标签的,其它数据是不带标签的。第一组数据中前8个带标记的采样数据如表1所示。
[0050] 表1第一组数据中前8个带标记的采样数据
[0051]
[0052]
[0053] 步骤2:用步骤1得到的前N个采样样本x1,x2,……xN,建立邻接图矩阵W∈N×N。矩阵W分为两个部分外邻近关系图矩阵W1∈N×N和内邻近关系图矩阵W2∈N×N。
[0054] 令 为矩阵W1第i行第j列上的值,则由下面的公式可求得矩阵W1。
[0055]
[0056] 其中, 是第i个采样样本xi的第k个最近邻的点,k(xi)是xi的k个最近邻的点的集合; 是第j个采样样本xj的第k个最近邻的点,k(xj)是xj的k
个最近邻的点的集合。本实施例中,近邻参数k选为25。在此,两点xi和xj的距离为欧式距离||xi-xj||,两点之间距离越小则两点越接近。
[0057] 本实施例中,利用第一组数据求得的矩阵W1的前8行和前8列数据如表2所示。
[0058] 表2矩阵W1的前8行和前8列数据
[0059]
[0060]
[0061] 令矩阵A∈N×N,aij为矩阵A第i行第j列上的值,矩阵A可由如下公式,利用二次规划解得:
[0062]
[0063]
[0064] 其中, 且 和xi属于同一类,k(xi)是xi的k个最近邻的点的集合。在此,两点xi和xj之间的距离由矩阵W1决定,即W1第i行第j列上的值 越大,两点之间距离越近。T
在求得矩阵A后,最后可得W2=AA。
[0065] 本实施例中,利用第一组数据求得的矩阵W2的前8行和前8列数据如表3所示。
[0066] 表3矩阵W2的前8行和前8列数据
[0067]
[0068] 将W1和W2线性叠加即可得到最后的邻接图矩阵W,如下式所示。
[0069] W=(1-γ)W1+γW2
[0070] 其中,γ为线性系数,且0≤γ≤1。本实施例中,线性系数γ选为0.5。
[0071] 本实施例中,利用第一组数据求得的矩阵W的前8行和前8列数据如表4所示。
[0072] 表4矩阵W的前8行和前8列数据
[0073]
[0074] 步骤3:在丛流形上利用核线性判别分析方法求得特征矩阵α。
[0075] 类内散度矩阵Sw和类间散度矩阵Sb公式如下所示:
[0076]
[0077]
[0078] 其中,Xc表示带标签样本数据中第c类样本,Φ(x)是样本x在高维空间上的投影。是第c类样本在高维空间上投影的均值。uφ是所有带标签的样本在高维空间上投影的均值。为了让投影后的点保持类间距离、最大类内距离最小且保持数据在流形上的结构,构造如下目标函数:
[0079]
[0080]
[0081] 其中,γI为相应的线性系数,0≤γI≤1,L为拉普拉斯矩阵,P为投影矩阵,wij为邻接图矩阵W第i行第j列上的值。令上式目标函数的分母为1,则该优化问题可变为:
[0082]
[0083] s.t tr(PTSbP)=1
[0084] 由表示定理可得,该优化问题的解可写为 由于h(x)=PTΦ(x),所以可得
[0085]
[0086] 其中Φ(X)=[Φ(x1),Φ(x2),…,Φ(xN)],α=[α1T,α2T,…,αNT]T。根据上两式,最终可得到如下优化问题:
[0087]
[0088] s.t tr(αTMα)=1
[0089] 其中:
[0090] 且M和R中参数 和 可由如下公式求得:
[0091]
[0092] 其中,K∈N×N,是核矩阵,其第i行j列上的值kij=φ(xi,xj),φ(·)为核函数;L∈N×N,为拉普拉斯矩阵,L=D-W;D∈N×N,是一个对角矩阵,其对角元素 为矩阵W第i行元素之和;mc为带标签样本中第c类的样本数;1c为一个N×1的列向量,其中对应的第c类数据处的值为1,其余位置的值为0;1l为一个N×1的列向量,其中对应的有标签数据处的值为1,其余位置的值为0。
[0093] 由拉格朗日乘子法可知,α可由下面式子计算得到:
[0094]
[0095] 用线性判别分析方法进行降维后数据维数应小于等于数据类别数减1。因为电熔镁炉数据共有三种类别,所以应将数据降至2维,因此对矩阵 做特征值分解,取对应的特征值最大的两个特征向量组成的矩阵即可得到α。
[0096] 在本实施例中,利用第一组数据求得的矩阵α前20列数据如表5所示。
[0097] 表5矩阵α前20列数据
[0098]
[0099]
[0100] 步骤4:利用建立的模型即特征矩阵α对电熔镁过程中产生的数据进行故障检测与诊断,新产生的图片及电流数据经特征提取后得到的向量为xnew,求得其投影为tnew=αTΦ(X,xnew)。
[0101] 其中,Φ(X,xnew)∈N×1,其第i行上的元素为φ(xi,xnew),X∈23×N为样本矩阵,xi为该矩阵第i列向量。在实施例中的核函数采用高斯核函数,核参数选为12005。
[0102] 根据之前带标签的样本点的位置即可判断新数据所属类别。计算新样本的投影离各类别数据投影中心点的距离并进行比较。如果新样本的投影离正常样本的投影的中心点最近那么电熔镁炉在该时刻运行正常,如果新样本的投影离某一类故障样本的投影的中心点最近,那么电熔镁炉发生该类故障。
[0103] 本实施例中,利用第一组和第二组数据计算出来的投影图如附图3和4所示。在投影图中正常数据用方块表示,喷炉数据用圆圈表示,漏炉数据用菱形表示。由两张投影图可看出,不管是第一组数据还是第二组数据,它们不同类别数据的投影之间基本没有重叠部分样本,说明,分类效果很好。分类信息图如图5和图6所示,在分类信息图中,横坐标是样本编号,纵坐标表是类别信息,正常数据用圆形表示,喷炉数据用正方形表示,漏炉数据用三角形表示。
[0104] 将本实施例的方法与传统核线性判别分析算法做一下对比实验。利用各组中带标记样本建模,然后对剩下的数据进行诊断。图7和图8分别为用核线性判别分析方法求得的第一组和第二组数据的投影图。由图中可看出不同类别数据的投影有重叠部分,说明该方法对该数据诊断效果较差。
[0105] 计算两种方法的分类准确率,用算法判断类别正确的样本数除以总样本数即可得到该算法分类准确率。两种方法分类准确率如表6所示。
[0106] 表6两种方法分类准确率对比
[0107] 样本 样本1 样本2Semi-KLDA准确率(%) 92% 94%
KLDA确率(%) 57% 62%
[0108] 由上述分析可以看出,当面对多分类问题且带标记样本数量不足时传统的核线性判别分析方法准确率相当低,而本是实例提供的方法相对于传统方法检测准确率有很大提高,表明了本发明提供的基于丛流形核线性判别分析的工业过程故障监测方法的有效性,实现了对电镕镁炉工业生产过程的监测诊断。
[0109] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。