基于宽度学习的机电产品系统或设备实时故障诊断方法转让专利
申请号 : CN202110796980.0
文献号 : CN113419519B
文献日 : 2022-05-13
发明人 : 刘杰 , 王冲
申请人 : 北京航空航天大学
摘要 :
权利要求 :
1.一种基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,其包括以下步骤:
步骤1:采集机电产品系统或设备的故障状态和监测数据,获得历史监测数据;
步骤2:对所述步骤1获得的历史监测数据进行数据预处理,获得预处理后的数据集[X,Y],所述X为机电产品系统或设备故障状态相关变量,所述Y为机电产品系统或设备故障状态;
步骤3:在现有的宽度学习系统中引入代价敏感学习、设置随机失活层并采用投票式并行集成学习,获得改进宽度学习系统,所述改进宽度学习系统由N个加入代价参数和随机失活层的宽度学习系统集成所得,根据所述步骤2中获得的预处理后的数据集[X,Y],将所述机电产品系统或设备故障状态相关变量X作为所述改进宽度学习系统的输入,将所述机电产品系统或设备故障状态Y作为所述改进宽度学习系统的输出,计算得到所述机电产品系统或设备故障诊断模型,具体包括以下步骤:步骤31:所述步骤3在现有的宽度学习系统中引入代价敏感学习,具体为在现有宽度学习系统的输入层设置可调节的代价参数,所述可调节的代价参数的功能是将模型原始输入转变为代价敏感输入,所述可调节的代价参数为可调节的权重矩阵Λ:式中:K为输入到宽度学习系统中的样本总数量;λi为可调节参数;
当第i个样本是正常样本时,λi为1;
当第i个样本是故障样本时,λi为大于1的数值;
步骤32:所述步骤3在现有宽度学习系统中设置随机失活层,具体为在宽度学习系统的隐藏层设置随机失活层,所述宽度学习系统的隐藏层包括映射特征节点组和增强节点组,所述随机失活层的功能是使得映射特征节点和增强节点随机失活;在设置可调节的代价参数和随机失活层的宽度学习系统中输入所述机电产品系统或设备故障状态相关变量X,将所述机电产品系统或设备故障状态Y作为输出,计算得到输出权重W;根据所述输出权重W和机电产品系统或设备故障状态相关变量X,获得包含代价参数、隐藏层和随机失活层的单个分类器;
步骤33:采用投票式并行集成学习获得改进宽度学习系统,所述改进宽度学习系统由N个包含代价参数、隐藏层和随机失活层的宽度学习系统构成;在所述步骤32中的随机失活层选取N‑1个不同随机失活概率θ,获得N‑1个包含代价参数、隐藏层和随机失活层的宽度学习系统;对所述机电产品系统或设备故障状态相关变量X随机添加高斯白噪声获得N‑1组输入集;将所述N‑1组输入集对应输入所述N‑1个包含代价参数、隐藏层和随机失活层的宽度学习系统,所述机电产品系统或设备故障状态Y作为输出,根据所述步骤32获得单个分类器的方法建立N‑1个宽度学习系统分类器;根据所述N‑1个宽度学习系统分类器和所述步骤32获得的单个分类器,获得集成学习系统,所述集成学习系统包含N个分类器;集成学习输出结果集采用投票方式预测最终输出结果,获得机电产品或设备的故障诊断模型;
步骤4:采集实时监测数据,对所述实时监测数据进行与所述步骤2相同的数据预处理,获得预处理后的实时监测数据,所述预处理后的实时监测数据输入到所述步骤3获得的机电产品或设备故障诊断模型中,获得机电产品系统或设备的实时故障状态,完成故障诊断。
2.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述机电产品系统或设备故障状态相关变量X经过加入代价参数的输入层获n
得代价敏感输入ΛX,根据所述代价敏感输入ΛX计算隐藏层的n组随机映射特征节点Z 和mm
组增强节点E:
n
Z=[Z1,Z2,…,Zi,…,Zn]Zi=φi(ΛXWei+βei)m
E=[E1,E2,…,Ej,…,Em]n
Ej=ξj(ZWhj+βhj)式中:Zi为第i组映射特征;φi为非线性激活函数;Wei为通过稀疏自编码确定的最优输入权重矩阵;βei为通过稀疏自编码确定的最优输入偏置矩阵;权重矩阵Wei的维度为P×ν,P为X包含的变量列数;映射特征Zi包含ν个节点;Ej为第j组增强节点;ξj为非线性激活函数;
Whj和βhj分别为第j组高维特征所使用的随机矩阵和偏置矩阵,Whj和βhj的维度均为(∑nν)×η,映射特征Ej包含η个节点;
n m
将所述n组随机映射特征节点Z和m组增强节点E进行矩阵拼接获得考虑代价敏感学习的宽度学习系统的隐藏层H:
n m
H=[Z|E]。
3.根据权利要求2所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤32中在现有宽度学习系统中设置随机失活层,具体如下:Θ*H/(1‑θ)
式中:Θ为利用Bernoulli函数随机生成的随机失活概率θ的0,1向量;
所述设置可调节的代价参数和随机失活层的宽度学习系统的最终输出结果为:n m
Θ*H/(1‑θ)*W=Θ[Z|E]/(1‑θ)*W=Y利用岭回归计算所述输出权重W,根据所述输出权重W和机电产品系统或设备故障状态相关变量X,获得所述包含代价参数、隐藏层和随机失活层的单个分类器。
4.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤1中故障状态包括有故障和无故障。
5.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤1中监测数据为异构数据,所述异构数据包括连续特征、离散特征和信号特征。
6.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤2中的数据预处理包括对缺失值填充、替换异常值、处理量纲差距和数字化;所述异常值为明显超过系统或设备规定环境阈值的记录;所述处理量纲差距是指数据归一化,所述数据归一化为将所述机电产品系统或设备的监测数据转换为0以上1以下的数值型变量。
说明书 :
基于宽度学习的机电产品系统或设备实时故障诊断方法
技术领域
背景技术
交叉影响,一个很小的故障就很有可能引起连锁反应,从而导致整个系统的损毁。不仅会带
来巨大的经济损失,还有可能危及相关人员的生命安全。因此机电产品系统或设备的状态
监测与故障诊断在系统健康与安全管理中显得越来越重要,也逐渐成为研究者关注的焦
点。
系统的运维成本越来越高。一旦遭遇突发情况如震荡、撞击,或定期检查未能及时发现部件
的磨损和老化,系统就很有可能面临极大的风险。同时,定期维护也依赖于维修保障人员的
综合素质和能力,这使得系统受人为因素的干扰更甚。因此,精确、稳定的故障诊断技术在
机电产品系统运维中的需求越来越迫切,基于此的精准维修、提前维修也备受关注。
家系统模型、物理模型等传统算法研究其机理非常困难,甚至不可实现。而采用数据驱动模
型,则可以避免对设备先验知识的依赖,只需有足够多的相关监测数据和维修数据等,就可
以快速廉价地得到故障诊断模型。
习网络结构复杂且涉及大量超参数,不仅很难调整参数、结构,使得训练过程极度耗时,而
且在理论上分析深层结构也变得极其困难。当深度学习系统应用于复杂系统或设备状态监
测时,如若发生突然情况常会致使运维环境突变,现有的故障诊断模型不再适用,此时若能
及时更新、调整模型结构和参数来契合系统或设备当前的状态,则会有效保障系统和设备
的可靠性。
路,避免了深层次结构的同时,通过增量学习的方式进行网络拓展,极大地提高了模型训练
和优化的效率。BLS可以很好地平衡模型精度和效率,其效果在提出后不久便在包括故障诊
断在内的各个领域得到了验证。在故障诊断领域,BLS也具有较好的适应性、较快的计算速
度和较高的分类精度。但BLS目前大多被用于如转子、轴承等设备的故障诊断,监测数据类
型统一且维度较低。当前故障诊断领域对BLS的应用和改进主要偏向于提高分类精度,如与
现有的特征提取方法主成分分析法、Hilbert变化相结合等,没有针对故障诊断领域常遇到
的类别不平衡问题进行全面考虑。并且,对BLS模型参数和结构稳定性的考虑也比较欠缺。
发明内容
到复杂系统或设备的状态监测数据存在严重类别不平衡问题,以不增加运算负担的代价敏
感学习对模型进行改进,旨在建立能应用于实际的高效故障诊断模型。为解决模型结构和
参数难以确定的问题,以及降低不确定因素的影响,本发明在BLS中加入Dropout层并采用
了集成学习,在满足诊断精度要求的基础上,实现对机电产品系统或设备健康状态的实时
监测。
障状态;
机失活层的宽度学习系统集成所得,根据所述步骤2中获得的预处理后的数据集[X,Y],将
所述机电产品系统或设备故障状态相关变量X作为所述改进宽度学习系统的输入,将所述
机电产品系统或设备故障状态Y作为所述改进宽度学习系统的输出,计算得到所述机电产
品系统或设备故障诊断模型,具体包括以下步骤:
输入转变为代价敏感输入,所述可调节的代价参数为可调节的权重矩阵Λ:
组,所述随机失活层的功能是使得映射特征节点和增强节点随机失活;在设置可调节的代
价参数和随机失活层的宽度学习系统中输入所述机电产品系统或设备故障状态相关变量
X,将所述机电产品系统或设备故障状态Y作为输出,计算得到输出权重W;根据所述输出权
重W和机电产品系统或设备故障状态相关变量X,获得包含代价参数、隐藏层和随机失活层
的单个分类器;
失活层选取N‑1个不同随机失活概率θ,获得N‑1个包含代价参数、隐藏层和随机失活层的宽
度学习系统;对所述机电产品系统或设备故障状态相关变量X随机添加高斯白噪声获得N‑1
组输入集;将所述N‑1组输入集对应输入所述N‑1个包含代价参数、隐藏层和随机失活层的
宽度学习系统,所述机电产品系统或设备故障状态Y作为输出,根据所述步骤32获得单个分
类器的方法建立N‑1个宽度学习系统分类器;根据所述N‑1个宽度学习系统分类器和所述步
骤32获得的单个分类器,获得集成学习系统,所述集成学习系统包含N个分类器;集成学习
输出结果集采用投票方式预测最终输出结果,获得机电产品或设备的故障诊断模型;
的机电产品或设备故障诊断模型中,获得机电产品系统或设备的实时故障状态,完成故障
诊断。
层获得代价敏感输入ΛX,根据所述代价敏感输入ΛX计算隐藏层的n组随机映射节点Z 和m
m
组增强节点E:
×ν,P为X包含的变量列数;映射特征Zi包含ν个节点;Ej为第j组增强节点;ξj为非线性激活
函数;Whj和βhj分别为第j组高维特征所使用的随机矩阵和偏置矩阵,Whj和βhj的维度均为
(∑nν)×η,映射特征Ej包含η个节点;
差距是指数据归一化,所述数据归一化为将所述机电产品系统或设备的监测数据转换为0
以上1以下的数值型变量
例如故障预测等具有指导和借鉴意义。
附图说明
具体实施方式
即可将监测数据转换为数值型数据。本申请基于预处理后得到的数值型数据进行研究,这
里数值型数据包含连续特征和离散特征。
障特征变量,根据剩下的离散数据故障特征变量和连续数据故障特征变量来进行后续研
究。
的异常值指人为判定为异常记录的数据,比如风速、温度等记录明显超过系统或设备规定
环境阈值的记录,比如设备规定操作温度范围0~50摄氏度,则应删除监测数据中明显超出
规定范围(如100摄氏度以上)的温度记录。处理量纲差距为数据归一化,是为了平衡数值变
量之间的维度差异。监测数据经归一化转换为0以上1以下的数值型变量。
分。
平衡的影响,还可以大大提高异常状态的识别准确率及检出率。
输入,本发明中可调节的代价参数为可调节的权重矩阵Λ:
列数,Q为Y中变量的列数,则代价敏感输入为ΛX,如图2所示,由代价输入数据ΛX可计算得
n
到n组映射特征节点Z:
偏置矩阵;这里权重Wei和偏置βei都是随机产生的,且每个映射特征组Zi中的节点数目由权
重Wei和偏置βei的维数决定,即若输入X的维度为K×P且权重Wei的维度是P×ν,则Zi具有ν个
映射特征组节点。
节点。
即将机电产品系统或设备故障状态Y作为宽度学习系统的输出,那么可以得到式(6)如下:
量,其维度与隐藏层节点总数L=nν+mη相同。Θ*H可表示让H中的节点以概率θ随机失效,且
为保持总节点的期望不变,还需对Dropout后的节点权重进行缩放,则随机失活后的隐藏层
H′为:
输出权重W 的公式,引入了符号D和B,符号D和B分别对应式(13)和式(14):
的伪逆,就能快速得到新的输出权重W 。根据新的输出权重W 可以得到包含代价参数、隐
藏层、随机失活层的单个分类器。
中随机添加高斯白噪声获得N‑1组输入集;将该N‑1组输入集对应输入N‑1个包含代价参数、
隐藏层和随机失活层的宽度学习系统,将机电产品系统或设备故障状态Y作为输出,根据前
述步骤32获得单个分类器的方法建立N‑1个宽度学习系统分类器;根据该N‑1个宽度学习系
统分类器和步骤32获得的单个分类器,获得集成学习系统,该集成学习系统包含N个分类
器;集成学习输出结果集采用投票方式预测最终输出结果,获得机电产品或设备的故障诊
断模型;
结构和参数的负担,并且能够提高实际应用时的鲁棒性。
到步骤3获得的机电产品系统或设备故障诊断模型中,获得机电产品系统或设备的实时监
测数据的故障状态,完成故障诊断。
价敏感输入随机添加白噪声,并选取不同的随机失活概率,构建多个分类器,组成集成学习
系统;机电产品系统或设备的实时监测数据进行数据处理后,可由集成学习系统内多个分
类器投票输出其实时故障状态。
在保证一定精度的前提下大大降低模型训练时间,且所提出的方法能很好地处理类别不平
衡问题,实验流程如图3所示。
温度、蓄电池电压、检测到的打滑或滑动、ED制动状态、TCL制动状态、达到的制动力等。出于
保密原则,这里不能详细列出这些变量,并将它们命名为Var1、Var2、…、Var43。这43个变量
并非都对故障检测任务有用。
要将原始数据中的一些变量转换为数值。经数据处理后,输入数据中的43个变量都变为[0,
1]之间的数值型变量。
本文只区分制动系统有故障或无故障。正常状态有28837个数据点,故障状态只有159个,数
据存在严重不平衡性。
增加,直至测试精度基本保持不变或下降时为止。在同样的运行环境下,通过10次交叉验
证,模型输出平均训练时间、以及测试结果中故障类的平均G‑mean和平均F1‑score。
有效的方法之一。这种方法将数据点之间的相似性转换为概率,通过将高维数据投影到二
维或三维空间,可以实现高维数据的可视化。由于使用所有数据时,故障样本会完全被覆盖
住,因此图中只显示了正常样本的10%。经比较,图中10%正态样本与整个数据集的t‑SNE
投影分布基本一致。
大值。因此需采用两者的综合指标来评估算法泛化精度,由于实际场景中希望两个指标同
大,因此本文中综合指标取两者的几何平均值F‑G,而不是算术平均值。
G‑means 0.78429 0.94894 0.86645
F‑G 0.68864 0.9217 0.80284
平均训练时长(s) 1.847 1.917 8.623
G‑means 0.95519 0.95743 0.95743
F‑G 0.93138 0.91789 0.93683
平均训练时长(s) 10.147 232.652 76.899
实验仅基于高速列车运行一年的监测数据,可以预见,在数据量非常大的情况下,即监测数
据起始时间点较远时,BLS的高效性会得到更大的体现。
的同时,训练时长大大降低,如遇突发状况可以迅速更新诊断模型;加入Dropout层和集成
学习,提升了模型的适用性、稳定性和鲁棒性,不同场景下均可使用该模型结构和参数。
做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。