基于宽度学习的机电产品系统或设备实时故障诊断方法转让专利

申请号 : CN202110796980.0

文献号 : CN113419519B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘杰王冲

申请人 : 北京航空航天大学

摘要 :

本发明提供一种基于宽度学习的机电产品系统或设备实时故障诊断方法,其在传统宽度学习系统基础上,提供包括损失函数优化,即代价敏感学习、随机失活Dropout和集成学习多种方法,获得改进的宽度学习系统。针对实际监测数据存在不同数据类型、类别严重不平衡等问题,本发明在保障训练和优化效率前提下,将代价权重、失活概率等设置为可调节参数,并仿照装袋算法bagging进行集成学习投票预测最终结果,解决故障诊断中普遍存在的不确定影响及类别不平衡问题;基于改进宽度学习系统训练快速、预测精准且稳定性、鲁棒性高,应用于实时监测复杂系统或设备的健康状态,能够预防故障并提供维修建议。

权利要求 :

1.一种基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,其包括以下步骤:

步骤1:采集机电产品系统或设备的故障状态和监测数据,获得历史监测数据;

步骤2:对所述步骤1获得的历史监测数据进行数据预处理,获得预处理后的数据集[X,Y],所述X为机电产品系统或设备故障状态相关变量,所述Y为机电产品系统或设备故障状态;

步骤3:在现有的宽度学习系统中引入代价敏感学习、设置随机失活层并采用投票式并行集成学习,获得改进宽度学习系统,所述改进宽度学习系统由N个加入代价参数和随机失活层的宽度学习系统集成所得,根据所述步骤2中获得的预处理后的数据集[X,Y],将所述机电产品系统或设备故障状态相关变量X作为所述改进宽度学习系统的输入,将所述机电产品系统或设备故障状态Y作为所述改进宽度学习系统的输出,计算得到所述机电产品系统或设备故障诊断模型,具体包括以下步骤:步骤31:所述步骤3在现有的宽度学习系统中引入代价敏感学习,具体为在现有宽度学习系统的输入层设置可调节的代价参数,所述可调节的代价参数的功能是将模型原始输入转变为代价敏感输入,所述可调节的代价参数为可调节的权重矩阵Λ:式中:K为输入到宽度学习系统中的样本总数量;λi为可调节参数;

当第i个样本是正常样本时,λi为1;

当第i个样本是故障样本时,λi为大于1的数值;

步骤32:所述步骤3在现有宽度学习系统中设置随机失活层,具体为在宽度学习系统的隐藏层设置随机失活层,所述宽度学习系统的隐藏层包括映射特征节点组和增强节点组,所述随机失活层的功能是使得映射特征节点和增强节点随机失活;在设置可调节的代价参数和随机失活层的宽度学习系统中输入所述机电产品系统或设备故障状态相关变量X,将所述机电产品系统或设备故障状态Y作为输出,计算得到输出权重W;根据所述输出权重W和机电产品系统或设备故障状态相关变量X,获得包含代价参数、隐藏层和随机失活层的单个分类器;

步骤33:采用投票式并行集成学习获得改进宽度学习系统,所述改进宽度学习系统由N个包含代价参数、隐藏层和随机失活层的宽度学习系统构成;在所述步骤32中的随机失活层选取N‑1个不同随机失活概率θ,获得N‑1个包含代价参数、隐藏层和随机失活层的宽度学习系统;对所述机电产品系统或设备故障状态相关变量X随机添加高斯白噪声获得N‑1组输入集;将所述N‑1组输入集对应输入所述N‑1个包含代价参数、隐藏层和随机失活层的宽度学习系统,所述机电产品系统或设备故障状态Y作为输出,根据所述步骤32获得单个分类器的方法建立N‑1个宽度学习系统分类器;根据所述N‑1个宽度学习系统分类器和所述步骤32获得的单个分类器,获得集成学习系统,所述集成学习系统包含N个分类器;集成学习输出结果集采用投票方式预测最终输出结果,获得机电产品或设备的故障诊断模型;

步骤4:采集实时监测数据,对所述实时监测数据进行与所述步骤2相同的数据预处理,获得预处理后的实时监测数据,所述预处理后的实时监测数据输入到所述步骤3获得的机电产品或设备故障诊断模型中,获得机电产品系统或设备的实时故障状态,完成故障诊断。

2.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述机电产品系统或设备故障状态相关变量X经过加入代价参数的输入层获n

得代价敏感输入ΛX,根据所述代价敏感输入ΛX计算隐藏层的n组随机映射特征节点Z 和mm

组增强节点E:

n

Z=[Z1,Z2,…,Zi,…,Zn]Zi=φi(ΛXWei+βei)m

E=[E1,E2,…,Ej,…,Em]n

Ej=ξj(ZWhj+βhj)式中:Zi为第i组映射特征;φi为非线性激活函数;Wei为通过稀疏自编码确定的最优输入权重矩阵;βei为通过稀疏自编码确定的最优输入偏置矩阵;权重矩阵Wei的维度为P×ν,P为X包含的变量列数;映射特征Zi包含ν个节点;Ej为第j组增强节点;ξj为非线性激活函数;

Whj和βhj分别为第j组高维特征所使用的随机矩阵和偏置矩阵,Whj和βhj的维度均为(∑nν)×η,映射特征Ej包含η个节点;

n m

将所述n组随机映射特征节点Z和m组增强节点E进行矩阵拼接获得考虑代价敏感学习的宽度学习系统的隐藏层H:

n m

H=[Z|E]。

3.根据权利要求2所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤32中在现有宽度学习系统中设置随机失活层,具体如下:Θ*H/(1‑θ)

式中:Θ为利用Bernoulli函数随机生成的随机失活概率θ的0,1向量;

所述设置可调节的代价参数和随机失活层的宽度学习系统的最终输出结果为:n m

Θ*H/(1‑θ)*W=Θ[Z|E]/(1‑θ)*W=Y利用岭回归计算所述输出权重W,根据所述输出权重W和机电产品系统或设备故障状态相关变量X,获得所述包含代价参数、隐藏层和随机失活层的单个分类器。

4.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤1中故障状态包括有故障和无故障。

5.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤1中监测数据为异构数据,所述异构数据包括连续特征、离散特征和信号特征。

6.根据权利要求1所述的基于宽度学习的机电产品系统或设备的实时故障诊断方法,其特征在于,所述步骤2中的数据预处理包括对缺失值填充、替换异常值、处理量纲差距和数字化;所述异常值为明显超过系统或设备规定环境阈值的记录;所述处理量纲差距是指数据归一化,所述数据归一化为将所述机电产品系统或设备的监测数据转换为0以上1以下的数值型变量。

说明书 :

基于宽度学习的机电产品系统或设备实时故障诊断方法

技术领域

[0001] 本申请涉及故障诊断领域,具体地涉及针对机电产品系统或设备故障诊断采用宽度学习系统实现对故障状态的实时、精准监测一种故障诊断方法。

背景技术

[0002] 随着信息科技和人工智能水平的飞速发展,机电产品综合化、智能化程度不断提高的同时,其复杂度和风险系数也大大提升。机电产品在运行过程中各部件联系紧密,极易
交叉影响,一个很小的故障就很有可能引起连锁反应,从而导致整个系统的损毁。不仅会带
来巨大的经济损失,还有可能危及相关人员的生命安全。因此机电产品系统或设备的状态
监测与故障诊断在系统健康与安全管理中显得越来越重要,也逐渐成为研究者关注的焦
点。
[0003] 为确保机电产品安全、平稳运行,现阶段主要采用定期检查保养、更换部件等相对保守的运维策略进行日常保养,但这不仅无法从根本上提高系统的可靠性、鲁棒性,也使得
系统的运维成本越来越高。一旦遭遇突发情况如震荡、撞击,或定期检查未能及时发现部件
的磨损和老化,系统就很有可能面临极大的风险。同时,定期维护也依赖于维修保障人员的
综合素质和能力,这使得系统受人为因素的干扰更甚。因此,精确、稳定的故障诊断技术在
机电产品系统运维中的需求越来越迫切,基于此的精准维修、提前维修也备受关注。
[0004] 当前,可用于故障诊断的方法有很多,如专家系统模型、物理模型、数据驱动模型等。由于复杂系统或设备设计时遵循故障导向安全原则,功能、结构复杂且存在冗余,用专
家系统模型、物理模型等传统算法研究其机理非常困难,甚至不可实现。而采用数据驱动模
型,则可以避免对设备先验知识的依赖,只需有足够多的相关监测数据和维修数据等,就可
以快速廉价地得到故障诊断模型。
[0005] 数据驱动模型中,深度学习网络是非常常见的算法。其在处理高维数据和建立复杂非线性模型方面具有得天独厚的优势,因此被广泛使用于各种领域。然而,大多数深度学
习网络结构复杂且涉及大量超参数,不仅很难调整参数、结构,使得训练过程极度耗时,而
且在理论上分析深层结构也变得极其困难。当深度学习系统应用于复杂系统或设备状态监
测时,如若发生突然情况常会致使运维环境突变,现有的故障诊断模型不再适用,此时若能
及时更新、调整模型结构和参数来契合系统或设备当前的状态,则会有效保障系统和设备
的可靠性。
[0006] 因此,以提高模型训练速度为目的的深度网络及相关方法逐渐引起人们的关注。其中,宽度学习系统(Broad Learning System,BLS)提供了一种替代深度学习网络的新思
路,避免了深层次结构的同时,通过增量学习的方式进行网络拓展,极大地提高了模型训练
和优化的效率。BLS可以很好地平衡模型精度和效率,其效果在提出后不久便在包括故障诊
断在内的各个领域得到了验证。在故障诊断领域,BLS也具有较好的适应性、较快的计算速
度和较高的分类精度。但BLS目前大多被用于如转子、轴承等设备的故障诊断,监测数据类
型统一且维度较低。当前故障诊断领域对BLS的应用和改进主要偏向于提高分类精度,如与
现有的特征提取方法主成分分析法、Hilbert变化相结合等,没有针对故障诊断领域常遇到
的类别不平衡问题进行全面考虑。并且,对BLS模型参数和结构稳定性的考虑也比较欠缺。

发明内容

[0007] 为了克服现有技术的不足,本发明的目的是提出一种基于宽度学习的机电产品系统或设备实时故障诊断方法,本发明在现有BLS应用于机电产品的故障诊断的基础上,考虑
到复杂系统或设备的状态监测数据存在严重类别不平衡问题,以不增加运算负担的代价敏
感学习对模型进行改进,旨在建立能应用于实际的高效故障诊断模型。为解决模型结构和
参数难以确定的问题,以及降低不确定因素的影响,本发明在BLS中加入Dropout层并采用
了集成学习,在满足诊断精度要求的基础上,实现对机电产品系统或设备健康状态的实时
监测。
[0008] 为实现上述目的,本发明所采用的解决方案为:
[0009] 一种基于宽度学习的机电产品系统或设备实时故障诊断方法,其包括以下步骤:
[0010] 步骤1:采集机电产品系统或设备的故障状态和监测数据,获得历史监测数据;
[0011] 步骤2:对所述步骤1获得的历史监测数据进行数据预处理,获得预处理后的数据集[X,Y],所述X为机电产品系统或设备故障状态相关变量,所述Y为机电产品系统或设备故
障状态;
[0012] 步骤3:在现有的宽度学习系统中引入代价敏感学习、设置随机失活层并采用投票式并行集成学习,获得改进宽度学习系统,所述改进宽度学习系统由N个加入代价参数和随
机失活层的宽度学习系统集成所得,根据所述步骤2中获得的预处理后的数据集[X,Y],将
所述机电产品系统或设备故障状态相关变量X作为所述改进宽度学习系统的输入,将所述
机电产品系统或设备故障状态Y作为所述改进宽度学习系统的输出,计算得到所述机电产
品系统或设备故障诊断模型,具体包括以下步骤:
[0013] 步骤31:所述步骤3在现有的宽度学习系统中引入代价敏感学习,具体为在现有宽度学习系统的输入层设置可调节的代价参数,所述可调节的代价参数的功能是将模型原始
输入转变为代价敏感输入,所述可调节的代价参数为可调节的权重矩阵Λ:
[0014]
[0015] 式中:K为输入到宽度学习系统中的样本总数量;λi为可调节参数;
[0016] 当第i个样本是正常样本时,λi为1;
[0017] 当第i个样本是故障样本时,λi为大于1的数值;
[0018] 步骤32:所述步骤3在现有宽度学习系统中设置随机失活层,具体为在宽度学习系统的隐藏层设置随机失活层,所述宽度学习系统的隐藏层包括映射特征节点组和增强节点
组,所述随机失活层的功能是使得映射特征节点和增强节点随机失活;在设置可调节的代
价参数和随机失活层的宽度学习系统中输入所述机电产品系统或设备故障状态相关变量
X,将所述机电产品系统或设备故障状态Y作为输出,计算得到输出权重W;根据所述输出权
重W和机电产品系统或设备故障状态相关变量X,获得包含代价参数、隐藏层和随机失活层
的单个分类器;
[0019] 步骤33:采用投票式并行集成学习获得改进宽度学习系统,所述改进宽度学习系统由N个包含代价参数、隐藏层和随机失活层的宽度学习系统构成;在所述步骤32中的随机
失活层选取N‑1个不同随机失活概率θ,获得N‑1个包含代价参数、隐藏层和随机失活层的宽
度学习系统;对所述机电产品系统或设备故障状态相关变量X随机添加高斯白噪声获得N‑1
组输入集;将所述N‑1组输入集对应输入所述N‑1个包含代价参数、隐藏层和随机失活层的
宽度学习系统,所述机电产品系统或设备故障状态Y作为输出,根据所述步骤32获得单个分
类器的方法建立N‑1个宽度学习系统分类器;根据所述N‑1个宽度学习系统分类器和所述步
骤32获得的单个分类器,获得集成学习系统,所述集成学习系统包含N个分类器;集成学习
输出结果集采用投票方式预测最终输出结果,获得机电产品或设备的故障诊断模型;
[0020] 步骤4:采集实时监测数据,对所述实时监测数据进行与所述步骤2相同的数据预处理,获得预处理后的实时监测数据,所述预处理后的实时监测数据输入到所述步骤3获得
的机电产品或设备故障诊断模型中,获得机电产品系统或设备的实时故障状态,完成故障
诊断。
[0021] 进一步,所述机电产品系统或设备故障状态相关变量X经过加入代价参数的输入n
层获得代价敏感输入ΛX,根据所述代价敏感输入ΛX计算隐藏层的n组随机映射节点Z 和m
m
组增强节点E:
[0022] Zn=[Z1,Z2,…,Zi,…,Zn]
[0023] Zi=φi(ΛXWei+βei)
[0024] Em=[E1,E2,…,Ej,…,Em]
[0025] Ej=ξj(Z′nWhj+βhj)
[0026] 式中:Zi为第i组映射特征;φi为非线性激活函数;Wei为通过稀疏自编码确定的最优输入权重矩阵;βei为通过稀疏自编码确定的最优输入偏置矩阵;权重矩阵Wei的维度为P
×ν,P为X包含的变量列数;映射特征Zi包含ν个节点;Ej为第j组增强节点;ξj为非线性激活
函数;Whj和βhj分别为第j组高维特征所使用的随机矩阵和偏置矩阵,Whj和βhj的维度均为
(∑nν)×η,映射特征Ej包含η个节点;
[0027] 将所述n组随机映射特征节点Zn和m组增强节点Em进行矩阵拼接获得考虑代价敏感学习的宽度学习系统的隐藏层H:
[0028] H=[Zn|Em]。
[0029] 更进一步,所述步骤32中在现有宽度学习系统中设置随机失活层,具体如下:
[0030] Θ*H/(1‑θ)
[0031] 式中:Θ为利用Bernoulli函数随机生成的随机失活概率θ的0,1向量;
[0032] 所述设置可调节的代价参数和随机失活层的宽度学习系统的最终输出结果为:
[0033] Θ*H/(1‑θ)*W=Θ[Zn|Em]/(1‑θ)*W=Y
[0034] 利用岭回归计算所述输出权重W,根据所述输出权重W和机电产品系统或设备故障状态相关变量X,获得所述包含代价参数、隐藏层和随机失活层的单个分类器。
[0035] 可优选的是,所述步骤1中故障状态包括有故障和无故障。
[0036] 可优选的是,所述步骤1中监测数据为异构数据,所述异构数据包括连续特征、离散特征和信号特征。
[0037] 可优选的是,所述步骤2中的数据预处理包括对缺失值填充、替换异常值、处理量纲差距和数字化;所述异常值为明显超过系统或设备规定环境阈值的记录;所述处理量纲
差距是指数据归一化,所述数据归一化为将所述机电产品系统或设备的监测数据转换为0
以上1以下的数值型变量
[0038] 与现有技术相比,本发明的有益效果在于:
[0039] 1、在现有宽度学习系统基础上,采用代价敏感学习充分利用原始数据,基本不增加运算负担;
[0040] 2、代价敏感参数和随机失活概率参数均设置为可调节参数,灵活性和适应性更高;
[0041] 3、融入了随机失活和集成学习,使得模型结构和参数稳定,通用性强;
[0042] 4、基于改进的宽度学习系统不仅训练快速、预测精准且稳定性、鲁棒性高,应用于实时监测复杂系统或设备的故障状态,能够预防故障并提供维修建议,对其他算法和场景,
例如故障预测等具有指导和借鉴意义。

附图说明

[0043] 图1为本发明实施例的基于宽度学习的机电产品系统或设备实时故障诊断方法的流程框图;
[0044] 图2为本发明实施例的包含代价参数、隐藏层和随机失活层的单个宽度学习系统分类器的结构图;
[0045] 图3为本发明实施例中基于实例验证本发明有效性的对比实验流程图;
[0046] 图4为发明本实施例中典型机电产品——高铁制动系统运行一年健康状态监测数据的t‑SNE投影概图。

具体实施方式

[0047] 以下,参照附图对本发明的实施方式进行说明。
[0048] 本发明实施例提供了一种基于宽度学习的机电产品系统或设备实时故障诊断方法,如图1所示,具体步骤包括:
[0049] 步骤1:采集一段时间内机电产品系统或设备的故障状态以及相关监测数据做为历史监测数据;
[0050] 一般情况下,采集到的系统或设备故障状态监测数据为异构数据,包括连续特征、离散特征和信号特征。
[0051] 步骤2:对历史监测数据进行数据预处理,包括对缺失值、异常值、量纲差距和数字化处理等,得到预处理后的数据集[X,Y]。提取信号特征的关键指标并将离散特征数字化,
即可将监测数据转换为数值型数据。本申请基于预处理后得到的数值型数据进行研究,这
里数值型数据包含连续特征和离散特征。
[0052] 如果原始故障特征变量数据集离散数据故障特征变量中包含仅有一种状态的故障特征变量,那么对于从数据中诊断系统是否故障来说是没有价值的,所以需删除这类故
障特征变量,根据剩下的离散数据故障特征变量和连续数据故障特征变量来进行后续研
究。
[0053] 机电产品系统或设备故障状态相关变量X作为改进宽度学习系统的输入。首先需要对历史监测数据进行数据清理和转换,如填充缺失值、替换异常值、处理量纲差距。这里
的异常值指人为判定为异常记录的数据,比如风速、温度等记录明显超过系统或设备规定
环境阈值的记录,比如设备规定操作温度范围0~50摄氏度,则应删除监测数据中明显超出
规定范围(如100摄氏度以上)的温度记录。处理量纲差距为数据归一化,是为了平衡数值变
量之间的维度差异。监测数据经归一化转换为0以上1以下的数值型变量。
[0054] 机电产品系统或设备故障状态Y作为改进宽度学习系统的输出,即是否故障。系统或设备可能会发生各种不同的故障,本发明中只区分有故障和无故障,不进行故障类型区
分。
[0055] 步骤3:采用宽度学习系统进行故障诊断,针对复杂系统和设备故障诊断中不确定影响和类别不平衡问题作出以下几种改进,获得改进的宽度学习系统:
[0056] 步骤31:为充分利用已有数据的信息,并尽可能不增加运算负担,本发明在深入分析宽度学习系统的基础上,将代价敏感学习加入宽度学习系统中,不仅可以有效降低类不
平衡的影响,还可以大大提高异常状态的识别准确率及检出率。
[0057] 在现有的宽度学习系统中引入代价敏感学习,是指在现有宽度学习系统的输入层设置可调节的代价参数,这里可调节的代价参数的功能是将模型原始输入转变为代价敏感
输入,本发明中可调节的代价参数为可调节的权重矩阵Λ:
[0058]
[0059] 式中:K为输入到宽度学习系统中的样本总数量;λi为可调节参数;
[0060] 当第i个样本是正常样本时,λi为1;
[0061] 当第i个样本是故障样本时,λi为大于1的数值,记为λ。
[0062] 在训练单个宽度学习系统分类器时逐步增大λ直至模型预测精确度,即预测正确的样本占总样本比例趋于稳定或开始下降,则可得到近似的局部最优解。
[0063] 假设预处理后的数据集为[X,Y]∈RK×(P+Q),K是机电产品系统或设备监测数据中包含的总样本量,即输入到宽度学习系统中的样本总数量,也是数据总行数,P为X包含的变量
列数,Q为Y中变量的列数,则代价敏感输入为ΛX,如图2所示,由代价输入数据ΛX可计算得
n
到n组映射特征节点Z:
[0064] Zn=[Z1,Z2,…,Zi,…,Zn]                (1)
[0065] Zi=φi(XWei+βei)                   (2)
[0066] 其中:X∈RK×P为K个P维的原始输入数据;Zi为第i组映射特征;φi为非线性激活函数;Wei是通过稀疏自编码确定的最优输入权重矩阵;βei是通过稀疏自编码确定的最优输入
偏置矩阵;这里权重Wei和偏置βei都是随机产生的,且每个映射特征组Zi中的节点数目由权
重Wei和偏置βei的维数决定,即若输入X的维度为K×P且权重Wei的维度是P×ν,则Zi具有ν个
映射特征组节点。
[0067] 进一步利用增强特征节点对随机的映射特征节点进行补充,可得m组增强节点Em:
[0068] Em=[E1,E2,…,Ej,…,Em]                (3)
[0069] Ej=ξj(ZnWhj+βhj)                     (4)
[0070] 其中:Ej为第j组增强节点;ξj为非线性激活函数;Whj和βhj分别为第j组高维特征所使用的随机矩阵和偏置矩阵,且也是随机产生的,维数为(∑nν)×η,增强节点组Ej包含η个
节点。
[0071] 将Zn={Z1,Z2,...,Zn}与Em={E1,E2,...,Em}进行矩阵拼接,得到宽度学习系统的实际输入H,即考虑代价敏感学习的宽度学习系统的隐藏层:
[0072] H=[Zn|Em]          (5)
[0073] 将结果H=[Zn|Em]作为宽度学习系统的实际输入,则模型的最终输出结果为HW,其中W为输出权重,该结果对应前述预处理后的数据集中的机电产品系统或设备故障状态Y,
即将机电产品系统或设备故障状态Y作为宽度学习系统的输出,那么可以得到式(6)如下:
[0074] HW=[Zn|Em]W=Y                 (6)
[0075] 利用岭回归求解输出权重W可得:
[0076]
[0077] 其中:值c表示对输出权重W平方权重和的进一步约束;L为隐藏层节点总数;I为L阶单位矩阵;*T为矩阵转置运算;这里隐藏层节点总数L为:
[0078] L=nν+mη           (8)
[0079] 式中:ν为映射特征组Zi包含的节点数;η为增强节点组Ej包含的节点数。
[0080] 步骤32:在宽度学习系统的隐藏层设置随机失活层,提高模型结构和参数的稳定性;
[0081] 在BLS中引入Dropout则是针对考虑代价敏感学习的宽度学习系统的隐藏层H来进行节点的随机删除,为此首先利用Bernoulli函数随机生成一个概率θ向量Θ,即一个0,1向
量,其维度与隐藏层节点总数L=nν+mη相同。Θ*H可表示让H中的节点以概率θ随机失效,且
为保持总节点的期望不变,还需对Dropout后的节点权重进行缩放,则随机失活后的隐藏层
H′为:
[0082] H′=Θ*H'/(1‑θ) (9)
[0083] 此时,将宽度学习系统故障状态输出Y作为宽度学习系统的输出:
[0084] Θ*HW′/(1‑θ)=Y (10)
[0085] 利用岭回归获得随机失活后的输出权重W′:
[0086]
[0087] 当新增加p个增强节点时,相当于在矩阵H′增加p列,新的隐藏层Hm+1记为:
[0088]
[0089] 式中: 和 分别为所述p个增强节点的随机矩阵和偏置矩阵,它们的维度为包含p个节点;
[0090] 根据宽度学习系统的增强学习算法,推导出新的输出权重Wm+1,其中为了简化表示m+1 T T
输出权重W 的公式,引入了符号D和B,符号D和B分别对应式(13)和式(14):
[0091]
[0092] 其中(H′)+为H′的伪逆矩阵,具体为:
[0093]
[0094] 其中:ε为对单位矩阵I进行约束的调节参数;
[0095]
[0096] 式(12)中引入了符号C对应式(13):
[0097]
[0098] 其中(C)+为C的伪逆矩阵,具体为:
[0099]
[0100] 引入了符号D和BT后输出权重Wm+1具体为:
[0101]
[0102] 宽度学习系统增加增强节点后,并不需要重新计算所有权重,只需计算相应节点m+1 m+1
的伪逆,就能快速得到新的输出权重W 。根据新的输出权重W 可以得到包含代价参数、隐
藏层、随机失活层的单个分类器。
[0103] 步骤33:采用投票式并行集成学习,添加白噪声并设置不同参数,降低不确定因素的影响,提高模型的鲁棒性。具体为:
[0104] 在前述步骤32中的随机失活层选取N‑1个不同随机失活概率θ,获得N‑1个包含代价参数、隐藏层和随机失活层的宽度学习系统;对机电产品系统或设备故障状态相关变量X
中随机添加高斯白噪声获得N‑1组输入集;将该N‑1组输入集对应输入N‑1个包含代价参数、
隐藏层和随机失活层的宽度学习系统,将机电产品系统或设备故障状态Y作为输出,根据前
述步骤32获得单个分类器的方法建立N‑1个宽度学习系统分类器;根据该N‑1个宽度学习系
统分类器和步骤32获得的单个分类器,获得集成学习系统,该集成学习系统包含N个分类
器;集成学习输出结果集采用投票方式预测最终输出结果,获得机电产品或设备的故障诊
断模型;
[0105] 为提高模型泛化精度和稳定性,本发明中选取不同的Dropout概率θ建立多个BLS分类器,再采用投票的方式预测最终输出结果,虽然增加了运算量,但大大降低了确定模型
结构和参数的负担,并且能够提高实际应用时的鲁棒性。
[0106] 步骤4:采集实时监测数据,并依照步骤2采用的数据预处理方式对所采集的实时监测数据进行数据预处理,得到预处理后的实时监测数据,输入预处理后的实时监测数据
到步骤3获得的机电产品系统或设备故障诊断模型中,获得机电产品系统或设备的实时监
测数据的故障状态,完成故障诊断。
[0107] 如图1所示,基于机电产品系统或设备的历史监测数据,采取代价敏感学习后输入宽度学习系统中,对宽度学习系统实际输入进行随机失活,以此构建单个分类器;通过在代
价敏感输入随机添加白噪声,并选取不同的随机失活概率,构建多个分类器,组成集成学习
系统;机电产品系统或设备的实时监测数据进行数据处理后,可由集成学习系统内多个分
类器投票输出其实时故障状态。
[0108] 提供一具体实施例,基于某高铁制动系统的实际监测数据验证了所提出方法的有效性。
[0109] 为了检验所提出方法的有效性,该部分基于某高铁运行一年的实际监测数据,建立宽度学习系统模型,与深度学习网络:ANN、CNN进行对比实验,来验证宽度学习系统可以
在保证一定精度的前提下大大降低模型训练时间,且所提出的方法能很好地处理类别不平
衡问题,实验流程如图3所示。
[0110] 输入数据X为可能与制动系统故障相关的43个变量。包括列车级条件,如:GPS位置、速度、运行模式、外部电源、运行时间、线路电压、线路电流等;制动系统级条件,如内部
温度、蓄电池电压、检测到的打滑或滑动、ED制动状态、TCL制动状态、达到的制动力等。出于
保密原则,这里不能详细列出这些变量,并将它们命名为Var1、Var2、…、Var43。这43个变量
并非都对故障检测任务有用。
[0111] 首先需要对传感器收集到的原始数据进行数据清理和转换,如填充缺失值、数据标准化。数据标准化是为了平衡数值变量之间的维度差异。此外,根据模型的数据要求,需
要将原始数据中的一些变量转换为数值。经数据处理后,输入数据中的43个变量都变为[0,
1]之间的数值型变量。
[0112] 输出数据Y为高铁制动系统的故障状态,即是否故障。高铁制动系统可能会发生各种不同的故障,如:塞门紧急制动阀关闭、转向架气动制动塞门关闭、MTB隔离、塞门关闭等,
本文只区分制动系统有故障或无故障。正常状态有28837个数据点,故障状态只有159个,数
据存在严重不平衡性。
[0113] 为避免受随机因素的影响,实验观测十折交叉验证的平均精度和运行时长。并且,为了得到近似的局部最优解,节点数、代价敏感权重和Dropout概率等参数均由较小时逐步
增加,直至测试精度基本保持不变或下降时为止。在同样的运行环境下,通过10次交叉验
证,模型输出平均训练时间、以及测试结果中故障类的平均G‑mean和平均F1‑score。
[0114] 如图4所示,处理后的数据集基于t分布随机邻域嵌入t‑SNE的二维投影图,黑色的1.0代表故障样本,灰色的0.0代表正常样本。t‑SNE算法是分析高维数据可视化最常用和最
有效的方法之一。这种方法将数据点之间的相似性转换为概率,通过将高维数据投影到二
维或三维空间,可以实现高维数据的可视化。由于使用所有数据时,故障样本会完全被覆盖
住,因此图中只显示了正常样本的10%。经比较,图中10%正态样本与整个数据集的t‑SNE
投影分布基本一致。
[0115] 从图4中也可以看出数据严重不平衡,并且两类数据的交叉性较强,这使得故障状态的准确率和召回率无法同时达到非常高的水平,即F1‑score和G‑means不能同时取得最
大值。因此需采用两者的综合指标来评估算法泛化精度,由于实际场景中希望两个指标同
大,因此本文中综合指标取两者的几何平均值F‑G,而不是算术平均值。
[0116]
[0117] 首先,我们分别比较加入代价敏感和Dropout的BLS与原始BLS的效果,加入代价敏感的BLS记为C‑BLS;设置Dropout的BLS为D‑BLS,实验结果如表1所示:
[0118] 表1使用代价敏感和Dropout的效果
[0119]   BLS C‑BLS D‑BLSF1‑score 0.60465 0.89524 0.7439
G‑means 0.78429 0.94894 0.86645
F‑G 0.68864 0.9217 0.80284
平均训练时长(s) 1.847 1.917 8.623
[0120] 可以看出,使用代价敏感学习可以大大提高BLS的精度且几乎不会增加运算负担,Dropout虽然增加了运算量但可以使得预测结果更加稳定。
[0121] 其次,对不同模型进行比较,实验结果如表2所示:CD‑BLS为加入代价敏感和Dropout的BLS对应的模型;ANN、CNN分别为采用对应深度学习网络的模型:
[0122] 表2不同模型的效果对比
[0123]   CD‑BLS ANN CNNF1‑score 0.90816 0.87999 0.91667
G‑means 0.95519 0.95743 0.95743
F‑G 0.93138 0.91789 0.93683
平均训练时长(s) 10.147 232.652 76.899
[0124] 可以看出泛化精度大致相同时,CD‑BLS的训练时长明显远小于ANN和CNN。实验证实了基于宽度学习系统构建的异常监测模型,满足实际中实时性和精准性的要求。而且,该
实验仅基于高速列车运行一年的监测数据,可以预见,在数据量非常大的情况下,即监测数
据起始时间点较远时,BLS的高效性会得到更大的体现。
[0125] 与现有技术相比,本发明提出的基于宽度学习的机电产品系统或设备实时故障诊断方法,有效解决了监测数据中类别不平衡问题,且不会增加运算负担;在满足高精度诊断
的同时,训练时长大大降低,如遇突发状况可以迅速更新诊断模型;加入Dropout层和集成
学习,提升了模型的适用性、稳定性和鲁棒性,不同场景下均可使用该模型结构和参数。
[0126] 以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案
做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。