一种可解释的空调系统深度神经网络故障诊断方法转让专利

申请号 : CN202110453526.5

文献号 : CN113221973B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李冠男董子明胡云鹏高佳佳陈俭方曦熊嘉豪胡浩楠吴雨蓓王璐晗

申请人 : 武汉科技大学

摘要 :

本发明公开了一种可解释的空调系统深度神经网络故障诊断方法,涉及暖通空调系统故障诊断技术领域,其技术方案要点是:基于深度学习模型,利用一维卷积神经网络模型(1D‑CNN)提取暖通空调运行数据的特征信息,并将绝对梯度加权类激活映射(Grad‑Absolute‑CAM)作为可视化分类诊断标准,利用绝对梯度加权类激活映射可视化暖通空调系统的故障特征信息,通过绝对梯度加权类激活映射获取一维卷积神经网络故障诊断模型中各故障数据对应的故障诊断标准,使故障诊断模型变得可解释。本发明的方法采用一维卷积神经网络模型进行故障诊断,故障诊断结果准确率高;同时,通过绝对梯度加权类激活映射对故障特征可视化,获取故障诊断准则,可加强对模型的可解释性。

权利要求 :

1.一种可解释的空调系统深度神经网络故障诊断方法,其特征是:基于深度学习模型,利用一维卷积神经网络模型提取暖通空调运行数据的特征信息,并将绝对梯度加权类激活映射作为可视化分类诊断标准,利用绝对梯度加权类激活映射可视化暖通空调系统的故障特征信息,通过绝对梯度加权类激活映射获取一维卷积神经网络模型中各故障数据对应的故障诊断标准,使故障诊断模型变得可解释,具体包括以下步骤:S1、一维卷积神经网络模型的特征学习与故障诊断,具体方法为:

1)通过筛选得到冷水机组空调系统运行数据集,其中,数据集包括正常数据和5种典型故障数据,每种数据包含48个直接测量变量和16个间接计算变量;

2)采用一维卷积神经网络模型将暖通空调系统运行数据依次进行数据归一化、稳态数据处理、数据分割和数据张量变换处理,得处理后数据;

3)将处理后数据输入至一维卷积神经网络模型的输入层,并通过一维卷积神经网络模型的卷积层对处理后数据进行特征提取,然后将提取的特征平铺后输入至一维卷积神经网络模型的全连接层中,然后在一维卷积神经网络模型的输出层采用分类器对数据进行故障分类,完成故障的特征学习过程,并根据故障特性实现故障分类;

4)输入新的经过处理后的空调系统运行数据至一维卷积神经网络模型中,一维卷积神经网络模型根据特征学习的故障特征信息对新数据进行故障分类,实现故障诊断;

S2、绝对梯度加权类激活映射故障诊断准则对故障特征的解释,采用绝对梯度加权类激活映射对步骤S1中一维卷积神经网络模型提取的故障特征进行可视化解释,获取各故障诊断标准,其中,绝对梯度加权类激活映射的公式为: 式中: 表示第c类故障的绝对梯度激活映射; 表示最后一个卷积层中第c类故障的第k个特征的权重;K是卷积层中的通道数;k表示第c类故障类别的第k个特征映射;

k

A表示激活特征图;

S3、对正常数据和故障数据进行分类,采用一维卷积神经网络模型的两个全连接层接收一维卷积神经网络模型的卷积层中卷积运算后的平铺数据,并采用softmax函数作为故障分类器,实现对正常数据和故障数据的分类。

2.根据权利要求1所述的一种可解释的空调系统深度神经网络故障诊断方法,其特征是:步骤S1中所述的一维卷积神经网络模型包括输入层、卷积层、全连接层和输出层,不采用池化层操作,且所述卷积层的卷积核的大小为1×1。

3.根据权利要求2所述的一种可解释的空调系统深度神经网络故障诊断方法,其特征是:所述卷积层中的激活函数采用softsign函数。

说明书 :

一种可解释的空调系统深度神经网络故障诊断方法

技术领域

[0001] 本发明涉及暖通空调系统故障诊断技术领域,更具体地说,它涉及一种可解释的空调系统深度神经网络故障诊断方法。

背景技术

[0002] 暖通空调系统是一个多设备运行的系统,运行过程中常常会发生一些故障,这些故障的发生不仅会影响系统的正常运行,而且还会增加建筑的总能耗。随着建筑物智能化
的快速发展,以及数据积累和计算速度的提高,各种基于数据驱动的深度学习故障诊断方
法被运用于暖通空调系统,如长短期记忆网络(LSTM)、深度神经网络(DNN)和卷积神经网络
(CNN)等深度学习算法。这些深度学习方法因其在各种系统配置和运行条件下都能保证较
好的诊断性能而受到越来越多的关注。由于各种深度学习模型具有提取深层故障特征、实
现高精度非线性拟合等优点,在计算机视觉、自然语言处理、工业过程监测和机械故障诊断
等领域得到了广泛的应用。
[0003] 然而,上述这些方法大多是黑箱模型,虽然对系统的运行状态监测和故障诊断具有很高的精度,但却极难解释。深度学习模型能将暖通空调输入数据样本划分为故障样本
和正常样本,但其工作机理和诊断准则难以理解。从实际应用的角度来看,对深度学习方法
进行模型解释具有重要意义。
[0004] 为了克服深度学习黑箱模型的可解释性较差的缺点。本发明旨在提出一种可解释的空调系统深度神经网络故障诊断方法,以解决上述问题。

发明内容

[0005] 本发明的目的是提供一种可解释的空调系统深度神经网络故障诊断方法,本发明的方法采用一维卷积神经网络模型进行故障诊断,故障诊断结果准确率高;同时,通过绝对
梯度加权类激活映射对故障特征可视化,获取各故障诊断标准,可加强对模型的可解释性。
[0006] 本发明的上述技术目的是通过以下技术方案得以实现的:一种可解释的空调系统深度神经网络故障诊断方法,基于深度学习模型,利用一维卷积神经网络模型提取暖通空
调运行数据的特征信息,并将绝对梯度加权类激活映射作为可视化分类诊断标准,利用绝
对梯度加权类激活映射可视化暖通空调系统的故障特征信息,通过绝对梯度加权类激活映
射获取一维卷积神经网络模型中各故障数据对应的故障诊断标准,具体包括以下步骤:
[0007] S1、一维卷积神经网络模型的特征学习与故障诊断,具体方法为:
[0008] 1)通过筛选得到冷水机组空调系统运行数据集,该数据集来源于美国供暖、制冷与空调程师学会(ASHRAE)的研究项目1043(RP‑1043)中一个冷水机组暖通空调系统的故障
实验。对一台制冷量为90吨的R134a冷媒离心式冷水机组进行了故障试验。其中,数据集包
括正常数据和5种典型故障数据,每种数据包含48个直接测量变量和16个间接计算变量。
[0009] 2)采用一维卷积神经网络模型将暖通空调系统运行数据依次进行数据归一化、稳态数据处理、数据分割和数据张量变换处理,得处理后数据;
[0010] 3)将处理后数据输入至一维卷积神经网络模型的输入层,并通过一维卷积神经网络模型的卷积层对处理后数据进行特征提取,其中,卷积核进行一维卷积运算后的输出可
表示为 式中:l为卷积层层数;N为一维输入的变量数目;Q
为卷积核大小; 表示第p个输入一维卷积核运算;xp表示第p个一维输入。对于第k通道,
其一维卷积层的输出 可以表示为 式中:j表示卷积层
中的通道数; 表示第l卷积层的第j通道中的第p个一维卷积核运算; 表示第l卷积层
l,j
的第j通道接收的第p个输入变量;b 是卷积的偏差; 是softsign
激活函数。提取的特征可表示为 将提取的特征平铺后输入
至一维卷积神经网络模型的全连接层中,全连接层用于处理由最后卷积层提取的特征信
息,其数学计算可以表示为 式中: 表示位于(g,h)位置的连接
权重矩阵ν的权重系数; 分别表示第l个全连接层中第h个变量的偏置向量; 表示由第l
个全连接层接收的第g个变量的激活特征。然后在一维卷积神经网络模型的输出层采用分
类器对数据进行故障分类,完成故障的特征学习过程,并根据故障特性实现故障分类;位于
c
softmax分类器前第c类故障的得分向量为y=σ(∑αν+r),输出层的softmax分类器预测分
c
类结果为 式中:Prob(y)表示故障类别c=(0,1,2,3,4,
5)的概率函数。
[0011] 4)输入新的经过处理后的空调系统运行数据至一维卷积神经网络模型中,一维卷积神经网络模型根据特征学习的故障特征信息对新数据进行故障分类,实现故障诊断;
[0012] S2、绝对梯度加权类激活映射故障诊断准则对故障特征的解释,采用绝对梯度加权类激活映射对步骤S1中一维卷积神经网络模型提取的故障特征进行可视化解释,获取故
障诊断标准,其中,绝对梯度加权类激活映射的公式为: 式
中: 表示第c类故障的绝对梯度激活映射; 表示最后一个卷积层中第c类故
k
障的第k个特征的权重;K是卷积层中的通道数;k表示第c类故障类别的第k个特征映射;A
表示激活特征图;
[0013] S3、对正常数据和故障数据进行分类,采用一维卷积神经网络模型的两个全连接层接收一维卷积神经网络模型的卷积层中卷积运算后的平铺数据,并采用softmax函数作
为故障分类器,实现对正常数据和故障数据的分类。
[0014] 进一步地,步骤S1中所述的一维卷积神经网络模型包括输入层、卷积层、全连接层和输出层,不采用池化层操作,且所述卷积层的卷积核的大小为1×1。
[0015] 进一步地,所述卷积层中的激活函数采用softsign函数,其数学表达式为
[0016] 其中,在本发明的上述方案中,一维卷积神经网络模型可等同替换为二维卷积神经网络模型,以实现本发明同样的技术效果。
[0017] 综上所述,本发明具有以下有益效果:
[0018] 1、本发明的方法通过一维卷积神经网络模型对暖通空调系统的故障特征进行提取并完成特征学习过程,并通过分类器对故障特征进行故障分类,达到故障诊断的目的,故
障诊断结果准确率高;
[0019] 2、本发明的方法不仅可以实现故障特征学习和故障诊断,同时,本发明的方法中通过采用绝对梯度加权类激活映射对故障特征可视化,获取故障诊断标准,能够加强对模
型的可解释性,从而能够同时实现故障诊断、特征学习及模型解释三方面功能,对暖通空调
系统故障的自动诊断而言具有重大意义。

附图说明

[0020] 图1是本发明实施例中的一维卷积神经网络模型故障诊断流程图;
[0021] 图2是本发明实施例中绝对梯度加权类激活映射获取故障诊断标准过程的输入层的激活特征图(以冷凝器结垢CdF故障为例);
[0022] 图3是本发明实施例中绝对梯度加权类激活映射获取故障诊断标准过程的第一卷积层的激活特征图(以冷凝器结垢CdF故障为例);
[0023] 图4是本发明实施例中绝对梯度加权类激活映射获取故障诊断标准过程的第二卷积层的激活特征图(以冷凝器结垢CdF故障为例);
[0024] 图5是本发明实施例中绝对梯度加权类激活映射获取故障诊断标准过程的第三卷积层的激活特征图(以冷凝器结垢CdF故障为例);
[0025] 图6是本发明实施例中绝对梯度加权类激活映射获取故障诊断标准过程的故障类别诊断得分图(以冷凝器结垢CdF故障为例);
[0026] 图7是本发明实施例中一维卷积神经网络模型的故障诊断结果混淆矩阵图;
[0027] 图8是本发明实施例中利用梯度加权类激活映射、负向梯度加权类激活映射和绝对梯度加权类激活映射对冷凝器结垢CdF故障进行故障类别判别信息定位图;
[0028] 图9是本发明实施例中利用梯度加权类激活映射、负向梯度加权类激活映射和绝对梯度加权类激活映射对不凝性气体NCdG故障进行故障类别判别信息定位图;
[0029] 图10是本发明实施例中利用梯度加权类激活映射、负向梯度加权类激活映射和绝对梯度加权类激活映射对蒸发器水量不足RWEv故障进行故障类别判别信息定位图;
[0030] 图11是本发明实施例中利用梯度加权类激活映射、负向梯度加权类激活映射和绝对梯度加权类激活映射对冷凝器水量不足RWCd故障进行故障类别判别信息定位图;
[0031] 图12是本发明实施例中利用梯度加权类激活映射、负向梯度加权类激活映射和绝对梯度加权类激活映射对润滑油过量ExO故障进行故障类别判别信息定位图;
[0032] 图13是本发明实施例中绝对梯度加权类激活映射对冷凝器结垢CdF故障特征可视化结果图;
[0033] 图14是本发明实施例中绝对梯度加权类激活映射对不凝性气体NCdG故障特征可视化结果图;
[0034] 图15是本发明实施例中绝对梯度加权类激活映射对蒸发器水量不足RWEv故障特征可视化结果图;
[0035] 图16是本发明实施例中绝对梯度加权类激活映射对冷凝器水量不足RWCd故障特征可视化结果图;
[0036] 图17是本发明实施例中绝对梯度加权类激活映射对润滑油过量ExO故障特征可视化结果图。

具体实施方式

[0037] 以下结合附图1‑17对本发明作进一步详细说明。
[0038] 实施例:一种可解释的空调系统深度神经网络故障诊断方法,基于深度学习模型,利用一维卷积神经网络模型提取暖通空调运行数据的特征信息,并将绝对梯度加权类激活
映射作为可视化分类诊断标准,利用绝对梯度加权类激活映射可视化暖通空调系统的故障
数据信息,通过绝对梯度加权类激活映射获取一维卷积神经网络模型中各故障数据对应的
故障诊断标准,使故障诊断模型变得可解释,如图1所示,具体包括以下步骤:
[0039] S1、一维卷积神经网络模型的特征学习与故障诊断,具体方法为:
[0040] 1)通过筛选得到冷水机组空调系统运行数据集,其中,数据集包括正常数据和5种典型故障数据,每种数据包含48个直接测量变量和16个间接计算变量。
[0041] 2)采用一维卷积神经网络模型将暖通空调系统运行数据依次进行数据归一化、稳态数据处理、数据分割和数据张量变换处理,得处理后数据;
[0042] 3)将处理后数据输入至一维卷积神经网络模型的输入层,并通过一维卷积神经网络模型的卷积层对处理后数据进行特征提取,然后将提取的特征平铺后输入至一维卷积神
经网络模型的全连接层中,然后在一维卷积神经网络模型的输出层采用分类器对数据进行
故障分类,完成故障的特征学习过程,并根据故障特性实现故障分类;
[0043] 4)输入新的经过处理后的空调系统运行数据至一维卷积神经网络模型中,一维卷积神经网络模型根据特征学习的故障特征信息对新数据进行故障分类,实现故障诊断;
[0044] S2、绝对梯度加权类激活映射故障诊断准则对故障特征的解释,采用绝对梯度加权类激活映射对步骤S1中一维卷积神经网络模型提取的故障特征进行可视化解释,获取故
障诊断标准,其中,绝对梯度加权类激活映射的公式为: 式
中: 表示第c类故障的绝对梯度激活映射; 表示最后一个卷积层中第c类故
k
障的第k个特征的权重;K是卷积层中的通道数;k表示第c类故障类别的第k个特征映射;A
表示激活特征图;利用绝对梯度加权类激活映射可视化暖通空调系统的故障数据信息,可
以更好的作为确定特定故障类别的诊断标准。
[0045] S3、对正常数据和故障数据进行分类,采用一维卷积神经网络模型的两个全连接层接收一维卷积神经网络模型的卷积层中卷积运算后的平铺数据,并采用softmax函数作
为故障分类器,实现对正常数据和故障数据的分类。
[0046] 其中,步骤S1中所述的一维卷积神经网络模型包括输入层、卷积层、全连接层和输出层,不采用池化层操作,且所述卷积层的卷积核的大小为1×1。
[0047] 其中,所述卷积层中的激活函数采用softsign函数。
[0048] 其中,本发明中的上述实施例中,一维卷积神经网络模型可等同替换为二维卷积神经网络模型,以实现与本发明等同的技术效果。
[0049] 在本实施例中,一维卷积神经网络的特征学习与故障诊断过程如下:
[0050] 典型的卷积神经网络是由输入层、卷积层和池化层、全连接层和输出层组成的多层网络。本发明采用的一维卷积神经网络模型由三个卷积层组成,使用大小为1×1的卷积
核,一维卷积神经网络模型不进行池化操作,softsign被用作每个卷积层后面的激活函数。
本发明采用的一维卷积神经网络模型最优参数如下表1所示。
[0051] 表1最优一维卷积神经网络模型参数
[0052]
[0053] 该一维卷积神经网络模型将暖通空调系统运行数据经过数据归一化、稳态数据处理、数据分割和数据张量变换四个步骤处理后,再将处理后的数据输入到输入层,然后在卷
积神经网络的核心模块卷积层中进行特征提取,再将卷积层提取的特征平铺后输入到全连
接层中,最后,输出层使用分类器对数据进行故障分类。至此,一维卷积神经网络模型完成
故障的特征学习过程,并根据其故障特性进行了故障分类。当输入新的经过处理后的空调
系统运行数据一维卷积神经网络模型会根据特征学习的故障特征信息对新数据进行故障
分类,以达到故障诊断的目的。
[0054] 本发明采用的一维卷积神经网络结构具有三个特点:(1)排除了池化层;(2)卷积核的大小设为1×1;采用池化层和卷积核大小大于1×1可能会导致变量顺序打乱和特征信
息丢失。(3)使用softsign作为激活函数。尽管ReLU在深度学习中广泛应用,但是它存在消
除卷积运算后所有负值的问题。消除负值会导致未知信息更改或者丢失。softsign作为激
活函数可以从数据样本的正值和负值中学习非线性信息。
[0055] 在本发明中,关于绝对梯度加权类激活映射故障诊断准则的数学描述如下:
[0056] 在计算机视觉研究领域,传统的梯度加权类激活映射(Grad‑CAM)主要用于从深层神经网络中提供图像分类的视觉解释。对于彩色图像,它是由二维或三维通道的多个像素
组成的。通常,所有像素值都在0‑255之间,这意味着图像数据没有负像素。梯度加权类激活
映射利用ReLU保持方程 中的正线性组合部分,对目标类c具
有正影响。
[0057] 然而,暖通空调系统运行数据样本在两个方面有很大的不同。一方面,标准化的暖通空调数据样本有正值和负值。另一方面,暖通空调故障对标准化故障指标的影响可能是
正向的,也可能是负向的。这表明应同时保留正梯度和负梯度。
[0058] 本发明提出了一种改进的负向梯度加权类激活映射(Grad‑Negative‑CAM),表达式为 以解决传统梯度加权类激活映射中忽略的负向
特征映射激活问题。
[0059] 为了将正负两个方面结合起来,本发明将绝对值函数应用于线性组合部分,在梯度加权类激活映射的基础上提出了绝对梯度加权类激活映射方法,保留可能丢失的负向信
息。其表达式为 表示第c类故障的绝对梯度
激活映射; 表示最后一个卷积层中第c类故障的第k个特征的权重;K是卷积层中的通道
k
数;k表示第c类故障类别的第k个特征映射;A表示激活特征图。
[0060] 结果表明,负向梯度加权类激活映射对故障特征可解释效果弱于绝对梯度加权类激活映射,绝对梯度加权类激活映射用于获取一维卷积神经网络模型的故障诊断标准。具
体实施方案如下。
[0061] 在本实施例中,绝对梯度加权类激活映射故障诊断准则对故障特征的解释过程如下:
[0062] 具体获取故障诊断准则的实施方案如图2‑6所示,绝对梯度加权类激活映射通过激活特征图形式来解释模型的工作机理,当处理过的空调运行数据输入到一维卷积神经网
络模型,绝对梯度加权类激活映射将模型的输入层、三个卷积层的激活特性以及Softmax分
类器之前的故障类别诊断得分以激活特征图形式展现。
[0063] 为了说明绝对梯度加权类激活映射故障诊断准则的解释过程,选取冷凝器结垢CdF故障样本作为实例进行激活特征图的可视化说明。每个卷积层有64个通道(0号通道到
63号通道),为了更容易理解,图3‑5仅显示前4个通道(0号通道到3号通道)。如图2所示,输
入层的激活特征图上的最大值位于46供油压力(PO_feed)和47进出口油压差(PO_net)。如
图3‑5所示,前4个通道激活特征图按其激活图上的最大值可分为两类,0号通道到2号通道
为一类,3号通道为另一类。对于0号通道到2号通道的激活特征图,激活图的最大值位于45
供油温度(TO_feed)的位置。但对于3号通道的激活特征图来说,46供油压力(PO_feed)、47
进出口油压差(PO_net)和50蒸汽小阀开度(VSS)显示出的激活特征图的最大值。最后,冷凝
器结垢CdF故障样本诊断得分如图6所示。故障类别为1的故障在输入Softmax分类器之前获
得最大分数22。这表明冷凝器结垢故障CdF样本被正确分类为1,表示冷凝器结垢CdF故障。
[0064] 在本实施例中,绝对梯度加权类激活映射可视化了暖通空调系统的5种典型故障的故障诊断标准,5种典型故障分别是冷凝器结垢CdF、不凝性气体NCdG、蒸发器水量不足
RWEv、冷凝器水量不足RWCd、润滑油过多ExO。
[0065] 采用一维卷积神经网络模型进行故障诊断,通过图7中的混淆矩阵来评估模型性能。故障诊断结果准确率最高超过99%,能很好的诊断5种典型暖通空调故障。
[0066] 图8‑12比较了3种可视化方法的输出,包括传统的梯度加权类激活映射(Grad‑CAM)、负向梯度加权类激活映射(Grad‑Negative‑CAM)和绝对梯度加权类激活映射(Grad‑
Absolute‑CAM)。以冷凝器结垢CdF故障样本为例,负向梯度加权类激活映射和绝对梯度加
权类激活映射都能正确识别出位于46供油压力(PO_feed)和47进出口油压差(PO_net)的两
个特征变量。根据专业知识和以往的特征选择研究,供油压力(PO_feed)和进出口油压差
(PO_net)这两个变量是冷凝器结垢CdF的故障指示特征。然而,梯度加权类激活映射识别出
了51蒸汽大阀开度(VSL)和45供油温度(TO_feed)是冷凝器结垢CdF故障的故障指示特征,
这意味着梯度加权类激活映射无法找到冷凝器结垢CdF故障正确的位置。梯度加权类激活
映射可以正确识别不凝性气体NCdG,蒸发器水量不足RWEv,冷凝器水量不足RWCd这三个故
障类别的故障指示信息,而负向梯度加权类激活映射不能正确识别。而对于冷凝器水量不
足RWCd故障,梯度加权类激活映射和绝对梯度加权类激活映射都给出了正确的故障类别判
别信息,定位故障指示变量为23冷凝器侧水流量(FWC)。然而,负向梯度加权类激活映射将
故障指示变量为50蒸汽小阀开度(VSS),这很难根据冷水机组系统的专业知识进行解释。因
此,利用绝对梯度加权类激活映射诊断标准的可视化和故障指示信息的定位来解释模型的
诊断机理。
[0067] 表2冷水机组系统5种故障特征诊断标准
[0068]
[0069]
[0070] 本发明提出的绝对梯度加权类激活映射方法具有很强的故障类别判别能力,用于获取5种冷水机组故障的诊断标准。随着故障严重程度的增加,故障类别判别特征信息位置
更加准确。5种典型冷水机组故障的绝对梯度加权类激活映射可视化图如图13‑17所示。在
绝对梯度加权类激活映射的可视化特征图中,可以清晰地观察到输入张量故障类别指示信
息的位置。从绝对梯度加权类激活映射可视化结果来看,5种冷水机组故障的故障识别特征
及诊断标准如表2所示。冷水机组系统64个变量及其特征信息如表3所示。
[0071] 表3冷水机组系统64个变量及其特征信息
[0072]
[0073]
[0074] 本发明的上述实施例提出一维卷积神经网络模型对故障特征提取完成特征学习过程,通过分类器对故障特征进行故障分类,达到故障诊断的目的,同时,通过绝对梯度加
权类激活映射对故障特征可视化,获取故障诊断准则,加强对模型的可解释性,使得本发明
的方法可以同时实现故障诊断、特征学习及模型解释三方面功能。
[0075] 本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本
发明的权利要求范围内都受到专利法的保护。