一种基于深度学习的水轮发电机组故障诊断方法转让专利

申请号 : CN201911019873.6

文献号 : CN110597240B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 高伟卢思佳廖国平杨耿杰郭谋发

申请人 : 福州大学

摘要 :

本发明涉及一种基于深度学习的水轮发电机组故障诊断方法,首先采集水电机组运行时的振动信号作为样本,并建立数据库;对数据进行预处理,即对原始振动信号进行重构;接着将重构后的数据集分割成训练集、验证集以及测试集;然后训练一维卷积神经网络(1‑D CNN)与门控循环单元(GRU)相结合的网络,并对网络参数进行优化,以避免网络过拟合;最后利用训练好的网络参数建立水电机组故障诊断模型,将测试集样本输入至该模型中,实现水电机组故障诊断。本发明能够提高水电机组故障诊断的准确性。

权利要求 :

1.一种基于深度学习的水轮发电机组故障诊断方法,其特征在于,采集水电机组运行时的振动信号作为样本,对已知类型的样本打标签,并建立一个包含正常及各种故障类型的数据库;

采用数据分割方法对原始振动信号进行重构;

将重构后的数据集分割成训练集、验证集以及测试集;

训练一维卷积神经网络与门控循环单元相结合的网络,并对网络参数进行优化,以避免网络过拟合;

利用训练好的网络参数建立水电机组故障诊断模型,将测试集样本输入至该模型中,实现水电机组故障诊断;

其中,振动信号从水电机组的水导轴承处采集;

其中,所述采用数据分割方法对原始振动信号进行重构具体为:将长度为C的振动信号按顺序分为X段,每段包含Y个数据点,且X、Y的取值满足X*Y=C;因此,将采样数C设置为

1200,时间步长X取值为20,特征值Y取值为60;

其中,所述一维卷积神经网络与门控循环单元相结合的网络包括输入层、隐藏层和输出层三部分组成;其中,隐藏层包括卷积层、池化层、门控循环单元层和全连接层;

其中,选择高斯分布的权值初始化算法来初始化卷积层中的权重;

其中,所述一维卷积神经网络与门控循环单元相结合的网络具体为:设输入序列矩阵为D,第i个输出序列矩阵为Si,则S0=D;

当i=1时,当前层为卷积层,输出特征矩阵Si表示为:式中,wi是权重矩阵,b是偏差矩阵;非线性激活函数f使用ReLU,卷积层采用零填充,使Si的大小统一为m×n,其中m为输入数据的时间步长,n为滤波器个数;

当i=2时,当前层为池化层,采用最大池化法,其输出为前一特征矩阵中的最大值,输出特征矩阵Si定义如下:

Si=Y(Si-1);

式中,Y是池化函数,S2的大小为m/z×n,z是池化层的池层比例值;

当i=3时,当前层为门控循环单元层;门控循环单元层通过重置门与更新门得到当前隐藏节点的输出和传递至下一个节点的隐状态;

当i=4时,当前层为全连接层,计算当前每个样本对应于每个故障类别的概率,然后得到一个新的特征;

其中,所述对网络参数进行优化具体包括以下步骤:步骤S1:判断当前的一维卷积神经网络与门控循环单元相结合的网络是否达到训练预设的期望,若是,则将当前的网络参数作为训练好的网络参数,否则进入步骤S2;

步骤S2:通过基于L2正则化损失函数的反向传播神经网络来防止拟合过度并使损失函数最小化,并分别更新一维卷积神经网络和门控循环单元中的权重和偏差,返回步骤S1;

其中,为了使损失函数最小化,同时为了防止过度拟合和内协变量移位,在整个过程中,使用Adam优化器、批量规范化和随机失活的方法。

2.根据权利要求1所述的一种基于深度学习的水轮发电机组故障诊断方法,其特征在于,所述训练集、验证集以及测试集的比例为8:1:1。

说明书 :

一种基于深度学习的水轮发电机组故障诊断方法

技术领域

[0001] 本发明涉及水轮发电机组设计领域,特别是一种基于深度学习的水轮发电机组故障诊断方法。

背景技术

[0002] 由于世界人口的增加以及工业化进程的加快,全球能源消耗速度将越来越快。此外,消耗传统化石能源会给生态环境带来危害,如出现自然灾害频繁发生以及全球变暖等
一系列灾害现象。因此,可再生能源的提出就是为了在发展的同时能够保护我们赖以生存
的环境。根据可再生能源的全球状态报告(REN212018)可知,预计2017年年底,全球可再生
能源电力生产占全球总电力生产的26.5%,其中水力发电的电力生产占可再生能源总电力
生产的61.9%。这些数据表明了水电在可再生能源中的重要性。水电机组是水电站最重要
的设备之一,对水电站和电力系统的整体性能影响很大。因此,建立一个可靠、精确、智能的
水电机组故障诊断模型是实用且具有重要意义的。
[0003] 目前,基于人工特征提取的机器学习的水电机组故障诊断方法已经取得了很好的成果。其主要包含以下三个步骤:1)信号分解,2)特征提取,3)智能诊断。特别地,水电机组
振动信号特征提取的质量对其诊断精度起着决定性作用。然而,传统的智能故障诊断方法
只能提供有限的故障诊断能力。其存在一些明显的缺点,总结如下:1)传统的智能故障诊断
方法单独设计和执行特征提取和分类,这将影响最终的诊断性能。这是一种无法同时优化
的策略。2)在传统的智能故障诊断方法中所有从信号中提取的特征都是人工手动制作的,
需要很多关于信号处理技术的先验知识和诊断专业知识,且制作这些特征是费时且费力。

发明内容

[0004] 有鉴于此,本发明的目的是提出一种基于深度学习的水轮发电机组故障诊断方法,能够提高水电机组故障诊断的准确性。
[0005] 本发明采用以下方案实现:一种基于深度学习的水轮发电机组故障诊断方法,具体包括以下步骤:
[0006] 采集水电机组运行时的振动信号作为样本,对已知类型的样本打标签,并建立一个包含正常及各种故障类型的数据库;
[0007] 采用数据分割方法对原始振动信号进行重构;
[0008] 将重构后的数据集分割成训练集、验证集以及测试集;
[0009] 训练一维卷积神经网络(1-D CNN)与门控循环单元(GRU)相结合的网络,并对网络参数进行优化,以避免网络过拟合;
[0010] 利用训练好的网络参数建立水电机组故障诊断模型,将测试集样本输入至该模型中,实现水电机组故障诊断。
[0011] 本发明通过在线采集系统采集水导轴承的振动信号。其中,在线采集系统由振动信号采集终端、通信模块、以及数据服务器组成。其中,振动信号采集终端包括压电式加速
度传感器、整流电路模块、模数采样单元、振动信号采集电路、通信模块和中央处理器。
[0012] 该在线采集系统采集振动信号的一般过程如下:当水电机组运行时,水电机组的振动值通过压电式加速度传感器转换为振动加速度值,采用振动信号采集电路将这些变化
的加速度值转化为电压信号,代表采样周期内水电机组的振动信号。接着,振动信号采集终
端通过通信模块连接到数据服务器,从而将数据包传输并存储到数据服务器。
[0013] 进一步地,振动信号是一种时间序列数据,其存储于一个具有时间轴的三维张量。本发明的振动信号从水电机组的水导轴承处采集,为了更有效地提取振动信号的特征,采
样周期的设置需要保证输入样本的完整周期性。在本发明中,考虑到水轮发电机并网频率
为50Hz(0.02s),通常将采样周期设置为N,此时输入样本为N/0.02个完整的周波,通过输入
完整周期性的样本,能包含更本质的振动信号的信息。当未将振动信号进行重构时,振动信
号的每个时间步长只包含一个特征值。若直接采用本发明的方法对这些数据进行训练,将
降低网络自适应特征提取的能力并且增加训练时间。因此,需要对原始振动数据进行重构,
以减少时间步长,提高各时间步长包含的特征量。具体过程如下:
[0014] 假设水电机组额定转速为A r/min(即水电机组运行一转时间为60/A秒),采样频率设置为BHz,则水电机组的运行一转被采集的数据点个数为3/50*B个。一般来说可以将采
样频率设置为3000Hz,则机组运行一转被采集数据点为180个。所述对原始振动信号进行重
构具体为:将长度为C(采样数)的振动信号按顺序分为X段(即X个时间步长),每段包含Y个
数据点(即每个时间步长包含Y个特征值),且X、Y的取值满足X*Y=C;因此,将采样数C设置
为1200,时间步长X取值为20,特征值Y取值为60(相当于水电机组运行1/3转)。采用数据分
割方法对原始振动数据进行重构,为神经网络更快地运行、更好地提取特征值和较高的故
障识别精度奠定了基础。
[0015] 进一步地,所述训练集、验证集以及测试集的比例为8:1:1。
[0016] 进一步地,所述一维卷积神经网络(1-D CNN)与门控循环单元(GRU)相结合的网络包括输入层、隐藏层和输出层三部分组成;其中,隐藏层包括卷积层、池化层、门控循环单元
层和全连接层。
[0017] 其中,卷积神经网络(CNN)是一个多层的神经网络,每层包含多个特征平面,每个特征平面由多个独立神经元组成。一维卷积神经网络(1-D CNN)通常用于时间序列模型,其
卷积输出是一维的。而且,1-D CNN的滤波器是沿时间轴滑动的,1-D CNN的输入形状是三维
张量。考虑到时间轴对于存储在三维张量中的振动信号很重要,因此,本发明采用1-D CNN。
此外,本发明还选取线性整流函数(ReLU)作为1-D CNN的激活函数。由于基于高斯分布的权
值初始化算法——he_normal能使输入到ReLU的数据具有良好的恒定方差,因此选择he_
normal来初始化卷积层中的权重。
[0018] 进一步地,所述一维卷积神经网络(1-D CNN)与门控循环单元(GRU)相结合的网络具体为:
[0019] 设输入序列矩阵为D,第i个输出序列矩阵为Si,则S0=D;
[0020] 当i=1时,当前层为卷积层,卷积层参数由一组空间上较小的可学习滤波器组成(滤波器大小为c×d,其中c是内核的大小,d是输入数据的维数)。输出特征矩阵Si表示为:
[0021]
[0022] 式中,wi是权重矩阵,b是偏差矩阵;非线性激活函数f使用ReLU,卷积层采用零填充,使Si的大小统一为m×n,其中m为输入数据的时间步长,n为滤波器个数;
[0023] 当i=2时,当前层为池化层,其作用是在保持特征的尺度不变性的同时,减少序列特征的时间步长。本发明采用最大池化法,其输出为前一特征矩阵中的最大值,输出特征矩
阵Si定义如下:
[0024] Si=Y(Si-1);
[0025] 式中,Y是池化函数,S2的大小为m/z×n,z是池化层的池层比例值;
[0026] 当i=3时,当前层为门控循环单元层,GRU是循环神经单元(RNN)的一种,是为解决长期记忆和反向传播中的梯度问题而提出的;门控循环单元层通过重置门与更新门得到当
前隐藏节点的输出和传递至下一个节点的隐状态;
[0027] GRU有两个输入:一个是当前信号的输入xt,一个是上一个节点传递下来的隐状态ht-1,这个隐状态包含之前节点的相关信息。结合xt和ht-1,GRU会得到当前隐藏节点的输出yt
和传递给下一个节点的隐状态ht。同时,GRU中有重置门(r门)和更新门(z门)。
[0028] 首先通过ht-1和xt来获取两个门控状态(Step 1),其输出可以表示为:
[0029] rt=σ(Wrxt+Urht-1+br);
[0030] Zt=σ(WZxt+UZht-1+bZ);
[0031] 其中,σ是sigmoid函数,该函数输出数据变化范围为(0,1),所以门控信息的变化范围为(0,1),数值越大,记忆下来的信息也越多。W和U为权重矩阵,b为偏差。
[0032] 其次,通过重置门来确定当前节点中存储了哪些新信息,可以计算为:
[0033] ht=tanh(Whxt+Uh(rtоht-1)+bh);
[0034] 其中,rtоht-1是通过重置门重置之后的数据,将其与xt进行拼接后,再通过tanh激活函数将数据放缩到(-1,1)的范围内,即可得到当前节点中存储的新信息。
[0035] 最后通过更新门选择上一节点遗忘的信息和当前节点记忆的信息,可计算如下:
[0036]
[0037] 其中,Ztоht-1表示对上一节点隐藏状态的选择性“遗忘”,即忘掉上一节点隐藏状态中一些不重要的信息。 表示对包含当前节点信息的 的选择性“记忆”,即存储
包含当前节点信息的 维度中的重要信息。
[0038] 当i=4时,当前层为全连接层,全连接层由一排神经元组成,每个神经元与其前一层的所有神经元进行全连接。在CNN中,全连接层通常出现在最后几层,用于对前面设计的
特征做加权和,它起到将学到的“分布式特征表示”映射到样本标记空间的作用。本发明的
全连接层在最后一层,它的输出值被传递给一个输出,可以采用softmax逻辑回归(softmax 
regression)进行分类,起到最终分类的作用。在此层中,计算当前每个样本对应于每个故
障类别的概率,然后得到一个新的特征,表达式如下:
[0039] ypredict(i)=f(L=li|S3;(W,b));
[0040] 式中,其中f是SoftMax激活函数,S3是从GRU获得的特征,li是第i类输入数据的计算结果。
[0041] 为了使损失函数最小化,同时为了防止过度拟合和内协变量移位,在整个过程中,本发明都使用Adam优化器、批量规范化和随机失活等方法。
[0042] 进一步地,所述对网络参数进行优化具体包括以下步骤:
[0043] 步骤S1:判断当前的一维卷积神经网络(1-D CNN)与门控循环单元(GRU)相结合的网络是否达到训练预设的期望,若是,则将当前的网络参数作为训练好的网络参数,否则进
入步骤S2;
[0044] 步骤S2:通过基于L2正则化损失函数的反向传播神经网络来防止拟合过度并使损失函数最小化,并分别更新一维卷积神经网络(1-D CNN)和门控循环单元(GRU)中的权重和
偏差,返回步骤S1。
[0045] 其中,L2正则化可以看作是在寻找最小权重和最小化成本函数之间进行折衷的一种有效方法。因此,本发明的1-D CNN-GRU网络通过基于L2正则化损失函数的反向传播神经
网络来防止拟合过度并使损失函数最小化,损失函数的计算公式如下:
[0046]
[0047] 式中,y(t)(i)是一个指标变量(0或1),如果t类与i类样本的类别相同,则为1,否则为0; 是i类样本对应于t类样本的概率;n是样本数;c是类别数;λ是L2正则化系数。
[0048] 与现有技术相比,本发明有以下有益效果:
[0049] 1、本发明对振动信号进行了时序重构,减少数据的时间步长并增加各时间步长包含的特征量,提高了方法的自适应提取特征的能力和训练过程的效率。
[0050] 2、本发明将1-DCNN与GRU结合起来,可以结合卷积神经网络的速度和轻量与循环神经网络的顺序敏感性,从而可自动提取振动信号蕴含的丰富的故障信息避免人工提取特
征的局限性,进而显著提高水电机组故障诊断的准确性。
[0051] 3、本发明建立的水电机组故障诊断系统可应用于工程实践中,其同时实现振动信号的自动特征提取和故障诊断并具有良好的鲁棒性和突出的诊断性能。

附图说明

[0052] 图1为本发明实施例的方法原理示意图。
[0053] 图2为本发明实施例的1-D CNN-GRU架构图。
[0054] 图3为本发明实施例的GRU的内部结构图。
[0055] 图4为本发明实施例的方法具体流程示意图。
[0056] 图5为本发明实施例的训练及验证过程的精度及损失曲线图,其中(a)为精度曲线,(b)为损失曲线。
[0057] 图6为本发明实施例中举例的各方法的分类精度和F-measure分数,其中(a)为分类精度,(b)为F-measure分数。
[0058] 图7为比较不同方法的10次试验结果。

具体实施方式

[0059] 下面结合附图及实施例对本发明做进一步说明。
[0060] 应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常
理解的相同含义。
[0061] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式
也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包
括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0062] 如图1以及图3所示,本实施例提供了一种基于深度学习的水轮发电机组故障诊断方法,具体包括以下步骤:
[0063] 采集水电机组运行时的振动信号作为样本,对已知类型的样本打标签,并建立一个包含正常及各种故障类型的数据库;
[0064] 采用数据分割方法对原始振动信号进行重构;
[0065] 将重构后的数据集分割成训练集、验证集以及测试集;
[0066] 训练一维卷积神经网络(1-D CNN)与门控循环单元(GRU)相结合的网络,并对网络参数进行优化,以避免网络过拟合;
[0067] 利用训练好的网络参数建立水电机组故障诊断模型,将测试集样本输入至该模型中,实现水电机组故障诊断。
[0068] 较佳的,本实施例通过在线采集系统采集水导轴承的振动信号。其中,在线采集系统由振动信号采集终端、通信模块、以及数据服务器组成。其中,振动信号采集终端包括压
电式加速度传感器、整流电路模块、模数采样单元、振动信号采集电路、通信模块和中央处
理器。
[0069] 该在线采集系统采集振动信号的一般过程如下:当水电机组运行时,水电机组的振动值通过压电式加速度传感器转换为振动加速度值,采用振动信号采集电路将这些变化
的加速度值转化为电压信号,代表采样周期内水电机组的振动信号。接着,振动信号采集终
端通过通信模块连接到数据服务器,从而将数据包传输并存储到数据服务器。
[0070] 在本实施例中,振动信号是一种时间序列数据,其存储于一个具有时间轴的三维张量。本发明的振动信号从水电机组的水导轴承处采集,为了更有效地提取振动信号的特
征,采样周期的设置需要保证输入样本的完整周期性。在本发明中,考虑到水轮发电机并网
频率为50Hz(0.02s),通常将采样周期设置为N,此时输入样本为N/0.02个完整的周波,通过
输入完整周期性的样本,能包含更本质的振动信号的信息。当未将振动信号进行重构时,振
动信号的每个时间步长只包含一个特征值。若直接采用本发明的方法对这些数据进行训
练,将降低网络自适应特征提取的能力并且增加训练时间。因此,需要对原始振动数据进行
重构,以减少时间步长,提高各时间步长包含的特征量。具体过程如下:
[0071] 假设水电机组额定转速为A r/min(即水电机组运行一转时间为60/A秒),采样频率设置为BHz,则水电机组的运行一转被采集的数据点个数为3/50*B个。一般来说可以将采
样频率设置为3000Hz,则机组运行一转被采集数据点为180个。所述对原始振动信号进行重
构具体为:将长度为C(采样数)的振动信号按顺序分为X段(即X个时间步长),每段包含Y个
数据点(即每个时间步长包含Y个特征值),且X、Y的取值满足X*Y=C;因此,将采样数C设置
为1200,时间步长X取值为20,特征值Y取值为60(相当于水电机组运行1/3转)。采用数据分
割方法对原始振动数据进行重构,为神经网络更快地运行、更好地提取特征值和较高的故
障识别精度奠定了基础。
[0072] 在本实施例中,所述训练集、验证集以及测试集的比例为8:1:1。
[0073] 在本实施例中,所述一维卷积神经网络1-D CNN与门控循环单元GRU相结合的网络包括输入层、隐藏层和输出层三部分组成;其中,隐藏层包括卷积层、池化层、门控循环单元
层和全连接层。其中,1-D CNN-GRU的架构包含6层,如图2所示。
[0074] 其中,卷积神经网络(CNN)是一个多层的神经网络,每层包含多个特征平面,每个特征平面由多个独立神经元组成。一维卷积神经网络(1-D CNN)通常用于时间序列模型,其
卷积输出是一维的。而且,1-D CNN的滤波器是沿时间轴滑动的,1-D CNN的输入形状是三维
张量。考虑到时间轴对于存储在三维张量中的振动信号很重要,因此,本发明采用1-D CNN。
此外,本发明还选取线性整流函数(ReLU)作为1-D CNN的激活函数。由于基于高斯分布的权
值初始化算法——he_normal能使输入到ReLU的数据具有良好的恒定方差,因此选择he_
normal来初始化卷积层中的权重。
[0075] 在本实施例中,所述一维卷积神经网络(1-D CNN)与门控循环单元(GRU)相结合的网络具体为:
[0076] 设输入序列矩阵为D,第i个输出序列矩阵为Si,则S0=D;
[0077] 当i=1时,当前层为卷积层,卷积层参数由一组空间上较小的可学习滤波器组成(滤波器大小为c×d,其中c是内核的大小,d是输入数据的维数)。输出特征矩阵Si表示为:
[0078]
[0079] 式中,wi是权重矩阵,b是偏差矩阵;非线性激活函数f使用ReLU,卷积层采用零填充,使Si的大小统一为m×n,其中m为输入数据的时间步长,n为滤波器个数;
[0080] 当i=2时,当前层为池化层,其作用是在保持特征的尺度不变性的同时,减少序列特征的时间步长。本发明采用最大池化法,其输出为前一特征矩阵中的最大值,输出特征矩
阵Si定义如下:
[0081] Si=Y(Si-1);
[0082] 式中,Y是池化函数,S2的大小为m/z×n,z是池化层的池层比例值;
[0083] 当i=3时,当前层为门控循环单元层,GRU是循环神经单元(RNN)的一种,是为解决长期记忆和反向传播中的梯度问题而提出的,GRU的内部结构图如图3所示;门控循环单元
层通过重置门与更新门得到当前隐藏节点的输出和传递至下一个节点的隐状态;
[0084] GRU有两个输入:一个是当前信号的输入xt,一个是上一个节点传递下来的隐状态ht-1,这个隐状态包含之前节点的相关信息。结合xt和ht-1,GRU会得到当前隐藏节点的输出yt
和传递给下一个节点的隐状态ht。同时,GRU中有重置门(r门)和更新门(z门)。
[0085] 首先通过ht-1和xt来获取两个门控状态(Step 1),其输出可以表示为:
[0086] rt=σ(Wrxt+Urht-1+br);
[0087] Zt=σ(WZxt+UZht-1+bZ);
[0088] 其中,σ是sigmoid函数,该函数输出数据变化范围为(0,1),所以门控信息的变化范围为(0,1),数值越大,记忆下来的信息也越多。W和U为权重矩阵,b为偏差。
[0089] 其次,通过重置门来确定当前节点中存储了哪些新信息,可以计算为:
[0090] ht=tanh(Whxt+Uh(rtоht-1)+bh);
[0091] 其中,rtоht-1是通过重置门重置之后的数据,将其与xt进行拼接后,再通过tanh激活函数将数据放缩到(-1,1)的范围内,即可得到当前节点中存储的新信息。
[0092] 最后通过更新门选择上一节点遗忘的信息和当前节点记忆的信息,可计算如下:
[0093]
[0094] 其中, 表示对上一节点隐藏状态的选择性“遗忘”,即忘掉上一节点隐藏状态中一些不重要的信息。 表示对包含当前节点信息的 的选择性“记忆”,即存储
包含当前节点信息的 维度中的重要信息。
[0095] 当i=4时,当前层为全连接层,全连接层由一排神经元组成,每个神经元与其前一层的所有神经元进行全连接。在CNN中,全连接层通常出现在最后几层,用于对前面设计的
特征做加权和,它起到将学到的“分布式特征表示”映射到样本标记空间的作用。本发明的
全连接层在最后一层,它的输出值被传递给一个输出,可以采用softmax逻辑回归(softmax 
regression)进行分类,起到最终分类的作用。在此层中,计算当前每个样本对应于每个故
障类别的概率,然后得到一个新的特征,表达式如下:
[0096] ypredict(i)=f(L=li|S3;(W,b));
[0097] 式中,其中f是SoftMax激活函数,S3是从GRU获得的特征,li是第i类输入数据的计算结果。
[0098] 较佳的,为了使损失函数最小化,同时为了防止过度拟合和内协变量移位,在整个过程中,本发明都使用Adam优化器、批量规范化和随机失活等方法。
[0099] 在本实施例中,所述对网络参数进行优化具体包括以下步骤:
[0100] 步骤S1:判断当前的一维卷积神经网络1-D CNN与门控循环单元GRU相结合的网络是否达到训练预设的期望,若是,则将当前的网络参数作为训练好的网络参数,否则进入步
骤S2;
[0101] 步骤S2:通过基于L2正则化损失函数的反向传播神经网络来防止拟合过度并使损失函数最小化,并分别更新一维卷积神经网络(1-D CNN)和门控循环单元(GRU)中的权重和
偏差,返回步骤S1。
[0102] 其中,2正则化可以看作是在寻找最小权重和最小化成本函数之间进行折衷的一种有效方法。因此,本发明的1-D CNN-GRU网络通过基于L2正则化损失函数的反向传播神经
网络来防止拟合过度并使损失函数最小化,损失函数的计算公式如下:
[0103]
[0104] 式中,y(t)(i)是一个指标变量(0或1),如果t类与i类样本的类别相同,则为1,否则为0; 是i类样本对应于t类样本的概率;n是样本数;c是类别数;λ是L2正则化系数。
[0105] 特别的,为了验证本实施例的有效性,本实施例选用型号为HLD54-WJ-71的混流式水轮机;选用型号为SFW1250-6/1180的水轮发电机;选用型号为LC0166C的压电加速度传感
器来进行研究。
[0106] 在本实施中,研究的水电机组的数据集为实测的水电机组振动数据集,如表1所示。
[0107] 表1实测的水电机组振动数据集
[0108]
[0109] 由表1可知,实测数据中水电机组状态包括:类别1:正常状态、类别2:机组轴瓦间隙过大故障状态。鉴于水电机组产生振动信号的激励源复杂,且其包含着丰富的机组运行
信息。因此,选择水电机组振动信号作为其故障诊断数据来源。此外,本实验分别通过验证
本发明算法的有效性和稳定性,验证所提方法是否有现场实用的价值。
[0110] (1)网络训练
[0111] 首先,对表1实测的振动数据按照上文所述的数据预处理进行数据重构,其次,按8:1:1的比例将其划分为训练集,测试集及验证集。最后,将训练集和验证集输入到1-D 
CNN-GRU网络中进行训练,为达到训练误差最小的情况,通过对一维卷积神经网络中的卷积
层滤波器个数,卷积核尺寸,步长,激活函数、GRU的神经元个数、随机失活、批量处理个数等
参数进行调节。最终得到网络的最优参数,并以此作为故障诊断模型的参数,其参数如表2
所示,该参数下的训练及验证过程的精度及损失曲线如图5所示。
[0112] 表2网络参数
[0113]
[0114]
[0115] 从图5可以看出,在训练和验证过程中收敛速度快,无过度拟合现象,表明本实施例采用的正则化方法(随机失活率,批量归一化)是有效的。在图5的(a)中的两条曲线分别
表示训练精度和验证精度。在图5的(b)中,两条曲线分别表示训练损失和验证损失。
[0116] (2)有效性评估
[0117] 为了评价本实施例方法的有效性,采用了五种分类方法(1-D CNN-GRU(本专利所提方法)、1-D CNN、GRU、反向传播神经网络(BPNN)和支持向量机(SVM))对实测数据集进行
故障诊断。其中前三种方法的输入是原始振动信号,后两种方法的输入分别是原始数据和
使用变分模式分解(VMD)从每个样本中提取的频域特征(FD)。
[0118] 在故障分类方法的评价指标中,分类精度、精确度和召回率是关键指标,此外,F-measure是包含精确度和召回率的另一个广泛使用的标准。因此,本实施例应用分类精度和
F-measure来验证所提出方法的有效性。验证结果如图6所示,在图6中BPNN(raw data)表示
BPNN采用原始振动信号为训练数据;BPNN(FD)表示BPNN采用频域特征作为训练数据;SVM
(raw data)表示SVM采用原始振动信号为训练数据;SVM(FD)表示SVM采用频域特征作为训
练数据。
[0119] 由图6中结果可得出结论:1)深度学习方法的精度明显高于传统的原始振动信号方法。这是因为深度学习方法可以自适应地从原始振动信号中学习有价值的信息。2)通过
对比其它方法,本实施例所提方法具有更高的分类精度和F-measure分数,结果证明了该方
法的有效性。
[0120] (3)稳定性评估
[0121] 本实施例应用K-折叠交叉验证的方法来验证本实施例所提出方法的稳定性。在本实施例中,K值设置为10,即典型的10倍交叉验证。采用不同的方法,对不同数据集的诊断性
能进行了10次比较。每条轨迹的精度如图7所示,平均精度和标准偏差见表3。
[0122] 表3各方法10次试验的平均精度和标准偏差
[0123]
[0124] 从表3和图7可以看出,比较各方法在10次交叉验证的情况下,本实施例所提方法的平均精度比其他方法更高;标准偏差分别比其他方法更低。因此,这些结果表明所提出的
方法的稳定性优于其他方法。
[0125] 基于以上结果可以看出,本实施例所提出的方法的平均精度和标准偏差分别高于和小于其他方法,因此,该方法的稳定性更好,能比其他方法更有效、更可靠地实现水电机
组故障诊断。
[0126] 以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等
效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所
作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。