一种基于深度学习的变工况行星齿轮箱故障诊断方法及装置转让专利
申请号 : CN202011374953.6
文献号 : CN112665852B
文献日 : 2021-11-05
发明人 : 冒泽慧 , 夏明轩 , 姜斌 , 严星刚
申请人 : 南京航空航天大学
摘要 :
权利要求 :
1.一种基于深度学习的变工况行星齿轮箱故障诊断方法,其特征在于,包括:S1、采集源域与目标域的齿轮箱振动信号,得到源域数据和目标域数据,其中,所述源域数据包括工况改变之前的齿轮箱振动信号,所述目标域数据包括工况改变后的齿轮箱振动信号;
S2、对所述源域数据和所述目标域数据进行分割,获取包含相同数量的数据点的样本段,其中,每个样本段包括:数据点、故障类别标签和工况信息,所得到的样本段记录至离线训练数据库;
其中,源域训练集为 其中 为第i个样本, 为该样本的s
标签,K表示待分类数据共有K类,S表示源域数据集,n表示源域数据集内的样本个数,目标域训练集为 其中 为第i个样本且i显示为正整数,目标域训练集不含有标签,T
T表示目标域数据集,n表示目标域数据集T内的样本个数;
S3、建立域适应卷积神经网络模型,并通过所述离线训练数据库的训练集训练所述域适应卷积神经网络模型,再通过所述离线训练数据库的验证集验证所述域适应卷积神经网络模型的准确性;在S3中,建立的域适应卷积神经网络模型包括两个部分:第一部分,用于对源域的有故障类别标签的数据,通过卷积神经网络进行有监督的标签预测;第二部分,用于对目标域的无故障类别标签的数据,通过自编码器进行无监督重构;其中,两个部分的参数都输入所述自编码器,而所述自编码器中的参数则为所述目标域的数据独享;
所述域适应卷积神经网络模型由卷积神经网络构成,其中包括:编码器fe、分类器fl和解码器fd;编码器fe将源域数据样本x进行特征提取,转换为中间特征 分类器fl将中间特征 进行分类,得到预测出的不同故障的标签 解码器fd将中间特征 通过反池化操作得到 且使x和 无限接近, 自编码器fe与分类器fl进行组合,得到模型的有监督学习部分 自编码器fe与自解码器fd进行组合,得到模型的无监督学习部分
其中,编码器fe、分类器fl和解码器fd三个部分中的权重参数分别为Θe、Θl和Θd,有监督学习过程包含的权重参数为Θs={Θe,Θl},无监督学习部分包含的权重参数为Θt={Θe,Θd},所述有监督学习过程和所述无监督学习部分的中共享参数为编码器fe的参数Θe;
所述通过所述离线训练数据库的训练集训练所述域适应卷积神经网络模型,包括:对所述域适应卷积神经网络模型采用交替迭代学习的多任务学习方法,从所述离线训练数据库的训练集中提取待输入的样本并输入所述域适应卷积神经网络模型,其中,所述待输入的样本的每个训练批次上轮流运行最小化源域的代价函数和目标域的代价函数;当所述目标域代价函数稳定且不再下降后,训练停止,并得到最优模型参数 通过所述域适应卷积网络故障诊断模型中的编码器fe与分类器fl的组合Fs对目标域数据样本进行故障诊断;
在训练域适应卷积神经网络模型的过程中,使用交替迭代学习的多任务学习方法,输入样本的每个batch上轮流最小化源域与目标域的两个代价函数:其中,两个代价函数分别处理源域中有标签的数据 与目标域中无标签数据 ls和lt分别为有监督部分和无监督部分的损失函数;其形式分别如下:综上所述,该任务的总目标为:
其中,λ为平衡两个子任务的超参数,可以人为调节,采用梯度下降法求解模型的权重参数Θe、Θl、Θd,得到训练后的域适应卷积神经网络模型,当目标域代价函数稳定不再下降后,训练停止,得到模型的权重参数Θe、Θl、Θd的最优估计量与分类器
S4、获取齿轮箱在工况变化后的振动信号作为在线数据,对所述在线数据进行预处理得到测试样本,将所述测试样本输入训练后的所述域适应卷积神经网络模型,最终得到故障诊断结果。
2.根据权利要求1所述的方法,其特征在于,在S1中,所述采集源域与目标域的齿轮箱振动信号,包括:
通过所述齿轮箱中安装的加速度传感器,采集所述齿轮箱运行过程中的振动信号,其中,所述加速度传感器所采集的振动信号方向包括:水平、竖直和轴向三个方向,采样频率为10kHz。
3.根据权利要求1所述的方法,其特征在于,在S2中,齿轮箱振动信号为一维振动信号,一个样本段长度为1024个数据点,每个数据点包含三个测点信号;
每个故障类别标签和工况信息下采集得到的数据,都含有至少三个不同测点的一维振动信号,所述至少三个不同测点的一维振动信号在相同时间分割,形成包含相同数据点的样本段。
4.一种基于深度学习的变工况行星齿轮箱故障诊断装置,其特征在于,包括:数据准备模块,用于采集源域与目标域的齿轮箱振动信号,得到源域数据和目标域数据,其中,所述源域数据包括工况改变之前的齿轮箱振动信号,所述目标域数据包括工况改变后的齿轮箱振动信号;
数据分析模块,用于对所述源域数据和所述目标域数据进行分割,获取包含相同数量的数据点的样本段,其中,每个样本段包括:数据点、故障类别标签和工况信息,所得到的样本段记录至离线训练数据库;
其中,源域训练集为 其中 为第i个样本, 为该样本的标s
签,K表示待分类数据共有K类,S表示源域数据集,n 表示源域数据集内的样本个数,目标域训练集为 其中 为第i个样本且i显示为正整数,目标域训练集不含有标签,TT
表示目标域数据集,n 表示目标域数据集T内的样本个数;模型维护模块,用于建立域适应卷积神经网络模型,并通过所述离线训练数据库的训练集训练所述域适应卷积神经网络模型,再通过所述离线训练数据库的验证集验证所述域适应卷积神经网络模型的准确性;
所述模型维护模块,建立的域适应卷积神经网络模型包括两个部分:第一部分,用于对源域的有故障类别标签的数据,通过卷积神经网络进行有监督的标签预测;第二部分,用于对目标域的无故障类别标签的数据,通过自编码器进行无监督重构;其中,两个部分的参数都输入所述自编码器,而所述自编码器中的参数则为所述目标域的数据独享;
所述域适应卷积神经网络模型由卷积神经网络构成,其中包括:编码器fe、分类器fl和解码器fd;编码器fe将源域数据样本x进行特征提取,转换为中间特征 分类器fl将中间特征 进行分类,得到预测出的不同故障的标签 解码器fd将中间特征 通过反池化操作得到 且使x和 无限接近, 自编码器fe与分类器fl进行组合,得到模型的有监督学习部分 自编码器fe与自解码器fd进行组合,得到模型的无监督学习部分
其中,编码器fe、分类器fl和解码器fd三个部分中的权重参数分别为Θe、Θl和Θd,有监督学习过程包含的权重参数为Θs={Θe,Θl},无监督学习部分包含的权重参数为Θt={Θe,Θd},所述有监督学习过程和所述无监督学习部分的中共享参数为编码器fe的参数Θe;
所述模型维护模块,具体用于对所述域适应卷积神经网络模型采用交替迭代学习的多任务学习装置,从所述离线训练数据库的训练集中提取待输入的样本并输入所述域适应卷积神经网络模型,其中,所述待输入的样本的每个batch上轮流运行最小化源域的代价函数和目标域的代价函数;当所述目标域代价函数稳定且不再下降后,训练停止,并得到最优模型参数 通过所述域适应卷积网络故障诊断模型中的编码器fe与分类器fl的组合Fs对目标域数据样本进行故障诊断;
在训练域适应卷积神经网络模型的过程中,使用交替迭代学习的多任务学习方法,输入样本的每个batch上轮流最小化源域与目标域的两个代价函数:其中,两个代价函数分别处理源域中有标签的数据 与目标域中无标签数据 ls和lt分别为有监督部分和无监督部分的损失函数;其形式分别如下:综上所述,该任务的总目标为:
其中,λ为平衡两个子任务的超参数,可以人为调节,采用梯度下降法求解模型的权重参数Θe、Θl、Θd,得到训练后的域适应卷积神经网络模型,当目标域代价函数稳定不再下降后,训练停止,得到模型的权重参数Θe、Θl、Θd的最优估计量与分类器 诊断模块,用于获取齿轮箱在工况变化后的振动信号作为在线数据,对所述在线数据进行预处理得到测试样本,将所述测试样本输入训练后的所述域适应卷积神经网络模型,最终得到故障诊断结果。
5.根据权利要求4所述的装置,其特征在于,所述数据准备模块,具体用于通过所述齿轮箱中安装的加速度传感器,采集所述齿轮箱运行过程中的振动信号,其中,所述加速度传感器所采集的振动信号方向包括:水平、竖直和轴向三个方向,采样频率为10kHz;
所述数据分析模块,具体用于齿轮箱振动信号为一维振动信号,一个样本段长度为
1024个数据点,每个数据点包含三个测点信号;每个故障类别标签和工况信息下采集得到的数据,都含有至少三个不同测点的一维振动信号,所述至少三个不同测点的一维振动信号在相同时间分割,形成包含相同数据点的样本段。
说明书 :
一种基于深度学习的变工况行星齿轮箱故障诊断方法及装置
技术领域
背景技术
行星齿轮箱的主要部件包括齿轮、滚动轴承、传动轴等。在旋转机械设备长时间运行于高
速、重负荷、强冲击的工作条件下,齿轮箱中的滚动轴承与齿轮系容易出现损伤,进而导致
旋转机械发生故障。一旦故障发生将极大影响生产效率,甚至造成巨大损失。因此,研究齿
轮箱的故障诊断方法,对于保障机械设备的安全运行至关重要。
工作条件如转速、负载发生变化后,训练数据与测试数据之间有了分布差异。而传统的基于
数据的故障诊断方法,普遍存在域漂移现象,不能在测试集(目标域)变化之后仍然有优良
的性能。
发明内容
箱振动信号;
离线训练数据库;
经网络模型的准确性;
到故障诊断结果。
况改变后的齿轮箱振动信号;
的样本段记录至离线训练数据库;
述域适应卷积神经网络模型的准确性;
型,最终得到故障诊断结果。
理,创建离线训练数据库;构建域适应卷积神经网络模型,并训练网络;获取所述齿轮箱在
工况变化后的振动信号作为在线数据,经过预处理后生成测试样本,将测试样本输入训练
后的域适应卷积神经网络模型,得到故障诊断结果。其中,基于小波包变换的方法,该方法
结合了随机森林算法,能够实现较为准确的故障诊断,并且在对匝间短路微小故障的敏感
性上有一定的优势。将小波包变换与随机森林算法用于对高速列车牵引系统中的匝间短路
故障诊断。这种设计能够有效地实现高速列车牵引电机匝间短路故障诊断,并且在微小故
障诊断上也有较高的灵敏度。
附图说明
域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附
图。
齿轮箱中可能的安装位置,并不限定安装方式和传感器的类型,图2中的齿轮箱也是一种常
见的齿轮箱形式,本领域技术人员能够从中理解传感器在齿轮箱中可能的安装位置;
具体实施方式
例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类
似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能
解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形
式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书
中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除
存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,
当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者
也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使
用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有
与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用
字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且
除非像这里一样定义,不会用理想化或过于正式的含义来解释。
工作条件如转速、负载发生变化后,训练数据与测试数据之间有了分布差异。而传统的基于
数据的故障诊断方法,普遍存在域漂移现象,不能在测试集(目标域)变化之后仍然有优良
的性能。这种工况变化带来的数据分布迁移属于故障诊断中的跨域学习问题。目前,对于齿
轮箱故障诊断的跨域学习仍然缺少可行的工程方法。因此,还需进一步发展变工况条件下
齿轮箱的故障诊断手段。
故障诊断,解决在变工况条件下齿轮箱的故障诊断问题。具体需要采集源域与目标域的齿
轮箱振动信号;将采集得到的源域与目标域信号进行预处理,创建离线训练数据库;构建域
适应卷积神经网络模型,并训练网络;获取所述齿轮箱在工况变化后的振动信号作为在线
数据,经过预处理后生成测试样本,将测试样本输入训练后的域适应卷积神经网络模型,可
以得到故障诊断结果。
改变后的齿轮箱振动信号。
据点的样本,创建多个样本段,每个样本段包括数据点、故障类别标签与工况信息,所述样
本构成离线训练数据库,离线训练数据库分为训练集和验证集。
经网络模型的准确性。
到故障诊断结果。
器所采集的振动信号方向包括:水平、竖直和轴向三个方向,采样频率为10kHz。例如图2中
所示的,CH1、CH2、CH3分别为行星齿轮箱输入端的径向、垂直、水平方向的传感器。
有至少三个不同测点的一维振动信号,所述至少三个不同测点的一维振动信号在相同时间
分割,形成包含相同数据点的样本段。某一工况下,采集得到的数据形式及预处理步骤如图
3所示。例如:每种工况与不同故障类别标签下采集得到的数据都含有三个不同测点的一维
振动信号,将三个测点信号在相同时间分割,形成相同长度即包含相同数据点的样本段。一
个样本段长度为1024个数据点,每个数据点包含三个测点信号。创建得到预设数量的样本
段,构成离线训练数据库。其中,每个样本段包括数据点、故障类别标签与工况信息,所述样
本构成离线训练数据库,离线训练数据库分为训练集和验证集。每一种状态对应至少800个
样本段。源域训练集为 其中 为第i个样本, 为该样本的标
s
签,K表示待分类数据共有K类,S表示源域数据集,n 表示源域数据集内的样本个数,目标域
训练集为 其中 为第i个样本且i显示为正整数,目标域训练集不含有标签,T
T
表示目标域数据集,n表示目标域数据集T内的样本个数。
于对目标域的无故障类别标签的数据,通过自编码器进行无监督重构。
适应卷积神经网络模型。该模型分为两个部分:(i)对源域的有标签数据通过卷积神经网络
进行有监督的标签预测,(ii)对目标域的无标签数据通过自编码器进行无监督重构。如图4
所示,模型的两个部分中,自编码器共享参数,而自解码器的参数为目标域数据独享。该模
型的目的是通过减少源域和目标域之间的差异,使自编码器通过源域数据所学的标签预测
函数,能够对目标域内无标签的故障数据进行分类。通过(监督)学习源标签分布和(非监
督)学习目标数据分布,无标签的目标域数据提供了辅助训练信息,可以帮助算法比仅使用
源数据更好地在目标域上泛化。在训练集上训练网络,通过验证集验证网络模型的准确性。
点数、学习率以及迭代次数。
{Θe,Θd},所述有监督学习过程和所述无监督学习部分的中共享参数为编码器fe的参数
Θe。
所述待输入的样本的每个batch上轮流运行最小化源域的代价函数和目标域的代价函数。
当所述目标域代价函数稳定且不再下降后,训练停止,并得到域适应卷积神经网络的最优
参数 通过所述域适应卷积网络故障诊断模型中的编码器fe与分类器fl的组合
Fs对目标域数据样本进行故障诊断。在训练域适应卷积神经网络模型的过程中,使用交替
迭代学习的多任务学习方法,输入样本的每个batch上轮流最小化源域与目标域的两个代
价函数:
该分类器可以实现目标域数据的故障诊断。对目标域样本进行故障诊断。
模型,最终得到故障诊断结果。该模型的目的是通过减少源域和目标域之间的差异,使自编
码器通过源域数据所学的标签预测函数,能够对目标域内无标签的故障数据进行分类。通
过(监督)学习源标签分布和(非监督)学习目标数据分布,无标签的目标域数据提供了辅助
训练信息,可以帮助算法比仅使用源数据更好地在目标域上泛化。而在后续的在线测试阶
段:获取所述齿轮箱在工况变化后的振动信号作为在线数据,经过预处理后生成测试样本
将测试样本输入训练后的域适应卷积神经网络模型中的有监督部分Fs进行标签
预测,可以得到故障诊断结果:
训练网络。
经网络模型,可以得到故障诊断结果。
样本构成离线训练数据库,离线训练数据库分为训练集和验证集;
障诊断结果。其中,所述在线数据包括:当前所述行星齿轮箱三个测点的振动信号。
率为10kHz。
含相同数据点的样本段。一个样本段长度为1024个数据点,每个数据点包含三个测点信号,
预处理步骤如图3所示。
S T
有K类。目标域训练集为 其中 为第i个样本,目标域训练集不含有标签。n 和n
分别为源域S和目标域T内的样本个数。
数。
{Θe,Θd}。两过程中共享参数为编码器fe的参数Θe。
与分类器 该分类器可以实现目标域数据的故障诊断。
况改变后的齿轮箱振动信号。
的样本段记录至离线训练数据库。
述域适应卷积神经网络模型的准确性。
型,最终得到故障诊断结果。
平、竖直和轴向三个方向,采样频率为10kHz。
到的数据,都含有至少三个不同测点的一维振动信号,所述至少三个不同测点的一维振动
信号在相同时间分割,形成包含相同数据点的样本段。
用于对目标域的无故障类别标签的数据,通过自编码器进行无监督重构。其中,两个部分的
参数都输入所述自编码器,而所述自编码器中的参数则为所述目标域的数据独享。
卷积神经网络模型,其中,所述待输入的样本的每个batch上轮流运行最小化源域的代价函
数和目标域的代价函数。当所述目标域代价函数稳定且不再下降后,训练停止,并得到域适
应卷积神经网络模型参数 通过所述对目标域数据样本进行故障诊断。
由于基于小波包变换的方法,该方法结合了随机森林算法,能够实现较为准确的故障诊断,
并且在对匝间短路微小故障的敏感性上有一定的优势。将小波包变换与随机森林算法用于
对高速列车牵引系统中的匝间短路故障诊断。这种方法能够有效地实现高速列车牵引电机
匝间短路故障诊断,并且在微小故障诊断上也有较高的灵敏度。此外,通过随机森林进行特
征选择能够提升模型的泛化性能,具有较强的鲁棒性。
施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例
的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于
此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替
换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范
围为准。