基于混合卷积的多源域轴承故障诊断方法转让专利

申请号 : CN202311301059.X

文献号 : CN117349749B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 马新娜汤宇刘勤清李豪郑雪鹏梁秀李沂阳胡畅霞谷丽华胡沛伶张策何畔

申请人 : 石家庄铁道大学

摘要 :

本发明公开了一种基于混合卷积的多源域轴承故障诊断方法,涉及轴承故障诊断技术领域。所述方法采集不同工况原始轴承故障信号,将数据分配给源域和目标域,多个源域数据加标签;将多个源域、目标域按照设置要求无重叠的形式分割信号,信号样本经过FFT变换后得到多个源域和目标域的频域信号;构建一维的基于混合卷积的多源域滚动轴承故障诊断模型,并初始化故障诊断模型参数;将两个源域和目标域中样本随机打乱,输入故障网络模型进行训练,获取对应的健康状态分类;最小化源域和目标域之间的域适应损失、分类损失以及分类器差异损失;采用Adam算法对网络参数进行更新。所述方法能够提高在目标域的分类性能,且故障诊断精度更高。

权利要求 :

1.一种基于混合卷积的多源域轴承故障诊断方法,其特征在于包括如下步骤:采集不同工况下的滚动轴承信号数据集,进行数据预处理;

构建一维混合卷积网络的多源域滚动轴承故障诊断模型,并初始化模型参数;

将两个源域和目标域的数据样本分别随机打乱,将源域带标签,目标域无标签的数据集输入所述网络模型中进行训练;

源域和目标域整体送入所述模型中的共享特征提取器来获取共享特征信息,再将源域和目标域对送入特定特征提取器,获取对应的特定特征信息;

获取到样本信息后进行领域适应,将源域和目标域整体利用最大均方值差异进行整体域对齐,并利用局部最大均值差异进行领域内的类别对齐;

将源域送入各个源域分类器计算交叉熵分类损失,求和得到源域分类损失,为降低两个分类器的目标域样本模糊样本误分类的可能,对两个分类器取平均值,来实现分类器器对齐;

将所有的损失函数整合,并赋予每部分损失一定的影响因子,最小化损失函数,Adam优化网络参数,以此来训练模型;

将不带标签的目标域送入训练好的所述承故障诊断模型中,并经过两个分类器来获得目标域的分类精度,取两个分类器的平均值作为最终分类结果,完成轴承故障的诊断;

最后进行测试,将不带标签的目标域送入训练好的特征提取网络中,特征提取网络即为共享特征提取器和特定特征提取器,经过两个特定分类器来获得目标域的分类精度,取两个分类器的平均值作为最终分类结果,完成轴承故障的诊断;

所述多源域滚动轴承故障诊断模型包括:共享特征提取器F,所述共享特征提取器F的输入端输入FFT变换后得到多个源域和目标域的频域信号,所述共享特征提取器F的输出端分别与特定特征提取器SF1的输入端以及特征提取器SF2的输入端连接,所述特定特征提取器SF1的一个输出端以及特征提取器SF2的一个输出端分别与优化模块最大均方值差异MMSD和局部最大值差异LMMD连接,优化模块MMSD&LMMD用于优化边缘分布以及优化条件分布差异;特定特征提取器SF1的另一个输出端与分类器C1连接,特定特征提取器SF2的另一个输出端与分类器C2连接,使用所述分类器C1、分类器C2计算出领域适应损失;并将领域适应损失输入给共享特征提取器F;

将混合卷积块结合入一维卷积网络中并应用多源域故障诊断模型中的共享特征提取器部分来提取源域和目标域的共享特征信息,以此来获取更加丰富和全面的特征信息,来进行故障诊断;

源域样本在进入经过特定特征提取器的全连接输出之后,使用softmax对特定分类器分类,并采用交叉熵损失函数作为损失函数,求和后得到源域的分类损失Lcls,其公式如(1)所示:其中,F为共享的特征提取器,SFi为特定特征提取器,Ci为领域分类器,LENT为交叉熵分si si类损失,x 、y 为源域的样本和标签;

当模型提取到特定领域特征后,首先利用最大均方值差异MMSD来优化边缘分布,进行整体分布上的域对齐LMMSD,其公式为(2)所示:其中E表示求源域和目标域的期望, 表示为两个希尔伯特空间求外

积,H表示为希尔伯特空间;

然后再利用LMMD算法优化条件分布差异,缩小类边界,增大不同类之间的距离LLMMD,其公式如(3),(4)所示:c

其中ωi 表示对应类别权重,c表示故障类别个数,C表示类别总数,ψ(x)为源域和目标域样本的非线性特征映射函数;

采用一个参数λ来调整边缘分布自适应和条件分布自适应之间的关系;

对于目标域样本,通过不同分类器预测的目标域样本之间也会存在一定的差异,因为不同分类器是通过不同源域源本训练得到的,所以对于类边界上的目标域样本肯能会存在分类器差异,为降低特定分类器对目标域样本预测的不一致性,通过计算多个特定分类器器输出的平均值Lcls‑avg,来减少边界误分类的可能,实现特定分类器对齐,其公式如(5)所示:其中N表示分类器个数,F表示为共享特征提取器,SFi表示为特定特定提取器,C表示为T域分类器,x为目标域样本;

总体优化目标主要包含三大部分,源域分类损失,分类器差异损失和领域适应损失,其中领域适应损失包括域间损失和类内损失,其公式如(6)所示:Ltotal=Lcls+αLcls‑avg+β(λLLMMD+(1‑λ)LMMSD)                   (6)其中α、β和λ为影响因子。

2.如权利要求1所述的基于混合卷积的多源域轴承故障诊断方法,其特征在于,所述进行数据预处理的方法包括:将数据集整体分成三部分,两个源域和一个目标域,按照无重叠的形式分割信号数据样本以此来构建一维信号数据样本,并对其快速傅里叶变换FFT和“0‑1”标准化处理,源域数据带标签,目标域数据无标签。

3.如权利要求1所述的基于混合卷积的多源域轴承故障诊断方法,其特征在于,共享特征提取器:经过快速傅里叶变换FFT处理将时域信号转换到频域后,将多个源域和目标域数据映射到共享特征空间,共享特征提取器的网络的主要结构为混合卷积块。

4.如权利要求1所述的基于混合卷积的多源域轴承故障诊断方法,其特征在于:经过共享特征提取器,提取丰富的共享特征信息后,再为每个源域和目标域分配一个特定特征提取器,进行特定特征提取,经过特定特征提取器之后经过池化和全连接层得到最终输出。

说明书 :

基于混合卷积的多源域轴承故障诊断方法

技术领域

[0001] 本发明涉及轴承故障诊断方法技术领域,尤其涉及一种基于混合卷积的多源域轴承故障诊断方法。

背景技术

[0002] 轴承作为旋转机械设备的关键核心部件,需要为其长期、安全可靠的提供服务,因此有必要及时监测轴承的健康状态,从而减少设备停机时间,制定计划维修,避免悲剧性灾难。轴承在运行过程中环境复杂,如何及时准确在工业工程中进行轴承故障诊断,是一个巨大的挑战。
[0003] 随着深度学习快速发展,故障诊断领域取得了很大的进步,但是轴承种类繁多,在不同的负载、转速下以及相同的轴承故障类型会采集到不同的振动信号,轴承数据分布存在较大差异。并且,轴承在服役期间的将健康状态数据是难以获取的,而深度学习模型依赖于大量带标签的数据进行来训练模型,不同训练故障数据的稀缺成为深度学习方法应用在故障诊断领域的瓶颈。但是,迁移学习可以从有标记的源域学习故障诊断知识,并将这些知识转移到无标记的目标域中,从而实现故障分类。改变数据特征分布的问题,也可以称为域适应的问题,主要通过差异度量和域对抗的方式不断缩小两域之间的差异,差异度量通过KL散度,最大均值差异和中心矩差异等距离测量差异算法嵌入自适应中减少域差异,如Ben首次指出特征分布之间的距离对模型在目标域的性能起着重要作用,陈等人提出切片wasserstein距离的方法,更加关注于类别条件分布,域对抗方法主要通过生成器和判别器之间进行博弈训练来学习领域不变特征,赵等人提出小波时频图和多对抗域适应网络结合的方法进行故障诊断。
[0004] 将迁移学习从理论研究落实到故障诊断的实际应用中,若采用以往的单源域故障诊断,可能会由于源域和目标之间的相关性低,从而造成负迁移的情况。然而数据扩充需要高成本,此时多源域的故障诊断,可以提供更加丰富的数据特征信息,为上述问题的解决提供了一个方向。
[0005] 早期多源域的故障诊断,主要思想是把多个源域简单组合起来变成单个源域,再用单源域适应的方法来解决问题。但是,这种方法多个源域之间数据分布存在较大差异时,会削弱模型在目标域中的泛化性能。而采用多源域的方法,如,杨盛康等人采用锚适配器的方法,通过构建多个源域‑目标域锚适配器对,集成多源故障特征信息,学习域不变特征,加权集成分类器来进行故障诊断的识别;许等人提出基于相似性度量的域对齐网络,相似性度量来约束输入和中心特征之间的相似性,减小多个组合的源域和目标域之间的距离;吴等人提出知识单元匹配引导的具有注意力机制的多源域适应网络(KDMUMDAN),采用知识动态匹配单元作为特征提取器动态适应输入样本,并将注意力机制嵌入分类器中增强相关影响来促进对齐分布;李等人提出多源域强化集成深度学习网络,基于kMMD和多样性度量的方式,进行无监督迁移学习,用统一的度量作为奖励从而进行故障诊断;田等人提出多源子域自适应的方法,利用多分支的网络结构分别匹配每个源域和目标域的特征空间,再将多个分类器的加权分数进行联合设备诊断;这些方法提高了多源域迁移故障诊断的性能,并减少了学习过程中存在的负迁移。但是上述研究更加关注于边缘分布对齐,而忽略了边缘分布对齐,可能导致的故障分类精度低的问题。

发明内容

[0006] 本发明所要解决的技术问题是如何提供一种能够提高在目标域的分类性能,且故障诊断精度更高的多源域轴承故障诊断方法。
[0007] 为解决上述技术问题,本发明所采取的技术方案是:一种基于混合卷积的多源域轴承故障诊断方法,包括如下步骤:
[0008] 采集不同工况下的滚动轴承信号数据集,进行数据预处理;
[0009] 构建一维混合卷积网络的多源域滚动轴承故障诊断模型,并初始化模型参数;
[0010] 将两个源域和目标域的数据样本分别随机打乱,将源域带标签,目标域无标签的数据集输入所述网络模型中进行训练;
[0011] 源域和目标域整体送入所述模型中的共享特征提取器来获取共享特征信息,再将源域和目标域对送入特定特征提取器,获取对应的特定特征信息;
[0012] 获取到样本信息后进行领域适应,将源域和目标域整体利用最大均方值差异进行整体域对齐,并利用局部最大均值差异进行领域内的类别对齐;
[0013] 将源域送入各个源域分类器计算交叉熵分类损失,求和得到源域分类损失,为降低两个分类器的目标域样本模糊样本误分类的可能,对两个分类器取平均值,来实现分类器器对齐;
[0014] 将所有的损失函数整合,并赋予每部分损失一定的影响因子,最小化损失函数,Adam优化网络参数,以此来训练模型;
[0015] 将不带标签的目标域送入训练好的所述承故障诊断模型中,并经过两个分类器来获得目标域的分类精度,取两个分类器的平均值作为最终分类结果,完成轴承故障的诊断。
[0016] 最后进行测试,将不带标签的目标域送入训练好的特征提取网络(共享特征提取器和特定特征提取器)中,经过两个特定分类器来获得目标域的分类精度,取两个分类器的平均值作为最终分类结果,完成轴承故障的诊断。
[0017] 进一步的技术方案在于,所述进行数据预处理的方法包括:将数据集整体分成三部分,两个源域和一个目标域,按照无重叠的形式分割信号数据样本以此来构建一维信号数据样本,并对其快速傅里叶变换(FFT)和“0‑1”标准化处理,源域数据带标签,目标域数据无标签。
[0018] 进一步的技术方案在于,所述多源域故障诊断模型包括:共享特征提取器(F),所述共享特征提取器(F)的输入端输入FFT变换后得到多个源域和目标域的频域信号,所述共享特征提取器(F)的输出端分别与特定特征提取器SF1的输入端以及特征提取器SF2的输入端连接,所述特定特征提取器SF1的一个输出端以及特征提取器SF2的一个输出端分别与优化模块MMSD&LMMD连接,优化模块MMSD&LMMD用于优化边缘分布以及优化条件分布差异;特定特征提取器SF1的另一个输出端与分类器C1连接,特定特征提取器SF2的另一个输出端与分类器C2连接,使用所述分类器C1、分类器C2计算出领域适应损失;并将领域适应损失输入给共享特征提取器(F)。
[0019] 进一步的技术方案在于,共享特征提取器:经过快速傅里叶变换(FFT)处理将时域信号转换到频域后,将多个源域和目标域数据映射到共享特征空间,共享特征提取器采用混合卷积块结合入一维卷积网络中的方式,以此来获取更加丰富和全面的特征信息,来进行故障诊断。
[0020] 进一步的技术方案在于,经过共享特征提取器,提取丰富的共享特征信息后,再为每个源域和目标域分配一个特定特征提取器,进行特定特征提取,经过特定特征提取器之后经过池化和全连接层得到最终输出。
[0021] 进一步的技术方案在于,源域样本在进入特定特定提取器全连接输出之后,使用softmax对特定分类器分类,并采用交叉熵损失函数作为损失函数。求和后得到源域的分类损失Lcls;其公式如(1)所示
[0022]
[0023] 其中,F为共享的特征提取器,SFi为特定特征提取器,Ci为领域分类器,LENT为交叉si si熵分类损失,x 、y 为源域的样本和标签。
[0024] 当模型提取到特定领域特征后,首先利用最大均方值差异(MMSD)来优化边缘分布,进行整体分布上的域对齐LMMSD,其公式为(2)所示:
[0025]
[0026] 其中E表示为求源域和目标域的期望, 表示为两个希尔伯特空间求外积,H表示为希尔伯特空间。
[0027] 然后再利用LMMD算法优化条件分布差异,缩小类边界,增大不同类之间的距离LLMMD,其公式如(3),(4)所示:
[0028]
[0029]
[0030] 其中ωic表示对应类别权重,c表示故障类别个数,C表示类别总数,ψ(x)为源域和目标域样本的非线性特征映射函数。
[0031] 采用一个参数λ来调整边缘分布自适应和条件分布自适应之间的关系;
[0032] 对于目标域样本,通过不同分类器预测的目标域样本之间也会存在一定的差异,因为不同分类器是通过不同源域源本训练得到的,所以对于类边界上的目标域样本肯能会存在分类器差异,为降低特定分类器对目标域样本预测的不一致性,通过计算多个特定分类器器输出的平均值Lcls‑avg,来减少边界误分类的可能,实现特定分类器对齐,N表示分类器个数;
[0033]
[0034] 其中N表示分类器个数,F表示为共享特征提取器,SFi表示为特定特定提取器,C表T示为域分类器,x为目标域样本。
[0035] 总体优化目标主要包含三大部分,源域分类损失,分类器差异损失和领域适应损失,其中领域适应损失包括域间损失和类内损失:
[0036] Ltotal=Lcls+αLcls‑avg+β(λLLMMD+(1‑λ)LMMSD)    (6)
[0037] 其中α、β和λ为影响因子。
[0038] 采用上述技术方案所产生的有益效果在于:所述方法采用混合卷积(共享特征提取器)能够充分发挥多源域的作用,提取丰富的特征信息,增强了MIX‑MUDA网络的特征学习能力;采用最大均方值差异(MMSD)和局部最大均值差异(LMMD)结合的方式,同时达到缩小域间差异和类内差异的目标,增强了MIX‑MUDA的领域对齐性能,解决了源域和目标域之间因分布差异而导致故障诊断准确率较低的问题。进行多源域轴承故障诊断时,能有效识别轴承的健康状态,使模型具有较强的泛化性。

附图说明

[0039] 下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0040] 图1是本发明实施例所述方法的诊断流程图;
[0041] 图2是本发明实施例所述方法中混合卷积块的原理图;
[0042] 图3是本发明实施例所述方法中多源域故障诊断模型的原理框图;
[0043] 图4是本发明实施例中江南大学滚动轴承数据采集系统的实物图;
[0044] 图5a是本发明实施例中JB混淆矩阵图;
[0045] 图5b是本发明实施例中CA混淆矩阵图;
[0046] 图5c是本发明实施例中PF混淆矩阵图;
[0047] 图6a是本发明实施例中JB特征可视化图;
[0048] 图6b是本发明实施例中CA特征可视化图;
[0049] 图6c是本发明实施例中PF特征可视化图;
[0050] 图7是本发明实施例中不同域适应方法对比图。

具体实施方式

[0051] 下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0052] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0053] 总体,如图1所示,本发明实施例公开了一种基于混合卷积的多源域轴承故障诊断方法,包括如下步骤:
[0054] 采集不同工况下的滚动轴承信号数据集,进行基本的数据预处理:数据集整体分成三部分,两个源域和一个目标域,按照无重叠的形式分割信号数据样本以此来构建一维信号数据样本,并对其进行快速傅里叶变换(FFT)和“0‑1”标准化处理,源域数据带标签,目标域数据无标签;
[0055] 构建一维混合卷积网络的多源域滚动轴承故障诊断模型,并初始化模型参数;
[0056] 将两个源域和目标域的数据样本分别随机打乱,将源域带标签,目标域无标签的数据集输入所述网络模型中进行训练;
[0057] 源域和目标域整体送入所述模型中的共享特征提取器来获取共享特征信息,再将源域和目标域对送入特定特征提取器,获取对应的特定特征信息;
[0058] 获取到样本信息后进行领域适应,将源域和目标域整体利用最大均方值差异进行整体域对齐,并利用局部最大均值差异进行领域内的类别对齐;
[0059] 将源域送入各个源域分类器计算交叉熵分类损失,求和得到源域分类损失,为降低两个分类器的目标域样本模糊样本误分类的可能,对两个分类器取平均值,来实现分类器器对齐;
[0060] 将所有的损失函数整合,并赋予每部分损失一定的影响因子,最小化损失函数,Adam优化网络参数,以此来训练模型;
[0061] 将不带标签的目标域送入训练好的所述承故障诊断模型中,并经过两个分类器来获得目标域的分类精度,取两个分类器的平均值作为最终分类结果,完成轴承故障的诊断;
[0062] 最后进行测试,将不带标签的目标域送入训练好的特征提取网络(共享特征提取器和特定特征提取器)中,经过两个特定分类器来获得目标域的分类精度,取两个分类器的平均值作为最终分类结果,完成轴承故障的诊断。
[0063] 下面结合具体内容对上述方法进行详细说明
[0064] 混合卷积:
[0065] 从简单的网络结构中提取特征的能力较弱,但是通过增加参数和卷积层的方法设计网络结构虽然能取得较高的精度,然而随着隐藏层的增加,会多出许多不必要的计算开销,大量参数的增加也会使得网络更容易发生过拟合问题,因此需要更加高效的网络结构。
[0066] 混合卷积块(MIXCNN)由深度卷积和点卷积以及残差连接组成,采用深度卷积增加各通道信息特征的差异,点卷积来实现跨通道交互和空间位置信息集成,残差连接来较少信息损失。该网络不需要下采样,可以更大程度的保留原始信息,由此提取共享特征,能提供更为丰富,全面的的数据特征信息。
[0067] 关于混合卷积块的结构,首先,采用宽核滤波器提取短时特征,卷积每一层采用Relu作为激活函数来克服梯度散度问题,采用BN对输出层进行归一化,采用一维深度卷积,与常规卷积不同,一个卷积核对一个通道进行卷积,然后将所有通道堆叠回去,通过残差原理将上述输出与原始卷积相加来减少信息损失,其结构如图2所示。
[0068] 最大均方差异:
[0069] 最大均值差异(MMD),是最常用的度量源域和目标域之间差异的方法,主要计算的是再生希尔博特空间中两个样本映射之间的平均差异,它主要依据的是高维空间根据参考值增加了数据样本的可分性。
[0070] 与MMD不同,最大均方值差异MMSD主要利用的是均方值,均方值是一种能综合反映均值和方差信息的二阶统计量,非常适合于振动信号数据样本的差异表示。
[0071] 与高维空间相比,低维样本空间限制了域混淆的性能,基于此,MMSD引入两个再生希尔伯特空间(RKHS)如式(1)所示:
[0072]
[0073]
[0074] 最大均方值差异公式如式(2)
[0075]
[0076] 基于混合卷积网络的多源域滚动轴承故障诊断模型
[0077] 基于MIXCNN(混合卷积网络)的多源域滚动轴承故障诊断模型(MIX‑MUDA)主要包括三大部分,一个共享特征提取器(F)、两个特定特征提取器(SF1,SF2)和与之对应的两个特定领域分类器(C1,C2),为说明情况,本申请选用了两个源域,模型结构如图2所示。数据的输入为两个带标签的源域数据和一个不带标签的目标域数据。
[0078] 共享特征提取器
[0079] 共享特征提取器:经过快速傅里叶变换(FFT)将时域信号转换到频域后,将多个源域和目标域数据映射到共享特征空间。考虑到模型的参数量和训练效果,共享特征提取器的网络结构其主要结构为混合卷积块,整体结构参数如表1所示:
[0080] 表1‑共享特征提取器网络参数
[0081]
[0082]
[0083] 特定特征提取器
[0084] 经过共享特征提取器,提取了丰富的共享特征信息后,再为每个源域和目标域对分配一个特定特征提取器,进行特定特征提取,经过特定特征提取器之后经过池化和全连接层得到最终输出,其参数结构如表2
[0085] 表2‑特定特征提取器网络参数
[0086]
[0087] 损失函数
[0088] 源域样本在进入全连接输出之后,使用softmax特定分类器分类,并采用交叉熵损失函数作为损失函数。求和后得到源域的分类损失Lcls;
[0089]
[0090] 其中N为源域个数,F为共享特征提取器,H为特定特征提取器,C为特定领域分类器。
[0091] 当模型提取到特定领域特征后,最重要的是学习源域和目标域的域不变表示,以此来减小源域和目标域之间的差异。首先可以利用最大均方值差异(MMSD)来优化边缘分布,进行整体分布上的域对齐LMMSD,MMSD增大再生希尔伯特空间,大大提高网络的适应效率。
[0092]
[0093] 其中E表示为求源域和目标域的期望, 表示为两个希尔伯特空间求外积,H表示为希尔伯特空间。
[0094] 然后再利用LMMD优化条件分布差异,缩小类边界,增大不同类之间的距离LLMMD,其公式如(5),(6)所示:
[0095]
[0096]
[0097] 其中ωic表示对应类别权重,c表示故障类别个数,C表示类别总数,[0098] ψ(x)为源域和目标域样本的非线性特征映射函数。由于本文研究的是多源域无监督域适应,目标域数据无标签,所以这里目标域标签采用的是分类器输出的伪标签。
[0099] 边缘分布自适应和条件分布自适应并不是同等重要的,因此有必要采用一个参数λ来调整两个分布之间的关系。
[0100] 对于目标域样本,通过不同分类器预测的目标域样本之间也会存在一定的差异,因为不同分类器是通过不同源域源本训练得到的,所以对于类边界上的目标域样本肯能会存在分类器差异,为降低特定分类器对目标域样本预测的不一致性,这里通过计算多个特定分类器器输出的平均值Lcls‑avg,来减少边界误分类的可能,实现特定分类器对齐:
[0101]
[0102] 其中N表示分类器个数,F表示为共享特征提取器,SFi表示为特定特定提取器,C表T示为域分类器,x为目标域样本。
[0103] 总体优化目标主要包含三大部分,源域分类损失,分类器差异损失和领域适应损失。其中领域适应损失包括域间损失和类内损失:
[0104] Ltotal=Lcls+αLcls‑avg+β(λLLMMD+(1‑λ)LMMSD)    (8)
[0105] 其中α、β和λ为影响因子。
[0106] 实验验证
[0107] 基于Python‑Pytorch搭建深度学习模型,采用不同数据集,不同工况的迁移任务来验证,本申请所提出的基于混合卷积网络的多源域故障诊断模型相较于其他模型具有更强的故障诊断能力。
[0108] 实验数据集
[0109] 1)江南大学数据集(JNU)
[0110] 江南大学实验采集到的是垂向振动信号,采样频率为50KHz。轴承数据采集系统如图4所示。故障类型主要包括内圈故障、外圈故障、滚动体故障和健康状态这四种类型。每个样本采用2048个采样点。本实验按照三类速度划分工况,每个工况下的每类使用400个样本,则每个数据域共有1600个样本。
[0111] 2)凯斯西储大学数据集(CWRU)
[0112] 对于CWRU滚动轴承数据集,本实验主要采用的是采样频率为12kHz驱动端数据,电机转速设置为1797rpm,1772rpm,1750rpm。本实验按照不同转速划分出三种工况,每个工况下每类样本使用100个样本,每个域共有1000个样本,每个样本的信号长度为1024,表3为具体的标签信息。
[0113] 表3‑CWRU数据集标签信息
[0114]
[0115] 3)德国帕德博恩大学数据集(PU)
[0116] 德国帕德博恩大学轴承数据集,由于加速退化的轴承数据实验台数据分布差异加大,故障诊断难度更大。本实验采用科学实验台中通过加速寿命实验产生的真实轴承损坏样本。数据集按照驱动系统转速、负载扭矩和轴承径向力作为参数划分工况,本实验选取"N15_M07_F10"、"N09_M07_F10"、"N15_M01_F10","N15_M01_F04"这4个工况作为源域和目标域,每种工况包含12种故障类型,故障类别分别为KA04、KA15、KA16、KA22、KA30、KB23、KB24、KB27、KI14、KI16、KI17和KI18,每类故障选取200个样本,每个域共有2400个样本。
[0117] 实验任务设置
[0118] 数据准备阶段,对每个信号样本从原始采集数据信号中进行不重叠切割处理,进行Z‑core标准化处理,每次训练批次大小设置为32,迭代次数为2000,并采用Adam来调节学习率。实验数据分布如表4所示。
[0119] 表4‑实验数据集分布
[0120]
[0121] A:CNN:使用普通卷积网络结构,包含特征提取和分类网络,域适应阶段采用多核最大均值差异的方式。
[0122] B:ADVCNN:CNN和对抗域自适应网络。
[0123] C:MDAN,多对抗网络。
[0124] MIX‑MUDA:本申请所提出的网络结构。
[0125] 由于实验A和B不是特定的针对多源域的网络结构,所以本申请采用的是将两个源域合并为一个源域,再与目标域进行对齐的方式。
[0126] 实验结果分析
[0127] 从表5中可以看出,MIX‑MUDA(本申请)在大部分的迁移故障诊断实验中取得了最好的结果。江南大学数据集的平均准确率为98.6%,相比于其他网络准确率要高。西储大学数据集中任务CA、CB、CC更是达到了100%的准确率。在PU数据集上,所有实验结果表现一般,这是因为PU数据集工况是按照系统转速、负载扭矩和轴承径向力作为参数划分工况,而PB的准确率相对于PA、PC的准确率较低,说明转速不同导致了数据分布较大差异,对振动信号影响较大,当数据分布越大时,知识迁移越困难,从而影响了MIX‑MUDA的诊断性能,但是明显可以看出,单源域故障诊断的方法,只能在部分数据集上表现良好,在PU数据表现效果很差,表明将单源域简单合并为多源的方法,并不具有泛化性。相反,可能会因为冗余信息增加负迁移的可能,本文所提方法优于单源域合并的A、B算法,表明MIX‑MUD故障诊断的鲁棒性,以及扩充数据成本进行故障诊断的必要性。
[0128] 表5多源域迁移跨工况故障诊断实验结果
[0129]
[0130]
[0131] 引入混淆矩阵和特征可视化(T‑SNE)来对JB、CA、PF的结果进行进一步分析。混淆矩阵(图5a‑图5c所示)可以直接的看到样本的分类情况,JB(图5a)中,内圈故障被误分类8个,健康状态均被正确分类,外圈故障错分类4个和滚动体错分类9个;CA(图5b)中,所有的故障状态和健康状态均被正确分类;PF(图5c)中被错误分类相对较多。图6a‑图6c是对测试后的目标域数据进行的降维可视化,CA(图6b)每一个类别都能很好的聚集在一起,JB(图6a)和PF(图6c)的大部分样本也能很好的聚类在一起,只有少量样本被错误分类,而与其他类别样本聚集在一起。
[0132] 为了证明本申请所采用的领域适应方法具有较强的迁移诊断性能,将其与目前使用较为广泛的MMD、MK‑MMD和CORAL等度量域差异方法进行对比分析,所有实验采用的网络结构均为本申请所提出的MIX‑MUDA,采用的实验方法均一致,实验数据采用的是PU数据集,因其数据分布差异大,相比其他实验台数据集更为真实,效果明显,更好的反映对比效果,其结果如表6所示。可以直观感受到本申请所采用方法,在缩小源域和目标域差异上具有较强的能力。单一的MK‑MMD和MMD在本网络上故障诊断准确率很低,侧面也反映出进行更细粒度的类别对齐的必要性。CORAL在PU数据上性能表现也很好,但是从准确的平均值可以看出不如本模型所采用的域适应方法,反映了本方法具有较好的稳定性。
[0133] 表6不同域适应方法实验结果
[0134]
[0135]
[0136] 为进一步体现多源域故障诊断的优越性,将两个源域和三个源域在PU数据集进行对比实验,目标域采用相同的数据集,实验任务如表7所示,实验结果如表8所示,两个源域和三个源域均表现出很好的诊断效果,表明采用多源域进行故障诊断的可行性,同时也说明了使用本网络进行故障诊断的优越性。三源域和两个源域的正确率差别不大,网络相比于两个源域更为复杂,综上,本申请采用两个源域来进行的综合实验,说明MIX‑MUDA可以通过探索不同源域的互补信息,增强故障诊断的能力。
[0137] 表7不同数量的源域实验任务
[0138]
[0139] 表8不同数量的源域实验结果
[0140]
[0141]
[0142] 综上实验结果表明:
[0143] 本申请采用混合卷积能够充分发挥多源域的作用,提取丰富的特征信息,增强了MIX‑MUDA网络的特征学习能力;改进的域适应方法,采用最大均方值差异和局部最大均值差异结合的方式,同时达到缩小域间差异和类内差异的目标,增强了MIX‑MUDA的领域对齐性能,解决了源域和目标域之间因分布差异而导致故障诊断准确率较低的问题。进行多源域轴承故障诊断时,能有效识别轴承的健康状态,使模型具有较强的泛化性。