基于深度迁移学习的飞行器状态监测方法转让专利

申请号 : CN202010896327.7

文献号 : CN114104328B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 曹佳薇高宏力陈涛全栋梁张宇鹏段安东哲郭亮

申请人 : 中国航天科工飞航技术研究院(中国航天海鹰机电技术研究院)西南交通大学

摘要 :

本发明提供一种基于深度迁移学习的飞行器状态监测方法,涉及飞行器状态监测方法领域,包括如下步骤:通过飞行器的仿真模型实验试获取包含故障信息的标签数据;采集仿真模型试验的实验数据和飞行器的实际数据;对实验数据和实际数据进行预处理;建立深度迁移诊断模型;优化所述深度迁移诊断模型;通过诊断模型对飞行器状态进行监测。本发明旨在将利用实验室带标签数据训练的深度迁移诊断模型用于飞行器的状态识别,提高状态识别精度,从而增加飞行器的安全性。

权利要求 :

1.一种基于深度迁移学习的飞行器状态监测方法,其特征在于,包括如下步骤:获取带标记的源域样本和不带标记的目标域样本,所述源域样本为仿真实验监测数据,所述目标域样本为实际数据;

所述获取带标记的源域样本和不带标记的目标域样本的具体步骤包括:S1:通过飞行器的仿真模型实验试获取包含故障信息的标签数据;

S2:采集仿真模型试验的实验数据和飞行器的实际数据;

S3:对实验数据和实际数据进行预处理后得到带标记的源域样本和不带标记的目标域样本;

通过源域样本和目标域样本建立并优化深度迁移诊断模型;

通过诊断模型对飞行器状态进行监测;

其中,所述优化深度迁移诊断模型的过程包括:提取源域与目标域中的迁移故障特征,对于源域数据完成CNN模型的完整训练;

计算源域与目标域迁移故障特征的MMD经验估计值;

根据源域训练的CNN模型,输入目标域数据,预测健康状态标记的概率分布;生成目标域样本的伪标记;

同时输入源域与目标域的带标记迁移故障特征,采用随机梯度下降优化算法训练模型;

所述深度迁移诊断模型包括1个输入层、6个卷积层、6个池化层、2个全连接层和1个输出层,其中,前15层用于特征提取,最后一层输出层用于健康状态分类、输入层输入源域与目标域数据;

深度迁移诊断模型的具体建立步骤为:

S41:输入层输入长度为L的振动信号,卷积层中,卷积核与输入数据一起卷积以学习特m征,在核kc∈R与第i个输入样本的第j个分段信号 之间取点积以获得卷积特征:m k

其中,R 为矩阵域,kc为卷积核,bc为对应的偏置,n 为卷积核的数量,Relu为激励函数,cj为卷积层的第j个输出点,输入样本为源域样本或目标域样本;

S42:每个卷积层后都连接着一个池化层,通过池化操作减少卷积特征的维数,使用最大池化函数,返回某一子区域的最大值如下:pj=max{cj×a:(j+1)×a}    (2)其中,a是池化长度,pj是池化层的第j个输出点,对于cj和cj+1的池化位移为a,池化窗口大小为a,max{cj×a:(j+1)×a}表示在这个窗口a范围内寻找最大值代表这个范围的数据;

S43:经过6次卷积核池化操作后,第一个全连接层将第6个池化层输出的特征平坦化,使其平铺为一维矢量;然后,输入到第二个全连接层中输出如下:其中, 是连接两个全连接层的权重矩阵, 为第一个全连接层的输出, 是相应的偏置矢量, 为第二个全连接层的输出;

S44:基于第二个全连接层的输出 在输出层FO中通过softmax函数预测样本在标记空间的概率分布,则第i个数据样本属于第q个健康状态的概率为:其中k表示健康状态类别, 为输出层的待训练参数集,分别为相应的权重值及偏置, 为第q个健康状态的权重值, 为第q个健康状态的偏置;

所述深度迁移诊断模型的优化过程具体为:

S51:执行步骤S41‑S42提取源域和目标域的迁移故障特征,对于源域数据继续执行步骤S44完成深度迁移诊断模型;

S52:计算源域目标域迁移故障特征的MMD经验估计值;

源域和目标域迁移故障特征滞留在第二个全连接层的输出中,输出特征集合设为和 则存在再生核希尔伯特空间H(RKHS),有映射函数Φ(.)∈H将迁移故障特征从原特征空间投影至RKHS;源域与目标域迁移故障特征之间的MMD定义为:其中 为第i个样本源域数据在经过第二个全连接层后的特征输出,同理 为目标域数据第i个样本在经过第二个全连接层后的特征输出,E(.)为求平均数,sup{.}为集合的上确界;

使用多项式核构造RKHS,多项式核函数如下:T

其中,a,b,c为多项式多项式核参数,是随机值;() 表示转置;

则MMD的经验估计值表达为:

其中,ns是源域样本数,nt为目标域样本数;

所以在分布适配部分存在下述优化目标:

其中, 为卷积层、池化层以及第二个全连接层的待训练参数;

S53:根据S51中得到的深度迁移诊断模型,输入目标域数据,预测健康状态标记的概率分布,生成带伪标记的目标域迁移故障特征;具体如下:由公式(4)可知目标域样本 的预测标记的概率分布为并由此式生成目标域样本的伪标记

其中, 为目标域样本在使用源域数据训练的CNN上的输出值, 即为目标域样本的二值化伪标记;

S54:伪标记学习的优化目标函数构建如下:其中, 为CNN的待训练参数,其中,Γ(,)为交叉熵代价函数,α为标记正则项的权重因子;

结合公式(8)和公式(11),构建如下用于深度迁移模型训练的目标函数:式中,λ为分布适配优化部分的权重因子;

同时输入源域与目标域的带标记迁移故障特征,计算公式(12),采用随机梯度下降优化算法训练模型,直到公式(12)的计算值小于预定阈值ε。

2.根据权利要求1所述的一种基于深度迁移学习的飞行器状态监测方法,其特征在于,所述S2包括:S21:数据获取;

S22:数据传输;

S23:数据存储;

采集的数据类型包括飞行器振动数据、飞行器温度数据、飞行器应力应变数据。

3.根据权利要求2所述的一种基于深度迁移学习的飞行器状态监测方法,其特征在于,所述S3的预处理包括缺失数据处理、异常数据处理以及噪声数据处理。

说明书 :

基于深度迁移学习的飞行器状态监测方法

技术领域

[0001] 本发明涉及飞行器状态监测方法领域,具体涉及一种基于深度迁移学习的飞行器状态监测方法。

背景技术

[0002] 飞行器是一类价值和维护成本都很高的复杂机械系统,其故障的发生往往导致严重的经济损失和恶劣的社会影响,其日常的定时维修也耗资巨大,因此对其进行状态监测以进行视情维修势在必行。人工检修机床主要运用传统的无损检测方法,该方法不仅价格昂贵,而且耗时耗力,对于隐蔽性损伤检测效果差且对于早期故障及剩余寿命没有预测功能;而现有的飞行器状态监测系统在采集到飞行器关键部位的原始信号后,先对数据进行处理与分析,再进行特征的提取与选择,最后进行模型的训练。在现有的飞行器监测系统中,由于特征是人工提取的,难以挖掘到深层的故障表征信息,导致状态识别的精度较低。
[0003] 另外,飞行器还存在可用监测信息缺乏,损伤模式复杂的问题。因此,本发明提供一种基于深度迁移学习的飞行器状态监测方法。

发明内容

[0004] 本发明的目的在于:针对现有飞行器状态监测系统无法自动提取深层特征导致的故障诊断精度不高的问题,以及飞行器本身存在的可用监测信息不多、损伤模式复杂的问题,本发明提出一种新的飞行器状态监测方法。
[0005] 本发明的技术方案如下:
[0006] 一种基于深度迁移学习的飞行器状态监测方法,包括如下步骤:
[0007] 获取带标记的源域样本和不带标记的目标域样本,所述源域样本为仿真实验监测数据,所述目标域样本为实际数据;
[0008] 通过源域样本和目标域样本建立并优化深度迁移诊断模型;
[0009] 通过诊断模型对飞行器状态进行监测;
[0010] 其中,所述优化深度迁移诊断模型的过程包括:
[0011] 提取源域与目标域中的迁移故障特征,对于源域数据完成CNN模型的完整训练;
[0012] 计算源域与目标域迁移故障特征的MMD经验估计值;
[0013] 根据源域训练的CNN模型,输入目标域数据,预测健康状态标记的概率分布;生成目标域样本的伪标记;
[0014] 同时输入源域与目标域的带标记迁移故障特征,采用随机梯度下降优化算法训练模型。
[0015] 具体地所述建立深度迁移诊断模型具体为:
[0016] 所述深度诊断模型包括1个输入层、6个卷积层、6个池化层、2个全连接层和1个输出层,其中,前15层用于特征提取,最后一层输出层用于健康状态分类、输入层输入源域与目标域数据。
[0017] 进一步地,所述建立深度迁移诊断模型更进一步的具体步骤为:
[0018] S41:输入层输入长度为L的振动信号,卷积层中,卷积核与输入数据一起卷积以学m习特征,在核kc∈R与第i个输入样本的第j个分段信号 之间取点积以获得卷积特征:
[0019]
[0020] 其中,Rm为矩阵域,kc为卷积核,bc为对应的偏置,nk为卷积核的数量,Relu为激励函数,cj为卷积层的第j个输出点,输入样本为源域样本或目标域样本;
[0021] S42:每个卷积层后都连接着一个池化层,通过池化操作减少卷积特征的维数,使用最大池化函数,返回某一子区域的最大值如下:
[0022] pj=max{cj×a:(j+1)×a}  (2)
[0023] 其中,a是池化长度,pj是池化层的第j个输出点,对于cj和cj+1的池化位移为a,池化窗口大小为a,max{cj×a:(j+1)×a}表示在这个窗口a范围内寻找最大值代表这个范围的数据;
[0024] S43:经过6次卷积核池化操作后,第一个全连接层将第6个池化层输出的特征平坦化,使其平铺为一维矢量;然后,输入到第二个全连接层中输出如下:
[0025]
[0026] 其中, 是连接两个全连接层的权重矩阵, 为第一个全连接层的输出, 是相应的偏置矢量, 为第二个全连接层的输出;
[0027] S44:基于第二个全连接层的输出 在输出层FO中通过softmax函数预测样本在标记空间的概率分布,则第i个数据样本属于第q个健康状态的概率为:
[0028]
[0029] 其中k表示健康状态类别, 为输出层的待训练参数集,分别为相应的权重值及偏置, 为第q个健康状态的权重值, 为第q个健康状态的偏置。
[0030] 进一步地,所述优化深度迁移诊断模型的过程更具体为:
[0031] S51:执行步骤S41‑S42提取源域和目标域的迁移故障特征,对于源域数据继续执行S44完成深度迁移诊断模型;
[0032] S52:计算源域目标域迁移故障特征的MMD经验估计值;
[0033] 源域和目标域数据经过CNN训练后,其迁移故障特征滞留在第二个全连接层的输出中,该输出特征集合设为 和 则存在再生核希尔伯特空间H(RKHS),有映射函数Φ(.)∈H将迁移故障特征从原特征空间投影至RKHS;源域与目标域迁移故障特征之间的MMD定义为:
[0034]
[0035] 其中 为第i个样本源域数据在经过第二个全连接层后的特征输出,同理 为目标域数据第i个样本在经过第二个全连接层后的特征输出,E(.)为求平均数,sup{.}为集合的上确界;
[0036] 本发明使用多项式核构造RKHS,多项式核函数如下:
[0037]
[0038] 其中,a,b,c为多项式多项式核参数,是随机值;( )T表示转置;
[0039] 则MMD的经验估计可表达为:
[0040]
[0041] 其中,ns是源域样本数,nt为目标域样本数;
[0042] 所以在分布适配部分存在下述优化目标:
[0043]
[0044] 式中, 为卷积层、池化层以及第二个全连接层的待训练参数;
[0045] S53:根据S51中得到的深度迁移诊断模型,输入目标域数据,预测健康状态标记的概率分布,生成带伪标记的目标域迁移故障特征;具体如下:
[0046] 由公式(4)可知目标域样本 的预测标记的概率分布为
[0047]
[0048] 并由此式生成目标域样本的伪标记
[0049]
[0050] 其中, 为目标域样本在使用源域数据训练的CNN上的输出值, 即为目标域样本的二值化伪标记;
[0051] S54:伪标记学习存在下述优化问题:
[0052]
[0053] 其中, 为CNN的待训练参数,其中,Γ(,)为代价函数,本文使用交叉熵代价函数,α为标记正则项的权重因子;
[0054] 结合公式(8)和公式(11),构建如下用于深度迁移模型训练的目标函数:
[0055]
[0056] 式中,λ为分布适配优化部分的权重因子;
[0057] 同时输入源域与目标域的带标记迁移故障特征,计算公式(12),采用随机梯度下降优化算法训练模型,直到公式(12)的计算值小于预定阈值ε。
[0058] 具体地,所述获取带标记的源域样本和不带标记的目标域样本的具体步骤包括:
[0059] S1:通过飞行器的仿真模型实验试获取包含故障信息的标签数据;
[0060] S2:采集仿真模型试验的实验数据和飞行器的实际数据;
[0061] S3:对实验数据和实际数据进行预处理后得到带标记的源域样本和不带标记的目标域样本。
[0062] 具体地,所述S2包括:
[0063] S21:数据获取;
[0064] S22:数据传输;
[0065] S23:数据存储;
[0066] 采集的数据类型包括但不限于飞行器振动数据、飞行器温度数据、飞行器应力应变数据。
[0067] 具体地,所述S3的预处理包括但不限于缺失数据处理、异常数据处理以及噪声数据处理。
[0068] 采用上述方案后,本发明的有益效果如下:
[0069] 本发明将利用实验室带标签数据训练的深度迁移诊断模型运用到飞行器上,克服了飞行器可用监测信息不多、损伤模式复杂的问题,解决了当前飞行器状态监测系统人工提取故障特征困难、模型精度较低的问题,大大提高了飞行器状态监测的精度,保证了飞行器运行的安全性。具有重要的现实意义和应用价值。

附图说明

[0070] 图1为本发明的流程示意图。

具体实施方式

[0071] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0072] 因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0073] 本发明的一种基于深度迁移学习的飞行器状态监测方法,包括如下步骤:
[0074] S1:通过飞行器的仿真模型实验试获取包含故障信息的标签数据;仿真模型实验是通过对飞行器的仿真模型进行模拟加载直到发生故障以获得相应带标签有效数据的过程,所述飞行器的仿真模型为实际飞行器的缩小版或易发生故障的飞行器的某一部分,如机翼。为了更快得到故障数据,可以通过增大加载力的方式来进行加速退化实验,直到获得所需的包含故障信息的带标签数据。
[0075] S2:采集仿真模型试验的实验数据和飞行器的实际数据;所述S2包括数据获取、数据传输和数据存储;
[0076] 采集的数据类型包括但不限于飞行器振动数据、飞行器温度数据、飞行器应力应变数据。为了使两个数据域更为接近,两者采用相同的数据采集方法。采集的数据类型包括但不限于是振动数据、温度、应力应变。对于应力应变的获取使用压电传感器,包括粘贴在结构表面的PZT压电陶瓷和埋入式的光纤传感器;对于温度的获取通常也使用埋入式的光纤传感器;对于振动数据的获取则采用加速度传感器。数据传输使用的是电荷放大器,对采集到的信号进行调整放大以得到所需的线性电压信号。数据存储设备由抗混滤波器、主板、模拟板通道、电源板、存储器及相应的接口板组成,将传输过来的信号通过A/D转换后以数字量的形式存储在FLASH电子盘中。
[0077] S3:对实验数据和实际数据进行预处理;预处理包括但不限于缺失数据处理、异常数据处理以及噪声数据处理。数据预处理是对采集到的数据进行预先处理使其能更好的运用到后续的分析中,以振动信号为例,由于原始的振动信号是一条很长的一维数据,因此采用滑动窗口进行采样,从而获得更多的有效样本作为模型的最终输入。预处理后得到源域和目标域样本集,实验室获得的振动信号经过预处理后构成源域样本集 其中,is=1表示第一个样本,共含有n个样本, 为源域数据样本, 为源域数据样本的健康状态标签,Y={1,2,......,K}为标记空间,共有k种健康状态,源域数据生成服从边缘概率分布P;同理实际飞行器采集到的振动信号经过预处理后构成目标域样本集 为目标t
域数据样本,共含有n个样本,目标域数据分布服从边缘概率分布Q,显然P≠Q。
[0078] S4:建立深度迁移诊断模型。所述深度诊断模型包括1个输入层、6个卷积层、6个池化层、2个全连接层和1个输出层,其中,前15层用于特征提取,最后一层输出层用于健康状态分类、输入层输入源域与目标域数据;ResNet通过堆叠多级残差单元,提取池化后特征的深层抽象表达,全连接层将提取的迁移故障特征映射至样本的标记空间,输出层使用Softmax函数预测输入样本在标记空间的概率分布,从而得到每个监测数据样本处于各种健康状态的概率。进一步地,具体构建过程如下:
[0079] S41:输入层输入长度为L的振动信号,卷积层中,卷积核与输入数据一起卷积以学m习特征,在核kc∈R与第i个输入样本的第j个分段信号 之间取点积以获得卷积特征:
[0080]
[0081] 其中,Rm为矩阵域,kc为卷积核,bc为对应的偏置,nk为卷积核的数量,Relu为激励函数,cj为卷积层的第j个输出点,输入样本为源域样本或目标域样本;
[0082] S42:每个卷积层后都连接着一个池化层,通过池化操作减少卷积特征的维数,使用最大池化函数,返回某一子区域的最大值如下:
[0083] pj=max{cj×a:(j+1)×a}   (2)
[0084] 其中,a是池化长度,pj是池化层的第j个输出点,对于cj和cj+1的池化位移为a,池化窗口大小为a,max{cj×a:(j+1)×a}表示在这个窗口a(池子)范围内寻找最大值代表这个范围的数据;
[0085] S43:经过6次卷积核池化操作后,第一个全连接层将第6个池化层输出的特征平坦化,使其平铺为一维矢量;然后,输入到第二个全连接层中输出如下:
[0086]
[0087] 其中, 是连接两个全连接层的权重矩阵, 为第一个全连接层的输出, 是相应的偏置矢量, 为第二个全连接层的输出;
[0088] S44:基于第二个全连接层的输出 在输出层FO中通过softmax函数预测样本在标记空间的概率分布,则第i个数据样本属于第q个健康状态的概率为:
[0089]
[0090] 其中k表示健康状态类别, 为输出层的待训练参数集,分别为相应的权重值及偏置, 为第q个健康状态的权重值, 为第q个健康状态的偏置。
[0091] S5:对S4中得到的深度迁移诊断模型的训练与优化。
[0092] 优化前,需要源域的含标记监测数据 与目标域的未含标记监测数据随机初始化深度迁移诊断模型的待训练参数集θ2以及权重因子α、λ,α为标记正则项的权重因子,λ为分布适配优化部分的权重因子。
[0093] 具体优化包括如下步骤:
[0094] S51:执行步骤S41‑S42(即执行公式(1)‑公式(3))提取源域和目标域的迁移故障特征,对于源域数据继续执行S44(即执行公式(4))完成深度迁移诊断模型;
[0095] S52:计算源域目标域迁移故障特征的MMD经验估计值;MMD为最大均值差异,是衡量两数据集分布差异的非参数距离指标;根据公式(7)计算源域与目标域迁移故障特征的MMD经验估计值;
[0096] 源域和目标域数据经过CNN训练后,其迁移故障特征滞留在第二个全连接层的输出中,该输出特征集合可以设为 和 则存在再生核希尔伯特空间H(RKHS),有映射函数Φ(.)∈H将迁移故障特征从原特征空间投影至RKHS。因此,源域与目标域迁移故障特征之间的MMD可以定义为:
[0097]
[0098] 其中 为源域数据在经过第二个全连接层后的特征输出,同理 为目标域数据在经过第二个全连接层后的特征输出,E(.)为求平均数,sup{.}为集合的上确界。
[0099] 本发明使用多项式核构造RKHS,多项式核函数如下:
[0100]
[0101] 其中,a,b,c为多项式多项式核参数,是随机值;( )T表示转置;
[0102] 则MMD的经验估计可表达为:
[0103]
[0104] 其中,ns是源域样本数,nt为目标域样本数;
[0105] 所以在分布适配部分存在下述优化目标:
[0106]
[0107] 式中, 为卷积层、池化层以及第二个全连接层的待训练参数。
[0108] S53:根据S51中得到的深度迁移诊断模型,输入目标域数据,通过公式(4)预测健康状态标记的概率分布,并由此概率分布结合公式(10)生成带伪标记的目标域迁移故障特征;由于目标域的数据没有健康状态标记信息,无法训练CNN的输出层待训练参数集 因此使用伪标记学习法,借助源域样本训练所得的CNN预测目标域样本的健康状态标记信息,使目标域样本也能用于监督训练CNN,从而实现源域与目标域的迁移故障特征向同一标记空间预测。具体如下:
[0109] 由公式(4)可知目标域样本 的预测标记的概率分布为
[0110]
[0111] 并由此式生成目标域样本的伪标记
[0112]
[0113] 其中, 为目标域样本在CNN(使用源域数据训练)上的输出值, 即为目标域样本的二值化伪标记。
[0114] S54:同时输入带标记的源域迁移故障特征与带伪标记的目标域迁移故障特征,对深度迁移诊断模型进行优化后的深度迁移诊断模型;具体如下:
[0115] 伪标记学习存在下述优化问题:
[0116]
[0117] 其中, 为CNN的待训练参数,其中,Γ(,)为代价函数,本文使用交叉熵代价函数,α为标记正则项的权重因子。
[0118] 结合公式(8)和公式(11),构建如下用于深度迁移模型训练的目标函数:
[0119]
[0120] 式中,λ为分布适配优化部分的权重因子。
[0121] 同时输入源域与目标域的带标记迁移故障特征,计算公式(12),采用随机梯度下降优化算法(SGD)训练模型,只到公式(12)的计算值小于预定阈值ε。
[0122] 从式中,可以看出优化的内容由三部分组成:①最小化源域的预测标记与实际标记之间的误差;②最小化目标域预测标记与伪标记的误差;③最小化源域与目标域的迁移故障特征之间的MMD。
[0123] S6:将原目标域样本输入优化后的深度迁移诊断模型进行飞行器健康状态预测。将原目标域样本输入深度迁移诊断模型,返回输出层的输出结果,概率分布中最大值对应的健康状态标记即为预测的目标域数据代表的飞行器健康状态。
[0124] 本发明中,通过分布适配缩小源域与目标域的数据分布差异,使得CNN从源域和目标域提取出的迁移故障特征的分布更为接近,从而提高深度迁移模型状态识别的准确率。最大均值差异(MMD)是衡量两数据集分布差异的非参数距离指标,而基于多项式核的距离度量方法(PK‑MMD)是目前最优的一种方法,因此边缘概率分布适配就通过最小化源域与目标域迁移故障特征之间的PK‑MMD来实现。伪标记学习借助源域样本训练所得的ResNet,赋予目标域样本预测的健康状态标记,以此实现目标域与源域数据样本同时监督训练ResNet,实现源域与目标域的迁移故障特征映射向同一标记空间,以达到条件概率分布适配。
[0125] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。