一种用于剩余使用寿命预测退化数据的扩增方法转让专利

申请号 : CN202110117688.1

文献号 : CN112464578B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吕燚蒋艺杰

申请人 : 电子科技大学中山学院

摘要 :

本发明公开了一种用于剩余使用寿命预测退化数据的扩增方法,首先将采集到的设备退化数据送入设计好的数据预处理策略进行处理,随后将处理之后的数据送入设计好的循环一致性对抗生成网络,训练其生成器网络作为数据的扩增网络,最后得到扩增数据,本发明实现了对退化数据的扩增,增加退化数据规模,以此达到提升RUL预测网络的预测效果。

权利要求 :

1.一种用于剩余使用寿命预测退化数据的扩增方法,其特征在于,包括以下步骤:采集退化数据:给定已有多传感器退化数据{X}s×n,该退化数据{X}s×n以矩阵形式表示,其中s代表反映退化状态的传感器数量,n是退化数据的长度;

退化数据预处理:首先通过数理统计及经验分析获得某类设备快速退化阶段的初始值m,则退化数据为 并指定扩增网络输入数据的长度n′,对于所采集退化数据长度大于n′的部分予以裁切,对于所采集退化数据长度小于n′的部分予以填充,以保证输入扩增网络的数据尺度一致;

扩增网络:扩增网络以CycleGAN为框架,训练CycleGAN中的生成器作为数据扩增的扩增网络,将输入数据随机分为数量相等的两部分A和B,A属于领域X,B属于领域Y,A和B作为CycleGAN的输入,其中A通过生成器GX→Y得到生成数据 B通过生成器GY→X得到生成数据将得到的生成数据 送入生成器GY→X得到生成数据 将得到的生成数据 送入生成器GX→Y得到生成数据 鉴别器DX负责对原始数据A和生成数据 进行判断,鉴别器DY负责对原始数据B和生成数据 进行判断,鉴别器DX和DY的判断结果决定生成器下一轮的生成方向;

获得扩增数据:将原始数据送入扩增网络进行数据扩增,获得扩增数据。

2.根据权利要求1所述的一种用于剩余使用寿命预测退化数据的扩增方法,其特征在于:

如果采集到的退化数据的长度大于n′,直接删除超过的部分,得到退化数据X′如下:处理好之后的数据大小为s×n′,上式中n′=n‑l,超出部分将从开始阶段被移除掉;

如果采集到的退化数据的长度小于n′,则需要对该数据进行填充,填充数据的长度记为lp,计算该长度下同一个传感器数值的平均值,作为填充数据,对于传感器值xs的替代值x′s可以表示如下: 其中γ是高斯噪声,其值范围固定在是传感器数据在lp范围内最小值, 是传感器数据在lp范围内最大值,处理过后的数据如下所示: 其中,n′=n+lp。

3.根据权利要求1所述的一种用于剩余使用寿命预测退化数据的扩增方法,其特征在于:

所述CycleGAN的价值函数如下所示,定义GX→Y为G,GY→X为F:其中,x是属于领域X的训练样本,y是属于领域Y的训练样本,DX是用于鉴别样本是否属于领域X的鉴别器,DY是用于鉴别样本是否属于领域Y的鉴别器,DY(y)是判断样本y是否真实的概率,DX(x)是判断样本x是否真实的概率,DY(G(x))是判断G生成的样本是否真实的概率,表示从由样本y组成的数据集中依次取出样本y进行运算,取所有样本运算结果的平均值作为返回值, 表示从由样本x组成的数据集中依次取出样本x进行运算,取所有样本运算结果的平均值作为返回值,DX(F(y))是判断F生成的样本是否真实的概率, 表示关于生成器G、鉴别器DY、样本X和Y的价值函数,表示关于生成器F、鉴别器DX、样本X和Y的价值函数;G生成的样本应该与真实样本接近,对于 而言是求min(G),鉴别器DY的能力应该越强越好,所以DY(G(x))的概率应尽可能大,则对于 而言是求max(DY),同理,F生成的样本应该与真实样本接近,对于 而言是求min(F),鉴别器DX的能力越强越好,所以DX(F(y))的概率应尽可能大,则对于 而言是求max(DX),

组合上述两式得到循环一致性损失函数:F(G(x))表示将样本x送入G之后得到的样本G(x)再次送入F得到的样本F(G(x)),G(F(y))表示将样本y送入F之后得到的样本F(y)再次送入G得到的样本G(F(y)),由两部分组成,第一部分为 它表示将样本x送入G后再送入F后,F的输出样本与样本x的差异,第二部分为 它表示将样本y送入F后再送入G后,G的输出样本与样本y的差异,将上述公式组合可以得到CycleGAN的总的价值函数:其中生成器网络的损失函数如下所示:其中J(G)是生成器的损失函数,num表示样本的数量,yi 表示第i个原始样本, 表示第i个生成样本,

根据损失函数训练网络模型,当训练多次直至损失函数值趋于稳定时完成网络的训练。

说明书 :

一种用于剩余使用寿命预测退化数据的扩增方法

技术领域

[0001] 本发明涉及机器退化预测处理技术领域,特别是一种用于剩余使用寿命预测退化数据的扩增方法。

背景技术

[0002] 随着技术的发展和生成工艺的进步,当前各类工业产品和装置设备的自动化程度和复杂程度日益提升,由于关键零部件的磨损,不可预知的外部冲击,腐蚀等原因,设备的
性能将不可避免的产生退化,进而失效,突然的失效会造成严重的经济损失和人员伤亡。如
果能在设备退化初期就对设备的寿命进行预测和评估,并且在此基础上确定设备检测和维
修的最佳时机,制定相关的备件管理和维护方案,就能有效的提升整个相关系统的可靠性,
降低设备的运行风险和运行成本。这种对设备剩余可使用时间的预测方法被称为剩余使用
寿命(Remaining Useful Life,RUL)预测。
[0003] 实现RUL预测的主要思想在于根据设备的失效机理,采集到的失效数据等构建RUL预测模型,实现实时或离线的剩余寿命预测。在大多数的RUL预测任务中,由于目标设备的
性能退化速度慢使得采集退化数据耗时长,导致可以获取到目标设备的退化数据集普遍规
模较小,小规模数据在一定程度上无法反映出设备整体退化过程的数据分布,基于这个前
提,在对设备退化过程进行建模时,由于无法得知退化过程的完整数据分布,导致数据退化
模型存在偏差,进而影响剩余寿命的预测性能。

发明内容

[0004] 针对现有技术中存在的问题,本发明的目的在于提供本发明提出一种基于循环一致性生成对抗网络(Cycle‑consistent Generative Adversarial Network,CycleGAN)的
退化数据扩增技术,该技术针对那些退化数据匮乏的RUL预测任务,通过深度学习技术对原
始退化数据进行扩增,在不损失退化信息的情况下增加退化数据集的规模,丰富退化数据
的样本空间,提升使用数据驱动建模的RUL预测网络的预测性能。
[0005] 为解决上述问题,本发明采用如下的技术方案。
[0006] 一种用于剩余使用寿命预测退化数据的扩增方法,包括以下步骤:
[0007] 采集退化数据:给定已有多传感器退化数据{X}s×n,该退化数据{X}s×n以矩阵形式表示,其中s代表反映退化状态的传感器数量,n是退化数据的
长度;
[0008] 退化数据预处理:首先通过数理统计及经验分析获得某类设备快速退化阶段的初始值m,则退化数据为 并指定扩增网络输入数据的
长度n′,对于所采集退化数据大于n′的部分予以裁切,对于所采集退化数据小于n′的部分
予以填充,以保证输入扩增网络的数据尺度一致;
[0009] 扩增网络:扩增网络以CycleGAN为框架,训练CycleGAN中的生成器作为数据扩增的扩增网络,将输入数据随机分为数量相等的两部分A和B,A属于领域X,B属于领域Y,A和B
作为CycleGAN的输入,其中A通过生成器GX→Y得到生成数据 B通过生成器GY→X得到生成数
据 将得到的生成数据 送入生成器GY→X得到生成数据 将得到的生成数据 送入
生成器GX→Y得到生成数据 鉴别器DX负责对原始数据A和生成数据 进行判断,鉴
别器DY负责对原始数据B和生成数据 进行判断,鉴别器DX和DY的判断结果决定生成
器下一轮的生成方向;
[0010] 获得扩增数据:将原始数据送入扩增网络进行数据扩增,获得扩增数据。
[0011] 作为本发明的进一步改进,如果采集到的退化数据的长度大于n′,直接删除超过的部分,得到退化数据X′如下: 处理好之后
的数据大小为s×n′,上式中n′=n‑l,超出部分将从开始阶段被移除掉;
[0012] 如果采集到的退化数据的长度小于n′,则需要对该数据进行填充,填充数据的长度记为lp,计算该长度下同一个传感器数值的平均值,作为填充数据,对于传感器值xs的替
代值x′s可以表示如下: 其中γ是高斯噪声,其值范围固定在
是传感器数据在lp范围内最小值, 是传感器数据在lp范围内
最大值,处理过后的数据如下所示: 其中,n′=n+
lp。
[0013] 作为本发明的进一步改进,所述CycleGAN的价值函数如下所示,定义GX→Y为G,GY→X为F:
[0014]
[0015]
[0016] 组合上述两式得到循环一致性损失函数:
[0017]
[0018] 将上述公式组合可以得到CycleGAN的总的价值函数:
[0019]
[0020] 其中生成器网络的损失函数如下所示:
[0021]
[0022] 其中J(G)是生成器的损失函数,num表示样本的数量,yi表示第i个原始样本, 表示第i个生成样本。
[0023] 根据损失函数训练网络模型,当训练多次直至损失函数值趋于稳定时完成网络的训练。
[0024] 本发明的有益效果
[0025] 相比于现有技术,本发明的优点在于:
[0026] 在某些剩余使用寿命预测的任务,由于时间成本和经济成本的原因导致退化数据的稀少,直接使用数据驱动的方法进行RUL预测网络建模,可能效果不理想,本发明在此基
础上实现了对退化数据的扩增,增加退化数据规模,以此达到提升RUL预测网络的预测效
果。

附图说明

[0027] 图1为本发明的流程示意图。
[0028] 图2为本发明CycleGAN网络的结构示意图。
[0029] 图3为本发明生成器网络的结构示意图。

具体实施方式

[0030] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
[0031] 1、介绍已有退化数据
[0032] 给定已有多传感器退化数据{X}s×n,如公式1所示:
[0033]
[0034] 该退化数据以矩阵形式表示,其中s代表了可以反映退化状态的传感器数量,n是退化数据的长度,一般以时间为尺度来表征设备的寿命。
[0035] 2、介绍数据预处理策略
[0036] 首先通过数理统计及经验分析获得某类设备快速退化阶段的初始值m,则退化数据如下所示:
[0037]
[0038] 并指定扩增网络输入数据的长度n′,对于所采集退化数据大于n′的部分应该予以裁切,对于所采集退化数据小于n′的部分应该予以填充,以保证输入扩增网络的数据尺度
一致,对于两种处理方法具体如下:
[0039] 1)如果采集到的退化数据的长度大于n′,直接删除超过的部分,得到退化数据X′如下:
[0040]
[0041] 处理好之后的数据大小为s×n′,上式中n′=n‑l,超出部分将从开始阶段被移除掉。
[0042] 2)如果采集到的退化数据的长度小于n′,则需要对该数据进行填充,填充数据的长度记为lp,计算该长度下同一个传感器数值的平均值,作为填充数据。对于传感器值xs的
替代值x′s可以表示如下。
[0043]
[0044] 其中γ是高斯噪声,其值范围固定在 是传感器数据在lp范围内最小值, 是传感器数据在lp范围内最大值。处理过后的数据如下所示:
[0045]
[0046] 其中,n′=n+lp。
[0047] 3、扩增网络部分
[0048] 扩增网络以CycleGAN为框架,训练CycleGAN中的生成器作为数据扩增的扩增网络,将输入数据随机分为数量相等的两部分A和B,A属于领域X,B属于领域Y,A和B作为
CycleGAN的输入,其中A通过生成器GX→Y得到生成数据 B通过生成器GY→X得到生成数据
将得到的生成数据 送入生成器GY→X得到生成数据 将得到的生成数据 送入生
成器GX→Y得到生成数据 鉴别器DX负责对原始数据A和生成数据 进行判断,鉴别
器DY负责对原始数据B和生成数据 进行判断,鉴别器DX和DY的判断结果决定生成器
下一轮的生成方向。
[0049] 其中生成器网络使用的是长短期记忆网络(Long Short‑Time Memory Network,LSTM),假设任务给定的输入数据维度为n×s,其中n代表了输入数据的长度,s代表了输入
数据所具有的传感器的数量,timestep ts被设置为nts,其中nts>s,在训练阶段,输入数据
的第一行1×s首先被送入生成器,所有输入数据都发送到生成器之后,从每个时间步获得
的值组成了大小为1×nts的输出,所有的输出数据被组合成一个大小为n×nts的矩阵,加入
一个dense操作,最终得到与输入数据大小一致的输出数据,满足了任务的设计需求。
[0050] CycleGAN的价值函数如下所示,为了简化公式,我们定义GX→Y为G,GY→X为F:
[0051]
[0052]
[0053] 组合6、7式得到循环一致性损失函数8。
[0054]
[0055] 将上述公式组合可以得到CycleGAN的总的价值函数。
[0056]
[0057] 其中生成器网络的损失函数如下所示:
[0058]
[0059] 其中J(G)是生成器的损失函数,num表示样本的数量,yi表示第i个原始样本, 表示第i个生成样本。
[0060] 根据损失函数训练网络模型,当训练多次直至损失函数值趋于稳定时完成网络的训练。
[0061] 4、获得扩增数据
[0062] 将原始数据送入扩增网络进行数据扩增,获得的扩增数据将于原始数据一起,作为训练数据,参与到下一步的基于数据驱动的RUL预测模型建模过程中去。
[0063] 以上所述,仅为本发明较佳的具体实施方式;但本发明的保护范围并不局限于此。任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其
改进构思加以等同替换或改变,都应涵盖在本发明的保护范围内。