一种基于深度学习的医疗器械的故障类别检测方法和系统转让专利

申请号 : CN202310883905.7

文献号 : CN116595444B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴胤王楠朱晓瑾季超王凤奇

申请人 : 北京大学第一医院

摘要 :

本申请属于医疗器械领域,具体涉及一种基于深度学习的医疗器械的故障类别检测方法和系统,其中方法包括:获取医疗器械的振动信号,对振动信号进行预处理;对预处理信号进行插值运算;在插值信号中添加随机扰动,得到第一补充信号;对振动信号进行随机过采样,生成第二补充信号;将第二补充信号和振动信号结合,得到拓展信号;将拓展信号转换为故障图像,将故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;上述方法对插值信号添加随机扰动可以模拟实际振动信号中的噪声和变化,增强数据的抗干扰能力。对第一补充信号进行随机过采样,能够平衡不同类型的医疗器械故障类别的信号数量,从而提升对医疗器械进行故障分类的准确性。

权利要求 :

1.一种基于深度学习的医疗器械故障类别检测方法,其特征在于,包括:获取医疗器械的振动信号,对所述振动信号进行预处理,得到预处理信号;

对所述预处理信号进行插值运算,得到插值信号;

在所述插值信号中添加随机扰动,得到第一补充信号;

对所述振动信号进行随机过采样,生成第二补充信号;

将所述第一补充信号、所述第二补充信号和所述振动信号拼接,得到拓展信号;

将所述拓展信号转换为故障图像,将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,所述多层分类模型通过使用所述拓展信号训练待训练模型得到;所述将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别,包括:将所述故障图像输入所述多层分类模型的卷积层进行特征提取,得到图像特征;

将所述图像特征输入所述多层分类模型的第一双向LSTM层进行时间序列处理,得到第一中间结果;

将所述第一中间结果输入所述多层分类模型的第二双向LSTM层进行时间序列处理,得到第二中间结果;

将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果;

将所述注意力增强结果输入所述多层分类模型的分类器进行分类,得到所述医疗器械故障类别。

2.根据权利要求1所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果,包括:通过以下公式对所述第二中间结果进行注意力增强:;

其中,为第j个未归一化的注意力分数, 为第j个注意力权重,为所述注意力增强结果, 为第一参数矩阵, 为第二参数矩阵,为第三参数矩阵,T表示矩阵转置运算,为查询矩阵,为第j个键矩阵,tanh表示双曲正切函数,softmax表示归一化指数函数,为第j个值矩阵。

3.根据权利要求1所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述对所述振动信号进行预处理,得到预处理信号,包括:对所述振动信号进行归一化,得到归一化信号;

对所述归一化信号进行滤波,得到滤波信号;

对所述滤波信号进行缺失值填充,得到所述预处理信号。

4.根据权利要求1所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述将所述故障图像输入多层分类模型进行故障分类之前,还包括对所述待训练模型进行训练,训练过程包括:根据所述第一补充信号设置最小向量和最大向量;

根据所述最小向量和所述最大向量随机生成目标向量;

获取差分权重,根据所述差分权重和所述目标向量生成扰动向量;

根据交叉判别式将所述目标向量或所述扰动向量设置为试验向量;

检测所述试验向量的适应度是否高于所述目标向量的适应度,若是,则将所述目标向量替换为所述试验向量;

向所述试验向量添加高斯扰动,得到扰动添加向量;

检测当前训练次数是否大于或等于最大训练次数,若否,则根据所述最小向量和所述最大向量随机生成所述目标向量。

5.根据权利要求1所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述对所述振动信号进行随机过采样,生成第二补充信号,包括:在所述振动信号中随机选取一个第一补充数据点,根据过采样比例计算第一阈值;

从所述振动信号中随机复制所述第一阈值个所述振动数据点,得到中间信号;

对所述中间信号进行插值运算,并添加随机扰动,生成所述第二补充信号。

6.根据权利要求1所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述对所述预处理信号进行插值运算,得到插值信号,包括:在所述预处理信号中选取不同的预处理数据点;

根据以下公式使用双线性插值法对不同的所述预处理数据点进行插值运算:;

其中, 为插值系数, 为第i个预处理数据点, 为第j个预处理数据点, 为第k个插值数据点,i<j;

将所有所述预处理数据点和所有所述插值数据点组成所述插值信号。

7.根据权利要求6所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述在所述插值信号中添加随机扰动,得到第一补充信号,包括:通过正态分布随机生成多个随机扰动;其中,所述随机扰动的数量与所述插值数据点的数量相同;

将每个所述插值数据点与对应的所述随机扰动相加,得到所述第一补充信号。

8.根据权利要求1所述的基于深度学习的医疗器械故障类别检测方法,其特征在于,所述将所述拓展信号转换为故障图像,包括:对所述拓展信号进行短时傅里叶变换,得到所述故障图像。

9.一种基于深度学习的医疗器械的故障类别检测系统,其特征在于,包括:预处理模块,用于获取医疗器械的振动信号,对所述振动信号进行预处理,得到预处理信号;

插值运算模块,用于对所述预处理信号进行插值运算,得到插值信号;

随机扰动添加模块,用于在所述插值信号中添加随机扰动,得到第一补充信号;

随机过采样模块,用于对所述振动信号进行随机过采样,生成第二补充信号;

信号结合模块,用于将所述第一补充信号、所述第二补充信号和所述振动信号拼接,得到拓展信号;

故障分类模块,用于将所述拓展信号转换为故障图像,将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,所述多层分类模型通过使用所述拓展信号训练待训练模型得到;

所述故障分类模块包括:

卷积单元,用于将所述故障图像输入所述多层分类模型的卷积层进行特征提取,得到图像特征;

第一时间序列处理单元,用于将所述图像特征输入所述多层分类模型的第一双向LSTM层进行时间序列处理,得到第一中间结果;

第二时间序列处理单元,用于将所述第一中间结果输入所述多层分类模型的第二双向LSTM层进行时间序列处理,得到第二中间结果;

注意力增强单元,用于将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果;

分类单元,用于将所述注意力增强结果输入所述多层分类模型的分类器进行分类,得到所述医疗器械故障类别。

说明书 :

一种基于深度学习的医疗器械的故障类别检测方法和系统

技术领域

[0001] 本申请涉及医疗器械领域,具体涉及一种基于深度学习的医疗器械的故障类别检测方法和系统。

背景技术

[0002] 随着医疗技术的发展,目前医生在疾病诊断过程中,医疗器械的检测结果提供了重要的医学证据,医疗器械故障的出现,是增加医疗事故的主要因素之一,但是,单纯人工检测并不能及时发现故障。为此,已有相关的研发人员研制了GIS振动信号检测装置,通过进行振动检测检测医疗器械的故障。
[0003] 基于振动信号检测医疗器械故障虽然比较便捷,但是医疗器械运行状态中的振动信号往往比较复杂,并包含有一定噪声干扰,影响振动信号的分析处理效果。故而,本申请采用一种基于深度学习的故障类别检测方法,并对采集的信号进行预处理等改进,解决训练数据中样本不平等问题,从而实现故障的精准检测。

发明内容

[0004] 本申请目的在于:提供一种基于深度学习的医疗器械的故障类别检测方法和系统,其能够解决现有的医疗器械故障检测技术存在振动信号的种类不均衡,从而降低判断医疗器械故障类别的准确性的问题。
[0005] 为达到上述目的,本申请提供了一种基于深度学习的医疗器械的故障类别检测方法,包括:
[0006] 获取医疗器械的振动信号,对所述振动信号进行预处理,得到预处理信号;
[0007] 对所述预处理信号进行插值运算,得到插值信号;
[0008] 在所述插值信号中添加随机扰动,得到第一补充信号;
[0009] 对所述振动信号进行随机过采样,生成第二补充信号;
[0010] 将所述第一补充信号、所述第二补充信号和所述振动信号拼接,得到拓展信号;
[0011] 将所述拓展信号转换为故障图像,将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,所述多层分类模型通过使用所述拓展信号训练待训练模型得到。
[0012] 优选地,所述将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别,包括:
[0013] 将所述故障图像输入所述多层分类模型的卷积层进行特征提取,得到图像特征;
[0014] 将所述图像特征输入所述多层分类模型的第一双向LSTM层进行时间序列处理,得到第一中间结果;
[0015] 将所述第一中间结果输入所述多层分类模型的第二双向LSTM层进行时间序列处理,得到第二中间结果;
[0016] 将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果;
[0017] 将所述注意力增强结果输入所述多层分类模型的分类器进行分类,得到所述医疗器械故障类别。
[0018] 优选地,所述将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果,包括:
[0019] 通过以下公式对所述第二中间结果进行注意力增强:
[0020] ;
[0021] ;
[0022] ;
[0023] 其中,为第j个未归一化的注意力分数, 为第j个注意力权重,为所述注意力增强结果, 为第一参数矩阵, 为第二参数矩阵, 为第三参数矩阵,T表示矩阵转置运算,为查询矩阵, 为第j个键矩阵,tanh表示双曲正切函数,softmax表示归一化指数函数,为第j个值矩阵。
[0024] 优选地,所述对所述振动信号进行预处理,得到预处理信号,包括:
[0025] 对所述振动信号进行归一化,得到归一化信号;
[0026] 对所述归一化信号进行滤波,得到滤波信号;
[0027] 对所述滤波信号进行缺失值填充,得到所述预处理信号。
[0028] 优选地,所述将所述故障图像输入多层分类模型进行故障分类之前,还包括对所述待训练模型进行训练,所述训练过程包括:
[0029] 根据所述第一补充信号设置最小向量和最大向量;
[0030] 根据所述最小向量和所述最大向量随机生成目标向量;
[0031] 获取差分权重,根据所述差分权重和所述目标向量生成扰动向量;
[0032] 根据交叉判别式将所述目标向量或所述扰动向量设置为试验向量;
[0033] 检测所述试验向量的适应度是否高于所述目标向量的适应度,若是,则将所述目标向量替换为所述试验向量;
[0034] 向所述试验向量添加高斯扰动,得到扰动添加向量;
[0035] 检测当前训练次数是否大于或等于最大训练次数,若否,则根据所述最小向量和所述最大向量随机生成所述目标向量。
[0036] 优选地,所述对所述振动信号进行随机过采样,生成第二补充信号,包括:
[0037] 在所述振动信号中随机选取一个第一补充数据点,根据过采样比例计算第一阈值;
[0038] 从所述振动信号中随机复制所述第一阈值个所述振动数据点,得到中间信号;
[0039] 对所述中间信号进行插值运算,并添加随机扰动,生成所述第二补充信号。
[0040] 优选地,所述对所述预处理信号进行插值运算,得到插值信号,包括:
[0041] 在所述预处理信号中选取不同的预处理数据点;
[0042] 根据以下公式使用双线性插值法对不同的所述预处理数据点进行插值运算:
[0043] ;
[0044] 其中,为插值系数, 为第i个预处理数据点, 为第j个预处理数据点, 为第k个插值数据点,i<j;
[0045] 将所有所述预处理数据点和所有所述插值数据点组成所述插值信号。
[0046] 优选地,所述在所述插值信号中添加随机扰动,得到第一补充信号,包括:
[0047] 通过正态分布随机生成多个随机扰动;其中,所述随机扰动的数量与所述插值数据点的数量相同;
[0048] 将每个所述插值数据点与对应的所述随机扰动相加,得到所述第一补充信号。
[0049] 优选地,所述将所述拓展信号转换为故障图像,包括:
[0050] 对所述拓展信号进行短时傅里叶变换,得到所述故障图像。
[0051] 本申请提供了一种基于深度学习的医疗器械的故障类别检测系统,包括:
[0052] 预处理模块,用于获取医疗器械的振动信号,对所述振动信号进行预处理,得到预处理信号;
[0053] 插值运算模块,用于对所述预处理信号进行插值运算,得到插值信号;
[0054] 随机扰动添加模块,用于在所述插值信号中添加随机扰动,得到第一补充信号;
[0055] 随机过采样模块,用于对所述振动信号进行随机过采样,生成第二补充信号;
[0056] 信号结合模块,用于将所述第一补充信号、所述第二补充信号和所述振动信号拼接,得到拓展信号;
[0057] 故障分类模块,用于将所述拓展信号转换为故障图像,将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,所述多层分类模型通过使用所述拓展信号训练待训练模型得到。
[0058] 本申请的一种基于深度学习的医疗器械的故障类别检测方法包括获取医疗器械的振动信号,对振动信号进行预处理,得到预处理信号;对预处理信号进行插值运算,得到插值信号;在插值信号中添加随机扰动,得到第一补充信号;对振动信号进行随机过采样,生成第二补充信号;将第二补充信号和振动信号结合,得到拓展信号;将拓展信号转换为故障图像,将故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,多层分类模型通过使用拓展信号训练待训练模型得到。上述方法通过插值运算可以扩充预处理信号中数据点的数量,对插值信号添加随机扰动可以模拟实际振动信号中的噪声和变化,增强数据的抗干扰能力。对第一补充信号进行随机过采样,能够平衡不同类型的医疗器械故障类别的信号数量,从而提升对医疗器械进行故障分类的准确性。

附图说明

[0059] 图1为一实施例的基于深度学习的医疗器械的故障类别检测方法的流程示意图;
[0060] 图2为一实施例的对振动信号进行预处理的流程示意图;
[0061] 图3为一实施例的对振动信号进行随机过采样的流程示意图;
[0062] 图4为一实施例的将故障图像输入多层分类模型进行故障分类的流程示意图;
[0063] 图5为一实施例的对待训练模型进行训练的流程示意图;
[0064] 图6为一实施例的基于深度学习的医疗器械的故障类别检测系统的结构示意框图;
[0065] 图7为一实施例的计算机设备的结构示意框图。
[0066] 本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0067] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0068] 本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“上述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件、模块和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、模块、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一模块和全部组合。
[0069] 本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0070] 在一个实施例中,参照图1,是本申请公开的基于深度学习的医疗器械的故障类别检测方法的流程示意图,包括:
[0071] S1:获取医疗器械的振动信号,对所述振动信号进行预处理,得到预处理信号。
[0072] 通过振动传感器采集医疗器械在运行过程中的振动信号,振动传感器安装在医疗器械的关键部位例如电机和/或轴承等位置来测量振动信号。振动传感器将振动信号转化为电信号,再通过连接到数据采集系统或数据记录仪进行数据的采集和记录。
[0073] 振动信号包含振动幅值、振动频率、振动加速度、振动速度和振动位移。振动幅值表示振动的大小或振动的最大偏移量。通常以毫米(mm)或微米(μm)为单位表示,振动频率表示振动信号的频率,即振动的周期性变化。常用的单位是赫兹(Hz),表示每秒发生的振动周期数。振动加速度表示振动信号的加速度,即单位时间内振动速度的变化率。常用的单位是米每平方秒(m/s²)。振动速度表示振动信号的速度,即振动的变化速率。常用的单位是米每秒(m/s),振动位移表示振动信号的位移量,即振动的偏移量。常用的单位是毫米(mm)或微米(μm)。
[0074] 在一个具体实施例中,对医疗设备振动故障数据进行采集,包括正常数据采集和故障数据采集。采用GIS振动信息检测装置采集医疗器械在运行过程中的振动信号。
[0075] 参照图2,对所述振动信号进行预处理,得到预处理信号,包括以下步骤:
[0076] S12:对所述振动信号进行归一化,得到归一化信号。
[0077] 在步骤S12之前还包括步骤S11:获取医疗器械的振动信号。
[0078] 优选地,对振动信号进行医疗器械故障类别标注,医疗器械故障类别包括轴承磨损、不平衡、不对中和松动。
[0079] 归一化是预处理过程的一个重要步骤,用于消除数据的量级差异,使数据在同一尺度上。本实施例采用的归一化方法是最小‑最大归一化法。具体地,将振动信号表示为X,振动信号包含N个振动数据点,第i个振动数据点表示为Xi,其中,i=1,2,...,N。振动信号中的最小值为a,最大值为b,通过以下公式对振动信号进行归一化:
[0080] ;
[0081] 其中, 表示归一化信号,X为振动信号,a为振动信号的最小值,b为振动信号的最大值。
[0082] S13:对所述归一化信号进行滤波,得到滤波信号。
[0083] 滤波是消除噪声并提取有用信号的过程,具体地,本实施例采用低通滤波器进行滤波操作,对归一化信号进行滤波的公式如下:
[0084] Y =H( sd(Xnorm))
[0085]
[0086] 其中,Y为滤波信号, 为归一化信号,H( )是滤波器函数,sd( )是复频率转换函数,把Xnorm转为复频率,输入到滤波器函数H( )中 为滤波信号,K为低通滤波器的增益系数,T是低通滤波器的时间常数,s为复频率。
[0087] S14:对所述滤波信号进行缺失值填充,得到所述预处理信号。
[0088] 本实施例采用均值填充的方式进行缺失值填充,具体地,滤波信号中所有滤波数据点的平均值为 ,若滤波信号中第i个滤波数据点Yi为缺失值,则 。
[0089] S2:对所述预处理信号进行插值运算,得到插值信号。
[0090] 在所述预处理信号中选取不同的预处理数据点;
[0091] 根据以下公式使用双线性插值法对不同的所述预处理数据点进行插值运算:
[0092] ;
[0093] 其中,为插值系数, 为第i个预处理数据点, 为第j个预处理数据点, 为第k个插值数据点,i<j;
[0094] 将所有所述预处理数据点和所有所述插值数据点组成所述插值信号。
[0095] 插值系数表示位置k相对于i和j的距离,插值系数大于0且小于1。通过对预处理信号使用双线性插值法,可以填补不同预处理数据点之间的空白,得到一个连续的插值信号。
[0096] S3:在所述插值信号中添加随机扰动,得到第一补充信号。
[0097] 通过正态分布随机生成多个随机扰动;其中,所述随机扰动的数量与所述插值数据点的数量相同;
[0098] 将每个所述插值数据点与对应的所述随机扰动相加,得到所述第一补充信号。
[0099] 对于每个插值数据点添加一个随机扰动,以模拟实际应用中振动信号的噪声和变化。每一个随机扰动由均值为0,方差为 的正态分布随机生成。可选地,将方差 设置为0.1。
[0100] 通过以下公式对插值信号添加随机扰动:
[0101] ;
[0102] 其中, 为第k个第一补充数据点, 为第k个插值数据点, 为第k个随机扰动。
[0103] S4:对所述振动信号进行随机过采样,生成第二补充信号。
[0104] 参照图3,步骤S4包括以下步骤S41‑S43:
[0105] S41:在所述振动信号中随机选取一个第一补充数据点,根据过采样比例计算第一阈值。
[0106] 随机选取一个第一补充数据点 ,计算第一阈值的公式如下:
[0107] ;
[0108] 其中, 为第一阈值, 为过采样比例, 为所述振动信号的振动数据点的总数,[]表示向下取整运算或四舍五入取整运算, 表示过采样比例与振动数据点的总数的乘积。
[0109] S42:从所述振动信号中随机复制所述第一阈值个所述振动数据点,得到中间信号。
[0110] 中间信号包含第一阈值个振动数据点。
[0111] S43:对所述中间信号进行插值运算,并添加随机扰动,生成所述第二补充信号。
[0112] 对中间信号进行插值运算与步骤S2相同,此处不再赘述。添加随机扰动与步骤S3相同,此处不再赘述。
[0113] 重复步骤S41‑S43,直到生成的第二补充信号的数量大于或等于第二阈值。第二阈值可以设置为2,也可以设置为5,此处不作限定。
[0114] S5:将所述第一补充信号、所述第二补充信号和所述振动信号拼接,得到拓展信号。
[0115] 可以按随机顺序拼接或固定顺序拼接第一补充信号、第二补充信号和振动信号,作为示例,将第一补充信号拼接在振动信号之后,将第二补充信号拼接在第一补充信号之后。
[0116] S6:将所述拓展信号转换为故障图像,将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,所述多层分类模型通过使用所述拓展信号训练待训练模型得到。
[0117] 对所述拓展信号进行短时傅里叶变换,得到所述故障图像。
[0118] 根据以下公式对拓展信号进行短时傅里叶变换:
[0119]
[0120] 其中,I为故障图像, 是填充了缺失值的数据,是窗函数,表示时间,表示频率,公式中的 表示虚数单位。是一个虚拟变量,用于执行时间上的积分, 表示积分变量,在积分过程中会遍历所有的 ,即所有可能的时间点,来计算时频转换结果。
[0121] 多层分类模型包括卷积层、第一双向LSTM层、第二双向LSTM层、注意力机制层和分类器。故障图像依次经过卷积层、第一双向LSTM层、第二双向LSTM层、注意力机制层和分类器,得到医疗器械故障类别。
[0122] 本申请实施例的一种基于深度学习的医疗器械的故障类别检测方法包括获取医疗器械的振动信号,对振动信号进行预处理,得到预处理信号;对预处理信号进行插值运算,得到插值信号;在插值信号中添加随机扰动,得到第一补充信号;对振动信号进行随机过采样,生成第二补充信号;将第二补充信号和振动信号结合,得到拓展信号;将拓展信号转换为故障图像,将故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,多层分类模型通过使用拓展信号训练待训练模型得到。上述方法通过插值运算可以扩充预处理信号中数据点的数量,对插值信号添加随机扰动可以模拟实际振动信号中的噪声和变化,增强数据的抗干扰能力。对第一补充信号进行随机过采样,能够平衡不同类型的医疗器械故障类别的信号数量,从而提升对医疗器械进行故障分类的准确性。
[0123] 参照图4,在一个实施例中,所述将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别,包括:
[0124] S62:将所述故障图像输入所述多层分类模型的卷积层进行特征提取,得到图像特征。
[0125] 在步骤S62之前,还包括步骤S61:将所述拓展信号转换为故障图像。
[0126] 卷积层用于提取图像特征,卷积操作可以表示为:
[0127] ;
[0128] 其中,I为故障图像, 为卷积核, 为图像特征,u表示故障图像的宽度,v表示故障图像的高度,m表示卷积核的行数,n表示卷积核的列数。
[0129] 将卷积运算得到的图像特征拉伸为一维向量。
[0130] S63:将所述图像特征输入所述多层分类模型的第一双向LSTM层进行时间序列处理,得到第一中间结果。
[0131] 双向LSTM层具有两组权重系数和偏置系数,一组权重系数和偏置系数用于前向序列,另一组权重系数和偏置系数用于后向序列。
[0132] S64:将所述第一中间结果输入所述多层分类模型的第二双向LSTM层进行时间序列处理,得到第二中间结果。
[0133] 通过第一双向LSTM层和第二双向LSTM层对图像特征进行时间序列处理,使得第二中间结果具有时间上的特征。
[0134] S65:将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果。
[0135] 第二中间结果为图像,注意力机制层用于对第二中间结果的不同区域分配不同的注意力权重。具体地,注意力机制层对第二中间结果与医疗器械故障类别相关的部分分配较大的注意力权重,对与医疗器械故障类别无关的部分分配较小的注意力权重,从而突出表示第二中间结果与医疗器械故障类别相关的部分。
[0136] 通过以下公式对所述第二中间结果进行注意力增强:
[0137] ;
[0138] ;
[0139] ;
[0140] 其中,为第j个未归一化的注意力分数, 为第j个注意力权重,为所述注意力增强结果, 为第一参数矩阵, 为第二参数矩阵, 为第三参数矩阵,T表示矩阵转置运算,为查询矩阵, 为第j个键矩阵,tanh表示双曲正切函数,softmax表示归一化指数函数,为第j个值矩阵。
[0141] S66:将所述注意力增强结果输入所述多层分类模型的分类器进行分类,得到所述医疗器械故障类别。
[0142] 优选地,分类器采用归一化指数函数将注意力增强结果转化为概率分布,以进行多分类任务。归一化指数函数表示为:
[0143] ;
[0144] 其中,是医疗器械故障类别的数量,是第个类别的注意力增强结果,是第 个类别的注意力增强结果, 是第 个类别的预测概率。模型输出的医疗器械故障类别为预测概率最大值对应的类别。
[0145] 如上所述,将故障图像输入多层分类模型,故障图像依次经过卷积层进行特征提取,第一双向LSTM层对第一中间结果进行时间序列处理,第二双向LSTM层对第二中间结果进行时间序列处理。再将第二中间结果输入注意力机制层,对第二中间结果与医疗器械故障类别相关的部分分配较大的注意力权重,从而突出表示与医疗器械故障类别相关的部分。通过分类器将注意力增强结果转化为概率分布,将预测概率最大值对应的类别作为医疗器械故障类别。
[0146] 在一个实施例中,参照图5,所述将所述故障图像输入多层分类模型进行故障分类之前,还包括对待训练模型进行训练,所述训练过程包括以下步骤S51’‑S57’:
[0147] S51’:根据所述第一补充信号设置最小向量和最大向量。
[0148] 最小向量表示为 ,最大向量表示为 。
[0149] S52’:根据所述最小向量和所述最大向量随机生成目标向量。
[0150] 通过以下公式生成目标向量:
[0151] ;
[0152] 其中, 是在第G代的第i个目标向量, 为随机生成一个大于0且小于1的随机函数,NP为目标向量的总数。
[0153] 可选地,将NP设置为10。
[0154] S53’:获取差分权重,根据所述差分权重和所述目标向量生成扰动向量。
[0155] 通过以下公式生成扰动向量:
[0156] ;
[0157] 其中, 为扰动向量, 为第 个索引所对应的目标向量, 为第 个索引所对应的目标向量, 为第 个索引所对应的目标向量, 是从{1,2,...,NP}中随机选取的三个不同的索引,F是差分权重。
[0158] S54’:根据交叉判别式将所述目标向量或所述扰动向量设置为试验向量。
[0159] 通过交叉判别式进行交叉操作,可以增加数据的多样性,交叉判别式如下:
[0160] ;
[0161] 其中,CR为交叉概率, 是一个从{1,2,...,D}中随机选择的索引, 为第G+1代的第j个维度所对应的第i个试验向量, 为第G代的第j个维度所对应的第i个参数向量, 为第G+1代的第j个维度所对应的第i个扰动向量。
[0162] 自适应更新差分权重和交叉概率。针对差分权重F和交叉概率CR,是在运行过程中根据之前搜索的表现动态调整的。具体地,为F和CR设置一个初始的候选列表,如:
[0163] ;
[0164] ;
[0165] 在每一代中,对每一个个体,随机选择F和CR的值:
[0166] ;
[0167] ;
[0168] 其中,为第i个个体对应的差分权重, 为第i个个体对应的交叉概率, 为随机取值函数, 为长度计算函数。
[0169] 进一步地,在选择操作之后,根据新解的质量更新F和CR的候选列表。如果新解比当前解更好,将对应的F和CR值加入到候选列表中。
[0170] 进一步地,通过一个变量S来跟踪在过去的搜索中,每一个F和CR值对应的成功次数。然后在每一代中,按照如下公式更新F和CR的值:
[0171] ;
[0172] ;
[0173] 其中,argmax函数表示搜寻给定函数取得最大值时的自变量的集合,表示定义在F对应的集合中搜寻跟踪变量中适应度函数取得最大值时的差分权重,表示定义在CR对应的集合中搜寻跟踪变量中适应度函数取得最大值时的交叉概率。
[0174] S55’:检测所述试验向量的适应度是否高于所述目标向量的适应度,若是,则将所述目标向量替换为所述试验向量。
[0175] 若试验向量的适应度低于或等于目标向量的适应度,则保持目标向量不变。
[0176] 通过以下公式更新目标向量或保持目标向量不变:
[0177] ;
[0178] 其中, 为第G+1代的第i个试验向量, 是在第G代的第i个参数向量,为适应度函数。所述适应度函数表示为:
[0179] ;
[0180] 其中, 为模型的损失函数,是一个小的正数,用于防止分母为零。具体地,所述模型的损失函数为交叉熵损失函数。
[0181] S56’:向所述试验向量添加高斯扰动,得到扰动添加向量。
[0182] 当发现新的更优解时,将启动局部搜索进程对新的更优解进行细化,实现在解的质量和搜索效率之间达到较好的平衡。
[0183] 具体地,当找到一个新的更优解时,向该新的更优解添加一个小的高斯扰动,公式如下:
[0184] ;
[0185] 其中, 为新的更优解, 为添加扰动后的解,是一个用于控制扰动大小的可调节参数, 表示一个标准正态分布。
[0186] 进一步地,计算新的解 的适应度。如果新的解比 更优,则用新的解替换。否则,保持 不变。可以表示为:
[0187] ;
[0188] S57’:检测当前训练次数是否大于或等于最大训练次数,若否,则根据所述最小向量和所述最大向量随机生成所述目标向量。
[0189] 若当前训练次数小于最大训练次数,则重复执行步骤S53’‑S56’;若当前训练次数大于或等于最大训练次数,则停止训练待训练模型,得到多层分类模型。
[0190] 如上所述,通过比较试验向量的适应度和目标向量的适应度,可以不断替换目标向量,对待训练模型的每一层的参数进行更新。
[0191] 参照图6,是本申请公开的一种基于深度学习的医疗器械的故障类别检测系统的结构示意框图,所述系统包括:
[0192] 预处理模块10,用于获取医疗器械的振动信号,对所述振动信号进行预处理,得到预处理信号;
[0193] 插值运算模块20,用于对所述预处理信号进行插值运算,得到插值信号;
[0194] 随机扰动添加模块30,用于在所述插值信号中添加随机扰动,得到第一补充信号;
[0195] 随机过采样模块40,用于对所述振动信号进行随机过采样,生成第二补充信号;
[0196] 信号结合模块50,用于将所述第一补充信号、所述第二补充信号和所述振动信号拼接,得到拓展信号;
[0197] 故障分类模块60,用于将所述拓展信号转换为故障图像,将所述故障图像输入多层分类模型进行故障分类,得到医疗器械故障类别;其中,所述多层分类模型通过使用所述拓展信号训练待训练模型得到。
[0198] 上述基于深度学习的医疗器械的故障类别检测系统用于实现基于深度学习的医疗器械的故障类别检测方法。
[0199] 在一个实施例中,所述故障分类模块60包括:
[0200] 卷积单元,用于将所述故障图像输入所述多层分类模型的卷积层进行特征提取,得到图像特征;
[0201] 第一时间序列处理单元,用于将所述图像特征输入所述多层分类模型的第一双向LSTM层进行时间序列处理,得到第一中间结果;
[0202] 第二时间序列处理单元,用于将所述第一中间结果输入所述多层分类模型的第二双向LSTM层进行时间序列处理,得到第二中间结果;
[0203] 注意力增强单元,用于将所述第二中间结果输入所述多层分类模型的注意力机制层进行注意力增强,得到注意力增强结果;
[0204] 分类单元,用于将所述注意力增强结果输入所述多层分类模型的分类器进行分类,得到所述医疗器械故障类别。
[0205] 在一个实施例中,所述注意力增强单元包括:
[0206] 注意力增强子单元,用于通过以下公式对所述第二中间结果进行注意力增强:
[0207] ;
[0208] ;
[0209] ;
[0210] 其中,为第j个未归一化的注意力分数, 为第j个注意力权重,为所述注意力增强结果, 为第一参数矩阵, 为第二参数矩阵, 为第三参数矩阵,T表示矩阵转置运算,为查询矩阵, 为第j个键矩阵,tanh表示双曲正切函数,softmax表示归一化指数函数,为第j个值矩阵。
[0211] 在一个实施例中,所述预处理模块10包括:
[0212] 归一化单元,用于对所述振动信号进行归一化,得到归一化信号;
[0213] 滤波单元,用于对所述归一化信号进行滤波,得到滤波信号;
[0214] 缺失值填充单元,用于对所述滤波信号进行缺失值填充,得到所述预处理信号。
[0215] 在一个实施例中,所述基于深度学习的医疗器械的故障类别检测系统还包括模型训练模块,所述模型训练模块包括:
[0216] 向量设置单元,用于根据所述第一补充信号设置最小向量和最大向量;
[0217] 第一目标向量生成单元,用于根据所述最小向量和所述最大向量随机生成目标向量;
[0218] 扰动向量生成单元,用于获取差分权重,根据所述差分权重和所述目标向量生成扰动向量;
[0219] 试验向量设置单元,用于根据交叉判别式将所述目标向量或所述扰动向量设置为试验向量;
[0220] 目标向量替换单元,用于检测所述试验向量的适应度是否高于所述目标向量的适应度,若是,则将所述目标向量替换为所述试验向量;
[0221] 高斯扰动添加单元,用于向所述试验向量添加高斯扰动,得到扰动添加向量;
[0222] 第二目标向量生成单元,用于检测当前训练次数是否大于或等于最大训练次数,若否,则根据所述最小向量和所述最大向量随机生成所述目标向量。
[0223] 在一个实施例中,所述随机过采样模块40包括:
[0224] 第一阈值计算单元,用于在所述振动信号中随机选取一个第一补充数据点,根据过采样比例计算第一阈值;
[0225] 振动数据点复制单元,用于从所述振动信号中随机复制所述第一阈值个所述振动数据点,得到中间信号;
[0226] 第二补充信号生成单元,用于对所述中间信号进行插值运算,并添加随机扰动,生成所述第二补充信号。
[0227] 在一个实施例中,所述插值运算模块20包括:
[0228] 预处理数据点选取单元,用于在所述预处理信号中选取不同的预处理数据点;
[0229] 插值运算单元,用于根据以下公式使用双线性插值法对不同的所述预处理数据点进行插值运算:
[0230] ;
[0231] 其中,为插值系数, 为第i个预处理数据点, 为第j个预处理数据点, 为第k个插值数据点,i<j;
[0232] 插值信号组成单元,用于将所有所述预处理数据点和所有所述插值数据点组成所述插值信号。
[0233] 在一个实施例中,所述随机扰动添加模块30包括:
[0234] 随机扰动生成单元,用于通过正态分布随机生成多个随机扰动;其中,所述随机扰动的数量与所述插值数据点的数量相同;
[0235] 随机扰动添加单元,用于将每个所述插值数据点与对应的所述随机扰动相加,得到所述第一补充信号。
[0236] 在一个实施例中,所述故障分类模块60包括:
[0237] 故障分类单元,用于对所述拓展信号进行短时傅里叶变换,得到所述故障图像。
[0238] 相应于上述方法实施例,本申请实施例中还提供一种计算机设备,该计算机设备的内部结构可以如图7所示。该计算机设备包括计算机处理器、存储介质、存储器、网络接口和输入装置,计算机处理器与存储介质进行信息交换,存储介质包括操作系统、计算机程序和数据库。计算机处理器通过系统总线与存储器、网络接口和输入装置连接,网络接口用于与外部设备进行网络通信。
[0239] 相应于上述方法实施例,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被计算机处理器执行时实现上述基于深度学习的医疗器械的故障类别检测方法的步骤。
[0240] 还需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0241] 对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。