一种基于流形学习和softmax的石油钻机健康状态评估方法转让专利

申请号 : CN202011299670.X

文献号 : CN112507479B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李波邓慧敏胡家文洪涛

申请人 : 电子科技大学

摘要 :

本发明提出一种基于流形学习和softmax的石油钻机健康状态评估方法,属于设备数据分析领域。本发明首先对振动信号进行标准化处理,并提取特征;然后对高维振动信号特征进行基于流形学习的维数简约,得到低维空间特征向量,对低维向量进行softmax模型训练并得到分类结果,计算输出结果序列与健康序列的马氏距离并转换成健康指数进行量化表达,实现对石油钻机系统的健康状态评估。该方法通过对基于最大似然估计的本征维数进行自适应加权,修正数据点的贡献,同时利用标签信息,改进距离度量公式,减小不同类别之间的混叠程度,同时结合马氏距离对石油钻机健康状态进行评估,提高了评估结果的准确性和稳定性,为石油钻机故障预测和维护提供有力支撑。

权利要求 :

1.一种基于流形学习和softmax的石油钻机健康状态评估方法,该方法包括以下步骤:步骤1:采集石油钻机系统设备不同健康状态下N个不同测点振动信号,m为样本长度,对振动信号进行均值‑方差标准化,并分成训练集S1和测试集S2;

步骤2:标准化后的振动信号具有零均值和单位方差,基于时域与频域分别从标准化后的振动信号中提取时域特征、频域特征;

则时域特征向量αi,l和频域特征向量βi,l为:αi,l=[αi,l,1,αi,l,2,...,αi,l,t]βi,l=[βi,l,1,βi,l,2,...,βi,l,f]其中,αi,l,t为处于健康状态l的第i个样本的第t个时域特征参量,βi,l,f为处于健康状态l的第i个样本的第f个频域特征参量,i表示处于健康状态l的第i个样本i=1,...,n,n为样本总个数,t为时域特征参量个数,f为频域特征参量个数;

步骤3:对不同测点位置下不同健康状态的振动信号样本构建高维特征矩阵,将原始振动信号的时域特征向量和频域特征向量按顺序排列,构成第i个样本的高维特征向量:T

Si=[αi,0,αi,1,αi,2,…,αi,t,βi,0,βi,1,βi,2,…,βi,f]再构成各状态的高维特征矩阵:

其中,Nl为处于健康状态l的石油钻机系统振动信号的样本;

步骤4:提取低维嵌入分量,对步骤3中构造的不同健康状态振动信号的高维特征矩阵降维,表征石油钻机系统的健康状态;

步骤4.1:计算不同健康状态中的各样本点xi的邻域,对高维本征空间中的每一个点确定xi的k个最近邻近点构成的邻域Xi=[xi1,xi2,…,xik],根据最佳分类效果选择;

步骤4.2:利用极大似然估计,由k个局部最近邻计算全局坐标映射的d个特征向量;用近邻数k作为小球半径,可得局部维数极大似然估计,对每个样本点的本征维数取其平均值可得到全局本征维数;局部维数极大似然估计为:其中Tk(xi)为xi与其第k个近邻点的欧氏距离;

步骤4.3:由邻近点数k的选取和本征维数的计算,对原始高维特征向量进行维数简约,得到不同健康状态的低维特征向量合集:其中 d为维数简约后特征向量的维数;

步骤5:将训练样本简约后的低维特征向量输入softmax模型中训练,得到样本属于不同健康状态下的概率;

利用步骤4中不同健康状态标签下的低维特征向量来训练softmax分类器,分类器输出为一阶概率矩阵,表示样本属于不同健康状态的概率;其假设函数为:(i) (i) (i) (i) (i)其中,p(y =l∣x ;θ)代表样本x 属于第j类的概率,y 表示第i个样本的标签,x表示第i个训练样本,θl为模型参数向量,θ的代价函数定义为:(1) (2) (K)

J(θ)=J(θ )+J(θ )+…+J(θ )(k)

J(θ )定义为:

步骤6:根据步骤5的softmax模型中设置的迭代次数和模型参数要求,输入降维后的测试样本,输出各个测试样本属于不同健康状态等级的概率,将测试样本隶属概率最大的结果所对应的健康状态作为最终健康状态等级;

步骤7:计算石油钻机系统最终健康状态等级序列与健康状态序列之间的马氏距离,计算出不同健康状态等级下健康指数的范围。

2.如权利要求1所述的一种基于流形学习和softmax的石油钻机健康状态评估方法,其特征在于,所述步骤1中根据石油钻机系统的性能退化过程,将石油钻机系统不同健康状态划分为5个等级,依次为健康、良好、合格、异常、故障;对于每个测点位置采集5个状态下的振动信号。

3.如权利要求1所述的一种基于流形学习和softmax的石油钻机健康状态评估方法,其特征在于,所述步骤2中的时域特征为振动信号的13个时域特征,包括:绝对均值、最大峰值、均方根值、方根幅值、方差、峰‑峰值、峭度、歪度、峰值指标、波形指标、脉冲指标、裕度指标、峭度指标;频域特征为振动信号的7个时域特征,包括:平均频率、谱峰稳定指数、第一频带相对能量、第二频道相对能量、第三频带相对能量、第四频带相对能量、第五频带相对能量。

4.如权利要求1所述的一种基于流形学习和softmax的石油钻机健康状态评估方法,其特征在于,所述步骤4.1中采用欧氏距离与余弦相似度结合的改进距离dij的度量方式进行邻域点的选取,增大健康状态相同的样本被选为邻点的可能性;

其中 分别为xj与xi的余弦相似度与欧氏距离,根据最佳分类效果值来人为确定k个最近邻近点构成的邻域中的k值;

故定义近邻距离矩阵为:

其中 为改进距离dij的平均值,相同健康状态下的距离为:不同健康状态下的距离为:

为改进距离dij的平均值。

5.如权利要求1所述的一种基于流形学习和softmax的石油钻机健康状态评估方法,其特征在于,所述步骤4.2考虑每个数据点与其近邻点之间的关系,加权修正本征维数;点xi的权重可表示为:

其中,Dk为近邻距离矩阵,Ak(xi)为点xi距最近邻的距离;

加权后的本征维数为:

其中, 表示用近邻数k得到的局部维数极大似然估计:Tk(xi)是样本点xi与其第k个近邻点的欧式距离。

6.如权利要求1所述的一种基于流形学习和softmax的石油钻机健康状态评估方法,其特征在于,所述步骤5中的模型参数使用迭代的优化算法对代价函数进行优化;

(k)

对J(θ )增加一个权重衰减项:其中,λ是模型的参数,根据实验确定,C表示类别标签, 为n维实数向量,是由训练集得到的模型参数,li表示第i个样本的标签;

(k)

对代价函数J(θ )求偏导,得到梯度公式:其中,λ为模型的参数,根据实验确定,p(li=j∣xi,θ)表示分类器的输入训练样本为xi时,输出类别为li的概率;

在梯度下降的每一次迭代中进行如下更新:

7.如权利要求1所述的一种基于流形学习和softmax的石油钻机健康状态评估方法,其特征在于,所述步骤7中健康指数的定义为:其中MD1为石油钻机系统健康状态序列与理想状态序列的马氏距离,MD2为石油钻机系统健康状态序列与各健康状态等级序列的马氏距离。

说明书 :

一种基于流形学习和softmax的石油钻机健康状态评估方法

技术领域

[0001] 本发明属于设备健康管理技术领域,是一种对石油钻机关键机械设备进行健康评估的方法,具体为一种基于流形学习和softmax分类器的石油钻机健康状态评估方法。

背景技术

[0002] 健康评估这一概念最早来源于人的健康管理,随后逐渐被引入到复杂装备的科学化管理中,最早应用于航空发动机管理。其中健康状态可以定性描述为装备是否能够完成
既定任务,定量又可以描述为装备当前与服役初期之间的性能差异,或表示装备当前状态
与失效状态之间的距离。
[0003] 目前常用的设备健康状态评估方法为物理模型和数据驱动。由于复杂装备结构的复杂性,难以对其建立精确的机理模型,而数据驱动的方法具有对复杂系统建模的优势,且
各类监控系统的建立,储备了大量的运行数据,使得数据驱动的健康评估方法受到广泛的
关注。
[0004] 基于数据驱动的复杂装备健康评估方法主要有三类,其一是以状态特征距离度量为核心的健康评估方法,其二是基于统计学理论进行健康状态估计,其三是以可靠性理论
为背景,依据复杂装备物理结构进行可靠性建模,从而估计总体健康水平。
[0005] 数据驱动法存在计算过程繁琐、对健康状态不敏感等问题,且石油钻机系统属于大型复杂装备,组成关系复杂,目前国内没有可视化的石油钻机健康状态评估研究,因此本
领域的技术人员致力于研究针对石油钻机设备的健康状态评估方法,对主要机械设备异常
进行分析,在钻机发生事故前及时加以监测,为设备维护奠定基础。

发明内容

[0006] 本发明的目的在于针对石油钻机振动信号非线性、非平稳的特点,提出一种基于流形学习和softmax的石油钻机健康状态评估方法,使其解决背景技术中存在的不足,结合
流形学习与状态识别评估石油钻机健康状态,以提高评估结果的精确性。
[0007] 本发明一种基于流形学习和softmax的石油钻机健康状态评估方法,该方法包括以下步骤:
[0008] 步骤1:采集石油钻机系统设备不同健康状态下N个不同测点振动信号,j=1,2,……,m,m为样本长度,对振动信号进行均值‑方差标准
化,并分成训练集S1和测试集S2;
[0009] 步骤2:标准化后的振动信号具有零均值和单位方差,基于时域与频域分别从标准化后的振动信号中提取时域特征、频域特征;
[0010] 则时域特征向量αi,l和频域特征向量βi,l为:
[0011] αi,l=[αi,l,1,αi,l,2,...,αi,l,t]
[0012] βi,l=[βi,l,1,βi,l,2,...,βi,l,f]
[0013] 其中,αi,l,t为处于健康状态l的第i个样本的第t个时域特征参量,βi,l,f为处于健康状态l的第i个样本的第f个频域特征参量,i表示处于健康状态l的第i个样本i=1,...,
n,n为样本总个数,t为时域特征参量个数,f为频域特征参量个数;
[0014] 步骤3:对不同测点位置下不同健康状态的振动信号样本构建高维特征矩阵,将原始振动信号的时域特征向量和频域特征向量按顺序排列,构成第i个样本的高维特征向量:
[0015] Si=[αi,0,αi,1,αi,2,…,αi,t,βi,0,βi,1,βi,2,…,βi,f]T
[0016] 再构成各状态的高维特征矩阵:
[0017]
[0018] 其中,Nl为处于健康状态l的石油钻机系统振动信号的样本;
[0019] 步骤4:提取低维嵌入分量,对步骤3中构造的不同健康状态振动信号的高维特征矩阵降维,表征石油钻机系统的健康状态;
[0020] 步骤4.1:计算不同健康状态中的各样本点xi的邻域,对高维本征空间中的每一个点确定xi的k个最近邻近点构成的邻域Xi=[xi1,xi2,…,xik],根据最佳分类效果选择。
[0021] 步骤4.2:利用极大似然估计,由k个局部最近邻计算全局坐标映射的d个特征向量;用近邻数k作为小球半径,可得局部维数极大似然估计,对每个样本点的本征维数取其
平均值可得到全局本征维数;局部维数极大似然估计为:
[0022]
[0023] 其中Tk(xi)为xi与其第k个近邻点的欧氏距离;
[0024] 步骤4.3:由邻近点数k的选取和本征维数的计算,对原始高维特征向量进行维数简约,得到不同健康状态的低维特征向量合集:
[0025]
[0026] 其中 d为维数简约后特征向量的维数;
[0027] 步骤5:将训练样本简约后的低维特征向量输入softmax模型中训练,得到样本属于不同健康状态下的概率;
[0028] 利用步骤4中不同健康状态标签下的低维特征向量来训练softmax分类器,分类器输出为一阶概率矩阵,表示样本属于不同健康状态的概率;其假设函数为:
[0029]
[0030] 其中,p(y(i)=l∣x(i);θ)代表样本x(i)属于第j类的概率,y(i)表示第i个样本的标(i)
签,x 表示第i个训练样本,θl为模型参数向量,θ的代价函数定义为:
[0031] J(θ)=J(θ(1))+J(θ(2))+…+J(θ(K))
[0032] J(θ(k))定义为:
[0033]
[0034] 步骤6:根据步骤5的softmax模型中设置的迭代次数和模型参数要求,输入降维后的测试样本,输出各个测试样本属于不同健康状态等级的概率,将测试样本隶属概率最大
的结果所对应的健康状态作为最终健康状态等级;
[0035] 步骤7:计算石油钻机系统最终健康状态等级序列与健康状态序列之间的马氏距离,计算出不同健康状态等级下健康指数的范围。
[0036] 进一步地,所述步骤1中根据石油钻机系统的性能退化过程,将石油钻机系统不同健康状态划分为5个等级,依次为健康、良好、合格、异常、故障;对于每个测点位置采集5个
状态下的振动信号。
[0037] 进一步地,所述步骤2中的时域特征为振动信号的13个时域特征,包括:绝对均值、最大峰值、均方根值、方根幅值、方差、峰‑峰值、峭度、歪度、峰值指标、波形指标、脉冲指标、
裕度指标、峭度指标;频域特征为振动信号的7个时域特征,包括:平均频率、谱峰稳定指数、
第一频带相对能量、第二频道相对能量、第三频带相对能量、第四频带相对能量、第五频带
相对能量。
[0038] 进一步地,所述步骤4.1中采用欧氏距离与余弦相似度结合的改进距离dij的度量方式进行邻域点的选取,增大健康状态相同的样本被选为邻点的可能性;
[0039]
[0040] 其中 分别为xj与xi的余弦相似度与欧氏距离,根据最佳分类效果值来人为确定k个最近邻近点构成的邻域中的k值;
[0041] 故定义近邻距离矩阵为:
[0042]
[0043] 其中 为改进距离dij的平均值,相同健康状态下的距离为:
[0044]
[0045] 不同健康状态下的距离为:
[0046]
[0047] 为改进距离dij的平均值。
[0048] 进一步地,所述步骤4.2考虑每个数据点与其近邻点之间的关系,加权修正本征维数;点xi的权重可表示为:
[0049]
[0050] 其中,Dk为近邻距离矩阵,Ak(xi)为点xi距最近邻的距离;
[0051] 加权后的本征维数为:
[0052]
[0053] 其中, 表示用近邻数k得到的局部维数极大似然估计:
[0054]
[0055] Tk(xi)是样本点xi与其第k个近邻点的欧式距离。
[0056] 进一步地,所述步骤5中的模型参数使用迭代的优化算法对代价函数进行优化;
[0057] 对J(θ(k))增加一个权重衰减项:
[0058]
[0059] 其中,λ是模型的参数,根据实验确定,C表示类别标签, 为n维实数向量,是由训练集得到的模型参数,li表示第i个样本的标签。
[0060] 对代价函数J(θ(k))求偏导,得到梯度公式:
[0061]
[0062] 其中,λ为模型的参数,根据实验确定,p(li=j∣xi,θ)表示分类器的输入训练样本为xi时,输出类别为li的概率。
[0063] 在梯度下降的每一次迭代中进行如下更新:
[0064]
[0065] 进一步地,所述步骤7中健康指数的定义为:
[0066]
[0067] 其中MD1为石油钻机系统健康状态序列与理想状态序列的马氏距离,MD2为石油钻机系统健康状态序列与各健康状态等级序列的马氏距离。
[0068] 本评估方法通过对石油钻机的系统各测点的振动信号进行分析,特征提取并降维,结合softmax分类器进行状态识别,实现石油钻机的健康状态等级划分和健康状态评估
评估。
[0069] 流形学习能够在保持较好原始特征流形结构的情况下进行维数简约,减小状态识别的压力,提高健康状态识别精度,LTSA算法给出了从低维流形到高维流形之间的主流形
重构显示表达式,保证了映射变化误差小,但不能利用类别标签信息,导致不同类别的低维
特征集可能存在混叠现象,且存在本征维数人为设置的不确定性问题。本方法通过对基于
最大似然估计的本征维数进行自适应加权,考虑每个数据点与其邻近点的关系,修正数据
点的贡献,同时利用标签信息,改进距离度量公式,减小不同类别之间的混叠程度,提高了
健康状态评估的准确率和稳定性,具有实际意义。
[0070] 以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

附图说明

[0071] 图1为本发明一种基于流形学习和softmax的石油钻机健康状态评估方法的流程图。

具体实施方式

[0072] 下面结合附图对本发明作进一步详述,旨在用于解释本发明,而不是对本发明的限制。
[0073] 本发明所述问题是以下所述技术方案解决的:
[0074] 基于石油钻机系统各测点振动信号的历史运行数据,以及性能退化下的健康状态分类,首先对振动信号进行标准化处理,并提取特征。然后对高维振动信号特征进行基于流
形学习的维数简约,得到低维空间特征向量,对低维向量进行softmax模型训练并得到分类
结果,计算输出结果序列与健康序列的马氏距离并转换成健康指数进行量化表达,实现对
石油钻机系统的健康状态评估。
[0075] 上述石油钻机健康状态评估方法按以下步骤进行:
[0076] 步骤1:采集石油钻机某系统设备不同健康状态下N个不同测点振动信号,j=1,2,……,m,m为样本长度,对振动信号进行均值‑方差标准
化,并分成训练和测试两个数据子集S1、S2。根据石油钻机系统的性能退化过程,将石油钻
机系统不同健康状态划分为5个等级,依次为健康、良好、合格、异常、故障。对于每个测点位
置采集5个状态下的振动信号,如表2所示。
[0077] 表2为石油钻机健康状态等级划分说明表
[0078]
[0079]
[0080] 步骤2:标准化后的振动信号具有零均值和单位方差,基于时域与频域分析从标准化后的振动信号中提取时域原始特征、频域特征。
[0081] 时域特征向量和频域特征向量分别为:
[0082] αi,l=[αi,l,1,αi,l,2,...,αi,l,t]
[0083] βi,l=[βi,l,1,βi,l,2,...,βi,l,f]
[0084] 其中i表示处于健康状态l的第i个样本i=1,...,n,t为时域特征参量个数,f为频域特征参量个数。
[0085] 时域特征为振动信号的13个时域特征,包括绝对均值、最大峰值、均方根值、方根幅值、方差、峰‑峰值、峭度、歪度、峰值指标、波形指标、脉冲指标、裕度指标、峭度指标。频域
特征为振动信号的7个时域特征,包括平均频率、谱峰稳定指数、第一频带相对能量、第二频
道相对能量、第三频带相对能量、第四频带相对能量、第五频带相对能量。
[0086] 步骤3:对不同测点位置下不同健康状态的振动信号样本构建高维特征矩阵,将原始振动信号的时域特征参量和频域特征参量按顺序排列,构成第i个样本的高维特征向量:
[0087] Si=[αi,0,αi,1,αi,2,…,αi,t,βi,0,βi,1,βi,2,…,βi,f]T
[0088] 构成各状态的高维特征矩阵:
[0089] SNl=[s1,s2,…,sNl]T
[0090] 其中,Nl为处于健康状态l的石油钻机系统振动信号的样本。
[0091] 步骤4:利用LTSA流形算法提取低维嵌入分量,对步骤3中构造的不同健康状态振动信号的高维特征矩阵降维,进一步表征石油钻机某系统的健康状态。
[0092] 步骤4.1:选取邻域,计算不同健康状态中的各样本点xi的邻域,对高维本征空间中的每一个点确定xi的k个最近邻近点构成的邻域Xi=[xi1,xi2,…,xik]。
[0093] 采用Euclidean距离与余弦相似度结合的改进距离度量方式进行邻域点的选取,增大健康状态相同的样本被选为邻点的可能性。
[0094]
[0095] 其中 分别为xj与xi的余弦相似度与欧氏距离。
[0096] 定义相同健康状态下的距离为
[0097]
[0098] 不同健康状态下的距离为
[0099]
[0100] 其中 为xi与邻域改进距离的平均值。
[0101] 步骤4.2:利用极大似然估计,由k个局部最近邻计算全局坐标映射的d个特征向量。用近邻数k作为小球半径,可得局部维数极大似然估计,对每个样本点的本征维数取其
平均值可得到全局本征维数。局部维数极大似然估计为:
[0102]
[0103] 其中Tk(xi)为xi与其第k个近邻点的欧氏距离。
[0104] 考虑每个数据点与其近邻点之间的关系,加权修正本征维数。点xi的权重可表示为
[0105]
[0106] 其中Dk为近邻距离矩阵,Ak(xi)为点xi距最近邻的距离
[0107] 加权后的本征维数为:
[0108]
[0109] 步骤4.3:由邻近点数k的选取和本征维数的计算,通过LTSA算法对原始高维特征向量进行维数简约,得到不同健康状态的低维向量合集:
[0110]
[0111] 其中 d为维数简约后特征向量的维数。
[0112] 步骤5:将训练样本简约后的低维特征向量输入softmax模型中训练,得到样本属于不同健康状态下的概率。
[0113] 利用步骤4中不同健康状态标签下的低维向量来训练softmax分类器,分类器输出为一阶概率矩阵,表示样本属于不同健康状态的概率。其假设函数为:
[0114]
[0115] 其中θ为模型参数。θ的代价函数定义为:
[0116] J(θ)=J(θ(1))+J(θ(2))+…+J(θ(K))
[0117] J(θ(k))定义为:
[0118]
[0119] 模型参数使用迭代的优化算法对代价函数进行优化。
[0120] 对J(θ(k))增加一个权重衰减项:
[0121]
[0122] 其中λ是模型的参数,根据实验确定。
[0123] 对代价函数J(θ(k))求偏导,得到梯度公式:
[0124]
[0125] 在梯度下降的每一次迭代中进行如下更新:
[0126]
[0127] 步骤6:根据步骤5的softmax模型中设置的迭代次数和模型参数要求,输入降维后的测试样本,输出各个测试样本属于不同健康状态等级的概率,将测试样本隶属概率最大
的结果所对应的健康状态作为最终健康状态等级。
[0128] 步骤7:计算石油钻机系统最终健康状态等级序列与健康状态序列之间的马氏距离,计算出不同健康状态等级下健康指数的范围。
[0129] 健康指数的定义为:
[0130]
[0131] 其中MD1为石油钻机系统状态序列与理想状态序列的马氏距离,MD2为石油钻机系统状态序列与各健康状态等级序列的马氏距离。