阀门内漏缺陷类型识别与内漏速率计算的方法转让专利

申请号 : CN201310459628.3

文献号 : CN103488906B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 徐长航曹国梁陈国明任乐峰李国瑞史焕地艾素萍韩国星张丽珍

申请人 : 中国石油大学(华东)

摘要 :

阀门缺陷类型识别与内漏内漏速率计算的方法。其步骤包括(1)基于声发射技术开展阀门内漏检测实验,获取实验数据;(2)提取阀门特征、工艺参数、声发射信号特征等方面数据,构建高维特征空间;(3)对高维特征空间数据进行保局投影降维,提取低维空间特征;(4)建立基于支持向量分类的阀门内漏缺陷类型识别模型,选用RBF核函数,用微粒群算法确定模型的最优参数,输入低维空间标记数据进行训练;(5)基于主动学习的方法,标记对模型影响较大的无标签数据样本,建立支持向量回归的内漏内漏速率计算模型;(6)利用模型预测待测阀门的内漏缺陷类型及内漏速率。本发明降低了对数据样本数量的依赖,有效解决阀门内漏定量检测困难的问题。

权利要求 :

1.阀门内漏缺陷类型识别与内漏速率计算的方法,其特征在于,包括以下步骤:

1)分别从实验室、工程现场采集阀门内漏检测所需的实验数据:

实验室内采集,针对不同类型、不同材质的阀门,人工预制阀门内漏缺陷,通过改变密封划痕的形状尺寸、阀体穿孔的形状尺寸以及阀门的开度,模拟缺陷的损伤程度;然后针对有缺陷的阀门,以阀门类型、阀门材质、阀门尺寸、工艺参数、介质特性为变量组合V,用宽频传感器以1MHz的采样频率采集阀门内漏声发射信号,包括特征量信号与波形流信号;标记内漏缺陷类型和测试阀门的内漏速率;

工程现场采集,针对工程现场发生内漏的阀门,记录变量组合V中的数值,采集阀门内漏声发射信号,根据工程现场状况,对于内漏缺陷类型和内漏速率已知的内漏阀门,标记阀门内漏缺陷类型标签及内漏速率标签,其他数据,不作标记;

2)将步骤1)采集的实验数据添加到样本集R,样本集R包括标签数据样本集L、无标签数据样本集U,R中样本包含对象数据、测试数据与标签数据三类,其中对象数据包含阀门类型、阀门材质、介质相态三个属性,测试数据包括阀门尺寸、阀前压力、阀后压力、温度、介质密度、介质粘度、声发射信号数据,标签数据包括内漏缺陷类型标签、内漏速率标签,分别记为Lq、Ln;对于实验中和工程现场中内漏缺陷类型与内漏速率已知的阀门,添加其步骤1)中采集的数据至标签数据样本集L中;对于工程现场中阀门内漏缺陷类型、内漏速率无法获取的阀门,仅将工程现场采集的对象数据与测试数据,添加至无标签数据样本集U中;

3)提取样本集R中所有声发射信号的幅值平均值、有效值电压(RMS)、平均信号电平(ASL)、峰值频率,选用db8小波基对声发射波形流信号进行了5层小波包分解,将原始信号分解到32个子频段上,根据每个子频段能量的大小,选取31.25~46.875KHz, 46.875~62.5 KHz, 62.5~78.125 KHz, 78.125~93.75 KHz, 93.75~109.375 KHz, 109.375~125 KHz, 

125~140.625 KHz, 140.625~156.25 KHz, 156.25~171.875 KHz, 171.875~187.5 KHz十个频率段的能量,子频段信号的能量计算公式如下:其中,S(k t)每一频段的重构系数;然后对样本集R中的所有样本,以阀门尺寸、阀前压力、阀后压力、温度、介质密度、介质粘度;幅值平均值、有效值电压(RMS)、平均信号电平(ASL)、峰值频率以及十个子频带的能量值共20个变量为输入参数,构建n*20的输入矩阵X1;

4)通过流行学习方法对输入矩阵X1中测试数据进行保局投影(LPP)降维,提取低维空间特征,形成低维特征空间;首先按照不同维度对输入矩阵X1进行归一化处理,得到归一化处理后的矩阵X2,然后利用保局投影算法对X2进行降维处理得到矩阵X3,其中由标签数据样本集L降维获得的样本集记为X3L,由无标签数据样本集U降维获得的样本集记为X3U;

5)对于由阀门类型、阀门材质、介质相态三个属性组合的不同研究对象,利用支持向量分类(SVC)方法,分别建立相应研究对象的阀门内漏缺陷类型识别模型,选用RBF核函数,用微粒群算法确定模型的最优参数,然后输入保局投影后X3L中低维特征数据与内漏缺陷类型标签Lq,训练得到阀门内漏缺陷类型识别模型;

6)对于由阀门类型、阀门材质、介质相态三个属性组合的不同研究对象,建立支持向量回归(SVR)阀门内漏速率计算模型,基于主动学习的方法,从降维后的无标签数据集X3U中挑选对模型影响较大的数据点,然后通过实验采集获得内漏速率标签并加入到已标记样本集L,最后利用更新后的样本集L重新建立阀门内漏速率回归计算模型Mend;

7)阀门内漏缺陷类型识别及内漏速率预测,按照变量组合V中要求采集被测阀门的相关数据,经过2)、3)、4)处理后得到该数据样本的降维后样本,然后将该降维后的样本分别输入5)、6)中建立的阀门内漏缺陷类型识别模型、阀门内漏速率回归计算模型,从而得到该阀门内漏缺陷类型和内漏速率;所述步骤6)中所述基于主动学习,从未知标签的数据中,选择对模型影响较大的数据点,主动学习的步骤如下:(1)将保局投影后X3L的低维特征数据与内漏速率标签Ln组合为B(x,y),其中x为X3L样本数据,y为对应的泄漏量标签,以B(x,y)为训练数据,选用RBF核函数,用微粒群算法确定模型的最优参数,训练得到最初的回归模型M0;

(2)利用模型M0,输入降维后的无标签数据集X3U中的数据xu,得到其对应的泄漏量预测值yu,将(xu,yu)数据添加到数据集B(x,y)中,得到新的标记样本集Bnew,利用Bnew中所有数据训练SVR模型,得到新的回归模型Mnew,然后用新模型Mnew计算原数据集B中x,获得新标签数据ynew;

(3)计算新的回归模型Mnew在数据集L上的均方根误差(RMSE),计算公式如下:

均方根误差值相对较大的数据,其置信度低,对模型会有更大的影响,通过对无标签数据集X3U中所有数据输入计算后,选取置信度低的无内漏速率标签的数据,通过实验采集获得内漏速率标签并加入到已标记样本集L,最后利用更新后的样本集L重新建立阀门内漏速率回归计算模型Mend。

说明书 :

阀门内漏缺陷类型识别与内漏速率计算的方法

技术领域

[0001] 本发明涉及阀门内漏检测领域,特别涉及阀门内漏缺陷类型识别与内漏速率计算。

背景技术

[0002] 近年来,基于声发射技术的阀门内漏检测已经成为研究热点。有些研究人员从声发射机理出发,用解析法提出了阀门内漏速率估测的Kaewwaewnoi模型与E. Meland模型。但是,应用这些模型的前提是泄漏孔形状确定,这在工程现场中是很难直接获得的。大多数研究者着眼于阀门内漏的声发射信号的特征,在阀门内漏声发射信号预处理以及特征提取方面取得了很好的进展,对于阀门内漏速率预测,也提出了最小二乘法回归预测、数据对比等方法。受选取的特征参数数量及样本数量不足的限制,上述方法的预测模型只适用于限定状况下的阀门内漏检测,模型的可移植性与精确性较差,这严重制约了阀门内漏检测技术的工程转化。因此,数据的获取、甄选以及多维特征参数的降维处理成为制约阀门内漏检测技术发展的重要原因。

发明内容

[0003] 本发明针对基于声发射技术进行阀门内漏检测时,数据样本少、数据特征参数利用不充分的问题,从流形学习降维、主动学习、支持向量领域出发,提出了一种阀门内漏缺陷类型识别与内漏速率计算的方法。降低了对数据样本数量的依赖,最大程度挖掘、利用了测试数据中的特征参数。建立普适性良好、由声发射信号特征等可测因素反演计算内漏速率的数学模型。
[0004] 本发明的技术方案如下:
[0005] 1)分别从实验室、工程现场采集阀门内漏检测所需的实验数据:
[0006] 实验室内采集,针对不同类型(球阀、闸阀、截止阀)、不同材质(碳钢、不锈钢、铸铁)的阀门,人工预制阀门内漏缺陷(密封划痕、穿孔、关不紧),通过改变密封划痕的形状尺寸、阀体穿孔的形状尺寸以及阀门的开度,模拟缺陷的损伤程度;然后针对所有缺陷的阀门,以阀门类型、阀门材质、阀门尺寸、工艺参数(阀前压力、阀后压力、温度)、介质特性(密度、粘度和介质相态)为变量组合V,用宽频传感器以1MHz的采样频率采集阀门内漏声发射信号,包括特征量信号与波形流信号。标记内漏缺陷类型和测试阀门的内漏速率。
[0007] 工程现场采集,针对工程现场发生内漏的阀门,记录变量组合V中的数值,采集阀门内漏声发射信号,根据工程现场状况,对于内漏缺陷类型和内漏速率已知的内漏阀门,标记阀门内漏缺陷类型标签及内漏速率标签,其他数据,不作标记。
[0008] 2)将步骤1)采集的实验数据添加到样本集R。样本集R包括标签数据样本集L、无标签数据样本集U。
[0009] R中样本包含对象数据、测试数据与标签数据三类。
[0010] 其中对象数据包含阀门类型、阀门材质、介质相态三个属性,测试数据包括阀门尺寸、阀前压力、阀后压力、温度、介质密度、介质粘度、声发射信号数据,标签数据包括内漏缺陷类型标签、内漏速率标签,分别记为Lq、Ln。
[0011] 对于实验中和工程现场中内漏缺陷类型与内漏速率已知的阀门,添加其步骤1)中采集的数据至标签数据样本集L中;对于工程现场中阀门内漏缺陷类型、内漏速率无法获取的阀门,仅将工程现场采集的对象数据与测试数据,添加至无标签数据样本集U中。
[0012] 3)提取样本集R中所有声发射信号的幅值平均值、有效值电压(RMS)、平均信号电平(ASL)、峰值频率。选用db8小波基对声发射波形流信号进行了5层小波包分解,[0013] 将原始信号分解到32个子频段上,根据每个子频段能量的大小,选取31.25~46.875KHz, 46.875~62.5 KHz, 62.5~78.125 KHz, 78.125~93.75 KHz, 93.75~109.375 KHz, 109.375~125 KHz, 125~140.625 KHz, 140.625~156.25 KHz, 156.25~171.875 KHz, 171.875~187.5 KHz十个能量最大的子频段”
[0014] 子频段信号的能量计算公式如下:
[0015]
[0016] 其中,S(k t)每一频段的重构系数。然后由对样本集R中的所有样本,中提取阀门尺寸、阀前压力、阀后压力、温度、介质密度、介质粘度;幅值平均值、有效值电压(RMS)、平均信号电平(ASL)、峰值频率以及十个子频带的能量值共20个变量为输入参数,构建n*20的输入矩阵X1。
[0017] 4)通过流行学习方法对输入矩阵X1中测试数据进行保局投影(LPP)降维,提取低维空间特征,形成低维特征空间:首先按照不同维度对输入矩阵X1进行归一化处理,得到归一化处理后的矩阵X2;然后利用保局投影算法对X2进行降维处理得到矩阵X3,其中由标签数据样本集L降维获得的样本集记为X3L,由无标签数据样本集U降维获得的样本集记为X3U,[0018] 利用保局投影算法对X2进行降维处理得到矩阵X3的降维处理具体步骤如下:
[0019] 第一,首先用k最邻近结点算法计算X2中样本点xi与其他样本点xj的欧氏距离,获得与样本点xi最近邻的k个样本点。
[0020] 第二,计算X2中样本点之间的权重值。xi与近邻的k个样本点的权重值 ,xi与其他非近邻样本点的权重值为零。对X2中n个样本点依次赋权重,从而构造得出n*n的权重矩阵W。
[0021] 第三,构造对角矩阵D,
[0022]
[0023] 第四,构造拉普拉斯阵L,
[0024]
[0025] 第五,解广义特征方程,求特征向量、特征值
[0026] 求解 的解,其中,列向量为特征方程的解,按照特征值从大到小 排序,构成矩阵 ,即降维过程的转移矩阵。其中,l<20,l的值
由主成分贡献的要求设定。
[0027] 第六,求解降维后的矩阵X3
[0028]
[0029] 5)对于由阀门类型、阀门材质、介质相态三个属性组合的不同研究对象,利用支持向量分类(SVC)方法,分别建立相应研究对象的阀门内漏缺陷类型识别基础模型,选用RBF核函数,用微粒群算法确定模型的最优参数,然后向基础模型内输入保局投影后X3L中低维特征数据与内漏缺陷类型标签Lq的数据,训练得到阀门内漏缺陷类型识别模型。
[0030] 6)对于由阀门类型、阀门材质、介质相态三个属性组合的不同研究对象,建立支持向量回归(SVR)阀门内漏速率计算模型。基于主动学习的方法,从降维后的无标签数据集X3U中挑选对模型影响较大的数据点,其步骤如下:
[0031] (1)将保局投影后X3L的低维特征数据与内漏速率标签Ln组合为B(x,y),其中x为X3L样本数据,y为x对应的泄漏量标签。以B(x,y)为训练数据,选用RBF核函数,用微粒群算法确定模型的最优参数,训练得到最初的回归模型M0。
[0032] (2)利用模型M0,输入降维后的无标签数据集X3U中的数据xu,得到其对应的泄漏量预测值yu,将(xu,yu)数据添加到数据集B(x,y)中,得到新的标记样本集Bnew。利用Bnew中所有数据训练SVR模型,得到新的回归模型Mnew。然后用新模型Mnew计算原数据集B中x,获得新标签数据ynew。
[0033] (3)计算新的回归模型Mnew在数据集L上的均方根误差(RMSE),计算公式如下:
[0034]
[0035] 均方根误差值相对较大的数据,其置信度低,对模型会有更大的影响。通过对无标签数据集X3U中所有数据输入计算后,选取置信度低的无内漏速率标签的数据,通过实验采集获得内漏速率标签并加入到已标记样本集L,最后利用更新后的样本集L重新建立阀门内漏速率回归计算模型Mend。
[0036] 7)阀门内漏缺陷类型识别及内漏速率预测
[0037] 按照变量组合V中要求采集被测阀门的相关数据,加入添加至无标签数据样本集U中,经过2)、3)、4)处理后得到该数据样本的降维后样本。然后将该降维后的样本分别输入5)、6)中建立的阀门内漏缺陷类型识别模型、阀门内漏速率回归计算模型,从而得到该阀门内漏缺陷类型和内漏速率。
[0038] 从流形学习降维、主动学习、支持向量领域出发,提出了一种阀门内漏缺陷类型识别与内漏速率计算的方法。
[0039] 本发明的有益效果在于:1、与现有的阀门内漏检测声发射信号处理方法相比,最大程度挖掘测试数据中的特征参数,充分利用了单个样本的信息量。同时应用流形学习减少了降维过程的信息丢失。2、与现有的阀门内漏缺陷类型识别与内漏速率计算方法相比,运用支持向量机工具,降低了对数据样本数量的依赖,模型的普适性及精确性得以提升。主动学习提取对模型影响较大的数据点,一方面降低了盲目测试带来的各项经济成本,另一方面进一步拓展了模型的应用范围。
[0040] 本发明利用流形学习中的保局投影算法对高维特征进行降维处理,然后以支持向量机算法开展分类、回归训练,同时运用了主动学习的方法提取潜在的有利于后续学习的无标签数据,从而有目的性的进行补充标记,克服了数据不足对阀门内漏速率预测的影响。

附图说明

[0041] 下面结合附图与具体实施案例进一步说明本发明
[0042] 图1是本发明建立阀门内漏缺陷类型识别与内漏速率计算模型的流程图;
[0043] 图2 是本发明对待测阀门进行内漏缺陷类型识别与内漏速率计算的流程图。

具体实施方式

[0044] 本例以内漏的不锈钢球阀为研究对象,采集空气通过内漏阀门的实验数据,进一步说明本发明的实施步骤:
[0045] 1)分别从实验室、工程现场采集阀门内漏检测所需的实验数据人工预制密封划痕、阀门球体穿孔以及阀门关不紧三种阀门内漏缺陷,密封划痕贯穿于密封圈与阀门球体接触的切面上,其深度*宽度尺寸为:5*1、4*2、3*3(mm);阀体球体穿孔的直径分别为2、2.5、3(mm);阀门开度分别为10°、15°、20°、25°;阀门直径尺寸选择25、32、50、65、100(mm),阀前、阀后压力从0.1Mpa~2Mpa变化,气体温度从25~40℃变化,用正交试验设计法设计实验方案,选用美国PAC公司的PCI-2声发射检测系统以及WS传感器,声发射传感器布置在球阀下游法兰处,采样频率设定为1MHz,采集阀门内漏声发射信号,包括特征量信号与波形流信号。标记内漏缺陷类型和测试阀门的内漏速率。泄漏的气体通过气体流量计计量,内漏速率换算至标准大气压。采集60个具有内漏缺陷类型标签、内漏速率标签的样本。
[0046] 工程现场实际发生内漏的阀门的直径分别为100、125、150(mm)的内漏球阀,阀前、阀后压力从0.1Mpa~2Mpa变化,气体温度从25~40℃变化,用正交试验设计法设计实验方案,选用与实验室采集时相同的设备和方法,采集20个具有内漏缺陷类型标签、内漏速率标签的样本,40个无标签的样本。
[0047] 2)将步骤(1)采集的实验数据添加到样本集R。样本集R包括标签数据样本集L、无标签数据样本集U。R中样本包含对象数据、测试数据与标签数据三类。其中对象数据包含阀门类型、阀门材质、介质相态三个属性,测试数据包括阀门尺寸、阀前压力、阀后压力、温度、介质密度、介质粘度、声发射信号数据,标签数据包括内漏缺陷类型标签、内漏速率标签,分别记为Lq、Ln。将实验中采集60个、工程现场中采集的20个具有内漏缺陷类型标签、内漏速率标签的样本添加至标签数据样本集L中;工程现场中采集的40个无标签的样本,添加至无标签数据样本集U中。
[0048] 3)提取样本集R中所有声发射信号的幅值平均值、有效值电压(RMS)、平均信号电平(ASL)、峰值频率。选用db8小波基对声发射波形流信号进行了5层小波包分解,将原始信号分解到32个子频段上,根据每个子频段能量的大小,选取31.25~46.875KHz, 46.875~62.5 KHz, 62.5~78.125 KHz, 78.125~93.75 KHz, 93.75~109.375 KHz, 109.375~125 KHz, 125~140.625 KHz, 140.625~156.25 KHz, 156.25~171.875 KHz, 171.875~187.5 KHz十个频率段的能量,子频段信号的能量计算公式如下:
[0049]
[0050] 其中,S(k t)小波包分解后每一频段的重构系数。对样本集R中的所有样本,以阀门尺寸、阀前压力、阀后压力、温度、介质密度、介质粘度;幅值平均值、有效值电压(RMS)、平均信号电平(ASL)、峰值频率以及十个子频带的能量值共20个变量为输入参数,构建120*20的输入矩阵X1。
[0051] 表1 输入矩阵X1
[0052]
[0053] 4)通过流行学习方法对输入矩阵X1中测试数据进行归一化处理及保局投影(LPP)降维,提取低维空间特征,形成低维特征空间:首先按照不同维度对输入矩阵X1进行归一化处理,得到归一化处理后的矩阵X2,然后利用保局投影算法对X2进行降维处理得到矩阵X3,其中由标签数据样本集L降维获得的样本集记为X3L,由无标签数据样本集U降维获得的样本集记为X3U。利用保局投影算法对X2进行降维处理得到矩阵X3的具体步骤如下:
[0054] 第一,首先用k最邻近结点算法计算X2中样本点xi与其他样本点xj的欧氏距离,获得与样本点xi最近邻的k个样本点。
[0055] 第二,计算X2中样本点之间的权重值。xi与近邻的k个样本点的权重值 ,xi与其他非近邻样本点的权重值为零。对X2中120个样本点依次赋权重,从而构造得出120*120的权重矩阵W。
[0056] 第三,构造对角矩阵D,
[0057]
[0058] 第四,构造拉普拉斯阵L,
[0059]
[0060] 第五,解广义特征方程,求特征向量、特征值
[0061] 求解 的解,其中,列向量为特征方程的解,按照特征值从大到小排序,构成矩阵 ,即降维过程的转移矩阵,其中,l<20,l
的值由主成分贡献的要求设定。根据书籍资料建议,在实用中,选择主贡献率≥85%。当l=7时,主贡献率≥85%。因此,降维后的维数为:l-1=7-1=6。
[0062] 第六,求解降维后的矩阵X3
[0063]
[0064] 因此最终得到120*6的低维数据矩阵X3。归一化、降维处理后的部分结果如表2所示。其中由样本集L中80个标签数据降维获得的样本集记为X3L,由样本集U中40个无标签数据降维获得的样本集记为X3U。
[0065] 表2 降维处理后的输入矩阵数据
[0066]
[0067] 5)建立阀门内漏缺陷类型支持向量分类(SVC)识别模型
[0068] 以样本集X3L 80个数据样本作为训练样本,令密封划痕缺陷的数字标签为1,球体穿孔缺陷的数字标签为2,阀门关不紧缺陷的数字标签为3。选用RBF核函数,用微粒群算法确定模型的最优参数,然后输入训练样本与内漏缺陷类型的数字标签,训练获得阀门内漏缺陷类型SVC识别模型。
[0069] 6)建立支持向量回归(SVR)阀门内漏速率计算模型。基于主动学习的方法,从降维后的无标签数据集X3U中挑选对模型影响较大的数据点,其步骤如下:
[0070] (1)将保局投影后X3L的80个低维特征样本与内漏速率标签Ln组合为B(x,y),其中x为X3L样本数据,y为对应的泄漏量标签。以B(x,y)为训练数据,选用RBF核函数,用微粒群算法确定模型的最优参数,训练得到最初的回归模型M0。
[0071] (2)利用模型M0,输入降维后的无标签数据集X3U中的数据xu,得到其对应的泄漏量预测值yu,将(xu,yu)数据添加到数据集B(x,y)中,得到新的标记样本集Bnew。利用Bnew中所有数据训练SVR模型,得到新的回归模型Mnew。然后用新模型Mnew计算原数据集B中x,获得新标签数据ynew。
[0072] (3)计算新的回归模型Mnew在数据集L上的均方根误差(RMSE),计算公式如下:
[0073]
[0074] 均方根误差值相对较大的数据,其置信度低,对模型会有更大的影响。通过对无标签数据集X3U中所有数据输入计算后,选取置信度较小的20个无内漏速率标签的数据,通过工程现场实验采集获得内漏速率标签并加入到已标记样本集L,最后利用更新后的样本集L中的100个标记数据,重新训练建立阀门内漏速率回归计算模型Mend。
[0075] 7)阀门内漏速率预测。
[0076] 按照1)2)中步骤,在工程现场采集10个具有内漏缺陷类型标签、内漏速率标签的样本,然后按照3)4)步骤进行特征提取、降维处理,最后将降维后的数据分别输入步骤4)、5)建立的阀门内漏缺陷类型识别模型与回归模型Mend,阀门内漏缺陷类型详细数据分布及最终识别精度如表3示,用Mend计算10测试样本的泄漏量值,然后计算预测值与实际测试值的平均相对误差。经计算阀门内漏速率预测的平均相对误差为13%。
[0077] 表3阀门内漏缺陷类型详细数据分布及最终识别精度
[0078]
[0079] 以上实例仅用于说明发明目的和方法过程,而非用于限定发明的范围,通过增加标记样本的数量,可以进一步提高阀门内漏缺陷识别精度与内漏速率的回归精度。