一种基于多传感器数据融合的电泵井工况诊断系统及方法转让专利

申请号 : CN202110028155.6

文献号 : CN112832999B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 檀朝东冯钢宋健马丹孙向飞

申请人 : 中国石油大学(北京)北京雅丹石油技术开发有限公司西安中控天地科技开发有限公司

摘要 :

本发明涉及一种基于多传感器数据融合的电泵井工况诊断系统,包括图版生成单元、故障诊断单元和电潜泵工况仪,其中,所述电潜泵工况仪内设置有至少两个传感器,用于采集电潜泵的实时行为数据,图版生成单元通过建立电潜泵的至少两个历史行为数据的历史特征参数和历史故障类型的映射关系而形成所述电潜泵的故障图版,电潜泵工况仪将其在电潜泵生产过程中采集到的与历史行为数据相对应的至少两个实时行为数据发送至故障诊断单元,故障诊断单元采用基于历史特征参数所建立的曲线趋势识别模型,对其处理得到的实时行为数据在设定时间窗口内的实时特征参数进行识别,分析得出当前故障类型。

权利要求 :

1.一种基于多传感器数据融合的电泵井工况诊断系统,包括图版生成单元、故障诊断单元和电潜泵工况仪,其中,所述电潜泵工况仪内设置有至少两个传感器,用于采集电潜泵的实时行为数据,其特征在于,

图版生成单元通过建立电潜泵的至少两个历史行为数据的历史特征参数和历史故障类型的映射关系而形成所述电潜泵的故障图版,电潜泵工况仪将其在电潜泵生产过程中采集到的与历史行为数据相对应的至少两个实时行为数据发送至故障诊断单元,故障诊断单元采用基于历史特征参数所建立的曲线趋势识别模型,对其处理得到的实时行为数据在设定时间窗口内的实时特征参数进行识别,诊断得出当前故障类型;

诊断系统还包括识别模型建立单元,其被配置为:对历史特征参数相关的历史数据的变化情况进行分析,选取不同的斜率变化值,建立至少一个趋势变化数据集;

将至少一个趋势变化数据集进行划分,并将划分结果作为卷积神经网络的训练集和测试集,训练得到曲线趋势识别模型;

识别模型建立单元通过对训练得到的曲线趋势识别模型的迭代次数、批量样本数、学习率、优化算法以及Dropout与否中的一个或几个进行优化分析后再将其输出;

识别模型建立单元基于选取得到的不同斜率变化值确定至少一个趋势变化特征,趋势变化特征包括稳定状态、缓慢减小、快速减小、缓慢增加、快速增加和前期稳定后期上升中的至少一个;

故障诊断单元还被配置为:

利用预处理后得到的实时特征参数相关的实时数据,选取设定时间窗口以绘制得到多参变化曲线;

根据建立的曲线趋势识别模型判别不同实时特征参数的曲线变化趋势;

综合不同实时特征参数的曲线变化趋势,利用预先建立的故障图版进行模式识别及匹配;

选择特定时间窗口内不同故障中所对应的故障概率值为最大的工况类型为当前故障类型;

故障诊断单元利用下式计算特定时间窗口内不同故障所对应的故障概率值P:其中,P为特定时间窗口内不同故障的概率值;n为特定时间窗口内不同特征参数的曲线变化趋势所匹配的个数;m为当前电泵井能够采集到的特征参数的种类数。

2.根据权利要求1所述的诊断系统,其特征在于,诊断系统还包括数据预处理单元,数据预处理单元和电潜泵工况仪之间通过地面记录仪通信连接,在所述故障诊断单元的时间戳触发设定时间窗口的情况下,所述地面记录仪将其基于实时行为数据确定的实时特征参数相关的多传感器数据发送至所述数据预处理单元。

3.根据权利要求2所述的诊断系统,其特征在于,数据预处理单元通过地面记录仪可获取到至少一个特征参数相关的多传感器数据,对多传感器数据进行预处理以去除数据中毛刺、突减和缺失的异常情况,并进行归一化处理。

4.根据权利要求1所述的诊断系统,其特征在于,电潜泵工况仪采集的行为数据包括电潜泵相关的电机电流、电机温度、频率、电压、入口压力、出口压力、压差、入口温度、井口温度、油压和流量中的至少两种。

5.一种基于多传感器数据融合的电泵井工况诊断方法,其特征在于,所述诊断方法至少包括以下步骤:

基于电潜泵的至少两个历史行为数据的历史特征参数和历史故障类型的映射关系,建立电潜泵的故障图版;

对历史特征参数相关的历史数据的变化情况进行分析,选取不同的斜率变化值,建立至少一个趋势变化数据集;

将至少一个趋势变化数据集进行划分,并将划分结果作为卷积神经网络的训练集和测试集,训练得到曲线趋势识别模型;

采集在电潜泵生产过程中与历史行为数据相对应的至少两个实时行为数据;

基于历史特征参数所建立的曲线趋势识别模型,对其处理得到的实时行为数据在设定时间窗口内的实时特征参数进行识别,诊断得出当前故障类型;

所述诊断方法至少还包括以下步骤:对历史特征参数相关的历史数据的变化情况进行分析,选取不同的斜率变化值,建立至少一个趋势变化数据集;

将至少一个趋势变化数据集进行划分,并将划分结果作为卷积神经网络的训练集和测试集,训练得到曲线趋势识别模型;

识别模型建立单元通过对训练得到的曲线趋势识别模型的迭代次数、批量样本数、学习率、优化算法以及Dropout与否中的一个或几个进行优化分析后再将其输出;

识别模型建立单元基于选取得到的不同斜率变化值确定至少一个趋势变化特征,趋势变化特征包括稳定状态、缓慢减小、快速减小、缓慢增加、快速增加和前期稳定后期上升中的至少一个;

利用预处理后得到的实时特征参数相关的实时数据,选取设定时间窗口以绘制得到多参变化曲线;

根据建立的曲线趋势识别模型判别不同实时特征参数的曲线变化趋势;

综合不同实时特征参数的曲线变化趋势,利用预先建立的故障图版进行模式识别及匹配;

选择特定时间窗口内不同故障中所对应的故障概率值为最大的工况类型为当前故障类型;

故障诊断单元利用下式计算特定时间窗口内不同故障所对应的故障概率值P:其中,P为特定时间窗口内不同故障的概率值;n为特定时间窗口内不同特征参数的曲线变化趋势所匹配的个数;m为当前电泵井能够采集到的特征参数的种类数。

说明书 :

一种基于多传感器数据融合的电泵井工况诊断系统及方法

技术领域

[0001] 本发明涉及油田智慧诊断技术领域,尤其涉及一种基于多传感器数据融合的电泵井工况诊断系统及方法。

背景技术

[0002] 电潜泵工况仪是电潜泵技术发展的产物,又称为井下传感器。其在工作时连接至电潜泵机组,用于至少采集:泵吸入温度、电机绕组温度、泵吸入口压力、泵排出口压力、泄
漏电流和电机振动,并通过电潜泵动力电缆以电信号的形式将数据传输至地面记录仪,实
现泵工况数据的实时记录和监控,为电潜泵井动态分析和故障诊断提供必要的原始参数。
[0003] 随着电潜泵在油田的应用越来越多,由于电潜泵机组具有零部件多且相互关联的结构特性,再加上其本身运动复杂、工作环境恶劣、油井和井液条件复杂多变等因素,使得
电潜泵在其使用过程中综合故障率较高,寿命较短。电潜泵机组一旦出现故障,不仅需要提
机维修,花费大量的作业费和修理费,而且大多数故障会造成油层工作失调,给油田的开发
带来经济和时间上的损失,严重影响油井的正常生产。因此,开展电泵井故障实时诊断方法
研究具有非常重要的意义,可以及时准确地判断电泵井的工作状况,保证电泵井的运转时
间,降低维修费用,提高设备利用率。
[0004] 例如,公开号为CN105781527A的中国专利公开的一种电潜泵井工况仪参数诊断分析方法。其包括:绘制典型的电潜泵井故障类型的参数曲线版图;通过工况仪采集到泵吸入
口温度、电机绕组温度、泵吸入口压力、泵排出口压力、泄漏电流和电机振动频率六组参数;
然后再通过记录仪进行泵工况数据的实时记录和监控;当电潜泵井出现故障时,通过工况
仪所获取的参数曲线与参数曲线图版进行比对后确定故障类型。
[0005] 又例如,于2012年11月发表在《石油钻采工艺》第34卷第6期的题为电潜泵工况仪参数应用实践的研究绘制了10种电潜泵井典型故障时工况仪参数变化示意图,通过将该变
化示意图与实际工况参数进行比较,对电潜泵井进行动态分析和故障诊断。其中,电潜泵井
典型的故障类型有:生产管柱漏失、电潜泵机组在调频过程中存在共振区、电潜泵抽空电机
烧毁、投产时生产管线存在节流、泵磨损/泵吸入口堵塞、气体影响、气锁、泵轴断、机组振动
加剧面临躺井和泄漏电流加剧面临躺井。
[0006] 目前,从国内外电潜泵故障诊断技术发展的现状来看,电泵工况诊断方法仅仅考虑了某一项或某几项主要影响因素,尤其是对于多参数实时电泵伴侣数据所进行的研究更
少,其故障分析的结果带有一定的片面性和局限性,同时由于缺乏具体的现场应用数据,所
得到的故障分析结果也缺乏系统性和实用性。
[0007] 此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于申请人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝
非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申
请人保留在背景技术中增加相关现有技术之权利。

发明内容

[0008] 针对现有技术之不足,本发明提供了一种基于多传感器数据融合的电泵井工况诊断系统,包括图版生成单元、故障诊断单元和电潜泵工况仪,其中,所述电潜泵工况仪内设
置有至少两个传感器,用于采集电潜泵的实时行为数据,图版生成单元通过建立电潜泵的
至少两个历史行为数据的历史特征参数和历史故障类型的映射关系而形成所述电潜泵的
故障图版,电潜泵工况仪将其在电潜泵生产过程中采集到的与历史行为数据相对应的至少
两个实时行为数据发送至故障诊断单元,故障诊断单元采用基于历史特征参数所建立的曲
线趋势识别模型,对其处理得到的实时行为数据在设定时间窗口内的实时特征参数进行识
别,诊断得出当前故障类型。
[0009] 随着电泵井生产状态监测技术的蓬勃发展,现场实时采集的电泵井生产参数越来越多,例如:油压、运行频率、电压、电流、产液量的井口数据;泵入口温度、电机温度、泵入口
压力、泵出口压力、机组X轴、Y轴、Z轴振动加速度和漏电电流的井下电泵伴侣数据。相对于
传统的单参数分析诊断方法,合理的综合运用多参数据能够比较准确的反映油井生产状
况,也对电泵井生产工况诊断至关重要。基于此,本申请提出了一种基于多传感器数据融合
的电泵井工况诊断系统及方法,通过对电泵井典型工况下不同特征参数变化情况进行分
析,归纳总结出不同工况对应参数的趋势变化规则图版,建立不同趋势曲线数据集,并利用
卷积神经网络对趋势曲线进行识别优化,从而可结合趋势变化规则图版对现场实例工况进
行分析,实现对电泵井工况的诊断。
[0010] 根据一种优选实施方式,诊断系统还包括识别模型建立单元,其被配置为:对历史特征参数相关的历史数据的变化情况进行分析,选取不同的斜率变化值,建立至少一个趋
势变化数据集;将至少一个趋势变化数据集进行划分,并将划分结果作为卷积神经网络的
训练集和测试集,训练得到曲线趋势识别模型。
[0011] 根据一种优选实施方式,识别模型建立单元通过对训练得到的曲线趋势识别模型的迭代次数、批量样本数、学习率、优化算法以及Dropout与否中的一个或几个进行优化分
析后再将其输出。
[0012] 根据一种优选实施方式,识别模型建立单元基于选取得到的不同斜率变化值确定至少一个趋势变化特征,趋势变化特征包括稳定状态、缓慢减小、快速减小、缓慢增加、快速
增加和前期稳定后期上升中的至少一个。
[0013] 根据一种优选实施方式,诊断系统还包括数据预处理单元,数据预处理单元和电潜泵工况仪之间通过地面记录仪通信连接,在所述故障诊断单元的时间戳触发设定时间窗
口的情况下,所述地面记录仪将其基于实时行为数据确定的实时特征参数相关的多传感器
数据发送至所述数据预处理单元。
[0014] 根据一种优选实施方式,数据预处理单元通过地面记录仪可获取到至少一个特征参数相关的多传感器数据,对多传感器数据进行预处理以去除数据中毛刺、突减和缺失的
异常情况,并进行归一化处理。
[0015] 根据一种优选实施方式,故障诊断单元还被配置为:利用预处理后得到的实时特征参数相关的实时数据,选取设定时间窗口以绘制得到多参变化曲线;根据建立的曲线趋
势识别模型判别不同实时特征参数的曲线变化趋势;综合不同实时特征参数的曲线变化趋
势,利用预先建立的故障图版进行模式识别及匹配;选择特定时间窗口内不同故障中所对
应的故障概率值为最大的工况类型为当前故障类型。
[0016] 根据一种优选实施方式,故障诊断单元利用下式计算特定时间窗口内不同故障所对应的故障概率值P: 其中,P为特定时间窗口内不同故障的概率值;n为特定时间
窗口内不同特征参数的曲线变化趋势所匹配的个数;m为当前电泵井能够采集到的特征参
数的种类数。
[0017] 根据一种优选实施方式,电潜泵工况仪采集的行为数据包括电潜泵相关的电机电流、电机温度、频率、电压、入口压力、出口压力、压差、入口温度、井口温度、油压和流量中的
至少两种。
[0018] 本申请还提出了一种基于多传感器数据融合的电泵井工况诊断方法,所述诊断方法至少包括以下步骤:基于电潜泵的至少两个历史行为数据的历史特征参数和历史故障类
型的映射关系,建立电潜泵的故障图版;对历史特征参数相关的历史数据的变化情况进行
分析,选取不同的斜率变化值,建立至少一个趋势变化数据集;将至少一个趋势变化数据集
进行划分,并将划分结果作为卷积神经网络的训练集和测试集,训练得到曲线趋势识别模
型;采集在电潜泵生产过程中与历史行为数据相对应的至少两个实时行为数据;基于历史
特征参数所建立的曲线趋势识别模型,对其处理得到的实时行为数据在设定时间窗口内的
实时特征参数进行识别,诊断得出当前故障类型。
[0019] 该诊断系统可以即为诊断仪,其中包括中央处理模块、分别与中央处理模块相连的通信单元、数据预处理单元、图版生成单元、识别模型建立单元和故障诊断单元。中央处
理模块通过通信单元与地面记录仪相连。地面记录仪将其得出的与电潜泵工况相关的多传
感数据传输至中央处理模块进行处理。本申请所提出的诊断方法中的可执行语句可以是由
单个或两个及以上的上述单元所完成,单个单元可以对应完成上述一条或两条及以上的可
执行语句。例如,图版生成单元被配置为基于电潜泵的至少两个历史行为数据的历史特征
参数和历史故障类型的映射关系,建立电潜泵的故障图版。

附图说明

[0020] 图1是本发明中得到的正常工况下的多参曲线图;
[0021] 图2是本申请中得到的井口关井工况下的多参曲线图;
[0022] 图3是本申请中得到的油管漏失工况下的多参曲线图;
[0023] 图4是本申请中得到的泵堵塞工况下的多参曲线图;
[0024] 图5是本申请中得到的轴断脱工况下的多参曲线图;
[0025] 图6是本申请中得到的泵磨损工况下的多参曲线图;
[0026] 图7是本申请中得到的气体影响工况下的多参曲线图;
[0027] 图8是本申请中得到的电泵井生产典型工况规则图版表;
[0028] 图9是本申请中得到的与稳定状态特征对应的部分数据集示意图;
[0029] 图10是本申请中得到的与缓慢增加特征对应的部分数据集示意图;
[0030] 图11是本申请中得到的与快速增加特征对应的部分数据集示意图;
[0031] 图12是本申请中得到的与缓慢减小特征对应的部分数据集示意图;
[0032] 图13是本申请中得到的与快速减小特征对应的部分数据集示意图;
[0033] 图14是本申请中得到的与前期稳定后期上升特征对应的部分数据集示意图;
[0034] 图15是本申请中得到的随迭代次数变化的准确率变化曲线图;
[0035] 图16是本申请中得到的随迭代次数变化的损失值变化曲线图;
[0036] 图17是本申请中得到的不同批量样本数准确率变化图;
[0037] 图18是本申请中得到的不同批量样本数损失值变化图;
[0038] 图19是本申请中得到的不同批量样本数运行时间和损失值对比图;
[0039] 图20是本申请中得到的随迭代次数变化的不同学习率准确率变化图;
[0040] 图21是本申请中得到的随迭代次数变化的不同学习率损失值变化图;
[0041] 图22是本申请中得到的随迭代次数变化的不同优化算法准确率变化图;
[0042] 图23是本申请中得到的不同优化算法准确率与损失值对照表;
[0043] 图24是本申请中得到的是否添加Dropout准确率变化对比图;
[0044] 图25是本申请中得到的是否添加Dropout损失值变化对比图;
[0045] 图26是本申请中步骤S3.2对应的多参曲线工况诊断流程图;
[0046] 图27是本申请中实施例1对应的多参曲线数据图;
[0047] 图28是本申请中实施例1对应的不同时间窗口诊断情况表;
[0048] 图29是本申请中实施例2中井的部分现场实测数据。

具体实施方式

[0049] 下面结合附图对本申请进行详细说明。
[0050] 随着电泵井生产状态监测技术的蓬勃发展,现场实时采集的电泵井生产参数越来越多,例如:油压、运行频率、电压、电流、产液量的井口数据;泵入口温度、电机温度、泵入口
压力、泵出口压力、机组X轴、Y轴、Z轴振动加速度和漏电电流的井下电泵伴侣数据。相对于
传统的单参数分析诊断方法,合理的综合运用多参数据能够比较准确的反映油井生产状
况,也对电泵井生产工况诊断至关重要。基于此,本申请提出了一种基于多传感器数据融合
的电泵井工况诊断系统及方法,通过对电泵井典型工况下不同特征参数变化情况进行分
析,归纳总结出不同工况对应参数的趋势变化规则图版,建立不同趋势曲线数据集,并利用
卷积神经网络对趋势曲线进行识别优化,从而可结合趋势变化规则图版对现场实例工况进
行分析,实现对电泵井工况的实时诊断。
[0051] 在电泵采油过程中,由于工作环境的温度、压力较高,抽汲的液体中含气和含砂量较大,再加上电泵自身的结构比较复杂,其工作性能受到多方面的因素影响,经常会发生各
种故障,使得电泵的故障呈现出多样性、多态性。从现场电泵的使用情况来看,其故障主要
表现为轴断脱、油管漏失、泵堵塞、射孔孔眼堵、含水上升、井口关井、油藏压力上升、气体影
响、泵磨损、频率上升、油嘴刺大、泵反转、油管堵塞。
[0052] 如下以部分典型工况在电泵机组工作参数上的变化情况示例说明。部分典型工况在电泵机组工作参数上的变化情况如图1至图7所示,其中,图2至图7中图中多条曲线在起
始范围内彼此对应一致,即从图1中对各曲线的文字标识(不同参数所对应的曲线)同时同
步地适用于图2至图7,为利于便于区别图中曲线走势就未再累赘地在图2至图7中文字标
识。即,参考图1中已标出的在起始范围内(时间0~10)的曲线与不同参数之间的对应关系,
可以确定图2至图7中不同曲线所分别对应的参数。
[0053] (1)正常工作
[0054] 油井正常工作时,机组工作参数上各项参数几乎都在稳定值运行,偶尔出现较小的波动变化,但上下波动值都在正常波动范围之内,如图1所示。
[0055] (2)井口关井
[0056] 油井关井后地层流体在生产压差的作用下继续向井筒内涌入,引起井筒井底压力增加,泵入口压力和出口压力上升,进而使得井口油压增大,其不同参数变化情况如图2所
示。
[0057] (3)油管漏失
[0058] 电泵生产过程中油管受井液腐蚀严重造成穿孔将会导致漏失。油管漏失在机组工作参数上主要表现为产量下降,造成供排不协调导致泵吸入口压力增加,而泵工作正常,受
到吸入口压力增加的影响,负载小幅降低,电流会小幅度波动下降,其不同参数变化情况如
图3所示。
[0059] (4)泵堵塞
[0060] 当电泵生产过程中出现油井结蜡、出砂、井液中含有杂质等,会造成泵叶轮或吸入口发生堵塞,导致机组系统载荷将增大,入口压力会上升但出口压力下降,举升液体降低,
致使泵排量明显降低,泵效变低,系统运行电流小于额定电流,但不会发生停机状况,其不
同参数变化情况如图4所示。
[0061] (5)轴断脱
[0062] 当电泵机组运行过程出现泵轴断脱时,工作电流急剧降低,欠载后立即停机。泵轴断在机组工作参数上主要表现为泵排量很低,载荷由正常迅速增大,然后突然降低到空载,
井口排量急剧下降到自喷产量,井口压力很低,泵出口压力急速下降,泵的转速很低,电机
温度会出现先平后升现象,其不同参数变化情况如图5所示。
[0063] (6)泵磨损
[0064] 当井液含砂量较高或者含有较多的腐蚀性物质且机组使用时间过长时,泵的止推轴承或叶轮等部件将会发生磨损,发生磨损这种故障时,最先磨损的是叶轮的下裙部,进而
造成整个叶轮偏磨加剧,最后造成叶轮轮毂磨损断裂甚至是叶轮穿透,同时由于叶轮高速
旋转时的摆动同样会对泵轴产生磨损,导致系统电流低于额定电流,但不会导致电机停机,
泵的排量低于其合理排量,泵效不高,振动将会加剧,其不同参数变化情况如图6所示。
[0065] (7)气体影响
[0066] 在油井生产过程中,当井液含气量较大、选泵较大造成泵挂深度较低、油井供液不足都会造成气体影响。当油井出现气体影响时,泵吸入口的油气比较大,井口排量低于额定
排量,产气量增大,井口温度下降,工作电流有规律地长期波动。当气体影响严重时,将会导
致气锁发生,此时机组工作参数主要表现为油气比很大,产液量很低,产气量很大,动液面
低并逐渐接近泵吸入口,导致泵入口压力上升出口压力下降、工作电流逐渐降低,并出现电
流波动,最终欠载停机。气体影响多参数情况如图7所示。
[0067] 通过对电泵井部分典型工况特征参数变化分析,并结合国内外油田及石油公司的故障诊断调研分析,归纳总结得出电泵井生产中13种不同故障的特征参数变化规则图版,
如图8中竖轴所示,为工况诊断提供了理论分析依据。图8中,“→”代表稳定状态;“↘”代表
缓慢减小;“↓”代表快速减小;“↗”代表缓慢增加;“↑”代表快速增加;“__↗”代表前期稳定
后期上升。
[0068] 典型工况下不同参数的变化在特定时间窗口内具有6类不同趋势变化特征,分别为稳定状态(“→”)、缓慢减小(“↘”)、快速减小(“↓”)、缓慢增加(“↗”)、快速增加(“↑”)和
前期稳定后期上升(“__↗”)。
[0069] 通过对不同趋势的变化情况进行分析,选取不同的斜率变化值,建立不同趋势变化数据集。采用卷积神经网络对建立的趋势变化数据集进行识别并优化分析,从而为多参
工况诊断提供趋势变化判别依据。
[0070] S1:趋势变化数据集的建立。
[0071] 综合分析典型工况下的特征参数曲线趋势特征,定义以下6类趋势变化特征:
[0072] (1)稳定状态
[0073] 在一定时间窗口内,特征参数基本稳定在0附近,且斜率变化在[‑0.2,0.2]之内,即:‑0.2≤k≤0.2。其中,k为特定时间窗口内的斜率变化值。图9示出了与稳定状态变化特
征对应的部分数据集示意图。
[0074] (2)缓慢增加
[0075] 在一定时间窗口内,特征参数斜率变化在(0.2,0.6]之内,即:0.2<k≤0.6。图10示出了与缓慢增加变化特征对应的部分数据集示意图。
[0076] (3)快速增加
[0077] 在一定时间窗口内,特征参数斜率变化在(0.6,1.0]之内,即:0.6<k≤1.0。图11示出了与快速增加变化特征对应的部分数据集示意图。
[0078] (4)缓慢减小
[0079] 在一定时间窗口内,特征参数斜率变化在[‑0.6,‑0.2)之内,即:‑0.6≤k<‑0.2。图12示出了与缓慢减小变化特征对应的部分数据集示意图。
[0080] (5)快速减小
[0081] 在一定时间窗口内,特征参数斜率变化在[‑1.0,‑0.6)之内,即:‑1.0≤k<‑0.6。图13示出了与缓慢减小变化特征对应的部分数据集示意图。
[0082] (6)前期稳定后期上升
[0083] 在一定时间窗口内,特征参数前期基本稳定在0附近,斜率变化在[0,0.2]之内,即:0≤k1≤0.2;后期数据值增大斜率变化在(0.2,0.6]之内,即:0.2<k2≤0.6。图14示出了
与前期稳定后期上升变化特征对应的部分数据集示意图。
[0084] S2:曲线趋势识别模型的建立及优化。
[0085] 以选取不同的斜率变化特征,建立不同趋势变化数据集各200张为例,6类趋势变化特征汇总的趋势变化数据集有1200张。
[0086] 以4:1的比例将不同趋势曲线数据集划分为训练集和测试集。为了保证数据的随机性,利用Numpy库中random.shuffle的方法将训练集和测试集进行随机打乱操作。最终得
到960个训练集,240个测试集。
[0087] 将随机打乱后的训练集作为输入层,6类不同趋势变化特征的概率值为输出值,采用卷积神经网络对不同趋势曲线进行识别,并对曲线识别模型的迭代次数、批量样本数、学
习率、不同优化算法和是否进行Dropout进行优化分析。
[0088] S2.1:迭代次数的优化分析。
[0089] 设定初始批量样本数batch_size=8,学习率lr=0.01,随机失活率dropout=0.5,得到迭代次数与准确率和损失值的变化曲线,其结果如图15和图16所示。
[0090] 结合图15和图16可以看出:迭代次数越多模型拟合得越好,损失值越小,相应迭代次数越多时间越长,所以在相对高效的情况下选取收敛区的迭代次数。根据对上述数据分
析,曲线识别模型从迭代110次左右的时候开始收敛,为了考虑设备性能,减少运算时间,因
此后续优化工作选取次数epoch=120。
[0091] S2.2:批量样本数的优化分析。
[0092] 由于多参曲线样本过多不能每张图像训练一次,因此将所有样本分成若干组,每组单独训练。在迭代次数120次的情况下,每组分别选取4张、8张、16张多参曲线图训练一
次,得到测试后的准确率和损失值变化曲线,如图17和图18所示。图中BATCH_SIZE即为一次
训练所抓取的数据样本数量,或称批量样本数。
[0093] 综合图17~19的实验结果可以分析出,批量样本数为4和8时,其训练准确率相差不大,但批量样本数为4时,其运行时间是批量样本数为8的2倍多,而批量样本数为16时,引
起训练结果准确率较低,测试集准确率不断震荡,拟合程度低。再结合图19从时间效率上来
考虑,本申请中网络模型的批量样本数取为8。
[0094] S2.3:学习率对网络模型的影响分析。
[0095] 根据前述模型的选择,分别将学习率lr设置为0.5、0.1、0.01,分别训练卷积神经网络模型120次,其准确率和损失值变化曲线如图20和图21所示。
[0096] 综合对图20和图21中不同学习率准确率和损失值变化曲线的分析,当学习率lr=0.1时,网络模型在迭代次数为70次左右已经开始收敛,稳定性也最好,拟合效果也是最好。
当学习率lr=0.5和lr=0.01时,收敛速度缓慢,准确率也低于学习率lr=0.01,损失值较
大。因此,本申请中网络模型选择lr=0.01作为学习率。
[0097] S2.4:优化算法的选择。
[0098] 卷积神经网络在计算时,为了能够得到最佳的运行结果,本申请将采用SGD、AdaGrad、RMSProp、Adam四种不同优化算法进行对比寻优。根据上节上述对学习率的优化寻
优后,发现当学习率lr=0.01时,在70次左右就已经开始收敛。基于此,设定迭代次数epoch
=80,批量样本数batch_size=8,学习率lr=0.01,并得到四种不同优化算法的准确率变
化曲线如图22所示。
[0099] 综合图22和23可知,四种优化算法迭代80次后,Adam优化算法的平均准确率最高达到了87.84%;其次为RMSProp算法,平均准确率为81.8%,但该算法收敛速度最快,模型
损失值最低;SGD和AdaGrad优化算法的最终收敛准确率相差不大,分别为77.90%和
77.07%,且其损失值相对较高。由此可知,选择合适的优化算法可以加快模型训练,且相比
于其他优化算法可以提高模型诊断准确率。因此,本申请选择Adam算法作为模型训练的优
化算法。与此同时,Adam优化器实现较为简单,计算效率高,并且是所有优化器中对内存要
求最低的,同时拥有稳定的梯度更新和解释性良好的超参数,更适用于大规模数据及参数
计算的场景,因此综合来看,Adam优化器效果强于SGD和AdaGrad,同时相比RMSprop有着不
可替代优势,适用于本申请多参曲线模型优化。为便于理解进行以下说明,在图23对深度学
习优化算法的参数经验设置中,momentum表示动量参数,大或等于0的浮点数;decay表示每
次更新后的学习率衰减值,大或等于0的浮点数;nesterov表示布尔值,确定是否使用
Nesterov动量;epsilon表示维持数值稳定性的浮点型值;rho表示RMSProp梯度平方的移动
均值的衰减率,float≥0;beta_1/beta_2为浮点型值,通常接近于1,0布尔型(逻辑型)数据类型。
[0100] S2.5:模型结构优化。
[0101] 虽然本申请初始在每个卷积层加上Dropout操作,但为能够提升模型的精度,加快模型的收敛,解决过拟合的问题,本申请在上述已有模型参数和优化算法的基础上,去掉每
层的Dropout,对比分析拥有Dropout是否对本申请所提出的网络模型优化有益。
[0102] 根据前面优化设定迭代次数epoch=120,批量样本数batch_size=8,学习率lr=0.01,优化算法使用Adam,得到添加Dropout前后准确率和损失值变化曲线如图24所示。
[0103] 由图25可以看到,在不添加Dropout时,模型训练过程损失值在迭代的过程中有稍微的上升情况发生,这表示模型在训练的过程中可能出现了过拟合现象模型,通过增加
Dropout,模型训练过程中损失值没有出现上升情况,总体呈下降趋势,损失值变化相对稳
定。再结合图24可知,模型的准确率从80.40%提高到了87.84%,损失值从3.004降低到了
1.425,以此使网络取得更好的参数,防止了过拟合,还使模型具有更好的融合效果。
[0104] 至此,综合上述对利用卷积神经网络对曲线趋势识别模型的优化分析,选取迭代次数epoch=80次,批量样本数batch_size=8,学习率lr=0.1,优化算法Adam,在卷积层加
上Dropout(初始失活率为0.5)操作得到最终的曲线趋势识别模型。
[0105] S3:基于多参曲线的工况诊断分析。
[0106] S3.1:数据预处理。
[0107] 电泵井多参工况诊断过程中,为了能够表现出不同工况特征参数的变化情况,及时侦查到故障的发生状况,根据电泵井状态监测的m种不同特征参数的实时数据,通过对多
传感器数据进行预处理,去除数据中毛刺、突减和缺失的异常情况,并进行归一化处理。
[0108] S3.2:工况诊断分析。
[0109] 利用预处理后的m种不同特征参数的实时数据,选取特定的时间窗口绘制成多参变化曲线;
[0110] 根据建立的曲线趋势识别模型判别当前不同特征参数的曲线变化趋势;
[0111] 结合多参曲线规则图版,综合不同特征参数的变化情况进行模式匹配;
[0112] 不同特征参数趋势匹配的个数为n,计算特定时间窗口内不同故障的概率值,并选择最大故障概率值P所对应的工况类型为当前故障类型。
[0113] 利用下式计算特定时间窗口内不同故障的概率值P:
[0114]
[0115] 式中:P为特定时间窗口内不同故障的概率值;n为特定时间窗口内不同特征参数趋势匹配的个数;m为当前电泵井能够采集到的特征参数种类数。
[0116] 上述多参工况诊断流程可参见图26所示。
[0117] 实施例1
[0118] 本实施例以某作业区实测1号井实时数据为例,该井实时数据每30s保存一次,2019年5月11日该井气体分离器轴从底部断裂,断脱部分卡在联轴器上,选取该井发生故障
2.5个小时的历史数据,得到的数据如图27所示。将得到实时的泵入口压力、泵出口压力、泵
入口温度、电机温度、电流、电压、频率、油压数据和计算的泵压差数据进行预处理,以该井
14时20分为诊断时间点,选取30min、20min和10min为时间窗口进行特征处理绘制成不同特
征参数变化趋势曲线,运用本申请建立的曲线趋势识别模型进行分析并结合图8典型工况
规则图版进行诊断,其不同时间窗口的诊断结果如图28所示。
[0119] 结合图27和图28可以发现时间窗口越小,对于不同工况的参数趋势差异变化诊断不准确,工况类型不明确,导致最终结果错误,例如电机温度,在发生故障前10min,其一直
处于上升状态,与实际故障趋势不匹配,导致诊断误判;如果时间窗口越大,故障诊断的结
果越准确,对于工况参数趋势变化判别更加全面,但不能及时发现故障,影响油井产量,例
如时间窗口选取20min时已经能够准确发现轴断故障,因此对于时间窗口的确定对于油井
正常生产至关重要,在现场实际应用中,应根据大数据规律确定合适的时间窗口进行电泵
诊断。
[0120] 实施例2
[0121] 以某作业区实测3号井实时数据为例,该井可实时采集电泵生产过程中的频率、电压、电流、泵入口压力、泵出口压力、电机温度、流体温度、回压、油压、回温,且1min保存一
次,其在2019年11月2日和3日的部分实时数据如图29所示,根据得到的数据,发现在3日8时
33分电流、电压、电机温度、流体温度都突然降为0,将其归为异常数据,直接剔除;在3日4时
03分该井的泵入口压力急速下降、泵出口压力增加,导致泵入口压力与出口压力几乎相同,
其他参数也相应发生变化。选取该井15时整为诊断时间点,30min为时间间隔,利用本申请
建立的多参曲线诊断理论进行工况分析,其诊断流程与实施例1相似,诊断结果为油管漏
失,根据检修报告发现该井的实际情况为管柱中油管公扣段丝扣磨损严重、油管连接不严。
结合实施例1的诊断结果,表明多参曲线诊断模型对于电泵井现场应用具有一定的使用价
值,也为电泵井的工况诊断开辟了一种新方法。
[0122] 需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发
明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非
构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。本发明说明书包
含多项发明构思,诸如“优选地”、“根据一个优选实施方式”或“可选地”均表示相应段落公
开了一个独立的构思,申请人保留根据每项发明构思提出分案申请的权利。