基于油浸式套管气体检测的套管故障检测方法和装置转让专利

申请号 : CN202211660424.1

文献号 : CN115639327B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李鹏景茂恒樊小鹏田兵徐振恒谭则杰陈仁泽李立浧姚森敬韦杰

申请人 : 南方电网数字电网研究院有限公司

摘要 :

本申请涉及一种基于油浸式套管气体检测的套管故障检测方法和装置。所述方法包括:获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据,在气体浓度数据满足故障条件的情况下,将气体浓度数据对应的套管区域确定为可疑故障区域,将可疑故障区域对应的气体浓度数据输入目标决策树模型,得到气体浓度数据对应的故障类型识别结果和故障区域识别结果,比较可疑故障区域和故障区域识别结果所表征的故障区域,确定油浸式套管的目标故障识别结果。采用本方法能够利用气体检测传感探头准确且高效地检测套管各区域的气体浓度数据,通过气体浓度数据精确确定故障区域,实现对套管故障类型和故障区域的准确识别,提高套管故障检测的准确度。

权利要求 :

1.一种基于油浸式套管气体检测的套管故障检测方法,其特征在于,所述方法包括:获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据;所述气体检测传感探头设有用于通过气体的纳米级微孔;

在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;

将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到故障类型识别结果和故障区域识别结果;

比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。

2.根据权利要求1所述的方法,其特征在于,所述在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域,包括:获取针对所述套管区域的气体类型的气体浓度阈值;

在所述气体浓度数据大于所述气体浓度阈值的情况下,确定所述气体浓度数据对应的套管区域为所述可疑故障区域。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取样本数据集,根据所述样本数据集中的训练数据集,构建初始决策树模型;

对所述初始决策树模型进行剪枝处理,得到剪枝决策树模型;

利用所述样本数据集中的测试数据集,对所述剪枝决策树模型进行测试,得到所述剪枝决策树模型对应的测试结果;

在所述测试结果指示所述剪枝决策树模型通过测试的情况下,确定所述剪枝决策树模型为所述目标决策树模型。

4.根据权利要求3所述的方法,其特征在于,所述训练数据集包括多个特征量;所述特征量为根据三比值法确定得到的;所述根据所述样本数据集中的训练数据集,构建初始决策树模型,包括:确定所述训练数据集中的各特征量对所述训练数据集的信息增益比;

根据各所述特征量对应的信息增益比,确定目标特征量;

根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点;

去除所述多个特征量中的所述目标特征量,得到新的多个特征量;

返回执行所述确定各所述特征量对所述训练数据集的信息增益比的步骤,直至得到所述初始决策树模型。

5.根据权利要求4所述的方法,其特征在于,所述根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点,包括:当所述目标特征量对应的信息增益比为0,将训练数据集中占比最多的故障类型作为单结点对应的类,构成所述初始决策树模型。

6.根据权利要求4所述的方法,其特征在于,所述根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点,还包括:当所述目标特征量对应的信息增益比不为0,将所述训练数据集分为多个非空子集,得到划分后的多个子节点对应的数据集;

将每个子节点对应的数据集中占比最多的故障类型作为相应子节点对应的类,构成所述初始决策树模型。

7.一种基于油浸式套管气体检测的套管故障检测系统,其特征在于,所述系统包括:固体激光器、光谱检测单元、光开关、传感探头和计算机设备;所述光谱检测单元分别与所述固体激光器、所述计算机设备和所述光开关连接,所述计算机设备通过所述光开关与所述传感探头连接;其中:所述固体激光器,用于经所述光谱检测单元向所述光开关发送宽带光;

所述光开关,用于使所述固体激光器发送的宽带光进入所述传感探头;

所述传感探头,设有用于通过气体的纳米级微孔,放置于油浸式套管内各区域,用于返回散射光至所述光谱检测单元;所述散射光为所述宽带光与所述传感探头中的气体相互作用后产生的;

所述光谱检测单元,用于接收和分析所述传感探头返回的散射光,得到光谱检测数据;

所述计算机设备,用于根据所述光谱检测数据,获取油浸式套管内各区域的气体浓度数据;

所述计算机设备,还用于在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;

所述计算机设备,还用于将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到故障类型识别结果和故障区域识别结果;

所述计算机设备,还用于比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。

8.一种基于油浸式套管气体检测的套管故障检测装置,其特征在于,所述装置包括:获取模块,用于获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据;所述气体检测传感探头设有用于通过气体的纳米级微孔;

确定模块,用于在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;

识别模块,用于将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到故障类型识别结果和故障区域识别结果;

对比模块,用于比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

说明书 :

基于油浸式套管气体检测的套管故障检测方法和装置

技术领域

[0001] 本申请涉及光学传感系统技术领域,特别是涉及一种基于油浸式套管气体检测的套管故障检测方法、系统、装置、计算机设备、存储介质和计算机程序产品。

背景技术

[0002] 变压器套管作为送变电设备的重要组成部分,其内部由于绝缘受潮等原因会发生局部放电、异常升温等故障,进而导致套管绝缘老化劣化,严重时甚至将造成击穿绝缘,影响电力系统的安全稳定运行。目前国内外高电压、大容量电力变压器多采用油浸式绝缘套管,对油浸式绝缘套管进行油中溶解气体分析是对套管进行故障诊断、实现提前预警的首要方法之一。
[0003] 目前针对油浸式套管的油中溶解气体检测方法主要为油色谱法,然而,油色谱法对故障气体进行取样时,由于故障气体从产生到溶解至油中并扩散至取油口需要耗费数小时,检测周期较长,另外,油色谱法根据故障气体浓度判定故障时,无法根据故障特征精确判断故障状态,不利于提高套管故障检测的准确度。

发明内容

[0004] 基于此,有必要针对上述技术问题,提供一种能够提高套管故障检测准确度的基于油浸式套管气体检测的套管故障检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005] 第一方面,本申请提供了一种基于油浸式套管气体检测的套管故障检测方法,所述方法包括:
[0006] 获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据;所述气体检测传感探头设有用于通过气体的纳米级微孔;
[0007] 在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;
[0008] 将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果;
[0009] 比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。
[0010] 在其中一个实施例中,所述在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域,包括:
[0011] 获取针对所述套管区域的气体类型的气体浓度阈值;
[0012] 在所述气体浓度数据大于预设的气体浓度阈值的情况下,确定所述气体浓度数据对应的套管区域为所述可疑故障区域。
[0013] 在其中一个实施例中,所述方法还包括:
[0014] 获取样本数据集,根据所述样本数据集中的训练数据集,构建初始决策树模型;
[0015] 对所述初始决策树模型进行剪枝处理,得到剪枝决策树模型;
[0016] 利用所述样本数据集中的测试数据集,对所述剪枝决策树模型进行测试,得到所述剪枝决策树模型对应的测试结果;
[0017] 在所述测试结果指示所述剪枝决策树模型通过测试的情况下,确定所述剪枝决策树模型为所述目标决策树模型。
[0018] 在其中一个实施例中,所述训练数据集包括多个特征量;所述特征量为根据三比值法确定得到的;所述根据所述样本数据集中的训练数据集,构建初始决策树模型,包括:
[0019] 确定所述多个特征量对所述训练数据集的信息增益比;
[0020] 根据各所述特征量对应的信息增益比,确定目标特征量;
[0021] 根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点;
[0022] 去除所述多个特征量中的所述目标特征量,得到新的所述多个特征量;
[0023] 返回执行所述确定各所述特征量对所述训练数据集的信息增益比的步骤,直至得到所述初始决策树模型。
[0024] 在其中一个实施例中,所述根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点,包括:
[0025] 当所述目标特征量对应的信息增益比为0,将训练数据集中占比最多的故障类型作为单结点对应的类,构成所述决策树模型。
[0026] 在其中一个实施例中,所述根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点,还包括:
[0027] 当所述目标特征量对应的信息增益比不为0,将所述训练数据集分为多个非空子集,得到划分后的多个子节点对应的数据集;
[0028] 将每个子节点对应的数据集中占比最多的故障类型作为相应子节点对应的类,构成所述决策树模型。
[0029] 第二方面,本申请还提供了一种基于油浸式套管气体检测的套管故障检测系统,所述系统包括:固体激光器、光谱检测单元、光开关、传感探头和计算机设备;所述光谱检测单元分别与所述固体激光器、所述计算机设备和所述光开关连接,所述计算机设备通过所述光开关与所述传感探头连接;其中:
[0030] 所述固体激光器,用于经所述光谱检测单元向所述光开关发送宽带光;
[0031] 所述光开关,用于使所述固体激光器发送的宽带光进入所述传感探头;
[0032] 所述传感探头,设有用于通过气体的纳米级微孔,放置于油浸式套管内各区域,用于返回散射光至所述光谱检测单元;所述散射光为所述宽带光与所述传感探头中的气体相互作用后产生的;
[0033] 所述光谱检测单元,用于接收和分析所述传感探头返回的散射光,得到光谱检测数据;
[0034] 所述计算机设备,用于根据所述光谱检测数据,获取油浸式套管内各区域的气体浓度数据;
[0035] 所述计算机设备,还用于在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;
[0036] 所述计算机设备,还用于将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果;
[0037] 所述计算机设备,还用于比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。
[0038] 第三方面,本申请还提供了一种基于油浸式套管气体检测的套管故障检测装置,所述装置包括:
[0039] 获取模块,用于获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据;所述气体检测传感探头设有用于通过气体的纳米级微孔;
[0040] 确定模块,用于在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;
[0041] 识别模块,用于将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果;
[0042] 对比模块,用于比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。
[0043] 第四方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0044] 第五方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0045] 第六方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0046] 上述基于油浸式套管气体检测的套管故障检测方法、系统、装置、计算机设备、存储介质和计算机程序产品,获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据,气体检测传感探头设有用于通过气体的纳米级微孔,由于纳米级微孔仅允许油中溶解的气体小分子通过并进入传感探头内部,油中大分子物质被阻止在传感探头外部,可避免油中大分子物质对气体浓度检测的影响,实现原位油气分离,还可以缩短气体浓度检测所需时间,提高检测效率,在气体浓度数据满足故障条件的情况下,将气体浓度数据对应的套管区域确定为可疑故障区域,从而确定可能存在故障的区域,减少故障检测的工作量,进而提高检测效率,将可疑故障区域对应的气体浓度数据输入目标决策树模型,得到气体浓度数据对应的故障类型识别结果和故障区域识别结果,从而确定更为精确的故障区域识别结果,通过比较可疑故障区域和故障区域识别结果所表征的故障区域,确定油浸式套管的目标故障识别结果,目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型,从而通过比较,确定精确的故障区域,能够通过气体检测传感探头直接且快速地测量套管内各区域的气体浓度数据,提高气体浓度数据检测的准确度和效率,利用检测到的气体浓度数据先确定出可疑故障区域,再利用决策树模型对气体浓度数据进行分析,得到目标故障识别结果,进而比对目标故障识别结果中故障区域识别结果所表征的故障区域和可疑故障区域,确定精确的故障区域,实现对套管故障类型和故障区域的准确识别,提高套管故障检测的准确度。

附图说明

[0047] 图1为一个实施例中一种基于油浸式套管气体检测的套管故障检测方法的应用环境图;
[0048] 图2为一个实施例中一种基于油浸式套管气体检测的套管故障检测方法的流程示意图;
[0049] 图3为一个实施例中另一种基于油浸式套管气体检测的套管故障检测方法的流程示意图;
[0050] 图4为一个实施例中一种建立决策树模型的流程示意图;
[0051] 图5为一个实施例中一种传感探头布置方式的示意图;
[0052] 图6为一个实施例中一种基于油浸式套管气体检测的套管故障检测系统的示意图;
[0053] 图7为一个实施例中一种基于油浸式套管气体检测的套管故障检测装置的结构框图;
[0054] 图8为一个实施例中计算机设备的内部结构图。

具体实施方式

[0055] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0056] 本申请实施例提供的基于油浸式套管气体检测的套管故障检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上,终端102获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据,所述气体检测传感探头设有用于通过气体的纳米级微孔,在所述气体浓度数据满足故障条件的情况下,终端102将所述气体浓度数据对应的套管区域确定为可疑故障区域,终端102将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果,终端102比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果,所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0057] 可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。
[0058] 在一些实施例中,如图2所示,提供了一种基于油浸式套管气体检测的套管故障检测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
[0059] 步骤S202,获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据;所述气体检测传感探头设有用于通过气体的纳米级微孔。
[0060] 其中,油浸式套管可以是指用于为电力变压器引线的油浸式绝缘套管。
[0061] 其中,气体检测传感探头可以是指侧面钻有纳米级微孔的空心光子晶体光纤,且该纳米级微孔纸质光纤纤芯内部。
[0062] 其中,气体浓度数据可以是指油浸式套管的油中所溶解的特征气体对应的浓度数据。
[0063] 作为一种示例,终端接收光谱检测单元发送的光谱数据,分析光谱数据,进而确定油浸式套管的油中所溶解的特征气体对应的浓度数据。
[0064] 步骤S204,在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域。
[0065] 其中,故障条件可以是指用于判断套管气体浓度数据是否满足气体浓度经验阈值的条件,实际应用中,故障条件可以包括气体浓度条件和气体类型条件。
[0066] 其中,套管区域可以是指套管内部充油区的不同区域,实际应用中,套管区域可以包括导杆区域、电容芯子区域和油枕区域。
[0067] 其中,可疑故障区域可以是指根据气体浓度数据判定可能存在故障的套管区域。
[0068] 作为一种示例,工作人员根据经验设置每个套管区域中每种气体的气体浓度阈值,若任一套管区域中任意一种气体的气体浓度数据超过工作人员设置的气体浓度阈值,终端判定该气体浓度数据对应的套管区域为可疑故障区域,若气体浓度数据未超过气体浓度阈值,终端继续读取其他气体的气体浓度数据。
[0069] 步骤S206,将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果。
[0070] 其中,目标决策树模型可以是指用于根据气体浓度数据输出故障类型和故障区域的决策树模型。
[0071] 其中,故障类型识别结果可以是指目标决策树模型输出的针对故障类型的决策树输出结果。
[0072] 其中,故障区域识别结果可以是指目标决策树模型输出的针对故障区域的决策树输出结果。
[0073] 作为一种示例,终端根据可疑故障区域对应的气体浓度数据建立数据集,将数据集中的数据输入目标决策树模型,进而得到目标决策树输出的故障类型识别结果和故障区域识别结果。
[0074] 步骤S208,比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。
[0075] 其中,目标故障识别结果可以是指由目标故障区域和故障类型识别结果所表征的故障类型组成的识别结果。
[0076] 作为一种示例,终端将可疑故障区域和故障区域识别结果所表征的故障区域进行对比,确定可疑故障区域和故障区域识别结果所表征的故障区域是否存在重合区域,若存在重合区域,终端判定该重合区域为目标故障区域,若不存在重合区域,终端重新读取气体浓度数据。
[0077] 上述基于油浸式套管气体检测的套管故障检测方法中,获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据,气体检测传感探头设有用于通过气体的纳米级微孔,由于纳米级微孔仅允许油中溶解的气体小分子通过并进入传感探头内部,油中大分子物质被阻止在传感探头外部,可避免油中大分子物质对气体浓度检测的影响,实现原位油气分离,还可以缩短气体浓度检测所需时间,提高检测效率,在气体浓度数据满足故障条件的情况下,将气体浓度数据对应的套管区域确定为可疑故障区域,从而确定可能存在故障的区域,减少故障检测的工作量,进而提高检测效率,将可疑故障区域对应的气体浓度数据输入目标决策树模型,得到气体浓度数据对应的故障类型识别结果和故障区域识别结果,从而确定更为精确的故障区域识别结果,通过比较可疑故障区域和故障区域识别结果所表征的故障区域,确定油浸式套管的目标故障识别结果,目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型,从而通过比较,确定精确的故障区域,能够通过气体检测传感探头直接且快速地测量套管内各区域的气体浓度数据,提高气体浓度数据检测的准确度和效率,利用检测到的气体浓度数据先确定出可疑故障区域,再利用决策树模型对气体浓度数据进行分析,得到目标故障识别结果,进而比对目标故障识别结果中故障区域识别结果所表征的故障区域和可疑故障区域,确定精确的故障区域,实现对套管故障类型和故障区域的准确识别,提高套管故障检测的准确度。
[0078] 在一些实施例中,所述在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域,包括:
[0079] 获取针对所述套管区域的气体类型的气体浓度阈值。
[0080] 其中,气体类型可以是指油浸式套管的油中所溶解的气体的类型,实际应用中,气体类型可以包括甲烷、乙烷、乙烯、乙炔和氢气。
[0081] 其中,气体浓度阈值可以是指工作人员根据经验设置的每个套管区域中每种气体对应的浓度阈值。
[0082] 在所述气体浓度数据大于所述气体浓度阈值的情况下,确定所述气体浓度数据对应的套管区域为所述可疑故障区域。
[0083] 作为一种示例,如图3所示,工作人员根据过去经验数据,对不同区域内不同类型故障特征气体浓度设置合适的气体浓度阈值,终端读取套管内部充油区的七种典型故障气体浓度,若气体浓度数据超过气体浓度阈值,终端判定气体浓度数据对应的套管区域为可疑故障区域,若气体浓度数据未超过气体浓度阈值,终端继续监测套管内各气体对应的气体浓度信息,终端利用事先根据选定特征量和样本数据集建立的决策树模型,直接将处理后得到的测试数据集作为输入,判断故障类型和故障区域,终端将决策树判断结果与可疑故障区域进行比较,若二者有重合区域,则说明决策树判断结果正确,即得到精确到故障区域的故障类型,若无重合区域则重新读取传感数据。
[0084] 本实施例中,通过根据气体浓度数据和预设的气体浓度阈值,确定气体浓度数据对应的套管区域是否为可疑故障区域,能够实现先对故障区域的大致确定,减少故障检测的工作量,提高故障检测效率。
[0085] 在一些实施例中,所述方法还包括:
[0086] 获取样本数据集,根据所述样本数据集中的训练数据集,构建初始决策树模型。
[0087] 其中,样本数据集可以是指在建立决策树模型和测试决策树模型所需的数据组成的数据集合,实际应用中,样本数据集可以包括训练数据集和测试数据集;例如:终端按照8:2的比例将样本数据集分为训练数据集和测试数据集。
[0088] 其中,训练数据集可以是指建立决策树模型所需的数据组成的数据集合。
[0089] 其中,初始决策树模型可以是指初步建立的未经测试优化的决策树模型。
[0090] 作为一种示例,终端根据三比值法将气体浓度数据转化为三种比值:乙炔含量/乙烯含量比(α),甲烷含量/氢气含量比(β)和乙烯含量/乙烷含量比(γ),终端利用三种比值对应的比值数据构成特征量集,此时每个特征量可包含信息:故障区域位置和其中一个比值数据,终端将所有可疑故障区域的三种比值均作为特征量,并对每种套管故障类型赋予标签值,对每一种故障类型与套管区域和该套管区域的三种比值进行匹配处理,构建样本数据集。以套管区域1为例,产生的特征量有:α1、β1、γ1,若套管区域1无故障,即为正常状态,则标签值为0,其余特征量按照统计的套管各类典型故障发生概率从低到高依次赋值1、2、3、…、K,其中,K表示第K类故障。
[0091] 对所述初始决策树模型进行剪枝处理,得到剪枝决策树模型。
[0092] 其中,剪枝处理可以是指删除或修剪决策树模型中冗余权重和非关键权重的操作。
[0093] 其中,剪枝决策树可以是指经过剪枝处理的决策树模型。
[0094] 作为一种示例,为防止决策树模型过拟合或欠拟合,终端对初始决策树进行剪枝处理,具体通过极小化决策树整体的损失函数来实现剪枝,得到可靠的剪枝决策树模型。
[0095] 利用所述样本数据集中的测试数据集,对所述剪枝决策树模型进行测试,得到所述剪枝决策树模型对应的测试结果。
[0096] 其中,测试数据集可以是指测试决策树模型所需的数据组成的数据集合。
[0097] 其中,测试结果可以是指利用测试数据集对剪枝决策树进行测试后得到的决策树输出结果。
[0098] 在所述测试结果指示所述剪枝决策树模型通过测试的情况下,确定所述剪枝决策树模型为所述目标决策树模型。
[0099] 作为一种示例,终端利用测试数据集判断剪枝决策树模型的准确率,将测试数据集输入剪枝决策树模型中,当剪枝决策树模型输出的测试结果的准确率达到95%以上时,将剪枝决策树模型视为判断有效,否则更新样本数据集,并重新建立决策树模型。
[0100] 本实施例中,通过根据样本数据集中的训练数据集,构建初始决策树模型,在对初始决策树模型进行剪枝后,根据样本数据集中的测试数据集,对剪枝决策树模型进行测试,在测试结果通过的情况下,确定出目标决策树模型,能够实现对建立的决策树模型进行剪枝优化和测试,提高决策树模型的识别结果准确率。
[0101] 在一些实施例中,所述训练数据集包括多个特征量;所述特征量为根据三比值法确定得到的;所述根据所述样本数据集中的训练数据集,构建初始决策树模型,包括:
[0102] 确定所述多个特征量对所述训练数据集的信息增益比。
[0103] 其中,特征量可以是指组成样本数据集的数据。
[0104] 其中,信息增益比可以是指信息增益与训练数据集关于某特征的值的熵之比,实际应用中,样本数据集或测试数据集的经验熵H(D)对应的计算公式可表示为:
[0105]
[0106] 数据集中特征对数据集的经验条件熵H(D|A)对应的计算公式可表示为:
[0107]
[0108] 信息增益g(D,A)的计算公式可表示为:
[0109]
[0110] 信息增益比gR(D,A)的计算公式可表示为:
[0111]
[0112] 根据各所述特征量对应的信息增益比,确定目标特征量。
[0113] 其中,目标特征量可以是指信息增益比最大的特征量。
[0114] 根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点。
[0115] 其中,决策树节点可以是指表征决策树模型中对数据进行分类的位置。
[0116] 去除所述多个特征量中的所述目标特征量,得到新的所述多个特征量。
[0117] 返回执行所述确定各所述特征量对所述训练数据集的信息增益比的步骤,直至得到所述初始决策树模型。
[0118] 作为一种示例,如图4所示,终端读取各种套管内部典型故障下所有传感区域传感探头的数据;终端根据各自传感区域数据结合三比值法,构成样本数据集,其中,训练数据集标记为D,共有n个数据,所有特征量构成的集合标记为A,假设需要分K个故障类型,每种故障类型记为Ck,输出最终故障分类的的决策树记为T,并按8:2分为训练数据集和测试数据集,终端计算A中各个特征量对D的信息增益比,选择信息增益比G最大的特征量Ag(特征g表示决策树的第g个结点);如果Ag的信息增益比G为0,则终端将T置为单结点树,并将D中的实例数最大的类Ck作为该结点的类,D中的实例数最大的类为训练数据集中占比最多的故障类型,即可得到决策树T;如果Ag的信息增益比G不为0,对Ag的每一个可能值ai,终端按照Ag=ai将D分为若干个非空子集,记为Di,终端将Di中实例数最大的类作为标记,构建子结点,并由结点与其子节点构成树,即可得到决策树T,终端去除特征集A中的特征Ag,得到新的特征集A,终端对第i个结点,Di作为样本数据集,A作为特征集,遍历每个结点递归地按照上述步骤进行计算,直至得到决策树T后跳出递归,即可根据训练数据集初步生成初始决策树。
[0119] 本实施例中,通过确定特征量的信息增益比,利用信息增益比确定决策树模型的各节点,能够精确控制各决策树节点的识别标准,细化识别分支,进而提高决策树模型的识别结果准确率。
[0120] 在一些实施例中,所述根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点,包括:
[0121] 当所述目标特征量对应的信息增益比为0,将训练数据集中占比最多的故障类型作为单结点对应的类,构成所述决策树模型。
[0122] 作为一种示例,如果Ag的信息增益比G为0,则终端将T置为单结点树,并将D中的实例数最大的类Ck作为该结点的类,D中的实例数最大的类为训练数据集中占比最多的故障类型,即可得到决策树T。
[0123] 本实施例中,通过在目标特征量对应的信息增益比为0时,将该分支建立为单节点分支,能够在极端情况下,即输入的特征量与故障类型无关或相关性低时,则将输入的特征量直接与最多的故障类型对应,提高决策树模型对数据集中数据的适用性,提高故障识别的灵活性。
[0124] 在一些实施例中,所述根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点,还包括:
[0125] 当所述目标特征量对应的信息增益比不为0,将所述训练数据集分为多个非空子集,得到划分后的多个子节点对应的数据集。
[0126] 其中,多个子节点对应的数据集可以是指将训练数据集中训练数据的特征量依照是否大于、小于或等于目标特征量分类得到的若干个子集。
[0127] 将每个子节点对应的数据集中占比最多的故障类型作为相应子节点对应的类,构成所述决策树模型。
[0128] 作为一种示例,如果Ag的信息增益比G不为0,对Ag的每一个可能值ai,终端按照Ag=ai将D分为若干个非空子集,记为Di,终端将Di中实例数最大的类作为标记,构建子结点,并由结点与其子节点构成树,即可得到决策树T,终端去除特征集A中的特征Ag,得到新的特征集A,终端对第i个结点,Di作为样本数据集,A作为特征集,遍历每个结点递归地按照上述方法步骤进行计算,直至得到决策树T后跳出递归。
[0129] 本实施例中,通过在目标特征量对应的信息增益比不为0时,划分子节点数据集,并对子节点数据集进行类的划分,能够精确实现对决策树各分支节点的构建,提高决策树模型的识别准确率,通过决策树的C4.5算法将包含故障区域和故障特征气体浓度的三比值作为样本数据集进行训练,最终得到能够实现具体至故障区域的故障诊断方法,克服了传统三比值法在编码不足,编码模糊问题,以及现有套管故障检测难以实现故障定位的难题。
[0130] 在一些实施例中,本申请实施例还提供了一种基于油浸式套管气体检测的套管故障检测系统,所述系统包括:固体激光器、光谱检测单元、光开关、传感探头和计算机设备;所述光谱检测单元分别与所述固体激光器、所述计算机设备和所述光开关连接,所述计算机设备通过所述光开关与所述传感探头连接;其中:
[0131] 所述固体激光器,用于经所述光谱检测单元向所述光开关发送宽带光。
[0132] 其中,固体激光器可以是指用于发出宽带光的元件。
[0133] 所述光开关,用于使所述固体激光器发送的宽带光进入所述传感探头。
[0134] 其中,光开关可以是指由计算机设备控制的、可根据控制指令控制是否允许宽带光通过的元件。
[0135] 作为一种示例,光开关由计算机控制选择所通的光路即选择需要测量的测点,考虑油中溶解气体扩散慢,实时性要求不高,因此利用计算机设备控制光开关的方式可以有效检测各测点的气体组分及浓度。
[0136] 所述传感探头,设有用于通过气体的纳米级微孔,放置于油浸式套管内各区域,用于返回散射光至所述光谱检测单元;所述散射光为所述宽带光与所述传感探头中的气体相互作用后产生的。
[0137] 其中,传感探头可以是指放置于油浸式套管内各区域的气体检测传感探头,具体实现中,传感探头可以由HC‑800‑02型空心光子晶体光纤制备而成,长度不低于0.5m,其侧面微孔间距不超过10cm,保证纤芯内部故障气体的交换。
[0138] 作为一种示例,如图5所示,传感探头在油浸式套管中的布置方式可以为:套管充油区包括油枕、导杆、电容芯子以及升高座油箱。考虑到导杆以及电容芯子区域的油与导杆内部结构充分接触,因此在这两个区域轴向每隔20 cm布置一个传感探头,而对于升高座油箱,考虑该部分油中溶解气体不涉及套管内部故障,因此不做测量,对于油枕,在油流动速度较大区域即靠近电容芯子一侧,距离顶部15cm处布置一个传感探头。最终将套管内部充油区划为若干个区域,每个区域对应一个传感探头,可以直接反映该区域的溶解气体浓度信息。
[0139] 所述光谱检测单元,用于接收和分析所述传感探头返回的散射光,得到光谱检测数据。
[0140] 实际应用中,光谱检测单元可以包括拉曼探头和拉曼光谱仪。
[0141] 作为一种示例,如图6所示,固体激光器发出宽带光,宽带光经过拉曼探头到达光开关,算机设备控制光开关所连接光路接通,以使宽带光到达传感探头,宽带光到达传感探头后,与传感探头内部的气体分子相互作用,产生后向拉曼散射光,拉曼光谱仪收集后向拉曼散射光并进行检测,得到光谱数据,计算机设备通过采集卡采集光谱数据,并对光谱数据进行分析,得到油中所溶解气体的组分和浓度。
[0142] 所述计算机设备,用于根据所述光谱检测数据,获取油浸式套管内各区域的气体浓度数据。
[0143] 所述计算机设备,还用于在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域。
[0144] 所述计算机设备,还用于将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果。
[0145] 所述计算机设备,还用于比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。
[0146] 本实施例中,通过利用光纤传感技术实现套管内部充油区的准分布式油中溶解气体直接原位检测,无需油气分离过程,克服了传统检测方法检测周期长,检测区域单一难以实现故障定位的难题。
[0147] 应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0148] 基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的基于油浸式套管气体检测的套管故障检测方法的基于油浸式套管气体检测的套管故障检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于油浸式套管气体检测的套管故障检测装置实施例中的具体限定可以参见上文中对于基于油浸式套管气体检测的套管故障检测方法的限定,在此不再赘述。
[0149] 在一个实施例中,如图7所示,提供了一种基于油浸式套管气体检测的套管故障检测装置,包括:获取模块702、确定模块704、识别模块706和对比模块708,其中:
[0150] 获取模块702,用于获取放置于油浸式套管内各区域的气体检测传感探头采集的气体浓度数据;所述气体检测传感探头设有用于通过气体的纳米级微孔;
[0151] 确定模块704,用于在所述气体浓度数据满足故障条件的情况下,将所述气体浓度数据对应的套管区域确定为可疑故障区域;
[0152] 识别模块706,用于将所述可疑故障区域对应的气体浓度数据输入目标决策树模型,得到所述气体浓度数据对应的故障类型识别结果和故障区域识别结果;
[0153] 对比模块708,用于比较所述可疑故障区域和所述故障区域识别结果所表征的故障区域,确定所述油浸式套管的目标故障识别结果;所述目标故障识别结果包括目标故障区域和所述故障类型识别结果所表征的故障类型。
[0154] 在其中一个实施例中,上述确定模块704具体还用于获取针对所述套管区域的气体类型的气体浓度阈值;在所述气体浓度数据大于所述气体浓度阈值的情况下,确定所述气体浓度数据对应的套管区域为所述可疑故障区域。
[0155] 在其中一个实施例中,上述装置还包括决策树模块,该决策树模块具体用于获取样本数据集,根据所述样本数据集中的训练数据集,构建初始决策树模型;对所述初始决策树模型进行剪枝处理,得到剪枝决策树模型;利用所述样本数据集中的测试数据集,对所述剪枝决策树模型进行测试,得到所述剪枝决策树模型对应的测试结果;在所述测试结果指示所述剪枝决策树模型通过测试的情况下,确定所述剪枝决策树模型为所述目标决策树模型。
[0156] 在其中一个实施例中,上述决策树模块具体还用于确定所述多个特征量对所述训练数据集的信息增益比;根据各所述特征量对应的信息增益比,确定目标特征量;根据所述目标特征量对应的信息增益比,构建所述目标特征量对应的决策树节点;去除所述多个特征量中的所述目标特征量,得到新的所述多个特征量;返回执行所述确定各所述特征量对所述训练数据集的信息增益比的步骤,直至得到所述初始决策树模型;所述训练数据集包括多个特征量;所述特征量为根据三比值法确定得到的。
[0157] 在其中一个实施例中,上述决策树模块具体还用于当所述目标特征量对应的信息增益比为0,将训练数据集中占比最多的故障类型作为单结点对应的类,构成所述决策树模型。
[0158] 在其中一个实施例中,上述决策树模块具体还用于当所述目标特征量对应的信息增益比不为0,将所述训练数据集分为多个非空子集,得到划分后的多个子节点对应的数据集;将每个子节点对应的数据集中占比最多的故障类型作为相应子节点对应的类,构成所述决策树模型。
[0159] 上述基于油浸式套管气体检测的套管故障检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0160] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于油浸式套管气体检测的套管故障检测方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0161] 本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0162] 在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0163] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0164] 在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0165] 需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0166] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read‑Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0167] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0168] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。