基于图马尔可夫神经网络的变压器故障的诊断系统转让专利

申请号 : CN202211486848.0

文献号 : CN115758899B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨会轩张瑞照

申请人 : 山东华科信息技术有限公司北京华清智汇能源技术有限公司

摘要 :

本公开描述一种基于图马尔可夫神经网络的变压器故障的诊断系统。该诊断系统包括获取模块和预测模块,获取模块配置为获取多个包括类型为文本的初始特征的故障数据;预测模块配置为对多个故障数据进行预处理以获取多个包括多个目标特征的目标故障数据,构建基于图马尔可夫神经网络的诊断模型以同时对目标故障数据的故障类型之间的依赖关系和目标故障数据的特征表示进行建模,利用目标故障数据构建图结构并基于图结构对基于图马尔可夫神经网络的诊断模型进行优化以获取目标诊断模型,并且将待诊断的故障数据进行预处理后输入目标诊断模型以输出待诊断的故障数据所属的故障类型。由此,能够提高对故障类型预测的准确率。

权利要求 :

1.一种基于图马尔可夫神经网络的变压器故障的诊断系统,其特征在于,包括:获取模块,其配置为获取待诊断的故障数据;以及预测模块,其配置为将所述待诊断的故障数据进行预处理后输入目标诊断模型以输出所述待诊断的故障数据所属的故障类型,其中,获取所述目标诊断模型包括:从多个变压器获取多个故障数据,各个故障数据包括多个初始特征,所述初始特征的类型包括文本,所述初始特征包括变压器的油中铜的浓度、变压器的油中铁的浓度、变压器的油中溶解气体的含量、变压器的缺陷信息、变压器的设备型号、变压器的生产厂家、变压器的投运年限、恶劣气象的信息和绝缘老化的情况,对所述多个故障数据进行包括初步去重和构建序列向量处理的所述预处理以获取多个包括多个目标特征的目标故障数据,所述初步去重为在存在相关性的多个初始特征中保留至少一个初始特征,所述构建序列向量处理为利用连续词袋模型将类型为文本的中间特征更新为序列向量并将更新后的中间特征作为第二目标特征以获取多个包括多个所述第二目标特征的第二故障数据,将所述第二故障数据作为所述目标故障数据,将所述第二目标特征作为所述目标特征,其中,所述中间特征是经由所述初步去重的初始特征,构建基于图马尔可夫神经网络的诊断模型以同时对所述目标故障数据的故障类型之间的依赖关系和所述目标故障数据的特征表示进行建模,利用所述目标故障数据构建图结构并基于所述图结构对所述诊断模型进行优化以使所述诊断模型结合所述目标故障数据的故障类型之间的依赖关系来预测故障类型,进而获取所述目标诊断模型。

2.根据权利要求1所述的诊断系统,其特征在于:

所述初始特征还包括变压器的油的温度、变压器的负荷和变压器的突发短路的次数中的至少一种,其中,所述溶解气体包括氢气、甲烷、乙烷、乙烯和乙炔。

3.根据权利要求1所述的诊断系统,其特征在于:

所述初始特征的类型还包括数值。

4.根据权利要求1所述的诊断系统,其特征在于:

通过初步收集初始故障数据,并不断地更新已收集的初始故障数据以获取所述多个故障数据。

5.根据权利要求1所述的诊断系统,其特征在于:

多个所述目标故障数据中包括已知故障类型的数据和未知故障类型的数据以利用半监督的方式对所述诊断模型进行训练。

6.根据权利要求1所述的诊断系统,其特征在于:

所述预处理还包括缺失值处理、特征降维处理和数据规范化处理,所述缺失值处理为对所述多个故障数据进行处理以获取多个包括多个第一目标特征的第一故障数据;所述特征降维处理为利用训练线性回归或逻辑回归提取所述第二故障数据的各个第二目标特征的表决系数并进行重要性排序以获取重要性大于预设重要性的第二目标特征,然后利用主成分分析和/或因子分析提取所述重要性大于预设重要性的第二目标特征中的主要特征;

所述数据规范化处理为利用所述第二目标特征的均值和方差对所述第二故障数据进行规范化。

7.根据权利要求1所述的诊断系统,其特征在于:

所述连续词袋模型利用多个类型为文本的所述中间特征的值进行训练;或利用单个类型为文本的所述中间特征的值分别进行训练。

8.根据权利要求1所述的诊断系统,其特征在于:

所述图结构G表示为G=(V,E,xV),V为多个所述目标故障数据的集合,xV为多个所述目标故障数据的目标特征的集合,E为各个所述目标故障数据之间的关系的集合。

9.根据权利要求1所述的诊断系统,其特征在于:

将多个类型为文本的所述中间特征的值用独热编码进行表示以获取多个独热编码向量,将各个所述独热编码向量分别与第一权重矩阵相乘以获取该中间特征的值对应的序列向量,其中,所述第一权重矩阵通过利用所述多个独热编码向量对所述连续词袋模型进行训练获得。

10.根据权利要求5所述的诊断系统,其特征在于:

基于所述溶解气体的含量确定所述已知故障类型和/或分析缺陷信息确定所述已知故障类型。

说明书 :

基于图马尔可夫神经网络的变压器故障的诊断系统

[0001] 本申请是申请日为2021年06月28日、申请号为2021107198738、发明名称为基于图马尔可夫神经网络的变压器故障的诊断方法的专利申请的分案申请。

技术领域

[0002] 本公开大体涉及变压器故障诊断领域,具体涉及一种基于图马尔可夫神经网络的变压器故障的诊断系统。

背景技术

[0003] 变压器作为电网系统的核心设备,若发生故障,将会对整个电网系统的稳定运行造成严重威胁,不仅影响到居民的用电生活,还会由于断电引发其他相关问题,造成灾难性的后果。因此,及时准确地对变压器进行故障诊断以确定故障类型后进行精准维修显得至关重要,有利于提高电网系统的安全性和可靠性。
[0004] 现有变压器故障诊断方法一般是收集变压器的故障数据,并利用机器学习的算法对变压器的故障类型进行预测,机器学习的算法例如决策树、支持序列向量机、聚类和关联分析等。然而,由于变压器的故障数据一般包括大量的文本类型的数据,对收集变压器的故障数据进行预处理后转成可用于训练基于机器学习的模型的数据往往耗时较长,并且现有变压器故障诊断方法常常关注于对变压器的故障类型进行预测,却忽略了故障类型之间的依赖关系。因此对变压器的故障类型进行诊断的准确率还有待于提高。

发明内容

[0005] 本公开是有鉴于上述的状况,经过多次调研和实验,提供了一种同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模且能够提高对故障类型预测的准确率的基于图马尔可夫神经网络的变压器故障的诊断方法。
[0006] 为此,本公开第一方面提供了一种基于图马尔可夫神经网络的变压器故障的诊断方法,包括:从多个变压器获取多个故障数据,各个故障数据包括多个初始特征,所述初始特征的类型包括文本;对所述多个故障数据进行预处理以获取多个包括多个目标特征的目标故障数据,多个所述目标故障数据中包括已知故障类型的数据和未知故障类型的数据,所述预处理包括缺失值处理和构建序列向量处理,其中,对所述多个故障数据进行所述缺失值处理以获取多个包括多个第一目标特征的第一故障数据,所述构建序列向量处理为利用连续词袋模型将类型为文本的第一目标特征更新为序列向量并将更新后的第一目标特征作为第二目标特征以获取多个包括多个所述第二目标特征的第二故障数据,将所述第二故障数据作为所述目标故障数据,将所述第二目标特征作为所述目标特征,其中,所述连续词袋模型利用多个类型为文本的第一目标特征的值进行训练;构建基于图马尔可夫神经网络的诊断模型以同时对所述目标故障数据的故障类型之间的依赖关系和所述目标故障数据的特征表示进行建模,利用所述目标故障数据构建图结构并基于所述图结构对所述诊断模型进行优化以获取目标诊断模型,其中,所述图结构G表示为G=(V,E,xV),V为多个所述目标故障数据的集合,xV为多个所述目标故障数据的目标特征的集合,E为各个所述目标故障数据之间的关系的集合;并且将待诊断的故障数据进行所述预处理后输入所述目标诊断模型以输出所述待诊断的故障数据所属的故障类型,其中,所述初始特征包括变压器的油中铜的浓度、变压器的油中铁的浓度,变压器的油中溶解气体的含量和变压器的缺陷信息。在本公开中,能够将故障数据、故障数据的特征以及故障数据的之间的关系用图结构进行表示并用于基于图马尔可夫神经网络的诊断模型的训练,另外还针对变压器的故障数据中文本类型的特征值较多的情况利用连续词袋模型将特征值转成序列向量。在这种情况下,能够快速且准确地将变压器的故障数据中的特征值转成序列向量,进而提高预处理的效率,且同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模,进而能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。
[0007] 另外,在本公开第一方面所涉及的诊断方法中,可选地,所述缺失值处理为对所述初始特征的缺失比例进行检测并将所述缺失比例大于预设比例的初始特征进行删除和将不大于所述预设比例的初始特征的缺失值进行填充以获取所述第一目标特征。由此,能够完善用于训练的故障数据。
[0008] 另外,在本公开第一方面所涉及的诊断方法中,可选地,所述预处理还包括初步去重,所述初步去重为在存在相关性的多个初始特征中保留至少一个初始特征。由此,能够对故障数据中的初步特征进行初步筛选以快速降低特征的维度。
[0009] 另外,在本公开第一方面所涉及的诊断方法中,可选地,所述预处理还包括特征降维处理和数据规范化处理;所述特征降维处理为利用训练线性回归或逻辑回归提取所述第二故障数据的各个第二目标特征的表决系数并进行重要性排序以获取重要性大于预设重要性的第二目标特征,然后利用主成分分析和/或因子分析提取所述重要性大于预设重要性的第二目标特征中的主要特征;所述数据规范化处理为利用所述第二目标特征的均值和方差对所述第二故障数据进行规范化。由此,能够提取出主要特征和能够对第二故障数据进行规范化。
[0010] 另外,在本公开第一方面所涉及的诊断方法中,可选地,所述初始特征还包括变压器的油的温度、变压器的设备型号、变压器的生产厂家、变压器的投运年限、变压器的负荷、变压器的突发短路的次数、恶劣气象的信息和绝缘老化的情况中的至少一种,其中,所述溶解气体包括氢气、甲烷、乙烷、乙烯和乙炔。由此,能够获取较多的特征用于后续的预处理。
[0011] 另外,在本公开第一方面所涉及的诊断方法中,可选地,将多个类型为文本的第一目标特征的值用独热编码进行表示以获取多个独热编码向量,将各个所述独热编码向量分别与第一权重矩阵相乘以获取该第一目标特征的值对应的序列向量,其中,所述第一权重矩阵通过利用所述多个独热编码向量对所述连续词袋模型进行训练获得。在这种情况下,通过连续词袋模型将类型为文本的第一目标特征快速地转成序列向量。由此,能够提高预处理的效率。
[0012] 另外,在本公开第一方面所涉及的诊断方法中,可选地,所述诊断模型利用条件随机分布通过所述目标特征来建模所述目标故障数据的故障类型之间的联合分布并使用变分EM算法进行优化,所述变分EM算法包括E步骤和M步骤,其中,在所述E步骤中通过第一图神经网络来学习所述目标故障数据的特征表示以预测故障类型,在所述M步骤中通过第二图神经网络来建模所述目标故障数据的故障类型之间的依赖关系。在这种情况下,能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。
[0013] 另外,在本公开第一方面所涉及的诊断方法中,可选地,所述故障类型包括高温过热、中低温过热、高能放电、低能放电、放电兼过热和局部放电。由此,能够对多种故障类型进行预测。
[0014] 本公开第二方面提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的诊断方法的步骤。
[0015] 本公开第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的诊断方法的步骤。
[0016] 根据本公开,能够提供一种同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模且能够提高对故障类型预测的准确率的基于图马尔可夫神经网络的变压器故障的诊断方法。

附图说明

[0017] 现在将仅通过参考附图的例子进一步详细地解释本公开,其中:
[0018] 图1是示出了本公开示例所涉及的基于图马尔可夫神经网络的变压器故障的诊断方法的应用场景示意图。
[0019] 图2是示出了本公开示例所涉及的变分EM算法的示意图。
[0020] 图3是示出了本公开示例所涉及的基于图马尔可夫神经网络的诊断模型的训练方法的流程图。
[0021] 图4是示出了本公开示例所涉及的一种预处理过程的流程图。
[0022] 图5是示出了本公开示例所涉及的基于图马尔可夫神经网络的变压器故障的诊断方法的流程图。
[0023] 图6是示出了本公开示例所涉及的基于图马尔可夫神经网络的变压器故障的诊断系统的框图。

具体实施方式

[0024] 以下,参考附图,详细地说明本公开的优选实施方式。在下面的说明中,对于相同的部件赋予相同的符号,省略重复的说明。另外,附图只是示意性的图,部件相互之间的尺寸的比例或者部件的形状等可以与实际的不同。需要说明的是,本公开中的术语“包括”和“具有”以及它们的任何变形,例如所包括或所具有的一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可以包括或具有没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本公开所描述的所有方法可以以任何合适的顺序执行,除非在此另有指示或者与上下文明显矛盾。
[0025] 本公开涉及的基于图马尔可夫神经网络的变压器故障的诊断方法和诊断系统能够快速且准确地将变压器的故障数据中的特征值转成序列向量,且同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示(对象表示)进行建模,进而能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。本公开涉及的诊断方法应用于诊断系统(稍后描述)。以下结合附图进行详细描述本公开。此外,本公开的示例描述的应用场景是为了更加清楚的说明本公开的技术方案,并不构成对于本公开提供的技术方案的限定。
[0026] 图1是示出了本公开示例所涉及的基于图马尔可夫神经网络的变压器故障的诊断方法的应用场景示意图。如图1所示,监控服务器20可以存储变压器10的信息例如厂家的信息和收集变压器10的数据例如故障数据。在一些示例中,本公开涉及的诊断方法可以以计算机程序指令的形式存储在监控服务器20中并由监控服务器20执行,监控服务器20可以通过执行该诊断方法以实现基于变压器10的故障数据对变压器10的故障类型进行预测。在一些示例中,监控客户端30可以获取监控服务器20收集的变压器10的数据,若出现异常的数据,则监控客户端30可以根据预测的故障类型通知的相应的维修人员40进行维修。由此,能够实现精准维修。
[0027] 在一些示例中,监控服务器20可以包括一个或多个处理器和一个或多个存储器。其中,处理器可以包括中央处理单元、图形处理单元以及能够处理数据的其它任何电子部件,能够执行计算机程序指令。存储器可以用于存储计算机程序指令。在一些示例中,可以通过执行存储器中的计算机程序指令以实现诊断方法。在一些示例中,监控服务器20也可以是云端服务器。另外,在一些示例中,监控客户端30可以是智能手机、笔记本电脑、个人计算机(Personal Computer,PC)等各类电子设备。在一些示例中,维修人员40可以是具有维修变压器的专业知识的人员。
[0028] 图2是示出了本公开示例所涉及的变分EM算法的示意图。如上所述,本公开涉及的基于图马尔可夫神经网络的变压器故障的诊断方法可以同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模。一般而言,图马尔可夫神经网络(Graph Markov Neural Network,GMNN)能够结合统计关系学习(Statistical Relational Learning,SRL)和图神经网络(Graph Neural Networks,GNN)的优点。在一些示例中,可以用条件随机场(条件随机分布)对故障数据的故障类型的联合分布进行建模以获取基于图马尔可夫神经网络的诊断模型(稍后描述),并利用变分EM算法对诊断模型进行训练,不仅能学习故障数据的有效的特征表示,还能学习到不同故障数据之间的故障类型的依赖关系。在一些示例中,如图2所示,变分EM算法可以包括E‑step(E步骤)和M‑step(M步骤),通过交替执行E‑step和M‑step以更新变分分布qθ和联合分布pφ(稍后描述)直至收敛。
[0029] 以下结合附图描述基于图马尔可夫神经网络的诊断模型的训练方法。图3是示出了本公开示例所涉及的基于图马尔可夫神经网络的诊断模型的训练方法的流程图。在一些示例中,如图3所示,训练方法可以包括获取多个故障数据(步骤S110),在步骤S110中,可以从多个变压器10获取多个故障数据。例如可以通过观测3000至5000台变压器10的运行情况、缺陷记录以及电网相关人员提供的数据信息获取多个故障数据。由于变压器10的数据不容易收集,在一些示例中,可以初步收集初始的故障数据(例如初始特征或初始特征的值不完整的数据)并通过不断地更新已收集的数据以获取多个故障数据。在一些示例中,多个变压器10的来源地可以不同,例如多个变压器10可以是来源不同的省份或城市。由此,能够提高诊断模型的泛化能力。
[0030] 另外,在一些示例中,各个故障数据可以包括多个初始特征。在一些示例中,初始特征的类型可以包括文本。由此,后续能够通过连续词袋模型快速且准确地将类型为文本的特征转成序列向量。在一些示例中,多个故障数据可以形成以一个二维数组或者矩阵,其中,每行可以表示一个故障数据,每列可以表示多个故障数据的相同的一个初始特征的值。在一些示例中,初始特征的类型还可以包括数值。
[0031] 另外,在一些示例中,初始特征可以包括变压器10的油中铜的浓度、变压器10的油中铁的浓度,变压器10的油中溶解气体的含量和变压器10的缺陷信息,其中变压器10的油可以指变压器10的油箱中的油。变压器10的缺陷信息可以用于描述变压器10的发生过的故障信息。例如变压器10的缺陷信息可以包括但不限于是变压器10发声异常、铁芯接地不良、变压器10漏油、发生过过电压或过负荷和油温过高中的一种或多种。在这种情况下,分析缺陷信息能够确定故障类型并作为金标准对诊断模型进行训练,也即基于缺陷信息能够确定故障类型。由此,能够获取尽量多的已知故障类型的故障数据用于训练。在一些示例中,可以基于变压器10的油中溶解气体的含量确定故障类型并作为金标准对诊断模型进行训练。由此,能够获取尽量多的已知故障类型的故障数据用于训练。
[0032] 另外,在一些示例中,初始特征还包括变压器10的油的温度、变压器10的设备型号、变压器10的生产厂家、变压器10的投运年限、变压器10的负荷、变压器10的突发短路的次数、恶劣气象的信息和绝缘老化的情况中的至少一种。由此,能够获取较多的特征用于后续的预处理。在一些示例中,绝缘老化的情况可以指示变压器10是否存在老化的现象。例如变压器10的绝缘老化的情况可以分为四个等级,四个等级可以为一级(也可以称为绝缘良好)、二级(也可以称为绝缘合格)、三级(也可以称为绝缘不可靠)和四级(也可以称为绝缘老化)。在一些示例中,溶解气体可以包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)和乙炔(C2H2)。
[0033] 在一些示例中,如图3所示,训练方法可以包括对多个故障数据进行预处理以获取多个目标故障数据(步骤S120)。在一些示例中,各个目标故障数据可以包括多个目标特征。在一些示例中,多个目标故障数据中可以包括已知故障类型的数据和未知故障类型的数据。由此,能够,利用半监督的方式对诊断模型进行训练。在一些示例中,预处理可以包括缺失值处理和构建序列向量处理。
[0034] 另外,在一些示例中,缺失值处理可以为对初始特征的缺失比例进行检测并将缺失比例大于等于预设比例例如50%的初始特征进行删除和将不大于预设比例的初始特征的缺失值进行填充。由此,能够完善用于训练的故障数据。在一些示例中,缺失值填充的方法可以包括但不限于是均值填充、随机差值填充、中位数填充、哑变量填充等。例如,若一个变压器10的初始特征例如乙炔(C2H2)的含量的缺失值可以利用其它变压器10的乙炔(C2H2)的含量的平均值进行填充。另外,在一些示例中,对多个故障数据进行缺失值处理可以获取多个第一故障数据,其中,各个第一故障数据可以包括多个第一目标特征。在一些示例中,第一目标特征的数量可以小于初始特征的数量。
[0035] 另外,在一些示例中,构建序列向量处理可以为利用连续词袋模型(Continuous Bag‑of‑Word Model,CBOW)将类型为文本的第一目标特征更新为序列向量并将更新后的第一目标特征作为第二目标特征。由此,能够利用数据处理的算法进行后续的预处理。在一些示例中,经由构建序列向量处理可以获取多个第二故障数据,其中,各个第二故障数据可以包括多个第二目标特征。在一些示例中,可以将第二故障数据作为目标故障数据,将第二目标特征作为目标特征。在一些示例中,目标故障数据可以为m×n的矩阵,其中m为目标故障数据的数量,n为目标特征的数量。
[0036] 在一些示例中,连续词袋模型可以利用多个类型为文本的第一目标特征的值进行训练。由此,能够快速地完成连续词袋模型的训练。在一些示例中,类型为文本的第一目标特征的值的数量较大,例如第一目标特征的值的数量可以为3000至5000。在这种情况下,通过连续词袋模型能够快速且准确地将类型为文本的第一目标特征更新为序列向量。在一些示例中,可以将多个类型为文本的第一目标特征的值用独热编码(One‑Hot)进行表示以获取多个独热编码向量,将各个独热编码向量分别与第一权重矩阵相乘以获取该第一目标特征的值对应的序列向量,其中,第一权重矩阵可以通过利用多个独热编码向量对连续词袋模型进行训练获得。在这种情况下,通过连续词袋模型将类型为文本的第一目标特征快速地转成序列向量。由此,能够提高预处理的效率。
[0037] 具体地,连续词袋模型的训练过程可以为将多个类型为文本的第一目标特征用独热编码进行表示以获取多个独热编码向量,并将多个独热编码向量中的一个序列向量作为中间序列向量,其他序列向量作为上下文序列向量;将各个上下文序列向量分别与第一权重矩阵相乘以获取多个第一序列向量;将多个第一序列向量相加取平均以获取第二序列向量;将第二序列向量与第二权重矩阵相乘以获取第三序列向量;利用激活函数对第三序列向量进行处理以获得概率分布;然后通过反向传播操作更新第一权重矩阵和第二权重矩阵进而更新概率分布直至概率分布与中间序列向量的误差符合预设误差,其中,第一权重矩阵的大小可以为dim×number,第二权重矩阵的大小可以为number×dim,dim可以为多个独热编码向量的数量,number可以为序列向量的维度,第一权重矩阵的初始值可以为随机值,第二权重矩阵的初始值可以为随机值。在这种情况下,最终获得的第一权重矩阵可以用于与上述各个独热编码向量相乘以获取第一目标特征的值对应的序列向量。
[0038] 但本公开的示例不限于此,在另一些示例中,连续词袋模型可以利用单个类型为文本的第一目标特征的值分别进行训练。
[0039] 在一些示例中,在步骤S120中的预处理还可以包括初步去重。在一些示例中,初步去重可以为在存在相关性的多个初始特征中保留至少一个初始特征。例如,若变压器10的一个初始特征是通过其他初始特征进行相应的计算获得,则可以保留该初始特征或其他初始特征。其他初始特征可以包括一个初始特征或多个初始特征。由此,能够对故障数据中的初步特征进行初步筛选以快速降低特征的维度。但本公开的示例不限于此,在一些示例中,可以舍弃相关性较小的初始特征,例如可以舍弃多个初始特征中的空气湿度。
[0040] 在一些示例中,在步骤S120中的预处理还可以包括特征降维处理和数据规范化处理。在一些示例中,特征降维处理可以为利用训练线性回归(Linear Regression)或逻辑回归(logistics regression)提取第二故障数据的各个第二目标特征的表决系数,并进行重要性排序以获取重要性大于预设重要性的第二目标特征,然后利用主成分分析(Principal Component Analysis,PCA)和/或因子分析(Factor analysis,FA)提取重要性大于预设重要性的第二目标特征中的主要特征。由此,能够提取出主要特征。在一些示例中,可以将主要特征作为目标特征。在一些示例中,预设重要性可以根据实际情况进行设置。
[0041] 另外,在一些示例中,数据规范化处理可以为利用第二目标特征的均值和方差对第二故障数据进行规范化。由此,能够对第二故障数据进行规范化。具体地,可以将第二目标特征的值与均值做差值后除以方差,也即,(第二目标特征的值‑均值)/方差。在一些示例中,经由数据规范化处理的第二故障数据可以作为目标故障数据。
[0042] 图4是示出了本公开示例所涉及的一种预处理过程的流程图。
[0043] 为了更好说明上述的预处理过程,如图4所示,图4是示出了一种预处理过程的流程图。在一些示例中,预处理过程可以依次为缺失值处理(步骤S121)、初步去重(步骤S122)、构建序列向量处理(步骤S123)、特征降维处理(步骤S124)和数据规范化处理(步骤S125)。但本公开的示例不限于此,在另一些示例中,可以先进行初步去重再进行缺失值处理、或先进行数据规范化处理再进行特征降维处理。
[0044] 在一些示例中,如图3所示,训练方法可以包括构建基于图马尔可夫神经网络的诊断模型并利用目标故障数据对诊断模型进行优化以获取目标诊断模型(步骤S130)。在步骤S130中,构建基于图马尔可夫神经网络的诊断模型可以同时对目标故障数据的故障类型之间的依赖关系和目标故障数据的特征表示进行建模。在这种情况下,能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。在一些示例中,故障类型可以包括高温过热、中低温过热、高能放电、低能放电、放电兼过热和局部放电。由此,能够对多种故障类型进行预测。
[0045] 在一些示例中,可以利用目标故障数据构建图结构并基于图结构对诊断模型进行优化以获取目标诊断模型,其中,图结构G可以表示为G=(V,E,xV),V为多个目标故障数据的集合,xV为多个目标故障数据的目标特征的集合,E为各个目标故障数据之间的关系的集合。
[0046] 在一些示例中,诊断模型可以利用条件随机分布通过目标特征来建模目标故障数据的故障类型之间的联合分布并使用变分EM算法进行优化,如图2所示,变分EM算法可以包括E‑step(E步骤)和M‑step(M步骤),其中,在E‑step中通过第一图神经网络来学习目标故障数据的特征表示以预测故障类型,在M‑step中通过第二图神经网络来建模目标故障数据的故障类型之间的依赖关系。在这种情况下,能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。
[0047] 具体地,以下结合基于目标故障数据描述对基于图马尔可夫神经网络的诊断模型进行训练以获取目标诊断模型。首先,利用已知故障类型的数据预训练第一图神经网络得到初始的变分分布qθ,其中,变分分布qθ可以利用摊销推理法(Amortized Inference)对单个目标故障数据的分布进行建模并使用第一图神经网络进行参数化,变分分布qθ可以表示为:
[0048] qθ(yn|xV)=Cat(yn|softmax(Wθhθ,n)),
[0049] 其中,Cat为分类函数,n为未知故障类型的数据的索引,hθ,n为通过将多个目标故障数据的目标特征的集合xV作为特征对第一图神经网络进行训练获得的第n个未知故障类型的数据的特征表示,θ为第一图神经网络的参数,Wθ是线性转换矩阵。
[0050] 其次,在E‑step中,拟合多个目标故障数据的故障类型之间的联合分布pφ并更新变分分布qθ去近似联合分布pφ。在一些示例中,联合分布pφ(也可以称为诊断模型)是根据统计关系学习方法利用条件随机分布并通过多个目标故障数据的目标特征的集合xV来建模获得的,联合分布pφ表示为:
[0051] pφ(yV|xV),
[0052] 其中,φ为诊断模型的参数,诊断模型的参数φ通过对对数似然函数的证据下界进行优化而获得,对数似然函数的证据下界表示为:
[0053] logpφ(yV|xV)≥Εqθ(yU|xV)[logpφ(yL,yU|xV)‑logqθ(yU|xV)],[0054] 其中,yV为多个目标故障数据的故障类型,yL为已知故障类型的数据的故障类型,yU为未知故障类型的数据的故障类型, U=V\L,Ε为期望符号。
[0055] 接着,在M‑step中,拟合变分分布qθ并更新联合分布pφ,进而最大化伪似然函数伪似然函数表示为:
[0056]
[0057] 其中,NB(n)为第n个未知故障类型的数据的邻近集,yNB(n)为第n个未知故障类型的数据的邻近集的故障类型,pφ(yn|yNB(n),xV)使用第二图神经网络进行参数化以表示为:
[0058] pφ(yn|yNB(n),xV)=Cat(yn|softmax(Wφhφ,n)),
[0059] 其中,n为未知故障类型的数据的索引,hφ,n为通过将多个目标故障数据的目标特征的集合xV以及第n个未知故障类型的数据的邻近集的故障类型yNB(n)作为特征对第二图神经网络进行训练获得的第n个未知故障类型的数据的特征表示,Wφ是线性转换矩阵,V\n表示集合V减去第n个未知故障类型的数据。
[0060] 最后,交替更新变分分布qθ和联合分布pφ直至收敛并将变分分布qθ对应的第一图神经网络作为目标诊断模型。
[0061] 利用本公开的训练方法能够将故障数据、故障数据的特征以及故障数据的之间的关系用图结构进行表示并用于基于图马尔可夫神经网络的诊断模型的训练,另外还针对变压器10的故障数据中文本类型的特征值较多的情况利用连续词袋模型将特征值转成序列向量。在这种情况下,能够快速且准确地将变压器10的故障数据中的特征值转成序列向量,进而提高预处理的效率,且同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模,进而能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。
[0062] 图5是示出了本公开示例所涉及的基于图马尔可夫神经网络的变压器故障的诊断方法的流程图。
[0063] 在一些示例中,如图5所示,诊断方法可以包括获取待诊断的故障数据(步骤S210)。在步骤S210中,待诊断的故障数据的特征可以是与上述用于训练的故障数据的初始特征一样,在这种情况下,后续待诊断的故障数据经由与上述训练方法一致的预处理可以输入目标诊断模型进行故障类型的预测。但本公开的示例不限于此,在另一些示例中,待诊断的故障数据中的特征可以跟目标特征一致。
[0064] 在一些示例中,如图5所示,诊断方法可以包括将待诊断的故障数据进行预处理后输入目标诊断模型以输出待诊断的故障数据所属的故障类型(步骤S220)。在步骤S220中,目标诊断模型可以利用变压器10的故障数据对基于图马尔可夫神经网络的诊断模型进行训练获得,相关描述参见上述基于图马尔可夫神经网络的诊断模型的训练方法的相关描述。
[0065] 在一些示例中,若待诊断的故障数据的特征是与上述用于训练的故障数据的初始特征一样,则待诊断的故障数据可以经由上述的预处理以输入目标诊断模型进行故障类型的预测。例如可以根据诊断模型的预处理过程,选择与诊断模型的预处理过程相匹配的上述的缺失值处理、初步去重、构建序列向量处理、特征降维处理或数据规范化处理中的一种或多种对待诊断的故障数据进行预处理。在另一些示例中,若待诊断的故障数据中的特征与目标特征一致,则由于该待诊断的故障数据中的特征已经是用于训练诊断模型的目标特征,可以对该待诊断的故障数据的特征值进行相应的预处理,例如缺失值处理、构建序列向量处理或数据规范化处理等。
[0066] 利用本公开的诊断方法能够快速且准确地将变压器10的故障数据中的特征转成序列向量,且同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模,进而能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。
[0067] 图6是示出了本公开示例所涉及的基于图马尔可夫神经网络的变压器故障的诊断系统1的框图。
[0068] 在一些示例中,本公开的诊断方法可以应用于基于图马尔可夫神经网络的变压器故障的诊断系统1。如图6所示,诊断系统1可以包括获取模块100和预测模块200。
[0069] 在一些示例中,获取模块100可以用于获取待诊断的故障数据。在一些示例中,待诊断的故障数据的特征可以是与上述用于训练的故障数据的初始特征一样,在这种情况下,后续待诊断的故障数据经由与上述基于图马尔可夫神经网络的诊断模型的训练方法一致的预处理可以输入目标诊断模型进行故障类型的预测。但本公开的示例不限于此,在另一些示例中,待诊断的故障数据中的特征可以跟目标特征一致。
[0070] 在一些示例中,预测模块200可以用于将待诊断的故障数据进行预处理后输入目标诊断模型以输出待诊断的故障数据所属的故障类型。在一些示例中,目标诊断模型可以利用变压器10的故障数据对基于图马尔可夫神经网络的诊断模型进行训练获得,相关描述参见上述基于图马尔可夫神经网络的诊断模型的训练方法的相关描述。在一些示例中,故障类型可以包括高温过热、中低温过热、高能放电、低能放电、放电兼过热和局部放电。
[0071] 另外,在一些示例中,若待诊断的故障数据的特征是与上述用于训练的故障数据的初始特征一样,则待诊断的故障数据可以经由上述的预处理以输入目标诊断模型进行故障类型的预测。例如可以根据诊断模型的预处理过程,选择与诊断模型的预处理过程相匹配的上述的缺失值处理、初步去重、构建序列向量处理、特征降维处理或数据规范化处理中的一种或多种对待诊断的故障数据进行预处理。在另一些示例中,若待诊断的故障数据中的特征与目标特征一致,则由于该待诊断的故障数据中的特征已经是用于训练诊断模型的目标特征,可以对该待诊断的故障数据的特征值进行相应的预处理,例如缺失值处理、构建序列向量处理或数据规范化处理等。
[0072] 利用本公开的诊断系统1能够快速且准确地将变压器10的故障数据中的特征转成序列向量,且同时对故障数据的故障类型之间的依赖关系和故障数据的特征表示进行建模,进而能够结合故障类型之间的依赖关系来预测故障类型。由此,能够提高对故障类型预测的准确率。
[0073] 虽然以上结合附图和示例对本公开进行了具体说明,但是可以理解,上述说明不以任何形式限制本公开。本领域技术人员在不偏离本公开的实质精神和范围的情况下可以根据需要对本公开进行变形和变化,这些变形和变化均落入本公开的范围内。