基于集成学习Bagging算法的变压器故障诊断方法转让专利

申请号 : CN201110129133.5

文献号 : CN102289682B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 徐茹枝王宇飞安睿耿啸风周凡雅

申请人 : 华北电力大学

摘要 :

本发明公开了变压器故障诊断技术领域中的一种基于集成学习Bagging算法的变压器故障诊断方法。本发明选用球向量机作为Bagging算法的弱学习算法,并使用油中溶解气体分析技术作为数据采集方法,通过数据归一化、类别数值化等数据处理方法得到适用于球向量机的样本集;集成学习Bagging算法通过反复调用弱学习算法完成对样本集的训练得到强学习机H;利用强学习机H作为变压器故障诊断模型,以完成待诊断记录的故障判别。本发明在改善变压器故障诊断精度方面,有较好的适应性和较低的诊断误差。

权利要求 :

1.基于集成学习Bagging算法的变压器故障诊断方法,其特征是所述方法包括以下步骤:步 骤 1:数 据 采 集 及 数 据 预 处 理,得 到 初 始 历 史 数 据 样 本 集 ;该步骤具体由步骤1.1-步骤1.2组成:步骤1.1:数据采集:采集目标变压器各个时间监测点的气体含量及运行状态;

步骤1.2:数据预处理:设定时间监测点的气体含量及运行状态的特征属性,构成初始历史数据样本集 ;

步骤2:将初始历史数据样本集 构造成集成学习Bagging算法中弱学习算法可读的数据集 ;该步骤具体由步骤2.1-步骤2.3组成:步骤2.1:数据归一化:将初始历史数据样本集 中气体含量按照各自的取值范围全部归一化到[0,1]区间;

步骤2.2:数值化处理:将变压器运行的运行状态设定为数值型类别标号;

步骤2.3:将初始历史数据样本集 中的气体含量作为故障诊断模型的输入向量;将初始历史数据样本集 中的变压器的运行状态作为故障诊断模型的输出向量,故障诊断模型的输入向量和输出向量构成了数据集 ;

步骤3:选定球向量机BVM作为集成学习Bagging算法中的弱学习算法并对该弱学习算法循环调用,完成数据集 的训练,从而得到弱学习机序列,序列中包含各代弱学习机 ,该序列即为强学习机 ;该步骤具体由步骤3.1-步骤3.5组成:步骤3.1:对集成学习Bagging算法初始化,设定Bagging算法最大迭代次数 ,并设定弱学习算法的训练参数;

步骤3.2:以指定概率从数据集 中有放回地选取训练样本子集 , ,作为弱学习算法的训练样本子集 ;

步骤3.3:将训练样本子集 输入到弱学习算法训练,得到对应的弱学习机 ;

步骤3.4:检查当前集成学习Bagging算法是否达到算法的最大迭代次数 ,若已达到,则执行步骤3.5;否则,返回步骤3.2;

步骤3.5:输出弱学习机序列,即强学习机 ;

步骤4:将强学习机 作为故障诊断模型,并将当前待故障诊断的数据样本输入到强学习机 ,强学习机 利用其各代弱学习机 做初步故障诊断,进而以投票的方式判定当前待故障诊断的数据样本的故障类别,得票数多的故障类别即为强学习机 的最终诊断结果。

2.根据权利要求1所述基于集成学习Bagging算法的变压器故障诊断方法,其特征是所述步骤1.1中数据采集的方法为油中溶解气体分析技术DGA。

3. 根据权利要求1所述基于集成学习Bagging算法的变压器故障诊断方法,其特征是所述步骤1.1中气体包括氢气H2、一氧化碳CO、甲烷CH4、乙烯C2H4、乙烷C2H6、乙炔C2H2和二氧化碳CO2。

4. 根据权利要求1所述基于集成学习Bagging算法的变压器故障诊断方法,其特征是所述步骤3.1中弱学习算法的训练参数包括核函数类型、核函数参数和惩罚因子。

5. 根据权利要求1所述基于集成学习Bagging算法的变压器故障诊断方法,其特征是所述步骤3.2中的指定概率为50%。

说明书 :

基于集成学习Bagging算法的变压器故障诊断方法

技术领域

[0001] 本发明属于变压器故障诊断技术领域,尤其涉及一种基于Bagging算法的变压器故障诊断方法。

背景技术

[0002] 随着智能电网技术的飞速发展,传统的变压器故障诊断技术也发生巨大的变化,越来越多的智能化方法被引入到故障诊断领域。变压器作为一种常见电力设备,其结构相对复杂、故障种类繁多,如何快速、准确的诊断出变压器故障对于提高其运行维护水平和电力系统安全具有很强的理论及现实意义。目前变压器故障诊断方法主要是使用模式识别领域中的单分类器方法,将油中溶解气体分析技术DGA(Dissolved Gas Analysis)采集到的目标变压器中各个时间监测点的氢气H2、一氧化碳CO、甲烷CH4、乙烯C2H4、乙烷C2H6、乙炔C2H2和二氧化碳CO2等七种气体的含量,及各个时间监测点对应的变压器运行状态(包括“正常、低温过热故障、中温过热故障、高温过热故障、局部放电故障、低能放电故障、低能放电兼过热故障、电弧放电故障、电弧放电兼过热故障”)作为数据样本进行训练,从而得到基于单分类器的变压器故障诊断模型,该过程主要包括三个部分,分别是构造样本集、分类器训练、故障诊断。
[0003] 构造样本集是将变压器历史运行记录转化为模式识别算法可读的数据样本集,即将油中溶解气体分析技术DGA采集到的各个时间监测点的七种气体含量作为模式识别算法的输入向量,将各个时间监测点对应的变压器运行状态作为模式识别算法的输出向量。
[0004] 分类器训练是将样本集输入到已选定的某种模式识别算法,通过对样本集的训练,得到精度满足要求的分类器,并将分类器作为变压器故障诊断模型。这是整个故障诊断过程最重要的一步。
[0005] 故障诊断是将待诊断记录样本输入分类器,从而得到故障诊断结果。
[0006] 目前变压器故障诊断方法,主要是利用决策树、神经网络、支持向量机等单分类器方法,而这些单分类器方法均为不稳定分类算法,所谓不稳定分类算法就是指训练样本集发生一个微小的变化,分类器的分类结果就会产生巨大变化。虽然经多年研究,通过各种群智能优化算法已使单分类器的稳定性有所提高,但其仍存在误差相对较大、易出现过拟合现象、计算过程复杂等难以克服的问题。为此本发明采用集成学习Bagging算法,并使用球向量机BVM作为Bagging算法的弱学习算法,完成变压器故障诊断,有效改善了诊断精度。

发明内容

[0007] 针对上述背景技术中提到的基于单分类器的故障诊断技术因易出现过拟合现象而导致的诊断误差大、计算过程复杂等不足,本发明提出了一种基于集成学习Bagging算法的变压器故障诊断方法。
[0008] 本发明的技术方案是,基于集成学习Bagging算法的变压器故障诊断方法,其特征是所述方法包括以下步骤:
[0009] 步骤1:数据采集及数据预处理,得到初始历史数据样本集S;
[0010] 步骤2:将初始历史数据样本集S构造成集成学习Bagging算法中弱学习算法可读的数据集Ssample,选定球向量机BVM作为弱学习算法;
[0011] 步骤3:选定球向量机BVM作为集成学习Bagging算法中的弱学习算法并对该弱学习算法循环调用,完成样本集Ssample的训练,从而得到弱学习机序列,序列中包含各代弱学习机hi,该序列即为强学习机H;
[0012] 步骤4:将强学习机H作为故障诊断模型,并将当前待故障诊断的数据样本输入到强学习机H,强学习机H利用其各个弱学习机hi做初步故障诊断,进而以投票的方式判定当前待测数据样本的故障类别,得票数多的故障类别即为强学习机H的最终诊断结果;
[0013] 所述步骤1包括以下步骤:
[0014] 步骤1.1:数据采集:采集目标变压器各个时间监测点的气体含量及运行状态;
[0015] 步骤1.2:数据预处理:设定时间监测点的气体含量及运行状态的特征属性,构成初始历史数据样本集S。
[0016] 所述步骤1.1中数据采集的方法为油中溶解气体分析技术DGA。
[0017] 所述步骤1.1中气体包括氢气H2、一氧化碳CO、甲烷CH4、乙烯C2H4、乙烷C2H6、乙炔C2H2和二氧化碳CO2。
[0018] 所述步骤2包括以下步骤:
[0019] 步骤2.1:数据归一化:将初始历史数据样本集S中气体的含量值按照各自的取值范围全部归一化到[0,1]区间;
[0020] 步骤2.2:数值化处理:将变压器运行的运行状态设定为数值型类别标号;
[0021] 步骤2.3:将初始历史数据样本集S中的气体含量作为故障诊断模型的输入向量;将初始历史数据样本集S中的变压器的运行状态作为故障诊断模型的输出向量,故障诊断模型的输入向量和输出向量构成了数据集Ssample。
[0022] 所述步骤3具体包括下列步骤:
[0023] 步骤3.1:对集成学习Bagging算法初始化,设定Bagging算法最大迭代次数t,并设定弱学习算法的训练参数;
[0024] 步骤3.2:以指定概率从数据集Ssample中有放回地选取样训练本子集Si,i∈[1,…t],作为弱学习算法的训练样本子集Si;
[0025] 步骤3.3:将训练样本子集Si输入到弱学习算法训练,得到对应的弱学习机hi;
[0026] 步骤3.4:检查当前集成学习Bagging算法是否达到算法的最大迭代次数t,若已达到,则执行步骤3.5;否则,返回步骤3.2;
[0027] 步骤3.5:输出弱学习机序列,即强学习机H。
[0028] 所述步骤3.1中弱学习算法的训练参数包括核函数类型、核函数参数和惩罚因子。
[0029] 所述步骤3.2中的指定概率为50%。
[0030] 本发明利用集成学习Bagging算法并行生成多个弱学习机来完成对目标问题的求解。采用本发明对变压器故障进行诊断,不但克服了原有基于单分类器故障诊断技术的缺陷,而且提高了诊断的准确率。

附图说明

[0031] 图1为本发明方法的流程图;
[0032] 图2为变压器故障诊断样本集的生成过程的流程图;
[0033] 图3为集成学习Bagging算法训练弱学习机的流程图;
[0034] 图4为强学习机诊断变压器故障过程的示意图。

具体实施方式

[0035] 下面结合附图,详细说明本发明方法的实施过程。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
[0036] 变压器运行数据采集是故障诊断的前提,只有准确、充分的数据样本才能保证故障诊断方法的有效性。为此,本发明采用油中溶解气体分析技术DGA(Dissolved Gas Ahalysis)收集目标变压器中各个时间监测点的氢气H2、一氧化碳CO、甲烷CH4、乙烯C2H4、乙烷C2H6、乙炔C2H2和二氧化碳CO2等七种气体的含量,并记录各个时间监测点的变压器运行状态“正常、低温过热故障、中温过热故障、高温过热故障、局部放电故障、低能放电故障、低能放电兼过热故障、电弧放电故障、电弧放电兼过热故障”,通过数据归一化处理及数值化处理构造出变压器运行数据集。进而将数据集按照Bagging算法中弱学习算法要求改造成样本集,并将改造好的样本集输入集成学习Bagging算法,由集成学习Bagging算法调用弱学习算法进行样本集训练以得到各代弱学习机,再将各代弱学习机组合成强学习机。最后利用强学习机完成变压器故障诊断。这样从局部到整体,使集成学习Bagging算法能诊断更一般的变压器故障问题。
[0037] 图1是本发明方法的流程图,可以看出,本发明方法包括如下步骤:
[0038] 步骤1:数据采集及数据预处理,得到初始历史数据样本集S;
[0039] 步骤2:将初始历史数据样本集S构造成集成学习Bagging算法中弱学习算法可读的数据集Ssample;
[0040] 步骤3:选定球向量机BVM作为集成学习Bagging算法中的弱学习算法并对该弱学习算法循环调用,完成样本集Ssample的训练,从而得到一个弱学习机序列h={h1,h2,…ht},t为集成学习Bagging算法设定的迭代次数,弱学习机序列中的每一个hi代表第i代弱学习机,i∈[1,…t],弱学习机序列h={h1,h2,…ht}即为强学习机H,j∈[1,+∞];
[0041] 步骤4:将强学习机H作为故障诊断模型,并将当前待故障诊断的数据样本输入到强学习机H,强学习机H利用其中各个弱学习机hi做初步故障诊断,进而以投票的方式判定当前待测数据样本的故障类别,得票数多的故障类别为强学习机H最终诊断结果;
[0042] 设已知某台变压器一段连续时间的运行状态记录,按照步骤1的方法进行数据采集和数据预处理:记录中包含的信息有时间监测点、“氢气H2、一氧化碳CO、甲烷CH4、乙烯C2H4、乙烷C2H6、乙炔C2H2和二氧化碳CO2”七种气体含量的监测数据、以及变压器的运行状态“正常、低温过热故障、中温过热故障、高温过热故障、局部放电故障、低能放电故障、低能放电兼过热故障、电弧放电故障、电弧放电兼过热故障”,现按照图2的方法将设备记录改造成集成学习Bagging算法中弱学习算法可读的样本集。
[0043] 首先,样本集中每条样本均包含9个特征属性,其中第一条为该样本的时间监测点,第2至第8条特征属性分别对应时间监测点和该时间监测点的氢(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)含量,第9条特征属性对应变压器当时的运行状态;
[0044] 其次,执行步骤2.1:数据归一化,初始历史数据样本集S中氢(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)等七种气体的含量值按照各自的取值范围全部归一化到[0,1]的区间。比如H2的含量最高值为100毫升/小时,最低值为0.1毫升/小时,则按下面公式进行归一化,其中x为未归一化之前的含量,为归一化之后的含量,由此可将所有含量值都约束在[0,1]的值域,
[0045]
[0046] 再次,执行步骤2.2:数值化处理,变压器运行状态分为“正常、低温过热故障、中温过热故障、高温过热故障、局部放电故障、低能放电故障、低能放电兼过热故障、电弧放电故障、电弧放电兼过热故障”等九种状态,因而基于集成学习Bagging算法的变压器故障诊断模型共有九种诊断结果,分别对应变压器的九种运行状态,将九种运行状态设定为“-4、-3、-2、-1、0、+1、+2、+3、+4”等九个数值型类别标号。
[0047] 最后,执行步骤2.3:将初始历史数据样本集S中氢(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)等七种气体的含量值作为故障诊断模型的输入向量,即集成学习Bagging算法中弱学习算法BVM的输入向量,将初始历史数据样本集S中变压器的运行状态作为故障诊断模型的输出向量,即集成学习Bagging算法中弱学习算法BVM的输出向量,至此已将初始历史数据样本集S构造成集成学习Bagging算法中弱学习算法可读的数据集Ssample,数据集Ssample中包含故障诊断模型的输入向量和输出向量。
[0048] 将数据集Ssample输入到集成学习Bagging算法,以完成变压器故障诊断模型的训练。与其他集成学习方法不同的是:集成学习Bagging算法通过并行生成多个弱学习机完成对目标问题的求解。对于固定的初始样本集,集成学习Bagging算法采用有放回的方式每次以随机概率抽取相同个数的样本组成样本子集,并输入弱学习算法训练,从而得到弱学习机序列,该序列即为强学习机。最终分类判别时,根据各个弱学习机的判别结果投票决定待分类样本的类别归属。集成学习Bagging算法可以有效地提高泛化能力,因为其每次样本子集生成过程均为有放回的随机抽取Bootstrap Aggregating方法,因而各个弱学习机之间不存在依赖关系,保证了集成学习Bagging算法的可靠性。
[0049] 集成学习Bagging算法的详细训练过程如图3,主要包括下列步骤:
[0050] 步骤3.1:对集成学习Bagging算法初始化,选用球向量机BVM作为弱学习算法,并设定球向量机BVM的训练参数,如核函数类型、核函数参数、惩罚因子等;
[0051] 步骤3.2:以指定概率从数据集Ssample中有放回的选取样本子集Si,i∈[1,…t],t为Bagging算法最大迭代次数,样本子集Si作为球向量机BVM的训练样本集,具体选取规则采用Bootstrap Aggregating方法,即某个样本可能在不同子训练集中反复出现,也可能从不出现;
[0052] 步骤3.3:将样本子集Si输入到球向量机BVM中做训练,得到对应的弱学习机hi,i∈[1,t],t为算法最大迭代次数;
[0053] 步骤3.4:检查当前集成学习Bagging算法的执行步骤是否达到迭代次数t,若已达到,则执行步骤3.5;否则,返回步骤3.2;
[0054] 步骤3.5:输出弱学习机序列h={h1,h2,…ht},即最终强学习机H。
[0055] 特别注意的是在步骤3.1中的训练过程是利用球向量机BVM完成对样本数据的训练。球向量机BVM改进于支持向量机SVM(Support Vector Machine)。球向量机BVM的改进在于利用最小包含球算法MEB(Minimum Enclosing Ball)代替了支持向量机SVM中的凸二次规划,从而大大节省了运算时间。最小包含球算法MEB算法理论基础来自于“计算几何(Computational Geometry)”。球向量机BVM利用最小包含球算法MEB算法求解原n维欧n氏空间R 中目标问题Φ,其过程如下:
[0056] (1)将原n维欧氏空间Rn中的目标问题Φ映射到Hilbert空间,并在Hilbert空间中构造对偶问题Φ′。
[0057] (2)根据对偶问题Φ′的样本集S构造初始球。
[0058] (3)迭代求解样本集S的核子集Se,即完成对偶问题Φ′到最小闭包球MEB问题的转化。设c、r分别为初始球的重心和半径,使用B(c,r)表示一个重为c,半径为r的球,r∈[0,R],r的上限为R,当r增加到R时,此时的球即为MEB球。再设误差阈值δ>0,球B(c,(1+δ)r)视为MEB(S)的(1+δ)近似球。则核子集Sc可定义为:若真子集Sc以因子(1+δ)扩展的最小闭包球MEB包含了所有S中的样本点,即: 其中B(c,R)=MEB(Sc),则真子集Sc称为S的核子集。
[0059] (4)在中心约束条件下,求解最小闭包球MEB问题,即求解原n维欧氏空间Rn的目标问题Φ。
[0060] 完成变压器故障诊断模型构造后,将待诊断变压器记录输入到强学习机H,以得到诊断结果,具体包括步骤4,如图4:
[0061] 步骤4:将强学习机H作为故障诊断模型,并将当前待故障诊断的数据样本输入到强学习机H,强学习机H利用其中各个弱学习机hi做初步故障诊断,进而以投票的方式判定当前待测数据样本的故障类别,即得票数多的故障类别为强学习机H最终诊断结果(“弱学习机hi投票过程”为步骤44);
[0062] “弱学习机投票过程”阐述,因为强学习机为若干弱学习机的组合,而对于同一条待测样本各弱学习机的故障诊断结果不尽相同,因此需投票决定该待测样本的最终诊断结果。下面举例说明:
[0063] 设有某条待测样本,以及“正常、低温过热故障、中温过热故障、高温过热故障、局部放电故障、低能放电故障、低能放电兼过热故障、电弧放电故障、电弧放电兼过热故障”等九种变压器运行状态,十五个弱学习机h1,h2,Λ,h15。十五个弱学习机的故障诊断结果分别为11个“低温过热故障”、3个“低能放电兼过热故障”、1个“低能放电故障”,则该待测样本的最终诊断结果为“低温过热故障”。
[0064] 若某条待测样本的故障诊断结果出现无法确定的情况,如诊断“正常”的弱学习机数和诊断“低温过热故障”的弱学习机数相同,则需对该待测样本重新进行故障诊断。经研究,Bagging算法中出现上述情况的可能性会随着弱学习机个数的增加而逐渐减小。
[0065] 经过上述4个步骤的训练学习之后,形成基于集成学习Bagging算法的变压器故障诊断模型,从而实现对待故障诊断设备记录的精确诊断。
[0066] 本发明在诊断变压器故障方面,相比传统单分类器方法,有较好的诊断精度,提高了变压器故障诊断算法的实用性。
[0067] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。