会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 人工智能 / 特征向量 / 一种基于随机森林的断路器机械故障诊断方法及系统

一种基于随机森林的断路器机械故障诊断方法及系统

阅读:1050发布:2021-02-25

IPRDB可以提供一种基于随机森林的断路器机械故障诊断方法及系统专利检索,专利查询,专利分析的服务。并且本发明公开了一种基于随机森林的断路器机械故障诊断方法及系统,包括:建立断路器振动样本数据库;分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;构成原始训练样本集;采集目标断路器的振动信号数据,并对其数据进行预处理;提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。本发明有益效果:两个随机性的引入,使得随机森林具有很好的抗噪声能力。特别适用于断路器的故障诊断,能够提高故障诊断的准确率。,下面是一种基于随机森林的断路器机械故障诊断方法及系统专利的具体信息内容。

1.一种基于随机森林的断路器机械故障诊断方法,其特征在于,包括:采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;

分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;

为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;

采集目标断路器的振动信号数据,并对其数据进行预处理;

提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;

根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。

2.如权利要求1所述的一种基于随机森林的断路器机械故障诊断方法,其特征在于,采集目标断路器的振动信号数据,并对其数据进行预处理,具体为:去除趋势项和噪声。

3.如权利要求1所述的一种基于随机森林的断路器机械故障诊断方法,其特征在于,采用随机森林算法,对断路器的故障进行诊断,具体为:(1)利用bootstrap重采样方法从原始训练样本集中抽取M个特征向量样本生成一个子样本集;

(2)利用每个子样本集,生长为单棵分类树;

(3)在分类树的每个节点处,从M个特征向量中随机挑选m个特征向量,按照节点不纯度最小的原则,从这m个特征向量中选出一个特征向量α作为该节点的分类属性;

(4)根据特征向量α将节点分成2个分支,然后再从剩下的特征向量中寻找分类效果最好的特征向量作为其他节点的分类属性,如此递归构造分类树的分支,使分类树充分生长,每个节点的不纯度达到最小,而不进行剪枝;直到这棵树能准确地分类训练集,或者所有属性使用完;

(5)所有子样本集生成的分类树组成随机森林,对特征向量F进行判别与分类,按分类器的投票多少,输出分类结果。

4.如权利要求3所述的一种基于随机森林的断路器机械故障诊断方法,其特征在于,所述bootstrap重采样方法具体为:从容量为n的原始样本中进行有放回的重复采样,采样样本的容量也为n,每个观测对象被抽到的概率为1/n,每次采样构成的子样本称为bootstrap样本。

5.如权利要求4所述的一种基于随机森林的断路器机械故障诊断方法,其特征在于,随机森林进行bootstrap抽样,在生成每棵决策树的时候,每个节点的特征向量都在随机选出的少数特征向量中产生;因此,不但子样本是随机的,连每个节点特征向量的产生都是随机的。

6.一种基于随机森林的断路器机械故障诊断系统,其特征在于,包括服务器,所述服务器包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;

分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;

为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;

采集目标断路器的振动信号数据,并对其数据进行预处理;

提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;

根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行以下步骤:采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;

分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;

为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;

采集目标断路器的振动信号数据,并对其数据进行预处理;

提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;

根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。

说明书全文

一种基于随机森林的断路器机械故障诊断方法及系统

技术领域

[0001] 本发明涉及电力系统中高压电器设备的检测领域,特别涉及一种基于随机森林的断路器机械故障诊断方法及系统。

背景技术

[0002] 作为电力系统中重要的保护与控制电器,中高压断路器在保障电网安全稳定运行方面起着十分关键的作用,其运行维护也是电力部门日常工作的重要内容。
[0003] 根据1990-1999年全国电力系统配电电压等级开关事故的统计,机械原因故障占总故障类型的39.30%。近年来,各种数据挖掘算法被广泛应用于中高压断路器的机械故障诊断中,并取得了良好的效果,例如基于人工神经网络的诊断系统和基于支持向量机的诊断系统。然而,人工神经网络存在着参数优化难、收敛速度过慢等缺点,支持向量机虽克服了人工神经网络收敛速度慢和过拟合的问题,但也存在处理大样本数据时能力不足以及解决多分类问题精度较低等困难。
[0004] 综上所述,现有数据挖掘算法中对于如何高效的提高机械故障诊断的正确率问题,尚缺乏有效的解决方案。

发明内容

[0005] 本发明为了解决上述问题,提出了一种基于随机森林的断路器机械故障诊断方法及系统,该方法在数据集上表现良好,两个随机性的引入,使得随机森林具有很好的抗噪声能力。
[0006] 为了实现上述目的,本发明采用如下技术方案:
[0007] 本发明的第一目的是公开一种基于随机森林的断路器机械故障诊断方法,包括:
[0008] 采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;
[0009] 分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;
[0010] 为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;
[0011] 采集目标断路器的振动信号数据,并对其数据进行预处理;
[0012] 提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;
[0013] 根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。
[0014] 进一步地,采集目标断路器的振动信号数据,并对其数据进行预处理,具体为:去除趋势项和噪声。
[0015] 进一步地,采用随机森林算法,对断路器的故障进行诊断,具体为:
[0016] (1)利用bootstrap重采样方法从原始训练样本集中抽取M个特征向量样本生成一个子样本集;
[0017] (2)利用每个子样本集,生长为单棵分类树;
[0018] (3)在分类树的每个节点处,从M个特征向量中随机挑选m个特征向量,按照节点不纯度最小的原则,从这m个特征向量中选出一个特征向量α作为该节点的分类属性;
[0019] (4)根据特征向量α将节点分成2个分支,然后再从剩下的特征向量中寻找分类效果最好的特征向量作为其他节点的分类属性,如此递归构造分类树的分支,使分类树充分生长,每个节点的不纯度达到最小,而不进行剪枝;直到这棵树能准确地分类训练集,或者所有属性使用完;
[0020] (5)所有子样本集生成的分类树组成随机森林,对特征向量F进行判别与分类,按分类器的投票多少,输出分类结果。
[0021] 进一步地,所述bootstrap重采样方法具体为:
[0022] 从容量为n的原始样本中进行有放回的重复采样,采样样本的容量也为n,每个观测对象被抽到的概率为1/n,每次采样构成的子样本称为bootstrap样本。
[0023] 进一步地,随机森林进行bootstrap抽样,在生成每棵决策树的时候,每个节点的特征向量都在随机选出的少数特征向量中产生;因此,不但子样本是随机的,连每个节点特征向量的产生都是随机的。
[0024] 本发明的第二目的是公开一种基于随机森林的断路器机械故障诊断系统,包括服务器,所述服务器包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
[0025] 采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;
[0026] 分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;
[0027] 为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;
[0028] 采集目标断路器的振动信号数据,并对其数据进行预处理;
[0029] 提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;
[0030] 根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。
[0031] 本发明的第三目的是公开一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以下步骤:
[0032] 采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;
[0033] 分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;
[0034] 为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;
[0035] 采集目标断路器的振动信号数据,并对其数据进行预处理;
[0036] 提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;
[0037] 根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。
[0038] 本发明的有益效果为:
[0039] 本发明方法在数据集上表现良好,两个随机性的引入,使得随机森林具有很好的抗噪声能力。能够处理很高维度(feature很多)的数据,并且不用做特征选择。特别适用于断路器的故障诊断,能够提高故障诊断的准确率。
[0040] 本发明方法训练速度快,可以得到变量重要性排序。在训练过程中,能够检测到feature间的互相影响。
[0041] 本发明方法容易做成并行化方法,实现比较简单。

附图说明

[0042] 图1为本发明的方法流程图;
[0043] 图2为本发明随机森林方法流程图。具体实施方式:
[0044] 下面结合附图与实施例对本发明作进一步说明。
[0045] 应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
[0046] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0047] 术语解释部分:随机森林,是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。通过对大量原始数据采取有放回的抽样,构建子数据集,再由子数据集构建子决策树。从待选特征中选取分裂特征对子决策树进行分支,将待处理数据经由分裂特征进行编码分类,最终根据在算法中的多次运算分类结果确定待处理数据的分类情况。
[0048] 在本发明的一个实施例中,如图1所示,提供了一种基于随机森林的断路器机械故障诊断方法,包括以下步骤:
[0049] 步骤1、建立样本断路器振动数据库,所述数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据。
[0050] 样本断路器振动数据库的建立,可以选择的方法很多,理论上讲,数据库覆盖的故障越全面,样本数据越多,效果越好。但依据所有的断路器类型及其在现实中的所有故障情况来建立数据库,几乎是不可能的。
[0051] 本发明所倾向的建立数据库的方式是,通过人为调整断路器的不同构件,尽可能多的模拟断路器的各种故障情况,如:电磁铁卡涩(通过在合闸电磁铁的铁芯上施加拉力阻碍铁芯的运动来模拟电磁铁卡涩故障)、软连接松动(将接线端固定软连接的部分螺丝拧松来对软连接故障模式进行模拟实验)、绝缘拉杆松动(通过调整绝缘拉杆备帽来模拟绝缘拉杆松动故障模式)、销轴脱落(通过卸除锁杆上的连接销轴来模拟销轴断裂松脱故障模式)等,并采集此时的振动信号。
[0052] 分别提取每一个振动信号数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量F,为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;
[0053] 其中,时域特征向量包括:最大值F1,均方根值F2,歪度值F3,峭度值F4,波形指标F5,脉冲指标F6,峰值指标F7以及裕度指标F8。
[0054] 均方根值:
[0055] 歪度值:
[0056] 峭度值:
[0057] 峰值指标:
[0058] 波形指标:
[0059] 脉冲指标:
[0060] 裕度指标:
[0061] 其中,x是采集的振动信号数据,N是采集的振动信号个数,RMS是均方根值的英文缩写、σ是标准差。
[0062] 步骤2、采集目标断路器的振动信号,并对其进行如下预处理:去除趋势项和噪声。
[0063] 所谓趋势项是指,由于周围环境对传感器的干扰以及传感器频率范围外低频性能的不稳定等,采集到的振动信号数据往往会偏离基线,且偏离基线的大小会随时间发生变化。偏离基线随时间变化的整个过程即是信号的趋势项。和噪声类似,趋势项也是一种干扰。
[0064] 步骤3、对预处理后的振动信号进行进一步处理,提取特征向量;将得到的时域特征向量组合成为特征向量F;
[0065] 随机森林算法能够在比较简单的特征向量条件下,表现出较好的性能,提取振动信号的时域特征。
[0066] 步骤4、根据得到的原始训练样本集以及特征向量F,运用随机森林算法,将特征向量作为输入对断路器进行故障诊断,如图2所示。
[0067] 所谓随机森林算法的应用,将上述10种特征向量组合成为一种特征向量F,并将对应断路器的无故障和有故障状态分别贴上标签,作为随机森林算法的输入,通过将简单的弱分类器(决策树)的分类结果集成起来,对断路器进行故障诊断。
[0068] 随机森林是由多个决策树{h(x,θk),k=1,2,…,n}组成的分类器,其中{θk}是相互独立且同分布的随机向量,k表示随机森林中决策树的个数,在给定自变量x下,最终由所有决策树综合投票决定输出的结果。
[0069] 随机森林是由多个决策树组成的分类器,如果把决策树比作分类任务中的一个专家,随机森林就是许多专家在一起对某个任务进行分类。
[0070] 如图2所示,随机森林生成的具体步骤如下:
[0071] (1)随机森林每次利用bootstrap重采样方法从原始训练样本集中抽取63.2%的样本生成一个子样本集,每一个子样本对应着一棵分类树。
[0072] (2)利用每个子样本集,生长为单棵分类树。在树的每个节点处,从M个特征向量中随机挑选m个特征向量,根据经验公式,通常取 即m取 的向下整数。按照节点不纯度最小的原则从这m个特征向量中选出一个特征α作为该节点的分类属性。
[0073] (3)根据特征α将节点分成2个分支,然后再从剩下的特征中寻找分类效果最好的特征,如此递归构造分类树的分支,使分类树充分生长,每个节点的不纯度达到最小,而不进行剪枝。直到这棵树能准确地分类训练集,或者所有属性使用完。
[0074] (4)在分类阶段,分类标签是由所有分类树的结果综合而成。随机森林使用的是投票原则。即
[0075]
[0076] 其中,N是森林中决策树的数目,I(*)是示性函数,nhi,c是树hi对类C的分类结果,nhi是树的叶子节点数。
[0077] 将生成的多棵分类树组成随机森林,用随机森林分类器对新的数据进行判别与分类,分类结果按树分类器的投票多少而定。
[0078] 随机森林进行bootstrap抽样,在生成每棵树的时候,每个节点变量都仅仅在随机选出的少数变量中产生。因此,不但样本是随机的,连每个节点变量的产生都是随机的。
[0079] bootstrap方法基本思想是:从容量为n的原始样本中进行有放回的重复采样,采样样本的容量也为n,每个观测对象被抽到的概率为1/n,每次采样构成的子样本称为bootstrap样本。采样次数根据计算量而定。从每个重采样的样本中可以计算某个统计量的bootstrap分布,比如说均值,多个重采样样本的均值构成了原始样本均值的bootstrap分布。其过程一般可用随机数或者计算机输出n个0~1之间的随机数实现。即:先将样本变量编码为1,2,...,n;然后取分组距离1/n将区间[0,1]分成n个互斥的分隔。
[0080]
[0081] 出现的随机数,凡在0~1/n之间的去编码“1”变量,凡在1/n~2/n之间的去编码“2”变量,…,凡在(n-1)/n~之间的去编码“n”变量。
[0082] bootstrap重采样是集成学习算法对原始样本进行采样的方法,也是随机森林算法的一个重要构成部分。
[0083] 本发明进一步公开了一种基于随机森林的断路器机械故障诊断系统,包括服务器,所述服务器包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
[0084] 采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;
[0085] 分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;
[0086] 为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;
[0087] 采集目标断路器的振动信号数据,并对其数据进行预处理;
[0088] 提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;
[0089] 根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。
[0090] 本发明进一步公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以下步骤:
[0091] 采集断路器正常运行以及故障时的振动信号数据,建立断路器振动样本数据库,所述断路器振动样本数据库包含无故障时的断路器振动数据和存在故障时断路器振动数据;
[0092] 分别提取断路器振动样本数据库中每一个振动样本数据的时域特征向量,并将得到的时域特征向量进行组合得到一种特征向量;
[0093] 为得到的每一个特征向量分别添加有故障或者无故障状态标签,构成原始训练样本集;
[0094] 采集目标断路器的振动信号数据,并对其数据进行预处理;
[0095] 提取目标断路器振动信号数据的时域特征向量;将得到的时域特征向量组合成为特征向量F;
[0096] 根据得到的原始训练样本集以及特征向量F,采用随机森林算法,对目标断路器进行故障诊断。
[0097] 上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用