一种基于局部敏感哈希的发电机设备隐患预警方法转让专利

申请号 : CN202110590832.3

文献号 : CN113268552B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李志军王朋卢应强乔苏朋陈果曹玲燕赵海平

申请人 : 江苏国电南自海吉科技有限公司

摘要 :

本发明提供了一种基于局部敏感哈希的发电机设备隐患预警方法。所述方法包括:获取训练数据构建多维样本空间;构建哈希函数族;从中随机选取哈希函数对样本点数据进行处理,得到数据的映射向量;把具有相同映射向量的样本点划分到一个数据类;把具有相同样本点的数据类进行合并;记录合并后每一个数据类的特征信息并存储到数据库中;对于新接收的实时数据,遍历所有的数据类,并尝试划分到某个类中;如果新的样本数据不属于任何一个类,则认为该数据代表某种潜在的故障征兆。所述系统包括:训练数据获取模块;数据处理及工况识别模块;数据库;实时数据接收模块;实时数据分析模块;隐患预警输出模块。

权利要求 :

1.一种基于局部敏感哈希的发电机设备隐患预警方法,其特征在于,包括以下步骤:(1)分析并提取影响发电机设备故障的机组相关特征和影响因素,形成历史发电机特征向量,得到样本集[x1,x2,x3,x4,...x20],其中x1,x2,x3,x4,…,x20为发电机相关特征历史数据值;

(2)对样本集[x1,x2,x3,x4,...x20]进行数据预处理,剔除[x1,x2,x3,x4,...x20]中机组异常状态下的数据值,保留机组的正常状态值;

(3)构建一系列具有统一映射规则的哈希函数族,用于把多维的样本集数据点映射为一个整型向量,即映射向量;

(4)从步骤(3)中构建的哈希函数族中,随机选取M组哈希函数,每组由N个哈希函数组成,使用这些哈希函数对样本空间中的所有样本点进行处理,得到每个样本的映射向量;

(5)在M组哈希函数中,把每一组中的具有相同映射向量的样本点划分为一个数据类;

遍历所有的数据类,把具有相同样本点的数据类进行合并;合并后所得到的每一个数据类,即代表设备正常运行过程中的一种工况;

(6)记录合并后所有数据类的特征信息,并存储到数据库;

(7)对于新接收的实时数据值,按照上述步骤(2)‑步骤(5),遍历所有的数据类,并尝试划分到某个数据类中;如果新的实时数据值无法划分到任何一个数据类,则认为该数据值不符合正常运行工况,即判定该数据值代表潜在故障征兆;

所述步骤(1)中,发电机相关特征历史数据值包括机组有功、机组油温、机组油槽油位、机组转速、定子瓦温、压力以及流量的历史时刻值;

所述步骤(1)中,x1,x2,x3,x4,…,x20为前一整年发电机相关特征历史数据值;

所述步骤(4)中,通过p稳定分布构建哈希函数族,则P取2时,定义的哈希函数族为:ha,b(v)=(a*v+b)/r,其中,向量v是样本数据值,向量a是由p稳定分布产生的与v维度相同的随机向量,b是(0,r)里的随机数,r是直线的分段长度;选取不同的a和b,构成多个哈希函数,从而构成哈希函数族;

所述步骤(4)中,M组哈希函数记为{F1(·),F2(·),…,FM(·)},其中Fi(·)=(h1(·),h2(·),…,hN(·)),则样本集数据点经过Fi(·)被映射成一个整型向量(X1,X2,…,XN),这个向量便是这个样本集数据点的标识;

所述步骤(3)中,哈希函数族的构建需要满足如下两个约束:

1)能够高效地把样本集数据点映射为一个整型向量;

2)哈希函数族中所有函数设定不同的参数,但必须遵从统一的映射原则;

所述步骤(6)中,特征信息包括:数据类的编号、所含样本点数量及时间戳、每个数据维度的最大值和最小值,其中,每个数据维度是原始数据维度,而非映射后的数据。

2.根据权利要求1所述的一种基于局部敏感哈希的发电机设备隐患预警方法建立的发电机隐患预警系统,其特征在于,所述发电机隐患预警系统包括如下模块:训练数据获取模块,用于获取用于训练的样本数据;

数据处理及工况识别模块,其使用所述的基于局部敏感哈希的发电机设备隐患预警方法对训练数据获取模块获取的样本数据进行处理,得到一系列的数据类及其特征信息;

数据库,用于存储数据处理及工况识别模块得到数据类及其特征信息;

实时数据接收模块,用于接收发电机设备运转的实时数据值;

实时数据分析模块,用于判定每一批新接收的实时数据值是否符合某一正常运行工况;

隐患预警输出模块,其对于不符合正常运行工况的数据值,输出隐患预警。

3.一种电子设备,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序以实现如权利要求1所述的一种基于局部敏感哈希的发电机设备隐患预警方法。

4.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1所述一种基于局部敏感哈希的发电机设备隐患预警方法。

说明书 :

一种基于局部敏感哈希的发电机设备隐患预警方法

技术领域

[0001] 本发明适用于发电机设备隐患预警领域,尤其涉及一种基于局部敏感哈希(Locality Sensitive Hashing,LSH)的发电机设备隐患预警方法。

背景技术

[0002] 发电机是水力发电厂的核心设备。发电机在长时间运转的过程中,受各方面因素的影响,不可避免的会出现各种故障。其中大部分故障的形成是一个隐蔽而缓慢的过程。当
最终出现剧烈的故障表象时,设备已经损坏,需要耗费大量的人力物力进行维修。因此,如
何对运转过程中的设备进行持续监测,提前发现潜在的故障征兆,及时进行人工干预避免
故障发生,是水力发电厂一直在研究的课题。
[0003] 目前,大多数水力发电厂采用了数字化控制系统,能够在设备运转过程中以固定频率采集设备各类数据,从而对设备状态进行实时监测。但是在设备隐患预警方面,大部分
采用固定阈值判定法,此方法存在如下缺陷:
[0004] 1)存在一定的局限性,只能实现单参数阈值判定,无法实现多参数联合判定。
[0005] 2)阈值设定依赖于现场人员的经验,设定过于严苛则产生大量无效预警,设定过于宽松则预警产生时设备已经损坏。

发明内容

[0006] 针对现有技术发电机中隐患预警存在的不足,本发明提供了一种基于局部敏感哈希的发电机设备隐患预警方法。通过大量历史样本数据的训练,构建预警模型,对设备的潜
在故障征兆进行提前预警。
[0007] 本发明采用的技术方案如下:
[0008] 一种基于局部敏感哈希的发电机设备隐患预警方法,包括以下步骤:
[0009] (1)分析并提取影响发电机设备故障的机组相关特征和影响因素,形成历史发电机特征向量,得到样本集[x1,x2,x3,x4,...x20],其中x1,x2,x3,x4,…,x20为发电机相关特征
历史数据值;
[0010] (2)对样本集[x1,x2,x3,x4,...x20]进行数据预处理,剔除[x1,x2,x3,x4,...x20]中机组异常状态下的数据值,保留机组的正常状态值;
[0011] (3)构建一系列具有统一映射规则的哈希函数族,用于把多维的样本集数据点映射为一个整型向量,即映射向量;
[0012] (4)从步骤(3)中构建的哈希函数族中,随机选取M组哈希函数,每组由N个哈希函数组成,使用这些哈希函数对样本空间中的所有样本点进行处理,得到每个样本的映射向
量;
[0013] (5)在M组哈希函数中,把每一组中的具有相同映射向量的样本点划分为一个数据类;遍历所有的数据类,把具有相同样本点的数据类进行合并;合并后所得到的每一个数据
类,即代表设备正常运行过程中的一种工况;
[0014] (6)记录合并后所有数据类的特征信息,并存储到数据库;
[0015] (7)对于新接收的实时数据值,按照上述步骤(2)‑步骤(5),遍历所有的数据类,并尝试划分到某个数据类中;如果新的实时数据值无法划分到任何一个数据类,则认为该数
据值不符合正常运行工况,即判定该数据值代表潜在故障征兆。
[0016] 进一步地,所述步骤(1)中,发电机相关特征历史数据值包括机组有功、机组油温、机组油槽油位、机组转速、定子瓦温、压力以及流量的历史时刻值。
[0017] 进一步地,所述步骤(1)中,x1,x2,x3,x4,…,x20为前一整年发电机相关特征历史数据值。
[0018] 进一步地,所述步骤(4)中,通过p稳定分布构建哈希函数族,则P取2时,定义的哈希函数族为:
[0019]
[0020] 其中,向量v是样本数据值,向量a是由p稳定分布产生的与v维度相同的随机向量,b是(0,r)里的随机数,r是直线的分段长度;选取不同的a和b,构成多个哈希函数,从而构成
哈希函数族。
[0021] 进一步地,所述步骤(4)中,M组哈希函数可以记为{F1(·),F2(·),…,FM(·)},其中Fi(·)=(h1(·),h2(·),…,hN(·)),则样本集数据点经过Fi(·)被映射成一个整
型向量(X1,X2,…,XN),这个向量便是这个样本集数据点的标识。
[0022] 进一步地,所述步骤(3)中,哈希函数族的构建需要满足如下两个约束:
[0023] 1)能够高效地把样本集数据点映射为一个整型向量;
[0024] 2)哈希函数族中所有函数可以设定不同的参数,但必须遵从统一的映射原则。
[0025] 进一步地,所述步骤(6)中,特征信息包括:数据类的编号、所含样本点数量及时间戳、每个数据维度的最大值和最小值,其中,每个数据维度是原始数据维度,而非映射后的
数据。
[0026] 一种根据上述基于局部敏感哈希的发电机设备隐患预警方法建立的发电机隐患预警系统,所述发电机隐患预警系统包括如下模块:
[0027] 训练数据获取模块,用于获取用于训练的样本数据;
[0028] 数据处理及工况识别模块,其使用所述的基于局部敏感哈希的发电机设备隐患预警方法对训练数据获取模块获取的样本数据进行处理,得到一系列的数据类及其特征信
息;
[0029] 数据库,用于存储数据处理及工况识别模块得到数据类及其特征信息;
[0030] 实时数据接收模块,用于接收发电机设备运转的实时数据值;
[0031] 实时数据分析模块,用于判定每一批新接收的实时数据值是否符合某一正常运行工况;
[0032] 隐患预警输出模块,其对于不符合正常运行工况的数据值,输出隐患预警。
[0033] 一种电子设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序以实现上述的一种基于局部敏感哈希的发电机
设备隐患预警方法。
[0034] 一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述一种基于局部敏感哈希的发电机设备隐患预警方法。
[0035] 本发明取得了如下技术效果:
[0036] 与现有技术相比,本发明利用局部敏感哈希方法,既能够对数据进行再降维,同时具有局部寻找匹配能力,不仅使得模型在处理数据方面更加的精致,而且提高了隐患预警
的精度。具体有效增益如下:
[0037] 1、本发明中分析并提取影响发电机设备故障的机组相关特征和影响因素,如机组有功、机组油温、机组油槽油位、机组转速、定子瓦温、压力、流量等历史时刻值,形成发电机
故障特征参量体系,构建了发电机特定的故障模型,实现了对发电机的隐患预警,使得发电
机的隐患预警模型更加可靠;
[0038] 2、本发明中在M组哈希函数中,把每一组中的具有相同映射向量的样本点划分为一个数据类,对于新接收的实时数据,遍历所有的数据类,并尝试划分到某个类中。如果新
的实时数据无法划分到任何一个类,则人为数据不符合正常运行工况,即判定数据代表某
种潜在故障征兆。详细计算了每一类工况下样本的预警信息,使得发电机隐患预警结果更
加准确;
[0039] 此外,本发明主要解决如下技术问题:
[0040] 1)采用多参数联合判定,解决单一参数判定的局限性。
[0041] 2)采用历史数据训练,构建预警模型,减少对人员经验的依赖。
[0042] 3)采用数据驱动的方式,在故障形成初期,精准发现潜在故障征兆。

附图说明

[0043] 图1是本发明一种基于局部敏感哈希(Locality Sensitive Hashing,LSH)的发电机设备隐患预警方法的较佳实施例的流程示意图;
[0044] 图2是本发明一种基于局部敏感哈希(Locality Sensitive Hashing,LSH)算法的发电机设备潜在隐患预警系统的较佳实施例的结构示意图。

具体实施方式

[0045] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不
用于限定本发明。
[0046] 如图1所示,本实施例的一种基于局部敏感哈希的发电机设备隐患预警方法,包括以下步骤:
[0047] (1)分析并提取影响发电机设备故障的机组相关特征和影响因素,形成历史发电机特征向量,得到样本集[x1,x2,x3,x4,...x20],其中x1,x2,x3,x4,…,x20为前一整年发电机
相关特征历史数据值。发电机相关特征历史数据值包括机组有功、机组油温、机组油槽油
位、机组转速、定子瓦温、压力以及流量的历史时刻值。
[0048] 在本发明实施例中,用于训练的历史数据必须是设备正常运行过程中产生的时序数据,不能有设备故障情况下的数据。历史数据中应包含两个或两个以上的物理参数(如:
温度,压力,流量等),且这些参数之间从物理机理上应该是有相关性的。在构建多维样本空
间时,同一个时刻的数据作为多维样本空间中的一个样本点(每一个物理参数作为样本点
的一个维度)。
[0049] 应当理解,历史数据的获取方式有很多种,包括但不限于从数据库读取、从文件读取、从特定数据接口读取等。无论采用何种方式获取数据,均不应构成对本发明权利要求的
影响。
[0050] (2)对样本集[x1,x2,x3,x4,...x20]进行数据预处理,剔除[x1,x2,x3,x4,...x20]中机组异常状态下的数据值,保留机组的正常状态值。
[0051] (3)构建一系列具有统一映射规则的哈希函数族,用于把多维的样本集数据点映射为一个整型向量,即映射向量。
[0052] 哈希函数族的构建需要满足如下两个约束:
[0053] 1)能够高效地把样本集数据点映射为一个整型向量。
[0054] 2)哈希函数族中所有函数可以设定不同的参数,但必须遵从统一的映射原则。
[0055] 应当理解,满足上述约束的构建哈希函数的方式有很多种。无论采用何种方式构建哈希函数,均不应构成对本发明权利要求的影响。
[0056] (4)从步骤(3)中构建的哈希函数族中,随机选取M组哈希函数,每组由N个哈希函数组成,使用这些哈希函数对样本空间中的所有样本点进行处理,得到每个样本的映射向
量。具体为:
[0057] 通过p稳定分布构建哈希函数族,则P取2时,定义的哈希函数族为:
[0058]
[0059] 其中,向量v是样本数据值,向量a是由p稳定分布产生的与v维度相同的随机向量,b是(0,r)里的随机数,r是直线的分段长度。选取不同的a和b,构成多个哈希函数,从而构成
哈希函数族。
[0060] M组哈希函数可以记为{F1(·),F2(·),…,FM(·)},其中Fi(·)=(h1(·),h2(·),…,hN(·)),则样本集数据点经过Fi(·)被映射成一个整型向量(X1,X2,…,XN),这
个向量便是这个样本集数据点的标识。
[0061] 应当理解,哈希函数的构建方式和样本点的数据映射方式有很多种,无论采用何种方式,均不应构成对本发明权利要求的影响。
[0062] (5)在M组哈希函数中,把每一组中的具有相同映射向量的样本点划分为一个数据类。遍历所有的数据类,把具有相同样本点的数据类进行合并。合并后所得到的每一个数据
类,即代表设备正常运行过程中的一种工况。
[0063] (6)记录合并后所有数据类的特征信息,包括:数据类的编号、所含样本点数量及时间戳、每个数据维度的最大值和最小值,其中,每个数据维度是原始数据维度,而非映射
后的数据。并存储到数据库。
[0064] 应当理解,用于存储分类结果的数据库有很多种,无论采用何种数据库,均不应构成对本发明权利要求的影响。
[0065] (7)对于新接收的实时数据值,按照上述步骤(2)‑步骤(5),遍历所有的数据类,并尝试划分到某个数据类中。如果新的实时数据值无法划分到任何一个数据类,则认为该数
据值不符合正常运行工况,即判定该数据值代表潜在故障征兆。
[0066] 在本发明实施例中,对于实时数据是判定的准确性,即监测模型的准确性,依赖于历史数据是否完备,是否能够覆盖设备所有的正常运行工况。从理论上讲,设备的故障模式
是不可穷举的,但是设备的正常运行工况是可以通过足够多的历史数据完全覆盖到的。
[0067] 如图2所示,根据上述基于局部敏感哈希的发电机设备隐患预警方法建立的发电机隐患预警系统,包括如下模块:
[0068] 训练数据获取模块,用于获取用于训练的样本数据。
[0069] 数据处理及工况识别模块,其使用的基于局部敏感哈希的发电机设备隐患预警方法对训练数据获取模块获取的样本数据进行处理,得到一系列的数据类及其特征信息。
[0070] 数据库,用于存储数据处理及工况识别模块得到数据类及其特征信息。
[0071] 实时数据接收模块,用于接收发电机设备运转的实时数据值。
[0072] 实时数据分析模块,用于判定每一批新接收的实时数据值是否符合某一正常运行工况。
[0073] 隐患预警输出模块,其对于不符合正常运行工况的数据值,输出隐患预警。
[0074] 根据上述预警方法可以得到一种电子设备,包括处理器和存储器,存储器用于存储计算机程序,处理器用于执行存储器存储的计算机程序以实现上述的一种基于局部敏感
哈希的发电机设备隐患预警方法。
[0075] 根据上述预警方法还可以得到一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于局部敏感哈希的发电机设备隐患预警方法。
[0076] 以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。