一种基于GPU的改进加权关联规则的设备故障预警与诊断方法转让专利

申请号 : CN201010128662.9

文献号 : CN101819411B

文献日 : 2011-06-15

本发明属于设备故障诊断与预警领域，涉及一种基于图形处理器GPU的改进加权关联规则的设备故障预警与诊断方法。包括如下步骤：构建基于图像处理器GPU的快速关联加权规则算法RARG模型；利用基于图像处理器GPU的改进加权关联规则模型对设备历史监控数据进行挖掘，构建关联规则模式库；监测设备数据，提取特征值；判断特征值是否达到阈值；若达到阈值则设备处于故障状态；若没有到达阈值则设备处于非故障状态，并将相关数据与关联规则模式库相匹配，若匹配成功则设备处于缺陷状态，即有潜在故障；否则，返回重新监测数据。本发明开发了一种基于在图形处理器GPU上实现快速加权关联规则的算法RARG模型，具有重要的应用价值。

1.一种基于图像处理器GPU的设备故障预警和诊断方法，其特征在于包括如下步骤：

1)构建基于图像处理器GPU的快速关联加权规则算法RARG模型，即Rapid association rule on GPU模型，算法描述如下：第一步：在主机上利用神经网络的自组织竞争模型计算权值wj，具体如下：i.设定设备故障信息的三个主要属性：重要程度、易损程度、故障等级作为神经网络的输入；将神经元数目设为3，学习速率设为0.1；

ii.自组织竞争神经网络模型初始化；

iii.设定训练参数net.trainparam.epochs＝200；

iv.通过样本的训练确定神经网络的连接权；

v.利用训练好的网络确定设备故障的加权关联规则的权值；

第二步：在主机上完成初始化，并扫描数据事物集D求得其频繁项目集的最大可能长度Size；

第三步：在主机上生成1-频繁项目候选集C1：扫描事物数据集D，求得1-项目集的支持数，并按照公式①计算每个1-项目集的k-支持期望，每个项目集的最低支持数为该项目集的k-支持期望，1-频繁项目候选集C1由支持度不低于k-支持期望的1-项目集组成；

令I为所有项目的集合，假定Y为一个q-项目集，q＜k，在剩余项目集合(I-Y)中，记前(k-q)个权值最大的项目为ir1，ir2，...，irk-q，那么包含项目集Y的任一k-项目集的最大可能值为其中，第1个和式为q-项目集Y中各项目的权值之和，第2个和式为剩余的前(k-q)个最大权值之和；由于加权关联规则中频繁项集的加权支持度不低于最低加权支持度wminsup，所以如果包含Y的k-项目集是频繁的，那么其最低支持数应为公式：①

其中wminsup为最小加权支持度，T为交易项个数，称该B(Y，k)为Y的k-支持期望，采用向上取整原则以保证包含Y的k-项目集有可能是频繁的；

第四步：在主机上根据k-1-频繁项目候选集Ck-1连接生成k-频繁项目候选集Ck；

第五步：在主机上对k-频繁项目候选集Ck进行第一次剪枝，即利用目前生成的最近最大频繁项目候选集来计算，剪掉不在k-1-频繁项目候选集Ck-1中的k-频繁项目候选集Ck中的候选项目集的子集；

第六步：在GPU上对k-频繁项目候选集Ck进行再次剪枝，具体如下：i.将k-频繁项目候选集Ck加载到设备全局存储器中；

ii.扫描k-频繁项目候选集Ck中的每一项，计算其候选k-项目集的支持度的上界；

iii.将k-频繁项目候选集Ck分为t部分，在t个线程中并行计算所有项目集的k-支持期望；

iv.若支持度计数小于k-支持期望则剪枝；

v.将结果加载到主机；

第七步：在主机上利用事物数据库D，检查各项目集的加权支持度，生成频繁k项目集Lk；；

第八步：在主机上合并L＝L∪Lk；

第九步：在主机上判断若k＜Size，则k+1，返回第四步执行；否则，执行第十步；

第十步：在主机上生成符合最小置信阈值的关联规则L；

2)利用基于图像处理器GPU的加权关联规则模型对设备历史监控数据进行挖掘，构建关联规则模式库；

3)监测设备数据，并对其相关数据进行分析和处理，提取特征值；

4)判断特征值是否达到或超过预设的阈值；

5)若特征值到达或超过了阈值，则说明设备处于故障状态，报警并根据预先设定好的故障诊断方案进行诊断，制定相关故障决策信息，所述相关故障决策信息包括故障等级和类型以及建议处置方案；

6)若特征值没有到达阈值，则说明设备处于非故障状态，将所述被监测设备的相关数据与所述关联规则模式库中保存的关联规则模式相匹配，若匹配成功，则说明被测设备虽然处于非故障状态，但已经处于缺陷状态，即具有潜在的故障风险，制定相关预警决策信息，所述相关预警决策信息包括预警等级和类型以及建议处置方案；否则，返回重新监测设备数据。

一种基于GPU的改进加权关联规则的设备故障预警与诊断

方法

技术领域

[0001] 本发明属于设备故障预警与诊断领域，涉及一种基于GPU的改进加权关联规则的设备故障预警与诊断方法。

背景技术

[0002] 随着现代生产设备日益大型化和复杂化，设备故障现象也随之增多，且带来的损失也在增大。因此，对设备系统实时在线监控，进行设备故障机理研究，建立有效、准确的故障诊断及预警模式和系统的优化运行显得十分重要。

[0003] 目前设备故障诊断领域中应用比较广泛的是采用专家系统基于知识的故障诊断方法。专家系统主要由知识库、推理机和用户接口等部分组成。知识库是专家知识、经验与书本知识的存储器，其中存放着各种故障现象、引起故障的原因及排除故障应采取的措施。专家系统能对机器运行过程中出现的故障进行实时诊断，并根据故障现象快速地查找故障原因。然而，在传统的专家系统中，知识的获取是领域专家和软件工程师协同工作的结果，这一环节存在的问题主要有两个：一是将领域专家的描述转换成规则的知识比较困难；二是由于理解的偏差，软件工程师在与领域专家的交流中，可能会得到对该领域知识的错误描述。当推理机利用一些带有一定的主观性的知识进行推理时，很可能会得到不合理的甚至是错误的结果。因此知识的自动获取已经成为制约智能诊断发展的“瓶颈”。

[0004] 近年来兴起的数据挖掘技术与专家系统有机地相结合，可以很好地解决知识自动获取问题。数据挖掘从大量、不完全、有噪声、模糊、随机的数据中挖掘出隐藏着的对决策生成有重要参考价值的信息，因而能有效地克服以往存在的知识获取瓶颈。将数据挖掘技术应用于机械设备故障诊断系统，可以把现场产生的大量原始数据转化为有价值的知识，为专家发掘他们感兴趣的信息，还能描述机械设备故障的演变趋势，为专家提供决策支持信息。因此，将数据挖掘技术应用在机械故障诊断中，将大大推动故障诊断技术的发展。

发明内容

[0005] 本发明的目的是为了克服现有技术存在的问题，采用加权关联规则算法对企业的设备运行数据进行监测和分析，不仅能发现并识别设备故障状态，而且可以找出偏离常规运行状态但尚未达到设备故障的参数点的关联规则模式，从而起到企业设备故障预警的作用。

[0006] 同时，本发明考虑到复杂工业过程中设备的故障状态错综复杂，靠单一因素不能很好的确定权重，提出了基于自组织竞争神经网络的多因素权重法，将设备故障信息的三个主要属性：重要程度、易损程度、故障等级作为自组织竞争神经网络模型的输入，通过样本的训练来确定其神经网络的连接权，从而确定设备故障的加权关联规则的权值。该方法即体现了专家的经验知识又考虑了复杂的故障因素。

[0007] 在传统加权关联规则算法中，计算量主要由于频繁候选项目集多，因此计算量比较大。本发明对传统的加权关联规则进行了改进，将不可能成为频繁项目集的元素提前删除，以减少计算量。即在第一次遍历之后就不用数据库来计算支持度，而用目前生成的最近最大频繁项目候选集来计算，并且利用上一步中生成的频繁项目集对最近最大频繁项目候选集进行筛选，将不符合最小支持度的元素从最近最大频繁项目候选集中删除，以缩小最近最大频繁项目候选集。

[0008] 由于设备故障诊断和预警需要较强的实时性，利用加权关联规则方式对其进行挖掘时间较长，目前已有很多系统对加权关联规则算法进行了有效的优化，尽管改进的算法在一定程度上提高了挖掘的速度，但由于算法受到CPU串行模式编程模型的限制，仍不能满足快速对大量数据进行挖掘的需要。本发明引入并行计算，在研究改进加权关联规则算法的基础上，针对设备故障诊断和预警的特殊性，利用图形处理器GPU的多线程并行能力计算改进加权关联规则算法的关键步骤，并开发了一种在图形处理器GPU上实现快速加权关联规则的算法RARG(Rapid association rule on GPU)，经试验证明，该方法可以加快挖掘速度，在保证准确率的同时方便用户使用。该实用新型在实际中有很强的应用价值。

[0009] 基于GPU的设备故障预警和诊断方法包括如下步骤：

[0010] 1)构建基于图像处理器GPU的快速关联加权规则算法RARG模型，算法描述如下：

[0011] 第一步：设数据事物集D，I＝{i1，i2，…，im}是项的集合，其中的元素称为项(item)。记D为交易T的集合，这里交易T是项的集合，并且对应每一个交易有唯一的标识。设x是一个I中项的集合，如果那么称交易T包含x。

[0012] 一个关联规则是形如的蕴涵式，这里并且x∩y＝Φ。

[0013] 定义一：在事物数据库D中的支持度是事物集中包含x和y的事物数与所有事物数之比，记为support(x∪y)，即：

[0014]

[0015] 定义二：在事物集中的可信度是指包含x和y的事务数与包含x的事物数之比，记为即：

[0016]

[0017] 设为每一个项目ij赋以权值wj，其中0≤wj≤1，j＝{1，2，...，n}。

[0018] 定义三：加权关联规则中定义加权支持度为公式：

[0019]

[0020] 定义四：若一个k-项目集被称为频繁项目集，则加权支持度不低于最低加权支持度wminsup，即公式

[0021]

[0022] 定义五：若X∪Y是频繁项目集，则置信度不低于最低置信阈值minconf[0023] 第二步：在主机上利用神经网络的自组织竞争模型计算权值wj，具体如下：

[0024] i.设定设备故障信息的三个主要属性：重要程度、易损程度、故障等级作为神经网络的输入；将神经元数目设为3，学习速率设为0.1

[0025] ii.自组织竞争神经网络模型初始化；

[0026] ii i.设定训练参数net.trainparam.epochs＝200；

[0027] iv.通过样本的训练确定神经网络的连接权；

[0028] v.利用训练好的网络确定设备故障的加权关联规则的权值。

[0029] 第三步：在主机上完成初始化，并扫描数据事物集D求得其频繁项目集的最大可能长度Size；

[0030] 第四步：在主机上生成1-频繁项目候选集C1：扫描事物数据集D，求得1-项目集的支持数，并按照公式①计算每个1-项目集的k-支持期望，每个项目集的最低支持数为该项目集的k-支持期望。1-频繁项目候选集C1由支持度不低于k-支持期望的1-项目集组成；

[0031] 令I为所有项目的集合，假定Y为一个q-项目集，q＜k。在剩余项目集合(I-Y)中，记前(k-q)个权值最大的项目为ir1，ir2，...，irk-q，那么包含项目集Y的任一k-项目集的最大可能值为

[0032]

[0033] 其中，第1个和式为q-项目集Y中各项目的权值之和，第2个和式为剩余的前(k-q)个最大权值之和。由定义2可知，如果包含Y的k-项目集是频繁的，那么其最低支持数应为

[0034] ①

[0035] 其中wminsup为最小加权支持度，T为交易项个数，称该B(Y，k)为Y的k-支持期望。采用向上取整原则以保证包含Y的k-项目集有可能是频繁的；

[0036] 第五步：在主机上根据k-1-频繁项目候选集Ck-1连接生成k-频繁项目候选集Ck；

[0037] 第六步：在主机上对k-频繁项目候选集Ck进行第一次剪枝，即利用目前生成的最近最大频繁项目候选集来计算，剪掉不在k-1-频繁项目候选集Ck-1中的k-频繁项目候选集Ck中的候选项目集的子集；

[0038] 第七步：在GPU上对k-频繁项目候选集Ck进行再次剪枝，具体如下：

[0039] i.将k-频繁项目候选集Ck加载到设备全局存储器中；

[0040] ii.扫描k-频繁项目候选集Ck中的每一项，计算其候选k-项目集的支持度的上界；

[0041] iii.将k-频繁项目候选集Ck分为t部分，在t个线程中并行计算所有项目集的k-支持期望；

[0042] iv.若支持度计数小于k-支持期望则剪枝；

[0043] v.将结果加载到主机；

[0044] 第八步：在主机上利用事物数据库D，检查各项目集的加权支持度，生成频繁k项目集Lk；

[0045] 第九步：在主机上生成L＝L∪Lk；

[0046] 第十步：在主机上判断若k＜Size，则k+1，返回第五步执行；否则执行第十一步；

[0047] 第十一步：在主机上生成符合最小置信阈值的关联规则L；

[0048] 2)利用基于图像处理器GPU的加权关联规则模型对设备历史监控数据进行挖掘，构建关联规则模式库；

[0049] 3)监测设备数据，并对其相关数据进行分析和处理，提取特征值；

[0050] 4)判断特征值是否达到或超过预设的阈值；

[0051] 5)若特征值到达或超过了阈值，则说明设备处于故障状态，报警并根据预先设定好的故障诊断方案进行诊断，制定相关故障决策信息，所述相关故障决策信息包括故障等级和类型以及建议处置方案；

[0052] 6)若特征值没有到达阈值，则说明设备处于非故障状态，将所述被监测设备的相关数据与所述关联规则模式库中保存的关联规则模式相匹配，若匹配成功，则说明被测设备虽然处于非故障状态，但已经处于缺陷状态，即具有潜在的故障风险，制定相关预警决策信息，所述相关预警决策信息包括预警等级和类型以及建议处置方案；否则，返回重新监测设备数据。

[0053] 本发明与现有技术相比具有以下有益效果：

[0054] 1.本发明采用加权关联规则算法对企业的设备运行数据进行监测和分析，不仅能识别设备故障状态，而且可以找出偏离常规运行状态但尚未达到故障的参数点的关联规则模式，从而起到企业设备故障预警的作用。

[0055] 2.考虑到复杂工业过程中设备的故障状态错综复杂，靠单一因素不能很好的确定权重，本发明提出了基于自组织竞争神经网络模型的多因素权重法对加权关联规则算法进行改进。该方法即体现了专家的经验知识又考虑了复杂的故障因素。

[0056] 3.本发明对传统的加权关联规则进行了改进，将不可能成为频繁项目集的元素提前删除，以减少计算量。即在第一次遍历之后就不用数据库来计算支持度，而用目前生成的最近最大频繁项目候选集来计算，并且利用上一步中生成的频繁项目集对最近最大频繁项目候选集进行筛选，将不符合最小支持度的元素从最近最大频繁项目候选集中删除，以缩小最近最大频繁项目候选集。

[0057] 4.由于设备故障诊断和预警需要较强的实时性，利用加权关联规则方式对其进行挖掘时间较长，目前已有很多系统对加权关联规则算法进行了有效的优化，尽管改进的算法在一定程度上提高了挖掘的速度，但由于算法受到CPU串行模式编程模型的限制，仍不能满足快速对大量数据进行挖掘的需要。本发明引入并行计算，在研究改进加权关联规则算法的基础上，针对设备故障诊断和预警的特殊性，开发了一种基于图形处理器GPU上实现快速加权关联规则的算法RARG，经试验证明，该方法可以加快挖掘速度，在保证准确率的同时方便用户使用。

附图说明

[0058] 图1是基于GPU的加权关联规则的设备故障预警与诊断方法的流程图具体实施方式

[0059] 下面结合某钢铁公司设备对本发明的技术方案作进一步的描述。

[0060] 某钢铁公司大型锻压系统主要由A、B、C三个设备组成，在该系统的数据库中存储了以前大量的运行数据(包括正常状态和故障状态)，包括易损程度(设备损坏次数)、故障等级、专家给定的重要程度以及三个设备上的采样点：温度、压力、震动、转速和故障原因。

[0061] 实施步骤如下：

[0062] 1)首先构建基于图像处理器GPU的快速关联加权规则算法RARG模型，构建方法如技术方案所述；

[0063] 2)从数据库中获取温度、压力、震动、转速、易损程度(设备损坏次数)、故障等级和故障原因的样本数据，清洗去除不一致数据；为了防止具有较大值的属性相对于较小值的属性权重过大，将数据进行归一化处理；再将上述归一化处理的数据按比例缩放，使他们都落在[0，1]上，建立设备监控数据集。

[0064] 3)将上一步得到的设备监控数据集中的连续性历史数据进行聚类分析和离散化，得到各类数据所属聚类范围的概化结果，从而得到概化后的设备监控数据集。

[0065] 4)利用基于图像处理器GPU的快速加权关联规则RARG模型，以易损程度(设备损坏次数)、故障等级、专家给定的重要程度作为输入求得加权关联规则的权值，并利用对概化后的设备监控数据进行挖掘，构建关联规则模式库；设温度T、压力P、震动S、转速R与故障原因RE的关联规则为：X->Y[wminsup，minconf.]，其中X＝{T、P、S、R}，Y＝{RE}，wminsup为加权最小支持度，min conf.为置信度。

[0066] 5)监测设备数据，并对其相关数据进行分析和处理，提取特征值；

[0067] 6)判断特征值是否达到或超过预设的阈值；

[0068] 7)若特征值到达或超过了阈值，则说明设备处于故障状态，报警并根据预先设定好的故障诊断方案进行诊断，制定相关故障决策信息，所述相关故障决策信息包括故障等级和类型以及建议处置方案；

[0069] 8)若特征值没有到达阈值，则说明设备处于非故障状态，将所述被监测设备的相关数据与所述关联规则模式库中保存的关联规则模式相匹配，从而得出匹配度最高的结论。匹配结论存在以下情况：

[0070] i.若关联规则模式库中只有一条完全匹配，则说明被测设备虽然处于非故障状态，但已经处于该匹配项的缺陷状态，即具有潜在的该故障风险，制定相关预警决策信息，所述相关预警决策信息包括预警等级和类型以及建议处置方案；

[0071] ii.若关联规则模式库中只有多条匹配，则按照加权支持度和关联度由高到低排序，选择支持度最高的第一条结论作为匹配结果，并制定相关预警决策信息，所述相关预警决策信息包括预警等级和类型以及建议处置方案；

一种基于GPU的改进加权关联规则的设备故障预警与诊断方法转让专利

申请号 : CN201010128662.9

文献号 : CN101819411B

文献日 : 2011-06-15

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 刘晶 , 朱清香

申请人 : 燕山大学

摘要 :

权利要求 :

说明书 :

一种基于GPU的改进加权关联规则的设备故障预警与诊断

技术领域

背景技术

发明内容

附图说明