生产设备的故障诊断知识图谱的构建方法及诊断方法转让专利
申请号 : CN202211053217.X
文献号 : CN115146081B
文献日 : 2022-12-09
发明人 : 令狐彬 , 胡炳彰 , 周璠 , 许鹏 , 张鲜顺 , 高磊
申请人 : 合肥中科迪宏自动化有限公司
摘要 :
权利要求 :
1.一种生产设备的故障诊断知识图谱的构建方法,其特征在于,包括:获取故障维修文本;
从所述故障维修文本中确定多个实体,并建立所述实体之间的关系,其中,所述实体包括故障现象;
获取用户对所述故障诊断知识图谱推荐的各个所述故障现象的历史评分,并根据所述历史评分确定所述故障现象之间的相似度;
根据多个所述实体、所述实体之间的关系以及所述故障现象之间的相似度对所述故障诊断知识图谱进行更新;
所述根据所述历史评分确定所述故障现象之间的相似度,包括:将两个所述故障现象的文本进行分词和词汇去重处理,并统计所述故障现象的文本中所有词汇的词频;
根据两个所述故障现象的词频确定两个所述故障现象的初始相似度;
根据所述历史评分确定两个所述故障现象的权重系数;
根据所述初始相似度和所述权重系数得到所述故障现象之间的相似度;
其中,更新好的所述故障诊断知识图谱被配置为:
获取用户输入的故障描述文本;
利用训练好的实体抽取模型对所述故障描述文本进行实体抽取,得到多个实体信息;
根据各个所述实体信息,在所有所述故障现象中确定多个第一标准故障现象;
根据各所述第一标准故障现象与其他所述故障现象之间的相似度,确定与各所述第一标准故障现象相关的第二标准故障现象;
将多个所述第一标准故障现象和多个所述第二标准故障现象推荐给用户。
2.根据权利要求1所述的故障诊断知识图谱的构建方法,其特征在于,所述从所述故障维修文本中确定多个实体,包括:构建所述故障诊断知识图谱的本体层;
利用训练好的实体抽取模型,根据所述本体层从所述故障维修文本中抽取多个所述实体。
3.根据权利要求2所述的故障诊断知识图谱的构建方法,其特征在于,所述实体抽取模型的训练方法包括:获取训练样本和测试样本;
对所述训练样本进行BMEO标注,并以经过BMEO标注的训练样本为输入,以标注结果为标签,训练双向长短期记忆网络模型,得到多个实体抽取模型;
利用所述测试样本对多个实体抽取模型进行测试,并选取测试结果最优的实体抽取模型作为所述训练好的实体抽取模型。
4.根据权利要求3所述的故障诊断知识图谱的构建方法,其特征在于,通过下式得到所述初始相似度:其中,C为所述初始相似度,Bi为第i个所述故障现象,Bj为第j个所述故障现象,n为所述故障现象的文本经过分词和词汇去重后词汇的数量,k为第k个词汇,bi,k为第i个所述故障现象的文本中第k个词汇的词频,bj,k为第j个所述故障现象的文本中第k个词汇的词频。
5.根据权利要求4所述的故障诊断知识图谱的构建方法,其特征在于,通过下式得到所述权重系数:其中,W(Bi,Bj)为第i个所述故障现象和第j个所述故障现象之间的权重系数,u为表示第u个用户,U为对第i个所述故障现象和第j个所述故障现象进行过评分的用户集合,Ru,Bi为第u个用户对第i个所述故障现象的历史评分,Ru,Bj为第u个用户对第j个所述故障现象的历史评分, 为第u个用户对所有评分过的所述故障现象的评分均值。
6.根据权利要求5所述的故障诊断知识图谱的构建方法,其特征在于,通过下式确定所述故障现象之间的相似度:其中,L(Bi,Bj)为第i个所述故障现象和第j个所述故障现象之间的相似度。
7.根据权利要求6所述的故障诊断知识图谱的构建方法,其特征在于,所述根据各个所述实体信息,在所有所述故障现象中确定多个第一标准故障现象,包括:根据各个所述实体信息确定与各个所述实体信息相似的故障现象集合;
对所述故障描述文本和所述故障现象集合中各个故障现象的文本进行分词和词汇去重处理,并统计所述故障描述文本中所有词汇的词频和各个所述故障现象的文本中所有词汇的词频;
根据所述故障描述文本中所有词汇的词频和各个所述故障现象的文本中所有词汇的词频,确定所述故障描述文本和各个所述故障现象之间的相似度;
根据所述故障描述文本和各个所述故障现象之间的相似度确定预设数量的第一标准故障现象。
8.一种生产设备的故障诊断方法,其特征在于,包括:获取用户输入的故障描述文本;
利用如权利要求1‑7中任一项所述的故障诊断知识图谱的构建方法构建的故障诊断知识图谱,得到多个第一标准故障现象和多个第二标准故障现象;
根据所述第一标准故障现象和所述第二标准故障现象,为用户推荐与所述第一标准故障现象对应的诊断方案和与所述第二标准故障现象对应的诊断方案,以实现故障诊断。
说明书 :
生产设备的故障诊断知识图谱的构建方法及诊断方法
技术领域
背景技术
来实现对生产设备的故障诊断。因此,知识图谱得到了广泛的应用。
系统开发中的主要瓶颈;另外,由于构建得到的知识图谱较为庞大,因此存在搜索缓慢、搜
索效率较低的问题,在知识图谱的推理过程中也会存在匹配冲突、推理效率较低等问题。
发明内容
和全面性。
故障现象的历史评分,并根据所述历史评分确定所述故障现象之间的相似度;根据多个所
述实体、所述实体之间的关系以及所述故障现象之间的相似度对所述故障诊断知识图谱进
行更新。
故障诊断知识图谱推荐的各个故障现象的历史评分,并根据历史评分确定故障现象之间的
相似度,将故障现象之间的相似度融入构建的故障诊断知识图谱中,在用户搜索相关的故
障案例时,不仅可以根据用户搜索的内容为用户推荐一些故障案例,还可以再根据故障现
象之间的相似度为用户推荐一些故障案例,从而提高了故障诊断知识图谱推荐故障案例的
准确性和全面性。
故障现象;根据所述第一标准故障现象和所述第二标准故障现象,为用户推荐与第一标准
故障现象对应的诊断方案和与第二标准故障现象对应的诊断方案,以实现故障诊断。
第二标准故障现象,用户可以通过推荐的第一标准故障现象和第二标准故障现象查询相应
的诊断方案,并参考查询出的诊断方案对生产设备进行故障诊断;由于故障诊断知识图谱
融入了用户的历史评分,得到了故障现象和故障现象之间的相似度,从而能够得到与第一
标准故障现象相似的第二标准故障现象,进而提高了故障诊断知识图谱推荐故障案例的准
确性和全面性。
附图说明
具体实施方式
图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
报警信号、用户操作、故障原因、用户。作为一个示例,从故障维修文本中确定的故障现象可
以为设备停止运行,故障部位可以为设备控制器。
“人”、“汽车”、“商品”等概念。构建本体层的方式可以为:基于专家的知识和经验,对故障诊
断知识图谱进行本体建模,得到多个本体模型。在本实施例中,本体包括(但不限于):故障
现象、故障部位、机床型号、报警信号、用户操作、故障原因、用户。
故障现象之间的发生关系;构建机床信号与故障现象之间的发生关系;构建报警信号与故
障现象之间的发生关系;构建故障原因与故障现象之间的原因关系;构造用户与故障现象
的评分关系;构造故障现象与故障现象之间的相关关系。
实体之间的关系。
现象实体类型,标签“B‑故障现象”代表该实体的开始位置,标签“E‑故障现象”代表该实体
的结束位置,标签“M‑故障现象”代表该实体的其余位置(或中间位置),O用于标记非实体的
部分。
行/E‑故障现象。由此,根据设置的本体层对训练样本进行标注,以便于后续对实体的抽取
过程。
在本实施例中,可以同时对多个双向长短期记忆网络模型进行训练;对多个双向长短期记
忆网络模型进行训练后,能够得到多个实体抽取模型。
抽取,根据每个实体抽取模型抽取的结果,在多个实体抽取模型中选出测试结果最优的实
体抽取模型,来作为投入使用的实体抽取模型。
建立的本体之间的关系类型,将抽取得到的实体组合成一个一个的(实体,关系,实体)三元
组。
本体为故障现象。按照预先建立的故障部位和故障现象这两个本体之间的关系类型,将设
备控制器和停止运行组合成(设备控制器,发生,停止运行)三元组。
免该实体在故障诊断知识图谱中重复出现或实体的关系信息不完整等情况。需要说明的
是,可以选择人工校验的方式将重复的实体进行人工合并,来完成实体对齐。
是以推荐故障现象的方式来推荐故障案例,用户可以根据推荐的故障现象查询相应的诊断
方案。
图谱中,来将用户输入的评分存储在故障诊断知识图谱所在的系统中;将存储在系统中的
评分作为历史评分,以在后续计算故障现象之间相似度时使用。
分。
骤:
第i个故障现象,Bj为第j个故障现象。
进行分词。进行分词后,再取两个故障现象所有词汇的并集,即将两个故障现象的文本中出
现的所有词汇放入一个集合中,得到词汇并集集合。得到词汇并集集合后,需要对该词汇并
集集合进行词汇去重处理。需要说明的是,词汇去重处理即当存在相同的词汇时,只保留一
个词汇。
所有词汇的词频,可以分别得到两个故障现象的词频向量。
{bj,1,bj,2…bj,k…bj,n},其中,bi,k为第i个故障现象的文本中第k个词汇的词频,bj,k为第j个
故障现象的文本中第k个词汇的词频。
词汇的词频,bj,k为第j个故障现象的文本中第k个词汇的词频。
第i个故障现象的历史评分,Ru,Bj为第u个用户对第j个故障现象的历史评分, 为第u个
用户对所有评分过的故障现象的评分均值。
相似度。采用这种方式确定故障现象之间的相似度,使后续故障诊断知识图谱为用户推荐
的故障现象更有针对性,提高了故障诊断知识图谱推荐故障案例的准确性。
与本体之间的关系时,建立了故障现象与故障现象之间的关系;在得到故障现象之间的相
似度后,可以建立(故障现象,相似度,故障现象)的三元组。
的故障诊断知识图谱。
谱。此外,在用户使用故障诊断知识图谱查询相关故障案例后,获取用户对本次的查询结果
进行的评分,并将该评分存储至故障诊断知识图谱中作为历史评分,以便于对故障诊断知
识图谱中故障现象之间的相似度进行更新。
例中,可以将故障描述文本记为D。
词频。
象集合。
故障部位相关的所有故障现象,得到一个故障现象的集合,可以将该故障现象的集合记为
A1。以此类推,再利用其他实体,得到故障现象的集合A2、A3等。将获得的所有故障现象的集
合进行合并和去重处理得到集合A={A1,A2…At}={B1,B2…Bi…Bj…BN},其中,t为故障现象集
合的总数量,N为筛选出来的故障现象的总数量。
述文本中所有词汇的并集,得到词汇并集集合。得到词汇并集集合后,需要对该词汇并集集
合进行去重处理,得到故障描述文本和故障现象的描述文本之间的词汇集合;再根据词汇
集合,分别统计故障描述文本和故障现象的描述文本中所有词汇的词频,获得故障描述文
本故障现象的描述文本的词频向量。
个词汇的词频,bi,k为第i个故障现象的文本中第k个词汇的词频,n为词汇集合中词汇的总
数量。
之间的相似度后,可以按照相似度从大到小的顺序,将故障现象集合A中的所有故障现象进
行排序;并且可以设置预设数量,即从相似度最大的故障现象开始,选择预设数量的故障现
象,最终会得到一定数量的故障现象,将这些故障现象作为第一标准故障现象。需要说明的
是,预设数量可以由故障诊断知识图谱的管理者根据需求进行设置,此处不做限制。
体地,可以根据第一标准故障现象与其他故障现象之间的相似度,按照从大到小顺序进行
排序,并从相似度最大处开始选择一定数量的、与第一标准故障现象相似的第二标准故障
现象。
诊断知识图谱为用户推荐的第一标准故障现象和第二标准故障现象的总数目不超过该阈
值。
现象;还可以结合用户的历史评分,利用故障现象之间的相似度,为用户推荐出第二标准故
障现象,从而提高了故障诊断知识图谱推荐故障案例的准确性和全面性。用户可以根据第
一标准故障现象和第二标准故障现象,从故障诊断知识图谱中分别获得相关的诊断方案,
实现对生产设备的故障诊断。
荐的第一标准故障现象和第二标准故障现象查询相应的诊断方案,并参考查询出的诊断方
案对生产设备进行故障诊断。由于故障诊断知识图谱融入了用户的历史评分,得到了故障
现象和故障现象之间的相似度,从而能够得到与第一标准故障现象相似的第二标准故障现
象,进而提高了故障诊断知识图谱推荐故障案例的准确性和全面性。
本发明第一方面实施例提出的故障诊断知识图谱的构建方法中的实现过程,此处不在赘
述。
谱推荐的各个故障现象的历史评分,并根据历史评分确定故障现象之间的相似度的相似度
确定模块;用于根据多个实体、实体之间的关系以及故障现象之间的相似度对故障诊断知
识图谱进行更新的构建模块。
用户对故障诊断知识图谱推荐的各个故障现象的历史评分,并根据历史评分确定故障现象
之间的相似度,构建模块将故障现象之间的相似度融入构建的故障诊断知识图谱中,在用
户搜索相关的故障案例时,不仅可以根据用户搜索的内容为用户推荐一些故障案例,还可
以再根据故障现象之间的相似度为用户推荐一些故障案例,从而提高了故障诊断知识图谱
推荐故障案例的准确性和全面性。
要说明的是,实际应用中收发器904不限于一个,该电子设备900的结构并不构成对本发明
实施例的限定。
Integrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编
程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以
实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器901
也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合
等。
Industry Standard Architecture,扩展工业标准结构)总线等。总线902可以分为地址总
线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总
线或一种类型的总线。
和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically Erasable
Programmable Read Only Memory,电可擦可编程只读存储器)、CD‑ROM(Compact Disc
Read Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数
字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储
具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限
于此。
的内容。
端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备900
仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其
他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行
系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、
通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设
备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或
多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只
读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光
盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其
他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必
要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器
中。
或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下
列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路
的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场
可编程门阵列(FPGA)等。
点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不
一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何
的一个或多个实施例或示例中以合适的方式结合。
隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三
个等,除非另有明确具体的限定。
部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员
而言,可以根据具体情况理解上述术语在本发明中的具体含义。
第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示
第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第
一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
实施例进行变化、修改、替换和变型。