故障监测方法、装置和电子设备转让专利

申请号 : CN202210089973.1

文献号 : CN114490765B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 姬涛王磊范丹丹吕丽红张天齐孙洁张永顺阎成金冯浩魏振宁张冠南武永利

申请人 : 中国人民解放军32039部队

摘要 :

本发明提供了一种故障监测方法、装置和电子设备,涉及通信的技术领域,方法包括:接收待监测任务系统发送的任务状态信息和待监测任务系统中所有设备的工作参数信息;基于任务状态信息确定任务监测队列,获取任务监测队列中每个被监测任务的设备分配详情;基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果;其中,故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。该方法通过维护预设故障处置策略集合即可实现对任务故障的及时自动发现、快速定位故障设备部位并给出故障处置策略,缩短了任务故障处置时间,提升了通信系统的可靠性。

权利要求 :

1.一种故障监测方法,其特征在于,包括:

接收待监测任务系统发送的任务状态信息和所述待监测任务系统中所有设备的工作参数信息;其中,所述任务状态信息包括:每个任务的任务标记和每个所述任务的任务执行状态;

基于所述任务状态信息确定任务监测队列,并获取所述任务监测队列中每个被监测任务的设备分配详情;其中,所述被监测任务为处于执行中状态的任务;所述设备分配详情包括:资源分配信息和任务设备集合,所述资源分配信息包括以下其中之一:设置备用设备,未设置备用设备;

基于每个所述被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个所述被监测任务的故障监测结果;其中,所述任务设备表示所述被监测任务所占用的设备;所述故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略;

其中,所述预设故障处置策略集合中包括多条故障处置策略,每条所述故障处置策略对应一条故障识别规则;每条所述故障识别规则预先定义以下信息:规则类型、适用设备类型、故障描述、故障设备类型、故障参数编号和规则内容;其中,所述规则类型用于表征所述故障识别规则所适用的任务是否设置备用设备;所述适用设备类型包括以下其中之一:主用设备,备用设备;所述故障设备类型和所述故障参数编号用于表征故障设备部位;新增故障识别规则可以嵌套引用已定义的相同规则类型的旧故障识别规则。

2.根据权利要求1所述的方法,其特征在于,基于每个所述被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个所述被监测任务的故障监测结果,包括:遍历所述预设故障处置策略集合中的故障处置策略,并针对目标故障处置策略执行以下步骤;其中,所述目标故障处置策略为所述预设故障处置策略集合中的任一个策略:基于目标任务的设备分配详情和所述目标故障处置策略对应的目标故障识别规则确定所述目标故障处置策略是否适用所述目标任务;其中,所述目标任务为所述任务监测队列中的任一个任务;

若确定适用,则基于所述目标故障识别规则和所述目标任务的任务设备的工作参数信息确定所述目标任务的故障监测结果。

3.根据权利要求2所述的方法,其特征在于,基于目标任务的设备分配详情和所述目标故障处置策略对应的目标故障识别规则确定所述目标故障处置策略是否适用所述目标任务,包括:获取所述目标任务的设备分配详情中的资源分配信息;其中,所述资源分配信息包括以下其中之一:设置备用设备,未设置备用设备;

判断所述目标故障识别规则的规则类型是否与所述目标任务中的资源分配信息相匹配;

若匹配,则确定所述目标故障处置策略适用所述目标任务;

若不匹配,则确定所述目标故障处置策略不适用所述目标任务。

4.根据权利要求2所述的方法,其特征在于,基于所述目标故障识别规则和所述目标任务的任务设备的工作参数信息确定所述目标任务的故障监测结果,包括:基于所述目标故障识别规则的故障设备类型和所述目标任务的任务设备确定目标识别设备;

基于所述目标故障识别规则的故障参数编号和所述目标识别设备的工作参数信息确定所述目标识别设备的故障参数值;

基于所述目标故障识别规则的规则内容和所述故障参数值确定所述目标任务的故障监测结果。

5.根据权利要求1所述的方法,其特征在于,所述故障识别规则属于预设树形结构故障规则模型,且所述预设树形结构故障规则模型中的叶子节点为基础规则,每个所述基础规则中定义以下信息:故障设备类型、故障参数编号、比较运算符和比较参数值。

6.一种故障监测装置,其特征在于,包括:

接收模块,用于接收待监测任务系统发送的任务状态信息和所述待监测任务系统中所有设备的工作参数信息;其中,所述任务状态信息包括:每个任务的任务标记和每个所述任务的任务执行状态;

第一确定模块,用于基于所述任务状态信息确定任务监测队列,并获取所述任务监测队列中每个被监测任务的设备分配详情;其中,所述被监测任务为处于执行中状态的任务;

所述设备分配详情包括:资源分配信息和任务设备集合,所述资源分配信息包括以下其中之一:设置备用设备,未设置备用设备;

第二确定模块,用于基于每个所述被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个所述被监测任务的故障监测结果;其中,所述任务设备表示所述被监测任务所占用的设备;所述故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略;

其中,所述预设故障处置策略集合中包括多条故障处置策略,每条所述故障处置策略对应一条故障识别规则;每条所述故障识别规则预先定义以下信息:规则类型、适用设备类型、故障描述、故障设备类型、故障参数编号和规则内容;其中,所述规则类型用于表征所述故障识别规则所适用的任务是否设置备用设备;所述适用设备类型包括以下其中之一:主用设备,备用设备;所述故障设备类型和所述故障参数编号用于表征故障设备部位;新增故障识别规则可以嵌套引用已定义的相同规则类型的旧故障识别规则。

7.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5中任一项所述的方法的步骤。

8.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行权利要求1至5中任一项所述的方法。

说明书 :

故障监测方法、装置和电子设备

技术领域

[0001] 本发明涉及通信的技术领域,尤其是涉及一种故障监测方法、装置和电子设备。

背景技术

[0002] 随着社会发展和科技进步,人们工作生活的方方面面越来越离不开电子通信。尤其是金融到能源、到交通、到医疗等社会保障系统,甚至到军事、信息等战场领域,在所有这些重要领域中,保障通信系统稳定可靠地运行都是首要之重。因此,通信系统的建设方案首要考虑如何保障通信系统工作不失效,以及设备故障的及时诊断。考虑内容通常包括系统可靠性指标、电力保障、甚至建筑施工等系统层面,以及包括从硬件或软件方面实现设备有主备工作,还包括定期执行人工检查指标测试等维护维修手段。但是现有的对通信系统的故障监测方法中,仅能做到发现故障并通知技术人员,故障排查再处理需要耗费较长时间,因此,现有的故障监测方法存在故障处置不及时的问题,进而导致通信系统的可靠性差。

发明内容

[0003] 本发明的目的在于提供一种故障监测方法、装置和电子设备,以缩短了任务故障处置时间,提升了通信系统的可靠性。
[0004] 第一方面,本发明提供一种故障监测方法,包括:接收待监测任务系统发送的任务状态信息和所述待监测任务系统中所有设备的工作参数信息;其中,所述任务状态信息包括:每个任务的任务标记和每个所述任务的任务执行状态;基于所述任务状态信息确定任务监测队列,并获取所述任务监测队列中每个被监测任务的设备分配详情;其中,所述被监测任务为处于执行中状态的任务;基于每个所述被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个所述被监测任务的故障监测结果;其中,所述任务设备表示所述被监测任务所占用的设备;所述故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。
[0005] 在可选的实施方式中,所述预设故障处置策略集合中包括多条故障处置策略,每条所述故障处置策略对应一条故障识别规则;每条所述故障识别规则预先定义以下信息:规则类型、适用设备类型、故障描述、故障设备类型、故障参数编号和规则内容;其中,所述规则类型用于表征所述故障识别规则所适用的任务是否设置备用设备;所述适用设备类型包括以下其中之一:主用设备,备用设备;所述故障设备类型和所述故障参数编号用于表征故障设备部位。
[0006] 在可选的实施方式中,基于每个所述被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个所述被监测任务的故障监测结果,包括:遍历所述预设故障处置策略集合中的故障处置策略,并针对目标故障处置策略执行以下步骤;其中,所述目标故障处置策略为所述预设故障处置策略集合中的任一个策略:基于目标任务的设备分配详情和所述目标故障处置策略对应的目标故障识别规则确定所述目标故障处置策略是否适用所述目标任务;其中,所述目标任务为所述任务监测队列中的任一个任务;若确定适用,则基于所述目标故障识别规则和所述目标任务的任务设备的工作参数信息确定所述目标任务的故障监测结果。
[0007] 在可选的实施方式中,基于目标任务的设备分配详情和所述目标故障处置策略对应的目标故障识别规则确定所述目标故障处置策略是否适用所述目标任务,包括:获取所述目标任务的设备分配详情中的资源分配信息;其中,所述资源分配信息包括以下其中之一:设置备用设备,未设置备用设备;判断所述目标故障识别规则的规则类型是否与所述目标任务中的资源分配信息相匹配;若匹配,则确定所述目标故障处置策略适用所述目标任务;若不匹配,则确定所述目标故障处置策略不适用所述目标任务。
[0008] 在可选的实施方式中,基于所述目标故障识别规则和所述目标任务的任务设备的工作参数信息确定所述目标任务的故障监测结果,包括:基于所述目标故障识别规则的故障设备类型和所述目标任务的任务设备确定目标识别设备;基于所述目标故障识别规则的故障参数编号和所述目标识别设备的工作参数信息确定所述目标识别设备的故障参数值;基于所述目标故障识别规则的规则内容和所述故障参数值确定所述目标任务的故障监测结果。
[0009] 在可选的实施方式中,所述故障识别规则属于预设树形结构故障规则模型,且所述预设树形结构故障规则模型中的叶子节点为基础规则,每个所述基础规则中定义以下信息:故障设备类型、故障参数编号、比较运算符和比较参数值。
[0010] 第二方面,本发明提供一种故障监测装置,包括:接收模块,用于接收待监测任务系统发送的任务状态信息和所述待监测任务系统中所有设备的工作参数信息;其中,所述任务状态信息包括:每个任务的任务标记和每个所述任务的任务执行状态;第一确定模块,用于基于所述任务状态信息确定任务监测队列,并获取所述任务监测队列中每个被监测任务的设备分配详情;其中,所述被监测任务为处于执行中状态的任务;第二确定模块,用于基于每个所述被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个所述被监测任务的故障监测结果;其中,所述任务设备表示所述被监测任务所占用的设备;所述故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。
[0011] 在可选的实施方式中,所述预设故障处置策略集合中包括多条故障处置策略,每条所述故障处置策略对应一条故障识别规则;每条所述故障识别规则预先定义以下信息:规则类型、适用设备类型、故障描述、故障设备类型、故障参数编号和规则内容;其中,所述规则类型用于表征所述故障识别规则所适用的任务是否设置备用设备;所述适用设备类型包括以下其中之一:主用设备,备用设备;所述故障设备类型和所述故障参数编号用于表征故障设备部位。
[0012] 第三方面,本发明提供一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述前述实施方式中任一项所述的方法的步骤。
[0013] 第四方面,本发明提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行前述实施方式中任一项所述的方法。
[0014] 本发明提供的故障监测方法,包括:接收待监测任务系统发送的任务状态信息和待监测任务系统中所有设备的工作参数信息;其中,任务状态信息包括:每个任务的任务标记和每个任务的任务执行状态;基于任务状态信息确定任务监测队列,并获取任务监测队列中每个被监测任务的设备分配详情;其中,被监测任务为处于执行中状态的任务;基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果;其中,任务设备表示被监测任务所占用的设备;故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。该方法通过维护预设故障处置策略集合即可实现对任务故障的及时自动发现、快速定位故障设备部位并给出故障处置策略,缩短了任务故障处置时间,提升了通信系统的可靠性。

附图说明

[0015] 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016] 图1为本发明实施例提供的一种故障监测方法的流程图;
[0017] 图2为本发明实施例提供的一种故障监测方法的应用场景示意图;
[0018] 图3为本发明实施例提供的一种基于目标故障识别规则和目标任务的任务设备的工作参数信息确定目标任务的故障监测结果的流程图;
[0019] 图4为本发明实施例提供的一种故障监测装置的功能模块图;
[0020] 图5为本发明实施例提供的一种电子设备的示意图。

具体实施方式

[0021] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0022] 因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023] 下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0024] 通信系统日常维护工作之外,经常要承担重要的通信任务。在承担通信任务期间一旦通信设备发生故障、影响到通信任务,将可能造成无法挽回的损失,损失的代价可能是时间、经济、甚至是生命。如果在通信系统出现异常时能够及时发现问题、快速定位故障部位,则能够为解决问题争取宝贵时间,降低故障问题带来的不利影响,提升通信系统稳定性、可靠性、可维护性。有鉴于此,本发明实施例提供了一种故障监测方法,用以实现上述功能。
[0025] 实施例一
[0026] 图1为本发明实施例提供的一种故障监测方法的流程图,如图1所示,该方法具体包括如下步骤:
[0027] 步骤S102,接收待监测任务系统发送的任务状态信息和待监测任务系统中所有设备的工作参数信息。
[0028] 具体的,本发明实施例提供的故障监测方法应用于任务故障监测系统,该任务故障监测系统与待监测任务系统通信连接,待监测任务系统中包括多种设备,例如通信设备,控制设备等。图2为本发明实施例提供的一种故障监测方法的应用场景示意图。
[0029] 故障监测方法执行时,待监测任务系统将发送任务状态信息和系统中所有设备的工作参数信息至任务故障监测系统,其中,任务状态信息包括:每个任务的任务标记和每个任务的任务执行状态。具体的,待监测任务系统可以同时承担多个任务,因此,为了便于区分,每个任务均具有唯一的任务标记,且每个任务的任务执行状态包括一下其中之一:执行中,执行结束。设备的工作参数与设备类型相关,用户可以根据系统需求进行配置,本发明实施例不对其进行限制。
[0030] 步骤S104,基于任务状态信息确定任务监测队列,并获取任务监测队列中每个被监测任务的设备分配详情。
[0031] 任务故障监测系统在接收到任务状态信息之后,即可根据每个任务的任务执行状态确定出任务监测队列,执行结束的任务无需对其进行监控,所以任务故障监测系统将处于执行中的任务存入任务监测队列,也即,被监测任务为处于执行中状态的任务。
[0032] 在确定出所有被监测任务之后,针对每个被监测任务,待监测任务系统将以任务为单位将各个任务的设备分配详情通知任务故障监测系统,其中,设备分配详情包括:资源分配信息和任务设备集合,资源分配信息包括以下其中之一:设置备用设备,未设置备用设备。
[0033] 针对任务执行状态为执行结束的任务,待监测任务系统在向任务故障监测系统发送任务状态信息时,可以选择将该任务执行时的资源分配信息一并反馈,但是,任务结束时,待监测任务系统并不会将该任务执行时的任务设备集合发送给任务故障监测系统。
[0034] 具体的,任务故障监测系统依次处理通知中的单条或多条任务状态信息,维护任务监测队列,如果任务执行状态是执行中,则任务监测队列中更新该任务标记,并更新其设备分配详情;如果任务执行状态是执行结束,则任务监测队列中删除该任务标记,同时清空该任务的设备分配详情数据,任务监测队列中的任务标记不重复,队列可以是空。
[0035] 为了便于理解,下面举例说明,如果任务执行时分配了备用设备,则设备分配详情的表达形式为:设置备用设备+<主用设备集合,设备1类型,设备1编号...设备n类型,设备n编号>+<备用设备集合,设备x类型,设备x编号...设备y类型,设备y编号>;如果任务执行时未分配备用设备,则设备分配详情的表达形式为:未设置备用设备+<主用设备集合,设备1类型,设备1编号...设备n类型,设备n编号>。
[0036] 在本发明实施例中,待监测任务系统内的设备按型号分类,相同型号的设备规定成同一类型编号;相同类型编号的多台设备,各自使用不同的设备编号。
[0037] 根据以上描述可知,任务故障监测系统可以定义一种任务设备占用资源模型,模型表达形式为:任务标记+任务执行状态+资源分配信息+任务设备集合,利用该模型可表达任务设备分配结果。
[0038] 步骤S106,基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果。
[0039] 具体的,在本发明实施例中,待监测任务系统内相同类型编号的设备,具有相同的监控状态参数集合,参数集合内每个参数的编号不重复;任务故障监测系统在接收到所有设备的工作参数信息后,将实时解析上述信息,并利用以下方式按队列存储所有设备状态参数:设备类型编号+设备编号+参数编号+实时参数值。
[0040] 因此,在获取到每个被监测任务的设备分配详情之后,即可根据设备分配详情确定出任务设备,进而确定任务设备的工作参数信息,其中,任务设备表示被监测任务所占用的设备。
[0041] 任务故障监测系统内置预设故障处置策略集合,且该集合支持增删改查管理,预设故障处置策略集合中包括多条故障处置策略,且每条故障处置策略均具有唯一的策略编号,同时策略编号绑定一条用于判断的故障识别规则,以及,故障发生时预计采取的处置策略(措施),故障识别规则用于根据任务设备的工作参数信息判别故障是否发生,以及提供发生故障时的故障描述。因此,在得到每个被监测任务的设备分配详情和任务设备的工作参数信息之后,任务故障监测系统即可根据预设故障处置策略集合确定出每个被监测任务的故障监测结果,其中,故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略,且故障描述中携带有故障设备部位信息。
[0042] 考虑任务安全性,处置措施一般必须由待监测任务系统自主执行,因此处置策略需要跟待监测任务系统相互约定。常用处置策略一般有:1)仅提示故障信息;2)提示故障并对故障部位设备切换主备;3)提示故障并对故障设备所属的整个链路切换主备,以上三种策略可以分别编码‘T’、‘D’、‘L’,根据以上定义描述,一条故障处置策略的表达形式可以为:策略编号+故障识别规则编号+T/D/L。
[0043] 本发明提供的故障监测方法,包括:接收待监测任务系统发送的任务状态信息和待监测任务系统中所有设备的工作参数信息;其中,任务状态信息包括:每个任务的任务标记和每个任务的任务执行状态;基于任务状态信息确定任务监测队列,并获取任务监测队列中每个被监测任务的设备分配详情;其中,被监测任务为处于执行中状态的任务;基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果;其中,任务设备表示被监测任务所占用的设备;故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。该方法通过维护预设故障处置策略集合即可实现对任务故障的及时自动发现、快速定位故障设备部位并给出故障处置策略,缩短了任务故障处置时间,提升了通信系统的可靠性。
[0044] 在一个可选的实施方式中,预设故障处置策略集合中包括多条故障处置策略,每条故障处置策略对应一条故障识别规则;每条故障识别规则预先定义以下信息:规则类型、适用设备类型、故障描述、故障设备类型、故障参数编号和规则内容;其中,规则类型用于表征故障识别规则所适用的任务是否设置备用设备;适用设备类型包括以下其中之一:主用设备,备用设备;故障设备类型和故障参数编号用于表征故障设备部位。
[0045] 具体的,规则类型可以划分为:第一类规则和第二类规则,第一类规则适用于设置备用设备(既有主用设备又有备用设备)的任务;第二类规则适用于未设置备用设备(只有主用设备)的任务。在生成故障识别规则时,可以将故障描述设为规则名称,并且,为了便于规则管理,每个故障识别规则均对应唯一的规则编号。
[0046] 在本发明实施例中,新增故障识别规则可以嵌套引用已定义的旧故障识别规则,但必须指定旧规则跟已有内容是‘与’、还‘或’运算关系;且新规则引用旧规则时,两者必须同属于第一类规则,或者同属于第二类规则,且需要规避“自己引用自己”这种死循环引用。
[0047] 在一个可选的实施方式中,故障识别规则属于预设树形结构故障规则模型,且预设树形结构故障规则模型中的叶子节点为基础规则,每个基础规则中定义以下信息:故障设备类型、故障参数编号、比较运算符和比较参数值。
[0048] 在本发明实施例中,预设树形结构故障规则模型支持增删改查管理,为了避免规则嵌套引用的死循环,每个规则编号在一个树形分支里只能出现一次。通过上文中对基础规则的描述可知,该树形结构内的基础规则是把某类型设备的某个实际工作参数值,使用比较运算符跟其定义的比较参数值做比较计算。
[0049] 根据规则模型构建语法,一条规则的表达可参考以下形式:一类/二类+规则编号+主用/备用+<(┃且,最小基础规则┃且,其它规则编号)┃或,其它规则编号…>。其中‘┃’是语法连接符,表明之后的内容是可选项。前3项是必选项。‘<>’之中内容不能为空。
[0050] 为了便于理解,下面提供一段树形结构故障识别规则示例:
[0051] <规则库>
[0052] <!‑‑规则编号:1,示例一种规则:主用上变频器的工作频率大于1000,或者主用上变频器的工作频率小于800‑‑>
[0053] <规则规则类型=“一类”规则编号=“1”适用设备=“主用”规则名称=“主用上变频器工作频率异常”故障设备类型=“上变频器”故障参数编号=“工作频率”>
[0054] <规则内容与或关系=“或”>
[0055] <内容种类=“基础规则”设备类型=“上变频器”参数编号=“工作频率”比较运算符=“大于”比较运算参数值=“1000”/>
[0056] <内容种类=“基础规则”设备类型=“上变频器”参数编号=“工作频率”比较运算符=“小于”比较运算参数值=“800”/>
[0057] <规则内容>
[0058]
[0059] <!‑‑规则编号:2,示例一种规则:备用上变频器的工作频率小于等于1000,且上变频器的工作频率大于等于800‑‑>
[0060] <规则规则类型=“一类”规则编号=“2”适用设备=“备用”规则名称=“备用上变频器工作频率正常”故障设备类型=“上变频器”故障参数编号=“工作频率”>
[0061] <规则内容与或关系=“且”>
[0062] <内容种类=“基础规则”设备类型=“上变频器”参数编号=“工作频率”比较运算符=“大于”比较运算参数值=“1000”/>
[0063] <内容种类=“基础规则”设备类型=“上变频器”参数编号=“工作频率”比较运算符=“小于”比较运算参数值=“800”/>
[0064] <规则内容>
[0065]
[0066] <!‑‑规则编号:3,示例一种规则:判定上变频器工作频率异常‑‑>
[0067] <规则规则类型=“一类”规则编号=“3”适用设备=“主用”规则名称=“有主备任务上变频器工作频率异常”故障设备类型=“上变频器”故障参数编号=“工作频率”>[0068] <规则内容与或关系=“且”>
[0069] <内容种类=“引用规则”规则编号=“1”/>
[0070] <内容种类=“引用规则”规则编号=“2”/>
[0071] <规则内容>
[0072]
[0073] <!‑‑规则编号:4,示例一种规则:适用于只有主用设备、没有备用设备的任务‑‑>[0074] <规则规则类型=“二类”规则编号=“4”适用设备=“主用”规则名称=“无备用设备任务上变频器工作频率异常”故障设备类型=“上变频器”故障参数编号=“工作频率”>[0075] <规则内容与或关系=“或”>
[0076] <内容种类=“基础规则”设备类型=“上变频器”参数编号=“工作频率”比较运算符=“大于”比较运算参数值=“1000”/>
[0077] <内容种类=“基础规则”设备类型=“上变频器”参数编号=“工作频率”比较运算符=“小于”比较运算参数值=“800”/>
[0078] <规则内容>
[0079]
[0080]
[0081] 上述示例中提供了4条故障识别规则:规则编号1属于上文中介绍的第一类规则,需要采集任务中的主用设备参数参加计算;规则编号2属于第一类规则,需要采集任务中的备用设备参数参加计算;规则编号3属于第一类规则,需要采集任务中的主用设备参数参加计算,其引用了规则编号1和引用规则编号2,并使用“且”完成计算;规则编号4属于第二类规则,只能适用于未设置备用设备的任务,需要采集任务中的主用设备参数参加计算。
[0082] 在一个可选的实施方式中,上述步骤S106,基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果,具体包括如下步骤:
[0083] 步骤S1061,遍历预设故障处置策略集合中的故障处置策略,并针对目标故障处置策略执行以下步骤;其中,目标故障处置策略为预设故障处置策略集合中的任一个策略:
[0084] 步骤S1062,基于目标任务的设备分配详情和目标故障处置策略对应的目标故障识别规则确定目标故障处置策略是否适用目标任务。
[0085] 其中,目标任务为任务监测队列中的任一个任务。
[0086] 若确定适用,则执行下述步骤S1063;若确定不适用,则对下一故障处置策略执行步骤S1062。
[0087] 步骤S1063,基于目标故障识别规则和目标任务的任务设备的工作参数信息确定目标任务的故障监测结果。
[0088] 在本发明实施例中,任务故障监测系统可以周期性的对任务检测队列中的所有被监测任务进行故障监测,在对目标任务进行监测时,需要遍历预设故障处置策略集合中的所有故障处置策略,在遍历到目标故障处置策略时,首先根据目标故障处置策略对应的目标故障识别规则判断该策略是否适用于目标任务,如果适用,则利用上述目标故障识别规则对标任务的任务设备的工作参数信息进行故障判断,如果任务设备的工作参数信息能够触发该规则,则立即确定目标任务的一个故障监测结果;如果不适用,则直接跳转至下一条处置策略,判断下一条故障处置策略对应的故障识别规则是否适用于目标任务。以此类推,遍历完所有的故障处置策略后,结束目标任务的故障监测,利用同样的方式方法可确定所有被监测任务的故障监测结果。
[0089] 任务故障监测系统在确定目标任务存在故障的情况下,会将以下信息反馈至待监测任务系统:任务标记+故障描述+故障设备部位+故障处置策略。
[0090] 在一个可选的实施方式中,上述步骤S1062,基于目标任务的设备分配详情和目标故障处置策略对应的目标故障识别规则确定目标故障处置策略是否适用目标任务,具体包括如下步骤:
[0091] 步骤S10621,获取目标任务的设备分配详情中的资源分配信息。
[0092] 其中,资源分配信息包括以下其中之一:设置备用设备,未设置备用设备。
[0093] 步骤S10622,判断目标故障识别规则的规则类型是否与目标任务中的资源分配信息相匹配。
[0094] 若匹配,则执行下述步骤S10623;若不匹配,则执行下述步骤S10624。
[0095] 步骤S10623,确定目标故障处置策略适用目标任务。
[0096] 步骤S10624,确定目标故障处置策略不适用目标任务。
[0097] 具体的,通过上文中的描述可知,每条故障识别规则在定义时均指定了规则类型,也即,规则适用于设置备用设备的任务还是适用于未设置备用设备的任务。因此,本发明实施例中,在对目标任务进行故障监测时,首先根据目标任务的设备分配详情中的资源分配信息确定目标任务具体适用哪种类型的故障识别规则,只有在目标故障处置策略对应的目标故障识别规则的规则类型与目标任务中的资源分配信息相匹配时,才能确定目标故障处置策略适用目标任务;反之,确定不适用。
[0098] 也就是说,如果据目标任务的资源分配信息显示该任务中设置备用设备,那么说明目标任务适用于第一类规则;如果目标故障处置策略对应的目标故障识别规则定义为第一类规则,则确定目标故障处置策略适用目标任务;如果目标故障处置策略对应的目标故障识别规则定义为第二类规则,则确定目标故障处置策略不适用目标任务。
[0099] 在一个可选的实施方式中,如图3所示,上述步骤S1063,基于目标故障识别规则和目标任务的任务设备的工作参数信息确定目标任务的故障监测结果,具体包括如下步骤:
[0100] 步骤S10631,基于目标故障识别规则的故障设备类型和目标任务的任务设备确定目标识别设备。
[0101] 步骤S10632,基于目标故障识别规则的故障参数编号和目标识别设备的工作参数信息确定目标识别设备的故障参数值。
[0102] 步骤S10633,基于目标故障识别规则的规则内容和故障参数值确定目标任务的故障监测结果。
[0103] 本发明实施例的故障处置策略中所指定的故障识别规则是抽象化、概念化的规则模型,且基础规则中仅定义了故障设备类型、故障参数编号、比较运算符和比较参数值。因此,只有输入实际设备参数值(也即上文中的故障参数值)才能完成比较计算。也就是说,规则要跟实际任务使用的设备结合后,才能生成实际的故障识别规则,才能把抽象化的故障识别规则具现化,故障识别规则具现化之后才能用于监测计算。
[0104] 在利用目标故障识别规则对目标任务进行故障判断时,首先要确定出目标识别设备,其中,目标识别设备表示利用目标故障识别规则从目标任务的任务设备集合中匹配到的任务设备。具体的,根据故障识别规则中所指定的适用设备类型(主用/备用)以及故障设备类型(也即,设备类型编号),到目标任务的任务设备集合(主用集合/备用集合)中匹配设备类型得到实际任务设备编号,进而根据设备编号确定出所有目标识别设备。
[0105] 接下来,在确定出目标识别设备之后,再结合故障识别规则所指明的故障参数编号,从目标识别设备的工作参数信息中确定出目标识别设备的故障参数值(也即,实时参数值),获得故障参数值后,故障识别规则即完成了具现化,进而可利用故障参数值与规则中的比较参数值进行比较,最终确定规则是否触发。
[0106] 由于故障识别规则属于预设树形结构故障规则模型,因此,在根据目标故障识别规则的规则内容和故障参数值判断目标任务是否发生故障时,根据故障规则的树形结构特点,可设计从叶子节点到根节点的逐级递归算法,计算故障规则是否成立,如果计算结果成立,则表明任务发生了该故障;如果计算结果不成立,则表明任务未发生该故障。
[0107] 综上所述,本发明实施例提供的故障监测方法可通过建立任务状态专家模型,设计一种可管理的任务故障规则模型和对故障的处置策略,实现基于任务状态的自动故障监测,发现故障时根据处置策略自动快速采取处置措施。由于该方法只需管理通用的故障识别规则模型和故障处置策略,即能够实现对任务故障的及时自动发现并通知任务系统采取自动处置,因此,本发明方法可推广应用到具备远程监控且长时间承担任务,对任务有自动故障监测和处置需求的系统,实时监测系统任务的故障状态并自动快速采取处置,可以使系统执行任务更稳定、可靠、可维护,特别适用于提高系统任务保障能力,进而达到了提升任务运行稳定性、可靠性和可维护性的目的。
[0108] 实施例二
[0109] 本发明实施例还提供了一种故障监测装置,该故障监测装置主要用于执行上述实施例一所提供的故障监测方法,以下对本发明实施例提供的故障监测装置做具体介绍。
[0110] 图4是本发明实施例提供的一种故障监测装置的功能模块图,如图4所示,该装置主要包括:接收模块10,第一确定模块20,第二确定模块30,其中:
[0111] 接收模块10,用于接收待监测任务系统发送的任务状态信息和待监测任务系统中所有设备的工作参数信息;其中,任务状态信息包括:每个任务的任务标记和每个任务的任务执行状态。
[0112] 第一确定模块20,用于基于任务状态信息确定任务监测队列,并获取任务监测队列中每个被监测任务的设备分配详情;其中,被监测任务为处于执行中状态的任务。
[0113] 第二确定模块30,用于基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果;其中,任务设备表示被监测任务所占用的设备;故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。
[0114] 本发明提供的故障监测装置,包括:接收模块10,用于接收待监测任务系统发送的任务状态信息和待监测任务系统中所有设备的工作参数信息;其中,任务状态信息包括:每个任务的任务标记和每个任务的任务执行状态;第一确定模块20,用于基于任务状态信息确定任务监测队列,并获取任务监测队列中每个被监测任务的设备分配详情;其中,被监测任务为处于执行中状态的任务;第二确定模块30,用于基于每个被监测任务的设备分配详情、任务设备的工作参数信息和预设故障处置策略集合确定每个被监测任务的故障监测结果;其中,任务设备表示被监测任务所占用的设备;故障监测结果包括:是否发生故障,以及确定发生故障时的故障描述和故障处置策略。该装置通过维护预设故障处置策略集合即可实现对任务故障的及时自动发现、快速定位故障设备部位并给出故障处置策略,缩短了任务故障处置时间,提升了通信系统的可靠性。
[0115] 可选地,预设故障处置策略集合中包括多条故障处置策略,每条故障处置策略对应一条故障识别规则;每条故障识别规则预先定义以下信息:规则类型、适用设备类型、故障描述、故障设备类型、故障参数编号和规则内容;其中,规则类型用于表征故障识别规则所适用的任务是否设置备用设备;适用设备类型包括以下其中之一:主用设备,备用设备;故障设备类型和故障参数编号用于表征故障设备部位。
[0116] 可选地,第二确定模块30包括:
[0117] 遍历执行单元,用于遍历预设故障处置策略集合中的故障处置策略,并针对目标故障处置策略执行以下步骤;其中,目标故障处置策略为预设故障处置策略集合中的任一个策略:
[0118] 第一确定单元,用于基于目标任务的设备分配详情和目标故障处置策略对应的目标故障识别规则确定目标故障处置策略是否适用目标任务;其中目标任务为任务监测队列中的任一个任务。
[0119] 第二确定单元,若确定适用,则基于目标故障识别规则和目标任务的任务设备的工作参数信息确定目标任务的故障监测结果。
[0120] 可选地,第一确定单元具体用于:
[0121] 获取目标任务的设备分配详情中的资源分配信息;其中,资源分配信息包括以下其中之一:设置备用设备,未设置备用设备。
[0122] 判断目标故障识别规则的规则类型是否与目标任务中的资源分配信息相匹配。
[0123] 若匹配,则确定目标故障处置策略适用目标任务。
[0124] 若不匹配,则确定目标故障处置策略不适用目标任务。
[0125] 可选地,第二确定单元具体用于:
[0126] 基于目标故障识别规则的故障设备类型和目标任务的任务设备确定目标识别设备。
[0127] 基于目标故障识别规则的故障参数编号和目标识别设备的工作参数信息确定目标识别设备的故障参数值。
[0128] 基于目标故障识别规则的规则内容和故障参数值确定目标任务的故障监测结果。
[0129] 可选地,故障识别规则属于预设树形结构故障规则模型,且预设树形结构故障规则模型中的叶子节点为基础规则,每个基础规则中定义以下信息:故障设备类型、故障参数编号、比较运算符和比较参数值。
[0130] 实施例三
[0131] 参见图5,本发明实施例提供了一种电子设备,该电子设备包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器
60用于执行存储器61中存储的可执行模块,例如计算机程序。
[0132] 其中,存储器61可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non‑volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
[0133] 总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0134] 其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
[0135] 处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field‑Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
[0136] 本发明实施例所提供的一种故障监测方法、装置和电子设备的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
[0137] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0138] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0139] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0140] 在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0141] 此外,术语“水平”、“竖直”、“悬垂”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
[0142] 在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0143] 最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。