故障处理方法及系统转让专利

申请号 : CN201310237951.6

文献号 : CN104243192B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李宏琳

申请人 : 北京神州泰岳软件股份有限公司

摘要 :

本发明公开了一种故障处理方法及系统,涉及故障分析技术领域。本发明实施例提供的故障处理方法和系统,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。

权利要求 :

1.一种故障处理方法,其特征在于,所述方法包括:

建立关联模板,用于记录故障之间的关联关系;及

建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;

当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;

如查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;如未查找到第二故障发生,则将所述第一故障上报;

针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理;

所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;

若存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。

2.根据权利要求1所述的故障处理方法,其特征在于,所述方法还包括:对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;

则所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;

若存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生。

3.根据权利要求1或2所述的故障处理方法,其特征在于,若存在关联故障,所述方法还包括:根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。

4.根据权利要求1-2任一项所述的故障处理方法,其特征在于,所述第二故障为一个或多个。

5.根据权利要求1-2任一项所述的故障处理方法,其特征在于,互为关联故障的第一故障和第二故障的关系如下:第一故障为主故障,则第二故障为次故障;或

第一故障为次故障,则第二故障为主故障。

6.一种故障处理系统,其特征在于,所述系统包括:

关联模板模块,用于建立关联模板,记录故障之间的关联关系;

缓存模块,用于建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;

关联故障查找模块,用于当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;

上报模块,用于若所述关联故障查找模块查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;若所述关联故障查找模块未查找到第二故障发生,则将所述第一故障上报;处理模块,用于针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理;

所述关联故障查找模块具体包括:

故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;

查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。

7.根据权利要求6所述的故障处理系统,其特征在于,上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报模块上报故障。

8.根据权利要求7所述的故障处理系统,其特征在于,所述系统还包括:内存缓存队列管理模块,用于对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;

则所述关联故障查找模块具体包括:

故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;

查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生;

上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报模块上报故障。

9.根据权利要求7或8所述的故障处理系统,其特征在于,所述缓存模块还包括:分组单元,用于存在关联故障时,根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中;

所述第二故障为一个或多个;

互为关联故障的第一故障和第二故障的关系如下:

第一故障为主故障,则第二故障为次故障;或

第一故障为次故障,则第二故障为主故障。

说明书 :

故障处理方法及系统

技术领域

[0001] 本发明涉及故障分析技术领域,特别涉及一种故障处理方法及系统。

背景技术

[0002] 在日常设备维护中,通常是通过监控人员监控,如发现故障,便将该故障提交维护人员对其进行排查处理,以及时恢复正常工作状态。
[0003] 但是,上述处理方法中,对于维护人员而言,由于收到的上报故障杂乱无章,毫无规律而言,因此,在对故障排查和处理时,效率低下。因此,迫切需要一种高效有序的故障处理解决方案,以提高故障处理效率。

发明内容

[0004] 鉴于上述问题,本发明实施例提供一种故障处理方法及系统,使得能够根据有序上报的故障,实现高效快速的故障处理解决方案。
[0005] 本发明实施例采用了如下技术方案:
[0006] 本发明一个实施例提供了一种故障处理方法,所述方法包括:
[0007] 当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;
[0008] 如查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;如未查找到第二故障发生,则将所述第一故障上报;
[0009] 针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
[0010] 所述方法还包括:
[0011] 建立关联模板,用于记录故障之间的关联关系;及
[0012] 建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;
[0013] 则所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:
[0014] 当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;
[0015] 若存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。
[0016] 所述方法还包括:对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;
[0017] 则所述当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生具体包括:
[0018] 当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障,若不存在关联故障,则上报所述第一故障;
[0019] 若存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生。
[0020] 若存在关联故障,所述方法还包括:
[0021] 根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
[0022] 所述第二故障为一个或多个。
[0023] 互为关联故障的第一故障和第二故障的关系如下:
[0024] 第一故障为主故障,则第二故障为次故障;或
[0025] 第一故障为次故障,则第二故障为主故障。
[0026] 本发明实施例还提供一种故障处理系统,所述系统包括:
[0027] 关联故障查找模块,用于当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生;
[0028] 上报模块,用于若所述关联故障查找模块查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;若所述关联故障查找模块未查找到第二故障发生,则将所述第一故障上报;
[0029] 处理模块,用于针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
[0030] 所述系统还包括:
[0031] 关联模板模块,用于建立关联模板,记录故障之间的关联关系;
[0032] 缓存模块,用于建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障;
[0033] 则所述关联故障查找模块具体包括:
[0034] 故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;
[0035] 查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生;
[0036] 上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
[0037] 所述系统还包括:
[0038] 内存缓存队列管理模块,用于对所述内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障;
[0039] 则所述关联故障查找模块具体包括:
[0040] 故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障;
[0041] 查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生;
[0042] 上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
[0043] 所述缓存模块还包括:
[0044] 分组单元,用于存在关联故障时,根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中;
[0045] 所述第二故障为一个或多个;
[0046] 互为关联故障的第一故障和第二故障的关系如下:
[0047] 第一故障为主故障,则第二故障为次故障;或
[0048] 第一故障为次故障,则第二故障为主故障。
[0049] 本发明实施例提供的故障处理方法和系统,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
[0050] 进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。

附图说明

[0051] 图1为本发明一个实施例提供的一种故障处理方法流程图;
[0052] 图2为本发明另一实施例提供的一种故障处理方法流程图;
[0053] 图3为本发明实施例提供的故障处理方法的一种具体实例流程图;
[0054] 图4为本发明一个实施例提供的一种故障处理系统框图。

具体实施方式

[0055] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0056] 在日常设备维护中,通过监控人员不断观察分析,总结出故障发生规律。通常,若多个故障通常一起发生,则称该多个故障之间具备影响关系,称为关联故障。比如,当A故障发生,通常前后10分钟内B故障也会发生,则认为告警A和告警B为影响关系,根据具体应用场景,关联故障之间存在主次关系,例如在上述关联关系中,A为主故障,B为次故障。
[0057] 本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于维护人员针对关联故障进行处理,提高故障处理效率。
[0058] 具体的,参见图1,为本发明实施例提供的一种故障处理方法,具体包括如下步骤:
[0059] S101:监控故障发生。
[0060] S102:当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生。
[0061] 根据不同的应用场景,预定时间窗的长度可以设置不同。比如,在通信行业通信设备维护应用场景中,可以设置预定时间窗的长度为10分钟。
[0062] S103:如查找到第二故障发生,则将所述第一故障和第二故障作为关联故障,上报所述关联故障;如未查找到第二故障发生,则将所述第一故障上报。
[0063] 第一故障和第二故障是关联故障,即通常情况下,两者会伴随发生,在实际应用中,如果在故障上报之前,能够对故障进行关联分析处理,并上报,这样,维护人员便可以针对故障进行关联合并处理,能够大大提高故障处理效率。
[0064] 需要说明的是,上述第二故障可以是一个或多个,也就是说,若第一故障为A故障,第二故障可以为B故障,也可以为B故障、C故障和D故障等等,此处不做限制。
[0065] 另外需要说明的是,互为关联故障的第一故障和第二故障的关系可以是:
[0066] 第一故障为主故障,则第二故障为次故障;或,第一故障为次故障,则第二故障为主故障。比如,若某基站故障为主故障,则下行信号发送故障便可以设置为次故障。
[0067] S104:针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
[0068] 本发明实施例中,查找主故障A发生前T时间(即时间窗T前)的次故障B。找到的次故障B,建立关联关系。并继续接收次故障B,建立关联关系。当主故障A超过时间窗T,主故障A不在关联次故障B。
[0069] 可见,本发明实施例提供的故障处理方法和系统,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
[0070] 优选的,参见图2,本发明另一实施例提供了另一种故障处理方法。本发明实施例进一步的建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,从而避免对大样本数据进行分析处理,能够进一步提高故障处理效率。
[0071] 具体步骤如下:
[0072] S201:建立关联模板,用于记录故障之间的关联关系。
[0073] S202:建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障。
[0074] 具体实践中,当收到故障B时,计算出故障的超时时间窗(即故障发生时间+时间窗T分钟)。将故障以队列的方式存入内存缓存中。若当前处理故障为故障A,则查询内存缓存队列中缓存的故障A之前时间窗T分钟内是否有故障B存在,可见,通过增加内存缓存队列,可以避免对大样本数据进行分析的步骤,仅仅在内存缓存队列中查询即可。
[0075] S203:当监控到第一故障发生时,查询上述关联模板,判断第一故障是否存在关联故障,若不存在关联故障,则执行步骤S204,若存在关联故障,则执行步骤S205。
[0076] S204:上报第一故障,执行步骤S208。
[0077] S205:在内存缓存队列中查询第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。如查找到第二故障发生,则执行步骤S206,如未查找到第二故障发生,则执行步骤S204。
[0078] 优选的,本发明实施例还包括如下步骤:对内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障。
[0079] 针对该步骤,当收到故障B时,计算出故障的超时时间窗(即故障发生时间+时间窗T分钟)。将故障以队列的方式存入内存缓存中。若当前处理故障为故障A,则查询内存缓存队列中缓存的故障A之前是否有故障B存在(内存缓存队列中存储的仅仅为当前处理故障即故障A之前时间窗T分钟内的),并且,在第一故障(故障A)发生后的预定时间窗内,继续监控内存缓存队列中是否有第二故障(故障B)发生。可见,通过增加内存缓存队列,可以避免对大样本数据进行分析的步骤,仅仅在内存缓存队列中查询即可。
[0080] 进一步的,若存在关联故障,本发明实施例所述方法还包括:
[0081] 根据所述关联模板中的故障关联关系,在内存缓存队列中建立以“设备网元唯一标识+关联规则ID”标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
[0082] 其中,设备网元唯一标识,用于唯一标识网络中的某台设备。
[0083] 关联规则ID,用于标识关联规则,比如A故障为主故障,B故障为次故障。
[0084] 相应的,在内存缓存队列中查询关联故障的步骤,具体为在内存缓存队列中以“设备网元唯一标识+关联规则ID”标识的分组中查询即可。这样,可以进一步缩小数据处理的样本,进一步提高故障处理的效率。
[0085] S206:将第一故障和第二故障作为关联故障,上报该关联故障。
[0086] S207:对关联故障进行合并处理,结束。
[0087] S208:对第一故障进行处理。
[0088] 第一故障和第二故障是关联故障,即通常情况下,两者会伴随发生,在实际应用中,如果在故障上报之前,能够对故障进行关联分析处理,并上报,这样,维护人员便可以针对故障进行关联合并处理,能够大大提高故障处理效率。
[0089] 需要说明的是,上述第二故障可以是一个或多个,也就是说,若第一故障为A故障,第二故障可以为B故障,也可以为B故障、C故障和D故障等等,此处不做限制。
[0090] 另外需要说明的是,互为关联故障的第一故障和第二故障的关系可以是:
[0091] 第一故障为主故障,则第二故障为次故障;或,第一故障为次故障,则第二故障为主故障。比如,若某基站故障为主故障,则下行信号发送故障便可以设置为次故障。
[0092] 本发明实施例中,在内存缓存队列中查找主故障A发生前T时间(即时间窗T前)的次故障B。找到的次故障B,建立关联关系。并继续接收次故障B,建立关联关系。当主故障A超过时间窗T,主故障A不在关联次故障B。
[0093] 可见,本发明实施例提供的故障处理方法和系统,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
[0094] 进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。
[0095] 参见图3,为本发明实施例提供的一种具体的故障处理方法的实例,整体思路:首先,缓存需要关联的故障。然后,根据故障定位信息,将故障分组。最后,当故障设备的主、次故障均发生故障时,进行故障关联。实现的大体包括以下描述,具体子步骤请参见图3所示,此处不再赘述。
[0096] S301:定义关联规则。
[0097] 同一个设备发生故障A为主告警,发生故障B为子告警。定义时间窗长度为T分钟。
[0098] S302:接收活动告警。
[0099] i.收到故障A(或者故障B),建立一个以“网元唯一标识+关联规则ID”的一个分组,计算出故障的超时时间窗(即故障发生时间+时间窗T分钟)。将故障以队列的方式存入内存缓存中。
[0100] ii.收到故障B(或者故障A)。查找“网元唯一标识+关联规则ID”是否存在未超时数据。如果存在,且互为主次告警,将故障A、故障B关联。
[0101] S303:超时丢弃。
[0102] 检索队列,将超过时间窗T的告警从分组队列中删除。不再用于关联。
[0103] 可见,本实例的有益效果是:大大减少了大数据样本的复杂查询,加快故障关联速度,从而大大提高了故障处理的效率。
[0104] 参见图4,本发明实施例提供一种故障处理系统,包括:
[0105] 关联故障查找模块401,用于当监控到第一故障发生时,分别向前和向后查找预定时间窗内是否有第二故障发生。
[0106] 上报模块402,用于若关联故障查找模块401查找到第二故障发生,则将第一故障和第二故障作为关联故障,上报该关联故障;若关联故障查找模块401未查找到第二故障发生,则将第一故障上报。
[0107] 处理模块403,用于针对上报的故障,若为关联故障,则对其进行合并处理;若为第一故障,则对其进行处理。
[0108] 进一步的,本发明实施例提供的故障处理系统还包括:
[0109] 关联模板模块404,用于建立关联模板,记录故障之间的关联关系。
[0110] 缓存模块405,用于建立内存缓存队列,在监控过程中若有故障发生,则以队列的方式在内存中缓存该故障。
[0111] 则关联故障查找模块401具体包括:
[0112] 故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障。
[0113] 查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询所述第一故障发生前预定时间窗内是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控是否有第二故障发生。
[0114] 以及,上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
[0115] 再进一步的,本发明实施例提供的故障处理系统还包括:
[0116] 内存缓存队列管理模块406,用于对内存缓存队列进行监控管理,清除当前处理故障发生预定时间窗之前的故障。
[0117] 则所述关联故障查找模块401具体包括:
[0118] 故障类型判断单元,用于当监控到第一故障发生时,查询所述关联模板,判断所述第一故障是否存在关联故障。
[0119] 查找单元,用于所述故障类型判断单元的判断结果为存在关联故障,则在所述内存缓存队列中查询是否有与之关联的第二故障,并且,在所述第一故障发生后的预定时间窗内,继续监控所述内存缓存队列中是否有第二故障发生。
[0120] 以及,上报触发单元,用于当所述故障类型判断单元的判断结果为不存在关联故障,则触发所述上报模块上报所述第一故障;及,根据所述查找单元的查找结果触发所述上报单元上报故障。
[0121] 优选的,上述缓存模块还包括:
[0122] 分组单元,用于存在关联故障时,根据所述关联模板中的故障关联关系,在内存缓存队列中建立以设备网元唯一标识及关联规则ID标识的一个分组,则当监控到故障发生时,将当前监控到的故障缓存在其所对应的设备网元唯一标识及关联规则ID标识的分组中。
[0123] 需要说明的是,上述第二故障可以是一个或多个,也就是说,若第一故障为A故障,第二故障可以为B故障,也可以为B故障、C故障和D故障等等,此处不做限制。
[0124] 另外需要说明的是,互为关联故障的第一故障和第二故障的关系可以是:
[0125] 第一故障为主故障,则第二故障为次故障;或,第一故障为次故障,则第二故障为主故障。比如,若某基站故障为主故障,则下行信号发送故障便可以设置为次故障。
[0126] 需要说明的是,本发明系统实施例中的各个模块或者单元的工作原理和处理过程可以参见上述图1、图2和图3所示方法实施例中的相关描述,此处不再赘述。
[0127] 可见,本发明实施例提供的故障处理方法和系统,本故障关联方法中,对设备工作状况进行实时监控,当监控到主故障A发生,则分别以主故障A发生时间点向前和向后查找时间窗T内,是否有故障B发生,如果有,则建立关联关系。故障关联关系的建立,有利于运维人员针对关联故障进行处理,提高故障处理效率。
[0128] 进一步的,本发明实施例还建立有内存缓存队列,通过以队列方式在内存中缓存故障,以便在确定故障关联关系时,仅查询该内存缓存队列便可以快速的找到是否有关联故障发生,避免对大样本进行分析,进一步提高故障处理效率。
[0129] 为了便于清楚描述本发明实施例的技术方案,在发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。
[0130] 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。