一种网络故障关联规则获取方法及装置转让专利

申请号 : CN201010591182.6

文献号 : CN102006198B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张继宏江泓李华

申请人 : 中国电子科技集团公司第三十研究所

摘要 :

本发明公开了一种简便易用的网络故障关联规则获取方法,包括如下步骤:A、对通信网络的某个故障类型A,获取其发生时间前后特定时间内发生的所有故障类型的集合,并获取其恢复时间前后特定时间内恢复的所有故障类型的集合,求两者的交集;B、对交集内的每个故障类型均进一步验证其是否为故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则;C、对通信网络的所有故障类型,均执行步骤A和步骤B,以得到的网络故障关联规则的集合作为网络故障关联规则库。本发明还相应提供了一种网络故障关联规则获取装置,包括关联故障类型初步认定模块、验证模块和网络故障关联规则库建立模块。

权利要求 :

1.一种网络故障关联规则获取方法,其特征在于,包括如下步骤:步骤A、对通信网络的某个故障类型A,获取其发生时间前后M时间内发生的所有故障类型的集合,并获取其恢复时间前后N时间内恢复的所有故障类型的集合,求两者的交集;

其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔;

步骤B、对所述交集内的每个故障类型均进一步验证其是否为所述故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则;

步骤B中,验证其是否为所述故障类型A的关联故障类型,采用的方法包括:取Z个样本时间段,获取在所述Z个样本时间段内,所述故障类型A和所述交集内的待验证故障类型同时出现的次数U,和单独出现的次数V,若U/V大于等于预设的阀值G,则认为所述待验证故障类型为所述故障类型A的关联故障类型,其中Z为自然数;

所述样本时间段长度不小于M和N中较大的一个;

所述预设的阀值G不小于1。

2.根据权利要求1所述的网络故障关联规则获取方法,其特征在于,所述通信网络的故障响应速度越快,则M和N取值越小;反之,所述通信网络的故障响应速度越慢,则M和N取值越大。

3.根据权利要求1所述的网络故障关联规则获取方法,其特征在于,步骤B中,验证其是否为所述故障类型A的关联故障类型,采用的方法包括:在同一时间段内,获取所述故障类型A在所述通信网络中的发生次数,以及所述交集内的待验证故障类型在所述通信网络中的发生次数,若两者的发生次数之比与1的差值不大于预设的阀值H,则认为所述待验证故障类型为所述故障类型A的关联故障类型。

4.根据权利要求3所述的网络故障关联规则获取方法,其特征在于,所述同一时间段的长度不小于5分钟。

5.根据权利要求3所述的网络故障关联规则获取方法,其特征在于,所述预设的阀值H满足:0<H<0.5。

6.根据权利要求1至5中任一项所述的网络故障关联规则获取方法,其特征在于,还包括步骤:对所述通信网络的所有故障类型,均执行所述步骤A和步骤B,分别得到网络故障关联规则,以这些网络故障关联规则的集合作为网络故障关联规则库。

7.根据权利要求6所述的网络故障关联规则获取方法,其特征在于,还包括步骤:根据所述通信网络在所述网络故障关联规则库建立之后发生的故障类型,定期对所述网络故障关联规则库进行维护,包括添加新的网络故障关联规则,以及删除失效的网络故障关联规则。

8.一种网络故障关联规则获取装置,其特征在于,包括关联故障类型初步认定模块和验证模块;

其中,所述关联故障类型初步认定模块用于,对通信网络的某个故障类型A,获取其发生时间前后M时间内发生的所有故障类型的集合,并获取其恢复时间前后N时间内恢复的所有故障类型的集合,求两者的交集;其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔;

所述验证模块用于,对所述交集内的每个故障类型均进一步验证其是否为所述故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则;

其中,对所述交集内的每个故障类型均进一步验证其是否为所述故障类型A的关联故障类型,包括:取Z个样本时间段,获取在所述Z个样本时间段内,所述故障类型A和所述交集内的待验证故障类型同时出现的次数U,和单独出现的次数V,若U/V大于等于预设的阀值G,则认为所述待验证故障类型为所述故障类型A的关联故障类型,其中Z为自然数;

所述样本时间段长度不小于M和N中较大的一个;

所述预设的阀值G不小于1。

9.根据权利要求8所述的网络故障关联规则获取装置,其特征在于,还包括网络故障关联规则库建立模块;

所述网络故障关联规则库建立模块用于,对所述通信网络的所有故障类型,分别交由所述关联故障类型初步认定模块和验证模块执行,分别得到网络故障关联规则,以这些网络故障关联规则的集合作为网络故障关联规则库。

说明书 :

一种网络故障关联规则获取方法及装置

技术领域

[0001] 本发明属于通信技术领域,尤其涉及一种网络故障关联规则获取方法及装置。

背景技术

[0002] 故障诊断是现代网络管理系统需要解决的主要问题之一,通过建立故障关联规则来实现故障的准确定位是大多数网管系统采用的主要方法,但目前故障关联规则的建立主要依赖于本领域专家的个人经验,对于规模较小,管理方式比较简单的通信网络比较适用。随着网络规模日益扩大,体系结构日趋复杂,多网系集成趋势越来越明显,通过本领域专家来发现故障关联规则的方式具有越来越大的局限性,难以适应网络管理发展的需要。
[0003] 现有技术中存在一种通过数据挖掘的方式来自动获取网络故障关联规则的方法,通过比较故障类型之间的内在特性,来确定故障类型之间是否存在关联关系,其缺点是实现难度大,实现方案复杂。

发明内容

[0004] 本发明要解决的技术问题是针对现有技术中存在的上述不足,提出一种简便易用的网络故障关联规则获取方法及装置。
[0005] 本发明所采用的技术方案包括:
[0006] 一种网络故障关联规则获取方法,包括如下步骤:
[0007] 步骤A、对通信网络的某个故障类型A,获取其发生时间前后M时间内发生的所有故障类型的集合,并获取其恢复时间前后N时间内恢复的所有故障类型的集合,求两者的交集;其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔;
[0008] 步骤B、对所述交集内的每个故障类型均进一步验证其是否为所述故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则。
[0009] 进一步地,所述通信网络的故障响应速度越快,则M和N取值越小;反之,所述通信网络的故障响应速度越慢,则M和N取值越大。
[0010] 进一步地,步骤B中,验证其是否为所述故障类型A的关联故障类型,采用的方法可以为,包括:
[0011] 在同一时间段内,获取所述故障类型A在所述通信网络中的发生次数,以及所述交集内的待验证故障类型在所述通信网络中的发生次数,若两者的发生次数之比与1的差值不大于预设的阀值H,则认为所述待验证故障类型为所述故障类型A的关联故障类型。
[0012] 更进一步地,所述同一时间段的长度不小于5分钟。
[0013] 更进一步地,所述预设的阀值满足,0<H<0.5;优选地,0<H<0.2。
[0014] 进一步地,步骤B中,验证其是否为所述故障类型A的关联故障类型,采用的方法还可以为,包括:
[0015] 取Z个样本时间段,获取在所述Z个样本时间段内,所述故障类型A和所述交集内的待验证故障类型同时出现的次数U,和单独出现的次数V,若U/V大于等于预设的阀值G,则认为所述待验证故障类型为所述故障类型A的关联故障类型,其中Z为自然数。
[0016] 更进一步地,所述样本时间段长度不小于M和N中较大的一个。
[0017] 更进一步地,所述预设的阀值G不小于1。
[0018] 进一步地,本发明网络故障关联规则获取方法还包括:
[0019] 对所述通信网络的所有故障类型,均执行所述步骤A和步骤B,分别得到网络故障关联规则,以这些网络故障关联规则的集合作为网络故障关联规则库。
[0020] 更进一步地,本发明网络故障关联规则获取方法还包括,根据所述通信网络在所述网络故障关联规则库建立之后发生的故障类型,定期对所述网络故障关联规则库进行维护,包括添加新的网络故障关联规则,以及删除失效的网络故障关联规则。
[0021] 一种网络故障关联规则获取装置,包括关联故障类型初步认定模块和验证模块;
[0022] 其中,所述关联故障类型初步认定模块用于,对通信网络的某个故障类型A,获取其发生时间前后M时间内发生的所有故障类型的集合,并获取其恢复时间前后N时间内恢复的所有故障类型的集合,求两者的交集;其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔;
[0023] 所述验证模块用于,对所述交集内的每个故障类型均进一步验证其是否为所述故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则。
[0024] 进一步地,本发明网络故障关联规则获取装置还包括网络故障关联规则库建立模块,该模块用于,对所述通信网络的所有故障类型,分别交由所述关联故障类型初步认定模块和验证模块执行,分别得到网络故障关联规则,以这些网络故障关联规则的集合作为网络故障关联规则库。
[0025] 本发明的有益效果为:
[0026] 本发明分析了故障告警数据之间的内在关联关系,通过离线和在线方式进行时间序列关联分析,自动建立故障关联规则,并随通信网络系统运行不断对故障关联规则知识进行扩展和更新,具有自动学习的功能。
[0027] 本发明提高了故障诊断定位效率和网络管理的智能化水平,能够及时检测到实际网络通信系统中故障关联关系发生的变化并动态更新关联规则。

附图说明

[0028] 图1为本发明网络故障关联规则获取方法流程示意图;
[0029] 图2为本发明网络故障关联规则获取装置结构示意图。

具体实施方式

[0030] 下面结合附图和具体实施方式对本发明作进一步详细说明。
[0031] 图1为本发明网络故障关联规则获取方法流程示意图,如图所示,本发明网络故障关联规则获取方法具体包括如下步骤:
[0032] 1、对通信网络的某个故障类型A,获取其发生时间前后M时间内发生的所有故障类型的集合,并获取其恢复时间前后N时间内恢复的所有故障类型的集合,求两者的交集;其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔;通信网络的故障响应速度越快,则M和N取值越小;反之,通信网络的故障响应速度越慢,则M和N取值越大。
[0033] 2、对交集内的每个故障类型均进一步验证其是否为故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则。验证方法可以为根据本领域专家的经验来验证,或者根据本发明实施例中提供的下述两种方式来验证,或结合使用这几种方法,也可以采用本领域已知的一些技术方案来验证。
[0034] 本发明实施例提供的第一种验证方法为:
[0035] 在同一时间段内,例如不小于5分钟的一段时间内,例如取一天作为该时间段的长度,获取故障类型A在通信网络中的发生次数,以及交集内的待验证故障类型在通信网络中的发生次数,若两者的发生次数之比与1的差值不大于预设的阀值H,则认为待验证故障类型为故障类型A的关联故障类型。预设的阀值满足,0<H<0.5;优选地,0<H<0.2。
[0036] 本发明实施例提供的第二种验证方法为:
[0037] 取Z个样本时间段,该样本时间段长度不小于M和N中较大的一个,例如可以直接取为网管系统的轮询时间间隔,获取在所述Z个样本时间段内,故障类型A和交集内的待验证故障类型同时出现的次数U,和单独出现的次数V,若U/V大于等于预设的阀值G,该预设的阀值G不小于1,则认为待验证故障类型为故障类型A的关联故障类型。其中Z为自然数,优选地,Z>3。
[0038] 3、对通信网络的所有故障类型,均执行步骤1和步骤2,分别得到网络故障关联规则,以这些网络故障关联规则的集合作为网络故障关联规则库。
[0039] 4、根据通信网络在网络故障关联规则库建立之后发生的故障类型,定期对网络故障关联规则库进行维护,包括添加新的网络故障关联规则,以及删除失效的网络故障关联规则。
[0040] 下面进一步对本发明网络故障关联规则获取方法进行说明:
[0041] 本发明网络故障关联规则获取方法的主要思想可以描述如下:将故障数据按照时间顺序加载到滑动时间窗口,两两比较窗口内的任意两条故障数据,若发生故障的被管对象之间存在关联关系(即同时满足发生时间关联度及恢复时间关联度,且满足验证条件),则将两条故障的故障类型映射关系作为关联关系保存到网络故障关联关系规则库中。
[0042] 然后不断移除时间窗口中最旧的一部分数据,同时按时间顺序不断加入新的故障数据。再次进行分析并保存规则,若规则已存在,则增加其可信度值。持续进行上述学习过程,直到所有的故障数据都被分析。去掉规则库中可信度值低于指定阈值的规则,就得到正确的故障关联规则集合。
[0043] 在对网络故障进行关联分析时,虽然将被管对象之间的关联关系作为分析因子可以提高分析结果的准确性,但难以使用通用的模式来进行表达。因此,出于效率和易用性的考虑,在进行故障关联分析时,本发明忽略被管对象之间的关联关系而只考虑时间和故障类型间的关联关系。
[0044] 根据根源故障与关联故障的产生规律,首先提出以下假设:
[0045] 设根源故障为R,发生时间为Tr,恢复时间为Trr,可能的关联故障集合为S={R1,R2,...,Ri,...,Rn},发生时间依次为Ts={T1,T2,...,Ti,...,Tn},恢复时间依次为Tss={T11,T22,...,Tii,...,Tnn},i,n为正整数,0<i<=n。假设最迟发生的关联故障发生时间为Ti,最迟恢复的关联故障的恢复时间为Tii。
[0046] 假设1:关联故障的产生对根源故障具有时间依赖性。即最迟发生的关联故障与根源故障的发送时间差值不大于固定值M,即:
[0047] Ti-Tr<=M。
[0048] 假设2:关联故障的恢复对根源故障也具有时间依赖性。即最迟恢复的关联故障与根源故障的恢复时间差值不大于固定值N,即:
[0049] Tii-Trr<=N。
[0050] 其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔,并且,通信网络的故障响应速度越快,则M和N取值越小;反之,通信网络的故障响应速度越慢,则M和N取值越大。
[0051] 由于时间的连续性,使用滑动时间窗口机制来对故障数据进行分析,时间窗口的大小取M与N中的较大值,在分析的过程中,逐渐加入最新的故障数据,同时逐步去掉最旧的故障数据,这样就能够保证分析结果的准确性,避免时间区间边缘数据分析结果的偏差。
[0052] 下面给出算法的具体步骤:
[0053] 设在某段时间范围内产生的故障为F={f0,f1,...,fi,...,fn},其发生的时间为Tf={t0,t1,...,ti,...,tn}。F按时间有序排列。
[0054] 执行以下步骤:
[0055] 步骤1:取F中任一故障fk作为源故障,在F中查找满足假设1的故障集合Fk={fk+1,fk+2,...,fk+j,...,fk+a},其中(0<=k,k+j,k+a<=n)。此时,Fk中除了包含fk的关联故障外,还包含其它与fk发生时间相近的无关故障。
[0056] 步骤2:类似地,当fk恢复时,在F中查找满足假设2的故障集合F′k。
[0057] 步骤3:取F1=Fk∩F′k,从理想情况上讲,此时F1中就应该只包含fk的关联故障。但在实际中,F1中仍可能包含其它与fk发生和恢复时间接近的故障。
[0058] 步骤4:设fk的故障类型为sk,则Fk对应的故障类型集合为:
[0059] Sk={sk+1,sk+2,...,sk+j,...,sk+a}
[0060] 检查Sk,并为其中每一个元素计数(初始计数值为1),若存在sm,sn∈Sk,且sm=sn,则将sn从Sk中移除并将sm的计数加1。Sk={sk+h,sk+i,...,sm,...,sk+r},并得到对应的计数集合C={ck+h,ck+i,...,cm,...,ck+r}。将故障类型关联关系定义为四元组:
[0061] rk+i=(sk,Sk+i,ck,ck+i)。
[0062] 其中rk+i为故障类型sk与sk+i的关联关系,sk与sk+i表明了故障类型,ck表示sk在各个样本发生的总次数,ck+i表示关联故障类型sk+i发生的总次数。定义可信度:λk+i=ck+i÷ck,λ值越接近1,可信度越高。
[0063] 则可得到关联关系集合R(fk)={rk+h,rk+i,...,rm,...,rk+r}。
[0064] 对F中每一个故障重复步骤1至步骤4,若存在另一故障fl,其故障类型为sl,通过步骤4得到的关联故障集合为Sl={sl+h,sl+i,...,sl+r},计数集合为Cl={cl+h,cl+i,...,cl+r}。若存在关联关系:
[0065] rl+i=(sl,sl+i,cl,cl+i)。
[0066] 有sk=sl,sk+i=sl+i,则执行:
[0067] ck=ck+cl
[0068] ck+i=ck+i+cl+i
[0069] 否则将rl+i加入R。
[0070] 设故障发生次数阈值为Mc。若对关联关系rk+i,有:
[0071] ck>Mc并且λk+i-1小于预设的阈值,则判定该条规则可用,将其加入规则库。其中Mc和预设的阀值是由本领域专家给出的经验值。
[0072] 当有新的故障发生时,就能够从规则库中加载学习到的规则来判定故障的关联关系。同时,从新的故障集合中继续学习,若判定某个规则失效,则将其对应的关联规则从规则库中移除。
[0073] 图2为本发明网络故障关联规则获取装置结构示意图,如图所示,本发明网络故障关联规则获取装置包括关联故障类型初步认定模块、验证模块、网络故障关联规则库建立模块和网络故障关联规则库维护模块。
[0074] 其中,关联故障类型初步认定模块用于,对通信网络的某个故障类型A,获取其发生时间前后M时间内发生的所有故障类型的集合,并获取其恢复时间前后N时间内恢复的所有故障类型的集合,求两者的交集;其中,M和N为正数,M和N均不大于网管系统的轮询时间间隔。通信网络的故障响应速度越快,则M和N取值越小;反之,通信网络的故障响应速度越慢,则M和N取值越大。
[0075] 验证模块用于,对交集内的每个故障类型均进一步验证其是否为故障类型A的关联故障类型,若是则将其关联关系作为一个网络故障关联规则。验证模块采用的验证方案同于上述对本发明方法进行说明时描述的验证方案,此处不再赘述。
[0076] 网络故障关联规则库建立模块用于,对通信网络的所有故障类型,分别交由关联故障类型初步认定模块和验证模块执行,分别得到网络故障关联规则,以这些网络故障关联规则的集合作为网络故障关联规则库。
[0077] 网络故障关联规则库维护模块用于,根据通信网络在网络故障关联规则库建立之后发生的故障类型,定期对网络故障关联规则库进行维护,包括添加新的网络故障关联规则,以及删除失效的网络故障关联规则。
[0078] 本方法通过采用统计学习的方式实现了故障关联规则的自动获取,提高了故障诊断定位效率和网络管理的智能化水平。本发明具有如下优点:
[0079] 1、只需要很少的故障数据样本前提条件就可以得到较准确的分析结果;
[0080] 2、分析故障之间的潜在关系较少借助领域专家的经验;
[0081] 3、在有较大的数据样本前提下可以进行离线学习;
[0082] 4、随着网络通信系统运行时间的增长结果的准确度也逐步提高;
[0083] 5、能够及时检测到实际网络通信系统中故障关联关系发生的变化并动态更新关联规则。
[0084] 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应注意的是,以上所述仅为本发明的具体实施例而已,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求记载的技术方案及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。