故障自动恢复的方法、系统和控制网元转让专利

申请号 : CN200810217100.4

文献号 : CN101729305A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 宋旭郭东

申请人 : 华为技术有限公司

摘要 :

本发明实施例公开了一种故障自动恢复的方法、系统和一种控制网元,其中该方法包括:按照预先设置的检测条件,判断目标网元是否出现故障;判断所述目标网元出现故障后,按照预先的配置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息修改为所述目标网元的备份网元的信息。采用本发明实施例所提供的方法,能检测出目标网元是否出现故障,并自动进行切换,提高了系统的稳定性和可靠性。

权利要求 :

1.一种故障自动恢复的方法,其特征在于,包括:

按照预先设置的检测条件,判断目标网元是否出现故障;

判断所述目标网元出现故障后,按照预先的配置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息修改为所述目标网元的备份网元的信息。

2.如权利要求1所述的故障自动恢复的方法,其特征在于,还包括:向所述目标网元的备份网元发送第二命令,将所述目标网元的备份网元设置为与所述目标网元中的参数相同的参数。

3.如权利要求1所述的故障自动恢复的方法,其特征在于,所述检测条件包括:所述目标网元的维护状态是否为故障。

4.如权利要求3所述的故障自动恢复的方法,其特征在于,所述检测条件还包括:是否收到目标网元的相邻网元发送的与所述目标网元之间的链路故障告警。

5.如权利要求1至4任一所述的故障自动恢复的方法,其特征在于,所述目标网元为第一网关通用分组无线业务支持节点GGSN,所述目标网元的备份网元为第二GGSN,关联网元为域名服务器DNS时,所述将所述关联网元上与所述目标网元对应的信息修改为所述目标网元的备份网元的信息包括:发送设置命令给DNS,将DNS上对应的第一GGSN的信息修改为第二GGSN的信息。

6.如权利要求5所述的故障自动恢复的方法,其特征在于,在第二GGSN上增加所述第一GGSN的网段的路由,并将所述网段的路由发送到网上。

7.如权利要求6所述的故障自动恢复的方法,其特征在于,判断所述第一GGSN的故障消除后,将所述第一GGSN上的网段的路由删除。

8.一种控制网元,其特征在于,包括:

判断单元,用于按照预先设置的检测条件,判断目标网元是否出现故障;

切换单元,用于在判断所述目标网元出现故障后,按照预先的配置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息,修改为所述目标网元的备份网元的信息。

9.如权利要求8所述的控制网元,其特征在于,切换单元,还用于向所述目标网元的备份网元发送第二命令,将所述目标网元的备份网元设置为与所述目标网元中的参数相同的参数。

10.如权利要求8或9任一所述的控制网元,其特征在于,所述判断单元还包括:第一判断单元,用于按照所述目标网元的维护状态是否为故障时,判断目标网元是否出现故障;或第二判断元,用于按照所述目标网元的维护状态是否为故障以及是否收到所述目标网元的相邻网元发送的与所述目标网元之间的链路故障告警,判断目标网元是否出现故障。

11.一种故障自动恢复的系统,其特征在于,包括:

控制网元,用于根据预先设置的检测条件检测目标网元是否出现故障,当所述目标网元出现故障后,按照预先的设置向目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息,修改为所述目标网元的备份网元的信息;

关联网元,用于按照控制网元的第一命令将对应的目标网元信息修改为所述目标网元的备份网元的信息。

12.如权利要求11所述的故障自动恢复的系统,其特征在于,还包括:备份网元,用于接收控制网元发送的第二命令,将自身的参数设置为与目标网元中的参数相同的参数;

控制网元,还用于向所述目标网元的备份网元发送第二命令,将所述目标网元的备份网元设置为与所述目标网元中的参数相同的参数。

13.如权利要求11或12任一所述的故障自动恢复的系统,其特征在于,所述预先设置的检测条件为目标网元的维护状态是否为故障。

14.如权利要求11或12任一所述的故障自动恢复的系统,其特征在于,所述预先设置的检测条件为目标网元的维护状态是否为故障和控制网元是否收到目标网元的相邻网元发送的与目标网元之间的链路故障告警时,所述系统还包括:相邻网元,用于将与目标网元之间的链路故障告警发送给控制网元。

说明书 :

技术领域

本发明涉及通讯领域,尤其涉及一种故障自动恢复的方法、系统和控制网元。

背景技术

在分组域PS组网中,为保证网络的冗余性和可靠性,对于一些网元会部署多个,工作方式多采取主备模式或者负荷分担等方式。
在主备模式的一些场景下,在主用设备正常工作时,由于主用设备和备用设备的一些设置存在冲突,备用设备在系统中处于备份状态,并不与其它的网元产生信令上的交互;当主用设备出现故障时,备用设备不能自动获知主用设备的故障,也不能自动的替换主用设备,需要通过人工干预的方式,实现主备设备的替换。
采用人工干预的方式,误差高,效率低,并且业务恢复时间长,影响了网络的可靠性和稳定性。

发明内容

有鉴于此,本发明实施例提了一种故障自动恢复的方法、系统和控制网元,实现了对故障网元的自动替换,减少人工干预出现的误差,提高了工作效率,不中断正在使用的业务,增强了网络的可靠性和稳定性。
一种故障自动恢复的方法,包括:按照预先设置的检测条件,判断目标网元是否出现故障;判断所述目标网元出现故障后,按照预先的配置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息修改为所述目标网元的备份网元的信息。
一种控制网元,包括:判断单元,用于按照预先设置的检测条件,判断目标网元是否出现故障;切换单元,用于在判断所述目标网元出现故障后,按照预先的配置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息,修改为所述目标网元的备份网元的信息。
一种故障自动恢复的系统,包括:控制网元,用于根据预先设置的检测条件检测目标网元是否出现故障,当所述目标网元出现故障后,按照预先的设置向目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息,修改为所述目标网元的备份网元的信息;关联网元,用于按照控制网元的第一命令将对应的目标网元信息修改为所述目标网元的备份网元的信息。
本发明通过在网管上设置检测条件,能判断出目标网元是否发生故障,当判断目标网元发生故障时,向目标网元的关联网元发送第一命令,来实现对目标网元的自动替换。减少人工配制出现的误差,并提高工作效率,避免业务的中断,提高了网络的稳定性和可靠性。

附图说明

图1是本发明实施例所提供的一种设备故障自动恢复的方法的第一示意图;
图2是本发明实施例所提供的一种设备故障自动恢复的方法的第二示意图;
图3是本发明实施例所提供的一种设备故障自动恢复的方法的第三示意图;
图4是本发明实施例所提供的一种设备故障自动恢复的装置的第一示意图;
图5是本发明实施例所提供的一种设备故障自动恢复的装置的第二示意图;
图6是本发明实施例所提供的一种设备故障自动恢复的系统的第一示意图;
图7是本发明实施例所提供的一种设备故障自动恢复的系统的第二示意图。

具体实施方式

参照附图1,本发明实施例提供了一种设备故障自动恢复的方法,包括:
101.按照预先设置的检测条件,判断目标网元是否出现故障;
其中目标网元是主用设备,检测条件可以是,1)网管与目标网元之间的维护状态是否为故障;同时检测条件也可以进一步包括:2)网管是否收到目标网元的相邻网元发送的与目标网元之间的链路故障告警等等,其中此处的网管并不局限于网管,可以是有类似功能的其他控制网元。
102.判断目标网元出现故障后,按照预先的设置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息,修改为所述目标网元的备份网元的信息;
当网管判断目标网元出现故障时,按照预先的设置向目标网元的关联网元发送第一命令,将关联网元所对应的目标网元信息修改为目标网元的备份网元的信息。
如果所述目标网元和目标网元的备份网元的设置不同,则该方法进一步包括:
103.向所述目标网元的备份网元发送第二命令,将所述目标网元的备份网元设置为与所述目标网元中的参数相同的参数;
向目标网元的备份网元发送第二命令,将目标网元的备份网元设置为与目标网元中的参数相同的参数,完成对目标网元的切换。
本发明实施例中,网管通过设置检测条件来检测目标网元是否出现故障,当目标网元出现故障时,向目标网元的关联网元发送第一命令,切换出现故障的目标网元,能减少网络业务恢复的时间,提高网络可靠性;同时通过网管集中管理,减少人工修改配置的误差,提高工作效率。
下面通过具体场景来说明本发明实施例提供的故障自动恢复的方法,其中接入点名称(Access Point Name,APN)为“vip.nw”的用户使用归属位置寄存器(Home Location Register,HLR)签约的静态IP地址,范围为10.110.248.0/24,不由GPRS网关支持节点(Gateway GPRS Support Node,GGSN)分配,正常情况下,通过“vip.nw”接入的用户在第一GGSN上激活,第一GGSN将地址为10.110.248.0/24网段的路由发布到网络上,第二GGSN作为第一GGSN的备用网元,其设置与第一GGSN存在冲突,不能发布10.110.248.0/24网段的路由。
参照附图2,本发明实施例提供了一种设备故障自动恢复的方法,当第一GGSN故障时,修改域名服务器(Domain Name Server,DNS)的配置,将此APN为“vip.nw”的用户所对应的第一GGSN修改为第二GGSN,并通过第二GGSN将地址为10.110.248.0/24的网段路由发布到网上,由第二GGSN接管此APN的业务,其中第一GGSN是主用设备,第二GGSN是备用设备。包括:
201、按照预先在网管上设置的检测条件,判断第一GGSN是否出现故障;
在网管上配置的检测条件,可以是检测第一GGSN的维护状态是否为故障;
网管通过检测与第一GGSN之间的消息通道是否畅通,来判断网管与第一GGSN之间的维护端口是否出现了故障,当网管与第一GGSN之间的维护端口出现故障时,则判断第一GGSN的维护状态为故障;
202、当网管判定第一GGSN网元出现故障时,向DNS发送第一命令,将DNS上对应的第一GGSN的信息修改为第二GGSN的信息;
具体的,当网管检测到第一GGSN的维护状态为故障时,向DNS发送第一命令,将APN为“vip.nw”所对应的GGSN由第一GGSN修改为第二GGSN;
当第一GGSN和第二GGSN上参数的设置不一样时,该方法还可以包括:
203、向第二GGSN发送第二命令,将第二GGSN设置为与第一GGSN中的参数相同的参数。
具体的,向第二GGSN下发第二命令,增加10.110.248.0/24网段的路由,并通过第二GGSN将地址为10.110.248.0/24的网段的路发送到网上,由第二GGSN接管此APN的业务,保证网络业务的正常运行。
网管通过检测与第一GGSN之间的消息通道是否畅通,来判断第一GGSN维护状态是否正常,当第一GGSN的维护状态为正常时,则判断第一GGSN故障恢复,此时,网管向第一GGSN发送命令,将第一GGSN上10.110.248.0/24网段的路由删除,避免对已经切换到第二GGSN上业务的影响,将第一GGSN作为备用设备。
同样,当第二GGSN出现故障时,网管按照上述步骤进行切换,将第一GGSN切换为主用设备。
本发明实施例提供的技术方案,在网管上设置检测条件,能准确地判断主用设备第一GGSN是否出现了故障,同时通过网管向DNS发送第一命令,将发生故障的第一GGSN自动切换,减少了人工配置的误差,减少故障导致的业务中断时间,提高网络的可靠性。
参照附图3,本发明实施例还提供了一种设备故障自动恢复的方法,当第一GGSN故障时,通过网管发送命令,修改DNS的配置,将此APN为“vip.nw”的用户所对应的第一GGSN修改为第二GGSN,并通过第二GGSN将地址为10.110.248.0/24的网段路由发布到网上,由第二GGSN接管此APN的业务,其中第一GGSN是主用设备,第二GGSN是备用设备,包括:
301、按照预先设置的综合检测条件,判断第一GGSN是否出现故障;
在网管上配置综合检测条件,包括但不限于:
a、第一GGSN的维护状态是否为故障;
网管通过检测与第一GGSN之间的消息通道是否畅通,来判断网管与第一GGSN之间的维护端口是否出现了故障,当网管与第一GGSN之间的维护端口为故障时,则判断第一GGSN的维护状态是否为故障;
b、网管是否收到第一GGSN的相邻的网元发送的与第一GGSN之间的链路故障告警;
网管根据是否接收到GPRS服务支持节点(Service GPRS Support Node,SGSN)与第一GGSN之间的GPRS隧道协议(GPRS Tunnel Protocol,GTP)链路故障告警,来判断SGSN和第一GGSN之间链路是否出现了故障;
302、如果网管判断第一GGSN出现故障时,向DNS发送第一命令,将DNS上对应的第一GGSN的信息修改为第二GGSN的信息;
具体的,当网管检测到第一GGSN出现故障时,向DNS下发第一命令,将APN为“vip.nw”所对应的GGSN由第一GGSN修改为第二GGSN,其中第二GGSN为第一GGSN的备用网元;
进一步的,如果第一GGSN和第二GGSN的参数设置不同时,则该方法还包括:
303、网管向第二GGSN发送第二命令,将第二GGSN设置与第一GGSN中参数相同的参数。
具体的,向第二GGSN下第二命令,增加10.110.248.0/24网段的路由,并通过第二GGSN将地址为10.110.248.0/24的网段的路发送到网上,由第二GGSN接管此APN的业务,保证网络业务的正常运行。
同样,网管通过检测与第一GGSN之间的消息通道是否畅通,来判断第一GGSN维护状态是否正常,当第一GGSN的维护状态为正常时,则判断第一GGSN故障恢复,此时,网管向第一GGSN发送命令,将第一GGSN上10.110.248.0/24网段的路由删除,避免对已经切换到第二GGSN上业务的影响,将第一GGSN作为备用设备。
同样,当第二GGSN出现故障时,网管按照上述步骤进行切换,将第一GGSN切换为主用设备。
本发明实时例通过在网管上设置综合检测条件,能准确地检测到主用设备第一GGSN是否出现故障,当判断第一GGSN出现故障时,对其进行自动切换,既能实现对故障网元的准确判断,也实现了通过网管集中管理,减少了人工修改导致的误差,同时避免网络中断,增强了网络的稳定性。
参照附图4,本发明实施例所提供了一种控制网元,包括:判断单元100和切换单元200,其中
判断单元100,用于按照预先设置的检测条件,判断目标网元是否出现故障;
切换单元200,用于在判断所述目标网元出现故障后,按照预先的配置向所述目标网元的关联网元发送第一命令,将所述关联网元上与所述目标网元对应的信息,修改为所述目标网元的备份网元的信息;
切换单元200,还可以用于向所述目标网元的备份网元发送第二命令,将所述目标网元的备份网元设置与所述目标网元相同的参数。
其中判断单元还可以包括第一判断单元300或第二判断单元400,如图5所示:
第一判断单元300,用于按照所述目标网元的维护状态是否为故障,来判断目标网元是否出现故障;或者
第二判断单元400,用于按照所述目标网元的维护状态是否为故障以及是否接收到目标网元的相邻网元发送的与目标网元之间的链路故障告警,来判断目标网元是否出现故障。
本发明实施例所提供的装置能实现在目标网元故障时,对目标网元的自动切换,减少了人工修改配置出现的误差,增加了系统的稳定性。
参照附图6,本发明实施例还提供了一种故障自动恢复的系统,包括控制网元600、关联网元700、目标网元500和备份网元900,其中
控制网元600,用于根据预先设置的检测条件检测目标网元500是否出现故障,当所述目标网元500出现故障后,按照预先的设置向目标网元500的关联网元发送第一命令,将所述关联网元上与所述目标网元500对应的信息,修改为所述目标网元的备份网元的信息;
关联网元700,用于按照控制网元的第一命令将对应的目标网元500信息修改为所述目标网元的备份网元的信息。
其中,当目标网元和备份网元的参数不相同时,该系统还包括:
备用网元900,用于接收控制网元600发送的第二命令,将自身的参数设置为与目标网元500中参数相同的参数;
控制网元600,还用于向所述目标网元的备份网900元发送第二命令,将所述目标网元的备份网元900设置为与所述目标网元500中参数相同的参数。
如果检测条件为目标网元的维护状态是否为故障时,控制网元通过判断目标网元的维护状态是否为故障,来判断目标网元是否出现了故障,如果发生了故障,则进行对目标网元的切换。
如果检测条件为目标网元的维护状态是否为故障和控制网元是否收到目标网元的相邻网元发送的与目标网元之间的链路故障告警,当目标网元的维护状态为故障,同时控制网元收到相邻网元发送的与目标网元之间的链路故障告警时,控制网元判断目标网元出现故障,切换目标网元。如图7所示,该系统还进一步包括:
相邻网元800,用于将与目标网元500之间的链路故障告警发送给控制网元。
本发明实施例所提供的系统,通过控制网元自动检测目标网元的状态,当目标网元出现故障时,向目标网元的关联网元发送第一命令,完成对目标网元的替换,增强了系统的稳定性和可靠性,同时也减少了采用人工修改配置产生的误差,避免了系统中断,提高了系统的稳定性,也提高了工作效率。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。