提高设备可靠性的方法和通信设备转让专利

申请号 : CN200810223799.5

文献号 : CN101729285A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张斌

申请人 : 大唐移动通信设备有限公司

摘要 :

本发明提出一种提高设备可靠性的方法,所述设备包括至少两对热切换的主备功能板,以及与所述主备功能板均相连的全局控制模块,包括以下步骤:所述各对主备功能板向所述全局控制模块上报自身的处理负荷指标;所述全局控制模块根据所述各对主备功能板上报的处理负荷指标分配用户的业务。本发明在1+1主备功能板分布式处理的基础上增加全局控制模块,通过所述全局控制模块的业务分配,从而保证在资源分配阶段的负载均衡性。

权利要求 :

1.一种提高设备可靠性的方法,其特征在于,所述设备包括至少两对热切换的主备功能板,以及与所述主备功能板均相连的全局控制模块,包括以下步骤:所述各对主备功能板向所述全局控制模块上报自身的处理负荷指标;

所述全局控制模块根据所述各对主备功能板上报的处理负荷指标分配用户的业务。

2.如权利要求1所述的提高设备可靠性的方法,其特征在于,所述全局控制模块根据各对主备功能板上报的处理负荷指标分配用户的业务包括:所述全局控制模块优先选择处理负荷指标低的一对主备功能板分配用户业务。

3.如权利要求2所述的提高设备可靠性的方法,其特征在于,在所述设备中预设有轻载门限和预警门限,还包括以下步骤:所述全局控制模块判断是否有主备功能板的处理负荷指标超过预警门限;

如果所述主备功能板的处理负荷指标超过预警门限,则所述全局控制模块选择处理负荷指标低于轻载门限的其他主备功能板分配新的用户业务。

4.如权利要求3所述的提高设备可靠性的方法,其特征在于,在所述设备中还预设有过载门限,在判断有主备功能板的处理负荷指标超过预警门限之后,还包括:进一步判断所述主备功能板的处理负荷指标是否超过过载门限;

如果所述主备功能板的处理负荷指标超过过载门限,则所述全局控制模块将所述主备功能板的用户业务分配到其他处理负荷指标低于轻载门限或预警门限的主备功能板上。

5.如权利要求4所述的提高设备可靠性的方法,其特征在于,所述全局控制模块按照预定的粒度调整所述主备功能板用户业务的分配,并在调整之后继续判断所述主备功能板的处理负荷指标是否超过所述过载门限,直至所述主备功能板的处理负荷指标低于所述过载门限或其他主备功能板的处理负荷指标大于所述预警门限。

6.如权利要求1所述的提高设备可靠性的方法,其特征在于,所述全局控制模块根据Round Robin负荷均衡算法均匀地分配用户业务。

7.如权利要求1-5任一项所述的提高设备可靠性的方法,其特征在于,所述主备功能板为控制处理板、业务处理板、交换板或接口处理板。

8.一种通信设备,其特征在于,包括至少两对热切换的主备功能板,以及与所述主备功能板均相连的全局控制模块,所述主备功能板,用于向所述全局控制模块上报自身的处理负荷指标;

所述全局控制模块,用于根据所述各对主备功能板上报的处理负荷指标分配用户的业务。

9.如权利要求8所述的通信设备,其特征在于,所述全局控制模块优先选择处理负荷指标低的主备功能板分配用户业务。

10.如权利要求8所述的通信设备,其特征在于,所述全局控制模块中预设有轻载门限和预警门限,所述全局控制模块包括接收子模块、判断子模块和分配子模块,所述接收子模块,用于接收所述各对主备功能板上报的处理负荷指标;

所述判断子模块,用于判断是否有主备功能板的处理负荷指标超过所述预警门限;

所述分配子模块,用于在所述判断子模块判断主备功能板的处理负荷指标超过预警门限时,选择处理负荷指标低于轻载门限的其他主备功能板分配新的用户业务。

11.如权利要求10所述的通信设备,其特征在于,所述全局控制模块中还预设有过载门限,所述全局控制模块还包括调度子模块,所述判断子模块,还用于进一步判断所述主备功能板的处理负荷指标是否超过过载门限;

所述调度子模块,用于在所述判断子模块判断主备功能板的处理负荷指标超过过载门限时,按照预定的粒度将所述主备功能板的用户业务分配到其他处理负荷指标低于轻载门限或预警门限的主备功能板上。

12.如权利要求11所述的通信设备,其特征在于,所述判断子模块,还用于在所述调度子模块按照预定的粒度将所述主备功能板的用户业务分配到其他处理负荷指低于轻载门限或预警门限的主备功能板之后,继续判断所述主备功能板的处理负荷指标是否超过过载门限,直至所述主备功能板的处理负荷指标低于所述过载门限或其他主备功能板的处理负荷指标大于所述预警门限。

13.如权利要求10所述的通信设备,其特征在于,所述分配子模块根据Round Robin负荷均衡算法均匀地分配用户业务。

14.如权利要求8-12任一项所述的通信设备,其特征在于,所述主备功能板为控制处理板、业务处理板、交换板或接口处理板。

说明书 :

技术领域

本发明涉及通信设备制造领域,特别涉及一种提高设备可靠性的方法和通信设备。

背景技术

随着通信技术的不断发展,在通信网络中采用大量的通信设备,一旦这些通信设备出现故障或者死机将会导致通信网络的故障甚至瘫痪,因此通信设备的可靠性和稳定性成为通信设备的重要指标。通常,数通信设备由交换模块、控制处理模块、业务处理模块、接口模块以及时钟模块等组成。控制处理模块是较为重要的一部分,一般完成信令、呼叫链路建立删除、协议的处理,动、静态数据的配置、维护、管理等功能,如果控制处理模块的功能出现故障,则将会导致非常严重的后果。因此,对于这部分的设计,各厂家通用的方式是采用1+1主备设计。这样在主用板故障时,备用板可较快地升为主用板,接续进行控制处理功能,避免故障影响范围的扩大。
对于1+1主备板,主要体现为热备份、温备份、冷备份三种工作方式,其中热备份效果最佳,可以在毫秒级进行倒换,对业务基本无影响。以下将对热备份方式进行简单介绍,在通信设备中,控制面处理模块一般是分布式设计,硬件上由多对1+1单板组成,每对1+1单板以随机或轮转的方式对接入的用户信令、协议、链路进行处理,申请资源、释放资源。
但是不同用户的业务请求是千差万别的,因此经过长时间的累积后,不同控制处理板负荷的差别将会非常大,有的控制处理板负荷很轻,有的控制处理板处理负荷可能已经接近了处理器极限,这样的情况将极易导致控制处理板无法继续接纳用户处理需求、资源耗尽、死机,极大地降低设备的工作可靠性。如图1所示,为现有技术中不同控制处理板长时间运行后负载情况示意图,其中,每块控制处理板均表示1+1备份方式中的主用板,因为是1+1热备份方式,备用板与主用板的负荷状态是相同的,因此下文不同的控制处理板即表示不同数对的1+1控制板。从图1中可以看出,1号控制处理板的负荷状态已接近其处理极限,而2号控制处理板的负荷却很少。
现有技术存在的缺点是:现有的实现方式,每对1+1控制处理板与需要处理的基站或小区资源绑定,而不同的基站或小区资源在不同地域、不同时段的负荷是有很大差别的,这种情况下就容易出现有的控制处理板负载很重,有的负载很轻的情况,处理负荷过载时将大大降低设备的稳定性及可靠性,极易导致系统宕机。并且现有的分布式处理方案缺乏统一的全局控制、管理,因此故障管理非常的零散,使得维护将变得复杂。

发明内容

本发明的目的旨在至少解决上述技术缺陷之一,特别是解决现有技术中热备份的1+1主备控制处理板可靠性不高的技术缺陷。
为达到上述目的,本发明一方面提出一种提高设备可靠性的方法,所述设备包括至少两对热切换的主备功能板,以及与所述主备功能板均相连的全局控制模块,包括以下步骤:所述各对主备功能板周期性地上报自身的处理负荷指标;所述全局控制模块根据所述各对主备功能板上报的处理负荷指标分配用户的业务。
作为本发明的一个实施例,所述全局控制模块根据各对主备功能板上报的处理负荷指标分配用户的业务包括:所述全局控制模块优先选择处理负荷指标低的一对主备功能板分配用户业务。
作为本发明的一个实施例,在所述设备中预设有轻载门限和预警门限,还包括以下步骤:所述全局控制模块判断是否有主备功能板的处理负荷指标超过预警门限;如果所述主备功能板的处理负荷指标超过预警门限,则所述全局控制模块选择处理负荷指标低于轻载门限的其他主备功能板分配新的用户业务。
作为本发明的一个实施例,在所述设备中还预设有过载门限,在判断有主备功能板的处理负荷指标超过预警门限之后,还包括:进一步判断所述主备功能板的处理负荷指标是否超过过载门限;如果所述主备功能板的处理负荷指标超过过载门限,则所述全局控制模块将所述主备功能板的用户业务分配到其他处理负荷指标低于轻载门限或预警门限的主备功能板上。
作为本发明的一个实施例,所述全局控制模块按照预定的粒度调整所述主备功能板用户业务的分配,并在调整之后继续判断所述主备功能板的处理负荷指标是否超过所述过载门限,直至所述主备功能板的处理负荷指标低于所述过载门限或其他主备功能板的处理负荷指标大于所述预警门限。
在上述实施例中,所述全局控制模块根据Round Robin负荷均衡算法均匀地分配用户业务。
在上述实施例中,所述主备功能板为控制处理板、业务处理板、交换板或接口处理板。
本发明另一方面还提出一种通信设备,包括至少两对热切换的主备功能板,以及与所述主备功能板均相连的全局控制模块,所述主备功能板,用于向所述全局控制模块上报自身的处理负荷指标;所述全局控制模块,用于根据所述各对主备功能板上报的处理负荷指标分配用户的业务。
作为本发明的一个实施例,所述全局控制模块优先选择处理负荷指标低的主备功能板分配用户业务。
作为本发明的一个实施例,所述全局控制模块中预设有轻载门限和预警门限,所述全局控制模块包括接收子模块、判断子模块和分配子模块,所述接收子模块,用于接收所述各对主备功能板上报的处理负荷指标;所述判断子模块,用于判断是否有主备功能板的处理负荷指标超过所述预警门限;所述分配子模块,用于在所述判断子模块判断主备功能板的处理负荷指标超过预警门限时,选择处理负荷指标低于轻载门限的其他主备功能板分配新的用户业务。
作为本发明的一个实施例,所述全局控制模块中还预设有过载门限,所述全局控制模块还包括调度子模块,所述判断子模块,还用于进一步判断所述主备功能板的处理负荷指标是否超过过载门限;所述调度子模块,用于在所述判断子模块判断主备功能板的处理负荷指标超过过载门限时,按照预定的粒度将所述主备功能板的用户业务分配到其他处理负荷指标低于轻载门限或预警门限的主备功能板上。
作为本发明的一个实施例,所述判断子模块,还用于在所述调度子模块按照预定的粒度将所述主备功能板的用户业务分配到其他处理负荷指低于轻载门限或预警门限的主备功能板之后,继续判断所述主备功能板的处理负荷指标是否超过过载门限,直至所述主备功能板的处理负荷指标低于所述过载门限或其他主备功能板的处理负荷指标大于所述预警门限。
在上述实施例中,所述分配子模块根据Round Robin负荷均衡算法均匀地分配用户业务。
在上述实施例中,所述主备功能板为控制处理板、业务处理板、交换板或接口处理板。
本发明在1+1主备功能板分布式处理的基础上增加全局控制模块,通过所述全局控制模块的业务分配,从而保证在资源分配阶段的负载均衡性。并且通过本发明全局控制模块的调度,能够将资源负荷高的主备功能板的业务调度到其他资源负荷低的主备功能板上,从而保证主备功能板工作在过载门限之下,因此进一步增强了设备的可靠性和健壮性。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为现有技术中不同控制处理板长时间运行后负载情况示意图;
图2为本发明实施例一的提高设备可靠性方法的流程图;
图3为根据本发明实施例一的N对控制处理板在全局控制下的均衡负荷示意图;
图4为本发明实施例二的提高设备可靠性方法的流程图;
图5为本发明实施例二N块轻载控制处理板分担过载控制处理板话务示意图;
图6为本发明实施例通信设备的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明主要在于在热备份的1+1主备功能板分布式处理的基础上增加与各对主备功能板均相连的全局控制模块,该全局控制模块为整个系统的全局控制中心,所有主备功能板的处理资源构成一个大的资源池,全局控制模块根据用户的业务申请均匀地分配业务资源。这样通过所述全局控制模块控制对各对主备功能板的业务分配,可保证在资源分配阶段各对主备功能板的负载均衡性。并且作为本发明的优选实施例,在本发明中全局控制模块还可对各对主备功能板已分配的业务进行调度,将资源负荷高的主备功能板的业务调度到其他资源负荷低的主备功能板上,从而保证主备功能板工作在过载门限之下,因此进一步增强了设备的可靠性和健壮性。其中,上述主备功能板可为控制处理板、业务处理板、交换板或接口处理板,为了便于理解本发明以下实施例将以控制处理板为例进行介绍,但是需要注意的是不应将上述主备功能板仅限于控制处理板。
实施例一
如图2所示,为本发明实施例一的提高设备可靠性方法的流程图,在该实施例中,每对控制处理板均与全局控制模块相连,全局控制模块根据各对控制处理板上报的处理负荷指标均匀地分配用户的业务分配,该方法包括以下步骤:
步骤S201,各对控制处理板周期性地向全局控制模块上报自身的处理负荷指标,该处理负荷指标表示控制处理板的资源负荷情况。
步骤S202,全局控制模块根据所述各对控制处理板上报的处理负荷指标分配用户的业务。作为本发明的一个实施例,全局控制模块可采用RoundRobin负荷均衡算法均匀地分配控制处理资源,所有的控制处理资源(共同组成一个大的控制处理资源池)可由全局控制中心(在该实施例中为全局控制模块)进行调配,这种轮转分配资源的方式在原理设计上可达到各个控制处理板处理负荷的均衡。如图3所示,为根据本发明实施例一的N对控制处理板在全局控制下的均衡负荷示意图,从该示意图中可以看出,本实施例可均衡地为每对控制处理板分配用户业务。
然而在不同种类、不同时长的用户业务下,经过较长时间的累积,上述实施例一中各对控制处理板的负荷也可能会出现不均衡的情况。针对这种情况,本发明提出通过全局控制模块对控制处理板的负荷调度,将资源负荷高的主备功能板的业务调度到其他资源负荷低的主备功能板上,从而可解决实施例一中可能出现的各对控制处理板的负荷不均衡的问题。
实施例二
如图4所示,为本发明实施例二的提高设备可靠性方法的流程图,在该实施例中对控制处理板设置3个负荷门限,分别为轻载门限Z,预警门限X和过载门限Y,全局控制模块周期性地监控控制处理板的CPU占有率指标及内存使用指标,如果某块控制处理板超过预警门限时,则全局控制模块将不再把用户分配到该板上,选择其他负荷比较轻的单板;并且如果某块控制处理板过载门限,则全局控制模块启动调整过程将该控制处理板的部分负荷调整到其他负荷较轻的控制处理板上。本发明可保证所有的控制处理板不超过设计指标,进一步提高通信设备的可靠性和健壮性。该实施例包括以下步骤:
步骤S401,每对控制处理板周期性地向全局控制模块报告自己的处理负荷指标,例如周期可为5秒,该周期可配置。
步骤S402,全局控制模块判断是否有控制处理板的处理负荷指标超过预警门限X。如果没有控制处理板的处理负荷指标超过预警门限X,则说明没有控制处理板的资源负荷超出预定范围,因此结束调整。其中,需要说明的是,在该步骤中,可以由全局控制模块根据各对控制处理板周期性地上报的处理负荷指标进行判断,也可先由控制处理板检测自己的CPU(或内存)的占用是否超过预警门限X,如果超过则向全局控制模块发送请求。
步骤S403,全局控制模块进一步判断该控制处理板的处理负荷指标是否超过过载门限Y(比如80%,可配置)。
步骤S404,如果该控制处理板的处理负荷指标超过过载门限Y,则全局控制模块将该控制处理板的用户业务分配到其他处理负荷指标低于轻载门限或预警门限的控制处理板上。同时在该控制处理板的处理负荷指标低于预警门限X之前,不再为该控制处理板分配新的用户业务。如果没有其他控制处理板的处理负荷指标低于轻载门限或预警门限,则也不再为该控制处理板进行调度。作为本发明的优选实施例,全局控制模块每次按一个指定粒度k进行微调,隔n秒(可配置)后再检查负荷情况,如果该控制处理板的处理负荷指标已低于过载下限Y,或此时其它控制处理板的处理负荷指标均大于预警门限X,则结束调整过程,否则继续以指定粒度k对该控制处理板进行调整,这样可保证每个控制处理板的负荷不会超过过载门限Y,从而保证设备稳定、可靠地工作。在此需要说明的是上述的指定粒度k为每次调整的步长,本发明可根据系统能力等参数对其预先设定,例如如果指定粒度k太小,则会引起系统的频繁调整,降低效率。如图5所示,为本发明实施例二N块轻载控制处理板分担过载控制处理板话务示意图,从图中可以看出,1号控制处理板的处理负荷指标已超过过载门限Y,而N号控制处理板的处理负荷指标Z,因此全局控制模块将1号控制处理板的部分业务调度至N号控制处理板。
步骤S405,如果该控制处理板的处理负荷指标未超过过载门限Y,则全局控制模块不再为该控制处理板分配新的用户业务,而将新的用户业务分配到其他处理负荷指标低于轻载门限的控制处理板上。如果某一控制处理板的处理负荷指标超过预警门限X但未超过过载门限Y,则说明控制处理板的资源负荷虽然比较大,但是还不需要将其业务调度至其他控制处理板上,全局控制模块只需选择其他负荷低的控制处理板分配新的用户业务即可。作为本发明的一个实施例,全局控制模块根据当前各控制处理板的负荷情况选择一个负荷低于轻载门限Z(比如40%,可配置)的控制处理板分配新的用户业务。
如图6所示,为本发明实施例通信设备的结构示意图,该通信设备包括至少两对热切换的主备功能板100,以及与这些主备功能板100均相连的全局控制模块200。其中主备功能板100用于向全局控制模块200上报自身的处理负荷指标,该处理负荷指标表示该控制处理板的资源负荷情况。全局控制模块200用于根据各对主备功能板100上报的处理负荷指标分配用户的业务。作为本发明的一个实施例,全局控制模块200优先选择处理负荷指标低的主备功能板100分配用户业务。其中上述主备功能板100可为控制处理板、业务处理板、交换板或接口处理板。
具体地,全局控制模块200中预设有轻载门限和预警门限,该全局控制模块200包括接收子模块210、判断子模块220和分配子模块230,接收子模块210用于接收各对主备功能板100上报的处理负荷指标;判断子模块220用于判断是否有主备功能板100的处理负荷指标超过预警门限;分配子模块230用于在判断子模块220判断主备功能板100的处理负荷指标超过预警门限时,选择处理负荷指标低于轻载门限的其他主备功能板100分配新的用户业务。具体地,分配子模块230根据Round Robin负荷均衡算法均匀地分配用户业务。
作为本发明的一个实施例,全局控制模块200中还预设有过载门限,全局控制模块200还包括调度子模块240,判断子模块220还用于进一步判断主备功能板100的处理负荷指标是否超过过载门限;调度子模块240用于在判断子模块220判断主备功能板100的处理负荷指标超过过载门限时,按照预定的粒度将该主备功能板100的用户业务分配到其他处理负荷指低于轻载门限或预警门限的主备功能板100上。另外判断子模块220还用于在调度子模块240按照预定的粒度将主备功能板100的用户业务分配到其他处理负荷指低于轻载门限或预警门限的主备功能板100之后,继续判断该主备功能板100的处理负荷指标是否超过过载门限,直至该主备功能板100的处理负荷指标低于过载门限或其他主备功能板100的处理负荷指标大于预警门限。
本发明在1+1主备功能板分布式处理的基础上增加全局控制模块,通过所述全局控制模块的业务分配,从而保证在资源分配阶段的负载均衡性。并且通过本发明全局控制模块的调度,能够将资源负荷高的主备功能板的业务调度到其他资源负荷低的主备功能板上,从而保证主备功能板工作在过载门限之下,因此进一步增强了设备的可靠性和健壮性。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。