多处理器计算系统及其计算组件内的电源管理方法转让专利

申请号 : CN200380107857.3

文献号 : CN1742249B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 迪恩·杜宾斯基

申请人 : 国际商业机器公司

摘要 :

多计算组件系统所用的一种电源管理系统。所述管理系统能够对挂起和休眠两种低功率运行状态下的各个计算组件进行运行管理。此外,所述管理系统还能够对各个计算组件内的功耗附件进行粒度管理。当计算组件处于挂起或休眠的低功率状态时,它可以热交换到另一个位置。此外,当计算组件从休眠的低功率状态恢复时,它可以访问所述系统中的替代映像。所以,所述电源管理系统允许多计算组件系统中的各个组件有五种运行状态。

权利要求 :

1.一种多处理器系统的计算组件内的电源管理方法,该方法包括以下步骤:(a)分析至少具有两个计算组件的网络计算环境中的所述计算组件的操作,其中所述操作包括组件利用;

(b)根据所述分析判断所述计算组件是否需要继续运行状态;

(c)修改所述计算组件的运行状态,以响应判断需要所述继续运行状态,其中,一种可用状态支持所述计算组件的操作系统映像与从选自由本地存储器和连接到网络上的存储器组成的组的存储介质之间的通信;以及从低功率状态恢复所述计算组件时,访问连接到网络上的存储器内的替代操作系统映像。

2.根据权利要求1的方法,进一步包括对所述计算组件内功耗附件的粒度管理进行控制的步骤。

3.根据权利要求2的方法,其中,所述功耗附件选自下列项组成的组:微处理器、磁盘驱动器、I/O端口、芯片及其组合。

4.根据权利要求1的方法,其中,修改所述计算组件运行状态的步骤包括通过开关改变所述计算组件的功耗。

5.根据权利要求1的方法,其中,修改所述计算组件运行状态的步骤包括通过软件管理系统控制所述计算组件的所述运行状态。

6.根据权利要求1的方法,其中,所述计算组件的所述运行状态选自下列项组成的组:最大功率、硬件附件的选择性减少、挂起、休眠、复原、恢复、关闭及其组合。

7.根据权利要求1的方法,进一步包括当所述计算组件被修改为在所述低功率状态运行时,热交换所述计算组件的步骤。

8.根据权利要求7的方法,其中,所述低功率状态选自下列项组成的组:挂起和休眠。

9.一种多处理器计算系统,包括:

多个计算组件,其中,计算组件包含带有功耗附件的印刷电路板;

用于对至少具有两个计算组件的网络计算环境中的所述计算组件的操作进行分析的管理器,其中所述操作包括组件利用;

所述管理器用于响应所述分析,调用对所述计算组件的运行状态的修改,其中,一种可用状态支持所述计算组件的操作系统映像与从选自由本地存储器和连接到网络上的存储器组成的组的存储介质之间的通信;以及存储管理器,用于指示所述计算组件在所述计算组件从低功率状态的恢复功能期间,访问在网络存储器中存储的替代映像。

10.根据权利要求9的系统,其中,所述运行状态的修改包括所述计算组件功耗附件的粒度管理。

11.根据权利要求10的系统,其中,所述附件选自下列项组成的组:微处理器、磁盘驱动器、I/O端口、芯片及其组合。

12.根据权利要求9的系统,其中,所述计算组件的所述运行状态选自下列项组成的组:最大功率、硬件附件的选择性减少、挂起、休眠、复原、恢复、关闭及其组合。

13.根据权利要求9的系统,其中,所述计算组件适于在被修改为在低功率状态下运行时,进行热交换过程。

14.根据权利要求13的系统,其中,所述低功率状态选自下列项组成的组:挂起和休眠。

说明书 :

技术领域

一般说来,本发明涉及在计算环境中管理电源消耗的装置和方法。更确切地说,本发明涉及在多计算组件环境中管理各个计算组件。

背景技术

膝上计算机是个人计算机,一般包括微处理器、硬件存储、I/O端口和通信端口。所述膝上计算机可以独立地运行以满足个人计算需要,如果所述膝上计算机包括网络适配器或调制解调器,它也可以成为局域或广域网的一部分。
当今膝上和个人计算机表现出的特性之一是所述计算机能够被置于低功率的运行状态,比如挂起和休眠。这两种低功率运行状态都为个人计算机相关业内公知。在所述挂起状态下,对处理器和主板上的其他附件关闭电源,但是内存保持不变。这是一种低功耗状态。当所述计算机的操作者希望恢复使用所述硬件附件时,所述操作者必须对所述处理器、所述主板和所述相关联硬件附件恢复全功率,尽管由于所述内存保持不变,不必重新启动整个系统。除了所述挂起状态之外,所述个人计算机还可以被置于低功耗的休眠状态,把所述内存的内容置于磁盘之后,关闭所述计算机的电源。所以,进入所述挂起状态和恢复所述计算机的电源,或者进入所述休眠状态和复原所述计算机的电源,而不是终止所述计算机电源和后来重新启动所述整个系统,一般说来耗时较少。所以,在所述膝上或个人计算机上使用所述挂起状态是个人计算机系统上电源管理的一个实例。
在5,802,305号美国专利、US 2002/0007463A1号美国专利申请和康柏计算机公司、英特尔公司、微软公司、凤凰科技有限公司和东芝公司联合出版的the Advanced Configuration and Power InterfaceSpecification Revision 2.0中,介绍了常规电源管理系统的实例。
依照定义,多处理器计算机系统包含多个处理器,本文也称为CPU,它们能够以称为并行计算的方式同时执行多个过程或单一过程中的多个线程。一般说来,多处理器系统执行多个过程或线程快于顺序执行若干程序的常规单处理器系统,比如个人计算机(PC)。实际性能优势取决于许多因素,包括多线程过程和/或多个不同过程的若干部分能够并行执行的程度,以及手边具体多处理器系统的架构。
共享内存多处理器系统的架构可以根据其内存如何物理地组织而分类。在分布式共享内存(DSM)机器中,所述内存划分成若干模块,物理地置于一个或多个处理器附近,典型情况下是在处理器节点上。尽管所有的所述内存模件都是全局可访问,但是处理器访问其节点上的本机内存能够快于其他节点上的远程内存。因为所述内存访问时间根据内存位置而不同,这类系统也称为非均匀内存访问(NUMA)机器。反之,在集中式共享内存机器中,所述内存物理地处于一个位置。集中式共享内存计算机被称为均匀内存访问(UMA)机器,因为所述内存对每个所述处理器是时间等距的。典型情况下,两种内存组织形式都使用高速缓存协助主存,以减少执行时间。
处理器节点可以分组以形成分区,它是操作系统下一个或多个节点互连的集合,以形成计算环境。在同一计算机系统内能够存在多个分区。计算机系统内的每个分区执行单一的独立操作系统映像。多处理器计算机系统可以处于多个节点或分区集合的结构中,包括服务处理器硬件、管理控制台和其他基础设施,代表单一的可管理和可配置环境。所以,一个系统也能够被分拆成多个逻辑计算机系统或分区,它们中每一个都执行单一操作系统映像。
除了分区节点形式的多处理器计算系统以外,还有刀片式多处理器计算系统。所述刀片式系统是局域网或广域网上可用的分布式计算资源的集合,对最终用户和应用呈现为一个大的虚拟计算系统。每项计算资源都是可拆卸卡上的服务器,插在共享基础设施中,再插入机架。所述计算资源可以共享键盘、监视器以及至所述局域网或广域网络的连接。所述系统内的每项资源都可以被配置为在不同操作系统下运行。所以,刀片式多处理器计算系统是带有多项资源的可升级系统实例,所述资源适于通过公共的通信连接进行通信通信。
分区式多处理器计算环境和刀片式多处理器计算环境都包括多个计算组件。每个组件至少包括一片印刷电路板,带有一个或多个微处理器和一个通信端口。多计算组件系统——包括刀片式计算机系统以及分区式计算机系统——的当前管理,需要在需要维护时关闭指定的计算组件。每个组件都运行在开或关这两种状态中的一种。不存在运行的中间状态。这影响到组件的电源管理或者说组件上的功耗附件,以及组件的计划和非计划维护。所以,有必要启用计算机系统中组件运行的中间状态,以便在网络计算环境内能够进行组件的有效电源管理。

发明内容

本发明包括多计算组件计算环境内的电源管理系统。对于大规模和小规模的操作级别,所述系统都进行电源管理。
在本发明的第一方面,提供了一种计算组件内的电源管理方法。所述方法包括所述计算组件的功耗分析、根据所述功耗分析判断所述计算组件需要的功耗级别以及对应地修改所述计算组件的运行状态,其中,所述计算组件的所述运行状态选自下列项组成的组:最大功率、硬件附件的选择性减少、挂起、休眠、复原、恢复、关闭及其组合。所述方法也可以包括对所述计算组件内功耗附件的粒度管理进行控制。这类附件可以包括微处理器、磁盘驱动器、I/O端口和/或芯片。修改所述计算组件运行状态的步骤可以包括通过开关或者软件管理系统。所述计算计算组件的运行状态包括最大功率、硬件附件的选择性减少、挂起、休眠、复原、恢复以及关闭。当所述计算组件从低功率运行状态返回时,所述计算组件也可以访问网络存储设备的替代映像。此外,当所述计算组件正在低功率状态运行时,所述计算组件可以进行热交换。低功率的运行状态包括挂起状态和休眠状态。
在本发明的第二方面,提供了具有多个计算组件的多处理器计算系统,包括用于对所述计算组件进行功耗分析的装置;用于根据所述功耗分析对所述计算组件需要的功耗级别进行判断的装置;用于响应所述判断,修改所述计算组件的运行状态的装置,其中,所述计算组件的所述运行状态选自下列项组成的组:最大功率、硬件附件的选择性减少、挂起、休眠、复原、恢复、关闭及其组合。运行状态的修改可以包括所述组件的功耗附件的粒度管理,比如微处理器、磁盘驱动器、I/O端口以及芯片。所述运行状态可以包括最大功率、功率的选择性减少、挂起、休眠、复原、恢复以及关闭。此外,所述系统还可以包括存储管理器,适于指示所述计算组件在恢复所述部件功能期间,访问在网络存储设备中存储的替代映像。所述计算组件正在低功率状态运行时,比如所述挂起和休眠状态时,也可以进行热交换过程。
在本发明的第三方面,提供了含有计算机可读信号承载介质的制造产品。所述制造产品包括管理器,用于分析多计算组件计算环境中计算组件的功耗。在所述介质中提供了控制系统。所述控制系统响应所述管理器,改变所述计算组件的运行状态。所述介质的形式可以是可记录的数据存储介质,或调制后的载波信号。所述组件的运行状态可以包括最大功率、硬件附件的选择性减少、挂起、休眠、复原、恢复或关闭。所述控制系统可以适于控制所述计算组件内功耗附件的运行。优选情况下,所述功耗附件包括微处理器、磁盘驱动器、I/O端口和/或芯片。此外,所述组件从休眠状态返回时,所述控制系统可以为所述计算组件访问连接到网络上的存储器内的替代映像。当所述组件正在低功率状态运行时,所述控制系统也适于提供所述计算组件的热交换。
连同附图阅读本发明之目前优选实施例的以下详细说明,本发明的其他特性和优点将变得显而易见。
附图简要说明
图1是现有技术可分区多处理器计算机系统的框图;
图2是现有技术刀片式多处理器计算机系统的示意图;
图3是一幅流程图,展示了根据本发明优选实施例计算组件的粒度电源管理,建议印刷在所发布专利的第一页上;
图4是一幅流程图,展示了计算组件低功率运行状态的选择过程。
图5是多组件计算机系统的示意图,展示了一种替代电源管理工具。

具体实施方式

综述
多计算组件系统中各个计算组件的电源管理对所述各个组件和所述系统都增强了运行效率。各个组件的管理级别可以是将整个组件置于低功率运行状态。另外,各个组件的管理形式也可以是所述计算组件中功耗附件的粒度管理。两种形式的电源管理都在总体上增强了所述组件和所述系统的效率和运行。
技术细节
图1所示,多处理器系统10可以包括多个节点。所述系统10使用分布式共享内存(DSM)架构,它可以是也可以不是非均匀内存访问(NUMA)机器。如图1所示,有12、14、16和18四个节点,每个节点都由系统互连20连接,它允许任何节点与所述系统任何其他节点通信。所述系统互连20的目的是使任何节点的处理器都能够访问所述系统任何其他节点上驻留的内存。系统互连20的物理链接提供了高带宽和低延迟,并且是可升级的以容许在所述系统10中增加更多的节点。所以,所述多处理器系统10是可分区计算机系统的实例。
所述系统中的所述计算组件的形式为可分区系统内的分区、刀片或等效可分区计算组件。所述组件是印刷电路板,包含一个或多个微处理器和一个通信端口,而且它可以可选地包含硬件附件,比如存储硬件、内存、I/O端口和电池。图2是多组件系统30的实例,组件40和50存储在机架32中。组件140是印刷电路板42,显示为带有硬盘42和不带电池。组件250是印刷电路板52,显示为带有电池54,但不带硬盘。组件140和组件250都具有各自的通信端口(未显示)。所述组件40和50共享到局域网36的通信线34。如图所示,所述局域网36与组件140和组件250都进行通信。所述机架32是一个外壳,适于存储一个组件或多个组件。在所述机架32内的所有所述组件共享键盘60、显示设备65以及到所述局域网36的所述通信线34。所述机架32也用于向每个所述组件提供外部电源。组件40和50都显示为通过所述局域网36连接至连接到网络上的存储器55。由于组件140具有其本身的硬盘,它可以在其本身的存储硬件中本地存储数据,也可以将其存储信息直接写入所述连接到网络上的存储器55。另外,组件140也可以使用其对所述局域网36的访问,将数据存储至中心位置。
在现有技术中,多组件计算机系统的每个计算组件都能够运行在最大功率或无功率两种运行状态之一。在所述优选实施例中,每个组件都可以运行在五种状态之一,两种所述状态为最大功率或无功率,三种剩余的状态为运行的中间状态。所述三种中间运行状态的第一种是功率的选择性减少。这种状态使所述组件能够继续运行,但是可能不会提供所述组件以及任何相关功耗附件全部能力的最佳性能。所述三种中间运行状态的第二种称为挂起。这种状态使所述组件能够在低功率状态下继续运行。为了选择所述挂起状态,所述组件必须具有电池或者与电源保持通信。为了使所述组件从所述挂起状态返回至全功率,操作者必须对所述组件复原供电。所述复原过程使所述组件返回全功率运行,而不需要重新启动所述组件。第三种中间运行状态称为休眠。在所述休眠状态下,所述计算组件的全部内存内容被写入连接到网络上的存储器,并且向所述操作系统发送了标记:当恢复所述组件时不重新起动。所述标记将指示所述操作系统检索在所述连接到网络上的存储器中存储的所述内存内容。这使得所述组件返回至适度或全功率运行状态能够快于从重新起动所述组件所提供的速度。所述休眠状态要求所述组件在终止供电之前将其内存写入存储器中。当所述操作者希望所述组件从所述休眠状态返回全功率时,他们必须恢复所述组件。恢复所述组件的过程包括检索过去存储到所述本机磁盘或连接到网络上的存储器中的内存内容。所述三种中间运行状态使得所述操作者能够在后来返回全功率,而不必完全关闭电源,之后再重新起动所述组件。在每种所述中间运行状态下,所述组件和所述组件的所述选定的功耗附件消耗的功率都较少。所以,所述三种中间运行状态使得所述系统的操作者能够在所述计算环境中灵活地管理分配到所述可分区组件的功率。
有几个实施例可以使所述计算系统内的所述计算组件能够进入所述三种中间运行状态之一。在一个实施例中,可以调用系统管理软件以控制所述组件的运行状态,以及组件内的功耗附件。图3是流程图100,展示了在粒度级别上管理计算组件电源的过程,即所述组件以及所述组件的功耗组件。电源管理的第一个步骤是判断所述组件是否需要连续运行104。这包括分析所述组件的功耗和判断所述系统内所述组件的使用情况。如果不需要运行所述组件,那么就要求选择期望的低功率或无功率运行状态116。所述状态可以包括关闭所述组件的电源118或将所述组件置于低功率状态120。如果需要运行所述组件,下一个步骤就是判断是否需要运行任何所述功耗附件106,即它们是否正在使用。不需要运行的功耗附件能够被选择性地关闭108。然而,如果任何所述组件附件需要处于运行状态,那么就必须判断是否任何所述附件能够运行在降低能力状态下110。然后这些选定的功耗附件会在各自的基础上减慢112。例如,能够运行在两吉赫兹速度的处理器可以被减慢至五百兆赫兹以节省能量。如果判定所述功耗附件不能在降低能力状态下运行,那么它们就必须都保持在全功率下运行114。所以,所述系统管理软件能够对多计算组件系统中各个组件的电源进行管理,以及对各个组件内功耗附件的电源进行粒度管理。
所述电源管理软件能够在多组件系统中控制各个组件的运行。如以上说明,所述系统中的每个组件都可以运行在低功率状态下,即步骤120。所述低功率状态称为休眠和挂起。图4是流程图150,展示了选择组件低功率运行状态的过程。所述选择运行状态的一部分包括判断所述组件是否具有电池154。如果所述组件没有电池,那么必须判断所述组件是否将继续与外部电源通信156。为了使所述组件在延长的时间期间内保持在挂起状态,需要在所述挂起期间的供电。例如,如果所述组件要保留在所述机架内,它就能够在其处于挂起状态延续期间继续从所述机架接收供电。如果在步骤156的查询是肯定的,所述组件就可以进入所述挂起运行状态158。然后关闭所述组件的处理器电源160,而所述组件的内存则保持活动162。在所述挂起状态,所述组件继续耗电,所以需要从其内部电池提供足够的电源或者从外部电源继续供电。为了使所述组件回到运行状态,所述组件必须通过复原过程。这个过程使所述组件能够迅速地返回全功率,而不必重新启动所述组件。所以,如果所述组件不要在延长的时间期间内保持在低功率状态,并且需要迅速地返回全功率运行状态,那么就可能需要所述挂起的低功率状态。
图4还展示了将组件置于休眠低功率状态的过程。在这种状态下,不要求所述组件具有电池或与外部电源通信。当所述组件进入所述休眠状态时164,所述组件将其内存内容写入所述本机磁盘或连接到网络上的存储器166。然后所述组件向所述操作系统发送标记,指明所述组件的内存置于所述本机磁盘或连接到网络上的存储器168。这使得所述组件从休眠状态完成所述恢复过程时访问其映像。然后对所述处理器和所述组件的全部功耗附件关闭电源170。所述组件一旦处于休眠状态,它就可以从所述机架移走而无须考虑对所述组件连续供电。所述组件可以在不定长的时间期间保持休眠状态。当给所述组件再次供电以意图使所述组件返回全部或部分功率状态时,所述休眠组件必须通过恢复过程。所述恢复过程比与所述挂起状态相关联的所述复原过程耗时多,但是比所述组件的重新启动耗时少。所以,对于长期的低功率运行状态可能需要所述休眠的低功率状态。
如果多组件系统内的计算组件与连接到网络上的存储器通信,所述组件就可以可选地使用磁盘作为本机存储。在所述休眠状态的另一个实施例中,不包括本机硬盘的组件也可以利用这种低功率状态。当没有硬盘的组件初始进入所述休眠状态时,它通过非易失性存储器中的网络地址将其映像存储在所述连接到网络上的存储器设备中。没有本机硬盘的计算组件将需要在组件上有芯片或软件,以对所述操作系统模拟本机磁盘。这种芯片或软件使得所述组件和所述连接到网络上的存储器设备之间能够通信。所以,所述芯片或软件使所述组件能够利用所述休眠状态,而不需要在所述组件上设置硬盘。
当组件处于或者是挂起状态或者是休眠状态时,所述组件能够从所述机架中移走。这就使得处于这两种低功率运行状态之一的组件能够从所述机架的一个插槽移至同一机架的另一个插槽或另一个机架,即热交换。所述组件一旦置于所述机架内所期望的位置,所述组件就可以或者通过从所述挂起状态的复原过程或者通过从所述休眠状态的恢复过程回到全功率运行。由于这两种过程都比所述组件的完全重新启动快,所以当选择所述组件做热交换过程时,它们更受欢迎。所以,在组件热交换的情况下,将根据所述组件将要保持在低功率状态的时间长度以及所述组件返回全功率运行所需要的时间,可能需要把所述组件置于所述挂起或休眠的低功率状态。
除了在低功率状态的计算组件能够进行热交换以外,在休眠状态的计算组件还可以在所述恢复功能期间不需要重新启动所述组件而从所述连接到网络上的存储器设备访问不同映像。当组件进入所述休眠状态时,全部内存内容从本机磁盘或SCSI扩展写入所述连接到网络上的存储器设备,并且向所述操作系统发送标记:对所述组件恢复供电时不重新启动所述组件。此外,所述标记对所述组件用作指示器,指明所述内存内容在所述连接到网络上的存储器设备中的位置。对所述组件恢复供电时,所述组件可以可选地访问所述连接到网络上的存储器设备中的替代映像。众所周知,在多组件环境下,不同组件执行不同的任务。例如,基于Linux映像和基于Windows映像执行不同的任务。所述Linux映像和所述Windows映像在休眠状态都能够存储在所述连接到网络上的存储器设备中。当确定了转换工作负载时,可以把替代映像恢复至从所述休眠状态返回的所述组件。替代映像可以根据需要而恢复,包括对已分区的计算系统重新分区。恢复替代映像的过程显著地快于和效率高于重新启动和/或重新配置计算组件。所以,使用休眠映像缩短了恢复若干系统映像之间的转换时间。
优于现有技术的优点
各个计算组件的所述低功率运行状态,以及组件内功耗附件的粒度管理提高了多组件计算系统的运行效率。在小规模和大规模上都可以管理电源。系统内的各个组件可以运行在五种级别之一,排列为从无功率到全功率,具有三种中间运行级别。此外,所述中间运行级别之一能够对独立组件进行粒度管理。所述组件的粒度管理包括控制所述组件的各个功耗附件的运行。所述粒度管理结合所述软件管理系统能够在低功率应用阶段期间降低功耗和发热量、能够为替换工作负载改进系统配置,并且能够安排多组件系统中各个组件的维护。
除了组件内若干附件的粒度管理之外,所述电源管理也使得或者挂起或者休眠状态下的组件能够热交换。或者通过复原或者通过恢复过程使所述组件返回全功率之前,可以把所述组件置于所述机架内另一个插槽,或另一个机架。最后,休眠组件恢复至全功率运行时,可以在与其被置于所述休眠状态时不同的映像下运行。恢复休眠的组件时,软件管理系统可以指定所述组件至所述连接到网络上的存储器设备中的替代映像。这就提高了所述组件根据所述系统工作负载的灵活性,而不必把所述组件完全重新启动到不同映像。所以,本文公开的电源管理为多组件计算系统提高了运行效率。
替代实施例
应当承认,尽管为了展示的目的本文已经介绍了本发明的特定实施例,但是在不脱离本发明实质和范围的情况下,可以做出多种修改。具体地说,所述系统的每个计算组件都可以包括手动开关,与软件管理系统连同使用或独立使用。图5展示了多组件计算机系统180。在这幅图中,单一组件184显示为放置在机架182中。所述组件184具有印刷电路板186,包括本机电池188和硬盘190。所述组件184具有通信端口(未显示),使所述组件能够通过局域网194与连接到网络上的存储器设备192进行通信。所述组件184在其前方有一对按钮196和198。第一个按钮196用于将所述组件置于休眠,第二个按钮198用于将所述组件置于挂起。当所述组件运行在全功率时,所述按钮196和19将都亮起第一种颜色,指明全功率的运行状态。此时当所述按钮196、198之一被操作员或外部压力源激活,所述按钮196、198将亮起第二种颜色,指明所述组件处于改变其运行状态的过程中。一旦所述组件完成了至所期望运行状态的转换,所述按钮196、198将亮起第三种颜色。尽管所述按钮已经显示为以颜色指明运行状态,但是所述按钮也可以使用与之相关联的标记指明运行状态。同样,也可以使用通信工具比如键盘来取代所述组件184上安装的按钮,以启动组件操作状态的改变。所以,本发明的保护范围仅仅由以下的权利要求书及其相当内容所限定。