计算机装置和集群服务器装置转让专利

申请号 : CN03826729.2

文献号 : CN1802627B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 新潟克矢

申请人 : 富士通株式会社

摘要 :

具有:分别执行信息处理的多个信息处理单元(501、502、503、…);构成多个信息处理单元(501、502、503、…)的一部分、插拔自如地进行安装的多个存储单元(511、512);物理上分散安装在多个存储单元(511、512)上、采用冗余结构的多个存储装置(52A1、52A2、52B1、52B2);以及分别安装在多个信息处理单元(501、502、503、…)上、访问多个存储装置(52A1、52A2、52B1、52B2)的多个HDD控制器(56A1、56B2)。

权利要求 :

1.一种计算机装置,其特征在于,具有:

分别执行信息处理的第一信息处理单元和第二信息处理单元,所述第一信息处理单元和第二信息处理单元分别具有以可插拔的方式提供的第一可插拔存储单元和第二可插拔存储单元;

多个存储装置,在所述第一可插拔存储单元和第二可插拔存储单元上、物理分散安装有至少各两个所述存储装置,所述多个存储装置采用冗余结构,以使所述第一可插拔存储单元和第二可插拔存储单元存储相同的数据;

被设置在上述第一信息处理单元中的第一控制装置,所述第一控制装置当第一可插拔存储单元连接到所述第一控制装置时访问分散在所述第一可插拔存储单元中的所述第一存储装置,并且当从所述第一信息处理单元单独卸下所述第一可插拔存储单元时访问分散在所述第二可插拔存储单元中的第二存储装置,所述第一存储装置和所述第二存储装置存储相同的数据;以及被设置在上述第二信息处理单元中的第二控制装置,所述第二控制装置当第二可插拔存储单元连接到所述第二控制装置时访问分散在所述第二可插拔存储单元中的不同于所述第二存储装置的第三存储装置,并且当从所述第二信息处理单元单独卸下所述第二可插拔存储单元时访问分散在所述第一可插拔存储单元中的不同于所述第一存储装置的第四存储装置,所述第三存储装置和所述第四存储装置存储相同的数据。

2.如权利要求1所述的计算机装置,其特征在于,

上述第一信息处理单元和第二信息处理单元分别具有服务器功能。

3.如权利要求1所述的计算机装置,其特征在于,

包含上述第一信息处理单元和第二信息处理单元的多个信息处理单元被设成多个组,上述第一控制装置可访问的存储装置的数量和各组的信息处理单元的数量一致。

4.一种集群服务器装置,其特征在于,具有:

分别具有服务器功能的第一信息处理单元和第二信息处理单元,所述第一信息处理单元和第二信息处理单元分别具有以可插拔的方式提供的第一可插拔存储单元和第二可插拔存储单元;

物理上分散安装在上述第一可插拔存储单元和第二可插拔存储单元上、采用冗余结构使上述第一可插拔存储单元和第二可插拔存储单元存储相同的数据的多个存储装置;以及被设置在上述第一信息处理单元中的第一控制装置,所述第一控制装置当第一可插拔存储单元连接到所述第一控制装置时访问分散在所述第一可插拔存储单元中的所述第一存储装置,并且当从所述第一信息处理单元单独卸下所述第一可插拔存储单元时访问分散在所述第二可插拔存储单元中的第二存储装置,所述第一存储装置和所述第二存储装置存储相同的数据;以及被设置在上述第二信息处理单元中的第二控制装置,所述第二控制装置当第二可插拔存储单元连接到所述第二控制装置时访问分散在所述第二可插拔存储单元中的不同于所述第二存储装置的第三存储装置,并且当从所述第二信息处理单元单独卸下所述第二可插拔存储单元时访问分散在所述第一可插拔存储单元中的不同于所述第一存储装置的第四存储装置,所述第三存储装置和所述第四存储装置存储相同的数据。

5.如权利要求4所述的集群服务器装置,其特征在于,

包含上述第一信息处理单元和第二信息处理单元的多个信息处理单元被设成多个组,上述第一控制装置可访问的存储装置的数量和各组的信息处理单元的数量一致。

说明书 :

技术领域

本发明涉及安装了多个信息处理单元的集群型服务器装置等的计算机装置和集群服务器装置,特别涉及在多个信息处理单元中,能够对采用了冗余结构的存储装置进行热交换的计算机装置和集群服务器装置。

背景技术

图9是表示现有的计算机装置10的外观结构的立体图。该计算机装置10是例如服务器装置,在框体11中具有未图示的CPU(Centralprocessing Unit,中央处理器)、HDD(hard disk drive,硬盘驱动器)等。
并且,在框体11的前面形成有2个槽121和122。在这些槽121和122中插拔自如地安装有HDD(硬盘)131和HDD 132。
这些HDD 131和HDD 132是存储由HDD控制器控制读写、由CPU进行处理的各种数据的大容量存储装置。并且,HDD 131和HDD 132为冗余结构。
即,在HDD 131和HDD 132中,分别通过镜像存储了相同的数据,即使一方HDD出现故障,也可以通过另一方HDD来恢复。
并且,在计算机装置10中,具有可以在不停止工作的情况下对HDD131、HDD 132中的发生故障的HDD进行热交换(hot swap)的功能。
因此,当在HDD 131中发生故障时,通过HDD 132来恢复数据,而且,在不停止计算机装置10的工作的情况下,将发生故障的HDD 131从槽121中拔出后,将替换用的HDD(图示略)安装到槽121中。
图10是表示现有的计算机装置20的外观结构的立体图。该计算机装置20是可以在框体21上安装卡型的多个数据处理单元301~30n的集群服务器装置(刀片服务器装置)。各个数据处理单元301~30n具有与计算机装置10(参照图9)相同的功能。
并且,在框体21的前面形成有n个槽221~22n。在这些槽221~22n上插拔自如地安装有信息处理单元301~30n。
图11是图10所示的X-X’线的剖面图。在该图中,对与图10的各部分对应的部分标以相同的标号。在该图中,在框体21的内部设有背板23,其与信息处理单元301~30n(参照图10)物理及电连接。并且,背板23向信息处理单元301~30n供电,具有作为接口的功能。
信息处理单元301由卡状的印刷基板311、HDD 32A1、HDD 32B1、CPU 331、以及HDD控制器341构成,如上所述,和计算机装置10相同,具有服务器功能。
这些HDD 32A1、HDD 32B1、CPU 331以及HDD控制器341安装在印刷基板311上。信息处理单元301通过连接器351安装在背板23上。
这些HDD 32A1和HDD 32B1是由HDD控制器341来进行读写控制、并存储由CPU 331进行处理的各种数据的大容量存储装置。并且,HDD 32A1和HDD 32B1形成了冗余结构。
即,在HDD 32A1和HDD 32B1中,分别通过镜像来存储相同的数据,即使一方HDD出现故障,也可以通过另一方HDD来进行恢复。因此,在HDD 32A1中产生故障的情况下,通过HDD 32B1来恢复数据。
专利文献1日本特开平11-184643号公报
然而,如上所述,在现有的计算机装置20(图10和图11)中,由于在图11所示的信息处理单元301中HDD 32A1和HDD 32B1采用了冗余结构,因此即使一方HDD出现故障,也可以通过另一方HDD来进行恢复,但存在无法对发生故障的HDD进行热交换的问题。
即,由于HDD 32A1和HDD 32B1安装在同一块印刷基板311上,因此当替换发生故障的HDD 32A1时,必须从背板23上拆下整个印刷基板311,并在停止了信息处理单元301(服务器)的工作的状态下,将发生故障的HDD 32A1更换成替换用的HDD之后,再将信息处理单元301安装到背板23上。
本发明就是鉴于上述情况而提出的,其目的在于,提供在多个信息处理单元中,能够对采用冗余结构的存储装置进行热交换的计算机装置和集群服务器装置。

发明内容

本发明的第一方面提供了一种计算机装置,其特征在于,具有:分别执行信息处理的第一信息处理单元和第二信息处理单元,所述第一信息处理单元和第二信息处理单元分别具有以可插拔的方式提供的第一可插拔存储单元和第二可插拔存储单元;多个存储装置,在所述第一可插拔存储单元和第二可插拔存储单元上、物理分散安装有至少各两个所述存储装置,所述多个存储装置采用冗余结构,以使所述第一可插拔存储单元和第二可插拔存储单元存储相同的数据;被设置在上述第一信息处理单元中的第一控制装置,所述第一控制装置当第一可插拔存储单元连接到所述第一控制装置时访问分散在所述第一可插拔存储单元中的所述第一存储装置,并且当从所述第一信息处理单元单独卸下所述第一可插拔存储单元时访问分散在所述第二可插拔存储单元中的第二存储装置,所述第一存储装置和所述第二存储装置存储相同的数据;以及被设置在上述第二信息处理单元中的第二控制装置,所述第二控制装置当第二可插拔存储单元连接到所述第二控制装置时访问分散在所述第二可插拔存储单元中的不同于所述第二存储装置的第三存储装置,并且当从所述第二信息处理单元单独卸下所述第二可插拔存储单元时访问分散在所述第一可插拔存储单元中的不同于所述第一存储装置的第四存储装置,所述第三存储装置和所述第四存储装置存储相同的数据。
根据本发明,由于将采用冗余结构的多个存储装置物理上分散安装到构成多个信息处理单元的一部分、插拔自如地进行安装的多个存储单元中,所以即使一个存储装置发生故障而卸下相应的存储单元,控制装置也可以访问安装在其它存储单元上的存储装置,从而在多个信息处理单元中,能够对采用冗余结构的存储装置进行热交换。
本发明的第二方面提供了一种集群服务器装置,其特征在于,具有:分别具有服务器功能的第一信息处理单元和第二信息处理单元,所述第一信息处理单元和第二信息处理单元分别具有以可插拔的方式提供的第一可插拔存储单元和第二可插拔存储单元;物理上分散安装在上述第一可插拔存储单元和第二可插拔存储单元上、采用冗余结构使上述第一可插拔存储单元和第二可插拔存储单元存储相同的数据的多个存储装置;以及被设置在上述第一信息处理单元中的第一控制装置,所述第一控制装置当第一可插拔存储单元连接到所述第一控制装置时访问分散在所述第一可插拔存储单元中的所述第一存储装置,并且当从所述第一信息处理单元单独卸下所述第一可插拔存储单元时访问分散在所述第二可插拔存储单元中的第二存储装置,所述第一存储装置和所述第二存储装置存储相同的数据;以及被设置在上述第二信息处理单元中的第二控制装置,所述第二控制装置当第二可插拔存储单元连接到所述第二控制装置时访问分散在所述第二可插拔存储单元中的不同于所述第二存储装置的第三存储装置,并且当从第二信息处理单元单独卸下所述第二可插拔存储单元时访问分散在第一可插拔存储单元中的不同于所述第一存储装置的第四存储装置,所述第三存储装置和所述第四存储装置存储相同的数据。
根据本发明,由于将采用冗余结构的多个存储装置物理上分散安装到多个信息处理单元中,所以即使一个存储装置发生故障而卸下相应的信息处理单元,控制装置也可以访问安装在其它信息处理单元上的存储装置,从而在多个信息处理单元中,能够对采用冗余结构的存储装置进行热交换。

附图说明

图1是表示本发明的实施方式1的结构的概略平面图。
图2是沿图1所示的Y-Y’线的剖面图。
图3是说明该实施方式1中的热交换方法的图。
图4是说明该实施方式1中的热交换方法的图。
图5是说明该实施方式1中的热交换方法的图。
图6是表示本发明的实施方式2的结构的概略平面图。
图7是说明该实施方式2中的热交换方法的图。
图8是说明该实施方式2中的热交换方法的图。
图9是表示现有的计算机装置10的外观结构的立体图。
图10是表示现有的计算机装置20的外观结构的立体图。
图11是沿图10所示的X-X’线的剖面图。

具体实施方式

下面,参照附图对本发明的实施方式1和2进行详细说明。
(实施方式1)
图1是表示本发明的实施方式1的结构的概略平面图。图2是沿图1所示的Y-Y’线的剖面图。在这些图中,与图10和图11的各部分对应的部分标以相同标号。
图1所示的计算机装置40是可在框体21上安装卡型的多个信息处理单元501、502、503、…的集群服务器装置(刀片服务器装置)。
在该图中,各个信息处理单元501、502、503、…如图10所示的信息处理单元301、302等那样以垂直状态进行安装,但进行了平面图示。
在框体21的槽221、222、223、…中插拔自如地安装有信息处理单元501、502、503、…。
背板41设置在框体21的内部,通过连接器571、572、…与信息处理单元501、502、…物理及电连接(参照图2)。并且,背板41向信息处理单元501、502、503、…供电、具有作为接口的功能。
各个信息处理单元501、502、503、…和计算机装置10(参照图9)一样,具有服务器功能。
并且,在信息处理单元501、502、503、…中,2台构成1组。在该图中,信息处理单元501和信息处理单元502构成1组。
信息处理单元501由存储单元511和处理器单元541构成。存储单元511和处理器单元541通过连接器531而插拔自如地连接。存储单元511在同一基板上具有HDD 52A1和HDD 52B1。处理器单元541在同一基板上具有CPU 55A1和HDD控制器56A1。
另一方面,信息处理单元502由存储单元512和处理器单元542构成。存储单元512和处理器单元542通过连接器532而插拔自如地连接。存储单元512在同一基板上具有HDD 52A2和HDD 52B2。处理器单元542在同一基板上具有CPU 55B2和HDD控制器56B2。
这里,在信息处理单元501和信息处理单元502中,在该图中(A)所示的要素(HDD 52A1、HDD 52A2、CPU 55A1、HDD控制器56A1)构成了组A。该组A相当于具有由2台HDD构成的冗余结构的1台计算机装置10(参照图9)。
在组A中,HDD 52A1和HDD 52A2是由HDD控制器56A1来进行读写控制、并存储由CPU 55A1进行处理的各种数据的大容量存储装置。
即,HDD 52A1通过连接器531与HDD控制器56A1连接。另一方HDD 52A2通过连接器532、处理器单元542、连接器572、背板41以及连接器571与HDD控制器56A1连接。
并且,这些HDD 52A1和HDD 52A2分散安装在物理上分离的存储单元(存储单元511、存储单元512)上。
另一方面,在该图中(B)所示的要素(HDD 52B1、HDD 52B2、CPU 55B2、HDD控制器56B2)构成了组B。该组B相当于具有由2台HDD构成的冗余结构的又1台计算机装置10(参照图9)。
在组B中,HDD 52B1和HDD 52B2是由HDD控制器56B2来进行读写控制、并存储由CPU 55B2进行处理的各种数据的大容量存储装置。
即,HDD 52B1通过连接器531、处理器单元541、连接器571、背板41以及连接器572与HDD控制器56B2连接。HDD 52B2通过连接器532与HDD控制器56B2连接。
并且,这些HDD 52B1和HDD 52B2分散安装在物理上分离的存储单元(存储单元511、存储单元512)上。
接着,参照图3~图5,对实施方式1中的热交换方法进行说明。下面,如图3所示,对当HDD 52A2发生故障时,在不停止信息处理单元501和信息处理单元502的工作的情况下,对该HDD 52A2进行热交换的例子进行说明。
在图3中,当A组中的存储单元512的HDD 52A2发生故障时,由于由构成冗余结构的另一方的HDD 52A1来进行数据的恢复,所以可以持续工作。
这里,在A组中,由于HDD 52A2的故障而不具有冗余结构,因此实施HDD 52A2的热交换。即,如图4所示,单独卸下存储单元512,与处理器单元542分离。
此时,在A组中,HDD 52A1作为现用,由CPU 55A1和HDD控制器56A1进行访问,不受到上述热交换操作的影响而继续工作。
同样,在B组中,也是HDD 52B1作为现用,由CPU 55B2和HDD控制器56B2进行访问,不受到上述热交换操作的影响而继续工作。
并且,在拔出的存储单元512中,把发生故障的HDD 52A2更换为替换用的HDD 52A2’。
并且,在更换之后,如图5所示,存储单元512通过连接器532安装到处理器单元542上。由此,将计算机装置40恢复到故障前的状态。
如上面说明的那样,根据实施方式1,由于将采用冗余结构的多个HDD 52A1、HDD 52A2(存储装置)物理上分散安装在构成多个信息处理单元501、502的一部分、插拔自如地进行安装的多个存储单元511、512上,所以即使一个HDD 52A2发生故障而卸下相应的存储单元512,HDD控制器56A1也可以访问安装在其它存储单元511上的HDD 52A1,从而在多个信息处理单元501、502中,能够对采用冗余结构的HDD进行热交换。
(实施方式2)
在上述实施方式1中,对可将2台信息处理单元(信息处理单元501和信息处理单元502)作为1组,进行HDD的热交换的结构例进行了说明,但也可以是可将3台(或者4台或4台以上)信息处理单元作为1组,执行HDD的热交换的结构例。下面,将该结构例作为实施方式2而进行说明。
图6是表示本发明的实施方式2的结构的概略平面图。在该图中,对与图1的各部件对应的部分标以相同标号。
图6所示的计算机装置60是可在框体21中安装卡型的多个信息处理单元701、702、703、…的集群服务器装置(刀片服务器装置)。
在框体21的槽221、222、223、…中插拔自如地安装有信息处理单元701、702、703、…。
背板78设置在框体21的内部,通过连接器771、772、773、…与信息处理单元701、702、703、…物理及电连接。并且,背板78向信息处理单元701、702、703、…供电、具有作为接口的功能。
各个信息处理单元701、702、703、…和计算机装置10(参照图9)一样,具有服务器功能。
并且,在信息处理单元701、702、703、…中,3台构成1组。在该图中,信息处理单元701、信息处理单元702以及信息处理单元703构成1组。
信息处理单元701由存储单元711和处理器单元741构成。存储单元711和处理器单元741通过连接器731而插拔自如地连接。存储单元711在同一基板上具有HDD 72A1和HDD 72B1以及HDD 72C1。处理器单元741在同一基板上具有CPU 75A1和HDD控制器76A1。
并且,信息处理单元702由存储单元712和处理器单元742构成。存储单元712和处理器单元742通过连接器732而插拔自如地连接。存储单元712在同一基板上具有HDD 72A2、HDD 72B2以及HDD 7262。处理器单元742在同一基板上具有CPU 75B2和HDD控制器76B2。
并且,信息处理单元703由存储单元713和处理器单元743构成。存储单元713和处理器单元743通过连接器733而插拔自如地连接。存储单元713在同一基板上具有HDD 72A3、HDD 72B3以及HDD 72C3。处理器单元743在同一基板上具有CPU 75C3和HDD控制器76C3。
这里,在信息处理单元701、信息处理单元702以及信息处理单元703中,在该图中(A)所示的要素(HDD 72A1、HDD 72A2、HDD 72A3、CPU 75A1、HDD控制器76A1)构成了组A。该组A相当于具有由3台HDD构成的冗余结构(n+1冗余结构)的1台计算机装置10(参照图9)。
在组A中,HDD 72A1、HDD 72A2以及HDD 72A3是由HDD控制器76A1来进行读写控制、并存储由CPU 75A1进行处理的各种数据的大容量存储装置。
即,HDD 72A1通过连接器731与HDD控制器76A1连接。并且,HDD 72A2通过连接器732、处理器单元742、连接器772、背板78以及连接器771与HDD控制器76A1连接。
并且,HDD 72A3通过连接器733、处理器单元743、连接器773、背板78以及连接器771与HDD控制器76A1连接。
并且,这些HDD 72A1、HDD 72A2以及HDD 72A3分散安装在物理上分离的存储单元(存储单元711、存储单元712、存储单元713)上。
同样,在该图中(B)所示的要素(HDD 72B1、HDD 72B2、HDD 72B3、CPU 75B2、HDD控制器76B2)构成了组B。该组B相当于具有由3台HDD构成的冗余结构(n+1冗余结构)的1台计算机装置10(参照图9)。
在组B中,HDD 72B1、HDD 72B2以及HDD 72B3是由HDD控制器76B2来进行读写控制、并存储由CPU 75B2进行处理的各种数据的大容量存储装置。
即,HDD 72B1通过连接器731、处理器单元741、连接器771、背板78以及连接器772与HD9控制器76B2连接。
并且,HDD 72B2通过连接器732与HDD控制器76B2连接。并且,HDD 72B3通过连接器733、处理器单元743、连接器773、背板78以及连接器772与HDD控制器76B2连接。
并且,这些HDD 72B1、HDD 72B2以及HDD 72B3分散安装在物理上分离的存储单元(存储单元711、存储单元712、存储单元713)上。
同样,在该图中(C)所示的要素(HDD 72C1、HDD 72C2、HDD 72C3、CPU 75C3、HDD控制器76C3)构成了组C。该组C相当于具有由3台HDD构成的冗余结构(n+1冗余结构)的1台计算机装置10(参照图9)。
在组C中,HDD 72C1、HDD 72C2以及HDD 72C3是由HDD控制器76C3来进行读写控制、并存储由CPU 75C3进行处理的各种数据的大容量存储装置。
即,HDD 72C1通过连接器731、处理器单元741、连接器771、背板78以及连接器773与HDD控制器76C3连接。
并且,HDD 72C2通过连接器732、处理器单元742、连接器772、背板78以及连接器773与HDD控制器76C3连接。并且,HDD 72C3通过连接器733与HDD控制器76C3连接。
并且,这些HDD 72C1、HDD 72C2以及HDD 72C3分散安装在物理上分离的存储单元(存储单元711、存储单元712、存储单元713)上。
接着,参照图6~图8,对实施方式2中的热交换方法进行说明。下面,如图6所示,对当HDD 72A2发生故障时,在不停止信息处理单元701、信息处理单元702以及信息处理单元703的工作的情况下,对该HDD 72A2进行热交换的例子进行说明。
在图6中,当A组中的存储单元712的HDD 72A2发生故障时,由于通过构成冗余结构的另一个HDD 72A1(或者HDD 72A3)来进行数据的恢复,所以可以继续工作。
这里,在A组中,由于HDD 72A2的故障而实施HDD 72A2的热交换。即,如图7所示,单独卸下存储单元712,与处理器单元742分离。
此时,在A组中,由HDD 72A1(或者HDD 72A3)作为现用,由CPU 75A1和HDD控制器76A1进行访问,不受到上述热交换操作的影响而继续工作。
同样,在B组中,也由HDD 72B1(或者HDD 72B3)作为现用,由CPU75B2和HDD控制器76B2进行访问,不受到上述热交换操作的影响而继续工作。
同样,在C组中,也由HDD 72C1(或者HDD 72C3)作为现用,由CPU75C3和HDD控制器76C3进行访问,不受到上述热交换操作的影响而继续工作。
并且,在拔出的存储单元712中,把发生故障的HDD 72A2更换成替换用的HDD 72A2’。
并且,在更换之后,如图8所示,把存储单元712通过连接器732安装到处理器单元742上。由此,计算机装置60恢复到故障前的状态。
如上面说明的那样,根据实施方式2,获得与实施方式1相同的效果。
参照附图对以上本发明的实施方式1和2进行了详细描述,但具体的结构例不限于这些实施方式1和2,不脱离本发明宗旨的范围内的设计变更等也包含在本发明中。
如上面说明的那样,根据本发明,由于将采用冗余结构的多个存储装置物理上分散安装到多个信息处理单元中,所以即使一个存储装置发生故障而卸下相应的信息处理单元,控制装置也可以访问安装在其它信息处理单元上的存储装置,从而实现在多个信息处理单元中,能够对采用冗余结构的存储装置进行热交换的效果。
并且,根据本发明,由于将采用冗余结构的多个存储装置物理上分散安装到构成多个信息处理单元的一部分、插拔自如地进行安装的多个存储单元中,所以即使一个存储装置发生故障而卸下相应的存储单元,控制装置也可以访问安装在其它存储单元上的存储装置,从而实现在多个信息处理单元中,能够对采用冗余结构的存储装置进行热交换的效果。
并且,根据本发明,由于在信息处理单元中具有服务器功能,所以实现了在具有多个信息处理单元的服务器中,能够对采用冗余结构的存储装置进行热交换的效果。
并且,根据本发明,当无法利用插拔自如地安装在信息处理单元上的存储装置时,由于可利用安装在其它信息处理单元上的存储装置,从而实现了能够对无法利用的存储装置进行热交换的效果。
工业上的可利用性
如上所述,本发明的计算机装置和集群服务器装置对于在多个信息处理单元中对采用冗余结构的存储装置进行热交换是有用的。