一种保障双控制器存储设备资源连续可用性的装置转让专利

申请号 : CN201510010479.1

文献号 : CN104536853B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 梁吉林

申请人 : 浪潮电子信息产业股份有限公司

摘要 :

本发明公开了一种保障双控制器存储设备资源连续可用性的装置,其实现过程为在每个控制器内设置一套相同的模块,并在后台运行,该模块包括发送模块、接收模块、通信处理模块、裁决模块、资源处理模块、资源接管模块、资源切回模块。该一种保障双控制器存储设备资源连续可用性的装置与现有技术相比,保障在单个控制器出现故障时不影响存储资源的使用,不影响正在提供的服务,并且基本不会发生脑裂的情况;应用到产品中,能够显著的提高产品的可靠性,提升对用户业务的连续支持,对产品有较大的提升,实用性强,易于推广。

权利要求 :

1.一种保障双控制器存储设备资源连续可用性的装置,其特征在于,在每个控制器内设置一套相同的模块,并在后台运行,该模块包括发送模块、接收模块、通信处理模块、裁决模块、资源处理模块、资源接管模块、资源切回模块,其中上述各模块的具体工作过程为:接收模块:接收另一个控制器发送的讯息,将接收到的讯息传递给通信处理模块;当在指定的时间内未收到另一个控制器所发送的讯息时,则传递错误信息给通信处理模块;

发送模块:接收通信处理模块的指令,按照指定的方式向指定的IP或串口发送指定的讯息;

通信处理模块:按照设定的间隔时间传递指令给发送模块,控制发送模块的讯息发送;

获取接收模块传递过来的信息,对获取的信息进行关键字判断,决定下一步的动作;维护本端控制器中所保存的对端控制器的对外服务网络、存储资源和服务信息的配置文件;

裁决模块:接受通信处理模块的指令后启动,通过ping网段网关或串口传输信息来判断是否是本端链路故障,并将判定结果发送给资源处理模块;

资源处理模块:接收裁决模块和通信处理模块的信息,根据信息判断需要触发的操作;

该资源处理模块触发的操作包括:

一、当接收到的裁决模块所发送的信息为本端链路故障,则将本端的资源进行释放;当接收到的裁决模块所发送的信息为另一个控制器链路故障,则触发资源接管模块,对另一个控制器所属的资源进行接管,资源接管分为两部分,分别为:

1)网络地址接管,接管另一个控制器对外提供服务的网络地址IP;

2)资源接管,接管另一个控制器所属的存储资源和对外所提供的服务;

二、当接收到的是通信处理模块发送的另一个控制器资源切回申请信息时,触发资源切回模块,将本端控制器所接管的另一个控制器的所属资源切回到另一个控制器;资源切回分为两部份,分别为:

1)网络地址切回,将本端所接管的对端控制器的对外服务网络切回到对端控制器;

2)资源切回,将本端控制器所接管的对端控制器所属的存储资源和对外服务切回到对端控制器上启动;

资源接管模块:由资源处理模块所控制,负责接管对端控制器的对外服务网络地址和存储资源、服务;对端控制器的对外服务网络、存储资源和服务信息由通信处理模块所维护的配置文件进行获取;

资源切回模块:由资源处理模块所控制,负责将本端所接管的对端控制器的对外服务网络地址、存储资源、服务进行释放,由对端控制器进行启动;对端控制器的对外服务网络、存储资源和服务信息由通信处理模块所维护的配置文件进行获取。

2.根据权利要求1所述的一种保障双控制器存储设备资源连续可用性的装置,其特征在于,所述通信处理模块决定的下一步动作分别为:当获取到的信息为正常的通讯信息时,则仅记录时间戳;当获取到的为错误信息时,启动裁决模块进行下一步处理;当获取到的信息为资源切回请求时,则交由资源处理模块进行下一步处理。

3.根据权利要求1所述的一种保障双控制器存储设备资源连续可用性的装置,其特征在于,每两个相互连接的控制器均通过以下方式进行通信连接:内部网络:即在两个控制器之间设置相互的、单独的指定的一个网段,该网段是一个仅用于这两个控制器之间进行通信的网段;

外部网络:控制器对外提供服务的网络;

串口连接:即通过串行通信接口相互连接。

4.根据权利要求3所述的一种保障双控制器存储设备资源连续可用性的装置,其特征在于,所述通信连接的具体选择过程为:当三条链路都相通时,使用内部网络进行通信;当内部网络不通,外部网络和串口连接相通时,使用串口链路通信;当内部网络和串口连接都不通时,使用外部网络通信。

说明书 :

一种保障双控制器存储设备资源连续可用性的装置

技术领域

[0001] 本发明涉及计算机技术领域,具体地说是一种实用性强、保障双控制器存储设备资源连续可用性的装置。

背景技术

[0002] 在存储设备发展越来越快的今天,单控制器的存储设备在应对大型的应用时已经越来越感觉到吃力,并且容易发生故障导致应用宕机问题。因此,现在较为普及的存储设备大部份已经更换为了双控制器存储、四控制器存储甚至八控制器存储设备。基于现有技术的存储设备,现提供一种保障双控制器存储设备资源连续可用性的装置。

发明内容

[0003] 本发明的技术任务是针对以上不足之处,提供一种实用性强、保障双控制器存储设备资源连续可用性的装置。
[0004] 一种保障双控制器存储设备资源连续可用性的装置,其实现过程为在每个控制器内设置一套相同的模块,并在后台运行,该模块包括发送模块、接收模块、通信处理模块、裁决模块、资源处理模块、资源接管模块、资源切回模块,其中上述各模块的具体工作过程为:
[0005] 接收模块:接收另一个控制器发送的讯息,将接收到的讯息传递给通信处理模块;当在指定的时间内未收到另一个控制器所发送的讯息时,则传递错误信息给通信处理模块;
[0006] 发送模块:接收通信处理模块的指令,按照指定的方式向指定的IP或串口发送指定的讯息;
[0007] 通信处理模块:按照设定的间隔时间传递指令给发送模块,控制发送模块的讯息发送;获取接收模块传递过来的信息,对获取的信息进行关键字判断,决定下一步的动作;维护本端控制器中所保存的对端控制器的对外服务网络、存储资源和服务信息的配置文件;
[0008] 裁决模块:接受通信处理模块的指令后启动,通过ping网段网关或串口传输信息来判断是否是本端链路故障,并将判定结果发送给资源处理模块;
[0009] 资源处理模块:接收裁决模块和通信处理模块的信息,根据信息判断需要触发的操作;
[0010] 资源接管模块:由资源处理模块所控制,负责接管对端控制器的对外服务网络地址和存储资源、服务;对端控制器的对外服务网络、存储资源和服务信息由通信处理模块所维护的配置文件进行获取;
[0011] 资源切回模块:由资源处理模块所控制,负责将本端所接管的对端控制器的对外服务网络地址、存储资源、服务进行释放,由对端控制器进行启动;对端控制器的对外服务网络、存储资源和服务信息由通信处理模块所维护的配置文件进行获取。
[0012] 所述通信处理模块决定的下一步动作分别为:当获取到的信息为正常的通讯信息时,则仅记录时间戳;当获取到的为错误信息时,启动裁决模块进行下一步处理;当获取到的信息为资源切回请求时,则交由资源处理模块进行下一步处理。
[0013] 所述资源处理模块触发的操作包括:
[0014] 一、当接收到的裁决模块所发送的信息为本端链路故障,则将本端的资源进行释放;当接收到的裁决模块所发送的信息为另一个控制器链路故障,则触发资源接管模块,对另一个控制器所属的资源进行接管,资源接管分为两部分,分别为:
[0015] 1)网络地址接管,接管另一个控制器对外提供服务的网络地址IP;
[0016] 2)资源接管,接管另一个控制器所属的存储资源和对外所提供的服务;
[0017] 二、当接收到的是通信处理模块发送的另一个控制器资源切回申请信息时,触发资源切回模块,将本端控制器所接管的另一个控制器的所属资源切回到另一个控制器;资源切回分为两部份,分别为:
[0018] 1)网络地址切回,将本端所接管的对端控制器的对外服务网络切回到对端控制器;
[0019] 2)资源切回,将本端控制器所接管的对端控制器所属的存储资源和对外服务切回到对端控制器上启动。
[0020] 每两个相互连接的控制器均通过以下方式进行通信连接:
[0021] 内部网络:即在两个控制器之间设置相互的、单独的指定的一个网段,该网段是一个仅用于这两个控制器之间进行通信的网段;
[0022] 外部网络:控制器对外提供服务的网络;
[0023] 串口连接:即通过串行通信接口相互连接。
[0024] 所述通信连接的具体选择过程为:当三条链路都相通时,使用内部网络进行通信;当内部网络不通,外部网络和串口连接相通时,使用串口链路通信;当内部网络和串口连接都不通时,使用外部网络通信。
[0025] 本发明的一种保障双控制器存储设备资源连续可用性的装置,具有以下优点:
[0026] 该发明的一种保障双控制器存储设备资源连续可用性的装置用于维护控制器的状态,在控制器发生异常情况时能够及时的进行处理;能够将发生故障的控制器所属资源转移到运行正常的控制器,并且能够释放自身的资源;保障在单个控制器出现故障时不影响存储资源的使用,不影响正在提供的服务,并且基本不会发生脑裂的情况;应用到产品中,能够显著的提高产品的可靠性,提升对用户业务的连续支持,对产品有较大的提升,实用性强,易于推广。

附图说明

[0027] 附图1为本发明的整体结构示意图。
[0028] 附图2为本发明的两控制器之间的链接链路示意图。

具体实施方式

[0029] 下面结合附图和具体实施例对本发明作进一步说明。
[0030] 本发明提出一种保障双控制器存储设备资源连续可用性的装置,用于维护控制器的状态,在控制器发生异常情况时能够及时的进行处理,这里的异常情况包括控制器宕机、数据链路失效等。能够将发生故障的控制器所属资源转移到运行正常的控制器,并且能够释放自身的资源,这里发生故障的控制器所属资源转移到运行正常的控制器,不仅指存储资源的转移,也包括网络资源的转移。
[0031] 如附图1、图2所示,其实现过程为在每个控制器内设置一套相同的模块,并在后台运行,该模块包括发送模块、接收模块、通信处理模块、裁决模块、资源处理模块、资源接管模块、资源切回模块,其中上述各模块的具体工作过程为:
[0032] 接收模块:接收另一个控制器发送的讯息,将接收到的讯息传递给通信处理模块;当在指定的时间内未收到另一个控制器所发送的讯息时,则传递错误信息给通信处理模块;
[0033] 发送模块:接收通信处理模块的指令,按照指定的方式向指定的IP或串口发送指定的讯息;
[0034] 通信处理模块:按照设定的间隔时间传递指令给发送模块,控制发送模块的讯息发送;获取接收模块传递过来的信息,对获取的信息进行关键字判断,决定下一步的动作;维护本端控制器中所保存的对端控制器的对外服务网络、存储资源和服务信息的配置文件;
[0035] 裁决模块:接受通信处理模块的指令后启动,通过ping网段网关或串口传输信息来判断是否是本端链路故障,并将判定结果发送给资源处理模块;
[0036] 资源处理模块:接收裁决模块和通信处理模块的信息,根据信息判断需要触发的操作;
[0037] 资源接管模块:由资源处理模块所控制,负责接管对端控制器的对外服务网络地址和存储资源、服务;对端控制器的对外服务网络、存储资源和服务信息由通信处理模块所维护的配置文件进行获取;
[0038] 资源切回模块:由资源处理模块所控制,负责将本端所接管的对端控制器的对外服务网络地址、存储资源、服务进行释放,由对端控制器进行启动;对端控制器的对外服务网络、存储资源和服务信息由通信处理模块所维护的配置文件进行获取。
[0039] 所述通信处理模块决定的下一步动作分别为:当获取到的信息为正常的通讯信息时,则仅记录时间戳;当获取到的为错误信息时,启动裁决模块进行下一步处理;当获取到的信息为资源切回请求时,则交由资源处理模块进行下一步处理。
[0040] 所述资源处理模块触发的操作包括:
[0041] 一、当接收到的裁决模块所发送的信息为本端链路故障,则将本端的资源进行释放;当接收到的裁决模块所发送的信息为另一个控制器链路故障,则触发资源接管模块,对另一个控制器所属的资源进行接管,资源接管分为两部分,分别为:
[0042] 1)网络地址接管,接管另一个控制器对外提供服务的网络地址IP;
[0043] 2)资源接管,接管另一个控制器所属的存储资源和对外所提供的服务;
[0044] 二、当接收到的是通信处理模块发送的另一个控制器资源切回申请信息时,触发资源切回模块,将本端控制器所接管的另一个控制器的所属资源切回到另一个控制器;资源切回分为两部份,分别为:
[0045] 1)网络地址切回,将本端所接管的对端控制器的对外服务网络切回到对端控制器;
[0046] 2)资源切回,将本端控制器所接管的对端控制器所属的存储资源和对外服务切回到对端控制器上启动。
[0047] 每两个相互连接的控制器均通过以下方式进行通信连接:
[0048] 内部网络:两个控制器之间相互的、单独的指定的一个网段,是一个仅用于这两个控制器之间进行通信的网段。
[0049] 外部网络:控制器对外提供服务的网络,也可以称为数据网络,是正常状态下用于传输数据的网络。
[0050] 串口连接:串行通信接口,在Linux系统中多以ttyS0、ttyS1等进行标识,可以使用A:echo“hello,world”>/dev/ttyS0和B:cat/dev/ttyS0指令来测试两个控制器之间的串口连接情况。
[0051] 所述通信连接的具体选择过程为:当三条链路都相通时,使用内部网络进行通信;当内部网络不通,外部网络和串口连接相通时,使用串口链路通信;当内部网络和串口连接都不通时,使用外部网络通信。
[0052] 上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的一种保障双控制器存储设备资源连续可用性的装置的权利要求书的且任何所述技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。