基于光分组交换及光组播的分级控制计算机系统转让专利

申请号 : CN200710019916.1

文献号 : CN100584105C

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 孙小菡赵俊

申请人 : 东南大学

摘要 :

本发明公开了一种基于光分组交换及光组播的分级控制计算机系统,包括至少2组CPU(A),在CPU(A)之间连接有光互连交换装置,光互连交换装置至少包括第1级节点(1)和第2级节点(2),目前的HPCS多采用集中控制方式,每一个端口有业务产生后,必须向中央调度器发送请求信号,若距离较远,则可能引入请求和回答信号较大的往返时延。本发明采用分级控制的管理模式,节点只需向本地控制单元发送请求,可以大大减小此类时延,同时,可以减小每级控制单元的存储和计算压力。

权利要求 :

1、一种基于光分组交换及光组播的分级控制计算机系统,包括至少2组CPU(A),在CPU(A)之间连接有光互连交换装置,其特征在于光互连交换装置至少包括第1级节点(1)和第2级节点(2),其中: 第1级节点由第一级控制单元(11)、第一级光交换单元(12)、第一级光复用器(13)及第一级光分束器(14)组成,第一级光复用器(13)的输出端与第一级光分束器(14)的输入端连接,第一级光分束器(14)的一个输出端与第一级控制单元(11)的输入端连接,用于将含有分组头的信号传送至第一级控制单元(11),第一级光分束器(14)的另一个输出端通过第一光纤延时线(15)与第一级光交换单元(12)的输入端连接,用于将含有数据的信号传送至第一级光交换单元,第一级控制单元(11)的控制信号输出端与第一级光交换单元(12)的控制信号输入端连接,用于控制第一级光交换单元(12)以进行数据的组播交换; 第2级节点至少包括n个二级节点,n≥2且n为自然数,该二级节点(2)包括第二级光复用器(211)、第二级合波器(212)、第二级光分束器(213)、光上下路单元(214)、第二级节点控制单元(215)及第二级节点光交换单元(216),多个CPU的总线输出端分别经过边缘路由器(217)的信号发送端与第二级光复用器(211)的输入端连接,用于将多路光信号采用密集波分复用DWDM技术复用进光纤,第二级光复用器(211)的输出端经光纤与合波器(212)的一个输入端连接,上述第一级光交换单元(12)的输出端分别经过下路波长冲突解决模块(A11、…、An1)与各个二级节点的合波器(212、…2n2)的另一输入端连接,该合波器(212)用于将第一级光交换单元(12)产生的下路信号复用进二级节点,合波器(212)的输出端与第二级光分束器(213)的输入端连接,第二级光分束器(213)的一个输出端经过第二光纤延时线(218)与第二级光上下路单元(214)的一个输入端连接,第二级光分束器(213)的另一个输出端与第二级节点控制单元(215)的控制信号输入端连接,第二级光分束器(213)用于将数据信号与分组头控制信号分离,光上下路单元(214)的输出端与第二级节点光交换单元(216)的输入端连接,第二级节点光交换单元(216)的输出端分别与第二级边缘路由器的信号接收端连接,并将接收的光信号转换为电信号传送至多个CPU的内存,第二级节点控制单元(215)的一个控制信号输出端与光上下路单元(214)的控制信号输入端连接,用于控制光上下路单元(214)的状态,将需要分别在第一级和第二级交换的数据分开,另一个控制信号输出端与第二级节点光交换单元(216)的控制信号输入端连接,用于控制第二级光交换单元(216)以进行数据的组播交换,各个第二级光上下路单元(214)的下路信号输出端分别经过上路波长冲突解决模块(A12、…、An2)与第一级光复用器(13)的输入端连接,用于将需要在第一级节点交换的数据路由至第一级节点。

2、根据权利要求1所述的基于光分组交换及光组播的分级控制计算机系统,其特 征在于第一级节点控制单元(li)、 二级节点控制单元(215)、……或m级节点控制单 元采用控制单元实现,该控制单元由光电转换器(Bl)、头识别单元(B2)、控制单元 接口 (B3)和存储矩阵(B4)组成,光电转换器(Bl)的输入端作为控制单元的控制 信号输入端,光电转换器(Bl)的输出端与头识别单元(B2)的输入端连接,头识别 单元(B2)的输出端分别与控制单元接口 (B3)及存储矩阵(B4)的输入端连接,头 识别单元(B2)将具有明确目的地址的控制信号直接传输至控制单元接口 (B3),而将 没有目的地址的控制信号传输至存储矩阵(B4),通过对存储矩阵(B4)的轮询为任务 分配目的地,存储矩阵(B4)的输出端与控制单元接口 (B3)输入端连接,控制单元 接口 (B3)的输出端作为控制单元的控制信号输出端。

说明书 :

基于光分组交换及光组播的分级控制计算机系统

技术领域

本发明涉及一种分级控制计算机,尤其涉及一种基于光分组交换及光组播的分级控 制计算机系统。

背景技术

过去的若干年里,在技术领域内,计算资源的发展往往跟不上应用的需求。在一些 诸如量子物理实验、全球范围内的气候模拟等专门化的领域当中,需要共享大量的测量 数据来加强分析计算的能力。同时,为了能满足科学研究、资源环境、制造业和服务业 等行业与领域的需要,希望研制出一批基于高性能计算与网格技术的大型应用系统,实 现行业与领域的资源共享和协同工作,提高行业的生产力,促进各部门的信息化建设。
传统的计算和通信资源己不能满足需求。在高性能计算的快速发展过程中,人们提 出了通过高速的网络将分处不同区域的不同计算资源连接起来,以解决一些"大量级" 应用的思想。90年代中期提出的"网格"概念,是实现这种思想的主要实现方法。
但是,电的带宽受到其固有的高频电容、电感效应以及电磁干扰等因素的影响,成 为高速、高容量、低延时数据传输的瓶颈。
现在,光纤和DWDM技术日趋成熟,分布式计算被带到了一个新的高度。通过高 速的光网络及光互连技术,把一系列分布的计算存储节点整合起来作为一个大计算存储 单元的想法在技术和经济上都是可行的。
目前HPCS及Grid的设计从光交换的角度来看主要可以分为光电路交换(OCS), 光突发交换(OBS)及光分组交换(OPS)等方面。
基于OCS的HPCS尝试在节点之间建立永久的静态的光路的连接,适用于吞吐量 较大的流量传输,但其静态特性降低了端口和链路的利用率,不能满足用户突发业务的 需求。
采用OBS技术既可满足较大文件的传输对较高吞吐量的需求,又可满足较小命令 的传输对较低时延的需求。但突发的组装会引入较大的突发装配时延,不能满足低时延的实时传输需求。 发明内容
本发明提供一种能够减小时延,满足用户业务突发性需求,提高链路和端口的利 用率的基于光分组交换及光组播的分级控制计算机系统。 本发明采用如下技术方案:
以两级HPCS为例,定义第一级为主节点,第二级为从节点。主节点带有n个从节 点;每一个从节点带有m个CPUs。主节点具有最高管理级别,管理并控制n个从节点, 从节点管理自己的m个CPUs,以此类推,可以实现多级扩展。定义从节点向主节点转 发的信号为上路信号,主节点向从节点转发的信号为下路信号。
每一个从节点所带的m个CPUs产生的信号通过密集波分复用(DWDM)技术与从 节点交换单元相连,同样,n个从节点产生的信号通过DWDM技术与主节点相连。
CPUs通过控制信道,定期把自己的空闲存储空间、空闲计算能力等信息传到从节 点,从节点同样定期将自己所管理的CPUs的信息向主节点汇报。主,从节点将这些信 息存储在自己控制单元的存储矩阵当中。
CPUs有任务产生以后,在边缘路由器(ER)处组装成光分组,分组头中带有任务 所需的存储容量,计算能力等信息,若有明确的目的地,则带有地址信息。
分组首先在此CPU所在的从节点内部交换,控制单元根据分组头信息为任务分配 或寻找目的地,若无满足需要的目的单元,则将分组转发至主节点。
主节点根据各从节点情况进行均衡,寻找满足合适的从节点,并将任务转发至相应 的从节点,获得任务的从节点再根据分组头信息为任务分配合适的目的CPUs。
光交换单元采用组播技术实现高速大容量数据交换。
与现有技术相比,本发明具有如下优点-
本发明能够实现大批量分布式高性能微处理器的互连和大量突发高速光数据流的 实时交互和共享。高速大容量数据采用分布式控制、分级管理模式进行存储和处理,可 以减小控制单元的计算和存储压力,有利于实现多级扩展,容易实现较远距离CPUs 之间的连接。采用异步交换模式和OPS及组播技术可以减小时延,满足用户业务突发 性需求,提高链路和端口的利用率和数据传输效率,同时避免时钟同步。
目前的HPCS多采用集中控制方式,每一个端口有业务产生后,必须向中央调度
5器发送请求信号,若距离较远,则可能引入请求和回答信号较大的往返时延。本发明采 用分级控制的管理模式,节点只需向本地控制单元发送请求,可以大大减小此类时延, 同时,可以减小每级控制单元的存储和计算压力;
本发明采用异步交换模式,可以减小数据等待时间,满足用户业务的突发性需求, 避免对同步时钟信号的需求,增加了业务交换的灵活性。特别是在进行多级扩展的时候, 若采用同步交换,各级节点之间的同步难度较大,采用异步交换模式可以避免这个问题;
本发明采用DWDM技术可以充分利用光纤容量大的特点,避免了电信号容量较小 的传输瓶颈,提高信道的利用率,另外光纤在抗干扰能力及价格等方面和电传输交换技 术相比也有无法比拟的优势;
本发明采用OPS技术实现数据交换,既可避免OCS的静态特性所导致的较低端口和 链路利用率,也可避免OBS中突发组装所引入的较大装配时延,能够满足用户业务突发
性和实时传输的需求;
本发明采用组播技术,和点对点的单播技术相比,可以大大提高数据传输效率; 目前的HPCS结构在实现多级扩展的时候,每一级往往都需要进行光电光转换,
交换速度和吞吐量都会受到影响。本发明釆用的多级控制技术进行多级扩展时,无需进
行多次光电光转换,可大大提高吞吐量并减小时延。

附图说明

图1是本发明两级系统上下路结构示意图。
图2是本发明节点控制单元结构示意图。
图3是本发明实施例的m级系统结构示意图。
图中,A、 CPUs, 11、第一级节点控制单元,12、第一级节点光交换单元,13、 第一级节点光复用器,14、第一级节点光分束器,15、第一级节点光纤延时线,211、 第二级第1个节点光复用器,212、第二级第1个节点光合波器,213、第二级第1个节 点光分束器,214、第二级第1个节点光交换单元,215、第二级第1个节点控制单元, 216、第二级第1个节点光交换单元,217、边缘路由器,218、第二级第1个节点光纤 延时线,All、第二级第1个节点下路波长冲突解决模块,A12、第二级第l个节点上 路波长冲突解决模块,Anl、第二级第n个节点下路波长冲突解决模块,An2、第二级 第n个节点上路波长冲突解决模块。具体实施方式 实施例l本发明提出基于OPS及光组播的新型分级控制HPCS。以两级HPCS为例,定义第一 级为主节点,第二级为从节点。主节点带有n个从节点;每一个从节点带有m个CPUs。 主节点具有最高管理级别,管理并控制n个从节点,从节点管理自己的m个CPUs,以此 类推,可以实现多级扩展。定义从节点向主节点转发的信号为上路信号,主节点向从节 点转发的信号为下路信号。每一个从节点所带的m个CPUs产生的信号通过密集波分复用(DWDM)技术与从 节点交换单元相连,同样,n个从节点产生的信号通过DWDM技术与主节点相连。CPUs通过控制信道,定期把自己的空闲存储空间、空闲计算能力等信息传到从节 点,从节点同样定期将自己所管理的CPUs的信息向主节点汇报。主,从节点将这些信 息存储在自己控制单元的存储矩阵当中。CPUs有任务产生以后,在边缘路由器(ER)处组装成光分组,分组头中带有任务 所需的存储容量,计算能力等信息,若有明确的目的地,则带有地址信息。分组首先在此CPU所在的从节点内部交换,控制单元根据分组头信息为任务分配 或寻找目的地,若无满足需要的目的单元,则将分组通过光上下路单元转发至主节点。光上下路单元由可调谐光纤布啦格光栅和光环行器组成。主节点根据各从节点情况进行均衡,寻找满足合适的从节点,并将任务转发至相应 的从节点,获得任务的从节点再根据分组头信息为任务分配合适的目的CPUs。 光交换单元采用组播技术实现高速大容量数据交换。参照图1, 一种基于光分组交换及光组播的分级控制计算机系统,包括至少2组 CPUA,在CPUA之间连接有光互连交换装置,光互连交换装置至少包括第l级节点1 和第2级节点2,其中:第l级节点由第一级控制单元h、第一级光交换单元12、第一级光复用器13及第 一级光分束器14组成,第一级光复用器13的输出端与第一级光分束器14的输入端连接, 第一级光分束器14的一个输出端与第一级控制单元1,的输入端连接,用于将含有分组 头的信号传送至第一级控制单元h,第一级光分束器14的另一个输出端通过光纤延时 线15与第一级光交换单元12的输入端连接,用于将含有数据的信号传送至第一级光交 换单元,第一级控制单元1,的控制信号输出端与第一级光交换单元12的控制信号输入7端连接,用于控制第一级光交换单元12以进行数据的组播交换;第2级节点至少包括n个二级节点,n》2且n为自然数,该二级节点2包括第二 级光复用器21卜第二级合波器2h、第二级光分束器213、光上下路单元2U、第二级 节点控制单元215及第二级节点光交换单元216, CPUs的总线输出端分别经过边缘路由 器217的信号发送端与第二级光复用器的输入端连接,用于将多路光信号采用密集 波分复用(DWDM)技术复用进光纤,第二级光复用器21!的输出端经光纤与合波器 212的一个输入端连接,上述第一级光交换单元12的输出端分别经过下路波长冲突解决 模块A1卜…、Am与各个二级节点的合波器212、…2n2的另一输入端连接,该合波器 212用于将第一级光交换单元12产生的下路信号复用进二级节点,合波器2l2的输出端 与第二级光分束器213的输入端连接,第二级光分束器213的一个输出端经过光纤延时 线218与第二级光上下路单元214的一个输入端连接,第二级光分束器213的另一个输 出端第二级节点控制单元215的控制信号输入端连接,第二级光分束器213用于将数据 信号与分组头控制信号分离,光上下路单元214的输出端与第二级节点光交换单元216的输入端连接,第二级节点光交换单元2l6的输出端分别与第二级边缘路由器的信号接收端连接,并将接收的光信号转换为电信号传送至CPUs的内存,第工级节点控制单元 215的一个控制信号输出端与光上下路单元214的控制信号输入端连接,用于控制光上 下路单元2U的状态,将需要分别在第一级和第二级交换的数据分开,另一个控制信号输出端与第二级节点光交换单元2l6的控制信号输入端连接,用于控制第二级光交换单元216以进行数据的组播交换,各个第二级光上下路单元214的下路信号输出端分别经 过上路波长冲突解决模块Ah、…、An2与第一级光复用器l3的输入端连接,用于将需 要在第一级节点交换的数据上路至第一级节点,参照图2,第一级节点控制单元l,、 二 级节点控制单元215、……或m级节点控制单元采用控制单元实现,该控制单元由光电 转换器B1、头识别单元B2、控制单元接口B3和存储矩阵B4组成,光电转换器B1的 输入端作为控制单元的控制信号输入端,光电转换器B1的输出端与头识别单元B2的 输入端连接,头识别单元B2的输出端分别与控制单元接口 B3及存储矩阵B4的输入 端连接,头识别单元B2将具有明确目的地址的控制信号直接传输至控制单元接口 B3, 而将没有目的地址的控制信号传输至存储矩阵B4,通过对存储矩阵B4的轮询为任务 分配目的地,存储矩阵B4的输出端与控制单元接口B3输入端连接,控制单元接口B3 的输出端作为控制单元的控制信号输出端。实施例2参照图3,一种基于光分组交换及光组播的m级计算机系统,包括n⑨力组CPU,在CPU之 间连接有光互连交换装置,其特征在于包括m级光互连交换装置,其中:第1级节点由第一级控制单元、第一级光交换单元、第一级光复用器及第一级光分 束器组成,第一级光复用器的输出端与第一级光分束器的输入端连接,第一级光分束器 的一个输出端与第一级控制单元的输入端连接,用于将含有分组头的信号传送至第一级 控制单元,第一级光分束器的另一个输出端通过光纤延时线与第一级光交换单元的输入端连接,用于将含有数据的信号传送至第一级光交换单元,第一级控制单元的控制信号 输出端与第一级光交换单元的控制信号输入端连接,用于控制第一级光交换单元以进行 数据的组播交换;第2级节点至少包括n个二级节点,n^2且n为自然数,该二级节点包括第二级 光复用器、第二级合波器、第二级光分束器、光上下路单元、第二级节点控制单元及第 二级节点光交换单元,第三级节点的光上下路单元的下路信号输出端分别经过上路波长 冲突解决单元与第二级光复用器的输入端连接,用于将第三级节点的上路信号采用密集波分复用(DWDM.)技术复用进第二级节点,第二级光复用器的输出端经光纤与合波 器的一个输入端连接,上述第一级光交换单元的输出端分别经过下路波长冲突解决模块 与各个二级节点的合波器的另一输入端连接,该合波器用于将第一级光交换单元产生的 下路信号复用进第二级节点,合波器的输出端与第二级光分束器的输入端连接,第二级 光分束器的一个输出端经过光纤延时线与第二级光上下路单元的一个输入端连接,第二 级光分束器的另一个输出端与第二级节点控制单元的控制信号输入端连接,光分束器用 于将数据信号与分组头控制信号分离,光上下路单元的输出端与第二级节点光交换单元 的输入端连接,第二级节点光交换单元的输出端分别与第二级边缘路由器的信号接收端 连接,并将接收的光信号转换为电信号传送至CPUs的内存,第二级节点控制单元的一 个控制信号输出端与光上下路单元的控制信号输入端连接,用于控制光上下路单元的状 态,将需要分别在第一级和第二级交换的数据分开,另一个控制信号输出端与第二级节 点光交换单元的控制信号输入端连接,用于控制第二级光交换单元以进行数据的组播交 换,各个第二级光上下路单元的下路信号输出端分别经过上路波长冲突解决模块与第一 级光复用器的输入端连接,用于将需要在第一级^r点交换的数据上路至第一级节点。第m级节点与第2级节点结构相同,共包括r^m'"个m级节点,n, m》2且n、 m 为自然数,该m级节点包括第m级光复用器、第m级合波器、第m级光分束器、第 m级光上下路单元、第m级节点控制单元及第m级节点光交换单元,CPUs的总线输 出端分别经过边缘路由器的信号发送端与第m级光复用器的输入端连接,用于将多路 光信号采用密集波分复用(DWDM)技术复用进光纤,第m级光复用器的输出端经光 纤与合波器的一个输入端连接,第m-l级光交换单元的输出端分别经过下路波长冲突 解决模块与各个m级节点的合波器的另一输入端连接,该m级合波器用于将第m-l级 光交换单元产生的下路信号复用进第m级节点,第m级合波器的输出端与第m级光分 束器的输入端连接,第m级光分束器的一个输出端经过光纤延时线与第m级光上下路 单元的一个输入端连接,第m级光分束器的另一个输出端第m级节点控制单元的控制 信号输入端连接,第m级光分束器用于将数据信号与分组头控制信号分离,第m级光 上下路单元的输出端与第m级节点光交换单元的输入端连接,第m级节点光交换单元 的输出端分别与第m级边缘路由器的信号接收端连接,并将接收的光信号转换为电信 号传送至CPUs的内存,第m级节点控制单元的一个控制信号输出端与第m级光上下 路单元的控制信号输入端连接,用于控制第m级光上下路单元的状态,将需要分别在 第m-l级和第m级交换的数据分开,另一个控制信号输出端与第m级节点光交换单元 的控制信号输入端连接,用于控制第m级光交换单元以进行数据的组播交换,各个第 m级光上下路单元的下路信号输出端分别经过上路波长冲突解决模块与第m-l级光复 用器的输入端连接,用于将需要在第m-l级节点交换的数据上路至第m-l级节点。