用以卸载服务器管理流量的系统转让专利

申请号 : CN201610326391.5

文献号 : CN107104910B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 林立民黄志嘉黄楹钦

申请人 : 广达电脑股份有限公司

摘要 :

一种用以卸载服务器管理流量的系统,包括数据端口、带外端口、以及叶交换器。叶交换器包括交换器专用集成电路(ASIC)、以及直接连接交换器ASIC的非受管理芯片(unmanaged chip)。交换器ASIC用以将数据流量导向数据端口,并将基板管理控制器(BMC)流量卸载至非受管理芯片。非受管理芯片用以将BMC流量导向带外端口。

权利要求 :

1.一种用以卸载服务器管理流量的系统,包括:一数据端口;

一带外端口;以及

一叶交换器,包括:

一交换器集成电路;以及

一非受管理芯片,直接连接该交换器集成电路;

其中该交换器集成电路用以将一数据流量导向该数据端口,并将一基板管理控制器流量卸载至该非受管理芯片,该非受管理芯片用以将该基板管理控制器流量导向该带外端口,并且其中该非受管理芯片使用一媒体访问控制表以及一虚拟局域网配置将该基板管理控制器流量导向该带外端口。

2.如权利要求1所述的系统,还包括一处理器,该非受管理芯片连接该处理器。

3.如权利要求1所述的系统,其中该非受管理芯片还用以将一进入管理流量从该带外端口导向该交换器集成电路,该交换器集成电路还用以将该进入管理流量导向该基板管理控制器。

4.一种用以卸载服务器管理流量的方法,包括:以一交换器集成电路将一数据流量导向一数据端口;

以该交换器集成电路将一基板管理控制器流量卸载至一非受管理芯片,其中该非受管理芯片直接连接该交换器集成电路;以及以该非受管理芯片将该基板管理控制器流量导向一带外端口,其中该非受管理芯片使用一媒体访问控制表以及一虚拟局域网配置以将该基板管理控制器流量导向该带外端口。

5.一种用以卸载服务器管理流量的系统,包括:一数据端口;

一带外端口;

一叶交换器,包括:

一处理器;

一交换器集成电路,连接该处理器;

一非受管理芯片,连接该处理器,且该非受管理芯片直接连接该交换器集成电路;

其中该交换器集成电路用以将一数据流量导向该数据端口,并将一基板管理控制器流量卸载至该非受管理芯片,该非受管理芯片用以将该基板管理控制器流量导向该带外端口,并且其中该非受管理芯片使用一媒体访问控制表以及一虚拟局域网配置以将该基板管理控制器流量导向该带外端口;以及一基板管理控制器,连接该处理器以及该非受管理芯片。

6.如权利要求5所述的系统,还包括一处理器,其中该非受管理芯片以一串行千兆位媒体独立接口或一串行器/解串器接口连接该处理器,该非受管理芯片以一以太网络接口连接该交换器集成电路。

7.如权利要求5所述的系统,其中该非受管理芯片还用以将来自该带外端口的一进入管理流量导向该交换器集成电路,该交换器集成电路还用以将该进入管理流量导向该基板管理控制器。

说明书 :

用以卸载服务器管理流量的系统

技术领域

[0001] 本发明涉及计算机系统,特别涉及用以卸载服务器管理流量至带外端口的系统及方法。

背景技术

[0002] 现代数据中心的计算机服务器系统通常以特定配置安装于服务器机柜(server rack)上,服务器机柜中放置多个计算模块且这些计算模块互相堆叠于彼此之上,计算模块例如是服务器托盘(tray)、服务器机壳(chassis)、服务器滑轨(sled)、服务器刀锋(blade)等等。安装在机柜上的系统可以使得计算模块垂直摆放,以有效利用空间。一般而言,每个计算模块可以滑入机柜或是自机柜滑出,各种电缆可从机柜的前方或后方连接至计算模块,电缆例如是输入输出电缆、网络电缆、电力电缆等等。各计算模块包括一或多个计算机服务器,或是具有一或多个计算机服务器组件,举例而言,计算模块包括硬件电路用以处理、存储、网络控制器、磁盘驱动器、电缆端口、电源供应等等。
[0003] 各计算模块可连接至网络,例如以太网络(Ethernet network),对于连接至局域网(Local Area Network,LAN)以及广域网(Wide Area Network,WAN)的计算机而言,以太网络已为广泛运用的网络标准。以太网络装置藉由传送数据封包(packet)进行通信,数据封包包括个别传送的数据区块(block)。藉由数据链路层(Data Link Layer)的网络存取以及共同寻址格式,以太网络定义了物理层(Physical Layer,PHY)的多个接线与信号的标准。
[0004] 典型的服务器系统包括管理控制器,例如基板管理控制器(Baseboard Management Controller,BMC),BMC是一种嵌入于服务器系统主板的专用微控制器,BMC管理系统管理软件与平台硬件之间的接口。不同类型的传感器可设置于计算机系统内,向BMC回报相关参数,例如温度、散热风扇速度、电源状态、操作系统状态等等。BMC监控多个传感器,当有任何参数数值超出了预设的限制范围时,BMC能够通过以太网络传送警告信息给系统管理员(Administrator),告知服务器系统可能的不正常运行。系统管理员能够通过以太网络远程与BMC通信,以采取改正措施使得系统恢复正常功能,改正措施例如是系统重置或是重新启动电源。
[0005] 目前一些服务器系统将BMC与系统管理员之间的流量与来自服务器系统的数据流量分开,其使用放置于机柜顶端(top-of-rack,TOR)的管理交换器(management switch)将流量分开。将BMC流量与数据流量分开,可确保BMC流量不会受到数据流量拥塞(congestion)影响。然而,由于管理交换器的必要性,将会占据服务器机柜的空间,并且增加服务器机柜的成本。

发明内容

[0006] 以下呈现一或多个实施例的简要概述以提供对本技术的基本了解。此概述并非本技术的所有可能实施例的泛泛总览,也不是要确立所有例示的关键或重要组件,或是描述本技术的任一或所有层面的范畴。其唯一目的在于用简要的形式呈现一或多个例子的一些概念,以此作为后面的详细说明的序言。
[0007] 在部分实施方式中,提出一种用以卸载服务器管理流量的系统,包括数据端口、带外端口、以及叶交换器。叶交换器包括交换器集成电路、以及直接连接交换器集成电路的非受管理芯片。交换器集成电路用以将数据流量导向数据端口,并将BMC流量卸载至非受管理芯片。非受管理芯片用以将BMC流量导向带外端口。
[0008] 在部分实施方式中,提出一种用以卸载服务器管理流量的方法,包括下列步骤。以交换器集成电路将数据流量导向数据端口;以交换器集成电路将BMC流量卸载至非受管理芯片,其中非受管理芯片直接连接交换器集成电路;以及以非受管理芯片将BMC流量导向带外端口。
[0009] 在部分实施方式中,提出一种用以卸载服务器管理流量的系统,包括数据端口、带外端口、以及叶交换器。叶交换器包括处理器、交换器集成电路、以及非受管理芯片。交换器集成电路连接处理器。非受管理芯片连接处理器且直接连接交换器集成电路。交换器集成电路用以将数据流量导向数据端口,并将BMC流量卸载至非受管理芯片。非受管理芯片用以将BMC流量导向带外端口。此系统还包括BMC,BMC连接处理器以及非受管理芯片。

附图说明

[0010] 本技术的多个方面将配合附图描述于以下的详细说明以及权利要求内:
[0011] 图1绘示用以卸载管理控制器流量的示例性系统的框图。
[0012] 图2绘示用以卸载管理控制器流量的示例性系统的框图。
[0013] 图3绘示用以卸载管理控制器流量的示例性方法。
[0014] 图4绘示示例性计算机系统的框图。
[0015] 附图标记说明
[0016] 100、200:系统
[0017] 110:脊节点
[0018] 120:服务器机柜
[0019] 122、210:TOR交换器
[0020] 124:服务器
[0021] 129:管理交换器
[0022] 130:管理服务器
[0023] 132:带外路径
[0024] 140:路由器
[0025] 220:处理器
[0026] 230:交换器ASIC
[0027] 232、242、262、272、282:连接
[0028] 235:数据端口
[0029] 240:非受管理芯片
[0030] 245:带外端口
[0031] 260:网络
[0032] 270:管理服务器
[0033] 280:服务器
[0034] 310:以交换器ASIC将数据流量导向数据端口
[0035] 320:以交换器ASIC将管理流量卸载至非受管理芯片,其中非受管理芯片直接连接交换器ASIC
[0036] 330:以非受管理芯片将管理流量导向带外端口
[0037] 400:计算机系统
[0038] 410:BIOS
[0039] 420:存储器
[0040] 430:存储部
[0041] 440:处理器
[0042] 450:网络接口
[0043] 460:北桥
[0044] 470:南桥
[0045] 480:管理控制器

具体实施方式

[0046] 本公开提供将管理控制器流量卸载(offloading)至带外(out-of-band)的技术。本技术的多个层面将配合附图进行说明。在以下描述中,为了解释的目的,陈列出多个具体的细节以提供对本技术一或多个层面的理解。然而明显地,本技术可以不用这些具体的细节来实现。在其他例子中,已知的结构及装置绘示于框图中以便于描述本公开的这些层面。
[0047] 图1绘示用以卸载管理控制器流量的示例性系统100的框图。在部分实施方式中,系统100包括多个服务器机柜120以形成叶脊网络拓扑(leaf-spine network topology)中的第一阶层(tier),此例中服务器机柜120即为叶节点(leaf node),第一阶层即为叶阶层(leaf layer)。每个作为叶节点的服务器机柜120包括机柜顶端(top-of-rack,TOR)交换器(switch)122以及一或多个服务器124。各服务器124包括管理控制器,例如基板管理控制器(Baseboard Management Controller,下称BMC),经由网络适配器(Network Interface Card,NIC)连接到TOR交换器122。一或多个脊节点110形成叶脊网络拓扑中的第二阶层并连接至路由器140,第二阶层即为脊阶层(spine layer),每一个脊节点110皆连接到路由器140。举例而言,路由器140可适用于局域网(LAN)或广域网(WAN)。
[0048] 叶阶层包括叶节点120,每个叶节点包括连接至装置的叶交换器(TOR交换器122)。脊阶层包括脊节点110,每个脊节点包括脊交换器。脊阶层为网络的主干,网络中各个叶节点120皆连接到每一个脊节点110。
[0049] 在部分实施方式中,叶节点120当中的每个服务器连接到管理交换器129的前端口(或数据端口(data ports))。管理服务器130可以是系统管理员使用的计算机、平板、或移动装置,管理服务器130间接连接至管理交换器129。在一些实施例中,管理服务器130可监控从各个BMC传送的系统健康状态,管理服务器130也使得系统管理员能够远程管理各服务器124的BMC。
[0050] 在部分实施方式中,TOR交换器122可整合管理交换器129的功能,但将数据流量与BMC流量分开,以将BMC流量从带外端口(out-of-band port)卸载至管理服务器130。来自服务器机柜120中各服务器124的数据流量在叶脊网络中移动至路由器140。管理流量经由带外路径(out-of-band path)132在管理服务器130与TOR交换器122之间移动。
[0051] 带外(out-of-band)指的是使用特定路径以管理网络装置,例如服务器机柜120中的服务器124。带外管理可用以确保管理连接性不受到其他非带外网络组件的状态影响。带外管理使得系统管理员能够远程监控并且管理服务器以及其他连接到网络的设备,不论装置是否开机、也不论操作系统是否安装或功能正常。相较之下,带内(in-band)管理是基于带内连接性以及已安装的软件,软件只有在操作系统启动后才能执行。
[0052] 图2绘示用以卸载管理控制器流量的示例性系统200的框图。在部分实施方式中,系统200包括服务器机柜内的TOR交换器210,TOR交换器210连接至服务器机柜内各个服务器280的一或多个BMC。在部分实施方式中,TOR交换器210包括处理器220、交换器专用集成电路(Application-Specific Integrated Circuit,ASIC)230、以及非受管理芯片(Unmanaged Chip)240。
[0053] 网络交换器(例如以太网络交换器)是使用于计算机网络将多个装置物理连接在一起的一种装置。多条电缆连接到交换器以使得网络装置能够互相沟通。交换器藉由将接收到的信息仅传送到此信息意图到达的装置,以管理网络中的数据流向。每个连接到交换器的网络装置可使用媒体访问控制(Media Access Control,MAC)地址以辨别身份,使得交换器管理流向。交换器包括ASIC以建立并且维护MAC地址表。
[0054] TOR交换器210的交换器ASIC 230(或交换器集成电路)经由数据端口235,使用连接262连接到网络260。举例而言,网络260是局域网(LAN)或是广域网(WAN)。ASIC是为特定用途而定制的集成电路,而非一般用途使用,以使得在这个特定用途能有较佳的效率。交换器ASIC 230使用连接282连接服务器280。
[0055] 交换器ASIC 230用以将向外(outbound)数据流量,从服务器280经由数据端口235以及连接262导向网络260。交换器ASIC 230还用以将向外BMC流量从服务器280的BMC卸载至非受管理芯片240。向外BMC流量包括管理服务器270与服务器280的BMC之间的管理流量。
[0056] 交换器ASIC 230还用以将进入(inbound)数据流量从网络260导向服务器280。交换器ASIC 230还用以将进入BMC流量(源自管理服务器270),从非受管理芯片240导向服务器280的BMC。
[0057] TOR交换器210的非受管理芯片240使用带外连接272,经由带外端口245连接到管理服务器270。举例而言,管理服务器270是服务器机柜中一或多个服务器的系统管理员所使用的计算机、平板、或移动装置。
[0058] 非受管理芯片240可包括不具有远程配置、管理、或监控选项的交换器。然而,部分的非受管理芯片可以藉由发光二极管(Light Emitting Diode,LED)指示器以及双列直插封装(Dual In-line Package,DIP)开关(Switch)而在本地端作监控以及设定。DIP Switch是手动操作的电子开关,封装于标准双列直插封装。一般而言这些交换器比受管理交换器(managed switch)便宜。
[0059] 相较于非受管理芯片,受管理交换器支持通过嵌入式代理(embedded agent)的简单网络管理协议(Simple Network Management Protocol,SNMP),具有指令行接口(Command Line Interface,CLI),可使用串行控制台(Serial Console)、远程登录(Telnet)、安全壳(Secure Shell)存取。受管理交换器通常可以群体被设定及管理。
[0060] 在部分实施方式中,非受管理芯片240用以将向外BMC流量,从交换器ASIC 230导向带外端口245。在一些实施例中,非受管理芯片240可以使用MAC表以及虚拟局域网(VLAN)配置以将BMC流量导向该带外端口245。
[0061] 交换器ASIC 230使用连接232连接处理器220。在一些实施例中,连接232是外设组件互联标准(Peripheral Component Interconnect,PCI)、快捷外设互联标准(PCI Express,PCIe)、或其类似。PCI使用共享并行总线架构,其中PCI主机与所有装置共享相同组合的地址、数据以及控制线。相较之下,PCIe使用点对点拓扑,各装置以分别的串行链路连接至主机。就总线协议而言,PCIe通信是封装在封包内。
[0062] 非受管理芯片240使用连接242连接处理器220。在一些实施例中,连接242是串行千兆位媒体独立接口(Serial Gigabit Media Independent Interface,SGMII)或串行器/解串器(Serializer/Deserializer,SerDes)接口。
[0063] 图3绘示用以卸载管理控制器流量的示例性方法。方法300包括,在步骤310,以交换器ASIC将数据流量导向数据端口。
[0064] 方法300包括,在步骤320,以交换器ASIC将管理流量卸载至非受管理芯片,其中非受管理芯片直接连接交换器ASIC。
[0065] 方法300包括,在步骤330,以非受管理芯片将管理流量导向带外端口。
[0066] 图4绘示示例性计算机系统400的框图。计算机系统400包括处理器440、网络接口450、管理控制器480、存储器420、存储部430、基本输入输出系统(Basic Input/Output System,BIOS)410、北桥(Northbridge)460、以及南桥(Southbridge)470。
[0067] 计算机系统400例如是服务器(例如数据中心的服务器机柜中的服务器)或个人计算机。处理器(例如中央处理单元,CPU)440是主板上的芯片,可检索并执行存储器420存储的程序指令。处理器440可以是具有单一处理核心的单一CPU、具有多处理核心的单一CPU、或是多个CPU。一或多个总线(未绘示于图中)于多个计算机组件之间传送指令与应用程序数据,计算机组件例如包括处理器440、存储器420、存储部430、以及网络接口450。
[0068] 存储器420包括用以暂时性或永久性存储数据或程序的实体装置,例如各种形式的随机存取存储器(RAM)。存储部430包括非易失性数据存储的实体装置,例如硬盘或闪存盘(flash drive)。相较于存储器420,存储部430可具有较大容量,每单位存储量的成本较低,然而也可能有较慢的传输速率。
[0069] BIOS 410包括基本输入输出系统、其等同物或其后代衍生物,例如可扩展固件接口(Extensible Firmware Interface,UEFI)或统一可扩展固件接口(Unified Extensible Firmware Interface,UEFI)。BIOS 410包括BIOS芯片,设置于存储BIOS软件程序的计算机系统400的主板上。BIOS 410存储有固件,此固件在计算机系统初次开机时伴随着为BIOS 410指定的配置设定而被执行。BIOS固件以及BIOS配置存储在非易失性存储器(NVRAM)或是只读存储器(ROM),例如闪存(flash memory)。闪存是一种非易失性计算机存储介质,可以电子信号擦除(erase)以及重新编程(reprogram)。
[0070] 每次计算机系统400启动时,BIOS 410被加载并作为顺序程序被执行。BIOS 410可根据配置设定而识别、初始化、并且测试计算机系统中的硬件。BIOS 410可对计算机系统执行自测试,例如开机自检测(Power-On-Self-Test,POST)。此自测试可测试多个硬件组件,例如硬盘、光盘读取装置、散热装置、存储器模块、扩展卡及其类似。BIOS 410寻址并且配置存储器420的一区域以存储操作系统,BIOS 410接着将计算机系统的控制权交给操作系统。
[0071] 计算机系统400的BIOS 410包括BIOS配置,BIOS配置定义BIOS 410如何控制计算机系统400的各种硬件组件,BIOS配置决定计算机系统400的各种硬件组件启动的顺序。BIOS 410提供一个接口(例如BIOS设定公用程序)以允许设定各种参数,可以设定为不同于BIOS预设配置的参数。举例而言,用户(例如系统管理员)可以使用BIOS 410指定频率以及总线速度、指定连接到计算机系统的外围装置、指定监控健康程度(例如风扇速度以及CPU温度的限制)、以及指定其他各式各样会影响计算机系统性能与功率消耗的参数。
[0072] 管理控制器480是一种嵌入于计算机系统主板的专用微控制器,举例而言,管理控制器480是基板管理控制器(BMC)。管理控制器480管理系统管理软件与平台硬件之间的接口。不同类型的传感器可设置于计算机系统内,向管理控制器480回报相关参数,例如温度、散热风扇速度、电源状态、操作系统状态等等。管理控制器480监控多个传感器,当有任何参数数值超出了预设的限制范围时,管理控制器480能够通过网络传送警告信息给系统管理员,告知系统可能的不正常运行。系统管理员能够远程与管理控制器480通信,以采取改正措施使得系统恢复正常功能,改正措施例如是系统重置或是重新启动电源。
[0073] 北桥460是主板上的芯片,可直接连接处理器440或是集成于处理器440内。在一些实施例中,北桥460及南桥470可集成于单一芯片。北桥460及南桥470管理处理器440与主板上其他组件之间的沟通。相较于南桥470,北桥460管理需要较高性能的工作。北桥460管理处理器440、存储器420、以及影像控制器(未绘示于图中)之间的沟通。在一些实施例中,北桥460包括影像控制器。
[0074] 南桥470是主板上的芯片,连接至北桥460,而南桥470不一定需要直接连接处理器440(与北桥460不同)。南桥470管理输入输出功能,例如计算机系统400的通用串行总线(Universal Serial Bus,USB)、音频、串行接口、BIOS、串行高级技术附件(Serial Advanced Technology Attachment,SATA)、PCI总线、PCI延伸(PCI-X)总线、PCI快捷(Express)总线、工业标准体系结构(ISA)总线、串行外围接口(SPI)总线、改良串行外围接口(eSPI)总线、系统管理总线(SMBus)。南桥470可连接管理控制器480、直接存储器访问(Direct Memory Access,DMA)控制器、可编程中断控制器(Programmable Interrupt Controller,PIC)、以及实时时钟,上述这些单元也可以包含于南桥470内部。在一些实施例中,南桥470直接连接处理器440,例如当北桥460集成于处理器440内部时。
[0075] 网络接口450是可支持局域网或广域网的任意接口,例如以太网络、光纤信道、Wi-Fi、蓝牙(Bluetooth)、火线(Firewire)、因特网等等。举例而言,网络接口450可包括以太网络的网络接口控制器(NIC)。对于在局域网以及广域网连接计算机,以太网络已为广泛运用的网络标准。藉由媒体访问控制(MAC)/数据链路层的网络存取以及共同寻址格式,以太网络定义了物理层(PHY)的多个接线与信号的标准。以太网络使得装置藉由传送数据封包进行通信,数据封包包括个别传送的数据区块。
[0076] 与本公开相关的各个说明性逻辑区块、模块以及电路,实现方式可以通过通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ASIC)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)或其它可编程逻辑设备、离散门或晶体管逻辑、离散硬件组件、或前述的任意组合,经设计而执行本文所述的功能。通用处理器是一种微处理器,或是任一种传统的处理器、控制器、微控制器或状态机。处理器也可实现为运算装置的组合,例如DSP及微处理器的组合、多个微处理器、一或多个微处理器连同一DSP核心、或任何其他配置。
[0077] 与本文公开叙述关联的操作方法或算法可直接内嵌于硬件、由处理器所执行的软件模块、或两者的组合当中。软件模块可放置于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、缓存、硬盘、可移除式磁盘、CD-ROM、或任何其他公知的存储介质形式。一示例性的存储介质耦接至处理器,使处理器可自存储介质读取或对其写入信息。或者,存储介质集成至处理器当中。处理器以及存储介质可置于ASIC当中。而ASIC可置于用户终端。或者,处理器以及存储介质可作为用户终端中的离散组件。
[0078] 在一或多个示例性设计中,所述的功能实现于硬件、软件、固件或其任一组合当中。若实现于软件,这些功能以一或多个指令或程序代码的形式被存储或是传输在非瞬时计算机可读取介质上。非瞬时计算机可读取介质包括计算机存储介质以及通信介质,通信介质包括任意一种可促使计算机程序从一处传输至另一处的介质。存储介质可以是任一种可被通用计算机或特殊用途计算机所存取的介质。举例来说,但不限于,计算机可读取介质包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储或其他磁性存储装置、或任何其他可用来承载或存储所需程序代码手段的介质,所述程序代码手段的形式例如为可被通用或特殊用途计算机、或通用或特殊用途处理器所存取的指令或数据结构。本文所述的磁盘(disk)及光盘(disc)包括压缩光盘(Compact Disc,CD)、激光光盘(laser disc)、光学光盘(optical disc)、数字激光盘(digital versatile disc,DVD)、软盘(floppy disk)以及蓝光光盘(blue ray disc),其中,磁盘通常是磁性地复制(reproduce)数据,而光盘则通常是光学地通过激光来复制数据。上述的结合也属非瞬时计算机可读取介质的范畴。
[0079] 综上所述,虽然本发明已以较佳实施例公开如上,然其并非用以限定本发明。本领域技术人员在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当以所附的权利要求为准。