一种用于刀片服务器主板的测试方法转让专利

申请号 : CN201110455553.2

文献号 : CN102411526B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张迎华赵雷杨磊

申请人 : 曙光信息产业股份有限公司

摘要 :

本发明公开了一种用于刀片服务器主板的测试方法,该刀片服务器主板安装于服务器机箱内构成刀片服务器系统,包括:在刀片服务器系统通过第一综合测试后,在Linux操作系统下根据设定的测试规范对刀片服务器系统进行第二综合测试,其中第二综合测试包括以下之一或任意组合:测试刀片服务器主板的CPU的性能,对刀片服务器系统进行压力测试以评估刀片服务器系统的稳定性,测试刀片服务器系统的硬盘的性能,测试刀片服务器系统的内存带宽性能;获取并判断第二综合测试中每项测试的测试结果是否在设定的测试通过范围内,如果都判断为是则判定刀片服务器主板通过第二综合测试。采用本发明可发现刀片服务器主板所存在的绝大多数问题并且可以为试生产奠定基础。

权利要求 :

1.一种用于刀片服务器主板的测试方法,所述刀片服务器主板安装于服务器机箱内从而构成刀片服务器系统,该测试方法包括:对所述刀片服务器系统进行第一综合测试,所述第一综合测试包括:对所述刀片服务器系统进行BIOS功能测试,

对所述刀片服务器系统进行上下电测试,

通过智能平台管理接口IPMI的管理界面读取所述刀片服务器系统的物理健康信息以测试所述IPMI的功能,验证所述刀片服务器系统的基于网络的KVM功能,

对所述刀片服务器系统进行重启以及开关机测试,

对所述刀片服务器系统进行相应的压力测试以测试所述刀片服务器系统的稳定性,测试所述刀片服务器系统的内存带宽性能、浮点性能、读写性能和CPU性能,测试所述刀片服务器系统的CPU和内存在不同数量的配置下,所述刀片服务器系统的内存的带宽性能及效率,测试所述刀片服务器系统中的指定功能部件的温度是否在设定的温度阈值内以评估所述刀片服务器主板和所述刀片服务器系统的散热情况,和对所述刀片服务器主板以及所述刀片服务器系统进行功耗测试;

获取所述第一综合测试中每项测试的测试结果以判断所述刀片服务器系统是否通过所述第一综合测试;

在所述刀片服务器系统通过第一综合测试后,在Linux操作系统下根据设定的测试规范对所述刀片服务器系统进行第二综合测试,其中所述第二综合测试包括以下之一或任意组合:测试所述刀片服务器主板的CPU的性能,

对所述刀片服务器系统进行压力测试以评估所述刀片服务器系统的稳定性,测试所述刀片服务器系统的硬盘的性能,测试所述刀片服务器系统的内存带宽性能;

获取并判断所述第二综合测试中每项测试的测试结果是否在预先设定的测试通过范围内,如果都判断为是则判定所述刀片服务器主板通过第二综合测试。

2.根据权利要求1所述的测试方法,其特征在于,在Linux操作系统下根据设定的测试规范对批量的刀片服务器主板进行所述第二综合测试。

3.根据权利要求1所述的测试方法,其特征在于:

对所述刀片服务器系统进行重启以及开关机测试包括:在Linux操作系统下利用测试人员编写的测试程序测试所述刀片服务器系统的重启及开关机;

判断重启以及开关机测试后的测试结果是否在设定的重启及开关机通过范围内,如果是则判定通过所述刀片服务器系统的重启及开关机测试。

4.一种用于刀片服务器主板的测试方法,刀片服务器主板安装于服务器机箱内从而构成刀片服务器系统,该测试方法包括对所述刀片服务器系统进行第一综合测试,所述第一综合测试包括:对所述刀片服务器系统进行BIOS功能测试,

对所述刀片服务器系统进行上下电测试,

通过智能平台管理接口IPMI的管理界面读取所述刀片服务器系统的物理健康信息以测试所述IPMI的功能,验证所述刀片服务器系统的基于网络的KVM功能,

对所述刀片服务器系统进行重启以及开关机测试,

对所述刀片服务器系统进行相应的压力测试以测试所述刀片服务器系统的稳定性,测试所述刀片服务器系统的内存带宽性能、浮点性能、读写性能和CPU性能,测试所述刀片服务器系统的CPU和内存在不同数量的配置下所述刀片服务器系统的内存的带宽性能及效率,测试所述刀片服务器系统中的指定功能部件的温度是否在设定的温度阈值内以评估所述刀片服务器主板和所述刀片服务器系统的散热情况,和对所述刀片服务器主板以及所述刀片服务器系统进行功耗测试;

获取所述第一综合测试中的每项测试的测试结果以判断所述刀片服务器系统是否通过所述第一综合测试。

5.根据权利要求4所述的测试方法,其特征在于:

对所述刀片服务器系统进行重启以及开关机测试包括:在Linux操作系统下利用测试人员编写的测试程序测试所述刀片服务器系统的重启及开关机;

判断重启以及开关机测试后的测试结果是否在设定的重启及开关机通过范围内,如果是则判定通过所述刀片服务器系统的重启及开关机测试。

说明书 :

一种用于刀片服务器主板的测试方法

技术领域

[0001] 本发明涉及一种用于刀片服务器主板的测试方法。

背景技术

[0002] 刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,是一种实现高可用高密度(High AvailabiMity High Density,HAHD)的低成本服务器平台。刀片服务器是近年发展起来的一种高密度、统一供电、便捷管理和具有统一千兆或万兆网络交换功能、刀片之间可实现高速互联通讯的服务器产品。它与传统机架式服务器的差异较大,因此,测试方案也有较大差异。针对刀片服务器的小批量测试,目前也尚无较完善的方案。

发明内容

[0003] 针对相关技术中的问题,本发明提出一种用于刀片服务器主板的测试方法,能够发现刀片服务器主板存在的绝大多数问题,并且可以为试生产奠定基础。
[0004] 本发明的技术方案是这样实现的:
[0005] 一种用于刀片服务器主板的测试方法,刀片服务器主板安装于服务器机箱内从而构成刀片服务器系统,该测试方法包括:
[0006] 在所述刀片服务器系统通过第一综合测试后,在Linux操作系统下根据设定的测试规范对所述刀片服务器系统进行第二综合测试,其中所述第二综合测试包括以下之一或任意组合:
[0007] 测试所述刀片服务器主板的CPU的性能,
[0008] 对所述刀片服务器系统进行压力测试以评估所述刀片服务器系统的稳定性,[0009] 测试所述刀片服务器系统的硬盘的性能,
[0010] 测试所述刀片服务器系统的内存带宽性能;
[0011] 获取并判断所述第二综合测试中每项测试的测试结果是否在预先设定的测试通过范围内,如果都判断为是则判定所述刀片服务器主板通过第二综合测试。
[0012] 在可选实施方法式中,该测试方法还包括对所述刀片服务器系统进行第一综合测试,所述第一综合测试包括:
[0013] 对所述刀片服务器系统进行BIOS功能测试,
[0014] 对所述刀片服务器系统进行上下电测试,
[0015] 通过智能平台管理接口IPMI的管理界面读取所述刀片服务器系统的物理健康信息以测试所述IPMI的功能,
[0016] 验证所述刀片服务器系统的基于网络的KVM功能,
[0017] 对所述刀片服务器系统进行重启以及开关机测试,
[0018] 对所述刀片服务器系统进行相应的压力测试以测试所述刀片服务器系统的稳定性,
[0019] 测试所述刀片服务器系统的内存带宽性能、浮点性能、读写性能和CPU性能,[0020] 测试所述刀片服务器系统的CPU和内存在不同数量的配置下,所述刀片服务器系统的内存的带宽性能及效率,
[0021] 测试所述刀片服务器系统中的指定功能部件的温度是否在设定的温度阈值内以评估所述刀片服务器主板和所述刀片服务器系统的散热情况,和
[0022] 对所述刀片服务器主板以及所述刀片服务器系统进行功耗测试;
[0023] 获取所述第一综合测试中的每项测试的测试结果以判断所述刀片服务器系统是否通过所述第一综合测试。
[0024] 本发明通过充分测试刀片服务器主板的功能、性能、稳定性、可靠性,并对刀片服务器主板和刀片服务器系统的散热情况和功耗情况进行较充分的验证,可以发现刀片服务器主板所存在的绝大多数问题,并可以为产品试生产奠定技术基础。

附图说明

[0025] 图1是根据本发明一实施例的用于刀片服务器主板的测试方法的流程示意图。

具体实施方式

[0026] 下面结合附图对本发明作进一步地详细说明。
[0027] 根据本发明实施例的用于刀片服务器主板的测试方法,测试时刀片服务器主板安装于服务器机箱内从而构成刀片服务器系统。对刀片服务器系统测试时,通常先对刀片服务器系统进行第一综合测试,并在第一综合测试通过后,对所述刀片服务器系统进行第二综合测试。其中,可以采用现有测试刀片服务器主板的方法对刀片服务器主板进行第一综合测试;也可以采用本申请后面描述的第一综合测试的方法对刀片服务器主板进行第一综合测试。本发明一实施例的用于刀片服务器主板的测试方法的流程示意图如图1所示,该测试方法包括:
[0028] S101,在所述刀片服务器系统通过第一综合测试后,在Linux操作系统下根据设定的测试规范对所述刀片服务器系统进行第二综合测试。
[0029] 在本发明实施例中,对所述刀片服务器系统进行第二综合测试包括测试刀片服务器的以下一个方面或者这些方面的任意组合:
[0030] 测试所述刀片服务器主板的CPU的性能,
[0031] 对所述刀片服务器系统进行压力测试以评估所述刀片服务器系统的稳定性,[0032] 测试所述刀片服务器系统的硬盘的性能,
[0033] 测试所述刀片服务器系统的内存带宽性能。
[0034] 在本发明的一实施方式中,测试刀片服务器主板的CPU性能包括:使用开源的p7zip软件,利用CPU进行压缩操作(compressing)和解压缩操作(decompressing),从而衡量单核或多核MIPS性能(每秒执行多少百万条指令)。
[0035] 在本发明的一实施方式中,测试刀片服务器系统的硬盘的性能包括:通过运行开源的iozone等软件,测试硬盘读写大块文件的吞吐性能,以及硬盘读写小块文件时的IOPS值(Input/Output Operations Per Second,每秒处理I/O读写操作的次数),从而衡量硬盘的带宽和I/O速度快慢。
[0036] 在本发明的一实施方式中,测试内存带宽性能包括:测试内存与CPU之间的数据传输速率,由此可衡量内存访问带宽效率(带宽效率=实测值/理论值)。
[0037] 例如主板有6个DDR 3通道,每通道2个DIMM槽,配置1333MHZ内存*12条;则其理论带宽值为1333*64/8*6=63984MB/s。在该实验环境中,实测得Copy值(数据从内存到CPU的速率)为27234.6218MB/s,则其内存带宽效率为42.6%左右。
[0038] S102,获取并判断所述第二综合测试中每项测试的测试结果是否在预先设定的测试通过范围内,如果都判断为是则判定所述刀片服务器通过第二综合测试。
[0039] 在一可选实施方式中,可以是每进行一项测试后获取该项测试得到的测试结果,然后将测试结果与设定的评判标准值比较,进一步判断比较结果是否在测试通过范围内,如果判断为是则判定所述刀片服务器系统通过该项测试。其中在一种实施方式中评判标准值依据各功能部件的生产商的规格手册中规定的值来设定。在其他可选实施方式中,部分评判标准值依据功能部件的生产商的规格手册中规定的值来设定,另一部分评判标准值依据测试人员的测试经验或者服务器主板生产商的规定来设定。
[0040] 在另一可选实施方式中,可以是在第二综合测试中的每项测试完成后,获取第二综合测试后的测试结果,并逐项判断测试是否通过,如果都判断为是则判定所述刀片服务器主板通过第二综合测试,给出测试通过的提示信息,反之则判定刀片服务器主板没有通过第二综合测试,给出测试失败的提示信息。
[0041] 在一可选实施方式中,测试系统在Linux操作系统下通过测试人员用脚本语言或者其他程序设计编写的测试程序对所述刀片服务器系统自动进行第二综合测试。其中,该测试程序是测试人员基于设定的测试规范编写的。
[0042] 在另一可选实施方式中,测试系统在Linux操作系统下根据设定的测试规范分别调用相应的用脚本语言或者其他程序设计编写的功能测试程序进行测试,从而最终完成第二综合测试。
[0043] 例如,利用P7ZIP软件对CPU进行性能测试的测试步骤包括;
[0044] 1、源码解压缩
[0045] 2、编译并输出到日志文件
[0046] 3、安装p7zip
[0047] 4、运行单核心p7zip测试进程并输出结果到日志文件
[0048] 5、运行多核心p7zip测试进程并输出结果到日志文件
[0049] 6、从结果中取出有效数据、整理并显示。
[0050] 其中,一种用脚本语言编写的实现上述测试步骤的部分程序如下:
[0051]
[0052] 本发明实施例优选基于该测试方案集中化测试20-50台左右的刀片服务器主板以评估小批量刀片服务器主板的综合性能,从而为产品试生产奠定基础。
[0053] 在本发明一实施方式的测试方法中包括对所述刀片服务器系统进行第一综合测试,所述第一综合测试包括:
[0054] S201,对所述刀片服务器系统进行BIOS功能测试。
[0055] 其中,BIOS功能测试包括POST(Power On Self Test,上电自检)检查、SETUP功能测试、接口功能测试、供电以及CMOS电池供电功能验证。
[0056] S202,对所述刀片服务器系统进行上下电测试。
[0057] S203,通过智能平台管理接口IPMI的管理界面读取所述刀片服务器系统的物理健康信息以测试所述IPMI的功能。
[0058] 具体地,登录到IPMI的Web管理界面,可以读取主板管理控制器(Baseboard Management Controller,BMC)的固件信息,可以读取服务器主板上相应传感器的电压和温度信息。Web界面可以通过动态IP或静态IP的方式进行访问。
[0059] S204,验证所述刀片服务器系统的基于网络的KVM功能。
[0060] 在一种实施方式中,KVM交换机通过直接连接键盘、显示器和鼠标端口(KVM端口),能够访问和控制计算机。KVM交换机无需目标服务器修改软件。可通过一个KVM交换机实现由一套输入/输出设备,例如键盘和鼠标,访问多台服务器中的其中一台服务器。在另一种实施方式中,KVM功能以软件的方式设置在服务器上,其它服务器或具备Web浏览器的任意计算机通过网络的形式与KVM软件通信,从而实现基于一套输入设备访问多台服务器下的任意一台服务器。
[0061] S205,对所述刀片服务器系统进行重启以及开关机测试。
[0062] 其中,可以在Windows操作系统下或者Linux操作系统下采用OSreboot软件(Windows公司开发)进行重启以及开关机测试。还可以在Linux操作系统下利用测试人员编写的测试程序测试所述刀片服务器系统的重启及开关机性能。测试中不仅测试直流供电下的服务器主板的重启和开关机性能,还测试交流供电通过电源转换模块下的服务器主板的重启和开关机性能。
[0063] S206,对所述刀片服务器系统进行相应的压力测试以测试所述刀片服务器系统的稳定性。
[0064] 其可以通过Linpack测试软件、Memtest测试软件和IOMeter测试软件(IOMeter组织开发,Intel公司参与)对刀片服务器系统进行压力测试以测试刀片服务器系统的稳定性。
[0065] 其中,可以通过Linpack测试软件进行压力测试来测试服务器系统的性能和可靠性;通过Memtest测试软件进行压力测试来测试内存的性能、以及内存与CPU的兼容性;通过Iometer测试软件进行压力测试来测试硬盘的吞吐性能,以及IOPS值(Input/Output Operations Per Second,每秒处理I/O读写操作的次数)。
[0066] S207,测试所述刀片服务器系统的内存带宽性能、浮点性能、读写性能和CPU性能。
[0067] 其中,可以通过SPEC CPU测试软件(System Performance EvaluationCorporation,系统性能评估测试组织开发)测试CPU性能,通过Linpack测试(Linear system package,线性系统软件包)软件测试刀片服务器系统的浮点性能,通过IOzone测试软件(www.iozone.org开发)测试刀片服务器系统中文件系统的读写性能。Linpack软件现在在国际上已经成为最流行的用于测试高性能计算机系统浮点性能的基准。
[0068] S208,测试所述刀片服务器系统的CPU和内存在不同数量的配置下所述刀片服务器系统的内存的带宽性能及效率。
[0069] 其中在各种CPU和内存条数搭配情况下对刀片服务器系统的内存带宽性能以及效率进行测试。
[0070] S209,测试所述刀片服务器系统中的指定功能部件的温度是否在设定的温度阈值内以评估所述刀片服务器主板和所述刀片服务器系统的散热情况。
[0071] 其中,实时监控刀片服务器系统中的指定功能部件的温度是否在设定的温度阈值内。例如,测试CPU温度是否在该CPU厂商规格手册中指定的范围内。步骤S209包括可以通过Intel平台下的Burn-in Test(PassMark公司开发)测试软件进行测试,或者通过AMD平台下的Thermal Now测试软件进行测试。
[0072] S210,对所述刀片服务器主板以及所述刀片服务器系统进行功耗测试。
[0073] 其中,可以通过Stress测试软件、Linpack测试软件进行压力测试从而测试刀片服务器系统在正常工作时以及静态时的功耗,从而有效评估刀片服务器主板的功耗、刀片服务器系统的功耗和刀片服务器系统的电源冗余方案。
[0074] 在本发明一实施方式中,测试系统将进行前述测试步骤获得的测试结果存储在存储单元,在第一综合测试完成后从存储单元获取所述第一综合测试中的各项测试结果以判断所述刀片服务器系统是否通过所述第一综合测试。例如,测试系统获取步骤S205得到的测试结果,然后判断重启该测试结果是否在设定的重启及开关机通过范围内,如果是则判定通过所述刀片服务器系统的重启及开关机测试。例如,设定重启或者开机或者关机通过阈值为3次,如果测试得到的重启失败为2次,则判断该测试结果在设定的重启通过范围内从而判定所述刀片服务器系统通过重启测试。在本发明另一实施方式中,测试系统在进行步骤S201-S210的测试时,完成某一步骤的测试后即判断该步骤得到的测试结果是否符合通过标准,并将该判断结果存储在存储单元以备后续判断所述刀片服务器系统是否通过所述第一综合测试。在一种实施方式中,判断所述刀片服务器系统是否通过所述第一综合测试的各测试项目的通过标准如表1所示。
[0075] 表1
[0076]
[0077] 在本发明实施例中,对刀片服务器主板进行第一综合测试的作用是充分测试并掌握刀片服务器主板的功能、性能、稳定性、可靠性以及刀片服务器系统的散热情况和功耗情况。
[0078] 第二综合测试也可以称为全自动化老化测试。第二综合测试一方面在于进一步评估刀片服务器主板的综合性能是否符合试生产的技术基础,其能将测试结果输出到日志文件中,以供最终检验判断服务器是否符合出厂要求。第二综合测试的测试项目中每项测试都需要通过服务器厂商设定的标准,从而为服务器厂商生产高性能的产品奠定基础。如内存带宽必须高于40%,Linpack效率必须高于70%,SAS硬盘单盘512K块大小读写速度必须高于110MB/s等。第二综合测试另一方面在于可以验证编写的测试软件是否可流畅无需人工干预的完成服务器老化测试。
[0079] 进一步地,本发明实施例对服务器主板的各项测试和综合性能可以采用评分的方式以有效评估服务器主板。
[0080] 综上所述,借助于本发明的上述技术方案,较充分地测试了刀片服务器主板的功能、性能、稳定性、可靠性,并可对刀片服务器主板和刀片服务器系统的散热情况和功耗情况进行较充分的验证,可以发现刀片服务器主板所存在的绝大多数问题。
[0081] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。