面向全舰计算环境的统一资源管理系统及方法转让专利

申请号 : CN201710035518.2

文献号 : CN106850598B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 谢彬卜炜李宁波王敬平王慧玲

申请人 : 中国电子科技集团公司第三十二研究所

摘要 :

本发明公开了一种面向全舰计算环境的统一资源管理系统及方法,该系统包括统一资源描述模块,通过XML文件的配置实现平台节点、软件等配置信息的分发、查询、解释和执行;节点宿主OS部署或更新模块,需根据平台资源的描述解析,通过网络部署或节点OS;虚拟机部署模块,需从资源描述池中选择并解析资源描述文件,通过网络将虚拟机批量分发到平台节点中等。本发明提升硬件资源的利用效率和共用水平,部署安装任务调度更加便捷,容易实施。

权利要求 :

1.一种面向全舰计算环境的统一资源管理系统,其特征在于,其包括:统一资源描述模块、节点宿主OS部署或更新模块、虚拟机部署模块、虚拟机故障迁移模块、应用部署与管理模块以及资源统一管理模块,其中:统一资源描述模块,通过XML文件的配置实现平台节点和软件配置信息的分发、查询、解释和执行;

节点宿主OS部署或更新模块,需根据平台资源的描述解析,通过网络部署或节点OS;

虚拟机部署模块,需从资源描述池中选择并解析资源描述文件,通过网络将虚拟机批量分发到平台节点中;

虚拟机故障迁移模块,在计算/存储节点服务出现异常时,根据统一资源描述模块中的虚拟机故障迁移处理策略,在指定的备份计算节点中下载镜像,重新启动应用服务器;

应用部署与管理模块,需从资源描述池中选择并解析资源描述文件,通过网络将应用软件、管理脚本以及依赖软件批量分发到平台节点中;

资源统一管理模块,部署在管理节点上,对虚拟机进行开启、关停以及重启管理操作,对应用软件进行安装卸载和启动停止管控,对整个部署的拓扑图和部署过程进行日志记录、存储和管理。

2.一种面向全舰计算环境的统一资源管理方法,其特征在于,其包括节点宿主OS部署或更新流程、虚拟机部署流程、虚拟机故障迁移流程以及应用部署与管理流程;

所述节点宿主OS部署或更新流程主要包括以下步骤:步骤一,配置平台资源描述;

步骤二,启动节点,尝试网络加载节点OS;

步骤三,启动节点OS,并启动节点代理;

步骤四,发送宿主OS;

步骤五,本地固化OS及文件系统;

所述应用部署与管理流程主要包括以下步骤:步骤三十一,批量分发应用软件、管理脚本以及依赖软件;

步骤三十二,安装或卸载应用软件;

步骤三十三,启动或停止应用软件;所述虚拟机部署流程主要包括以下步骤:步骤十一,批量分发软件;

步骤十二,虚拟机/Docker管理工具启动;

步骤十三,虚拟机/Docker管理;

步骤十四,虚拟镜像下发;

所述虚拟机故障迁移流程主要包括以下步骤:步骤二十一,监控计算节点和冗余计算节点的负载运行状态;

步骤二十二,发生故障时,向管理节点发出告警;

步骤二十三,管理节点从存储节点中提取虚拟镜像并挂载到冗余计算节点上,补充原来计算节点的服务能力;

步骤二十四,发生故障的计算节点暂停对外服务;

步骤二十五,重新向管理节点请求虚拟镜像,并部署在故障的计算节点上,进而恢复计算能力。

说明书 :

面向全舰计算环境的统一资源管理系统及方法

技术领域

[0001] 本发明涉及一种统一资源管理系统及方法,特别是涉及一种面向全舰计算环境的统一资源管理系统及方法。

背景技术

[0002] 全舰计算环境(Total Ship Computing Environment,缩写TSCE)是指将全舰公用的计算、存储、传输、显控等硬件设备和基础服务软件,按照成熟的技术和标准进行有机集成,形成全舰的“逻辑大计算机”,作为公共信息基础设施平台支撑全舰各业务应用任务的运行。从本质上来说,TSCE是全舰统一的信息基础设施,能够为舰艇的探测感知、指挥控制、武器交战、信息保障以及舰艇驾控、安防损管等舰艇业务应用提供包括信息交换、数据存储、高性能计算以及人机交互等基础服务支持。美军认为,TSCE为舰艇电子信息系统装备的集成方式和组织运行带来重大变革,在扩展升级、抗毁生存、分散布置、统一标准、开放集成和灵活重构等六方面具有优势。
[0003] 为解决信息化作战条件下信息化装备开放性差,可升级困难、全生命周期费用高等问题,美军提出开发式体系架构计算环境(Open Architecture  Computing Environment,缩写OACE)。在开放式体系架构的设计思想下,通过各层次之间的标准接口,屏蔽与上层之间的紧耦合,提升对应用层的开放性支撑;将软件与硬件分离,实现局部软件升级即可提升系统能力,从而有效引入竞争,消除垄断,降低消耗。
[0004] 当前,全舰计算环境处于建设初期,应用和基础架构垂直紧密绑定在一起,造成了许多的资源、信息的孤岛。系统间还不具备共用硬件和基础支撑软件的条件,大部分功能如数字信号处理仍依赖特定硬件实现。当特定硬件发生故障或被摧毁时,相应的功能会陷入瘫痪状态,难以在短时间内恢复。异构硬件独立管理,没有统一的资源管理方法。下一步发展需要定义标准的接口规范,以软件定义的方式实现标准硬件模块的功能定义,不同模块之间互为灾备,抽取、重用形成部分“公共功能”软件,支持公共功能软件的灵活部署,快速升级。
[0005] 本发明专利拟基于全舰计算环境基础计算平台,采用统一资源描述定义,通过实时信息采集、统一视图展现、统一控制管理,利用平台级的一体化的资源管理技术,实现计算平台的能力定义、系统资源配置,统一软件部署等功能,提高整个系统的高可用,能力可重构。

发明内容

[0006] 本发明所要解决的技术问题是提供一种面向全舰计算环境的统一资源管理系统及方法,其提升硬件资源的利用效率和共用水平,部署安装任务调度更加便捷,容易实施。
[0007] 本发明是通过下述技术方案来解决上述技术问题的:一种面向全舰计算环境的统一资源管理系统,其包括统一资源描述模块、节点宿主OS部署或更新模块、虚拟机部署模块、虚拟机故障迁移模块、应用部署与管理模块、资源统一管理模块,其中:
[0008] 统一资源描述模块,通过XML文件的配置实现平台节点、软件等配置信息的分发、查询、解释和执行;
[0009] 节点宿主OS部署或更新模块,需根据平台资源的描述解析,通过网络部署或节点OS;
[0010] 虚拟机部署模块,需从资源描述池中选择并解析资源描述文件,通过网络将虚拟机批量分发到平台节点中;
[0011] 虚拟机故障迁移模块,在计算/存储节点服务出现异常时,根据统一资源描述模块中的虚拟机故障迁移处理策略,在指定的备份计算节点中下载镜像,重新启动应用服务器;
[0012] 应用部署与管理模块,需从资源描述池中选择并解析资源描述文件,通过网络将应用软件、管理脚本、依赖软件批量分发到平台节点中;
[0013] 资源统一管理模块,部署在管理节点上,对虚拟机进行开启、关停、重启等管理操作,对应用软件进行安装卸载、启动停止等管控,对整个部署的拓扑图、部署过程进行日志记录、存储和管理。
[0014] 本发明还提供一种面向全舰计算环境的统一资源管理方法,包括节点宿主OS部署或更新流程、虚拟机部署流程、虚拟机故障迁移流程以及应用部署与管理流程。
[0015] 优选地,所述节点宿主OS部署或更新流程主要包括以下步骤:
[0016] 步骤一,配置平台资源描述;
[0017] 步骤二,启动节点,尝试网络加载节点OS;
[0018] 步骤三,启动节点OS,并启动节点代理;
[0019] 步骤四,发送宿主OS;
[0020] 步骤五,本地固化OS及文件系统。
[0021] 优选地,所述虚拟机部署流程主要包括以下步骤:
[0022] 步骤十一,批量分发软件;
[0023] 步骤十二,虚拟机/Docker管理工具启动;
[0024] 步骤十三,虚拟机/Docker管理;
[0025] 步骤十四,虚拟镜像下发。
[0026] 优选地,所述虚拟机故障迁移流程主要包括以下步骤:
[0027] 步骤二十一,监控计算节点和冗余计算节点的负载运行状态;
[0028] 步骤二十二,发生故障时,向管理节点发出告警;
[0029] 步骤二十三,管理节点从存储节点中提取虚拟镜像并挂载到冗余计算节点上,补充原来计算节点的服务能力;
[0030] 步骤二十四,发生故障的计算节点暂停对外服务;
[0031] 步骤二十五,重新向管理节点请求虚拟镜像,并部署在故障的计算节点上,进而恢复计算能力。
[0032] 优选地,所述应用部署与管理流程主要包括以下步骤:
[0033] 步骤三十一,批量分发应用软件、管理脚本以及依赖软件;
[0034] 步骤三十二,安装或卸载应用软件;
[0035] 步骤三十三,启动或停止应用软件。
[0036] 本发明的积极进步效果在于:本发明硬件资源通用化,计算、存储资源标准化,提升硬件资源的利用效率和共用水平;软件服务标准化,通过配置过程完成部署安装软件与硬件解耦,应用与数据分离,使全舰计算环境基础计算平台的部署安装任务调度更加便捷,容易实施。

附图说明

[0037] 图1为本发明面向全舰计算环境的统一资源管理系统的框架示意图。
[0038] 图2为本发明面向全舰计算环境的统一资源管理方法中的节点宿主OS部署/更新流程图。
[0039] 图3为本发明面向全舰计算环境的统一资源管理方法中的虚拟机部署流程图。
[0040] 图4为本发明面向全舰计算环境的统一资源管理方法中的虚拟机故障迁移流程图。
[0041] 图5为本发明面向全舰计算环境的统一资源管理方法中的应用部署与管理流程图。

具体实施方式

[0042] 下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
[0043] 如图1所示,本发明公开了一种面向全舰计算环境的统一资源管理系统,其包括统一资源描述模块、节点宿主OS(操作系统)部署或更新模块、虚拟机部署模块、虚拟机故障迁移模块、应用部署与管理模块、资源统一管理模块,其中:
[0044] 统一资源描述模块,通过XML(可扩展标记语言)文件的配置实现平台节点、软件等配置信息的分发、查询、解释和执行;
[0045] 节点宿主OS部署或更新模块,需根据平台资源的描述解析,通过网络部署或节点OS;
[0046] 虚拟机部署模块,需从资源描述池中选择并解析资源描述文件,通过网络将虚拟机批量分发到平台节点中;
[0047] 虚拟机故障迁移模块,在计算/存储节点服务出现异常时,根据统一资源描述模块中的虚拟机故障迁移处理策略,在指定的备份计算节点中下载镜像,重新启动应用服务器;
[0048] 应用部署与管理模块,需从资源描述池中选择并解析资源描述文件,通过网络将应用软件、管理脚本、依赖软件批量分发到平台节点中;
[0049] 资源统一管理模块,部署在管理节点上,对虚拟机进行开启、关停、重启等管理操作,对应用软件进行安装卸载、启动停止等管控,对整个部署的拓扑图、部署过程进行日志记录、存储和管理。
[0050] 本发明面向全舰计算环境的统一资源管理方法包括节点宿主OS部署或更新流程、虚拟机部署流程、虚拟机故障迁移流程以及应用部署与管理流程。
[0051] 如图2所示,所述节点宿主OS部署或更新流程主要包括以下步骤:
[0052] 步骤一,配置平台资源描述;
[0053] 步骤二,启动节点,尝试网络加载节点OS;
[0054] 步骤三,启动节点OS,并启动节点代理;
[0055] 步骤四,发送宿主OS(及文件系统);
[0056] 步骤五,本地固化OS及文件系统。
[0057] 如图3所示,所述虚拟机部署流程主要包括以下步骤:
[0058] 步骤十一,批量分发软件;
[0059] 步骤十二,虚拟机/Docker(高级容器引擎)管理工具启动;
[0060] 步骤十三,虚拟机/Docker管理;
[0061] 步骤十四,虚拟镜像下发。
[0062] 如图4所示,所述虚拟机故障迁移流程主要包括以下步骤:
[0063] 步骤二十一,监控计算节点和冗余计算节点的负载运行状态;
[0064] 步骤二十二,发生故障时,向管理节点发出告警;
[0065] 步骤二十三,管理节点从存储节点中提取虚拟镜像并挂载到冗余计算节点上,补充原来计算节点的服务能力;
[0066] 步骤二十四,发生故障的计算节点暂停对外服务;
[0067] 步骤二十五,重新向管理节点请求虚拟镜像,并部署在故障的计算节点上,进而恢复计算能力。
[0068] 如图5所示,所述应用部署与管理流程主要包括以下步骤:
[0069] 步骤三十一,批量分发应用软件、管理脚本以及依赖软件;
[0070] 步骤三十二,安装或卸载应用软件;
[0071] 步骤三十三,启动或停止应用软件。
[0072] 实施举例1:
[0073] 在全舰计算环境基础计算平台的管理节点中有整个平台的软件、硬件、通信链路的统一资源描述。根据实际需要,通过资源描述配置模块形成符合应用需求的资源描述列表。管理节点中的资源描述解析模块从资源描述列表中提取出关乎资源配置的有用信息。节点OS池中存有各节点所需要的基础操作系统,供网络部署OS模块或者建立在本地固化OS模块之上的网络分发模块使用。计算/存储节点在启动之初首先尝试网络加载节点OS,管理节点接到请求命令后,启动节点OS,并启动节点代理,之后发送宿主OS(及文件系统)给计算/存储节点。计算/存储节点在接收到由管理节点发送来的宿主OS(及文件系统)后固化到本地节点中。至此,完成节点宿主OS部署流程。
[0074] 实施举例2:
[0075] 在节点OS安装完成之后,根据需求还要在计算/存储节点上继续部署虚拟机。管理节点中的资源描述解析模块从资源描述列表中提取出有关虚拟机配置的信息,并将配置信息发送给软件分发模块。软件分发模块从管理节点的软件池和虚拟镜像池中提取虚拟机/Docker管理工具及依赖软件供计算/存储节点请求调用。计算/存储节点开启之后像管理节点请求需要的软件包,管理节点接到请求命令后,启动虚拟机/Docker管理工具,在虚拟机/Docker管理界面里选择合适的虚拟机镜像下发给计算/存储节点。计算/存储节点在接收到由管理节点发送来的虚拟机镜像后存储在本机节点的文件目录下,供本机的软件分发模块或软件远程管理模块调用。至此,完成节点虚拟机的部署流程。
[0076] 实施举例3:
[0077] 全舰计算环境基础计算平台的管理节点实时监控着计算节点和冗余计算节点的负载运行状态。当某一计算节点发生故障时,向管理节点发出告警,管理节点会从存储节点中提取虚拟镜像并挂载到冗余计算节点上,补充原来计算节点的服务能力。同时,发生故障的计算节点暂停对外服务,重新向管理节点请求虚拟镜像,并部署在故障的计算节点上,进而恢复计算能力。
[0078] 实施举例4:
[0079] 管理节点中的资源描述解析模块从资源描述列表中提取应用列表配置信息,并将配置信息发送给软件分发模块。软件分发模块从软件池中提取相对应的软件发送给网络传输模块。计算/存储节点向管理节点请求所需要的应用软件,管理节点收到请求后通过软件分发模块,将应用软件、管理脚本、依赖软件批量分发到计算/存储节点中。管理节点通过网络启动或停止应用软件。
[0080] 本发明针对异构硬件实现统一资源描述定义及可视化配置、描述模板管理,实现统一视图管理,资源一体化管理;基于统一资源描述实现软件分发及系统能力重构,实现虚拟机的管理、资源分配回收、故障迁移;实现平台能力视图、软件部署拓扑图的全局展示;提供管理过程日志记录、存储及管理。
[0081] 以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。