一种基于卫星移动通信系统地面信关站的健康管理系统转让专利

申请号 : CN202010316758.1

文献号 : CN111541474B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 贾钢王艳君王力权王涛张志丽

申请人 : 中国电子科技集团公司第五十四研究所

摘要 :

本发明公开了一种基于卫星移动通信系统地面信关站的健康管理系统,属于卫星移动通信系统地面信关站设备操作维护与管理领域。它由Agent代理模块、数据采集模块、数据预处理模块、数据发送模块、SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模块和告警模块组成。提供了一种基于卫星移动通信系统地面信关站设备监控、故障诊断与预测、健康评估与故障告警的实现方法。本发明采用地面站设备集中式管理体系、分布式软件模块架构的实现方案,具有支持设备灵活管理、实时监控、快速故障诊断与修复等优点,特别适用于卫星移动通信系统。

权利要求 :

1.一种基于卫星移动通信系统地面信关站的健康管理系统,其特征在于:包括部署在各个网元设备的Agent代理模块、数据采集模块、数据预处理模块和数据发送模块,以及运行在操作管理维护中心OMC的SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模块、告警模块和故障数据库;

Agent代理模块用于接收和处理SNMP管理模块下发的各种消息,包括采集计划和控制命令,Agent代理模块将采集计划下达给数据采集模块来执行采集任务,并控制数据发送模块按采集计划上报数据;控制命令包括触发网元启动、复位和休眠;

数据采集模块用于在接收到采集计划后采集网元设备的运行参数、环境参数和性能参数,将采集的原始数据发送至数据预处理模块;

数据预处理模块用于对接收的原始数据进行过滤、提纯和压缩变换,保留有效数据以及剔除无用数据,将处理后的数据发送至数据发送模块;在处理过程中,当确定网元明显处于故障状态时,直接生成立即告警消息,立即告警消息经数据发送模块发送至OMC的数据接收模块,并由数据接收模块将立即告警消息呈报给告警模块;

数据发送模块根据采集计划及被采数据的特点,以FTP或SNMP协议方式将数据一次性或周期性地发送给OMC的数据接收模块;

数据接收模块用于接收各个网元发送的数据,并对数据源的网元身份、数据完整性和准确性进行鉴别,将鉴别后的特征数据发送至故障检测模块;当接收到网元的立即告警消息时,立即将告警消息呈报告警模块;

SNMP管理模块用于负责与各个网元之间的信令交互与信令处理,包括下发控制命令给网元,制定网元数据的采集计划并根据故障诊断模块发送的故障诊断结果适时调整采集计划;

故障检测模块用于将接收到的特征数据与故障数据库中预先设定的各种参数阈值和历史数据相比较,检测是否有异常发生,将检测结果和特征数据发送至故障诊断模块;

故障诊断模块采用专家经验法与神经网络算法相融合的神经网络专家系统,神经网络专家系统的专家经验知识库和神经网络知识库部署在故障数据库中;故障诊断模块通过获取故障数据库中存储的知识和历史数据,对故障检测模块生成的特征数据和检测结果进行分析对比,获取网元的运行状态,当判定网元运行状态出现异常时,通过SNMP管理模块调整网元的采集计划,对网元实施集中监测,实现对网元故障的预测;当判定网元故障或预测到网元即将故障时,通过SNMP管理模块向该网元的备用设备发送启动命令,触发主备切换,并将网元故障原因和切换结果上报告警模块;当故障网元没有备用设备时,向告警模块上报高级别告警申请和网元故障细节;

健康评估模块用于依据故障检测模块和故障诊断模块的推断信息分析数据变化特点,对被监测的各级网元设备进行综合健康信息评估,获得完整的系统工作状态;当判定系统性能出现下降时,向告警模块上报系统性能下降告警;

告警模块用于根据数据接收模块、故障诊断模块和健康评估模块发出的判决结果生成告警,以声光形式进行呈现;通过人工界面对告警模块的告警规则进行修改,实现对特定告警的拦截和过滤,以及告警级别的调整。

2.根据权利要求1所述的基于卫星移动通信系统地面信关站的健康管理系统,其特征在于:神经网络专家系统包括知识库管理与维护模块、数据提取与学习模块、专家经验知识库、神经网络知识库、神经网络推理机、专家系统推理机、神经网络动态库以及两个解释器;

知识库管理与维护模块用于提供人工操作和维护专家经验知识库和神经网络知识库的接口;

专家经验知识库用于将合理性的知识、有效性的检验规则进行形式化,并最终以编程语言表示成可供计算机执行的语句和程序;

神经网络知识库在系统初始运行时,通过数据提取与学习模块从专家知识经验库中获取知识和规则,构建初始化的神经网络知识库,并在以后每次的特征数据判决过程中实现不断的自我学习和知识积累,每次新学到的知识存储在神经网络知识库中;

专家系统推理机用于根据专家经验知识库提供的经验知识对故障检测模块生成的特征数据和检测结果进行一次性分析推理,得出判决结果,将判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块;

神经网络推理机用于从神经网络知识库获取知识,对故障检测模块生成的特征数据进行推理,然后得出中间判决结果或最终判决结果;对于中间判决结果,先存入神经网络动态库,然后返回神经网络推理机,与特征数据重新组合,再次推理,直到得出最终判决结果,将最终判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块。

说明书 :

一种基于卫星移动通信系统地面信关站的健康管理系统

技术领域

[0001] 本发明涉及卫星移动通信系统地面信关站健康管理的实现方法,属于卫星移动通信系统信关站设备操作维护与管理领域。

背景技术

[0002] 在地面移动通信全面普及的今天,卫星通信融合了地面移动通信技术,将基站搬到了太空的卫星上,实现了卫星移动通信。卫星移动通信网络是一种新型的移动通信网络。
与地面移动通信网络相比,它的地面站所有设备在地理位置上高度集中,适合采用集中式
网络管理;与传统的卫星通信网络相比,它支持多波束,地面站设备种类众多、数量庞大,这
便增加了集中式网络管理的难度。传统的站控技术曾广泛应用于卫星通信地面站,但只能
实现对单一种类设备、少量设备的管理和监控,很难应用于卫星移动通信地面站的网络管
理。
发明内容:
[0003] 本发明所要解决的技术问题在于避免上述背景技术中的不足之处而提供一种基于卫星移动通信系统地面信关站设备监控、故障诊断与预测、健康评估与故障告警的实现
系统,即健康管理的实现系统。本发明采用地面站设备集中式软件管理体系、分布式模块架
构的实现方案,具有支持设备灵活管理、实时监控、快速故障诊断与修复等优点,特别适用
于卫星移动通信系统。
[0004] 本发明采用的技术方案为:
[0005] 一种基于卫星移动通信系统地面信关站的健康管理系统,包括部署在各个网元设备的Agent代理模块、数据采集模块、数据预处理模块和数据发送模块,以及运行在操作管
理维护中心OMC的SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模
块、告警模块和故障数据库;
[0006] Agent代理模块用于接收和处理SNMP管理模块下发的各种消息,包括采集计划和控制命令,Agent代理模块将采集计划下达给数据采集模块来执行采集任务,并控制数据发
送模块按采集计划上报数据;控制命令包括触发网元启动、复位和休眠;
[0007] 数据采集模块用于在接收到采集计划后采集网元设备的运行参数、环境参数和性能参数,将采集的原始数据发送至数据预处理模块;
[0008] 数据预处理模块用于对接收的原始数据进行过滤、提纯和压缩变换,保留有效数据以及剔除无用数据,将处理后的数据发送至数据发送模块;在处理过程中,当确定网元明
显处于故障状态时,直接生成立即告警消息,立即告警消息经数据发送模块发送至OMC的数
据接收模块,并由数据接收模块将立即告警消息呈报给告警模块;
[0009] 数据发送模块根据采集计划及被采数据的特点,以FTP或SNMP协议方式将数据一次性或周期性地发送给OMC的数据接收模块;
[0010] 数据接收模块用于接收各个网元发送的数据,并对数据源的网元身份、数据完整性和准确性进行鉴别,将鉴别后的特征数据发送至故障检测模块;当接收到网元的立即告
警消息时,立即将告警消息上报告警模块;
[0011] SNMP管理模块用于负责与各个网元之间的信令交互与信令处理,包括下发控制命令给网元,制定网元数据的采集计划并根据故障诊断模块反馈的诊断结果适时调整采集计
划;
[0012] 故障检测模块用于将接收到的特征数据与故障数据库中预先设定的各种参数阈值和历史数据相比较,检测是否有异常发生,将检测结果和特征数据发送至故障诊断模块;
[0013] 故障诊断模块采用专家经验法与神经网络算法相融合的神经网络专家系统,神经网络专家系统的专家经验知识库和神经网络知识库部署在故障数据库中;故障诊断模块通
过获取故障数据库中存储的知识和历史数据,对故障检测模块生成的特征数据和检测结果
进行分析对比,获取网元的运行状态,当判定网元运行状态出现异常时,通过SNMP管理模块
调整网元采集计划,对网元实施集中监测,可实现对网元故障的预测。当判定网元故障或预
测到网元即将故障时,通过SNMP管理模块向该网元的备用设备发送启动命令,触发主备切
换,并将网元故障原因和切换结果上报告警模块;当故障网元没有备用设备时,向告警模块
上报高级别告警申请和网元故障细节;
[0014] 健康评估模块用于依据故障检测模块和故障诊断模块的推断信息分析数据变化特点,对被监测的各级网元设备进行综合健康信息评估,获得完整的系统工作状态;当判定
系统性能出现下降时,向告警模块上报系统性能下降告警;
[0015] 告警模块用于根据数据接收模块、故障诊断模块和健康评估模块发出的判决结果生成告警,以声光形式进行呈现;通过人工界面对告警模块的告警规则进行修改,实现对特
定告警的拦截和过滤,以及告警级别的调整。
[0016] 其中,神经网络专家系统包括知识库管理与维护模块、数据提取与学习模块、专家经验知识库、神经网络知识库、神经网络推理机、专家系统推理机、神经网络动态库以及两
个解释器;
[0017] 知识库管理与维护模块用于提供人工操作和维护专家经验知识库和神经网络知识库的接口;
[0018] 专家经验知识库用于将合理性的知识、有效性的检验规则进行形式化,并最终以编程语言表示成可供计算机执行的语句和程序;
[0019] 神经网络知识库在系统初始运行时,通过数据提取与学习模块从专家知识经验库中获取知识和规则,构建初始化的神经网络知识库,并在以后每次的特征数据判决过程中
实现不断的自我学习和知识积累,每次新学到的知识存储在神经网络知识库中;
[0020] 专家系统推理机用于根据专家经验知识库提供的经验知识对故障检测模块生成的特征数据和检测结果进行一次性分析推理,得出判决结果,将判决结果送至解释器,解释
器根据判决结果的具体内容决定是否送往告警模块;
[0021] 神经网络推理机用于从神经网络知识库获取知识,对故障检测模块生成的特征数据进行推理,然后得出中间判决结果或最终判决结果;对于中间判决结果,先存入神经网络
动态库,然后返回神经网络推理机,与特征数据重新组合,再次推理,直到得出最终判决结
果,将最终判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块。
[0022] 本发明相比背景技术具有如下优点:
[0023] 1.针对卫星移动通信多波束系统地面信关站设备种类众多、数量庞大这些特点,采用集中式软件管理体系、分布式模块架构,实现了对信关站内全体设备的网络管理和监
控;
[0024] 2.在卫星移动通信系统地面信关站中采用自动化故障诊断、故障预测和健康评估技术,提高系统的可维护性和稳定性;
[0025] 3.采用专家经验法、神经网络分析法和信号处理相结合的神经网络专家系统,克服单一算法的缺点;
[0026] 4.数据采集和数据预处理部署在网元一侧,并对数据进行过滤、提纯和压缩,减少了数据传输所需带宽,并减轻了管理设备对原始数据处理的负担。

附图说明

[0027] 图1为本发明卫星移动通信系统地面信关站健康管理实现框图。
[0028] 图2为本发明地面信关站健康管理神经网络专家系统实现框图。

具体实施方式

[0029] 下面结合附图对本发明作进一步解释说明。
[0030] 参照图1,在卫星移动通信系统地面信关站,以操作维护管理服务器为中央管理单元,信关站内其他设备均为被管理单元,即网元。在DellR730xd服务器上部署操作管理维护
中心OMC,运行SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模块、
告警模块和故障数据库;在网元部署Agent代理模块、数据采集模块、数据预处理模块和数
据发送模块。对于不支持SNMP协议的设备,使用自定义格式的TCP/IP协议将采集数据发送
至支持SNMP协议的第三方网元设备;对于不支持TCP/IP协议的设备,使用其他接口(例如串
口、I2C、SRIO、PCIe)将采集数据发送至支持SNMP协议的第三方网元设备;对于不能对外提
供任何参数和状态的设备,坚决不能使用。网元通过各种传感器和数据耦合口获取原始数
据,然后对原始数据进行预处理。经过预处理后,数据量仍然较大的以文件方式进行保存;
数据量小的直接写入网元的MIB库。
[0031] Agent代理模块用于接收和处理SNMP管理模块下发的各种消息,包括采集计划和控制命令,Agent代理模块将采集计划下达给数据采集模块来执行采集任务,并控制数据发
送模块按采集计划上报数据;控制命令包括触发网元启动、复位和休眠;
[0032] 数据采集模块用于在接收到采集计划后采集网元设备的运行参数、环境参数和性能参数,将采集的原始数据发送至数据预处理模块;
[0033] 数据预处理模块用于对接收的原始数据进行过滤、提纯和压缩变换,保留有效数据以及剔除无用数据,将处理后的数据发送至数据发送模块;在处理过程中,当确定网元明
显处于故障状态时,直接生成立即告警消息,立即告警消息经数据发送模块发送至OMC的数
据接收模块,并由数据接收模块将立即告警消息呈报给告警模块;
[0034] 数据发送模块根据采集计划及被采数据的特点,以FTP或SNMP协议方式将数据一次性或周期性地发送给OMC的数据接收模块;
[0035] 数据接收模块用于接收各个网元发送的数据,并对数据源的网元身份、数据完整性和准确性进行鉴别,将鉴别后的特征数据发送至故障检测模块;当接收到网元的立即告
警消息时,立即将告警消息上报告警模块;
[0036] SNMP管理模块用于负责与各个网元之间的信令交互与信令处理,包括下发控制命令给网元,制定网元数据的采集计划并根据故障诊断模块反馈的诊断结果适时调整采集计
划;
[0037] 故障检测模块用于将接收到的特征数据与故障数据库中预先设定的各种参数阈值和历史数据相比较,检测是否有异常发生,将检测结果和特征数据发送至故障诊断模块;
[0038] 故障诊断模块采用专家经验法与神经网络算法相融合的神经网络专家系统,神经网络专家系统的专家经验知识库和神经网络知识库部署在故障数据库中;故障诊断模块通
过获取故障数据库中存储的知识和历史数据,对故障检测模块生成的特征数据和检测结果
进行分析对比,获取网元的运行状态,当判定网元运行状态出现异常时,通过SNMP管理模块
调整网元采集计划,对网元实施集中监测,可实现对网元故障的预测。当判定网元故障或预
测到网元即将故障时,通过SNMP管理模块向该网元的备用设备发送启动命令,触发主备切
换,并将网元故障原因和切换结果上报告警模块;当故障网元没有备用设备时,向告警模块
上报高级别告警申请和网元故障细节;
[0039] 健康评估模块用于依据故障检测模块和故障诊断模块的推断信息分析数据变化特点,对被监测的各级网元设备进行综合健康信息评估,获得完整的系统工作状态;当判定
系统性能出现下降时,向告警模块上报系统性能下降告警;
[0040] 告警模块用于根据数据接收模块、故障诊断模块和健康评估模块发出的判决结果生成告警,以声光形式进行呈现;通过人工界面对告警模块的告警规则进行修改,实现对特
定告警的拦截和过滤,以及告警级别的调整。对于易恢复的故障通过设备软、硬重启或软件
重加载等手段进行恢复;对于难恢复的故障通过人机界面提示人工修复。
[0041] 其中,故障诊断模块部署专家经验法与神经网络法相结合的神经网络专家系统,故障诊断模块主要功能:
[0042] 1)用户可以根据已存储的历史测试数据来进行故障诊断。
[0043] 2)故障诊断知识可以扩充和修改。用户可根据网元实际维护过程中的专家经验,不断充实故障知识库,提高系统故障诊断能力。
[0044] 3)故障诊断完成后,可自动生成和显示诊断报告,并可根据用户的设置存储在故障知识库,并可打印输出,以供文件备案和学习研究。
[0045] 4)故障诊断遇到新状态时,以告警方式通知人工界面,人为决定是否需要维护故障知识库。
[0046] 5)针对采样数据的特点,采用不同诊断算法:对于网元的电压电流、温度、增益、功率、CPU与内存的占用率、风扇转速、线缆连接状态和热交换状态等数据,采用专家经验法进
行诊断;对于样点数据、基带信号、射频频谱等大数据量数据,采用神经网络专家系统并结
合数字信号处理算法进行诊断。
[0047] 6)具有故障预测能力。故障预测技术是利用系统状态监测数据以及运行环境和负载状况等相关信息,对网元健康状态进行评估,对可能发生的故障进行预测。当网元某些状
态或参数已经濒临门限值时,OMC调整采集计划,缩小采集粒度,单位时间内获取更多的网
元状态数据。当连续多次判决网元已经工作于濒临故障状态时,则判定网元已经处于故障
状态,通知告警模块。
[0048] 具体结构见图2。神经网络专家系统包括知识库管理与维护模块、数据提取与学习模块、专家经验知识库、神经网络知识库、神经网络推理机、专家系统推理机、神经网络动态
库以及两个解释器;
[0049] 知识库管理与维护模块用于提供人工操作和维护专家经验知识库和神经网络知识库的接口;
[0050] 专家经验知识库用于将合理性的知识、有效性的检验规则进行形式化,并最终以编程语言表示成可供计算机执行的语句和程序;
[0051] 神经网络知识库在系统初始运行时,通过数据提取与学习模块从专家知识经验库中获取知识和规则,构建初始化的神经网络知识库,并在以后每次的特征数据判决过程中
实现不断的自我学习和知识积累,每次新学到的知识存储在神经网络知识库中;
[0052] 专家系统推理机用于根据专家经验知识库提供的经验知识对故障检测模块生成的特征数据和检测结果进行一次性分析推理,得出判决结果,将判决结果送至解释器,解释
器根据判决结果的具体内容决定是否送往告警模块;
[0053] 神经网络推理机用于从神经网络知识库获取知识,对故障检测模块生成的特征数据进行推理,然后得出中间判决结果或最终判决结果;对于中间判决结果,先存入神经网络
动态库,然后返回神经网络推理机,与特征数据重新组合,再次推理,直到得出最终判决结
果,将最终判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块。
[0054] 本发明简要工作原理如下:
[0055] OMC通过SNMP++Manager模块向网元Agent++模块下发采集计划,网元通过数据采集模块采集原始数据,数据预处理模块对原始数据进行加工处理,随后将加工处理后的数
据根据数据特点进行存储。OMC通过SNMP++Manager模块向网元的Agent++模块下发获取数
据的指令,网元将数据通过数据发送模块发送给OMC的数据接收模块,OMC的数据接收模块
对数据进行鉴别和校验后,将数据送至故障检测模块,故障检测模块完成计算和估计与系
统健康状态相关的特征值,初步判断当前系统中是否有异常发生。随后将数据提交至故障
诊断模块,通过故障诊断模块的神经网络专家系统分析被监测网元的运行状态是否出现异
常,组成诊断的历史记录,按设定的置信度判断发生故障的状态,根据状态来源推断存在故
障的网元部位。故障诊断模块通过故障预测技术利用系统状态监测数据及运行环境和负载
状况等信息,对网元可能发生的故障进行预测。判定网元处于故障状态时,向告警模块申请
告警呈现;健康评估模块把所有网元的数据、状态输出和历史评估信息进行综合分析,并参
考故障检测模块和故障诊断模块的判决结果,获得系统整体的工作现状,评估系统整体健
康状态,从系统角度分析单个网元运行状态的改变可能引起的后果和影响,最终给出系统
运行状态分析报告。当故障诊断模块判决网元出现故障,或网元有立即告警消息上报时,告
警模块依据告警规则呈现告警;当故障诊断模块未判决有任何网元故障,也没有任何网元
上报立即告警消息,但健康评估模块判定系统当前性能下降时,同样向告警模块申请生成
告警,警示操作维护人员对系统运行状态给予关注;当网元故障清除后,告警模块自动清除
对应告警,并形成告警记录写入故障知识数据库,为以后的故障判决提供参考。