一种基于卫星移动通信系统地面信关站的健康管理系统转让专利
申请号 : CN202010316758.1
文献号 : CN111541474B
文献日 : 2021-08-31
发明人 : 贾钢 , 王艳君 , 王力权 , 王涛 , 张志丽
申请人 : 中国电子科技集团公司第五十四研究所
摘要 :
权利要求 :
1.一种基于卫星移动通信系统地面信关站的健康管理系统,其特征在于:包括部署在各个网元设备的Agent代理模块、数据采集模块、数据预处理模块和数据发送模块,以及运行在操作管理维护中心OMC的SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模块、告警模块和故障数据库;
Agent代理模块用于接收和处理SNMP管理模块下发的各种消息,包括采集计划和控制命令,Agent代理模块将采集计划下达给数据采集模块来执行采集任务,并控制数据发送模块按采集计划上报数据;控制命令包括触发网元启动、复位和休眠;
数据采集模块用于在接收到采集计划后采集网元设备的运行参数、环境参数和性能参数,将采集的原始数据发送至数据预处理模块;
数据预处理模块用于对接收的原始数据进行过滤、提纯和压缩变换,保留有效数据以及剔除无用数据,将处理后的数据发送至数据发送模块;在处理过程中,当确定网元明显处于故障状态时,直接生成立即告警消息,立即告警消息经数据发送模块发送至OMC的数据接收模块,并由数据接收模块将立即告警消息呈报给告警模块;
数据发送模块根据采集计划及被采数据的特点,以FTP或SNMP协议方式将数据一次性或周期性地发送给OMC的数据接收模块;
数据接收模块用于接收各个网元发送的数据,并对数据源的网元身份、数据完整性和准确性进行鉴别,将鉴别后的特征数据发送至故障检测模块;当接收到网元的立即告警消息时,立即将告警消息呈报告警模块;
SNMP管理模块用于负责与各个网元之间的信令交互与信令处理,包括下发控制命令给网元,制定网元数据的采集计划并根据故障诊断模块发送的故障诊断结果适时调整采集计划;
故障检测模块用于将接收到的特征数据与故障数据库中预先设定的各种参数阈值和历史数据相比较,检测是否有异常发生,将检测结果和特征数据发送至故障诊断模块;
故障诊断模块采用专家经验法与神经网络算法相融合的神经网络专家系统,神经网络专家系统的专家经验知识库和神经网络知识库部署在故障数据库中;故障诊断模块通过获取故障数据库中存储的知识和历史数据,对故障检测模块生成的特征数据和检测结果进行分析对比,获取网元的运行状态,当判定网元运行状态出现异常时,通过SNMP管理模块调整网元的采集计划,对网元实施集中监测,实现对网元故障的预测;当判定网元故障或预测到网元即将故障时,通过SNMP管理模块向该网元的备用设备发送启动命令,触发主备切换,并将网元故障原因和切换结果上报告警模块;当故障网元没有备用设备时,向告警模块上报高级别告警申请和网元故障细节;
健康评估模块用于依据故障检测模块和故障诊断模块的推断信息分析数据变化特点,对被监测的各级网元设备进行综合健康信息评估,获得完整的系统工作状态;当判定系统性能出现下降时,向告警模块上报系统性能下降告警;
告警模块用于根据数据接收模块、故障诊断模块和健康评估模块发出的判决结果生成告警,以声光形式进行呈现;通过人工界面对告警模块的告警规则进行修改,实现对特定告警的拦截和过滤,以及告警级别的调整。
2.根据权利要求1所述的基于卫星移动通信系统地面信关站的健康管理系统,其特征在于:神经网络专家系统包括知识库管理与维护模块、数据提取与学习模块、专家经验知识库、神经网络知识库、神经网络推理机、专家系统推理机、神经网络动态库以及两个解释器;
知识库管理与维护模块用于提供人工操作和维护专家经验知识库和神经网络知识库的接口;
专家经验知识库用于将合理性的知识、有效性的检验规则进行形式化,并最终以编程语言表示成可供计算机执行的语句和程序;
神经网络知识库在系统初始运行时,通过数据提取与学习模块从专家知识经验库中获取知识和规则,构建初始化的神经网络知识库,并在以后每次的特征数据判决过程中实现不断的自我学习和知识积累,每次新学到的知识存储在神经网络知识库中;
专家系统推理机用于根据专家经验知识库提供的经验知识对故障检测模块生成的特征数据和检测结果进行一次性分析推理,得出判决结果,将判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块;
神经网络推理机用于从神经网络知识库获取知识,对故障检测模块生成的特征数据进行推理,然后得出中间判决结果或最终判决结果;对于中间判决结果,先存入神经网络动态库,然后返回神经网络推理机,与特征数据重新组合,再次推理,直到得出最终判决结果,将最终判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块。
说明书 :
一种基于卫星移动通信系统地面信关站的健康管理系统
技术领域
背景技术
与地面移动通信网络相比,它的地面站所有设备在地理位置上高度集中,适合采用集中式
网络管理;与传统的卫星通信网络相比,它支持多波束,地面站设备种类众多、数量庞大,这
便增加了集中式网络管理的难度。传统的站控技术曾广泛应用于卫星通信地面站,但只能
实现对单一种类设备、少量设备的管理和监控,很难应用于卫星移动通信地面站的网络管
理。
发明内容:
系统,即健康管理的实现系统。本发明采用地面站设备集中式软件管理体系、分布式模块架
构的实现方案,具有支持设备灵活管理、实时监控、快速故障诊断与修复等优点,特别适用
于卫星移动通信系统。
理维护中心OMC的SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模
块、告警模块和故障数据库;
送模块按采集计划上报数据;控制命令包括触发网元启动、复位和休眠;
显处于故障状态时,直接生成立即告警消息,立即告警消息经数据发送模块发送至OMC的数
据接收模块,并由数据接收模块将立即告警消息呈报给告警模块;
警消息时,立即将告警消息上报告警模块;
划;
过获取故障数据库中存储的知识和历史数据,对故障检测模块生成的特征数据和检测结果
进行分析对比,获取网元的运行状态,当判定网元运行状态出现异常时,通过SNMP管理模块
调整网元采集计划,对网元实施集中监测,可实现对网元故障的预测。当判定网元故障或预
测到网元即将故障时,通过SNMP管理模块向该网元的备用设备发送启动命令,触发主备切
换,并将网元故障原因和切换结果上报告警模块;当故障网元没有备用设备时,向告警模块
上报高级别告警申请和网元故障细节;
系统性能出现下降时,向告警模块上报系统性能下降告警;
定告警的拦截和过滤,以及告警级别的调整。
个解释器;
实现不断的自我学习和知识积累,每次新学到的知识存储在神经网络知识库中;
器根据判决结果的具体内容决定是否送往告警模块;
动态库,然后返回神经网络推理机,与特征数据重新组合,再次推理,直到得出最终判决结
果,将最终判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块。
控;
附图说明
具体实施方式
中心OMC,运行SNMP管理模块、数据接收模块、故障检测模块、故障诊断模块、健康评估模块、
告警模块和故障数据库;在网元部署Agent代理模块、数据采集模块、数据预处理模块和数
据发送模块。对于不支持SNMP协议的设备,使用自定义格式的TCP/IP协议将采集数据发送
至支持SNMP协议的第三方网元设备;对于不支持TCP/IP协议的设备,使用其他接口(例如串
口、I2C、SRIO、PCIe)将采集数据发送至支持SNMP协议的第三方网元设备;对于不能对外提
供任何参数和状态的设备,坚决不能使用。网元通过各种传感器和数据耦合口获取原始数
据,然后对原始数据进行预处理。经过预处理后,数据量仍然较大的以文件方式进行保存;
数据量小的直接写入网元的MIB库。
送模块按采集计划上报数据;控制命令包括触发网元启动、复位和休眠;
显处于故障状态时,直接生成立即告警消息,立即告警消息经数据发送模块发送至OMC的数
据接收模块,并由数据接收模块将立即告警消息呈报给告警模块;
警消息时,立即将告警消息上报告警模块;
划;
过获取故障数据库中存储的知识和历史数据,对故障检测模块生成的特征数据和检测结果
进行分析对比,获取网元的运行状态,当判定网元运行状态出现异常时,通过SNMP管理模块
调整网元采集计划,对网元实施集中监测,可实现对网元故障的预测。当判定网元故障或预
测到网元即将故障时,通过SNMP管理模块向该网元的备用设备发送启动命令,触发主备切
换,并将网元故障原因和切换结果上报告警模块;当故障网元没有备用设备时,向告警模块
上报高级别告警申请和网元故障细节;
系统性能出现下降时,向告警模块上报系统性能下降告警;
定告警的拦截和过滤,以及告警级别的调整。对于易恢复的故障通过设备软、硬重启或软件
重加载等手段进行恢复;对于难恢复的故障通过人机界面提示人工修复。
行诊断;对于样点数据、基带信号、射频频谱等大数据量数据,采用神经网络专家系统并结
合数字信号处理算法进行诊断。
态或参数已经濒临门限值时,OMC调整采集计划,缩小采集粒度,单位时间内获取更多的网
元状态数据。当连续多次判决网元已经工作于濒临故障状态时,则判定网元已经处于故障
状态,通知告警模块。
库以及两个解释器;
实现不断的自我学习和知识积累,每次新学到的知识存储在神经网络知识库中;
器根据判决结果的具体内容决定是否送往告警模块;
动态库,然后返回神经网络推理机,与特征数据重新组合,再次推理,直到得出最终判决结
果,将最终判决结果送至解释器,解释器根据判决结果的具体内容决定是否送往告警模块。
据根据数据特点进行存储。OMC通过SNMP++Manager模块向网元的Agent++模块下发获取数
据的指令,网元将数据通过数据发送模块发送给OMC的数据接收模块,OMC的数据接收模块
对数据进行鉴别和校验后,将数据送至故障检测模块,故障检测模块完成计算和估计与系
统健康状态相关的特征值,初步判断当前系统中是否有异常发生。随后将数据提交至故障
诊断模块,通过故障诊断模块的神经网络专家系统分析被监测网元的运行状态是否出现异
常,组成诊断的历史记录,按设定的置信度判断发生故障的状态,根据状态来源推断存在故
障的网元部位。故障诊断模块通过故障预测技术利用系统状态监测数据及运行环境和负载
状况等信息,对网元可能发生的故障进行预测。判定网元处于故障状态时,向告警模块申请
告警呈现;健康评估模块把所有网元的数据、状态输出和历史评估信息进行综合分析,并参
考故障检测模块和故障诊断模块的判决结果,获得系统整体的工作现状,评估系统整体健
康状态,从系统角度分析单个网元运行状态的改变可能引起的后果和影响,最终给出系统
运行状态分析报告。当故障诊断模块判决网元出现故障,或网元有立即告警消息上报时,告
警模块依据告警规则呈现告警;当故障诊断模块未判决有任何网元故障,也没有任何网元
上报立即告警消息,但健康评估模块判定系统当前性能下降时,同样向告警模块申请生成
告警,警示操作维护人员对系统运行状态给予关注;当网元故障清除后,告警模块自动清除
对应告警,并形成告警记录写入故障知识数据库,为以后的故障判决提供参考。