一种基于机器学习的异构传感器智能任务规划方法转让专利

申请号 : CN201811495205.6

文献号 : CN109711678B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王玉茜王磊张斌杨良洁张晓宇

申请人 : 江南机电设计研究所

摘要 :

本发明提供了一种基于机器学习的异构传感器智能任务规划方法,包括如下步骤:(1)规则设置:采用条件判断的格式,建立开关机及辐射规则、工作模式切换规则和抗干扰措施运用规则;(2)量化处理:将上述开关机及辐射规则、工作模式切换规则和抗干扰措施运用规则分别遍历并量化为参数组;(3)学习模型;(4)场景量化;(5)规则推理;(6)确认反馈。本发明将基于专家知识的规划推理方法与基于机器学习的人工智能方法相结合,提升了专家系统的自学习能力,可实现对知识库以外规则的推理,解决了传统方法对专家系统依赖性过大,缺乏自适应性及相应的自组织、自学习能力的问题,有利于发现新规则、形成新经验。

权利要求 :

1.一种基于机器学习的异构传感器智能任务规划方法,其特征在于:包括如下步骤:(1)规则设置:采用条件判断的格式,建立开关机及辐射规则、工作模式切换规则和抗干扰措施运用规则;

(2)量化处理:将上述开关机及辐射规则、工作模式切换规则和抗干扰措施运用规则分别遍历并量化为参数组;

(3)学习模型:将得到的参数组作为训练样本,采用机器学习算法进行训练,得到规则推理模型;

(4)场景量化:获取目标和装备状态对应于规则推理模型的输入的分量值;

(5)规则推理:将上述分量值代入至规则推理模型中,得到规划结果;

(6)确认反馈:确认并修正规划结果,同时将修正后得到的规划结果连同对应的输入分量一并加入至参数组中,重新进行步骤(3);

所述步骤(2)中的量化,指将规则中对应的目标、装备状态和规划结果用数字表示,其中规划结果取整数值;

所述步骤(2)中的遍历,是指将开关机及辐射规则、工作模式切换规则或抗干扰措施运用规则中,根据规则所可能发生的所有情况均列举出来。

2.如权利要求1所述的基于机器学习的异构传感器智能任务规划方法,其特征在于:所述步骤(3)中机器学习算法采用基于极限学习机的方法。

3.如权利要求2所述的基于机器学习的异构传感器智能任务规划方法,其特征在于:在所述基于极限学习机的方法中,激活函数采用Sigmoid函数。

4.如权利要求2所述的基于机器学习的异构传感器智能任务规划方法,其特征在于:在所述基于极限学习机的方法中,隐层节点数为九个。

5.如权利要求1所述的基于机器学习的异构传感器智能任务规划方法,其特征在于:所述步骤(5)中,规则推理模型计算得到输出结果经四舍五入取整后得到规划结果。

说明书 :

一种基于机器学习的异构传感器智能任务规划方法

技术领域

[0001] 本发明涉及一种基于机器学习的异构传感器智能任务规划方法,属于区域防空指挥控制领域。

背景技术

[0002] 区域级指挥决策系统是发挥系统装备集体效能的核心,其基本任务是基于综合态势,根据系统的运行状态,完成对各资源的协调控制,包含对预警雷达、制导雷达、红外探测系统等异构传感器系统的规划控制。指挥决策具有实时性、正确性、完备性和可扩充性的要求,在决策过程中,当某规则最适合当前态势时,能够迅速启用该规则,充分抓住战机,当所有规则都不适合时,也应有一定的战术策略。同时,还应能根据攻防对抗演习后的经验,实时的增加新的决策知识到系统中去。
[0003] 传统指挥控制系统对传感器系统的工作时机规划、模式规划等通常根据作战经验和专家知识得来,规划方法主要基于固定准则,一般通过对一个个规则的遍历寻找决策方案,在灵活性和自主扩充性上不足。由于现代系统运行的复杂性、非线性和模糊性,使得以往采用固定规则的规划建模的方法不能满足智能指控系统的自适应、自学习需求。

发明内容

[0004] 为解决上述技术问题,本发明提供了一种基于机器学习的异构传感器智能任务规划方法,该基于机器学习的异构传感器智能任务规划方法解决了传统方法对专家系统依赖性过大,缺乏自适应性及相应的自组织、自学习能力的问题,有利于发现新规则、形成新经验。
[0005] 本发明通过以下技术方案得以实现。
[0006] 本发明提供的一种基于机器学习的异构传感器智能任务规划方法,包括如下步骤:
[0007] (1)规则设置:采用条件判断的格式,建立开关机及辐射规则、工作模式切换规则和抗干扰措施运用规则;
[0008] (2)量化处理:将上述开关机及辐射规则、工作模式切换规则和抗干扰措施运用规则分别遍历并量化为参数组;
[0009] (3)学习模型:将得到的参数组作为训练样本,采用机器学习算法进行训练,得到规则推理模型;
[0010] (4)场景量化:获取目标和装备状态对应于规则推理模型的输入的分量值;
[0011] (5)规则推理:将上述分量值代入至规则推理模型中,得到规划结果;
[0012] (6)确认反馈:确认并修正规划结果,同时将修正后得到的规划结果连同对应的输入分量一并加入至参数组中,重新进行步骤(3)。
[0013] 所述步骤(2)中的量化,指将规则中对应的目标、装备状态和规划结果用数字表示,其中规划结果取值为整数。
[0014] 所述步骤(2)中的遍历,是指将开关机及辐射规则、工作模式切换规则或抗干扰措施运用规则中,根据规则所可能发生的所有情况均列举出来。
[0015] 所述步骤(3)中机器学习算法采用基于极限学习机的方法。
[0016] 在所述基于极限学习机的方法中,激活函数采用Sigmoid函数。
[0017] 在所述基于极限学习机的方法中,隐层节点数为九个。
[0018] 所述步骤(5)中,规则推理模型计算得到输出结果经四舍五入取整后得到规划结果。
[0019] 本发明的有益效果在于:将基于专家知识的规划推理方法与基于机器学习的人工智能方法相结合,提升了专家系统的自学习能力,可实现对知识库以外规则的推理,解决了传统方法对专家系统依赖性过大,缺乏自适应性及相应的自组织、自学习能力的问题,有利于发现新规则、形成新经验。

附图说明

[0020] 图1是本发明的流程示意图。

具体实施方式

[0021] 下面进一步描述本发明的技术方案,但要求保护的范围并不局限于所述。
[0022] 如图1所示的一种基于机器学习的异构传感器智能任务规划方法,具体步骤如下:
[0023] 第一步:传感器模式规划规则设计。
[0024] 在系统运行时,为了保证需要主动辐射信号进行目标测量的雷达等既能适时测量目标位置,又能减少暴露自己的机会,应严格控制开机和辐射时机,一般当分配给传感器的目标到达其最大探测距离时才进行辐射。对于红外探测系统,由于其不会主动辐射能量,可作为监视系统进行搜索监视,当有目标指示信息时,可转入跟踪模式,在小范围内进行目标跟踪。而当传感器判断到其被反辐射弹锁定时,应关闭辐射,但若此时该传感器正对其他重点目标进行跟踪,则需判断该重点目标是否被其他传感器稳定跟踪,再根据该重点目标的被跟踪情况判断传感器是否需要关闭辐射或实施间歇辐射模式。当目标进入范围后,用于制导的雷达应转入精跟模式,当探测到目标施放干扰,可利用雷达的无源定位技术确定目标位置或根据干扰类型采用相应的抗干扰措施,根据以上知识,采用If-Then的格式建立如下规则:
[0025] a)开关机及辐射规则
[0026] 规则k+1:If{存在目标相对于传感器距离<传感器最大探测范围+目标速度×传感器开机/开辐射时间}
[0027] Then{传感器工作状态=开辐射/开机}
[0028] Else{传感器工作状态=关辐射/关机}
[0029] 其中,对于红外探测传感器,由于不主动辐射信号,因此其工作状态为开机和关机两种。
[0030] 对于主动辐射信号的雷达类传感器,还有以下规则:
[0031] 规则k+2:if{存在反辐射威胁}
[0032] Then if{存在重点目标跟踪任务}
[0033] Then if{重点目标被协同跟踪}
[0034] Then{雷达工作模式=关辐射}
[0035] Else{雷达工作模式=间歇辐射}
[0036] Else{雷达工作模式=关辐射}
[0037] Else{雷达工作模式=“保持现状”}
[0038] 其中,雷达间歇辐射时,不能转入精跟状态。
[0039] b)工作模式切换规则
[0040] 规则k+1:If{存在目标指示信息}
[0041] Then{红外系统工作模式=跟踪模式
[0042] 制导雷达工作模式=外引导}
[0043] Else{红外系统工作模式=搜索模式
[0044] 制导雷达工作模式=边跟边扫};
[0045] 规则k+2:if{存在目标相对距离<允许的最大距离+目标速度×系统准备时间}[0046] Then{制导雷达工作模式=精跟}
[0047] Else{制导雷达工作模式=粗跟}
[0048] c)抗干扰措施运用规则
[0049] 对于制导雷达,有以下抗干扰措施运用方法:
[0050] 规则k+1:if{目标施放自卫式噪声干扰}
[0051] Then{雷达抗干扰方式=被动跟踪}
[0052] 规则k+2:If{目标施放远距支援干扰}
[0053] Then{雷达抗干扰方式=“频率捷变”且“旁瓣对消”且“旁瓣匿影”}[0054] 规则k+3:If{目标施放自卫式假目标干扰}
[0055] Then{雷达抗干扰方式=“频率捷变”且“旁瓣对消”且“旁瓣匿影”且假目标}[0056] 规则k+4:If{目标施放拖引干扰}
[0057] Then{雷达抗干扰方式=“宽带”且“相位编码”}
[0058] 规则k+5:If{目标施放箔条干扰}
[0059] Then{雷达抗干扰方式=“MTI”且“MTD”且“宽带波形跟踪”}
[0060] 第二步:将上述规则进行量化处理。以第一步a)条中的开关机及辐射规则为例进行说明,将以上规则进行量化处理。量化方法如下:输入变量:x=(x1,x2,x3,x4,x5)=(主动或被动体制,目标是否进入其探测范围,是否有ARM对其攻击,是否有已跟踪重点目标,重点跟踪目标是否被协同跟踪),其中,各分量可取值为0或1,x1为0表示传感器为主动雷达,x1为1表示传感器为被动雷达或红外,其他分量取值为1表示为是,0表示为“否”。输出值y取值为1表示不开机(或不辐射),2表示开机(或辐射)。
[0061] 由于战场变化是动态的,针对上述输入参数的取值,可根据实际情况进行模糊化处理,如若传感器不确定是否有ARM攻击,则该项值可根据目标的行为特征采用最大隶属函数的方法,模糊取值为0~1之间的小数;
[0062] 第三步:将量化后的规则作为N个训练样本(xi,yi),其中xi=[xi1,xi2,…,xi5]T∈R5,yi∈R,对于一个有L个隐层节点的ELM可以表示为:
[0063]
[0064] 其中wi=[wi1,wi2,…,win]T是连接第i个隐藏层节点的输入权值;bi是i个隐藏层节点的偏差;βi=[βi1,βi2,…,βim]T是连接i个隐藏层节点的输出权重;wi·xi表示wi和xi的内积。激活函数g(·)可以是任意有界的非常量连续函数,通常为“Sigmoid”,“Sine”或“RBF”等。利用ELM算法进行训练学习,求得对应的系数βi,wi和bi。
[0065] 第四步:根据实时的威胁目标和装备状态,采用最大隶属函数的方法确定各输入分量值,然后利用第三步中的公式计算决策值,并进行四舍五入取整处理。
[0066] 第五步:由用户对结果进行评判,并将错误的结果修正后,作为新的规则置入量化后的规则库中,重新进行第三步学习训练,得到新的推理模型。