变形与机动一体化的规避与突防方法转让专利

申请号 : CN202211270948.X

文献号 : CN115357051B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王玥李柯绪刘鑫渝吴若愚刘劲涛

申请人 : 北京理工大学

摘要 :

本发明公开了一种变形与机动一体化的规避与突防方法,涉及飞行器规避与突防技术领域,该方法适用于多种飞行器,具有泛化性。首先根据作战任务,对滑翔飞行器进行发射诸元解算与发射诸元装订,获得预设的标称轨迹。滑翔飞行器发射,并按预设的标称轨迹持续飞行。若飞行器在中段遭遇敌方拦截,则通过机翼变形实现滑翔飞行器的中段规避与突防;变形后的滑翔飞行器进行轨迹重规划,保证滑翔飞行器完成原始的作战任务。若飞行器在末段遭遇敌方拦截,则进行机动闪避在原始轨迹周围进行变轨,以实现末段规避与突防,同时进行轨迹重规划,保证在机动变轨之后仍能完成原始任务。若飞行器未遭遇敌方拦截,则按照标称轨迹持续飞行,直至完成作战任务。

权利要求 :

1.变形与机动一体化的规避与突防方法,其特征在于,包括:

步骤1:根据作战任务,对滑翔飞行器进行发射诸元解算与发射诸元装订,获得预设的标称轨迹;

步骤2:所述滑翔飞行器发射,并按所述预设的标称轨迹持续飞行;

步骤3:若所述滑翔飞行器在中段遭遇敌方拦截,则通过展开弹翼,提高最大升阻比,或者通过收起弹翼,降低最大升阻比,实现滑翔飞行器的中段规避与突防;变形后的滑翔飞行器进行轨迹重规划,重规划后的轨迹保证滑翔飞行器完成原始的作战任务;

步骤4:若滑翔飞行器在末段遭遇敌方拦截,则进行机动闪避从而在原始轨迹周围进行变轨,以实现飞行器的末段规避与突防,同时进行轨迹重规划,以保证其在机动变轨之后仍能完成原始任务;

具体为:当所述滑翔飞行器感知到敌方拦截时,感知单元将探测到的敌我双方实时态势信息传输给深度强化学习网络,所述敌我双方实时态势信息包括敌我双方相对距离R、相对视线角q作为网络的观测向量St,网络内部则进行奖励函数Rt的梯度更新;

随着攻防对抗的进行,奖励函数逐渐收敛至取值最优,从而得到一个能够稳定输出规*避与突防策略π的深度强化学习神经网络模型,该网络模型用于稳定输出动作控制指令;

所述动作控制指令包括过载控制指令或者姿态控制指令;

此时,固定该网络模型的权重参数,当再次输入感知单元观测到的实时态势信息时,该网络模型即可稳定输出连续的动作控制指令,且保证在此连续动作控制指令的指导下,滑翔飞行器实现实时的规避与突防,并且最终完成原始作战任务;

步骤5:若飞行器未遭遇敌方拦截,则按照步骤2中的标称轨迹持续飞行,直至完成作战任务。

2.如权利要求1所述的变形与机动一体化的规避与突防方法,其特征在于,所述发射诸元包括发射方位角A、最大负攻角αm、三级俯仰角变化率φ3’、剖面参数Dc、标称攻角指令αp、标称倾侧角指令γVp。

3.如权利要求1所述的变形与机动一体化的规避与突防方法,其特征在于,所述步骤3中,变形后的滑翔飞行器进行轨迹重规划,具体步骤为:以变形的时机和变形后的飞行器参数组成为多目标变量;

对于多目标变量Xorigin,首先进行分解得到单目标变量X1,…,Xm,m为单目标变量个数,之后对优化目标进行聚合更新,并验证是否满足终止条件:脱靶量大于10m且能够完成作战任务,若满足则输出最终优化结果Xbest,否则继续进行分解更新,直至满足终止条件,之后输出最终优化结果Xbest;

根据最终优化结果确定重规划后的轨迹。

4.如权利要求1所述的变形与机动一体化的规避与突防方法,其特征在于,所述奖励函数Rt的主线回报设计为:脱靶量大于10m且能完成原始任务。

说明书 :

变形与机动一体化的规避与突防方法

技术领域

[0001] 本发明涉及飞行器规避与突防技术领域,具体涉及一种变形与机动一体化的规避与突防方法。

背景技术

[0002] 在复杂的战场环境中,由于常规固定外形飞行器的大升阻比与大机动过载之间存在矛盾,而且在高速飞行情况下存在气动加热严重等问题,导致常规固定外形飞行器在实际飞行过程中机动能力不足,从而导致其在战场遭遇时刻的规避与突防能力不足。
[0003] 面向敌方拦截的主动规避与突防方法,是当前国内外研究的重点。传统的机动突防方式通常基于飞行器的气动模型,将重力纳入模型范围,考虑再入点的空间位置、速度以及过载等约束,从机动的时刻点、机动时间和机动能力等方面对拦截器脱靶量进行仿真研究,构建线性微分对策模型,以航向误差为性能指标,借鉴数学中泛函数的双边极值问题讨论方法,最终得出飞行器的机动策略。近年来,众多专家与文献也提出了基于传统优化算法的机动突防技术,这类技术通常基于大量数据,通过优化计算得到最优策略集,根据支付函数制定战术策略,完成自主化突防任务,趋于智能化。
[0004] 上述研究对飞行器主动规避与突防技术的发展起到了重要推动作用。然而,上述方法生成的规避与突防策略过于依赖模型与空气动力学参数,在实际应用中仍然是射前规划中制定的方案弹道,至于飞行器发射后如何实时面对敌方拦截,缺少临机策略指导,因此自主智能性较低。面对防御系统在中段、末段的全程拦截,我方飞行器在临机规避与突防领域的研究亟待开展。

发明内容

[0005] 有鉴于此,本发明提供了一种变形与机动一体化的规避与突防方法,该方法考虑了飞行器在飞行过程中不同阶段遭遇敌方拦截时的规避与突防方法,适用于多种飞行器,具有泛化性。
[0006] 为达到上述目的,本发明的技术方案包括如下步骤:
[0007] 步骤1:根据作战任务,对滑翔飞行器进行发射诸元解算与发射诸元装订,获得预设的标称轨迹。
[0008] 步骤2:滑翔飞行器发射,并按预设的标称轨迹持续飞行。
[0009] 步骤3:若滑翔飞行器在中段遭遇敌方拦截,则通过展开弹翼,提高最大升阻比,或者通过收起弹翼,降低最大升阻比,实现滑翔飞行器的中段规避与突防;变形后的滑翔飞行器进行轨迹重规划,重规划后的轨迹保证滑翔飞行器完成原始的作战任务。
[0010] 步骤4:若滑翔飞行器在末段遭遇敌方拦截,则进行机动闪避从而在原始轨迹周围进行变轨,以实现飞行器的末段规避与突防,同时进行轨迹重规划,以保证其在机动变轨之后仍能完成原始任务。
[0011] 步骤5:若飞行器未遭遇敌方拦截,则按照步骤2中的标称轨迹持续飞行,直至完成作战任务。
[0012] 进一步地,发射诸元包括发射方位角A、最大负攻角αm、三级俯仰角变化率φ3’、剖面参数Dc、标称攻角指令αp、标称倾侧角指令γVp。
[0013] 进一步地,步骤3中,变形后的滑翔飞行器进行轨迹重规划,具体步骤为:
[0014] 以变形的时机和变形后的飞行器参数组成为多目标变量。
[0015] 对于多目标变量Xorigin,首先进行分解得到单目标变量(X1,…,Xm),m为单目标变量个数,之后对优化目标进行聚合更新,并验证是否满足终止条件:脱靶量大于10m且能够完成作战任务,若满足则输出最终优化结果Xbest,否则继续进行分解更新,直至满足终止条件,之后输出最终优化结果Xbest。
[0016] 根据最终优化结果确定重规划后的轨迹。
[0017] 进一步地,步骤4具体为:
[0018] 当滑翔飞行器感知到敌方拦截时,感知单元将探测到的敌我双方实时态势信息传输给深度强化学习网络,敌我双方实时态势信息包括敌我双方相对距离R、相对视线角q作为网络的观测向量St,网络内部则进行奖励函数Rt的梯度更新。
[0019] 随着攻防对抗的进行,奖励函数逐渐收敛至取值最优,从而得到一个能够稳定输*出规避与突防策略π深度强化学习神经网络模型,该网络模型用于稳定输出动作控制指令;动作控制指令包括过载控制指令或者姿态控制指令。
[0020] 此时,固定该网络模型的权重参数,当再次输入感知单元观测到的实时态势信息时,该网络模型即可稳定输出连续的动作控制指令,且保证在此连续动作控制指令的指导下,滑翔飞行器实现实时的规避与突防,并且最终完成原始作战任务。
[0021] 进一步地,奖励函数Rt的主线回报设计为:脱靶量大于10m且能完成原始任务。
[0022] 有益效果:
[0023] 1、本发明针对上述固定外形飞行器机动能力不足、飞行器在线规避与突防技术缺乏等问题,将变形方法与机动方法结合起来,从而拓展飞行器机动能力上限,同时通过在线智能算法解决临机决策问题,从而提高飞行器在实际作战过程中的战场生存能力。
[0024] 2、本发明可面向某一典型飞行器,针对其在不同飞行阶段遭遇拦截时,解决对应的规避与突防问题;同时适用于多种飞行器,针对不同飞行器在各自的战场遭遇情况下,解决其对应的规避与突防问题,泛化性强。
[0025] 3、本发明中飞行器变形与机动策略的生成都是基于统一的框架,基于这种框架的飞行器可以自适应地增添或删减,从而有效应对飞行器随时出现损毁或者增添的场景,增加了整个系统的鲁棒性。

附图说明

[0026] 图1为一种变形与机动一体化的规避与突防方法的整体流程图;
[0027] 图2为发射诸元求解方法示意图;
[0028] 图3为变形策略及重规划求解方法示意图;
[0029] 图4为机动策略及重规划求解方法示意图。

具体实施方式

[0030] 下面结合附图并举实施例,对本发明进行详细描述。
[0031] 本发明提供了一种变形与机动一体化的规避与突防方法。该方法考虑了飞行器可变外形情况下,面向战场实时遭遇时刻,结合变形与机动一体化策略,快速、高效地生成一个可行的规避与突防方案。本发明结合多目标优化和深度强化学习方法,作为变形与机动一体化的规避与突防方案的求解算法。算法对机载计算器的硬件要求低,求解速度快。其主要实体可以包括如下:用于执行战场侦察、打击等任务的低速、亚音速、超音速以及高超音速滑翔飞行器。
[0032] 如图1所示,的一种变形与机动一体化的规避与突防方法具体步骤如下:
[0033] 步骤1:根据侦察、打击等作战任务,针对典型飞行器(滑翔飞行器)进行发射诸元解算并进行发射诸元装订(装订发射诸元得到预设的标称轨迹),其中发射诸元包括:发射方位角A、最大负攻角αm、三级俯仰角变化率φ3’(以三级火箭作为助推器为例)、剖面参数Dc、标称攻角指令αp、标称倾侧角指令γVp等。具体发射诸元求解方法如图2。
[0034] 步骤2:飞行器发射,并按预设的标称轨迹持续飞行。
[0035] 步骤3:若飞行器在中段(相对平衡的阶段)遭遇敌方拦截,通过展开机翼,提高最大升阻比,从而大幅跃起至高度更高的空域;或者通过收起机翼,降低最大升阻比,从而大幅下滑至高度更低的空域,进而实现规避与突防。同时针对变形后的飞行器进行轨迹重规划,以保证其在大幅改变飞行空域后仍能完成原始任务。具体变形策略及重规划求解方法如图3。
[0036] 对于输入的多目标变量Xorigi(n 变形的时机、变形之后的最大升阻比),首先进行分解得到单目标变量(X1,…,Xm),之后对优化目标进行聚合更新,并验证是否满足终止条件:脱靶量大于10m且能够完成作战任务,若满足则输出最终优化结果Xbest,否则继续进行分解更新,直至满足终止条件,之后输出最终优化结果Xbest。
[0037] 步骤4:若飞行器在末段遭遇敌方拦截,通过机动闪避,在原始轨迹周围进行小幅变轨,从而实现规避与突防,同时进行轨迹重规划,以保证其在机动变轨之后仍能完成原始任务。具体机动策略及重规划求解方法如图4。
[0038] 当我方飞行器感知到敌方拦截时,感知单元将探测到的敌我双方相对信息(主要包括敌我双方相对距离R、相对视线角q)传输给深度强化学习网络,作为网络的观测向量St,网络内部则进行奖励函数Rt的梯度更新,其中奖励函数Rt的主线回报设计为:脱靶量大于10m且能完成原始任务。随着海量攻防对抗的进行,奖励函数逐渐收敛至取值最优,从而得到一个能够稳定输出规避与突防策略π*的深度强化学习神经网络,也即该网络模型能够稳定输出过载控制指令(Nx,Ny,Nz)或者姿态控制指令(alpha,gamma)等底层动作控制指令。此时,固定该网络模型的权重参数,当再次输入感知单元观测到的实时态势信息时,该网络即可稳定输出连续的动作控制指令,且保证在此连续动作控制指令的指导下,飞行器能够实现实时的规避与突防,并且最终完成侦察、打击等原始作战任务。
[0039] 步骤5:若飞行器未遭遇敌方拦截,则按照步骤2中的标称轨迹持续飞行,直至完成作战任务。
[0040] 综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。