一种基于深度学习的制导炮弹导航方法及系统转让专利

申请号 : CN202310977773.4

文献号 : CN117091457B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 汪进文薄煜明付梦印朱建良吴祥何山

申请人 : 南京理工大学

摘要 :

本发明提供了一种基于深度学习的制导炮弹导航方法及系统,适用于制导炮弹全过程自主导航定位,该方法主要包括深度学习网络训练和弹道位置增量误差融合滤波两部分,根据炮弹飞行动力学方程获取深度学习网络训练数据集,采用LSTM网络构建弹道位置增量预测模型,并建立弹道位置增量误差滤波模型,完成深度学习预测结果与INS解算结果的信息融合,实现高精度的制导炮弹全过程自主导航定位。该方法适用于高动态环境下制导炮弹导航。

权利要求 :

1.一种基于深度学习的制导炮弹导航方法,其特征在于,包括步骤:根据炮弹飞行动力学方程获取深度学习网络训练数据集,采用LSTM网络构建弹道位置增量预测模型;

采用一阶马尔可夫建立弹道位置增量误差滤波模型,将深度学习预测结果与INS解算结果进行信息融合,实现制导炮弹导航定位;

采用一阶马尔可夫建立弹道位置增量误差滤波模型具体包括:将弹道位置增量误差建模为一阶马尔可夫过程,即:式中,ep为弹道位置增量误差, 为相关时间矩阵,w为白噪声,τx、τy、τz分别表示x、y、z轴的相关时间;

以弹道位置增量误差ep作为系统状态变量,构建Kalman滤波系统方程;

采用INS解算的弹道位置增量结果和深度学习预测弹道位置增量结果构建观测方程;

所述Kalman滤波系统方程为:

Xk=Φk,k‑1Xk‑1+Wk‑1

式中,Wk‑1为白噪声,Φk,k‑1=I3×3‑Tts,Xk=ep,ts为采样时间;

所述观测方程为:

式中,Vk为观测噪声, 为INS解算的弹道位置增量结果, 为深度学习预测弹道位置增量结果。

2.根据权利要求1所述的基于深度学习的制导炮弹导航方法,其特征在于,根据炮弹飞行动力学方程获取深度学习网络训练数据集具体包括:根据制导炮弹动力学方程获取不同风速环境下的弹道,根据弹道反演出惯性器件输出数据,作为深度学习网络输入,弹道位置增量作为深度学习网络输出。

3.根据权利要求1所述的基于深度学习的制导炮弹导航方法,其特征在于,所述LSTM网络采用2层LSTM,每一层节点数为32,学习率为0.001,迭代次数为100次,序列输入层为6,全连接层为3。

4.根据权利要求1~3任一所述的基于深度学习的制导炮弹导航方法,其特征在于,弹道位置增量预测模型为:b

式中, 表示陀螺仪测量的载体角速率,f 表示加速度计测量的三轴比力,f(·)表示b和f与弹道位置增量之间的函数映射关系。

5.一种实现权利要求1所述方法的基于深度学习的制导炮弹导航系统,其特征在于,包括LSTM网络、INS模块、滤波融合模块和制导炮弹导航模块,其中:所述LSTM网络的训练集根据炮弹飞行动力学方程获取,输出弹道位置增量;

INS模块用于解算弹道位置增量;

滤波融合模块采用一阶马尔可夫建立弹道位置增量误差滤波模型,将深度学习预测结果与INS解算结果进行信息融合;

制导炮弹导航模块根据融合结果实现制导炮弹导航定位。

说明书 :

一种基于深度学习的制导炮弹导航方法及系统

技术领域

[0001] 本发明属于高动态环境下的制导炮弹导航领域,涉及一种基于深度学习的制导炮弹导航方法及系统。

背景技术

[0002] 制导炮弹高精度导航定位赋予炮弹精确制导能力,其精度直接制约武器精确打击目标的能力。制导炮弹飞行时间为100秒左右,属于短时导航领域。惯性导航具有自主性、实时性和隐蔽性,可以连续提供姿态、速度和位置全部导航参数,且具有非常好的短期精度和稳定性。通常采用惯性导航方式进行炮弹导航、制导与控制。由于全球导航卫星系统(Global Navigation Satellite System,GNSS)属于无线通信系统,且卫星导航信号属于弱信号,因此,在实际战场环境下卫星信号传播时易受到各种复杂的电磁环境干扰,同时受炮弹结构和高旋转(≥20r/s)运动扰动影响,使得卫星拒止,导致导航定位精度下降,严重影响作战效能,甚至会导致军事作战任务失败。为此针对卫星干扰和随机风扰等高复杂性,高旋转(≥20r/s)和高过载(≥10000g)等高动态性等难题,亟需开展制导炮弹全过程自主导航研究。
[0003] 针对制导炮弹全过程自主导航,主要围绕着各类多源传感信息融合的导航定位方法研究。2015年美国启动精确鲁棒惯性制导弹药(PRIGM)项目,研制先进导航惯性测量单元(NGIMU)与先进惯性微传感器(AIMS),以求在极端条件下提供稳定的导航性能,从现有公开文献来看,该项目进展如何还处于未知状态。法国圣路易斯法德研究所的Roux等人采用扩展卡尔曼滤波器(EKF)和不完全右不变扩展卡尔曼滤波器(不完全R‑IEKF)有效估计了炮弹弹道,该方法侧重于滤波算法的研究,对于炮弹本身及其环境特性分析较少。
[0004] 随着人工智能(AI)的发展,AI技术越来越多地用于军事应用,如目标识别、预测性维护、军事训练、决策支持或网络安全。导航技术也随之迈入了智能时代,多源传感器的数据融合要求传统定位导航方法向着数据与模型共同驱动的人工智能方向迈进,AI技术已经广泛应用于导航领域。Brossard等提出一种基于CNN结构的噪声估计AI‑IMU模型能够自适应估计IMU的量测噪声,用于纯惯性导航系统。Chen等人提出一种IONet,使用惯性传感器在给定时间窗内估计位移的方法,所提优于基于标准惯性导航系统和基于模型的步长估计的算法。随着导航技术的发展,AI技术和传统方法的有机结合开始成为新的发展趋势。Chen等人提出了DynaNet,一种混合深度学习和时变状态空间模型,可以进行端到端训练,有效的提升了导航精度。Tang等人提出了一种结合推理建模和数据驱动的联合优化方法VINFNet,该方法融合了状态空间潜在推理模型和深度生成网络各自的优势,可以显式模拟目标运动的物理过程,并通过一系列可逆映射构建目标轨迹的复杂后验分布,在收敛性、准确性、鲁棒性和有效性方面优于传统方法。尽管AI技术广泛用于地面导航,但很少应用于炮弹导航。

发明内容

[0005] 为了克服复杂扰动环境下惯性导航精度不足的问题,本发明提出一种基于深度学习的制导炮弹导航方法及系统,以提高导航精度。
[0006] 本发明所采用的技术方案是:一种基于深度学习的制导炮弹导航方法,包括步骤:
[0007] 根据炮弹飞行动力学方程获取深度学习网络训练数据集,采用LSTM网络构建弹道位置增量预测模型;
[0008] 采用一阶马尔可夫建立弹道位置增量误差滤波模型,将深度学习预测结果与INS解算结果进行信息融合,实现制导炮弹导航定位。
[0009] 进一步地,采用一阶马尔可夫建立弹道位置增量误差滤波模型具体包括:
[0010] 将弹道位置增量误差建模为一阶马尔可夫过程,即:
[0011]
[0012] 式中,ep为弹道位置增量误差, 为相关时间矩阵,w为白噪声,τx、τy、τz分别表示x、y、z轴的相关时间;
[0013] 以弹道位置增量误差ep作为系统状态变量,构建Kalman滤波系统方程;D
[0014] 采用INS解算的弹道位置增量结果 和深度学习预测弹道位置增量结果ΔPk 构建观测方程。
[0015] 进一步地,所述Kalman滤波系统方程为:
[0016] Xk=Φk,k‑1Xk‑1+Wk‑1
[0017] 式中,Wk‑1为白噪声,Φk,k‑1=I3×3‑Tts,Xk=ep。
[0018] 进一步地,所述观测方程为:
[0019]
[0020] 式中,Vk为观测噪声,ts为采样时间。
[0021] 进一步地,根据炮弹飞行动力学方程获取深度学习网络训练数据集具体包括:根据制导炮弹动力学方程获取不同风速环境下的弹道,根据弹道反演出惯性器件输出数据,作为深度学习网络输入,弹道位置增量作为深度学习网络输出。
[0022] 进一步地,所述LSTM网络采用2层LSTM,每一层节点数为32,学习率为0.001,迭代次数为100次,序列输入层为6,全连接层为3。
[0023] 进一步地,弹道位置增量预测模型为:
[0024]
[0025] 式中, 表示陀螺仪测量的载体角速率,fb表示加速度计测量的三轴比力,f(·)b表示 和f与弹道位置增量之间的函数映射关系。
[0026] 一种基于深度学习的制导炮弹导航系统,包括LSTM网络、INS模块、滤波融合模块和制导炮弹导航模块,其中:
[0027] 所述LSTM网络的训练集根据炮弹飞行动力学方程获取,输出弹道位置增量;
[0028] INS模块用于解算弹道位置增量;
[0029] 滤波融合模块采用一阶马尔可夫建立弹道位置增量误差滤波模型,将深度学习预测结果与INS解算结果进行信息融合;
[0030] 制导炮弹导航模块根据融合结果实现制导炮弹导航定位。
[0031] 与现有技术相比,本发明的有益效果为:本发明将弹道反演得到陀螺仪和加速度计输出结果作为深度学习网络的输入,以弹道的位置增量作为深度学习网络的输出,实现弹道位置增量的预测;本发明采用一阶马尔可夫构建了弹道位置增量误差滤波模型,采用Kalman滤波估计弹道位置增量误差,实现对弹道位置增量误差的补偿,从而提升导航精度;本发明实现高精度的制导炮弹全过程自主导航定位,适用于高动态环境下制导炮弹导航。

附图说明

[0032] 图1为一种深度学习制导炮弹导航框架示意图。
[0033] 图2为基于深度学习的SINS位置推算框架示意图。
[0034] 图3为深度学习网络模型结构图。
[0035] 图4为深度学习制导炮弹导航框架应用流程图。

具体实施方式

[0036] 接下来结合附图,对本发明的实施进行详细说明。
[0037] 参见附图1和图4,本发明设计一种深度学习制导炮弹导航框架。框架主要分为两大部分:1)深度学习网络;2)信息融合滤波。首先,根据制导炮弹动力学方程获取不同风速环境下的弹道,建立深度学习网络训练集,构建基于深度学习的INS位置推算框架,根据弹道反演出惯性器件(陀螺仪和加速度计)输出数据,以此作为深度学习网络输入,以弹道位置增量作为深度学习网络输出,完成深度学习网络模型训练。最后,构建弹道位置增量误差滤波模型,采用一阶马尔可夫过程建立弹道位置增量误差系统方程,结合INS解算弹道位置增量结果和深度学习网络预测弹道位置增量结果构建量测方程,采用Kalman滤波完成信息融合,实现制导炮弹高精度导航定位。
[0038] 捷联于制导炮弹的惯性导航系统中弹道(即导航位置)信息的递推形式为:
[0039]
[0040] 式中,Pk表示k时刻制导炮弹的位置坐标;Pk‑1表示k‑1时刻制导炮弹的位置坐标;表示k‑1时刻导航坐标系下制导炮弹的速度。ΔPk表示惯性弹道增量(即位置增量)。
[0041] 本专利采用深度学习方法来解决制导炮弹弹道位置解算问题,因此,可将弹道位置增量写为:
[0042]
[0043] 式中, 表示陀螺仪测量的载体角速率。fb表示加速度计测量的三轴比力。f(·)表示陀螺仪输出角速率和加速度计输出比力信息与弹道位置增量之间的函数映射关系。
[0044] 根据式(2)可知,只需要获取弹道位置增量即可推算出制导炮弹的具体位置。这部分采用深度学习方法实现,我们考虑在不同风速条件下,根据发射点的弹药型号、气象条件以及地理位置计算多条弹道,构建深度学习网络训练集。
[0045] 得到炮弹飞行动力学方程得到n条弹道,可得不同弹道姿态、速度信息。根据欧拉方程可得反演的陀螺仪输出角速率:
[0046]
[0047] 将姿态和速度代入比力方程可得反演的加速度计输出比力:
[0048]
[0049] 式中, Re为地球平均半径,ωie为地球自转角T
速率,[L λ h] 为位置,分别代表纬度、经度和高度, 为速度,分别代表n
东、北和天向速度,g为当地重力加速度。 为载体坐标系到导航坐标系的姿态转换矩阵。
[0050] 根据式(3)和式(4)即可根据弹道反演获取陀螺仪和加速度计输出结果。结合图2,将弹道反演得到陀螺仪和加速度计输出结果作为深度学习网络的输入,以弹道的位置增量作为深度学习网络的输出,实现弹道位置增量的预测。
[0051] 在使用深度学习处理时间序列数据时,大多数方法使用递归神经网络(RNN)。本专利采用LSTM深度学习网络结构,本发明采用2层LSTM,每一层节点数为32,学习率为0.001,迭代次数为100次,序列输入层为6,全连接层为3,采用LSTM网络实现弹道位置增量预测,并将所得结果与INS解算结果进行Kalman滤波融合。深度学习网络结构见附图3,为现有结构,在此不做详细阐述。
[0052] 基于上述分析,通过深度学习手段可以获取INS位置增量结果,而INS本身亦可获取位置增量结果,为了进一步提高导航的精度,对二者进行融合处理。根据弹道位置递推过程可知,当前时刻弹道位置增量误差仅与上一时刻的位置增量误差有关。因此,可将弹道位置增量误差建模为一阶马尔可夫过程,即:
[0053]
[0054] 式中,ep为弹道位置增量误差。 为相关时间矩阵。w为白噪声。
[0055] 以弹道位置增量误差ep作为系统状态变量,构建Kalman滤波系统方程,离散形式为:
[0056] Xk=Φk,k‑1Xk‑1+Wk‑1  (6)
[0057] 式中,Wk‑1为白噪声。D
[0058] 采用INS解算弹道位置增量结果 和深度学习预测弹道位置增量结果ΔPk 构建观测方程:
[0059]
[0060] 式中,Vk为观测噪声,ts为采样时间。
[0061] 结合式(6)和式(7)即构建了弹道位置增量误差滤波模型,采用Kalman滤波估计弹道位置增量误差,实现对弹道位置增量误差的补偿,从而提升导航精度。
[0062] 参见附图2,本发明根据弹道反演获取陀螺仪和加速度计输出结果。将弹道反演得到陀螺仪和加速度计输出结果作为深度学习网络的输入,以弹道的位置增量作为深度学习网络的输出,实现弹道位置增量的预测。
[0063] 本发明实现高精度的制导炮弹全过程自主导航定位,这种方法适用于高动态环境下,制导炮弹导航。