基于集总复合估计的飞行器神经网络学习控制方法转让专利

申请号 : CN201810950223.2

文献号 : CN108663940B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 许斌寿莹鑫

申请人 : 西北工业大学

摘要 :

本发明涉及一种基于集总复合估计的飞行器神经网络学习控制方法,首先将飞行器纵向通道模型解耦为速度子系统和高度子系统;针对速度子系统采用动态逆控制,针对高度子系统采用反步法控制;针对系统存在的动力学不确定采用神经网络进行估计,针对弹性模态带来的耦合采用非线性观测器进行估计;基于在线数据构造两种估计的集总预测误差,并将该预测误差应用到神经网络和非线性观测器的更新律中;基于两种估计器信息给出高度和速度控制器以实现对高度与速度的跟踪,最后将控制方法应用到高超声速飞行器弹性体模型中。

权利要求 :

1.一种基于集总复合估计的飞行器神经网络学习控制方法,其特征在于步骤如下:步骤1:采用飞行器动力学模型:该动力学模型包含五个状态变量X=[V,h,α,γ,q]T,四个弹性状态变量和两个控制输入U=[δe,Φ]T;其中V表示速度,h表示高度,γ表示航迹角,α表示攻角,q表示俯仰角速率,δe表示舵偏角,Φ表示燃油当量比;g,m,Iyy分别表示由重力引起的加速度、飞行器的质量以及俯仰轴的转动惯量,T,D,L,Myy分别表示推力、升力、阻力、俯仰力矩,ηi表示第i阶弹性模态,ζi表示第i阶弹性模态的阻尼,wi表示自然振动频率, 表示相互耦合参数,Ni表示广义力;

步骤2:将飞行器动力学模型解耦得到速度子系统和高度子系统:定义 θp=α+γ,速度子系统(1)写为:其中 表示由式(1)得到的未知光滑函数,gv表示由式(1)得到的已知函数;

针对高度子系统,定义高度跟踪误差为 航迹角期望指令γd为其中kh>0,kI>0,hd表示高度参考信号, 表示高度参考信号的导数;

定义x1=γ,x2=θp,x3=q,定义 姿态子系统(3)-(6)变换为:

其中 表示由式(3)-(6)得到的未知光滑函数, 表示由式(3)-(6)得到的已知函数,d表示由式(5)-(6)中的弹性模态组成的扰动;

步骤3:针对速度子系统,定义速度跟踪误差为ev=V-Vd,设计控制器Φ为:其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Vd表示速度参考信号, 表示速度参考信号的导数,Lfv>0和kv>0为设计参数;

设计补偿信号zv为:

定义补偿后跟踪误差为νv=ev-zv,设计集总预测误差为 其中τd>0为在线数据采集区

间;

设计神经网络复合学习自适应更新律为:其中λv>0,kωv>0和δfv>0为设计参数;

步骤4:针对姿态子系统,定义航迹角跟踪误差为 其中 表示航迹角期望指令;

第1步:设计虚拟控制量 为:其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Lf1>0和k1>0为设计参数, 表示高度参考信号的二阶导数,设计一阶滤波器为:

其中τ2>0为滤波器参数;

设计补偿信号z1为:

其中z2在下一步设计中给出;

定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中设计神经网络复合学习自适应更新律为:其中λ1>0,kω1>0和δf1>0为设计参数;

第2步:设计虚拟控制量 为:其中k2>0为设计参数;

设计一阶滤波器为:

其中τ3>0为滤波器参数;

设计补偿信号z2为:

定义补偿后跟踪误差为v2=e2-z2;

第3步:设计实际控制输入u为:其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示复合扰动的估计值,Lf3>0和k3>0为设计参数;

设计补偿信号 为:

定义补偿后跟踪误差为v3=e3-z3,设计集总预测误差为 其中设计神经网络复合学习自适应更新律为:其中λ3>0,kω3>0和δf3>0为设计参数设计扰动观测器为:

其中 L3>0为扰动观测器参数;

步骤5:根据得到的舵偏角δe和燃油当量比Φ,返回到飞行器的动力学模型(1)-(6),对高度和速度进行跟踪控制。

说明书 :

基于集总复合估计的飞行器神经网络学习控制方法

技术领域

[0001] 本发明涉及一种飞行器控制方法,特别是涉及一种基于集总复合估计的飞行器神经网络学习控制方法,属于飞行控制领域。

背景技术

[0002] 反步法控制被广泛应用于飞行器控制,但是在传统设计中存在“复杂度爆炸”问题,因此动态面设计以及指令滤波设计被应用降低设计复杂度。而针对飞行器系统存在的非线性,基于神经网络进行逼近学习的智能控制技术得到广泛关注。现在多数已有智能控制研究基于跟踪误差进行权重更新,仅保证闭环系统的稳定性,难以实现预期的非线性估计效果。为了提高智能系统对非线性的逼近性能,基于复合学习的设计采用平行估计策略实现不确定学习性能评价进而用于权重更新。
[0003] 《Composite Learning Control of MIMO Systems With Applications》(B Xu,Y Shou,《IEEE Transactions on Industrial Electronics》,2018年,第65卷第8期)一文针对多输入多输出的严格反馈系统研究了反步法控制并基于在线数据设计预测误差进行神经网络自适应律更新,实现了系统的快速稳定控制并应用于飞行器系统。但是,该设计过程中并未考虑飞行器系统存在弹性模态耦合的情形。当不确定系统受弹性模态耦合影响时,耦合会破坏神经网络的学习性能,系统无法对未知系统动力学进行有效逼近,因而难以保证控制性能。

发明内容

[0004] 要解决的技术问题
[0005] 为解决飞行器系统具有未知动态和弹性模态耦合的问题,本发明提出了一种基于集总复合估计的飞行器神经网络学习控制方法,该方法将飞行器纵向通道模型解耦为速度子系统和高度子系统;针对速度子系统采用动态逆控制,针对高度子系统采用反步法控制;利用神经网络估计系统存在的动力学不确定,利用非线性观测器估计弹性模态带来的耦合;基于在线数据构造两种估计的集总预测误差以设计神经网络和非线性观测器的更新律;基于两种估计器信息给出高度和速度控制器实现对高度和速度的跟踪。
[0006] 技术方案
[0007] 一种基于集总复合估计的飞行器神经网络学习控制方法,其特征在于步骤如下:
[0008] 步骤1:采用飞行器动力学模型:
[0009]
[0010]
[0011]
[0012]
[0013]
[0014]
[0015] 该动力学模型包含五个状态变量X=[V,h,α,γ,q]T,四个弹性状态变量和两个控制输入U=[δe,Φ]T;其中V表示速度,h表示高度,γ表示航迹角,α表示攻角,q表示俯仰角速率,δe表示舵偏角,Φ表示燃油当量比;g,m,Iyy分别表示由重力引起的加速度、飞行器的质量以及俯仰轴的转动惯量,T,D,L,Myy分别表示推力、升力、阻力、俯仰力矩,ηi表示第i阶弹性模态,ζi表示第i阶弹性模态的阻尼,wi表示自然振动频率,表示相互耦合参数,Ni表示广义力;
[0016] 步骤2:将飞行器动力学模型解耦得到速度子系统和高度子系统:
[0017] 定义 θp=α+γ,速度子系统(1)写为:
[0018]
[0019] 其中 表示由式(1)得到的未知光滑函数,gv表示由式(1)得到的已知函数;
[0020] 针对高度子系统,定义高度跟踪误差为 航迹角期望指令γd为
[0021]
[0022] 其中kh>0,kI>0,hd表示高度参考信号, 表示高度参考信号的导数;
[0023] 定义x1=γ,x2=θp,x3=q,定义 姿态子系统(3)-(6)变换为:
[0024]
[0025] 其中 表示由式(3)-(6)得到的未知光滑函数, 表示由式(3)-(6)得到的已知函数,d表示由式(5)-(6)中的弹性模态组成的扰动;
[0026] 步骤3:针对速度子系统,定义速度跟踪误差为ev=V-Vd,设计控制器Φ为:
[0027]
[0028] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Vd表示速度参考信号, 表示速度参考信号的导数,Lfv>0和kv>0为设计参数;
[0029] 设计补偿信号zv为:
[0030]
[0031] 定义补偿后跟踪误差为νv=ev-zv,设计集总预测误差为 其中τd>0为在线数据采集区
间;
[0032] 设计神经网络复合学习自适应更新律为:
[0033]
[0034] 其中λv>0,kωv>0和δfv>0为设计参数;
[0035] 步骤4:针对姿态子系统,定义航迹角跟踪误差为 其中 表示航迹角期望指令;
[0036] 第1步:设计虚拟控制量 为:
[0037]
[0038] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Lf1>0和k1>0为设计参数, 表示高度参考信号的二阶导数,
[0039] 设计一阶滤波器为:
[0040]
[0041] 其中τ2>0为滤波器参数;
[0042] 设计补偿信号z1为:
[0043]
[0044] 其中z2在下一步设计中给出;
[0045] 定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中
[0046] 设计神经网络复合学习自适应更新律为:
[0047]
[0048] 其中λ1>0,kω1>0和δf1>0为设计参数;
[0049] 第2步:设计虚拟控制量 为:
[0050]
[0051] 其中k2>0为设计参数;
[0052] 设计一阶滤波器为:
[0053]
[0054] 其中τ3>0为滤波器参数;
[0055] 设计补偿信号z2为:
[0056]
[0057] 定义补偿后跟踪误差为v2=e2-z2;
[0058] 第3步:设计实际控制输入u为:
[0059]
[0060] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,表示复合扰动的估计值,Lf3>0和k3>0为设计参数;
[0061] 设计补偿信号z3为:
[0062]
[0063] 定义补偿后跟踪误差为v3=e3-z3,设计集总预测误差为 其中
[0064] 设计神经网络复合学习自适应更新律为:
[0065]
[0066] 其中λ3>0,kω3>0和δf3>0为设计参数
[0067] 设计扰动观测器为:
[0068]
[0069] 其中 L3>0为扰动观测器参数;
[0070] 步骤5:根据得到的舵偏角δe和燃油当量比Φ,返回到飞行器的动力学模型(1)-(6),对高度和速度进行跟踪控制。
[0071] 有益效果
[0072] 本发明提出的一种基于集总复合估计的飞行器神经网络学习控制方法,与现有技术相比有益效果为:
[0073] (1)本发明考虑飞行器弹性模态带来的耦合影响,采用神经网络与扰动观测器两种估计器对系统的模型不确定以及耦合不确定进行估计。
[0074] (2)本发明给出了基于集总估计构造集总预测误差,实现神经网络与扰动观测的更新律设计,两种估计协同交换信息完成集总估计,提高集总估计的精度。
[0075] (3)本发明给出基于两种估计信息结合的飞行器控制器设计,突破单一神经网络处理模型不确定以及扰动观测处理耦合影响的设计,实现集总不确定前馈设计,可提高系统的跟踪性能。

附图说明

[0076] 图1是本发明基于集总复合估计的飞行器神经网络学习控制方法的流程图。

具体实施方式

[0077] 现结合实施例、附图对本发明作进一步描述:
[0078] 本发明解决其技术问题采用的技术方案是:一种基于集总复合估计的飞行器神经网络学习控制方法,通过以下步骤实现:
[0079] (a)采用飞行器动力学模型:
[0080]
[0081]
[0082]
[0083]
[0084]
[0085]
[0086] 该动力学模型包含五个状态变量X=[V,h,α,γ,q]T,四个弹性状态变量和两个控制输入U=[δe,Φ]T;其中V表示速度,h表示高度,γ表示航迹角,α表示攻角,q表示俯仰角速率,δe表示舵偏角,Φ表示燃油当量比;g,m,Iyy分别表示由重力引起的加速度、飞行器的质量以及俯仰轴的转动惯量,T,D,L,Myy分别表示推力、升力、阻力、俯仰力矩,ηi表示第i阶弹性模态,ζi表示第i阶弹性模态的阻尼,wi表示自然振动频率,表示相互耦合参数,Ni表示广义力。
[0087] (b)将飞行器动力学模型解耦得到速度子系统(1)和高度子系统(2)-(6)。
[0088] 定义 θp=α+γ,速度子系统(1)写为:
[0089]
[0090] 其中 表示由式(1)得到的未知光滑函数,gv表示由式(1)得到的已知函数。
[0091] 针对高度子系统,定义高度跟踪误差为 航迹角期望指令γd为
[0092]
[0093] 其中kh>0,kI>0,hd表示高度参考信号, 表示高度参考信号的导数。
[0094] 定义x1=γ,x2=θp,x3=q,定义 姿态子系统(3)-(6)变换为:
[0095]
[0096] 其中 表示由式(3)-(6)得到的未知光滑函数, 表示由式(3)-(6)得到的已知函数,d表示由式(5)-(6)中的弹性模态组成的扰动。
[0097] (c)针对速度子系统,定义速度跟踪误差为ev=V-Vd,设计控制器Φ为:
[0098]
[0099] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Vd表示速度参考信号, 表示速度参考信号的导数,Lfv>0和kv>0为设计参数。
[0100] 设计补偿信号zv为:
[0101]
[0102] 定义补偿后跟踪误差为νv=ev-zv,设计集总预测误差为 其中τd>0为在线数据采集区
间。
[0103] 设计神经网络复合学习自适应更新律为:
[0104]
[0105] 其中λv>0,kωv>0和δfv>0为设计参数。
[0106] (d)针对姿态子系统,定义航迹角跟踪误差为 其中 表示航迹角期望指令。
[0107] 第1步:设计虚拟控制量 为:
[0108]
[0109] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Lf1>0和k1>0为设计参数, 表示高度参考信号的二阶导数,
[0110] 设计一阶滤波器为:
[0111]
[0112] 其中τ2>0为滤波器参数。
[0113] 设计补偿信号z1为:
[0114]
[0115] 其中z2在下一步设计中给出。
[0116] 定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中
[0117]
[0118] 设计神经网络复合学习自适应更新律为:
[0119]
[0120] 其中λ1>0,kω1>0和δf1>0为设计参数。
[0121] 第2步:设计虚拟控制量 为:
[0122]
[0123] 其中k2>0为设计参数。
[0124] 设计一阶滤波器为:
[0125]
[0126] 其中τ3>0为滤波器参数。
[0127] 设计补偿信号z2为:
[0128]
[0129] 定义补偿后跟踪误差为v2=e2-z2。
[0130] 第3步:设计实际控制输入u为:
[0131]
[0132] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,表示复合扰动的估计值,Lf3>0和k3>0为设计参数
[0133] 设计补偿信号z3为:
[0134]
[0135] 定义补偿后跟踪误差为v3=e3-z3,设计集总预测误差为 其中
[0136]
[0137] 设计神经网络复合学习自适应更新律为:
[0138]
[0139] 其中λ3>0,kω3>0和δf3>0为设计参数
[0140] 设计扰动观测器为:
[0141]
[0142] 其中 L3>0为扰动观测器参数。
[0143] (e)根据得到的舵偏角δe和燃油当量比Φ,返回到飞行器的动力学模型(1)-(6),对高度和速度进行跟踪控制。
[0144] 实施例:
[0145] 参照图1,本发明基于集总复合估计的飞行器神经网络学习控制方法应用于高超声速飞行器中,通过以下步骤实现:
[0146] (a)采用高超声速飞行器弹性体动力学模型:
[0147]
[0148]
[0149]
[0150]
[0151]
[0152]
[0153] 该动力学模型包含五个状态变量X=[V,h,α,γ,q]T,四个弹性状态变量和两个控制输入U=[δe,Φ]T;其中V表示速度,h表示高度,γ表示航迹角,α表示攻角,q表示俯仰角速率,δe表示舵偏角,Φ表示燃油当量比;g,m,Iyy分别表示由重力引起的加速度、飞行器的质量以及俯仰轴的转动惯量,T,D,L,Myy分别表示推力、升力、阻力、俯仰力矩,ηi表示第i阶弹性模态,ζi表示第i阶弹性模态的阻尼,wi表示自然振动频率,表示相互耦合参数,Ni表示广义力。
[0154] 力、力矩以及各系数的表达式分别为:
[0155] T=TΦ(α)Φ+T0(α)≈(β1Φ+β2)α3+(β3Φ+β4)α2+(β5Φ+β6)α+(β7Φ+β8),[0156]
[0157]
[0158]
[0159]
[0160]
[0161]
[0162]
[0163]
[0164]
[0165]
[0166] 其中 表示动压,ρ表示空气密度,Ci(j),i=D,L,M,T,N1,N2,j=α,β,q,δe表示j对i的系数,表示平均气动弦长,S表示气动参考面积。
[0167] (b)将高超声速飞行器弹性体动力学模型解耦得到速度子系统(1)和高度子系统(2)-(6)。
[0168] 定义 θp=α+γ,速度子系统(1)写为:
[0169]
[0170] 其中
[0171] 针对高度子系统,高度跟踪误差定义为 航迹角期望指令γd为
[0172]
[0173] 其中,kh=0.5,kI=0.05,hd表示高度参考信号, 表示高度参考信号的导数。
[0174] 定义x1=γ,x2=θp,x3=q,定义 姿态子系统(3)-(6)变换为:
[0175]
[0176] 其中
[0177] (c)针对速度子系统,定义速度跟踪误差为ev=V-Vd,设计控制器Φ为:
[0178]
[0179] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,Vd表示速度参考信号, 表示速度参考信号的导数,kv=3,Lfv=3。
[0180] 设计补偿信号zv为:
[0181]
[0182] 定义补偿后跟踪误差为νv=ev-zv,设计集总预测误差为 其中τd=0.05s为在线数据
采集区间。
[0183] 设计神经网络复合学习自适应更新律为:
[0184]
[0185] 其中λv=1.5,kωv=30,δfv=0.001。
[0186] (d)针对高度子系统,并定义航迹角跟踪误差为 其中 表示航迹角期望指令。
[0187] 第1步:设计虚拟控制量 为:
[0188]
[0189] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,k1=0.8, 表示高度参考信号的二阶导数,
[0190] 设计一阶滤波器为:
[0191]
[0192] 其中τ2=0.05为滤波器参数。
[0193] 设计补偿信号z1为:
[0194]
[0195] 其中z2在下一步设计中给出。
[0196] 定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中
[0197] 设计神经网络复合学习自适应更新律为:
[0198]
[0199] 其中λ1=3.5,kw1=30,δf1=0.001。
[0200] 第2步:设计虚拟控制量 为:
[0201]
[0202] 其中k2=1.8。
[0203] 设计一阶滤波器为:
[0204]
[0205] 其中τ3=0.05为滤波器参数。
[0206] 设计补偿信号z2为:
[0207]
[0208] 定义补偿后跟踪误差为v2=e2-z2。
[0209] 第3步:设计实际控制输入u为:
[0210]
[0211] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,表示复合扰动的估计值,k3=2.8,Lf3=3。
[0212] 设计补偿信号z3为:
[0213]
[0214] 定义补偿后跟踪误差为v3=e3-z3,设计集总预测误差为 其中
[0215] 设计神经网络复合学习自适应更新律为:
[0216]
[0217] 其中λ3=1.5,kω3=30,δf3=0.001。
[0218] 设计扰动观测器为:
[0219]
[0220] 其中 L3=10为扰动观测器参数。
[0221] (e)根据得到的舵偏角δe和燃油当量比Φ,返回到高超声速飞行器的弹性体动力学模型(1)-(6),对高度和速度进行跟踪控制。
[0222] 本发明首先将飞行器纵向通道模型解耦为速度子系统和高度子系统;针对速度子系统采用动态逆控制,针对高度子系统采用反步法控制;针对系统存在的动力学不确定采用神经网络进行估计,针对弹性模态带来的耦合采用非线性观测器进行估计;基于在线数据构造两种估计的集总预测误差,并将该预测误差应用到神经网络和非线性观测器的更新律中;基于两种估计器信息给出高度和速度控制器以实现对高度与速度的跟踪,最后将控制方法应用到高超声速飞行器弹性体模型中。本发明充分利用在线数据进行神经网络学习以及非线性观测器设计,实现飞行器动力学不确定以及模态耦合影响有效估计,为飞行器控制提供了新的技术途径。