基于集总复合估计的严格反馈系统神经网络控制方法转让专利

申请号 : CN201810949491.2

文献号 : CN109062049B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 许斌寿莹鑫

申请人 : 西北工业大学

摘要 :

本发明涉及一种基于集总复合估计的严格反馈系统神经网络控制方法,属于智能控制方法领域,用于解决具有外界干扰的不确定反馈系统中未知动态和时变扰动的问题。该方法基于反步法的框架,采用神经网络来估计系统的非线性函数,利用扰动观测器处理由神经网络近似误差和时变扰动所形成的复合扰动,利用在线数据的神经网络估计和扰动观测估计构造集总复合估计误差,并设计神经网络和扰动观测器的更新律,最后基于神经网络估计与扰动观测估计设计控制输入。本发明将神经网络学习和扰动观测有机结合,为处理具有时变干扰的严格反馈系统控制提供了有效途径。

权利要求 :

1.一种基于集总复合估计的严格反馈系统神经网络控制方法,其特征在于步骤如下:步骤1:考虑严格反馈系统动力学模型:其中 表示系统输入,y∈R表示系统输出, 表示关于 的未知光滑函数, 表示已知非零函数,di(t)表示时变扰动,满足其中 表示扰动以及扰动变化率上界;

步骤2:根据公式(1),定义跟踪误差为e1=x1-yr,其中yr表示参考信号;

第一步:设计虚拟控制量 为其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示参考信号的导数, 表示复合扰动的估计值,k1>0和Lf1>0为设计参数;

设计一阶滤波器为

其中τ2>0为滤波器参数;

设计补偿信号z1为

其中z2在下一步设计中给出;

定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中τd>0为在

线数据采集区间;

设计神经网络自适应更新律为其中λ1>0,kω1>0和δf1>0为设计参数;

设计扰动观测器为

其中 L1>0为扰动观测器参数;

第i步:定义跟踪误差为 设计虚拟控制量 为其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,ki>0和Lfi>0为设计参数;

设计一阶滤波器为

其中τi+1>0为滤波器参数;

设计补偿信号zi为

定义补偿后跟踪误差为vi=ei-zi,设计集总预测误差为 其中设计神经网络自适应更新律为其中λi>0,kωi>0和δfi>0为设计参数;

设计扰动观测器为

其中 Li>0为扰动观测器参数;

第n步:定义跟踪误差为 设计实际系统输入u为其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,kn>0和Lfn>0为设计参数;

设计补偿信号zn为

定义补偿后跟踪误差为vn=en-zn,设计集总预测误差为 其中设计神经网络自适应更新律为其中λn>0,kωn>0和δfn>0为设计参数;

设计扰动观测器为

其中 Ln>0为扰动观测器设计参数;

步骤3:根据得到的控制输入u,返回到严格反馈系统的动力学模型(1),对参考信号yr进行跟踪控制。

说明书 :

基于集总复合估计的严格反馈系统神经网络控制方法

技术领域

[0001] 本发明涉及一种神经网络控制方法,特别是涉及一种基于集总复合估计的严格反馈系统神经网络控制方法,属于智能控制方法领域。

背景技术

[0002] 反步法控制被广泛应用于严格反馈系统,但是在传统设计中存在“复杂度爆炸”问题,因此动态面设计以及指令滤波设计被应用降低设计复杂度。针对非线性严格反馈系统的设计由于非线性存在,智能控制技术得到广泛关注。现在多数已有智能控制研究基于跟踪误差进行权重更新,仅保证闭环系统的稳定性,难以实现预期的非线性估计效果。
[0003] 《Composite Learning Control of MIMO Systems With Applications》(B Xu,Y Shou,《IEEE Transactions on Industrial Electronics》,2018年,第65卷第8期)一文针对多输入多输出的严格反馈系统研究了基于在线数据学习的控制方法。论文在反步法的框架下设计控制器,基于在线数据构建预测误差以设计神经网络自适应更新律,实现了系统的快速稳定控制。但是,当不确定系统具有时变扰动时,扰动会破坏神经网络的学习性能,系统将无法准确逼近未知系统动力学,因而难以保证控制性能。

发明内容

[0004] 要解决的技术问题
[0005] 为解决具有外界干扰的不确定反馈系统中未知动态和时变扰动的问题,本发明提出了一种基于集总复合估计的严格反馈系统神经网络控制方法,该方法基于反步法的框架,采用神经网络来估计系统的非线性函数,同时利用扰动观测器处理由神经网络近似误差和时变扰动所形成的复合扰动,然后基于两种估计信息形成集总预测误差,并应用到神经网络和扰动观测器的更新律中,最后将控制输入前馈到系统的动力学模型中。
[0006] 技术方案
[0007] 一种基于集总复合估计的严格反馈系统神经网络控制方法,其特征在于步骤如下:
[0008] 步骤1:考虑严格反馈系统动力学模型:
[0009]
[0010] 其中 i=1,…,n,u∈R表示系统输入,y∈R表示系统输出, 表示关于 的未知光滑函数, 表示已知非零函数,di(t)表示时变扰动,满足其中 表示扰动以及扰动变化率上界;
[0011] 步骤2:根据公式(1),定义跟踪误差为e1=x1-yr,其中yr表示参考信号;
[0012] 第一步:设计虚拟控制量 为
[0013]
[0014] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示参考信号的导数, 表示复合扰动的估计值,k1>0和Lf1>0为设计参数;
[0015] 设计一阶滤波器为
[0016]
[0017] 其中τ2>0为滤波器参数;
[0018] 设计补偿信号z1为
[0019]
[0020] 其中z2在下一步设计中给出;
[0021] 定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中τd>0为在
线数据采集区间;
[0022] 设计神经网络自适应更新律为
[0023]
[0024] 其中λ1>0,kω1>0和δf1>0为设计参数;
[0025] 设计扰动观测器为
[0026]
[0027] 其中 L1>0为扰动观测器参数;
[0028] 第i步:定义跟踪误差为 i=2,…,n-1;设计虚拟控制量 为
[0029]
[0030] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,ki>0和Lfi>0为设计参数;
[0031] 设计一阶滤波器为
[0032]
[0033] 其中τi+1>0为滤波器参数;
[0034] 设计补偿信号zi为
[0035]
[0036] 定义补偿后跟踪误差为vi=ei-zi,设计集总预测误差为 其中
[0037] 设计神经网络自适应更新律为
[0038]
[0039] 其中λi>0,kωi>0和δfi>0为设计参数;
[0040] 设计扰动观测器为
[0041]
[0042] 其中 Li>0为扰动观测器参数;
[0043] 第n步:定义跟踪误差为 设计实际控制输入u为
[0044]
[0045] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,kn>0和Lfn>0为设计参数;
[0046] 设计补偿信号zn为
[0047]
[0048] 定义补偿后跟踪误差为vn=en-zn,设计集总预测误差为 其中
[0049] 设计神经网络自适应更新律为
[0050]
[0051] 其中λn>0,kωn>0和δfn>0为设计参数;
[0052] 设计扰动观测器为
[0053]
[0054] 其中 Ln>0为扰动观测器设计参数;
[0055] 步骤3:根据得到的控制输入u,返回到严格反馈系统的动力学模型(1),对参考信号yr进行跟踪控制。
[0056] 有益效果
[0057] 本发明提出的一种基于集总复合估计的严格反馈系统神经网络控制方法,与现有技术相比有益效果为:
[0058] (1)本发明考虑采用神经网络估计系统不确定非线性信息,采用扰动观测器估计系统复合扰动,并基于这两种估计信息构造集总预测误差。
[0059] (2)本发明在神经网络与扰动观测器的更新律中引入集总预测误差用于评价集总估计性能,形成信息交互。
[0060] (3)本发明将神经网络估计和扰动观测估计引入到控制信号中,实现系统集总不确定的有效前馈,可提高系统的跟踪性能。

附图说明

[0061] 图1是本发明基于集总复合估计的严格反馈系统神经网络控制方法的流程图。

具体实施方式

[0062] 现结合实施例、附图对本发明作进一步描述:
[0063] 本发明解决其技术问题采用的技术方案是:一种基于集总复合估计的严格反馈系统神经网络控制方法,通过以下步骤实现:
[0064] (a)考虑严格反馈系统动力学模型:
[0065]
[0066] 其中 i=1,…,n,u∈R表示系统输入,y∈R表示系统输出, 表示关于 的未知光滑函数, 表示已知非零函数,di(t)表示时变扰动,满足其中 表示扰动以及扰动变化率上界。
[0067] (b)根据公式(1),定义跟踪误差为e1=x1-yr,其中yr表示参考信号。
[0068] 第一步:设计虚拟控制量 为
[0069]
[0070] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示参考信号的导数, 表示复合扰动的估计值,k1>0和Lf1>0为设计参数。
[0071] 设计一阶滤波器为
[0072]
[0073] 其中τ2>0为滤波器参数。
[0074] 设计补偿信号z1为
[0075]
[0076] 其中z2在下一步设计中给出。
[0077] 定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中τd>0为在
线数据采集区间。
[0078] 设计神经网络自适应更新律为
[0079]
[0080] 其中λ1>0,kω1>0和δf1>0为设计参数。
[0081] 设计扰动观测器为
[0082]
[0083] 其中 L1>0为扰动观测器参数。
[0084] 第i步:定义跟踪误差为 i=2,…,n-1。设计虚拟控制量 为
[0085]
[0086] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,ki>0和Lfi>0为设计参数。
[0087] 设计一阶滤波器为
[0088]
[0089] 其中τi+1>0为滤波器参数。
[0090] 设计补偿信号zi为
[0091]
[0092] 定义补偿后跟踪误差为vi=ei-zi,设计集总预测误差为 其中
[0093] 设计神经网络自适应更新律为
[0094]
[0095] 其中λi>0,kωi>0和δfi>0为设计参数。
[0096] 设计扰动观测器为
[0097]
[0098] 其中 Li>0为扰动观测器参数。
[0099] 第n步:定义跟踪误差为 设计实际控制输入u为
[0100]
[0101] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,kn>0和Lfn>0为设计参数。
[0102] 设计补偿信号zn为
[0103]
[0104] 定义补偿后跟踪误差为vn=en-zn,设计集总预测误差为 其中
[0105] 设计神经网络自适应更新律为
[0106]
[0107] 其中λn>0,kωn>0和δfn>0为设计参数。
[0108] 设计扰动观测器为
[0109]
[0110] 其中 Ln>0为扰动观测器设计参数。
[0111] (c)根据得到的控制输入u,返回到严格反馈系统的动力学模型(1),对参考信号yr进行跟踪控制。
[0112] 实施例:
[0113] 参照图1,本发明基于集总复合估计的严格反馈系统神经网络控制应用于三阶严格反馈系统中,通过以下步骤实现:
[0114] (a)考虑三阶严格反馈系统动力学模型:
[0115]
[0116] (b)根据公式(1),定义跟踪误差为e1=x1-yr,其中yr=sin(t)表示参考信号。
[0117] 第一步:设计虚拟控制量 为
[0118]
[0119] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量,表示参考信号的导数, 表示复合扰动的估计值,k1=3,Lf1=1。
[0120] 设计一阶滤波器为
[0121]
[0122] 其中τ2=0.05为滤波器参数。
[0123] 设计补偿信号z1为
[0124]
[0125] 其中z2在下一步设计中给出。
[0126] 定义补偿后跟踪误差为v1=e1-z1,设计集总预测误差为 其中τd=
0.05s为在线数据采集区间。
[0127] 设计神经网络自适应更新律为
[0128]
[0129] 其中λ1=0.1,kω1=40,δf1=0.001。
[0130] 设计扰动观测器为
[0131]
[0132] 其中 L1=10为扰动观测器参数。
[0133] 第2步:定义跟踪误差为 设计虚拟控制量 为
[0134]
[0135] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,k2=3,Lf2=1。
[0136] 设计一阶滤波器为
[0137]
[0138] 其中τ3=0.05为滤波器参数。
[0139] 设计补偿信号z2为
[0140]
[0141] 定义补偿后跟踪误差为v2=e2-z2,设计集总预测误差为 其中
[0142] 设计神经网络自适应更新律为
[0143]
[0144] 其中λ2=0.1,kω2=40,δf2=0.001。
[0145] 设计扰动观测器为
[0146]
[0147] 其中 L2=10为扰动观测器参数。
[0148] 第3步:定义跟踪误差为 设计实际控制输入u为
[0149]
[0150] 其中 表示神经网络最优权重的估计值, 表示神经网络基函数向量, 表示虚拟控制量的导数, 表示复合扰动的估计值,k3=3,Lf3=10。
[0151] 设计补偿信号z3为
[0152]
[0153] 定义补偿后跟踪误差为v3=e3-z3,设计集总预测误差为 其中
[0154]
[0155] 设计神经网络自适应更新律为
[0156]
[0157] 其中λ3=0.1,kω3=40,δf3=0.001。
[0158] 设计扰动观测器为
[0159]
[0160] 其中 L3=10为扰动观测器参数。
[0161] (c)根据得到的控制输入u,返回到严格反馈系统的动力学模型(1),对参考信号yr进行跟踪控制。
[0162] 本发明基于反步法的框架,采用神经网络来估计系统的非线性函数,利用扰动观测器处理由神经网络近似误差和时变扰动所形成的复合扰动,利用在线数据的神经网络估计和扰动观测估计构造集总复合估计误差,并设计神经网络和扰动观测器的更新律,最后基于神经网络估计与扰动观测估计设计控制输入。本发明将神经网络学习和扰动观测有机结合,为处理具有时变干扰的严格反馈系统控制提供了有效途径。