水下自主航行器深度和纵向解耦控制方法及系统转让专利
申请号 : CN202110324567.4
文献号 : CN113050666B
文献日 : 2022-05-03
发明人 : 边有钢 , 张俊杰 , 徐彪 , 秦兆博 , 秦洪懋 , 秦晓辉 , 谢国涛 , 王晓伟 , 胡满江 , 李崇康 , 丁荣军
申请人 : 湖南大学
摘要 :
权利要求 :
1.一种基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,包括建模步骤S0,所述建模步骤S0对水下自主航行器进行动力学建模,使得所述模型符合水下自主航行器的动力学特性,且适于采用于模型预测控制,所述建模步骤S0具体包括:步骤S01,对于水下自主航行器建立深度和纵向速度耦合的系统模型如下:各符号表示的意义如下:
z——深度;
u——纵向速度;
θ——俯仰角;
q——俯仰角速度;
X|u|u——计算流体阻力的系统水动力系数;
——计算横向惯性力矩的加速度水动力系数;
——计算纵向惯性力的加速度水动力系数;
Mq——俯仰角速度水动力系数;
Xwq——垂向速度俯仰角速度水动力系数;
Mw——垂向速度水动力系数;
——舵角水动力系数;
Iy——沿横向轴的转动惯量;
zg——重心在垂直方向的位置;
zb——浮力中心在垂直方向的位置;
W——重力;
B——浮力;
δs——与深度控制相关的舵角,即垂直舵角;
T——纵向推力;
m——水下自主航行器的质量;
步骤S02,将上述系统模型分解为纵向速度控制子系统模型和深度控制子系统模型,纵向速度控制子系统模型为:深度控制子系统模型为:
步骤S03,确定水下自主航行器系统状态向量y、水下自主航行器的深度控制子系统状态向量x,水下自主航行器的速度控制子系统状态向量u,其中,水下自主航行器的系统状态向量y=[z,θ,q,u],水下自主航行器的深度控制子系统状态向量x=[z,θ,q],水下自主航行器的速度控制子系统状态向量u=[u],用x(k),y(k),u(k)分别表示上述状态向量在任意离散时刻k的值,步骤S04,用采样时间Δt离散化上述状态向量,步骤S04包括下述步骤:步骤S041,将深度控制子系统状态向量用采样时间Δt离散化,得到:即:x(k+1)=f[x(k),u(k),δs(k)],步骤S042,将速度控制子系统状态向量用采样时间Δt离散化,得到:即:u(k+1)=g[x(k),u(k),T(k)],步骤S043,将系统状态向量用采样时间Δt离散化,得到:即:y(k+1)=h[x(k),u(k),δs(k),T(k)]。
2.如权利要求1所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,利用建模步骤S0中建立的模型以及离散化的状态向量表达式,对解耦的纵向速度控制子系统模型和深度控制子系统模型,分别以舵角δs和纵向推力T为控制输入量,构建优化问题,分别获取舵角δs和纵向推力T的最优控制输入,并以所述最优控制输入控制水下自主航行器。
3.如权利要求1所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,
采样水下自主航行器的参数,基于采样参数和离散公式,获取水下自主航行器在未来最大预测步长Np个时刻内的预测状态,把上一离散时刻求得的预测最优状态序列内的纵向速度序列作为深度控制子系统中纵向速度的值,对深度控制子系统进行优化来求解未来Np个时刻内的最优控制舵角输入序列,
同时,把上一离散时刻求得的预测最优状态序列内的俯仰角序列作为纵向速度控制子系统中的对应量的值,对纵向速度控制子系统进行优化来求解未来Np个时刻内的最优控制纵向推力输入序列,
以所述最优控制舵角输入序列的第一个值、所述最优控制纵向推力输入序列的第一个值来控制水下自主航行器,输入序列的其他值用于生成水下自主航行器在后续未来Np个时刻的预测最优状态序列,并重新采样再获取预测最优状态序列,如此循环,直至完成控制任务。
4.如权利要求1‑3中任一项所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,包括下述的控制步骤:步骤S1,在t=t0的起始时刻,采样水下自主航行器的状态,并对水下自主航行器系统进行初始化,
采样的参数如下:
y(0)=[z(0),θ(0),q(0),u(0)],或者,表示为y(t)=[z(t),θ(t),q(t),u(t)],其中,t=t0,对水下自主航行器系统的初始化包括:获取水下自主航行器在未来Np个时刻内的预测最优状态 及
其中,Np为最大预测步长,为大于等于1的自然数,所述Np个时刻为t=t0+1*Δt,t0+2*Δt,…,t0+k*Δt,…,t0+(Np‑1)*Δt,t0+Np*Δt,Δt为采样周期或采样时间间隔,表示在时刻t对时刻t之后k步的预测最优值,或(t+k*Δt)时刻的预测最优值,
其中, 分别为水下自主航行器的深度、俯仰角、俯仰角速度、和纵向速度的预测最优值,
步骤S2,对深度控制子系统和纵向速度控制子系统分别构建优化问题,即构建对深度控制子系统的最优控制优化问题Pd(t),以及构建对纵向速度控制子系统的最优控制优化问题Pl(t),
对于Pd(t),把 作为深度控制子模型中时刻t之后NP个离散时刻纵向速度的预测值,以舵角输入作为变量,以舵角最小、与预测最优状态 的状态偏离最小、以及/或者与预设约束状态之间的偏差最小为优化目的,以便获取舵角最优控制输入序列,对于Pl(t),把 中的俯仰角序列作为纵向速度控制子模型中时刻t之后NP个离散时刻俯仰角的预测值,以纵向推力输入作为变量,以纵向推力最小、与预测最优状态 的状态偏离最小、以及/或者与预设约束状态(参考轨迹)之间的偏差最小为优化目的,以便获取纵向推力最优控制输入序列,步骤S3,求解优化问题,获取最优控制输入序列,具体地,通过求解优化问题Pd(t),获取舵角最优控制输入序列,获取的舵角最优控制输入序列=[δs(0|t),δs(1|t),…,δs(k|t),…,δs(Np‑1|t)],通过求解优化问题Pl(t),获取纵向推力最优控制输入序列,获取的纵向推力最优控制输入序列=[T(0|t),T(1|t),…,T(k|t),…,T(Np‑1|t)],步骤S4,将步骤S3获取的舵角最优控制输入序列的第一个值δs(0|t)和纵向推力最优控制输入序列的第一个值T(0|t)作为真实控制量作用于水下自主航行器,基于步骤S3获取的本采样周期的最优控制舵角输入值序列的值,确定下一采样周期的舵角预设序列如下,
* * * *
[δs (0|t+Δt),δs (1|t+Δt),…,δs (k|t+Δt),…,δs (Np‑1|t+Δt)]=[δs(1|t),…,δs(k|t),…,δs(Np‑1|t),δs(Np|t)=设定舵角值],基于步骤S3获取的本采样周期的最优控制纵向推力输入值序列的值,确定下一采样周期的纵向推力预设序列如下,* * * *
[T(0|t+Δt),T (1|t+Δt),…,T (k|t+Δt),…,T(Np‑1|t+Δt)]=[T(1|t),…,T(k|t),…,T(Np‑1|t),T(Np|t)=设定纵向推力值],步骤S5,经过一个采样周期后,t=t+Δt,再次采样水下自主航行器状态,得到采样的参数y(t)=[z(t),θ(t),q(t),u(t)],基于采样的参数、当前采样周期的预设控制输入序列,利用离散公式y(k+1)=h[x(k),u(k),δs(k),T(k)],获取水下自主航行器在未来Np个时刻内的预测最优状态 及然后,转步骤S2。
5.如权利要求4所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,
在步骤S1中,直接给定与起始时刻对应的采样周期的预设控制输入序列,然后,基于采样的参数、直接给定的预设控制输入序列,利用离散公式y(k+1)=h[x(k),u(k),δs(k),T(k)],获取水下自主航行器在未来Np个时刻内的预测最优状态 及 或者
在步骤S1中,根据经验值,或者根据所要跟踪的轨迹,直接给定水下自主航行器在未来Np个时刻内的预测最优状态 及
6.如权利要求4所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,
在步骤S2中,构建对深度控制子系统的最优控制优化问题Pd(t)如下:其中, 为待优化的代价函数,为待优化的代价函数的表达式,为预测舵角输入,在最优控制优化问题Pd(t)的优化过程中为待优化的变量,为t时刻之后的第k个预测舵角输入,是待优化的变量,通过变化 的取值,从而计算最小的代价函数,xp为深度控制子系统状态向量的预测值,在优化过程中,其值根据 而变化,xa为深度控制子系统状态向量的假设值或比较基准值,xa为深度控制子系统状态向量的假设值或比较基准值,xr为所述控制方法所跟踪的跟踪轨迹yr的子集,跟踪轨迹yr(t)=[zr(t),θr(t),qr(t),ur(t)]=[xr(t),ur(t)],跟踪轨迹yr(t)包含了每个时刻水下自主航行器的理想状态,其中,xr(k|t)=xr(t+k),ur(k|t)=ur(t+k),上述优化问题Pd(t)应满足:xp(0|t)=x(t),其中,
为舵角输入约束,
为水下自主航行器的垂向状态约束,代表对控制输入的惩罚,
代表对预测状态与参考状态误差的惩罚,代表预测状态与跟踪轨迹误差的惩罚Rd、Fd和Gd为权重系数,对于矩阵X,定义P范数:
7.如权利要求4所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制方法,其特征在于,
在步骤S2中,构建对纵向速度控制子系统的最优控制优化问题Pl(t)如下:其中, 为待优化的代价函数,p
ll(up,T ,ua,ur;k|t)为待优化的代价函数的表达式,p
T为预测纵向推力输入,在最优控制优化问题Pl(t)的优化过程中为待优化的变量,p p
T (k|t)为纵向速度控制子系统在t时刻之后的第k个预测纵向推力输入,T (k|t)是待p
优化的变量,通过变化T(k|t)的取值,从而计算最小的代价函数,p
up为纵向速度控制子系统状态向量的预测值,在优化过程中,其值根据T而变化,ua为纵向速度控制子系统状态向量的假设值或比较基准值,ur为所述控制方法所跟踪的跟踪轨迹yr的子集,跟踪轨迹yr(t)=[zr(t),θr(t),qr(t),ur(t)]=[xr(t),ur(t)],跟踪轨迹yr(t)包含了每个时刻水下自主航行器的理想状态,其中,xr(k|t)=xr(t+k),ur(k|t)=ur(t+k),上述优化问题Pl(t)应满足:up(0|t)=u(t),其中,
为纵向速度控制子系统的输入约束,为水下自主航行器纵向状态约束,代表对控制输入的惩罚,
代表对预测状态与参考状态误差的惩罚,代表预测状态与跟踪轨迹误差的惩罚,Rl、Gl和Fl是权重系数,对于矩阵或参数X,定义P范数:
8.一种基于模型预测控制的水下自主航行器深度和纵向解耦控制系统,其特征在于,所述基于模型预测控制的水下自主航行器深度和纵向解耦控制系统包括数据解耦计算单元,
所述数据解耦计算单元采用的纵向速度控制子系统模型为:深度控制子系统模型为:
各符号表示的意义如下:
z——深度;
u——纵向速度;
θ——俯仰角;
q——俯仰角速度;
X|u|u——计算流体阻力的系统水动力系数;
——计算横向惯性力矩的加速度水动力系数;
——计算纵向惯性力的加速度水动力系数;
Mq——俯仰角速度水动力系数;
Xwq——垂向速度俯仰角速度水动力系数;
Mw——垂向速度水动力系数;
——舵角水动力系数;
Iy——沿横向轴的转动惯量;
zg——重心在垂直方向的位置;
zb——浮力中心在垂直方向的位置;
W——重力;
B——浮力;
δs——与深度控制相关的舵角,即垂直舵角;
T——纵向推力;
m——水下自主航行器的质量;
水下自主航行器的系统状态向量y=[z,θ,q,u],水下自主航行器的深度控制子系统状态向量x=[z,θ,q],水下自主航行器的速度控制子系统状态向量u=[u],用x(k),y(k),u(k)分别表示上述状态向量在任意离散时刻k的值;
所述数据解耦计算单元具体还用于用采样时间Δt进行离散化,具体包括下述步骤:步骤S041,将深度控制子系统状态向量用采样时间Δt离散化,得到:即:x(k+1)=f[x(k),u(k),δs(k)],步骤S042,将速度控制子系统状态向量用采样时间Δt离散化,得到:即:u(k+1)=g[x(k),u(k),T(k)],步骤S043,将系统状态向量用采样时间Δt离散化,得到:即:y(k+1)=h[x(k),u(k),δs(k),T(k)]。
9.如权利要求8所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制系统,其特征在于,采用权利要求1‑7中任一项所述的方法来进行深度与纵向解耦控制。
10.如权利要求8所述的基于模型预测控制的水下自主航行器深度和纵向解耦控制系统,其特征在于,进一步包括水平舵角控制单元,用于控制水平舵角。
说明书 :
水下自主航行器深度和纵向解耦控制方法及系统
技术领域
背景技术
深远的应用价值与研究意义。
度控制成为人们研究的热点问题。
种基于神经网络的控制方法来解决不确定海流扰动带来的控制难题;清华大学的专利“基
于深度强化学习的自主水下航行器轨迹跟踪控制方法”(专利号:CN201810535773.8)提出
了一种基于深度强化学习的轨迹跟踪控制方法,可以使AUV不受到历史轨迹的影响;西北工
业大学的专利“基于分层分布式模型预测控制的AUV编队协同控制方法”(专利号:
CN201611163767.1)提出了一种基于分层分布式的模型预测控制方法,将AUV分为运动学模
型和动力学模型两层,从而实现分层的多AUV分布式控制。
情况下AUV滑模控制算法,使其在有限时间内,在多重扰动下实现全局稳定。Haoliang Wang
等在论文“Adaptive Cooperative Diving of Saucer‑Type Underwater Gliders
Subject to Model Uncertainties and Input Constraints”中提出了一种处理模型不确
定性的自适应方法。除此之外,基于神经网络、模糊控制和模型预测控制等的方法也被应用
到了AUV的运动控制中。Chao Shen等在论文“Model Predictive Control for an AUV
with Dynamic Path Planning”中提出了一种动态路径规划和模型预测控制共同作用的方
法,来解决复杂环境下AUV规划和控制的问题。
发明内容
进行动力学建模,使得所述模型符合水下自主航行器的动力学特性,且适于采用于模型预
测控制,所述建模步骤S0具体包括:
和纵向推力T为控制输入量,构建优化问题,分别获取舵角δs和纵向推力T的最优控制输入,
并以所述最优控制输入控制水下自主航行器。
入序列,
控制纵向推力输入序列,
个时刻的预测最优状态序列,并重新采样再获取预测最优状态序列,如此循环,直至完成控
制任务。
给定,仅仅用于给两个子系统的耦合变量赋值,从而解耦两个子系统,进而求取最优的舵角
输入及推力输入。
优化问题Pl(t),
或者与预设约束状态之间的偏差最小为优化目的,以便获取舵角最优控制输入序列,
的状态偏离最小、以及/或者与预设约束状态之间的偏差最小为优化目的,以便获取
纵向推力最优控制输入序列,
迹;或者可以是要求在某些时间段中,处于设定的深度,或者处于设定的位置,或者而处于
设定的纵向速度,或者要求在特定的时间段或特定的区域纵向推力小于设定值。
其他预设约束状态的情况下,所述惩罚取值为0。
所述惩罚取值为0。
如δs(Np|t)设置为等于零,以便于快速实现优化收敛,以较快的计算速度或效率实现舵角最
小的优化目标;或者δs(Np|t)设置为等于已经确定的δs(Np‑1|t),从而,有利于增进运行中
舵角的稳定。需要指出的是,δs(Np|t)的值仅仅是一个给出的假定初始值,最终的输出舵角
取决于优化的结果。
设置,例如T(Np|t)可以设置为等于零,以便于快速实现优化收敛,以较快的计算速度或效
率实现纵向推力最小的优化目标;或者T(Np|t)设置为等于已经确定的T(Np‑1|t),从而,有
利于增进运行中纵向推力的稳定。需要指出的是,T(Np|t)的值仅仅是一个给出的假定初始
值,最终的输出纵向推力取决于优化的结果。
结束控制;否则继续进行。
或者在设定的时长内,无法完成优化而求解出相应的最优控制输入序列。
(k+1)=h[x(k),u(k),δs(k),T(k)],获取水下自主航行器在未来Np个时刻内的预测最优状
态 及 或者
述优化问题Pd(t)满足:
是其他与舵角相关的约束。
与舵角相关的约束。
是待优化的变量,通过变化T(k|t)的取值,从而计算最小的代价函数,
态传感器单元、数据解耦计算单元、优化控制计算单元和控制执行单元等,
计算单元和数据解耦计算单元,
和深度控制子模型,并生成两个子系统的最优化问题,
AUV运动,并将得到的最优控制输入传输到控制执行单元和数据解耦计算单元中,用于下一
周期的预测及优化。
控制方法,可以采用任何适当的控制方法,例如可以借鉴在路面上行驶的车辆的横向运动
控制方法。
实时性。
附图说明
具体实施方式
系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有
特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
下智能武器等高科技,主要用于海洋科学考察及水下搜救工作。军事上则能够用于反潜战、
水雷战、侦察与监视和后勤支援等领域。
得到了很好的应用。
控制过程中的计算,提高了运算效率,有利于保证控制的实时性。
述模型符合水下自主航行器的动力学特性,且适于采用于模型预测控制方法来进行控制。
和纵向推力T为控制输入量,构建优化问题,分别获取舵角δs和纵向推力T的最优控制输入,
并以所述最优控制输入控制水下自主航行器。
入序列,
控制纵向推力输入序列,
个时刻的预测最优状态序列,并重新采样再获取预测最优状态序列,如此循环,直至完成控
制任务。
节系统参数。
及构建对纵向速度控制子系统的最优控制优化问题Pl(t)。
及/或者与预设约束状态之间的偏差最小为优化目的,以便获取舵角最优控制输入序列。
的状态偏离最小、以及/或者与预设约束状态之间的偏差最小为优化目的,以便获取
纵向推力最优控制输入序列。
独立的两个子模型,可以分别进行优化求解。
迹;或者可以是要求在某些时间段中,处于设定的深度,或者处于设定的位置,或者而处于
设定的纵向速度,或者要求在特定的时间段或特定的区域纵向推力小于设定值。
其他预设约束状态的情况下,所述惩罚取值为0。
所述惩罚取值为0。
如δs(Np|t)设置为等于零,以便于快速实现优化收敛,以较快的计算速度或效率实现舵角最
小的优化目标;或者δs(Np|t)设置为等于已经确定的δs(Np‑1|t),从而,有利于增进运行中
舵角的稳定。需要指出的是,δs(Np|t)的值仅仅是一个给出的假定初始值,最终的输出舵角
取决于优化的结果。
设置,例如T(Np|t)可以设置为等于零,以便于快速实现优化收敛,以较快的计算速度或效
率实现纵向推力最小的优化目标;或者T(Np|t)设置为等于已经确定的T(Np‑1|t),从而,有
利于增进运行中纵向推力的稳定。需要指出的是,T(Np|t)的值仅仅是一个给出的假定初始
值,最终的输出纵向推力取决于优化的结果。
及
结束控制;否则继续进行。
或者在设定的时长内,无法完成优化而求解出相应的最优控制输入序列。
(k+1)=h[x(k),u(k),δs(k),T(k)],获取水下自主航行器在未来Np个时刻内的预测最优状
态 及 或者
是其他与舵角相关的约束。
与舵角相关的约束。
是待优化的变量,通过变化T(k|t)的取值,从而计算最小的代价函数,
态传感器单元、数据解耦计算单元、优化控制计算单元和控制执行单元等,
计算单元和数据解耦计算单元,
和深度控制子模型,并生成两个子系统的最优化问题,
AUV运动,并将得到的最优控制输入传输到控制执行单元和数据解耦计算单元中,用于下一
周期的预测及优化。
元等。状态传感器单元与优化控制计算单元连接,优化控制计算单元与数据解耦计算单元
和控制执行单元连接。状态传感器探测此时的AUV状态,输入到优化控制计算单元,优化控
制计算单元将得到的最优控制输入传输到控制执行单元和数据解耦计算单元中,控制执行
单元驱动AUV运动,数据解耦计算单元根据最优控制输入计算未来的预测状态,从而解耦两
个子系统。该系统可支持上述方法的具体实施。
控制方法,可以采用任何适当的控制方法,例如可以借鉴在路面上行驶的车辆的横向运动
控制方法。
实时性。
其中部分技术特征进行等同替换;这些修改或者替换,并不使相应技术方案的本质脱离本
发明各实施例技术方案的精神和范围。