多智能体系统跟踪控制方法、智能体和程序产品转让专利

申请号 : CN202311537876.5

文献号 : CN117250998B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王薇武相铠吕金虎王磊高庆

申请人 : 北京航空航天大学

摘要 :

本发明公开了一种多智能体系统跟踪控制方法、智能体和程序产品。该方法中,根据自身以及自身全部入‑邻居的本地信号估计值计算第一本地信号估计误差,根据自身的本地信号估计值以及本地信号真实值计算第二本地信号估计误差,根据第一本地信号估计误差和第二本地信号估计误差计算自身的本地信号估计器值对时间的导数,其中,如果本地信号真实值未知则第二本地信号估计误差为缺省值,本地信号真实值用于表征虚拟领导者的速度和加速度整体的上界;根据本地信号估计误差的范数判断向自身的全部出‑邻居发送当前自身的本地信号估计器值的第二类数据发送时刻。在本地信号真实值仅部分智能体已知且单向通信的严苛条件下,依然能够(56)对比文件J. Desai 等.Controlling formations ofmultiple mobile robots", Proc. IEEE Int.Conf. Robot. Autom., pp. 2864-2869, 1998.2. M. Egerstedt, X. Hu and A. Stotsky, "Control of mobile platforms using avirtual vehicle approach", IEEE Trans.Autom. Control, vol. 46, no. 46, pp.1777-1782, Nov. 2001. 3. M. Egerstedt andX. Hu, "Formation constrained multi-agentcontrol", IEEE Trans. Robot. Autom., vol.17, no. 6, pp. 947-951, Dec. 2001. 4. P.O”gren, M. Egerstedt and X. Hu, "Acontrol Lyapunov function approach tomulti-agent coordination", IEEE Trans.Robot. Autom., vol. 18, no. 5, pp. 847-851, Oct. 2002. 5. N. Leonard and E.Fiorelli, "Virtual leaders artificialpotentials and coordinated control ofgroups", Proceedings of the IEEEConference on Decision and Control, Dec.2001. 6. J. Corfmat and A. Morse, "Decentralized control of linearmultivariate systems", Automatica, vol.12, pp. 476-495, 1976. 7. J. Desai, J. P.Ostrowski and V. Kumar, "Modeling andcontrol of formations of nonholonomicmobile robots. IEEE Trans. Robot.2001,全文.洪亮 等.一种基于定向天线的蜂群组网邻居发现算法.西北工业大学学报.2020,(第01期),

权利要求 :

1.一种多智能体系统跟踪控制方法,其特征在于,所述多智能体系统的通信拓扑表示为包含至少1棵有向生成树的有向图,至少1棵有向生成树的根节点对应的智能体已知虚拟领导者的实时运动信息以及本地信号真实值,针对所述多智能体系统中任一个智能体的控制方法包括:估计自身以及自身全部入‑邻居的运动状态,得到自身以及自身全部入‑邻居的状态估计值;

计算自身的状态估计值与自身的状态值之间的差异程度,得到自身的事件触发误差;

根据自身的状态值以及自身全部入‑邻居的状态估计值计算编队状态误差,以及根据自身的状态值以及虚拟领导者的实时运动状态计算对虚拟领导者的跟踪状态误差,根据编队状态误差和跟踪状态误差计算事件触发滑模误差,其中,如果虚拟领导者的实时运动信息未知则跟踪状态误差为缺省值;

根据自身以及自身全部入‑邻居的本地信号估计值计算第一本地信号估计误差,根据自身的本地信号估计值以及本地信号真实值计算第二本地信号估计误差,根据第一本地信号估计误差和第二本地信号估计误差计算自身的本地信号估计器值对时间的导数,其中,如果本地信号真实值未知则第二本地信号估计误差为缺省值,本地信号真实值用于表征虚拟领导者的速度和加速度整体的上界;

计算自身的本地信号估计器值与自身的本地信号估计值的差,得到本地信号估计误差,根据本地信号估计误差的范数判断向自身的全部出‑邻居发送当前自身的本地信号估计器值的第二类数据发送时刻,并将该时刻的本地信号估计器值作为自身更新后的本地信号估计值;

根据自身的全局拓扑信息、自身的事件触发误差、自身的本地信号估计器值、自身的事件触发滑模误差判断向自身的全部出‑邻居发送自身的状态值的第一类数据发送时刻;

根据自身的事件触发滑模误差、本地信号估计器值生成控制输入,以调控自身的运动状态。

2.根据权利要求1所述的方法,其特征在于,自身的全局拓扑信息是智能体自身根据自身的事件触发误差、出‑邻居数、本地信号估计器值估算得到的。

3.根据权利要求2所述的方法,其特征在于,自身的全局拓扑信息包括第一全局拓扑信息 和第二全局拓扑信息m,下标i表示自身的编号,二者定义如下,, ;

其中,P为对角矩阵且表示为 ,定义列向量q为 ,

为所述有向图的拉普拉斯矩阵, , 为对角矩阵,对角元素为自身入度, 为所述有向图的邻接矩阵, ,N为智能体的数量,如果 则 ,否则 ,是有向图边的集合, 是有向图的节点集合, 是矩阵Q的最小特征值, ,dj是智能体j的入度, ,对角线元素为1表示对

应下标的智能体已知虚拟领导者的实时运动信息,对角线元素为0表示对应下标的智能体未知虚拟领导者的实时运动信息;

初始时刻第一全局拓扑信息的估算值大于0,其对时间的导数与自身的事件触发误差的二阶范数的平方成正比关系,初始时刻第二全局拓扑信息的估算值大于0,其对时间的导数与自身的出度、自身事件触发误差的二阶范数、自身的本地信号估计器值的二阶范数三者的乘积成正比关系。

4.根据权利要求1所述的方法,其特征在于,本地信号真实值记为F, 是 的上界,是设定系数,是虚拟领导者的速度,是虚拟领导者的加速度;

自身的本地信号估计器值 对时间的导数 按照如下公式确定

其中,如果 则 ,否则 , 是有向图边的集合, 是有

向图的节点集合,是智能体i的本地信号估计值, 是智能体j的本地信号估计值,如果智能体i已知本地信号真实值则 =1,否则 =0。

5.根据权利要求4所述的方法,其特征在于,第二类数据发送时刻的触发条件为:,其中, 为本地信号估计误差, ,t为时间,为设

定正值常数, 为随时间指数衰减函数。

6.根据权利要求1所述的方法,其特征在于,自身的事件触发滑模误差记为 ,, 为设定系数, ,,如果 则 ,否则 , 是有向图边的集合,

是有向图的节点集合;

pi是智能体i的位置值,是智能体i的编队参数, 是智能体i对智能体j位置的状态估计值,是智能体j的编队参数,如果智能体i已知虚拟领导者的实时运动信息则 =1,否则=0,是虚拟领导者的实时位置信息,vi是智能体i的速度值, 是智能体i对智能体j速度的状态估计值,是虚拟领导者的实时速度信息。

7.根据权利要求6所述的方法,其特征在于,第一类发送时刻的触发条件为;其中,m2和m1为设定常数,m2>m1>0,c为设定的正值常数,自身的全局拓扑信息包括第一全局拓扑信息 和第二全局拓扑信息m,下标i表示自身的编号,二者定义如下,, ;

其中,P为对角矩阵且表示为 ,定义列向量q为

, 为所述有向图的拉普拉斯矩阵, , 为对角矩阵,

对角元素为自身入度, 为所述有向图的邻接矩阵, ,N为智能体的数量,如果则 ,否则 , 是有向图边的集合, 是有向图的节点集合, 是矩阵Q的最小特征值, , ,对角线元素

为1表示对应下标的智能体已知虚拟领导者的实时运动信息,对角线元素为0表示对应下标的智能体未知虚拟领导者的实时运动信息,dj是智能体j的入度;ri是自身的事件触发误差,是智能体i自身的出度,是自身的本地信号估计器值, 是自身的事件触发滑模误差,是设定正值常数, 是随时间指数衰减函数。

8.根据权利要求1所述的方法,其特征在于,根据自身的事件触发滑模误差、本地信号估计器值生成控制输入,包括:根据自身的事件触发滑模误差、本地信号估计器值以及干扰估计值生成控制输入;

其中,x和y方向的干扰估计值 表示为:

其中, 是已知光滑非线性函数,

是被估计的未知的常数向量,mi,x和mi,y是正整数,下标i为自身的编号;

Mi是自身质量,ui,x、ui,y依次是自身沿x和y轴方向的控制输入,pi,x、pi,y依次是自身沿x和y轴方向的位置,vi,x、vi,y依次是自身沿x和y轴方向的速度。

9.一种智能体,其特征在于,包括存储器和处理器,存储器存储程序,处理器运行该程序以执行权利要求1至8中任一项所述的方法。

说明书 :

多智能体系统跟踪控制方法、智能体和程序产品

技术领域

[0001] 本发明涉及一种多智能体系统跟踪控制方法、智能体和程序产品。

背景技术

[0002] 智能体例如是无人车、无人船、无人机、仿生昆虫等。多智能体构成的系统执行跟踪任务时,需要克服未知干扰的影响。出于安全方面的因素,在一些场景中,多智能体之间的通信是单向的,并且虚拟领导者的实时位置、速度、加速度等信息仅对部分智能体开放。在这些严苛的要求下,如何实现多智能体系统对虚拟领导者的跟踪控制,是本领域技术人员需要克服的技术问题。
[0003] 中国专利CN111665848A研究了拓扑切换下无人机与无人车异构集群编队跟踪控制方法。对于通信不是双向的,并且仅部分智能体已知虚拟领导者的实时信息以及本地信号真实值的严苛条件下,如何实现编队跟踪任务,并没有相关报道。

发明内容

[0004] 本发明提供一种多智能体系统跟踪控制方法、控制器、智能体和程序产品,以至少部分解决现有技术中存在的技术问题。
[0005] 本发明提供如下技术方案: 一种多智能体系统跟踪控制方法,所述多智能体系统的通信拓扑可表示为包含至少1棵有向生成树的有向图,至少1棵有向生成树的根节点对应的智能体已知虚拟领导者的实时运动信息以及本地信号真实值,针对所述多智能体系统中任一个智能体的控制方法包括:
[0006] 估计自身以及自身全部入‑邻居的运动状态,得到自身以及自身全部入‑邻居的状态估计值;
[0007] 计算自身的状态估计值与自身的状态值之间的差异程度,得到自身的事件触发误差;
[0008] 根据自身的状态值以及自身全部入‑邻居的状态估计值计算编队状态误差,以及根据自身的状态值以及虚拟领导者的实时运动状态计算对虚拟领导者的跟踪状态误差,根据编队状态误差和跟踪状态误差计算事件触发滑模误差,其中,如果虚拟领导者的实时运动信息未知则跟踪状态误差为缺省值;
[0009] 根据自身以及自身全部入‑邻居的本地信号估计值计算第一本地信号估计误差,根据自身的本地信号估计值以及本地信号真实值计算第二本地信号估计误差,根据第一本地信号估计误差和第二本地信号估计误差计算自身的本地信号估计器值对时间的导数,其中,如果本地信号真实值未知则第二本地信号估计误差为缺省值,本地信号真实值用于表征虚拟领导者的速度和加速度整体的上界;
[0010] 计算自身的本地信号估计器值与自身的本地信号估计值的差,得到本地信号估计误差,根据本地信号估计误差的范数判断向自身的全部出‑邻居发送当前自身的本地信号估计器值的第二类数据发送时刻,并将该时刻的本地信号估计器值作为自身更新后的本地信号估计值;
[0011] 根据自身的全局拓扑信息、自身的事件触发误差、自身的本地信号估计器值、自身的事件触发滑模误差判断向自身的全部出‑邻居发送自身的状态值的第一类数据发送时刻;
[0012] 根据自身的事件触发滑模误差、本地信号估计器值生成控制输入,以调控自身的运动状态。
[0013] 本发明提供如下技术方案:一种智能体,包括存储器和处理器,存储器上存储程序,处理器运行该程序以执行前述的方法。
[0014] 本发明提供如下技术方案:一种程序产品,其在处理器上运行时执行前述的方法。
[0015] 本发明的技术方案中,多智能体系统在执行编队跟踪任务时,即使通信不是双向的,并且仅部分智能体已知虚拟领导者的实时信息以及本地信号真实值的严苛条件下,依然能够完成编队跟踪任务。在进一步优选的技术方案中,即使全局的通信拓扑模型对于各个智能体均是未知的情况下,依然能够完成编队跟踪任务。在进一步优选的技术方案中,即使存在未知干扰,依然能够完成编队跟踪任务。

附图说明

[0016] 图1是本发明的多智能体系统跟踪控制方法的流程示意图。
[0017] 图2是本发明一实施例的多智能体系统的通信拓扑图。
[0018] 图3是图2所示多智能体系统执行跟踪任务的位置变化以及跟踪误差随时间的变化图。
[0019] 图4是图2所示多智能体系统执行跟踪任务的轨迹,t为时间。
[0020] 图5是图2所示多智能体系统发送状态值的触发时刻。
[0021] 图6是图2所示多智能体系统发送本地信号估计器值的时刻。
[0022] 图7是本发明实施例的智能体的控制器的结构示意图。

具体实施方式

[0023] 下面结合具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。
[0024] 本部分以智能体为无人车为例进行介绍,但智能体的种类不限于此。并且智能体的运动可以是在地面、水面也可以是在三维空间。
[0025] 以下是多智能体系统跟踪控制方法的设计思路。本发明中符号上的单个点表示对时间求导,符号上的两个点表示对时间求二次导数。
[0026] 对多无人车系统建立运动学模型、通信拓扑模型以及编队模型。
[0027] 多无人车系统的运动学模型为:
[0028]
[0029] 其中, 是多无人车系统中第i个无人车在地面坐标系Oxy中的坐标位置, 是多无人车系统中第i个无人车的速度, 是无
人车的动力,是需要进行设计的控制输入,Mi是无人车i的质量, 是无人
车在环境中受到的干扰,假设在x和y两个方向的干扰分别可以被一组已知函数和未知参数表示,即:
[0030] ;
[0031] 其中, 是已知光滑非线性函数,是未知的常数向量。mi,x和mi,y是正整数。
[0032] 本发明讨论基于领导者‑跟随者的多无人车编队模型。即多无人车系统内的所有无人车均为跟随者,它们都需要以特定编队跟踪一个虚拟领导者。虚拟领导者是提前设计好的参考轨迹,用 进行表示。本发明中t均表示时间。本发明要求(即位置、速度、加速度)都是有界并且是分段连续的。
[0033] 对多无人车系统建立通信拓扑模型。
[0034] 无人车之间的通信拓扑关系可以用含有N个节点的有向图 来描述,其中是节点集合,代表每一个无人车, 是不同无人车之间边的集合。
意味着无人车j可以获取到无人车i的信息,并称无人车j是无人车i的一个出‑邻
居,无人车i是无人车j的一个入‑邻居。定义无人车i的入‑邻居集为
、出‑邻居集为 。定义 分别是无人车i的入‑邻
居数(入度)和出‑邻居数(出度)。aij定义参考下文。需要注意的是,本发明考虑通信拓扑为有向图的情形,因此无人车j可以获取到无人车i的信息,不意味着无人车i可以获取到无人车j的信息。同时,不考虑(i,i)的情况,因此 。根据以上通信拓扑关系,定义邻接矩阵 ,其中如果 ,那么 ,否则 。通信拓扑的入度矩阵 被定
义为一个对角矩阵,其对角元素定义为di。接着定义有向图的拉普拉斯矩阵为 。
[0035] 从无人车i到无人车j的一条有向路径是一段连续边的序列 。如果一个有向图存在一个节点,并且以这个节点作为起点,这个节点与有向图里其他任何一个节点都存在一条以该节点为起点的有向路径,则称这个有向图含有一棵有向生成树,这一节点被称为根节点。本发明中,假设无人车的通信拓扑是一棵含有向生成树的有向图,并且至少有一个根节点可以获取到虚拟领导者的相关实时运动信息 ,并
用 表示无人车i可以获取到虚拟领导者的实时运动信息, 表示无人车i不能获取
到虚拟领导者的实时运动信息,但 表示的无人车i的已知信息是虚拟领导者的实时运动信号 是有界的,但具体的上界未知。并记矩阵 ,对角
线元素为1表示对应下标的智能体已知虚拟领导者的实时运动信息(必然也已知实时运动信息的上界),对角线元素为0表示对应下标的智能体未知虚拟领导者的实时运动信息。
[0036] 根据通信拓扑图,定义列向量 和对角矩阵,并可以计算得到矩阵 用于后续的设计和分
析。这3个量均包含了通信拓扑信息以及虚拟领导者的实时运动信息是否能够被获取的信息。
[0037] 对多无人车系统建立编队。
[0038] 多无人车系统中的跟随者需要以特定编队跟踪虚拟领导者的参考轨迹,对每个无人车提前设计好已知的编队参数 。其中hi,x、hi,y均是常数,并且可以被其出‑邻居所获取。最终对无人车i而言,实现的编队效果应为:
[0039] 。
[0040] 为每个无人车设计状态观测器,状态观测器例如是一个实时运行的进程。状态观测器估计自身以及自身全部入‑邻居的运动状态,得到自身以及自身全部入‑邻居的状态估计值。
[0041] 状态观测器会受到邻居无人车通信时传输数据的影响。记 满足是无人车i的向出‑邻居无人车传输当前自身状态值(具体为位置
和速度)的时刻序列。 是初始时刻, 代表着无人车i第ki次向它的出‑邻居无人车传输当前自身的状态值 的时刻。对于无人车i而言,其接收到的来自于其入‑邻居无
人车的状态数据 只会在时刻 进行更新,并且其值 中的速度项
在时刻 将保持不变。
[0042] 对于无人车i,其需要对自己和它的所有入‑邻居设计一个状态观测器,具体如下所示:
[0043] 。
[0044] 状态观测器认为在2次状态值更新的时刻之间,无人车i及其所有入‑邻居的速度是不变的,从而根据各个无人车的速度估计值 ,进而得到各个无人车的位置估计值。 表示位置估计值对时间求导, 表示速度估计值对时间求导。
[0045] 设计状态观测器可以为后续多无人车系统实现渐近跟踪编队控制做好准备。并记无人车i的事件触发误差为 ,这一信号反映的是无人车i当前运动状态和从上次触发时刻起推断的自身状态(状态估计值)之间的差距。该表达式中,事件触发误差综合了位置误差和速度误差两个信息。进一步,事件触发误差也可以是综合位置误差的绝对值与速度误差的绝对值这两个信息。
[0046] 为各个无人车设计事件触发滑模误差。
[0047] 首先为每个无人车设计位置和速度的事件触发一致性误差,表达式如下:
[0048] ;
[0049] pi是智能体i的位置值,是智能体i的编队参数, 是智能体i对智能体j位置的状态估计值, 是智能体j的编队参数,如果智能体i已知虚拟领导者的实时运动信息则 =1,否则 =0,是虚拟领导者的实时位置信息,vi是智能体i的速度值, 是智能体i对智能体j速度的状态估计值,是虚拟领导者的实时速度信息。
[0050] 表示无人车i的位置值及其全部入‑邻居的位置估计值与预期的编队位置之间整体的关于位置的编队状态误差, 表示无人车i如果已知
虚拟领导者实时运动信息,那么还需要计算无人车i相对于虚拟领导者之间的关于位置的跟踪状态误差, 综合了这两个信息。
[0051] 表示无人车i的速度值与其全部入‑邻居的速度估计值之间整体的关于速度的编队状态误差, 表示无人车i如果已知虚拟领导者实时运动信息,那么
还需要计算无人车i相对于虚拟领导者之间的关于速度的跟踪状态误差, 综合了这两个信息。
[0052] 接着可以为各个无人车定义事件触发滑模误差如下:
[0053] ;
[0054] 其中, 是一个可以设计的常数。事件触发滑模误差这一信号将用于后续的无人车控制器设计之中。事件触发滑模误差例如是由运行在每一个无人车上的一个进程实时计算得到的。无人车i的事件触发滑模误差反应了无人车i及其入‑邻居的位置、速度与预期的编队跟踪状态的误差。
[0055] 为每个无人车设计本地信号估计器,本地信号估计器例如是每一个无人车上的一个实时运行的进程。本地信号估计器的输出定义为本地信号估计器值。
[0056] 记 是信号 的上界,F的具体值对于 的无人车i而言是未知的。为了实现对虚拟领导者pr(t)的渐近跟踪,此处需要为每个无人车设计一个本地的信号估计器 用于估计常数F。由于此估计器的构建也许需要进行信号传输,因此,记
满足 是无人车i的向出‑邻居无人车传输当前
相关信号估计器 的时刻序列。 是初始时刻, 代表着无人车i第ki,F次向它的
出‑邻居无人车传输自身的本地信号估计值 的时刻。对于无人车i而言,其接收到的来自于其入‑邻居无人车本地信号估计值 只会在时刻 进行更新,并且其值
在时刻 将保持不变,并简记为 。
[0057] 无人车i本地信号估计器设计具体如下所示:
[0058] ;
[0059] 是智能体i的本地信号估计值, 是智能体j的本地信号估计值,如果智能体i已知本地信号真实值则 =1,否则 =0。
[0060] 为第一本地信号估计误差, 为第二本地信号估计误差。
[0061] 是无人车i对F的本地信号估计器值对时间的导数,它综合了自身的已知信息以及其全部入‑邻居已知的信息。是无人车i上一次对F的估计值,是无人车j上一次对F的估计值。
[0062] 0时刻,所有无人车的本地信号估计器值可以设置为0。
[0063] 并记无人车i的本地信号估计误差为 。这一信号反映的是无人车i当前本地信号估计器值和上次触发时刻本地信号估计器值(即本地信号估计值,该值在没有通信事件触发时保持不变)之间的差距。
[0064] 为每个无人车设计全局信息估计器。全局信息估计器也是实时运行的,其输出是对自身的全局拓扑信息的估算值。
[0065] 为了避免无人车在设计控制器和事件触发通信时用到有关整个多无人车系统的全局信息(例如多无人车系统中的无人车总数、多无人车系统拉普拉斯矩阵的特征值等),需要为每个无人车设计全局信息估计器 ,分别用于估计与全局相关的信息和 , 是矩阵Q的最小特征值。无人车i的全局信息
估计器的设计如下所示:
[0066] ;
[0067] 其中, 均是可调整的正值常数, 越大,全局信息估计器的效果越显著,但是控制器会越大; 越小,全局信息估计器的效果越不显著,但是控制器会越小,满足m2和m1为设定常数,m2>m1>0。在一个实例中,m2=33,m1=32。 是无人车i的出‑邻居数目(出度),0时刻 和 零时刻的值可以设置为任意一个大于0的常数,没有其他限制。这2个物理量包含拓扑通信图的相关参数,在智能体数量足够多的时候,这些参数对于一个智能体而言是难以获取的。
[0068] 为每个无人车设计事件触发通信规则。
[0069] 为了减少通信次数,对于状态值的传输通道,设定无人车i当前的状态值pi(t)、vi(t)如果和状态估计器得出的状态估计值 差距过大,则无人车i才将当前时刻的状态值传递给其出‑邻居,具体表示为:
[0070] ;
[0071] 其中, 是一个可调的常数参数,大于0即可。 越大,通信次数越少,但控制性能越差, 越小,通信次数越多,但控制性能越好。函数 是一个指数衰减函数,其中也是一个可调的参数,大于0即可。 越大,通信次数越多,但一致跟踪效果越明显;越小,通信次数越少,但一致跟踪效果越差。
[0072] 满足m2和m1为设定常数,m2>m1>0。在一个实例中,m2=33,m1=32。c是设定的正值常数。与前文中的c为同一数值。
[0073] 同理,对于本地信号估计器这一信息传输通道,设定无人车i当前的本地信号估计器得出的本地信号估计器值 如果和上次触发时刻的本地信号估计值 差距过大,则无人车i才将当前时刻本地信号估计器值传递给其出‑邻居,具体表示为:
[0074] ;
[0075] 其中, 是一个可调的常数参数,大于0即可。 越大,通信次数越少,但本地信号估计器收敛效果越差, 越小,通信次数越多,但本地信号估计器收敛效果越好。函数是一个指数衰减函数,其中 也是一个可调的参数,大于0即可。 越大,通信次数越多,但本地信号估计器收敛效果越好; 越小,通信次数越少,但本地信号估计器收敛效果越差。
[0076] 事件触发通信规则的设计可以有效降低无人车之间的通信次数。
[0077] 为每个无人车设计分布式一致性跟踪控制器和自适应律。
[0078] 为每个无人车i设计控制器如下:
[0079] ;
[0080] 其中, , 是用于估计未知参数的参数估计器,设计自适应律如下所示:
[0081]
[0082] ;
[0083] ,sgn(x)的定义为: 。
[0084] 注:各变量下标x表示x轴方向,下标y表示y轴方向。
[0085] 设计自适应律可以有效应对环境干扰中存在的未知参数,有效解决干扰中的未知参数与多无人车系统之间单向通信产生的耦合问题。
[0086] 综上所述,采取上述设计步骤后,多无人车系统便可以以特定编队在含有干扰的环境下跟踪预先设定好的虚拟领导者。
[0087] 需要说明的是,在另外的一些方案中,未知干扰是忽略的。在另外的一些方案中,全局拓扑信息是已知的。
[0088] 基于以上设计思路,参考图1,可以得到 一种多智能体系统跟踪控制方法,所述多智能体系统的通信拓扑可表示为包含至少1棵有向生成树的有向图,至少1棵有向生成树的根节点对应的智能体已知虚拟领导者的实时运动信息以及本地信号真实值,针对所述多智能体系统中任一个智能体的控制方法包括:
[0089] 步骤101、估计自身以及自身全部入‑邻居的运动状态,得到自身以及自身全部入‑邻居的状态估计值;
[0090] 步骤102、计算自身的状态估计值与自身的状态值之间的差异程度,得到自身的事件触发误差;
[0091] 步骤103、根据自身的状态值以及自身全部入‑邻居的状态估计值计算编队状态误差,以及根据自身的状态值以及虚拟领导者的实时运动状态计算对虚拟领导者的跟踪状态误差,根据编队状态误差和跟踪状态误差计算事件触发滑模误差,其中,如果虚拟领导者的实时运动信息未知则跟踪状态误差为缺省值;
[0092] 步骤104、根据自身以及自身全部入‑邻居的本地信号估计值计算第一本地信号估计误差,根据自身的本地信号估计值以及本地信号真实值计算第二本地信号估计误差,根据第一本地信号估计误差和第二本地信号估计误差计算自身的本地信号估计器值对时间的导数,其中,如果本地信号真实值未知则第二本地信号估计误差为缺省值,本地信号真实值用于表征虚拟领导者的速度和加速度整体的上界;
[0093] 步骤105、计算自身的本地信号估计器值与自身的本地信号估计值的差,得到本地信号估计误差,根据本地信号估计误差的范数判断向自身的全部出‑邻居发送当前自身的本地信号估计器值的第二类数据发送时刻,并将该时刻的本地信号估计器值作为自身更新后的本地信号估计值;
[0094] 步骤106、根据自身的全局拓扑信息、自身的事件触发误差、自身的本地信号估计器值、自身的事件触发滑模误差判断向自身的全部出‑邻居发送自身的状态值的第一类数据发送时刻;
[0095] 步骤107、根据自身的事件触发滑模误差、本地信号估计器值生成控制输入,以调控自身的运动状态。
[0096] 进一步,自身的全局拓扑信息是智能体自身根据自身的事件触发误差、出‑邻居数、本地信号估计器值估算得到的。
[0097] 进一步,步骤107为根据自身的事件触发滑模误差、本地信号估计器值以及干扰估计值生成控制输入。
[0098] 以下,考虑一种场景,现存在3架满足动态为 的无人车。多无人车系统要在存在阻力干扰场景下执行任务。在实施例中,考虑阻力与小车运动速度成正比的情形,但具体的比例系数是未知的。因此,干扰项可以表示为:
[0099] 。
[0100] 即上述方案中的 均为一维的,未知参数也是一维的。
[0101] 现在三辆无人小车均处于地面,其具体的初始位置为,初始速度为 ,需要
以正三角形编队(预先设定编队参数 )按照预先设
定的参考轨迹 在某一区域巡逻。但考虑到巡逻的轨迹信息较为敏
感,仅能由1号我方无人车实时获取( ),而2号和3号无人车是合作方的无
人车,仅用于合作巡逻,其不能直接获取参考轨迹。并且3辆无人车之间的数据通信不是双向的,其通信拓扑图如图2所示。技术方案中涉及到的其他参数设置如下表所示。
[0102]
[0103] 其中需要注意的是, 模拟的是阻力环境下的阻力系数,但是其值对于无人车而言均是未知的。
[0104] 运用MATLAB仿真软件,对上述场景进行仿真,仿真步长10‑5s,仿真总时长25s。
[0105] 仿真效果见图3至图6。图3反应的是三辆无人车分别在x、y轴上的状态变化情况及其跟踪误差,可以看到,各个无人车的跟踪误差渐近收敛到0。其中,pr,x、p1,x、p2,x、p3,x、pr,y、p1,y、p2,y、p3,y依次为虚拟领导者在x方向的坐标、无人车1在x方向的坐标、无人车2在x方向的坐标、无人车3在x方向的坐标、虚拟领导者在y方向的坐标、无人车1在y方向的坐标、无人车2在y方向的坐标、无人车3在y方向的坐标。第i个无人机的跟踪误差δi为 。
[0106] 图4反应的是三辆无人车在2维空间中的运动轨迹,可以看到多无人车最终稳定形成一个正三角形编队,并且按照既定的参考轨迹的路线前进巡逻。
[0107] 图5反应的是无人车在传输状态值的通信传输时刻,图6反应的是无人车在传输本地信号估计器值的通信传输时刻。可以看到其通信量大幅降低,体现了本发明相比于其他发明,在通信资源节省上的优势。其总的通信次数的具体情况如下表所示:
[0108]无人车 无人车1 无人车2 无人车3
通信次数 62 61 59
[0109] 综上所述,本发明不仅可以适用于系统动态中含各类干扰的多无人车系统,还适用于无人车之间无法进行双向通信的场景。本发明所提出的分布式一致性跟踪算法在参考轨迹仅能部分无人车获取的情况下,依旧能实现整个多无人车系统对参考轨迹的渐进跟踪编队控制。同时,本发明中所提出的事件触发通信规则大大降低了多无人车系统之间的通信量,节省了多无人车系统的通信资源。此外,本发明提出的全局信息估计器可以避免无人车在设计控制器和事件触发通信规则时使用到全局信息。
[0110] 基于相同的发明构思,本发明的实施例还提供一种智能体,包括存储器和处理器,存储器上存储程序,处理器运行该程序以执行前述的方法。
[0111] 基于相同的发明构思,本发明的实施例还提供一种程序产品,其在处理器上运行时执行前述的方法。
[0112] 本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
[0113] 本发明的保护范围不限于上述的实施例,显然,本领域的技术人员可以对本发明进行各种改动和变形而不脱离本发明的范围和精神。倘若这些改动和变形属于本发明权利要求及其等同技术的范围,则本发明的意图也包含这些改动和变形在内。