一种基于改进拟态物理法的多智能体系统运动控制方法转让专利

申请号 : CN201910466169.9

文献号 : CN110275527A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 丁勇高振龙何金

申请人 : 南京航空航天大学

摘要 :

本发明公布了一种基于改进拟态物理法的多智能体系统运动控制方法,涉及多智能体协同运动控制领域。所述方法首先建立单个智能体的运动模型,并对多智能体个体的运动规则用拟态物理力的方法进行描述;接着,将拟态物理法与经典聚集、避碰和速度一致规则相结合,同时利用距离和相对速度来计算聚集系数与速度一致系数;然后,利用注意力参数调节调节改进拟态物理法各项的作用效果,使智能体有选择的跟随其他智能体或者目标;最后,通过使用改进拟态物理法对智能体运动进行调节,实现多智能体系统的聚集运动、速度一致和多目标环境下的分群运动。该方法主要解决了经典的多智能体系统运动控制算法在聚集运动过程中出现的边界振荡问题和多目标环境下多智能体系统的分群运动问题。

权利要求 :

1.一种基于改进拟态物理法的多智能体系统运动控制方法,其特征在于,包括以下步骤:步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。

步骤二,根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。

步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象。

步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。

步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。

步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。

步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。

2.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤一中将每个智能体抽象为质点,建立单个智能体的二阶运动模型,具体为:式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。

3.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤二中根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息,具体包括:获取智能体Agenti的邻居序号集Ni为:

Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i}  (2)式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离。

获取邻居智能体的状态信息用元组 表示,为Agentj(j∈Ni)的目标感知状态。当Agentj能感知到目标时, 反之

当目标与智能体的距离 小于智能体的感知距离δ时,表示智能体能感知到目标,则获取目标的位置信息为 这里 表示编号为m的目标Tm位置向量。

4.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤三中根据邻居智能体的状态信息和目标的位置信息选择注意对象选择注意对象,具体为:当智能体Agenti能够感知到目标时,根据目标的位置信息 选择欧氏距离最近的目标作为注意对象 同时设置Agenti的目标感知状态为当智能体Agenti没有感知到目标且邻居智能体Agentj(j∈Ni)的目标感知状态 时,则选择最近的智能体Agentj作为注意对象 同时设置Agenti的目标感知状态为当智能体Agenti既感知不到目标,且其邻居智能体的目标感知状态 均为0时,则令Agenti的注意对象 同时设置Agenti的目标感知状态为

5.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤四中根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数,具体为:式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象 的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子。

6.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤五中利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入,具体包括:(6.1)计算智能体Agenti与邻居智能体Agentj(j∈Ni)的位置差 和速度差 具体为:式中,pj表示编号为j的智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量。

(6.2)计算改进拟态物理法的速度一致项 和避碰项 具体为:

式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rs为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离。

(6.3)计算改进拟态物理法的注意力跟随项 具体为:

式中, 为注意对象 的位置, 为注意对象 的速度向量。显然,当注意对象 为静止目标时,(6.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:式中,αi为注意力参数,表示为:

说明书 :

一种基于改进拟态物理法的多智能体系统运动控制方法

技术领域

[0001] 本发明属于多智能体系统运动控制领域,特别是考虑多个目标环境下的自主分群方法。

背景技术

[0002] 多智能体系统(multi-agent systems,MAS)是由大量简单自主个体组成的自组织群体系统,虽然MAS的基本单位智能水平很低,但是整体却表现出较高的智能水平,能够完成搜索、侦查、救援等复杂的任务,多智能体系统运动控制是多智能体系统应用的基础,即通过自组织的方式实现群体的聚集运动、速度一致以及分群运动。
[0003] 目前的多智能体运动控制算法主要针对聚集运动和速度一致,并以SAC原则为基础出现了大量的分布式集群运动控制算法,如Three-Circle法、人工势场法、社会力模型等。其中SAC原则是指每一个智能体遵循三条简单的规则——避撞(Separation)、对齐(Alignment)和聚集(Cohesion)。Three-Circle法简单且容易理解,但是由于智能体的感知范围被分为三个不连续的区域,因此在聚集过程中容易发生振荡现象。人工势场法通常需要建立全局势场,且存在局部极小值的问题,导致智能体间避碰失败。社会力法不需要全局控制,但由于与人工势场法在本质上是相同的,因此也存在人工势场法局部极小值问题。
[0004] 拟态物理法将个体间的相互作用抽象为物理力,省去了人工势场法的求梯度过程,且不存在人工势场法局部极小值问题,因此广泛应用于多智能体编队及重构、无人机编队、智能车编队等。但是当环境中存在多个目标时,经典的拟态物理法无法实现多智能体系统的分群运动。

发明内容

[0005] 本发明的目的在于提供一种基于改进拟态物理法的多智能体系统运动控制方法,能够实现多智能系统的聚集运动、速度一致和分群运动,解决了经典SAC 算法边界振荡问题和实现了多目标环境下多智能体系统的分群运动。
[0006] 为实现上述目的,本发明采用以下技术方案:
[0007] 一种基于改进拟态物理法的多智能体系统运动控制方法,包括:
[0008] 步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。
[0009] 步骤二,根据智能体感知范围得到智能体的邻居序号集Ni,获取感知范围内邻居智能体的状态信息 以及目标的位置信息
[0010] 步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象 并确定自身的目标感知状态
[0011] 步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数kp、速度一致系数kv和避碰系数kr。
[0012] 步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui。
[0013] 步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。
[0014] 步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。
[0015] 本发明具有以下优点:
[0016] 1.在智能体的感知距离内,同时考虑相对速度与相对位置来计算聚集系数和速度一致系数,实现多智能体系统的聚集运动,解决了经典基于SAC原则的运动控制算法在聚集运动过程中存在的边界振荡问题。
[0017] 2.将拟态物理法与SAC原则相结合,融合聚集区域与速度一致区域,在经典拟态物理法吸引力与排斥力的基础上,增加速度一致作用力,实现了多智能体系统的速度一致运动。
[0018] 3.考虑到多目标情形下多智能体系统的分群运动,将注意力跟随机制与改进拟态物理法相结合,利用注意力参数调节目标点或邻居智能体的作用效果,实现了多智能体系统分群运动。
[0019] 附图表说明
[0020] 图1为本发明方法的流程图。
[0021] 图2为多智能体系统坐标示意图。
[0022] 图3为t=3s和t=9s时多智能体系统群体运动状态。
[0023] 图4为25s内每个智能体的速度方向变化曲线。
[0024] 图5为本发明算法、经典SAC算法、人工势场法、改进的SAC算法一致性指数变化曲线。
[0025] 图6为基于改进拟态物理法的多智能体系统分群运动轨迹。
[0026] 图7为分群运动过程中每个智能体的速度变化曲线。

具体实施方式

[0027] 结合所附图表,对本发明的技术方案作具体说明。
[0028] 如图1所示,本发明的一种基于改进拟态物理法的多智能体系统运动控制方法,具体包括以下步骤:
[0029] 步骤1:将每个智能体抽象为质点,建立单个智能体的二阶运动模型。具体过程为:
[0030] 对智能体所处环境建立笛卡尔坐标系,如图2所示,图中圆圈表示智能体,三角形表示目标,速度向量由箭头表示。设智能体Agenti在环境中的位置为 pi=(xi,yi),速度为目标的位置为 将单个智能体均抽象为质点,其运动模型为:
[0031]
[0032] 式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。
[0033] 步骤2:根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。具体过程为:
[0034] 获取编号为i的智能体Agenti的邻居序号集Ni为:
[0035] Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i}            (2)[0036] 式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj|| 为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离。
[0037] 获取的邻居智能体的状态信息用元组 表示, 为Agentj(j∈Ni)的目标感知状态。当Agentj能感知到目标时, 反之
[0038] 当目标与智能体的距离 小于智能体的感知距离δ时,表示智能体能感知到目标,则获取目标的位置信息为 这里 表示编号为m的目标Tm位置向量。
[0039] 步骤3:根据邻居智能体的状态信息和目标的位置信息选择注意对象 并确定自身的目标感知状态 具体过程为:
[0040] 当智能体Agenti能够感知到目标时,根据目标的位置信息 选择欧氏距离最近的目标作为注意对象 同时设置Agenti的目标感知状态为
[0041] 当智能体Agenti没有感知到目标且邻居智能体Agentj(j∈Ni)的目标感知状态时,则选择最近的智能体Agentj作为注意对象 同时设置Agenti的目标感知状态为[0042] 当智能体Agenti既感知不到目标,且其邻居智能体的目标感知状态 均为0 时,则令Agenti的注意对象 同时设置Agenti的目标感知状态为
[0043] 步骤4:根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。具体为:
[0044]
[0045] 式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象 的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子。
[0046] 步骤5:利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。具体过程为:
[0047] (5.1)计算智能体Agenti与邻居智能体Agentj(j∈Ni)的位置差 和速度差 具体为:
[0048]
[0049] 式中,pj表示智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量。
[0050] (5.2)计算改进拟态物理法的速度一致项 和避碰项 具体为:
[0051]
[0052] 式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rS为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离。
[0053] (5.3)计算改进拟态物理法的注意力跟随项 具体为:
[0054]
[0055] 式中, 为注意对象 的位置, 为注意对象 的速度。显然,当注意对象 为静止目标时,
[0056] (5.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:
[0057]
[0058] 式中,αi为注意力参数,表示为:
[0059]
[0060] 步骤6:根据步骤5计算的控制输入与步骤1单个智能体的运动模型,对智能体进行控制。
[0061] 步骤7:判断每个智能体是否都到达目标点,如果没有,则跳转步骤2进行循环,否则结束运动。
[0062] 采用本发明的上述方案,多智能体系统在运动过程中能够实现多智能体的聚集运动、速度一致和多目标环境下的分群运动。
[0063] 为了验证方法的可行性和有效性,下面结合实例对本发明做进一步详细的描述。
[0064] 在Windows 7操作系统上,使用MATLAB 2013a进行仿真实验。设置规模为20多智能体系统,每个智能体的初始位置在半径为25米的圆形区域内随机选取,初始速度v0设置为单位为m/s。分别针对多智能体系统在连续环境下的聚集与速度一致以及多目标环境下自主分群两种情况进行仿真。仿真每次循环的时间步长为1s,同步更新智能体的状态。
[0065] 表1所示为本发明中改进拟态物理法的参数。
[0066] 表1改进拟态物理法仿真参数
[0067]
[0068] 图3为3s和9s时多智能体系统群体运动状态,图中虚线表示智能体连续3s 的运动轨迹, 和“·”分别表示3s和9s时的智能体。在t=3s时,从虚线所示轨迹可以看出,此时正在发生群体的聚集运动。在t=9s时,虚线所示运动轨迹平稳,同时智能体间保持稳定的距离,多智能体系统完成了聚集运动。
[0069] 图4所示为仿真时长25s得到的每个智能体的速度方向θ的变化曲线,其中θ=arctan(xi/yi)。从图4曲线可以看出,经过大约5s的调整,各个智能体的运动速度基本达成一致,多智能体系统实现了速度一致运动。
[0070] 在仿真过程中,为了定量描述MAS聚集运动和速度一致运动,定义一致性指数C描述了群体运动方向的有序性,具体如下式所示:
[0071]
[0072] 式中,N为多智能体系统中智能体的个数,vi为智能体Agenti的速度,显然, C∈[0,1]。当C→1时,表示多智能体系统运动的一致性越强,反之,则多智能体系统运动的随机性越强。
[0073] 图5所示为本发明提出的改进拟态物理法与经典SAC算法、人工势场法、改进SAC算法的仿真比较。在相同的初始状态下仿真25s,得到一致性指数变化曲线,这里认为当一致性指数C>0.95时即表示多智能体系统实现了速度一致。可以看出,本发明提出的改进拟态物理法得到的一致性指数变化曲线更为平滑,解决了经典SAC算法与基于人工势场的算法存在的振荡问题。
[0074] 为验证本发明一种基于改进拟态物理法的多智能体系统运动控制方法的分群能力,当多智能体系统聚集完成并实现速度一致后,在群体运动路线上随机设置两个目标点。
[0075] 图6所示为本发明提出的基于改进拟态物理法的多智能体系统分群运动轨迹。从图中可以看出,当多智能体系统附近存在多个目标时,由于目标信息迅速在集群内传播,系统中智能体根据自身状态自主地选择注意对象,实现了多智能体系统的分群运动。
[0076] 图7为分群运动过程中每个智能体的速度变化曲线。从图中可以看出,本发明提出的改进拟态物理法不仅很好地实现了多智能体系统的聚集运动、速度一致,还实现了多目标环境下的分群运动,并在分群运动过程中各个子群保持速度一致运动。