一种多智能体自主式跟踪方法、装置及计算机可存储介质转让专利

申请号 : CN201910499778.4

文献号 : CN110275549A

文献日 : 2019-09-24

相似专利: 请登录后查看

本发明涉及一种基于自适应避撞机制的多智能体自主式跟踪方法、装置及计算机可存储介质。本发明通过构建了智能体运动控制代价函数，引入了暴力优化匹配及动态权值策略，描述了一种新颖的动态自适应的多智能体避撞责任划分方法，可大幅降低目标跟踪过程中多智能体避撞速度解集出现空集的概率，并通过全局最优控制器同时兼顾多智能体连续探测性能与运动平稳性，从而有效保障多智能体自主式跟踪的连续性与稳定性。

1.一种基于自适应避撞机制的多智能体自主式跟踪方法，其特征在于，所述方法包括：获取当前时刻目标智能体的期望速度；

根据所述期望速度计算所述目标智能体的动态自适应避撞权值；

根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集；

若所述目标智能体与参考智能体之间的避撞速度可行集为非空集，则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集；

若所述最终速度可行集为非空集，则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性；

根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集；

根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：若所述避撞速度可行集是空集，则控制所述目标智能体停止运动并获取下一时刻目标智能体的期望速度，并执行所述根据所述期望速度计算所述目标智能体的动态自适应避撞权值、所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集，直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。

3.如权利要求1或2所述的方法，其特征在于，构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数，包括:根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数；

根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。

4.如权利要求3所述的方法，其特征在于，所述根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集，包括：基于所述跟踪代阶函数与所述运动平稳代阶函数，通过暴力匹配模型最小化计算智能体运动控制解集，其中，所述暴力匹配模型包括所述目标智能体的避撞责任权值。

5.如权利要求3所述的方法，其特征在于，所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集，包括：根据所述目标智能体与参考智能体之间的相对期望速度，得到最短路径向量，所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值；

根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集；

根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集；

根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。

6.如权利要求5所述的方法，其特征在于,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。

7.如权利要求5所述的方法，其特征在于，所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集，包括：从所述避撞速度可行集中挑选出满足预设约束条件的元素，并得到所述最终速度可行集。

8.一种基于自适应避撞机制的多智能体自主式跟踪装置，其特征在于：所述装置包括获取模块、第一计算模块、第二计算模块、第三计算模块、第四计算模块、第一判断模块、第二判断模块、构建模块、控制模块，其中：所述获取模块，用于获取当前时刻目标智能体的期望速度；

所述第一计算模块，用于根据所述期望速度计算所述目标智能体的动态自适应避撞权值；

所述第二计算模块，用于根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集；

所述第一判断模块，用于判断出所述目标智能体与参考智能体之间的避撞速度可行集是否是空集；

所述第三计算模块，用于当所述第一判断模块判断所述目标智能体与参考智能体之间的避撞速度可行集为非空集时，根据所述避撞速度可行集计算所述目标智能体的最终速度可行集；

所述第二判断模块，用于判断所述最终速度可行集是否为空集；

所述构建模块，用于当所述第二判断模块判断出所述最终速度可行集为非空集时，构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性；

所述第四计算模块，用于根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集；

所述控制模块，用于根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

9.一种基于自适应避撞机制的多智能体自主式跟踪装置，其特征在于，所述装置包括：存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1-7任一项所述的基于自适应避撞机制的多智能体自主式跟踪方法。

10.一种计算机可存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-7任一项所述的基于自适应避撞机制的多智能体自主式跟踪方法。

一种多智能体自主式跟踪方法、装置及计算机可存储介质

技术领域

[0001] 本申请实施例涉及计算机技术领域，特别是涉及一种基于自适应避撞机制的多智能体自主式跟踪方法、装置及计算机可存储介质。

背景技术

[0002] 目前，基于智能体的自动跟踪技术在机场、商店、剧院、交通路口等众多场景中具有广泛应用前景。通过多智能体的协同控制以及有效的信息交互反馈，基于视频传感器的自主式跟踪目的在于对感兴趣目标实施连续高精度定位，同时能够尽可能持续探测目标形状、大小等重要特征。然而，在移动视频传感器目标追踪过程中，智能体的移动受限于自身探测方式、观测区域及运动模式，且与目标实时运动特征密切关联，尤其当多个智能体在同一场景中执行任务且各自跟踪对应的目标时，若多目标的运动路径发生交叉，则很可能导致多智能体相互碰撞或目标丢失现象。

[0003] 目前，大多数避撞方法通过智能体之间的相对速度来判决，为各智能体解算出安全的运动速度。其中，每个智能体独立计算得到与自身期望速度最为接近的安全速度。例如，某个智能体在运动过程中的单个时刻，若其他智能体没有以相同的方式和路径来执行移动控制，则此智能体能够以期望的速度实施自身运动。在此情况下，假如网络中每个智能体均可以感知到邻居智能体的位置，且预知其期望速度，则此类基于相对速度的避撞方法不需要邻居节点之间进行通信即可以顺利执行协同目标探测与跟踪任务。

[0004] 然而，当环境中智能体或目标密集且交叉运动现象严重时，传统基于相对速度的避撞方法在计算多智能体运动路径的过程中将面临无解的情况，即无法得到能够同时满足所有智能体相互避撞且连续跟踪目标的速度解集。虽然，已有方法通过调整智能体两两之间的速度约束，以便在空集发生的情况下具有至少一个速度解。但是，这种方法虽然缓解了空集问题，但智能体的移动完全依赖于邻近的智能体状况，其运动稳定性难以保障。

发明内容

[0005] 为了解决上述问题，本发明提供了一种基于自适应避撞机制的多智能体自主式跟踪方法、装置及计算机可存储介质，其能够有效保障多智能体自主式跟踪的连续性与稳定性。

[0006] 本发明第一方面公开一种基于自适应避撞机制的多智能体自主式跟踪方法，该方法包括：

[0007] 获取当前时刻目标智能体的期望速度；

[0008] 根据所述期望速度计算所述目标智能体的动态自适应避撞权值；

[0009] 根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集；

[0010] 若所述目标智能体与参考智能体之间的避撞速度可行集为非空集，则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集；

[0011] 若所述最终速度可行集为非空集，则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性；

[0012] 根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集；

[0013] 根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

[0014] 作为一种可选的实施方式，所述方法还包括：

[0015] 若所述避撞速度可行集是空集，则控制所述目标智能体停止运动并获取下一时刻目标智能体的期望速度，并执行所述根据所述期望速度计算所述目标智能体的动态自适应避撞权值、所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集，直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。

[0016] 作为一种可选的实施方式，构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数，包括:

[0017] 根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数；

[0018] 根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。

[0019] 作为一种可选的实施方式，所述根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集，包括：

[0020] 基于所述跟踪代阶函数与所述运动平稳代阶函数，通过暴力匹配模型最小化计算智能体运动控制解集，其中，所述暴力匹配模型包括所述目标智能体的避撞责任权值。

[0021] 作为一种可选的实施方式，所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集，包括：

[0022] 根据所述目标智能体与参考智能体之间的相对期望速度，得到最短路径向量，所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值；

[0023] 根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集；

[0024] 根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集；

[0025] 根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。

[0026] 作为一种可选的实施方式,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。

[0027] 作为一种可选的实施方式，所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集，包括：

[0028] 从所述避撞速度可行集中挑选出满足预设约束条件的元素，并得到所述最终速度可行集。

[0029] 本发明第二方面公开了一种基于自适应避撞机制的多智能体自主式跟踪装置，所述装置包括获取模块、第一计算模块、第二计算模块、第三计算模块、第四计算模块、第一判断模块、第二判断模块、构建模块、控制模块，其中：

[0030] 所述获取模块，用于获取当前时刻目标智能体的期望速度；

[0031] 所述第一计算模块，用于根据所述期望速度计算所述目标智能体的动态自适应避撞权值；

[0032] 所述第二计算模块，用于根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集；

[0033] 所述第一判断模块，用于判断出所述目标智能体与参考智能体之间的避撞速度可行集是否是空集；

[0034] 所述第三计算模块，用于当所述第一判断模块判断所述目标智能体与参考智能体之间的避撞速度可行集为非空集时，根据所述避撞速度可行集计算所述目标智能体的最终速度可行集；

[0035] 所述第二判断模块，用于判断所述最终速度可行集是否为空集；

[0036] 所述构建模块，用于当所述第二判断模块判断出所述最终速度可行集为非空集时，构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性；

[0037] 所述第四计算模块，用于根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集；

[0038] 所述控制模块，用于根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

[0039] 本发明第三方面公开了另一种基于自适应避撞机制的多智能体自主式跟踪装置，该装置包括：

[0040] 存储有可执行程序代码的存储器；

[0041] 与所述存储器耦合的处理器；

[0042] 所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面所述的一种基于自适应避撞机制的多智能体自主式跟踪方法。

[0043] 本发明第四方面公开一种计算机可存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明第一方面所述的一种基于自适应避撞机制的多智能体自主式跟踪方法。

[0044] 与现有技术相比，本发明的有益效果为：

[0045] 本发明通过构建了目标智能体的运动控制代价函数，引入了暴力优化匹配及动态权值策略，描述了一种新颖的动态自适应的多智能体避撞责任划分方法，可大幅降低智能体避撞速度解集出现空集的概率，并通过全局最优控制器同时兼顾多智能体连续探测性能与运动平稳性，从而有效保障多智能体自主式跟踪的连续性与稳定性。

附图说明

[0046] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0047] 图1是本发明实施例一公开的一种基于自适应避撞机制的多智能体自主式跟踪方法的流程示意图；

[0048] 图2是本发明实施例二公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图；

[0049] 图3是本发明实施例三公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图；

[0050] 图4是本发明实施例的智能体目标探测示意图。

具体实施方式

[0051] 为了使本技术领域的人员更好地理解本发明的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0052] 本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

[0053] 在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

[0054] 在本发明实施例中，为了便于描述，做以下约定：

[0055] 设定场景中存在M个智能体{s1,s2,...si,...sM}，跟踪M个目标，其中每个智能体自主跟踪一个目标。可以设置i为智能体的序号，n是目标的序号，t为时间步长。每个智能体的半径为r，并且在全局坐标系中具有位置参数pi(t)和速度参数vi(t)。可以设置智能体si与其监测的目标之间的距离为di(t)＝||pn(t)-pi(t)||，智能体的朝向与目标之间的夹角为ψin(t)∈(-π,π]。设定每个智能体装载一个视频传感器，其探测区域为扇形，探测距离为ro，扇形角度为ψo，且传感器的朝向与智能体的朝向相同。对于网络中的某个智能体si，其主要任务就是通过与目标保持特定的距离来持续锁定目标，且同时要避免与其他智能体sj发生碰撞，即任意两个智能体之间的距离随时要满足条件智能体目标探测示意如图4所示。

[0056] 下面将结合具体的实施例方式对本发明进行详细说明。

[0057] 实施例一

[0058] 请参阅图1，图1是本发明实施例一所示的一种基于自适应避撞机制的多智能体自主式跟踪方法的流程示意图，其中，该方法包括如下步骤：

[0059] 101、获取当前时刻目标智能体的期望速度；

[0060] 在本发明实施例中，环境中的多个目标智能体能够基于周围邻居智能体以及自身对应目标的位置关系，且在单个时刻保持平稳运动的条件下计算自身的期望速度，以确保观察目标在自身观测区域内的最佳位置(例如观测区域的中心)。

[0061] 102、根据所述期望速度计算所述目标智能体的动态自适应避撞权值。

[0062] 103、根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。

[0063] 示例性地，假定目标智能体用si表示，参考智能体用sj表示，其中，目标智能体si和参考智能体sj的位置分别为pi和pj，且目标智能体、参考智能体的期望速度分别为和目标智能体与参考智能体的相对速度为v，则对于目标智能体si来说，在时间段τ内由参考智能体sj引起碰撞的速度集为：

[0064]

[0065] 由公式(1)可知，在时间段τ内由目标智能体si不与参考智能体sj不发生碰撞的速度集为：

[0066]

[0067] 即目标智能体si与参考智能体sj，若si选择运动速度且sj选择运动速度为则参考智能体与目标智能体不会发生碰撞。

[0068] 104、若所述目标智能体与参考智能体之间的避撞速度可行集为非空集，则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集。

[0069] 105、若所述最终速度可行集为非空集，则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性。

[0070] 在本发明实施例中，采用类似于汽车的运动模型来描述目标智能体。目标智能体的运动控制Ci(t)由速度vi(t)和转向角并且速度和转向角具有极限值|vi(t)|≤vmax，为了求算目标智能体运动控制解集Ci(t)，首先构建目标跟踪代价函数Cost1(t)和智能体运动平稳代价函数Cost2(t)，其功能分别是保持观察目标在智能体观测区域的中心以及保持智能体运动的平稳性。

[0071] 为计算Cost1(t)、Cost2(t)的解集，先定义距离偏差与观测区域中心的比值为定义角度偏差与观测区域中心的比值为其中，在给定Ci(t)的条件下，基于观察目标的状态和目标智能体的状态，可以计算得到观察目标与目标智能体在t+1时刻的距离din(t+1)和角度ψin(t+1)。

[0072] 具体地，基于距离偏差与观测区域中心的比值计算Cost1(t)，即公式(3)：

[0073]

[0074] 其中exp(·)是以自然常数e为底的指数函数。可见，Cost1(t)＜exp(1)保证了观察目标位于对应的目标智能体探测区域内。若观察目标正好位于探测区域中心，则Cost1(t)取得其最小值，Cost1(t)＝exp(0)＝1。

[0075] 具体地，基于公式(3)以及目标智能体的加速或减速情况，计算Cost2(t)，即公式(4)：

[0076]

[0077] 其中，vmax+||vi(t)||是目标智能体在两个连续时间步长之间运动速度的最大差值。若目标智能体在两个相邻时间步长内没有速度变化，则代价函数取得最小值，即Cost2(t)＝1。

[0078] 106、根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集；

[0079] 107、根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

[0080] 作为一种可选的实施方式，若所述避撞速度可行集是空集，则执行步骤108，即，控制所述目标智能体停止运动并获取下一时刻目标智能体的期望速度，并执行所述根据所述计算所述目标智能体的动态自适应避撞权值、所述根据所述计算所述目标智能体与参考智能体之间的避撞速度可行集，直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。

[0081] 作为一种可选的的实施方式，步骤105包括:

[0082] 根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数；

[0083] 根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。

[0084] 作为一种可选的实施方式，步骤106包括：

[0085] 基于所述跟踪代阶函数与所述运动平稳代阶函数，通过暴力匹配模型最小化计算智能体运动控制解集，其中，所述暴力匹配模型包括所述目标智能体的避撞责任权值。

[0086] 具体地，有公式(3)和公式(4)计算Ci(t)，即公式(5)：

[0087] Ci(t)＝argminc(ωCost1(t)+(1-ω)Cost2(t))………………………(5)；

[0088] 其中，权值ω∈[0.5,1]，在本发明实施例中，优选可以将ω设置为0.5。需要说明的是，可以根据观察目标是否在目标智能体观测区域内来调整ω的大小。比如，若是智能体已经丢失目标，则其主要任务是要尽可能重新捕获目标，此时不考虑运动是否平稳，将ω设置为1。而当目标位于智能体观测区域内，则智能体的主要任务是在保障运动平稳的条件下尽可能将目标位于探测中心，此时，可将ω设置为0.6，这样一来，就能够较好地保障两个代价函数之间的权衡。

[0089] 作为一种可选的实施方式，步骤103包括：

[0090] 根据所述目标智能体与参考智能体之间的相对期望速度，得到最短路径向量，所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值；

[0091] 根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集；

[0092] 根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集；

[0093] 根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。

[0094] 具体地，定义为目标智能体si关于参考智能体sj的相对期望速度，ui,j为到速度集边界的最短路径向量，其中，最短路径向量表示在时间段τ内智能体si与sj能够实现避免碰撞的最小相对速度变化值。再具体地，定义ni,j为向量的外法线向量。另一方面，设定目标智能体和参考智能体在避撞过程中均分担部分责任，不防设置与分别为目标智能体si与sj在相互避撞过程中承担的责任权值，且有其中，责任权值用于表示避撞过程中对相对期望速度的调整程度，目标智能体si通过补偿向量ui,j而实现逃离碰撞圈。

[0095] 具体地，所述目标智能体的预选避撞速度可行集为：

[0096]

[0097] 具体地，根据公式(6)同理可得所述参考智能体的预选避撞速度可行集为[0098] 具体地，假定为满足智能体速度/加速度限制及非完整性约束条件下的运动速度集，其中，对于目标智能体si，其需要避免碰撞的智能体集合为则可计算得到其对应的

[0099] 具体地，可根据公式(7)计算所述目标智能体与参考智能体之间的避撞速度可行集，即：

[0100]

[0101] 作为一种可选的实施方式,所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。

[0102] 具体地，定义所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率为：

[0103]

[0104] 其中，“|·|”表示集合的基数。考虑到目标智能体和参考智能体的公平性，通过计算最优相互避撞可行速度解的平均比率来获得目标智能体si为避撞参考智能体sj的动态自适应避撞权值，即：

[0105]

[0106] 其中：

[0107]

[0108] 同理，可计算得到参考智能体sj为避撞目标智能体si的自适应责任权值其中，且或可以为负数。

[0109] 作为一种可选的实施方式，所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集，包括：

[0110] 从所述避撞速度可行集中挑选出满足预设约束条件的元素，并得到所述最终速度可行集。

[0111] 综上，本发明通过获知网络中多智能体与多目标的位置和速度状态，并得到各智能体的期望速度，进而计算动态自适应的避撞责任权值进而计算目标智能体与参考智能体之间的避撞速度集和进而根据和得到约束条件下目标智能体的可行速度集进而建立目标跟踪代价函数Cost1(t)和智能体运动平稳代价函数Cost2(t)，进而通过暴力优化匹配方法实现目标智能体的运动控制解集，最终降低目标智能体的避撞速度可行集出现空集的几率，进而提高多智能体连续探测性能与运动平稳性，从而有效保障多智能体自主式跟踪的连续性与稳定性。

[0112] 实施例二

[0113] 请参阅图2，图2是本发明实施例二公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图。如图2所示，该装置可以包括获取模块201、第一计算模块202、第二计算模块203、第三计算模块204、第四计算模块205、第一判断模块206、第二判断模块207、构建模块208、控制模块209，其中：

[0114] 所述获取模块201，用于获取当前时刻目标智能体的期望速度，需要说明的是获取模块201执行完毕后可触发第一计算模块202启动。

[0115] 所述第一计算模块202，用于根据所述期望速度计算所述目标智能体的动态自适应避撞权值，要说明的是第一计算模块202执行完毕后可触发第二计算模块203启动。

[0116] 所述第二计算模块203，用于根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集，需要说明的是，第二计算模块203可触发第一判断模块206启动。

[0117] 所述第一判断模块206，用于判断出所述目标智能体与参考智能体之间的避撞速度可行集是否是空集。

[0118] 所述第三计算模块204，用于当所述第一判断模块206判断所述目标智能体与参考智能体之间的避撞速度可行集为非空集时，根据所述避撞速度可行集计算所述目标智能体的最终速度可行集，需要说明的是，第一判断模块206执行完毕后，可触发第二判断模块207启动。

[0119] 所述第二判断模块207，用于判断所述最终速度可行集是否为空集；

[0120] 所述构建模块208，用于当所述第二判断模块207判断出所述最终速度可行集为非空集时，构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性，需要说明的是，构建模块208执行完毕后，可触发第四计算模块205启动。

[0121] 所述第四计算模块205，用于根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集，需要说明的是，第四计算模块205执行完毕后，可触发控制模块209启动。

[0122] 所述控制模块209，用于根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

[0123] 在一些实施方式中，第一判断模块206还用于当判断出所述避撞速度可行集是空集，则触发控制模块209控制所述目标智能体停止运动，并触发获取模块201获取下一时刻目标智能体的期望速度，并触发第一计算模块202执行所述根据所述期望速度计算所述目标智能体的动态自适应避撞权值，并触发第二计算模块203执行所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集，直至所述目标智能体与参考智能体之间的避撞速度可行集为非空集。

[0124] 在一些实施方式中，构建模块208执行所述目标智能体的跟踪代阶函数与运动平稳代阶函数的具体方式为：

[0125] 根据所述观察目标的当前位置与所述观测区域中心之间的位置偏差计算所述跟踪代阶函数；

[0126] 根据所述目标智能体的实时速度变化状态及所述跟踪代阶函数计算所述运动平稳代阶函数。

[0127] 在一些实施方式中，第四计算模块205执行所述根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集的具体方式为：

[0128] 基于所述跟踪代阶函数与所述运动平稳代阶函数，通过暴力匹配模型最小化计算智能体运动控制解集，其中，所述暴力匹配模型包括所述目标智能体的避撞责任权值。

[0129] 在一些实施方式中，第二计算模块203执行所述根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集的具体方式为：

[0130] 根据所述目标智能体与参考智能体之间的相对期望速度，得到最短路径向量，所述最短路径向量表示在预设时间段内所述目标智能体与所述参考智能体能够实现避免碰撞的最小相对速度变化值；

[0131] 根据所述最短路径向量计算所述目标智能体的预选避撞速度可行集；

[0132] 根据所述最短路径向量计算所述参考智能体的预选避撞速度可行集；

[0133] 根据所述目标智能体的预选避撞速度可行集、所述参考智能体的预选避撞速度可行集、所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集。

[0134] 在一些实施方式中，所述动态自适应避撞权值通过所述目标智能体的预选避撞速度可行集与所述参考智能体的预选避撞速度可行集的比率确定。

[0135] 在一些实施方式中，第三计算模块204执行所述根据所述避撞速度可行集计算所述目标智能体的最终速度可行集的具体方式为：

[0136] 从所述避撞速度可行集中挑选出满足预设约束条件的元素，并得到所述最终速度可行集。

[0137] 本发明实施例的装置通过执行基于自适应避撞机制的多智能体自主式跟踪方法，能够降低目标智能体的避撞速度可行集出现空集的几率，进而提高智能体连续探测性能与运动平稳性，从而有效保障智能体自主式跟踪的连续性与稳定性。

[0138] 实施例三

[0139] 请参阅图3，图3是本发明实施例三公开的一种基于自适应避撞机制的多智能体自主式跟踪装置的结构示意图。如图3所示，该装置可以包括：

[0140] 存储有可执行程序代码的存储器301；

[0141] 与存储器301耦合的处理器302；

[0142] 处理器302调用存储器301中存储的可执行程序代码，执行以下步骤：

[0143] 获取当前时刻目标智能体的期望速度；

[0144] 根据所述期望速度计算所述目标智能体的动态自适应避撞权值；

[0145] 根据所述动态自适应避撞权值计算所述目标智能体与参考智能体之间的避撞速度可行集；

[0146] 若所述目标智能体与参考智能体之间的避撞速度可行集为非空集，则根据所述避撞速度可行集计算所述目标智能体的最终速度可行集；

[0147] 若所述最终速度可行集为非空集，则构建所述目标智能体的跟踪代阶函数与运动平稳代阶函数,所述跟踪代阶函数用于控制观察目标始终在所述目标智能体的观测区域中心，所述运动平稳代阶函数用于控制所述目标智能体运动的平稳性；

[0148] 根据所述跟踪代阶函数与所述运动平稳代阶函数计算所述目标智能体的运动控制解集；

[0149] 根据所述运动控制解集控制所述目标智能体跟踪所述观察目标。

[0150] 需要说明的是，处理器302调用存储器301中存储的可执行程序代码，执行如实施例一所描述的基于自适应避撞机制的多智能体自主式跟踪方法中的其他步骤。

[0151] 本发明实施例的装置通过执行基于自适应避撞机制的多智能体自主式跟踪方法，能够降低多智能体的避撞速度可行集出现空集的几率，进而提高智能体连续探测性能与运动平稳性，从而有效保障多智能体自主式跟踪的连续性与稳定性。

[0152] 实施例四

[0153] 本发明实施例四公开了一种计算机可读存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行实施例一所描述的基于自适应避撞机制的多智能体自主式跟踪方法中的步骤。

[0154] 本发明实施例的计算机可读存储介质通过执行基于自适应避撞机制的多智能体自主式跟踪方法，能够降低目标智能体的避撞速度可行集出现空集的几率，进而提高智能体连续探测性能与运动平稳性，从而有效保障智能体自主式跟踪的连续性与稳定性。

[0155] 实施例五

[0156] 本发明实施五公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一所描述的基于自适应避撞机制的多智能体自主式跟踪方法中的步骤。

[0157] 本发明实施例的计算机程序产品通过执行基于自适应避撞机制的多智能体自主式跟踪方法，能够降低目标智能体的避撞速度可行集出现空集的几率，进而提高智能体连续探测性能与运动平稳性，从而有效保障智能体自主式跟踪的连续性与稳定性。

[0158] 在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

[0159] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

[0160] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

[0161] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

[0162] 以上对本发明实施例进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

一种多智能体自主式跟踪方法、装置及计算机可存储介质转让专利

申请号 : CN201910499778.4

文献号 : CN110275549A

文献日 : 2019-09-24

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 刘瑜 , 李岩山 , 王海鹏

申请人 : 深圳大学

摘要 :

权利要求 :

说明书 :