一种空地机器人任务动态分配方法、存储介质及终端设备转让专利

申请号 : CN202111332092.X

文献号 : CN114330978B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 涂伟周连杰李清泉张亮张德津王欢周宝定汪驰升

申请人 : 深圳大学

摘要 :

本发明公开了一种空地机器人任务动态分配方法、存储介质及终端设备,其中,方法包括步骤:布局n个用于对m个任务点进行观测的空地机器人,并定义所述空地机器人的观测描述模型,所述空地机器人包括空中机器人和地面机器人,其中,n大于m;基于所述空地机器人的观测描述模型,按照时空特性建立任务点对应的状态模型,基于所述状态模型获取空地机器人执行任务点时的收益模型;基于所述收益模型建立双阶段启发式任务分配策略,完成空地机器人的任务动态分配。本发明提供的空地机器人任务动态分配方法有效地量化了空地机器人和任务之间的收益关系,能够克服时空参数带来的收益计算偏差,从而支撑空地机器人高效完成作业。

权利要求 :

1.一种空地机器人任务动态分配方法,其特征在于,包括步骤:

布局n个用于对m个任务点进行观测的空地机器人,并定义所述空地机器人的观测描述

模型,所述空地机器人包括空中机器人和地面机器人,其中,n大于m,所述空地机器人的观测描述模型包括空中机器人的观测描述模型和地面机器人的观测描述模型,其中,定义空中机器人的观测描述模型为:βaerial=∑α1×raerial+α2×θaeeial+α3×ηaerial,其中,βaerial是用于执行任务时空中机器人的能力指数,α为相关系数,raerial为空中机器人执行任务时的空间分辨率,θaeeial为空中机器人执行观测任务时的倾斜角度,ηaerial为空中机器人执行任务时的空间覆盖范围;定义地面机器人的观测描述模型为:βground=min{α1×rground+α2×ηground,α3×θground,},其中,βground是用于执行任务时地面机器人的能力指数,min{}为选取最小值函数,α为相关系数,rground为地面机器人执行任务时的空间分辨率,θground为地面机器人执行观测任务时的倾斜角度,ηground为地面机器人执行任务时的空间覆盖范围;

基于所述空地机器人的观测描述模型,按照时空特性建立任务点对应的状态模型,基

于所述状态模型获取空地机器人执行任务点时的收益模型;

基于所述收益模型建立双阶段启发式任务分配策略,完成空地机器人的任务动态分

配;

其中,基于所述空地机器人的观测描述模型,按照时空特性建立任务点对应的状态模

型的步骤包括:假设任务空间中包含分布于二维平面上不同位置的m个任务点,定义第i个任务点在时刻t的状态值为Si(t),则第i个任务点的状态模型表示为:其中,Si(0)是第i个目标点的初始状态值(Si(t)

>0),αi是第i个目标点的状态变化率,β j,i 是用于执行第i个任务的第j个空地机器人的能力指数,ni是分配到该任务点的空地机器人的数量,ε是状态阈值;基于所述状态模型获取空地机器人执行任务点时的收益模型为: 其中,dji表示第j个地面机器人距离第i个任务点的空间距离, 表示第j个地面机器人在时刻t执行第i个任务取得的原始收益,所述空间距离为欧式距离、马氏距离或闵科夫斯基距离;

基于所述收益模型建立双阶段启发式任务分配策略,完成空地机器人的任务动态分配

的步骤包括:在第一阶段,计算将第i个空地机器人分配给第j个任务点所获得的收益值矩阵,对于每个任务点,计算各个空地机器人执行所述任务点获得的最大收益值,并按最大收益值由大到小对任务点进行排序,排在前面的任务点优先选择一个对应的空地机器人;对于第j个任务点,从所述收益值矩阵中选择最大值对应的空地机器人与所述第j个任务点匹配;在第一阶段还包括步骤:遍历所有未分配的任务节点,从所述收益值矩阵中选择最大值对应的空地机器人与所述未分配的任务点匹配,直至每一个任务节点至少分配到一个空地机器人;在第二阶段,对于在第一阶段中未分配的空地机器人,计算将其分配给各个任务点所能产生的收益增加值矩阵,对于每个未分配的空地机器人,求得所述收益增加值矩阵中的最大值 和第二大值 之间的差值 将所述未分配的空地机器人按值由大到小优先进行分配排序;对于当前未分配的空地机器人,从所述收益增加值矩阵中选择最大值对应的任务点与所述当前未分配的空地机器人匹配;在第二阶段还包括步骤:遍历所有未分配的空地机器人,根据所述收益增加矩阵选择对应分配的任务点,直至所有未分配的空地机器人全部分配。

2.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1所述空地机器人任务动态分配方法中的步骤。

3.一种终端设备,其特征在于,包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;

所述通信总线实现处理器和存储器之间的连接通信;

所述处理器执行所述计算机可读程序时实现如权利要求1所述空地机器人任务动态分

配方法中的步骤。

说明书 :

一种空地机器人任务动态分配方法、存储介质及终端设备

技术领域

[0001] 本发明涉及任务动态分布技术领域,尤其涉及一种空地机器人任务动 态分配方法、存储介质及终端设备。

背景技术

[0002] 智能无人系统是集机械、电子、控制、传感、人工智能等多学科先进 技术于一体的复杂系统。随着人工智能、精密制造、智能传感技术的发展, 当前智能无人系统已是第三代,这类系统带有多种传感器,能够将多种传 感器得到的信息进行融合处理,能够适应环境的动态变化,具有较强的自 适应能力和学习能力,解决了以往无人系统智能化所需要的多传感器信息 融合、自主导航控制、环境动态感知与本体控制等复杂技术瓶颈,使机器 人单体智能化水平得到了大幅的提升,也为异构多智能机器人群体协同提 供了基础支撑。
[0003] 相比于定点抓拍摄像头,无人机具有更大优势,不仅能弥补监控摄像 头的盲点地区,观测区域交通状况,还能灵活移动,自动调节高度,将查 处现场的过程清晰地展现出来。美国宾夕法尼亚大学的Michael等人提出 了一种抽象模型,使空中平台不需要特定专业知识即可控制地面机器人组。 但是,目前空地协同方案中空地机器人缺乏有效的协同机制和方法,协同 效果有待进一步提高。
[0004] 因此,现有技术还有待于改进和发展。

发明内容

[0005] 鉴于上述现有技术的不足,本发明的目的在于提供一种空地机器人任 务动态分配方法、存储介质及终端设备,旨在解决现有空地协同方案中空 地机器人缺乏有效的协同机制,导致空地机器人无法高效执行任务的问题。
[0006] 本发明的技术方案如下:
[0007] 一种空地机器人任务动态分配方法,其中,包括步骤:
[0008] 布局n个用于对m个任务点进行观测的空地机器人,并定义所述空地 机器人的观测描述模型,所述空地机器人包括空中机器人和地面机器人, 其中,n大于m;
[0009] 基于所述空地机器人的观测描述模型,按照时空特性建立任务点对应 的状态模型,基于所述状态模型获取空地机器人执行任务点时的收益模型;
[0010] 基于所述收益模型建立双阶段启发式任务分配策略,完成空地机器人 的任务动态分配。
[0011] 所述的空地机器人任务动态分配方法,其中,所述空地机器人的观测 描述模型包括空中机器人的观测描述模型和地面机器人的观测描述模型, 其中,定义空中机器人的观测描述模型为: βaerial=∑α1×raerial+α2×θaeeial+α3×ηaerial,其中,βaerial是用于执行任务时空 中机器人的能力指数,α为相关系数,raerial为空中机器人执行任务时的空 间分辨率,θaeeial为空中机器人执行观测任务时的倾斜角度,ηaerial为空中机 器人执行任务时的空间覆盖范围;定义地面机器人的观测描述模型为: βground=min{α1×rground+α2×ηground,α3×θground,},其中,βground是用于执行任务 时地面机器人的能力指数,min{}为选取最小值函数,α为相关系数,rground为地面机器人执行任务时的空间分辨率,θground为地面机器人执行观测任务 时的倾斜角度,ηground为地面机器人执行任务时的空间覆盖范围。
[0012] 所述的空地机器人任务动态分配方法,其中,基于所述空地机器人的 观测描述模型,按照时空特性建立任务点对应的状态模型的步骤包括:
[0013] 假设任务空间中包含分布于二维平面上不同位置的m个任务点,定义 第i个任务点在时刻t的状态值为 Si(t) ,则第i个 任务点的状态模型表示  为 :其中,Si(0)是第i个目标点的 初始状态值(Si
(t)>0),αi是第i个目标点的状态变化率,βji是用于执行第i 个任务的第j个空地机器人的能力指数,ni是分配到该任务点的空地机器 人的数量,ε是状态阈值。
[0014] 所述的空地机器人任务动态分配方法,其中,基于所述状态模型获取 空地机器人执行任务点时的收益模型为: 其中,dji表 示第j个地面机器人距离第i个任务点的空间距离, 表示第j个地面机 器人在时刻t执行第i个任务取得的原始收益。
[0015] 所述的空地机器人任务动态分配方法,其中,所述空间距离为欧式距 离、马氏距离或闵科夫斯基距离。
[0016] 所述的空地机器人任务动态分配方法,其中,基于所述收益模型建立 双阶段启发式任务分配策略,完成空地机器人的任务动态分配的步骤包括:
[0017] 在第一阶段,计算将第i个空地机器人分配给第j个任务点所获得的 收益值矩阵,对于每个任务点,计算各个空地机器人执行所述任务点获得 的最大收益值,并按最大收益值由大到小对任务点进行排序,排在前面的 任务点优先选择一个对应的空地机器人;对于第j个任务点,从所述收益 值矩阵中选择最大值对应的空地机器人与所述第j个任务点匹配;
[0018] 在第二阶段,对于在第一阶段中未分配的空地机器人,计算将其分配 给各个任务点所能产生的收益增加值矩阵,对于每个未分配的空地机器人, 求得所述收益增加值矩阵中的最大值 和第二大值 之间的差值  将所述未分配的空地机器人按值由大到小优先进行分配 排序;对于当前未分配的空地机器人,从所述收益增加
值矩阵中选择最大 值对应的任务点与所述当前未分配的空地机器人匹配。
[0019] 所述的空地机器人任务动态分配方法,其中,在第一阶段还包括步骤: 遍历所有未分配的任务节点,从所述收益值矩阵中选择最大值对应的空地 机器人与所述未分配的任务点匹配,直至每一个任务节点至少分配到一个 空地机器人。
[0020] 所述的空地机器人任务动态分配方法,其中,在第二阶段还包括步骤: 遍历所有未分配的空地机器人,根据所述收益增加矩阵选择对应分配的任 务点,直至所有未分配的空地机器人全部分配。
[0021] 一种存储介质,其中,所述存储介质存储有一个或者多个程序,所述 一个或者多个程序可被一个或者多个处理器执行,以实现本发明所述空地 机器人任务动态分配方法中的步骤。
[0022] 一种终端设备,其中,包括:处理器、存储器及通信总线;所述存储器 上存储有可被所述处理器执行的计算机可读程序;
[0023] 所述通信总线实现处理器和存储器之间的连接通信;
[0024] 所述处理器执行所述计算机可读程序时实现本发明所述空地机器人任 务动态分配方法中的步骤。
[0025] 有益效果:本发明提供了一种空地机器人任务动态分配方法,通过建 立空地机器人观测指数模型,设计双阶段启发式任务分配策略,将任务分 配划分为两个阶段,按照收益增加高低分配空地机器人。本发明为空地机 器人分配任务节点收益计算提供了一种定量化的方法,有效地降低了任务 动态分配实时在线资源单位时间消耗量,显著提升了空地机器人任务动态 分配计算效率;根据时空特性和启发式算法进行任务动态分配,支撑空地 机器人高效完成作业。

附图说明

[0026] 图1为本发明一种空地机器人任务动态分配方法的流程图。
[0027] 图2为本发明一种终端设备的结构原理图。

具体实施方式

[0028] 本发明提供一种空地机器人任务动态分配方法、存储介质及终端设备, 为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一 步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明, 并不用于限定本发明。
[0029] 请参阅图1,图1为本发明提供的一种空地机器人任务动态分配方法较 佳实施例的流程图,如图所示,其包括步骤:
[0030] S10、布局n个用于对m个任务点进行观测的空地机器人,并定义所述 空地机器人的观测描述模型,所述空地机器人包括空中机器人和地面机器 人,其中,n大于m;
[0031] S20、基于所述空地机器人的观测描述模型,按照时空特性建立任务点 对应的状态模型,基于所述状态模型获取空地机器人执行任务点时的收益 模型;
[0032] S30、基于所述收益模型建立双阶段启发式任务分配策略,完成空地机 器人的任务动态分配。
[0033] 本实施例针对空地机器人协同作业,提出了一种基于时空启发式算法 的空地机器人任务动态分配方法,该方法首先建立了空地机器人的观测指 数模型,然后设计双阶段启发式任务分配策略,将任务分配划分为两个阶 段,按照收益增加高低分配空地机器人;本实施例并融合地理时空位置、 任务完成能力指数、任务点在某时刻的状态值,来测定任务完成带来的收 益,有效地量化了空地机器人和任务之间的收益关系,能够克服时空参数 带来的收益计算偏差;本实施例为空地机器人分配任务节点收益计算提供 了一种定量化的方法,有效地降低了任务动态分配实时在线资源单位时间 消耗量,显著提升了空地机器人任务动态分配计算效率;根据时空特性和 启发式算法进行任务动态分配,支撑空地机器人高效完成作业。
[0034] 在一些实施方式中,所述空地机器人包括空中机器人和地面机器人, 所述空中机器人负责全局观测,全局测图,观测精度稍低;地面机器人负 责局部观测,局部测图,观测精度较高。其协同观测思路为地面机器人观 测辅助空中观测机器人,空中机器人进行全局观测,地面机器人辅助进行 高精度观测,从而实现全局高精度测图。在本实施例中,所述空地机器人 的观测描述模型包括空中机器人的观测描述模型和地面机器人的观测描述 模型,其中,定义空中机器人的观测描述模型为: βaerial=∑α1×raerial+α2×θaeeial+α3×ηaerial,其中,βaerial是用于执行任务时空 中机器人的能力指数,α为相关系数,raerial为空中机器人执行任务时的空 间分辨率,θaeeial为空中机器人执行观测任务时的倾斜角度,ηaerial为空中机 器人执行任务时的空间覆盖范围;定义地面机器人的观测描述模型为: βground=min{α1×rground+α2×ηground,α3×θground,},其中,βground是用于执行任务 时地面机器人的能力指数,min{}为选取最小值函数,α为相关系数,rground为地面机器人执行任务时的空间分辨率,θground为地面机器人执行观测任务 时的倾斜角度,ηground为地面机器人执行任务时的空间覆盖范围。
[0035] 在一些实施方式中,基于所述空地机器人的观测描述模型,按照时空 特性建立任务点对应的状态模型的步骤包括:假设任务空间中包含分布于 二维平面上不同位置的m个任务点,为了区别不同目标在时刻t的重要性, 每个任务点具有一个对应的收益函数Rj,i,tφi(t),其中Ri是完成任务i可以 获得的最大收益,φi(t)是完成任务i获得的收益随时间变化的“打折函数”, 假设当φi(t)≠0时,φi(t)/dt≠0,或者φi(t)/dt<0;定义第i个任务点在时刻 t的状态值为Si(t),空地机器人完成任务是通过将其状态归零实现,则第i个任务点的状态模型表示为: 其中, Si(0)是第i个目标点的初始状态值(Si(t)>0),αi是第i个目标点的状态变 化率,βji是用于执行第i个任务的第j个空地机器人的能力指数,ni是分 配到该任务点的空地机器人的数量,ε是状态阈值。整个任务的目标是使获 得的最终任务收益最大化。
[0036] 在本实施例中,基于时空特性的第j个地面机器人在时刻t执行第i 个任务取得的收益模型表示为: 其中,dji表示第j个 地面机器人距离第i个任务点的空间距离, 表示第j个地面机器人在时 刻t执行第i个任务取得的原始收益。其中,所述空间距离为欧式距离、 马氏距离或闵科夫斯基距离,但不限于此。
[0037] 在一些实施方式中,启发式算法最大的优点是计算量少,特别适合实 时性要求高的场合,对于多空地机器人的任务分配问题,根据经验知识, 以下两个启发式规则将被融入到算法的构造中:
[0038] 1)对于某个任务点而言,完成其获得的收益值Ri越大,表明其重要程 度越高,越应该被优先分配。
[0039] 2)对于某个空地机器人而言,计算出把它分配给不同任务时对系统整 体指标的提高值(ΔRi,1,ΔRi,2,...,ΔRi,M)。其中,ΔRi,j为将第i个空地机器人分配 给第j个任务点1
时系统性能指标的增加值,求得(ΔRi,1,ΔRi,2,...,ΔRi,M)中的最大 值ΔRi 和第二大值Δ
2 1 2 1 2
Ri,并计算二者的差值ΔRi‑ΔRi。经验表明,ΔRi‑ΔRi较大者应该优先分配。
[0040] 基于上述两个启发式规则,本实施提供出一种双阶段启发式任务分配 策略,有n个空地机器人和m个任务点,且n>m,则具体操作方式为:
[0041] 在第一阶段,计算将第i(i=1,2,...,N)个空地机器人分配给第j(j=1,2,...,M)个任务点所获得的收益值矩阵 对于 每个任务点,计算各个空地机器人执行所述任务点获得的最大收益值,并 按最大收益值由大到小对任务点进行排序,排在前面的任务点优先选择一 个对应的空地机器人;对于第j个任务点,从所述收益值矩阵R1,j,R2,j,...,RN,j中选择最大值对应的空地机器人与所述第j个任务点匹配。同时,优先级 较高的任务点匹配的空地机器人在后续分配中不再考虑。
[0042] 在第二阶段,对于在第一阶段中未分配的空地机器人(数量为n‑m), 计算将其分配给各个任务点所能产生的收益增加值矩阵  ΔRi,j表示将第i个空地机器人分配给第 j个任务点后整个任务收益的增加值,对于每个未分配的空地机器人,求 得所述收益增加值矩阵中的最大值 和第二大值 之间的差值 
将所述未分配的空地机器人按 值由大到小优先进行分配 排序;对于当
前未分配的空地机器人,从所述收益增加值矩阵中选择最大 值对应的任务点与所述当前未分配的空地机器人匹配。
[0043] 在一些具体的实施方式中,在第一阶段还包括步骤:遍历所有未分配 的任务节点,从所述收益值矩阵中选择最大值对应的空地机器人与所述未 分配的任务点匹配,直至每一个任务节点至少分配到一个空地机器人。
[0044] 在一些具体的实施方式中,所在第二阶段还包括步骤:遍历所有未分 配的空地机器人,按照ΔR来计算收益增加矩阵,计算出对应分配的任务节 点,直至所有未分配的空地机器人全部分配。
[0045] 在本实施例中,所述第一阶段的分配主要针对任务点而言,保证了所 有任务点分配到一个空地机器人,同时按照任务点的重要程度进行先后分 配。第二阶段根据第二条启发式规则,从未分配的空地机器人角度出发进 行分配,将空地机器人分配到任务收益增加最大的任务点。假设将一个空 地机器人分配给任务点进行收益计算所消耗的时间是t0,计算第一阶段的计 算复杂性为O(t0.M.N),并计算第二阶段的计算复杂性为O(t0.M.(N‑M)),将其 相加得到整个启发式任务分配算法的计算复杂度为O(M.N)。
[0046] 在一些实施方式中,还提供一种存储介质,其中,所述存储介质存储 有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执 行,以实现本发明所述空地机器人任务动态分配方法中的步骤。
[0047] 基于上述空地机器人任务动态分配方法,本申请还提供了一种终端设 备,如图2所示,其包括至少一个处理器(processor)20;显示屏21;以 及存储器(memory)22,还可以包括通信接口(Communications Interface) 23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可 以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中 预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存 储器22中的逻辑指令,以执行上述实施例中的方法。
[0048] 此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实 现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介 质中。
[0049] 存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计 算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理 器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功 能应用以及数据处理,即实现上述实施例中的方法。
[0050] 存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储 操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设 备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器, 还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read‑Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者 光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
[0051] 此外,存储介质以及终端设备中的多条指令处理器加载并执行的具体 过程在上述方法中已经详细说明,在这里就不再一一陈述。
[0052] 综上所述,本发明公开了一种空地机器人任务动态分配方法,该方法 利用多个空地机器人、时空启发算法和双阶段启发式任务分配策略,将任 务动态分配给空地机器人。本发明公开的空地机器人任务分配策略,计算 复杂度低、适合于计算资源有限的空地机器人的任务动态分配,降低了任 务分配的复杂度,能够降低任务动态分配计算带来的延迟。
本发明还利用 地理时空位置、建立空地机器人观测指数模型,任务点在某时刻的状态值, 来测定任务完成带来的收益,有效地量化了空地机器人和任务之间的收益 关系,能够克服时空参数带来的收益计算偏差。
[0053] 应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术 人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应 属于本发明所附权利要求的保护范围。