面向多智能体对抗场景的防御态势评估方法及装置转让专利

申请号 : CN202210115950.3

文献号 : CN114492058B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 姜竣凯王建强王裕宁黄荷叶王嘉昊杨奕彬

申请人 : 清华大学

摘要 :

本申请公开了一种面向多智能体对抗场景的防御态势评估方法及装置,其中,方法包括:在多智能体对抗场景下,判断多智能体对抗是否开始,如果多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量,并根据防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至多智能体对抗结束,得到多智能体对抗场景的防御态势评估结果。由此,解决了相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务等问题。

权利要求 :

1.一种面向多智能体对抗场景的防御态势评估方法,其特征在于,包括以下步骤:在多智能体对抗场景下,判断多智能体对抗是否开始;

如果所述多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量,其中,建立预设的安全能量场分层模型包括,获取多智能体的智能体信息,将所述智能体信息和当前环境信息输入被动防护安全层模型、单体机动安全层模型和群体协同安全层模型,得到被动防护安全能量、单体机动安全能量和群体协同安全能量,基于所述被动防护安全能量、所述单体机动安全能量和所述群体协同安全能量获取所述防护安全能量;以及根据所述防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至所述多智能体对抗结束,得到所述多智能体对抗场景的防御态势评估结果。

2.根据权利要求1所述的方法,其特征在于,所述智能体信息包括智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项。

3.根据权利要求1或2所述的方法,其特征在于,所述被动防护安全能量的计算公式为:其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。

4.根据权利要求3所述的方法,其特征在于,所述单体机动安全能量的计算公式为:其中,emob(x,y)为场景中(x,y)点处智能体单体机动安全贡献的防御安全强度,Sdam为智能体单元的毁伤幅员面积。

5.根据权利要求4所述的方法,其特征在于,所述群体协同安全能量的计算公式为:其中,esig为单体综合防护安全能量,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量。

6.根据权利要求5所述的方法,其特征在于,所述根据所述防护安全能量更新安全能量场态势图,包括:基于对抗环境中任意一点的防护安全能量,获取在对抗单元自身毁伤幅员内的总防护安全能量,确定预期安全能量场能,其中,所述预期安全能量场能的计算公式为:其中,Esaf为所得的预期安全能量场能。

7.一种面向多智能体对抗场景的防御态势评估装置,其特征在于,包括:判断模块,用于在多智能体对抗场景下,判断多智能体对抗是否开始;

计算模块,用于如果所述多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量,其中,建立预设的安全能量场分层模型包括,获取多智能体的智能体信息,将所述智能体信息和当前环境信息输入被动防护安全层模型、单体机动安全层模型和群体协同安全层模型,得到被动防护安全能量、单体机动安全能量和群体协同安全能量,基于所述被动防护安全能量、所述单体机动安全能量和所述群体协同安全能量获取所述防护安全能量;以及评估模块,用于根据所述防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至所述多智能体对抗结束,得到所述多智能体对抗场景的防御态势评估结果。

8.根据权利要求7所述的装置,其特征在于,所述智能体信息包括智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项。

9.根据权利要求7或8所述的装置,其特征在于,所述被动防护安全能量的计算公式为:其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。

10.根据权利要求9所述的装置,其特征在于,所述单体机动安全能量的计算公式为:其中,emob(x,y)为场景中(x,y)点处智能体单体机动安全贡献的防御安全强度,Sdam为智能体单元的毁伤幅员面积。

11.根据权利要求9所述的装置,其特征在于,所述群体协同安全能量的计算公式为:其中,esig为单体综合防护安全能量,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量。

12.根据权利要求11所述的装置,其特征在于,所述评估模块,进一步用于:基于对抗环境中任意一点的防护安全能量,获取在对抗单元自身毁伤幅员内的总防护安全能量,确定预期安全能量场能,其中,所述预期安全能量场能的计算公式为:其中,Esaf为所得的预期安全能量场能。

13.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1‑6任一项所述的面向多智能体对抗场景的防御态势评估方法。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1‑6任一项所述的面向多智能体对抗场景的防御态势评估方法。

说明书 :

面向多智能体对抗场景的防御态势评估方法及装置

技术领域

[0001] 本申请涉及防御态势评估技术领域,特别涉及一种面向多智能体对抗场景的防御态势评估方法及装置。

背景技术

[0002] 现代信息化条件下,对抗场景中可探测范围日益扩展,信息来源愈益广泛,这使得获取的信息数量大,含义杂,变化快,已经大大超出了人脑的信息综合能力,极易造成指控人员的认知过载现象。因此,基于多源信息融合的多智能体对抗场景态势的理解判断,已经成为对抗环境信息系统的核心技术之一。然而,相关技术难以实现对抗场景下的综合态势评估,其原因在于没有成熟的模型对场景中的多源信息进行统一量化和理解,导致难以对当前态势做出准确快速的判断。
[0003] 相关技术主要有两种:
[0004] 第一种:基于对抗环境信息,将对抗环境态势进行分类,主要分为能力势、效能势、综合势等。这种方法虽然实现了不同“势”的统一梳理,但是各种“势”边界模糊,并且难以实现具体量化;
[0005] 第二种:基于对抗场景,针对某一种具体的场景,提出采用基于粗糙集理论、基于信息熵、基于动态贝叶斯网络等方法的态势量化模型。这种方法虽然实现了态势的量化评估,但是对抗场景无穷无尽,各种模型之间存在无法统一的问题。
[0006] 综上,相关技术大多只是提出了一些模糊的整体态势感知方法,而并未对具体的智能体攻防行为的物理原理进行深入的探究。
[0007] 通过对相关技术的分析,可以发现当前的防御态势评估方法主要存在以下问题:
[0008] 1)尚未提出基于智能体防御行为物理原理的态势评估方法;
[0009] 2)研究对象多为宏观场景,而忽略微观层面上智能体的具体行为;
[0010] 3)研究手段多为数据统计方法的应用,而非客观物理规律的建模,因此方法的通用性不强,并且可解释性低;
[0011] 4)态势评估方法缺乏实时性,无法为后续智能体决策服务;
[0012] 5)方法需要大量数据支持,智能化程度低。
[0013] 综上所述,相关技术中对于防御态势评估方法还有待改善。

发明内容

[0014] 本申请提供一种面向多智能体对抗场景的防御态势评估方法及装置,以解决相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务等问题。
[0015] 本申请第一方面实施例提供一种面向多智能体对抗场景的防御态势评估方法,包括以下步骤:在多智能体对抗场景下,判断多智能体对抗是否开始;如果所述多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量;以及根据所述防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至所述多智能体对抗结束,得到所述多智能体对抗场景的防御态势评估结果。
[0016] 可选地,在本申请的一个实施例中,所述利用预设的安全能量场分层模型计算对抗环境中的防护安全能量,包括:获取多智能体的智能体信息;将所述智能体信息和当前环境信息输入被动防护安全层模型、单体机动安全层模型和/或群体协同安全层模型,得到被动防护安全能量、单体机动安全能量和/或群体协同安全能量;基于所述被动防护安全能量、所述单体机动安全能量和/或所述群体协同安全能量获取所述防护安全能量。
[0017] 可选地,在本申请的一个实施例中,所述智能体信息包括智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项。
[0018] 可选地,在本申请的一个实施例中,所述被动防护安全能量的计算公式为:
[0019]
[0020] 其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。
[0021] 可选地,在本申请的一个实施例中,所述单体机动安全能量的计算公式为:
[0022]
[0023] 其中,emob(x,y)为场景中(x,y)点处智能体单体机动安全贡献的防御安全强度,Sdam为智能体单元的毁伤幅员面积,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,Smob为智能体单元的机动范围。
[0024] 可选地,在本申请的一个实施例中,所述群体协同安全能量的计算公式为:
[0025]
[0026] 其中,esog为单体综合防护安全能量,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量。
[0027] 可选地,在本申请的一个实施例中,所述根据所述防护安全能量更新安全能量场态势图,包括:基于对抗环境中任意一点的防护安全能量,获取在对抗单元自身毁伤幅员内的总防护安全能量,确定预期安全能量场能,其中,所述预期安全能量场能的计算公式为:
[0028]
[0029] 其中,Esaf为所得的预期安全能量场能,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量,Sdam为智能体单元的毁伤幅员面积。
[0030] 本申请第二方面实施例提供一种面向多智能体对抗场景的防御态势评估装置,包括:判断模块,用于在多智能体对抗场景下,判断多智能体对抗是否开始;计算模块,用于如果所述多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量;以及评估模块,用于根据所述防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至所述多智能体对抗结束,得到所述多智能体对抗场景的防御态势评估结果。
[0031] 可选地,在本申请的一个实施例中,所述计算模块,包括:获取单元,用于获取多智能体的智能体信息;第一计算单元,用于将所述智能体信息和当前环境信息输入被动防护安全层模型、单体机动安全层模型和/或群体协同安全层模型,得到被动防护安全能量、单体机动安全能量和/或群体协同安全能量;第二计算单元,用于基于所述被动防护安全能量、所述单体机动安全能量和/或所述群体协同安全能量获取所述防护安全能量。
[0032] 可选地,在本申请的一个实施例中,所述智能体信息包括智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项。
[0033] 可选地,在本申请的一个实施例中,所述被动防护安全能量的计算公式为:
[0034]
[0035] 其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。
[0036] 可选地,在本申请的一个实施例中,所述单体机动安全能量的计算公式为:
[0037]
[0038] 其中,emob(x,y)为场景中(x,y)点处智能体单体机动安全贡献的防御安全强度,Sdam为智能体单元的毁伤幅员面积,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,Smob为智能体单元的机动范围。
[0039] 可选地,在本申请的一个实施例中,所述群体协同安全能量的计算公式为:
[0040]
[0041] 其中,esig为单体综合防护安全能量,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量。
[0042] 可选地,在本申请的一个实施例中,所述评估模块,进一步用于:基于对抗环境中任意一点的防护安全能量,获取在对抗单元自身毁伤幅员内的总防护安全能量,确定预期安全能量场能,其中,所述预期安全能量场能的计算公式为:
[0043]
[0044] 其中,Esaf为所得的预期安全能量场能,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量,Sdam为智能体单元的毁伤幅员面积。
[0045] 本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的面向多智能体对抗场景的防御态势评估方法。
[0046] 本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如权利要求1‑7任一项所述的面向多智能体对抗场景的防御态势评估方法。
[0047] 本申请实施例通过建立安全能量场分层模型,计算对抗环境中的防护安全能量,并对当前时刻的安全能量场态势进行实时更新,进而获得多智能体对抗场景的防御态势评估结果,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高,实时性好,可以为后续智能体决策服务。由此,解决了相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务等问题。
[0048] 本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

[0049] 本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0050] 图1为根据本申请实施例提供的一种面向多智能体对抗场景的防御态势评估方法的流程图;
[0051] 图2为根据本申请一个具体实施例提供的间瞄单元碰撞范围与机动范围图;
[0052] 图3为根据本申请一个具体实施例提供的直瞄单元命中范围图;
[0053] 图4为根据本申请一个具体实施例提供的群体协同防护安全图;
[0054] 图5为根据本申请一个具体实施例提供的面向多智能体对抗场景的防御态势评估方法的原理示意图;
[0055] 图6为根据本申请一个具体实施例提供的安全能量场模型测试样例图;
[0056] 图7为根据本申请一个具体实施例提供的我方安全能量场态势图;
[0057] 图8为根据本申请一个具体实施例提供的对方安全能量场态势图;
[0058] 图9为根据本申请实施例提供的一种面向多智能体对抗场景的防御态势评估装置的结构示意图;
[0059] 图10为根据本申请实施例提供的电子设备的结构示意图。

具体实施方式

[0060] 下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0061] 下面参考附图描述本申请实施例的面向多智能体对抗场景的防御态势评估方法及装置。针对上述背景技术中心提到的相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务的问题,本申请提供了一种面向多智能体对抗场景的防御态势评估方法,在该方法中,通过建立安全能量场分层模型,计算对抗环境中的防护安全能量,并对当前时刻的安全能量场态势进行实时更新,进而获得多智能体对抗场景的防御态势评估结果,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高,实时性好,可以为后续智能体决策服务。由此,解决了相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务等问题。
[0062] 具体而言,图1为本申请实施例所提供的一种面向多智能体对抗场景的防御态势评估方法的流程示意图。
[0063] 如图1所示,该面向多智能体对抗场景的防御态势评估方法包括以下步骤:
[0064] 在步骤S101中,在多智能体对抗场景下,判断多智能体对抗是否开始。
[0065] 在实际执行过程中,当对抗双方的智能体不断移动并采取不同行动时,本申请实施例可以通过使用自身配置的传感器实时监测周边环境情况,并调用图像传感器、激光雷达、GPS等传感器数据,为后续步骤提供数据支持。
[0066] 在步骤S102中,如果多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量。
[0067] 具体地,当本申请实施例判断多智能体对抗开始后,则可以利用预设的安全能量场分层模型计算对抗环境中的防护安全能量,其中,安全能量场分层模型的建立会在下文进行详细阐述。本申请实施例基于智能体防御行为物理原理,通过预设的安全能量场分层模型,获取对抗环境中的防护安全能量,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高。
[0068] 可选地,在本申请的一个实施例中,利用预设的安全能量场分层模型计算对抗环境中的防护安全能量,包括:获取多智能体的智能体信息;将智能体信息和当前环境信息输入被动防护安全层模型、单体机动安全层模型和/或群体协同安全层模型,得到被动防护安全能量、单体机动安全能量和/或群体协同安全能量;基于被动防护安全能量、单体机动安全能量和/或群体协同安全能量获取防护安全能量。
[0069] 作为一种可能实现的方式,本申请实施例可以使用预设的安全能量场分层模型计算对抗环境中的防护安全能量,其中,建立安全能量场分层模型的步骤包括:数据提取、被动防护安全层模型建立、单体机动安全层模型建立、群体协同安全层模型建立等。本申请实施例可以在获取多智能体的智能体信息后,将所获得的智能体信息输入上述建立完成的模型中,获得相应的被动防护安全能量、单体机动安全能量和/或群体协同安全能量,进而获取防护安全能量。本申请实施例基于智能体防御行为物理原理,通过预设的安全能量场分层模型,获取对抗环境中的防护安全能量,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高。
[0070] 可选地,在本申请的一个实施例中,智能体信息包括智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项。
[0071] 可以理解的是,提取智能体信息是安全能量场的输入模块,对防御态势评估的效率和效果具有十分重要的影响,在对抗环境中,本申请实施例可以通过两种方法获得所需的智能体信息与环境信息:
[0072] 1、依托于高精度立体融合感知技术的信息获取,如:智能体的类型、位置和朝向;
[0073] 2、依托于全面智能体单元数据库的信息获取,如:智能体的物理防护强度、机动性能(最大速度、最大加速度等)。
[0074] 在本申请实施例中,所需获取的智能体信息,包括但不限于智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项,其中具体的信息获取类型,可以由本领域技术人员根据实际情况进行相应调整,在此不做具体限制。
[0075] 可选地,在本申请的一个实施例中,被动防护安全能量的计算公式为:
[0076]
[0077] 其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。
[0078] 在此,对被动防护安全层模型的建立进行详细阐述。
[0079] 可以理解的是,被动防护安全层的作用机理为智能体通过自身装甲承受威胁,在实际对抗环境中,由于智能体单元具有机动性,在自身机动范围内的任意一点,智能体单元都能够通过自身装甲的物理防护,对自身或机动范围内的其他智能体单元提供保护,因此被动防护安全能量计算如下:
[0080]
[0081] 其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,DDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。
[0082] 在实际执行过程中,在计算智能体机动范围半径Rmob时,假设智能体以最大机动能力进行逃逸,此时计算需要考虑两种情况:
[0083] 1、智能体以自身能产生的最大加速度加速行驶,且在机动逃逸时间t之内,不能达到自身的最大速度,这种情况下智能体在时间t之内均处于匀加速运动状态,因此范围半径Rmob即为时间内智能体所能行驶的最远距离;
[0084] 2、智能体以自身能产生的最大加速度加速行驶,且在机动逃逸时间t之内,能够达到自身的最大速度,这种情况下智能体在时间t之内将先处于匀加速运动状态,在达到最大速度后处于匀速运动状态,此时范围半径Rmob为两段运动距离之和。
[0085] 即言,智能体机动范围半径Tmob计算可以如下:
[0086]
[0087] 其中,v0为智能体单元当前速度,vmax为智能体单元最大速度,amax为智能体单元所能发出的最大加速度,t为智能体单元机动逃逸时间。本申请实施例考虑到智能体单元转向能力较强,因此忽略当前速度方向对机动范围的影响。
[0088] 本申请实施例在量化智能体单元防御能力时,机动逃逸时间t可取常数;本申请实施例在具体计算防护智能体单元对威胁智能体单元的防御作用时,机动逃逸时间t可通过威胁智能体单元的弹丸出射速度v以及双方之间距离d来确定,其计算公式如下:
[0089]
[0090] 可选地,在本申请的一个实施例中,单体机动安全能量的计算公式为:
[0091]
[0092] 其中,emob(x,y)为场景中(x,y)点处智能体单体机动安全贡献的防御安全强度,Sdam为智能体单元的毁伤幅员面积,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,Smob为智能体单元的机动范围。
[0093] 在此,对单体机动安全层模型的建立进行详细阐述。
[0094] 可以理解的是,单体机动安全的作用机理为智能体单元利用自身的机动性,在被对方的威胁智能体单元锁定时,通过机动躲避,最大化发挥自身的物理防护作用。若对方智能体单元毁伤范围大于我方智能体单元的机动范围,则对方智能体单元只要瞄准我方智能体单元当前位置进行射击,即可对我方造成毁伤,此时单体机动安全能量即为单体被动防护安全能量。若对方智能体单元毁伤范围小于我方智能体单元机动范围,则我方智能体单元有可能通过自身的机动性,躲避对方的威胁行为,相当于我方智能体单元在自身的毁伤幅员内,其防御能力得到了相应加强。
[0095] 基于以上机理,本申请实施例在计算单体机动安全能量时,需要对毁伤幅员内的防御强度进行加强。本申请实施例可以使用智能体单元的机动范围面积与自身毁伤幅员的比值作为防御加强程度的衡量标准,场能计算方式如下:
[0096]
[0097] 其中,emob(x,y)为场景中(x,y)点处,智能体单体机动安全贡献的防御安全强度,Rmob为智能体单元的机动半径,Sdam为智能体单元的毁伤幅员面积。
[0098] 以上为泛化的安全能量场中单体机动安全层能量的计算方法,而在具体的场力计算时,由于攻防对象已经确定,因此需要更加细致的机动安全能量计算方式。威胁类型为间瞄的智能体单元对目标产生毁伤的方式为区域爆炸,因此目标智能体单元未逃脱率为爆炸区域面积与机动范围面积的比值;而对于威胁类型为直瞄的智能体单元,其毁伤方式为直线射击,因此目标单元未逃脱率为以毁伤幅员为半边长的机动圆内接鼓型与机动范围的比值,即:
[0099] 1、间瞄智能体单元
[0100] 若爆炸半径小于机动半径(如图2所示),则在智能体单元的毁伤幅员内基于爆炸范围与机动范围的面积比值进行防御增强;若爆炸半径大于等于机动半径,则不进行增强。场能计算如下:
[0101]
[0102] 其中,Rexp为间瞄智能体单元的爆炸半径,Rmob为防御智能体单元的机动半径。
[0103] 2、直瞄智能体单元
[0104] 考虑智能体单元毁伤幅员的半径为Rdam,直瞄智能体单元弹丸飞行轨迹为上图3中横线,则在机动范围内,防御智能体单元的质心移动范围在深蓝色矩形框时被认定为受到毁伤,反之则未受到毁伤。基于此躲避机理,应对直瞄智能体单元威胁的安全能量计算如下:
[0105]
[0106] 其中,Rmob为防御智能体单元的机动半径,A为受到毁伤范围(即图3中深色矩形框)面积,计算方法为:
[0107]
[0108] 本申请实施例在综合考虑被动防护安全和单体机动安全之后,单体综合防护安全能量esig计算如下:
[0109]
[0110] 在量化智能体单元单体综合防护安全能量时,本申请实施例可将威胁智能体单元视作间瞄单元,且爆炸范围半径Rexp取常数;在量化智能体单元对某一具体威胁单元的防护安全能量时,单体综合防护安全能量可由上述分析计算得到。
[0111] 可选地,在本申请的一个实施例中,群体协同安全能量的计算公式为:
[0112]
[0113] 其中,esig为单体综合防护安全能量,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量。
[0114] 在此,对群体协同安全层模型的建立进行详细阐述。
[0115] 可以理解的是,在真实的多智能体对抗环境中,各个智能体单元的重要程度不同,当整体受到较大威胁时,指控人员很可能需要在智能体单元之间作取舍,甚至需要重要程度较低的智能体单元,去为重要程度较高的智能体单元承受威胁。安全能量场模型的建立同样需要考虑这种协同行为,也就是群体协同安全能量。通过上述步骤,已经得到了各个智能体单元对于对抗环境中某一点的单体综合防护安全能量esig(x,y)。此时若对抗环境中共有n个我方智能体单元,则安全防护能量可由单体防护延伸为协同防护。图4示出了群体协同防护的作用原理,群体协同防护安全能量,可由某一点不同智能体单元的单体安全能量直接叠加而成,其计算如下:
[0116]
[0117] 其中,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,也就是群体综合防护安全能量。
[0118] 综上,对对抗环境中某一点的防护能力由三种防护行为构成:自体物理防护、自体机动性防护、群体协同保护,分别对应安全能量场的被动防护安全、单体机动安全、群体协同安全三层结构。
[0119] 在步骤S103中,根据防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至多智能体对抗结束,得到多智能体对抗场景的防御态势评估结果。
[0120] 本申请实施例可以根据上述步骤中计算获得的防护能量,更新安全能量场态势图,对当前时刻都安全能量场态势进行更新,直至多智能体对抗结束,进而得到多智能体对抗场景的防御态势评估结果。本申请实施例能够基于对抗场景中智能体的防护行为,建立安全能量场模型,实现对抗环境中防御态势的评估,以便于后续的态势理解与决策制定。
[0121] 可选地,在本申请的一个实施例中,根据防护安全能量更新安全能量场态势图,包括:基于对抗环境中任意一点的防护安全能量,获取在对抗单元自身毁伤幅员内的总防护安全能量,确定预期安全能量场能,其中,预期安全能量场能的计算公式为:
[0122]
[0123] 其中,Esaf为所得的预期安全能量场能,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量,Sdam为智能体单元的毁伤幅员面积。
[0124] 在实际执行过程中,本申请实施例可以通过步骤S102的分析计算,获得对抗环境中任意一点的综合防护安全能量esaf(x,y),则在对抗单元自身毁伤幅员内的总防护安全能量,即为所得的预期安全能量场能Esaf:
[0125]
[0126] 下面结合图2至图8所示,以一个具体实施例对本申请实施例的评估方法的工作原理进行详细阐述。
[0127] 如图5所示,本申请实施例的评估方法包括以下步骤:
[0128] 步骤S501:多智能体对抗开始。在实际执行过程中,当对抗双方的智能体不断移动并采取不同行动时,本申请实施例可以通过使用自身配置的传感器实时监测周边环境情况,并调用图像传感器、激光雷达、GPS等传感器数据,为后续步骤提供数据支持。
[0129] 步骤S502:根据感知结果与智能体数据库建立安全能量场分层模型。本申请实施例可以使用预设的安全能量场分层模型计算对抗环境中的防护安全能量,其中,建立安全能量场分层模型的步骤包括:数据提取、被动防护安全层模型建立、单体机动安全层模型建立、群体协同安全层模型建立等。本申请实施例可以在获取多智能体的智能体信息后,将所获得的智能体信息输入上述建立完成的模型中,获得相应的被动防护安全能量、单体机动安全能量和/或群体协同安全能量,进而获取防护安全能量。本申请实施例基于智能体防御行为物理原理,通过预设的安全能量场分层模型,获取对抗环境中的防护安全能量,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高。
[0130] 其中,被动防护安全层模型建立、单体机动安全层模型建立、群体协同安全层模型建立,各自设计如下:
[0131] a,安全能量场模型建立所需数据提取。
[0132] 可以理解的是,提取智能体信息是安全能量场的输入模块,对防御态势评估的效率和效果具有十分重要的影响,在对抗环境中,本申请实施例可以通过两种方法获得所需的智能体信息与环境信息:
[0133] 1、依托于高精度立体融合感知技术的信息获取,如:智能体的类型、位置和朝向;
[0134] 2、依托于全面智能体单元数据库的信息获取,如:智能体的物理防护强度、机动性能(最大速度、最大加速度等)。
[0135] b,被动防护安全层模型建立。
[0136] 可以理解的是,被动防护安全层的作用机理为智能体通过自身装甲承受威胁,在实际对抗环境中,由于智能体单元具有机动性,在自身机动范围内的任意一点,智能体单元都能够通过自身装甲的物理防护,对自身或机动范围内的其他智能体单元提供保护,因此被动防护安全能量计算如下:
[0137]
[0138] 其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。
[0139] 在实际执行过程中,在计算智能体机动范围半径Rmob时,假设智能体以最大机动能力进行逃逸,此时计算需要考虑两种情况:
[0140] 1、智能体以自身能产生的最大加速度加速行驶,且在机动逃逸时间t之内,不能达到自身的最大速度,这种情况下智能体在时间t之内均处于匀加速运动状态,因此范围半径Rmob即为时间内智能体所能行驶的最远距离;
[0141] 2、智能体以自身能产生的最大加速度加速行驶,且在机动逃逸时间t之内,能够达到自身的最大速度,这种情况下智能体在时间t之内将先处于匀加速运动状态,在达到最大速度后处于匀速运动状态,此时范围半径Rmob为两段运动距离之和。
[0142] 即智能体机动范围半径Rmob计算如下:
[0143]
[0144] 其中,v0为智能体单元当前速度,vmax为智能体单元最大速度,amax为智能体单元所能发出的最大加速度,t为智能体单元机动逃逸时间。本申请实施例考虑到智能体单元转向能力较强,因此忽略当前速度方向对机动范围的影响。
[0145] 本申请实施例在量化智能体单元防御能力时,机动逃逸时间t可取常数;本申请实施例在具体计算防护智能体单元对威胁智能体单元的防御作用时,机动逃逸时间t可通过威胁智能体单元的弹丸出射速度v以及双方之间距离d来确定,其计算公式如下:
[0146]
[0147] c,单体机动安全层模型建立。
[0148] 可以理解的是,单体机动安全的作用机理为智能体单元利用自身的机动性,在被对方的威胁智能体单元锁定时,通过机动躲避,最大化发挥自身的物理防护作用。若对方智能体单元毁伤范围大于我方智能体单元的机动范围,则对方智能体单元只要瞄准我方智能体单元当前位置进行射击,即可对我方造成毁伤,此时单体机动安全能量即为单体被动防护安全能量。若对方智能体单元毁伤范围小于我方智能体单元机动范围,则我方智能体单元有可能通过自身的机动性,躲避对方的威胁行为,相当于我方智能体单元在自身的毁伤幅员内,其防御能力得到了相应加强。
[0149] 基于以上机理,本申请实施例在计算单体机动安全能量时,需要对毁伤幅员内的防御强度进行加强。本申请实施例可以使用智能体单元的机动范围面积与自身毁伤幅员的比值作为防御加强程度的衡量标准,场能计算方式如下:
[0150]
[0151] 其中,emob(x,y)为场景中(x,y)点处,智能体单体机动安全贡献的防御安全强度,Rmob为智能体单元的机动半径,Sdam为智能体单元的毁伤幅员面积。
[0152] 以上为泛化的安全能量场中单体机动安全层能量的计算方法,而在具体的场力计算时,由于攻防对象已经确定,因此需要更加细致的机动安全能量计算方式。威胁类型为间瞄的智能体单元对目标产生毁伤的方式为区域爆炸,因此目标智能体单元未逃脱率为爆炸区域面积与机动范围面积的比值;而对于威胁类型为直瞄的智能体单元,其毁伤方式为直线射击,因此目标单元未逃脱率为以毁伤幅员为半边长的机动圆内接鼓型与机动范围的比值,即:
[0153] 1、间瞄智能体单元
[0154] 若爆炸半径小于机动半径(如图2所示),则在智能体单元的毁伤幅员内基于爆炸范围与机动范围的面积比值进行防御增强;若爆炸半径大于等于机动半径,则不进行增强。场能计算如下:
[0155]
[0156] 其中,Rexp为间瞄智能体单元的爆炸半径,Rmob为防御智能体单元的机动半径。
[0157] 2、直瞄智能体单元
[0158] 考虑智能体单元毁伤幅员的半径为Rdam,直瞄智能体单元弹丸飞行轨迹为上图3中横线,则在机动范围内,防御智能体单元的质心移动范围在深蓝色矩形框时被认定为受到毁伤,反之则未受到毁伤。基于此躲避机理,应对直瞄智能体单元威胁的安全能量计算如下:
[0159]
[0160] 其中,Rmob为防御智能体单元的机动半径,A为受到毁伤范围(即图3中深色矩形框)面积,计算方法为:
[0161]
[0162] 本申请实施例在综合考虑被动防护安全和单体机动安全之后,单体综合防护安全能量esig计算如下:
[0163]
[0164] 在量化智能体单元单体综合防护安全能量时,本申请实施例可将威胁智能体单元视作间瞄单元,且爆炸范围半径Rexp取常数;在量化智能体单元对某一具体威胁单元的防护安全能量时,单体综合防护安全能量可由上述分析计算得到。
[0165] d,群体协同安全层模型建立。
[0166] 可以理解的是,在真实的多智能体对抗环境中,各个智能体单元的重要程度不同,当整体受到较大威胁时,指控人员很可能需要在智能体单元之间作取舍,甚至需要重要程度较低的智能体单元,去为重要程度较高的智能体单元承受威胁。安全能量场模型的建立同样需要考虑这种协同行为,也就是群体协同安全能量。通过上述步骤,已经得到了各个智能体单元对于对抗环境中某一点的单体综合防护安全能量esig(x,y)。此时若对抗环境中共有n个我方智能体单元,则安全防护能量可由单体防护延伸为协同防护。图4示出了群体协同防护的作用原理,群体协同防护安全能量,可由某一点不同智能体单元的单体安全能量直接叠加而成,其计算如下:
[0167]
[0168] 其中,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,也就是群体综合防护安全能量。
[0169] 综上,对对抗环境中某一点的防护能力由三种防护行为构成:自体物理防护、自体机动性防护、群体协同保护,分别对应安全能量场的被动防护安全、单体机动安全、群体协同安全三层结构。
[0170] 步骤S503:更新安全能量场态势图。本申请实施例可以通过步骤S502的分析计算,获得对抗环境中任意一点的综合防护安全能量esaf(x,y),则在对抗单元自身毁伤幅员内的总防护安全能量,即为所得的预期安全能量场能Esaf:
[0171]
[0172] 下面给出使用安全能量场进行防御态势评估的一个样例,样例场景如图6所示。
[0173] 样例图为一块100m×50m的区域,其中,蓝色为我方智能体单元,红色为对方智能体单元。“D/d”代表直瞄智能体单元,“I/i”代表间瞄智能体单元,“C/c”代表指控单元。各单元坐标位置如表1所示,表1为测试样例各智能体单元坐标位置。
[0174] 表1
[0175]
[0176] 直瞄智能体单元(D1、D2、d1、d2),间瞄智能体单元(I1、I2、i1、i2),指控单元(C1、c1)样例参数分别如表2、表3、表4所示。其中,表2为直瞄智能体单元样例参数,表3为间瞄智能体单元样例参数,表4为指控单元样例参数。
[0177] 表2
[0178]
[0179] 表3
[0180]
[0181] 表4
[0182]
[0183] 将以上参数输入安全能量场计算模型中,得到我方安全能量场与对方安全能量场态势图分别如图7、图8所示,其中颜色越亮的区域表示防御安全态势越强。
[0184] 根据本申请实施例提出的面向多智能体对抗场景的防御态势评估方法,通过建立安全能量场分层模型,计算对抗环境中的防护安全能量,并对当前时刻的安全能量场态势进行实时更新,进而获得多智能体对抗场景的防御态势评估结果,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高,实时性好,可以为后续智能体决策服务。由此,解决了相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务等问题。
[0185] 其次参照附图描述根据本申请实施例提出的面向多智能体对抗场景的防御态势评估装置。
[0186] 图9是本申请实施例的面向多智能体对抗场景的防御态势评估装置的方框示意图。
[0187] 如图9所示,该面向多智能体对抗场景的防御态势评估装置10包括:判断模块100、计算模块200和评估模块300。
[0188] 具体地,判断模块100,用于在多智能体对抗场景下,判断多智能体对抗是否开始。
[0189] 计算模块200,用于如果多智能体对抗开始,则利用预设的安全能量场分层模型计算对抗环境中的防护安全能量。
[0190] 评估模块300,用于根据防护安全能量更新安全能量场态势图,更新当前时刻的安全能量场态势,直至多智能体对抗结束,得到多智能体对抗场景的防御态势评估结果。
[0191] 可选地,在本申请的一个实施例中,计算模块200,包括:获取单元、第一计算单元和第二计算单元。
[0192] 其中,获取单元,用于获取多智能体的智能体信息。
[0193] 第一计算单元,用于将智能体信息和当前环境信息输入被动防护安全层模型、单体机动安全层模型和/或群体协同安全层模型,得到被动防护安全能量、单体机动安全能量和/或群体协同安全能量。
[0194] 第二计算单元,用于基于被动防护安全能量、单体机动安全能量和/或群体协同安全能量获取防护安全能量。
[0195] 可选地,在本申请的一个实施例中,智能体信息包括智能体的类型、位置、朝向、物理防护强度和机动性能中的一项或多项。
[0196] 可选地,在本申请的一个实施例中,被动防护安全能量的计算公式为:
[0197]
[0198] 其中,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,FDbre为智能体的物理防护强度,其定义为:需要毁伤目标智能体的单位面积上的碰撞或冲击能量,Smob为智能体单元的机动范围。
[0199] 可选地,在本申请的一个实施例中,单体机动安全能量的计算公式为:
[0200]
[0201] 其中,emob(x,y)为场景中(x,y)点处智能体单体机动安全贡献的防御安全强度,Sdam为智能体单元的毁伤幅员面积,ephy(x,y)为场景中(x,y)点处智能体被动防护安全贡献的防御安全强度,Smob为智能体单元的机动范围。
[0202] 可选地,在本申请的一个实施例中,群体协同安全能量的计算公式为:
[0203]
[0204] 其中,esig为单体综合防护安全能量,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量。
[0205] 可选地,在本申请的一个实施例中,评估模块300进一步用于:基于对抗环境中任意一点的防护安全能量,获取在对抗单元自身毁伤幅员内的总防护安全能量,确定预期安全能量场能,其中,预期安全能量场能的计算公式为:
[0206]
[0207] 其中,Esaf为所得的预期安全能量场能,esaf(x,y)为场景中(x,y)点处,智能体群体协同安全贡献的防御安全强度,即群体综合防护安全能量,Sdam为智能体单元的毁伤幅员面积。
[0208] 需要说明的是,前述对面向多智能体对抗场景的防御态势评估方法实施例的解释说明也适用于该实施例的面向多智能体对抗场景的防御态势评估装置,此处不再赘述。
[0209] 根据本申请实施例提出的面向多智能体对抗场景的防御态势评估装置,通过建立安全能量场分层模型,计算对抗环境中的防护安全能量,并对当前时刻的安全能量场态势进行实时更新,进而获得多智能体对抗场景的防御态势评估结果,可针对微观层面上的智能体的具体行为进行评估,智能化程度高,通用性较强且可解释性高,实时性好,可以为后续智能体决策服务。由此,解决了相关技术忽略微观层面上的智能体的具体行为,且缺乏客观物理规律的建模,可解释性低,智能化程度低,实时性差,无法为后续智能体决策服务等问题。
[0210] 图10为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
[0211] 存储器1001、处理器1002及存储在存储器1001上并可在处理器1002上运行的计算机程序。
[0212] 处理器1002执行程序时实现上述实施例中提供的面向多智能体对抗场景的防御态势评估方法。
[0213] 进一步地,电子设备还包括:
[0214] 通信接口1003,用于存储器1001和处理器1002之间的通信。
[0215] 存储器1001,用于存放可在处理器1002上运行的计算机程序。
[0216] 存储器1001可能包含高速RAM存储器,也可能还包括非易失性存储器(non‑volatile memory),例如至少一个磁盘存储器。
[0217] 如果存储器1001、处理器1002和通信接口1003独立实现,则通信接口1003、存储器1001和处理器1002可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0218] 可选的,在具体实现上,如果存储器1001、处理器1002及通信接口1003,集成在一块芯片上实现,则存储器1001、处理器1002及通信接口1003可以通过内部接口完成相互间的通信。
[0219] 处理器1002可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
[0220] 本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的面向多智能体对抗场景的防御态势评估方法。
[0221] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0222] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0223] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
[0224] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0225] 应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0226] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0227] 此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0228] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。