一种基于多域注意力机制的无人机检测方法及系统转让专利
申请号 : CN202111389310.3
文献号 : CN113822383B
文献日 : 2022-03-15
发明人 : 罗远哲 , 刘瑞景 , 徐盼云 , 梅轶纯 , 郑玉洁 , 吴鹏 , 刘志明 , 李文静 , 孟小钰
申请人 : 北京中超伟业信息安全技术股份有限公司
摘要 :
权利要求 :
1.一种基于多域注意力机制的无人机检测方法,其特征在于,包括:构建无人机检测图像数据集;无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像,无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像;
构建基于多域注意力机制的无人机检测网络;
采用所述无人机检测图像数据集对所述无人机检测网络进行训练,获得无人机检测模型;
利用所述无人机检测模型对待检测图像进行无人机检测;
所述无人机检测网络包括骨干网络、多尺度特征融合网络、多域注意力机制模块、区域生成网络、ROI Align层和检测头;
所述骨干网络包括依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块;
所述多尺度特征融合网络用于对所述第五卷积块的输出进行卷积核为1*1的卷积操作,获得特征图F5;所述多尺度特征融合网络还用于将对所述特征图F5进行上采样操作后的特征图与对所述第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F4;所述多尺度特征融合网络还用于将对所述特征图F4进行上采样操作后的特征图与对所述第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F3;所述多尺度特征融合网络还用于将对所述特征图F3进行上采样操作后的特征图与对所述第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F2;
所述多域注意力机制模块用于对所述特征图F5进行全局平均池化,获得通道域特征图;所述多域注意力机制模块还用于将所述通道域特征图分别与所述特征图F5、所述特征图F4、所述特征图F3和所述特征图F2相乘,获得对应的特征图M5、特征图M4、特征图M3和特征图M2;所述多域注意力机制模块还用于对所述特征图F2进行卷积核为1*1的卷积操作,获得空间域特征图;所述多域注意力机制模块还用于将所述空间域特征图与所述特征图M2相乘,获得特征图D2;所述多域注意力机制模块还用于将所述空间域特征图进行一次核为2*2的最大池化操作后与所述特征图M3相乘,获得特征图D3,将所述空间域特征图进行最大池化操作后的特征图与所述特征图M3空间维度相同;所述多域注意力机制模块还用于将所述空间域特征图进行两次核为2*2的最大池化操作后与所述特征图M4相乘,获得特征图D4;所述多域注意力机制模块还用于将所述空间域特征图进行三次核为2*2的最大池化操作后与所述特征图M5相乘,获得特征图D5;
所述特征图D5、所述特征图D4、所述特征图D3和所述特征图D2输入所述区域生成网络;
所述区域生成网络的输出连接所述ROI Align层,所述ROI Align层连接检测头。
2.根据权利要求1所述的基于多域注意力机制的无人机检测方法,其特征在于,所述ROI Align层输出的各候选区域特征图的尺寸相同。
3.根据权利要求1所述的基于多域注意力机制的无人机检测方法,其特征在于,所述检测头包括分类支路和回归支路;所述分类支路的损失函数为二分类交叉熵损失函数,所述回归支路的损失函数为平衡损失函数。
4.根据权利要求1所述的基于多域注意力机制的无人机检测方法,其特征在于,所述构建无人机检测图像数据集,具体包括:采用标注软件标注出各无人机检测图像中无人机的位置;
通过对标注后的无人机检测图像进行旋转和加噪处理,增多无人机检测图像的数量。
5.一种基于多域注意力机制的无人机检测系统,其特征在于,包括:数据集构建模块,用于构建无人机检测图像数据集;无人机检测图像数据集中图像包括利用可见光摄像头拍摄的不同型号的无人机的飞行视频转换后获得的图像,无人机检测图像数据集中图像还包括通过网络爬虫下载的包含无人机的图像;
无人机检测网络构建模块,用于构建基于多域注意力机制的无人机检测网络;
模型训练模块,用于采用所述无人机检测图像数据集对所述无人机检测网络进行训练,获得无人机检测模型;
无人机检测模块,用于利用所述无人机检测模型对待检测图像进行无人机检测;
所述无人机检测网络包括骨干网络、多尺度特征融合网络、多域注意力机制模块、区域生成网络、ROI Align层和检测头;
所述骨干网络包括依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块;
所述多尺度特征融合网络用于对所述第五卷积块的输出进行卷积核为1*1的卷积操作,获得特征图F5;所述多尺度特征融合网络还用于将对所述特征图F5进行上采样操作后的特征图与对所述第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F4;所述多尺度特征融合网络还用于将对所述特征图F4进行上采样操作后的特征图与对所述第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F3;所述多尺度特征融合网络还用于将对所述特征图F3进行上采样操作后的特征图与对所述第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F2;
所述多域注意力机制模块用于对所述特征图F5进行全局平均池化,获得通道域特征图;所述多域注意力机制模块还用于将所述通道域特征图分别与所述特征图F5、所述特征图F4、所述特征图F3和所述特征图F2相乘,获得对应的特征图M5、特征图M4、特征图M3和特征图M2;所述多域注意力机制模块还用于对所述特征图F2进行卷积核为1*1的卷积操作,获得空间域特征图;所述多域注意力机制模块还用于将所述空间域特征图与所述特征图M2相乘,获得特征图D2;所述多域注意力机制模块还用于将所述空间域特征图进行一次核为2*2的最大池化操作后与所述特征图M3相乘,获得特征图D3,将所述空间域特征图进行最大池化操作后的特征图与所述特征图M3空间维度相同;所述多域注意力机制模块还用于将所述空间域特征图进行两次核为2*2的最大池化操作后与所述特征图M4相乘,获得特征图D4;所述多域注意力机制模块还用于将所述空间域特征图进行三次核为2*2的最大池化操作后与所述特征图M5相乘,获得特征图D5;
所述特征图D5、所述特征图D4、所述特征图D3和所述特征图D2输入所述区域生成网络;
所述区域生成网络的输出连接所述ROI Align层,所述ROI Align层连接检测头。
6.根据权利要求5所述的基于多域注意力机制的无人机检测系统,其特征在于,所述ROI Align层输出的各候选区域特征图的尺寸相同。
7.根据权利要求5所述的基于多域注意力机制的无人机检测系统,其特征在于,所述检测头包括分类支路和回归支路;所述分类支路的损失函数为二分类交叉熵损失函数,所述回归支路的损失函数为平衡损失函数。
8.根据权利要求5所述的基于多域注意力机制的无人机检测系统,其特征在于,所述数据集构建模块具体包括:
标注单元,用于采用标注软件标注出各无人机检测图像中无人机的位置;
图像处理单元,用于通过对标注后的无人机检测图像进行旋转和加噪处理,增多无人机检测图像的数量。
说明书 :
一种基于多域注意力机制的无人机检测方法及系统
技术领域
背景技术
题,对社会与军事安全构成了严重威胁。实现无人机的快速精确识别是进行无人机监管和
反制的基础。由于强大的特征表达能力和出色的检测效率,基于卷积神经网络的目标检测
技术得到了专家学者的广泛研究,能够为无人机识别提供可靠的技术途径。
这使得无人机的精确检测成为目标检测领域的一大难点。现有算法多采用多尺度特征融合
技术来解决无人机检测中的尺度变化问题(曹靖豪,张俊举,黄维,姚若彤,张平.基于多尺
度特征融合的无人机识别与检测[J].空天防御,2021,4(01):60‑64+70.),但对如何从丰富
的特征信息中筛选出有助于无人机识别定位的关键特征则研究较少。因此,亟需探索一种
能精确识别和定位无人机的方法。
发明内容
后的特征图与对所述第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素
级相加,获得特征图F4;所述多尺度特征融合网络还用于将对所述特征图F4进行上采样操
作后的特征图与对所述第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元
素级相加,获得特征图F3;所述多尺度特征融合网络还用于将对所述特征图F3进行上采样
操作后的特征图与对所述第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行
元素级相加,获得特征图F2;
征图F3和所述特征图F2相乘,获得对应的特征图M5、特征图M4、特征图M3和特征图M2;所述
多域注意力机制模块还用于对所述特征图F2进行卷积核为1*1的卷积操作,获得空间域特
征图;所述多域注意力机制模块还用于将所述空间域特征图与所述特征图M2相乘,获得特
征图D2;所述多域注意力机制模块还用于将所述空间域特征图进行一次核为2*2的最大池
化操作后与所述特征图M3相乘,获得特征图D3,将所述空间域特征图进行最大池化操作后
的特征图与所述特征图M3空间维度相同;所述多域注意力机制模块还用于将所述空间域特
征图进行两次核为2*2的最大池化操作后与所述特征图M4相乘,获得特征图D4;所述多域注
意力机制模块还用于将所述空间域特征图进行三次核为2*2的最大池化操作后与所述特征
图M5相乘,获得特征图D5;
网络爬虫下载的包含无人机的图像。
后的特征图与对所述第四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素
级相加,获得特征图F4;所述多尺度特征融合网络还用于将对所述特征图F4进行上采样操
作后的特征图与对所述第三卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元
素级相加,获得特征图F3;所述多尺度特征融合网络还用于将对所述特征图F3进行上采样
操作后的特征图与对所述第二卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行
元素级相加,获得特征图F2;
征图F3和所述特征图F2相乘,获得对应的特征图M5、特征图M4、特征图M3和特征图M2;所述
多域注意力机制模块还用于对所述特征图F2进行卷积核为1*1的卷积操作,获得空间域特
征图;所述多域注意力机制模块还用于将所述空间域特征图与所述特征图M2相乘,获得特
征图D2;所述多域注意力机制模块还用于将所述空间域特征图进行一次核为2*2的最大池
化操作后与所述特征图M3相乘,获得特征图D3,将所述空间域特征图进行最大池化操作后
的特征图与所述特征图M3空间维度相同;所述多域注意力机制模块还用于将所述空间域特
征图进行两次核为2*2的最大池化操作后与所述特征图M4相乘,获得特征图D4;所述多域注
意力机制模块还用于将所述空间域特征图进行三次核为2*2的最大池化操作后与所述特征
图M5相乘,获得特征图D5;
网络爬虫下载的包含无人机的图像。
息,并通过相乘操作逐层生成包含多域注意力信息的加权特征图,从而引导各层特征图更
加关注无人机目标所在位置,提高了无人机识别精度,另外多域注意力机制模块主要基于
池化层构建,有效降低了网络计算复杂度。
附图说明
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
具体实施方式
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
包含无人机的图像。即采用两种方式进行图像采集,第一种:在不同背景、天气情况下,利用
可见光摄像头拍摄不同型号无人机的飞行视频,并将飞行视频转换为图像帧,获得无人机
图像;第二种:通过网络爬虫下载包含无人机的图像。
块的输出连接第五卷积块的输入。
四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F4;
多尺度特征融合网络还用于将对特征图F4进行上采样操作后的特征图与对第三卷积块的
输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F3;多尺度特征
融合网络还用于将对特征图F3进行上采样操作后的特征图与对第二卷积块的输出进行卷
积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F2。
得对应的特征图M5、特征图M4、特征图M3和特征图M2;多域注意力机制模块还用于对特征图
F2进行卷积核为1*1的卷积操作,获得空间域特征图;多域注意力机制模块还用于将空间域
特征图与特征图M2相乘,获得特征图D2;多域注意力机制模块还用于将空间域特征图进行
一次核为2*2的最大池化操作后与特征图M3相乘,获得特征图D3,将空间域特征图进行最大
池化操作后的特征图与特征图M3空间维度相同;多域注意力机制模块还用于将空间域特征
图进行两次核为2*2的最大池化操作后与特征图M4相乘,获得特征图D4;多域注意力机制模
块还用于将空间域特征图进行三次核为2*2的最大池化操作后与特征图M5相乘,获得特征
图D5。
C3:128×128×512、C4:64×64×1024、C5:32×32×2048。
图的通道数统一。接下来,将C5对应的输出特征图命名为F5。对F5进行上采样操作,通过双
线性插值法将F5尺寸放大为原来的2倍,并与相等尺寸的C4对应的输出特征图进行元素级
相加,从而得到F4。依次对F4和F3进行上述特征融合操作,从而得到F3和F2特征图。至此,获
得特征图F2、F3、F4、F5,其对应尺寸依次为256×256×256、128×128×256、64×64×256、
32×32×256。此处构建的多尺度特征融合网络结构通过为每层特征图融合来自相邻高层
具有丰富语义信息的高质量特征,来提升网络对不同尺寸无人机的识别能力。
全局平均池化(Global Average Pooling)操作,获得尺寸为1×1×256的通道域特征图Ch,
将通道域特征图Ch分别与F5、F4、F3、F2相乘,得到包含全局信息的特征图M5、M4、M3、M2。对
上一步所得低层特征图F2进行一次卷积核为1*1的卷积操作,将通道数变换为1,获得尺寸
为256×256×1的空间域特征图Sp,将空间域特征图Sp与M2相乘,获得特征图D2。对特征图
Sp进行一次核为2*2的最大池化(Max Pooling)操作,获得与M3空间维度相同的特征图,并
与M3相乘,获得特征图D3。对特征图Sp进行两次核为2*2的最大池化(Max Pooling)操作,并
与M4相乘,获得特征图D4。对特征图Sp进行三次核为2*2的最大池化(Max Pooling)操作,并
与M5相乘,获得特征图D5。至此,获得特征图D2、D3、D4、D5,其对应尺寸依次为256×256×
256、128×128×256、64×64×256、32×32×256。此处构建的多域注意力机制(MDAM)从高
层特征图提炼出通道域注意力信息,从低层特征图提炼出有助于无人机定位的空间域注意
力信息,并通过相乘操作逐层生成包含多域注意力信息的加权特征图,从而引导各层特征
图更加关注无人机目标所在位置。且该网络主要基于池化层构建,有效降低了网络的计算
复杂度。
得目标候选区域。
(Binary Crossentropy Loss)进行无人机与背景信息的分类,确定候选区域特征图是否为
无人机目标;利用平衡损失函数(Balanced L1 Loss)完成边框回归操作,从而获得无人机
的具体位置信息。整个卷积神经网络的损失值由二分类交叉熵损失值和平衡损失值相加所
得。
失函数为二分类交叉熵损失函数与平衡损失函数之和。
化识别。本发明方法可被应用于军用民用机场、重大活动场所、保密区域等多种场景,实现
无人机的快速精准识别,并为无人机的监管与反制提供支持,维护公共与军事安全。
了网络对无人机目标的检测准确率。
意力信息,从低层特征图提炼出有助于无人机定位的空间域注意力信息,并为每个特征层
生成包含多域注意力信息的加权特征图,从而引导各层特征图更加关注无人机目标所在位
置,有助于网络从丰富的特征信息中提取出最关键有用的特征,从而提高网络对无人机目
标的定位能力。
包含无人机的图像。
无人机检测模型。损失函数为二分类交叉熵损失函数与平衡损失函数之和。
四卷积块的输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F4;
多尺度特征融合网络还用于将对特征图F4进行上采样操作后的特征图与对第三卷积块的
输出进行卷积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F3;多尺度特征
融合网络还用于将对特征图F3进行上采样操作后的特征图与对第二卷积块的输出进行卷
积核为1*1的卷积操作后的特征图进行元素级相加,获得特征图F2;
得对应的特征图M5、特征图M4、特征图M3和特征图M2;多域注意力机制模块还用于对特征图
F2进行卷积核为1*1的卷积操作,获得空间域特征图;多域注意力机制模块还用于将空间域
特征图与特征图M2相乘,获得特征图D2;多域注意力机制模块还用于将空间域特征图进行
一次核为2*2的最大池化操作后与特征图M3相乘,获得特征图D3,将空间域特征图进行最大
池化操作后的特征图与特征图M3空间维度相同;多域注意力机制模块还用于将空间域特征
图进行两次核为2*2的最大池化操作后与特征图M4相乘,获得特征图D4;多域注意力机制模
块还用于将空间域特征图进行三次核为2*2的最大池化操作后与特征图M5相乘,获得特征
图D5;
而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说
明即可。
本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不
应理解为对本发明的限制。