一种基于视觉和毫米波融合的全天候目标检测方法转让专利
申请号 : CN202011595732.1
文献号 : CN112835037B
文献日 : 2021-12-07
发明人 : 张新钰 , 刘华平
申请人 : 清华大学
摘要 :
权利要求 :
1.一种基于视觉与毫米波融合的全天候目标检测方法,所述方法包括:使用车载相机和毫米波雷达两种传感器,同时采集连续的图像数据和点云数据;
对图像数据和点云数据进行预处理;
使用预先建立的融合模型对预处理后图像数据和点云数据进行融合,输出融合后的特征图;
将融合后的特征图输入YOLOv5的检测网络进行检测,采用非极大值抑制输出目标检测结果;
所述融合模型包括:特征提取模块和特征融合模块;
所述特征提取模块包括第一特征提取通道、第二特征提取通道以及三个特征拼接单元;第一特征提取通道采用三个依次连接的卷积单元,对雷达点云的散射截面强度信息进行特征提取;第二特征提取通道采用包括三个卷积单元的CSPDarkNet53,对图像数据的特征进行提取;
所述第一特征提取通道的第一个卷积单元对点云数据的散射截面强度信息进行处理得到第一RCS特征,将第一RCS特征输出至第一拼接单元;CSPDarkNet53的第一个卷积单元对图像数据进行处理得到第一视觉特征,将第一视觉特征输出至第一拼接单元;第一拼接单元将第一RCS特征和第一视觉特征进行拼接,生成融合特征图F1并输出至特征融合模块;
所述第一特征提取通道的第二个卷积单元对第一RCS特征进行处理得到第二RCS特征,将第二RCS特征输出至第二拼接单元;CSPDarkNet53的第二个卷积单元对第一视觉特征进行处理得到第二视觉特征,将第二视觉特征输出至第二拼接单元;第二拼接单元将第二RCS特征和第二视觉特征进行拼接,生成融合特征图F2并输出至特征融合模块;
所述第一特征提取通道的第三个卷积单元对第二RCS特征进行处理得到第三RCS特征,将第三RCS特征输出至第三拼接单元;CSPDarkNet53的第三个卷积单元对第二视觉特征进行处理得到第三视觉特征,将第三视觉特征输出至第三拼接单元;第三拼接单元将第三RCS特征和第三视觉特征进行拼接,生成融合特征图F3并输出至特征融合模块;
所述特征融合模块包括:第三特征提取通道、三个融合单元和PANet结构;第三特征提取通道采用三个依次连接的卷积单元;
所述第三特征提取通道的第一个卷积单元对点云数据的距离信息和速度信息进行处理得到第一点云特征,将第一点云特征输出至第一融合单元;第一融合单元将第一点云特征和融合特征图F1进行像素级叠加,生成融合特征图P1并输出至PANet结构;
所述第三特征提取通道的第二个卷积单元对第一点云特征进行处理得到第二点云特征,将第二点云特征输出至第二融合单元;第二融合单元将第二点云特征和融合特征图F2进行像素级叠加,生成融合特征图P2并输出至PANet结构;
所述第三特征提取通道的第三个卷积单元对第二点云特征进行处理得到第三点云特征,将第三点云特征输出至第三融合单元;第三融合单元将第三点云特征和融合特征图F3进行像素级叠加,生成融合特征图P3并输出至PANet结构;
融合特征图P1,融合特征图P2和融合特征图P3经过PANet结构,分别输出特征图A1,特征图A2和特征图A3。
2.根据权利要求1所述的基于视觉与毫米波融合的全天候目标检测方法,其特征在于,所述方法还包括:对两种传感器的坐标系进行坐标系标定。
3.根据权利要求1所述的基于视觉与毫米波融合的全天候目标检测方法,其特征在于,所述对图像数据和点云数据进行预处理;具体包括:对毫米波雷达的点云数据进行补全;以及对车载相机的图像数据进行补全。
4.根据权利要求3所述的基于视觉与毫米波融合的全天候目标检测方法,其特征在于,所述方法还包括:融合模型的训练步骤,具体包括:建立训练集;
对超参数进行设置,包括:初始学习率lr=0.001,每次更新参数使用的批量值b=32,迭代训练次数为epoch=300,优化器采用SGD;
对损失函数进行设置,包括:在分类方面采用二值交叉熵损失函数,回归损失函数采用GIOU损失函数;对学习率的进行更新并使用余弦退火策略进行降低;
基于nuScenes数据集和自行采集的道路目标数据集,以及设置的参数对融合模型的参数进行训练。
5.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1‑4任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行权利要求1‑4任一项所述的方法。
说明书 :
一种基于视觉和毫米波融合的全天候目标检测方法
技术领域
背景技术
驾驶基础功能。其中环境感知可以为汽车反馈道路信息,以便修正对驾驶行为的控制,从而
提高驾驶的安全性和舒适性。
场景下稳定的环境感知,因此学者通常会增加不同的传感器进行融合感知,其中毫米波雷
达的毫米波波段的电磁波不会受到雨、雾、灰尘等常见的环境因素影响,在这些场景下都能
顺利工作,且相机、毫米波雷达价格低的优势使基于视觉、毫米波雷达融合的车辆感知系统
极易大规模商用部署。
都对目标检测能力有巨大影响。
发明内容
用RCS(散射截面强度)、距离信息和速度信息以不同的方式与视觉信息进行融合并进行目
标检测,提升在强光、大雾、夜间等复杂场景下的检测精度和鲁棒性。
进行特征提取;第二特征提取通道采用包括三个卷积单元的CSPDarkNet53,对图像数据的
特征进行提取;
对图像数据进行处理得到第一视觉特征,将第一视觉特征输出至第一拼接单元;第一拼接
单元将第一RCS特征和第一视觉特征进行拼接,生成融合特征图F1并输出至特征融合模块;
行处理得到第二视觉特征,将第二视觉特征输出至第二拼接单元;第二拼接单元将第二RCS
特征和第二视觉特征进行拼接,生成融合特征图F2并输出至特征融合模块;
行处理得到第三视觉特征,将第三视觉特征输出至第三拼接单元;第三拼接单元将第三RCS
特征和第三视觉特征进行拼接,生成融合特征图F3并输出至特征融合模块;
征和融合特征图F1进行像素级叠加,生成融合特征图P1并输出至PANet结构;
进行像素级叠加,生成融合特征图P2并输出至PANet结构;
进行像素级叠加,生成融合特征图P3并输出至PANet结构;
的方法。
法。
是通过分析毫米波雷达点云不同的特征,用不同的特征提取结构和方式与图像信息进行融
合,使两种传感器数据优势互补,提升了车辆在复杂道路场景下的感知能力,提高了目标检
测的准确性。
附图说明
用于限定本发明。
流的思路是在毫米波雷达点云和相机图像上分别进行目标检测,再对检测结果进行融合,
这种方法没有充分利用两种传感器数据之间信息的互补作用。还有一种主流思路是将毫米
波雷达点云映射到相机图像平面生成点云图像,用毫米波雷提供的速度、方向、反射强度等
多种信息进行融合,这类方法不加区分的将所有毫米波点云信息与图像信息进行特征融
合,没有考虑到不同信息的特有属性,也没有充分利用二者信息的互补性。本发明经过分析
毫米波点云不同信息的特征,将不同的信息以不同的方式与图像信息融合,充分利用二者
信息的互补性。
点云信息转化为较为密集的线簇,这种对毫米波雷达点云的预处理方法在一些学者的研究
中已经应用,本发明也只是采用了这种相似预处理手段,重点在于融合方法的不同。
cuda10.0+cudnn8.0+python3.7。
层提取特征形成和图像特征尺寸相同的特征张量,然后二者特征进行通道叠加生成融合特
征,形成互补的语义信息;然后进入下一阶段的特征提取模块分别提取特征,经过三个阶段
的不断地融合,最终的融合特征通过SPP结构生成特征金字塔。
空间中重要的区域的特征的学习。对于距离较远或者速度较高的目标所反馈的点云,在特
征上有着更高的权重,这样用来提高对于距离较远和速度较快的目标的检测精度。融合方
式采用逐像素相加(Addition),来增强空间中重要的区域的特征的学习。对于距离较远或
者速度较高的目标所反馈的点云,在特征上有着更高的权重,这样用来增强对于距离较远
和速度较快的目标的检测效果,检测部分采用了YOLOv5的检测算法,检测结果上采用NMS
(非极大值抑制)输出检测结果效果图。
行特征提取;第二特征提取通道采用包括三个卷积单元的CSPDarkNet53,对图像数据的特
征进行提取;
对图像数据进行处理得到第一视觉特征,将第一视觉特征输出至第一拼接单元;第一拼接
单元将第一RCS特征和第一视觉特征进行拼接,生成融合特征图F1并输出至特征融合模块;
行处理得到第二视觉特征,将第二视觉特征输出至第二拼接单元;第二拼接单元将第二RCS
特征和第二视觉特征进行拼接,生成融合特征图F2并输出至特征融合模块;
行处理得到第三视觉特征,将第三视觉特征输出至第三拼接单元;第三拼接单元将第三RCS
特征和第三视觉特征进行拼接,生成融合特征图F3并输出至特征融合模块;
征和融合特征图F1进行像素级叠加,生成融合特征图P1并输出至PANet结构;
进行像素级叠加,生成融合特征图P2并输出至PANet结构;
进行像素级叠加,生成融合特征图P3并输出至PANet结构;
系统用于实现这些组件之间的连接通信。总线系统除包括数据总线之外,还包括电源总线、
控制总线和状态信号总线。其中,用户接口可以包括显示器、键盘或者点击设备(例如,鼠
标,轨迹球(track ball)、触感板或者触摸屏等。
(Read‑Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只
读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,
EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用
作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取
存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取
存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data
Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步
连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器
(Direct Rambus RAM,DRRAM)。本文描述的存储器旨在包括但不限于这些和任意其它适合
类型的存储器。
(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本公开实施例方法的
程序可以包含在应用程序中。
件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号
处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific
Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)
或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行
实施例1中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也
可以是任何常规的处理器等。结合实施例1所公开的方法的步骤可以直接体现为硬件译码
处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位
于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器
等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其
硬件完成上述方法的步骤。
(Application Specific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal
Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable
Logic Device,PLD)、现场可编程门阵列(Field‑Programmable Gate Array,FPGA)、通用处
理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
外部实现。
实施例3
案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明
的权利要求范围当中。