基于语义分割的单目测距方法、装置、设备及存储介质转让专利
申请号 : CN202210001002.7
文献号 : CN114018215B
文献日 : 2022-04-12
发明人 : 张康宁 , 张海强 , 李成军 , 朱磊
申请人 : 智道网联科技(北京)有限公司
摘要 :
权利要求 :
1.一种基于语义分割的单目测距方法,其特征在于,包括:根据自车坐标系,生成地面网格点矩阵;
对单目摄像头采集的前车图像进行语义分割,其中所述前车图像中像素的语义分割的类型包括:道路路面、道路中感兴趣物体;
将所述地面网格点矩阵按照预设投影矩阵转换到所述前车图像上,并根据所述道路路面、所述道路中感兴趣物体,确定所述道路中感兴趣物体的目标网格接地点集,其中所述目标网格接地点集包括若干目标网格接地点;
所述根据所述道路路面、所述道路中感兴趣物体,确定所述道路中感兴趣物体的目标网格接地点集,包括:
通过对所述前车图像进行语义分割,得到所述道路中感兴趣物体最靠近道路路面的轮廓点集{k1、k2、k3、k4、……、kn};
通过语义值矩阵与地面网格点矩阵的映射关系,在所述地面网格点矩阵内确定所述目标网格接地点集{g1、g 2、g 3、g 4、……、g n};
根据所述目标网格接地点集到自车距离,得到单目摄像头的测距结果。
2.根据权利要求1所述的基于语义分割的单目测距方法,其特征在于,所述根据自车坐标系,生成地面网格点矩阵,包括:根据自车坐标系,生成地面网格点矩阵和语义值矩阵,所述地面网格点矩阵的维度与所述语义值矩阵的维度相同;
所述将所述地面网格点按照预设投影矩阵转换到所述前车图像上,并根据所述道路路面、所述道路中感兴趣物体,确定所述道路中感兴趣物体的目标网格接地点集,包括:将所述地面网格点矩阵按照预设投影矩阵转换成与所述前车图像位于同一坐标系下的地面网格点投影矩阵;
根据所述地面网格点投影矩阵获取所述道路路面、所述道路中感兴趣物体的像素值,并将所述像素值存储至所述语义值矩阵中,对所述语义值矩阵进行边缘检测,得到所述道路中感兴趣物体的最靠近所述道路路面的连续轮廓点集;
以最靠近所述道路路面的轮廓点集作为映射索引在所述地面网格点矩阵内找到所述道路中感兴趣物体的目标网格接地点集。
3.根据权利要求2所述的基于语义分割的单目测距方法,其特征在于,所述地面网格点矩阵的长度、宽度及分辨率均可调。
4.根据权利要求2所述的基于语义分割的单目测距方法,其特征在于,所述对单目摄像头采集的前车图像进行语义分割,其中所述前车图像中像素的语义分割的类型包括:道路路面、道路中感兴趣物体,包括:输入所述前车图像至训练好的深度学习模型中;
执行前向预测,通过卷积神经网络对所述前车图像进行像素级分类;
按照语义分割结果内存排列将所述前车图像语义分割成道路路面、道路中感兴趣物体。
5.根据权利要求2所述的基于语义分割的单目测距方法,其特征在于,所述将所述地面网格点矩阵按照预设投影矩阵转换成与所述前车图像位于同一坐标系下的地面网格点投影矩阵,包括:
设定相机坐标系及像素坐标系,其中所述前车图像位于所述像素坐标系下;
获取相机内参矩阵和相机外参矩阵;
根据所述相机外参矩阵将所述地面网格点矩阵转换至相机坐标系下,得到相机网格点矩阵;
根据所述相机内参矩阵将所述相机网格点矩阵转换至像素坐标系下,得到所述地面网格点投影矩阵。
6.根据权利要求2所述的基于语义分割的单目测距方法,其特征在于,所述对所述语义值矩阵进行边缘检测,包括:
设定阈值对所述语义值矩阵二值化处理;
使用Sobel算子检测所述语义值矩阵的轮廓。
7.根据权利要求2所述的基于语义分割的单目测距方法,其特征在于,所述根据所述目标网格接地点集到自车距离,得到单目摄像头的测距结果,包括:根据X轴分量、Y轴分量及Z轴分量,计算单个所述目标网格接地点与所述自车坐标系原点的距离,重复此过程直至把每一目标网格接地点与所述自车坐标系原点的距离计算出,得到待优化距离集,所述待优化距离集包括若干待优化距离;
对所述待优化距离集进行方差计算,若方差大于或者等于额定值时,则对所述待优化距离集进行均值运算得到所述物体距离;若方差小于所述额定值时,则所述物体距离等于最小值的所述待优化距离。
8.一种基于语义分割的单目测距装置,其特征在于,包括:矩阵生成模块,用于根据自车坐标系,生成地面网格点矩阵;
语义分割模块,用于对单目摄像头采集的前车图像进行语义分割,其中所述前车图像中像素的语义分割的类型包括:道路路面、道路中感兴趣物体;
转换模块,用于将所述地面网格点矩阵按照预设投影矩阵转换到所述前车图像上,并根据所述道路路面、所述道路中感兴趣物体,确定所述道路中感兴趣物体的目标网格接地点集,其中所述目标网格接地点集包括若干目标网格接地点;其中所述根据所述道路路面、所述道路中感兴趣物体,确定所述道路中感兴趣物体的目标网格接地点集,包括:通过对所述前车图像进行语义分割,得到所述道路中感兴趣物体最靠近道路路面的轮廓点集{k1、k2、k3、k4、……、kn};通过语义值矩阵与地面网格点矩阵的映射关系,在所述地面网格点矩阵内确定所述目标网格接地点集{g1、g 2、g 3、g 4、……、g n};
测距模块,用于根据所述目标网格接地点集到自车距离,得到单目摄像头的测距结果。
9.一种电子设备,其特征在于,包括:处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至7中任一项所述的方法。
说明书 :
基于语义分割的单目测距方法、装置、设备及存储介质
技术领域
背景技术
最后基于先验假设以及相机成像原理完成对物体的测距。但上述方法存在缺陷,若检测框
无法与物体的轮廓贴合,就需要进一步对检测框内的物体进行更为复杂的细化处理,否则
会影响测距精度,但复杂的细化处理涉及的流程繁琐、耗时耗力,且提取到得到的轮廓点或
者特征点也并不一定满足物体位于地面上的先验假设,这些都会对单目测距的精度产生很
大的影响。
发明内容
述目标网格接地点集包括若干目标网格接地点;
道路中感兴趣物体的最靠近所述道路路面的连续轮廓点集;
出,得到待优化距离集,所述待优化距离集包括若干待优化距离;
等于最小值的所述待优化距离。
接地点集,其中所述目标网格接地点集包括若干目标网格接地点;
兴趣物体,将地面网格点矩阵按照预设投影矩阵转换到前车图像上,并根据道路路面、道路
中感兴趣物体,确定道路中感兴趣物体的目标网格接地点集,其中目标网格接地点集包括
若干目标网格接地点,根据目标网格接地点集到自车距离,得到单目摄像头的测距结果。通
过预设投影矩阵与前车图像进行语义信息关联,得到感兴趣物体离道路路面最近的若干目
标网格接地点,以此提高测距精度。
附图说明
通常代表相同部件。
具体实施方式
相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整
地传达给本领域的技术人员。
形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包
含一个或多个相关联的列出项目的任何或所有可能组合。
在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以
被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更
多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限
定。
测距精度会因检测框无法与物体贴合而无法得到有效地保证。
术方案。
面网格点。地面网格点的坐标为(x,y,0)。
及小猫为道路中感兴趣物体。经过语义分割处理后,就可以识别出当前前车图像具有四个
物体元素。
集包括若干目标网格接地点。
前车图像之间的语义联系。而后根据道路路面、道路中感兴趣物体,确定道路中感兴趣物体
的目标网格接地点集,其中目标网格接地点集包括若干目标网格接地点。目标网格接地点
即道路中感兴趣物体的轮廓边缘离道路路面最近的坐标点。
趣物体,将地面网格点矩阵按照预设投影矩阵转换到前车图像上,并根据道路路面、道路中
感兴趣物体,确定道路中感兴趣物体的目标网格接地点集,其中目标网格接地点集包括若
干目标网格接地点,根据目标网格接地点集到自车距离,得到单目摄像头的测距结果。通过
预设投影矩阵与前车图像进行语义信息关联,得到感兴趣物体离道路路面最近的若干目标
网格接地点,以此提高测距精度。
的地方就是地面网格点。地面网格点的坐标为(x,y,0)。而语义值矩阵则是一个虚拟矩阵,
地面网格点矩阵的维度和语义值矩阵的维度相同,即地面网格点矩阵与语义值矩阵具有对
应关系,但不同在于,地面网格点矩阵为坐标点集合,而语义值矩阵则是用于存储每个地面
网格点对应的像素值。
0.1*0.1m的意思是地面网格点矩阵中小网格的长度及宽度均为0.1m),也可以把地面网格
点矩阵设置成长度为100m,宽度为20m,分辨率为0.2*0.2m的矩阵。用户可以根据实际情况,
灵活设定长度、宽度及分辨率。
及小猫为道路中感兴趣物体。经过语义分割处理后,就可以识别出当前前车图像具有四个
物体元素。
道路中感兴趣物体。
包括卷积层、池化层、上采样层、全连接层及激活函数,最后按照语义分割结果内存排列将
前车图像语义分割成道路路面、道路中感兴趣物体。
下,以此通过地面网格点投影矩阵来建立地面网格点矩阵与前车图像之间的语义联系。
机网格点矩阵;根据相机内参矩阵将相机网格点矩阵转换至像素坐标系下,得到地面网格
点投影矩阵。
程,以地面网格点P(i xi,yi,0)为例说明(地面网格点矩阵由多个地面网格点组成),通过投
影的方式把地面网格点(xi,yi,0)投影至相机坐标系下,地面网格点(xi,yi,0)对应的地面
网格投影点p(i u,v),具体转换公式如下:
的Z坐标。相机内参矩阵和相机外参矩阵都是相机的标定量,是固定不变,用户通过获取相
机参数即可得知。得到地面网格点投影矩阵后,由于地面网格点投影矩阵是由地面网格点
矩阵转换得到的,而地面网格点矩阵的维度又是与语义值矩阵的维度相同的,此时地面网
格点投影矩阵、地面网格点矩阵及语义值矩阵这三者就具有一一对应的关系,即建立了映
射关系。
最靠近道路路面的连续轮廓点集。
内存储有像素值),此时就可以通过地面网格点投影矩阵把语义图像的像素值存储至语义
值矩阵中,随后对存储有像素值得语义值矩阵进行边缘检测,就可以得到连续的轮廓点集,
把轮廓点集的每一轮廓点连接起来,就可以得到道路中感兴趣物体的轮廓线,识别出道路
中感兴趣物体的最靠近道路路面的连续轮廓点集。。
与y轴正方向如图3所示。
投影至前车图像中。(1)式中,pi是像素点,Pi是地面网格点,R是相机外参矩阵,t为相机外
参的平移变量,K为相机内参矩阵,Zc为Pi到相机坐标系下的Z坐标。假如九个点p1(3, 1,
0),点p2(3, 0, 0),点p3(3, ‑1, 0),点p4(2, 1, 0),点p5(2, 0, 0),点p6(2, ‑1, 0),点
p7(1, 1, 0),点p8(1, 0, 0),点p9(1, ‑1, 0)。
义值矩阵被填充的效果如图5中的“赋值后的语义值矩阵”。
户可以根据实际情况自行设定,最后利用Sobel算子检测语义值矩阵的轮廓。本申请的边缘
检测处理,相比于相关技术中的边缘计算方法,无须在二值化处理前对语义值矩阵进行灰
度处理,同时也不需要利用OpenCV将轮廓绘制,大大降低了边缘检测的运算负担,能够简化
繁琐的运算流程。
映射索引,在地面网格点矩阵内找到目标网格接地点集。
集,待优化距离集包括若干待优化距离。对待优化距离集进行方差计算,若方差大于或者等
于额定值时,则对待优化距离进行均值运算得到物体距离;若方差小于额定值时,则物体距
离等于最小值的待优化距离。
点矩阵内找到目标网格接地点集{g1、g 2、g 3、g 4、……、g n},此时就可以通过目标网格接地
点集{g1、g 2、g 3、g 4、……、g n},计算单个目标网格点g(i xi、yi,zi)与自车坐标系原点的距
离,具体公式为:
离,重复此过程直至把每一目标网格点gi与车坐标系原点的距离计算出,得到待优化距离
集{d1、d 2、d 3、d 4、……、d n},最后我们对待优化距离集{d1、d 2、d 3、d 4、……、d n}求方差,
若方差大于或者等于额定值时,则对待优化距离集进行均值运算得到物体距离;若方差小
于额定值时,则物体距离等于最小值的待优化距离di。
图像同一坐标系下的地面网格投影点矩阵,以此来建立地面网格点矩阵、语义值矩阵及地
面网格投影点矩阵这三者的映射关系,即建立三者的语义联系,将对存储有像素值得语义
值矩阵进行边缘检测得到道路中感兴趣物体的最靠近道路路面的连续轮廓点集,以轮廓点
集作为映射索引来匹配出在地面网格点矩阵中的目标网格接地点集,最后以目标网格接地
点集来计算得到物体距离。
格投影点矩阵这三者的映射关系,使得得到的轮廓线能够贴合语义分割结果出来的物体语
义图像的轮廓,使得后续映射得到的目标网格接地点集也能够贴合物体语义图像的轮廓,
以此提高测距精度。
标网格接地点集包括若干目标网格接地点;
割的类型包括:道路路面、道路中感兴趣物体,转换模块830将地面网格点矩阵按照预设投
影矩阵转换到前车图像上,并根据道路路面、道路中感兴趣物体,确定道路中感兴趣物体的
目标网格接地点集,其中目标网格接地点集包括若干目标网格接地点,测距模块840根据目
标网格接地点集到自车距离,得到单目摄像头的测距结果。通过预设投影矩阵与前车图像
进行语义信息关联,得到感兴趣物体离道路路面最近的若干目标网格接地点,以此提高测
距精度。
单元832和映射单元833。
兴趣物体的最靠近道路路面的连续轮廓点集。
(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field‑
Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器
等。
令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不
会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用
大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存
储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者
易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器
在运行时需要的指令和数据。此外,存储器1200可以包括任意计算机可读存储媒介的组合,
包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘
和/或光盘也可以采用。在一些实施方式中,存储器1200可以包括可读和/或写的可移除的
存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD‑ROM,双层DVD‑ROM)、只读蓝
光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro‑SD卡等)、磁性软盘等。计算机可
读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
程序代码指令。
可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,
使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨
在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的
其他普通技术人员能理解本文披露的各实施例。