基于边缘检测的单阶段目标检测方法转让专利
申请号 : CN202110675466.1
文献号 : CN113450321B
文献日 : 2022-05-03
发明人 : 桂盛霖 , 张瑞琼
申请人 : 电子科技大学
摘要 :
权利要求 :
1.一种基于边缘检测的单阶段目标检测算法,包括以下步骤:S1)机舱门数据集的获取和处理采集至少600张真实机舱门的图片以及至少300张模型机舱门的图片,获得机舱门数据集D,并划分为训练集、验证集以及测试集;对所有图片中的机舱门进行边框标注、物体所属类别标注,获得目标检测任务的标签;同时对机舱门进行轮廓标注,获得边缘检测任务的标签;对训练集图像进行数据增强预处理,包括对图像进行旋转、平移、放缩、调整图像亮度以及对比度;
S2)建立目标检测网络模型
所述目标检测网络模型由不含全连接层的基础特征提取网络VGG‑16、目标检测分支a、以及边缘检测分支b三部分组成;
具体地:
所述目标检测分支a连接在基础特征提取网络VGG‑16后;所述目标检测分支a包含顺序连接的3×3卷积conv6、1×1卷积conv7、至少4个新增卷积层、以及检测器;
所述3×3卷积conv6采用带孔卷积的结构,通过设置扩张率参数,来改变扩张的尺寸;
所述新增卷积层为卷积核大小为3×3的卷积层;
将全部新增卷积层、1×1卷积conv7、以及基础特征提取网络VGG‑16的conv4_3输出的不同尺度的特征图输入到检测器中进行预测,得到初始的物体边框坐标以及类别置信度的预测结果;再通过非极大值抑制得到最终的物体边框坐标以及类别置信度的预测结果;
所述边缘检测分支b连接在基础的特征提取网络VGG‑16后;所述边缘检测分支b包含顺序连接的conv6网络层、Deconv6网络层、5个反池化层、以及sigmoid网络层,其中每个反池化层后接有一个3×3卷积层;
所述conv6网络层用于扩充基础特征提取网络VGG‑16输出特征图的通道数;
所述Deconv6网络层用于减少特征图的通道数;
每个所述反池化层均用于扩大特征图的尺度为输入该反池化层的两倍,使得该层输出的特征图尺寸和基础特征提取网络VGG‑16对应层输出的特征图大小相同;
所述sigmoid网络层用于将输入的通道数为1的特征图像素值归一化到0‑1范围内,从而得到最终的机舱门边缘检测的预测结果;
S3)计算目标检测任务的损失以及边缘检测任务的损失将数据集D中训练集的图片划分为若干个batch,并输入到目标检测网络模型中;分别计算目标检测任务的损失和边缘检测任务的损失,其中目标检测任务的损失包含类别置信度损失和物体边框坐标损失;
S4)反向传播更新网络参数
将步骤S3)得到的损失相加,并自适应的调整各个损失的权重,使得各任务的损失同步收敛;反向传播更新网络参数,得到多个训练好的预选目标检测网络模型;
S5)验证
将验证集的图片输入到预选目标检测网络模型中进行验证,选取预测结果最优的预选目标检测网络模型作为最终的目标检测网络模型;
S6)测试
将测试集的图片输入到最终的目标检测网络模型中进行检测,得到检测结果并计算检测精度。
2.如权利要求1所述一种基于边缘检测的单阶段目标检测算法,其特征在于,将所述不含全连接层的基础特征提取网络VGG‑16的第五个最大池化层替换为窗口大小为3×3,步长为1的池化层。
说明书 :
基于边缘检测的单阶段目标检测方法
技术领域
背景技术
自动化识别与跟踪,可以提高机场运行效率和机场的智能化程度。而在真实机场中有时不
仅需要检测到物体,还需要识别物体的轮廓,比如实现登机桥的自动对接问题,只有获取机
舱门位置的同时,识别出机舱门的轮廓信息,才能实现登机桥自动精准对接。因此,研究物
体轮廓检测在单阶段目标检测算法中的关键技术可为智慧机场提供技术支撑。
标的边界框,以及预测每个目标的所属类别。众多学者们为了提高目标检测技术的精度以
及效率,构建了VGG、GoogleNet、ResNet等特征提取网络。基于深度学习的目标检测算法可
以分为双阶段目标检测算法以及单阶段目标检测算法。双阶段目标检测算法即首先需要产
生区域建议,然后再进一步修正建议的边框坐标以及所属类别。单阶段目标检测算法即省
去了区域建议的步骤,直接使用卷积预测物体的边框坐标以及所属类别。其中,Liu等人提
出的单阶段目标检测算法SSD(Liu W,Anguelov D,Erhan D,Szegedy C,Reed S,Fu C Y
and Berg A C.2016.SSD:single shot MultiBox detector//Proceedings of the 14th
European Conference on Computer Vision.Amsterdam:Springer:21‑37)在保持较高的
检测精度的前提下,依然可以达到较快的检测速度,使得检测精度与速度达到了平衡。
别等众多领域里都发挥着重要作用。图像边缘检测的方法可以分为传统边缘检测方法以及
基于深度学习的边缘检测方法。其中,在基于深度学习的边缘检测方法中,Yang等人提出的
CEDN(YANG J,PRICE B,COHEN S,et al.Object contour detection with a fully
convolutional encoder‑decoder network[C]//Proceedings of the 2016 IEEE
Conference on Computer Vision and Pattern Recognition.Piscataway:IEEE,2016:
193‑202.)是用于检测物体轮廓的算法,该算法使用了全卷积编码器解码器的神经网络架
构来提取高层的特征。其中编码网络使用的是VGG‑16,编码网络的作用是提取特征,固定网
络参数,通过第六个卷积层后,输出高维特征图,随后输入到用于解码的网络层。解码器是
由若干个反池化以及反卷积构成的,解码网络最终输出原图大小的特征图与物体轮廓标签
计算损失,使预测的特征图更贴近于给定的标签。不同于以往的低水平边缘检测算法,该算
法更加关注图像中物体的轮廓,而忽视背景的边缘。
普遍都存在只能预测物体的边框位置,无法精确到物体轮廓的缺点。
发明内容
网络VGG‑16的参数,让网络在预测物体所属类别以及边框坐标的同时,预测图像中物体的
轮廓,从而利用物体轮廓的坐标,约束误差较大的预测边框。
所属类别标注,获得目标检测任务的标签;同时对机舱门进行轮廓标注,获得边缘检测任务
的标签。对训练集图像进行数据增强预处理,包括对图像进行旋转、平移、放缩、调整图像亮
度以及对比度。
度的预测结果;再通过非极大值抑制得到最终的物体边框坐标以及类别置信度的预测结
果。
反池化层后接一个3×3卷积层。
置信度损失和物体边框坐标损失。
的参数,由于目标检测任务预测边框坐标和边缘检测任务都需要物体轮廓周围的特征,使
得两个任务互相影响。在训练过程中,网络层输出的特征图中物体轮廓周围的特征更加的
明显,即特征图中物体轮廓周围的最大响应值比单独训练某个任务的最大响应值更加突
出,加强了图像中物体特征的提取,而弱化了背景特征的提取,从而分别提高了目标检测任
务和边缘检测任务的正确率。
附图说明
法对机舱门的边框检测的预测结果,且该边框利用了机舱门的轮廓坐标进行了约束。
具体实施方式
不同类型以及包含不同程度阴影的机舱门图片。其次在整理出的模型机舱门视频中截取出
300张图片,其中包括不同天气状况下以及包含不同程度阴影的模型机图片。获取的机舱门
图片如图1所示。
处理,包括对图像进行旋转、平移、放缩、调整图像亮度以及对比度。
杂度。
卷积conv6为了和池化层的变化相匹配,采用了带孔卷积的结构,通过设置扩张率参数,来
改变扩张的尺寸,在不提升模型复杂度和增加参数量的前提下,使卷积的感受野得到指数
级扩张。采用4个卷积核大小为3×3的新增卷积层来代替VGG‑16的dropout层以及第八个全
连接层。然后将全部新增卷积层、1×1卷积conv7、以及基础特征提取网络VGG‑16的conv4_3
输出的不同尺度的特征图输入到检测器中进行预测,得到初始的物体边框坐标以及类别置
信度的预测结果,其中不同尺度的特征图大小分别为38×38、19×19、10×10、5×5、3×3、1
×1;再通过非极大值抑制滤除误差较大以及重合度过大的预测边框,得到最终的物体边框
坐标以及类别置信度的预测结果。
层,其中每个反池化层后接一个3×3卷积层。
参数以及降低模型复杂度。之后的每一个反池化层,用于扩大特征图的尺度为输入该网络
层的两倍,使得该层输出的特征图尺寸和基础特征提取网络VGG‑16对应层输出的特征图大
小相同,最终输出特征通道数为1的原图大小的特征图。然后通过sigmoid网络层将输入的
通道数为1的特征图像素值归一化到0‑1范围内,从而得到最终的边缘预测结果图。
练过程中,网络层输出的特征图中物体轮廓周围的特征更加的明显,即特征图中物体轮廓
周围的最大响应值比单独训练某个任务的最大响应值更加突出,加强了图像中物体特征的
提取,而弱化了背景特征的提取,从而分别提高了目标检测任务和边缘检测任务的正确率。
验框预测的类别置信度,同时物体的所属类别为背景;Pos表示正样本集合;Neg表示负样本
集合;n表示正样本的数量。
测边框的位置总称;g表示真实目标的位置总称; 表示第k层特征图中所设的第i个先验
框和第j个真实目标匹配,k的取值范围为[1,6];其中smoothL1函数具体的计算公式如下所
示:
了一种多任务损失的计算方法,可以在网络训练过程中,自适应的调整各任务损失的权重,
从而使得各任务损失同步收敛,都可以达到良好的训练效果。
体边框坐标损失的权重系数,σ3表示边缘检测任务损失的权重系数。
用在了智慧机场的现实场景中。基于智慧机场的现实场景,ED‑SSD模型可以利用物体轮廓
像素坐标修正那些与物体真实位置存在误差的预测边框,从而预测出精确到舱门轮廓的位
置,为后续实现登机桥自动精准对接做了前期的准备工作。