一种深度细化的多重信息嵌套边缘检测方法转让专利

申请号 : CN202110746455.8

文献号 : CN113538484B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 林川王蕤兴张贞光陈永亮谢智星吴海晨李福章潘勇才韦艳霞

申请人 : 广西科技大学

摘要 :

本发明旨在提供一种深度细化的多重信息嵌套边缘检测方法,包括以下步骤:构建深度神经网络结构,深度神经网络结构具体如下:编码网络、解码网络;编码网络为VGG16网络,该VGG16网络去除了所有全连接层、pool5池化层,只保留了VGG16网络主体;解码网络分为三层,第一层包括压缩模块、重塑模块、调整模块;第二层为信息提取融合模块a、信息提取融合模块b、信息提取融合模块信息c、提取融合模块d;第三层为在横向细分轮廓网络模块。

权利要求 :

1.一种深度细化的多重信息嵌套边缘检测方法,其特征在于包括以下步骤:

A、构建深度神经网络结构,深度神经网络包括编码网络和解码网络,具体结构如下:

编码网络为VGG16网络,该VGG16网络去除了所有全连接层、pool5池化层,只保留了VGG16网络主体;解码网络分为三层,第一层包括压缩模块、重塑模块和调整模块;第二层为信息提取融合模块a、信息提取融合模块b、信息提取融合模块信息c和信息提取融合模块d;

第三层为在横向细分轮廓网络模块;

B、原始图像先经过VGG16网络卷积处理,获得VGG16的5个侧面输出图,然后将VGG16的5个侧面输出图分别输入压缩模块和信息提取融合模块a;

在信息提取融合模块a中,将第1~5侧面输出图,经过再次卷积处理,使得输出通道数一致,获得第1‑5侧面输出图的再次卷积图像;然后第2~5侧面输出图的再次卷积图像分别以第1侧面输出图再次卷积图像为基准,统一分辨率,获得2~5侧面输出图再次卷积图像的分辨率调整图像,将第1侧面输出图再次卷积图像与2~5侧面输出图再次卷积图像的分辨率调整图像融合,获得信息提取融合图像a,输入横向细分轮廓网络模块中;

C、在压缩模块中:对第1~5侧面输出图像进行二次卷积,其中1、2层卷积图像的二次卷积采用3*3卷积,3、4、5层卷积图像的二次卷积采用1*1卷积,统一特征通道数;将二次卷积后的1、2、3、4、5层卷积图像,依次两两组合形成4个组,每组中将高分辨率的输出图使用最大值池化至与低分辨率输出图相同,然后相加,获得四幅一次结合图像,分别为1‑2、2‑3、3‑

4、4‑5结合图像,将该四幅图像分别输入重塑模块和信息提取融合模块b;

在信息提取融合模块b中,将1‑2、2‑3、3‑4、4‑5结合图像,分别经过再次卷积处理,使得输出通道数一致,获得1‑2、2‑3、3‑4、4‑5的再次卷积图像;然后2‑3、3‑4、4‑5的再次卷积图像分别以1‑2再次卷积图像为基准,统一分辨率,获得2‑3、3‑4、4‑5的分辨率调整图像,将1‑

2再次卷积图像与2‑3、3‑4、4‑5的分辨率调整图像融合,获得信息提取融合图像b,输入横向细分轮廓网络模块中;

D、重塑模块设有两层,第一层的处理过程为:对1‑2、2‑3结合图像分别采用1*1、3*3、5*

5进行三次平行卷积;将1‑2结合图像的三次平行卷积结果进行融合,获得融合1‑2结合图像;将2‑3结合图像的三次平行卷积结果进行融合,获得融合2‑3结合图像;对3‑4、4‑5结合图像采用1*1卷积;将融合1‑2结合图像、融合2‑3结合图像、卷积后的3‑4、4‑5结合图像依次两两组合形成3个组,每组中将高分辨率的输出图使用最大值池化至与低分辨率输出图相同,然后相加,获得1‑3结合图像、2‑4结合图像、3‑5结合图像,分别输入第二层和信息提取融合模块c中;

在第二层的处理过程为:对1‑3、2‑4结合图像分别采用1*1、3*3、5*5进行三次平行卷积;将1‑3结合图像的三次平行卷积结果进行融合,获得融合1‑3结合图像;将2‑4结合图像的三次平行卷积结果进行融合,获得融合2‑4结合图像;对3‑5结合图像采用1*1卷积;将融合1‑3结合图像1‑3、融合2‑4结合图像、卷积后的3‑5结合图像统一分辨率,将高分辨率的输出图使用最大值池化至与低分辨率输出图相同,然后组合相加,获得1‑4结合图像、2‑5结合图像,输入调整模块;

在信息提取融合模块c中,将1‑3、2‑4、3‑5结合图像,分别经过再次卷积处理,使得输出通道数一致,获得1‑3、2‑4、3‑5的再次卷积图像;然后2‑4、3‑5再次卷积图像分别以1‑3再次卷积图像为基准,统一分辨率,获得2‑4、3‑5的分辨率调整图像,将1‑3再次卷积图像与2‑4、

3‑5的分辨率调整图像融合,获得信息提取融合图像c,输入横向细分轮廓网络模块中;

E、在调整模块中,将1‑4结合图像,2‑5结合图像统一分辨率,将低分辨率的输出图使用双线性差值化至高分辨率输出图相同,然后组合相加,获得1‑5结合图像,输入信息提取融合模块d中;

在信息提取融合模块d中,将1‑5结合图像经过再次卷积处理,获得1‑5再次卷积图像,输入横向细分轮廓网络模块中;

F、在横向细分轮廓网络模块中,进行如下操作:

F1、将信息提取融合图像a、信息提取融合图像b、信息提取融合图像c、信息提取融合图像d分别进行卷积、激活,乘以自适应随机权重,获得一次权重图像a、一次权重图像b、一次权重图像c、一次权重图像d,将这四个图像依次两两组合,形成3个组,每组中将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,获得一次相加权重图像a、一次相加权重图像b、一次相加权重图像c;

F2、将一次相加权重图像a、一次相加权重图像b、一次相加权重图像c分别进行卷积、激活,乘以自适应随机权重,获得二次权重图像a、二次权重图像b、二次权重图像c,将这三个图像依次两两组合,形成2个组,每组中将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,获得二次相加权重图像a、二次相加权重图像b;

F3、将二次相加权重图像a、二次相加权重图像b分别进行卷积、激活,乘以自适应随机权重,获得三次权重图像a、三次权重图像b,将这两幅图像统一分辨率,将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,最后经1*1卷积改变特征通道数为1后输出,获得最终边缘图像。

2.如权利要求1所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的各步骤涉及的卷积表达式为m*n‑k conv+relu,其中,m*n表示卷积核的大小,k表示输出通道数,conv表示卷积公式,relu表示激活函数;m*n、k均为预设值。

3.如权利要求2所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的VGG16网络包括包含5个阶段,分别为阶段Ⅰ~阶段Ⅴ,每个阶段中分别设置有一个以上的卷积层;

所述的阶段Ⅰ的第一卷积层的输入响应为原始图像,阶段Ⅰ的其他卷积层的输入响应为该阶段上一卷积层的输出响应;阶段Ⅱ~阶段Ⅴ中,除了该阶段中的第一卷积层的输入响应之外,该阶段中的其他卷积层的输入响应为上一卷积层的输出响应;阶段Ⅰ~阶段Ⅳ中最后一个卷积层的输出响应,一方面经过最大值池化后作为下一个阶段的第一卷积层的输入响应;另一方面,作为输入响应输入到压缩模块和信息提取融合模块a中;阶段Ⅴ中最后一个卷积层的输出响应,经过最大值池化后输入到压缩模块和信息提取融合模块a中。

4.如权利要求3所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:

所述的VGG16网络中的卷积均为3*3卷积。

5.如权利要求1所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的步骤B~E中的再次卷积为1*1卷积。

6.如权利要求1所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的步骤C中,统一特征通道数为200。

7.如权利要求1所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的步骤B‑E中,信息提取融合图像a的特征通道数为64,信息提取融合图像b的特征通道数为100,信息提取融合图像c的特征通道数为200,信息提取融合图像d的特征通道数为300。

8.如权利要求1所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的步骤B‑E中,在信息提取融合模块a、信息提取融合模块b、信息提取融合模块c、信息提取融合模块d中统一分辨率的方法为:低分辨率的输出图使用双线性差值化至高分辨率输出图相同。

9.如权利要求1所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:

所述的步骤F1‑3中,所述的卷积为3*3卷积,所述的激活为采用下述ReLU函数进行,所述的自适应随机权重的权重参数范围为0~1;

10.如权利要求8所述的深度细化的多重信息嵌套边缘检测方法,其特征在于:所述的最大值池化为2*2最大值池化。

说明书 :

一种深度细化的多重信息嵌套边缘检测方法

技术领域

[0001] 本发明涉及图像处理领域,具体涉及一种深度细化的多重信息嵌套边缘检测方法。

背景技术

[0002] 轮廓检测是图像处理及计算机视觉中一个很重要组成部分。从复杂的背景中正确地检测物体轮廓是一个非常重要而困难的工作。在众多传统的图像处理方法中,应用于轮廓检测较成功的有Canny算子、活动轮廓模型和基于机器学习的轮廓模型等。这些方法主要利用了图像中的亮度,颜色,对比度信息进行检测,难以区分目标轮廓和其他杂乱边界。所以在面对图像中的对比度变化比较大、背景干扰比较多的情况时,这些方法很难得到比较满意的结果。上述算法需要相当多的领域专业知识和精细的处理算法设计,把原始图像数据转换成合适的表示或者特征向量,来构造一个轮廓分类器或者轮廓模型。近几年来,深度学习技术已经成为从原始数据中自动学习特征表示的高效方法。借助深度学习工具,尤其是卷积神经网络,轮廓检测任务有显著的性能提高。
[0003] 近年来,深度学习的相关研究已形成较为完整的体系。其中,HED为我们展现了VGG16 网络五层侧面图的检测效果,发现浅层的轮廓效果较差,含有大量的纹理和噪声,传递过程中导致错误率上升,对实验效果产生巨大影响。且现有深度学习算法只是将卷积层直接相加或融合,缺乏生物视觉机制的理论支撑,而仿生学算法用数学模型描述细胞响应,不足以模拟视觉机制中各层间复杂的传递方式。

发明内容

[0004] 本发明旨在提供一种深度细化的多重信息嵌套边缘检测方法,该方法克服现有技术缺陷,可以使轮廓更加清晰、准确。
[0005] 本发明的技术方案如下:
[0006] 所述的深度细化的多重信息嵌套边缘检测方法,包括以下步骤:
[0007] A、构建深度神经网络结构,包括编码网络、解码网络,具体结构如下:
[0008] 编码网络为VGG16网络,该VGG16网络去除了所有全连接层、pool5池化层,只保留了VGG16网络主体;解码网络分为三层,第一层包括压缩模块、重塑模块和调整模块;第二层为信息提取融合模块a、信息提取融合模块b、信息提取融合模块信息c和信息提取融合模块d;第三层为在横向细分轮廓网络模块;
[0009] B、原始图像先经过VGG16网络卷积处理,获得VGG16的5个侧面输出图,然后将VGG16 的5个侧面输出图分别输入压缩模块和信息提取融合模块a;
[0010] 在信息提取融合模块a中,将第1~5侧面输出图,经过再次卷积处理,使得输出通道数一致,获得第1‑5侧面输出图的再次卷积图像;然后第2~5侧面输出图的再次卷积图像分别以第1侧面输出图再次卷积图像为基准,统一分辨率,获得2~5侧面输出图再次卷积图像的分辨率调整图像,将第1侧面输出图再次卷积图像与2~5侧面输出图再次卷积图像的分辨率调整图像融合,获得信息提取融合图像a,输入横向细分轮廓网络模块中;
[0011] C、在压缩模块中:对第1~5侧面输出图像进行二次卷积,其中1、2层卷积图像的二次卷积采用3*3卷积,3、4、5层卷积图像的二次卷积采用1*1卷积,统一特征通道数;将二次卷积后的1、2、3、4、5层卷积图像,依次两两组合形成4个组,每组中将高分辨率的输出图使用最大值池化至与低分辨率输出图相同,然后相加,获得四幅一次结合图像,分别为1‑2、2‑3、3‑4、4‑5结合图像,将该四幅图像分别输入重塑模块和信息提取融合模块b;
[0012] 在信息提取融合模块b中,将1‑2、2‑3、3‑4、4‑5结合图像,分别经过再次卷积处理,使得输出通道数一致,获得1‑2、2‑3、3‑4、4‑5的再次卷积图像;然后2‑3、3‑4、4‑5的再次卷积图像分别以1‑2再次卷积图像为基准,统一分辨率,获得2‑3、3‑4、4‑5的分辨率调整图像,将1‑2再次卷积图像与2‑3、3‑4、4‑5的分辨率调整图像融合,获得信息提取融合图像b,输入横向细分轮廓网络模块中;
[0013] D、重塑模块设有两层,第一层的处理过程为:对1‑2、2‑3结合图像分别采用1*1、3*3、 5*5进行三次平行卷积;将1‑2结合图像的三次平行卷积结果进行融合,获得融合1‑2结合图像;将2‑3结合图像的三次平行卷积结果进行融合,获得融合2‑3结合图像;对3‑4、4‑5结合图像采用1*1卷积;将融合1‑2结合图像、融合2‑3结合图像、卷积后的3‑4、4‑5结合图像依次两两组合形成3个组,每组中将高分辨率的输出图使用最大值池化至与低分辨率输出图相同,然后相加,获得1‑3结合图像、2‑4结合图像、3‑5结合图像,分别输入第二层和信息提取融合模块c中;
[0014] 在第二层的处理过程为:对1‑3、2‑4结合图像分别采用1*1、3*3、5*5进行三次平行卷积;将1‑3结合图像的三次平行卷积结果进行融合,获得融合1‑3结合图像;将2‑4结合图像的三次平行卷积结果进行融合,获得融合2‑4结合图像;对3‑5结合图像采用1*1卷积;将融合1‑3结合图像1‑3、融合2‑4结合图像、卷积后的3‑5结合图像统一分辨率,将高分辨率的输出图使用最大值池化至与低分辨率输出图相同,然后组合相加,获得1‑4结合图像、2‑5 结合图像,输入调整模块;
[0015] 在信息提取融合模块c中,将1‑3、2‑4、3‑5结合图像,分别经过再次卷积处理,使得输出通道数一致,获得1‑3、2‑4、3‑5的再次卷积图像;然后2‑4、3‑5再次卷积图像分别以1‑3 再次卷积图像为基准,统一分辨率,获得2‑4、3‑5的分辨率调整图像,将1‑3再次卷积图像与2‑4、3‑5的分辨率调整图像融合,获得信息提取融合图像c,输入横向细分轮廓网络模块中;
[0016] E、在调整模块中,将1‑4结合图像,2‑5结合图像统一分辨率,将低分辨率的输出图使用双线性差值化至高分辨率输出图相同,然后组合相加,获得1‑5结合图像,输入信息提取融合模块d中;
[0017] 在信息提取融合模块d中,将1‑5结合图像经过再次卷积处理,获得1‑5再次卷积图像,输入横向细分轮廓网络模块中;
[0018] F、在横向细分轮廓网络模块中,进行如下操作:
[0019] F1、将信息提取融合图像a、信息提取融合图像b、信息提取融合图像c、信息提取融合图像d分别进行卷积、激活,乘以自适应随机权重,获得一次权重图像a、一次权重图像b、一次权重图像c、一次权重图像d,将这四个图像依次两两组合,形成3个组,每组中将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,获得一次相加权重图像a、一次相加权重图像b、一次相加权重图像c;
[0020] F2、将一次相加权重图像a、一次相加权重图像b、一次相加权重图像c分别进行卷积、激活,乘以自适应随机权重,获得二次权重图像a、二次权重图像b、二次权重图像c,将这三个图像依次两两组合,形成2个组,每组中将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,获得二次相加权重图像a、二次相加权重图像b;
[0021] F3、将二次相加权重图像a、二次相加权重图像b分别进行卷积、激活,乘以自适应随机权重,获得三次权重图像a、三次权重图像b,将这两幅图像统一分辨率,将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,最后经1*1卷积改变特征通道数为1后输出,获得最终边缘图像。
[0022] 所述的各步骤涉及的卷积表达式为m*n‑k conv+relu,其中,m*n表示卷积核的大小,k 表示输出通道数,conv表示卷积公式,relu表示激活函数;m*n、k均为预设值;所述的最终融合层的卷积表达式为m*n‑k conv。
[0023] 所述的VGG16网络包括包含5个阶段,分别为阶段Ⅰ~阶段Ⅴ,每个阶段中分别设置有一个以上的卷积层;
[0024] 所述的阶段Ⅰ的第一卷积层的输入响应为原始图像,阶段Ⅰ的其他卷积层的输入响应为该阶段上一卷积层的输出响应;阶段Ⅱ~阶段Ⅴ中,除了该阶段中的第一卷积层的输入响应之外,该阶段中的其他卷积层的输入响应为上一卷积层的输出响应;阶段Ⅰ~阶段Ⅳ中最后一个卷积层的输出响应,一方面经过最大值池化后作为下一个阶段的第一卷积层的输入响应;另一方面,作为输入响应输入到压缩模块和信息提取融合模块a中;阶段Ⅴ中最后一个卷积层的输出响应,经过最大值池化后输入到压缩模块和信息提取融合模块a中;
[0025] 所述的VGG16网络中的卷积均为3*3卷积。
[0026] 所述的步骤B~E中的再次卷积为1*1卷积。
[0027] 所述的步骤C中,统一特征通道数为200。
[0028] 所述的步骤B‑E中,信息提取融合图像a的特征通道数为64,信息提取融合图像b的特征通道数为100,信息提取融合图像c的特征通道数为200,信息提取融合图像d的特征通道数为300。
[0029] 所述的步骤B‑E中,在信息提取融合模块a、信息提取融合模块b、信息提取融合模块c、信息提取融合模块d中统一分辨率的方法为:低分辨率的输出图使用双线性差值化至高分辨率输出图相同。
[0030] 所述的步骤F1‑3中,所述的卷积为3*3卷积,所述的激活为采用下述ReLU函数进行,所述的自适应随机权重的权重参数范围为0~1;
[0031]
[0032] 所述的最大值池化为2*2最大值池化。
[0033] 本发明设计了一种基于新型解码网络的边缘检测方法,该方法适用于大部分网络,并可以表现出良好的成绩。在NYUD‑V2数据集上,以VGG16为编码网络时,获得了ODS为0.773 的F‑score,相较于LRCNet提升了1.6%。本发明提出的方法为后续轮廓检测的研究提出了一个新的思路,并进一步有助于改进其他视觉任务。

附图说明

[0034] 图1本发明实施例1提供的VGG16网络图;
[0035] 图2为本发明实施例1方案与文献1方案的轮廓检测效果对比图;
[0036] 图1中的“3*3‑64”、“3*3‑128”等表示卷积核的参数,其中“3*3”为卷积核的大小尺寸,“‑64”、“‑128”等表示卷积核的个数即输出的特征通道数为64或128等。

具体实施方式

[0037] 下面结合附图和实施例具体说明本发明。
[0038] 实施例1
[0039] 本实施例提供的一种深度细化的多重信息嵌套边缘检测方法,包括以下步骤:
[0040] A、构建深度神经网络结构,包括编码网络、解码网络,具体结构如下:
[0041] 编码网络为VGG16网络,该VGG16网络去除了所有全连接层、pool5池化层,只保留了VGG16网络主体;解码网络分为三层,第一层包括压缩模块、重塑模块和调整模块;第二层为信息提取融合模块a、信息提取融合模块b、信息提取融合模块信息c和信息提取融合模块d;第三层为在横向细分轮廓网络模块;
[0042] B、原始图像先经过VGG16网络卷积处理,获得VGG16的5个侧面输出图,然后将VGG16 的5个侧面输出图分别输入压缩模块和信息提取融合模块a;
[0043] 在信息提取融合模块a中,将第1~5侧面输出图,经过再次卷积处理,使得输出通道数一致,获得第1‑5侧面输出图的再次卷积图像;然后第2~5侧面输出图的再次卷积图像分别以第1侧面输出图再次卷积图像为基准,统一分辨率,获得2~5侧面输出图再次卷积图像的分辨率调整图像,将第1侧面输出图再次卷积图像与2~5侧面输出图再次卷积图像的分辨率调整图像通过concat函数进行融合,获得信息提取融合图像a,输入横向细分轮廓网络模块中;
[0044] C、在压缩模块中:对第1~5侧面输出图像进行二次卷积,其中1、2层卷积图像的二次卷积采用3*3卷积,3、4、5层卷积图像的二次卷积采用1*1卷积,统一特征通道数;将二次卷积后的1、2、3、4、5层卷积图像,依次两两组合形成4个组,每组中将高分辨率的输出图使用2*2最大值池化至与低分辨率输出图相同,然后相加,获得四幅一次结合图像,分别为1‑2、2‑3、3‑4、4‑5结合图像,将该四幅图像分别输入重塑模块和信息提取融合模块b;
[0045] 在信息提取融合模块b中,将1‑2、2‑3、3‑4、4‑5结合图像,分别经过再次卷积处理,使得输出通道数一致,获得1‑2、2‑3、3‑4、4‑5的再次卷积图像;然后2‑3、3‑4、4‑5的再次卷积图像分别以1‑2再次卷积图像为基准,统一分辨率,获得2‑3、3‑4、4‑5的分辨率调整图像,将1‑2再次卷积图像与2‑3、3‑4、4‑5的分辨率调整图像通过concat函数进行融合,获得信息提取融合图像b,输入横向细分轮廓网络模块中;
[0046] D、重塑模块设有两层,第一层的处理过程为:对1‑2、2‑3结合图像分别采用1*1、3*3、 5*5进行三次平行卷积;将1‑2结合图像的三次平行卷积结果通过concat函数进行融合,获得融合1‑2结合图像;将2‑3结合图像的三次平行卷积结果通过concat函数进行融合,获得融合2‑3结合图像;对3‑4、4‑5结合图像采用1*1卷积;将融合1‑2结合图像、融合2‑3结合图像、卷积后的3‑4、4‑5结合图像依次两两组合形成3个组,每组中将高分辨率的输出图使用2*2最大值池化至与低分辨率输出图相同,然后相加,获得1‑3结合图像、2‑4结合图像、3‑
5结合图像,分别输入第二层和信息提取融合模块c中;
[0047] 在第二层的处理过程为:对1‑3、2‑4结合图像分别采用1*1、3*3、5*5进行三次平行卷积;将1‑3结合图像的三次平行卷积结果通过concat函数进行融合,获得融合1‑3结合图像;将2‑4结合图像的三次平行卷积结果通过concat函数进行融合,获得融合2‑4结合图像;对 3‑5结合图像采用1*1卷积;将融合1‑3结合图像1‑3、融合2‑4结合图像、卷积后的3‑5结合图像统一分辨率,将高分辨率的输出图使用2*2最大值池化至与低分辨率输出图相同,然后组合相加,获得1‑4结合图像、2‑5结合图像,输入调整模块;
[0048] 在信息提取融合模块c中,将1‑3、2‑4、3‑5结合图像,分别经过再次卷积处理,使得输出通道数一致,获得1‑3、2‑4、3‑5的再次卷积图像;然后2‑4、3‑5再次卷积图像分别以1‑3 再次卷积图像为基准,统一分辨率,获得2‑4、3‑5的分辨率调整图像,将1‑3再次卷积图像与2‑4、3‑5的分辨率调整图像通过concat函数进行融合合,获得信息提取融合图像c,输入横向细分轮廓网络模块中;
[0049] E、在调整模块中,将1‑4结合图像,2‑5结合图像统一分辨率,将低分辨率的输出图使用双线性差值化至高分辨率输出图相同,然后组合相加,获得1‑5结合图像,输入信息提取融合模块d中;
[0050] 在信息提取融合模块d中,将1‑5结合图像经过再次卷积处理,获得1‑5再次卷积图像,输入横向细分轮廓网络模块中;
[0051] F、在横向细分轮廓网络模块中,进行如下操作:
[0052] F1、将信息提取融合图像a、信息提取融合图像b、信息提取融合图像c、信息提取融合图像d分别进行卷积、激活,乘以自适应随机权重,获得一次权重图像a、一次权重图像b、一次权重图像c、一次权重图像d,将这四个图像依次两两组合,形成3个组,每组中将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,获得一次相加权重图像a、一次相加权重图像b、一次相加权重图像c;
[0053] F2、将一次相加权重图像a、一次相加权重图像b、一次相加权重图像c分别进行卷积、激活,乘以自适应随机权重,获得二次权重图像a、二次权重图像b、二次权重图像c,将这三个图像依次两两组合,形成2个组,每组中将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,获得二次相加权重图像a、二次相加权重图像b;
[0054] F3、将二次相加权重图像a、二次相加权重图像b分别进行卷积、激活,乘以自适应随机权重,获得三次权重图像a、三次权重图像b,将这两幅图像统一分辨率,将低分辨率的输出图使用双线性差值上采样至高分辨率输出图相同,然后相加,最后经1*1卷积改变特征通道数为1后输出,获得最终边缘图像。
[0055] 所述的各步骤涉及的卷积表达式为m*n‑k conv+relu,其中,m*n表示卷积核的大小,k 表示输出通道数,conv表示卷积公式,relu表示激活函数;m*n、k均为预设值;所述的最终融合层的卷积表达式为m*n‑k conv。
[0056] 所述的VGG16网络包括包含5个阶段,分别为阶段Ⅰ~阶段Ⅴ,每个阶段中分别设置有一个以上的卷积层;
[0057] 所述的阶段Ⅰ的第一卷积层的输入响应为原始图像,阶段Ⅰ的其他卷积层的输入响应为该阶段上一卷积层的输出响应;阶段Ⅱ~阶段Ⅴ中,除了该阶段中的第一卷积层的输入响应之外,该阶段中的其他卷积层的输入响应为上一卷积层的输出响应;阶段Ⅰ~阶段Ⅳ中最后一个卷积层的输出响应,一方面经过2*2最大值池化后作为下一个阶段的第一卷积层的输入响应;另一方面,作为输入响应输入到压缩模块和信息提取融合模块a中;阶段Ⅴ中最后一个卷积层的输出响应,经过2*2最大值池化后输入到压缩模块和信息提取融合模块a中;
[0058] 所述的VGG16网络中的卷积均为3*3卷积。
[0059] 所述的步骤B~E中的再次卷积为1*1卷积。
[0060] 所述的步骤C中,统一特征通道数为200。
[0061] 所述的步骤B‑E中,信息提取融合图像a的特征通道数为64,信息提取融合图像b的特征通道数为100,信息提取融合图像c的特征通道数为200,信息提取融合图像d的特征通道数为300。
[0062] 所述的步骤B‑E中,在信息提取融合模块a、信息提取融合模块b、信息提取融合模块c、信息提取融合模块d中统一分辨率的方法为:低分辨率的输出图使用双线性差值化至高分辨率输出图相同。
[0063] 所述的步骤F1‑3中,所述的卷积为3*3卷积,所述的激活为采用下述ReLU函数进行,所述的自适应随机权重的权重参数范围为0~1;
[0064]
[0065] 实施例2
[0066] 将本实施例方法与以下文献1的方法进行边缘检测结果的对比;
[0067] 文献1:HED:S.Xie and Z.Tu,"Holistically‑nested edge detection,"in International Comference on Computer Vision,2015,pp.1395‑1403.;
[0068] 文献2:LRCNet:C.Lin,L.Cui,F.Li,and Y.Cao,"Lateral Refinement Network for Contour Detection,"Neurocomputing,vol.409,2020.;
[0069] 基于实施例1的神经网络模型进行训练和边缘检测。本发明训练和测试都是使用公开的 PyTorch框架完成的。本发明使用已经在ImageNet预训练好的VGG16模型来初始化本发明的网络。在训练中,使用零均值高斯分布初始化卷积核,其中标准差为0.01,偏置项初始化为 0。随机梯度下降法(SGD)超参数,全局学习率设置为1e‑6,动量和权重衰减分别设定为0.9 和0.0002。当采用NYUD数据集时,将容忍度maxDist调整为0.011。
[0070] 我们使用精确‑回归(Precision‑Recall,PR)曲线和调和平均数F值来评判轮廓检测模型的性能。F值的定义如下:
[0071] F=2PR/(P+R)
[0072] 其中,P和R分别代表精确度和回归度, 这里TPFP、和FN分别代表轮廓像素的正确个数,错误检测个数和漏检测个数。
[0073] 实验数据:
[0074] NYUD‑V2数据集。如表 1所示,本发明网络相较于其他学习网络都有较好的检测结果。本发明实施例1以VGG16为编码网络时,HHA图像与RGB图像相结合后的ODS为0.773。相比于LRC分别提高了1.6%。从表1实验的效果来看,本发明(DDM)检测方法优于文献1(HED)、文献2(LRCNet)的检测方法。
[0075] 表1与其他网络中F‑score的效果对比
[0076]