一种烟雾识别方法及装置、电子设备转让专利
申请号 : CN202110144582.0
文献号 : CN112767645B
文献日 : 2022-03-11
发明人 : 曹毅超 , 徐晓昂 , 曾庆峰 , 俞小鹏 , 封晓强
申请人 : 南京恩博科技有限公司
摘要 :
权利要求 :
1.一种烟雾识别方法,其特征在于,包括:获取烟雾视频;
计算烟雾视频的相邻帧图像的帧差,得到帧差图像序列;
将烟雾视频输入空间支路提取烟雾的空间特征,得到烟雾的空间纹理信息;将帧差图像序列输入时间支路提取烟雾的时间特征,得到相邻帧的烟雾变化信息;空间支路和时间支路并行前向计算,并在前向计算过程中,空间特征与时间特征进行特征交叉融合;
所述空间支路包括N层第一残差块,时间支路包括N层第二残差块,空间支路和时间支路并行前向计算时,每层第一残差块输出的空间特征均与对应层的第二残差块输出的时间特征进行特征交叉融合,并将交叉融合后的空间特征作为下一层第一残差块的输入,将交叉后的时间特征作为下一层第二残差块的输入;
所述空间特征与时间特征进行交叉融合的方法包括:获取空间支路第l层第一残差块计算得到空间特征图获取时间支路第l层第二残差块计算得到时间特征图通过逐元素相加方式进行特征融合,得到交叉融合后的空间特征和时间特征,计算公式为: 其中, 交叉融合后的空间特征, 为交叉融合后的时间特征,1≤l≤N,1≤i≤H,1≤j≤W,1≤c≤C,i,j,c分别代表特征图在长、宽、通道三个维度的索引;
将最终交叉融合后的特征信息经过下采样进行压缩,并通过全连接层输出预测结果。
2.根据权利要求1所述的方法,其特征在于,所述的计算烟雾视频的相邻帧图像的帧差,获得帧差图像的方法包括:
将相邻帧图像作差,计算方式为:其中,ResFramek表示第k时刻的帧差图像,Framek表示第k时刻的RGB输入图像,α为增强系数,β为限幅系数。
3.根据权利要求1所述的方法,其特征在于,第一残差块和第二残差块相同,均为ResNet、ShuffleNet、MobileNet、DenseNet或ResNeXt系列网络的残差块。
4.根据权利要求1所述的方法,其特征在于,空间支路和时间支路的输入数据维度相同。
5.一种烟雾识别装置,其特征在于,包括:视频图像获取单元,用于获取烟雾视频;
帧差计算单元,用于计算烟雾视频的相邻帧图像的帧差,得到帧差序列图像;
第一提取模块,用于将烟雾视频输入空间支路提取烟雾的空间特征,得到烟雾的空间纹理信息;
第二提取模块,将帧差图像输入时间支路提取烟雾的时间特征,得到相邻帧的烟雾变化信息;
交叉融合模块,用于空间支路和时间支路并行前向计算过程中,将空间特征与时间特征进行交叉融合;所述交叉融合模块包括:空间特征获取模块,用于获取空间支路第l层第一残差块计算得到空间特征图时间特征提取模块,用于获取时间支路第l层第二残差块计算得到时间特征图融合计算模块,用于通过逐元素相加方式进行特征融合,得到交叉融合后的空间特征和时间特征,计算公式为: 其中, 交叉融合后的空间特征, 为交叉融合后的时间特征,1≤l≤N,1≤i≤H,1≤j≤W,1≤c≤C,i,j,c分别代表特征图在长、宽、通道三个维度的索引;输出模块,将最终交叉融合后的特征信息经过下采样进行压缩,并通过至少一个全连接层输出预测结果。
6.根据权利要求5所述的装置,其特征在于,所述帧差计算单元通过将相邻帧图像作差得到烟雾视频的相邻帧图像的帧差,计算方式为:其中,ResFramek表示第k时刻的帧差图像,Framek表示第k时刻的RGB输入图像,α为增强系数,β为限幅系数。
7.一种烟雾识别电子设备,其特征在于,包括:处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行权利要求1‑4任一项所述的烟雾识别方法。
说明书 :
一种烟雾识别方法及装置、电子设备
技术领域
背景技术
健康和生态环境造成不利影响。随着深度学习技术的发展,计算视觉技术取得了长足发展,
深度学习技术在目标检测、行为识别、超分辨率等领域取得巨大成功,通过计算机视觉技术
进行火灾和烟雾探测获得了学术界和工业界的广泛关注。基于计算机视觉的烟雾检测技术
既能够帮助人民及早发现早期火灾,也能帮助监管部门取证和监督企业的排放情况。
36个光谱通道的反射率或亮温值,识别出烟雾像元和非烟雾像元,并将从36个光谱通道的
反射率或亮温值中获取神经网络分类器的输入特征,使用烟雾像元的烟雾输入特征和非烟
雾像元的非烟雾输入特征对神经网络分类器进行训练,得到烟雾识别分类单元,使用烟雾
识别分类单元能够精确识别出烟雾像元和非烟雾像元。再例如申请号为201810692696.7的
中国专利公开了一种基于多任务深度卷积神经网络的烟雾识别方法,该方法能够通过卷积
神经网络提取出单帧图像的静态特征结合视频相邻帧之间的动态特征进行多任务学习,并
融合了光流信息。
结合多帧的视觉运动特征进行推理。而缺乏稳定可靠的烟雾特征描述方式,一直是限制烟
雾识别精度的重要原因,从而导致现有方法对烟雾的识别准确率不高。
发明内容
时间支路并行前向计算,并在前向计算过程中,空间特征与时间特征进行特征交叉融合;
出的时间特征进行特征交叉融合,并将交叉融合后的空间特征作为下一层第一残差块的输
入,将交叉后的时间特征作为下一层第二残差块的输入。
为交叉融合后的时间特征,1≤l≤N,1≤i≤H,1≤j≤W,1≤c≤C,i,j,c分别代表特征图在
长、宽、通道三个维度的索引。
的空间特征, 为交叉融合后的时间特征,1≤l≤N,1≤i≤H,1≤j≤W,1≤c≤C,i,j,c
分别代表特征图在长、宽、通道三个维度的索引。
叉融合,从而空间支路与时间支路相互引导,实现了从低到高多种尺度上的特征融合,增强
了对于不明显烟雾的识别能力和对干扰因素的判别能力,从而提高了对于烟雾的检测识别
能力,进而提高了烟雾识别的准确性,避免了在森林防火、废气排放监测等应用场景中的漏
报和误报。
附图说明
具体实施方式
火领域时,可利用森林火灾监控系统获取烟雾视频。
时间支路并行前向计算,并在前向计算过程中,空间特征与时间特征进行特征交叉融合。
征,而时间支路用于提取烟雾的时间特征,其中,空间支路包括依次连接的N层第一残差块,
时间支路包括依次连接的N层第二残差块。然后,每层第一残差块输出的空间特征都会与对
应层的第二残差块输出的时间特征进行特征交叉操作,从而实现空间特征与时间特征的交
叉融合。由此空间支路和时间支路构成了一个双路时空金字塔的网络结构,从而在空间支
路与时间支路并行前向计算过程中,能够生成多尺度的特征表示信息,并进行交叉融合、互
相引导,以增强整个神经网络模型对烟雾的识别建模能力,便于从低维到高维特征的充分
融合。
支路构成了一个4层的双路时空金字塔结构,如图3为4层双路时空金字塔结构的示意图。
后的时间特征作为下一层第二残差块的输入,空间支路和时间支路继续进行前向计算,并
在下一个交叉融合的位置执行交叉融合操作,直至最后一层第一残差块输出的空间特征和
最后一层第二残差块输出的空间特征融合后,完成烟雾的特征提取。
浅层的残差块特征交叉融合时相同的操作,但因为已经到最后一层,融合后的特征无需再
严格区分空间特征和时间特征,而是直接将融合后特征用于分类预测。
后的时间特征作为第二层第二残差块的输入;然后第二层第一残差块输出的空间特征和第
二层第二残差块输出的时间特征进行交叉融合,融合后的空间特征作为第三层第一残差块
的输入,融合后的时间特征作为第三层第二残差块的输入;接着第三层第一残差块输出的
空间特征和第三层第二残差块输出的时间特征进行交叉融合,融合后的空间特征作为第四
层第一残差块的输入,融合后的时间特征作为第四层第二残差块的输入;而第四层第一残
差块输出的空间特征和第四层第二残差块输出的时间特征交叉融合后,即完成烟雾的特征
提取。
二残差块输出的时间特征融合时的情况。通常情况下,为了使得神经网络模型能够提取到
更多的烟雾特征,空间支路会包括多层第一残差块,时间支路也包括多个第二残差块,即N
>1。
时间支路第l层第二残差块计算得到时间特征图 通过逐元素相加方式进行特征融
合,得到交叉融合后的空间特征和时间特征,计算公式为:
其中, 交叉融合后的空间特征, 为交叉融合后的时间特征,1≤l≤N,1
≤i≤H,1≤j≤W,1≤c≤C,i,j,c分别代表特征图在长、宽、通道三个维度的索引。
相同。例如,输入空间支路的烟雾视频的维度为C×T×H×W,C代表RGB三个通道,T为视频帧
长度,H和W分别为图像的高和宽,则输入时间支路的帧差图像序列的维度也同样为C×T×H
×W。
据,使得双路上由浅入深的时空特征也具有相同的维度,从而便于特征的融合。
差块。例如MobileNet V2的残差块,如图4所示,包括3个子结构,第一个子结构为1个1×1的
扩展层、1个归一化层,并用ReLU6激活;第二个子结构包括1个3×3的深度可分离卷积层、1
个归一化层,并用ReLU6激活;第二个子结构包括1个投影层和1个归一化层。首先利用1×1
的扩展层提升通道数,然后利用3×3的深度可分离卷积层进行空间卷积运算,最后通过1×
1的投影层恢复通道数。
考文献Densely Connected Convolutional Networks(arXiv:1608.06993v5[cs.CV])。
建空间支路时,SE‑ResNeXt‑50网络包括四个残差块,那么可以构建一个包括4个第一残差
块的空间支路,然后4个第一残差块分别采用SE‑ResNeXt‑50网络的四个残差块,例如可以
表示为res1、res2、res3和res4,那么此时,这四个第一残差块的网络结构是不同,区别在于
res1、res2、res3和res4内部的卷积层数量的差别。
对应SE‑ResNeXt‑50网络的四个残差块。
卷积,然后经过池化,得到缩小的图像或者像素;最后利用全连接层进行分类,从而输出预
测结果。也可以通过全局平均池化的方式进行下采样,然后用全连层进行分类输出。
Spatial表示空间;Temporal表示时间。
和第二残差块,res4表示第一层第一残差块和第二残差块。其中res1包括3个子残差单元,
每个子残差单元包括2个1×1的卷积层和1个3×3的卷积层;res2包括4个子残差单元,每个
子残差单元包括2个1×1的卷积层和1个3×3的卷积层;res3,包括6个子残差单元,每个子
残差单元包括2个1×1的卷积层和1个3×3的卷积层;res4包括3个子残差单元,每个子残差
单元包括2个1×1的卷积层和1个3×3的卷积层;具体参数和输出特征参见表1。
残差块,空间支路和时间支路并行前向计算,然后空间支路中的第一层第一残差块输出的
空间特征与时间支路中的第一层第二残差块输出的时间特征进行交叉融合,并将融合后的
空间特征作为空间支路中的第二层第一残差块的输入,将融合后的时间特征作为时间支路
中的第二层第二残差块的输入;空间支路和时间支路继续进行前向计算,并在下一融合位
置进行类似交叉融合操作。直到空间支路中的第四层第一残差块输出的空间特征与时间支
路中的第四层第二残差块输出的时间特征进行交叉融合完毕。在表1所示的实施例中,空间
2
支路和时间支路输入的数据维度均为T×3×224 ,最后一层残差块输出后,空间特征和时
2
间特征的维度均为T×2048×7 ,因此,最后将融合后的特征进行利用2个1×1的卷积层的
和1个自适应平均池化层进行下采样降低数据维度,并利用全连接层分类得到预测结果。
公开的方法进行对比,以F‑score作为准确率评价指标,对比结果如表2所示。
[cs.CV])。
现有的方法都相对较高,从而可以看出,利用本发明的方法进行烟雾识别时,准确性得到显
著的提高。
间特征,得到烟雾的纹理信息;第二提取模块,将帧差图像输入时间支路提取烟雾的时间特
征,得到相邻帧的烟雾变化信息;交叉融合模块,用于空间支路和时间支路并行前向计算过
程中,将空间特征与时间特征进行交叉融合;输出模块,将最终交叉融合后的特征信息经过
下采样进行压缩,并通过至少一个全连接层输出预测结果。
融合。
算得到时间特征图 融合计算模块,用于通过逐元素相加方式进行特征融合,得到交
叉融合后的空间特征和时间特征,计算公式为: 其中,
交叉融合后的空间特征, 为交叉融合后的时间特征,1≤l≤N,1≤i≤H,1≤j
≤W,1≤c≤C,i,j,c分别代表特征图在长、宽、通道三个维度的索引。
明所提出的烟雾识别方法。该电子设备可以应用于森林防火、工厂废气排放监测等涉及烟
雾的应用场景。
行期望的功能。
(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、
硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器
可以运行所述程序指令,以实现上文所述的本申请的实施例中的烟雾识别方法。在所述计
算机可读存储介质中还可以存储诸如各阶段的特征图,以及烟雾视频、帧差图像序列等。
的烟雾。利用该电子设备,可以有效地提高烟雾识别的准确率,当应用于具体的场景中时,
有效地降低烟雾的漏报和误报。
权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。