一种基于证据推理的语义分割网络模型不确定性量化方法转让专利
申请号 : CN202111011851.2
文献号 : CN113780292B
文献日 : 2022-05-06
发明人 : 王睿 , 梁茨 , 郑伟
申请人 : 北京交通大学
摘要 :
权利要求 :
1.一种基于证据推理的语义分割网络模型不确定性量化方法,其特征在于,包括:构建FCN网络模型,利用训练数据集对FCN网络模型进行训练,得到用于图像数据的语义分割的训练后的FCN网络模型;
将D‑S证据理论移植于所述训练后的FCN网络模型,得到重构后的FCN网络模型;
将待分割的图像数据输入到重构后的FCN网络模型,FCN网络模型输出待分割图像的分类结果,利用D‑S证据理论指标计算出每个像素点的分类结果不确定值;
所述的将D‑S证据理论移植于所述训练后的FCN网络模型,得到重构后的FCN网络模型,包括:
将D‑S证据理论移植于所述训练后的FCN网络模型,通过D‑S证据理论计算得到原始证据池mjk;再将Dempster组合规则应用于原始证据池mjk,通过计算得到对K个类别的置信度ml和不确定性度量指标,不确定性度量指标用于评估预测结果的不确定性,K个类别的置信度ml经过似然变换得到归一化似然函数Pm,将FCN网络模型的输出结果P(Ck)等价于基于证据推理方法得到的似然函数Pm(Ck),得到重构后的FCN网络模型。
2.根据权利要求1所述的方法,其特征在于,所述的构建FCN网络模型,包括:将卷积神经网络中经卷积层和池化层缩小的特征图通过上采样/反卷积操作,实现特征空间信息的恢复,得到全卷积网络FCN网络模型,对FCN网络模型的参数进行训练,所述FCN网络模型的参数包括特征图的激活值和滤波器的权重,FCN网络模型的参数层均为卷积层,最后一个卷积层的卷积核大小为1*1,FCN网络模型的全连接层不用于执行图像分割任务。
3.根据权利要求2所述的方法,其特征在于,所述的利用训练数据集对FCN网络模型进行训练,得到用于图像数据的语义分割的训练后的FCN网络模型,包括:获取已知的原始图像数据集和标签数据,所述原始图像数据集中的预处理图像为相同尺度大小m*n,将所述原始图像数据集和标签数据构成训练数据集,将所述训练数据集输入到FCN网络模型中,利用损失函数自动计算优化分类模型的参数,得到用于图像数据的语义分割的训练后的FCN网络模型。
4.根据权利要求1所述的方法,其特征在于,所述的将待分割的图像数据输入到重构后的FCN网络模型,FCN网络模型输出FCN网络模型输出待所述分割的图像数据的图像分割结果,包括:
将待分割的图像数据输入到重构后的FCN网络模型,假设需要将待分割的图像数据分割为K+1类,外加“背景”类别,设置FCN网络模型的最后一个卷积层包括K个滤波器,FCN网络模型的最后一层特征图的尺寸及通道数分别为nH,nW和nC;
所述重构后的FCN网络模型对待分割的图像数据进行语义分割,从FCN网络模型的最后一组特征图提取激活值 是J维的激活值,J=nH*nW*nC,同时提取FCN的最后一个卷积层的滤波器的权重w及偏置b;利用所述激活值 权重w及偏置b,通过计算得到原始证据池mjk;
将Dempster组合规则应用于所述原始证据池mjk,通过计算得到对K个类别的置信度ml,FCN网络模型的输出结果P(CK)为:得到N*nH*nW*nC*(K+1)维的预测数据,其中N为输入图片样本数量,nH,nW,nC分别为原始图片的尺寸:高度、宽度、颜色通道数,K为分类类别数。
5.根据权利要求4所述的方法,其特征在于,所述的利用D‑S证据理论指标计算出每个像素点的分类结果不确定值,包括:提取FCN网络模型的最后一层特征图的所有激活值 和训练得到的滤波器的权重w及偏置b,在D‑S证据理论中,冲突度用来表示证据间的矛盾程度,对于两条证据m1和m2的冲突度F的计算方法为公式(2‑5);
当F≠0时,则正交和m也是一个概率分配函数,当F=0时,则不存在正交和m,此时称作m1与m2相矛盾;
所述待分割的图像数据的最终分割结果的冲突度F的计算方法为(2‑7)、(2‑8)和(2‑
9);
其中 表示证据的总权重的正相关支持, 表示负相关支持。
6.根据权利要求5所述的方法,其特征在于,所述的利用D‑S证据理论指标计算出每个像素点的分类结果不确定值,还包括:信息无效度 是指对类别全集 分配的基本概率,在两条证据情况下, 的计算方法为:
当 时,意味着对命题完全未知;
待分割的图像数据的最终分割结果的信息无效度 表示无法进行分配的信任度,计算公式为式(2‑11);
‑1 + ‑
其中,η=(1‑F) ,η与η参见公式(2‑8)与(2‑9)。
7.根据权利要求5所述的方法,其特征在于,所述的利用D‑S证据理论指标计算出每个像素点的分类结果不确定值,还包括:采用总不确定熵来度量神经网络的不确定性,其定义如下:公式(2‑14)由(2‑15)与(2‑16)代入计算得出其中;其中|a|为子集a中元素的个数;pl_Pm(x)为概率mass函数,计算方法见公式(2‑15),pl(xi)为似然函数;m(a)为集合 的子集的‑1
mass函数,计算方法见公式(2‑16),η=(1‑F) ;
使用m({θk})表示根据D‑S证据理论的组合规则计算所得到的对分类{θk}的总置信度,‑1
其计算公式为式(2‑10),其中η=(1‑F) ;
‑1 + ‑
其中,η=(1‑F) ,η与η参见公式(2‑8)与(2‑9);
第一部分Hs(pl_Pm)是对应于bpa基本概率分配的香农熵,第二部分Hd(m)计算分配给非单一元素集合基本概率的不确定熵之和,两部分度量值相加即为神经网络对一个样本预测结果的总不确定熵,总不确定熵用来度量模型预测结果的不确定性。
说明书 :
一种基于证据推理的语义分割网络模型不确定性量化方法
技术领域
背景技术
将它们转换为具有突出显示的感兴趣区域的新数据。语义分割是在像素级别上的分类,属
于同一类的像素都要被归为一类。
围而不是一个确定的概率值来描述不确定性。证据理论将概率论中对事件的单点赋值扩展
为对事件集合赋值,弱化了相应的公理系统,满足了比概率更弱的要求,可看作一种广义的
概率论。
则由Θ中所有子集构成的集合称为幂集,记为2 。当Θ中的元素个数为N时,其幂集中元素
N
的个数为2。
m1和m2是两个不同的概率分配函数,融合公式为式(2‑4)。
模型以及它的非线性扩展(即神经网络分类器)可以将输入层或更高层的特征转换成D‑S质
量函数,然后利用D‑S证据理论的组合规则进行信息推理,从而辅助基于不确定性信息的精
准决策。
互独立。传统的分类器一般通过最小化损失函数来学习特征 和参数β0k与βk,之后使
用softmax将输入映射为0‑1之间的实数,输出对各个类别的判别概率,并归一化保证和为
1。如图1展示了传统分类器结构。
结构图。当仅仅考虑输出分类,二者是等效的,但D‑S决策视图奠定了一个潜在的质量函数,
相比概率输出,归一化的组合质量函数输出更具有信息量,在特征组合的过程中,可计算得
到特征之间的冲突以及无效的信息量。
度,其计算公式为式(2‑10),其中η=(1‑F) 。
发明用于测试数据的生成工作方面起到了良好的指导作用。
参数的点估计,因此通过神经网络的训练不但可以得到预测结果,还可以得到参数的概率
分布,即估计预测结果的不确定性。然而,使用BNN模型在选择合适的先验分布或精确地推
理后验参数时面临着棘手的挑战。随后,有研究者提出了一系列近似推理方法,亦称为变分
推理(variational inference),即假设一组后验分布q(ω),通过最小化q(ω)与真实后验
p(ω)之间的KL散度(Kullback‑Leibler Divergence),寻找近似的参数后验分布 然
而,最早的变分推理方法和引入了新的近似方法的变分推理,如基于采样的变分推理和随
机变分推理等都无法避免计算量过大的问题。而且为了度量预测不确定性,对于同样规模
的网络模型,参数的数量甚至需要加倍。
非线性的神经网络,在所有参数层之前增加dropout操作(随机丢弃一定比例的隐藏节点输
出值,以防止模型过拟合的操作),该模型在数学上等同一个概率深度高斯过程的近似(近
似边缘化的隐空间);模型训练的优化目标(损失函数加L2正则化)实际上就是在最小化假
设的近似分布和深度高斯过程的真实后验之间的KL散度。最后利用蒙特卡洛(Monte
Carlo)采样方法,在测试阶段同样使用dropout操作,模拟T随机前向计算,得到各输出节点
的平均值及方差估计值,即预测结果的不确定性,因此该方法也称为MC dropout。
用深层学习的层次表示能力对复杂任务进行建模,同时还可以推断复杂的多模态后验分
布。贝叶斯深度学习模型通常通过在模型权重上放置分布或通过学习得到概率输出的直接
映射来形成不确定性估计。
得到多个预测结果,从而计算预测方差,即不确定度。而且在将贝叶斯学习方法与神经网络
结合时,由于神经网络本身已经具有非常巨大的参数量,再加上贝叶斯学习方法的大量模
型推理,导致计算量非常庞大,无法在短时间内有效完成对语义分割不确定度的推理计算。
发明内容
述FCN网络模型的参数包括特征图的激活值和滤波器的权重,FCN网络模型的参数层均为卷
积层,最后一个卷积层的卷积核大小为1*1,FCN网络模型的全连接层不用于执行图像分割
任务。
输入到FCN网络模型中,利用损失函数自动计算优化分类模型的参数,得到用于图像数据的
语义分割的训练后的FCN网络模型。
信度ml和不确定性度量指标,不确定性度量指标用于评估预测结果的不确定性,K个类别的
置信度ml经过似然变换得到归一化似然函数Pm,将FCN网络模型的输出结果P(Ck)等价于基
于证据推理方法得到的似然函数Pm(Ck),得到重构后的FCN网络模型。
网络模型的最后一层特征图的尺寸及通道数分别为nH,nW和nC;
一个卷积层的滤波器的权重w及偏置b;利用所述激活值 权重w及偏置b,通过计算得
到原始证据池mjk;
的冲突度F的计算方法为公式(2‑5);
子集的mass函数,计算方法见公式(2‑16),η=(1‑F)‑1;
度,其计算公式为式(2‑10),其中η=(1‑F) ;
不确定熵,总不确定熵用来度量模型预测结果的不确定性。
附图说明
领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的
附图。
具体实施方式
考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加
一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元
件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在
中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞
“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意
义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
(predictive uncertainty)信息。具体来说,通过FCN网络模型最后一组特征图(feature
maps)的激活值及一个卷积层的参数值计算对应的质量函数mjk,进而推理出两类可区分“缺
乏特征”和“特征冲突”的预测结果不确定性,用于决策辅助。
据构成训练数据集,用于对FCN网络模型进行训练。
后训练输出一个标量,即分类标签。而图像语义分割的输出是二维分割图,为了得到与原图
等大的分割图,本发明实施例将卷积神经网络中经卷积层和池化层缩小的特征图通过上采
样/反卷积操作,实现特征空间信息的恢复。这类将CNN网络的全连接层转化为上采样层/反
卷积层的模型,统称为全卷积网络FCN网络模型。为实现本发明方法,需搭建如图3(a)所示
的语义分割网络模型,并对语义分割网络模型的参数进行训练,其中要求语义分割网络模
型最后一个卷积层的卷积核大小为1*1(在数值计算上等价于全连接层,为不确定信息推理
做铺垫)。
据的语义分割网络模型。
function),其定义为:对于有限集 集合 的质量函数为由 的幂集到
区间[0,1]的映射: 满足:
ω
重。那么,此简单bpa用证据权重ω可表示为:A 。
此,每一个 特征值(激活值)都被视为支持分类结果 的一条证据。在此定义,一
条证据 是否支持输入样本归类于Ck将取决于下面权重值的符号:
属于子集{Ck},证据权重(支持度)等于ωjk:=max(0,ωjk);当权重值ωjk<0时,本条证据支
‑
持样本属于{Ck}的补集 证据权重(支持度)等于ωjk :=max(0,‑ωjk)。因此,对于每
个神经元的输出值 都有2个简单bpa:
然函数Pm(Ck)。该似然函数等价于通过神经网络全连接层线性计算,及由softmax函数归一
化处理后得到的预测概率值。本发明方法进一步将上述方法移植于FCN网络模型中,将FCN
网络模型的输出结果P(Ck)等价于基于证据推理方法得到的似然函数Pm(Ck)。
通过计算得到对K个类别的置信度ml和不确定性度量指标Conflict,Ignorance以及
Entropy。不确定性度量指标用于评估预测结果的不确定性。
将D‑S证据理论体系与FCN结合,并且提出的不确定性度量指标是对D‑S证据理论体系的扩
展。
类结果不确定值。
两层(卷积层和softmax输出层)展开如图3(b)所示,最后一层特征图(featuremaps)的尺寸
及通道数分别为nH,nW和nC, 为特征图的激活值(输出值).
但结果可能是错误的,原模型无法判断结果的真实性,尤其针对安全关键系统,需要通过其
他指标判断预测结果,本发明提出的三个指标均能判断每个像素点的分类结果的不确定
性,也就是分割结果的不确定性,例如三个指标很高的情况,可以选择不信任或丢弃预测结
果。
度的正交和,意在度量不同证据的相互矛盾程度。因此,本发明根据公式(2‑7)推理图像最
终分割结果的F。
数,η,η是推理公式的中间变量。
结果的信息无效度,即一组激活值缺乏有效信息来确定分类结果的程度。
中间变量,η与η参见公式(2‑8)与(2‑9)。
大量研究采用熵来度量bpa的不确定度。本发明综述并全面比对了bpa熵的各类度量方法,
并提出了一个新的bpa熵的定义,用来衡量bpa的总不确定熵(total uncertainty
entropy)。本发明采用总不确定熵来度量神经网络的不确定性,其定义如下:
‑1
函数;m(a)为集合 的子集的mass函数,计算方法见公式(2‑16),η=(1‑F) 。
度,其计算公式为式(2‑10),其中η=(1‑F) 。
不确定熵。总不确定熵用来度量模型预测结果的不确定性。
SegNet,U‑Net。
出的不确定性,如何评估语义分割网络模型的不确定性和如何量化语义分割网络模型决策
的可信度的问题。
服了现有技术方法的计算量非常庞大,无法在短时间内有效完成对语义分割不确定度的推
理计算。极大提高计算效率,节约时间、资源成本。
的有效支持。
上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品
可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备
(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些
部分所述的方法。
系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法
实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为
分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或
者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根
据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术
人员在不付出创造性劳动的情况下,即可以理解并实施。
都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围
为准。