一种针对重叠问题的X射线安检违禁品检测方法转让专利
申请号 : CN202110551186.X
文献号 : CN113326753B
文献日 : 2022-04-19
发明人 : 赵才荣 , 朱亮
申请人 : 同济大学
摘要 :
权利要求 :
1.一种针对重叠问题的X射线安检违禁品检测方法,其特征在于,包括步骤一:将训练集图像输入网络中进行训练:网络分为特征提取网络和检测网络两个子网络;特征提取网络负责输入的图像到特征图谱的转化,采用ResNet‑50‑FPN网络作为特征提取网络;
检测网络负责特征图谱到对边界框的预测转化以及训练阶段中损失函数的求取;
在检测网络中,特征图谱经过ATSS层的回归和分类得到第一次预测结果,特征图谱上不同位置的采样点负责对不同位置的目标进行预测,将标签通过ATSS层的标签分配策略为特征图谱上的每一个采样点赋予对应的标签信息;预测的结果分为分类预测和回归预测,其中分类预测是多个类别对应的预测概率值;将预测得到的多类别概率值和标签分配获得的正确类别信息输入到OB模块中,用于生成第二次预测所使用的特征图谱;
在OB模块中,假定重叠的物体不属于同一类别,因此重叠区域的同一采样点所包含的源自不同物体的特征对应不同的类别,求所有采样点预测的多类别概率值对于正确类别的梯度,并反向传播到特征图谱所在的网络层;由于反向传播获取的梯度大小反应了特征图谱的特征与正确目标的相关程度,因此可以作为权重对特征图谱重新加权;采用Sigmoid函数,将权重变换到0到1之间,Sigmoid函数如下:使用权重对原特征图谱进行加权来增强相关特征,减弱无关特征,生成新的特征图谱xnew如下:
其中x表示特征图谱,y表示预测的多类别置信度,表示分配的类别标签;
考虑到 为0的情况下Sigmoid(0)=0.5,为了使得网络退化后依然有xnew=x,修改生成公式为:
进一步采用相同方式求取梯度,根据求取的梯度,在原公式中添加一项,用来进一步减弱无关特征:
其中y*表示除正确类别外预测概率最高的类别;
从OB模块输出得到新的特征图谱后,重新输入ATSS层,得到新的预测结果并计算新的预测结果与目标之间的损失函数,损失函数如下:回归损失Lreg:
Lreg=Giou*LGIoU(Preg,Greg)边界框质量预测损失LIOU:
LIOU=Giou*LBCE(Piou,Giou)分类损失Lcls:
Lcls=LFL_loss(Pcls,Gcls)其中,LGIoU为GIoU损失函数,LBCE为二元交叉熵损失函数,LFL_loss为Focal loss损失函数;Preg,Greg,Piou,Giou分别为对应标签为前景的采样点的回归预测、实际回归目标、边界框质量预测、边界框实际质量,其中边界框质量的含义为预测的边界框与实际的边界框的相交区域与合并区域的比值,Pcls和Gcls分别为所有采样点的分类预测和实际类别;总的损失函数L如下:
其中,A为正样本数量,B为所有正样本的Giou之和;
通过损失函数和梯度下降算法对网络参数进行优化,经过多次迭代后获得最终可用于检测的网络;
步骤二:将测试集图像输入训练后网络中进行测试:测试阶段的OB模块输入只有类别的预测;OB模块设计了一个判断是否有输入的标签的环节,如果没有输入的标签,就用预测的类别概率值中最大的类别代替真实标签进行标签分配,其他的步骤则与训练阶段一致;
假设网络经过训练后已经能正确预测类别,第二次预测的结果通过后处理得到最终的预测的边界框,使用真实的边界框标签与最终的预测的边界框计算mAP用以评价网络性能。
说明书 :
一种针对重叠问题的X射线安检违禁品检测方法
技术领域
背景技术
有很大的不稳定性。当密封包裹中的危险品因为遮挡、旋转而在X 光图像中呈现出难以识
别的视图时,将使检测任务变得十分艰难。尤其在应对海量安检图片的情况下,工作人员只
有几秒钟判断袋子中是否装有威胁品。而在大量不包含威胁品的各种形状和材质的物品检
查过程中,持续集中的注意力是难以保持的,疲劳带来的误判和漏判成为安检过程中不容
忽视的问题,一次不小心的漏检就可能对公众造成严重的危害。因此,需要一种快速,准确
和自动的方法来协助甚至代替检察员检测X光安检图像中的违禁物品。
测算法也被应用于X光安检图像,同样在X光安检图像检测上取得了巨大的性能提升。
检测的低效和出错率。但是训练前期的预处理和特征提取过程过于复杂,并且输出结果仅
仅是违禁品的分类,没有实现违禁品的定位,这种分两步走的方法缺少端到端的能力,难以
部署到安检机上。
需要基于大量物理条件,比如核密度计、光谱分析仪等,训练过程复杂,当类别增加时需要
重新训练整个分类器并修改网络,这种每类单独训练分类器的方法在实际运用过程中不易
实现。
叠现象较少,背景较为简单,目标特征显著。而真实场景中的X射线安检图像往往包含多个
大小不一、形状各异的物品,具有更复杂的背景和相互重叠的前景。因此,在真实场景中,能
否正确检测出重叠区域的违禁物对检测效果有着较大的影响。
发明内容
略为特征图谱上的每一个采样点赋予对应的标签信息;预测的结果分为分类预测和回归预
测,其中分类预测是多个类别对应的预测概率值;将预测得到的多类别概率值和标签分配
获得的正确类别信息输入到OB模块中,用于生成第二次预测所使用的特征图谱;
别的梯度,并反向传播到特征图谱所在的网络层;由于反向传播获取的梯度大小反应了特
征图谱的特征与正确目标的相关程度,因此可以作为权重对特征图谱重新加权;采用
Sigmoid函数,将权重变换到0到1之间,Sigmoid函数如下:
框质量预测、边界框实际质量,其中而边界框质量的含义为预测的边界框与实际的边界框
的相交区域与合并区域的比值,Pcls和Gcls分别为所有采样点(包含标签为背景)的分类预测
和实际类别;总的损失函数L如下:
标签分配,其他的步骤则与训练阶段一致;
络性能。
基于提取的特征图谱来预测目标的方式,首次提出一个从预测目标到特征图谱的反向网络
模块。该网络模块首先根据重叠区域中不同采样点所要预测的目标和首次预测的结果,寻
找目标在特征图谱所对应的相关特征以及对预测结果产生干扰的无关特征,然后通过对相
关特征和无关特征加权,在原有特征图谱上生成新的特征图谱,最后送回检测网络中重新
进行预测。由于新的特征图谱消除了重叠区域特征之间的纠缠状态,降低了重叠物体之间
干扰,因此相比原有的特征图谱更易于网络的检测,继而提升了检测的性能。该技术方案设
计的反向网络模块不依赖于特定网络,只增加了少量网络参数和计算量,且对真实场景中
的X射线安检图像的重叠问题有针对性的解决,因此本发明技术方案具有通用性强,易于实
现,精度高。此外,本发明技术方案还为携带物安检的智能化和算法落地提供了理论指导和
技术支持。
用当中。
和计算速度的情况下能够提升网络的整体性能。
附图说明
具体实施方式
仅用以解释本发明,但并不限定本发明。
FPN网络作为特征提取网络,并使用Pytorch官方提供的预训练权重初始化网络,用以节省
训练时间,提高检测精度。检测网络负责特征图谱到对边界框的预测转化以及训练阶段中
损失函数的求取。在检测网络中,特征图谱经过ATSS 层的回归和分类得到第一次预测结
果,特征图谱上不同位置的采样点负责对不同位置的目标进行预测,将标签通过ATSS层的
标签分配策略为特征图谱上的每一个采样点赋予对应的标签信息。由于重叠区域中同一个
采样点受到源自不同物体的特征的干扰,第一次预测结果较差。预测的结果又分为分类预
测和回归预测,其中分类预测是多个类别对应的预测概率值。我们将预测得到的多类别概
率值和标签分配获得的正确类别信息输入到OB模块中,用于生成第二次预测所使用的特征
图谱。OB 模块的结构示意图见图3。在OB模块中,我们假定重叠的物体不属于同一类别,因
此重叠区域的同一采样点所包含的源自不同物体的特征对应不同的类别,求所有采样点预
测的多类别概率值对于正确类别的梯度,并反向传播到特征图谱所在的网络层。这一过程
通过Pytorch内置的Autograd方法完成。由于反向传播获取的梯度大小反应了特征图谱的
特征与正确目标的相关程度,因此可以作为权重对特征图谱重新加权。这里用到了Sigmoid
函数,将权重变换到0到1之间。Sigmoid函数如下:
取梯度。根据求取的梯度,在原公式中添加一项,用来进一步减弱无关特征:
框质量预测、边界框实际质量。其中而边界框质量的含义为预测的边界框与实际的边界框
的相交区域与合并区域的比值。Pcls和Gcls分别为所有采样点(包含标签为背景)的分类预测
和实际类别。总的损失函数L如下:
测。OB模块设计了一个判断是否有输入的标签的环节,如果没有输入的标签,就用预测的类
别概率值中最大的类别代替真实标签进行标签分配,其他的步骤则与训练阶段一致。这里,
假设了网络经过训练后已经能正确预测类别。第二次预测的结果通过后处理(采用非极大
值抑制对同一个预测对象保留质量最高的预测的边界框,去除重复预测的边界框)得到最
终的预测的边界框。使用真实的边界框标签与最终的预测的边界框计算mAP(业内普遍采用
的检测性能评价标准)用以评价网络性能。