基于平衡样本回归损失的SAR舰船目标检测方法转让专利

申请号 : CN202011544100.2

文献号 : CN112668440B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王英华杨振东刘宏伟唐天顾

申请人 : 西安电子科技大学

摘要 :

本发明公开了一种基于平衡样本回归损失的SAR舰船目标检测方法,主要解决现有深度学习方法中因难易样本不平衡导致训练出的网络模型对舰船目标检测性能低的问题。其实现方案是:1)获取舰船数据,并分为训练数据和测试数据;2)选取Faster‑RCNN网络为训练网络模型;3)对训练网络的原始损失函数进行改进,构成新的总损失函数;4)将训练数据送入2)所选的网络中,使用新的总损失函数对网络进行训练,得到最终训练好的网络模型;5)将测试数据送到训练好的网络模型中,得到舰船目标检测结果。本发明能更好的提取舰船目标的深度特征,提高了舰船目标检测性能,可用于对舰船目标的检测。

权利要求 :

1.一种基于平衡样本回归损失的SAR舰船目标检测方法,其特征在于,包括如下:(1)获取SSDD舰船数据集,并将其按照8:2的比例分为训练数据Φx和测试数据Φc;

(2)选取由共享基础模块VGG、区域选取模块RPN和区域精修模块Fast‑RCNN依次连接组成的训练网络模型Ω;

(3)构建改进后的损失函数;

(3a)将网络RPN模块回归损失中的 函数改进为 函数,其形

式为:

其中,j为RPN模块第j个训练样本,tn为RPN模块为训练样本预测的位置信息,为训练样本对应的目标框的位置信息,n∈{x,y,w,h},a为超参数,a=2;

(3b)将网络Fast‑RCNN模块回归损失中的 函数改进为 函

数,其形式为:

其中,p为Fast‑RCNN模块第p个训练样本,em为Fast‑RCNN模块为训练样本预测的位置信息, 为训练样本对应的目标框的位置信息,m∈{x,y,w,h};

(3c)根据(3a)和(3b)改进的回归损失函数,得到训练网络改进后的总损失函数Js,其表示如下:其中,Js1、λrpn和Ns1分别为RPN模块的分类损失函数、损失平衡常数和训练样本数量,Js3、λfast和Ns2为Fast‑RCNN模块的分类损失函数、损失平衡常数和训练样本数量, 为RPN模块第j个样本是否为正样本的标签, 为Fast‑RCNN模块第p个样本是否为正样本的标签;

(4)将训练数据Φx输入到训练网络模型Ω中,使用网络总的损失函数Js对该网络模型Ω进行训练,直到损失函数收敛,得到训练好的网络模型Ω';

(5)将舰船测试数据Φc输入到最终训练好的网络模型Ω'中,得到舰船的检测结果。

2.根据权利要求1所述的方法,其中(2)中网络模型的共享基础模块VGG,包括5个卷积块和4个平均池化层,依次为第一卷积块V1→第一平均池化层P1→第二卷积块V2→第二平均池化层P2→第三卷积块V3→第三平均池化层P3→第四卷积块V4→第四平均池化层P4→第五卷积块V5,各层参数设置及关系如下:所述4个池化层的结构相同,其用于对输入下采样,下采样核的窗口大小为2×2,滑动步长为2,输出特征图的数量和输入一致,并作为下一卷积块的输入;

所述第一卷积块V1和第二卷积块V2结构相同,其均由两个完全相同的卷积块级联而成,每个卷积块由卷积层Li1和ReLU激活函数层Li2两层结构组成,i表示第i个卷积块,i=1,

2;

所述第三卷积块V3、第四卷积块V4和第五卷积块V5结构相同,其均由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层Tj1、第二层为ReLU激活函数层Tj2,j表示第j个卷积块,j=1,2,3。

3.根据权利要求1所述的方法,其中(2)中网络模型的区域选取模块RPN依次由共享卷积层C1、激活函数层C2、两个并列的分类支路C3和回归卷积层C4组成,该分类支路C3依次由分类卷积层C31和Softmax分类器层C32组成,用于得到分类概率向量p;该回归卷积层C4用于对输入进行卷积,得到36个位置预测特征图b。

4.根据权利要求1所述的方法,(2)中网络模型的区域精修模块Fast‑RCNN依次由ROI pooling层、全连接层F1、全连接层F2、两个并列的分类支路F3和回归全连接层F4组成,该分类支路F3依次由全连接层F31和Softmax分类器层F32组成,用于得到分类概率向量Τ,该回归全连接层F4输出一个4维的回归列向量C,表示候选框的回归偏移量ex,ey,ew,eh。

5.根据权利要求1所述的方法,所述(3c)中RPN模块的分类损失函数Js1,表示如下:其中,Ns1为RPN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns1取一个批次的样本数量256, 为第j个样本对应第k类的标签, 为RPN网络将第j个样本预测为第k类的概率。

6.根据权利要求1所述的方法,所述(3c)中Fast‑RCNN模块的分类损函数Js3,表示如下:其中,Ns2为Fast‑RCNN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns2取一个批次的样本数量128, 为第p个样本对应第k类的标签, 为Fast‑RCNN模块将第p个样本预测为第k类的概率。

7.根据权利要求1所述的方法,其中(4)对训练网络模型Ω进行训练,其实现如下:

4a)将训练数据送入网络模型Ω中进行训练,一次训练一张图片,根据送入图片的标签计算网络损失函数Js的值;

4b)计算网络的损失函数梯度,通过改进后的损失函数,使难易样本在回归上产生的梯度平衡;

4c)根据4b)算出的损失函数对网络产生的梯度,利用随机梯度下降算法向损失函数减小的方向不断更新权值,并通过反向传播算法将输出层的误差向前传播,更新网络模型Ω的各层参数;

4d)循环执行4a)‑4c),直到损失函数Js收敛,得到训练好的网络模型Ω'。

说明书 :

基于平衡样本回归损失的SAR舰船目标检测方法

技术领域

[0001] 本发明属于雷达技术领域,主要涉及一种SAR图像舰船目标检测方法,可用于后续的舰船目标识别与分类。

背景技术

[0002] 合成孔径雷达是一种主动成像传感器,具有全天候、全天时、高分辨的数据获取能力。并具有多频段、多极化、视角可变和穿透性等特点。目前,SAR已广泛应用于军事侦察、地质普查、地形测绘和制图、灾情预报、海洋应用以及科学研究等领域,具有广阔的研究和应用前景。SAR图像自动目标识别ATR是SAR图像的重要应用之一。基本的SAR图像自动目标识别ATR系统一般包括目标检测、目标鉴别和目标识别三个阶段。目标检测的性能将直接影响鉴别和分类阶段的性能和效率,因此对于SAR目标检测的研究就显得十分重要。
[0003] 传统的SAR图像目标检测算法主要是恒虚警率CFAR方法,该类方法根据预先建立的杂波统计模型来确定检测阈值,但这些模型存在应用场景受限的缺点,并且检测效率较低。当前比较热门的深度学习方法能够通过训练自动获得数据的特征进行目标检测,在数据充足的情况下,能保证准确率和检测速度,更能适用不同的场景,因此通过深度学习方法对SAR图像舰船目标检测进行研究引起了普遍的关注。
[0004] Jianwei Li等人在IEEE发表的文章《SHIP DETECTION IN SAR IMAGES BASED ON AN IMPROVED FASTER R‑CNN》中整理发布了SSDD舰船数据集并提出了使用改进的Faster‑RCNN网络进行检测的方法,该方法将网络的多层特征进行融合,充分利用了底层特征,为SSDD数据的检测效果建立了基准线,但该方法由于未考虑训练数据中的难易样本非平衡问题,因而会使网络倾向于学习其中的一类样本,导致对另一类样本的学习较差,制约检测性能。
[0005] Yuanyuan Wang等人在remote sensing发表的文章《Automatic Ship Detection Based on RetinaNet Using Multi‑Resolution Gaofen‑3 Imagery》中对RetinaNet检测网络进行改进,并将其应用于高分3号SAR图像舰船数据,取得较好的检测性能。该方法使用Focal loss分类损失函数解决了分类上的难易样本不平衡问题,然而,未考虑回归上的不平衡问题,检测结果依然有待进一步提高。

发明内容

[0006] 本发明的目的在于提出一种基于平衡样本回归损失的SAR舰船目标检测方法,以解决现有深度学习方法中因难易样本不平衡导致训练出的网络模型对舰船目标检测效果不佳的问题,提高舰船目标检测性能。
[0007] 本发明的技术方案是:首先将SSDD数据分为训练数据和测试数据,然后使用训练数据训练Faster‑RCNN深度神经网络模型,网络使用改进后的回归损失函数,待模型收敛后,将训练好的神经网络应用于测试数据之上,得到最终的舰船检测结果,其实现步骤包括如下:
[0008] (1)获取SSDD舰船数据集,并将其按照8:2的比例分为训练数据Φx和测试数据Φc;
[0009] (2)选择由共享基础模块VGG、区域选取模块RPN和区域精修模块Fast‑RCNN依次连接组成的训练网络模型Ω;
[0010] (3)构建改进后的损失函数;
[0011] (3a)将网络RPN模块回归损失中的 函数改进为 函数,其形式为:
[0012]
[0013]
[0014] 其中,j为RPN模块第j个训练样本,tn为RPN模块为训练样本预测的位置信息,为训练样本对应的目标框的位置信息,n∈{x,y,w,h},a为超参数,a=2;
[0015] (3b)将网络Fast‑RCNN模块回归损失中的 函数改进为函数,其形式为:
[0016]
[0017]
[0018] 其中,p为Fast‑RCNN模块第p个训练样本,em为Fast‑RCNN模块为训练样本预测的位置信息, 为训练样本对应的目标框的位置信息,m∈{x,y,w,h}。
[0019] (3c)根据(3a)和(3b)改进的回归损失函数,得到训练网络改进后的总损失函数Js,其表示如下:
[0020]
[0021] 其中,Js1、λrpn和Ns1分别为RPN模块的分类损失函数、损失平衡常数和训练样本数量,Js3、λfast和Ns2为Fast‑RCNN模块的分类损失函数、损失平衡常数和训练样本数量, 为RPN模块第j个样本是否为正样本的标签, 为Fast‑RCNN模块第p个样本是否为正样本的标签。
[0022] (4)将训练数据Φx输入到构建好的训练网络模型Ω中,使用网络总的损失函数Js对该网络模型Ω进行训练,直到损失函数收敛,得到训练好的网络模型Ω';
[0023] (5)将舰船测试数据Φc输入到最终训练好的网络模型Ω'中,得到舰船的检测结果。
[0024] 本发明与现有技术相比具有以下优点:
[0025] 本发明针对现有深度学习目标检测方法Faster‑RCNN应用于SAR舰船目标检测时存在回归损失难易样本不平衡的问题,改进了回归损失函数,能更好的提取舰船目标的深度特征,提高了舰船目标检测性能。

附图说明

[0026] 图1为本发明的实现流程图;
[0027] 图2为本发明中使用的训练网络模型结构图;
[0028] 图3为本发明中设计的回归损失函数梯度图。

具体实施方式

[0029] 下面结合附图对本发明的实施例和效果进行详细说明:
[0030] 参照图1,本发明的实现步骤如下:
[0031] 步骤1,获取SSDD舰船数据集,划分训练数据和测试数据。
[0032] SSDD舰船数据集由多个雷达卫星拍摄,并经过专家整理标注而成,本实例通过申请获取数据后按照8:2的比例划分为训练数据Φx和测试数据Φc。
[0033] 步骤2,选取训练网络模型Ω。
[0034] 现有的目标检测网络有YOLO系列、SSD网络和Faster‑RCNN网络等,本实例选取经典的Faster‑RCNN网络作为训练网络模型Ω进行检测。
[0035] 参照图2,本实例选取的训练网络模型Ω由共享基础模块VGG、区域选取模块RPN和区域精修模块Fast‑RCNN依次连接组成,各模块结构如下:
[0036] 2.1)VGG基础模块:
[0037] 该模块包括5个卷积块和4个平均池化层,依次为第一卷积块V1→第一平均池化层P1→第二卷积块V2→第二平均池化层P2→第三卷积块V3→第三平均池化层P3→第四卷积块V4→第四平均池化层P4→第五卷积块V5,各层参数设置及关系如下:
[0038] 2.1a)卷积块V1,其由两个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层 第二层为ReLU激活函数层 i表示第i个卷积块,i=1,2,其中:
[0039] 第一层卷积层 其卷积核K1的窗口大小为3×3,滑动步长S1为1,填充方式为SAME,用于对输入进行卷积,输出64个特征图 作为第二层激活函数层 的输入;
[0040] 第二层ReLU激活函数层 用于对上一层 层的输出进行非线性的映射,非线性映射公式如下:
[0041] ReLU(x)=max(0,x)
[0042] 式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
[0043] 2.1b)平均池化层P1,用于对输入下采样,其下采样核U1的窗口大小为2×2,滑动1
步长V为2,输出64个特征图Y1,作为卷积块V2层的输入。
[0044] 2.1c)卷积块V2,其由两个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层 第二层为ReLU激活函数层 i表示第i个卷积块,i=1,2,其中:
[0045] 第一层卷积层 其卷积核K2的窗口大小为3×3,滑动步长S2为1,填充方式为SAME,用于对输入进行卷积,输出128个特征图 作为第二层激活函数层 的输入;
[0046] 第二层ReLU激活函数层 用于对上一层 层的输出进行非线性的映射,非线性映射公式如下:
[0047] ReLU(x)=max(0,x)
[0048] 式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
[0049] 2.1d)平均池化层P2,用于对输入下采样,其下采样核U2的窗口大小为2×2,滑动2
步长V为2,输出128个特征图Y2,作为卷积块V3的输入。
[0050] 2.1e)卷积块V3,其由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层 第二层为ReLU激活函数层 i表示第i个卷积块,i=1,2,3,其中:
[0051] 第一层卷积层 其卷积核K3的窗口大小为3×3,滑动步长S3为1,填充方式为SAME,用于对输入进行卷积,输出256个特征图 作为第二层激活函数层 的输入;
[0052] 第二层ReLU激活函数层 用于对上一层 层的输出进行非线性的映射,非线性映射公式如下:
[0053] ReLU(x)=max(0,x)
[0054] 式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
[0055] 2.1f)平均池化层P3,用于对输入下采样,其下采样核U3的窗口大小为2×2,滑动3
步长V为2,输出256个特征图Y3,作为卷积块V4的输入。
[0056] 2.1g)卷积块V4,其由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层 第二层为ReLU激活函数层 i表示第i个卷积块,i=1,2,3,其中:
[0057] 第一层卷积层 其卷积核K4的窗口大小为3×3,滑动步长S4为1,填充方式为SAME,用于对输入进行卷积,输出512个特征图 作为第二层激活函数层 的输入;
[0058] 第二层ReLU激活函数层 用于对上一层 层的输出进行非线性的映射,非线性映射公式如下:
[0059] ReLU(x)=max(0,x)
[0060] 式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
[0061] 2.1h)平均池化层P4,用于对输入下采样,其下采样核U4的窗口大小为2×2,滑动4
步长V为2,输出512个特征图Y4,作为卷积块V5的输入。
[0062] 2.1i)卷积块V5,其由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层 第二层为ReLU激活函数层 i表示第i个卷积块,i=1,2,3,其中:
[0063] 第一层卷积层 其卷积核K5的窗口大小为3×3,滑动步长S5为1,填充方式为SAME,用于对输入进行卷积,输出512个特征图 作为第二层激活函数层 的输入;
[0064] 第二层ReLU激活函数层 用于对上一层 层的输出进行非线性的映射,非线性映射公式如下:
[0065] ReLU(x)=max(0,x)
[0066] 式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
[0067] 最后一个卷积块ReLU激活函数层 输出即为VGG基础层提取的共享特征F。
[0068] 2.2)RPN模块:
[0069] 该层依次由共享卷积层C1、激活函数层C2、两个并列的分类支路C3和回归卷积层C4组成,各层参数设置及关系如下:
[0070] 共享卷积层C1,其卷积核K6的窗口大小为3×3,滑动步长S6为1,填充方式为SAME,用于对输入进行卷积,输出512个特征图Y6,作为第二层激活函数层C2的输入;
[0071] 第二层ReLU激活函数层C2,用于对上一层C1层的输出进行非线性的映射,非线性映射公式如下:
[0072] ReLU(x)=max(0,x)
[0073] 式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
[0074] 分类支路依次由分类卷积层C31、Softmax分类器层C32组成,各层参数设置及关系如下:
[0075] 分类卷积层C31,其卷积核K7的窗口大小为1×1,滑动步长S7为1,填充方式为SAME,用于对输入进行卷积,输出18个特征图Y7;
[0076] Softmax分类器层C32,用于将分类卷积层C31得到的18个特征图Y7输入到两类Softmax分类器中,得到分类概率向量p。
[0077] 回归卷积层C4,其卷积核K8的窗口大小为1×1,滑动步长S8为1,填充方式为SAME,用于对输入进行卷积,输出36个特征图b,表示RPN模块为9个预设框分别预测的4个偏移量tx,ty,tw,th;
[0078] 根据回归卷积层C4的输出b确定初步检测框的位置,并通过分类概率向量p筛选检测框,将得分满足阈值的判为候选框,作为下一步精修模块Fast‑RCNN模块的输入。
[0079] 2.3)Fast‑RCNN模块:
[0080] 该层依次由ROIpooling层,第一全连接层F1,第二全连接层F2,两个并列的分类支路F3和回归全连接层F4组成,各层参数设置及关系如下:
[0081] ROIpooling层R,用于将不同大小的输入特征图下采样成相同大小,其将输入特征图分成7×7块,每块选择最大值作为当前特征块的输出,输出512个特征图Y8,Y8大小为512×7×7,作为第一全连接层F1的输入。
[0082] 第一全连接层F1,其设有4096个神经元,用于对上一层ROIpooling层输出的特征进行非线性映射,输出一个4096维的列向量;
[0083] 第二全连接层F2,其设有4096个神经元,用于对上一全连接层F1输出的列向量进行非线性映射,输出一个4096维的列向量;
[0084] 分类支路依次由分类全连接层F31、Softmax分类器层F32组成,各层参数设置及关系如下:
[0085] 分类全连接层F31,其设有2个神经元,用于对上一全连接层F2的输出的列向量进行非线性映射,输出一个2维的列向量,作为Softmax分类器层F32的输入;
[0086] Softmax分类器层F32,用于将分类全连接层F31得到的2维列向量输入到两类Softmax分类器中,得到分类概率向量Τ,根据概率值将候选框进行分类;
[0087] 回归全连接层F4组成,其设有4个神经元,用于对上一全连接层F2的输出的列向量进行非线性映射,输出一个4维的回归列向量C,表示候选框的回归偏移量ex,ey,ew,eh。
[0088] 步骤3,构建改进后的损失函数。
[0089] 训练网络模型Ω的原始损失函数中的回归损失使用的是smoothL1函数,此函数在训练网络时存在回归损失难易样本不平衡的问题,影响网络检测性能,因此需要对回归损失函数进行改进,构建新的总损失函数。
[0090] 新的总损失函数由RPN模块的损失函数与Fast‑RCNN模块的损失函数之和构成,其构建如下:
[0091] 3.1)构建RPN模块损失函数:
[0092] 3.1.1)预设框信息和目标框信息:RPN模块为VGG基础层提取的共享特征F的每个特征点配备九个预设框,九个框以三种宽高比和三种尺寸得到,其中宽:高∈{1:1,1:2,2:1},三种尺度分别为128*128,256*256,512*512,设(xa,ya)为预设框的中心坐标,wa为框的* * * *
宽度,ha为框的高度,(x ,y)为目标框的中心坐标,w为目标框的宽度,h为目标框的高度;
[0093] 3.1.2)根据预设框信息和目标框信息计算每一预设框与所有目标框的交并比IOU值:
[0094]
[0095] 其中,A为预设框,B为目标框,A∩B为预设框和目标框相交的面积,A∪B为预设框和目标框相并的面积;
[0096] 3.1.3)设定IOU阈值,划分预设框的样本类别:
[0097] 设定IOU下限阈值v1为0.3,上限阈值v2为0.7。
[0098] 若预设框与某一目标框的IOU大于等于上限阈值v2,或预设框与某一目标框的IOU是所有预设框与该目标框IOU中最大的,则该预设框为正样本,并将该目标框分配给预设框;
[0099] 若预设框与所有目标框的IOU均小于等于下限阈值v1,并且预设框与某一目标框的IOU不是所有预设框与该目标框IOU中最大的,则该预设框为负样本;
[0100] 若预设框与所有目标框的IOU均大于下限阈值v1且均小于上限阈值v2,同时预设框与某一目标框的IOU不是所有预设框与该目标框IOU中最大的,则该预设框为无用样本,不参与训练;
[0101] 3.1.4)根据预设框信息和其对应的目标框信息计算出目标偏移量
[0102]
[0103]
[0104]
[0105]
[0106] 3.1.5)RPN模块的原始损失函数:
[0107] 利用RPN模块得到的分类概率向量p和回归特征图b,其中,分类概率向量p为预设框判为目标和背景的概率,回归特征图b为网络为每个预设框预测的偏移信息tx,ty,tw,th,得到RPN模块的原损失函数J'rpn:
[0108] J'rpn=Js1+λrpnJs2
[0109]
[0110]
[0111] 其中,Js1为交叉熵损失函数,Ns1为RPN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns1取一个批次的样本数量256, 为第j个样本对应第k类的标签, 为RPN网络将第j个样本预测为第k类的概率;Js2为回归损失函数, 为第j个样本是否为正样本的标签,标签为1时,该预设框为正样本,计算回归损失;标签为0时,该预设框为负样本,回归损失为0;tn为预设框的位置信息, 为目标框的位置信息,n∈{x,y,w,h},λrpn为平衡常数。函数为:
[0112]
[0113] 3.1.6)对原损失函数进行改进:
[0114] 参照图3,统计RPN模块回归部分的损失发现简单样本产生的损失梯度值明显大于难样本产生的损失梯度值,为解决舰船检测中难易样本非平衡问题,对 函数进行改进,增大难样本损失的梯度,对 函数进行改进后的 为:
[0115]
[0116] 其中,a为超参数,a=2,得到改进后的RPN模块损失Jrpn为:
[0117]
[0118] 3.2)构建Fast‑RCNN模块损失函数。
[0119] 3.2.1)根据RPN预测的回归特征图b,其表示候选框的偏移量tx,ty,tw,th,计算出候选框的位置信息x,y,w,h:
[0120] tx=(x‑xa)/wa,
[0121] ty=(y‑ya)/ha,
[0122] tw=log(w/wa),
[0123] th=log(h/ha);
[0124] 其中,(x,y)为候选框的中心坐标,w为候选框的宽度,h为框的高度;
[0125] 3.2.2)设定IOU阈值,划分候选框的样本类别:
[0126] 设定IOU阈值v3为0.5。
[0127] 根据候选框位置坐标计算候选框与目标框的IOU,若候选框与所有目标框的IOU均小于阈值v3,该候选框为负样本;
[0128] 若候选框与某一目标框的交并比大于阈值v3,该候选框为正样本,并将该目标框分配给候选框;
[0129] 3.2.3)根据候选框信息和目标框信息计算目标偏移量
[0130]
[0131]
[0132]
[0133]
[0134] 3.2.4)Fast‑RCNN模块的原始损失函数:
[0135] 根据RPN模块得到的分类概率向量p对判为目标概率较高的前2000候选框使用Fast‑RCNN模块进一步位置回归和分类,得到分类概率向量T和回归列向量C,分类概率向量为候选框判为目标和背景的概率,回归列向量C为候选框的预测偏移量ex,ey,ew,eh,得到Fast‑RCNN模块的损失函数J'fast:
[0136] J'fast=Js3+λfastJs4
[0137]
[0138]
[0139] 其中,Js3为交叉熵损失函数,Ns2为Fast‑RCNN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns2取一个批次的样本数量128, 为第p个样本对应第k类的标签, 为Fast RCNN网络将第p个样本预测为第k类的概率;Js4为回归损失, 为第p个样本是否为正样本的标签,标签为1时,该候选框为正样本,计算回归损失,标签为0时,该候选框为负样本,回归损失为0,λfast为平衡常数。
[0140] 函数为:
[0141]
[0142] 3.2.5)对原损失函数进行改进:
[0143] 同理,为解决舰船检测中难易样本非平衡问题,对 函数进行改进后的 函数为:
[0144]
[0145] 其中,a为超参数,a=2,改进后的Fast‑RCNN模块损失Jfast为:
[0146]
[0147] 3.3)根据3.1)改进的回归损失函数Jrpn和3.2)改进的回归损失函数Jfast,得到训练网络改进后的总损失函数Js:
[0148]
[0149] 步骤4,使用步骤3构建的损失函数Js对该网络模型Ω进行训练,得到训练好的网络模型Ω'。
[0150] 4.1)将训练数据Φx输入到训练网络模型Ω中进行训练,一次训练一张图片,根据送入图片的标签计算网络的损失函数Js的值;
[0151] 4.2)根据步骤4.1)损失函数Js的值计算网络损失函数的梯度,通过改进后的损失函数,使难易样本在回归损失上产生的梯度平衡;
[0152] 4.3)根据4.2)算出的损失函数对网络产生的梯度,利用随机梯度下降算法向损失函数减小的方向不断更新权值,并通过反向传播算法将输出层的误差向前传播,更新网络模型Ω的各层参数;
[0153] 4.4)循环执行步骤4.1)‑步骤4.3),直到损失函数收敛,得到训练好的网络模型Ω'。
[0154] 步骤5,将舰船测试数据Φc输入到最终训练好的网络模型Ω'中,得到舰船的检测结果。
[0155] 本发明的效果可通过以下实验数据进一步说明:
[0156] 一.实验条件
[0157] 1)实验数据
[0158] 本实验使用中国人民解放军海军航空大学整理发布的SSDD数据集,该数据包含了多尺寸舰船目标以及多种成像条件,如不同分辨率、海况和传感器类型,数据集样本的多样性使训练出来的检测器具有更好的鲁棒性。数据集多种成像条件如表1。
[0159] 表1舰船数据成像条件
[0160]
[0161]
[0162] 表1中,RADARSAT‑2为加拿大发射的RADARSAT‑2卫星,TERRASAR‑X为德国发射的TERRASAR‑X卫星,SENTINEL‑1为欧盟发射的SENTINEL‑1卫星;HH为卫星水平发射水平接收的极化方式,VV为卫星垂直发射垂直接收的极化方式,HV为卫星水平发射垂直接收的极化方式,VH为卫星垂直发射水平接收的极化方式。
[0163] 2)评价准则
[0164] 实验重复五次,取五次实验检测结果的平均准确率的平均值和检测率的平均值对实验结果进行评价。
[0165] 二.实验内容
[0166] 用本发明方法与现有两种方法对上述实验数据进行对比实验,性能参数对比结果如表2所示。
[0167] 表2本发明方法与现有方法性能参数对比结果
[0168]对比方法 平均准确率 检测率
SmoothL1 93.59% 94.38%
BalanceL1 93.83% 93.99%
本发明 94.88% 95.68%
[0169] 表2中:Smooth L1为Faster‑RCNN网络回归损失函数使用smoothL1对舰船数据检测的方法;
[0170] Balance L1为Faster‑RCNN网络回归损失函数使用文章《Libra R‑CNN:Towards Balanced Learning for ObjectDetection》提出的balanceL1回归损失函数对舰船数据检测的方法;
[0171] 从表2中可见,相比于现有方法,本发明取得了更好的检测效果,这是由于本发明设计的损失函数能更好的解决难易样本不平衡问题,网络能够更准确的学习各类样本中的特征,因此本发明比现有方法获得了更好的检测结果。
[0172] 以上描述仅是本发明的一个具体实例,并未构成对本发明的任何限制,显然对于本领域的专业人员来说,在了解了本发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修改和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。