一种基于原型学习的开放集干扰识别模型和方法转让专利

申请号 : CN202210909603.8

文献号 : CN114997248B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈杰赵知劲叶学义岳克强姜明

申请人 : 杭州电子科技大学

摘要 :

本方案公开了一种基于原型学习的开放集干扰识别模型和方法,包括具有特征提取网络和分类模型的PL‑Net,特征提取网络对输入干扰提取特征,分类模型根据特征向量与干扰类别的原型中心的距离进行类别识别,用于训练PL‑Net的损失函数包括闭集训练项和开集训练项,开集训练项的原型中心集合包括未知干扰类别原型中心,闭集训练项的原型中心集合无未知干扰类别原型中心,训练得到若干已知干扰类别原型中心和一未知干扰类别原型中心。本方案设计的损失函数基于原型学习策略,通过假定开放类别原型中心将闭集训练和开集训练相结合,使其对未知干扰也能够基于原型中心进行识别,从而使模型能够被用于识别未知干扰,有效提高模型在开放集合情况下干扰识别精度。

权利要求 :

1.一种基于原型学习的开放集干扰识别模型的构建方法,其特征在于,包括具有特征提取网络和分类模型的PL‑Net,所述的特征提取网络用于对输入干扰提取特征,所述的分类模型用于根据特征提取网络输出的特征向量与相应干扰类别的原型中心的距离进行干扰类别识别,且用于训练PL‑Net的损失函数包括闭集训练项和开集训练项,所述开集训练项的原型中心集合包括未知干扰类别原型中心,所述闭集训练项的原型中心集合无未知干扰类别原型中心,通过训练得到若干已知干扰类别原型中心和一个未知干扰类别原型中心用于已知干扰类别分类和未知干扰类别识别;

所述的损失函数包括:

L(x,y;θ,Op)=Lc(x,y;θ,Op\OK+1)+λ·Lc(x,K+1;θ,Op\Oy)  (3)Lc(x,y;θ,O)=‑log p(y=k|x,f,O)   (4)其中θ表示网络参数,λ为常数,O={Ok,k=1,...,K}表示原型中心,K表示K类已知干扰类别,Op={Ok,k=1,...,K+1}为假定未知干扰也具有原型中心OK+1时的原型中心集合,K+1表示未知干扰类别;z=f(x)表示特征提取函数;

公式(3)的第一项对应于闭集训练,Op\OK+1表示移除原型中心集合中未知干扰类别原型,训练优化模型使得输出以匹配已知干扰类别;第二项对应于开集训练,Op\Oy表示移除原型中心集合中样本x对应真实标签y的原型中心Oy,训练优化模型使得样本被识别为未知干扰类别,通过最小化损失函数L使得模型在保证已知干扰类别识别准确性的同时具有识别未知干扰的能力。

2.根据权利要求1所述的基于原型学习的开放集干扰识别模型的构建方法,其特征在于,所述闭集训练项的原型中心集合为所有样本均对应有原型的第一原型集合;

所述开集训练项的原型中心集合为去除一个或多个已知样本对应原型的第二原型集合。

3.根据权利要求2所述的基于原型学习的开放集干扰识别模型的构建方法,其特征在于,所述的分类模型通过以下方式计算输入干扰的特征向量与各原型中心的距离:d(f(x),Ok)表示特征向量与原型中心之间的距离,

Dtr={(x1,y1),(x2,y2),...,(xN,yN)},yi∈{1,...,K}是样本xi的标签,N为样本个数。

4.根据权利要求3所述的基于原型学习的开放集干扰识别模型的构建方法,其特征在于,采用欧几里得距离衡量输入干扰的特征向量与原型中心之间的距离:其中m为特征空间中特征的维数,采用高斯分布随机初始化原型中心。

5.根据权利要求1所述的基于原型学习的开放集干扰识别模型的构建方法,其特征在于,所述的特征提取网络包括两个分别用于提取时域特征和频域特征的分支网络,且特征提取网络通过将两个分支网络的输出进行拼接和融合得到相应干扰信号的特征向量。

6.根据权利要求5所述的基于原型学习的开放集干扰识别模型的构建方法,其特征在于,所述特征提取网络的分支网络均采用ResNet结构的一维深度残差网络;

两个分支网络的池化层均连接于拼接层,由拼接层对两个分支网络的输出进行特征拼接输出。

7.根据权利要求6所述的基于原型学习的开放集干扰识别模型的构建方法,其特征在于,所述拼接层依次连接于线性层、激活函数层、线性层进行非线性变换得到融合后的特征向量。

8.一种基于原型学习的开放集干扰识别方法,其特征在于,包括以下步骤:

S1.由特征提取网络提取输入干扰的特征向量;

S2.分类模型根据特征提取网络输出的特征向量与相应干扰类别的原型中心的距离进行干扰类别识别;

S3.识别距离最近的干扰类别为相应输入干扰所属的类别;

所述特征提取网络和分类模型通过以下损失函数训练优化特征提取能力和类别识别能力:Lc(x,y;θ,O)=‑log p(y=k|x,f,O)   (4)L(x,y;θ,Op)=Lc(x,y;θ,Op\OK+1)+λ·Lc(x,K+1;θ,Op\Oy) (3)d(f(x),Ok)表示特征向量与原型中心之间的距离,z=f(x)表示特征提取函数,O={Ok,k=1,...,K}表示原型中心,K表示K类已知干扰类别,Dtr={(x1,y1),(x2,y2),...,(xN,yN)},yi∈{1,...,K}是样本xi的标签,N为样本个数;

其中θ表示网络参数,λ为常数,Op={Ok,k=1,...,K+1}为假定未知干扰也具有原型中心OK+1时的原型中心集合,K+1表示未知干扰类别;

公式(3)第一项对应于闭集训练,Op\OK+1表示移除原型中心集合中未知干扰类别原型,训练优化模型使得输出以匹配已知干扰类别;第二项对应于开集训练,Op\Oy表示移除原型中心集合中样本x对应真实标签y的原型中心Oy,训练优化模型使得样本被识别为未知干扰类别,通过最小化损失函数L使得模型在保证已知干扰类别识别准确性的同时具有识别未知样本的能力;

网络训练结束以后将得到K+1个原型中心,前K个为已知类原型中心,第K+1个为未知干扰原型中心,当输入干扰与第k个原型中心的距离最小时,则输入干扰属于第k类,当与第K+

1个原型中心的距离最小时,则该输入干扰为未知类。

说明书 :

一种基于原型学习的开放集干扰识别模型和方法

技术领域

[0001] 本发明属于通信干扰信号开放识别技术领域,尤其是涉及一种基于原型学习的开放集干扰识别模型和方法。

背景技术

[0002] 在无线通信系统所处的电磁环境日益复杂,通信设备受到各种干扰信号和噪声的影响下,为了保障通信的可靠性,各种通信抗干扰技术应运而生,高效可行的抗干扰技术对于军事通信的抗干扰能力尤为重要。然而在实际中一种抗干扰策略往往只对特定干扰类型有效,因此对通信干扰信号的准确识别,根据所识别干扰信号种类,采用相应的抗干扰措施对通信抗干扰能力具有重要意义。
[0003] 传统的干扰识别方法由特征提取和模式识别两部分组成,首先根据信号的时频域分析、信号空间分析等人工提取特征,再使用模式识别中的决策树、支持向量机等模式识别方法进行分类。这些方法十分依赖人工提取特征的有效性,通常面临算法复杂度高,特征信息不全等问题。为了解决这一问题,人们提出了基于深度学习的特征提取方法,基于深度学习的方法能自动提取高维特征,可以提取信号中的深层表示,避免了对人工识别特征的依赖。利用深度学习优秀的特征提取能力和分类性能,实现了优于传统干扰识别算法的识别效果。
[0004] 但是在新型干扰不断涌现的情况下,现有的基于深度学习的干扰识别方法只能对已知种类的干扰进行识别,也就是闭集识别(Closed Set Recognition, CSR)。而当有新的干扰方式出现时,现有的方法只能将其错误的识别为已知干扰方式的一种,而无法判断其为未知干扰方式,从而造成错误的抗干扰措施的使用,从而降低通信系统的抗干扰能力。因此如何能准确识别出已知干扰方式的同时有效拒绝未知抗干扰方式也就是开放集识别(Open Set Recognition, OSR),对于提高通信系统的抗干扰能力非常重要。

发明内容

[0005] 本发明的目的是针对上述问题,提供一种基于原型学习的开放集干扰识别模型和方法。
[0006] 为达到上述目的,本发明采用了下列技术方案:
[0007] 一种基于原型学习的开放集干扰识别模型,包括具有特征提取网络和分类模型的PL‑Net,所述的特征提取网络用于对输入干扰提取特征,所述的分类模型用于根据特征提取网络输出的特征向量与相应干扰类别的原型中心的距离进行干扰类别识别,且用于训练PL‑Net的损失函数包括闭集训练项和开集训练项,所述开集训练项的原型中心集合包括未知干扰类别原型中心,所述闭集训练项的原型中心集合无未知干扰类别原型中心,通过训练得到若干已知干扰类别原型中心和一个未知干扰类别原型中心用于已知干扰类别分类和未知干扰类别识别。
[0008] 在上述的基于原型学习的开放集干扰识别模型中,所述闭集训练项的原型中心集合为所有样本均对应有原型的第一原型集合;
[0009] 所述开集训练项的原型中心集合为去除一个或多个已知样本对应原型的第二原型集合。
[0010] 在上述的基于原型学习的开放集干扰识别模型中,所述的分类模型通过以下方式计算输入干扰的特征向量与各原型中心的距离:
[0011]   (1)
[0012] 表示特征向量与原型中心之间的距离, 表示特征提取函数, 表示原型中心,
, 是训练样本 的
标签, 为样本个数。
[0013] 在上述的基于原型学习的开放集干扰识别模型中,采用欧几里得距离衡量输入干扰的特征向量与原型中心之间的距离:
[0014]       (2)
[0015] 其中 为特征空间中特征的维数,采用高斯分布随机初始化原型中心。
[0016] 在上述的基于原型学习的开放集干扰识别模型中,所述的损失函数包括:
[0017] (3)
[0018]     (4)
[0019] 其中 表示网络参数, 为常数, ,K表示K类已知干扰类别, ,K+1表示未知干扰类别;
[0020] 公式(4)的第一项对应于闭集训练, 表示移除原型中心集合中未知干扰类别原型,训练优化模型使得输出以匹配已知干扰类别;第二项对应于开集训练,表示移除原型中心集合中样本 对应真实标签 的原型中心 ,训练优化模型使得样本被识别为未知干扰类别,通过最小化损失函数 使得模型在保证已知干扰类别识别准确性的同时具有识别未知干扰的能力。
[0021] 在上述的基于原型学习的开放集干扰识别模型中,所述的特征提取网络包括两个分别用于提取时域特征和频域特征的分支网络,且特征提取网络通过将两个分支网络的输出进行拼接和融合得到相应干扰信号的特征向量。
[0022] 在上述的基于原型学习的开放集干扰识别模型中,所述特征提取网络的分支网络均采用ResNet结构的一维深度残差网络;
[0023] 两个分支网络的池化层均连接于拼接层,由拼接层对两个分支网络的输出进行特征拼接输出。
[0024] 在上述的基于原型学习的开放集干扰识别模型中,所述拼接层依次连接于线性层、激活函数层、线性层进行非线性变换得到融合后的特征向量。
[0025] 一种基于原型学习的开放集干扰识别方法,包括以下步骤:
[0026] S1.由特征提取网络提取输入干扰的特征向量;
[0027] S2.分类模型根据特征提取网络输出的特征向量与相应干扰类别的原型中心的距离进行干扰类别识别;
[0028] S3.识别距离最近的干扰类别为相应输入干扰所属的类别。
[0029] 在上述的基于原型学习的开放集干扰识别方法中,所述特征提取网络和分类模型通过以下损失函数训练优化特征提取能力和类别识别能力:
[0030]        (1)
[0031]        (4)
[0032] (3)
[0033] 表示特征向量与原型中心之间的距离, 表示特征提取函数, 表示原型中心,
, 是样本 的标
签, 为样本个数;
[0034] 其中 表示网络参数, 为常数, ,K表示K类已知干扰类别, ,K+1表示未知干扰类别;
[0035] 公式(4)第一项对应于闭集训练, 表示移除原型中心集合中未知干扰类别原型,训练优化模型使得输出以匹配已知干扰类别;第二项对应于开集训练,表示移除原型中心集合中样本 对应真实标签 的原型中心 ,训练优化模型使得样本被识别为未知干扰类别,通过最小化损失函数 使得模型在保证已知干扰类别识别准确性的同时具有识别未知样本的能力;
[0036] 网络训练结束以后将得到K+1个原型中心,前K个为已知类原型中心,第K+1个为未知干扰原型中心,当输入干扰与第 个原型中心的距离最小时,则样本属于第 类,当与第K+1个原型中心的距离最小时,则该输入干扰为未知类。
[0037] 本发明的优点在于:
[0038] 1、本方案设计的损失函数基于原型学习策略,通过假定开放类别原型中心将闭集训练和开集训练相结合,使其对未知类别也能够基于原型中心进行识别,从而使模型能够被用于识别未知样本,有效提高了模型在开放集合情况下干扰识别精度;
[0039] 2、本方案在进行开放集测试时可直接判断样本是否为未知干扰,无需依靠训练集合的信息得到开集阈值,有效降低了识别的复杂度;
[0040] 3、本方案融合了ResNet结构和干扰信号的时域频域特点,设计的特征提取网络采用将时域和频域分别提取特征后进行融合,在很大程度上提高了网络对输入信号的特征提取能力;
[0041] 4、本方案通过一个较为简单的模型和算法就能够实现对已知类别的准确判断和未知类别的识别。

附图说明

[0042] 图1为本发明一种基于原型学习的开放集干扰识别方法的特征提取网络结构图;
[0043] 图2为本发明基于原型学习的开放集干扰识别方法的模型训练和识别流程图。

具体实施方式

[0044] 下面结合附图和具体实施方式对本发明做进一步详细的说明。
[0045] 如图2所示构建开放集干扰识别模型PL‑Net对已知干扰进行分类对未知干扰进行识别,其中特征提取网络如图1所示,该网络结合ResNet结构和干扰信号特点,所设计的特征提取网络具体结构如下:
[0046] 是采样长度为1024的干扰信号, 是与 维度相同的高斯白噪声。将时域信号 经过傅立叶变换后得到频域信号 分别输入两个分支网 以分别得到信号时域特征和频域特征,然后将其拼接后输入线性层进行特征融合得到最终特征向量。
[0047] 其中分支网络 为采用ResNet结构的一维深度残差网络。每个 包含33个一维卷积层其中包含16个残差基本块、两个一维池化层。卷积层参数的意义分别为:卷积核大小、卷积层类型、卷积核个数和输出长度变化量。例如卷积层参数{3x1 conv1d 128,/2}代表使用卷积核大小为3x1的一维卷积,卷积核数量为128,输出序列长度减小为输入序列的一半。每个分支网络具有两个池化层,分别为最大池化层(max pool)和自适应池化层(adapt pool)。
[0048] cat层的作用是对时域特征 和频域特征 进行特征拼接得到输出,后续的linear层和relu层对拼接后的特征进行非线性变
换得到融合后的特征向量。
[0049] 特征提取网络的设计融合了ResNet结构和干扰信号的时域频域特点,能够在很大程度上程度提高网络对输入信号的特征提取能力,从而保障后续的分类能力。
[0050] 进一步地,本方案为了使模型既能够区分已知干扰信号,又能够识别未知干扰信号,为PL‑Net设计了独特的损失函数,该损失函数基于原型学习设计思路而来,定义已知干扰原型中心集合,然后采用干扰特征与原型中心的距离来判断干扰信号所属类别,故能够用于实现模型的已知干扰分类能力,同时通过假定未知干扰也有原型中心并通过去除已知干扰对应原型的方式训练出未知干扰的原型中心,使模型同时具有对未知干扰的识别能力,具体实现方式如下:
[0051] 将已知干扰信号作为训练数据集 其中是干扰 的标签, 为训练集干扰信号个数, 为干扰信号种类,根据原型学习策略,定义原型中心 。通过特征提取网络得到干扰信号 的特征
向量 ,对于该干扰 属于第 类的概率通过公式(1)计算得到:
[0052] (1)
[0053] 其中 代表特征向量与原型之间的距离, 表示特征提取函数,即将输入干扰映射到特征空间。为了更好表达特征空间上的距离,本实施例使用欧几里得距离衡量干扰信号特征与原型中心之间的距离:
[0054]        (2)
[0055] 其中 为特征空间中特征的维数。采用高斯分布随机初始化原型中心,定义损失函数为(3),使干扰信号特征向量与对应的原型中心尽可能接近,以同时训练PL‑Net的特征提取能力和分类能力:
[0056] (3)
[0057] 其中 代表网络参数。
[0058] 进一步地,本实施例进一步假定未知干扰也具有原型中心 , 代表未知干扰类别标签,则原型中心集合定义为 。假定已有训练良好的特征提取网络和原型中心,则给定干扰信号 和其对应真实标签 ,对于不包含未知干扰类别原型的原型中心集合,样本经过特征提取网络所得到的特征向量 应与原型 具有最小的距离。而对于去除原型 的剩余原型集合,该样本 将被视为未知样本,特征向量 将与未知原型中心 具有最小距离,通过以上方法,本实施例将损失函数可定义为:
[0059] (4)
[0060] 其中 为常数,第一项对应于闭集训练, 表示移除原型中心集合中未知类别原型,训练优化模型使得输出以匹配已知类别;第二项对应于开集训练, 表示移除原型中心集合中样本 对应真实标签 的原型中心 ,训练优化模型使得样本被识别为未知类别。通过最小化损失函数 使得模型具有除已知类别的K个原型中心外还具有未知类别的第K+1个原型中心。
[0061] 本实施例中,上述闭集训练项的原型中心集合为 除去未知原型的已知干扰原型中心集合,开集训练项的原型中心集合为 除去一个样本对应原型的剩余原型中心集合。即同一个样本,在不同原型集合的视角下被认为为已知和未知。
[0062] 最后,如图2所示,使用训练集训练后的PL‑Net模型对测试集干扰信号进行识别。模型训练完成后会得到 个干扰信号原型中心,将模型用于对干扰信号进行识别时,待识别样本被代入公式(2)得到与 个原型中心的距离。分类规则表示为:
[0063]
[0064] 当与第 个原型中心的距离最小时,则识别该干扰属于第 类,由于前 个为已知类原型中心,第 个为未知干扰原型中心,因此当该样本与第 个原型中心的距离最小时,则识别该样本为未知干扰。
[0065] 本实施设定已知干扰为跳频干扰、线性扫频干扰和二次扫频干扰,未知干扰为多音干扰。训练集设定为已知干扰,且每种干扰包含从‑10dB到20dB,间隔2dB的每一干噪比下有2000个样本,共计90000个样本。测试集包含已知干扰和未知干扰,每一干噪比下有500个样本,共计30000个样本。通过上述构建利用训练集对模型进行训练后得到4个原型中心:跳频干扰原型中心、线性扫频干扰原型中心、二次扫频干扰原型中心和未知信号原型中心。然后使用测试集对得到的开放集干扰识别模型进行测试验证:
[0066] 将跳频干扰信号输入特征提取网络后通过公式(2)得到与4个原型中心的距离,但是与跳频干扰原型中心距离最小,故识别跳频干扰信号属于跳频干扰。同样地,将线性扫频干扰信号输入特征提取网络后通过公式(2)得到与4个原型中心的距离,但是与线性扫频干扰原型中心距离最小,故识别线性扫频干扰信号属于线性扫频干扰。将二次扫频干扰信号输入特征提取网络后通过公式(2)得到与4个原型中心的距离,但是与二次扫频干扰原型中心距离最小,故识别二次扫频干扰信号为二次扫频干扰。将多音干扰信号输入特征提取网络后通过公式(2)得到与4个原型中心的距离,发现其与未知原型中心距离最小,故识多音干扰信号为未知类别。可见,经过上述构建利用已知干扰进行训练能够对已知干扰跳频干扰、线性扫频干扰和二次扫频干扰进行分类,还能够对未知的多音干扰进行识别。
[0067] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。