一种基于GRU网络的主用户数目估计方法转让专利

申请号 : CN202010488065.0

文献号 : CN111612097B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 彭盛亮孙姝君李焕焕黄秋婷

申请人 : 华侨大学

摘要 :

本发明提供一种基于GRU网络的主用户数目估计方法,涉及通信技术中认知无线电领域。本估计方法包括离线训练阶段和在线识别阶段。离线训练阶段包括:S1、获取已知信号;S2、计算已知信号对应的归一化总功率S3、生成Ns×1观测向量;S4、数据标定;S5、生成打有标签的训练数据集;S6、训练GRU网络模型。在线识别阶段包括:S7、接收未知信号x(t);S8、计算信号x(t)对应的归一化总功率S9、生成Ns×1观测向量;S10、将主用户数目未知信号的观测向量送入训练好的GRU网络模型,得到主用户数目估计结果。本发明方法,引入深度学习的思想,充分考虑接收信号的时域相关性和网络模型复杂度,利用GRU网络,能够在较少人工干预下有效估计出主用户数目。

权利要求 :

1.一种基于GRU网络的主用户数目估计方法,其特征在于,利用GRU网络估计接收信号的主用户数目,包含离线训练阶段和在线识别阶段;

所述离线训练阶段包括:

S1、获取已知信号:空口接收或仿真获得N个主用户信号si(t),1≤i≤N,主用户数目N为已知量;

S2、计算信号功率:计算N个信号si(t)的归一化总功率为 其中,信号归一化总功率的计算方法如下:ms=E{Ps(t)},

其中, 表示t时刻第i个主用户PUi(1≤i≤N)的信号功率,N为主用户数目,Ps(t)表示t时刻N个主用户信号的总功率,ms为信号总功率Ps(t)的均值;

S3、生成观测向量:选取归一化总功率 中Ns个采样点作为一组观测值,构成一个Ns×1观测向量;

S4、数据标定:根据归一化总功率 中包含的主用户数目N对观测向量打标签;

S5、生成训练数据集:选择不同的主用户数目N,重复步骤S1‑S4,生成大量打过标签的观测向量作为训练数据集;

S6、训练GRU网络:将训练数据集输入GRU网络进行训练,得到训练好的主用户数目估计模型;

所述在线识别阶段包括:

S7、接收未知信号:空口接收主用户数目未知的信号x(t);

S8、计算信号功率:计算信号x(t)的归一化总功率为S9、生成观测向量:选取归一化总功率 中Ns个采样点作为一组观测值,构成一个Ns×1观测向量;

S10、主用户数目估计:将接收到的主用户数目未知的观测向量送入步骤S6得到的训练好的主用户数目估计模型中,进行主用户数目估计,得到估计结果。

2.根据权利要求1所述的基于GRU网络的主用户数目估计方法,其特征在于,以仿真方式获得主用户信号的功率 服从指数分布,其概率密度函数如下:其中,P0表示其功率均值。

3.根据权利要求1所述的基于GRU网络的主用户数目估计方法,其特征在于,次级用户接收未知信号,接收到主用户数目未知的信号的归一化总功率 其计算方法如下:2

Px(t)=|x(t)| ,

mx=E{Px(t)},

其中,Px(t)表示t时刻次级用户接收到的信号总功率,mx为接收信号总功率Px(t)的均值。

4.根据权利要求1所述的基于GRU网络的主用户数目估计方法,其特征在于,充分考虑MAC信号的时域相关性,利用GRU网络作为主用户数目估计的分类器,其超参数设置lstm_size为10,lstm_layers为2,batch_size为2500,seq_len为20,learning_rate为0.001,Epochs为125,n_classes为15,n_channels为1。

说明书 :

一种基于GRU网络的主用户数目估计方法

技术领域

[0001] 本发明属于通信技术中认知无线电领域,具体涉及次级用户基于门控循环单元(Gate Recurrent Unit,GRU)网络估计媒体访问控制(Medium Access Control,MAC)协议信号中主用户数目的方法。

背景技术

[0002] 近年来,由于认知无线电能够感知外界环境的变化,提高频谱利用率和通信系统容量,解决频谱资源紧张的问题而被认为是颇具前景的技术。在认知无线电系统中,次级用户在不会对主用户产生严重干扰的前提下,可以占用空闲的频谱资源。为了尽量减少对主用户的干扰,次级用户需要及时感知主用户的频谱使用状况。因此,频谱感知被认为是认知无线电中的关键技术。一方面,次级用户拥有主用户数目的先验知识,有利于估计主用户信号更多的细节参数,例如载波频率、到达间隔和位置等,另一方面,可减少次级用户对主用户的干扰。
[0003] 目前,在认知无线电的信号处理领域,主用户数目估计的研究工作大致可分为单个主用户问题研究和多个主用户问题研究两个方面。检测单个主用户的工作已被广泛研究,许多方法都已被提出,如能量检测、匹配滤波器检测和基于特征的检测等,但多个主用户的检测更符合实际应用场景,目前也已提出许多估计主用户数目的方法。其中最经典的是基于信息论准则的算法,包括Akaik信息准则(Akaike Information Criterion,AIC)、最小描述长度(Minimum Description Length,MDL)和基于盖氏圆半径准则(Gerschgorin Disks Estimator,GDE)等,但这几种方法需要在网络中专门设立阵列天线来检测主用户的数目,且能够检测的信号个数少,在信号个数多的情况下,检测效果差。最新提出的一种基于支持向量机的主用户数目检测方法,通过多个次级用户接收主用户信号,对接收到的主用户信号进行特征提取,得到两类特征向量,再将这两类特征向量组成新的特征向量作为支持向量机的输入,生成训练模型。但由于这种手动从接收信号中提取出来特征非常依赖专业知识,如果特征提取不恰当或者选取的特征不十分合适,那么主用户数目的估计准确率将受到严重影响。

发明内容

[0004] 本发明的目的在于克服现有技术的不足,提供一种基于GRU网络的主用户数目估计方法,用于解决认知无线电系统中多个主用户数目估计的问题。
[0005] 为了实现上述目的,本发明提出以下技术方案:
[0006] 一种基于GRU网络的主用户数目估计方法,利用GRU网络估计接收信号的主用户数目,包含离线训练阶段和在线识别阶段。
[0007] 所述离线训练阶段包括:
[0008] S1、获取已知信号:空口接收或仿真获得N个主用户信号si(t),1≤i≤N,主用户数目N为已知量;
[0009] S2、计算信号功率:计算N个信号si(t)的归一化总功率为
[0010] S3、生成观测向量:选取归一化总功率 中Ns个采样点作为一组观测值,构成一个Ns×1观测向量;
[0011] S4、数据标定:根据归一化总功率 中包含的主用户数目N对观测向量打标签;
[0012] S5、生成训练数据集:选择不同的主用户数目N,重复步骤S1‑S4,生成大量打过标签的观测向量作为训练数据集;
[0013] S6、训练GRU网络:将训练数据集输入GRU网络进行训练,得到训练好的主用户数目估计模型。
[0014] 所述在线识别阶段包括:
[0015] S7、接收未知信号:空口接收主用户数目未知的信号x(t);
[0016] S8、计算信号功率:计算信号x(t)的归一化总功率为
[0017] S9、生成观测向量:选取归一化总功率 中Ns个采样点作为一组观测值,构成一个Ns×1观测向量;
[0018] S10、主用户数目估计:将接收到的主用户数目未知的观测向量送入步骤S6得到的训练好的主用户数目估计模型中,进行主用户数目估计,得到估计结果。
[0019] 优选地,信号归一化总功率 的计算方法如下:
[0020]
[0021] ms=E{Ps(t)},
[0022]
[0023] 其中,空口接收或仿真获得的信号si(t)的功率 的计算方法如下:
[0024]
[0025] 其中, 表示t时刻第i个主用户PUi(1≤i≤N)的信号功率,N为主用户数目,Ps(t)表示t时刻N个主用户信号的总功率,ms为信号总功率Ps(t)的均值。
[0026] 优选地,以仿真方式获得主用户信号的功率 服从指数分布,其概率密度函数如下:
[0027]
[0028] 其中,P0表示其功率均值。
[0029] 优选地,次级用户接收未知信号,空口接收到主用户数目未知的信号的归一化总功率 其计算方法如下:
[0030] Px(t)=|x(t)|2,
[0031] mx=E{Px(t)},
[0032]
[0033] 其中,Px(t)表示t时刻次级用户接收到的信号总功率,mx为接收信号总功率Px(t)的均值。
[0034] 优选地,充分考虑MAC信号的时域相关性,利用GRU网络作为主用户数目估计的分类器,其超参数设置lstm_size为10,lstm_layers为2,batch_size为2500,seq_len为20,learning_rate为0.001,Epochs为125,n_classes为15,n_channels为1。
[0035] 本发明的有益效果如下:
[0036] (1)本发明方法引入深度学习思想,利用GRU网络处理接收到的信号,自动提取特征,整个识别过程人工干预较少;
[0037] (2)本发明方法充分利用海量通信数据训练GRU网络,能够实现信号中多个主用户数目的估计,且准确率高。

附图说明

[0038] 图1为本发明实施例1提供的基于GRU网络的主用户数目估计方法的流程图;
[0039] 图2为本发明实施例1提供的认知无线电系统模型示意图;
[0040] 图3为本发明实施例1提供的不同主用户数目中一种随机情况的信号示意图;
[0041] 图4为本发明实施例1提供的不同条件下进行主用户数目估计的精度图。

具体实施方式

[0042] 以下结合附图及实施例对本发明作进一步详细说明。
[0043] 实施例1
[0044] 本实施例提出一种基于GRU网络的主用户数目估计方法,本方法的流程图如图1所示,包括以下步骤:离线训练阶段和在线识别阶段。
[0045] 其中,离线训练阶段包括以下步骤S1~S6:
[0046] S1、获取已知信号:空口接收或仿真获得N个主用户信号si(t),1≤i≤N,主用户数目N为已知量;
[0047] S2、计算信号功率:计算N个信号si(t)的归一化总功率为 计算公式如下[0048]
[0049]
[0050] ms=E{Ps(t)},
[0051]
[0052] 其中, 表示t时刻第i个主用户PUi(1≤i≤N)的信号功率,N为主用户数目,Ps(t)表示t时刻N个主用户信号的总功率,ms为信号总功率Ps(t)的均值;
[0053] S3、生成观测向量:选取归一化总功率 中Ns个采样点作为一组观测值,构成一个Ns×1观测向量,Ns优选取值为Slotted Aloha时隙长度的整数倍,取整数倍有利于在采样时获得一段完整的数据;
[0054] S4、数据标定:根据归一化总功率 中包含的主用户数目N对观测向量打标签,打标签以标识观测向量所包含的正确主用户数目;
[0055] S5、生成训练数据集:选择不同的主用户数目N,重复步骤S1‑S4,得到大量打过标签的观测向量作为训练数据集;
[0056] 例如,主用户数目数据集N={1,2,...,15}的标签值分别为{0,1,...,14},数据集中,每种用户数量生成50万个观测向量,用于GRU网络训练;
[0057] S6、训练GRU网络:将训练数据集输入GRU网络进行训练,得到训练好的主用户数目估计模型。
[0058] 训练过程引入梯度截断,防止在梯度下降过程中发生梯度爆炸。模型训练可基于TensorFlow框架,超参数设置可根据实际损失手动优化。
[0059] 所述在线识别阶段包括以下步骤S7~S10:
[0060] S7、接收未知信号:次级用户空口接收主用户数目未知的信号x(t);每个次级用户每次接收一个主用户数目未知的信号x(t);
[0061] S8、计算信号功率:计算信号x(t)的归一化总功率为
[0062] Px(t)=|x(t)|2,
[0063] mx=E{Px(t)},
[0064]
[0065] S9、生成观测向量:选取归一化总功率 中Ns个采样点作为一组观测值,构成一个Ns×1观测向量;
[0066] S10、主用户数目估计:将接收到的主用户数目未知的信号观测向量送入S6训练好的主用户数目估计模型中进行估计,得到估计结果。
[0067] 例如图2所示,认知无线电系统模型由N个主用户(PU1,PU2,...,PUN)和一个次级用户(SU)构成。N个主用户在M个可选的MAC协议组成的集合{C1,C2,...,CM}中选择一种协议Cj(1≤j≤M)与基站进行通信,次级用户通过监测主用户信号来确定N的数值。本发明考虑了Slotted Aloha和Pure Aloha两种MAC协议下的多种主用户数目情况。假设两种协议发送数据包的长度相等;Slotted Aloha时隙长度等于数据包长度;传输信道为瑞利衰落信道;仿真信号s(t)的功率p服从指数分布,其概率密度函数为:
[0068]
[0069] 其中P0是功率均值。通信中,信号在信道中传输时会存在反射、折射等现象,因此本发明考虑了瑞利衰落信道对信号的影响。在该信道中,信号功率的包络服从指数分布。
[0070] 在Slotted Aloha协议中,每个主用户都有权力使用任意时隙,不管此时隙是否被其他用户占用。在每个时隙,所有主用户均以概率σt产生新的数据包,并发送出去。如果有多个用户在相同时隙发送,就会产生冲突。
[0071] 在Pure Aloha协议中,不存在时隙结构,每个主用户都可以在任意时刻以概率σt生成新的数据包,并发送出去。如果多个主用户的发送时间有重叠,也会产生冲突。
[0072] 图3给出了采用Slotted Aloha协议的信号在不同主用户数目下的情况对比。填充色为白色的框表示信道空闲,填充色为灰色的框表示数据包发送成功,填充色为黑色的框表示发送冲突。如图3所示,当主用户数目N分别为10和15时,碰撞的概率、时间段和信号的能力特征随机且不同,即不同主用户数目的信号样式不同,因此,可利用GRU网络作为分类器,处理接收到的MAC协议信号,估计出接收信号中包含的主用户数目。
[0073] 图4给出了不同数据包发送概率下,主用户数目估计准确率随次级用户接收信号中包含的主用户数目变化的精度曲线,在1~15个主用户内,主用户越多,数目估计越准确。
[0074] 门控循环单元(Gate Recurrent Unit,GRU)网络是为解决长期依赖和反向传播中的梯度等问题而提出的一种效果很好的长短期记忆(Long Short‑Term Memory,LSTM)网络的变体。LSTM网络是一种时间循环神经网络,可解决长期依赖问题。在LSTM网络中有三个门,而GRU网络中只有两个门:更新门和重置门。更新门用来控制前一时刻状态信息流入到当前状态中的程度,更新门的值越大说明当前时刻带入的前一时刻状态信息越多;重置门用来控制节点忽略前一时刻状态信息的程度,重置门越小,则前一时刻状态信息的忽略程度越大,前一状态的信息被写入的越少。重置门利于捕捉时序数据中短期的依赖关系,更新门利于捕捉时序数据中长期的依赖关系。此外,由于GRU网络比LSTM网络少一个门结构,因此参数数量少于LSTM网络,整体上GRU网络的训练速度快于LSTM网络。综合考虑MAC信号具有的时域相关性和网络模型的复杂度,在一个优选实施例中,本发明选择GRU网络作为主用户数目估计的分类器,GRU网络模型的具体超参数设置可见表1。
[0075] 表1超参数设置表
[0076]
[0077] 本发明的有益效果为:(1)本发明方法引入深度学习思想,综合考虑信号的时间相关性和网络复杂度,利用GRU网络处理接收到的信号,自动提取特征,整个识别过程人工干预较少;(2)本发明方法充分利用海量通信数据训练GRU网络,能够实现MAC协议中多个主用户数目的估计,且准确率高。
[0078] 以上为本发明较佳的实施方案,但本发明并不仅限于上述实施方案,凡按本发明实质所做的任何均等变化和修饰,所产生的功能作用未超出本方案的范围时,均属于本发明的保护范围。