认知无线电中基于博弈论的公共信道的建立方法转让专利

申请号 : CN200910076265.9

文献号 : CN101466119B

文献日 : 2010-11-10

本发明公开了一种认知无线电中基于博弈论的公共信道的建立方法，首先认知无线电中的多个用户分别对多个可用信道的效用进行评价，每个用户均选择对自身来说效用最大的信道，并通过该信道上发送广播信息，广播信息包含本信道的质量信息；然后每个用户根据其它用户发送的信道质量信息重新评价和选择信道，该过程多次进行，并进行归一化处理，使其收敛于一条对多个用户来说效用最优的信道，即为公共信道。该方法能使CR系统选择效用较高的公共信息信道。

1.一种认知无线电中基于博弈论的公共信道的建立方法，其特征在于，包括步骤：

首先，认知无线电CR中的多个用户分别对多个可用信道的效用进行评价，每个用户均选择对自身来说效用最大的信道，并通过该信道发送广播信息，所述广播信息包含本信道的质量信息；

然后，每个用户根据其它用户发送的信道质量信息重新评价和选择信道，该过程多次进行，并进行归一化处理，使全网收敛于一条对多个用户来说效用最优的信道，即为公共信道；

所述的多个用户中，某一用户在对某一可用信道的效用进行评价时，考虑以下一项或多项因素：

该用户自身选择的信道的质量信息对该信道的效用的贡献；

与该用户选择相同信道的其他用户的信道质量信息对该信道的效用的贡献；

与该用户选择不同信道的其他用户的信道质量信息对该信道的效用的惩罚；

所述的用户为感知用户，所述感知用户的可用信道的数量为认知无线电网络中的信道总数量减去主用户占用的信道数量；所述某一用户在对某一可用信道的效用进行评价时，设定以下效用函数，并通过该函数对该信道质量进行加权： $U_{idx_cu} = C_{idx_cu, sel_chan} \cdot δ \cdot \frac{N_{tx}_{idx_cu}}{N_rec} + Σ_{t \neq idx_cu}^{N} Σ_{p = 1}^{l} P (p) \cdot N_{rec}_{t, p} \cdot C_{t, p} - Σ_{t \neq idx_cu}^{N} Σ_{q = 1}^{l} Q (q) \cdot N_{rec}_{t, q} \cdot C_{t, q}$ 式中各个参数描述如下：

N：感知用户数量；

l：可用信道数量；

idx_cu：感知用户索引，范围从1到N；

t：第t个用户，范围从1到N；

sel_chan：用户idx_cu所选择的最优信道，取值范围从1到l；

Uidx_cu：用户idx_cu根据公式计算得到的信道sel_chan的效用；

Cidx_cu，sel_chan：用户idx_cu检测到的信道sel_chan的质量信息；

Ct，p：第t个用户所测量到的第p个信道的质量信息；

Ct，q：第t个用户所测量到的第q个信道的质量信息；

N_rect，p：用户idx_cu接收到的第t个用户在第p个信道上的广播信息的次数；

N_rect，q：用户idx_cu接收到的第t个用户在第q个信道上广播信息的次数；

δ：用户自私因子，代表用户idx_cu使用对自己最优信道的坚持度；

N_txidx_cu：用户idx_cu在信道sel_chan上发送广播信息的次数；

N_rec：用户idx_cu接收到的所有广播信息的次数；

为信道选择函数，用来确定接收到的广播信息对总效用的增加还是减少。

2.根据权利要求1所述的认知无线电中基于博弈论的公共信道的建立方法，其特征在于，所述信道的质量用接收信噪比或信道容量中一项或两项表示。

3.根据权利要求1所述的认知无线电中基于博弈论的公共信道的建立方法，其特征在于，包括不能有效收敛时的控制手段：当经过有限次信道的评价和选择后，全网没有收敛到同一信道时，则直接在当前接收到的信道列表中选取当前最佳信道作为公共信息信道。

4.根据权利要求3所述的认知无线电中基于博弈论的公共信道的建立方法，其特征在于，所述控制手段包括：设当前最优信道的效用为：

$U_{ch_\max} = \max_{i \in [1 : l]} Σ_{t = 1}^{N} N_{t, i} \cdot C_{t, i}$ 式中，Nt，i为第t个用户在第i条信道的广播信息次数；Ct，i为第t个用户所测量的第i条信道的信道质量；

对应的第i条信道为所述当前最佳信道。

技术领域

本发明涉及一种认知无线电通信技术，尤其涉及一种认知无线电中基于博弈论的公共信道的建立方法。

背景技术

CR(认知无线电)作为一种无线通信技术，最典型的特点就是频谱变化的多样性和随机性，由于主用户的不定时接入和由其他因素引起的自然环境噪声温度变化，CR系统需要周期性的检测信道的可用状态和信道质量。CR用户之间需要一条相对稳定的公共信息信道共享这些信息。
另外，在一个CR网络服务集里面要进行相应的功率控制和信道分配算法，也需要公共信息信道来完成算法参数的传递和信息的广播。
所以公共信息信道对于CR系统是十分重要的。现今的频谱资源愈来愈少，而且大部分已经进行了固定分配，今后随着通信技术的不断进步可能对现有频谱资源进行进一步优化重组，但短期内不可能有大的变化。
在现有的频谱分配确定的前提下，还没有一种有效的算法，能使CR系统选择效用较高的公共信息信道。

发明内容

本发明的目的是提供一种认知无线电中基于博弈论的公共信道的建立方法，该方法能使认知无线电系统选择效用较高的公共信息信道。
本发明的目的是通过以下技术方案实现的：
本发明的认知无线电中基于博弈论的公共信道的建立方法，包括步骤：
首先，认知无线电CR中的多个用户分别对多个可用信道的效用进行评价，每个用户均选择对自身来说效用最大的信道，并通过该信道上发送广播信息，所述广播信息包含本信道的质量信息；
然后，每个用户根据其它用户发送的信道质量信息重新评价和选择信道，该过程多次进行，并进行归一化处理，使其收敛于一条对多个用户来说效用最优的信道，即为公共信道。
由上述本发明提供的技术方案可以看出，本发明所述的认知无线电中基于博弈论的公共信道的建立方法，由于首先认知无线电中的多个用户分别对多个可用信道的效用进行评价，每个用户均选择对自身来说效用最大的信道，并通过该信道上发送广播信息，所述广播信息包含本信道的质量信息；然后每个用户根据其它用户发送的信道质量信息重新评价和选择信道，该过程多次进行，并进行归一化处理，使其收敛于一条对多个用户来说效用最优的信道，即为公共信道。该方法能使CR系统选择效用较高的公共信息信道。

附图说明

图1为本发明的具体实施例中两用户循环震荡示意图；
图2为本发明的具体实施例中加以控制的两用户公共信息信道建立示意图；
图3为本发明的具体实施例中10用户100信道时的公共信息信道建立示意图；
图4为本发明的具体实施例中100用户10信道时的公共信息信道建立示意图；
图5为本发明的具体实施例中100用户100信道时的公共信息信道建立示意图。

具体实施方式

本发明的认知无线电中基于博弈论的公共信道的建立方法，其较佳的具体实施方式是，包括步骤：
首先，认知无线电CR中的多个用户分别对多个可用信道的效用进行评价，每个用户均选择对自身来说效用最大的信道，并通过该信道上发送广播信息，所述广播信息包含本信道的质量信息；
然后，每个用户根据其它用户发送的信道质量信息重新评价和选择信道，该过程多次进行，并进行归一化处理，使其收敛于一条对多个用户来说效用最优的信道，即为公共信道。
所述的多个用户中，某一用户在对某一可用信道的效用进行评价时，可用考虑以下一项或多项因素：
该用户自身选择的信道的质量信息对该信道的效用的贡献；
与该用户选择相同信道的其他用户的信道质量信息对该信道的效用的贡献；
与该用户选择不同信道的其他用户的信道质量信息对该信道的效用的惩罚。
所述的用户为感知用户，所述感知用户的可用信道包括认知无线电网络中的信道总数量减去主用户占用的信道数量。
所述某一用户在对某一可用信道的效用进行评价时，可用设定以下效用函数，并通过该函数对该信道质量进行加权：

U_{idx_cu} = C_{idx_cu, sel_chan} \cdot δ \cdot \frac{N_{tx}_{idx_cu}}{N_rec} + Σ_{t \neq idx_cu}^{N} Σ_{p = 1}^{l} P (p) \cdot N_{rec}_{t, p} \cdot C_{t, p} - Σ_{t \neq idx_cu}^{N} Σ_{q = 1}^{l} Q (q) \cdot N_{rec}_{t, q} \cdot C_{t, q}

式中各个参数描述如下：
N：感知用户数量；
l：可用信道数量；
idx_cu：感知用户索引，范围从1到N；
t：第t个用户，范围从1到N；
sel_chan：用户idx_cu所选择的最优信道，取值范围从1到l；
Uidx_cu：用户idx_cu根据公式计算得到的信道sel_chan的效用；
Cidx_cu，sel_chan：用户idx_cu检测到的信道sel_chan的质量信息；
Ct，p：第t个用户所测量到的第p个信道的质量信息；
Ct，q：第t个用户所测量到的第q个信道的质量信息；
N_rect，p：用户idx_cu接收到的第t个用户在第p个信道上的广播信息的次数；
N_rect，q：用户idx_cu接收到的第t个用户在第q个信道上广播信息的次数；
δ：用户自私因子，代表用户idx_cu使用对自己最优信道的坚持度；
N_txidx_cu：用户idx_cu在信道sel_chan上发送广播信息的次数；
N_rec：用户idx_cu接收到的所有广播信息的次数；

P (p) = \{\begin{matrix} 0 & p \neq sel_chan \\ 1 & p = sel_chan \end{matrix},

Q (q) = \{\begin{matrix} 1 & q \neq sel_chan \\ 0 & q = sel_chan \end{matrix}

：为信道选择函数，用来确定接收到的广播信息对总效用的增加还是减少。
所述信道的质量可以用接收信噪比或信道容量中一项或两项表示。
本发明还包括不能有效收敛时的控制手段：
当经过有限次信道的评价和选择后，全网没有收敛到同一信道时，则直接在当前接收到的信道列表中选取当前最佳信道作为公共信息信道。
具体控制手段可以包括：
设当前最优信道的效用为：

U_{ch_\max} = \max_{i \in [1 : l]} Σ_{t = 1}^{N} N_{t, i} \cdot C_{t, i}

式中，Nt，i为第t个用户在第i条信道的广播信息次数；Ct，i为第t个用户所测量的第i条信道的信道质量；
对应的第i条信道为所述当前最佳信道，即可选作为公共信息信道。
具体实施例：
首先，假设以下公共信息信道建立算法的前提条件：
1、一个IBSS(独立基本服务集)中可用信道状态对于各个节点一样。由于一个IBSS所覆盖范围有限，可以近似认为该IBSS周围的PU(主用户)对CU(感知用户)的影响类似。
2、由于分布不同和距离主用户距离同，不同的CU对于相同信道的感知情况不同，即对于CUt1和CUt2(感知用户t1和t2)，它们感知到的Ci(第i条信道的质量)有所差异。
3、信道状态在公共信息信道建立期间基本不变，使得算法能够有效收敛。
4、CU拥有全网定时的某种机制，如GPS等。
5、关于PU的突然介入，认为可以由物理层正确的检测并在可用信道列表里面进行标注，对于PU检测判决可以借助于全网定时机制，可以利用算法迭代周期间隔进行静默期检测，进而实现主用户的介入判决。
下面对算法应用的场景进行分析：
场景参数描述：
信道：Chi i∈[1，2，...，num_chan]，式中，num_chan为总信道数量；
每个信道上相应的高斯噪声：Ki i∈[1，2，...，num_chan]；
建立公共信息信道时发射功率固定为pcom。由于节点分布的随机性，可以规定接收节点处的平均接收功率为pcom·g g为信道衰落和接受处理增益的加权；
信道质量可以用接收信噪比或信道容量表示，分别为：
相应信道信噪比：SINRi＝pcom·g/Ki
用信道容量表示：Ci＝B·log2(1+SINRi)
规定公共信息信道质量的上限为C量纲同信道容量，当第i条信道的信道质量Ci小于C时，认为Ci增大有益于公共控制信息的传送；当Ci增大到一定程度时，Ci大于C，此时再增大Ci，公共信息信道的得益受限于固定的调制方式和传输速率，增加不再明显；
在一个小范围区域中，CU组成一个CR网络，小区周围可能有一个或若干个PU用户。所有信道集合为：CH＝{Ch1，Ch2...Chnum_chan}；
其中在某一时间段内，PU用户占据m个信道：CHPU＝{ChP1，ChP2...ChPm}
感知用户可以用物理层技术周期性的检测到这些已占用信道，而后形成自己的信道列表：CHCU＝{ChC1，ChC2...ChCl} l＝num_chan-m。
然后，对算法进行说明：
1、在一定时间间隔里，CR网络的感知用户在自己的空闲可用频段中周期性的扫频，以接收来自其他CR用户的广播信息，同时选择自己信道列表中的最优信道(信道质量最优)，并在该信道上发送广播信息，信息包括自己检测到该最优信道的质量Ci。
一个周期内，统计意义上来说，每个感知用户都在各个信道上接收到一些广播信息，对于一个CU节点来说，其他CU用户发送的广播信息中对同一信道的质量测量可能并不一样(由于衰落，多径等因素)，所以有必要对这些信息进行相应的加权。
设定一个效用函数，该效用函数以一定的方式对各个用户发送的信道质量进行加权，具体加权算法如下

U_{idx_cu} = C_{idx_cu, sel_chan} \cdot δ \cdot \frac{N_{tx}_{idx_cu}}{N_rec} + Σ_{t \neq idx_cu}^{N} Σ_{p = 1}^{l} P (p) \cdot N_{rec}_{t, p} \cdot C_{t, p} - Σ_{t \neq idx_cu}^{N} Σ_{q = 1}^{l} Q (q) \cdot N_{rec}_{t, q} \cdot C_{t, q}

式中各个参数描述如下：
N：感知用户数量；
l：可用信道数量；
idx_cu：index of cognitive user，感知用户索引，范围从1到N；
t：第t个用户，范围从1到N；
sel_chan：selected channel，用户idx_cu所选择的最优信道，取值范围从1到l。每个用户在一个博弈周期选择一个确定的sel_chan值，并在该博弈周期内该值不变；
Uidx_cu：用户idx_cu根据公式计算得到的信道sel_chan的效用；
Cidx_cu，sel_chan：用户idx_cu在信道sel_chan上的广播信息，描述用户idx_cu检测到的信道sel_chan的信道质量；
Ct，p：第t个用户在第p个信道上发送的广播信息，描述第t个用户所测量到的第p个信道质量；
Ct，q：第t个用户在第q个信道上发送的广播信息，描述第t个用户所测量到的第q个信道质量；
N_rect，p：用户idx_cu接收到的第t个用户在第p个信道上广播信息的次数；
N_rect，q：用户idx_cu接收到的第t个用户在第q个信道上广播信息的次数；
δ为用户自私因子，代表用户idx_cu使用对自己最优信道的坚持度；
N_txidx_cu：用户idx_cu在信道sel_chan上发送广播信息的次数；
N_rec：用户idx_cu接收到的所有广播信息的次数；
由于用户idx_cu不接收自己的广播信息，所以该项模拟考虑了用户idx_cu的信道度量对于效用函数的贡献；

P (p) = \{\begin{matrix} 0 & p \neq sel_chan \\ 1 & p = sel_chan \end{matrix},

Q (q) = \{\begin{matrix} 1 & q \neq sel_chan \\ 0 & q = sel_chan \end{matrix}

：P、Q这两个函数是信道选择函数，用来确定接收到的广播信息对总效用的增加还是减少。如果广播信息中包含的信道就是sel_chan，对应p等于sel_chan情况，则该信息会增加总效用Uidx_cu；反之对应q不等于sel_chan情况，就会减少Uidx_cu。
对于上述的整个公式：可分为三部分
第一部分：用户idx_cu自身的信道质量广播信息对效用函数的贡献。
第二部分：和用户idx_cu选择相同信道sel_chan的其他用户的信道质量广播信息对效用函数的贡献。
第三部分：和用户idx_cu选择不同于信道sel_chan的其他用户的信道质量广播信息对效用函数的惩罚。
这样每个用户在知道全部用户的选择分布后都会最大化自己的效用函数，从效用函数可以看出这一过程并不是自私的，而是考虑到其他用户的选择。
2、每个CR用户经过广播信息收集，分析后，在下一阶段选择使得效用函数最大的信道，在此信道上发送广播信息，包含本信道质量。
3、如此反复，经过若干次迭代后，全网会收敛到同一个信道上，设为公共信道。
如图1至图5所示，在应用上述的算法时，当用户数量较小的情况下出现循环震荡的概率大，由公式可知两个用户时一定会出现循环震荡，这也对应于一个博弈的混合策略纳什均衡，用户数量增多后出现纯策略纳什均衡的概率增大，收敛速度也快。因为除去某些特殊的博弈模型(Potential Game or S-modular Game)等之外，没有很有效的方法确定一个博弈是否具有唯一纯策略纳什均衡，所以可以在博弈过程不能有效收敛时加以控制：
定义当前最优信道质量

U_{ch_\max} = \max_{i \in [1 : l]} Σ_{t = 1}^{N} N_{t, i} \cdot C_{t, i}

即选择第i条信道的第t个用户的广播信息次数乘以第t个用户所测量的第i条信道的信道质量。对应的第i条信道为当前最佳信道。
可以加入最佳信道修正因子，在一个博弈阶段过后如果全网没有收敛到同一信道，则对当前最佳信道的信道质量乘以一大于1的增益系数一修正因子，由公式可以推导出经过有限次迭代后，各个节点的建立信道算法并不用改变，总可以使全网收敛到同一信道。
在一个博弈阶段过后如果全网没有收敛到同一信道，则可以直接在当前接收到的信道列表中选取当前最佳信道作为公共信息信道。
博弈论相关知识简介：
博弈标准式含有以下三个要素：参与人集合；每一个参与人可供选择的战略集；针对所有参与人可能选择的战略组合，每一个参与人获得的收益。
用G表示一个博弈，如果G有n个博弈方，每个博弈方的全部可选战略的集合称为“战略空间”，分别用S1，…，Sn表示，Sij∈Si表示博弈方i的第j个战略，其中j可取有限个值(有限战略博弈，如在有限个信道列表中选择信道)，也可取无限个值(无限战略博弈，如非限制功率调整)；博弈方i的得益用Ui表示，是各博弈方战略的多元函数，n个博弈方的博弈G可以表示成G＝{S1，…，Sn；U1，…，Un}。
在博弈G＝{S1，…，Sn；U1，…，Un}中，如果由各个博弈方的各一个策略组合(S1*，…，Sn*)中，任一博弈方i的策略Si*都是对其余博弈方策略组合(S1*，…，Si-1*，Si+1*，…，Sn*)的最佳策略，即
Ui(S1*，…，Si-1*，Si*，Si+1*，…，Sn*)≥Ui(S1*，…，Si-1*，Sij，Si+1*，…，Sn*)

\forall S_{ij} \in S_{i}

则称(S1*，…，Sn*)为G的一个纳什均衡。
纳什均衡是博弈论中一个最重要也是最基础的概念。博弈论预测的博弈结果中，给定每个参与人选定各自的战略，为使该预测是正确的，必须使参与人自愿根据已知信息推导出相应战略。这样，每个参与人要选择的战略必须是针对其他参与人选择战略的最优反应，这种理论推测结果可以叫做“战略稳定”或“自动实施”的，因为没有参与人愿意独自离弃他所选定的战略，这样纳什均衡就是所有参与者最终都会选择稳定状态。
本发明正是通过上述的算法找到这样一个均衡点，以使得所有用户能从随机的初始状态收敛到该点。
以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

认知无线电中基于博弈论的公共信道的建立方法转让专利

申请号 : CN200910076265.9

文献号 : CN101466119B

文献日 : 2010-11-10

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 韩小博 , 罗涛 , 郝建军 , 李剑峰 , 尹长川 , 刘丹谱 , 乐光新

申请人 : 北京邮电大学

摘要 :

权利要求 :

说明书 :

技术领域

背景技术

发明内容

附图说明

具体实施方式