基于非合作博弈的分布式超密集异构网络干扰协调方法转让专利

申请号 : CN201710269564.9

文献号 : CN107094060B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 潘志文涂晶刘楠尤肖虎

申请人 : 东南大学

摘要 :

本发明公开了一种基于非合作博弈的分布式超密集异构网络干扰协调方法,通过分析超密集网络的动态特性,将网络干扰问题建模成非合作博弈问题,网络中小区作为博弈参与者,最小化自身干扰为效用函数。为了推导纳什均衡解的存在,将建立博弈模型推导成潜在博弈问题,基于此提出了一种基于随机学习的反馈方法求解纳什均衡解。该方法根据每个小区每一次迭代的效用函数建立概率矩阵,通过不断更新概率矩阵得到最终的纳什均衡解。本发明能够在不需要小区间信息交换下,收敛到闭式解,最终所有小区在收敛到纳什均衡解时,使得整个网络干扰最小,提高了网络容量,以较低的复杂度有效地解决用户速率动态变化、网络密集化与网络容量,频谱效率之间的难题。

权利要求 :

1.基于非合作博弈的分布式超密集异构网络干扰协调方法,其特征在于,包括如下步骤:步骤一,采集网络信息,初始化参数

采集网络中的宏站数目M、小站数目N和用户数目U,宏站分布在中心位置,感知小区随机分布在宏站周围,感知小区具有感知和发现周围环境的能力,能够根据过去的信息作出相应的决策,能够调整接入的信道,发射功率,小区处于动态开关状态中,能够根据服务的用户数目调整开关状态,能够服务多个用户,同时会由于小区内用户业务类型的变化调整自身的速率请求;假设小区n的可选RB集合为Sn,初始选择的RB集合为sn(0),在第0时隙,各个小区在其可选RB集合中随机选择RB集合;

步骤二,采集信道信息

小区用户采用最大参考信号接收功率准则接入小区,小区基站m到小区基站n服务的用户ek之间的信道增益近似为两小区基站m,n之间的信道增益,即 由此将网络中小区基站间即用户间的信道增益对称化,即 其中el是小区m中的用户;

步骤三,小区干扰信息初始化

根据步骤二采集的信道信息,通过下式计算小区n在RBi上受到的网络干扰其中, 表示小区m在RBi上的发射功率,σ2表示白噪声功率,可通过信道估计得到,N/{n}表示小区集合N中除了小区n以外的所有小区, 为干扰系数,其表示如下:其中,sn表示小区n最终使用的RB集合, 表示小区n使用的RB集合sn中的第i个RB,当小区n与小区m使用相同的RBi时, 为1,否则为0;

步骤四,小区总速率计算

假设RB带宽为B,则小区n在RBi上的速率由香农公式计算,表示如下:网络中所有的小区RB选择表示为(sn,s-n),其中s-n表示除了小区n外其他小区的RB选择,则小区n的总速率利用其表示为:步骤五,问题建模

基于在超密集感知网中,每个小区选择RB的原则:选择使自身受到的干扰最小的RB集合,达到最大化自身速率;将小区n受到的干扰表示为:整个网络的干扰表示为:

定义本方法的效用函数为:

根据非合作博弈模型定义,本方法的问题建模为 参与者为N个小区,Sn为小区n的策略集合,un(sn,s-n)为小区n的效用函数,非合作博弈问题建模具体表示如下:Subject to:

其中,限制条件C1表示小区m和小区n只能同时使用相同的RB或者不使用相同的RB,限制条件C2表示RB上的功率必须大于0,限制条件C3表示每个小区有速率请求,rre,n为小区n请求速率;

步骤六,在第t时隙,小区n根据式(7)计算当前选择策略的效用函数un(sn(t),s-n(t)),其中sn(t)为第t时隙小区n选择的RB集合;

步骤七,更新t时隙的置信矩阵 的大小为|sn(t)|×|sn(t)|,其中

其中,an(t)表示在t时隙小区n选择的RB集合sn(t)中的一个RB,而a'n(t)表示不在sn(t)中的一个RB,置信矩阵 反映的是选择其它RB所带来的效用函数的变化,即收益的改变,置信矩阵 中非零元素的个数完全由t时隙的RB选择策略sn(t)决定;

步骤八,更新 矩阵及 矩阵

其中, 为辅助矩阵, 为平均置信矩阵,εt=1/(t+1)表示每一次迭代步长,可自行根据情况设定;

步骤九,更新选择概率矩阵 同时决定t+1时隙的选择策略;

其中,μ为归一化系数,选择概率矩阵 描述的是在下一时刻t+1选择各个RB的概率大小,小区n选择 中概率最大的那个RB,根据式(3)计算当前的速率 若不满足小区速率请求rre,n,即 则继续选择 中概率次大的那个RB,直到 此时选出来的RB集合即为 时刻RB选择策略集合;

步骤十,循环步骤第六步至第九步,直到所有小区的RB选择集合不再变化,或达到预设的迭代次数门限。

2.根据权利要求1所述的基于非合作博弈的分布式超密集异构网络干扰协调方法,其特征在于:所述步骤三中,在每个RB上的发射功率相同,即

说明书 :

基于非合作博弈的分布式超密集异构网络干扰协调方法

技术领域

[0001] 本发明属于移动通信技术领域,涉及无线通信系统中无线资源管理方法,更为具体的说,是涉及基于非合作博弈的分布式超密集异构网络中干扰协调方法。

背景技术

[0002] 在宏站覆盖范围内同频密集部署低功率小站的超密集异构网络是3GPP(Third Generation Partnership Project)提出的一种提升5G网络频谱利用率和网络容量的有效方法。然而小站密度的增加会造成小区间干扰加剧,限制整个网络容量的提升,同时小区边缘用户的通话质量受到严重影响。而且未来实际网络场景中的每个小区基站及小区用户处于动态变化的网络环境中,包括小区基站位置不固定、小区可自行决定开关状态、每个小区可以服务多个用户,每个用户由于自身业务的变化会有不同的速率请求等等多种情况。在5G网络中,小区数目急剧增加,小区间的干扰问题直接影响着用户的服务质量和网络容量,需有效的干扰协调技术来解决。但现有的干扰协调方案不能有效解决用户之间由于业务类型不同而引起的速率请求的差异问题,且需要大量的信令交换。

发明内容

[0003] 为解决上述问题,本发明公开了一种基于非合作博弈的分布式超密集异构网络干扰协调方法,考虑了在超密集异构网络场景下不同小区用户由于业务类型不同而引起的用户速率速率需求变化,通过分析超密集网络的动态特性,将网络干扰问题建模成非合作博弈问题,网络中小区作为博弈参与者,最小化自身干扰为效用函数。为了推导纳什均衡解的存在,将建立博弈模型推导成潜在博弈问题。
[0004] 为了达到上述目的,本发明提供如下技术方案:
[0005] 基于非合作博弈的分布式超密集异构网络干扰协调方法,包括如下步骤:
[0006] 步骤一,采集网络信息,初始化参数
[0007] 采集网络中的宏站数目M、小站数目N和用户数目U,宏站分布在中心位置,感知小区随机分布在宏站周围,感知小区具有感知和发现周围环境的能力,能够根据过去的信息作出相应的决策,能够调整接入的信道,发射功率,小区处于动态开关状态中,能够根据服务的用户数目调整开关状态,能够服务多个用户,同时会由于小区内用户业务类型的变化调整自身的速率请求;假设小区n的可选RB集合为Sn,初始选择的RB集合为sn(0),在第0时隙,各个小区在其可选RB集合中随机选择RB集合;
[0008] 步骤二,采集信道信息
[0009] 小区用户采用最大参考信号接收功率准则接入小区,小区基站m到小区基站n服务的用户ek之间的信道增益近似为两小区基站m,n之间的信道增益,即 由此将网络中小区基站间即用户间的信道增益对称化,即 其中el是小区m中的用户。
[0010] 步骤三,小区干扰信息初始化
[0011] 根据步骤二采集的信道信息,通过下式计算小区n在RBi上受到的网络干扰[0012]
[0013] 其中, 表示小区m在RBi上的发射功率,σ2表示白噪声功率,可通过信道估计得到,N/{n}表示小区集合N中除了小区n以外的所有小区, 为干扰系数,其表示如下:
[0014]
[0015] 其中,sn表示小区n最终使用的RB集合,表示小区n使用的RB集合sn中的第i个RB,当小区n与小区m使用相同的RBi时, 为1,否则为0;
[0016] 步骤四,小区总速率计算
[0017] 假设RB带宽为B,则小区n在RBi上的速率由香农公式计算,表示如下:
[0018]
[0019] 网络中所有的小区RB选择表示为(sn,s-n),其中s-n表示除了小区n外其他小区的RB选择,则小区n的总速率利用其表示为:
[0020]
[0021] 步骤五,问题建模
[0022] 基于在超密集感知网中,每个小区选择RB的原则:选择使自身受到的干扰最小的RB集合,达到最大化自身速率;将小区n受到的干扰表示为:
[0023]
[0024] 整个网络的干扰表示为:
[0025]
[0026] 定义本方法的效用函数为:
[0027]
[0028] 根据非合作博弈模型定义,本方法的问题建模为 参与者为N个小区,Sn为小区n的策略集合,un(sn,s-n)为小区n的效用函数,非合作博弈问题建模具体表示如下:
[0029]
[0030] Subject to:
[0031] C1:
[0032] C2:
[0033] C3:
[0034] 其中,限制条件C1表示小区m和小区n只能同时使用相同的RB或者不使用相同的RB,限制条件C2表示RB上的功率必须大于0,限制条件C3表示每个小区有速率请求,rre,n为小区n请求速率;
[0035] 步骤六,在第t时隙,小区n根据式(7)计算当前选择策略的效用函数un(sn(t),s-n(t)),其中sn(t)为第t时隙小区n选择的RB集合;
[0036] 步骤七,更新t时隙的置信矩阵 的大小为|sn(t)|×|sn(t)|,其中
[0037]
[0038] 其中,an(t)表示在t时隙小区n选择的RB集合sn(t)中的一个RB,而a'n(t)表示不在sn(t)中的一个RB,置信矩阵 反映的是选择其它RB所带来的效用函数的变化,即收益的改变,置信矩阵 中非零元素的个数完全由t时隙的RB选择策略sn(t)决定;
[0039] 步骤八,更新 矩阵及 矩阵
[0040]
[0041]
[0042] 其中, 为辅助矩阵, 为平均置信矩阵,εt=1/(t+1)表示每一次迭代步长,可自行根据情况设定;
[0043] 步骤九,更新选择概率矩阵 同时决定t+1时隙的选择策略;
[0044]
[0045]
[0046] 其中,μ为归一化系数,选择概率矩阵 描述的是在下一时刻t+1选择各个RB的概率大小,小区n选择 中概率最大的那个RB,根据式(3)计算当前的速率 若不满足小区速率请求rre,n,即 则继续选择 中概率次大的那个RB,直到 此时选出来的RB集合即为 时刻RB选择策略集合;
[0047] 步骤十,循环步骤第六步至第八步,直到所有小区的RB选择集合不再变化,或达到预设的迭代次数门限。
[0048] 进一步的,所述步骤三中,在每个RB上的发射功率相同,即
[0049] 与现有技术相比,本发明具有如下优点和有益效果:
[0050] 本发明提供的基于非合作博弈的分布式超密集异构网络干扰协调方法能够在不需要小区间信息交换下,收敛到闭式解,最终所有小区在收敛到纳什均衡解时,使得整个网络干扰最小,提高了网络容量,以较低的复杂度有效地解决用户速率动态变化、网络密集化与网络容量,频谱效率之间的难题。

附图说明

[0051] 图1为本发明步骤流程图。

具体实施方式

[0052] 以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
[0053] 在分布式超密集感知网中,各个小区因用户需求而产生时变的速率请求,同时将各个小区干扰最小化问题建模成非合作博弈模型,各个小区的目标函数为自身干扰最小,小区可以根据周围干扰环境及自身过去的资源选择情况作出当前的决策,此决策同时满足自身速率请求。小区的每一次决策为RB(ResourceBlock)集合。关键地,此非合作博弈问题可推导成潜在博弈问题。潜在博弈有两个关键点,一方面其至少存在一个纳什均衡解;另一方面小区局部干扰最小化可以使得全局网络干扰最小化。为了求解该问题的纳什均衡解,将建立博弈模型推导成潜在博弈问题,本发明提出了本发明提出了一种基于随机学习的改进的非置信方法。该方法根据每个小区每一次迭代的效用函数建立概率矩阵,通过不断更新概率矩阵得到最终的纳什均衡解。最终所有小区在收敛到纳什均衡解时,整个网络干扰最小,达到干扰协调的目的。
[0054] 具体的说,如图1所示,本发明包括如下步骤:
[0055] 步骤一,采集网络信息,初始化参数。
[0056] 采集网络中的宏站数目M、小站数目N和用户数目U。初始化小区网关给整个网络中提供的RB,RB指的是基站频谱资源块数目,表示为S,所有RB可以被所有小区复用。小区n可用的RB集合表示为Sn,每个小区的可用RB集合相同,即S1=S2=...=SN。在第0时隙,各个小区在其可选RB集合中随机选择RB集合。假设小区n的可选RB集合为Sn,初始选择的RB集合为sn(0)。宏站分布在中心位置,感知小区随机分布在宏站周围。感知小区具有感知和发现周围环境的能力,可以根据过去的信息作出相应的决策,可以调整接入的信道,发射功率等等。小区处于动态开关状态中,会根据服务的用户数目调整开关状态。每个小区可以服务多个用户。同时会由于小区内用户业务类型的变化调整自身的速率请求。
[0057] 步骤二,采集信道信息。
[0058] 小区用户采用最大参考信号接收功率准则接入小区,小区基站m到小区基站n服务的用户ek之间的信道增益近似为两小区基站m,n之间的信道增益,即 由此将网络中小区基站间即用户间的信道增益对称化,即 其中el是小区m中的用户。
[0059] 步骤三,小区干扰信息初始化
[0060] 根据步骤二采集的信道信息,通过下式计算小区n在RBi上受到的网络干扰[0061]
[0062] 其中, 表示小区m在RBi上的发射功率,σ2表示白噪声功率,可通过信道估计得到,N/{n}表示小区集合N中除了小区n以外的所有小区, 为干扰系数,其表示如下:
[0063]
[0064] 其中,sn表示小区n最终使用的RB集合, 表示小区n使用的RB集合sn中的第i个RB,当小区n与小区m使用相同的RBi时, 为1,否则为0;
[0065] 步骤四,小区总速率计算
[0066] 假设RB带宽为B,则小区n在RBi上的速率由香农公式计算,表示如下:
[0067]
[0068] 网络中所有的小区RB选择表示为(sn,s-n),其中s-n表示除了小区n外其他小区的RB选择,则小区n的总速率利用其表示为:
[0069]
[0070] 步骤五,问题建模
[0071] 基于在超密集感知网中,每个小区选择RB的原则:选择使自身受到的干扰最小的RB集合,达到最大化自身速率;将小区n受到的干扰表示为:
[0072]
[0073] 整个网络的干扰表示为:
[0074]
[0075] 定义本方法的效用函数为:
[0076]
[0077] 根据非合作博弈模型定义,本方法的问题建模为 参与者为N个小区,Sn为小区n的策略集合,un(sn,s-n)为小区n的效用函数,非合作博弈问题建模具体表示如下:
[0078]
[0079] Subject to:
[0080] C1:
[0081] C2:
[0082] C3:
[0083] 其中,限制条件C1表示小区m和小区n只能同时使用相同的RB或者不使用相同的RB,限制条件C2表示RB上的功率必须大于0,限制条件C3表示每个小区有速率请求,rre,n为小区n请求速率;
[0084] 步骤六至步骤十是本发明为求解纳什均衡解而设计基于随机学习的非置信方法关键步骤。
[0085] 步骤六,在第t时隙,小区n根据式(7)计算当前选择策略的效用函数un(sn(t),s-n(t)),其中sn(t)为第t时隙小区n选择的RB集合;
[0086] 步骤七,更新t时隙的置信矩阵 的大小为|sn(t)|×|sn(t)|,其中
[0087]
[0088] 其中,an(t)表示在t时隙小区n选择的RB集合sn(t)中的一个RB,而a'n(t)表示不在sn(t)中的一个RB,置信矩阵 反映的是选择其它RB所带来的效用函数的变化,即收益的改变,置信矩阵 中非零元素的个数完全由t时隙的RB选择策略sn(t)决定;
[0089] 步骤八,更新 矩阵及 矩阵
[0090]
[0091]
[0092] 其中, 为辅助矩阵, 为平均置信矩阵,εt=1/(t+1)表示每一次迭代步长,可自行根据情况设定;
[0093] 步骤九,更新选择概率矩阵 同时决定t+1时隙的选择策略;
[0094]
[0095]
[0096] 其中,μ为归一化系数,选择概率矩阵 描述的是在下一时刻t+1选择各个RB的概率大小,小区n选择 中概率最大的那个RB,根据式(3)计算当前的速率 若不满足小区速率请求rre,n,即 则继续选择 中概率次大的那个RB,直到 此时选出来的RB集合即为 时刻RB选择策略集合;
[0097] 经过以上步骤,最终所有小区在收敛到纳什均衡解时,整个网络干扰最小,达到干扰协调的目的。
[0098] 本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。