一种基站以及基于局部流行度的内容缓存方法转让专利

申请号 : CN201910143150.0

文献号 : CN109639844B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 苑贵全

申请人 : 北京中投视讯文化传媒股份有限公司

摘要 :

本申请属于无线通信领域,涉及移动蜂窝网络的设备间的通信技术,具体涉及基于局部流行度的内容缓存方法,包括如下步骤:统计时间窗口内经过移动设备的兴趣包所请求的文件;基于上述统计,计算文件的局部流行度;根据文件的局部流行度计算最优文件数;依据最优文件数修改文件库。本申请给出了缓存阶段的缓存策略,即在移动设备的缓存空间有限的情况下减小文件库中文件的数量,尽可能提高缓存命中率,并且降低系统平均能量消耗。

权利要求 :

1.一种基于局部流行度的内容缓存方法,其特征在于,包括如下步骤:统计时间窗口内经过移动设备的兴趣包所请求的文件;

基于上述统计,计算文件的局部流行度;

根据文件的局部流行度计算最优文件数;

根据文件的局部流行度计算缓存文件库中最优文件数,包括以下子步骤:在文件库Mlib中,确定文件的缓存命中概率和文件被缓存在网络中的概率;

根据文件的缓存命中概率和文件被缓存在网络中的概率确定平均缓存命中概率;

确定平均缓存命中概率和系统平均能量消耗的反比关系;

通过最大化平均缓存命中概率获得最小化系统平均能量消耗;

将求解最大化平均缓存命中概率转化为求解文件库Mlib中最优文件数;

求解最优文件数,确定缓存文件库;

依据最优文件数修改文件库。

2.根据权利要求1所述的基于局部流行度的内容缓存方法,其特征在于,统计时间窗口内经过移动设备的兴趣包所请求的文件,具体包括以下步骤:对时间窗口内经过移动设备的兴趣包所请求的文件进行相似度分析;

根据相似度对兴趣包的文件进行分类;

对每类别的文件分别进行统计。

3.根据权利要求1或2所述的基于局部流行度的内容缓存方法,其特征在于,文件的局部流行度计算公式如下:lib lib

其中,Li为文件库M 中第i个文件的局部流行度;M为文件库M 中的文件数;j为文件库Mlib中第j个文件,j从1取至M;i为文件库Mlib中第i个文件;γ为齐夫分布参数。

4.根据权利要求3所述的基于局部流行度的内容缓存方法,其特征在于,最优文件数计算公式:其中,M′opt为求解得到的最优文件数; 为求 最大的函数; 为平均缓存命中概率;C为每个移动设备最多能缓存的文件数量;M′为缓存文件库的最优文件数;M为文件库的文件数;i为文件库或缓存文件库中第i个文件; 为文件i的流行度;Li为第i个文件的局部流行度;e为常数;π为常数;RD2D为移动设备的D2D最大传输半径;λ为泊松分布的期望,λ为泊松分布的方差。

5.根据权利要求1或2所述的基于局部流行度的内容缓存方法,其特征在于,在一个新的统计周期内,根据文件的局部流行度重新确定缓存文件库。

说明书 :

一种基站以及基于局部流行度的内容缓存方法

技术领域

[0001] 本发明属于无线通信领域,涉及移动蜂窝网络的设备间(Device-To-Device,D2D)通信技术,具体涉及一种基站以及基于局部流行度的内容缓存方法。

背景技术

[0002] 随着移动通信网络中的数据流量和内容多样性爆发式的增加。内容缓存是一个流行的内容分发技术,被广泛应用在因特网中以减少蜂窝流量负载。为了应对未来移动网络中海量数据需求,现有技术将内容缓存技术引入到蜂窝网络中。在下一代蜂窝网络中,设备间通信(Device-to-Device,D2D)作为一种有效的卸载蜂窝网络流量和改善系统性能的技术受到广泛关注。在D2D蜂窝网络中,利用移动设备(MT)间直接通信能力可以扩展蜂窝通信应用的前景,例如,如果在邻居移动设备上拥有相同的内容,MT之间可以通过D2D通信进行内容转发实现内容共享。
[0003] 具有缓存能力的MT间内容共享主要可以分为两个阶段,缓存阶段和传输阶段。传输阶段可以利用D2D通信实现,缓存阶段是利用MT的缓存资源发挥D2D传输的优势。其中,缓存阶段的缓存命中概率是评价缓存性能的重要指标,当缓存命中概率较大时,D2D蜂窝网络能够充分利用缓存资源并发挥D2D传输的优势;当缓存命中概率较小时,MT从宏基站获取请求文件的次数较大,此时缓存资源没有充分利用。
[0004] 在现有的缓存策略中,等概率随机缓存策略(Equal  Probability Random Caching,EPRC)和最流行文件缓存策略(Most Popular file Caching,MPC)是最为普遍的应用方案。在EPRC方案中,所有文件都以相同的概率被MT随机缓存,缓存命中概率较低。而在MPC策略中,所有移动设备都缓存相同的排行最靠前的文件。当文件请求集中在排行靠前的文件时,能够实现较高的缓存命中概率。但是,所有MT都缓存相同文件造成大量冗余,不能充分利用D2D的传输优势。
[0005] 因此,如何能够充分利用D2D的传输优势,并且能够提高缓存命中率,是本领域技术人员目前急需解决的技术问题。

发明内容

[0006] 本申请提供了一种基于局部流行度的内容缓存方法及基站,以充分利用D2D的传输优势,并且还提高了缓存命中率。
[0007] 为解决上述技术问题,本申请提供如下技术方案:
[0008] 一种基于局部流行度的内容缓存方法,包括如下步骤:统计时间窗口内经过移动设备的兴趣包所请求的文件;基于上述统计,计算文件的局部流行度;根据文件的局部流行度计算最优文件数;依据最优文件数修改文件库。
[0009] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,统计时间窗口内经过移动设备的兴趣包所请求的文件,具体包括以下步骤:对时间窗口内经过移动设备的兴趣包进行相似度分析;根据相似度对兴趣包的文件进行分类;对每类别的文件分别进行统计。
[0010] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,文件的相似度计算公式: 其中,D(a,b)为内容文件a和内容文件b之间的相似度;DKL为内容文件a与内容文件b的相对熵距离。
[0011] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,文件的局部流行度计算公式如下: 其中,Li为文件库Mlib中第i个文件的局部流行度;M为文件库Mlib中的文件数;j为文件库Mlib中第j个文件,j从1取至M;i为文件库Mlib中第i个文件;γ为齐夫分布参数。
[0012] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,最优文件数计算公式:
[0013] 其中,Mo′pt为求解得到的最优文件数; 为求 最大的函数; 为平均缓存命中概率;C为每个移动设备最多能缓存的文件数量;M′为缓存文件库的最优文件数;M为文件库的文件数;i为文件库或缓存文件库中第i个文件; 为文件i的流行度;Li为第i个文件的局部流行度;e为常数;π为常数;RD2D为移动设备的D2D最大传输半径;λ为泊松分布的期望和方差。
[0014] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,根据文件的局部流lib行度计算缓存文件库中最优文件数,包括以下子步骤:在文件库M 中,确定文件的缓存命中概率和文件被缓存在网络中的概率;根据文件的缓存命中概率和文件被缓存在网络中的概率确定平均缓存命中概率;确定平均缓存命中概率和系统平均能量消耗的反比关系;通过最大化平均缓存命中概率获得最小化系统平均能量消耗;将求解最大化平均缓存命中概lib
率转化为求解文件库M 中最优文件数;求解最优文件数,确定缓存文件库。
[0015] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,缓存命中概率计算公式: 其中,PiHit为访问第i个文件的缓存命中概率; 为文件i的流行度,由Zipf分布决定,Zipf分布满足Zipf定律; 表示文件i被缓存在网络中的概率。
[0016] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,文件被缓存在网络中概率计算公式: 其中, 表示文件i被缓存在网络中的概率; 表示每个移动设备(MT)缓存文件i的概率;P{K=k}为覆盖范围内有k个移动设备(MT)的概率。
[0017] 如上所述的基于局部流行度的内容缓存方法,其中,优选的是,在一个新的统计周期内,根据文件的局部流行度重新确定缓存文件库。
[0018] 一种基站,所述基站执行上述任一项所述的基于局部流行度的内容缓存方法。
[0019] 相对上述背景技术,本申请所提供的基于局部流行度的内容缓存方法及基站,主要给出缓存阶段的缓存策略,即在移动设备(MT)的缓存空间有限的情况下减少文件库中的文件,尽可能提高缓存命中率,并且降低系统平均能量消耗。

附图说明

[0020] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0021] 图1是本申请实施例一提供的基于局部流行度的内容缓存方法的流程图;
[0022] 图2是本申请实施例一提供的集中式网络系统的示意图。

具体实施方式

[0023] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0024] 实施例一
[0025] 本实施例提供了一种基于局部流行度的内容缓存方法,如图1所示,包括以下步骤:
[0026] 步骤S110、统计时间窗口内经过移动设备的兴趣包所请求的文件;
[0027] 具体的,对时间窗口内经过移动设备的兴趣包进行相似度分析,根据相似度对兴趣包的文件进行分类,对每类别的文件分别进行统计。
[0028] 根据每个兴趣包请求的内容,通过对称相对熵距离来计算两个文件之间的相似度。例如:计算内容文件a和内容文件b之间的相似度D(a,b):
[0029]
[0030] 其中,DKL为内容文件a与内容文件b的相对熵距离。
[0031] 相对熵距离是衡量相同事件空间里的两个概率分布的差异情况,具体为:
[0032] 其中,内容a、内容b均具有S个主题,x从1取至S。
[0033] 根据相似度对兴趣包的文件进行分类。例如,对内容a的S个主题和内容b的S个主题计算之间的相似度后,把各个分类对象(例如:a1和b1、a2和b2……ax和bx)均先单独视为一类,然后根据相似度最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行,经过多次就可以把全部分类对象归为一类。以此类推,将兴趣包文件划分为多个类别,并对每个类别的兴趣包文件进行统计。
[0034] 上述通过相似度分析从而对文件进行类别划分,进而减少后续对文件分析的数量,提高分析效率。
[0035] 步骤S120、基于上述统计,计算文件的局部流行度;
[0036] 对上述统计的各个类别的兴趣包文件计算局部流行度,通过以下公式计算:
[0037]
[0038] 其中,i为文件库Mlib中第i个文件,i属于[1,M],其中M是文件库Mlib中的文件总个数;Li为第i个文件的局部流行度;j为文件库Mlib中第j个文件,j从1取至M;γ为齐夫分布参数,即代表描述数据分布的指数特征。
[0039] 步骤S130、根据文件的局部流行度计算最优文件数;
[0040] 在集中式网络系统中,如图2所示,具有基站(BS)和D2D设备,以一个基站(BS)和N个移动设备(MT)为例。这些移动设备(MT)均匀的分布在以基站(BS)为中心,半径为RB的覆盖范围内。设定每个移动设备(MT)在其D2D最大传输半径(表示为RD2D)范围内分布K个移动设备(MT),并且移动设备(MT)的分布可以看做密度为λ的泊松点过程(Poisson Point Process,PPP)。
[0041] 那么,请求内容的移动设备(MT)在以其自身为中心,半径为RD2D的覆盖范围内有k个移动设备(MT)的概率满足如下公式:
[0042] 其中,P{K=k}为覆盖范围内有k个移动设备(MT)的概率;π为常数;λ为泊松分布的期望和方差;e为常数,取值2.7182818459。
[0043] 通常会确定一个统计周期T,在统计周期T内,基站(BS)给出全部传输M个文件的文件库Mlib,进行文件的局部流行度排序;并且统计获得K个移动设备(MT)的泊松点过程分布参数λ;获得移动设备(MT)通信覆盖半径RD2D。在下一个周期T内重新按照上述进行初始化,以应对文件流行度变化或用户移动的情况,周期T的取值可以由系统在实际应用时设置。
[0044] (1)首先,在文件库Mlib中,确定文件的缓存命中概率和文件被缓存在网络中的概率;
[0045] 移动设备(MT)请求文件库Mlib中每个文件具有不同的缓存命中概率,缓存命中概率是评价缓存性能的重要指标,当缓存命中概率较大时,D2D蜂窝网络能够充分利用缓存资源并发挥D2D的传输优势;当缓存命中概率较小时,移动设备(MT)从基站(BS)获取请求文件的次数较大,此时缓存资源没有充分利用。具体的,以访问第i个文件为例,缓存命中概率可以表示为: 其中,PiHit为访问第i个文件的缓存命中概率; 为文件i的流行度,由Zipf分布决定,Zipf分布满足Zipf定律; 表示文件i被缓存在网络中的概率。
[0046] 由于每个文件都是独立的内容进行缓存, 可以进一步表示为:其中, 表示每个移动设备(MT)缓存文件i的概
率。
[0047] (2)其次,根据文件的缓存命中概率和文件被缓存在网络中的概率确定平均缓存命中概率;
[0048] 具体的,由于移动设备(MT)的位置是不断变化的,移动设备(MT)之间拓扑结构也跟着不断变化。因此,需要从平均意义上去决定文件的缓存概率,即平均的缓存命中概率。移动设备(MT)可以在自身或附近其他移动设备(MT)缓存中获取请求文件的概率,即平均缓存命中概率可以表示为: 进一步
简化可得:
[0049] (3)确定平均缓存命中概率和系统平均能量消耗的反比关系;
[0050] 集中式网络系统中系统平均能量消耗η=Edevice+PHit·ED2D+PBS·EBS……(7);PHit表示缓存命中概率,PBS表示连接基站(BS)缓存概率,并且PHit+PBS=1;Edevice表示移动设备(MT)运行所需能耗,在通信过程中,一般认为Edevice是一个已知的定值;ED2D表示移动设备(MT)通过D2D方式获取文件消耗的能量;EBS表示移动设备(MT)通过基站(BS)获取文件消耗的能量,一般情况下,ED2D<EBS。
[0051] 由上可知,D2D中缓存命中概率越大系统平均能量消耗越低,也就是D2D平均缓存命中概率越大系统平均能量消耗越低,因此平均缓存命中概率和系统平均能量消耗成反比关系,所以可以通过提高D2D中平均缓存命中概率来提高整体的能量利用效率。
[0052] (4)通过最大化平均缓存命中概率获得最小化系统平均能量消耗;
[0053] 为了降低系统平均能量消耗,需要提高平均缓存命中率 进一步,由公式(6)可知,需要通过控制每个文件的缓存概率 使平均缓存命中率 最大化。由于每个移动设备(MT)的缓存空间是有限的,最多可以缓存C个文件,在一般情况下C<<M,因此限制:
[0054] 由上以及公式(1)和公式(6)构建平均缓存命中率 最大化求解方程,如下:
[0055]
[0056] (5)将求解最大化平均缓存命中概率转化为求解文件库Mlib中最优文件数;
[0057] 由上述公式(8)可知,针对优化目标直接求解复杂度较高,因此将约束条件放松为: 该放松过程不影响最优化问题的求解,由优化目标表达式我们可以看出,若获得最大缓存命中概率,要充分利用移动设备(MT)的缓存空间,即全部移动设备(MT)的缓存空间都要存满文件。
[0058] 进一步,在实际系统中,用户需求的文件数目巨大,求解最优化问题的计算量也很大,因此以公式(9)的约束条件为出发点,将优化问题进一步简化。
[0059] 从用户请求分布来看,大部分的用户请求会集中在文件的局部流行度排名靠前的一些文件。文件库Mlib中排名靠后的文件的局部流行度较低,也就是文件库Mlib中排名靠后的文件被访问的概率较低,因此文件库Mlib中排名靠后的文件并不能提高缓存命中概率。并且同时文件库Mlib中排名靠后的文件还占用了缓存空间,浪费了缓存资源。因此,本申请中在文件库Mlib的基础上,截去其中排名靠后的文件,也就是截去一部分请求概率较低的文件,形成一个缓存文件库 缓存文件库 中具有排名靠前的M′个文件。
[0060] 确保缓存文件库 中的文件至少有一个以上的移动设备(MT)进行缓存,即:其中,文件的局部流行度Li可以根据公式(2)进行计算和更新。
[0061] 通过公式(1)、(6)和(10)可以得到由公式(11)可知,通过求解最优化的文件
数M′可以求解平均缓存命中概率 的最大值,也就是将确定系统平均能量消耗最小化转化为求解最优化的文件数M′。
[0062] (6)、求解最优文件数,确定缓存文件库。
[0063] 对公式(11)求解最优化的文件数M′,即通过求解最优化
的文件数M′;其中,Mo′pt为求解得到的最优文件数, 为求 最大的函数。
[0064] 步骤S140、依据最优文件数修改文件库。
[0065] 根据计算出的最优文件数,截去文件库Mlib中排名在最优文件数M′以后的文件以修改文件库,形成缓存文件库
[0066] 实施例二
[0067] 本申请实施例还提供了一种基站,该基站执行实施例一提供的基于局部流行度的内容缓存方法。
[0068] 本申请实施例提供的基于局部流行度的内容缓存方法及基站,主要给出缓存阶段的缓存策略,即在移动设备(MT)的缓存空间有限的情况下,减少文件库中的文件,尽可能提高缓存命中率,并且降低系统平均能量消耗。
[0069] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0070] 此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。