一种预测移动通信用户数的方法和装置转让专利

申请号 : CN201510938056.6

文献号 : CN106888476B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 从光磊叶青安瑞虹王雨王雪

申请人 : 中国联合网络通信集团有限公司

摘要 :

本发明实施例提供一种预测移动通信用户数的方法和装置,涉及通信领域,用以获取跟踪区级各时段的用户数分布情况,获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA一个时间段内的PS寻呼量及平均连接态用户数;对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;获取第一跟踪区TA下的PS寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数。本发明实施例可以用于计算各友商的用户数。

权利要求 :

1.一种预测移动通信用户数的方法,其特征在于,包括:获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA在一个时间段内的分组域寻呼量及平均连接态用户数;

对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;

获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数;

对于第二跟踪区TA,所述第二跟踪区TA为待统计跟踪区TA中的任意一个,在获取建模样本数据集合之前,所述方法还包括:统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内的接收寻呼消息次数及接收电路域寻呼消息次数;

根据所述接收寻呼消息次数及所述接收电路域寻呼消息次数,获取分组域寻呼量;

统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内每个小区的连接态用户数;

根据所述第二跟踪区TA下每个小区的连接态用户数,获得所述第二跟踪区TA下的平均连接态用户数;

统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内所述第二跟踪区TA下演进分组系统连接性管理空闲模式ECM-IDLE平均附着用户数及演进分组系统连接性管理连接模式ECM-CONNECTED平均附着用户数;

根据所述ECM-IDLE平均附着用户数及ECM-CONNECTED平均附着用户数,获取所述第二跟踪区TA下的平均附着用户数。

2.根据权利要求1所述的方法,其特征在于,所述对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型,包括:对建模样本数据集合C={(x1,y1),(x2,y2).......(xN,yN)}进行一元线性回归分析,获取一元线性回归模型:Y1=β0+β1X1,其中,β0和β1为常数;x1为第一个样本数据中的分组域寻呼量,y1为第一个样本数据中的平均连接态用户数,xN为第N个样本数据中的分组域寻呼量,yN为第N个样本数据中的平均连接态用户数,N为数据样本的数量;

根据公式 计算使得Q(β0,β1)值最小时对应的 和 从而确定所述一元线性回归模型的 和 其中,

yi为第i个样本数据中的平均连接态用户数;E(yi)=β0+β1Xi;

根据确定的 和 获取寻呼量推算连接态用户数模型 xi为第i个样本数据中的分组域寻呼量,yi为第i个样本数据中的平均连接态用户数,1≤i≤N。

3.根据权利要求2所述的方法,其特征在于,所述一个数据样本还包括在一个跟踪区TA下、该跟踪区TA一个时间段内的平均附着用户数;

相应的,所述方法还包括:

对所述N组数据样本中所有分组域寻呼量及平均附着用户数进行线性回归分析,建立寻呼量推算附着用户数模型;

获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算附着用户数模型,计算所述第一跟踪区的附着用户数。

4.根据权利要求3所述的方法,其特征在于,所述对所述N组数据样本中所有分组域寻呼量及平均附着用户数进行线性回归分析,建立寻呼量推算附着用户数模型,包括:从所述建模样本数据集合中,获取时间段满足预设要求的n组目标数据样本,每组目标数据样本记为(xl,yl),其中,(xl,yl)∈C,1≤l≤N,n为目标样本数据的数量且n≤N;

对所述n组目标数据样本进行一元线性回归分析,获取一元线性回归模型:Y2=λ0+λ1X2,其中,λ0和λ1为常数;Y2为平均附着用户数,X2为分组域寻呼量;

根据公式 计算使得Q(λ0,λ1)值最小的 和 从而确定所述一元线性回归模型的 和 其中,

根据确定的 和 获取寻呼量推算附着用户数模型

5.根据权利要求4所述的方法,其特征在于,在所述获取寻呼量推算连接态用户数模型之前所述方法还包括:根据公式 计算所述寻呼量推算连接态用户数模型 的拟合度;其中, 为N个数据样本中所有连接态用户数的平均值, 为根据第i个数据样本中的分组域寻呼量拟合出的连接态用户数,yi为第i个样本数据中的平均连接态用户数;

若确定所述R12大于等于预设值,则确定所述寻呼量推算连接态用户数模型对样本数据的拟合度满足要求;

若确定 则确定所述X1对Y1有显著贡献;其中, 为N组数据样本中所有分组域寻呼量的平均值; 回归方程的标准误差,α为显著性水平,为临界值;

在所述获取寻呼量推算附着用户数模型 之前,所述方法还包括:根据公式 计算所述寻呼量推算附着用户数模型 的拟合度;其中, 为n组数据样本中所有附着用户数的平均值, 根据第l个数据样本中的分组域寻呼量拟合出的平均附着用户,yl为从n个数据样本中选取的第l个数据样本中平均附着用户数;

若确定所述R22大于等于预设值,则确定所述寻呼量推算附着用户数模型对样本数据的拟合度满足要求;

若确定 则确定所述X2对Y2有显著贡献;其中, 为n组数据样本中所有分组域寻呼量的平均值; 回归方程的标准误差,α为显著性水平,为临界值; 为λ1的估计值,即使得Q(λ0,λ1)满足拟合准则的值。

6.根据权利要求3所述的方法,其特征在于,所述寻呼量推算附着用户数模型为其中,X2为分组域寻呼量,Y2为附着用户数;

所述寻呼量推算连接态用户数模型为 其中,X1为分组域寻呼量,Y1为连接态用户数。

7.一种预测移动通信用户数的装置,其特征在于,包括:获取单元用于,获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA在一个时间段内的分组域寻呼量及平均连接态用户数;

第一建模单元用于,对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;

计算单元用于,获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数;

所述装置还包括统计单元,所述统计单元具体用于:

统计在第二跟踪区TA下,所述第二跟踪区TA一个时间段内的接收寻呼消息次数及接收电路域寻呼消息次数;

根据所述接收寻呼消息次数及所述接收电路域寻呼消息次数,获取分组域寻呼量;

统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内每个小区的连接态用户数;

根据所述第二跟踪区TA下每个小区的连接态用户数,获得所述第二跟踪区TA下的平均连接态用户数;

统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内所述第二跟踪区TA下演进分组系统连接性管理空闲模式ECM-IDLE平均附着用户数及演进分组系统连接性管理连接模式ECM-CONNECTED平均附着用户数;

根据所述ECM-IDLE平均附着用户数及ECM-CONNECTED平均附着用户数,获取所述第二跟踪区TA下的平均附着用户数。

8.根据权利要求7所述的装置,其特征在于,所述第一建模单元具体用于:对建模样本数据集合C={(x1,y1),(x2,y2).......(xN,yN)}进行一元线性回归分析,获取一元线性回归模型:Y1=β0+β1X1,其中,β0和β1为常数;x1为第一个样本数据中的分组域寻呼量,y1为第一个样本数据中的平均连接态用户数,xN为第N个样本数据中的分组域寻呼量,yN为第N个样本数据中的平均连接态用户数,N为数据样本的数量;

根据公式 计算使得Q(β0,β1)值最小时对应的 和 从而确定所述一元线性回归模型的 和 E(yi)=β0+β1Xi;

根据确定的 和 获取寻呼量推算连接态用户数模型 其中,xi为第i个样本数据中的分组域寻呼量,

yi为第i个样本数据中的平均连接态用户数,1≤i≤N。

9.根据权利要求8所述的装置,其特征在于,所述获取单元中一个数据样本还包括在一个跟踪区TA下、该跟踪区TA一个时间段内的平均附着用户数;

相应的,所述装置还包括:

第二建模单元用于,对所述N组数据样本中所有分组域寻呼量及平均附着用户数进行线性回归分析,建立寻呼量推算附着用户数模型;

所述计算单元还用于,获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算附着用户数模型,计算所述第一跟踪区的附着用户数。

10.根据权利要求9所述的装置,其特征在于,所述第二建模单元具体用于:从所述建模样本数据集合中,获取时间段满足预设要求的n组目标数据样本,每组目标数据样本记为(xl,yl),其中,(xl,yl)∈C,1≤l≤N,n为目标样本数据的数量且n≤N;

对所述n组目标数据样本进行一元线性回归分析,获取一元线性回归模型:Y2=λ0+λ1X2,其中,λ0和λ1为常数;Y2为平均附着用户数,X2为分组域寻呼量;

根据公式 计算使得Q(λ0,λ1)值最小的 和 从而确定所述一元线性回归模型的 和

根据确定的 和 获取寻呼量推算附着用户数模型 其中,

11.根据权利要求10所述的装置,其特征在于,所述装置还包括第一判断单元和第二判断单元:所述第一判断单元用于,根据公式 计算所述寻呼量推算连接态用户数模型 的拟合度;其中, 为N个数据样本中所有连接态用户数的平均值,为根据第i个数据样本中的分组域寻呼量拟合出的连接态用户数,yi为第i个样本数据中的平均连接态用户数;

若确定所述R12大于等于预设值,则确定所述寻呼量推算连接态用户数模型对样本数据的拟合度满足要求;

若确定 则确定所述X1对Y1有显著贡献;其中, 为N组数据样本中所有分组域寻呼量的平均值; 回归方程的标准误差,α为显著性水平,为临界值;

所述第二判断单元用于:

根据公式 计算所述寻呼量推算附着用户数模型 的拟合度;其中, 为n组数据样本中所有附着用户数的平均值, 根据第l个数据样本中的分组域寻呼量拟合出的平均附着用户,yl为从n个数据样本中选取的第l个数据样本中平均附着用户数;

若确定所述R22大于等于预设值,则确定所述寻呼量推算附着用户数模型对样本数据的拟合度满足要求;

若确定 则确定所述X2对Y2有显著贡献;其中, 为n组数据样本中所有分组域寻呼量的平均值; 回归方程的标准误差,α为显著性水平,为临界值; 为λ1的估计值,即使得Q(λ0,λ1)满足拟合准则的值。

说明书 :

一种预测移动通信用户数的方法和装置

技术领域

[0001] 本发明涉及通信技术领域,尤其涉及一种预测移动通信用户数的方法和装置。

背景技术

[0002] 移动通信运营市场是一组竞争的市场,今后随着移动牌照的增发,竞争将更加激烈。对某组移动运营商来说,合理的预测移动通信业务显得尤为重要。移动通信业务预测的对象主要是移动通信用户数。
[0003] 现有技术,公开了一种基于移动通信网络寻呼消息预测区域内用户数的方法,公告号为CN102118775B,该方法包括选择能够采集移动通信网络第三层信令并且带有导出第三层信令功能的测试软件;确定测试区域;在测试区域中选择不位于LAC区的边界处的测试点;将装有测试软件的测试设备放置在测试点T小时采集数据;从测试软件中导出相关寻呼信息及信道配置参数;计算寻呼组数量;利用数据处理工具统计出寻呼消息总量;根据公式计算总寻呼量;从交换机上获取包含时间、寻呼量、开机用户数的话务统计数据;根据话务统计数据计算出每用户每天寻呼次数;LAC区内用户数测算结果为用户数=总寻呼量/每用户每天寻呼次数。
[0004] 但是,获取总寻呼量与用户数之间关系所采用的方法是通过话务统计数据中的全天寻呼次数除以用户数来得到一组系数即“每用户每天寻呼次数”,该方法过于简单且不够科学,同时该方案中的系数“每用户每天寻呼次数”无法用于精细到小时级的用户数推算。

发明内容

[0005] 本发明的实施例提供一种预测移动通信用户数的方法和装置,用以获取跟踪区级各时段的用户数分布情况。
[0006] 为达到上述目的,本发明的实施例采用如下技术方案:
[0007] 第一方面,本发明实施例提供一种预测移动通信用户数的方法,包括:获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA在一个时间段内的分组域寻呼量及平均连接态用户数;
[0008] 对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;
[0009] 获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数。
[0010] 第二方面,本发明实施例提供一种一种预测移动通信用户数的装置,包括:
[0011] 获取单元用于,获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA在一个时间段内的分组域寻呼量及平均连接态用户数;
[0012] 第一建模单元用于,对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;
[0013] 计算单元用于,获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数。
[0014] 本发明实施例提供一种预测移动通信用户数的方法,通过对获取的建模样本数据集合进行线性回归分析,建立寻呼量推算连接态用户数的模型,在获取到第一跟踪区TA下的分组域寻呼量时,可以通过所述寻呼量推算连接态用户数模型直接获得所述第一跟踪区TA下的连接态用户数,便于移动运营商获取友商用户数的分布情况。克服了现有技术中通过已有用户数信息预测后续用户数发展情况,仅适用于运营商自身的用户数发展预测,无法用于推算友商的用户数情况的问题,且本发明实施例中的寻呼量推算连接态用户数模型所依据的数据样本集合,为基于小时级的数据采样结合,可以有效将所述第一跟踪区TA的连接态用户数精细到小时级的用户数推算。

附图说明

[0015] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016] 图1为本发明实施例提供的一种预测移动通信用户数的方法的流程示意图一;
[0017] 图2为本发明实施例提供的一种预测移动通信用户数的方法中的PS寻呼量与连接态用户数的一元线性回归模型示意图;
[0018] 图3为本发明实施例提供的一种预测移动通信用户数的方法中的PS寻呼量与附着用户数的一元线性回归模型示意图;
[0019] 图4为本发明实施例提供的一种预测移动通信用户数的方法的流程示意图二;
[0020] 图5为本发明实施例提供的一种预测移动通信用户数的装置的结构示意图一;
[0021] 图6为本发明实施例提供的一种预测移动通信用户数的装置的结构示意图二。

具体实施方式

[0022] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023] 为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”、“第三”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”、“第三”等字样并不对数量和执行次序进行限定。
[0024] 本发明实施例提供了一种预测移动通信用户数的方法,如图1所示,所述方法包括:
[0025] S101、获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA一个时间段内的PS寻呼量及平均连接态用户数;
[0026] S102、对所述N组数据样本中所有跟踪区TA下的分组域PS寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;
[0027] S103、获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数。
[0028] 本发明实施例提供一种预测移动通信用户数的方法,通过对获取的建模样本数据集合进行线性回归分析,建立寻呼量推算连接态用户数的模型,在获取到第一跟踪区TA下的分组域寻呼量时,可以通过所述寻呼量推算连接态用户数模型直接获得所述第一跟踪区TA下的连接态用户数,便于移动运营商获取友商用户数的分布情况。克服了现有技术中通过已有用户数信息预测后续用户数发展情况,仅适用于运营商自身的用户数发展预测,无法用于推算友商的用户数情况的问题,且本发明实施例中的寻呼量推算连接态用户数模型所依据的数据样本集合,为基于小时级的数据采样结合,可以有效将所述第一跟踪区TA的连接态用户数精细到小时级的用户数推算。
[0029] 其中,本发明实施例的一种预测移动通信用户数的方法可以通过一种预测移动通信用户数的装置来执行,也可以通过处理器来执行,该一种预测移动通信用户数的装置或处理器可以单独配置。
[0030] 本发明实施例中的建模样本数据集合包括一个城市内的多个跟踪区(TA,Tracking Area),本发明实施例中的跟踪区TA是指寻呼消息下发的范围,每个跟踪区TA下包含多个小区,该小区的数量本发明实施例对此不进行限定,具体视网络实际运营情况而定。
[0031] 需要说明的是,在提取每一个跟踪区TA的寻呼消息次数和CS寻呼消息次数及小区内的平均连接态用户数时,必须提取该跟踪区TA下所有小区的寻呼消息次数和CS寻呼消息次数及小区内的平均连接态用户数,由于寻呼下发的范围为TA,因此同一TA下的所有小区在同一采样周期内收到的PS寻呼量相同,例如,对于跟踪区TA1,其下包含5个小区,在预设周期内每个小区的平均连接态用户数分别为S1、S2、S3、S4、S5,则在预设周期内该TA下的总的平均连接态用户数为S=(S1+S2+S3+S4+S5)。本发明实施例的预设周期至少为一个小时。
[0032] 其中,连接态用户数是指在一个TA下所有小区内所有处于RRC-Connected(已连接)状态的UE。
[0033] 该每个小区的平均连接态用户数可以通过在预设周期内,按照预设采样周期统计每个小区的连接态用户数,在预设周期末,将每个预设采样周期采集的连接态用户数求和,然后再取平均值即可得到每个小区的平均连接态用户数,例如,对于第一小区,其在预设周期(1小时)内按照采样周期(1S)进行采样,若每个预设采样周期的采样点数分别为(S11,S12,S13,…,S13600),则该第一小区的平均采样点数为(S11+S12+S13,…,S13600)/3600。
[0034] 本发明实施例中的一种预测移动通信用户数的主要通过从无线侧(例如,无线接入网,即基站)处以小时为单位的采样实际内获得数据信息,所述数据信息包括一个TA下每个小区的接收寻呼消息次数及每个小区在采样时间内的CS寻呼消息次数以及每个小区的平均连接态用户数。
[0035] 需要说明的是,每个TA的对应时间段可以相同,也可以不同,但是每个TA对应的时间段的时长应该等于预设周期时长,例如,第一跟踪区TA可以是2015年11月10号在9点到10点(时间段时长)进行的采样,第二跟踪区TA可以是2015年11月12号12点到13点(时间段时长)进行的采样。
[0036] 在所述从无线侧提取的数据信息之后,本发明实施例还包括将所述从无线侧提取的数据信息提取到的小区级的数据同基础工参信息关联出小区所属的跟踪区码(TAC,Tracking Area Code),将无线侧小区级数据汇总到TA级。接着,需要将无线侧数据同核心网数据通过日期、时段以及TAC信息进行关联处理,获得时间粒度为小时级,地理粒度为TA级的建模样本数据集合,将所述建模样本数据集合存储于存储单元中,该存储单元可以与所述预测移动通信用户数的装置或处理器进行数据交互,例如,所述预测移动通信用户数的装置或处理器可以从所述存储单元读取需要的样本数据,也可以将小区级的样本数据关联成TA级的样本数据,本发明实施例对所述建模样本数据集合的具体存储形式不进行限定,可以以表格形式存储,也可以以表格以外的其他形式进行存储,示例性的,本发明实施例给出了一种以表格形式存储的建模数据样本集合,如表1所示。
[0037]
[0038]
[0039] 其中,由于对于每个网络运营商而言,根据其每个TA的PS寻呼量推算其TA下的平均连接态用户数的方法和原理均相同,本发明实施例仅以第一跟踪区TA为例进行说明,并不具有任何指示性含义。其中,该第一跟踪区TA可以是中国移动网络覆盖的每个TA,可以是中国联通覆盖的每个TA,也可以是中国电信覆盖的每个TA,本发明实施例对此不进行限定,只要可以获知任何一个网络运营商覆盖的每个TA的PS寻呼量,即可根据建立的寻呼量推算连接态用户数模型获得该跟踪区的连接态用户数。
[0040] 其中,ECM(Evolved Packet System Connectivity Management,演进分组系统连接性管理)-CONNECTED(连接);ECM(Evolved Packet System Connectivity Management,演进分组系统连接性管理)-IDLE空闲模式。
[0041] 进一步的,对于第二跟踪区TA,所述第二跟踪区TA为待统计跟踪区TA中的任意一个,在获取建模样本数据集合之前,所述方法还包括S1-S6:
[0042] S1、统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内的接收寻呼消息次数及接收电路域CS寻呼消息次数;
[0043] S2、根据所述接收寻呼消息次数及所述接收CS寻呼消息次数,获取分组域PS寻呼量;
[0044] S3、统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内每个小区的连接态用户数;
[0045] S4、根据所述第二跟踪区TA下每个小区的连接态用户数,获得所述第二跟踪区TA下的平均连接态用户数;
[0046] S5、统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内所述第二跟踪区TA下的ECM-IDLE平均附着用户数及ECM-CONNECTED平均附着用户数;
[0047] S6、根据所述ECM-IDLE平均附着用户数及ECM-CONNECTED平均附着用户数,获取所述第二跟踪区TA下的平均附着用户数。
[0048] 进一步的,本发明实施例对所述步骤S102的具体实现方式不进行限定,可以有多种途径建立寻呼量推算连接态用户数模型,示例性的,本发明实施例采用一元线性回归分析建立寻呼量推算连接态用户数模型,具体可以通过以下步骤来实现S1021-S1023:
[0049] S1021、对建模样本数据集合C={(x1,y1),(x2,y2).......(xN,yN)}进行一元线性回归分析,获取一元线性回归模型:Y1=β0+β1X1,其中,β0和β1为常数;x1为第一个样本数据中的分组域寻呼量,y1为第一个样本数据中的平均连接态用户数,xN为第N个样本数据中的分组域寻呼量,yN为第N个样本数据中的平均连接态用户数,N为数据样本的数量;
[0050] 其中,本发明实施例对数据样本的具体数量不进行限定,为了提高建模模型的准确性,该数据样本的数量N越多越好,xN,yN分别为建模样本数据在采样周期内第N个数据样本中的分组域寻呼量和平均连接态用户数。
[0051] S1022、根据公式 计算使得Q(β0,β1)值最小时对应的 和从而确定所述一元线性回归模型的 和 yi为第i个样本数据中的平均连接态用户数;E(yi)=β0+β1Xi;
[0052] 其中, 和 为根据统计拟合准则,例如,普通最小二乘(Ordinary Least  Square,OLS)获得的使得Q(β0,β1)的值达到最小的β0,β1的估计值,其中,[0053] S1023、根据确定的 和 获取寻呼量推算连接态用户数模型 xi
为第i个样本数据中的分组域寻呼量,yi为第i个样本数据中的平均连接态用户数,1≤i≤N。
[0054] 在所述获取寻呼量推算连接态用户数模型 之前所述方法还包括:
[0055] S1024、根据公式 计算所述寻呼量推算连接态用户数模型的拟合度;其中, 为N组数据样本中所有连接态用户数的平均值, 为;yi
为第i跟踪区TA下的平均连接态用户数;
[0056] S1025、若确定所述R12大于等于预设值,则确定所述寻呼量推算连接态用户数模型对样本数据的拟合度满足要求;
[0057] S1026、若确定 则确定所述X1对Y1有显著贡献;其中,为N组数据样本中所有分组域寻呼量的平均值; 回归方程的标准
误差,α为显著性水平, 为临界值。
[0058] 本发明实施例中的α=0.05。对于t分布,在α=0.05,N已知的情况下,可以查表获取 的值。
[0059] 其中,本发明实施例中若R12大于预设值70%,则确定所述寻呼量推算连接态用户数模型 对样本数据的拟合度满足要求。
[0060] 参见图2所示,为本发明实施例根据表1获取的建模样本数据集合建立的PS寻呼量与平均连接态用户数之间回归方程,其中,N为9808,横轴坐标x表示PS寻呼量,纵轴坐标y表示平均连接态用户数。
[0061] 由图2可以发现,随着PS寻呼量的增加,TA内的平均连接态用户数有比较明显的线性增长趋势。
[0062] 通过一元线性回归分析,得到该寻呼量推算连接态用户数模型的回归系数估计值及其置信区间(显著性水平α=0.05),检验统计量的结果见表2:
[0063]
[0064] 其中, 为回归方程的标准误差,来考察观测值对回归直线的离散程度ε表示回归方程中被估参数的数量,即 和 本公式中ε=2,
为残差。
[0065] 故本发明实施例的寻呼量推算连接态用户数模型为:
[0066] 其中,X1为PS寻呼量,Y1为连接态用户数。
[0067] 由表2可知, 的拟合度R12=0.9422,说明通过线性回归得到的回归方程对样本值的拟合度达到了94.22%。
[0068] 由表2可知,t=399.7725,查表得 则说明所述X1对Y1有显著贡献。
[0069] 在所述 的拟合度满足要求且X1对Y1有显著贡献时,说明为有效模型。
[0070] 1)点估计:
[0071] 根据某TA任意小时的PS寻呼量观测值Xf1,基于 可得该TA该时间段内的平均连接态用户数 的点估计值。
[0072] 2)区间估计
[0073] 根据建模 样本中的PS寻呼量 xi,求得样本 均值可以得到:
[0074] 平均连接态用户数Yf1的均值E(Yf)的置信水平1-α=95%下的置信区间为:
[0075]
[0076] 平均连接态用户数Yf1的个值在置信水平1-α=95%下的置信区间为:
[0077]
[0078] 其中,
[0079] 进一步的,本发明实施例还可以对建模样本数据集合进行一元线性回归分析,获取寻呼量推算附着用户数模型,如表1所示,所述一个数据样本还包括在一个跟踪区TA下、该跟踪区TA一个时间段内的平均附着用户数;
[0080] 相应的,参见图4,所述方法还包括:
[0081] S104、对所述N组数据样本中所有跟踪区TA下的PS寻呼量及平均附着用户数进行线性回归分析,建立寻呼量推算附着用户数模型;
[0082] 其中,本发明实施例中的平均附着用户数通过从核心网侧(即MME)处获取,其中,每个小区的连接态用户数包括如表1所示的ECM-IDLE平均附着用户数和ECM-CONNECTED平均附着用户数,其中,ECM-IDLE平均附着用户数和ECM-CONNECTED平均附着用户数的具体获得方法可以参见每个小区平均连接态用户数的方法,每个TA下的平均附着用户数可以参见上述所述的每个TA平均连接态用户数的方法本发明实施例在此不再赘述。
[0083] S105、获取第一跟踪区TA下的PS寻呼量,利用所述寻呼量推算附着用户数模型,计算所述跟踪区的附着用户数。
[0084] 进一步优选的,对于步骤S104可以通过以下方式具体实现:
[0085] S1041、从所述建模样本数据集合中,获取时间段满足预设要求的n组目标数据样本,每组目标数据样本记为(xl,yl),其中,(xl,yl)∈C,1≤l≤N,n为目标样本数据的数量且n≤N;
[0086] 其中,由于在不同时段PS寻呼量与平均附着用户数之间存在不同的关系,需分时段建模。即将样本数据按不同时段分组,1天24个时段,每个时段分别建模,故本发明实施例在建立PS寻呼量与平均附着用户数时,从N个数据样本中选取同一时间段的样本数据,比如,可以选择同一个时间的,例如9-10点的,或选取每月周一到周五的数据,或每月周六至周日的数据。
[0087] S1042、对所述n组目标数据样本进行一元线性回归分析,获取一元线性回归模型:Y2=λ0+λ1X2,其中,λ0和λ1为常数;Y2为平均附着用户数,X2为分组域寻呼量;
[0088] S1043、根据公式 计算使得Q(λ0,λ1)值最小的 和从而确定所述一元线性回归模型的 和 其中,
[0089] S1044、根据确定的 和 获取寻呼量推算附着用户数模型
[0090] 进一步的,在所述获取寻呼量推算附着用户数模型 之前,所述方法还包括S1045-S1047:
[0091] S1045、根据公式 计算所述寻呼量推算附着用户数模型的拟合度;其中, 为n组数据样本中所有附着用户数的平均值, 根据第l
个数据样本中的分组域寻呼量拟合出的平均附着用户,yl为从n个数据样本中选取的第l个数据样本中平均附着用户数;
[0092] S1046、若确定所述R22大于等于预设值,则确定所述寻呼量推算附着用户数模型对样本数据的拟合度满足要求;
[0093] S1047、若确定 则确定所述X2对Y2有显著贡献;其中,为n组数据样本中所有PS寻呼量的平均值; 回归方程的标准误
差,α为显著性水平, 为临界值; 为λ1的估计值,即使得Q(λ0,λ1)满足拟合准则的值。
[0094] 其中,本发明实施例中若R22大于预设值70%,则确定所述寻呼量推算附着用户数模型 对样本数据的拟合度满足要求。
[0095] 只有当寻呼量推算附着用户数模型 对样本数据的拟合度满足要求,且 时,才确定 为有效模型。
[0096] 参见图3所示,为本发明实施例根据表1获取的建模样本数据,以工作日12点为例:筛选出工作日12点的样本集合建立的PS寻呼量与平均附着用户数之间回归方程,其中,n为
25,横轴坐标x表示PS寻呼量,纵轴坐标y表示平均附着用户数。
[0097] 通过一元线性回归分析,得到该寻呼量推算附着用户数模型的回归系数估计值及其置信区间(显著性水平α=0.05),检验统计量的结果见表3:
[0098] 表3检验统计量的结果
[0099]
[0100] 故本发明实施例的寻呼量推算连接态用户数模型为:
[0101] 其中,X2为PS寻呼量,Y2为附着用户数;
[0102] 由表3可知, 的拟合度R22=0.9632,说明通过线性回归得到的回归方程对样本值的拟合度达到了96.32%对样本数据的拟合度满足要求;
[0103] 由表3可知,t=24.5526,查表得 则说明所述X1对Y2有显著贡献。
[0104] 由 于 对 样 本 数 据 的 拟 合 度 满 足 要 求 且故 为有效模型。
[0105] 1)点估计:
[0106] 根据某TA任意小时的PS寻呼量观测值Xf2,基于回归方程可以得到该TA在12点的平均附着用户数Yf2=0.0889Xf2+732.4090。
[0107] 2)区间估计
[0108] 根据 建模样 本中的 PS寻呼 量x i ,求 得样本 均值可以得到:
[0109] 平均附着用户数Yf2的均值E(Yf2)的置信水平1-α=95%下的置信区间为:
[0110]
[0111] 平均附着用户数Yf1的个值在置信水平1-α=95%下的置信区间为:
[0112]
[0113] 其中,Yf2=0.0889Xf2+732.4090,
[0114] 参见图5,本发明实施例还提供一种预测移动通信用户数的装置50,该预测移动通信用户数的装置50中的各个功能单元与本发明上述实施例中预测移动通信用户数的方法相对应,具体可以参考本发明上述实施例的描述,本发明实施例在此不再赘述。如图5所示,该预测移动通信用户数的装置50,包括:
[0115] 获取单元501用于,获取建模样本数据集合,所述建模样本数据集合包括N组数据样本,其中,一个数据样本包括在一个跟踪区TA下、该跟踪区TA在一个时间段内的分组域寻呼量及平均连接态用户数;
[0116] 第一建模单元502用于,对所述N组数据样本中所有分组域寻呼量及平均连接态用户数进行线性回归分析,建立寻呼量推算连接态用户数模型;
[0117] 计算单元503用于,获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算连接态用户数模型,计算所述第一跟踪区TA的连接态用户数。
[0118] 进一步的,所述第一建模单元502具体用于:
[0119] 对建模样本数据集合C={(x1,y1),(x2,y2).......(xN,yN)}进行一元线性回归分析,获取一元线性回归模型:Y1=β0+β1X1,其中,β0和β1为常数;x1为第一个样本数据中的分组域寻呼量,y1为第一个样本数据中的平均连接态用户数,xN为第N个样本数据中的分组域寻呼量,yN为第N个样本数据中的平均连接态用户数,N为数据样本的数量;
[0120] 根据公式 计算使得Q(β0,β1)值最小时对应的 和 从而确定所述一元线性回归模型的 和 E(yi)=β0+β1Xi;
[0121] 根据确定的 和 获取寻呼量推算连接态用户数模型 其中,xi为第i个样本数据中的分组域寻呼量,
yi为第i个样本数据中的平均连接态用户数,1≤i≤N。
[0122] 进一步可选的,所述获取单元中一个数据样本还包括在一个跟踪区TA下、该跟踪区TA一个时间段内的平均附着用户数;
[0123] 相应的,如图6所示,所述预测移动通信用户数的装置50还包括:
[0124] 第二建模单元504用于,对所述N组数据样本中所有分组域寻呼量及平均附着用户数进行线性回归分析,建立寻呼量推算附着用户数模型;
[0125] 所述计算单元503还用于,获取第一跟踪区TA下的分组域寻呼量,利用所述寻呼量推算附着用户数模型,计算所述第一跟踪区的附着用户数。
[0126] 进一步优选的,所述第二建模单元504具体用于:
[0127] 从所述建模样本数据集合中,获取时间段满足预设要求的n组目标数据样本,每组目标数据样本记为(xl,yl),其中,(xl,yl)∈C,1≤l≤N,n为目标样本数据的数量且n≤N;
[0128] 对所述n组目标数据样本进行一元线性回归分析,获取一元线性回归模型:Y2=λ0+λ1X2,其中,λ0和λ1为常数;Y2为平均附着用户数,X2为分组域寻呼量;
[0129] 根据公式 计算使得Q(λ0,λ1)值最小的 和 从而确定所述一元线性回归模型的 和
[0130] 根据确定的 和 获取寻呼量推算附着用户数模型 其中,
[0131] 进一步优选的,所述预测移动通信用户数的装置50还包括第一判断单元和第二判断单元:
[0132] 所述第一判断单元用于,根据公式 计算所述寻呼量推算连接态用户数模型 的拟合度;其中, 为N个数据样本中所有连接态用户数的平均
值, 为根据第i个数据样本中的分组域寻呼量拟合出的连接态用户数,yi为第i个样本数据中的平均连接态用户数;
[0133] 若确定所述R12大于等于预设值,则确定所述寻呼量推算连接态用户数模型对样本数据的拟合度满足要求;
[0134] 若确定 则确定所述X1对Y1有显著贡献;其中,为N组数据样本中所有分组域寻呼量的平均值; 回归方程的标准误差,α为显著性水平,为临界值;
[0135] 所述第二判断单元用于:
[0136] 根据公式 计算所述寻呼量推算附着用户数模型的拟合度;其中, 为n组数据样本中所有附着用户数的平均值, 根据第l个数据样本中的分组域寻呼量拟合出的平均附着用户,yl为从n个数据样本中选取的第l个数据样本中平均附着用户数;
[0137] 若确定所述R22大于等于预设值,则确定所述寻呼量推算附着用户数模型对样本数据的拟合度满足要求;
[0138] 若确定 则确定所述X2对Y2有显著贡献;其中,为n组数据样本中所有分组域寻呼量的平均值; 回归方程的标准误差,α为显著性水平, 为临界值; 为λ1的估计值,即使得Q(λ0,λ1)满足拟合准则的值。
[0139] 进一步优选的,预测移动通信用户数的装置50还包括统计单元,所述统计单元具体用于:
[0140] 统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内的接收寻呼消息次数及接收电路域寻呼消息次数;
[0141] 根据所述接收寻呼消息次数及所述接收电路域寻呼消息次数,获取分组域寻呼量;
[0142] 统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内每个小区的连接态用户数;
[0143] 根据所述第二跟踪区TA下每个小区的连接态用户数,获得所述第二跟踪区TA下的平均连接态用户数;
[0144] 统计在所述第二跟踪区TA下,所述第二跟踪区TA一个时间段内所述第二跟踪区TA下的ECM-IDLE平均附着用户数及ECM-CONNECTED平均附着用户数;
[0145] 根据所述ECM-IDLE平均附着用户数及ECM-CONNECTED平均附着用户数,获取所述第二跟踪区TA下的平均附着用户数。
[0146] 本发明实施例提供一种预测移动通信用户数的装置,通过对获取的建模样本数据集合进行线性回归分析,建立寻呼量推算连接态用户数的模型,在获取到第一跟踪区TA下的PS寻呼量时,可以通过所述寻呼量推算连接态用户数模型直接获得所述第一跟踪区TA下的连接态用户数,便于移动运营商获取友商用户数的分布情况。克服了现有技术中通过已有用户数信息预测后续用户数发展情况,仅适用于运营商自身的用户数发展预测,无法用于推算友商的用户数情况的问题,且本发明实施例中的寻呼量推算连接态用户数模型所依据的数据样本集合,为基于小时级的数据采样结合,可以有效将所述第一跟踪区TA的连接态用户数精细到小时级的用户数推算。
[0147] 在本申请所提供的几组实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多组单元或组件可以结合或者可以集成到另一组系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0148] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一组地方,或者也可以分布到多组网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0149] 另外,在本发明各组实施例中的各功能单元可以集成在一组处理单元中,也可以是各组单元单独物理包括,也可以两组或两组以上单元集成在一组单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0150] 上述以软件功能单元的形式实现的集成的单元,可以存储在一组计算机可读取存储介质中。上述软件功能单元存储在一组存储介质中,包括若干指令用以使得一台计算机设备(可以是组人计算机,服务器,或者网络设备等)执行本发明各组实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0151] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。