移动网络流量预测方法、装置及设备转让专利

申请号 : CN201911374536.9

文献号 : CN113055923B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 袁姣红

申请人 : 中国移动通信集团湖南有限公司中国移动通信集团有限公司

摘要 :

本发明实施例公开了一种移动网络流量预测方法、装置及设备,该方法包括:获取目标时段内的历史移动网络数据;将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果;确定各所述流量预测模型分别对应的权重;根据各所述流量预测模型的输出结果及所述权重,计算得到待预测时刻的流量预测结果。在本发明实施例中将多种预测模型进行有效融合,充分发挥各预测模型的优势,有效提升了移动网络流量预测的准确性。

权利要求 :

1.一种移动网络流量预测方法,其特征在于,包括:

获取目标时段内的历史移动网络数据;所述历史移动网络数据包括以下至少一项:使用移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、所述流量数据的平均增长率;

将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果;所述流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,所述第一流量预测模型基于所述流量数据的平均增长率、所述流量增长率和所述网络侧的流量最大承载能力训练得到;所述第二流量预测模型基于所述目标业务渗透率训练得到;所述第三流量预测模型基于所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率训练得到;

确定各所述流量预测模型分别对应的权重;

根据各所述流量预测模型的输出结果及所述权重,计算得到待预测时刻的流量预测结果。

2.根据权利要求1所述的方法,其特征在于,在将所述历史移动网络数据输入流量预测模型之前,所述方法还包括:对所述历史移动网络数据进行预处理;

所述预处理包括以下至少一项:

若第一时段内的所述用户数量与所述第一时段的前一相邻时段内的用户数量平均值之差大于预设数量阈值,则删除所述第一时段内的历史移动网络数据;

若第二时段内的所述流量数据与所述第二时段的前一相邻时段内的流量数据平均值之差大于预设流量阈值,则删除所述第二时段内的历史移动网络数据;

若第三时段内的所述目标业务渗透率与所述第三时段的前一相邻时段内的目标业务渗透率平均值之差大于预设渗透率阈值,则删除所述第三时段内的历史移动网络数据;

若第四时段内的所述流量增长率与所述第四时段的前一相邻时段的流量增长率平均值之差大于预设增长率阈值,则删除所述第四时段内的历史移动网络数据。

3.根据权利要求1所述的方法,其特征在于,所述确定各所述流量预测模型分别对应的权重,包括:确定各所述流量预测模型的初始权重;

按照预设规则调整各所述流量预测模型的初始权重,得到各所述流量预测模型分别对应的权重;所述预设规则包括以下至少一项:若所述流量预测模型的输出结果不在预设流量范围内,则调整所述初始权重为0,作为所述流量预测模型对应的权重;

若所述流量预测模型的输出结果在所述预设流量范围内、且与所述待预测时刻的实际流量数据的差值小于或等于第一阈值,则调整所述初始权重为1,作为所述流量预测模型对应的权重;

若所述流量预测模型的输出结果在所述预设流量范围内、且与所述实际流量数据的差值小于或等于第二阈值,则增大所述初始权重,得到所述流量预测模型对应的权重;

若所述流量预测模型的输出结果在所述预设流量范围内、且与所述实际流量数据的差值大于或等于第三阈值,则减小所述初始权重,得到所述流量预测模型对应的权重;

其中,所述第一阈值小于所述第二阈值,所述第二阈值小于所述第三阈值。

4.根据权利要求3所述的方法,其特征在于,各所述流量预测模型的初始权重之和为1;

所述按照预设规则调整各所述流量预测模型的初始权重,得到各所述流量预测模型分别对应的权重之后,所述方法还包括:将调整后的权重值进行归一化,得到各所述流量预测模型分别对应的权重。

5.根据权利要求1所述的方法,其特征在于,所述将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果,包括:根据所述流量数据分别确定核心网络和无线网络对应的平均增长率;

根据所述核心网络和所述无线网络对应的平均增长率及所述流量增长率,计算所述核心网络在所述待预测时刻的预测流量以及所述无线网络在所述待预测时刻的预测流量;

将所述核心网络在所述待预测时刻的预测流量、所述无线网络在所述待预测时刻的预测流量和所述网络侧的流量最大承载能力对应的流量中的最小值确定为所述第一流量预测模型的输出结果。

6.根据权利要求1所述的方法,其特征在于,所述将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果,包括:将所述目标业务渗透率输入预先建立的多元线性回归模型,得到所述第二流量预测模型的输出结果;所述多元线性回归模型基于历史时段的所述移动网络对应的流量数据和目标业务渗透率训练得到。

7.根据权利要求1所述的方法,其特征在于,所述将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果,包括:将所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率输入预先训练的神经网络模型,得到所述第三流量预测模型的输出结果;

所述神经网络模型以历史时段的所述移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率作为训练样本,以待预测时刻的流量数据作为所述训练样本的目标值训练得到。

8.一种移动网络流量预测装置,其特征在于,包括:

数据获取模块,用于获取目标时段内的历史移动网络数据;所述历史移动网络数据包括以下至少一项:使用移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、所述流量数据的平均增长率;

模型预测模块,用于将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果;所述流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,所述第一流量预测模型基于所述流量数据的平均增长率、所述流量增长率和所述网络侧的流量最大承载能力训练得到;所述第二流量预测模型基于所述目标业务渗透率训练得到;所述第三流量预测模型基于所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率训练得到;

权重确定模块,用于确定各所述流量预测模型分别对应的权重;

结果计算模块,用于根据各所述流量预测模型的输出结果及所述权重,计算得到待预测时刻的流量预测结果。

9.一种移动网络流量预测设备,其特征在于,包括:

存储器,存储有计算机程序指令;

处理器,当所述计算机程序指令被所述处理器执行时实现如权利要求1至7中任一项所述的移动网络流量预测方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1至7中任一项所述的移动网络流量预测法。

说明书 :

移动网络流量预测方法、装置及设备

技术领域

[0001] 本发明涉及通信领域,尤其涉及一种移动网络流量预测方法、装置及设备。

背景技术

[0002] 随着国家“提速降费”政策的推广和大流量套餐的普及,全网流量呈现爆发式快速增长,给网络运维带来巨大的挑战和压力。现网2G/4G/5G网络多种制式并存、云及本地传统设备混合组网,业务类型种类繁多,尤其是5G时代具有高带宽和海量连接等特性,使得移动通信网络的流量预测复杂度不断提升。
[0003] 现有的流量预测方法仅从微观层面或网络角度来探究流量变化原因,然而目前导致流量变化的因素远不止于此,例如重要活动或节假日的人员大幅迁徙(如春节务工人员大量返乡、大学生开学或寒暑假离校)、大流量套餐渗透率的提升、大带宽需求的5G业务量快速增长、网络端到端最大承载能力等因素都会对网络的流量变化产生重要影响。因此现有的流量预测方法无法适用于当前移动网络的分析与预测,流量预测的准确性不足。

发明内容

[0004] 本发明实施例提供一种移动网络流量预测方法、装置及设备,以解决现有流量预测方法的预测准确性不足的问题。
[0005] 为解决上述技术问题,本发明实施例是这样实现的:
[0006] 第一方面,本发明实施例提供了一种移动网络流量预测方法,该方法包括:
[0007] 获取目标时段内的历史移动网络数据;所述历史移动网络数据包括以下至少一项:使用移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、所述流量数据的平均增长率;将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果;所述流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型中;其中,所述第一流量预测模型基于所述流量数据的平均增长率、所述流量增长率和所述网络侧的流量最大承载能力训练得到;所述第二流量预测模型基于所述目标业务渗透率训练得到;所述第三流量预测模型基于所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率训练得到;确定各所述流量预测模型分别对应的权重;根据各所述流量预测模型的输出结果及所述权重,计算得到待预测时刻的流量预测结果。
[0008] 第二方面,本发明实施例还提供了一种移动网络流量预测装置,该装置包括:
[0009] 数据获取模块,用于获取目标时段内的历史移动网络数据;所述历史移动网络数据包括以下至少一项:使用移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、所述流量数据的平均增长率;模型预测模块,用于将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果;所述流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型中;其中,所述第一流量预测模型基于所述流量数据的平均增长率、所述流量增长率和所述网络侧的流量最大承载能力训练得到;所述第二流量预测模型基于所述目标业务渗透率训练得到;所述第三流量预测模型基于所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率训练得到;权重确定模块,用于确定各所述流量预测模型分别对应的权重;结果计算模块,用于根据各所述流量预测模型的输出结果及所述权重,计算得到待预测时刻的流量预测结果。
[0010] 第三方面,本发明实施例还提供了一种移动网络流量预测设备,包括:存储器,存储有计算机程序指令;处理器,当所述计算机程序指令被所述处理器执行时实现如上述任一项所述的移动网络流量预测方法。
[0011] 第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得所述计算机执行如上述任一项所述的移动网络流量预测方法。
[0012] 在本发明实施例中,可以将目标时段内的历史移动网络数据输入流量预测模型,得到流量预测模型的输出结果,通过各流量预测模型的输出结果及对应的权重,可以计算得到待预测时刻的流量预测结果。该流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,第一流量预测模型基于流量数据的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到;第二流量预测模型基于目标业务渗透率训练得到;第三流量预测模型基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到。由于将多种预测模型进行有效融合,充分发挥各预测模型的优势,有效提升了移动网络流量预测的准确性。

附图说明

[0013] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0014] 图1是本发明的一个实施例中一种移动网络流量预测方法的示意性流程图。
[0015] 图2是本发明的一个实施例中BP神经网络的结构示意图。
[0016] 图3是本发明的一个实施例中执行基于多模型融合的流量预测方法的系统结构示意图。
[0017] 图4是本发明的一个实施例中各模型预测误差的对比示意图。
[0018] 图5是本发明的一个实施例中一种移动网络流量预测装置的结构示意图。
[0019] 图6是本发明的一个实施例中一种移动网络流量预测设备的结构示意图

具体实施方式

[0020] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0021] 图1是本发明的一个实施例中一种移动网络流量预测方法的示意性流程图。
[0022] 图1的方法可包括:
[0023] S102,获取目标时段内的历史移动网络数据。
[0024] 该历史移动网络数据包括以下至少一项:使用移动网络的用户数量、移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、流量数据的平均增长率。具体地,可以通过专业性能网管采集无线侧和核心网侧的历史数据,该目标时段可以基于用户设置确定。
[0025] 其中,该使用移动网络的用户数量可以是目标时段的2G/4G/5G的用户数量;该移动网络对应的流量数据可以是目标时段移动网络的流量数据,流量数据主要包括业务忙时段、日粒度、月粒度等统计值;该目标业务渗透率可以是市场侧各档位大流量套餐的渗透率,某档位大流量套餐的渗透率=该档位套餐的签约用户数/全网总用户数;该指定类事件可以是重要活动或节假日,可以为所有数据添加是否重要活动标签或节假日标签并计算用户位置移动导致的流量增长率(表示因重要活动或节假日期间导致的流量增幅);该网络侧的流量最大承载能力,表示网络侧可以承载流量的最大能力,可以通过“无线网‑传输网‑核心网‑互联网CMNET”的流量路径上网络端到端的承载流量的最大能力确定。另由于2G流量占总流量的比重不足0.3%,在本实施例中可以不考虑2G用户及对应的流量。
[0026] 因受网络连通性或采集服务器等因素影响,可能存在部分时段、部分网元性能文件采集延时或采集不全等原因导致提取的目标数据中存在异常数据的情况,因此需要对提取的数据进行预处理剔除掉异常数据,基于此在将历史移动网络数据输入流量预测模型之前,对历史移动网络数据进行预处理,预处理包括以下至少一项:
[0027] 若第一时段内的用户数量与第一时段的前一相邻时段内的用户数量平均值之差大于预设数量阈值,则删除第一时段内的历史移动网络数据。该用户数量平均值为第一时段的前一相邻时段内用户数量的总和除以时段数量得到的比值。
[0028] 若第二时段内的流量数据与第二时段的前一相邻时段内的流量数据平均值之差大于预设流量阈值,则删除第二时段内的历史移动网络数据。该流量数据平均值为第二时段的前一相邻时段内流量数据的总和除以时段数量得到的比值。
[0029] 若第三时段内的目标业务渗透率与第三时段的前一相邻时段内的目标业务渗透率平均值之差大于预设渗透率阈值,则删除第三时段内的历史移动网络数据。该目标业务渗透率平均值为第三时段的前一相邻时段内的目标业务渗透率的总和除以时段数量得到的比值。
[0030] 若第四时段内的流量增长率与第四时段的前一相邻时段内的流量增长率平均值之差大于预设增长率阈值,则删除第四时段内的历史移动网络数据。该流量增长率平均值为第四时段的前一相邻时段内的流量增长率的总和除以时段数量得到的比值。
[0031] 上述各阈值可以根据实际实施条件确定,本实施例对此不作限定。例如,某个工作日的用户数量与前一工作日的用户数量、本周工作日的平均用户数量或前一周工作日的平均用户数量相比波动超过10%的数据,某个工作日的流量与前一工作日的流量、本周工作日的平均流量或前一周工作日的平均流量相比波动超过15%的数据,某个节假日的用户数量与节假日前一周的平均用户数量相比波动超过20%,某个节假日的流量与节假日前一周的平均流量相比波动超过30%的值等。对模型的输入数据进行预处理,可以保障数据的正确性和可靠性。
[0032] S104,将历史移动网络数据输入流量预测模型,得到流量预测模型的输出结果。该流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型。其中,第一流量预测模型基于流量数据的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到;第二流量预测模型基于目标业务渗透率训练得到;第三流量预测模型基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到。
[0033] 随着移动网络的发展,近年的总上网用户数增长趋于平稳,主要依靠大流量套餐用户的大幅增加拉动全网流量快速增长。通过对大量历史数据进行计算分析,发现总流量与市场侧大流量套餐的渗透率具有显著的线性相关性。而总4G用户数、5G用户数、重要活动或节假日因素等与全网总流量主要是线性关系,但也存在一定程度的非线性关系。
[0034] 故为了综合考虑网络侧和市场侧对移动网络总流量变化有重要影响的因素,提升预测的准确性,本发明实施例首先建立三种预测模型:基于流量的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到的第一预测模型、基于目标业务渗透率训练得到的第二预测模型和基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到的第三预测模型,将上述三个预测模型融合得到流量预测模型。
[0035] 其中,第一预测模型和第二预测模型的算法易于实现,仅考虑网络侧数据或市场侧数据,无法同时兼顾网络和市场业务发展变化情况,且此两种模型无法体现各数据之间的非线性关系,虽然能较好反映流量的变化趋势,但是难以达到理想的预测精度;第三预测模型可以体现各数据之间的非线性关系,但对于未经过学习的新样本,可能存在较大误差,导致预测结果产生波动,故为了充分发挥上述三种模型的优势,本发明实施例提出将此三种预测模型进行融合,并基于融合后的流量预测模型输出流量预测值。
[0036] S106,确定各流量预测模型分别对应的权重。
[0037] 具体地,可以根据以下方式确定各流量预测模型分别对应的权重:
[0038] 首先,确定各流量预测模型的初始权重。可选地,将各流量预测模型的初始权重设置为相同值。
[0039] 然后,按照预设规则调整各流量预测模型的初始权重,得到各流量预测模型分别对应的权重。预设规则包括以下至少一项:
[0040] 若流量预测模型的输出结果不在预设流量范围内,则调整初始权重为0,作为流量预测模型对应的权重。可以通过历史统计数据和网络的最大承载能力得到流量的最大预测值以及最小预测值,该最大预测值和最小预测值限定了预设流量范围。如果输出结果不在该预设流量范围内,表示该预测模型的输出结果与实际流量差距过大,在流量预测模型中不使用该预测模型。
[0041] 若流量预测模型的输出结果在预设流量范围内、且与待预测时刻的实际流量数据的差值小于或等于第一阈值,则调整初始权重为1,作为流量预测模型对应的权重。该第一阈值表示输出结果与实际流量的误差值,若低于该误差值则表示模型的输出结果与实际流量相符合,在流量预测模型中考虑仅使用该预测模型,可以暂时屏蔽其他两个模型。
[0042] 若流量预测模型的输出结果在预设流量范围内、且与上述实际流量数据的差值小于或等于第二阈值,则增大初始权重,得到流量预测模型对应的权重。该第二阈值表示流量估计值与实际流量的最小差值,若小于或等于该最小差值则表示模型的输出结果与实际流量比较符合,在流量预测模型中考虑提高该预测模型的权重。
[0043] 若流量预测模型的输出结果在预设流量范围内、且与上述实际流量数据的差值大于或等于第三阈值,则减小初始权重,得到流量预测模型对应的权重。该第三阈值表示流量估计值与实际流量的最大差值,若大于或等于该最大差值则表示模型的输出结果与实际流量比较不符合,在流量预测模型中考虑降低该预测模型的权重。
[0044] 可以理解的是,上述第一阈值小于第二阈值,第二阈值小于第三阈值。在将三个预测模型的初始权重系数之和设置为1的前提下,得到各模型的权重系数后,可以将第一预测模型、第二预测模型、第三预测模型对应的权重系数之和进行归一化,得到对应的最终权重系数。
[0045] 考虑到权重归一化的需要,可以将各流量预测模型的初始权重之和设置为1。在按照上述规则调整初始权重,得到各流量预测模型分别对应的权重之后,还可以将调整后的权重值进行归一化,从而得到各流量预测模型分别对应的权重。
[0046] S108,根据各流量预测模型的输出结果及权重,计算得到待预测时刻的流量预测结果。
[0047] 为了将各流量预测模型融合,对各流量预测模型的输出结果进行加权组合,从而得到待预测时刻的流量预测结果。在进行加权组合时,通过各模型的输出结果与对应的权重相乘,得到上述流量预测结果。其中,各模型对应的权重标识了该模型在流量预测模型中的重要程度,可以理解的是,准确度越高的模型越重要,对应的权重越大。
[0048] 本发明实施例提供了一种移动网络流量预测方法,可以将目标时段内的历史移动网络数据输入流量预测模型,得到流量预测模型的输出结果,通过各流量预测模型的输出结果及对应的权重,可以计算得到待预测时刻的流量预测结果。该流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,第一流量预测模型基于流量数据的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到;第二流量预测模型基于目标业务渗透率训练得到;第三流量预测模型基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到。由于将多种预测模型进行有效融合,充分发挥各预测模型的优势,有效提升了移动网络流量预测的准确性。
[0049] 下面,分别介绍第一预测模型、第二预测模型和第三预测模型的训练及预测过程。
[0050] (1)第一预测模型可以按照以下步骤输出结果:
[0051] 首先,根据移动网络的流量数据分别确定核心网络和无线网络对应的平均增长率。该平均增长率可以理解为网络侧的流量自然增长率。
[0052] 然后,根据核心网络和无线网络对应的平均增长率及流量增长率,计算核心网络在待预测时刻的预测流量以及无线网络在待预测时刻的预测流量。在已知流量随时间变化的平均增长率以及重要活动或节假日导致的流量增长率的情况下,可以计算得到待预测时刻的预测流量。
[0053] 然后,将核心网络在待预测时刻的预测流量、无线网络在待预测时刻的预测流量和网络侧的流量最大承载能力对应的流量中的最小值确定为第一流量预测模型的输出结果。由于流量需要通过“无线网‑传输网‑核心网‑互联网CMNET”的流量路径传输,因此取预测流量和网络侧的流量最大承载能力对应的流量中的最小值作为输出结果。
[0054] 可以根据公式St+τT=St*(1+μ)τ*(1+φ)预测网络侧(含无线网络和核心网络)的流量,其中,St为t时刻的流量统计值,St+τT为t+τT时刻的流量统计值,T表示时间粒度(如小时、天、周或者月),τ表示第τ个时间粒度,φ为由指定类事件导致的流量增长率,μ为T时间粒度内对应的平均增长率。
[0055] 例如当T表示月粒度,St为2019年7月对应的流量,St+τT为待预测的2019年10月国庆期间的流量,则μ为2019年5月、6月、7月这三个月环比流量增幅的平均值,φ可取2018年国庆期间的峰值流量/2018年国庆节前一周的平均流量。
[0056] 故可基于公式(1)和(2)可分别获得核心网络侧和无线网络侧的流量预测值:
[0057] St+τT(核心网侧)=St(核心网侧)*(1+μ核心网)τ*(1+φ核心网)  (1)
[0058] St+τT(无线侧)=St(无线侧)*(1+μ无线)τ*(1+φ无线)  (2)
[0059] 在基于公式(1)和(2)获得核心网络侧和无线网络侧的流量后,还需网络端到端的流量最大承载能力,故第一预测模型的流量输出值
[0060] (2)第二预测模型可以按照以下步骤输出结果:
[0061] 将目标业务渗透率输入预先建立的多元线性回归模型,得到第二流量预测模型的输出结果。其中,多元线性回归模型基于历史时段的移动网络对应的流量数据和目标业务渗透率训练得到。该历史时段可以与前述目标时段相同或者不同。
[0062] 由于总上网用户数趋于平稳,全网流量快速增长是由大流量套餐用户的增加拉动。通过对大量历史数据进行计算分析,发现总流量与市场侧各档位大流量套餐的渗透率(某档位大流量套餐的渗透率=该档位大流量套餐的签约用户数/总用户数)具有显著的线性相关性,且不同档位的大流量套餐用户数对全网流量的贡献程度差异较大。本实施例通过建立多元线性回归模型来反映总流量与市场侧各档位大流量套餐渗透率之间的线性关系。
[0063] 根据线性回归模型的原理,设因变量y(表示全网总流量)与p个自变量x1,x2,…,xp(分别表示各档位大流量套餐的渗透率)之间满足公式(3),则可建立多元线性回归模型。
[0064]
[0065] 其中β0,β1,…,βp为多元回归参数,ε为统计误差,服从均值为零的正态分布,自变量x1,x2,…,xp满足约束条件 且θ的取值依据市场营销策略和业务实际发展情况进行确定。
[0066] 为了降低预测复杂度,在本实施例中可将大流量套餐分为38~100元、101~200元,201~300元、300元以上共4个档次,建立四元线线性回归模型。设y为历史流量实际值,x1,x2,…,x4为对应4个档次大流量套餐的渗透率,并对(x1,x2,…,x4,y)作n(n>5)次试验,就可以得到一个容量为n的样本和一个有限样本模型:
[0067]
[0068] 其中ε0,ε1,…,εn相互独立且与ε同分布。可用矩阵表示上式,如下:
[0069]
[0070]
[0071] 则上式变为
[0072]
[0073] 根据最小二乘法可得β的最小二乘估计
[0074]
[0075] 此模型即为基于市场大流量套餐渗透率的四元线性回归流量预测模型。根据此模型可以得到四元回归模型的流量预测值输出,设为
[0076] (3)第三预测模型可以按照以下步骤输出结果:
[0077] 将用户数量、流量数据、目标业务渗透率和流量增长率输入预先训练的神经网络模型,得到第三流量预测模型的输出结果。其中,神经网络模型以历史时段的移动网络的用户数量、移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率作为训练样本,以待预测时刻的流量数据作为训练样本的目标值训练得到。
[0078] 在本实施例中,以前馈BP(back propagation)神经网络为例进行说明。通过BP神经网络可以建立4G用户数、5G用户数、4G流量、5G流量、市场侧所有大流量套餐的渗透率、由指定类事件导致的流量增长率等输入变量与预测流量之间的非线性模型。参见图2所示的BP神经网络的结构示意图,该神经网络采用基本的三层结构,其中,xi(i=1,2,3,4,5,6)分别表示输入变量某时间点的4G用户数、5G用户数、4G总流量、5G总流量、市场侧所有大流量套餐的渗透率、流量增长率, 为BP神经网络模型输出的流量预测值。在该神经网络子网的输入层有12个神经元,输出层有1个神经元,中间层根据经验公式和试验结果,取m=12个神经元,其隐层采用sigmoid函数,输出层函数采用y=x,则基于BP神经网络的核心网流量预测模型的输入和输出关系如公式(7)所示:
[0079]
[0080] 其中, 为输入的第i个值对应的神经元到中间层的第m个神经元的权值,O
是中间层第m个神经元的阀值,b是输出层神经元的阀值, 是中间层的第m个神经元到输出层神经元的权值,tansig(.)表示sigmoid函数。
[0081] 因运营商主要依赖历史统计数据,实现对未来时刻点的流量预测,故本实施例为了既能表征网络流量的动态变化特性,又避免流量的时间累积效应,在第一预测模型进行训练时对样本数据采用时间滑动窗口的处理思路,以降低模型的分析处理复杂度。具体为:将t时刻点的4G用户数、5G用户数、4G总流量、5G总流量、市场侧所有大流量套餐的渗透率和流量增长率数据作为训练样本的输入,t+τT时刻的峰值流量作为训练样本的目标值,其中T表示时间粒度(如小时、天、周或者月),τ为整数。例如当利用2017年1月到2019年8月的数据来预测2019年国庆期间的峰值流量时,可将历史数据整理成如表1所示的样本数据来进行模型训练。
[0082] 表1
[0083]
[0084]
[0085] 为了充分发挥上述三种预测模型的优势,本实施例还提出针对上述三种预测模型的融合算法,将多模型融合后的预测值作为最终的预测输出结果。
[0086] 将第一预测模型、第二预测模型、第三预测模型的输出 和 进行加权组合,得到流量预测模型的最终输出值
[0087]
[0088] 式(8)中,α+β+γ=1,且0≤α,β,γ≤1。α,β和γ的初始值相同,通过规则改变。以第一预测模型的输出 的测量误差为例说明系数变化规则:
[0089] 规则1:如果 则γ=1,α,β暂时屏蔽;
[0090] 规则2:如果 则γ(k)=1.5γ(k‑1);
[0091] 规则3:如果 则γ(k)=0.5γ(k‑1);
[0092] 其中,Yreal为训练样本在待预测时刻的流量真实值,第一预设阈值δ1、第二预设阈值δ2和第三预设阈值δ3可根据经验值选取,如δ1=0.5%Yreal,δ2=3%Yreal,δ3=15%Yreal,k为调整次数,当增大权重时,新的权重取值为原权重的1.5倍;当减小权重时,新的权重取值为原权重的0.5倍。
[0093] 系数和流量预测值的有效性检查规则包括:
[0094] 规则4:如果 or 则γ=0;
[0095] 规则5:如果α,β,γ值改变,则α,β,γ之和归一化。
[0096] 其中,Ymin和Ymax可通过历史统计数据和网络的最大承载能力得到。例如历史统计数据中流量的范围是6000TB‑8000TB,网络的最大承载能力是9000TB,则Ymax取9000TB,Ymin取6000TB。
[0097] 参见图3所示的执行基于多模型融合的流量预测方法的系统结构示意图,示出了数据提取单元301、数据预处理单元302、多模型融合单元303和网络能力调整策略确定单元304。数据提取单元301用于提取历史移动网络数据,数据预处理单元302用于对历史移动网络数据进行数据过滤,多模型融合单元303用于将第一预测模型、第二预测模型、第三预测模型的输出结果进行加权组合,网络能力调整策略确定单元304用于指导现网确定网络能力调整策略(所述策略包括网络能力扩充策略和/或负荷均衡调优策略。
[0098] 应用上述第一预测模型、第二预测模型、第三预测模型的多模型融合方案,对2018年中秋节、2018年国庆节和2019年春节等重大节假日期间的峰值流量进行预测,各模型的预测误差如图4所示。其中柱形图1、2、3分别表示2018年中秋节的预测误差、2018年国庆节的预测误差和2019年春节的预测误差。可将,多模型融合方案的预测误差显著小于各模型单独使用的预测误差。
[0099] 因此,通过本实施例提供的多模型融合的预测模型可以大幅提升移动网络流量预测的准确性,从而可以精确指导现网进行负荷均衡调优或网络能力扩充。
[0100] 图5是本发明的一个实施例中一种移动网络流量预测装置的结构示意图,请参考图5,该移动网络流量预测装置可包括:
[0101] 数据获取模块501,用于获取目标时段内的历史移动网络数据;历史移动网络数据包括以下至少一项:使用移动网络的用户数量、移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、流量数据的平均增长率;
[0102] 模型预测模块502,用于将历史移动网络数据输入流量预测模型,得到流量预测模型的输出结果;流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,第一流量预测模型基于流量数据的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到;第二流量预测模型基于目标业务渗透率训练得到;第三流量预测模型基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到;
[0103] 权重确定模块503,用于确定各流量预测模型分别对应的权重;
[0104] 结果计算模块504,用于根据各流量预测模型的输出结果及权重,计算得到待预测时刻的流量预测结果。
[0105] 本发明实施例提供了一种移动网络流量预测装置,可以将目标时段内的历史移动网络数据输入流量预测模型,得到流量预测模型的输出结果,通过各流量预测模型的输出结果及对应的权重,可以计算得到待预测时刻的流量预测结果。该流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,第一流量预测模型基于流量数据的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到;第二流量预测模型基于目标业务渗透率训练得到;第三流量预测模型基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到。由于将多种预测模型进行有效融合,充分发挥各预测模型的优势,有效提升了移动网络流量预测的准确性。
[0106] 可选地,作为一个实施例,所述装置还包括预处理模块,所述预处理模块用于:对所述历史移动网络数据进行预处理;所述预处理包括以下至少一项:若第一时段内的所述用户数量与所述第一时段的前一相邻时段内的用户数量平均值之差大于预设数量阈值,则删除所述第一时段内的历史移动网络数据;若第二时段内的所述流量数据与所述第二时段的前一相邻时段内的流量数据平均值之差大于预设流量阈值,则删除所述第二时段内的历史移动网络数据;若第三时段内的所述目标业务渗透率与所述第三时段的前一相邻时段内的目标业务渗透率平均值之差大于预设渗透率阈值,则删除所述第三时段内的历史移动网络数据;若第四时段内的所述流量增长率与所述第四时段的前一相邻时段的流量增长率平均值之差大于预设增长率阈值,则删除所述第四时段内的历史移动网络数据。
[0107] 可选地,作为一个实施例,所述权重确定模块503,具体用于:确定各所述流量预测模型的初始权重;按照预设规则调整各所述流量预测模型的初始权重,得到各所述流量预测模型分别对应的权重;所述预设规则包括以下至少一项:若所述流量预测模型的输出结果不在预设流量范围内,则调整所述初始权重为0,作为所述流量预测模型对应的权重;若所述流量预测模型的输出结果在所述预设流量范围内、且与所述待预测时刻的实际流量数据的差值小于或等于第一阈值,则调整所述初始权重为1,作为所述流量预测模型对应的权重;若所述流量预测模型的输出结果在所述预设流量范围内、且与所述实际流量数据的差值小于或等于第二阈值,则增大所述初始权重,得到所述流量预测模型对应的权重;若所述流量预测模型的输出结果在所述预设流量范围内、且与所述实际流量数据的差值大于或等于第三阈值,则减小所述初始权重,得到所述流量预测模型对应的权重;其中,所述第一阈值小于所述第二阈值,所述第二阈值小于所述第三阈值。
[0108] 可选地,作为一个实施例,各所述流量预测模型的初始权重之和为1;所述权重确定模块503,具体用于:将调整后的权重值进行归一化,得到各所述流量预测模型分别对应的权重。
[0109] 可选地,作为一个实施例,模型预测模块502,具体用于:根据所述流量数据分别确定核心网络和无线网络对应的平均增长率;根据所述核心网络和所述无线网络对应的平均增长率及所述流量增长率,计算所述核心网络在所述待预测时刻的预测流量以及所述无线网络在所述待预测时刻的预测流量;将所述核心网络在所述待预测时刻的预测流量、所述无线网络在所述待预测时刻的预测流量和所述网络侧的流量最大承载能力对应的流量中的最小值确定为所述第一流量预测模型的输出结果。
[0110] 可选地,作为另一个实施例,模型预测模块502,具体用于:将所述目标业务渗透率输入预先建立的多元线性回归模型,得到所述第二流量预测模型的输出结果;所述多元线性回归模型基于历史时段的所述移动网络对应的流量数据和目标业务渗透率训练得到。
[0111] 可选地,作为另一个实施例,模型预测模块502,具体用于:将所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率输入预先训练的神经网络模型,得到所述第三流量预测模型的输出结果;所述神经网络模型以历史时段的所述移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率作为训练样本,以待预测时刻的流量数据作为所述训练样本的目标值训练得到。
[0112] 本发明实施例提供的移动网络流量预测装置能够实现上述移动网络流量预测方法的实施例中的各个过程,为避免重复,这里不再赘述。
[0113] 请参阅图6,图6是本发明实施例应用的移动网络流量预测设备的结构示意图,能够实现上述实施例中移动网络流量预测方法的细节,并达到相同的效果。如图6所示,移动网络流量预测设备600包括:处理器601、收发机602、存储器603、用户接口604和总线接口,其中:
[0114] 在本发明实施例中,移动网络流量预测设备600还包括:存储在存储器上603并可在处理器601上运行的计算机程序,计算机程序被处理器601执行时实现如下步骤:
[0115] 获取目标时段内的历史移动网络数据;所述历史移动网络数据包括以下至少一项:使用移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率、网络侧的流量最大承载能力、所述流量数据的平均增长率;将所述历史移动网络数据输入流量预测模型,得到所述流量预测模型的输出结果;所述流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,所述第一流量预测模型基于所述流量数据的平均增长率、所述流量增长率和所述网络侧的流量最大承载能力训练得到;所述第二流量预测模型基于所述目标业务渗透率训练得到;所述第三流量预测模型基于所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率训练得到;确定各所述流量预测模型分别对应的权重;根据各所述流量预测模型的输出结果及所述权重,计算得到待预测时刻的流量预测结果。
[0116] 在图6中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器601代表的一个或多个处理器和存储器603代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机602可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。针对不同的用户设备,用户接口604还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
[0117] 处理器601负责管理总线架构和通常的处理,存储器603可以存储处理器601在执行操作时所使用的数据。
[0118] 可选的,计算机程序被处理器601执行时还可实现如下步骤:对所述历史移动网络数据进行预处理;所述预处理包括以下至少一项:若第一时段内的所述用户数量与所述第一时段的前一相邻时段内的用户数量平均值之差大于预设数量阈值,则删除所述第一时段内的历史移动网络数据;若第二时段内的所述流量数据与所述第二时段的前一相邻时段内的流量数据平均值之差大于预设流量阈值,则删除所述第二时段内的历史移动网络数据;若第三时段内的所述目标业务渗透率与所述第三时段的前一相邻时段内的目标业务渗透率平均值之差大于预设渗透率阈值,则删除所述第三时段内的历史移动网络数据;若第四时段内的所述流量增长率与所述第四时段的前一相邻时段的流量增长率平均值之差大于预设增长率阈值,则删除所述第四时段内的历史移动网络数据。
[0119] 可选的,计算机程序被处理器601执行时还可实现如下步骤:确定各所述流量预测模型的初始权重;按照预设规则调整各所述流量预测模型的初始权重,得到各所述流量预测模型分别对应的权重;所述预设规则包括以下至少一项:若所述流量预测模型的输出结果不在预设流量范围内,则调整所述初始权重为0,作为所述流量预测模型对应的权重;若所述流量预测模型的输出结果在所述预设流量范围内、且与所述待预测时刻的实际流量数据的差值小于或等于第一阈值,则调整所述初始权重为1,作为所述流量预测模型对应的权重;若所述流量预测模型的输出结果在所述预设流量范围内、且与所述实际流量数据的差值小于或等于第二阈值,则增大所述初始权重,得到所述流量预测模型对应的权重;若所述流量预测模型的输出结果在所述预设流量范围内、且与所述实际流量数据的差值大于或等于第三阈值,则减小所述初始权重,得到所述流量预测模型对应的权重;其中,所述第一阈值小于所述第二阈值,所述第二阈值小于所述第三阈值。
[0120] 可选的,计算机程序被处理器601执行时还可实现如下步骤:将调整后的权重值进行归一化,得到各所述流量预测模型分别对应的权重。
[0121] 可选的,计算机程序被处理器601执行时还可实现如下步骤:根据所述流量数据分别确定核心网络和无线网络对应的平均增长率;根据所述核心网络和所述无线网络对应的平均增长率及所述流量增长率,计算所述核心网络在所述待预测时刻的预测流量以及所述无线网络在所述待预测时刻的预测流量;将所述核心网络在所述待预测时刻的预测流量、所述无线网络在所述待预测时刻的预测流量和所述网络侧的流量最大承载能力对应的流量中的最小值确定为所述第一流量预测模型的输出结果。
[0122] 可选的,计算机程序被处理器601执行时还可实现如下步骤:将所述目标业务渗透率输入预先建立的多元线性回归模型,得到所述第二流量预测模型的输出结果;所述多元线性回归模型基于历史时段的所述移动网络对应的流量数据和目标业务渗透率训练得到。
[0123] 可选的,计算机程序被处理器601执行时还可实现如下步骤:将所述用户数量、所述流量数据、所述目标业务渗透率和所述流量增长率输入预先训练的神经网络模型,得到所述第三流量预测模型的输出结果;
[0124] 所述神经网络模型以历史时段的所述移动网络的用户数量、所述移动网络对应的流量数据、目标业务渗透率、由指定类事件导致的流量增长率作为训练样本,以待预测时刻的流量数据作为所述训练样本的目标值训练得到。
[0125] 本发明实施例提供了一种移动网络流量预测设备,可以将目标时段内的历史移动网络数据输入流量预测模型,得到流量预测模型的输出结果,通过各流量预测模型的输出结果及对应的权重,可以计算得到待预测时刻的流量预测结果。该流量预测模型至少包括第一预测模型、第二预测模型和第三预测模型;其中,第一流量预测模型基于流量数据的平均增长率、流量增长率和网络侧的流量最大承载能力训练得到;第二流量预测模型基于目标业务渗透率训练得到;第三流量预测模型基于用户数量、流量数据、目标业务渗透率和流量增长率训练得到。由于将多种预测模型进行有效融合,充分发挥各预测模型的优势,有效提升了移动网络流量预测的准确性。
[0126] 优选的,本发明实施例还提供一种移动网络流量预测设备,包括处理器601,存储器603,存储在存储器603上并可在所述处理器601上运行的计算机程序,该计算机程序被处理器601执行时实现上述移动网络流量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0127] 本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述移动网络流量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read‑Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
[0128] 本发明实施例提供一种计算机可读存储介质,将多种预测模型进行有效融合,充分发挥各预测模型的优势,有效提升了移动网络流量预测的准确性。
[0129] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0130] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0131] 上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。