一种用户离网的预测方法及装置转让专利

申请号 : CN201810149676.5

文献号 : CN108377204B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周诗雨冉萌韩玉辉陈崴嵬刘喜卿包宸曦曹振

申请人 : 中国联合网络通信集团有限公司

摘要 :

本申请公开一种用户离网的预测方法及装置,涉及电信技术领域,用于预测用户的离网概率。该方法包括:获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据;根据用户的业务质量数据,确定第一概率,所述第一概率用于表征业务质量对于用户离网的影响程度;根据用户的离网代价数据,确定第二概率,所述第二概率用于表征离网代价对于用户离网的影响程度;根据用户的通信行为数据,确定第三概率,所述第三概率用于表征通信行为对于用户离网的影响程度;根据用户的消费行为数据,确定第四概率,所述第四概率用于表征消费行为对于用户离网的影响程度;根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。

权利要求 :

1.一种用户离网的预测方法,其特征在于,所述方法包括:

从运营商的运维系统中获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据;其中,所述业务质量数据包括:语音业务质量、视频业务质量以及数据业务质量;所述离网代价数据包括:在网时长、用户等级以及合约机剩余时间;所述通信行为数据包括:月均被叫号码数量、月均主叫号码数量、月均被叫次数以及月均主叫次数;所述消费行为数据包括:月均消费金额、月均通话时长、月均上网流量以及月均充值金额;

根据用户的业务质量数据,确定第一概率,所述第一概率用于表征业务质量对于用户离网的影响程度;

根据用户的离网代价数据,确定第二概率,所述第二概率用于表征离网代价对于用户离网的影响程度;

根据用户的通信行为数据,确定第三概率,所述第三概率用于表征通信行为对于用户离网的影响程度;

根据用户的消费行为数据,确定第四概率,所述第四概率用于表征消费行为对于用户离网的影响程度;

根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。

2.根据权利要求1所述的方法,其特征在于,所述根据用户的业务质量数据,确定第一概率,包括:

根据公式q1=a1k1+b1k2+c1k3,确定第一特征值;其中,q1表示第一特征值,k1表示语音业务质量,k2表示视频业务质量,k3表示数据业务质量,a1表示与语音业务质量对应的权重值,b1表示与视频业务质量对应的权重值,c1表示与数据业务质量对应的权重值,a1+b1+c1=1;

根据第一预设关系以及第一特征值,确定第一概率,所述第一预设关系包括:第一概率以及与所述第一概率对应的第一特征值;

所述根据用户的离网代价数据,确定第二概率,包括:

根据公式q2=a2m1+b2m2+c2m3,确定第二特征值;其中,q2表示第二特征值,m1表示在网时长,m2表示用户等级,m3表示合约机剩余时间,a2表示与在网时长对应的权重值,b2表示与用户等级对应的权重值,c2表示与合约机剩余时间对应的权重值,a2+b2+c2=1;

根据第二预设关系以及第二特征值,确定第二概率,所述第二预设关系包括:第二概率以及与所述第二概率对应的第二特征值;

所述根据用户的通信行为数据,确定第三概率,包括:

根据公式q3=a3L1+b3L2+c3L3+d3L4,确定第三特征值;其中,q3表示第三特征值,L1表示月均被叫号码数量,L2表示月均主叫号码数量,L3表示月均被叫次数,L4表示月均主叫次数,a3表示与月均被叫号码数量对应的权重值,b3表示与月均主叫号码数量对应的权重值,c3表示与月均被叫次数对应的权重值,d3表示与月均主叫次数对应的权重值,a3+b3+c3+d3=1;

根据第三预设关系以及第三特征值,确定第三概率,所述第三预设关系包括:第三概率以及与所述第三概率对应的第三特征值;

所述根据用户的消费行为数据,确定第四概率,包括:

根据公式q4=a4X1+b4X2+c4X3+d4X4,确定第四特征值;其中,q4表示第四特征值,X1表示月均消费金额,X2表示月均通话时长,X3表示月均上网流量,X4表示月均充值金额,a4表示与月均消费金额对应的权重值,b4表示与月均通话时长对应的权重值,c4表示与月均上网流量对应的权重值,d4表示与月均充值金额对应的权重值,a4+b4+c4+d4=1;

根据第四预设关系以及第四特征值,确定第四概率,所述第四预设关系包括:第四概率以及与所述第四概率对应的第四特征值。

3.根据权利要求1所述的方法,其特征在于,所述根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率,包括:根据公式f=w1p1+w2p2+w3p3+w4p4,确定用户的预测离网概率;

其中,f表示用户的预测离网概率,p1表示第一概率,p2表示第二概率,p3表示第三概率,p4表示第四概率,w1表示第一权重值,w2表示第二权重值,w3表示第三权重值,w4表示第四权重值,w1+w2+w3+w4=1。

4.根据权利要求3所述的方法,其特征在于,在所述获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据之前,所述方法还包括:构建偏离度函数,所述偏离度函数用于计算样本用户的实际离网概率与预测离网概率之间最小的偏差值;

以粒子群算法对用户离网概率偏离度函数求解,以确定第一权重值、第二权重值、第三权重值以及第四权重值的取值。

5.根据 权利 要求4 所述的 方法 ,其 特征 在于 ,所述 偏离 度函 数为 :

其中,F表示最小的偏差值,M表示样本用户的总数,fk表示第k个

样本用户的预测离网概率,pk表示第k个样本用户的实际离网概率。

6.一种用户离网的预测装置,其特征在于,所述装置包括:

获取模块,用于从运营商的运维系统中获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据;其中,所述业务质量数据包括:语音业务质量、视频业务质量以及数据业务质量;所述离网代价数据包括:在网时长、用户等级以及合约机剩余时间;所述通信行为数据包括:月均被叫号码数量、月均主叫号码数量、月均被叫次数以及月均主叫次数;所述消费行为数据包括:月均消费金额、月均通话时长、月均上网流量以及月均充值金额;

处理模块,用于根据用户的业务质量数据,确定第一概率,所述第一概率用于表征业务质量对于用户离网的影响程度;根据用户的离网代价数据,确定第二概率,第二概率用于表征离网代价对于用户离网的影响程度;根据用户的通信行为数据,确定第三概率,第三概率用于表征通信行为对于用户离网的影响程度;根据用户的消费行为数据,确定第四概率,所述第四概率用于表征消费行为对于用户离网的影响程度;根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。

7.根据权利要求6所述的装置,其特征在于,所述处理模块,用于根据公式q1=a1k1+b1k2+c1k3,确定第一特征值;其中,q1表示第一特征值,k1表示语音业务质量,k2表示视频业务质量,k3表示数据业务质量,a1表示与语音业务质量对应的权重值,b1表示与视频业务质量对应的权重值,c1表示与数据业务质量对应的权重值,a1+b1+c1=1;根据第一预设关系以及第一特征值,确定第一概率,所述第一预设关系包括:第一概率以及与所述第一概率对应的第一特征值;

根据公式q2=a2m1+b2m2+c2m3,确定第二特征值;其中,q2表示第二特征值,m1表示在网时长,m2表示用户等级,m3表示合约机剩余时间,a2表示与在网时长对应的权重值,b2表示与用户等级对应的权重值,c2表示与合约机剩余时间对应的权重值,a2+b2+c2=1;根据第二预设关系以及第二特征值,确定第二概率,所述第二预设关系包括:第二概率以及与所述第二概率对应的第二特征值;

根据公式q3=a3L1+b3L2+c3L3+d3L4,确定第三特征值;其中,q3表示第三特征值,L1表示月均被叫号码数量,L2表示月均主叫号码数量,L3表示月均被叫次数,L4表示月均主叫次数,a3表示与月均被叫号码数量对应的权重值,b3表示与月均主叫号码数量对应的权重值,c3表示与月均被叫次数对应的权重值,d3表示与月均主叫次数对应的权重值,a3+b3+c3+d3=1;根据第三预设关系以及第三特征值,确定第三概率,所述第三预设关系包括:第三概率以及与所述第三概率对应的第三特征值;

根据公式q4=a4X1+b4X2+c4X3+d4X4,确定第四特征值;其中,q4表示第四特征值,X1表示月均消费金额,X2表示月均通话时长,X3表示月均上网流量,X4表示月均充值金额,a4表示与月均消费金额对应的权重值,b4表示与月均通话时长对应的权重值,c4表示与月均上网流量对应的权重值,d4表示与月均充值金额对应的权重值,a4+b4+c4+d4=1;根据第四预设关系以及第四特征值,确定第四概率,所述第四预设关系包括:第四概率以及与所述第四概率对应的第四特征值。

8.根据权利要求6所述的装置,其特征在于,所述处理模块,用于根据公式f=w1p1+w2p2+w3p3+w4p4,确定用户的预测离网概率;其中,f表示用户的预测离网概率,p1表示第一概率,p2表示第二概率,p3表示第三概率,p4表示第四概率,w1表示第一权重值,w2表示第二权重值,w3表示第三权重值,w4表示第四权重值,w1+w2+w3+w4=1。

9.根据权利要求8所述的装置,其特征在于,所述处理模块,用于构建偏离度函数,所述偏离度函数用于计算样本用户的实际离网概率与预测离网概率之间最小的偏差值;以粒子群算法对用户离网概率偏离度函数求解,以确定第一权重值、第二权重值、第三权重值以及第四权重值的取值。

10.根据权 利要求9所述的 装置 ,其 特征在于 ,所述偏离 度函数为 :

其中,F表示最小的偏差值,M表示样本用户的总数,fk表示第k个

样本用户的预测离网概率,pk表示第k个样本用户的实际离网概率。

说明书 :

一种用户离网的预测方法及装置

技术领域

[0001] 本申请涉及电信技术领域,尤其涉及一种用户离网的预测方法及装置。

背景技术

[0002] 目前,随着智能终端的普及,越来越多的人们会成为电信运营商的用户。对于用户来说,用户可根据自身的需求选择电信运营商。但是,由于用户的需求在不断变化,因此某个电信运营商的用户可能会放弃原本选择的电信运营商,这种现象称为用户离网。
[0003] 由于用户是电信运营商的业务基础和收入的根本来源,因此用户离网会导致电信运营商利润下降。因此,如何预测用户的离网概率,以便于对即将离网的用户采取必要的挽留措施,是运营商亟待解决的问题。

发明内容

[0004] 本申请提供一种用户离网的预测方法及装置,用于对用户的离网概率进行预测。
[0005] 为达到上述目的,本申请采用如下技术方案:
[0006] 第一方面,本申请提供一种用户离网的预测方法,所述方法包括:
[0007] 获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据;其中,所述业务质量数据包括:语音业务质量、视频业务质量以及数据业务质量;所述离网代价数据包括:在网时长、用户等级以及合约机剩余时间;所述通信行为数据包括:月均被叫号码数量、月均主叫号码数量、月均被叫次数以及月均主叫次数;所述消费行为数据包括:月均消费金额、月均通话时长、月均上网流量以及月均充值金额;
[0008] 根据用户的业务质量数据,确定第一概率,所述第一概率用于表征业务质量对于用户离网的影响程度;
[0009] 根据用户的离网代价数据,确定第二概率,第二概率用于表征离网代价对于用户离网的影响程度;
[0010] 根据用户的通信行为数据,确定第三概率,第三概率用于表征通信行为对于用户离网的影响程度;
[0011] 根据用户的消费行为数据,确定第四概率,所述第四概率用于表征消费行为对于用户离网的影响程度;
[0012] 根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。
[0013] 采用上述技术方案,根据用户的各类数据,从多个维度来确定用户的预测离网概率,从而保证用户的预测离网概率的准确性。
[0014] 第二方面,本申请提供一种用户离网的预测装置,所述装置包括:
[0015] 获取模块,用于获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据;其中,所述业务质量数据包括:语音业务质量、视频业务质量以及数据业务质量;所述离网代价数据包括:在网时长、用户等级以及合约机剩余时间;所述通信行为数据包括:月均被叫号码数量、月均主叫号码数量、月均被叫次数以及月均主叫次数;所述消费行为数据包括:月均消费金额、月均通话时长、月均上网流量以及月均充值金额;
[0016] 处理模块,用于根据用户的业务质量数据,确定第一概率,所述第一概率用于表征业务质量对于用户离网的影响程度;根据用户的离网代价数据,确定第二概率,第二概率用于表征离网代价对于用户离网的影响程度;根据用户的通信行为数据,确定第三概率,第三概率用于表征通信行为对于用户离网的影响程度;根据用户的消费行为数据,确定第四概率,所述第四概率用于表征消费行为对于用户离网的影响程度;根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。
[0017] 第三方面,本申请提供一种计算机设备,所述计算机设备包括:处理器、收发器和存储器。其中,存储器存储有一个或多个程序,一个或多个程序包括计算机可执行指令,当该计算机设备运行时,处理器执行该存储器存储的该计算机可执行指令,以使该计算机设备执行第一方面及其各种可选的实现方式中任意之一所述的评估小区覆盖有效性的方法。
[0018] 第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当该计算机设备执行该指令时,该计算机设备执行上述第一方面及其各种可选的实现方式中任意之一所述的评估小区覆盖有效性的方法。
[0019] 其中,上述第二方面至第四方面对应的有益效果,可参见第一方面的相关描述,在此不再赘述。

附图说明

[0020] 图1为本申请实施例提供的一种用户离网的预测方法的流程图;
[0021] 图2为本申请实施例提供的一种确定权重值的方法的流程图;
[0022] 图3为本申请实施例提供的一种用户离网的预测装置的结构示意图;
[0023] 图4为本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

[0024] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0025] 如图1所示,本申请实施例提供一种用户离网的预测方法,所述方法的执行主体是计算机设备。所述方法包括:
[0026] 101、获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据。
[0027] 其中,所述业务质量数据包括:语音业务质量、视频业务质量以及数据业务质量。所述离网代价数据包括:在网时长、用户等级以及合约机剩余时间。所述通信行为数据包括:月均被叫号码数量、月均主叫号码数量、月均被叫次数以及月均主叫次数。所述消费行为数据包括:月均消费金额、月均通话时长、月均上网流量以及月均充值金额。
[0028] 需要说明的是,上述数据可以从运营商的运维系统中获取。
[0029] 102、根据用户的业务质量数据,确定第一概率。
[0030] 其中,所述第一概率用于表征业务质量对于用户离网的影响程度。
[0031] 一种可选的实现方式中,根据公式q1=a1k1+b1k2+c1k3,确定第一特征值。其中,q1表示第一特征值,k1表示语音业务质量,k2表示视频业务质量,k3表示数据业务质量,a1表示与语音业务质量对应的权重值,b1表示与视频业务质量对应的权重值,c1表示与数据业务质量对应的权重值,a1+b1+c1=1。然后,根据第一预设关系以及第一特征值,确定第一概率,所述第一预设关系包括:第一概率以及与所述第一概率对应的第一特征值。
[0032] 示例性的,第一预设关系为: 其中P1表示第一概率,x表示第一特征值。
[0033] 103、根据用户的离网代价数据,确定第二概率。
[0034] 其中,所述第二概率用于表征离网代价对于用户离网的影响程度。
[0035] 由于在网时长、用户等级、合约机剩余时间这三种数据在单位上不统一,因此在确定第二概率之前,先对上述三种数据分别进行归一化处理。
[0036] 可选的,以公式y=(x-MinValue)/(Maxvalue-Minvalue)来对数据进行归一化处理。其中,y表示归一化处理后的数据,x表示归一化处理前的数据,MinValue表示预设的最小值,MaxValue表示预设的最大值。
[0037] 一种可选的实现方式中,根据公式q2=a2m1+b2m2+c2m3,确定第二特征值。其中,q2表示第二特征值,m1表示在网时长,m2表示用户等级,m3表示合约机剩余时间,a2表示与在网时长对应的权重值,b2表示与用户等级对应的权重值,c2表示与合约机剩余时间对应的权重值,a2+b2+c2=1。然后,根据第二预设关系以及第二特征值,确定第二概率,所述第二预设关系包括:第二概率以及与所述第二概率对应的第二特征值。
[0038] 104、根据用户的通信行为数据,确定第三概率。
[0039] 其中,所述第三概率用于表征通信行为对于用户离网的影响程度。
[0040] 可选的,在确定第三概率之前,先对月均消费金额、月均通话时长、月均上网流量以及月均充值金额这四种数据分别进行归一化处理。
[0041] 一种可选的实现方式中,根据公式q3=a3L1+b3L2+c3L3+d3L4,确定第三特征值;其中,q3表示第三特征值,L1表示月均被叫号码数量,L2表示月均主叫号码数量,L3表示月均被叫次数,L4表示月均主叫次数,a3表示与月均被叫号码数量对应的权重值,b3表示与月均主叫号码数量对应的权重值,c3表示与月均被叫次数对应的权重值,d3表示与月均主叫次数对应的权重值,
[0042] a3+b3+c3+d3=1。然后,根据第三预设关系以及第三特征值,确定第三概率,所述第三预设关系包括:第三概率以及与所述第三概率对应的第三特征值。
[0043] 105、根据用户的消费行为数据,确定第四概率。
[0044] 其中,所述第四概率用于表征消费行为对于用户离网的影响程度。
[0045] 一种可选的实现方式中,根据公式q4=a4X1+b4X2+c4X3+d4X4,确定第三特征值;其中,q4表示第四特征值,X1表示月均消费金额,X2表示月均通话时长,X3表示月均上网流量,X4表示月均充值金额,a4表示与月均消费金额对应的权重值,b4表示与月均通话时长对应的权重值,c4表示与月均上网流量对应的权重值,d4表示与月均充值金额对应的权重值,a4+b4+c4+d4=1。然后,根据第四预设关系以及第四特征值,确定第四概率,所述第四预设关系包括:第四概率以及与所述第四概率对应的第四特征值。
[0046] 106、根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。
[0047] 一种可选的实现方式中,根据公式f=w1p1+w2p2+w3p3+w4p4,确定用户的预测离网概率。其中,f表示用户的预测离网概率,p1表示第一概率,p2表示第二概率,p3表示第三概率,p4表示第四概率,w1表示第一权重值,w2表示第二权重值,w3表示第三权重值,w4表示第四权重值,w1+w2+w3+w4=1。
[0048] 可选的,若用户的预测离网概率大于预设阀值,则对所述用户采取挽留措施。
[0049] 或者,根据用户的月均消费金额对用户进行分类,将月均消费金额大于预设金额的用户确定为高价值用户。若高价值用户的预测离网概率大于预设阀值,则对所述高价值用户采用针对性的挽留措施。
[0050] 为了保证预测离网概率的准确性,第一权重值、第二权重值、第三权重值以及第四权重值需要具有合理的取值。因此,如图2所示,本申请实施例提供一种确定权重值的方法,包括:
[0051] 201、构建偏离度函数。
[0052] 其中,所述偏离度函数用于计算样本用户的实际离网概率与预测离网概率之间最小的偏差值。
[0053] 其中,实际离网概率为:0或1。0表示用户已离网,1表示用户未离网。
[0054] 上述偏离度函数为:
[0055] 其中,F表示最小的偏差值,M表示样本用户的总数,pk表示第k个样本用户的实际离网概率,fk表示第k个样本用户的预测离网概率。
[0056] fk=w1p1,k+w2p2,k+w3p3,k+w4p4,k。其中,根据p1,k表示第k个样本用户的第一概率,p2,k表示第k个样本用户的第二概率,p3,k表示第k个样本用户的第三概率,p4,k表示第k个样本用户的第四概率,w1表示第一权重值,w2表示第二权重值,w3表示第三权重值,w4表示第四权重值,w1+w2+w3+w4=1。值得说明的是,上述w1、w2、w3、w4的取值均未确定。
[0057] 202、以粒子群算法对用户离网概率偏离度函数求解,以确定第一权重值、第二权重值、第三权重值以及第四权重值的取值。
[0058] 其中,粒子群算法如下:
[0059] 设定V表示四维搜索空间,M表示V中粒子的数量,在V中粒子的位置xi、速度vi可用如下公式表示:
[0060] xi=(xi1,xi2,xi3,xi4)=(w1,w2,w3,w4)
[0061] vi=(vi1,vi2,vi3,vi4)
[0062] i=1,2,3,......,M
[0063] 粒子的位置和速率按照以下公式更新
[0064]
[0065]
[0066] 其中,w1表示第一权重值,w2表示第二权重值,w3表示第三权重值,w4表示第四权重值, 表示第k+1次更新后第i个粒子的速度, 表示第k次更新后第i个粒子的速度,表示第k+1次更新后第i个粒子的位置, 表示第k次更新后第i个粒子的位置,α表示惯性权重值,c1、c2表示学习参数,r1、r2为取值范围在[0,1]之间的随机数, 表示第k次更新后第i个粒子搜索到的最优值, 表示第k次更新后整个粒子集群搜索到的最优值。
[0067] 以粒子群算法对上述偏离度函数求解的过程如下:
[0068] S1、初始化粒子群中各个粒子的位置。
[0069] S2、根据每个粒子的位置,计算每个粒子的适应值。
[0070] 这里,所述适应值为根据粒子的位置确定出来的偏离度函数的解。
[0071] S3、根据适应值确定 以根据公式(1)、(2)更新粒子的速度和位置。
[0072] 其中, 为第i个粒子历次计算出的适应值中的最优值对应的位置, 所有粒子历次计算出的适应值中的最优值对应的位置。
[0073] S4、重复步骤S2、S3,直至计算出偏离度函数的最优解。
[0074] 从而,根据偏离度函数的最优解对应的粒子位置,确定出第一权重值、第二权重值、第三权重值以及第四权重值的取值。
[0075] 本申请实施例可以根据上述方法示例对计算机设备进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0076] 如图3所示,本申请实施例提供一种用户离网的预测装置,所述装置包括:
[0077] 获取模块11,用于获取用户的业务质量数据、离网代价数据、通信行为数据以及消费行为数据;其中,所述业务质量数据包括:语音业务质量、视频业务质量以及数据业务质量;所述离网代价数据包括:在网时长、用户等级以及合约机剩余时间;所述通信行为数据包括:月均被叫号码数量、月均主叫号码数量、月均被叫次数以及月均主叫次数;所述消费行为数据包括:月均消费金额、月均通话时长、月均上网流量以及月均充值金额。
[0078] 处理模块12,用于根据用户的业务质量数据,确定第一概率,所述第一概率用于表征业务质量对于用户离网的影响程度;根据用户的离网代价数据,确定第二概率,第二概率用于表征离网代价对于用户离网的影响程度;根据用户的通信行为数据,确定第三概率,第三概率用于表征通信行为对于用户离网的影响程度;根据用户的消费行为数据,确定第四概率,所述第四概率用于表征消费行为对于用户离网的影响程度;根据第一概率、第二概率、第三概率以及第四概率,确定用户的预测离网概率。
[0079] 一种可选的实现方式中,所述处理模块12,用于根据公式q1=a1k1+b1k2+c1k3,确定第一特征值;其中,q1表示第一特征值,k1表示语音业务质量,k2表示视频业务质量,k3表示数据业务质量,a1表示与语音业务质量对应的权重值,b1表示与视频业务质量对应的权重值,c1表示与数据业务质量对应的权重值,a1+b1+c1=1;根据第一预设关系以及第一特征值,确定第一概率,所述第一预设关系包括:第一概率以及与所述第一概率对应的第一特征值。
[0080] 一种可选的实现方式中,所述处理模块12,用于根据公式q2=a2m1+b2m2+c2m3,确定第二特征值;其中,q2表示第二特征值,m1表示在网时长,m2表示用户等级,m3表示合约机剩余时间,a2表示与在网时长对应的权重值,b2表示与用户等级对应的权重值,c2表示与合约机剩余时间对应的权重值,a2+b2+c2=1;根据第二预设关系以及第二特征值,确定第二概率,所述第二预设关系包括:第二概率以及与所述第二概率对应的第二特征值。
[0081] 一种可选的实现方式中,所述处理模块12,用于根据公式q3=a3L1+b3L2+c3L3+d3L4,确定第三特征值;其中,q3表示第三特征值,L1表示月均被叫号码数量,L2表示月均主叫号码数量,L3表示月均被叫次数,L4表示月均主叫次数,a3表示与月均被叫号码数量对应的权重值,b3表示与月均主叫号码数量对应的权重值,c3表示与月均被叫次数对应的权重值,d3表示与月均主叫次数对应的权重值,a3+b3+c3+d3=1;根据第三预设关系以及第三特征值,确定第三概率,所述第三预设关系包括:第三概率以及与所述第三概率对应的第三特征值。
[0082] 一种可选的实现方式中,所述处理模块12,用于根据公式q4=a4X1+b4X2+c4X3+d4X4,确定第四特征值;其中,q4表示第四特征值,X1表示月均消费金额,X2表示月均通话时长,X3表示月均上网流量,X4表示月均充值金额,a4表示与月均消费金额对应的权重值,b4表示与月均通话时长对应的权重值,c4表示与月均上网流量对应的权重值,d4表示与月均充值金额对应的权重值,a4+b4+c4+d4=1;根据第四预设关系以及第四特征值,确定第四概率,所述第四预设关系包括:第四概率以及与所述第四概率对应的第四特征值。
[0083] 一种可选的实现方式中,所述处理模块12,用于根据公式f=w1p1+w2p2+w3p3+w4p4,确定用户的离网概率;其中,f表示用户的预测离网概率,p1表示第一概率,p2表示第二概率,p3表示第三概率,p4表示第四概率,w1表示第一权重值,w2表示第二权重值,w3表示第三权重值,w4表示第四权重值,w1+w2+w3+w4=1。
[0084] 一种可选的实现方式中,所述处理模块12,用于构建偏离度函数,所述偏离度函数用于计算样本用户的实际离网概率与预测离网概率之间最小的偏差值;以粒子群算法对用户离网概率偏离度函数求解,以确定第一权重值、第二权重值、第三权重值以及第四权重值的取值。
[0085] 其中,所述偏离度函数为: 其中,F表示最小的偏差值,M表示样本用户的总数,fk表示第k个样本用户的预测离网概率,pk表示第k个样本用户的实际离网概率。
[0086] 在采用集成的单元的情况下,图4示出了上述实施例中所涉及的计算机设备的一种可能的结构示意图。所述计算机设备包括:处理单元21。所述处理单元21用于执行上述处理模块12执行的步骤,和/或用于执行本文所描述的技术的其它过程。所述计算机设备还可以包括通信单元22、存储单元23和总线24。其中,通信单元22用于执行上述获取模块11执行的步骤,所述通信单元22还用于支持计算机设备与其他设备的通信。存储单元23用于存储计算机设备的程序代码和数据。
[0087] 其中,上述处理单元21可以是计算机设备中的处理器或控制器,该处理器或控制器可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器或控制器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合等。
[0088] 通信单元22可以是计算机设备中的收发器、收发电路或系统接口等。
[0089] 存储单元23可以是计算机设备中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
[0090] 总线24可以是扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。总线24可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0091] 本说明书中的各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
[0092] 本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序加载到计算机上被计算机执行时,使计算机执行上述用户离网的预测方法。
[0093] 其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0094] 以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。