价值预测模型输入数据生成方法、装置、设备和介质转让专利
申请号 : CN202110531498.4
文献号 : CN112990989B
文献日 : 2021-07-30
发明人 : 刘志伟
申请人 : 太平金融科技服务(上海)有限公司深圳分公司
摘要 :
权利要求 :
1.一种价值预测模型输入数据生成方法,其特征在于,所述方法包括:获取目标用户对应的目标历史业务数据;
从所述目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值;
当存在未提取到目标特征值的目标特征时,将未提取到所述目标特征值的目标特征作为缺失特征,并获取与所述目标用户对应的相似用户以及所述目标用户与所述相似用户的相似度;所述相似用户与所述目标用户具有相似交易行为;
从所述相似用户对应的相似业务数据中提取与所述缺失特征对应的相似特征值,包括:从所述相似用户对应的所述相似业务数据中,提取预设的各所述目标特征分别对应的相似特征值;根据各所述相似特征值确定相似特征均值;
根据所述相似用户的相似度以及所述相似特征值,计算得到所述缺失特征对应的缺失特征值,包括:根据所述目标历史业务数据中各正常特征分别对应的正常特征值,确定正常特征均值;根据所述相似用户的相似度,确定对应相似用户的权重;根据各所述相似用户分别对应的所述相似特征均值、所述相似特征值以及所述权重,确定各所述相似用户对应的相似调整值;根据所述正常特征均值以及各所述相似用户分别对应的相似调整值,计算得到所述缺失特征对应的缺失特征值;
根据计算得到的所述缺失特征值,及提取到的所述目标特征值得到价值预测模型输入数据。
2.根据权利要求1所述的价值预测模型输入数据生成方法,其特征在于,将从所述目标历史业务数据中提取到目标特征值的目标特征作为正常特征;所述获取与所述目标用户对应的相似用户以及所述目标用户与所述相似用户的相似度,包括:根据所述相似特征均值以及各所述目标特征对应的所述相似特征值,确定各所述目标特征的相似差值;
根据所述正常特征均值以及各所述正常特征对应的所述正常特征值,确定各所述正常特征的目标差值;
根据各所述目标特征对应的所述相似差值以及所述目标差值,确定所述目标用户与所述相似用户的相似度。
3.根据权利要求1或2任意一项所述的价值预测模型输入数据生成方法,其特征在于,所述方法还包括:
对所述目标历史业务数据进行预处理;所述预处理包括数据校验、数据清洗以及数据归一化中的至少一种。
4.一种用户价值预测方法,其特征在于,所述方法包括:根据权利要求1至3中任意一项所述的价值预测模型输入数据生成方法获取模型输入数据;
将所述模型输入数据输入至预先构建的价值预测模型中,根据所述价值预测模型得到所述目标用户在未来时间段内的预测价值;其中,所述价值预测模型是根据训练特征以及训练价值构建的,且所述训练特征以及所述训练价值是从多于一个的用户分别对应的历史业务数据中得到的。
5.根据权利要求4所述的用户价值预测方法,其特征在于,所述价值预测模型的构建方法,包括:
获取多于一个的用户分别对应的历史业务数据;
分别从各所述历史业务数据中提取训练特征;
从所述训练特征中提取价值计算特征;
获取各所述价值计算特征的特征权重;
根据所述特征权重以及所述价值计算特征确定各所述用户的训练价值;
根据所述训练特征以及所述训练价值训练预测模型,当满足训练结束条件时,停止预测模型的训练得到价值预测模型。
6.一种用户请求处理方法,其特征在于,所述方法包括:接收用户请求,所述用户请求携带有用户数据;
通过权利要求4至5任意一项所述的用户价值预测方法对所述用户数据进行处理,得到用户价值;
获取与所述用户价值对应的服务策略;
根据所述服务策略对所述用户请求进行处理。
7.一种价值预测模型输入数据生成装置,其特征在于,所述装置包括:获取模块,用于获取目标用户对应的目标历史业务数据;
提取模块,用于从所述目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值;
相似获取模块,用于当存在未提取到目标特征值的目标特征时,将未提取到所述目标特征值的目标特征作为缺失特征,并获取与所述目标用户对应的相似用户以及所述目标用户与所述相似用户的相似度;所述相似用户与所述目标用户具有相似交易行为;
相似数据提取模块,用于从所述相似用户对应的相似业务数据中提取与所述缺失特征对应的相似特征值,包括:从所述相似用户对应的所述相似业务数据中,提取预设的各所述目标特征分别对应的相似特征值;根据各所述相似特征值确定相似特征均值;
计算模块,用于根据所述相似用户的相似度以及所述相似特征值,计算得到所述缺失特征对应的缺失特征值,包括:根据所述目标历史业务数据中各正常特征分别对应的正常特征值,确定正常特征均值;根据所述相似用户的相似度,确定对应相似用户的权重;根据各所述相似用户分别对应的所述相似特征均值、所述相似特征值以及所述权重,确定各所述相似用户对应的相似调整值;根据所述正常特征均值以及各所述相似用户分别对应的相似调整值,计算得到所述缺失特征对应的缺失特征值;
生成模块,用于根据计算得到的所述缺失特征值,及提取到的所述目标特征值得到价值预测模型输入数据。
8.根据权利要求7所述的装置,其特征在于,所述相似获取模块还用于根据所述相似特征均值以及各所述目标特征对应的所述相似特征值,确定各所述目标特征的相似差值;根据所述正常特征均值以及各所述正常特征对应的所述正常特征值,确定各所述正常特征的目标差值;根据各所述目标特征对应的所述相似差值以及所述目标差值,确定所述目标用户与所述相似用户的相似度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
说明书 :
价值预测模型输入数据生成方法、装置、设备和介质
技术领域
背景技术
据变得越来越重要。
的业务活动,提高业务执行效率。
预测到的用户价值级别不准确。
发明内容
的,且训练特征以及训练价值是从多于一个的用户分别对应的历史业务数据中得到的。
用户的相似度;
征值后还判断是否存在未提取到目标特征值的目标特征(即各目标特征对应的目标特征值
是否存在缺失值),实现了在进行用户价值预测之前对目标历史业务数据的准确性进行判
断。并且当存在未提取到目标特征值的目标特征时(即存在目标特征对应的目标特征值为
缺失值时),将未提取到目标特征值的目标特征作为缺失特征。然后获取与目标用户对应的
相似用户,以及各相似用户对应的相似业务数据,以根据相似业务数据以及各相似用户与
目标用户的相似度对目标业务数据中的缺失特征的缺失特征值进行补全,进而实现了对目
标历史业务数据的补全,提高了目标历史业务数据的准确性。
附图说明
具体实施方式
用于限定本申请。
对应的目标历史业务数据;从目标历史业务数据中提取预设的多个目标特征分别对应的目
标特征值;当存在未提取到目标特征值的目标特征时,将未提取到目标特征值的目标特征
作为缺失特征,并获取与目标用户对应的相似用户以及目标用户与相似用户的相似度;从
相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值;根据相似用户的相似
度以及相似特征值,计算得到缺失特征对应的缺失特征值;根据计算得到的缺失特征值,及
提取到的目标特征值得到价值预测模型输入数据。其中,终端102可以但不限于是各种个人
计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服
务器或者是多个服务器组成的服务器集群来实现。
终端102,方法包括以下步骤:
户的历史交易数据、目标用户的历史行为信息等。可以理解,用户属性信息可以为目标用户
的姓名、性别以及所在目标用户所在的地理位置等。目标用户的历史交易数据可以为目标
用户在交易过程中产生的交易流水,如目标用户购买的产品、购买产品的频率、购买产品的
价格等。目标用户的行为信息可以为用户在交易场景中或者在其他非交易场景中的行为,
如目标用户的交易是否成功的行为等。
合后续的数据处理要求,并提高对数据处理的准确度。以及服务器还可以对爬取到的目标
历史业务数据进行归一化处理,以使得不同维度的数据之间能够进行数据计算。
频率、连续购买年限、保费、利润、房产价值、车辆价值、月收入以及保费收入占比等。目标特
征值是各目标特征对应的具体数值。并且,目标特征可以是预先设定的特征。
度。
标用户的房产价值,故而服务器无法从目标历史业务数据中提取到的房产价值的目标特征
值。
中提取到预先确定的所有的目标特征对应的目标特征值时,说明目标历史业务数据为合格
的数据,根据目标历史业务数据就可以执行对目标用户价值的预测步骤。当不能成功从目
标历史业务数据中提取到预先确定的所有的目标特征对应的目标特征值时,说明目标历史
业务数据为不合格的数据,即目标历史业务数据中缺失部分的数据,此时若根据缺失部分
数据的目标历史业务数据预测到的目标用户的价值存在不准确的弊端。
征。具体地,将无法从目标历史业务数据中提取到目标特征值的目标特征作为缺失特征,将
能够提取到目标特征值的目标特征作为正常特征。当服务器判定目标特征中存在缺失特征
时,说明目标历史业务数据中缺失用于表征用户缺失特征的数据。从目标历史业务数据中
提取多于一个的目标特征对应的目标特征值之后,还包括:当服务器判定目标特征中存在
缺失特征时,获取目标用户对应的相似用户,以及相似用户对应的相似业务数据。从相似业
务数据中提取与缺失特征对应的相似数据,根据相似数据确定缺失特征对应的缺失特征
值。
似的相似用户,以根据相似用户的相似业务数据对目标用户的缺失特征值进行估计。需要
说明的是,相似用户的数量可以为一个或者多个,在此不作限制。
对应的相似特征值,然后利用相似特征值对缺失特征的缺失特征值进行补充,以实现可以
获取缺失特征的缺失特征值。
特征值,计算得到缺失特征对应的缺失特征值。
没有获取到,或者通过具体的业务情景收集到用户其他方面的数据,但是得到的用户数据
是一个稀疏矩阵,在很多情况下收集到的目标用户的目标历史业务数据并不是很全面的。
并且将稀疏矩阵输入随机森林预测模型中预测用户价值时,会影响模型的精准度。故而在
本实施例中可以通过与目标用户相似的相似用户的数据对目标用户缺失的数据进行补全。
具体地,可以根据相关系数来对目标用户的未知数据进行权重投票,对稀疏矩阵进行填充,
如可以通过局部矩阵投票补全目标历史业务数据。
征值后还判断是否存在未提取到目标特征值的目标特征(即各目标特征对应的目标特征值
是否存在缺失值),实现了在进行用户价值预测之前对目标历史业务数据的准确性进行判
断。并且当存在未提取到目标特征值的目标特征时(即存在目标特征对应的目标特征值为
缺失值时),将未提取到目标特征值的目标特征作为缺失特征。然后获取与目标用户对应的
相似用户,以及各相似用户对应的相似业务数据,以根据相似业务数据以及各相似用户与
目标用户的相似度对目标业务数据中的缺失特征的缺失特征值进行补全,进而实现了对目
标历史业务数据的补全,提高了目标历史业务数据的准确性。
用户对应的相似业务数据中,提取预设的各目标特征分别对应的相似特征值。根据各相似
特征值确定相似特征均值,根据目标历史业务数据中各正常特征分别对应的正常特征值,
确定正常特征均值。根据相似特征均值以及各目标特征对应的相似特征值,确定各目标特
征的相似差值;根据目标特征均值以及各目标特征对应的目标特征值,确定各目标特征的
目标差值;根据各目标特征对应的相似差值以及目标差值,确定目标用户与相似用户的相
似度。
为一个i*j列的矩阵,其中 为相似用户i在目标特征j上对应的相似特征值。那么相似用
户i对应得相似特征均值可用如下公式(1)计算。
值 以及各目标特征对应的相似特征值 ,确定各目标特征的相似差值 。根据
目标特征均值 以及各目标特征对应的目标特征值 ,确定各目标特征的目标差值
。最后根据各目标特征对应的相似差值以及目标差值,确定目标用户与相似用户
的相似度,具体的,目标用户a与相似用户i的相似度 计算公式如式(2)所示。
度越高,也就是说,该相似用户对目标用户的缺失特征值进行评分时,其对应的权重也越
高。
度,确定各相似用户对应的相似调整值;根据正常特征均值以及各相似用户分别对应的相
似调整值,计算得到缺失特征对应的缺失特征值。
测值 ,等于目标用户a的已知信息对应的正常特征的正常特征均值,加上n个相似用户
的相似值乘以该相似用户的目标特征值与对应相似用户的相似特均值的差值。具体的计算
过程如公式(3)所示。
与目标用户的相似度对目标用户的缺失特征值进行投票,来补充目标用户的矩阵信息,使
一个稀疏矩阵变成了密集矩阵,提升了后续根据价值预测模型预测用户价值的准确性。
数据输入错误,不同来源数据引起的不同表示法,数据间的不一致等,导致现有的数据中存
在这样或那样的脏数据,主要表现为:不合法值、录入不规范、不一致值以及数据重复等。数
据清洗的作用包括去除不需要字段,或者格式内容清洗,或者填充空缺值,或者逻辑错误清
洗,或者数据真实性验证等。
区段验证等,清洗出有真实有效的数据。在一个实施例中,数据清洗包括:1、对身份证号校
验,具体地要求身份证号码的长度为15位或18位,要求身份证号码需要符合地区编码验证,
要求身份证号码需要符合身份证日期验证,要求身份证号码需要符合身份证校验位判断,
并且要求身份证号码不包含‘0000’等异常号。当判定身份证码不满意以上任何一个要求
时,就将身份证号码置空。2、若用户与外勤人员将身份证号或手机号置为相同数值的,也将
身份证号或手机号置空。3、姓名中只保留纯中文、纯字母和空格,将中英混合的数据剔除。
4、手机号长度不等于11位的,非常规手机号,根据给出的规则进行校验,或号码包含
‘000000’等非常规号,置空。5、姓名长度大于或等于3位,且含有“等人”字样,剔除。7、超过3
位不同客户使用相同的身份证号与手机号,剔除。8、姓名含有“公司”,剔除。
新值。当字段为空值‘’或null时,将其置换为字符串‘null’。而符合规则的值保持不变,最
终每一条原始记录数据都将按照上述数据清洗规则,形成一条对应的新的数据记录,若该
行数据有效,则进入下一步的ID打通,否则,将会被过滤。b、空值校验,判断字段值是否为空
值,如是,则将字符串’null’给字段默认值。c、Null值校验,判断字段值是否为null值,如
是,则将字符串’null’给字段默认值。d、身份证号校验,判断身份证号是否是合法,地区编
码验证是否有效,身份证日期验证是否有效,身份证值最后一位判断,身份证长度判断。具
体包括:当身份证的省份编码不正确,置空;当身份证的正则表达式判断不正确,置空;当身
份证的校验位不正确,置空;当身份证包含“0000”,置空。
机号不以1开头,置空;当手机号包含“000000”,置空;当手机号包含“11111111”,置空;当手
机号包含“22222222”,置空;当手机号包含“33333333”,置空;当手机号包含“44444444”,置
空;当手机号包含“55555555”,置空;当手机号包含“66666666”,置空;当手机号包含
“77777777”,置空;当手机号包含“88888888”,置空;当手机号包含“99999999”,置空;当手
机号包含“23456789”,置空;当手机号包含“12345678”,置空;当手机号包含“01234567”,置
空;当手机号包含“34567890”,置空;当手机号包含“456789”,置空;当手机号包含
“1380013800”,置空。
供信息的不同,也可能被认为是两个客户。在对客户价值进行分析时,要求能够收集到该客
户在所有系统,所有时间段内的数据,需要进行ID归一化,将客户ID打通。具体地,数据打通
规则包括:在服务器中获取用户基础信息数据汇总表,并为用户生成新的用户ID作为用户
的唯一标识,放在第一个字段位置存到汇总表里, 一个客户ID对应多条记录数据,但一条
记录仅属于一个客户ID。
数据存到hive数据仓库中。具体地,目前作为标识用户的规则如下:姓名前两位 + 证件号
码,确定一个用户;姓名 + 手机号,确定一个用户;证件号码 + 手机号,确定一个用户;姓
名+ 银行卡号,确定一个用户;姓名 + 微信号 确定一个用户;手机号 + 银行卡号 确定一
个用户;手机号 + 微信号,确定一个用户;姓名 + 设备ID,确定一个用户;手机号 + 设备
ID,确定一个用户等。在此不作限制。
价值构建的,且训练特征以及训练价值是从多于一个的用户分别对应的历史业务数据中得
到的。
以及根据训练特征确定训练价值,以根据训练特征以及训练价值训练模型,得到价值预测
模型。可以理解,价值预测模型可以为决策树模型、随机森林模型、回归模型或则机器学习
模型等,在此不作限制。
练价值可用于计算用户的训练价值。
各目标特征对应的目标特征值是否存在缺失值,实现了在进行用户价值预测之前对目标历
史业务数据的准确性进行判断。并且只有当判定各目标特征对应的目标特征值都不存在缺
失值时,才执行将精准的目标特征值输入至预先构建的价值预测模型中,根据价值预测模
型得到目标用户在未来时间段内的预测价值,提高了目标用户的价值预测的准确性。其中,
价值预测模型是根据训练特征以及训练价值构建的,且训练特征以及训练价值是从多于一
个的用户分别对应的历史业务数据中得到的。在对目标用户的价值进行预测之前,通过对
从目标历史业务数据中提取到目标特征值进行校验,保证了后续根据目标特征预测得到的
目标用户的价值的准确性。
以为用户的姓名、性别以及所在用户所在的地理位置等。用户的历史交易数据可以为用户
在交易过程中产生的交易流水,如用户购买的产品、购买产品的频率、购买产品的价格等。
用户的行为信息可以为用户在交易场景中或者在其他非交易场景中的行为,如用户的交易
是否成功的行为等。
合标准格式的数据等,以使得历史业务数据符合后续的数据处理要求,并提高对数据处理
的准确度。以及服务器还可以对爬取到的历史业务数据进行归一化处理,以使得不同维度
的数据之间能够进行数据计算。
连续购买年限、保费、利润、房产价值、车辆价值、月收入以及保费收入占比等。
特征以及利润特征计算训练价值。
对多个用户的历史业务数据进行分析以及挖掘,以从历史业务数据中发掘与用户的价值标
签关联性最大的价值计算特征,并确定各价值计算特征对用户的价值标签的影响力,根据
影响力确定各价值计算特征的特征权重。
测模型的训练,进而得到价值预测模型。
具体的,从训练特征中抽取关键特征的步骤包括:提取各训练特征对应的特征向量;根据各
特征向量的向量特征值,从训练特征中提取关键特征。具体的可以根据向量特征值的得分
高低得到排名靠前的关键特征。
重以及利润特征的利润权重。然后拟合保费特征值与保费权重以及利润特征值与利润权重
构建保费利润综合考量表达式。以根据综合考量表达式计算分值,并根据分值确定用户价
值。
50%的用户的训练价值为第二价值用户,50%‑70%的用户的训练价值为第三价值用户,70%‑
90%的用户的训练价值为第四价值用户,90%‑100%的用户的训练价值为第五价值用户。
存得到的价值预测模型。在一个实施例中可以使用随机森林算法来构建预测模型,将数棵
决策树的结果进行加权集合,使算法更加稳定,降低了过拟合的风险。
特征的最大数量。增加单颗树的最大特征一般能提高模型的拟合性能,因为在每个节点上,
有更多的选择可以考虑。 然而降低了单个树的多样性,并且通过增加最大特征数目会降低
算法的速度。 因此需要选择最佳最大特征数目。通常情况下,对于特征数小于200的模型,
最大特征数据可以考虑在总特征的35%到75%之间。根据模型的拟合状况进行针对性调整,
过拟合则降低,欠拟合则提升。再者是树的数量:树的数量对模型有两部分的影响,一是性
能二是模型的拟合能力,通常情况下数量越大,计算速度越低,拟合能力越好。对于样本多
样性较低(特征数量及标签类别而定),通常不超过两百棵树。以及叶结点最小样本数:叶结
点的样本数目可以控制模型的复杂度,同时能够很好的保证模型的鲁棒性,在本申请中的
一个实施例中,对于业务的少类别,多训练样本的场景,叶结点的最小样本数目可设置较大
值(大于50)。
数值域的笛卡尔积(排列组合)为一组超参数。然后用交叉验证的方法,对每一个超参数模
型进行误差测试,得到最优的模型。
型,预测2019年用户价值为例进行说明。从图5中的左上角开始的部分对应为特征抽取阶
段。具体的,服务器获取2015‑2018年的历史业务数据(历史业务数据中可包括用户保单数
据、用户理赔数据以及用户报案数据等),并对历史业务数据做数据处理(数据预测,如对数
据校验、数据清洗以及数据归一化等)。然后对进行数据处理后的数据执行特征工程,如从
数据处理后的历史业务数据中提取预设的多个目标特征对应的目标特征值,然后再对目标
特征进行特征筛选,得到筛选后的与用户的价值相关的特征。
数据的分布进行归一化处理,并根据归一化后的数据构建关于保费以及利润的综合表达式
y=a*保费+b*利润(其中a、b分别为保费和利润对应的权重),并根据综合表达式计算各用户
的综合分值,根据综合分值对用户进行排序分层,得到不同价值级别的用户。最后根据筛选
得到的特征以及各用户的价值类别(目标)作为学习标签,建立多分类问题,并训练模型得
到逻辑回归模型或者决策树模型等,以根据训练得到的模型预测用户在2019年的客户(用
户)价值类别。
获取与用户价值对应的服务策略;根据服务策略对用户请求进行处理。
内容策略等。
配对应的服务的功能,提高了用户与服务器策略的匹配度,减少了不必要的计算机匹配过
程,节约了计算机资源。同时也提高了用户体验,以及服务的精准度。
户ID,选定时间区间进行特征提取。将根据业务逻辑将目标特征转化为价值标签。构建随机
森林模型,并使用grid searchCV方法进行超参数调优,获得最优模型。将模型生成的用户
价值作为用户标签存入用户数据分析应用平台。通过用户标签进行差异化服务或者差异化
理赔,每当有用户触达时,用户坐席可以通过用户数据分析平台查询用户的价值标签。并以
此标签作为参考,使用不同的话术和服务策略为用户提供个性化,提供有针对性的服务。
的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2‑4中的至少一
部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻
执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次
进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地
执行。
似用户的相似度。
目标历史业务数据中各正常特征分别对应的正常特征值,确定正常特征均值;根据相似特
征均值以及各目标特征对应的相似特征值,确定各目标特征的相似差值;根据目标特征均
值以及各目标特征对应的目标特征值,确定各目标特征的目标差值;根据各目标特征对应
的相似差值以及目标差值,确定目标用户与相似用户的相似度。
相似用户分别对应的相似调整值,计算得到缺失特征对应的缺失特征值。
一化中的至少一种。
以及训练价值构建的,且训练特征以及训练价值是从多于一个的用户分别对应的历史业务
数据中得到的。
练特征;从训练特征中提取价值计算特征;获取各价值计算特征的特征权重;根据特征权重
以及价值计算特征确定各用户的训练价值;根据训练特征以及训练价值训练预测模型,当
满足训练结束条件时,停止预测模型的训练得到价值预测模型。
件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中
的存储器中,以便于处理器调用执行以上各个模块对应的操作。
口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储
器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和
数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该
计算机设备的数据库用于存储预测用户价值的相关业务数据。该计算机设备的网络接口用
于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种价值预测模
型输入数据生成方法。
可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
史业务数据;从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值;当
存在未提取到目标特征值的目标特征时,将未提取到目标特征值的目标特征作为缺失特
征,并获取与目标用户对应的相似用户以及目标用户与相似用户的相似度;从相似用户对
应的相似业务数据中提取与缺失特征对应的相似特征值;根据相似用户的相似度以及相似
特征值,计算得到缺失特征对应的缺失特征值;根据计算得到的缺失特征值,及提取到的目
标特征值得到价值预测模型输入数据。
中,提取预设的各目标特征分别对应的相似特征值;根据各相似特征值确定相似特征均值;
根据目标历史业务数据中各正常特征分别对应的正常特征值,确定正常特征均值;根据相
似特征均值以及各目标特征对应的相似特征值,确定各目标特征的相似差值;根据目标特
征均值以及各目标特征对应的目标特征值,确定各目标特征的目标差值;根据各目标特征
对应的相似差值以及目标差值,确定目标用户与相似用户的相似度。
对应的相似特征均值、相似特征值以及相似度,确定各相似用户对应的相似调整值;根据正
常特征均值以及各相似用户分别对应的相似调整值,计算得到缺失特征对应的缺失特征
值。
测模型输入数据生成方法,获取模型输入数据;将模型输入数据输入至预先构建的价值预
测模型中,根据价值预测模型得到目标用户在未来时间段内的预测价值;其中,价值预测模
型是根据训练特征以及训练价值构建的,且训练特征以及训练价值是从多于一个的用户分
别对应的历史业务数据中得到的。
提取价值计算特征;获取各价值计算特征的特征权重;根据特征权重以及价值计算特征确
定各用户的训练价值;根据训练特征以及训练价值训练预测模型,当满足训练结束条件时,
停止预测模型的训练得到价值预测模型。
有用户数据;通过上述实施例中的用户价值预测方法对用户数据进行处理,得到用户价值;
获取与用户价值对应的服务策略;根据服务策略对用户请求进行处理。
标历史业务数据中提取预设的多个目标特征分别对应的目标特征值;当存在未提取到目标
特征值的目标特征时,将未提取到目标特征值的目标特征作为缺失特征,并获取与目标用
户对应的相似用户以及目标用户与相似用户的相似度;从相似用户对应的相似业务数据中
提取与缺失特征对应的相似特征值;根据相似用户的相似度以及相似特征值,计算得到缺
失特征对应的缺失特征值;根据计算得到的缺失特征值,及提取到的目标特征值得到价值
预测模型输入数据。
据中,提取预设的各目标特征分别对应的相似特征值;根据各相似特征值确定相似特征均
值;根据目标历史业务数据中各正常特征分别对应的正常特征值,确定正常特征均值;根据
相似特征均值以及各目标特征对应的相似特征值,确定各目标特征的相似差值;根据目标
特征均值以及各目标特征对应的目标特征值,确定各目标特征的目标差值;根据各目标特
征对应的相似差值以及目标差值,确定目标用户与相似用户的相似度。
别对应的相似特征均值、相似特征值以及相似度,确定各相似用户对应的相似调整值;根据
正常特征均值以及各相似用户分别对应的相似调整值,计算得到缺失特征对应的缺失特征
值。
测模型输入数据生成方法,获取模型输入数据;将模型输入数据输入至预先构建的价值预
测模型中,根据价值预测模型得到目标用户在未来时间段内的预测价值;其中,价值预测模
型是根据训练特征以及训练价值构建的,且训练特征以及训练价值是从多于一个的用户分
别对应的历史业务数据中得到的。
中提取价值计算特征;获取各价值计算特征的特征权重;根据特征权重以及价值计算特征
确定各用户的训练价值;根据训练特征以及训练价值训练预测模型,当满足训练结束条件
时,停止预测模型的训练得到价值预测模型。
带有用户数据;通过上述实施例中的用户价值预测方法对用户数据进行处理,得到用户价
值;获取与用户价值对应的服务策略;根据服务策略对用户请求进行处理。
取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申
请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括
非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM
(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括
随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,
诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强
型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM
(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
盾,都应当认为是本说明书记载的范围。
不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
因此,本申请专利的保护范围应以所附权利要求为准。