价值预测模型输入数据生成方法、装置、设备和介质转让专利

申请号 : CN202110531498.4

文献号 : CN112990989B

文献日 : 2021-07-30

本申请涉及大数据技术领域，特别涉及一种价值预测模型输入数据生成方法、装置、设备和介质。方法包括：获取目标用户对应的目标历史业务数据；从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；当存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特征，并获取与目标用户对应的相似用户以及目标用户与相似用户的相似度；从相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值；根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值；根据计算得到的缺失特征值，及提取到的目标特征值得到价值预测模型输入数据。采用本方法能够提高模型输入数据生成的准确性。

1.一种价值预测模型输入数据生成方法，其特征在于，所述方法包括：获取目标用户对应的目标历史业务数据；

从所述目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；

当存在未提取到目标特征值的目标特征时，将未提取到所述目标特征值的目标特征作为缺失特征，并获取与所述目标用户对应的相似用户以及所述目标用户与所述相似用户的相似度；所述相似用户与所述目标用户具有相似交易行为；

从所述相似用户对应的相似业务数据中提取与所述缺失特征对应的相似特征值，包括：从所述相似用户对应的所述相似业务数据中，提取预设的各所述目标特征分别对应的相似特征值；根据各所述相似特征值确定相似特征均值；

根据所述相似用户的相似度以及所述相似特征值，计算得到所述缺失特征对应的缺失特征值，包括：根据所述目标历史业务数据中各正常特征分别对应的正常特征值，确定正常特征均值；根据所述相似用户的相似度，确定对应相似用户的权重；根据各所述相似用户分别对应的所述相似特征均值、所述相似特征值以及所述权重，确定各所述相似用户对应的相似调整值；根据所述正常特征均值以及各所述相似用户分别对应的相似调整值，计算得到所述缺失特征对应的缺失特征值；

根据计算得到的所述缺失特征值，及提取到的所述目标特征值得到价值预测模型输入数据。

2.根据权利要求1所述的价值预测模型输入数据生成方法，其特征在于，将从所述目标历史业务数据中提取到目标特征值的目标特征作为正常特征；所述获取与所述目标用户对应的相似用户以及所述目标用户与所述相似用户的相似度，包括：根据所述相似特征均值以及各所述目标特征对应的所述相似特征值，确定各所述目标特征的相似差值；

根据所述正常特征均值以及各所述正常特征对应的所述正常特征值，确定各所述正常特征的目标差值；

根据各所述目标特征对应的所述相似差值以及所述目标差值，确定所述目标用户与所述相似用户的相似度。

3.根据权利要求1或2任意一项所述的价值预测模型输入数据生成方法，其特征在于，所述方法还包括：

对所述目标历史业务数据进行预处理；所述预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

4.一种用户价值预测方法，其特征在于，所述方法包括：根据权利要求1至3中任意一项所述的价值预测模型输入数据生成方法获取模型输入数据；

将所述模型输入数据输入至预先构建的价值预测模型中，根据所述价值预测模型得到所述目标用户在未来时间段内的预测价值；其中，所述价值预测模型是根据训练特征以及训练价值构建的，且所述训练特征以及所述训练价值是从多于一个的用户分别对应的历史业务数据中得到的。

5.根据权利要求4所述的用户价值预测方法，其特征在于，所述价值预测模型的构建方法，包括：

获取多于一个的用户分别对应的历史业务数据；

分别从各所述历史业务数据中提取训练特征；

从所述训练特征中提取价值计算特征；

获取各所述价值计算特征的特征权重；

根据所述特征权重以及所述价值计算特征确定各所述用户的训练价值；

根据所述训练特征以及所述训练价值训练预测模型，当满足训练结束条件时，停止预测模型的训练得到价值预测模型。

6.一种用户请求处理方法，其特征在于，所述方法包括：接收用户请求，所述用户请求携带有用户数据；

通过权利要求4至5任意一项所述的用户价值预测方法对所述用户数据进行处理，得到用户价值；

获取与所述用户价值对应的服务策略；

根据所述服务策略对所述用户请求进行处理。

7.一种价值预测模型输入数据生成装置，其特征在于，所述装置包括：获取模块，用于获取目标用户对应的目标历史业务数据；

提取模块，用于从所述目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；

相似获取模块，用于当存在未提取到目标特征值的目标特征时，将未提取到所述目标特征值的目标特征作为缺失特征，并获取与所述目标用户对应的相似用户以及所述目标用户与所述相似用户的相似度；所述相似用户与所述目标用户具有相似交易行为；

相似数据提取模块，用于从所述相似用户对应的相似业务数据中提取与所述缺失特征对应的相似特征值，包括：从所述相似用户对应的所述相似业务数据中，提取预设的各所述目标特征分别对应的相似特征值；根据各所述相似特征值确定相似特征均值；

计算模块，用于根据所述相似用户的相似度以及所述相似特征值，计算得到所述缺失特征对应的缺失特征值，包括：根据所述目标历史业务数据中各正常特征分别对应的正常特征值，确定正常特征均值；根据所述相似用户的相似度，确定对应相似用户的权重；根据各所述相似用户分别对应的所述相似特征均值、所述相似特征值以及所述权重，确定各所述相似用户对应的相似调整值；根据所述正常特征均值以及各所述相似用户分别对应的相似调整值，计算得到所述缺失特征对应的缺失特征值；

生成模块，用于根据计算得到的所述缺失特征值，及提取到的所述目标特征值得到价值预测模型输入数据。

8.根据权利要求7所述的装置，其特征在于，所述相似获取模块还用于根据所述相似特征均值以及各所述目标特征对应的所述相似特征值，确定各所述目标特征的相似差值；根据所述正常特征均值以及各所述正常特征对应的所述正常特征值，确定各所述正常特征的目标差值；根据各所述目标特征对应的所述相似差值以及所述目标差值，确定所述目标用户与所述相似用户的相似度。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

价值预测模型输入数据生成方法、装置、设备和介质

技术领域

[0001] 本申请涉及大数据技术领域，特别是涉及一种价值预测模型输入数据生成方法、装置、设备和介质。

背景技术

[0002] 随着计算机技术的发展，传统的线下业务逐渐转移到线上进行处理，使得线上的数据量变得越来越庞大。对于公司而言，如何对庞大的线上数据进行分析处理得到有效数
据变得越来越重要。

[0003] 如公司可以通过对线上数据的分析，并根据用户在历史时间段内的价值级别预测用户在未来时间段内的价值级别，进可以在未来时间段内对不同级别的用户执行对应等级
的业务活动，提高业务执行效率。

[0004] 在传统的方法中，对用户价值级别的预测过程中，是直接根据用户对应的历史数据对用户未来的价值级别进行预测，当用户的历史数据缺失时，导致根据用户的历史数据
预测到的用户价值级别不准确。

发明内容

[0005] 基于此，有必要针对上述技术问题，提供一种能够提高模型输入数据获取准确性的价值预测模型输入数据生成方法、装置、设备和介质。

[0006] 一种价值预测模型输入数据生成方法，方法包括：

[0007] 获取目标用户对应的目标历史业务数据；

[0008] 从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；

[0009] 当存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特征，并获取与目标用户对应的相似用户以及目标用户与相似用户的相似度；

[0010] 从相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值；

[0011] 根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值；

[0012] 根据计算得到的缺失特征值，及提取到的目标特征值得到价值预测模型输入数据。

[0013] 在一个实施例中，将从目标历史业务数据中提取到目标特征值的目标特征作为正常特征；获取与目标用户对应的相似用户以及目标用户与相似用户的相似度，包括：

[0014] 从相似用户对应的相似业务数据中，提取预设的各目标特征分别对应的相似特征值；

[0015] 根据各相似特征值确定相似特征均值；

[0016] 根据目标历史业务数据中各正常特征分别对应的正常特征值，确定正常特征均值；

[0017] 根据相似特征均值以及各目标特征对应的相似特征值，确定各目标特征的相似差值；

[0018] 根据目标特征均值以及各目标特征对应的目标特征值，确定各目标特征的目标差值；

[0019] 根据各目标特征对应的相似差值以及目标差值，确定目标用户与相似用户的相似度。

[0020] 在一个实施例中，根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值，包括：

[0021] 根据各相似用户分别对应的相似特征均值、相似特征值以及相似度，确定各相似用户对应的相似调整值；

[0022] 根据正常特征均值以及各相似用户分别对应的相似调整值，计算得到缺失特征对应的缺失特征值。

[0023] 在一个实施例中，方法还包括：

[0024] 对目标历史业务数据进行预处理；预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

[0025] 一种用户价值预测方法，方法包括：

[0026] 根据上述实施例中的价值预测模型输入数据生成方法，获取模型输入数据；

[0027] 将模型输入数据输入至预先构建的价值预测模型中，根据价值预测模型得到目标用户在未来时间段内的预测价值；其中，价值预测模型是根据训练特征以及训练价值构建
的，且训练特征以及训练价值是从多于一个的用户分别对应的历史业务数据中得到的。

[0028] 在一个实施例中，价值预测模型的构建方法，包括：

[0029] 获取多于一个的用户分别对应的历史业务数据；

[0030] 分别从各历史业务数据中提取训练特征；

[0031] 从训练特征中提取价值计算特征；

[0032] 获取各价值计算特征的特征权重；

[0033] 根据特征权重以及价值计算特征确定各用户的训练价值；

[0034] 根据训练特征以及训练价值训练预测模型，当满足训练结束条件时，停止预测模型的训练得到价值预测模型。

[0035] 一种用户请求处理方法，方法包括：

[0036] 接收用户请求，用户请求携带有用户数据；

[0037] 通过上述实施例中的用户价值预测方法对用户数据进行处理，得到用户价值；

[0038] 获取与用户价值对应的服务策略；

[0039] 根据服务策略对用户请求进行处理。

[0040] 一种价值预测模型输入数据生成装置，装置包括：

[0041] 获取模块，用于获取目标用户对应的目标历史业务数据；

[0042] 提取模块，用于从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；

[0043] 相似获取模块，用于当存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特征，并获取与目标用户对应的相似用户以及目标用户与相似
用户的相似度；

[0044] 相似数据提取模块，用于从相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值；

[0045] 计算模块，用于根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值；

[0046] 生成模块，用于根据计算得到的缺失特征值，及提取到的目标特征值得到价值预测模型输入数据。

[0047] 一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述方法的步骤。

[0048] 一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述方法的步骤。

[0049] 上述价值预测模型输入数据生成方法，获取目标用户对应的目标历史业务数据，并从目标历史业务数据中提取预设的多个目标特征对应的目标特征值。并且在得到目标特
征值后还判断是否存在未提取到目标特征值的目标特征（即各目标特征对应的目标特征值
是否存在缺失值），实现了在进行用户价值预测之前对目标历史业务数据的准确性进行判
断。并且当存在未提取到目标特征值的目标特征时（即存在目标特征对应的目标特征值为
缺失值时），将未提取到目标特征值的目标特征作为缺失特征。然后获取与目标用户对应的
相似用户，以及各相似用户对应的相似业务数据，以根据相似业务数据以及各相似用户与
目标用户的相似度对目标业务数据中的缺失特征的缺失特征值进行补全，进而实现了对目
标历史业务数据的补全，提高了目标历史业务数据的准确性。

附图说明

[0050] 图1为一个实施例中价值预测模型输入数据生成方法的应用场景图；

[0051] 图2为一个实施例中价值预测模型输入数据生成方法的流程示意图；

[0052] 图3为一个实施例中用户价值预测方法的流程示意图；

[0053] 图4为一个实施例中价值预测模型的构建方法流程示意图；

[0054] 图5为一个实施例中模型训练以及预测的整体示意图；

[0055] 图6为一个实施例中价值预测模型输入数据生成装置的结构框图；

[0056] 图7为一个实施例中用户价值预测装置的结构框图；

[0057] 图8为一个实施例中用户请求处理装置的结构框图；

[0058] 图9为一个实施例中计算机设备的内部结构图。

具体实施方式

[0059] 为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不
用于限定本申请。

[0060] 本申请提供的价值预测模型输入数据生成方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。服务器104从终端102中获取目标用户
对应的目标历史业务数据；从目标历史业务数据中提取预设的多个目标特征分别对应的目
标特征值；当存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征
作为缺失特征，并获取与目标用户对应的相似用户以及目标用户与相似用户的相似度；从
相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值；根据相似用户的相似
度以及相似特征值，计算得到缺失特征对应的缺失特征值；根据计算得到的缺失特征值，及
提取到的目标特征值得到价值预测模型输入数据。其中，终端102可以但不限于是各种个人
计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服
务器或者是多个服务器组成的服务器集群来实现。

[0061] 在其中一个实施例中，如图2所示，提供了一种价值预测模型输入数据生成方法，以该方法应用于图1中的服务器104为例进行说明，在其他实施例中，该方法也可以应用于
终端102，方法包括以下步骤：

[0062] 步骤202，获取目标用户对应的目标历史业务数据。

[0063] 其中，目标用户是需要进行价值预测得用户。目标历史业务数据可为目标用户在历史一段时间内对应的数据。如目标历史业务数据中可包括目标用户的属性信息、目标用
户的历史交易数据、目标用户的历史行为信息等。可以理解，用户属性信息可以为目标用户
的姓名、性别以及所在目标用户所在的地理位置等。目标用户的历史交易数据可以为目标
用户在交易过程中产生的交易流水，如目标用户购买的产品、购买产品的频率、购买产品的
价格等。目标用户的行为信息可以为用户在交易场景中或者在其他非交易场景中的行为，
如目标用户的交易是否成功的行为等。

[0064] 进一步地，服务器还可以对爬取到的目标历史业务数据进行清洗处理，如去除目标历史业务数据中的错误数据或者不符合标准格式的数据等，以使得目标历史业务数据符
合后续的数据处理要求，并提高对数据处理的准确度。以及服务器还可以对爬取到的目标
历史业务数据进行归一化处理，以使得不同维度的数据之间能够进行数据计算。

[0065] 步骤204，从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值。

[0066] 目标特征是从目标历史业务数据中提取出来得用于表征目标用户特征的特征。目标特征值为目标特征的数值。可以理解，目标特征可以为目标用户对产品的购买间隔、购买
频率、连续购买年限、保费、利润、房产价值、车辆价值、月收入以及保费收入占比等。目标特
征值是各目标特征对应的具体数值。并且，目标特征可以是预先设定的特征。

[0067] 步骤206，当存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特征，并获取与目标用户对应的相似用户以及目标用户与相似用户的相似
度。

[0068] 其中，缺失特征是指无法从目标历史业务数据中提取到对应目标特征值的目标特征。具体可以是目标历史业务数据中不包括该目标特征，如目标历史业务数据中不包括目
标用户的房产价值，故而服务器无法从目标历史业务数据中提取到的房产价值的目标特征
值。

[0069] 在一个实施例中，可以预先确定多于一个的目标特征，然后服务器从目标历史业务数据中提取预先确定的各目标特征对应的目标特征值，并且当成功从目标历史业务数据
中提取到预先确定的所有的目标特征对应的目标特征值时，说明目标历史业务数据为合格
的数据，根据目标历史业务数据就可以执行对目标用户价值的预测步骤。当不能成功从目
标历史业务数据中提取到预先确定的所有的目标特征对应的目标特征值时，说明目标历史
业务数据为不合格的数据，即目标历史业务数据中缺失部分的数据，此时若根据缺失部分
数据的目标历史业务数据预测到的目标用户的价值存在不准确的弊端。

[0070] 在一个实施例中，服务器从目标历史业务数据中提取各目标特征对应的目标特征值，并根据目标特征的目标特征值是否为缺失值，将目标特征划分为缺失特征以及正常特
征。具体地，将无法从目标历史业务数据中提取到目标特征值的目标特征作为缺失特征，将
能够提取到目标特征值的目标特征作为正常特征。当服务器判定目标特征中存在缺失特征
时，说明目标历史业务数据中缺失用于表征用户缺失特征的数据。从目标历史业务数据中
提取多于一个的目标特征对应的目标特征值之后，还包括：当服务器判定目标特征中存在
缺失特征时，获取目标用户对应的相似用户，以及相似用户对应的相似业务数据。从相似业
务数据中提取与缺失特征对应的相似数据，根据相似数据确定缺失特征对应的缺失特征
值。

[0071] 其中，相似用户是与目标用户近似的用户，如相似用户可以是与目标用户具有相似交易行为的用户。具体地，当服务器判定目标特征中存在缺失特征时，获取与目标用户相
似的相似用户，以根据相似用户的相似业务数据对目标用户的缺失特征值进行估计。需要
说明的是，相似用户的数量可以为一个或者多个，在此不作限制。

[0072] 步骤208，从相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值。

[0073] 服务器获取相似用户对应的相似业务数据，以根据相似业务数据对目标历史业务数据中的缺失数据进行补充。具体地，服务器可以通过从相似业务数据中提取与缺失特征
对应的相似特征值，然后利用相似特征值对缺失特征的缺失特征值进行补充，以实现可以
获取缺失特征的缺失特征值。

[0074] 步骤210，根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值。

[0075] 在一个实施例中，当相似用户的数量为多个时，还包括计算各相似用户与目标用户的相似度。然后在服务器中根据相似用户的相似度以及根据各相似用户计算得到的相似
特征值，计算得到缺失特征对应的缺失特征值。

[0076] 步骤212，根据计算得到的缺失特征值以及从提取到的目标特征值得到模型输入数据。

[0077] 在一个实施例中，保险公司在收集用户（客户）数据时，可能只收集了用户的基本信息，而对于用户的价值信息，如月收入、负债情况、房屋价值以及车辆价值等数据可能并
没有获取到，或者通过具体的业务情景收集到用户其他方面的数据，但是得到的用户数据
是一个稀疏矩阵，在很多情况下收集到的目标用户的目标历史业务数据并不是很全面的。
并且将稀疏矩阵输入随机森林预测模型中预测用户价值时，会影响模型的精准度。故而在
本实施例中可以通过与目标用户相似的相似用户的数据对目标用户缺失的数据进行补全。
具体地，可以根据相关系数来对目标用户的未知数据进行权重投票，对稀疏矩阵进行填充，
如可以通过局部矩阵投票补全目标历史业务数据。

[0078] 上述价值预测模型输入数据生成方法，获取目标用户对应的目标历史业务数据，并从目标历史业务数据中提取预设的多个目标特征对应的目标特征值。并且在得到目标特
征值后还判断是否存在未提取到目标特征值的目标特征（即各目标特征对应的目标特征值
是否存在缺失值），实现了在进行用户价值预测之前对目标历史业务数据的准确性进行判
断。并且当存在未提取到目标特征值的目标特征时（即存在目标特征对应的目标特征值为
缺失值时），将未提取到目标特征值的目标特征作为缺失特征。然后获取与目标用户对应的
相似用户，以及各相似用户对应的相似业务数据，以根据相似业务数据以及各相似用户与
目标用户的相似度对目标业务数据中的缺失特征的缺失特征值进行补全，进而实现了对目
标历史业务数据的补全，提高了目标历史业务数据的准确性。

[0079] 在一个实施例中，将从目标历史业务数据中提取到目标特征值的目标特征作为正常特征；获取与目标用户对应的相似用户以及目标用户与相似用户的相似度，包括：从相似
用户对应的相似业务数据中，提取预设的各目标特征分别对应的相似特征值。根据各相似
特征值确定相似特征均值，根据目标历史业务数据中各正常特征分别对应的正常特征值，
确定正常特征均值。根据相似特征均值以及各目标特征对应的相似特征值，确定各目标特
征的相似差值；根据目标特征均值以及各目标特征对应的目标特征值，确定各目标特征的
目标差值；根据各目标特征对应的相似差值以及目标差值，确定目标用户与相似用户的相
似度。

[0080] 具体的，服务器从相似用户i对应的相似业务数据中提取各个目标特征j对应的相似特征值。然后对各相似特征值求均值得到相似特征均值。假设相似用户的信息
为一个i*j列的矩阵，其中为相似用户i在目标特征j上对应的相似特征值。那么相似用
户i对应得相似特征均值可用如下公式（1）计算。

[0081] （1）

[0082] 服务器从包括缺失特征的目标用户a的目标历史业务数据中提取所有的正常特征对应的正常特征值，然后根据正常特征值计算正常特征均值。然后根据相似特征均
值以及各目标特征对应的相似特征值，确定各目标特征的相似差值。根据
目标特征均值以及各目标特征对应的目标特征值，确定各目标特征的目标差值
。最后根据各目标特征对应的相似差值以及目标差值，确定目标用户与相似用户
的相似度，具体的，目标用户a与相似用户i的相似度计算公式如式（2）所示。

[0083] （2）

[0084] 并且，根据计算得到的对应的数值大小，可用于评估目标用户与相似用户之间的相似程度。具体的，目标用户与相似用户之间的相似度数值越大，说明两者之间的相似
度越高，也就是说，该相似用户对目标用户的缺失特征值进行评分时，其对应的权重也越
高。

[0085] 在一个实施例中，根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值，包括：根据各相似用户分别对应的相似特征均值、相似特征值以及相似
度，确定各相似用户对应的相似调整值；根据正常特征均值以及各相似用户分别对应的相
似调整值，计算得到缺失特征对应的缺失特征值。

[0086] 具体的，对于含有未知信息（缺失特征）的目标用户a，根据相似用户估计的缺失特征值可以通过权重投票进行计算。在其中一个实施例中，目标用户a的目标特征j的预
测值，等于目标用户a的已知信息对应的正常特征的正常特征均值，加上n个相似用户
的相似值乘以该相似用户的目标特征值与对应相似用户的相似特均值的差值。具体的计算
过程如公式（3）所示。

[0087] （3）

[0088] 在本实施例中，通过已知的相似用户对应的相似业务数据对目标用户的目标历史业务数据进行补全操作，使得目标历史业务数据的准确性更高。并且还依据不同相似用户
与目标用户的相似度对目标用户的缺失特征值进行投票，来补充目标用户的矩阵信息，使
一个稀疏矩阵变成了密集矩阵，提升了后续根据价值预测模型预测用户价值的准确性。

[0089] 在一个实施例中，方法还包括：对目标历史业务数据进行预处理；预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

[0090] 在其中一个实施例中，数据校验可包括对目标历史业务数据中的数据准确性进行校验。数据清洗可包括对用户数据中的错误数据进行清洗，并去除错误数据。具体的，由于
数据输入错误，不同来源数据引起的不同表示法，数据间的不一致等，导致现有的数据中存
在这样或那样的脏数据，主要表现为：不合法值、录入不规范、不一致值以及数据重复等。数
据清洗的作用包括去除不需要字段，或者格式内容清洗，或者填充空缺值，或者逻辑错误清
洗，或者数据真实性验证等。

[0091] 首先，将已确定的客户信息数据从Oracle抽取到hive平台上，输入提取要清洗的数据库表和数据，根据特定的校验规则做信息真实性校验，如身份证的省份检查，手机号的
区段验证等，清洗出有真实有效的数据。在一个实施例中，数据清洗包括：1、对身份证号校
验，具体地要求身份证号码的长度为15位或18位，要求身份证号码需要符合地区编码验证，
要求身份证号码需要符合身份证日期验证，要求身份证号码需要符合身份证校验位判断，
并且要求身份证号码不包含‘0000’等异常号。当判定身份证码不满意以上任何一个要求
时，就将身份证号码置空。2、若用户与外勤人员将身份证号或手机号置为相同数值的，也将
身份证号或手机号置空。3、姓名中只保留纯中文、纯字母和空格，将中英混合的数据剔除。
4、手机号长度不等于11位的，非常规手机号，根据给出的规则进行校验，或号码包含
‘000000’等非常规号，置空。5、姓名长度大于或等于3位，且含有“等人”字样，剔除。7、超过3
位不同客户使用相同的身份证号与手机号，剔除。8、姓名含有“公司”，剔除。

[0092] 在一个实施例中，数据清洗规则包括：a、清洗规则（准入规则）:空值校验、null值校验、身份证号校验以及手机号校验等，当字段不符合配置的规则时，按规定的默认值赋予
新值。当字段为空值‘’或null时，将其置换为字符串‘null’。而符合规则的值保持不变，最
终每一条原始记录数据都将按照上述数据清洗规则，形成一条对应的新的数据记录，若该
行数据有效，则进入下一步的ID打通，否则，将会被过滤。b、空值校验，判断字段值是否为空
值，如是，则将字符串’null’给字段默认值。c、Null值校验，判断字段值是否为null值，如
是，则将字符串’null’给字段默认值。d、身份证号校验，判断身份证号是否是合法，地区编
码验证是否有效，身份证日期验证是否有效，身份证值最后一位判断，身份证长度判断。具
体包括：当身份证的省份编码不正确，置空；当身份证的正则表达式判断不正确，置空；当身
份证的校验位不正确，置空；当身份证包含“0000”，置空。

[0093] 手机号校验，具体地，判断手机号是否合法，如手机号长度判断，空值判断，是否以1开头，是否为1111111111之类的异常号等。具体如下：当手机号长度不等于11，置空；当手
机号不以1开头，置空；当手机号包含“000000”，置空；当手机号包含“11111111”，置空；当手
机号包含“22222222”，置空；当手机号包含“33333333”，置空；当手机号包含“44444444”，置
空；当手机号包含“55555555”，置空；当手机号包含“66666666”，置空；当手机号包含
“77777777”，置空；当手机号包含“88888888”，置空；当手机号包含“99999999”，置空；当手
机号包含“23456789”，置空；当手机号包含“12345678”，置空；当手机号包含“01234567”，置
空；当手机号包含“34567890”，置空；当手机号包含“456789”，置空；当手机号包含
“1380013800”，置空。

[0094] 与代理人信息相同处理。具体地，代理人信息（姓名+证件号+手机号），当用户基础信息总表中的数据被判断不属于代理人，但使用了代理人信息，则将对应信息置空。

[0095] 在一个实施例中，数据归一化的步骤包括：因为客户可能通过多种途径，多个入口触达，所以同一个客户在不同系统可能被打上了多个ID。还有用户多次办理业务时，因为提
供信息的不同，也可能被认为是两个客户。在对客户价值进行分析时，要求能够收集到该客
户在所有系统，所有时间段内的数据，需要进行ID归一化，将客户ID打通。具体地，数据打通
规则包括：在服务器中获取用户基础信息数据汇总表，并为用户生成新的用户ID作为用户
的唯一标识，放在第一个字段位置存到汇总表里, 一个客户ID对应多条记录数据，但一条
记录仅属于一个客户ID。

[0096] ID打通：通过规定规则给每条数据都添加一个可以标识唯一标识该用户的字段，同时每条数据都会有个字段保留其在源表中的主键，以便回溯源表，最后将处理后的结果
数据存到hive数据仓库中。具体地，目前作为标识用户的规则如下：姓名前两位 + 证件号
码，确定一个用户；姓名 + 手机号，确定一个用户；证件号码 + 手机号，确定一个用户；姓
名+ 银行卡号，确定一个用户；姓名 + 微信号确定一个用户；手机号 + 银行卡号确定一
个用户；手机号 + 微信号，确定一个用户；姓名 + 设备ID，确定一个用户；手机号 + 设备
ID，确定一个用户等。在此不作限制。

[0097] 如图3所示，提供了一种用户价值预测方法的流程示意图，方法包括：

[0098] 步骤302，根据上述任意一个实施例中提供的价值预测模型输入数据生成方法获取模型输入数据。

[0099] 步骤304，将模型输入数据输入至预先构建的价值预测模型中，根据价值预测模型得到目标用户在未来时间段内的预测价值；其中，价值预测模型是根据训练特征以及训练
价值构建的，且训练特征以及训练价值是从多于一个的用户分别对应的历史业务数据中得
到的。

[0100] 其中，价值预测模型是预先训练的模型，可用于对目标用户的价值进行预测。具体地，服务器获取多个用户分别对应的历史业务数据，然后从历史业务数据中提取训练特征，
以及根据训练特征确定训练价值，以根据训练特征以及训练价值训练模型，得到价值预测
模型。可以理解，价值预测模型可以为决策树模型、随机森林模型、回归模型或则机器学习
模型等，在此不作限制。

[0101] 并且，需要说明的是，训练特征与目标特征可以为相同的特征，也可以为不同的特征，在此不做限制。以及训练价值是从训练特征中提取到的全部或者部分特征，并且根据训
练价值可用于计算用户的训练价值。

[0102] 上述用户价值预测方法，获取目标用户对应的目标历史业务数据，并从目标历史业务数据中提取预设的多个目标特征对应的目标特征值。并且在得到目标特征值后还判断
各目标特征对应的目标特征值是否存在缺失值，实现了在进行用户价值预测之前对目标历
史业务数据的准确性进行判断。并且只有当判定各目标特征对应的目标特征值都不存在缺
失值时，才执行将精准的目标特征值输入至预先构建的价值预测模型中，根据价值预测模
型得到目标用户在未来时间段内的预测价值，提高了目标用户的价值预测的准确性。其中，
价值预测模型是根据训练特征以及训练价值构建的，且训练特征以及训练价值是从多于一
个的用户分别对应的历史业务数据中得到的。在对目标用户的价值进行预测之前，通过对
从目标历史业务数据中提取到目标特征值进行校验，保证了后续根据目标特征预测得到的
目标用户的价值的准确性。

[0103] 在一个实施例中，如图4所示，提供了一种价值预测模型的构建方法流程示意图，方法包括：

[0104] 步骤402，获取多于一个的用户分别对应的历史业务数据。

[0105] 其中，历史业务数据可为历史一段时间内对应的数据。历史业务数据中可包括用户的属性信息、用户的历史交易数据、用户的历史行为信息等。可以理解，用户属性信息可
以为用户的姓名、性别以及所在用户所在的地理位置等。用户的历史交易数据可以为用户
在交易过程中产生的交易流水，如用户购买的产品、购买产品的频率、购买产品的价格等。
用户的行为信息可以为用户在交易场景中或者在其他非交易场景中的行为，如用户的交易
是否成功的行为等。

[0106] 具体的，服务器从业务系统中爬取多个用户的历史业务数据。进一步地，服务器还可以对爬取到的历史业务数据进行清洗处理，如去除历史业务数据中的错误数据或者不符
合标准格式的数据等，以使得历史业务数据符合后续的数据处理要求，并提高对数据处理
的准确度。以及服务器还可以对爬取到的历史业务数据进行归一化处理，以使得不同维度
的数据之间能够进行数据计算。

[0107] 步骤404，分别从各历史业务数据中提取训练特征。

[0108] 训练特征是从历史业务数据中提取出来得用于表征用户特征的。可以理解，训练特征可以与目标特征为相同的特征，如训练特征可以为用户对产品的购买间隔、购买频率、
连续购买年限、保费、利润、房产价值、车辆价值、月收入以及保费收入占比等。

[0109] 步骤406，从训练特征中提取价值计算特征。

[0110] 其中，价值计算特征是从训练特征中提取到的部分或者全部的特征，以用于计算用户的训练价值。具体的，服务器从训练特征中提取保费特征以及利润特征，然后根据保费
特征以及利润特征计算训练价值。

[0111] 步骤408，获取各价值计算特征的特征权重。

[0112] 特征权重可以是预先确定的，并且预先为价值计算特征设定特征权重。在一个实施例中，服务器获取多个用户的历史业务数据，以及各个用户对应的价值标签，然后服务器
对多个用户的历史业务数据进行分析以及挖掘，以从历史业务数据中发掘与用户的价值标
签关联性最大的价值计算特征，并确定各价值计算特征对用户的价值标签的影响力，根据
影响力确定各价值计算特征的特征权重。

[0113] 步骤410，根据特征权重以及价值计算特征确定各用户的训练价值。

[0114] 具体的，服务器将特征权重与对应的价值计算特征对应相乘，并且求和，得到各用户的训练价值。

[0115] 步骤412，根据训练特征以及训练价值训练预测模型，当满足训练结束条件时，停止预测模型的训练得到价值预测模型。

[0116] 具体的，将训练特征以及训练价值作为训练集，并用于训练预测模型，当得到的预测模型的训练精度满足预设精度条件时，或者训练的迭代次数达到预设次数时，停止对预
测模型的训练，进而得到价值预测模型。

[0117] 在一个实施例中，得到训练特征后，还包括从训练特征中抽取部分或者全部的特征得到关键特征，以根据从训练特征中抽取得到的关键特征以及训练价值训练预测模型。
具体的，从训练特征中抽取关键特征的步骤包括：提取各训练特征对应的特征向量；根据各
特征向量的向量特征值，从训练特征中提取关键特征。具体的可以根据向量特征值的得分
高低得到排名靠前的关键特征。

[0118] 在一个实施例中，以服务器获取用户在2015‑2018年对应的历史业务数据，并根据历史业务数据预测用户在2019年的价值为例进行说明。

[0119] 首先根据历史业务数据中的保费特征值以及利润特征值数据的分布情况，对保费特征值以及利润特征值的数据进行数据归一化。以及根据业务经验确定保费特征的保费权
重以及利润特征的利润权重。然后拟合保费特征值与保费权重以及利润特征值与利润权重
构建保费利润综合考量表达式。以根据综合考量表达式计算分值，并根据分值确定用户价
值。

[0120] 具体的，根据综合考量表达式计算得到的分值对用户进行综合排序并分层。如可以根据分值排序对用户进行分层，如排序在前10%的用户的训练价值为第一价值用户，20%‑
50%的用户的训练价值为第二价值用户，50%‑70%的用户的训练价值为第三价值用户，70%‑
90%的用户的训练价值为第四价值用户，90%‑100%的用户的训练价值为第五价值用户。

[0121] 然后，根据从历史业务数据中的提取到的训练特征，以及根据综合考量表达式计算得到训练价值进行预测模型的训练，并进行模型训练，优化迭代得到稳定算法模型，并保
存得到的价值预测模型。在一个实施例中可以使用随机森林算法来构建预测模型，将数棵
决策树的结果进行加权集合，使算法更加稳定，降低了过拟合的风险。

[0122] 进一步地，利用随机森林算法构建预测模型的过程中，预测模型的参数调优算法主要有三个特征可以进行调优。其中一个为最大特征数目：随机森林允许单个决策树使用
特征的最大数量。增加单颗树的最大特征一般能提高模型的拟合性能，因为在每个节点上，
有更多的选择可以考虑。然而降低了单个树的多样性，并且通过增加最大特征数目会降低
算法的速度。因此需要选择最佳最大特征数目。通常情况下，对于特征数小于200的模型，
最大特征数据可以考虑在总特征的35%到75%之间。根据模型的拟合状况进行针对性调整，
过拟合则降低，欠拟合则提升。再者是树的数量：树的数量对模型有两部分的影响，一是性
能二是模型的拟合能力，通常情况下数量越大，计算速度越低，拟合能力越好。对于样本多
样性较低（特征数量及标签类别而定），通常不超过两百棵树。以及叶结点最小样本数：叶结
点的样本数目可以控制模型的复杂度，同时能够很好的保证模型的鲁棒性，在本申请中的
一个实施例中，对于业务的少类别，多训练样本的场景，叶结点的最小样本数目可设置较大
值（大于50）。

[0123] 具体的，本申请中可以通过交叉验证进行grid_search，选择最佳参数，获得最佳模型。根据一般的业务知识，在指定的参数范围内，列出一个较小的超参数值域，这些超参
数值域的笛卡尔积（排列组合）为一组超参数。然后用交叉验证的方法，对每一个超参数模
型进行误差测试，得到最优的模型。

[0124] 如图5所示，图5提供了一种模型训练以及预测的整体示意图。具体的，如图5所示价值预测模型分训练和预测两个阶段。具体的以利用2015‑2018年的历史业务数据训练模
型，预测2019年用户价值为例进行说明。从图5中的左上角开始的部分对应为特征抽取阶
段。具体的，服务器获取2015‑2018年的历史业务数据（历史业务数据中可包括用户保单数
据、用户理赔数据以及用户报案数据等），并对历史业务数据做数据处理（数据预测，如对数
据校验、数据清洗以及数据归一化等）。然后对进行数据处理后的数据执行特征工程，如从
数据处理后的历史业务数据中提取预设的多个目标特征对应的目标特征值，然后再对目标
特征进行特征筛选，得到筛选后的与用户的价值相关的特征。

[0125] 继续参考图5，从图5中的左下角开始，服务器获取2015‑2018年对应的历史业务数据，并从历史业务数据中提取目标数据，如保费数据以及理赔数据，并对保费数据以及理赔
数据的分布进行归一化处理，并根据归一化后的数据构建关于保费以及利润的综合表达式
y=a*保费+b*利润（其中a、b分别为保费和利润对应的权重），并根据综合表达式计算各用户
的综合分值，根据综合分值对用户进行排序分层，得到不同价值级别的用户。最后根据筛选
得到的特征以及各用户的价值类别（目标）作为学习标签，建立多分类问题，并训练模型得
到逻辑回归模型或者决策树模型等，以根据训练得到的模型预测用户在2019年的客户（用
户）价值类别。

[0126] 一种用户请求处理方法，方法包括：接收用户请求，用户请求携带有用户数据；通过上述任意一个实施例中示意的用户价值预测方法对用户数据进行处理，得到用户价值；
获取与用户价值对应的服务策略；根据服务策略对用户请求进行处理。

[0127] 在具体的应用场景中，可以对用户进行价值类别划分，实现对不同价值的用户分配不同的服务以及采取不同的服务策略。其中服务策略可以是服务话术策略、或者是服务
内容策略等。

[0128] 在具体的应用场景中，业务部门希望对用户的用户价值进行建模，以实现对用户进行价值划分，进而对不同的价值用户采取不同的服务策略，实现了为不同等级的用户匹
配对应的服务的功能，提高了用户与服务器策略的匹配度，减少了不必要的计算机匹配过
程，节约了计算机资源。同时也提高了用户体验，以及服务的精准度。

[0129] 在具体的应用场景中，首先对获取到的用户历史业务数据，并进行用户ID的归一化，将不同业务系统中的用户历史业务数据打通，并给予唯一标识。然后通过归一化后的用
户ID，选定时间区间进行特征提取。将根据业务逻辑将目标特征转化为价值标签。构建随机
森林模型，并使用grid searchCV方法进行超参数调优，获得最优模型。将模型生成的用户
价值作为用户标签存入用户数据分析应用平台。通过用户标签进行差异化服务或者差异化
理赔，每当有用户触达时，用户坐席可以通过用户数据分析平台查询用户的价值标签。并以
此标签作为参考，使用不同的话术和服务策略为用户提供个性化，提供有针对性的服务。

[0130] 应该理解的是，虽然图2‑4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤
的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2‑4中的至少一
部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻
执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次
进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地
执行。

[0131] 在一个实施例中，如图6所示，提供了一种价值预测模型输入数据生成装置600，装置包括：

[0132] 获取模块602，用于获取目标用户对应的目标历史业务数据。

[0133] 提取模块604，用于从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值。

[0134] 相似获取模块606，用于当存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特征，并获取与目标用户对应的相似用户以及目标用户与相
似用户的相似度。

[0135] 相似数据提取模块608，用于从相似用户对应的相似业务数据中提取与缺失特征对应的相似特征值。

[0136] 计算模块610，用于根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值。

[0137] 生成模块612，用于根据计算得到的缺失特征值，及提取到的目标特征值得到价值预测模型输入数据。

[0138] 在一个实施例中，相似获取模块606还用于从相似用户对应的相似业务数据中，提取预设的各目标特征分别对应的相似特征值；根据各相似特征值确定相似特征均值；根据
目标历史业务数据中各正常特征分别对应的正常特征值，确定正常特征均值；根据相似特
征均值以及各目标特征对应的相似特征值，确定各目标特征的相似差值；根据目标特征均
值以及各目标特征对应的目标特征值，确定各目标特征的目标差值；根据各目标特征对应
的相似差值以及目标差值，确定目标用户与相似用户的相似度。

[0139] 在一个实施例中，计算模块610还用于：根据各相似用户分别对应的相似特征均值、相似特征值以及相似度，确定各相似用户对应的相似调整值；根据正常特征均值以及各
相似用户分别对应的相似调整值，计算得到缺失特征对应的缺失特征值。

[0140] 在一个实施例中，价值预测模型输入数据生成装置还包括预处理模块614，预处理模块614用于对目标历史业务数据进行预处理；预处理包括数据校验、数据清洗以及数据归
一化中的至少一种。

[0141] 在一个实施例中，如图7所示，提供了一种用户价值预测装置700，装置包括：

[0142] 输入数据获取模块702，用于根据上述实施例中的价值预测模型输入数据生成方法，获取模型输入数据。

[0143] 预测模块704，用于将模型输入数据输入至预先构建的价值预测模型中，根据价值预测模型得到目标用户在未来时间段内的预测价值；其中，价值预测模型是根据训练特征
以及训练价值构建的，且训练特征以及训练价值是从多于一个的用户分别对应的历史业务
数据中得到的。

[0144] 在一个实施例中，用户价值预测装置700还包括模型构建模块706，模型构建模块706用于获取多于一个的用户分别对应的历史业务数据；分别从各历史业务数据中提取训
练特征；从训练特征中提取价值计算特征；获取各价值计算特征的特征权重；根据特征权重
以及价值计算特征确定各用户的训练价值；根据训练特征以及训练价值训练预测模型，当
满足训练结束条件时，停止预测模型的训练得到价值预测模型。

[0145] 在一个实施例中，如图8所示，提供了一种用户请求处理装置800，装置包括：

[0146] 请求接收模块802，用于接收用户请求，用户请求携带有用户数据。

[0147] 价值计算模块804，用于通过上述实施例中的用户价值预测方法对用户数据进行处理，得到用户价值。

[0148] 策略匹配模块806，用于获取与用户价值对应的服务策略。

[0149] 处理模块808，用于根据服务策略对用户请求进行处理。

[0150] 关于上述装置的具体限定可以参见上文中对于上述方法的限定，在此不再赘述。上述装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬
件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中
的存储器中，以便于处理器调用执行以上各个模块对应的操作。

[0151] 在其中一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接
口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储
器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和
数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该
计算机设备的数据库用于存储预测用户价值的相关业务数据。该计算机设备的网络接口用
于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种价值预测模
型输入数据生成方法。

[0152] 本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备
可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

[0153] 在其中一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取目标用户对应的目标历
史业务数据；从目标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；当
存在未提取到目标特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特
征，并获取与目标用户对应的相似用户以及目标用户与相似用户的相似度；从相似用户对
应的相似业务数据中提取与缺失特征对应的相似特征值；根据相似用户的相似度以及相似
特征值，计算得到缺失特征对应的缺失特征值；根据计算得到的缺失特征值，及提取到的目
标特征值得到价值预测模型输入数据。

[0154] 在其中一个实施例中，处理器执行计算机程序时实现获取与目标用户对应的相似用户以及目标用户与相似用户的相似度的步骤时还用于：从相似用户对应的相似业务数据
中，提取预设的各目标特征分别对应的相似特征值；根据各相似特征值确定相似特征均值；
根据目标历史业务数据中各正常特征分别对应的正常特征值，确定正常特征均值；根据相
似特征均值以及各目标特征对应的相似特征值，确定各目标特征的相似差值；根据目标特
征均值以及各目标特征对应的目标特征值，确定各目标特征的目标差值；根据各目标特征
对应的相似差值以及目标差值，确定目标用户与相似用户的相似度。

[0155] 在其中一个实施例中，处理器执行计算机程序时实现根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值的步骤时还用于：根据各相似用户分别
对应的相似特征均值、相似特征值以及相似度，确定各相似用户对应的相似调整值；根据正
常特征均值以及各相似用户分别对应的相似调整值，计算得到缺失特征对应的缺失特征
值。

[0156] 在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：对目标历史业务数据进行预处理；预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

[0157] 在其中一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：根据上述实施例中的价值预
测模型输入数据生成方法，获取模型输入数据；将模型输入数据输入至预先构建的价值预
测模型中，根据价值预测模型得到目标用户在未来时间段内的预测价值；其中，价值预测模
型是根据训练特征以及训练价值构建的，且训练特征以及训练价值是从多于一个的用户分
别对应的历史业务数据中得到的。

[0158] 在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：获取多于一个的用户分别对应的历史业务数据；分别从各历史业务数据中提取训练特征；从训练特征中
提取价值计算特征；获取各价值计算特征的特征权重；根据特征权重以及价值计算特征确
定各用户的训练价值；根据训练特征以及训练价值训练预测模型，当满足训练结束条件时，
停止预测模型的训练得到价值预测模型。

[0159] 在其中一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现以下步骤：接收用户请求，用户请求携带
有用户数据；通过上述实施例中的用户价值预测方法对用户数据进行处理，得到用户价值；
获取与用户价值对应的服务策略；根据服务策略对用户请求进行处理。

[0160] 在其中一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取目标用户对应的目标历史业务数据；从目
标历史业务数据中提取预设的多个目标特征分别对应的目标特征值；当存在未提取到目标
特征值的目标特征时，将未提取到目标特征值的目标特征作为缺失特征，并获取与目标用
户对应的相似用户以及目标用户与相似用户的相似度；从相似用户对应的相似业务数据中
提取与缺失特征对应的相似特征值；根据相似用户的相似度以及相似特征值，计算得到缺
失特征对应的缺失特征值；根据计算得到的缺失特征值，及提取到的目标特征值得到价值
预测模型输入数据。

[0161] 在其中一个实施例中，计算机程序被处理器执行时实现获取与目标用户对应的相似用户以及目标用户与相似用户的相似度的步骤时还用于：从相似用户对应的相似业务数
据中，提取预设的各目标特征分别对应的相似特征值；根据各相似特征值确定相似特征均
值；根据目标历史业务数据中各正常特征分别对应的正常特征值，确定正常特征均值；根据
相似特征均值以及各目标特征对应的相似特征值，确定各目标特征的相似差值；根据目标
特征均值以及各目标特征对应的目标特征值，确定各目标特征的目标差值；根据各目标特
征对应的相似差值以及目标差值，确定目标用户与相似用户的相似度。

[0162] 在其中一个实施例中，计算机程序被处理器执行时实现根据相似用户的相似度以及相似特征值，计算得到缺失特征对应的缺失特征值的步骤时还用于：根据各相似用户分
别对应的相似特征均值、相似特征值以及相似度，确定各相似用户对应的相似调整值；根据
正常特征均值以及各相似用户分别对应的相似调整值，计算得到缺失特征对应的缺失特征
值。

[0163] 在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：对目标历史业务数据进行预处理；预处理包括数据校验、数据清洗以及数据归一化中的至少一种。

[0164] 在其中一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，计算机程序被处理器执行时实现以下步骤：根据上述实施例中的价值预
测模型输入数据生成方法，获取模型输入数据；将模型输入数据输入至预先构建的价值预
测模型中，根据价值预测模型得到目标用户在未来时间段内的预测价值；其中，价值预测模
型是根据训练特征以及训练价值构建的，且训练特征以及训练价值是从多于一个的用户分
别对应的历史业务数据中得到的。

[0165] 在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取多于一个的用户分别对应的历史业务数据；分别从各历史业务数据中提取训练特征；从训练特征
中提取价值计算特征；获取各价值计算特征的特征权重；根据特征权重以及价值计算特征
确定各用户的训练价值；根据训练特征以及训练价值训练预测模型，当满足训练结束条件
时，停止预测模型的训练得到价值预测模型。

[0166] 在其中一个实施例中，提供了一种计算机设备，包括存储器和处理器，该存储器存储有计算机程序，该计算机程序被处理器执行时实现以下步骤：接收用户请求，用户请求携
带有用户数据；通过上述实施例中的用户价值预测方法对用户数据进行处理，得到用户价
值；获取与用户价值对应的服务策略；根据服务策略对用户请求进行处理。

[0167] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读
取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申
请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括
非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM
（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括
随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，
诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强
型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM
（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

[0168] 以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛
盾，都应当认为是本说明书记载的范围。

[0169] 以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在
不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。
因此，本申请专利的保护范围应以所附权利要求为准。

价值预测模型输入数据生成方法、装置、设备和介质转让专利

申请号 : CN202110531498.4

文献号 : CN112990989B

文献日 : 2021-07-30

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 刘志伟

申请人 : 太平金融科技服务(上海)有限公司深圳分公司

摘要 :

权利要求 :

说明书 :