基于多维度交叉特征的信用评价方法、装置、设备及介质转让专利

申请号 : CN202011495154.4

文献号 : CN112232951B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 梁德威彭艺焦建益

申请人 : 中证信用云科技(深圳)股份有限公司

摘要 :

本发明实施例公开了一种基于多维度交叉特征的信用评价方法,包括:接收信用评价指令,获取与待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;对所述多个变量下的初步数据进行分组;针对每个分组进行至少一次模型训练,获取该分组对应的子模型,其中:对至少一个变量进行第一筛选操作、第二筛选操作,确定至少一个目标特征;根据至少一个第二变量确定对应的目标组合特征,构建该分组对应的子模型;根据每个分组对应的子模型,构建目标评价模型;根据目标评价模型,获取与所述待评价用户对应的信用评价结果。本发明实施例还公开了相应的装置、设备及存储介质。采用本发明,可提高基于互联网大数据的信用评价的准确性。

权利要求 :

1.一种基于多维度交叉特征的信用评价方法,其特征在于,所述方法包括:接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;

根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;

对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;

针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型,其中:

使用gradient boosting tree算法根据重要值评价值对至少一个变量进行第一筛选操作,确定至少一个第一变量;

基于对至少一个第一变量的穷举组合进行第二筛选操作,获取每一个变量组合对应的组合特征;分别计算每一个组合特征对应的第二特征值,根据第二特征值是否大于或等于预设的特征阈值确定目标组合特征;

基于目标组合特征以及与该目标组合特征对应的变量,在引入惩罚因子的情况下,构建该分组对应的子模型;

使用改进的boosting算法对每个分组对应的子模型进行模型叠加,构建目标评价模型;

根据目标评价模型,获取与所述待评价用户对应的信用评价结果。

2.根据权利要求1所述的基于多维度交叉特征的信用评价方法,其特征在于,所述对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个的步骤,还包括:根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组,所述属性信息包括与该变量对应的初步数量对应数据来源、数据维度、时间中的一个或多个。

3.根据权利要求2所述的基于多维度交叉特征的信用评价方法,其特征在于,所述根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组的步骤之后,包括:针对每个分组下的变量的初步数据,进行数据预处理;

所述数据预处理包括删除数据完整度过低的初步数据、删除高度共线性的初步数据、删除数据来源可靠性过低的初步数据、删除时间间隔过早的初步数据中的一个或多个。

4.根据权利要求1所述的基于多维度交叉特征的信用评价方法,其特征在于,所述使用gradient boosting tree算法根据重要值评价值对至少一个变量进行第一筛选操作,确定至少一个第一变量的步骤,还包括:基于随机样本计算每一个变量对应的重要性评价值;

根据所述重要性评价值是否大于或等于预设的重要性阈值确定至少一个第一变量。

5.根据权利要求1所述的基于多维度交叉特征的信用评价方法,其特征在于,所述基于对至少一个第一变量的穷举组合进行第二筛选操作,获取每一个变量组合对应的组合特征的步骤,包括:

对至少一个第一变量进行穷举组合,获取K元组,其中K为大于等于2的整数;

针对每一个K元组构建对应的决策树特征,计算决策树特征的每一个叶子节点的第三特征值,根据决策树特征和对应的第三特征值确定该K元组对应的组合特征。

6.一种基于多维度交叉特征的信用评价装置,其特征在于,所述装置包括:信用评价指令接收模块,用于接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;

数据获取模块,用于根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;

数据分组模块,用于对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;

分组子模型构建模块,用于针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型;

其中,所述分组子模型构建模块包括:第一筛选子单元,用于使用gradient boosting tree算法根据重要值评价值对至少一个变量进行第一筛选操作,确定至少一个第一变量;

第二筛选子单元,用于基于对至少一个第一变量的穷举组合进行第二筛选操作,获取每一个变量组合对应的组合特征;

特征组合子单元,用于分别计算每一个组合特征对应的第二特征值,根据第二特征值是否大于或等于预设的特征阈值确定目标组合特征;

子模型构建子单元,用于基于目标组合特征以及与该目标组合特征对应的变量,在引入惩罚因子的情况下,构建该分组对应的子模型;

目标评价模型构建模块,用于根据每个分组对应的子模型,使用改进的boosting算法对每个分组对应的子模型进行模型叠加,构建目标评价模型;

评价模块,根据目标评价模型,获取与所述待评价用户对应的信用评价结果。

7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。

8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。

说明书 :

基于多维度交叉特征的信用评价方法、装置、设备及介质

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质。

背景技术

[0002] 在传统的金融信贷场景下,对用户的信用进行评价主要是基于征信数据、房产数据、收入存款数据等。但是也同样存在大量的无传统信用数据或数据接近于空白的用户,例
如,征信白户、无房产用户等,从而造成了传统的信用评估无法准确进行评估。
[0003] 但是,在互联网大数据时代中,在互联网中存在大量与用户对应的数据,例如,多头申请和多头借贷、移动设备行为特征、消费指数、移动轨迹等,这些数据也可以对用户的
信用进行评估。但是互联网大数据的噪声过大,且没有有效的评估模型,无法根据互联网大
数据对用户信用进行有效的评估。

发明内容

[0004] 基于此,有必要针对上述问题,提出了一种基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质。
[0005] 在本发明的第一部分,提供了一种基于多维度交叉特征的信用评价方法,所述方法包括:
[0006] 接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;
[0007] 根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;
[0008] 对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;
[0009] 针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型,其中:对至少一个变量进行第一筛选操作,确定至少一个第一变量;对至
少一个第一变量进行第二筛选操作,确定至少一个目标特征;根据至少一个第二变量确定
对应的目标组合特征;基于目标组合特征以及与该目标组合特征对应的变量,构建该分组
对应的子模型;
[0010] 根据每个分组对应的子模型,构建目标评价模型;
[0011] 根据目标评价模型,获取与所述待评价用户对应的信用评价结果。
[0012] 可选的,所述对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个的步骤,还包括:根据每一个变量对应的初步数据的属性信息,对所述信用数据
进行分组,所述属性信息包括与该变量对应的初步数量对应数据来源、数据维度、时间中的
一个或多个。
[0013] 可选的,所述根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组的步骤之后,包括:针对每个分组下的变量的初步数据,进行数据预处理;所述数据预
处理包括删除数据完整度过低的初步数据、删除高度共线性的初步数据、删除数据来源可
靠性过低的初步数据、删除时间间隔过早的初步数据中的一个或多个。
[0014] 可选的,所述对至少一个变量进行第一筛选操作,确定至少一第一变量的步骤,还包括:基于随机样本计算每一个变量对应的重要性评价值;根据所述重要性评价值是否大
于或等与预设的重要性阈值确定至少一个第一变量。
[0015] 可选的,所述对至少一个第一变量进行第二筛选操作,确定至少一个目标组合特征的步骤,还包括:对至少一个第一变量进行穷举组合,获取每一个变量组合对应的组合特
征;分别计算每一个组合特征对应的第二特征值,根据第二特征值是否大于或等于预设的
特征阈值确定目标组合特征。
[0016] 可选的,所述对至少一个第一变量进行穷举组合,获取每一个变量组合对应的组合特征的步骤,包括:对至少一个第一变量进行穷举组合,获取K元组,其中K为大于等于2的
整数;针对每一个K元组构建对应的决策树特征,计算决策树特征的每一个叶子节点的第三
特征值,根据决策树特征和对应的第三特征值确定该K元组对应的组合特征。
[0017] 可选的,所述根据每个分组对应的子模型,构建目标评价模型的步骤,包括:使用改进的boosting算法对每个分组对应的子模型进行模型叠加,获取目标评价模型。
[0018] 在本发明的第二部分,提供了一种基于多维度交叉特征的信用评价装置,包括:
[0019] 信用评价指令接收模块,用于接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;
[0020] 数据获取模块,用于根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;
[0021] 数据分组模块,用于对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;
[0022] 分组子模型构建模块,用于针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型;
[0023] 其中,所述分组子模型构建模块包括:
[0024] 第一筛选子单元,用于对至少一个变量进行第一筛选操作,确定至少一个第一变量;
[0025] 第二筛选子单元,用于对至少一个第一变量进行第二筛选操作,确定至少一个目标特征;
[0026] 特征组合子单元,用于根据至少一个第二变量确定对应的目标组合特征;
[0027] 子模型构建子单元,用于基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型;
[0028] 目标评价模型构建模块,用于根据每个分组对应的子模型,构建目标评价模型;
[0029] 评价模块,根据目标评价模型,获取与所述待评价用户对应的信用评价结果。
[0030] 在本发明的第三部分,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器如上所述的基
于多维度交叉特征的信用评价方法。
[0031] 在本发明的第四部分,提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述的基于多维度交叉特征的信用
评价方法。
[0032] 采用本发明实施例,具有如下有益效果:
[0033] 采用了上述基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质之后,在金融信贷等应用场景下,对于待评价用户,从互联网大数据获取该用户
对应的多个维度的数据,然后对数据进行分组,针对每一个分组进行多次变量筛选、特征筛
选,然后基于筛选后的变量构建每个分组下的子模型,然后对多个子模型进行叠加处理,得
到最终的基于多维度交叉特征的目标评价模型,通过该目标评价模型对待评价用户进行评
价,输出目标评价结果,完成对待评价用户的信用评价。通过上述目标评价模型对用户的信
用进行评价,可以更好的利用互联网大数据完成信用评价,提高信用评价的准确性。

附图说明

[0034] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的附图。
[0035] 其中:
[0036] 图1为一个实施例中一种基于多维度交叉特征的信用评价方法的流程示意图;
[0037] 图2为一个实施例中子模型构建的流程示意图;
[0038] 图3为一个实施例中一种基于多维度交叉特征的信用评价方法的流程示意图;
[0039] 图4为一个实施例中一种基于多维度交叉特征的信用评价装置的结构框图;
[0040] 图5为一个实施例中一种基于多维度交叉特征的信用评价装置的结构框图;
[0041] 图6为一个实施例中计算机设备的结构框图。

具体实施方式

[0042] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于
本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
[0043] 在本实施例中,提供了一种基于多维度交叉特征的信用评价方法,可以提高金融信贷等过程中的信用评价的准确性。其中,该基于多维度交叉特征的信用评价方法适用于
金融信贷等应用场景下的用户信用评价,通过该方法可以更加准确的对用户信用进行评
价,以降低金融信贷等场景下的信贷风险。
[0044] 上述方法的实现可依赖于计算机程序,该计算机程序可运行于基于冯诺依曼体系的计算机系统之上,该计算机程序可以是用户信用评价的应用程序。该计算机系统可以是
运行上述计算机程序的例如智能手机、平板电脑、个人电脑、服务器等计算机设备。
[0045] 具体的,请参考图1,上述基于多维度交叉特征的信用评价方法包括如图1所述的步骤:
[0046] 步骤S102:接收信用评价指令,所述信用评价指令包含待评价用户的用户标识。
[0047] 在需要进行信用评价的情况下,根据需要待评价用户生成对应的信用评价指令,其中包含了待评价用户对应的用户标识,例如,用户姓名、身份证号码等。
[0048] 步骤S104:根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据。
[0049] 在互联网环境下,通过用户标识获取待评价用户对应的各种信用数据,其中包括了互联网数据、银行内部数据等。例如,多头申请和多头借贷、移动设备行为特征、消费指
数、移动轨迹、征信数据、房产数据、收入数据等多个维度下的数据。其中,每一种数据为一
个变量,对应的数据为该变量下的初步数据。例如,从互联网大数据环境下,获取与待评价
用户对应的消费指数对应的数据,该数据即为初步数据,对应的变量为消费指数。
[0050] 步骤S106:对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个。
[0051] 在本实施例中,需要从互联网大数据中获取的高维的信用数据中确定多个变量来构建信用评估模型,这就需要对多个维度的信用数据进行筛选。
[0052] 首先需要对大量的信用数据进行分组,然后在分组后对信用数据进行进一步的筛选。
[0053] 具体实施中,根据每一个变量对应的初步数据,根据其对应的属性信息,例如数据来源、变量特性、数据维度、数据时间等多个维度进行分组,还可以根据初步数据对应的组
别的划分进行分组,例如,将初步数据按照预设的多个分组进行划分,这多个分组包括了稳
定性数据、消费性数据、借贷意向数据、评分类数据等。
[0054] 在分组以后,还需要对数据进行清洗,具体包括对数据进行预处理。其中,预处理的操作包括删除数据完整度过低的初步数据、删除高度共线性的初步数据、删除数据来源
可靠性过低的初步数据、删除时间间隔过早的初步数据中的一个或多个。其目的是为了去
掉不可靠的数据以提高后续模型建立的准确性,也为了去掉高度共线性的数据以减少后续
模型建立的数据冗余。
[0055] 步骤S108:针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型。
[0056] 在本步骤中,需要针对每一个分组下的数据进行变量的筛选、组合,然后转化成对应的特征,并构建每一个分组下的子模型。
[0057] 其中,请参见图2,上述步骤S108包括如下步骤:
[0058] 步骤S1082:对至少一个变量进行第一筛选操作,确定至少一个第一变量。
[0059] 在本步骤是,首先需要对变量进行筛选,去掉对信用评价作用不大的数据。具体执行中是通过评价每一个变量的重要性,计算对应的重要性评价值。
[0060] 使用gradient boosting tree算法,进行模型预训练,训练过程重复多次。每次训练中,先对样本进行随机抽样,训练完成后,计算各个变量的重要性。全部训练完成后,统计
各在每一次训练过程中确定的变量的重要性的平均值或累积值作为该变量对应的重要性
评价值。然后根据重要性评价值在多个变量中确定多个变量作为第一变量。
[0061] 具体执行中,可以按照重要性评价值对变量进行排序,获取排序在前的N个变量作为第一变量,其中N为预设的重要性阈值,该阈值为排序的序号。
[0062] 或者,也可以根据重要性评价值是否大于或等于预设的重要性阈值,其中该阈值为重要性评价值的一个取值,该阈值可以为0.99,也可以是其他取值,在此处不做限定;然
后获取大于或等于预设的重要性阈值的重要性评价值对应的变量作为第一变量,从而完成
第一筛选操作。
[0063] 在上述计算过程中,重要性的计算可以是通过函数identify_low_importance来计算的。
[0064] 步骤S1084:对至少一个第一变量进行第二筛选操作,确定至少一个目标特征。
[0065] 在本步骤中,需要对变量进行第二次筛选操作(即第二筛选操作),并转化成对应的特征,以用于后续的模型构建。
[0066] 对于所有的第一变量,穷举所有的变量组合,该组合可以为K元组,其中,K为大于或等于2的正整数。针对穷举的每一个变量组合,构建对应的组合特征。其中,组合特征的构
建为:
[0067] 针对每一个变量组合,构建对应的决策树作为决策树特征,然后将决策树中包含的每一个叶子节点都映射成对应的WOE值,即第三特征值。每一个决策树的WOE输出即为该
变量组合的组合特征。
[0068] 其中,叶子节点的WOE值的计算可以是通过如下公式计算的:
[0069] ;
[0070] 其中,WOEi表示第i个叶子节点的WOE值,Badi为该变量组中所有未响应的特征的数量,BadT为所有变量中未响应的特征的数量;Goodi为该变量组中所有响应的特征的数量,
GoodT为所有变量中响应的特征的数量。
[0071] 步骤S1086:根据至少一个第二变量确定对应的目标组合特征。
[0072] 进一步的,针对每一个变量组合对应的组合特征,计算对应的第二特征值。具体的,针对每一个决策树的WOE输出对应组合特征,计算对一个的IV值(即第二特征值)。然后
根据第二特征值是否大于或等与预设的特征阈值,选择对应的第二特征值对应 组合特征
作为目标组合特征,并确定对应的变量组合。也就是说,在本实施例中,需要删除第二特征
值过低的组合特征,筛选出更适合的组合特征以构建后续的模型。
[0073] 步骤S1088:基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型。
[0074] 根据步骤S1086中保留的目标组合特征,建立每个分组下的子模型。具体的,针对每个分组下得到的目标组合特征,通过逻辑回归,构建每一个分组对应的子模型。其中,构
建子模型的过程中,为了防止数据过度拟合,仅得到局部最优解,而不是全局最优解,需要
在模型中引入惩罚因子,以保留多个对最终的用户信用评价具有相关性的特征中的一个,
以降低模型维度。
[0075] 在另一个实施例,还可以通过其他方式对变量进行选择,挑选出相对重要的特征,以进一步优化每个分组下的子模型。
[0076] 步骤S110:根据每个分组对应的子模型,构建目标评价模型。
[0077] 在针对每个分组对应的子模型之后,即可进行子模型的叠加,从而得到最近的目标评价模型。具体的,对多个子模型进行叠加可以使用改进Boosting算法来对多个子模型
进行叠加,叠加得到的最终的目标评价模型。
[0078] 具体的,通过改进的Boosting算法对子模型进行叠加的过程如下:
[0079] 将训练集记为: ,其中,xi为正训练样本,yi为负训练样本,N为样本数量,将子模型记为:分类器 及其概率函数 ,其中,
x为训练集中的一个训练样本(正训练样本或负训练样本), 。
[0080] 初始化步骤:样本权重 ,其中, ;备选子模型集合,定义损失函数 。
[0081] 循环步骤:对于训练次数 ,重复执行下述步骤:
[0082] 从 中选择一个最优分类器 ,即 ;
[0083] 令函数 ,对权重进行更新 ,其中 为归一化因子,然后对备选子模型集合进行更新:
[0084] 。
[0085] 最终输出步骤:最终输出的目标评价模型为 。
[0086] 步骤S112:根据目标评价模型,获取与所述待评价用户对应的信用评价结果。
[0087] 根据最终得到的目标评价模型,可以对待评价用户的信用数据进行输出对应的评价结果。在本实施例中。输出的评价结果即为步骤S112中的信用评价结果。
[0088] 为了方便对用户信用进行评价,还可以将目标评价模型的输出设置为在预设区间内的评分,例如,[0,100]之间的评分值作为目标评价模型的输出,并作为与待评价用户对
应的信用评价结果。
[0089] 通过上述目标评价模型的构建以及对待评价用户的信用评估,得出的信用评价结果可以合理的利用互联网大数据,不限于传统银行的数据,对待评价用户进行更为准确的
评价,从而提高信用评价的准确性,降低金融信贷场景下的信贷风险。
[0090] 进一步的,请参见图3,给出了上述基于多维度交叉特征的信用评价方法的执行流程示意图。在个人用户申请贷款的情况下,对用户的基本信息进行评价,然后通过上述基于
多维度交叉特征的信用评价方法构建目标评价模型,并对用户的目标评价结果,在信用评
价通过的情况下完成贷款的审批。
[0091] 进一步的,为了更加全面的对用户的信贷情况进行了解,输出的不仅仅是信用评价的评分值,还包括了与用户的信用评价结果有较大影响的变量的分析报告,其中包括了
对信用评价结果有较大正面影响的一个或多个变量、以及对信用评价结果有较大负面影响
的一个或多个变量,并且不限于上述两种变量,以更加全面的对用户的信用情况进行评价
和了解。
[0092] 进一步的,在本实施例中,还提出了一种基于多维度交叉特征的信用评价装置。具体的,请参见图4,上述基于多维度交叉特征的信用评价装置包括:
[0093] 信用评价指令接收模块102,用于接收信用评价指令,所述信用评价指令包含待评价用户的用户标识;
[0094] 数据获取模块104,用于根据所述用户标识获取与所述待评价用户对应的信用数据,所述信用数据包括多个变量下的初步数据;
[0095] 数据分组模块106,用于对所述多个变量下的初步数据进行分组,每个分组下的变量的数量为至少一个;
[0096] 分组子模型构建模块108,用于针对每个分组下的至少一个变量的初步数据,进行至少一次模型训练,获取该分组对应的子模型;
[0097] 其中,如图5所述,分组子模型构建模块108包括:
[0098] 第一筛选子单元1082,用于对至少一个变量进行第一筛选操作,确定至少一个第一变量;
[0099] 第二筛选子单元1084,用于对至少一个第一变量进行第二筛选操作,确定至少一个目标特征;
[0100] 特征组合子单元1086,用于根据至少一个第二变量确定对应的目标组合特征;
[0101] 子模型构建子单元1088,用于基于目标组合特征以及与该目标组合特征对应的变量,构建该分组对应的子模型;
[0102] 目标评价模型构建模块110,用于根据每个分组对应的子模型,构建目标评价模型;
[0103] 评价模块112,根据目标评价模型,获取与所述待评价用户对应的信用评价结果。
[0104] 可选的,数据分组模块106还用于根据每一个变量对应的初步数据的属性信息,对所述信用数据进行分组,所述属性信息包括与该变量对应的初步数量对应数据来源、数据
维度、时间中的一个或多个。
[0105] 可选的,数据分组模块106还用于针对每个分组下的变量的初步数据,进行数据预处理;
[0106] 所述数据预处理包括删除数据完整度过低的初步数据、删除高度共线性的初步数据、删除数据来源可靠性过低的初步数据、删除时间间隔过早的初步数据中的一个或多个。
[0107] 可选的,第一筛选子单元1082还用于基于随机样本计算每一个变量对应的重要性评价值;根据所述重要性评价值是否大于或等与预设的重要性阈值确定至少一个第一变
量。
[0108] 可选的,第二筛选子单元1084还用于对至少一个第一变量进行穷举组合,获取每一个变量组合对应的组合特征;特征组合子单元1086还用于分别计算每一个组合特征对应
的第二特征值,根据第二特征值是否大于或等于预设的特征阈值确定目标组合特征。
[0109] 可选的,第二筛选子单元1084还用于对至少一个第一变量进行穷举组合,获取K元组,其中K为大于等于2的整数;针对每一个K元组构建对应的决策树特征,计算决策树特征
的每一个叶子节点的第三特征值,根据决策树特征和对应的第三特征值确定该K元组对应
的组合特征。
[0110] 可选的,目标评价模型构建模块110还用于使用改进的boosting算法对每个分组对应的子模型进行模型叠加,获取目标评价模型。
[0111] 图6示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图6所示,该计算机设备包括通过系统总线连接的处理器、存储器和
网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储
介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理
器实现上述方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可
使得处理器执行上述方法。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请
方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,
具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有
不同的部件布置。
[0112] 在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行前述基于多维
度交叉特征的信用评价方法。
[0113] 在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行前述基于多维度交叉特征的信用评价方法。
[0114] 采用了上述基于多维度交叉特征的信用评价方法、装置、计算机设备和计算机可读存储介质之后,在金融信贷等应用场景下,对于待评价用户,从互联网大数据获取该用户
对应的多个维度的数据,然后对数据进行分组,针对每一个分组进行多次变量筛选、特征筛
选,然后基于筛选后的变量构建每个分组下的子模型,然后对多个子模型进行叠加处理,得
到最终的基于多维度交叉特征的目标评价模型,通过该目标评价模型对待评价用户进行评
价,输出目标评价结果,完成对待评价用户的信用评价。通过上述目标评价模型对用户的信
用进行评价,可以更好的利用互联网大数据完成信用评价,提高信用评价的准确性。
[0115] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取
存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供
的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性
和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编
程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器
(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM
(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM
(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直
接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0116] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0117] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员
来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保
护范围。因此,本申请专利的保护范围应以所附权利要求为准。