用户金融风险预估方法、装置、电子设备及可读介质转让专利

申请号 : CN201910330539.6

文献号 : CN110111198A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张潮华高明宇朱明林沈赟郑彦

申请人 : 上海淇玥信息技术有限公司

摘要 :

本公开涉及一种基于时序行为模型的用户金融风险预估方法、装置、电子设备及计算机可读介质。该方法包括:获取用户的基础数据,所述基础数据包括行为数据与属性数据;通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级。本公开涉及的基于时序行为模型的用户金融风险预估方法、装置、电子设备及计算机可读介质,能够预测用户在未来一段时间内的金融风险等级,企业可依据金融风险等级及时采取措施,避免损失。

权利要求 :

1.一种基于时序行为模型的用户金融风险预估方法,其特征在于,包括:获取用户的基础数据,所述基础数据包括行为数据与属性数据;

通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;

将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级。

2.如权利要求1所述的方法,其特征在于,还包括:通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型。

3.如权利要求1所述的方法,其特征在于,通过所述行为数据与所述属性数据生成多维度特征数据包括:基于所述行为数据确定多个目标行为及其对应的时间;

将所述多个目标行为按照其对应的时间排序;以及通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据。

4.如权利要求3所述的方法,其特征在于,通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据包括:通过首个目标行为与末尾目标行为的间隔时间确定所述时长维度数据;和/或通过所述末尾目标行为所对应的时间确定所述行为维度数据;和/或通过所述多个目标行为的数量确定所述频率维度数据;和/或通过所述属性数据中的金额确定所述属性维度数据。

5.一种基于时序行为模型的用户金融风险预估装置,其特征在于,包括:基础数据模块,用于获取用户的基础数据,所述基础数据包括行为数据与属性数据;

特征数据模块,用于通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;

模型计算模块,用于将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及行为预估模块,用于基于所述目标行为概率确定所述用户的金融风险等级。

6.如权利要求5所述的装置,其特征在于,还包括:模型训练模块,用于通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型。

7.如权利要求5所述的装置,其特征在于,所述模型训练模块包括:聚类单元,用于通过历史用户的基础数据与无监督学习模型建立所述时序行为模型;

和/或

决策单元,用于通过历史用户的基础数据与有监督学习模型建立所述时序行为模型。

8.如权利要求5所述的装置,其特征在于,所述模型训练模块包括:历史数据单元,用于通过历史用户的基础数据生成历史多维度特征数据;

训练测试单元,用于通过所述历史多维度特征数据生成训练集数据与测试集数据;

分箱编码单元,用于分别对训练集数据与测试集数据中的所述历史多维度数据的每一维度数据进行分箱编码;以及训练单元,用于将分箱编码后的训练集数据输入所述至少一个机器学习模型中,通过分箱编码后的测试集数据进行验证以建立所述时序行为模型。

9.一种电子设备,其特征在于,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。

10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-4中任一所述的方法。

说明书 :

用户金融风险预估方法、装置、电子设备及可读介质

技术领域

[0001] 本公开涉及计算机信息处理领域,具体而言,涉及一种基于时序行为模型的用户金融风险预估方法、装置、电子设备及计算机可读介质。

背景技术

[0002] 信贷是指以偿还和付息为条件的价值运动形式,通常包括银行存款、贷款等信用活动,信贷是社会主义国家用有偿方式动员和分配资金的重要形式,是发展经济的有力杠杆。贷款的产生必然伴随着金融风险,在还款期限届满之前,用户个人的财务商务状况的重大不利变化很可能影响其履约能力,从而发生呆账、坏账等风险,因此,为了降低此类风险的发生概率,需要对用户的金融风险进行评估。
[0003] 传统金融机构对于用户的金融风险评估主要依据两种方式:一种是人为评估,主要依靠人类的历史经验进行评估,这种人工评判的方式一方面增加了人工成本和处理时间,另一方面通过人工方式生成的经验规则,通常是需要在一个危险行为已经发生一段时间之后,给企业带来了大量的经济损失之后才被建立,这种滞后的方式增加了企业的风险;另一种是依据个人信用评分系统,现有技术中用户金融风险评估系统在进行用户金融风险评估时依赖于一些基础数据,评估维度单一,导致评估结果不够准确。而且,通过该方法与用户的基础数据评估出金融风险的时候,该金融风险常常已无法避免。
[0004] 因此,需要一种新的基于时序行为模型的用户金融风险预估方法、装置、电子设备及计算机可读介质。
[0005] 在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

[0006] 有鉴于此,本公开提供一种基于时序行为模型的用户金融风险预估方法、装置、电子设备及计算机可读介质,能够预测用户在未来一段时间内的金融风险等级,企业可依据金融风险等级及时采取措施,避免损失。
[0007] 本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008] 根据本公开的一方面,提出一种基于时序行为模型的用户金融风险预估方法,该方法包括:获取用户的基础数据,所述基础数据包括行为数据与属性数据;通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级。
[0009] 在本公开的一个实施例中,还包括:通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型。
[0010] 在本公开的一个实施例中,通过所述行为数据与所述属性数据生成多维度特征数据包括:基于所述行为数据确定多个目标行为及其对应的时间;将所述多个目标行为按照其对应的时间排序;以及通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据。
[0011] 在本公开的一个实施例中,通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据包括:通过首个目标行为与末尾目标行为的间隔时间确定所述时长维度数据;和/或通过所述末尾目标行为所对应的时间确定所述行为维度数据;和/或通过所述多个目标行为的数量确定所述频率维度数据;和/或通过所述属性数据中的金额确定所述属性维度数据。
[0012] 在本公开的一个实施例中,将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率包括:将所述多维度特征数据进行分箱编码;将分箱编码后的所述多维度特征数据输入所述时序行为模型中;所述时序行为模型对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。
[0013] 在本公开的一个实施例中,所述时序行为模型对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率包括:所述时序行为模型按照多维度评估指标对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。
[0014] 在本公开的一个实施例中,所述时序行为模型按照多维度评估指标对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率包括:所述时序行为模型按照多维度评估指标对所述多维度特征数据进行无监督聚类以确定所述用户的目标行为概率;和/或所述时序行为模型按照多维度评估指标对所述多维度特征数据进行决策树分组以确定所述用户的目标行为概率。
[0015] 在本公开的一个实施例中,基于所述目标行为概率确定所述用户的金融风险等级包括:判断所述目标行为概率是否大于阈值;以及在所述目标行为概率大于阈值时,基于所述目标行为概率确定用户的风险等级。
[0016] 在本公开的一个实施例中,通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型包括:通过历史用户的基础数据与无监督学习模型建立所述时序行为模型;和/或通过历史用户的基础数据与有监督学习模型建立所述时序行为模型。
[0017] 在本公开的一个实施例中,通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型包括:通过历史用户的基础数据生成历史多维度特征数据;通过所述历史多维度特征数据生成训练集数据与测试集数据;分别对训练集数据与测试集数据中的所述历史多维度数据的每一维度数据进行分箱编码;以及将分箱编码后的训练集数据输入所述至少一个机器学习模型中,通过分箱编码后的测试集数据进行验证以建立所述时序行为模型。
[0018] 在本公开的一个实施例中,将分箱编码后的训练集数据输入所述至少一个机器学习模型中,通过分箱编码后的测试集数据进行验证以建立所述时序行为模型包括:将分箱编码后的训练集数据输入所述至少一个机器学习模型中,生成多维度预估指标;通过分箱编码后的测试集数据验证所述多维度预估指标;以及在验证通过后基于所述多维度预估指标确定所述时序行为模型。
[0019] 根据本公开的一方面,提出一种基于时序行为模型的用户金融风险预估装置,该装置包括:基础数据模块,用于获取用户的基础数据,所述基础数据包括行为数据与属性数据;特征数据模块,用于通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;模型计算模块,用于将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及行为预估模块,用于基于所述目标行为概率确定所述用户的金融风险等级。
[0020] 在本公开的一个实施例中,还包括:模型训练模块,用于通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型。
[0021] 在本公开的一个实施例中,所述模型训练模块包括:聚类单元,用于通过历史用户的基础数据与无监督学习模型建立所述时序行为模型;和/或决策单元,用于通过历史用户的基础数据与有监督学习模型建立所述时序行为模型。
[0022] 在本公开的一个实施例中,所述模型训练模块包括:历史数据单元,用于通过历史用户的基础数据生成历史多维度特征数据;训练测试单元,用于通过所述历史多维度特征数据生成训练集数据与测试集数据;分箱编码单元,用于分别对训练集数据与测试集数据中的所述历史多维度数据的每一维度数据进行分箱编码;以及训练单元,用于将分箱编码后的训练集数据输入所述至少一个机器学习模型中,通过分箱编码后的测试集数据进行验证以建立所述时序行为模型。
[0023] 在本公开的一个实施例中,所述训练单元包括:输入子单元,用于将分箱编码后的训练集数据输入所述至少一个机器学习模型中,生成多维度预估指标;验证子单元,用于通过分箱编码后的测试集数据验证所述多维度预估指标;以及指标子单元,用于在验证通过后基于所述多维度预估指标确定所述时序行为模型。
[0024] 在本公开的一个实施例中,所述特征数据模块包括:时间单元,用于基于所述行为数据确定多个目标行为及其对应的时间;排序单元,用于将所述多个目标行为按照其对应的时间排序;以及特征单元,用于通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据。
[0025] 在本公开的一个实施例中,所述特征单元包括:时长子单元,用于通过首个目标行为与末尾目标行为的间隔时间确定所述时长维度数据;和/或行为子单元,用于通过所述末尾目标行为所对应的时间确定所述行为维度数据;和/或频率子单元,用于通过所述多个目标行为的数量确定所述频率维度数据;和/或属性子单元,用于通过所述属性数据中的金额确定所述属性维度数据。
[0026] 在本公开的一个实施例中,所述模型计算模块包括:处理单元,用于将所述多维度特征数据进行分箱编码;模型单元,用于将分箱编码后的所述多维度特征数据输入所述时序行为模型中;以及计算单元,用于所述时序行为模型对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。
[0027] 在本公开的一个实施例中,所述计算单元,还用于所述时序行为模型按照多维度预估指标对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。
[0028] 在本公开的一个实施例中,所述计算单元,还用于所述时序行为模型按照多维度预估指标对所述多维度特征数据进行无监督聚类以确定所述用户的目标行为概率;和/或所述时序行为模型按照多维度预估指标对所述多维度特征数据进行决策树分组以确定所述用户的目标行为概率。
[0029] 在本公开的一个实施例中,所述行为预估模块包括:判断单元,判断在所述目标行为概率是否大于阈值;以及等级单元,在所述目标行为概率大于阈值时,基于所述目标行为概率确定用户的风险等级。
[0030] 根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
[0031] 根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
[0032] 根据本公开的基于时序行为模型的用户金融风险预估方法、装置、电子设备及计算机可读介质,通过用户的行为数据与属性数据生成多维度特征数据,将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级的方式,能够预测用户在未来一段时间内的金融风险等级,企业可依据金融风险等级及时采取措施,避免损失。
[0033] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。

附图说明

[0034] 通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035] 图1是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法及装置的系统框图。
[0036] 图2是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的流程图。
[0037] 图3是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的流程图。
[0038] 图4是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的示意图。
[0039] 图5是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的示意图。
[0040] 图6是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估装置的框图。
[0041] 图7是根据另一示例性实施例示出的一种基于时序行为模型的用户金融风险预估装置的框图。
[0042] 图8是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

[0043] 现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
[0044] 此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
[0045] 附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0046] 附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0047] 应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
[0048] 本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
[0049] 图1是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法及装置的系统框图。
[0050] 如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0051] 用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0052] 在本公开的实施例中,将以用户浏览金融信息平台为例,对本公开中的基于时序行为模型的用户金融风险评估方法进行详细说明。值得一提的是,本公开中的时序行为模型还可应用在多个应用场景和不同商品类别的平台中,本申请不以此为限。
[0053] 终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0054] 服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的金融平台类网站提供支持的后台管理服务器。服务器105可以对接收到的用户基数数据进行分析等处理,并将处理结果(用户金融风险等级)反馈给企业客户管理终端。
[0055] 服务器105可例如获取用户的基础数据,所述基础数据包括行为数据与属性数据;服务器105可例如通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;服务器105可例如将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;服务器105可例如基于所述目标行为概率确定所述用户的金融风险等级。
[0056] 服务器105还可例如通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型。
[0057] 服务器105可以是一个实体的服务器,还可例如为多个服务器组成,需要说明的是,本公开实施例所提供的基于时序行为模型的用户金融风险预估方法可以由服务器105执行,相应地,基于时序行为模型的用户金融风险预估装置可以设置于服务器105中。而提供给用户进行金融信息浏览的金融网页平台端一般位于终端设备101、102、103中。
[0058] 根据本公开的基于时序行为模型的用户金融风险预估方法及装置,通过用户的行为数据与属性数据生成多维度特征数据,将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级的方式,能够预测用户在未来一段时间内的金融风险等级,企业可依据金融风险等级及时采取措施,避免损失。
[0059] 目前,RFM模型是一种用户管理模型,RFM模型有三个要素,这三个要素构成了数据分析的指标:最近一次消费(Recency),消费频率(Frequency),消费金额(Monetary)。RFM模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱这三项指标来描述该客户的状况。但是,传统RFM模型通过交易环节中三个维度:R、F、M细分用户群体,是用历史数据对用户当前状态的评估。随着各种电子技术的发展,广告与传媒业的快速增加,用户接触到了更多更大量的信息。在当今社会中,用户的喜好和行为在短时间内就会发生巨大的变化,在本申请中借助于带有时间序列的用户管理模型建立时序行为模型以进行用户金融风险预估。
[0060] 图2是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的流程图。图2示例性的描述了时序行为模型的建立过程。
[0061] 如图2所示,在S202中,通过历史用户的基础数据生成历史多维度特征数据。可通过在金融平台上已注册的用户的基础数据生成历史多维度特征数据。
[0062] 在S204中,通过所述历史多维度特征数据生成训练集数据与测试集数据。在机器学习中,一般将样本分成独立的三部分训练集(train set),验证集(validation set)和测试集(test set)。其中,训练集用于建立模型。验证集用来确定网络结构或者控制模型复杂程度的参数,而测试集则检验最终选择最优的模型的性能如何。
[0063] 在一个实施例中,还可例如,将编码后的所述多个特征数据按照时间序列分为多个数据集,所述数据集包括训练观察集,训练表现集,测试观察集,以及测试表现集;将所述训练观察集,所述训练表现集输入多个机器学习模型中,生成多维度特征指标;通过所述测试观察集,所述测试表现集验证所述多维度特征指标;以及在验证通过后基于所述多维度特征指标确定所述多个初始机器学习模型。
[0064] 其中,用户的基础数据可按照如下表所示的时间分为训练观察集,训练表现集,测试观察集,以及测试表现集。
[0065]
[0066] 在S206中,分别对训练集数据与测试集数据中的所述历史多维度数据的每一维度数据进行分箱编码。
[0067] 在S208中,将分箱编码后的训练集数据输入所述至少一个机器学习模型中,通过分箱编码后的测试集数据进行验证以建立所述时序行为模型。
[0068] 在一个实施例中,可例如,将分箱编码后的训练集数据输入所述至少一个机器学习模型中,生成多维度评价指标;通过分箱编码后的测试集数据验证所述多维度评价指标;以及在验证通过后基于所述多维度评价指标确定所述时序行为模型。
[0069] 在本公开的一个实施例中,针对于用户借贷的问题,在机器学习的过程中,可通过所述训练观察集,所述训练表现集中的用户的基础数据确定群体应收利息和人均利息。其中,通过所述测试观察集,所述测试表现集中的用户的基础数据确定平均应还利息;以及通过所述平均应还利息与所述群体应收利息和所述人均利息验证所述多维度特征指标。
[0070] 更具体的,还可通过群体应收利息和人均利息确定该模型的在不同维度上的稳定性:
[0071]
[0072] 根据本公开的时序行为模型,能够对用户在未来一段时间内的金融风险进行预估,提高对用户行为分析的时效,为企业提供更高效全面的金融风险预测和分析,减少用户带来的金融风险。
[0073] 图3是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的流程图。基于时序行为模型的用户金融风险预估方法30至少包括步骤S302至S308。
[0074] 如图3所示,在S302中,获取用户的基础数据,所述基础数据包括行为数据与属性数据。其中,基础数据中可包括用户的金融相关行为数据,可为借款行为,欠款行为等等,逾期行为等等具有金融风险的行为,属性数据可为欠款金额数据。
[0075] 在S304中,通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据。
[0076] 在一个实施例中,通过所述行为数据与所述属性数据生成多维度特征数据包括:基于所述行为数据确定多个目标行为及其对应的时间;将所述多个目标行为按照其对应的时间排序;以及通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据。
[0077] 更具体的,可例如通过排序后的行为数据生成所述多个特征数据包括:通过首个行为数据与末尾行为数据的间隔时间确定所述时长特征数据;和/或通过所述末尾行为数据所对应的时间确定所述行为特征数据;和/或通过所述行为数据的数量确定所述频率特征数据;和/或通过所述行为数据中的金额确定所述属性特征数据。
[0078] 可例如以用户借贷行为和相关的时间为例,可将借贷行为相关的行为数据分为,最近一次欠款,欠款频率,以及欠款金额。更具体的可根据首次借贷行为与最后一次借贷行为的时间间隔生成时长特征数据L(Length);通过最后一次借贷行为的时间确定行为特征数据R(Recency),通过借贷行为发生的次数确定频率特征数据F(Frequency),通过节点行为中的借贷金额确定属性特征数据M(Monetary)。
[0079] 值得一提的是,在属性特征数据中,可将用户最后一次欠款的金额作为属性特征数据,还可将用户多次欠款行为中平均欠款金额作为属性特征数据,具体情况可根据模型计算中关注点的不同而进行调整,本公开不以此为限。
[0080] 在S306中,将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率。
[0081] 在一个实施例中,将所述多维度特征数据输入时序行为模型中,获取所述用户的当前价值与价值转移概率包括:将所述多维度特征数据进行分箱编码;将分箱编码后的所述多维度特征数据输入所述时序行为模型中;以及所述时序行为模型对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。
[0082] 其中,分箱编码技术(Weight of Evidence,WOE)即证据权重,可以将模型数据转化为标准评分卡格式,在建模中,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险,这个时候需要借助于分箱技术使特征离散化。分箱技术分为有监督分箱和无监督分箱:有监督的卡方分箱法(ChiMerge)自底向上的(即基于合并的)数据离散化方法。无监督分箱法是采用等距划分、等频划分的方法,将数据直接分箱。对特征进行分箱后,对分箱后的每组进行WOE编码,然后才能放进模型进行训练。
[0083] 在一个实施例中,所述时序行为模型按照多维度评价指标对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。多维度评价指标可根据用户的技术数据中的目标行为数量确定,可例如目标行为是欠款行为,可通过欠款行为相关的评价指标进行聚类和分组以确定超期行为概率;还可例如目标行为是超期行为,可通过超期行为相关的评价指标进行聚类和分组以确定超期行为概率。
[0084] 其中,聚类方法可为k-mean聚类,k-mean聚类是先随机选取K个用户基础数据作为初始的聚类中心。然后计算每个用户基础数据与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。
[0085] 其中,分组可通过决策树进行分组,决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,在本公开的时序行为模型中,决策树是一个预测模型,他代表的是基础数据与基础数据发生的概率之间的一种映射关系。通过学习得到一个分类器,这个分类器能够对新出现的基础数据给出分类。
[0086] 在一个实施例中,可包括:所述时序行为模型按照多维度评估指标对所述多维度特征数据进行无监督聚类以确定所述用户的目标行为概率;和/或所述时序行为模型按照多维度评估指标对所述多维度特征数据进行决策树分组以确定所述用户的目标行为概率。
[0087] 在S308中,基于所述目标行为概率确定所述用户的金融风险等级。可例如,判断所述目标行为概率是否大于阈值;以及在所述目标行为概率大于阈值时,基于所述目标行为概率确定用户的风险等级。
[0088] 图4,图5是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估方法的示意图。
[0089] 如图4所述,其中,根据RFM这三个指标可将每个指标维度再细分出不同的等级,这样就能够细分不同类别的用户,再根据每类用户精准营销在。本公开中可例如把每个维度做一次两分即可,每个维度都分为高低两类,这样在RFM三个维度上可得到了8组用户。这样用户就可以按照不同的维度进行分析,(编号次序RFM:1代表高,0代表低)仅用4组示例作为说明。
[0090] 超高风险用户(111):最近欠款时间近、欠款频次和欠款金额都很高。重要关注用户(011):最近欠款时间较远,但欠款频次和金额都很高,需要主动关注该用户。一般关注用户(101):最近欠款时间较近、欠款金额高,但欠款频次不高。正常状态用户(001):最近欠款时间较远、欠款频次不高,但欠款金额也不高的用户。
[0091] 而引入了L维度之后,还可得到在未来一段时间之后,用户的行为特征,本公开中可例如把L维度也做一次两分,即为当前和120天之后用户的行为特征,这样就把用户由当前的8个组别扩展到了16个组别,即为16个象限中。当然,L还可做不同的区分,可例如将L分为三个维度,当前,20天和120天,那么用户由当前的8个维度分为了24个维度。
[0092] 如图5所示,在把用户由当前的8个组别扩展到了16个组别,即为16个象限中的情况下,(编号次序RFM,1代表高,0代表低,编号L,1代表当前,0代表未来)[0093] 超高风险用户(1111)与超高风险用户(0111),当前与未来均为超高风险用户;重要关注用户(1011)与重要关注用户(0011),当前与未来均为重要关注用户;一般关注用户(1101)与一般关注用户(0101):当前与未来均为一般关注用户;正常状态用户(1001)与正常状态用户(0001)当前与未来均为一般关注用户。
[0094] 可例如,当前用户的象限分类为正常状态用户(1001),未来120天的表现为重要关注用户(0011),则可根据对用户行为的分析,调整该用户的借款额度,或者借款审批条件,提前做好规划。
[0095] 应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教导,这些原理能够应用于许多其它实施例。
[0096] 本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
[0097] 此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0098] 下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
[0099] 图6是根据一示例性实施例示出的一种基于时序行为模型的用户金融风险预估装置的框图。如图6所示,基于时序行为模型的用户金融风险预估装置60包括:基础数据模块602,特征数据模块604,模型计算模块606,行为预估模块608。
[0100] 基础数据模块602用于获取用户的基础数据,所述基础数据包括行为数据与属性数据;
[0101] 特征数据模块604用于通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;具体包括:时间单元,用于基于所述行为数据确定多个目标行为及其对应的时间;排序单元,用于将所述多个目标行为按照其对应的时间排序;以及特征单元,用于通过排序后的所述多个目标行为与所述属性数据生成所述多维度特征数据。其中,所述特征单元包括:时长子单元,用于通过首个目标行为与末尾目标行为的间隔时间确定所述时长维度数据;和/或行为子单元,用于通过所述末尾目标行为所对应的时间确定所述行为维度数据;和/或频率子单元,用于通过所述多个目标行为的数量确定所述频率维度数据;和/或属性子单元,用于通过所述属性数据中的金额确定所述属性维度数据。
[0102] 模型计算模块606用于将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;具体可块包括:处理单元,用于将所述多维度特征数据进行分箱编码;模型单元,用于将分箱编码后的所述多维度特征数据输入所述时序行为模型中;以及计算单元,用于所述时序行为模型对所述多维度特征数据进行聚类和分组以确定所述用户的目标行为概率。
[0103] 行为预估模块608用于基于所述目标行为概率确定所述用户的金融风险等级。具体可包括:判断单元,判断在所述目标行为概率是否大于阈值;以及等级单元,在所述目标行为概率大于阈值时,基于所述目标行为概率确定用户的风险等级。
[0104] 图7是根据另一示例性实施例示出的一种基于时序行为模型的用户金融风险预估装置的框图。如图7所示,基于时序行为模型的用户金融风险预估装置70在基于时序行为模型的用户金融风险预估装置60的基础上还包括:模型训练模块702。
[0105] 模型训练模块702用于通过历史用户的基础数据与带有时间特征的用户管理模型建立所述时序行为模型。具体可包括:聚类单元,用于通过历史用户的基础数据与无监督学习模型建立所述时序行为模型;和/或决策单元,用于通过历史用户的基础数据与有监督学习模型建立所述时序行为模型。
[0106] 模型训练模块702还可包括:历史数据单元,用于通过历史用户的基础数据生成历史多维度特征数据;训练测试单元,用于通过所述历史多维度特征数据生成训练集数据与测试集数据;分箱编码单元,用于分别对训练集数据与测试集数据中的所述历史多维度数据的每一维度数据进行分箱编码;以及训练单元,用于将分箱编码后的训练集数据输入所述至少一个机器学习模型中,通过分箱编码后的测试集数据进行验证以建立所述时序行为模型。
[0107] 其中,所述训练单元包括:输入子单元,用于将分箱编码后的训练集数据输入所述至少一个机器学习模型中,生成多维度预估指标;验证子单元,用于通过分箱编码后的测试集数据验证所述多维度预估指标;以及指标子单元,用于在验证通过后基于所述多维度预估指标确定所述时序行为模型。
[0108] 根据本公开的基于时序行为模型的用户金融风险预估装置,通过用户的行为数据与属性数据生成多维度特征数据,将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级的方式,能够预测用户在未来一段时间内的金融风险等级,企业可依据金融风险等级及时采取措施,避免损失。
[0109] 图8是根据一示例性实施例示出的一种电子设备的框图。
[0110] 下面参照图8来描述根据本公开的这种实施方式的电子设备200。图8显示的电子设备200仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0111] 如图8所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
[0112] 其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子处方流转处理方法部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图2,图3中所示的步骤。
[0113] 所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
[0114] 所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0115] 总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0116] 电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0117] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。
[0118] 所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0119] 上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取用户的基础数据,所述基础数据包括行为数据与属性数据;通过所述行为数据与所述属性数据生成多维度特征数据,所述多维度特征数据包括时长维度数据,行为维度数据,频率维度数据,和属性维度数据;将所述多维度特征数据输入时序行为模型中,获取所述用户的目标行为概率;以及基于所述目标行为概率确定所述用户的金融风险等级。
[0120] 本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0121] 通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。
[0122] 以上具体地示出和描述了本公开的示例性实施例。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。