信息预测方法、装置、计算机设备和存储介质转让专利

申请号 : CN201910217322.4

文献号 : CN110110884A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 范荣程晓瑜莫泽鸿万雨竹汤哲

申请人 : 平安直通咨询有限公司上海分公司

摘要 :

本申请涉及大数据处理领域,特别涉及一种信息预测方法、装置、计算机设备和存储介质。包括获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;从各基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数;根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列;采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;根据多组信贷风险指数预测模型进行信贷风险指数预测。本方法能提高信息预测准确性。

权利要求 :

1.一种信息预测方法,所述方法包括:

获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;

从各所述基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;

分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数;

根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列;

采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;

根据多组所述信贷风险指数预测模型进行信贷风险指数预测。

2.根据权利要求1所述的方法,其特征在于,所述根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列,包括:获取预设相关阈值,提取所述相关系数大于所述预设相关阈值的基础宏观指标序列;

获取提取出的所述基础宏观指标序列的指标属性,根据所述指标属性对提取出的所述基础宏观指标序列进行分类;

将每一分类中对应的所述相关系数最大的所述基础宏观指标序列筛选出来。

3.根据权利要求2所述的方法,其特征在于,所述将每一分类中对应的所述相关系数最大的所述基础宏观指标序列筛选出来之后,还包括:获取提取出的所述基础宏观指标序列的分类数量,并获取预设指标下限数值;

当所述分类数量小于所述预设指标下限数值时,计算所述预设指标下限数值与所述分类数量的差值;

将未筛选出的提取的所述基础宏观指标序列根据对应相关系数由大至小的顺序进行排序,将排在前列的所述基础宏观指标序列筛选出来,且筛选出的排在前列的所述基础宏观指标序列的数量与所述差值一致。

4.根据权利要求1所述的方法,其特征在于,所述分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数,包括:获取各组合中所述基础宏观指标序列的序列初始时间;

从所述非金融企业杠杆率数据中提取与所述序列初始时间对应的杠杆率序列;

计算各组合的所述基础宏观指标序列与所述杠杆率序列的相关系数。

5.根据权利要求4所述的方法,其特征在于,所述采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型,包括:对筛选出的所述基础宏观指标序列进行标准化处理得到数据矩阵;

计算所述数据矩阵的协方差矩阵,并计算所述协方差矩阵的特征根和特征向量;

根据所述特征根和所述特征向量确定主成分表达式;

根据所述主成分表达式构建各组合的信贷风险指数预测模型。

6.根据权利要求5所述的方法,其特征在于,所述根据多组所述信贷风险指数预测模型进行信贷风险指数预测,包括:将筛选出的所述基础宏观指标序列分别输入各组信贷风险指数预测模型得到多条信贷风险指数预测曲线;

分别根据各条信贷风险指数预测曲线计算各所述序列初始时间对应的未来时刻的信贷风险指数预测值。

7.一种信息预测装置,其特征在于,所述装置包括:数据获取模块,用于获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;

序列提取模块,用于从各所述基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;

系数计算模块,用于分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数;

序列筛选模块,用于根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列;

模型构建模块,用于采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;

指数预测模块,用于根据多组所述信贷风险指数预测模型进行信贷风险指数预测。

8.根据权利要求7所述的装置,其特征在于,所述序列筛选模块包括:阈值获取子模块,用于获取预设相关阈值,提取所述相关系数大于所述预设相关阈值的基础宏观指标序列;

序列分类子模块,用于获取提取出的所述基础宏观指标序列的指标属性,根据所述指标属性对提取出的所述基础宏观指标序列进行分类;

筛选子模块,用于将每一分类中对应的所述相关系数最大的所述基础宏观指标序列筛选出来。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

说明书 :

信息预测方法、装置、计算机设备和存储介质

技术领域

[0001] 本申请涉及计算机技术领域,特别是涉及一种信息预测方法、装置、计算机设备和存储介质。

背景技术

[0002] 银行机构是金融经济的命脉,与国民经济的各个参与主体之间均具有复杂的关系,银行机构作为经济主体的枢纽,其风险危机的波及性较为广泛且迅速。
[0003] 商业银行经营过程中面临多种风险,其中最重要的就是信贷风险,信贷风险是银行因企业不能按时归还贷款本息而遭受损失的可能性,是银行必须要积极面对与防范的一种风险。但是,目前缺少对信贷风险相关的宏观经济指标的发展趋势进行准确预测的有效手段。

发明内容

[0004] 基于此,有必要针对上述技术问题,提供一种能够提高信息预测准确性的信贷风险指标预测方法、装置、计算机设备和存储介质。
[0005] 一种信息预测方法,所述方法包括:
[0006] 获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;
[0007] 从各所述基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;
[0008] 分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数;
[0009] 根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列;
[0010] 采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;
[0011] 根据多组所述信贷风险指数预测模型进行信贷风险指数预测。
[0012] 在其中一个实施例中,所述根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列,包括:
[0013] 获取预设相关阈值,提取所述相关系数大于所述预设相关阈值的基础宏观指标序列;
[0014] 获取提取出的所述基础宏观指标序列的指标属性,根据所述指标属性对提取出的所述基础宏观指标序列进行分类;
[0015] 将每一分类中对应的所述相关系数最大的所述基础宏观指标序列筛选出来。
[0016] 在其中一个实施例中,所述将每一分类中对应的所述相关系数最大的所述基础宏观指标序列筛选出来之后,还包括:
[0017] 获取提取出的所述基础宏观指标序列的分类数量,并获取预设指标下限数值;
[0018] 当所述分类数量小于所述预设指标下限数值时,计算所述预设指标下限数值与所述分类数量的差值;
[0019] 将未筛选出的提取的所述基础宏观指标序列根据对应相关系数由大至小的顺序进行排序,将排在前列的所述基础宏观指标序列筛选出来,且筛选出的排在前列的所述基础宏观指标序列的数量与所述差值一致。
[0020] 在其中一个实施例中,所述分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数,包括:
[0021] 获取各组合中所述基础宏观指标序列的序列初始时间;
[0022] 从所述非金融企业杠杆率数据中提取与所述序列初始时间对应的杠杆率序列;
[0023] 计算各组合的所述基础宏观指标序列与所述杠杆率序列的相关系数。
[0024] 在其中一个实施例中,所述采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型,包括:
[0025] 对筛选出的所述基础宏观指标序列进行标准化处理得到数据矩阵;
[0026] 计算所述数据矩阵的协方差矩阵,并计算所述协方差矩阵的特征根和特征向量;
[0027] 根据所述特征根和所述特征向量确定主成分表达式;
[0028] 根据所述主成分表达式构建各组合的信贷风险指数预测模型。
[0029] 在其中一个实施例中,所述根据多组所述信贷风险指数预测模型进行信贷风险指数预测,包括:
[0030] 将筛选出的所述基础宏观指标序列分别输入各组信贷风险指数预测模型得到多条信贷风险指数预测曲线;
[0031] 分别根据各条信贷风险指数预测曲线计算各所述序列初始时间对应的未来时刻的信贷风险指数预测值。
[0032] 一种信息预测装置,所述装置包括:
[0033] 数据获取模块,用于获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;
[0034] 序列提取模块,用于从各所述基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;
[0035] 系数计算模块,用于分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数;
[0036] 序列筛选模块,用于根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列;
[0037] 模型构建模块,用于采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;
[0038] 指数预测模块,用于根据多组所述信贷风险指数预测模型进行信贷风险指数预测。
[0039] 在其中一个实施例中,序列筛选模块包括:
[0040] 阈值获取子模块,用于获取预设相关阈值,提取所述相关系数大于所述预设相关阈值的基础宏观指标序列;
[0041] 序列分类子模块,用于获取提取出的所述基础宏观指标序列的指标属性,根据所述指标属性对提取出的所述基础宏观指标序列进行分类;
[0042] 筛选子模块,用于将每一分类中对应的所述相关系数最大的所述基础宏观指标序列筛选出来。
[0043] 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0044] 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
[0045] 上述信息预测方法、装置、计算机设备和存储介质,通过从基础指标库中获取多个基础宏观指标数据,并从各基础宏观指标数据中抽取多个时时间周期的基础宏观指标序列,得到多个基础宏观指标序列组合,进而根据各组合中基础宏观指标序列与非金融企业杠杆率数据之间的相关系数确定相关联的指标,从而采用相关联指标构建信贷风险指数预测模型,本申请的指标众多且来源丰富,构建的信贷风险指数预测模型科学且可靠,能够对多个时间周期的信贷风险指数进行准确预测。

附图说明

[0046] 图1为一个实施例中信息预测方法的应用场景图;
[0047] 图2为一个实施例中信息预测方法的流程示意图;
[0048] 图3为一个实施例中指标筛选步骤的流程示意图;
[0049] 图4为一个实施例中构建出的4期信贷风险指数预测模型的示意图;
[0050] 图5为一个实施例中信息预测装置的结构框图;
[0051] 图6为一个实施例中计算机设备的内部结构图。

具体实施方式

[0052] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以释义本申请,并不用于限定本申请。
[0053] 本申请提供的信息预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102可以向服务器104发送信贷风险指数预测请求,服务器104接收请求后,获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;从各所述基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;分别计算各组合中各所述基础宏观指标序列与所述非金融企业杠杆率数据的相关系数;根据计算出的所述相关系数筛选出各组合中与所述非金融企业杠杆率数据关联的基础宏观指标序列;采用主成分分析法对筛选出的所述基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;根据多组所述信贷风险指数预测模型进行信贷风险指数预测。服务器104将预测的信贷风险指数返回给终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0054] 在一个实施例中,如图2所示,提供了一种信息预测方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
[0055] 步骤210,获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据。
[0056] 非金融企业杠杆率是衡量信贷风险的一项重要指标,服务器获取非金融企业杠杆率数据,非企业金融杠杆率数据包括预设时间范围内的多个时刻的非金融企业杠杆率。
[0057] 基础指标库中的基础宏观指标来源于2000多个宏观经济指标,基本覆盖了整个宏观经济的重要指标。这些指标有非农就业人口、就业率、失业率、国际收支、国民生产总值、国内生产总值、生产价格指数、消费价格指数、可支配个人收入、个人消费支出、城乡居民储蓄存款余额、投资指标、金融指标(金融指标包括利率、汇率、货币供应量、金融机构存贷款余额、金融资产总量等)、消费信心指数、采购经理人指数、耐用品订单、工业生产指数、设备使用率、零售销售指数、社会消费品零售总额、消费者信贷、新屋开工及建筑许可、建筑支出、生产价格指数、批发物价指数、对外贸易、工厂订单、耐久商品订单、经常帐以及商业库存等等。
[0058] 服务器从基础指标库中逐个获取各个基础宏观指标的数据,基础宏观指标数据包括预设时间范围内的多个时刻的基础宏观指标的数值。
[0059] 步骤220,从各基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合。
[0060] 服务器获取预设的序列初始时间,序列初始时间的数量为多个。服务器逐个获取各序列初始时间,将基础宏观指标中各序列初始时间对应的数值及序列初始时间之后所有时刻对应的数值提取为基础宏观指标序列,从而得到多个时间周期的包括多个基础宏观指标序列的基础宏观指标序列组合。
[0061] 例如,国民生产总值指标数据中包括从2008年3月至2018年3月之间的各月的国民生产总值,预设的序列初始时间分别为2008年3月、4月、5月和6月,则提取出4个国民生产总值指标序列分别2008年3月至2018年3月的数据序列、2008年4月至2018年3月的数据序列、2008年5月至2018年3月的数据序列和2008年6月至2018年3月的数据序列。
[0062] 步骤230,分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数。
[0063] 服务器逐个获取各时间周期对应的基础宏观指标序列组合,并逐个计算算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数。具体地,服务器将各基础宏观指标序列和非金融企业杠杆率数据代入相关性计算公式进行计算,将得到的计算结果设定为相关系数。进一步地,服务器获取计算结果的绝对值,将获取的绝对值设定为相关系数。其中,服务器可以采用皮尔森相关系数计算公式、斯皮尔曼相关性计算公式等公式来进行相关性计算。
[0064] 例如,服务器可采用皮尔森相关系数计算公式:
[0065]
[0066]
[0067] 在上式中,X为基础宏观指标序列,Y均为非金融企业杠杆率数值,ρ(X,Y)为相关性系数。两个连续变量(X,Y)的皮尔森相关性系数ρ(X,Y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)。系数的取值总是在-1.0到1.0之间,接近0的变量被称为无相关性,接近1或者-1被称为具有强相关性。
[0068] 服务器也可采用斯皮尔曼相关系数计算公式:
[0069]
[0070] 服务器在计算相关系数时,X为基础宏观指标序列,Y均为非金融企业杠杆率数值,ρ为服务器计算得到的相关系数。
[0071] 在一个实施例中,分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数可以包括:获取各组合中基础宏观指标序列的序列初始时间;从非金融企业杠杆率数据中提取与序列初始时间对应的杠杆率序列;计算各组合的基础宏观指标序列与杠杆率序列的相关系数。
[0072] 服务器获取各时间周期组合的序列初始时间,并从非金融企业杠杆率数据中查找序列初始时间对应的数值及序列初始时间之后所有时刻对应的数值,将查找到的数值提取为杠杆率序列,并计算出多个序列初始时间对应的各基础宏观指标序列与非金融企业杠杆率数据的相关系数,得到多个时间周期的相关系数数据,从而实现多个时间周期的期信贷风险指数的预测。
[0073] 步骤240,根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列。
[0074] 服务器获取预设的关联指标筛选规则,筛选出符合相关指标筛选规则的相关系数,并将筛选出的相关系数对应的基础宏观指标序列提取为与非金融企业杠杆率具有关联关系的指标序列。关联指标筛选规则可以根据需要筛选出的指标数量、指标的关联强度等因素进行具体设定。
[0075] 步骤250,采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型。
[0076] 服务器分别对各时间周期对应的筛选出的多个基础宏观指标序列进行主成分分析,根据主成分分析结果得到多个主成分表达式,再对得到的主成分表达式进行筛选,且筛选出的主成分表达式的数量小于关联的基础宏观指标序列的数量。服务器分别根据筛选出的主成分表达式构建各时间周期的信贷风险指数预测模型。
[0077] 步骤260,根据多组信贷风险指数预测模型进行信贷风险指数预测。
[0078] 服务器可以将各时间周期对应的筛选出的基础宏观指标序列代入相应的信贷风险指数预测模型中进行计算,得到多个时间周期的杠杆率变化曲线,根据杠杆率变化曲线对未来时刻的信贷风险指数进行预测,得到未来多期的信贷风险指数。
[0079] 上述信息预测方法、装置、计算机设备和存储介质,通过从基础指标库中获取多个基础宏观指标数据,并从各基础宏观指标数据中抽取多个时时间周期的基础宏观指标序列,得到多个基础宏观指标序列组合,进而根据各组合中基础宏观指标序列与非金融企业杠杆率数据之间的相关系数确定相关联的指标,从而采用相关联指标构建信贷风险指数预测模型,本申请的指标众多且来源丰富,构建的下行储备指数预测模型科学且可靠,能够对多个时间周期的信贷风险指数进行准确预测。
[0080] 在一个实施例中,如图3所示,根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列的指标筛选步骤可以包括:
[0081] 步骤242,获取预设相关阈值,提取相关系数大于预设相关阈值的基础宏观指标序列。
[0082] 服务器获取预先设定好的相关阈值,预设相关阈值用于划分各基础宏观指标与非金融企业杠杆率是否具有相关性,将相关系数数值大于预设相关阈值时的指标设定为具有相关性。服务器将根据各基础宏观指标序列计算出的相关系数分别与预设相关阈值进行比较,当服务器判定出相关系数大于预设相关阈值时,将对应的基础宏观指标序列提取出来。
[0083] 步骤244,获取提取出的基础宏观指标序列的指标属性,根据指标属性对提取出的基础宏观指标序列进行分类。
[0084] 因为基础宏观指标涵盖了宏观经济的各个方面,存在多个基础宏观指标反映一类经济问题的情况。服务器事先对各基础宏观指标进行分类打标,赋予不同的指标属性。服务器获取各基础宏观指标序列对应的基础宏观指标被打标的指标属性,并将属于同一指标属性的基础宏观指标序列划分为同一类。
[0085] 例如,非农就业人口、就业率、失业率对应的指标属性均划分为非农工作属性;国民生产总值、国内生产总值、工业生产指数以及工厂订单等对应的指标属性均划分为生产数据属性;生产价格指数、消费价格指数、零售销售指数以及社会消费品零售总额等对应的指标属性均划分为销售数据属性。
[0086] 步骤246,将每一分类中对应的相关系数最大的基础宏观指标序列筛选出来。
[0087] 例如,提取出的指标属性为非农工作属性的基础宏观指标序列包括非农就业人口、就业率和失业率三个指标序列,三个指标序列对应的相关系数分别为0.6、0.8以及0.7,就业率指标对应的相关系数最大,因此,服务器将就业率序列筛选出来。
[0088] 上述信息预测方法中,事先对各基础宏观指标进行分类打标,并将每一类指标中相关系数最大的基础宏观指标序列筛选出来,确保了每类指标都能被选取,不仅降低了因政策、局势以及时间等变化造成的影响,而且还进一步提高了构建模型的准确性。
[0089] 在一个实施例中,将每一分类中对应的相关系数最大的基础宏观指标序列筛选出来之后,还包可以包括:获取提取出的基础宏观指标序列的分类数量,并获取预设指标下限数值;当分类数量小于预设指标下限数值时,计算预设指标下限数值与分类数量的差值;将未筛选出的提取的基础宏观指标序列根据对应相关系数由大至小的顺序进行排序,将排在前列的基础宏观指标序列筛选出来,且筛选出的排在前列的基础宏观指标序列的数量与差值一致。
[0090] 服务器获取预设的指标下限数值,并获取提取出的基础宏观指标序列的分类数量。该预设指标下限数值是指为了确保最终构建的信贷风险指数预测模型的准确性而设定的最小数值,可以降低因采用主成分分析法降维所造成的影响,确保最终构建的信贷风险指数预测模型的精准性。例如,可以将预设指标下限数值设定为10。
[0091] 服务器将分类数量和预设指标下限数值进行比较,当分类数量不小于预设指标下限数值时,则继续执行采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型的步骤;当分类数量小于预设指标下限数值时,服务器计算预设指标下限数值与分类数量的差值Q。服务器将余下的提取出的基础宏观指标序列按照相应相关系数由大至小的顺序进行排序,并将排在前Q位的基础宏观指标序列也筛选出来。
[0092] 上述信息预测方法中,事先确定了预设指标下限数值,降低了因采用主成分分析法降维所造成的影响,确保最终构建的信贷风险指数预测模型的精准性。而当分类数量小于预设指标下限数值时,提取出相关系数数值排在前列的基础宏观指标序列,不仅弥补了数量不足造成的影响,而且每个基础宏观指标序列都与非金融企业杠杆率数据紧密关联,确保了信贷风险指数预测模型的准确。
[0093] 在一个实施例中,采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型可以包括:对筛选出的基础宏观指标序列进行标准化处理得到数据矩阵;计算数据矩阵的协方差矩阵,并计算协方差矩阵的特征根和特征向量;根据特征根和特征向量确定主成分表达式;根据主成分表达式构建各组合的信贷风险指数预测模型。
[0094] 服务器对每组筛选出的n个基础宏观指标序列分别采集p维随机向量x=(x1,x2,...,xp)T,其中每个基础宏观指标序列xi=(xi1,xi2,...,xip)T,i=1,2,…,n,n>p,对其构造矩阵,对矩阵阵元进行如下标准化变换以消除不同指标数据间的量纲差异和数量级间的差异并得标准化后的数据矩阵Zij:
[0095]
[0096] 其中,Zij表示第i个基础宏观指标序列中第j个数值的数据矩阵,n为基础宏观指标序列的总数量,p为每个基础宏观指标序
列对应的数列中数值个数。
[0097] 根据数据矩阵Z求得协方差矩阵R,该协方差矩阵R的计算公式如下:
[0098]
[0099] 然后解该协方差矩阵R得到p个特征根,并获取p个特征根的主成分方差贡献率以及对应的特征向量 根据特征根和特征向量将标准化后的指标变量转换为主成分,如下所示:
[0100]
[0101] U1称为第一主成分表达式,U2称为第二主成分表达式,…,Up称为第p主成分表达式。
[0102] 服务器可以根据预设模型构建规则选取主成分表达式并构建信贷风险指数预测模型。例如,服务器可以选取第一主成分表达式为信贷风险指数预测模型,服务器也可以计算出各主成分表达式的主成分方差贡献率,并获取预先设定的最低方差贡献率阈值,提取出主成分方差贡献率超过最低方差贡献率阈值的主成分表达式,并对提取出的主成分表达式进行加权求和得到信贷风险指数预测模型,其中,权重可以设定为每个主成分表达式的主成分方差贡献率。服务器得到的信贷风险指数预测模型的自变量为标准化后的筛选出的基础宏观指标数据,因变量可以看作非金融企业杠杆率即信贷风险指数,从而得到信贷风险指数为多个筛选出的基础宏观指标数据的加权之和,且根据多组基础宏观指标序列得到多个信贷风险指数预测模型。
[0103] 在一个实施例中,根据多组信贷风险指数预测模型进行信贷风险指数预测可以包括:将筛选出的基础宏观指标序列分别输入各组信贷风险指数预测模型得到多条信贷风险指数预测曲线;分别根据各条信贷风险指数预测曲线计算各序列初始时间对应的未来时刻的信贷风险指数预测值。
[0104] 服务器逐个获取每个时间周期对应的筛选出的基础宏观指标序列,并输入到相应的信贷风险指数预测模型中,从而得到多个时刻的信贷风险指数的散点值,根据多个散点值绘制信贷风险指数预测曲线。
[0105] 服务器分别对得到的多条信贷风险指数预测曲线进行拟合,拟合过程可以采用线性拟合或非线性拟合方法,根据拟合结果计算出未来时刻的信贷风险指数预测值。具体地,未来时刻可以与序列初始时间对应,序列的初始时间越晚,对应的未来时刻也越晚。
[0106] 例如,服务器将2008年3月至2018年3月的筛选出的所述基础宏观指标序列代入信贷风险指数预测模型中,序列初始时间2008年3月对应的未来时刻为下个月即2018年4月,可以预测第一期2018年4月的信贷风险指数;将2008年4月至2018年3月的杠杆率序列代入信贷风险指数预测模型中,序列初始时间2008年4月对应的未来时刻为下两个月即2018年4月和2018年5月,可以预测第二期2018年5月的信贷风险指数,以此类推,从而可以预测未来多期的信贷风险指数。
[0107] 如图4所示,服务器采用本方法分别构建第1时间周期到第4时间周期(2018年第2季度到2019年第1季度)的信贷风险指数预测模型。外汇预设序列初始时间为2011年第3季度,服务器从非金融企业杠杆率数据中提取与2011年第2期(第三季度)对应的杠杆率序列(图中OBJ曲线),服务器从各基础宏观指标数据中提取与预设序列初始时间对应的基础宏观指标序列。
[0108] 当构建第1时间周期的信贷风险指数预测模型时,服务器从各基础指标数据中提取从2011年第3季度起始到对应的2018年第1季度基础宏观指标序列,此时信贷风险指数预测模型为图中OBJ1曲线。当构建第2时间周期的信贷风险指数预测模型时,服务器从各基础宏观指标数据中提取从2011年第4季度起始到对应的2018年第1季度基础指标序列,此时信贷风险指数预测模型为图中OBJ2曲线。当构建第3时间周期的信贷风险指数预测模型时,服务器从各基础指标数据中提取从2012年第1季度起始到对应的2018年第1季度基础指标序列,此时信贷风险指数预测模型为图中OBJ3曲线。当构建第4时间周期的的实信贷风险指数预测模型时,服务器从各基础指标数据中提取从2012年第2季度起始到对应的2018年第1季度基础指标序列,此时贷风险指数预测模型为图中OBJ4曲线。
[0109] 当采用本方法预测不同时间周期的信贷风险指数时,均需要先构建信贷风险指数预测模型,以确保每一期的构建指数的唯一性。这样可以降低因政策、局势以及时间等变化造成的影响,进一步提升每一期的信贷风险指数的准确性。
[0110] 应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0111] 在一个实施例中,如图5所示,提供了一种信息预测装置,包括:数据获取模块510、序列提取模块520、系数计算模块530、序列筛选模块540、模型构建模块550和指数预测模块560,其中:
[0112] 数据获取模块510,用于获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据。
[0113] 序列提取模块520,用于从各基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合。
[0114] 系数计算模块530,用于分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数。
[0115] 序列筛选模块540,用于根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列。
[0116] 模型构建模块550,用于采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型。
[0117] 指数预测模块560,用于根据多组信贷风险指数预测模型进行信贷风险指数预测。
[0118] 在一个实施例中,序列筛选模块540可以包括:
[0119] 阈值获取子模块,用于获取预设相关阈值,提取相关系数大于预设相关阈值的基础宏观指标序列。
[0120] 序列分类子模块,用于获取提取出的基础宏观指标序列的指标属性,根据指标属性对提取出的基础宏观指标序列进行分类。
[0121] 筛选子模块,用于将每一分类中对应的相关系数最大的基础宏观指标序列筛选出来。
[0122] 在一个实施例中,序列筛选模块540还可以包括:
[0123] 数值获取子模块,用于获取提取出的基础宏观指标序列的分类数量,并获取预设指标下限数值。
[0124] 差值计算模块,用于当分类数量小于预设指标下限数值时,计算预设指标下限数值与分类数量的差值。
[0125] 复选子模块,用于将未筛选出的提取的基础宏观指标序列根据对应相关系数由大至小的顺序进行排序,将排在前列的基础宏观指标序列筛选出来,且筛选出的排在前列的基础宏观指标序列的数量与差值一致。
[0126] 在一个实施例中,系数计算模块530可以包括:
[0127] 时间获取子模块,用于获取各组合中基础宏观指标序列的序列初始时间。
[0128] 杠杆序列提取子模块,用于从非金融企业杠杆率数据中提取与序列初始时间对应的杠杆率序列。
[0129] 相关计算子模块,用于计算各组合的基础宏观指标序列与杠杆率序列的相关系数。
[0130] 在一个实施例中,模型构建模块550可以包括:
[0131] 标准化子模块,用于对筛选出的基础宏观指标序列进行标准化处理得到数据矩阵。
[0132] 协方差计算子模块,用于计算数据矩阵的协方差矩阵,并计算协方差矩阵的特征根和特征向量。
[0133] 表达式确定子模块,用于根据特征根和特征向量确定主成分表达式。
[0134] 构建子模块,用于根据主成分表达式构建各组合的信贷风险指数预测模型。
[0135] 在一个实施例中,指数预测模块560可以包括:
[0136] 曲线生成子模块,用于将筛选出的基础宏观指标序列分别输入各组信贷风险指数预测模型得到多条信贷风险指数预测曲线。
[0137] 预测子模块,用于分别根据各条信贷风险指数预测曲线计算各序列初始时间对应的未来时刻的信贷风险指数预测值。
[0138] 关于信息预测装置的具体限定可以参见上文中对于信息预测方法的限定,在此不再赘述。上述信息预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0139] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息预测相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息预测方法。
[0140] 本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0141] 在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;从各基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数;根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列;采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;根据多组信贷风险指数预测模型进行信贷风险指数预测。
[0142] 在一个实施例中,处理器执行计算机程序时实现根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列的步骤时还用于:获取预设相关阈值,提取相关系数大于预设相关阈值的基础宏观指标序列;获取提取出的基础宏观指标序列的指标属性,根据指标属性对提取出的基础宏观指标序列进行分类;将每一分类中对应的相关系数最大的基础宏观指标序列筛选出来。
[0143] 在一个实施例中,处理器执行计算机程序时实现根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列的步骤时还用于:获取提取出的基础宏观指标序列的分类数量,并获取预设指标下限数值;当分类数量小于预设指标下限数值时,计算预设指标下限数值与分类数量的差值;将未筛选出的提取的基础宏观指标序列根据对应相关系数由大至小的顺序进行排序,将排在前列的基础宏观指标序列筛选出来,且筛选出的排在前列的基础宏观指标序列的数量与差值一致。
[0144] 在一个实施例中,处理器执行计算机程序时实现分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数的步骤时还用于:获取各组合中基础宏观指标序列的序列初始时间;从非金融企业杠杆率数据中提取与序列初始时间对应的杠杆率序列;计算各组合的基础宏观指标序列与杠杆率序列的相关系数。
[0145] 在一个实施例中,处理器执行计算机程序时实现采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型的步骤时还用于:对筛选出的基础宏观指标序列进行标准化处理得到数据矩阵;计算数据矩阵的协方差矩阵,并计算协方差矩阵的特征根和特征向量;根据特征根和特征向量确定主成分表达式;根据主成分表达式构建各组合的信贷风险指数预测模型。
[0146] 在一个实施例中,处理器执行计算机程序时实现根据多组信贷风险指数预测模型进行信贷风险指数预测的步骤时还用于:将筛选出的基础宏观指标序列分别输入各组信贷风险指数预测模型得到多条信贷风险指数预测曲线;分别根据各条信贷风险指数预测曲线计算各序列初始时间对应的未来时刻的信贷风险指数预测值。
[0147] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取非金融企业杠杆率数据,并从基础指标库中逐个获取基础宏观指标数据;从各基础宏观指标数据中提取多个时间周期的基础宏观指标序列,根据所提取的多个时间周期的基础宏观指标序列得到多个时间周期的基础宏观指标序列组合;分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数;根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列;采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型;根据多组信贷风险指数预测模型进行信贷风险指数预测。
[0148] 在一个实施例中,计算机程序被处理器执行时实现根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列的步骤时还用于:获取预设相关阈值,提取相关系数大于预设相关阈值的基础宏观指标序列;获取提取出的基础宏观指标序列的指标属性,根据指标属性对提取出的基础宏观指标序列进行分类;将每一分类中对应的相关系数最大的基础宏观指标序列筛选出来。
[0149] 在一个实施例中,计算机程序被处理器执行时实现根据计算出的相关系数筛选出各组合中与非金融企业杠杆率数据关联的基础宏观指标序列的步骤时还用于:获取提取出的基础宏观指标序列的分类数量,并获取预设指标下限数值;当分类数量小于预设指标下限数值时,计算预设指标下限数值与分类数量的差值;将未筛选出的提取的基础宏观指标序列根据对应相关系数由大至小的顺序进行排序,将排在前列的基础宏观指标序列筛选出来,且筛选出的排在前列的基础宏观指标序列的数量与差值一致。
[0150] 在一个实施例中,计算机程序被处理器执行时实现分别计算各组合中各基础宏观指标序列与非金融企业杠杆率数据的相关系数的步骤时还用于:获取各组合中基础宏观指标序列的序列初始时间;从非金融企业杠杆率数据中提取与序列初始时间对应的杠杆率序列;计算各组合的基础宏观指标序列与杠杆率序列的相关系数。
[0151] 在一个实施例中,计算机程序被处理器执行时实现采用主成分分析法对筛选出的基础宏观指标序列进行分析并构建多组信贷风险指数预测模型的步骤时还用于:对筛选出的基础宏观指标序列进行标准化处理得到数据矩阵;计算数据矩阵的协方差矩阵,并计算协方差矩阵的特征根和特征向量;根据特征根和特征向量确定主成分表达式;根据主成分表达式构建各组合的信贷风险指数预测模型。
[0152] 在一个实施例中,计算机程序被处理器执行时实现根据多组信贷风险指数预测模型进行信贷风险指数预测的步骤时还用于:将筛选出的基础宏观指标序列分别输入各组信贷风险指数预测模型得到多条信贷风险指数预测曲线;分别根据各条信贷风险指数预测曲线计算各序列初始时间对应的未来时刻的信贷风险指数预测值。
[0153] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0154] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0155] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。