一种社区社会信用体系信息处理系统及方法转让专利

申请号 : CN202310965749.9

文献号 : CN116702052B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李维红李映虹徐程

申请人 : 云南香农信息技术有限公司

摘要 :

本发明涉及信用服务技术领域,尤其为一种社区社会信用体系信息处理系统及方法,包括:信用数据采集模块:用于采集社区社会信用数据;数据特征处理模块:用于对采集的社区社会信用数据进行特征提取处理;信用数据分析模块:用于对社区社会信用数据进行分析;信用体系搭建模块;用于基于分析结果搭建社区社会信用体系。本发明基于决策树的划分,通过随机森林算法提取信用特征数据,基于基分类器进行信用特征数据的初步分类,并基于改进白骨顶搜索算法进行基分类器权重的寻优,通过改进的白骨顶搜索算法优化提升算法的收敛性能,基于寻优获取的基分类器权重基于融合处理进行居民的信用等级划分,能够较为准确的反映社区社会信用体系评分结果。

权利要求 :

1.一种社区社会信用体系信息处理系统,其特征在于:包括:信用数据采集模块(100):用于采集社区社会信用数据;

数据特征处理模块(200):用于对采集的社区社会信用数据进行特征提取处理;

信用数据分析模块(300):用于对社区社会信用数据进行分析;

信用体系搭建模块(400):用于基于分析结果搭建社区社会信用体系;

所述数据特征处理模块(200)根据社区社会信用数据的类型基于决策树进行划分,并基于随机森林算法提取信用特征数据;

所述随机森林算法具体如下:

其中,Gs表示决策树上节点s的基尼系数,R表示社区社会信用数据类别数量,prs表示决策树上节点s上属于第r类的样本所占比例,ΔGks=Gs‑Ga‑Gb

其中,ΔGks表示节点s分枝前后的基尼系数变化量,Ga、Gb分别表示节点s分枝后两个新节点上计算的基尼系数,其中,Gjk表示社区社会信用数据Xk在第j个决策树上的重要性评分;

其中,Gk表示社区社会信用数据Xk在整个随机森林中的重要性;

所述信用数据分析模块(300)基于所述数据特征处理模块(200)提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集P,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优;

所述改进白骨顶搜索算法具体如下:

基于基分类器的个数分别生成种群X和反向种群Xi=rd*(E‑L)+L

其中,Xi为第i个种群个体的位置信息,rd为随机选取的维度,E为搜索空间的上限,L为搜索空间的下限,*为点乘运算, 为第i个反向种群个体的位置信息,r为[0,1]间的随机数;

生成新的种群x:

其中,f为第i个种群个体的适应度, 为第i个反向种群个体的适应度;

新的种群个体具有如下的三种移动方式:

个体随机移动:

其中, 为第i个新的种群个体第t+1次移动后的位置, 为第i个新的种群个体第t次移动的位置,t为当前迭代次数,T为最大迭代次数,W为随机选取的位置;

链式移动:

其中, 为第i‑1个新的种群个体第t次移动的位置;

跟随群体领导者yI移动:

I=1+(i mod N)

其中,I为领导者个体,mod为取余运算,N为预设领导者数量, 为第I个领导者个体第t次移动的位置, 为第I个领导者个体第t+1次移动的位置,r0为[‑1,1]间的随机数,gb为全局最优位置,r1为[0,1]间的随机数;

新的种群个体通过下式选取移动方式:

其中, 为第i个新的种群个体在第l(l∈[1,T])次移动时选择的移动方式, 为第i个新的种群个体在第l‑1次移动时选择的移动方式,~为非运算,δ为随机选取, 为第i个新的种群个体在第l‑1次移动时的适应度值, 为第i个新的种群个体在第l‑2次移动时的适应度值;

所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置。

2.根据权利要求1所述的社区社会信用体系信息处理系统,其特征在于:所述数据特征处理模块(200)基于社区社会信用数据在随机森林中的重要性进行排序筛选提取信用特征数据。

3.根据权利要求1所述的社区社会信用体系信息处理系统,其特征在于:所述信用数据分析模块(300)获取最佳位置对应的SVM基分类器最佳权重后,进行各SVM基分类器的融合处理:

其中,Y为社区社会信用数据的分类结果,ωi为第i个基分类器的权重,gi为第i个基分类器的分类结果,M为基分类器的数量。

4.根据权利要求3所述的社区社会信用体系信息处理系统,其特征在于:所述信用体系搭建模块(400)基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。

5.一种社区社会信用体系信息处理方法,基于权利要求1‑4任意一项所述的社区社会信用体系信息处理系统,其特征在于:包括如下步骤:S1:采集社区社会信用数据;

S2:对采集的社区社会信用数据进行特征提取处理,提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集P,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优;

所述改进白骨顶搜索算法具体如下:

基于基分类器的个数分别生成种群X和反向种群Xi=rd*(E‑L)+L

其中,Xi为第i个种群个体的位置信息,rd为随机选取的维度,E为搜索空间的上限,L为搜索空间的下限,*为点乘运算, 为第i个反向种群个体的位置信息,r为[0,1]间的随机数;

生成新的种群x:

其中,f为第i个种群个体的适应度, 为第i个反向种群个体的适应度;

新的种群个体具有如下的三种移动方式:

个体随机移动:

其中, 为第i个新的种群个体第t+1次移动后的位置, 为第i个新的种群个体第t次移动的位置,t为当前迭代次数,T为最大迭代次数,W为随机选取的位置;

链式移动:

其中, 为第i‑1个新的种群个体第t次移动的位置;

跟随群体领导者yI移动:

I=1+(i mod N)

其中,I为领导者个体,mod为取余运算,N为预设领导者数量, 为第I个领导者个体第t次移动的位置, 为第I个领导者个体第t+1次移动的位置,r0为[‑1,1]间的随机数,gb为全局最优位置,r1为[0,1]间的随机数;

新的种群个体通过下式选取移动方式:

其中, 为第i个新的种群个体在第l(l∈[1,T])次移动时选择的移动方式, 为第i个新的种群个体在第l‑1次移动时选择的移动方式,~为非运算,δ为随机选取, 为第i个新的种群个体在第l‑1次移动时的适应度值, 为第i个新的种群个体在第l‑2次移动时的适应度值;

所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置;

S3:对社区社会信用数据进行分析;

S4:基于分析结果搭建社区社会信用体系。

说明书 :

一种社区社会信用体系信息处理系统及方法

技术领域

[0001] 本发明涉及信用服务技术领域,尤其是一种社区社会信用体系信息处理系统及方法。

背景技术

[0002] 为了实现信用体系的建设,须从小群体先行先试,因此我们需要结合社区自身优势和资源,构建信用惠民数据,构建一套社区社会信用体系服务系统。现有技术基于樱花分评分的方式进行量化评分,但是对于各项信用评分项目的分类较少,细分程度不够,且对于个人的信用评分仅通过评分项目的严重程度进行赋分和扣分,未基于评分项目的重要程度进行综合评分,不能够准确反映信用体系评分结果。

发明内容

[0003] 本发明的目的是通过提出一种社区社会信用体系信息处理系统及方法,以解决上述背景技术中提出的缺陷。
[0004] 本发明采用的技术方案如下:
[0005] 提供一种社区社会信用体系信息处理系统,包括:
[0006] 信用数据采集模块:用于采集社区社会信用数据;
[0007] 数据特征处理模块:用于对采集的社区社会信用数据进行特征提取处理;
[0008] 信用数据分析模块:用于对社区社会信用数据进行分析;
[0009] 信用体系搭建模块:用于基于分析结果搭建社区社会信用体系;
[0010] 所述数据特征处理模块根据社区社会信用数据的类型基于决策树进行划分,并基于随机森林算法提取信用特征数据;
[0011] 所述随机森林算法具体如下:
[0012]
[0013] 其中, 表示决策树上节点 的基尼系数,表示社区社会信用数据类别数量,表示决策树上节点 上属于第 类的样本所占比例,
[0014]
[0015] 其中, 表示节点 分枝前后的基尼系数变化量, 、 分别表示节点 分枝后两个新节点上计算的基尼系数,
[0016]
[0017] 其中, 表示社区社会信用数据 在第 个决策树上的重要性评分;
[0018]
[0019] 其中, 表示社区社会信用数据 在整个随机森林中的重要性。
[0020] 作为本发明的一种优选技术方案:所述数据特征处理模块基于社区社会信用数据在随机森林中的重要性进行排序筛选提取信用特征数据。
[0021] 作为本发明的一种优选技术方案:所述信用数据分析模块基于所述数据特征处理模块提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集 ,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优。
[0022] 作为本发明的一种优选技术方案:所述改进白骨顶搜索算法具体如下:
[0023] 基于基分类器的个数分别生成种群 和反向种群 ,
[0024]
[0025]
[0026] 其中, 为第 个种群个体的位置信息,为随机选取的维度,为搜索空间的上限,为搜索空间的下限,为点乘运算, 为第 个反向种群个体的位置信息,为 间的随机数;
[0027] 生成新的种群 :
[0028]
[0029] 其中,为第 个种群个体的适应度, 为第 个反向种群个体的适应度;
[0030] 新的种群个体具有如下的三种移动方式:
[0031] 个体随机移动:
[0032]
[0033] 其中, 为第 个新的种群个体第 次移动后的位置, 为第 个新的种群个体第 次移动的位置,为当前迭代次数,为最大迭代次数, 为随机选取的位置;
[0034] 链式移动:
[0035]
[0036] 其中, 为第 个新的种群个体第 次移动的位置;
[0037] 跟随群体领导者 移动:
[0038]
[0039]
[0040]
[0041] 其中,为领导者个体, 为取余运算,为预设领导者数量, 为第 个领导者个体第 次移动的位置, 为第 个领导者个体第 次移动的位置,为 间的随机数, 为全局最优位置,为 间的随机数;
[0042] 新的种群个体通过下式选取移动方式:
[0043]
[0044] 其中, 为第 个新的种群个体在第 次移动时选择的移动方式,为第 个新的种群个体在第 次移动时选择的移动方式,为非运算,为随机选取, 为第 个新的种群个体在第 次移动时的适应度值, 为第 个新的种群个体在第 次移动时的适应度值。
[0045] 作为本发明的一种优选技术方案:所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置。
[0046] 作为本发明的一种优选技术方案:所述信用数据分析模块获取最佳位置对应的SVM基分类器最佳权重后,
[0047] 进行各SVM基分类器的融合处理:
[0048]
[0049] 其中,为社区社会信用数据的分类结果, 为第 个基分类器的权重, 为第 个基分类器的分类结果。
[0050] 作为本发明的一种优选技术方案:所述信用体系搭建模块基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
[0051] 提供一种社区社会信用体系信息处理方法,包括如下步骤:
[0052] S1:采集社区社会信用数据;
[0053] S2:对采集的社区社会信用数据进行特征提取处理;
[0054] S3:对社区社会信用数据进行分析;
[0055] S4:基于分析结果搭建社区社会信用体系。
[0056] 本发明提供的社区社会信用体系信息处理系统及方法,与现有技术相比,其有益效果有:
[0057] 本发明基于决策树的划分,通过随机森林算法提取信用特征数据,基于基分类器进行信用特征数据的初步分类,并基于改进白骨顶搜索算法进行基分类器权重的寻优,通过种群和反向种群生成新的种群的方式可以对种群初始化阶段进行优化以提升算法的收敛性能,还通过添加移动方式的选取策略,可以减少移动过程的盲目性,提升算法的移动效率以及算法的收敛速度,基于寻优获取的基分类器权重基于融合处理进行居民的信用等级划分,能够较为准确的反映社区社会信用体系评分结果。

附图说明

[0058] 图1为本发明优选实施例的系统框图;
[0059] 图2为本发明优选实施例中方法流程图。
[0060] 图中各个标记的意义为:100、信用数据采集模块;200、数据特征处理模块;300、信用数据分析模块;400、信用体系搭建模块。

具体实施方式

[0061] 需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0062] 参照图1所示,本发明优选实施例提供了一种社区社会信用体系信息处理系统,包括:
[0063] 信用数据采集模块100:用于采集社区社会信用数据;
[0064] 数据特征处理模块200:用于对采集的社区社会信用数据进行特征提取处理;
[0065] 信用数据分析模块300:用于对社区社会信用数据进行分析;
[0066] 信用体系搭建模块400:用于基于分析结果搭建社区社会信用体系。
[0067] 所述数据特征处理模块200根据社区社会信用数据的类型基于决策树进行划分,并基于随机森林算法提取信用特征数据。
[0068] 所述随机森林算法具体如下:
[0069]
[0070] 其中, 表示决策树上节点 的基尼系数,表示社区社会信用数据类别数量,表示决策树上节点 上属于第 类的样本所占比例,
[0071]
[0072] 其中, 表示节点 分枝前后的基尼系数变化量, 、 分别表示节点 分枝后两个新节点上计算的基尼系数,
[0073]
[0074] 其中, 表示社区社会信用数据 在第 个决策树上的重要性评分;
[0075]
[0076] 其中, 表示社区社会信用数据 在整个随机森林中的重要性。
[0077] 其中,为了保证选择节点的划分特征和划分点。本实施例采用贪心算法通过遍历每个特征和每个特征的可能划分点,选择能够最大程度地减少基尼系数的划分作为最优划分。具体为:
[0078] 对于每个社区社会信用数据 :
[0079] 对于每个可能的划分点 :
[0080] 将样本数据根据 和 进行划分为两个子集: 和 ,其中左子集包含个样本,其中属于类别 的样本数量为 ,右子集包含 个样本,其中属于类别的样本数量为 ;根据子集 和 中的样本数量 和 ,分别计算和 的基尼系数 和 。计算公式如下:
[0081]
[0082]
[0083]
[0084]
[0085] 计算当前划分的基尼系数。
[0086] 选择具有最小基尼系数的特征和划分点,即 。
[0087] 基于贪心算法选择能够最大程度地减少基尼系数的划分,意味着它能够有效地减少数据集的不纯度。通过选择最优划分,可以将节点的不纯度最小化,从而使得决策树的节点更加纯净。所述数据特征处理模块200基于社区社会信用数据在随机森林中的重要性进行排序筛选提取信用特征数据。
[0088] 所述信用数据分析模块300基于所述数据特征处理模块200提取的信用特征数据的获取训练样本及训练样本对应的类别标签获得训练样本集 ,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,基于改进白骨顶搜索算法进行基分类器的权重寻优。
[0089] 所述改进白骨顶搜索算法具体如下:
[0090] 基于基分类器的个数分别生成种群 和反向种群 ,
[0091]
[0092]
[0093] 其中, 为第 个种群个体的位置信息,为随机选取的维度,为搜索空间的上限,为搜索空间的下限,为点乘运算, 为第 个反向种群个体的位置信息,为 间的随机数;
[0094] 生成新的种群 :
[0095]
[0096] 其中,为第 个种群个体的适应度, 为第 个反向种群个体的适应度;
[0097] 新的种群个体具有如下的三种移动方式:
[0098] 个体随机移动:
[0099]
[0100] 其中, 为第 个新的种群个体第 次移动后的位置, 为第 个新的种群个体第 次移动的位置,为当前迭代次数,为最大迭代次数, 为随机选取的位置;
[0101] 链式移动:
[0102]
[0103] 其中, 为第 个新的种群个体第 次移动的位置;
[0104] 跟随群体领导者 移动:
[0105]
[0106]
[0107]
[0108] 其中,为领导者个体, 为取余运算,为预设领导者数量, 为第 个领导者个体第 次移动的位置, 为第 个领导者个体第 次移动的位置,为 间的随机数, 为全局最优位置,为 间的随机数;
[0109] 新的种群个体通过下式选取移动方式:
[0110]
[0111] 其中, 为第 个新的种群个体在第 次移动时选择的移动方式,为第 个新的种群个体在第 次移动时选择的移动方式,为非运算,为随机选取, 为第 个新的种群个体在第 次移动时的适应度值, 为第 个新的种群个体在第 次移动时的适应度值。
[0112] 所述改进白骨顶搜索算法中,基于训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法信寻优获取最佳位置。
[0113] 所述信用数据分析模块300获取最佳位置对应的SVM基分类器最佳权重后,[0114] 进行各SVM基分类器的融合处理:
[0115]
[0116] 其中,为社区社会信用数据的分类结果, 为第 个基分类器的权重, 为第 个基分类器的分类结果。
[0117] 所述信用体系搭建模块400基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
[0118] 参照图2所示,提供一种社区社会信用体系信息处理方法,包括如下步骤:
[0119] S1:采集社区社会信用数据;
[0120] S2:对采集的社区社会信用数据进行特征提取处理;
[0121] S3:对社区社会信用数据进行分析;
[0122] S4:基于分析结果搭建社区社会信用体系。
[0123] 本实施例中,通过信用数据采集模块100采集社区社会信用数据,包含100个住户。数据特征处理模块200对应100个住户搭建100棵决策树,基于随机森林算法以及基尼系数算法进行信用特征数据的选择:
[0124]
[0125] 其中, 表示决策树上节点 的基尼系数,表示社区社会信用数据类别数量,表示决策树上节点 上属于第 类的样本所占比例,
[0126]
[0127] 其中, 表示节点 分枝前后的基尼系数变化量, 、 分别表示节点 分枝后两个新节点上计算的基尼系数,
[0128]
[0129] 其中, 表示社区社会信用数据 在第 个决策树上的重要性评分;
[0130]
[0131] 其中, 表示社区社会信用数据 在整个随机森林中的重要性;
[0132] 基于计算出的社区社会信用数据 在整个随机森林中的重要性,基于重要性数值进行排序,选取排序的前60%的社区社会信用数据作为特征数据。基于特征数据获取训练样本及训练样本对应的类别标签获得训练样本集 ,并基于SVM基分类器进行初步分类,将SVM基分类器的权重作为个体的位置信息,选取训练样本集的训练误差倒数作为适应度函数,基于改进白骨顶搜索算法进行基分类器的权重寻优:
[0133] 基于50个基分类器分别生成数量为50的种群 和数量为50的反向种群 ,[0134]
[0135]
[0136] 其中, 为第 个种群个体的位置信息,为随机选取的维度,为搜索空间的上限,为搜索空间的下限,为点乘运算, 为第 个反向种群个体的位置信息,为 间的随机数;
[0137] 生成新的种群 :
[0138]
[0139] 其中,为第 个种群个体的适应度, 为第 个反向种群个体的适应度;
[0140] 改进白骨顶搜索算法通过种群和反向种群生成新的种群的方式可以对种群初始化阶段进行优化以提升算法的收敛性能。
[0141] 新的种群个体具有如下的三种移动方式:
[0142] 以第6次移动为例:
[0143] 个体随机移动:
[0144]
[0145] 其中, 为第 个新的种群个体第7次移动后的位置, 为第 个新的种群个体第6次移动的位置,为最大迭代次数, 为随机选取的位置;
[0146] 链式移动:
[0147]
[0148] 其中, 为第 个新的种群个体第6次移动的位置;
[0149] 跟随群体领导者 移动:
[0150]
[0151]
[0152]
[0153] 其中,为领导者个体, 为取余运算,为预设领导者数量, 为第 个领导者个体第6次移动的位置, 为第 个领导者个体第7次移动的位置,为 间的随机数,为全局最优位置,为 间的随机数;
[0154] 新的种群个体通过下式选取移动方式:
[0155]
[0156] 其中, 为第 个新的种群个体在第 次移动时选择的移动方式, 为第个新的种群个体在第5次移动时选择的移动方式,为非运算,为随机选取, 为第 个新的种群个体在第5次移动时的适应度值, 为第 个新的种群个体在第4次移动时的适应度值。
[0157] 若第 个新的种群个体在第5次移动时的适应度值低于第 个新的种群个体在第4次移动时的适应度值,则延续使用第5次移动时选取的移动,方式,否则随机选取移动方式。
[0158] 白骨顶搜索算法中种群个体的移动从三种移动方式中随机选取,易出现收敛速度慢、收敛精度低等问题,改进白骨顶搜索算法通过添加移动方式的选取策略,可以减少移动过程的盲目性,提升算法的移动效率以及算法的收敛速度。
[0159] 信用数据分析模块300基于获取最佳位置对应的SVM基分类器最佳权重后,[0160] 进行各SVM基分类器的融合处理:
[0161]
[0162] 其中,为社区社会信用数据的分类结果, 为第 个基分类器的权重, 为第 个基分类器的分类结果。
[0163] 信用体系搭建模块400基于强分类器分类结果划分社区社会信用等级体系,对社区社会信用数据进行社区社会信用等级划分。
[0164] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0165] 此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。