一种基于超元启发算法的人群信息聚类方法转让专利

申请号 : CN201910396377.6

文献号 : CN110276376A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李武朝郭为安汪镭毛杰司呈勇

申请人 : 嘉兴职业技术学院

摘要 :

本发明提供了基于超元启发算法的人群信息聚类方法。它解决了现有技术难以实现在动态环境中建立人群的聚类的问题。本方法包括以下步骤:根据人群的社交网络建立社交图模型;根据上述模型获得邻接矩阵A及该矩阵的元素a_{ij};获取节点i的等级;通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;设计超元启发式算法对所述的聚类目标进行聚类处理。本方法能有效提高人群信息的动态网络环境下算法的聚类能力,提高聚类质量。

权利要求 :

1.一种基于超元启发算法的人群信息聚类方法,其特征在于,包括以下步骤:A、根据人群的社交网络建立社交图模型,该模型表示为:G=G(N,V),其中,N为节点数,V为节点间的关系;

B、根据上述模型获得邻接矩阵A,该矩阵的元素a_{ij}表示为:其中,L(i,j)表示节点i和节点j是连接的;w_{ij}代表两个节点的权值;

C、获取节点i的等级,具体表示为

D、通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;

E、设计超元启发式算法对所述的聚类目标进行聚类处理。

2.根据权利要求1所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的节点i的等级具体表示为: 其中, 其中,S为人群的聚类类别,将社交网络划分为m个社区,则S={S1,S2,...,Sm}, 为第i个节点的入度,为第i个节点的出度。

3.根据权利要求2所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的聚类目标的定义如下:

4.根据权利要求1或2或3所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的人群信息聚类目标的目标函数包括:人群的爱好、出没地点、作息习惯和社会网络结构。

5.根据权利要求1或2或3所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的超元启发式算法包括如下步骤:e1、初始化种群信息;

e2、对种群信息进行分组形成n个子种群;

e3、采用n个算法分别对n个子种群进行一一对应的并行运算;

e4、输出运算结果,并利用评估器对并行运算的结果进行评估;

e5、根据评估结果选出最佳算法,并利用该最佳算法进行一定次数的迭代计算;

e6、输出当前全体子种群,并判断各子种群是否满足优化的终止条件:如果满足,则输出结果;如果不满足,则重新进行种群分组。

6.根据权利要求5所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的并行运算过程中,设计算法的重组器来选择合适的算法。

7.根据权利要求6所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的重组器用于从n个算法中重组出m个合适的算法,其中n大于m。

8.根据权利要求5所述的一种基于超元启发算法的人群信息聚类方法,其特征在于,所述的评估器用于对运算结果进行个体评估和子算法评估;所述的个体评估用于评估出运算结果中的普通个体和较好个体,所述的子算法评估用于对较好个体进行算法评估。

说明书 :

一种基于超元启发算法的人群信息聚类方法

技术领域

[0001] 本发明属于信息处理技术领域,涉及一种基于超元启发算法的人群信息聚类方法。

背景技术

[0002] 当前,我国的各类社交软件不断发展并广泛应用,给人民群众的生活娱乐方式带来了诸多的便利。然而,利用社交网络进行团伙式的违法犯罪行为也具有更高的隐蔽性、更强的破坏性,给人民群众的生命财产安全造成隐患。因此通过对社交网络中的人群数据信息进行聚类,将有效地挖掘不同小众群体的人员结构及其在社会大数据网络中的关系。
[0003] 在过去的十年不断涌现出了各种类型的网络聚类算法,其中较为著名的算法包括Girvan-Newman算法,快速贪婪模块优化,马尔科夫聚类算法等。对网络中的人群信息进行检测已经成为社会数据分析中的重要研究方向,Orman以及Forunato提出的网络数据聚类方法已经被应用于社会网络中的人群检测。然而,由于网络结构形式各异且复杂多变,因此传统启发式优化方法往往无法满意的求解人群信息的聚类与模式识别问题。为了对人群信息进行检测与识别,元启发式算法引起了学者们的广泛关注。这些算法在局部学习和全局搜索能力方面具有更为显著的优势,在多数研究中均表现出了比传统启发式算法更为显著的优化能力。在元启发式算法中,人群数量可以由算法自动的设定,并能够实现在线的动态变化。许多学者已经将一些元启发式算法应用于网络聚类问题,如进化算法和粒子群优化算法等。在这一研究中,Pizzuti等提出了网络聚类的单目标遗传算法,Gong提出基于Memetic算法提出了面向网络聚类问题的Memenet算法。尽管这些单目标算法在人群信息聚类的理论与应用中都很成功,仍然存在以下问题并未得到解决:1.不同算法对于相同网络会产生不同的聚类模式,即人群环境将发生变化;2.用户需要实现设定好人群数量用于聚类,无法根据人群信息的特征自适应地设定不同的算法,即人员个体在群体中的行为将发生变化。然而在实际网络中,这些信息通常无法事先预知且存在动态特性,因此如何在动态环境中建立人群的聚类信息是当前人群信息聚类分析中面临的难点问题。

发明内容

[0004] 针对上述背景技术中人群信息的特点,本发明提供了一种基于超元启发算法的人群信息聚类方法。
[0005] 本发明的目的可通过下列技术方案来实现:
[0006] 一种基于超元启发算法的人群信息聚类方法,其特征在于,包括以下步骤:
[0007] A、根据人群的社交网络建立社交图模型,该模型表示为:G=G(N,V),其中,N为节点数,V为节点间的关系;
[0008] B、根据上述模型获得邻接矩阵A,该矩阵的元素a_{ij}表示为:其中,L(i,j)表示节点i和节点j是连接的;w_{ij}代表两个节点的权值;
[0009] C、获取节点i的等级,具体表示为
[0010] D、通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;
[0011] E、设计超元启发式算法对所述的聚类目标进行聚类处理。
[0012] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的节点i的等级具体表示为: 其中, 其中,S为人群的聚类类别,将社交网络划分为m个社区,则S={S1,S2,...,Sm}, 为第i个节点的入度, 为第i个节点的出度;
[0013] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的聚类目标的定义如下:
[0014] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的人群信息聚类目标的目标函数包括:人群的爱好、出没地点、作息习惯和社会网络结构。
[0015] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的超元启发式算法包括如下步骤:
[0016] e1、初始化种群信息;
[0017] e2、对种群信息进行分组形成n个子种群;
[0018] e3、采用n个算法分别对n个子种群进行一一对应的并行运算;
[0019] e4、输出运算结果,并利用评估器对并行运算的结果进行评估;
[0020] e5、根据评估结果选出最佳算法,并利用该最佳算法进行一定次数的迭代计算;
[0021] e6、输出当前全体子种群,并判断各子种群是否满足优化的终止条件:如果满足,则输出结果;如果不满足,则重新进行种群分组。
[0022] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的并行运算过程中,设计算法的重组器来选择合适的算法。
[0023] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的重组器用于从n个算法中重组出m个合适的算法,其中n大于m。
[0024] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的算法包括粒子群算法、蚁群算法、遗传算法、模拟退火算法、人工神经网络算法和GRASP with  path-relinking算法中的至少两种。
[0025] 在上述的一种基于超元启发算法的人群信息聚类方法中,所述的评估器用于对运算结果进行个体评估和子算法评估;所述的个体评估用于评估出运算结果中的普通个体和较好个体,所述的子算法评估用于对较好个体进行算法评估。
[0026] 与现有技术相比,本基于超元启发算法的人群信息聚类方法具有以下优点:1、人群信息的聚类更加精准;算法对不同问题的自适应性大幅提高;3、有效提高人群信息的动态网络环境下算法的聚类能力,提高聚类质量;3、算法的空间复杂度降低,效率提高。

附图说明

[0027] 图1是本发明实施例中人群的社交网络的结构示意图。
[0028] 图2是本发明实施例中超元启发式算法的框架。

具体实施方式

[0029] 以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
[0030] 如图1所示,本基于超元启发算法的人群信息聚类方法包括以下步骤:
[0031] A、根据人群的社交网络建立社交图模型,该模型表示为:G=G(N,V),其中,N为节点数,其对应人员信息,N的维度包括年龄、性别、民族等特征信息;V为节点间的关系,其对应不同人员之间的联系度,上述信息可由注册在案的人员关系获得,也将有人员往来大数据分析补充获得。
[0032] B、根据上述模型获得邻接矩阵A,该矩阵的元素a_{ij}表示为:其中,L(i,j)表示节点i和节点j是连接的;w_{ij}代表两个节点的权值;人群信息网络的聚类中需要决定网络中节点的特征相似点,进而进行信息分类。如果一个网络在两个节点被连接时是不直接的和不权重的,那么a_{ij}=1;相反则a_{ij}=0。
[0033] C、获取节点i的等级: 其具体可以表示为: 其中,其中,S为人群的聚类类别,将社交网络划分为m个社区,则S={S1,
S2,...,Sm}, 为第i个节点的入度, 为第i个节点的出度;
[0034] D、通过对节点i的等级进行分析判断,确立强感官群体和弱感官群体,在强群体中,每个节点在人群内比在其他社区中有更多的连接。在弱群体中,与其他群体的等级和大于群体内的等级和。从而定义人群信息的聚类目标,所述的聚类目标包括聚类目标NRA和聚类目标RC;NRA具体含义为Negative Ratio Association,RC具体含义为Ratio Cut。聚类目标的定义如下:
[0035] E、设计超元启发式算法对所述的聚类目标进行聚类处理。其中,人群信息聚类目标的目标函数包括:人群的爱好、出没地点、作息习惯和社会网络结构。超元启发式算法是一类使用元启发式算法思想对各种元启发式算法进行调度、选择的算法,从而提高算法对不同问题的自适应性。如图2所示,在本步骤中采用的超元启发式算法包括如下步骤:
[0036] e1、初始化种群信息;
[0037] e2、对种群信息进行分组形成n个子种群;
[0038] e3、采用n个算法分别对n个子种群进行一一对应的并行运算;同时采用重组器选择合适的算法,利用重组器从n个算法中重组出m个合适的算法,其中n大于m。从而使得元启发式算法的模块可以进行重组和优化,即将不同的算法操作模块作为算法模块群(Modular Population/Swarm)进行重组。
[0039] e4、输出运算结果,并利用评估器对并行运算的结果进行评估;
[0040] e5、根据评估结果选出最佳算法,并利用该最佳算法进行一定次数的迭代计算;评估器用于对运算结果进行个体评估和子算法评估;个体评估用于评估出运算结果中的普通个体和较好个体,子算法评估用于对较好个体进行算法评估。
[0041] e6、输出当前全体子种群,并判断各子种群是否满足优化的终止条件:如果满足,则输出结果;如果不满足,则重新进行种群分组。
[0042] 本实施例中所述的评估器为候选解的评价函数,或者说目标函数。比如我们要最小化y=x1+x2,获得两个解,其中第一个解为[x1=1,x2=3],第二个解为[x1=2,x2=1]。
[0043] 那么在这个问题中,评估器就是目标函数y=x1+x2,对于第一个解[x1=1,x2=3]来说,他的评估结果就是1+3=4,对于第二个解[x1=2,x2=1]来说,他的评估结果就是2+1=3)
[0044] 而重组器是指以随机的对现有解集合进行重组,按照上面所说的例子,两个解分别为
[0045] 解1:[x1=1,x2=3]
[0046] 解2:[x1=2,x2=1]
[0047] 那么一种比较简单方便的重组方式就是把解1中的x1与解2中的x1互换,生成新的两个解如下:
[0048] 新解1:[x1=1,x2=1]
[0049] 新解2:[x1=2,x2=3]
[0050] 算法最终利用评估器对解1,解2,新解1,新解2进行评估,保留质量前两名的解,进入下一轮迭代。
[0051] 采用上述超元启发式算法:一方面,以指数形式进一步扩大了子算法的组合类型,使得超启发式算法具有更强的自适应性;另一方面,该设计将在不增大算法时间复杂度的同时(算法的重组并不改变各算法的最大时间复杂度),有效降低算法的空间复杂度(从n个算法中挑选出m个子算法进行运算,而非全部n个子算法参与运算)。在协同式算法结构设计中,原有的高层结构中的算法或学习机制将被摒弃,取而代之的是不同算法的协同工作。
[0052] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。