一种社交网络中的朋友关系传递树的建立方法转让专利

申请号 : CN201310026965.3

文献号 : CN103077247B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王建民王朝坤张君

申请人 : 清华大学

摘要 :

本发明涉及一种社交网络中的朋友关系传递树的建立方法,属于计算机数据挖掘技术领域。为每个自我节点建立朋友关系传递树,添加自我节点和朋友节点。在每个时间段,建立社交行为概率生成模型,初始化自我节点的中介偏好概率分布和好友关系强度分布的先验参数以及每个自我节点和新朋友节点的候选中介人,并不断迭代更新候选中介人,将迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的社交网络中添加z→y。本发明方法基于好友关系传递性对用户在社交网络中的行为进行建模,提供扁平社交网络的层次化呈现方法,便于深入分析社交网络的成因与内在结构,预测社交网络未来的发展与变化。

权利要求 :

1.一种社交网络中的朋友关系传递树的建立方法,其特征在于该方法包括以下步骤:

(1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点u,将该用户的朋友记为朋友节点v,为社交网络中的自我节点u,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;

(2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,对于与第i段交互对应的时间段Ti,执行步骤(3)-(9),i=1,2,……,N;

(3)对于时间段Ti,建立如下社交行为概率生成模型:

(3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为Vu,社交网络中每个自我节点u的新交朋友数为Nu;

(3-2)分别用先验参数为 的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布(3-3)从上述好友关系强度分布 中,采样得到社交网络中每个自我节点u的每次交互对象x;

(3-4)分别用先验参数为 的狄利克雷分布表示社交网络中每个自我节点u的中介偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布(3-5)分别从上述中介偏好概率分布 中采样得到社交网络中每个自我节点u的中介人z,从与中介人z对应的好友关系强度分布 中采样得到社交网络中自我节点u的新朋友节点y;

(3-6)用 表示社交网络中自我节点u在时间段Ti的朋友节点集合,用 表示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用 表示在时间段Ti中介人z选择z的朋友y′交互的次数,用 表示在时间段Ti中介人z将朋友y′推荐给别人的次数;

(4)对于时间段Ti:

若上一时间段Ti-1之前,社交网络自我节点u和朋友节点v已经是朋友,则先验参数和先验参数 分别为:其中, 表示在时间段Ti-1自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti-1自我节点u作为中介人与朋友节点v交互的次数, 表示在时间段Ti-1自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为

0~1, 为在Ti-1时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti-1时间段自我节点u的好友关系强度分布 先验参数中与朋友节点v相应的先验值;

若自我节点u和朋友节点v是上一时间段Ti-1中的新朋友,则先验参数 和先验参数分别为:

其中中介人z是自我节点u认识朋友节点v的中介人,κ为权重系数,取值范围为0~1,α0和β0分别为先验参数的预设值,α0和β0分别为正数;

(5)对于时间段Ti,若自我节点u和自我节点u的新朋友节点y有共同朋友,则从共同朋友中随机选择共同朋友z作为自我节点u与新朋友节点y之间的候选中介人,记录共同朋友z被选为自我节点u与新朋友节点y之间的候选中介人的次数为1,若自我节点u和自我节点u的新朋友节点y没有共同朋友,则选择自我节点u作为自我节点u与新朋友节点y之间的候选中介人;将自我节点u的中介偏好概率分布参照值 和好友关系强度分布参照值 均设定为0;

(6)对于时间段Ti:

若自我节点u与自我节点u的新朋友节点y有共同朋友,则按照下式计算共同朋友z′作为自我节点u与新朋友节点y之间的中介人z的概率其中, 表示在时间段Ti自我节点u选择共同朋友z′作为中介人的次数, 表示在时间段Ti共同朋友z′作为中介人与自我节点u的新朋友节点y交互的次数, 表示在时间段Ti共同朋友z′作为中介人将自我节点u的新朋友节点y推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与共同朋友z′相应的先验值, 为在Ti时间段自我节点z′的好友关系强度分布 先验参数中与朋友节点y相应的先验值,v为在Ti时间段自我节点u的朋友节点,y′为在Ti时间段共同朋友z′的朋友节点, 表示在时间段Ti自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti共同朋友z′作为中介人与z′的朋友节点y′交互的次数, 表示在时间段Ti共同朋友z′作为中介人将z′的朋友节点y′推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti时间段自我节点z′的好友关系强度分布 先验参数中与朋友节点y′相应的先验值;

根据得到的概率,采样确定自我节点u与新朋友节点y之间的新候选中介人z,并在记录中介人z被选为自我节点u与新朋友节点y之间的候选中介人的次数上增加1,进行步骤(7);

若自我节点u与自我节点u的新朋友节点y没有共同朋友,则保持步骤(5)的候选中介人不变,进行步骤(7);

(7)按照下式,分别计算自我节点u的中介偏好概率分布 和好友关系强度分布其中, 表示在时间段Ti自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti自我节点u作为中介人与朋友节点v交互的次数, 表示在时间段Ti自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti时间段自我节点u的好友关系强度分布 先验参数中与朋友节点v相应的先验值;

根据以上得到的自我节点u的中介偏好概率分布 和好友关系强度分布 与步骤(5)中设定的中介偏好概率分布参照值 和好友关系强度分布参照值 分别计算中介偏好概率分布变化量Δθ和好友关系强度分布变化量Δφ:设定一个变化量阈值,若Δθ和Δφ同时小于指定阈值,则进行步骤(8);若Δθ和Δφ中的任何一个大于或等于指定阈值,则设 并返回步骤(6);

(8)在时间段Ti,对于自我节点u与自我节点u的新朋友节点y,将步骤(5)迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的朋友关系传递树中添加一条边z→y;

(9)遍历所有时间段,得到社交网络中每个自我节点u的朋友关系传递树。

说明书 :

一种社交网络中的朋友关系传递树的建立方法

技术领域

[0001] 本发明涉及一种社交网络中的朋友关系传递树的建立方法,属于计算机数据挖掘技术领域。

背景技术

[0002] 社交网络在近些年得到了飞速的发展,也受到了许多研究人员的重视。其中社交网络的形成与演化过程研究一直都是一项有意义而且有挑战的工作。已有的工作主要从两个方面来研究社交网络的形成与演化。一方面,人们以社交网络演化中在某一时刻的快照或者多个时刻的快照为对象,研究社交网络的宏观结构特征变化;另一方面,人们关注社交网络发展的微观模式,并发现了许多的模式用以解释和分析人们如何交朋友。这样的模式包括偏好依附(Preferential Attachment)、三元闭合(triadic closure)、互惠(Reciprocity)、同质性(Homophily)等等,其中三元闭合(triadic closure)是社交网络的链接形成中最普遍的现象之一,其社会学原理是朋友关系的传递性(the transitivity of friendship),即两个有公共朋友的人更可能成为朋友。朋友关系的传递性已经被证明可以用于对网络演化过程进行建模以及预测未来的链接形成,然而这一性质在网络演化过程中所起的作用并没有得到很深的探究。
[0003] 学者Simmel分析了在这样三元结构中三个参与者的角色,并且指出第三个人一般扮演着中介人或者协调者的作用。然而,其中还是不清楚第三个人是如何影响、促使另外两个人成为朋友的。学者D.Yin等人在链接预测问题中考虑了中介人的作用,并且把链接产生看作是中间人“潜在的推荐”的结果。他们在矩阵分解中引入了中介人潜在推荐这一潜在的维度,然而这一分析是对于静态网络进行的,没有考虑到网络的发展以及中介人在微观上对于网络中每一条链接形成的影响。
[0004] 好友推荐是交友网站中的一项重要的功能,许多交友网站依靠为用户推荐好友来吸引用户、增强用户对交友网站的依赖性。目前研究者已经提出了许多算法来解决好友推荐的问题,比如随机游走算法、有监督的随机游走算法、矩阵分解算法等等,然而这些算法都 把社交网络当作一个图来处理,并没有考虑到用户的动机和行为在好友推荐中的重要作用。

发明内容

[0005] 本发明的目的是提出一种社交网络中的朋友关系传递树的建立方法,通过对用户的行为进行建模,基于朋友关系的传递性来推测和表达社交网络的形成和演化过程,从而便于对社交网络未来发展情况进行预测。
[0006] 本发明提出的社交网络中的朋友关系传递树的建立方法,包括以下步骤:
[0007] (1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点u,将该用户的朋友记为朋友节点v,为社交网络中的自我节点u,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;
[0008] (2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,对于与第i段交互对应的时间段Ti,执行步骤(3)-(9),i=1,2,……,N;
[0009] (3)对于时间段Ti,建立如下社交行为概率生成模型:
[0010] (3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为Vu,社交网络中每个自我节点u的新交朋友数为Nu;
[0011] (3-2)分别用先验参数为 的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布
[0012] (3-3)从上述好友关系强度分布 中,采样得到社交网络中每个自我节点u的每次交互对象x;
[0013] (3-4)分别用先验参数为 的狄利克雷分布表示社交网络中每个自我节点u的中介偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布
[0014] (3-5)分别从上述中介偏好概率分布 中采样得到社交网络中每个自我节点u的中介人z,从与中介人z对应的好友关系强度分布 中采样得到社交网络中自我节点u的新朋友节点y;
[0015] (3-6)用 表示社交网络中自我节点u在时间段Ti的朋友节点集合,用表 示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用 表示在时间段Ti中介人z选择z的朋友y′交互的次数,用 表示在时间段Ti中介人z将朋友y′推荐给别人的次数;
[0016] (4)对于时间段Ti:
[0017] 若上一时间段Ti-1之前,社交网络自我节点u和朋友节点v已经是朋友,则先验参数 和先验参数 分别为:
[0018]
[0019]
[0020] 其中, 表示在时间段Ti-1自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti-1自我节点u作为中介人与朋友节点v交互的次数, 表示在时间段Ti-1自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为0~1, 为在Ti-1时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti-1时间段自我节点u的好友关系强度分布 先验参数中与朋友节点v相应的先验值;
[0021] 若自我节点u和朋友节点v是上一时间段Ti-1中的新朋友,则先验参数 和先验参数  分别为:
[0022]
[0023]
[0024] 其中中介人z是自我节点u认识朋友节点v的中介人,κ为权重系数,取值范围为0~1,α0和β0分别为先验参数的预设值,α0和β0分别为正数;
[0025] (5)对于时间段Ti,若自我节点u和自我节点u的新朋友节点y有共同朋友,则从共同朋友中随机选择共同朋友z作为自我节点u与新朋友节点y之间的候选中介人,记录共同朋友z被选为自我节点u与新朋友节点y之间的候选中介人的次数为1,若自我节点u和自我节点u的新朋友节点y没有共同朋友,则选择自我节点u作为自我节点u与新朋友节点y之间的候选中介人;
[0026] (6)对于时间段Ti:
[0027] 若自我节点u与自我节点u的新朋友节点y有共同朋友,则按照下式计算共同朋友z′作为自我节点u与新朋友节点y之间的中介人z的概率
[0028]
[0029] 其中, 表示在时间段Ti自我节点u选择共同朋友z′作为中介人的次数, 表示在时间段Ti共同朋友z′作为中介人与自我节点u的新朋友节点y交互的次数, 表示在时间段Ti共同朋友z′作为中介人将自我节点u的新朋友节点y推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与共同朋友z′相应的先验值, 为在Ti时间段自我节点z′的好友关系强度分布φz′先验参数中与朋友节点y相应的先验值,v为在Ti时间段自我节点u的朋友节点,y′为在Ti时间段共同朋友z′的朋友节点, 表示在时间段Ti自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti共同朋友z′作为中介人与z′的朋友节点y′交互的次数, 表示在时间段Ti共同朋友z′作为中介人将z′的朋友节点y′推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti时间段自我节点z′的好友关系强度分布 先验参数中与朋友节点y′相应的先验值;
[0030] 根据得到的概率,采样确定自我节点u与新朋友节点y之间的新候选中介人z,并在记录中介人z被选为自我节点u与新朋友节点y之间的候选中介人的次数上增加1,进行步骤(7);
[0031] 若自我节点u与自我节点u的新朋友节点y没有共同朋友,则保持步骤(5)的候选中介人不变,进行步骤(7);
[0032] (7)按照下式,分别计算自我节点u的中介偏好概率分布 和好友关系强度分布 [0033]
[0034]
[0035] 其中, 表示在时间段Ti自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti自我节点u作为中介人与朋友节点v交互的次数, 表示在时间段Ti自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti时间段自我节点u的好友关系强度分布 先验参数中与朋友节点v相应的先验值;
[0036] 根据以上得到的自我节点u的中介偏好概率分布 和好友关系强度分布 和上一轮迭代后计算所得到的中介偏好概率分布 和好友关系强度分布 分别计算中介偏好概率分布变化量Δθ和好友关系强度分布变化量Δφ:
[0037]
[0038]
[0039] 设定一个变化量阈值,若Δθ和Δφ同时小于指定阈值,则进行步骤(8);若Δθ和Δφ中的任何一个大于或等于指定阈值,则设 并返回步骤(6);
[0040] (9)在时间段Ti,对于自我节点u与自我节点u的新朋友节点y,将步骤(5)迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的朋友关系传递树中添加一条边z→y;
[0041] (10)遍历所有时间段,得到社交网络中每个自我节点u的朋友关系传递树。
[0042] 本发明提出的社交网络中的朋友关系传递树的建立方法,其优点是:
[0043] 1、本发明方法建立的社交网络中的朋友关系传递树,从好友关系传递性的角度出发,提供了对于传统上扁平结构的社交网络的层次化呈现方法,便于深入分析社交网络的成因与内在结构,以及预测社交网络未来的发展与变化,从而为交友网站的设计与运营提供参考。
[0044] 2、本发明方法基于社会学原理,对用户在社交网络中的行为进行合理建模,在考虑用户的交友行为时,不仅考虑用户对于朋友的偏好,还考虑用户在选择朋友时对于中介人的偏好,可以更准确地预测用户未来的交友行为,从而可以为交友网站提供更准确的好友推荐结果。
[0045] 3、本发明方法能够体现出用户的交友行为与习惯在不同时间的变化情况,从而可以更好地用于预测用户在不同时间的交友行为,以及整个社交网络在不同时间的演化情况,可以使得交友网站能够根据用户的行为变化在不同时间为用户推荐最合适的新朋友。
[0046] 4、本发明方法采用了吉布斯采样法进行模型的求解,执行速度快,可扩展性强。

附图说明

[0047] 图1是一个典型的自我中心网络示意图。
[0048] 图2是本发明提出的社交网络中的朋友关系传递树的示意图。
[0049] 图3是本发明方法中建立的社交行为概率生成模型的示意图。

具体实施方式

[0050] 本发明提出的社交网络中的朋友关系传递树的建立方法,其最后建立的树状网络如图2所示,包括以下步骤:
[0051] (1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点u,将该用户的朋友记为朋友节点v,为社交网络中的自我节点u,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;
[0052] (2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,交互数据包括用户与朋友建立朋友关系和用户与朋友的信息交流,对于与第i段交互对应的时间段Ti,执行步骤(3)-(9),i=1,2,……,N;
[0053] (3)对于时间段Ti,建立如下社交行为概率生成模型:
[0054] (3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为Vu,社交网络中每个自我节点u的新交朋友数为Nu;
[0055] (3-2)分别用先验参数为 的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布
[0056] (3-3)从上述好友关系强度分布 中,采样得到社交网络中每个自我节点u的每次交互对象x;
[0057] (3-4)分别用先验参数为 的狄利克雷分布表示社交网络中每个自我节点u的中介 偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布
[0058] (3-5)分别从上述中介偏好概率分布 中采样得到社交网络中每个自我节点u的中介人z,从与中介人z对应的好友关系强度分布 中采样得到社交网络中自我节点u的新朋友节点y;
[0059] (3-6)用 表示社交网络中自我节点u在时间段Ti的朋友节点集合,用表示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用 表示在时间段Ti中介人z选择z的朋友y′交互的次数,用 表示在时间段Ti中介人z将朋友y′推荐给别人的次数;
[0060] (4)对于时间段Ti:
[0061] 若上一时间段Ti-1之前,社交网络自我节点u和朋友节点v已经是朋友,则先验参数 和先验参数 分别为:
[0062]
[0063]
[0064] 其中, 表示在时间段Ti-1自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti-1自我节点u作为中介人与朋友节点v交互的次数, 表示在时间段Ti-1自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为0~1, 为在Ti-1时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti-1时间段自我节点u的好友关系强度分布 先验参数中与朋友节点v相应的先验值;
[0065] 若自我节点u和朋友节点v是上一时间段Ti-1中的新朋友,则先验参数 和先验参数  分别为:
[0066]
[0067]
[0068] 其中中介人z是自我节点u认识朋友节点v的中介人,κ为权重系数,取值范围为0~1, α0和β0分别为先验参数的预设值,α0和β0分别为正数;
[0069] (5)对于时间段Ti,若自我节点u和自我节点u的新朋友节点y有共同朋友,则从共同朋友中随机选择共同朋友z作为自我节点u与新朋友节点y之间的候选中介人,记录共同朋友z被选为自我节点u与新朋友节点y之间的候选中介人的次数为1,若自我节点u和自我节点u的新朋友节点y没有共同朋友,则选择自我节点u作为自我节点u与新朋友节点y之间的候选中介人;
[0070] (6)对于时间段Ti:
[0071] 若自我节点u与自我节点u的新朋友节点y有共同朋友,则按照下式计算共同朋友z′作为自我节点u与新朋友节点y之间的中介人z的概率
[0072]
[0073] 其中, 表示在时间段Ti自我节点u选择共同朋友z′作为中介人的次数, 表示在时间段Ti共同朋友z′作为中介人与自我节点u的新朋友节点y交互的次数, 表示在时间段Ti共同朋友z′作为中介人将自我节点u的新朋友节点y推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与共同朋友z′相应的先验值, 为在Ti时间段自我节点z′的好友关系强度分布φz′先验参数中与朋友节点y相应的先验值,v为在Ti时间段自我节点u的朋友节点,y′为在Ti时间段共同朋友z′的朋友节点, 表示在时间段Ti自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti共同朋友z′作为中介人与z′的朋友节点y′交互的次数, 表示在时间段Ti共同朋友z′作为中介人将z′的朋友节点y′推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti时间段自我节点z′的好友关系强度分布 先验参数中与朋友节点y′相应的先验值;
[0074] 根据得到的概率,采样确定自我节点u与新朋友节点y之间的新候选中介人z,并在记录中介人z被选为自我节点u与新朋友节点y之间的候选中介人的次数上增加1,进行步骤(7);
[0075] 若自我节点u与自我节点u的新朋友节点y没有共同朋友,则保持步骤(5)的候选中 介人不变,进行步骤(7);
[0076] (7)按照下式,分别计算自我节点u的中介偏好概率分布 和好友关系强度分布 [0077]
[0078]
[0079] 其中, 表示在时间段Ti自我节点u选择朋友v作为中介人的次数, 表示在时间段Ti自我节点u作为中介人与朋友节点v交互的次数, 表示在时间段Ti自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数, 为在Ti时间段自我节点u的中介偏好概率分布 的先验参数中与朋友节点v相应的先验值, 为在Ti时间段自我节点u的好友关系强度分布 先验参数中与朋友节点v相应的先验值;
[0080] 根据以上得到的自我节点u的中介偏好概率分布 和好友关系强度分布 和上一轮迭代后计算所得到的中介偏好概率分布 和好友关系强度分布 分别计算中介偏好概率分布变化量Δθ和好友关系强度分布变化量Δφ:
[0081]
[0082]
[0083] 设定一个变化量阈值,若Δθ和Δφ同时小于指定阈值,则进行步骤(8);若Δθ和Δφ中的任何一个大于或等于指定阈值,则设 并返回步骤(6);
[0084] (9)在时间段Ti,对于自我节点u与自我节点u的新朋友节点y,将步骤(5)迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的朋友关系传递树中添加一条边z→y;
[0085] (10)遍历所有时间段,得到社交网络中每个自我节点u的朋友关系传递树。
[0086] 本发明提出的社交网络中的朋友关系传递树(Latent Friendship Transitivity Tree,下文简称LaFT-Tree)是针对于自我中心网络(Egocentric Network)而定义的。自我中心网络指环绕在自我周围的社会网络,它既包括自我与他人的直接联结,也包括这些与自我联结的他人之间的联结。自我中心网络一般包含一个自我节点(ego),以及该自我节点在社交网络中的朋友。典型的一个自我中心网络例子如图1所示,其中节点v1是自我节点,其他节点都是v1的朋友。在自我中心网络中,所有的朋友都与自我节点直接相连,形成一种扁平化的结构。这一结构无法体现出不同的朋友在v1的社交网络中的影响与作用,也无法体现出v1的自我中心网络的形成过程与未来演化趋势。因此我们提出了LaFT-Tree,来层次化地表达自我中心网络的形成过程。LaFT-Tree是一个树状结构,其根节点就是自我中心网络的自我节点,而每一个叶节点和分支节点都是自我节点的朋友。树中的每一条边u->v都表示自我节点是通过u认识了v;如果u是自我节点,那么这一条边表示自我节点直接认识了v。LaFT-Tree的一个例子如图2所示,它描述了如图1所示的自我中心网络的一种可能的形成过程:v1直接认识了v2,然后通过v2认识了v4和v9;v1直接认识了v1,然后通过v1认识了v3、v6和v14;等等。在LaFT-Tree中离根节点越远的节点表示他认识根节点的时间越晚。
[0087] 本发明提出的社交行为概率生成模型命名为LaFT-LDA。LaFT-LDA是一个概率生成模型,它假设每个用户在社交网络中的交友行为包括两个步骤:一是选择一位朋友作为中介人,二是选择这位中介人的一个朋友作为自己的新朋友。模型的图形化表示如图3所示。在图中,U表示社交网络中总用户数,Nu表示每个用户u新交的朋友数,Vu表示每个用户u与他的朋友们的交互数。θ是每个用户的中介偏好概率分布,φ是每个用户的好友关系强度分布,α,β分别是θ,φ的先验分布。