一种用户行为评价方法、装置及系统转让专利

申请号 : CN201510242258.7

文献号 : CN106302568B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈方毅高家栋苏利祥

申请人 : 厦门美柚信息科技有限公司

摘要 :

本发明公开了一种用户行为评价方法、装置及系统,该方法包括:服务器获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;根据所述用户行为日志统计所述用户的操作行为;根据用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价。利用本发明,能够自动、快速地分离有效的用户行为及其影响权重,具有很强的自动化和鲁棒性。

权利要求 :

1.一种用户行为评价方法,其特征在于,所述方法包括:

服务器获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;

根据所述用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子;其中,所述第一预设条件为相关系数高于第一阈值;

计算保留下来的各因子的贡献率;

根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为;

根据用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价。

2.根据权利要求1所述的用户行为评价方法,其特征在于,计算保留下来的各因子的贡献率的步骤之前,所述方法还包括:对保留下来的因子进行检验统计量KMO的检测,以保留相关性满足第二预设条件的因子;其中,所述第二预设条件为KMO检测值不低于第二阈值。

3.根据权利要求1所述的用户行为评价方法,其特征在于,所述根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为的步骤具体为:根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率;

计算各因子的载荷矩阵,获得各主成分因子的权重向量,以统计所述用户的操作行为;

所述根据用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价的步骤具体为:根据用户的操作行为的统计结果以及所述权重向量确定评分,以利用所述评分对所述用户进行行为评价。

4.根据权利要求1所述的用户行为评价方法,其特征在于,所述方法还包括:将评分满足第四预定条件的用户的用户信息/用户行为发送至另一服务器,使所述另一服务器对所述用户信息/用户行为进行分析以获取相关信息。

5.根据权利要求1所述的用户行为评价方法,其特征在于,所述方法还包括:根据所述用户行为的评价结果进行排序,以确定置信阈值;其中,所述置信阈值用于预测所述用户接下来的用户生成内容是否属于有价值的信息。

6.一种用户行为评价装置,其特征在于,所述装置包括:

获取模块,用于获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;

统计模块,用于对所述获取模块生成的用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子;计算保留下来的各因子的贡献率;以及根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为;其中,所述第一预设条件为相关系数高于一阈值;

评价模块,用于根据所述统计模块得到的所述用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价。

7.根据权利要求6所述的用户行为评价装置,其特征在于,所述统计模块根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率;计算各因子的载荷矩阵,获得各主成分因子的权重向量,以统计所述用户的操作行为;

所述评价模块用于根据用户的操作行为的统计结果以及所述权重向量确定评分,以利用所述评分对所述用户进行行为评价。

8.根据权利要求6所述的用户行为评价装置,其特征在于,所述统计模块还用于对保留下来的因子进行检验统计量KMO的检测,以保留相关性满足第二预设条件的因子;其中,所述第二预设条件为KMO检测值不低于第二阈值。

9.一种用户行为评价系统,其特征在于,所述系统包括第一服务器和第二服务器,其中,所述第一服务器包括:获取模块,用于获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;

统计模块,用于对所述获取模块生成的用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子;计算保留下来的各因子的贡献率;以及根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为;其中,所述第一预设条件为相关系数高于一阈值;

评价模块,用于根据所述统计模块得到的所述用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价;以及传送模块,用于发送包括所述用户评分的用户信息至所述第二服务器,使所述第二服务器对所述用户信息进行分析以确定相关信息。

说明书 :

一种用户行为评价方法、装置及系统

技术领域

[0001] 本发明涉及网络信息分析与数据挖掘技术领域,特别是涉及一种用户评价方法、装置及系统。

背景技术

[0002] 随着计算机网络的不断发展,网络信息成为日常生活中的重要组成部分,互联网以及成为人们获取信息、交流沟通的重要场所。用户可以在各种主题的论坛中发布信息、获取信息、交流经验等,在这些海量的帖子蕴含着巨大的潜在价值。同样,发布帖子的用户也同样具有相应的价值。现有用户行为评价的方法,基本上是基于有限的数据量,采用主动降维、人工抽取权重因子的方式。但是,该方式需要的人工量大,而且不利于自动化、快速的迭代。

发明内容

[0003] 本发明主要解决的技术问题是提供一种用户行为评价方法、装置及系统,能够快速根据论坛帖子的相关信息对用户行为进行评价。
[0004] 为解决上述技术问题,本发明采用的一个技术方案是:提供一种用户行为评价方法,所述方法包括:服务器获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;根据所述用户行为日志统计所述用户的操作行为;根据用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价。
[0005] 其中,所述根据所述用户行为日志统计所述用户的操作行为的步骤具体为:根据所述用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子;计算保留下来的各因子的贡献率;以及根据计算得到的保留下来的各因子的 贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为。
[0006] 其中,根据所述用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子的步骤之后,所述方法还包括:对保留下来的因子进行检验统计量KMO的检测,以保留相关性满足第二预设条件的因子。
[0007] 其中,所述根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为的步骤具体为:根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率;计算各因子的载荷矩阵,获得各主成分因子的权重向量,以统计所述用户的操作行为;所述根据用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价的步骤具体为:根据用户的操作行为的统计结果以及所述权重向量确定评分,以利用所述评分对所述用户进行行为评价。
[0008] 其中,所述方法还包括:将评分满足第四预定条件的用户的用户信息/用户行为发送至另一服务器,使所述另一服务器对所述用户信息/用户行为进行分析以获取相关信息。
[0009] 其中,所述方法还包括:根据所述用户行为的评价结果进行排序,以确定置信阈值;其中,所述置信阈值用于预测所述用户接下来的用户生成内容是否属于有价值的信息。
[0010] 为解决上述技术问题,本发明采用的另一个技术方案是:提供一种用户行为评价装置,所述装置包括:获取模块,用于获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;统计模块,用于对所述获取模块生成的用户行为日志进行统计而得到所述用户的操作行为;评价模块,用于根据所述统计模块得到的所述用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价。
[0011] 其中,所述统计模块用于根据该用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足预设条件的因子;根据用户行为日志确定用于评价用户行为的因子,并根据各因子的相关系数矩阵提取相关性较强的因子,过滤掉相关性较低的因子; 计算保留下来的各因子的贡献率;以及根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为。
[0012] 其中,所述统计模块根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率;根据所述各因子的累积贡献率获得各主成分因子的权重向量;所述评价模块用于根据用户的操作行为的统计结果以及所述权重向量确定评分,以利用所述评分对所述用户进行行为评价。
[0013] 为解决上述技术问题,本发明采用的另一个技术方案是:提供一种用户行为评价系统,所述系统包括第一服务器和第二服务器,其中,所述第一服务器包括:获取模块,用于获取用户请求日志,根据所述用户请求日志记录的用户操作行为生成用户行为日志;统计模块,用于对所述获取模块生成的用户行为日志进行统计而得到所述用户的操作行为;评价模块,用于根据所述统计模块得到的所述用户的操作行为的统计结果确定评分,以利用所述评分对所述用户进行行为评价;以及传送模块,用于发送包括所述用户评分的用户信息至所述第二服务器,使所述第二服务器对所述用户信息进行分析以确定相关信息。
[0014] 本发明的有益效果是:本发明提供的一种用户行为评价方法、装置及系统,通过对根据用户请求日志记录的用户操作行为生成的用户行为日志统计用户的操作行为,并根据用户的操作行为的统计结果确定评分,以利用评分对所述用户进行行为评价,从而自动、快速地分离有效的用户行为及其影响权重,具有很强的自动化和鲁棒性。

附图说明

[0015] 图1是本发明一种用户行为评价方法的第一实施方式的流程图;
[0016] 图2是图1所示的一种用户行为评价方法中统计用户操作行为的方法的流程图;
[0017] 图3是本发明一种用户行为评价方法的第二实施方式的流程图;
[0018] 图4是本发明一种用户行为评价装置的第一实施方式的结构示意图;
[0019] 图5是本发明一种用户行为评价装置的第二实施方式的结构示意 图;
[0020] 图6是本发明一种用户行为评价系统一实施方式的结构示意图。

具体实施方式

[0021] 首先,对本发明实施方式中出现的相关技术名词进行解释说明。
[0022] KMO检测,检验统计量(Kaiser-Meyer-Olkin)检测,KMO是用于比较变量间简单相关系数和偏相关系数的指标。KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1。KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。Kaiser给出了常用的KMO度量标准:0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。
[0023] 球形检测,又称巴特利特球形检验,是一种检验各个变量之间相关性程度的检验方法。一般在做因子分析之前都要进行巴特利特球形检验,用于判断变量是否适合用于做因子分析。巴特利特球形检验是以变量的相关系数矩阵为出发点的。它的零假设相关系数矩阵是一个单位阵,即相关系数矩阵对角线上的所有元素都是1,所有非对角线上的元素都为零。巴特利特球形检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数不可能是单位阵,即原始变量之间存在相关性,适合于作因子分析,相反不适合作因子分析。
[0024] 下面结合附图和实施方式对本发明进行详细说明。
[0025] 请参阅图1,为本发明一种用户行为评价方法的第一实施方式的流程图,该实施方式示出的方法包括:
[0026] 步骤S10:服务器获取用户请求日志,根据该用户请求日志记录的用户操作行为生成用户行为日志。
[0027] 其中,该用户行为日志记录了用户对应用程序各个功能点的操作行 为记录,包括功能点、操作时间和操作时长等信息。
[0028] 用户登录服务器运行的论坛等信息发布平台发布帖子,发布的帖子通常包括标题、内容、发布者的身份信息ID,例如,用户名、用户的网络地址等。并且,服务器根据该需要被评价的用户发布帖子的时间、数量以及对发布的帖子的回复、浏览、收藏等记录用户的操作行为,形成该用户请求日志。
[0029] 服务器根据该用户请求日志,整理出用户在应用程序上的操作行为,以形成该用户行为日志。
[0030] 在本实施方式中,该用户行为日志包括该需要被评价的用户如下11项因子:总活跃天数、历史活跃发表帖子天数、历史发表帖子次数、近三十天天浏览帖子次数、近三十天回复天数、近三十天回复次数、近三十天收藏天数、近三十天收藏的次数。
[0031] 在本实施方式中,根据帖子内容和用户行为特点,同时选取如上所述的11个因子作为评价该用户的因子,还可以从如上所述的11个因子中选择一个或多个因子作为帖子的特征。但是,在其他实施方式中,可以根据情况选择因子,并不仅限于如上列出的11个因子。
[0032] 进一步地,在步骤S10中,服务器还过滤数据不全的用户请求日志,以保留下有效的日志项,从而得到用户行为日志。
[0033] 步骤S11,根据该用户行为日志统计该用户的操作行为。
[0034] 在步骤S11中,根据用户行为日志统计用户的操作行为,具体为:以天为单位,根据用户行为日志统计该用户当天对各项功能点进行操作的操作次数和时长统计,按周和月的时间粒度对操作次数和时长统计结果进行两重统计汇总,得到用户的操作行为。
[0035] 请同时参阅图2,步骤S11,即,根据该用户行为日志统计该用户的操作行为,具体通过如下步骤实现:
[0036] 步骤S110,根据该用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子。
[0037] 在步骤S110中,服务器根据用户行为日志确定用于评价用户行为的因子,并根据各因子的相关系数矩阵提取相关性较强的因子,过滤掉 相关性较低的因子。其中,设定相关系数阈值为0.3,即,第一预设条件为相关性系数高于0.3,因此将相关性系数高于0.3的因子保留下来,形成相关性较强的因子组合,同时将相关性系数低于0.3的因子过滤。
[0038] 进一步地,对保留下来的因子进行KMO检验统计量和球形检测。如果KMO检测值能达到0.7以上,则说明这样的因子组合可解释度很高,可以进入下一步计算。
[0039] 步骤S111,计算保留下来的各因子的贡献率。
[0040] 在步骤S111中,计算保留下来的各因子的相关性系数矩阵的特征根,并提取特征值大于0.1的成分因子,然后计算各特征值对应的成分因子的贡献率。
[0041] 步骤S112,根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为。
[0042] 根据步骤111的计算结果,统计所有特征值大于0.1的成分因子的累积贡献率,如果该贡献率达到70%以上,则认可该因子组合方式。所以,根据认可的因子组合方式确定对应的用户操作行为,即,由认可的选定的因子以得到评价用户行为的参考对象(用户操作行为)。
[0043] 步骤S113,计算各因子的载荷矩阵,以统计该用户的操作行为。
[0044] 其中,选取的因子为如步骤S110至S112确定的因子。
[0045] 使用主成分计算各因子的载荷矩阵,可以获得各主成分下各因子的权重值,如果各成分的典型代表变量不是很突出,各指标前几个公共因子上均有相当程度的载荷值,是难以合理解释其实际意义,此时需要进一步进行选择。选择方差最大化方法进行因子旋转,得到旋转后的因子载荷矩阵,然后根据上述判断方式,如果各成分的典型代表向量突出,则认可该模型结果,从而获得各主成分因子的权重向量。
[0046] 步骤S12,根据用户的操作行为的统计结果确定评分,以利用该评分对该用户进行评价。
[0047] 在步骤S12中,结合用户的操作行为的统计结果和主成分因子权重向量,即可计算用户置信分(评分)。
[0048] 由于一般的应用程序功能点很多,统计项也非常多,很难给出合理 的解释,本发明实施方式中采用因子分析法,计算出相关系数矩阵的特征值、贡献率、累计贡献率、因子载荷矩阵等,最终求得综合评价值,实现对用户行为的评价。
[0049] 利用本发明实施方式,通过对根据用户请求日志记录的用户操作行为生成的用户行为日志统计用户的操作行为,并根据用户的操作行为的统计结果确定评分,以利用评分对所述用户进行行为评价,从而自动、快速地分离有效的用户行为及其影响权重,具有很强的自动化和鲁棒性。
[0050] 下面对本发明实施方式中的用户行为评价方法进行举例说明。
[0051] 例如,起初选定的涉及用户行为评价的基础因子包括:总活跃天数、历史活跃发表帖子天数、历史发表帖子次数、近三十天浏览帖子次数、近三十天回复天数、近三十天回复次数、近三十天收藏天数、近三十天收藏的次数等11项,都是用户在UGC(User Generated Content,用户生成内容)社区中的行为统计结果。并从UGC社区中随机抽取5万个用户行为统计数据做测试。
[0052] 首先,根据用户行为日志中记录的如上所述的因子及对应的数据,计算各因子的相关系数矩阵,结果如下:
[0053]
[0054]
[0055] 由此可以看出,在这11个因子当中,前9个因子之间存在较强的相关关系,最后两个因子与其他因子的相关性系数偏离性较大,所以过滤掉这两个因子(近三十天收藏天数和近三十天收藏次数)的相关数据。这两项与其他项的相关度低是因为相关系数大多数小于0.3,而其余9个因子的相关系数大多在0.3以上,由此可知,这9个因子之间存在较强的相关关系。
[0056] 利用剔除最后两项因子的剩余9项数据进行计算,得出相关系数矩阵,如下:
[0057] Correlation Matrix
[0058]
[0059] 然后对保留下来的因子做KMO检测,结果如下:
[0060] KMO and Bartlett's Test
[0061]
[0062] 其中,KMO检验值为0.763,大于0.7,则说明这9项因子的组合可解释度很高,非常适合用于做因子分析以统计用户行为。因此,继续计算保留下来的因子载荷矩阵,如下:
[0063] Component Matrixa
[0064]
[0065] 由此可以看出,各个公共因子的典型代表变量不是很突出,各因子前几个公共因子上均有相当程度的载荷值,难以合理解释其实际意义,所以需要进一步进行旋转。选择方差最大化方法进行因子旋转,得到旋转后的因子载荷矩阵如下:
[0066] Rotated Component Matrixa
[0067]
[0068] 根据旋转后的因子载荷矩阵表,可将指标集分为三个主因子,第一主因子在“近三十天发表帖子天数”、“近三十天天发表帖子次数”、“近三十天回复天数”、“近三十天回复次数”四个指标上具有很大载荷,从各指标的含义可知反映了用户近期在论坛上的发帖和回复行为,将其定义为内容产出行为;第二主因子在“总活跃天数”、“近三十天浏览帖子天数”、“近三十天浏览帖子次数”上有较大载荷,从各指标的含义可知反映了用户浏览行为,将其定义为内容消费行为;第三主因子在“历史活跃发表帖子天数”、“历史发表帖子次数”比重上载荷较大,从各指标的含义可知时反映用户的历史活跃程度,将其定义为历史行为。
[0069]
[0070]
[0071] 使用旋转结果,得到各因子权重如下(注:未归一化):
[0072]   
总活跃天数 0.26197032
历史活跃发表帖子天数 0.2944206
历史发表帖子次数 0.32751438
近三十天发表帖子天数 0.56119506
近三十天发表帖子次数 0.54647568
近三十天浏览帖子天数 0.32128377
近三十天浏览帖子次数 0.30641238
近三十天回复天数 0.53242188
近三十天回复次数 0.56202837
[0073] 然后构建用户综合评价模型,算出因子得分并排序。
[0074] 具体地,确定因子得分系数矩阵为:
[0075] F=57.52%*F1+19.17%*F2+11.46%*F3
[0076] F1=0.691*X1+0.718*X2+0.729*X3+0.797*X4+0.757*X5+0.744*X6+0.709*X7+0.844*X8+0.821*X9
[0077] F2=0.613*X1-0.265*X2-0.358*X3-0.426*X4-0.460*X5+0.612*X6+0.594*X7-0.015*X8-0.180*X9
[0078] F3=0.126*X1+0.613*X2+0.555*X3-0.251*X4-0.259*X5-0.005*X6-0.012*X7-0.276*X8-0.354*X9
[0079] 请参阅图3,为本发明一种用户行为评价方法的第二实施方式的流程图,该实施方式与图1所示的实施方式相比,还包括如下步骤:
[0080] 步骤S23,根据用户行为的评价结果进行排序,以确定置信阈值。其中,该置信阈值用于预测该用户在接下来的UGC(用户生成内容)是否属于垃圾信息。
[0081] 图2中的其他步骤可以参阅图1及对应的文字说明。
[0082] 进一步地,服务器还可以将评分满足第四预定条件的用户的用户信息/用户行为发送至另一服务器,使另一服务器对该用户信息/用户行为进行分析以获取相关信息。
[0083] 具体地,根据该用户行为的评价结果进行排序,以确定评分满足该第四预定条件的用户信息,并将评分满足第四预定条件的用户信息及/或用户行为发送至该另一服务器,使该另一服务器对用户信息和/或用户行为进行分析以获取相关信息。
[0084] 在本实施方式中,按照评分从高到低的顺序进行排列,该第四预定条件为评分最高的用户的信息,其中,该用户信息至少包括用户名。在其他实施方式中,该第四预定信息为根据排序结果确定前N个的用户的信息,N为自然数。
[0085] 当确定评分满足第四预定条件的用户的信息时,即,评价最高的一个(或几个)用户时,服务器还将这些用户信息/用户行为发送至相应的服务器进行信息分析、保存、操作、管理等相关操作。
[0086] 例如,当论坛为生理健康知识相关的论坛时,用户在该论坛中发布的帖子基本上均为养生、治疗、症状等相关内容的帖子。根据如上所述的用户行为评价方法对每个(或从中抽取的特定数量的)用户的用户行为进行评价而得到对应的评价分数。该服务器将这些用户的用户信息/用户行为发送至一医院网站服务器,使该医院网站服务器从这些用户信息/用户行为提取帖子摘要关键字,或者用户ID等帖子特征,并进行相关的数据分析以得到所需信息,如,哪些用户正在的关注的医疗领域,并向这些用户推送相关的医药产品、广告等。
[0087] 请参阅图4,为本发明实施方式的一种用户行为评价装置的结构示意图,该装置30包括:获取模块31、统计模块32以及评价模块33。
[0088] 该获取模块31用于用户请求日志,根据该用户请求日志记录的用户操作行为生成用户行为日志。
[0089] 其中,该用户行为日志记录了用户对应用程序各个功能点的操作行为记录,包括功能点、操作时间和操作时长等信息。
[0090] 用户登录服务器运行的论坛等信息发布平台发布帖子,发布的帖子 通常包括标题、内容、发布者的身份信息ID,例如,用户名、用户的网络地址等。并且,服务器根据该需要被评价的用户发布帖子的时间、数量以及对发布的帖子的回复、浏览、收藏等记录用户的操作行为,形成该用户请求日志。
[0091] 获取模块31根据该用户请求日志,整理出用户在应用程序上的操作行为,以形成该用户行为日志。
[0092] 在本实施方式中,该用户行为日志包括该需要被评价的用户如下11项因子:总活跃天数、历史活跃发表帖子天数、历史发表帖子次数、近三十天天浏览帖子次数、近三十天回复天数、近三十天回复次数、近三十天收藏天数、近三十天收藏的次数。
[0093] 在本实施方式中,根据帖子内容和用户行为特点,同时选取如上所述的11个因子作为评价该用户的因子,还可以从如上所述的11个因子中选择一个或多个因子作为帖子的特征。但是,在其他实施方式中,可以根据情况选择因子,并不仅限于如上列出的11个因子。
[0094] 进一步地,获取模块31还过滤数据不全的用户请求日志,以保留下有效的日志项,从而得到用户行为日志。
[0095] 该统计模块32用于根据该获取模块31生成的用户行为日志进行统计而得到用户的操作行为。
[0096] 该统计模块32根据用户行为日志统计用户的操作行为,具体为:以天为单位,根据用户行为日志统计该用户当天对各项功能点进行操作的操作次数和时长统计,按周和月的时间粒度对操作次数和时长统计结果进行两重统计汇总,得到用户的操作行为。
[0097] 该统计模块32具体用于:根据该用户行为日志确定用于评价用户行为的因子,并计算各因子的相关系数矩阵,以保留相关性满足第一预设条件的因子;计算保留下来的各因子的贡献率;据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为;以及计算各因子的载荷矩阵,以统计该用户的操作行为。
[0098] 其中,该统计模块32根据用户行为日志确定用于评价用户行为的因子,并根据各因子的相关系数矩阵提取相关性较强的因子,过滤掉相 关性较低的因子。其中,设定相关系数阈值为0.3,即,第一预设条件为相关性系数高于0.3,因此将相关性系数高于0.3的因子保留下来,形成相关性较强的因子组合,同时将相关性系数低于0.3的因子过滤。
[0099] 进一步地,该统计模块32对保留下来的因子进行KMO检验统计量和球形检测。如果KMO检测值能达到0.7以上,则说明这样的因子组合可解释度很高,可以进入下一步计算。
[0100] 该统计模块32计算保留下来的各因子的相关性系数矩阵的特征根,并提取特征值大于0.1的成分因子,然后计算各特征值对应的成分因子的贡献率。
[0101] 该统计模块32根据计算得到的保留下来的各因子的贡献率,确定各因子的累积贡献率,以统计所述用户的操作行为。具体地,该统计模块32统计所有特征值大于0.1的成分因子的累积贡献率,如果该贡献率达到70%以上,则认可该因子组合方式。所以,根据认可的因子组合方式确定对应的用户操作行为,即,由认可的选定的因子以得到评价用户行为的参考对象(用户操作行为)。
[0102] 该评价模块33用于根据用户的操作行为的统计结果确定评分,以利用该评分对该用户进行评价。
[0103] 具体地,该评价模块33结合用户的操作行为的统计结果和主成分因子权重向量,即可计算用户置信分(评分)。
[0104] 请参阅图5,为本发明一种用户行为评价装置的第二实施方式的结构示意图,该实施方式与图5所示的实施方式相比,还包括排序模块44。
[0105] 该排序模块44用于根据用户行为的评价结果进行排序,以确定置信阈值。其中,该置信阈值用于预测该用户在接下来的UGC(用户生成内容)是否属于垃圾信息。
[0106] 图5中的其他步骤可以参阅图4及对应的文字说明。
[0107] 进一步地,该装置还可以将评分满足第四预定条件的用户的用户信息/用户行为发送至另一服务器,使另一服务器对该用户信息/用户行为进行分析以获取相关信息。
[0108] 具体地,该装置根据所述用户行为的评价结果进行排序,以确定评 分满足该第四预定条件的用户信息;以及将评分满足第四预定条件的用户信息及/或用户行为发送至该另一服务器,使该另一服务器对用户信息和/或用户行为进行分析以获取相关信息。
[0109] 在本实施方式中,该装置按照评分从高到低的顺序进行排列,该第四预定条件为评分最高的用户的信息,其中,该用户信息至少包括用户名。在其他实施方式中,该第四预定信息为根据排序结果确定前N个的用户的信息,N为自然数。
[0110] 当确定评分满足第四预定条件的用户的信息时,即,评价最高的一个(或几个)用户子时,服务器还将这些用户信息/用户行为发送至相应的服务器进行信息分析、保存、操作、管理等相关操作。
[0111] 请参阅图6,为本发明一种用户行为评价系统的结构示意图,该实施方式示出的系统50包括第一服务器51和第二服务器52。该第一服务器51包括获取模块510、统计模块511、评价模块512以及传送模块513。该第二服务器52为医院网站服务器、学校网站服务器等专业机构服务器,该第二服务器52的类型还可以根据该第一服务器51进行评价的帖子所在论坛的类型进行选择。
[0112] 该获取模块51用于用户请求日志,根据该用户请求日志记录的用户操作行为生成用户行为日志。其中,该用户行为日志记录了用户对应用程序各个功能点的操作行为记录,包括功能点、操作时间和操作时长等信息。
[0113] 该统计模块52用于根据该获取模块51生成的用户行为日志进行统计而得到用户的操作行为。
[0114] 该评价模块53用于根据用户的操作行为的统计结果确定评分,以利用该评分对该用户进行评价。
[0115] 该传送模块513用于将评分满足第四预定条件的用户的用户信息/用户行为发送至第二服务器52,使第二服务器52对该用户信息/用户行为进行分析以获取相关信息。
[0116] 本发明提供的一种用户行为评价方法、装置及系统,通过对根据用户请求日志记录的用户操作行为生成的用户行为日志统计用户的操作 行为,并根据用户的操作行为的统计结果确定评分,以利用评分对所述用户进行行为评价,从而自动、快速地分离有效的用户行为及其影响权重,具有很强的自动化和鲁棒性。
[0117] 以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。