一种基于大数据的信息推荐方法及系统转让专利

申请号 : CN202210487674.3

文献号 : CN114579916B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈守红

申请人 : 深圳格隆汇信息科技有限公司

摘要 :

本发明实施例涉及信息推荐技术领域,具体公开了一种基于大数据的信息推荐方法及系统。本发明实施例通过进行活跃度分析;对活跃浏览数据进行浏览信息统计与筛选;对非活跃浏览数据进行标签识别;将多个兴趣推荐信息向非活跃浏览数据对应的非活跃用户推荐。能够按照多个用户的信息浏览数据进行活跃度分析,将活跃用户的活跃浏览数据进行浏览信息统计与筛选,并进行标签识别,得到标签信息排列数据库,进而通过非活跃用户的兴趣标签,从标签信息排列数据库中匹配兴趣推荐信息进行推荐,从而能够按照非活跃用户的兴趣,推荐活跃用户浏览量高的相应的信息,使得向非活跃用户推荐的信息尽可能的满足用户的兴趣,避免非活跃用户的活跃度越来越低。

权利要求 :

1.一种基于大数据的信息推荐方法,其特征在于,所述方法具体包括以下步骤:基于大数据技术,获取多个用户的信息浏览数据;

对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户;

对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库;

对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序;

按照所述推荐顺序,将多个所述兴趣推荐信息向所述非活跃浏览数据对应的非活跃用户推荐;

在非活跃用户再次进行信息浏览时,按照推荐顺序,将多个兴趣推荐信息依次推荐给非活跃用户,若非活跃用户暂停或关闭了信息浏览,则在下次浏览开启之后,按照推荐顺序,在上一次暂停或关闭的兴趣推荐信息处继续进行信息推荐。

2.根据权利要求1所述的基于大数据的信息推荐方法,其特征在于,所述对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户具体包括以下步骤:对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分;

将多个所述活跃度评分与预设的标准评分进行比较;

将所述活跃度评分大于所述标准评分的信息浏览数据标记为活跃浏览数据,并将对应的用户标记为活跃用户;

将所述活跃度评分不大于所述标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。

3.根据权利要求2所述的基于大数据的信息推荐方法,其特征在于,所述对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分具体包括以下步骤:根据多个所述信息浏览数据进行注册时长分析,得到多个用户注册时长;

根据多个所述信息浏览数据进行浏览时长统计,得到多个用户浏览时长;

综合多个所述用户注册时长和对应的用户浏览时长进行活跃度评价,生成多个活跃度评分。

4.根据权利要求1所述的基于大数据的信息推荐方法,其特征在于,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库具体包括以下步骤:对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量;

对多个所述筛选信息进行标签识别,得到多个筛选标签;

按照多个所述浏览量,将多个所述筛选信息和对应的筛选标签进行信息排列整理,得到标签信息排列数据库。

5.根据权利要求4所述的基于大数据的信息推荐方法,其特征在于,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量具体包括以下步骤:统计多个所述活跃浏览数据中多个浏览信息的浏览量;

剔除浏览量小于预设的标准量的浏览信息,获取多个筛选信息和对应的浏览量。

6.根据权利要求1所述的基于大数据的信息推荐方法,其特征在于,所述对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序具体包括以下步骤:对所述非活跃浏览数据进行分析,获取多个兴趣信息;

对多个所述兴趣信息进行标签识别,得到多个兴趣标签;

按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。

7.一种基于大数据的信息推荐系统,其特征在于,所述系统包括浏览数据获取单元、活跃分析处理单元、活跃数据处理单元、兴趣信息匹配单元和兴趣信息推荐单元,其中:浏览数据获取单元,用于基于大数据技术,获取多个用户的信息浏览数据;

活跃分析处理单元,用于对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户;

活跃数据处理单元,用于对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库;

兴趣信息匹配单元,用于对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序;

兴趣信息推荐单元,用于按照所述推荐顺序,将多个所述兴趣推荐信息向所述非活跃浏览数据对应的非活跃用户推荐。

8.根据权利要求7所述的基于大数据的信息推荐系统,其特征在于,所述活跃分析处理单元具体包括:活跃度分析模块,用于对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分;

评分比较模块,用于将多个所述活跃度评分与预设的标准评分进行比较;

活跃数据标记模块,用于将所述活跃度评分大于所述标准评分的信息浏览数据标记为活跃浏览数据,并将对应的用户标记为活跃用户;

非活跃数据标记模块,用于将所述活跃度评分不大于所述标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。

9.根据权利要求7所述的基于大数据的信息推荐系统,其特征在于,所述活跃数据处理单元具体包括:信息统计筛选模块,用于对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量;

筛选标签识别模块,用于对多个所述筛选信息进行标签识别,得到多个筛选标签;

信息排列整理模块,用于按照多个所述浏览量,将多个所述筛选信息和对应的筛选标签进行信息排列整理,得到标签信息排列数据库。

10.根据权利要求7所述的基于大数据的信息推荐系统,其特征在于,所述兴趣信息匹配单元具体包括:兴趣信息获取模块,用于对所述非活跃浏览数据进行分析,获取多个兴趣信息;

兴趣标签识别模块,用于对多个所述兴趣信息进行标签识别,得到多个兴趣标签;

兴趣信息匹配模块,用于按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。

说明书 :

一种基于大数据的信息推荐方法及系统

技术领域

[0001] 本发明属于信息推荐技术领域,尤其涉及一种基于大数据的信息推荐方法及系统。

背景技术

[0002] 随着大数据技术和各种软件技术的发展,信息推荐变得尤为重要,尤其是新闻资讯类软件中,只有多推荐符合用户兴趣的内容,才能够增加用户的在线时间,保证更多的活跃用户,进而促进该软件的发展。
[0003] 现有的信息推荐方法,通常都是根据用户选择的兴趣类型,进行相关信息的推荐,这种信息推荐方法虽然在一定程度上,能够向用户推荐一些感兴趣的内容,但是大部分的信息并不能够真正引起用户的兴趣,尤其是对于一些活跃度不高的用户,在推荐的信息中,如果有一大半的内容不能引起用户兴趣的话,有可能会造成用户活跃度越来越低。

发明内容

[0004] 本发明实施例的目的在于提供一种基于大数据的信息推荐方法及系统,旨在解决背景技术中提出的问题。
[0005] 为实现上述目的,本发明实施例提供如下技术方案:
[0006] 一种基于大数据的信息推荐方法,所述方法具体包括以下步骤:
[0007] 基于大数据技术,获取多个用户的信息浏览数据;
[0008] 对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户;
[0009] 对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库;
[0010] 对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序;
[0011] 按照所述推荐顺序,将多个所述兴趣推荐信息向所述非活跃浏览数据对应的非活跃用户推荐。
[0012] 作为本发明实施例技术方案进一步的限定,所述对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户具体包括以下步骤:
[0013] 对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分;
[0014] 将多个所述活跃度评分与预设的标准评分进行比较;
[0015] 将所述活跃度评分大于所述标准评分的信息浏览数据标记为活跃浏览数据,并将对应的用户标记为活跃用户;
[0016] 将所述活跃度评分不大于所述标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。
[0017] 作为本发明实施例技术方案进一步的限定,所述对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分具体包括以下步骤:
[0018] 根据多个所述信息浏览数据进行注册时长分析,得到多个用户注册时长;
[0019] 根据多个所述信息浏览数据进行浏览时长统计,得到多个用户浏览时长;
[0020] 综合多个所述用户注册时长和对应的用户浏览时长进行活跃度评价,生成多个活跃度评分。
[0021] 作为本发明实施例技术方案进一步的限定于,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库具体包括以下步骤:
[0022] 对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量;
[0023] 对多个所述筛选信息进行标签识别,得到多个筛选标签;
[0024] 按照多个所述浏览量,将多个所述筛选信息和对应的筛选标签进行信息排列整理,得到标签信息排列数据库。
[0025] 作为本发明实施例技术方案进一步的限定,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量具体包括以下步骤:
[0026] 统计多个所述活跃浏览数据中多个浏览信息的浏览量;
[0027] 剔除浏览量小于预设的标准量的浏览信息,获取多个筛选信息和对应的浏览量。
[0028] 作为本发明实施例技术方案进一步的限定,所述对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序具体包括以下步骤:
[0029] 对所述非活跃浏览数据进行分析,获取多个兴趣信息;
[0030] 对多个所述兴趣信息进行标签识别,得到多个兴趣标签;
[0031] 按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。
[0032] 一种基于大数据的信息推荐系统,所述系统包括浏览数据获取单元、活跃分析处理单元、活跃数据处理单元、兴趣信息匹配单元和兴趣信息推荐单元,其中:
[0033] 浏览数据获取单元,用于基于大数据技术,获取多个用户的信息浏览数据;
[0034] 活跃分析处理单元,用于对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户;
[0035] 活跃数据处理单元,用于对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库;
[0036] 兴趣信息匹配单元,用于对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序;
[0037] 兴趣信息推荐单元,用于按照所述推荐顺序,将多个所述兴趣推荐信息向所述非活跃浏览数据对应的非活跃用户推荐。
[0038] 作为本发明实施例技术方案进一步的限定,所述活跃分析处理单元具体包括:
[0039] 活跃度分析模块,用于对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分;
[0040] 评分比较模块,用于将多个所述活跃度评分与预设的标准评分进行比较;
[0041] 活跃数据标记模块,用于将所述活跃度评分大于所述标准评分的信息浏览数据标记为活跃浏览数据,并将对应的用户标记为活跃用户;
[0042] 非活跃数据标记模块,用于将所述活跃度评分不大于所述标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。
[0043] 作为本发明实施例技术方案进一步的限定,所述活跃数据处理单元具体包括:
[0044] 信息统计筛选模块,用于对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量;
[0045] 筛选标签识别模块,用于对多个所述筛选信息进行标签识别,得到多个筛选标签;
[0046] 信息排列整理模块,用于按照多个所述浏览量,将多个所述筛选信息和对应的筛选标签进行信息排列整理,得到标签信息排列数据库。
[0047] 作为本发明实施例技术方案进一步的限定,所述兴趣信息匹配单元具体包括:
[0048] 兴趣信息获取模块,用于对所述非活跃浏览数据进行分析,获取多个兴趣信息;
[0049] 兴趣标签识别模块,用于对多个所述兴趣信息进行标签识别,得到多个兴趣标签;
[0050] 兴趣信息匹配模块,用于按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。
[0051] 与现有技术相比,本发明的有益效果是:
[0052] 本发明实施例通过进行活跃度分析;对活跃浏览数据进行浏览信息统计与筛选;对非活跃浏览数据进行标签识别;将多个兴趣推荐信息向非活跃浏览数据对应的非活跃用户推荐。能够按照多个用户的信息浏览数据进行活跃度分析,将活跃用户的活跃浏览数据进行浏览信息统计与筛选,并进行标签识别,得到标签信息排列数据库,进而通过非活跃用户的兴趣标签,从标签信息排列数据库中匹配兴趣推荐信息进行推荐,从而能够按照非活跃用户的兴趣,推荐活跃用户浏览量高的相应的信息,使得向非活跃用户推荐的信息尽可能的满足用户的兴趣,避免非活跃用户的活跃度越来越低。

附图说明

[0053] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
[0054] 图1示出了本发明实施例提供的方法的流程图。
[0055] 图2示出了本发明实施例提供的方法中活跃度分析标记的流程图。
[0056] 图3示出了本发明实施例提供的方法中生成活跃度评分的流程图。
[0057] 图4示出了本发明实施例提供的方法中生成标签信息排列数据库的流程图。
[0058] 图5示出了本发明实施例提供的方法中浏览信息统计与筛选的流程图。
[0059] 图6示出了本发明实施例提供的方法中兴趣标签信息匹配的流程图。
[0060] 图7示出了本发明实施例提供的系统的应用架构图。
[0061] 图8示出了本发明实施例提供的系统中活跃分析处理单元的结构框图。
[0062] 图9示出了本发明实施例提供的系统中活跃数据处理单元的结构框图。
[0063] 图10示出了本发明实施例提供的系统中兴趣信息匹配单元的结构框图。

具体实施方式

[0064] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0065] 可以理解的是,在现有技术中,信息推荐方法通常都是根据用户选择的兴趣类型,进行相关信息的推荐,这种信息推荐方法虽然在一定程度上,能够向用户推荐一些感兴趣的内容,但是大部分的信息并不能够真正引起用户的兴趣,尤其是对于一些活跃度不高的用户,在推荐的信息中,如果有一大半的内容不能引起用户兴趣的话,有可能会造成用户活跃度越来越低。
[0066] 为解决上述问题,本发明实施例通过进行活跃度分析;对活跃浏览数据进行浏览信息统计与筛选;对非活跃浏览数据进行标签识别;将多个兴趣推荐信息向非活跃浏览数据对应的非活跃用户推荐。能够按照多个用户的信息浏览数据进行活跃度分析,将活跃用户的活跃浏览数据进行浏览信息统计与筛选,并进行标签识别,得到标签信息排列数据库,进而通过非活跃用户的兴趣标签,从标签信息排列数据库中匹配兴趣推荐信息进行推荐,从而能够按照非活跃用户的兴趣,推荐活跃用户浏览量高的相应的信息,使得向非活跃用户推荐的信息尽可能的满足用户的兴趣,避免非活跃用户的活跃度越来越低。
[0067] 图1示出了本发明实施例提供的方法的流程图。
[0068] 具体的,一种基于大数据的信息推荐方法,所述方法具体包括以下步骤:
[0069] 步骤S101,基于大数据技术,获取多个用户的信息浏览数据。
[0070] 在本发明实施例中,向多个用户发送浏览数据访问请求,在多个用户同意浏览数据访问请求之后,基于大数据技术,访问并获取多个用户的信息浏览数据。
[0071] 可以理解的是,信息浏览数据是对用户浏览的新闻信息的记录数据,记录了用户在注册之后进行浏览的新闻信息和浏览时间。
[0072] 步骤S102,对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户。
[0073] 在本发明实施例中,对多个信息浏览数据进行注册时长分析,得到多个用户注册时长,多个信息浏览数据进行浏览时长统计,得到多个用户浏览时长,将每个用户的用户浏览时长除以用户注册时长,得到活跃比例值,根据活跃比例值进行活跃度评价,生成与每个用户对应的活跃度评分,并将多个活跃度评分与预设的标准评分进行比较,将活跃度评分大于标准评分的信息浏览数据标记为活跃浏览数据,并将活跃浏览数据对应的用户标记为活跃用户;将活跃度评分不大于标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。
[0074] 可以理解的是,活跃用户在注册之后,具有更加频繁的信息浏览记录,而非活跃用户在注册之后,只有比较少的信息浏览记录。
[0075] 具体的,图2示出了本发明实施例提供的方法中活跃度分析标记的流程图。
[0076] 其中,在本发明提供的优选实施方式中,所述对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户具体包括以下步骤:
[0077] 步骤S1021,对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分。
[0078] 具体的,图3示出了本发明实施例提供的方法中生成活跃度评分的流程图。
[0079] 其中,在本发明提供的优选实施方式中,所述对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分具体包括以下步骤:
[0080] 步骤S10211,根据多个所述信息浏览数据进行注册时长分析,得到多个用户注册时长。
[0081] 步骤S10212,根据多个所述信息浏览数据进行浏览时长统计,得到多个用户浏览时长。
[0082] 步骤S10213,综合多个所述用户注册时长和对应的用户浏览时长进行活跃度评价,生成多个活跃度评分。
[0083] 进一步的,所述对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户还包括以下步骤:
[0084] 步骤S1022,将多个所述活跃度评分与预设的标准评分进行比较。
[0085] 步骤S1023,将所述活跃度评分大于所述标准评分的信息浏览数据标记为活跃浏览数据,并将对应的用户标记为活跃用户。
[0086] 步骤S1024,将所述活跃度评分不大于所述标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。
[0087] 进一步的,所述基于大数据的信息推荐方法还包括以下步骤:
[0088] 步骤S103,对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库。
[0089] 在本发明实施例中,对多个活跃浏览数据中相同的浏览信息的浏览量进行统计,并将浏览量小于预设的标准量的浏览信息进行剔除,将保留下的浏览信息标记为筛选信息,从而得到多个筛选信息和对应的浏览量,通过对多个筛选信息进行标签识别,得到多个与不同筛选信息对应的筛选标签,并将每个筛选信息对应的筛选标签和浏览量进行整理,按照浏览量的大小进行排列,生成标签信息排列数据库。
[0090] 具体的,图4示出了本发明实施例提供的方法中生成标签信息排列数据库的流程图。
[0091] 其中,在本发明提供的优选实施方式中,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库具体包括以下步骤:
[0092] 步骤S1031,对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量。
[0093] 具体的,图5示出了本发明实施例提供的方法中浏览信息统计与筛选的流程图。
[0094] 其中,在本发明提供的优选实施方式中,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量具体包括以下步骤:
[0095] 步骤S10311,统计多个所述活跃浏览数据中多个浏览信息的浏览量。
[0096] 步骤S10312,剔除浏览量小于预设的标准量的浏览信息,获取多个筛选信息和对应的浏览量。
[0097] 进一步的,所述对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库还包括以下步骤:
[0098] 步骤S1032,对多个所述筛选信息进行标签识别,得到多个筛选标签。
[0099] 步骤S1033,按照多个所述浏览量,将多个所述筛选信息和对应的筛选标签进行信息排列整理,得到标签信息排列数据库。
[0100] 进一步的,所述基于大数据的信息推荐方法还包括以下步骤:
[0101] 步骤S104,对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。
[0102] 在本发明实施例中,对每个非活跃用户对应的非活跃浏览数据进行分析,根据信息浏览时长、信息点赞、信息收藏、信息转发等进行兴趣信息识别,得到多个兴趣信息,对多个兴趣信息进行标签识别,得到多个兴趣标签,通过多个兴趣标签,在标签信息排列数据库中进行信息匹配,得到多个筛选标签与兴趣标签相同的筛选信息,并将这些筛选信息标记为兴趣推荐信息,并按照多个兴趣推荐信息的浏览量的大小进行推荐排序,生成推荐顺序。
[0103] 可以理解的是,每个非活跃用户的兴趣标签不同,生成的兴趣推荐信息不同,推荐顺序也不同。
[0104] 具体的,图6示出了本发明实施例提供的方法中兴趣标签信息匹配的流程图。
[0105] 其中,在本发明提供的优选实施方式中,所述对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序具体包括以下步骤:
[0106] 步骤S1041,对所述非活跃浏览数据进行分析,获取多个兴趣信息。
[0107] 步骤S1042,对多个所述兴趣信息进行标签识别,得到多个兴趣标签。
[0108] 步骤S1043,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。
[0109] 进一步的,所述基于大数据的信息推荐方法还包括以下步骤:
[0110] 步骤S105,按照所述推荐顺序,将多个所述兴趣推荐信息向所述非活跃浏览数据对应的非活跃用户推荐。
[0111] 在本发明实施例中,在非活跃用户再次进行信息浏览时,按照推荐顺序,将多个兴趣推荐信息依次推荐给非活跃用户,若非活跃用户暂停或关闭了信息浏览,则在下次浏览开启之后,按照推荐顺序,在上一次暂停或关闭的兴趣推荐信息处继续进行信息推荐。
[0112] 进一步的,图7示出了本发明实施例提供的系统的应用架构图。
[0113] 其中,在本发明提供的又一个优选实施方式中,一种基于大数据的信息推荐系统,包括:
[0114] 浏览数据获取单元101,用于基于大数据技术,获取多个用户的信息浏览数据。
[0115] 在本发明实施例中,浏览数据获取单元101向多个用户发送浏览数据访问请求,在多个用户同意浏览数据访问请求之后,基于大数据技术,访问并获取多个用户的信息浏览数据。
[0116] 活跃分析处理单元102,用于对多个所述信息浏览数据进行活跃度分析,根据分析结果,将多个所述信息浏览数据分别标记为活跃浏览数据和非活跃浏览数据,并将对应的用户分别标记为活跃用户和非活跃用户。
[0117] 在本发明实施例中,活跃分析处理单元102对多个信息浏览数据进行注册时长分析,得到多个用户注册时长,多个信息浏览数据进行浏览时长统计,得到多个用户浏览时长,将每个用户的用户浏览时长除以用户注册时长,得到活跃比例值,根据活跃比例值进行活跃度评价,生成与每个用户对应的活跃度评分,并将多个活跃度评分与预设的标准评分进行比较,将活跃度评分大于标准评分的信息浏览数据标记为活跃浏览数据,并将活跃浏览数据对应的用户标记为活跃用户;将活跃度评分不大于标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。
[0118] 具体的,图8示出了本发明实施例提供的系统中活跃分析处理单元102的结构框图。
[0119] 其中,在本发明提供的优选实施方式中,所述活跃分析处理单元102具体包括:
[0120] 活跃度分析模块1021,用于对多个所述信息浏览数据进行活跃度分析,生成多个活跃度评分。
[0121] 评分比较模块1022,用于将多个所述活跃度评分与预设的标准评分进行比较。
[0122] 活跃数据标记模块1023,用于将所述活跃度评分大于所述标准评分的信息浏览数据标记为活跃浏览数据,并将对应的用户标记为活跃用户。
[0123] 非活跃数据标记模块1024,用于将所述活跃度评分不大于所述标准评分的信息浏览数据标记为非活跃浏览数据,并将对应的用户标记为非活跃用户。
[0124] 进一步的,所述基于大数据的信息推荐系统还包括:
[0125] 活跃数据处理单元103,用于对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量,对多个所述筛选信息进行标签识别,得到多个筛选标签,综合多个筛选信息、多个浏览量和多个筛选标签进行信息排列整理,得到标签信息排列数据库。
[0126] 在本发明实施例中,活跃数据处理单元103对多个活跃浏览数据中相同的浏览信息的浏览量进行统计,并将浏览量小于预设的标准量的浏览信息进行剔除,将保留下的浏览信息标记为筛选信息,从而得到多个筛选信息和对应的浏览量,通过对多个筛选信息进行标签识别,得到多个与不同筛选信息对应的筛选标签,并将每个筛选信息对应的筛选标签和浏览量进行整理,按照浏览量的大小进行排列,生成标签信息排列数据库。
[0127] 具体的,图9示出了本发明实施例提供的系统中活跃数据处理单元103的结构框图。
[0128] 其中,在本发明提供的优选实施方式中,所述活跃数据处理单元103具体包括:
[0129] 信息统计筛选模块1031,用于对多个所述活跃浏览数据进行浏览信息统计与筛选,获取多个筛选信息和对应的浏览量。
[0130] 筛选标签识别模块1032,用于对多个所述筛选信息进行标签识别,得到多个筛选标签。
[0131] 信息排列整理模块1033,用于按照多个所述浏览量,将多个所述筛选信息和对应的筛选标签进行信息排列整理,得到标签信息排列数据库。
[0132] 进一步的,所述基于大数据的信息推荐系统还包括:
[0133] 兴趣信息匹配单元104,用于对所述非活跃浏览数据进行标签识别,得到多个兴趣标签,按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。
[0134] 在本发明实施例中,兴趣信息匹配单元104对每个非活跃用户对应的非活跃浏览数据进行分析,根据信息浏览时长、信息点赞、信息收藏、信息转发等进行兴趣信息识别,得到多个兴趣信息,对多个兴趣信息进行标签识别,得到多个兴趣标签,通过多个兴趣标签,在标签信息排列数据库中进行信息匹配,得到多个筛选标签与兴趣标签相同的筛选信息,并将这些筛选信息标记为兴趣推荐信息,并按照多个兴趣推荐信息的浏览量的大小进行推荐排序,生成推荐顺序。
[0135] 具体的,图10示出了本发明实施例提供的系统中兴趣信息匹配单元104的结构框图。
[0136] 其中,在本发明提供的优选实施方式中,所述兴趣信息匹配单元104具体包括:
[0137] 兴趣信息获取模块1041,用于对所述非活跃浏览数据进行分析,获取多个兴趣信息。
[0138] 兴趣标签识别模块1042,用于对多个所述兴趣信息进行标签识别,得到多个兴趣标签。
[0139] 兴趣信息匹配模块1043,用于按照多个兴趣标签,在所述标签信息排列数据库中进行信息匹配,得到多个兴趣推荐信息和推荐顺序。
[0140] 进一步的,所述基于大数据的信息推荐系统还包括:
[0141] 兴趣信息推荐单元105,用于按照所述推荐顺序,将多个所述兴趣推荐信息向所述非活跃浏览数据对应的非活跃用户推荐。
[0142] 在本发明实施例中,在非活跃用户再次进行信息浏览时,兴趣信息推荐单元105按照推荐顺序,将多个兴趣推荐信息依次推荐给非活跃用户,若非活跃用户暂停或关闭了信息浏览,则在下次浏览开启之后,按照推荐顺序,在上一次暂停或关闭的兴趣推荐信息处继续进行信息推荐。
[0143] 综上所述,本发明实施例能够按照多个用户的信息浏览数据进行活跃度分析,将活跃用户的活跃浏览数据进行浏览信息统计与筛选,并进行标签识别,得到标签信息排列数据库,进而通过非活跃用户的兴趣标签,从标签信息排列数据库中匹配兴趣推荐信息进行推荐,从而能够按照非活跃用户的兴趣,推荐活跃用户浏览量高的相应的信息,使得向非活跃用户推荐的信息尽可能的满足用户的兴趣,避免非活跃用户的活跃度越来越低。
[0144] 应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0145] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0146] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0147] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
[0148] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。