大学生新闻推荐方法、装置、设备及存储介质转让专利

申请号 : CN202010164375.7

文献号 : CN111259259B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李莉吴楠武志祥

申请人 : 郑州工程技术学院

摘要 :

本申请实施例公开了一种基于预筛选的大学生新闻推荐方法、装置、设备及存储介质,属于数据预筛选技术领域,该方法包括:接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则进行标记;获取历史新闻参照集信息;基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设的阈值判断是否对所述新闻主题进行新闻内容进行推荐。

权利要求 :

1.一种基于预筛选的大学生新闻推荐方法,其特征在于,包括下述步骤:接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;

基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;

基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则对所述新闻内容和所述新闻主题进行标记,否则,所述新闻内容与新闻主题不满足预设的阈值,终止执行;

获取历史新闻参照集,并基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,基于预设的新闻分类表获取不同分类的历史新闻主题总体排序和总体浏览量;

基于历史新闻主题和新闻主题的权重值,确定被标记的新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设的阈值判断是否对所述被标记的新闻主题进行所述被标记的新闻内容进行推荐。

2.根据权利要求1所述的大学生新闻推荐方法,其特征在于,所述对新发布的新闻进行新闻标题和新闻内容获取包括:

基于预先设定的新闻标题标签从新发布的新闻中解析出新闻主题信息;

基于预先设定的新闻内容标签集从新发布的新闻中解析出新闻内容信息。

3.根据权利要求2所述的大学生新闻推荐方法,其特征在于,所述基于预设的筛选算法对新闻主题进行关键词提取包括:

基于预先配置的分词数据表对所述新闻主题进行分词处理,获取每一个分词作为关键词。

4.根据权利要求3所述的大学生新闻推荐方法,其特征在于,所述基于预设的算法和相关权重表获取新闻主题的权重值包括:基于预设的相关权重表获取每一个关键词对应的权重值,对每一个关键词对应的权重值进行加权处理,获取整个新闻主题的权重值。

5.根据权利要求4所述的大学生新闻推荐方法,其特征在于,所述基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值包括:基于预设的算法模型对新闻内容进行关键词筛选,获取特定个数的关键词;

基于预设的关联参照表,获取所述关键词与对应新闻主题间的相关值。

6.根据权利要求5所述的大学生新闻推荐方法,其特征在于,所述基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类包括:基于历史新闻主题的权重值,构建新闻分类,判断新发布的新闻主题的权重值所对应的新闻分类区间,获取新闻主题所述的新闻分类。

7.根据权利要求1至6任一项所述的大学生新闻推荐方法,其特征在于,所述基于预设的阈值判断是否对所述新闻主题进行新闻内容进行推荐包括:确定新闻主题所属的历史新闻分类,基于历史新闻主题总体排序和总体浏览量,判断同类历史新闻的浏览比重,若浏览比重超过预设的阈值,则对所述新闻主题对应的新闻内容进行推荐,否则,不进行推荐。

8.一种基于预筛选的大学生新闻推荐装置,其特征在于,包括:新闻获取模块,用于接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;

新闻主题权重获取模块,用于基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;

新闻内容与新闻主题相关值获取模块,用于基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则对所述新闻内容和所述新闻主题进行标记,否则,所述新闻内容与新闻主题不满足预设的阈值,终止执行;

历史新闻信息处理模块,用于获取历史新闻参照集,并基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,基于预设的新闻分类表获取不同分类的历史新闻主题总体排序和总体浏览量;

新闻推荐判断模块,用于基于历史新闻主题和新闻主题的权重值,确定被标记的新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设的阈值判断是否对所述被标记的新闻主题进行所述被标记的新闻内容进行推荐。

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的大学生新闻推荐方法的步骤。

10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的大学生新闻推荐方法的步骤。

说明书 :

大学生新闻推荐方法、装置、设备及存储介质

技术领域

[0001] 本申请涉及数据预筛选技术领域,尤其涉及一种基于预筛选的大学生新闻推荐方法、装置、设备及存储介质。

背景技术

[0002] 新闻内容推荐是大多数应用中一个重要的功能,当前字节跳动、百度、腾讯等各大互联网企业都有多款爆款互联网应用,里面一个重要的功能就是新闻内容推荐。该功能会
基于用户的阅读行为,从自有数据库中挑出用户最可能点击查看的新闻内容展示给用户。
现有新闻内容推荐方法主要用户的群体为非学生群体,再加上基于用户的阅读行为进行推
荐,在校园中又往往不能适用,因为校园内的新闻平台还要及时的更新和发布学校相关的
新闻内容和学生自行发布的校内新闻。
[0003] 目前的新闻内容推荐方法主要使用基于用户阅读行为的方式进行推荐,这会时校内新闻推荐不及时;而且在新闻发布时,容易不能结合实际应用场景,为学生群体推荐新
闻。由此可知,现有技术中校园进行新闻发布时,存在不能对新闻内容进行合理推荐的问
题。

发明内容

[0004] 本申请实施例的目的在于提出一种基于预筛选的大学生新闻推荐方法、装置、设备及存储介质,以解决现有技术中校园进行新闻发布时,存在不能对新闻内容进行合理推
荐的问题。
[0005] 为了解决上述技术问题,本申请实施例提供一种基于预筛选的大学生新闻推荐方法,采用了如下所述的技术方案:
[0006] 一种基于预筛选的大学生新闻推荐方法,包括:
[0007] 接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;
[0008] 基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;
[0009] 基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则进行标记;
[0010] 获取历史新闻参照集,并基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,基于预设的新闻分类表获取不同分类的历史新闻主题总体排序和总体浏览量;
[0011] 基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设的阈值判断是否对所述新
闻主题进行新闻内容进行推荐。
[0012] 进一步的,所述大学生新闻推荐方法,所述对新发布的新闻进行新闻标题和新闻内容获取包括:
[0013] 基于预先设定的新闻标题标签从新发布的新闻中解析出新闻主题信息;
[0014] 基于预先设定的新闻内容标签集从新发布的新闻中解析出新闻内容信息。
[0015] 进一步的,所述大学生新闻推荐方法,所述基于预设的筛选算法对新闻主题进行关键词提取包括:
[0016] 基于预先配置的分词数据表对所述新闻主题进行分词处理,获取每一个分词作为关键词。
[0017] 进一步的,所述大学生新闻推荐方法,所述基于预设的算法和相关权重表获取新闻主题的权重值包括:
[0018] 基于预设的相关权重表获取每一个关键词对应的权重值,对每一个关键词对应的权重值进行加权处理,获取整个新闻主题的权重值。
[0019] 进一步的,所述大学生新闻推荐方法,所述基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值包括:
[0020] 基于预设的算法模型对新闻内容进行关键词筛选,获取特定个数的关键词;
[0021] 基于预设的关联参照表,获取所述关键词与对应新闻主题间的相关值。
[0022] 进一步的,所述大学生新闻推荐方法,所述基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类包括:
[0023] 基于历史新闻主题的权重值,构建新闻分类,判断新发布的新闻主题的权重值所对应的新闻分类区间,获取新闻主题所述的新闻分类。
[0024] 进一步的,所述大学生新闻推荐方法,所述基于预设的阈值判断是否对所述新闻主题进行新闻内容进行推荐包括:
[0025] 确定新闻主题所属的历史新闻分类,基于历史新闻主题总体排序和总体浏览量,判断同类历史新闻的浏览比重,若浏览比重超过预设的阈值,则对所述新闻主题对应的新
闻内容进行推荐,否则,不进行推荐。
[0026] 为了解决上述技术问题,本申请实施例还提供了一种基于预筛选的大学生新闻推荐装置,采用了如下所述的技术方案:
[0027] 一种基于预筛选的大学生新闻推荐装置,包括:
[0028] 新闻获取模块,用于接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;
[0029] 新闻主题权重获取模块,用于基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;
[0030] 新闻内容与新闻主题相关值获取模块,用于基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则进行标记;
[0031] 历史新闻信息处理模块,用于获取历史新闻参照集,并基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,基于预设的新闻分类表获取不同分类的历史新闻主题
总体排序和总体浏览量;
[0032] 新闻推荐判断模块,用于基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设
的阈值判断是否对所述新闻主题进行新闻内容进行推荐。
[0033] 为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0034] 一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现本申请实施例中提出的一种基于预筛选的大学生新闻推
荐方法的步骤。
[0035] 为了解决上述技术问题,本申请实施例还提供一种非易失性计算机可读存储介质,采用了如下所述的技术方案:
[0036] 一种非易失性计算机可读存储介质,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例中提出的一种基于预筛选的大学生新
闻推荐方法的步骤。
[0037] 与现有技术相比,本申请实施例主要有以下有益效果:
[0038] 本申请实施例公开了大学生新闻推荐方法、装置、设备及存储介质,通过接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;基于预设的筛选算法对新闻
主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;基于预设
的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的
阈值,若满足,则进行标记;获取历史新闻参照集信息;基于历史新闻主题和新闻主题的权
重值,确定新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总
体浏览量,基于预设的阈值判断是否对所述新闻主题进行新闻内容进行推荐。本申请有助
于提高校园新闻的规范发布和及时推荐,给阅读用户提供更加良好的推荐结果。

附图说明

[0039] 为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域
普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040] 图1为本申请实施例可以应用于其中的示例性系统架构图;
[0041] 图2为本申请实施例中所述大学生新闻推荐方法的一个实施例的流程图;
[0042] 图3为本申请实施例中所述大学生新闻推荐装置的一个实施例的结构示意图;
[0043] 图4为本申请实施例中新闻获取模块的结构示意图;
[0044] 图5为本申请实施例中新闻主题权重获取模块的结构示意图;
[0045] 图6为本申请实施例中计算机设备的一个实施例的结构示意图。

具体实施方式

[0046] 除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体
的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明
中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说
明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用
于描述特定顺序。
[0047] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同
的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和
隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0048] 为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0049] 如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以
包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0050] 用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应
用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0051] 终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts 
Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture 
Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携
计算机和台式计算机等等。
[0052] 服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
[0053] 需要说明的是,本申请实施例所提供的大学生新闻推荐方法一般由服务器/终端设备执行,相应地,大学生新闻推荐装置一般设置于服务器/终端设备中。
[0054] 应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0055] 继续参考图2,图中示出了本申请的大学生新闻推荐方法的一个实施例的流程图,所述的大学生新闻推荐方法包括以下步骤:
[0056] 步骤201,接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取。
[0057] 在本实施例中,所述步骤201对新发布的新闻进行新闻标题和新闻内容获取包括:基于预先设定的新闻标题标签从新发布的新闻中解析出新闻主题信息。
[0058] 所述基于预先设定的新闻标题标签从新发布的新闻中解析出新闻主题信息,例如在进行新闻发布时,服务器在接收到最新新闻时,会确定整个新闻中的标签部分,为了区别
主题与内容部分,新闻写入平台经常使用

标签确定新闻主题的写入区域,在进行
解析时,直接获取最新发布新闻的

标签中的内容部分,即新闻主题。
[0059] 在本实施例中,所述步骤201对新发布的新闻进行新闻标题和新闻内容获取还包括:基于预先设定的新闻内容标签集从新发布的新闻中解析出新闻内容信息。
[0060] 所述基于预先设定的新闻内容标签集从新发布的新闻中解析出新闻内容信息,例如在新闻内容解析时,预先创建新闻内容标签集包括

、、

、、
    等页面标签,在进行新闻解析时,直接获取新闻内容标签集中元素中包含的内容文本,即新闻内容。
    [0061] 步骤202,基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值。
    [0062] 在本实施例中,所述步骤202基于预设的筛选算法对新闻主题进行关键词提取包括:基于预先配置的分词数据表对所述新闻主题进行分词处理,获取每一个分词作为关键
    词。
    [0063] 在本实施例中,所述基于预设的筛选算法对新闻主题进行关键词提取,具体所述基于预设的筛选算法为基于新闻主题中的不同词性对新闻主题进行分割,然后去历史分割
    后的词库中,进行查找,筛选出出现最多的非助词词语,作为新闻主题的关键词,所述关键
    词个数不限。
    [0064] 在本实施例中,所述步骤202所述基于预设的算法和相关权重表获取新闻主题的权重值包括:基于预设的相关权重表获取每一个关键词对应的权重值,对每一个关键词对
    应的权重值进行加权处理,获取整个新闻主题的权重值。
    [0065] 在本申请的一些实施例中,所述基于预设的算法和相关权重表获取新闻主题的权重值,具体的实现方式如下:预先给出一个权重值表,所述权重值表中包含了所有常出现,
    非常出现的词语,对于这些词语分别设定不同的权重值,例如权重值表中包含校级、院级、
    各个专业名称等,分别对不同等级的词语设定不同的权重值,最后将新闻主题中出现的关
    键词,在权重值表中进行筛选,获取每个关键词对应的权重值,在基于预设的算法进行获取
    总的权重值,即新闻主题的权重值,所述预设的算法可以为累加算法,也可以为方差算法
    等。
    [0066] 步骤203,基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则进行标记。
    [0067] 在本申请的一些实施例中,所述步骤203中的所述基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值包括:基于预设的算法模型对新闻内容进行关键词筛
    选,获取特定个数的关键词;基于预设的关联参照表,获取所述关键词与对应新闻主题间的
    相关值。
    [0068] 具体的,所述基于预设的算法模型对新闻内容进行关键词筛选,获取特定个数的关键词,实现方式如下:所述预设的算法模型为概率模型算法,首先对新闻内容进行分段落
    处理,所述分段落处理包括:对整体新闻内容进行查询筛选,判断行首位置是否有2个空格
    字符,若存在,则往前一行进行查询,查询到最后一个字符,进行分割处理,将整个新闻内容
    分割成若干新闻段落;其次,分别在段落中提取关键词,所述在段落中提取关键词使用概率
    模型算法,所述概率模型算法包括:对段落中的字符信息进行分句处理,所述分句处理为基
    于预设设定的句尾符号表如。、!、;、等,将段落分割为不同句子。在对不同的句子进行分割
    处理,分割为不同的词语,筛选出每个段落中出现频率最高的10个词语,进行整合,最后筛
    选出整个新闻内容中出现频率最高的10个词语,作为新闻内容的关键词。
    [0069] 在本实施例中,所述基于预设的关联参照表,获取所述关键词与对应新闻主题间的相关值,具体的步骤如下:所述预设的关联参照表,为基于历史新闻信息获取的不同新闻
    主题经常对应的关键词,基于不同关键词出现的频率为每一个关键词设定不同的相关值,
    最后将从新闻内容中提取出的10个关键词作为查询词,获取不同关键词在对应新闻主题中
    的相关值,进行累加处理,获取新闻内容与其对应新闻主题间的总相关值。
    [0070] 在本实施例中,所述判断所述相关值是否满足预设的阈值,若满足,则进行标记,例如:获取新闻内容与新闻主题间的相关值之后,先进行判断,判断所述相关值是否满足新
    闻相关度,假设存在一篇新发布的新闻,设定的相关值阈值为0.7,该新闻主题与新闻内容
    间的相关值为0.2,则判断该新闻的新闻内容与新闻主题不相符,则不再进行后续操作。
    [0071] 步骤204,获取历史新闻参照集,并基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,基于预设的新闻分类表获取不同分类的历史新闻主题总体排序和总体浏览
    量。
    [0072] 在本申请的一些实施例中,所述基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,具体的实现方式如下:所述历史浏览量为基于累加算法,在用户进行新闻阅读
    时,判断阅读是否超过特定的时间,例如设定为5秒,如果用户浏览某个新闻内容超过5秒,
    则浏览量加一,否则,为非浏览。获取历史新闻参照集中不同历史新闻主题的浏览量,进行
    排序处理,筛选出浏览量次数最高的若干历史新闻主题进行提取。
    [0073] 在本申请的一些实施例中,所述基于预设的新闻分类表获取不同分类的历史新闻主题总体排序和总体浏览量,具体的实现方式如下:所述预设的新闻分类表,基于不同的分
    类方式对新闻信息进行分类,例如基于院级、校级、专业级别进行分类,或者基于新闻的内
    容,如军事、科学、历史、文学等进行分类。基于所述新闻分类表分别对不同的新闻内容查找
    特定领域字符,例如历史类,检索新闻内容中是否包含多个历史名人,若能检索到,则划分
    为历史类,最后对同一分类的所有新闻信息,获取每一个所属类新闻中每一遍新闻对应的
    浏览量,进行统计,获取总浏览量,所述分类方式为首次分类,即新闻领域分类。
    [0074] 步骤205,基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设的阈值判断是
    否对所述新闻主题进行新闻内容进行推荐。
    [0075] 在本申请的一些实施例中,所述步骤205中所述基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类包括:基于历史新闻主题的权重值,构建新闻分类,
    判断新发布的新闻主题的权重值所对应的新闻分类区间,获取新闻主题所述的新闻分类。
    [0076] 在本申请实施例中,所述基于历史新闻主题的权重值,构建新闻分类,具体的实现方式如下:首先,对基于新闻分类表中已经分类完成的新闻领域分类的新闻进行二次分类,
    所述二次分类的方式为获取首次分类后同种类别中的所有历史新闻信息,然后使用上述步
    骤202中的权重值分类方式分别对历史新闻信息进行依据权重值进行分类,假设经过权重
    值计算后,每个新闻主题对应的权重值为10至50,这时,将[10,20)、[20,30)、[30,40)、[40,
    50)权重区域分为不同的种类,为新闻权重值分类。
    [0077] 在本申请实施例中,所述判断新发布的新闻主题的权重值所对应的新闻分类区间,获取新闻主题所述的新闻分类,具体的判断方式如下:获取步骤202中的新发布新闻的
    新闻主题权重值,并判断该权重值对应的新发布新闻新闻领域分类,再进行新闻权重值分
    类。
    [0078] 在本申请的一些实施例中,所述步骤205中所述基于预设的阈值判断是否对所述新闻主题进行新闻内容进行推荐包括:确定新闻主题所属的历史新闻分类,基于历史新闻
    主题总体排序和总体浏览量,判断同类历史新闻的浏览比重,若浏览比重超过预设的阈值,
    则对所述新闻主题对应的新闻内容进行推荐,否则,不进行推荐。
    [0079] 在本申请的实施例中,所述判断同类历史新闻的浏览比重,若浏览比重超过预设的阈值,则对所述新闻主题对应的新闻内容进行推荐,否则,不进行推荐,具体的实现方式
    如下:判断经过新闻权重值分类后的新发布新闻的权重区间内的总浏览量,然后判断所述
    总浏览量是否超过预设的推荐阈值,若超过,则进行推荐,否则,不进行推荐。
    [0080] 本申请实施例中所述的大学生新闻推荐方法,可以通过接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;基于预设的筛选算法对新闻主题进行关键词
    提取,并基于预设的算法和相关权重表获取新闻主题的权重值;基于预设的关联算法获取
    新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则
    进行标记;获取历史新闻参照集信息;基于历史新闻主题和新闻主题的权重值,确定新闻主
    题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预
    设的阈值判断是否对所述新闻主题进行新闻内容进行推荐。本申请有助于提高校园新闻的
    规范发布和及时推荐,给阅读用户提供更加良好的推荐结果。
    [0081] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介
    质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为
    磁碟、光盘、只读存储记忆体(Read‑Only Memory,ROM)等非易失性存储介质,或随机存储记
    忆体(Random Access Memory,RAM)等。
    [0082] 应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤
    的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一
    部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻
    执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他
    步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
    [0083] 进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种基于预筛选的大学生新闻推荐装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装
    置具体可以应用于各种电子设备中。
    [0084] 如图3所示,本实施例所述的大学生新闻推荐装置3包括:新闻获取模块301、新闻主题权重获取模块302、新闻内容与新闻主题相关值获取模块303、历史新闻信息处理模块
    304和新闻推荐判断模块305。其中:
    [0085] 新闻获取模块301,用于接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;
    [0086] 新闻主题权重获取模块302,用于基于预设的筛选算法对新闻主题进行关键词提取,并基于预设的算法和相关权重表获取新闻主题的权重值;
    [0087] 新闻内容与新闻主题相关值获取模块303,用于基于预设的关联算法获取新闻内容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则进行标
    记;
    [0088] 历史新闻信息处理模块304,用于获取历史新闻参照集,并基于历史浏览量对历史新闻参照集中历史新闻标题进行排序,基于预设的新闻分类表获取不同分类的历史新闻主
    题总体排序和总体浏览量;
    [0089] 新闻推荐判断模块305,用于基于历史新闻主题和新闻主题的权重值,确定新闻主题所属的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预
    设的阈值判断是否对所述新闻主题进行新闻内容进行推荐。
    [0090] 在本申请的一些实施例中,如图4,图4为本申请实施例中新闻获取模块的结构示意图,所述新闻获取模块301包括新闻内容抓取单元301a、新闻主题信息获取单元301b、新
    闻内容信息获取单元301c。
    [0091] 在本申请的一些实施例中,所述新闻内容抓取单元301a用于对新发布的新闻进行信息抓取,抓取到发布的整篇信息,使用爬虫机制直接进行抓取。
    [0092] 在本申请的一些实施例中,所述新闻主题信息获取单元301b用于基于预先设定的新闻标题标签从新发布的新闻中解析出新闻主题信息。
    [0093] 在本申请的一些实施例中,所述新闻内容信息获取单元301c用于基于预先设定的新闻内容标签集从新发布的新闻中解析出新闻内容信息。
    [0094] 在本申请的一些实施例中,如图5,图5为本申请实施例中新闻主题权重获取模块的结构示意图,所述新闻主题权重获取模块302包括关键词提取单元302a和新闻主题权重
    获取单元302b。
    [0095] 在本申请的一些实施例中,所述关键词提取单元302a用于基于预先配置的分词数据表对所述新闻主题进行分词处理,获取每一个分词作为关键词,具体的基于预设的筛选
    算法为基于新闻主题中的不同词性对新闻主题进行分割,然后去历史分割后的词库中,进
    行查找,筛选出出现最多的非助词词语,作为新闻主题的关键词,所述关键词个数不限。
    [0096] 在本申请的一些实施例中,所述新闻主题权重获取单元302b用于基于预设的相关权重表获取每一个关键词对应的权重值,对每一个关键词对应的权重值进行加权处理,获
    取整个新闻主题的权重值,具体的,预先给出一个权重值表,所述权重值表中包含了所有常
    出现,非常出现的词语,对于这些词语分别设定不同的权重值,例如权重值表中包含校级、
    院级、各个专业名称等,分别对不同等级的词语设定不同的权重值,最后将新闻主题中出现
    的关键词,在权重值表中进行筛选,获取每个关键词对应的权重值,在基于预设的算法进行
    获取总的权重值,即新闻主题的权重值,所述预设的算法可以为累加算法,也可以为方差算
    法等。
    [0097] 本申请实施例所述的大学生新闻推荐装置,通过接收新闻发布请求,并对新发布的新闻进行新闻标题和新闻内容获取;基于预设的筛选算法对新闻主题进行关键词提取,
    并基于预设的算法和相关权重表获取新闻主题的权重值;基于预设的关联算法获取新闻内
    容与其对应新闻主题间的相关值,判断所述相关值是否满足预设的阈值,若满足,则进行标
    记;获取历史新闻参照集信息;基于历史新闻主题和新闻主题的权重值,确定新闻主题所属
    的新闻分类,并获取所述新闻分类的历史新闻主题总体排序和总体浏览量,基于预设的阈
    值判断是否对所述新闻主题进行新闻内容进行推荐。本申请有助于提高校园新闻的规范发
    布和及时推荐,给阅读用户提供更加良好的推荐结果。
    [0098] 为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6,图6为本实施例计算机设备基本结构框图。
    [0099] 所述计算机设备6包括通过系统总线相互通信连接存储器6a、处理器6b、网络接口6c。需要指出的是,图中仅示出了具有组件6a‑6c的计算机设备6,但是应理解的是,并不要
    求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员
    可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算
    和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application 
    Specific Integrated Circuit,ASIC)、可编程门阵列(Field‑Programmable Gate Array,
    FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
    [0100] 所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人
    机交互。
    [0101] 所述存储器6a至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访
    问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存
    储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器6a可以是所述计算机
    设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器
    6a也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,
    智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash 
    Card)等。当然,所述存储器6a还可以既包括所述计算机设备6的内部存储单元也包括其外
    部存储设备。本实施例中,所述存储器6a通常用于存储安装于所述计算机设备6的操作系统
    和各类应用软件,例如大学生新闻推荐方法的程序代码等。此外,所述存储器6a还可以用于
    暂时地存储已经输出或者将要输出的各类数据。
    [0102] 所述处理器6b在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器6b通常用于控制所述计
    算机设备6的总体操作。本实施例中,所述处理器6b用于运行所述存储器6a中存储的程序代
    码或者处理数据,例如运行所述大学生新闻推荐方法的程序代码。
    [0103] 所述网络接口6c可包括无线网络接口或有线网络接口,该网络接口6c通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
    [0104] 本申请还提供了另一种实施方式,即提供一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有大学生新闻推荐程序,所述大学生新闻推荐程序可
    被至少一个处理器执行,以使所述至少一个处理器执行如上述的大学生新闻推荐方法的步
    骤。
    [0105] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下
    前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做
    出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质
    (如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服
    务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
    [0106] 显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同
    的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻
    全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其
    依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进
    行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他
    相关的技术领域,均同理在本申请专利保护范围之内。