应用人工智能的新闻舆情文本处理方法、服务器及介质转让专利
申请号 : CN202110584711.8
文献号 : CN113157871B
文献日 : 2021-12-21
发明人 : 邢作乾 , 房爱军
申请人 : 宿迁硅基智能科技有限公司
摘要 :
权利要求 :
1.一种应用人工智能的新闻舆情文本处理方法,其特征在于,应用于人工智能服务器,所述方法至少包括:
根据事先存储的各个基准舆情文本片段,确定与目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件的第一基准舆情文本片段集,以及,与新闻参考文本之间的相关性系数满足所述第一设定相关性判定条件的第二基准舆情文本片段集;其中,所述第一基准舆情文本片段集是由各个基准舆情文本片段中的一个或者多个第一基准舆情文本片段构成;所述新闻参考文本是事先存储的各个新闻参考文本中的新闻参考文本,所述第二基准舆情文本片段集是由各个基准舆情文本片段中的一个或者多个第二基准舆情文本片段构成;
分别确定所述第一基准舆情文本片段集与每个所述第二基准舆情文本片段集之间的片段集相关性,获得所述目标网络新闻文本与所述每个新闻参考文本之间的新闻文本相关度。
2.根据权利要求1所述的方法,其特征在于,在根据事先存储的各个基准舆情文本片段,确定与目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件的第一基准舆情文本片段集之前,还包括:
将每个所述新闻参考文本分别拆分为相同数目的多个舆情文本参考片段,获得每个所述新闻参考文本分别对应的舆情文本参考片段集;其中,所述舆情文本参考片段集中的各个舆情文本参考片段按照各个舆情文本参考片段在对应的新闻参考文本中的分布区域整理;
基于每个所述舆情文本参考片段集中,相同分布区域上的舆情文本参考片段,确定对应的一个或者多个基准舆情文本片段,获得事先存储的各个基准舆情文本片段。
3.根据权利要求2所述的方法,其特征在于,基于每个所述舆情文本参考片段集中,相同分布区域上的舆情文本参考片段,确定对应的一个或者多个基准舆情文本片段,获得事先存储的各个基准舆情文本片段,包括:将每个所述舆情文本参考片段集中,相同分布区域上的舆情文本参考片段作为一个文本片段描述序列,对每个文本片段描述序列进行特征分析处理,获得每个文本片段描述序列分别对应的一个或者多个基准舆情文本片段;
根据每个所述文本片段描述序列分别对应的一个或者多个基准舆情文本片段,获得事先存储的各个基准舆情文本片段。
4.根据权利要求3所述的方法,其特征在于,在文本片段描述序列与文本片段描述序列中包括的舆情文本参考片段在对应的新闻参考文本中的分布区域关联的前提下,根据事先存储的各个基准舆情文本片段,确定与目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件的第一基准舆情文本片段集,包括:将所述目标网络新闻文本拆分为多个目标舆情文本片段,获得所述目标网络新闻文本的目标舆情文本片段集;其中,所述目标舆情文本片段集中的各个目标舆情文本片段按照各个目标舆情文本片段在目标网络新闻文本中的分布区域整理;
确定所述文本片段描述序列对应的一个或者多个基准舆情文本片段中,与所述目标舆情文本片段之间的相关性系数满足第二设定相关性判定条件的第一基准舆情文本片段;其中,所述目标舆情文本片段在所述目标舆情文本片段集中的分布区域,与所述文本片段描述序列的邻居分布区域相同;
在每个所述目标舆情文本片段皆存在一个对应的所述第一基准舆情文本片段的前提下,确定由各个所述第一基准舆情文本片段构成的所述第一基准舆情文本片段集,与所述目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件,获得所述目标网络新闻文本对应的所述第一基准舆情文本片段集。
5.根据权利要求4项所述的方法,其特征在于,在事先存储的各个基准舆情文本片段分别具有文本片段标签,在所述文本片段标签用于唯一表示每个基准舆情文本片段的前提下,获得所述目标网络新闻文本对应的所述第一基准舆情文本片段集,包括:根据各个所述第一基准舆情文本片段的文本片段标签,获得所述目标网络新闻文本对应的第一基准舆情文本片段集。
6.根据权利要求3所述的方法,其特征在于,在文本片段描述序列与文本片段描述序列中包括的舆情文本参考片段在对应的新闻参考文本中的分布区域关联的前提下,根据事先存储的各个基准舆情文本片段,确定分别与各个事先存储的新闻参考文本之间的相关性系数满足第一设定相关性判定条件的各个第二基准舆情文本片段集,包括:在所述文本片段描述序列对应的一个或者多个基准舆情文本片段中,确定与所述舆情文本参考片段之间的相关性系数满足第二设定相关性判定条件的第二基准舆情文本片段;
其中,所述舆情文本参考片段在所述舆情文本参考片段集中的分布区域,与所述文本片段描述序列的邻居分布区域相同;
在每个所述舆情文本参考片段皆存在一个对应的所述第二基准舆情文本片段的前提下,确定由各个所述第二基准舆情文本片段构成的所述第二基准舆情文本片段集,与所述新闻参考文本之间的相关性系数满足第一设定相关性判定条件,获得所述新闻参考文本对应的所述第二基准舆情文本片段集。
7.根据权利要求1所述的方法,其特征在于,在所述第一基准舆情文本片段集中第一基准舆情文本片段的数目与所述第二基准舆情文本片段集中第二基准舆情文本片段的数目一致的前提下,分别确定所述第一基准舆情文本片段集与每个所述第二基准舆情文本片段集之间的片段集相关性,包括:
分别确定所述第一基准舆情文本片段集中每个第一基准舆情文本片段,与所述第二基准舆情文本片段集中对应分布区域的第二基准舆情文本片段之间的文本片段相关性系数;
对获得的文本片段相关性系数进行全局优化处理,获得所述第一基准舆情文本片段集与所述第二基准舆情文本片段集之间的片段集相关性。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据与目标网络新闻文本对应的目标话题互动客户端确定目标话题评论内容,通过所述目标话题评论内容确定话题评论画像知识库;
相应的,根据与目标网络新闻文本对应的目标话题互动客户端确定目标话题评论内容,通过所述目标话题评论内容确定话题评论画像知识库,包括:根据目标话题互动客户端获取目标话题评论内容的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息;
在所述目标话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息;
根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库。
9.一种人工智能服务器,其特征在于,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行权利要求1‑8任一项所述的方法。
10.一种计算机用可读存储介质,其特征在于,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现权利要求1‑8任一项所述的方法。
说明书 :
应用人工智能的新闻舆情文本处理方法、服务器及介质
技术领域
背景技术
情信息的有效处理和归类,相关技术会借助人工智能(Artificial Intelligence,AI)技术
进行文本处理。
发明内容
间的相关性系数满足所述第一设定相关性判定条件的第二基准舆情文本片段集;其中,所
述第一基准舆情文本片段集是由各个基准舆情文本片段中的一个或者多个第一基准舆情
文本片段构成;所述新闻参考文本是事先存储的各个新闻参考文本中的新闻参考文本,所
述第二基准舆情文本片段集是由各个基准舆情文本片段中的一个或者多个第二基准舆情
文本片段构成;
相关度。
的各个舆情文本参考片段按照各个舆情文本参考片段在对应的新闻参考文本中的分布区
域整理;
段,包括:
述序列分别对应的一个或者多个基准舆情文本片段;
段,确定与目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件的第一基准
舆情文本片段集,包括:
按照各个目标舆情文本片段在目标网络新闻文本中的分布区域整理;
段;其中,所述目标舆情文本片段在所述目标舆情文本片段集中的分布区域,与所述文本片
段描述序列的邻居分布区域相同;
所述目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件,获得所述目标网
络新闻文本对应的所述第一基准舆情文本片段集。
应的所述第一基准舆情文本片段集,包括:
段,确定分别与各个事先存储的新闻参考文本之间的相关性系数满足第一设定相关性判定
条件的各个第二基准舆情文本片段集,包括:
片段;其中,所述舆情文本参考片段在所述舆情文本参考片段集中的分布区域,与所述文本
片段描述序列的邻居分布区域相同;
所述新闻参考文本之间的相关性系数满足第一设定相关性判定条件,获得所述新闻参考文
本对应的所述第二基准舆情文本片段集。
一基准舆情文本片段集与每个所述第二基准舆情文本片段集之间的片段集相关性,包括:
系数;
标在线评论用户的第二评论情感极性信息;
序并运行,以执行上述的方法。
络新闻文本之间的相关性系数满足第一设定相关性判定条件的一个或者多个第一基准舆
情文本片段,获得目标网络新闻文本对应的第一基准网络新闻文本集,以及与新闻参考文
本之间的相关性系数满足第一设定相关性判定条件的一个或者多个第二基准舆情文本片
段,获得各个新闻参考文本对应的第二基准文本片段集。如此设计,能够将目标网络新闻文
本和各个新闻参考文本映射到同一基准规范下进行比对分析,根据事先存储的各个基准舆
情文本片段之间的相关性系数,确定第一基准网络新闻文本集与每个第二基准网络新闻文
本集之间片段集相关性,从而获得目标网络新闻文本与各个新闻参考文本之间的新闻文本
相关度,进而有效简化确定目标网络新闻文本与各个新闻参考文本之间的新闻文本相关度
的过程,提高了新闻舆情文本分析的效率,避免在一些时段内处理大量的新闻舆情文本而
导致服务器崩溃。
使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被
实现和获得。
附图说明
范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这
些附图获得其他相关的附图。
具体实施方式
是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请
实施例的组件可以以各种不同的配置来布置和设计。
技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范
围。
人工智能服务器10包括:存储器11、处理器12、通信总线13和应用人工智能的新闻舆情文本
处理装置20。
存储器11中存储有应用人工智能的新闻舆情文本处理装置20,所述应用人工智能的新闻舆
情文本处理装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11
中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如
本申请实施例中的应用人工智能的新闻舆情文本处理装置20,从而执行各种功能应用以及
数据处理,即实现本申请实施例中的应用人工智能的新闻舆情文本处理方法。
Memory,PROM),可擦除只读存储器(Erasable Programmable Read‑Only Memory,EPROM),
电可擦除只读存储器(Electric Erasable Programmable Read‑Only Memory,EEPROM)等。
其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻
辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
件或其组合实现。
理器12实现,所述方法包括以下步骤100‑步骤300所描述的技术方案。
以及,与新闻参考文本之间的相关性系数满足所述第一设定相关性判定条件的第二基准舆
情文本片段集。
者文本4。应当理解,网络新闻文本和舆情文本片段之间的关系仅作示例解释,并不是对本
方案的限定。
制。
新闻参考文本中的新闻参考文本,所述第二基准舆情文本片段集是由各个基准舆情文本片
段中的一个或者多个第二基准舆情文本片段构成。
的第一基准舆情文本片段集的步骤之前,该方法还可以包括以下步骤210和步骤220所描述
的技术方案。
文本参考片段可以按照各个舆情文本参考片段在对应的新闻参考文本中的位置进行排序
或者排列。
段。
段集中,相同分布区域上的舆情文本参考片段,确定对应的一个或者多个基准舆情文本片
段,获得事先存储的各个基准舆情文本片段,可以包括以下步骤221和步骤222所描述的技
术方案。
本片段描述序列分别对应的一个或者多个基准舆情文本片段。
据事先存储的各个基准舆情文本片段,确定与目标网络新闻文本之间的相关性系数满足第
一设定相关性判定条件的第一基准舆情文本片段集,可以包括以下步骤110‑步骤130所描
述的技术方案。
情文本片段。
段集,与所述目标网络新闻文本之间的相关性系数满足第一设定相关性判定条件,获得所
述目标网络新闻文本对应的所述第一基准舆情文本片段集。
性判定条件是基于每个所述目标舆情文本片段皆存在一个对应的所述第一基准舆情文本
片段实现的,这样能够有效减少人工智能服务器的计算量,从而释放人工智能服务器的内
存资源,使得人工智能服务器能够在相同时段内处理更多的网络新闻文本。
述的获得所述目标网络新闻文本对应的所述第一基准舆情文本片段集,可以包括以下技术
方案:根据各个所述第一基准舆情文本片段的文本片段标签,获得所述目标网络新闻文本
对应的第一基准舆情文本片段集。
先存储的各个基准舆情文本片段,确定分别与各个事先存储的新闻参考文本之间的相关性
系数满足第一设定相关性判定条件的各个第二基准舆情文本片段集,可以包括以下步骤
(1)和步骤(2)所描述的技术方案。
文本片段。
布区域。
与所述新闻参考文本之间的相关性系数满足第一设定相关性判定条件,获得所述新闻参考
文本对应的所述第二基准舆情文本片段集。
的所述第二基准舆情文本片段集。
参考文本之间的新闻文本相关度。
考文本之间的文本相似度,这样可以快速确定目标网络新闻文本与每个新闻参考文本之间
的文本相似度,以实现对目标网络新闻文本的分类处理,便于后续进行全局层面的分析。
度的准确性和可靠性的前提下有效减少相关度的计算复杂度,从而减少人工智能服务器的
文本处理压力,避免在一些时段处理大量的新闻文本而导致人工智能服务器崩溃。
上述步骤300所描述的分别确定所述第一基准舆情文本片段集与每个所述第二基准舆情文
本片段集之间的片段集相关性,可以包括以下步骤310和步骤320。
段相关性系数。
片段集相关性。
根据与目标网络新闻文本对应的目标话题互动客户端确定目标话题评论内容,通过所述目
标话题评论内容确定话题评论画像知识库。
库”进一步可以通过以下实施方式实现:根据目标话题互动客户端获取目标话题评论内容
的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息;在所述目标话题评
论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据同步更新的
具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论
情感极性信息;根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目
标在线评论用户的话题评论画像知识库。
话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据同步
更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第
二评论情感极性信息;根据所述第一评论情感极性信息和所述第二评论情感极性信息确定
所述目标在线评论用户的话题评论画像知识库”进一步可以通过以下实施方式实现。
组话题观点文本可以是用户输入的文字性观点评论。目标在线评论用户可以是通过账号登
录的互联网用户。相应的,评论情感极性信息可以包括积极、消极和中立三种情感极性,也
可以包括其他类型的极性,本方案不一一列举。
网络模型对第一组话题观点文本进行分析,具体实施方式可以参阅相关现有技术。
情感极性确定所述目标在线评论用户的第二评论情感极性信息。
述目标在线评论用户的在线状态标识。
义关联情况确定目标在线评论用户的第二评论情感极性信息,这样可以尽可能确保第二评
论情感极性信息的完整性。
骤之前,该方法还可以包括以下技术方案:根据所述目标话题互动客户端获取第一组话题
观点文本中所述目标在线评论用户的第二目标策略信息;获取所述第二目标策略信息的情
感关键描述,并根据所述情感关键描述调整得到第二解析策略信息;获取所述第二解析策
略信息的策略描述特征;通过对所述第二解析策略信息的策略描述特征进行迭代处理得到
所述文本同步更新线程的样本训练序列;根据所述样本训练序列以及线性回归模型确定所
述文本同步更新线程。
该方法还可以包括以下技术方案:获取同步更新的关联观点文本的最大关联度;获取同步
更新的关联观点文本与预设自然语言文本特征分布之间的匹配程度;根据所述最大关联度
和所述匹配程度确定所述目标在线评论用户的话题评论可信系数;在所述话题评论可信系
数大于第四设定阈值的前提下,确定所述第二组话题观点文本中存在所述目标在线评论用
户。
示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载
体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
以下S231‑S236。
所述x为大于1的整数。
义关键描述。
绪画像聚类结果;根据所述情绪画像聚类结果确定所述评论语义情绪内容集合的情绪画像
拼接策略。
论画像知识库;
性信息的情绪画像标签以及以及所述第二评论情感极性信息的情绪画像标签进行图数据
化处理,得到所述话题评论画像知识库,这样可以确保话题评论画像知识库的完整性,避免
出现部分画像节点或者画像节点之间的连边的缺失,以提高话题评论画像知识库的质量。
论语义情绪内容集合所对应的情绪画像聚类结果,可以包括以下S2351‑S2355。
义关键描述。
述。
语义特征图。
图以及x个时序权重确定的,每个目标语义特征图对应于一个时序权重。
述方法包括以下S241‑S244。
观点文本中的第三评论情感极性信息,其中,所述第三组与所述第四组之间间隔n组,n为大
于1、且小于第一设定阈值的正整数。
点文本中的第一目标策略信息的事理图谱传递路径为所述第一解析策略信息的事理图谱
传递路径,以所述目标在线评论用户在所述第二组话题观点文本中所述第一目标策略信息
的情感关键描述的特征加权结果为所述第一解析策略信息的情感关键描述,确定所述第一
解析策略信息。
条件和上下位等事理逻辑关系。因此,为了准确将不同分类标识对应的新闻事件的事件内
容准确、并高效的呈现给用户,以实现新闻预警的目的,将事件内容以具有逻辑关系的方式
映射到事理图谱对应的节点处。进一步地,情感关键描述可以是特征向量。
特征值,所述m个局部策略描述特征最后一个局部策略描述特征的一个特征值为所述策略
描述特征的第二特征值,所述第一特征值和所述第二特征值存在关联,所述m个局部策略描
述特征中每相邻的两个局部策略描述特征之间存在相同特征维度的共有策略信息,所述m
为大于1的正整数。
知识库,从而确保话题评论画像知识库处于持续的更新状态中。
可以包括以下S251‑S255。
在线评论用户的所有目标备选策略信息,其中所述第三组与所述第五组之间间隔k组,k为
大于第一设定阈值的正整数;
递路径和策略优先级一致。
论用户得到的向量。
像知识库的信息。
库,从而确保话题评论画像知识库处于持续的更新状态中。
情感极性获取所述目标在线评论用户在所述第二组话题观点文本中的事理图谱传递路径
和策略优先级。
二用户绑定信息之后,所述方法还可以包括以下步骤a1‑步骤a4。
定所述目标在线评论用户在所述第二组话题观点文本中的目标策略描述向量。
点文本中的文本同步更新线程。
定所述第二组话题观点文本中的事理图谱传递路径和策略优先级关联线程。
参数确定所述当前组话题观点文本中所述目标在线评论用户的目标策略描述向量、文本同
步更新线程以及事理图谱传递路径和策略优先级关联线程。
观点文本中存在的目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观
点文本的评论情感极性确定目标在线评论用户的第二评论情感极性信息;根据第一评论情
感极性信息和第二评论情感极性信息确定目标在线评论用户的话题评论画像知识库,达到
了根据文本同步更新线程获取的关联观点文本确定目标话题评论内容中每组话题观点文
本中目标在线评论用户的评论情感极性信息的目的,从而实现了根据同步更新的关联观点
文本完整确定目标在线评论用户评论情感极性信息的技术效果,进而解决了相关技术中,
在较为繁杂的话题交互环境下目标在线评论用户的话题评论画像知识库出现缺失的技术
问题。
舆情文本片段,获得目标网络新闻文本对应的第一基准网络新闻文本集,以及与新闻参考
文本之间的相关性系数满足第一设定相关性判定条件的一个或者多个第二基准舆情文本
片段,获得各个新闻参考文本对应的第二基准文本片段集。如此设计,能够将目标网络新闻
文本和各个新闻参考文本映射到同一基准规范下进行比对分析,根据事先存储的各个基准
舆情文本片段之间的相关性系数,确定第一基准网络新闻文本集与每个第二基准网络新闻
文本集之间片段集相关性,从而获得目标网络新闻文本与各个新闻参考文本之间的新闻文
本相关度,进而有效简化确定目标网络新闻文本与各个新闻参考文本之间的新闻文本相关
度的过程,提高了新闻舆情文本分析的效率,避免在一些时段内处理大量的新闻舆情文本
而导致服务器崩溃。
集,以及,与新闻参考文本之间的相关性系数满足所述第一设定相关性判定条件的第二基
准舆情文本片段集;其中,所述第一基准舆情文本片段集是由各个基准舆情文本片段中的
一个或者多个第一基准舆情文本片段构成;所述新闻参考文本是事先存储的各个新闻参考
文本中的新闻参考文本,所述第二基准舆情文本片段集是由各个基准舆情文本片段中的一
个或者多个第二基准舆情文本片段构成。
参考文本之间的新闻文本相关度。
流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现
的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序
段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻
辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也
可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执
行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或
流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动
作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个
人计算机,人工智能服务器10,或者网络设备等)执行本申请各个实施例所述方法的全部或
部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、
随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的
介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他
性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且
还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的
要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述
要素的过程、方法、物品或者设备中还存在另外的相同要素。
改、等同替换、改进等,均应包含在本申请的保护范围之内。