确定文本情感的方法及装置转让专利
申请号 : CN201611219673.1
文献号 : CN108241682B
文献日 : 2021-03-30
发明人 : 刘乙霖 , 陈晓敏 , 刘嘉 , 赵钰 , 王雪纯 , 栾睿
申请人 : 北京国双科技有限公司
摘要 :
权利要求 :
1.一种确定文本情感的方法,其特征在于,包括:获取文本的关键词和所述文本包含的多个句子,并标注每个句子的情感类别以及情感级别;
对所述每个句子进行分词处理,提取所述每个句子的情感词;
确定所述情感词在所述每个句子中的情感权重值;
根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度;
根据所述隶属度确定所述文本的情感类别;
其中,根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度,包括:
根据所述情感权重值确定包含所述关键词的句子的情感类别;
根据包含所述关键词的句子的情感类别,确定所述关键词的情感级别,并通过如下公式确定所述关键词在包含所述关键词的句子中的隶属度:其中,所述W1为所述隶属度,所述V1为所述关键词的情感级别的权重值,所述∑Vi为所述关键词在所述情感级别中的权重值之和,所述α为所述关键词权重。
2.根据权利要求1所述的方法,其特征在于,所述情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,所述情感级别用于表征所述句子表达情感的强烈程度。
3.根据权利要求1所述的方法,其特征在于,确定所述情感词在所述每个句子中的情感权重值,包括:
计算所述情感词在所述每个句子中的个数;
计算包含所述情感词的句子中的词语总数;
根据所述情感词在所述每个句子中的个数以及包含所述情感词的句子中的词语总数确定所述情感词在所述每个句子中的情感权重值。
4.根据权利要求1所述的方法,其特征在于,根据所述隶属度确定所述文本的情感类别包括:
在至少一种所述情感类别中,对所述关键词在至少一个所述情感级别中的隶属度进行求和运算,并得到求和结果;
选取所述求和结果最大的情感类别为所述至少一个文本的情感。
5.一种确定文本情感的装置,其特征在于,包括:获取模块,用于获取文本的关键词和所述文本包含的多个句子,并标注每个句子的情感类别以及情感级别;
处理模块,用于对所述每个句子进行分词处理,提取所述每个句子的情感词;
第一计算模块,用于确定所述情感词在所述每个句子中的情感权重值;
第二计算模块,用于根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度;
判断模块,用于根据所述隶属度确定所述文本的情感类别;
其中,所述第二计算模块包括:
第四计算子模块,用于根据所述情感权重值确定包含所述关键词的句子的情感类别;
第五计算子模块,用于根据包含所述关键词的句子的情感类别,确定所述关键词的情感级别,并通过如下公式确定所述关键词在包含所述关键词的句子中的隶属度:其中,所述W1为所述隶属度,所述V1为所述关键词的情感级别的权重值,所述∑Vi为所述关键词在所述情感级别中的权重值之和,所述α为所述关键词权重。
6.根据权利要求5所述的装置,其特征在于,所述情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,所述情感级别用于表征所述句子表达情感的强烈程度。
7.根据权利要求5所述的装置,其特征在于,所述第一计算模块包括:第一计算子模块,用于计算所述情感词在所述每个句子中的个数;
第二计算子模块,用于计算包含所述情感词的句子中的词语总数;
第三计算子模块,用于根据所述情感词在所述每个句子中的个数以及包含所述情感词的句子中的词语总数确定所述情感词在所述每个句子中的情感权重值。
8.根据权利要求5所述的装置,其特征在于,所述判断模块包括:第六计算子模块,用于在至少一种所述情感类别中,对所述关键词在至少一个所述情感级别中的隶属度进行求和运算,并得到求和结果;
选取子模块,用于选取所述求和结果最大的情感类别为所述至少一个文本的情感。
说明书 :
确定文本情感的方法及装置
技术领域
背景技术
户的情感反馈及时调整市场方向或改进产品提供支持。
情感,若正面情感倾向的句子占比大,那该文章就被机器判断为正面情绪;若负面情感倾向
的句子占比大,那该文章就被机器判断为负面情绪;若中性情感倾向的句子占比大,那该文
章就被机器判断为中性情绪。基于句子情感所占比例的文章情感判断方式,文章的判断结
果基本是以某种情绪的句子比例在整篇文章中的占比决定的,这些句子通常不分主次,都
是按照相同的权重进行计算的。
发明内容
进行分词处理,提取每个句子的情感词;确定情感词在每个句子中的情感权重值;根据情感
权重值确定关键词在包含关键词的句子中的隶属度;根据隶属度确定文本的情感类别。
级别;处理模块,用于对每个句子进行分词处理,提取每个句子的情感词;第一计算模块,用
于确定情感词在每个句子中的情感权重值;第二计算模块,用于根据情感权重值确定关键
词在包含关键词的句子中的隶属度;判断模块,用于根据隶属度确定文本的情感类别。
取每个句子的情感词,进而确定情感词在每个句子中的情感权重值,再根据情感权重值确
定关键词在包含关键词的句子中的隶属度,进而根据隶属度确定文本的情感类别。达到了
有效判断文本情感的目的,从而实现了提高文本情感判断准确率的技术效果,进而解决了
现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
附图说明
具体实施方式
本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范
围。
的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆
盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于
清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品
或设备固有的其它步骤或单元。
然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出
或描述的步骤。
所提到的词就是文本情感判断的关键词。
一种可选的实施例中,正面情绪、负面情绪可以各设五种情感级别,由于中性情绪的特殊性
其情感级别可以设为一种。
体,提高文本情感判断的针对性。
情感词的每个句子的情感占比。
每个句子中的情感词。
的词语总数来确定情感词在每个句子中的情感权重值。
子中每个情感词对于判断这个句子为正面情绪的权重,在情感类别为负面情绪、中性情绪
的情况下,计算情感词在每个句子中的情感权重值的方法与上述情感类别为正面情绪的计
算方法一样,此处不再叙述。
“阳光”对包含“阳光”的句子情感级别pos1的隶属度为W1pos1。
关键词的句子中的隶属度,通过上述步骤可以有效区分既包含关键词又包含情感词的句子
与只包含情感词的句子所表达的情感强烈程度。在一个句子中同时出现关键词与情感词的
情况下,则增加该句子的情感权重,从而提升了文本情感判断的准确率。
安全性。”中获取到的关键词为:日本车,分析可知:上述文本中正面情绪的句子占比大,若
按照现有的情感判断方式多被判断为正面情感。但此文本的关键词为“日本车”,且关键词
“日本车”所在句子的情感为负面情绪。在此情况下,在得到文本中的关键词所在句子情感
权重值基础上,对关键词“日本车”所在句子再一次加权,选取隶属度最大的情感类别为文
本情感的情感类别,得到此文本情感为负面情感的判断结果。本申请上述步骤有效提高了
文本情感判断的准确率。
取每个句子的情感词,进而确定情感词在每个句子中的情感权重值,再根据情感权重值确
定关键词在包含关键词的句子中的隶属度,进而根据隶属度确定文本的情感类别。达到了
有效判断文本情感的目的,从而实现了提高文本情感判断准确率的技术效果,进而解决了
现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
为正面情绪;若负面情感倾向的词语占比大,那该句子就被机器判断为负面情绪;若中性情
感倾向的词语占比大,那该句子就被机器判断为中性情绪。
具体的,情感级别所要表达的情感强烈程度可以按数字大小区分,其中,数字越大情感级别
越高,所要表达的情感也越强烈。
种。通过上述划分,进而可以得到上述三种情感类别的情感级别,其中,正面情绪:pos1,
pos2,pos3,pos4,pos5,中性情绪:neu,负面情绪:neg1,neg2,neg3,neg4,neg5。
除。
分后的每个句子中可能包含情感词,在任意一个句子包含有情感词的情况下,可以先计算
出任意一个情感词在每个句子中的个数,再对包含情感词的句子中的词语总数进行计算,
得到两个计算结果后,可以将情感词在每个句子中的个数比上包含情感词的句子中的词语
总数,进而确定情感词在每个句子中的情感权重值。
子中的词语总数,计算在正面情绪的句子中每个情感词对于判断这个句子为正面情绪的权
重,在情感类别为负面情绪、中性情绪的情况下,计算情感词在每个句子中的情感权重值的
方法与上述情感类别为正面情绪的计算方法一样,此处不再叙述。
可以确定出关键词的情感级别。
情况下,则增加该句子的情感权重并确定关键词在包含关键词的句子中的隶属度从而提升
了文本情感判断的准确率。
进行求和运算,并得到每一种情感级别的求和结果。由于情感级别不唯一,可以在文本所包
含的情感级别中选取求和结果最大的一个情感类别,则此情感类别所表征的情感倾向为文
本的情感。
本情感判断准确率的技术效果。
36、判断模块38。
情感词;第一计算模块34,用于确定情感词在每个句子中的情感权重值;第二计算模块36,
用于根据情感权重值确定关键词在包含关键词的句子中的隶属度;判断模块38,用于根据
隶属度确定文本的情感类别。
句子进行分词处理,提取每个句子的情感词,第一计算模块,用于确定情感词在每个句子中
的情感权重值,第二计算模块,用于根据情感权重值确定关键词在包含关键词的句子中的
隶属度,判断模块,用于根据隶属度确定文本的情感类别,达到了有效判断文本情感的目
的,从而实现了提高文本情感判断准确率的技术效果,进而解决了现有的文本情感判断方
式存在忽略关键词导致判断不准确的的技术问题。
现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块
作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
为正面情绪;若负面情感倾向的词语占比大,那该句子就被机器判断为负面情绪;若中性情
感倾向的词语占比大,那该句子就被机器判断为中性情绪。
为一种。具体的,情感级别所要表达的情感强烈程度可以按数字大小区分,其中,数字越大
情感级别越高,所要表达的情感也越强烈。
种。通过上述划分,进而可以得到上述三种情感类别的情感级别,其中,正面情绪:pos1,
pos2,pos3,pos4,pos5,中性情绪:neu,负面情绪:neg1,neg2,neg3,neg4,neg5。
除。
42、第三计算子模块44。
句子中的个数以及包含情感词的句子中的词语总数确定情感词在每个句子中的情感权重
值。
场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部
分可以在诸如一组计算机可执行指令的计算机系统中执行。
52。
并通过如下公式确定关键词在包含关键词的句子中的隶属度:
于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一
组计算机可执行指令的计算机系统中执行。
情感类别为至少一个文本的情感。
述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计
算机可执行指令的计算机系统中执行。
储在存储器中的上述程序单元。上述文本、计算公式都可以存储在存储器中。
储芯片。
标注每个句子的情感类别以及情感级别;对每个句子进行分词处理,提取每个句子的情感
词;确定情感词在每个句子中的情感权重值;根据情感权重值确定关键词在包含关键词的
句子中的隶属度;根据隶属度确定文本的情感类别。
一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或
者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互
之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连
接,可以是电性或其它的形式。
单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式
体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机
设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或
部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read‑Only Memory)、随机存取存
储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的
介质。
视为本发明的保护范围。