确定文本情感的方法及装置转让专利

申请号 : CN201611219673.1

文献号 : CN108241682B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘乙霖陈晓敏刘嘉赵钰王雪纯栾睿

申请人 : 北京国双科技有限公司

摘要 :

本发明公开了一种确定文本情感的方法及装置。其中,该方法包括:获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别;对每个句子进行分词处理,提取每个句子的情感词;确定情感词在每个句子中的情感权重值;根据情感权重值确定关键词在包含关键词的句子中的隶属度;根据隶属度确定文本的情感类别。本发明解决了现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。

权利要求 :

1.一种确定文本情感的方法,其特征在于,包括:获取文本的关键词和所述文本包含的多个句子,并标注每个句子的情感类别以及情感级别;

对所述每个句子进行分词处理,提取所述每个句子的情感词;

确定所述情感词在所述每个句子中的情感权重值;

根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度;

根据所述隶属度确定所述文本的情感类别;

其中,根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度,包括:

根据所述情感权重值确定包含所述关键词的句子的情感类别;

根据包含所述关键词的句子的情感类别,确定所述关键词的情感级别,并通过如下公式确定所述关键词在包含所述关键词的句子中的隶属度:其中,所述W1为所述隶属度,所述V1为所述关键词的情感级别的权重值,所述∑Vi为所述关键词在所述情感级别中的权重值之和,所述α为所述关键词权重。

2.根据权利要求1所述的方法,其特征在于,所述情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,所述情感级别用于表征所述句子表达情感的强烈程度。

3.根据权利要求1所述的方法,其特征在于,确定所述情感词在所述每个句子中的情感权重值,包括:

计算所述情感词在所述每个句子中的个数;

计算包含所述情感词的句子中的词语总数;

根据所述情感词在所述每个句子中的个数以及包含所述情感词的句子中的词语总数确定所述情感词在所述每个句子中的情感权重值。

4.根据权利要求1所述的方法,其特征在于,根据所述隶属度确定所述文本的情感类别包括:

在至少一种所述情感类别中,对所述关键词在至少一个所述情感级别中的隶属度进行求和运算,并得到求和结果;

选取所述求和结果最大的情感类别为所述至少一个文本的情感。

5.一种确定文本情感的装置,其特征在于,包括:获取模块,用于获取文本的关键词和所述文本包含的多个句子,并标注每个句子的情感类别以及情感级别;

处理模块,用于对所述每个句子进行分词处理,提取所述每个句子的情感词;

第一计算模块,用于确定所述情感词在所述每个句子中的情感权重值;

第二计算模块,用于根据所述情感权重值确定所述关键词在包含所述关键词的句子中的隶属度;

判断模块,用于根据所述隶属度确定所述文本的情感类别;

其中,所述第二计算模块包括:

第四计算子模块,用于根据所述情感权重值确定包含所述关键词的句子的情感类别;

第五计算子模块,用于根据包含所述关键词的句子的情感类别,确定所述关键词的情感级别,并通过如下公式确定所述关键词在包含所述关键词的句子中的隶属度:其中,所述W1为所述隶属度,所述V1为所述关键词的情感级别的权重值,所述∑Vi为所述关键词在所述情感级别中的权重值之和,所述α为所述关键词权重。

6.根据权利要求5所述的装置,其特征在于,所述情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,所述情感级别用于表征所述句子表达情感的强烈程度。

7.根据权利要求5所述的装置,其特征在于,所述第一计算模块包括:第一计算子模块,用于计算所述情感词在所述每个句子中的个数;

第二计算子模块,用于计算包含所述情感词的句子中的词语总数;

第三计算子模块,用于根据所述情感词在所述每个句子中的个数以及包含所述情感词的句子中的词语总数确定所述情感词在所述每个句子中的情感权重值。

8.根据权利要求5所述的装置,其特征在于,所述判断模块包括:第六计算子模块,用于在至少一种所述情感类别中,对所述关键词在至少一个所述情感级别中的隶属度进行求和运算,并得到求和结果;

选取子模块,用于选取所述求和结果最大的情感类别为所述至少一个文本的情感。

说明书 :

确定文本情感的方法及装置

技术领域

[0001] 本发明涉及文本信息分析领域,具体而言,涉及一种确定文本情感的方法及装置。

背景技术

[0002] 随着互联网上的文本信息越来越丰富,对这些文本信息进行情感分析就显得尤其重要,利用情感分析这项技术,应用得当可以更好的反馈舆情,能够为公司或者机构根据客
户的情感反馈及时调整市场方向或改进产品提供支持。
[0003] 现有的文章情感判断方式是基于篇章中句子情感的正中负比例进行计算的。在情感判断的机器学习中,选择一些特征参数,基本是根据句子情感占比,进而判断篇章级别的
情感,若正面情感倾向的句子占比大,那该文章就被机器判断为正面情绪;若负面情感倾向
的句子占比大,那该文章就被机器判断为负面情绪;若中性情感倾向的句子占比大,那该文
章就被机器判断为中性情绪。基于句子情感所占比例的文章情感判断方式,文章的判断结
果基本是以某种情绪的句子比例在整篇文章中的占比决定的,这些句子通常不分主次,都
是按照相同的权重进行计算的。
[0004] 现有的这种做法忽略了情感所指向的主体,也即忽略了关键词所在的句子所表达的情感,导致了文本情感判断不准确的问题。
[0005] 针对上述的问题,目前尚未提出有效的解决方案。

发明内容

[0006] 本发明实施例提供了一种确定文本情感的方法及装置,以至少解决现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
[0007] 根据本发明实施例的一个方面,提供了一种确定文本情感的方法,包括:获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别;对每个句子
进行分词处理,提取每个句子的情感词;确定情感词在每个句子中的情感权重值;根据情感
权重值确定关键词在包含关键词的句子中的隶属度;根据隶属度确定文本的情感类别。
[0008] 根据本发明实施例的另一方面,还提供了一种确定文本情感的装置,包括:获取模块,用于获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感
级别;处理模块,用于对每个句子进行分词处理,提取每个句子的情感词;第一计算模块,用
于确定情感词在每个句子中的情感权重值;第二计算模块,用于根据情感权重值确定关键
词在包含关键词的句子中的隶属度;判断模块,用于根据隶属度确定文本的情感类别。
[0009] 在本发明实施例中,采用基于关键词加权的方式,通过获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别,对每个句子进行分词处理,提
取每个句子的情感词,进而确定情感词在每个句子中的情感权重值,再根据情感权重值确
定关键词在包含关键词的句子中的隶属度,进而根据隶属度确定文本的情感类别。达到了
有效判断文本情感的目的,从而实现了提高文本情感判断准确率的技术效果,进而解决了
现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。

附图说明

[0010] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0011] 图1是根据本发明实施例的一种确定文本情感的方法流程图;
[0012] 图2是根据本发明实施例的一种可选的确定文本情感的方法流程图;
[0013] 图3是根据本发明实施例的一种确定文本情感的装置示意图;
[0014] 图4是根据本发明实施例的一种可选的确定文本情感的装置示意图;
[0015] 图5是根据本发明实施例的一种可选的确定文本情感的装置示意图;以及
[0016] 图6是根据本发明实施例的一种可选的确定文本情感的装置示意图。

具体实施方式

[0017] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是
本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范
围。
[0018] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆
盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于
清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品
或设备固有的其它步骤或单元。
[0019] 实施例1
[0020] 根据本发明实施例,提供了一种确定文本情感的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽
然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出
或描述的步骤。
[0021] 图1是根据本发明实施例的一种确定文本情感的方法流程图,如图1所示,该方法包括如下步骤:
[0022] 步骤S102,获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别。
[0023] 具体的,在上述步骤S102中,上述关键词为文本情感所指向的主体,该关键词可以但不限于事件词、品牌词,例如,很多文本情感判断都需要基于某一个视角,那么这个视角
所提到的词就是文本情感判断的关键词。
[0024] 上述情感类别可以根据情感倾向进行划分,一般情况下,情感类别可以包含正面情绪、负面情绪和中性情绪,具体的,上述情感级别用于表征句子表达情感的强烈程度,在
一种可选的实施例中,正面情绪、负面情绪可以各设五种情感级别,由于中性情绪的特殊性
其情感级别可以设为一种。
[0025] 需要说明的是,可以由人工对网页文本进行处理以及对句子进行标注,也可以由机器处理及标注,此处不做具体限定。
[0026] 通过在待判断文本情感的网页文本中,获取事件词或品牌词,并把上述网页文本划分成句子,进而标注每个句子的情感类别以及情感级别,可以确定文本情感所指向的主
体,提高文本情感判断的针对性。
[0027] 步骤S104,对每个句子进行分词处理,提取每个句子的情感词。
[0028] 具体的,在上述步骤S104所限定的方案中,对文本中的每个句子进行分词处理,并从处理结果中提取每个句子的情感词,可以确定文本中所包含的情感词,进而判断出包含
情感词的每个句子的情感占比。
[0029] 例如,可以利用分词器对文本中的每个句子进行分词处理,得到分词结果,其中,上述分词结果中可能包含情感词,在分词结果中包含情感词的情况下,从分词结果中选取
每个句子中的情感词。
[0030] 步骤S106,确定情感词在每个句子中的情感权重值。
[0031] 在上述步骤S106中,可以通过计算情感词的词语频次来确定出情感词在每个句子中的情感权重值,具体的,可以根据情感词在每个句子中的个数以及包含情感词的句子中
的词语总数来确定情感词在每个句子中的情感权重值。
[0032] 在一种可选的实施例中,可以从正面情绪、负面情绪、中性情绪三个情感类别分别进行计算,以情感类别为正面情绪为例,可以基于情感词的词语频次,计算在正面情绪的句
子中每个情感词对于判断这个句子为正面情绪的权重,在情感类别为负面情绪、中性情绪
的情况下,计算情感词在每个句子中的情感权重值的方法与上述情感类别为正面情绪的计
算方法一样,此处不再叙述。
[0033] 通过上述步骤S106,可以有效提高文本中句子的情感判断的准确率,进而可以提高文本情感判断的准确率。
[0034] 步骤S108,根据情感权重值确定关键词在包含关键词的句子中的隶属度。
[0035] 具体的,在上述步骤S108中,可以通过对包含关键词的句子的情感再一次加权重的计算方法来确定关键词在包含关键词的句子中的隶属度。
[0036] 在一种可选的实施例中,若关键词“阳光”在各个情感类别的情感级别中出现的频率为Vpos1,Vpos2,Vpos3,Vpos4,Vpos5;Vneu;Vneg1,Vneg2,Vneg3,Vneg4,Vneg5。则关键词
“阳光”对包含“阳光”的句子情感级别pos1的隶属度为W1pos1。
[0037] 在上述步骤S108所限定的方案中,在得到情感词在每个句子中的情感权重值基础上,根据情感权重值对包含关键词的句子的情感再一次加权重,进而确定了关键词在包含
关键词的句子中的隶属度,通过上述步骤可以有效区分既包含关键词又包含情感词的句子
与只包含情感词的句子所表达的情感强烈程度。在一个句子中同时出现关键词与情感词的
情况下,则增加该句子的情感权重,从而提升了文本情感判断的准确率。
[0038] 步骤S110,根据隶属度确定文本的情感类别。
[0039] 具体的,在上述步骤S110中,可以根据计算关键词在包含关键词的句子中的隶属度,来确定整个文本的情感类别。
[0040] 下面以一个文本为例进行说明,例如:在文本“美系车的特点是马力大,自重大,加速性能好,崇尚安全与安静,车身宽大、舒适。而日本车比较单薄,在其省油的同时也牺牲了
安全性。”中获取到的关键词为:日本车,分析可知:上述文本中正面情绪的句子占比大,若
按照现有的情感判断方式多被判断为正面情感。但此文本的关键词为“日本车”,且关键词
“日本车”所在句子的情感为负面情绪。在此情况下,在得到文本中的关键词所在句子情感
权重值基础上,对关键词“日本车”所在句子再一次加权,选取隶属度最大的情感类别为文
本情感的情感类别,得到此文本情感为负面情感的判断结果。本申请上述步骤有效提高了
文本情感判断的准确率。
[0041] 此处需要说明的是,在确定文本的情感类别之后,可以根据文本的长度对整个文本进行情感值的修正,以提高整个文本的情感判断的准确率。
[0042] 在本发明实施例中,采用基于关键词加权的方式,通过获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别,对每个句子进行分词处理,提
取每个句子的情感词,进而确定情感词在每个句子中的情感权重值,再根据情感权重值确
定关键词在包含关键词的句子中的隶属度,进而根据隶属度确定文本的情感类别。达到了
有效判断文本情感的目的,从而实现了提高文本情感判断准确率的技术效果,进而解决了
现有的文本情感判断方式存在忽略关键词导致判断不准确的的技术问题。
[0043] 基于上述步骤S102至步骤S110提供的方案,本申请还提供了如下优选的方案:
[0044] 可选的,情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,情感级别用于表征句子表达情感的强烈程度。
[0045] 具体的,上述情感类别可以包含正面情绪、负面情绪和中性情绪,其中,情感类别可以根据情感倾向进行划分,例如,若正面情感倾向的词语占比大,那该句子就被机器判断
为正面情绪;若负面情感倾向的词语占比大,那该句子就被机器判断为负面情绪;若中性情
感倾向的词语占比大,那该句子就被机器判断为中性情绪。
[0046] 上述情感级别用于表征句子表达情感的强烈程度,在一种可选的实施例中,正面情绪、负面情绪可以各设五种情感级别,由于中性情绪的特殊性其情感级别可以设为一种。
具体的,情感级别所要表达的情感强烈程度可以按数字大小区分,其中,数字越大情感级别
越高,所要表达的情感也越强烈。
[0047] 在一种可选的实施例中,情感类别可设为正面情绪、负面情绪和中性情绪。其中,正面情绪、负面情绪可以各设五种情感级别,由于中性情绪的特殊性其情感级别可以为一
种。通过上述划分,进而可以得到上述三种情感类别的情感级别,其中,正面情绪:pos1,
pos2,pos3,pos4,pos5,中性情绪:neu,负面情绪:neg1,neg2,neg3,neg4,neg5。
[0048] 需要说明的是,以上只是举例说明,本申请并不局限于计算以上三种情感类别、十一种情感级别的情况,根据实际需要可以对计算中的情感类别和情感级别进行添加或删
除。
[0049] 可选的,图2是根据本发明实施例的一种可选的确定文本情感的方法流程图,如图2所示,在执行步骤S106,即确定情感词在每个句子中的情感权重值,该方法包括如下步骤:
[0050] 步骤S202,计算情感词在每个句子中的个数。
[0051] 步骤S204,计算包含情感词的句子中的词语总数。
[0052] 步骤S206,根据情感词在每个句子中的个数以及包含情感词的句子中的词语总数确定情感词在每个句子中的情感权重值。
[0053] 具体的,在上述步骤S202至步骤S206中,可以通过计算情感词的词语频次来确定出情感词在每个句子中的情感权重值,具体的,在将待确定情感的文本划分为句子之后,划
分后的每个句子中可能包含情感词,在任意一个句子包含有情感词的情况下,可以先计算
出任意一个情感词在每个句子中的个数,再对包含情感词的句子中的词语总数进行计算,
得到两个计算结果后,可以将情感词在每个句子中的个数比上包含情感词的句子中的词语
总数,进而确定情感词在每个句子中的情感权重值。
[0054] 在一种可选的实施例中,可以从正面情绪、负面情绪、中性情绪三个情感类别分别进行计算,以情感类别为正面情绪为例,可以利用情感词的词语频次比上包含情感词的句
子中的词语总数,计算在正面情绪的句子中每个情感词对于判断这个句子为正面情绪的权
重,在情感类别为负面情绪、中性情绪的情况下,计算情感词在每个句子中的情感权重值的
方法与上述情感类别为正面情绪的计算方法一样,此处不再叙述。
[0055] 通过上述步骤S202至步骤S206,可以有效提高文本中句子的情感判断的准确率,进而可以提高文本情感判断的准确率。
[0056] 可选的,在执行步骤S108,即根据情感权重值确定关键词在包含关键词的句子中的隶属度,该方法包括如下步骤:
[0057] 步骤S302,根据情感权重值确定包含关键词的句子的情感类别。
[0058] 步骤S304,根据包含关键词的句子的情感类别,确定关键词的情感级别,并通过如下公式确定关键词在包含关键词的句子中的隶属度:
[0059]
[0060] 其中,W1为隶属度,V1为关键词的情感级别的权重值,∑Vi为关键词在情感级别中的权重值之和,α为关键词权重。
[0061] 具体的,在上述步骤S302至步骤S306中,在得到情感权重值的基础上,可以根据对文本进行处理时所做的标注来确定包含关键词的句子的情感类别,在得到情感类别之后,
可以确定出关键词的情感级别。
[0062] 进一步的,通过对包含关键词的句子的情感再一次加权重,并确定关键词在包含关键词的句子中的隶属度,进而确定关键词在包含关键词的句子中的隶属度。
[0063] 通过上述步骤S302至步骤S306,可以有效区分既包含关键词又包含情感词的句子与只包含情感词的句子所表达的情感强烈程度。在一个句子中同时出现关键词与情感词的
情况下,则增加该句子的情感权重并确定关键词在包含关键词的句子中的隶属度从而提升
了文本情感判断的准确率。
[0064] 可选的,在执行步骤S110,即根据隶属度确定文本的情感类别根据隶属度确定文本的情感类别,该方法包括如下步骤:
[0065] 步骤S402,在至少一种情感类别中,对关键词在至少一个情感级别中的隶属度进行求和运算,并得到求和结果。
[0066] 步骤S404,选取求和结果最大的情感类别为至少一个文本的情感。
[0067] 具体的,在上述步骤S402至步骤S404中,在得到关键词在包含关键词的句子中的隶属度的情况下,可以根据情感类别的不同,分别对关键词在每一种情感级别中的隶属度
进行求和运算,并得到每一种情感级别的求和结果。由于情感级别不唯一,可以在文本所包
含的情感级别中选取求和结果最大的一个情感类别,则此情感类别所表征的情感倾向为文
本的情感。
[0068] 在本申请上述实施例中,通过上述步骤S402至步骤S404,增加了既包含关键词又包含情感词的句子的情感强烈程度,达到了有效判断文本情感的目的,从而实现了提高文
本情感判断准确率的技术效果。
[0069] 此处需要说明的是,在确定文本的情感类别之后,可以根据文本的长度对整个文本进行情感值的修正,以提高整个文本的情感判断的准确率。
[0070] 实施例2
[0071] 根据本发明实施例,还提供了一种确定文本情感的装置实施例。
[0072] 图3是根据本发明实施例的一种确定文本情感的装置示意图,如图3所示,在一种可选的实施例中,该装置包括:获取模块30、处理模块32、第一计算模块34、第二计算模块
36、判断模块38。
[0073] 其中,获取模块30,用于获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别;处理模块32,用于对每个句子进行分词处理,提取每个句子的
情感词;第一计算模块34,用于确定情感词在每个句子中的情感权重值;第二计算模块36,
用于根据情感权重值确定关键词在包含关键词的句子中的隶属度;判断模块38,用于根据
隶属度确定文本的情感类别。
[0074] 在本发明实施例中,采用基于关键词加权的方式,通过获取模块来获取文本的关键词和文本包含的多个句子,并标注每个句子的情感类别以及情感级别,处理模块对每个
句子进行分词处理,提取每个句子的情感词,第一计算模块,用于确定情感词在每个句子中
的情感权重值,第二计算模块,用于根据情感权重值确定关键词在包含关键词的句子中的
隶属度,判断模块,用于根据隶属度确定文本的情感类别,达到了有效判断文本情感的目
的,从而实现了提高文本情感判断准确率的技术效果,进而解决了现有的文本情感判断方
式存在忽略关键词导致判断不准确的的技术问题。
[0075] 此处需要说明的是,上述获取模块30、处理模块32、第一计算模块34、第二计算模块36、判断模块38对应于实施例一中的步骤S102至步骤S110,上述模块与对应的步骤所实
现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块
作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
[0076] 基于上述实施例提供的方案,本申请还提供了如下优选方案:
[0077] 可选的,情感类别至少包括如下之一:正面情绪、负面情绪和中性情绪,情感级别用于表征句子表达情感的强烈程度。
[0078] 具体的,上述情感类别可以包含正面情绪、负面情绪和中性情绪,其中,情感类别可以根据情感倾向进行划分,例如,若正面情感倾向的词语占比大,那该句子就被机器判断
为正面情绪;若负面情感倾向的词语占比大,那该句子就被机器判断为负面情绪;若中性情
感倾向的词语占比大,那该句子就被机器判断为中性情绪。
[0079] 具体的,上述情感级别用于表征句子表达情感的强烈程度,在一种可选的实施例中,正面情绪、负面情绪可以各设五种情感级别,由于中性情绪的特殊性其情感级别可以设
为一种。具体的,情感级别所要表达的情感强烈程度可以按数字大小区分,其中,数字越大
情感级别越高,所要表达的情感也越强烈。
[0080] 在一种可选的实施例中,情感类别可设为正面情绪、负面情绪和中性情绪。其中,正面情绪、负面情绪可以各设五种情感级别,由于中性情绪的特殊性其情感级别可以为一
种。通过上述划分,进而可以得到上述三种情感类别的情感级别,其中,正面情绪:pos1,
pos2,pos3,pos4,pos5,中性情绪:neu,负面情绪:neg1,neg2,neg3,neg4,neg5。
[0081] 需要说明的是,以上只是举例说明,本申请并不局限于计算以上三种情感类别、十一种情感级别的情况,根据实际需要可以对计算中的情感类别和情感级别进行添加或删
除。
[0082] 可选的,图4是根据本发明实施例的一种可选的确定文本情感的装置示意图,如图4所示,在一种可选的实施例中,第一计算模块34包括:第一计算子模块40、第二计算子模块
42、第三计算子模块44。
[0083] 其中,第一计算子模块40,用于计算情感词在每个句子中的个数;第二计算子模块42,用于计算包含情感词的句子中的词语总数;第三计算子模块44,用于根据情感词在每个
句子中的个数以及包含情感词的句子中的词语总数确定情感词在每个句子中的情感权重
值。
[0084] 此处需要说明的是,上述第一计算子模块40、第二计算子模块42、第三计算子模块44对应于实施例一中的步骤S202至步骤S204,上述模块与对应的步骤所实现的示例和应用
场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部
分可以在诸如一组计算机可执行指令的计算机系统中执行。
[0085] 可选的,图5是根据本发明实施例的一种可选的确定文本情感的装置示意图,如图5所示,在一种可选的实施例中,第二计算模块36包括:第四计算子模块50、第五计算子模块
52。
[0086] 其中,第四计算子模块50,用于根据情感权重值确定包含关键词的句子的情感类别;第五计算子模块52,用于根据包含关键词的句子的情感类别,确定关键词的情感级别,
并通过如下公式确定关键词在包含关键词的句子中的隶属度:
[0087]
[0088] 其中,W1为隶属度,V1为关键词的情感级别的权重值,∑Vi为关键词在情感级别中的权重值之和,α为关键词权重。
[0089] 此处需要说明的是,上述第四计算子模块50、第五计算子模块52对应于实施例一中的步骤S302至步骤S304,上述模块与对应的步骤所实现的示例和应用场景相同,但不限
于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一
组计算机可执行指令的计算机系统中执行。
[0090] 可选的,图6是根据本发明实施例的一种可选的确定文本情感的装置示意图,如图6所示,在一种可选的实施例中,判断模块38包括:第六计算子模块60、选取子模块62。
[0091] 其中,第六计算子模块60,用于在至少一种情感类别中,对关键词在至少一个情感级别中的隶属度进行求和运算,并得到求和结果;选取子模块62,用于选取求和结果最大的
情感类别为至少一个文本的情感。
[0092] 此处需要说明的是,上述第六计算子模块60、选取子模块62对应于实施例一中的步骤S402至步骤S404,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上
述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计
算机可执行指令的计算机系统中执行。
[0093] 上述确定文本情感的装置包括处理器和存储器,上述获取模块、处理模块、第一计算模块、第二计算模块和判断模块等等均作为程序单元存储在存储器中,由处理器执行存
储在存储器中的上述程序单元。上述文本、计算公式都可以存储在存储器中。
[0094] 处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解析文本内容。
[0095] 存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存
储芯片。
[0096] 本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取文本的关键词和文本包含的多个句子,并
标注每个句子的情感类别以及情感级别;对每个句子进行分词处理,提取每个句子的情感
词;确定情感词在每个句子中的情感权重值;根据情感权重值确定关键词在包含关键词的
句子中的隶属度;根据隶属度确定文本的情感类别。
[0097] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0098] 在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0099] 在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为
一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或
者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互
之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连
接,可以是电性或其它的形式。
[0100] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0101] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0102] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上
或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式
体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机
设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或
部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read‑Only Memory)、随机存取存
储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的
介质。
[0103] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应
视为本发明的保护范围。