一种文本情绪分析方法、装置及设备转让专利

申请号 : CN201910554005.1

文献号 : CN110276076A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 单斌

申请人 : 北京奇艺世纪科技有限公司

摘要 :

本发明提供了文本情绪分析方法、装置及设备,先将待处理文本转换为对应的文本向量,再将文本向量输入至预选训练得到的文本情绪分类模型得到该待处理文本的目标情绪类别。其中文本情绪分类模型包括特征提取网络和分类网络,利用特征提取网络从文本向量中提取得到能够表征待处理文本的语义内容的语义特征向量并输入至分类网络;再由分类网络对语义特征向量进行分析最终得到该待处理文本的目标情绪类别。其中,文本情绪分类模型预先利用文本训练样本训练后能够输出细粒度情绪的类别,如高兴、悲伤、生气、喜欢、惊讶、平淡等。与只能输出情绪极性的方案相比,该装置能够识别出待处理文本所表达的细粒度情绪,同时扩大了文本情绪分析方法的应用范围。

权利要求 :

1.一种文本情绪分析方法,其特征在于,包括:

基于词向量模型,将所述待处理文本映射为文本向量;

基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;

基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。

2.根据权利要求1所述的方法,其特征在于,所述基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别,包括:基于所述分类网络,分析所述语义特征向量得到所述待处理文本属于各个预设情绪类别的置信度;

选取置信度最大的预设情绪类别为所述待处理文本所属的目标情绪类别。

3.根据权利要求1所述的方法,其特征在于,训练所述文本情绪分类模型的过程,包括:获取标注有预设情绪类别的文本训练样本;

基于词向量模型将所述文本训练样本转换为对应的文本训练样本向量;

基于预设文本情绪分类模型中的基于注意力机制的单层双向GRU网络,从所述文本训练样本向量中提取得到语义特征向量;

基于所述预设文本情绪分类模型中的分类网络,对所述文本训练样本向量的语义特征向量进行分析得到所述文本训练样本所属情绪类别的分类结果;

基于所述文本训练样本的分类结果和标注类别,调整所述预设文本情绪分类模型中的模型参数,直到利用调整后的文本情绪分类模型分析所述文本训练样本得到的分类结果满足预设收敛条件,得到所述文本情绪分类模型。

4.根据权利要求3所述的方法,其特征在于,所述获取已标注情绪类别的文本训练样本,包括:获取预标注数据,所述预标注数据中包含表征文本情绪的情绪标识;

利用所述预标注数据训练预设文本情绪分类模型得到基础分类模型;

基于所述基础分类模型获得各个候选文本训练样本所属情绪类别的置信度;

依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本。

5.根据权利要求4所述的方法,其特征在于,所述依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本,包括:选取分类结果中最大置信度大于置信度阈值的候选文本训练样本为所述文本训练样本。

6.一种文本情绪分析装置,其特征在于,包括:

向量转换模块,用于基于词向量模型,将所述待处理文本映射为文本向量;

特征提取模块,用于基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;

分类模块,用于基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。

7.根据权利要求6所述的装置,其特征在于,所述分类模块包括:置信度获取子模块,用于基于所述分类网络,分析所述语义特征向量得到所述待处理文本属于各个预设情绪类别的置信度;

选取子模块,用于选取置信度最大的预设情绪类别为所述待处理文本所属的目标情绪类别。

8.根据权利要求6所述的装置,其特征在于,所述装置还包括:样本获取模块,用于获取标注有预设情绪类别的文本训练样本;

样本向量转换模块,用于基于词向量模型将所述文本训练样本转换为对应的文本训练样本向量;

样本特征提取模块,用于基于预设文本情绪分类模型中的基于注意力机制的单层双向GRU网络,从所述文本训练样本向量中提取得到语义特征向量;

样本分类模块,用于基于所述预设文本情绪分类模型中的分类网络,对所述文本训练样本向量的语义特征向量进行分析得到所述文本训练样本所属情绪类别的分类结果;

模型参数调整模块,用于基于所述文本训练样本的分类结果和标注类别,调整所述预设文本情绪分类模型中的模型参数,直到利用调整后的文本情绪分类模型分析所述文本训练样本得到的分类结果满足预设收敛条件,得到所述文本情绪分类模型。

9.根据权利要求8所述的装置,其特征在于,所述样本获取模块,包括:第一获取子模块,用于获取预标注数据,所述预标注数据中包含表征文本情绪的情绪标识;

基础模型训练子模块,用于利用所述预标注数据训练预设文本情绪分类模型得到基础分类模型;

分类子模块,用于基于所述基础分类模型获得各个候选文本训练样本所属情绪类别的置信度;

选取子模块,用于依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本。

10.根据权利要求9所述的装置,其特征在于,所述选取子模块具体用于:选取分类结果中最大置信度大于置信度阈值的候选文本训练样本为所述文本训练样本。

11.一种设备,其特征在于,包括存储器和处理器,其中,所述处理器执行所述存储器中存储的程序;

所述存储器用于存储程序,所述程序至少用于:

基于词向量模型,将所述待处理文本映射为文本向量;

基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;

基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。

说明书 :

一种文本情绪分析方法、装置及设备

技术领域

[0001] 本发明属于计算机技术领域,尤其涉及文本情绪分析方法、装置及设备。

背景技术

[0002] 文本情绪分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,通过对文本进行分析得到人们在文本中表达的观点、情绪。文本情绪分析作为自然语言处理的一个重要应用领域,广泛应用到舆情分析等众多领域。
[0003] 目前的文本情绪分析主要集中在正负向情绪的分析上,即,用来分析自然语言所表达的情绪是积极情绪(正向)还是消极情绪(负向);或者,还包括中立情绪。这种文本情绪分析方法只分析正向、负向、中立等情绪的极性,无法得到自然语言中更丰富的情绪表达,因此,需要粒度更细的情绪分析方法。

发明内容

[0004] 有鉴于此,本发明的目的在于提供文本情绪分析方法、装置及设备,以解决传统的文本情绪分析方法只能分析文本情绪的极性,无法得到细粒度的情绪类别的问题。其具体的技术方案如下:
[0005] 一方面,本发明提供了一种文本情绪分析方法,包括:
[0006] 基于词向量模型,将所述待处理文本映射为文本向量;
[0007] 基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;
[0008] 基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。
[0009] 在一方面一种可能的实现方式中,所述基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别,包括:
[0010] 基于所述分类网络,分析所述语义特征向量得到所述待处理文本属于各个预设情绪类别的置信度;
[0011] 选取置信度最大的预设情绪类别为所述待处理文本所属的目标情绪类别。
[0012] 在一方面另一种可能的实现方式中,训练所述文本情绪分类模型的过程,包括:
[0013] 获取标注有预设情绪类别的文本训练样本;
[0014] 基于词向量模型将所述文本训练样本转换为对应的文本训练样本向量;
[0015] 基于预设文本情绪分类模型中的基于注意力机制的单层双向GRU网络,从所述文本训练样本向量中提取得到语义特征向量;
[0016] 基于所述预设文本情绪分类模型中的分类网络,对所述文本训练样本向量的语义特征向量进行分析得到所述文本训练样本所属情绪类别的分类结果;
[0017] 基于所述文本训练样本的分类结果和标注类别,调整所述预设文本情绪分类模型中的模型参数,直到利用调整后的文本情绪分类模型分析所述文本训练样本得到的分类结果满足预设收敛条件,得到所述文本情绪分类模型。
[0018] 在一方面又一种可能的实现方式中,所述获取已标注情绪类别的文本训练样本,包括:
[0019] 获取预标注数据,所述预标注数据中包含表征文本情绪的情绪标识;
[0020] 利用所述预标注数据训练预设文本情绪分类模型得到基础分类模型;
[0021] 基于所述基础分类模型获得各个候选文本训练样本所属情绪类别的置信度;
[0022] 依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本。
[0023] 在一方面再一种可能的实现方式中,所述依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本,包括:
[0024] 选取分类结果中最大置信度大于置信度阈值的候选文本训练样本为所述文本训练样本。
[0025] 另一方面,本发明还提供了一种文本情绪分析装置,包括:
[0026] 向量转换模块,用于基于词向量模型,将所述待处理文本映射为文本向量;
[0027] 特征提取模块,用于基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;
[0028] 分类模块,用于基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。
[0029] 在另一方面一种可能的实现方式中,所述分类模块包括:
[0030] 置信度获取子模块,用于基于所述分类网络,分析所述语义特征向量得到所述待处理文本属于各个预设情绪类别的置信度;
[0031] 选取子模块,用于选取置信度最大的预设情绪类别为所述待处理文本所属的目标情绪类别。
[0032] 在另一方面另一种可能的实现方式中,所述装置还包括:
[0033] 样本获取模块,用于获取标注有预设情绪类别的文本训练样本;
[0034] 样本向量转换模块,用于基于词向量模型将所述文本训练样本转换为对应的文本训练样本向量;
[0035] 样本特征提取模块,用于基于预设文本情绪分类模型中的基于注意力机制的单层双向GRU网络,从所述文本训练样本向量中提取得到语义特征向量;
[0036] 样本分类模块,用于基于所述预设文本情绪分类模型中的分类网络,对所述文本训练样本向量的语义特征向量进行分析得到所述文本训练样本所属情绪类别的分类结果;
[0037] 模型参数调整模块,用于基于所述文本训练样本的分类结果和标注类别,调整所述预设文本情绪分类模型中的模型参数,直到利用调整后的文本情绪分类模型分析所述文本训练样本得到的分类结果满足预设收敛条件,得到所述文本情绪分类模型。
[0038] 在另一方面又一种可能的实现方式中,所述样本获取模块,包括:
[0039] 第一获取子模块,用于获取预标注数据,所述预标注数据中包含表征文本情绪的情绪标识;
[0040] 基础模型训练子模块,用于利用所述预标注数据训练预设文本情绪分类模型得到基础分类模型;
[0041] 分类子模块,用于基于所述基础分类模型获得各个候选文本训练样本所属情绪类别的置信度;
[0042] 选取子模块,用于依据各个候选文本训练样本所属情绪类别的置信度,从所述各个候选文本训练样本中选取得到所述文本训练样本。
[0043] 在另一方面再一种可能的实现方式中,所述选取子模块具体用于:
[0044] 选取分类结果中最大置信度大于置信度阈值的候选文本训练样本为所述文本训练样本。
[0045] 又一方面,本发明提供了一种设备,包括存储器和处理器,其中,所述处理器执行所述存储器中存储的程序;
[0046] 所述存储器用于存储程序,所述程序至少用于:
[0047] 基于词向量模型,将所述待处理文本映射为文本向量;
[0048] 基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;
[0049] 基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。
[0050] 本发明提供的文本情绪分析方法,先将待处理文本转换为对应的文本向量,再将文本向量输入至预选训练得到的文本情绪分类模型得到该待处理文本的目标情绪类别。其中文本情绪分类模型包括特征提取网络和分类网络,利用特征提取网络从文本向量中提取得到能够表征待处理文本的语义内容的语义特征向量并输入至分类网络;再由分类网络对语义特征向量进行分析最终得到该待处理文本的目标情绪类别。其中,文本情绪分类模型预先利用文本训练样本进行训练使其能够输出细粒度情绪的类别,例如高兴、悲伤、生气、喜欢、惊讶、平淡等。与只能输出情绪极性的分析方案相比,该装置能够识别出待处理文本所表达的细粒度情绪,同时扩大了文本情绪分析方法的应用范围。

附图说明

[0051] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0052] 图1是本发明实施例提供的一种文本情绪分类模型的结构示意图;
[0053] 图2是本发明实施例提供的一种文本情绪分析方法的流程图;
[0054] 图3是本发明实施例提供的得到文本向量过程的流程图;
[0055] 图4是本发明实施例提供的一种训练文本情绪分类模型过程的流程图;
[0056] 图5是本发明实施例提供的获取文本训练样本过程的流程图;
[0057] 图6是本发明实施例提供的一种文本情绪分析装置的框图;
[0058] 图7是本发明实施例提供的另一种文本情绪分析装置的框图。

具体实施方式

[0059] 目前的文本情绪分析主要集中在正负向情绪的分析上,而自然语言表达出的情绪有很多种,其中,最基本的情绪包括喜怒哀乐等。这种只分析文本表达情绪的极性的方式难以跟人类的基本情绪进行一一对应;从而导致文本情绪分析方法的应用范围受到极大地限制。本发明提供的文本情绪分析方法,能够对文本进行情绪分析得到更细粒度的情绪类型,使得文本的情绪标签更具体,应用范围更广泛。
[0060] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0061] 下面结合图1和图2对本发明提供的文本情绪分析方法进行说明;图1示出了本发明实施例提供的一种文本情绪分类模型的结构示意图;图2为本发明实施例提供的一种文本情绪分析方法的流程图。
[0062] 该文本情绪分析方法应用于服务端,主要用于分析短文本表达的更细粒度的情绪类型。
[0063] 如图2所示,该方法包括以下步骤:
[0064] S110,基于词向量模型,将待处理文本映射为文本向量。
[0065] 该步骤利用词向量模型是将文本类型的数据映射成计算机软件能够处理的数字型的向量,即文本向量。
[0066] 词向量模型的作用是将文本中的每个词语映射为一个向量,实现文本到向量的转换。词向量模型的本质就是词到向量的映射表,查找这个映射表得到待处理文本中的每一个词对应的向量,即文本向量。
[0067] 但是通用的词向量模型由通用的语料训练得到,这种词向量由于含义比较泛化,大部分的词向量所代表的意义不具备某些特定领域的词语的语义。因此,为了得到更具有某领域词语特点的向量,需要利用该领域的词语语料训练词向量模型得到具有该领域的词语的语义的词向量模型。
[0068] 本文以视频领域相关的文本(即,视频相关文本)为例进行说明,视频相关文本(例如,弹幕、台词、标题等文本数据),可以预先将大量视频相关文本的词语输入至词向量模型中进行训练,得到能够更好地表征视频相关文本含义的词向量,利用该领域的词向量将视频相关文本映射得到的文本向量,能够更好地表征视频相关文本所表征的意义。
[0069] 在一种可能的实现方式中,如图3所示,S110的过程可以包括以下步骤:
[0070] S111,利用中文分词算法将待处理文本进行分词处理得到分词结果。
[0071] 例如,待处理文本为视频相关文本,可以先利用中文分词算法将该视频相关文本进行分词处理得到分词结果。
[0072] 中文分词是指将一个汉字序列切分成一个个单独的词,目前的中文分词算法主要包括:基于词典的方法、基于统计的方法、基于规则的方法、基于字标注的方法。
[0073] S112,利用词向量模型将分词结果中的每一个词语转换为对应的向量。
[0074] 利用视频领域相关的文本训练得到的词向量将待处理的视频相关文本中的每一个分词都映射为对应的向量。
[0075] S113,将待处理文本中每一个词语对应的向量进行拼接得到文本向量。
[0076] 如果一个待处理文本的分词结果包含多个词语,则需要将转换得到的每一个分词对应的向量拼接成一个向量,得到文本向量。
[0077] S120,基于预先训练得到的文本情绪分类模型中的特征提取网络,从文本向量中提取得到语义特征向量。
[0078] 文本情绪分类模型包括特征提取网络和分类网络,其中,特征提取网络层用于从文本向量中提取维度更少的语义特征向量。该文本情绪分类模型需要预先利用相关的训练样本数据训练得到,训练样本数据标注有相应的预设情绪类别。预设情绪类别可以根据实际领域的业务需求划分,例如,可以包括高兴、悲伤、生气、喜欢、惊讶、平淡等。训练得到的文本情绪分类模型也能够输出待处理文本相应的情绪类别。
[0079] 在一种可能的实现方式中,该特征提取网络层可以采用基于attention机制的Bi-GRU(Bi-directional Gated Recurrent Unit,双向门控循环单元)网络实现。
[0080] GRU是LSTM(Long Short-Term Memory,长短期记忆网络)的变体,LSTM是一种时间递归神经网络,LSTM中引入了三个门函数:输入门、遗忘门和输出门来控制输入值、记忆值和输出值。而GRU模型中只有两个门分别是更新门和重置门,相对于LSTM少了一个门函数,因此GRU模型的参数数量少于LSTM,所以整体上GRU模型比LSTM模型缩短了训练过程。
[0081] 自然语言作为一种序列类型,词与词之间有位置关系,GRU模型能够记录这种词与词之间的相互位置关系,用来分析文本向量效果更好。其中,双向GRU(Bi-GRU)模型具有两个信息传递相反的GRU循环层,其中一个GRU循环层按照时间正序传递信息,另一个GRU循环层按照时间逆序传递信息。
[0082] 本文中双向GRU按照时间正序传递信息的过程,即按照正向语序分析文本向量的语义,正向语序分析能够得到当前分析语句的前文的信息;双向GRU按照时间逆序传递信息的过程即按照逆向语序分析文本向量的语义,逆向语序分析能够得到当前分析语句的后文的信息。可见,利用双向GRU能够得到当前分析的语句的上下文的信息,因此能够更准确地提取出文本向量中的语义特征。
[0083] attention机制,又叫做注意力机制,这种机制可以在训练模型的过程中,使模型更加关注一些重要的信息,如在文本情绪分析过程中,更加关注那些表达情绪的词,这样能够使模型学习能力更好,使得模型最终分类的准确率更高。例如,使用Bi-GRU模型提取得到的能够表征文本向量语义的语义特征向量中每一个词维度的向量没有表示重要性的权重,增加attention机制后,使得该语义特征向量中词维度的向量具有重要性的权重,使得最终的分类结果更准确。
[0084] S130,基于文本情绪分类模型中的分类网络,对语义特征向量进行分析得到待处理文本所属的目标情绪类别。
[0085] 本文中的所述分类网络能够输出细粒度的情绪类别,即输出的清晰类别更细化。
[0086] 将提取得到待处理文本的语义特征向量后输入至后级的分类网络,分类网络层对语义特征向量进行分析得到待处理文本所表达的情绪类别。
[0087] 在一种可能的实现方式中,文本情绪分类模型中的分类网络能够输出更细粒度的预设情绪类别,例如,高兴、悲伤、生气、喜欢、惊讶、平淡等;分类网络最终输出该待处理文本属于各个预设情绪类别的置信度;选取置信度最大的情绪类别为该待处理文本所属的目标情绪类别。
[0088] 本实施例提供的文本情绪分析方法,利用词向量模型将待处理文本映射为文本向量,即将文本转换成数字形式的向量。然后,将该文本向量输入至文本情绪分类模型,最终输出待处理文本的目标情绪类别。其中,文本情绪分类模型预先利用文本训练样本进行训练使其能够输出细粒度情绪的类别,例如包括高兴、悲伤、生气、喜欢、惊讶、平淡等。具体的,文本情绪分类模型包括特征提取网络和分类网络,利用特征提取网络从文本向量中提取得到能够表征待处理文本的语义内容的语义特征向量并输入至分类网络;再由分类网络对语义特征向量进行分析最终得到该待处理文本的目标情绪类别。与只能输出情绪极性的分析方法相比,该方法能够识别出待处理文本所表达的细粒度情绪,同时扩大了文本情绪分析方法的应用范围。
[0089] 请参见图4,示出了本发明实施例提供的一种训练文本情绪分类模型过程的流程图,如图4所示,模型训练过程如下:
[0090] S210,获取标注有预设情绪类别的文本训练样本。
[0091] 文本训练样本中的每一个样本都标注有该样本所属的预设情绪类别。其中,文本训练样本可以由人工对文本进行标识得到。
[0092] 为了提高文本标注效率,可以采用图5所示的方式获取文本训练样本,如图5所示,该过程可以包括:
[0093] S211,获取预标注数据。
[0094] 其中,预标注数据中自带表征文本情绪的情绪标识,例如,预标注数据可以是微博数据,微博数据中自带的HashTag(#标签)和Emoij(绘文字)数据即情绪标识,通过HashTag和Emoij将微博数据映射到对应的预设情绪类别。
[0095] S212,利用预标注数据训练预设文本情绪分类模型进行训练得到基础分类模型。
[0096] 利用上一步骤得到的预标注数据对预设的文本情绪分类模型中的模型参数进行训练得到基础分类模型,利用该基础分类模型可以对输入的文本样本进行情绪类别预测。
[0097] 此处的预设文本情绪分类模型与最终用于文本情绪分类的模型的架构一致,以保证标注数据的可用性。即,此处的预设文本情绪分类模型与S120和S130提及的文本情绪分类模型的模型架构一致。
[0098] S213,基于该基础分类模型获得各个候选文本训练样本所属情绪类别的置信度。
[0099] 候选文本训练样本是与待处理文本属于相同领域的文本数据,例如,对于视频相关文本,可以选取大量的视频台词、弹幕、视频标题等文本。
[0100] 然后,使用训练得到的基础分类模型预测这些候选文本训练样本的情绪类别。其中,该基础分类模型的预测结果是候选文本训练样本属于各个预设情绪类别的置信度。
[0101] S214,依据候选文本训练样本所属类别的置信度,从各个候选文本训练样本中选取文本训练样本。
[0102] 该步骤是从大量候选文本训练样本中选取可以作为训练样本的文本样本。
[0103] 在本发明的一个实施例中,可以设定一个置信度阈值,即预设置信度阈值,选取分类结果中最大置信度大于或等于该预设置信度阈值的候选文本训练样本作为训练文本情绪分类模型所要使用的文本训练样本。
[0104] 其中,该预设置信度阈值可以根据候选文本训练样本的数据量或实际需求设定,例如,0.45、0.5等。
[0105] 例如,某一候选文本训练样本的分类结果为:高兴的置信度为0.25,悲伤的置信度为0.05,生气的置信度为0.09,喜欢的置信度为0.12,惊讶的置信度为0.03,平淡的置信度为0.1;可见,该候选文本训练样本的分类结果中最大置信度为0.25。但是预设置信度阈值为0.45,该候选文本训练样本的最大置信度小于预设置信度阈值,因此,抛弃该候选文本训练样本。若某候选文本训练样本的最大置信度大于0.45,则选取该候选文本训练样本作为最终的文本训练样本。
[0106] 在本发明的另一个实施例中,为了得到多样化的训练样本数据,进而使训练得到的文本情绪分类模型的泛化能力更高,采用较低的预设置信度阈值结合人工修正标注的方式。
[0107] 通过设定较低的预设置信度阈值保留较多的候选文本训练样本,然后,再人工对基础分类器选取的样本数据进行清洗,即由人工筛选出标注不准确的样本数据,从而得到最终被用来训练文本情绪分类模型的文本训练样本。此种方式既能保证获取文本训练样本的效率,同时,还能保证选取的文本训练样本的准确率。
[0108] S220,基于词向量模型将文本训练样本转换为对应的文本训练样本向量。
[0109] 利用文本训练样本所属领域的词向量将文本训练样本映射为对应的向量,具体可以请参见S110的具体过程,此处不再赘述。
[0110] S230,基于预设文本情绪分类模型中的基于attention机制的单层双向GRU网络,从文本训练样本向量中提取得到语义特征向量。
[0111] 提取语义特征向量的过程可以参见S120中的相关内容,此处不再赘述。
[0112] 提取出的语义特征向量输入至下一级的分类网络,由分类网络分析文本训练样本向量得到对应的情绪类别。
[0113] S240,基于预设文本情绪分类模型中的分类网络,对文本训练样本向量的语义特征向量进行分析得到文本训练样本所属情绪类别的分类结果。
[0114] 分类网络层是对输入的语义特征向量的维度逐级降低最终得到维度与预设情绪类别数量相同的向量,即,分类结果。分类结果中的每一个维度表示该文本训练样本属于该维度对应的预设情绪类别的置信度。
[0115] S250,基于文本训练样本的分类结果和标注的情绪类别,调整预设文本情绪分类模型中的模型参数,直到利用调整参数后的文本情绪分类模型分析文本训练样本得到的分类结果满足预设收敛条件,得到文本情绪分类模型。
[0116] 初始文本情绪分类模型中的模型参数是初始化的参数或自定义参数,模型训练过程就是不断地调整模型参数,直到文本训练样本的分类结果满足预设收敛条件,其中,该收敛条件即损失函数降低最低,同时准确率较高。
[0117] 具体的,利用分类模型分析得到所有文本训练样本所属的预设情绪类别的分类结果;由于文本训练样本标注有其真实的情绪类别,根据文本训练样本的分类结果及标注的情绪类别可以计算得到当前分类模型的损失函数及准确率。如果损失函数及准确率均满足相应的条件,则得到最优模型参数组合,即得到最终的文本情绪分类模型。
[0118] 本实施例提供的文本情绪分类模型的训练过程,获取标注有预设情绪类别的文本训练样本,然后,利用与文本训练样本同一领域的词向量将文本训练样本映射为文本向量,并将该文本向量输入至预设文本情绪分类模型中进行训练得到最终的文本情绪分类模型。其中,该训练过程使用特定领域的词向量将文本训练样本转换得到的文本向量的准确率更高;而且,预设文本情绪分类模型中采用了基于注意力的双向GRU神经网络分类模型,能够更准确地从本文训练样本中提取语义特征向量,而且,GRU模型的参数数量少于LSTM的参数数量,因此,缩短了训练过程。
[0119] 相应于上述的文本情绪分析方法实施例,本发明还提供了文本情绪分析装置实施例。
[0120] 请参见图6,示出了本发明实施例提供的文本情绪分析装置的框图,该装置可以应用于服务器中,如图6所示,该装置包括:向量转换模块110、特征提取模块120和分类模块130。
[0121] 向量转换模块110,用于基于词向量模型,将待处理文本映射为文本向量。
[0122] 利用词向量模型是将文本类型的数据映射成计算机软件能够处理的数字型的向量,即文本向量。
[0123] 特征提取模块120,用于基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从文本向量中提取得到语义特征向量。
[0124] 利用基于注意力机制的单层双向GRU网络能够从文本向量中提取更准确的语义特征。
[0125] 分类模块130,用于基于文本情绪分类模型中的分类网络,对语义特征向量进行分析得到待处理文本所属的目标情绪类别。
[0126] 在本发明的一个实施例中,该分类模型130包括置信度获取子模块和选取子模块。
[0127] 置信度获取子模块,用于基于分类网络,分析语义特征向量得到待处理文本属于各个预设情绪类别的置信度。
[0128] 选取子模块,用于选取置信度最大的预设情绪类别为待处理文本所属的目标情绪类别。
[0129] 本实施例提供的文本情绪分析装置,先将待处理文本转换为对应的文本向量,再将文本向量输入至预选训练得到的文本情绪分类模型得到该待处理文本的目标情绪类别。其中文本情绪分类模型包括特征提取网络和分类网络,利用特征提取网络从文本向量中提取得到能够表征待处理文本的语义内容的语义特征向量并输入至分类网络;再由分类网络对语义特征向量进行分析最终得到该待处理文本的目标情绪类别。其中,文本情绪分类模型预先利用文本训练样本训练后能够输出细粒度情绪的类别,如高兴、悲伤、生气、喜欢、惊讶、平淡等。与只能输出情绪极性的方案相比,该装置能够识别出待处理文本所表达的细粒度情绪,同时扩大了文本情绪分析方法的应用范围。
[0130] 请参见图7,示出了本发明实施例提供的另一种文本情绪分类装置的框图,该装置在图6所示实施例的基础上还包括:样本获取模块210、样本向量转换模块220、样本特征提取模块230、样本分类模块240和模型参数调整模块250。
[0131] 样本获取模块210,用于获取标注有预设情绪类别的文本训练样本。
[0132] 所述样本获取模块210,包括:第一获取子模块、基础模型训练子模块、分类子模块和选取子模块。
[0133] 该第一获取子模块,用于获取预标注数据。
[0134] 其中,该预标注数据中包含表征文本情绪的情绪标识。
[0135] 基础模型训练子模块,用于利用预标注数据训练预设文本情绪分类模型得到基础分类模型。
[0136] 分类子模块,用于基于基础分类模型获得各个候选文本训练样本所属情绪类别的置信度。
[0137] 选取子模块,用于依据各个候选文本训练样本所属情绪类别的置信度,从各个候选文本训练样本中选取得到文本训练样本。
[0138] 在本发明的一个实施例中,该选取子模块具体用于选取分类结果中最大置信度大于置信度阈值的候选文本训练样本为所述文本训练样本。
[0139] 样本向量转换模块220,用于基于词向量模型将文本训练样本转换为对应的文本训练样本向量。
[0140] 样本特征提取模块230,用于基于预设文本情绪分类模型中的基于注意力机制的单层双向GRU网络,从文本训练样本向量中提取得到语义特征向量。
[0141] 样本分类模块240,用于基于预设文本情绪分类模型中的分类网络,对文本训练样本向量的语义特征向量进行分析得到文本训练样本所属情绪类别的分类结果。
[0142] 模型参数调整模块250,用于基于文本训练样本的分类结果和标注类别,调整预设文本情绪分类模型中的模型参数,直到利用调整后的文本情绪分类模型分析文本训练样本得到的分类结果满足预设收敛条件,得到文本情绪分类模型。
[0143] 本实施例提供的文本情绪分类装置,获取标注有预设情绪类别的文本训练样本,然后,利用与文本训练样本同一领域的词向量将文本训练样本映射为文本向量,并将该文本向量输入至预设文本情绪分类模型中进行训练得到最终的文本情绪分类模型。其中,该训练过程使用特定领域的词向量将文本训练样本转换得到的文本向量的准确率更高;而且,预设文本情绪分类模型中采用了基于注意力的双向GRU神经网络分类模型,能够更准确地从本文训练样本中提取语义特征向量,而且,GRU模型的参数数量少于LSTM的参数数量,因此,缩短了训练过程。
[0144] 另一方面,本发明还提供了一种设备,该设备可以是服务器,也可以是终端。该设备包括处理器和存储器,其中,处理器用于执行存储器中存储的程序;存储器用于存储程序,所述程序至少用于:
[0145] 基于词向量模型,将所述待处理文本映射为文本向量;
[0146] 基于预先训练得到的文本情绪分类模型中基于注意力机制的单层双向GRU网络,从所述文本向量中提取得到语义特征向量;
[0147] 基于所述文本情绪分类模型中的分类网络,对所述语义特征向量进行分析得到所述待处理文本所属的目标情绪类别。
[0148] 再一方面,本发明还提供了一种存储介质,该存储介质中存储有计算程序,该计算机程序被处理器加载并执行时用于实现上述任意一个实施例所提供的文本情绪分类方法。
[0149] 对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0150] 需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0151] 本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
[0152] 本申请各实施例中的装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
[0153] 本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0154] 作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
[0155] 另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
[0156] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0157] 对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
[0158] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。