会话意图识别方法及装置、计算机设备、存储介质、软件转让专利

申请号 : CN202310620564.4

文献号 : CN116340523B

文献日 : 2023-09-26

本申请实施例提供了一种会话意图识别方法及装置、计算机设备、存储介质、软件，该方法包括：获取用户的会话语句对应的语句特征；基于语句特征和第一意图分类模型，获取会话语句对应的第一意图类型及第一分类依据；基于语句特征和第二意图分类模型，获取会话语句对应的第二意图类型及第二分类依据，第一意图分类模型不同于第二意图分类模型；基于会话语句和第三意图分类模型，获取会话语句对应的第三意图类型及第三分类依据，第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；将第一意图类型、第二意图类型和第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及第一分类依据、第二分类依据、第三分类依据。

1.一种会话意图识别方法，其特征在于，所述方法包括：

获取用户的会话语句对应的语句特征；

基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；

将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据；

其中，所述第三意图分类模型包括依次连接的多个前馈神经网络层和分类输出层，各前馈神经网络层分别包括一个注意力层，基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三分类依据，包括：将所述会话语句输入所述第三意图分类模型的多个前馈神经网络层；从所述多个前馈神经网络层包括的注意力层的输出提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重，提取权重为大于预设阈值的权重；基于不同注意力层提取权重之间的权重配比，确定目标提取权重；将所述目标提取权重对应的字符，确定为所述第三意图类型对应的第三分类依据。

2.根据权利要求1所述的方法，其特征在于，将所述会话语句输入所述第三意图分类模型的多个前馈神经网络层，包括：将所述会话语句输入预训练模型，以得到所述会话语句对应的嵌入式向量；

将所述会话语句对应的嵌入式向量输入所述第三意图分类模型的多个前馈神经网络层；其中，所述第三意图分类模型基于会话语句样本对应的嵌入式向量和对应的标签训练得到，所述会话语句样本对应的标签包括所述会话语句样本的意图类型。

3.根据权利要求2所述的方法，其特征在于，将所述会话语句输入预训练模型，以得到所述会话语句对应的嵌入式向量，包括：将所述会话语句中的各字符逐个输入所述预训练模型，得到所述会话语句中各字符的嵌入式向量；

将各字符的嵌入式向量组合得到所述会话语句对应的嵌入式向量。

4.根据权利要求2所述的方法，其特征在于，基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型，包括：通过将所述前馈神经网络层输出的向量输入到所述分类输出层，得到所述会话语句属于所述第三意图分类模型的不同意图类型的概率；

将最大概率对应的意图类型确定为所述第三意图类型。

5.根据权利要求4所述的方法，其特征在于，所述基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三分类依据，包括：将所述会话语句输入所述第三意图分类模型的多个前馈神经网络层；

从所述多个前馈神经网络层中最后一层的前馈神经网络层包括的注意层的输出，提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重，提取权重为大于预设阈值的权重；

将所述提取权重对应的字符，确定为所述第三意图类型对应的第三分类依据。

6.根据权利要求1所述的方法，其特征在于，

所述第一意图分类模型包括规则引擎，所述第二意图分类模型包括相似度检索引擎；

或者

所述第二意图分类模型包括规则引擎，所述第一意图分类模型包括相似度检索引擎。

7.根据权利要求6所述的方法，其特征在于，所述第一意图分类模型包括规则引擎，所述基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据，包括：将所述语句特征输入预设规则引擎；

基于所述预设规则引擎包括的正则表达式规则或关键词规则，输出所述语句特征匹配的规则以及所述匹配的规则对应的意图类型，其中，规则与意图类型具有预设映射关系；

将所述匹配的规则对应的意图类型确定为所述第一意图类型；

将所述匹配的规则确定为所述第一意图类型对应的第一分类依据。

8.根据权利要求6所述的方法，其特征在于，所述第一意图分类模型包括相似度检索引擎，所述基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据，包括：将所述语句特征输入预设相似度检索引擎；

基于所述预设相似度检索引擎包括的典型语句，输出与所述语句特征最相似的典型语句以及所述最相似的典型语句对应的意图类型；典型语句与意图类型具有预设映射关系；

将所述最相似的典型语句对应的意图类型确定为所述第一意图类型；

将所述最相似的典型语句确定为所述第一意图类型对应的第一分类依据。

9.根据权利要求1至8中任一项所述的方法，其特征在于，所述将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，包括：基于所述第一意图类型、所述第二意图类型和所述第三意图类型各自对应的投票权重，确定所述第一意图类型对应的累计投票权重、所述第二意图类型对应的累计投票权重和所述第三意图类型对应的累计投票权重；

将最大累计投票权重对应的意图类型确定为所述会话语句对应的目标意图类型；

确定所述目标意图类型对应的分类置信度；

输出所述目标意图类型、对应的分类置信度以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

10.一种会话意图识别装置，其特征在于，所述装置包括：

获取模块，用于获取用户的会话语句对应的语句特征；

第一意图分类模块，用于基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

第二意图分类模块，用于基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

第三意图分类模块，用于基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型，所述第三意图分类模型包括依次连接的多个前馈神经网络层和分类输出层，各前馈神经网络层分别包括一个注意力层，所述第三意图分类模块基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三分类依据，包括：将所述会话语句输入所述第三意图分类模型的多个前馈神经网络层；从所述多个前馈神经网络层包括的注意力层的输出提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重，提取权重为大于预设阈值的权重；基于不同注意力层提取权重之间的权重配比，确定目标提取权重；将所述目标提取权重对应的字符，确定为所述第三意图类型对应的第三分类依据；

输出模块，用于将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

11.一种计算机设备，其特征在于，所述计算机设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令被配置由所述处理器执行，所述可执行指令包括用于执行如权利要求1至9中任一项所述的方法中的步骤。

12.一种存储介质，其特征在于，所述存储介质用于存储计算机可执行指令，所述可执行指令使得计算机执行如权利要求1至9中任一项所述的方法。

13.一种计算机软件，所述计算机软件被存储在存储介质中，所述计算机软件被至少一个处理器执行以实现如权利要求1至9中任一项所述的方法。

会话意图识别方法及装置、计算机设备、存储介质、软件

技术领域

[0001] 本申请涉及语言处理技术领域，尤其涉及一种会话意图识别方法及装置、计算机设备、存储介质、计算机软件。

背景技术

[0002] 在移动互联网、大数据、深度学习等技术的发展推动下，智能语音技术、自然语言处理技术等得到了快速地发展，并很快应用到各个行业领域当中。在金融、保险、汽车等行业中智能会话机器人作为一种综合的智能化、数字化系统被广泛应用于各种业务场景中，通过获取用户的通话内容的文本数据，然后利用自然语言处理技术，识别用户的会话意图，然后利用人工智能技术训练的会话机器人，基于用户的会话意图完成与客户的对话任务。

[0003] 现有用户会话意图的识别算法例如包括逻辑回归等机器学习算法，利用自然语言处理技术对客户的会话语料进行预处理，利用标注好意图类型的大量语料，训练意图分类模型完成意图的分类。

[0004] 然而，训练出的意图分类模型因各种原因可能会出现分类错误，也无法准确得知分类错误的原因，进而无法进行意图分类模型的及时修正和优化。

发明内容

[0005] 本申请实施例的目的是提供一种会话意图识别方法及装置、计算机设备、存储介质、计算机软件，能够准确定位出意图分类模型出现分类错误的原因，从而对意图分类模型进行及时修正和优化，提高意图分类模型意图识别的准确性。

[0006] 为了实现上述技术方案，本申请实施例是这样实现的：

[0007] 第一方面，本申请实施例提供的一种会话意图识别方法，所述方法包括：

[0008] 获取用户的会话语句对应的语句特征；

[0009] 基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

[0010] 基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

[0011] 基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；

[0012] 将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0013] 第二方面，本申请实施例提供的一种会话意图识别装置，所述装置包括：

[0014] 获取模块，用于获取用户的会话语句对应的语句特征；

[0015] 第一意图分类模块，用于基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

[0016] 第二意图分类模块，用于基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

[0017] 第三意图分类模块，用于基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；

[0018] 输出模块，用于将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0019] 第三方面，本申请实施例提供的一种计算机设备，所述设备包括：

[0020] 处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令被配置由所述处理器执行，所述可执行指令包括用于执行如第一方面中所述的方法中的步骤。

[0021] 第四方面，本申请实施例提供的一种存储介质，其中，所述存储介质用于存储计算机可执行指令，所述可执行指令使得计算机执行如第一方面中所述的方法中的步骤。

[0022] 第五方面，本申请实施例提供的一种计算机软件，所述计算机软件被存储在存储介质中，所述计算机软件被至少一个处理器执行以实现如第一方面中所述的方法。

[0023] 可以看出，在本申请实施例中，通过获取用户的会话语句对应的语句特征；基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，由此结合多种意图分类模型不仅可以准确实现会话语句的意图识别，还给出了意图识别的依据，有助于帮助相关人员更快的分析智能会话机器人与客户间的对话，提升意图分类模型的准确率和可解释性，同时能够根据意图分类依据及时发现问题，准确定位出意图分类模型出现分类错误的原因，从而对意图分类模型进行及时修正和优化，提高意图分类模型意图识别的准确性，提升用户体验。

附图说明

[0024] 为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请一个或多个中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

[0025] 图1为本申请实施例的会话意图识别方法的第一种流程示意图。

[0026] 图2为本申请实施例的会话意图识别方法的第二种流程示意图。

[0027] 图3为本申请实施例提供的会话意图识别装置的模块组成示意图；

[0028] 图4为本申请实施例提供的计算机设备的结构示意图。

具体实施方式

[0029] 为了使本技术领域的人员更好地理解本申请一个或多个中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一个或多个一部分实施例，而不是全部的实施例。基于本申请一个或多个中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请的保护范围。

[0030] 需要说明的是，在不冲突的情况下，本申请中的一个或多个实施例以及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请实施例。

[0031] 本申请一个或多个实施例提供了一种会话意图识别方法及装置、设备、存储介质，考虑到现有意图分类模型在出现分类错误时准确得知分类错误的原因，进而无法进行意图分类模型的及时修正和优化的问题，基于此，本技术方案通过获取用户的会话语句对应的语句特征，并基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据，基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型，基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型，然后将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，从而能够准确定位出意图分类模型出现分类错误的原因，对意图分类模型进行及时修正和优化，由此提高意图分类模型意图识别的准确性。

[0032] 图1为本申请一个或多个实施例提供的会话意图识别方法的第一种流程示意图，本申请实施例的会话意图识别方法的执行主体可以是智能会话机器人。如图1所示，该方法至少包括以下步骤102至步骤110。

[0033] 步骤102，获取用户的会话语句对应的语句特征。

[0034] 本申请实施例的会话意图识别方法可以适用于各种业务场景的智能会话机器人，业务场景包括电话营销、客户服务、催收款项等等。智能会话机器人通过与对应业务场景的对端目标用户进行会话，可以实时获取目标用户的会话语句。利用自然语言处理技术进行会话语句的处理，包括分词、特征提取等，可以得到对应会话语句的语句特征。

[0035] 步骤104，基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；步骤106，基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型。

[0036] 具体地，所述第一意图分类模型包括规则引擎，所述第二意图分类模型包括相似度检索引擎；或者所述第二意图分类模型包括规则引擎，所述第一意图分类模型包括相似度检索引擎。

[0037] 规则引擎和相似度检索引擎均可以基于会话语句的语句特征进行意图类型的识别，在本申请实施例中，可以同时采用规则引擎和相似度检索引擎对于同一会话语句进行意图类型的识别。

[0038] 可选地，在第一意图分类模型包括规则引擎的情况下，所述基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据，包括：将所述语句特征输入预设规则引擎；基于所述预设规则引擎包括的正则表达式规则或关键词规则，输出所述语句特征匹配的规则以及所述匹配的规则对应的意图类型，其中，规则与意图类型具有预设映射关系；将所述匹配的规则对应的意图类型确定为所述第一意图类型；将所述匹配的规则确定为所述第一意图类型对应的第一分类依据。

[0039] 将步骤102处理过的语句特征发送给规则引擎，并根据预先定义的规则对目标会话语句的语句特征依次进行规则判断，规则可以包括正则表达式规则或关键词规则。规则判断时将目标会话语句的各语句特征分别与预设规则进行匹配比对，找出匹配的规则和匹配规则对应的意图类型，各规则与意图类型的映射关系预先确定，由此通过规则引擎可以输出命中的规则和对应的意图类型。

[0040] 通过规则引擎的意图分类模型能够匹配到语句特征对应的规则，则表示该意图分类模型进行意图分类的置信度为100%。分类依据是用于解释对应意图分类模型输出对应意图类型的原因或证据，对于规则引擎，分类依据则为对应匹配的规则内容。

[0041] 可选地，在第一意图分类模型包括相似度检索引擎的情况下，所述基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据，包括：将所述语句特征输入预设相似度检索引擎；基于所述预设相似度检索引擎包括的典型语句，输出与所述语句特征最相似的典型语句以及所述最相似的典型语句对应的意图类型；
典型语句与意图类型具有预设映射关系；将所述最相似的典型语句对应的意图类型确定为所述第一意图类型；将所述最相似的典型语句确定为所述第一意图类型对应的第一分类依据。

[0042] 将步骤102处理过的语句特征发送给相似度检索引擎，并分别与相似度检索引擎中的典型语句进行相似度计算。典型语句是各会话对应的标准语句，目标会话与标准语句进行比较，语句表述可能不一样，但是表示的语意一样。利用业务专家根据积累的会话语料，可以总结出意图类型及其相应的典型会话。相似度计算时将目标会话语句的语句特征分别与各预设的典型语句进行相似度计算，相似度越高越表示语意越相同。根据最高相似度确定出最相似的典型语句，并输出最相似的典型语句以及该典型语句所对应的意图类型。各典型语句与意图类型的映射关系预先确定，由此通过相似度检索引擎可以输出最相似的典型语句和对应的意图类型。

[0043] 对于相似度检索引擎，其分类依据为对应计算出的最高相似度的典型语句内容。

[0044] 步骤108，基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型。

[0045] 在本申请实施例中，第三意图分类模型是基于会话语句本身进行意图类型的识别，第三意图分类模型不同于上述的规则引擎和相似度检索引擎。

[0046] 具体地，基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，包括：将所述会话语句输入预训练模型，以得到所述会话语句对应的嵌入式向量；将所述会话语句对应的嵌入式向量输入所述第三意图分类模型，以得到所述第三意图类型及第三分类依据，其中，所述第三意图分类模型基于会话语句样本对应的嵌入式向量和对应的标签训练得到，所述会话语句样本对应的标签包括所述会话语句样本的意图类型。

[0047] 预训练模型的功能是获得目标会话语句包括的每个字符的嵌入式向量，嵌入式向量为每个字符的特征表示。所述预训练模型包括RoBERTa模型或BERT模型。

[0048] 如果目标会话语句包括多个字符，则可以通过预训练模型得到各字的对应的嵌入式向量。

[0049] 可选地，将所述会话语句输入预训练模型，以得到所述会话语句对应的嵌入式向量，包括：将所述会话语句中的各字符逐个输入所述预训练模型，得到所述会话语句中各字符的嵌入式向量；将各字符的嵌入式向量组合得到所述会话语句对应的嵌入式向量。

[0050] 在得到会话语句的嵌入式向量后，将会话语句的所有嵌入式向量发分别送给第三意图分类模型，以获取该会话语句的意图类型。第三意图分类模型可以通过样本和标签训练得到，标签包括同一会话语句样本对应不同意图类型的概率。第三意图分类模型的输出为目标会话语句属于不同意图类型的概率，例如输出目标会话语句分别属于四种意图类型的概率，概率最大的意图类型则识别为该目标会话语句最终的意图类型。

[0051] 具体地，所述第三意图分类模型包括前馈神经网络层和分类输出层，所述前馈神经网络层包括注意力层，所述将所述会话语句对应的嵌入式向量输入所述第三意图分类模型，以得到所述第三意图类型及第三分类依据，包括：将所述会话语句对应的嵌入式向量输入所述第三意图分类模型的前馈神经网络层；从所述前馈神经网络层的注意力层的输出提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重，提取权重为大于预设阈值的权重；将所述提取权重对应的字符，确定为所述第三意图类型对应的第三分类依据；通过将所述前馈神经网络层输出的向量输入到所述分类输出层，得到所述会话语句属于所述第三意图分类模型的不同意图类型的概率；将最大概率对应的意图类型确定为所述第三意图类型。

[0052] 在该实施例中，第三意图分类模型的结构为带有注意力层（Attention layer）的前馈神经网络（FNN）层，注意力层的输入是预训练模型输出的嵌入式向量，注意力层通过样本训练可以学习到，会话语句的每个字符对最后输出的会话语句的意图识别分类结果的影响力或重要程度，注意力层的输出可以作为每个字符对于意图分类的影响力权重。为提高意图识别的精度，可以从注意力层输出的影响力权重中抽取大于预设权重阈值的权重，这些权重对应的字符更能体现对最后输出的意图识别分类结果的影响力或重要程度。

[0053] 第三意图分类模型可以包括一个或多个前馈神经网络层，一个前馈神经网络层带有一个注意力层。

[0054] 可选地，在所述第三意图分类模型包括依次连接的多个前馈神经网络层，各前馈神经网络层分别包括一个注意力层，所述从所述前馈神经网络层的注意力层的输出提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重，包括：分别从多个前馈神经网络层包括的注意力层的输出提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重；基于不同注意力层提取权重之间的权重配比，确定目标提取权重；或者从最后一层的前馈神经网络层包括的注意层的输出提取所述会话语句中各字符对于所述会话语句的意图分类的影响力的权重。

[0055] 在一个实施例中，可以从每个注意力层输出的影响力权重中抽取大于预设权重阈值的权重，然后将各层抽取的权重按照预设的权重配比进行选择，得到最终提取的权重，并获取这些权重对应的字符，也即确定目标会话语句最终的意图识别结果具有一定影响力的字符，并将这些字符作为输出目标会话语句最终意图类型的分类依据。

[0056] 在另一个实施例中，也可以仅从最后一个注意力层输出的影响力权重中抽取大于预设权重阈值的权重，并作为最终提取的权重。获取这些权重对应的字符，作为输出目标会话语句最终意图类型的分类依据。

[0057] 通过上述步骤，可以得到三种不同的意图分类模型对目标会话语句识别分类的三种意图类型。

[0058] 步骤110，将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0059] 该步骤中，将三种意图类型和各自的分类依据进行整合，以得到会话语句最终的意图类型和分类依据。

[0060] 可选地，所述将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，包括：基于所述第一意图类型、所述第二意图类型和所述第三意图类型各自对应的投票权重，确定所述第一意图类型对应的累计投票权重、所述第二意图类型对应的累计投票权重和所述第三意图类型对应的累计投票权重；将最大累计投票权重对应的意图类型确定为所述会话语句对应的目标意图类型；确定所述目标意图类型对应的分类置信度；输出所述目标意图类型、对应的分类置信度以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0061] 在该实施例中，通过投票的方式从三个意图分类模型各自识别的意图类型中，确定最终的意图类型。投票权重是表示不同意图分类模型识别出的意图类型体现对应会话语句的意图的程度，投票权重越大，说明对应的意图分类模型识别的意图类型更能准确体现对应会话语句的意图。如果投票一样，则说明通过三种意图分类模型识别出的意图类型的准确程度是一样的。

[0062] 如果三种意图分类模型各自识别出的意图类型均相同，只有一种意图类型，则直接作为最终的意图类型。

[0063] 如果三种意图分类模型各自识别出的意图类型存在部分不同，则将相同意图类型对应的意图分类模型对应的投票权重进行累加，由此可以得到识别出的不同意图类型对应的累计投票权重，例如三种意图分类模型各自识别出的意图类型包括意图类型A、意图类型A和意图类型B，对应的投票权重均为1，则意图类型A对应的累计投票权重为2，意图类型B对应的累计投票权重为1，最大累计投票权重2对应的意图类型为A。

[0064] 如果三种意图分类模型各自识别出的意图类型全部不同，例如三种意图分类模型各自识别出的意图类型包括意图类型A、意图类型B和意图类型C，对应的投票权重分别为1、0.9、0.8，则意图类型A对应的累计投票权重为1，意图类型B对应的累计投票权重为0.9，意图类型C对应的累计投票权重为0.8，最大累计投票权重1对应的意图类型为A。如果三种意图分类模型对应的投票权重均相同，例如都为1，不存在最大累计投票权重，则输出意图识别失败。

[0065] 不同意图分类模型在识别对应的意图类型时，存在对应的识别置信度，例如通过规则引擎匹配到意图类型，则表示百分百命中，置信度为100%；如果通过相似性检索引擎识别到意图类型，则置信度为最相似典型语句对应的最大相似度；如果通过包括前馈神经网络层的意图分类模型，则置信度为意图分类模型输出的最大概率。可以在输出目标会话语句对应的最终意图类型时，一并输出该意图类型对应的置信度。置信度可以表示该意图类型分类的可信程度，如果置信度太低，则最终输出的意图类型也可以认为是识别失败。

[0066] 输出的意图类型、分类依据和置信度可以记录在日志中，或者直接显示给相关人员，以便于相关人员在分析会话的时候，可以根据输出结果判断三种意图分类模型中出现分类错误的目标意图分类模型，并根据三种方法的分类依据、置信度，准确定位出目标意图分类模型出现分类错误的原因，从而对该意图分类模型进行及时修正和优化，以提高该意图分类模型意图识别的准确性。例如，补充规则引擎的规则，或者完善相似的典型语句，或者添加新的训练语料重新训练意图分类模型，实现对应意图分类模型的修复和优化。

[0067] 图2以意图分类模型包括规则引擎、相似度检索引擎和预训练模型、包括前馈神经网络的意图分类模型为例，显示了不同意图分类模型的处理流程和最终的输出结果。

[0068] 如图2所示，在获取到目标会话语句后，可以直接输入到预训练模型，同时提取到目标会话语句对应的语句特征，并分别输入到规则引擎和相似的检索引擎中进行意图识别。由此，得到规则引擎输出的匹配规则作为分类依据1和匹配规则对应的意图类型1，以及相似度检索引擎输出的最相似典型语句作为分类依据2和最相似典型语句对应的意图类型2。预训练模型则得到目标会话语句的各字符对应的嵌入式向量，并输入到意图分类模型，从前馈神经网络的注意力层抽取到目标权重，进而得到权重对应的分类依据3，以及意图分类模型输出的意图类型3。

[0069] 最后将意图类型1、意图类型2和意图类型3通过投票方式进行整合，输出最终的意图类型和分类依据1、分类依据2、分类依据3。

[0070] 企业在电话营销的过程中，需要通过智能会话机器人完成获客、商机发现、商机转化等过程，这些过程依赖于通过会话意图识别方法获取客户的会话意图标签，根据客户意图执行相应操作。下面以汽车4S店在电话营销过程中，通过智能会话机器人（下文简称“机器人”）邀请客户到店试驾场景为例，对本申请实施例的会话意图识别方法输出的识别结果描述如下。

[0071] 并且，将规则引擎简称为“规则”、相似度检索引擎简称为“检索”、第三意图分类模型简称为“模型”。

[0072] （1）机器人：您好，这里是XXX汽车试驾邀约服务中心，请问您是XX先生吗？[0073] （2）客户：嗯，是的。<意图：身份确认；置信度：100%；依据：（规则[是的]；检索：[ ]；模型[ ]）>

[0074] （注： [ ]表示没有对应依据）

[0075] （3）机器人：有了解到您之前关注过我们XXX车型，请问你近期有购车的意向吗？[0076] （4）客户：看过你们的这款车，最近也有换车的想法。<意图：有购车意向；置信度：84%；依据：（规则[ ]；检索：[最近打算换车]；模型 [有购车的想法]）>

[0077] （5）机器人：非常感谢您对我们品牌的关注和支持，近期我们推出了免费试驾邀请的活动，想邀请您到店试驾体验？

[0078] （6）客户：可以啊，什么时间能安排试驾？<意图：愿意试驾；置信度：100%；依据：（规则[可以]；检索[可以去试驾]，模型[ ]）>

[0079] （7）机器人：XX先生您好，本周末我们品牌会在XXXX店有免费试驾活动，不知道您有时间过来试驾体验么？

[0080] （8）客户：周末外地出差<意图：null；置信度：30%；依据：（规则[ ]；检索[ ]；模型[周末]）>

[0081] （注： null表示意图识别失败）

[0082] （9）机器人：抱歉，暂时没听您说什么？你能再说一遍么？

[0083] （10）客户：周末出差，去不了<意图：无法试驾；置信度：75%；依据：（规则[ ]；检索[]；模型[去不了]）>

[0084] （11）机器人：非常感谢您对我们品牌的关注和支持。稍后会有经销商联系到您，您可以进一步了解下，您看可以吗？

[0085] （12）客户：好的<意图：确认；置信度：100%；依据：（规则[好的]；检索:[ ]；模型[好]）>

[0086] （13）机器人：我们会让经销商尽快联系您，感谢您的接听，XXX汽车祝您生活愉快，再见！

[0087] 以上展示了本申请实施例的会话意图识别方法在实际场景中的应用。在会话序号（8）中，用户会话内容超出了规则、典型语句检索库中的内容，且模型识别置信度过低，则导致意图识别失败，并触发智能会话机器人默认话术，要求客户重复会话。

[0088] 运营人员在分析上述会话的时候，可以根据三种方法的依据，及时排查是哪里出了问题，通过添加规则和相似典型语句，补充规则和完善相似语句来完成意图分类模型的修复。

[0089] 在本申请实施例中，通过获取用户的会话语句对应的语句特征；基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，由此结合多种意图分类模型不仅可以准确实现会话语句的意图识别，还给出了意图识别的依据，有助于帮助相关人员更快的分析智能会话机器人与客户间的对话，提升意图分类模型的准确率和可解释性，同时能够根据意图分类依据及时发现问题，准确定位出意图分类模型出现分类错误的原因，从而对意图分类模型进行及时修正和优化，提高意图分类模型意图识别的准确性，提升用户体验。

[0090] 对应上述图1至图2描述的会话意图识别方法，基于相同的技术构思，本申请实施例还提供了一种会话意图识别装置，图3为本申请实施例提供的会话意图识别装置600的模块组成示意图，该会话意图识别装置600用于执行图1至图2描述的会话意图识别方法，如图3所示，该会话意图识别装置装置600包括：

[0091] 获取模块620，用于获取用户的会话语句对应的语句特征；

[0092] 第一意图分类模块640，用于基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

[0093] 第二意图分类模块660，用于基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

[0094] 第三意图分类模块680，用于基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；

[0095] 输出模块690，用于将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0096] 在本申请实施例中，通过获取用户的会话语句对应的语句特征；基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；基于所述第一意图类型、所述第二意图类型和所述第三意图类型，输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，由此结合多种意图分类模型不仅可以准确实现会话语句的意图识别，还给出了意图识别的依据，有助于帮助相关人员更快的分析智能会话机器人与客户间的对话，提升意图分类模型的准确率和可解释性，同时能够根据意图分类依据及时发现问题，准确定位出意图分类模型出现分类错误的原因，从而对意图分类模型进行及时修正和优化，提高意图分类模型意图识别的准确性，提升用户体验。

[0097] 需要说明的是，本申请中关于会话意图识别装置的实施例与本申请中关于会话意图识别方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的会话意图识别方法的实施，重复之处不再赘述。

[0098] 进一步地，对应上述图1至图2所示的方法，基于相同的技术构思，本申请实施例还提供了一种计算机设备，该设备用于执行上述的会话意图识别方法，如图4所示。

[0099] 计算机设备700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器701和存储器702，存储器702中可以存储有一个或一个以上存储应用程序或数据。其中，存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块（图示未示出），每个模块可以包括对信息更新设备中的一系列计算机可执行指令。更进一步地，处理器701可以设置为与存储器702通信，在信息更新设备上执行存储器702中的一系列计算机可执行指令。计算机设备700还可以包括一个或一个以上电源703，一个或一个以上有线或无线网络接口704，一个或一个以上输入输出接口705，一个或一个以上键盘706等。

[0100] 在一个具体的实施例中，计算机设备700包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对计算机设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

[0101] 获取用户的会话语句对应的语句特征；

[0102] 基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

[0103] 基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

[0104] 基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；

[0105] 将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0106] 在本申请实施例中，通过获取用户的会话语句对应的语句特征；基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，由此结合多种意图分类模型不仅可以准确实现会话语句的意图识别，还给出了意图识别的依据，有助于帮助相关人员更快的分析智能会话机器人与客户间的对话，提升意图分类模型的准确率和可解释性，同时能够根据意图分类依据及时发现问题，准确定位出意图分类模型出现分类错误的原因，从而对意图分类模型进行及时修正和优化，提高意图分类模型意图识别的准确性，提升用户体验。

[0107] 需要说明的是，本申请中关于计算机设备的实施例与本申请中关于会话意图识别方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的会话意图识别方法的实施，重复之处不再赘述。

[0108] 进一步地，对应上述图1至图2所示的方法，基于相同的技术构思，本申请实施例还提供了一种存储介质，用于存储计算机可执行指令，一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令在被处理器执行时，能实现以下流程：

[0109] 获取用户的会话语句对应的语句特征；

[0110] 基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；

[0111] 基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；

[0112] 基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；

[0113] 将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据。

[0114] 在本申请实施例中，通过获取用户的会话语句对应的语句特征；基于所述语句特征和第一意图分类模型，获取所述会话语句对应的第一意图类型及第一分类依据；基于所述语句特征和第二意图分类模型，获取所述会话语句对应的第二意图类型及第二分类依据，所述第一意图分类模型不同于所述第二意图分类模型；基于所述会话语句和第三意图分类模型，获取所述会话语句对应的第三意图类型及第三分类依据，所述第三意图分类模型不同于所述第一意图分类模型和所述第二意图分类模型；将所述第一意图类型、所述第二意图类型和所述第三意图类型进行整合，以输出所述会话语句对应的目标意图类型以及所述第一分类依据、所述第二分类依据、所述第三分类依据，由此结合多种意图分类模型不仅可以准确实现会话语句的意图识别，还给出了意图识别的依据，有助于帮助相关人员更快的分析智能会话机器人与客户间的对话，提升意图分类模型的准确率和可解释性，同时能够根据意图分类依据及时发现问题，准确定位出意图分类模型出现分类错误的原因，从而对意图分类模型进行及时修正和优化，提高意图分类模型意图识别的准确性，提升用户体验。

[0115] 需要说明的是，本申请中关于存储介质的实施例与本申请中关于会话意图识别方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的会话意图识别方法的实施，重复之处不再赘述。

[0116] 进一步地，对应上述图1至图2所示的方法，基于相同的技术构思，本申请实施例还提供了一种计算机软件，所述计算机软件被存储在存储介质中，所述计算机软件被至少一个处理器执行以实现上述的会话意图识别方法。

[0117] 需要说明的是，本申请中关于计算机软件的实施例与本申请中关于会话意图识别方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的会话意图识别方法的实施，重复之处不再赘述。

[0118] 上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

[0119] 本领域内的技术人员应明白，本申请实施例可提供为方法、系统或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质（包括但不限于磁盘存储器、CD‑ROM、光学存储器等）上实施的计算机程序产品的形式。

[0120] 本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

[0121] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

[0122] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

[0123] 在一个典型的配置中，计算设备包括一个或多个处理器（CPU）、输入/输出接口、网络接口和内存。

[0124] 内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器（RAM）和/或非易失性内存等形式，如只读存储器（ROM）或闪存（flash RAM）。内存是计算机可读介质的示例。

[0125] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存（PRAM）、静态随机存取存储器（SRAM）、动态随机存取存储器（DRAM）、其他类型的随机存取存储器（RAM）、只读存储器（ROM）、电可擦除可编程只读存储器（EEPROM）、快闪记忆体或其他内存技术、只读光盘只读存储器（CD‑ROM）、数字多功能光盘（DVD）或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体（transitory media），如调制的数据信号和载波。

[0126] 还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

[0127] 本申请实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请的一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

[0128] 本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

[0129] 以上所述仅为本文件的实施例而已，并不用于限制本文件。对于本领域技术人员来说，本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本文件的权利要求范围之内。

会话意图识别方法及装置、计算机设备、存储介质、软件转让专利

申请号 : CN202310620564.4

文献号 : CN116340523B

文献日 : 2023-09-26

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 李犇 , 张杰 , 于皓 , 罗华刚

申请人 : 北京中关村科金技术有限公司

摘要 :

权利要求 :

说明书 :