一种业务处理方法、装置及计算机可读存储介质转让专利

申请号 : CN201710391804.2

文献号 : CN108959327B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王燕蒙冯俊兰胡珉段福高孟繁宇

申请人 : 中国移动通信有限公司研究院中国移动通信集团公司

摘要 :

本发明公开了一种业务处理方法,包括:获取用户问题;将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;根据确定的业务逻辑,完成对所述用户问题的应答处理。本发明同时还公开了一种业务处理装置及计算机可读存储介质。

权利要求 :

1.一种业务处理方法,其特征在于,所述方法包括:

获取用户问题;

将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;

利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;

在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;

根据确定的业务逻辑,完成对所述用户问题的应答处理;其中,所述将所述用户问题通过动作分类器,形成动作分类概率向量,并将所述用户问题通过业务分类器,形成业务分类概率向量,包括以下之一:先将所述用户问题通过动作分类器,形成动作分类概率向量;再将所述用户问题通过业务分类器,形成业务分类概率向量;

先将所述用户问题通过业务分类器,形成业务分类概率向量;再将所述用户问题通过动作分类器,形成动作分类概率向量;

同时将所述用户问题通过动作分类器和业务分类器,形成动作分类概率向量和业务分类概率向量。

2.根据权利要求1所述的方法,其特征在于,所述利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签,包括:将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;

在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;

当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,并去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。

4.根据权利要求3所述的方法,其特征在于,所述确定所述用户问题的置信度时,所述方法包括:将动作分类概率向量中每个动作分类概率与第一值求积;所述第一值表征动作和业务权证调节参数;

将业务分类概率向量中每个业务分类概率与第二值求积;所述第二值与第一值之和满足预设条件;

针对每个动作分类概率与第一值求积的结果,将其与每个业务分类概率与第二值求积的结果求和,形成一个集合;

在确定所述用户问题对应的业务逻辑时,按照求和结果从大到小的顺序,从集合中依次选择一个求和结果,选择的求和结果对应的动作分类概率的类别为所述用户问题对应的动作分类标签,选择的求和结果对应的业务分类概率的类别为所述用户问题对应的业务分类标签。

5.根据权利要求1所述的方法,其特征在于,所述根据确定的动作和业务所对应的业务逻辑,完成对所述用户问题的应答处理,包括:根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。

6.根据权利要求1至5任一项所述的方法,其特征在于,形成动作分类概率向量和业务分类概率向量之前,所述方法还包括:对所述用户问题进行分词处理。

7.一种业务处理装置,其特征在于,所述装置包括:

获取单元,用于获取用户问题;

分类单元,用于将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;

确定单元,用于利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;

查找单元,用于在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;

处理单元,用于根据确定的业务逻辑,完成对所述用户问题的应答处理;其中,所述分类单元,具体用于执行以下之一:先将所述用户问题通过动作分类器,形成动作分类概率向量;再将所述用户问题通过业务分类器,形成业务分类概率向量;

先将所述用户问题通过业务分类器,形成业务分类概率向量;再将所述用户问题通过动作分类器,形成动作分类概率向量;

同时将所述用户问题通过动作分类器和业务分类器,形成动作分类概率向量和业务分类概率向量。

8.根据权利要求7所述的装置,其特征在于,所述确定单元,具体用于:将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。

9.根据权利要求8所述的装置,其特征在于,

所述确定单元,还用于当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;

所述查找单元,还要同于在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;

当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,所述确定单元利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,所述查找单元去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。

10.根据权利要求7所述的装置,其特征在于,所述处理单元,具体用于:根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。

11.根据权利要求7至10任一项所述的装置,其特征在于,所述装置还包括:分词单元,用于对所述用户问题进行分词处理。

12.一种业务处理装置,其特征在于,所述装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行权利要求1至6任一项所述方法的步骤。

13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。

说明书 :

一种业务处理方法、装置及计算机可读存储介质

技术领域

[0001] 本发明涉及人机智能交互领域,尤其涉及一种业务处理方法、装置及计算机可读存储介质。

背景技术

[0002] 智能客服系统是指以自然语言理解技术为核心,根据移动用户提出的相关咨询、查询、办理等类型问题,给出相应的解答或引导、帮助用户完成相应业务流程的客户服务系统。
[0003] 目前,在智能客服系统中,一般是基于问答库的文本对话系统。即用户输入文本,系统通过关键词和规则匹配,找到与用户问题最为匹配的标准问题,将该标准问题对应的答案最为答案反馈给当前用户。
[0004] 然而,当这种处理方式应用到移动客服领域时,由于移动客服领域自身的特性,决定了上述这种处理方式会造成问题的识别不准确,从而造成问题的解答和处理不准确等。

发明内容

[0005] 为解决现有存在的技术问题,本发明实施例提供一种业务处理方法、装置及计算机可读存储介质。
[0006] 本发明实施例的技术方案是这样实现的:
[0007] 本发明实施例提供了一种业务处理方法,包括:
[0008] 获取用户问题;
[0009] 将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;
[0010] 利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;
[0011] 在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;
[0012] 根据确定的业务逻辑,完成对所述用户问题的应答处理。
[0013] 上述方案中,所述利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签,包括:
[0014] 将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。
[0015] 上述方案中,所述方法还包括:
[0016] 当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;
[0017] 在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;
[0018] 当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,并去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0019] 上述方案中,所述确定所述用户问题的置信度时,所述方法包括:
[0020] 将动作分类概率向量中每个动作分类概率与第一值求积;所述第一值表征动作和业务权证调节参数;
[0021] 将业务分类概率向量中每个业务分类概率与第二值求积;所述第二值与第一值之和满足预设条件;
[0022] 针对每个动作分类概率与第一值求积的结果,将其与每个业务分类概率与第二值求积的结果求和,形成一个集合;
[0023] 在确定所述用户问题对应的业务逻辑时,按照求和结果从大到小的顺序,从集合中依次选择一个求和结果,选择的求和结果对应的动作分类概率的类别为所述用户问题对应的动作分类标签,选择的求和结果对应的业务分类概率的类别为所述用户问题对应的业务分类标签。
[0024] 上述方案中,所述根据确定的动作和业务所对应的业务逻辑,完成对所述用户问题的应答处理,包括:
[0025] 根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。
[0026] 上述方案中,形成动作分类概率向量和业务分类概率向量之前,所述方法还包括:
[0027] 对所述用户问题进行分词处理。
[0028] 本发明实施例还提供了一种业务处理装置,包括:
[0029] 获取单元,用于获取用户问题;
[0030] 分类单元,用于将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;
[0031] 确定单元,用于利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;
[0032] 查找单元,用于在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;
[0033] 处理单元,用于根据确定的业务逻辑,完成对所述用户问题的应答处理。
[0034] 上述方案中,所述确定单元,具体用于:
[0035] 将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。
[0036] 上述方案中,所述确定单元,还用于当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;
[0037] 所述查找单元,还要同于在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;
[0038] 当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,所述确定单元利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,所述查找单元去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0039] 上述方案中,所述处理单元,具体用于:
[0040] 根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。
[0041] 上述方案中,所述装置还包括:
[0042] 分词单元,用于对所述用户问题进行分词处理。
[0043] 本发明实施例又提供了一种业务处理装置,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
[0044] 其中,所述处理器用于运行所述计算机程序时,执行上述方法的步骤。
[0045] 本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
[0046] 本发明实施例提供的业务处理方法、装置及计算机可读存储介质,获取用户问题;将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;根据确定的业务逻辑,完成对所述用户问题的应答处理,对用户问题在动作和业务两个维度采用有监督的机器学习算法,进行分类和识别处理,如此,能够准确识别用户的需求,进而能够准确解答和处理问题。

附图说明

[0047] 在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
[0048] 图1为本发明实施例业务处理的方法流程示意图;
[0049] 图2为本发明实施例信息维度表结构示意图;
[0050] 图3为本发明实施例用户问题的识别及应答流程示意图;
[0051] 图4为本发明实施例业务处理装置结构示意图;
[0052] 图5为本发明实施例业务处理装置硬件结构示意图。

具体实施方式

[0053] 下面结合附图实施例对本发明再作进一步详细的描述。
[0054] 对用户意图准确理解成为智能客服系统成功与否的基础和核心技术要求。目前的智能客服系统一般是基于问答库的文本对话系统,即用户输入文本,智能客服系统通过关键词和规则匹配,找到与用户问题最为匹配的标准问题,并将该标准问题对应的答案作为答案反馈给用户。其中,匹配答案时,在海量聊天问答库中,对用户问题的做相似度匹配及匹配后的重排,从而找到与用户问题最为匹配的问题。所以目前的智能客服系统适合应对一般闲聊的机器人场景。
[0055] 发明人发现:对于移动业务来说,由于有些客户不是很了解,以及自然语言(语音方式)本身存在较大的灵活性,所以对同一个基本问题往往有多种表达方式。字面表达相似的客户问题,可能要求不一样的业务动作或者不一样业务办理对象。
[0056] 同时,由于移动业务的多样性,涉及几十种办理动作和上千种移动公司业务。对于每种动作和业务都用多种的表达方式,两个维度组合起来更是不胜枚举。所以如果还要准备问题答案库,做相似问题匹配,工作量巨大,且无法解决数据稀疏的问题,效果不好。当无法准确识别用户需要的动作和业务意图时,则无法帮助用户完成相应的业务办理。
[0057] 综上所述,现有的智能客服系统主要有以下问题:
[0058] 1、用户问题的语义理解都是在现有问答库中检索最相近问题及后续的二次排序或综合排序。对于近似问题的识别不准确,能够找到几个相关近似问题,但是很难把正确问题排序在第一位。
[0059] 2、由于移动客服领域较为专业,涉及查询、咨询、办理、发送等几十个业务流程和两千个具体业务。如果使用现有的技术方案,需要准备大量标准问题和答案覆盖两个维度的组合情况,这就需要消耗大量人力和资源,而且后期维护、更新数据成本很高。另外,即使数据库里存储了很多数据,也会出现数据稀疏的情况,从而造成检索结果不准确。
[0060] 3、准备问题答案库的这种解决方式,并没有特别关注区分用户在动作和业务两个维度上用户表达的细微差别。并且用户问题中每个词都有可能有多种说法或者同义词,每个词语的同义词组合数量将会成倍增加,给准备标准问题库带来了更大难度。
[0061] 换句话说,当基于问题答案库的方式应用到移动客服领域时,会存在以下技术问题:
[0062] 1、在运营商智能客服的回答问题不准确,相似相关问题难以区分。同义词识别能力差,问题中每个词的同义词在问题库中都需要穷举,算法泛化能力差。
[0063] 2、为全面覆盖用户问题,需要准备海量问题答案库,人工工作量大。且覆盖不够均匀和全面。后续运营过程中,知识更新成本大,人工制作问题,容易出错,不易管理。
[0064] 同时,发明人还发现:在移动客服领域用户提出的问题都是有明确的动作和业务分类的。比如:“我想搞个异地充值”,动作是:办理,业务是:移动充值。再比如“手机报我不要了,下月撤销吧”,动作是:取消,业务是:手机报。
[0065] 基于此,在本发明的各种实施例中,对用户问题在动作和业务两个维度采用有监督的机器学习算法,进行分类和识别处理,如此,能够准确识别用户的需求,实现准确的系统响应。
[0066] 本发明实施例提供了一种业务处理方法,应用于移动智能客服系统,如图1所示,该方法包括:
[0067] 步骤101:获取用户问题;
[0068] 这里,实际应用时,获取的用户问题的呈现形式可以是语音形式或文本形式等。
[0069] 步骤102:将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;
[0070] 其中,为了后续能快速地查找到用户问题对应的业务逻辑,以便进行相应的应答处理,获取到所述用户问题后,可以先对所述用户问题进行分词处理,具体包括:清洗、分词,其中,所述清洗是指:去掉停用词、不合法符号等。
[0071] 其中,所述分词的目的是将用户问题划分成多个词语。
[0072] 将分词处理后的用户问题通过动作分类器,形成动作分类概率向量;并将分词处理后的用户问题通过业务分类器,形成业务分类概率向量。
[0073] 所述分类器实际上是一种分类模型,具体来说,是一种基于训练样本,所建立的分类模型。
[0074] 实际应用时,动作分类器和业务分类器是有监督分类的分类器,可以选取LOGISTIC、深度神经网络(DNN)、卷积神经网络(CNN)、循环神经网络(RNN)等多种可以输出分类结果概率分布的分类模型训练而成。
[0075] 步骤103:利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;
[0076] 具体地,将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。
[0077] 步骤104:在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;
[0078] 这里,所述信息维度表为由动作、业务所形成的二维表。
[0079] 实际应用时,如图2所示,根据用户问题的动作(行)和业务(列)组成一个二维的信息维度表,中间部分填写对应问题的答案,即业务逻辑。比如:介绍这一行,应该是通话详单的介绍,入网规则的介绍,密码的介绍等等。办理这一行,应该填写办理方法或直接开始引导用户办理相应的业务。
[0080] 需要说明的是:所述二维表中并不是每个(n,m)坐标对应的格子中都有对应的知识。举个例子来说,假设动作是办理,业务是套餐,所以有:办理+套餐。但是没有动作是办理,业务是详单,即没有:办理+详单,因为这不是一个合法的业务逻辑。只有查询+详单,或者介绍+详单是合法的业务逻辑。
[0081] 步骤105:根据确定的业务逻辑,完成对所述用户问题的应答处理。
[0082] 具体地,根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。
[0083] 这里,本发明实施例的方案,确定所述用户问题对应的动作分类标签及业务分类标签时,先用最高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,查找到对应的业务逻辑时,根据确定的业务逻辑,完成对所述用户问题的应答处理;当未查找到对应的业务逻辑时,再用次高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,查找到对应的业务逻辑时,根据确定的业务逻辑,完成对所述用户问题的应答处理;当未查找到对应的业务逻辑时,再用第三高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0084] 其中,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的置信度。
[0085] 具体地,将动作分类概率向量中每个动作分类概率与第一值求积;所述第一值表征动作和业务权证调节参数;
[0086] 将业务分类概率向量中每个业务分类概率与第二值求积;所述第二值与第一值之和满足预设条件;
[0087] 针对每个动作分类概率与第一值求积的结果,将其与每个业务分类概率与第二值求积的结果求和,形成一个集合;
[0088] 在确定所述用户问题对应的业务逻辑时,按照求和结果从大到小的顺序,从集合中依次选择一个求和结果,选择的求和结果对应的动作分类概率的类别为所述用户问题对应的动作分类标签,选择的求和结果对应的业务分类概率的类别为所述用户问题对应的业务分类标签。
[0089] 其中,所述预设条件是指:第一值与第二值之和等于1。
[0090] 上述过程中,确定次高置信度用公式表达则有:在动作分类概率不等于最大动作分类概率或业务分类概率不等于最大业务分类概率的条件下,使最大化:MAX(rate*ACTIONn+(1-rate)ENTITYn)。相应地,确定其他置信度可以采用类似的公式。即查找时,每次取除去已使用的动作分类概率及对应的业务分类概率外的其它动作分类概率及对应的业务分类概率求和结果的最大值所对应的动作分类概率及对应的业务分类概率,去信息维度表中查找对应的业务逻辑。
[0091] 这里,rate表示第一值,1-rate表示第二值;ACTIONn表示一个动作分类概率,ENTITYn表示一个业务分类概率。
[0092] 所述已使用的动作分类概率及对应的业务分类概率是指:在所述信息维度表中已确定未查找到对应业务逻辑的动作分类概率及对应的业务分类概率。
[0093] 本发明实施例提供的业务处理方法,获取用户问题;将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;根据确定的业务逻辑,完成对所述用户问题的应答处理,对用户问题在动作和业务两个维度采用有监督的机器学习算法,进行分类和识别处理,如此,能够准确识别用户的需求,进而能够准确解答和处理问题。
[0094] 另外,先用最高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,查找到对应的业务逻辑时,根据确定的业务逻辑,完成对所述用户问题的应答处理;当未查找到对应的业务逻辑时,再用次高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,查找到对应的业务逻辑时,根据确定的业务逻辑,完成对所述用户问题的应答处理;当未查找到对应的业务逻辑时,再用第三高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑,当两个分类概率接近时,通过上述过程能够去掉歧义,如此,能够进一步确识别用户的需求,进而能够准确解答和处理问题。
[0095] 结合上面的描述,对于一个用户问题的识别及应答过程,如图3所示,包括以下步骤:
[0096] 步骤301:对语音形式的用户问题进行分词处理;
[0097] 具体地,对用户问题进行清洗,去掉停用词和不合法符号;然后进行分词处理。
[0098] 步骤302:处理后的用户问题通过动作分类器,形成动作分类概率向量;
[0099] 这里,动作分类概率向量可以表达为ACTION=[ACTION1,ACTION2…ACTIONn],其中ACTIONn为该问题是第N个动作类别的概率。
[0100] 这里,概率最大的类别为该句子(即用户问题)的动作分类结果,即作为用户问题的动作分类标签。
[0101] 步骤303:处理后的用户问题通过业务分类器,形成业务分类概率向量;
[0102] 这里,业务分类概率向量可以表达为ENTITY=[ENTITY1,ENTITY2…ENTITYn],其中ENTITYn为该问题是第N个业务类别的概率。
[0103] 这里,概率最大的类别为该句子(即用户问题)的业务分类结果,即作为用户问题的业务分类标签。
[0104] 需要说明的是:实际应用时,步骤302、303的执行顺序可以不分先后,比如可以先执行步骤302,再执行步骤303;也可以先执行步骤303,再执行步骤302;还可以同时执行步骤302、303。
[0105] 步骤304:根据用户问题的动作分类标签和它的业务分类标签,在信息维度表中查询;
[0106] 步骤305:检查对应位置(比如:m行,n列)是否有对应的知识(即业务逻辑);如果没有,则执行步骤306,否则执行步骤307;
[0107] 步骤306:未查找到对应的知识,选择低一级置信度的用户问题,之后执行步骤304;
[0108] 这里,未查找到对应的知识,说明不存在对应的问题。举个例子来说,根据两个维度语义分类,发现对应语义为取消+详单。然而不存在这样的业务逻辑。说明分类结果有误。可能是因为对用户问题分类不准确。
[0109] 可以根据如下公式选取次高置信度的用户语义理解:
[0110] 根据ACTION向量和ENTITY向量中的概率分布,搜索:
[0111] 在维度信息库中搜索(n,m),在动作分类不等于最大动作标签或业务不等于原最大业务分类标签的条件下,使最大化:MAX(rate*ACTIONn+(1-rate)ENTITYn)。
[0112] 其中rate为动作和业务权证调节参数。实际应用时,rate可以根据经验进行取值,比如可以取值为0.5,表示ACTION和ENTITY同等重要。当然,也可以取其他值,比如当ACTION比ENTITY更重要时,即ACTION优先时,可以将取值大于0.5等。
[0113] 依次选择次高置信度的用户语义理解,当重新执行步骤304,未查找到对应的知识时,再选择第三高置信度的用户语义理解,执行步骤304,如此循环,直到查找到对应的知识,从而输出答案。
[0114] 其中,当最终也未查找到对应的知识时,向用户输出预置的话语,比如:不好意思,不知道您在说什么等。
[0115] 步骤307:查找到对应的知识,代表两个分类结果都是正确的,定位到了用户问题对应的动作和业务,根据相应知识输出对应的回答或引导用户完成相应的办理流程,即输出答案。
[0116] 从上面的描述可以看出,本发明实施例提供的方案,是结合动作、业务两个维度分类的方法对用户问题进行语义理解的智能客服系统和实现用户问题回答的方案。
[0117] 总的来说,本发明实施例的方案具有以下优点:
[0118] 首先,目前用户问题的语义理解,都是在已有问答库中检索最相近问题及后续的二次排序或综合排序。对于近似问题的识别不准确,而本发明实施例的方案是利用分类器和标注语料,可以在近似问题中实现动作和业务两个维度的准确分类,从而能够准确理解用户问题。
[0119] 其次,由于移动客服领域较为专业,涉及查询、咨询、办理、发送等几十个业务流程和两千个具体业务。如果使用目前的技术方案,需要准备大量标准备问题和答案覆盖两个维度的组合情况。需要消耗大量人力和资源,而本发明实施例的方案可以从动作和业务两个维度,分解知识结果,大量语料可以复用,解决了训练语料稀疏的问题。同时后续知识维护、修改的成本也能够大大降低。
[0120] 第三,通过二维知识库的形式,矫正了分类器结果不准的问题,通过合法业务逻辑进行歧义消除,可以方便地把业务逻辑知识引入到问题语义理解系统中。
[0121] 为实现本发明实施例的方法,本发明实施例还提供了一种业务处理装置,如图4所示,所述装置包括:
[0122] 获取单元41,用于获取用户问题;
[0123] 分类单元,用于将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;
[0124] 确定单元42,用于利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;
[0125] 查找单元43,用于在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;
[0126] 处理单元44,用于根据确定的业务逻辑,完成对所述用户问题的应答处理。
[0127] 这里,实际应用时,获取的用户问题的呈现形式可以是语音形式或文本形式等。
[0128] 其中,为了后续能快速地查找到用户问题对应的业务逻辑,以便进行相应的应答处理,获取到所述用户问题后,可以先对所述用户问题进行分词处理,具体包括:清洗、分词,其中,所述清洗是指:去掉停用词、不合法符号等。
[0129] 其中,所述分词的目的是将用户问题划分成多个词语。
[0130] 将分词处理后的用户问题通过动作分类器,形成动作分类概率向量;并将分词处理后的用户问题通过业务分类器,形成业务分类概率向量。
[0131] 所述分类器实际上是一种分类模型,具体来说,是一种基于训练样本,所建立的分类模型。
[0132] 实际应用时,动作分类器和业务分类器是有监督分类的分类器,可以选取LOGISTIC、DNN、CNN、RNN等多种可以输出分类结果概率分布的分类模型训练而成。
[0133] 在一实施例中,所述确定单元42,具体用于:
[0134] 将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。
[0135] 实际应用时,如图2所示,根据用户问题的动作(行)和业务(列)组成一个二维的信息维度表,中间部分填写对应问题的答案,即业务逻辑。比如:介绍这一行,应该是通话详单的介绍,入网规则的介绍,密码的介绍等等。办理这一行,应该填写办理方法或直接开始引导用户办理相应的业务。
[0136] 需要说明的是:所述二维表中并不是每个(n,m)坐标对应的格子中都有对应的知识。举个例子来说,假设动作是办理,业务是套餐,所以有:办理+套餐。但是没有动作是办理,业务是详单,即没有:办理+详单,因为这不是一个合法的业务逻辑。只有查询+详单,或者介绍+详单是合法的业务逻辑。
[0137] 这里,本发明实施例的方案,确定所述用户问题对应的动作分类标签及业务分类标签时,先用最高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,查找到对应的业务逻辑时,根据确定的业务逻辑,完成对所述用户问题的应答处理;当未查找到对应的业务逻辑时,再用次高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,查找到对应的业务逻辑时,根据确定的业务逻辑,完成对所述用户问题的应答处理;当未查找到对应的业务逻辑时,再用第三高置信度对应的动作分类标签及业务分类标签,在所述信息维度表中查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0138] 基于此,在一实施例中,所述确定单元42,还用于当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;
[0139] 所述查找单元43,还要同于在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;
[0140] 当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,所述确定单元42利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,所述查找单元43去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0141] 其中,所述确定单元42利用动作分类概率向量及业务分类概率向量,确定所述用户问题的置信度。
[0142] 具体地,所述确定单元42将动作分类概率向量中每个动作分类概率与第一值求积;所述第一值表征动作和业务权证调节参数;
[0143] 所述确定单元42将业务分类概率向量中每个业务分类概率与第二值求积;所述第二值与第一值之和满足预设条件;
[0144] 所述确定单元42针对每个动作分类概率与第一值求积的结果,将其与每个业务分类概率与第二值求积的结果求和,形成一个集合;
[0145] 在确定所述用户问题对应的业务逻辑时,所述确定单元42按照求和结果从大到小的顺序,从集合中依次选择一个求和结果,选择的求和结果对应的动作分类概率的类别为所述用户问题对应的动作分类标签,选择的求和结果对应的业务分类概率的类别为所述用户问题对应的业务分类标签。
[0146] 其中,所述预设条件是指:第一值与第二值之和等于1。
[0147] 上述过程中,确定次高置信度用公式表达则有:在动作分类概率不等于最大动作分类概率或业务分类概率不等于最大业务分类概率的条件下,使最大化:MAX(rate*ACTIONn+(1-rate)ENTITYn)。相应地,确定其他置信度可以采用类似的公式。即查找时,每次取除去已使用的动作分类概率及对应的业务分类概率外的其它动作分类概率及对应的业务分类概率求和结果的最大值所对应的动作分类概率及对应的业务分类概率,去信息维度表中查找对应的业务逻辑。
[0148] 这里,rate表示第一值,1-rate表示第二值;ACTIONn表示一个动作分类概率,ENTITYn表示一个业务分类概率。
[0149] 所述已使用的动作分类概率及对应的业务分类概率是指:在所述信息维度表中已确定未查找到对应业务逻辑的动作分类概率及对应的业务分类概率。
[0150] 所述处理单元44,具体用于:
[0151] 根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。
[0152] 需要说明的是:上述实施例提供的业务处理装置在进行业务处理时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。
[0153] 对应地,本发明实施例还提供了一种业务处理装置,如图5所示,该业务处理装置50包括:处理器51和用于存储能够在处理器上运行的计算机程序的存储器52,[0154] 其中,所述处理器51用于运行所述计算机程序时,执行:
[0155] 获取用户问题;
[0156] 将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;
[0157] 利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;
[0158] 在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;
[0159] 根据确定的业务逻辑,完成对所述用户问题的应答处理。
[0160] 其中,在一实施例中,所述处理器51用于运行所述计算机程序时,执行:
[0161] 将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。
[0162] 这里,所述处理器51用于运行所述计算机程序时,还执行:
[0163] 当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;
[0164] 在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;
[0165] 当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,并去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0166] 在一实施例中,所述处理器51还用于运行所述计算机程序时,执行:
[0167] 所述确定所述用户问题的置信度时,将动作分类概率向量中每个动作分类概率与第一值求积;所述第一值表征动作和业务权证调节参数;
[0168] 将业务分类概率向量中每个业务分类概率与第二值求积;所述第二值与第一值之和满足预设条件;
[0169] 针对每个动作分类概率与第一值求积的结果,将其与每个业务分类概率与第二值求积的结果求和,形成一个集合;
[0170] 在确定所述用户问题对应的业务逻辑时,按照求和结果从大到小的顺序,从集合中依次选择一个求和结果,选择的求和结果对应的动作分类概率的类别为所述用户问题对应的动作分类标签,选择的求和结果对应的业务分类概率的类别为所述用户问题对应的业务分类标签。
[0171] 在一实施例中,所述处理器51用于运行所述计算机程序时,执行:
[0172] 根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。
[0173] 在一实施例中,所述处理器51还用于运行所述计算机程序时,执行:
[0174] 形成动作分类概率向量和业务分类概率向量之前,对所述用户问题进行分词处理。
[0175] 当然,实际应用时,如图5所示,该装置50还可以包括:至少一个网络接口53。业务处理装置50中的各个组件通过总线系统54耦合在一起。可理解,总线系统54用于实现这些组件之间的连接通信。总线系统54除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统54。
[0176] 其中,可以理解,存储器52可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,Synchronous Dynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器52旨在包括但不限于这些和任意其它适合类型的存储器。
[0177] 本发明实施例中的存储器52用于存储各种类型的数据以支持业务处理装置50的操作。这些数据的示例包括:用于在业务处理装置50上操作的任何计算机程序,如操作系统521和应用程序522。其中,操作系统521包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序522可以包含各种应用程序,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序522中。
[0178] 上述本发明实施例揭示的方法可以应用于处理器51中,或者由处理器51实现。处理器51可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器51中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器51可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器51可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器52,处理器51读取存储器52中的信息,结合其硬件完成前述方法的步骤。
[0179] 在示例性实施例中,业务处理装置50可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
[0180] 在示例性实施例中,本发明实施例还提供了一种计算机可读存储介质,例如包括计算机程序的存储器52,上述计算机程序可由业务处理装置的处理器51执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
[0181] 具体地,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器运行时,执行:
[0182] 获取用户问题;
[0183] 将所述用户问题通过动作分类器,形成动作分类概率向量;并将所述用户问题通过业务分类器,形成业务分类概率向量;
[0184] 利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签;
[0185] 在信息维度表中查找所述用户问题的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;所述信息维度表为由动作、业务所形成的二维表;
[0186] 根据确定的业务逻辑,完成对所述用户问题的应答处理。
[0187] 在一实施例中,所述计算机程序被处理器运行时,执行:
[0188] 所述利用所述动作分类概率向量及业务分类概率向量,确定所述用户问题对应的动作分类标签及业务分类标签,包括:
[0189] 将动作分类概率向量中概率最大的类别作为所述用户问题的动作分类标签;并将业务分类概率向量中概率最大的类别作为所述用户问题的业务分类标签;所述动作分类概率向量中最大概率及业务分类概率向量中最大概率形成所述用户问题的最高置信度。
[0190] 其中,在一实施例中,所述计算机程序被处理器运行时,还执行:
[0191] 当在所述信息维度表中未查找到所述最高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的次高置信度;
[0192] 在信息维度表中查找所述用户问题的次高置信度对应的动作分类标签及业务分类标签,确定所述用户问题对应的业务逻辑;并根据确定的业务逻辑,完成对所述用户问题的应答;
[0193] 当在所述信息维度表中未查找到所述次高置信度对应的动作分类标签及业务分类标签对应的业务逻辑时,利用动作分类概率向量及业务分类概率向量,确定所述用户问题的第三高置信度,并去查找对应的业务逻辑,以此类推,直至查找到所述用户问题对应的业务逻辑。
[0194] 在一实施例中,所述计算机程序被处理器运行时,执行:
[0195] 所述确定所述用户问题的置信度时,将动作分类概率向量中每个动作分类概率与第一值求积;所述第一值表征动作和业务权证调节参数;
[0196] 将业务分类概率向量中每个业务分类概率与第二值求积;所述第二值与第一值之和满足预设条件;
[0197] 针对每个动作分类概率与第一值求积的结果,将其与每个业务分类概率与第二值求积的结果求和,形成一个集合;
[0198] 在确定所述用户问题对应的业务逻辑时,按照求和结果从大到小的顺序,从集合中依次选择一个求和结果,选择的求和结果对应的动作分类概率的类别为所述用户问题对应的动作分类标签,选择的求和结果对应的业务分类概率的类别为所述用户问题对应的业务分类标签。
[0199] 在一实施例中,所述计算机程序被处理器运行时,执行:
[0200] 根据所述业务逻辑,输出对所述用户问题的回答,或者引导用户完成相应业务的办理。
[0201] 在一实施例中,所述计算机程序被处理器运行时,还执行:
[0202] 形成动作分类概率向量和业务分类概率向量之前,对所述用户问题进行分词处理。
[0203] 以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。