一种智能客服解决率预测方法和系统以及多业务预测模型转让专利

申请号 : CN202010461703.X

文献号 : CN111369080B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 龙翀王雅芳王颖于浩淼

申请人 : 支付宝(杭州)信息技术有限公司

摘要 :

本申请公开了一种智能客服解决率预测方法,该方法包括:获取请求平台内某业务领域客服的请求者的身份标识;基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列;基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率。

权利要求 :

1.一种智能客服解决率预测方法,其包括:

获取请求平台内某业务领域客服的请求者的身份标识;

基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列;其中,所述业务因子至少反映请求者在所述某业务领域的状态信息,所述共性因子至少反映请求者的个人属性信息,所述行为序列反映请求者在平台内的历史操作行为信息;

基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率;其中,所述多业务预测模型具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,且所述多业务预测模型利用来自所述多个业务领域的样本数据训练得到。

2.如权利要求1所述的方法,其中,所述基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率,包括:基于第一编码网络处理所述业务因子,得到业务因子向量;

基于第二编码网络处理所述共性因子,得到共性因子向量;

基于第三编码网络处理所述行为序列,得到行为序列向量;

将所述业务因子向量、共性因子向量以及行为序列向量拼接得到融合向量;

基于多业务输出层处理所述融合向量,在所述某业务领域对应的智能客服解决概率输出端处得到所述请求者在所述某业务领域对应的智能客服解决概率。

3.如权利要求2所述的方法,其中,所述第一编码网络与第二编码网络均为深度神经网络;

所述第三编码网络为循环神经网络。

4.如权利要求2所述的方法,其中:

所述多业务输出层为多层感知器或全连接层。

5.一种智能客服解决率预测系统,其包括:

获取模块,用于获取请求平台内某业务领域客服的请求者的身份标识;

提取模块,用于基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列;其中,所述业务因子至少反映请求者在所述某业务领域的状态信息,所述共性因子至少反映请求者的个人属性信息,所述行为序列反映请求者在平台内的历史操作行为信息;

处理模块,用于基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率;其中,所述多业务预测模型具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,且所述多业务预测模型利用来自所述多个业务领域的样本数据训练得到。

6.如权利要求5所述的系统,其中,所述处理模块还用于:基于第一编码网络处理所述业务因子,得到业务因子向量;

基于第二编码网络处理所述共性因子,得到共性因子向量;

基于第三编码网络处理所述行为序列,得到行为序列向量;

将所述业务因子向量、共性因子向量以及行为序列向量拼接得到融合向量;

基于多业务输出层处理所述融合向量,在所述某业务领域对应的智能客服解决概率输出端处得到所述请求者在所述某业务领域对应的智能客服解决概率。

7.如权利要求6所述的系统,其中,所述第一编码网络与第二编码网络均为深度神经网络;

所述第三编码网络为循环神经网络。

8.如权利要求6所述的系统,其中:

所述多业务输出层为多层感知器或全连接层。

9.一种智能客服解决率预测装置,其中,包括处理器以及存储介质,所述存储介质用于存储计算机指令,所述处理器用于执行所述计算机指令中的至少一部分以实现如权利要求

1 4中任一项所述的方法。

~

10.一种多业务预测模型,其包括:

输入层,用于获取与请求平台内某业务领域客服的请求者相关的业务因子、共性因子以及行为序列;其中,所述业务因子至少反映请求者在所述某业务领域的状态信息,所述共性因子至少反映请求者的个人属性信息,所述行为序列反映请求者在平台内的历史操作行为信息;

编码层,用于基于第一编码网络处理所述业务因子,得到业务因子向量;用于基于第二编码网络处理所述共性因子,得到共性因子向量;以及用于基于第三编码网络处理所述行为序列,得到行为序列向量;

多业务输出层,具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,所述多业务输出层用于对所述业务因子向量、共性因子向量以及行为序列向量拼接得到的融合向量进行处理,并在多个输出端输出对应的概率,其中所述某业务领域对应的智能客服解决概率输出端输出的概率为有效概率。

11.如权利要求10所述的模型,其中,所述第一编码网络与第二编码网络均为深度神经网络;

所述第三编码网络为循环神经网络。

12.一种如权利要求10或11任一项所述的多业务预测模型的训练方法,其包括:获取来自多业务领域的训练样本,所述训练样本包括样本业务因子、样本共性因子、样本行为序列以及标签;其中,样本业务因子至少反映样本用户在对应的业务领域的状态信息,共性因子至少反映样本用户的个人属性信息,行为序列反映样本用户在平台内或者在平台内对应的业务领域的历史操作行为信息,标签反映样本用户是否在对应的业务领域通过智能客服成功解决其请求;

将所述训练样本中的样本业务因子、样本共性因子以及样本行为序列作为多业务预测模型的输入,调整所述多业务预测模型的参数,使得多业务预测模型输出的该训练样本所属的业务领域对应的智能客服解决概率与该训练样本的标签的差异最小化。

说明书 :

一种智能客服解决率预测方法和系统以及多业务预测模型

技术领域

[0001] 本申请涉及机器学习领域,特别涉及一种智能客服解决率预测方法和系统以及多业务预测模型。

背景技术

[0002] 智能客服是在大规模知识处理基础上发展起来的一项技术,其适用大规模知识处理、自动问答系统等技术行业,用于减少人工客服压力,并提升用户体验。
[0003] 在一些应用场景中,智能客服并不能完全替代人工客服,那么针对用户的客服请求,在某具体场景下选择为用户提供智能客服或者人工客服,在很大程度关系到用户所发起请求的解决率。

发明内容

[0004] 本申请实施例之一提供一种智能客服解决率预测方法。所述方法包括:获取请求平台内某业务领域客服的请求者的身份标识;基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列;其中,业务因子至少反映请求者在所述某业务领域的状态信息,共性因子至少反映请求者的个人属性信息,行为序列反映请求者在平台内或者在平台内所述某业务领域的历史操作行为信息;基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率;其中,所述多业务预测模型具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,且所述多业务预测模型利用来自所述多个业务领域的样本数据训练得到。
[0005] 本申请实施例之一提供一种智能客服解决率预测系统,该系统包括:获取模块,用于获取请求平台内某业务领域客服的请求者的身份标识;提取模块,用于基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列;其中,业务因子至少反映请求者在所述某业务领域的状态信息,共性因子至少反映请求者的个人属性信息,行为序列反映请求者在平台内或者在平台内所述某业务领域的历史操作行为信息;处理模块,用于基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率;其中,所述多业务预测模型具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,且所述多业务预测模型利用来自所述多个业务领域的样本数据训练得到。
[0006] 本申请实施例之一提供一种智能客服解决率预测装置,包括处理器以及存储质,所述存储介质用于存储计算机指令,所述处理器用于执行所述计算机指令中的至少一部分以实现智能客服解决率预测方法。
[0007] 本申请实施例之一提供一种多业务预测模型,该模型包括:输入层,用于获取与请求平台内某业务领域客服的请求者相关的业务因子、共性因子以及行为序列;其中,业务因子至少反映请求者在所述某业务领域的状态信息,共性因子至少反映请求者的个人属性信息,行为序列反映请求者在平台内或者在平台内所述某业务领域的历史操作行为信息;编码层,用于基于第一编码网络处理所述业务因子,得到业务因子向量;用于基于第二编码网络处理所述共性因子,得到共性因子向量;以及用于基于第三编码网络处理所述行为序列,得到行为序列向量;多业务输出层,具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,所述多业务输出层用于对所述业务因子向量、共性因子向量以及行为序列向量拼接得到的融合向量进行处理,并在多个输出端输出对应的概率,其中所述某业务领域对应的智能客服解决概率输出端输出的概率为有效概率。

附图说明

[0008] 本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
[0009] 图1是根据本申请一些实施例所示的一种智能客服解决率预测系统应用场景的结构化流程图;
[0010] 图2是根据本申请一些实施例所示的一种智能客服解决率预测方法的示例性流程图;
[0011] 图3是根据本申请一些实施例所示的一种多业务预测模型的结构示意图;
[0012] 图4是根据本申请一些实施例所示的一种多业务预测系统的示例性系统框图。

具体实施方式

[0013] 为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
[0014] 应当理解,本文使用的“服务端”、“平台”、“后台”、“服务器”等可以互换,“用户端”、“用户终端”、“请求者”、“前端”、“用户设备”等可以互换。本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
[0015] 如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
[0016] 本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
[0017] 图1是根据本申请一些实施例所示的一种智能客服解决率预测系统应用场景的结构化流程图。
[0018] 如图1所示,在一些实施例中,智能客服解决率预测系统100的应用场景还包括请求者110和服务端120。
[0019] 在一些实施例中,请求者110可以通过用户终端发起客服请求,用户终端可以是部署有服务平台前端(如APP、小程序等)的设备,用户通过用户终端在平台上发起客服请求。用户终端可以包括但不限于移动设备、平板电脑、笔记本电脑、台式电脑等或其任意组合。
在一些实施例中,移动设备可以包括但不限于智能家居设备、可穿戴设备、智能移动设备、增强现实设备等或其任意组合在一些实施例中,可穿戴设备可以包括智能手镯、智能鞋袜、智能眼镜、智能头盔、智能手表、智能衣物、智能背包、智能配饰等或其任意组合。在一些实施例中,智能移动设备可以包括智能手机、个人数字助理(PDA)、游戏设备、导航设备、POS机等或其任意组合。在一些实施例中,用户终端可以直接采用拨打电话(移动通讯或网络电话等)的形式发起客服请求。
[0020] 在一些实施例中,服务端120可以包含一个或多个子处理设备(如:单核处理器或多核处理器)。仅仅作为范例,服务端120可包含中央处理器(CPU)、专用集成电路(ASIC)、专用指令处理器(ASIP)、图形处理器(GPU)、物理处理器(PPU)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编辑逻辑电路(PLD)、控制器、微控制器单元、精简指令集电脑(RISC)、微处理器等或以上任意组合。在一些实施例中,服务端120可以是部署有服务平台后端的服务器。所述服务平台可以是线上的购物平台、支付平台、信息查询平台、金融理财平台等能够提供任意类型服务的平台。服务端120部署有客服服务,以针对用户在平台服务使用过程中的疑问或者咨询等客服请求进行处理。在一些实施例中,客服服务可以是人工客服(如人工在线应答或者人工电话应答),也可以是智能客服(如在线应答机器人)。
[0021] 在一些实施例中,请求者110向服务端120发起客服请求,通常是采用人工客服对请求者110进行协助或解答,然而在不同的日期(工作日、周末或购物节),或者同一天不同的时间段(白天或晚上),用户发起客服请求的频率是不一样的,在客服请求的高峰时间段如果调度不好的话,会极大延长请求者110的等待时间,甚至让请求者110的诉求无法得到及时的解决,从而极大影响用户体验。
[0022] 针对上述问题,在一些实施例中,服务端120可以在高峰时段针对请求者110发起的客服请求,根据所属业务类型(如某服务平台可以提供购物、支付、理财等不同业务领域或类型的服务)的不同,将客服请求进行分流后,根据按照用户特点的不同以及接受能力的不同,推荐一部分合适的用户退出人工客服,而采用智能客服(APP、在线问答等)得到他们想要的答案,这样能够减轻高峰时段人工客服的压力,缩短用户等待时间,提高用户的满意度。
[0023] 为了找准适合采用智能客服的请求者110,在一些实施例中,通过各业务类型历史智能客服解决成功的样例作为训练样本,基于经典的分类问题(Classification)的方式得到服务分流模型,请求者110发起客服请求后,利用服务分流模型对请求者110进行判断,当模型认为该请求者110适合采用人工客服,可以使请求者110继续排队等待,当模型认为该请求者110适合采用智能客服,可以向客户推荐智能客服或直接接入智能语音服务等。但训练样本中各个业务类型规模不同,例如最大规模业务类型训练样本数量可能是最小规模业务类型训练样本的几十倍,这样导致训练出来的模型对于较小规模业务类型的判断不准确。此外,随着平台规模变大或营业范围的扩大,业务领域也相应的增多,当出现新的业务类型时,由于训练数据不足,容易出现模型无法判断请求者110适用于人工客服还是智能客服(称为“冷启动”问题),可能造成人工客服压力增大或者客服分流错误,导致请求者体验不佳。
[0024] 在一些实施例中,为了增加模型的适应性并减少对训练样本的依赖,采用基于深度学习(Deep Learning)的方法对模型进行训练,并且训练时将用户信息中具有共性的一部分信息进行分离并加以利用,减小部分业务类型训练效果不佳的情况,进而提出了一种智能客服解决率预测方法以及一种多业务预测模型。智能客服解决率预测方法通过训练得到的多业务预测模型对请求者110进行判断,得到智能客服解决概率,服务端120可以通过该智能客服解决概率决定是否采用智能客服。
[0025] 图2是根据本申请一些实施例所示的一种智能客服解决率预测方法的示例性流程图。
[0026] 图2所示的一种智能客服解决率预测方法200,至少包括以下步骤:
[0027] 步骤210,获取请求平台内某业务领域客服的请求者的身份标识。在一些实施例中,步骤210可以由获取模块执行。
[0028] 身份标识为能够唯一标识平台内用户身份的信息,例如电话号码或用户账户等。在一些实施例中。获取身份标识的方式包括用户主动输入电话号码或账户名称等,其中输入形式可以是文本或者语音等。此外,在一些实施例中,当用户通过拨打客服电话时,平台可以获取用户的呼出号码,若呼出号码在平台内已经与某一账户进行绑定时,可以直接获取该电话号码作为身份标识。
[0029] 步骤220,基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列。在一些实施例中,步骤220可以由提取模块执行。
[0030] 在一些实施例中,平台数据库内存储有关于用户(请求者)的相关信息,相关信息可以理解为用户在平台内留下的任意数据。在一些实施例中,相关信息能够反映用户的个人属性,如年龄、所在地、性别、职业等,或者反映用户在平台内不同业务领域内的状态信息,其包括但不限于:用户是否是某业务领域的用户或会员,或所述相关信息可以反映用户在该平台内的历史操作行为或行为轨迹,所述操作行为可以包括但不限于在过去的一段历史时间(过去一周、三个月或一年等等)内:用户开通了什么功能、向客服咨询的什么问题、购买了什么商品或做了什么评价等。通过步骤210中获取的身份标识可以将请求者与其对应的相关信息建立连接。
[0031] 基于所述请求者的身份标识可以从相关信息中提取与所述请求者相关的业务因子、共性因子以及行为序列。其中,业务因子至少反映请求者在所述某业务领域的状态信息,共性因子至少反映请求者的个人属性信息,行为序列反映请求者在平台内或者在平台内所述某业务领域的历史操作行为信息。
[0032] 在一些实施例中,业务因子所反映的状态信息可以是,是否为某业务领域的会员或注册用户。例如,在业务领域为保险业务时,业务因子可以是用户是否开通了某保险业务;又例如在业务领域为安全业务时,业务因子可以是在过去24小时内是否出现密码验证错误的情形。需要说明的是,以上业务领域及其对应的业务因子仅作为示例,在其他具体实施方式中,上述业务领域还可以是理财业务等,在业务领域为安全业务时,业务因子还可以是上一次登录时的IP地址。
[0033] 在一些实施例中,共性因子所反映的个人属性信息可以包括平台数据库内存储有关于用户如年龄、所在地、性别、职业等信息。进一步的,共性因子可以包括与业务领域关联性较小或者可以在各不同业务领域通用的任意信息。
[0034] 在一些实施例中,行为序列可以是在业务领域内的行为轨迹点,也可以是平台内其他领域的行为轨迹点,或者上述两者皆有。行为序列包括多个行为轨迹点,每个行为轨迹点可以对应一个历史操作行为。例如,继续采用业务领域为保险业务和安全业务为例,在安全业务中,行为序列可以是密码找回页面点击情况,分别进行了哪些操作(包括点击、输入等);在保险业务中,行为序列可以是在保险业务页面进行了哪些操作(包括点击、输入等)。在一些实施例中,上述历史操作行为可以是发生客服请求过去的三个月、一个月或一个星期等。
[0035] 步骤230,基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率。在一些实施例中,步骤230可以由处理模块执行。
[0036] 智能客服解决概率即该请求者在当前业务领域通过智能客服能解决其问题的概率。在一些实施例中,智能客服能够给使用者提供快捷的客服工作,并且减轻人工客服的工作量,但并不是所有用户的所有问题都适用于智能客服,因为不同用户提出的问题不同,因此适合自助解决的程度也不一样。例如,对年纪较大的请求者,采用智能客服能够解决问题的概率较低,故人工客服渠道可能更为适合;此外,对于“密码被盗”一类比较敏感的问题来说,采用人工客服的方法或许让用户从心理层面上觉得更安全。
[0037] 在步骤230中,所述多业务预测模型具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,且所述多业务预测模型利用来自所述多个业务领域的样本数据训练得到。在一些实施例中,多业务预测模型能够根据输入的业务因子、共性因子和行为序列所属的业务领域输出对应的智能客服解决概率,智能客服解决概率能够表示智能客服解决概率,即该请求者在当前业务领域通过智能客服能解决其问题的概率。在一些实施例中,平台可以进一步根据该智能客服解决概率来判断该客服请求采用智能客服或人工客服。
[0038] 在一些实施例中,多业务预测模型在实际运行时,根据其模型结构和训练的情况,针对输入的业务因子、共性因子和行为序列可能在保险业务和安全业务分别输出一个概率,此时将请求所发起客服请求的业务领域对应的概率作为智能客服解决概率,其余业务领域的智能客服解决概率输出端输出的结果视为无效。
[0039] 在一些实施例中,步骤230包括:基于第一编码网络处理所述业务因子,得到业务因子向量;基于第二编码网络处理所述共性因子,得到共性因子向量;基于第三编码网络处理所述行为序列,得到行为序列向量;将所述业务因子向量、共性因子向量以及行为序列向量拼接得到融合向量;基于多业务输出层处理所述融合向量,在所述某业务领域对应的智能客服解决概率输出端处得到所述请求者在所述某业务领域对应的智能客服解决概率。
[0040] 可以理解的是,业务因子、共性因子以及行为序列经过深度神经网络编码(也可以理解为embedding处理)后可以提取到这些信息中更深层、抽象的特征信息,使得模型预测更加准确。经过编码(或embedding处理)得到的业务因子向量、共性因子向量以及行为序列向量均为向量形式,这些向量可以同维也可以不同维。在融合阶段,如果同维,可以按位相加得到融合向量;如果不同维,也可以将向量拼接为更长的向量或二维矩阵得到融合向量(或融合矩阵)。
[0041] 通过对将可以应用于任何业务领域的共性因子进行分离,分路处理,可以利用训练样本中大量的共性因子对其处理支路(如第二编码网络)进行比较充分的训练,以弥补某些业务邻域训练样本不足对多业务预测模型的整体参数训练不足的缺陷。
[0042] 在一些实施例中,所述第一编码网络与第二编码网络分别为深度神经网络(DNN);所述第三编码网络为循环神经网络(RNN),其可以学习到序列中各历史操作之间的关联关系,在一些实施例中,第三编码网络为长短期记忆网络(LSTM),其可以有效解决长期依赖问题。应当理解,使用深度神经网络(DNN)或循环神经网络(RNN)处理业务因子、共性因子以及行为序列,主要是提取这些信息中的深层特征,最后将深层特征表现为向量形式,进一步进行融合。
[0043] 在一些实施例中,第一编码网络可以使用同一深度神经网络,即业务因子与共性因子的编码都共享一个深度神经网络的权重参数。在其他实施例中,为了更高的训练效率或更好的编码效果,第一编码网络和第二编码网络可以分别为两个深度神经网络。
[0044] 在一些实施例中,步骤230中多业务输出层为多层感知器(MLP)或全连接层(FC)。可以理解,多业务输出层具备多个智能客服解决概率输出端,通过多个智能客服解决概率输出端使得多业务预测模型在执行过程中,能够对不同业务领域的请求者进行预测,对客户服务这类多业务类型的场景适应性好。相应的,多业务输出层的智能客服解决概率输出端针对每个业务领域均输出一个概率,取请求者所请求的业务领域对应的智能客服解决概率输出端输出的概率为有效概率。
[0045] 图3是根据本申请一些实施例所示的一种多业务预测模型的结构示意图。
[0046] 在一些实施例中,该多业务预测模型可以包括输入层、编码层和多业务输出层。
[0047] 输入层,用于获取与请求平台内某业务领域客服的请求者相关的业务因子、共性因子以及行为序列;其中,业务因子至少反映请求者在所述某业务领域的状态信息,共性因子至少反映请求者的个人属性信息,行为序列反映请求者在平台内或者在平台内所述某业务领域的历史操作行为信息。
[0048] 关于业务因子、共性因子以及行为序列相关描述可以在更多描述可以在本说明书的其他地方(如步骤220及其相关描述中)找到,在此不作赘述。
[0049] 编码层,用于基于第一编码网络处理所述业务因子,得到业务因子向量;用于基于第二编码网络处理所述共性因子,得到共性因子向量;以及用于基于第三编码网络处理所述行为序列,得到行为序列向量。
[0050] 关于编码网络和向量的相关描述可以在更多描述可以在本说明书的其他地方(如步骤230及其相关描述中)找到,在此不作赘述。
[0051] 在一些实施例中,编码层中,所述第一编码网络与第二编码网络均为深度神经网络(DNN1和DNN2),所述第三编码网络为循环神经网络(RNN)。
[0052] 关于深度神经网络和循环神经网络的相关描述可以在更多描述可以在本说明书的其他地方(如步骤230及其相关描述中)找到,在此不作赘述。
[0053] 多业务输出层,具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,所述多业务输出层用于对所述业务因子向量、共性因子向量以及行为序列向量拼接得到的融合向量进行处理,并在多个输出端输出对应的概率(业务1概率、业务2概率、……、业务n概率),其中所述某业务领域对应的智能客服解决概率输出端输出的概率为有效。
[0054] 关于融合向量和智能客服解决概率的相关描述可以在更多描述可以在本说明书的其他地方(如步骤230及其相关描述中)找到,在此不作赘述。
[0055] 该多业务预测模型通过以下方式训练:
[0056] 获取来自多业务领域的训练样本,所述训练样本包括样本业务因子、样本共性因子、样本行为序列以及标签。
[0057] 其中,样本业务因子至少反映样本用户在对应的业务领域的状态信息,共性因子至少反映样本用户的个人属性信息,行为序列反映样本用户在平台内或者在平台内对应的业务领域的历史操作行为信息,标签反映样本用户是否在对应的业务领域通过智能客服成功解决其请求。
[0058] 在一些实施例中,仅作为示例,训练样本来自于安全业务,如果该训练样本在历史被推荐为智能客服并顺利解决,那么标签可以表示为1;如果并未顺利解决,那么标签可以表示为0。
[0059] 将训练样本中的样本业务因子、样本共性因子以及样本行为序列作为多业务预测模型的输入,调整所述多业务预测模型的参数,使得多业务预测模型输出的该训练样本所属的业务领域对应的智能客服解决概率与该训练样本的标签的差异最小化。
[0060] 在一些实施例中,在对多业务预测模型进行训练过程中,可以利用梯度反向传递调节多业务预测模型的参数。
[0061] 在一些实施例中,可以基于多智能客服解决概率输出端的输出值 与训练样本标签 构造损失函数。仅作为示例,损失函数可以表达为,其中 表示正相关
于,表示某训练样本ID, 、 、…、 表示针对训练样本 多业务预测模型在各输出
端上的输出值。由于多业务预测模型中拥有多个业务领域对应的智能客服解决概率输出端,而实际预测过程中仅对目标业务领域得到智能客服解决概率,继续采用上述示例,当利用业务1(如安全业务)训练样本训练多业务预测模型模型并调整模型的参数时,可以将业务1对应的业务权重 设为1,其余业务2、…、n对应的业务权重 设置为0。依次
类推,可以使用来自不同业务领域的训练样本对业务预测模型进行依次迭代训练或交替迭代训练,直到满足训练停止条件。
[0062] 图4是根据本申请一些实施例所示的一种多业务预测系统的示例性系统框图。
[0063] 如图4所示,该智能客服解决率预测系统400可以包括获取模块410、提取模块420以及处理模块430。这些模块也可以作为应用程序或一组由处理引擎读取和执行的指令实现。此外,模块可以是硬件电路和应用/指令的任何组合。例如,当处理引擎或处理器执行应用程序/一组指令时,模块可以是处理器的一部分。
[0064] 获取模块410可以用于获取请求平台内某业务领域客服的请求者的身份标识。
[0065] 关于身份标识的更多描述可以在本说明书的其他地方(如步骤210及其相关描述中)找到,在此不作赘述。
[0066] 提取模块420可以用于基于所述请求者的身份标识提取与所述请求者相关的业务因子、共性因子以及行为序列;其中,业务因子至少反映请求者在所述某业务领域的状态信息,共性因子至少反映请求者的个人属性信息,行为序列反映请求者在平台内或者在平台内所述某业务领域的历史操作行为信息。
[0067] 关于业务因子、共性因子以及行为序列的更多描述可以在本说明书的其他地方(如步骤220及其相关描述中)找到,在此不作赘述。
[0068] 处理模块430可以用于基于多业务预测模型处理所述业务因子、共性因子以及行为序列得到与所述请求者在所述某业务领域对应的智能客服解决概率;其中,所述多业务预测模型具有包括所述某业务领域在内的多个业务领域对应的智能客服解决概率输出端,且所述多业务预测模型利用来自所述多个业务领域的样本数据训练得到。
[0069] 关于智能客服解决概率的更多描述可以在本说明书的其他地方(如步骤220及其相关描述中)找到,在此不作赘述。
[0070] 在一些实施例中,处理模块430中,还可以包括基于第一编码网络处理所述业务因子,得到业务因子向量;基于第二编码网络处理所述共性因子,得到共性因子向量;基于第三编码网络处理所述行为序列,得到行为序列向量;将所述业务因子向量、共性因子向量以及行为序列向量拼接得到融合向量;基于多业务输出层处理所述融合向量,在所述某业务领域对应的智能客服解决概率输出端处得到所述请求者在所述某业务领域对应的智能客服解决概率。
[0071] 在一些实施中,所述第一编码网络与第二编码网络分别为深度神经网络;所述第三编码网络为循环神经网络。
[0072] 在一些实施中,所述多业务输出层为多层感知器或全连接层。
[0073] 应当理解,图4所示的装置及其模块可以利用各种方式来实现。例如,在一些实施例中,装置及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行装置,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和装置可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的装置及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
[0074] 需要注意的是,以上对于数据下载装置及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该装置的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子装置与其他模块连接。例如,图4中获取模块410和提取模块420可以为同一个模块,任意模块在获取身份标识后进行提取。又例如,智能客服解决率预测系统中的各个模块可以位于同一服务器上,也可以分属不同的服务器。诸如此类的变形,均在本说明书的保护范围之内。
[0075] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0076] 本申请实施例可能带来的有益效果包括但不限于:(1)利用多业务输出端,实现对多业务类型的客服场景较好的适应性;(2)通过对用户信息中具有共性的一部分信息加以利用,以弥补部分业务领域训练数据不足导致的判断准确率低或“冷启动”的问题,从而提高模型的准确性。
[0077] 需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
[0078] 上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
[0079] 同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
[0080] 此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
[0081] 同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
[0082] 一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
[0083] 针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
[0084] 最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。