基于人工智能的搜索系统优化方法和装置转让专利

申请号 : CN201610942110.9

文献号 : CN106503189B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 孙珂吴华于佃海李大任徐犇刘占一

申请人 : 北京百度网讯科技有限公司

摘要 :

本发明公开了一种基于人工智能的搜索系统优化方法和装置,其中,方法包括以下步骤:接收用户输入的查询语句;基于意图理解模型QU识别出查询语句的意图;利用会话管理模型DM判断意图是否满足QU模型主动学习机制;如果意图满足QU模型主动学习机制,则向用户提供意图澄清信息;接收用户针对意图澄清信息输入的答复信息,并根据答复信息生成反馈数据;如果反馈数据符合预设格式,则将反馈数据作为样本对QU进行训练。该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。

权利要求 :

1.一种基于人工智能的搜索系统优化方法,其特征在于,包括:接收用户输入的查询语句;

基于意图理解模型QU识别出所述查询语句的意图;

利用会话管理模型DM判断所述意图是否满足QU模型主动学习机制,所述DM模型具有训练模式和应用模式,所述训练模式下发起意图澄清信息的次数高于所述应用模式下发起意图澄清信息的次数,所述利用会话管理模型DM判断所述意图是否满足QU模型主动学习机制,包括:获取所述意图的置信度;如果所述置信度小于预设阈值,则满足所述QU模型主动学习机制;

如果所述意图满足所述QU模型主动学习机制,则向所述用户提供意图澄清信息;

接收所述用户针对所述意图澄清信息输入的答复信息,并根据所述答复信息生成反馈数据;

如果所述反馈数据符合预设格式,则将所述反馈数据作为样本对所述QU进行训练。

2.如权利要求1所述的方法,其特征在于,还包括:如果所述意图不满足所述QU模型主动学习机制,则直接根据所述意图获取搜索结果。

3.如权利要求1所述的方法,其特征在于,所述意图澄清信息包括自然语言问句或待选答案。

4.如权利要求1所述的方法,其特征在于,所述QU模型主动学习机制包括意图澄清学习、槽位澄清学习以及角色澄清学习。

5.如权利要求1所述的方法,其特征在于,还包括:根据所述答复信息获取澄清后的意图,并根据澄清后的意图获取搜索结果。

6.一种基于人工智能的搜索系统优化装置,其特征在于,包括:第一接收模块,用于接收用户输入的查询语句;

识别模块,用于基于意图理解模型QU识别出所述查询语句的意图;

判断模块,用于利用会话管理模型DM判断所述意图是否满足QU模型主动学习机制,所述DM模型具有训练模式和应用模式,所述训练模式下发起意图澄清信息的次数高于所述应用模式下发起意图澄清信息的次数,所述判断模块具体用于:获取所述意图的置信度;如果所述置信度小于预设阈值,则满足所述QU模型主动学习机制;

提供模块,用于如果所述意图满足所述QU模型主动学习机制,则向所述用户提供意图澄清信息;

第二接收模块,用于接收所述用户针对所述意图澄清信息输入的答复信息,并根据所述答复信息生成反馈数据;

训练模块,用于当所述反馈数据符合预设格式时,将所述反馈数据作为样本对所述QU进行训练。

7.如权利要求6所述的装置,其特征在于,还包括:第一获取模块,用于当所述意图不满足所述QU模型主动学习机制时,直接根据所述意图获取搜索结果。

8.如权利要求6所述的装置,其特征在于,所述意图澄清信息包括自然语言问句或待选答案。

9.如权利要求6所述的装置,其特征在于,所述QU模型主动学习机制包括意图澄清学习、槽位澄清学习以及角色澄清学习。

10.如权利要求6所述的装置,其特征在于,还包括:第二获取模块,用于根据所述答复信息获取澄清后的意图,并根据澄清后的意图获取搜索结果。

说明书 :

基于人工智能的搜索系统优化方法和装置

技术领域

[0001] 本发明涉及互联网技术领域,尤其涉及一种基于人工智能的搜索系统优化方法和装置。

背景技术

[0002] 人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
[0003] 随着移动互联网的快速发展,越来越多的用户已习惯使用移动终端来搜索自己感兴趣的信息。移动终端相比于PC端,由于操作显示界面更小,通过虚拟键盘方式输入查询语句的方式不够方便。因此,通过语音输入查询语句来进行搜索的方式应运而生。
[0004] 目前,主要基于语言模型对用户输入的查询语句进行意图解析,再基于用户的意图再进行搜索,从而获取符合用户意图的搜索结果。因此,如何更好地理解用户的搜索意图,即如何使语言模型能够更好地理解用户的搜索意图已成为研究的重点。但是,要训练出识别精度高语言模型,则需要大量的人为干预,人工成本高,效率低。

发明内容

[0005] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种基于人工智能的搜索系统优化方法,该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。
[0006] 本发明的第二个目的在于提出一种基于人工智能的搜索系统优化装置。
[0007] 为了实现上述目的,本发明第一方面实施例提出了一种基于人工智能的搜索系统优化方法,包括:接收用户输入的查询语句;基于意图理解模型QU识别出查询语句的意图;利用会话管理模型DM判断意图是否满足QU模型主动学习机制;如果意图满足QU模型主动学习机制,则向用户提供意图澄清信息;接收用户针对意图澄清信息输入的答复信息,并根据答复信息生成反馈数据。
[0008] 本发明实施例的基于人工智能的搜索系统优化方法,通过QU模型识别查询语句的意图,当会话管理模型DM判断意图满足QU模型主动学习机制时,向用户提供澄清信息,根据用户的答复信息生成反馈数据,将满足预设格式的反馈数据作为样本对QU模型进行训练。该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。
[0009] 为达上述目的,本发明第二方面实施例提出了一种基于人工智能的搜索系统优化装置,包括第一接收模块,用于接收用户输入的查询语句;识别模块,用于QU模型识别出查询语句的意图;判断模块,用于利用会话管理模型DM判断意图是否满足QU模型主动学习机制;提供模块,用于如果意图满足QU模型主动学习机制,则向用户提供意图澄清信息;第二接收模块,用于接收用户针对意图澄清信息输入的答复信息,并根据答复信息生成反馈数据;训练模块,用于当反馈数据符合预设格式时,将反馈数据作为样本对QU进行训练。
[0010] 本发明实施例的基于人工智能的搜索系统优化装置,通过QU模型识别查询语句的意图,当会话管理模型DM判断意图满足QU模型主动学习机制时,向用户提供澄清信息,根据用户的答复信息生成反馈数据,将满足预设格式的反馈数据作为样本对QU模型进行训练。该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。
[0011] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

[0012] 图1是根据本发明一个实施例的基于人工智能的搜索系统优化方法的流程图;
[0013] 图2是根据本发明一个实施例的基于人工智能的搜索系统优化方法的效果示意图;
[0014] 图3是根据本发明一个实施例的QU模型主动学习机制的效果示意图;
[0015] 图4是根据本发明一个实施例的待选答案意图澄清信息的效果示意图;
[0016] 图5是根据本发明一个具体实施例的基于人工智能的搜索系统优化方法的流程图;
[0017] 图6是根据本发明一个实施例的DM模型训练模式下基于人工智能的搜索系统优化的效果示意图;
[0018] 图7是根据本发明一个实施例的DM模型应用模式下基于人工智能的搜索系统优化的效果示意图;
[0019] 图8是根据本发明一个实施例的基于人工智能的搜索系统优化装置的结构示意图;
[0020] 图9是根据本发明一个具体实施例的基于人工智能的搜索系统优化装置的结构示意图。

具体实施方式

[0021] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0022] 下面参考附图描述本发明实施例的基于人工智能的搜索系统优化方法和装置。
[0023] 图1是根据本发明一个实施例的基于人工智能的搜索系统优化方法的流程图。
[0024] 如图1所示,该基于人工智能的搜索系统优化方法包括:
[0025] S101,接收用户输入的查询语句。
[0026] 在本发明的一个实施例中,用户可通过搜索系统提供的语音输入接口,通过语音输入的方式输入查询语句。例如,用户想在出门之前查询今天的天气,于是拿出手机按住语音输入键,说话:“今天的天气怎么样”,从而通过语音输入查询语句。
[0027] S102,基于QU模型识别出查询语句的意图。
[0028] 本实施例中的搜索系统,可由QU(Query Understanding,意图理解模型)和DM(Interactive Dialog Manager,会话管理模型)组成。
[0029] 其中,QU模型是一个可以识别查询语句的意图与参数的模型,DM模型是一个会话管理模型,用于引导搜索系统明确用户未表达清楚的意图与参数,使搜索系统可以更好地满足用户需求。
[0030] 现有技术中的语音模型是通过对大量的(10万条)人工标注的查询语句进行训练获得的,工作量巨大,且准确性不高。
[0031] 而在本实施例中,仅需要使用少量的训练数据(1000条左右),就能够训练出一个初始的QU模型,而后经过主动学习机制不断地训练学习,提升识别意图的准确性。
[0032] 具体地,在接收到用户输入的查询语句后,可通过QU模型识别查询语句的意图。
[0033] 需要说明的是,QU模型识别出的查询语句的意图,可能是一个意图,可能是多个候选意图以及各个意图的置信度。其中,置信度指的是识别出的意图的可信度。
[0034] 当QU模型识别出多个候选意图时,可根据置信度从大到小的顺序对意图进行排序。例如,如图2所示,用户语音输入查询语句“主要看气质”后(图2中的201所示),QU模型识别出该查询语句有两个候选意图“聊天”和“空气质量”,置信度分别为0.8和0.7,并根据置信度从大到小的顺序对意图进行排序(图2中202所示)。
[0035] S103,利用DM模型判断意图是否满足QU模型主动学习机制。
[0036] 具体地,QU模型识别出查询语句的意图后,如果识别出的查询语句的意图有多个候选意图,则DM模型获取排在第一位的意图的置信度,即最大置信度。DM模型获取该意图的置信度后,根据获取的置信度,判断置信度是否小于预设阈值。
[0037] 例如,图2中,DM模型获取第一个意图“聊天”的置信度0.8,判断0.8是否小于预设阈值0.9(图2中203)。
[0038] S104,如果意图满足QU模型主动学习机制,则向用户提供意图澄清信息。
[0039] 具体地,如果置信度小于预设阈值,即查询语句的意图满足QU模型主动学习机制,则DM模型引导搜索系统向用户提供意图澄清信息。例如,如图2所示,“聊天”的置信度0.8小于预设阈值0.9,即该意图满足QU模型主动学习机制,从而搜索系统向用户提供“你是想查空气质量还是想跟我聊天呢?”意图澄清信息(图2中204所示)。
[0040] 另外,QU模型主动学习机制可包括意图澄清学习、槽位澄清学习以及角色澄清学习。
[0041] 如图3所示,意图澄清学习(图3中301所示):用户输入查询语句“你今早吃了什么?”,搜索系统为了澄清该查询语句的意图,向用户提供“你想订餐吗”的意图澄清信息,从而进行意图澄清学习。
[0042] 槽位澄清学习(图3中302所示):用户输入查询语句“有老外服务的餐厅”。QU模型在识别槽位时,可能会将处于同一槽位的“有老外”和“有老外服务”识别错误,所以需要对槽位进行澄清。于是,搜索系统向用户提供“你是想找“有老外”还是“老外服务”的餐厅呢?”的澄清信息,以确定用户是找“有老外”的餐厅还是“有老外服务”的餐厅,从而进行槽位澄清学习。
[0043] 角色澄清学习(图3中303所示):用户输入查询语句“到北京的火车票”。由于北京具有两个角色,一个是出发地,另一个是目的地。因此,为了确定北京的角色,搜索系统向用户提供“北京是你的出发地还是目地的呢?”的澄清信息,以确定北京的角色是出发地还是目的地,从而进行角色澄清学习。
[0044] 需要说明的是,根据实际情况的需要,可选择上述任意一种澄清学习方式进行学习,也可以选择上述任意两种澄清学习方式进行学习,当然也可选择上述三种澄清学习方式进行学习,对此不作限定。
[0045] 此外,搜索系统向用户提供的意图澄清信息可以是自然问句,例如“你是想查空气质量还是跟我聊天呢?”,也可以是待选答案。如图4所示,用户输入查询语句“交大”(图4中401所示),搜索系统提供了“上海交通大学”、“西安交通大学”、“西南交通大学”三个待选答案(图4中402所示),用户可从待选答案中选择需要的答案。
[0046] 可选的,如图5所示,本实施例还可包括步骤S107,如果意图不满足QU模型主动学习机制,则直接根据意图获取搜索结果。
[0047] 具体地,如果QU模型识别出的查询语句的意图,只有一个意图,则搜索系统直接根据该意图获取搜索结果。
[0048] 另外,如果QU模型识别出的查询语句的意图,有多个候选意图,并且排在第一位的意图的置信度大于预设阈值,搜索系统可直接根据排在第一位的意图获取搜索结果。
[0049] S105,接收用户针对意图澄清信息输入的答复信息,并根据答复信息生成反馈数据。
[0050] 具体地,根据QU模型主动学习机制,搜索系统向用户提供意图澄清信息后,用户针对意图澄清信息输入答复信息。在搜索系统接收到答复信息后,QU模型识别答复信息的意图。之后,DM模型根据答复信息的意图生成反馈数据。
[0051] 例如,如图2所示,用户针对“你是想查空气质量还是跟我聊天呢?”意图澄清信息,输入答复信息“前者”(图2中205所示),QU模型识别答复信息“前者”的意图为“选择空气质量”(图2中206所示)。之后,DM模型根据该答复信息的意图生成反馈数据(图2中207所示),反馈数据为“Q:主要看气质,意图:空气质量,置信度:0.7”(图2中208所示)。
[0052] S106,如果反馈数据符合预设格式,则将反馈数据作为样本对QU进行训练。
[0053] 其中,预设格式可以是人工标注的查询语句的格式。例如,查询语句:今天北京天气如何;意图:天气情况查询。
[0054] 具体地,如果DM模型根据用户输入的答复信息生成的反馈数据符合预设格式,即反馈数据与人工标注的查询语句的格式一致,则将反馈数据作为样本对QU模型进行训练。例如,图2中,DM生成的反馈数据“Q:主要看气质;意图:空气质量;置信度:0.7”(图2中208所示)可以作为样本对QU模型进行训练。
[0055] 因而,当用户下次输入同样的查询语句时,可以一次识别查询语句的意图并提供相应的搜索结果,而不需要搜索系统再向用户提供澄清信息。从而,搜索系统会展现出自主优化的效果,给用户提供良好的交互式搜索体验。
[0056] 可选地,如图5所示,本实施例还可包括步骤S108,根据答复信息获取澄清后的意图,并根据澄清后的意图获取搜索结果。例如,图2中,根据用户的答复信息“前者”(图2中205所示),QU模型识别答复信息的意图是选择空气质量(图2中206所示)。进而,搜索系统根据澄清后的意图,获取与空气质量相关的搜索结果。
[0057] 综上所述,本发明实施例的基于人工智能的搜索系统优化方法,通过QU模型识别查询语句的意图,当DM模型判断意图满足QU模型主动学习机制时,向用户提供澄清信息,根据用户的答复信息生成反馈数据,将满足预设格式的反馈数据作为样本对QU模型进行训练。该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。
[0058] 此外,根据使用场景的不同,DM模型可具有两种学习模式:训练模式和应用模式。下面结合图6和7对两种模式进行描述。
[0059] 图6是根据本发明一个实施例的DM模型在训练模式下基于人工智能的搜索系统优化的效果示意图。
[0060] DM模型在训练模式下时,可将置信度的预设阈值设置一个比较高的数值,使得多数的查询语句均触发主动学习机制,从而提高QU模型的理解能力。
[0061] 由于训练模式下,设置的置信度的预设阈值数值较高,因此多个查询语句的意图的置信度小于预设阈值,即大多数查询语句的意图满足QU模型的主动学习机制,从而系统会频繁的发起意图澄清信息。进而,可根据大量的满足预设格式的反馈数据训练QU模型,优化QU模型。
[0062] 图7是根据本发明一个实施例的DM模型应用模式下基于人工智能的搜索系统优化的效果示意图。
[0063] DM模型在应用模式下时,可将置信度的预设阈值设置一个比较低的数值。由于置信度的预设阈值较低,因此在大多数的情况下,用户查询语句的意图不满足QU模型主动学习机制,从而可直接获取搜索结果。仅在少数情况下,搜索系统向用户提供意图澄清信息。
[0064] 因此,应用模式可以实现在有限打扰用户的前提下,通过大量的用户使用搜索系统时,回答意图澄清信息而生成的反馈数据训练QU模型,提高QU模型理解意图的能力。
[0065] 下面结合图8对本发明实施例提出的基于人工智能的搜索系统优化装置进行描述。图8是根据本发明一个实施例的基于人工智能的搜索系统优化装置的结构示意图。
[0066] 如图8所示,该基于人工智能的搜索系统优化装置包括:第一接收模块810、识别模块820、判断模块830、提供模块840、第二接收模块850、训练模块860。
[0067] 接收模块810,用于接收用户输入的查询语句。
[0068] 具体地,用户可通过搜索系统提供的语言输入接口,通过语音输入的方式输入查询语句。从而,接收模块810接收到用户输入的查询语句。
[0069] 识别模块820,用于基于QU模型识别出查询语句的意图。
[0070] 判断模块830,用于利用DM模型判断意图是否满足QU模型主动学习机制。
[0071] 判断模块830包括:获取意图的置信度;如果置信度小于预设阈值,则满足QU模型主动学习机制。其中,QU模型主动学习机制包括意图澄清学习、槽位澄清学习以及角色澄清学习。
[0072] 提供模块840,用于如果意图满足QU模型主动学习机制,则向用户提供意图澄清信息。
[0073] 其中,意图澄清信息包括自然语言问句或待选答案。
[0074] 第二接收模块850,用于接收用户针对意图澄清信息输入的答复信息,并根据答复信息生成反馈数据。
[0075] 训练模块860,用于当反馈数据符合预设格式时,将反馈数据作为样本对QU进行训练。
[0076] 需要说明的是,前述对基于人工智能的搜索系统优化方法实施例的解释说明也适用于该实施例的基于人工智能的搜索系统优化装置,此处不再赘述。
[0077] 综上所述,本发明实施例的基于人工智能的搜索系统优化装置,通过QU模型识别查询语句的意图,当DM模型判断意图满足QU模型主动学习机制时,向用户提供澄清信息,根据用户的答复信息生成反馈数据,将满足预设格式的反馈数据作为样本对QU模型进行训练。该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。
[0078] 下面结合图9对基于人工智能的搜索系统优化装置进行详细说明。图9是根据本发明一个具体实施例的基于人工智能的搜索系统优化装置的结构示意图。
[0079] 如图9所示,在图8的基础上,基于人工智能的搜索系统优化装置还包括:第一获取模块870、第二获取模块880。
[0080] 第一获取模块870,用于当意图不满足QU模型主动学习机制时,直接根据意图获取搜索结果。
[0081] 第二获取模块880,用于根据答复信息获取澄清后的意图,并根据澄清后的意图获取搜索结果。
[0082] 需要说明的是,前述对基于人工智能的搜索系统优化方法实施例的解释说明也适用于该实施例的基于人工智能的搜索系统优化装置,此处不再赘述。
[0083] 综上所述,本发明实施例的基于人工智能的搜索系统优化装置,通过QU模型识别查询语句的意图,当DM模型判断意图满足QU模型主动学习机制时,向用户提供澄清信息,根据用户的答复信息生成反馈数据,将满足预设格式的反馈数据作为样本对QU模型进行训练。该方法能够实现QU模型与DM模型的有效配合,自主优化QU模型,减少人为的干预,从而节省人工成本。
[0084] 在本说明书的描述中,参考术语:“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0085] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。