基于深度问答的答案检索方法及装置转让专利

申请号 : CN201611235007.7

文献号 : CN106649786B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘雄

申请人 : 北京百度网讯科技有限公司

摘要 :

本发明提出了一种基于深度问答的答案检索方法及装置,其中,方法包括:接收输入的查询语句;根据查询语句检索得到包含候选答案的网页;基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案;根据第一候选答案、第二候选答案以及第三候选答案确定最终答案;展现最终答案。通过本发明能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。

权利要求 :

1.一种基于深度问答的答案检索方法,其特征在于,应用于搜索引擎,包括:接收输入的查询语句;

根据所述查询语句检索得到包含候选答案的网页;

基于网页分析方法、深度学习方法以及模板匹配方法分别从所述包含候选答案的网页中获取第一候选答案、第二候选答案以及第三候选答案;

根据所述第一候选答案、所述第二候选答案以及所述第三候选答案确定最终答案;

展现所述最终答案。

2.如权利要求1所述的基于深度问答的答案检索方法,其特征在于,根据所述查询语句检索得到包含候选答案的网页,包括:对所述查询语句进行分析处理,并生成所述查询语句的特征,其中,所述分析处理包括分词、词性标注、命名实体识别、语义角色标注、句法依存分析、语义依存分析中的一种或多种;

根据所述特征检索得到包含候选答案的网页。

3.如权利要求1所述的基于深度问答的答案检索方法,其特征在于,基于网页分析方法获取第一候选答案,包括:对所述包含候选答案的网页进行结构分析和内容分析,以获取所述网页中句子的结构信息和内容信息;

根据所述结构信息和所述内容信息以及所述查询语句的特征从所述网页中的句子筛选出第一候选答案。

4.如权利要求1所述的基于深度问答的答案检索方法,其特征在于,基于深度学习方法获取第二候选答案,包括:获取所述查询语句的句向量、所述网页中的候选答案句向量和结构化知识库中的结构化知识向量;

将所述查询语句的句向量、所述网页中的候选答案句向量和所述结构化知识向量输入至卷积神经网络,以生成中间信息向量;

将所述中间信息向量作为输入,输入至循环神经网络,以生成第二候选答案。

5.如权利要求1所述的基于深度问答的答案检索方法,其特征在于,基于模板匹配方法获取第三候选答案,包括:获取所述包含候选答案的网页中的候选答案;

对所述候选答案进行语义分析,以提取所述候选答案的词语特征;

根据所述词语特征从答案模板库中匹配得到候选模板;

获取所述候选模板与所述查询语句的相关性,并根据所述相关性确定答案模板;

根据所述答案模板生成所述第三候选答案。

6.如权利要求1所述的基于深度问答的答案检索方法,其特征在于,根据所述第一候选答案、所述第二候选答案以及所述第三候选答案确定最终答案,包括:对所述第一候选答案、所述第二候选答案以及所述第三候选进行打分并排序;

获取得分最高的候选答案,并判断所述得分最高的候选答案的得分是否大于预设分数;

如果大于所述预设分数,则确定所述得分最高的候选答案为最终答案。

7.如权利要求1所述的基于深度问答的答案检索方法,其特征在于,展现所述最终答案,包括:在搜索结果提供页面预设位置直接展现所述最终答案。

8.一种基于深度问答的答案检索装置,其特征在于,应用于搜索引擎,包括:接收模块,用于接收输入的查询语句;

检索模块,用于根据所述查询语句检索得到包含候选答案的网页;

获取模块,用于基于网页分析方法、深度学习方法以及模板匹配方法分别从所述包含候选答案的网页中获取第一候选答案、第二候选答案以及第三候选答案;

确定模块,用于根据所述第一候选答案、所述第二候选答案以及所述第三候选答案确定最终答案;

展现模块,用于展现所述最终答案。

9.如权利要求8所述的基于深度问答的答案检索装置,其特征在于,所述检索模块,包括:第一处理单元,用于对所述查询语句进行分析处理,并生成所述查询语句的特征,其中,所述分析处理包括分词、词性标注、命名实体识别、语义角色标注、句法依存分析、语义依存分析中的一种或多种;

获取单元,用于根据所述特征检索得到包含候选答案的网页。

10.如权利要求8所述的基于深度问答的答案检索装置,其特征在于,所述获取模块,用于:对所述包含候选答案的网页进行结构分析和内容分析,以获取所述网页中句子的结构信息和内容信息;

根据所述结构信息和所述内容信息以及所述查询语句的特征确定从所述网页中的句子筛选出第一候选答案。

11.如权利要求8所述的基于深度问答的答案检索装置,其特征在于,所述获取模块,用于:获取所述查询语句的句向量、所述网页中的候选答案句向量和结构化知识向量;

将所述查询语句的句向量、所述网页中的候选答案句向量和所述结构化知识向量输入至卷积神经网络,以生成中间信息向量;

将所述中间信息向量作为输入,输入至循环神经网络,以生成第二候选答案。

12.如权利要求8所述的基于深度问答的答案检索装置,其特征在于,所述获取模块,还用于:获取所述包含候选答案的网页中的候选答案;

对所述候选答案进行语义分析,以提取所述候选答案的词语特征;

根据所述词语特征从答案模板库中匹配得到候选模板;

获取所述候选模板与所述查询语句的相关性,并根据所述相关性确定答案模板;

根据所述答案模板生成所述第三候选答案。

13.如权利要求8所述的基于深度问答的答案检索装置,其特征在于,所述确定模块,包括:排序单元,用于对所述第一候选答案、所述第二候选答案以及所述第三候选进行打分并排序;

第二处理单元,用于获取得分最高的候选答案,并判断所述得分最高的候选答案的得分是否大于预设分数;

确定单元,用于在所述得分最高的候选答案的得分大于所述预设分数时,确定所述得分最高的候选答案为最终答案。

14.如权利要求8所述的基于深度问答的答案检索装置,其特征在于,所述展现模块,用于:在搜索结果提供页面预设位置直接展现所述最终答案。

说明书 :

基于深度问答的答案检索方法及装置

技术领域

[0001] 本发明涉及互联网技术领域,尤其涉及一种基于深度问答的答案检索方法及装置。

背景技术

[0002] 深度问答(Deep Question and Answer,DeepQA),是指理解人类的语言,智能识别问题的含义,并从海量的互联网数据中提取问题的答案。
[0003] 随着互联网的快速发展,搜索引擎的功能日趋强大,用户对搜索引擎的期望也越来越高,开始由基本的相关网页召回向智能问答转变。当用户通过搜索引擎输入所要查询的问题时,希望获得的搜索结果不再是相关的网页,而希望能够直接获得问题的答案。
[0004] 然而,现有的搜索引擎技术仅能通过信息检索和文档摘要技术,向用户提供相关性较高的网页作为检索结果,用户需要结合网页标题、正文摘要甚至是网页链接等信息确定所要查看的网页,并自行提取所需答案。因此,现有的搜索引擎技术不具有深度问答功能,无法直接为用户提供问题答案,搜索结果的呈现效果差。

发明内容

[0005] 本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
[0006] 为此,本发明的第一个目的在于提出一种基于深度问答的答案检索方法,该方法能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0007] 本发明的第二个目的在于提出一种基于深度问答的答案检索装置。
[0008] 本发明的第三个目的在于提出一种终端。
[0009] 本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
[0010] 本发明的第五个目的在于提出一种计算机程序产品。
[0011] 为了实现上述目的,本发明第一方面实施例提出了一种基于深度问答的答案检索方法,包括:接收输入的查询语句;根据查询语句检索得到包含候选答案的网页;基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案;根据第一候选答案、第二候选答案以及第三候选答案确定最终答案;展现最终答案。
[0012] 本发明第一方面实施例提出的基于深度问答的答案检索方法,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0013] 为了实现上述目的,本发明第二方面实施例提出了一种基于深度问答的答案检索装置,包括:接收模块,用于接收输入的查询语句;检索模块,用于根据查询语句检索得到包含候选答案的网页;获取模块,用于基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案;确定模块,用于根据第一候选答案、第二候选答案以及第三候选答案确定最终答案;展现模块,用于展现最终答案。
[0014] 本发明第二方面实施例提出的基于深度问答的答案检索装置,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0015] 为了实现上述目的,本发明第三方面实施例提出了一种终端,包括:处理器;用于存储处理器可执行指令的存储器。其中,处理器被配置为执行以下步骤:
[0016] 接收输入的查询语句;
[0017] 根据查询语句检索得到包含候选答案的网页;
[0018] 基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案;
[0019] 根据第一候选答案、第二候选答案以及第三候选答案确定最终答案;
[0020] 展现最终答案。
[0021] 本发明第三方面实施例提出的终端,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0022] 为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,用于存储一个或多个程序,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种基于深度问答的答案检索方法,方法包括;
[0023] 接收输入的查询语句;
[0024] 根据查询语句检索得到包含候选答案的网页;
[0025] 基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案;
[0026] 根据第一候选答案、第二候选答案以及第三候选答案确定最终答案;
[0027] 展现最终答案。
[0028] 本发明第四方面实施例提出的非临时性计算机可读存储介质,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0029] 为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行一种基于深度问答的答案检索方法,方法包括:
[0030] 接收输入的查询语句;
[0031] 根据查询语句检索得到包含候选答案的网页;
[0032] 基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案;
[0033] 根据第一候选答案、第二候选答案以及第三候选答案确定最终答案;
[0034] 展现最终答案。
[0035] 本发明第五方面实施例提出的计算机程序产品,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。

附图说明

[0036] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0037] 图1是本发明一实施例提出的基于深度问答的答案检索方法的流程示意图;
[0038] 图2是根据查询语句检索得到包含候选答案的网页的流程示意图;
[0039] 图3是基于深度学习方法获取第二候选答案的示意图;
[0040] 图4(a)是传统搜索引擎技术的搜索结果显示界面图;
[0041] 图4(b)是采用本实施例提出的答案检索方法的搜索引擎的搜索结果显示界面图;
[0042] 图5是本发明另一实施例提出的基于深度问答的答案检索方法的流程示意图;
[0043] 图6是本发明一实施例提出的基于深度问答的答案检索装置的结构示意图;
[0044] 图7是本发明另一实施例提出的基于深度问答的答案检索装置的结构示意图;
[0045] 图8是本发明又一实施例提出的基于深度问答的答案检索装置的结构示意图。

具体实施方式

[0046] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0047] 随着网络信息技术的发展,用户对搜索引擎的需求已不满足于基本的相关网页召回,开始向智能问答方向转变。
[0048] 然而,现有的搜索引擎通过传统的信息检索和文档摘要技术,仅能向用户提供与查询语句有相关性的搜索结果,同时,通过摘要计算,提取网页中能够总结网页内容的文字展现给用户,以辅助用户确定点击的内容。用户需要结合网页标题、正文摘要甚至是网页链接等信息确定所要查看的网页,并自行提取所需答案。因此,现有的搜索引擎技术存在以下不足:
[0049] (1)搜索到的答案与问题的相关度不高。现有搜索引擎通常以关键词匹配作为基础,搜索结果的相关程度依赖于用户所查询问题的中心词和关键词出现的次数和位置,忽略了问题的实质及用户所需答案的类型。另外,摘要计算通常以网页内容为中心,而不考虑用户的问题,导致网页摘要与问题的相关性低。
[0050] (2)对搜索到的答案的呈现效果差。通过现有的搜索技术获得的搜索结果,用户所查询问题的答案可能出现在搜索结果的任一位置,比如,答案可能在网页标题、网页摘要,甚至在网页内容中,用户很难直接获得问题的答案,答案的呈现效果差,从而降低用户体验。
[0051] 因此,为了弥补现有技术的不足,本发明提出了一种基于深度问答的答案检索方法,以在搜索结果页中简洁明了地向用户展现所查询问题的答案。
[0052] 图1是本发明一实施例提出的基于深度问答的答案检索方法的流程示意图。
[0053] 如图1所示,本实施例的基于深度问答的答案检索方法包括:
[0054] S11:接收输入的查询语句。
[0055] 本实施例中,当用户想要查询某一问题的答案时,比如用户想要获知“守望先锋”这款游戏的开发公司,可以在搜索引擎中输入想要查询的问题,即输入“哪家公司开发了守望先锋?”,或者输入“守望先锋是由哪家公司开发的?”。搜索引擎接收用户输入的查询语句,以进行答案搜索。
[0056] S12:根据查询语句检索得到包含候选答案的网页。
[0057] 本实施例中,搜索引擎在接收了用户输入的查询语句之后,即可根据查询语句检索得到包含候选答案的网页。
[0058] 具体地,如图2所示,根据查询语句检索得到包含候选答案的网页,可以包括以下步骤:
[0059] S21:对查询语句进行分析处理,并生成查询语句的特征。
[0060] 其中,分析处理包括但不限于分词、词性标注、命名实体识别、语义角色标注、句法依存分析、语义依存分析中的一种或多种。
[0061] 本实施例中,搜索引擎在接收了用户输入的查询语句之后,即可对接收的查询语句进行分词、词性标注、命名实体识别、语义角色标注、语法依存分析、语义依存分析等处理,并生成查询语句的特征。
[0062] 需要说明的是,分词、词性标注、命名实体识别、语义角色标注、语法依存分析、语义依存分析等技术是自然语言处理领域比较常用的语句分析处理技术,为避免累赘,此处不作详细介绍。
[0063] S22:根据特征检索得到包含候选答案的网页。
[0064] 本实施例中,在对用户输入的查询语句进行分析处理并获得查询语句的特征之后,根据获取的特征,能够检索得到包含候选答案的网页。
[0065] 本实施例中,在对查询语句进行详细的分析处理并生成查询语句的特征之后,利用生成的特征进行网页搜索,能够提高搜索到的网页与查询语句的相关性。由于搜索到的网页与查询语句具有较高的相关性,在搜索到的网页中,能够找到至少一个与查询语句对应的候选答案。
[0066] S13:基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案。
[0067] 本实施例中,在检索获得包含候选答案的网页之后,可以基于网页分析方法获取第一候选答案、基于深度学习方法获取第二候选答案,以及基于模板匹配方法获取第三候选答案。其中,
[0068] 基于网页分析方法获取第一候选答案,包括:对包含候选答案的网页进行结构分析和内容分析,以获取网页中句子的结构信息和内容信息;根据结构信息和内容信息以及查询语句的特征从网页中的句子筛选出第一候选答案。
[0069] 由于网页中的句子存在能够直接作为查询语句对应的答案的可能性,比如,问答社区网站中的句子也许能作为查询语句的答案,本实施例中,基于网页分析方法获取第一候选答案,其目的就在于直接从网页的句子中选择一个最佳句子作为查询语句的答案。
[0070] 具体地,基于网页分析方法获取第一候选答案,可以按照如下流程进行:结合包含候选答案的网页的标签及视觉效果等信息,对网页进行结构分析,得到网页的类别、标题、正文、时间、段落等结构信息;根据网页内容结构信息,对网页进行内容分析,得到网页中句子的内容信息;进而根据获得的结构信息和内容信息,并结合查询语句的特征,从包含候选答案的网页中的句子筛选出第一候选答案。
[0071] 基于深度学习方法获取第二候选答案,包括:获取查询语句的句向量、网页中的候选答案句向量和结构化知识库中的结构化知识向量;将查询语句的句向量、网页中的候选答案句向量和结构化知识向量输入至卷积神经网络,以生成中间信息向量;将中间信息向量作为输入,输入至循环神经网络,以生成第二候选答案。
[0072] 其中,结构化知识库又称三元组知识库,由无数个三元关系组成,每一个三元关系均包含两个实体以及两个实体之间的关系。比如,张杰、谢娜是两个实体,夫妻是张杰和谢娜的关系,因此,张杰、谢娜和夫妻便组成了一个三元关系。
[0073] 本实施例中,基于深度学习方法获取第二候选答案,首先要获取查询语句的句向量、网页中的候选答案句向量,以及结构化知识库中的结构化知识向量。
[0074] 需要说明的是,查询语句的句向量、网页中的候选答案句向量和结构化知识向量均可以基于从大规模语料中训练获得的词向量构建而成,本发明对构建过程不作详细说明。
[0075] 在获取了查询语句的句向量、网页中的候选答案句向量和结构化知识向量后,将获取的查询语句的句向量、网页中的候选答案句向量和结构化知识向量作为输入,一起输入至卷积神经网络,经卷积神经网络编码,提取所输入向量中的最强特征,最终生成中间信息向量。
[0076] 在获得中间信息向量之后,将所得的中间信息向量作为输入,输入至循环神经网络进行解码,最终生成第二候选答案。
[0077] 作为一种示例,参见图3,图3是基于深度学习方法获取第二候选答案的示意图。
[0078] 如图3所示,将查询语句的句向量、候选答案句向量和结构化知识向量输入至卷积神经网络进行编码后,得到中间信息向量。将中间信息向量输入至循环神经网络进行解码后,即可获得答案词_1,答案词_2,…,答案词_N,其中,N为正整数。
[0079] 需要说明的是,候选答案句向量中能够获得多少个与结构化知识库中的结构化知识向量匹配的三元关系,经卷积神经网络编码、循环神经网络解码后,就能获得多少个答案词。
[0080] 基于模板匹配方法获取第三候选答案,包括:获取包含候选答案的网页中的候选答案;对候选答案进行语义分析,以提取候选答案的词语特征;根据词语特征从答案模板库中匹配得到候选模板;获取候选模板与查询语句的相关性,并根据相关性确定答案模板;根据答案模板生成第三候选答案。
[0081] 其中,答案模板库可以通过相关的训练模型训练生成。随着网页资源的增长以及问答社区网站的繁荣,能够很容易地通过互联网获得大量的问题与答案对,将获得的问题与答案对作为训练语料进行模型训练,能够训练生成所需的答案模板库。
[0082] 本实施例中,基于模板匹配方法获取第三候选答案时,首先需要从包含候选答案的网页中获取候选答案。接着,对获取的候选答案进行语义分析,以提取候选答案的词语特征,比如,从候选答案中提取实体词、重要指示词等。之后,根据提取的词语特征从答案模板库中匹配得到候选模板。
[0083] 在匹配到候选模板后,结合查询语句,获取候选模板与查询语句的相关性,并根据相关性确定答案模板,进而根据答案模板生成第三候选答案。
[0084] 举例而言,假设用户输入的查询语句为“姚明的生日是哪一天?”,从包含候选答案的网页中获取的候选答案为“姚明,1980年9月12日出生于上海市”,则从候选答案中提取的词语特征为“姚明”、“1980年9月12日”、“出生”和“上海市”。根据提取到的词语特征,从答案模板库中匹配得到的候选模板为“姚明生日1980年9月12日”和“姚明出生上海市”。结合查询语句,可以确定“姚明生日1980年9月12日”这一候选模板与查询语句的相关性更高,将该候选模板确定为答案模板,进而根据该候选模板生成第三候选答案,比如为“姚明的生日是1980年9月12日”。
[0085] S14:根据第一候选答案、第二候选答案以及第三候选答案确定最终答案。
[0086] 本实施例中,在基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案之后,根据获取的第一候选答案、第二候选答案和第三候选答案确定最终答案。
[0087] 需要说明的是,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案的具体过程将在后续内容中给出,此处不作详细描述。
[0088] S15:展现最终答案。
[0089] 本实施例中,在确定最终答案之后,即可在搜索结果显示页面展现确定的最终答案。
[0090] 可选地,可以在搜索结果提供页面的预设位置直接展现最终答案。
[0091] 比如,为了让用户很容易地获得最终答案,可以将预设位置设置在搜索框的下方,将最终答案直接展现在搜索框下方。
[0092] 需要说明的是,预设位置是预先设置的,本发明对预设位置在搜索结果提供页面中所处的具体位置不作限制。
[0093] 作为一种示例,参见图4(a)和图4(b),其中,图4(a)是传统搜索引擎技术的搜索结果显示界面图,图4(b)是采用本实施例提出的答案检索方法的搜索引擎的搜索结果显示界面图。
[0094] 如图4(a)和图4(b)所示,当在搜索框41中输入同样的查询语句“星际争霸是哪家公司的”时,图4(a)和图4(b)呈现出不同的显示效果。相较于图4(a)而言,图4(b)中还展现了百度深度问答的相关内容42,从图4(b)展现的百度深度问答的相关内容42中,用户能够很容易地获得查询语句的答案“暴雪娱乐公司”,且能够获得更详细的相关内容,比如星际争霸的正式发行时间。因此,相较于传统搜索引擎,采用本实施例提出的答案检索方法的搜索引擎能够展现更清晰、更全面的搜索结果。
[0095] 本发明实施例提出的基于深度问答的答案检索方法,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0096] 图5是本发明另一实施例提出的基于深度问答的答案检索方法的流程示意图。
[0097] 如图5所示,基于上述实施例,步骤S14可以包括:
[0098] S51:对第一候选答案、第二候选答案以及第三候选进行打分并排序。
[0099] 本实施例中,在基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案之后,对获取的第一候选答案、第二候选答案以及第三候选进行打分,并按照得分的高低进行排序。
[0100] 应当理解的是,得分越高的候选答案其可信度越高,也就是说,候选答案的得分越高,越接近于正确答案。
[0101] S52:获取得分最高的候选答案,并判断得分最高的候选答案的得分是否大于预设分数。
[0102] 本实施例中,对第一候选答案、第二候选答案以及第三候选进行打分并排序后,获取得分最高的候选答案,并将该候选答案的得分与预设分数比较,判断得分最高的候选答案的得分是否大于预设分数。
[0103] 需要说明的是,预设分数是预先设置的,设置的预设分数越高,对得分最高的候选答案的要求越严格,获取的最终答案也就越准确。
[0104] S53:如果大于预设分数,则确定得分最高的候选答案为最终答案。
[0105] 本实施例中,将得分最高的候选答案的得分与预设分数进行比较,当得分最高的候选答案的得分大于预设分数时,则确定得分最高的候选答案为最终答案。若得分最高的候选答案的得分不大于预设分数,则按照现有的搜索引擎技术,在搜索结果提供页面显示与查询语句相关性较高的网页。
[0106] 本发明实施例提出的基于深度问答的答案检索方法,通过对第一候选答案、第二候选答案以及第三候选进行打分并排序,获取得分最高的候选答案,并将得分最高的候选答案的得分与预设分数比较,在得分最高的候选答案的得分大于预设分数时,确定该得分最高的候选答案为最终答案,能够保证最终答案的准确度。
[0107] 为了实现上述实施例,本发明还提出了一种基于深度问答的答案检索装置,图6是本发明一实施例提出的基于深度问答的答案检索装置的结构示意图。
[0108] 如图6所示,本实施例的基于深度问答的答案检索装置包括:接收模块610、检索模块620、获取模块630、确定模块640,以及展现模块650。其中,
[0109] 接收模块610,用于接收输入的查询语句。
[0110] 检索模块620,用于根据查询语句检索得到包含候选答案的网页。
[0111] 具体地,如图7所示,检索模块620包括:
[0112] 第一处理单元621,用于对查询语句进行分析处理,并生成查询语句的特征。
[0113] 其中,分析处理包括分词、词性标注、命名实体识别、语义角色标注、句法依存分析、语义依存分析中的一种或多种。
[0114] 获取单元622,用于根据特征检索得到包含候选答案的网页。
[0115] 获取模块630,用于基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案。
[0116] 具体地,获取模块630用于:
[0117] 对包含候选答案的网页进行结构分析和内容分析,以获取网页中句子的结构信息和内容信息;
[0118] 根据结构信息和内容信息以及查询语句的特征确定从网页中的句子筛选出第一候选答案。
[0119] 获取模块630用于:
[0120] 获取查询语句的句向量、网页中的候选答案句向量和结构化知识向量;
[0121] 将查询语句的句向量、网页中的候选答案句向量和结构化知识向量输入至卷积神经网络,以生成中间信息向量;
[0122] 将中间信息向量作为输入,输入至循环神经网络,以生成第二候选答案。
[0123] 获取模块630还用于:
[0124] 获取包含候选答案的网页中的候选答案;
[0125] 对候选答案进行语义分析,以提取候选答案的词语特征;
[0126] 根据词语特征从答案模板库中匹配得到候选模板;
[0127] 获取候选模板与查询语句的相关性,并根据相关性确定答案模板;
[0128] 根据答案模板生成第三候选答案。
[0129] 确定模块640,用于根据第一候选答案、第二候选答案以及第三候选答案确定最终答案。
[0130] 展现模块650,用于展现最终答案。
[0131] 可选地,展现模块650可以在搜索结果提供页面预设位置直接展现最终答案。
[0132] 需要说明的是,前述实施例中对基于深度问答的答案检索方法实施例的解释说明也适用于本实施例的基于深度问答的答案检索装置,其实现原理类似,此处不再赘述。
[0133] 本发明实施例提出的基于深度问答的答案检索装置,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0134] 图8是本发明又一实施例提出的基于深度问答的答案检索装置的结构示意图。
[0135] 如图8所示,在如图6所示的基础上,确定模块640具体包括:
[0136] 排序单元641,用于对第一候选答案、第二候选答案以及第三候选进行打分并排序。
[0137] 第二处理单元642,用于获取得分最高的候选答案,并判断得分最高的候选答案的得分是否大于预设分数。
[0138] 确定单元643,用于在得分最高的候选答案的得分大于预设分数时,确定得分最高的候选答案为最终答案。
[0139] 需要说明的是,前述实施例中对基于深度问答的答案检索方法实施例的解释说明也适用于本实施例的基于深度问答的答案检索装置,其实现原理类似,此处不再赘述。
[0140] 本发明实施例提出的基于深度问答的答案检索装置,通过对第一候选答案、第二候选答案以及第三候选进行打分并排序,获取得分最高的候选答案,并将得分最高的候选答案的得分与预设分数比较,在得分最高的候选答案的得分大于预设分数时,确定该得分最高的候选答案为最终答案,能够保证最终答案的准确度。
[0141] 为了实现上述实施例,本发明还提出了一种终端,包括:处理器,以及用于存储处理器可执行指令的存储器。其中,处理器被配置为执行以下步骤:
[0142] S11’:接收输入的查询语句。
[0143] S12’:根据查询语句检索得到包含候选答案的网页。
[0144] S13’:基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案。
[0145] S14’:根据第一候选答案、第二候选答案以及第三候选答案确定最终答案。
[0146] S15’:展现最终答案。
[0147] 需要说明的是,前述实施例中对基于深度问答的答案检索方法实施例的解释说明也适用于本实施例的终端,其实现原理类似,此处不再赘述。
[0148] 本发明实施例提出的终端,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0149] 为了实现上述实施例,本发明还提出了一种非临时性计算机可读存储介质,用于存储一个或多个程序,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行本发明第一方面实施例提出的基于深度问答的答案检索方法。
[0150] 本发明实施例提出的非临时性计算机可读存储介质,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0151] 为了实现上述实施例,本发明还提出了一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行本发明第一方面实施例提出的基于深度问答的答案检索方法。
[0152] 本发明实施例提出的计算机程序产品,通过接收输入的查询语句,根据查询语句检索得到包含候选答案的网页,并基于网页分析方法、深度学习方法以及模板匹配方法分别获取第一候选答案、第二候选答案以及第三候选答案,根据第一候选答案、第二候选答案以及第三候选答案确定最终答案并展现。由此,能够在搜索结果页面中直接展示与用户查询问题对应的答案,提高答案检索的相关度和准确度,以及提高搜索结果的呈现效果。
[0153] 需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0154] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0155] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0156] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0157] 此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0158] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0159] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0160] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。