一种知识库的构建方法及装置转让专利

申请号 : CN201710294688.2

文献号 : CN107256226B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 蒋宏飞崔培君晋耀红张青付靖玲杨凯程

申请人 : 北京神州泰岳软件股份有限公司

摘要 :

本申请提供一种知识库的构建方法及装置,所述方法包括:接收初始请求信息;根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;根据所述子知识库架构模型中预设的架构规则,构建子知识库。通过将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,进而可利用不同的架构规则构建相应的子知识库,从而有效避免相同语句和词汇的重复录入,提高存储器的存储空间的利用率,并且有效降低工作人员录入量。

权利要求 :

1.一种知识库的构建方法,其特征在于,包括:接收初始请求信息,所述初始请求信息类型包括要素类初始请求、列表类初始请求、概念类初始请求和FAQ类初始请求;

根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;

根据所述子知识库架构模型中预设的架构规则,构建子知识库,所述子知识库构架模型包括要素类知识库架构模型、列表类知识库架构模型、概念类知识库架构模型和FAQ类知识库架构模型。

2.如权利要求1所述的方法,其特征在于,所述初始请求信息类型包括要素类初始请求;

所述子知识库架构模型包括要素类知识库架构模型;

所述根据所述子知识库架构模型中预设的架构规则包括:创建要素类知识集合,所述要素类知识集合包括触发场景信息和与所述触发场景信息相对应的N个要素类问答对,其中,所述每个要素类问答对包括反问问题和答案,所述答案包括要素属性和与要素属性相对应的要素信息,N为不小于1的正整数;

建立触发场景信息和第一个要素类问答对的反问问题关联性;

建立第K-1个要素类问答对的答案与第K个要素类问答对的反问问题关联性,K≤N。

3.如权利要求1所述的方法,其特征在于,所述初始请求信息类型包括列表类初始请求;

所述子知识库架构模型包括列表类知识库架构模型;

所述根据所述子知识库架构模型中预设的架构规则包括:创建列表类知识集合,所述列表类知识集合包括列表类问答对和列表元素集,其中,所述列表类问答对包括肯定答案、否定答案、一个标准问题和一个以上与标准问题相对应的扩展问题;

选取所述列表类问答对的标准问题和扩展问题的有效字段;

根据所述有效字段,查找与所述有效字段相匹配的列表元素集;

建立所述列表类问答对与相匹配的列表元素集关联性。

4.如权利要求1所述的方法,其特征在于,所述初始请求信息类型包括概念类初始请求;

所述子知识库架构模型包括概念类知识库架构模型;

所述根据所述子知识库架构模型中预设的架构规则包括:创建概念类知识集合,所述概念类知识集合包括概念类问答对,其中,所述概念类问答对包括答案、一个标准问题和一个以上与标准问题相对应的概念扩展集;

获取标准问题的语句;

将所述语句拆分成至少一个概念;

从所述至少一个概念中,筛选出有效概念;

标记所述有效概念;

将标记后的有效概念存储至概念扩展集。

5.如权利要求1所述的方法,其特征在于,所述初始请求信息类型包括FAQ类初始请求;

所述子知识库架构模型包括FAQ类知识库架构模型;

所述根据所述子知识库架构模型中预设的架构规则包括:创建FAQ类知识集合,所述FAQ类知识集合包括概念类问答对,其中,所述FAQ类问答对包括答案、一个标准问题和一个以上与标准问题相对应的扩展问题;

所述架构规则还包括:

获取FAQ类问答对的当前时间和录入时间;

根据所述FAQ类问答对的当前时间和录入时间,计算所述FAQ类问答对的存储时间;

如果所述存储时间大于知识有效时间,则将所述FAQ类问答对确定为无效问答对。

6.一种知识库的构建装置,其特征在于,包括:接收模块,用于接收初始请求信息,所述初始请求信息类型包括要素类初始请求、列表类初始请求、概念类初始请求和FAQ类初始请求;

查找模块,用于根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;

构建模块,用于根据所述子知识库架构模型中预设的架构规则,构建子知识库,所述子知识库构架模型包括要素类知识库架构模型、列表类知识库架构模型、概念类知识库架构模型和FAQ类知识库架构模型。

7.如权利要求6所述的装置,其特征在于,所述初始请求信息类型包括要素类初始请求;

所述子知识库架构模型包括要素类知识库架构模型;

所述构建模块包括:

第一创建单元,用于创建要素类知识集合,所述要素类知识集合包括触发场景信息和与所述触发场景信息相对应的N个要素类问答对,其中,所述每个要素类问答对包括反问问题和答案,所述答案包括要素属性和与要素属性相对应的要素信息,N为不小于1的正整数;

第一关联单元,用于建立触发场景信息和第一个要素类问答对的反问问题关联性;

第二关联单元,用于建立第K-1个要素类问答对的答案与第K个要素类问答对的反问问题关联性,K≤N。

8.如权利要求6所述的装置,其特征在于,所述初始请求信息类型包括列表类初始请求;

所述子知识库架构模型包括列表类知识库架构模型;

所述构建模块包括:

第二创建单元,用于创建列表类知识集合,所述列表类知识集合包括列表类问答对和列表元素集,其中,所述列表类问答对包括肯定答案、否定答案、一个标准问题和一个以上与标准问题相对应的扩展问题;

第一筛选单元,用于筛选所述列表类问答对的标准问题和扩展问题的有效字段;

匹配单元,用于根据所述有效字段,查找与所述有效字段相匹配的列表元素集;

第三关联单元,用于建立所述列表类问答对与所述列表元素集关联性。

9.如权利要求6所述的装置,其特征在于,所述初始请求信息类型包括概念类初始请求;

所述子知识库架构模型包括概念类知识库架构模型;

所述构建模块包括:

第三创建单元,用于创建概念类知识集合,所述概念类知识集合包括概念类问答对,其中,所述概念类问答对包括答案、一个标准问题和一个以上与标准问题相对应的概念扩展集;

获取单元,用于获取标准问题的语句;

拆分单元,用于将所述语句拆分成至少一个概念;

第二筛选单元,用于从所述至少一个概念中,筛选出有效概念;

标记单元,用于标记所述有效概念;

存储单元,将标记后的有效概念存储至概念扩展集。

10.如权利要求6所述的装置,其特征在于,所述初始请求信息类型包括FAQ类初始请求;

所述子知识库架构模型包括FAQ类知识库架构模型;

所述构建模块包括:

第四创建单元,用于创建FAQ类知识集合,所述FAQ类知识集合包括FAQ类问答对,其中,所述FAQ类问答对包括答案、一个标准问题和一个以上与标准问题相对应的扩展问题;

第四创建单元,还用于获取FAQ类问答对的当前时间和录入时间;根据所述FAQ类问答对的当前时间和录入时间,计算所述FAQ类问答对的存储时间;如果所述存储时间大于知识有效时间,则将所述FAQ类问答对确定为无效问答对。

说明书 :

一种知识库的构建方法及装置

技术领域

[0001] 本申请涉及数据处理的技术领域,尤其涉及一种知识库的构建方法及装置。

背景技术

[0002] 知识库,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识点集合。
[0003] 目前,知识库在智能问答系统有着广泛的应用。如图1所示,如果公众用户提出问题,智能问答系统将公众用户提出的问题与知识库内预设的问题匹配;如果匹配成功,智能问答系统会将该预设问题对应的答案反馈给公众用户。
[0004] 由于用户问题的多样性和不确定性,为了增加智能问答系统回答问题的准确率,知识库的编辑与扩展尤为重要。在现有技术中,图2是儿童办保险的知识点表格示例图,表格示例图的每一列是知识的一个要素,表格一行的所有要素组成一条完整的知识点。例如:工作人员录入答案是“儿童走失险”的知识点时,需录入包含所有元素的标准问题,如“什么保险是在北京给儿童投保,价格在3000元且投保时间是1-3年的?”,还需录入包含所有元素的多个扩展问题,如“在北京给儿童投保,价格在3000元且投保时间是1-3年的有哪些?”等。
同样,工作人员录入在答案是“儿童教育险”的知识点时,需录入包含所有元素的标准问题,如“什么保险是在北京给儿童投保,价格在2000元且投保时间是3-5年的?”,还需录入包含所有要素的多个扩展问题,如“在北京给儿童投保,价格在2000元且投保时间是3-5年的有哪些?”等。
[0005] 而针对知识中的同位概念,即在概念树中处于同一父节点下的子节点情况,例如:充电器、手枪、汽油、水等都是“乘坐飞机的违禁品”父节点的子结点,工作人员在录入答案是“充电器是乘坐飞机违禁品”的知识点时,需录入“充电器是乘坐飞机违禁品吗?”的标准问题,以及“飞机违禁品包括充电器吗?”“充电器属于飞机违禁品吗?”之类的扩展问题。同样,对于答案是“手枪是乘坐飞机违禁品”的知识点的录入也需采用上述录入方式。
[0006] 并且一个标准问题和对应的多个扩展问题极易存在多个相同的词汇,例如:“信用卡如何办理?”的标准问题和对应的“信用卡怎么办理?”“信用卡办理需要什么手续?”之类的扩展问题,“信用卡”和“办理”是标准问题和扩展问题都含有的词汇,录入人员需将“信用卡”和“办理”这两个词汇录入多次。因此,工作人员录入大量重复词汇和语句,极大浪费存储器的存储空间,并且极易导致存储空间不足。

发明内容

[0007] 本申请提供了一种知识库的构建方法及装置,以解决现有知识库存在大量重复词汇和语句,浪费存储器的存储空间,极易导致存储空间不足的问题。
[0008] 第一方面,本申请实施例提供了一种知识库的构建方法,包括:
[0009] 接收初始请求信息;
[0010] 根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;
[0011] 根据所述子知识库架构模型中预设的架构规则,构建子知识库。
[0012] 第二方面,本申请实施例提供了一种知识库的构建装置,包括:
[0013] 接收模块,用于接收初始请求信息;
[0014] 查找模块,用于根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;
[0015] 构建模块,用于根据所述子知识库架构模型中预设的架构规则,构建子知识库。
[0016] 由以上技术方案可知,本申请实施例提供一种知识库的构建方法及装置,将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,进而可利用不同的架构规则构建相应的子知识库,从而有效避免相同语句和词汇的重复录入,提高存储器的存储空间的利用率,并且有效降低工作人员录入量。

附图说明

[0017] 为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018] 图1为本申请的场景图;
[0019] 图2为儿童办保险的知识点表格示例图;
[0020] 图3为本申请提供的一种知识库的构建方法的一个实施例的方法流程示意图;
[0021] 图4为图3步骤303的一个实施例的方法流程图;
[0022] 图5为图3步骤303的另一个实施例的方法流程图;
[0023] 图6为图3步骤303的又一个实施例的方法流程图;
[0024] 图7为本申请提供的一种知识库的构建装置的一个实施例的结构示意图;
[0025] 图8为图7中构建模块的一个实施例的结构示意图;
[0026] 图9为图7中构建模块的另一个实施例的结构示意图;
[0027] 图10为图7中构建模块的又一个实施例的结构示意图。

具体实施方式

[0028] 下面结合说明书附图,对本申请实施例提供的一种知识库的构建方法及装置的具体实施方式进行说明。
[0029] 参见图3,为本申请提供的一种知识库的构建方法的一个实施例的方法流程示意图。本申请实施例提供一种知识库的构建方法,包括:
[0030] 步骤301:接收初始请求信息;
[0031] 步骤302:根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;
[0032] 步骤303:根据所述子知识库架构模型中预设的架构规则,构建子知识库。
[0033] 上述初始请求信息类型包括要素类初始请求、列表类初始请求、概念类初始请求和FAQ(Frequent ly Asked Quest ions,经常问到的问题)类初始请求等。子知识库构架模型包括要素类知识库架构模型、列表类知识库架构模型、概念类知识库架构模型和FAQ类知识库架构模型等。要素类知识库架构模型适用于每个知识点含有多个要素,且每个知识点的一个或多个要素不同的情况;列表类知识库架构模型适用于一个知识点的问题中含有较多同位概念的情况;概念类知识库架构模型适用于知识点的标准问题和扩展问题的重复词汇较多的情况;FAQ类知识库架构模型适用于常用知识点的情况。上述四种初始请求信息类型可涵盖大多数的知识信息,满足问答系统的知识库的应用需求。并且将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,工作人员在对知识库进行扩充时,仅需增加子知识库类型,无需更改整个知识库构架,也便于工作人员对知识库进一步完善。工作人员可通过电脑等终端设备的显示界面的按钮等形式,发送初始请求信息。
[0034] 由以上技术方案可知,本申请实施例提供一种知识库的构建方法,将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,进而可利用不同的架构规则构建相应的子知识库,从而有效避免相同语句和词汇的重复录入,提高存储器的存储空间的利用率,并且有效降低工作人员录入量。
[0035] 参见图4,为步骤303的一个实施例的方法流程图。步骤303还包括如下步骤:
[0036] 步骤401:创建要素类知识集合,所述要素类知识集合包括触发场景信息和与所述触发场景信息相对应的N个要素类问答对,其中,所述每个要素类问答对包括反问问题和答案,所述答案包括要素属性和与要素属性相对应的要素信息,N为不小于1的正整数。
[0037] 触发场景是要素类问答对包含的主题,触发场景词语可以是概括要素类问答主题的词语或语句,示例性的,参见图2,图2是儿童办保险的知识点表格示例图,触发场景词语或语句可以是“办保险”、“我要办保险”等,表格示例图的每一行为一个知识点,每一列的第一行为要素属性,即“对象名称”、“被投保人”、“地区”、“价格”和“期限”,该列的其他行为对应要素属性所属的要素信息,即“儿童走失险”和“儿童教育险”是“对象名称”的要素信息,“儿童”是“被投保人”的要素信息,“北京”是“地区”的要素信息,“2000”和“3000”是“价格”的要素信息,“1-3年”和“3-5年”是“期限”的要素信息。要素属性和对应的要素信息可在显示界面对应位置由工作人员进行录入,也可导入提前录入的如图2的表格。
[0038] 每个要素属性和对应的要素信息构成答案对应的反问问题由问答系统向公众用户提出的问题,反问问题的内容与答案相对应,例如:由要素属性是“被投保人”和要素信息是“儿童”构成的答案对应的反问问题可以是“你要给谁投保?”,“被投保人是谁”等;由要素属性是“地区”和要素信息是“北京”构成的答案对应的反问问题可以是“你要在哪投保?”、“你的投保地区是哪?”。反问问题可以由工作录入人员自显示界面对应位置进行录入。
[0039] 步骤402:建立触发场景信息和第一个要素类问答对的反问问题关联性。
[0040] 通过触发场景信息可调用第一个要素类问答对的反问问题,示例性的,触发场景信息为“办保险”,第一个要素类问答对的反问问题为“你的被投保人是谁?”,建立触发场景信息“办保险”和反问问题“你的被投保人是谁?”的关联性。当公众用户表述“我要办保险”时,则触发场景信息“办保险”,利用触发场景信息调用反问问题“你的被投保人是谁?”,以使问答系统与公众用户的问答开始。
[0041] 步骤403:建立第K-1个要素类问答对的答案与第K个要素类问答对的反问问题关联性,K≤N。
[0042] 示意性的,建立第1个要素类问答对关于被投保人的答案与第二个要素类问答对的反问问题“你投保的地区是哪里?”关联性,利用第一个要素类问题的答案调用第二个要素类问答对的反问问题,以此类推,以使公众用户与问答系统进行多轮问答。
[0043] 由以上技术方案可知,本申请实施例提供的一种知识库的构建方法,对于属于一个要素属性的多个要素信息构成的答案,仅需录入一个反问问题即可,与现有技术相比,无需多次重复录入含有相同要素信息的标准问题和对应的扩展问题,提高存储器的存储空间的利用率,并且有效降低工作人员的录入量。
[0044] 参见图5,为步骤303的另一个实施例的方法流程图。步骤303还包括如下步骤:
[0045] 步骤501:创建列表类知识集合,所述列表类知识集合包括列表类问答对和列表元素集,其中,所述列表类问答对包括肯定答案、否定答案、一个标准问题和一个以上与标准问题相对应的扩展问题。
[0046] 列表元素集包括主题名称和与主题名称相对应的列表元素,主题名称是列表元素的父节点,列表元素是主题名称的子节点,示例性的,一个列表元素集由主题名称是“飞机违禁品”以及主题名称所属的“充电器”、“手枪”、“汽油”和“水”等列表元素构成。针对该列表元素针可设定“##是飞机违禁品吗?”的标准问题,“##属于飞机违禁品吗?”等的扩展问题,以及“是飞机违禁品”的肯定回答和“不是飞机违禁品”的否定回答构成的问答对。列表元素集可由工作人员在显示界面的相应位置录入,也可以提前制作好导入。列表类问答对也可由工作人员在显示界面的相应位置录入。
[0047] 步骤502:选取所述列表类问答对的标准问题和扩展问题的有效字段。
[0048] 示意性的,“##是飞机违禁品吗?”的标准问题和“##属于飞机违禁品吗?”等的扩展问题的有效字段为“飞机违禁品”。
[0049] 步骤503:根据所述有效字段,查找与所述有效字段相匹配的列表元素集。
[0050] 匹配的方式可采用模糊匹配等匹配方法。其中一种具体实现方式是:对有效字段的每个字分配权重值,将有效字段与每个列表元素集进行比较,就完全相同或语义相同的部分进行计数,得到匹配程度值,选取匹配程度值较高的列表元素集。上述匹配方式是示意性的,本申请对匹配方法不做限制。
[0051] 步骤504:建立所述列表类问答对与相匹配的列表元素集的关联性。
[0052] 将列表类问答对与相匹配的列表元素集建立关联性,利用列表类问答对调用列表元素集,例如:公众用户向问答系统提问“毛巾是飞机违禁品吗?”时,利用列表类问答对中的标准问题“##是飞机违禁品吗?”调用主题为“飞机违禁品”的列表元素集。为了提高用户的体验感,列表元素集可包含否定列表元素集和肯定列表元素集,以实现问答系统对公众用户的问题进行肯定回答和否定回答。例如:公众用户提出“毛巾是乘飞机的违禁品吗?”的问题,“毛巾”不是违禁品,属于该问题的否定概念,而针对“毛巾”这一否定概念也有一系列的同位概念,因此,也可将这些同位概念用否定列表元素集的形式表示,并与相匹配的列表类问答对建立关联性,在否定概念列表元素集中进行查找匹配,根据查找匹配的结果,调用“不是,可以携带上飞机”的否定回答,以使问答系统向公众用户给出“不是,可以携带上飞机”的答案。而对于公众用户提出“充电宝是乘飞机的违禁品吗?”的问题,“充电宝”是违禁品,属于该问题的肯定概念,而针对“充电宝”这一肯定概念也有一系列的同位概念,因此,也可将这些同位概念用肯定列表元素集的形式表示,并与相匹配的列表类问答对建立关联性,在肯定概念列表元素集中进行查找匹配,根据查找匹配的结果,调用“是,不可以携带上飞机”的肯定回答,以使问答系统向公众用户给出“是,不可以携带上飞机”的答案。
[0053] 由以上技术方案可知,本申请实施例提供的一种知识库的构建方法,对于多个知识点的标准问和扩展问中存在互为同位概念的情况,与现有技术相比,无需将多个知识点的标准问、扩展问以及答案逐一录入,仅需针对列表元素集匹配一个通用的标准问和扩展问即可,提高存储器的存储空间的利用率,并且有效降低工作人员的录入量。
[0054] 参见图6,为步骤303的又一个实施例的方法流程图。步骤303还包括如下步骤:
[0055] 步骤601:创建概念类知识集合,所述概念类知识集合包括概念类问答对,其中,所述概念类问答对包括答案、一个标准问题和一个以上与标准问题相对应的概念扩展集;
[0056] 概念扩展集是标准问题的部分词语的相同或近似概念,例如:标准问题是“银行卡如何办理?”,对应的概念扩展集可以是“信用卡”、“账户”和“规则”等。
[0057] 步骤602:获取标准问题的语句;
[0058] 步骤603:将所述语句拆分成至少一个概念;
[0059] 概念是标准问题的词语,示例性的,标准问题的语句是“银行卡如何办理?”,可以拆分为“银行卡”“如何”“办理”三个概念。
[0060] 步骤604:从所述至少一个概念中,筛选出有效概念;
[0061] 有效概念是有确定意义的词语,例如:“银行卡”、“如何”和“办理”三个概念中,“银行卡”和“办理”为有效概念。
[0062] 步骤605:标记所述有效概念;
[0063] 步骤606:将标记后的有效概念存储至概念扩展集。
[0064] 将有效概念存储至概念扩展集后,工作人员无需在概念扩展集中录入标准问题的有效概念,从而减少词语的重复出现,提高存储器的存储空间的利用率,并且有效降低工作人员的录入量。
[0065] 进一步地,还可以设定概念类问答对的有效时间,具体步骤如下:
[0066] 获取概念类问答对的当前时间和录入时间;
[0067] 根据所述概念类问答对的当前时间和录入时间,计算所述概念类问答对的存储时间;
[0068] 如果所述存储时间大于知识有效时间,则将所述概念类问答对确定为无效问答对。
[0069] 录入人员可设置概念类问答对的有效时间,超过有效时间,可将该问答对确定为无效问答对,保证问答对的时效性。
[0070] 由以上技术方案可知,本申请实施例提供的一种知识库的构建方法,对于标准问题和扩展问题相同的词语的情况,通过对标准问题的拆分,筛选出有效概念,将有效概念存入概念扩展集中,与现有技术相比,无需将标准问题和扩展问题逐一录入,避免录入大量重复词语,从而提高存储器的存储空间的利用率,并且有效降低工作人员的录入量。
[0071] 进一步地,步骤303还包括如下步骤:
[0072] 创建FAQ类知识集合,所述FAQ类知识集合包括FAQ类问答对,其中,所述FAQ类问答对包括答案、一个标准问题和一个以上与标准问题相对应的扩展问题。
[0073] FAQ类知识架构模型适用于常用的知识点,例如:“如何办理火车票?”等。这一类知识往往不需要复杂的逻辑和要素补充,因此,一个标准问和若干个扩展问对应一个答案即可。
[0074] 进一步地,FAQ类问答对也可设置有效时间,具体步骤可参见概念类问答对设定有效时间的步骤,不再赘述。
[0075] 由以上技术方案可知,本申请实施例提供一种知识库的构建方法,将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,进而可利用不同的架构规则构建相应的子知识库,从而有效避免相同语句和词汇的重复录入,提高存储器的存储空间的利用率,并且有效降低工作人员录入量。
[0076] 第二方面,参见图7,图7为本申请提供的一种知识库的构建装置的一个实施例的结构示意图。本申请提供一种知识库的构建装置,包括:
[0077] 接收模块701,用于接收初始请求信息;
[0078] 查找模块702,用于根据初始请求信息类型,查找知识库内与所述初始请求信息类型相对应的子知识库架构模型;
[0079] 构建模块703,用于根据所述子知识库架构模型中预设的架构规则,构建子知识库。
[0080] 上述初始请求信息类型包括要素类初始请求、列表类初始请求、概念类初始请求和FAQ类初始请求。子知识库构架模型包括要素类知识库架构模型、列表类知识库架构模型、概念类知识库架构模型和FAQ类知识库架构模型。要素类知识库架构模型适用于每个知识点含有多个要素,且每个知识点的一个或多个要素不同的情况;列表类知识库架构模型适用于一个知识点的问题中含有较多同位概念的情况;概念类知识库架构模型适用于知识点的标准问题和扩展问题的重复词汇较多的情况;FAQ类知识库架构模型适用于常用知识点的情况。
[0081] 进一步地,参见图8,图8为构建模块的一个实施例的结构示意图,所述构建模块703包括:
[0082] 第一创建单元801,用于创建要素类知识集合,所述要素类知识集合包括触发场景信息和与所述触发场景信息相对应的N个要素类问答对,其中,所述每个要素类问答对包括反问问题和答案,所述答案包括要素属性和与要素属性相对应的要素信息,N为不小于1的正整数;
[0083] 第一关联单元802,用于建立触发场景信息和第一个要素类问答对的反问问题关联性;
[0084] 第二关联单元803,用于建立第K-1个要素类问答对的答案与第K个要素类问答对的反问问题关联性,K≤N。
[0085] 进一步地,如图9所示,图8为构建模块的另一个实施例的结构示意图。所述构建模块包括:
[0086] 第二创建单元901,用于创建列表类知识集合,所述列表类知识集合包括列表类问答对和列表元素集,其中,所述列表类问答对包括肯定答案、否定答案、一个标准问题和一个以上与标准问题相对应的扩展问题;
[0087] 第一筛选单元902,用于筛选所述列表类问答对的标准问题和扩展问题的有效字段;
[0088] 匹配单元903,用于根据所述有效字段,查找与所述有效字段相匹配的列表元素集;
[0089] 第三关联单元904,用于建立所述列表类问答对与所述列表元素集关联性。
[0090] 进一步地,如图10所示,图10为构建模块的一个实施例的结构示意图。所述构建模块包括:
[0091] 第三创建单元1001,用于创建概念类知识集合,所述概念类知识集合包括概念类问答对,其中,所述概念类问答对包括答案、一个标准问题和一个以上与标准问题相对应的概念扩展集;
[0092] 获取单元1002,用于获取标准问题的语句;
[0093] 拆分单元1003,用于将所述语句拆分成至少一个概念;
[0094] 第二筛选单元1004,用于从所述至少一个概念中,筛选出有效概念;
[0095] 标记单元1005,用于标记所述有效概念。
[0096] 存储单元1006,将标记后的有效概念存储至概念扩展集。
[0097] 进一步地,所述构建模块703包括:
[0098] 第四创建单元,用于创建FAQ类知识集合,所述FAQ类知识集合包括FAQ类问答对,其中,所述FAQ类问答对包括答案、一个标准问题和一个以上与标准问题相对应的扩展问题。
[0099] 由以上技术方案可知,本申请实施例提供一种知识库的构建方法及装置,将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,进而可利用不同的架构规则构建相应的子知识库,从而有效避免相同语句和词汇的重复录入,减少存储器的存储空间。
[0100] 本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者或对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以似的一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
[0101] 本说明书的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分可相互参见即可,每个实施例重点说明的都是与其他实施例的不同之处,尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。