一种新型干法水泥熟料生产热耗知识图谱的构建方法转让专利

申请号 : CN201910575949.7

文献号 : CN110263185B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 宋华珠熊博涛易小泉阮珠清周明凯赵青林吴迪

申请人 : 武汉理工大学

摘要 :

本发明属于水泥熟料热耗技术领域,公开了一种新型干法水泥熟料生产热耗知识图谱的构建方法,以水泥熟料生产热耗知识为中心,通过划分基础知识、深度知识和综合应用知识之间的关系,构建结构化的新型干法水泥熟料生产热耗知识图谱;采用分布式代理的模式,基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理,通过将指令分配给代理执行,使用户获取相关知识。本发明从基础层面、深度层面、应用层面三个层面对热耗进行分析,发现实体与实体之间的潜在关系,进而找出影响热耗的关键因素以及降低热耗的有效且高效的方法,从而达到降低能耗的直接目的,最终实现水泥产业优化。

权利要求 :

1.一种新型干法水泥熟料生产热耗知识图谱的构建方法,其特征在于,所述新型干法水泥熟料生产热耗知识图谱的构建方法包括:步骤一,对水泥熟料生产热耗知识中的基础知识、深度知识和综合应用知识之间的关系进行划分,构建结构化的新型干法水泥熟料生产热耗知识图谱;

步骤二,采用分布式代理的模式,基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理,通过将指令分配给代理执行,使用户获取相关知识;

所述将指令分配给代理执行,使用户获取相关知识的方法包括:

第一步,当用户对系统发起访问请求, AgentHub将对用户的输入内容进行初步解析,并基于基础知识、深度分析和综合应用三种词汇库,根据与词汇库的匹配程度以及输入内容所包含实体或概念的个数进行评分;

第二步,当三种分数相差明显时,则将解析结果传输给评分最高、匹配度最佳的领域内;当三种分数相差较小时,则提醒用户对基础知识、深度知识和综合应用知识的领域进行选择;

当用户的解析结果传输给对应领域后,领域将对解析结果进行深度分析确定所属类别,并将搜索任务分配给所属类别子代理,所属类别的代理进行相关知识的搜寻;

在反馈用户结果时,若仅反馈某单一层次内知识,往往不能达到用户目的;考虑到该三个层次的复杂度从高到低排序为综合应用知识 > 深度知识 > 基础知识;为实现输出知识的多维度,当用户搜寻高层次知识时,子代理还将调用低层次领域的同名子代理进行查询;

第三步,各层次搜寻结果将传输至知识汇总代理进行整合,整合后知识汇总代理将结果返回给AgentHub,并由AgentHub反馈给用户。

2.如权利要求1所述的新型干法水泥熟料生产热耗知识图谱的构建方法,其特征在于,步骤一中,基础知识、深度知识和综合应用知识之间的关系为:深度知识包含相关基础知识及深度知识的组合;

综合应用知识包含相关综合应用知识、深度知识与基础知识的组合;

具体描述为:

深度知识 = 深度知识 | ∪基础知识 | (深度知识 ∪基础知识);

综合应用知识 = 综合应用知识 | ∪深度知识 | (综合应用知识 ∪深度知识)。

3.如权利要求1所述的新型干法水泥熟料生产热耗知识图谱的构建方法,其特征在于,步骤一构建结构化的新型干法水泥熟料生产热耗知识图谱后,还需进行:通过BiLSTM-CRF结合信息熵的命名实体识别,具体包括:

命名实体识别过程,对国标文档文本进行分词及标注,并从词向量化和特征向量完成模型搭建与训练,实现命名实体识别,并输出识别结果。

4.如权利要求1所述的新型干法水泥熟料生产热耗知识图谱的构建方法,其特征在于,步骤二基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理中, 利用抽象组件构建水泥熟料的领域知识并划分九种不同的子代理构成抽象组件Agent; 所述抽象组件Agent具体包括基础信息知识子代理、标准知识子代理、原材料知识子代理、燃料知识子代理、操作过程知识子代理、运行管理知识子代理、质量监控知识子代理、环境监控知识子代理、设备维管知识子代理,每一种子代理管理相应类型的知识组件。

5.一种利用权利要求1所述新型干法水泥熟料生产热耗知识图谱的构建方法构建的新型干法水泥熟料生产热耗知识图谱。

说明书 :

一种新型干法水泥熟料生产热耗知识图谱的构建方法

技术领域

[0001] 本发明属于水泥熟料热耗技术领域,尤其涉及一种新型干法水泥熟料生产热耗知识图谱的构建方法。

背景技术

[0002] 目前,最接近的现有技术:水泥行业是我国重要基础材料产业,也是我国主要的高能耗、高排放产业,是我国节能减排中的重点也是难点之一。加大节能减排力度,已成为水泥行业面临的一项艰巨而紧迫的任务。因此节能减排对中国水泥工业来说已经刻不容缓。
[0003] 水泥工业的能源消耗主要来源于水泥熟料煅烧生产。水泥熟料煅烧是水泥生产过程中高能耗、高热耗损失的一个工艺环节,对水泥生产热耗有着重要的影响。我国当前普遍采用的水泥生产方法是新型干法水泥生产技术,该技术因其显著地优越性赢得了广泛的认可,成为水泥生产工艺技术新的发展潮流,但仍存在能耗高、产能利用率低等缺点。要想达到节能减排的目标,对新型干法水泥熟料生产过程进行热耗分析是十分必要的。但单一的进行热耗分析是不够的,因此,需要构建新型干法水泥熟料生产热耗知识图谱。
[0004] 而在国内外的研究中,大多都是对新型干法水泥熟料生产过程热耗进行分析,还并未有学者构建新型干法水泥熟料生产热耗的知识图谱。因此构建新型干法水泥熟料生产热耗知识图谱具有十分重要的意义和价值
[0005] 综上所述,现有技术存在的问题是:水泥熟料生产领域没有形成本领域的知识库,生产过程或政策制定过程中,很多都是根据专家或工程师的经验,以及实际经验,所以,没有对该领域知识的总结与提炼的成果;并且,由于知识零散、分布在不同地方、出现的形式也不一样,不同人需求的知识也不同,所以,这对本领域的知识获取提出了更高的要求。
[0006] 在国内外的研究中,大多都是对新型干法水泥熟料生产过程热耗进行分析,还并未有学者构建新型干法水泥熟料生产热耗的知识图谱。
[0007] 解决上述技术问题的难度:
[0008] 如何根据水泥熟料生产的实际,搭建知识的架构;如何根据不同的需求,确定相关的知识;如何让这种知识呈现一种动态,即可以自动根据需求去响应不同的知识,然后对知识进行重组后为不同用户服务,以解决其实际问题。
[0009] 解决上述技术问题的意义:
[0010] 构建新型干法水泥熟料生产热耗知识图谱能够把复杂晦涩难懂的水泥熟料热耗知识领域及知识体系通过数据挖掘、信息处理、信息计量等方式表示出来,不仅可以为新型干法水泥熟料生产热耗分析的研究提供全方面、科学性、整体性、关系链的参考,可以帮助企业人员通过搜索问答获取行业内的相关信息,还可以为企业实际生产的决策制定、业务管理等方面提供科学可靠的帮助。

发明内容

[0011] 针对现有技术存在的问题,本发明提供了一种新型干法水泥熟料生产热耗知识图谱的构建方法。
[0012] 本发明是这样实现的,一种新型干法水泥熟料生产热耗知识图谱的构建方法,包括:
[0013] 步骤一,以水泥熟料生产热耗知识为中心,通过划分基础知识、深度知识和综合应用知识之间的关系,构建结构化的新型干法水泥熟料生产热耗知识图谱。
[0014] 步骤二,采用分布式代理的模式,基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理,通过将指令分配给代理执行,使用户获取相关知识。
[0015] 进一步,步骤一中,基础知识、深度知识和综合应用知识之间的关系为:
[0016] 深度知识包含相关基础知识及深度知识的组合。
[0017] 综合应用知识包含相关综合应用知识、深度知识与基础知识的组合。
[0018] 具体描述为:
[0019] 深度知识=深度知识|∪基础知识|(深度知识∪基础知识)。
[0020] 综合应用知识=综合应用知识|∪深度知识|(综合应用知识∪深度知识)。
[0021] 其中,每一种知识都包含水泥熟料生产中的知识,可划分为如下的9类:
[0022] 知识类别 相关知识内容基础信息知识 水泥厂基本信息(包含生产线信息、水泥厂信息、产品信息、生产任务等)标准知识 国标、省标及相关重要文件所规定标准
原材料知识 生产原材料及其反应的内容
燃料知识 生产燃料及其反应的内容
操作过程知识 生产工艺与操作
运行管理知识 运行管理(各级工作人员职能;当前运行状态监控;异常预警、报警及故障诊断)质量监控知识 质量监控
环境监控知识 环境监控
设备维管知识 生产设备(电子仪器,机械设备)的维修、管理
[0023] 进一步,步骤一构建结构化的新型干法水泥熟料生产热耗知识图谱后,还需进行:
[0024] 通过BiLSTM-CRF结合信息熵的命名实体识别,具体包括:
[0025] 命名实体识别过程,对国标文档文本进行分词及标注,并从词向量化和特征向量完成模型搭建与训练,实现命名实体识别,并输出识别结果。
[0026] 进一步,步骤二基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理中,利用抽象组件构建水泥熟料的领域知识并划分九种不同的子代理构成抽象组件Agent。所述抽象组件Agent具体包括基础信息知识子代理、标准知识子代理、原材料知识子代理、燃料知识子代理、操作过程知识子代理、运行管理知识子代理、质量监控知识子代理、环境监控知识子代理、设备维管知识子代理,每一种子代理管理相应类型的知识组件;抽象组件Agent是3个不同层次知识的抽象组件。
[0027] 进一步,步骤二将指令分配给代理执行,使用户获取相关知识的方法包括:
[0028] 第一步,当用户对系统发起访问请求,AgentHub将对用户的输入内容进行初步解析,并基于基础知识、深度分析和综合应用三种词汇库,根据与词汇库的匹配程度以及输入内容所包含实体或概念的个数进行评分。
[0029] 第二步,当三种分数相差明显时,则将解析结果传输给评分最高、匹配度最佳的领域内。当三种分数相差较小时,则提醒用户对基础知识、深度知识和综合应用知识的领域进行选择。
[0030] 当用户的解析结果传输给对应领域后,领域将对解析结果进行深度分析确定所属类别,并将搜索任务分配给所属类别子代理,所属类别的代理进行相关知识的搜寻。
[0031] 在反馈用户结果时,若仅反馈某单一层次内知识,往往不能达到用户目的;考虑到该三个层次的复杂度从高到低排序为综合应用知识>深度知识>基础知识;为实现输出知识的多维度,当用户搜寻高层次知识时,子代理还将调用低层次领域的同名子代理进行查询。
[0032] 第三步,各层次搜寻结果将传输至知识汇总代理进行整合,整合后知识汇总代理将结果返回给AgentHub,并由AgentHub反馈给用户。
[0033] 本发明另一目的在于提供一种利用所述新型干法水泥熟料生产热耗知识图谱的构建方法构建的新型干法水泥熟料生产热耗知识图谱。
[0034] 本发明的优点及积极效果为:
[0035] 本发明以水泥熟料生产热耗知识为中心,通过AgentHub从基础、深度和应用三个层面,自顶向下构建结构化的新型干法水泥熟料生产热耗知识图谱,以实现知识图谱的完整性和层次性。采用分布式代理的模式,基于三个层面特性设计子代理,通过将指令分配给多个子代理执行,使用户更高效、精准、迅速地获取相关知识,以此来实现知识获取的高效化和精确化。
[0036] 本发明以水泥熟料生产热耗知识为中心,从基础、深度和应用三个层次,构建结构化的新型干法水泥熟料生产热耗知识图谱,以实现知识图谱的完整性和层次性。
[0037] 采用分布式代理的模式,基于三个层次特性设计代理及相应子代理,通过将指令分配给代理执行,使用户更高效、精准、迅速地获取相关知识,以此来实现知识获取的高效化和精确化。
[0038] 本发明利用数据挖掘、智能分析等技术,从基础、深度和应用三个层面,建立全面完整的新型干法水泥热耗知识图谱,通过BiLSTM-CRF结合信息熵的命名实体识别,通过基于注意力机制的BiLSTM模型的实体关系抽取,并对所建立的知识进行冲突消解。所构建的知识平台能为水泥熟料的生产提供相应的知识及解决相关问题的指导,能更好供现场的工人或工程师参考,并提供指导方案,进而达到降低整个水泥熟料的生产过程的热耗,节约燃料,降低生产成本的目的,实现生产的节能与优化。
[0039] 本发明通过构建新型干法水泥熟料生产热耗知识图谱,从基础层面、深度层面、应用层面三个层面,更科学高效对新型干法水泥熟料生产过程中热耗进行分析,发现实体与实体之间的潜在关系,进而找出影响热耗的关键因素以及降低热耗的有效且高效的方法,从而达到降低能耗的直接目的,最终实现水泥产业优化。

附图说明

[0040] 图1是本发明实施例提供的新型干法水泥熟料生产热耗知识图谱的构建方法流程图。
[0041] 图2是本发明实施例提供的基础、深度和应用三个层次构建的知识架构图。
[0042] 图3是本发明实施例提供的抽象化组件Agent图。
[0043] 图4是本发明实施例提供的知识图谱的架构图。
[0044] 图5是本发明实施例提供的改进的BiLSTM-CRF模型结构图。
[0045] 图6是本发明实施例提供的关系抽取的输入语料示例图。
[0046] 图7是本发明实施例提供的基础知识评价分析图。
[0047] 图中:(a)、基础知识实体分布。(b)基础知识构成分析。
[0048] 图8是本发明实施例提供的基础知识部分图谱可视化实例图。
[0049] 图9是本发明实施例提供的基础知识查询信息展示1图。
[0050] 图10是本发明实施例提供的基础知识查询信息示例展示2图。

具体实施方式

[0051] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0052] 在国内外的研究中,大多都是对新型干法水泥熟料生产过程热耗进行分析,还并未有学者构建新型干法水泥熟料生产热耗的知识图谱。
[0053] 针对现有技术存在的问题,本发明提供了一种新型干法水泥熟料生产热耗知识图谱的构建方法,下面结合附图对本发明作详细的描述。
[0054] 如图1所示,本发明实施例提供的新型干法水泥熟料生产热耗知识图谱的构建方法包括以下步骤:
[0055] S101,以水泥熟料生产热耗知识为中心,通过划分基础知识、深度知识和综合应用知识之间的关系,构建结构化的新型干法水泥熟料生产热耗知识图谱。
[0056] S102,采用分布式代理的模式,基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理,通过将指令分配给代理执行,使用户获取相关知识。
[0057] 步骤S101,中,基础知识、深度知识和综合应用知识之间的关系为:
[0058] 深度知识包含相关基础知识及深度知识的组合。
[0059] 综合应用知识包含相关综合应用知识、深度知识与基础知识的组合。
[0060] 具体描述为:
[0061] 深度知识=深度知识|∪基础知识|(深度知识∪基础知识)。
[0062] 综合应用知识=综合应用知识|∪深度知识|(综合应用知识∪深度知识)。
[0063] 步骤S101构建结构化的新型干法水泥熟料生产热耗知识图谱后,还需进行:
[0064] 通过BiLSTM-CRF结合信息熵的命名实体识别,具体包括:
[0065] 命名实体识别过程,对国标文档文本进行分词及标注,并从词向量化和特征向量完成模型搭建与训练,实现命名实体识别,并输出识别结果。
[0066] 步骤S102基于基础知识、深度知识和综合应用知识三个层次特性设计代理及相应子代理中,利用抽象组件构建水泥熟料的领域知识并划分九种不同的子代理构成抽象组件Agent。所述抽象组件Agent具体包括基础信息知识子代理、标准知识子代理、原材料知识子代理、燃料知识子代理、操作过程知识子代理、运行管理知识子代理、质量监控知识子代理、环境监控知识子代理、设备维管知识子代理,每一种子代理管理相应类型的知识组件。
[0067] 步骤S102将指令分配给代理执行,使用户获取相关知识的方法包括:
[0068] 第一步,当用户对系统发起访问请求,AgentHub将对用户的输入内容进行初步解析,并基于基础知识、深度分析和综合应用三种词汇库,根据与词汇库的匹配程度以及输入内容所包含实体或概念的个数进行评分。
[0069] 第二步,当三种分数相差明显时,则将解析结果传输给评分最高、匹配度最佳的领域内。当三种分数相差较小时,则提醒用户对基础知识、深度知识和综合应用知识的领域进行选择。
[0070] 当用户的解析结果传输给对应领域后,领域将对解析结果进行深度分析确定所属类别,并将搜索任务分配给所属类别子代理,所属类别的代理进行相关知识的搜寻。
[0071] 在反馈用户结果时,若仅反馈某单一层次内知识,利用综合应用知识、深度知识、基础知识从高到底排序原则,子代理调用低层次领域的同名子代理进行查询进行某单一层次内知识补充完善。
[0072] 第三步,各层次搜寻结果将传输至知识汇总代理进行整合,整合后知识汇总代理将结果返回给AgentHub,并由AgentHub反馈给用户。
[0073] 下面结合具体实施例及分析对本发明作进一步描述。
[0074] 1知识架构。
[0075] 在整个水泥生产过程中,包含着大量的知识。为尽可能的保证所构建知识图谱的完整性和准确性,确定了从基础、深度和应用三个层次构建知识,如图2知识架构所示。
[0076] 在图2中,每个层次的知识都是独立的知识组件。深度知识包含相关基础知识及深度知识的组合。综合应用知识包含相关综合应用知识、深度知识与基础知识的组合。
[0077] 深度知识=深度知识|∪基础知识|(深度知识∪基础知识)。
[0078] 综合应用知识=综合应用知识|∪深度知识|(综合应用知识∪深度知识)。
[0079] 此外,根据水泥熟料生产的工艺、过程等因素,为提高获取相关热耗知识的准确度,我们将水泥熟料生产知识大致分为九种类型,见表1,这些类型的知识基本覆盖了水泥熟料生产的工艺、管理、原材料、环保等主要应用场景。
[0080] 表1水泥熟料生产相关知识划分及内容
[0081]
[0082] 2利用抽象组件构建水泥熟料的领域知识。
[0083] 针对基础、深度及综合应用所涉及的领域知识的共性,本方法根据表1的知识划分设计了九种不同的子代理构成抽象组件Agent,如图3所示。
[0084] 在图3中,抽象组件Agent包含基础信息知识子代理(Agent_BasicInfo)、标准知识子代理(Agent_Norm)、原材料知识子代理(Agent_RawMarterial)、燃料知识子代理(Agent_Fuel)、操作过程知识子代理(Agent_ProcessOperation)、运行管理知识子代理(Agent_RunningManagement)、质量监控知识子代理(Agent_QualityMonitor)、环境监控知识子代理(Agent_EnvironmentMonitor)、设备维管知识子代理(Agent_EquipmentFixManagement),每一种子代理都管理相应类型的知识组件。
[0085] 该三个层次知识将通过继承抽象组件Agent完成不同功能的实现。
[0086] 3、知识图谱的架构和机制。
[0087] 根据上述知识构建及三个层次知识构建方法,设计了如图4的知识图谱架构。
[0088] 图4可以很好地说明本知识图谱的架构的优点,对于架构,一般都是定性分析的(因为架构图是最重要的):
[0089] AgentHub可以用于搜集用户的需求,并根据具体的需求,分派不同的任务下行,不至于在获取需求的时候造成瓶颈,由此解决获得需求时可能出现的拥堵;
[0090] 不同代理可以处理不同的知识,降低了搜索空间,会提升处理效率;
[0091] 三个层次知识的划分,也是从应用知识的角度出发的,这样便于为用户提供不同层次的知识服务。
[0092] 为了更准确的获取和反馈用户所需相关知识,提出了AgentHub用于分析用户问题及汇总最终结果。
[0093] 当用户对系统发起访问请求,首先AgentHub将对用户的输入内容进行初步解析,并基于基础知识、深度分析和综合应用三种词汇库,根据其与词汇库的匹配程度以及输入内容所包含实体或概念的个数为其评分。当三种分数相差明显时,则将解析结果传输给评分最高、匹配度最佳的领域内。当三种分数相差较小时,则提醒用户对三种领域进行选择,提高输出结果的准确度。
[0094] 当用户的解析结果传输给对应领域后,领域将对解析结果进行深度分析确定所属类别,并将搜索任务分配给所属类别子代理,所属类别的代理进行相关知识的搜寻。
[0095] 在反馈用户结果时,若仅反馈某单一层次内知识,往往不能达到用户目的。考虑到该三个层次的复杂度从高到低排序为“综合应用知识>深度知识>基础知识”。为实现输出知识的多维度,当用户搜寻高层次知识时,子代理还将调用低层次领域的同名子代理进行查询。
[0096] 例如,当用户搜寻从属于综合应用高层次的水泥厂基本信息知识时,综合应用层次的子代理Agent_BasicInfo则会分别调用深度知识层次和基础知识层次的子代理Agent_BasicInfo进行信息查询,为综合应用知识进行补充完善。
[0097] 最后,各层次搜寻结果将传输至知识汇总代理进行整合。整合后知识汇总代理将结果返回给AgentHub,并由AgentHub反馈给用户。
[0098] 4、下面结合知识图谱的构建(实例)对本发明作进一步描述。
[0099] 下面将从国标中读取知识为例构建基础知识。深度知识与综合应用知识的方法大体相似。
[0100] 知识由三元组<实体1,实体1与实体2之间的关系,实体2>表示。实体关系抽取和命名实体识别的实验由准确率P、召回率R和F1值进行评测,相应的计算分别如公式(1)、公式(2)、公式(3)所示。
[0101] P=n/N                                  (1)。
[0102] R=n/M                                  (2)。
[0103] F1=2×P×R/(P+R)                      (3)。
[0104] 其中:n表示实验结果中关系正确标注的个数,N代表实验结果中实体关系标注的总个数,M表示测试集中实体关系的总个数。
[0105] 4.1命名实体识别过程。
[0106] 在考虑到尽可能使用命名实体识别精确率高的算法,本发明结合了信息熵的BiLSTM-CRF-MI系统对国标文档文本进行分词及标注,并从词向量化和特征向量构造两个方面,完成模型搭建与训练,进而实现命名实体识别,输出识别结果,其模型结构如图5所示。与CRF-MI的对比结果见表2。
[0107] 表2CRF-MI的实验结果
[0108]
[0109] 从表2的实验结果中可以看到,同样在CRF层上加入了互信息熵(Mutual information-entropy,MI)的筛选算法,BiLSTM-CRF对于术语、设备名、材料名、实体、量纲单位5类命名实体识别精确率相对较高,对比CRF模型提升较为明显。可以看出,基于BiLSTM-CRF的学习模型,在针对相关领域的命名实体识别任务上,达到了较好的效果。特别是对于一些组合式的命名实体,例如术语中就包含大量组合的词语,LSTM模型中的能够学习长期依赖关系的能力,取得了较好的性能。从识别率来看,BiLSTM对于这5类命名实体,对比传统的CRF模型,均有较大的提升,这应该是因为CRF是基于概率的模型,而水泥生产能耗领域的命名实体通常会由一些基本的命名实体拼接而成,因而给CRF的分类造成一定干扰。从总体召回率上看,只有在量纲单位上BiLSTM和CRF的召回率相近,这也可能是因为量纲在水泥生产国标文本中的分布并不多,导致相关训练语料不足以致特征学习不明显。
[0110] 总而言之,从实验对比结果看来,在针对水泥生产能耗国标领域这一细分领域的命名实体识别任务中,基于BiLSTM-CRF-MI算法的模型学习识别方法,较传统的基于统计学习的方法有着较大的优势。
[0111] 4.2实体关系抽取。
[0112] 在识别命名实体后,在输入图6的预料后,引入了注意力机制的BiLSTM-Attention模型进行水泥生产能耗国标文档的实体关系抽取,其与CRF、BiLSTM的实验结果如表3所示。
[0113] 表3实验结果
[0114]
[0115] 从实验结果中可以看出,在基于上下位领域关系的抽取实验中,相对于没有引入注意力机制的BiLSTM模型,基于BiLSTM-Attention的模型对于关系识别的效果提升较大。这应该是因为注意力机制的序列输入时,随着序列的不断增长,原始BiLSTM的识别方式的表现就会下降,无法照顾到句子中前后对应的实体词语。这是由于BiLSTM原始的模型设计的结构问题,即所有的上下文信息都被限制到固定长度,使得BiLSTM模型的学习能力受限。
[0116] 4.3基础领域知识成分分析。
[0117] 本发明水泥生产能耗相关国标构建的领域知识库,对于其中的实体类别包括术语、参数名、设备名、材料名、量纲单位等包含较为完整,如图7((a)基础知识实体分布。(b)基础知识构成分析)。因为这些知识信息统统来源于国家标准局发布的水泥生产能耗国标文档,因而在知识的权威性方面毋庸置疑。总体来看,本发明构建的水泥生产能耗领域国标知识库具有较高的潜在应用价值,相关的构建方法和经验可以延伸复用至其他领域。
[0118] 在本发明实施例中,图8为基础知识部分图谱可视化实例图。图9为基础知识查询信息展示1图。图10为基础知识查询信息示例展示2图。
[0119] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。