一种以自然语言搜索关系型复杂管理信息系统数据的方法及系统转让专利
申请号 : CN201910115361.3
文献号 : CN109918453B
文献日 : 2021-03-12
发明人 : 何文 , 赵鑫阳 , 熊水玲
申请人 : 中国三峡建设管理有限公司
摘要 :
权利要求 :
1.一种以自然语言搜索关系型复杂管理信息系统数据的系统,其特征在于该系统包括:
自然语言解析模块,其用于:根据语义解析表,对用户输入的搜索条件进行语义解析,分别识别出输入条件中表名、属性名、属性值,并根据规则将属性名、属性值进行匹配,得出标准的查询条件;
数据查询模块,其用于:根据索引配置表,将自然语言解析模块得出的查询条件,转化为SQL 查询语句执行查询,再将查询结果提交给数据安全控制模块,以得到用户可看的查询结果;
数据安全控制模块,其用于:实现两个层级的权限控制,一是根据搜索目标表中设置的“安全级别”字段,实现对数据权限的初级管控;二是引入原信息系统的权限控制机制,实现对数据权限的精确管控;
搜索结果展示模块,其用于:以业务信息的形式而非单纯表单数据的形式,将数据信息提交给用户,同时为用户提供简单的数据分析及可视化工具;
所述自然语言解析模块还包括:
词性分析模块,其用于:根据语义解析表中的“标识”字段,识别出用户的输入项为表名、属性名或是属性值,根据表名优先、然后属性名,最后属性值的顺序来识别;然后根据属性名与属性值临近的匹配规则,将属性名与属性值成对匹配;最终形成“表名+属性名+属性值”的组合方式,将用户输入的查询条件精准解析为标准的查询条件;
多条件识别及组合模块,其用于:在用户输入多个查询条件情况下,能够智能识别多个查询条件之间的逻辑关系,执行组合查询,实现准确搜索,其逻辑关系识别以及查询条件组合过程遵循以下几个规则:
规则一:根据索引配置表,确定属性与表名之间的关系,如果多个属性属于同一表中的不同属性,则条件之间以AND组合查询条件;
规则二:根据索引配置表,确定属性与表名之间的关系,如果多个属性属于不同的表,则再根据索引配置表中配置,得出不同表之间的属性取值关系,根据该取值关系确定表间的子查询关系,以IN组合查询条件;
规则三:如果自然语言解析的结果只有表名+属性值的情况,则将该属性值带入索引配置表中当前表的所有属性进行匹配,但此时同一表中的不同属性之间以OR组合查询条件;
上述为规则一、二、三为基本原则,通过不同规则的组合应用,能够分析识别出各种复杂查询;
所述数据查询模块还包括:
单表联想搜索模块,其用于:根据索引配置表中配置的“目标表+目标字段”对应到“源表+源字段”的模式,将对一个目标字段的查询转化为对源表中多个搜索字段的查询,允许业务用户从对象的不同属性入手搜索数据;另一方面对于重复性较强的编码类数据,在源表中的查询速度也远远优于在引用该编码的业务表中的查询速度,再加上索引配置表中“取值条件”字段的设定,进一步缩小了在源表中的搜索范围,提高数据搜索的速度;
所述搜索结果展示模块包括:
数据自动推送模块,其用于:设计了相关数据推送定义表,其中按照表间字段的取值关系,定义了某个基表相关的父级基表、子级基表以及其他关联基表;在数据搜索模块完成数据搜索之后,根据相关数据推送定义表以及索引配置表中所配置的表间关系,在其他关联基表中查出相关数据一并反馈给用户;
搜索结果衍生展示模块,其用于,第一:将编码类数据转换为业务信息描述:即根据编码描述转换表,将业务数据表中存储的编码类数据代码转化为可读性更强的业务描述;第二:根据业务需求,在搜索结果展示中添加辅助显示字段,即根据辅助显示定义表,即能够在任意显示表中添加关联的显示字段;
不同类型数据个性化展示模块,其用于:对于结构化数据,以数据表的方式提供数据、并主动推送相关数据;对于文件、新闻类数据,以链接的方式提供数据;对于位置信息,以地图链接的方式提供数据;
搜索结果分析及可视化模块,其用于:提供数据下载功能、数据订阅功能、数据统计及图表生成功能;用户通过数据订阅功能可及时跟踪当前表中的最新数据变动,所有数据更新将自动推送给用户;数据统计及图表生成功能为用户提供了按字段计数、求和数据处理过程,并根据结果生成相应图表展示。
2.根据权利要求1所述一种以自然语言搜索关系型复杂管理信息系统数据的系统,其特征在于:所述数据查询模块还包括:层级搜索模块,其用于:利用索引配置表中的“层级标识”字段,能够配置当前字段的值是否存在层级关系;如果搜索的目标字段为层级关系字段,将在源表的源字段中分析字段取值,找出上下级层级关系,一并搜索出上层及下层数据并返回至搜索结果展示模块。
3.采用如上述1‑2任意一项系统的以自然语言搜索关系型复杂管理信息系统数据的方法,其特征在于包括以下步骤:
步骤A:输入搜索条件;
步骤B:根据语义解析表,对用户输入的搜索条件进行语义解析,对词性进行识别,包括确认表名、属性名及属性值,并将属性值与属性匹配;
步骤C:根据用户输入的条件及既定的逻辑规则,确认多个查询条件之间的逻辑关系,得出由标准描述组成的组合查询条件;
步骤D:将标准描述转化为对应的表名及字段名,并将对目标字段的查询转化为源表搜索字段的查询,并按照步骤C中的逻辑关系,拼接查询语句;
步骤E:根据步骤D中拼接处的查询语句执行查询;
步骤 F:生成衍生展示数据及辅助显示字段;
步骤G:根据搜索目标表中设置的安全级别字段,实现对数据权限的初级管控;针对敏感数据引入原信息系统的权限控制机制,对步骤E中的搜索结果进一步筛选,实现对数据权限的精确管控;
步骤H:根据数据类型返回数据,并提供相应的数据分析及可视化工具。
说明书 :
一种以自然语言搜索关系型复杂管理信息系统数据的方法及
系统
技术领域
背景技术
易得性是这类用户很关心的一个问题。
要让业务人员能够自主获取存储于数据库中的数据,一种做法就是:让用户进行学习,让其
知道数据库结构,包括基表内容、基表间关联关系、基表字段含义,还要熟练掌握SQL语言,
这样做下来,用户可以自主的像IT人员一样从数据库中提取自己想要的数据了。但是实际
上,这种方式除对极个别具有IT基础或对IT非常有兴趣的特殊用户有用之外,绝大多数用
户是不可能接受的。一般业务人员只想专注于自己的专业,而非复杂IT技术,除非提供一个
诸如百度搜索的极简高效的数据搜索工具,否则,从数据库中提取数据是较为难以实现的。
发明内容
了数据使用的技术门槛;本发明系统支持多条件录入、识别及组合查询,并根据业务逻辑对
查询结果进行优化、衍生处理;该系统还采用严格的权限控制机制,以保障数据的安全。利
用本发明搜索方法,用户只需要根据自己的需求用自然语言输入查询条件,即可获得查询
结果及相关数据;用户的个性化需求得到快速实现,增强了数据的可用性、也更贴合业务需
求。
得出标准的查询条件;
查询结果;
实现对数据权限的精确管控;
属性名与属性值临近的匹配规则,将属性名与属性值成对匹配;最终形成“表名+属性名+属
性值”的组合方式,将用户输入的查询条件精准解析为标准的查询条件。
件组合过程遵循以下几个规则:
间的子查询关系,以IN组合查询条件;
件;
段的查询,允许业务用户从对象的不同属性入手搜索数据,大大扩展了数据的可搜索范围;
另一方面对于重复性较强的编码类数据,在源表中的查询速度也远远优于在引用该编码的
业务表中的查询速度,再加上索引配置表中“取值条件”字段的设定,进一步缩小了在源表
中的搜索范围,提高数据搜索的速度。
字段取值,找出上下级层级关系,一并搜索出上层及下层数据并返回至搜索结果展示模块,
层级搜索对于反应业务的完整性有很好的作用。
成数据搜索之后,根据相关数据推送定义表以及索引配置表中所配置的表间关系,可在其
他关联基表中查出相关数据一并反馈给用户,数据自动推送模块提升了所反馈数据的业务
完整性、提高搜索结果的可用性。
述;第二:根据业务需求,在搜索结果展示中添加辅助显示字段,即根据辅助显示定义表,即
可在任意显示表中添加关联的显示字段,以提高展示信息的业务完整性,提高搜索结果的
可用性。
以地图链接的方式提供数据,方便用户使用。
数据更新将自动推送给用户;数据统计及图表生成功能为用户提供了按字段计数、求和等
数据处理过程,并可根据结果生成相应图表展示。
“AND”的逻辑组合查询;如果属于不同的表,则根据索引配置表中的信息,确认不同表之间
的字段取值关系,在组合查询条件时同一表中的不同属性之间还是以“AND”方式组合,而不
同表之间的字段取值关系以子查询“IN”的方式组合;
限的精确管控;
仅是关系型数据库中数据的搜索工具,更是针对信息系统业务信息的搜索及展示。立足于
业务需求角度的设计,大大提高了搜索与业务的紧密结合,增强了本发明对业务的支持及
可用程度。
实现了由业务人员自主获取业务数据、个性化的查询需求能得到快速响应的目标;提高数
据易得性的同时,也提高了数据的利用率。
附图说明
具体实施方式
逻辑过程可见图1逻辑流程图。该系统包括以下几个部分:
下一步生成查询语句执行查询。本步骤中主要有三个特征点:
规则,将属性名与属性值成对匹配;最终形成“表名+属性名+属性值”的组合方式。
组合,首先确认表名及属性名之间的关系:如果同属一张表,则多个属性+属性值的组合以
“AND”的逻辑组合查询;如果属于不同的表,则根据索引配置表,表1‑2中的信息,确认不同
表之间的字段取值关系,在组合查询条件时同一表中的不同属性之间还是以“AND”方式组
合,而不同表之间的字段取值关系以子查询“IN”的方式组合。如果词性分析的结果中只有
表名+属性值的结果,那么将属性值带入该表的所有属性,作为条件执行查询,但各属性+属
性值之间组合的逻辑关系为“OR”。多条件识别及组合之后的查询的模式调整为:
据2.1节中记载的单表联想搜索特征进行处理。
骤将把标准化处理后的查询条件转化为SQL查询语句执行查询,再将查询结果提交给安全
控制模块,以得到用户可看的查询结果。本步骤主要有以下特征点:
搜索字段的查询,例如:
搜索数据,扩展了数据的可搜索范围。
明系统中的联想搜索,则可以按照源表(合同代码字段的取值表:合同基表)中的搜索字段
(合同基表中定义的合同属性来搜索),比如:合同名称、签订日期、签订单位、合同类型、合
同总金额等,这些条件最终都将指向这一个合同。
在源表中查询的速度也远远优于在引用该数据的业务表中的查询,再加上“取值条件”字段
的设定,进一步缩小了在源表中的搜索范围,提高数据搜索的速度。
时需要上一层级或者下一层级的数据;为满足业务需求,本发明系统中引入了层级搜索功
能。利用表1‑2中的“层级标识”字段,可配置当前字段的值是否存在层级关系;如果搜索的
目标字段为层级关系字段,将在源表的源字段中分析字段值,找出上下级层级关系,并将相
关的上下级数据一起返回。
科目之后,将分析科目代码字段的值,找出上级代码和下级代码的相关数据,一并返回。
全级别”字段,实现对数据权限的初级管控,二是引入原信息系统的权限控制机制,实现对
数据权限的精确管控。数据表的安全级别分为敏感和非敏感:非敏感数据即为可以对用户
完全开放的数据,无需权限控制;而敏感数据则是无法对用户完全开放,需要引入原信息系
统的权限控制机制进行管控。在该权限控制机制下,既保障了数据的安全,也方便用户的使
用。
了一个基表相关的父级基表、子级基表以及其他关联基表;在完成数据搜索之后,根据表1‑
4以及表1‑2中所配置的表间关系,可在其他关联基表中查出相关数据一并反馈给用户,提
升所反馈数据的业务完整性、提高搜索结果的可用性。
及可视化工具。个性化展示主要包括以下几个方面:
字段在源表中的对应字段,源字段描述即为源表中对应的描述字段。根据表1‑5中的字段设
置即可可拼接出所需的转换查询语句。
显示字段,取值条件中涉及的参数即为显示表的查询结果中对的应数据,据此所展示信息
的更具业务完整性,提高搜索结果的可用性。
提供数据、并主动推送相关数据;对于文件、新闻类数据,以链接的方式提供数据;对于位置
信息,以地图链接的方式提供数据等。
可以及时跟踪当前表中的最新数据变动,所有数据更新将自动推送给用户,方便用户及时
了解数据更新情况;数据统计及图表生成功能为用户提供了按字段计数、求和等数据处理
过程,并可根据结果生成相应图表展示。
同义词 可与该标准描述对应的自然语言(基于业务术语及用户习惯搜集)
标识 TABLE/FIELD:标识该标准描述对应表名或是属性名
目标表 待搜索目标表名
父级表 目标表中某些字段的定义表
子级表 子级表中某些字段取值于目标表
其他可跳转表 其他与目标表有表间数据相等关系的表
待转换字段名 待转换字段名
源表名 待转换字段定义表的表名
源字段名 待转换字段在源表中对应的字段名
源字段描述 源字段定义时对应的业务描述
取值条件 源表中查询时对应的取值条件(转换显示时,需带入查询的条件)
标准描述 源字段的标准描述