基于知识图谱的指标提取方法和装置转让专利

申请号 : CN202110777886.0

文献号 : CN113571179B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 冯晓彬吴美龙黎成权王建民董家鸿

申请人 : 清华大学

摘要 :

本发明提供一种基于知识图谱的指标提取方法和装置,其中,方法包括:获取患者的信息;对患者的信息进行结构化处理,得到患者的结构化信息;依据患者的结构化信息和研究目标确定研究所需的参考指标;获取参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。本发明通过依据患者信息和研究的目的确定研究所要参考的指标。再通过获取确定的指标在不同时间点的数值,将这些数值与现有的知识图谱相比对,利用知识图谱对这些指标进行筛选和校准,从而得到研究所能够依据的指标。这些指标并非知识图谱中已明确的,而是通过研究确定的。

权利要求 :

1.一种基于知识图谱的指标提取方法,其特征在于,包括:

获取患者的信息;

对所述患者的信息进行结构化处理,得到患者的结构化信息;

依据所述患者的结构化信息和研究目标确定研究所需的参考指标;其中,所述参考指标包括研究人员结合自身的知识利用所述结构化信息和所述研究目标确定的研究所需要的参考指标;所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础;所述节点包括:以第一疾病、第一症状、医疗操作、药物为第一节点,以化验指标、影像指标、第二疾病和第二症状为第二节点;所述有向边是指由第一节点指向第二节点的影响关系;

获取所述参考指标在不同时间点的取值;

将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标;其中,所述最终的研究参考目标包括将确定的所述参考指标在不同时间点的数值与所述知识图谱相比对,利用知识图谱对所述参考指标进行筛选和校准后得到的研究所能够依据的指标;

所述将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标,具体为:所述知识图谱用于提示不同时间点的参考指标受到其他因素的影响;

指示研究者依据所述影响判断所述影响对应的时间点的参考指标是否能作为研究的参考指标;

若研究者判断所述参考指标受所述其他因素的影响权重小于预设阈值,则指示研究者确定所述时间点对应的参考指标为最终的研究参考指标。

2.根据权利要求1所述的基于知识图谱的指标提取方法,其特征在于,在所述确定最终的参考指标之后,还包括:利用所述最终确定的参考指标对所述知识图谱进行修改、更新维护。

3.根据权利要求1所述的基于知识图谱的指标提取方法,其特征在于,所述获取患者的信息包括治疗前信息和治疗后信息;

其中,治疗前信息包括基本信息、现病史信息、既往史信息、家族史信息、个人史信息、体格检查信息、治疗前影像检查信息、治疗前化验检查信息和治疗前病理检查信息;

治疗后信息包括治疗后影像检查信息、治疗后化验检查信息、治疗后病理检查信息、治疗后症状信息。

4.一种基于知识图谱的指标提取装置,其特征在于,包括:

第一处理模块,用于获取患者的信息;

第二处理模块,用于对所述患者的信息进行结构化处理,得到患者的结构化信息;

第三处理模块,依据所述患者的结构化信息和研究目标确定研究所需的参考指标;其中,所述参考指标包括研究人员结合自身的知识利用所述结构化信息和所述研究目标确定的研究所需要的参考指标;所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础;所述节点包括:以第一疾病、第一症状、医疗操作、药物为第一节点,以化验指标、影像指标、第二疾病和第二症状为第二节点;所述有向边是指由第一节点指向第二节点的影响关系;

第四处理模块,用于获取所述参考指标在不同时间点的取值;

第五处理模块,将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标;其中,所述最终的研究参考目标包括将确定的所述参考指标在不同时间点的数值与所述知识图谱相比对,利用知识图谱对所述参考指标进行筛选和校准后得到的研究所能够依据的指标;所述将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标,具体为:所述知识图谱用于提示不同时间点的参考指标受到其他因素的影响;

指示研究者依据所述影响判断所述影响对应的时间点的参考指标是否能作为研究的参考指标;

若研究者判断所述参考指标受所述其他因素的影响权重小于预设阈值,则指示研究者确定所述时间点对应的参考指标为最终的研究参考指标。

5.根据权利要求4所述的基于知识图谱的指标提取装置,其特征在于,所述装置还用于:在所述确定最终的参考指标之后,利用所述最终确定的参考指标对所述知识图谱进行修改、更新维护。

6.根据权利要求5所述的基于知识图谱的指标提取装置,其特征在于,所述获取患者的信息包括治疗前信息和治疗后信息;

其中,治疗前信息包括基本信息、现病史信息、既往史信息、家族史信息、个人史信息、体格检查信息、治疗前影像检查信息、治疗前化验检查信息和治疗前病理检查信息;

治疗后信息包括治疗后影像检查信息、治疗后化验检查信息、治疗后病理检查信息、治疗后症状信息。

7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述基于知识图谱的指标提取方法的步骤。

8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述基于知识图谱的指标提取方法的步骤。

说明书 :

基于知识图谱的指标提取方法和装置

技术领域

[0001] 本发明涉及医学研究技术领域,尤其涉及一种基于知识图谱的指标提取方法和装置。

背景技术

[0002] 肿瘤是严重威胁人类生命安全的疾病,其治疗具有时间周期长、方案多样、过程复杂多变的特点。近年来疾病数据库或知识库迎来了较大的发展,并出现了基于医学数据/知识存储库开展研究的趋势。这些数据库更多的只是对医学数据/知识进行简单的存储,不能满足研究的需要,研究者需要根据自身专业知识去判断和提取研究指标。医学研究在研究某一种治疗方案的效果时要求排除既往治疗和后续不同治疗的影响,研究人员在发起研究时需要耗费大量的时间和精力在众多时间点中去排除各种治疗方案或病人所处状态对相关指标的影响。然而较多的研究者在提取指标时由于自身专业知识储备的不足并不能很好的判断提取的指标是否合适或没有排除影响因素的意识,如何在在不同时间选择正确时间点的合理的指标是临床的迫切需要。

发明内容

[0003] 本发明提供一种基于知识图谱的指标提取方法和装置,用以解决现有技术中无法确定研究指标的缺陷,实现利用知识图谱确定研究指标。
[0004] 第一方面,本发明提供一种基于知识图谱的指标提取方法,包括:
[0005] 获取患者的信息;
[0006] 对所述患者的信息进行结构化处理,得到患者的结构化信息;
[0007] 依据所述患者的结构化信息和研究目标确定研究所需的参考指标;
[0008] 获取所述参考指标在不同时间点的取值;
[0009] 将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0010] 本发明提供的基于知识图谱的指标提取方法,其中,在所述确定最终的参考指标之后,还包括:
[0011] 利用所述最终确定的参考指标对所述知识图谱进行修改、更新维护。
[0012] 进一步,本发明提供的基于知识图谱的指标提取方法,其中,所述获取患者的信息包括治疗前信息和治疗后信息;
[0013] 其中,治疗前信息包括基本信息、现病史信息、既往史信息、家族史信息、个人史信息、体格检查信息、治疗前影像检查信息、治疗前化验检查信息和治疗前病理检查信息;
[0014] 治疗后信息包括治疗后影像检查信息、治疗后化验检查信息、治疗后病理检查信息、治疗后症状信息。
[0015] 进一步,本发明提供的基于知识图谱的指标提取方法,其中,所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础;
[0016] 其中,所述节点包括:以第一疾病、第一症状、医疗操作、药物为第一节点,以化验指标、影像指标、第二疾病和第二症状为第二节点;
[0017] 所述有向边是指由第一节点指向第二节点的影响关系。
[0018] 进一步,本发明提供的基于知识图谱的指标提取方法,其中,将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标,具体为:
[0019] 所述知识图谱提示不同时间点的参考指标所述受到其他因素的影响;
[0020] 研究者依据所述影响判断所述影响对应的时间点的参考指标是否能作为研究的参考指标;
[0021] 若研究者判断所述参考指标受所述其他因素的影响权重小于预设阈值,则研究者确定所述时间点对应的参考指标为最终的研究参考指标。
[0022] 第二方面,本发明提供一种基于知识图谱的指标提取装置,包括:
[0023] 第一处理模块,用于获取患者的信息;
[0024] 第二处理模块,用于对所述患者的信息进行结构化处理,得到患者的结构化信息;
[0025] 第三处理模块,依据所述患者的结构化信息和研究目标确定研究所需的参考指标;
[0026] 第四处理模块,用于获取所述参考指标在不同时间点的取值;
[0027] 第五处理模块,将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0028] 进一步,本发明提供的基于知识图谱的指标提取装置,其中,所述装置还包括:
[0029] 第六处理模块,用于在所述确定最终的参考指标之后,利用所述最终确定的参考指标对所述知识图谱进行修改、更新维护。
[0030] 进一步,本发明提供的基于知识图谱的指标提取装置,其中,所述获取患者的信息包括治疗前信息和治疗后信息;
[0031] 其中,治疗前信息包括基本信息、现病史信息、既往史信息、家族史信息、个人史信息、体格检查信息、治疗前影像检查信息、治疗前化验检查信息和治疗前病理检查信息;
[0032] 治疗后信息包括治疗后影像检查信息、治疗后化验检查信息、治疗后病理检查信息、治疗后症状信息。
[0033] 第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述任一项所述基于知识图谱的指标提取方法的步骤。
[0034] 第四方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述基于知识图谱的指标提取方法的步骤。
[0035] 本发明提供的一种基于知识图谱的指标提取方法和装置,其中方法包括:获取患者的信息;对所述患者的信息进行结构化处理,得到患者的结构化信息;通过将患者杂乱而多样的医学信息转化为研究所需要的结构化信息。进而,依据所述患者的结构化信息和研究目标确定研究所需的参考指标;即研究人员结合自身的知识利用获取的结构化信息和研究的目的,确定研究所需要的参考指标。获取参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。本发明通过依据患者信息和研究的目的确定研究所要参考的指标。再通过获取确定的指标在不同时间点的数值,将这些数值与现有的知识图谱相比对,利用知识图谱对这些指标进行筛选和校准,从而得到研究所能够依据的指标。同时,由于这些指标并非知识图谱中已明确的,而是通过研究确定的,能够实现对研究的指导。

附图说明

[0036] 为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037] 图1是本发明提供的基于知识图谱的指标提取方法的流程示意图之一;
[0038] 图2是本发明提供的基于知识图谱的指标提取方法的流程示意图之二;
[0039] 图3是本发明提供的利用知识图谱确定最终参考指标的示意图;
[0040] 图4是本发明提供的基于知识图谱的指标提取装置的结构示意图;
[0041] 图5是本发明提供的电子设备的结构示意图。

具体实施方式

[0042] 为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0043] 下面结合图1‑图2描述本发明提供一种基于知识图谱的指标提取方法,包括:
[0044] 步骤100:获取患者的信息;
[0045] 具体地,从各个医疗卫生信息系统的业务数据库中抽取患者信息。而获取患者的信息包括治疗前信息和治疗后信息;
[0046] 其中,治疗前信息包括基本信息、现病史信息、既往史信息、家族史信息、个人史信息、体格检查信息、治疗前影像检查信息、治疗前化验检查信息和治疗前病理检查信息;
[0047] 治疗后信息包括治疗后影像检查信息、治疗后化验检查信息、治疗后病理检查信息、治疗后症状信息。
[0048] 步骤200:对所述患者的信息进行结构化处理,得到患者的结构化信息;
[0049] 由于医疗卫生信息系统的业务数据库包括但不限于HIS、LIS、PACS、EMR、病理等信息,这些数据并非都具有结构性,因此,将其中的非结构信息转化为结构化的信息。
[0050] 步骤300:依据所述患者的结构化信息和研究目标确定研究所需的参考指标;
[0051] 具体地,依据患者的结构化信息,以及研究的目标确定研究所需要的指标。举例来说,以肝细胞癌肝部分切除术后为例,为了研究术后患者的预后营养指数(PNI=白蛋白(g/9
L)+5*淋巴细胞绝对值(10 /L))对肿瘤预后的影响,需要将提取白蛋白和淋巴细胞作为研究指标。
[0052] 步骤400:获取参考指标在不同时间点的取值;
[0053] 在确定研究的问题的指标之后,采集所述指标在不同时间点的取值。采集的时间可以是等时间隔的时间,也可以是非等时间隔,具体间隔根据医学的采集需要予以确定,再次不予限制。
[0054] 步骤500:将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0055] 具体地,虽然确定了指标在不同时间的数值,但是,由于较多的研究者在提取指标时由于自身专业知识储备的不足并不能很好的判断提取的指标是否合适或没有排除影响因素的意识,如何在在不同时间选择正确时间点的合理的指标是临床的迫切需要。采用知识图谱与参考指标取值相互结合的方式,确定具体哪一个或几个时间点的指标的数值可以使用,举例来说,以术前外周血中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期预后影响的研究为例,一个病人在手术前可能多次抽取外周血化验,不同研究者在提取外周血中性粒细胞和淋巴细胞时对于应该选择那次的外周血并不清楚,需要排除什么样的影响也不清楚。实际上中性粒细胞/淋巴细胞能否真实的反应肿瘤患者术前的免疫状态至关重要,如果研究者提取的患者正处于肺部感染、腹部感染等状态,此时的中性粒细胞和淋巴细胞则并不能真实的反应的肿瘤患者日常的免疫状态,相反反应的更多是一种感染状态的免疫状态,如此提取的指标用于研究肝细胞癌的预后则存在较大的影响。此外,如果本次治疗期间在肝切除之前进行了肝脏介入治疗,则也会激发炎症反应,那么介入术后的炎症指标也不能很好的反应肿瘤患者真实的免疫状态。
[0056] 而现有的知识图谱会展现患者患有肺部炎症、腹部感染等状态时可能会导致中性粒细胞和淋巴细胞的数值偏高,因此,在炎症存在的情况下,就无法在术前外周血中性粒细胞/淋巴细胞和肝细胞癌肝部分切除术后远期影响之间建立单因素变量关系。因此,需要等到炎症消除后由专家确定其影响权重低不会对研究产生影响之后,才能判断出中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期预后的影响。
[0057] 本发明实施例中虽然采用的是一些明显的医学常识,但是研究者并没有掌握所有的医学知识,因此在研究者确定需要获取的指标是否会受到别的因素影响,以及这些影响因素在哪个时间点会消失,从而确定哪个时间点的指标数值是可以作为研究的参考指标,就需要知识图谱用来辅助研究者对研究的参考指标的筛选。
[0058] 其中,所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础,以第一疾病、第一症状、医疗操作、药物等为第一节点,以化验指标、影像指标、第二疾病和第二症状等临床指标为第二节点,以影响关系为由第一节点指向第二节点的有向边构建的。也即是,知识图谱,可以向研究者表明对参考指标的数值产生影响的因数有哪些。即本发明实施例中可以通过知识图谱判断患者本身的状态,判断出有哪些因素会对研究者选定的指标产生影响,从而帮助研究者确定最终的参考指标。
[0059] 本发明实施例提供的本发明提供一种基于知识图谱的指标提取方法,通过获取患者的信息;对所述患者的信息进行结构化处理,得到患者的结构化信息;通过将患者杂乱而多样的医学信息转化为研究所需要的结构化信息。进而,依据所述患者的结构化信息和研究目标确定研究所需的参考指标;即研究人员结合自身的知识利用获取的结构化信息和研究的目的,确定研究所需要的参考指标。获取参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。本发明通过依据患者信息和研究的目的确定研究所要参考的指标。再通过获取确定的指标在不同时间点的数值,将这些数值与现有的知识图谱相比对,利用知识图谱对这些指标进行筛选和校准,从而得到研究所能够依据的指标。同时,由于这些指标并非知识图谱中已明确的,而是通过研究确定的,能够实现对研究的指导。
[0060] 进一步,本发明实施例提供的基于知识图谱的指标提取方法,其中,在所述确定最终的参考指标之后,还包括:
[0061] 利用所述最终确定的参考指标对所述知识图谱进行修改、更新维护。
[0062] 具体地,在本发明实施例中,由于研究员确定对研究指标与研究目的之间存在的关系,是现有的知识图谱中并不存在的新的知识,因此,利用新的知识对现有的知识图谱进行更新,实现对知识图谱的增量。
[0063] 进一步,参考图3,本发明实施例中提供的基于知识图谱的指标提取方法,其中,将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标,具体包括:
[0064] 所述知识图谱提示不同时间点的参考指标所述受到其他因素的影响;
[0065] 研究者依据所述影响判断所述影响对应的时间点的参考指标是否能作为研究的参考指标;
[0066] 若研究者判断所述参考指标受所述其他因素的影响权重小于预设阈值,则研究者确定所述时间点对应的参考指标为最终的研究参考指标。
[0067] 具体地,所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础,以第一疾病、第一症状、医疗操作、药物等为第一节点,以化验指标、影像指标、第二疾病和第二症状等临床指标为第二节点,以影响关系为由第一节点指向第二节点的有向边构建的。也即,知识图谱,可以向研究者表明对参考指标的数值产生影响的因数有哪些。即本发明实施例中可以通过知识图谱判断患者本身的状态,判断出有哪些因素会对研究者选定的指标产生影响,从而帮助研究者确定最终的参考指标。
[0068] 举例来说,以术前外周血中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期预后影响的研究为例,一个病人在手术前可能多次抽取外周血化验,不同研究者在提取外周血中性粒细胞和淋巴细胞时对于应该选择那次的外周血并不清楚,需要排除什么样的影响也不清楚。
[0069] 而现有的知识图谱会展现患者患有肺部炎症、腹部感染等状态时会导致中性粒细胞和淋巴细胞的数值偏高,因此,在炎症存在的情况下,就无法在术前外周血中性粒细胞/淋巴细胞和肝细胞癌肝部分切除术后远期影响之间建立单因素变量关系。因此,需要等到炎症消除后由专家确定其影响权重低不会对研究产生影响之后,才能判断出中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期影响。在图3中,第一时间点假设患者存在肺炎,则此时获取的外周血中性粒细胞/淋巴细胞指标不能够作为研究的参考指标,进而在第二时间点处,此时患者的肺炎有所减轻,但是专家判断其中炎症仍不足以完全被忽视,则需要不断检测,直到炎症能够被忽视,参考指标能够反映研究的效果为止,在本发明实施例中影响因素对之指标的影响权重小于预设的阈值中的阈值是由专家予以判断,比如可以是小于百分之十等。
[0070] 即,知识图谱帮助研究人员起到警示和规范研究者提取指标,帮助研究者确定所述最终参考指标。
[0071] 第二方面,参照图4,本发明实施例提供一种基于知识图谱的指标提取装置,包括:
[0072] 第一处理模块41,用于获取患者的信息;
[0073] 第二处理模块42,用于对所述患者的信息进行结构化处理,得到患者的结构化信息;
[0074] 第三处理模块43,依据所述患者的结构化信息和研究目标确定研究所需的参考指标;
[0075] 第四处理模块44,用于获取参考指标在不同时间点的取值;
[0076] 第五处理模块45,将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0077] 具体地,第一处理模块41用于:
[0078] 从各个医疗卫生信息系统的业务数据库中抽取患者信息。而获取患者的信息包括治疗前信息和治疗后信息;
[0079] 其中,治疗前信息包括基本信息、现病史信息、既往史信息、家族史信息、个人史信息、体格检查信息、治疗前影像检查信息、治疗前化验检查信息和治疗前病理检查信息;
[0080] 治疗后信息包括治疗后影像检查信息、治疗后化验检查信息、治疗后病理检查信息、治疗后症状信息。
[0081] 第二处理模块42用于:
[0082] 由于医疗卫生信息系统的业务数据库包括但不限于HIS、LIS、PACS、EMR、病理等信息,这些数据并非都具有结构性,因此,将其中的非结构信息转化为结构化的信息。
[0083] 第三处理模块43用于:
[0084] 具体地,依据患者的结构化信息,以及研究的目标确定研究所需要的指标。举例来说,以肝细胞癌肝部分切除术后为例,为了研究术后患者的预后营养指数(PNI=白蛋白(g/L)+5*淋巴细胞绝对值(109/L))对肿瘤预后的影响,需要将提取白蛋白和淋巴细胞作为研究指标。
[0085] 第四处理模块44用于:
[0086] 在确定研究的问题的指标之后,采集所述指标在不同时间点的取值。采集的时间可以是等时间隔的时间,也可以是非等时间隔,具体间隔根据医学的采集标准予以确定,在此不予限制。
[0087] 第五处理模块45用于:
[0088] 具体地,虽然确定了指标在不同时间的数值,但是,由于较多的研究者在提取指标时由于自身专业知识储备的不足并不能很好的判断提取的指标是否合适或没有排除影响因素的意识,如何在不同时间选择正确时间点的合理的指标是临床的迫切需要。采用知识图谱与参考指标取值相互结合的方式,确定具体哪一个或几个时间点的指标的数值可以使用,举例来说,以术前外周血中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期预后影响的研究为例,一个病人在手术前可能多次抽取外周血化验,不同研究者在提取外周血中性粒细胞和淋巴细胞时对于应该选择那次的外周血并不清楚,需要排除什么样的影响也不清楚。实际上中性粒细胞/淋巴细胞能否真实的反应肿瘤患者术前的免疫状态至关重要,如果研究者提取的患者正处于肺部感染、腹部感染等状态,此时的中性粒细胞和淋巴细胞则并不能真实的反应的肿瘤患者日常的免疫状态,相反反应的更多是一种感染状态的免疫状态,如此提取的指标用于研究肝细胞癌的预后则存在较大的影响。此外,如果本次治疗期间在肝切除之前进行了肝脏介入治疗,则也会激发炎症反应,那么介入术后的炎症指标也不能很好的反应肿瘤患者真实的免疫状态。
[0089] 而现有的知识图谱会展现患者患有肺部炎症、腹部感染等状态时会导致中性粒细胞和淋巴细胞的数值偏高,因此,在炎症存在的情况下,就无法在术前外周血中性粒细胞/淋巴细胞和肝细胞癌肝部分切除术后远期影响之间建立单因素变量关系。因此,需要等到炎症消除后由专家确定其影响权重低不会对研究产生影响之后,才能判断出中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期预后影响。
[0090] 本发明实施例中虽然采用的是一些明显的医学常识,但是研究者并没有掌握所有的医学知识,因此在研究者确定需要获取的指标是否会受到别的因素影响,以及这些影响指标在哪个时间点会消失,从而确定哪个时间点的指标数值是可以作为研究的参考指标,就需要知识图谱用来辅助研究者对研究的参考指标的筛选。
[0091] 其中,所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础,以第一疾病、第一症状、医疗操作、药物等为第一节点,以化验指标、影像指标、第二疾病和第二症状等临床指标为第二节点,以影响关系为由第一节点指向第二节点的有向边构建的。也即是,知识图谱,可以向研究者表明对参考指标的数值产生影响的因数有哪些。即本发明实施例中可以通过知识图谱判断患者本身的状态,判断出有哪些因素会对研究者选定的指标产生影响,从而帮助研究者确定最终的参考指标。
[0092] 本发明实施例提供的本发明提供一种基于知识图谱的指标提取装置,通过获取患者的信息;对所述患者的信息进行结构化处理,得到患者的结构化信息;通过将患者杂乱而多样的医学信息转化为研究所需要的结构化信息。进而,依据所述患者的结构化信息和研究目标确定研究所需的参考指标;即研究人员结合自身的知识利用获取的结构化信息和研究的目的,确定研究所需要的参考指标。获取参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。本发明通过依据患者信息和研究的目的确定研究所要参考的指标。再通过获取确定的指标在不同时间点的数值,将这些数值与现有的知识图谱相比对,利用知识图谱对这些指标进行筛选和校准,从而得到研究所能够依据的指标。同时,由于这些指标并非知识图谱中已明确的,而是通过研究确定的,实现对研究的指导。
[0093] 进一步,本发明实施例提供的基于知识图谱的指标提取装置,其中,所述装置还包括:
[0094] 第六处理模块,用于在所述确定最终的参考指标之后,利用所述最终确定的参考指标对所述知识图谱进行修改、更新维护。
[0095] 具体地,在本发明实施例中,由于研究员确定对研究指标与研究目的之间存在的关系,是现有的知识图谱中并不存在的新的知识,因此,利用新的知识对现有的知识图谱进行更新,实现对知识图谱的增量。
[0096] 进一步,本发明实施例中提供的基于知识图谱的指标提取装置,其中,第五处理模块45具体用于:
[0097] 所述知识图谱提示不同时间点的参考指标所述受到其他因素的影响;
[0098] 研究者依据所述影响判断所述影响对应的时间点的参考指标是否能作为研究的参考指标;
[0099] 若研究者判断所述参考指标受所述其他因素的影响权重小于预设阈值,则研究者确定所述时间点对应的参考指标为最终的研究参考指标。
[0100] 具体地,所述知识图谱包括节点和连接节点的有向边,是依据医学专业指南、专家共识、药物说明、医学文献、医学专业书籍为基础,以第一疾病、第一症状、医疗操作、药物等为第一节点,以化验指标、影像指标、第二疾病和第二症状等临床指标为第二节点,以影响关系为由第一节点指向第二节点的有向边构建的。也即是,知识图谱,可以向研究者表明对参考指标的数值产生影响的因数有哪些。即本发明实施例中可以通过知识图谱判断患者本身的状态,判断出有哪些因素会对研究者选定的指标产生影响,从而帮助研究者确定最终的参考指标。
[0101] 举例来说,以术前外周血中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期预后影响的研究为例,一个病人在手术前可能多次抽取外周血化验,不同研究者在提取外周血中性粒细胞和淋巴细胞时对于应该选择那次的外周血并不清楚,需要排除什么样的影响也不清楚。
[0102] 而现有的知识图谱会展现患者患有肺部炎症、腹部感染等状态时会导致中性粒细胞和淋巴细胞的数值偏高,因此,在炎症存在的情况下,就无法在术前外周血中性粒细胞/淋巴细胞和肝细胞癌肝部分切除术后远期影响之间建立单因素变量关系。因此,需要等到炎症消除后或者由专家确定其影响权重低不会对研究产生影响之后,才能判断出中性粒细胞/淋巴细胞对肝细胞癌肝部分切除术后远期影响。在本发明实施例中影响因素对之指标的影响权重小于预设的阈值中的阈值是由专家予以判断,比如可以是小于百分之十等。
[0103] 即,知识图谱帮助研究人员起到警示和规范研究者提取指标,帮助研究者确定所述最终参考指标。
[0104] 图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行基于知识图谱的指标提取方法,该方法包括:获取患者的信息;对所述患者的信息进行结构化处理,得到患者的结构化信息;依据所述患者的结构化信息和研究目标确定研究所需的参考指标;获取所述参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0105] 此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0106] 另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于知识图谱的指标提取方法,该方法包括:获取患者的信息;对所述患者的信息进行结构化处理,得到患者的结构化信息;依据所述患者的结构化信息和研究目标确定研究所需的参考指标;获取所述参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0107] 又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的基于知识图谱的指标提取方法,该方法包括:获取患者的信息;对所述患者的信息进行结构化处理,得到患者的结构化信息;依据所述患者的结构化信息和研究目标确定研究所需的参考指标;获取所述参考指标在不同时间点的取值;将所述不同时间点的所述参考指标取值与知识图谱相结合,确定所述不同时间点中的至少一个时间点所对应的参考指标为最终的研究参考指标。
[0108] 以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0109] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0110] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。