癌症特异的共调网络建立方法及装置转让专利

申请号 : CN201811492500.6

文献号 : CN109616152B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李睿江陈河兵卢一鸣李昊江帅洪浩李宛莹黄昕赵诚辉张卓伯晓晨

申请人 : 中国人民解放军军事科学院军事医学研究院

摘要 :

本发明提供了一种癌症特异的共调网络建立方法及装置,属于癌症调控网络建立技术领域。所述方法包括:根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息;根据TF调控信息和miRNA调控信息建立三元调控网络;识别所述三元调控网络中的FFLs,获得FFLs识别结果;根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA‑TF共调网络。本发明建立了TF,miRNA和靶基因的三元调控网络,并结合基因表达信息,获得miRNA‑TF共调网络,提高了miRNA‑TF共调控关系的准确性。

权利要求 :

1.一种癌症特异的共调网络建立方法,其特征在于,包括:

根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息;

根据TF调控信息和miRNA调控信息建立三元调控网络;

识别所述三元调控网络中的FFLs,获得FFLs识别结果;

根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络;

所述FFLs是miRNA和TF共同调控靶基因的形式,包括TF-FFLs、miRNA-FFLs和复合FFLs三种类型;

所述TF-FFLs中,TF是主要调控者;

所述miRNA-FFLs中,miRNA是主要调控者;

所述复合FFLs中,miRNA和TF相互调节,所述复合FFLs由所述TF-FFLs和miRNA-FFLs结合形成;

所述识别所述三元调控网络中的FFLs,获得FFLs识别结果,具体包括:根据网络模体挖掘算法在所述三元调控网络中识别FFLs,获得FFLs识别结果;

所述根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络,具体包括:根据FFLs识别结果和癌症基因组表达量信息,利用统计检验、网络推理算法或基因富集分析得到miRNA和TF对癌症基因组靶基因的共调关系,并根据所述共调关系建立癌症特异的miRNA-TF共调网络。

2.根据权利要求1所述方法,其特征在于,所述TF调控信息包括TF-miRNA调控信息和TF-mRNA调控信息。

3.根据权利要求1所述方法,其特征在于,所述miRNA调控信息包括miRNA-TF调控信息和miRNA-mRNA调控信息。

4.根据权利要求1所述方法,其特征在于,所述癌症基因组表达信息包括mRNA表达量信息和miRNA表达量信息。

5.一种癌症特异的共调网络建立装置,其特征在于,包括:

获得模块,用于根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息;

建立模块,用于用户根据TF调控信息和miRNA调控信息建立三元调控网络;

识别模块,用于识别所述三元调控网络中的FFLs,获得FFLs识别结果;所述FFLs是miRNA和TF共同调控靶基因的形式,包括TF-FFLs、miRNA-FFLs和复合FFLs三种类型;所述TF-FFLs中,TF是主要调控者;所述miRNA-FFLs中,miRNA是主要调控者;所述复合FFLs中,miRNA和TF相互调节,所述复合FFLs由所述TF-FFLs和miRNA-FFLs结合形成;利用网络模体挖掘算法在三元调控网络中识别FFLs,获得FFLs识别结果;

筛选模块,用于根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络;根据FFLs识别结果和癌症基因组表达量信息,利用统计检验、网络推理算法或基因富集分析得到miRNA和TF对癌症基因组靶基因的共调关系,并根据共调关系建立癌症特异的miRNA-TF共调网络。

6.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至4任一项所述的方法的步骤。

7.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至4任一所述方法。

说明书 :

癌症特异的共调网络建立方法及装置

技术领域

[0001] 本发明涉及癌症调控网络建立领域,尤其是涉及一种癌症特异的共调网络建立方法及装置。

背景技术

[0002] 转录因子(TF)和microRNAs(miRNA)是基因表达调控中具有重要作用的调控因子。越来越多的证据表明,TF和miRNA能够协同工作,它们的失调与包括癌症在内的许多疾病有关。而现有的对miRNA-TF共调控关系的研究缺乏对疾病(如癌症)的具体分析,且缺乏与基因表达数据的结合,miRNA-TF共调控关系结论的准确性还有待提高。

发明内容

[0003] 有鉴于此,本发明的目的在于提供一种癌症特异的共调网络建立方法及装置,建立了TF,miRNA和靶基因的三元调控网络,并结合基因表达信息,获得miRNA-TF共调网络,提高了miRNA-TF共调控关系的准确性。
[0004] 第一方面,本发明提供了一种癌症特异的共调网络建立方法,包括:
[0005] 根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息;
[0006] 根据TF调控信息和miRNA调控信息建立三元调控网络;
[0007] 识别所述三元调控网络中的FFLs,获得FFLs识别结果;
[0008] 根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络。
[0009] 结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述TF调控信息包括TF-miRNA调控信息和TF-mRNA调控信息。
[0010] 结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述miRNA调控信息包括miRNA-TF调控信息和miRNA-mRNA调控信息。
[0011] 结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述FFLs是miRNA和TF共同调控靶基因的形式,包括TF-FFLs、miRNA-FFLs和复合FFLs三种类型;
[0012] 所述TF-FFLs中,TF是主要调控者;
[0013] 所述miRNA-FFLs中,miRNA是主要调控者;
[0014] 所述复合FFLs中,miRNA和TF相互调节,所述复合FFLs由所述TF-FFLs和miRNA-FFLs结合形成。
[0015] 结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述识别所述三元调控网络中的FFLs,获得FFLs识别结果,具体包括:
[0016] 根据网络模体挖掘算法在所述三元调控网络中识别FFLs,获得FFLs识别结果。
[0017] 结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述癌症基因组表达信息包括mRNA表达量信息和miRNA表达量信息。
[0018] 结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络,具体包括:
[0019] 根据FFLs识别结果和癌症基因组表达量信息,利用统计检验、网络推理算法或基因富集分析得到miRNA和TF对癌症基因组靶基因的共调关系,并根据所述共调关系建立癌症特异的miRNA-TF共调网络。
[0020] 第二方面,本发明实施例提供了一种癌症特异的共调网络建立装置,包括:
[0021] 获得模块,用于根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息;
[0022] 建立模块,用于用户根据TF调控信息和miRNA调控信息建立三元调控网络;
[0023] 识别模块,用于识别所述三元调控网络中的FFLs,获得FFLs识别结果;
[0024] 筛选模块,用于根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络。
[0025] 第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如第一方面所述的方法的步骤。
[0026] 第四方面,本发明实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,其中,所述程序代码使所述处理器执行如第一方面所述的方法。
[0027] 本发明带来了以下有益效果:本发明提供的一种癌症特异的共调网络建立方法及装置。在该方法中,首先根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息;然后根据TF调控信息和miRNA调控信息建立三元调控网络;再识别所述三元调控网络中的FFLs,获得FFLs识别结果;最后根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络。该方法建立了TF,miRNA和靶基因的三元调控网络,并结合基因表达信息,获得miRNA-TF共调网络,提高了miRNA-TF共调控关系的准确性。
[0028] 本发明的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本发明的上述技术即可得知。
[0029] 为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施方式,并配合所附附图,作详细说明如下。

附图说明

[0030] 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031] 图1为本发明实施例一提供的一种癌症特异的共调网络建立方法流程图;
[0032] 图2为本发明实施例一提供的一种癌症特异的共调网络建立方法模型示意图;
[0033] 图3为本发明实施例二提供的一种癌症特异的共调网络建立装置结构图;
[0034] 图4为本发明实施例三提供的电子设备结构图。
[0035] 图标:31-获得模块;32-建立模块;33-识别模块;34-筛选模块;4-电子设备;41-处理器;42-存储器;43-通信接口;44-总线。

具体实施方式

[0036] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0037] 现有的对miRNA-TF共调控关系的研究缺乏对疾病(如癌症)的具体分析,且缺乏与基因表达数据的结合,miRNA-TF共调控关系结论的准确性还有待提高。基于此,本发明实施例提供的一种癌症特异的共调网络建立方法及装置,可以应用于癌症特异的共调网络建立。
[0038] 为便于对本实施例进行理解,首先对本发明实施例所公开的一种癌症特异的共调网络建立方法进行详细介绍。
[0039] 实施例一:
[0040] 本发明实施例提供了一种癌症特异的共调网络建立方法,如图1所示,该方法包括以下步骤:
[0041] S101:根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息。
[0042] 如图2所示,TF调控信息是从公开数据库(例如:TRRUST,TRED,HTRIdb)获得,TF调控信息包括TF-miRNA调控信息和TF-mRNA调控信息。
[0043] miRNA调控信息是从公开数据库(例如:miRTarBase,starBase,miRecords)获得,miRNA调控信息包括miRNA-TF调控信息和miRNA-mRNA调控信息。
[0044] S102:根据TF调控信息和miRNA调控信息建立三元调控网络。
[0045] 由TF调控信息和miRNA调控信息建立三元调控网络:
[0046] 将从公开数据库中获得的调控信息合并,由此获得由miRNA、TF、基因(Gene)组成的三元混合网络,该网络中包含TF-miRNA,TF-miRNA,miRNA-TF,miRNA-Gene这些调控关系。
[0047] S103:识别三元调控网络中的FFLs,获得FFLs识别结果。
[0048] 如图2所示,利用网络模体挖掘算法(也可以叫网络模体识别算法)在三元调控网络中识别FFLs,获得FFLs识别结果。
[0049] FFLs是miRNA和TF共同调控靶基因的形式,包括TF-FFLs、miRNA-FFLs和复合FFLs三种类型;TF-FFLs中,TF是主要调控者;miRNA-FFLs中,miRNA是主要调控者;复合FFLs中,miRNA和TF相互调节,复合FFLs由TF-FFLs和miRNA-FFLs结合形成。
[0050] S104:根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络。
[0051] 利用癌症数据库TCGA(The Cancer Genome Atlas)的表达数据获得更准确的miRNA-TF共调控信息。计算TFs、miRNA和基因之间表达量两两的Spearman相关系数,根据相关性计算相关系数ρ值并筛选FFLs。
[0052] 其中,以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数,即Spearman相关系数。经常用希腊字母ρ表示。它是衡量两个变量的依赖性的非参数指标。它利用单调方程评价两个统计变量的相关性。如果数据中没有重复值,并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或-1。
[0053] 如图2所示,根据FFLs识别结果和癌症基因组表达量信息,利用统计检验、网络推理算法或基因富集分析得到miRNA和TF对癌症基因组靶基因的共调关系,并根据共调关系建立癌症特异的miRNA-TF共调网络。
[0054] 癌症基因组表达信息包括mRNA表达量信息和miRNA表达量信息。
[0055] 上述方法构建的miRNA-TF共调控网络,可以结合具体疾病的基因表达对疾病进行分析,以便找到正确的疾病治疗方法。
[0056] 例如,THCA(甲状腺肿瘤)miRNA-TF共调节网络的构建和分析。THCA是一种常见的内分泌恶性肿瘤,在世界范围内发病率越来越高。利用本实施例提供的癌症特异的共调网络建立方法构建完整的miRNA-TF共调节网络,建立了由391个节点和520条边组成的THCA特异性miRNA-TF共调控网络,在FFLs中发现,识别到TF-FFLs 7对,miRNA-FFLs 2对,复合FFLs 2对。随后,利用网络拓扑分析,为共调控网络中的关键节点打分,得到五个重要基因(MELK,PIGR,SNX5,CLU,DAPK2)。
[0057] 对这些基因的综合文献研究证实了它们在癌症诊断和治疗中的作用。MELK已被报道为恶性肿瘤的潜在治疗靶点。PIGR有潜力成为候选预后生物标志物。肿瘤基因和表观遗传因子对CLU的调控对哺乳动物肿瘤发生具有重要影响。据报道,DAPK2的异常甲基化和沉默在甲状腺癌的发生和进展中起着关键作用。最后,SNX5表达的减少最近被证实与促进甲状腺肿瘤发生有关,SNX5表达研究可用于甲状腺癌的病理诊断。此外,对THCA特异性miRNA-TF共调控网络中的基因和TFs进行了功能富集分析。通过KEGG pathway富集分析,发现了11个显著的通路(如下表所示),均与癌症相关。
[0058]
[0059]
[0060] 本发明实施例提供了一种癌症特异的共调网络建立方法,建立了TF,miRNA和靶基因的三元调控网络,并结合基因表达信息,获得miRNA-TF共调网络,提高了miRNA-TF共调控关系的准确性。
[0061] 实施例二:
[0062] 本发明实施例提供的一种癌症特异的共调网络建立装置,如图3所示,包括:
[0063] 获得模块31,用于根据公开数据库获得TF和miRNA对靶基因的TF调控信息和miRNA调控信息。TF调控信息是从公开数据库(例如:TRRUST,TRED,HTRIdb)获得,TF调控信息包括TF-miRNA调控信息和TF-mRNA调控信息。miRNA调控信息是从公开数据库(例如:miRTarBase,starBase,miRecords)获得,miRNA调控信息包括miRNA-TF调控信息和miRNA-mRNA调控信息。
[0064] 建立模块32,用于用户根据TF调控信息和miRNA调控信息建立三元调控网络。将从公开数据库中获得的调控信息合并,由此获得由miRNA、TF、基因(Gene)组成的三元混合网络,该网络中包含TF-miRNA,TF-miRNA,miRNA-TF,miRNA-Gene这些调控关系。
[0065] 识别模块33,用于识别三元调控网络中的FFLs,获得FFLs识别结果。利用网络模体挖掘算法在三元调控网络中识别FFLs,获得FFLs识别结果。
[0066] 筛选模块34,用于根据FFLs识别结果和癌症基因组表达量信息,筛选得到癌症特异的miRNA-TF共调网络。利用癌症数据库TCGA(The Cancer Genome Atlas)的表达数据获得更准确的miRNA-TF共调控信息。计算TFs、miRNA和基因之间表达量两两的Spearman相关系数,根据相关性计算相关系数ρ值并筛选FFLs。
[0067] 根据FFLs识别结果和癌症基因组表达量信息,利用统计检验、网络推理算法或基因富集分析得到miRNA和TF对癌症基因组靶基因的共调关系,并根据共调关系建立癌症特异的miRNA-TF共调网络。
[0068] 本发明实施例提供的癌症特异的共调网络建立装置,与上述实施例一提供的癌症特异的共调网络建立方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
[0069] 实施例三:
[0070] 本发明实施例提供的一种电子设备,如图4所示,电子设备4包括处理器41、存储器42,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例一提供的方法的步骤。
[0071] 参见图4,电子设备还包括:总线44和通信接口43,处理器41、通信接口43和存储器42通过总线44连接。处理器41用于执行存储器42中存储的可执行模块,例如计算机程序。
[0072] 其中,存储器42可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
[0073] 总线44可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0074] 其中,存储器42用于存储程序,所述处理器41在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器41中,或者由处理器41实现。
[0075] 处理器41可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器41中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器41可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等。还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器42,处理器41读取存储器42中的信息,结合其硬件完成上述方法的步骤。
[0076] 实施例四:
[0077] 本发明实施例提供的一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述实施例一提供的方法。
[0078] 除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
[0079] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0080] 在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
[0081] 附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0082] 在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0083] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0084] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0085] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0086] 最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。