一种细胞特异性合成致死对预测方法、装置、设备和介质转让专利

申请号 : CN202310700493.9

文献号 : CN116453586B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 濮梦辰辛玉翠魏兰颖郑炜圣彭公信李晓荣成凯阳张应生

申请人 : 北京望石智慧科技有限公司

摘要 :

本发明公开了一种细胞特异性合成致死对预测方法、装置、设备和介质。该方法包括:对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征,该特定组学数据包含有多种能够表征细胞特异性的组学数据;将该特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果,该初步预测结果包含目标细胞系中各基因对为合成致死对的概率;基于初步预测结果筛选出目标细胞系中的特异性合成致死对。本发明能够实现合成致死对预测的高可靠性。

权利要求 :

1.一种细胞特异性合成致死对预测方法,其特征在于,所述方法包括:对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征;

其中,所述特定组学数据包含有多种能够表征细胞特异性的组学数据;所述目标细胞系指要对其进行细胞特异性合成致死对预测的细胞系;所述特异性融合特征用于特异性合成致死对预测,其中,所述特异性合成致死对是指仅在目标细胞系中是合成致死对,而在其他细胞系中不是合成致死对;将所述特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果;所述初步预测结果包含所述目标细胞系中各基因对为合成致死对的概率;

基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对,对目标细胞系的特异性合成致死对中的一个基因或一对基因进行基因干扰,使目标细胞系失活,而不影响其他细胞系;

所述预处理,包括:

将所述特定组学数据包含的多个组学数据分别转换为对应的图结构数据;

将每个所述组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量;

基于多头注意力机制将多个所述组学数据对应的特征向量进行融合处理,获得特异性融合特征;

在对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征之前,还包括:获取多个预设细胞系的合成致死对标签数据;

基于多个所述预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得所述合成致死对预测模型;

所述基于多个所述预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得所述合成致死对预测模型的步骤,包括:针对每个预设细胞系,将所述预设细胞系的特定组学数据包含的多个组学数据分别转换为对应的图结构数据;

将预设细胞系的组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量;

基于多头注意力机制将多个所述组学数据对应的特征向量进行融合处理,获得多个所述预设细胞系的特异性融合特征;

针对每一个所述预设细胞系的特异性融合特征,将所述特异性融合特征与对应的所述合成致死对标签数据进行拼接处理,以生成训练特征集;

从所述训练特征集中选择训练特征输入全连接神经网络,获得训练输出结果;

确定所述训练输出结果的损失函数;所述训练输出结果包括所述预设细胞系中各基因对为合成致死对的概率;

所述基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对的步骤,包括:根据所述初步预测结果确定候选合成致死对集合;

针对候选合成致死对集合中的每一个候选合成致死对,获取所述候选合成致死对扰动后在多个细胞系中的显著影响基因集;所述多个细胞系包含所述目标细胞系;

对每个细胞系中的所述显著影响基因集进行基因富集分析,生成基因富集结果;

基于所述基因富集结果判断所述候选合成致死对是否为所述目标细胞系中的特异性合成致死对。

2.根据权利要求1所述的方法,其特征在于,还包括:

在初次确定所述损失函数的情况下,或者在本次确定的损失函数比上一次确定的损失函数小的情况下,基于当前确定的损失函数进行反向传播以更新模型参数,并返回所述将预设细胞系的组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量的步骤;所述模型参数包括所述图卷积神经网络的参数和所述全连接神经网络的参数;

在当前确定的所述损失函数大于或等于上一次确定的损失函数的情况下,选择输出结果的损失函数最小时的全连接神经网络作为所述合成致死对预测模型。

3.根据权利要求1所述的方法,其特征在于,在所述基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对之后,还包括:在筛选出所述目标细胞系中的特异性合成致死对的情况下,根据与所述目标细胞系和所述特异性合成致死对相关的所述基因富集结果,对所述特异性合成致死对进行机理追踪处理。

4.根据权利要求1所述的方法,其特征在于,所述特定组学数据包括旁系同源基因数据、互斥突变基因数据、基因表达数据、基因效应得分数据和基因扰动特征数据中的一种或多种。

5.一种细胞特异性合成致死对预测装置,其特征在于,所述装置包括:预处理单元,对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征;其中,所述特定组学数据包含有多种能够表征细胞特异性的组学数据;所述目标细胞系指要对其进行细胞特异性合成致死对预测的细胞系;所述特异性融合特征用于特异性合成致死对预测,其中,所述特异性合成致死对是指仅在目标细胞系中是合成致死对,而在其他细胞系中不是合成致死对;

预测单元,将所述特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果;所述初步预测结果包含所述目标细胞系中各基因对为合成致死对的概率;

分析单元,用于基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对,对目标细胞系的特异性合成致死对中的一个基因或一对基因进行基因干扰,使目标细胞系失活,而不影响其他细胞系;

所述预处理,包括:

将所述特定组学数据包含的多个组学数据分别转换为对应的图结构数据;

将每个所述组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量;

基于多头注意力机制将多个所述组学数据对应的特征向量进行融合处理,获得特异性融合特征;

在对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征之前,还包括:获取多个预设细胞系的合成致死对标签数据;

基于多个所述预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得所述合成致死对预测模型;

所述基于多个所述预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得所述合成致死对预测模型的步骤,包括:针对每个预设细胞系,将所述预设细胞系的特定组学数据包含的多个组学数据分别转换为对应的图结构数据;

将预设细胞系的组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量;

基于多头注意力机制将多个所述组学数据对应的特征向量进行融合处理,获得多个所述预设细胞系的特异性融合特征;

针对每一个所述预设细胞系的特异性融合特征,将所述特异性融合特征与对应的所述合成致死对标签数据进行拼接处理,以生成训练特征集;

从所述训练特征集中选择训练特征输入全连接神经网络,获得训练输出结果;

确定所述训练输出结果的损失函数;所述训练输出结果包括所述预设细胞系中各基因对为合成致死对的概率;

所述基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对的步骤,包括:根据所述初步预测结果确定候选合成致死对集合;

针对候选合成致死对集合中的每一个候选合成致死对,获取所述候选合成致死对扰动后在多个细胞系中的显著影响基因集;所述多个细胞系包含所述目标细胞系;

对每个细胞系中的所述显著影响基因集进行基因富集分析,生成基因富集结果;

基于所述基因富集结果判断所述候选合成致死对是否为所述目标细胞系中的特异性合成致死对。

6.一种计算机设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1‑4任一项所述的细胞特异性合成致死对预测方法的步骤。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑4任一项所述的细胞特异性合成致死对预测方法的步骤。

说明书 :

一种细胞特异性合成致死对预测方法、装置、设备和介质

技术领域

[0001] 本发明涉及人工智能技术领域,具体涉及一种细胞特异性合成致死对预测方法、预测装置、计算机设备和计算机可读存储介质。

背景技术

[0002] 精准医疗的靶点主要集中在癌症中反复发生的肿瘤驱动基因上,然而由于一些靶点自身结构不可成药和一些肿瘤驱动基因为抑癌基因不能直接靶向,使得肿瘤治疗受到限制。基因遗传中的合成致死(Synthetic lethality,SL)理念将肿瘤单基因依赖性拓展到“基因对”,即将肿瘤特异性靶点由少量的肿瘤特异性基因拓展至额外的脆弱性基因,为精准医疗提供了探索空间。
[0003] 相关技术中,合成致死对的发现是通过遗传筛选完成的,但该筛选过程昂贵、费力且耗时。近几年出现了使用机器学习模型预测合成致死对的趋势。然而,这些预测模型往往采用混合数据作为输入,即不论是哪个细胞系的合成致死对均笼统的收入数据库,同时用于合成致死对预测的训练和测试,完全忽视了细胞的背景特异性问题,该背景特异性问题是指同一个合成致死对在一个细胞系起作用,但在另一个细胞系完全没有效果,导致现有预测过程可靠性差,预测出的合成致死对可用性低。

发明内容

[0004] 有鉴于此,本发明实施例提供了一种细胞特异性合成致死对预测方法、预测装置、计算机设备和计算机可读存储介质,以解决现有合成致死对预测过程中未考虑细胞特异性而导致的预测过程可靠性差的问题。
[0005] 根据第一方面,本发明实施例提供了一种细胞特异性合成致死对预测方法,该方法包括:对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征;其中,所述特定组学数据包含有多种能够表征细胞特异性的组学数据;将所述特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果;所述初步预测结果包含所述目标细胞系中各基因对为合成致死对的概率;基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对。
[0006] 在一些实施例中,所述预处理,包括:将所述特定组学数据包含的多个组学数据分别转换为对应的图结构数据;将每个所述组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量;基于多头注意力机制将多个所述组学数据对应的特征向量进行融合处理,获得特异性融合特征。
[0007] 在一些实施例中,在对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征之前,还包括:获取多个预设细胞系的合成致死对标签数据;基于多个所述预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得所述合成致死对预测模型。
[0008] 在一些实施例中,所述基于多个所述预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得所述合成致死对预测模型的步骤,包括:针对每个预设细胞系,将所述预设细胞系的特定组学数据包含的多个组学数据分别转换为对应的图结构数据;将预设细胞系的组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量;基于多头注意力机制将多个所述组学数据对应的特征向量进行融合处理,获得多个所述预设细胞系的特异性融合特征;针对每一个所述预设细胞系的特异性融合特征,将所述特异性融合特征与对应的所述合成致死对标签数据进行拼接处理,以生成训练特征集;从所述训练特征集中选择训练特征输入全连接神经网络,获得训练输出结果;确定所述训练输出结果的损失函数;所述训练输出结果包括所述预设细胞系中各基因对为合成致死对的概率;在初次确定所述损失函数的情况下,或者在本次确定的损失函数比上一次确定的损失函数小的情况下,基于当前确定的损失函数进行反向传播以更新模型参数,并返回所述将预设细胞系的组学数据对应的所述图结构数据分别输入预定层的图卷积神经网络,以获得每个所述组学数据对应的特征向量的步骤;所述模型参数包括所述图卷积神经网络的参数和所述全连接神经网络的参数;在当前确定的所述损失函数大于或等于上一次确定的损失函数的情况下,选择输出结果的损失函数最小时的全连接神经网络作为所述合成致死对预测模型。
[0009] 在一些实施例中,所述基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对的步骤,包括:根据所述初步预测结果确定候选合成致死对集合;针对候选合成致死对集合中的每一个候选合成致死对,获取所述候选合成致死对扰动后在多个细胞系中的显著影响基因集;所述多个细胞系包含所述目标细胞系;对每个细胞系中的所述显著影响基因集进行基因富集分析,生成基因富集结果;基于所述基因富集结果判断所述候选合成致死对是否为所述目标细胞系中的特异性合成致死对。
[0010] 在一些实施例中,所述在基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对之后,还包括:在筛选出所述目标细胞系中的特异性合成致死对的情况下,根据与所述目标细胞系和所述特异性合成致死对相关的所述基因富集结果,对所述特异性合成致死对进行机理追踪处理。
[0011] 在一些实施例中,所述特定组学数据包括旁系同源基因数据、互斥突变基因数据、基因表达数据、基因效应得分数据和基因扰动特征数据中的一种或多种。
[0012] 根据第二方面,本发明实施例提供了一种细胞特异性合成致死对预测装置,该装置包括:预处理单元,对目标细胞系的特定组学数据进行预处理,获得所述目标细胞系的特异性融合特征;其中,所述特定组学数据包含有多种能够表征细胞特异性的组学数据;预测单元,将所述特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果;所述初步预测结果包含所述目标细胞系中各基因对为合成致死对的概率;分析单元,用于基于所述初步预测结果筛选出所述目标细胞系中的特异性合成致死对。
[0013] 根据第三方面,本发明实施例提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如本发明第一方面中任一项所述的细胞特异性合成致死对预测方法的步骤。
[0014] 根据第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如本发明第一方面中任一项所述的细胞特异性合成致死对预测方法的步骤。
[0015] 本发明技术方案,具有如下优点。
[0016] 本发明提供一种细胞特异性合成致死对预测方法、装置、设备和介质,首先对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征,其中,特定组学数据包含有多种能够表征细胞特异性的组学数据;然后将该特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果,该初步预测结果包含目标细胞系中各基因对为合成致死对的概率;最后基于初步预测结果筛选出目标细胞系中的特异性合成致死对,由于该特异性合成致死对能够只引发该目标细胞系的目标响应,因此本发明能够实现合成致死对预测的高可靠性。

附图说明

[0017] 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018] 图1为本发明实施例提供的一种细胞特异性合成致死对预测方法的流程图。
[0019] 图2为本发明实施例提供的一种对特定组学数据进行预处理的方法的流程图。
[0020] 图3为发明实施例提供的另一种细胞特异性合成致死对预测方法的流程图。
[0021] 图4为本发明实施例提供的一种合成致死对预测模型训练方法的流程图。
[0022] 图5为本发明实施例提供的一种筛选出目标细胞中特异性合成致死对的方法的流程图。
[0023] 图6为本发明实施例提供的一种细胞特异性合成致死对预测装置的结构示意图。
[0024] 图7为本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

[0025] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0026] 肿瘤治疗不断朝向精准医疗发展,效果显著且副作用小的药物是科研工作者们长期追求的目标。精准医疗的靶点主要集中在癌症中反复发生的肿瘤驱动基因上,然而由于一些靶点自身结构不可成药和一些肿瘤驱动基因为抑癌基因不能直接靶向,都大大限制了肿瘤精准医疗的发展。而基因遗传中的合成致死理念将肿瘤单基因依赖性拓展到“基因对”,即将肿瘤特异性靶点由少量的肿瘤特异性基因拓展至额外的脆弱性基因。
[0027] 合成致死理念为,当肿瘤的某个功能基因发生突变,导致其生存更依赖于与该突变基因行使补偿作用的其它基因(即为合成致死对另一成员)为其提供功能补偿。如果再使用药物抑制合成致死对另一成员,细胞内对应功能就彻底缺失,导致肿瘤不能继续生存。而非肿瘤细胞中由于不存在对应的功能基因突变,因此依然可以正常行使基因功能,即使药物也同样抑制了合成致死基因,细胞依然可以继续生存。识别合成致死基因对是一项复杂且具有挑战性的任务。
[0028] 相关技术中,合成致死目标的发现是通过遗传筛选完成的,这涉及系统地敲除基因并观察由此产生的表型,然而这些筛选昂贵、费力且耗时,而且它们一次只能测试有限数量的基因。近几年出现了使用机器学习模型预测合成致死对的趋势。然而,这些预测模型往往采用混合数据作为输入,即不论是哪个细胞系的合成致死对均笼统的收入数据库,同时用于合成致死对预测的训练和测试,完全忽视了细胞的背景特异性问题,该背景特异性问题是指同一个合成致死对在一个细胞系起作用,但在另一个细胞系完全没有效果,导致现有预测过程可靠性差,预测出的合成致死对可用性低。
[0029] 图1为本发明实施例提供的一种细胞特异性合成致死对预测方法的流程图。如图1所示,该细胞特异性合成致死对预测方法包括下述步骤:步骤S1‑步骤S3。
[0030] 步骤S1、对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征。
[0031] 其中,细胞系可泛指一般可能传代的细胞。目标细胞系是指要对其进行细胞特异性合成致死对预测的细胞系。
[0032] 合成致死对是指具有合成致死效应的一对基因,即该两个基因同时失活将导致细胞死亡,而单独一个基因失活并不影响细胞的活力。特异性合成致死对是指该合成致死对仅在某一个细胞系中是合成致死对,而在其他细胞系中不是合成致死对。
[0033] 组学数据就是在研究生物医学等领域中特定对象他们各自以及它们之间的关系而形成的数据,例如,组学数据主要包括基因组学,蛋白组学,代谢组学,转录组学,脂类组学,免疫组学和糖组学等。
[0034] 本实施例中,特定组学数据包含有多种能够表征细胞特异性的组学数据。需要说明的是,该特定组学数据既可以同时包含表征细胞特异性的组学数据和不表征细胞特异性的组学数,也可以仅包含表征细胞特异性的组学数据。
[0035] 在一个实施方式中,该特定组学数据包括旁系同源(Paralogs)基因数据、互斥突变基因(mutually exclusive genes)数据、基因表达数据、基因效应得分数据和基因扰动特征数据中的一种或多种。
[0036] 其中,旁系同源基因数据是用来描述在同一物种内由于基因复制而在复制后发生分歧的同源基因。
[0037] 互斥突变基因数据是指同一信号通路通常不会同时发生突变的基因。在一些实施例中,该互斥突变基因数据可以从综合分析癌症基因和临床资料(cBio Cancer Genomics Portal,cBioPortal)数据库中获取。
[0038] 基因表达数据是与基因的遗传信息合成功能性基因产物的过程相关的数据。该基因表达数据可以从肿瘤细胞系综合性分析数据库(Dependency Map Portal,DepMap)中的基因表达谱获得,该基因表达谱包含基因表达值等信息。在本实施例中,该基因表达数据一般为低表达基因数据,具体地,定义细胞系中基因表达值小于1且该基因表达的标准分数小于1.28的基因为低表达基因。
[0039] 基因效应得分数据(也可以称为基因依赖性数据)用于表征两个基因的关系,本实施例中,该基因效应得分一般为低效应得分。在一些实施例中,基因效应得分可以从肿瘤细胞系综合性分析数据库获得,其中,基因效应得分反应了敲除细胞系中特定基因后对细胞系影响,基因效应得为则负分数表示基因敲除后细胞生长抑制和/或死亡。基于该DepMap中的基因效应得分数据,能够获得细胞系中的低效应得分数据,其中,可以定义基因效应得分低于‑0.5且该基因效应的标准分数小于1.28的基因为低效应得分基因。
[0040] 基因扰动特征数据是用来描述细胞系内遗传扰动引起的转录变化的数据。在一些实施例中,该基因扰动特征数据例如基因扰动相似性度量数据库(Genetic Perturbation Similarity Analysis,GPSA)、L1000基因扰动特征数据等。本实施例中基因扰动特征数据优选L1000基因扰动特征数据,该L1000基因扰动特征数据是一个庞大的高通量数据集,包含特定细胞系内遗传扰动引起的转录变化,即同一细胞内每一个基因扰动后其它基因的表达量变化,可以为细胞背景特异性(context specificity)的动态变化提供充足的参考。例如,可以将选择L1000的5级数据作为原始分析数据集,将该数据转换为12328行和238351列的矩阵,其中每行代表一个基因,每列代表该基因在各种细胞系下与对照组相比在扰动后的归一化表达倍数变化值。
[0041] 在对目标细胞系的特定组学数据进行预处理的步骤中,该预处理是指为了从特性组学数据中提取能够用于特异性合成致死对预测而进行的处理操作。
[0042] 特异性融合特征是指对特定组学数据进行预处理后获得的特征,用于特异性合成致死对预测。由于特定组学数据包含有多种能够表征细胞特异性的组学数据,因此,基于特定组学数据获得的该特异性融合特征也可以表征细胞特异性。
[0043] 本实施例中,对目标细胞系的特定组学数据进行预处理,可以从多种能够表征目标细胞系中细胞特异性的组学数据里提取有效内容,获得目标细胞系的特异性融合特征,为后续目标细胞系中的特异性合成致死对的预测提供了数据基础。
[0044] 步骤S2、将特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果。
[0045] 其中,合成致死对预测模型是预先训练好的用于预测合成致死对的模型。输出的初步预测结果包含目标细胞系中各基因对为合成致死对的概率。
[0046] 需要说明的是,本实施例中所用到的合成致死对预测模型与相关技术中的通用预测模型不同,该合成致死对预测模型的输入特征引入了可以表征目标细胞系中细胞特异性的特异性融合特征,有助于预测出目标细胞系的特异性合成致死对,即本实施例中用到的合成致死对预测模型针对不同的细胞系给出的初步预测结果是不同的。而通用预测模型的输入大多不考虑细胞特异性,其针对不同的细胞系预测出的合成致死对是相同的,无法对细胞系的特异性合成致死对进行预测,因此,对通用预测模型预测出的合成致死对中的一个基因或一对基因进行基因干扰,可能不仅没有使需要失活的细胞系失活,反而使其他多个不需要失活的细胞系失活。
[0047] 步骤S3、基于初步预测结果筛选出目标细胞系中的特异性合成致死对。
[0048] 其中,目标细胞系中的特异性合成致死对是指仅在目标细胞系中是合成致死对,而在其他细胞系中不是合成致死对。
[0049] 在实际应用中,在目标细胞系为癌细胞的情况下,对目标细胞系的特异性合成致死对中的一个基因或一对基因进行基因干扰(扰动),可以使目标细胞系失活,而不影响其他细胞系,即本发明实施例中预测出的特异性合成致死对能够只引发该目标细胞系的目标响应,而不会引发其他细胞系的响应,能够实现合成致死对预测的高可靠性。
[0050] 本发明实施例提供的细胞特异性合成致死对预测方法中,首先对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征,其中,特定组学数据包含有多种能够表征细胞特异性的组学数据;然后将该特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果,该初步预测结果包含目标细胞系中各基因对为合成致死对的概率;最后基于初步预测结果筛选出目标细胞系中的特异性合成致死对,由于该特异性合成致死对能够只引发该目标细胞系的目标响应,因此本发明能够实现合成致死对预测的高可靠性。
[0051] 图2为本发明实施例提供的一种对特定组学数据进行预处理的方法的流程图。如图2所示,对特定组学数据进行预处理的步骤,包括:步骤S11‑步骤S13。
[0052] 步骤S11、将特定组学数据包含的多个组学数据分别转换为对应的图结构数据。
[0053] 其中,多个组学数据包括但不限于旁系同源基因数据、互斥突变基因数据、基因表达数据、基因效应得分数据和基因扰动特征数据。
[0054] 在一个实施方式中,针对基因表达数据和基因效应得分数据,上述将该多个组学数据分别转换为对应的图结构数据的步骤,包括:基于基因表达数据和基因效应得分数据确定各基因对之间的基因依赖关系,将该依赖关系转换为对应的图结构数据,其中,该基因依赖关系用于表征一个基因低表达以后,细胞对另一个基因是否表现出高度依赖。
[0055] 本实施例中,将多个组学数据分别转换为图结构数据之后,该图结构数据的节点代表细胞系中的基因,边代表基因之间存在的关系。两个基因之间存在关系的则将其作为邻接矩阵的1,即将边的权重设置为1。针对基因扰动特征数据,转换后的图结构数据中,以该基因扰动特征数据中具体的数值作为相应的边的权重。
[0056] 本实施例中,将多个组学数据分别转换为对应的图结构数据,能够直接、自然表达基因之间的关系,易于后续数据处理、分析和建模的过程。
[0057] 步骤S12、将每个组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量。
[0058] 其中,预定层可以根据实际需求进行设置,例如,2层或者4层。
[0059] 在一些实施例中,该预定层可以设置为2层,因为两跳邻域覆盖了大多数连接信息,通常足以进行图结构数据学习。
[0060] 在一个实施方式中,为了避免过度拟合,可以在每个卷积层后添加一个丢弃(dropout)函数,其概率设置为0.5。
[0061] 本实施例中,将每个组学数据对应的图结构数据分别输入预定层的图卷积神经网络,可以显著降低数据冗余,分别从该组学数据中有效提取出表征该组学数据的特征向量。
[0062] 步骤S13、基于多头注意力机制将多个组学数据对应的特征向量进行融合处理,获得特异性融合特征。
[0063] 其中,多头注意力机制(Multi‑head‑attention)能够从多个维度提炼特征信息,因此,基于多头注意力机制将多个组学数据对应的特征向量进行融合处理后获得的特异性融合特征,能够在多个组学数据对应的维度上表征细胞系中基因的特征,并且,至少一个维度上的特征是具有细胞特异性的特征。
[0064] 本发明实施例中,对特定组学数据进行预处理,能够有效提炼出表征细胞系中基因的特征信息,为进行模型训练、数据分析等过程提供了数据支持。
[0065] 图3为发明实施例提供的另一种细胞特异性合成致死对预测方法的流程图。如图3所示,在对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征之前,还包括:步骤S01‑步骤S02。
[0066] 步骤S01、获取多个预设细胞系的合成致死对标签数据。
[0067] 其中,预设细胞系是用于进行合成致死对预测模型训练的细胞系,该预设细胞系所中的合成致死对已知。合成致死对标签数据用于表征预设细胞系中哪些基因对是合成致死对。
[0068] 在一个实施方式中,获取多个预设细胞系的合成致死对标签数据的方法包括:针对多个预设细胞系中的每个预设细胞系,根据该预设细胞系中的基因对标签构建合成致死网络图,将该合成致死网络图输入预定层的图卷积神经网络,以使模型获得该预设细胞系的合成致死对标签数据。
[0069] 其中,基因对标签用于标识该基因对是否为合成致死对。合成致死网络图的节点代表基因,边代表合成致死关系,用边相连的两个节点代表该两个节点对应的基因为一对合成致死对,没有用边相连的节点代表该两个节点对应的基因不是合成致死对。预定层的图卷积神经网络可参见前述实施例中的描述,此处不再赘述。
[0070] 本实施例中,通过获取多个预设细胞系的合成致死对标签数据能够为训练合成致死对预测模型提供训练样本。
[0071] 步骤S02、基于多个预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得合成致死对预测模型。
[0072] 本实施例中,预先训练出合成致死对预测模型,以便于对细胞系中的特异性合成致死对进行预测。
[0073] 需要说明的是,该合成致死对预测模型的训练方法的详细描述可参见下述实施例。
[0074] 图4为本发明实施例提供的一种合成致死对预测模型训练方法的流程图。如图4所示,基于多个预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得合成致死对预测模型的步骤(步骤S02),包括:步骤S02a‑步骤S02i。
[0075] 步骤S02a、针对每个预设细胞系,将预设细胞系的特定组学数据包含的多个组学数据分别转换为对应的图结构数据。
[0076] 步骤S02b、将预设细胞系的组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量。
[0077] 步骤S02c、基于多头注意力机制将多个组学数据对应的特征向量进行融合处理,获得多个预设细胞系的特异性融合特征。其中,该特定组学数据包含有多种能够表征细胞特异性的组学数据。关于步骤S02a‑步骤S02c的详细说明,可参见前述图2提供的实施例,此处不再赘述。
[0078] 步骤S02d、针对每一个预设细胞系的特异性融合特征,将特异性融合特征与对应的合成致死对标签数据进行拼接处理,以生成训练特征集。
[0079] 其中,训练特征集中包含多个训练特征,该训练特征是一个预设细胞系的特异性融合特征与对应的合成致死对标签数据拼接形成的特征。
[0080] 在一些实施例中,可以通过多层感知器(Multi‑Layer Perceptron,MLP)将特异性融合特征与对应的合成致死对标签数据进行拼接处理。
[0081] 步骤S02e、从训练特征集中选择训练特征输入全连接神经网络,获得训练输出结果。
[0082] 其中,训练输出结果包括预设细胞系中各基因对为合成致死对的概率。
[0083] 在一个实施方式中,该全连接神经网络以训练特征作为输入,并具有多个隐藏层,利用线性整流函数(Rectified Linear Unit,ReLU)作为激活函数,输出层包含具有S型激活函数的单个节点,该节点输出指示预设细胞系中各基因对为合成致死对的概率。
[0084] 步骤S02f、确定训练输出结果的损失函数。
[0085] 其中,损失函数(loss function)是用来估量模型的输出结果与真实情况的不一致程度,它是一个非负实值函数,损失函数越小,模型的鲁棒性越好。该损失函数例如均方差损失、平均绝对误差损失、分位数损失、交叉熵损失函数、Hinge 损失。
[0086] 在一些实施例中,该损失函数可以优选为二元交叉损失熵(Binary CrossEntropy Loss,BCE loss)。
[0087] 步骤S02g、确定是否是初次确定该损失函数,在初次确定该损失函数的情况下,基于当前确定的损失函数进行反向传播以更新模型参数,并返回将预设细胞系的组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量的步骤(步骤S02b)。
[0088] 其中,模型参数包括图卷积神经网络的参数和全连接神经网络的参数。模型参数是决定模型性能的关键,基于当前确定的损失函数更新图卷积神经网络和全连接神经网络的模型参数,能够优化该图卷积神经网络和全连接神经网络模型,缩小训练输出结果与实际情况之间的差距。
[0089] 需要说明的是,在初次确定该损失函数的情况下,说明合成致死对预测模型的训练才刚刚开始,为了提高预测性能,根据损失函数更新图卷积神经网络和全连接神经网络的模型参数。而更新图卷积神经网络和全连接神经网络的模型参数之后,不确定更新参数后的模型的性能是否还有优化空间(损失函数是否会降低),因此需要继续进行训练,以实现模型参数的最优化。
[0090] 步骤S02h、在不是初次确定该损失函数的情况下,则确定本次确定的损失函数是否比上一次确定的损失函数小,在本次确定的损失函数比上一次确定的损失函数小的情况下,将预设细胞系的组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量的步骤(步骤S02b)。
[0091] 其中,在本次确定的损失函数比上一次确定的损失函数小的情况下,说明本次的训练输出结果与真实结果之间的差距比于上一次的训练输出结果与真实结果之间的差距小,即上一次的模型参数更新后使得模型性能更好。为了继续提高模型的预测性能,根据本次确定的损失函数继续更新图卷积神经网络和全连接神经网络的模型参数,更新图卷积神经网络和全连接神经网络的模型参数之后,不确定更新参数后的模型的性能是否得到提高以及是否还有优化空间(损失函数是否会继续降低),因此需要继续进行训练,以实现模型参数的最优化。
[0092] 步骤S02i、在当前确定的损失函数大于或等于上一次确定的损失函数的情况下,选择输出结果的损失函数最小时的全连接神经网络作为合成致死对预测模型。
[0093] 其中,在当前确定的损失函数大于或等于上一次确定的损失函数的情况下,说明本次的训练输出结果与真实结果之间的差距比于上一次的训练输出结果与真实结果之间的差距大,即上一次的模型参数更新后并没有使得模型性能更好,反而变差了。此时模型不存在继续优化的空间,即使继续对模型进行训练也不会提高模型的预测性能,因此,选择输出结果的损失函数最小时的全连接神经网络作为合成致死对预测模型,该合成致死对预测模型即为模型参数最优化的模型。
[0094] 在一个实施方式中,在训练出合成致死对预测模型之后,还可以对该合成致死对预测模型进行评价。
[0095] 该评价的步骤,包括:从训练特征集中选取部分未参与模型训练的训练特征作为验证集,选取将验证集中的训练特征输入合成致死对预测模型,输出验证预测结果,该验证预测结果包含该训练特征对应的预设细胞系中各基因对为合成致死对的概率。基于该概率由大到小选择排序在预定序号之前的基因对作为候选评价集,确定该候选评价集中预测出的真实合成致死对的数量和特异性合成致死对的数量,基于该真实合成致死对的数量和特异性合成致死对的数量对合成致死对预测模型的预测性能进行评价。
[0096] 其中,真实合成致死对的数量是指该候选评价集中包括的普通合成致死对和特异性合成致死对的总数,普通合成致死对是指该基因对是该预设细胞系中的合成致死对,也是其他预设细胞系中的合成致死对。
[0097] 本实施例提供一种合成致死对预测模型的训练方法,在模型训练过程中引入了可以表征预设细胞系中细胞特异性的特异性融合特征,有助于训练出能够预测细胞系中细胞特异性合成致死对的预测模型,即该初步预测结果中既预测了普通合成致死对,也预测了细胞特异性合成致死对,有助于提高合成致死对预测的可靠性。
[0098] 需要说明的是,通用预测模型的输入大多不考虑细胞特异性,因此不确定预测出的合成对在哪个细胞系中起作用。尽管通用性模型预测出了很多合成致死靶点,但相关技术人员并不能通过预测结果了解靶点的真实应用性。本发明实施例提供的合成致死对预测模型相比于通用模型而言,其中强调的细胞系特异性合成致死关系预测具有更强的可应用性,有利于开发出更有针对性和个性化的疗法。此外,肿瘤组织存在异质性,要想彻底治愈肿瘤,无疑需要逐个细胞攻克,而此时细胞系特异性的合成致死关系预测和细胞间的迁移性就显得尤为重要。
[0099] 另外,由于输出的初步预测结果中既预测了普通合成致死对,也预测了细胞特异性合成致死对,因此,需要筛选出目标细胞中特异性合成致死对,实现合成致死对预测的高可靠性。
[0100] 图5为本发明实施例提供的一种筛选出目标细胞中特异性合成致死对的方法的流程图。如图5所示,该基于初步预测结果筛选出目标细胞系中的特异性合成致死对的步骤(步骤S3),包括:步骤S31‑步骤S34。
[0101] 步骤S31、根据初步预测结果确定候选合成致死对集合。
[0102] 其中,初步预测结果包含目标细胞系中各基因对为合成致死对的概率。
[0103] 在一个实施方式中,根据初步预测结果确定候选合成致死对集合的方法包括:根据初步预测结果中包含的概率由大到小对目标细胞系中各基因对进行排序,选取排序在预定序号之前的基因对作为候选合成致死对,以构成候选合成致死对集合。其中,预定序号可以根据实际应用情况进行设定,例如,设定为100,即选取排序在前100的基因对构成合成致死对集合。
[0104] 在另一个实施方式中,根据初步预测结果确定候选合成致死对集合的方法包括:根据初步预测结果中包含的概率由大到小对目标细胞系中各基因对进行排序,选取排序在预定序号之前的基因对,根据先验信息将排序在预定序号之前的基因对中的普通合成致死对去除,剩下的基因对作为候选合成致死对,以构成候选合成致死对集合。
[0105] 其中,先验信息包含已知的普通合成致死对,该普通合成致死对是指既在该目标细胞系中是合成致死对,也在其他细胞系中是合成致死对。
[0106] 本实施例中,根据初步预测结果确定候选合成致死对集合可以缩小筛选细胞特异性合成致死对的范围,提高筛选效率。
[0107] 步骤S32、针对候选合成致死对集合中的每一个候选合成致死对,获取候选合成致死对扰动后在多个细胞系中的显著影响基因集。
[0108] 其中,多个细胞系包含目标细胞系。
[0109] 需要说明的是,由于同一候选合成致死对扰动后在不同细胞系内显著影响的基因集各异,故根据该结果可以进行细胞系之间的特异性分析。
[0110] 在一个实施方式中,可以基于L1000基因扰动数据获取候选合成致死对扰动后在多个细胞系中的显著影响基因集。
[0111] 对于一个包含约2万基因的细胞系而言,由于背景特异性的存在,每一个基因扰动后都会引发不同的转录变化,这必然是一个庞大的运行网络。尽管合成致死概念以“基因对”的形式展示,然而细胞内牵连到的背景一般不止只是两个基因,可能涉及第三、第四个基因甚至一个基因网络的差异。L1000基因扰动数据提供了同一细胞内每一个基因扰动后,其它基因的表达量变化,为细胞特异性的动态变化提供充足的参考,是细胞系特异性运行网络最好的表征。
[0112] 步骤S33、对每个细胞系中的显著影响基因集进行基因富集分析,生成基因富集结果。
[0113] 其中,基因富集结果能够表征候选合成致死对扰动后在多个细胞系中显著影响的信号通路以及功能。
[0114] 步骤S34、基于基因富集结果判断候选合成致死对是否为目标细胞系中的特异性合成致死对。
[0115] 本实施例中,由于基因富集结果能够表征候选合成致死对扰动后在多个细胞系中显著影响的信号通路以及功能,因此,根据该基因富集结果能够判断该候选合成致死对在目标细胞系中是否是真实的合成致死对以及是否具有细胞特异性,由此可确定该候选合成致死对在目标细胞系中是否为特异性合成致死对。
[0116] 本实施例提供一种进行细胞特异性分析的实例:使用合成致死对预测模型来分别预测三种细胞系中的合成致死相互作用,该三种细胞系包括A375 黑色素瘤细胞、HT29 结直肠癌细胞和 A549 肺腺癌细胞系。在三个细胞系分别对应的预测结果中,我们观察到这些细胞系对MAP2K1(一种基因)和BRAF(一种基因)的依赖性存在明显差异。具体而言,在具有纯合BRAF V600E(一个基因中的位点)突变的A375细胞系中,MAP2K1和BRAF对被预测为合成致死对。然而,在具有野生型 BRAF基因的A549细胞系中,没有预测到涉及MAP2K1的合成致死对。在 BRAF V600E杂合突变的 HT29 细胞系中,MAP2K1和BRAF对没有被预测为合成致死对,而是MAP2K1和MTOR(一种基因)的组合被预测为合成致死对。这些结果表明,参与BRAF突变癌症的合成致死对因不同细胞系中存在的特定遗传改变而异,该预测结果与这三种细胞系中MAP2K1被敲除时的表现一致。更重要的是,现有的实验证据证实了合成致死关系和细胞特异性。文献报道,BRAF突变可以预测对分裂原活化抑制剂(methyl ethyl ketone,MEK)的敏感性。BRAF和MEK1/2激酶抑制剂已被批准用于治疗BRAF突变黑色素瘤,取得了显著的临床反应。正如预期的那样,MAP2K1和MTOR之间的SL相互作用通过联合敲除筛选以及PD98059(M EK 抑制剂)和雷帕霉素(MTOR 抑制剂)在HT29细胞系中的联合治疗得到了实验验证。但是,实验结果仅证明 BRAF和MEK1/2激酶抑制剂在KRAS突变肺癌中的中度抑制作用,这与A549细胞系中没有 MAP2K1 被鉴定为 SL 对的预测一致。
[0117] 在一个实施方式中,在基于初步预测结果筛选出目标细胞系中的特异性合成致死对之后,还包括:在筛选出目标细胞系中的特异性合成致死对的情况下,根据与目标细胞系和特异性合成致死对相关的基因富集结果,对特异性合成致死对进行机理追踪处理。
[0118] 其中,与目标细胞系和特异性合成致死对相关的基因富集结果是指:对该特异性合成致死对扰动后在目标细胞系中的显著影响基因集,进行基因富集分析后形成的基因富集结果。
[0119] 机理追踪处理指的是追踪分析该特异性合成致死对扰动后改变了目标细胞系中的哪些通路或功能。
[0120] 本实施例还提供一种机理追踪处理的可视化实例:使用L1000基因扰动特征数据来筛选HT29细胞系中受MAP2K1或MTOR敲除显著影响的基因,分别产生63个和26个显著受影响的基因。使用分子特征数据库(MSigDB)对这些基因进行标志性富集分析表明,MAP2K1敲除会导致 MTORC1(一种酶)信号通路标志性的显著变化。MTORC1是MTOR的关键复合体,它使我们能够在MAP2K1和MTOR之间建立初步关系。此外,这些基因的生物过程的基因本体(GO)分析被用于关注关键损伤单元。结果表明,MAP2K1和MTOR的敲除分别显著改变胆固醇代谢过程和脂质修饰。这些数据与细胞的信号通路很好地一致,并为观察到的细胞损伤提供了合理的解释。
[0121] 本实施例中应用目标细胞系的L1000基因扰动特征数据结合基因富集分析,能够有效的追踪候选合成致死对扰动后对目标细胞系的表达层面的损伤,提供合成致死关系的可视化的理解,有助于将合成致死对预测的方案推广到临床应用场景。
[0122] 图6为本发明实施例提供的一种细胞特异性合成致死对预测装置的结构示意图。如图6所示,该细胞特异性合成致死对预测装置包括:预处理单元61、预测单元62和分析单元63。
[0123] 预处理单元61,对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征,其中,特定组学数据包含有多种能够表征细胞特异性的组学数据。
[0124] 在一个实施方式中,细胞特异性合成致死对预测装置还包括:获取单元和训练单元。
[0125] 其中,获取单元用于获取多个训练预设细胞系的合成致死对标签数据;训练单元用于基于多个预设细胞系的特定组学数据和对应的合成致死对标签数据进行模型训练,以获得合成致死对预测模型。
[0126] 在一个实施方式中,训练单元包括:转换子单元、特征提取子单元、融合子单元、拼接子单元、输入子单元、计算子单元、更新子单元和控制子单元。
[0127] 转换子单元用于针对每个预设细胞系,将预设细胞系的特定组学数据包含的多个组学数据分别转换为对应的图结构数据。
[0128] 特征提取子单元用于将预设细胞系的组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量。
[0129] 融合子单元用于基于多头注意力机制将多个组学数据对应的特征向量进行融合处理,获得多个预设细胞系的特异性融合特征。
[0130] 拼接子单元用于针对每一个预设细胞系的特异性融合特征,将特异性融合特征与对应的合成致死对标签数据进行拼接处理,以生成训练特征集。
[0131] 输入子单元用于从训练特征集中选择训练特征输入全连接神经网络,获得训练输出结果。
[0132] 计算子单元用于确定训练输出结果的损失函数;训练输出结果包括预设细胞系中各基因对为合成致死对的概率。
[0133] 更新子单元用于在初次确定损失函数的情况下,或者在本次确定的损失函数比上一次确定的损失函数小的情况下,基于当前本次确定的损失函数进行反向传播以更新模型参数,并且控制子单元用于控制返回将预设细胞系的组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量的步骤。其中,模型参数包括图卷积神经网络的参数和全连接神经网络的参数。
[0134] 控制子单元还用于在本次当前确定的损失函数大于或等于上一次确定的损失函数的情况下,选择输出结果的损失函数最小时的全连接神经网络作为合成致死对预测模型。
[0135] 在一个实施方式中,预处理单元61包括转换子单元、卷积子单元和融合子单元。
[0136] 其中,转换子单元用于将特定组学数据包含的多个组学数据分别转换为对应的图结构数据。
[0137] 卷积子单元用于将每个组学数据对应的图结构数据分别输入预定层的图卷积神经网络,以获得每个组学数据对应的特征向量。
[0138] 融合子单元用于基于多头注意力机制将多个组学数据对应的特征向量进行融合处理,获得特异性融合特征。
[0139] 预测单元62,将特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果,其中,初步预测结果包含目标细胞系中各基因对为合成致死对的概率。
[0140] 分析单元63,用于基于初步预测结果筛选出目标细胞系中的特异性合成致死对。
[0141] 在一个实施方式中,分析单元63包括确定子单元、扰动子单元、富集子单元和筛选子单元。
[0142] 其中,确定子单元用于根据初步预测结果确定候选合成致死对集合。
[0143] 扰动子单元用于针对候选合成致死对集合中的每一个候选合成致死对,根据L1000扰动特征数据获取候选合成致死对扰动后在多个细胞系中的显著影响基因集,其中,多个细胞系包含目标细胞系。
[0144] 富集子单元用于对每个细胞系中的显著影响基因集进行基因富集分析,生成基因富集结果。
[0145] 筛选子单元用于基于基因富集结果判断候选合成致死对是否为目标细胞系中的特异性合成致死对。
[0146] 在一个实施方式中,细胞特异性合成致死对预测装置还包括机理追踪单元,用于在筛选出目标细胞系中的特异性合成致死对的情况下,根据与目标细胞系和特异性合成致死对相关的基因富集结果,对特异性合成致死对进行机理追踪处理。
[0147] 需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0148] 本发明实施例提供一种细胞特异性合成致死对预测装置,预处理单元用于对目标细胞系的特定组学数据进行预处理,获得目标细胞系的特异性融合特征,其中,特定组学数据包含有多种能够表征细胞特异性的组学数据;预测单元用于将该特异性融合特征输入预先训练好的合成致死对预测模型,输出初步预测结果,该初步预测结果包含目标细胞系中各基因对为合成致死对的概率;分析单元用于基于初步预测结果筛选出目标细胞系中的特异性合成致死对,由于该特异性合成致死对只引发该目标细胞系的目标响应,因此本发明能够实现合成致死对预测的高可靠性。
[0149] 图7为本发明实施例提供的一种计算机设备的结构示意图。如图7所示,该计算机设备可以包括处理器701和存储器702,其中处理器701和存储器702可以通过总线或者其他方式连接,图7中以通过总线连接为例。
[0150] 处理器701可以为中央处理器(Central Processing Unit,CPU)。处理器701还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field‑Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
[0151] 存储器702作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的细胞特异性合成致死对预测方法对应的程序指令/模块。处理器701通过运行存储在存储器702中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的细胞特异性合成致死对预测方法。
[0152] 存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器701所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至处理器701。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0153] 一个或者多个模块存储在存储器702中,当被处理器701执行时,执行如图1所示实施例中的细胞特异性合成致死对预测方法。
[0154] 上述计算机设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
[0155] 本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read‑Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid‑State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
[0156] 虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。