GPCR的热稳定性突变预测方法、结构筛选方法及其装置转让专利
申请号 : CN202210010296.X
文献号 : CN114038498B
文献日 : 2022-03-18
发明人 : 王天元 , 黄健 , 吴炜坤 , 翟珂
申请人 : 北京晶泰科技有限公司
摘要 :
权利要求 :
1.一种GPCR的热稳定性突变预测方法,其特征在于,包括:根据目标GPCR的三维结构,获取所述目标GPCR的位点在突变前后的自由能值下降值的变化值ΔΔG,并根据所述自由能值下降值的变化值ΔΔG,在突变后的所述位点中确定符合第一预设条件的第一突变位点;
根据所述目标GPCR的特征和/或所述目标GPCR的氨基酸序列,分别获取所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量,并根据所述加热前后活性变化量,在突变后的所述位点中确定符合第二预设条件的第二突变位点;
筛选第一预设数量占比的第一突变位点和第二预设数量占比的第二突变位点作为候选突变位点。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述目标GPCR的三维结构未知时,根据所述目标GPCR的氨基酸序列,通过同源建模获取所述目标GPCR的候选三维结构;
在所述候选三维结构中,选取置信度最高的候选三维结构作为所述目标GPCR的三维结构。
3.根据权利要求1所述的方法,其特征在于,所述根据目标GPCR的三维结构,获取所述目标GPCR的位点在突变前后的自由能值下降值的变化值ΔΔG,包括:根据所述目标GPCR的三维结构,预测对应的跨膜区域;
根据所述跨膜区域构建的隐式溶剂模型,分别计算所述目标GPCR的各位点在突变前后的能量最小构象对应的自由能值下降值的变化值ΔΔG。
4.根据权利要求1所述的方法,其特征在于,所述根据所述自由能值下降值的变化值ΔΔG,在突变后的所述位点中确定符合第一预设条件的第一突变位点,包括:将所述自由能值下降值的变化值ΔΔG与预设能量阈值进行比较;
当所述自由能值下降值的变化值ΔΔG小于或等于所述预设能量阈值时,确定所述目标GPCR对应的突变后位点为所述第一突变位点。
5.根据权利要求1所述的方法,其特征在于:所述筛选第一预设数量占比的第一突变位点和第二预设数量占比的第二突变位点作为候选突变位点之后,还包括:
根据预设评价指标筛选所述第一突变位点,以在所述候选突变位点中选择推荐突变位点;或
所述筛选第一预设数量占比的第一突变位点和第二预设数量占比的第二突变位点作为候选突变位点之前,还包括:
根据预设评价指标筛选所述第一突变位点,以在所述第一突变位点中选择第一预设数量占比的候选突变位点;
其中,所述预设评价指标包括突变后的所述目标GPCR的三维结构中是否存在冲突,是否生成新的氢键,及生成的所述新的氢键的朝向和位置是否与周围的氨基酸产生有利稳定性的相互作用。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标GPCR的特征和/或所述目标GPCR的氨基酸序列,分别获取所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量,包括:
根据训练好的基于机器学习的分类器模型,提取所述目标GPCR的特征,所述特征包括结构特征和氨基酸性质特征、能量特征及信息特征;
根据所述特征,获取所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量;和/或
通过训练好的深度学习模型,根据所述目标GPCR的氨基酸序列,获取所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述加热前后活性变化量,在突变后的所述位点中确定符合第二预设条件的第二突变位点,包括:将所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量与野生型目标GPCR的加热前后活性变化量的预设倍率进行比较;
当所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量大于所述野生型目标GPCR的加热前后活性变化量的预设倍率时,确定所述目标GPCR对应的突变后位点为所述第二突变位点。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述筛选第一预设数量占比的第一突变位点和第二预设数量占比的第二突变位点作为候选突变位点,包括:根据所需候选突变位点的总数,筛选获取在所述总数中占比M%的第一突变位点和在所述总数中占比N%的第二突变位点作为候选突变位点;其中,M小于N,且M+N=100。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取历史数据,并将所述历史数据中的已知GPCR中具有迁移性的突变位点作为所述目标GPCR的候选突变位点。
10.一种GPCR结构的筛选方法,其特征在于,包括:根据权利要求1至9中任一GPCR的热稳定性突变预测方法筛选获得目标GPCR的候选突变位点;
根据所述候选突变位点确定所述目标GPCR的突变后结构。
11.一种GPCR的热稳定性突变预测装置,其特征在于:第一位点确定模块,用于根据目标GPCR的三维结构,获取所述目标GPCR的位点在突变前后的自由能值下降值的变化值ΔΔG,并根据所述自由能值下降值的变化值ΔΔG,在突变后的所述位点中确定符合第一预设条件的第一突变位点;
第二位点确定模块,用于根据所述目标GPCR的特征和/或所述目标GPCR的氨基酸序列,分别获取所述目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量,并根据所述加热前后活性变化量,在突变后的所述位点中确定符合第二预设条件的第二突变位点;
筛选模块,用于筛选第一预设数量占比的第一突变位点和第二预设数量占比的第二突变位点作为候选突变位点。
12.一种GPCR结构的筛选装置,其特征在于,包括:筛选模块,用于根据权利要求11所述的GPCR的热稳定性突变预测装置筛选获得目标GPCR的候选突变位点;
结构确定模块,用于根据所述候选突变位点确定所述目标GPCR的突变后结构。
13.一种电子设备,其特征在于,包括:处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1‑10中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1‑10中任一项所述的方法。
说明书 :
GPCR的热稳定性突变预测方法、结构筛选方法及其装置
技术领域
背景技术
连接第5和第6个跨膜螺旋的胞内环上都有结合位点,它们的主要功能是通过与G蛋白相互
作用将细胞外的信息传递到细胞内。GPCRs参与了大量人类疾病、生理和药理活动,是研究
最多的药物靶点。研究GPCRs的结构稳定性和其结构解析技术对研制新药至关重要,但由于
其结构柔性比较大、构象多变、异源表达折叠错误等,解析有些GPCRs的结构还存在一定的
困难,GPCR的热稳定性突变位点预测愈发重要。
两种对GPCR突变体热稳定性改造的方法:系统性的ALA扫描GPCR突变方法和定向蛋白进化
方法。然而,目前这些方法存在耗时耗力且需要投入大量的研发费用的问题。
发明内容
性,达到省时省力及降低研发费用的效果。
定符合第一预设条件的第一突变位点;
量,在突变后的所述位点中确定符合第二预设条件的第二突变位点;
利稳定性的相互作用。
在突变后的所述位点中确定符合第一预设条件的第一突变位点;
所述加热前后活性变化量,在突变后的所述位点中确定符合第二预设条件的第二突变位
点;
数量的突变位点组成最终的候选突变位点;这样的设计,一方面可以通过不同的方式更快
速且更全面地获得目标GPCR的突变位点,提供更完整的突变位点筛选基础,减少遗漏;另一
方面,根据不同的来源提高获取的候选突变位点的可靠性,进一步设置在推荐位点中的相
应的数量占比,从而避免候选突变位点过多,控制候选突变位点的数量,减少GPCR在热稳定
性突变中的实验尝试过程,达到省时省力及降低研发费用的效果。
附图说明
通常代表相同部件。
具体实施方式
相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整
地传达给本领域的技术人员。
形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包
含一个或多个相关联的列出项目的任何或所有可能组合。
在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以
被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更
多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限
定。
突变位点预测愈发重要。然而,如何缩减GPCR在热稳定性突变中所需要覆盖大量突变空间
的实验尝试过程,以达到省时省力及降低研发费用的目的,是目前需要解决的问题。
下结合附图详细描述本申请实施例的技术方案。
第一预设条件的第一突变位点。
提高获取的第一突变位点的全面性,可以将目标GPCR的全部位点进行丙氨酸扫描突变,并
分别逐一计算各位点突变前的自由能下降值与突变后的自由能下降值之间的变化值ΔΔ
G。
维结构作为目标GPCR的三维结构。在获取置信度最高的候选三维结构充当目标GPCR的三维
结构后,同理,分别通过相关算法获取目标GPCR的每一位点在突变前的自由能值下降值和
突变后的自由能值下降值之间的变化值ΔΔG。
第一突变位点。通过这样的设计,即可筛选获得符合第一预设条件的一批第一突变位点。
符合第二预设条件的第二突变位点。
者仅采用另一种算法模型根据目标GPCR的氨基酸序列获取第二突变位点,或者同时根据两
种不同的算法模型分别获取第二突变位点。
变化量,从而获得对应的加热前后活性变化量。
酸扫描突变后的加热前后活性变化量大于野生型目标GPCR的加热前后活性变化量的预设
倍率,确定目标GPCR对应的突变后位点为第二突变位点。也就是说,确定符合第二预设条件
的突变后的位点为第二突变位点。其中加热前后活性变化量可以根据加热后的活性与加热
前的活性的比值进行表示,或者根据加热后的活性与加热前的活性的差值进行表示。
二预设数量占比。也就是说,根据上述不同方法所得的各突变位点之间存在可信度的区别,
其中,第二突变位点的可信度更高,第二突变位点的推荐数量占比则可以多于第一突变位
点的推荐数量。这样的设计,可以更合理地确保候选突变位点的全面性和可靠性。可以理
解,在汇集所需数量的候选突变位点后,即可便于研究人员在候选突变位点中挑选并进行
相关实验,从而缩减实验尝试过程。
中各自选取一定数量的突变位点组成最终的候选突变位点;这样的设计,一方面可以通过
不同的方式更快速且更全面地获得目标GPCR的突变位点,提供更完整的突变位点筛选基
础,减少遗漏;另一方面,根据不同的来源提高获取的候选突变位点的可靠性,进一步设置
在推荐位点中的相应的数量占比,从而避免候选突变位点过多,控制候选突变位点的数量,
减少GPCR在热稳定性突变中的实验尝试过程,达到省时省力及降低研发费用的效果。
位点中确定符合第一预设条件的第一突变位点。
继而根据变化值ΔΔG筛选获得第一突变位点。其中第一预设模型是基于三维结构,以
RosettaMP_ddG算法为核心的模型。在一具体的实施方式中,该第一预设模型的具体处理环
节包括如下步骤:
目标GPCR的三维结构。
目标GPCR,可以根据同源建模的方式,确定与目标GPCR的氨基酸序列同源的各个同源GPCR,
并选取与目标GPCR的氨基酸序列相似度更高的一个或多个同源GPCR,分别以选取的这些同
源GPCR的三维结构作为结构模板,根据相关技术中的生物信息学和计算模拟的方法进行建
模。例如,在进行同源建模时,可以通过结构模板检索、氨基酸序列比对、根据结构模板建立
骨架、排布侧链构象和loop区域(蛋白质肽链中除去螺旋和β折叠的第三种二级结构),以实
现精细化建模,获得对应的目标GPCR的候选三维结构。为了确保后续预测结果的准确性,可
以设计置信度对各候选三维结构进行评分,以便筛选置信度符合预设阈值的三维结构,例
如将置信度最高的候选三维结构作为目标GPCR的三维结构。在其他实施例中,可以根据已
经完成建模的结构库获取目标GPCR的三维结构,例如GPCR‑I‑TASSER(一种蛋白三级预测软
件)。当然,如果目标GPCR的三维结构已知,则可以直接进入下一步骤,无需进行同源建模。
本步骤中,通过将PDB格式文件中的三维坐标逐一转换为膜坐标框架下的坐标。具体地,可
以将PDB格式文件中的原始三维坐标通过旋转、平移的操作移动到以Z轴为膜法向量的位置
上,从而获得坐标转换后的PDB格式文件,可以理解,坐标转换后的各原子之间的相对位置
不变。例如,可以根据相关技术中PPM服务器直接进行坐标转换。
(Rosetta是基于蒙特卡罗模拟退火为算法核心的高分子建模软件库)中的$ROSETTA/tools
模块下的cleanATOM工具清理冗余原子信息。
器进行坐标转换时,可以预测出氨基酸嵌入残基(embeddedresidues),即嵌入膜中的残基。
在一实施方式中,根据嵌入残基修改调整跨膜区域,使跨膜区域更加准确,以便提高后续计
算结果的准确性。其中,跨膜区域可以采用span格式文件进行存储。
接触的部分,使用对应的膜势能进行描述;而与bulk(溶剂大体系)中水接触的部分,应该用
正常的隐式势能描述。
身为位点外的其余19种天然氨基酸的一种,即非丙氨酸突变),根据隐式溶剂模型分别计算
每一位点突变后的目标GPCR对应的自由能值下降值。根据目标GPCR的单个位点突变后的自
由能下降值与突变前的目标GPCR对应的自由能值下降值作差,计算获得该位点突变后的目
标GPCR对应的变化值ΔΔG。以此类推,根据目标GPCR的突变位点的个数,计算获得对应个
数的变化值ΔΔG。其中,为了确保计算结果的准确,在进行自由能值下降值的计算之前,先
将突变前和突变后的三维结构进行优化,例如可以采用Rosetta软件库中的FastRelax模块
进行优化,通过多次迭代进行氨基酸侧链重排以及能量最小化的计算来搜索给定的三维结
构在局部能垒的最优构象,即能量最小构象。
降值的变化值ΔΔG小于或等于预设能量阈值的突变位点。其中,预设能量阈值是负值。例
如,预设能量阈值可以是‑1.5REU(单位:Rosetta Energy Unit,REU),当然还可以是其他数
值。当自由能值下降值的变化值ΔΔG小于或等于‑1.5REU,数值越小,即绝对值越大时,表
示该位点突变后对应的蛋白结构更稳定,该位点具有作为候选突变位点的倾向。因此,当该
位点突变后对应的自由能值下降值的变化值ΔΔG大于预设能量阈值时,例如大于‑
1.5REU,则不符合第一预设条件中的规则,对应的目标GPCR突变后的位点不属于第一突变
位点,即不会作为候选突变位点。
式包括键伸缩能、键角变形能、键的转动(二面角)能和非键相互作用等多项能量项,通过对
能量函数中的能量项进行分解,从而确定函数中的具体某项或多项能量项导致产生变化值
ΔΔG。这样的设计,通过分析,有助于挑选更优的突变后位点。
突变后的位点中确定符合第二预设条件的第二突变位点。
不同类型的模型,例如第二预设模型包括一种基于机器学习的分类器模型和一种深度学习
模型。这样的设计,通过两种不同的模型分别获取第二突变位点,从而更全面地获得符合第
二预设条件的突变后位点,避免遗漏。
激活剂A2AR受体活化态的构象(agonist50‑N‑ethylcarboxamidoadenosine‑bound human
adenosine receptor)、结合拮抗剂的A2AR受体非激活态构象(antagonist ZM‑241385‑
bound A2AR)、结合拮抗剂的β1AR(antagonist cyanopindolol‑bound turkey b1‑
adrenergic receptor)受体非激活态构象、结合激动剂的NTSR受体活化中间态(agonist
NTS1‑bound rat neurotensin receptor)及结合拮抗剂的AT1R(antagonist ZD7155‑
bound human angiotensinreceptor type 1)等至少5种样本GPCR的丙氨酸扫描突变全部
位点的热稳定性测试数据。
后活性比值的形式进行表示。具体的,获取每一样本GPCR的单个位点突变后、在加热前的活
性,再获取每一样本GPCR的对应位点突变后、在加热后的活性,进而获得样本GPCR在该位点
突变后的加热后的活性与加热前的活性的比值,即为该样本GPCR的位点突变后的加热前后
活性比值。另外,再获取野生型(即自然界中的原始GPCR的序列进行表达纯化后的蛋白)的
样本GPCR的加热后活性与加热前活性的比值,即为该野生型样本GPCR对应的加热前后活性
比值;将样本GPCR的加热前后活性比值与野生型的样本GPCR的加热前后活性比值进行对
比,如果前者的加热前后活性比值大于后者的加热前后活性比值的预设倍率,则表示该突
变后位点使样本GPCR的热稳定性提高;否则,如果前者的加热前后活性比值小于或等于后
者的加热前后活性比值的预设倍率,即该突变后位点使样本GPCR的热稳定性降低或没有提
高热稳定性。也就是说,根据对热稳定性的“提高”或“降低”作用,对样本GPCR的每一位点突
变后的结构进行分类,获得对应的分类标签,即“提高”或“降低”标签。进一步地,预设倍率
可以是在以野生型的样本GPCR的加热前后活性比值为基准,设置倍率为100%,或者预设倍
率大于100%,例如110%、120%等,从而减少实验数据的误差。为了便于理解,例如当野生型样
本GPCR的加热前后活性比值为80%,当预设倍率为110%,则样本GPCR的加热前后活性比值需
要大于(80%*110%=88%)时,输出的标签为“提高”;如果样本GPCR的加热前后活性比值小于
或等于88%时,输出的标签为“降低”。
GPCR的结构进行描述,并对每一个位点突变后的样本GPCR的输入结构计算基于该位点突变
后的closeness(接近中心性)、centrality(中心性)、betweenness(中介中心性)等信息;可
采用的实用工具例如市面上已知的InfoAbstractor大分子矢量化工具。针对氨基酸性质特
征,包括疏水性、进化偶联得分以及溶剂化面积。针对能量特征,通过对每一个位点突变后
的样本GPCR的构象进行Rosetta中能量函数的能量项的评估,包括氢键、范式作用等多个物
理相关能量以及统计相关能量项;可采用的实用工具例如Rosetta软件库。针对信息特征,
包括二级结构、二面角信息、残基深度、等电点等;可采用的实用工具例如市面上已知的
InfoAbstractor大分子矢量化工具。
施方式中,根据样本GPCR的特征和对应的分类标签,训练构建GBDT(Gradient Boosting
Decision Tree,梯度下降树)模型。其中,GBDT模型是一种基于机器学习的分类器模型,为
了应对样本数据的不平衡,可以选择RandomOverSampling、SMOTE或SMOTE Tomek等数据平
衡方法,从而提高构建的模型的可靠性,确保在实际应用中的输出结果的准确性。在一具体
的实施方式中,根据样本GPCR的特征和对应的分类标签,训练构建深度学习模型。
数据持平。上述训练数据在深度学习模型中可达到20%回复率。因此,本步骤构建的两种第
二预设模型均可投入实际使用。
比值在突变后的位点中确定符合第二预设条件的第二突变位点。
后,提取目标GPCR的特征,特征包括结构特征和氨基酸性质特征、能量特征及信息特征;根
据特征,获取目标GPCR的位点经丙氨酸扫描突变后的加热后的活性与加热前的活性的比
例,即为该位点突变后对应的加热前后活性比值。需要明确的是,本步骤中的目标GPCR的三
维结构如果未知,同理可按照上述步骤211进行确定三维结构。
GPCR对应的突变后位点为第二突变位点。也就是说,根据本步骤中所采用的模型,分别将目
标GPCR在每一位点分别经丙氨酸扫描突变后进行加热前和加热后的活性计算,在获得该位
点突变后对应的加热前后活性比值后,还可以计算获得该目标GPCR对应的野生型在加热前
后活性比值,即可与野生型目标GPCR的加热前后活性比值的预设倍率进行比较,获得比较
结果。如果该位点突变后对应的加热前后活性比值大于野生型目标GPCR的加热前后活性比
值的预设倍率,则符合第二预设条件,即可以确定目标GPCR对应的突变后位点为第二突变
位点。
中确定符合第二预设条件的第二突变位点。
根据加热前后活性比值在突变后的位点中确定符合第二预设条件的第二突变位点。本步骤
中的符合第二预设条件的第二突变位点的获取方法与上述步骤S222相同,于此不再赘述。
ΔG的从小到大进行排序,由于ΔΔG为负值,则获取更小的变化值ΔΔG所对应的第一突变
点。或者,按照第一突变位点对应的能量项分解决定筛选的优先级。这样的方式,从而获取
更有利于热稳定性的第一突变位点作为候选突变位点,滤除冗余的第一突变位点。
目标GPCR的三维结构中是否存在冲突,是否生成新的氢键,及生成的新的氢键的朝向和位
置是否与周围的氨基酸产生有利稳定性的相互作用。例如,如果某位点突变后的目标GPCR
的三维结构中不存在冲突、和/或有生成新的氢键,及生成的新的氢键的朝向和位置与周围
的氨基酸产生有利稳定性的相互作用,则这样的突变后位点为更优的第一突变位点,从而
可以将该第一突变位点作为推荐突变位点。
择第一预设数量占比的候选突变位点。也就是说,可以先根据上述预设评价指标对符合第
一预设条件的第一突变位点进行筛选,然后在筛选后的第一突变位点中再筛选第一预设数
量占比的第一突变位点作为候选突变位点。也就是说,在步骤S214获得符合第一预设条件
的第一突变位点后,可以先人工挑选或计算机自动挑选符合预设评价指标的第一突变位
点,再在挑选获得的第一突变位点中,筛选在总数中占比M%的第一突变位点作为候选突变
位点。
的第二突变位点中筛选获得总数占比P%的第二突变位点,在步骤S223中根据训练好的深度
学习模型所预测的第二突变位点中筛选获得在总数中占比Q%的第二突变位点,其中P+Q=N,
P>Q。也就是说,作为候选突变位点的第二突变位点综合了不同类型的第二预设模型的预
测结果,从而使预测位点更丰富全面。其中,筛选的优先级可以是第二预设模型中的优先
级,于此不作限制。但需要明确的是,在采用不同类型的第二预设模型进行预测第二突变位
点时,由于两种模型都是基于丙氨酸扫描突变位点,两种模型的预测结果可能有部分相同,
即两种模型可能预测输出相同的第二突变位点。在一实施方式中,优先选取两种模型中预
测相同的第二突变位点作为候选突变位点。
变位点中筛选获取候选突变位点,还可以根据公开的文献报道中的历史数据,收集候选突
变位点。可以理解,由于GPCR家族的氨基酸序列与三维结构的保守性,在以往公开的实验数
据中证实能够稳定某些或某类GPCR的突变位点可能拥有迁移性,即该突变位点如果迁移到
目标GPCR中也可能会具备同样稳定结构的效应。通过对实验数据广泛的收集和GPCR序列保
守性的分析,总结出基于经验的具有潜在稳定性的突变位点作为候选突变位点。
变的第二突变位点,并分别根据优先级从各突变位点中筛选获得不同数量占比的候选突变
位点;这样的设计,可以通过不同的预设模型从丙氨酸突变和非丙氨酸突变等不同的突变
角度全面且精准地获得有利于目标GPCR热稳定性的突变位点,去除冗余的突变位点,减少
不必要的实验过程,从而节省时间,提高研究效率和节约研发费用,为GPCR的高热稳定性的
构象的发现和筛选进行助力,为GPCR的结构解析提供新的思路和省时省力的捷径。
值的变化值ΔΔG,根据自由能值下降值的变化值ΔΔG,在突变后的位点中确定符合第一
预设条件的第一突变位点;及分别根据目标GPCR的特征和氨基酸序列,通过不同类型的第
二预设模型,获取目标GPCR的位点经丙氨酸扫描突变后的加热前后活性比值,并根据加热
前后活性比值在突变后的位点中确定符合第二预设条件的第二突变位点。最后,根据所需
候选突变位点的总数,筛选获取在总数中占比M%的第一突变位点和在总数中占比N%的第二
突变位点作为候选突变位点;其中,M小于N,且M+N=100。另外,还可以获取历史数据,并将历
史数据中的已知GPCR中具有迁移性的突变位点作为候选突变位点。
变,从而获得目标GPCR的突变后结构,即目标GPCR的突变体。
白进化,本申请的筛选方法可以更快速地获得具有稳定性的目标GPCR的突变体,提高研发
效率,节省研发费用。
后的位点中确定符合第一预设条件的第一突变位点。
变化量,在突变后的位点中确定符合第二预设条件的第二突变位点。
三位点确定模块350,其中:
的候选三维结构作为目标GPCR的三维结构。
应的自由能值下降值的变化值ΔΔG。及第一位点确定模块310用于将自由能值下降值的变
化值ΔΔG与预设能量阈值进行比较;当自由能值下降值的变化值ΔΔG与预设能量阈值小
于或等于预设能量阈值时,确定目标GPCR对应的突变后位点为第一突变位点。
目标GPCR的位点经丙氨酸扫描突变后的加热前后活性变化量。和/或,第二位点确定模块
320用于根据目标GPCR的氨基酸序列,通过训练好的深度学习模型,获取目标GPCR的位点经
丙氨酸扫描突变后的加热前后活性变化量。第二位点确定模块320还用于将加热前后活性
变化量与野生型目标GPCR的加热前后活性变化量的预设倍率进行比较;当目标GPCR的位点
经丙氨酸扫描突变后的加热前后活性变化值大于野生型目标GPCR的加热前后活性变化量
的预设倍率时,确定目标GPCR对应的突变后位点为第二突变位点。
100。筛选模块330用于在根据训练好的基于机器学习的分类器模型预测的第二突变位点中
筛选获得总数占比P%的第二突变位点,在根据训练好的深度学习模型所预测的第二突变位
点中筛选获得在总数中占比Q%的第二突变位点,其中P+Q=N,P>Q。
位点,并分别根据优先级从各突变位点中筛选获得不同数量占比的候选突变位点;这样的
设计,可以全面且精准地获得有利于目标GPCR热稳定性的突变位点,去除冗余的突变位点,
减少不必要的实验过程,从而节省时间,提高研究效率和节约研发费用,为GPCR的高热稳定
性的构象的发现和筛选进行助力,为GPCR的结构解析提供新的思路和省时省力的捷径。
320确定的目标GPCR对应的突变后的第二突变位点中,筛选第一预设数量占比的第一突变
位点和第二预设数量占比的第二突变位点作为候选突变位点。
(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field‑
Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器
等。
令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不
会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用
大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存
储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者
易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器
在运行时需要的指令和数据。此外,存储器1010可以包括任意计算机可读存储媒介的组合,
包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘
和/或光盘也可以采用。在一些实施方式中,存储器1010可以包括可读和/或写的可移除的
存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD‑ROM,双层DVD‑ROM)、只读蓝
光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro‑SD卡等)、磁性软盘等。计算机可
读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
程序代码指令。
可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,
使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨
在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的
其他普通技术人员能理解本文披露的各实施例。