特征尿蛋白对covid-19轻重级进行分型的非诊断方法及应用转让专利
申请号 : CN202110441023.6
文献号 : CN113138250B
文献日 : 2021-12-17
发明人 : 郭天南 , 丁璇 , 刘威 , 朱怡
申请人 : 西湖大学
摘要 :
权利要求 :
1.特征尿蛋白作为尿液检测靶标在制备分型受试者covid‑19轻重级的试剂盒中的应用,其特征在于,试剂盒含有检测特征尿蛋白的相对表达量的试剂;通过试剂盒检测受试者尿液中特征尿蛋白的相对表达量,特征尿蛋白的相对表达量与受试者covid‑19分型结果相关联,其中特征尿蛋白为:VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3。
2.根据权利要求1所述的应用,其特征在于,特征尿蛋白的相对表达量与受试者covid‑
19分型结果相关联:将特征尿蛋白的相对表达量输入分型模型,若分型模型输出的预测值低于设定阈值,则预测受试者为covid‑19重型。
3.根据权利要求1所述的应用,其特征在于,受试者covid‑19分型结果与受试者的肾脏组织监测相关联,分型模型的预测值和肾脏组织损伤程度成负相关。
4.特征尿蛋白在制备预测covid‑19分型结果的试剂中的应用,其特征在于,检测受试者尿液中的特征尿蛋白的相对表达量,相对表达量输入分型模型预测受试者的covid‑19分型结果,其中特征尿蛋白为:VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3。
5.一种对covid‑19轻重级进行分型的分型模型的构建方法,其特征在于,以不同轻重型covid‑19受试者的尿液的特征尿蛋白的相对表达量作为训练样本训练机器学习模型得到,其中特征尿蛋白为:VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3,分型模型的预测值表征受试者的covid‑19轻重型。
6.根据权利要求5所述的对covid‑19轻重级进行分型的分型模型的构建方法,其特征在于,机器学习模型以随机森林算法构建得到。
说明书 :
特征尿蛋白对covid‑19轻重级进行分型的非诊断方法及应用
技术领域
背景技术
织的报告,截至2021年1月4日,全球有超过8300万人感染了SARS‑CoV‑2,死亡人数超过180
万。在临床实践中,约80%的Covid‑19患者为非重症病例,症状轻微,预后良好,其余20%为
重症,需要特殊护理,包括吸氧和人工通气等操作,然而重症Covid‑19患者的疾病发展速度
极为迅速,Covid‑19的重症病例多在1周后出现呼吸困难,严重者会快速进展为急性呼吸窘
迫综合征、脓毒症休克、难以纠正的代谢性酸中毒和出凝血功能障碍及多器官功能衰竭等
情况,故及早发现重症Covid‑19患者有着非常广泛的意义。
Covid‑19的轻重型分型仅能通过患者的临床症状进行判断,极大可能会错过对临床症状最
佳的人工干预。
发明内容
量输入分型模型中得到covid‑19分型结果的预测值,该预测值可用于对罹患covid‑19的受
试者进行轻重型分型以及肾脏组织损坏程度的监测,特征尿蛋白为:VPS36、CEL、FREM2、
TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、
CDH19、TRHDE、SPOCK1、CD84和BTNL3。
型covid‑19,则预判患者存在验证的肾脏组织损伤;用于监测受试者的病症的恶化或改善:
基于预测值的变化监测covid‑19病症的变化状态;用于为制备治疗covid‑19轻重型的靶向
药物提供支持:基于预测值验证药物是否具有治疗效果,且本方案的特征尿蛋白在轻重型
分型中的区别最大,可以用作未来药物靶点的研究重点。有利于临床诊治过程中进行更加
针对性的治疗和用药,对于改善患者的预后具有重大意义。
从性高的特点,且本方案仅需使用微量的尿液样本(500ul)即可完成检测。
入分型模型中获取预测值,若预测值低于设定阈值,则分型受试者为重型,其中特征尿蛋白
包括VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、
SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3。
测,以及其他靶标或非靶标蛋白组学分析方法进行检测。
合TEA停止反应;经胰酶消化后的肽段使用除盐柱进行清洗除盐后,使用tmt标记多肽后溶
解多肽,用LC‑MS/MS进行分析后得到质谱数据,基于质谱数据获取多肽和蛋白的定量数据。
变性,再加入用10mm三(2‑羧基乙基)膦(TCEP)和40mm碘乙酰胺(IAA)还原并烷基化蛋白裂
解物,30℃下避光孵育30分钟。用100mM TEAB 200μL进一步稀释后,用5μg胰蛋白酶和1μg
Lys‑C的混合酶在32℃下消化12小时。加入30μL 10%三氟乙酸(TFA)停止反应。这些经胰酶
消化后的肽段使用除盐柱进行清洗除盐后,使用TMTpro 16plex(Thermo Fisher)按照厂家
说明书对多肽进行标记。重新使用2%的乙腈水溶液(V/V)对尿液多肽进行溶解,然后通过
LC‑MS/MS进行分析得到质谱数据。对得到的质谱数据,用商业化的Proteome Discoverer
2.4.1.15软件进行鉴定和定量,输出多肽和蛋白的鉴定和定量结果。
蛋白包括VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、
SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3。
原始数据,模型构建的主要参数设置为:ntree=1000,nodesize=1,其他使用默认参数。
重型;经过训练后的分型模型可基于输入的尿蛋白相对表达量输出预测值,预测值越高则
表明对应的covid‑19的分型越偏向于轻型,反之则更偏向于重型。
剂盒检测受试者尿液中特征尿蛋白的相对表达量,特征尿蛋白的相对表达量与受试者
covid‑19分型结果相关联,其中特征尿蛋白为:VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、
ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、
SPOCK1、CD84和BTNL3。
covid‑19为重型。
受试者的covid‑19分型结果,其中特征尿蛋白为:VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、
ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、
SPOCK1、CD84和BTNL3。
到,其中特征尿蛋白为:VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、
MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3,分型模型的
预测值表征受试者的covid‑19轻重型。
预测得到预测值,基于预测值可分型covid‑19的轻重型,可以及早对病人分型进行预判,有
利于临床诊治过程中进行更加针对性的治疗和用药,对于改善患者的预后具有重大意义,
同时可以作为潜在的治疗靶点供后续研究。
附图说明
具体实施方式
本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的
范围。
再加入用10mm三(2‑羧基乙基)膦(TCEP)和40mm碘乙酰胺(IAA)还原并烷基化蛋白裂解物,
在30℃的黑暗中孵育30分钟。用100mM TEAB 200μL进一步稀释后,再用2μg胰蛋白酶在32℃
下消化4小时,继而再加入2μg胰蛋白酶在32℃下消化12小时。加入30μL 10%三氟乙酸
(TFA)停止反应,取这些经胰酶消化后的肽段使用除盐柱进行清洗除盐后,使用TMTpro
16plex按照厂家说明书对多肽进行标记。
的实验进行了批次设计,以尽量减少批次效应对蛋白质组学数据的影响。本申请人将四组
不同的样本随机分为6批次进行TMTpro 16plex标记,每批样品数量相同,此处的四组不同
的样本分别指代:COVID‑19重症患者、COVID‑19非重症患者、非COVID‑19患者和健康供体的
尿液样本;对于每个批次的TMT样品,采用nanflow DIONEX UltiMate 3000RSLCnano系统
(Thermo Fisher Scientific,San Jose,USA)和XBridge Peptide BEH C18色谱柱(
5μm×4.6mm×250mm)(Waters,Milford,MA,USA)。样品采用5%‑35%乙腈(ACN)在10mM
氨水(pH=10.0)中梯度分离,流速为1mL/min。TMT标记的肽经该系统被分离为60个馏分,这
些馏分再进一步合并为30个馏分。这30个馏分经旋干后,用2%ACN/0.1%甲酸(FA)重新溶
解,重新溶解的多肽通过LC‑MS/MS进行分析。使用nanflow DIONEX UltiMate
3000RSLCnano系统(Thermo Fisher Scientific,San Jose,USA),并联合QE‑HFX高分辨率
质谱(Thermo Fisher Scientific,San Jose,USA),采用数据依赖采集(DDA)模式,在线对
每个馏分进行分析,分析时,样本首先以6ul/min的速度加载到预载柱(3μm, 20mm*
75μm i.d.)上,然后以300nL/分钟的流速,将加载在预载柱上的样品,冲洗至分析柱(1.9μ
m,120a,150毫米*75μm证件)中进行进一步的在线分离,分析时间为35分钟,LC梯度为从5%
到28%的缓冲液B(缓冲液A为2%ACN,98%H2O(含0.1%FA),缓冲液B为98%ACN(含0.1%
FA))。所有试剂均为MS级。质谱参数方面MS1的m/z范围为350~1800,分辨率为60,000
(200m/z),AGC为3e6,最大离子注入时间(max IT)为50ms。选取前15个前体离子进行MS/MS
的二级碎裂,其分辨率为45000(200m/z),AGC为2e5,max IT为120ms。所选前体的隔离窗口
为0.7m/z。使用Proteome Discoverer(版本2.4.1.15,Thermo Fisher Scientific)和蛋白
质数据库(从UniProtKB下载)对质谱数据进行分析。
氨酸氧化(+15.994915)和肽段N端乙酰化(+42.010565)。前体离子质量偏差设置为10ppm,
碎裂离子质量偏差设置为0.02Da。
图1中,健康对照组指的是:健康供体;轻型患者指的是:39例非重症;重型患者指的是的:11
例重症。
方案选用的样本的数据质量高。具体的,该数据表明本方案的数据是系统误差较小,不会因
为系统误差的原因导致这20个尿蛋白的选择出现错误。样本在鉴定过程中专门插入并设置
了QC的样本,使用QC样本的数据来证明本方案的分析方法的可靠性,从而证明本方案筛选
到的20个蛋白,并非源自系统误差,而是样本的真实差异。
重症的区别,以最终定位20种特征尿蛋白。
参数按照默认设置,对筛选得到的蛋白按照伴随这些蛋白所输出的Mean Decrease(平均降
低精度)进行排序。平均降低精度排名前20的尿蛋白,如图2所示,这些尿蛋白主要参与细胞
粘附、细胞发育、分泌、消化和细胞外基质或结构组织相关的生物过程,这些尿蛋白为
VPS36、CEL、FREM2、TNR、PTGFRN、MLEC、ADGRL1、OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、
MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和BTNL3。
降解。其相关途径包括先天免疫系统和蛋白质代谢。
重要作用。
调是胰腺炎的特征。
长的调节和突触可塑性的发展中起作用。
水平下降,可能提示白细胞外渗到炎症部位的过程受到影响。
长。
相似性),另外可以激活的T细胞的增殖反应。在巨噬细胞中,可增强LPS诱导的MAPK磷酸化
和NF‑κB活化,并调节LPS诱导的细胞因子分泌。与CD84相关的疾病包括淋巴增生综合征和
选择性免疫球蛋白缺乏症。
OSTN、ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和
BTNL3,该预测值表征受试者的covid‑19轻重型程度。
模型构建的主要参数设置为:ntree=1000,nodesize=1,其他使用默认参数。
集。
ICOSLG、NPR3、MELTF、PRSS2、SERPINI1、MADCAM1、CDH22、CDH19、TRHDE、SPOCK1、CD84和
BTNL3。具体的,对尿液样本进行测定的方法参见其上关于样品准备以及纳升液相‑高分辨
率质谱分析步骤内容。
先使用50个训练队列样本进行筛选得到的模型,可以用这个曲线的相关参数(AUC)来对模
型的稳定性和性能进行评估。然后建好的模型再应用于后续独立的队列(13个样本的队列)
进行分型预测。分型结果的灵敏度和特异性,也可以用这个曲线的相关参数(AUC)来说明。
如果训练队列建模和独立队列评估这两条曲线的相关参数较高,说明我们的模型有效性较
好,是科学的。
U10_10 0.972 0.028
U10_11 0.189 0.811
U10_15 0.13 0.87
U7_13 0.296 0.704
U7_2 1 0
U7_8 1 0
U8_15 0.828 0.172
U8_3 0.872 0.128
U8_6 0.972 0.028
U8_9 0.235 0.765
U9_11 1 0
U9_3 0.668 0.332
U9_7 0.999 0.001
是在病情好转阶段进行的。事实上,尿液取样后三天的CT检查也显示她双肺多发斑点状影
呈现减少趋势。因此,在该患者尿样采集处于其病情好转阶段,故导致对该病例的错误分
类,但其也从侧面反应了该分型模型起到一定的预测分型效果。第2例(U7‑13)为非重症,被
误诊为重症,实际2型糖尿病病史为2年,可能影响模型评估。另外两例U9‑3和U8‑15为男性
重症,被误诊为非重症,原因不明。
是,随机选择了另外20种蛋白进行建模:GASK1B、LIPA、PLAUR、RPL19、LSM2、GALM、FAM25A、
RRAS、C1RL、FOLH1、NUCKS1、NPM1、S100A6、FAT4、EPS8L2、C5orf15、SIAE、CRK、SEMG1、
SMPDL3B。
术方案,均落在本发明的保护范围之内。