基因的应用、预测I期非小细胞肺癌术后复发转移的模型及其构建方法转让专利

申请号 : CN202111425548.7

文献号 : CN114657245B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴芳胡春宏舒龙陈晨潘越赵丽淑曾月刘笑寒刘俊奇彭钰茸

申请人 : 中南大学湘雅二医院

摘要 :

本发明涉及生物医药领域,特别涉及基因的应用、预测I期非小细胞肺癌术后早期复发转移的模型及其构建方法。本发明公开了一种预测I期非小细胞肺癌术后早期复发转移的列线图模型及其建立方法。本发明通过全外显子测序和LASSO回归分析基因突变与预后的关系并构建肿瘤突变评分,通过免疫组化分析肿瘤浸润性CD3+和CD8+T细胞与预后的关系并构建免疫评分,结合肿瘤突变评分和免疫评分,我们通过建立了转移风险模型,并构建了相应的列线图。本发明的模型简单、直观,易于推广,能有效地帮助临床医生预测I期NSCLC患者是否会出现术后早期复发转移,从而为患者的监测和治疗提供理论指导。

权利要求 :

1.MUC4, KRTAP10‑6, ZFHX4, TCF20, PRDM7, MEOX2, NPIPB5, FAM173B, ACP2, SCN5A, NSRP1基因的组合在制备I期NSCLC复发转移风险的预测和/或检测的模型中的应用;

所述模型包括:TMS=1.0509288×MUC4 突变状态+0.26744718×KRTAP10‑6突变状态+ 

0.1652883×MEOX2突变状态+ 0.07419074×NPIPB5突变状态+ 0.07250511×FAM173B突变状态‑0.07430707×ACP2突变状态+ 0.24224709×PRDM7突变状态‑ 0.03014324×SCN5A突变状态+ 0.23401033×TCF20突变状态+ 0.24224673×ZFHX4突变状态‑ 0.10444693×NSRP1突变状态‑0.13372265;

基因为突变型时,所述突变状态为1;基因为野生型时,所述突变状态为0。

2.如权利要求1所述的应用,其特征在于,所述TMS与I期NSCLC早期复发转移风险呈正相关,临界值为‑0.097,当患者TMS大于‑0.097时,患者会出现术后复发转移,否则不会。

3.如权利要求1或2所述的应用,其特征在于,所述模型还包括:

复发转移风险值=TMS×a‑IS×b+c;其中,a c分别独立为:‑0.8 7.0;

~ ~

将肿瘤组织分为肿瘤中心和浸润边缘两个区域,并将CD3+和CD8+T细胞在这两个区域的浸润水平分为高低两组,高低的分界值则由ROC曲线及约登指数确定,根据CD3+和CD8+T细胞的浸润位置和密度建立免疫评分,分析IS与转移风险的相关性;

IS= CD3‑CT+T表达水平 + CD3‑IM +T表达水平+CD8‑CT +T表达水平+CD8‑IM +T表达水平;表达水平高赋值为1分,低则赋值为0分;

IS范围为0‑4分,IS=0分表示两种细胞在两个区域的水平都是低表达,IS=1表示有一种免疫细胞在一个区域高表达,其余都是低表达,IS=2表示CD3‑CT、CD3‑IM、CD8‑CT、CD8‑IM +T中有两个高,IS=2表示CD3‑CT、CD3‑IM、CD8‑CT、CD8‑IM +T中有三个高,IS=4分表示两种细胞在两个区域表达水平都低;

所述模型为:

复发转移风险值=TMS×6.55658858436019‑IS×0.748938863395558+

0.767461882293273。

4.I期NSCLC复发转移风险的预测和/或检测的试剂或试剂盒,其特征在于,包括检测MUC4, KRTAP10‑6, ZFHX4, TCF20, PRDM7, MEOX2, NPIPB5, FAM173B, ACP2, SCN5A, NSRP1基因组合的引物、探针或其组合。

说明书 :

基因的应用、预测I期非小细胞肺癌术后复发转移的模型及其

构建方法

技术领域

[0001] 本发明涉及生物医药领域,特别涉及基因的应用、预测I期非小细胞肺癌术后复发转移的模型及其构建方法。

背景技术

[0002] 非小细胞肺癌(non‑small cell lung cancer,NSCLC)是占肺癌的80‑85%,手术是其I期非小细胞肺癌的标准治疗方式,部分患者术后会发生肿瘤复发转移,导致生存时间显著缩短。目前指南推荐部分IB期患者(临床病理特征提示高复发转移风险的患者)接受术后辅助化疗,然而仅少数IB患者能从术后辅助化疗获益。近些年围手术期靶向治疗和免疫治疗对早期NSCLC展现出了很好的疗效,但是对I期NSCLC疗效欠佳。总体而言,围手术期治疗对降低I期NSCLC术后复发转移风险疗效不够令人满意,其中一个重要的原因可能是缺少有效的生物标志物筛选高危人群。
[0003] 现有的I期NSCLC预后生物标志物主要是是临床病理及影像学特征,这些标志物预测价值有限,且未考虑到疾病发生的分子机制。近年来,少量研究报道了基因突变和免疫微环境特征对预测I期NSCLC术后转移的作用,如肿瘤突变负荷(TMB),TMB反映了基因突变的整体情况,但是往往检测成本高,并且计算TMB时很可能会纳入与预后不相关的基因突变,导致预测效能下降。基因突变和免疫微环境均是对I期NSCLC肿瘤转移有重要影响,然而,很少有研究将两者结合应用。

发明内容

[0004] 有鉴于此,本发明结合基因突变和免疫微环境两个方面的特征创建了联合转移风险模型,既为I期NSCLC提供了一个精确的生物标志物,也为手术期治疗提供转化医学证据。
[0005] 为了实现上述发明目的,本发明提供以下技术方案:
[0006] 第一方面,本发明提供了MUC4,KRTAP10‑6,ZFHX4,TCF20,PRDM7,MEOX2,NPIPB5,FAM173B,ACP2,SCN5A,NSRP1中的一个或多个基因的组合在制备I期NSCLC预后生物标志物中的应用。
[0007] 第二方面,本发明提供了MUC4,KRTAP10‑6,ZFHX4,TCF20,PRDM7,MEOX2,NPIPB5,FAM173B,ACP2,SCN5A,NSRP1中的一个或多个基因的组合在制备I期NSCLC复发转移风险的预测和/或检测的模型、试剂或试剂盒中的应用。
[0008] 在本发明的一些具体实施方案中,所述模型包括:TMS=k1×MUC4突变状态+k2×KRTAP10‑6突变状态+k3×MEOX2突变状态+k4×NPIPB5突变状态+k5×FAM173B突变状态‑k6×ACP2突变状态+k7×PRDM7突变状态‑k8×SCN5A突变状态+k9×TCF20突变状态+k10×ZFHX4突变状态‑k11×NSRP1突变状态‑k12;
[0009] 基因为突变型时,所述突变状态为1;基因为野生型时,所述突变状态为0;
[0010] K1~k12分别独立为:‑0.2~1.1。
[0011] 在本发明的一些具体实施方案中,所述模型包括:TMS=1.0509288×MUC4突变状态+0.26744718×KRTAP10‑6突变状态+0.1652883×MEOX2突变状态+0.07419074×NPIPB5突变状态+0.07250511×FAM173B突变状态‑0.07430707×ACP2突变状态+0.24224709×PRDM7突变状态‑0.03014324×SCN5A突变状态+0.23401033×TCF20突变状态+0.24224673×ZFHX4突变状态‑0.10444693×NSRP1突变状态‑0.13372265;
[0012] 基因为突变型时,所述突变状态为1;基因为野生型时,所述突变状态为0。
[0013] 在本发明的一些具体实施方案中,所述TMS与I期NSCLC复发转移风险呈正相关,临界值为‑0.097,当患者TMS大于‑0.097时,患者会出现术后复发转移,否则不会。
[0014] 在本发明的一些具体实施方案中,所述模型还包括:
[0015] 复发转移风险值=TMS×a‑IS×b+c;其中,a~c分别独立为:‑0.8~7.0;
[0016] 将肿瘤组织分为肿瘤中心(Center of Tumor,CT)和浸润边缘(Invasive Margin,IM)两个区域,并将C3+和CD8+T细胞在这两个区域的浸润水平分为高低两组(高低的分界值则由ROC曲线及约登指数确定)。根据CD3+和CD8+T细胞的浸润位置和密度建立免疫评分(immunescore,IS),分析IS与转移风险的相关性。IS=CD3‑CT+T表达水平+CD3‑IM+T表达水平+CD8‑CT+T表达水平+CD8‑IM+T表达水平。表达水平高赋值为1分,低则赋值为0分。
[0017] IS范围为0‑4分,IS=0分表示两种细胞在两个区域的水平都是低表达,IS=1表示有一种免疫细胞在一个区域高表达,其余都是低表达,IS=2表示CD3‑CT、CD3‑IM、CD8‑CT、CD8‑IM+T中有两个高,IS=2表示CD3‑CT、CD3‑IM、CD8‑CT、CD8‑IM+T中有三个高,IS=4分表示两种细胞在两个区域表达水平都低。
[0018] 在本发明的一些具体实施方案中,所述模型为:
[0019] 转移风险值=TMS×6.55658858436019‑IS×0.748938863395558+0.767461882293273。
[0020] 第三方面,本发明还提供了I期NSCLC复发转移风险的预测和/或检测的模型,包括本发明所述应用中采用的模型。
[0021] 第四方面,本发明还提供了所述模型的构建方法。
[0022] 第五方面,本发明还提供了I期NSCLC复发转移风险的预测和/或检测的试剂或试剂盒,包括检测MUC4,KRTAP10‑6,ZFHX4,TCF20,PRDM7,MEOX2,NPIPB5,FAM173B,ACP2,SCN5A,NSRP1中的一个或多个基因组合的引物、探针或其组合和/或所述模型需要用到的试剂。
[0023] 基因突变和肿瘤免疫微环境是影响肿瘤生物学行为的重要因素。本发明一方面通过全外显子测序技术分析I期NSCLC患者突变特征,通过LASSO回归筛选出了多个与术后早期复发转移相关的基因突变,并整合这些建立了早期复发转移相关的TMS,该评分可以为I期NSCLC患者提供了很好的预后预测作用;另一方面,本发明也通过免疫组化检测肿瘤组织中CD3+和CD8+T细胞的浸润水平及位置,并以此建立IS。
[0024] 本发明结合基因突变和免疫微环境两个方面的特征,既为I期NSCLC提供了一个精确的生物标志物,也为了围手术期治疗提供转化医学证据。
[0025] 本发明公开了一种预测I期非小细胞肺癌术后早期复发转移的列线图模型及其建立方法。本发明通过全外显子测序和LASSO回归分析基因突变与预后的关系并构建肿瘤突变评分(tumor mutation score,TMS),通过免疫组化分析肿瘤浸润性CD3+和CD8+T细胞与预后的关系并构建免疫评分(immune score,IS),结合TMS、IS,我们建立了转移风险模型,并构建了相应的列线图。本发明的模型简单、直观,易于推广,能有效地帮助临床医生预测I期NSCLC患者是否会出现术后早期复发转移,从而为患者的监测和治疗提供理论指导。

附图说明

[0026] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
[0027] 图1示WES检测I期NSCLC患者基因突变特征;其中,图1A示138种基因突变是两组共有的,1087种基因突变为早期转移组特有,458种基因突变为未转移组特有;图1B示瀑布图展示74例全外显子测序的突变频率前40的基因;
[0028] 图2示LASSO回归筛选肿瘤复发转移的相关基因;其中,图2A示LASSO回归筛选出转移相关的突变基因;图2B示交叉验证法筛选出11个转移相关的突变基因,lambda取最佳值;
[0029] 图3示TMS的分布及其与肿瘤复发转移的关系;其中,图3A示TMS在总体I期NSCLC患者中的密度分布图;图3B示在早期转移的患者中,TMS显著更低(P=6e‑09);图3C示TMS预测I期NSCLC术后早期转移的ROC曲线,AUC=0.869;
[0030] 图4示TMS预测TCGA数据库I期NSCLC患者无疾病生存期;其中,图4A示TMS与TCGA队列中I期NSCLC无疾病生存期无关;图4B示在TCGA队列I期LUAD患者中,TMS高的患者无疾病生存期显著缩短;图4C示在TCGA队列I期LUSC患者中,TMS与无疾病生存期无关;
[0031] 图5示IS的建立与评估;其中,图5A示IS建立的示意图;图5B示不同水平IS的早期复发转移率;图5C示早期转移的患者IS显著更低(P=0.0003);IS,免疫评分;
[0032] 图6示Logistic回归建立结合TMS和IS转移风险模型及其列线图;其中,图6A示Logistic回归中TMS和IS为I期NSCLC术后早期复发转移的独立危险因素(P<0.0001),而组织学类型和TMB与早期转移无关;图6B示TMS和IS的联合预测模型的列线图;图6C示列线图使用例子,如患者TMS=0.4,对应的Points为50,IS=2,对应的Points为约为14,两个分数相加Totalpoints约为64,对应的术后发生肿瘤早期复发转移的风险接近90%;
[0033] 图7示ROC曲线和拟合曲线评价本发明模型;其中,图7A示模型在训练集中的ROC曲线,AUC=0.935;图7B示模型在训练集中的拟合曲线;图7C示模型在内部验证集中的ROC曲线,AUC=0.935;图7D示模型在内部验证集中的拟合曲线。

具体实施方式

[0034] 本发明公开了基因的应用、预测I期非小细胞肺癌术后复发转移的模型及其构建方法,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明的方法及应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。
[0035] 本发明首次结合MUC4,KRTAP10‑6,ZFHX4,TCF20,PRDM7,MEOX2,NPIPB5,FAM173B,ACP2,SCN5A,NSRP1等11个基因建立肿瘤突变评分。本发明首次结合TMS和IS建立模型,并且建立列线图,用于预测I期NSCLC的术后复发转移风险。特别提供了建立TMS的方法,以及结合TMS和IS作为风险预测模型。
[0036] 本发明针对I期NSCLC,结合基因突变和免疫微环境建立了术后早期复发转移风险模型,该模型纳入了早期复发转移相关的基因突变和免疫特征,在验证集和训练集中均具有很好的预测价值。比较现有的临床预测模型,本发明的模型是一个综合基因及免疫微环境两方面特征的模型,考虑了更多因素,更加全面。另外本模型是针对I期NSCLC特别开发的模型,现有的模型大部分是针对早期(I‑III期)NSCLC,很少将I期NSCLC区分出来。
[0037] 本发明中TMS是根据MUC4,KRTAP10‑6,ZFHX4,TCF20,PRDM7,MEOX2,NPIPB5,FAM173B,ACP2,SCN5A,NSRP1等11个基因计算得到的,不同的基因有不同的系数,稍微更改系数也可能不会对TMS的预测效果有显著影响,如:MUC4基因的系数是1.0509288,将改系数更改为1.05092879也可以计算得到几乎一样的TMS。因此,更改11个基因的系数获得的方案也均在本发明的保护范围之内。同理,最终的logistic模型中,更改TMS和IS的系数也在本发明的保护范围之内。
[0038] 本发明公开了一种预测I期非小细胞肺癌术后早期复发转移的列线图模型及其建立方法。本发明通过全外显子测序和LASSO回归分析基因突变与预后的关系并构建肿瘤突变评分(tumor mutation score,TMS),通过免疫组化分析肿瘤浸润性CD3+和CD8+T细胞与预后的关系并构建免疫评分(immune score,IS),结合TMS、IS,我们建立了转移风险模型,并构建了相应的列线图。本发明的模型简单、直观,易于推广,能有效地帮助临床医生预测I期NSCLC患者是否会出现术后早期复发转移,从而为患者的监测和治疗提供理论指导。
[0039] 本发明提供的基因的应用、预测I期非小细胞肺癌术后复发转移的模型及其构建方法中,所用原料及试剂均可由市场购得。
[0040] 下面结合实施例,进一步阐述本发明:
[0041] 实施例1患者临床病理资料
[0042] 收集I期NSCLC患者临床病理组织和随访信息,将患者分为早期转移组(复发转移时间短于3年)和未转移组(超过5年未发现复发转移)
[0043] 表1.患者临床病理特征表
[0044]
[0045]
[0046] 由表1可知,组织学类型为腺癌(P=0.008)的患者复发转移风险显著更高。其余临床病理特征,包括年龄、性别、病理分级、肿瘤大小、胸膜侵犯、TNM分期与复发转移风险都没有显著差异。
[0047] 实施例2 TMS的建立及评估
[0048] 2.1患者基因突变特征
[0049] 如图1所示,在完成WES的患者中共检测到1708种体细胞突变基因,其中未转移组628种,转移组1130种,150种基因突变在两组均存在。在总体人群中,TP53是突变频率最高的基因(25.0%),其次是MUC4基因突变(24.3%)。在早期转移组中,MUC4是突变频率最高的基因(39.0%),在未转移组中,突变频率最高的基因是TP53(25.6%)。
[0050] 2.2 TMS的建立
[0051] 本发明通过LASSO回归(又称套索回归)筛选复发转移风险相关的突变基因,共发现11个基因突变状态与转移风险相关(图2)。该11个基因的计算公式为:TMS=1.0509288×MUC4突变状态+0.26744718×KRTAP10‑6突变状态+0.1652883×MEOX2突变状态+0.07419074×NPIPB5突变状态+0.07250511×FAM173B突变状态‑0.07430707×ACP2突变状态+0.24224709×PRDM7突变状态‑0.03014324×SCN5A突变状态+0.23401033×TCF20突变状态+0.24224673×ZFHX4突变状态‑0.10444693×NSRP1突变状态‑0.13372265(突变型为
1,野生型为0,系数范围在‑0.2到1.1)。
[0052] 2.3 TMS与复发转移的关系
[0053] 如图3所示TMS在总体人群的分布在‑0.24到1.2之间,高TMS与高复发转移风险显著相关,并且ROC曲线提示TMS对复发转移事件有很好的预测作用(AUC=0.869),临界值为‑0.097,即当患者TMS大于‑0.097时预测患者会出现术后复发转移,否则不会。
[0054] 2.4 TCGA数据库进行验证TMS
[0055] 本发明从TCGA数据库中筛选出I期NSCLC患者,应用第3步得到的公式,计算每位患者的TMS,根据ROC曲线中得到的临界值(‑0.097)作为分界值将患者分为高TMS人群和低TMS人群,分析TMS与无疾病生存期的关系。如图4所示,在总体的NSCLC人群中,高TMS的患者无疾病生存期有缩短的趋势,但是未达到统计学差异(P=0.13),但是在LUAD中,高TMS的患者无疾病生存期显著缩短(P=0.034),在肺鳞癌人群中,则趋势不明显(P=0.34),即TMS未能很好地预测患者无疾病生存期。
[0056] 实施例3 IS的建立及评估
[0057] 3.1 CD3,CD8及免疫评分评价标准
[0058] ①CD3,CD8染色清楚,细胞形态完整,呈棕黑色或棕黄色颗粒。
[0059] ②肿瘤中心阳性细胞密度:在10×20倍放大情况下选取肿瘤中心密度最高和最低的视野,在Image Pro Plus 6软件中计算单位面积下(每平方毫米)的阳性细胞数的平均值;
[0060] ③浸润边缘阳性细胞密度:视野倍数及计算方式同肿瘤中心,浸润边缘的选取方式是肿瘤组织和正常组织的交界处,肿瘤组织和正常组织各占一半;
[0061] 3.2建立IS
[0062] 本发明将肿瘤中心和浸润边缘的CD3+、CD8+T细胞分为高低两组,并以此给每位患者建立IS:有一个位置的免疫细胞高就给1分,如果两个位置的两种免疫细胞都高浸润则给4分(图5A)。本发明发现IS高的患者复发转移风险显著降低(图5B‑C)。
[0063] 实施例4复发转移风险模型的建立及评估
[0064] 本发明将患者随机分为两组:70%的患者作为训练集用于建立logistic回归模型,30%患者作为验证集验证模型。
[0065] 4.1建立模型
[0066] 结合临床病理特征,通过logistic回归我们发现只有TMS和IS是独立危险因素(图6A),我们再次使用logistic回归建立了仅由IS和TMS构成的模型:
[0067] 复发转移风险值=TMS×6.55658858436019‑IS×0.748938863395558+0.767461882293273(系数范围在‑0.8到7.0)。图6B展示了最终模型的列线图:图中第一行为分值标尺,分值范围为0~100;第二行为TMS,若为TMS等于‑0.4则得0分,TMS等于1.2则得
100分;三行为IS,4对应标尺0分,3对应标尺8分,2对应13分,1对应21分,0对应29分;第四行为总分值,范围为0~130分,第五行为复发风险,范围为0.1~0.9分。列线图中,第二行(TMS)和第三行(IS)为两个危险因素,在TMS和IS中做垂线到第一行即可得到两个因素不同状态对应第一行标尺不同分值(Points),第四行总分值(Totalpoints)等于TMS和IS得分之和,第四行做垂线到第五行即可得到对应的复发风险。例如,一个患者TMS=0.4,对应的Points为50,IS=2,对应的Points约为14,两个分数相加Totalpoints为64,转移风险值为
1.89,而对应的复发转移风险(Recurrence risk)为接近0.9,上述结果表明:根据该患者TMS和IS检测结果,判断他术后发生肿瘤复发转移的风险接近90%。
[0068] 4.2评估模型
[0069] 本发明将130例患者通过R软件中caret包分为训练集(70%,91例)和验证集(30%,29例),通过logistic回归在训练集中建立TMS和IS联合预测模型,在验证集中验证模型性能。本发明通过R软件pROC包进行ROC曲线分析,发现在训练集中模型的区分度、特异度、灵敏度分别为0.935、0.930和0.796,在验证集中模型的区分度、特异度和灵敏度分别为0.932、0.889、0.850,这表明该模型在训练集和验证集中都有很好的预测性能。另外,根据ROC曲线,本发明模型在训练集和验证集的最佳临界点分别为‑0.091和0.295,本发明采用训练集中的临界点,即当患者复发转移风险值大于‑0.091时,本模型预测患者会出现术后早期复发转移,否则预测不转移。本发明通过R软件中rms包绘制拟合曲线,发现模型拟合度良好。上述结果说明本发明的模型最I期NSCLC患者复发转移事件有很好的临床预测作用(图7)。
[0070] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。