用于预测肺鳞癌患者预后的系统转让专利

申请号 : CN201510744997.6

文献号 : CN106442990B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张学敏周涛靳宝锋

申请人 : 中国人民解放军军事医学科学院生物医学分析中心

摘要 :

本发明公开了种用于预测肺鳞癌患者预后的系统,包括检测EGFR、p38α、AKT1、SOX2和E‑cadherin五种蛋白质表达量的系统和蛋白质表达量数据处理系统。检测上述五种蛋白质表达量的系统通过免疫组织化学染色方法测定蛋白质的表达量;蛋白质表达量数据处理系统将来自待预测肺鳞癌患者的分离的肺鳞癌组织中所述五种蛋白质表达量转换为预后分值,根据预后分值预测待肺鳞癌患者的预后。

权利要求 :

1.用于预测肺鳞癌患者预后的系统,包括检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统。

2.根据权利要求1所述用于预测肺鳞癌患者预后的系统,其特征在于:所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统包括通过免疫组织化学染色方法检测所述五种蛋白质的表达量所需的试剂和/或仪器。

3.根据权利要求1或2所述预测肺鳞癌患者预后的系统,其特征在于:所述用于预测肺鳞癌患者预后的系统包括蛋白质表达量数据处理系统,所述蛋白质表达量数据处理系统用于将来自待预测肺鳞癌患者的分离的肺鳞癌组织中所述五种蛋白质表达量转换为所述待预测肺鳞癌患者的预后分值,根据所述待预测肺鳞癌患者的预后分值预测所述待预测肺鳞癌患者的预后。

4.权利要求1或2中所述的检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统在制备预测肺鳞癌患者预后的系统中的应用。

5.根据权利要求4所述的应用,其特征在于:所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统包括通过免疫组织化学染色方法测定所述五种蛋白质的表达量所需的试剂和/或仪器。

6.权利要求1或2中所述的检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统和权利要求3中所述蛋白质表达量数据处理系统在制备预测肺鳞癌患者预后的系统中的应用。

7.根据权利要求6所述的应用,其特征在于:所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统包括通过免疫组织化学染色方法测定所述五种蛋白质的表达量所需的试剂和/或仪器。

8.EGFR、p38α、AKT1、SOX2和E-cadherin五种蛋白质作为标志物在制备预测肺鳞癌患者预后的产品中的应用。

说明书 :

用于预测肺鳞癌患者预后的系统

技术领域

[0001] 本发明涉及生物医学领域,具体涉及用于预测肺鳞癌患者预后的系统。

背景技术

[0002] 肺癌是当今世界上癌症相关死亡中最常见的原因,而其中80%为非小细胞肺癌(NSCLC)。TNM分期是目前为人们所普遍接受的临床分期系统,被用于预测预后并指导非小细胞肺癌患者的治疗。然而,目前的TNM分期系统远不足以准确预测非小细胞肺癌患者的预后情况。比如,对于肺癌患者来说,即使处于临床Ⅰ期,肺癌的复发率也高达35-50%。另外,相当一部分患者仅靠手术方式即能治愈,这些病人应该可以避免基于当前TNM系统而进行辅助性化疗所带来的极强副反应。
[0003] 为了提高对非小细胞肺癌患者预后的预测效果,人们已经投入了极大努力去鉴定和识别其相关的分子标志物谱。很多研究肺癌的团队都曾报道过具有不同预后能力的基因表达谱。然而,到目前为止还没有一个基因表达谱应用于非小细胞肺癌临床预后的预测。
[0004] 肺鳞癌又称肺鳞状上皮细胞癌,占原发性肺癌的40%~51%,多见于中老年男性,与吸烟有密切关系。主要是由支气管黏膜柱状上皮细胞化生后形成的,包括支气管上皮细胞受慢性刺激和损伤、纤毛丧失、基底细胞鳞状化生或典型增生等。肺鳞癌以中央型肺癌多见,并有胸管腔内生长的倾向,肺鳞癌早期常引发支气管狭窄,或阻塞性肺炎。肺鳞癌的恶性程度变异较大,一般来说与其他几种肺癌相比,鳞癌生长较为缓慢,往往发现时肿瘤已经生长较大。

发明内容

[0005] 本发明所要解决的技术问题是如何对肺鳞癌患者进行预后预测。
[0006] 为解决上述技术问题,本发明首先提供了用于预测肺鳞癌患者预后的系统,包括检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统。
[0007] 上述用于预测肺鳞癌患者预后的系统中,所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统可包括通过免疫组织化学染色方法测定所述五种蛋白质的表达量所需的试剂和/或仪器。
[0008] 上述用于预测肺鳞癌患者预后的系统中,所述用于预测肺鳞癌患者预后的系统包括包括蛋白质表达量数据处理系统,所述蛋白质表达量数据处理系统用于将来自待预测肺鳞癌患者的分离的肺鳞癌组织(手术切除的肺鳞癌组织)中所述五种蛋白质表达量转换为所述待预测肺鳞癌患者的预后分值,根据所述待预测肺鳞癌患者的预后分值预测所述待预测肺鳞癌患者的预后。
[0009] 上述用于预测肺鳞癌患者预后的系统中,所述蛋白质表达量数据处理系统内设模块1-a和模块1-b,所述模块1-a用于将来自待预测肺鳞癌患者的分离的肺鳞癌组织中所述五种蛋白质表达量转换为所述待预测肺鳞癌患者的预后分值,所述模块1-b用于根据所述待预测肺鳞癌患者的预后分值预测所述待预测肺鳞癌患者的预后。
[0010] 所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统在制备预测肺鳞癌患者预后的系统中的应用也属于本发明的保护范围。
[0011] 所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统和蛋白质表达量数据处理系统在制备预测肺鳞癌患者预后的系统中的应用也属于本发明的保护范围;所述蛋白质表达量数据处理系统为上述任一所述蛋白质表达量数据处理系统。
[0012] 上述应用中,所述检测EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量的系统可包括通过免疫组织化学染色方法测定所述五种蛋白质的表达量所需的试剂和/或仪器。
[0013] 上述用于预测肺鳞癌患者预后的系统中,所述五种蛋白质均来自于人(Homo sapiens)。
[0014] 上述用于预测肺鳞癌患者预后的系统中,所述肺鳞癌患者为经手术切除肺鳞癌组织的肺鳞癌患者。
[0015] 上述用于预测肺鳞癌患者预后的系统中,检测上述五种蛋白质的表达量的系统具体可为免疫组织化学染色方法测定上述五种蛋白质的表达量所需的试剂和/或仪器,如EGFR的单克隆抗体或多克隆抗体、p38α的单克隆抗体或多克隆抗体、AKT1的单克隆抗体或多克隆抗体、SOX2的单克隆抗体或多克隆抗体和E-cadherin的单克隆抗体或多克隆抗体。
[0016] 为解决上述技术问题,本发明还提供了一种预测肺鳞癌患者预后的方法。
[0017] 本发明所提供的预测肺鳞癌患者预后的方法,包括:C、检测来自待预测肺鳞癌患者的分离的肺鳞癌组织样本的EGFR、p38α、AKT1、SOX2和E-cadherin这五种蛋白质表达量;D、将所述五种蛋白质表达量转换为所述待预测肺鳞癌患者的预后分值,根据所述待预测肺鳞癌患者的预后分值预测所述待预测肺鳞癌患者的预后。
[0018] 上述方法中,预后分值也可以通过“组合分子标志物筛选及模型构建软件”(软件著作权登记号为2014SR142190)获得。
[0019] 上述方法中,所述五种蛋白质表达量可根据免疫组织化学染色方法获得。
[0020] 上述方法中,所述分离的肺鳞癌组织样本可来自所述待预测肺鳞癌患者的分离的肺鳞癌组织经过福尔马林固定石蜡包埋制备的样本或来自所述待预测肺鳞癌患者的分离的肺鳞癌组织的冰冻切片。
[0021] 上述方法中,所述五种蛋白质表达量转换为所述待预测肺鳞癌患者的预后分值的方法可包括将所述五种蛋白质表达量转化为蛋白质表达量向量,将所述蛋白质表达量向量代入公式1得到f(v),将f(v)代入公式2,得到所述待预测肺鳞癌患者的预后分值;
[0022] 所述公式1为:
[0023] 所述公式1中,v是蛋白质表达量向量,简称向量,sv_coef(i)是支持向量的系数,SV(i)是支持向量;
[0024] 所述公式2为:
[0025] 所述公式2中,prob(v)为待预测肺鳞癌患者的预后分值。
[0026] 所述蛋白质表达量向量以v表示,v=(xAKT1,xE-cadherin,xEGFR,xp38α,xSOX2)。
[0027] 上述方法中,根据所述待预测肺鳞癌患者的预后分值预测所述待预测肺鳞癌患者的预后可为通过受试者工作特征曲线(ROC曲线)确定诊断阈值,比较所述待预测肺鳞癌患者的预后分值和所述诊断阈值的大小,如果所述待预测肺鳞癌患者的预后分值小于或等于所述诊断阈值,所述待预测肺鳞癌患者的预后不良,如果所述待预测肺鳞癌患者的预后分值大于所述诊断阈值,所述待预测肺鳞癌患者的预后良好。
[0028] 预后判断也可通过“非小细胞肺癌预后判断软件”(软件著作权登记号为2014SR157070)获得。
[0029] 所述通过受试者工作特征曲线确定诊断阈值是以具有统计学意义数量的正常肺组织中所述五种蛋白质表达量为对照,根据具有统计学意义数量的肺鳞癌组织中所述五种蛋白质表达量和相应的肺鳞癌患者分组信息制作受试者工作特征曲线,ROC曲线上的最优值为阈值;所述分组信息是肺鳞癌患者从手术切除肺鳞癌组织开始存活的时间,3年以上(大于等于3年)为一组,不足3年(小于3年)为一组;所述最优值是在特异性最大的基础上敏感性尽可能地大。
[0030] 为解决上述技术问题,本发明还提供了D1)和/或D2)中的应用:
[0031] D1)EGFR、p38α、AKT1、SOX2和E-cadherin五种蛋白质作为标志物在预测肺鳞癌患者预后中的应用;
[0032] D2)EGFR、p38α、AKT1、SOX2和E-cadherin五种蛋白质作为标志物在制备预测肺鳞癌患者预后的产品中的应用。
[0033] 本发明还提供了一种产生肺鳞癌相关蛋白质特征谱的方法,包括检测来自TNM I-III期肺鳞癌患者的分离的肺鳞癌组织样本中EGFR、p38α、AKT1、SOX2和E-cadherin五种蛋白质表达量的步骤。
[0034] 本申请中所述肺鳞癌患者可为TNM I-III期肺鳞癌患者。进一步,本申请中所述肺鳞癌患者具体可为TNM IB-IIIA期肺鳞癌患者。
[0035] 本申请中所述预后不良是从手术切除肺鳞癌组织时间开始存活时间不足3年,所述预后良好是从手术切除肺鳞癌组织时间开始存活时间为3年及3年以上。
[0036] 本申请中所述待预测肺鳞癌患者的分离的肺鳞癌组织可为手术切除的肺鳞癌组织。
[0037] 本申请中所述EGFR在NCBI的记录名(RecName)为受体酪氨酸蛋白激酶ErbB-1(Receptor Tyrosine-Protein Kinase ErbB-1);所述p38α在NCBI的记录名(RecName)为丝裂原活化蛋白激酶14(Mitogen-activated protein kinase 14);所述AKT1在NCBI的的记录名(RecName)为V-Akt的小鼠胸腺瘤病毒癌基因同源1(V-Akt Murine Thymoma Viral Oncogene Homolog 1);所述SOX2在NCBI的记录名(RecName)为性别决定区Y框蛋白2(SRY(Sex Determining Region Y)-Box 2);所述E-cadherin在NCBI的记录名(RecName)为1型钙粘蛋白(Cadherin 1,Type 1,E-Cadherin(Epithelial))。
[0038] 本发明中,肺肿瘤组织样本中北京大学人民医院有88名鳞癌患者病例满足样本入选标准,将其作为北京鳞癌样本群,将北京鳞癌样本群命名为BJ鳞癌群。在BJ鳞癌群中随机选择三分之二的样本(58例)作为鳞癌训练组,另三分之一的样本(30例)作为鳞癌测试组。肺肿瘤组织样本中重庆西南医院有82名鳞癌患者病例符合样本入选标准,将其作为重庆独立验证鳞癌样本群,将重庆独立验证鳞癌样本群命名为CQ鳞癌群。通过对鳞癌训练组样本的组织微阵列(TMA)进行免疫组化(IHC)染色,我们分析了75个在肿瘤发生发展过程中起关键作用的信号蛋白质的表达水平。通过随机森林算法和支持向量机算法的结合,得到了肺鳞癌(ADC)相关蛋白质的特征谱并开发出分类模型,即5-蛋白质模型。然后用鳞癌测试组样本和CQ鳞癌群对P5-ADC预后鳞癌方法进一步进行验证。
[0039] 结果表明,由五个蛋白质EGFR、p38α、AKT1、SOX2和E-cadherin组成的P5-ADC成套蛋白质为准确预测肺鳞癌的蛋白质特征谱。在鳞癌测试组中,预后良好组患者的3年生存率为72.7%(置信区间为37.1%-90.3%),而预后不良组患者的3年生存率为16.7%(置信区间为4.1%-36.5%),预后良好组和预后不良组间风险比为7.67(置信区间为3.96-39.34);在CQ鳞癌群,预后良好组患者的3年生存率为97.6%(置信区间为83.6%-99.7%),而预后不良组患者的3年生存率为29.3%(置信区间为16.4%-43.4%),两组间风险比为2.81(置信区间为1.65-6.05)。Cox回归分析表明,鳞癌相关蛋白质的特征谱的效能优于TNM分级系统并可作为独立的预后因子。
[0040] 结果还表明,本发明所提供的P5-ADC预后鳞癌方法可准确预测肺鳞癌的临床预后情况,显著提高了肺鳞癌患者的预后预测水平;P5-ADC预后鳞癌方法还对TMN分级的鳞癌患者进一步预后。

附图说明

[0041] 图1为P5-ADC预后鳞癌方法的确立和效能验证。
[0042] 其中A为鳞癌训练组的ROC曲线;B为鳞癌训练组的预后;C为鳞癌测试组的预后;D为BJ鳞癌群的预后分值分布、预后预测结果、鳞癌特征谱及患者试剂生存状态总图;E为CQ鳞癌群的预后;F为CQ鳞癌群的预后分值分布、预后预测结果、鳞癌特征谱及患者试剂生存状态总图。
[0043] 图2为P5-ADC预后鳞癌方法对临床TMN分级的鳞癌患者的预后。
[0044] 其中A为TMNⅠB期鳞癌患者的预后;B为TMNⅡ期鳞癌患者的预后;C为TMNⅢA期鳞癌患者的预后。

具体实施方式

[0045] 下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
[0046] 下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0047] 下述实施例中所涉及的名词解释:
[0048] 预后良好:从手术切除肿瘤时开始,患者生存时间超过3年。
[0049] 预后不良:从手术切除肿瘤时开始,患者在3年内死亡。
[0050] 总生存期(OS):从接受肺癌根治性外科手术到任何原因造成的死亡或最近一次随访之间的时间段。
[0051] 总体生存率:一个群体特定时间点时的存活率。
[0052] 受试者工作特征曲线(receiver operating characteristic curve,简称ROC曲线):是根据一系列不同的二分类方式(分界值或决定阈),以灵敏度(真阳性率)为纵坐标,1-特异性(真阴性率)为横坐标绘制的曲线。ROC曲线下面积是重要的试验准确度指标,ROC曲线下面积越大,试验的诊断价值越大。
[0053] 灵敏度(真阳性率):实际有病而按试验标准被正确判断为有病的百分率,灵敏度越大越好,理想灵敏度为100%。
[0054] 1-特异性(真阴性率):实际无病而按试验标准被正确判断为无病的百分率,特异性越大越好,理想特异度为100%。
[0055] 实施例1、鳞癌相关蛋白质特征谱的发现、组合分子标志物模型、非小细胞肺癌预后判断、P5-ADC预后鳞癌方法及有效性的验证
[0056] 1、鳞癌相关蛋白质特征谱的发现
[0057] 1.1、病例及样品
[0058] 所述福尔马林固定和石蜡包埋的人正常肺组织样本,由北京大学人民医院和西南医院组织库提供。所述福尔马林固定和石蜡包埋的肺肿瘤组织样本,由北京大学人民医院病理科和重庆西南医院病理科的组织库提供。肺肿瘤组织的提供者(即患者)在2004年到2010年期间在上述医院接受了肺癌根治性外科手术并有系统的。本发明不包括以下情况的病例:既往有恶性肿瘤的病例、在手术前接受过其他手段治疗的病例、手术不完全切除的病例、接受过表皮生长因子(EGFR)酪氨酸激酶抑制剂治疗的病例、小细胞肺癌的病例、存在被国际肺癌研究协会(IASIC)标准定义的浸润性癌前病变的病例以及那些术后30天内死亡的病例。根据世界卫生组织(WTO)采用的组织病理学分类系统,所有病例经苏木精-伊红(H&E)染色的病理切片,都再次进行集中审查,并确认肿瘤类型、组织学分级以及肿瘤转移程度。
临床及随访信息来自于医院的前瞻性病例数据库。
[0059] 肺肿瘤组织样本中北京大学人民医院有88名鳞癌患者病例满足样本入选标准,将其作为北京鳞癌样本群,将北京鳞癌样本群命名为BJ鳞癌群。在BJ鳞癌群中随机选择三分之二的样本(58例)作为鳞癌训练组,另三分之一的样本(30例)作为鳞癌测试组。肺肿瘤组织样本中重庆西南医院有82名鳞癌患者病例符合样本入选标准,将其作为重庆独立验证鳞癌样本群,将重庆独立验证鳞癌样本群命名为CQ鳞癌群。
[0060] 1.2、制备组织芯片
[0061] 将鳞癌训练组的石蜡包埋肺肿瘤组织样本逐一做切片,H&E染色做形态学观察,将病变的典型位置标记出来作为穿刺点,然后用环钻装置穿刺肺肿瘤组织蜡块(直径2毫米)得到肺肿瘤组织蜡芯。
[0062] 将石蜡包埋的人正常肺组织样本做切片,H&E染色标记出作为穿刺点,然后用环钻装置穿刺正常肺组织蜡块(直径2毫米)得到正常肺组织蜡芯。
[0063] 将上述肺肿瘤组织蜡芯和正常肺组织蜡芯一一配对,转移至受体蜡块的阵列中排列,得到组织芯片。
[0064] 每个受体蜡块包含一张组织芯片,每张组织芯片包含30个鳞癌病例。
[0065] 1.3、免疫组化染色及化学评分
[0066] 将上述1.2制备的组织芯片进行免疫组化染色,具体步骤为:A:烘片、脱蜡与洗片:将组织阵列蜡块连续切成4微米厚切片并固定在载玻片上,载玻片经过2小时60℃烘烤后,通过二甲苯、梯度乙醇和水依次进行有序浸泡、脱蜡,PBS(pH7.4)洗片3次,每次3min;B:抗原恢复:将切片95℃进行抗原修复15min;C:加入3%过氧化氢室温处理30min阻断内源性过氧化物酶活性;D:加入10%正常山羊血清封闭非特异蛋白质,切片在4℃与75种抗体孵育过夜;E:按照ABC试剂盒(Vector Laboratories公司产品)步骤进行增强处理、加入二抗以及DAB显色;F:苏木精染色,切片冲洗干净并封片。免疫组化分析时使用的部分抗体为:抗EGFR的抗体(兔源单抗、出售公司Epitomics、产品号#1902-1)、抗p38α的抗体(兔源多抗、出售公司Santa Cruz、产品号SC-535)、抗AKT1的抗体(兔源单抗、出售公司Epitomics、产品号#
1085-1)、抗SOX2的抗体(兔源单抗、出售公司Epitomics、产品号#2696-1)和抗E-cadherin的抗体(鼠源单抗、出售公司BD、产品号610182)。
[0067] 免疫组化染色评价采用改良型免疫组织化学评分(组织病理染色评分)系统进行。该系统通过对病理切片的染色强度以及阳性细胞的百分比定量赋分后进行评估,其中依据染色强度可定义为0分、1分、2分、3分,分别对应于染色阴性、染色弱阳、染色中阳及染色强阳;同时,统计每个强度阳性细胞的百分比。所有的免疫组化染色切片均经3位专业的病理学家平行评估,且事先不了解患者的临床信息。若3位病理学家对切片的解读有分歧,3位病理学家将一起对该切片重新评估,直到达成共识。化学评分计算公式为:每种蛋白质的表达分值=1×弱阳性百分率+2×中阳性百分率+3×强阳性百分率。
[0068] 1.4、蛋白质表达谱的数据处理
[0069] 蛋白质特征谱的数据处理:根据上述1.3的方法逐一评估每个蛋白质的表达分值,将表达分值首先归一化处理,缺失值被所有肿瘤中该蛋白质表达的中间值替代,然后计算出每个蛋白质的分值和鳞癌训练组的该蛋白质平均值的表达比,之后表达水平以表达比的log10(表达比)量化。为了避免对数中0的出现,所有分数都加上0.01。
[0070] 1.5、鳞癌相关蛋白质的特征谱
[0071] 将鳞癌训练组应用随机森林算法得到各个蛋白质的重要性指标。使用袋外数据[out-of-bag(OOB)]误差最小化准则,依次消减最不重要的蛋白质,较小OOB误差的若干蛋白质即作为肺鳞癌相关蛋白质的特征谱。上述过程是通过在随机森林软件包上使用R varSelRF包程序实现的。
[0072] 支持向量机(SVM)是用来开发带特征谱的训练组的分类模型。选择径向基函数(RBF)内核进行SVM训练,因为当类特征谱与属性之间非线性时,通过非线性映射样品到高维空间,内核可以处理这些情况。RBF内核的两个参数C和γ都可以使用网格搜索策略进行调谐。分类模型经SVM的最优C和γ训练而成。在训练阶段,SVM的性能通过5倍交叉验证精度进行评估。
[0073] 1.6、统计分析
[0074] 由于患者的死因难以完全准确定义,使用特定的生存点作为生存终点可能带来潜在偏离,因此我们以从手术切除肿瘤时间开始的总生存作为我们主要的分析事件。用Kaplan-Meier分析患者总体生存率。用双侧对数秩(two-sided log-rank)检验分析预后良好患者的生存时间、预后不良患者的生存时间以及辅助化疗的效能。相关的变量,包括鳞癌相关蛋白质的特征谱确定、患者年龄、吸烟指数、组织学类型、肿瘤大小和疾病阶段等,都通过单变量和多变量Cox比例风险分析的结果进行比较。Wald似然比(Wald likelihood ratio)检验应用于检验单变量和多变量分析,以评估是否具有统计学意义。Cox比例风险分析和双侧对数秩检验同时也用于比较是否接受辅助性化疗的患者之间的总体生存率。所有的统计测试,以预设的双侧α小于0.05视为有统计学意义。上述分析都是在R编程语言(3.0.2版本)下完成。
[0075] 根据上述1.1—1.6的方法,本发明以鳞癌训练组为样本,通过检测与肿瘤发生发展密切相关的75个信号蛋白质的表达水平发现肺鳞癌相关蛋白质的特征谱。肺鳞癌相关蛋白质的特征谱包括五种蛋白质,五种蛋白质的名称分别为EGFR、p38α、AKT1、SOX2和E-cadherin。肺鳞癌相关蛋白质的特征谱以下简称鳞癌特征谱。将这五种蛋白质EGFR、p38α、AKT1、SOX2和E-cadherin组成的成套蛋白质命名为P5-ADC。
[0076] 2、组合分子标志物模型和非小细胞肺癌预后判断
[0077] 2.1、组合分子标志物模型
[0078] 将发现的肺鳞癌特征谱采用支持向量机算法开发分类模型,该模型全称为组合分子标志物模型,简称为5-蛋白质模型。再对每个患者的预后评分进行计算,预后分值代表了5-蛋白质模型中每个蛋白质的综合信息。
[0079] 上述5-蛋白质模型可以十分简单明确的应用于临床。5-蛋白质模型的使用方法为:⑴对于每个肺鳞癌患者使用免疫组化的方法检测5个标志物蛋白质的表达分值;⑵5个蛋白质分子的表达水平采用下列公式进行归一化:
[0080] fs(x)=-1+2·(x-lower)/(upper-lower);
[0081] 公式中x是质控标准化后蛋白质分子的表达水平,每个蛋白质对应的Upper(上限)和Lower(下限)在表1中列出;
[0082] 表1.鳞癌标志物蛋白质分子归一化系数
[0083]Protein Lower Upper
AKT1 -1.131249036 0.211173644
E-cadherin -0.791163384 0.178873393
EGFR -1.212120146 0.250277851
p38α -0.970134933 0.352084361
SOX2 -0.650762327 0.639272285
[0084] ⑶得到5个蛋白质分子归一化的表达量后,每个患者可以表示为由该5个蛋白质分子组成的蛋白质分子向量v:v=(xAKT1,xE-cadherin,xEGFR,xp38α,xSOX2)。
[0085] ⑷将患者蛋白质分子向量v代入下列公式计算f(v):
[0086]
[0087] 其中,sv_coef(i)是支持向量的系数,SV(i)是支持向量(表2);
[0088] 表2.组合分子标志物模型中的支持向量和系数
[0089]
[0090]
[0091] ⑸将f(v)代入下列公式计算该患者的预后分值:
[0092]
[0093] 2.2、非小细胞肺癌预后判断
[0094] 阈值的获得:鳞癌特征谱的性能由receiver-operating characteristic(ROC)分析进行评估。以正常肺组织中P5-ADC的表达分值为对照,根据鳞癌训练组每个患者的P5-ADC的表达分值和患者的分组信息(分组信息是指患者从手术切除时间开始存活的时间,3年以上为一组,3年以下为一组;见表3)用SPSS 16.0软件进行ROC曲线分析。鳞癌训练组鳞癌特征谱ROC曲线下的面积(AUC)是0.913,表明在鳞癌训练组中该鳞癌特征谱可以准确的对预后进行预测(图1中A)。ROC曲线上的最优值即为阈值,综合考虑敏感性和特异性,是指在特异性最大的基础上灵敏度尽可能地大。基于这个方法,鳞癌训练组ROC曲线的最优值为0.597,即阈值为0.597。在鳞癌训练组的这一节点上,肺鳞癌特征谱显示出75.8%的灵敏度和96.0%的1-特异性,96.2%的阳性预测值和患者3年内死亡的总体精度为84.5%。
[0095] 表3.鳞癌训练组肺鳞癌相关蛋白质的表达分值和分组信息
[0096]No. 生存时间(月) AKT1 E-cadherin EGFR p38α SOX2
1 9.53 1.75 1.7 2.3 1.25 0
2 3.80 0 0.2 0.15 0.35 0
3 114.93 0 NA 0 NA 0
4 84.33 0.35 1.65 0 1.25 0
5 110.13 0.8 2.2 0.1 0.6 1.65
6 109.00 0 2.25 1.25 0.85 1.4
7 106.87 1.3 2.4 1.75 1.95 0
8 106.20 1.7 2.2 1.6 1.85 1.85
9 5.60 1.85 2.3 2.4 1.6 0
10 105.80 0 NA 1.45 1.3 0
11 16.23 1.5 2.5 2.4 1.3 0
[0097]12 21.50 1.95 1.85 2.1 0.3 0
13 103.17 1.4 2.45 1.6 1.85 0
14 103.13 1.35 2.4 1.6 0.9 1.8
15 17.23 1.8 2.25 2.1 0.65 0.35
16 101.50 1.35 NA 1.3 1.4 0
17 7.73 1.5 1.65 1.4 0.95 0
18 75.10 1.35 1.5 1.75 0.7 0
19 92.77 0.6 1.4 1.3 0.2 0
20 59.53 1.1 2.2 0 0.65 0.45
21 4.33 1.4 1.65 1.35 1.35 0
22 13.33 1.3 1.8 2.7 1 0.1
23 86.17 1.2 1.5 1.3 2 0
24 85.63 1.9 1.85 0.4 1.75 0
25 58.33 1.05 2.2 2 0.6 0
26 81.80 1.1 1.9 1.75 1.2 0
27 80.40 1.2 1.55 1.7 1.8 1.15
28 79.57 2 2.6 1.75 1.9 0
29 79.50 1.95 2.55 1.4 0.8 0.5
30 78.77 1.15 1.6 2.75 1.3 0.4
31 31.80 0.65 0.4 0.15 0.35 0
32 78.27 1.65 2.25 1.55 1.3 0.2
33 75.23 0.7 1.45 2.8 0.15 0
34 3.93 0.65 2.2 1.4 0.9 0
35 20.03 0.4 1.5 1.75 0.7 0.1
36 71.40 1.65 1.9 1.95 1.8 0.65
37 71.17 2.05 2.6 1.7 1 1.65
38 2.27 0.3 1.9 1.85 1.2 0
39 3.43 1.9 0.4 1.75 1.2 0
40 42.60 1.25 2.55 1.25 0.85 0
41 58.03 1.6 1.65 1.6 1.6 0
42 62.83 1.6 2.3 1.65 1.1 0
43 40.03 1.15 0.7 1.2 1.1 0.4
44 61.67 1.75 2.7 1.1 1.3 0.8
45 32.27 0.7 1.65 2.3 0.4 0
46 59.53 1.5 2.25 1.55 0.85 0
47 58.03 2.1 2.6 1.85 1.4 1.75
48 11.73 0 0.25 2.2 0.1 0
49 57.10 1.75 1.6 1.65 0.35 0.1
50 6.23 0.75 1.65 1.8 0.55 0
51 30.30 1.55 1.45 2.4 1.65 0
52 15.20 0.3 1.85 0.5 0 0.65
53 11.57 0.6 1.8 1.8 0.9 0.15
54 14.17 0.3 2.3 2 0.7 0
55 16.60 0.55 0.7 1.4 0.5 0
56 19.00 0 1.6 1.65 0.1 0.25
57 9.47 2 1.9 1.05 0.2 0.85
58 9.13 1.45 1.5 1.4 0.6 0
[0098] 注:“NA”表示无法得到数值。
[0099] 将步骤2.1得到的预后分值和阈值经比较分析后,得到预后良好或预后不良。比较分析结果判定标准如下:如果所述待测鳞癌患者的预后分值小于或等于阈值(即预后分值小于等于0.597),则判定该鳞癌患者预后不良;若预后分值大于阈值(即预后分值大于0.597),则判定该鳞癌患者预后良好。
[0100] 3、P5-ADC预后鳞癌方法
[0101] a、以待测鳞癌患者的肺肿瘤组织为检测样本,按照上述步骤1中所述方法进行免疫组化染色和化学评分,得到P5-ADC的表达分值;
[0102] b、按照步骤2.1的方法,得到预后分值;
[0103] c、将上述步骤b得到的预后分值按照步骤2.2的方法,得到预后良好或预后不良。
[0104] Kaplan-Meier生存分析显示在鳞癌训练组中预后良好组3年总体生存率为96.2%(置信区间为75.7%-99.5%),而预后不良组总体生存率为25.0%(置信区间为11.8%-40.7%)(P<0.0001,图1中B)。
[0105] 4、P5-ADC预后鳞癌方法有效性的验证
[0106] 4.1、以鳞癌测试组为样本,对步骤3中P5-ADC预后鳞癌方法的有效性进行验证。
[0107] 4.2、以CQ鳞癌群为样本,对步骤3中P5-ADC预后鳞癌方法的有效性进行独立验证。与上述4.1不同的是,进行蛋白质表达谱的数据处理时,只保留不超过2个缺失蛋白质读值的患者,对逐一评估CQ鳞癌群中鳞癌相关蛋白质的表达分值,将表达分值用鳞癌训练组和鳞癌测试组程序进行归一化处理,缺失值由BJ鳞癌群中该蛋白质表达的中值替代,然后计算出每个蛋白质的分值和CQ鳞癌群的该蛋白质平均值的表达比,之后表达水平以表达比的log10(表达比)量化。为了避免对数中0的出现,所有分数都加上0.01。
[0108] Kaplan-Meier生存分析结果表明,鳞癌测试组中预后良好组3年存活率达72.7%(置信区间为37.1%-90.3%),而预后不良组为16.7%(置信区间为4.1%-36.5%),预后良好组和预后不良组间风险比为3.51(置信区间为1.39-7.73)(P=0.008,图1中C);CQ鳞癌群中在预后良好组3年存活率达97.6%(置信区间为83.6%-99.7%),预后不良组3年存活率达29.3%(置信区间为16.4%-43.4%),两者间风险比为9.97,置信区间为4.46-17.99(P<0.001,图1中E)。
[0109] 将BJ鳞癌群的预后分值分布、预后预测结果、鳞癌特征谱以及患者的实际生存状态进行总结,实验结果见图1中D。预后分值与患者3年生存率的比较结果显示,鳞癌特征谱可以预测患者的预后情况。
[0110] CQ鳞癌群的预后评分分布、预后预测结果、鳞癌特征谱以及患者的实际生存状态都与BJ鳞癌群的相似(图1中F)。进一步证实步骤3的预后方法对鳞癌患者预后预测的有效性。
[0111] 为了进一步分析鳞癌特征谱能否作为一个独立的预后因子,我们用单变量和多变量Cox回归分析对模型和现有临床风险因子(包括病例分级、年龄、吸烟和组织学等)的预后价值进行比较。单变量分析结果显示,虽然该鳞癌特征谱和临床分级区分患者的预后均具有显著的统计学差异,但对3年总体生存率预测来说,鳞癌特征谱是一个相对更好的预后因子;多变量回归分析显示,在消除了病例分级、年龄、肿瘤大小和吸烟因素后,鳞癌特征谱仍可作为一个独立的的预后因子(表4)。
[0112] 表4.肺鳞癌模型在重庆样本群中的Cox比例风险分析
[0113]
[0114] 注:*预后不良组与预后良好组比较;+作为连续变量
[0115] 实施例2、P5-ADC预后鳞癌方法对TNM分级的鳞癌患者的进一步预后[0116] 对TNM分级的鳞癌患者的进一步预后的方法为:对经TNM分级的任何级别的鳞癌患者(如IB期鳞癌的患者),按照实施例1的方法获得P5-ADC的表达分值,然后将该表达分值按照实施例1步骤2.1的方法,得到预后分值;将各预后分值按照实施例1步骤2.2的方法,判定该鳞癌患者预后良好或预后不良。
[0117] 将BJ群和CQ群的样本整合得到总鳞癌样本,P5-ADC预后鳞癌方法能将总鳞癌样本中的每个患者在TNM分级基础上进一步分成预后不良组或预后良好组(IB期P<0.0001;II期P=0.0001;IIIA期P=0.0008)(图2)。结果表明,P5-ADC预后鳞癌方法可在TNM分级基础上,对鳞癌患者进一步进行预后。