用于肺癌预后的基因及其应用转让专利

申请号 : CN201310115930.7

文献号 : CN103205433B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杜祥周晓燕王志敏危平王丽莎王懿琴徐清华

申请人 : 复旦大学附属肿瘤医院上海人类基因组研究中心

摘要 :

本发明公开了一组用于肺癌预后的基因,包括SEQ?ID?No.13~SEQ?ID?No.24所示核苷酸序列的基因。此外,本发明还公开了上述基因组的应用,包括在制备用于肺癌预后的基因芯片中的应用,以及在制备用于肺癌预后的试剂和中的应用。本发明有助于提高结肺癌患者术后的生存率。在肺癌患者接受根治性手术后,即可通过对上述基因芯片的检测和联合分析,快速判断出该患者术后死亡的危险度,从而能够对死亡危险度较高的患者及早地进行辅助治疗,帮助延长患者的生存时间。

权利要求 :

1.一组用于肺癌预后的基因在制备用于肺癌预后的基因芯片中的应用,所述一组用于肺癌预后的基因,其为SEQ ID No.13~SEQ ID No.24所示核苷酸序列的基因的组合,所述基因芯片包括固相载体和探针,其特征在于,所述探针与待测SEQ ID No.13~SEQ ID No.24所示基因序列进行杂交,所述探针是SEQ ID No.1~SEQ ID No.12所示序列。

2.一组用于肺癌预后的基因在制备用于肺癌预后的试剂盒中的应用,所述一组用于肺癌预后的基因,其为SEQ ID No.13~SEQ ID No.24所示核苷酸序列的基因的组合,其特征在于,所述试剂盒包含:与SEQ ID No.13~SEQ ID No.24所示基因序列进行杂交的探针,所述探针是SEQ ID No.1~SEQ ID No.12所示序列。

说明书 :

用于肺癌预后的基因及其应用

技术领域

[0001] 本发明涉及肺癌的预后领域,主要是肺癌术后死亡危险度的预测。更具体而言,涉及一种用于肺癌预后的基因及其应用。

背景技术

[0002] 肺癌是我国最常见的恶性肿瘤之一,近年来发病率逐年上升。肺癌在全球范围内也属于常见恶性肿瘤,发病率和死亡率居恶性肿瘤的第一位(Jemal A,Siegel R,Xu J,Ward E.Cancer statistics,2010.CA Cancer J Clin.2010;60(5):277-300.)。肺癌包括小细胞肺癌、腺癌、鳞癌等多种病理类型,其中腺癌是最为常见的肺癌类型,其特点为容易出现术后远处转移,恶性程度高、预后差。尽管多年来从分子水平认识肺癌的发生发展为肺癌的治疗和预防创造了条件,各种新的诊治方法和药物层出不穷,但是肺癌的治疗效果并没有取得同步提高,其总的五年生存率仅在10%左右。在目前的临床实际工作中,大部分临床医师对肺癌治疗是基于临床分期、患者的功能状态、病理分型、药物不良反应的评价等临床因素来制定肺癌个体化治疗,是基于循证医学基础上的规范化治疗。组织病理学诊断是肿瘤诊断的金标准和临床治疗的基础。肺癌的组织病理学分型和临床分期是目前肺癌的临床预后指标。然而即使同为非小细胞肺癌,甚至TNM分期相同的肺腺癌,采用同样的治疗方案却会产生截然不同的治疗效果和毒副反应。事实上,由于肺癌是一类分子水平上高度异质性的疾病,组织学形态相同的肿瘤,其分子遗传学改变不尽一致,从而导致了肺癌治疗反应和预后的差别,因此对其进行分子分型是肺癌个体化治疗的必然要求。分子分型对于预测肿瘤进展或复发转移风险,预测肿瘤预后,指导肿瘤治疗方式具有重要的临床意义。

发明内容

[0003] 本发明要解决的技术问题是提供一组用于肺癌预后的基因及其应用,能对肺癌患者术后的生存情况进行预测,有助于提高结肺癌患者术后的生存率。
[0004] 为解决上述技术问题,本发明采用如下技术方案:
[0005] 在本发明的一方面,提供一组用于肺癌预后的基因,包括SEQ ID No.13~SEQ ID No.24所示核苷酸序列的基因。
[0006] 在本发明的另一方面,提供一组用于肺癌预后的基因在制备用于肺癌预后的基因芯片中的应用,所述基因芯片包括固相载体和探针,所述探针与待测SEQ ID No.13~SEQ ID No.24所示基因序列和/或其互补序列进行杂交。
[0007] 所述探针包括下列三组核苷酸序列之一:
[0008] (1)SEQ ID No.1~SEQ ID No.12所示序列;
[0009] (2)SEQ ID No.1~SEQ ID No.12所示序列中每条序列的互补链;
[0010] (3)与SEQ ID No.1~SEQ ID No.12所示的序列中每条序列有至少70%同源性的序列。
[0011] 优选的,所述探针包括SEQ ID No.1~SEQ ID No.12所示序列。
[0012] 在本发明的另一方面,提供一组用于肺癌预后的基因在制备用于肺癌预后的试剂盒中的应用,所述试剂盒包含:与SEQ ID No.13~SEQ ID No.24中至少一个基因序列进行杂交的探针。
[0013] 所述探针包括下列三组核苷酸序列之一:
[0014] (1)SEQ ID No.1~SEQ ID No.12所示序列;
[0015] (2)SEQ ID No.1~SEQ ID No.12所示序列中每条序列的互补链;
[0016] (3)与SEQ ID No.1~SEQ ID No.12所示的序列中每条序列有至少70%同源性的序列。
[0017] 优选的,所述探针包括SEQ ID No.1~SEQ ID No.12所示序列。
[0018] 本发明通过多基因计算模型预测肺癌患者术后死亡危险度的检测方法,主要包括以下步骤:
[0019] (1)收集肺癌患者的手术切除癌组织标本;
[0020] (2)提取组织的RNA样本;
[0021] (3)纯化组织的RNA样本;
[0022] (4)RNA质量控制:用Alignent2100生物分析仪检测抽提的总RNA的质量及完整性;
[0023] (5)通过全基因表达谱(Affymetrix公司GeneChip Human Genome U133Plus2.0)检测,发现12个探针在生存组和死亡组样本中存在差异表达(所述探针为SEQ ID No.1~SEQ ID No.12所示序列);
[0024] (6)计算上述12个探针的基因表达权重,通过预测死亡危险度计算公式对患者术后预后进行评价;预测死亡危险度计算公式如下:C为权重值的常数,C=339.277;B为每个基因的权重系数;X为每个基因在四分类方法中的赋值;y=C+(B1*X1…B12*X12),P=EXP(y)/((1+EXP(y))。根据计算的P值来预测复发的可能性:P<0.5生存;P>0.5死亡。所述探针的表达计算所得概率越大,该患者术后的死亡率越高。
[0025] 为解决上述技术问题,本发明人等反复进行研究,通过基因表达谱芯片得到的12个基因模型,用于预测肺癌患者的术后死亡风险。模型的建立包括以下步骤:采集肺癌患者的手术切除标本;抽提并纯化RNA;检测78例肺癌组织的全基因表达谱,结果筛选出12个基因,针对该12个基因设计了12个探针,通过生物信息学分析得出在死亡组和生存组样本中存在差异表达的该12个特异性探针,以用于预测术后死亡风险;通过计算公式得出每个探针的表达权重,进而评价该患者术后死亡的可能性大小。本发明还公开了由上述探针组成的探针组,以及包含该探针组的计算过程及公式。本发明通过对癌组织的全基因组表达谱的检测,通过对12个差异探针的联合分析,来快速判断肺癌患者术后死亡危险度,从而可以在术后及早筛查出死亡风险较高的肺癌患者,并对其进行积极的辅助治疗,以提高结肺癌患者术后的生存率,延长患者的生存时间。

附图说明

[0026] 图1是本发明实施例中差异表达的12个探针聚类分析结果图。

具体实施方式

[0027] 以下实施例仅用于说明本发明,而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,按照制造试剂盒生产公司所建议的条件或按照常规实验条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件。
[0028] 1、实验对象
[0029] 本实施例的研究对象选择2007年1月—2011年4月间复旦大学附属肿瘤医院组织库RNA later保存的肺癌组织共78例。纳入及排除标准:
[0030] (1)新发肺癌患者(需以手术标本的病理诊断为标准);
[0031] (2)年龄18-65岁之间,病理诊断为腺癌;
[0032] (3)临床分期:I-III期;
[0033] (4)患者手术前未接受放射性治疗、化学药物治疗及分子靶向药物治疗,术后采用相同或相近的放化疗方案治疗。
[0034] (5)无其他器官肿瘤病史;无肺癌家族史。
[0035] 2、实验方法
[0036] 采集上述78例患者的手术切除癌组织标本,用Qiagen公司的RNeasy Mini Column Kit,按照试剂盒的说明,抽提RNA样本。抽提后的RNA样本保存在-70℃的深低温冰箱中。
[0037] 用Qiagen公司的QIAGEN Rneasy Kit纯化试剂盒,按照试剂盒的说明,对抽提的RNA进行纯化。用Aligent2100生物分析仪,检测抽提的总RNA的质量及完整性。
[0038] 用美国Affymetrix公司的GeneChip Human Genome U133Plus2.0寡核苷酸芯片;该芯片含有47000个探针组(probe sets),代表迄今所知的人类全基因及表达序列标签(expressed sequence tags,ESTs)共38500个。按照Affymetrix全基因表达谱芯片操作说明规定的标准操作步骤,对纯化后的78个RNA样本进行全基因组表达谱的检测。
[0039] 采用激光共聚焦荧光扫描仪扫描芯片,用QuantArray R分析软件读取数据,分辨率Seanresolution为10um,PMT为100%,采用Genespring进行标准化处理分析,得出Cy3和Cy5标记的强度值,计算Ratio值为Cy3/Cy5。结果分析:(1)RNA提取结果良好;(2)Cy3和Cy5信号荧光强度必须有一个>800;(3)Ratio(Cy3/Cy5)比值>2或<0.5,判断为有表达变化的基因数据。
[0040] 3、结果分析
[0041] 结合78例患者的临床随访结果,按照是否死亡分类,生存组53例,死亡组25例,我们针对肺癌术后生存/死亡个体进行全基因组表达谱分析,遵循下面原则筛选出12个探针:(1)fold change≥1.5或≤0.67;(2)生存和死亡组织基因表达量至少有一组60%样品达到sig>100;(3)P≤0.01。为了去除极值的影响,我们将所有探针的表达值进行四分法分类分别赋值为1、2、3、4;进一步进行二分类Logistic回归分析(我们分析时不将1、2、3、4看作亚变量分析,仍看作连续变量)后我们筛选得到12个探针模型。探针名称、对应基因及权重系数见表1。根据每个基因表达量进行权重后,得出预测生存情况的计算公式。
具体预测计算公式如下:C为权重值的常数,C=339.277;B为每个基因的权重系数;X为每个基因在四分类方法中的赋值;y=C+(B1*X1…B12*X12),P=EXP(y)/((1+EXP(y))。根据计算的P值来预测复发的可能性:P<0.5生存;P>0.5死亡。从预测公式可以看出,B值为正数的基因表达量越高,术后发生肿瘤死亡的危险度就越高;反之,B值为负数的基因表达量越高,术后发生肿瘤死亡的危险度就越小。实际观测值与预期结果比较见表2。表2是用该公式实际预测本次实验中所有样本的死亡或生存情况。本次实验共有死亡病例25例,非死亡病例53例,在预测过程中,根据计算的P值来预测复发的可能性:P<0.5生存;P>0.5死亡。
实际检测结果显示25例死亡病例P值均大于0.5,53例生存病例P值均小于0.5,12个探针模型对预测本组肺癌生存情况的准确性为100%。
[0042] 聚类分析结果见图1,图1是用随机方差模型筛选死亡组与非死亡组的差异基因的聚类分析图。在图1中,最上方是聚类树状图,可以看出死亡的样本和非死亡的样本基本各自聚成一类。由图1可知,定义死亡为阳性事件:真阳性23例,假阳性27例,真阴性26例,假阴性2例,灵敏度=真阳性/(真阳性+假阴性)=92%,特异度=真阴性/(真阴性+假阳性)=49.06%,阳性准确率=真阳性/(真阳性+假阳性)=46%,阴性准确率=真阴性/(真阴性+假阴性)=93%。该图的分析结果表明,12个探针模型对预测本组结肺癌死亡的阳性准确率为46%,阴性准确率为93%,即判读为非死亡的常规治疗即有非常好的疗效,而判读为死亡的应该进行治疗方案的优化。
[0043] 表1本发明中的12个探针及基因名称
[0044]
[0045]
[0046] 表2实际观测值与预期结果比较
[0047] Classification Tablea
[0048]
[0049] a.The cut value is.500
[0050] 模型的拟合度非常高(Hosmer和Lemeshow检验要比较的是实际观察频数与预测期望频数之间的差异是否有显著性,其统计量服从卡方分布。一般认为P值大表示模型拟合较好,最大为1,我们的结果为1)。
[0051] 表3
[0052] Hosmer and Lemeshow Test
[0053]
[0054] 4、在预后判断中的应用
[0055] 采集待检结肺癌患者的手术切除癌组织标本,按照前述方法,抽提、纯化RNA样本,并利用基因表达谱技术,检测上述12个特异性探针在该患者肿瘤组织RNA样本中的表达,然后,计算每个探针表达量,再根据预测模型公式,评价该待检患者在手术后死亡的危险度。