一组标志物组合及其在预测AML病患预后中的应用转让专利

申请号 : CN202110680875.0

文献号 : CN113373228B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郭祥瑞高洁官士兵

申请人 : 山东第一医科大学附属省立医院(山东省立医院)

摘要 :

本发明提供了一组标志物组合及其应用。所述标志物组合包括ERRFI1、EGFR、SDC2、PPP1R3C、PYGM和GPC3基因;优选地,所述标志物组合是EGFR、PYGM和GPC3的组合。所述标志物组合可以应用于预测白血病患者的预后;优选地,所述白血病是急性髓细胞白血病。

权利要求 :

1.检测标志物组合的表达量的试剂在制备预测急性髓性白血病预后的产品中的应用,所述标志物组合是EGFR、PYGM和GPC3的组合。

2.如权利要求1所述的应用,所述表达量包括mRNA表达量或蛋白表达量。

3.如权利要求2所述的应用,所述产品中还包括处理样品的试剂。

4.如权利要求1所述的应用,所述预后的指标包括客观缓解率、总体存活率、无进展生存期、疾病进展时间、无病生存期、治疗失败时间、应答率。

5.如权利要求4所述的应用,其特征在于,所述预测疾病预后的指标是总体存活率。

6.如权利要求5所述的应用,其特征在于,所述预测疾病预后的指标是1年、3年或5年的总体存活率。

说明书 :

一组标志物组合及其在预测AML病患预后中的应用

技术领域

[0001] 本发明涉及生物技术领域,具体涉及一组标志物组合及其在预测AML病患预后中的应用。

背景技术

[0002] 急性髓细胞性白血病(Acute myeloid leukemia,LAML,AML),被定义为通过造血系统增殖,克隆,异常分化和偶尔分化差的治疗细胞渗透到骨髓,血液和其他组织中的一类癌症。AML是成人中最常见的急性白血病类型,约占病例的70%。超过四十年来,LAML的治疗标准并未发生显著变化,仍由阿糖胞苷加蒽环类药物作为基础药物的强化联合化疗组成。尽管大多数患者已实现缓解,但由于复发性疾病,高达70%的成年人和30%的儿童在最初临床治疗后的5年内将无法生存。这突显了对新治疗手段的迫切及其预后预测的需求,以使LAML患者能够持续康复。
[0003] 众所周知,在实体瘤中,肿瘤细胞的过度增殖会导致严重的缺氧,这可能影响肿瘤进展。同样,在血液系统恶性肿瘤中,有人认为细胞的异常增殖和积累会导致骨髓微环境中的低氧环境。有研究表明,低氧条件可触发白血病细胞走向分化,分化伴随着缺氧诱导因子蛋白表达水平及与DNA结合活性的增高,这种现象不依赖LAML亚型而广泛存在。
[0004] 目前,肿瘤缺氧的研究方法还很有限,且尚未在LAML中进行系统的缺氧基因的研究。这项研究首次使用了足量RNA‑Seq分析数据来开发低氧风险模型,作为预测LAML组的预后生物标志物。这种方法可能会帮助临床医生做出重要的治疗决策。
[0005] 在本研究中,我们下载了TCGA数据库中LAML的RNA‑Seq数据和临床数据。通过GSEA(hallmark‑hypoxia)获得200个缺氧基因。TCGA数据库中LAML的RNA‑Seq数据7:3分为训练集和验证集,对训练集利用单因素、多因素Cox回归分析筛选预后缺氧基因,并构建缺氧风险模型,检测其对LAML预后价值。最后我们采用验证集数据对缺氧风险模型进行验证,进一步确定缺氧风险模型的有效性。联合临床病理特征的关系验证其独立预后价值。

发明内容

[0006] 本发明提供了一组标志物组合及其应用。
[0007] 标志物组合
[0008] 一方面本发明提供了一种预测疾病预后的标志物组合,所述标志物组合包括ERRFI1、EGFR、SDC2、PPP1R3C、PYGM或GPC3基因。
[0009] 优选地,所述标志物组合包括EGFR、PYGM和GPC3。
[0010] 优选地,所述标志物组合是EGFR、PYGM和GPC3的组合。
[0011] 优选地,所述EGFR是与人第7号染色体的第55,019,017~55,211,628位的序列有至少90%同源性的序列。
[0012] 优选地,所述PYGM是与人第11号染色体的第64,746,389~64,760,715位的序列有至少90%同源性的序列。
[0013] 优选地,所述GPC3是与人X染色体的第133,535,745~133,985,616位的序列有至少90%同源性的序列。
[0014] 优选地,所述至少90%是指90%,91%,92%,93%,94%,95%,96%,97%,98%,99%和100%。
[0015] 所述标志物组合中的EGFR的基因序列是人第7号染色体的第55,019,017‑55,211,628位。
[0016] 所述标志物组合中的PYGM的基因序列是人第11号染色体的第64,746,389‑64,760,715位。
[0017] 所述标志物组合中的PYGM的基因序列是人X染色体的第133,535,745‑133,985,616位。
[0018] 优选地,所述标志物组合还包括其他基因。
[0019] 优选地,所述其他基因包括结构基因和/或非结构基因。
[0020] 优选地,所述非结构基因包括顺式作用元件和/或反式作用元件。
[0021] 优选地,其他基因是白血病融合基因。
[0022] 优选地,所述白血病融合基因包括BCR‑ABL(b2a2)、BCR‑ABL(b3a2)、BCR‑ABL(e1a2)、E2A‑PBX1、TEL‑AML1、MLL‑AF4(e10/e4)、CBFB‑MYH11(A type)、AML1‑ETO、PML‑RARA(L form)、PML‑RARA(S form)、AML1/MPSI/EV11、DEK/CAN、AML1/MTG8。
[0023] 优选地,所述疾病包括急性髓细胞白血病(AML,LAML)、急性淋巴细胞白血病(ALL)、急性早幼粒细胞白血病(APL)、慢性淋巴细胞白血病(CLL)、慢性粒细胞白血病(CML)、慢性嗜中性粒细胞白血病(CNL)、急性未分化细胞白血病(AUL)、幼淋巴细胞白血病(PML)、幼年型粒‑单核细胞白血病(JMML)、成人T细胞急性淋巴细胞白血病、急性髓系白血病伴三系病态造血(AML/TMDS)、混合血系白血病(MLL)、急性单核细胞性白血病(AMOL)。
[0024] 优选地,所述疾病是急性髓细胞白血病。
[0025] 优选地,所述预后的指标包括客观缓解率(Objective Response Rate,ORR)、总体存活率(Overall survival rate,Overall survival,OS)、无进展生存期(progression‑free survival,PFS)、疾病进展时间(time to progress,TTP)、无病生存期(Disease‑free survival,DFS)、治疗失败时间(time to treatment failure,TTF)、应答率(RR)、完全应答(CR)、部分应答(PR)。
[0026] 优选地,所述预后的指标是总体存活率(Overall survival rate,Overall survival,OS)。
[0027] 优选地,所述预后的指标是1~10年的总体存活率。具体地,所述1~10年是1年、2年、3年、4年、5年、6年、7年、8年、9年、10年。
[0028] 优选地,所述预后的指标是1年、3年或5年的总体存活率。
[0029] 预测疾病预后的试剂
[0030] 另一方面本发明提供了一种用于预测前述疾病预后的试剂。
[0031] 优选地,所述试剂包括检测前述标志物组合中每个基因各自的表达量所需的试剂。
[0032] 优选地,所述试剂包括反转录试剂、血液抽提试剂、内参引物、用于指示DNA合成量的荧光物质、qPCR反应缓冲液、dNTPs、DNA聚合酶、TRIZOL试剂、氯仿、异丙醇、水(包括无RNA酶水)、反转录酶、反转录缓冲液、DNA聚合酶、dNT、Mg2+。
[0033] 优选地,所述DNA聚合酶包括Taq、Bst、Vent、Phi29、Pfu、Tru、Tth、Tl1、Tac、Tne、Tma、Tih、Tf1、Pwo、Kod、Sac、Sso、Poc、Pab、Mth、Pho、ES4DNA聚合酶、Klenow。
[0034] 优选地,所述试剂还包括处理样品的试剂。
[0035] 优选地,所述处理样品包括提取样品中的mRNA和/或提取并纯化蛋白质。
[0036] 优选地,所述试剂包括TRIZOL试剂,氯仿,异丙醇,DEPC水,反转录酶,无RNA酶水,反转录缓冲液,Taq酶,dNTP,Mg2+。
[0037] 优选地,所述试剂包括与前述标志物组合中各个基因所表达的蛋白特异结合的抗体。
[0038] 优选地,所述抗体可以与可检测标记物连接。
[0039] 优选地,所述可检测标记物包括放射性同位素、荧光团、化学发光部分、酶、酶底物、酶辅因子、酶抑制剂、染料、金属离子、配体(如,生物素或半抗原)、或它们的任合组合。
[0040] 优选地,所述抗体包括捕获抗体和检测抗体。
[0041] 优选地,所述捕获抗体固定于载体上,用于捕获样品中的蛋白质。
[0042] 优选地,所述载体包括孔板、滤膜、玻片。
[0043] 优选地,所述试剂还包括检测内参基因表达量的试剂。
[0044] 改善疾病预后的药物组合物
[0045] 另一方面本发明提供了一种用于改善前述疾病预后的药物组合物。
[0046] 优选地,所述药物组合物包括能改变前述标志物组合中每个基因表达量的成分。
[0047] 优选地,所述改变前述标志物组合中每个基因表达量的方法包括但不限于基因编辑法、细胞移植方法、CAR细胞疗法。
[0048] 优选地,所述组合物还包括药学上可接受的载体、稀释剂或赋形剂。
[0049] 优选地,所述药学上可接受的载体、稀释剂或赋形剂包括但不限于已经由美国食品和药品管理局或中国食品药品监督管理局批准可用于人或家畜的任何佐剂、载体、赋形剂、助流剂、甜味剂、稀释剂、防腐剂、染料/着色剂、增味剂、表面活性剂、润湿剂、分散剂、悬浮剂、稳定剂、等渗剂、溶剂、表面活性剂或乳化剂。
[0050] 预测疾病预后列线图
[0051] 另一方面本发明提供了一种预测疾病预后的列线图(nomogram,诺莫图),所述列线图包括若干个的变量。
[0052] 优选地,所述若干是1‑10个。
[0053] 优选地,所述若干是1个或2个。
[0054] 优选地,所述变量包括风险评分和/或临床因素。
[0055] 优选地,所述风险评分是根据前述标志物组合的表达量计算而来。
[0056] 优选地,所述风险评分(riskcscore)的计算公式是:
[0057] riskcscore=(‑6.872126744×EGFR表达量)+(0.379061788×PYGM表达量)+(0.244755593×GPC3表达量)。
[0058] 优选地,所述风险评分的取值范围是‑2~3。
[0059] 优选地,所述临床因素包括人口学信息和/或体检数据。
[0060] 优选地,所述人口学信息包括年龄、性别、居住地、民族、宗教信仰,家庭月收入、文化程度、婚姻状况、居住状况、子女情况及孝顺程度和医疗保险状况。
[0061] 优选地,所述体检数据包括体温、脉搏、呼吸、心律、血压、疼痛状况(疼痛状况采用数字分级法)、睡眠状况、自我感觉疾病严重程度、体力评分和卡氏功能状态评分;
[0062] 优选地,所述临床因素是年龄。
[0063] 优选地,所述年龄变量的取值范围是20~90。
[0064] 优选地,所述列线图包括总分值标尺。
[0065] 优选地,所述总分值取值范围为0~180。
[0066] 优选地,所述列线图包括变量分值标尺。
[0067] 优选地,所述变量分值标尺取值范围为0~100。
[0068] 优选地,所述列线图还包括linear predictor。
[0069] 优选地,所述列线图还包括患者生存概率变量。
[0070] 优选地,所述生存概率变量均为连续性变量。
[0071] 优选地,所述生存概率变量包括1‑10年生存概率变量。具体地,所述1~10年是1年、2年、3年、4年、5年、6年、7年、8年、9年、10年。
[0072] 优选地,所述生存概率变量选自1年生存概率变量,3年生存概率变量和5年生存概率变量中的一种或多种。
[0073] 优选地,所述生存概率变量包括1年生存概率变量,3年生存概率变量和5年生存概率变量。
[0074] 具体地,1年生存概率变量指晚期乳腺癌患者可生存1年的概率,3和5生存概率变量同理。
[0075] 优选地,所述列线图的分布为:分值标尺、每个变量、总分值标尺以及生存概率变量在列线图中各占一行。
[0076] 打分规则:
[0077] 优选地,所述变量均包括若干个变量取值。
[0078] 优选地,所述变量取值均有对应前述变量分值标尺上的一个分值。
[0079] 优选地,所述生存概率变量均包括一个变量取值范围,所述生存概率变量的变量取值范围均有对应所述总分值标尺上的一个分值范围。
[0080] 使用该列线图时:根据患者的情况在所述列线图的每个变量中选择取值后,将每一个被选择的变量取值的分值相加得到总分值,在总分值标尺上对应该总分值的生存概率变量,从而可以预测患者的预后情况。
[0081] 计算疾病风险评分的方法
[0082] 另一方面本发明提供了一种计算疾病风险评分的方法,所述风险评分是根据前述标志物组合的表达量计算而来。
[0083] 优选地,所述风险评分(riskcscore)的计算公式是:
[0084] riskcscore=(‑6.872126744×EGFR表达量)+(0.379061788×PYGM表达量)+(0.244755593×GPC3表达量)。
[0085] 优选地,所述风险评分可以预测前述疾病的预后。
[0086] 预测疾病预后的方法
[0087] 另一方面本发明提供了一种预测前述疾病预后的方法,所述方法包括检测前述标志物组合中每个基因各自的表达量的步骤。
[0088] 优选地,所述检测方法包括定性地、定量地、或半定量的方法。
[0089] 优选地,所述表达量包括mRNA表达量或蛋白表达量。
[0090] 优选地,所述表达量mRNA的检测方法包括基于PCR的定量检测方法、Southern杂交、Northern杂交、点杂交、荧光原位杂交(FISH)、DNA微阵列、ASO法、高通量测序平台。
[0091] 优选地,所述基于PCR的定量检测方法包括将mRNA逆转录为cDNA的步骤和/或测量cDNA的含量的步骤。
[0092] 优选地,所述测量cDNA的含量的方法包括但不限于PCR、NASBA、RPA、SDA、LAMP、HAD、NEAR、MDA、RCA、LCR、RAM。
[0093] 优选地,所述蛋白表达量的检测方法包括酶联免疫吸附测定(ELISA)、放射性免疫测定(RIA)、夹心测定、蛋白质印迹、免疫沉淀、免疫组织化学染色、流式细胞术、荧光辅助的细胞分选(FACS)、酶底物显色测定和抗原‑抗体聚集、质谱法、免疫组化染色、免疫沉淀分析法、补体结合分析法、流式细胞荧光分边技术和蛋白质芯片。
[0094] 优选地,所述方法包括收集样品的步骤。
[0095] 优选地,所述样品包括:血液、血清、血浆、尿液、唾液、精液、乳汁、脑脊髓液、泪液、痰、粘液、淋巴、胞液、腹水、胸膜积液、羊水、膀胱冲洗液和支气管肺泡灌洗液。
[0096] 优选地,所述样品来自于被诊断为患有癌症的患者。
[0097] 构建预测疾病预后的列线图的方法
[0098] 另一方法,本发明提供了一种构建预测疾病预后的列线图的方法,所述方法使用R包分析患者的风险评分和/或临床因素与疾病预后的关系,输出列线图。
[0099] 优选地,所述风险评分是根据前述标志物组合的表达量计算而来。
[0100] 优选地,所述临床因素是年龄。
[0101] 预测疾病预后的产品
[0102] 另一方法,本发明提供了一种预测疾病预后的产品,所述产品包括前述列线图。
[0103] 优选地,所述产品还包括前述试剂。
[0104] 应用
[0105] 另一方法,本发明提供了EGFR、PYGM和GPC3中的一种或多种在预测疾病预后中的应用。
[0106] 另一方法,本发明提供了EGFR、PYGM和GPC3中的一种或多种在构建预测预测疾病预后的列线图中的应用。
[0107] 另一方法,本发明提供了前述标志物组合、前述试剂、前述列线图或前述产品在制备预测疾病预后的产品中的应用;
[0108] 另一方面,本发明提供给了前述标志物组合或其计算而得到的风险评分在构建预测疾病预后的列线图中的应用。

附图说明

[0109] 图1是训练集缺氧相关基因单因素Cox分析的森林图。
[0110] 图2是训练集缺氧相关基因多因素Cox分析的森林图。
[0111] 图3是对本发明标志物组合中的3个基因进行的Spearman相关性分析。
[0112] 图4是TCGA‑LAML训练集中高低风险分组的风险曲线;上图是按照风险得分(risk score)高低对患者进行高地风险分组;中图是按照风险得分(风险评分得分)记录患者的存活时间;下图为高低风险组的基因表达热图。
[0113] 图5是TCGA‑LAML训练集中高低风险分组的生存曲线。
[0114] 图6是TCGA‑LAML训练集中1、3、5年的ROC曲。
[0115] 图7是TCGA‑LAML验证集中高低风险分组的风险曲线。
[0116] 图8是TCGA‑LAML验证集中高低风险组的生存曲线。
[0117] 图9是TCGA‑LAML验证集中1、3、5年的ROC曲线。
[0118] 图10是TCGA‑SKCM不同临床信息下的生存和表达分析。
[0119] 图11是风险基因的表达与临床特征的相关性。
[0120] 图12是单因素Cox独立预后分析。
[0121] 图13是多因素Cox独立预后分析。
[0122] 图14是列线图预测患者1、3和5年生存。
[0123] 图15是列线图1、3和5年矫正曲线。

具体实施方式

[0124] 下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
[0125] 实施例1、构建模型
[0126] Cox回归模型,又称“比例风险回归模型(proportional hazards model,简称Cox模型”),是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。模型以生存结局和生存时间为应变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于上述优良性质,该模型自问世以来,在医学随访研究中得到广泛的应用,是迄今生存分析中应用最多的多因素分析方法。
[0127] 单因素Cox分析
[0128] 为了评估缺氧相关的基因是否和急性髓细胞样白血病患者的生存相关,我们在TCGA‑LAML急性髓细胞样白血病表达数据中提取了缺氧相关基因的表达数据(FPKM),然后与临床数据合并得到TCGA‑LAML急性髓细胞样白血病样本的临床表达数据,随机将TCGA‑LAML急性髓细胞样白血病样本临床表达数据7:3分为训练集和验证集,在训练集中做单因素Cox和多因素Cox回归分析,以验证这些基因是否是危险因素。最终利用单因素和多因素Cox回归得到风险回归模型,以此评估患者的风险(风险评分)分数。在训练集中筛选单因素Cox分析中pvalue<0.05的基因得到6个与预后相关的缺氧相关基因,单因素Cox分析结果见表1。
[0129] 表1训练集缺氧相关基因单因素Cox回归分析结果
[0130]
[0131] 如图1所示,单因素Cox分析中P值小于0.05的变量共有6个,包括ERRFI1、EGFR、SDC2、PPP1R3C、PYGM和GPC3基因,此六个基因可用于评估患者的预后。HR为危险比,HR大于1代表危险因素,HR小于1代表保护因素。
[0132] 多因素Cox分析
[0133] 单因素Cox分析中P值小于0.05的变量共有6个,包括ERRFI1、EGFR、SDC2、PPP1R3C、PYGM和GPC3基因(表1)。然后将单因素Cox分析中将单因素检验P值小于0.05的变量纳入多因素Cox分析,随后使用逐步回归函数step(),参数direction设置‘both’,对多因素回归模型进行调整。逐步回归分析是以AIC信息统计量为准则,通过选择最小的AIC信息统计量,来达到删除或增加变量的目的,其主要作用是得到当前最优的回归方程。多因素Cox分析的结果如表2所示。
[0134] 表2训练集缺氧相关基因多因素Cox分析结果
[0135]
[0136] 如图2所示,多因素Cox分析中P值小于0.05的变量共有3个,包括EGFR、PYGM和GPC3基因,此三个基因可用于评估患者的预后。
[0137] 模型基因间相互关系
[0138] 我们对单因素和多因素Cox得到的3个缺氧相关的风险回归模型基因进行了Spearman相关性分析(图3),从图中可知这3个模型基因的Spearman相关性很低。
[0139] 实施例2、预后风险模型的评估和验证
[0140] 根据单因素和多因素Cox得到的风险回归模型,对急性髓细胞样白血病患者进行打分,得到每个患者的风险值,以风险评分中位值为界,将急性髓细胞样白血病患者分为高风险组和低风险组。根据风险模型绘制风险曲线图(图4),风险曲线图由上、中、下三部分图组成,上图和中图中横坐标一致,为根据风险得分高低进行排序的患者样本,从左到右风险得分依次增大;纵坐标分别为风险得分和生存时间。虚线为风险得分中位值及其对应的病人数量。下图为高低风险组的基因表达热图。
[0141] 根据高低风险分组绘制OS(Overall survival)生存曲线,结果见图5。从图中可以看到高低风险组间病人的生存情况有显著差异(p<0.05),高风险组的病人生存率更低。
[0142] 为进一步评估风险模型的有效性,采用ROC计算模型的AUC面积以评估模型的有效性。ROC曲线是一种显示分类模型在所有分类阈值下的效果的图表。该曲线绘制了以下两个参数:真阳性(True positive rate)和假阳性(False positive rate)。曲线下方部分的面积被称为AUC(Area Under Curve),用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,表示预测准确率越高。根据多因素风险回归得到的风险模型,以1、3、5年为生存时间节点,绘制ROC曲线,结果见图6。可以看到ROC曲线的AUC均大于0.6,风险模型的效能较好。
[0143] 构建风险模型后,我们使用验证集对风险模型进行验证,我们同样对验证数据绘制风险曲线(图7)、高低风险组生存曲线(图8)和ROC曲线(图9),可以看到验证集数据中同样高风险组在生存率低,且ROC曲线中1、3、5年节点的AUC均大于0.6,与训练集结果一致。
[0144] 实施例3、风险模型与临床因素相关性分析
[0145] 为进一步研究临床病理特征与风险模型的预后情况,将age(年龄)、gender(性别)临床病理因素与风险模型进行生存和表达相关性分析(图10,11),比较不同临床信息下的生存和表达是否有显著差异,我们发现风险评分在年龄、性别的不同分组之间无显著差异,但是年龄不同分组之间生存存在显著差异,而性别不同分组之间的生存无显著差异。
[0146] 所以风险模型与年龄存在相关性,可以相互结合用于患者预后的预测。
[0147] 实施例4、风险模型的独立预后价值
[0148] 为进一步研究临床病理特征与风险模型的预后情况,将age(年龄)、gender(性别)这2个临床病理因素纳入风险模型进行单因素Cox独立预后分析(图12),结果显示age和riskScore的pvalue均小0.05。因此将age和riskScore临床因素纳入风险模型进行多因素Cox独立预后分析(图13)。
[0149] 结果显示在单因素和多因素Cox独立预后分析中age和riskScore的pvalue均小于0.05。说明本发明的风险模型以及年龄均可作为患者的独立预后因素。说明本发明的风险模型也可以与年龄因素结合使用,同样有预后价值。
[0150] 实施例5、急性髓细胞样白血病患者生存列线图的构建及验证
[0151] 将风险模型的独立预后价值步骤中多因素Cox独立预后分析中pvalue小于0.05因素用于构建列线图,列线图对age和riskScore因素分别进行打分,每一种因素对应一个评分,各因素总评分相加对应总评分,然后根据总评分预测1、3和5年生存率(图14),分数越高,生存率越。
[0152] 基于上述预测模型绘制列线图绘制校准曲线(图15),斜率越接近1,说明预测越准确。结果得知模型对患者1年、3年和5年生存率的预测准确度较高,说明构建的预测模型可作为有效模型。