用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突变负荷的方法及装置转让专利

申请号 : CN201811447772.4

文献号 : CN109767811B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张静波李孟键王建伟伍启熹刘倩刘珂弟唐宇

申请人 : 北京优迅医学检验实验室有限公司

摘要 :

本发明公开了一种用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突变负荷的方法及装置。其中,该构建方法包括:S1,筛选蛋白编码区域的同义突变和非同义突变,分别计算Nsyn和Nnon;S2,计算Ltarget,计算靶向区域肿瘤突变负荷同义突变项:Tsys=Nsyn/Ltarget,计算靶向区域肿瘤突变负荷非同义突变项:Tnon=Nnon/Ltarget;S3,建立多元线性模型,计算待测样本的肿瘤突变负荷TMB:TMB=a1Tsys+a2Tnon+a3log(Tnon)。应用本发明的技术方案,能够预测全外显子的肿瘤突变负荷,有效的降低成本,缩短周期。

权利要求 :

1.一种用于预测肿瘤突变负荷的线型模型的构建方法,其特征在于,包括以下步骤:S1,通过测序及序列分析获得待测样本的突变数据,筛选蛋白编码区域的同义突变和非同义突变,分别计算靶向区域的同义突变个数Nsyn和非同义突变个数Nnon;

S2,计算靶向区域的蛋白编码区域长度Ltarget,计算靶向区域肿瘤突变负荷同义突变项:Tsys=Nsyn/Ltarget,计算靶向区域肿瘤突变负荷非同义突变项:Tnon=Nnon/Ltarget;

S3,建立多元线性模型,计算待测样本的肿瘤突变负荷TMB:TMB=a1Tsys+a2Tnon+a3log(Tnon),其中,a1、a2和a3通过已有的数据库数据进行拟合得到。

2.根据权利要求1所述的构建方法,其特征在于,所述已有的数据库包括TCGA数据库。

3.一种预测肿瘤突变负荷的方法,其特征在于,包括以下步骤:S1,分别取得同一病人的肿瘤样本和正常样本并提取DNA;

S2,根据目标区域捕获原理使用探针捕获肿瘤相关基因;

S3,通过高通量的方法进行测序及序列分析,得到肿瘤样本的突变数据;以及S4,根据如权利要求1中所述的用于预测肿瘤突变负荷的线型模型的构建方法构建的线型模型预测肿瘤突变负荷TMB。

4.根据权利要求3所述的方法,其特征在于,所述S3还包括:选择高质量的测序序列,去除N含量大于5%的序列,去除含有接头的序列。

5.根据权利要求4所述的方法,其特征在于,所述S3中的序列分析包括:使用比对软件将肿瘤样本DNA与正常样本DNA比对到参考基因组,继而使用变异检测软件,检测得到所述肿瘤样本的突变数据。

6.根据权利要求4所述的方法,其特征在于,所述S4还包括:使用ANNOVAR软件对突变位点进行注释,得到靶向区域的同义和非同义突变,并分别计算其个数。

7.一种预测肿瘤突变负荷的装置,其特征在于,所述装置用于执行上述权利要求3至6中任一项所述的方法。

说明书 :

用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突

变负荷的方法及装置

技术领域

[0001] 本发明涉及生物医学技术领域,具体而言,涉及一种用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突变负荷的方法及装置。

背景技术

[0002] 肿瘤突变负荷(TMB)是指外显子编码区每兆碱基发生的非同义体细胞突变的个数,是预测免疫治疗效果的全新的生物标志物,具有良好的应用前景。体细胞突变会改变蛋白序列,产生新抗原。这些新抗原被自身免疫系统识别为非自身抗原,激活T细胞,引起免疫反应,因此肿瘤突变负荷高时就会产生更多的抗原,有利于免疫系统杀死肿瘤细胞。很多研究已经证明肿瘤突变负荷与免疫治疗效果是显著相关的。
[0003] 目前常用的肿瘤突变负荷检测方法是Lawrence团队2015年在Nature上提出的策略,通过计算全外显子组(平均深度<200X)的体细胞突变数目来判断肿瘤突变负荷状态。然而,这种方法是全外显子组测序,成本高,检测周期长。

发明内容

[0004] 本发明旨在提供一种用于预测肿瘤突变负荷的线型模型的构建方法、预测肿瘤突变负荷的方法及装置,以解决现有技术中肿瘤突变负荷检测方法需要进行全外显子组测序,成本高,检测周期长的技术问题。
[0005] 为了实现上述目的,根据本发明的一个方面,提供了一种用于预测肿瘤突变负荷的线型模型的构建方法。该构建方法包括以下步骤:S1,通过测序及序列分析获得待测样本的突变数据,筛选蛋白编码区域的同义突变和非同义突变,分别计算靶向区域的同义突变个数Nsyn和非同义突变个数Nnon;S2,计算靶向区域的蛋白编码区域长度Ltarget,计算靶向区域肿瘤突变负荷同义突变项:Tsys=Nsyn/Ltarget,计算靶向区域肿瘤突变负荷非同义突变项:Tnon=Nnon/ Ltarget;S3,建立多元线性模型,计算待测样本的肿瘤突变负荷TMB:TMB=a1Tsys+a2Tnon+ a3log(Tnon),其中,a1、a2和a3通过已有的数据库数据进行拟合得到。
[0006] 进一步地,已有的数据库包括TCGA数据库。
[0007] 根据本发明的另一方面,提供了一种预测肿瘤突变负荷的方法。该方法包括以下步骤: S1,分别取得同一病人的肿瘤样本和正常样本并提取DNA;S2,根据目标区域捕获原理使用探针捕获肿瘤相关基因;S3,通过高通量的方法进行测序及序列分析,得到肿瘤样本的突变数据;以及S4,根据如权利要求1中的用于预测肿瘤突变负荷的线型模型的构建方法构建的线型模型预测肿瘤突变负荷TMB。
[0008] 进一步地,S3还包括:选择高质量的测序序列,去除N含量大于5%的序列,去除含有接头的序列。
[0009] 进一步地,S3中的序列分析包括:使用比对软件将肿瘤样本DNA与正常样本DNA比对到参考基因组,继而使用变异检测软件,检测得到肿瘤样本的突变数据。
[0010] 进一步地,S4还包括:使用ANNOVAR软件对突变位点进行注释,得到靶向区域的同义和非同义突变,并分别计算其个数。
[0011] 根据本发明的再一方面,提供了一种预测肿瘤突变负荷的装置。该装置包括:装置用于存储或者运行的模块,或者模块为装置的组成部分;其中,模块为软件模块,软件模块为一个或多个,软件模块用于执行上述预测肿瘤突变负荷的方法。
[0012] 应用本发明的技术方案,通过靶向区域的肿瘤突变负荷预测全外显子的肿瘤突变负荷,有效的降低成本,缩短周期。

附图说明

[0013] 构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0014] 图1示出了实施例1中方法计算所得TMB与全外显子数据计算所得TMB的相关性图;以及
[0015] 图2示出了实施例1中方法所得TMB(549panel)和全外显子所得TMB(WXS)直观比较图;
[0016] 图3示出了实施例2中PM00G18**0228样本所得突变的缩略图。

具体实施方式

[0017] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
[0018] 根本发明一种典型的实施方式,提供一种用于预测肿瘤突变负荷的线型模型的构建方法。该方法包括以下步骤:S1,通过测序及序列分析获得待测样本的突变数据,筛选蛋白编码区域的同义突变和非同义突变,分别计算靶向区域的同义突变个数Nsyn和非同义突变个数Nnon; S2,计算靶向区域的蛋白编码区域长度Ltarget;计算靶向区域肿瘤突变负荷同义突变项:Tsys=Nsyn /Ltarget;计算靶向区域肿瘤突变负荷非同义突变项:Tnon=Nnon/Ltarget;S3,建立多元线性模型,计算待测样本的肿瘤突变负荷TMB:TMB=a1Tsys+a2Tnon+a3log(Tnon),其中,a1、a2和a3通过已有的数据库数据进行拟合得到。
[0019] 应用本发明的技术方案,通过靶向测序计算肿瘤突变负荷有效代替全外显子测序计算肿瘤突变负荷,有效的降低成本,缩短周期。
[0020] 根据本发明一种典型的实施方式,已有的数据库包括TCGA数据库。例如,在本发明一实施例中,通过从TCGA下载的33种肿瘤的10092例WES数据进行拟合。因为目前公认 WES计算的TMB最准,所以拟合时以WES所得TMB为准,从WES数据中提取出本实施例中PANEL基因的突变信息,与之拟合,最终得到模型参数。
[0021] 根本发明一种典型的实施方式,提供一种预测肿瘤突变负荷的方法。该方法括以下步骤: S1,分别取得同一病人的肿瘤样本和正常样本并提取DNA;S2,根据目标区域捕获原理使用探针捕获肿瘤相关基因;S3,通过高通量的方法进行测序及序列分析,得到测序信息肿瘤样本的突变数据;以及S4,根据上述用于预测肿瘤突变负荷的线型模型的构建方法构建的线型模型预测肿瘤突变负荷TMB。
[0022] 通过靶向测序计算肿瘤突变负荷有效代替全外显子测序计算肿瘤突变负荷,有效的降低成本,缩短周期。
[0023] 优选的,S3还包括:选择高质量的测序序列,去除N含量大于5%的序列,去除含有接头的序列,从而进一步提高预测的准确性。在本发明一典型的实施方式中,S3中的序列分析包括:使用比对软件将肿瘤样本DNA与正常样本DNA比对到参考基因组,继而使用变异检测软件,检测得到所述肿瘤样本的突变数据。
[0024] 优选的,S4还包括:使用ANNOVAR软件对突变位点进行注释,得到靶向区域的同义和非同义突变,并分别计算其个数。
[0025] 根本发明一种典型的实施方式,提供一种预测肿瘤突变负荷的装置。该装置包括:装置用于存储或者运行的模块,或者模块为装置的组成部分;其中,模块为软件模块,软件模块为一个或多个,软件模块用于执行上述任一种方法。
[0026] 下面将结合实施例进一步说明本发明的有益效果。
[0027] 实施例1
[0028] 从TCGA数据库下载33种肿瘤(33种肿瘤分别为ACC、KIRC、PRAD、BLCA、KIRP、 READ、BRCA、LAML、SARC、CESC、LGG、SKCM、CHOL、LIHC、STAD、COAD、LUAD、 TGCT、DLBC、LUSC、THCA、ESCA、MESO、THYM、GBM、OV、UCEC、HNSC、PAAD、 UCS、KICH、PCPG和UVM)的10092例WES数据,从中提取自定义549个基因的靶向捕获区域突变信息,按如下多元线性模型计算靶向区域的TMB。
[0029] S1,通过测序及序列分析获得待测样本的突变数据,筛选蛋白编码区域的同义突变和非同义突变,分别计算靶向区域的同义突变个数Nsyn和非同义突变个数Nnon;
[0030] S2,计算靶向区域的蛋白编码区域长度Ltarget;计算靶向区域肿瘤突变负荷同义突变项:Tsys=Nsyn/Ltarget;计算靶向区域肿瘤突变负荷非同义突变项:Tnon=Nnon/Ltarget;
[0031] S3,建立多元线性模型,计算待测样本的肿瘤突变负荷TMB:TMB=a1Tsys+a2Tnon+ a3log(Tnon)。
[0032] 将WES直接计算的TMB作为标准进行比较,图1示出了本实施例方法计算所得TMB 与全外显子数据计算所得TMB的相关性图。横坐标为本实施例方法计算所得TMB,纵坐标为个外显子计算所得TMB,相关性R2=0.9898。说明本发明建模方法的准确性。
[0033] 图2示出了33种肿瘤中本实施例方法所得TMB(549panel)和全外显子所得TMB(WXS) 直观比较图。横坐标为不同肿瘤,纵坐标计算所得TMB。
[0034] 实施例2
[0035] 取得样本PM00G18**0228的肿瘤样本和正常对照样本,并分别提取DNA;通过自选的 549基因panel同时对肿瘤样本和正常样本DNA进行捕获建库、测序;然后比对、查找突变、结果注释、突变过滤,最终得到受检者的详细突变信息(16466条,见图3)。
[0036] 突变信息分类得到5027条非同义突变(Nnon)和11439条同义突变(Nsyn),靶向区域的蛋白编码区域长度为1.373692Mbp(Ltarget),计算得到靶向区域肿瘤突变负荷非同义突变项(Tnon)和同义突变项(Tsys),然后代入已建立的多元线性模型计算得到待测样本的肿瘤突变负荷为82.9。
[0037] 图3示出了PM00G18**0228样本所得突变的缩略图。
[0038] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。