基于高通量靶向测序分析肿瘤突变负荷的方法转让专利

申请号 : CN201910728941.X

文献号 : CN110343748B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张周张之宏侯婷李冰揣少坤汉雨生

申请人 : 广州燃石医学检验所有限公司

摘要 :

本公开涉及一种基于高通量靶向测序数据分析肿瘤突变负荷的方法和系统,所述方法包括以下步骤:通过高通量靶向测序对肿瘤样本和配对对照样本中的靶基因的选定外显子和上下游区域的序列进行测序;通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;以及将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:TMB=总突变数目/总区域长度。

权利要求 :

1.一种分析肿瘤负荷突变的系统,所述系统包括:

靶向高通量测序模块;和

突变分析模块,

其中,所述靶向高通量测序模块配置为使用特异性探针从DNA片段文库中捕获包含靶基因的选定外显子和上下游区域覆盖的区域的DNA片段,并对所述DNA片段进行测序以获得所述靶基因的选定外显子和外显子上下游20bp区域的序列信息,其中所述靶基因的选定外显子包括表1中列出的基因的外显子;并且所述突变分析模块配置为将所述序列信息与人参考基因组序列信息进行比对,从而计算所述DNA片段文库中所述靶基因的选定外显子和上下游区域中的突变的数量。

2.如权利要求1所述的系统,其中:

所述靶向高通量测序模块配置为对肿瘤样本DNA片段文库和配对对照样本DNA片段文库分别进行捕获和测序,以获得所述靶基因的选定外显子和上下游区域的序列信息;并且所述突变分析模块配置为将从所述肿瘤样本DNA片段文库获得的序列信息与参考基因组进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;并将从所述配对对照样本DNA片段文库获得的序列信息与参考基因组进行比对以获得所述靶基因的选定外显子和上下游区域中的胚系变异;以及使用所述胚系变异过滤所述潜在突变,从而筛选体细胞突变。

3.如权利要求2所述的系统,其中所述突变分析模块进一步配置为将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度,通过以下公式计算TMB:TMB=总突变数目/总区域长度,

其中在计算总突变数目和总区域长度时排除2号染色体29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。

4.如权利要求2或3所述的系统,其中所述体细胞突变包括单核苷酸变异(SNV)和插入缺失突变(indel)。

5.一种分析肿瘤突变负荷的设备,其包括:

用于存储计算机程序指令的存储器;和

用于执行计算机程序指令的处理器,

其中当所述计算机程序指令由所述处理器执行时,所述设备执行分析肿瘤突变负荷(TMB)的方法,所述方法包括:a.通过高通量靶向测序,对肿瘤样本和配对对照样本中的靶基因的选定外显子和外显子上下游20bp区域的序列进行测序,所述靶基因的选定外显子包括表1中列出的基因的外显子;

b.通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;和c.将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度,通过以下公式计算TMB:TMB=总突变数目/总区域长度,

其中在计算总突变数目和总区域长度时排除2号染色体29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。

6.如权利要求5所述的设备,其中所述肿瘤样本中肿瘤细胞的比例不少于20%。

7.如权利要求5或6所述的设备,其中所述配对对照样本是癌旁组织样本或白细胞样本。

8.如权利要求5-7中任一项所述的设备,其中所述高通量靶向测序包括:a1.从所述肿瘤样本和配对对照样本提取DNA;

a2.将所述DNA片段化并扩增,从而制备预文库;

a3.使用特异性探针,从所述预文库中捕获包含所述靶基因的选定外显子和上下游区域覆盖的区域的DNA片段;

a4.对捕获的DNA片段进行扩增,从而制备终文库;和

a5.对所述终文库进行测序,以获得所述靶基因的选定外显子和上下游区域的序列信息。

9.如权利要求5-8中任一项所述的设备,其中计算所述区域内的体细胞突变的数量包括:b1.将从所述肿瘤样本获得的序列数据与人类参考基因组序列进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;

b2.将从所述配对对照样本获得的序列数据与人类参考基因组序列进行比对,以获得所述靶基因的选定外显子和上下游区域中的胚系变异;和b3.使用所述胚系变异过滤b1中检测的潜在突变,从而筛选体细胞突变,并计算所述体细胞突变的数量。

10.如权利要求5-9中任一项所述的设备,其中所述体细胞突变包括单核苷酸变异(SNV)和插入缺失突变(indel)。

11.如权利要求5-10中任一项所述的设备,其中所述肿瘤是实体瘤。

12.如权利要求11所述的设备,其中所述肿瘤选自膀胱癌、乳腺癌、宫颈癌、胆管癌、结直肠癌、子宫内膜癌、食道癌、头颈癌、胃癌、肝癌、肾癌、肺癌、黑色素瘤、卵巢癌、胰腺癌、前列腺癌、肉瘤和甲状腺癌。

13.一种计算机可读介质,所述计算机可读介质存储有计算机程序指令,其中当所述计算机程序指令被处理器执行时分析肿瘤突变负荷(TMB)的方法,所述方法包括:a.通过高通量靶向测序,对肿瘤样本和配对对照样本中的靶基因的选定外显子和外显子上下游20bp区域的序列进行测序,所述靶基因的选定外显子包括表1中列出的基因的外显子;

b.通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;和c.将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度,通过以下公式计算TMB:TMB=总突变数目/总区域长度,

其中在计算总突变数目和总区域长度时排除2号染色体29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。

14.如权利要求13所述的计算机可读介质,其中所述肿瘤样本中肿瘤细胞的比例不少于20%。

15.如权利要求13或14所述的计算机可读介质,其中所述配对对照样本是癌旁组织样本或白细胞样本。

16.如权利要求13-15中任一项所述的计算机可读介质,其中所述高通量靶向测序包括:a1.从所述肿瘤样本和配对对照样本提取DNA;

a2.将所述DNA片段化并扩增,从而制备预文库;

a3.使用特异性探针,从所述预文库中捕获包含所述靶基因的选定外显子和上下游区域覆盖的区域的DNA片段;

a4.对捕获的DNA片段进行扩增,从而制备终文库;和

a5.对所述终文库进行测序,以获得所述靶基因的选定外显子和上下游区域的序列信息。

17.如权利要求13-16中任一项所述的计算机可读介质,其中计算所述区域内的体细胞突变的数量包括:b1.将从所述肿瘤样本获得的序列数据与人类参考基因组序列进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;

b2.将从所述配对对照样本获得的序列数据与人类参考基因组序列进行比对,以获得所述靶基因的选定外显子和上下游区域中的胚系变异;和b3.使用所述胚系变异过滤b1中检测的潜在突变,从而筛选体细胞突变,并计算所述体细胞突变的数量。

18.如权利要求13-17中任一项所述的计算机可读介质,其中所述体细胞突变包括单核苷酸变异(SNV)和插入缺失突变(indel)。

19.如权利要求13-18中任一项所述的计算机可读介质,其中所述肿瘤是实体瘤。

20.如权利要求19所述的计算机可读介质,其中所述肿瘤选自膀胱癌、乳腺癌、宫颈癌、胆管癌、结直肠癌、子宫内膜癌、食道癌、头颈癌、胃癌、肝癌、肾癌、肺癌、黑色素瘤、卵巢癌、胰腺癌、前列腺癌、肉瘤和甲状腺癌。

说明书 :

基于高通量靶向测序分析肿瘤突变负荷的方法

技术领域

[0001] 本公开属于生物信息技术中的基因检测领域,具体来说,涉及一种利用高通量靶向测序数据分析肿瘤突变负荷的方法和系统。技术背景
[0002] 化疗和放疗、靶向治疗以及免疫治疗被列为肿瘤治疗的三次革命。其中,免疫治疗以其低毒性、不损伤反而增强免疫系统、以及降低癌症复发率等优点,受到科学家、医生和患者的广泛关注。近几年来,免疫疗法在治疗黑色素瘤、非小细胞肺癌、头颈癌、尿路上皮癌,以及其他具有错配修复缺陷的肿瘤方面表现出显著的临床疗效。免疫药物,如最近在国内审批上市的O药(Opdivo)、K药(Keytruda)以及国产的特瑞普利,均是通过靶向免疫检查点分子来增强抗肿瘤免疫应答。而针对程序性死亡蛋白1(PD-1)以及其配体PD-L1、细胞毒性T 淋巴细胞相关抗原4(CTLA-4)的抑制剂是目前促进T细胞免疫活化的主要药物,且展现出良好的抗癌效果。
[0003] 然而,免疫疗法并不是适合于每一个癌症患者。为了提高免疫疗法的经济学效能进而避免不必要的浪费,需要实现精准免疫治疗,选择优势获益人群等。
[0004] 在癌症患者中,肿瘤细胞通常存在各种体细胞突变,其与肿瘤的发生和发展相关。肿瘤突变负荷(Tumor Mutation Burden,TMB)表示肿瘤细胞的基因组上每一百万个碱基中存在的体细胞突变个数。 TMB是重点研究的免疫疗法潜在生物标志物之一,与疗效响应率相关,可以用于选择免疫疗法的高获益人群。同时,相比于MSI-H/dMMR 的低发生率,TMB高的患者比例更高。目前,TMB已被收入NCCN 的NSCLC治疗指南。随着测序成本的降低,使用二代测序技术预测分析TMB成为可能。现有技术主要采取肿瘤样本与其对应的配对对照样本进行全基因组测序或全外显子组测序来对TMB进行预测分析。

发明内容

[0005] 本公开旨在提供一种基于高通量靶向测序分析癌症的肿瘤突变负荷(TMB)的方法和系统。通过本公开的方法检测的TMB在本文中也称为OncoScreenPlus TMB。
[0006] 相应的,在第一个方面,本公开涉及一种分析肿瘤突变负荷(TMB) 的方法,所述方法包括:
[0007] a.通过高通量靶向测序,对肿瘤样本和配对对照样本中的靶基因的选定外显子和上下游20bp区域的序列进行测序,所述多个靶基因包括以下表1中列出的基因的外显子;
[0008] b.通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;和
[0009] d.将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:
[0010] TMB=总突变数目/总区域长度,
[0011] 其中在计算总突变数目和总区域长度时排除2号染色体 29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。
[0012] 表1.靶基因外显子列表
[0013]
[0014]
[0015]
[0016]
[0017]
[0018]
[0019]
[0020]
[0021]
[0022]
[0023]
[0024]
[0025]
[0026]
[0027]
[0028] 人2号染色体29419654-29446218位的序列对应ALK基因激酶编码区域;人7号染色体55241614-55259567位的序列对应EGFR基因激酶编码区域。ALK与EGFR激酶区内突变主要为TKI(酪氨酸激酶抑制剂)用药后诱导出现的耐药突变,不代表全基因组上原发的体细胞突变水平,因此在计算TMB予以排除。
[0029] 在上述方法的一些实施方案中,使用的肿瘤样本中肿瘤细胞的比例不少于约20%,例如不少于约30%或不少于约50%。
[0030] 在上述方法的一些实施方案中,所述配对对照样本可以选自癌旁组织样本或白细胞样本,即与所述肿瘤样本来源于相同个体的癌旁组织样本或白细胞样本。在另一些实施方案中,可以使用其他类型的组织样本作为配对对照样本。
[0031] 在上述方法的一些实施方案中,所述高通量靶向测序可以包括:
[0032] a1.从所述肿瘤样本和配对对照样本提取DNA;
[0033] a2.将所述DNA片段化并扩增,从而制备预文库;
[0034] a3.使用特异性探针,从所述预文库中捕获包含所述靶基因的选定外显子和上下游区域覆盖的区域的DNA片段;
[0035] a4.对捕获的DNA片段进行扩增,从而制备终文库;和
[0036] a5.对所述终文库进行测序,以获得所述靶基因的选定外显子和上下游区域的序列信息。
[0037] 在一些实施方案中,在步骤a2中将DNA片段化为平均约200bp的 DNA片段,例如200bp±50bp、200±20bp或200bp±10bp。
[0038] 在一些实施方案中,在a3中使用的所述特异性探针是RNA探针。
[0039] 在上述方法的一些实施方案中,计算所述区域内的体细胞突变的数量可以包括:
[0040] b1.将从所述肿瘤样本获得的序列数据与人类参考基因组序列进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;
[0041] b2.将从所述配对对照样本获得的序列数据与人类参考基因组序列进行比对,以获得所述靶基因的选定外显子和上下游区域中的胚系变异;和
[0042] b3.使用所述胚系变异过滤b1中检测的潜在突变,从而筛选体细胞突变,并计算所述体细胞突变的数量。
[0043] 在上述方法的一些实施方案中,所述体细胞突变包括单核苷酸变异(SNP)和插入缺失突变(indel)。
[0044] 在上述方法中,所述肿瘤的类型可以是实体瘤。在一些实施方案中,所述肿瘤可以选自膀胱癌、乳腺癌、宫颈癌、胆管癌、结直肠癌、子宫内膜癌、食道癌、头颈癌、胃癌、肝癌、肾癌、肺癌、黑色素瘤、卵巢癌、胰腺癌、前列腺癌、肉瘤和甲状腺癌等。
[0045] 在第二个方面,本公开涉及一种分析肿瘤负荷突变的系统,所述系统包括:
[0046] 靶向高通量测序模块;和
[0047] 突变分析模块,
[0048] 其中,所述靶向高通量测序模块配置为使用特异性探针从DNA 片段文库中捕获包含靶基因的选定外显子和上下游区域覆盖的区域的DNA片段,并对所述DNA片段进行测序以获得所述靶基因的选定外显子和外显子上下游20bp区域的序列信息,其中所述靶基因的选定外显子包括表1中列出的基因的外显子;并且
[0049] 所述突变分析模块配置为将所述序列信息与人参考基因组序列信息进行比对,从而计算所述DNA片段文库中所述靶基因的选定外显子和上下游区域中的突变的数量。
[0050] 在上述系统的一些实施方案中,所述特异性探针是RNA探针。
[0051] 在上述系统的一些实施方案中,所述靶向高通量测序模块配置为对肿瘤样本DNA片段文库和配对对照样本DNA片段文库分别进行捕获和测序,以获得所述靶基因的选定外显子和上下游区域的序列信息;并且
[0052] 所述突变分析模块配置为将从所述肿瘤样本DNA片段文库获得的序列信息与参考基因组进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;并将从所述配对对照样本DNA片段文库获得的序列信息与参考基因组进行比对以获得所述靶基因的选定外显子和上下游区域中的胚系变异;以及使用所述胚系突变过滤所述潜在突变,从而筛选体细胞突变。
[0053] 在进一步的实施方案中,所述突变分析模块进一步配置为将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:
[0054] TMB=总突变数目/总区域长度,
[0055] 其中在计算总突变数目和总区域长度时排除2号染色体 29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。
[0056] 在上述系统的一些实施方案中,所述体细胞突变包括单核苷酸变异(SNP)和插入缺失突变(indel)。
[0057] 在第三个方面,本公开涉及一种分析肿瘤突变负荷的设备,其包括:
[0058] 用于存储计算机程序指令的存储器;和
[0059] 用于执行计算机程序指令的处理器,
[0060] 其中当所述计算机程序指令由所述处理器执行时,所述设备执行本公开的方法的步骤。
[0061] 在第四个方面,本公开涉及一种计算机可读介质,所述计算机可读介质存储有计算机程序指令,其中当所述计算机程序指令被处理器执行时实现本公开的方法的步骤。

附图说明

[0062] 图1显示了基于高通量靶向测序获得的数据,分析肿瘤样本的肿瘤负荷突变的流程示意图。
[0063] 图2显示了对于临床肿瘤样本,使用本公开的OncoScreenPlus TMB和金标准WES TMB计算的TMB的一致性的图。
[0064] 图3A和图3B显示了在in silico方法中,使用本公开的 OncoScreenPlus TMB和WES TMB计算的TMB的一致性的图。

具体实施方式

[0065] 下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
[0066] 实施例1.高通量靶向测序和TMB分析(OncoScreenPlus TMB)
[0067] 1.肿瘤组织样本及配对对照样本的预处理和DNA提取
[0068] 在本实施例中,对于肿瘤组织样本使用肿瘤细胞占比≥20%的样本,且配对正常(对照)样本选取癌旁组织或血液白细胞样本。肿瘤组织样本和对照样本的DNA提取流程参照试剂盒(QIAamp DNA FFPE Tissue Kit,QIAGEN公司生产)自带的操作说明书进行。随后,将提取的DNA片段化为平均200bp左右的DNA片段,并用于建立预文库。若不立即用于建库,则将片段化的DNA储存在-20℃的冰箱中。
[0069] 2.预文库的制备
[0070] 预文库的制备使用的方法学为经典的超声打断双链连接法,其流程包括末端修复,3‘端加A,接头连接,接头连接产物纯化,预文库扩增,和扩增的预文库纯化。其中,末端修复和3’端加A在同一个反应体系中进行。接头连接步骤中采用两条30bp左右的DNA寡核苷酸片段作为接头。纯化后的预文库产量在500ng以上(通过Qubit HS分析试剂盒评估)。
[0071] 使用针对以上表1中所示的518个靶基因的选定外显子和上下游区域特异性RNA捕获探针(Agilent),通过与预文库进行杂交捕获特异性DNA片段。捕获的文库经过洗脱过程洗脱掉非特异性片段,达到富集特异性片段的目的。
[0072] 随后,将捕获富集的目标文库片段通过Post-PCR进行扩增,扩增反应体系采用KAPA Biosystems公司的KAPA HiFi HotStart试剂。将扩增得到的产物进行纯化,并对纯化后的终文库的片段大小及产量进行评估。DNA片段长度的峰值在350bp左右,产量在10-300ng之间。
[0073] 3.上机测序
[0074] 按照仪器说明书,使用Illumina公司的基因测序仪Illumina MiSeqTM Sequencer,Illumina MiniSeqTM Sequencer,Illumina NextSeqTM Sequencer或Illumina NovaSeqTM Sequencer进行上机测序。
[0075] 4.下机数据分析
[0076] 4.1数据拆分和预处理
[0077] 图1显示了本公开的方法中的下机数据处理和TMB分析步骤的流程图。具体而言,使用bcl2fastq(v2.20.0.422),根据sampleSheet提供的样本-索引(index)对应信息,将原始bcl文件拆分成单个样本的fastq 文件。使用Trimmomatic(v0.36)对fastq文件做预处理,去除接头序列和低质量碱基,去除长度小于50bp的序列片段(read)。
[0078] 4.2序列与参考基因组比对
[0079] 使用BWA(v0.7.10)MEM模式将预处理后的fastq文件比对到人参考基因组b37(hg19),生成排序的BAM文件。使用GATK (v3.2-2-gec30cee)indel-realign模块对indel区域进行比对优化。
[0080] 4.3突变检测和注释
[0081] 使用samtools(v0.1.19)mpileup模块将BAM文件转换为pileup格式(过滤碱基质量(base quality)<30的碱基和比对质量(mapping quality)<60的reads)。采用varscan(v2.3)mpileup2snp模块检测点突变, mpileup2indel模块检测插入缺失,并对检出突变做质量过滤(要求突变丰度AF≥2%;突变具有PCR重复支持和双端序列支持的片段数 dup_Pair≥4或突变具有双端序列支持的片段数pairCount≥6)。采用 snpEff软件将突变注释到refseq基因和HGVS变异形式,采用annoVar 将突变注释到dbSNP、COSMIC、人群频率数据库(1000genome,ExAC,ESP6500等)、clinVar等数据库。通过对比肿瘤样本与配对正常样本的突变丰度(AF)滤除胚系变异。当突变满足如下条件时判定为体细胞突变:a)肿瘤样本AF大于3倍配对正常样本AF;b)配对的正常样本AF<10%;c)突变在公共数据库(ExAC)中人群频率小于千分之五。
[0082] 5.TMB分析
[0083] 通过上述步骤计算表1所示的518个基因的选定外显子和外显子上下游20bp范围内每一百万个碱基上体细胞突变个数(mut/Mb),突变类型包括单核苷酸变异(SNV)、插入缺失突变(indel)如同义突变、移码突变和可变剪切位点突变。此外,位于2号染色体 29419654-29446218位的ALK基因激酶编码区域中的突变和位于7号染色体55241614-
55259567位的EGFR基因激酶编码区域中的突变并未计算在内。将得到的突变个数除以突变覆盖的序列长度范围(即 1.26Mb),即为计算的肿瘤样本的TMB(OncoScreenPlus TMB)。TMB 计算公式如下:
[0084] TMB=总突变数/总(编码区大小+上下游各20bp)
[0085] 实施例2.临床肿瘤样本的TMB检测和评估
[0086] 本实施例包括对来自国内三甲医院的44例(14例样本来自浙江大学医学院附属第一医院,30例样本来自华中科技大学同济医学院附属协和医院)IV期非小细胞肺癌样本以及配对的白细胞样本进行 TMB检测。将44例样本本分别使用安捷伦SureSelectXT Human All Exon V5(由明码(上海)生物科技有限公司检测)和本公开的方法对肿瘤样本进行WES和Target捕获测序。以TMB计算的金标准WES TMB为评估标准,通过本公开的方法计算的TMB(OncoScreenPlus TMB)与WES TMB相关性(correlation)=0.841,R2=0.707,如图2所示。分别以文献中报道的TMB截断值7.4[1]、9.65[2]、10[3,4]和16[5](mut/Mb) 作为阈值对TMB分组进行准确性评估。在设置的各个TMB阈值下, OncoScreenPlus TMB的敏感性均在80%以上;
当将TMB阈值设置为大于等于9.65时,OncoScreenPlus TMB的特异性为90%左右,且准确性均在90%以上,如表3所示。其中,1例患者的OncoScreenPlus TMB=23.8,经过PD-1抑制剂nivolumab治疗,患者最佳疗效为PR;另1例患者的 OncoScreenPlus TMB=9.5,经过PD-1抑制剂atezolizumab治疗,患者最佳疗效PR,表明检测的TMB值对于免疫治疗的选择和预后判断具有一定临床意义。
[0087] 表2.OncoScreenPlus TMB与WES TMB的一致性评估
[0088] 截断值 TP FP TN FN 敏感性 特异性 准确性7.4 11 7 24 2 84.62% 77.42% 79.55%
9.65 8 4 32 0 100.00% 88.89% 90.91%
10 8 4 32 0 100.0% 98.89% 90.91%
16 4 4 36 1 80.00% 92.31% 90.91%
[0089] 实施例3.In silico TMB检测和评估
[0090] 本实施例采取in silico方法学评估OncoScreenPlus TMB与WES TMB的一致性。具体而言,从美国国立卫生研究院(NIH)的数据库网站(https://gdc.cancer.gov/about-data/publications/mc3-2017)下载TCGA MC3样品的数据MAF文件,包括32种癌症的8291例样本突变数据,如表3所示。参考FoCR(Friends of Cancer Research)WES TMB标准,计算WES TMB:(1)将MAF文件中FILTER!=“PASS”的突变定义为假阳(variant artifacts),去除包含假阳突变占比50%以上的样本;(2)去除样本中假阳突变;(3)去除突变序列(variant count)<3的突变;(4)去除等位基因频率(allele frequency)<5%的突变;(5)去除总深度(total depth)<25的突变;(6)选择CCDS project中编码区域(约32.3Mb)突变作为候选突变;(7)仅包含非同义突变。单个样本的WES TMB值为 1Mb编码区域内非同义突变的个数。
[0091] 表3.In silico样本信息
[0092]
[0093]
[0094] OncoScreenPlus TMB计算方法如下:(1)按照FoCR过滤WES标准的(1)-(5)过滤TCGA突变;(2)筛选OncoScreenPlus TMB方法探针覆盖区域突变,按照本公开的方法计算TMB。结果表明,OncoScreenPlus TMB与WES TMB的相关性(correlation)=0.992,R2=0.984,如图3A所示;将TMB值+1取log之后,相关性=0.905,R2=0.819,如图3B所示。分别以文献中报道的TMB截断值7.4、9.65、10和16(mut/Mb)作为阈值对TMB分组进行准确性评估。
结果表明,以WES TMB分组为参考, OncoScreenPlus TMB分组敏感性均在98%以上,特异性和准确性在 90%左右。并且,随着阈值的增加,OncoScreenPlus TMB的敏感性、特异性和准确性均升高,在阈值设置为16(mut/Mb)时,特异性和准确性可达96%。具体结果如表4中所示。
[0095] 表4.OncoScreenPlus TMB与WES TMB的一致性评估
[0096] 截断值 TP FP TN FN 敏感性 特异性 准确性7.4 1064 800 6089 17 98.43% 88.39% 89.75%
9.65 805 567 6592 6 99.26% 92.08% 92.81%
10 780 592 6593 5 99.36% 91.76% 92.51%
16 484 281 7202 3 99.38% 96.24% 96.44%
[0097] 参考文献
[0098] 1.Rizvi H,Sanchez-Vega F,La K,et al.Molecular Determinants of Response to Anti-Programmed Cell Death(PD)-1and Anti-Programmed Death-Ligand 1(PD-L1)Blockade in Patients With Non-Small-Cell Lung Cancer Pro led With Targeted Next-Generation Sequencing.J Clin Oncol 2018;36:633-41.
[0099] 2.Motzer RJ,Escudier B,McDermott DF,et al.Nivolumab versus Everolimus in Advanced Renal-Cell Carcinoma.N Engl J Med 2015;373:1803-13.
[0100] 3.Hellmann MD,Ciuleanu TE,Pluzanski A,et al.Nivolumab plus Ipilimumab inLung Cancer with a High Tumor Mutational Burden. N Engl J Med 2018;378:2093-104.
[0101] 4.Fehrenbacher L,Spira A,Ballinger M,et al.Atezolizumab versus docetaxel for patients with previously treated non-small-cell lung cancer(POPLAR):a multicentre, open-label,phase 2randomised controlled trial.Lancet 44.2016;387:1837-46.
[0102] 5.Robert C,Ribas A,Wolchok JD,et al.Anti-programmed- death-receptor-1 treatment with pembrolizumab in ipilimumab-refractory advanced melanoma:a randomised dose-comparison cohort of a phase 1 trial.Lancet 2014;384:1109-17。