一种结直肠癌西妥昔单抗耐药性痕量DNA突变检测的方法及装置转让专利

申请号 : CN201810449985.4

文献号 : CN108588201B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨柳叶松胡晓歌倪超常连鹏徐亚平易鑫杨玲

申请人 : 浙江省人民医院浙江大学医学院附属第一医院北京吉因加科技有限公司

摘要 :

本发明公开了一种一种结直肠癌西妥昔单抗耐药性痕量DNA突变检测的方法及装置,所述方法包括:从样本中提取游离DNA;将所述游离DNA构建文库;将所述文库进行富集;将所述富集的文库使用捕获探针进行捕获,获得捕获DNA;将所述捕获DNA测序,获得测序结果;将所述测序结果与参考序列比较,检出突变位点。本发明的方法实现了低起始量DNA富集捕获测序突变检测。

权利要求 :

1.一种结直肠癌西妥昔单抗耐药性痕量DNA突变检测的装置,所述装置包括:(1)DNA样本提取模块,用于从血浆样本和同一受试者外周血分离后的血细胞中分别提取DNA,所述血浆样本为受检样本,所述同一受试者外周血分离后的血细胞为对照样本;

(2)建库模块,用于将所述DNA分别构建文库;

(3)文库富集模块,用于将所述文库分别进行富集;

(4)捕获模块,用于将所述富集的文库使用捕获探针分别进行捕获,获得捕获DNA,所述捕获探针为针对如下基因的全部外显子区域的基因序列的探针:KRAS、NRAS、ERBB2、MET、EGFR、BRAF、PIK3CA、PTEN、MEK1、NF1和AKT1;

(5)测序模块,用于将所述捕获DNA测序,获得测序结果;

(6)突变检出模块,根据所述受检样本和所述对照样本的测序结果,检出突变位点:获得每个受检样本的捕获探针的平均错误率μ和所述多个受检样本的位点特异性错误率e;

计算在受检样本中,突变位置预期的错误发生测序读段数,该期望值分为整体错误测序读段期望值Nμ和位点特异性的错误期望值Ne,公式如下:Nμ=D*μ

Ne=D*e

其中,D在受检样本中该突变位置的总测序深度,

其中n为捕获探针的碱基数,i为捕获探针内某个位点,Mi为i位点的错误碱基数,Di为i位点的总深度;

其中,m为对照样本数,j为发生特定位点发生碱基突变的样本,Mj为在j样本中,该碱基突变型的测序读段支持数,Dj为在j样本中该突变位置的总测序深度;

分别评估受检样本中,突变测序读段实际检测数N与错误发生测序读段数期望值在泊松分布中的可信度pNμ和pNe,公式如下:pNμ=1-ppois(N,Nμ)

pNe=1-ppois(N,Ne)

如果pNμ和pNe同时小于显著性阈值,且对照样本突变测序读段数≤2,即该点突变为真实检出突变。

2.权利要求1的装置,所述装置还包括突变频率计算模块,在(2)建库模块中将所述受检样本DNA平均分成两份同时构建两个文库,对于(6)突变检出模块中所检出突变位点,计算该突变位点在两文库中平均突变频率,作为该突变位点的校正后突变频率。

3.权利要求1或2的装置,所述显著性阈值为0.05。

4.权利要求1或2的装置,在捕获模块中捕获探针为针对说明书表2或说明书表3中所列出的基因突变的探针。

说明书 :

一种结直肠癌西妥昔单抗耐药性痕量DNA突变检测的方法及

装置

技术领域

[0001] 本发明属于生物技术领域,特别是癌症基因检测,更具体而言本发明涉及一种结直肠癌西妥昔单抗耐药性痕量DNA富集捕获测序突变检测的方法及装置。

背景技术

[0002] 结直肠癌是世界范围内最常见的消化道肿瘤。据权威机构统计,全球每年新发病例超过1,400,000,死亡病例接近700,000,无论是发病率还是死亡率均居所有恶性肿瘤前列[1]。在美国,随着早期筛查的不断普及,以及围手术期治疗方式的不断完善,局限性及区域性结直肠癌的5年生存率已达70%以上,但转移性结直肠癌的5年生存率仍为13%-14%左右,提示结直肠癌的防治形势仍十分严峻[2]。西妥昔单抗(Cetuximab)是一种特异性阻断表皮生长因子受体EGFR(epidermal growth factor receptor)的IgG单克隆抗体,多项临床研究表明,在一线或二线治疗中,化疗方案联合西妥昔单抗可以显著改善转移性结直肠癌患者的生存预后[3-5]。
[0003] 目前对于西妥昔单抗疗效预测的检测方法多为基于组织样品进行RAS家族、BRAF基因的PCR或者一代Sanger测序方法。这些方法具有以下的局限性:(1)复发转移患者手术组织检测的检测结果不准确。对于复发转移结直肠癌患者,多采用的是手术时的组织取样进行分子检测。肿瘤进化所造成的时间异质性,会使得部分样品检测呈现假阴性结果。同时肿瘤内部以及不同部位转移灶间都存在空间层面的基因组异质性,组织活检的取样偏移也会影响检测结果的准确性。(2)组织活检时可能造成癌细胞的转移,具有一定的临床风险;(3)检测基因范围小。(4)荧光定量PCR或者Sanger检测平台的灵敏性有限,不能准确检出低丰度的基因突变。
[0004] 如何高效利用来自于脱落细胞、穿刺活检微量样本、外周血游离DNA样本中提取的痕量DNA进行基因检测,是解决结直肠癌西妥昔单抗耐药检测问题的难题。
[0005] 参考文献
[0006] 1.Torre LA,Bray F,Siegel RL et al.Global cancer statistics,2012.CA Cancer J Clin.2015Mar;65(2):87-108.doi:10.3322/caac.21262.
[0007] 2.Siegel RL,Miller KD,Fedewa SA et al.Colorectal cancer statistics,2017.CACancer J Clin.2017May 6;67(3):177-193.doi:10.3322/caac.21395.[0008] 3.Sobrero AF,Maurel J,Fehrenbacher L et al.EPIC:phase III trial of cetuximab plus irinotecan after fluoropyrimidine and oxaliplatin failure in patients with metastatic colorectal cancer.J Clin Oncol.2008May 10;26(14):
2311-9.doi:10.1200/JCO.2007.13.1193.
[0009] 4.Venook AP,Niedzwiecki D,Lenz HJ et al.Effect of First-Line Chemotherapy Combined With Cetuximab or Bevacizumab on Overall Survival in Patients With KRAS Wild-Type Advanced or Metastatic Colorectal Cancer:A Randomized Clinical Trial.JAMA.2017Jun 20;317(23):2392-2401.doi:10.1001/jama.2017.7105.
[0010] 5.Segelov E,Waring P,Desai J et al.ICECREAM:randomised phase II study of cetuximab alone or in combination with irinotecan in patients with metastatic colorectal cancer with either KRAS,NRAS,BRAF and PI3KCA wild type,or G13D mutated tumours.BMC Cancer.2016May 31;16:339.doi:10.1186/s12885-016-2389-8.

发明内容

[0011] 本发明考虑到结直肠癌患者组织样本DNA或外周血游离DNA的不易获取的特性,提供了一种低起始量DNA富集捕获测序突变检测的方法,以克服原有技术的不足。
[0012] 因此,在第一方面,本发明提供了一种结直肠癌西妥昔单抗耐药性痕量DNA突变检测的方法,所述方法包括步骤:
[0013] (1)从受检样本和对照样本中分别提取DNA;
[0014] (2)将所述DNA分别构建文库;
[0015] (3)将所述文库分别进行富集;
[0016] (4)将所述富集的文库使用捕获探针分别进行捕获,获得捕获DNA;
[0017] (5)将所述捕获DNA测序,获得测序结果;
[0018] (6)将所述受检样本和所述对照样本的测序结果,检出突变位点。
[0019] 在一个实施方案中,所述方法还包括(7)对于所检出突变位点,计算该突变位点在文库中突变频率。
[0020] 在一个实施方案中,在步骤(2)中将所述游离DNA分成两份同时构建两个文库,在步骤(7)中对于所检出突变位点,计算该突变位点在两文库中平均突变频率,作为该突变位点的校正后突变频率。
[0021] 在一个实施方案中,步骤(6)中,对于多个样本,突变位点检出如下:
[0022] 获得每个样本的捕获探针的平均错误率μ和多个样本的位点特异性错误率e;
[0023] 计算在受检样本中,突变位置预期的错误发生测序读段数,该期望值分为整体错误测序读段期望值Nμ和位点特异性的错误期望值Ne,公式如下:
[0024] Nμ=D*μ
[0025] Ne=D*e
[0026] 其中,D在受检样本中该突变位置的总测序深度,
[0027] 分别评估受检样本中,突变测序读段实际检测数N与错误发生测序读段数期望值在泊松分布中的可信度pNμ和pNe,公式如下:
[0028] pNμ=1-ppois(N,Nμ)
[0029] pNe=1-ppois(N,Ne)
[0030] 如果pNμ和pNe同时小于显著性阈值,且对照样本突变测序读段数≤2,即该点突变为真实检出突变。
[0031] 在一个实施方案中,所述显著性阈值0.05,更任选0.01。
[0032] 在一个实施方案中,计算所述捕获探针的平均错误率μ:公式如下,[0033]
[0034] 其中n为捕获探针的碱基数,i为捕获探针内某个位点,Mi为i位点的错误碱基数,Di为i位点的总深度。
[0035] 在一个实施方案中,计算位点特异性错误率e:公式如下,
[0036]
[0037] 其中,m为检测的总样本数,j为发生特定位点发生碱基突变(如G突变为T)的样本,Mj为在j样本中,该碱基突变型的测序读段支持数,Dj为在j样本中该突变位置的总测序深度。
[0038] 在一个实施方案中,步骤(6)中,用GATK软进行somatic InDel变异(体细胞插入/缺失变异)检出;用CONTRA软件进行CNV(基因组拷贝数变异)检出;参数为默认。
[0039] 在一个实施方案中,步骤(1)中,所述样本选自穿刺活检样本、唾液、胸腹腔积液、尿液、粪便等。
[0040] 在一个实施方案中,在步骤(3)中进行PCR富集所述文库。所述PCR引物,优选采用高通量测序通用引物。
[0041] 在一个实施方案中,在步骤(4)中捕获探针为针对表1中所列出基因的基因序列的探针。
[0042] 在一个实施方案中,在步骤(4)中捕获探针为针对表2或表3中所列出基因突变的探针。
[0043] 在第二方面,本发明提供了一种结直肠癌西妥昔单抗耐药性痕量DNA突变检测的装置,所述装置包括:
[0044] DNA样本提取模块,用于从受检样本和对照样本中分别提取DNA;
[0045] 建库模块,用于将所述DNA分别构建文库;
[0046] 文库富集模块,用于将所述文库分别进行富集;
[0047] 捕获模块,用于将所述富集的文库使用捕获探针进行捕获,获得捕获DNA;
[0048] 测序模块,用于将所述捕获DNA测序,获得测序结果;
[0049] 突变检出模块,根据所述受检样本和所述对照样本的测序结果,检出突变位点。
[0050] 在一个实施方案中,所述装置还包括:突变频率计算模块,对于所检出突变位点,计算所述突变位点的突变频率。
[0051] 在一个实施方案中,在建库模块中进行:将所述游离DNA分成两份同时构建两个文库,在突变频率计算模块中进行,对于所检出突变位点,计算该突变位点在两文库中平均突变频率,作为该突变位点的校正后突变频率。
[0052] 在一个实施方案中,在突变检出模块中进行突变位点检出:
[0053] 获得每个样本的捕获探针的平均错误率μ和多个样本的位点特异性错误率e;
[0054] 计算在受检样本θ中,突变位置预期的错误发生测序读段数,该期望值分为整体错误测序读段期望值Nμ和位点特异性的错误期望值Ne,公式如下:
[0055] Nμ=D*μ
[0056] Ne=D*e
[0057] 其中,D在样本θ中该突变位置的总测序深度,
[0058] 分别评估受检样本θ中,突变测序读段实际检测数Nθ与错误发生测序读段数期望值在泊松分布中的可信度pNμ和pNe,公式如下:
[0059] pNμ=1-ppois(Nθ,Nμ)
[0060] pNe=1-ppois(Nθ,Ne)
[0061] 如果pNμ和pNe同时小于显著性阈值,且对照样本突变测序读段数≤2,即该点突变为真实检出突变。
[0062] 在一个实施方案中,所述显著性阈值0.05,更任选0.01。
[0063] 在一个实施方案中,在突变检出模块中计算所述捕获探针的平均错误率μ:公式如下,
[0064]
[0065] 其中n为捕获探针的碱基数,i为捕获探针内某个位点,Mi为i位点的错误碱基数,Di为i位点的总深度。
[0066] 在一个实施方案中,在突变检出模块中计算位点特异性错误率e:公式如下,[0067]
[0068] 其中,m为检测的总样本数,j为发生特定位点发生碱基突变(如G突变为T)的样本,Mj为在j样本中,该碱基突变型的测序读段支持数,Dj为在j样本中该突变位置的总测序深度。
[0069] 在一个实施方案中,在突变检出模块中,用GATK软进行somatic InDel变异(体细胞插入/缺失变异)检出;用CONTRA软件进行CNV(基因组拷贝数变异)检出;参数为默认。
[0070] 在一个实施方案中,在DNA样本提取模块中,所述样本选自穿刺活检样本、唾液、胸腹腔积液、尿液、粪便等。
[0071] 在一个实施方案中,在文库富集模块中进行PCR富集所述文库。所述PCR引物,优选采用高通量测序通用引物。
[0072] 在一个实施方案中,在捕获模块中捕获探针为针对表1中所列出基因的基因序列的探针。
[0073] 在一个实施方案中,在捕获模块中捕获探针为针对表2或表3中所列出基因突变的探针。
[0074] 在第三方面,本发明提供了一种捕获芯片,所述捕获芯片包括针对表1中所列出基因的基因序列的捕获探针。
[0075] 在一个实施方案中,在步骤(4)中捕获探针为针对表2或表3中所列出基因突变的探针。
[0076] 在第四方面本发明提供了用于指示胰腺癌的基因序列组合,所述基因组合包括表1中所列出基因的基因序列。
[0077] 在一个实施方案中,所述基因序列组合包括表2或表3中所列出的基因突变位点。
[0078] 相对于其他分析方法,本发明的方法的优势如下:
[0079] 1)高适用性:相对于传统的Sanger测序方法,本方法仅需要低至10ng的DNA样本即可进行基因检测,增加了分子检测方法在胰腺癌样本中的适用性;
[0080] 2)高通量:结合下一代测序技术和杂交捕获的实验方法,可以同时对多个样本进行检测,并且可以一次性检测结直肠癌西妥昔单抗耐药性相关基因,提供更全面的突变信息;
[0081] 3)高灵活性:相较于传统的分子检测手段,本方法可以实现对单个患者,多时间节点样本,或者多区域样本,进行连续检测,使得检测更加灵活;
[0082] 4)高准确性:通过高深度的测序,可以提高检出突变的敏感性,实现丰度为0.1%突变的准确检出。

附图说明

[0083] 通过以下附图对本发明进行说明:
[0084] 图1示出结直肠癌外周血游离DNA富集捕获测序示意图。

具体实施方式

[0085] 本发明的目的在于提供一种高效利用结直肠癌患者西妥昔单抗治疗前后外周血样本进行基因检测的方法,以准确评估西妥昔单抗耐药状态及耐药机制。该方法提供了微量DNA(纳克级)样本的制备方法,并提供了优化的文库构建方法和自主设计的富集芯片对DNA文库进行高效捕获,进一步采用高通量测序的方法对多基因区域进行检测(图1),可以高效、准确、灵活地评估捕获区域基因突变状态,对西妥昔单抗的原发性或继发性耐药原因进行评估,并进一步对患者的治疗策略进行优化。
[0086] 在本发明中,基因名称均采用NCBI-Gene(https://www.ncbi.nlm.nih.gov)里的官方命名(Official Symbol)。染色体序列的参考序列为GRCh37/hg19(http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/),本发明中涉及的染色体编号及位置也是基于参考序列为GRCh37/hg19。
[0087] 在本发明中,单纯检测基因突变位点的方法不涉及疾病的诊断,但与某些基因突变位点相结合的检测基因突变的方法可以用于疾病检测。因此,本发明的方法包括非诊断方法。
[0088] 在本发明中,受检样本和对照样本优选来自同一受试者的不同样本。例如,受试样本为血浆,对照样本为外周血分离后的血细胞。受试者的外周血分离后,得到配对的血浆和血细胞,进行建库。将每份血浆建两个文库(DNA均分),每份血细胞建一个文库。血浆文库是受试者的结果,对应各自配对的血细胞结果。
[0089] 实施例
[0090] 1.捕获探针设计:
[0091] 根据发明人工作中的经验积累,将积累的结直肠癌西妥昔单抗耐药相关的基因变异信息进行整合分析,进行捕获芯片设计,将与西妥昔单抗耐药相关的11个热点基因的全部外显子区域设计入捕获芯片,如下表。
[0092] 表1:西妥昔耐药相关热点基因列表
[0093]KRAS NRAS ERBB2 MET EGFR
BRAF PIK3CA PTEN MEK1 NF1
AKT1        
[0094] 2.外周血游离DNA提取方法
[0095] 2.1外周血采集方法
[0096] 使用Streck采血管采血,采血量不低于15ml,采血后立即上下颠倒混匀,72h内完成血浆分离。
[0097] 2.2血浆分离流程
[0098] 外周血分离得到血浆样本和血细胞样本,血浆样本和血细胞样本构成了配对样品。可以理解,在本发明中,对照样本。血浆样本中含有少量的结直肠癌突变基因,而血细胞样本中不含肿瘤突变基因,用于遗传背景突变的剔除,要从大量遗传背景中区分少量的结直肠癌突变基因,是本实施例要解决的问题。
[0099] (1)将外周血在4℃条件下1600g离心10min,离心后将上层血浆分装到多个1.5mL或者2.0mL的离心管中,在吸取血浆过程中注意不能吸到中间白细胞层;下层淋巴细胞和血细胞作为对照样本进行保存。
[0100] (2)将分装好的血浆样本进行二次分离,在4℃条件下16000g离心10min,将上清转移到新的1.5mL或者2.0mL的离心管中,弃去残余白细胞;
[0101] 两次分离后血浆和对照样本标记清楚,保存在-80℃冰箱备用。
[0102] 2.3血浆游离DNA和对照样本DNA提取
[0103] 血浆游离DNA采用QIAamp Circulating Nucleic Acid Kit(QIAGEN)游离DNA提取试剂盒完成。
[0104] 对照样本DNA的提取依照SDS裂解法进行。
[0105] 本发明可以使用其他可提取游离DNA的样本类型,如唾液、胸腹腔积液、尿液、粪便等;其他采血管进行的外周血采集;其他方法收集胰液及活检样本;其他试剂盒进行的DNA提取。
[0106] 3.文库构建:
[0107] 考虑到外周血中正常DNA丰度高,突变DNA丰度极低,为降低正常DNA背景,提高低频突变的检出率,故采用双文库构建的策略。具体为,将提取后的游离DNA平均为为两份,并在后续过程中进行双文库的平行构建。
[0108] 对照样本DNA进行建库。
[0109] 建库反应,按照KAPA LTP Library Preparation Kit建库说明书,进行3步酶促反应。双文库构建可以有效减少单个文库DNA分子的复杂度。
[0110] 3.1末端修复
[0111]
[0112] 之后,加入Agencourt AMPure XP reagent 120μL,进行磁珠纯化。纯化产物带磁珠进行回溶,回溶溶剂为ddH2O,回溶体系42μL,并带磁珠进行下一步反应,避免转管造成的样品损失。
[0113] 3.2加A反应
[0114]
[0115] 之后加入PEG/NaCl SPRI溶液90μL,充分混合,进行磁珠纯化,最后回溶(35-接头)μL ddH2O,带磁珠进行下一步反应。
[0116] 3.3接头(Adapter)连接
[0117]
[0118] 使用了快速连接反应体系,大大缩短了反应时间(16h缩短到15min)。
[0119] 之后分别加入PEG/NaCl SPRI溶液50μL 2次,进行2次磁珠纯化,最后回溶25μL ddH2O。
[0120] 3.4连接文库的富集
[0121] 采用优化的富集方法对文库进行富集PCR,扩增酶选用Phusion  HotStart Polymerase,并加入DMSO以消除DNA二级结构对扩增的影响,具体反应体系如下。
[0122]
[0123] 使用荧光定量PCR仪(ABI 7500),条件设置如
[0124]
[0125]
[0126] 之后加入Agencourt AMPure XP reagent 50uL进行磁珠纯化。
[0127] 实施例
[0128] 下面通过具体的50例术后复发的转移性结直肠癌患者的外周血游离DNA回顾性检测结果实施例,对本发明进行说明。该50例患者均对既往手术组织进行了RAS基因(KRAS的12/13/61/146密码子、NRAS的密码子12/13/61)和BRAF V600E的一代测序,结果显示为检测位点野生型,但是在接受联合西妥昔单抗的治疗过程中,表现为原发耐药。另外以100例正常人的外周血游离DNA进行对照。对患者疗前外周血和疗前活检组织样本进行了回顾性的高通量捕获测序。对正常人的外周血样本进行了高通量捕获测序。需要说明的是该实施例仅仅是为了说明目的,而不能以任何方式解释成对本发明的限制。
[0129] 1.外周血游离DNA提取
[0130] 1.1外周血采集
[0131] 使用Streck采血管采血,采血量不低于15ml,采血后立即上下颠倒混匀,72h内完成血浆分离。
[0132] 1.2血浆分离流程
[0133] (1)将外周血在4℃条件下1600g离心10min,离心后将上层血浆分装到多个1.5mL或者2.0mL的离心管中,在吸取血浆过程中注意不能吸到中间白细胞层;下层淋巴细胞和血细胞作为对照样本进行保存。
[0134] (2)将分装好的血浆样本进行二次分离,在4℃条件下16000g离心10min,将上清转移到新的1.5mL或者2.0mL的离心管中,弃去残余白细胞;
[0135] 两次分离后血浆和对照样本标记清楚,保存在-80℃冰箱备用。
[0136] 1.3血浆游离DNA和对照样本DNA提取
[0137] 血浆游离DNA采用QIAamp Circulating Nucleic Acid Kit(QIAGEN)游离DNA提取试剂盒完成。
[0138] 对照样本DNA的提取依照SDS裂解法进行。
[0139] 2.文库构建:
[0140] 提取后的游离DNA,分成进行两个文库的平行构建,以减少文库中DNA复杂度,提高低频突变检出率。对照样本DNA进行建库。建库反应,按照KAPA LTP Library Preparation Kit建库说明书,进行3步酶促反应。
[0141] 2.1末端修复
[0142]
[0143]
[0144] 之后,加入Agencourt AMPure XP reagent 120μL,进行磁珠纯化。纯化产物带磁珠进行回溶,回溶溶剂为ddH2O,回溶体系42μL,并带磁珠进行下一步反应,避免去除磁珠过程中由于转管导致的DNA模板损失。
[0145] 2.2加A反应
[0146]
[0147] 之后加入PEG/NaCl SPRI溶液90μL,充分混合,进行磁珠纯化,最后回溶(35-接头)μL ddH2O,带磁珠进行下一步反应。
[0148] 2.3接头(Adapter)连接
[0149]
[0150] 使用了快速连接反应体系,大大缩短了反应时间(16h缩短到15min)。之后分别加入PEG/NaCl SPRI溶液50μL 2次,进行2次磁珠纯化,最后回溶25μL ddH2O[0151] 2.4连接文库的富集
[0152] 采用优化的富集方法对文库进行富集PCR,扩增酶选用Phusion  HotStart Polymerase,并加入DMSO以消除DNA二级结构对扩增的影响,具体反应体系如下。
[0153]
[0154] 使用荧光定量PCR仪(ABI 7500),条件设置如
[0155]
[0156]
[0157] 之后加入Agencourt AMPure XP reagent 50uL进行磁珠纯化。
[0158] 3.探针捕获与上机测序
[0159] 3.1高通量的捕获测序是按照基因列表,按照参考序列每~100bp进行探针覆盖,即在某基因比如1~3kb区间,每隔10bp设计一条100bp的探针,由前到后依次设计。扩增后文库质控合格后并采用发明人设计的捕获探针,参照芯片制造商(Roche)提供的说明书进行杂交捕获。最后洗脱回溶21μL ddH2O带杂交洗脱磁珠。
[0160] 3.2杂交捕获产物的扩增
[0161] PCR反应体系:
[0162]
[0163] PCR反应条件:
[0164]
[0165] 3.3先除去上一步磁珠,然后重新加入Agencourt AMPure XP reagent 50μL,进行磁珠纯化,最后回溶25μL ddH2O,进行QC及上机
[0166] 3.4采用Illumina HiSeq3000PE151程序进行上机测序,测序实验操作按照制造商提供的操作说明书(参见Illumina/Solexa官方公布cBot)进行上机测序操作。
[0167] 4.数据处理及突变检出
[0168] 4.1下机数据进行过滤,剔除低质量的测序读段;
[0169] 4.2下机数据采用BWA软件比对到参考基因组;
[0170] 4.3比对bam文件采用Picard进行重复序列的标记;
[0171] 4.4去重复后的bam文件采用GATK进行IndelRealigner和BaseRecalibrator的处理。
[0172] 4.5单文库突变检出:
[0173] 突变检测过程:碱基变化要么是随机错误,要么是真实突变,本统计过程的H0假设是,测序得到的碱基变化是随机错误,然后证伪,p值如果和H0是显著性差异,则不是随机错误,即为真实突变。对单个文库的突变检出进行泊松分布验证。分别计算检出突变与两种随机错误(芯片随机测序错误、样本随机错误)的差异显著性。若突变测序读段支持数与两种错误均有显著性差异,即认为该突变为真实突变,而非随机错误。
[0174] 4.5.1捕获区域的每一个位置都有可能发生错误,所以计算整个区域的平均错误率,即每个位置的错误率加和,然后除以整个区域的大小。
[0175] 对于每个血浆样本,计算捕获探针的平均错误率;在本样本中,每个芯片位点都有一定的错误率,计算平均值。
[0176] 计算捕获区间的平均错误率μ:公式如下,
[0177]
[0178] 其中n为捕获区间位点数,i为区间内某个位点,Mi为i位点的错误碱基数,Di为i位点的总深度。
[0179] 对于所有血清样本,捕获区间的平均错误率μ取平均值。
[0180] 4.5.2对于所有血清样本,计算群体中位点特异性错误率e:公式如下,[0181]
[0182] 其中,m为检测的总样本数,j为发生特定位点发生碱基突变(如G突变为T)的样本,Mj为在j样本中,该碱基突变型的测序读段支持数,Dj为在j样本中该突变位置的总测序深度。
[0183] 以上两步计算的是随机错误的发生率。
[0184] 4.5.3计算如果是随机错误,在这份血浆的测序深度下,会出现多少条错误的测序读段reads。分成两部分,芯片随机错误的测序读段期望值——即如果是芯片随机错误,会有多少条reads;位点随机错误的测序读段——即如果是位点随机错误,会有多少条reads。两部分分别进行显著性检验。
[0185] 计算在受检样本θ中,突变位置预期的错误发生测序读段数,该期望值分为整体错误测序读段期望值Nμ和位点特异性的错误期望值Ne,公式如下:
[0186] Nμ=Dθ*μ
[0187] Ne=Dθ*e
[0188] 4.5.4显著性检验,按照泊松分布,计算实际出现的reads,和两个期望分布的显著性。
[0189] 分别评估受检样本θ中,突变测序读段实际检测数Nθ与错误发生测序读段数期望值在泊松分布中的可信度pNμ和pNe,公式如下:
[0190] pNμ=1-ppois(Nθ,Nμ)
[0191] pNe=1-ppois(Nθ,Ne)
[0192] 如果pNμ和pNe同时小于0.05,即突变测序读段真实检出数与测序随机错误具有显著差异,则认为该突变并非由随机错误导致。
[0193] 以上两步完成了显著性检验。
[0194] 除去显著性之外,再和对照样本(血细胞测序的结果)进行比较,若同时对照样本检出测序读段数>2,即不认为该突变是一个体细胞突变。
[0195] 4.5.5用GATK软进行somatic InDel变异(体细胞插入/缺失变异)检出;用CONTRA软件进行CNV(基因组拷贝数变异)检出;参数为默认。
[0196] 4.6双文库频率校正及变异注释:对于单个文库中的检出突变,计算该突变位点在两文库中平均突变频率,作为该突变的校正后突变频率。采用ANNOVAR软件对检出变异进行注释,注释内容包括碱基突变、氨基酸突变、突变功能等。
[0197] 在本实施例种,之所以平行建库,是因为DNA在分为两份后,不是随机分布的,因此分两份后降低了背景,提高了检出。两文库的结果差异较大,也正是说明了这个问题,而不是方法不准确。采用2文库,原因是DNA量本来就不多,分成多份就会增加实验损失的风险。
[0198] 参考网站
[0199] 1.BWA:http://bio-bwa.sourceforge.net/
[0200] 2.Picard:https://broadinstitute.github.io/picard/
[0201] 3.GATK:https://www.broadinstitute.org/gatk/
[0202] 4.Mutect:http://www.broadinstitute.org/cancer/cga/mutect[0203] 5.CONTRA:http://contra-cnv.sourceforge.net/
[0204] 6.ANNOVAR:http://annovar.openbioinformatics.org/en/latest/[0205] 7.SAMtools:http://samtools.sourceforge.net/
[0206] 5.测序结果分析
[0207] 50例患者突变检出结果如下表2所示,本实施例中结果显示,所有样本均有耐药突变的阳性结果检出,并且双文库检测的结果也呈现出突变测序读段的分布不均匀性,这是由于突变DNA的丰度极低,正常DNA丰度会产生非常大的检测背景,而双文库构建策略,可以将单个文库的检测背景降低,利于突变的检出,所有患者检出突变共计22个,突变的总结在表3中列出。
[0208] 表2:50例患者突变检出结果
[0209]
[0210]
[0211]
[0212] 表3. 突变检出结果总结
[0213]
[0214]
[0215] 5.统计分析
[0216] 进一步采用捕获测序的方法,对50例患者活检组织样本进行回顾性突变验证,发现活检组织样本中检出突变与外周血中突变一致。
[0217] 50例正常对照的血液样本进行了平行检测未检出相关位点的突变,说明这些突变足以用于区分结直肠癌西妥昔单抗耐药个体与正常个体。
[0218] 根据上述结果,发明人设计了一种简化的捕获芯片,所述捕获芯片包括针对表2或表3中所列出基因位点的探针。具体设计方法简述为:基于表2或3中所列出基因位点的序列,按照参考序列每~100bp进行探针覆盖,每隔10bp设计一条100bp的探针,由前到后依次设计。重复上述实施例,并且在步骤3.1中,将扩增后文库质控合格后并采用这些简化的捕获探针,参照芯片制造商(Roche)提供的说明书进行杂交捕获进行后续测序步骤,得到了与上述实施例相同的结果。因此,利用简化的序列在减少合成、实验、测序成本的情况下,能够实现本发明的目的。
[0219] 不拘囿于任何理论,本发明人通过对反应体系进行的优化和选择对合适基因序列组合的检测实现了结直肠癌西妥昔单抗耐药的痕量DNA(纳克级)样本的检测。对反应体系进行优化包括聚合酶的选择为Phusion而不是KAPA系列,另外还有加入DMSO,增加了痕量DNA检测度。平行进行的对照试验,得不出本发明实施例中的检测效果。