检测肿瘤相关的50个热点突变基因的捕获文库和试剂盒转让专利

申请号 : CN201610738252.3

文献号 : CN106283199B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李宏志李丽珍刘琦赵金银许立志于闯明鸿博

申请人 : 大连晶泰生物技术有限公司

摘要 :

本发明公开一种检测肿瘤相关的50个热点突变基因的试剂盒及方法,其针对肿瘤学研究相关的50个基因(包括致癌基因和抑癌基因)的207个热点突变区域的捕获方法,以及捕获使用的液相杂交文库的制备方法。具体为选取207个热点突变区域的序列信息,设计PCR引物,利用PCR方法制备生物素标记的液相杂交捕获文库,利用其与构建好的靶标基因组DNA文库杂交,对捕获到的片段进行高通量测序和生物信息学分析,从而获得样本的核酸序列位点变异情况。本发明提供的方法,可获得高质量的测序数据,具有更高捕获效率和更好的靶标位点的均一性捕获,解决了固相杂交的效率低、均一性差等缺点,大大的降低了测序成本。

权利要求 :

1.一种肿瘤相关突变基因的捕获文库的构建方法,其特征在于:包括筛选出的207个突变基因,其基因名称和染色体坐标信息为:还包括扩增上述207个突变基因的引物对,其碱基序列如SEQ ID NO.1~414所示;

利用上述的引物,用标化的人基因组DNA作为模板进行PCR扩增、纯化、分别定量后,均一等量混合207个PCR产物,将混合的PCR产物通过进行片段 化处理,获得大小为70-130bp的DNA片段 ,通过表面带有链霉亲和素标记的磁珠来分离纯化带有生物素标记的含有目标基因DNA片段 ,从而获得带有生物素标记的捕获文库。

2.根据权利要求1所述的肿瘤相关突变基因的捕获文库的构建方法,其特征在于:所述进行片段 化处理的方法为超声波打断法。

3.根据权利要求1所述的肿瘤相关突变基因的捕获文库的构建方法,其特征在于:所述PCR扩增体系为:PCR扩增条件为:

95℃、5min;95℃、30s,55℃、30s,72℃、30s,35个循环;72℃、10min;4℃、∞。

4.利用权利要求1所述方法获得的肿瘤相关突变基因的捕获文库。

5.利用权利要求4所述的捕获文库制备的肿瘤相关突变基因的检测试剂盒。

6.根据权利要求5所述的检测试剂盒,其特征在于:包括以下试剂:建库试剂:KAPA Hyper Prep Kit Illumina platforms封闭试剂:COT DNA、封闭引物

杂交试剂:Hybridiation缓冲液

探针:权利要求4所述的杂交捕获文库

生物素亲和磁珠:Invitrogen MyOneTM Streptavidin T1洗脱试剂:缓冲液1×SSC,0.1%SDS和缓冲液0.1×SSC,0.1%SDS;

富集试剂:KAPA HiFi HotStart ReadyMix,Post-LM-PCR Oligos 1&2,5μM。

说明书 :

检测肿瘤相关的50个热点突变基因的捕获文库和试剂盒

技术领域

[0001] 本发明属于基因检测技术领域,涉及一种用于检测癌症相关基因的试剂盒及检测方法,具体涉及杂交的序列捕获文库的制备方法及技术。

背景技术

[0002] 恶性肿瘤,俗称癌症,据统计癌症已经成为我国城乡居民的首要死因。近百年来,人们对于癌症的研究一直没有间断,但具体病因仍然不能确定。随着科学进步发展,科学家们发现癌基因与抑癌基因在癌症发生上起到关键作用。癌基因(oncogene)一般可定义为某种基因,它的异常表达或表达产物的异常直接决定细胞恶性表型的产生。现已知道在肿瘤发生中,作为环境因素的病毒、化学致癌物和射线,它们作用于机体内的靶分子都是DNA,导致原癌基因的激活引发癌症发生。癌基因可以促进细胞增殖与迁移,可以抑制细胞分化和凋亡,其在肿瘤细胞中大量表达。抑癌基因(tumor-suppressor gene)存在于正常细胞中,在被激活情况下它们具有抑制细胞增殖与迁移,调节细胞凋亡的作用,它们的丢失、突变或失去功能,使激活的癌基因发挥作用而致癌。近年来随着基因组学的发展,不少基因检测为主的研究项目已经取得标志性的阶段成果,尤其对于癌症的诊断预防具有不可替代的优势。
[0003] 20世纪初,人们认识到癌症是一种遗传病,并且在整个20世纪,科学家们开展了大量的细致、有突破性的研究来发掘癌症的发生发展与基因之间的联系。在研究的过程中,涌现了许多先进的技术和研究手段,使得科学家们更高效地找到了更多与癌症相关的遗传变异,其中细胞遗传学技术逐渐崭露头角,例如荧光原位杂交(FISH)和比较基因组杂交(CGH)技术广泛应用于鉴定染色体变异,揭示癌症生物学的重要信息。随后一代测序技术广泛应用于目标区域测序,并且鉴定了许多热点突变基因。到20世纪90年代,基因芯片技术的发展使得人们有机会更大规模地研究癌症相关基因。
[0004] 在过去的十年,关于癌症的研究取得了空前的进步,而这都归功于新一代测序技术提供的技术和大量的数据。与一代测序技术相比,二代测序技术具有高通量、高准确性的技术特点,可对数以亿计的DNA片段同时进行测序,这一技术进步使得测序成本大大降低。虽然二代测序技术的高通量特点大大降低了测序成本,但是得到一个人的完整基因组数据仍然需要花费1万美元,并且由于研究进展限制很多得到的序列信息并不了解临床意义,难以大规模推广应用。另一方面,对于研究人类某些疾病的科学家来说,他们并不需要对整个基因组进行测序,他们感兴趣的往往只是与疾病密切相关的很小部分的基因组区域,如果能选择性地对这些区域进行测序,可以显著地降低测序成本同时也能缩短测序时间和生物信息分析周期。目标序列捕获技术的出现,缓解了上述问题。目标序列捕获测序是针对已知的特定基因组区域设计探针捕获后进行测序。目前常用的序列捕获方法有:PCR法、分子倒置探针法(MolecuLar insersion probe,MIP)和杂交法。PCR法具有高灵敏性、高特异性和重复性好等优点,不过这种方法通量小,适合捕获一些很小的区域,并且PCR反应由于在同一反应中使用多种引物,导致大量非特异性扩增产生和部分区域无法扩增等问题。分子倒置探针法具有样品前期处理简单、样品需求量小等优点,然而其分子探针合成成本较高,均一性较差,难以对一些区域较大的基因组序列进行捕获。杂交法在二代测序平台中应用较为广泛,主要分为固相杂交法和液相杂交两种方法,固相杂交法所用的探针通常都是固定在固体支持物上,如玻璃片、塑料球等,其中最典型的是基因芯片。液相杂交与固相杂交最大的差异在于杂交反应的环境不同。液相杂交是通过在溶液中,目标DNA片段和已带有生物素标记探针直接杂交,然后通过生物素亲和素的反应使目标DNA片段锚定在带有亲和素的微珠上。洗去非目标DNA,洗脱后,富集的DNA用于测序。液相杂交与固相杂交相比有两大优势:杂交效率更高;易于操作,时间短,便于自动化操作。
[0005] 因此,基于以上研究成果及技术特点,开发一种合适的、准确度高的、低成本的检测癌症相关基因的测序方法是迫切需要的技术进步,这一方法可以有效地评估人们的患癌风险,根据结果对高风险人群进行科学的健康管理,达到提早预防和发现癌症的目的。

发明内容

[0006] 本发明一方面在于提供了一种从人的血液样本DNA或癌组织样本DNA中有选择地捕获特定外显子或目标基因的高效而低成本的捕获文库的构建方法。
[0007] 本发明涉及的肿瘤相关的50个热点突变基因的捕获文库的构建方法,是针对肿瘤相关的50个热点突变基因的207个高突变区域(如TP53、KRAS、HRAS等)设计的,其基因名称和染色体坐标信息如表2,再根据表2所述的每个区域设计特异扩增引物(如表3,其碱基序列如SEQ ID NO.1~414所示),分别进行PCR扩增,207个PCR产物纯化后分别定量,等量混合扩增片段,最终构建捕获文库。
[0008] 上文所述的捕获文库的构建方法,还包括利用碱基序列如SEQ ID NO.1~414所述的引物,用标准的人基因组DNA作为模板进行PCR扩增、纯化、分别定量后,均一等量混合207个PCR产物,将混合的PCR产物进行片断化处理,获得大小为70-130bp的DNA片断,通过表面带有链霉亲和素标记的磁珠来分离纯化带有生物素标记的含有目标基因DNA片断,从而获得带有生物素标记的捕获文库。
[0009] 具体的,上文使用 3.0荧光计(Thermo Fisher Scientific)对每个PCR产物进行定量。根据定量的结果均一等量混合207个PCR产物。具体的,本发明实施例中是将PCR产物统一稀释至25ng/μL,后每个取2μL混合。本领域技术人员可以根据需要自行调整此浓度。
[0010] 对于上述技术方案,优选的情况下,所述进行片断化处理的方法为超声波打断法。
[0011] 对于上述技术方案,优选的情况下,所述PCR扩增体系为:
[0012]
[0013] PCR扩增条件为:
[0014] 95℃、5min;95℃、30s,55℃、30s,72℃、30s,35个循环;72℃、10min;4℃、∞。
[0015] 上述操作涉及将生物素标记的Biotin-11-dUTP掺入合成的DNA产物中,通过优化PCR的反应体系,主要是优化dUTP与dTTP的比例,当dUTP:dTTP为1:3时,扩增带有Biotin-11-dUTP的PCR产物效果最佳。
[0016] 本发明的另一方面在于,保护利用上述方法获得的肿瘤相关突变基因的捕获文库。
[0017] 本发明的另一方面在于,保护利用上述的捕获文库,制备的肿瘤相关突变基因的检测试剂盒。
[0018] 对于上述技术方案,优选的情况下,所述的检测试剂盒,其特征在于:包括以下试剂:
[0019] 建库试剂:KAPA Hyper Prep Kit Illumina platforms
[0020] 封闭试剂:COT DNA、封闭引物
[0021] 杂交试剂:Hybridiation缓冲液(Roche)
[0022] 探针:上文所述的杂交捕获文库
[0023] 生物素亲和磁珠:invitrogen MyOneTM Streptavidin T1
[0024] 洗脱试剂:1×Wash缓冲液I(1×SSC,0.1%SDS),1×Wash缓冲液II(0.1×SSC,0.1%SDS)
[0025] 富集试剂:KAPA HiFi HotStart ReadyMix,Post-LM-PCR Oligos 1&2,5μM。
[0026] 具体的利用上述的捕获文库制备的肿瘤相关突变基因的检测试剂盒,其使用方法已经在本发明实施例中写明。本领域技术人员可以根据实施例中的所述方法,即:3.样本基因组DNA提取及文库制备;4.目标序列的杂交捕获、洗脱与富集;5.文库质检;6.高通量测序与数据分析最终获得检测结果。
[0027] 有益效果:
[0028] 本发明所构建的捕获文库中每个PCR产物是均一等量混合,从而确保了目标区域捕获的一致性,同时由于每个PCR产物被随机打断成一些较短的DNA片段,每个短DNA片段都能特异的通过互补配对杂交捕获相对应的目标区域,从而确保了文库具有更高的捕获效率。这就解决了目前芯片捕获存在的捕获不均一的问题和捕获效率低的问题,可以提高测序的有效数据量。
[0029] 本发明提供的捕获文库构建方法,非常的适合应用于选择性的捕获特异性的目标基因,因此可以针对与特定疾病相关的基因。在这样的应用中,通常会针对疾病相关的十几个甚至数百个特定的基因,所以要求实验中能具有高特异性的捕获率和高通量的测序验证。
[0030] 为了解决靶基因捕获测序,本发明另一方面在于提供了一种从人的血液样本DNA或癌组织样本DNA中选择性地捕获特定外显子或目标基因的方法,提供了一种针对肿瘤相关的50个热点突变基因207个高突变区域的高效而低成本的检测试剂盒。
[0031] 本发明应用构建好的捕获文库对待测样本的目标区域进行杂交,从而有选择地捕获目标区域。这种方法不但具有高性价比的优势,而且检测结果具有较高的准确性和检出率。
[0032] 本发明中,构建的捕获文库可以同时杂交4-8个样品,样品可以通过本领域熟悉的二代建库方法先将待捕获样品分别进行测序文库构建,加上不同的index标记,一端加上Illumina公司的TruSeq Universal Adapter,另一端加上例如但不限于Illumina公司的Truseq Adapter index 1或者Truseq Adapter index 2或者Truseq Adapter index 3或者Truseq Adapter index 4,将加上不同index的4-8个样品进行等量混合,然后用捕获文库进行杂交捕获目标区域,最后将捕获的产物进行高通量测序,捕获的不同样品的目标区域后续分析时通过建库时加上的index标记进行区分。
[0033] 一种具体的实施方法,将本发明获得的肿瘤相关的热点突变基因捕获文库与含有待捕获的靶标基因组区域DNA片段杂交,捕获目标区域DNA片段,通过测序完成对肿瘤相关的热点突变基因的检测。

具体实施方式

[0034] 下面将结合实施例对本发明的实施方案进行详细的描述,但是本领域技术人员将会理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节,也可以实现本申请各权利要求保护的技术方案。
[0035] 实施例1
[0036] 具体而言,将本发明根据现有的或已获得的肿瘤相关的50个热点突变基因信息为基础,构建了针对肿瘤相关50个热点突变基因207个高突变区域的检测试剂盒,试剂盒首先将提取到的样本DNA经过超声打断成200-250bp的DNA片段(但不限于超声波打断法),经过末端修复、加“A”及连接过程将DNA片段连上index接头,随后利用构建的捕获文库与含有待捕获的靶标基因区域DNA片段杂交,捕获肿瘤相关热点突变基因的DNA片段,对这些DNA片段进行测序,经过生物信息学数据分析后获得样本检测结果。该技术方案包括从样品基因组DNA到测序结果输出的全部实验流程,主要包括样本采集、文库构建、杂交捕获、测序及数据分析四方面内容。
[0037] 1.样本采集、运送保存
[0038] 本发明样本采集使用无菌操作收集疾病样本(原癌灶或癌旁组织)或正常血液样本。样本运送需在低温条件下进行,样本需在低温环境中运输且需在24小时内送达实验室。采集的样本在2-8℃条件下保存不超过72小时;-20℃条件保存不超过1个月;需长期保存的样本需放于-80℃条件下保存。从样品采集之日起一周之内完成基因组DNA的提取。
[0039] 2.肿瘤相关的50个热点突变基因捕获文库构建
[0040] 用于基因捕获的文库DNA序列要具有较高的特异性,不受其他同源核酸序列的影响。本发明按照以下方式获得肿瘤相关的50个热点突变基因207个高突变区域的捕获文库,具体描述如下:
[0041] i)本发明构建的捕获文库包含目前已明确的与肿瘤密切相关的50个热点突变基因(如表1)207个高突变区域(如表2),这些基因被注释为癌基因与抑癌基因,其与肿瘤的发病密切相关,具体基因名称与染色体定位如下:
[0042] 表1捕获文库肿瘤相关的50个热点突变基因信息表
[0043]
[0044]
[0045] 表2. 207个高频突变区域的坐标信息如下
[0046]
[0047]
[0048]
[0049]
[0050] ii)确定目标基因并基于NCBI等数据库获获得基因序列信息后,利用专业引物设计软件Primer 5设计出扩增这些基因片段的特异性引物,共207对(如表3)。引物设计遵循以下原则:①引物核苷酸长度在20-35nt;②引物Tm值适中(50-65℃),且无发卡等结构;③利用NCBI数据库中的blast功能确定引物的高特异性。引物列表如下:
[0051] 表3针对50个热点基因设计的207对引物列表
[0052]
[0053]
[0054]
[0055]
[0056]
[0057]
[0058]
[0059] iii)通过普通PCR方法扩增每对引物后(此操作涉及将生物素标记的dUTP掺入合成的DNA产物中,实验证明扩增体系中dUTP:dTTP=1:3时,扩增带有生物素标记的PCR产物效率最高),产物进行柱纯化(参照TIANGEN Universal DNA Purification Kit)得到纯化后的含有目标基因的DNA片段,然后对207个PCR产物进行Qubit定量,根据定量结果将207个产物进行等量混合(将PCR产物统一稀释至25ng/μL,后每个取2μL混合)。
[0060] 所述的PCR扩增体系如下:共25μL
[0061]
[0062]
[0063] PCR扩增条件如下:
[0064] 95℃、5min;
[0065] 95℃、30s,55℃、30s,72℃、30s,35个循环;
[0066] 72℃、10min;
[0067] 4℃、∞
[0068] 随后利用超声打断仪Covairs S220将目的DNA片段打断至70-130bp。通过表面带有链霉亲和素标记的磁珠(invitrogen MyOneTM Streptavidin T1)来分离纯化带有生物素标记的目标DNA片断,最后利用0.1%SDS溶液在100℃金属浴10分钟的条件下将含有目标基因的DNA片段洗脱下来,得到带有生物素标记的捕获文库。
[0069] 本发明利用等量混合多对PCR产物的方法,使得每对引物对应的PCR产物能够均一的存在构建的捕获文库中,这为后续的测序提高了效率,提高了测序的有效数据量、均一性和覆盖度。
[0070] 3.样本基因组DNA提取及文库制备
[0071] 样本基因组DNA的提取方法参照Qiagen公司的QIAamp DNA Blood Mini Kit试剂盒,分别提取了编号为S19、S20、S23三个人全血基因组样本。将得到的高质量基因组DNA样本片段化成200-250bp的DNA片段,随后经过末端修复、加“A”及连接等过程,将DNA片段连上index接头(相关试剂来自KAPA Hyper Prep Kit Illumina platforms),经过PCR扩增纯化后得到样本DNA文库。
[0072] 4.目标序列的杂交捕获、洗脱与富集
[0073] i)样品准备:将上述获得的S19、S20、S23三个样本DNA文库等量混合,总量1μg,随后将COT DNA样本DNA文库与封闭引物按照如下比例混合。其中COT DNA作为基因组中重复率较高的一部分DNA片段,在杂交时有助于提高杂交效率。将上述混合好的样本在真空浓缩仪中60℃蒸干,用于后续杂交。
[0074]
[0075] ii)文库杂交与序列捕获:向上述混合好的样本中加入10.5μL杂交缓冲液和4.5μL杂交捕获探针文库,体系如下,涡旋30s充分溶解混匀后全速离心30s。
[0076]
[0077] 将上述反应体系放入热循环仪运行下列程序:
[0078]步骤 温度 时间
变性 95℃ 10min
杂交 47℃(热盖温度57℃) 64-72h
[0079] 将上述封闭后的样本在热循环仪中47℃保持,向反应管中加入4.5μL制备好的杂交捕获探针文库。混匀后在热循环仪上47℃进行杂交,反应64-72小时。
[0080] 杂交反应后,将15μL样品转移至事先经过1×Bead Wash缓冲液洗涤重悬的100μL链霉亲和素标记磁珠中,混匀后于47℃孵育45min,每隔15分钟吹打混匀一次,让捕获的片段与磁珠结合,特异吸附目标片段,将杂交到的片段抓取出来。
[0081] iii)洗脱与富集:样品的洗脱按照如下洗脱液依次进行:
[0082] ①孵育45min后,快速离心反应管,利用磁力架分离磁珠与缓冲液并去除上清液。
[0083] ②向反应管中加入200μL的1×Wash缓冲液I(1×SSC,0.1%SDS),吹打10次重悬磁珠,后于涡旋混合仪上涡旋8s,将反应管放于磁力架上,待液体澄清后小心弃上清。
[0084] ③向反应管中加入200μL 47℃预热1×Wash缓冲液II(0.1×SSC,0.1%SDS),缓慢吹打10次重悬磁珠,47℃温浴10min后,将反应管放于磁力架上,待液体澄清后小心弃上清。
[0085] ④重复③步骤3次。最后确保Wash缓冲液II去除干净。
[0086] ⑤将反应管从磁力架上去下,向管内加入50μL的PCR级别用水重悬磁珠。
[0087] 洗脱后磁珠带着捕获的目标DNA片段,进入样本的LM-PCR富集。LM-PCR反应体系如下(一个捕获样本做两管PCR反应):
[0088]
[0089] PCR反应条件为:98℃预变性45s;98℃变性15s,60℃退火30s,72℃延伸30s,共14个循环;72℃延伸1min;4℃保温。
[0090] 反应后,利用纯化磁珠AMPure beads纯化PCR扩增产物,得到捕获后的样本文库,质检后用于测序分析。
[0091] 5.文库质检
[0092] 本发明的文库质检包括三方面,一是文库片段大小质检,二是目标基因的富集度测定,三是文库定量检测。这三项指标是检测文库构建成功与否的必要步骤,更是测序获得高质量数据的必要保证。
[0093] 6.高通量测序与数据分析
[0094] 本发明采用本领域技术人员熟知的二代测序平台进行高通量测序,将捕获的序列在Illumina测序平台采用边合成边测序的方法进行序列测定(测序试剂均购自Illumina商业测序试剂盒),对得到的数据进行分析可知其上的标签序列,根据标签序列确定其对应的样本DNA来源。二代测序具有高通量的特点,为这一技术应用提供了快速高效的便利条件。本发明利用二代测序手段对上面方法获得的测序文库进行了测序并且获得了测序数据,有关分析结果如下:
[0095] 表3测序后数据分析结果
[0096]
[0097] 液相杂交捕获方法对肿瘤相关的50个热点突变基因测序的结果总结:在液相杂交体系中对约51kb大小的基因组区域进行序列捕获,结果显示,所有样本均取得了良好的测序捕获效果,平均测序深度都在5000X以上,且各位点均一性较好,覆盖率在99%以上,突变位点检出率在96%以上。结果显示该方法能有效的对50个热点突变基因进行测序检测,数据质量较高,检测结果可信。
[0098] 本发明是针对肿瘤相关的50个热点突变基因进行的基因检测,研究表明,这50个热点突变基因与癌症的发生有着密切联系,对临床上早期发现癌症预防癌症有着重大意义,同时本发明可应用于癌症的风险评估。下面根据三个具体检测结果进行具体说明。
[0099] 针对样本S19的检测结果如表4。
[0100] 表4样本S19检测分析结果
[0101]
[0102]
[0103]
[0104] 针对样本S19的检测结果如表5。
[0105] 表5样本S20检测分析结果
[0106]
[0107]
[0108] 针对样本S23的检测结果如表6。
[0109] 表6样本S23检测分析结果
[0110]
[0111]
[0112] 针对本发明,本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施实施例,而在实际操作中可在操作细节上作出适当改变,而不偏离发明的精神和范围。