一种针对一个或多个目标基因组区域进行边扩增边连接的方法转让专利

申请号 : CN201010163648.2

文献号 : CN101824412B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张秀清苏夜阳林琳汪建杨焕明

申请人 : 北京华大基因研究中心有限公司

摘要 :

本发明涉及一种针对一个或多个目标基因组区域进行边扩增边连接的公用接头设计方法。本发明又涉及一种针对一个或多个目标基因组区域进行边扩增边连接的方法。本发明所述方法适用于针对任意长度的目标基因组区域的边扩增边连接工作,所得到的非特异连接的长链DNA可根据研究需要应用于多种DNA分析平台。本发明还涉及一种针对一个或多个目标基因组区域序列重测序工作、建立随机DNA文库的方法,所得随机DNA文库可用于通过包括Sanger测序技术、边合成边测序技术在内的测序方法对所述一个或多个目标基因组区域序列进行重测序。

权利要求 :

1.一种针对一个目标基因组区域进行边扩增边连接的方法,包括步骤:

1)针对一个目标基因组区域,设计包含公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的用于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物中公用接头彼此反向互补;所述正向和反向引物的公用接头为GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC,所述目标基因组区域选自BRCA1和BRCA2的70个外显子;

2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,扩增目标基因组区域,得到在所述目标基因组区域5’端和3’端加入公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的可连接性DNA片段;

3)步骤2)获得的可连接性DNA片段,作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得可连接性DNA片段连接而成的长链DNA。

2.一种针对两个及两个以上的多个目标基因组区域进行边扩增边连接的方法,包括步骤:

1)针对多个目标基因组区域的每个区域,分别设计包含公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的用于多核苷酸扩增反应的正向和反向引物,其中每对正向和反向引物中公用接头彼此反向互补;所述正向和反向引物的公用接头为GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC,所述目标基因组区域选自BRCA1和BRCA2的70个外显子;

2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5’端和3’端加入公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的不同可连接性DNA片段;

3)将步骤2)获得的不同可连接性DNA片段进行等量地混合,作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链DNA。

3.一种建立针对一个目标基因组区域序列重测序随机DNA文库的方法,包括步骤:

1)针对一个目标基因组区域,设计包含公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的用于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物中公用接头彼此反向互补;

所述正向和反向引物的公用接头为GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC,所述目标基因组区域选自BRCA1和BRCA2的70个外显子;

2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,扩增目标基因组区域,得到在所述目标基因组区域5’端和3’端加入公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的可连接性DNA片段;

3)步骤2)获得的可连接性DNA片段作为第二轮多核苷酸扩增反应的模板进行扩增反应;得到由步骤2)所得可连接性DNA片段连接而成的长链DNA;

4)将步骤3)所得的长链DNA用DNA随机打断法打断,得到随机DNA文库。

4.一种建立针对两个及两个以上的多个目标基因组区域重测序随机DNA文库的方法,包括步骤:

1)针对多个目标基因组区域的每个区域,分别设计包含公用接头GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC的用于多核苷酸扩增反应的正向和反向引物,其中每对正向和反向引物中公用接头彼此反向互补;

所述正向和反向引物的公用接头为GTAAAACGACGGCCAGT和ACTGGCCGTCGTTTTAC,所述目标基因组区域选自BRCA1和BRCA2的70个外显子;

2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5’端和3’端加入公用接头的不同可连接性DNA片段;

3)将步骤2)获得的不同可连接性DNA片段进行等量地混合,作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链DNA;

4)将步骤3)所得的长链DNA用DNA随机打断法打断,得到随机DNA文库。

5.根据权利要求3或4所述的方法,其中步骤4)中打断所得长链DNA序列的方法为选自超声法、喷雾法、化学剪切法和酶剪切法的DNA随机打断方法。

说明书 :

一种针对一个或多个目标基因组区域进行边扩增边连接的

方法

[0001] 本申请是申请日为2007年8月15日、申请号为200710143624.9的同名专利申请的分案申请。

技术领域

[0002] 本发明涉及一种针对一个或多个目标基因组区域进行边扩增边连接的公用接头设计方法。本发明又涉及一种针对一个或多个目标基因组区域进行边扩增边连接的方法。本发明所述方法适用于针对任意长度的目标基因组区域的边扩增边连接工作,所得到的非特异连接的长链DNA可根据研究需要应用于多种DNA分析平台。本发明还涉及一种针对一个或多个目标基因组区域序列重测序工作、建立随机DNA文库的方法,所得随机DNA文库可用于通过包括Sanger测序技术、边合成边测序技术在内的测序方法对所述一个或多个目标基因组区域序列进行重测序。

背景技术

[0003] 自1983年Kary Mullis发明聚合酶链式反应(polymerase chainreaction,PCR)以来,历经三十多年,PCR技术已成为生物科学领域不可或缺的、运用广泛的实验技术。为不同的实验目的,在标准PCR基础上又衍生出RT-PCR(Reverse Transcriptase PCR,逆转录PCR)、Inverse PCR(反向PCR),In Situ PCR(原位PCR),Long PCR(长PCR),Real Time PCR(实时PCR),Single Cell PCR(单细胞PCR),Hot Start PCR(热启动PCR),Colony PCR(菌落PCR),AFLPPCR(Amplified Fragment Length Polymorphism PCR,扩增片断长度 多态性PCR)等多项技术手段。可以说,自PCR技术问世以来,分子生物学及之后的基于大规模测序反应的基因组学均得到了飞速的发展。
[0004] 本发明应用碱基互补配对的基本原理,通过设计含“公用接头”的目标基因组区域的引物,在第一轮多核苷酸扩增反应后,第二轮多核苷酸扩增反应中,将目标基因组区域在扩增的基础上进行高效地连接,即“边扩增边连接”。连接工作按随机顺序进行,在本发明的上下文中这种随机顺序连接的方式称为“非特异连接”。经过边扩增边连接得到由目标基因组区域的DNA片段经“非特异连接”而成的长链DNA,此长链DNA可根据研究需要应用于多种DNA分析平台。
[0005] 通过本发明提出的“边扩增边连接”方法获得长链DNA,并经过DNA随机打断法打断,可建立用于通过包括Sanger测序技术、边合成边测序技术在内的测序方法对所述一个或多个目标基因组区域序列进行重测序工作的随机DNA文库。
[0006] 本发明可运用于一个目标基因组区域的边扩增边连接和随机DNA文库建立工作,也可用于两个及两个以上的多个目标基因组区域边扩增边连接和随机DNA文库建立工作。 [0007] 设计目的的不同,使本发明提出的“边扩增边连接”反应与同样使用接头设计的串联PCR方法具有本质的分别:串联PCR是根据具体研究的需要,进行特殊的接头设计,将本属基因组不同区域的DNA,甚至是不同物种基因组的DNA片断进行“特异性”连接,以获得研究所需要的“功能性DNA片段”。而本发明是为了得到特异扩增的、“非特异连接”的长链DNA。
[0008] 在本发明中,除在目标基因组区域的引物设计中在正向引物和反向引物的5’端和3’端分别加上本发明提出的一对反向互补的公用接头外,两轮多核苷酸扩增反应均无需特殊处理;非特异连接长链DNA的生成无需“连接酶”作用。
[0009] 本发明获得的长链DNA可突破在保真要求限制下的长PCR(LongPCR)方法目的片段长度的限制,而且可免去使用包含特殊酶物质的试剂盒及设计更严格引物的麻烦;与使用同连接区域特异配对之接头的 串联PCR(overlap PCR)方法相比,本发明只需设计一对公用接头,在第二轮多核苷酸扩增反应中利用公用接头将目标基因组区域原始DNA片段按随机顺序连接,又免去了设计多对可用于特异串联的互补引物的工序,对本行业的技术人员来说本发明所涉及的实验室工作是简单易行且费用很低的。

发明内容

[0010] 本发明基于以下认识:在目标基因组区域的每对引物设计中加入反向互补的同一对“公用接头”(Universal Adaptor),对目标基因组区域的原始DNA片断进行特异性多核苷酸扩增和非酶法连接,形成由目标基因组区域DNA片段按随机顺序连接而成的长链DNA混合物。
[0011] 本发明获得的长链DNA可在诸多DNA分析平台上进行应用,对高通量重测序工作尤其具有重要的意义。在经过诸如超声法、喷雾法、化学剪切法、酶剪切法等在内的DNA随机打断法打断后,可重新获得含有目标基因组区域片段的DNA片段,这些DNA片段可高效地涵盖整个目标区域,将其作为重测序工作的随机DNA文库(DNA library),可有效地进行目标基因组区域的高通量重测序工作。
[0012] 本发明的一个方面,涉及一种用于针对一个或多个目标基因组区域进行边扩增边连接的公用接头,其为两条以5’→3’方向和以3’→5’方向碱基互补的寡核苷酸序列,其序列结构特征为:1)在多核苷酸扩增反应退火温度下不与目标基因组结合;2)自身不形成发夹等二级结构;3)胞嘧啶和鸟嘌呤的含量占四种碱基数量总和的20%-80%;且4)序列长度在7-100个碱基。具体的,所述一对公用接头中的一个加在多核苷酸扩增反应正向引物的5’端,与之互补的另一个加在多核苷酸扩增反应反向引物的5’端。 [0013] 本发明中,为满足加在引物两端而不影响对目标基因组区域进行扩增,同时为降低成本的要求,所述公用接头的长度应当尽可能选择较短的寡核苷酸序列,其长度适当地为8-50个碱基,优选为9-4 0个碱基,更优选为10-30个碱基,更优选为11-25个碱基,更优选为12-20个碱基,更优选为13-18个碱基,甚至更优选为17个碱基。
[0014] 本发明又一方面,涉及一种针对一个目标基因组区域进行边扩增边连接的方法,包括步骤:
[0015] 1)针对一个目标基因组区域,设计包含本发明所述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物中公用接头彼此反向互补; [0016] 2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,扩增目标基因组区域,得到在所述目标基因组区域5’端和3’端加入本发明所述公用接头的可连接性DNA片段;
[0017] 3)步骤2)获得的可连接性DNA片段,作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得可连接性DNA片段连接而成的长链DNA。 [0018] 在本发明中,所述目标基因组序列区域可以为任意长度的目标基因组区域,包括但不限于长度在70-10000个碱基的序列,例如,长度在100-3000个碱基的序列,长度在300-2000个碱基的序列,长度在700-1000个碱基的序列。
[0019] 在本发明的又一方面,涉及一种针对两个及两个以上的多个目标基因组区域进行边扩增边连接的方法,包括步骤:
[0020] 1)针对多个目标基因组区域的每个区域,分别设计包含本发明所述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中每对正向和反向引物所含公用接头彼此反向互补;
[0021] 2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5’端和3’端加入本发明所述公用接头的不同可连接性DNA片段;
[0022] 3)将步骤2)获得的不同可连接性DNA片段进行等量地混合,作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链 DNA。
[0023] 在本发明上下文中,所述第一轮多核苷酸扩增反应是指常规多核苷酸扩增反应,包括例如在多核苷酸扩增反应仪中首先升高温度,使原始DNA的双链解旋、打开,随即降低温度,使正、反向引物分别与目标基因组序列的5’和3’端序列配对、结合,并在多核苷酸聚合酶的作用下,按照碱基互补配对原则,以5’→3’的顺序、添加多核苷酸扩增反应的反应体系中游离的dNTPs,经过多次的“变性-退火-延伸”过程,使得所述目标基因组区域原始DNA序列得到高效的扩增。在本发明的上下文中,第一轮多核苷酸扩增反应所需扩增的目标基因组区域称为目标基因组区域原始DNA序列,经第一轮多核苷酸扩增后得到5’端和3’端加入本发明所述公用接头的目标基因组区域,称为“可连接性DNA片段”。 [0024] 在本发明上下文中,所述第二轮多核苷酸扩增反应是指将在本发明第一轮多核苷酸扩增反应获得的“可连接性DNA片段”,作为第二轮多核苷酸扩增反应的模板,在DNA双链解旋、打开后,在碱基互补配对原则的指引下,一条可连接性DNA片段的单链3’端的公用接头与另一条可与之互补的可连接性DNA片段的单链3’端的公用接头彼此配对,作为第二轮多核苷酸扩增反应的引物,在无需另加特殊引物的条件下,进行可连接性DNA片段的连接和多核苷酸扩增反应。扩增和连接同时进行,因此称为“边扩增边连接”反应。 [0025] 在第二轮多核苷酸扩增反应中,无需连接酶的处理,原始DNA片段在公用接头的带领下,可在扩增的同时进行随机顺序的连接,形成“非特异连接的长链DNA”。在本发明的上下文中,按随机顺序连接的方式也称为“非特异连接”。
[0026] 在本发明上下文中,在第二轮多核苷酸扩增反应中依据第一轮所得DNA产量大小进行等量混合是指,根据第一轮多核苷酸扩增反应产物的等摩尔量混合。具体的,可用例如Hoechst染料H33258或Picogreen对第一轮多核苷酸扩增反应所得产物进行准确定量。也可通过对多核苷酸扩增产物进行凝胶电泳,与已知量的DNA Marker比对 进行粗略定量。 [0027] 在本发明上下文中,所述针对多个目标基因组区域进行边扩增边合成的方法,适于两个或两个以上的任意多个目标基因组区域,包括2以及大于2的任意整数。例如,所述方法可以针对2-10000000个目标基因组区域进行边扩增边合成,例如2-1000000个目标基因组区域,2-100000个目标基因组区域,2-1000个目标基因组区域,2-100个目标基因组区域。
[0028] 本发明又一方面,涉及一种建立针对一个目标基因组区域序列重测序随机DNA文库的方法,包括步骤:
[0029] 1)针对一个目标基因组区域,设计包含本发明所述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中正向和反向引物中公用接头彼此反向互补; [0030] 2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,扩增目标基因组区域,得到在所述目标基因组区域5’端和3’端加入本发明所述公用接头的可连接性DNA片段;
[0031] 3)步骤2)获得的可连接性DNA片段作为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得可连接性DNA片段连接而成的长链DNA; [0032] 4)将步骤3)所得的长链DNA用DNA随机打断法打断,得到随机DNA文库。 [0033] 本发明的再一方面,涉及一种建立针对两个及两个以上的多个目标基因组区域重测序随机DNA文库的方法,包括步骤:
[0034] 1)针对多个目标基因组区域的每个区域,分别设计包含本发明所述公用接头的用于多核苷酸扩增反应的正向和反向引物,其中每对正向和反向引物所含公用接头彼此反向互补;
[0035] 2)利用步骤1)中所述正向和反向引物,通过第一轮多核苷酸扩增反应,分别扩增目标基因组区域,得到在各个目标基因组区域5’端和3’端加入公用接头的不同可连接性DNA片段;
[0036] 3)将步骤2)获得的不同可连接性DNA片段进行等量地混合,作 为第二轮多核苷酸扩增反应的模板进行边扩增边连接反应;得到由步骤2)所得不同的可连接性DNA片段按随机连接顺序连接而成的长链DNA;
[0037] 4)将步骤3)所得的长链DNA用DNA随机打断法打断,得到随机DNA文库。 [0038] 在本发明上下文中,所述建立针对多个目标基因组区域重测序随机DNA文库的方法,适于两个或两个以上的任意多个目标基因组区域,包括2以及大于2的任意整数。例如,所述方法可以针对2-10000000个目标基因组区域进行边扩增边合成,例如2-1000000个目标基因组区域,2-100000个目标基因组区域,2-1000个目标基因组区域,2-100个目标基因组区域。
[0039] 在本发明上下文中,打断所得长链DNA序列所述DNA随机打断法包括超声法、喷雾法、化学剪切法、酶剪切法等在内的本领域周知的打断DNA序列的方法。

附图说明

[0040] 图1描述了利用公用接头进行目标基因组区域边扩增边连接反应的流程。其中 [0041] 图1A示例了引物设计过程,具体的,(1)显示为设计好的引物,包含黑色的公用接头(Universal Adaptor)和花色的目标基因组区域原始引物两部分;(2)显示所设计的引物,在第一轮多核苷酸扩增反应的退火过程中,可与目标基因组区域进行配对,引导目标基因组区域原始DNA序列的特异性扩增。
[0042] 图1B示例了第一轮多核苷酸扩增反应:将设计好的含有公用接头的引物使特定的目标基因组区域扩增,得到目标基因组区域原始DNA序列5’端和3’端加上公用接头的可连接性DNA片段(4)。其中,一个多核苷酸扩增反应只扩增一个目标基因组区域。若目标基因组区域数目大于1,则每个目标基因组区域的多核苷酸扩增反应需独立进行。 [0043] 图1C示例了第二轮多核苷酸扩增和连接反应(边扩增边连接反应)。具体分两种情况:
[0044] 1)针对一个目标基因组区域,以第一轮多核苷酸扩增产物为模板、公用接头为引物进行第二轮多核苷酸扩增反应(未画出);
[0045] 2)针对两个及两个以上的多个目标基因组区域,将第一轮多核苷酸扩增得到的可连接性DNA片段进行等量混合,将混合物作为第二轮多核苷酸扩增反应模板、公用接头为引物进行第二轮多核苷酸扩增反应,如(2)-(3)-(4)所示;
[0046] 其中,反向互补的公用接头在多核苷酸扩增反应退火阶段彼此配对,作为第二轮多核苷酸扩增反应的引物,使可连接性DNA片段解旋后的单链在多核苷酸聚合酶的作用下延伸、形成双链DNA,获得非特异连接的长链DNA。扩增和连接反应同时进行,称为“边扩增边连接”反应。
[0047] 获得的长链DNA可运用类似全基因组打碎后测序的策略,通过(5)用DNA随机打断法将长链DNA打断、建立随机DNA文库,再用包含Sanger测序技术、边合成边测序技术在内的测序方法进行测序。
[0048] 图2为实施例1中经过第一轮多核苷酸扩增反应,获得的“可连接性DNA片段”的凝胶电泳图,其中9个可连接性DNA片段为9个目标基因组区域CSF1R-10、CSF1R-18、JAK2-1、JAK2-5、JAK2-9、JAK2-12、KRAS-1、KRAS-4和NRAS-1原始序列的5’端和3’端连接上公用接头(各20个碱基,共计40个碱基)后的产物,用CSF1R-10’(483bp)、CSF1R-18’(375bp)、JAK2-1’(524bp)、JAK2-5’(595bp)、JAK2-9’(556bp)、JAK2-12’(490bp)、KRAS-1’(531bp)、KRAS-4’(404bp)和NRAS-1’(419bp)表示。其中胶图上NRAS-1’的大小(约500bp)与理论值(419bp)不符,重测序结果证明NRAS-1存在非特异扩增。
[0049] 图3为实施例1中第二轮多核苷酸扩增和连接反应,即边扩增边连接反应获得的“非特异连接的长链DNA”的凝胶电泳图;
[0050] 图4为将边扩增边连接反应得到的非特异连接的长链DNA产物用超声法打断、建库、用Sanger测序技术测序,所得到的含有杂合位点 的片段测序结果。其中在用超声法将非特异连接的长链DNA产物打断后,建立pUC 118DNA文库,并在ABI公司的3730x1测序仪上用Sanger测序法进行重测序工作。图中所示为CSF1R-10重测序后得到的杂合位点显示。
[0051] 图5为实施例2中所得非特异连接的长链DNA之凝胶电泳图。
[0052] 图6为实施例3中所得凝胶电泳图,其中选择人类基因组中与癌症相关的候选基因BRCA2的第10个外显子的一部分(在本实施例中命名为BRCA2-10j)作为一个目标基因组区域,利用公用接头(各17个碱基,共34个碱基),经过两轮多核苷酸扩增反应,将一个目标基因组区域扩增并连接形成长链DNA。
[0053] 图7为实施例4中所得酶切反应电泳图。其中选择人类基因组中与癌症相关的候选基因BRCA2的第6个外显子(序列长度:446,在5’至3’方向的第167个碱基处含一个BamH I酶切位点)作为一个目标基因组区域,利用公用接头(各17个碱基,共34个碱基),经过两轮多核苷酸扩增反应,将一个目标基因组区域扩增并连接形成的长链DNA,随后将第一轮多核苷酸扩增反应产物和经两轮多核苷酸反应扩增、连接得到的长链DNA用异丙醇沉淀法纯化,并在相同条件下用BamHI酶切。实施例
[0054] 实施例1
[0055] 实施例1选用人类基因组中癌症相关的候选基因CSF1R基因的第10、18个外显子、JAK2基因的第1、5、9、12外显子、KRAS基因的第1、4外显子和NRAS基因的第1个外显子作为目标基因组区域,通过两轮多核苷酸反应扩增、连接,并通过Sanger测序技术测序验证本方法的有效性。
[0056] 具体过程如下:
[0057] 1.引物设计:
[0058] 选择人类基因组中与癌症相关的候选基因CSF1R基因的第10、18个外显子、JAK2基因的第1、5、9、12外显子、KRAS基因的第1、4外显子和NRAS基因的第1个外显子作为目标基因组区域原始DNA片段,用Primer 3软件设计9对引物,在9对引物中为正向引物加上CGCGGATCC GCGGCCGC TTC序列,在反向引物加上GAA GCGGCCGC GGATCC GCG序列(均增加在引物序列的5’端),这两段寡核苷酸序列反向互补,为本实施例的公用接头,其中GGATCC为Bam HI酶切位点,GCGGCCGC为Not I酶切位点。
[0059] 设计好的引物为(下划线部分即为公用接头序列):
[0060] CSF1R-10(序列长度:443):
[0061] 正向引物:CGCGGATCCGCGGCCGCTTCGAGCACCCACTGTGTTCCAG
[0062] 反向引物:GAAGCGGCCGCGGATCCGCGTGATTAGCACCTGTCTCTCGC
[0063] CSF1R-18(序列长度:335):
[0064] 正向引物:CGCGGATCCGCGGCCGCTTCTCCAACTACATTGTCAAGGGC
[0065] 反向引物:GAAGCGGCCGCGGATCCGCGCATTCCTGCACTCTCACCAAC
[0066] JAK2-1(序列长度:484):
[0067] 正向引物:CGCGGATCCGCGGCCGCTTCTTCTGGGCTCAAGCTATCTGC
[0068] 反向引物:GAAGCGGCCGCGGATCCGCGAACACACACGCCAGCCATAC
[0069] JAK2-5(序列长度:555):
[0070] 正向引物:CGCGGATCCGCGGCCGCTTCCACTTGGCCACTGTGTTGTAA
[0071] 反向引物:GAAGCGGCCGCGGATCCGCGAATGGGAGAAGTGCAATACCA
[0072] JAK2-9(序列长度:516):
[0073] 正向引物:CGCGGATCCGCGGCCGCTTCGGCACTACATCGGATTCATGG
[0074] 反向引物:GAAGCGGCCGCGGATCCGCGGAACTTCAAGTCACTTCTAGACCACC [0075] JAK2-12(序列长度:450):
[0076] 正向引物:CGCGGATCCGCGGCCGCTTCGCCTGTTTGACTGGCATTATTC
[0077] 反向引物:GAAGCGGCCGCGGATCCGCGCTGACACCTAGCTGTGATCCTG
[0078] KRAS-1(序列长度:491):
[0079] 正向引物:CGCGGATCCGCGGCCGCTTCTCTTAAGCGTCGATGGAGGAG
[0080] 反向引物:GAAGCGGCCGCGGATCCGCGTTGAAACCCAAGGTACATTTCAG
[0081] KRAS-4(序列长度:364):
[0082] 正向引物:CGCGGATCCGCGGCCGCTTCTCAGTTGCCTGAAGAGAAACATAA
[0083] 反向引物:GAAGCGGCCGCGGATCCGCGTAACAGTCTGCATGGAGCAGG
[0084] NRAS-1(序列长度:379):
[0085] 正向引物:CGCGGATCCGCGGCCGCTTCCCAAATGGAAGGTCACACTAGG
[0086] 反向引物:GAAGCGGCCGCGGATCCGCGGAACTCAACACTGAGTTTGCAATAG
[0087] 2.第一轮多核苷酸扩增反应:
[0088] 九个目标基因组区域原始DNA片断的扩增反应独立进行。
[0089] 多核苷酸扩增体系(10μl):DNA(5ng/μl):1μl,引物(10μM):正反向引物各0.4μl,Taq DNA聚合酶(5U/μl):1μl,10×buffer:5μl,dNTPs(2.5mM):0.8μl,ddH2O:
1.4μl。
[0090] 多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上反应): [0091] 94度/10分钟
[0092] 94度/30秒-58度/30秒-72度/1分钟,40个循环
[0093] 72度/5分钟。
[0094] 第一轮多核苷酸扩增反应结束后,获得在两端连上公用接头的可用于“边扩增边连接”反应的CSF1R-10,CSF1R-18,JAK2-1,JAK2-5,JAK2-9,JAK2-12,KRAS-1,KRAS-4和NRAS-1共九种可连接性DNA片段,用CSF1R-10′、CSF1R-18′、JAK2-1′、JAK2-5′、JAK2-9′、JAK2-12′、KRAS-1′、KRAS-4′和NRAS-1′表示。根据扩增产量,九种产物以等DNA量的方式进行混合,作为第二轮多核苷酸扩增和连接反应的模板。
[0095] 实验胶图见图2。
[0096] 3.第二轮多核苷酸扩增和连接反应(边扩增边连接反应):
[0097] 多核苷酸扩增体系(20μl):模板:8μl,Taq DNA聚合酶(5U/μl):2μl,10×buffer:2μl,dNTPs(2.5mM):1.6μl,ddH2O:6.4μl。其中模板取自第一轮多核苷酸扩增反应所得产物的等量混合物。
[0098] 多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反应): [0099] 94度/2分钟
[0100] 94度/15秒-60度/30秒-68度/8分钟,10个循环94度/15秒-60度/30秒-68度/8分钟(每轮循环增加20秒),共15个循环
[0101] 72度/10分钟。
[0102] 第二轮多核苷酸扩增和连接反应结束后,获得“非特异连接的长链DNA”。 [0103] 本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。获得的非特异连接的长链DNA的电泳检测胶图见图3。
[0104] 4.建立载体文库、使用Sanger测序技术测序:
[0105] 运用超声法打断已获得的非特异连接的长链DNA。取长度在1.5~2kb的片段建立pUC 118 DNA文库,并在ABI公司的3730x1测序仪上用Sanger测序技术测序。片段测序的结果与原始DNA片段第一轮多核苷酸扩增后的产物测序结果进行比对,以确定“打断后DNA片段”的序列位置,并验证测序质量。
[0106] 统计结果显示:打断后DNA片段中含CSF1-10片段17条,CSF1R-18片段21条,JAK2-1片段12条,JAK2-5片段55条,JAK2-9片段21条,JAK2-12片段40条,KRAS-1片段19条,KRAS-4片段45条,NRAS-1片段36条,共获有效读长7274bp,占总测序量的63.89%。
在余下的测序读长中,非特异性扩增产物达20.37%,可通过提高原始DNA片段的引物质量,减少非特异性扩增,提高测序效率。
[0107] 对获得有效读长的DNA片段的统计表明,已获得的DNA片段可完 全覆盖本实施例中的九个目标基因组区域,并可有效检测出本实施例中九个目标基因组区域原始DNA片段中所含有的全部杂合位点。图4显示了其中一个来自CSF1-10序列的杂合位点。 [0108] 实施例2:
[0109] 本实施例选用人类基因组中癌症相关的候选基因BRCA1和BRCA2基因的70个外显子作为目标基因组区域,通过两轮多核苷酸反应扩增、连接。
[0110] 具体过程如下:
[0111] 1.引物设计:
[0112] 选择人类基因组中与癌症相关的候选基因BRCA1和BRCA2基因的70个外显子作为70个目标基因组区域,用Primer3软件设计70对引物,在每对引物中的一个加上17个碱基长度的GTAAAACGACGGCCAGT序列,另一个加上17个碱基长度的ACTGGCCGTCGTTTTAC序列(均增加在引物序列的5’端),这两段寡核苷酸序列反向互补,为本实验的公用接头。 [0113] 以BRCA1基因的第1、第10个外显子,和BRCA2基因第5、第24个外显子为例,设计好的引物为(下划线部分即为公用接头序列):
[0114] BRCA1-1(序列长度:530):
[0115] 正向引物:GTAAAACGACGGCCAGTATTGCGCCATCACACTCTAGC
[0116] 反向引物:ACTGGCCGTCGTTTTACTTTGTGCTCATGGCAGATTTC;
[0117] BRCA1-18(序列长度:548):
[0118] 正向引物:GTAAAACGACGGCCAGTGGGTTTCTCTTGGTTTCTTTGA
[0119] 反向引物:ACTGGCCGTCGTTTTACGTTGCCAGAATAAATGAAAATGGT
[0120] BRCA2-5(序列长度:451):
[0121] 正向引物:GTAAAACGACGGCCAGTCAATGTACACATGTAACACCACAAA
[0122] 反向引物:ACTGGCCGTCGTTTTACCCAAGACATATCAGGATCCACCT
[0123] BRCA2-24(序列长度:452):
[0124] 正向引物:ACTGGCCGTCGTTTTACTCAGCTATTTTGATTTGCTTTTATT
[0125] 反向引物:GTAAAACGACGGCCAGTAGCTATTTCCTTGATACTGGACTG
[0126] 2.第一轮多核苷酸扩增反应:
[0127] 多核苷酸扩增体系(10μl):DNA(5ng/μl):1μl,引物(5μM):正反向引物各0.4μl,Taq DNA聚合酶(5U/μl):1μl,10×buffer:1μl,dNTPs(2.5mM):0.8μl,ddH2O:
5.4μl。
[0128] 多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上反应): [0129] 94度/5分钟
[0130] 94度/30秒-62度/35秒-72度/35秒,40个循环
[0131] 72度/10分钟。
[0132] 第一轮多核苷酸扩增反应结束后,获得在70个目标基因组区域原始序列的5’端和3’端连上公用接头的可用于“边扩增边连接”反应的70种产物。根据扩增产量,70种产物以等DNA量的方式进行混合,作为第二轮多核苷酸扩增和连接反应的模板。 [0133] 3.第二轮多核苷酸扩增和连接反应(边扩增边连接反应):
[0134] 多核苷酸扩增体系(20μl):模板:6μl,Taq DNA聚合酶(5U/μl):2μl,10×buffer:2μl,dNTPs(2.5mM):1.6μl,ddH2O:8.4μl。其中模板取自第一轮多核苷酸扩增反应所得产物的等量混合物。
[0135] 多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反应): [0136] 94度/2分钟
[0137] 94度/15秒-60度/30秒-68度/8分钟,10个循环94度/15秒-60度/30秒-68度/8分钟(每轮循环增加20秒),共15个循环
[0138] 72度/10分钟。
[0139] 第二轮多核苷酸扩增和连接反应结束后,获得“非特异连接的长 链DNA”。 [0140] 本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。获得的非特异连接的长链DNA的电泳检测胶图见图5。
[0141] 4.建立随机DNA文库、使用边合成边测序测序技术进行测序:
[0142] 根据Illumina Genome Analyer测序仪工作条件要求,运用喷雾法打断已获得的非特异连接的长链DNA,取长度在100-200bp的片段建立随机DNA文库,在Illumina Genome Analyer测序仪上运用边合成边测序技术进行测序。片段测序的结果与目标区域的碱基序列进行比对,以确定“打断后DNA片段”的序列位置,并验证测序质量。
[0143] 统计结果显示:70个目标基因组区域全部比对成功,覆盖率均达100%,平均每个碱基覆盖的次数达2000次。对杂合位点的分析显示使用本发明提出的方法合成的目标基因组区域非特异连接的长链DNA、结合边合成边测序技术进行测序,可有效检测出所有的杂合位点。与70个目标基因组区域的PCR产物用Sanger法重测序结果比较,无假阳性和假阴性。
[0144] 实施例3:
[0145] 本实施例选用人类基因组中癌症相关的候选基因BRCA2的第10个外显子的一部分(在本实施例中命名为BRCA2-10j)作为目标基因组区域,通过两轮多核苷酸反应扩增、连接。
[0146] 具体过程如下:
[0147] 1.引物设计:
[0148] 选择人类基因组中与癌症相关的候选基因BRCA2的第10个外显子的一部分(在本实施例中命名为BRCA2-10j)作为一个目标基因组区域,用Primer3软件设计引物,在正向引物中一个加上17个碱基长度的序列GTAAAACGACGGCCAGT,在反向引物中加上17个碱基长度的ACTGGCCGTCGTTTTAC序列(均增加在引物序列的5’端),这两段寡核 苷酸序列反向互补,为本实验的公用接头。
[0149] 设计好的引物为(下划线部分即为公用接头序列):
[0150] BRCA2-10j(序列长度:478):
[0151] 正向引物:GTAAAACGACGGCCAGTAAAGATGAAACGGACTTGCTATT
[0152] 反向引物:ACTGGCCGTCGTTTTACGTTGTCCCTGGAAGGTCACTA。
[0153] 2.第一轮多核苷酸扩增反应:
[0154] 多核苷酸扩增体系(10μl):DNA(5ng/μl):1μl,引物(5μM):正反向引物各0.4μl,Taq DNA聚合酶(5U/μl):1μl,10×buffer:1μl,dNTPs(2.5mM):0.8μl,ddH2O:
5.4μl。
[0155] 多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上反应): [0156] 94度/5分钟
[0157] 94度/30秒-62度/35秒-72度/35秒,40个循环
[0158] 72度/10分钟。
[0159] 第一轮多核苷酸扩增反应结束后,获得在这一个目标基因组区域原始序列的5’端和3’端连上公用接头的可用于进一步连接的可连接性DNA片段:BRCA2-10j’(序列长度:512)。
[0160] 实验胶图见图6。
[0161] 3.第二轮多核苷酸扩增和连接反应:
[0162] 多核苷酸扩增体系(20μl):模板:8μl,Taq DNA聚合酶(5U/μl):2μl,10×buffer:2μl,dNTPs(2.5mM):1.6μl,ddH2O:6.4μl。其中模板取自第一轮多核苷酸扩增反应所得产物。
[0163] 多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反应): [0164] 94度/2分钟
[0165] 94度/15秒-60度/30秒-68度/8分钟,10个循环
[0166] 94度/15秒-60度/30秒-68度/8分钟(每轮循环增加20秒), 共15个循环 [0167] 72度/10分钟。
[0168] 第二轮多核苷酸扩增和连接反应结束后,获得“非特异连接的长链DNA”。 [0169] 本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。获得的非特异连接的长链DNA的电泳检测胶图见图6。
[0170] 实施例4:
[0171] 本实施例选用人类基因组中癌症相关的候选基因BRCA2的第6个外显子(序列长度:446,在5’→3’方向的第167个碱基处含一个BamH I酶切位点)作为一个目标基因组区域,通过两轮多核苷酸扩增反应扩增、连接成长链DNA。第一轮多核苷酸扩增反应产物和经两轮多核苷酸反应扩增、连接得到的长链DNA经异丙醇沉淀法纯化后、在相同条件下进行BamH I酶切。
[0172] 具体过程如下:
[0173] 1.引物设计:
[0174] 选择人类基因组中与癌症相关的候选基因BRCA2的第6个外显子的作为一个目标基因组区域,用Primer3软件设计引物,在正向引物中一个加上17个碱基长度的序列GTAAAACGACGGCCAGT,在反向引物中加上17个碱基长度的ACTGGCCGTCGTTTTAC序列(均增加在引物序列的5’端),这两段寡核苷酸序列反向互补,为本实验的公用接头。 [0175] 设计好的引物为(下划线部分即为公用接头序列):
[0176] BRCA2-6(序列长度:446):
[0177] 正向引物:GTAAAACGACGGCCAGTTTCTGCCTCATACAGGCAATTC
[0178] 反向引物:ACTGGCCGTCGTTTTACCATAATGCTTGACACCACTGGAC。
[0179] 2.第一轮多核苷酸扩增反应:
[0180] 多核苷酸扩增体系(10μl):DNA(5ng/μl):1μl,引物(5μ M):正反向引物各0.4μl,Taq DNA聚合酶(5U/μl):1μl,10×buffer:1μl,dNTPs(2.5mM):0.8μl,ddH2O:
5.4μl。
[0181] 多核苷酸扩增反应程序(在GeneAmp 9700多核苷酸扩增反应仪上反应): [0182] 94度/5分钟
[0183] 94度/30秒-58度/35秒-72度/35秒,40个循环
[0184] 72度/10分钟。
[0185] 第一轮多核苷酸扩增反应结束后,获得在这一个目标基因组区域原始序列的5’端和3’端连上公用接头的可用于进一步连接的可连接性DNA片段:BRCA2-6’(序列长度:480)。
[0186] 实验胶图见图7。
[0187] 3.第二轮多核苷酸扩增和连接反应:
[0188] 多核苷酸扩增体系(20μl):模板:8μl,Taq DNA聚合酶(5U/μl):2μl,10×buffer:2μl,dNTPs(2.5mM):1.6μl,ddH2O:6.4μl。其中模板取自第一轮多核苷酸扩增反应所得产物。
[0189] 多核苷酸扩增程序(在GeneAmp 9800多核苷酸扩增反应仪上反应): [0190] 94度/1分钟
[0191] 94度/10秒-68度/15分钟,14个循环
[0192] 94度/10秒-68度/15分钟(每轮循环增加15秒),共16个循环
[0193] 72度/10分钟。
[0194] 第二轮多核苷酸扩增和连接反应结束后,获得“非特异连接的长链DNA”。 [0195] 本轮多核苷酸扩增反应无需添加引物,连接反应无需添加连接酶。获得的非特异连接的长链DNA的电泳检测胶图见图7。
[0196] 4.BamH I酶切:
[0197] 首先将第一轮多核苷酸扩增反应获得的产物、和经两轮多核苷酸反应扩增、连接获得的长链DNA,用异丙醇沉淀法进行纯化。具体过程如下:
[0198] 取第一轮多核苷酸扩增反应扩增产物100μl,加入100μl异丙醇,10μlNaCl2(6mM),-80℃冷冻1小时后在4℃温度条件下、13,000r pm转速离心30分钟,弃去上清液后加入500μl 80%乙醇,4℃温度条件下、13,000rpm转速离心10分钟,弃去上清液,室温晾干,加入100μll ddH2O,混合均匀。用NanoDrop核酸蛋白测定仪ND-1000测得纯化后产物浓度为:37.9ng/μl;
[0199] 取经两轮多核苷酸反应扩增、连接获得的长链DNA产物30μl,加入30μl异丙醇,3μl NaCl2(6mM),-80℃冷冻1小时后在4℃温度条件下、13,000rpm转速离心30分钟,弃去上清液后加入500μl 80%乙醇,4℃温度条件下、13,000rpm转速离心10分钟,弃去上清液,室温晾干,加入100μlddH2O,混合均匀。用NanoDrop核酸蛋白测定仪ND-1000测得纯化后产物浓度为:35.0ng/μl。
[0200] 将纯化后的产物在相同条件下进行BamHI酶切。具体过程如下:
[0201] 酶切反应体系(20μl):纯化后产物:6μl,BamH I酶(15U/μl):1.5μl,10×k buffer:2μl,0.1%BSA:2μl,ddH2O:8.5μl。
[0202] 反应条件:37℃水浴2小时,酶切实验的胶图见图7。
[0203] 图7显示:经纯化处理过的可连接性DNA片段(BRCA2-6’)经BamHI酶切后得到两条特异性片段,而经纯化处理过的经本发明提出的实验方法扩增、连接得到的长链DNA经BamH I酶切后得到片段长度与可连接性DNA片段长度一致的产物。酶切实验的结果证实了本发明提出的针对目标基因组区域进行的边扩增边连接方法的有效性。