基因组大片段直接克隆和DNA多分子组装新技术转让专利

申请号 : CN201710177676.1

文献号 : CN106995813B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张友明王海龙符军A.F.斯图尔特

申请人 : 山东大学德累斯顿工业大学

摘要 :

一种基因组大片段直接克隆和DNA多分子组装新技术。本发明提供了同源重组的方法,所述方法包括使用第一核酸外切酶处理两个或两个以上目标核酸分子,然后使处理后的目标核酸分子在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中发生同源重组的目标核酸分子之间共享至少一段序列同源区域。本发明还提供了用于本发明的方法的试剂盒。

权利要求 :

1.一种同源重组的方法,所述方法包括使用第一核酸外切酶处理两个或两个以上目标核酸分子,然后使处理后的目标核酸分子在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中发生同源重组的目标核酸分子之间共享至少一段序列同源区域,其中所述第一核酸外切酶处理包括体外连接步骤,所述体外连接步骤使所述两个或两个以上目标核酸分子连接起来,其中所述体外连接步骤包括被所述第一核酸外切酶酶切和退火步骤,其中不同核酸分子的酶切可以是单独进行也可以是同时进行,其中所述第二核酸外切酶是RecE,其中所述退火蛋白是RecT,且其中所述同源重组在大肠杆菌细胞中进行。

2.一种同源重组的方法,其中所述方法包括使用第一核酸外切酶处理第一核酸分子与第二核酸分子,然后使处理后的第一核酸分子与第二核酸分子在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中第一核酸分子和第二核酸分子之间共享至少一段序列同源区域,其中所述第一核酸外切酶处理包括体外连接步骤,所述体外连接步骤使所述第一核酸分子与所述第二核酸分子连接起来,其中所述体外连接步骤包括被所述第一核酸外切酶酶切和退火步骤,其中不同核酸分子的酶切可以是单独进行也可以是同时进行,其中所述第二核酸外切酶是RecE,其中所述退火蛋白是RecT,且其中所述同源重组在大肠杆菌细胞中进行。

3.一种组装核酸分子的方法,所述方法包括使用第一核酸外切酶处理两个或两个以上的核酸分子,然后使处理后的核酸分子混合物在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中每个核酸分子与在所产生的组装产物中形成邻近物的核酸分子共享至少一段序列同源区域,其中所述第一核酸外切酶处理包括体外连接步骤,所述体外连接步骤使所述两个或两个以上的核酸分子连接起来,其中所述体外连接步骤包括被所述第一核酸外切酶酶切和退火步骤,其中不同核酸分子的酶切可以是单独进行也可以是同时进行,其中所述第二核酸外切酶是RecE,其中所述退火蛋白是RecT,且其中所述同源重组在大肠杆菌细胞中进行。

4.一种克隆基因组DNA的方法,其中方法包括使用第一核酸外切酶处理基因组DNA片段混合物和线性克隆载体,然后使处理后的基因组DNA片段混合物中的目标DNA片段和线性克隆载体在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中基因组DNA片段混合物中目标DNA片段与线性克隆载体之间共享至少一段序列同源区域,其中所述第一核酸外切酶处理包括体外连接步骤,所述体外连接步骤使处理后的线性克隆载体和基因组DNA片段混合物中的目标DNA片段连接起来,其中所述体外连接步骤包括被所述第一核酸外切酶酶切和退火步骤,其中不同核酸分子的酶切可以是单独进行也可以是同时进行,其中所述第二核酸外切酶是RecE,其中所述退火蛋白是RecT,且其中所述同源重组在大肠杆菌细胞中进行。

5.根据权利要求1-4任一项的方法,其中所述序列同源区域可以在目标核酸分子内部或末端。

6.根据权利要求5的方法,其中至少一个所述序列同源区域在目标核酸分子末端。

7.根据权利要求5的方法,其中所述序列同源区域均在目标核酸分子末端。

8.根据权利要求5的方法,其中所述序列同源区域的长度为至少6个核苷酸。

9.根据权利要求5的方法,其中所述序列同源区域的长度为至少10个核苷酸。

10.根据权利要求5的方法,其中所述序列同源区域的长度为至少20个核苷酸。

11.根据权利要求5的方法,其中所述序列同源区域的长度为至少25个核苷酸。

12.根据权利要求5的方法,其中所述序列同源区域的长度为至少30个核苷酸。

13.根据权利要求5的方法,其中所述序列同源区域的长度为至少40个核苷酸。

14.根据权利要求5的方法,其中所述序列同源区域的长度为至少50个核苷酸。

15.根据权利要求5的方法,其中所述序列同源区域的长度为至少60个核苷酸。

16.根据权利要求5的方法,其中所述序列同源区域的长度为至少70个核苷酸。

17.根据权利要求5的方法,其中所述序列同源区域的长度为至少80个核苷酸。

18.根据权利要求5的方法,其中所述序列同源区域的长度为25个、40个或80个核苷酸。

19.根据权利要求5的方法,其中所述序列同源区域的长度为80个核苷酸。

20.根据权利要求1-4任一项的方法,其中所述第一核酸外切酶可以是5’到3’核酸外切酶或是3’到5’核酸外切酶。

21.根据权利要求20的方法,其中所述第一核酸外切酶是T4 DNA 聚合酶、DNA聚合酶I的 Klenow片段、T5核酸外切酶或T7核酸外切酶。

22.根据权利要求20的方法,其中所述第一核酸外切酶是T4 DNA 聚合酶或T5核酸外切酶。

23.根据权利要求1-4任一项的方法,其中所述不同核酸分子的酶切在单个样品中的混合物中进行。

24.根据权利要求1-4任一项的方法,其中所述RecE是重组表达的。

25.根据权利要求1-4任一项的方法,其中所述RecT是重组表达的。

26.根据权利要求1-4任一项的方法,其中所述第一核酸外切酶处理还包括加入DNA 聚合酶、dNTP 和DNA连接酶的步骤。

27.根据权利要求1-4任一项的方法,其中所述第一核酸外切酶处理还包括加入具有

3'-5'核酸外切酶活性的DNA聚合酶。

28.根据权利要求27的方法,其中所述第一核酸外切酶处理排除添加dNTPs。

29.根据权利要求1-4任一项的方法,其中所述第一核酸外切酶处理是T4 DNA 聚合酶处理或Gibson组装方法。

30.根据权利要求26的方法,其中所述第一核酸外切酶处理是T4 DNA 聚合酶处理或Gibson组装方法。

31.根据权利要求1-4任一项的方法,其中所述大肠杆菌细胞表达核酸外切酶和退火蛋白。

32.根据权利要求31的方法,其中所述大肠杆菌细胞表达第二核酸外切酶和退火蛋白。

33.根据权利要求31的方法,其中所述大肠杆菌细胞是表达全长RecE和RecT的大肠杆菌细胞。

34.根据权利要求31的方法,其中所述大肠杆菌细胞是表达全长RecE、RecT和Redγ的大肠杆菌细胞。

35.根据权利要求31的方法,其中所述大肠杆菌细胞是表达全长RecE、RecT、Redγ和RecA的大肠杆菌细胞。

36.根据权利要求31的方法,其中所述大肠杆菌细胞是表达截短的RecE和RecT的大肠杆菌细胞。

37.根据权利要求31的方法,其中所述大肠杆菌细胞是表达Redα和Redβ的大肠杆菌细胞。

38.根据权利要求31的方法,其中所述大肠杆菌细胞通过在质粒载体和/或染色体上表达核酸外切酶和退火蛋白。

39.根据权利要求31的方法,其中所述大肠杆菌细胞通过质粒载体表达核酸外切酶和退火蛋白。

40.根据权利要求31的方法,其中所述大肠杆菌细胞通过质粒载体和染色体同时表达核酸外切酶和退火蛋白。

41.根据权利要求38-40任一项的方法,其中所述核酸外切酶是第二核酸外切酶。

42.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段是线性的。

43.根据权利要求42的方法,其中所述目标核酸分子或目标DNA片段选自用核酸内切酶切割的DNA片段、PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、源自BAC的片段和克隆载体片段。

44.根据权利要求43的方法,其中所述核酸内切酶是限制性内切酶或可编程的核酸内切酶。

45.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段的个数是

2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个。

46.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为0.5kb或更长的序列。

47.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为1kb或更长的序列。

48.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为2.5kb或更长的序列。

49.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为4kb或更长的序列。

50.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为5kb或更长的序列。

51.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为7.5kb或更长的序列。

52.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为10kb或更长的序列。

53.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为15kb或更长的序列。

54.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为20kb或更长的序列。

55.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为25kb或更长的序列。

56.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为40kb或更长的序列。

57.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为50kb或更长的序列。

58.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为75kb或更长的序列。

59.根据权利要求1-4任一项的方法,其中所述目标核酸分子或目标DNA片段具有长度为100kb或更长的序列。

60.根据权利要求1-4任一项的方法,其中:

-所述两种或更多种目标核酸分子、第一目标核酸分子和第二目标核酸分子或目标DNA片段包括一种或多种PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、和/或衍生自BAC的片段;

-所述第一核酸外切酶具有3'-5'核酸外切酶活性;

-所述核酸外切酶处理在体外在不存在dNTPs的情况下进行;

-所述第二核酸外切酶是全长RecE;

-所述退火蛋白是RecT;和

-所述同源重组在表达所述全长RecE和RecT的大肠杆菌细胞中进行。

61.根据权利要求60的方法,其中所述第一核酸外切酶是T4 DNA聚合酶。

62.根据权利要求1-4任一项的方法,其中:

-所述两种或更多种目标核酸分子包括三种或多种PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、或衍生自BAC、线性质粒和/或克隆载体的片段;

-所述第一核酸外切酶处理包括Gibson组装;

-所述第二核酸外切酶是全长RecE;

-所述退火蛋白是RecT;和

-所述同源重组在表达所述全长RecE和RecT的大肠杆菌细胞中进行。

63.根据权利要求62的方法,其中所述两种或更多种目标核酸分子包括三种或更多种线性质粒和/或克隆载体片段。

64.试剂盒,其包括权利要求1-63的方法中所述的第一核酸外切酶和第二核酸外切酶或编码权利要求1-63的方法中所述第一核酸外切酶和第二核酸外切酶的核酸,其中所述试剂盒还包括表达第二核酸外切酶的宿主细胞,其中所述宿主细胞中包含编码全长RecE、RecT、Redγ和RecA的核酸。

65.权利要求64的试剂盒,其中所述第一核酸外切酶是具有3'-5'核酸外切酶活性的DNA聚合酶,所述第二核酸外切酶是全长RecE。

66.权利要求65的试剂盒,其中所述第一核酸外切酶是T4 DNA 聚合酶、DNA聚合酶I的 Klenow片段、T5核酸外切酶或T7核酸外切酶。

67.权利要求64-66任一项的试剂盒,其中所述试剂盒还可包括一个或多个预先制备的线性载体。

68.根据权利要求1-63任一项的方法或权利要求64-67任一项的试剂盒在构建打靶载体中的用途。

69.根据权利要求1-63任一项的方法或权利要求64-67任一项的试剂盒在基因分型中的用途。

70.根据权利要求1-63任一项的方法或权利要求64-67任一项的试剂盒在DNA合成中的用途。

说明书 :

基因组大片段直接克隆和DNA多分子组装新技术

技术领域

[0001] 本发明涉及核酸克隆和组装方法,更具体涉及脱氧核糖核酸(DNA)克隆和组装的新方法。
[0002] 发明背景
[0003] DNA克隆是分子生物学和生物技术的核心内容,是进行基因功能研究的关键技术。随着DNA测序技术的不断进步和测序成本的不断降低,全基因组测序变得越来越容易。人们发现基因组中蕴藏着丰富的尚未开发的资源。短的DNA片段可以很容易通过PCR或者化学合成获得,但是克隆大于10 kb的DNA片段传统方法则要依赖于DNA文库的构建和筛选。传统的文库构建和筛选的方法不但操作复杂、耗时、费力,而且目的DNA片段经常分散的位于几个不同的克隆上,在进行基因功能研究时往往需要对其进行亚克隆,删除多余序列或者需要将其缝合成一个完整地生物合成途径,因此传统的文库构建和筛选的方法已经不能满足时代发展的需要,研究者们迫切需要简单、高效和快捷的基因组DNA 克隆和修饰技术。随着合成生物学技术的进步,大于10 kb的DNA大片段还可以通过Gibson体外组装1或者DNA 
2
assembler体内组装等方式由小片段组装而成。但是上述DNA组装需要PCR或者化学合成来制备小片段,容易引入随机突变并为后期基因功能研究带来不便。同时,上述方式对于要组装的DNA片段的量要求较高,需要采用纯度和浓度相对较高的目标DNA片段,不能用于直接从酶解的基因组DNA片段混合物中组装目的DNA片段。
[0004] 直接从基因组DNA中将特定的DNA区域克隆到载体中,在本文中称为“直接克隆”。RecET直接克隆技术的原理是:Rac噬菌体重组蛋白——全长的RecE和RecT能够在大肠杆菌细胞内高效地介导线性DNA分子之间发生同源重组——线线重组。其中RecE是5’-3’核酸外切酶,RecT是单链DNA退火蛋白,RecE和RecT之间的蛋白-蛋白相互作用是线线重组所必须的,RecET联合作用的线线重组效率是单独作用的1000倍。RecET直接克隆技术能将大于10 kb的基因组DNA片段直接捕获到表达载体上,而且还能实现2 5个DNA片段的组装。在基因组~
上一般都能找到合适的限制性酶切位点将目的DNA片段释放出来,然后将限制性酶切的基因组DNA和线性载体通过电转化导入表达了RecET重组酶的大肠杆菌细胞内,在细胞内目的DNA片段和线性载体通过两端的同源臂发生同源重组并形成环状质粒,最后通过抗生素筛选和限制性酶切分析可以获得含有重组DNA分子的菌落。在线性载体和基因组DNA都制备好了的情况下,完成目的DNA片段的直接克隆只需要3天的时间。目前该技术已被广泛应用于细菌天然产物生物合成途径的克隆和异源表达研究。比如来源于发光杆菌发光光杆状菌的
10个10-52 kb的聚酮合酶(PKS)/ 非核糖体多肽合成酶(NRPS)基因簇3,来源于类芽孢杆菌
4
Paenibacillus larvae中的12 kb sevadicin基因簇 ,来源于丁香假单胞菌Pseudomonas syringae中的19 kb syringolin基因簇5,来源于伯克氏菌Burkholderia DSM7029中的25 kb glidobactin基因簇6,以及来源于大肠杆菌E. coli Nissle 1917中的50 kb 
colibactin基因簇7。
[0005] 与文库构建和筛选相比,直接克隆所具有的优势驱动了该领域的很多相关研究。Larionov等人建立了依靠酵母重组系统的TAR克隆技术8,然后他们将TAR与Cas9切割结合起来提高了TAR克隆的效率使其应用起来更方便9,10。最近建立的CATCH(Cas9-Assisted Targeting of Chromosome Segments)技术利用Cas9体外切割和Gibson组装将DNA大片段克隆到BAC上11。该方法目前只被应用于原核生物基因组,而且在对重组DNA进行限制性酶切鉴定之前需要先对菌落进行PCR预筛选。据发明人所知包括上述两种方法在内的所有目前已知的直接克隆方法都局限于某些专家才能操作。
[0006] 尽管RecET直接克隆技术在从细菌基因组上克隆50 kb以下的DNA片段时操作方便3-6,12,但是却很难从细菌基因组上克隆更大的DNA片段,也无法从哺乳动物基因组上克隆DNA片段。这是由于RecET直接克隆技术依赖于细胞内表达的RecET重组酶,只有当克隆载体和目的DNA片段同时进入一个大肠杆菌细胞内并相遇才能发生同源重组,这就导致了该技术的局限性:(1)受到基因组DNA片段大小的限制,比如无法从从细菌基因组中克隆大于50 kb的DNA片段或者从哺乳动物(比如老鼠和人)中克隆大于10 kb的基因组片段。这是因为某一段DNA在基因组中的浓度是很低的,这就导致了目的DNA片段与克隆载体在转化时同时进入一个细胞的概率是很小的。而且由于受到基因组DNA制备过程中物理剪切力的影响的影响,要克隆的目的DNA片段越大,其在基因组中的浓度就越低,最终导致目的DNA片段与克隆载体共同进入一个细胞的几率也就越低。老鼠(2800 Mb)和人(3200 Mb)的基因组比细菌基因组(5 Mb)大了将近3个数量级,所以相同大小的基因组DNA片段在哺乳动物基因组中的浓度要比细菌低得多,因此在进行哺乳动物基因组DNA片段直接克隆时,目的DNA片段与克隆载体同时进入一个大肠杆菌细胞的几率也低得多。(2)受到DNA片段数目的影响,对于多片段组装来说,当DNA片段数量超过4个以上时,组装效率急剧降低,目前RecET直接克隆技术最多只能组装5个DNA片段。对于多片段组装来说,DNA片段的数量越多,它们共同进入一个细胞的几率就越低,因此组装效率也就越低。因此业界特别需要一个不受DNA片段大小和基因组复杂性限制的易于操作而又应用广泛的直接克隆技术。
[0007] 为了解决从基因组中直接克隆大片段的技术问题,发明人在体外先用核酸外切酶处理基因组DNA和克隆载体,然后再将体外反应产物在RecET重组酶的存在下进行同源重组,从而建立了ExoCET克隆技术。ExoCET技术不但能够从细菌基因组上直接克隆>100 kb的DNA片段,而且能够从哺乳动物细胞和人血中克隆>50 kb的DNA片段。ExoCET技术还能高效的组装至少20个以上的DNA片段,使其形成一个完整的质粒。
[0008] 与RecET直接克隆技术一样,ExoCET与PCR相比的优势在于保真性高,不会破坏DNA的单倍型,而且目的DNA直接克隆到质粒载体上以利于表达研究。此外,ExoCET比Gibson组装更高效,因为Gibson依赖于体外组装产生的环状DNA分子。而且,Gibson组装在直接克隆中会产生很严重的由空载体自身环化产生的背景,这也许是为什么Jiang等人11在对重组DNA进行鉴定之前要进行PCR预筛选的原因;也是Zhou等人13在利用Gibson组装从链霉菌Streptomyces conglobatus基因组上克隆要通过conglobatin基因簇时,需要通过琼脂糖凝胶电泳去除限制性酶切产生的20 kb以下的基因组DNA片段的原因。
[0009] ExoCET还可以用于从包括血液,疾病相关细胞系等来源的哺乳动物基因组上直接克隆DNA片段以助于SNPs的单倍型研究以及为核酸酶介导的人类干细胞打靶来快速构建单倍型同基因(HIT)打靶载体。从病人、脐带血或体细胞重编程分离到的人类干细胞在生物医学研究的重要性越来越受到人们的重视,对干细胞基因组的精确修饰方法的研究也受到人们的广泛关注。改造人类基因组比改造实验鼠的基因组要更有挑战性,因为人类的遗传多样性很复杂。同基因性(序列相似性)对同源重组的重要性在很多年前人们对老鼠胚胎干细胞进行基因打靶的时候就意识到了14。但是,序列错配对同源重组的影响还未研究清楚,比如单个错配(一个SNP或一个indel)到底能降低多少重组效率 错配距离重组位点的远近是如何影响重组效率的 多个错配是如何影响重组效率的 这些问题目前都还没有搞清楚。无论如何,在基因打靶中使用完全相同的序列很明显是大家极力推荐的,因此ExoCET是一种快速获得理想同源臂的有效方式。与通过PCR从基因组上扩增同源臂的的方法不同,ExoCET不受片段大小的限制,不会引入突变,而且能够维持DNA的单倍型。此外同源臂的末端还可以根据基因分型的方式(比如Southern杂交或者连接PCR)进行选择,所以可以对同源臂的长度进行优化。因此ExoCET为个体化基因组手术提供了优势,尤其是当其与CRISPR/Cas915联合起来时。ExoCET还可以作为一种对修饰后的基因组进行基因分型的最可靠方法,而Southern杂交和连接PCR会产生假阳性信号。
[0010] ExoCET具有的从复杂基因组上选择性捕获DNA大片段的能力使其成为疾病诊断和病理学检验的手段,比如为个体化医疗直接捕获DNA序列或者从病人样本中分离DNA病毒。ExoCET将会广泛应用于功能基因组学和比较基因组学研究中,尤其是直接克隆原核生物合成途径或者为合成生物学组装多个DNA分子。

发明内容

[0011] 在一个方面,本发明提供了一种同源重组的方法,所述方法包括使用第一核酸外切酶处理两个或两个以上目标核酸分子,然后使处理后的目标核酸分子在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中发生同源重组的目标核酸分子之间共享至少一段序列同源区域。
[0012] 在一个方面,本发明提供了一种同源重组的方法,其中所述方法包括使用第一核酸外切酶处理第一核酸分子与第二核酸分子,然后使处理后的第一核酸分子与第二核酸分子在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中第一核酸分子和第二核酸分子之间共享至少一段序列同源区域。
[0013] 在一个方面,本发明提供了一种组装线性核酸分子的方法,所述方法包括使用第一核酸外切酶处理两个或两个以上的核酸分子,然后使处理后的核酸分子混合物在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中每个核酸分子与在所产生的组装产物中形成邻近物的核酸分子共享至少一段序列同源区域。
[0014] 在一个方面,本发明提供了一种克隆基因组DNA的方法,其中方法包括使用第一核酸外切酶处理基因组DNA片段混合物和线性克隆载体,然后使处理后的基因组DNA片段混合物中的目标DNA片段和线性克隆载体在第二核酸外切酶和退火蛋白的存在下进行同源重组,其中基因组DNA片段混合物中目标DNA片段与线性克隆载体之间共享至少一段序列同源区域。
[0015] 根据前述方面任一项的方法,其中所述序列同源区域可以在目标核酸分子内部或末端,优选至少一个同源区域在目标核酸分子末端,更优选同源区域均在目标核酸分子末端。
[0016] 根据权利要求前述方面任一项的方法,其中所述同源区域的长度为至少6、至少10、至少20、至少25、至少30、至少40、至少50、至少60、至少70、至少80个核苷酸,优选25个、
40个或80个,最优选80个核苷酸。
[0017] 根据前述方面任一项的方法,其中所述第一核酸外切酶可以是5’到3’核酸外切酶或是3’到5’核酸外切酶,优选T4 DNA 聚合酶、DNA聚合酶I的 Klenow片段、T5核酸外切酶、T7核酸外切酶,最优选T4 DNA 聚合酶或T5核酸外切酶。
[0018] 根据前述方面任一项的方法,其中所述第一核酸外切酶处理包括体外连接步骤,所述体外连接步骤使两个或两个以上目标核酸分子或者所述第一核酸分子与所述第二核酸分子连接起来,或者使处理后的线性克隆载体和基因组DNA片段混合物中的目标DNA片段连接起来。
[0019] 根据前述方面任一项的方法,其中所述第一核酸外切酶处理包括酶切和退火步骤,其中不同核酸分子的酶切可以是单独进行也可以是同时进行,诸如在单个样品中的混合物中。
[0020] 根据前述方面任一项的方法,其中所述第一核酸外切酶处理还包括加入DNA 聚合酶, dNTP 和DNA连接酶的步骤。
[0021] 根据前述方面任一项的方法,其中所述第一核酸外切酶处理还包括加入具有3'-5'核酸外切酶活性的DNA聚合酶。
[0022] 根据前述方面任一项的方法,其中所述第一核酸外切酶处理排除添加dNTPs。
[0023] 根据前述方面任一项的方法,其中所述第一核酸外切酶处理是T4 DNA 聚合酶处理或Gibson组装。
[0024] 根据前述方面任一项的方法,其中所述第二核酸外切酶是RecE,优选地,所述RecE是重组表达的。
[0025] 根据前述方面任一项的方法,其中所述单链退火蛋白包括RecA、RAD51、Redβ、RecT、Pluβ或RAD52,优选其中所述退火蛋白是RecT,更优选地,所述RecT是重组表达的。
[0026] 根据前述方面任一项的方法,其中所述退火蛋白是RecT,优选地,所述RecT是重组表达的。
[0027] 根据前述方面任一项的方法,其中所述同源重组在体外或宿主细胞中进行。
[0028] 根据前述方面任一项的方法,其中所述宿主细胞可以是酵母细胞,优选酵母细胞是酿酒酵母细胞;或者是细菌细胞,优选细菌细胞是枯草芽孢杆菌或大肠杆菌。
[0029] 根据前述方面任一项的方法,其中所述宿主细胞表达核酸外切酶,优选第二核酸外切酶、和退火蛋白。
[0030] 根据前述方面任一项的方法,其中所述其中所述宿主细胞表达核酸外切酶、退火蛋白和Redγ,优选地,所述宿主细胞还表达RecA,最优选地,所述宿主细胞表达RecE、RecT、Redγ和RecA。
[0031] 根据前述方面任一项的方法,其中所述宿主细胞是表达全长RecE和RecT的大肠杆菌细胞,优选地,所述宿主细胞是表达全长RecE、RecT和Redγ的大肠杆菌细胞,最优选地,所述宿主细胞是表达全长RecE、RecT、Redγ和RecA的大肠杆菌细胞。
[0032] 根据前述方面任一项的方法,其中所述宿主细胞是表达截短的RecE和RecT的大肠杆菌细胞。
[0033] 根据前述方面任一项的方法,其中所述宿主细胞是表达Redα和Redβ的大肠杆菌细胞。
[0034] 根据根据前述方面任一项的方法,其中所述宿主细胞通过在质粒载体和/或染色体上表达核酸外切酶,优选第二核酸外切酶、退火蛋白、Redγ和/或RecA,优选地,通过质粒载体表达,最优选地,通过质粒载体和染色体同时表达。
[0035] 根据前述方面任一项的方法,其中所述目标核酸分子或目标DNA片段是线性的,优选选自用核酸内切酶切割的DNA片段、PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、源自BAC的片段和克隆载体片段。
[0036] 根据前述方面任一项的方法,其中所述核酸内切酶可以是限制性内切酶或可编程的核酸内切酶,例如Cas9。
[0037] 根据前述方面任一项的方法,其中所述目标核酸分子或DNA片段的个数是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个。
[0038] 根据前述方面任一项的方法,其中所述目标核酸分子包括长度为0.5kb或更长(例如,1kb或更长、2.5kb或更长、4kb或更长、5kb或更长、7.5kb或更长、10kb或更长、15kb或更长、20kb或更长、25kb或更长、40kb或更长、50kb或更长、75kb或更长或100kb或更长)的序列。
[0039] 根据前述方面任一项的方法,其中:
[0040] -所述两种或更多种目标核酸分子、第一目标核酸分子和第二目标核酸分子或目标DNA片段包括一种或多种PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、和/或衍生自BAC的片段;
[0041] -所述第一核酸外切酶具有3'-5'核酸外切酶活性,优选是T4 DNA聚合酶;
[0042] -所述核酸外切酶处理在体外在不存在dNTPs的情况下进行;
[0043] -所述第二核酸外切酶是全长RecE;
[0044] -所述退火蛋白是RecT;和
[0045] -所述同源重组在表达所述全长RecE和RecT的细菌宿主细胞中进行,优选大肠杆菌。
[0046] 根据前述方面任一项的方法,其中:
[0047] -所述两种或更多种目标核酸分子包括一种或多种PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、和/或衍生自BAC的片段,线性质粒和/或克隆载体片段,优选三种或更多种线性质粒和/或克隆载体片段;
[0048] -所述第一核酸外切酶包括Gibson组装;
[0049] -所述第二核酸外切酶是全长RecE;
[0050] -所述退火蛋白是RecT;和
[0051] -所述同源重组在表达所述全长RecE和RecT的细菌宿主细胞中进行,优选大肠杆菌。
[0052] 根据前述方面任一项的方法,其中:
[0053] -所述两种或更多种目标核酸分子包括三种或多种PCR扩增的DNA片段、基因组DNA片段、cDNA文库成员、或衍生自BAC、线性质粒和/或克隆载体的片段,优选三种或更多种线性质粒和/或克隆载体片段;
[0054] -所述第一核酸外切酶处理包括Gibson组装;
[0055] -所述第二核酸外切酶是全长RecE;
[0056] -所述退火蛋白是RecT;和
[0057] -所述同源重组在表达所述全长RecE和RecT的细菌宿主细胞中进行,优选大肠杆菌。
[0058] 试剂盒,其包括前述任一项的方法中所述的第一核酸外切酶和第二核酸外切酶或编码前述任一项的方法中所述第一核酸外切酶和第二核酸外切酶的核酸。
[0059] 试剂盒,其包括前述任一项的方法中所述的第一核酸外切酶和第二核酸外切酶或编码所述第一核酸外切酶和第二核酸外切酶的核酸,优选地,所述试剂盒还包括表达第二核酸外切酶的宿主细胞,优选地,所述宿主细胞表达核酸外切酶、退火蛋白和Redγ,优选地,所述宿主细胞还表达RecA,最优选地,所述宿主细胞表达RecE、RecT、Redγ和RecA,所述宿主细胞可以是酵母细胞,优选酵母细胞是酿酒酵母细胞;或者是细菌细胞,优选细菌细胞是枯草芽孢杆菌或大肠杆菌,所述宿主细胞通过在质粒载体和/或染色体上表达核酸外切酶、退火蛋白、Redγ和/或RecA,优选地,通过质粒载体表达,最优选地,通过质粒载体和染色体同时表达,进一步优选地,所述试剂盒还可包括一个或多个预先制备的线性载体。
[0060] 根据前述任一项的试剂盒,其中所述第一核酸外切酶是具有3'-5'核酸外切酶活性的DNA聚合酶,诸如T4 DNA 聚合酶、DNA聚合酶I的 Klenow片段、T5核酸外切酶或T7核酸外切酶,所述第二核酸外切酶是全长RecE。
[0061] 根据前述任一项的试剂盒,其中所述试剂盒还包括表达第二核酸外切酶的宿主细胞,优选地所述宿主细胞中包含编码全长RecE、RecT、Redγ和RecA的核酸。
[0062] 根据前述任一项的试剂盒,其中所述试剂盒还可包括一个或多个预先制备的线性载体。
[0063] 根据前述任一项的方法或试剂盒在构建打靶载体中的用途。
[0064] 根据前述任一项的方法或试剂盒在对哺乳动物细胞进行基因分型中的用途。
[0065] 根据前述任一项的方法或试剂盒在合成DNA中的用途。

附图说明

[0066] 图1. 联合使用体外组装和RecE/RecT促进了直接克隆的效率。(a) 从明亮发光杆菌(P. phosphoreum) ANT-2200基因组上直接克隆14 kb lux基因簇的示意图。p15A-cm载体和目的基因组DNA片段在最末端具有相同序列。 (b) 同源臂越长克隆效率越高。具有25 bp, 40 bp或80 bp同源臂的线性载体分别与基因组DNA混合,并且在退火和转化到阿拉伯糖诱导的E. coli GB05-dir之前用0.02 Uμl-1的T4pol在25℃下反应20分钟。误差线, s.d.; n = 3. (c) 优化T4pol的浓度。具有80 bp同源臂的线性载体与基因组DNA采用与(b)中相同的方式进行处理,唯一不同的T4pol的浓度。(d) T4pol的温育时间对克隆效率的-1影响。与(c)相同,使用0.02 Uμl  的T4pol,但是采用不同的温育时间。(e) ETgA拷贝数越高克隆效率越高。与(d)相同,温育时间为1小时,然后将体外组装产物分别电转化到阿拉伯糖诱导的E. coli GB05-dir (在染色体上带有1个 ETgA的拷贝), 含有pSC101-BAD-ETgA-tet的GB2005 (在pSC101质粒上带有 5个 ETgA的拷贝) 或者含有pSC101-BAD-ETgA-tet的~
GB05-dir (带有 6个 ETgA的拷贝) 。(f) ExoCET提高了直接克隆的效率。与(e)相同,使用~
含有pSC101-BAD-ETgA-tet的GB05-dir(ExoCET),或者不用T4pol处理(ETgA),或者不用阿拉伯糖诱导(T4pol)。
[0067] 图2. 不同核酸外切酶对lux基因簇直接克隆的影响。p15A-cm载体和明亮发光杆菌基因组DNA用核酸外切酶处理、退火后电转化到阿拉伯糖诱导的E. coli  GB05-dir中。(a)初始检测不同的核酸外切酶。(b-d)优化Kle, T5exo和T7exo的浓度。(e)用最优浓度的T4pol, Kle, T5exo和T7exo酶切20min后的克隆效率比较。(f)优化T4pol的酶切温度和时间(0.02 U μl-1)。误差线,s.d.; n = 3。
[0068] 图3. 退火速率对lux基因簇直接克隆的影响. 误差线, s.d.; n = 3. p15A-cm载体和明亮发光杆菌基因组DNA用0.02 U μl-1 T4pol 酶切之后采用不同的方式(A,B,C)退火之后电转化到阿拉伯糖诱导的E. coli GB05-dir 中。
[0069] 图4. 线性克隆载体的制备和ExoCET直接克隆技术的流程图。(a) 通过PCR扩增制备p15A-cm载体,所用引物带有80个核苷酸的同源臂。(b) ExoCET直接克隆的标准策略。体外组装产物转化到阿拉伯糖诱导的含有pSC101-BAD-ETgA-tet的GB05-dir中,通过抗生素筛选获得正确的重组子。
[0070] 图5. (a) p15A-cm和14 kb lux 基因组DNA片段之间的80 bp同源臂的位置:(A) 两个同源臂都位于最末端;(B, C) 一个位于距离末端1 kb的位置,另一个位于最末端; (D) 都位于距离末端1 kb的位置。反应条件与图1f相同。 (b) 利用上述四种同源臂通过ETgA, T4pol 或ExoCET 获得到菌落数。(c) 在GB2005中利用ExoCET和末端同源臂通过pSC101质粒表达的不同重组蛋白组合获得的14 kb lux 基因簇直接克隆效率:ETg-不表达RecA;Eg-不表达RecA和RecT;Tg-不表达RecA和RecE; pSC101-tet –空载体。误差线, s.d.; n = 3.
[0071] 图6. 利用EcoRV或Cas9酶切的白色链霉菌S. albus基因组DNA直接克隆106 kb的盐霉素基因簇。 (a) 利用ExoCET从EcoRV或Cas9 gRNA2/Cas9-gRNA7酶切的基因组DNA上将盐霉素基因簇克隆到pBeloBAC11载体上。 同源臂(蓝色)先被插入BAC载体上并通过BamHI酶切将BAC载体线性化作为直接克隆载体。同源臂长度标示于基因组DNA片段的末端。(b) 重组DNA的PvuII限制性酶切分析,正确的克隆用箭头标示。
[0072] 图7 ExoCET 和Gibson组装的效率比较. (a) 从老鼠基因组上利用末端同源臂直接克隆含有Wnt4基因的45 kb DNA片段的示意图。(b) 通过ExoCET和Gibson方法获得的菌落数。p15A-cm和SwaI酶切的老鼠基因组DNA分别通过ExoCET和Gibson处理,然后转化到阿拉伯糖诱导(ExoCET或Gibson+ETgA)或不诱导(T4pol或Gibson)的含有pSC101-BAD-ETgA-tet的GB05-dir中。(c) 通过T4pol、ExoCET、Gibson和Gibson+ETgA将多个DNA片段组装成质粒的示意图。DNA片段大小为1.0 kb 5.4 kb,组装成的p5A质粒大小为29.8 kb 54.9 kb,而~ ~且带有氯霉素抗性(cm)。(d) 多片段组装实验得到的克隆数及正确率。体外组装的产物转化到阿拉伯糖诱导(ExoCET或Gibson+ETgA)或不诱导(T4pol或Gibson)的含有pSC101-BAD-ETgA-tet的GB05-dir中。
[0073] 图8. 利用哺乳动物基因组DNA为DPY30构建HIT(单倍型同基因打靶)载体。(a)利用SpeI酶切的人类基因组DNA克隆DPY30终止密码子区域的示意图。直接克隆完成后,通过Redαβ重组工程mVenus元件16,17标记到DPY30的C端。(b)对利用从人血中分离的基因组DNA通过ExoCET进行直接克隆获得的重组DNA进行EcoRI酶切分析。(c)对利用从人类胚胎肾脏293T细胞中分离的基因组DNA通过ExoCET进行直接克隆获得的重组DNA进行EcoRI酶切分析。(d)对通过Redαβ重组工程插入mVenus元件后获得的重组DNA进行PvuII酶切分析。获得的所有克隆都是正确的,其中11泳道是对照。正确的克隆用箭头标示。
[0074] 图9. 利用老鼠细胞基因组DNA为Dpy30构建HIT(单倍型同基因打靶)载体。(a)利用BamHI+KpnI酶切的老鼠基因组DNA克隆Dpy30终止密码子区域的示意图。直接克隆完成后,通过Redαβ重组工程mVenus元件16,17标记到Dpy30的C端。(b)对利用从老鼠黑色素瘤B16细胞中分离的基因组DNA通过ExoCET进行直接克隆获得的重组DNA进行EcoRI酶切分析。(c)对通过Redαβ重组工程插入mVenus元件后获得的重组DNA进行NheI酶切分析。获得的所有克隆都是正确的,其中11泳道是对照。正确的克隆用箭头标示。
[0075] 图10利用ExoCET对哺乳动物细胞进行基因分型。(a)利用ExoCET进行基因分型的原理图。限制性酶切位点分别位于打靶元件的上游和下游。(b)利用ExoCET对具有卡那霉素抗性的Kmt2d-AID-neo打靶老鼠胚胎干细胞进行基因分型。利用SspI和SpeI从基因组上释放含有打靶元件的DNA片段。使用10 ug酶切的基因组DNA和PCR扩增的p15A-cm载体进行ExoCET克隆。克隆到p15A载体中的打靶片段和野生型片段可以通过双划线和限制性酶切区分开。
[0076] 图11. 对Klf4-Venus-neo 打靶的老鼠胚胎干细胞进行ExoCET基因分型得到的氯霉素抗性菌落的EcoRV+PstI 限制性酶切分析。具体实施方案
[0077] DNA重组工程是在大肠杆菌(E. coli)细胞内利用噬菌体syn/exo蛋白(主要是Redα和Redβ)18-22介导的同源重组对DNA分子进行修饰的基因工程技术。DNA重组工程技术最开始是在E. colisbcA(recBC抑制子)菌株中发现的,该菌株具有高效介导带有同源臂(homology boxes)的DNA分子之间发生同源重组的活性23。sbcA菌株是由AJ Clark在E. coli中寻找同源重组途径的经典试验中发现的。他利用对DNA损伤非常敏感的recBC菌株来筛选其抑制子时发现了具有RecE和RecT表达活性的sbcA突变菌株24-26。随后研究发现RecE和RecT是由整合在染色体上的Rac噬菌体表达的,它们与噬菌体的Redα和Redβ的功能相同27,而且在sbcA突变菌株只表达了RecE蛋白C端的280个氨基酸28-30。截短的RecE与Redα(266个氨基酸)相似,是一个5’-3’核酸外切酶31,RecT与Redβ类似,是一个单链DNA退火蛋白(SSAP,single strand annealing protein)32。RecE/RecT和Redα/Redβ属于5’-3’核酸外切酶/SSAP syn/exo蛋白对21,33,而且每对蛋白之间特异性的蛋白-蛋白相互作用势双链DNA的同源重组所必需的29,34,35。Redα/Redβ介导的同源重组主要发生在复制叉上而且要求复制进行36,37。虽然一开始发明人是通过截短的RecE/RecT发现的重组工程技术,但是后来发明人主要利用Redα/Redβ来修饰DNA分子,因为后者的效率更高16,38-42。尽管如此,发明人还是在不停地研究RecE/RecT的特性,而且发现RecE N端的600个氨基酸残基将其重组活性由复制3
依赖型变成了复制不依赖型。因此,两个线性DNA分子可以通过很短的同源臂发生高效的同源重组而形成环状质粒。与Redα/Redβ重组工程相比,这种线线重组机制具有不同的应用范围,比如从基因组上直接克隆DNA大片段3-6,12或者进行DNA的多片段组装15,43。
[0078] 本发明提供了一种用于在共享至少一段序列同源区域的两个或两个以上的目标线性核酸分子之间进行同源重组(线线重组)的方法,其中所述方法包括使用第一核酸外切酶处理目标线性核酸分子的混合物;然后使处理后的目标线性核酸分子在第二核酸外切酶和退火蛋白的存在下进行同源重组。其中所述第二核酸外切酶可以是RecE,来自大肠杆菌K12的全长RecE的氨基酸序列在WO2011/154927中公开。其中所述第二核酸外切酶也可以是截短的RecE,这些截短形式的RecE包括第588-866、595-866、602-866 或606-866位氨基酸构成的RecE 蛋白29。
[0079] 所述第二核酸外切酶与退火蛋白共同介导同源重组。在一些实施方案中,在本发明的方法中使用的退火蛋白是WO2011/154927中公开的退火蛋白。优选的,所述退火蛋白是RecT或其片段(源自Rac噬菌体)。更优选的,所述退火蛋白是全长RecT并且所述第二核酸外切酶是全长RecE。但是,可以使用任何其它合适的退火蛋白,只要该退火蛋白与所使用的核酸外切酶共同作用。其它合适的噬菌体退火蛋白的实例提供于WO02/062988。线线重组可以在缺乏RecT表达的某些宿主细胞如大肠杆菌菌株GB2005中发生,可能是由于存在某些内源RecT-样活性。但是,由全长RecE介导的线线重组的效率在RecT的存在下显著升高。
[0080] 本发明的方法在宿主细胞中可受到全部或部分的影响。合适的宿主细胞包括许多物种的细胞,包括寄生虫、原核生物和真核生物,但是细菌如革兰氏阴性细菌是优选的宿主。更优选的,宿主细胞是肠细菌细胞,如沙门氏菌(Salmonella)、克雷伯氏菌(Klebsiella)、芽孢杆菌(Bacillus)、奈瑟氏菌(Neisseria)、发光杆菌(Photorhabdus)或大肠杆菌(Escherichia coli)细胞(本发明的方法在已检测的所有大肠杆菌菌株中都起着有效的作用)。优选的宿主细胞是大肠杆菌K12。然而应当注意,本发明的方法同样适用于真核细胞或生物体中,如真菌、酵母、植物或动物细胞。该系统已经证实在小鼠ES细胞中具有功能,并且有理由推测在其他真核细胞细胞中也有功能。典型地,宿主细胞是分离的宿主细胞,但是同样可以使用未分离的宿主细胞。
[0081] 本发明所述宿主细胞包含编码核酸外切酶(优选全长RecE)、退火蛋白(优选RecT)和Redγ的核酸。在一些实施方案中,所述宿主细胞还包含编码RecA的核酸。优选地,所述宿主细胞表达RecE、RecT和Redγ、以及任选的RecA。最优选的,所述宿主细胞表达RecE、RecT、Redγ和RecA。
[0082] 本发明所述核酸外切酶、退火蛋白、Redγ和/或RecA可以由外源DNA在宿主细胞中重组表达,例如,由转化进宿主细胞中的载体表达。一个合适载体的实例是pSC101质粒,但是也可以使用其它合适的载体。任何合适的启动子都可以用来驱动这些蛋白的表达。但是,在表达RecE时,优选诱导型启动子,如阿拉伯糖诱导型启动子(PBAD)或鼠李糖诱导启动子(PRhaSR)。这些启动子都是本领域公知的。
[0083] 本发明所述宿主细胞通过在质粒载体或者染色体上由诱导型启动子表达核酸外切酶、退火蛋白、Redγ和/或RecA。优选地,核酸外切酶、退火蛋白、Redγ和/或RecA通过质粒载体在宿主细胞中表达。最优选地,核酸外切酶、退火蛋白、Redγ和/或RecA通过质粒载体和染色体同时在宿主细胞中表达。
[0084] 大肠杆菌K12宿主细胞的基因组中包括全长recE基因和recT基因的内源性拷贝,它们存在于已整合到宿主基因组中的Rac噬菌体。但是,由于该基因是沉默的,因此全长RecE的表达并不能由该整合基因自然发生。因此,在5’到3’核酸外切酶由外源DNA表达的实施方案中,可在不存在内源性recE基因情况下实施所述方法。
[0085] 还提供转化了编码如上所述核酸外切酶的核酸分子的宿主细胞。优选地,所述核酸外切酶由所述核酸分子表达,因此本发明还提供了表达本发明的方法中列举的核酸外切酶的宿主细胞。核酸外切酶优选地在诱导性启动子的控制下表达,如阿拉伯糖诱导型启动子(PBAD)或鼠李糖诱导型启动子(PRhaSR)。
[0086] 还设想在前述实施方案中,本发明的方法在体外受到全部或者部分的影响。例如,可以使用纯化的5’到3’核酸外切酶和退火蛋白(优选纯化的RecE和RecT蛋白),或者使用表达所述5’到3’核酸外切酶和退火蛋白的大肠杆菌细胞的提取物。当在体外实施该方法时,对所述第一和第二线性目标核酸分子进行预处理以暴露单链同源末端是有利的。
[0087] 线线重组需要目标线性核酸分子之间必须共享至少一个序列同源区域,通过所述区域发生同源重组。在一些实施方案中,所述第一目标核酸分子与所述第二目标核酸分子共享一个序列同源区域,以使第一和第二目标核酸分子之间的线线重组产生线性产物。在所述第一和第二线性核酸和一个或多个额外的线性核酸之间发生线线重组以形成线性产物的实施方案中,每个线性核酸与在线线重组反应的线性产物中形成其邻近物的线性核酸共享一个序列同源区域。在所述第一和第二线性核酸和一个或多个额外的线性目标核酸分子之间发生线线重组以形成环状产物的实施方案中,每个线性核酸与在线线重组反应的环状产物中形成其邻近物的线性核酸共享一个序列同源区域。在一些实施方案中,所述第一目标核酸分子和所述第二目标核酸分子共享两个序列同源区域,以使第一和第二目标核酸分子之间的线线重组形成环状分子。本领域技术人员知道如何设计同源区域以形成线性分子或环状分子。
[0088] 优选的,至少一个同源臂在每个线性片段的最末端。当同源臂在每个线性片段的最末端并且不同的同源臂在另一端时,这些序列同源区域或“同源臂”产生最佳构型,如此构造这些同源臂以使重组产生环。当同源臂不位于末端时可以发生线线重组,但是效率会降低。因此,在优选的实施方案中,所述同源的至少一个区域位于所述目标核酸分子的一个或两个末端的最外端。在一些实施方案中,所述同源区域位于所述某一目标核酸分子的内部。
[0089] 本发明所述的序列同源区域的长度为至少4、至少6、至少10、至少20、至少30个、至少40、至少50、至少60、至少70、至少80、至少90、至少100个核苷酸。例如,在一些实施方案中,序列同源区域为4-6、6-9、6-30、6-100、10-20、20-29、20-40、20-50、10-100、25-30、25-40、25-50、30-40、30-50、40-50、40-80个或80个以上核苷酸。同源重组的效率通常会随着使用的同源臂的长度而增加,因此可以使用较长的同源臂。
[0090] 两个核酸分子之间的“同源”是指对两个核酸分子的序列进行比对时,有许多核苷酸残基在所述序列的相同位置上是相同的。同源的程度很容易计算出来(Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988;Biocomputing.Informati cs and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part1,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysi s in 
Molecular Biology,von Heinje,G.,Academic Press,1987;and Seq uence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,New York,1991)。
[0091] 在一些实施方案中,本发明的方法包括将多个线性核酸分子连在一起形成环状核酸分子,例如环状质粒。其中每个目标核酸分子与在所产生的环状产物中形成邻近物的目标核酸分子共享一段同源区域,并按照本发明的方法进行线线重组。目标核酸分子个数是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个。
[0092] 在一些实施方案中,至少一个目标线性核酸分子包含选择标志物以允许选择正确的重组体。本发明中可以使用任意合适的选择标志物。在一些实施方案中,选择标志物是抗生素抗性基因,例如,氯霉素,氨苄青霉素,卡那霉素,或杀稻瘟菌素的抗性基因。
[0093] 所述目标线性核酸分子可以源自任意合适的来源。例如,可以包括来自真核生物或原核生物的核酸序列。在一些实施方案中,所述第一目标线性核酸分子是基因组DNA。典型的,所述基因组DNA是基因组DNA的片段。所述基因组DNA优选包括感兴趣的序列。在一些实施方案中,基因组DNA片段可以通过剪切或消化基因组DNA(例如使用限制性内切酶)获得包含感兴趣的完整序列。在一些实施方案中,所述第一目标线性核酸分子(例如,基因组DNA片段、cDNA文库成员或源自BAC的片段)包括2kb或更长(例如,2.5kb或更长、4kb或更长、5kb或更长、7.5kb或更长、10kb或更长、15kb或更长、20kb或更长、25kb或更长、40kb或更长、50kb或更长、75kb或更长或100kb或更长)的感兴趣的序列。优选的,感兴趣的序列是在第一目标线性核酸分子的任一端的同源臂之间的全部区域。例如,编码次级代谢产物途径或脂肪酸合成途径的基因簇。在一些实施方案中,本发明方法可用于从人类或者非人类动物基因组中直接克隆DNA区域,例如,用于健康研究或通过基因打靶进行修正的再生治疗。例如,在一些实施方案中,所述第一目标核酸分子包括或由来自人或非人类动物的基因组DNA片段组成。所述基因组DNA片段可以包括感兴趣的序列,如包含突变的基因,其中该突变导致疾病或者病症并且将该突变修正为野生型序列可以治疗或预防该疾病或病症。在所述第一目标核酸分子是基因组DNA片段的实施方案中,所述第二目标核酸分子优选线性化的克隆载体。
[0094] 在所述第一目标核酸分子是基因组DNA片段的实施方案中,所述方法包括通过消化或剪切基因组DNA来生成第一目标核酸分子以获得包含感兴趣的序列的线性基因组DNA片段,接着使用第一核酸外切酶处理基因组DNA片段与线性克隆载体的混合物,处理包括酶切目标核酸分子和退火使酶切后的目标核酸分子连接的步骤,然后将处理后的核酸分子的混合物共电转化至宿主细胞中。所述第二目标核酸分子优选包含选择标志物。
[0095] 在一个实施方案中,本公开的方法包括体外连接DNA分子的步骤。
[0096] 在一个优选实施方案中,所述体外连接步骤包括核酸外切酶消化随后是退火。
[0097] 在另一个优选实施方案中,所述核酸外切酶是T4聚合酶。
[0098] 在另一个优选实施方案中,所述体外连接步骤包括Gibson组装。
[0099] 在另一个优选实施方案中,所述体外连接步骤包括通过DNA聚合酶的DNA合成,所述DNA合成使用或不使用核酸外切酶,随后是退火。
[0100] 在另一个优选实施方案中,所述体外连接步骤包括由单链退火蛋白促进的退火,所述单链退火蛋白诸如RecA/RAD51、Redβ、RecT、Pluβ或RAD52。
[0101] 在另一个优选实施方案中,用于同源重组的宿主细胞是大肠杆菌细胞。
[0102] 在另一个优选实施方案中,用于同源重组的宿主细胞是表达全长RecE和/或RecT的大肠杆菌细胞。
[0103] 在另一个优选实施方案中,用于同源重组的宿主细胞是表达全长RecE、RecT和/或Redγ的大肠杆菌细胞。
[0104] 在另一个优选实施方案中,用于同源重组的宿主细胞是表达截短的RecE、RecT和/或Redγ的大肠杆菌细胞。
[0105] 在另一个优选实施方案中,用于同源重组的宿主细胞是表达全长RecE和/或RecT的任何细菌宿主细胞。
[0106] 在另一个优选实施方案中,用于同源重组的宿主细胞是表达Redα、Redβ和/或Redγ的大肠杆菌细胞。
[0107] 在另一个优选实施方案中,用于同源重组的宿主细胞是酿酒酵母细胞。
[0108] 提供了用于本发明的试剂盒。在一些实施方案中,所述试剂盒包括编码本文描述的核酸外切酶的核酸。在一些实施方案中,所述试剂盒包括在此处描述的核酸外切酶。优选的,所述第一核酸外切酶是T4 DNA 聚合酶(T4 DNA polymerase;T4pol)、DNA聚合酶I的 Klenow片段(Klenow fragment of DNA Polymerase I;Kle)、T7 DNA聚合酶(T7 DNA polymerase;T7pol)、核酸外切酶III(Exonuclease III;ExoIII)、Phusion DNA聚合酶(Phusion DNA polymerase;Phu)、T5核酸外切酶(T5 exonuclease;T5exo)、T7核酸外切酶(T7 exonuclease;T7exo)和Lambda核酸外切酶(Lambda exonuclease;λexo),所述第二核酸外切酶是全长RecE。更优选的,所述试剂盒包括本文描述的宿主细胞。例如,在一些实施方案中,试剂盒中的宿主细胞包括在可诱导启动子控制下编码本文所述的全长RecE、RecT、Redγ和RecA的核酸。所述试剂盒还可包括一个或多个预先制备的线性克隆载体。
[0109] 本发明的另一优选应用涉及合成生物学中的线性核酸分子的组装,所述线性核酸分子优选线性DNA。因此,在一些实施方案中,所述第一和第二目标核酸分子是线性的,并且所述方法进一步包括在5’到3’核酸外切酶和退火蛋白的存在下将所述第一和第二目标核酸分子与一个或多个其它线性目标核酸分子(例如,1、2、3、4、5、6、7、8、9、至少10、至少20个其它目标核酸分子)接触以产生线性或环状产物。在优选的实施方案中,第一和第二目标核酸分子以及一个或多个其它目标核酸分子之间的同源重组导致基因、操纵子、染色体或整个基因组的产生。DNA核酸的合成生物学组装已经用来产生基因、操纵子、染色体,或在最近用来产生整个基因组。在本发明实施方案中,基于第一核酸外切酶和第二核酸外切酶的联合作用使线性核酸分子组装效率显著提高,本发明将成为商业上和研究中合成生物学DNA组装的一种优选方法。
[0110] 本发明的另一优选应用是构建单倍型同基因打靶载体,利用本发明的方法从哺乳动物基因组上直接克隆5至10 kb的DNA片段作为同基因同源臂,这些DNA片段不仅是相同的基因而且维持了多态性的单倍型,所以发明人称之为单倍型同基因打靶载体,即“HIT”(haplotypic isogenic targeting)载体。然后通过重组工程将筛选标记以及其它功能元件插入到HIT载体上获得用于打靶的载体。本发明的另一优选应用是对哺乳动物细胞进行基因分型。应用本发明的方法从可能的打靶胚胎干细胞的基因组上克隆含有完整打靶元件的DNA片段,对克隆获得的重组质粒进行限制性酶切分析和DNA测序,根据结果判断细胞是否打靶成功。实施例
[0111] 材料和方法
[0112] 菌株和质粒
[0113] E. coli GB2005在DH10B基础上敲除了 fhuA, ybcC和recET 3,16,44. GB05-dir是在GB2005的染色体上整合了PBAD-ETgA 操纵子 (PBAD启动子调控下的recE, recT, redγ 和recA)3. GB08-red是在GB2005的染色体上整合了PBAD-gbaA 操纵子 (PBAD启动子调控下的redγ, redβ, redα和recA)16. pSC101-BAD-ETgA-tet 3带有四环素抗性基因和PBAD-ETgA 操纵子的温度敏感型质粒,它可以在30 ℃复制,但是却不能在37 ℃复制,因此在无选择压力下通过改变温度就能轻易将其消除。
[0114] 基因组DNA的制备和酶切
[0115] 革兰阴性细菌明亮发光杆菌(Photobacterium phosphoreum) ANT-2200 和发光光杆状菌(Photorhabdus luminescens) DSM15139在50 ml培养基中培养过夜。离心收集的-1细胞悬浮在8 ml 10 mM Tris-HCl (pH 8.0)中,然后加500 ul 20 mg ml  蛋白酶 K 和 1 ml 10% SDS,50度温浴2 h直至溶液变澄清。酚氯仿抽提和乙醇沉淀获得基因组DNA,最后溶于10 mM Tris-HCl (pH 8.0)中。
[0116] 革兰阳性细菌白色链霉菌(Streptomyces albus)DSM41398在50 ml TSB培养基中45
30度培养2天。根据参考文献 的方法提取基因组DNA,主要流程如下:菌体重悬于8 ml SET (75 mM NaCl, 25 mM EDTA, 20 mM Tris, pH 8.0) 中,添加10 mg溶菌酶,37度温浴1 h,然后加500 ul 20 mg ml-1 蛋白酶 K和1 ml 10% SDS,50度温浴2 h直至溶液变澄清,然后加3.5 ml 5 M NaCl。酚氯仿抽提和乙醇沉淀获得基因组DNA,最后溶于10 mM Tris-HCl (pH 8.0)中。
[0117] 老鼠黑色素瘤细胞B16、人胚胎肾细胞293T和人血的基因组使用Qiagen Blood & Cell Culture DNA 试剂盒提取,步骤略加改动,裂解细胞用蛋白酶K处理后用酚氯仿抽提和乙醇沉淀获得基因组DNA,最后溶于10 mM Tris-HCl (pH 8.0)中。
[0118] 明亮发光杆菌ANT-2200的基因组DNA用BamHI+KpnI酶切以克隆lux基因簇。P. luminescens DSM15139的基因组DNA用XbaI酶切以克隆plu3535-plu3532;用XbaI+XmaI酶切以克隆plu2670。白色链霉菌S. albus的基因组DNA用EcoRV 或Cas9-gRNA酶切以克隆盐霉素基因簇。老鼠细胞B16的基因组DNA用HpaI酶切以克隆Prkar1a,用BamHI+KpnI酶切以克隆Dpy30,用SwaI酶切以克隆Wnt4 或Lmbr1l-Tuba1a。人的基因组DNA用NdeI+BstZ17I酶切以克隆IGFLR1-LIN37,用SpeI酶切以克隆DPY30, 用BstZ17I酶切以克隆IGFLR1-ARHGAP33,用NdeI酶切以克隆ZBTB32-LIN37。酶切的基因组用酚氯仿抽提和乙醇沉淀,最后溶于ddH2O,浓度大约1 ug/ul。
[0119] 白色链霉菌S. albus基因组DNA的Cas9酶切
[0120] S. pyogenes Cas9 蛋白购自New England Biolab公司。白色链霉菌S. albus基因组DNA的Cas9酶切在含有80 ul 10×Cas9反应缓冲液(NEB) (NEB), 80 μg 基因组DNA, 40 μg gRNA-2, 40 μg gRNA-7和 20 μg Cas9的800 ul反应体系中进行。由于Cas9的切割效率受到DNA底物纯度的严重影响,所以在此试验中,白色链霉菌S. albus基因组DNA需要利用酚-氯仿-异戊醇(25:24:1, pH8.0)抽提三次,以保证Cas9切割的效率。37℃ 温育6小时后,加入100 μg RNase A (Thermo Scientific) ,37℃ 温育1小时后加入100 μg 蛋白酶K  (Roche)  ,继续50℃温育1 h。然后将基因组DNA再用酚-氯仿-异戊醇(25:24:1, pH8.0)抽提一次,经乙醇沉淀后,溶于适量ddH2O 中,使其终浓度在1 μg ul-1左右。最后将
10 μg Cas9切割后的基因组DNA 用于本发明方法的克隆实验。
[0121] 线性克隆载体的制备
[0122] PCR扩增(图4)p15A-cm载体的模板质粒为p15A-Pamp-luxABECD(购自Genebridge公司),使用PrimeSTAR Max DNA 聚合酶(Takara),所用引物(表1)含有80个核苷酸的同源臂并通过PAGE纯化。PCR产物通过胶回收来排除引物对后续实验的干扰,所用试剂盒为QIAquick 凝胶提取试剂盒(Qiagen),最后DNA用ddH2O洗脱,浓度大约200 ng/ul,使用200 ng进行ExoCET克隆实验。
[0123] 用来克隆106 kb盐霉素基因簇的pBeloBAC11载体和克隆plu3535-3532的pBAC2015载体的构建方法如文献43和文献46所述。通过BamHI酶切暴露出两端的同源臂,然后通过酚-氯仿-异戊醇(25:24:1, pH8.0)抽提和异丙醇沉淀收集DNA,最后溶于ddH2O,浓度大约1 ug/ul。使用1 μg BAC载体进行ExoCET克隆实验。
[0124] 表1 p15A-cm线性载体扩增的寡核苷酸
[0125]
[0126] 小写字母为同源臂序列。
[0127] 多片段组装的PCR产物制备
[0128] 以P. luminescens  DSM15139基因组DNA为模板,用PrimeSTAR Max DNA 聚合酶(Takara) 扩增的PCR产物相互之间带有40 bp的同源臂。PCR产物用胶回收纯化,所用试剂盒为QIAquick 凝胶提取试剂盒(Qiagen),最后用ddH2O洗脱,浓度大约200 ng/ul。每个片段使用250 ng进行组装实验。
[0129] mVenus-PGK-neo DNA元件的制备
[0130] 以pR6K-2Ty1-2PreS-mVenus-Biotin-PGK-em7-neo17为模板,利用PrimeSTAR Max DNA 聚合酶 (Takara) PCR扩增mVenus-PGK-neo元件。所用引物如表S7所示。PCR产物经试剂盒QIAquick PCR 纯化试剂盒 (Qiagen)纯化后,用ddH2O,浓度大约为100 ng ul-1. 使用200ng进行同源重组实验。
[0131] 体外组装
[0132] 在0.2 ml PCR管中加入10 ugDNA分子,200 ng 2.2 kb p15A-cm线性载体(或者1 ug 8 kb pBeloBAC11载体),2 ul 10×NE缓冲液2.1 和0.13 ul 3 U ul-1 T4 DNA 聚合酶(T4pol),用水补至20 ul。然后再PCR仪中进行如下循环:25 度1 h, 75度20 min, 50度30 min, 最后4度保温。在多片段组装实验中,25 度反应时间为20分钟。反应产物在转化之前用Millipore 膜过滤器 (Merck-Millipore, cat. no. VSWP01300)脱盐,室温30min。
[0133] 其他核酸外切酶的反应程序如下:T5 核酸外切酶 (T5 exo):50 度30min, 4度保温;T7 核酸外切酶 (T7 exo):25 度20 min, 50度30 min, 最后4度保温;Klenow 大片段 (kle)、T7 DNA 聚合酶 (T7 pol)、Lambda核酸外切酶 (Lam exo):25 度20 min, 75度20 min, 50度30 min, 最后4度保温;核酸外切酶 III (Exo III):37 度20 min, 75度20 min, 50度30 min, 最后4度保温;Phusion DNA 聚合酶 (Phu):37 度20 min, 50度30 min, 最后4度保温;Gibson组装 (NEB, cat. E2611) 的反应程序如下:50度30 min, 最后4度保温。
[0134] 电转化感受态大肠杆菌细胞的制备
[0135] 含有质粒pSC101-BAD-ETgA-tet的E. coli  GB05-dir在加有4 ug/ml四环素的LB中30度培养过夜(OD600=3~4)。将40 ul过夜培养物(OD600=3~4)转接到加有合适抗生素的1.4 ml LB中,置于Eppendorf热混合器上30度,950 rpm培养2 h (OD600=0.35 0.4)。加入35 ul ~10% L-arabinose (w/v, in ddH2O) 来诱导重组酶(ETgA 或gbaA)表达,37度继续培养40 min (OD600=0.7~0.8)。离心收集细胞,9,400g 30 sec, 2℃。弃上清,沉淀用1 ml 冰ddH2O悬浮。离心收集细胞,9,400g 30 sec, 2℃。弃上清,沉淀用1 ml 冰ddH2O悬浮。重复离心、重悬、再离心,用20 ul冰ddH2O悬浮细胞。加入5 ul脱盐的体外组装产物,而在mVenus-PGK-neo元件插入实验中则加入200 ng 质粒和 200 ng PCR产物的混合物。将细胞和DNA的混合液转入1 mm电激杯中,用Eppendorf 电穿孔仪2510 进行电击,电压1350 V, 电容10 uF, 电阻600Ω。加1 ml LB至电激杯中,洗涤细胞并将其转移至扎孔的1.5 ml管中,置于Eppendorf 热混合器上37度,950 rpm培养1 h。最后将适量的菌液涂布到加有合适抗生素(15 ug/ml的氯霉素或15 ug/ml的卡那霉素)的LB平板上,37度过夜培养。
[0136] 实施例1 体外组装和全长RecE/RecT的共同作用提高了直接克隆的效率
[0137] 发明人以明亮发光杆菌ANT-220047中14 kb lux基因簇的直接克隆(图1a)作为模型实验测试了一系列核酸外切酶以及退火方法。在这个克隆实验中,发明人将10 μg经过BamHI+KpnI酶切的ANT-2200基因组DNA和200 ng 2.2 kb的p15A-cm线性载体混合,其中线性载体两端带有与限制性酶切产生的含有lux基因簇的基因组片段两端一致的序列(同源臂),线性载体通过两端的同源臂与目的基因组DNA片段发生同源重组,形成最终的环状质粒。首先用不同的核酸外切酶在体外处理克隆载体和BamHI+KpnI酶切的基因组DNA,然后将体外反应产物转化到表达了RecE/RecT重组酶的E. coli细胞内。测试的核酸外切酶包括:T4 DNA 聚合酶(T4 DNA polymerase;T4pol),DNA聚合酶I的 Klenow片段(Klenow fragment of DNA Polymerase I;Kle),T7 DNA聚合酶(T7 DNA polymerase;T7pol),核酸外切酶III(Exonuclease III;ExoIII);Phusion DNA聚合酶(Phusion DNA polymerase;
Phu),T5核酸外切酶(T5 exonuclease;T5exo);T7核酸外切酶(T7 exonuclease;T7exo)和Lambda核酸外切酶(Lambda exonuclease;λexo)(图2a)。结果显示T4pol, Kle, T5exo和T7exo都能显著提高直接克隆的效率(图2a-e)。核酸外切酶消化之后的退火速率对克隆效率几乎没有影响,发明人选用Eppendorf MC nexus PCR仪的默认降温速率 (2℃ s-1 )(图
3)。经过测试T4pol的浓度、处理温度和时间对直接克隆效率的影响(图1c,d和图2f)。
[0138] 发明人分别比较了单独使用全长RecE/RecT、单独使用T4pol体外退火以及联合使用T4pol体外退火和全长RecE/RecT这三种情况下的直接克隆效率(图1f)。在单独使用RecE/RecT时,也能以很高的正确率将14 kb的lux基因簇从发光细菌染色体中直接克隆p15A载体上(427)。但是将T4pol体外组装的反应产物转化到一个标准的E. coli工程菌中得到的直接克隆效率要高的多(427 vs 4,880)。这表明:(1)E. coli内源的DNA修复体系能够娴熟的将质粒骨架封闭起来;(2)T4pol体外组装的效率很高(4880);(3)将T4pol体外组装和RecE/RecT细胞内重组结合起来的ExoCET技术却比其中任何一种技术单独作用时都要高效(32500)。
[0139] 实施例2同源臂对克隆效率的影响
[0140] 同源臂越长,克隆效率越高(图1b)。在图5a中,发明人将克隆载体一端的80 bp同源臂置于基因簇内部1 kb,或者两端均位于基因簇内部1 kb,然后对ExoCET的效率与T4pol和RecET的效率进行了比较(图5b)。当载体的两个同源臂均位于最末端时,发明人得到了与之前一样的结果。但是,当一个同源臂或者两个同源臂位于基因簇内部1kb时,只用T4pol进行处理的克隆效率是很低的,这表明T4pol核酸外切酶处理后的退火依赖于末端的DNA序列互补配对。值得注意的是,RecET重组的效率与同源臂的位置几乎没有关系。当一个同源臂位于末端,而另一个同源臂位于内部时得到的实验结果令人深思。当载体和基因组DNA片段之间只有一个末端同源臂时,ExoCET的效率是RecET的12倍,这表明在电转化和RecET重组之前,T4pol体外处理能使两个DNA分子通过一端退火而高效的结合在一起。以上数据表明T4pol只能作用于末端同源臂,而内部同源臂的重组需要RecET的作用。因此,发明人得出的结论是T4pol对ExoCET的主要贡献是通过两个线性DNA分子一端的退火而显著提高它们的共转化效率。然后,再用RecET来促进另一端的重组。在14 kb lux基因簇的克隆实验中,当两个同源臂均位于目的基因组酶切片段最末端时,ExoCET的克隆效率是T4pol的6 8倍(图~1f和5b)。这说明大部分体外组装产物只有一端结合在了一起(>85%),而且体外组装的环状产物和两个线性DNA分子共转化后完全由RecET产生的重组质粒对ExoCET高效率的贡献很小。在设计ExoCET直接克隆实验时,同源臂位置对克隆效率非常重要。为了获得最高的克隆效率,两个同源臂都要置于目的DNA片段的最末端。实际上,为了发挥体外T4pol核酸外切酶和退火的作用,至少一个同源臂要置于末端。但是另一个同源臂可以置于目的DNA片段的内部,因为RecE/RecT能够对其定位并发生重组。这非常有利于利用直接克隆来构建表达载体,因为其中一个同源臂可以置于目的片段3’端的最末端,而5’端的目的基因可以利用内部同源臂直接置于启动子和核糖体结合位点的控制之下。
[0141] 实施例3 RecE和RecT都是ExoCET必需的
[0142] 因为RecT是一个单链DNA退火蛋白,所以发明人猜测RecT有可能会跟T4pol(3’核酸外切酶)产生的单链DNA区域退火,因此在ExoCET技术体系可能不需要RecE的参与。为了验证这个猜想,发明人将T4pol处理过的DNA底物转化到表达RecT和Redγ (pSC101-Tg)而且不表达RecE的大肠杆菌细胞内,并没有发现RecT和T4pol之间发生相互作用,因此RecE和RecT都是ExoCET必需的(图5c)。RecA对直接克隆效率有一定的提高。
[0143] 实施例4 DNA大片段直接克隆的验证
[0144] 为了验证ExoCET技术的优越性,发明人利用它来做了一些之前用RecET技术很难做的实验。发光光杆状菌(Photorhabdus luminescens)基因组上存在两个大的基因簇:37.5 kb的plu3535-3532和52.6 kb的plu2670,之前发明人用RecET技术对这两个基因簇进
3
行直接克隆的时候非常困难,其效率分别只有2/12和0/48 ,而利用ExoCET技术发明人却分别获得了10/12和11/17的正确率(表2)。
[0145] 表2 利用ExoCET从细菌、哺乳动物细胞和人血中直接克隆的基因组DNA大片段。
[0146]
[0147] 再有就是发明人之前尝试从白色链霉菌(Streptomyces albus)基因组上一步直接克隆106 kb的盐霉素基因簇没有成功,因此发明人不得不将其分为三个片段分步克隆,然后再将其拼接成一个完整的基因簇43。但是通过ExoCET,利用一个带有同源臂的BAC载体和EcoRV酶切的基因组DNA,发明人可以直接将106 kb的盐霉素基因簇克隆到该BAC载体上,而且获得了2/24的正确率(表2和图6)。因为在106 kb盐霉素基因簇的两侧各有一个EcoRV酶切位点,所以发明人可以将其从染色体上释放出来并克隆到载体上。在DNA大片段克隆的时候,有时候在目的DNA片段的两侧很难找到合适的限制性酶切位点,但是利用可编程的核酸酶则可以摆脱对限制性酶切位点的限制,尤其是RNA介导的核酸内切酶--Cas948,49。为了检测该想法,发明人利用Cas9在很靠近EcoRV的位置将106 kb的盐霉素基因簇从染色体上释放出来,然后利用同一个BAC载体上将相同的106 kb DNA片段克隆到BAC载体上,最终获得相近的克隆效率(表2和图6)。因此,与RecET相比,ExoCET在DNA大片段的直接克隆上具有显著优越的表现。
[0148] 接下来发明人测试了ExoCET的效率能否达到从哺乳动物基因组上直接克隆DNA大片段的要求。发明人利用SwaI从老鼠基因组上释放了一个45 kb的含有Wnt4基因的片段(图7a),通过ExoCET发明人获得了8/25的正确率(图7b)。发明人同时也测试了利用Gibson组装1来克隆这一DNA片段。Gibson组装是在体外利用T5exo,Phusion DNA聚合酶和Taq DNA连接酶将相互之间带有同源臂的DNA分子组装起来。通过将Gibson组装的DNA产物转化到阿拉伯糖诱导和不诱导的含有pSC101-BAD-ETgA-tet的E. coli GB05-dir中,发明人获得了大量菌落(181,000和 257,000),而且检测了60个菌落也没有得到一个正确的克隆(图7b),而且全是自身环化的p15A空载体的。
[0149] 实施例5 利用ExoCET组装DNA片段
[0150] Gibson是为多片段DNA组装建立的方法,所以发明人通过一些DNA多片段组装实验(图7c)对ExoCET和Gibson进行了比较。这些DNA片段都是通过PCR扩增的,而且末端带有40 bp的同源臂。在7片段和10片段组装实验中,ExoCET和Gibson组装的效率都是不错的。当Gibson体外组装的产物转化到表达RecE、RecT、Redγ和RecA的大肠杆菌细胞中时(Gibson+ETgA),组装的效率和正确率均得到了显著提高(图7d)。ExoCET不能组装13个以上的DNA片段,Gibson不能组装16个以上的DNA片段,而Gibson+ETgA却能够将至少20个DNA片段组装成一个54.9 kb的质粒。因此,将体外组装和RecET重组结合起来,对于DNA组装的优势是很明显的。
[0151] 实施例6 利用ExoCET构建单倍型同基因打靶载体
[0152] ExoCET还可以用于从包括血液,疾病相关细胞系等来源的哺乳动物基因组上直接克隆DNA片段以助于SNPs的单倍型研究以及为核酸酶介导的人类干细胞打靶来快速构建单倍型同基因(HIT)打靶载体。从病人、脐带血或体细胞重编程分离到的人类干细胞在生物医学研究的重要性越来越受到人们的重视,对干细胞基因组的精确修饰方法的研究也受到人们的广泛关注。改造人类基因组比改造实验鼠的基因组要更有挑战性,因为人类的遗传多样性很复杂。同基因性(序列相似性)对同源重组的重要性在很多年前人们对老鼠胚胎干细胞进行基因打靶的时候就意识到了14。但是,序列错配对同源重组的影响还未研究清楚,比如单个错配(一个SNP或一个indel)到底能降低多少重组效率 错配距离重组位点的远近是如何影响重组效率的 多个错配是如何影响重组效率的 这些问题目前都还没有搞清楚。无论如何,在基因打靶中使用完全相同的序列很明显是大家极力推荐的,因此ExoCET是一种快速获得理想同源臂的有效方式。与通过PCR从基因组上扩增同源臂的的方法不同,ExoCET不受片段大小的限制,不会引入突变,而且能够维持DNA的单倍型。此外同源臂的末端还可以根据基因分型的方式(比如Southern杂交或者连接PCR)进行选择,所以可以对同源臂的长度进行优化。因此ExoCET为个体化基因组手术提供了优势,尤其是当其与CRISPR/Cas915联合起来时。
[0153] 发明人利用ExoCET来构建同基因打靶载体来对哺乳动物基因组进行改造。鉴于在老鼠胚胎干细胞研究中的经验50,发明人旨在从人或老鼠基因组上直接克隆5至10 kb的DNA片段作为同基因同源臂(图8a和图9a)。值得关注的是这些DNA片段不仅是相同的基因而且维持了多态性的单倍型,所以发明人称之为“HIT”(haplotypic isogenic targeting)载体。通过ExoCET发明人从人(体外培养的细胞系和人血)和老鼠(体外培养的细胞系)基因组中直接克隆了8 9 kb的DNA片段(图8b和图9b),然后通过Redαβ重组工程将筛选标记以及其~它功能元件16插入到HIT载体上(图8c和图9c)。
[0154] 实施例7 利用ExoCET对哺乳动物细胞进行基因分型
[0155] ExoCET还可以作为一种对修饰后的基因组进行基因分型的最可靠方法,而Southern杂交和连接PCR会产生假阳性信号。由于在哺乳动物基因分型研究中,长片段(Long Range)PCR很容易产生假阳性信号,所以发明人之前想通过Southern杂交对通过长片段PCR筛选到的Kmt2d-AID-neo打靶的老鼠胚胎干细胞进行确认。但是,发明人始终得不到好的探针。因此,发明人就用图10a所示的ExoCET方法,从其中4个可能的Kmt2d-AID-neo打靶老鼠胚胎干细胞的基因组上克隆含有完整打靶元件的DNA片段。对ExoCET克隆获得的重组质粒进行限制性酶切分析和DNA测序,结果表明这4个细胞都打靶成功了,而且是单打靶(图10b)。此外,发明人还成功利用ExoCET对之前研究获得的Oct4-Venus-neo, Nanog-Cherry-neo, Gata2-Venus-neo 和Set1b-TC-neo打靶老鼠胚胎干细胞进行了再次验证(表3),这些打靶细胞在之前都是已经通过Southern杂交验证过的。这些结果表明,ExoCET基因分型没有位点限制。发明人之前对一个Klf4-Venus-neo打靶的老鼠胚胎干细胞一直无法确定其是否打靶成功,因为长片段PCR和Southern杂交一直得不到确切的信号。利用ExoCET克隆,发明人在基因组上的相应区域并没有克隆到具有卡那霉素抗性的DNA片段(表3)。对克隆到的氯霉素抗性质粒进行限制性酶切分析发现,其中50%带有野生型的DNA序列(图11)。
因此,发明人才确切的知道此细胞并没有被正确打靶。
[0156] 表3 ExoCET 基因分型实验数据
[0157]
[0158] * 经过限制性酶切分析。
[0159] ** 其余10个是分子内重组 (在克隆目的序列中含有11个 > 40 bp的直接重复序列)。
[0160] 表4优化ExoCET基因分型中需要的Oct4-Venus-neo 打靶的老鼠胚胎干细胞基因组DNA的量
[0161]
[0162] * 经过限制性酶切分析。
[0163] 与长片段PCR相比,ExoCET基因分型不会产生假阳性信号。而与Southern杂交相比,其操作更简单,不需要繁琐的筛选杂交探针过程。在ExoCET基因分型中,用于释放含有完整打靶元件的限制性酶切位点很容易就能找到,而且在基因组制备好的情况下,只要三天就得到基因分型的结果。更重要的是,ExoCET从来不会产生假阳性信号。由于打靶元件上具有筛选标记,只要500 ng限制性酶切的基因组DNA就足以获得较好的克隆效率(表4)。为了提高ExoCET基因分型的通量,可以使用96孔板培养的细胞。
[0164] 实施例8 ExoCET克隆技术应用于宏基因组样品
[0165] 对海量基因组测序结果进行功能分析需要简单快速的表达载体构建方法。根据本发明的方法,发明人可以将长达 50 kb的DNA片段从3.0 x 109 bp的基因组中克隆出来。为~此,发明人将1 ng的明亮发光杆菌基因组DNA稀释到10μg芽胞杆菌Bacillus subtilis基因组DNA中来模仿宏基因组,通过ExoCET成功将14 kb的lux基因簇成功克隆了出来,并获得了可观的效率(表5)。环境样品通常含有104以上的物种51-53,所以该结果可以激励发明人将ExoCET克隆技术应用于宏基因组样品中。
[0166] 表 5 利用ExoCET从稀释的发光杆菌明亮发光杆菌基因组上直接克隆14 kb的lux基因簇。
[0167]
[0168] 参考文献
[0169] 1.Gibson, D.G. 等人 Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat. Methods 6, 343-345 (2009).
[0170] 2.Shao, Z. & Zhao, H. DNA assembler, an in vivo genetic method for rapid construction of biochemical pathways. Nucleic Acids Res. 37, e16 (2009).
[0171] 3.Fu, J. 等人 Full-length RecE enhances linear-linear homologous recombination and facilitates direct cloning for bioprospecting. Nat Biotechnol 30, 440-446 (2012).
[0172] 4.Tang, Y. 等人 Heterologous expression of an orphan NRPS gene cluster from Paenibacillus larvae in Escherichia coli revealed production of sevadicin. J. Biotechnol. 194, 112-114 (2015).
[0173] 5.Bian, X. 等人 Direct cloning, genetic engineering, and heterologous expression of the syringolin biosynthetic gene cluster in E. coli through Red/ET recombineering. ChemBioChem 13, 1946-1952 (2012).
[0174] 6.Bian, X. 等人 Heterologous production of glidobactins/luminmycins in Escherichia coli Nissle containing the glidobactin biosynthetic gene cluster from Burkholderia DSM7029. Chembiochem 15, 2221-2224 (2014).
[0175] 7.Bian, X. 等人 In vivo evidence for a prodrug activation mechanism during colibactin maturation. Chembiochem 14, 1194-1197 (2013).
[0176] 8.Larionov, V. 等人 Specific cloning of human DNA as yeast artificial chromosomes by transformation-associated recombination. Proc. Natl. Acad. Sci. USA 93, 491-496 (1996).
[0177] 9.Lee, N.C., Larionov, V. & Kouprina, N. Highly efficient CRISPR/Cas9-mediated TAR cloning of genes and chromosomal loci from complex genomes in yeast. Nucleic Acids Res. 43, e55 (2015).
[0178] 10.Kouprina, N.  &  Larionov,  V.  Transformation-associated recombination (TAR) cloning for genomics studies and synthetic biology. Chromosoma (2016).
[0179] 11.Jiang, W. 等人 Cas9-Assisted Targeting of CHromosome segments CATCH enables one-step targeted cloning of large gene clusters. Nat. Commun. 6, 8101 (2015).
[0180] 12.Bian, X., Plaza, A., Zhang, Y. & Müller, R. Luminmycins A-C, cryptic natural products from Photorhabdus luminescens identified by heterologous expression in Escherichia coli. J. Nat. Prod. 75, 1652-1655 (2012).
[0181] 13.Zhou, Y. 等人 Iterative mechanism of macrodiolide formation in the anticancer compound conglobatin. Chem. Biol. 22, 745-754 (2015).
[0182] 14.te Riele, H., Maandag, E.R. & Berns, A. Highly efficient gene targeting in embryonic stem cells through homologous recombination with isogenic DNA constructs. Proc. Natl. Acad. Sci. USA 89, 5128-5132 (1992).[0183] 15.Baker, O. 等人 RAC-tagging: Recombineering And Cas9-assisted targeting for protein tagging and conditional analyses. Sci. Rep. 6, 25529 (2016).
[0184] 16.Fu, J., Teucher, M., Anastassiadis, K., Skarnes, W. & Stewart, A.F. A recombineering pipeline to make conditional targeting constructs. Methods Enzymol. 477, 125-144 (2010).
[0185] 17.Hofemeister, H. 等人 Recombineering, transfection, Western, IP and ChIP methods for protein tagging via gene targeting or BAC transgenesis. Methods 53, 437-452 (2011).
[0186] 18.Copeland, N.G., Jenkins, N.A. & Court, D.L. Recombineering: a powerful new tool for mouse functional genomics. Nat. Rev. Genet. 2, 769-779 (2001).
[0187] 19.Muyrers, J.P., Zhang,  Y. &  Stewart, A.F. Techniques: Recombinogenic engineering--new options for cloning and manipulating DNA. Trends Biochem. Sci. 26, 325-331 (2001).
[0188] 20.Narayanan, K. & Chen, Q. Bacterial artificial chromosome mutagenesis using recombineering. J. Biomed. Biotechnol. 2011, 971296 (2011).[0189] 21.Murphy, K.C. Phage recombinases and their applications. Adv. Virus Res. 83, 367-414 (2012).
[0190] 22.Murphy, K.C. lambda Recombination and Recombineering. EcoSal Plus 7 (2016).
[0191] 23.Zhang, Y., Buchholz, F., Muyrers, J.P. & Stewart, A.F. A new logic for DNA engineering using recombination in Escherichia coli. Nat. Genet. 20, 123-128 (1998).
[0192] 24.Clark,  A.J. 等人  Genes of the RecE and  RecF pathways of conjugational recombination in Escherichia coli. Cold Spring Harb. Symp. Quant. Biol. 49, 453-462 (1984).
[0193] 25.Hall, S.D., Kane, M.F. & Kolodner, R.D. Identification and characterization of the Escherichia coli RecT protein, a protein encoded by the recE region that promotes renaturation of homologous single-stranded DNA. J. Bacteriol. 175, 277-287 (1993).
[0194] 26.Clark, A.J.,  Satin, L.  & Chu, C.C. Transcription of the Escherichia coli recE gene from a promoter in Tn5 and IS50. J. Bacteriol. 
176, 7024-7031 (1994).
[0195] 27.Kuzminov, A. Recombinational repair of DNA damage in Escherichia coli and bacteriophage lambda. Microbiol. Mol. Biol. Rev. 63, 751-813 (1999).[0196] 28.Chu, C.C., Templin, A. & Clark, A.J. Suppression of a frameshift mutation in the recE gene of Escherichia coli K-12 occurs by gene fusion. J. Bacteriol. 171, 2101-2109 (1989).
[0197] 29.Muyrers, J.P., Zhang, Y., Buchholz, F. & Stewart, A.F. RecE/RecT and Reda/Redb initiate double-stranded break repair by specifically interacting with their respective partners. Genes Dev. 14, 1971-1982 (2000).[0198] 30.Chang, H.W. &  Julin, D.A. Structure and function of the 
Escherichia coli RecE protein, a member of the RecB nuclease domain family. J. Biol. Chem. 276, 46004-46010 (2001).
[0199] 31.Zhang, J., Xing, X., Herr, A.B. & Bell, C.E. Crystal structure of E. coli RecE protein reveals a toroidal tetramer for processing double-stranded DNA breaks. Structure 17, 690-702 (2009).
[0200] 32.Zhang, Y., Muyrers, J.P., Rientjes, J. & Stewart, A.F. Phage annealing proteins promote oligonucleotide-directed mutagenesis  in Escherichia coli and mouse ES cells. BMC Mol. Biol. 4, 1 (2003).
[0201] 33.Szczepanska, A.K. Bacteriophage-encoded functions engaged in initiation of homologous recombination events. Crit. Rev. Microbiol. 35, 197-220 (2009).
[0202] 34.Kolodner, R., Hall, S.D. & Luisi-DeLuca, C. Homologous pairing proteins encoded by the Escherichia coli recE and recT genes. Mol Microbiol 11, 23-30 (1994).
[0203] 35.Iyer, L.M., Koonin, E.V. & Aravind, L. Classification and evolutionary history of the single-strand annealing proteins, RecT, Redbeta, ERF and RAD52. BMC genomics 3, 8 (2002).
[0204] 36.Maresca, M. 等人 Single-stranded heteroduplex intermediates in lambda Red homologous recombination. BMC Mol. Biol. 11, 54 (2010).
[0205] 37.Poteete, A.R. Involvement of Escherichia coli DNA replication proteins in phage Lambda Red-mediated homologous recombination. PloS one 8, e67440 (2013).
[0206] 38.Muyrers, J.P., Zhang, Y., Testa, G. & Stewart, A.F. Rapid modification of bacterial artificial chromosomes by ET-recombination. Nucleic Acids Res. 27, 1555-1557 (1999).
[0207] 39.Zhang, Y., Muyrers, J.P., Testa, G. & Stewart, A.F. DNA cloning by homologous recombination in Escherichia coli. Nat. Biotechnol. 18, 1314-1317 (2000).
[0208] 40.Testa, G. 等人 Engineering the mouse genome with bacterial artificial chromosomes to create multipurpose alleles. Nat. Biotechnol. 21, 
443-447 (2003).
[0209] 41.Sarov, M. 等人 A recombineering pipeline for functional genomics applied to Caenorhabditis elegans. Nat. Methods 3, 839-844 (2006).
[0210] 42.Bird, A.W. 等人 High-efficiency counterselection recombineering for site-directed mutagenesis in bacterial artificial chromosomes. Nat. Methods 9, 103-109 (2012).
[0211] 43.Yin, J. 等人 Direct cloning and heterologous expression of the salinomycin biosynthetic gene cluster from Streptomyces albus DSM41398 in Streptomyces coelicolor A3(2). Sci. Rep. 5, 15081 (2015).
[0212] 44.Wang, H. 等人 Improved seamless mutagenesis by recombineering using ccdB for counterselection. Nucleic Acids Res 42, e37 (2014).
[0213] 45.Pospiech, A. & Neumann, B. A versatile quick-prep of genomic DNA from Gram-positive bacteria. Trends Genet. 11, 217-218 (1995).
[0214] 46.Wang, H. 等人 RecET direct cloning and Redalphabeta recombineering of biosynthetic gene clusters, large operons or single genes for heterologous expression. Nat. Protoc. 11, 1175-1190 (2016).
[0215] 47.Zhang,  S.D. 等人  Genome  Sequence of Luminous Piezophile Photobacterium phosphoreum ANT-2200. Genome Announc. 2, e0009614 (2014).[0216] 48.Jinek, M. 等人 A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
[0217] 49.Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc. Natl. Acad. Sci. USA 109, E2579-2586 (2012).[0218] 50.Skarnes, W.C. 等人 A conditional knockout resource for the genome-wide study of mouse gene function. Nature 474, 337-342 (2011).
[0219] 51.Torsvik, V., Goksoyr, J. & Daae, F.L. High diversity in DNA of soil bacteria. Appl. Environ. Microbiol. 56, 782-787 (1990).
[0220] 52.Rappe, M.S. & Giovannoni, S.J. The uncultured microbial majority. Annu. Rev. Microbiol. 57, 369-394 (2003).
[0221] 53.Charlop-Powers, Z., Milshteyn, A. & Brady, S.F. Metagenomic small molecule discovery methods. Curr. Opin. Microbiol. 19, 70-75 (2014)。