基因组减少的细菌转让专利

申请号 : CN03802545.0

文献号 : CN1620497B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : F·R·布拉特纳G·波斯发C·D·赫林G·普伦基特J·D·格兰斯纳T·M·托斯

申请人 : 威斯康星校友研究基金会

摘要 :

本发明提供一种细菌,所具有的基因组被遗传改造成比其天然亲代菌株基因组小至少2到约20%。具较小基因组的细菌可更有效生成商业产品。本发明也提供从细菌基因组缺失基因和其它DNA序列的方法。此方法提供精确的缺失且很少引入突变到缺失位置周围的基因组DNA序列。因此,该方法可用于产生一系列细菌中的突变而不增加基因组内不需要的同源重组的可能性。此外,本发明提供的一些方法也能用于使所需DNA序列取代细菌基因组区域。

权利要求 :

1.一种大肠杆菌,所述大肠杆菌的基因组被遗传改造成比其天然亲代大肠杆菌菌株K12MG1655基因组小5%至20%,其中从所述细菌基因组缺失的序列不会不利地影响细菌在特定生长条件下生存和增殖的速度,其中所述大肠杆菌的基因组缺失了以下基因:

263080-324632(MD1),1398351-1480278(MD2),2556711-2563500(MD3),

2754180-2789270(MD4),2064327-2078613(MD5),3451565-3467490(MD6),

2464565-2474198(MD7),1625542-1650785(MD8),4494243-4547279(MD9),

3108697-3134392(MD10),1196360-1222299(MD11),564278-585331(MD12),

15388-20562(GP1),602688-608572(GP2),2507651-2515959(GP3),379334-387870(GP4),

389122-399029(GP5),2993014-2996890(GP6),3182797-3189712(GP7),

687083-688267(GP8),1386912-1396645(GP9),2099418-2135738(GP10),

2284421-2288200(GP11),3359797-3365277(GP12),3648921-3651342(GP13),

1128620-1140209(GP14),1960590-1977353(GP15),1995135-2021700(GP16),

4553059-4594581(GP17),522062-529349(GP18),728588-738185(GP19),

1525916-1531650(GP20),3616623-3623310(GP21),3759620-3767869(GP22),

1041254-1049768(GP23),1085330-1096545(GP24),2163173-2175230(GP25),

3578769-3582673(GP26),3718263-3719704(GP27),和167484-173447(MD40)。

2.如权利要求1所述的大肠杆菌,其基因组被遗传改造成比其天然亲代菌株基因组小至少14%。

3.如前述权利要求1-2中任一项所述的大肠杆菌,其基因组被遗传改造成小于

4.27Mb。

4.如前述权利要求1-2中任一项所述的大肠杆菌,其基因组被遗传改造成小于

4.00Mb。

5.如权利要求1所述的大肠杆菌,所述大肠杆菌基因组中一个或多个编码蛋白质的基因被缺失,所述蛋白分泌到其周质或在周质中加工。

6.如权利要求5所述的大肠杆菌,所述一个或多个基因选自fliY、yedO、nfnB、tauA、mppA、tynA、chiA、fimC、fecB、ygiH、yagP和yhcA。

7.如前述权利要求1-2中任一项所述的大肠杆菌,当与其天然亲代相比时,缺乏9%的蛋白质编码基因。

8.如前述权利要求1-2中任一项所述的大肠杆菌,当与其天然亲代相比时,缺乏

15.6%的蛋白质编码基因。

9.如前述权利要求1-2中任一项所述的大肠杆菌,当与其天然亲代相比时,缺乏

21.5%的蛋白质编码基因。

10.一种通过在细菌基因组中已知序列的所选基因组区域产生缺失而不引入瘢痕来产生权利要求1至9中任一项所述细菌的方法,所述方法包括步骤:产生人工DNA序列,所述人工DNA序列包括:一端是与待缺失基因组区域左侧翼基因组序列相同的1号序列,接着是与待缺失基因组区域右侧翼基因组序列相同的2号序列;另一端是与待缺失基因组区域中基因组序列相同的3号序列;以及线性DNA分子一端的2号序列与线性DNA分子另一端的3号序列之间的序列特异性核酸酶识别位点,其中所述识别位点不存在于细菌基因组中;

在有利于第一和第三序列与细菌基因组中序列同源重组的条件下将人工DNA序列导入细菌;

将表达载体导入细菌,所述细菌基因组包含插入正确位置的线性DNA分子,该表达载体用于表达识别识别位点的序列特异性核酸酶;

在细菌中表达所述序列特异性核酸酶;以及

收集在该序列特异性核酸酶表达时存活且包含正确缺失的细菌,和任选地重复上述步骤直至获得其基因组具有至少5%缺失的细菌。

11.如权利要求10所述的方法,人工DNA序列通过携带人工DNA序列的 载体导入细菌,或者,所述人工DNA序列被直接导入细菌。

12.如权利要求10或11所述的方法,还包括步骤:

提供细菌,所述细菌包含用于系统的表达载体和用于序列特异性核酸酶的表达载体,所述系统能增加同源重组频率,所述序列特异性核酸酶识别细菌基因组中不存在的识别位点,其中该序列特异性核酸酶的表达在诱导型启动子控制下且两个表达载体相容。

13.如权利要求10或11中任一项所述的方法,所述线性DNA分子进一步包括:在人工DNA一端的1号序列与人工DNA另一端的3号序列间的可选择标记。

14.如权利要求10或11所述的方法,所述序列特异性核酸酶是I-SceI。

15.如权利要求12所述的方法,所述能增加同源重组频率的系统是噬菌体λRed重组酶系统。

16.一种通过在细菌基因组中已知序列的所选基因组区域产生缺失来产生权利要求1至9中任一项所述细菌的方法,所述方法包括步骤:提供载体,载体包括序列特异性核酸酶识别位点和两个DNA序列,一个与待缺失细菌基因组一侧的侧翼序列相同,另一个与细菌基因组另一侧的侧翼序列相同,其中两个DNA序列在载体上彼此相邻,其中序列特异性核酸酶识别位点在载体上位于两个DNA序列外;

将载体导入细菌;

将表达载体导入相同细菌,表达载体用于表达识别识别位点的序列特异性核酸酶;

将能增加同源重组频率的系统导入相同细菌并在细菌中同时表达序列特异性核酸酶;

以及

鉴定待缺失基因组区域被缺失的细菌,和任选地重复上述步骤直至获得其基因组具有至少5%缺失的细菌。

17.如权利要求16所述的方法,所述能增加同源重组频率的系统是噬菌 体λRed重组酶系统。

18.一种改进了的在细菌中表达重组蛋白的方法,其特征在于,所述方法包括:将载体导入权利要求1-9中任一项所述的细菌,所述载体包括带有信号序列的编码蛋白质的DNA,该DNA序列与表达控制序列操作相连;和使细菌在适于表达蛋白编码DNA的营养条件下生长。

19.如权利要求18所述的方法,所述表达控制序列组成型表达,或者,所述表达控制序列是诱导型启动子。

说明书 :

基因组减少的细菌

[0001] 相关申请的交叉引用
[0002] 本专利申请是提交于2002年1月23日的美国专利申请序列号10/057,582和提交于2002年9月6日的美国临时专利申请序列号60/409,080的后继部分,它们都全部纳入本文供参考。
[0003] 关于联邦赞助研究或发展的声明
[0004] 本发明得到美国政府支持进行,由下列机构授予:
[0005] NIH GM35682
[0006] 美国对此发明有一些权利。
[0007] 发明背景
[0008] 细菌用于生成广泛范围的商业产品。例如,许多链霉菌属(Streptomyces)菌株和杆菌属(Bacillus)菌株用于生成抗生素;脱氮假单胞菌(Pseudomonas denitrificans)和许多丙酸菌属菌株用于生成维生素B12;一些其它细菌用于生成维生素核黄素;黄色短杆菌(Brevibacterium flavum)和谷氨酸棒状杆菌(Corynebacterium glutamicum)分别用于生成赖氨酸和谷氨酸作为食物添加剂;其它细菌用于生成其它氨基酸作为食物添加剂;真养产碱菌(Alcaligenes eutrophas)用于生成可生物降解的微生物塑料;许多醋酸杆菌属(Acetobacter)和葡萄糖酸菌(Gluconobacter)菌株用于生成醋。近来,细菌如大肠杆菌(E.coli)更常被遗传改造和用作宿主细胞以在实验室以及工业设置中生成生物制剂,如蛋白质和核酸。制药业支持了一些成功产品的例子,它们是在发酵罐中培养的大肠杆菌培养物中产生的人类蛋白质。
[0009] 正常细菌蛋白质不利影响所需蛋白产物从工程菌中生成或纯化不是不普遍。例如,当大肠杆菌用作宿主细胞以产生大量基因编码的所需产物,基因通过质粒导入宿主细胞,一些正常大肠杆菌基因产物可干扰质粒DNA的导入和维持。更重要的是,由于细菌产生蛋白质中的细菌培养经济,通常纯化重组蛋白的成本可大于生成成本,细菌宿主生成的一些天然蛋白质对于纯化问题敏感。此外,许多细菌菌株产生的毒素必须从正生成的靶蛋白中纯化出且一些菌株能同时产生大小与靶蛋白接近的天然蛋白质,从而使大小分离不能用于纯化过程。
[0010] 然而同样,发酵罐中用于生成重组蛋白的细菌基因组包括许多不必需基因。在自然环境中生长的细菌有许多条件响应基因以提供机制在温度、压力或缺乏食物来源的困难环境条件中生存。发酵罐中生长的细菌没有这些问题并因而不需要这些条件响应基因。细菌宿主将各增殖循环的代谢能量用于复制这些基因。因此,用于生成重组蛋白的细菌宿主所产生的不必需基因和不需要蛋白导致系统缺乏效率,这可被改进。
[0011] 使微生物基因组产生缺失不是很困难。可简单通过缺失基因组区域在生物体中进行随机缺失研究以确定生物体的什么特性由于缺失基因而失去。然而,基因组DNA特定区域进行靶缺失更困难,如果发明目标之一是缺失后不在生物体留下插入DNA更加困难,这里插入DNA定义为“瘢痕”。如果插入DNA即瘢痕区域在基因组缺失过程后留下,这些区域可作为不需要重组的位置,能切除所需或产生基因组重排的基因组区域。在确立一系列多种缺失时,前面步骤留下的瘢痕可作为随后缺失步骤的人工靶。当方法重复用于从基因组产生一系列缺失时更是如此。换句话说,如果留下插入DNA,生物体由于缺失过程变成遗传不稳定。
[0012] 发明概述
[0013] 本发明提供方法用于优选减少生物体基因组而不在基因组中留下瘢痕。
[0014] 在一个实施方案中,本发明提供一种细菌,所具有的基因组被遗传改造成比其天然亲代菌株基因组小至少百分之二(2%)到百分之二十(20%)。基因组优选比其天然亲代基因组小至少百分之七(7%)。基因组更优选比其天然亲代菌株基因组小至少百分之十四(14%)到百分之二十(20%)。当用于生成产品时,具较小基因组的细菌可有一个或多个下列优势。第一,生产过程在资源消耗或生产速度、最终产生百分比或所有三个方面效率更高。第二,可简化产品纯化过程或能产生更纯的产物。第三,以前由于天然蛋白质干扰不能生成的产品可被制成。第四,所需产品的每细胞产量可增加。
[0015] 本发明也涉及生物体,优选细菌,改造成具有“干净基因组”即没有例如遗传物质如一些细菌生长和代谢不必要的基因、插入序列(转座因子)、假基因、原噬菌体、内源限制性-修饰基因、致病基因、毒素基因、菌毛基因、周质蛋白基因、侵袭素基因、未知功能序列和相同天然亲代细菌属的2个菌株中没有共同发现的序列。培养中对细胞生存和一些蛋白质生成不必需的其它DNA序列可被缺失。本发明基因组减少的细菌可看作基本的遗传构架,可加入多种遗传元件以表达有用产物以及遗传控制元件以提供前所未有的机会来精调或最优化所需产物的表达。
[0016] 本发明也提供材料和方法用于从细菌基因组中靶缺失基因和其它DNA序列而不从操作中留下任何剩余DNA(无瘢痕缺失)。由于本发明方法很少在缺失位置周围的基因组DNA序列中引入突变或留下剩余DNA,该方法可用于产生一系列细菌中的突变而不增加基因组内不需要的同源重组的可能性。一些这种方法也用于产生类似缺失,例如在噬菌体、天然质粒等中,以及在高等生物体中如哺乳动物和植物。
[0017] 第一种缺失方法是以线性DNA为基础。为进行此过程,首先,在细菌中提供线性DNA构建且细菌基因组区域通过细菌系统协助的同源重组被线性DNA构建取代,系统能增加同源重组频率。其次,前面导入细菌的分离基因表达序列特异性核酸酶以在位于线性DNA构建上的独特识别位置切细菌基因组。随后,改造DNA序列包含的DNA与线性DNA构建一个末端基因组DNA中的靶同源,此DNA序列用位于线性DNA构建另一个末端的类似基因组DNA序列进行同源重组。净所得是基因组区域的确切缺失。
[0018] 第二种方法也以线性DNA为基础。两种DNA序列,一种与待缺失的细菌基因组区域一个末端侧翼序列相同而另一种与待缺失的细菌基因组区域另一个末端侧翼序列相同,两种DNA序列改造到载体中,在其中两种序列彼此相邻。至少一个序列特异性核酸酶识别位置也改造到载体中,在两种序列的一侧。载体导入细菌且通过在细菌中表达核酸酶来细菌内产生线性DNA,核酸酶识别序列特异性核酸酶识别位置并切割本文的载体。线性DNA与细菌基因组进行同源重组,由细菌系统协助以增加同源重组频率。因而产生的细菌具有靶缺失且基因组中没有剩余人为影响。
[0019] 上述第二种方法也能用于使所需DNA序列取代细菌基因组的选择区域。在此情况中,所需DNA序列可与选择区域进行同源重组并因此取代所选区域,所需DNA序列被改造到载体中。对于缺失靶区域,所有其它方面相同。
[0020] 第三种方法以自杀性质粒为基础。本发明所用特定质粒包含启动子控制的复制起点和可选择标记如抗生素抗性基因。为缺失细菌基因组的靶区域,含两种彼此相邻DNA序列的DNA插入片段被插到质粒中,两种DNA序列一种与待缺失的细菌基因组区域一个末端侧翼序列相同而另一种与细菌基因组区域另一个末端侧翼序列相同。随后质粒导入细菌并整合到细菌基因组中。其次,活化启动子以诱导从引入细菌基因组的异位来源复制,从而选择重组。在许多细菌中,重组导致细菌基因组靶区域的精确缺失且可鉴定这些细菌。另一种选择重组的方法是将序列特异性核酸酶识别位置改造到特定质粒并在质粒整合到细菌基因组后用序列特异性核酸酶切细菌基因组。
[0021] 上述以自杀性质粒为基础的方法也可用于使所需DNA序列取代细菌基因组的选择区域。在此情况中,DNA插入片段被插到质粒中,DNA插入片段包含的所需DNA序列可与选择区域进行同源重组并因此取代所选区域。对于缺失靶区域,所有其它方面相同。
[0022] 本发明方法用于改造基因组减少的细菌以生成重组基因产物。这种工程菌可改进这些蛋白质生成,通过增加所需基因产物的生成效率和产量以及通过去除不必需细菌基因产物更有效纯化产品。本发明优选的基因组减少细菌中缺失一个或多个天然基因,天然基因编码周质蛋白和/或膜蛋白。
[0023] 本发明也涉及DNAs和载体用于完成本发明方法、制备DNAs的方法和含小瓶的试剂盒,小瓶包含一个或多个本发明载体和任选适当的缓冲液、引物、核酸内切酶、核苷酸和聚合酶。
[0024] 本发明也涉及活疫苗,包括本发明基因组减少的细菌或所含本发明基因组减少的细菌中导入DNA编码致病生物的抗原决定簇,与能表达所述抗原决定簇的表达控制序列可操作相连。同样在本发明范围内的活疫苗包括本发明基因组减少的细菌,其中导入DNA获得自致病生物且任选具有复制起点,所述活疫苗能诱导宿主抗致病生物的免疫应答增强。所述DNA优选在甲基化位点被甲基化。发明也涉及产生自致病生物的活疫苗,这是通过从此生物中缺失用于致病的基因而保持其它抗原决定簇。
[0025] 发明的其它目标、特征和优势通过下列详细描述而明显。
[0026] 附图简述
[0027] 图1显示大肠杆菌K-12细菌基因组上候选缺失的基因和其它DNA序列位置,以最外层环上黑色和更淡阴影线盒表示。
[0028] 图2阐述了本发明以线性DNA为基础的无瘢痕遗传修饰方法的特定例子。
[0029] 图3阐述了本发明另一个以线性DNA为基础的方法的特定例子。
[0030] 图4显示突变质粒,能用于图3所示以线性DNA为基础的方法。
[0031] 图5A-C阐述了本发明以自杀性质粒为基础的方法的特定例子。
[0032] 图6显示3种质粒,能用于图5A-C所示以自杀性质粒为基础的方法。
[0033] 发明详述
[0034] 在其自然环境中的细菌暴露于许多在标准工业或实验室生长中通常不经历的条件,因此携带大量条件-依赖、压力-诱导的基因或者在工业或实验室使用生物中不需的另外非必要基因。本发明一开始意识到细菌菌株基因组中所含的许多遗传信息能被缺失而不有害影响细菌培养在工业加工中的使用或实验室重要性。意识到基因组减少的天然菌株可能在许多工业或实验室应用中相对天然菌株有优势。例如,基因组减少的细菌至少代谢要求有些降低并因此能更有效生成所需产物。此外,基因组减少可导致天然产物更少和一些天然蛋白水平更低,使从剩余细菌蛋白中纯化所需蛋白更简单。另外,一些细菌遗传序列与不稳定相关,可干扰标准工业或实验室实践,可能涉及昂贵且繁重的质量控制过程。
[0035] 本发明也包括一些方法用于从基因组中缺失基因组DNA而不留下任何插入DNA(无瘢痕缺失)。如果从构成细菌基因组的单个DNA分子中进行一些连续缺失,不留下任何插入DNA序列是重要的。这种插入序列如果留下,会是不需要重组的候选位置,不需要重组从细菌剩余基因组中缺失特征未确定且也许重要的部分或引起有不利影响的未预期基因组重排。由于基因组减少努力的目标之一是增加细菌的遗传稳定性,留下任何插入DNA会与目标相反并应避免。因此,用于从基因组缺失DNA的方法变得重要且复杂。
[0036] 一方面,本发明涉及的细菌基因组被遗传改造成比其天然亲代菌株基因组小。为了示范目的,本文所述工作集中在普通实验室和工业细菌大肠杆菌。本文所述基因组减少工作开始用实验室大肠杆菌菌株K-12,它在本文所述工作前具有的基因组为4,639,221个核苷酸或碱基对。本发明细菌可具有的基因组比其天然亲代菌株基因组小至少百分之二(2%),优选超过百分之五(5%),更优选超过百分之七(7%)到百分之八(8%)到百分之十四(14%)到百分之十八(18%)到百分之二十(20%),到百分之四十(40%)到百分之六十(60%)。术语“天然亲代菌株”指在科学界通常理解的自然或天然环境中发现的细菌菌株(或其它生物体),它们的基因组上可进行一系列缺失以产生基因组较小的细菌菌株。计算一系列缺失后基因组变小的百分比通过将“所有缺失后删除的碱基对总数”除以“所有缺失前基因组中碱基对总数”再乘以100。
[0037] 本发明的另一方面包括基因组较小的细菌,详细描述了其中约5%到约10%的蛋白质编码基因。优选约10%到约20%的蛋白质编码基因被缺失。在发明的另一个实施方案中,约30%到约40%)到约60%的蛋白质编码基因被缺失。
[0038] 一般说来,可缺失的基因和其它DNA序列类型是其缺失不会不利影响细菌在特定生长条件下生存和增殖的速度。不利效果水平是否可接受取决于特定应用。例如,增殖速度减少30%对于一种应用可接受但另一种不能。此外,基因组缺失DNA序列的不利效果可通过调节如改变培养条件来降低。这种调节可能使一种不能接受的不利效果转变成可接受的。增殖速度优选和亲代菌株大致相同。然而,比亲代菌株低约5%、10%、15%、20%、30%、40%到约50%范围的增殖速度在发明范围内。更特定的是,本发明细菌的优选倍增时间范围可从约30分钟到约3小时。
[0039] 本发明细菌可通过本发明方法改造以最优化它们对可用资源(如营养)的使用以生成所需产物。这些产物可以是重组蛋白,非限制例子有胰岛素、白介素、细胞因子、生长激素、生长因子、红细胞生成素、集落刺激因子、干扰素、抗体、抗体片段或任何其它有用的重组蛋白。重组产物可以是治疗产品、疫苗成分、诊断产品或研究试剂。细菌也可能用作背景以表达工业有用的产品如商业有用的代谢中间物和末端产品如香草醛、莽草酸、氨基酸、微生物、有机酸等,以及不在细菌中天然产生但通过代谢途径工程或其它遗传操作生成的化学化合物-(参见例如美国专利号6,472,16和6,372,476,它们都纳入本文供参考)。
[0040] 下面大肠杆菌用作例子来阐明作为缺失候选的基因和其它DNA序列用于产生能更有效生成所需产物的细菌。所示一般原则和鉴定为缺失候选的基因和其它DNA序列类型可应用于其它细菌属或菌株。要理解的是下面鉴定为缺失候选的基因和其它DNA序列仅是例子。许多未鉴定的其它大肠杆菌基因和其它DNA序列也可缺失而不影响细胞生存和增殖到不能接受的水平。
[0041] 假定在下述分析和方法中,靶细菌菌株噬菌体基因组或天然质粒的至少部分DNA序列可用。优选整个序列可用。这种完整或部分序列可获得于GenBank数据库。当然,现在发表了一些大肠杆菌菌株的完整基因组序列(例如Blattner等,Science,277:1453-74,1997K-12菌株MG1655;也参见GenBank登录号U00096;Perna等,Nature,409,
529-533,2001;Hayashi 等,DNA Res,8,11-22,2001 和 Welch 等,Proc.Natl.Acad.Sci.,USA(2002)99(26)17020-17024和GenBank登录号AE014075,所有都全部纳入本文供参考),如一些其它实验室常用细菌的序列。为开始缺失过程,分析细菌基因组以寻找作为好缺失候选的序列。当然,这些技术也可应用于基因组区域中部分测序的基因组,其序列数据可获得或能确定。
[0042] 在大肠杆菌、其它细菌以及高等生物中,可缺失的DNA序列类型包括一般会不利影响生物或此生物基因产物稳定性的类型。这些引起不稳定性的元件包括转座因子、插入序列、可能在基因组不稳定性中发挥作用的其它“自私DNA”因子。例如,插入序列(IS)元件和它们相关的转座子通常发现于细菌基因组,因此是缺失的靶。IS序列在大肠杆菌中普遍,它们都可被缺失。为了在此文献中阐明,我们使用术语IS元件和转座因子,一般称为DNA元件,无论完整或缺陷都可从基因组一点移到另一点。IS元件在科学技术中有害效果的另一个例子是它们在用于测序的增殖中从宿主大肠杆菌基因组跳到BAC质粒。许多例子发现于人基因组和其它GenBank数据库中的序列。此现象可通过从宿主细胞中缺失所有IS元件来防止。对于特定应用,其它与基因组不稳定性相关的特定基因也可被缺失。
[0043] 如图1所示,阐明了在K-12菌株中大肠杆菌基因组天然包括4,639,221个碱基对。图1显示内环上大肠杆菌K-12基因组(菌株MG1655)的碱基对位置刻度,没有缺失(也参见Blattner等,同上)。下一个外面的环显示K-12基因组区域,在相关菌株O157:H7中没有或高度改变,因此能从K-12基因组中检测。下一个外环显示天然基因组中完整和部分的IS元件位置。其次的外环显示RHS元件A到E和鞭毛和限制性区域位置,它们是缺失的特别靶。最外的环显示实际对基因组进行缺失的位置,也列于下表1和2。这些缺失组成原始K-12MG1655基因组中约百分之14的碱基对。使用本发明方法,18%到20%到约40%基因组用本文所述设计范例来缺失。
[0044] 另一个能缺失的大肠杆菌基因家族是限制性修饰系统基因和其它内源核酸酶,其产物破坏外源DNA。这些基因对于细菌在培养环境中存活和生长不重要。这些基因也能通过破坏导入细菌的质粒来干扰遗传工程。限制性修饰系统基因在大肠杆菌基因组图谱上的位置示于图1和表1。在发明的一个实施方案中,其它DNA甲基化酶基因可再加入缺失大肠杆菌菌株以最优化菌株用于一些使用,例如真核甲基化酶基因。
[0045] 另外一个能缺失的大肠杆菌基因家族是鞭毛基因家族。鞭毛用于细菌运动。在天然环境中,细菌游泳以搜索营养。在培养环境中,细菌运动对细胞存活和生长不重要且游泳行为在代谢上很昂贵,消耗超过1%的细胞能量而没有益处。因此,可缺失鞭毛基因来产生基因组减小的细菌。鞭毛基因在大肠杆菌基因组图谱上的位置示于图1和表1。
[0046] 已提及的一类能缺失的大肠杆菌DNA元件是IS元件(或转座因子)。IS元件对细菌在培养环境中存活和生长不重要且已知干扰基因组稳定性。因此,可缺失IS元件来产生基因组减小的细菌。IS元件在大肠杆菌基因组图谱上的位置示于图1和表1。
[0047] 另一类能缺失的大肠杆菌DNA元件是Rhs元件。所有Rhs元件共有3.7Kb Rhs核心,这是大同源重复区(在大肠杆菌K-12中有5个拷贝),提供经同源重组的基因组重排方法。Rhs元件是附加元件,主要在一些其它背景中进化并在大肠杆菌作为属分化后通过水平交换散布到大肠杆菌。Rhs元件在大肠杆菌基因组图谱上的位置示于图1和表1。
[0048] 一类能缺失的大肠杆菌基因组区域是非转录区,因为它们更不可能对细胞存活和增殖重要。另一类能缺失的大肠杆菌基因组区域是hsd区。hsd区编码上述主要限制性修饰基因家族。非转录区和hsd区在大肠杆菌基因组图谱上的位置示于图1和表1。
[0049] 在本文所讨论的基因选择范例基础上,原噬菌体、假基因、毒素基因、致病基因、周质蛋白基因、膜蛋白基因也是能缺失的基因。大肠杆菌K-12序列(参见Blattner等,同上)与其近亲O157:H7(参见Perna等,同上)序列比较后,论述22%(K-12)和46%(O157:H7)的蛋白质编码基因位于菌株特异岛上,从1到约85kb随机插入相对恒定的主链。
[0050] 其它能缺失的基因是编码噬菌体受体的基因,包括例如ton A(FhuA)和/或其完整操纵子fhu ABC,操纵子编码裂解性噬菌体T1的受体。
[0051] 鉴定另外基因和DNA序列作为缺失候选的一般方法是比较一个细菌菌株和一个或多个其它菌株的基因组。任何不存在于2或3个菌株的DNA序列是功能必需的可能性更小,因此可用于鉴定缺失候选。在下述例子中,比较2个大肠杆菌菌株O157:H7EDL933和K-12MG1655的完整基因组序列。在2个菌株中都没有发现的DNA序列用于鉴定缺失靶。12个这样从大肠杆菌菌株MG1655中鉴定的靶被缺失,产生的细菌菌株基因组小约8%。基因组减少的细菌生长速度几乎与天然亲代MG1655菌株相同。
[0052] 最近确定引发尿道疾病的大肠杆菌菌株CFT073H7(Welch等,同上)的DNA序列且其序列与K-12(MG1655)和O157:H7比较。结果显示任意基因组中发现的所有编码基因中仅约40%存在于所有基因组且CFT073、K-12和O157:H7包括67%、43%和68%菌株特异岛基因。在此信息基础上,多达约60%的蛋白编码序列可从大肠杆菌中缺失。优选至少5%或约90%或约15%或约21%的蛋白质编码基因被缺失。更优选约30%的蛋白质编码基因被缺失。应指出也许有些基因对于一个菌株生长必须而其它菌株生长不需要。在这种情况中,菌株生长必需基因不从此菌株中缺失或者如果缺失,用具互补功能的另一个基因取代以使此菌株能生长。
[0053] 在发明的一个特定实施方案中,序列信息用于从大肠杆菌基因组中选择另外基因(用本发明方法)以产生约3.7兆碱基的基因组(比K-12小约20%),基因组含73个缺失以去除约100个“岛”且当培养于基本培养基时周围DNAs仍使菌株能适当生长。设计也需要从基因组中完全去除任何剩余转座因子(IS序列)。
[0054] 周质清除和蛋白质表达
[0055] 由于本文所讨论原因,本领域仍需要生成分泌到细菌周质空间的重组蛋白且本发明方法提供细菌改造以最优化周质表达。
[0056] 革兰氏阴性细菌如大肠杆菌有2层细胞膜,内细胞膜和外细胞膜。2层膜通过周质空间(PS)分离。有适当信号序列的细菌蛋白经内细胞膜分泌到PS,通过至少2种不同系统Sec-系统和Tat-系统。(Danese等,Annu.Rev.Genet.(1998)32:59-94;Fekes等,Microbiol.Mol.Biol.Rev.,(1999)63:161-193;Pugsley,Microbiol.Rev.,(1993)57:50-108[sic].Hynds 等,(1998)J.Biol.Chem.273:34868-34874;Santini 等,(1998)EMBO J.17:101-112;Sargent等,EMBO J.17:101-112[TAT],全部都纳入本文供参考。
[0057] Sec-系统识别适当信号肽和运输蛋白质以未折叠状态到周质,使用细胞质ATP和电子原动力。切割信号蛋白后,新蛋白通过伴侣肽基-脯氨酰异构酶和硫氧还蛋白相关系统协助折叠,系统催化二硫键形成。参见例如Hynds等,(1998)J.Biol.Chem.273:34868-34874;Santini 等 (1998)EMBO J.17:101-112;Sargent 等,EMBO J.17:101-112[TAT],全部都纳入本文供参考。
[0058] 与Sec-系统相反,Tat-系统运输充分折叠构象的大蛋白且在识别适当信号序列中更特异。我们选择周质,因为(1)它是表达异源重组蛋白的优选位置,(2)对于控制条件中的工业使用,它有许多不需要蛋白,(3)它在许多不必需的适应和控制系统中发挥作用,一些似乎有害。通过从周质中去除天然蛋白质,我们预期能大幅改进生成蛋白质的加工方法。在周质中表达和分泌蛋白质综述于Hanahan,D.,J.Mol.Biol.,1983,166(4):557-80页;Hockney R.C.,Trends Biotechnol.,1994,12(11):456-632页;Hannig G.,等,Trends Biotechnol.,1998,16(2):54-60页,全部都纳入本文供参考。
[0059] 有一些原因说明周质为何是蛋白质生成的优选位置;(1)它能生成氨基末端与天然蛋白相同的重组蛋白,而在细胞质中蛋白质总是以氨基酸甲硫氨酸为起始;(2)许多蛋白质能在周质空间中正确折叠(3)正确的二硫键可在周质氧化环境中形成;(4)周质空间所含蛋白质远少于细胞质,简化纯化(5)蛋白酶少于细胞质,减少蛋白质消化和损失;(6)通过破坏外膜,表达蛋白能和其它周质蛋白容易释放,几乎没有更丰富的细胞质蛋白。周质空间有天然酶系统,经内膜与细胞细胞质代谢相关以承担这些加工任务,大概因为在此细胞器官中大部分内和外膜蛋白被加工。相反,证明获得细胞质还原环境中表达的适当折叠重组蛋白链很难。通常蛋白质聚集成不溶的“内含体”。初始内含体纯化可能较简单,蛋白质需要再溶解和再折叠,此过程不能预期且难以控制,对于一些蛋白质效率很低从而不能以工业规模生产。
[0060] 重组蛋白一般通过表达融合蛋白在周质中生成,其中它们附于导致分泌到周质空间的信号肽。信号肽由特定信号肽酶很精确的切割。第二种重组人生长因子生成由Genentech(Nutropin,所有指定信息)和Pharmacia通过此方法生产。不是所有的蛋白质能通过此途径成功生成,有证据表明分泌和分泌后加工系统有限制能力。同样,仍有待处理的蛋白污染物。要注意的是对这种批准产品有警告,它包含痕量大肠杆菌周质蛋白,在一些病人中引起抗体生成(Gonotropin:所有指定信息)。本发明材料和方法可减少或去除此问题。
[0061] 本领域需要生成会分泌到PS的重组蛋白。完成此分泌可用Sec-或Tat-系统或各细菌中可用的任何其它分泌病原体。在任一情况中,适当信号肽加入重组蛋白。如果使用Sec-系统,需要下列另外的实验。由于报导Sec-系统可通过高效表达构建饱和,第1组实验是发展有最佳重组蛋白表达水平的系统,重组蛋白能在PS中适当运输和折叠。
[0062] 用于在本发明基因组减少细菌中周质表达的重组DNA构建包括编码信号肽的第一个DNA序列,可操作连接于至少第二个编码所需异源蛋白的DNA序列,信号肽能调节蛋白质运输到周质空间。信号序列可以是待表达蛋白固有的。运输到周质空间的蛋白质优选是生物活性。表达重组DNA构建可在诱导型启动子或组成型表达于宿主细菌的启动子控制下。当使用已知可饱和的Sec系统时,使用诱导型启动子有特定优势。例如,可使用以lac-为基础的启动子/阻遏物,由非代谢半乳糖衍生物IPTG诱导。这种启动子可精调经Sec系统的表达和分泌,从而最优化周质表达。
[0063] 重组蛋白也可与伴侣/二硫键形成酶共表达以确保重组蛋白的适当折叠。用于周质表达重组蛋白的DNA序列包括但不限于美国专利号5,747,662;5,578,464;6,335,178 和 6,022,952、Thomas 等,Mol-Micro,(2001)39(1)47-53;Weiner 等,Cell,(1998)93,93-101;《分子生物的当前操作》(Current Protocols in MolecularBiology)(1994)16.6.1-16.6.14(John Wiley等和Sons享有版权2000)所述,全部纳入本文供参考。
[0064] 在本发明的一个实施方案中,9个已知和3个推定周质蛋白基因在构建MDS40中成功缺失,没有显著影响生物在基本培养基上生长的能力(见下表4和数据)。这些突变影响一定范围的功能,包括氨基酸吸收、无机代谢、细胞膜维持、糖代谢和粘附。
[0065] 缺失约85个编码已知或推定膜蛋白的基因,通过它们的信号肽序列鉴定。其中33个参与鞭毛结构或生物合成;9个参与菌毛结构或生物合成;13个参与一般分泌途径。剩余的具有多种细胞膜中已知或推定功能。认为许多这些蛋白质在周质空间中加工。它们也在构建MDS40中缺失,没有显著影响生物在基本培养基上生长的能力。
[0066] 通过在注释MG 1655数据库中搜索信号肽-类似序列,将这些与文献相互关联,我们鉴定了181个蛋白质,大部分被认为是固有(resident)周质蛋白。一些这种蛋白根据功能分成几组排除:粘附和移动;营养和盐吸收、痕量因子吸收;环境感觉;防御和保护;周质蛋白分泌和加工。在缺失或待缺失的基因或完全操纵子中,编码糖和氨基酸运输蛋白的基因或完全操纵子不可能为了生物制药生产需要用于成分明确的基本培养基。
[0067] 为监控重组蛋白运输到PS的效率,3种商业购买标记:大肠杆菌碱性磷酸酶、水母(Aequoria)绿色荧光蛋白(GFP)或人生长激素蛋白可根据上述方法使用。人生长激素蛋白目前最优选用于最终证明目的且用于ELISA和以基因芯片为基础测量重组蛋白定位到PS。
[0068] 可测试从基因组缺失一个或几个基因或其它DNA序列的结果。例如,基因组的一个或几个基因或其它DNA序列被缺失后,能可测量所得细菌的生存和增殖速度。尽管大部分上面鉴定的基因或其它DNA序列可没有有害效果地缺失用于生成所需产物,缺失特定基因或其它DNA序列可能有不可接受的后果如细胞死亡或增殖速度减少水平不能接受。由于基因功能冗余和生物途径间的相互作用,存在此可能性。一些缺失在没有另外缺失的菌株中可存活,仅在结合其它缺失时会有害。由于用于鉴定缺失候选的一些方法,也存在此可能性。例如,用于鉴定缺失候选的一种方法是比较两个大肠杆菌菌株并选择不在两个菌株中都存在的基因或其它DNA序列。尽管大部分这些基因和其它DNA序列不可能是功能必需,一些可能对独特菌株重要。另一种用于鉴定缺失候选的方法是鉴定非转录区,可能一些非转录区对基因组稳定性重要。
[0069] 缺失一个或几个基因或其它DNA序列的测试结果取决于应用目的。例如,当高生成效率是主要关注时,许多应用也确实如此,缺失对增殖速度和培养基消耗速度的效果可以是测试结果。在此情况中,测试结果也可更特异作为特定产物的生成速度量和每细胞产量。当去除天然蛋白污染物是主要关注时,更少的天然蛋白和更低的天然蛋白水平或缺乏特定天然蛋白可以是测试结果。
[0070] 当对于基因或其它DNA序列所知甚少时,测试缺失一个基因或其它DNA序列的结果是重要的。尽管艰苦,这是另一种鉴定缺失候选以产生基因组减少细菌的可行方法。当通过其它方法鉴定的候选被缺失且正寻找另外候选时,此方法特别有用。
[0071] 当缺失一个基因或其它DNA序列对细菌在一组条件下存活有影响时,一种不缺失特定基因或其它DNA序列的另外选择是确定是否有调节能减轻有害效果。例如,如果缺失脂多糖(LPS)基因导致存活差,这是由于细胞膜缺乏LPS蛋白的扩膜结构域引起更多孔的细胞膜,可改变培养条件以适应更多孔的细胞膜从而缺乏LPS基因的细菌能和携带LPS基因的细菌生存的一样好。
[0072] 从细菌基因组缺失DNA序列的方法对本领域普通技术人员已知,能用于产生基因组减少的细菌。这些方法的例子包括但不限于Posfai,G.等,J.Bacteriol.179:4426-4428(1997),Muyrers,J.P.P.等,Nucl.Acids Res.27:1555-1557(1999),Datsenko,K.A.等,Proc.Natl.Acad.Sci.97:6640-6649(2000)和Posfai,G.等,Nucl.AcidsRes.27:
4409-4415(1999)所述,全部纳入本文供参考。基本上,缺失方法可分成以线性DNAs为基础和以自杀性质粒为基础。Muyrers,J.P.P.等,Nucl.AcidsRes.27:1555-1557(1999)和Datsenko,K.A.等,Proc.Natl.Acad.Sci.97:6640-6649(2000)所述方法是以线性DNAs为基础的方法且Posfai,G.等,J.Bacteriol.179:4426-4428(1997)和Posfai,G.等,Nucl.Acids Res.27:4409-4415(1999)所述方法是以自杀性质粒为基础的方法。
[0073] 一些从细菌基因组缺失DNA序列的已知方法在缺失过程中将外源DNA序列导入基因组,因此如果任何方法在细菌中使用超过一次,有产生不需要同源重组的潜在问题。为避免此问题,优选无瘢痕的缺失方法。无瘢痕缺失指DNA从基因组精确缺失而不在缺失位置产生任何其它突变且不在生物基因组留下任何插入DNA。然而由于错误如PCR扩增和DNA修复过程中产生的,无瘢痕缺失中可偶尔引入一个或两个核苷酸变化。下面描述一些新的无瘢痕缺失方法,或以线性DNA为基础或以自杀性质粒为基础。这些新方法在下述例子中应用于大肠杆菌菌株。要理解的是例子中用于大肠杆菌菌株的特定载体和条件可由本领域普通技术人员修改用于其它细菌。类似方法和质粒能用于在高等生物中产生类似效果。在一些情况中,更适合修饰现有生产菌株而不是将生产转移到最小基因组的大肠杆菌菌株。
[0074] 本发明方法不限于使用基因组减少的细菌,例如本发明方法可用于从噬菌体中缺失DNA如P1、P2、λ和其它噬菌体。这些方法能改造噬菌体基因组以改进它们的有用性质和/或减少或去除一些有损这种噬菌体用于多种目标的性质。类似的,本发明方法用于修饰细菌中的质粒以从质粒中去除有害因子(如毒性基因)和改进质粒的其它有用性质。
[0075] 上述熟知的普遍性转导噬菌体P1用于将DNA片段转导入受体大肠杆菌。然而,一些P1的基因特征最终限制用于转导的吸收和包装基因组DNA的能力。特定的是,P1包装位置(pac)位点是GATC丰富区,当通过P1的dam甲基化酶甲基化时限制基因组DNA进入噬菌体包被的量。然而缺乏dam相关的包装位置甲基化时,包装DNA变得“肥大”,即比包装位置被甲基化时更易包装基因组DNA部分。因此,用本发明方法改造P1基因组以去除dam基因有优势,从而提高吸收和包装基因组物质dam的能力。
[0076] 另一个与使用P1转导相关的缺点是噬菌体携带两个插入序列。在插入序列上发现IS1在P1基因组的ssb和prt基因座之间。另一个IS5在res基因中。结果,可能当P1用于转导时,一个或多个插入序列会最终跳到生物基因座中。因此,用本发明方法改造P1基因组以缺失IS序列有优势,从而防止P1用作转导子时的基因组污染。
[0077] 在上面描述中,本发明结合特定例子描述。要理解的是本发明不限于这些例子,而要构建成在所附权利要求确定的精神和范围内。
[0078] 本发明的一个实施方案是基因组减少的费氏志贺氏菌(Shigella flexner)。最近,确定费氏志贺氏菌2a菌株2457T的完整基因组序列。(测序菌株重保存于美国模式培养物保藏所,登录号ATCC 700930)。费氏志贺氏菌基因组由4,599,354个碱基对(bp)的单环染色体组成,G+C含量为50.9%。由于细菌显示广泛的同源性,分配染色体的碱基对1与大肠杆菌K-12的碱基对一相应。基因组显示有约4082个预测基因,平均大小为873个碱基对。费氏志贺氏菌基因组表现出大肠杆菌病原体的主链和岛镶嵌结构,虽然水平转移的DNA少很多且缺乏大肠杆菌中存在的357个基因。(参见Perna等,(2001)Nature,409,529-533。生物体的独特在于在其大的插入序列补充、一些基因组重排、12个隐性原噬菌体、372个假基因和195个志贺氏菌特异基因。完整的费氏志贺氏菌注释序列保存于GenBank,登录号AE014073,纳入本文供参考。(也参见《费氏志贺氏菌血清型2A菌株2457T的完整基因组序列和比较基因组学》(Complete Genome Sequence and ComparativeGenomics of Shigella flexner Serotype 2A strain 2457T),Wei等,提交待发表)。令人惊讶的是注意到在其DNA序列基础上,志贺氏菌在系统发生上与大肠杆菌无法区别。
[0079] 从此说明中显然有费氏志贺氏菌序列,其基因组序列可用本文所讨论方法和基因选择范例来减少。由于本文所讨论关于基因组减少的大肠杆菌(活疫苗)的原因,基因组减少的志贺氏菌能用于表达异源(重组)蛋白或其它有用营养。另一种基因组减少的志贺氏菌使用或对此任何致病细菌易受本发明缺失方法影响的是作为载体用于展示或呈递抗原以诱导宿主的免疫反应。这种工程志贺氏菌能例如将用于毒性的基因从生物中缺失而维持其它基因如编码抗原决定簇的基因,足以诱导宿主的免疫反应和优选在宿主肠壁中的粘膜免疫反应。
[0080] 费氏志贺氏菌可能很适于此策略,因为其毒性决定簇特征被确定且定位于210-kb“大毒性(侵入)质粒”,其核苷酸序列被确定并保存于GenBank,登录号AE348706,纳入本文供参考。(也参见Venkatesan等,Infection of Immunity(2001年5月),
3271-3285)。侵入质粒中可能的缺失候选是编码赖氨酸脱羧酶的cadA基因。
[0081] 缺失的志贺氏菌侵入质粒可导入基因组减少的大肠杆菌,从而可有效表达一些志贺氏菌侵入质粒基因,在接种大肠杆菌的宿主中能引起免疫反应。也能改造侵入质粒以从质粒中缺失有害基因如用于破坏液泡的基因。从侵入质粒去除的优选候选基因包括一个或多个选自ipaA、ipaB、ipaC、ipaD和virB的基因。本发明也可加入其它基因到基因组减少的大肠杆菌,侵入质粒导入大肠杆菌以最优化来自导入、修饰侵入质粒的基因表达。
[0082] 本发明也涉及活疫苗,包括例如基因组减少的大肠杆菌或例如导入编码抗原基因的基因组减少大肠杆菌,在接种疫苗的宿主中能诱导免疫反应。基因组减少的疫苗可以是以DNA为基础的疫苗,所含DNA已知能诱导宿主中的所需生理反应(即免疫反应)。
[0083] 根据本发明的基因组减少生物的一个主要优势是提供干净、最小遗传背景,其中可导入DNA不仅能表达所需分子,也提供机会将另外的DNAs导入干净背景以提供能最优化所需产物表达的分子来源。
[0084] 缺失方法
[0085] 构建线性靶DNA
[0086] 构建线性靶DNA的例子如下:为产生引物a+b(图1),20pmol的引物a混合20pmol的引物b,PCR在总共50μl体积中进行。循环参数为:15x(94℃40秒/57℃或更低[取决于引物a和b间重叠程度]40秒/72℃15秒)。其次,1μl的此PCT产物混合各20pmol的引物a和c(图1)、50ng pSG76-CS模板,第二轮PCR在2x50μl体积中进行。循环参数为:28x(94℃40秒/57℃40秒/72℃80秒)。所得PCR产生的线性DNA片段用Promega Wizard PCR purification试剂盒纯化并悬浮于20μl水。不需要去除模板质粒(如通过DpnI消R
化)。pSG76-CS作为模板质粒通过PCR产生线性靶片段。它包含氯霉素抗性(Cm)基因和
2个I-SceI位点,通过PCR-调节插入第二个I-SceI位点来获得以及通过PCR-调节插入第二个I-SceI识别位点到pSG76-C的NotI位点下游来获得。2个I-SceI位点方向相反。
[0087] 新的以线性DNA为基础的无瘢痕缺失方法I
[0088] 当下列描述根据图2阅读时,可最好的理解本发明以DNA为基础的新无瘢痕缺失方法。一般说来,方法包括用人工DNA序列取代基因组片段,标记缺失。人工序列包含一个或多个识别位点用于序列特异性核酸酶如I-SceI,它切割的序列不在大肠杆菌K-12基因组任何地方天然出现。精确插入线性DNA分子到基因组通过系统协助的同源重组完成,系统可增加同源重组频率。当序列特异性核酸酶导入细菌时,它在独特识别位点切割基因组DNA,仅发生同源重组的细菌会存活。
[0089] 特别提到图2,质粒pSG76-CS用作模板以合成人工DNA插入片段。人工插入序列R在图2中命名为A、B和C的序列间延伸。C 表示抗生素抗性基因。插入DNA从质粒中PCR扩增并电穿孔到大肠杆菌宿主。构建插入从而序列A和B配对宿主基因组中跨计划缺失的序列。随后选择抗生素抗性的细菌,选择使只有发生同源重组的细菌会存活,其中人工DNA插入细菌基因组。此重组在序列A和C对间发生。插入DNA序列也包括现位于插入一个末端的序列B,设计成与插入另一个末端外的基因组序列同源,如图2所示。然后在细菌生长后,细菌用质粒pSTKST转化,质粒表达I-SceI序列特异性核酸酶。I-SceI酶切割细菌基因组,仅发生重组的个体会存活。10-100%的存活子是B到B重组存活子,可通过筛选步骤鉴定。B到B重组从基因组中缺失整个插入DNA,只留下缺失周围的天然序列。
[0090] 为了重复,此方法的第一个步骤包括在细菌中提供线性DNA分子。线性DNA分子包含具下列特征的人工线性DNA序列:线性DNA序列的一个末端是与待缺失基因组区域左侧翼基因组序列相同的序列,接着是与待缺失基因组区域右侧翼基因组序列相同的序列;线性DNA序列的另一个末端是与待缺失基因组区域中基因组序列相同的序列;线性DNA两个末端间有一个不存在于细菌菌株基因组的识别位点和抗生素选择基因。人工DNA序列可用聚合酶链式反应(PCR)或定向DNA合成来产生。用于此目的的PCR模板包含独特识别位点且人工线性DNA序列2个末端的基因组DNA序列是用于PCR反应的部分引物。PCR模板可由质粒提供。能用作模板的一个质粒例子是pSG76-C(GenBank登录号Y09893),描述于Posfai,G.等,J.Bacteriol.179:4426-4428(1997)。也可使用pSG76-CS(GenBank登录R
号AF402780),它获得自pSG76-C。pSG76-CS包含氯霉素抗性(Cm)基因和2个I-SceI位点,通过PCR-调节插入第二个I-SceI识别位点到pSG76-C的NotI位点下游来获得。2个I-SceI位点方向相反。
[0091] 人工或构建的DNA序列可提供给细菌,通过直接导入线性DNA分子到细菌,使用本领域普通技术人员已知的任何方法如电穿孔。在此情况中,选择标记如抗生素抗性基因改造到人工DNA序列中用于稍后选择含插入DNA序列的菌落。另外,线性DNA分子能在细菌中提供,通过用携带人工线性DNA序列的载体转化细菌并经限制性酶切在细菌内产生线性DNA分子。所用限制性酶应仅切载体但不切细菌基因组。在此情况中,人工线性DNA序列不必须携带选择标记,因为载体转化效率更高从而插入线性DNA的细菌可稍后直接通过PCR筛选。
[0092] 无瘢痕缺失方法的第二个步骤包括通过插入人工DNA分子来取代基因组区域。改造细菌细胞以包含增加同源重组频率的系统。这种系统的一个例子是Red重组酶系统。系统能通过载体导入细菌细胞。系统协助线性DNA分子取代含缺失靶的基因组区域。如下面例子所述,载体pBAD αβγ携带可用于大肠杆菌的同源重组系统,描述于Muyrers,J.P.P.等,Nucl.Acids Res.27:1555-1557(1999)。也可使用另一个质粒pKD46,描述于Datsenko,K.A.等,Proc.Natl.Acad.Sci.97:6640-6649(2000)。其它可用的质粒包括pGPXX和pJGXX。PGPXX获得自pBADαβγ,通过用pSC101复制起点取代pBADαβγ的复制起点。PJGXX是pSC101质粒,在tet启动子控制下从噬菌体933W中编码Red功能。
[0093] 无瘢痕缺失方法的第三个步骤包括去除插入DNA序列。序列特异性核酸酶如I-SceI的表达载体导入细菌,I-SceI识别插入DNA序列上的独特识别位点。随后表达序列特异性核酸酶并切割细菌基因组。切割后,仅发生同源重组导致插入线性DNA分子缺失的细胞可存活。因此,获得细菌的靶DNA序列从基因组中缺失。能用于大肠杆菌的序列特异性核酸酶表达载体例子包括pKSUC1、pKSUC5、pSTKST、pSTAST、pKTSHa、pKTSHc、pBADScel和pBADSce2。这些载体携带的序列特异性核酸酶是I-SceI。pKSUC1、pKSUC5、pSTKST和pSTAST描述于下面例子中。
[0094] 上述方法可在细菌中反复使用以产生一系列缺失。当用于同源重组系统的表达载体和用于独特序列特异性核酸酶的表达载体彼此不相容时,如pBADαβγ和pKSUC1的情况,每个缺失循环必须进行2个载体转化。当使用2个相容质粒如pBAD αβγ和pSTKST或pKD46和pKSUC5时,在另外缺失循环中可避免转化2个载体。使用2个这些彼此不相容载体的例子描述于下面例子中。
[0095] 可修改上面无瘢痕缺失方法以在细菌基因组上更有效产生一系列缺失(其例子是下面实施例的过程4)。修改方法的第一个步骤包括以平行方式在细菌细胞中产生单独线性DNA分子插入,优选野生型细菌细胞,导致各携带单个插入的一组菌株。此步骤能如上所述完成。修改方法的第二个步骤包括将单个插入连续转移到待减少基因组的靶细胞。P1转导是可用于转移插入的一个方法例子。修改方法的第三个步骤包括重组去除插入序列,能如上所述完成。
[0096] 新的以线性DNA为基础的无瘢痕缺失方法II
[0097] 在这个以线性DNA为基础的新方法中,2个DNA序列改造到质粒载体中,1个与待缺失细菌基因组区域一个末端序列相同且另1个与细菌基因组区域另一个末端序列相同,方向类似。本文的载体定义为靶载体。2个DNA序列在靶载体上彼此相邻。至少一个仅切靶载体而不是细菌基因组的酶识别位点也在2个DNA序列外的位置改造到靶载体。识别位点可以是序列特异性核酸酶如I-SceI。识别位点也可用于仅切未甲基化序列的甲基化敏感限制性酶。由于细菌基因组上的识别位点(如果有)被甲基化,限制性酶仅能切靶载体。靶载体转化到细菌中且线性DNA分子在细菌内产生,通过在细菌中表达识别和切割靶载体上识别位点的酶。其次,在细菌中活化可增加同源重组的系统以诱导线性DNA和待缺失区域侧翼的细菌基因组同源序列间的同源重组。由于上面的同源重组可获得靶基因组区域缺失的细菌。
[0098] 这个以线性DNA为基础的新方法也能用于使所需DNA序列取代细菌基因组区域。在此情况中,所需DNA序列改造到靶载体中,序列能与细菌基因组进行同源重组以取代基因组区域。所有其它方面与上述用于缺失细菌基因组区域的相同。
[0099] 无论方法是用于缺失或取代细菌基因组的靶区域,由于高结合效率不需要标记基因,标记基因选择靶载体上携带的DNA结合到细菌基因组。通过PCR简单筛选30-100个菌落通常可鉴定细菌基因组中有所需修饰的克隆。
[0100] 作为特定例子,图3和4阐明用此方法将琥珀终止密码子导入基因中部。作为第一个步骤,产生的DNA片段具有位于基因中部或染色体区域的所需修饰。序列特异性核酸酶I-SceI识别位点引入DNA片段一侧。这可通过包括PCR引物5’末端序列来简单完成,引物用于扩增DNA片段。更长的DNA片段(500-5,000个核苷酸)一般工作最佳。
[0101] DNA片段克隆到多拷贝的靶质粒载体如pUC19(GenBank登录号M77789)。由于此靶载体与下述突变载体一起使用,靶载体改造成与p15A起点质粒(获得自pACYC184)(GenBank登录号X06403)相容且具有除了氯霉素的药物抗性标记。这些限制可容易用另外突变质粒来避免。
[0102] 如图4所示,此例子所用突变质粒包含序列特异性核酸酶I-SceI和λred基因exo、P-BAD启动子控制下的β和γ。质粒也包含p15A ori和氯霉素抗性基因。
[0103] 靶和突变质粒转化到recA阳性大肠杆菌。根据氯霉素抗性和靶质粒上携带的抗性选择细菌。随后挑出单菌落并在1ml丰富的成分明确培养基中37℃培养约7.0小时(Neidhardt等,J.Bacteriol.119:736-47,全部纳入本文供参考),培养基含0.2%阿拉伯糖和氯霉素。随后连续稀释(例如1∶1,000、1∶10,000等)的培养物平板培养于非选择性培养基如LB。接着,筛选有所需突变的菌落。如果生长表型已知,筛选可通过在适当培养基上通过膜片形成来完成。否则,筛选用菌落PCR进行,接着通过限制性消化和电泳或测序。
[0104] 以自杀性质粒为基础的方法
[0105] 本文所述以自杀性质粒为基础的方法可用于无瘢痕基因缺失和基因取代。发明的基本要素包括名为联锁(Interlock)质粒的质粒载体,质粒含抗生素抗性基因和启动子控制下的复制起点。联锁质粒也包含一个或多个可插入DNA插入片段的位置。当方法用于无瘢痕缺失时,DNA插入片段包括两个彼此相邻的DNA序列,方向类似,一个与待缺失细菌基因组区域一个末端侧翼序列相同且另一个与细菌基因组区域另一个末端侧翼序列相同。当方法用于基因取代时,DNA插入片段包括取代细菌基因组片段的序列。当控制复制起点的启动子被关闭时,质粒的复制被关闭且抗生素压力能用于选择在侧翼区域位置的染色体整合。染色体在侧翼区域位置整合后,控制质粒复制起点的启动子可被打开,能存活的细菌仅是发生重组以去除所述复制起点、其启动子或两者的细菌。当DNA插入片段用于产生无瘢痕缺失时,整合插入和对应基因组区域间的重组会导致细菌在任何整合前具有所需取代或相同基因组。随后可进行筛选步骤以鉴定基因组中有所需修饰的细菌。
[0106] 上面方法的变化包括相同的联锁质粒,除了质粒也包含细菌基因组中缺乏的序列特异性核酸酶识别位点。染色体整合后,改造细菌以表达序列特异性核酸酶用于切割细菌基因组和选择重组,而不是活化复制起点控制启动子以选择重组。
[0107] 以自杀性质粒为基础的方法也可以与上述线性DNA为基础的新方法类似方式反复使用,以在细菌基因组上产生一系列缺失。
[0108] 图6显示质粒实施方案,能用于以自杀性质粒为基础的方法。pIL-1是联锁质粒且pBAD-Sce-1是表达序列特异性核酸酶I-SceI的质粒。pIL-4是两者的组合。pIL-1和pIL-4所用tet启动子被紧密调节并因此相对其它控制机制如温度敏感元件具有优势,温度敏感元件更加渗漏。使用pIL-4以取代基因的例子示于图5A-C,用于阐明本发明以自杀性质粒为基础的方法。图5A显示DNA插入片段pIL-4和pIL-4整合到细菌基因组。有了热活化氯四环素(CTC),tet阻遏物失活,O和P启动子有功能,质粒复制。去除CTC后,tet阻遏物结合O启动子和P启动子并阻碍复制。氯霉素抗性可用于选择整合子。图5B显示用异位起点诱导以选择同源重组和同源重组的2个可能结果。图5C显示另一种选择同源重组的方法和同源重组的2个可能结果。此另外方法包括诱导I-SceI表达以产生双链断裂。
[0109] 以自杀性质粒为基础的方法的2个特定实施方案在下面描述为操作1和操作2。pIL-1和pIL-4能用于操作1,pIL-1结合pBAD-Sec-1能用于操作2。本领域普通技术人员也可修改操作2,单独使用pIL-4。
[0110] 操作1(用λ起点反选择):
[0111] 1.生成所需基因组修饰作为线性DNA片段。在产生琥珀突变体的情况中,修饰可用兆引物PCR进行。为在基因组中进行缺失,应使用所需缺失终点的融合。应磷酸化DNA片段末端用于克隆。
[0112] 2.产生钝克隆位点,通过用限制性酶Srf1消化pIL4载体(图5A和6)。载体脱磷酸。
[0113] 3.钝端连接所需修饰和pIL4载体。
[0114] 4.(注意:此步骤可能在高通量实施中不是必要的)。将连接转化到大肠杆菌克隆菌株(如JS5)中。转化在LB+1ug/ml cTc中生长1小时(cTc-在LB培养基中新高压灭菌的氯四环素。100μg/ml贮存物高压灭菌20分钟,随后在4℃暗处保存。它可使用直至5天。另外,可置换2ng/ml无水四环素溶液)。然后平板培养于LB+氯霉素(Cam 25μg/ml)+cTc(1μg/ml),37℃生长过夜。在相同培养基中生长菌落并准备质粒小量制备DNA。通过凝胶电泳分析且选择有插入的克隆。
[0115] 5.将确认的质粒转化到recA阳性大肠杆菌菌株(如MG1655)。在LB+1μg/mlcTc中生长1小时。部分生长物在含Cam和1μg/ml cTc的平板上培养。37℃生长过夜。
[0116] 6.将菌落挑到1ml LB中,10μl在Cam平板上培养。37℃生长过夜。
[0117] 7.在Cam平板上划线菌落以确保每个存在的细胞包含整合质粒。37℃生长过夜。
[0118] 8.将菌落挑到1ml LB中,100μl的1∶100稀释在Cam平板上培养,平板含5μg/ml cTc。37℃生长过夜。
[0119] 9.(筛选突变)仅部分反选择菌落包含所需突变,其它的回复成野生型。突变体与回复体的比例取决于修饰在克隆片段中的位置。必须进行一些种类的筛选以鉴定所需突变。为生成琥珀突变体,所讨论基因可通过PCR扩增并用BfaI限制性酶消化(BfaI切前面是’C’的琥珀密码子)。
[0120] 操作2(用I.Sce1高通量反选择):
[0121] 1-4与操作1相同。
[0122] 5.携带插入的联锁质粒和pBAD-Sce1共转化到recA阳性大肠杆菌菌株(如MG1655)。在LB+1μg/ml cTc中生长1小时。(另外,携带插入的联锁质粒可自身转化到已携带pBAD-Sce1的感受态细胞)。
[0123] 6.加入氯霉素到25μg/ml且卡那霉素到50μg/ml。37℃振荡生长1-2小时。
[0124] 7.细胞在微离心机中沉淀30秒。去除培养基上清。
[0125] 8.(整合步骤)细胞重悬浮于1ml LB+氯霉素(25μg/ml)+卡那霉素(50μg/ml)+葡萄糖(0.2%),37℃振荡生长过夜。
[0126] 9.过夜培养物在相同培养基中1∶10,000稀释,37℃另外生长16-24小时。
[0127] 10.(反选择步骤)10μl培养物稀释到1ml 1xM9最少盐(以最小化生长速度)。将它分成2管,0.5ml每管。一管加入阿拉伯糖到0.2%,另一管加入葡萄糖到0.2%(作为负对照)。37℃振荡生长1-2小时。
[0128] 11.10μl阿拉伯糖管平板培养于LB+卡那霉素(50μg/ml)+阿拉伯糖(0.2%),10μl葡萄糖管平板培养于LB+氯霉素(25μg/ml)+卡那霉素(50μg/ml)+葡萄糖
(0.2%)。37℃生长过夜。
[0129] 12.(筛选突变)进行原始操作的步骤9。
[0130] 实施例
[0131] 质粒
[0132] 用于PCR构建人工插入DNA序列的质粒命名为pSG76-CS(GenBank登录号AF402780),它 通过 插入 第二 个I-SceI位点 从pSG76-C获得 (Posfai,G.等,J.Bacteriol.179:4426-4428(1997))。第二个I-SceI位点通过PCR-调节插入第二个I-SceI识别位点到pSG76-C的NotI位点下游来获得。2个I-SceI位点方向相反。
[0133] pBAD αβγ质粒用于提高线性DNA片段重组到基因组中。此质粒描述于Muyrers,J.P.P.等,Nucl.Acids Res.27:1555-1557(1999)。
[0134] 用 于 表 达I-SceI 的PKSUC1 质 粒 (GenBank登 录 号AF402779) 获 得 自pSG76-K(Posfai,G. 等,J.Bacteriol.179:4426-4428(1997)) 和 pUC 19RP 12(Posfai,G.等,Nucl.Acids.Res.27:4409-4415(1999))。pSG76-K的XbaI-NotI片段(携带Kan基因;NotI末端通过Klenow聚合酶变成钝端)连接pUC19RP12的XbaI-DraI片段(携带I-SceI基因和pUC ori)。
[0135] pKSUC5质粒获得自pFT-K(Posfai,G.等,J.Bacteriol.179:4426-4428(1997))和pKSUC1。pKSUC1的大XbaI-NcoI片段连接携带tet阻遏物的pFT-K的XbaI-NcoI片段。
[0136] PKD46质粒用于提高线性DNA片段重组到基因组中,描述于Datsenko,K.A.等,Proc.Natl.Acad.Sci.97:6640-6649(2000)。
[0137] 用于四环素-调节表达I-SceI的质粒pSTKST(GenBank登录号AF406953)是R
低拷贝数Kan 质粒,获得自pFT-K(Posfai,G.等,J.Bacteriol.179:4426-4428(1997))和pUC19RP12(Posfai,G.等,Nucl.Acids Res.27:4409-4415(1999))。 携 带I-SceI 基因的pUC19RP12的XbaI-PstI片段连接pFT-K的大XbaI-PstI片段。当由四环素诱导
时,此质粒表达I-SceI。质粒复制是温度-敏感的(Posfai,G.等,J.Bacteriol.179:
4426-4428(1997))。
[0138] 质粒pSTAST是用于四环素-调节表达I-SceI的低拷贝数ApR质粒,获得自pFT-A(Posfai,G.等,J.Bacteriol.179:4426-4428(1997))和pUC19RP12(Posfai,G.等,Nucl.Acids Res.27:4409-4415(1999))。携带I-SceI基因的pUC19RP12的XbaI-PstI片段连接pFT-A的大XbaI-PstI片段。当由四环素诱导时,此质粒表达I-SceI。质粒复制是温度-敏感的(Posfai,G.等,J.Bacteriol.179:4426-4428(1997))。
[0139] 缺失过程1
[0140] 所述方法用于反复在大肠杆菌K-12基因组中产生缺失。此过程是无瘢痕的缺失方法。过程开始是通过PCR构建线性靶片段。这通过混合20pmol引物A和20pmol引物B,在总共50μl体积中进行PCR来完成。循环参数为15x(94℃40秒/57℃或更低(取决于A和B的重叠)40秒/72℃15秒)。取出1μl上面PCR混合物,加入各20pmol的引物A和C,加入50ng pSG76-CS模板,在2x50μl体积中进行PCR(用50μl管,组合2管以获得更多DNA)。所用循环参数为28x(94℃40秒/57℃40秒/72℃80秒)。为从上面步骤中纯化PCR混合物,使用Promega Wizard
[0141] PCR purification试剂盒。所得DNA片段悬浮于20μl水。
[0142] 其次是通过插入人工DNA片段来取代基因组区域。这通过取携带pBAD αβ[0143] γ的靶细胞和制备所述电感受态细胞(Posfai,G.等,Nucl.Acids Res.27:4409-4415(1999)),除了在收集细胞前0.25-1小时加入0.1%阿拉伯糖到培养物。4μl DNA片段(100-200ng)电穿孔到40μl电感受态细胞。细胞在Cam平板(25μg/ml)上培养且
37℃孵育。通常的结果是过夜培养后获得总共10到几百个菌落。用引物D和E通过PCR检查在正确位置插入片段的一些菌落。
[0144] 接着是缺失插入序列。这是通过CaCl2方法从上面所选菌落制备感受态细胞来完成(Sambrook,J.等,《分子克隆:实验室手册》(Molecular Cloning:A LaboratoryManual).Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(1989))。质粒pKSUC1(~100ng)通过标准过程转化到细胞中(Sambrook,J.等,《分子克隆:实验室手册》.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(1989))。细胞在Kan平板上培养且37℃孵育(pKSUC1和pBAD αβγ不相容,因此在Kan平板上选择使pBAD αβγ从细胞中去除)。用引物D和E通过PCR检查正确缺失的菌落。选择携带正确缺失的菌落。在此点,细胞携带pKSUC1。下一步是缺失此质粒。
[0145] 缺失通过pBAD αβγ取代pKSUC1完成。选择来自前一步骤的菌落,在非选择条件下37℃生长于LB中,细胞再接种到新鲜培养基中2-3次。制备感受态细胞用于化学转化或电穿孔。质粒pBAD αβγ(100-200ng)转化到感受态细胞中,细胞在Amp平板上培养。用牙签在Kan和Amp平板上挑出100个菌落来选择Kan敏感/Amp抗性的菌落。
[0146] 所选菌落可用于下一轮缺失,通过使用新的靶片段和重复上面步骤。如果不需要更多缺失,细胞在非选择条件下(不加入Amp)生长导致pBAD αβγ从细胞长片段中自发失去。
[0147] 缺失过程1
[0148] 此过程与过程1类似,但pKSUC1被pSTKST取代。此质粒与pBAD αβγ相容,有温度-敏感的复制子,表达I-SceI需要氯四环素(CTC)诱导。从细胞中去除pSTKST的优势是容易完成,通过培养物在42℃生长。
[0149] 通过PCR构建线性靶片段和通过插入片段来取代基因组区域如过程1所述完成。
[0150] 为缺失插入片段,感受态细胞从来自所选菌落的培养物制备,菌落有正确插入。细胞用pSTKST转化,在Kan+Cam平板上培养且30℃孵育。来自此平板的菌落接种到10ml LB+Kan中,其中添加热处理的诱导物CTC(终浓度25μg/ml)并在30℃生长24小时。此步骤用于诱导I-SceI表达。稀释培养物随后在LB+Kan平板上铺开且30℃过夜培养。检查6-12个菌落,用引物D和E通过PCR检查正确缺失。选择携带正确缺失的菌落。
[0151] 为从细胞中去除辅助质粒,培养物在42℃生长于LB中(没有加入抗生素)。
[0152] 过程3
[0153] 由于pBAD αβγ和pSTKST携带相容复制子,当在相同宿主中进行连续缺失时,不需重复转化质粒。2个质粒通过抗生素选择(Kan+Amp)经连续缺失构建在宿主细胞中维持。重组酶和特定核酸酶功能仅当需要时诱导。因为pSTKST复制是温度-敏感的,细胞必须在30℃生长。
[0154] 此过程与过程2相同,除了pBAD αβγ和pSTKST仅转化到细胞中1次,直到需要在细胞中维持2个质粒,培养物在30℃生长,Amp+Kan包括在培养基中。注意:有时我们在2(Amp+Kan)或3种(Amp+Kan+Cam)抗生素存在时30℃生长细胞有困难。
[0155] 过程4
[0156] 当在相同细胞中进行一些连续缺失时,这是优选过程。插入(线性片段重组到携带pBAD αβγ的宿主细胞基因组中)平行进行,产生一系列重组细胞,各自携带单个插入。随后这些插入通过P1转导依次转入细胞,细胞携带pSTKST且有前面全部缺失。通过诱导pSTKST在此最终宿主中去除所有外源序列。与前面方法相比,主要区别是插入步骤和去除插入序列在不同细胞中进行。由于插入平行进行,构建连续缺失更迅速。另一个优势是细胞仅在第一次缺失构建开始时通过质粒转化。
[0157] 此过程在技术上与过程2相同,除了单独插入通过P1转导转入已有pSTKST的缺失菌株。各P1转导步骤后,诱导I-SceI表达以去除插入序列。
[0158] 结果
[0159] 对大肠杆菌菌株K-12MG1655进行12个连续基因组缺失。选择12个缺失区域用于缺失,部分来自大肠杆菌菌株O157:H7EDL933和菌株K-12MG1655基因组DNA序列的比较结果。缺失列于下表1。序列编号方式取自发表的K-12序列。
[0160] 第一 个缺 失MD1用Posfai,G.等,Nucl.Acids Res.27:4409-4415(1999) 所述方法产生。用此方法产生MD1缺失,在染色体缺失位置留下114-bppSG76-CS载体序列,包括FRT位点。MD2到MD6缺失用上述过程1产生。缺失MD7到MD12用过程4结合过程1或2产生。各新缺失的菌株命名和基因组坐标是:MD1263080-324632;
MD21398351-1480278;MD32556711-2563500;MD42754180-278970;MD52064327-2078613;
MD63451565-3467490;MD72464565-2474198;MD81625542-1650865;MD94494243-4547279;
MD103108697-3134392;MD111196360-1222299;MD12564278-585331。
[0161] 在此阶段总共去除378,180个碱基对,约为天然K-12MG1655大肠杆菌基因组的8.1%。从基因组中去除这些区域不影响细菌存活或细菌生长。
[0162] 下表2列出大肠杆菌基因组的其它片段、基因和区域,鉴定为进一步缺失的候选。片段也成功地从细菌基因组中去除。再次,产生这些缺失而对实验室和工业用途细菌的有效性没有明显有害效果。序列命名也取自发表的K-12序列。2组缺失总计约为14%的原始细菌基因组。要指出的是基因本身能和侧翼DNA一起缺失,只要侧翼DNA不破坏宿主生长和存活必需的基因。
[0163] 在过程1中,插入线性片段的效率随着特定基因座而变化。正确位点插入在1-100%(通常20-100%)菌落中发生。使用范围从42到74bp的侧翼同源物。更长的同源物插入效率更好。重复序列间的正确位点切除在1-100%(通常10-100%)菌落中发生且取决于重复区域长度。更长的重复一般更有效。重复序列长度范围从42到50bp。表面上同样重复的实验间插入和切除效率有变化且现在还未充分理解。
[0164] 过程3通过再产生缺失MD2来测试。正确位点插入线性DNA片段在6.6%菌落中发生。缺失插入序列很有效。25个所得菌落影印培养到Cam+Amp+Kan和Amp+Kan平板上,19个证明是Cam敏感。随后这些菌落中的5个通过PCR测试,5个全部显示失去预计的插入片段。
[0165] 表8和表9更精确描述缺失基因终点,基因从界标中删去或待删。大肠杆菌菌株MDS12、MDS40和MDS73(表8和表9)是中间菌株的缺失终点,中间菌株用于购建标志菌株。表9所列基因由数字“b”标识,以Blattner等,Science,同上和GenBank登录号400096所述命名为基础。表8的编号方式也以Blattner等同上为基础。
[0166] 确定缺失菌株特征
[0167] 转化频率
[0168] 需要将外源DNA结合到大肠杆菌缺失菌株基因组中,所用方式使宿主细菌细胞在分裂和生长时维持整合DNA。将外源DNA导入细菌宿主基因组的方法称为转化,有外源DNA的生物体称为转化生物。本领域需要有高转化频率的大肠杆菌菌株。
[0169] 大肠杆菌菌株MDS39通过在亲代大肠杆菌菌株中进行39个缺失(约14.1%基因组)来构建,发现通过电穿孔转化效率高。此高效转化延伸到吸收大尺寸BAC(细菌人工染色体)DNA,使菌株MDS39对广泛范围的应用有特定价值。
[0170] 为测试大肠杆菌菌株MDS39的转化效率,MDS39有且稳定维持外源DNA,三种菌株:DH10B、MDS31和MDS39在标准生长条件下生长至600nm光密度为0.5。旋转离下细胞培养物,细胞沉淀用水洗几次,最终重悬浮于水(以1/1000的原始培养体积)。25ng pBR322DNA或甲基化BAC DNA或未甲基化BAC DNA加入100μl细胞悬浮液并用标准电穿孔操作进行电TM
穿孔,如1.8kV和0.1cm电穿孔杯中的150ohms电阻,使用Invitrogen电穿孔仪II 装置。
在EcoK位点甲基化的BAC DNA和pBR322DNA用标准操作在大肠杆菌菌株MG1655中制备。
未甲基化BAC DNA在大肠杆菌菌株DH10B中制备。
[0171] 表3显示菌株MDS31和MDS39都能被分子量为4,636个碱基对的pBR322DNA和分子量为100,000个碱基对的甲基化BAC DNA有效转化。甲基化BACDNA对菌株MDS31和MDS39的转化效率可与对菌株DH 10B的转化效率相比,DH10B是目前认为转化效率最佳的菌株之一。
[0172] 当用未甲基化BAC DNA转化时,菌株MDS39的转化效率高于菌株DH10B的转化效率(表3),而菌株MDS31的转化效率低于菌株MDS39和DH10B的转化效率。菌株MDS31的+ +转化效率低是由于未甲基化DNA在菌株中受到限制,因为MDS31是rm 菌株,而菌株DH10B- -
和MDS39是rm 菌株。
[0173] 最近MDS39的工作显示可能在序列gb_ba:ecu 95365中存在剩余插入序列IS5。为确定从MDS39中缺失固有IS序列的效果,本文所述过程用于缺失此序列。MDS40中缺失的终点是表8和9的菌株。随后测试所得菌株MDS40的转化和生长特征(结果),如下所讨论。
[0174] 电穿孔-感受态细胞如Invitrogen电穿孔仪II手册所述制备。简要地,200ml培养物生长到OD550=0.5,然后离心收集细胞,用冰水洗2次和冰的10%甘油洗1次,重复离心和悬浮。在最后步骤时,细胞沉淀悬浮于0.4ml 10%甘油,等分成40μl部分并保存于-80℃。
[0175] 细胞通常用10-100ng量的质粒DNA以1.8kV和0.1cm电穿孔杯中的150Ω电阻电穿孔,使用电穿孔仪II装置(Invitrogen)。然后细胞用1ml LB稀释,摇床中接种1小时,在选择性培养基上平板培养。
[0176] 进行一些试验,结果以数量级变化。2个典型、单独实验(各2次平行)的平均值示于表5。
[0177] 也使用MG1655、MDS40和DH10B的转化效率,它们用化学转化方法。感受态细胞通过简单方法制备。冷冻50ml培养物并在OD550=0.4离心收集,随后用1/20体积的冰CaCl2溶液(10mM Tris pH7.5、15%甘油、60mM CaCl2)洗2次,重复离心和悬浮。接着细胞在冰上孵育1小时,等分成200μl部分并保存于-80℃。
[0178] 对于转化,细胞通常混合100ng质粒DNA,冰上孵育30分钟,42℃热激2分钟,然后加入0.8ml LB。细胞在37℃培养0.5-1小时,接着稀释物在选择性培养基上平板培养。结果示于表6。
[0179] 生长特征
[0180] 如上所讨论,需要通过本发明方法制备的缺失菌株有很强能力在特定培养条件下生长。生长研究进行如下。
[0181] 比较37℃时大肠杆菌菌株细胞的倍增时间(?),时间以分钟计,用96孔板读数器(SpectraMax plus,Molecular Devices)摇动测量。生长曲线的线性部分对数用于计算平均倍增时间和平板上6个重复的标准偏差。尽管此装置提供方便的方法进行比较测量,它不产生很好的细胞从而生长速度比摇瓶慢2倍。
[0182] 证明了缺失菌株在基本培养基中生长速度与原始MG1655相同,但没达到相同的终密度。在丰富的成分明确培养基中缺失生长较慢,但达到相同终密度。检测这些小差异的原因很有趣,但显然完成目标,即基因组显著减少同时保持在基本培养基中强生长的能力。
[0183]
[0184] 表2
[0185] 第二组完整缺失
[0186]
[0187]
[0188]
[0189]
[0190]
[0191] 表3
[0192] 大肠杆菌菌株MDS31、MDS39和DH10B的转化效率
[0193]DH10B MDS31 MDS39
(转化子每微克 (转化子每微克 (转化子每微克
DNA) DNA) DNA)
pBR322 2X108 2.2X108 2.7X108
甲基化BAC 2X106 0.6X106 1.2X106
未甲基化BAC 1.8X106 4.0X106 3.0X106
[0194] 表4
[0195] 缺失的周质蛋白基因
[0196]缺失 基因,b# MR基因 MR基因产物
GP16 b1920 fliY 半胱氨酸转运蛋白(ABC超家族,周围结合
(peri_bind))
GP16 b1919 yedO D-半胱氨酸脱巯基酶,PLP-依赖
GP2 b0578 nfnB 二氢蝶啶还原酶,02-敏感NAD(P)H还原酶
GP4 b0365 tauA 牛磺酸转运蛋白(ABC超家族,周围结合)
GP9 b1329 mppA 周质胞壁质三肽转运蛋白;抗菌抗性的负调节物
MD2 b1386 tynA 铜胺氧化酶(酪胺氧化酶)
MD6 b3338 chiA 内切壳多糖酶,周质
MD9 b4316 fimC 1型菌毛所需的周质伴侣
MD9 b4290 fecB KpLE2噬菌体-类似元件;柠檬酸依赖的Fe(III)
[0197]转运蛋白(ABC超家族,周围结合)
GP7 b3047 yqiH 推定周质伴侣
MD1 b0282 yagP 推定周质调节物
GP12 b3215 yhcA 推定周质伴侣
[0198] 表5
[0199] 大肠杆菌菌株MG1655、MDS40和DH10B的转化效率
[0200]DH10B MG1655 MDS40
(转化子每微克) (转化子每微克) (转化子每微克)
8 8 8
pUC19 1.3X10 2.9X10 1.3X10
BAC 8.8X106 3X106 6.5X106
[0201] 表6
[0202] 大肠杆菌菌株MG1655、MDS40和DH10B的转化效率
[0203]DH10B MG1655 MDS40
(转化子每微克) (转化子每微克) (转化子每微克)
pUC19 4.5X105 3.7X104 1.6X104
[0204] 表7
[0205] 培养基 菌株 平均倍增时间 标准偏差 最大OD
[0206] MOPS基本 MG1655 120.41 0.63 0.82
[0207] MOPS基本 MDS12 123.43 6.91 0.61
[0208] MOPS基本 MDS39 129.57 2.30 0.62
[0209] MOPS基本 MDS40 128.26 5.30 0.61
[0210] MOPS基本 DH10B 无生长
[0211] 丰富成分明确 MG1655 38.38 0.25 0.83
[0212] 丰富成分明确 MDS12 49.05 4.05 0.84
[0213] 丰富成分明确 MDS39 54.38 1.05 0.85
[0214] 丰富成分明确 MDS40 51.19 1.77 0.86
[0215] 丰富成分明确 DH10B 45.40 2.30 0.62
[0216] 表8
[0217] MSD12 MDS40 MDS73 缺失 开始 结束
[0218] 缺失 缺失 缺失 MD1 263080 324632
[0219] 缺失 缺失 缺失 MD2 1398351 1480278
[0220] 缺失 缺失 缺失 MD3 2556711 2563500
[0221] 缺失 缺失 缺失 MD4 2754180 2789270
[0222] 缺失 缺失 缺失 MD5 2064327 2078613
[0223] 缺失 缺失 缺失 MD6 3451565 3467490
[0224] 缺失 缺失 缺失 MD7 2464565 2474198
[0225] 缺失 缺失 缺失 MD8 1625542 1650785
[0226] 缺失 缺失 缺失 MD9 4494243 4547279
[0227] 缺失 缺失 缺失 MD10 3108697 3134392
[0228] 缺失 缺失 缺失 MD11 1196360 1222299
[0229] 缺失 缺失 缺失 MD12 564278 585331
[0230] 缺失 缺失 GP1 15388 20562
[0231] 缺失 缺失 GP2 602688 608572
[0232] 缺失 缺失 GP3 2507651 2515959
[0233] 缺失 缺失 GP4 379334 387870
[0234] 缺失 缺失 GP5 389122 399029
[0235] 缺失 缺失 GP6 2993014 2996890
[0236] 缺失 缺失 GP7 3182797 3189712
[0237] 缺失 缺失 GP8 687083 688267
[0238] 缺失 缺失 GP9 1386912 1396645
[0239] 缺失 缺失 GP10 2099418 2135738
[0240] 缺失 缺失 GP11 2284421 2288200
[0241] 缺失 缺失 GP12 3359797 3365277
[0242] 缺失 缺失 GP13 3648921 3651342
[0243] 缺失 缺失 GP14 1128620 1140209
[0244] 缺失 缺失 GP15 1960590 1977353
[0245] 缺失 缺失 GP16 1995135 2021700
[0246] 缺失 缺失 GP17 4553059 4594581
[0247] 缺失 缺失 GP18 522062 529349
[0248] 缺失 缺失 GP19 728588 738185
[0249] 缺失 缺失 GP20 1525916 1531650
[0250] 缺失 缺失 GP21 3616623 3623310
[0251] 缺失 缺失 GP22 3759620 3767869
[0252] 缺失 缺失 GP23 1041254 1049768
[0253] 缺失 缺失 GP24 1085330 1096545
[0254] 缺失 缺失 GP25 2163173 2175230
[0255] 缺失 缺失 GP26 3578769 3582673
[0256] 缺失 缺失 GP27 3718263 3719704
[0257] 缺失 缺失 MD40 167484 173447
[0258] 缺失 GP28 331595 376535
[0259] 缺失 GP29 1588878 1599265
[0260] 缺失 GP30 3794575 3805725
[0261] 缺失 GP31 3886064 3904195
[0262] 缺失 GP32 2599182 2612802
[0263] 缺失 GP33 3738738 3752058
[0264] 缺失 GP34 4055987 4073034
[0265] 缺失 GP35 1349431 1364839
[0266] 缺失 GP36 2876592 2885242
[0267] 缺失 GP37 149715 156883
[0268] 表8(续)
[0269] MSD12 MDS40 MDS73 缺失 开始 结束
[0270] 缺失 GP38 674793 682616
[0271] 缺失 GP39 997082 1003880
[0272] 缺失 GP40 2318063 2334712
[0273] 缺失 gp41 3503000 3510000
[0274] 缺失 gp42 4304000 4311000
[0275] 缺失 gp43 557000 563000
[0276] 缺失 gp44 764000 770000
[0277] 缺失 gp45 1555000 1561000
[0278] 缺失 gp46 2382000 2388000
[0279] 缺失 gp47 2447000 2453000
[0280] 缺失 gp48 4547600 4553000
[0281] 缺失 gp50 747000 752000
[0282] 缺失 gp51 1727000 1732000
[0283] 缺失 gp52 2859000 2864000
[0284] 缺失 gp53 4488000 4493000
[0285] 缺失 gp54 2520000 2524000
[0286] 缺失 gp55 4086000 4090000
[0287] 缺失 gp56 1250000 1253000
[0288] 缺失 gp57 1650000 1653000
[0289] 缺失 gp58 2186000 2189000
[0290] 缺失 gp59 2474000 2477000
[0291] 缺失 gp60 3358000 3360000
[0292] 缺失 gp61 3864000 3866000
[0293] 表9
[0294] 从各个缺失菌株删除的基因(用数字b标识)
[0295] MD1:b0247,b0248,b0249,b0250,b0251,b0252,b0253,b0254,b0255,b0256,b0257,
[0296] b0258,b0259,b0260,b0261,b0262,b0263,b0264,b0265,b0266,b0267,b0268,[0297] b0269,b0270,b0271,b0272,b0273,b0274,b0275,b0276,b0277,b0278,b0279,[0298] b0280,b0281,b0282,b0283,b0284,b0285,b0286,b0287,b0288,b0289,b0290,[0299] b0291,b0292,b0293,b0294,b0295,b0296,b0297,b0298,b0299,b0300,b0301,[0300] b0302,b0303,b0304,b0305,b0306,b0307,b0308,b0309,b0310[0301] MD2:b1337,b1338,b1339,b1340,b1341,b1342,b1343,b1344,b1345,b1346,b1347,
[0302] b1348,b1349,b1350,b1351,b1352,b1353,b1354,b1355,b1356,b1357,b1358,[0303] b1359,b1360,b1361,b1362,b1363,b1364,b1365,b1366,b1367,b1368,b1369,[0304] b1370,b1371,b1372,b1373,b1374,b1375,b1376,b1377,b1378,b1379,b1380,[0305] b1381,b1382,b1383,b1384,b1385,b1386,b1387,b1388,b1389,b1390,b1391,[0306] b1392,b1393,b1394,b1395,b1396,b1397,b1398,b1399,b1400,b1401,b1402,[0307] b1403,b1404,b1405,b1406,b1407,b1408,b1409,b1410,b1411[0308] MD3:b2442,b2443,b2444,b2445,b2446,b2447,b2448,b2449,b2450[0309] MD4:b2622,b2623,b2624,b2625,b2626,b2627,b2628,b2629,b2630,b2631,b2632,
[0310] b2633,b2634,b2635,b2636,b2637,b2638,b2639,b2640,b2641,b2642,b2643,[0311] b2644,b2645,b2646,b2647,b2648,b2649,b2650,b2651,b2652,b2653,b2654,[0312] b2655,b2656,b2657,b2658,b2659,b2660
[0313] MD5:b1994,b1995,b1996,b1997,b1998,b1999,b2000,b2001,b2002,b2003,b2004,
[0314] b2005,b2006,b2007,b2008
[0315] MD6:b3323,b3324,b3325,b3326,b3327,b3328,b3329,b3330,b3331,b3332,b3333,
[0316] b3334,b3335,b3336,b3337,b3338
[0317] MD7:b2349,b2350,b2351,b2352,b2353,b2354,b2355,b2356,b2357,b2358,b2359,
[0318] b2360,b2361,b2362,b2363
[0319] MD8:b1540,b1541,b1542,b1543,b1544,b1545,b1546,b1547,b1548,b1549,b1550,
[0320] b1551,b1552,b1553,b1554,b1555,b1556,b1557,b1558,b1559,b1560,b1561,[0321] b1562,b1563,b1564,b1565,b1566,b1567,b1568,b1569,b1570,b1571,b1572,[0322] b1573,b1574,b1575,b1576,b1577,b1578,b1579
[0323] MD9:b4271,b4272,b4273,b4274,b4275,b4276,b4277,b4278,b4279,b4280,b4281,
[0324] b4282,b4283,b4284,b4285,b4286,b4287,b4288,b4289,b4290,b4291,b4292,[0325] b4293,b4294,b4295,b4296,b4297,b4298,b4299,b4300,b4301,b4302,b4303,[0326] b4304,b4305,b4306,b4307,b4308,b4309,b4310,b4311,b4312,b4313,b4314,[0327] b4315,b4316,b4317,b4318,b4319,b4320
[0328] MD10:b2969,b2970,b2971,b2972,b2973,b2974,b2975,b2976,b2977,b2978,b2979,
[0329] b2980,b2981,b2982,b2983,b2984,b2985,b2986,b2987
[0330] MD11:b1138,b1139,b1140,b1141,b1142,b1143,b1144,b1145,b1146,b1147,b1148,
[0331] b1149,b1150,b1151,b1152,b1153,b1154,b1155,b1156,b1157,b1158,b1159,[0332] b1160,b1161,b1162,b1163,b1164,b1165,b1166,b1167,b1168,b1169,b1170,[0333] b1171,b1172
[0334] MD12:b0538,b0539,b0540,b0541,b0542,b0543,b0544,b0545,b0546,b0547,b0548,
[0335] b0549,b0550,b0551,b0552,b0553,b0554,b0555,b0556,b0557,b0558,b0559,[0336] b0560,b0561,b0562,b0563,b0564,b0565
[0337] GP1:b0016,b0017,b0018,b0019,b0020,b0021,b0022
[0338] GP2:b0577,b0578,b0579,b0580,b0581,b0582
[0339] GP3:b2389,b2390,b2391,b2392,b2393,b2394,b2395
[0340] GP4:b0358,b0359,b0360,b0361,b0362,b0363,b0364,b0365,b0366,b0367,b0368[0341] GP5:b0370,b0371,b0372,b0373,b0374,b0375,b0376,b0377,b0378,b0379,b0380[0342] GP6:b2856,b2857,b2858,b2859,b2860,b2861,b2862,b2863
[0343] GP7:b3042,b3043,b3044,b3045,b3046,b3047,b3048
[0344] GP8:b0656
[0345] GP9:b1325,b1326,b1327,b1328,b1329,b1330,b1331,b1332,b1333[0346] GP10:b2030,b2031,b2032,b2033,b2034,b2035,b2036,b2037,b2038,b2039,b2040,
[0347] b2041,b2042,b2043,b2044,b2045,b2046,b2047,b2048,b2049,b2050,b2051,[0348] b2052,b2053,b2054,b2055,b2056,b2057,b2058,b2059,b2060,b2061,b2062[0349] GP11:b2190,b2191,b2192
[0350] GP12:b3215,b3216,b3217,b3218,b3219
[0351] GP13:b3504,b3505
[0352] GP14:b1070,b1071,b1072,b1073,b1074,b1075,b1076,b1077,b1078,b1079,b1080,
[0353] b1081,b1082,b1083
[0354] GP15:b1878,b1879,b1880,b1881,b1882,b1883,b1884,b1885,b1886,b1887,b1888,
[0355] b1889,b1890,b1891,b1892,b1893,b1894
[0356] GP16:b1917,b1918,b1919,b1920,b1921,b1922,b1923,b1924,b1925,b1926,b1927,
[0357] b1928,b1929,b1930,b1931,b1932,b1933,b1934,b1935,b1936,b1937,b1938,[0358] b1939,b1940,b1941,b1942,b1943,b1944,b1945,b1946,b1947,b1948,b1949,[0359] b1950
[0360] GP17:b4325,b4326,b4327,b4328,b4329,b4330,b4331,b4332,b4333,b4334,b4335,
[0361] b4336,b4337,b4338,b4339,b4340,b4341,b4342,b4343,b4344,b4345,b4346,[0362] b4347,b4348,b4349,b4350,b4351,b4352,b4353,b4354,b4355,b4356,b4357,[0363] b4358
[0364] GP18:b0497,b0498,b0499,b0500,b0501,b0502
[0365] GP19:b0700,b0701,b0702,b0703,b0704,b0705,b0706
[0366] GP20:b1456,b1457,b1458,b1459,b1460,b1461,b1462
[0367] GP21:b3482,b3483,b3484
[0368] GP22:b3593,b3594,b3595,b3596
[0369] GP23:b0981,b0982,b0983,b0984,b0985,b0986,b0987,b0988
[0370] GP24:b1021,b1022,b1023,b1024,b1025,b1026,b1027,b1028,b1029,b1030,b1031
[0371] GP25:b2080,b2081,b2082,b2083,b2084,b2085,b2086,b2087,b2088,b2089,b2090,
[0372] b2091,b2092,b2093,b2094,b2095,b2096
[0373] GP26:b3441,b3442,b3443,b3444,b3445,b3446
[0374] GP27:b3557,b3558
[0375] MD40:b0150,b0151,b0152,b0153
[0376] GP28:b0315,b0316,b0317,b0318,b0319,b0320,b0321,b0322,b0323,b0324,b0325,
[0377] b0326,b0327,b0328,b0329,b0330,b0331,b0333,b0334,b0335,b0336,b0337,[0378] b0338,b0339,b0340,b0341,b0342,b0343,b0344,b0345,b0346,b0347,b0348,[0379] b0349,b0350,b0351,b0352,b0353,b0354
[0380] GP29:b1507,b1508,b1509,b1510,b1511,b1512
[0381] GP30:b3622,b3623,b3624,b3625,b3626,b3627,b3628,b3629,b3630,b3631,b3632
[0382] GP31:b3707,b3708,b3709,b3710,b3711,b3712,b3713,b3714,b3715,b3716,b3717,
[0383] b3718,b3719,b3720,b3721,b3722,b3723
[0384] GP32:b2481,b2482,b2483,b2484,b2485,b2486,b2487,b2488,b2489,b2490,b2491,
[0385] b2492
[0386] GP33:b3573,b3574,b3575,b3576,b3577,b3578,b3579,b3580,b3581,b3582,b3583,
[0387] b3584,b3585,b3586,b3587
[0388] GP34:b3871,b3872,b3873,b3874,b3875,b3876,b3877,b3878,b3879,b3880,b3881,
[0389] b3882,b3883,b3884
[0390] GP35:b1289,b1290,b1291,b1292,b1293,b1294,b1295,b1296,b1297,b1298,b1299,
[0391] b1300,b1301,b1302
[0392] GP36:b2754,b2755,b2756,b2757,b2758,b2759,b2760,b2761
[0393] GP37:b0135,b0136,b0137,b0138,b0139,b0140,b0141
[0394] GP38:b0644,b0645,b0646,b0647,b0648,b0649,b0650
[0395] GP39:b0938,b0939,b0940,b0941,b0942,b0943,b0944,b0945
[0396] GP40:b2219,b2220,b2221,b2222,b2223,b2224,b2225,b2226,b2227,b2228,b2229,
[0397] b2230
[0398] gp41:b3376,b3377,b3378,b3379,b3380,b3381,b3382,b3383
[0399] gp42:b4084,b4085,b4086,b4087,b4088,b4089,b4090
[0400] gp43:b0530,b0531,b0532,b0533,b0534,b0535
[0401] gp44:b0730,b0731,b0732
[0402] gp45:b1483,b1484,b1485,b1486,b1487
[0403] gp46:b2270,b2271,b2272,b2273,b2274,b2275
[0404] gp47:b2332,b2333,b2334,b2335,b2336,b2337,b2338
[0405] gp48:b4321,b4322,b4323,b4324
[0406] gp50:b0716,b0717,b0718,b0719
[0407] gp51:b1653,b1654,b1655
[0408] gp52:b2735,b2736,b2737,b2738,b2739,b2740
[0409] gp53:b4265,b4266,b4267,b4268,b4269
[0410] gp54:b2405,b2406,b2407,b2408,b2409
[0411] gp55:b3897,b3898,b3899,b3900,b3901
[0412] gp56:b1201
[0413] gp57:b1580,b1581
[0414] gp58:b2108,b2109,b2110,b2111,b2112
[0415] gp59:b2364,b2365
[0416] gp60:b3213,b3214
[0417] gp61:b3686,b3687,b3688,b3689,b3690