产生脂肪醛的方法和组合物转让专利

申请号 : CN200980148338.9

文献号 : CN102232110B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 穆尔塔扎·F·阿里比海胡志浩

申请人 : REG生命科学有限责任公司

摘要 :

描述了用于产生脂肪醛的方法和组合物,包括核苷酸序列、氨基酸序列和宿主细胞。

权利要求 :

1.产生脂肪醛的方法,所述方法包括:

(a)提供宿主细胞,其中所述宿主细胞被工程化以表达编码多肽的基因,其中所述多肽的氨基酸序列是SEQ ID NO:22并且具有SEQ ID NO:9的磷酸泛酰巯基乙胺附着位点序列,其中所述多肽具有能有效地将脂肪酸转化为脂肪醛的羧酸还原酶活性,并且其中所述宿主细胞进一步被工程化以表达硫酯酶;和(b)在含有碳水化合物碳源的培养基中培养所述工程化的宿主细胞,所述培养处于有效地产生脂肪醛的条件。

2.产生脂肪醛的方法,所述方法包括:

(a)提供宿主细胞,其中所述宿主细胞被工程化以包含重组载体,其中所述重组载体包含SEQ ID NO:21的核苷酸序列并且编码SEQ ID NO:9的磷酸泛酰巯基乙胺附着位点序列,其中所述核苷酸序列编码具有能有效地将脂肪酸转化为脂肪醛的羧酸还原酶活性的多肽,并且其中所述宿主细胞被工程化以表达硫酯酶;和(b)在含有碳水化合物碳源的培养基中培养所述工程化的宿主细胞,所述培养处于有效地产生脂肪醛的条件。

3.如权利要求1或2所述的方法,其还包括修饰所述宿主细胞中基因的表达,所述基因编码具有脂肪酸合酶活性的多肽。

4.如权利要求1所述的方法,其中所述硫酯酶具有在宿主细胞中的硫酯酶活性。

5.如权利要求4所述的方法,其中所述具有硫酯酶活性的多肽是EC3.1.2.14或EC

3.1.1.5。

6.如权利要求1或2所述的方法,其中所述宿主细胞是相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶的遗传工程化的宿主细胞,其中所述脂肪酸降解酶具有酰基-CoA合酶活性。

7.如权利要求6所述的方法,其中所述具有酰基-CoA合酶活性的脂肪酸降解酶是EC

2.3.1.86。

8.如权利要求1或2所述的方法,其中所述宿主细胞选自哺乳动物细胞、植物细胞、昆虫细胞、藻类细胞、真菌细胞和细菌细胞。

9.如权利要求1或2所述的方法,其中所述脂肪醛存在于所述宿主细胞的细胞外环境。

10.如权利要求9所述的方法,其中所述脂肪醛包括C6-C26脂肪醛。

11.如权利要求9所述的方法,其中所述脂肪醛是癸醛、十二醛、十四醛或十六醛。

12.如权利要求9所述的方法,其中所述脂肪醛是不饱和脂肪醛。

13.如权利要求9所述的方法,其中所述脂肪醛是饱和脂肪醛。

14.如权利要求1或2所述的方法,其中所述碳源是单糖。

15.如权利要求14所述的方法,其中所述单糖是葡萄糖。

16.如权利要求1或2所述的方法,其中在所述培养基中检测到所述脂肪醛。

17.如权利要求9所述的方法,其中在所述培养基中以至少25mg/L的产量产生所述脂肪醛。

18.如权利要求1或2所述的方法,其中所述宿主细胞是酵母细胞或丝状真菌细胞。

说明书 :

产生脂肪醛的方法和组合物

[0001] 相关申请的交叉引用
[0002] 本申请要求2008年10月7日提交的美国临时申请第61/103,447号的优先权,通过引用将其全部内容全部并入本文。
[0003] 发明背景
[0004] 石油是地球上发现的、液体、气体或固体形式的有限的天然资源。石油主要由碳氢化合物组成,碳氢化合物主要由碳和氢组成。石油还含有大量的处于不同形式的其他元素,
例如氮、氧或硫。
[0005] 石油是宝贵资源,但是以相当大的金融和环境代价对石油产品进行开发。首先,必须发现石油资源。石油勘探是耗资并有风险的投资。勘探深水井的费用可以超过1亿美元。
此外,不能保证这些井会含有石油。据估计,仅40%的钻井成为产生商业碳氢化合物的生产
井。除经济费用外,石油勘探存在严重的环境代价。例如近海勘探扰乱周围海洋环境。
[0006] 发现生产井后,必须以巨大代价从地球开采石油。在初次采收(primaryrecovery)中,地下的自然压力足以开采约20%的井中石油。当该自然压力降低时,如果经
济上合算,则使用二次采收(second recovery)。通常,二次采收涉及通过例如水注射、天然气注射或气举等增加井压。使用二次采油,采收到另外5%至15%的石油。一旦二次采收
方法不起作用,如果经济上合算,可以使用三次采收方法。三次方法涉及降低石油的粘度以
使其更易开采。使用三次采收方法,采收到另外5%至15%的石油。因此,即使在最佳条件
下,仅可以开采50%的井中石油。石油开采也存在环境代价。例如,石油开采可以导致大量
石油渗漏上升至表面。此外,近海钻井涉及挖掘河床,这扰乱或破坏周围海洋环境。
[0007] 因为石油矿藏不是在地球各处均匀发现的,所以石油必须从石油产生区长距离运输到石油消耗区。除运输费用外,还存在大规模油泄漏的环境风险。
[0008] 从地球开采的原油在天然形式时具有少数商业用途。其是具有不同长度和复杂性的碳氢化合物(例如,石蜡(或烷)、烯烃(或烯)、炔、环烷(napthenes)(或环烷
(cylcoalkanes))、脂肪族化合物、芳香族化合物等)的混合物。此外,原油含有其他有机化
合物(例如含有氮、氧、硫等的有机化合物)和杂质(例如硫磺、盐、酸、金属等)。
[0009] 因此,在商业上可以使用前,必须提炼并纯化原油。由于其高能量密度及其便利的可运输性,大部分石油被提炼为燃料,例如运输燃料(例如汽油、柴油、航空燃料等)、燃用
油、液化石油气等。
[0010] 原油还是用于产生石化产品的原材料的主要来源。两类主要的来自石油的原材料是短链烯烃(例如乙烯和丙烯)和芳香族化合物(例如苯和二甲苯异构体)。这些原材料来
源于原油中较长链的碳氢化合物,这是通过以相当大的费用使用各种方法,例如催化裂化、
蒸汽裂化或催化重整,裂化原油。这些原材料用于制造不能直接从原油提炼的石化产品,例
如单体、溶剂、去垢剂或粘合剂。
[0011] 来源于原油的原材料的一个实例是乙烯。乙烯被用于生产石化产品,例如聚乙烯、乙醇、氧化乙烯、乙二醇、聚酯、乙二醇醚、乙氧基化物、乙酸乙烯酯、1,2-二氯乙烷、三氯乙烯、四氯乙烯、氯乙烯和聚氯乙烯。原材料的其他实例是丙烯,丙烯用于生产异丙醇、丙烯
腈、聚丙烯、氧化丙烯、丙烯二醇、乙二醇醚、丁烯、异丁烯、1,3-丁二烯、合成橡胶、聚烯烃、α-烯烃、脂肪醇、丙烯酸、丙烯聚合物、氯化丙烯、环氧氯丙烷和环氧树脂。
[0012] 然后,这些石化产品可以用于制造特种化学品,例如塑料、树脂、纤维、橡胶、药品、润滑剂或凝胶。可以产自石化原材料的具体特种化学品为:脂肪酸、碳氢化合物(例如长链、支链、饱和的、不饱和的等)、脂肪醇、酯、脂肪醛、酮、润滑剂等。
[0013] 醛用于生产很多特种化学品。例如,醛用于生产聚合物、树脂(例如胶木(Bakelite))、染料、调味剂、增塑剂、香水、药品和其他化学品。一些被用作溶剂、防腐剂或消毒剂。一些天然和合成的化合物,例如维生素和激素是醛。此外,很多糖含有醛基。
[0014] 从原油获得这些特种化学品需要大量的金融投资以及大量的能量。因为常常裂化原油中的长链碳氢化合物以产生较小的单体,其也是低效的过程。这些单体然后被用作生
产更复杂的特种化学品的原材料。
[0015] 除勘探、开采、运输和提炼石油的问题外,石油是有限的并逐渐减少的资源。估计世界石油消耗为每年300亿桶。据估计,以现有生产水平,世界石油储量预计在2050年前
会耗竭。
[0016] 最后,基于石油的燃料的燃烧释放温室气体(例如二氧化碳)和其他形式的空气污染(例如一氧化碳、二氧化硫等)。随着世界对燃料需求的增加,温室气体的排放和其他
形式的空气污染也增加。大气中温室气体的累积可以导致增加全球变暖。因此,除局部破
坏环境外(例如油泄漏、海洋环境的挖掘等),燃烧石油还破坏全球环境。
[0017] 由于石油所引起的内在挑战,存在对于不需要像石油一样被勘探、开采、长距离运输或大量提炼的可再生石油资源的需要。还存在对于可以经济地生产而不会产生石油工业
和基于石油的燃料的燃烧所产生的类型的环境破坏的可再生石油资源的需要。基于相似原
因,还存在对于通常来自石油的化学品的可再生资源的需要。
[0018] 产生可再生石油的一种方法是通过工程化微生物以产生可再生石油产物。某些微生物具有产生化学品的天然能力。例如,酵母已被使用数世纪以产生乙醇(例如,啤酒、葡
萄酒等)。近年,通过先进的生物技术的发展,可能新陈代谢地工程化有机体以产生之前从
未产生过的生物产物。来源于这些细胞活性的诸如化学品的产物被称为生物产物。由这些
细胞活性产生的燃料被称为生物燃料。生物燃料是基于石油的燃料的可再生的替代选项。
生物燃料可以代替任何基于石油的燃料(例如,汽油、柴油、航空燃料、燃用油等)。生物燃
料可以来源于可再生的来源,例如植物物质、动物物质或甚至废品。这些可再生的来统称为
生物量。生物燃料相比基于石油的燃料的一个优势在于,它们不需要耗资和有风险的的勘
探或开采。另外,生物燃料可以在本地生产。因此,它们不需要长距离运输。此外,生物燃
料可以直接地制备而不需要耗资和能量密集的提炼,而这在提炼原油时是需要的。在其他
条件下,生物燃料可以需要有限的和经济有效的提炼水平。此外,使用生物燃料通过减少燃
烧期间释放的环境有害的排放(例如,温室气体,气体污染等)的量改善环境。例如,由于
生物燃料是从可再生的天然资源——生物量生产的,它维持平衡的碳循环。尽管生物燃料
的燃烧会释放碳(例如,以二氧化碳),但该碳会在生物量的产生期间在循环(例如,作物的
栽培),从而平衡碳循环,这与基于石油的燃料不同。
[0019] 基于类似的理由,生物来源的化学品提供了与生物燃料相同的优于基于石油的燃料的优点。生物来源的化学品是石化产品的可再生的替代选项。生物来源的化学品,例如
碳氢化合物(例如,烷烃、烯烃、或炔烃)、脂肪醇、酯、脂肪酸、脂肪醛和酮,比石化产品更优质,因为它们是直接产生的而不需要大量的提炼。与石化产品不同,生物来源的化学品不需
要像原油那样提炼以提取随后必须进一步加工以制备更复杂的石化产品的原材料。生物来
源的化学品是从生物量直接地转变为所需化学产品。
[0020] 发明概述
[0021] 本发明至少部分基于编码脂肪醛生物合成多肽的基因的鉴定。因此,在一方面,本发明特征为制备脂肪醛的方法。所述方法包括在宿主细胞中表达编码包含SEQ ID NO:18、
20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、
70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列的脂肪醛生物合成多肽或其变体的基因。在一些实施方案中,该方法还包括从所述宿主细胞分离所
述脂肪醛。在某些实施方案中,所述脂肪醛存在于细胞外环境。在一些实施方案中,所述脂
肪醛分离自所述宿主细胞的细胞外环境。在一些实施方案中,所述脂肪醛分泌自所述宿主
细胞。在可选择的实施方案中,将所述脂肪醛运输进细胞外环境。在其他实施方案中,将脂
肪醛被动运输到细胞外环境中。
[0022] 在一些实施方案中,脂肪醛生物合成多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQ ID NO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、
54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或
122的氨基酸序列,并且所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有
脂肪酸还原酶活性。
[0023] 在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代:例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸
替换;苏氨酸被丝氨酸替换;例如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸
如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨
酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香
族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、
50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在一些实施方案中,所述多肽具有脂肪酸酸还原酶活性。
[0024] 在一些实施方案中,所述方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0025] 在一些实施方案中,所述方法还包括修饰宿主细胞中编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂
肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选择的实施
方案中,修饰编码脂肪酸合酶的基因的表达包括减弱宿主细胞中编码脂肪酸合酶的基因和
/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,所述脂肪酸合酶
是硫酯酶。在具体实施方案中,所述硫酯酶是由tesA、缺乏前导序列的tesA、tesB、fatB、
fatB2、fatB3、fatA或fatA1编码的。
[0026] 在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达
减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合
酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方
案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述
的酰基CoA合酶基因。
[0027] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0028] 在一些实施方案中,所述多肽来自细菌、植物、昆虫、酵母、真菌或哺乳动物。
[0029] 在一些实施方案中,所述多肽来自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、细菌细胞或任何其他本文所述的有机体。在一些实施方案中,细菌是选自耻垢分枝杆菌(Mycobacterium smegmatis)、脓肿分支杆菌(Mycobacterium
abscessus)、鸟分支杆菌(Mycobacterium avium)、牛分支杆菌(Mycobacterium bovis)、
结核分枝杆菌(Mycobacterium tuberculosis)、麻风分枝杆菌(Mycobacterium leprae)、
海分枝杆菌(Mycobacterium marinum)和溃疡分枝杆菌(Mycobacterium ulcerans)的
分支杆菌。在其他实施方案中,细菌是诺卡氏菌(Nocardia sp.)、NRRL 5646、皮疽诺
卡氏菌(Nocardia farcinica)、灰色链霉菌(Streptomyces griseus)、砂嗜盐产孢菌
(Salinispora arenicola)或番茄溃疡病菌(Clavibacter michiganenesis)。
[0030] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0031] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述生物合成多肽包含与SEQ ID NO:18、20、22、24、26、28、
30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、
80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列具有至少约70%、至少约
75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的
氨基酸序列。在一些实施方案中,所述氨基酸序列是SEQ ID NO:18、20、22、24、26、28、30、
32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、
82、84、86、88、90、92、114、116、118、120或122的氨基酸序列。
[0032] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0033] 在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达
编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实
施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基
因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合
酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。
[0034] 在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达
减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合
酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方
案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述
的酰基CoA合酶基因。
[0035] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0036] 在一些实施方案中,所述多肽来自细菌、植物、昆虫、酵母、真菌或哺乳动物。
[0037] 在一些实施方案中,所述多肽来自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、细菌细胞或任何其他本文所述的有机体。在一些实施方案中,细菌是选自耻垢分枝杆菌、脓肿分支杆菌、鸟分支杆菌、牛分支杆菌、结核分枝杆菌、麻风
分枝杆菌、海分枝杆菌和溃疡分枝杆菌的分支杆菌。在其他实施方案中,细菌是诺卡氏菌
(Nocardia sp.)、NRRL 5646、皮疽诺卡氏菌、灰色链霉菌、砂嗜盐产孢菌或番茄溃疡病菌。
[0038] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0039] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达与SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、
61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列的互补序列或其片段杂交的多核苷酸,其中所述多核苷酸编码具有羧酸还原酶活性的
多肽。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。
[0040] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0041] 在一些实施方案中,所述多核苷酸与SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、
85、87、89、91、113、115、117、119或121的核苷酸序列的互补序列,或其片段,在低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交。
[0042] 在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达
编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实
施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基
因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合
酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。
[0043] 在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达
减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合
酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方
案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述
的酰基CoA合酶基因。
[0044] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0045] 在一些实施方案中,所述多核苷酸来自细菌、植物、昆虫、酵母、真菌或哺乳动物。
[0046] 在一些实施方案中,所述多肽来自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞、细菌细胞或任何其他本文所述有机体。在一些实施方案中,
细菌是选自耻垢分枝杆菌、脓肿分支杆菌、鸟分支杆菌、牛分支杆菌、结核分枝杆菌、麻风
分枝杆菌、海分枝杆菌和溃疡分枝杆菌的分支杆菌。在其他实施方案中,细菌是诺卡氏菌
(Nocardia sp.)、NRRL 5646、皮疽诺卡氏菌、灰色链霉菌、砂嗜盐产孢菌或番茄溃疡病菌。
[0047] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0048] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含SEQ ID NO:16的氨基酸
或其变体,和(ii)修饰编码脂肪酸合酶的基因的表达,包括在宿主细胞中表达编码脂肪酸
合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在某些实施方案中,修
饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增
加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案中,修饰编码脂肪酸合酶
的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/或降低宿主细胞中内源
脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案
中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。
[0049] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0050] 在一些实施方案中,多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQ ID NO:16的氨基酸序列,其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所
述多肽具有脂肪酸还原酶活性。
[0051] 在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代:诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸
替换;苏氨酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸
如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨
酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香
族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、
50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在一些实施方案中,所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。
[0052] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0053] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0054] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含与SEQ ID NO:16的氨基
酸序列具有至少约70%序列同一性的氨基酸序列,和(ii)修饰编码脂肪酸合酶的基因的
表达,包括在宿主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合
酶的表达或活性。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞
中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可
选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合
酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂
肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、
fatB2、fatB3、fatA或fatA1编码。
[0055] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0056] 在一些实施方案中,所述氨基酸序列与SEQ ID NO:16的氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
在一些实施方案中,所述氨基酸序列是SEQ ID NO:16。
[0057] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0058] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0059] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达与SEQ ID NO:15的核苷酸序列的互补序列或其片段杂交的多核苷酸,其中所述多核苷
酸编码具有羧酸还原酶活性的多肽;和(ii)修饰编码脂肪酸合酶的基因的表达,包括在宿
主细胞中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活
性。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达编码脂
肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实施方案
中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基因和/
或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合酶是硫
酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。
[0060] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0061] 在一些实施方案中,所述多核苷酸与SEQ ID NO:15的核苷酸序列的互补序列或其片段在低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交。
[0062] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0063] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0064] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含SEQ ID NO:16的氨基酸或其
变体,其中遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。
在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的酰基
CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合酶,所述酰基CoA
合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的宿
主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。
[0065] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0066] 在一些实施方案中,多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQ ID NO:16的氨基酸序列,其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所
述多肽具有脂肪酸还原酶活性。
[0067] 在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代:诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸
替换;苏氨酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸
如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨
酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香
族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、
50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。
[0068] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0069] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0070] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含与SEQ ID NO:16的氨基酸
序列具有至少约70%序列同一性的氨基酸序列,其中遗传工程化宿主细胞以相对于野生
型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相
对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表
达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、
EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的
基因编码。在一些实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶
的基因的敲除,例如上述的酰基CoA合酶基因。
[0071] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0072] 在一些实施方案中,所述氨基酸序列与SEQ ID NO:16的氨基酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
在一些实施方案中,所述氨基酸序列是SEQ ID NO:16。
[0073] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0074] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0075] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达与SEQ ID NO:15的核苷酸序列的互补序列或其片段杂交的多核苷酸,其中所述多核苷酸编码
具有羧酸还原酶活性的多肽,并且其中遗传工程化宿主细胞以相对于野生型宿主细胞表达
减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主
细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰
基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些
实施方案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例
如上述的酰基CoA合酶基因。
[0076] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0077] 在一些实施方案中,所述多核苷酸与SEQ ID NO:15的核苷酸序列的互补序列或其片段在低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交。
[0078] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0079] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0080] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达包含脂肪醛生物合成核苷酸序列的重组载体,所述脂肪醛生物合成核苷酸序列与SEQ ID
NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、
65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约70%的序列同一性。在一些实施方案中,所述核苷酸序列与SEQ ID NO:17、19、
21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、
71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约
75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在
一些实施方案中,所述核苷酸序列是SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、
41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、
91、113、115、117、119或121的核苷酸序列。
[0081] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0082] 在一些实施方案中,重组载体还包含可操作地连接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节型、细胞器特异性、组织特异性、诱导型、组成型或细胞特异性启动子。
[0083] 在其他实施方案中,所述重组载体包含至少一个选自以下的序列:(a)可操作地偶联到所述核苷酸序列的调节序列;(b)可操作地偶联到所述核苷酸序列的选择标记;(c)
可操作地偶联到所述核苷酸序列的标记序列;(d)可操作地偶联到所述核苷酸序列的纯化
部分;(e)可操作地偶联到所述核苷酸序列的分泌序列;和(f)可操作地偶联到所述核苷酸
序列的引导序列(targeting sequence)。
[0084] 在一些实施方案中,重组载体是质粒。
[0085] 在一些实施方案中,宿主细胞表达由重组载体编码的多肽。在一些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组DNA,并且所述核苷酸序列的表达受可调
型启动子区的控制。
[0086] 在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达
编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实
施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基
因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合
酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。
[0087] 在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达
减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合
酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方
案中,遗传工程化的宿主细胞包含一个或多个编码脂肪酸降解酶的基因的敲除,例如上述
的酰基CoA合酶基因。
[0088] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab 或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0089] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0090] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括(i)在宿主细胞中表达包含脂肪醛生物合成核苷酸序列的重组载体,所述脂肪醛生物合成核苷酸序列与SEQ ID
NO:15的核苷酸序列具有至少约70%的序列同一性,和(ii)修饰宿主细胞中编码脂肪酸合
酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞
中表达编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可
选的实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合
酶的基因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂
肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、
fatB2、fatB3、fatA或fatA1编码。
[0091] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0092] 在一些实施方案中,所述核苷酸序列与SEQ ID NO:15的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
在一些实施方案中,所述核苷酸序列是SEQ ID NO:15的核苷酸序列。
[0093] 在一些实施方案中,重组载体还包含可操作地连接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节型、细胞器特异性、组织特异性、诱导型、组成型或细胞特异性启动子。
[0094] 在其他实施方案中,所述重组载体包含至少一个选自以下的序列:(a)可操作地偶联到所述核苷酸序列的调节序列;(b)可操作地偶联到所述核苷酸序列的选择标记;(c)
可操作地偶联到所述核苷酸序列的标记序列;(d)可操作地偶联到所述核苷酸序列的纯化
部分;(e)可操作地连接到所述核苷酸序列的分泌序列;和(f)可操作地连接到所述核苷酸
序列的引导序列。
[0095] 在一些实施方案中,重组载体是质粒。
[0096] 在一些实施方案中,宿主细胞表达由重组载体编码的多肽。在一些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组DNA,并且所述核苷酸序列的表达受可调
型启动子区的控制。
[0097] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0098] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0099] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达包含脂肪醛生物合成核苷酸序列的重组载体,所述脂肪醛生物合成核苷酸序列与SEQ ID NO:
15的核苷酸序列具有至少约70%的序列同一性,其中遗传工程化宿主细胞以相对于野生
型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相
对于野生型宿主细胞表达减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表
达减弱水平的酰基CoA合酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、
EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的
基因编码。在一些实施方案中,遗传工程化的宿主细胞包含编码脂肪酸降解酶的一个或多
个基因的敲除,例如上述的酰基CoA合酶基因。
[0100] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0101] 在一些实施方案中,所述核苷酸序列与SEQ ID NO:15的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
在一些实施方案中,所述核苷酸序列是SEQ ID NO:15的核苷酸序列。
[0102] 在一些实施方案中,重组载体还包含可操作地连接到所述核苷酸序列的启动子。在一些实施方案中,所述启动子是发育调节型、细胞器特异性、组织特异性、诱导型、组成型或细胞特异性启动子。
[0103] 在其他实施方案中,所述重组载体包含至少一个选自以下的序列:(a)可操作地偶联到所述核苷酸序列的调节序列;(b)可操作地偶联到所述核苷酸序列的选择标记;(c)
可操作地偶联到所述核苷酸序列的标记序列;(d)可操作地偶联到所述核苷酸序列的纯化
部分;(e)可操作地偶联到所述核苷酸序列的分泌序列;和(f)可操作地偶联到所述核苷酸
序列的引导序列。
[0104] 在一些实施方案中,重组载体是质粒。
[0105] 在一些实施方案中,宿主细胞表达由重组载体编码的多肽。在一些实施方案中,所述核苷酸序列被稳定并入所述宿主细胞的基因组DNA,并且所述核苷酸序列的表达受可调
型启动子区的控制。
[0106] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0107] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0108] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括在宿主细胞中表达编码脂肪醛生物合成多肽的基因,所述脂肪醛生物合成多肽包含(i)SEQ ID NO:7、SEQ ID
NO:8、SEQ ID NO:9和SEQ ID NO:10;(ii)SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14;和/或(iii)SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:
11;其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活
性。
[0109] 在一些实施方案中,该方法还包括从宿主细胞分离脂肪醛。在一些实施方案中,脂肪醛存在于细胞外环境中。在某些实施方案中,从宿主细胞的细胞外环境分离脂肪醛。在
一些实施方案中,脂肪醛由宿主细胞分泌。在可选的实施方案中,将脂肪醛运输到细胞外环
境。在其他实施方案中,脂肪醛被动运输到细胞外环境。
[0110] 在一些实施方案中,所述多肽的长度为约1000个氨基酸至约2000个氨基酸。在某些实施方案中,所述多肽的长度为约1000个氨基酸、长度为约1050个氨基酸、长度为约
1100个氨基酸、长度为约1150个氨基酸、长度为约1200个氨基酸、长度为约1250个氨基
酸、长度为约1300个氨基酸、长度为约1400个氨基酸、长度为约1500个氨基酸、长度为约
1600个氨基酸、长度为约1700个氨基酸、长度为约1800个氨基酸、长度为约1900个氨基酸
或长度为约2000个氨基酸。在其他实施方案中,所述多肽的长度为高达约1500个氨基酸、
长度为高达约1400个氨基酸、长度为高达约1300个氨基酸、长度为高达约1250个氨基酸、
长度为高达约1200个氨基酸、长度为高达约1150个氨基酸、长度为高达约1100个氨基酸、
长度为高达约1050个氨基酸或长度为高达约1000个氨基酸。
[0111] 在一些实施方案中,所述方法还包括在所述宿主细胞中修饰编码脂肪酸合酶的基因的表达。在某些实施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中表达
编码脂肪酸合酶的基因和/或增加宿主细胞中内源脂肪酸合酶的表达或活性。在可选的实
施方案中,修饰编码脂肪酸合酶的基因的表达包括在宿主细胞中减弱编码脂肪酸合酶的基
因和/或降低宿主细胞中内源脂肪酸合酶的表达或活性。在一些实施方案中,该脂肪酸合
酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。
[0112] 在其他实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达减弱水平的脂肪酸降解酶。在一些实施方案中,遗传工程化宿主细胞以相对于野生型宿主细胞表达
减弱水平的酰基CoA合酶。在具体实施方案中,所述宿主细胞表达减弱水平的酰基CoA合
酶,所述酰基CoA合酶由fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方
案中,遗传工程化的宿主细胞包含编码脂肪酸降解酶的一个或多个基因的敲除,例如上述
的酰基CoA合酶基因。
[0113] 在仍然其他实施方案中,遗传工程化宿主细胞以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该宿主细胞包含fabA
或图6中列出的基因的敲除。在其他实施方案中,遗传工程化宿主细胞以表达减弱水平的
酮脂酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该宿主
细胞包含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化宿主细胞
以表达修饰水平的编码去饱和酶的基因,例如desA。
[0114] 在一些实施方案中,该方法还包括在脂肪醛生物合成多肽的至少一种生物底物的存在下培养所述宿主细胞。
[0115] 在本文所述的本发明的任何方面中,所述宿主细胞可以选自哺乳动物细胞、植物细胞、昆虫细胞、酵母细胞、真菌细胞、丝状真菌细胞和细菌细胞。
[0116] 在一些实施方案中,所述宿主细胞是革兰氏阳性细菌细胞。在其他实施方案中,所述宿主细胞是革兰氏阴性细菌细胞。
[0117] 在一些实施方案中,所述宿主细胞选自以下的属:埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、假
单胞菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、链孢霉属
(Neurospora)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、
克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉菌属(Mucor)、蚀
丝 霉 属 (Myceliophtora)、青 霉 属(Penicillium)、平 革 菌 属 (Phanerochaete)、
侧 耳 属 (Pleurotus)、栓 菌 属 (Trametes)、金 黄 孢 子 菌 属 (Chrysosporium)、
酵 母 属(Saccharomyces)、寡 养 单 胞 菌 属 (Stenotrophamonas)、裂 殖 酵 母 属
(Schizosaccharomyces)、耶氏酵母属(Yarrowia)或链霉菌属(Streptomyces)。
[0118] 在具体实施方案中,所述宿主细胞为迟缓芽孢杆菌(Bacillus lentus)细胞、短芽孢杆菌(Bacillus brevis)细胞、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)
细胞、地衣芽孢杆菌(Bacillus licheniformis)细胞、嗜碱芽孢杆菌(Bacillus
alkalophilus)细胞、凝结芽孢杆菌(Bacillus coagulans)细胞、环状芽孢杆菌(Bacillus
circulans)细胞、短小芽孢杆菌(Bacillus pumilis)细胞、苏云金芽孢杆菌(Bacillus
thuringiensis)细胞、克劳氏芽孢杆菌(Bacillus clausii)细胞、巨大芽孢杆菌
(Bacillus megaterium)细胞、枯草芽孢杆菌(Bacillus subtilis)细胞或解淀粉芽孢杆菌
(Bacillus amyloliquefaciens)细胞。
[0119] 在其他实施方案中,宿主细胞为康氏木霉(Trichoderma koningii)细胞、绿色木霉(Trichoderma viride)细胞、里氏木霉(Trichoderma reesei)细胞、长枝木霉
(Trichoderma longibrachiatum)细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲
霉(Aspergillus fumigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉
(Aspergillus nidulans)细胞、黑曲霉(Aspergillus niger)细胞、米曲霉(Aspergillus
oryzae)细胞、特异腐质霉(Humicola insolens)细胞、棉毛状腐质霉(Humicola
lanuginose)细胞、混浊红球菌(Rhodococcus opacus)细胞、米黑根毛霉(Rhizomucor
miehei)细胞或米黑毛酶(Mucor michei)细胞。
[0120] 在其他实施方案中,所述宿主细胞是浅青紫链霉菌(Streptomyces lividans)细胞或鼠灰链霉菌(Streptomyces murinus)细胞。
[0121] 在仍然其他实施方案中,宿主细胞是放线菌(Actinomycetes)细胞。
[0122] 在一些实施方案中,宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。在具体实施方案中,宿主细胞是来自真核植物、藻类、蓝藻(cyanolacterium)、绿色硫细菌、
绿色非硫细菌、紫色硫细菌、紫色非硫细菌、嗜极生物、酵母、真菌、其工程化的有机体或合成的有机体的细胞。在一些实施方案中,宿主细胞为光依赖性或固定碳。在一些实施方案
中,宿主细胞轻度依赖或固定碳。在一些实施方案中,宿主细胞具有自养活性。在一些实
施方案中,宿主细胞具有光合自养活性,例如在光的存在下。在一些实施方案中,在缺乏光
时,宿主细胞时异养的或兼养的。在某些实施方案中,宿主细胞是来自拟南芥(Avabidopsis thaliana)、柳枝稷(Panicum virgatum)、巨芒(Miscanthus giganteus)、玉 米(Zea
mays)、葡萄藻(Botryococcuse braunii)、莱菌衣藻(Chlamydomonas reinhardtii)、杜
氏盐藻(Dunaliela salina)、聚球蓝细菌(Synechococcus Sp.)PCC 7002、聚球蓝细菌
(Synechococcus Sp.)PCC 7940、聚球蓝细菌(Synechococcus Sp.)PCC6803、长嗜热聚球
蓝细菌(Thermosynechococcus elongates)BP-1、绿硫菌(Chlorobium tepidum)、荚膜
红细菌(Rhodobacter capsulatus)、沼泽红假单胞菌(Rhodopseudomonas palusris)、将
达梭菌(Clostridium ljungdahlii)、热纤梭菌(Clostridiuthermocellum)、产黄青霉菌
(Penicillium chrysogenum)、巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母、粟酒裂殖酵
母(Schizosaccharomyces pombe)、荧光假单胞菌(Pseudomonas fluorescens)或运动发酵
单胞菌(Zymomonas mobilis)的细胞。
[0123] 在其他实施方案中,所述宿主细胞是CHO细胞、COS细胞、VERO细胞、BHK细胞、HeLa细胞、Cv1细胞、MDCK细胞、293细胞、3T3细胞或PC12细胞。
[0124] 在仍然其他实施方案中,所述宿主细胞是大肠杆菌(E.coli)细胞。在某些实施方案中,所述大肠杆菌细胞是菌株B、菌株C、菌株K或菌株W大肠杆菌细胞。
[0125] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括将底物与(i)包含SEQ ID NO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、
62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或122的氨基酸序列或其变体的脂肪醛生物合成多肽或(ii)由与SEQ ID NO:17、19、21、23、25、27、29、31、
33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、
83、85、87、89、91、113、115、117、119或121的核苷酸序列或其变体具有至少约70%同一性的核苷酸序列编码的脂肪醛生物合成多肽接触。在一些实施方案中,该方法还包括纯化脂
肪醛。
[0126] 在一些实施方案中,脂肪醛生物合成多肽包含具有一个或多个氨基酸取代、添加、插入或缺失的SEQ ID NO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、
54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或
122的氨基酸序列,其中所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有
脂肪酸还原酶活性。
[0127] 在一些实施方案中,所述多肽包含一个或多个以下保守型氨基酸取代:诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一脂肪族氨基酸替换;丝氨酸被苏氨酸
替换;苏氨酸被丝氨酸替换;诸如天冬氨酸和谷氨酸的酸性残基被另一酸性残基替换;诸
如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺的残基替换;诸如赖氨酸和精氨
酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨酸的芳香族残基被另一芳香
族残基替换。在一些实施方案中,所述多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、
50、60、70、80、90、100或更多个氨基酸取代、添加、插入或缺失。在一些实施方案中,所述多肽具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。
[0128] 在一些实施方案中,所述多肽具有与SEQ ID NO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、
86、88、90、92、114、116、118、120或122的氨基酸序列至少约75%、至少约80%、至少约
85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%一致的氨基酸序列。在一些实施方案中,
所述多肽具有SEQ ID NO:18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、
54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、114、116、118、120或
122的氨基酸序列。
[0129] 在一些实施方案中,所述核苷酸序列与SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、
83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,所述
核苷酸序列是SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、
53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或
121。
[0130] 在另一方面,本发明特征为产生脂肪醛的方法。该方法包括将底物与脂肪醛生物合成多肽接触,所述脂肪醛生物合成多肽包含(i)SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:
9和SEQ ID NO:10;(ii)SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14;
和/或(iii)SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11;其中所述多肽
具有羧酸还原酶活性。在一些实施方案中,所述多肽具有脂肪酸还原酶活性。
[0131] 在一些实施方案中,所述多肽的长度为约1000氨基酸至约2000氨基酸。在某些实施方案中,所述多肽的长度为约1000个氨基酸、长度为约1050个氨基酸、长度为约1100
个氨基酸、长度为约1150个氨基酸、长度为约1200个氨基酸、长度为约1250个氨基酸、长
度为约1300个氨基酸、长度为约1400个氨基酸、长度为约1500个氨基酸、长度为约1600
个氨基酸、长度为约1700个氨基酸、长度为约1800个氨基酸、长度为约1900个氨基酸或长
度为约2000个氨基酸。在其他实施方案中,所述多肽的长度为高达约1500个氨基酸、长度
为高达约1400个氨基酸、长度为高达约1300个氨基酸、长度为高达约1250个氨基酸、长度
为高达约1200个氨基酸、长度为高达约1150个氨基酸、长度为高达约1100个氨基酸、长度
为高达约1050个氨基酸或长度为高达约1000个氨基酸。
[0132] 在本文所述的本发明的任何方面中,所述方法可以产生包含C6-C26脂肪醛的脂肪醛。在一些实施方案中,所述脂肪醛包含C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26脂肪醛。在具体实施方案中,所述脂肪醛为癸醛、十二醛、十四醛或十六醛。
[0133] 在其他实施方案中,所述脂肪醛包含直链脂肪醛。在其他实施方案中,所述脂肪醛包含支链脂肪醛。在其他实施方案中,所述脂肪醛包含环状部分。
[0134] 在一些实施方案中,所述脂肪醛是不饱和脂肪醛。在其他实施方案中,所述脂肪醛是单不饱和脂肪醛。在其他实施方案中,所述脂肪醛是饱和脂肪醛。
[0135] 在本文所述的发明的任何方面,脂肪醛生物合成多肽的底物可以是脂肪酸。在一些实施方案中,所述脂肪酸包括C6-C26脂肪酸。在一些实施方案中,所述脂肪酸包含C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26脂肪酸。在具体实施方案中,所述脂肪酸是C6、C8、C10、C12、C13、C14、C15、C16、C17或C18脂肪酸。
[0136] 在其他实施方案中,所述脂肪酸包含直链脂肪酸。在其他实施方案中,所述脂肪酸包含支链脂肪酸。在仍然其他实施方案中,所述脂肪酸包含环状部分。
[0137] 在一些实施方案中,所述脂肪醛是不饱和脂肪醛。在其他实施方案中,所述脂肪醛是单不饱和脂肪醛。在某些实施方案中,所述不饱和脂肪醛是C6:1、C7:1、C8:1、C9:1、
C10:1、C11:1、C12:1、C13:1、C14:1、C15:1、C16:1、C17:1、C18:1、C19:1、C20:1、C21:1、C22:1、C23:1、C24:1、C25:1或C26:1不饱和脂肪醛。在仍然其他实施方案中,所述脂肪醛
在Ω-7位置是不饱和的。在某些实施方案中,所述不饱和脂肪醛包含顺式双键。
[0138] 在另一方面,本发明特征为遗传工程化的微生物,所述微生物包含稳定并入所述微生物的基因组DNA中位于多核苷酸的上游的外源控制序列,所述多核苷酸包含与SEQ ID
NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、
65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少70%序列同一性的核苷酸序列,其中所述微生物相对于野生型微生物产生增高水平
的脂肪醛。
[0139] 在一些实施方案中,所述核苷酸序列与SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、
83、85、87、89、91、113、115、117、119或121的核苷酸序列具有至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些实施方案中,所述
核苷酸序列是SEQ ID NO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、
53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、113、115、117、119或
121。
[0140] 在一些实施方案中,所述多核苷酸对于所述微生物来说是内源的。
[0141] 在其他实施方案中,遗传工程化所述微生物以在宿主细胞中表达修饰水平的编码脂肪酸合酶的基因。在某些实施方案中,所述微生物表达编码脂肪酸合酶的基因和/或具
有增强表达或活性的内源脂肪酸合酶。在可选的实施方案中,所述微生物具有减弱表达的
在宿主中编码脂肪酸合酶的基因和/或具有降低表达或活性的内源脂肪酸合酶。在一些
实施方案中,该脂肪酸合酶是硫酯酶。在具体实施方案中,硫酯酶由tesA、无前导序列的
tesA、tesB、fatB、fatB2、fatB3、fatA或fatA1编码。
[0142] 在其他实施方案中,遗传工程化微生物以相对于野生型微生物表达减弱水平的脂肪酸降解酶。在一些实施方案中,所述微生物相对于野生型微生物表达减弱水平的酰基CoA
合酶。在具体实施方案中,所述微生物表达减弱水平的酰基CoA合酶,所述酰基CoA合酶由
fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因编码。在一些实施方案中,遗传工程化的微生物包含
一个或多个编码脂肪酸降解酶的基因的敲除,例如上述的酰基CoA合酶基因。
[0143] 在仍然其他实施方案中,遗传工程化微生物以表达减弱水平的脱水酶/异构酶,例如由fab A或图6中列出的基因编码的酶。在一些实施方案中,该微生物包含fabA或
图6中列出的基因的敲除。在其他实施方案中,遗传工程化微生物以表达减弱水平的酮脂
酰-ACP合酶,例如由fabB或图7中列出的基因编码的酶。在其他实施方案中,该微生物包
含fabB或图7中列出的基因的敲除。在仍然其他实施方案中,遗传工程化微生物以表达修
饰水平的编码去饱和酶的基因,例如desA。
[0144] 在一些实施方案中,所述微生物是细菌。在某些实施方案中,所述细菌是革兰氏阴性菌或革兰氏阳性菌。
[0145] 在一些实施方案中,所述微生物是选自耻垢分枝杆菌、脓肿分支杆菌、鸟分支杆菌、牛分支杆菌、结核分枝杆菌、麻风分枝杆菌、海分枝杆菌和溃疡分枝杆菌的分支杆菌。
[0146] 在其他实施方案中,所述微生物是诺卡氏菌(Nocardia sp.)、NRRL5646、皮疽诺卡氏菌、灰色链霉菌、砂嗜盐产孢菌或番茄溃疡病菌。
[0147] 在另一方面,本发明特征为由本文所述的任何方法或任何微生物所产生的脂肪醛。
[0148] 在一些实施方案中,所述脂肪醛的δ13C为约-15.4或更高。在某些实施方案中,13 13
所述脂肪醛的δ C为约-15.4至约-10.9,或δ C为约-13.92至约-13.84。
[0149] 在一些实施方案中,所述脂肪醛的fM14C为至少约1.003。在某些实施方案中,所述14 14
脂肪醛的fM C为至少约1.01或至少约1.5。在一些实施方案中,所述脂肪醛的fM C为约
1.111至约1.124。
[0150] 在本文所述的任何方面,所产生的脂肪醛的产量为约25mg/L、约50mg/L、约75mg/L、约100mg/L、约125mg/L、约150mg/L、约175mg/L、约200mg/L、约225mg/L、约250mg/L、
约275mg/L、约300mg/L、约325mg/L、约350mg/L、约375mg/L、约400mg/L、约425mg/L、
约450mg/L、约475mg/L、约500mg/L、约525mg/L、约550mg/L、约575mg/L、约600mg/L、
约625mg/L、约650mg/L、约675mg/L、约700mg/L、约725mg/L、约750mg/L、约775mg/L、
约800mg/L、约825mg/L、约850mg/L、约875mg/L、约900mg/L、约925mg/L、约950mg/L、约
975mg/L、约1000g/L、约1050mg/L、约1075mg/L、约1100mg/L、约1125mg/L、约1150mg/L、约
1175mg/L、约1200mg/L、约1225mg/L、约1250mg/L、约1275mg/L、约1300mg/L、约1325mg/L、约1350mg/L、约1375mg/L、约1400mg/L、约1425mg/L、约1450mg/L、约1475mg/L、约1500mg/L、约1525mg/L、约1550mg/L、约1575mg/L、约1600mg/L、约1625mg/L、约1650mg/L、约
1675mg/L、约1700mg/L、约1725mg/L、约1750mg/L、约1775mg/L、约1800mg/L、约1825mg/L、约1850mg/L、约1875mg/L、约1900mg/L、约1925mg/L、约1950mg/L、约1975mg/L、约2000mg/L或更高。
[0151] 在本文所述的任何方面,脂肪醛在本文所述的宿主细胞或微生物中由碳源产生。
[0152] 下述附图仅以示例的目的呈现而不意图限制。
[0153] 附图简述
[0154] 图1为脂肪醛产生的新途径的示意图。
[0155] 图2为诺卡氏菌(Nocardia sp.)NRRL 5646 car基因的核苷酸序列和相应氨基酸序列的列表。
[0156] 图3为CAR同系物的氨基酸序列基序的列表。
[0157] 图4为car同系物基因的核苷酸和氨基酸序列的列表。
[0158] 图5为鉴定可以被表达、超表达或减弱以增加特定底物产生的示例性基因的表格。
[0159] 图6为fab A相关基因的核苷酸和氨基酸序列的表格。
[0160] 图7为fab B相关基因的核苷酸和氨基酸序列的表格。
[0161] 发明详述
[0162] 除非另有限定,本文使用的所有技术和科学术语与本发明所属领域技术人员通常理解的具有相同的意义。尽管与本文所述的那些方法和材料相似或等同的方法和材料可以
用于本发明的实践或测试,仍然在下文描述了合适的方法和材料。本文提及的所有出版物、
专利申请、专利和其他参考资料,包括GenBank数据库序列,通过引用全文并入。如有冲突,以包括定义在内的本说明书为准。此外,材料、方法和实施例仅是举例说明并不意图限制。
[0163] 根据下文的详细描述和权利要求,本发明的其他特征和优势会清晰。
[0164] 定义
[0165] 在整个本说明书中,可以使用缩写基因名称或多肽名称进行引用,但是应当理解到,该缩写基因或多肽名称表示基因或多肽的种类。这些基因名称包括编码相同多肽和具
有相同生理功能的同源多肽的所有基因。多肽名称包括具有相同活性(例如催化相同基础
化学反应活性)的所有多肽。
[0166] 除非另作说明,本文引用的登录号来自美国国立卫生研究院(NationalInstitute of Health,U.S.A)所维护的NCBI数据库(国家生物技术信息中心(National
Center for Biotechnology Information))。登录号按照截止到2008年十月的数据库中
提供的。
[0167] EC号由国际生物化学和分子生物学联盟命名委员会(Nomenclature Committeeof the International Union of Biochemistry and Molecular Biology (NC-IUBMR))
(可获取自http://www.chem.qmul.ac.uk/iubmb/enzyme/)制定。本文引用的EC号来自
由东京大学部分资助的京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and
Genomics)所维护的KEGG配体数据库。除非另作说明,EC号按照截止到2008年十月的数
据库中提供的。
[0168] 本文所用冠词“a(一个)”和“an(一个)”是指该冠词的一个或多于一个(即至少一个)语法对象。作为实例,“元件(an element)″表示一个元件或多于一个元件。
[0169] 本文所用术语“约”表示给定数值的±20%的值。因此,“约60%”表示在60%±(60的20%)之间的值(即48-70)。
[0170] 如本文所用的术语“减弱”表示削弱、降低或缩小。例如,可以通过修饰多肽来减弱多肽以降低其活性(例如,通过修饰编码所述多肽的核苷酸序列)。
[0171] 如本文使用,术语“生物量”是指任何生物材料,其中碳源来源于所述生物材料。在一些实例中,将生物量处理成适用于生物转化的碳源。在其他实例中,生物量不需要进一步处理成碳源。碳源可以转化成生物燃料。生物量的一个示例性来源是植物物质或植被。例
如,玉米、甘蔗或柳枝稷可以用作生物量。生物量的另一非限制性实例是代谢废物,例如动
物物质,例如牛粪。另外,生物量可以包括藻类或其他海洋植物。生物量还包括来自工业、
农业、林业和家庭的废品。可以用作生物量的这些废品的实例是发酵废渣、青贮饲料、秸秆、无用杂物、污水、垃圾、纤维质城市废物和剩余食物。生物量还包括例如碳水化合物(例如
单糖、二糖或多糖)的碳源。
[0172] 如本文所用的短语“碳源”是指适于用作原核细胞或简单真核细胞生长的碳源的底物或化合物。碳源可以具有不同形式,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和CO2)。这些包括,例如,多种单糖,例如葡萄糖、果糖、甘露
糖和半乳糖;寡糖,例如低聚果糖和低聚半乳糖;多糖,例如木糖和阿拉伯糖;二糖,例如蔗糖、麦芽糖和松二糖;纤维素原料,例如甲基纤维素和羧甲基纤维素钠;饱和或不饱和脂肪
酸酯,例如琥珀酸酯、乳酸酯和醋酸酯;醇,例如乙醇、甲醇或丙三醇或其混合物。碳源还可以是光合作用的产物,包括但不限于葡萄糖。优选的碳源是生物量。另一优选的碳源是葡
萄糖。
[0173] 如果两个序列的每个碱基都匹配(即能够形成Watson Crick碱基对),则核苷酸序列与另一核苷酸序列是“互补的”。术语“互补链”在本文中与术语“互补序列”互换使用。
核酸链的互补序列可以是编码链的互补序列或非编码链的互补序列。
[0174] 如本文所用的术语“足以允许表达的条件”表示允许宿主细胞产生诸如本文所述的多肽或脂肪醛的所需产物的任何条件。合适的条件包括,例如发酵条件。发酵条件可以
包含很多参数,例如温度范围、通气水平和培养基组分。这些条件中每一个单独地并联合地
允许宿主细胞生长。示例性培养基包括培养液或凝胶。通常,所述培养基包括诸如葡萄糖、
果糖、纤维素等的碳源,该碳源可以直接被宿主细胞代谢。此外,培养基中可以使用酶以便
于促进动员(例如淀粉或纤维素的解聚为可发酵的糖)和随后碳源的代谢。
[0175] 为了确定条件是否足以允许表达,可以将宿主细胞培养例如约4、8、12、24、36或48小时。培养中和/或培养后,可以获取样品并分析样品以确定该条件是否允许表达。例
如,可以测试样品或宿主细胞在其中生长的培养基中的宿主细胞的所需产物的存在。当测
试产物的存在时,可以使用的检测诸如但不限于TLC、HPLC、GC/FID、GC/MS、LC/MS、MS。
[0176] 应当理解到,本文所述的多肽可以具有另外的对于多肽功能没有本质影响的保守型或非必需氨基酸取代。特定取代是否会被允许(即不会不利地影响例如脱羧酶活性的所
需生物性质),可以按照Bowie et al.Science(1990)247:1306 1310中所述进行测定。“保
守型氨基酸取代”是氨基酸残基被具有相似侧链的氨基酸残基所替代的取代。具有相似氨
基酸侧链的氨基酸残基家族,在本领域中已有定义。这些家族包括具有以下侧链的氨基酸:
碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的
极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β分枝侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、
组氨酸)。
[0177] 如本文所用的“控制元件”表示转录控制元件。控制元件包括启动子和增强子。术语“启动子元件”、“启动子”或“启动子序列”是指作为激活基因表达的开关发挥功能的DNA序列。如果基因被激活,认为其被转录或参与转录。转录涉及由基因合成mRNA。因此,启动
子充当转录调节元件并且还提供基因转录为mRNA的起始位点。控制元件与参与转录的细
胞蛋白特异性相互作用(Maniatis et al,Science 236:1237,1987)。
[0178] 如本文使用,术语“脂肪酸”表示具有通式RCOOH的羧酸。R表示脂肪族基团,优选地表示烷基。R可以包含约4到约22个碳原子。脂肪酸可以为饱和的、单不饱和的或多不
饱和的。在优选的实施方案中,所述脂肪酸由脂肪酸生物合成途径产生。
[0179] 如本文所用的术语“脂肪酸生物合成途径”表示产生脂肪酸的生物合成途径。所述脂肪酸生物合成途径包括脂肪酸酶,所述脂肪酸酶可以按照本文所述经工程化产生脂肪
酸,并且在一些实施方案中可以与其他酶一起表达以产生具有所需碳链特征的脂肪酸。
[0180] 如本文所用的术语“脂肪酸降解酶”表示涉及将脂肪酸或脂肪酸衍生物分解或转化成另一产物的酶。脂肪酸降解酶的非限制性实例是酰基CoA合酶。本文描述了脂肪酸降
解酶的其他实例。
[0181] 如本文所用的术语“脂肪酸衍生物”表示部分地产生于生产宿主生物体的脂肪酸生物合成途径的产物。“脂肪酸衍生物”还包括部分地产生于酰基ACP或酰基ACP衍生物的
产物。所述脂肪酸生物合成途径包括脂肪酸合酶酶类,所述脂肪酸合酶酶类可以按照本文
所述经工程化产生脂肪酸衍生物,并且在一些实施例中可以与其他酶一起表达以产生具有
所需碳链特征的脂肪酸衍生物。示例性的脂肪酸衍生物包括,例如脂肪酸、酰基CoA、脂肪
醛、短和长链醇、碳氢化合物、脂肪醇和酯(例如蜡、脂肪酸酯或脂肪酯)。
[0182] 如本文所用的术语“脂肪酸衍生酶”表示在脂肪酸衍生物的产生中可以被表达或超表达的任何酶。这些酶可以是脂肪酸生物合成途径的一部分。脂肪酸衍生酶的非限制性
实例包括脂肪酸合酶、硫酯酶、酰基CoA合酶、酰基CoA还原酶、醇脱氢酶、醇酰基转移酶、形成脂肪醇的酰基CoA还原酶、脂肪酸(羧酸)还原酶、醛还原酶、酰基ACP还原酶、脂肪酸羟
化酶、酰基CoA去饱和酶、酰基ACP去饱和酶、酰基CoA氧化酶、酰基CoA脱氢酶、酯合酶和
烷生物合成多肽等。脂肪酸衍生酶可以将底物转化为脂肪酸衍生物。在一些实施例中,所
述底物可以是被脂肪酸衍生酶转化为不同的脂肪酸衍生物的脂肪酸衍生物。
[0183] 如本文所用的“脂肪酸酶”表示参与脂肪酸生物合成的任何酶。脂肪酸酶可以在宿主细胞中被修饰以产生脂肪酸。脂肪酸酶的非限制性实例包括脂肪酸合酶和硫酯酶。本
文描述了脂肪酸酶的其他实例。
[0184] 如本文所用的“脂肪酸合酶”表示参与脂肪酸生物合成的任何酶。脂肪酸合酶可以在宿主细胞中表达或超表达以产生脂肪酸。脂肪酸合酶的非限制性实例是硫酯酶。本文
描述了脂肪酸合酶的其他实例。
[0185] 如本文所用术语“脂肪醛”表示具有通式RCHO的醛,所述RCHO特征为不饱和羰基(C=O)。在优选的实施方案中,所述脂肪醛是产生自脂肪酸或脂肪酸衍生物的任何醛。在
一个实施方案中,R基长度为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、
19或20个碳。
[0186] R可以是直链或支链。支链可以具有一个或多个分支点。此外,支链可以包括环状分支。
[0187] 另外,R可以是饱和的或不饱和的。如果是不饱和的,R可以具有一个或多个不饱和点。
[0188] 在一个实施方案中,脂肪醛是生物合成产生的。
[0189] 脂肪醛具有很多用途。例如,脂肪醛可被用于产生多种特种化学品。例如,脂肪醛用于生产聚合物、树脂、染料、调味剂、增塑剂、香水、药品和其他化学品。一些被用作溶剂、防腐剂或消毒剂。一些天然和合成的化合物,例如维生素和激素是醛。
[0190] 术语“脂肪醛生物合成多肽”、“羧酸还原酶”和“CAR”在本文可交换地使用。
[0191] 如本文所用的“现代碳比例(fraction of modern carbon)”或“fM”与分别由称为草酸标准HOxI和HOxII的国家标准技术研究院(National Institute of Standards andTechnology(NIST))标准参考物(SRMs)4990B和4990C所定义的具有相同意义。基本定义
14 12
涉及0.95倍的 C/ C同位素比例HOxI(参考AD 1950)。这粗略地等于衰变校正的工业革
命前树木(decay-corrected pre-Industrial Revolution wood)。对于现今生命生物圈
(植物物质)而言,fM约为1.1。
[0192] 本文所用的“基因敲除”是指修饰或失活编码靶蛋白的基因以降低或消除该完整蛋白的功能的方法。基因的失活可以通过常规方法进行,例如,通过UV照射或用
N-甲基-N′-硝基-N-亚硝基胍处理的诱变,定点诱变、同源重组、插入-缺失诱变、或
“Red-driven integration”(Datsenko et ah,Proc.Natl.Acad.Sci.USA,97:6640-45,
2000)。例如,在一实施方案中,将构建体引入宿主细胞从而可能在宿主细胞中选择同源重
组事件。本领域技术人员会容易地设计包含阳性或阴性选择基因的敲除构建体,所述选择
基因有效地选择经历了同源重组事件、具有构建体的转染的细胞。例如,宿主细胞中的改变
可以通过用包含改变的DNA序列置换野生型DNA序列获得,所述置换通过单或双交叉重组。
例如,为了方便地选择转化体,所述改变可以是编码抗生素抗性标记的DNA序列或与宿主
的可能的营养缺陷型互补的基因。突变包括但不限于,缺失-插入突变。这类改变的实例
包括基因中断,即基因干扰使得从该基因正常产生的产物没有以功能形式产生。这可以是
由于完全缺失、选择性标记的缺失或插入、选择性标记的插入、移码突变、框内缺失或导致
提前终止的定点突变。在一些实例中,该基因的完整mRNA是不存在的。在其他情况下,产
生的mRNA的量发生变化。
[0193] 可以按照以下计算两个序列之间“同源性”。序列以最佳比较目的进行比对(例如,可以在第一和第二氨基酸或核酸序列之一或两者中引入空位用于最佳比对,并且为了
比较目的可以忽略非同源序列)。在优选的实施方案中,用于比较目的的而比对的参考序列
长度,为参考序列长度的至少约30%、优选地至少约40%、更优选地至少约50%、更优选地
至少约60%并且更优选地至少约70%、至少约80%、至少约90%或约100%。然后比较位
于相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的位置被与第二序
列中相应位置相同的氨基酸残基或核苷酸占据时,则分子在该位置是相同的(如本文所用
的,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列所共享的相同位置数的函数,这考虑到空位数和每个空位的长度,为了两个
序列的最佳比对需要引入空位。
[0194] 可以使用数学算法完成序列的比较和两个序列之间同源性百分比的测定。在优选的实施方案中,使用以下测定两个氨基酸序列之间的同源性百分比:Needleman and
Wunsch(1970)、J.Mol.Biol.48:444 453的算法,其被并入GCG软件包中的GAP程序中,使
用Blossum 62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的空位权重和1、2、3、4、5或6的长度权重。在另一优选的实施方案中,使用以下测定两个核苷酸序列之间的同源性
百分比:GCG软件包中的GAP程序,使用NWSgapdna.CMP矩阵以及40、50、60、70或80的空
位权重和1、2、3、4、5或6的长度权重。特别优选的参数组(和如果操作者不确定应当应用
哪些参数确定分子是否在要求的同源性限制内而应该使用的参数组)是具有12的空位罚
分、4的空位延伸罚分和5的移码空位罚分的Blossum 62评分矩阵。
[0195] 如本文所用的“宿主细胞”是用于产生本文所述产物(例如本文所述的脂肪醛)的细胞。可以工程化宿主细胞以表达或超表达所选择的基因或具有所选择的基因的减弱的表
达。宿主细胞的非限制性实例包括植物、动物、人、细菌、酵母或丝状真菌细胞。
[0196] 如本文所用的术语在“低严紧性、中严紧性、高严紧性或非常高的严紧性条件下杂交”,描述用于杂交和洗涤的条件。进行杂交反应的指导可以见于Current Protocols
in Molecular Biology(现代分子生物学实验技术),John Wiley & Sons,N.Y.(1989),
6.3.1-6.3.6。该参考资料中描述了水性和非水性方法并且可以使用任一方法。本文涉及
的具体杂交条件如下:1)低严紧性杂交条件在约45℃下、在6×氯化钠/柠檬酸钠(SSC)
中,然后是在至少50℃下、在0.2×SSC、0.1%SDS中洗涤两次(对于低严紧性条件,洗涤
温度可以升至55℃);2)中严紧性杂交条件在约45℃下在、在6×SSC中,然后是在60℃的
0.2×SSC、0.1%SDS中洗涤一次或多次;3)高严紧性杂交条件在约45℃的6×SSC中,然后
是在65℃下、在0.2×SSC、0.1%SDS中洗涤一次或多次;以及优选地4)非常高严紧性杂交
条件为65℃的0.5M磷酸钠、7%SDS,然后是在65℃下、在0.2×SSC、1%SDS中洗涤一次或
多次。除非另作规定,非常高的严紧性条件(4)是优选的条件。
[0197] 本文中涉及诸如DNA或RNA的核酸所用的术语“分离的”是指分别从所述核酸的天然来源中存在的其他DNA或RNA中隔离的分子。此外,“分离的核酸”包括核酸片段,所述
核酸片段不是以片段天然存在的并不会在天然状态中发现。本文所用的术语“分离的”还
指从其他细胞蛋白分离的多肽,并且还指包括纯化的和重组的多肽两者。当核酸或多肽是
通过重组DNA技术产生时,本文使用的术语“分离的”还指基本上不含细胞物质、病毒物质
或培养基的核酸或肽。当核酸或多肽是化学合成时,本文所用的术语“分离的”还指基本上
不含化学前体或其他化学品的核酸或肽。本文所用的术语“分离的”,对于诸如脂肪醛的产
品而言,是指从细胞组分、细胞培养基或化学或合成前体分离的产物。
[0198] 如本文所用的“细胞中的基因表达水平”是指由所述细胞中基因编码的mRNA、前体mRNA新生转录物、转录加工中间体、成熟mRNA和降解产物的水平。
[0199] 如本文所用的术语“微生物”表示来自古菌域、细菌域和真核域的原核和真核微生物种类,后者包括酵母和丝状真菌、原生动物、藻类或高等原生生物。术语“微生物细
胞”(即,来自微生物的细胞)和“微生物”是可交换使用的并且表示仅借助于显微镜可见
的细胞或小有机体。
[0200] 如本文所用的术语“核酸”是指多核苷酸,例如脱氧核糖核酸(DNA)以及适当情况下,指核糖核酸(RNA)。该术语应理解为还包括作为等同物的产生自核苷酸类似物的RNA或
DNA的类似物,以及适用于所述实施方案的单链(有义或反义)和双链多核苷酸、EST、染色
体、cDNA、mRNA和rRNA。
[0201] 如本文所用的术语“可操作地连接”表示所选择的核苷酸序列(例如编码本文所述的多肽)与启动子接近以允许所述启动子调节该选择的DNA的表达。此外,按照转录和
翻译的方向,所述启动子位于所述选择的核苷酸序列的上游。“可操作地连接”表示将核苷
酸序列和调节序列连接以便当合适的分子(例如转录激活蛋白)与调节序列结合时允许基
因表达。
[0202] 本文所用术语“或”表示术语“和/或”并且与术语“和/或”交换使用,除非上下文明确表示并非如此。
[0203] 如本文所用的“超表达”表示在细胞中以高于相应野生型细胞中正常表达浓度的浓度表达核酸、多肽或碳氢化合物或使之表达。例如,当在重组宿主细胞中多肽以与其在相
同种类的非重组宿主细胞中的浓度相比更高的浓度存在时,所述多肽在所述重组宿主细胞
中能够“超表达”。
[0204] 如本文所用的“分配系数”或“P”定义为化合物在有机相中的平衡浓度除以在水相中(例如发酵液)平衡时的浓度。在本文所述的两相系统的一个实施方案中,生产过程
中所述有机相是由脂肪醛形成的。但是,在一些实施例中,可以例如通过提供辛烷层来提
供有机相以便促进产物分离。当描述两相系统时,化合物的分配特性可以描述为logP。例
如,logP为1的化合物会10∶1分配到有机相。logP为-1的化合物会1∶10分配到有
机相。通过选择合适的发酵液和有机相,具有高logP值的脂肪醛在发酵容器中也会分离到
有机相中,即使处于很低的浓度。
[0205] 如 本 文 所 用 的 术 语“纯 化(purify)”、“纯 化 的(purified)”或“纯 化(purification)”表示通过例如分离或隔离从分子的环境中移除或分离所述分子。“基本上纯化的”分子为至少约60%、优选地至少约75%以及更优选地至少约90%游离于与其相关
的其他组分。如本文所用的这些术语还指从样品中去除污染物。例如,污染物的去除可以
导致样品中脂肪醛的百分比增加。例如,当脂肪醛在宿主细胞中产生时,可以通过去除宿主
细胞蛋白纯化脂肪醛。纯化后,样品中脂肪醛的百分比增加。
[0206] 术语“纯化(purify)”、“纯化的(purified)”或“纯化(purification)”不需要绝对纯。它们是相对的术语。因此,例如当脂肪醛在宿主细胞中产生时、纯化的脂肪醛是基
本与其他细胞组分(例如核酸、多肽、脂质、碳水化合物或其他碳氢化合物)隔离的脂肪醛。
在另一实施例中,纯化的脂肪醛制剂是这样的制剂,在该制剂中,所述脂肪醛基本不含例如
发酵后可能存在的那些污染物。在一些实施方案中,当样品重量的至少约50%是由脂肪醛
组成时,所述脂肪醛是纯化的。在其他实施方案中,当样品重量的至少约60%、70%、80%、
85%、90%、92%、95%、98%或99%或更多是由脂肪醛组成时,所述脂肪醛是纯化的。
[0207] 如本文所用,术语“重组多肽”是指通过重组DNA技术产生的多肽,其中通常将编码所表达的多肽或RNA的DNA插入合适的表达载体,并且所述表达载体接下来用于转化宿
主细胞以产生所述肽或RNA。
[0208] 如本文所用的术语“基本相同”(或“基本同源”)是用于指含有足够数量的与第二氨基酸或核苷酸序列相同或等同的(例如具有相似侧链,例如保守氨基酸取代)氨基酸
残基或核苷酸的第一氨基酸或核苷酸序列,这样所述第一和第二氨基酸或核苷酸序列具有
相似活性。
[0209] 如本文所用的术语“合酶”表示催化合成过程的酶。如本文所用的术语合酶包括合酶、合成酶和连接酶。
[0210] 如本文所用的术语“转染”表示将核酸(例如通过表达载体)通过核酸介导的基因转移引入到受体细胞。
[0211] 如本文所用的“转化”是指这样的过程,在该过程中,细胞的基因型由于细胞摄入外源核酸而改变。这可以导致表达重组形式的RNA或多肽的转化的细胞。在由转移的基因
反义表达的情况下,天然存在形式的多肽的表达遭到破坏。
[0212] 如本文所用,“转运蛋白”是促进一种或多种化合物移入和/或移出细胞器和/或细胞的多肽。
[0213] 如本文所用,多肽X的“变体”是指具有肽X的氨基酸序列的多肽,其中一个或多个氨基酸残基发生改变。所述变体可以具有保守型改变或非保守型改变。使用本领域熟知的
计算机程序,例如LASERGENE软件(DNASTAR),可以找到确定哪些氨基酸残基可以被取代、
插入或缺失而不影响生物活性的指导。
[0214] 在用于多核苷酸序列的情况下,术语“变体”可以包括与基因或其编码序列的多核苷酸序列相关的多核苷酸序列。该定义还可以包括,例如“等位基因”变体、“剪接”变体、“物种”变体或“多态性”变体。剪接变体可以与参考多核苷酸具有显著的同一性,但是由于在
mRNA加工中的可选的外显子剪接,会通常具有更多或更少的多核苷酸数。相应的多肽可以
具有另外的功能结构域或结构域缺失。物种变体是在物种之间彼此不同的多核苷酸序列。
得到的多肽通常会具有显著的相对于彼此的氨基酸同一性。多态性变体是在给定物种的个
体之间特定基因的多核苷酸序列中的变异。
[0215] 如本文所用,术语“载体”是指能够转运另一核酸的核酸分子,所述核酸分子连接到所述另一核酸。一种有用的载体是附加体(即能够染色体外的复制的核酸)。有用的载
体是能够自主复制和/或表达与其连接的核酸的那些载体。能够指导基因的表达的载体在
本文被称为“表达载体”,所述载体被可操作地连接到所述基因。通常,在重组DNA技术中有用的表达载体经常是“质粒”的形式,所述“质粒”通常是指在其载体形式时不与染色体结
合的环状双链DNA环。在本说明书中,因为质粒是最通常使用的载体形式,所以“质粒”和
“载体”是交换使用的。但是,还包括发挥等同功能并随后至今成为本领域已知的表达载体
的这些其他形式。
[0216] 本发明至少部分基于大肠杆菌中脂肪醛合成新途径的发现和编码脂肪醛生物合成多肽的基因的鉴定。所述脂肪醛生物合成多肽参与图1中所示的生物合成途径。在该途
径中,首先用ATP活化脂肪酸,然后用羧酸还原酶(CAR)样酶还原以产生脂肪醛。因此,本
文所述的脂肪醛生物合成核苷酸和多肽可以用于产生脂肪醛。
[0217] 脂肪醛生物合成基因和变体
[0218] 例如,本文所述的方法和组合物包括脂肪醛生物合成基因,例如具有图2和图4中所列核苷酸序列的羧酸还原酶基因(car基因),以及其多核苷酸变体。在一些实例中,所
述脂肪醛生物合成基因编码图3所示的一个或多个氨基酸基序。例如,该基因可以编码包
含SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9和SEQ ID NO:10;SEQ ID NO:11;SEQ ID NO:
12;SEQ ID NO:13;SEQ ID NO:14;和/或SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11的多肽。SEQ ID NO:7包括还原酶结构域;SEQ ID NO:8和SEQ ID NO:14
包括NADP结合结构域;SEQ ID NO:9包括磷酸泛酰巯基乙胺附着位点;并且SEQ ID NO:10
包括AMP结合结构域。
[0219] 变体可以是天然存在的或体外产生的。特别是,可以使用基因工程技术产生这些变体,例如定点诱变、随机化学诱变、外切核酸酶III缺失操作或标准克隆技术。可选地,可以使用化学合成或修饰操作产生这些变体、片段、类似物或衍生物。
[0220] 制备变体的方法是本领域熟知的。这些方法包括这样的操作,在该操作中,修饰获得自天然分离物的核酸序列以生成编码多肽的核酸,所述多肽具有增强其在工业或实验室
应用中的价值的特征。在这些操作中,生成并表征了相对于获得自天然分离物的序列具有
一个或多个核苷酸差异的大量变体序列。通常,这些核苷酸差异导致相对于来自天然分离
物的核酸所编码的多肽的氨基酸改变。
[0221] 例如,可以使用易错PCR(参见,例如Leung et al.,Technique 1:11-15,1989;和Caldwell et al.,PCR Methods Applic.2:28-33,1992)产生变体。在易错PCR中,在
DNA聚合酶的复制保真度低的条件下进行PCR,这样沿着PCR产物的整个长度获得了高效点
突变。简单地说,在这些操作中,将待诱变的核酸(例如脂肪醛生物合成多核苷酸序列)与
PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶和适当浓度的dNTPs混合,以实现沿着PCR
产物的整个长度的高效点突变。例如,可以使用20fmoles的待诱变的核酸(例如脂肪醛生
物合成多核苷酸序列),30pmole的每种PCR引物,包含50mM KCl、10mM Tris HCl(pH 8.3)
和0.01%明胶的反应缓冲液,7mM MgCl2,0.5mM MnCl2,5单位的Taq聚合酶,0.2mM dGTP,
0.2mM dATP,1mM dCTP和1mM dTTP进行反应。PCR可以进行30个以下循环:94℃持续1分
钟、45℃持续1分钟和72℃持续1分钟。但是,应当理解到这些参数可以视情况变化。然
后,将诱变后的核酸克隆到合适的载体中并且评价所述诱变后的核酸编码的多肽的活性。
[0222] 还可以使用寡核苷酸定向诱变以在任何克隆的目的DNA中产生位点特异性突变来产生变体。寡核苷酸诱变描述于,例如Reidhaar-Olson etal.,Science 241:53-57,
1988。简单地说,在这些操作中,合成大量带有一个或多个待被引入克隆DNA中的突变的双
链寡核苷酸并且将其插入待诱变的克隆DNA(例如脂肪醛生物合成多核苷酸序列)。重获含
有诱变后的DNA的克隆并且评价其编码的多肽的活性。
[0223] 产生变体的另一方法是组合PCR(assembly PCR)。组合PCR涉及由小DNA片段的混合物组合PCR产物。大量的不同PCR反应在相同小管中平行发生,伴随一个反应的产物
引发另一反应的产物。组合PCR描述于例如美国专利第5,965,408号。
[0224] 生成变体的又一方法是有性PCR诱变。在有性PCR诱变中,作为基于序列同源性的DNA分子随机破碎的结果,体外发生了不同但高度相关的DNA序列的DNA分子之间的被
迫的同源重组。然后是通过在PCR反应中的引物延伸固定交换。有性PCR诱变描述于例如
Stemmer,PNAS,USA 91:10747-10751,1994。
[0225] 还可以通过体内诱变产生变体。在一些实施方案中,核酸序列中的随机突变通过在携带一个或多个DNA修复途径中的突变的例如大肠杆菌菌株的细菌菌株中增殖所述序
列来生成。这些“致突变(mutator)”菌株具有比野生型菌株更高的随机突变率。在这些菌
株的一个菌株中增殖DNA序列(例如脂肪醛生物合成多核苷酸序列)会最终在所述DNA中
产生随机突变。适用于体内诱变的致突变菌株描述于例如PCT公布第WO 91/16427号。
[0226] 还可以使用盒诱变产生变体。在盒诱变中,双链DNA分子的小的区被不同于天然序列的合成的寡核苷酸“盒”替换。该寡核苷酸经常含有完全和/或部分随机化的天然序
列。
[0227] 回归整体诱变(Recursive ensemble mutagenesis)也可以用于产生变体。回归整体诱变是开发用以产生表型相关的突变体的多样性群体的蛋白工程(即蛋白诱变)的运
算法则,所述群体成员的氨基酸序列是不同的。该方法使用反馈机制来控制连续轮的组合
盒诱变。回归整体诱变描述于例如Arkin et al.,PNAS,USA 89:7811-7815,1992。
[0228] 在一些实施方案中,使用指数整体诱变(exponential ensemble mutagenesis)产生变体。指数整体诱变是产生具有高百分比的独特并且有功能的变体的组合文库的过程,
其中小群残基被平行随机化以鉴定每个改变的位置上导致功能性蛋白的氨基酸。指数整体
诱变描述于例如Delegrave et al.,Biotech.Res.11:1548-1552,1993。随机诱变和定点
诱变描述于例如Arnold,Curr.Opin.Biotech.4:450-455,1993。
[0229] 在一些实施方案中,如例如美国专利第5,965,408号和第5,939,250号中所述,使用改组操作产生变体,其中许多编码不同多肽的核酸中的部分融合在一起以产生编码嵌合
多肽的嵌合核酸序列。
[0230] 多核苷酸变体还包括核酸类似物。核酸类似物可以在碱基部分、糖部分或磷酸主链处进行修饰以改善例如核酸的稳定性、杂交或溶解性。碱基部分的修饰包括将脱氧胸苷
修饰为脱氧尿苷和将脱氧胞苷修饰为5-甲基-2′-脱氧胞苷或5-溴-2′-脱氧胞苷。糖
部分的修饰包括修饰核糖的2′羟基以形成2′-O-甲基糖或′-O-烯丙基糖。可以修饰
脱氧核糖磷酸主链以产生吗啉代核酸,其中每个碱基部分连接到六元吗啉代环,或产生肽
核酸,其中脱氧磷酸主链被假肽主链代替并保留4个碱基(参见,例如Summerton et al.,
Antisense Nucleic Acid Drug Dev.(1997)7:187-195;和Hyrup et al.,Bioorgan.Med.
Chem.(1996)4:5-23.)。此外,脱氧磷酸主链可以被例如硫代磷酸酯或二硫代磷酸酯主链、
亚磷酰胺、或烷基磷酸三酯主链所代替。
[0231] 编码图2和图4中列出的同系物或其变体的任何多核苷酸序列可以被用作本文所述方法中的脂肪醛生物合成多核苷酸。
[0232] 脂肪醛生物合成多肽和变体
[0233] 本文所述的方法和组合物还包括具有图2和图4列出的氨基酸序列的脂肪醛生物合成多肽及其多肽变体。在一些实例中,所述脂肪醛生物合成多肽是包括图3所示的一个
或多个氨基酸基序的多肽。例如,该多肽可以包含SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:
9和SEQ ID NO:10的氨基酸序列。在其他情况下,该多肽包含SEQ ID NO:11、SEQ ID NO:
12、SEQ ID NO:13和SEQ ID NO:14中的一个或多个。在仍然其他实例中,该多肽包含SEQ
ID NO:7、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11的氨基酸序列。SEQ ID NO:7包
括还原酶结构域;SEQ ID NO:8和SEQ ID NO:14包括NADP结合结构域;SEQ ID NO:9包括
磷酸泛酰巯基乙胺附着位点;并且SEQ ID NO:10包括AMP结合结构域。
[0234] 脂肪醛生物合成多肽变体可以是其中一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)所取代的变体。这些取代的氨基酸残基可以是或可以不
是遗传密码所编码的残基。
[0235] 保守型取代为由相似性质的另一氨基酸取代多肽中给定氨基酸的那些取代。典型的保守型取代是以下替换:诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸的脂肪族氨基酸被另一
脂肪族氨基酸替换;丝氨酸被苏氨酸替换,或反之亦然;诸如天冬氨酸和谷氨酸的酸性残
基被另一酸性残基替换;诸如天冬酰胺和谷氨酰胺的携带酰胺的残基被另一携带酰胺基的
残替换;诸如赖氨酸和精氨酸的碱性残基被另一碱性残基交换;以及诸如苯丙氨酸和酪氨
酸的芳香族残基被另一芳香族残基替换。
[0236] 其他多肽变体是那些其中一个或多个氨基酸残基包括取代基的变体。还有其他多肽变体是那些其中所述多肽与另一化合物结合的变体,如增加多肽的半衰期的化合物(例
如聚乙二醇)。
[0237] 另外的多肽变体是那些其中其他氨基酸被融合到所述多肽的变体,所述其他氨基酸例如前导序列、分泌序列、前蛋白序列或促进所述多肽的纯化、富集或稳定的序列。
[0238] 在一些情况下,所述多肽变体保留了与具有图2和图4列出的氨基酸序列的多肽相同的生物学功能(例如,保留脂肪醛生物合成活性,例如羧酸或脂肪酸还原酶活性)并且
具有与其基本相同的氨基酸序列。
[0239] 在其他情况下,所述多肽变体与图2和图4列出的氨基酸序列具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或多于约95%的同源性。在另一实施方案中,所述多肽变体包括
片段,所述片段包含图2和图4列出的氨基酸序列的至少约5、10、15、20、25、30、35、40、50、
75、100或150个连续氨基酸。
[0240] 所述多肽变体或其片段可以通过使用本文所述的技术分离编码它们的核酸或通过超表达编码它们的合成的核酸来获得。可选地,多肽变体或其片段可以通过生物化学富
集或纯化操作来获得。多肽变体或片段的序列可以通过蛋白水解消化、凝胶电泳和/或微
测序来确定。然后使用本文所述的任何程序,可以将所述多肽变体或片段的序列与图2和
图4列出的氨基酸序列进行比较。
[0241] 使用常规方法,可以检测所述多肽变体及其片段的产生脂肪醛醛的活性。例如,在允许所述多肽变体发挥功能的条件下,可以使所述多肽变体或片段与底物(例如,脂肪酸
底物、脂肪酸衍生物底物或本文所述的其他底物)接触。可以测量底物水平的下降或脂肪
醛水平的升高以测定产生脂肪醛的活性。
[0242] 抗脂肪醛生物合成多肽抗体
[0243] 本文所述的脂肪醛生物合成多肽还可以用于产生针对脂肪醛生物合成多肽的抗体。这些抗体可以用于,例如利用本领域已知的方法检测脂肪醛生物合成多肽的表达。所
述抗体可以是,例如多克隆抗体;单克隆抗体或其抗原结合片段;例如嵌合抗体、重构抗体
(reshaped antibody)、人源化抗体的修饰的抗体或其片段(例如Fab′、Fab、F(ab′)2);
或例如单链抗体、单结构域抗体(DAB)、Fv、单链Fv(scFv)等的生物合成抗体。
[0244] 制备和使用多克隆和单克隆抗体的方法描述于,例如Harlow et al.,UsingAntibodies:A Laboratory Manual:Portable Protocol I(使用抗体:实验室指南:操作
手册I).Cold Spring Harbor Laboratory(1998年12月1日)。制备修饰的抗体和抗体
片段(例如嵌合抗体、重构抗体、人源化抗体或其片段,所述片段例如Fab′、Fab、F(ab′)2片段)或生物合成抗体(例如单链抗体、单结构域抗体(DABs)、Fv、单链Fv(scFv)等)的
方法是本领域已知的并且可以见于,例如Zola,Monoclonal Antibodies:Preparation and Use of Monoclonal Antibodies and Engineered Antibody Derivatives(单克隆抗体:
单克隆抗体和工程化抗体衍生物的制备和使用),施普林格(Springer Verlag)(2000年12
月15;第一版)。
[0245] 底物
[0246] 本文所述的组合物和方法可以用于由合适的底物产生脂肪醛。尽管不希望被理论所约束,还是认为本文所述的多肽通过还原机制由底物产生脂肪醛。在一些情况下,所述底
物是脂肪酸衍生物(例如脂肪酸),并且具有特定分支模式和碳链长度的脂肪醛可以由具
有那些会导致所需脂肪醛的特定特征的脂肪酸衍生物产生。
[0247] 因此,可以修饰导致脂肪酸衍生物底物的产生的生物合成途径中的每一个步骤以产生或过量产生目的底物。例如,可以在宿主细胞中表达、超表达或减弱参与脂肪酸生物合
成途径或脂肪醛途径的已知基因,以产生所需底物(参见,例如PCT/US08/058788)。示例性
基因提供于图5中。
[0248] 底物的合成
[0249] 脂肪酸合酶(FAS)是一组催化酰基链的起始和延长的多肽(Marrakchi et al.,Biochemical Society,30:1050-1055,2002)。酰基载体蛋白(ACP)以及FAS途径中的酶控
制所产生的脂肪酸衍生物的长度、饱和度和分支。脂肪酸生物合成途径涉及前体乙酰CoA
和丙二酰CoA。该途径中的步骤由脂肪酸生物合成(fab)和乙酰CoA羧化酶(acc)基因家
族的酶催化(参见,例如Heath et al.,Prog.Lipid Res.40(6):467-97(2001))。
[0250] 可以通过重组表达或超表达一种或多种脂肪酸合酶基因,例如乙酰CoA和/或丙二酰CoA合酶基因,工程化宿主细胞以表达脂肪酸衍生物底物。例如,为了增加乙酰CoA
产生,可以在宿主细胞中表达一个或多个以下基因:pdh(包含aceEF(编码丙酮酸和2-酮
戊二酸脱氢酶复合物的E1p脱氢酶组分和E2p二氢硫辛酰胺酰基转移酶组分,和lpd)的
多酶复合物)、panK、fabH、fabD、fabG、acpP和fabF。这些基因的示例性GenBank登录号
为:pdh(BAB34380、AAC73227、AAC73226)、panK(也称为CoA、AAC76952)、aceEF(AAC73227、AAC73226)、fabH(AAC74175)、fabB(P0A953)、fabD(AAC74176)、fabG(AAC74177)、
acpP(AAC74178)、fabF(AAC74179)。此外,可以通过用含有相应基因的无效或缺失突变的
条件复制或非复制质粒进行转化或通过取代启动子或增强子序列,在工程化的宿主细胞中
减弱或敲除fadE、gpsA、ldhA、pflb、adhE、pta、poxB、ackA和/或ackB的表达水平。这
些基因的示例性GenBank登录号为:fadE(AAC73325)、gspA(AAC76632)、ldhA(AAC74462)、
pflb(AAC73989)、adhE(AAC74323)、pta(AAC75357)、poxB(AAC73958)、ackA(AAC75356)和
ackB(BAB81430)。得到的宿主细胞当在合适的环境中生长时,会具有增加的乙酰CoA产生
水平。
[0251] 可以通过将accABCD(例如登录号AAC73296、EC 6.4.1.2)引入宿主细胞影响丙二酰CoA的超表达。可以通过将编码脂肪酶的DNA序列(例如,登录号CAA89087、CAA98876)
引入宿主细胞,在宿主细胞中进一步超表达脂肪酸。
[0252] 此外,抑制PlsB可以导致长链酰基ACP的水平增加,这会抑制途径中的早期步骤(例如,accABCD、fabH和fabI)。plsB(例如,登录号AAC77011)D311E突变可以用于增加可
用的脂肪酸的量。
[0253] 此外,可以工程化宿主细胞以超表达sfa基因(fabA的抑制基因,例如,登录号AAN79592),从而增加单不饱和脂肪酸的产生(Rock et al.,J.Bacteriology 178:
5382-5387,1996)。
[0254] 通过修饰所选择的硫酯酶的表达,可以选择脂肪酸衍生物底物的链长度。硫酯酶影响产生的脂肪酸的链长度。因此,可以工程化宿主细胞以表达、超表达、具有减弱表达或
不表达一种或多种选择的硫酯酶以增加优选的脂肪酸衍生物底物的产生。例如,C10脂肪酸
可以通过表达具有产生C10脂肪酸偏向性的硫酯酶并减弱具有产生除了C10脂肪酸外的脂肪
酸的偏向性的硫酯酶(例如,优选产生C14脂肪酸的硫酯酶)来产生。这会导致碳链长度为
10的脂肪酸的相对同种群体。在仍然其他情况下,C14脂肪酸可以通过减弱产生非C14脂肪
酸的内源硫酯酶并且表达使用C14-ACP的硫酯酶来产生。在一些情况下,C12脂肪酸可以通
过表达使用C12-ACP的硫酯酶并且减弱产生非C12脂肪酸的硫酯酶来产生。使用本领域已知
的方法可以证实乙酰CoA、丙二酰CoA和脂肪酸的过量产生,例如,通过在细胞裂解后使用
放射性操作、HPLC或GC-MS。可以用于本文所述的方法中的硫酯酶的非限制性实例在表1
中列出。
[0255] 表1:硫酯酶
[0256]
[0257] *Mayer et al.,BMC Plant Biology 7:1-11,2007
[0258] 在其他情况下,在宿主细胞中表达脂肪醛生物合成多肽或其变体或片段,所述宿主细胞含有导致所述宿主细胞中增加水平的脂肪酸的天然存在的突变。在一些情况下,遗
传工程化所述宿主细胞以相对于野生型宿主细胞增加所述宿主细胞中脂肪酸的水平。例
如,可以遗传工程化宿主细胞以相对于野生型宿主细胞表达降低水平的酰基CoA合酶。在
一实施方案中,通过遗传工程化“敲除”的宿主细胞以降低一个或多个基因(例如,酰基CoA
合酶基因)的表达水平。
[0259] 可以降低或敲除宿主细胞中任何已知的酰基CoA合酶基因。酰基CoA合酶基因的非限制性实例包括,fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白ZP_01644857的基因。酰基CoA合酶基因
的具体实例包括,来自结核分枝杆菌(M.tuberculosis)H37Rv[NP_217021]的fadDD35、来
自结核分枝杆菌H37Rv[NP_217464]的fadDD22、来自大肠杆菌[NP_416319]的fadD、来自
大肠杆菌[YP 416216]的fadK、来自不动杆菌(Acinetobacter sp.)ADP1[YP_045024]的
fadD、来自流感嗜血菌(Haemophilus influenza)RdkW20[NP_438551]的fadD、来自沼泽红
假单胞菌(Rhodopseudomonas palustris)Bis B18[YP 533919]的fadD、来自耐碱芽孢杆
菌(Bacillus halodurans)C-125[NP_243969]的BH3101、来自荧光假单胞菌(Pseudomonas
fluorescens)Pfo-1[YP 350082]的Pfl-4354、来自睾丸酮丛毛单胞菌(Comamonas
testosterone)KF-I[ZP_01520072]的EAV15023、来 自枯 草 芽 孢 杆菌 (B.subtilis)
[NP_388908]的yhfL、来自铜绿假单胞菌(P.aeruginosa)PAO1[NP_251989]的fadD1、来
自青枯菌(Ralstonia solanacearum)GM1 1000[NP_520978]的fadD1、来自铜绿假单胞
菌PAO1[NP 251990]的fadD2、来自嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)
R551-3的编码蛋白ZP_01644857的基因、来自酿酒酵母[NP_012257]的faa3p、来自酿酒
酵母[NP_014962]的faa1p、来自枯草芽孢杆菌[CAA99571]的lcfA,或描述于Shockey
et al.,Plant.Physiol.129:1710-1722,2002;Caviglia et al,J.Biol.Chem.279:
1163-1169,2004;Knoll et al.,J.Biol.Chem.269(23):16348-56,1994;Johnson et al.,J.Biol.Chem.269:18037-18046,1994和Black et al.,J.Biol Chem.267:25513-25520,
1992的那些基因。
[0260] 分支脂肪醛的形成
[0261] 通过使用分支脂肪酸衍生物作为底物,可以产生含有分支点的脂肪醛。例如,虽然大肠杆菌天然产生直链脂肪酸(sFAs),但是可以通过在大肠杆菌中引入且表达或超表达提
供分支前体的基因(例如bkd、ilv icm和fab基因家族)工程化大肠杆菌,以产生支链脂
肪酸(brFAs)。此外,可以工程化宿主细胞以表达或超表达编码用于brFAs的延长的蛋白的
基因(例如ACP、FabF等),和/或缺失或减弱通常导致sFAs的相应宿主细胞基因。
[0262] 形成brFAs中的第一步是通过支链氨基酸氨基转移酶产生相应α-酮酸。宿主细胞可以内源包括编码这些酶的基因或这些基因可以被重组引入。例如,大肠杆菌内源表达
这样的酶I1vE(EC 2.6.1.42;GenBank登录YP_026247)。在一些宿主细胞中,可以不表达
异源支链氨基酸氨基转移酶。但是,大肠杆菌I1vE或任何其他支链氨基酸氨基转移酶(例
如,来自乳酸乳球菌(Lactococcus lactis)的I1vE(GenBank登录AAF34406)、来自恶臭
假单胞菌(Pseudomonas putida)的I1vE(GenBank登录NP_745648)或来自天蓝色链霉菌
(Streptomyces coelicolor)的I1vE(GenBank登录NP629657)),如果不是内源的,可以被
引入。
[0263] 在另一实施方案中,α酮酸的产生可以通过使用Atsumi et al.,Nature451:86-89,2008所述的方法实现。例如,2-酮异戊酸可以通过超表达编码I1vI、I1vH、I1vC或
I1vD的基因产生。在另一实例中,2-酮-3-甲基-戊酸酯可以通过超表达编码I1vA和I1vI、
I1vH(或枯草芽孢杆菌的AlsS)、I1vC、I1vD或它们的相应同系物的基因产生。在另一实施
方案中,2-酮-4-甲基-戊酸酯可以通过超表达编码I1vI、I1vH、I1vC、I1vD和LeuA、LeuB、
LeuC、LeuD或它们的相应同系物的基因产生。
[0264] 第二步是将α酮酸氧化脱羧为相应的支链酰基CoA。该反应可以由支链α-酮酸脱氢酶复合物(bkd;EC 1.2.4.4.)(Denoya et al.,J.Bacteriol.177:3504,1995)催化,
该复合物由E1α/β(脱羧酶)、E2(二氢硫辛酸转酰酶)和E3(二氢硫辛酸脱氢酶)亚基
组成。这些支链α/酮酸脱氢酶复合物与丙酮酸和α-酮戊二酸脱氢酶复合物相似。具有
brFAs和/或生长在支链氨基酸上的任何微生物可以用作分离用于在例如大肠杆菌的宿主
细胞中表达的bkd基因的来源。此外,大肠杆菌具有E3组分,作为其丙酮酸脱氢酶复合物
(lpd、EC 1.8.1.4、GenBank登录NP_414658)的一部分。因此,仅表达E1a/β和E2b bkd
基因就足够了。表2列出了来自几种微生物的、可以在宿主细胞中重组引入并表达以提供
支链酰基CoA前体的bkd基因的非限制性实例。
[0265] 表2.来自选择的微生物的Bkd基因
[0266]
[0267] 在另一实例中,通过丁烯酰CoA还原酶(Ccr、EC 1.6.5.5、1.1.1.1)和异丁酰CoA变位酶(大亚基IcmA、EC 5.4.99.2;小亚基IcmB、EC 5.4.99.2)的共表达,异丁酰CoA可以
在宿主细胞中产生,例如在大肠杆菌中(Han和Reynolds,J.Bacteriol.179:5157,1997)。
丁烯酰CoA是大肠杆菌和其他微生物中脂肪酸生物合成的中间体。来自所选微生物的ccr
和icm基因的非限制性实例在表3中列出。
[0268] 表3.来自选择的微生物的Ccr和icm基因
[0269]
[0270] 除bkd基因的表达外,brFA生物合成的起始利用对支链酰基CoA具有特异性的β-酮脂酰-酰基-载体-蛋白合酶III(FabH、EC 2.3.1.41)(Li et al.,
J.Bacteriol.187:3795-3799,2005)。这些FabH酶的非限制性实例在表4中列出。参与任
何含有brFA的微生物的脂肪酸生物合成的fabH基因可以在宿主细胞中表达。来自不天然
产生brFA的宿主细胞的Bkd和FabH酶可能不支持brFA产生。因此,可以重组表达bkd和
fabH。可以将含有bkd和fabH基因的载体插入这样的宿主细胞中。同样,Bkd和FabH产
生的内源水平可能不足以产生brFA。这种情况下,可以超表达它们。此外,可以表达或超
表达脂肪酸生物合成途径的其他组分,例如酰基载体蛋白(ACPs)和β-酮脂酰-酰基-载
体-蛋白合酶II(fabF、EC 2.3.1.41)(候选者的非限制性实例在表4中列出)。除表达这
些基因外,可以在宿主细胞中减弱内源脂肪酸生物合成途径中的一些基因(例如,大肠杆
菌基因fabH(GenBank登录号NP_415609)和/或fabF(GenBank登录号NP_415613))。
[0271] 表4.来自选择的具有brFAs的微生物的FabH、ACP和fabF基因
[0272]
[0273] 环状脂肪醛的形成
[0274] 通过使用环状脂肪酸衍生物作为底物,可以产生环状脂肪醛。为了产生环状脂肪酸衍生物底物,可以将提供环状前体的基因(例如ans、chc和plm基因家族)引入宿
主细胞并使其表达,以允许由环状前体起始脂肪酸生物合成。例如,为了将例如大肠杆菌
的宿主细胞转变为能够合成ω-环状脂肪酸(cyFA)的细胞,可以在宿主细胞中引入并表
达提供环状前体环己基羰基CoA(CHC-CoA)的基因(Cropp et al.,Nature Biotech.18:
980-983,2000)。在大肠杆菌中提供CHC-CoA的基因的非限制性实例包括:来自山丘链霉
菌(Streptomyces collinus)的安莎三烯(ansatrienin)基因簇的ansJ、ansK、ansL、chcA
和ansM(Chen et al.,Eur.J.Biochem.261:98-107,1999)或来自链霉菌(Streptomyces
sp.)HK803的磷内酯霉素B(phoslactomycin B)基因簇的plmJ、plmK、plmL、chcA和
plmM(Palaniappan et al.,J.Biol.Chem.278:35552-35557,2003),以及来自山丘链霉菌、阿维链霉菌(S.avermitilis)或天蓝色链霉菌的chcB基因(Patton et al.,Biochem.39:
7595-7604,2000)(参见表5)。然后,可以表达表4中所列的基因,以允许ω-环状脂肪酸
的起始和延长。可选地,可以从产生cyFA的微生物中分离同源基因并在宿主细胞(例如大
肠杆菌)中表达该同源基因。
[0275] 表5.用于合成CHC-CoA的基因
[0276]
[0277] *仅chcA在GenBank条目U72144中注释,ansJKLM是根据Chen et al.(Eur.J.Biochem.261:98-107,1999)。
[0278] 表4中列出的基因(fabH、ACP和fabF)允许ω-环状脂肪酸的起始和延长,因为它们具有宽泛的底物特异性。如果任何这些基因与表5中列出的基因的共表达不产生cyFA,
则可以分离(例如通过使用简并PCR引物或异源DNA序列探针)并共表达来自产生cyFAs
的微生物的fabH、ACP和/或fabF同系物(例如表6中列出的那些)。
[0279] 表6.含有ω-环状脂肪酸的微生物的非限制性实例
[0280]
[0281] *利用环庚基羰基-CoA而不是环己基羰基-CoA作为cyFA生物合成的前体
[0282] 脂肪醛饱和水平
[0283] 通过调节脂肪酸中间体的饱和度,可以控制脂肪酸的饱和度。例如,可以表达、超表达或以降低水平表达sfa、gns和fab基因家族以控制脂肪酸的饱和。图5列出了这些基
因家族中可以用于本文所述的方法和宿主细胞的基因的非限制性实例。图6列出了其他的
fabA相关基因而图7列出了其他的fabB相关基因。
[0284] 例如,通过工程化生产宿主以超表达fabB或通过使生产宿主在低温生长(例如低于37C),可以工程化宿主细胞以产生不饱和脂肪酸。FabB偏爱顺式δ3癸烯酰ACP并导致
大肠杆菌中不饱和脂肪酸产生。fabB的超表达导致显著百分比的不饱和脂肪酸的产生(de
Mendoza et al.,J.Biol.Chem.258:2098-2101,1983)。基因fabB可以在不是天然具有该
基因的宿主细胞中插入和表达。然后,这些不饱和脂肪酸可以在被工程化的宿主细胞中用
作产生脂肪酸衍生物的中间物,例如脂肪醛。
[0285] 在其他情况下,可以缺失脂肪酸生物合成的阻抑物,例如fabR(GenBank登录NP_418398),这也可以导致大肠杆菌中不饱和脂肪酸产生的增加(Zhang et al.,J.Biol.
Chem.277:15558,2002)。可以在其他宿主细胞中进行相似的缺失。例如,通过超表达
fabM(反式-2、顺式-3-癸烯酰-ACP异构酶、GenBank登录DAA05501)和来自肺炎链球
菌(Streptococcus pneumoniae)的fabK(反式-2-烯酰-ACP还原酶II,GenBank登录
NP_357969)的受控表达(Marrakchi et al.,J.Biol.Chem.277:44809,2002),同时缺失大
肠杆菌fabI(反式-2-烯酰-ACP还原酶,GenBank登录NP_415804),可以实现不饱和脂肪
酸的进一步增加。在一些实例中,可以减弱内源fabF基因,从而增加所产生的棕榈油酸酯
(C16:1)的百分比。
[0286] 在仍然其他实例中,通过降低sfa、gns和/或fab基因的表达,可以工程化宿主细胞以产生饱和脂肪酸。
[0287] 在一些情况下,可以工程化宿主细胞以表达减弱水平的脱水酶/异构酶和/或酮脂酰-ACP合酶。例如,可以工程化宿主细胞以表达降低水平的fabA、fabB、图6中列出的
基因和/或图7中列出的基因。在一些情况下,所述宿主细胞可以在不饱和脂肪酸的存在
下生长。在其他情况下,还可以工程化所述宿主细胞以表达或超表达编码去饱和酶的基因。
去饱和酶的一个非限制性实例是枯草芽孢杆菌DesA(AF037430)。编码去饱和酶的其他基
因是领域内已知的并可用于本文所述的宿主细胞和方法,例如使用诸如十六酰基-ACP或
十八酰基-ACP的酰基-ACP的去饱和酶。如本文所述,饱和脂肪酸可被用于产生诸如脂肪
醛的脂肪酸衍生物。
[0288] 遗传工程化宿主细胞以产生脂肪醛
[0289] 如本文所述,可以用各种宿主细胞产生脂肪醛。宿主细胞可以是任何原核或真核细胞。例如,本文所述的多肽可以在细菌细胞(例如大肠杆菌)、昆虫细胞、酵母或哺乳动物
细胞(例如中国仓鼠卵巢细胞(CHO)细胞、COS细胞、VERO细胞、BHK细胞、HeLa细胞、Cv1
细胞、MDCK细胞、293细胞、3T3细胞或PC12细胞)中表达。其他示例性的宿主细胞包括来
自以下属的成员的细胞:埃希氏菌属、芽孢杆菌属、乳酸杆菌属、红球菌属、假单胞菌属、曲霉属、木霉属、脉孢菌属、镰刀菌属、腐质霉属、根毛霉属、克鲁维酵母菌属、毕赤酵母属、毛霉菌属、蚀丝霉属、青霉属、平革菌属、侧耳属、栓菌属、金黄孢子菌属、酵母属、裂殖酵母属、耶氏酵母属或链霉菌属。其他示例性的宿主细胞可以是迟缓芽孢杆菌细胞、短芽孢杆菌细
胞、嗜热脂肪芽孢杆菌细胞、地衣芽孢杆菌细胞、嗜碱芽孢杆菌细胞、凝结芽孢杆菌细胞、环状芽孢杆菌细胞、短小芽孢杆菌细胞、苏云金芽孢杆菌细胞、克劳氏芽孢杆菌细胞、巨大芽
孢杆菌细胞、枯草芽孢杆菌细胞、解淀粉芽孢杆菌细胞、康氏木霉细胞、绿色木霉细胞、里氏木霉细胞、长枝木霉细胞、泡盛曲霉细胞、烟曲霉细胞、臭曲霉细胞、构巢曲霉细胞、黑曲霉细胞、米曲霉细胞、特异腐质霉细胞、棉毛状腐质霉细胞、米黑根毛霉细胞、米黑毛酶细胞、浅青紫链霉菌细胞、鼠灰链霉菌细胞或放线菌细胞。其他宿主细胞是蓝细菌宿主细胞。
[0290] 在优选的实施方案中,所述宿主细胞是大肠杆菌细胞、酿酒酵母细胞或枯草芽孢杆菌细胞。在更优选的实施方案中,所述宿主细胞来自大肠杆菌菌株B、C、K或W。其他合
适的宿主细胞对于本领域技术人员是已知的。
[0291] 可以用于本文所述的方法的其他宿主细胞描述于WO2009/111513和WO2009/111672。
[0292] 本领域熟知的各种方法可以用于遗传工程化宿主细胞以产生脂肪醛。所述方法可以包括使用载体,优选表达载体,所述载体含有编码本文所述的脂肪醛生物合成多肽或其
多肽变体或片段的核酸。本领域技术人员会意识到多种病毒载体(例如,逆转录病毒载体、
慢病毒载体、腺病毒载体和腺相关病毒载体)和非病毒载体可以用于本文所述的方法。
[0293] 本文所述的重组表达载体包括以适于核酸在宿主细胞中表达的形式的本文所述的核酸。所述重组表达载体可以包括一个或多个基于将被用于表达的宿主细胞所选择的
控制序列。所述控制序列可操作地连接到待表达的核酸序列。这些控制序列描述于,例如
Goeddel,Gene Expression Technology:Methods in Enzymology(基因表达技术:酶学方
法)185,Academic Press,San Diego,Calif.(1990)。控制序列包括在许多类型的宿主细
胞中指导核苷酸序列的组成型表达的那些控制序列,和仅在某些宿主细胞中指导核苷酸序
列的表达的那些控制序列(例如组织特异性调节序列)。本领域技术人员应当理解到,表达
载体的设计可以取决于例如待转化的宿主细胞的选择、所需蛋白的表达水平等因素。可以
将本文所述的表达载体引入宿主细胞,以产生本文所述核酸所编码的多肽,包括融合多肽。
[0294] 可以设计重组表达载体用于在原核或真核细胞(例如,例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞)中表达脂肪醛生物合
成多肽或变体。适合的宿主细胞在Goeddel,Gene Expression Technology:Methods in
Enzymology(基因表达技术:酶学方法)185,Academic Press,San Diego,Calif.(1990)中
进一步作了详细讨论。可选地,所述重组表达载体可以在体外进行转录和翻译,例如通过使
用T7启动子调节序列和T7聚合酶。
[0295] 最经常用含有指导融合或非融合多肽表达的组成型或诱导型启动子的载体在例如大肠杆菌的原核生物中进行多肽的表达。融合载体将许多氨基酸添加到其中编码的多
肽,通常添加到重组多肽的氨基末端。这些融合载体通常担任3个用途:(1)增加重组多肽
的表达;(2)增加重组多肽的可溶性;和(3)通过作为亲和纯化中的配体,帮助重组多肽的
纯化。通常,在融合表达载体中,在融合部分和重组多肽的连接处引入蛋白水解切割位点。
这使得在融合多肽纯化后,重组多肽能够从融合部分分离。这些酶的实例及其同源识别序
列包括Xa因子、凝血酶和肠激酶。示例性的融合表达载体包括pGEX(Pharmacia Biotech
Inc;Smith et al.,Gene(1988)67:31-40)、pMAL(New England Biolabs,Beverly,Mass.)和pRITS(Pharmacia,Piscataway,N.J.),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E
结合蛋白或蛋白A融合到靶重组多肽。
[0296] 诱导型、非融合大肠杆菌表达载体的实例包括pTrc(Amann et al.,Gene(1988)69:301-315) 和 pET 11d(Studier et al.,Gene Expression Technology:
Methods in Enzymology(基因表达技术:酶学方法)185,Academic Press,San Diego,
Calif.(1990)60-89)。从pTrc载体表达靶基因依赖于由杂合trp-lac融合启动子的宿主
RNA聚合酶转录。从pET 11d载体表达靶基因依赖于来自共表达的病毒RNA聚合酶(T7gn1)
所介导的T7gn10-lac融合启动子的转录。该病毒聚合酶由来自携带T7gn1基因的定居入
原噬菌体的宿主菌株BL21(DE3)或HMS174(DE3)提供,所述T7gn1基因受lacUV 5启动子
的转录控制。
[0297] 使重组多肽表达最大化的一种策略是,在具有受损的蛋白水解切割所述重组多肽的能力的宿主细胞中表达多肽(参见Gottesman,Gene Expression Technology:Methods
in Enzymology(基因表达技术:酶学方法)185,Academic Press,San Diego,Calif.
(1990)119-128)。另一策略是改变待插入表达载体中的核酸序列,这样每个氨基酸的单
独密码子是所述宿主细胞优选使用的那些密码子(Wada et al.,Nucleic Acids Res.
(1992)20:2111-2118)。通过标准DNA合成技术可以进行该核酸序列的改变。
[0298] 在另一实施方案中,所述宿主细胞是酵母细胞。在该实施方案中,表达载体是酵母表达载体。用于在酿酒酵母中表达的载体的实例包括pYepSec1(Baldari et al.,EMBO
J.(1987)6:229-234)、pMFa(Kurjan et al.,Cell(1982)30:933-943)、pJRY88(Schultz et al.,Gene(1987)54:113-123)、pYES2(Invitrogen Corporation,San Diego,Calif.)和
picZ(Invitrogen Corp,San Diego,Calif.)。
[0299] 可选地,使用杆状病毒表达载体,可以在昆虫细胞中表达本文所述的多肽。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白的杆状病毒载体包括,例如pAc系
列(Smith et al.,Mol.Cell Biol.(1983)3:2156-2165)和pVL系列(Lucklow et al.,
Virology(1989)170:31-39)。
[0300] 在又一实施方案中,使用哺乳动物表达载体,可以在哺乳动物细胞中表达本文所述的核酸。哺乳动物表达载体的实例包括pCDM8(Seed,Nature(1987)329:840)和
pMT2PC(Kaufman et al.,EMBO J.(1987)6:187-195)。当用于哺乳动物细胞中时,表达载体的控制功能可以由病毒调节元件提供。例如,通常使用的启动子来自多瘤病毒、腺病毒2、
巨细胞病毒和猿猴病毒40。对于原核和真核细胞都合适的其他表达系统描述于Sambrook
et al.,eds.,Molecular Cloning:A Laboratory Manual.2nd(分子克隆:实验手册,第2
版),ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989的16和17章中。
[0301] 通过常规转化或转染技术可以将载体引入原核或真核细胞。如本文所用,术语“转化”和“转染”是指许多本领域公认的用于将外源核酸(例如DNA)引入宿主细胞的技术,包
括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂转染或电穿孔。用于转化或转染宿
主细胞的合适的方法可以见于例如Sambrook et al.(同上)。
[0302] 对于细菌细胞的稳定转化,已知的是,根据所用的表达载体和转化技术,仅小部分的细胞会摄入并复制所述表达载体。为了鉴定和选择这些转化体,可以将编码选择标记
(例如抗生素抗性)的基因伴随目的基因引入宿主细胞中。选择标记包括赋予药物抗性的
那些标记,所述药物诸如氨苄西林、卡那霉素、氯霉素或四环素。编码选择标记的核酸可以
在与编码本文所述的多肽相同的载体上被引入宿主细胞或可以在单独的载体上被引入。可
以通过药物选择鉴定被引入的核酸稳定转染的细胞(例如,具有并入的选择标记基因的细
胞会存活,而其他细胞死亡)。
[0303] 对于哺乳动物细胞的稳定转染,已知的是,根据使用的表达载体和转染技术,仅小部分的细胞可以将外源DNA整合到其基因组中。为了鉴定和选择这些整合体,可以将编码
选择标记(例如抗生素抗性)的基因伴随目的基因引入宿主细胞中。优选的选择标记包括
赋予药物抗性的那些标记,所述药物诸如G418、潮霉素和甲氨蝶呤。编码选择标记的核酸可
以在与编码本文所述的多肽相同的载体上被引入宿主细胞或可以在单独的载体上被引入。
可以通过药物选择鉴定用引入的核酸稳定转染的细胞(例如,具有并入的选择标记基因的
细胞会存活,而其他细胞死亡)。
[0304] 转运蛋白
[0305] 转运蛋白可以将多肽和有机化合物(例如脂肪醛)输出宿主细胞。很多转运和外排蛋白用于排出种类广泛的化合物并且可以被天然修饰,从而对于特定类型的碳氢化合物
具有选择性。
[0306] 合适的转运蛋白的非限制性实例是ATP结合盒(ABC)转运蛋白、外排蛋白和脂肪酸转运蛋白(FATP)。合适的转运蛋白的其他非限制性实例包括来自诸如秀丽隐
杆线虫(Caenorhabditis elegans)、拟南芥(Arabidopsis thalania)、真养产碱杆菌
(Alkaligenes eutrophus)和红平红球菌(Rhodococcus erythropolis)的有机体的ABC转
运蛋白。示例性的可以使用的ABC转运蛋白在图5中列出(例如CER5、AtMRP5、AmiS2和
AtPGP1)。宿主细胞也可以对于其分泌有机化合物的内源能力进行选择。有机化合物产生
和分泌进入宿主细胞环境(例如培养基、发酵液)的效率可以表达为细胞内产物与细胞外
产物的比值。在一些实施例中,该比值可以为约5∶1、4∶1、3∶1、2∶1、1∶1、1∶2、
1∶3、1∶4或1∶5。
[0307] 发酵
[0308] 通过使用有益发酵技术,可以增强脂肪醛的产生和分离。使产量最大化同时降低费用的一种方法是增加被转化为碳氢化合物产物的碳源的百分比。
[0309] 在正常的细胞生命周期中,碳被用于细胞功能,例如产生脂质、糖类、蛋白质、有机酸和核酸。降低生长相关活性所需的碳的量可以增加碳源转化为产物的效率。这可以通过例如首先使宿主细胞生长到所需密度(例如,在生长对数期峰值所达到的密度)来实现。
在这点上,可以使用复制检查点基因(replication checkpoint gene)阻止细胞生长。具
体而言,群体感应机制(quorum sensing mechanisms)(综述于Camilli et al.,Science
311:1113,2006;Venturi FEMS Microbio.Rev.30:274-291,2006;和Reading et al.,FEMS Microbiol.Lett.254:1-11,2006)可以用于激活例如p53、p21的检查点基因或其他检查点
基因。
[0310] 可以被激活以阻止大肠杆菌中细胞复制和生长的基因包括umuDC基因。umuDC基因的超表达阻止从静止期到指数性生长的进展(Murli et al.,J.of Bact.182:1127,
2000)。UmuC是可以对非编码损伤进行跨损伤修复(translesion synthesis)的DNA聚
合酶,所述非编码损伤是大部分UV和化学诱变的机制基础。umuDC基因产物参与跨损伤
修复的过程并且还作为DNA序列损伤检查点。umuDC基因产物包括UmuC、UmuD、umuD′、
UmuD′2C、UmuD′2和UmuD2。同时,产生产物的基因可以被激活,从而在产生脂肪醛的同
时,使对于待使用的复制和保持途径的需要最小化。通过用合适的终产物产生基因重新合
成umuC和umuD,可以工程化宿主细胞以在prpBCDE启动子系统下的pBAD24中表达来自大
肠杆菌的umuC和umuD。
[0311] 输入碳转化为脂肪醛的百分比是成本动因。该过程越有效,(即输入碳转化为脂肪醛的百分比越高)该过程的费用越低。对于含氧碳源(例如葡萄糖和其他基于碳水化合
物的来源),氧必须以二氧化碳的形式释放。对于每释放2个氧原子,1碳原子也被释放,这
导致约34%(w/w)的最大理论代谢效率(对于脂肪酸来源的产物)。但是,这个数字对于
其他有机化合物和碳源会发生变化。文献中的通常效率约低于5%。经工程化产生脂肪醛
的宿主细胞可以具有大于约1、3、5、10、15、20、25和30%的效率。在其他实例中,宿主细胞可以表现出约10%至约25%的效率。在其他实例中,这些宿主细胞可以表现出约25%至约
30%的效率。在其他实例中,宿主细胞可以表现出大于30%的效率。
[0312] 可以另外工程化宿主细胞以表达重组纤维小体,例如PCT申请第PCT/US2007/003736号中描述的那些。这些纤维小体可以允许宿主细胞使用纤维素原料作为碳
源。例如,可以另外工程化宿主细胞以表达转化酶(EC 3.2.1.26),这样蔗糖可以被用作
碳源。相似地,可以使用美国专利第5,000,000号、第5,028,539号、第5,424,202号、第
5,482,846号和第5,602,030号中描述的教导工程化宿主细胞,这样宿主细胞可以有效地
吸收碳并使用纤维素原料作为碳源。
[0313] 在一个实例中,发酵室可以将正在进行连续还原的发酵封闭。这种情况下,可以创造稳定的还原环境。通过二氧化碳的释放(以气体形式)可以保持电子平衡。提高NAD/H和
NADP/H平衡的努力也可以有助于稳定电子平衡。通过工程化宿主细胞以表达NADH:NADPH
转氢酶,也可以增强细胞内NADPH的可利用性。一个或多个NADH:NADPH转氢酶的表达将糖
酵解中产生的NADH转变为NADPH,所述NADPH可以增强脂肪醛的产生。
[0314] 对于小规模生产,工程化的的宿主细胞可以在例如约100mL、500mL、1L、2L、5L或10L的批量中生长;发酵;并且基于合适的质粒中所编码的特定基因,经诱导而表达所需
脂肪醛生物合成基因。对于大规模生产,工程化的宿主细胞可以在约10L、100L、1000L、
10,000L、100,000L、1,000,000L或更大的批量中生长;发酵;并且基于合适的质粒中所编
码的或并入所述宿主细胞基因组中的特定基因,经诱导而表达所需脂肪醛生物合成基因。
[0315] 例如,诸如大肠杆菌细胞的合适的生产宿主,其携带含有所需脂肪醛生物合成基因的质粒或具有整合到其基因组的脂肪醛生物合成基因,可以在合适的反应器内,例如,在
1L的反应器内,在补充了2%葡萄糖、羧苄青霉素和氯霉素的M9培养基中于37℃孵育20小
时。当培养物的OD600达到0.9时,用IPTG诱导生产宿主以活化工程化的基因系统用于产
生脂肪醛。孵育后,可以提取废培养基并且使用GC-MS检查有机相的脂肪醛的存在。
[0316] 在一些情况下,第一小时的诱导后,可以每小时移除不多于约10%的全部细胞体积的等分部分,并允许其静置而不摇动以允许脂肪醛上升至表面并经历自发的相分离或沉
淀。然后可以收集脂肪醛组分,并且将水相返回到反应室。可以连续操作反应室。当OD600
下降至0.6以下时,可以用生长自种子培养物的新批次替换细胞。
[0317] 使用无细胞方法产生脂肪醛
[0318] 在本文所述的一些方法中,可以使用本文所述的纯化的多肽和本文所述的底物产生脂肪醛。例如,可以工程化宿主细胞以表达如本文所述的脂肪醛生物合成多肽或变体。可
以在适于允许多肽表达的条件下培养宿主细胞。然后,可以使用已知方法产生无细胞提取
物。例如,可以使用去垢剂或通过超声处理裂解宿主细胞。可以使用已知方法纯化所表达
的多肽。获得无细胞提取物后,可以将本文所述的底物添加到所述无细胞提取物并保持在
允许所述底物转化为脂肪醛的条件下。然后,可以使用已知技术分离并纯化脂肪醛。
[0319] 产生后加工
[0320] 在发酵中产生的脂肪醛可以从发酵培养基中分离。可以使用用于从水性培养基分离脂肪醛的任何已知技术。一个示例性分离过程是两相(two phase)(两相(bi-phasic))
分离过程。该过程涉及使遗传工程化的宿主细胞在足以产生脂肪醛的条件下发酵,允许脂
肪醛收集在有机相中并从水性发酵液分离该有机相。该过程可以在批次和连续发酵过程中
实施。
[0321] 两相分离利用脂肪醛的相对不混溶性促进分离。不混溶是指化合物相对不溶于水的能力并且由化合物的分配系数定义。本领域技术人员应当理解到,通过选择发酵液和有
机相,使产生的脂肪醛具有高logP值,在发酵容器中脂肪醛即使处于非常低的浓度也可以
分离到有机相。
[0322] 通过本文所述的方法产生的脂肪醛在发酵液以及细胞质中可以是相对不混溶的。因此,脂肪醛可以细胞内或细胞外地收集在有机相中。有机相中产物的收集可以减轻脂肪
醛对细胞功能的影响并可以允许宿主细盹产生更多产物。
[0323] 本文所述的方法可以导致同种化合物的产生,其中至少约60%、70%、80%、90%或95%的产生的脂肪醛会具有改变少于约6个碳、少于约4个碳或少于约2个碳的碳链长
度。也可以产生具有相对一致的饱和度的这些化合物。这些化合物可以直接用作燃料、燃
料添加剂、用于生产其他化学化合物(例如聚合物、表面活性剂、塑料、纺织品、溶剂、粘合剂等)的起始原料或个人护理添加剂。这些化合物也可以用作例如氢化、催化裂解(通过
氢化、热解或两者)的后续反应的原料以制造其他产品。
[0324] 在一些实施方案中,使用本文所述的方法产生的脂肪醛可以含有约50%至约90%的碳;或约5%至约25%的氢。在其他实施方案中,使用本文所述的方法产生的脂肪醛
可以含有约65%至约85%的碳;或约10%至约15%的氢。
[0325] 生物产品
[0326] 包含生物学产生的有机化合物生物产品(例如,脂肪醛),特别是包含使用脂肪酸合成途径生物学产生的脂肪醛,还未从可再生资源产生过,并且由于如此,其是新的物质组
14
合物。基于双重碳同位素指纹谱或 C测定年代法,这些新生物产品可以区别于来自石化产
品的碳的有机化合物。此外,可以通过双重碳同位素指纹谱确定生物来源的碳的具体来源
(例如葡萄糖与甘油相比)(参见,例如美国专利第7,169,588号,该美国专利以引用的方式
并入本文中)。
[0327] 区别生物产品与基于石油的有机化合物的能力对于在商业中追踪这些材料是有益的。例如,包含基于生物学的和基于石油的碳同位素谱两者的有机化合物或化学品可以
区别于仅由基于石油的原料制造的有机化合物和化学品。因此,可以根据所述即时材料独
特的碳同位素谱在商业中追踪它们。
[0328] 通过比较每份燃料中稳定的碳同位素比(13C/12C),可以区别生物产品与基于石油13 12 13 12
的有机化合物。给定的生物产品中 C/ C比是二氧化碳固定时大气二氧化碳中的 C/ C比
的结果。它还反映精确的新陈代谢途径。还存在区域变化。石油、C3植物(阔叶植物)、C4
13 12 13
植物(草)和海洋碳酸盐均表现出 C/ C比和相应的δ C值的显著差异。此外,作为新陈
代谢途径的结果,C3和C4植物的脂质物质与来自相同植物的碳水化合物的材料分析上是不
同的。
[0329] 在测量的精度之内,由于同位素分馏效应,13C表现出大量变化,对于生物产品最显著的同位素分馏效应是光合作用机制。植物碳同位素比中差异的主要原因与植物中光合碳新陈代谢途径中的差异密切相关,特别是在原初羧化期间发生的反应(即,大气CO2最初的
固定)中的差异。两大类植物是包含“C3”(或开尔文-本森)光合循环的那些植物和包含
“C4”(或哈奇-斯莱克)光合循环的那些植物。
[0330] C3植物中,原初CO2固定或羧化反应涉及核酮糖-1,5-二磷酸羧化酶,并且第一个稳定的产物是3-碳化合物。诸如阔叶树和针叶树的C3植物主要在温带气候带。
[0331] C4植物中,涉及另一个酶即磷酸烯醇式丙酮酸羧化酶的另外的羧化反应是原初羧化反应。第一个稳定的碳化合物是随后被脱羧基的4-碳酸。然后,通过C3循环重新固定
释放的CO2。C4植物的实例是热带草类、玉米和甘蔗。
[0332] C4和C3植物都表现出 13C/12C同位素比的范围,但是对于C4植物,典型值为约-7‰至约-13‰;对于C3植物,典型值为约-19‰至约-27‰(参见,例如,Stuiver et ah,
13
Radiocarbon 19:355,1977)。煤炭和石油通常落入此较后的范围。 C测量标尺最初通过
由Pee Dee Belemnite(PDB)石灰石所设定的零所定义,其中值是以从该物质的偏差的千分
13
比给出。“δ C”值以每千分比部分(千分)表达,简写为‰,并且按照以下计算:
[0333] δ13C(‰)=[(13C/12C)样品-(13C/12C)标准]/(13C/12C)标准x 1000
[0334] 由于PDB标准物质(RM)已被耗尽,IAEA、USGS、NIST和其他选择的国际同位素实13
验室合作开发了一系列的替代RM。从PDB的千分偏离的符号为δ C。通过高精度稳定同
位素比质谱仪对质量为44、45和46的CO2分子离子进行测量。
[0335] 本文所述的组合物包括由本文所述的任何方法产生的生物产品。具体而言,生物13
产品的δ C可以为约-28或更大、约-27或更大、-27或更大、-20或更大、-18或更大、-15
13
或更大、-13或更大或-8或更大。例如,生物产品的δ C可以为约-30至约-15、约-27至
约-19、约-25至约-21、约-15至约-5、约-13至约-7、约-13至约-10。在其他情况下,生
13
物产品的δ C可以为约-10、-11、-12或-12.3。
[0336] 还可以通过比较每种化合物中14C的量来区分生物产品与石油来源的有机化合14
物。因为 C具有5730年的核半衰期,包含“较老的”碳的基于石油的燃料可以区别于包含
“较新的”碳的生物产品(参见,例如Currie,″Source Apportionment of Atmospheric
Particles″,Characterization of Environmental Particles,J.Buffle and H.P.van
Leeuwen,Eds.,1 of Vol.I of the IUPAC Environmental Analytical Chemistry
Series(Lewis Publishers,Inc)(1992)3-74)。
[0337] 放射性碳测定年代法的基本假定是大气中的14C浓度的恒定导致活有机体中14C的14
恒定。然而,由于1950年开始的大气层核试验和1850年开始的化石燃料的燃烧,C获得
14
了第二地球化学时代特征。大气CO2中并且因此活的生物圈中 C的浓度在核试验的峰期,
14
20世纪60年代中期,大约加倍。然后,C的浓度以约7-10年的松弛“半衰期”逐渐回落到
-12
约1.2x 10 的恒稳态宇宙(大气)基线同位素比。(不必照字面意思理解这个后来的半
衰期;而是,自从核时代开始后,人们必须使用精细的大气核输入/衰变函数以追踪大气和
14
生物圈 C的变化)。
[0338] 正是这个后来的生物圈14C时代特征保证能每年对近期生物圈碳进行年代测定。14
可以通过加速器质谱(AMS),测量 C,结果以“现代碳比例”(fM)为单位给出。fM由国家标
准技术研究院(National Institute of Standards and Technology)(NIST)标准参考物
质(Standard Reference Materials)(SRMs)4990B和4990C定义。如本文所用的“现代碳
比例(fraction of modern carbon)”或“fM”与分别由称为草酸标准HOxI和HOxII的国家
标准技术研究院(National Institute of Standards and Technology(NIST))标准参考
14 12
物(SRMs)4990B和4990C所定义的具有相同意义。基本定义涉及0.95倍的 C/ C同位素
比例HOxI(参考AD 1950)。这粗略地等于衰变校正的工业革命前树木(decay-corrected
pre-Industrial Revolution wood)。对于现今生命生物圈(植物物质)而言,fM约为1.1。
[0339] 本发明可以提供具有至少约1的fM14C的生物产品。例如,所述生物产品可以具有14 14 14
至少约1.01的fM C、约1至约1.5的fM C、约1.04至约1.08的fM C或约1.111至1.124
14
的fM C。
[0340] 14C的另一测量也被称为现代碳百分比,pMC。对于使用14C定年法的考古学家或地质学家而言,公元1950年等于“零年龄”。这也代表100pMC。大气中“爆炸碳(bomb carbon)”在热核子武器高峰的1963年几乎达到正常水平的两倍。从爆炸碳出现开始,对其在大气中
的分布进行了评估,表现出大于公元1950年以后活着的植物和动物的100pMC的值。其随
着时间逐渐下降到约107.5pMC的现值。这意味着,诸如玉米的新鲜生物量材料,会产生约
14
107.5pMC的 C特征。基于石油的化合物的pMC值为0。将化石碳与现代的碳结合会导致
14
现代pMC含量的稀释。假定107.5pMC代表现代生物量材料的 C含量而0pMC代表基于石
14
油的产品的 C含量,则该材料测量的pMC值会反映两种组分类型的比例。例如,100%来
源于现代大豆的材料会产生约107.5pMC的放射性碳标记。如果该材料用基于石油的产品
50%稀释,它会产生约54pMC的放射性碳标记。
[0341] 通过指定“100%”等于107.5pMC和指定“0%”等于0pMC,推导出基于生物学的碳含量。例如,测得99pMC的样品会产生相当于93%的基于生物学的碳含量。该值称为平均
的基于生物学的碳结果,并且假定分析的材料中所有组分或者来源于现代的生物学材料或
者来源于基于石油的材料。
[0342] 本文所述的生物产品可以具有至少约50、60、70、75、80、85、90、95、96、97、98、99或100的pMC。在其他情况下,本文所述的生物铲平可以具有约50至约100、约60至约100、约70至约100、约80至约100、约85至约100、约87至约98、约90至约95的pMC。在仍然
其他情况下,本文所述的生物产品可以具有约90、91、92、93、94或94.2的pMC。
[0343] 在下文的实施例中将进一步说明本发明。仅以示例性目的提供实施例。这些实施例不被解释为以任何方式限制本发明的范围或内容。
实施例
[0344] 实施例1
[0345] 羧酸还原酶(CAR)同系物的鉴定
[0346] 来自诺卡氏菌(Nocardia sp.)NRRL 5646菌株的羧酸还原酶(CAR)可以将羧酸还原为相应的醛,而不需要诸如酰基-CoA合酶的不同的活化酶(Li et al.,
J.Bacteriol.179:3482-3487,1997;He et al.,Appl.Environ.Microbiol.70:1874-1881,
2004))。使用NRRL 5646 CAR氨基酸序列(Genpept登录号AAR91681)作为查询序列进行
BLAST搜索鉴定出约20个同源序列。评估了表7中列出的三个同系物在大肠杆菌中表达
时将脂肪酸转化为脂肪醛的能力。在核苷酸序列水平,carA(SEQ ID NO:19)、carB(SEQ ID NO:21)和fadD9(SEQ ID NO:17)分别表现出与诺卡氏菌NRRL 5646的car基因(AY495697)
(SEQ ID NO:15)的62.6%、49.4%和60.5%的同源性。在氨基酸水平,CARA(SEQ ID NO:
20)、CARB(SEQ ID NO:22)和FadD9(SEQ ID NO:18)分别表现出与诺卡氏菌NRRL 5646的
CAR(SEQ ID NO:16)的62.4%、59.4%和60.7%的同一性。
[0347] 表7:CAR样蛋白和相应的编码序列。
[0348]
[0349] 实施例2
[0350] 大肠杆菌中CAR同系物的表达
[0351] A.质粒构建
[0352] 构建三个大肠杆菌表达质粒,以表达编码表7中列出的CAR同系物的基因。首先,使用引物fadD9F和FadDR(参见表8)从结核分枝杆菌H37Rv(获自英属哥伦比亚大学,温哥
华,加拿大)的基因组DNA扩增fadD9。首先将PCR产物克隆进PCR-blunt(Invitrogen),
然后以NdeI-AvrII片段释放。然后将NdeI-AvrII片段克隆到pACYCDuet-1(Novogen)的
NdeI位点和AvrII位点之间,以产生pACYCDuet-1-fadD9。
[0353] 分别使用引物CARMCaF和CARMCaR或CARMCbF和CARMCbR(参见,表8),从耻垢分枝杆菌MC2155(获自ATTC(ATTC 23037D-5))的基因组DNA扩增carA和carB基因。首先
将PCR产物克隆进PCR-blunt,然后以NdeI-AvrII片段释放。然后将两个片段的每一个克
隆到pACYCDuet-1(Novogen)的NdeI位点和AvrII位点之间以产生pACYCDuet-1-carA和
pACYCDuet-1-carB。
[0354] 表8.用于扩增编码CAR同系物的引物
[0355]fadD9F cat ATGTCGATCAACGATCAGCGACTGAC(SEQ ID NO:1)
fadD9R cctagg TCACAGCAGCCCGAGCAGTC(SEQ ID NO:2)
CARMCaF cat ATGACGATCGAAACGCG(SEQ ID NO:3)
CARMCaR cctagg TTACAGCAATCCGAGCATCT(SEQ ID NO:4)
CARMCbF cat ATGACCAGCGATGTTCAC(SEQ ID NO:5)
CARMCbR cctagg TCAGATCAGACCGAACTCACG(SEQ ID NO:6)
[0356] B.脂肪醛产生评估
[0357] 将 编 码 CAR 同 系 物 的 质 粒 (pACYCDUET-fadD9、pACYCDUET-carA 和pACYCDUET-carB)分别与pETDuet-1-′tesA(描述于PCT/US08/058788中)共转化到大肠
杆菌C41(描述于PCT/US08/058788中)株中。
[0358] 使大肠杆菌转化体在3mL补充了羧苄青霉素(100mg/L)和氯霉素(34mg/L)的LB培养基中于37℃生长。过夜生长之后,将15μL培养物转移到2mL的补充了羧苄青霉素和
氯霉素的新鲜LB培养基中。生长3.5小时之后,将2mL的培养物转移到包含20mL具有2%
葡萄糖和羧苄青霉素和氯霉素的M9培养基的125mL烧瓶中。当培养物的OD600达到0.9时,
将1mM的IPTG加入到每个烧瓶中。在37℃生长20小时候,将20mL乙酸乙酯(具有1%的
乙酸,v/v)添加到每个烧瓶中以提取发酵期间产生的有机化合物。如下文所述,用GC/MS直
接分析粗乙酸乙酯提取物。
[0359] 无前导序列的′tesA和三个car基因中的任何一个在大肠杆菌中的共表达导致可检测的脂肪醛产生。在一次发酵中,LS9001/pACYCDUETcarB+pETDuet-1-′tesA产生平
均120mg/L的脂肪醛。十二醛的保留时间为6.959分钟,7-十四烯醛的保留时间为8.247
分钟,十四醛的保留时间为8.37分钟,9-十六烯醛的保留时间为9.433分钟,十六醛的保
留时间为9.545分钟并且11-十八烯醛的保留时间为10.945分钟。大量脂肪醛的存在与
CAR是产生醛的脂肪酸还原酶(AFAR)是一致的。该机制与诸如JjFAR的产生醇的脂肪酰
基-CoA还原酶(FAR)和诸如Acr1的脂肪酰基-CoA还原酶是不同的。
[0360] C.CAR同系物的底物偏向性
[0361] 观察到评估的三个CAR同系物之间不同的底物偏向性。FadD9相对于碳链长度大于12的其他脂肪酸表现出对C12脂肪酸的强烈偏向性。CarA和CarB都表现出比FadD9更
宽的底物范围。
[0362] D.脂肪醛的定量和鉴定
[0363] 使用装配有30m x 0.25mm(0.10μm膜)DB-5柱的Agilent 5975BMSD系统进行GC-MS。将柱温在100℃等温3分钟。以20℃/分钟的速率将柱从100℃程序化升温至320℃。
当达到终点温度时,将柱在320℃保持等温5分钟。进样体积为1μL。载体气体氦气的流
速为1.3mL/分钟。质谱仪装有电子轰击离子源。离子源温度设定为300℃。
[0364] 定量之前,使用两种方法鉴定多种醛。首先,将每种化合物的GC保留时间与诸如月桂醛(十二醛)的已知标准物的保留时间比较。然后,通过将化合物的质谱与质谱库中
标准物的质谱匹配确认每个化合物的鉴定。
[0365] 其他实施方案
[0366] 应当理解,尽管结合其具体描述,对本发明进行了描述,但之前的描述意欲说明而非限制由所附权利要求范围所定义的本发明范围。其他方面、优点和修改是在随后的权利
要求的范围之内。