修饰的赖氨酸脱羧酶转让专利

申请号 : CN201680091606.8

文献号 : CN110291101A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周豪宏陆文强陈玲刘修才

申请人 : 上海凯赛生物技术研发中心有限公司CIBT美国公司

摘要 :

本发明提供了与野生型赖氨酸脱羧酶相比,具有在碱性pH增加活性的突变的CadA多肽。本发明还提供了产生这种突变体多肽的方法、经过基因修饰以过表达这种突变体多肽的微生物,以及产生这种微生物的方法。

权利要求 :

1.一种CadA变体多肽,其在相应于参考SEQ ID NO:2确定的氨基酸276-509的区域中的谷氨酸残基包含至少一个氨基酸取代,其中所述谷氨酸残基位于蛋白表面,侧链朝向外部环境,位于所述蛋白缺少确定的二级结构的区段中,并且其中所述CadA变体多肽与SEQ ID NO:2-5任一个具有至少70%的相同性。

2.权利要求1的CadA变体多肽,其中所述取代位于选自位置291、344、355、463、482和

499的位置处的谷氨酸残基。

3.权利要求2的CadA变体多肽,其包含位于选自位置291、344、355、463、482和499的至少两个位置处的谷氨酸残基的取代。

4.权利要求2的CadA变体多肽,其中所述氨基酸取代是E291A/C/D/H/R/V/G/K/N/S,E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y/A/H/K/M。

5.权利要求4的CadA变体多肽,其中所述氨基酸取代是E291A/C/D/H/R/V,E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y。

6.权利要求1-5任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。

7.权利要求1-5任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。

8.权利要求1-5任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。

9.权利要求1-5任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。

10.一种遗传修饰的宿主细胞,其包含权利要求1-5任一项的CadA变体多肽。

11.权利要求10的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。

12.权利要求10的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。

13.权利要求10的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。

14.权利要求10的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。

15.权利要求10的遗传修饰的宿主细胞,其中所述宿主细胞被遗传修饰以过表达一或多种赖氨酸生物合成多肽。

16.权利要求10-15任一项的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。

17.权利要求16的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属(Escherichia)、哈夫尼菌属(Hafnia)或棒杆菌属(Corynebacteria)。

18.权利要求16的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌(Escherichia coli)。

19.权利要求16的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌(Hafnia alvei)。

20.权利要求16的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。

21.一种生产尸胺的方法,所述方法包括在表达CadA变体多肽的条件下培养权利要求

10-20任一项的遗传修饰的宿主细胞。

22.一种多核苷酸,其包含编码权利要求1-5任一项的CadA变体多肽的核酸序列。

23.权利要求22的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。

24.权利要求22的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。

25.权利要求22的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。

26.权利要求22的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。

27.一种表达载体,其包含权利要求22-26任一项的多核苷酸。

28.一种遗传修饰的宿主细胞,其包含权利要求27的表达载体。

29.权利要求28的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。

30.权利要求28的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或棒杆菌属。

31.权利要求28的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌。

32.权利要求28的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌。

33.权利要求28的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌。

34.一种遗传修饰的宿主细胞,其包含权利要求22-26任一项的多核苷酸,其中编码所述CadA变体多肽的核酸序列整合进宿主细胞染色体中。

35.权利要求34的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。

36.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或棒杆菌属。

37.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌。

38.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌。

39.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌。

40.一种生产尸胺的方法,所述方法包括在表达CadA变体多肽的条件下培养权利要求

28-39任一项的遗传修饰的宿主细胞。

说明书 :

修饰的赖氨酸脱羧酶

背景技术

[0001] 大多数酶在窄pH范围内发挥最佳功能,因为它们是两性分子。周围环境的pH直接影响组成酶的氨基酸的酸性和碱性基团上的电荷。这些电荷的变化影响酶的净电荷,活性位点的pKa和酶表面的电荷分布。因此,pH的变化会影响酶的活性、溶解度和稳定性。
[0002] 被称为酸脱羧酶的一类蛋白质是一组酶,该酶催化碱性氨基酸(例如赖氨酸、精氨酸、鸟氨酸)的脱羧酶反应,以生成在许多微生物中作为酸应激反应一部分的多胺。大肠杆菌(Escherichia coli)有几种PLP依赖性酸脱羧酶:CadA、LdcC、AdiA、SpeA、SpeC、SpeF、GadA和GadB。所有这些酶均在窄pH范围内发挥作用,超出该pH范围,酶活性显著降低(Kanjee等人,Biochemistry 50,9388-9398,2011)。之前已经观察到,这些PLP依赖性脱羧酶发生二聚化,以形成完整的活性位点。在一些情况下,如CadA,二聚体形成十聚体,该十聚体聚集成最佳功能所需的较高分子量蛋白复合物。抑制较高分子量蛋白复合物的形成(例如,在最佳pH值以外的条件下)导致功能显著下降(Kanjee等人,The EMBO Journal 30,
931-944,2011)。
[0003] 蛋白质中各个氨基酸的pKa值对确定其生物分子功能是重要的,因为蛋白质-水溶液中的一个主要反应是某些氨基酸与蛋白质的环境交换质子。pKa是中性态和带电态之间自由能差异的量度,并表示氨基酸提供或接受质子的倾向性。某些氨基酸具有可滴定基团,使其更易于接受和提供质子。这些氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、丝氨酸、酪氨酸、苏氨酸、组氨酸、赖氨酸和精氨酸。一些氨基酸的示例性的pKa值为:天冬氨酸为4.0、谷氨酸为4.4、半胱氨酸为8.7、酪氨酸为9.6、组氨酸为6.3、赖氨酸为10.4和精氨酸为13.0(Nielsen JE&;Vriend G,Proteins 43,403-412,2001)。根据文献来源,这些pKa值可能相差0.5。
[0004] 可滴定基团接受还是提供质子将取决于其环境,如pH值或其附近的其他氨基酸。例如,当pH值小于可滴定基团的pKa时,基团将更可能接受质子。与之相反,当pH值大于可滴定基团的pKa时,基团将更可能提供质子。当氨基酸的可滴定基团接受或提供质子时,依赖于质子交换发生前其开始具有的电荷,氨基酸可以变成带正电荷、带负电荷或中性的。当两个基团彼此靠近时,带电基团可以与其他带电基团相互作用。相似的电荷相互排斥,相反的电荷相互吸引。质子化的中性带电基团仍然可以通过氢键相互作用与其他基团相互作用。
[0005] 对蛋白质可滴定基团的pKa值的理解不仅对理解pH如何影响多肽折叠和酶活性,而且对蛋白质-蛋白质相互作用是重要的(Jensen JE,Curr Pharm Biotechnol 9,96-102,2008),特别是在酸脱羧酶的四级结构因环境pH变化而发生显著变化的情况下。目前,在评价带有可滴定基团的各种氨基酸的突变对酸脱羧酶功能的影响方面的研究甚少。
[0006] 基于先前文献(Kanjee等人,EMBO Journal 30,931-944,2011),当环境pH改变时,CadA从由十聚体和高阶寡聚物组成的状态转变为主要由二聚体组成的状态。十聚体的形成是形成高阶寡聚物的先决条件。已经表明,在pH 5.0-5.5,CadA的功能最佳(Lemonnier M&Lane D,Microbiology 144,751-760,1998)。在此酸性pH,Kanjee等人使用EM分析表明CadA主要以高阶寡聚物存在。当pH升高到6.0以上或存在抑制剂ppGpp时,不形成高阶寡聚物,脱羧酶功能显著降低。然而,缺乏描述CadA高阶寡聚物如何形成以及在其形成中发挥作用的氨基酸残基的文献。

发明内容

[0007] 本发明部分基于突变的发现,该突变提供了稳定四级结构形成所需的化学相互作用的能力,并增加了稳定性,以允许突变型酸脱羧酶蛋白在更宽的pH范围内发挥作用。在较宽的pH范围内发挥作用的能力对于维持高反应速率而不需要添加额外的化学物质来维持pH值非常重要。在宽pH范围内维持高反应速率将使赖氨酸更快地转化为尸胺并减少所需设施的数量。该蛋白质对碱性pH的耐受性消除了添加额外化学物质以维持pH值的需要。这些用于维持pH值的化学物质通常形成盐(例如SO42-或Cl-),该盐进入废水或必须使用额外的纯化步骤从工艺中去除。因此,与野生型相比,在更宽的pH范围内发挥作用的突变型酸脱羧酶将通过减少工艺过程中形成的盐量来降低整个工艺的成本和环境中留下的痕迹。
[0008] 因此,在一个方面,本发明提供了一种CadA变体多肽,该CadA变体多肽在相应于参照SEQ ID NO:2确定的氨基酸276至509的区域中的谷氨酸残基处包括至少一个氨基酸取代,其中该谷氨酸残基出现在蛋白质的表面,具有朝向外部环境的侧链,位于缺少确定的二级结构的蛋白质区段中;以及其中该CadA变体多肽与SEQ ID NO:2至5的任一个具有至少70%的相同性。在一些实施方案中,所述取代在谷氨酸残基,该谷氨酸残基的位置选自参照SEQ ID NO:2确定的位置291、344、355、463、482和499。在一些实施方案中,所述氨基酸取代为E291A/C/D/H/R/V/G/K/N/S、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y/A/H/K/M。在一些实施方案中,所述氨基酸取代为E291A/C/D/H/R/V、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y。在一些实施方案中,CadA变体多肽包括在选自位置
291、344、355、463、482和499中的至少两个位置处谷氨酸残基的取代。在一些实施方案中,CadA变体多肽包括在选自位置291、344、355、463、482和499中的至少三个位置处谷氨酸残基的取代。在一些实施方案中,CadA变体多肽包括在选自位置291、344、355、463、482和499中的四个或五个位置或所有六个位置处谷氨酸残基的取代。在一些实施方案中,本段中所述的CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与所述SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
[0009] 在另一方面,本发明提供了一种遗传修饰的宿主细胞,该宿主细胞包括本文所述的CadA变体多肽,例如在前段所述的。在典型的实施方案中,所述遗传修饰的宿主细胞被遗传修饰以过表达一种或多种赖氨酸生物合成多肽。在一些实施方案中,所述宿主细胞是细菌。在进一步的实施方案中,所述宿主细胞选自埃希氏菌属(Escherichia)、哈夫尼菌属(Hafnia)或棒杆菌属(Corynebacteria)。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌(Escherichia coli)。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌(Hafnia alvei)。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。
[0010] 在另一方面,本发明提供了一种包括编码本文所述(例如在本节的上述段落中所述的)的CadA变体多肽的核酸序列的多核苷酸。在进一步的方面,本发明还提供了一种包括编码所述CadA变体的多核苷酸的表达载体和/或包括该表达载体的遗传修饰的宿主细胞。在一些实施方案中,所述宿主细胞是细菌,例如来自埃希氏菌属、哈夫尼菌属或棒杆菌属。
在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌。
[0011] 在另一方面,本发明提供了一种遗传修饰的宿主细胞,其包括多核苷酸,该多核苷酸包括编码本文所述例如在本部分前面的段落中所述的CadA变体多肽的核酸序列,其中编码所述CadA变体多肽的所述核酸序列整合到宿主细胞染色体中。在一些实施方案中,所述宿主细胞为细菌,例如来自埃希氏菌属、哈夫尼菌属或棒杆菌属。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌。
[0012] 在另一方面,本发明提供了一种产生尸胺的方法,该方法包括在表达CadA变体多肽的条件下培养本文所述例如在本节上述段落中所述的遗传修饰的宿主细胞。

附图说明

[0013] 图1显示了大肠杆菌CadA多肽序列SEQ ID NO:2与来自肠道沙门氏菌(Salmonella enterica)(WP_001540636.1),克雷伯氏菌属(Klebsiella)多物种(WP_012968785)和肠杆菌科(Enterobacteriaeceae)多物种(WP_002892486.1)的CadA同源物的比对。

具体实施方式

[0014] 在本发明被描述之前,应理解,本发明不限于所描述的特定实施方案,因此,这些实施方案当然可以改变。还应理解的是,本文中使用的术语仅用于描述特定实施方案的目的,并不意图是限制性的。
[0015] 除非特别指出,否则本文所用的全部技术和科学术语都具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的那些类似或等价的任何方法和材料可用于本发明的实践或测试,但目前描述了优选的方法和材料。本文提及的所有出版物和登录号均通过公开和描述所引用的出版物的方法和/或材料而并入本文参考。
[0016] 术语
[0017] 如在本公开上下文所用,“CadA多肽”是指具有SEQ ID NO:2的氨基酸序列的大肠杆菌CadA多肽,或其具有活性(即催化L-赖氨酸脱羧生成尸胺)的生物活性变体。生物活性变体包括大肠杆菌CadA多肽的等位基因、突变体、片段和种间同系物。CadA的结构和功能已被充分表征。CadA结构的蛋白质数据库编号为3N75。其他物种示例性的CadA多肽包括克雷伯氏菌属(例如SEQ ID NO:3)、肠杆菌科(例如SEQ ID NO:5)和肠道沙门氏菌(例如SEQ ID NO:6)的CadA。其他物种的额外CadA多肽包括沙雷氏菌属(Serratia sp.),WP033635725.1;和解鸟氨酸拉乌尔菌(Raoultella ornithinolytica),YP 007874766.1。在一些实施方案中,“CadA多肽”在SEQ ID NO:2所示CadA多肽的至少约200、300、400、500或更多个氨基酸的区域上或全长具有至少60%的氨基酸序列相同性,典型地至少65%、70%、75%、80%、
85%、90%的相同性;通常至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同。在一些实施方案中,“CadA多肽”包括一个区域,该区域与包括相应于SEQ ID NO:2的氨基酸261-509的氨基酸残基的区域具有至少80%、至少85%、至少90%、至少95%或至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性,其中存在于该区域中的天然谷氨酸如本文所述被另一种非天然氨基酸取代。在一些实施方案中,优选与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的CadA多肽的至少约200、
300、400、500或更多个氨基酸的区域,或全长,“CadA多肽”具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、
98%或99%或更高的氨基酸序列相同性。
[0018] 本文所用的“CadA多核苷酸”是指编码CadA多肽的多核苷酸。编码CadA的核酸或多核苷酸是指基因、前体mRNA、mRNA等,包括编码本文所述特定氨基酸序列的变体、等位基因、片段、突变体和种间同系物的核酸。
[0019] 本文所用的术语“碱性pH”是指pH值大于7.5的溶液或周围环境。在一个实施方案中,碱性pH是指pH至少为8.0、至少8.5或更高的溶液或周围环境。
[0020] 本文中所使用的在氨基酸衍生物(例如尸胺)生产上下文中的术语“增强”或“提高”是指与对照对应细胞(如野生型菌株的细胞或表达野生型CadA蛋白的相同菌株的细胞)相比,表达本发明CadA变体多肽的宿主细胞产生的氨基酸衍生物产量的增加。在一个实施方案中,与表达野生型CadA的对应细胞的CadA活性相比,CadA变体的活性至少提高10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更高,其中活性是通过测量宿主细胞和对照细胞在相同条件下产生的氨基酸衍生物(通常为尸胺)的产量来进行评估。例如,本发明的CadA变体多肽的活性可以通过评价用编码所述变体CadA多肽的多核苷酸转化的宿主细胞培养物的等份试样与表达野生型CadA的相同菌株的对应宿主细胞培养物的相应等份试样进行比较来进行评估。进一步说明,本发明的CadA变体多肽与对应的野生型CadA相比的活性可以通过评价由包括编码所述变体CadA多肽的核酸序列的载体(变体宿主细胞)或包括编码野生型CadA多肽的核酸的载体(对照宿主细胞)转化的细胞产生的尸胺来进行测定。在表达CadA的条件下生长的变体和对照宿主细胞与等份样品在pH8.0条件下与终浓度为分别120g/L和0.1mM的赖氨酸-HCl和PLP孵育一段时间,例如2小时。孵育后测量尸胺产量。在实施例部分提供了示例性的测定。
[0021] 当在给定氨基酸或多核苷酸序列编号的上下文中使用时,术语“参考……编号”或“相应于”或“参考……确定”是指当给定氨基酸或多核苷酸序列与参考序列比较时,特定参考序列的残基的编号。例如,当变体CadA多肽以最大比对方式与SEQ ID NO:2比对时,变体多肽序列的位置“相应于”SEQ ID NO:2中的位置。
[0022] 本文所使用的关于CadA多肽的术语“野生型”、“天然”和“天然存在”是指具有天然存在的序列的CadA蛋白。
[0023] 在本发明上下文中,关于突变多肽或突变多核苷酸的术语“突变体”与“变体”可互换使用。“非天然”存在的CadA变体是指自然界中不存在于细胞中,通过遗传修饰(例如利用遗传工程技术或诱变技术)天然CadA多核苷酸或多肽产生的变体或突变体CadA多肽。本公开上下文中的“变体”CadA多肽包括任何非天然存在的CadA多肽,该非天然存在的CadA多肽包括至少一个氨基酸取代,其中所述至少一个氨基酸取代是在如参照SEQ ID NO:2所确定的位置291、344、355、463、482或499的谷氨酸残基的取代。本发明的变体CadA多肽还可具有相对于SEQ ID NO:2的其他突变,包括进一步的取代、插入或缺失。
[0024] 术语“多核苷酸”和“核酸”可互换使用,是指从5’端到3’端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。本发明中使用的核酸通常含有磷酸二酯键,但在某些情况下,可使用具有替代骨架的核酸类似物,例如该替代骨架包括氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚磷酰胺连接(参见Eckstein,Oligonucleotides and Analogues:A Practical Approach,Oxford University Press);带正电的骨架;非离子骨架,和非核糖骨架。核酸或多核苷酸还可包括允许经聚合酶正确通读的修饰的核苷酸。“多核苷酸序列”或“核酸序列”包括作为单一单链的或双链的核酸的有义链和反义链。正如本领域的普通技术人员应当理解的,单链的描述也定义了互补链的序列;因此,本文所描述的序列也提供了该序列的互补物。除非另有说明,特定的核酸序列也隐含其变体(例如简并密码子取代)和互补序列,以及明示的序列。核酸可以是DNA(基因组和cDNA)、RNA或杂合体,其中核酸可以包含脱氧核糖核苷酸和核糖核苷酸的组合,以及碱基的组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤等。
[0025] 在本公开的上下文中用于两种核酸或多肽的术语“基本上相同”是指与参考序列具有至少50%序列相同性的序列。百分比相同性可以是50%到100%之间的任何整数。一些实施方案至少包括:50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,使用本文所述程序(优选使用标准参数的BLAST)与参考序列相比;如下所述。
[0026] 如下所述,如果两个核酸序列或多肽序列中的核苷酸或氨基酸残基序列分别在进行最大对应时比对时相同的,则这两个序列被称为是“相同的”。在两个或更多个核酸或多肽序列的上下文中的术语“相同”或百分比“相同性”是指当在比较窗口中进行最大对应性比较和比对时,如使用以下序列比较算法之一或通过手动比对和目视检查所测量的,相同的或具有指定百分比的相同氨基酸残基或核苷酸的两个或更多个序列或子序列。
[0027] 对于序列比较,通常一个序列作为参考序列,将测试序列与之进行比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,必要时指定子序列坐标,并设定序列算法程序参数。可以使用默认程序参数,或也可以设定替代参数。然后,基于程序参数,序列比较算法计算测试序列相对于参考序列的百分比序列相同性。
[0028] 可用于确定变体CadA多肽是否与SEQ ID NO:2或另一多肽参考序列(如SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5)具有序列相同性的算法为BLAST算法,如Altschuletal等人,1990,J Mol.Biol.215:403-410所述。执行BLAST分析的软件可通过国家生物技术信息中心(National Center for Biotechnology Information,网址ncbi.nlm.nih.gov/)公开获得。进行蛋白质序列比对的示例性软件包括ClustalW2和BLASTP。对于氨基酸序列,BLASTP程序默认使用的字长(W)为3,预期阈值(E)为10,以及BLOSUM62评分矩阵(参见
Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。在本公开中,通常使用默认参数的BLASTP Align Sequence确定多肽序列相同性。
[0029] 本文中使用的“比较窗口”包括参考选自20至600的任意一个数目的连续位置的区段,通常约50至约200,更通常约100至约150,其中序列可在两个序列最佳比对后与相同数目的连续位置的参考序列进行比较。用于比较的序列比对方法在本技术中是熟知的。可进行用于比较的最佳序列比对,例如,通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源算法,通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源比对算法,通过Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)的相似性搜寻方法,通过这些算法的计算机化实现(Wisconsin Genetics Software Package中的GAP,BESTFIT,FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,WI),或通过手动比对和目视检查。通常使用默认参数的BLASTP进行最佳比对。
[0030] 与参考序列基本上相同的核酸或蛋白质序列包括“保守修饰的变体”。对于特定核酸序列,保守修饰的变体是指编码相同或实质相同的氨基酸序列的那些核酸,或在核酸不编码氨基酸序列时,是实质相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子指定丙氨酸的每个位置,该密码子可以改变为所述的任何相应密码子而不改变编码的多肽。这类核酸变体为“沉默变体”,其是保守修饰变体的一种。本文中编码多肽的每一个核酸序列也描述了该核酸的每一种可能的沉默变体。本领域技术人员将认识到核酸中每个密码子(除了AUG,通常仅是甲硫氨酸的密码子)可以被修饰以产生功能相同的分子。因此,编码多肽的核酸的每一个沉默变体都隐含在每个描述的序列中。
[0031] 本文使用的术语“多肽”包括参考含有天然存在氨基酸和氨基酸骨架以及非天然存在氨基酸和氨基酸类似物的多肽。
[0032] 关于氨基酸序列,本领域技术人员将认识到在编码序列中改变单个氨基酸或少量氨基酸的核酸、肽、多肽或蛋白质序列中的各个取代是“保守修饰的变体”,其中所述改变导致氨基酸被化学相似的氨基酸所取代。提供功能相似氨基酸的保守取代表在本领域是熟知的。以这种方式定义的氨基酸组的示例可以包括:“带电/极性组”,包括Glu(谷氨酸或E)、Asp(天冬氨酸或D)、Asn(天冬酰胺或N)、Gln(谷氨酰胺或Q)、Lys(赖氨酸或K)、Arg(精氨酸或R)和His(组氨酸或H);“芳香或环状组”,包括Pro(脯氨酸或P)、Phe(苯丙氨酸或F)、Tyr(酪氨酸或Y)和Trp(色氨酸或W);和“脂肪族组”,包括Gly(甘氨酸或G)、Ala(丙氨酸或A)、Val(缬氨酸或V)、Leu(亮氨酸或L)、Ile(异亮氨酸或I)、Met(甲硫氨酸或M)、Ser(丝氨酸或S)、Thr(苏氨酸或T)和Cys(半胱氨酸或C)。在每个组内,还可以鉴别亚组。例如,带电/极性氨基酸组可被细分为亚组,包括:包括Lys、Arg和His的“正电荷亚组”;包括Glu和Asp的“负电荷亚组”;和包括Asn和Gln的“极性亚组”。在另一个示例中,芳香族或环状组可被细分为亚组,包括:包括Pro、His和Trp的“氮环亚组”;和包括Phe和Tyr的“苯基亚组”。在另一个其他示例中,脂肪族组可以细分为亚组,包括:包括Val、Leu和Ile的“大脂肪族非极性亚组”;包括Met、Ser、Thr和Cys的“脂肪族弱极性亚组”;和包括Gly和Ala的“小残基亚组”。保守突变的示例包括上述亚组内氨基酸的氨基酸取代,例如但不限于:Lys取代Arg或反之亦然,以便维持正电荷;Glu取代Asp或反之亦然,以便维持负电荷;Ser取代Thr或反之亦然,以便维持游离--OH;和Gln取代Asn或反之亦然,以便维持游离--NH2。以下六组各包含进一步提供了示例性的相互保守性取代的氨基酸。1)Ala、Ser、Thr;2)Asp、Glu;3)Asn、Gln;4)Arg,Lys;
5)Ile、Leu、Met、Val;和6)Phe、Try和Trp(例如参见Creighton,Proteins(1984))。在一些实施方案中,采用保守取代以在除谷氨酸残基以外的位点产生具有取代的Cada变体。
[0033] 本文使用的术语“启动子”是指能够驱动细胞中核酸序列转录的多核苷酸序列。因此,本发明的多核苷酸构建体中使用的启动子包括参与调节或调控基因转录的时间和/或速率的顺式和反式作用转录控制元件和调控序列。例如,启动子可以是顺式作用转录控制元件,包括增强子、阻遏物结合序列等。这些顺式作用序列通常与蛋白质或其他生物分子相互作用,进行(开启/关闭、调控、调节等)基因转录。最常见的核心启动子序列位于翻译起始位点的1-2kb范围内,更常见的在翻译起始位点的1kbp以内,通常在翻译起始位点的500bp或200bp或更少以内。按照惯例,通常以其控制的基因编码链上的序列提供启动子序列。在本申请上下文中,启动子通常以其天然调节表达的基因的名称提及。在本发明的表达构建体中使用的启动子以所述基因的名称提及。通过名称提及启动子包括野生型、天然启动子以及保持诱导表达能力的启动子变体。按名称提及启动子并不限于特定物种,还包括其他物种中相应基因的启动子。
[0034] 本发明上下文中的“组成型启动子”是指在细胞中在大多数条件下能够启始转录的启动子,例如在不存在诱导分子的情况下。“诱导型启动子”在诱导剂分子的存在下启始转录。
[0035] 如果一个多核苷酸来自于一个外来物种,或者如果来自于相同物种,从其原始形式修饰,则该多核苷酸对于生物体或第二多核苷酸序列是“异源的”。例如,当一个编码多肽序列的多核苷酸被称为可操作地连接到异源启动子时,这意味着编码该多肽的多核苷酸编码序列来源于一个物种,而启动子序列来源于另一个不同物种;或者,如果两者都来自相同物种,所述编码序列与所述启动子天然不相关(例如,是遗传工程化的编码序列,例如来自相同物种的不同基因,或来自不同物种的等位基因)。类似地,如果天然野生型宿主细胞不产生一种多肽,则该多肽对于所述宿主细胞是“异源的”。
[0036] 术语“外源”一般是指在野生型细胞或生物体中不是天然产生的多核苷酸序列或多肽,但通常是通过分子生物学技术,例如工程化以产生重组微生物而引入细胞的。“外源”多核苷酸的示例包括编码所需蛋白质的载体、质粒和/或人造核酸构建体。
[0037] 术语“内源”是指可在给定野生型细胞或生物体中发现的天然存在的多核苷酸序列或多肽。在这方面,还注意到,尽管生物体可能包含一个给定多核苷酸序列或基因的内源拷贝,但引入编码该序列的质粒或载体,如过表达或以其他方式调节编码蛋白的表达,代表了该基因或多核苷酸序列的“外源”拷贝。本文所述的任何途径、基因或酶都可利用或依赖“内源”序列,该序列可作为一或多个“外源”多核苷酸序列提供,或两者。
[0038] 本文中使用的“重组核酸”或“重组多核苷酸”是指核酸的聚合物,其中至少下列一项为真:(a)核酸序列对给定宿主细胞是外来的(即在给定宿主细胞中并非天然发现的);(b)该序列在给定宿主细胞中可能是天然发现的,但以非天然的(如大于预期)量存在;或(c)核酸序列包含在天然情况中彼此不以相同关系存在的两个或更多个子序列。例如,关于情况(c),重组核酸序列可以具有两个或更多个来自不相关基因的序列,这些序列排列以形成新的功能性核酸。
[0039] 术语“可操作连接”是指两个或更多个多核苷酸(如DNA)区段之间的功能关系。通常,其是指转录调节序列与转录序列的功能关系。例如,如果在适当的宿主细胞或其他表达系统中,启动子或增强子序列刺激或调节DNA或RNA序列的转录,则其可操作地与DNA或RNA序列连接。通常,与转录序列可操作连接的启动子转录调节序列与转录序列物理上相邻,即它们是顺式作用的。然而,一些转录调节序列,如增强子,不需要物理上与其增强转录的编码序列连续或位于其增强转录的编码序列附近。
[0040] 术语“表达盒”或“DNA构建体”或“表达构建体”是指当引入宿主细胞时分别导致RNA或多肽转录和/或翻译的核酸构建体。在转基因表达的情况中,本领域技术人员将认识到插入的多核苷酸序列不需要是相同的,但可能只是与其衍生的基因的序列是基本上相同的。如本文所述,通过提及特定核酸序列,特别涵盖这些基本上相同的变体。表达盒的一个示例是多核苷酸构建体,其包括编码可操作地与启动子(例如其天然启动子)连接的本发明蛋白多肽的多核苷酸序列,其中表达盒被引入异源微生物中。在一些实施方案中,表达盒包括编码本发明多肽的多核苷酸序列,其中所述多核苷酸靶向微生物基因组中的位置,使得所述多核苷酸序列的表达由存在于微生物中的启动子驱动。
[0041] 在本发明上下文中使用的术语“宿主细胞”是指微生物,包括各个细胞或细胞培养物,可以是或已经是本发明的任何重组载体或分离的多核苷酸的接受体。宿主细胞包括单个宿主细胞的子代,并且由于天然的、随机的或故意的突变和/或变化,该子代不一定与原始亲本细胞完全相同(在形态或总DNA补体方面)。宿主细胞包括通过转化、转染等方式引入本发明的重组载体或多核苷酸的细胞。
[0042] 术语“分离”是指基本上或实质上不含通常在其天然状态时与其一起伴随的成分的材料。例如,本文中使用的“分离的多核苷酸”可指从与在天然存在或基因组状态中在其侧翼的序列分离的多核苷酸,例如从通常与该片段相邻的序列中取出的DNA片段,如通过克隆到载体中。例如,如果将多核苷酸克隆到不是自然环境一部分的载体中,或者以不同于其天然发生状态的方式人为地引入到细胞的基因组中,就认为其是分离的。或者,本文所使用的“分离的肽”或“分离的多肽”等可指不含细胞其他成分的多肽分子,即不与体内细胞物质相关。
[0043] 本发明使用各种常规重组核酸技术。总之,在本领域中通常使用以下所述的重组DNA技术中的命名法和实验室步骤。可以获得提供了进行重组DNA操作指导的许多手册,例如Sambrook&Russell,Molecular Cloning,A Laboratory Manual(3rd Ed,2001);和Current Protocols in Molecular Biology(Ausubel等人,John Wiley and Sons,New York,2009-2016)。
[0044] 本发明特定方面的内容
[0045] 在一个方面,本发明提供了一种变体CadA多肽,其包括位于核心结构域中蛋白质部分(section)之一中的位置的谷氨酸(谷氨酸盐)处的突变,在那些结构域中所述蛋白质部分没有确定的二级结构(α,α螺旋;β,β折叠;η,链)(参见Kanjee等人)。这些部分是β10和β11之间的氨基酸276-299(β10和β11之间包括η4和α11)、β11和α12之间的氨基酸314-326(β
11和α12之间包括β12)、η6和β14之间的氨基酸344-357、β16和β18之间的氨基酸454-483(β
16和β18之间包括β17)以及β19和α17之间的氨基酸494-509,其中氨基酸的位置参考SEQ ID NO:2确定。
[0046] 本发明的变体CadA耐受碱性pH的能力也允许在发酵反应中使用具有较高pH值的替代氮源,如尿素和氨(1M溶液的pH为11.6),以生成所需的产物,例如多胺。这些替代氮源产生较少的盐废物副产物。
[0047] CadA多肽变体
[0048] CadA是Fold Type I吡哆醛5′-磷酸(PLP)依赖性脱羧酶亚类的成员。这类蛋白通常包含N-端翼(wing)结构域、核心结构域和C-端结构域。核心结构域具有接头区、PLP结合亚结构域和亚结构域4。对于CadA,N-端翼结构域(相应于参考SEQ ID NO:2确定的残基1至129)具有由夹在两组两亲性α-螺旋之间的五股平行β-折叠组成的黄素蛋白样折叠。核心结构域(残基130至参考SEQ ID NO:2的563确定的残基563)包括:接头区,SEQ ID NO:2的氨基酸残基130至183,其形成短螺旋束;PLP-结合亚结构域,SEQ ID NO:2的氨基酸184至417,其形成由三组α-螺旋包围的七股β-折叠核心;和亚结构域4,氨基酸418至563,其形成具有三个α螺旋朝外的四股反平行β折叠核心。C-端结构域相应于参考SEQ ID NO:2确定的氨基酸残基564至715,其形成两组具有α螺旋外表面的β折叠(Kanjee等人,The EMBO Journal30,
931-944 2011)。
[0049] CadA蛋白形成二倍对称的二聚体,该二聚体含有每个单体的活性位点。五个二聚体结合形成由具有五倍对称的双环结构组成的十聚体。该十聚体与其他十聚体结合形成高阶寡聚物。已表明,在酸性条件(pH5),CadA主要以寡聚状态存在,随着环境变得更加碱性,发现较少的寡聚物和十聚体。据估计,在pH6.5,25%的酶以二聚体存在,75%以十聚体存在,而在pH8.0,95%的酶以二聚体存在(Kanje等人,The EMBO Journal 30,931-944 2011)。寡聚物形成的这一减少与在酶环境的pH值增加至5.0以上时观察到的脱羧酶活性降低一致。
[0050] SEQ ID NO:2-5提供了大肠杆菌、肠道沙门氏菌、克雷伯氏菌属和肠杆菌科的示例性Cad A多肽,其彼此之间具有大于90%的序列相同性。
[0051] 本发明的CadA多肽包括至少一个用另一个氨基酸取代位于核心结构域中该蛋白质没有确定的二级结构(α,α螺旋;β,β折叠;η,链)的区段之一中的位置处的谷氨酸的取代(参见Kanjee等人);和其中所述谷氨酸位于的蛋白质表面,侧链朝向外部环境。在本公开中,取代谷氨酸的氨基酸在该位置不会出现在天然CadA序列中。因此,本发明的变体CadA多肽可以在参考SEQ ID NO:2确定的E291、E344、E355、E463、E482和E499的位置处包括至少一个氨基酸取代。在一些实施方案中,变体CadA多肽在参照SEQ ID NO:2确定的E291、E344、E355、E463、E482和E499的位置处包含一个以上的氨基酸取代,例如2个、3个或更多个取代。在一些实施方案中,取代谷氨酸的氨基酸选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸,其中突变体在相同位置与野生型序列(SEQ ID NO:2、3、4或5)不具有相同的氨基酸。在一些实施方案中,取代谷氨酸的氨基酸具有提供氢以形成氢键的能力。例如,C、Y、K和N的pKa值大于7,因此当pH从5增加到8时,它们的质子化状态不会改变。因此,与具有酸性pKa的谷氨酸存在于这些位置时相比,在这些位置形成的任何氢键更稳定。M的硫既可以作为亲核试剂也可以作为亲电试剂,不需要质子与其他氨基酸基团相互作用。因此M可以进一步稳定该位点的蛋白-蛋白相互作用。在一些实施方案中,取代谷氨酸的氨基酸选自C、H、K、S、A、F、L、M、N、R、V、Y、D、G、I、P、Q、T和W。在一些实施方案中,取代谷氨酸的氨基酸选自C、H、K、S、A、F、L、M、N、R、V和Y。在一些实施方案中,取代谷氨酸的氨基酸选自C、Y、K、S、H、R、M和N。在一些实施方案中,取代谷氨酸的氨基酸选自C、H、K和S。
[0052] 在一些实施方案中,所述变体CadA多肽为大肠杆菌CadA的变体,其中在位置E291、E344、E355、E463、E482和E499的至少一个、两个、三个、四个、五个或全部六个谷氨酸被另一氨基酸取代。
[0053] 在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:2的CadA多肽的长度为500个或更多个氨基酸的区域或全长具有至少60%的氨基酸序列相同性,通常至少65%、
70%、75%、80%或85%的相同性;和通常至少90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%或更高的氨基酸序列相同性,并在参照SEQ ID NO:2确定的位置E291、E344、E355、E463、E482或E499的至少一个处的谷氨酸残基处具有取代。在一些实施方案中,所述取代为E291A/C/D/H/R/V/G/K/N/S、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y/A/H/K/M。在其他实施方案中,所述取代为E291A/C/D/H/R/V、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y。
[0054] 在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:3的CadA多肽的长度为500个或更多个氨基酸的区域或全长具有至少60%的氨基酸序列相同性,通常至少65%、
70%、75%、80%或85%的相同性;和通常至少90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%或更高的氨基酸序列相同性,并在参照SEQ ID NO:3确定的位置E291、E344、E355、E463或E482的至少一个处的谷氨酸残基处具有取代。在一些实施例方案,所述取代为E291A/C/D/H/R/V/G/K/N/S、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y/A/H/K/M。在其他实施方案中,所述取代为E291A/C/D/H/R/V、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/I/L/S/W/Y。
[0055] 在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:4的CadA多肽的长度为500个或更多个氨基酸的区域或全长具有至少60%的氨基酸序列相同性,通常至少65%、
70%、75%、80%或85%的相同性;和通常至少90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%或更高的氨基酸序列相同性,并在参照SEQ ID NO:4确定的位置E291、E344、E355、E463或E482的至少一个处的谷氨酸残基处具有取代。在一些实施方案中,所述取代为E291A/C/D/H/R/V/G/K/N/S、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/i/L/S/W/Y/A/H/K/M。在其他实施方案中,所述取代为E291A/C/D/H/R/V、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/i/L/S/W/Y。
[0056] 在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:5的CadA多肽的长度为500个或更多个氨基酸的区域或全长具有至少60%的氨基酸序列相同性,通常至少65%、
70%、75%、80%或85%的相同性;和通常至少90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%或更高的氨基酸序列相同性,并在参照SEQ ID NO:5确定的位置E291、E355、E463或E482的至少一个处的谷氨酸残基处具有取代。在一些实施方案中,所述取代为E291A/C/D/H/R/V/G/K/N/S、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/i/L/S/W/Y/A/H/K/M。在其他实施方案中,所述取代为E291A/C/D/H/R/V、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y或E482C/F/i/L/S/W/Y。
[0057] 编码CadA变体多肽的核酸
[0058] CadA多核苷酸序列的分离或生成可通过多种技术完成。在一些实施方案中,基于本文公开的序列的寡核苷酸探针可用于从期望的细菌种属的cDNA或基因组DNA文库中鉴定期望的多核苷酸。可采用适当引物(例如,如实施例部分所示)将所需的取代引入编码CadA的多核苷酸序列中,以将所需变化整合到多核苷酸序列中。例如,PCR可直接从mRNA、cDNA、基因组文库或cDNA文库中扩增基因序列,并引入所需的取代。
[0059] 可通过比较本文提供的序列产生或基于另一细菌的CadA多核苷酸序列产生用于鉴别细菌中CadA多核苷酸的合适引物和探针。关于PCR的概述请参见PCR Protocols:A Guide to Methods and Applications(Innis,M,Gelfand,D.,Sninsky,J.and White,T.,eds.),Academic Press,San Diego(1990)。在实施例部分的引物表中给出了示例性引物序列。
[0060] 本发明中使用的编码酸脱羧酶多肽的核酸序列包括通过使用示例性核酸序列(例如SEQ ID NO:1的cadA多核苷酸序列)的如杂交和/或序列分析等技术识别和表征的基因和基因产物。在一些实施方案中,通过将具有至少60%相同性或至少70%、75%、80%、85%或90%相同性或95%相同性或更高的核酸序列引入到酸脱羧酶多核苷酸(例如SEQ ID NO:1的cadA多核苷酸)中来对宿主细胞进行遗传修饰,其中该核酸包括编码所需待取代氨基酸的密码子。
[0061] 编码本发明CadA变体蛋白(使宿主细胞产生氨基酸衍生物例如尸胺的产量增加)的核酸序列另外可以对密码子进行优化以在所需的宿主细胞中表达。可以使用的方法和数据库在本技术中是已知的。例如,可以根据单个基因、一组共同功能或来源的基因、高表达基因中的密码子使用,整个生物体的聚集蛋白编码区的密码子频率、相关生物体的聚集蛋白编码区的密码子频率或其组合确定优选密码子。例如参见Henaut和Danchin的"Escherichia coli and Salmonella,"Neidhardt,et al.Eds.,ASM Pres,Washington 
D.C.(1996),pp.2047-2066;Nucleic Acids Res.20:2111-2118;Nakamura等人,2000,Nucl.Acids Res.28:292)。
[0062] 重组载体的制备
[0063] 可使用本领域熟知的方法制备表达变体CadA蛋白的重组载体。例如,编码CadA变体多肽的DNA序列可与转录和其他调控序列组合,该调控序列将指导基因序列在预期细胞例如细菌细胞如蜂房哈夫尼菌、大肠杆菌或谷氨酸棒杆菌中的转录。在一些实施方案中,包括表达盒(该表达盒包括编码所述CadA变体多肽的基因)的表达载体还包括与编码所述CadA变体多肽的核酸序列可操作地连接的启动子。在其他实施方案中,指导编码变体Cada多肽的cadA多核苷酸转录的启动子和/或其它调控元件对宿主细胞是内源性的,并引入包括所述cadA基因的表达盒,例如通过同源重组,从而外源基因可操作地与内源性启动子连接,并由内源性启动子驱动表达。
[0064] 如上所述,编码CadA变体多肽的多核苷酸的表达可以由包括启动子在内的许多调控序列控制,这些启动子可以是组成型的或诱导型的;以及,如果需要,任选包括阻遏物序列。合适启动子的示例,尤其在细菌宿主细胞中,是得自大肠杆菌lac操纵子的启动子和衍生自参与其他糖例如半乳糖和麦芽糖代谢的基因的其他启动子。其他的示例包括如trp启动子,bla启动子噬菌体λPL和T5的启动子。此外,可以使用合成启动子,如tac启动子(美国专利号4,551,433)。启动子的进一步示例包括天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因。在上文的Ausubel和Sambrook&Russell中也描述了合适的启动子。其他启动子包括Jensen&Hammer,Appl.Environ.Microbiol.64:82,1998;Shimada等人,
J.Bacteriol.186:7112,2004;和Miksch等人,Appl.Microbiol.Biotechnol.69:312,2005中所述的启动子。
[0065] 在一些实施方案中,可以修饰影响编码本发明的CadA变体多肽的cadA基因表达的启动子以增加表达。例如,与天然启动子相比,内源性CadA启动子可被提供增加表达的启动子所取代。
[0066] 表达载体还可以包括影响编码所述CadA变体多肽的多核苷酸表达的其他序列。这种序列包括增强子序列、核糖体结合位点或其他序列,如转录终止序列等。
[0067] 表达编码本发明的CadA变体多肽的多核苷酸的载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体或人工染色体。载体可以包含任何确保自主复制的手段。或者,载体可以是这样的载体,当其导入宿主时被整合到基因组中并与其整合到其中的染色体一起复制。因此,表达载体还可以包含允许载体整合到宿主基因组中的元件。
[0068] 本发明的表达载体优选包含一或多个选择标记,其允许容易地选择转化的宿主。例如,表达载体可以包括赋予重组宿主生物体例如细菌细胞如大肠杆菌、蜂房哈夫尼菌或谷氨酸棒杆菌抗生素抗性(例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的基因。
[0069] 虽然可以使用任何合适的表达载体掺入所需的序列,但容易获得的细菌表达载体包括但不限于:质粒如pSClOl、pBR322、pBBRlMCS-3、pUR、pET、pEX、pMRlOO、pCR4、pBAD24、p15a、pACYC、pUC,如pUC18或pUC19,或衍生自这些质粒的质粒;和噬菌体,如Ml3噬菌体和λ噬菌体。然而,本领域技术人员可以通过常规实验容易地确定任何特定的表达载体是否适合任何给定的宿主细胞。例如,可将表达载体导入宿主细胞中,然后监测载体中所包含序列的活力和表达。
[0070] 本发明的表达载体可以使用任意已知方法引入到宿主细胞中,包括基于氯化钙的方法、电穿孔或本领域已知的任何其它方法。
[0071] 宿主细胞
[0072] 本发明提供了经过工程化以表达本发明的CadA变体多肽的遗传修饰的宿主细胞。本发明的遗传修饰的宿主菌株通常包括至少一个额外的遗传修饰,以相对于没有所述一个额外的遗传修饰的对照菌株(例如野生型菌株或没有所述一个额外的遗传修饰的相同菌株的细胞)增强氨基酸或氨基酸衍生物的生产。“增强氨基酸或氨基酸衍生物生产的额外遗传修饰”可以是任何遗传修饰。在一些实施方案中,该基因修饰是引入表达参与氨基酸或氨基酸衍生物合成的酶的多核苷酸。在一些实施方案中,所述宿主细胞包括相对于野生型宿主细胞增加氨基酸或氨基酸衍生物的生产的多个修饰。
[0073] 在一些方面,为表达CadA变体多肽对宿主细胞进行的遗传修饰与修饰该宿主细胞以过表达一或多种赖氨酸生物合成多肽联合进行。
[0074] 在一些实施方案中,宿主细胞可被遗传修饰以表达一或多种影响赖氨酸生物合成的多肽。赖氨酸生物合成多肽的示例包括大肠杆菌基因SucA、Ppc、AspC、LysC、Asd、DapA、DapB、DapD、ArgD、DapE、DapF、LysA、Ddh、PntAB、CyoABE、GadAB、YbjE、GdhA、GltA、SucC、GadC、AcnB、PflB、ThrA、AceA、AceB、GltB、AceE、SdhA、MurE、SpeE、SpeG、PuuA、PuuP和YgjG,或来自其他微生物的相应基因。这些基因在本领域是已知的(例如参见Shah等人,J.Med.Sci.2:152-157,2002;Anastassiadia,S.Recent Patents on Biotechnol.1:11-
24,2007)。也参见Kind等人,Appl.Microbiol.Biotechnol.91:1287-1296,2011的涉及尸胺生成的基因的综述。下面提供了编码赖氨酸生物合成多肽的示例性基因。
[0075]
[0076]
[0077] 在一些实施方案中,宿主细胞可被遗传修饰以减弱或降低影响赖氨酸生物合成的一或多种多肽的表达。这种多肽的示例包括大肠杆菌基因Pck、Pgi、DeaD、CitE、MenE、PoxB、AceA、AceB、AceE、RpoC和ThrA,或来自其他生物体的相应基因。这些基因在本领域是已知的(例如参见Shah等人,J.Med.Sci.2:152-157,2002;Anastassiadia,S.Recent Patents on Biotechnol.1:11-24,2007)。也参见Kind等人,Appl.Microbiol.Biotechnol.91:1287-1296,2011关于弱化基因以增加尸胺产生的综述。下面提供了编码其弱化增加赖氨酸生物合成的多肽的示例性基因。
[0078]
[0079]
[0080] 编码赖氨酸生物合成多肽的核酸可与编码CadA变体多肽的多核苷酸一起引入宿主细胞,例如编码在单个表达载体上,或同时以多个表达载体引入。或者,可以对宿主细胞进行遗传修饰,在宿主细胞进行遗传修饰以表达CadA变体多肽之前或之后过表达一或多种赖氨酸生物合成多肽。
[0081] 经工程化以表达CadA变体多肽的宿主细胞通常是细菌宿主细胞。在典型实施方案中,所述细菌宿主细胞是革兰氏阴性细菌宿主细胞。在本发明的一些实施方案中,所述细菌是肠细菌。在本发明的一些实施方案中,所述细菌是棒杆菌属、埃希氏菌属、假单胞菌属(Pseudomonas),单胞发酵菌属(Zymomonas),希瓦氏菌属(Shewanella),沙门氏菌属(Salmonella),志贺氏菌属(Shigella),肠杆菌属(Enterobacter),柠檬酸杆菌属
(Citrobacter),Cronobacter,欧文氏菌属(Erwinia),沙雷氏菌属(Serratia),变形杆菌属(Proteus),哈夫尼菌属,耶尔森氏菌属(Yersinia),摩根菌属(Morganella),爱德华氏菌属(Edwardsiella)或克雷伯氏菌属分类学类别的物种。在一些实施方案中,所述宿主细胞是埃希氏菌属、哈夫尼菌属或棒杆菌属的成员。在一些实施方案中,所述宿主细胞是大肠杆菌、蜂房哈夫尼菌或谷氨酸棒杆菌宿主细胞。在一些实施方案中,所述宿主细胞是大肠杆菌。在一些实施方案中,所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述宿主细胞是谷氨酸棒杆菌。
[0082] 在一些实施方案中,所述宿主细胞是革兰氏阳性菌宿主细胞,如芽孢杆菌(Bacillus sp.),例如枯草芽孢杆菌或地衣芽孢杆菌;或者另一芽孢杆菌,如嗜碱芽孢杆菌(B.alcalophilus),嗜胺芽孢杆菌(B.aminovorans),解淀粉芽孢杆菌,热熔芽孢杆菌(B.caldolyticus),环状芽孢杆菌(B.circulans),嗜热脂肪芽孢杆菌,热葡糖苷酶芽孢杆菌(B.thermoglucosidasius),苏云金芽孢杆菌(B.thuringiensis)或者B.vulgatis。
[0083] 如本文所述,可以针对增加的赖氨酸或赖氨酸衍生物如尸胺的产生筛选按照本发明修饰的宿主细胞。
[0084] 在一些实施方案中,本发明的CadA变体多肽可以从表达所述变体多肽的宿主细胞回收。在一些实施方案中,可以将所述回收的变体蛋白固定在固体基质或惰性材料上以形成固定化酶。在一个实施方案中,所述固定化酶可以较可溶形式融合多肽具有改善的操作稳定性。
[0085] 产生赖氨酸或赖氨酸衍生物的方法。
[0086] 经遗传修饰以过表达本发明的CadA变体多肽的宿主细胞可用于产生赖氨酸或赖氨酸的衍生物。在一些实施方案中,所述宿主细胞产生尸胺。因此,例如,为了产生尸胺,可以在适于允许多肽表达和编码用于产生赖氨酸和/或尸胺的酶的基因表达的条件下培养经遗传修饰以表达如本文所述的CadA变体多肽的宿主细胞。根据本发明修饰的表达CadA变体多肽的宿主细胞相对于表达天然CadA的对应宿主细胞提供更高产量的尸胺。
[0087] 宿主细胞可以使用熟知技术培养(见例如在实施例章节提供的示例条件)。
[0088] 在一些实施方案中,宿主细胞使用不是盐(例如硫酸铵或者氯化铵)的氮源如氨或尿素培养。在细胞生长或者酶产生期间,宿主细胞可以在碱性pH培养。
[0089] 赖氨酸或者赖氨酸衍生物可以使用已知技术分离和纯化。根据本发明产生的赖氨酸或者赖氨酸衍生物如尸胺随后可用于任何已知方法中,例如用于产生多胺。
[0090] 在一些实施方案中,使用化学催化剂或者通过使用酶和化学催化剂可以将赖氨酸转变为己内酰胺。
[0091] 本发明将通过具体实施例更详细地描述。提供以下实施例是为了说明目的,而不是以任何方式意图限制本发明。本领域技术人员将容易地认识到各种非关键参数,其可以改变或修改以产生基本相同的结果。
[0092] 实施例
[0093] 我们假设十聚体-十聚体界面包含核心结构域中的蛋白质区段,并由在那些结构域内无确定的二级结构(α,α螺旋;β,β折叠;η,链)(参见Kanjee等人)的蛋白质部分组成。这些部分是β10和β11之间的氨基酸276-299(包括η4和α11)、β11和α12之间的氨基酸314-326(包括β12)、η6和β14之间的氨基酸344-357、β16和β18之间的氨基酸454-483(包括β17)以及β19和α17之间的氨基酸494-509。这些实例表明,这些位置的谷氨酸残基可以被取代,以增加被遗传修改表达所述CadA变体多肽的宿主细胞的尸胺产量。
[0094] 实施例1:编码CadA的质粒载体的构建
[0095] 含有野生型大肠杆菌cadA(SEQ ID NO:1)的质粒载体,其编码赖氨酸脱羧酶CadA(SEQ ID NO:2),使用PCR引物cadA-F和cadA-R从大肠杆菌MG1655K12基因组DNA扩增(图1),使用限制性酶SacI和XbaI消化,并连接到pUC18以生成质粒pCIB60。使用PCR引物cadA-F2和cadA-R2对cadA基因的5’序列上游进行优化,产生pCIB71。
[0096] 实施例2:编码在预测的界面氨基酸残基处具有半胱氨酸突变的CadA的质粒载体的构建
[0097] 使用Quickchange PCR设计引物对,以将pCIB71中位置291、344、355、463、482或499的氨基酸修饰为cadA基因的半胱氨酸。使用DNA测序验证突变,携带半胱氨酸突变的质粒标记为pCIB71-E291C、pCIB71-E344C、pCIB71-E355C、pCIB71-E463C、pCIB71-E482C或pCIB71-E499C。
[0098] 实施例3:在预测界面氨基酸残基处具有半胱氨酸突变的突变体CadA多肽的赖氨酸脱羧酶活性
[0099] 使用pCIB71-E291C、pCIB71-E344C、pCIB71-E355C、pCIB71-E463C、pCIB71-E482C或pCIB71-E499C转化蜂房哈夫尼菌。每种转化的三个单菌落在4mL含氨苄青霉素(100μg/mL)的LB培养基中于37℃过夜培养。第二天,将0.7mL各过夜培养物加入0.3mL赖氨酸-HCl和PLP中,使其终浓度分别为120g/L和0.1mM。使用1M NaOH将最终混合物的pH调节至8.0。每份混合物在37℃下孵育2小时。使用NMR定量测定每个样品的尸胺产量,并通过将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表2中显示了2小时后每个样品相对于用pCIB71转化的蜂房哈夫尼菌平均产率的平均产率。
[0100] 表2表达编码在预测的界面氨基酸残基处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率
[0101]质粒 相对产率(%)
pCIB71 100
pCIB71-E291C 188
pCIB71-E344C 110
pCIB71-E355C 170
pCIB71-E463C 120
pCIB71-E482C 137
pCIB71-E499C 112
[0102] 如表2所示,几个突变提高了pH8.0时CadA多肽的活性。突变E291C、E355C和E482C使相对产率显著增加30%以上。突变E344C、E463C和E499C使产率增加10%至30%。
[0103] 实施例4.编码在具有偏离(deviant)pKa的预测界面氨基酸残基具有半胱氨酸突变的CadA的质粒载体的构建和突变蛋白质的赖氨酸脱羧酶的分析
[0104] 该实施例表明,在预测界面氨基酸残基的修饰不会增加尸胺产量。
[0105] 使用Quickchange PCR设计引物对,以将pCIB71中cadA基因位置279、288、319、323、346、353、357或470的氨基酸修饰为半胱氨酸。使用DNA测序验证突变,携带半胱氨酸突变的质粒标记为pCIB71-E279C、pCIB71-R288C、pCIB71-K319C、pCIB71-D323C、pCIB71-K346C、pCIB71-R353C、pCIB71-K357C或pCIB71-D470C。
[0106] 使用pCIB71-E279C、pCIB71-R288C、pCIB71-K319C、pCIB71-D323C、pCIB71-K346C、pCIB71-R353C、pCIB71-K357C和pCIB71-D470C转化蜂房哈夫尼菌。每种转化的三个单菌落在4mL含氨苄青霉素(100μg/mL)的LB培养基中于37℃过夜培养。第二天,将0.7mL各过夜培养物加入0.3mL赖氨酸-HC1和PLP中,使其终浓度分别为120g/L和0.1mM。使用1M NaOH将最终混合物的pH调节至8.0。每份混合物在37℃孵育2小时。使用NMR定量测定每个样品的尸胺产量,并通过将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表3中显示了2小时后每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的平均产率。如表3所示,在pH8.0时,所有的突变都降低了尸胺的产量。
[0107] 表3.表达编码在具有偏离pKa的预测界面氨基酸残基处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率
[0108]质粒 相对产率(%) 质粒 相对产率(%)
pCIB71 100 pCIB71-K346C 81
pCIB71-E279C 60 pCIB71-R353C 75
pCIB71-R288C 67 pCIB71-K357C 79
pCIB71K319C 82 pCIB71-D470C 60
pCIB71-D323C 85    
[0109] 实施例5:编码在E291具有突变的CadA的质粒载体的构建
[0110] 使用Quickchange PCR设计引物对,以修饰pCIB71中cadA基因位置291处的氨基酸。使用DNA测序验证突变,将在氨基酸位置291处携带每种突变的质粒标记为pCIB71-E291X,其中X为替代谷氨酸残基的氨基酸。
[0111] 实施例6:编码在E355具有突变的CadA的质粒载体的构建
[0112] 使用Quickchange PCR设计引物对,以修饰pCIB71中cadA基因位置355处的氨基酸。使用DNA测序验证突变,将在氨基酸位置355处携带每种突变的质粒标记为pCIB71-E355X,其中X为替代谷氨酸残基的氨基酸。
[0113] 实施例7:编码在E482具有突变的CadA的质粒载体的构建
[0114] 利用Quickchange PCR,设计引物以修饰pCIB71中cadA基因位置468处的氨基酸。使用DNA测序验证突变,将在氨基酸位置482处携带每种突变的质粒标记为pCIB71-E482X,其中X为替代谷氨酸残基的氨基酸。
[0115] 实施例8:具有E291X突变的突变体CadA多肽的赖氨酸脱羧酶活性
[0116] 使用pCIB71-E291X转化蜂房哈夫尼菌。每种转化的三个单菌落在4mL含氨苄青霉素(100μg/mL)的LB培养基中于37℃过夜培养。第二天,将0.7mL各过夜培养物加入0.3mL赖氨酸-HCl和PLP中,使其终浓度分别为120g/L和0.1mM。使用1M NaOH将最终混合物的pH调节至8.0。每份混合物在37℃孵育2小时。使用NMR定量测定每个样品的尸胺产量,并通过将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表4中显示了2小时后每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的产率。
[0117] 表4.表达编码在氨基酸位置291处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率
[0118]质粒 相对产率(%) 质粒 相对产率(%)
pCIB71 100 pCIB71-E291M 97
pCIB71-E291A 126 pCIB71-E291N 120
pCIB71-E291C 148 pCIB71-E291P 4
pCIB71-E291D 135 pCIB71-E2910 98
pCIB71-E291F 82 pCIB71-E291R 127
pCIB71-E291G 120 pCIB71-E291S 108
pCIB71-E291H 131 pCIB71-E291T 96
pCIB71-E291I 98 pCIB71-E291V 135
pCIB71-E291K 111 pCIB71-E291W 74
pCIB71-E291L 100 pCIB71-E291Y 80
[0119] 如表4所示,在氨基酸位置291的几个突变提高了pH8.0时CadA多肽的活性。突变E291A、E291C、E291D、E291H、E291R和E291V使相对产率增加25%以上。突变E291G、E291K、E291N和E291S也增加了产率。突变E291I、E291L、E291M、E291Q和E291T对产率几乎没有影响。其余突变E291F、E291P、E291W和E291Y降低了产率。
[0120] 实施例9:具有E355X突变的突变体CadA多肽的赖氨酸脱羧酶活性
[0121] 使用pCIB71-E355X转化蜂房哈夫尼菌。每种转化的三个单菌落在4mL含氨苄青霉素(100μg/mL)的LB培养基中于37℃过夜培养。第二天,将0.7mL各过夜培养物加入0.3mL赖氨酸-HCl和PLP中,使其终浓度分别为120g/L和0.1mM。使用1M NaOH将最终混合物的pH调节至8.0。每份混合物在37℃孵育2小时。使用NMR定量测定每个样品的尸胺产量,并通过将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表5中显示了2小时后每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的产率。
[0122] 表5.表达编码在氨基酸位置355处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率
[0123]质粒 相对产率(%) 质粒 相对产率(%)
pCIB71 100 pCIB71-E355M 141
pCIB71-E355A 0 pCIB71-E355N 135
pCIB71-E355C 157 pCIB71-E355P 150
pCIB71-E355D 97 pCIB71-E355Q 151
pCIB71-E355F 149 pCIB71-E355R 152
pCIB71-E355G 0 pCIB71-E355S 143
pCIB71-E355H 147 pCIB71-E355T 148
pCIB71-E355I 104 pCIB71-E355V 145
pCIB71-E355K 139 pCIB71-E355W 111
pCIB71-E355L 136 pCIB71-E355Y 141
[0124] 如表5所示,除E355A、E355D、E355G、E3551和E355W外,在氨基酸位置355处的大多数突变在pH8.0时提高了产率。突变E355D、E355I和E355W对产率几乎没有影响。突变E355A和E355G降低了产率。
[0125] 实施例10:具有E482X突变的突变体Cada多肽的赖氨酸脱羧酶活性
[0126] 使用pCIB71-E482X转化蜂房哈夫尼菌。每种转化的三个单菌落在4mL含氨苄青霉素(100μg/mL)的LB培养基中于37℃过夜培养。第二天,将0.7mL各过夜培养物加入0.3mL赖氨酸-HCl和PLP中,使其终浓度分别为120g/L和0.1mM。使用1M NaOH将最终混合物的pH调节至8.0。每份混合物在37℃孵育2小时。使用NMR定量测定每个样品的尸胺产量,并通过将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表6中显示了2小时后每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的产率。
[0127] 表6.表达编码在氨基酸位置482处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率
[0128]
[0129]
[0130] 如表6所示,在氨基酸位置482处的几个突变提高了pH8.0时CadA多肽的活性。突变E482C、E482F、E482I、E482L、E482S、E482W和E482Y使相对产率增加25%以上。突变E482A、E482H、E482K和E482M也增加了产率。突变E482D和E482N对产率几乎没有影响。其余突变E482G、E482P、E482Q、E482R、E482T和E482V降低了产率。
[0131] 实施例11:碱性pH条件突变体CadA多肽的体外动力学分析
[0132] 100mL用pCIB71、pCIB71-E291C、pCIB71-E355C或pCIB71-E482C转化的蜂房哈夫尼菌的样品使用法式压榨(french press)进行裂解。离心该裂解样品,从沉淀物中分离上清液,以便进行体外实验。各反应在含120g/L赖氨酸-HCl和0.1mM PLP的Tris-HCl缓冲液(50mM的Tris-HCl,pH6或8,25mM的NaCl,2mM的EDTA)中进行。使用NMR测定各裂解样品的反应速率:在PLP存在的条件下,每1.6分钟采集一次将赖氨酸转化为尸胺的量,共持续20分钟,并取收率曲线线性部分的斜率。稀释样品,从而各样品的反应速率U(mmol/min/mL)为4。在初始pH为6或pH为8时,使用相同的U测定各裂解样品赖氨酸的动力学常数Vmax和Km。两种样品的动力学分析结果见表7。
[0133] 表7.在不同pH条件下表达编码野生型或突变体CadA多肽的质粒的蜂房哈夫尼菌的裂解样品的归一化Vmax的动力学分析
[0134]pH pCIB71 pCIB71-E291C pCIB71-E355C pCIB71-E482C
6 100% 100% 100% 100%
8 73% 88% 91% 90%
[0135] 如表7所示,与pH6相比,野生型CadA(pCIB71)在pH8活性损失27%。令人惊讶的是,与野生型CadA多肽相比,突变体CadA多肽(pCIB71-E291C、pCIB71-E355C和pCIB71-E486C)在pH8示出显著更高的活性,尽管野生型和突变体在pH6的活性无显著差异。
[0136] 表8.实施例中使用的质粒和菌株表
[0137]
[0138]
[0139]
[0140] 表9.实施例中使用的引物序列表
[0141]
[0142]
[0143]
[0144] 示例性序列:
[0145] SEQ ID NO:1大肠杆菌cadA核酸序列
[0146] ATGAACGTTATTGCAATATTGAATCACATGGGGGTTTATTTTAAAGAAGAACCCATCCGTGAACTTCATCGCGCGCTTGAACGTCTGAACTTCCAGATTGTTTACCCGAACGACCGTGACGACTTATTAAAACTGATCGAAAACAATGCGCGTCTGTGCGGCGTTATTTTTGACTGGGATAAATATAATCTCGAGCTGTGCGAAGAAATTAGCAAAATGAACGAGAACCTGCCGTTGTACGCGTTCGCTAATACGTATTCCACTCTCGATGTAAGCCTGAATGACCTGCGTTTACAGATTAGCTTCTTTGAATATGCGCTGGGTGCTGCTGAAGATATTGCTAATAAGATCAAGCAGACCACTGACGAATATATCAACACTATTCTGCCTCCGCTGACTAAAGCACTGTTTAAATATGTTCGTGAAGGTAAATATACTTTCTGTACTCCTGGTCACATGGGCGGTACTGCATTCCAGAAAAGCCCGGTAGGTAGCCTGTTCTATGATTTCTTTGGTCCGAATACCATGAAATCTGATATTTCCATTTCAGTATCTGAACTGGGTTCTCTGCTGGATCACAGTGGTCCACACAAAGAAGCAGAACAGTATATCGCTCGCGTCTTTAACGCAGACCGCAGCTACATGGTGACCAACGGTACTTCCACTGCGAACAAAATTGTTGGTATGTACTCTGCTCCAGCAGGCAGCACCATTCTGATTGACCGTAACTGCCACAAATCGCTGACCCACCTGATGATGATGAGCGATGTTACGCCAATCTATTTCCGCCCGACCCGTAACGCTTACGGTATTCTTGGTGGTATCCCACAGAGTGAATTCCAGCACGCTACCATTGCTAAGCGCGTGAAAGAAACACCAAACGCAACCTGGCCGGTACATGCTGTAATTACCAACTCTACCTATGATGGTCTGCTGTACAACACCGACTTCATCAAGAAAACACTGGATGTGAAATCCATCCACTTTGACTCCGCGTGGGTGCCTTACACCAACTTCTCACCGATTTACGAAGGTAAATGCGGTATGAGCGGTGGCCGTGTAGAAGGGAAAGTGATTTACGAAACCCAGTCCACTCACAAACTGCTGGCGGCGTTCTCTCAGGCTTCCATGATCCACGTTAAAGGTGACGTAAACGAAGAAACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACTACGGTATCGTGGCGTCCACTGAAACCGCTGCGGCGATGATGAAAGGCAATGCAGGTAAGCGTCTGATCAACGGTTCTATTGAACGTGCGATCAAATTCCGTAAAGAGATCAAACGTCTGAGAACGGAATCTGATGGCTGGTTCTTTGATGTATGGCAGCCGGATCATATCGATACGACTGAATGCTGGCCGCTGCGTTCTGACAGCACCTGGCACGGCTTCAAAAACATCGATAACGAGCACATGTATCTTGACCCGATCAAAGTCACCCTGCTGACTCCGGGGATGGAAAAAGACGGCACCATGAGCGACTTTGGTATTCCGGCCAGCATCGTGGCGAAATACCTCGACGAACATGGCATCGTTGTTGAGAAAACCGGTCCGTATAACCTGCTGTTCCTGTTCAGCATCGGTATCGATAAGACCAAAGCACTGAGCCTGCTGCGTGCTCTGACTGACTTTAAACGTGCGTTCGACCTGAACCTGCGTGTGAAAAACATGCTGCCGTCTCTGTATCGTGAAGATCCTGAATTCTATGAAAACATGCGTATTCAGGAACTGGCTCAGAATATCCACAAACTGATTGTTCACCACAATCTGCCGGATCTGATGTATCGCGCATTTGAAGTGCTGCCGACGATGGTAATGACTCCGTATGCTGCATTCCAGAAAGAGCTGCACGGTATGACCGAAGAAGTTTACCTCGACGAAATGGTAGGTCGTATTAACGCCAATATGATCCTTCCGTACCCGCCGGGAGTTCCTCTGGTAATGCCGGGTGAAATGATCACCGAAGAAAGCCGTCCGGTTCTGGAGTTCCTGCAGATGCTGTGTGAAATCGGCGCTCACTATCCGGGCTTTGAAACCGATATTCACGGTGCATACCGTCAGGCTGATGGCCGCTATACCGTTAAGGTATTGAAAGAAGAAAGCAAAAAATAA[0147] SEQ ID NO:2CadA多肽序列
[0148] MNVIAILNHMGVYFKEEPIRELHRALERLNFQIVYPNDRDDLLKLIENNARLCGVIFDWDKYNLELCEEISKMNENLPLYAFANTYSTLDVSLNDLRLQISFFEYALGAAEDIANKIKQTTDEYINTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSLFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEQYIARVFNADRSYMVTNGTSTANKIVGMYSAPAGSTILIDRNCHKSLTHLMMMSDVTPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLRTESDGWFFDVWQPDHIDTTECWPLRSDSTWHGFKNIDNEHMYLDPIKVTLLTPGMEKDGTMSDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQELAQNIHKLIVHHNLPDLMYRAFEVLPTMVMTPYAAFQKELHGMTEEVYLDEMVGRINANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEESKK
[0149] SEQ ID NO:3来自克雷伯氏菌与大肠杆菌CadA同源的多肽
[0150] MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIODLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
[0151] SEQ ID NO:4来自肠杆菌科与大肠杆菌CadA同源的多肽
[0152] MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
[0153] SEQ ID NO:5来自肠道沙门氏菌与大肠杆菌CadA同源的多肽
[0154] MNVIAIMNHMGVYFKEEPIRELHRALEGLNFRIVYPNDREDLLKLIENNSRLCGVIFDWDKYNLELCEEISKLNEYMPLYAFANSYSTLDVSLNDLRMQVRFFEYALGAATDIAAKIRQNTDEYIDNILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYQGKCGMSGDRVEGKIIYETQSTHKLLAAFSQASMIHVKGDINEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLKSESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTILTPGMKKDGTMDEFGIPASLVAKYLDERGIIVEKTGPYNLLFLFSIGIDKTKALSLLRALTEFKRAFDLNLRVKNILPALYREAPEFYENMRIQELAQNIHKLVEHHNLPDLMYRAFEVLPKMVMTPYTAFQKELHGETEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKENTK