使用木糖利用基因表达增强的细菌进行发酵以生产L—氨基酸的方法转让专利

申请号 : CN200510076242.X

文献号 : CN1749390B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : A·N·马辰科S·V·伯内沃伦斯基E·V·克亚奇科Y·I·科滋洛夫E·B·沃罗斯洛瓦M·M·古斯亚蒂纳

申请人 : 味之素株式会社

摘要 :

本发明公开了一种生产L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和L-色氨酸的方法,其中使用埃希氏菌属细菌,该细菌中编码木糖利用酶的基因,如xylABFGHR基因座的表达量增加。该方法包括在含有木糖的培养基中培养L-氨基酸生产菌,并且从培养基中收集L-氨基酸。

权利要求 :

1.肠杆菌科(Enterobacteriaceae)的L-氨基酸生产菌,该细菌通过增加xylABFGHR基因座的表达量而具有增强的木糖利用酶活性。

2.根据权利要求1所述的细菌,其中该细菌属于埃希氏菌属(Escherichia)。

3.根据权利要求2所述的细菌,其中,该细菌属于大肠杆菌。

4.根据权利要求1所述的细菌,其中该细菌属于泛菌属(Pantoea)。

5.根据权利要求1所述的细菌,其中木糖利用酶活性通过增加xylABFGHR基因座的拷贝数或修饰表达调控序列以增强xylABFGHR基因座的表达而增强。

6.根据权利要求5所述的细菌,其中拷贝数通过用含有xylABFGHR基因座的低拷贝载体转化细菌而增加。

7.根据权利要求1所述的细菌,其中xylABFGHR基因座来自属于大肠杆菌的细菌。

8.生产L-氨基酸的方法,该方法包括在含有葡萄糖和戊糖混合物的培养基中培养权利要求1至7中任一项所述细菌,并且从培养基中收集L-氨基酸。

9.根据权利要求8所述的方法,其中戊糖是阿拉伯糖和木糖。

10.根据权利要求8所述的方法,其中糖的混合物是从纤维素生物质中获得的糖的原材料混合物。

11.根据权利要求8所述的方法,其中生产的L-氨基酸是L-组氨酸。

12.根据权利要求11所述的方法,其中该细菌增强表达L-组氨酸生物合成相关基因。

13.根据权利要求8所述的方法,其中生产的L-氨基酸是L-苏氨酸。

14.根据权利要求13所述的方法,其中该细菌增强表达L-苏氨酸生物合成相关基因。

15.根据权利要求8所述的方法,其中生产的L-氨基酸是L-赖氨酸。

16.根据权利要求15所述的方法,其中该细菌具有S-(2-氨基乙基)-L-半胱氨酸抗性。

17.根据权利要求8所述的方法,其中生产的L-氨基酸是L-谷氨酸。

18.根据权利要求17所述的方法,其中该细菌缺乏a-酮戊二酸盐脱氢酶活性或具有减弱的a-酮戊二酸盐脱氢酶活性。

19.根据权利要求8所述的方法,其中生产的L-氨基酸是L-色氨酸。

20.根据权利要求19所述的方法,其中该细菌增强表达L-色氨酸生物合成相关基因。

说明书 :

使用木糖利用基因表达增强的 细菌进行发酵以生产L—

氨基酸的方法

技术领域

[0001] 本发明涉及通过戊糖发酵生产L-氨基酸的方法,更具体地涉及使用木糖利用基因表达增强的细菌,以阿拉伯糖和/或木糖与葡萄糖一起的混合物作为碳源进行发酵从而生产L氨基酸的方法。在商业上生产L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和L-色氨酸时,可以使用廉价的碳源,其包括来自纤维素生物质(cellulosic biomass)的半纤维素片段的己糖和戊糖混合物。

背景技术

[0002] 一般的,L-氨基酸利用不同微生物菌株通过发酵方法进行工业化生产。该方法中所使用的发酵培养基通常包括充足量的各种碳源和氮源。
[0003] 常规地,各种碳水化合物如己糖、戊糖、丙糖;各种有机酸和醇被用作碳源。己糖包括葡萄糖、果糖、甘露糖、山梨糖、半乳糖等等。戊糖包括阿拉伯糖、木糖、核糖等等。然而,上述碳水化合物以及其它现在用于工业的常规碳源,如糖浆、谷物、糖蔗、淀粉、其水解产物等均相当昂贵。因此,需要找出更加廉价的替代碳源用于L-氨基酸的生产。 [0004] 纤维素生物质是一种合适的用于L-氨基酸生产的原料,因为其易于得到并且比碳水化合物、谷物、糖蔗或其它碳源便宜。在纤维素生物质中纤维素、半纤维素和木质素的常规量为约40-60%的纤维素、20-40%的半纤维素、10-25%的木质素和10%的其它成分。纤维素成分由己糖,通常是葡萄糖的聚合物组成。半纤维素成分主要由戊糖,包括木糖和阿拉伯糖组成。各种纤维素生物质原料的组成如表1所示(http://www.ott.doe.gov/biofuels/understanding_biomass.html)。
[0005] 表1
[0006]
[0007] 有关超过150种生物质(biomass)样品成分更加详细的信息汇总于“生物质原材料的组成与性质数据库”(http://www.ott.doe.gov/biofuels/progs/searchl.cgi)中。 [0008] 近来希望开发一种能够有效的将纤维素生物质转化为可发酵原材料,通常为碳水化合物的混合物的工业方法。因此,近期希望增加利用可再生的能量来源如纤维素和半纤维素生产有用的化合物(AristidouA.,Pentila.M.,Curr.Opin,Biotech nol,2000,Apr.,11:2,187-198)。然而,绝大部分已发表的文章和专利,或专利申请,记载的是借助生物催化剂(细菌和酵母)利用纤维素生物质生产乙醇,其被期望成为有效的代用燃料。该方法包括使用不同的运动发酵单胞菌(Zymomonas mobilis)改良菌株(Deanda K.等,Appl.Environ.Microbiol.,1996 Dec.,62:12,4465-70;Mohagheghi A.等,Appl.Biochem.Biotechnol.,2002,98-100:885-98;Lawford H.G.,RousseauJ.D.,Appl.Biochem.Biotechnol,2002,98-100:429-48;PCT申请WO95/28476,WO98/50524)、大肠杆菌(Escherichia coli)改良菌株(Dien B.S.等,Appl.Biochem.Biotechnol,2000,84-86:181-96;Nichols N.N.等,Appl.Microbiol.Biotechnol.,2001 Jul,56:1-2,120-5;美国专利5,000,000)进行纤维素生物质的发酵。利用热带假丝酵母菌(Candida tropicalis)对来自半纤维素糖的木糖进行发酵可生产木糖醇(Walthers T.等,Appl.Biochem.Biotechnol.,2001,91-93:423-35)。使用重组的大肠杆菌(Escherichia coli)菌株对阿拉伯糖、果糖、半乳糖、葡萄糖、乳糖、麦芽糖、蔗糖、木糖和其组合物进行发酵可生产1,
2-丙二醇(美国专利6,303,352)。还有报导通过使用大肠杆菌菌株对葡萄糖/木糖/阿拉伯糖混合物进行发酵可获得3-脱氢莽草酸。与单独采用木糖或葡萄糖作为碳源相比,当使用葡萄糖/木糖/阿拉伯糖混合物作为碳源时所获得的3-脱氢莽草酸的浓度和产量最高(KaiLi and J.W.Frost,Biotechnol.Prog.,1999,15,876-883)。
[0009] 有报导称大肠杆菌可以利用戊糖如L-阿拉伯糖和D-木糖(Escherichiacoli and Salmonella,Second Edition,Editor in Chief:F.C.Neidhardt,ASMPress,Washingtong D.C.,1996)。L-阿拉伯糖转运进细胞是通过两种诱导型系统:(1)araE基因编码的低亲合力通透酶(Km约0.1mM),和(2)araFG操纵子编码的高亲合力(Km为1到3μM)系统。araF基因编码具有趋化受体 功能的周围胞质结合蛋白(306个氨基酸),araG基因座编码内膜蛋白。糖的代谢是通过araBAD操纵子编码的一组酶:异构酶(araA基因编码),其可逆的将醛醣转化为L-核酮糖;激酶(araB基因编码),其将酮糖磷酸化为L-核酮糖5-磷酸盐;和L-核酮糖-5-磷酸-4-差向异构酶(araD基因编码),其催化D-木糖-5-磷酸盐的形成(Escherichia coli and Salmonella,SecondEdition,Editor in Chief:F.C.Neidhardt,ASM Press,Washingtong D.C.,1996)。
[0010] 大部分大肠杆菌菌株可在D-木糖中生长,但K-12菌株需要变异后才可在该化合物中生长。该戊糖的利用是通过诱导型且分解代谢物抑制的途径,其中包括利用两种诱导型通透酶(对D-核糖或D-阿拉伯糖无活性)转运通过胞质膜,异构化为D-木酮糖,以及ATP依赖型磷酸化戊酮糖产生D-木酮糖5-磷酸盐。高亲合力(Km为0.3到3μM)转运系统依赖于周围胞质结合蛋白(37,000Da)并且可能由高能化合物驱动。低亲合力(Km约170μM)系统由质子间原动力激活。该D-木糖-质子-同向转移系统由xylE基因编码。
对应于D-木糖利用的主要基因群为xylAB(RT)。xylA基因编码异构酶(54,000Da),xylB基因编码激酶(52,000Da)。操纵子包括两个转录起始位点,其中一个插入到xylB开放读码框上游。由于低亲合力通透酶对应于不连接的xylE,xylT基因座,也称为xylF(xylFGHR),可能编码高亲合力转运系统并且因此含有至少两个基因(一个编码周围胞质蛋白,一个编码完整的膜蛋白)(Escherichia coli and Salmonella,Second Edition,Editor inChief:
F.C.Neidhardt,ASM Press,Washingtong D.C.,1996)。该xylFGHR基因编码木糖ABC转运蛋白,其中xylF基因编码推定的木糖结合蛋白,xylG基因编码推定的ATP结合蛋白,xylH基因编码推定的膜成分,xylR基因编码木糖转录激活蛋白。
[0011] 导入上述编码L-阿拉伯糖异构酶、L-核酮糖激酶、L-核酮糖5-磷酸4-差向异构酶、木糖异构酶和木酮糖激酶,加上转醛醇酶和转酮醇酶的E.coli基因,可使微生物,如运动发酵单胞菌,将阿拉伯糖和木糖代谢为乙醇(WO/9528476,WO98/50524)。相反,编码乙醇脱氢酶(ADH)和丙酮酸脱羧酶(PDH)的发酵单胞菌基因也可用于大肠杆菌菌株的乙醇生产(Dien B.S.等,Appl.Biochem.Biotechnol,2000,84-86:181-96;美国专利5,000,000)。 [0012] 本发明的作者以前公开了一种通过发酵葡萄糖和戊糖,如阿拉伯糖和木糖 的混合物生产L-氨基酸,如L-异亮氨酸、L-组氨酸、L-苏氨酸和L-色氨酸的方法(Russian patent application 2003105269)。
[0013] 然而,至今没有关于木糖利用基因,如xylABFGHR基因座的基因表达增强的细菌,或使用这些基因从己糖和戊糖混合物中生产L-氨基酸的报导。
[0014] 发明概述
[0015] 本发明的目的在于增强L-氨基酸生产菌株的产量,提供木糖利用基因表达增强的L-氨基酸生产菌,并且提供使用该细菌从己糖,如葡萄糖,和戊糖,如木糖或阿拉伯糖的混合物中生产L-氨基酸的方法。从纤维素生物质中获得的发酵原材料可用作培养基的碳源。该目的的实现是基于发现克隆到低拷贝载体上的xylABFGHR基因座可增强L-氨基酸,例如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和L-色氨酸的产量。所使用的微生物能够在发酵原材料中生长并且有效生产L-氨基酸。该用作碳源的发酵原材料由木糖和阿拉伯糖以及葡萄糖组成。L-氨基酸生产菌株的示例为大肠杆菌菌株。由此完成本发明。 [0016] 本发明的目的是提供生产L-氨基酸的肠杆菌科(Enterobacteriaceae)家族的细菌,其具有活性增强的任意木糖利用酶。
[0017] 本发明进一步的目的是提供上述细菌,其中该细菌属于埃希氏菌属(Escherichia)。
[0018] 本发明进一步的目的是提供上述细菌,其中该细菌属于泛菌属(Pantoea)。 [0019] 本发明进一步的目的是提供上述细菌,其中所述木糖利用酶活性通过增加xylABFGHR基因座的表达量而增强。
[0020] 本发明进一步的目的是提供上述细菌,其中所述木糖利用酶活性通过增加xylABFGHR基因座的拷贝数或修饰基因的表达调控序列以增强基因的表达而提高。 [0021] 本发明进一步的目的是提供上述细菌,其中拷贝数通过用含有xylABFGHR基因座的低拷贝载体转化细菌而增加。
[0022] 本发明进一步的目的是提供上述细菌,其中xylABFGHR基因座源自属于埃希氏菌属(Escherichia)的细菌。
[0023] 本发明进一步的目的是提供一种生产L-氨基酸的方法,其包括在含有葡萄糖和戊糖混合物的培养基中培养上述细菌,以及从培养基中收集L-氨基酸。
[0024] 本发明进一步的目的是提供上述方法,其中戊糖是阿拉伯糖和木糖。 [0025] 本发明进一步的目的是提供上述方法,其中糖的混合物是从纤维素生物质中获得的糖的原材料混合物。
[0026] 本发明进一步的目的是提供上述方法,其中生产的L-氨基酸是L-组氨酸。 [0027] 本发明进一步的目的是提供上述方法,其中所述细菌增强表达L-组氨酸生物合成相关基因。
[0028] 本发明进一步的目的是提供上述方法,其中生产的L-氨基酸是L-苏氨酸。 [0029] 本发明进一步的目的是提供上述方法,其中所述细菌增强表达L-苏氨酸生物合成相关基因。
[0030] 本发明进一步的目的是提供上述方法,其中生产的L-氨基酸是L-赖氨酸。 [0031] 本发明进一步的目的是提供上述方法,其中所述细菌增强表达L-赖氨酸生物合成相关基因。
[0032] 本发明进一步的目的是提供上述方法,其中生产的L-氨基酸是L-谷氨酸。 [0033] 本发明进一步的目的是提供上述方法,其中所述细菌增强表达L-谷氨酸生物合成相关基因。
[0034] 本发明进一步的目的是提供上述方法,其中生产的L-氨基酸是L-色氨酸。 [0035] 本发明进一步的目的是提供上述方法,其中所述细菌增强表达L-色氨酸生物合成相关基因。
[0036] 该生产L-氨基酸的方法包括通过发酵葡萄糖和戊糖,如阿拉伯糖和木糖的混合物生产L-组氨酸。而且,该生产L-氨基酸的方法包括通过发酵葡萄糖和戊糖,如阿拉伯糖和木糖的混合物生产L-苏氨酸。而且,该生产L-氨基酸的方法包括通过发酵葡萄糖和戊糖,如阿拉伯糖和木糖的混合物生产L-赖氨酸。而且,该生产L-氨基酸的方法包括通过发酵葡萄糖和戊糖,如阿拉伯糖和木糖的混合物生产L-谷氨酸。而且,该生产L-氨基酸的方法包括通过发酵葡萄糖和戊糖,如阿拉伯糖和木糖的混合物生产L-色氨酸。用作发酵 原材料的上述葡萄糖和戊糖混合物可以从未充分利用的植物生物质资源,如纤维素生物质,优选纤维素的水解产物中获得。
[0037] 附图简述
[0038] 图1显示大肠杆菌菌株MG1655的染色体上xylABFGHR基因座的结构。图中箭头指示PCR引物的位置。
[0039] 优选实施方案的说明
[0040] 本发明中,“L-氨基酸生产菌”表示一种细菌,其在本发明所述细菌培养于培养基中时,能够引起培养基中L-氨基酸的累积。通过繁育可以赋予或增强L-氨基酸的生产能力。在此术语“L-氨基酸生产菌”也表示与野生型或亲代菌株相比能够产生并且在培养基中累积更多L-氨基酸的细菌,优选表示该微生物能够产生并且在培养基中累积不少于0.5g/L,更优选不少于1.0g/L的目的L-氨基酸。“L-氨基酸”包括L-丙氨酸、L-精氨酸、L-天冬酰胺酸、L-天冬氨酸、L-半胱氨酸、L-谷氨酸、L-谷氨酸盐、L-氨基乙酸、L-组氨酸、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-甲硫氨酸、L-苯基丙氨酸、L-脯氨酸、L-丝氨酸、L-苏氨酸、L-色氨酸、L-酪氨酸和L-缬氨酸。
[0041] 肠杆菌科(enterobacteriaceae)家族包括属于埃希氏菌属(Escherichia)、肠杆菌属(Enterobacter)、欧氏杆菌属(Erwinia)、克雷伯杆菌属(Klebsiella)、泛菌属(Pantoea)、Photorhabdus、普鲁维登斯杆菌(Providencia)、沙门氏菌属(Salmonella)、沙雷菌属(Serratia)、志贺菌属(Shigella)、摩根菌属(Morganella)、耶尔森菌属(Yersinia)等属的细菌。具体地,可以使用根据NCBI(National Center for Biotechnology Information)数据库中的分类法 (http://www.ncbi.nlm.nih.gov/htbinpost/Taxonomy/wgetorg?mode=Tree&id=1236&1v1=3&keep=1&srchmode=1&unlock)分类于肠杆菌科中的细菌。优选埃希氏菌属或泛菌属的细菌。
[0042] 术语“埃希氏菌属细菌”表示该细菌根据微生物技术领域常规技术人员公知的分类法分类于埃希氏菌属。用于本发明的埃希氏菌属细菌的例子包括,但不限于大肠杆菌(E.coli)。
[0043] 能够用于本发明的埃希氏菌属细菌未作特别限制,但是例如,Neidhardt,F.C.等所记述的细菌(Escherichia coli and Salmonella,Second Edition,Editor in Chief:F.C.Neidhardt,ASM Press,Washingtong D.C.,1208,表1)包含于本发明中。术语“泛菌属细菌”表示该细菌根据微生物技术领域常规技术人员公知的分类法分类于泛菌属。根据对16S rRNA等的核苷酸序列分析,一些成团肠杆菌(Enterobacter agglomerans)的种现在重新分类到成团泛菌(Pantoeaagglomerans)、Pantoea ananatis、Pantoea Stewartii等中。
[0044] 术语“木糖利用酶增强的活性”表示每个细胞中酶的活性高于未修饰的菌株,如野生型菌株。例子包括其中每个细胞中酶分子数量增加和每个酶分子的特异性活性增加等等。基因编码蛋白数量的测量可以采用已知方法,包括SDS-PAGE后进行免疫印迹分析(Western blotting analysis)等。此外,用作对照的野生型菌株包括,例如大肠杆菌K-12。作为增强木糖利用酶细胞内活性的结果,可以观察到L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和或L-色氨酸在培养基中累积。
[0045] “木糖利用酶”包括木糖转运、木糖异构和木糖磷酸化的酶以及调控蛋白。该酶包括木糖异构酶、木酮糖激酶、木糖转运蛋白和木糖转录激活蛋白。木糖异构酶催化D-木糖到D-木酮糖的异构反应。木酮糖激酶催化D-木酮糖使用ATP生成D-木酮糖-5-磷酸盐和ADP的磷酸化反应。木糖利用酶,如木糖异构酶、木酮糖激酶活性的存在分别取决于相应木糖异构酶阴性或木酮糖激酶阴性大肠杆菌突变体的互补作用。
[0046] 术语“埃希氏菌属细菌”表示该细菌根据微生物学领域常规技术人员公知的分类法分类于埃希氏菌属。用于本发明的埃希氏菌属微生物的一个实例是大肠杆菌(E.coli)。 [0047] 术语“增加基因表达量”表示基因的表达量高于未修饰的菌株,如野生型菌株。这种修饰的例子包括增加每个细胞中表达基因的数量,增加基因的表达水平等。表达基因拷贝数的定量可以通过,例如限制性酶切染色体DNA后用基于基因序列的探针进行DNA印迹分析(Sourthn blotting),荧光原位杂交(HSH)等进行测量。基因表达水平可以采用多种不同方法,包括RNA印迹分析(Northern blotting),定量RT-PCT等测定。此外,可用作对照的野生型菌株包括,例如大肠杆菌K-12。作为增强木糖利用酶细胞内活性的结果,可以观察到L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和或L-色氨酸在含有戊糖,如木糖的培养基中累积。
[0048] 细菌细胞内木糖利用酶活性的增强能够通过增加所述酶编码基因的表达实现。木糖利用有关的基因包括任何得自肠杆菌科家族细菌的基因,以及得自其它细菌如嗜热杆菌(thermophilic Bacillus sp)的基因(Biochem,Mol.Bio.Int.,1996,39(5),1049-1062)。优选得自埃希氏菌属细菌的基因。
[0049] 大肠杆菌木糖异构酶(EC编号5.3.1.5)的编码基因是已知的并且标明为xylA(GenBank accession NC_000913.1的序列中核苷酸编号3727072到3728394,gi:16131436)。木酮糖激酶(EC编号2.7.1.17)的编码基因是已知的并且标明为xylB(GenBank accession NC_000913.1的序列中核苷酸编号3725546到3727000,gi:16131435)。木糖结合蛋白转运系统的编码基因是已知的并且标明为xylF(GenBank accession NC_000913.1的序列中核苷酸编号3728760到3729752,gi:16131437)。推定的木糖转运系统ATP结合蛋白的编码基因是已知的并且标明为xylG(GenBank accession NC_000913.1的序列中核苷酸编号3729830到3731371,gi:16131438)。ABC类木糖转运系统通透酶组分的编码基因是已知的并且标明为xylH(GenBank accession NC_000913.1的序列中核苷酸编号
3731349到3732530,gi:16131439)。xyl操纵子转录调控蛋白的编码基因是已知的并且标明为xylR(GenBank accession NC_000913.1的序列中核苷酸编号3732608到3733786,gi:
16131440)。因此,上述基因可以通过使用基于基因核苷酸序列的引物进行PCR(聚合酶链反应;参考White,T.J.等.,TrendsGenet.,5,185(1989))而获得。
[0050] 其它微生物的木糖利用酶编码基因可以类似的获得。
[0051] 编码下述蛋白(A)或(B)的DNA是大肠杆菌xylA基因的范例:
[0052] (A)具有SEQ ID NO:2所示的氨基酸序列的蛋白;或
[0053] (B)具有在SEQ ID NO:2所示的氨基酸序列中缺失、替换、插入或增加一个或几个氨基酸后所得的氨基酸序列,且具有木糖异构酶活性的蛋白。
[0054] 编码下述蛋白(C)或(D)的DNA是大肠杆菌xylB基因的范例:
[0055] (C)具有SEQ ID NO:4所示的氨基酸序列的蛋白;或
[0056] (D)具有在SEQ ID NO:4所示的氨基酸序列中缺失、替换、插入或增加一个或几个氨基酸后所得的氨基酸序列,且具有木酮糖激酶活性的蛋白。
[0057] 编码下述蛋白(E)或(F)的DNA是大肠杆菌xylF基因的范例:
[0058] (E)具有SEQ ID NO:6所示的氨基酸序列的蛋白;或
[0059] (F)具有在SEQ ID NO:6所示的氨基酸序列中缺失、替换、插入或增加一个或几个氨基酸后所得的氨基酸序列的蛋白,其具有当L-氨基酸生产菌中蛋白量与xylAB和xylGHR基因编码的蛋白量增加时,增加培养基中L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和或L-色氨酸含量的活性。
[0060] 编码下述蛋白(G)或(H)的DNA是大肠杆菌xylG基因的范例:
[0061] (G)具有SEQ ID NO:8所示的氨基酸序列的蛋白;或
[0062] (H)具有在SEQ ID NO:8所示的氨基酸序列中缺失、替换、插入或增加一个或几个氨基酸后所得的氨基酸序列的蛋白,其具有当L-氨基酸生产菌中蛋白量与xylAB和xylFHR基因编码的蛋白量增加时,增加培养基中L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和或L-色氨酸含量的活性。
[0063] 编码下述蛋白(I)或(J)的DNA是大肠杆菌xylH基因的范例:
[0064] (I)具有SEQ ID NO:10所示的氨基酸序列的蛋白;或
[0065] (J)具有在SEQ ID NO:10所示的氨基酸序列中缺失、替换、插入或增加一个或几个氨基酸后所得的氨基酸序列的蛋白,其具有当L-氨基酸生产菌中蛋白量与xylAB和xylFGR基因编码的蛋白量增加时,增加培养基中L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和或L-色氨酸含量的活性。
[0066] 编码下述蛋白(K)或(L)的DNA是大肠杆菌xylR基因的范例:
[0067] (K)具有SEQ ID NO:12所示的氨基酸序列的蛋白;或
[0068] (L)具有在SEQ ID NO:12所示的氨基酸序列中缺失、替换、插入或增加一个或几个氨基酸后所得的氨基酸序列的蛋白,其具有在当L-氨基酸生产菌中蛋白量与xylAB和xylFGH基因编码的蛋白量增加时,增加培养基中L-氨基酸,如L-组氨酸、L-苏氨酸、L-赖氨酸、L-谷氨酸和或L-色氨酸含量的活性。
[0069] 编码木糖异构酶的DNA包括编码在蛋白(A)中一个或多个位置缺失、替换、插入或增加一个或几个氨基酸,但不失去蛋白活性的蛋白的DNA。虽然“几个”氨基酸差异的数量依赖于在蛋白三维结构中氨基酸残基的位置和类 型,对于蛋白(A)其可以为2到50,优选2到20,更优选2到10。这是因为一些氨基酸相互间具有高同源性这些氨基酸的取代不会对蛋白的三维结构和活性造成大的影响。因此,蛋白(B)相对于木糖异构酶的整个氨基酸序列具有不少于30到50%优选50到70%更优选70-90%,还更优选超过90%和最优选超过95%同源性,并且具有木糖异构酶活性。同样的方法和同源生判断可以应用于其它蛋白(C)、(E)、(G)、(I)和(K)。
[0070] 为计算蛋白或DNA的同源性水平,可以使用几种计算方法,如BLAST搜索、FASTA搜索和ClustalW。
[0071] BLAST(Basic Local Alignment Search Tool)是程序blastp、blastn、blastx、megablast、tblastn和tblastx所使用的启发式搜索算法;这些程序采用Karlin、Samuel和Stephen F.Altschul的统计学方法衡量其搜索结果的显著性(“Methodsfor assessing the statistical significance of molecular sequence features by usinggeneral scoring schemes”.Proc.Natl.Acad.Sci.USA,1990,87:2264-68;“Applications and statistics for multiple high-scoring segments in molecularsequences”.Proc.Natl.Acad.Sci.USA,1993,90:5873-7)。FASTA搜索方法由W.R.Pearson描述(“Rapid and Sensitive Sequence Comparison with FASTP andFASTA”,Methods in Enzymology,1990 183:63-98)。ClustalW方法由 ThompsonJ.D.,Higgins D.G. 和Gibson T.J.描述 (“CLUSTAL W:improving the sensitivity ofprogressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight martrix choice”Nucleic Acids Res.1994,22:4673-4680)。
[0072] 对(A)中定义的蛋白的变化,例如上述那些,通常是可以保持蛋白活性的保守变化。替换变化包括变化中其氨基酸序列内至少一个残基被移除并且由不同的残基插入到它的位置。可以替换上述蛋白中原始氨基酸,并且被认为是保守替换的氨基酸例子包括:Ala替换为ser或thr;arg替换为gln、his或lys;asn替换为glu、gln、lys、his、asp;asp替换为asn、glu或gln;cys替换为ser或ala;gln替换为asn、glu、lys、his、asp或arg;glu替换为asn、gln、lys或asp;gly替换为pro;his替换为asn、lys、gln、arg、tyr;ile替换为leu、met、val、phe;leu替换为ile、met、val、phe;lys替换为asa、glu、gln、his、arg;met替换为ile、leu、val、phe;phe替换为trp、tyr、met、ile或leu;ser替换 为thr、ala;thr替换为ser或ala;trp替换为phe、ty;tyr替换为his、phe或trp;以及val替换为met、ile、leu。
[0073] 获得与(A)中定义的蛋白基本上相同的蛋白的编码DNA可以采用,例如,通过点突变对编码(A)中定义的蛋白的核苷酸序列进行修饰,导致一个或多个氨基酸残基缺失、替换、插入或增加。该修饰的DNA可以通过使用产生突变的试剂或条件处理的常规方法获得。该处理包括用羟胺处理本发明中蛋白编码DNA,或者用UV辐射或试剂,如N-甲基-N’-氮-N-亚硝基胍或亚硝酸处理含有DNA的细菌。
[0074] 编码木糖异构酶的DNA包括由于天然的多样性所导致的在埃希氏菌属细菌不同菌株中发现的变异体。通过分离在严格条件下与xylA基因或该基因一部分杂交,且编码具有木糖异构酶活性蛋白的DNA可获得编码该变异体的DNA。在此术语“严格条件”包括条件,在该条件下可形成所谓特异性杂交,同时不形成非特异性杂交。例如,严格条件包括条件,在该条件下,具有高同源性的DNA,例如相互间同源性不少于70%,优选不少于80%,更优选不少于90%,最优选不少于95%的DNA发生杂交。或者,作为严格条件例子的条件包括Southern杂交洗脱的常规条件,例如60℃,1×SSC,0.1%SDS,优选0.1×SSC,0.1%SDS。洗脱过程的持续时间取决于用于印迹的膜的类型以及制造商推荐的标准时间。例如,在严TM
格条件下Hybond N+尼龙膜(Amersham)的推荐洗脱持续时间为15分钟。优选地,洗脱可以进行2到3次。核苷酸序列SEQ ID NO:1的部分序列也可用作变异体编码DNA的探针并且与xylA基因杂交。该探针可以通过PCR制备,其中以根据SEQ ID NO:1核苷酸序列生产的寡核苷酸作为引物,以含有SEQ ID NO:1核苷酸序列的DNA片段为模板。当以长度约为
300bp的DNA片段作为探针时,杂交的洗脱条件可以为,例如,50℃,2×SSC和0.1%SDS。 [0075] 获得编码与其它木糖利用酶基本上相同蛋白的DNA可以采用类似于上述获得木糖异构酶的方法。
[0076] 用编码蛋白的DNA转化细菌表示通过,例如常规方法将DNA导入细菌细胞中以增加编码本发明所述蛋白的基因的表达并且增强细菌细胞中蛋白的活性。
[0077] 本发明细菌还包括一种细菌,该菌中本发明蛋白的活性通过用编码(A) 或(B)、(C)或(D)、(E)或(F)、(G)或(H)、(I)或(J)、(K)或(L)中定义的蛋白的DNA转化所述细菌,或通过改变细菌染色体中所述DNA的表达调控序列而得到增强。
[0078] 增强基因表达的方法包括增加基因拷贝数。将基因导入能够在埃希氏菌属细菌中发挥功能的载体可增加基因的拷贝数。为该目的,优选使用多拷贝载体。优选地,使用低拷贝载体。低拷贝载体的例子为pSC101、pMW118、pMW119等。术语“低拷贝载体”用于表示在每个细胞中拷贝数最多为5个的载体。转化的方法包括任何本领域技术人员已知的的方法。例如,用氯化钙处理受体细胞以增加细胞对DNA的渗透性方法被报导可用于大肠杆菌K-12中(Mandel,M.And Higa,A.,J.Mol.Biol.,53,159(1970))并且可在此使用。 [0079] 通过,例如,同源重组、Mu整合等方法将基因的多重拷贝导入细菌染色体中也可实现基因表达的增强。例如,一轮Mu整合可以将最多3个拷贝的基因导入细菌染色体中。 [0080] 另一方面,将控制本发明DNA的天然启动子更换为更有效的启动子也可以实现基因表达的增强。启动子的强度用RNA合成起始作用的频率衡量。Deuschle,U.,Kammerer,W.,Gentz,R.,Bujard,H描述了测量启动子强度的方法和有效启动子的例子(Promoters in Escherichia coli:a hierarchy of in vivo strengthindicates alternate structures.EMBO J.1986,5,2987-2994)。例如,PR启动子是公知的有效的组成型启动子。其它公知的强启动子是λ噬菌体的PL启动子、lac启动子、trp启动子、trc启动子等。 [0081] 通过将更有效的Shine-Dalgarno序列(SD序列)导入本发明的DNA以替代天然SD序列可以实现翻译的增强。SD序列是mRNA起始密码子的上游区域,其与核糖体的16S RNA相互作用(Shine J.and DalgarnoL.,Proc.Natl.Acad.Sci.USA,1974,71,4,1342-6)。 [0082] 采用更有效的启动子可以与增加基因拷贝数的方法结合使用。
[0083] 或者,通过,例如,向启动子中导入突变可以增强启动子,从而提高位于启动子下游的基因的表达水平。此外,已知替换位于核糖体结合位点(RBS)与起始密码子间的几个氨基酸,尤其是,起始密码子上游紧邻的序列极大地影响mRNA的可译性。例如,发现20倍范围的表达水平依赖于起始密码子前面三个核苷酸的性质(Gold等.,Annu.Rev.Microbiol.,35,365-403,1981;Hui 等.,EMBO J.,3,623-629,1984)。 [0084] 制备染色体DNA、杂交、PCR、制备质粒DNA、消化和连接DNA,转化、选择寡核苷酸作为引物等的方法可以为本领域技术人员公知的常规方法。这些方法记载于Sambrook,J.,and Russell D.,“Molecular Cloning A LaboratoryManual,Third Edition”,Cold Spring Harbor Laboratory Press(2001)等。
[0085] 通过将前述DNA导入本身具有生产L-氨基酸能力的细菌可获得本发明的细菌。或者,通过将生产L-氨基酸的能力给予已经含有该DNA的细菌可获得本发明的细菌。 [0086] 埃希氏菌属的L-氨基酸生产菌的例子如下所述。
[0087] L-组氨酸生产菌
[0088] 埃希氏菌属的具有L-组氨酸生产能力的细菌的例子包括埃希氏菌属的L-组氨酸生产菌,如E.coli菌株24(VKPM B-5945,RU2003677);E.coli菌株80(VKPM B-7270,RU2119536);E.coli菌株NRRL B-12116-B12121(US4388405);E.coli菌株H-9342(FERM BP-6675) 和 H-9343(FERM BP-6676)(US6344347);E.coli 菌 株 H-9341(FERM BP-6674)(EP1085087);E.coli菌株AI80/pFM201(US6258554)等。
[0089] 优选地,本发明细菌被进一步修饰以增强L-组氨酸生产菌中组氨酸操纵子基因的表达,其优选包括编码ATP磷酸核糖基转移酶的hisG基因,使对L-组氨酸的反馈抑制灵敏度降低(俄罗斯专利2003677和2119536)。
[0090] L-苏氨酸生产菌
[0091] 衍生本发明的L-苏氨酸生产菌的亲代菌株的例子包括,但是不限于,埃希氏菌属的L-苏氨酸生产菌,如E.coli菌株TDH-6/pVIC40(VKPM B-3996)(美国专利5,175,107,美国专利5,705,371),E.coli菌株NRRL-21593(美国专利5,939,307),E.coli菌株FERM BP-3756(美国专利5,474,918),E.coli菌株FERM BP-3519和FERM BP-3520(美国专利5,376,538),E.coli菌株MG442(Gusyatiner等.,Genetika(in Russian),14,947-956(1978)),E.coli菌株VL643和VL2055(EP 1148811A)等。
[0092] 菌株TDH-6缺少thrC基因,以及蔗糖同化能力,并且ilvA基因具有渗漏突变。该菌株在rhtA基因也存在变异,其导致对高浓度苏氨酸或高丝氨酸具有抗性。菌株B-3996含有质粒pVIC40,其是通过将含有变异的thrA基因的thrA*BC操纵子插入到RSF1010衍生载体中而获得。变异的thrA基因编码天冬氨酸激酶高丝氨酸脱氢酶I,其基本对苏氨酸的反馈抑制不敏感。菌株B-3996于1987年11月19日保藏在全联盟抗菌素类科学中心(Nagatinskaya Street 3-A,117105Moscow,Russian Federation),编号为RIA1867。该菌株还于1987年4月7日保藏在俄罗斯国立工业微生物保藏中心(VKPM)(Dorozhny proezd.1,Moscow117545,Russian Federation),编号为B-3996,分类命名为Escherichia coli Tur6\pVIC40。
[0093] 优选地,本发明的细菌进一步修饰以增强下述一个或多个基因的表达: [0094] -变异的thrA基因,其编码对苏氨酸的反馈抑制具有抗性的天冬氨酸激酶高丝氨酸脱氢酶I;
[0095] -thrB基因,其编码高丝氨酸激酶;
[0096] -thrC基因,其编码苏氨酸合酶;
[0097] -rhtA基因,其编码推定的跨膜蛋白;
[0098] -asd基因,其编码天冬氨酸-β-半醛脱氢酶;以及
[0099] -aspC基因,其编码天冬氨酸转氨酶;
[0100] 编码大肠杆菌天冬氨酸激酶高丝氨酸脱氢酶I的thrA基因已经公开(GenBank accession NC_000913.2的序列中核苷酸编号337到2799,gi:49175990)。该thrA基因位于E.coli K-12染色体上thrL和thrB基因之间。编码大肠杆菌高丝氨酸激酶的thrB基因已经公开(GenBank accession NC_000913.2的序列中核苷酸编号2801到3733,gi:49175990)。该thrB基因位于E.coli K-12染色体上thrA和thrC基因之间。编码大肠杆菌苏氨酸合酶的thrC基因已经公开(GenBank accession NC_000913.2的序列中核苷酸编号3734到5020,gi:49175990)。该thrB基因位于E.coli K-12染色体上thrB基因和yaaX开放读码框之间。所有这三种基因共同作用成为一个独立的苏氨酸操纵子。 [0101] 编码对苏氨酸的反馈抑制具有抗性的天冬氨酸激酶高丝氨酸脱氢酶I的变异的thrA基因,以及thrB和thrC基因可以作为一个操纵子从公知质粒pVIC40中获得,该质粒存在于大肠杆菌苏氨酸生产菌株VKPM B-3996中。质粒pVIC40详细记载于美国专利
5,705,371中。
[0102] rhtA基因位于大肠杆菌染色体上18min靠近glnHPQ操纵子,其编码谷氨酸转运系统的组分,该rhtA基因与ORF1(ybiF基因,GenBank accession numberAAA218541的序列中编号764到1651,gi:440181)一致,位于pexB与ompX 基因之间。表达ORF1编码蛋白的单元表示为rhtA(rht:高丝氨酸和苏氨酸抗性)基因。而且,有发现表明rhtA23基因的th变异相对ATG起始密码子为位置-1上的A换G的替换(ABSTRACTS of 17 International Congress of Biochemistryand Molecular Biology in conjugation with 1997 Annual Meeting of the AmericanSociety for Biochemistry and Molecular Biology,San Francisco,California August 24-29,1997,abstruct No.457,EP1013765A)。 [0103] 大肠杆菌的asd基因已经公开(GenBank accession NC_000913.1的序列中核苷酸编号3572511到3571408,gi:16131307),并且能够通过使用根据基因核苷酸序列设计的引物进行PCR(聚合酶链反应;参考White,T.J.等.,TrendsGenet,5,185(1989))而获得。
其它微生物的asd基因可以用类似的方法获得。
[0104] 此外,大肠杆菌的aspC基因已经公开(GenBank accession NC_000913.1的序列中核苷酸编号983742到984932,gi:16128895),并且能够通过PCR获得。其它微生物的aspC基因可以用类似的方法获得。
[0105] L-赖氨酸生产菌
[0106] 埃希氏菌属的L-赖氨酸生产菌的例子包括具有L-赖氨酸类似物抗性的突变体。L-赖氨酸类似物抑制埃希氏菌属细菌的生长,但是当L-赖氨酸存在于培养基中时,这种抑制被完全或部分脱敏。L-赖氨酸类似物的例子包括,但不限于,溶菌素、赖氨酸氧肟酸盐、S-(2-氨基乙基)-L-半胱氨酸(AEC)、γ-甲基赖氨酸、a-氯己内酰胺等。对赖氨酸类似物具有抗性的突变体可以通过对埃希氏菌属细菌进行常规的人工诱变处理而获得。具体的可用于生产L-赖氨酸的菌株的例子包括大肠杆菌AJ11442(FERM BP-1543,NRRL B-12185;
见U.S.Patent 4,346,170)和大肠杆菌VL611。在这些微生物中,L-赖氨酸对天冬氨酸激酶的反馈抑制被脱敏。
[0107] 菌株WC196可以用作大肠杆菌的L-赖氨酸生产菌。该菌株的育种是赋予衍生自大肠杆菌K-12的菌株W3110AEC抗性。获得的菌株命名为大肠杆菌AJ13069菌株,并且于1994年12月6日保藏于生物科学和人类技术国家研究所,工业科学和技术机构(现在的高级工业科学和技术国家研究所,国际专利保藏单位,Tsukuba Central 6,1-1,Higashi
1-Chome,Tsukuba-shi,Ibaraki-ken,305-8566,日本),保藏号为FERM P-14690。而后,根据布达佩斯条约于1995年9月29日转为国际保藏,保藏号为FERM BP-5252(美国专利
5,827,698)。
[0108] L-谷氨酸生产菌
[0109] 衍生本发明的L-谷氨酸生产菌的亲代菌株的例子包括,但不限于,埃希氏菌属+的L-谷氨酸生产菌,如E.coli菌株VL334thrC(EP 1172433)。E.coli菌株VL334(VKPM B-1641)为thrC和ilvA基因发生突变的L-异亮氨酸和L-苏氨酸营养缺陷型菌株(美国专利4,278,765)。thrC基因的野生型等位基因通过常用的转导方法进行转移,该方法应用生长于野生型E.coli菌株K12(VKPM B-7)的细胞中的噬菌体P1进行接种。结果,获得+
L-异亮氨酸营养缺陷型菌株VL334thrC(VKPM B-8961)。该菌株能够生产L-谷氨酸。 [0110] 衍生本发明的L-谷氨酸生产菌的亲代菌株的例子包括缺乏a-酮戊二酸盐脱氢酶活性或具有减弱的a-酮戊二酸盐脱氢酶活性的突变体。缺乏a-酮戊二酸盐脱氢酶活性或具有减弱的a-酮戊二酸盐脱氢酶活性的埃希氏菌属细菌以及获得它们的方法记载于美国专利5,378,616和5,573,945。特别地,这些菌株包括下述:
[0111] E.coli W3110sucA::Kmr
[0112] E.coli AJ12624(FERM BP-3853)
[0113] E.coli AJ12628(FERM BP-3854)
[0114] E.coli AJ12949(FERM BP-4881)
[0115] 通过破坏E.coli W3110的a-酮戊二酸盐脱氢酶基因(以下表示为“sucA基因”)获得E.coli W3110sucA::Kmr。该菌株完全缺失a-酮戊二酸盐脱氢酶。
[0116] 其他L-谷氨酸生产菌的例子,包括缺乏a-酮戊二酸盐脱氢酶活性或具有减弱的a-酮戊二酸盐脱氢酶活性的泛菌属突变菌株,其获得方法如上所述。该菌株包括Pantoea ananatis AJ13356(美国专利6,331,419)。Pantoea ananatisAJ13356于1998年2月19日保藏于生物科学和人类技术国家研究所,工业科学和技术机构(现在的高级工业科学和技术国家研究所,国际专利保藏单位,Tsukuba Central 6,1-1,Higashi1-Chome,Tsukuba-shi,Ibaraki-ken,305-8566,日本),保藏号为FERM P-16645。而后,根据布达佩斯条约于1999年1月11日转为国际保藏,保藏号为FERM BP-6615。由于aKGDH-E1亚单位基因(sucA)被破坏,Pantoea ananatis AJ13356缺乏a-酮戊二酸盐脱氢酶活性。当上述菌株被分离和保藏为成团肠杆菌AJ13356时,其被鉴定为成团肠杆菌(Enterobacteragglomerans)。然而,现在其根据16S rRNA等的核苷酸测序结果重新分类到 Pantoea ananatis。虽然AJ13356在前述保藏单位中保藏为成团肠杆菌,本说明书中,它们记载为Pantoea ananatis。
[0117] L-色氨酸生产菌
[0118] 衍生本发明的L-谷氨酸生产菌的亲代菌株的例子包括,但不限于,埃希氏菌属的L-色氨酸生产菌,如缺乏trpS突变基因编码的色氨酸-tRNA合酶的E.coli JP4735/pMU3028(DSM10122)和JP6015/pMU91(DSM10123)(美国专利5,756,345);具有serA等位基因不受丝氨酸反馈抑制的E.coli SV164(pGH5)(美国专利6,180,373);缺乏色氨酸 酶 的E.coli AGX17(pGX44)(NRRL B-12263)和 AGX6(pGX50)aroP(NRRL B-12264)(美国专利4,371,614);磷酸烯醇丙酮酸盐生产能力增强的E.coli AGX17/pGX50,pACKG4-pps(WO9708333,美国专利6,319,696)等。
[0119] 过去鉴定出yddG基因编码膜蛋白,其不参与任何L-氨基酸的生物合成途径。此外,已知当yddG基因的野生型等位基因在微生物内的多拷贝载体中扩增时,其使得微生物具有对L-苯丙氨酸和几种氨基酸类似物的抗性。此外,当额外的拷贝被导入相应生产菌株的细胞时,yddG基因可以增加L-苯丙氨酸或L-色氨酸的产量(WO03044192)。因此优选进一步修饰L-色氨酸生产菌从而增强yddG开放读码框的表达。
[0120] L-精氨酸生产菌
[0121] 衍生本发明的L-精氨酸生产菌的亲代菌株的例子包括,但不限于,L-精氨酸生产菌,如E.coli菌株237(VKPM B-7925)(美国专利申请US2002058315)和其含有突变的N-乙酰基谷氨酸合酶的衍生菌株(俄罗斯专利申请No.2001112869)、E.coli菌株382(VKPM B-7926)(欧洲专利申请EP1170358)、导入编码N-乙酰基谷氨酸合酶的argA基因的精氨酸生产菌株(JP 57-5693A)等。
[0122] L-苯丙氨酸生产菌
[0123] 衍生本发明的L-苯丙氨酸生产菌的亲代菌株的例子包括,但不限于,埃希氏菌属的L-苯丙氨酸生产菌,如E.coli AJ12739(tyrA::Tn10,tyrR)(VKPMB-8197);含 有 pheA34 基 因 的 E.coli HW1089(ATCC 55371)(U.S.Patent5,354,672);E.coli MWEC101-b(KR8903681);E.coli NRRL B-12141,NRRL B-12145,NRRL B-12146 和NRRL B-12147(U.S.Patent 4,407,952)。此外,作为亲 代菌株,可以使用E.coli K-12[W3110(tyrA)/pPHAB](FERM BP-3566),E.coli K-12[W3110(tyrA)/pPHAD](FERM BP-12659),E.coli K-12[W3110(tyrA)/pPHATerm](FERM BP-12662)以 及 命 名为 AJ12604(FERM BP-3579) 的 E.coli K-12[W3110(tyrA)/pBR-aroG4,pACMAB](EP
488424B1)。此外,可以使用yedA基因或yddG基因编码蛋白活性增强的埃希氏菌属的L-苯丙氨酸生产菌(美国专利申请2003/0148473A1和2003/0157667A1)。
[0124] L-半胱氨酸生产菌
[0125] 衍生本发明的L-半胱氨酸生产菌的亲代菌株的例子包括,但不限于,埃希氏菌属的L-半胱氨酸生产菌,如用不同的编码反馈抗性丝氨酸酰基转移酶的cysE等位基因进行转化的E.coli菌株JM15(美国专利6,218,168,俄罗斯专利申请2003121601);过表达编码细胞毒性分泌蛋白的基因的E.coli菌株W3110(美国专利5,972,663);具有较低半胱氨酸去硫化酶活性的E.coli菌株(JP11-155571A);增强cysB基因编码的半胱氨酸调节子阳性转录调节蛋白活性的E.coli菌株W3110(WO0127307A1)等。
[0126] L-亮氨酸生产菌
[0127] 衍生本发明的L-亮氨酸生产菌的亲代菌株的例子包括,但不限于,埃希氏菌属的L-亮氨酸生产菌,如对亮氨酸类似物具有抗性的E.coli菌株,所述类似物包括β-2-噻吩丙氨酸、3-羟基亮氨酸、4-azaleucine、5,5,5-三氟亮氨酸(JP 62-34397B和JP 08-70879A);利用WO96/06926所述基因工程方法获得的E.coli菌株;E.coli菌株H-9068(JP 08-70879A)等。
[0128] 通过增强一个或多个涉及L-亮氨酸生物合成的基因的表达可以改善本发明的细菌。例子包括leuABCD操纵子的基因,优选为突变的leuA基因,其编码不被L-亮氨酸反馈抑制的异丙基苹果酸合酶(美国专利6,403,342)。此外,通过增强表达一个或多个将L-氨基酸分泌出细菌细胞的蛋白的编码基因可以改善本发明的细菌。该基因的例子包括b2682和b2683基因(ygaZH基因)(俄罗斯专利申请2001117632)。
[0129] L-脯氨酸生产菌
[0130] 衍生本发明的L-脯氨酸生产菌的亲代菌株的例子包括,但不限于,埃希氏菌属的L-脯氨酸生产菌,如E.coli菌株702ilvA(VKPM B-8012),其缺少ilvA基因,并且能够生产L-脯氨酸(EP 1172433)。通过增强一个或多个涉及 L-脯氨酸生物合成的基因的表达可以改善本发明的细菌。L-脯氨酸生产菌中该基因的例子包括proB基因,其编码对L-脯氨酸反馈抑制不敏感的谷氨酸激酶(DE专利3127361)。此外,通过增强表达一个或多个将L-氨基酸分泌出细菌细胞的蛋白的编码基因可以改善本发明的细菌。该基因的例子包括b2682和b2683基因(ygaZH基因)(EP1239041A2)。
[0131] 具有生产L-脯氨酸活性的埃希氏菌属细菌的例子包括下述E.coli菌株:NRRL B-12403和NRRL B-12404(GB专利2075056)、VKPM B-8012(俄罗斯专利申请2000124295)、th记载于DE专利3127361中的质粒突变体、Bloom F.R.等描述的质粒突变体(The 15 Miami winter symposium,1983,p.34)等。
[0132] 上述L-氨基酸生产菌株可以进一步采用本领域技术人员公知的各种方法进行修饰,以增强戊糖同化率或增强L-氨基酸生物合成能力。
[0133] 通过扩增戊糖同化基因,对应阿拉伯糖的araFG和araBAD基因,或者通过葡萄糖同化系统(PTS和非PTS)的突变,如ptsG的突变(Nichols N.N.等,Appl.Microbiol.Biotechnol.,2001,Jul.56:1-2,120-5)可以进一步增加戊糖利用率。
[0134] 本发明的方法包括生产L-氨基酸的方法,其包括在培养基中培养L-氨基酸生产菌,使L-氨基酸在培养基中累积,以及从培养基中收集L-氨基酸的步骤,其中培养基中含有葡萄糖和戊糖的混合物。另外,本发明的方法包括生产L-组氨酸的方法,其包括在培养基中培养本发明的L-组氨酸生产菌,使L-组氨酸在培养基中累积,以及从培养基中收集L-组氨酸的步骤,其中培养基中含有葡萄糖和戊糖的混合物。另外,本发明的方法包括生产L-苏氨酸的方法,其包括在培养基中培养本发明的L-苏氨酸生产菌,使L-苏氨酸在培养基中累积,以及从培养基中收集L-苏氨酸的步骤,其中培养基中含有葡萄糖和戊糖的混合物。另外,本发明的方法包括生产L-赖氨酸的方法,其包括在培养基中培养本发明的L-赖氨酸生产菌,使L-赖氨酸在培养基中累积,以及从培养基中收集L-赖氨酸的步骤,其中培养基中含有葡萄糖和戊糖的混合物。另外,本发明的方法包括生产L-谷氨酸的方法,其包括在培养基中培养本发明的L-谷氨酸生产菌,使L-谷氨酸在培养基中累积,以及从培养基中收集L-谷氨酸的步骤,其中培养基中含有葡萄糖和戊糖的混合物。另外,本发明的方法包括生产L-色氨酸的方法,其包括在培养基中培养本发明的L-色氨酸生产菌,使L-色氨酸在培养基中累积,以及从培养基中收集L -色氨酸的步骤,其中培养基中含有葡萄糖和戊糖的混合物。
[0135] 戊糖,如木糖和阿拉伯糖,与己糖,如葡萄糖的混合物可以从未充分利用的生物质资源中获得。通过蒸汽和/或浓缩的酸解、弱酸解、酶水解,如使用纤维素酶或碱处理,从植物生物质中释放葡萄糖、木糖、阿拉伯糖和其它碳水化合物。当底物是纤维素材料时,纤维素可同时或分别水解为糖并且也发酵为L-氨基酸。由于半纤维素比纤维素更容易水解为糖,优选预水解纤维素材料,分离戊糖而后利用蒸汽、酸、碱、纤维素酶或其结合的处理方法水解纤维素以形成葡萄糖。
[0136] 本研究使用不同比率的葡萄糖/木糖/阿拉伯糖组成的混合物,以模拟可能从植物水解物中获得的葡萄糖和戊糖原材料混合物的组成(参见实施例部分)。
[0137] 在本发明中,培养基中L-氨基酸的培养、收集和纯化等采用的方法类似于常规的微生物发酵生产蛋白的方法。用于培养的培养基可以为合成培养基或天然培养基,只要该培养基中含有碳源、氮源和矿物,以及如果需要,含有合适量的微生物生长所需的营养物。 [0138] 碳源可包括多种可被L-氨基酸生产菌用作碳源的碳水化合物,如葡萄糖、蔗糖、阿拉伯糖、木糖和其它戊糖和己糖。葡萄糖、木糖、阿拉伯糖和其它碳水化合物可以是从纤维素生物质中获得的糖的原材料混合物的一部分。
[0139] 本发明中适合发酵的戊糖包括,但不限于木糖和阿拉伯糖。
[0140] 用作氮源,可以使用多种铵盐如氨水和硫酸铵、其它含氮组合物如胺、天然氮源如蛋白胨、大豆水解产物和同化的发酵微生物。矿物,可以使用一磷酸钾、硫酸镁、氯化钠、硫酸铁、硫酸锰、氯化钙等。需要时可在培养基中加入额外的营养物。例如,如果微生物的生长需要脯氨酸(脯氨酸缺陷型),在培养时可以向培养基中加入足量的脯氨酸。 [0141] 优选地,培养在有氧的条件下进行例如摇瓶培养,和通风条件下搅拌培养,培养温度为20到40℃,优选30到38℃。培养基的pH值通常在5到9之间,优选在6.5到7.2之间。培养基的pH值可以用氨水、碳酸钙、多种酸、多种碱和缓冲液进行调节。通常,培养1到5天可以在液体培养基中产生目的L-氨基酸的累积。
[0142] 培养后,通过离心或膜过滤从液体培养基中除去固体物质如细胞,而后采用离子交换、浓缩和结晶方法收集和纯化目的L-氨基酸。
[0143] 实施例
[0144] 本发明将通过关于下面的非限制性实例进行更确切的解释。
[0145] 实施例1:从E.coli菌株MG1655的染色体克隆xylBFGHR基因座
[0146] 根据E.coli菌株MG1655的基因组分析,基因xylABFGHR可以被克隆为全部556个HidIII染色体片段中的一个独立的HindIII片段(13.1kb)(图1)。为此目的,用载体pUC19建立了基因文库,含有该尺寸插入物的该载体能够在E.coli中存活。
[0147] 为建立这样的文库,MG1655的染色体DNA用HindIII限制性酶切消化并且pUC19载体用XbaI限制性酶切消化。菌株MG1655(ATCC47076,ATCC700926)可以从美国典型培养物保藏中心(10801 University Boulevard,Manassas,VA.,20110-2209,U.S.A)得到。 [0148] 为了防止自连,两DNA产物的粘性末端随后均被Klenow片段补齐(两碱基填补)。在连接步骤之后,得到重组的pUC19质粒库。库的大小大于200000克隆。基因库使用与质粒序列互补的引物和与克隆染色体片段互补的引物通过PCR进行分析。在PCR产物中没有发现具有适当分子量的DNA片段,其说明建立的库中遗漏与xylABFGHR操纵子相应的片段。
这个结果可能是由于malS基因、yiaA以及yiaB ORFs(未知其功能)的负面影响,其也存在于HindIII目的片段中。另外一个负面选择可能的原因是Xyl-基因座太大。为了克服这个问题,基于修饰的pUC19质粒建立了新的基因库。主要的方法是克隆Xyl-基因座作为不含有相邻的malS基因和yiaA和yiaB ORFs的一组片段。
[0149] 为此目的,通过插入合成的含有MluI限制位点的DNA片段来修饰质粒pUC19的多接头。用修饰的pUC19克隆载体建立两个基因库。第一个库的建立是通过用HindIII和MluI限制性酶消化菌株MG1655的染色体DNA和修饰的pUC19而后连接。库的容量4,000余个克隆。基因库用与质粒序列互补的引物和与xyl基因座的xylABFG片段互补的引物1(SEQ ID NO:13)和2(SEQID NO:14)进行PCR分析。在PCR产物中发现了具有合适分子量的预期DNA片段。接下来的步骤是用目的片段饱和基因库。在这之后,从源基因库中得到的DNA用内切核酸酶消化,在其目的片段中不存在限制性位点。有Eco1471、KpnI、MlsI、Bst1107I。在富集后的库中的目的质粒的频率为1/800克隆。富集后的库如上文所述通过PCR分析。在五个连续的库细胞群的富集后,仅发现 了10个含有xylABFG基因的克隆。所得到的含有基因xylABFG的HindIII-MluIDNA片段的质粒命名为pUC19/xylA-G。随后含有yiaA和yiaB ORFs的HindIII-Mph1103I片段从质粒pUC19/xylA-G中除去;通过Klenow片段补齐粘性末端并且通过连接反应插入含有EcoRI限制位点的合成接头。这样,获得了质粒pUC19/xylA-G-2。然后,所得的pUC19/xylA-G-2质粒用EheI限制性酶切断;通过Klenow片段补齐粘性末端并且通过连接反应插入含有HindIII限制位点的合成接头。这样获得了pUC19/xylA-G-3。HindIII限制性位点插入余下的含有xylHR基因的DNA片段,得到完整的xyl基因座。
[0150] 第二个库的建立是通过用PstI和MluI限制性酶消化菌株MG1655的染色体DNA和修饰的pUC19而后连接。库的容量6,000余个克隆。基因库用与质粒序列互补的引物和与染色体片段克隆互补的引物3(SEQ ID NO:15)和4(SEQ ID NO:16)进行PCR分析。在PCR产物中发现了具有合适分子量的预期DNA片段。接下来的步骤为通过PCR分析对已知大小的基因库在细胞群上的连续细分。在库的七个连续细分之后含有基因xylHR的细胞群包含仅十个克隆。在这个群中,通过限制性分析发现了目的DNA片段。所得到的含有xylHR基因的HindIII-MluI DNA片段的质粒被命名为pUC19/xylHR。随后,从质粒pUC19/xylHR中得到的HindIII-MluI DNA片段连接到之前已经通过HindIII和MluI限制性酶处理过的pUC19/xylA-G-3质粒上。最后,获得菌株MG1655完整的xyl基因座。得到的含有完整xylABFGHR基因座的多拷贝质粒命名为pUC19/xylA-R。
[0151] 然后从pUC19/xylA-R质粒中得到的HindIII-EcoRI DNA片段重新克隆至已用HindIII和EcoRI限制性酶消化的低拷贝载体pMW119mod,得到含有完整的xylABFGHR基因座的低拷贝质粒pMW119mod-xylA-R。低拷贝载体pMW119mod从可商购的pMW119载体中通过除去PvuII-PvuII片段获得。该片段含有多克隆位点并且为lacZ基因的主要部位。LacZ基因含有lacI抑制物的位点,其后为含有EcoRI和HindIII位点的合成接头的插入,其对于从pUC19/xylA-R质粒中xylABFGHR基因座的插入是必须的。
[0152] 实施例2:使用L-组氨酸生产菌在葡萄糖和戊糖混合物中进行发酵生产L-组氨酸
[0153] L-组氨酸生产E.coli菌株80是用于葡萄糖和戊糖的混合物的发酵生产L-组氨酸的菌株。E.coli菌株80(VKPM B-7270)在俄罗斯专利RU2119536中
详 细 描 述 并 且 已 经 于1999年 10月15日 在 Russian National Collection of st
IndustrialMicroorganisms(Russia,113545Moscow,1 Dorozhny proezd,1) 以 序 号VRPMB-7270保藏。随后,其根据布达佩斯条约的规定于2004年1月12日转为国际保藏。
通过常规方法用pMW119mod-xylA-R质粒转化菌株80,获得菌株80/pMW119mod-xylA-R。 [0154] 为获得种子培养物,菌株80和80/pMW119mod-xylA-R均在含有2ml的含1g/l的链霉素的L-肉汤的40ml试管 中,27℃于旋转振荡器(250rpm)上生长6个小时。
对菌株80/pMW119mod-xylA-R,加入100mg/l的氨苄西林。随后,将2ml(5%)的种子物质接种至发酵培养基中。在含有2ml发酵培养基的40ml试管中在27℃于旋转振荡器(250rpm)上生长65个小时。
[0155] 培养之后,累积在培养基中的L-组氨酸的量通过纸色谱法测定。流动相的组成如下:丁醇∶醋酸酯∶水=4∶1∶1(v/v)。用茚三酮的丙酮溶液(0.5%)作为显示剂。结果显示在表2中。
[0156] 发酵培养基的组成(g/l):
[0157] 糖类(总量) 100.0
[0158] Mameno TN(全部氮)的0.2
[0159] (大豆水解产物)
[0160] L-脯氨酸 0.8
[0161] (NH4)2SO4 25.0
[0162] K2HPO4 2.0
[0163] MgSO4·7H2O 1.0
[0164] FeSo4·7H2O 0.01
[0165] MnSO4·5H2O 0.01
[0166] 盐酸硫胺 0.001
[0167] 甜菜碱 2.0
[0168] CaCO3 6.0
[0169] 链霉素 1.0
[0170] 碳水化合物(葡萄糖、阿拉伯糖、木糖)、L-脯氨酸、甜菜碱和硫酸镁分别被灭菌。CaCO3干热在110℃灭菌30分钟。灭菌前pH通过KOH调节至6.0。 从表2中可见,xylABFGHR基因座的增强表达促进了在含有木糖的培养基中培养的L-组氨酸生产E.coli菌株80的产率。
[0171] 表2
[0172]
[0173] 实施例3.使用L-苏氨酸生产菌在葡萄糖和戊糖混合物中进行发酵生产L-苏氨酸
[0174] L-苏氨酸生产E.coli菌株B-3996用于评价葡萄糖和戊糖的混合物的发酵生产L-组氨酸。分别通过使用CaCl2的常规方法用pMW119mod-xylA-R质粒和载体pMW119转化菌株B-3996,获得菌株3996/pMW119mod-xylA-R和3996/pMW119。
[0175] E.coli菌株B-3996和B-3996/pMW119mod-xylA-R均在含有链霉素(50mg/l)和氨苄西林(150mg/l)的L-琼脂平皿中在37℃中生长12-15个小时。随后,在含有木糖(4%)作为碳源的发酵培养基中接种一环菌株。在20×20mm试管中在2ml的含有链霉素(50mg/l)的发酵培养基中进行发酵。细胞在32℃在250rpm的振荡下生长65个小时。 [0176] 培养之后,累积在培养基中的L-苏氨酸的量通过纸色谱法测定,其应用如下流动相:丁醇∶醋酸∶水=4∶1∶1(v/v)。用丙酮的茚三酮溶液(2%)作为显示剂。切除掉含有L-苏氨酸的点,L-苏氨酸用CdCl2的0.5%的水溶液洗脱,L-苏氨酸的量用分光光度法在540nm测定。结果在表3中显示。
[0177] 发酵培养基的组成(g/l)如下:
[0178] 糖类(总量) 40.0
[0179] (NH4)2SO4 24.0
[0180] NaCl 0.8
[0181] KH2PO4 2.0
[0182] MgSO4·7H2O 0.8
[0183] FeSO4·7H2O 0.02
[0184] MnSO4·5H2O 0.02
[0185] 盐酸硫胺 0.0002
[0186] 酵母提取物 1.0
[0187] CaCO3 30.0
[0188] 葡萄糖和硫酸镁分别被灭菌。CaCO3干热在180℃灭菌2小时。pH调节至7.0。灭菌后抗菌素被引入至培养基。
[0189] 表3
[0190]
[0191] 如在表3中所示,xylABFGHR基因座的增强表达促进了培养于含有木糖的培养基中的L-苏氨酸生产E.coli菌株B-3996/pMW119的产率。
[0192] 实施例4.使用L-赖氨酸生产菌在葡萄糖和戊糖混合物中进行发酵生产L-赖氨酸
[0193] L-赖氨酸生成E.coli菌株WC196ΔcadA Δldc用于评价葡萄糖和戊糖的混合物的发酵生产L-赖氨酸。菌株WC196ΔcadA Δldc从通过如美国专利5,827,698中描述的灭活通过ldcC基因和cadA基因编码的赖氨酸脱羧酶的菌株WC 196中获得。分别通过使用CaCl2的常规方法用pMW119mod-xylA-R质粒和载体pMW119转化菌株WC196ΔcadA Δldc,获得菌株WC196ΔcadA Δldc/pMW119mod-xylA-R和WC196ΔcadAΔldc/pMW119。 [0194] E.coli 菌 株 WC196ΔcadA Δldc/pMW119 和 WC196ΔcadA Δldc/pMW119mod-xylA-R均在含有氨苄西林(150mg/l)的L-琼脂平皿中在37℃中生长12-15个小时。随后,在含有木糖(4%)或木糖(2%)/葡萄糖(2%)混合物作为碳源的发酵培养基中接种一环菌株。在20×20mm试管中在2ml的发酵培养基中进行发酵。细胞在32℃在250rpm的振荡下生长25个小时。
[0195] 培养之后,累积在培养基中的L-赖氨酸的量通过纸色谱法测定,其应用如下流动相:丁醇∶醋酸∶水=4∶1∶1(v/v)。用丙酮的茚三酮溶液(2%) 作为显示剂。切除掉含有L-赖氨酸的点,L-赖氨酸用CdCl2的0.5%的水溶液洗脱,L-赖氨酸的量用分光光度法在540nm测定。结果在表4中显示。
[0196] 发酵培养基的组成(g/l)如下:
[0197] 糖类(总量) 40.0
[0198] (NH4)2SO4 24.0
[0199] KH2PO4 1.0
[0200] MgSO4·7H2O 1.0
[0201] FeSO4·7H2O 0.01
[0202] MnSO4·5H2O 0.01
[0203] 酵母提取物 2.0
[0204] CaCO3 30.0
[0205] 葡萄糖和硫酸镁分别被灭菌。CaCO3干热在180℃灭菌2小时。pH用KOH调节至7.0。灭菌后抗菌素被引入至培养基。
[0206]
[0207] 如在表4中所示,xylABFGHR基因座的增强表达促进了培养于含有木糖的培养基中L-赖氨酸生成E.coli菌株WC196ΔcadA Δldc/pMW119的产率。
[0208] 实施例5.使用L-谷氨酸生产菌在葡萄糖和戊糖混合物中进行发酵生产L-谷氨酸。
[0209] L-谷氨酸生成E.coli菌株AJ12624用于评价葡萄糖和戊糖的混合物的发酵生产L-谷氨酸产物。分别通过使用CaCl2的常规方法用pMW119mod-xylA-R质粒和载体pMW119转化菌株AJ12624,获得菌株AJ12624/pMW119mod-xylA-R和AJ12624/pMW119。 [0210] E.coli菌株AJ12624/pMW119和AJ12624/pMW119mod-xylA-R均在含有氨苄西林(150mg/l)的L-琼脂平皿中在37℃中生长12-15个小时。随后,向含有木糖(4%)作为碳源的发酵培养基接种一环菌株。在20×20mm试管中 在2ml的发酵培养基中进行发酵。细胞在32℃在250rpm的振荡下生长48个小时。
[0211] 培养之后,累积在培养基中的L-谷氨酸的量通过纸色谱法测定,其应用如下流动相:丁醇∶醋酸∶水=4∶1∶1(v/v)。用丙酮的茚三酮溶液(2%)作为显示剂。切除掉含有L-谷氨酸的点,L-谷氨酸用CdCl2的0.5%的水溶液洗脱,L-谷氨酸的量用分光光度法在540nm测定。结果在表5中显示。
[0212] 发酵培养基的组成(g/l):
[0213] 糖类 40.0
[0214] (NH4)2SO4 25.0
[0215] KH2PO4 2.0
[0216] MgSO4·7H2O 1.0
[0217] 盐酸硫胺 0.0001
[0218] L-异亮氨酸 0.07
[0219] CaCO3 25.0
[0220] 葡萄糖和硫酸镁分别被灭菌。CaCO3干热在180℃灭菌2小时。pH调节至7.2。 [0221] 表5
[0222]
[0223] 如在表5中所示,xylABFGHR基因座的增强表达促进了在含有木糖的培养基中培养的L-谷氨酸生产E.coli菌株AJ12624/pMW119的产率。
[0224] 实施例6.使用L-色氨酸生产菌在葡萄糖和戊糖混合物中进行发酵生产L-色氨酸。
[0225] L-色氨酸生成E.coli菌株SV164/pGH5用于评价葡萄糖和戊糖的混合物的发酵生产L-色氨酸。分别通过使用CaCl2的常规方法用pMW119mod-xylA-R质粒和载体pMW119转化菌株SV164/pGH5,获得菌株SV164/pGH5/pMW119mod-xylA-R和SV164/pGH5/pMW119。 [0226] E.coli菌株SV164/pGH5/pMW119和SV164/pGH5/pMW119mod-xylA-R 均在含有四环素(30mg/l)和氨苄西林(150mg/l)的L-琼脂平皿中在37℃中生长12-15个小时。随后,向含有木糖(4%)或木糖(2%)/葡萄糖(2%)混合物作为碳源的发酵培养基接种一环菌株。在20×20mm试管中在2ml的发酵培养基中进行发酵。细胞在30℃在250rpm的振荡下生长48个小时。
[0227] 培养之后,累积在培养基中的L-色氨酸的量通过TLC测定。采用10×15cm的TLC平皿用不含荧光指示剂的0.11mm的Sorbfil硅胶(Stock CompanySorbpolymer Krasnodar,Russia)包被。Sorbfil平皿可以应用如下流动相显像:丙二醇∶乙烯醋酸酯∶25%液态氨∶水=40∶40∶7∶16(v/v)。用丙酮的茚三酮溶液(2%)作为显示剂。结果在表7中显示。发酵培养基组合物列在表5中,但是应该组A、B、C、D、E、F和H之间分别灭活,如所显示的,为了避免在灭活过程中相互之间的副作用。
[0228] 表6.
[0229]溶液 组合物 最终浓度,G/L
A KH2PO4 1.5
NaCl 0.5
(NH4)2SO4 1.5
L-甲硫胺酸 0.05
L-苯丙氨酸 0.1
L-酪氨酸 0.1
Mameno(全N) 0.07
B 葡萄糖 40.0
MgSO4·7H2O 0.3
C CaCl2 0.011
D FeSO4·7H2O 0.075
柠檬酸钠 1.0
E Na2MoO4·2H2O 0.00015
H3BO3 0.0025
CoCl2·6H2O 0.00007
CuSO4·5H2O 0.00025
MnCl2·4H2O 0.0016
ZnSO4·7H2O 0.0003
F 盐酸硫胺 0.005
GH 吡Ca哆CO醇3 03.00.30
[0230] 溶液A通过NH4OH调节pH至7.1。
[0231] 表7
[0232]
[0233] 如在表7中所示,xylABFGHR基因座的增强表达促进了在含有木糖的培养基中培养的L-色氨酸生产E.coli菌株SV164/pGH5/pMW119的产率。
[0234] 虽然本发明用其优选的实施方式详细描述,显然对所属领域的技术人员而言可以进行各种变换,以及在不背离本发明的范围下的等同物的替换。每一个前述文件在此均全文引用作为参考。
[0235] 序列表
[0236] <110>Ajinomoto Co.,Inc.
[0237] <120>使用木糖利用基因表达增强的细菌进行发酵以生产L-氨基酸的方法 [0238] <130>OP-C5007
[0239] <140>
[0240] <141>
[0241] <150>RU2004107548
[0242] <151>2004-03-16
[0243] <150>US60/610545
[0244] <151>2004-09-17
[0245] <160>16
[0246] <170>PatentIn Ver.2.1
[0247] <210>1
[0248] <211>1323
[0249] <212>DNA
[0250] <213>大肠杆菌
[0251] <220>
[0252] <221>CDS
[0253] <222>(1)..(1323)
[0254] <400>1
[0255] atg caa gcc tat ttt gac cag ctc gat cgc gtt cgt tat gaa ggc tca 48 [0256] Met Gln Ala Tyr Phe Asp Gln Leu Asp Arg Val Arg Tyr Glu Gly Ser [0257] 1 5 10 15 [0258] aaa tcc tea aac ccg tta gca ttc cgt cac tac aat ccc gac gaa ctg 96 [0259] Lys Ser Ser Asn Pro Leu Ala Phe Arg His Tyr Asn Pro Asp Glu Leu [0260] 20 25 30
[0261] gtg ttg ggt aag cgt atg gaa gag cac ttg cgt ttt gcc gcc tgc tac 144 [0262] Val Leu Gly Lys Arg Met Glu Glu His Leu Arg Phe Ala Ala Cys Tyr [0263] 35 40 45
[0264] tgg cac acc ttc tgc tgg aac ggg gcg gat atg ttt ggt gtg ggg gcg 192 [0265] Trp His Thr Phe Cys Trp Asn Gly Ala Asp Met Phe Gly Val Gly Ala [0266] 50 55 60
[0267] ttt aat cgt ccg tgg cag cag cct ggt gag gca ctg gcg ttg gcg aag 240 [0268] Phe Asn Arg Pro Trp Gln Gln Pro Gly Glu Ala Leu Ala Leu Ala Lys [0269] 65 70 75 80 [0270] cgt aaa gca gat gtc gca ttt gag ttt ttc cac aag tta cat gtg cca 288 [0271] Arg Lys Ala Asp Val Ala Phe Glu Phe Phe His Lys Leu His Val Pro [0272] 85 90 95 [0273] ttt tat tgc ttc cac gat gtg gat gtt tcc cct gag ggc gcg tcg tta 336 [0274] Phe Tyr Cys Phe His Asp Val Asp Val Ser Pro Glu Gly Ala Ser Leu [0275] 100 105 110
[0276] aaa gag tac atc aat aat ttt gcg caa atg gtt gat gtc ctg gca ggc 384 [0277] Lys Glu Tyr Ile Asn Asn Phe Ala Gln Met Val Asp Val Leu Ala Gly [0278] 115 120 125
[0279] aag caa gaa gag agc ggc gtg aag ctg ctg tgg gga acg gcc aac tgc 432 [0280] Lys Gln Glu Glu Ser Gly Val Lys Leu Leu Trp Gly Thr Ala Asn Cys [0281] 130 135 140
[0282] ttt aca aac cct cgc tac ggc gcg ggt gcg gcg acg aac cca gat cct 480 [0283] Phe Thr Asn Pro Arg Tyr Gly Ala Gly Ala Ala Thr Asn Pro Asp Pro [0284] 145 150 155 160 [0285] gaa gtc ttc agc tgg gcg gca acg caa gtt gtt aca gcg atg gaa gca 528 [0286] Glu Val Phe Ser Trp Ala Ala Thr Gln Val Val Thr Ala Met Glu Ala [0287] 165 170 175 [0288] acc cat aaa ttg ggc ggt gaa aac tat gtc ctg tgg ggc ggt cgt gaa 576 [0289] Thr His Lys Leu Gly Gly Glu Asn Tyr Val Leu Trp Gly Gly Arg Glu [0290] 180 185 190
[0291] ggt tac gaa acg ctg tta aat acc gac ttg cgt cag gag cgt gaa caa 624 [0292] Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Arg Gln Glu Arg Glu Gln [0293] 195 200 205
[0294] ctg ggc cgc ttt atg cag atg gtg gtt gag cat aaa cat aaa atc ggt 672 [0295] Leu Gly Arg Phe Met Gln Met Val Val Glu His Lys His LysIle Gly [0296] 210 215 220
[0297] ttc cag ggc acg ttg ctt atc gaa ccg aaa ccg caa gaa ccg acc aaa 720 [0298] Phe Gln Gly Thr Leu Leu Ile Glu Pro Lys Pro Gln Glu Pro Thr Lys [0299] 225 230 235 240 [0300] cat caa tat gat tac gat gcc gcg acg gtc tat ggc ttc ctg aaa cag 768 [0301] His Gln Tyr Asp Tyr Asp Ala Ala Thr Val Tyr Gly Phe Leu Lys Gln [0302] 245 250 255 [0303] ttt ggt ctg gaa aaa gag att aaa ctg aac att gaa gct aac cac gcg 816 [0304] Phe Gly Leu Glu Lys Glu Ile Lys Leu Asn Ile Glu Ala Asn His Ala [0305] 260 265 270
[0306] acg ctg gca ggt cac tct ttc cat cat gaa ata gcc acc gcc att gcg 864 [0307] Thr Leu Ala Gly His Ser Phe His His Glu Ile Ala Thr Ala Ile Ala [0308] 275 280 285
[0309] ctt ggc ctg ttc ggt tct gtc gac gcc aac cgt ggc gat gcg caa ctg 912 [0310] Leu Gly Leu Phe Gly Ser Val Asp Ala Asn Arg Gly Asp Ala Gln Leu [0311] 290 295 300
[0312] ggc tgg gac acc gac cag ttc ccg aac agt gtg gaa gag aat gcg ctg 960 [0313] Gly Trp Asp Thr Asp Gln Phe Pro Asn Ser Val Glu Glu Asn Ala Leu [0314] 305 310 315 320 [0315] gtg atg tat gaa att ctc aaa gca ggc ggt ttc acc acc ggt ggt ctg 1008 [0316] Val Met Tyr Glu Ile Leu Lys Ala Gly Gly Phe Thr Thr Gly Gly Leu [0317] 325 330 335 [0318] aac ttc gat gcc aaa gta cgt cgt caa agt act gat aaa tat gat ctg 1056 [0319] Asn Phe Asp Ala Lys Val Arg Arg Gln Ser Thr Asp Lys Tyr Asp Leu [0320] 340 345 350
[0321] ttt tac ggt cat atc ggc gcg atg gat acg atg gca ctg gcg ctg aaa 1104 [0322] Phe Tyr Gly His Ile Gly Ala Met Asp Thr Met Ala Leu Ala Leu Lys [0323] 355 360 365
[0324] att gca gcg cgc atg att gaa gat ggc gag ctg gat aaa cgc atc gcg 1152 [0325] Ile Ala Ala Arg Met Ile Glu Asp Gly Glu Leu Asp Lys Arg Ile Ala [0326] 370 375 380
[0327] cag cgt tat tcc ggc tgg aat agc gaa ttg ggc cag caa atc ctg aaa 1200 [0328] Gln Arg Tyr Ser Gly Trp Asn Ser Glu Leu Gly Gln Gln Ile Leu Lys [0329] 385 390 395 400 [0330] ggc caa atg rca ctg gca gat tta gccaaa tat gct cag gaa cat cat 1248 [0331] Gly Gln Met Ser Leu Ala Asp Leu Ala Lys Tyr Ala Gln Glu His His [0332] 405 410 415 [0333] ttg tct ccg gtg cat cag agt ggt cgc cag gaa caa ctg gaa aat ctg 1296 [0334] Leu Ser Pro Val His Gln Ser Gly Arg Gln Glu Gln Leu Glu Asn Leu [0335] 420 425 430
[0336] gta aac cat tat ctg ttc gac aaa taa 1323 [0337] Val Asn His Tyr Leu Phe Asp Lys
[0338] 435 440
[0339] <210>2
[0340] <211>440
[0341] <212>PRT
[0342] <213>大肠杆菌
[0343] <400>2
[0344] Met Gln Ala Tyr Phe Asp Gln Leu Asp Arg Val Arg Tyr Glu Gly Ser [0345] 1 5 10 15 [0346] Lys Ser Ser Asn Pro Leu Ala Phe Arg His Tyr Asn Pro Asp Glu Leu [0347] 20 25 30
[0348] Val Leu Gly Lys Arg Met Glu Glu His Leu Arg Phe Ala Ala Cys Tyr [0349] 35 40 45
[0350] Trp His Thr Phe Cys Trp Asn Gly Ala Asp Met Phe Gly Val Gly Ala [0351] 50 55 60
[0352] Phe Asn Arg Pro Trp Gln Gln Pro Gly Glu Ala Leu Ala Leu Ala Lys [0353] 65 70 75 80 [0354] Arg Lys Ala Asp Val Ala Phe Glu Phe Phe His Lys Leu His Val Pro [0355] 85 90 95 [0356] Phe Tyr Cys Phe His Asp Val Asp Val Ser Pro Glu Gly Ala Ser Leu [0357] 100 105 110
[0358] Lys Glu Tyr Ile Asn Asn Phe Ala Gln Met Val Asp Val Leu Ala Gly [0359] 115 120 125
[0360] Lys Gln Glu Glu Ser Gly Val Lys Leu Leu Trp Gly Thr Ala Asn Cys [0361] 130 135 140
[0362] Phe Thr Asn Pro Arg Tyr Gly Ala Gly Ala Ala Thr Asn Pro Asp Pro [0363] 145 150 155 160 [0364] Glu Val Phe Ser Trp Ala Ala Thr Gln Val Val Thr Ala Met Glu Ala [0365] 165 170 175 [0366] Thr His Lys Leu Gly Gly Glu Asn Tyr Val Leu Trp Gly Gly Arg Glu [0367] 180 185 190
[0368] Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Arg Gln Glu Arg Glu Gln [0369] 195 200 205
[0370] Leu Gly Arg Phe Met Gln Met Val Val Glu His Lys His Lys Ile Gly [0371] 210 215 220
[0372] Phe Gln Gly Thr Leu Leu Ile Glu Pro Lys Pro Gln Glu Pro Thr Lys [0373] 225 230 235 240 [0374] His Gln Tyr Asp Tyr Asp Ala Ala Thr Val Tyr Gly Phe Leu Lys Gln [0375] 245 250 255 [0376] Phe Gly Leu Glu Lys Glu Ile Lys Leu Asn Ile Glu Ala Asn His Ala [0377] 260 265 270
[0378] Thr Leu Ala Gly His Ser Phe His His Glu Ile Ala Thr Ala Ile Ala [0379] 275 280 285
[0380] Leu Gly Leu Phe Gly Ser Val Asp Ala Asn Arg Gly Asp Ala Gln Leu [0381] 290 295 300
[0382] Gly Trp Asp Thr Asp Gln Phe Pro Asn Ser Val Glu Glu Asn Ala Leu [0383] 305 310 315 320 [0384] Val Met Tyr Glu Ile Leu Lys Ala Gly Gly Phe Thr Thr Gly Gly Leu [0385] 325 330 335 [0386] Asn Phe Asp Ala Lys Val Arg Arg Gln Ser Thr Asp Lys Tyr Asp Leu [0387] 340 345 350
[0388] Phe Tyr Gly His Ile Gly Ala Met Asp Thr Met Ala Leu Ala Leu Lys [0389] 355 360 365
[0390] Ile Ala Ala Arg Met Ile Glu Asp Gly Glu Leu Asp Lys Arg Ile Ala [0391] 370 375 380
[0392] Gln Arg Tyr Ser Gly Trp Asn Ser Glu Leu Gly Gln Gln Ile Leu Lys [0393] 385 390 395 400 [0394] Gly Gln Met Ser Leu Ala Asp Leu Ala Lys Tyr Ala Gln Glu His His [0395] 405 410 415 [0396] Leu Ser Pro Val His Gln Ser Gly Arg Gln Glu Gln Leu Glu Asn Leu [0397] 420 425 430
[0398] Val Asn His Tyr Leu Phe Asp Lys
[0399] 435 440
[0400] <210>3
[0401] <211>1455
[0402] <212>DNA
[0403] <213>大肠杆菌
[0404] <220>
[0405] <221>CDS
[0406] <222>(1)..(1455)
[0407] <400>3
[0408] atg tat atc ggg ata gat ctt ggc acc tcg ggc gta aaa gtt att ttg 48 [0409] Met Tyr Ile Gly Ile Asp Leu Gly Thr Ser Gly Val Lys Val Ile Leu [0410] 1 5 10 15 [0411] ctc aac gag cag ggt gag gtg gtt gct gcg caa acg gaa aag ctg acc 96 [0412] Leu Asn Glu Gln Gly Glu Val Val Ala Ala Gln Thr Glu Lys Leu Thr [0413] 20 25 30
[0414] gtt tcg cgc ccg cat cca ctc tgg tcg gaa caa gac ccg gaa cag tgg 144 [0415] Val Ser Arg Pro His Pro Leu Trp Ser Glu Gln Asp Pro Glu Gln Trp [0416] 35 40 45
[0417] tgg cag gca act gat cgc gca atg aaa gct ctg ggc gat cag cat tct 192 [0418] Trp Gln Ala Thr Asp Arg Ala Met Lys Ala Leu Gly Asp Gln His Ser [0419] 50 55 60
[0420] ctg cag gac gtt aaa gca ttg ggt att gcc ggc cag atg cac gga gca 240 [0421] Leu Gln Asp Val Lys Ala Leu Gly Ile Ala Gly Gln Met His Gly Ala [0422] 65 70 75 80 [0423] acc ttg ctg gat gct cag caa cgg gtg tta cgc cct gcc att ttg tgg 288 [0424] Thr Leu Leu Asp Ala Gln Gln Arg Val Leu Arg Pro Ala Ile Leu Trp [0425] 85 90 95 [0426] aac gac ggg cgc tgt gcg caa gag tgc act ttg ctg gaa gcg cga gtt 336 [0427] Asn Asp Gly Arg Cys Ala Gln Glu Cys Thr Leu Leu Glu Ala Arg Val [0428] 100 105 110
[0429] ccg caa tcg cgg gtg att acc ggc aac ctg atg atg ccc gga ttt act 384 [0430] Pro Gln Ser Arg Val Ile Thr Gly Asn Leu Met Met Pro Gly Phe Thr [0431] 115 120 125
[0432] gcg cct aaa ttg cta tgg gtt cag cgg cat gag ccg gag ata ttc cgt 432 [0433] Ala Pro Lys Leu Leu Trp Val Gln Arg His Glu Pro Glu Ile Phe Arg [0434] 130 135 140
[0435] caa atc gac aaa gta tta tta ccg aaa gat tac ttg cgt ctg cgt atg 480 [0436] Gln Ile Asp Lys Val Leu Leu Pro Lys Asp Tyr Leu Arg Leu Arg Met [0437] 145 150 155 160 [0438] acg ggg gag ttt gcc agc gat atg tct gac gca gct ggc acc atg tgg 528 [0439] Thr Gly Glu Phe Ala Ser Asp Met Ser Asp Ala Ala Gly Thr Met Trp [0440] 165 170 175 [0441] ctg gat gtc gca aag cgt gac tgg agt gac gtc atg ctg cag gct tgc 576 [0442] Leu Asp Val Ala Lys Arg Asp Trp Ser Asp Val Met Leu Gln Ala Cys [0443] 180 185 190
[0444] gac tta tct cgt gac cag atg ccc gca tta tac gaa ggc agc gaa att 624 [0445] Asp Leu Ser Arg Asp Gln Met Pro Ala Leu Tyr Glu Gly Ser Glu Ile [0446] 195 200 205
[0447] act ggt gct ttg tta cct gaa gtt gcg aaa gcg tgg ggt atg gcg acg 672 [0448] Thr Gly Ala Leu Leu Pro Glu Val Ala Lys Ala Trp Gly Met Ala Thr [0449] 210 215 220
[0450] gtg cca gtt gtc gca ggc ggt ggc gac aat gca gct ggt gca gtt ggt 720 [0451] Val Pro Val Val Ala Gly Gly Gly Asp Asn Ala Ala Gly Ala Val Gly [0452] 225 230 235 240 [0453] gtg gga atg gtt gat gct aat cag gca atg tta tcg ctg ggg acg tcg 768 [0454] Val Gly Met Val Asp Ala Asn Gln Ala Met Leu Ser Leu Gly Thr Ser [0455] 245 250 255 [0456] ggg gtc tat ttt gct gtc agc gaa ggg ttc tta agc aag cca gaa agc 816 [0457] Gly Val Tyr Phe Ala Val Ser Glu Gly Phe Leu Ser Lys Pro Glu Ser [0458] 260 265 270
[0459] gcc gta cat agc ttt tgc cat gcg cta ccg caa cgt tgg cat tta atg 864 [0460] Ala Val His Ser Phe Cys His Ala Leu Pro Gln Arg Trp His Leu Met [0461] 275 280 285
[0462] tct gtg atg ctg agt gca gcg tcg tgt ctg gat tgg gcc gcg aaa tta 912 [0463] Ser Val Met Leu Ser Ala Ala Ser Cys Leu Asp Trp Ala Ala Lys Leu [0464] 290 295 300
[0465] acc ggc ctg agc aat gtc cca gct tta atc gct gca gct caa cag gct 960 [0466] Thr Gly Leu Ser Asn Val Pro Ala Leu Ile Ala Ala Ala Gln Gln Ala [0467] 305 310 315 320 [0468] gat gaa agt gcc gag cca gtt tgg ttt ctg cct tat ctt tcc ggc gag 1008 [0469] Asp Glu Ser Ala Glu Pro Val Trp Phe Leu Pro Tyr Leu Ser Gly Glu [0470] 325 330 335 [0471] cgt acg cca cac aat aat ccc cag gcg aag ggg gtt ttc ttt ggt ttg 1056 [0472] Arg Thr Pro His Asn Asn Pro Gln Ala Lys Gly Val Phe Phe Gly Leu [0473] 340 345 350
[0474] act cat caa cat ggc ccc aat gaa ctg gcg cga gca gtg ctg gaa ggc 1104 [0475] Thr His Gln His Gly Pro Asn Glu Leu Ala Arg Ala Val Leu Glu Gly [0476] 355 360 365
[0477] gtg ggt tat gcg ctg gca gat ggc atg gat gtc gtg cat gcc tgc ggt 1152 [0478] Val Gly Tyr Ala Leu Ala Asp Gly Met Asp Val Val His Ala Cys Gly [0479] 370 375 380
[0480] att aaa ccg caa agt gtt acg ttg att ggg ggc ggg gcg cgt agt gag 1200 [0481] Ile Lys Pro Gln Ser Val Thr Leu Ile Gly Gly Gly Ala Arg Ser Glu [0482] 385 390 395 400 [0483] tac tgg cgt cag atg ctg gcg gat atc agc ggt cag cag ctc gat tac 1248 [0484] Tyr Trp Arg Gln Met Leu Ala Asp Ile Ser Gly Gln Gln Leu Asp Tyr [0485] 405 410 415 [0486] cgt acg ggg ggg gat gtg ggg cca gca ctg ggc gca gca agg ctg gcg 1296 [0487] Arg Thr Gly Gly Asp Val Gly Pro Ala Leu Gly Ala Ala Arg Leu Ala [0488] 420 425 430
[0489] cag atc gcg gcg aat cca gag aaa tcg ctc att gaa ttg ttg ccg caa 1344 [0490] Gln Ile Ala Ala Asn Pro Glu Lys Ser Leu Ile Glu Leu Leu Pro Gln [0491] 435 440 445
[0492] cta ccg tta gaa cag tcg cat cta cca gat gcg cag cgt tat gcc gct 1392 [0493] Leu Pro Leu Glu Gln Ser His Leu Pro Asp Ala Gln Arg Tyr Ala Ala [0494] 450 455 460
[0495] tat cag cca cga cga gaa acg ttc cgt cgc ctc tat cag caa ctt ctg 1440 [0496] Tyr Gln Pro Arg Arg Glu Thr Phe Arg Arg Leu Tyr Gln Gln Leu Leu [0497] 465 470 475 480 [0498] cca tta atg gcg taa 1455 [0499] Pro Leu Met Ala
[0500] <210>4
[0501] <211>484
[0502] <212>PRT
[0503] <213>大肠杆菌
[0504] <400>4
[0505] Met Tyr Ile Gly Ile Asp Leu Gly Thr Ser Gly Val Lys Val Ile Leu [0506] 1 5 10 15 [0507] Leu Asn Glu Gln Gly Glu Val Val Ala Ala Gln Thr Glu Lys Leu Thr [0508] 20 25 30
[0509] Val Ser Arg Pro His Pro Leu Trp Ser Glu Gln Asp Pro Glu Gln Trp [0510] 35 40 45
[0511] Trp Gln Ala Thr Asp Arg Ala Met Lys Ala Leu Gly Asp Gln His Ser [0512] 50 55 60
[0513] Leu Gln Asp Val Lys Ala Leu Gly Ile Ala Gly Gln Met His Gly Ala [0514] 65 70 75 80 [0515] Thr Leu Leu Asp Ala Gln Gln Arg Val Leu Arg Pro Ala Ile Leu Trp [0516] 85 90 95 [0517] Asn Asp Gly Arg Cys Ala Gln Glu Cys Thr Leu Leu Glu Ala Arg Val [0518] 100 105 110
[0519] Pro Gln Ser Arg Val Ile Thr Gly Asn Leu Met Met Pro Gly Phe Thr [0520] 115 120 125
[0521] Ala Pro Lys Leu Leu Trp Val Gln Arg His Glu Pro Glu IIe Phe Arg [0522] 130 135 140
[0523] Gln Ile Asp Lys Val Leu Leu Pro Lys Asp Tyr Leu Arg Leu Arg Met [0524] 145 150 155 160 [0525] Thr Gly Glu Phe Ala Ser Asp Met Ser Asp Ala Ala Gly Thr Met Trp [0526] 165 170 175 [0527] Leu Asp Val Ala Lys Arg Asp Trp Ser Asp Val Met Leu Gln Ala Cys [0528] 180 185 190
[0529] Asp Leu Ser Arg Asp Gln Met Pro Ala Leu Tyr Glu Gly Ser Glu Ile [0530] 195 200 205
[0531] Thr Gly Ala Leu Leu Pro Glu Val Ala Lys Ala Trp Gly Met Ala Thr [0532] 210 215 220
[0533] Val Pro Val Val Ala Gly Gly Gly Asp Asn Ala Ala Gly Ala Val Gly [0534] 225 230 235 240 [0535] Val Gly Met Val Asp Ala Asn Gln Ala Met Leu Ser Leu Gly Thr Ser [0536] 245 250 255 [0537] Gly Val Tyr Phe Ala Val Ser Glu Gly Phe Leu Ser Lys Pro Glu Ser [0538] 260 265 270
[0539] Ala Val His Ser Phe Cys His Ala Leu Pro Gln Arg Trp His Leu Met [0540] 275 280 285
[0541] Ser Val Met Leu Ser Ala Ala Ser Cys Leu Asp Trp Ala Ala Lys Leu [0542] 290 295 300
[0543] Thr Gly Leu Ser Asn Val Pro Ala Leu Ile Ala Ala Ala Gln Gln Ala [0544] 305 310 315 320 [0545] Asp Glu Ser Ala Glu Pro Val Trp Phe Leu Pro Tyr Leu Ser Gly Glu [0546] 325 330 335 [0547] Arg Thr Pro His Asn Asn Pro Gln Ala Lys Gly Val Phe Phe Gly Leu [0548] 340 345 350
[0549] Thr His Gln His Gly Pro Asn Glu Leu Ala Arg Ala Val Leu Glu Gly [0550] 355 360 365
[0551] Val Gly Tyr Ala Leu Ala Asp Gly Met Asp Val Val His Ala Cys Gly [0552] 370 375 380
[0553] Ile Lys Pro Gln Ser Val Thr Leu Ile Gly Gly Gly Ala Arg Ser Glu [0554] 385 390 395 400 [0555] Tyr Trp Arg Gln Met Leu Ala Asp Ile Ser Gly Gln Gln Leu Asp Tyr [0556] 405 410 415 [0557] Arg Thr Gly Gly Asp Val Gly Pro Ala Leu Gly Ala Ala Arg Leu Ala [0558] 420 425 430
[0559] Gln Ile Ala Ala Asn Pro Glu Lys Ser Leu Ile Glu Leu Leu Pro Gln [0560] 435 440 445
[0561] Leu Pro Leu Glu Gln Ser His Leu Pro Asp Ala Gln Arg TyrAla Ala [0562] 450 455 460
[0563] Tyr Gln Pro Arg Arg Glu Thr Phe Arg Arg Leu Tyr Gln Gln Leu Leu [0564] 465 470 475 480 [0565] Pro Leu Met Ala
[0566] <210>5
[0567] <211>993
[0568] <212>DNA
[0569] <213>大肠杆菌
[0570] <220>
[0571] <221>CDS
[0572] <222>(1)..(993)
[0573] <400>5
[0574] atg aaa ata aag aac att cta ctc acc ctt tgc acc tca ctc ctg ctt 48 [0575] Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu [0576] 1 5 10 15 [0577] acc aac gtt gct gca cac gcc aaa gaa gtc aaa ata ggt atg gcg att 96 [0578] Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile [0579] 20 25 30
[0580] gat gat ctc cgt ctt gaa cgc tgg caa aaa gat cga gat atc ttt gtg 144 [0581] Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val [0582] 35 40 45
[0583] aaa aag gca gaa tct ctc ggc gcg aaa gta ttt gta cag tct gca aat 192 [0584] Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn [0585] 50 55 60
[0586] ggc aat gaa gaa aca caa atg tcg cag att gaa aac atg ata aac cgg 240 [0587] Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg [0588] 65 70 75 80 [0589] ggt gtc gat gtt ctt gtc att att ccg tat aac ggt cag gta tta agt 288 [0590] Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser [0591] 85 90 95 [0592] aac gtt gta aaa gaa gcc aaa caa gaa ggc att aaa gta tta gct tac 336 [0593] Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr [0594] 100 105 110
[0595] gac cgt atg att aac gat gcg gat atc gat ttt tat att tct ttc gat 384 [0596] Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp [0597] 115 120 125
[0598] aac gaa aaa gtc ggt gaa ctg cag gca aaa gcc ctg gtc gat att gtt 432 [0599] Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val [0600] 130 135 140
[0601] ccg caa ggt aat tac ttc ctg atg ggc ggc tcg ccg gta gat aac aac 480 [0602] Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn [0603] 145 150 155 160 [0604] gcc aag ctg ttc cgc gcc gga caa atg aaa gtg tta aaa cct tac gtt 528 [0605] Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val [0606] 165 170 175 [0607] gat tcc gga aaa att aaa gtc gtt ggt gac caa tgg gtt gat ggc tgg 576 [0608] Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp [0609] 180 185 190
[0610] tta ccg gaa aac gca ttg aaa att atg gaa aac gcg cta acc gcc aat 624 [0611] Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn [0612] 195 200 205
[0613] aat aac aaa att gat gct gta gtt gcc tca aac gat gcc acc gca ggt 672 [0614] Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly [0615] 210 215 220
[0616] ggg gca att cag gca tta agc gcg caa ggt tta tca ggg aaa gta gca 720 [0617] Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala [0618] 225 230 235 240 [0619] atc tcc ggc cag gat gcg gat ctc gca ggt att aaa cgt att gct gcc 768 [0620] Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala [0621] 245 250 255 [0622] ggt acg caa act atg acg gtg tat aaa cct att acg ttg ttg gca aat 816 [0623] Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn [0624] 260 265 270
[0625] act gcc gca gaa att gcc gtt gag ttg ggc aat ggt cag gaa cca aaa 864 [0626] Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys [0627] 275 280 285
[0628] gca gat acc aca ctg aat aat ggc ctg aaa gat gtc ccc tcc cgc ctc 912 [0629] Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu [0630] 290 295 300
[0631] ctg aca ccg atc gat gtg aat aaa aac aac atc aaa gat acg gta att 960 [0632] Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile [0633] 305 310 315 320 [0634] aaa gac gga ttc cac aaa gag agc gag ctg taa 993 [0635] Lys Asp Gly Phe His Lys Glu Ser Glu Leu
[0636] 325 330
[0637] <210>6
[0638] <211>330
[0639] <212>PRT
[0640] <213>大肠杆菌
[0641] <400>6
[0642] Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu [0643] 1 5 10 15 [0644] Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile [0645] 20 25 30
[0646] Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val [0647] 35 40 45
[0648] Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn [0649] 50 55 60
[0650] Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg [0651] 65 70 75 80 [0652] Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser [0653] 85 90 95 [0654] Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr [0655] 100 105 110
[0656] Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp [0657] 115 120 125
[0658] Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val [0659] 130 135 140
[0660] Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn [0661] 145 150 155 160 [0662] Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val [0663] 165 170 175 [0664] Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp [0665] 180 185 190
[0666] Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn [0667] 195 200 205
[0668] Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly [0669] 210 215 220
[0670] Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala [0671] 225 230 235 240 [0672] Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala [0673] 245 250 255 [0674] Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn [0675] 260 265 270
[0676] Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys [0677] 275 280 285
[0678] Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu [0679] 290 295 300
[0680] Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile [0681] 305 310 315 320 [0682] Lys Asp Gly Phe His Lys Glu Ser Glu Leu
[0683] 325 330
[0684] <210>7
[0685] <211>1542
[0686] <212>DNA
[0687] <213>大肠杆菌
[0688] <220>
[0689] <221>CDS
[0690] <222>(1)..(1542)
[0691] <400>7
[0692] atg cct tat cta ctt gaa atg aag aac att acc aaa acc ttc ggc agt 48 [0693] Met Pro Tyr Leu Leu Glu Met Lys Asn Ile Thr Lys Thr Phe Gly Ser [0694] 1 5 10 15 [0695] gtg aag gcg att gat aac gtc tgc ttg cgg ttg aat gct ggc gaa atc 96 [0696] Val Lys Ala Ile Asp Asn Val Cys Leu Arg Leu Asn Ala Gly Glu Ile [0697] 20 25 30
[0698] gtc tca ctt tgt ggg gaa aat ggg tct ggt aaa tca acg ctg atg aaa 144 [0699] Val Ser Leu Cys Gly Glu Asn Gly Ser Gly Lys Ser Thr Leu Met Lys [0700] 35 40 45
[0701] gtg ctg tgt ggt att tat ccc cat ggc tcc tac gaa ggc gaa att att 192 [0702] Val Leu Cys Gly Ile Tyr Pro His Gly Ser Tyr Glu Gly Glu Ile Ile [0703] 50 55 60
[0704] ttt gcg gga gaa gag att cag gcg agt cac atc cgc gat acc gaa cgc 240 [0705] Phe Ala Gly Glu Glu Ile Gln Ala Ser His Ile Arg Asp Thr Glu Arg [0706] 65 70 75 80 [0707] aaa ggt atc gcc atc att cat cag gaa ttg gcc ctg gtg aaa gaa ttg 288 [0708] Lys Gly Ile Ala Ile Ile His Gln Glu Leu Ala Leu Val Lys Glu Leu [0709] 85 90 95 [0710] acc gtg ctg gaa aat atc ttc ctg ggt aac gaa ata acc cac aat ggc 336 [0711] Thr Val Leu Glu Asn Ile Phe Leu Gly Asn Glu Ile Thr His Asn Gly [0712] 100 105 110
[0713] att atg gat tat gac ctg atg acg cta cgc tgt cag aag ctg ctc gca 384 [0714] Ile Met Asp Tyr Asp Leu Met Thr Leu Arg Cys Gln Lys Leu Leu Ala [0715] 115 120 125
[0716] cag gtc agt tta tcc att tca cct gat acc cgc gtt ggc gat tta ggg 432 [0717] Gln Val Ser Leu Ser Ile Ser Pro Asp Thr Arg Val Gly Asp Leu Gly [0718] 130 135 140
[0719] ctt ggg caa caa caa ctg gtt gaa att gcc aag gca ctt aat aaa cag 480 [0720] Leu Gly Gln Gln Gln Leu Val Glu Ile Ala Lys Ala Leu Asn Lys Gln [0721] 145 150 155 160 [0722] gtg cgc ttg tta att ctc gat gaa ccg aca gcc tca tta act gag cag 528 [0723] Val Arg Leu Leu Ile Leu Asp Glu Pro Thr Ala Ser Leu Thr Glu Gln [0724] 165 170 175 [0725] gaa acg tcg att tta ctg gat att att cgc gat cta caa cag cac ggt 576 [0726] Glu Thr Ser Ile Leu Leu Asp Ile Ile Arg Asp Leu Gln Gln His Gly [0727] 180 185 190
[0728] atc gcc tgt att tat att tcg cac aaa ctc aac gaa gtc aaa gcg att 624 [0729] Ile Ala Cys Ile Tyr Ile Ser His Lys Leu Asn Glu Val Lys Ala Ile [0730] 195 200 205
[0731] tcc gat acg att tgc gtt att cgc gac gga cag cac att ggt acg cgt 672 [0732] Ser Asp Thr Ile Cys Val Ile Arg Asp Gly Gln His Ile Gly Thr Arg [0733] 210 215 220
[0734] gat gct gcc gga atg agt gaa gac gat att atc acc atg atg gtc ggg 720 [0735] Asp Ala Ala Gly Met Ser Glu Asp Asp Ile Ile Thr Met Met Val Gly [0736] 225 230 235 240 [0737] cga gag tta acc gcg ctt tac cct aat gaa cca cat acc acc gga gat 768 [0738] Arg Glu Leu Thr Ala Leu Tyr Pro Asn Glu Pro His Thr Thr Gly Asp [0739] 245 250 255 [0740] gaa ata tta cgt att gaa cat ctg acg gca tgg cat ccg gtt aat cgt 816 [0741] Glu Ile Leu Arg Ile Glu His Leu Thr Ala Trp His Pro Val Asn Arg [0742] 260 265 270
[0743] cat att aaa cga gtt aat gat gtc tcg ttt tcc ctg aaa cgt ggc gaa 864 [0744] His Ile Lys Arg Val Asn Asp Val Ser Phe Ser Leu Lys Arg Gly Glu [0745] 275 280 285
[0746] ata ttg ggt att gcc gga ctc gtt ggt gcc gga cgt acc gag acc att 912 [0747] Ile Leu Gly Ile Ala Gly Leu Val Gly Ala Gly Arg Thr Glu Thr Ile [0748] 290 295 300
[0749] cag tgc ctg ttt ggt gtg tgg ccc gga caa tgg gaa gga aaa att tat 960 [0750] Gln Cys Leu Phe Gly Val Trp Pro Gly Gln Trp Glu Gly Lys Ile Tyr [0751] 305 310 315 320 [0752] att gat ggc aaa cag gta gat att cgt aac tgt cag caa gcc atc gcc 1008 [0753] Ile Asp Gly Lys Gln Val Asp Ile Arg Asn Cys Gln Gln Ala Ile Ala [0754] 325 330 335 [0755] cag ggg att gcg atg gtc ccc gaa gac aga aag cgc gac ggc atc gtt 1056 [0756] Gln Gly Ile Ala Met Val Pro Glu Asp Arg Lys Arg Asp Gly Ile Val [0757] 340 345 350
[0758] ccg gta atg gcg gtt ggt aaa aat att acc ctc gcc gca ctc aat aaa 1104 [0759] Pro Val Met Ala Val Gly Lys Asn Ile Thr Leu Ala Ala Leu Asn Lys [0760] 355 360 365
[0761] ttt acc ggt ggc att agc cag ctt gat gac gcg gca gag caa aaa tgt 1152 [0762] Phe Thr Gly Gly Ile Ser Gln Leu Asp Asp Ala Ala Glu Gln Lys Cys [0763] 370 375 380
[0764] att ctg gaa tca atc cag caa ctc aaa gtt aaa acg tcg tcc ccc gac 1200 [0765] Ile Leu Glu Ser Ile Gln Gln Leu Lys Val Lys Thr Ser Ser Pro Asp [0766] 385 390 395 400 [0767] ctt gct att gga cgt ttg agc ggc ggc aat cag caa aaa gcg atc ctc 1248 [0768] Leu Ala Ile Gly Arg Leu Ser Gly Gly Asn Gln Gln Lys Ala Ile Leu [0769] 405 410 415 [0770] gct cgc tgt ctg tta ctt aac ccg cgc att ctc att ctt gat gaa ccc 1296 [0771] Ala Arg Cys Leu Leu Leu Asn Pro Arg Ile Leu Ile Leu Asp Glu Pro [0772] 420 425 430
[0773] acc agg ggt atc gat att ggc gcg aaa tac gag atc tac aaa tta att 1344 [0774] Thr Arg Gly Ile Asp Ile Gly Ala Lys Tyr Glu Ile Tyr Lys Leu Ile [0775] 435 440 445
[0776] aac caa ctc gtc cag cag ggt att gcc gtt att gtc atc tct tcc gaa 1392 [0777] Asn Gln Leu Val Gln Gln Gly Ile Ala Val Ile Val Ile Ser Ser Glu [0778] 450 455 460
[0779] tta cct gaa gtg ctc ggc ctt agc gat cgt gta ctg gtg atg cat gaa 1440 [0780] Leu Pro Glu Val Leu Gly Leu Ser Asp Arg Val Leu Val Met His Glu [0781] 465 470 475 480 [0782] ggg aaa cta aaa gcc aac ctg ata aat cat aac ctg act cag gag cag 1488 [0783] Gly Lys Leu Lys Ala Asn Leu Ile Asn His Asn Leu Thr Gln Glu Gln [0784] 485 490 495 [0785] gtg atg gaa gcc gca ttg agg agc gaa cat cat gtc gaa aag caa tcc 1536 [0786] Val Met Glu Ala Ala Leu Arg Ser Glu His His Val Glu Lys Gln Ser [0787] 500 505 510
[0788] gtc tga 1542 [0789] Val
[0790] <210>8
[0791] <211>513
[0792] <212>PRT
[0793] <213>大肠杆菌
[0794] <400>8
[0795] Met Pro Tyr Leu Leu Glu Met Lys Asn Ile Thr Lys Thr Phe Gly Ser [0796] 1 5 10 15 [0797] Val Lys Ala Ile Asp Asn Val Cys Leu Arg Leu Asn Ala Gly Glu Ile [0798] 20 25 30
[0799] Val Ser Leu Cys Gly Glu Asn Gly Ser Gly Lys Ser Thr Leu Met Lys [0800] 35 40 45
[0801] Val Leu Cys Gly Ile Tyr Pro His Gly Ser Tyr Glu Gly Glu Ile Ile [0802] 50 55 60
[0803] Phe Ala Gly Glu Glu Ile Gln Ala Ser His Ile Arg Asp Thr Glu Arg [0804] 65 70 75 80 [0805] Lys Gly Ile Ala Ile Ile His Gln Glu Leu Ala Leu Val Lys Glu Leu [0806] 85 90 95 [0807] Thr Val Leu Glu Asn Ile Phe Leu Gly Asn Glu Ile Thr His Asn Gly [0808] 100 105 110
[0809] Ile Met Asp Tyr Asp Leu Met Thr Leu Arg Cys Gln Lys Leu Leu Ala [0810] 115 120 125
[0811] Gln Val Ser Leu Ser Ile Ser Pro Asp Thr Arg Val Gly Asp Leu Gly [0812] 130 135 140
[0813] Leu Gly Gln Gln Gln Leu Val Glu Ile Ala Lys Ala Leu Asn Lys Gln [0814] 145 150 155 160 [0815] Val Arg Leu Leu Ile Leu Asp Glu Pro Thr Ala Ser Leu Thr Glu Gln [0816] 165 170 175 [0817] Glu Thr Ser Ile Leu Leu Asp Ile Ile Arg Asp Leu Gln Gln His Gly [0818] 180 185 190
[0819] Ile Ala Cys Ile Tyr Ile Ser His Lys Leu Asn Glu Val Lys Ala Ile [0820] 195 200 205
[0821] Ser Asp Thr Ile Cys Val Ile Arg Asp Gly Gln His Ile Gly Thr Arg [0822] 210 215 220
[0823] Asp Ala Ala Gly Met Ser Glu Asp Asp Ile Ile Thr Met Met Val Gly [0824] 225 230 235 240 [0825] Arg Glu Leu Thr Ala Leu Tyr Pro Asn Glu Pro His Thr Thr Gly Asp [0826] 245 250 255 [0827] Glu Ile Leu Arg Ile Glu His Leu Thr Ala Trp His Pro Val Asn Arg [0828] 260 265 270
[0829] His Ile Lys Arg Val Asn Asp Val Ser Phe Ser Leu Lys Arg Gly Glu [0830] 275 280 285
[0831] Ile Leu Gly Ile Ala Gly Leu Val Gly Ala Gly Arg Thr Glu Thr Ile [0832] 290 295 300
[0833] Gln Cys Leu Phe Gly Val Trp Pro Gly Gln Trp Glu Gly Lys Ile Tyr [0834] 305 310 315 320 [0835] Ile Asp Gly Lys Gln Val Asp Ile Arg Asn Cys Gln Gln Ala Ile Ala [0836] 325 330 335 [0837] Gln Gly Ile Ala Met Val Pro Glu Asp Arg Lys Arg Asp Gly Ile Val [0838] 340 345 350
[0839] Pro Val Met Ala Val Gly Lys Asn Ile Thr Leu Ala Ala Leu Asn Lys [0840] 355 360 365
[0841] Phe Thr Gly Gly Ile Ser Gln Leu Asp Asp Ala Ala Glu Gln Lys Cys [0842] 370 375 380
[0843] Ile Leu Glu Ser Ile Gln Gln Leu Lys Val Lys Thr Ser Ser Pro Asp [0844] 385 390 395 400 [0845] Leu Ala Ile Gly Arg Leu Ser Gly Gly Asn Gln Gln Lys Ala Ile Leu [0846] 405 410 415 [0847] Ala Arg Cys Leu Leu Leu Asn Pro Arg Ile Leu Ile Leu Asp Glu Pro [0848] 420 425 430
[0849] Thr Arg Gly Ile Asp Ile Gly Ala Lys Tyr Glu Ile Tyr Lys Leu Ile [0850] 435 440 445
[0851] Asn Gln Leu Val Gln Gln Gly Ile Ala Val Ile Val Ile Ser Ser Glu [0852] 450 455 460
[0853] Leu Pro Glu Val Leu Gly Leu Ser Asp Arg Val Leu Val Met His Glu [0854] 465 470 475 480 [0855] Gly Lys Leu Lys Ala Asn Leu Ile Asn His Asn Leu Thr Gln Glu Gln [0856] 485 490 495 [0857] Val Met Glu Ala Ala Leu Arg Ser Glu His His Val Glu Lys Gln Ser [0858] 500 505 510
[0859] Val
[0860] <210>9
[0861] <211>1182
[0862] <212>DNA
[0863] <213>大肠杆菌
[0864] <220>
[0865] <221>CDS
[0866] <222>(1)..(1182)
[0867] <400>9
[0868] atg tcg aaa agc aat ccg tct gaa gtg aaa ttg gcc gta ccg aca tcc 48 [0869] Met Ser Lys Ser Asn Pro Ser Glu Val Lys Leu Ala Val Pro Thr Ser [0870] 1 5 10 15 [0871] ggt ggc ttc tcc ggg ctg aaa tca ctg aat ttg cag gtc ttc gtg atg 96 [0872] Gly Gly Phe Ser Gly Leu Lys Ser Leu Asn Leu Gln Val Phe Val Met [0873] 20 25 30
[0874] att gca gct atc atc gca atc atg ctg ttc ttt acc tgg acc acc gat 144 [0875] Ile Ala Ala Ile Ile Ala Ile Met Leu Phe Phe Thr Trp Thr Thr Asp [0876] 35 40 45
[0877] ggt gcc tac tta agc gcc cgt aac gtc tcc aac ctg tta cgc cag acc 192 [0878] Gly Ala Tyr Leu Ser Ala Arg Asn Val Ser Asn Leu Leu Arg Gln Thr [0879] 50 55 60
[0880] gcg att acc ggc atc ctc gcg gta gga atg gtg ttc gtc ata att tct 240 [0881] Ala Ile Thr Gly Ile Leu Ala Val Gly Met Val Phe Val Ile Ile Ser [0882] 65 70 75 80 [0883] gct gaa atc gac ctt tcc gtc ggc tca atg atg ggg ctg tta ggt ggc 288 [0884] Ala Glu Ile Asp Leu Ser Val Gly Ser Met Met Gly Leu Leu Gly Gly [0885] 85 90 95 [0886] gtc gcg gcg att tgt gac gtc tgg tta ggc tgg cct ttg cca ctt acc 336 [0887] Val Ala Ala Ile Cys Asp Val Trp Leu Gly Trp Pro Leu Pro Leu Thr [0888] 100 105 110
[0889] atc att gtg acg ctg gtt ctg gga ctg ctt ctc ggt gcc tgg aac gga 384 [0890] Ile Ile Val Thr Leu Val Leu Gly Leu Leu Leu Gly Ala Trp Asn Gly [0891] 115 120 125
[0892] tgg tgg gtc gcg tac cgt aaa gtc cct tca ttt att gtc acc ctc gcg 432 [0893] Trp Trp Val Ala Tyr Arg Lys Val Pro Ser Phe Ile Val Thr Leu Ala [0894] 130 135 140
[0895] ggc atg ttg gca ttt cgc ggc ata ctc att ggc atc acc aac ggc acg 480 [0896] Gly Met Leu Ala Phe Arg Gly Ile Leu Ile Gly Ile Thr Asn Gly Thr [0897] 145 150 155 160 [0898] act gta tcc ccc acc agc gcc gcg atg tca caa att ggg caa agc tat 528 [0899] Thr Val Ser Pro Thr Ser Ala Ala Met Ser Gln Ile Gly Gln Ser Tyr [0900] 165 170 175 [0901] ctc ccc gcc agt acc ggc ttc atc att ggc gcg ctt ggc tta atg gct 576 [0902] Leu Pro Ala Ser Thr Gly Phe Ile Ile Gly Ala Leu Gly Leu Met Ala [0903] 180 185 190
[0904] ttt gtt ggt tgg caa tgg cgc gga aga atg cgc cgt cag gct ttg ggt 624 [0905] Phe Val Gly Trp Gln Trp Arg Gly Arg Met Arg Arg Gln Ala Leu Gly [0906] 195 200 205
[0907] tta cag tct ccg gcc tct acc gca gta gtc ggt cgc cag gct tta acc 672 [0908] Leu Gln Ser Pro Ala Ser Thr Ala Val Val Gly Arg Gln Ala Leu Thr [0909] 210 215 220
[0910] gct atc atc gta tta ggc gca atc tgg ctg ttg aat gat tac cgt ggc 720 [0911] Ala Ile Ile Val Leu Gly Ala Ile Trp Leu Leu Asn Asp Tyr Arg Gly [0912] 225 230 235 240 [0913] gtt ccc act cct gtt ctg ctg ctg acg ttg ctg tta ctc ggc gga atg 768 [0914] Val Pro Thr Pro Val Leu Leu Leu Thr Leu Leu Leu Leu Gly Gly Met [0915] 245 250 255 [0916] ttt atg gca acg cgg acg gca ttt gga cga cgc att tat gcc atc ggc 816 [0917] Phe Met Ala Thr Arg Thr Ala Phe Gly Arg Arg Ile Tyr Ala Ile Gly [0918] 260 265 270
[0919] ggc aat ctg gaa gca gca cgt ctc tcc ggg att aac gtt gaa cgc acc 864 [0920] Gly Asn Leu Glu Ala Ala Arg Leu Ser Gly Ile Asn Val Glu Arg Thr [0921] 275 280 285
[0922] aaa ctt gcc gtg ttc gcg att aac gga tta atg gta gcc atc gcc gga 912 [0923] Lys Leu Ala Val Phe Ala Ile Asn Gly Leu Met Val Ala Ile Ala Gly [0924] 290 295 300
[0925] tta atc ctt agt tct cga ctt ggc gct ggt tca cct tct gcg gga aat 960 [0926] Leu Ile Leu Ser Ser Arg Leu Gly Ala Gly Ser Pro Ser Ala Gly Asn [0927] 305 310 315 320 [0928] atc gcc gaa ctg gac gca att gca gca tgc gtg att ggc ggc acc agc 1008 [0929] Ile Ala Glu Leu Asp Ala Ile Ala Ala Cys Val Ile Gly Gly Thr Ser [0930] 325 330 335 [0931] ctg gct ggc ggt gtg gga agc gtt gcc gga gca gta atg ggg gca ttt 1056 [0932] Leu Ala Gly Gly Val Gly Ser Val Ala Gly Ala Val Met Gly Ala Phe [0933] 340 345 350
[0934] atc atg gct tca ctg gat aac ggc atg agt atg atg gat gta ccg acc 1104 [0935] Ile Met Ala Ser Leu Asp Asn Gly Met Ser Met Met Asp Val Pro Thr [0936] 355 360 365
[0937] ttc tgg cag tat atc gtt aaa ggt gcg att ctg ttg ctg gca gta tgg 1152 [0938] Phe Trp Gln Tyr Ile Val Lys Gly Ala Ile Leu Leu Leu Ala Val Trp [0939] 370 375 380
[0940] atg gac tcc gca acc aaa cgc cgt tct tga 1182
[0941] Met Asp Ser Ala Thr Lys Arg Arg Ser
[0942] 385 390
[0943] <210>10
[0944] <211>393
[0945] <212>PRT
[0946] <213>大肠杆菌
[0947] <400>10
[0948] Met Ser Lys Ser Asn Pro Ser Glu Val Lys Leu Ala Val Pro Thr Ser [0949] 1 5 10 15 [0950] Gly Gly Phe Ser Gly Leu Lys Ser Leu Asn Leu Gln Val Phe Val Met [0951] 20 25 30
[0952] Ile Ala Ala Ile Ile Ala Ile Met Leu Phe Phe Thr Trp Thr Thr Asp [0953] 35 40 45
[0954] Gly Ala Tyr Leu Ser Ala Arg Asn Val Ser Asn Leu Leu Arg Gln Thr [0955] 50 55 60
[0956] Ala Ile Thr Gly Ile Leu Ala Val Gly Met Val Phe Val Ile Ile Ser [0957] 65 70 75 80 [0958] Ala Glu Ile Asp Leu Ser Val Gly Ser Met Met Gly Leu Leu Gly Gly [0959] 85 90 95 [0960] Val Ala Ala Ile Cys Asp Val Trp Leu Gly Trp Pro Leu Pro Leu Thr [0961] 100 105 110
[0962] Ile Ile Val Thr Leu Val Leu Gly Leu Leu Leu Gly Ala Trp Asn Gly [0963] 115 120 125
[0964] Trp Trp Val Ala Tyr Arg Lys Val Pro Ser Phe Ile Val Thr Leu Ala [0965] 130 135 140
[0966] Gly Met Leu Ala Phe Arg Gly Ile Leu Ile Gly Ile Thr Asn Gly Thr [0967] 145 150 155 160 [0968] Thr Val Ser Pro Thr Ser Ala Ala Met Ser Gln Ile Gly Gln Ser Tyr [0969] 165 170 175 [0970] Leu Pro Ala Ser Thr Gly Phe Ile Ile Gly Ala Leu Gly Leu Met Ala [0971] 180 185 190
[0972] Phe Val Gly Trp Gln Trp Arg Gly Arg Met Arg Arg Gln Ala Leu Gly [0973] 195 200 205
[0974] Leu Gln Ser Pro Ala Ser Thr Ala Val Val Gly Arg Gln Ala Leu Thr [0975] 210 215 220
[0976] Ala Ile Ile Val Leu Gly Ala Ile Trp Leu Leu Asn Asp Tyr Arg Gly [0977] 225 230 235 240 [0978] Val Pro Thr Pro Val Leu Leu Leu Thr Leu Leu Leu Leu Gly Gly Met [0979] 245 250 255 [0980] Phe Met Ala Thr Arg Thr Ala Phe Gly Arg Arg Ile Tyr Ala Ile Gly [0981] 260 265 270
[0982] Gly Asn Leu Glu Ala Ala Arg Leu Ser Gly Ile Asn Val Glu Arg Thr [0983] 275 280 285
[0984] Lys Leu Ala Val Phe Ala Ile Asn Gly Leu Met Val Ala Ile Ala Gly [0985] 290 295 300
[0986] Leu Ile Leu Ser Ser Arg Leu Gly Ala Gly Ser Pro Ser Ala Gly Asn [0987] 305 310 315 320 [0988] Ile Ala Glu Leu Asp Ala Ile Ala Ala Cys Val Ile Gly Gly Thr Ser [0989] 325 330 335 [0990] Leu Ala Gly Gly Val Gly Ser Val Ala Gly Ala Val Met Gly Ala Phe [0991] 340 345 350
[0992] Ile Met Ala Ser Leu Asp Asn Gly Met Ser Met Met Asp Val Pro Thr [0993] 355 360 365
[0994] Phe Trp Gln Tyr Ile Val Lys Gly Ala Ile Leu Leu Leu Ala Val Trp [0995] 370 375 380
[0996] Met Asp Ser Ala Thr Lys Arg Arg Ser
[0997] 385 390
[0998] <210>11
[0999] <211>1179
[1000] <212>DNA
[1001] <213>大肠杆菌
[1002] <220>
[1003] <221>CDS
[1004] <222>(1)..(1179)
[1005] <400>11
[1006] atg ttt act aaa cgt cac cgc atc aca tta ctg ttc aat gcc aat aaa 48 [1007] Met Phe Thr Lys Arg His Arg Ile Thr Leu Leu Phe Asn Ala Asn Lys [1008] 1 5 10 15 [1009] gcc tat gac cgg cag gta gta gaa ggc gta ggg gaa tat tta cag gcg 96 [1010] Ala Tyr Asp Arg Gln Val Val Glu Gly Val Gly Glu Tyr Leu Gln Ala [1011] 20 25 30
[1012] tca caa tcg gaa tgg gat att ttc att gaa gaa gat ttc cgc gcc cgc 144 [1013] Ser Gln Ser Glu Trp Asp Ile Phe Ile Glu Glu Asp Phe Arg Ala Arg [1014] 35 40 45
[1015] att gat aaa atc aag gac tgg tta gga gat ggc gtc att gcc gac ttc 192 [1016] Ile Asp Lys Ile Lys Asp Trp Leu Gly Asp Gly Val Ile Ala Asp Phe [1017] 50 55 60
[1018] gac gac aaa cag atc gag caa gcg ctg gct gat gtc gac gtc ccc att 240 [1019] Asp Asp Lys Gln Ile Glu Gln Ala Leu Ala Asp Val Asp Val Pro Ile [1020] 65 70 75 80 [1021] gtt ggg gtt ggc ggc tcg tat cac ctt gca gaa agt tac cca ccc gtt 288 [1022] Val Gly Val Gly Gly Ser Tyr His Leu Ala Glu Ser Tyr Pro Pro Val [1023] 85 90 95 [1024] cat tac att gcc acc gat aac tat gcg ctg gtt gaa agc gca ttt ttg 336 [1025] His Tyr Ile Ala Thr Asp Asn Tyr Ala Leu Val Glu Ser Ala Phe Leu [1026] 100 105 110
[1027] cat tta aaa gag aaa ggc gtt aac cgc ttt gct ttt tat ggt ctt ccg 384 [1028] His Leu Lys Glu Lys Gly Val Asn Arg Phe Ala Phe Tyr Gly Leu Pro [1029] 115 120 125
[1030] gaa tca agc ggc aaa cgt tgg gcc act gag cgc gaa tat gca ttt cgt 432 [1031] Glu Ser Ser Gly Lys Arg Trp Ala Thr Glu Arg Glu Tyr Ala Phe Arg [1032] 130 135 140
[1033] cag ctt gtc gcc gaa gaa aag tat cgc gga gtg gtt tat cag ggg tta 480 [1034] Gln Leu Val Ala Glu Glu Lys Tyr Arg Gly Val Val Tyr Gln Gly Leu [1035] 145 150 155 160 [1036] gaa acc gcg cca gag aac tgg caa cac gcg caa aat cgg ctg gca gac 528 [1037] Glu Thr Ala Pro Glu Asn Trp Gln His Ala Gln Asn Arg Leu Ala Asp [1038] 165 170 175 [1039] tgg cta caa acg cta cca ccg caa acc ggg att att gcc gtt act gac 576 [1040] Trp Leu Gln Thr Leu Pro Pro Gln Thr Gly Ile Ile Ala Val Thr Asp [1041] 180 185 190
[1042] gcc cga gcg cgg cat att ctg caa gta tgt gaa cat cta cat att ccc 624 [1043] Ala Arg Ala Arg His Ile Leu Gln Val Cys Glu His Leu His Ile Pro [1044] 195 200 205
[1045] gta ccg gaa aaa tta tgc gtg att ggc atc gat aac gaa gaa ctg acc 672 [1046] Val Pro Glu Lys Leu Cys Val Ile Gly Ile Asp Asn Glu Glu Leu Thr [1047] 210 215 220
[1048] cgc tat ctg tcg cgt gtc gcc ctt tct tcg gtc gct cag ggc gcg cgg 720 [1049] Arg Tyr Leu Ser Arg Val Ala Leu Ser Ser Val Ala Gln Gly Ala Arg [1050] 225 230 235 240 [1051] caa atg ggc tat cag gcg gca aaa ctg ttg cat cga tta tta gat aaa 768 [1052] Gln Met Gly Tyr Gln Ala Ala Lys Leu Leu His Arg Leu Leu Asp Lys [1053] 245 250 255 [1054] gaa gaa atg ccg cta cag cga att ttg gtc cca cca gtt cgc gtc att 816 [1055] Glu Glu Met Pro Leu Gln Arg Ile Leu Val Pro Pro Val Arg Val Ile [1056] 260 265 270
[1057] gaa cgg cgc tca aca gat tat cgc tcg ctg acc gat ccc gcc gtt att 864 [1058] Glu Arg Arg Ser Thr Asp Tyr Arg Ser Leu Thr Asp Pro Ala Val Ile [1059] 275 280 285
[1060] cag gcc atg cat tac att cgt aat cac gcc tgt aaa ggg att aaa gtg 912 [1061] Gln Ala Met His Tyr Ile Arg Asn His Ala Cys Lys Gly Ile Lys Val [1062] 290 295 300
[1063] gat cag gta ctg gat gcg gtc ggg atc tcg cgc tcc aat ctt gag aag 960 [1064] Asp Gln Val Leu Asp Ala Val Gly Ile Ser Arg Ser Asn Leu Glu Lys [1065] 305 310 315 320 [1066] cgt ttt aaa gaa gag gtg ggt gaa acc atc cat gcc atg att cat gcc 1008 [1067] Arg Phe Lys Glu Glu Val Gly Glu Thr Ile His Ala Met Ile His Ala [1068] 325 330 335 [1069] gag aag ctg gag aaa gcg cgc agt ctg ctg att tca acc acc ttg tcg 1056 [1070] Glu Lys Leu Glu Lys Ala Arg Ser Leu Leu Ile Ser Thr Thr Leu Ser [1071] 340 345 350
[1072] atc aat gag ata tcg caa atg tgc ggt tat cca tcg ctg caa tat ttc 1104 [1073] Ile Asn Glu Ile Ser Gln Met Cys Gly Tyr Pro Ser Leu Gln Tyr Phe [1074] 355 360 365
[1075] tac tct gtt ttt aaa aaa gca tat gac acg acg cca aaa gag tat cgc 1152 [1076] Tyr Ser Val Phe Lys Lys Ala Tyr Asp Thr Thr Pro Lys Glu Tyr Arg [1077] 370 375 380
[1078] gat gta aat agc gag gtc atg ttg tag 1179 [1079] Asp Val Asn Ser Glu Val Met Leu
[1080] 385 390
[1081] <210>12
[1082] <211>392
[1083] <212>PRT
[1084] <213>大肠杆菌
[1085] <400>12
[1086] Met Phe Thr Lys Arg His Arg Ile Thr Leu Leu Phe Asn Ala Asn Lys [1087] 1 5 10 15 [1088] Ala Tyr Asp Arg Gln Val Val Glu Gly Val Gly Glu Tyr Leu Gln Ala [1089] 20 25 30
[1090] Ser Gln Ser Glu Trp Asp Ile Phe Ile Glu Glu Asp Phe Arg Ala Arg [1091] 35 40 45
[1092] Ile Asp Lys Ile Lys Asp Trp Leu Gly Asp Gly Val Ile Ala Asp Phe [1093] 50 55 60
[1094] Asp Asp Lys Gln Ile Glu Gln Ala Leu Ala Asp Val Asp Val Pro Ile [1095] 65 70 75 80 [1096] Val Gly Val Gly Gly Ser Tyr His Leu Ala Glu Ser Tyr Pro Pro Val [1097] 85 90 95 [1098] His Tyr Ile Ala Thr Asp Asn Tyr Ala Leu Val Glu Ser Ala Phe Leu [1099] 100 105 110
[1100] His Leu Lys Glu Lys Gly Val Asn Arg Phe Ala Phe Tyr Gly Leu Pro [1101] 115 120 125
[1102] Glu Ser Ser Gly Lys Arg Trp Ala Thr Glu Arg Glu Tyr Ala Phe Arg [1103] 130 135 140
[1104] Gln Leu Val Ala Glu Glu Lys Tyr Arg Gly Val Val Tyr Gln Gly Leu [1105] 145 150 155 160 [1106] Glu Thr Ala Pro Glu Asn Trp Gln His Ala Gln Asn Arg Leu Ala Asp [1107] 165 170 175 [1108] Trp Leu Gln Thr Leu Pro Pro Gln Thr Gly Ile Ile Ala Val Thr Asp [1109] 180 185 190
[1110] Ala Arg Ala Arg His Ile Leu Gln Val Cys Glu His Leu His Ile Pro [1111] 195 200 205
[1112] Val Pro Glu Lys Leu Cys Val Ile Gly Ile Asp Asn Glu Glu Leu Thr [1113] 210 215 220
[1114] Arg Tyr Leu Ser Arg Val Ala Leu Ser Ser Val Ala Gln Gly Ala Arg [1115] 225 230 235 240 [1116] Gln Met Gly Tyr Gln Ala Ala Lys Leu Leu His Arg Leu Leu Asp Lys [1117] 245 250 255 [1118] Glu Glu Met Pro Leu Gln Arg Ile Leu Val Pro Pro Val Arg Val Ile [1119] 260 265 270
[1120] Glu Arg Arg Ser Thr Asp Tyr Arg Ser Leu Thr Asp Pro Ala Val Ile [1121] 275 280 285
[1122] Gln Ala Met His Tyr Ile Arg Asn His Ala Cys Lys Gly Ile Lys Val [1123] 290 295 300
[1124] Asp Gln Val Leu Asp Ala Val Gly Ile Ser Arg Ser Asn Leu Glu Lys [1125] 305 310 315 320 [1126] Arg Phe Lys Glu Glu Val Gly Glu Thr Ile His Ala Met Ile His Ala [1127] 325 330 335 [1128] Glu Lys Leu Glu Lys Ala Arg Ser Leu Leu Ile Ser Thr Thr Leu Ser [1129] 340 345 350
[1130] Ile Asn Glu Ile Ser Gln Met Cys Gly Tyr Pro Ser Leu Gln Tyr Phe [1131] 355 360 365
[1132] Tyr Ser Val Phe Lys Lys Ala Tyr Asp Thr Thr Pro Lys Glu Tyr Arg [1133] 370 375 380
[1134] Asp Val Asn Ser Glu Val Met Leu
[1135] 385 390
[1136] <210>13
[1137] <211>23
[1138] <212>DNA
[1139] <213>人造序列
[1140] <220>
[1141] <223>人造序列的说明:引物
[1142] <400>13
[1143] ggcaactatg catatcttcg cgc 23 [1144] <210>14
[1145] <211>24
[1146] <212>DNA
[1147] <213>人造序列
[1148] <220>
[1149] <223>人造序列的说明:引物
[1150] <400>14
[1151] gcgtgaatga attggcttag gtgg 24 [1152] <210>15
[1153] <211>21
[1154] <212>DNA
[1155] <213>人造序列
[1156] <220>
[1157] <223>人造序列的说明:引物
[1158] <400>15
[1159] cagacagcga gcgaggatcg c 21
[1160] <210>16
[1161] <211>21
[1162] <212>DNA
[1163] <213>人造序列
[1164] <220>
[1165] <223>人造序列的说明:引物
[1166] <400>16
[1167] tgtgcggtta tccatcgctg c 21