产生L-谷氨酸的微生物和产生L-谷氨酸的方法转让专利

申请号 : CN200580006838.0

文献号 : CN1938418B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 原吉彦泉井裕伊藤久生

申请人 : 味之素株式会社

摘要 :

L-谷氨酸通过在培养基中培养其中L-谷氨酸输出基因yhfK基因的表达增强或过表达的微生物以产生并导致L-谷氨酸在培养基中累积,并从培养基中收集L-谷氨酸来产生。

权利要求 :

1.具有产生L-谷氨酸能力的微生物,其中所述微生物经修饰使得来自大肠杆菌或菠萝泛菌的yhfK基因的表达增强,其中通过增加所述yhfK基因的拷贝数或者通过修饰所述yhfK基因的表达调控序列增强了所述yhfK基因的表达。

2.权利要求1的微生物,其中所述yhfK基因编码由SEQ ID NO:2或4的氨基酸序列组成的蛋白质。

3.权利要求1的微生物,其中所述yhfK基因为DNA,其由SEQ ID NO:1中1530至3620位或SEQ ID NO:3中201至2288位的核苷酸序列组成。

4.权利要求1的微生物,其中所述微生物是γ-蛋白细菌。

5.权利要求1的微生物,其中所述微生物是选自埃希氏菌属、肠杆菌属、泛菌属、克雷伯氏菌属和沙雷氏菌属组成的组的肠杆菌科细菌。

6.权利要求1的微生物,其中所述微生物是棒状杆菌属细菌。

7.产生L-谷氨酸的方法,包括在培养基中培养权利要求1-6任一项的微生物,并且从所述培养基中收集所述L-谷氨酸。

8.编码由SEQ ID NO:2的氨基酸序列组成的蛋白质的基因。

9.具有L-谷氨酸产生能力的微生物,其中所述微生物通过增加所述权利要求8的基因的拷贝数或者通过修饰所述基因的表达调控序列进行修饰以过表达所述基因。

说明书 :

技术领域

本发明涉及产生L-谷氨酸的方法。L-谷氨酸广泛用作调味品(seasoning)等的原料。

背景技术

L-谷氨酸主要利用产L-谷氨酸细菌通过发酵产生,所述细菌包括属于短杆菌属(Brevibacterium)、棒状杆菌属(Corynebacterium)或微杆菌属(Microbacterium)的棒状细菌,或其突变株(Kunihiko Akashi等,Amino AcidFermentation,Japan Scientific Societies Press[Gakkai Shuppan Center],pp.195-215,1986)。也已报导了用其他微生物通过发酵产生L-谷氨酸的方法,U.S.专利No.3,220,929报导了用属于芽孢杆菌属(Bacillus)、链霉菌属(Streptomyces)、青霉属(Penicillium)等的微生物产生L-谷氨酸的方法。U.S.专利No.3,563,857报导了用属于假单胞菌属(Pseudomonas)、节杆菌属(Arthrobacter)、沙雷氏菌属(Serratia)、念珠菌属(Candida)等的微生物产生L-谷氨酸的方法。JP32-9393B报导了用属于芽孢杆菌属、假单胞菌属、沙雷氏菌属、产气气杆菌(Aerobacter aerogenes)(现在称为产气肠杆菌(Enterobacter aerogenes))等的微生物产生L-谷氨酸的方法。JP5-244970A报导了用大肠杆菌(Escherichia coli)突变株产生L-谷氨酸的方法。此外,US6,197,559、US6,331,419和欧洲专利公开No.0999282中报导了用属于克雷伯氏菌属(Klebsiella)、欧文氏菌属(Erwinia)、泛菌属(Pantoea)或肠杆菌属(Enterobacter)的微生物产生L-谷氨酸的方法。
另外,已公开了用重组DNA技术增强L-谷氨酸生物合成酶活性以增强L-谷氨酸产生能力的方法。例如,据报导,通过导入源自大肠杆菌或谷氨酸棒状杆菌(Corynebacterium glutamicum)的编码柠檬酸合成酶的基因,可以有效地提高棒状杆菌属或短杆菌属细菌(JP7-121228B)产生L-谷氨酸的能力。另外,还报导了通过导入源自棒状杆菌属细菌的柠檬酸盐合成酶基因,可以有效地提高属于肠杆菌属、克雷伯氏菌属、沙雷氏菌属、欧文氏菌属、或埃希氏菌属的肠细菌(欧洲专利公开No.0999282)的L-谷氨酸产生能力。
通过修饰物质的摄入或输出系统而提高细菌产生物质如氨基酸的能力的方法是已知的。作为修饰物质摄入系统的方法,例如去除或减少物质的细胞摄入的方法是已知的。具体地,通过缺失gluABCD操纵子或其部分(欧洲专利公开No.1038970)以去除或减少L-谷氨酸的细胞摄入,或者减少嘌呤核苷酸的细胞摄入以增强嘌呤核苷酸的产生能力(欧洲专利公开No.1004663)等,以此来提高L-谷氨酸产生能力是已知的。
修饰输出系统的方法包括增强目标物质的输出系统和去除或减少目标物质生物合成系统中的中间产物或底物的输出系统。例如,已经报导了利用棒状杆菌属细菌菌株产生L-赖氨酸的方法,在所述菌株中L-赖氨酸输出基因(lysE)的表达得到增强(WO97/23597)。此外,还报导了用微生物产生L-氨基酸的方法,在所述微生物中,rhtA,B,和C基因的表达得到增强(欧洲专利公开No.1013765)。据报导这些基因与L-氨基酸的输出有关。作为去除L-谷氨酸生物合成系统中的中间产物或底物的输出系统的方法,突变或破坏2-酮戊二酸透性酶(2-oxoglutarate permease)基因以减少2-酮戊二酸的输出是已知的,2-酮戊二酸是L-谷氨酸生物合成的中间产物(WO01/05959)。
另外,还披露了培养微生物的方法(WO00/37647),其中用编码ATP结合盒超家族(ATP binding cassette superfamily)(ABC转运蛋白)的基因修饰了通过细胞膜的氨基酸转运,所述ATP结合盒超家族与底物通过细胞膜的渗透有关。
据报导,在棒状杆菌中,添加生物素或表面活性剂可改变细胞膜的渗透性,并由此使L-谷氨酸从细胞内部输出,这显示棒状杆菌中L-谷氨酸的输出并非由任何输出基因介导(Eiichiro Kimura,Metabolic Engineering ofGlutamate Production,Advanced Biochemical Engineering Biotechnology,79:37-57,2003,Springer Verlag)。此外,还报导了在埃希氏菌属细菌中,通过增强yfiK基因的表达,L-谷氨酸产生效率得到提高,认为yfiK基因与L-氨基酸输出有关(欧洲专利公开1016710)。
然而,尚未报导泛菌属微生物或其他微生物的L-谷氨酸输出基因,期望发现新的L-谷氨酸输出基因。
或者,在酸性条件下,培养微生物以产生并沉淀L-谷氨酸的方法是已知的(欧洲专利公开1078989)。其中去除或减少了2-酮戊二酸脱氢酶活性的肠杆菌属细菌常用于L-谷氨酸沉淀的发酵产生(欧洲专利公开1078989)。通常,在输入细胞后,L-谷氨酸由谷氨酸脱氢酶一步转化为TCA循环中间产物,2-酮戊二酸,因此一般认为输入到细胞中的L-谷氨酸很容易被代谢。然而,当在L-谷氨酸沉淀条件下培养2-酮戊二酸脱氢酶失活或活性降低的微生物时,不带电荷的游离L-谷氨酸比例增高,容易通过细胞膜,使细胞内L-谷氨酸浓度增加,因此细菌细胞生长减慢。欧洲专利公开1078989中,通过突变处理培养了能够有效产生并沉淀L-谷氨酸的2-酮戊二酸脱氢酶缺陷菌株,并用于L-谷氨酸的产生。然而,除了上述菌株外,很少报导能够产生同时也沉淀L-谷氨酸的菌株,也没有报导在沉淀L-谷氨酸的条件下能够赋予宿主微生物L-谷氨酸抗性和L-谷氨酸产生能力的基因。
yhfK基因是存在于大肠杆菌(Escherichia coli)基因组上的基因(Science,277(5331):1453-74,1997),已报导其编码根据预测的氨基酸序列的基序、拓扑学等推定的转运蛋白(J.Mol.Microbiol.Biotechnol.,2(2):195-198,2000)。然而,先前既没有关于基因的克隆也没有关于基因的表达分析的报导。此外,基因的实际功能也仍然是未知的。
发明概述
本发明的目的是提供能够有效地产生L-谷氨酸的微生物,也提供用这样的菌株有效地产生L-谷氨酸的方法。
本发明的发明人进行了广泛的研究以达到上述目的,结果,他们得到了L-谷氨酸输出基因yhfK,其同样赋予L-谷氨酸抗性。发明人还发现在yhfK基因表达增强的菌株中,细胞内L-谷氨酸浓度降低,用这样的菌株提高了L-谷氨酸产生能力。
本发明的目的是提供具有产生L-谷氨酸能力的微生物,其中所述的微生物经修饰增强了yhfK基因的表达。
本发明的另一目的是提供上述的微生物,其中通过增加yhfK基因的拷贝数或修饰所述yhfK基因的表达调控序列增强了所述yhfK基因的表达。
本发明的又一目的是提供上述的微生物,其中由所述yhfK基因编码的蛋白质的氨基酸序列选自由SEQ ID NO:10,11和12所组成的组,其中所述蛋白质能够输出L-谷氨酸。
本发明的又一目的是提供上述的微生物,其中所述的yhfK基因编码选自下组的蛋白质:
(A)包含SEQ ID NO:2或4的氨基酸序列的蛋白质;
(B)包含SEQ ID NO:2或4的氨基酸序列的蛋白质,且其中所述蛋白质包括一个或几个氨基酸残基的取代、缺失、插入或添加,且其中所述蛋白质能够输出L-谷氨酸。
本发明的又一目的是提供上述的微生物,其中所述的yhfK基因编码蛋白质,该蛋白质包含与SEQ ID NO:2或4的氨基酸序列具有70%或更高同源性的氨基酸序列,且其中所述的蛋白质能够输出L-谷氨酸。
本发明的又一目的是提供上述的微生物,其中所述的yhfK基因选自下组:
(a)包含SEQ ID NO:1中1530至3620位或SEQ ID NO:3中201至2288位的核苷酸序列的DNA;
(b)能够在严谨条件下与SEQ ID NO:1中1530至3620位或SEQ ID NO:3中201至2288位核苷酸序列,或由所述核苷酸序列制备的探针杂交的DNA,且其编码能够输出L-谷氨酸的蛋白质。
本发明的又一目的是提供上述的微生物,其中所述的微生物是γ-蛋白细菌(γ-proteobacterium)。
本发明的另一目的是提供上述的微生物,其中所述的微生物是选自由埃希氏菌属细菌、肠杆菌属细菌、泛菌属细菌、克雷伯氏菌属细菌和沙雷氏菌属细菌所组成的组的肠杆菌科(Enterobacteriaceae)细菌。
本发明的又一目的是提供上述的微生物,其中所述的微生物是棒状杆菌属细菌。
本发明的又一目的是提供产生L-谷氨酸的方法,包括在培养基中培养上述的微生物并从培养基中收集所述的L-谷氨酸。
本发明的又一目的是提供编码选自下组的蛋白质的基因:
(A)包含SEQ ID NO:2的氨基酸序列的蛋白质;和
(B)包含与SEQ ID NO:2的氨基酸序列有71%或更高同源性的氨基酸序列的蛋白质,其中所述的蛋白质能够输出L-谷氨酸。
本发明的另一目的是提供具有L-谷氨酸产生能力的微生物,其中所述微生物经修饰以过表达yhfK基因。
本发明的又一目的是提供上述的微生物,其中通过增加所述yhfK基因的拷贝数或修饰所述yhfK基因的表达调控序列而过表达所述的yhfK基因。
利用本发明的微生物,可以通过发酵有效地产生L-谷氨酸。本发明的基因可以适合地用于培养产生L-谷氨酸的微生物。
附图简述
图1显示对照菠萝泛菌(Pantoea ananatis)菌株(A)和含有携带yhfK基因的质粒Lib10的菠萝泛菌菌株(B)的生长曲线。
图2显示用于扩增菠萝泛菌yhfK基因的质粒(A)和用于扩增大肠杆菌yhfK基因的质粒(B)的构建方法。
图3显示对照菌株、质粒Lib10-扩增的菌株和yhfK-扩增的菠萝泛菌菌株的生长曲线。
图4显示具有扩增的源自大肠杆菌或菠萝泛菌的yhfK基因的菌株的胞内与胞外L-谷氨酸浓度比率的比较。
优选实施方案的详细说明
<1>本发明产生L-谷氨酸的微生物
本发明的微生物具有产生L-谷氨酸的能力,其经修饰以使yhfK基因的表达得到增强,或者过表达。本文所用术语“产生L-谷氨酸的能力(L-谷氨酸产生能力)”或“能够产生L-谷氨酸”指当在培养基中培养本发明的微生物时,导致L-谷氨酸在培养基中或微生物的细胞中累积至能从该培养基或细胞中收集的程度的能力。本发明的微生物可以本身就具有产生L-谷氨酸的能力,或者也可以是通过突变或重组DNA技术修饰如下提到的亲本菌株而获得了产生L-谷氨酸的能力。此外,也可以使用通过导入或转化本发明的yhfK基因而赋予其L-谷氨酸产生能力的微生物。
本发明可被修饰的微生物亲本菌株的例子包括肠杆菌科中分类为γ-蛋白细菌的那些菌株,例如埃希氏菌属(Escherichia)、肠杆菌属(Enterobacter)、泛菌属(Pantoea)、克雷伯氏菌属(Klebsiella)、沙雷氏菌属(Serratia)、欧文氏菌属(Erwinia)、沙门氏菌属(Salmonella)、摩根氏菌属(Morganella)等的菌株,属于短杆菌属(Brevibacterium)、棒状杆菌属(Corynebacterium)或微杆菌属(Microbacterium)的棒状细菌(coryneform bacteria),属于脂环酸杆菌属(Alicyclobacillus)、芽孢杆菌属(Bacillus)、酵母属(Saccharomyces)等的微生物,等等。具体地,可以使用根据由NCBI(国家生物技术信息中心(NationalCenter for Biotechnology Information))数据库http://www.ncbi.nlm.nih.gov/htbin-post/Taxonomy/wgetorg?mode=Tree&id=1236&lvl=3&keep=1&srchmode=1&unlock)提供的分类属于“γ-蛋白细菌”的那些菌株。此外,也可以使用甲醇同化型细菌如嗜甲基菌属(Methylophilus)、甲基菌属(Methylobacillus)等等。可以在含有甲醇的培养基中培养这些微生物以产生L-氨基酸,其中甲醇为可低成本大量获得的发酵原料。这些亲本菌株可以是本身具有yhfK基因的,也可以不是,但当将yhfK基因导入或转化时,显示出提高的L-谷氨酸输出能力。
埃希氏菌属细菌的例子包括大肠杆菌等。当用基因工程技术培养大肠杆菌L-谷氨酸产生菌株时,大肠杆菌K12菌株及其衍生物例如大肠杆菌MG1655菌株(ATCC No.47076),W3110菌株(ATCC No.27325)等可以用作亲本菌株。大肠杆菌K12菌株于1922年在斯坦福大学分离,而且其为λ噬菌体的溶原菌。此外,它是具有F因子的通用菌株,由该菌株可以通过接合(conjugation)等来产生基因重组菌株。另外,已经测定了大肠杆菌K12菌株的基因组序列,并因此可以获得其基因信息。大肠杆菌K12菌株及其衍生物可以由美国典型培养物保藏中心(ATCC,地址:P.O.Box 1549,Manassas,VA20108,美国)获得。
另外,肠杆菌属细菌的例子包括成团肠杆菌(Enterobacter agglomerans)、产气肠杆菌(Enterobacter aerogenes)等,泛菌属细菌的例子包括菠萝泛菌(Pantoea ananatis)。最近,基于16S rRNA的核苷酸序列分析等,将成团肠杆菌的一些菌株重新分类为成团泛菌(Pantoea agglomerans)、菠萝泛菌、斯氏泛菌(Pantoea stewartii)等。本发明中,肠杆菌属和泛菌属细菌均可使用,只要其分类为γ-蛋白细菌。当用基因工程技术培养菠萝泛菌菌株时,可以使用菠萝泛菌AJ13355菌株(FERM BP-6614),AJ13356菌株(FERM BP-6615),AJ13601菌株(FERM BP-7207)及其衍生物。分离这些菌株时,这些菌株被鉴定并保藏为成团肠杆菌。然而,最近,基于如上所述的16S rRNA的核苷酸测序等,其被重新分类为菠萝泛菌。
本文中棒状杆菌属细菌指Bergey’s Manual of Determinative Bacteriology(伯杰氏鉴定细菌学手册),第8版,p.599,1974中所定义的一组微生物。它们是需氧、革兰氏阳性、非抗酸性杆菌,不能形成孢子,并包括迄今还分类为短杆菌属但目前合并到棒状杆菌属的细菌(Int.J.Syst.Bacteriol.,41,255,1991),还包括属于与棒状杆菌属密切相关的短杆菌属或微杆菌属的细菌。
以下列出适于本发明产生L-谷氨酸的棒状杆菌的例子:
嗜乙酰乙酸棒状杆菌(Corynebacterium acetoacidophilum)
醋谷棒状杆菌(Corynebacterium acetoglutamicum)
烷醇棒状杆菌(Corynebacterium alkanolyticum)
美棒状杆菌(Corynebacterium callunae)
谷氨酸棒状杆菌(Corynebacterium glutamicum)
百合花棒状杆菌(Corynebacterium lilium)(谷氨酸棒状杆菌)
栖糖蜜棒状杆菌(Corynebacterium melassecola)
嗜热产氨棒状杆菌(Corynebacterium thermoaminogenes)(Corynebacterium effciens)
力士棒状杆菌(Corynebacterium herculis)
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒状杆菌)
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒状杆菌)
Brevibacterium immariophilum
乳发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒状杆菌)
玫瑰色短杆菌(Brevibacterium roseum)
解糖短杆菌(Brevibacterium saccharolyticum)
生硫短杆菌(Brevibacterium thiogenitalis)
产氨短杆菌(Brevibacterium ammoniagens)(产氨棒状杆菌(Corynebacterium ammoniagens))
白色短杆菌(Brevibacterium album)
蜡状短杆菌(Brevibacterium cerinum)
嗜氨微杆菌(Microbacterium ammoniaphilum)
具体地,可以以下列菌株为例。
嗜乙酰乙酸棒状杆菌ATCC13870
醋谷棒状杆菌ATCC 15806
烷醇棒状杆菌ATCC 21511
美棒状杆菌ATCC 15991
谷氨酸棒状杆菌ATCC 13020,ATCC 13032,ATCC 13060
百合花棒状杆菌(谷氨酸棒状杆菌)ATCC 15990
栖糖蜜棒状杆菌ATCC 17965
嗜热产氨棒状杆菌AJ12340(FERM BP-1539)
力士棒状杆菌ATCC 13868
二歧短杆菌(谷氨酸棒状杆菌)ATCC 14020
黄色短杆菌(谷氨酸棒状杆菌)ATCC 13826,ATCC 14067
Brevibacterium immariophilum ATCC 14068
乳发酵短杆菌(谷氨酸棒状杆菌)ATCC 13665,ATCC 13869
玫瑰色短杆菌ATCC 13825
解糖短杆菌ATCC 14066
生硫短杆菌ATCC 19240
产氨短杆菌(产氨棒状杆菌)ATCC 6871
白色短杆菌ATCC 15111
蜡状短杆菌ATCC 15112
嗜氨微杆菌ATCC 15354
嗜甲基菌属细菌的具体例子包括食甲基嗜甲基菌(Methylophilusmethylotrophus),食甲基嗜甲基菌的典型例子包括AS1菌株(NCIMB 10515)等。食甲基嗜甲基菌AS1菌株(NCIMB 10515)可由国家工业与海洋细菌保藏中心(National Collections of Industrial and Marine Bacteria)(地址:NCIMBLts.,Torry Research Station,135,Abbey Road,Aberdeen AB9 8DG,英国)获得。
甲基菌属细菌的具体例子包括糖原甲基菌(Methylobacillus glycogenes)、鞭毛甲基菌(Methylobacillus flagellatum)等。糖原甲基菌包括T-11菌株(NCIMB 11375),ATCC 21276菌株,ATCC 21371菌株,ATR80菌株(在Appl.Microbiol.Biotechnol.,vol.42,pp.67-72,1994中描述),A513菌株(在Appl.Microbiol.Biotechnol.,vol.42,pp.67-72(1994)中描述)等等。糖原甲基菌NCIMB 11375菌株可由国家工业与海洋细菌保藏中心(地址:NCIMB Lts.,Torry Research Station,135,Abbey Road,Aberdeen AB9 8DG,英国)提供。鞭毛甲基菌的例子包括KT菌株(Arch.Microbiol.,vol.149,pp.441-446,1988)等。
<赋予L-谷氨酸产生能力>
赋予上述微生物L-谷氨酸产生能力的方法包括例如,修饰微生物使基因的表达增强和/或使基因过表达,所述基因编码涉及L-谷氨酸生物合成的酶。涉及L-谷氨酸生物合成的酶的例子包括谷氨酸脱氢酶(下文也称为“GDH”)、谷氨酰胺合成酶、谷氨酸合酶、异柠檬酸脱氢酶、乌头酸水合酶、柠檬酸合酶(下文也称为“CS”)、磷酸烯醇丙酮酸羧化酶(下文也称为“PEPC”)、丙酮酸羧化酶、丙酮酸脱氢酶、丙酮酸激酶、磷酸烯醇丙酮酸合酶、烯醇化酶、磷酸甘油变位酶、磷酸甘油酸激酶、3-磷酸甘油醛脱氢酶、磷酸丙糖异构酶、果糖二磷酸醛缩酶、磷酸果糖激酶、磷酸葡糖异构酶等等。在这些酶中,优选CS、PEPC和GDH中的一种或多种活性得到增强,更优选所有这三种酶的活性都得到增强。
以下将解释修饰微生物以增强目标基因表达的方法。
一个方法是通过克隆目标基因、将其插入适当的质粒、用所得质粒转化宿主微生物来增加目标基因的拷贝数。例如,已经报导了来自埃希氏菌属和棒状杆菌属的编码CS(gltA基因),PEPC(ppc基因),和GDH(gdhA基因)的基因(Biochemistry,vol.22,pp.5243-5249,1983;J.Biochem.,vol.95,pp.909-916,1984;Gene,vol.27,PP.193-199,1984;Microbiology,vol.140,pP.1817-1828,1994;Mol.Gen.Genet.,vol.218,pp.330-339,1989;MolecularMicrobiology,vol.6,pp.317-326,1992),因此可以使用引物通过PCR来获得这些基因,所述引物基于来自埃希氏菌属或棒状杆菌属细菌染色体DNA的核苷酸序列。
可在属于肠杆菌科的微生物中自主复制并可用于转化的质粒的例子包括pUC19,pUC18,pBR322,RSF1010,pHSG299,pHSG298,pHSG399,pHSG398,pSTV28,pSTV29(pHSG和pSTV可由Takara Bio获得),pMW119,pMW118,pMW219,pMW218(pMW系列质粒可由Nippon Gene获得)等。用于棒状杆菌的质粒的例子包括pAM330(JP58-67699A),pHM1519(JP58-77895A),pAJ655,pAJ611,pAJ1844(JP58-192900A),pCG1(JP57-134500A),pCG2(JP58-35197A),pCG4,pCG11(JP57-183799A),pHK4(JP5-7491A)等。噬菌体DNA也可代替质粒用作载体。可用于同时增强CS、PEPC和GDH的活性的质粒的例子包括RSFCPG,其含有gltA,ppc和gdhA基因(EP 0952221A)。
可在甲基菌属细菌中复制的载体的具体例子包括广宿主谱载体RSF1010及其衍生物如pAYC32(Chistorerdov,A.Y.,Tsygankov,Y.D.Plasmid,16,161-167,1986),pMFY42(Gene,44,53,1990),pRP301,pTB70(Nature,287,396,1980)等。
转化方法的例子包括用氯化钙处理受体细胞以增加DNA通透性,该方法已报导用于大肠杆菌K-12(Mandel,M.和Higa,A.,J.Mol.Biol.,53,159(1970)),从处于生长期的细胞制备感受态细胞,然后用DNA转化,该方法已报导用于枯草芽孢杆菌(Duncan,C.H.,Wilson,G.A.和Young,F.E.,Gene,l,153(1977)),等等。除了这些方法,可以将重组DNA导入原生质体-或原生质球-样受体细胞,其已被报导适用于枯草芽孢杆菌、放线菌(actinomycetes)、和酵母(Chang,S.和Choen,S.N.,Molec.Gen.Genet.,168,111(1979);Bibb,M.J.,Ward,J.M.和Hopwood,O.A.,Nature,274,398(1978);Hinnen,A.,Hicks,J.B.和Fink,G.R.,Proc.Natl.Sci.,USA,75,1929(1978))。此外,也可以通过电脉冲方法进行微生物的转化(JP2-207791A)。
也可以通过将基因的多拷贝整合到微生物的染色体DNA来增加基因拷贝数。为了将多拷贝的基因整合到微生物的染色体DNA中,可以通过靶向存在于染色体DNA上多拷贝中的序列来进行同源重组(Experiments inMolecular Genetics,Cold Spring Harbor Lab.,1972)。位于转座子末端的重复DNA和反向重复序列(iverted repeats)可用作以多个拷贝存在于染色体DNA上的序列。或者,如EP0332488B所公开的,也可能将目标基因并入转座子中,并允许其转移,以使多拷贝的基因整合到染色体DNA中。另外,也可以使用Mu噬菌体将目标基因并入宿主染色体中(EP0332488B)。
通过用更强的表达调控序列替换染色体上或质粒上目标基因的表达调控序列如启动子也可以增强目标基因的表达,如WO00/18935所公开的那样。例如,lac启动子,trp启动子,trc启动子,pL启动子等是已知的强启动子。而且,将几个核苷酸取代导入基因的启动子区域使启动子更为有效也是可能的。表达调控序列的取代也可例如,用温度敏感性质粒以与基因取代相同的方式进行。具有大肠杆菌或菠萝泛菌的温度敏感复制起点的载体例子包括WO99/03988中所述的质粒pMAN997等。另外,表达调控序列的取代也可以用λ噬菌体的Red重组酶进行(Datsenko,K.A.,PNAS,97(12),6640-6645,2000)。表达调控序列的修饰可以与增加基因拷贝数组合使用。
用上述方法修饰而增强了柠檬酸合酶基因、磷酸烯醇丙酮酸羧化酶基因和/或谷氨酸脱氢酶基因的表达的微生物的例子包括US6,197,559,US6,331,419,和欧洲专利公开No.0999282,No.1078989中公开的微生物。
修饰微生物以赋予其L-谷氨酸产生能力可以通过增强6-磷酸葡糖酸脱水酶活性或2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶活性来实现。经修饰而增强了这些基因的表达的微生物的例子包括欧洲专利公开EP1352966中所公开的微生物。
修饰微生物以赋予其L-谷氨酸产生能力可以通过减小或灭活催化L-谷氨酸生物合成途径的分支反应,并产生除L-谷氨酸以外的化合物的酶的活性来进行。催化L-谷氨酸生物合成途径的分支反应,并产生除L-谷氨酸以外的化合物的酶的例子包括2-酮戊二酸脱氢酶、异柠檬酸裂合酶、磷酸乙酰转移酶、乙酸激酶、乙酰羟酸合酶、乙酰乳酸合酶、甲酸乙酰转移酶、乳酸脱氢酶、谷氨酸脱羧酶、1-吡洛啉脱氢酶等等。在这些酶中,优选减小或去除2-酮戊二酸脱氢酶的活性。
为了减小或灭活上述酶的活性,可以通过常见的诱变处理方法或基因工程方法导入减小或灭活这些酶胞内活性的突变。诱变处理方法的例子包括利用X-射线或紫外线照射、利用诱变试剂如N-甲基-N’-硝基-N-亚硝基胍(N-methyl-N’-nitro-N-nitrosoguanidine)处理等等。可将该突变导入到编码区或表达调控区如启动子。基因工程技术的例子包括基因重组、转导(transduction)、细胞融合等。
目标酶的胞内活性和活性的减小程度可以通过使用来自候选菌株的细胞提取物或其纯化级分(purified fraction)来测定酶活性、并将其与野生型或未经修饰的菌株的活性相比较来确定。例如,2-酮戊二酸脱氢酶活性可以用Reed等(Reed L.J.和Mukherjee B.B.,Methods in Enzymology,13,pp.55-61,1969)的方法来测定。
USP5,378,616,USP5,573,945A等公开了灭活或减小埃希氏菌属细菌中2-酮戊二酸脱氢酶活性的方法。WO95/34672中公开了灭活或减小棒状杆菌属细菌中2-酮戊二酸脱氢酶活性的方法。此外,USP6,331,419中公开了灭活或减小泛菌属细菌中2-酮戊二酸脱氢酶活性的方法。
减小或去除了2-酮戊二酸脱氢酶活性的细菌的具体例子包括下述菌株。
大肠杆菌AJ12624(FERM BP-3853)
大肠杆菌AJ12628(FERM BP-3854)
大肠杆菌AJ12949(FERM BP-4881)
乳发酵短杆菌ΔS菌株(WO95/34672).
菠萝泛菌AJ13601(FERM BP-7207EP 1078989A)
菠萝泛菌AJ13356(FERM BP-6615US专利6,331,419)
菠萝泛菌SC17sucA(FERM BP-8646)
植生克雷伯氏菌(Klebsiella platicola)AJ13410(FERM BP-6617US专利6,197,559)
SC17sucA菌株是来自SC17sucA/RSFCPG+pSTVCB菌株的质粒消除(plasmid-curing)菌株,具有专用编号AJ417,并于2004年2月26日保藏于国立生命科学和人体技术研究所(National Institute of Bioscience andHuman-Technology),Agency of Industrial Science and Technology,Ministry ofEconomy,Trade and Industry(1-1-3,Higashi,Tsukuba-shi,Ibaraki-ken,305-8566),保藏号为FERM BP-08646。
<增强yhfK基因的表达>
本发明的微生物可以通过修饰如上述那些具有L-谷氨酸产生能力的微生物以增强yhfK基因的表达来获得。或者,可以首先增强yhfK基因的表达,然后赋予其L-谷氨酸产生能力。此外,本发明的微生物可以是通过增强yhfK基因的表达而被赋予了L-谷氨酸产生能力的微生物。
yhfK基因的表达可以通过修饰表达调控序列如启动子以增强内源yhfK基因的表达,或者通过用质粒等外源导入yhfK基因来增强。可以组合使用这些技术。
yhfK基因表达的增强可以通过利用northern杂交或RT-PCR(Molecularcloning:Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)测定本发明细菌中由yhfK基因转录的RNA的量、并将其与野生型或未经修饰的菌株的情况相比较来确认。yhfK基因在本发明微生物中表达的增强大于其在野生型或未经修饰的菌株中的情况,优选不小于野生型或未经修饰的菌株的1.5倍,更优选不小于2倍,并且最优选不小于3倍。
本发明中使用的“yhfK基因”包括源自肠杆菌科的基因,例如来自大肠杆菌的yhfK基因,来自菠萝泛菌的yhfK基因或其同源物。来自大肠杆菌的yhfK基因的例子包括编码具有SEQ ID NO:4(Genbank登录号No.NP_417817.[gi:16131237])的氨基酸序列的蛋白质的基因,优选具有SEQID NO:3中201至2288位核苷酸的核苷酸序列的基因。源自菠萝泛菌的yhfK基因的例子包括编码具有SEQ ID NO:2的氨基酸序列的蛋白质的基因,优选具有SEQ ID NO:1中1530至3620位核苷酸的核苷酸序列的基因。yhfK基因可以是由GenBank登录号AE016992的230947至233037位核苷酸所代表的弗氏志贺氏菌(Shigella flexneri)的yhfK基因,和由GenBank登录号AE008859的4272至6359位核苷酸所代表的鼠伤寒沙门氏菌(Salmonellatyphimurium)的yhfK基因。大肠杆菌或菠萝泛菌yhfK基因的同源物指这样的基因,其显示出与两种yhfK基因高度的结构相似性,且增强宿主微生物L-谷氨酸输出能力以及L-谷氨酸产生能力。yhfK基因同源物的例子包括编码具有SEQ ID NOs:10,11或12的氨基酸序列的蛋白质的基因。SEQ IDNO:10的氨基酸序列是在大肠杆菌YhfK蛋白(SEQ ID NO:2)、菠萝泛菌的YhfK蛋白(SEQ ID NO:4)、和弗氏志贺氏菌及鼠伤寒沙门氏菌的YhfK同源物之间保守的序列。SEQ ID NO:11的氨基酸序列是在大肠杆菌YhfK蛋白和鼠伤寒沙门氏菌的YhfK蛋白之间保守的序列。SEQ ID NO:12的氨基酸序列是在大肠杆菌YhfK蛋白和肠沙门氏菌(Salmonella enterica)_Paratyphi菌株的YhfK蛋白之间保守的序列。
另外,基于上述例示基因的同源性,yhfK基因可以克隆自γ-蛋白细菌如肠杆菌属、克雷伯氏菌属、沙雷氏菌属、欧文氏菌和耶尔森氏菌属(Yersinia)细菌,棒状细菌如谷氨酸棒状杆菌和乳发酵短杆菌,假单胞菌属细菌如铜绿假单胞菌(Pseudomonas aeruginosa),分枝杆菌属(Mycobacterium)细菌如结核分支杆菌(Mycobacterium tuberculosis)等。由弗氏志贺氏菌和鼠伤寒沙门氏菌的yhfK基因所编码的蛋白质的氨基酸序列与SEQ ID NO:4的氨基酸序列分别有99%和86%的同源性,与SEQ ID NO:2的氨基酸序列分别有70%和71%的同源性。SEQ ID NO:2和4的氨基酸序列相互之间具有70%的同源性。氨基酸序列和DNA序列的同源性可以用Karlin和Altschul的算法BLAST(Proc.Natl.Acad.Sci.U.S.A.,90,和5873(1993))和FASTA(MethodsEnzymol.,183,和63(1990))来测定。程序BLASTN和BLASTX是以此算法BLAST为基础而开发的(参见http://www.ncbi.nlm.nih.gov)。
yhfK基因同源物包括源于其他微生物的基因,其与大肠杆菌和菠萝泛菌的yhfK基因具有高度的结构同源性,并具有L-谷氨酸输出能力。源于其他微生物的yhfK基因可以是这样的基因,其编码与SEQ ID NO:2或4的全部氨基酸序列有70%或更高同源性、优选80%或更高同源性、更优选90%或更高同源性,具体优选95%或更高同源性且具有输出L-谷氨酸的能力的蛋白质。
yhfK基因可以编码具有SEQ ID NO:2或4的氨基酸序列的蛋白质,在一个或多个位点包括一个或几个氨基酸残基的取代、缺失、插入或添加,只要保持编码蛋白质的活性,即L-谷氨酸输出能力。尽管此处所指出的“几个”氨基酸残基的数目可以依据其在蛋白质三维结构中的位置或氨基酸残基的类型而改变,但优选2至20,更优选2至10,特别优选2到5。包含功能上中性有义(neutral sense)突变的这种氨基酸取代是保守取代。
在芳香族氨基酸的例子中,保守性取代包括phe,trp,tyr相互取代。在疏水性氨基酸的例子中,保守性取代包括leu,ile,val相互取代。在极性氨基酸的例子中,保守性取代包括gln和asn相互取代。在碱性氨基酸的例子中,保守性取代包括arg,lys,his相互取代。在酸性氨基酸的例子中,保守性取代包括asp和glu的相互取代。在含羟基的氨基酸的例子中,保守性取代包括ser和thr相互取代。例如,可以以野生型序列为基础,通过向SEQ ID:10,11,12的X残基导入导致保守性取代的突变来获得具有相同功能的YhfK蛋白。氨基酸的这种取代优选为保守取代,其包括用ser或thr取代ala,用gln,his或lys取代arg,用glu,gln,lys,his或asp取代asn,用asn,glu或gln取代asp,用ser或ala取代cys,用ash,glu,lys,his,asp或arg取代gln,用gly,asn,gln,lys或asp取代glu,用pro取代gly,用asn,lys,gln,arg或tyr取代his,用leu,met,val或phe取代ile,用ile,met,val或phe取代leu,用asn,glu,gln,his或arg取代lys,用ile,leu,val或phe取代met,用trp,tyr,met,ile或leu取代phe,用thr或ala取代ser,用ser或ala取代thr,用phe或tyr取代trp,用his,phe或trp取代tyr以及用met,ile或leu取代val(ANTIMICROBIAL AGENTS AND CHEMTHERAPY,July 2002 Vol46,No.7p2208-2218)。
另外,yhfK基因的遗传简并性(genetic degeneracy)在导入yhfK基因的宿主菌株之间是不同的,可将yhfK基因的密码子改变为在每种宿主菌株中频繁使用的密码子。yhfK基因可以是编码具有YhfK蛋白的氨基酸序列的蛋白质的基因,该氨基酸序列在序列的N-末端和/或C-末端包括至少一个氨基酸残基的添加或缺失。在这种情况下,尽管只要保持输出L-谷氨酸的能力对N-末端和/或C-末端添加或缺失的氨基酸残基的数目没有具体限制,但不超过50,优选不超过20,更优选不超过10,特别优选不超过5。
可以通过修饰SEQ ID NO:1或3,或SEQ IDs No:10,11,12所示核苷酸序列来获得编码yhfK基因同源物的基因,例如,通过位点特异性突变,使在编码蛋白的特定位点包括一个或多个氨基酸残基的取代、缺失、插入或添加。此外,也可以通过常规已知的突变处理获得这样的基因。这种突变处理的例子包括用羟胺体外处理具有SEQ ID NO:1或3所示核苷酸序列的基因,用紫外线照射或常规突变处理中使用的突变试剂如N-甲基-N’-硝基-N亚硝基胍(NTG)或EMS(甲磺酸乙酯(ethyl methanesulfonate))处理携带所述基因的微生物如埃希氏菌属细菌。上述氨基酸残基的取代、缺失、插入、添加、倒置等突变也包括由携带yhfK基因的微生物个体间差异和物种间差异所引起的天然发生的突变(突变体或变体)。这些基因是否编码具有L-谷氨酸输出能力的蛋白可以通过,例如在适当细胞中表达这些基因并测定输出到培养基中的L-谷氨酸的量是否增加来确定。
yhfK基因也可以是这样的DNA,其能够在严谨条件下与具有SEQ IDNO:1的1530至3620位核苷酸序列的DNA、具有SEQ ID NO:3的201至2288位核苷酸序列的DNA或由这些序列制备的探针杂交,并编码具有L-谷氨酸输出能力的蛋白质。本领域技术人员可以在Boehringer mannheinGmbH出版的名为“the DIG system Users Guide for Filter Hybridization”的手册中找到DNA序列杂交方法的说明。
此处使用的“严谨条件”指在该条件下能够形成所谓的特异性杂交体而不形成非特异性杂交体的条件。严谨条件的例子包括使得具有高度同源性的DNA互相杂交的条件,例如,具有不小于70%同源性,优选不小于80%同源性,更优选不小于90%同源性,尤其优选不小于95%同源性的DNA互相杂交,而具有低于70%同源性的DNA不互相杂交的条件,以及使得DNA在Southern杂交所常见的洗涤盐浓度下互相杂交的条件,即在1x SSC,0.1%SDS,60℃,优选0.1x SSC,0.1%SDS,60℃,更优选0.1x SSC,0.1%SDS,68℃下洗涤一次或优选2-3次。
yhfK基因的部分序列也可用于本发明。这样的探针可以以本领域技术人员熟知的方式,用以yhfK基因的核苷酸序列为基础设计的寡核苷酸,通过PCR从包括yhfK基因的DNA片段制备。当具有约300bp长度的DNA片段用作探针时,杂交后的洗涤条件可例如为2x SSC,0.1%SDS,50℃。
可以用转化或同源重组技术,通过增加yhfK基因的拷贝数、修饰yhfK基因的表达调控序列、扩增编码增强yhfK基因表达的调控因子的基因、或者破坏或削弱编码降低yhfK基因表达的调控因子的基因来增强yhfK基因的表达。
例如,可以将包含yhfK基因的基因片段连接到能够在宿主微生物中复制的载体,优选多拷贝载体,并将所得的载体导入宿主微生物来制备重组DNA。
例如,可以用基于SEQ ID NO:3的核苷酸序列的引物,例如具有SEQ IDNO:7或8的序列的引物,以大肠杆菌的染色体DNA为模板,通过PCR(聚合酶链式反应,参见White,T.J.等,Trends Genet.,5,185(1989))获得大肠杆菌的yhfK基因。例如,可以用基于SEQ ID NO:1的核苷酸序列的引物,如具有SEQ ID NO:5或6的序列的引物,以菠萝泛菌的染色体DNA为模板,通过PCR获得菠萝泛菌的yhfK基因。也可以使用来自其他微生物的yhfK基因,并且所述yhfK基因可以用基于其yhfK基因或其同源序列或来自不同微生物物种的YhfK蛋白的序列的寡核苷酸引物,通过PCR从其染色体DNA或染色体DNA文库获得,或者用基于这些序列信息制备的寡核苷酸探针通过杂交获得。例如,可以用Saito和Miura(参见H.Saito和K.Miura,Biochem.Biophys.Acta,72,619(1963),Text for Bioengineering Experiments,Edited bythe Society for Bioscience and Bioengineering,Japan,pp.97-98,Baifukan,1992)的方法从微生物制备染色体DNA作为DNA供体。
然后,通过将yhfK基因与可在宿主微生物中复制的载体DNA连接来制备重组DNA。优选使用可在宿主微生物中自主复制的载体。
可在大肠杆菌中自主复制的载体的例子包括pUC19,pUC18,pHSG299,pHSG399,pHSG398,pACYC184,(pHSG和pACYC可由Takara Bio获得),RSF1010,pBR322,pMW219(pMW可由Nippon Gene获得),pTrc99A(Amann等,Gene 69:301-315(1988)等等。
可在棒状杆菌中自主复制的载体的例子包括pAM330(JP58-67699A),pHM1519(JP58-77895A),pVK7(US2003-0175912),和pSFK6(JP2000-262288A)。另外,也可以使用在大肠杆菌和棒状杆菌中都能自主复制的穿梭载体(shuttle vector)。
可在嗜甲基菌属细菌中自主复制的载体的例子包括RSF1010及其衍生物如pAYC32(Chistorerdov,A.Y.,Tsygankov,Y.D.,Plasmid,16,pp.161-167(1986)),pMFY42(Gene,44,p.53(1990)),pRK301,和pTB70(Nature,287,396(1980))。
为了将yhfK基因与上述任一载体连接而制备重组DNA,用限制性酶消化所述载体和含有yhfK基因的片段,并通常使用连接酶如T4DNA连接酶将其互相连接。
为了将上述制备的重组DNA导入微生物,可以使用任何已知的转化方法。这些方法包括上述用氯化钙处理受体细胞以增强DNA的渗透性,使用由生长中细胞制备的感受态细胞,将重组DNA导入原生质体-或原生质球-样受体细胞,以及电脉冲方法。
也可以通过将多拷贝的基因整合到微生物的染色体DNA中来增加yhfK基因的拷贝数。为了将多拷贝的yhfK基因整合到微生物的染色体DNA中,可以通过靶向以多个拷贝存在于染色体上的序列进行同源重组。可以使用转座子末端的重复DNA和反向重复序列。或者,如JP2-109985A所公开的,将yhfK基因并入转座子中,并允许其转移以使多拷贝的基因整合到染色体DNA中也是可能的。可以用具有部分yhfK基因序列的探针通过southern杂交确认yhfK基因整合入染色体中。
也可以如WO00/18935所述,通过用更强的表达调控序列取代染色体DNA上或质粒上的表达调控序列,包括yhfK基因的启动子,来增强yhfK基因的表达。例如,1ac启动子,trp启动子,trc启动子,pL启动子等是已知的强启动子。而且,将几个核苷酸取代导入yhfK基因的启动子区域使启动子更强也是可能的。Goldstein等(Prokaryotic promoters in biotechnology.Biotechnol.Annu.Rev.,1995,1,105-128)公开了评估启动子强度的方法和强启动子的例子。此外,已知核糖体结合位点(RBS)和翻译起始密码子之间的间隔区序列,尤其是紧邻起始密码子上游的几个核苷酸,对翻译效率有很大的影响。因此,可以修饰此序列。可以使用用于鉴定启动子的载体或基因分析软件如GENETYX来鉴定yhfK基因的表达调控序列。也可以通过延长mRNA寿命来增强表达。此外,通过阻止酶蛋白的降解也使酶活性增强。
yhfK基因的表达通过启动子的这种取代或修饰而得到增强。例如,也可以用温度敏感性质粒实现表达调控序列的取代。用于棒状杆菌的温度敏感性质粒的例子包括p48K和pSFKT2(JP2000-262288A),pHSC4(参见法国专利Laid-open Publication No.2667875,1992和JP5-7491A)等等。这些质粒在棒状杆菌中可在至少25℃的温度自主复制,但不能在37℃的温度自主复制。修饰表达调控序列可以与增加yhfK基因拷贝数组合。
为了增强由yhfK基因编码的蛋白的活性,可以将提高L-氨基酸输出能力的突变导入yhfK基因。增强由yhfK基因编码的蛋白(Yhfk蛋白)的活性的的突变的例子包括增加yhfK基因转录的启动子序列突变和增加YhfK蛋白比活性的yhfK基因编码区突变。
本发明的微生物优选为这样的微生物,其L-谷氨酸输出能力由于修饰导致yhfK基因表达增强而得以增强。此处所用短语“L-谷氨酸输出能力增强”指当培养经修饰而增强了yhfK基因表达的微生物时,由微生物输出到培养基中的L-谷氨酸的量大于由未经修饰的菌株如亲本株或对应野生型菌株所输出的L-谷氨酸的量。L-谷氨酸输出能力的增加通过测定培养基中L-谷氨酸的浓度的增加来观察。此外,L-谷氨酸输出能力的增强也可以通过测定向微生物中导入yhfK基因时胞内L-谷氨酸浓度的降低来观测。与由未经修饰的菌株输出的L-谷氨酸的量相比,从本发明的微生物所输出的L-谷氨酸的量优选增加10%或更多,更优选20%或更多,特别优选30%或更多。微生物的绝对“L-谷氨酸输出能力”可以通过测定L-谷氨酸的胞内和胞外浓度之间的差异来确定。此外,“L-谷氨酸输出能力”也可以通过用翻转的膜囊(membrane vesicle)测定细胞的放射性标记L-谷氨酸吸收来间接测定(J.Biol.Chem,vol.277,No.51,pp.49841-49849,2002)。例如,翻转的膜囊可以由导入了yhfK基因的细胞制备。然后,将ATP或其他提供驱动能量的底物加至膜囊,并测定细胞对放射性标记L-谷氨酸的吸收。或者,“L-谷氨酸输出能力”可以通过测定活跃细胞中非标记的谷氨酸与标记的谷氨酸之间交换反应的速率来检测。
本发明的微生物可以是这样的微生物,其在酸性条件下培养时,具有导致L-谷氨酸以超过L-谷氨酸的饱和浓度的浓度在液体培养基中积累的能力(该能力下文也称为“酸性条件下积累L-谷氨酸的能力”)。这样的微生物可以是通过增强yhfK基因的表达,已经具备了酸性条件下积累L-谷氨酸的能力的微生物,或者是原本就具备在酸性条件下积累L-谷氨酸的能力的微生物。
原本具备酸性条件下积累L-谷氨酸的能力的微生物的例子包括菠萝泛菌AJ13355菌株(FERM BP-6614),AJ13356菌株(FERM BP-6615),AJ13601菌株(FERM BP-7207)(欧洲专利公开1078989)等等。菠萝泛菌AJ13355菌株于1998年2月19日保藏在National Institute of Bioscience andHuman-Technology,Agency of Industrial Science and Technology,Ministry ofInternational Trade and Industry(现在为,National Institute of Bioscience andHuman-Technology,National Institute of Advanced Industrial Science andTechnology;1-3,Higashi 1-Chome,Tsukuba-shi,Ibaraki-ken,305-8566,日本),保藏号为FERM P-16644。此后,该保藏物于1999年1月11日依据布达佩斯条约的规定改为国际保藏,保藏号为FERM BP-6614。该菌株分离时被鉴定为成团肠杆菌,保藏为成团肠杆菌AJ13355菌株。然而,最近根据16SrRNA的核苷酸测序等重新将其分类为菠萝泛菌(参见随后的实施例)。尽管源于AJ13355菌株的AJ13356和AJ13601菌株也在前述保藏机构保藏为成团肠杆菌,但在此说明书中同样称其为菠萝泛菌。AJ13601菌株于1999年8月18日保藏在National Institute of B ioscience and Human-Technology,Agency of Industrial Science and Technology,Ministry of International Tradeand Industry,保藏号FERM P-17516。依据布达佩斯条约的规定,该保藏物于2000年7月6日改为国际保藏,保藏号为FERM BP-7207。
<2>产生本发明的L-谷氨酸的方法
可以通过在培养基中培养本发明的微生物以产生并在培养基中积累L-谷氨酸,以及从培养基中收集L-谷氨酸来产生L-谷氨酸。
含有碳源、氮源和无机盐、以及,如果需要的话,痕量有机营养物如氨基酸和维生素的常规培养基可以用作用于所述培养的培养基。合成的或天然的培养基均可使用。培养基中使用的碳源和氮源可以是任何类型的,只要能够被所培养的菌株利用。
糖类如葡萄糖、甘油、果糖、蔗糖、麦芽糖、甘露糖、半乳糖、淀粉水解产物以及糖蜜可以用作碳源。另外,有机酸如乙酸和柠檬酸、或醇类如甲醇和乙醇可以单独使用,或者与其他碳源组合使用,如果使用可利用这些碳源的微生物的话。氨、铵盐如硫酸铵、碳酸铵、氯化铵、磷酸铵和乙酸铵、硝酸盐等等可以用作氮源。氨基酸、维生素、脂肪酸、核酸、包含这些物质的营养物如蛋白胨、酪蛋白氨基酸、酵母提取物和大豆蛋白分解产物可以用作痕量有机营养物。当使用生长需要氨基酸等的营养缺陷型突变菌株时,优选添加所需营养物。磷酸盐、镁盐、钙盐、铁盐、锰盐等可以用作矿物盐。
培养在需氧条件下进行。培养期间,培养温度优选控制在20到45℃,pH优选控制在3至9。培养期间pH下降时,可以通过例如添加碳酸钙或碱如氨气来中和培养基。在上述条件下培养10至120小时后,培养液中积累了大量的L-谷氨酸。
另外,可以在导致L-谷氨酸沉淀(析出)(precipitate)的条件下进行培养。L-谷氨酸沉淀的条件包括酸性条件,例如pH5.0至4.0,优选pH4.5到4.0,更优选pH4.3至4.0,具体优选pH4.0的条件。
培养结束后,可以用已知的收集方法从培养液中收集L-谷氨酸。L-谷氨酸例如,可以通过浓缩去除了细胞的培养液并结晶L-谷氨酸而收集,或者通过用离子交换层析等方法分离L-谷氨酸来收集。当在L-谷氨酸沉淀的条件下进行培养时,可以通过离心、过滤等方法收集培养基中的L-谷氨酸沉淀。在这种情况下,进一步结晶溶解于培养基中的L-谷氨酸,然后收集L-谷氨酸也是可能的。
实施例
以下将参考非限制性实施例更详细地解释本发明。
实施例1
<筛选L-谷氨酸输出基因>
L-谷氨酸输出基因的筛选按照以下方法进行。由于L-谷氨酸通过谷氨酸脱氢酶一步转化为三羧酸循环的中间产物2-酮戊二酸,因而预期在酸性条件下流入细胞的L-谷氨酸可容易地在许多有谷氨酸脱氢酶和三羧酸循环的微生物中代谢。或者其中2-酮戊二酸脱氢酶被破坏的菌株在酸性条件下显示出对L-谷氨酸的敏感性。在此实施例中,试图通过使用菠萝泛菌SC17sucA菌株(JP2001-333769A)作为2-酮戊二酸脱氢酶缺陷株,基于在酸性条件下L-谷氨酸抗性,来获得L-谷氨酸输出基因。
以常规方法由菠萝泛菌AJ13355菌株提取染色体DNA,用限制性酶Sau3AI进行部分消化。然后,通过收集并向pSTV28(Takara Bio)的BamHI位点导入约10kb长的片段来制备质粒文库。以常规方式通过电穿孔将该质粒文库导入SC17sucA菌株。SC17sucA菌株具有专用编号AJ417,于2004年2月26日保藏在National Institute of Bioscience and Human-Technology,Agency of Industrial Science and Technology,Ministry of Economy,Trade andIndustry(1-1-3,Higashi,Tsukuba-shi,Ibaraki-ken,305-8566),保藏号为FERMBP-08646,由SC17sucA菌株可以获得SC17sucA/RSFCPG+pSTVCB菌株。
基于氯霉素抗性,在与基本培养基的成分(每1L纯净水0.5g葡萄糖,2mM硫酸镁,3g磷酸二氢钾,0.5g氯化钠,1g氯化铵和6g磷酸氢二钠)混合的L培养基(培养基每1L纯净水含10g Bacto蛋白胨,5g酵母提取物,5g NaCl和15g琼脂,pH7.0)平板上选择包含上述质粒文库的SC17sucA菌株,获得4.33×105个转化体菌落。这4.33×105个转化体在pH调节为4.5的基本培养基上划平板。这些转化体含高浓度的谷氨酸,而SC17sucA菌株在这种条件下不能形成菌落。具体地,转化体在培养基上划平板,该培养基中包含基本培养基的每种成分,30g/L的L-谷氨酸,盐酸L-赖氨酸(L-lysine hydrochloride)、DL-甲硫氨酸和ε-二氨基庚二酸各100mg/L,葡萄糖和蔗糖作为碳源,并调至pH4.5。
转化体于34℃培养3天,分析每个插入到载体而导入菌落中所含细胞的基因。从每个文库中提取质粒,用限制性酶处理以确认插入基因的大小。结果,由以蔗糖作为碳源的基本培养基获得的16个克隆中,有15个克隆显示出相同的限制性酶处理模式。还从以葡萄糖为碳源的基本培养基上出现的11个克隆中获得了显示相同限制性酶处理的模式的质粒。所述质粒命名为质粒文库Lib 10。
然后,将对照SC17sucA菌株和含质粒文库Lib 10的SC17sucALib 10菌株分别培养于液体培养基中,该液体培养基通过向基本培养基(所述培养基在1L纯净水中含0.5g的葡萄糖或蔗糖,2mM硫酸镁,3g磷酸二氢钾,0.5g氯化钠,1g氯化铵和6g磷酸氢二钠)中加入30g/L的L-谷氨酸,赖氨酸、甲硫氨酸和二氨基庚二酸各100mg/L,调到pH4.5而制备。酸性条件下,在含有高浓度L-谷氨酸的基本培养基上检测菌株的生长。
结果如图1所示。在存在高浓度L-谷氨酸的酸性条件下,发现与SC17sucA相比,含质粒文库Lib 10的SC17sucALib 10菌株的生长显著改善。相应地,测得Lib 10含有在酸性条件下赋予L-谷氨酸抗性的基因,因此,决定测定Lib 10所含基因的核苷酸序列并评估由该基因编码的蛋白质的功能。
以常规方法测定核苷酸序列,与GenBank中登记的基因比较同源性。结果发现该区域含有与大肠杆菌MG1655的yhfK(AE 000411.1:9304...11394)的一部分有同源性的基因。但yhfK的功能是未知的。
实施例2

因为基于蛋白质基序研究,提示yhfK可能编码转运蛋白(J.Mol.Microbiol.Biotechnol.,2(2):195-198,2000),因此决定检测前述基因中yhfK基因扩增的影响。
用寡核苷酸yhfK-F1和yhfK-R2通过PCR扩增yhfK基因片段,yhfK-F1和yhfK-R2分别具有SEQ ID NOS:5和6所示的核苷酸序列,源于菠萝泛菌No.359(AJ13355)野生型菌株的染色体DNA。通过将所得片段连接到TA-克隆载体pGEM-Teasy(Promega)制备pGEM-yhfK。用EcoRI消化pGEM-yhfK并连接到EcoRI消化的pSTV28(Takara Bio)以构建用于yhfK基因扩增的载体pSTV-yhfK。质粒构建方案如图2所示。
用于yhfK基因扩增的载体pSTV-yhfK和对照质粒pSTV28分别通过电穿孔导入SC17sucA菌株,并选择显示氯霉素抗性的转化体。分离所得质粒并确认存在pSTV-yhfK。yhfK-扩增的菌株命名为SC 17sucA/pSTV-yhfK,作为对照的导入pSTV的菌株命名为SC17sucA/pSTV28。
SC17sucA和SC17sucA/pSTV-yhfK在培养基上划平板,该培养基通过向基本培养基(该基本培养基在1L纯净水中含0.5g的葡萄糖或蔗糖,2mM硫酸镁,3g磷酸二氢钾,0.5g氯化钠,1g氯化铵和6g磷酸氢二钠)中加入30g/L的L-谷氨酸,赖氨酸、甲硫氨酸和二氨基庚二酸各100mg/L,用氨水调到pH 4.5而制得,分析这些菌株的生长。SC17sucA不能形成菌落,而SC17sucA/pSTV-yhfK在含有高浓度L-谷氨酸的基本培养基上形成菌落。
然后,将这些菌株培养于液体培养基中,该液体培养基通过向基本培养基(所述培养基在1L纯净水中含0.5g的葡萄糖或蔗糖,2mM硫酸镁,3g磷酸二氢钾,0.5g氯化钠,1g氯化铵和6g磷酸氢二钠)中加入30g/L的L-谷氨酸,盐酸L-赖氨酸、DL-蛋氨酸和ε-二氨基庚二酸各100mg/L,用氨水调到pH 4.5而制得。然后,检测菌株在酸性条件下,在含有高浓度L-谷氨酸的基本培养基上的生长。结果如图3所示。
与对照菌株SC17sucA/pSTV28相比,如同导入了Lib10的情况,SC17sucA/pSTV-yhfK菌株的生长得到改善,因此提示在酸性条件下,与SC17sucA菌株相比,yhfK基因赋予所述表型L-谷氨酸抗性。
实施例3
<中性pH下yhfK基因扩增对L-谷氨酸产生的影响>
然后,为了检测此基因对L-谷氨酸产生的影响,将用于yhfK扩增的质粒pSTV-yhfK导入L-谷氨酸产生细菌SC17sucA/RSFCPG,该细菌包含RSFCPG,其为用于L-谷氨酸产生的质粒,具有SEQ ID NO:9(欧洲专利公开1078989)所示的核苷酸序列。
通过电穿孔分别将质粒pSTV-yhfK和对照质粒pSTV29(Takara Bio)导入SC17sucA/RSFCPG,基于氯霉素抗性选择转化体。确认存在所述质粒后,将含有用于yhfK扩增的质粒的菌株命名为SC17sucA/RSFCPG+pSTV-yhfK,将含pSTV29的对照菌株命名为SC17sucA/RSFCPG+pSTV29。
然后,通过培养SC17sucA/RSFCPG+pSTV-yhfK和对照SC17sucA/RSFCPG+pSTV29检测L-谷氨酸产生能力。培养基的组成如下:
[培养基组成]
蔗糖              50g/L
MgSO4·7H2O       0.4g/L
KH2PO4            2.0g/L
酵母提取物        4.0g/L
FeSO4·7H2O              0.01g/L
MnSO4·5H2O              0.01g/L
盐酸L-赖氨酸             0.4g/L
DL-甲硫氨酸              0.4g/L
ε-二氨基庚二酸          0.4g/L
盐酸四环素               25mg/L
氯霉素                   25mg/L
将SC17sucA/RSFCPG+pSTV29和SC17sucA/RSFCPG+pSTV-yhfK在与基本培养基(该培养基在1L纯净水中含0.5g蔗糖,2mM硫酸镁,3g磷酸二氢钾,0.5g氯化钠,1g氯化铵和6g磷酸氢二钠)的组分,25mg/L氯霉素和12.5mg/L四环素混合的L培养基(该培养基在1L纯净水中含10g of Bacto蛋白胨,5g酵母提取物,5g NaCl和15g琼脂,pH7.0)上预培养,将由一个完整平板收集的细胞接种于发酵罐中,于34℃ pH6.0、在受控搅拌下以1/1vvm通气使氧浓度为5%或更高的条件下进行培养。
结果如表1所示。发现与SC17sucA/RSFCPG+pSTV29相比,yhfK扩增的菌株SC17sucA/RSFCPG+pSTV-yhfK所导致的L-谷氨酸积累增加约3g/L,即以每单位糖的得率(yield per sugar)计为约5%。
表1
中性条件下yhfK基因扩增的影响
  OD 620nm   (x1/101)   L-谷氨酸(g/L)   SC17sucA/RSFCPG+pSTV29   0.381   22.6   SC17sucA/RSFCPG+pSTV-yhfK   0.351   25.4
实施例4
<酸性条件下大肠杆菌yhfK基因扩增的影响和L-谷氨酸的产生>
然后,将大肠杆菌yhfK基因导入菠萝泛菌SC17sucA/RSFCPG菌株,检测基因导入的影响。
用具有SEQ ID NO:7和8所示核苷酸序列的寡核苷酸并用大肠杆菌W3110菌株(ATCC 27325)的染色体DNA作为模板进行PCR,所述寡核苷酸基于GeneBank中登记为NC_000913的大肠杆菌yhfK的序列(SEQ ID NO:3)而设计,获得含yhfK基因的约2.4kb片段。用EcoRI和PstI处理该片段,并将其连接到用相同限制性酶消化的pSTV29(Takara Shuzo)。所获得的用于扩增大肠杆菌yhfK的质粒命名为质粒pSTV-EcoyhfK。图2表示构建方案。
通过电穿孔将所得质粒pSTV-EcoyhfK导入前述SC 17sucA/RSFCPG菌株,基于氯霉素抗性选择转化体。所得大肠杆菌yhfK基因扩增的菌株命名为SC17sucA/RSFCPG+pSTV-EcoyhfK。
然后,用该菌株产生L-谷氨酸。也就是培养SC17sucA/RSFCPG+pSTV-yhfK,SC 17sucA/RSFCPG+pSTV-EcoyhfK和对照SC17sucA/RSFCPG+pSTV29菌株,检测其L-谷氨酸产生能力。培养在两个阶段进行,即种子培养(seed culture)以形成细胞和主培养(main culture)以产生L-谷氨酸。
种子培养用具有下述成分的培养基进行。
[种子培养基的组成]
蔗糖             50g/L
MgSO4·7H2O      0.4g/L
GD113            0.1mL/L
(NH4)2SO4        4g/L
KH2PO4           2.0g/L
酵母提取物       4.0g/L
FeSO4·7H2O      0.01g/L
MnSO4·5H2O      0.01g/L
盐酸L-赖氨酸     0.4g/L
DL-甲硫氨酸      0.4g/L
ε-二氨基庚二酸  0.4g/L
盐酸四环素       12.5mg/L
氯霉素           25mg/L
将SC17sucA/RSFCPG+pSTV29菌株,SC17sucA/RSFCPG+pSTV-yhfK菌株和SC17sucA/RSFCPG+pSTV-EcoyhfK菌株在与基本培养基(该培养基在1L纯净水中含0.5g葡萄糖,2mM硫酸镁,3g磷酸二氢钾,0.5g氯化钠,1g氯化铵和6g磷酸氢二钠)的组分,25mg/L氯霉素和12.5mg/L四环素混合的L培养基(该培养基在1L纯净水中含10g Bacto蛋白胨,5g酵母提取物,5g NaCl和15g琼脂,pH7.0)上预培养,将来自一个完整平板的细胞接种于种子培养发酵罐中,并在受控搅拌、1/1vvm通气使氧浓度为5%或更高的条件下,在34℃,pH6.0培养14小时。培养期间通过加入氨气将pH控制在6.0。种子培养连续进行到培养基中的糖被耗尽为止。然后,在具有下述组分的培养基中进行主培养。
[主培养基的组成(加入20%的种子培养基后的浓度)]
蔗糖                      50g/L
(NH4)2SO4                 5.0g/L
MgSO4·7H2O               0.4g/L
GD113                     0.1mL/L
酵母提取物                6.0g/L
KH2PO4                    6.0g/L
NaCl                      1.5g/L
FeSO4·7H2O               0.02g/L
MnSO4·5H2O               0.02g/L
盐酸L-赖氨酸              0.8g/L
DL-蛋氨酸                 0.6g/L
DL-α,ε-二氨基庚二酸    0.6g/L
盐酸四环素                12.5mg/L
氯霉素                    25mg/L
二水氯化钙                0.75g/L
泛酸钙                    12mg/L(仅在添加泛酸进行培养时添加)
将所获得的60mL体积中的细胞加到含有240mL培养基的1-L容积的小型发酵罐(mini jar)中于pH4.7下培养。主培养基中所含的50g/L的蔗糖耗尽后,用泵补加700g/L(w/v)的蔗糖溶液(经高压灭菌的),以将小型发酵罐中的糖浓度控制在5至20g/L。
结果如表2所示。将所有菌株培养相同时间后终止主培养。对于其中埃希氏菌属细菌的yhfK基因被扩增的SC17sucA/RSFCPG+pSTV-EcoyhfK菌株和其中菠萝泛菌的yhfK基因被扩增的SC17sucA/RSFCPG+pSTV-yhfK菌株来说,与用SC17sucA/RSFCPG+pSTV29对照菌株所得到的情况相比,L-谷氨酸的产量都显著增加,且糖消耗率都更高。由此,除了对L-谷氨酸产量的提高效应外,还发现yhfK基因的扩增在L-谷氨酸产生的培养中发挥生长改善效应。
表2
酸性条件下菠萝泛菌衍生的yhfK扩增菌株和大肠杆菌衍生的yhfK扩增菌株的结果(主培养)
  SC17sucA/   RSFCPG+   pSTV29   SC17sucA/   RSFCPG+   pSTV-yhfK   SC17sucA/   RSFCPG+   pSTV-EcoyhfK   所产生的L-谷氨酸的积累   (g/L)   46.0   100.0   76.0   培养时间   29.5   29.5   29.5
实施例5

测定了yhfK基因扩增的菌株的细胞中的L-谷氨酸浓度。参考A.Ishizaki等,Biotech.Teqniq.,vol.9,No.6,p.409,1995中所公开的方法测定L-谷氨酸的胞内浓度。将体积为1mL的培养基加入含500μL硅油(silicone oil)的1.5-mL管中,立刻在离心机中以15,000rpm离心3分钟。然后切下试管的底部,收集细胞。将细胞置于含200μL 5N高氯酸的2-mL管中,测定前存储于-80℃。室温下解冻含有细胞的高氯酸溶液,悬浮,并添加200μL 2.5M的碳酸钾中和。离心去除沉淀,然后测定上清液中的L-谷氨酸浓度,作为胞内L-谷氨酸浓度。
结果如图4所示。水平轴表示胞外L-谷氨酸浓度,垂直轴表示胞内L-谷氨酸浓度。显示在对照SC17sucA/RSFCPG+pSTV29菌株中,胞内L-谷氨酸浓度高于胞外L-谷氨酸浓度,而在SC17sucA/RSFCPG+pSTV-EcoyhfK和SC17sucA/RSFCPG+pSTV-yhfK中,胞内L-谷氨酸浓度低于胞外L-谷氨酸浓度。这些结果表明yhfK基因扩增的菌株如SC17sucA/RSFCPG+pSTV-EcoyhfK和SC17sucA/RSFCPG+pSTV-yhfK更可能将胞内L-谷氨酸输出到细胞外。因此,yhfK基因是编码L-谷氨酸输出蛋白的基因,该蛋白可以将胞内L-谷氨酸输出到细胞外。
实施例6
<其中yhfK基因被扩增的大肠杆菌的L-谷氨酸产生能力的评估>
然后,将源于菠萝泛菌的yhfK基因导入大肠杆菌,检测基因扩增的影响。
通过电穿孔将前述用于扩增源于菠萝泛菌的yhfK基因的载体pSTV-yhfK和对照质粒pSTV29分别导入大肠杆菌野生型菌株W3110,选择显示氯霉素抗性的转化体。将yhfK扩增菌株命名为W3110/pSTV-yhfK,作为对照的导pSTV29的菌株命名为W3110/pSTV29。
然后培养W3110/pSTV-yhfK菌株和对照W3110/pSTV29菌株,检测其L-谷氨酸产生能力。分别将W3110/pSTV-yhfK和对照W3110/pSTV29菌株在与氯霉素混合的L培养基(培养基在1L纯净水中含10g的Bacto蛋白胨,5g酵母提取物,5g NaCl和15g琼脂,pH7.0)上预培养,用由Nunc提供的1μL体积环将一环细胞接种到具有下述组成的培养基中,并在pH7.0和34℃摇动培养16小时。
[培养基的组成]
葡萄糖                40g/L
MgSO4·7H2O           1.0g/L
(NH4)2SO4             20g/L
KH2PO4                1.0g/L
酵母提取物            1.0g/L
FeSO4·7H2O           0.01g/L
MnSO4·5H2O           0.01g/L
氯霉素                25mg/L
碳酸钙                30g/L
(调至pH7.0)
表3
将用于扩增源于菠萝泛菌的yhfK基因的载体导入埃希氏菌属细菌的影响

与对照W3110/pSTV29菌株相比,具有扩增的菠萝泛菌yhfK基因的大肠杆菌W3110/pSTV-yhfK菌株中L-谷氨酸产率显著增加。
实施例7
<用yhfK基因扩增的棒状杆菌属细菌菌株ATCC13869或ATCC13869衍生物的L-谷氨酸产生>
可以从肠杆菌科细菌如大肠杆菌或菠萝泛菌的染色体DNA克隆yhfK基因。可以基于SEQ ID NO:1或3中描述的核苷酸序列,用SEQ ID NO:5和NO:6或SEQ ID NO:7和NO:8所示的引物来扩增yhfK基因。用限制性内切酶处理所得的含yhfK基因的PCR片段,将处理过的DNA插入到大肠杆菌-棒状杆菌穿梭载体pVK7,该载体是pCG1(US专利No.4,617,267)的衍生物。这样就获得了质粒pVK7yhfK。可以用常用方法转化含pVK7yhfK质粒的棒状杆菌L-谷氨酸产生菌株,以获得含扩增的yhfK基因的菌株。例如,用于增强柠檬酸合成酶、磷酸烯醇丙酮酸羧化酶和谷氨酸脱氢酶的活性或降低α-酮戊二酸脱氢酶活性的经修饰的菌株诸如谷氨酸棒状杆菌ATCC13869可以用作具有扩增的yhfK基因的棒状杆菌属L-谷氨酸产生菌。
可以在CMDX平板(5g/L的葡萄糖,10g/L蛋白胨,10g/L酵母提取物,1g/L KH2PO4,0.4g/L MgSO4·7H2O,10mg/L FeSO4·7H2O,10mg/L的MnSO4·4至5H2O,3g/L尿素,2g/L(根据N量)的mameno,20g/L的琼脂,pH7.5)上培养yhfK-扩增菌株18-24小时,可将每个平板上1/6的细胞接种至摇瓶中20mL的培养基(30g/L的葡萄糖,15g/L的(NH4)2SO4,0.4g/L的MgSO4·7H2O,1mg/L FeSO4·7H2O,1mg/L MnSO4·4至5H2O,200μg/L的维生素B1,200μg/L生物素,0.48g/L(根据N量)的mameno,1g/瓶的CaCO3,pH8.0)中,在31.5℃摇动培养20-40小时。然后,可以用BiotechAnalyzer(Sakura Seiki)测定培养基中葡萄糖和L-谷氨酸的浓度。由此获得其中yhfK基因被扩增且具有增强的L-谷氨酸产生能力的菌株。
工业实用性
使用本发明的微生物可以有效地产生L-谷氨酸。L-谷氨酸可以用作调味品等的原料。
序列表
<110>味之素株式会社(Ajinomoto.Co.,Inc.)
<120>生产L-谷氨酸的微生物和生产L-谷氨酸的方法
<130>C434-C4329
<150>JP 2004-60542
<151>2004-03-04
<160>12
<170>PatentIn version 3.1
<210>1
<211>3967
<212>DNA
<213>菠萝泛菌
<220>
<221>CDS
<222>(1530)..(3620)
<223>
<400>1
gatcgtttat ttccaatatc aacacgctgg ttgtacctgg cgggaaaatg gggctggcga    60
tggaattaat tatggcaccg ctggtaaaac ggctcatgga aggcaaacgc attgaataaa    120
atcagaggcc gcgctggcct ctgaataatt acagctcgat aacttcgtaa ctgtgggtaa    180
tttccacccc tttgcctaac ataatggcaa ccgagcaata cttctcagct gaaaggtcga    240
ccgcacgcgc cacggcttta tctgaaagtg cttttccact gacgataaaa tgcaggttga    300
tgcgggtaaa gatgcgaggc gcttcttccc ggcgttctga ttcgagtttt acttcgcaat    360
cagccacatc gttgcgacct ttttgcaaaa ttgataccac atcaatggcg ctgcatccgc    420
cggccgccat cagcaccatt tccatagggc tgggcgcttt atcgccggaa ttgccgtcca    480
ttaagacctg atgtccggac gaagactcgc cgaggaatgt taacccttca acccatttga    540
ctcttgcctg cataatctgg cccccagaat gccctgtttt tgcgtcagag tacgcttttg    600
cctggtaaac agcaatccgg agaaatcagc cttattgctg aagcgagaca acacaagaca    660
gtcggcgaaa gctgtgctac aaacagtgct gaaaatattt ttcgtcatcc gaagacgaag    720
ccgggaagaa tgatgcgctc tgcgcaaatg cagcccgaat aatttcctga atggaaacac    780
gcttaacgct ttcatcgcct ggcagggaaa ctgagccctg tattttgggc acgattacaa    840
tagaggataa tagcgaatgg ttctcggcaa accgcaaaca gaccctacac ttgaatggtt    900
cctgtcccat tgccatattc acaagtatcc atccaaaagt acgctgattc accaaggtga    960
aaaagccgaa acgctttact acatcgtgaa aggttccgtc gcggtactga ttaaggatga    1020
agaaggcaaa gagatgattc tttcttatct gaatcaaggc gattttattg gtgagcttgg    1080
cctgtttgaa gaaggtcagg agcgcagcgc ctgggtacgt gcgaaaactg cgtgcgaagt    1140
ggcagagatt tcctacaaga aattccgtca gctcattcag gttaacccgg atattttgat    1200
gcgcctttct tctcagatgg ctcgccgtct gcaggtgacg tcagaaaaag tggggaatct    1260
cgctttcctg gatgtgaccg gacgcattgc acaaacgttg cttaatctgg ctaaacagcc    1320
agatgccatg acgcatcctg acggcatgca aattaaaatt actcgtcagg aaattggcca    1380
aatcgttggt tgttcacgtg aaaccgtggg ccgtatcttg aagatgctgg aagatcagaa    1440
cctgatctcc gcacacggca aaaccatcgt tgtttacggc acacgctaag cctgactgtt    1500
cacggcgtga tggcgacatt atgccgtga atg tct tgt gtt gag ccg atg tgg      1553
                                Met Ser Cys Val Glu Pro Met Trp
                                1               5
cga aga ata atc tat cae ccc gaa gtt aac tat gcg ctg cgc cag acg      1601
Arg Arg Ile Ile Tyr His Pro Glu Val Asn Tyr Ala Leu Arg Gln Thr
    10                  15                  20
ctg gtg ttg tgc ctt ccc gta gcg ctc ggc tgg ctg ttc ggc gat ctg    1649
Leu Val Leu Cys Leu Pro Val Ala Leu Gly Trp Leu Phe Gly Asp Leu
25                  30                  35                  40
caa aaa gga ttg ctg ttc tca ttg gtt ccc gcc tgc tgc aac att gcc    1697
Gln Lys Gly Leu Leu Phe Ser Leu Val Pro Ala Cys Cys Asn Ile Ala
                45                  50                  55
ggt ctg gac acg ccc cac aaa cgc ttc ttt aaa cgc ctg atc atc ggc    1745
Gly Leu Asp Thr Pro His Lys Arg Phe Phe Lys Arg Leu Ile Ile Gly
            60                  65                  70
ggc agc ctg ttt gcc ctt ggc agt tta ctg atg cag tgg ctg ctg ctt    1793
Gly Ser Leu Phe Ala Leu Gly Ser Leu Leu Met Gln Trp Leu Leu Leu
        75                  80                  85
aaa gac gtg ccg ctg ccg ctc atc ctg ttt gcc ctg cct ttg ctg ctt    1841
Lys Asp Val Pro Leu Pro Leu Ile Leu Phe Ala Leu Pro Leu Leu Leu
    90                  95                  100
ggc gtc acc gga gag atc agt ccg ctg cac gcc cga ctg ctg ccc ggc    1889
Gly Val Thr Gly Glu Ile Ser Pro Leu His Ala Arg Leu Leu Pro Gly
105                 110                 115                 120
acg tta atc gcg gca att ttt acc ctc agc ctg att ggc cgt atg ccc    1937
Thr Leu Ile Ala Ala Ile Phe Thr Leu Ser Leu Ile Gly Arg Met Pro
                125                 130                 135
att tac gtt ccg ccc ctg ctc tat atc ggt gga acg ctc tgg tat ggc    1985
Ile Tyr Val Pro Pro Leu Leu Tyr Ile Gly Gly Thr Leu Trp Tyr Gly
            140                 145                 150
ctg ttc aac tgg ttt tgg ttc tgg ctg tgg aaa gag cag ccg atg cgc    2033
Leu Phe Asn Trp Phe Trp Phe Trp Leu Trp Lys Glu Gln Pro Met Arg
        155                 160                 165
gaa agc ctg agc ctg atc tac cgt gag ctg gca aat tac tgt gac gcc    2081
Glu Ser Leu Ser Leu Ile Tyr Arg Glu Leu Ala Asn Tyr Cys Asp Ala
    170                 175                 180
aag tac agc tta ttg acg cag ctg acc gat ccg gaa aaa gcc ctg ccg    2129
Lys Tyr Ser Leu Leu Thr Gln Leu Thr Asp Pro Glu Lys Ala Leu Pro
185                 190                 195                 200
ccc ctg ctg gcg cgt cag caa aaa gcg atc gat ctg atc aac acc tgc    2177
Pro Leu Leu Ala Arg Gln Gln Lys Ala Ile Asp Leu Ile Asn Thr Cys
                205                 210                 215
tat cag caa atg cat atg ctg tct gcg agt cgc gat cac agc cac aaa    2225
Tyr Gln Gln Met His Met Leu Ser Ala Ser Arg Asp His Ser His Lys
            220                 225                 230
cgc ctg acc cgg gcg ttt cag gta gca ctg gat ctg cag gag cat atc    2273
Arg Leu Thr Arg Ala Phe Gln Val Ala Leu Asp Leu Gln Glu His Ile
        235                 240                 245
tcc gtc agc ctg cat cag ccg gaa gag gtc cag aag ctg gtc gag caa    2321
Ser Val Ser Leu His Gln Pro Glu Glu Val Gln Lys Leu Val Glu Gln
    250                 255                 260
agc cat gct gaa gcc gtc atc cgc tgg aac gcc aga acg att tca gcc    2369
Ser His Ala Glu Ala Val Ile Arg Trp Asn Ala Arg Thr Ile Ser Ala
265                 270                 275                 280
cgg ctg cgc gcg ctg gcc gac gat att ctg tat cac caa ctc tct ggt    2417
Arg Leu Arg Ala Leu Ala Asp Asp Ile Leu Tyr His Gln Leu Ser Gly
                285                 290                 295
cgt ttc gat atg gac aag cag ttg ggt gcg ctg gag aaa atc gcc ctt    2465
Arg Phe Asp Met Asp Lys Gln Leu Gly Ala Leu Glu Lys Ile Ala Leu
            300                 305                 310
cag cat ccg gac aat ccg gtg ggt aac ttc tgt ctc tat cat ttc agc    2513
Gln His Pro Asp Asn Pro Val Gly Asn Phe Cys Leu Tyr His Phe Ser
        315                 320                 325
cgt atc gcc cgg gtg ctt cga acc caa aag ccg ctt tat caa cgc gac    2561
Arg Ile Ala Arg Val Leu Arg Thr Gln Lys Pro Leu Tyr Gln Arg Asp
    330                 335                 340
ctg atg gcc gat cgc cag cgt cgt tta ccg ctg ctg ccc gcg ttg cgg    2609
Leu Met Ala Asp Arg Gln Arg Arg Leu Pro Leu Leu Pro Ala Leu Arg
345                 350                 355                 360
agc tat ctg tcg ctg cgg tct tcc gca ctg cga acg gcc ggg cgt ttt    2657
Ser Tyr Leu Ser Leu Arg Ser Ser Ala Leu Arg Thr Ala Gly Arg Phe
                365                 370                 375
tcc gtc atg ctg atg ctg ggc agc gcc ctg gcc gtg ttc ttt tcg att    2705
Ser Val Met Leu Met Leu Gly Ser Ala Leu Ala Val Phe Phe Ser Ile
            380                 385                 390
cct aag ccc tac tgg att ttg atg acc atc atg ttt gtc agc cag agc    2753
Pro Lys Pro Tyr Trp Ile Leu Met Thr Ile Met Phe Val Ser Gln Ser
        395                 400                 405
aac tac agc gca acc cgc gta cgt att cag cac cgg gcc ctg gga acc    2801
Asn Tyr Ser Ala Thr Arg Val Arg Ile Gln His Arg Ala Leu Gly Thr
    410                 415                 420
ttt gcc gga ctg gct atc gcg gcg gcg tcg cta cgc ctg gat gtg cct    2849
Phe Ala Gly Leu Ala Ile Ala Ala Ala Ser Leu Arg Leu Asp Val Pro
425                 430                 435                 440
gaa ccg ctg gtg ctg agc atc atg ctg gtg att acc ttt atc agc tac    2897
Glu Pro Leu Val Leu Ser Ile Met Leu Val Ile Thr Phe Ile Ser Tyr
                445                 450                 455
cgt ttt acc cgc cag ttt tac ggc tgg tca ata gtg gga ttt acg gtg    2945
Arg Phe Thr Arg Gln Phe Tyr Gly Trp Ser Ile Val Gly Phe Thr Val
            460                 465                 470
acg gcc gtt tat acg ctg caa ctg ctc tcc ctt aac ggg gca cag ttt    2993
Thr Ala Val Tyr Thr Leu Gln Leu Leu Ser Leu Asn Gly Ala Gln Phe
        475                 480                 485
tta ctg ccc cgc ctg ctg gat acg ctg atg ggc tgc ctg atc gcc ttt    3041
Leu Leu Pro Arg Leu Leu Asp Thr Leu Met Gly Cys Leu Ile Ala Phe
    490                 495                 500
ggg ggc atg tta tgg ctg tgg ccg cag tgg caa agt gcc ctg ctg cgc    3089
Gly Gly Met Leu Trp Leu Trp Pro Gln Trp Gln Ser Ala Leu Leu Arg
505                 510                 515                 520
cag aat gcc cat gat gcg ctg gag gcc tgt cag aat gcc ctg cga atg    3137
Gln Asn Ala His Asp Ala Leu Glu Ala Cys Gln Asn Ala Leu Arg Met
                525                 530                 535
ttg ctg ggc cca gag cag tca ccc gat gcg ctg gct tac cag cgg gtt    3185
Leu Leu Gly Pro Glu Gln Ser Pro Asp Ala Leu Ala Tyr Gln Arg Val
            540                 545                 550
aag gtc aac cag gcg cat aac gcc gta ttc aac tcc ctg aat cag gcc    3233
Lys Val Asn Gln Ala His Asn Ala Val Phe Asn Ser Leu Asn Gln Ala
        555                 560                 565
atg cag gag ccg gga ttt aat tca cgc tac ctg cag gat atg cgc tta    3281
Met Gln Glu Pro Gly Phe Asn Ser Arg Tyr Leu Gln Asp Met Arg Leu
    570                 575                 580
tgg gtc acg cac tgc cag ttt atc gtg gag cac att aac gcc atg acc    3329
Trp Val Thr His Cys Gln Phe Ile Val Glu His Ile Asn Ala Met Thr
585                 590                 595                 600
att ctg gca cgt gaa cat acc atg ctg ccg ccc acg ctg gct gag cac    3377
Ile Leu Ala Arg Glu His Thr Met Leu Pro Pro Thr Leu Ala Glu His
                605                 610                 615
tac ctg caa tgg tgc gag atc gcc ctg caa cgg tgt cag caa agg ctg    3425
Tyr Leu Gln Trp Cys Glu Ile Ala Leu Gln Arg Cys Gln Gln Arg Leu
            620                 625                 630
gaa tat gat ggg gaa agt tcg cag acg gat ctg cta cag ggc gtg gaa    3473
Glu Tyr Asp Gly Glu Ser Ser Gln Thr Asp Leu Leu Gln Gly Val Glu
        635                 640                 645
gat ata aat gag ggg ccg gtc acg gta ctg gag cag cac gtc agg cgc    3521
Asp Ile Asn Glu Gly Pro Val Thr Val Leu Glu Gln His Val Arg Arg
    650                 655                 660
atc ctg gag cat ctg aaa gtc atg cac acg atc tct tct ctg gcc tgg    3569
Ile Leu Glu His Leu Lys Val Met His Thr Ile Ser Ser Leu Ala Trp
665                 670                 675                 680
aac cag cgg cct cat cat ggc cgc tgg ctg ttg cgc agt ctg cgc cgc    3617
Asn Gln Arg Pro His His Gly Arg Trp Leu Leu Arg Ser Leu Arg Arg
                685                 690                 695
aaa taactcaggc agacagcact ttctctaccg cacgggcaaa gcgagccatg         3670
Lys
ccctcttcga tatcggcagg ctcgataatc agcgacggtg cgaagcgcat cacatctgtt  3730
ccggccacca gcaccatgac gccttccgca gctgacgcat tcagaatatc gcgcgccttg  3790
cccgcatact gcggcttcag ggctgcacca atcagcaggc ctttaccacg gatatcactg  3850
aacaggtcgt gacgcgcatc aatagccttg agcgcctcaa caaactgctg gcggcggatt  3910
tctaccccat tcagtacagc tggcgtatta ataatatcta acgcggtttc tgcgatc     3967
<210>2
<211>697
<212>PRT
<213>菠萝泛菌
<400>2
Met Ser Cys Val Glu Pro Met Trp Arg Arg Ile Ile Tyr His Pro Glu
1               5                   10                  15
Val Asn Tyr Ala Leu Arg Gln Thr Leu Val Leu Cys Leu Pro Val Ala
            20                  25                  30
Leu Gly Trp Leu Phe Gly Asp Leu Gln Lys Gly Leu Leu Phe Ser Leu
         35                  40                  45
Val Pro Ala Cys Cys Asn Ile Ala Gly Leu Asp Thr Pro His Lys Arg
    50                  55                  60
Phe Phe Lys Arg Leu Ile Ile Gly Gly Ser Leu Phe Ala Leu Gly Ser
65                  70                  75                  80
Leu Leu Met Gln Trp Leu Leu Leu Lys Asp Val Pro Leu Pro Leu Ile
                85                  90                  95
Leu Phe Ala Leu Pro Leu Leu Leu Gly Val Thr Gly Glu Ile Ser Pro
            100                 105                 110
Leu His Ala Arg Leu Leu Pro Gly Thr Leu Ile Ala Ala Ile Phe Thr
        115                 120                 125
Leu Ser Leu Ile Gly Arg Met Pro Ile Tyr Val Pro Pro Leu Leu Tyr
    130                 135                 140
Ile Gly Gly Thr Leu Trp Tyr Gly Leu Phe Asn Trp Phe Trp Phe Trp
145                 150                 155                 160
Leu Trp Lys Glu Gln Pro Met Arg Glu Ser Leu Ser Leu Ile Tyr Arg
                165                 170                 175
Glu Leu Ala Asn Tyr Cys Asp Ala Lys Tyr Ser Leu Leu Thr Gln Leu
            180                 185                 190
Thr Asp Pro Glu Lys Ala Leu Pro Pro Leu Leu Ala Arg Gln Gln Lys
        195                 200                 205
Ala Ile Asp Leu Ile Asn Thr Cys Tyr Gln Gln Met His Met Leu Ser
    210                 215                 220
Ala Ser Arg Asp His Ser His Lys Arg Leu Thr Arg Ala Phe Gln Val
225                 230                 235                 240
Ala Leu Asp Leu Gln Glu His Ile Ser Val Ser Leu His Gln Pro Glu
                245                 250                 255
Glu Val Gln Lys Leu Val Glu Gln Ser His Ala Glu Ala Val Ile Arg
            260                 265                 270
Trp Asn Ala Arg Thr Ile Ser Ala Arg Leu Arg Ala Leu Ala Asp Asp
        275                 280                 285
Ile Leu Tyr His Gln Leu Ser Gly Arg Phe Asp Met Asp Lys Gln Leu
    290                 295                 300
Gly Ala Leu Glu Lys Ile Ala Leu Gln His Pro Asp Asn Pro Val Gly
305                 310                 315                 320
Asn Phe Cys Leu Tyr His Phe Ser Arg Ile Ala Arg Val Leu Arg Thr
                325                 330                 335
Gln Lys Pro Leu Tyr Gln Arg Asp Leu Met Ala Asp Arg Gln Arg Arg
            340                 345                 350
Leu Pro Leu Leu Pro Ala Leu Arg Ser Tyr Leu Ser Leu Arg Ser Ser
        355                 360                 365
Ala Leu Arg Thr Ala Gly Arg Phe Ser Val Met Leu Met Leu Gly Ser
    370                 375                 380
Ala Leu Ala Val Phe Phe Ser Ile Pro Lys Pro Tyr Trp Ile Leu Met
385                 390                 395                 400
Thr Ile Met Phe Val Ser Gln Ser Asn Tyr Ser Ala Thr Arg Val Arg
                405                 410                 415
Ile Gln His Arg Ala Leu Gly Thr Phe Ala Gly Leu Ala Ile Ala Ala
            420                 425                 430
Ala Ser Leu Arg Leu Asp Val Pro Glu Pro Leu Val Leu Ser Ile Met
        435                 440                 445
Leu Val Ile Thr Phe Ile Ser Tyr Arg Phe Thr Arg Gln Phe Tyr Gly
    450                 455                 460
Trp Ser Ile Val Gly Phe Thr Val Thr Ala Val Tyr Thr Leu Gln Leu
465                 470                 475                 480
Leu Ser Leu Asn Gly Ala Gln Phe Leu Leu Pro Arg Leu Leu Asp Thr
                485                 490                 495
Leu Met Gly Cys Leu Ile Ala Phe Gly Gly Met Leu Trp Leu Trp Pro
            500                 505                 510
Gln Trp Gln Ser Ala Leu Leu Arg Gln Asn Ala His Asp Ala Leu Glu
        515                 520                 525
Ala Cys Gln Asn Ala Leu Arg Met Leu Leu Gly Pro Glu Gln Ser Pro
    530                 535                 540
Asp Ala Leu Ala Tyr Gln Arg Val Lys Val Asn Gln Ala His Asn Ala
545                 550                 555                 560
Val Phe Asn Ser Leu Asn Gln Ala Met Gln Glu Pro Gly Phe Asn Ser
                565                 570                 575
Arg Tyr Leu Gln Asp Met Arg Leu Trp Val Thr His Cys Gln Phe Ile
            580                 585                 590
Val Glu His Ile Asn Ala Met Thr Ile Leu Ala Arg Glu His Thr Met
        595                 600                 605
Leu Pro Pro Thr Leu Ala Glu His Tyr Leu Gln Trp Cys Glu Ile Ala
    610                 615                 620
Leu Gln Arg Cys Gln Gln Arg Leu Glu Tyr Asp Gly Glu Ser Ser Gln
625                 630                 635                 640
Thr Asp Leu Leu Gln Gly Val Glu Asp Ile Asn Glu Gly Pro Val Thr
                645                 650                 655
Val Leu Glu Gln His Val Arg Arg Ile Leu Glu His Leu Lys Val Met
            660                 665                 670
His Thr Ile Ser Ser Leu Ala Trp Asn Gln Arg Pro His His Gly Arg
        675                 680                 685
Trp Leu Leu Arg Ser Leu Arg Arg Lys
    690                 695
<210>3
<211>2375
<212>DNA
<213>大肠杆菌
<220>
<221>CDS
<222>(201)..(2288)
<223>
<400>3
gacggtatgc aaatcaaaat tacccgtcag gaaattggtc agattgtcgg ctgttctcgt    60
gaaaccgtgg gacgcattct gaagatgctg gaagatcaga acctgatctc cgcacacggt    120
aaaaccatcg tcgtttacgg cactcgttaa tcccgtcgga gtggcgcgtt acctggtagc    180
gcgccatttt gtttcccccg atg tgg cgc aga ctg att tat cac ccc gat atc    233
                      Met Trp Arg Arg Leu Ile Tyr His Pro Asp Ile
                      1               5                   10
aac tat gca ctt cga caa acg ctg gtg cta tgt ttg ccc gtg gcc gtt      281
Asn Tyr Ala Leu Arg Gln Thr Leu Val Leu Cys Leu Pro Val Ala Val
                15                  20                  25
ggg tta atg ctt ggc gaa tta cga ttc ggt ctg ctc ttc tcc ctc gtt      329
Gly Leu Met Leu Gly Glu Leu Arg Phe Gly Leu Leu Phe Ser Leu Val
            30                  35                  40
cct gcc tgt tgc aat att gcg ggc ctt gat acg cct cat aaa cgt ttt      377
Pro Ala Cys Cys Asn Ile Ala Gly Leu Asp Thr Pro His Lys Arg Phe
        45                  50                  55
ttc aaa cgc tta atc att ggt gcg tcg ctg ttt gcc acc tgt agc ttg      425
Phe Lys Arg Leu Ile Ile Gly Ala Ser Leu Phe Ala Thr Cys Ser Leu
60                  65                  70                  75
ctg aca cag cta cta ctg gca aaa gat gtt ccc ctg ccc ttt ttg ctg      473
Leu Thr Gln Leu Leu Leu Ala Lys Asp Val Pro Leu Pro Phe Leu Leu
                80                  85                  90
acc gga tta acg ctg gta ctt ggc gtc act gct gag ctg ggg cca ttg      521
Thr Gly Leu Thr Leu Val Leu Gly Val Thr Ala Glu Leu Gly Pro Leu
            95                  100                 105
cac gca aaa ttg ctt cct gca tcg ctg ctc gcc gcc att ttt acc ctc      569
His Ala Lys Leu Leu Pro Ala Ser Leu Leu Ala Ala Ile Phe Thr Leu
        110                 115                 120
agt ttg gcg gga tac atg ccg gtc tgg gaa ccg ttg ctc atc tat gcg      617
Ser Leu Ala Gly Tyr Met Pro Val Trp Glu Pro Leu Leu Ile Tyr Ala
    125                 130                 135
ttg ggc act ctc tgg tac gga ttg ttt aac tgg ttt tgg ttc tgg atc      665
Leu Gly Thr Leu Trp Tyr Gly Leu Phe Asn Trp Phe Trp Phe Trp Ile
140                 145                 150                 155
tgg cgc gaa caa ccg ctg cgc gag tca cta agt ctg ctg tac cgt gaa      713
Trp Arg Glu Gln Pro Leu Arg Glu Ser Leu Ser Leu Leu Tyr Arg Glu
                160                 165                 170
ctg gca gat tat tgt gaa gcc aaa tac agc ctg ctt acc cag cac acc      761
Leu Ala Asp Tyr Cys Glu Ala Lys Tyr Ser Leu Leu Thr Gln His Thr
            175                 180                 185
gac cct gaa aaa gcg ctg ccg ccg ctg ctg gtg cgc cag caa aaa gcg    809
Asp Pro Glu Lys Ala Leu Pro Pro Leu Leu Val Arg Gln Gln Lys Ala
        190                 195                 200
gtc gat cta att acc cag tgc tat cag caa atg cat atg ctt tcc gcg    857
Val Asp Leu Ile Thr Gln Cys Tyr Gln Gln Met His Met Leu Ser Ala
    205                 210                 215
caa aat aat act gac tac aag cgg atg ctg cgt att ttc cag gag gcg    905
Gln Asn Asn Thr Asp Tyr Lys Arg Met Leu Arg Ile Phe Gln Glu Ala
220                 225                 230                 235
ctg gat tta cag gaa cat att tcg gtc agt ttg cat cag ccg gaa gag    953
Leu Asp Leu Gln Glu His Ile Ser Val Ser Leu His Gln Pro Glu Glu
                240                 245                 250
gtg caa aag ctg gtc gag cgt agc cat gcg gaa gaa gtt atc cgc tgg    1001
Val Gln Lys Leu Val Glu Arg Ser His Ala Glu Glu Val Ile Arg Trp
            255                 260                 265
aat gcg caa acc gtc gcc gct cgc ctg cgc gtg ctg gct gat gac att    1049
Asn Ala Gln Thr Val Ala Ala Arg Leu Arg Val Leu Ala Asp Asp Ile
        270                 275                 280
ctt tac cat cgc ctg cca acg cgt ttt acg atg gaa aag caa att ggc    1097
Leu Tyr His Arg Leu Pro Thr Arg Phe Thr Met Glu Lys Gln Ile Gly
    285                 290                 295
gca ctg gaa aaa atc gcc cgc cag cat ccg gat aat ccg gtt ggg caa    1145
Ala Leu Glu Lys Ile Ala Arg Gln His Pro Asp Asn Pro Val Gly Gln
300                 305                 310                 315
ttc tgc tac tgg cat ttc agc cgc atc gcc cgc gtg ctg cgc acc caa    1193
Phe Cys Tyr Trp His Phe Ser Arg Ile Ala Arg Val Leu Arg Thr Gln
                320                 325                 330
aaa ccg ctc tat gcc cgt gac tta ctg gcc gat aaa cag cgg cga atg    1241
Lys Pro Leu Tyr Ala Arg Asp Leu Leu Ala Asp Lys Gln Arg Arg Met
            335                 340                 345
cca tta ctt ccg gcg ctg aaa agt tat ctg tca cta aag tct ccg gcg    1289
Pro Leu Leu Pro Ala Leu Lys Ser Tyr Leu Ser Leu Lys Ser Pro Ala
        350                 355                 360
cta cgc aat gcc gga cga ctc agt gtg atg tta agc gtt gcc agc ctg    1337
Leu Arg Asn Ala Gly Arg Leu Ser Val Met Leu Ser Val Ala Ser Leu
    365                 370                 375
atg ggc acc gcg ctg cat ctg ccg aag tcg tac tgg atc ctg atg acg    1385
Met Gly Thr Ala Leu His Leu Pro Lys Ser Tyr Trp Ile Leu Met Thr
380                 385                 390                 395
gta ttg ctg gtg aca caa aat ggc tat ggc gca acc cgt ctg agg att    1433
Val Leu Leu Val Thr Gln Asn Gly Tyr Gly Ala Thr Arg Leu Arg Ile
                400                 405                 410
gtg aat cgc tcc gtg gga acc gtg gtc ggg tta atc att gcg ggc gtg    1481
Val Asn Arg Ser Val Gly Thr Val Val Gly Leu Ile Ile Ala Gly Val
            415                 420                 425
gcg ctg cac ttt aaa att ccc gaa ggt tac acc ctg acg ttg atg ctg    1529
Ala Leu His Phe Lys Ile Pro Glu Gly Tyr Thr Leu Thr Leu Met Leu
        430                 435                 440
att acc acc ctc gcc agc tac ctg ata ttg cgc aaa aac tac ggc tgg    1577
Ile Thr Thr Leu Ala Ser Tyr Leu Ile Leu Arg Lys Asn Tyr Gly Trp
    445                 450                 455
gcg acg gtc ggt ttt act att acc gca gtg tat acc ctg caa cta ttg    1625
Ala Thr Val Gly Phe Thr Ile Thr Ala Val Tyr Thr Leu Gln Leu Leu
460                 465                 470                 475
tgg ttg aac ggc gag caa tac atc ctt ccg cgt ctt atc gat acc att    1673
Trp Leu Asn Gly Glu Gln Tyr Ile Leu Pro Arg Leu Ile Asp Thr Ile
                480                 485                 490
att ggt tgt tta att gct ttc ggc ggt act gtc tgg ctg tgg ccg cag    1721
Ile Gly Cys Leu Ile Ala Phe Gly Gly Thr Val Trp Leu Trp Pro Gln
            495                 500                 505
tgg cag agc ggg tta ttg cgt aaa aac gcc cat gat gct tta gaa gcc    1769
Trp Gln Ser Gly Leu Leu Arg Lys Asn Ala His Asp Ala Leu Glu Ala
        510                 515                 520
tat cag gaa gcg att cgc ttg att ctt agc gag gat ccg caa cct acg    1817
Tyr Gln Glu Ala Ile Arg Leu Ile Leu Ser Glu Asp Pro Gln Pro Thr
    525                 530                 535
cca ctg gcc tgg cag cga atg cgg gta aat cag gca cat aac act ctg    1865
Pro Leu Ala Trp Gln Arg Met Arg Val Asn Gln Ala His Asn Thr Leu
540                 545                 550                 555
tat aac tca ttg aat cag gcg atg cag gaa ccg gcg ttt aac agc cat    1913
Tyr Asn Ser Leu Asn Gln Ala Met Gln Glu Pro Ala Phe Asn Ser His
                560                 565                 570
tat ctg gca gat atg aaa ctg tgg gta acg cac agc cag ttt att gtt    1961
Tyr Leu Ala Asp Met Lys Leu Trp Val Thr His Ser Gln Phe Ile Val
            575                 580                 585
gag cat att aat gcc atg acc acg ctg gcg cgg gaa cac cgg gca ttg    2009
Glu His Ile Asn Ala Met Thr Thr Leu Ala Arg Glu His Arg Ala Leu
        590                 595                 600
cca cct gaa ctg gca caa gag tat tta cag tct tgt gaa atc gcc att    2057
Pro Pro Glu Leu Ala Gln Glu Tyr Leu Gln Ser Cys Glu Ile Ala Ile
    605                 610                 615
cag cgt tgt cag cag cga ctg gag tat gac gaa ccg ggt agt tct ggc    2105
Gln Arg Cys Gln Gln Arg Leu Glu Tyr Asp Glu Pro Gly Ser Ser Gly
620                 625                 630                 635
gat gcc aat atc atg gat gcg ccg gag atg cag ccg cac gaa ggc gcg    2153
Asp Ala Asn Ile Met Asp Ala Pro Glu Met Gln Pro His Glu Gly Ala
                640                 645                 650
gca ggt acg ctg gag cag cat tta cag cgg gtt att ggt cat ctg aac    2201
Ala Gly Thr Leu Glu Gln His Leu Gln Arg Val Ile Gly His Leu Asn
            655                 660                 665
acc atg cac acc att tcg tcg atg gca tgg cgt cag cga ccg cat cac    2249
Thr Met His Thr Ile Ser Ser Met Ala Trp Arg Gln Arg Pro His His
        670                 675                 680
ggg att tgg ctg agt cgc aag ttg cgg gat tcg aag gcg taatgcaggc     2298
Gly Ile Trp Leu Ser Arg Lys Leu Arg Asp Ser Lys Ala
    685                 690                 695
taaaccatcg gataaggcat tcacgccgca tccgacatct tttgcctgat gcttcgtatt  2358
tacgccccaa ccacctt                                                 2375
<210>4
<211>696
<212>PRT
<213>大肠杆菌
<400>4
Met Trp Arg Arg Leu Ile Tyr His Pro Asp Ile Asn Tyr Ala Leu Arg
1               5                   10                  15
Gln Thr Leu Val Leu Cys Leu Pro Val Ala Val Gly Leu Met Leu Gly
            20                  25                  30
Glu Leu Arg Phe Gly Leu Leu Phe Ser Leu Val Pro Ala Cys Cys Asn
        35                  40                  45
Ile Ala Gly Leu Asp Thr Pro His Lys Arg Phe Phe Lys Arg Leu Ile
    50                  55                  60
Ile Gly Ala Ser Leu Phe Ala Thr Cys Ser Leu Leu Thr Gln Leu Leu
65                  70                  75                  80
Leu Ala Lys Asp Val Pro Leu Pro Phe Leu Leu Thr Gly Leu Thr Leu
                85                  90                  95
Val Leu Gly Val Thr Ala Glu Leu Gly Pro Leu His Ala Lys Leu Leu
            100                 105                 110
Pro Ala Ser Leu Leu Ala Ala Ile Phe Thr Leu Ser Leu Ala Gly Tyr
        115                 120                 125
Met Pro Val Trp Glu Pro Leu Leu Ile Tyr Ala Leu Gly Thr Leu Trp
    130                 135                 140
Tyr Gly Leu Phe Asn Trp Phe Trp Phe Trp Ile Trp Arg Glu Gln Pro
145                 150                 155                 160
Leu Arg Glu Ser Leu Ser Leu Leu Tyr Arg Glu Leu Ala Asp Tyr Cys
                165                 170                 175
Glu Ala Lys Tyr Ser Leu Leu Thr Gln His Thr Asp Pro Glu Lys Ala
            180                 185                 190
Leu Pro Pro Leu Leu Val Arg Gln Gln Lys Ala Val Asp Leu Ile Thr
        195                 200                 205
Gln Cys Tyr Gln Gln Met His Met Leu Ser Ala Gln Asn Asn Thr Asp
    210                 215                 220
Tyr Lys Arg Met Leu Arg Ile Phe Gln Glu Ala Leu Asp Leu Gln Glu
225                 230                 235                 240
His Ile Ser Val Ser Leu His Gln Pro Glu Glu Val Gln Lys Leu Val
                245                 250                 255
Glu Arg Ser His Ala Glu Glu Val Ile Arg Trp Asn Ala Gln Thr Val
            260                 265                 270
Ala Ala Arg Leu Arg Val Leu Ala Asp Asp Ile Leu Tyr His Arg Leu
        275                 280                 285
Pro Thr Arg Phe Thr Met Glu Lys Gln Ile Gly Ala Leu Glu Lys Ile
    290                 295                 300
Ala Arg Gln His Pro Asp Asn Pro Val Gly Gln Phe Cys Tyr Trp His
305                 310                 315                 320
Phe Ser Arg Ile Ala Arg Val Leu Arg Thr Gln Lys Pro Leu Tyr Ala
                325                 330                 335
Arg Asp Leu Leu Ala Asp Lys Gln Arg Arg Met Pro Leu Leu Pro Ala
            340                 345                 350
Leu Lys Ser Tyr Leu Ser Leu Lys Ser Pro Ala Leu Arg Asn Ala Gly
        355                 360                 365
Arg Leu Ser Val Met Leu Ser Val Ala Ser Leu Met Gly Thr Ala Leu
    370                 375                 380
His Leu Pro Lys Ser Tyr Trp Ile Leu Met Thr Val Leu Leu Val Thr
385                 390                 395                 400
Gln Asn Gly Tyr Gly Ala Thr Arg Leu Arg Ile Val Asn Arg Ser Val
                405                 410                 415
Gly Thr Val Val Gly Leu Ile Ile Ala Gly Val Ala Leu His Phe Lys
            420                 425                 430
Ile Pro Glu Gly Tyr Thr Leu Thr Leu Met Leu Ile Thr Thr Leu Ala
        435                 440                 445
Ser Tyr Leu Ile Leu Arg Lys Asn Tyr Gly Trp Ala Thr Val Gly Phe
    450                 455                 460
Thr Ile Thr Ala Val Tyr Thr Leu Gln Leu Leu Trp Leu Asn Gly Glu
465                 470                 475                 480
Gln Tyr Ile Leu Pro Arg Leu Ile Asp Thr Ile Ile Gly Cys Leu Ile
                485                 490                 495
Ala Phe Gly Gly Thr Val Trp Leu Trp Pro Gln Trp Gln Ser Gly Leu
            500                 505                 510
Leu Arg Lys Asn Ala His Asp Ala Leu Glu Ala Tyr Gln Glu Ala Ile
        515                 520                 525
Arg Leu Ile Leu Ser Glu Asp Pro Gln Pro Thr Pro Leu Ala Trp Gln
    530                 535                 540
Arg Met Arg Val Asn Gln Ala His Asn Thr Leu Tyr Asn Ser Leu Asn
545                 550                 555                 560
Gln Ala Met Gln Glu Pro Ala Phe Asn Ser His Tyr Leu Ala Asp Met
                565                 570                 575
Lys Leu Trp Val Thr His Ser Gln Phe Ile Val Glu His Ile Asn Ala
            580                 585                 590
Met Thr Thr Leu Ala Arg Glu His Arg Ala Leu Pro Pro Glu Leu Ala
        595                 600                 605
Gln Glu Tyr Leu Gln Ser Cys Glu Ile Ala Ile Gln Arg Cys Gln Gln
    610                 615                 620
Arg Leu Glu Tyr Asp Glu Pro Gly Ser Ser Gly Asp Ala Asn Ile Met
625                 630                 635                 640
Asp Ala Pro Glu Met Gln Pro His Glu Gly Ala Ala Gly Thr Leu Glu
                645                 650                 655
Gln His Leu Gln Arg Val Ile Gly His Leu Asn Thr Met His Thr Ile
            660                 665                 670
Ser Ser Met Ala Trp Arg Gln Arg Pro His His Gly Ile Trp Leu Ser
        675                 680                 685
Arg Lys Leu Arg Asp Ser Lys Ala
    690                 695
<210>5
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>5
tcaaggcgat tttattgggt gagcttggc                       29
<210>6
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>6
ttattaatac gccagctgta ctgaatgggg                      30
<210>7
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>7
gatcctgcag gtcaggaaat cggtcagatt gtcggctgtt 40
<210>8
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>8
gatcgaattc aaggtggttg gggcgtaaat acgaagcatc 40
<210>9
<211>16214
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>9
gaattccgcc agaaccttca tcagcagcat aaacaggtgc agtgaacagc agagatacgg  60
ccagtgcggc caatgttttt tgtcctttaa acataacaga gtcctttaag gatatagaat  120
aggggtatag ctacgccaga atatcgtatt tgattattgc tagtttttag ttttgcttaa  180
aaaatattgt tagttttatt aaattggaaa actaaattat tggtatcatg aattgttgta  240
tgatgataaa tatagggggg atatgataga cgtcattttc atagggttat aaaatgcgac  300
taccatgaag tttttaattc aaagtattgg gttgctgata atttgagctg ttctattctt  360
tttaaatatc tatataggtc tgttaatgga ttttattttt acaagttttt tgtgtttagg  420
catataaaaa tcaagcccgc catatgaacg gcgggttaaa atatttacaa cttagcaatc  480
gaaccattaa cgcttgatat cgcttttaaa gtcgcgtttt tcatatcctg tatacagctg  540
acgcggacgg gcaatcttca taccgtcact gtgcatttcg ctccagtggg cgatccagcc  600
aacggtacgt gccattgcga aaatgacggt gaacatggaa gacggaatac ccatcgcttt  660
caggatgata ccagagtaga aatcgacgtt cgggtacagt ttcttctcga taaagtacgg  720
gtcgttcagc gcgatgtttt ccagctccat agccacttcc agcaggtcat ccttcgtgcc  780
cagctctttc agcacttcat ggcaggtttc acgcattacg gtggcgcgcg ggtcgtaatt  840
tttgtacacg cggtgaccga agcccatcag gcggaaagaa tcatttttgt ctttcgcacg  900
acgaaaaaat tccggaatgt gtttaacgga gctgatttct tccagcattt tcagcgccgc  960
ttcgttagca ccgccgtgcg caggtcccca cagtgaagca atacctgctg cgatacaggc  1020
aaacgggttc gcacccgaag agccagcggt acgcacggtg gaggtagagg cgttctgttc  1080
atggtcagcg tgcaggatca gaatacggtc catagcacgt tccagaatcg gattaacttc  1140
atacggttcg cacggcgtgg agaacatcat attcaggaag ttaccggcgt aggagagatc  1200
gttgcgcggg taaacaaatg gctgaccaat ggaatacttg taacacatcg cggccatggt  1260
cggcattttc gacagcaggc ggaacgcggc aatttcacgg tgacgaggat tgttaacatc  1320
cagcgagtcg tgatagaacg ccgccagcgc gccggtaata ccacacatga ctgccattgg  1380
atgcgagtcg cgacggaaag catggaacag acgggtaatc tgctcgtgga tcatggtatg  1440
acgggtcacc gtagttttaa attcgtcata ctgttcctga gtcggttttt caccattcag  1500
caggatgtaa caaacttcca ggtagttaga atcggtcgcc agctgatcga tcgggaaacc  1560
gcggtgcagc aaaatacctt catcaccatc aataaaagta attttagatt cgcaggatgc  1620
ggttgaagtg aagcctgggt caaaggtgaa cacacctttt gaaccgagag tacggatatc  1680
aataacatct tgacccagcg tgcctttcag cacatccagt tcaacagctg tatccccgtt  1740
gagggtgagt tttgcttttg tatcagccat ttaaggtctc cttagcgcct tattgcgtaa    1800
gactgccgga acttaaattt gccttcgcac atcaacctgg ctttacccgt tttttatttg    1860
gctcgccgct ctgtgaaaga ggggaaaacc tgggtacaga gctctgggcg cttgcaggta    1920
aaggatccat tgatgacgaa taaatggcga atcaagtact tagcaatccg aattattaaa    1980
cttgtctacc actaataact gtcccgaatg aattggtcaa tactccacac tgttacataa    2040
gttaatctta ggtgaaatac cgacttcata acttttacgc attatatgct tttcctggta    2100
atgtttgtaa caactttgtt gaatgattgt caaattagat gattaaaaat taaataaatg    2160
ttgttatcgt gacctggatc actgttcagg ataaaacccg acaaactata tgtaggttaa    2220
ttgtaatgat tttgtgaaca gcctatactg ccgccagtct ccggaacacc ctgcaatccc    2280
gagccaccca gcgttgtaac gtgtcgtttt cgcatctgga agcagtgttt tgcatgacgc    2340
gcagttatag aaaggacgct gtctgacccg caagcagacc ggaggaagga aatcccgacg    2400
tcggggatcc tctagagctt tagcgtctga ggttatcgca atttggttat gagattactc    2460
tcgttattaa tttgctttcc tgggtcattt ttttcttgct taccgtcaca ttcttgatgg    2520
tatagtcgaa aactgcaaaa gcacatgaca taaacaacat aagcacaatc gtattaatat    2580
ataagggttt tatatctatg gatcagacat attctctgga gtcattcctc aaccatgtcc    2640
aaaagcgcga cccgaatcaa accgagttcg cgcaagccgt tcgtgaagta atgaccacac    2700
tctggccttt tcttgaacaa aatccaaaat atcgccagat gtcattactg gagcgtctgg    2760
ttgaaccgga gcgcgtgatc cagtttcgcg tggtatgggt tgatgatcgc aaccagatac    2820
aggtcaaccg tgcatggcgt gtgcagttca gctctgccat cggcccgtac aaaggcggta    2880
tgcgcttcca tccgtcagtt aacctttcca ttctcaaatt cctcggcttt gaacaaacct    2940
tcaaaaatgc cctgactact ctgccgatgg gcggtggtaa aggcggcagc gatttcgatc    3000
cgaaaggaaa aagcgaaggt gaagtgatgc gtttttgcca ggcgctgatg actgaactgt    3060
atcgccacct gggcgcggat accgacgttc cggcaggtga tatcggggtt ggtggtcgtg    3120
aagtcggctt tatggcgggg atgatgaaaa agctctccaa caataccgcc tgcgtcttca    3180
ccggtaaggg cctttcattt ggcggcagtc ttattcgccc ggaagctacc ggctacggtc    3240
tggtttattt cacagaagca atgctaaaac gccacggtat gggttttgaa gggatgcgcg    3300
tttccgtttc tggctccggc aacgtcgccc agtacgctat cgaaaaagcg atggaatttg    3360
gtgctcgtgt gatcactgcg tcagactcca gcggcactgt agttgatgaa agcggattca    3420
cgaaagagaa actggcacgt cttatcgaaa tcaaagccag ccgcgatggt cgagtggcag    3480
attacgccaa agaatttggt ctggtctatc tcgaaggcca acagccgtgg tctctaccgg    3540
ttgatatcgc cctgccttgc gccacccaga atgaactgga tgttgacgcc gcgcatcagc    3600
ttatcgctaa tggcgttaaa gccgtcgccg aaggggcaaa tatgccgacc accatcgaag    3660
cgactgaact gttccagcag gcaggcgtac tatttgcacc gggtaaagcg gctaatgctg    3720
gtggcgtcgc tacatcgggc ctggaaatgc cacaaaacgc tgcgcgcctg ggctggaaag    3780
ccgagaaagt tgacgcacgt ttgcatcaca tcatgctgga tatccaccat gcctgtgttg    3840
agcatggtgg tgaaggtgag caaaccaact acgtgcaggg cgcgaacatt gccggttttg    3900
tgaaggttgc cgatgcgatg ctggcgcagg gtgtgattta agttgtaaat gcctgatggc    3960
gctacgctta tcaggcctac aaatgggcac aattcattgc agttacgctc taatgtaggc    4020
cgggcaagcg cagcgccccc ggcaaaattt caggcgttta tgagtattta acggatgatg    4080
ctccccacgg aacatttctt atgggccaac ggcatttctt actgtagtgc tcccaaaact    4140
gcttgtcgta acgataacac gcttcaagtt cagcatccgt taactttctg cggactcacg    4200
cgcgcagcac tatgccagta aagaaatccc atttgactat ttttttgata atcttcttcg    4260
ctttcgaaca actcgtgcgc ctttcgagaa gctagagtcg actcgccaat caccagcact    4320
aaagtgcgcg gttcgttacc cgattcatct ttgaaattag ccagtggcgg caaggcatta    4380
ttttcattca gtaactttgt tagcgagttt agttgctgac gatactgata atagccggtc    4440
aggaattgcc acggtgcggc aggctccata cgcgaggcca ggttatccaa cgttttctca    4500
aacggcttgt ttttgataaa cgtattcatg gcgatcggat gcagaatcaa gccataaagc    4560
agggcaaaag agacaacata acgccacggc tttggaatat agaccgggcg caggcgtgtc    4620
cacagcagaa ctgccaccgc cgtataggcc agcgcgataa gcacaatttt caggctgaaa    4680
tactggctta aatactcgct ggcttcgttg gtgttggttt cgaacatcac aaacagaacg    4740
ctctgcgaga actcctgacc gtagatgacg tagtagcaca gcgccgccag agaggccgcc    4800
catagcacca cgccgattac tgcggcaata attttaatcc gcttcggaaa gaggaatacc    4860
gggatcaacc acagcgaact gaataacagc gagtcgcgaa tgccgttagt gccactataa    4920
ccactgatgt aaataatggc ctgtagcaga gtagagaaaa accaaaagta gagcagtgcc    4980
caacccaggg ctttccagct aaaaagaggt ttagcctgga cttctgtgga atgcatagta    5040
agaacctgtc ttgaaaaaat atcgccgaat gtaacgacaa ttccttaagg atatctgaag    5100
gtatattcag aatttgaata aaatgcagac agaaatatat tgaaaacgag ggtgttagaa    5160
cagaagtatt tcagaaaacc ctcgcgcaaa agcacgaggg tttgcagaag aggaagatta    5220
gccggtatta cgcatacctg ccgcaatccc ggcaatagtg accattaacg cttgttcgac    5280
gcgaggatcc ggttcctggc cttctttttc tgcctggcgg gagcggtgca gcaactcggc    5340
ctgcaatacg ttcagcgggt cggtgtaaat attccgtagc tgaatagact ctgcaatcca    5400
cggcagatcg gccatcagat gggaatcgtt ggcaatcgcc agcaccactt tgatgtcttc    5460
ttcttgcagg ttgcgtaact ctttacctaa cggccacagt gctttgtcta ccaggcgttg    5520
gtcatagtat tccgccagcc acaggtctgc tttggcgaag accatctcca gcatgccgag    5580
acgcgtcgag aagaatggcc aatcgcggca catagcctcc agctcgctct gtttgccgtc    5640
ttcgaccact ttttgcagcg ccgtacctgc acccagccag gcggggagca tcagacggtt    5700
ttgcgtccag gcgaagatcc acggaatggc gcgtagtgac tcgacgccgc cggttgggcg    5760
acgtttcgcc ggacgtgaac ccaacggcag tttgcccagt tcttgttccg gcgtagcgga    5820
gcggaagtaa ggcacaaaat ctttgttttc acgtacgtag ccgcggtaga catcgcagga    5880
gatgactgac agttcatcca taatgcgacg ccagctctct ttcggctccg gcggtggcag    5940
caggttggct tccagaatcg ccccggtata aagcgacagg ctgctgacgg tgatttctgg    6000
cagaccatat ttaaagcgga tcatctcgcc ctgttcggtt acgcgcaggc cgcctttcag    6060
gcttcctggc ggttgtgaca gcagcgccgc atgagcaggt gcgccgccgc gaccaatgga    6120
accgccgcga ccgtggaaca acgtcagctc aatacccgct ttttcgcagg ttttgattaa    6180
tgcatcctgt gcctgatatt gcgcccagga agctgccatc actcccgcat cttttgctga    6240
gtcggaatag ccaatcatca ccatctgttt gccctgaatc aggccacgat accagtcaat    6300
attgagcagc tgggtcatga catcgttggc gttgttcaga tcatcgaggg tttcaaacag    6360
cggagcaacc ggcatcgcaa acccgatacc cgcttctttc agcagcaggt ggacagccag    6420
tacgtcggac ggcgttttcg ccatcgagat cacgtaggcg gcaatggagc cttgcggtgc    6480
ttcggcaatc acctggcagg tatcgagcac ttcgcgcgtt tcggcgcttg gttgccagtt    6540
gcgcggcaga agcggacgtt tggagttcag ttcgcggatc aggaacgcct gtttgtcggc    6600
ctctgaccag ctttcgtagt cgccgatacc gaggtagcgg gtcagctcgc ccagcgcttc    6660
ggtatgacgc gtgctctcct gacggatatc aatacggacc agcggtacgc cgaaacattt    6720
cacgcggcgc agggtgtcga gcagatcgcc gttggcgata atacccatgc cacacgcctg    6780
aagtgactgg tagcaagcgt agagcggttc ccacagttct tcgttttgtg tcagcaggcc    6840
ttctggtttt ggcagttctt cgcctttcag gcgcgcttcc agccatgcct gtgtcgccat    6900
caggcgagaa cgcaggtttt tcatcagata gcgatacggt tctgcggcac cttcttcgcc    6960
aaccagcgcc agcagttcag gggtcgcttc aaccatcgac agttcagaaa ccagcacctg    7020
aatatctttc aggaacaaat cggtggcttt ccagcggctg agtagcagga cgtggcgggt    7080
gatatcggca gtgacgttcg ggttgccgtc gcggtcgccg cccatccacg aagtaaaacg    7140
gaccggaaca aattcgacgg gcagtttgta gccgaggttc tcttccagtt gttcgttcag    7200
ttcgcgcagg taatttggta cgccttgcca caggctgttt tccactacgg caaagcccca    7260
tttggcttca tctaccgggc ttggacgcag cttacggatt tcatcggtat gccatgactg    7320
ggcgatcaac tggcgcaggc gacgcatcag ctggttgtgt tcgtagtcag cgatatcttt    7380
gttatcgagc tgttttaaac aggcgttcac ttccaccatt ttgtggatca gtgtacgacg    7440
ggtaatttcg gttgggtgag ccgtgaggac cagttccagc gacagcgatt ccactgcttt    7500
tttgatggtg tcttcgctca gttccggctg gtttttcagt ttacgcaggg tgcgggcgat    7560
cacttccggg ttgctggcag cttcgccttt cggcgaaatg ctgtggtatt gctcggcggt    7620
gttggccagg ttcaggaact gactaaacgc acgcgcaacg ggcagcagct cgtcgttcga    7680
caaattttgt aaggtggtga gcaactcctg gcggttagca tcattgccag cgcgtgaaga    7740
tttcgacaac ttacggatag tttctacgcg ttcaagaatg tgttctccca acgcatcctt    7800
gatggtttct cccagcactt tgccgagcat actgacatta ctacgcaatg cggaatattg    7860
ttcgttcata ttaccccaga caccccatct tatcgtttga tagccctgta tccttcacgt    7920
cgcattggcg cgaatatgct cgggctttgc ttttcgtcgt cttttataaa gccacgtaaa    7980
agcggtgacg tcaaatgctg cgaaatcgct tcagcaaacg aataaatagc aggaatttac    8040
gtcattaaat tcacgacgct ttaaataagc gtaacttatg gaaatgttaa aaaatcgccc    8100
caagtaacac caaaggtgta ggtcggataa gatgcgcaag tatcgcatcc gacattattg    8160
cggcactgga gtttggcaac agtgccggat gcggcgcgag cgccttatcc ggcctacagt    8220
tgggcatcgt ttgagtcact gtcggtcgga taagatgcgc aagtatcgca tccgacatta    8280
ttgcggcact ggagtttggc aacagtgccg gatgcggcgc gagcgcctta tccggcctac    8340
ggttgggcat cgtttgagtc actgtaggtc ggataagatg cgcaagcatc gcatccgaca    8400
ttattgcggc actggagttt ggcaacagcg ccggatgcgg cgcgagcgcc ttatccggcc    8460
tacgttttaa tgccagcaaa aatggtgaat tacctgggtt atcagttcgc gggtgggctt    8520
gataaaccgt gtttccagat attcatcagg ttgatgagcc tgattaattg agccaggccc    8580
caacaccagc gtcgggcata acgtttgaat aaacggcgct tcggtacagt agttcaccac    8640
ttcggttttt gctccgagca atttctcaac cacttcaacc agttgatgat tcggtgggca    8700
ttcatagcca gggatcggcg gatgcagctc gtcgacctgc aggagcagaa gagcatacat    8760
ctggaagcaa agccaggaaa gcggcctatg gagctgtgcg gcagcgctca gtaggcaatt    8820
tttcaaaata ttgttaagcc ttttctgagc atggtatttt tcatggtatt accaattagc    8880
aggaaaataa gccattgaat ataaaagata aaaatgtctt gtttacaata gagtgggggg    8940
ggtcagcctg ccgccttggg ccgggtgatg tcgtacttgc ccgccgcgaa ctcggttacc    9000
gtccagccca gcgcgaccag ctccggcaac gcctcgcgca cccgctggcg gcgcttgcgc    9060
atggtcgaac cactggcctc tgacggccag acatagccgc acaaggtatc tatggaagcc    9120
ttgccggttt tgccggggtc gatccagcca cacagccgct ggtgcagcag gcgggcggtt    9180
tcgctgtcca gcgcccgcac ctcgtccatg ctgatgcgca catgctggcc gccacccatg    9240
acggcctgcg cgatcaaggg gttcagggcc acgtacaggc gcccgtccgc ctcgtcgctg    9300
gcgtactccg acagcagccg aaacccctgc cgcttgcggc cattctgggc gatgatggat    9360
accttccaaa ggcgctcgat gcagtcctgt atgtgcttga gcgccccacc actatcgacc    9420
tctgccccga tttcctttgc cagcgcccga tagctacctt tgaccacatg gcattcagcg    9480
gtgacggcct cccacttggg ttccaggaac agccggagct gccgtccgcc ttcggtcttg    9540
ggttccgggc caagcactag gccattaggc ccagccatgg ccaccagccc ttgcaggatg    9600
cgcagatcat cagcgcccag cggctccggg ccgctgaact cgatccgctt gccgtcgccg    9660
tagtcatacg tcacgtccag cttgctgcgc ttgcgctcgc cccgcttgag ggcacggaac    9720
aggccggggg ccagacagtg cgccgggtcg tgccggacgt ggctgaggct gtgcttgttc    9780
ttaggcttca ccacggggca cccccttgct cttgcgctgc ctctccagca cggcgggctt    9840
gagcaccccg ccgtcatgcc gcctgaacca ccgatcagcg aacggtgcgc catagttggc    9900
cttgctcaca ccgaagcgga cgaagaaccg gcgctggtcg tcgtccacac cccattcctc    9960
ggcctcggcg ctggtcatgc tcgacaggta ggactgccag cggatgttat cgaccagtac    10020
cgagctgccc cggctggcct gctgctggtc gcctgcgccc atcatggccg cgcccttgct    10080
ggcatggtgc aggaacacga tagagcaccc ggtatcggcg gcgatggcct ccatgcgacc    10140
gatgacctgg gccatggggc cgctggcgtt ttcttcctcg atgtggaacc ggcgcagcgt    10200
gtccagcacc atcaggcggc ggccctcggc ggcgcgcttg aggccgtcga accactccgg    10260
ggccatgatg ttgggcaggc tgccgatcag cggctggatc agcaggccgt cagccacggc    10320
ttgccgttcc tcggcgctga ggtgcgcccc aagggcgtgc aggcggtgat gaatggcggt    10380
gggcgggtct tcggcgggca ggtagatcac cgggccggtg ggcagttcgc ccacctccag    10440
cagatccggc ccgcctgcaa tctgtgcggc cagttgcagg gccagcatgg atttaccggc    10500
accaccgggc gacaccagcg ccccgaccgt accggccacc atgttgggca aaacgtagtc    10560
cagcggtggc ggcgctgctg cgaacgcctc cagaatattg ataggcttat gggtagccat    10620
tgattgcctc ctttgcaggc agttggtggt taggcgctgg cggggtcact acccccgccc    10680
tgcgccgctc tgagttcttc caggcactcg cgcagcgcct cgtattcgtc gtcggtcagc    10740
cagaacttgc gctgacgcat ccctttggcc ttcatgcgct cggcatatcg cgcttggcgt    10800
acagcgtcag ggctggccag caggtcgccg gtctgcttgt ccttttggtc tttcatatca    10860
gtcaccgaga aacttgccgg ggccgaaagg cttgtcttcg cggaacaagg acaaggtgca    10920
gccgtcaagg ttaaggctgg ccatatcagc gactgaaaag cggccagcct cggccttgtt    10980
tgacgtataa ccaaagccac cgggcaacca atagcccttg tcacttttga tcaggtagac    11040
cgaccctgaa gcgctttttt cgtattccat aaaaccccct tctgtgcgtg agtactcata    11100
gtataacagg cgtgagtacc aacgcaagca ctacatgctg aaatctggcc cgcccctgtc    11160
catgcctcgc tggcggggtg ccggtgcccg tgccagctcg gcccgcgcaa gctggacgct    11220
gggcagaccc atgaccttgc tgacggtgcg ctcgatgtaa tccgcttcgt ggccgggctt    11280
gcgctctgcc agcgctgggc tggcctcggc catggccttg ccgatttcct cggcactgcg    11340
gccccggctg gccagcttct gcgcggcgat aaagtcgcac ttgctgaggt catcaccgaa    11400
gcgcttgacc agcccggcca tctcgctgcg gtactcgtcc agcgccgtgc gccggtggcg    11460
gctaagctgc cgctcgggca gttcgaggct ggccagcctg cgggccttct cctgctgccg    11520
ctgggcctgc tcgatctgct ggccagcctg ctgcaccagc gccgggccag cggtggcggt    11580
cttgcccttg gattcacgca gcagcaccca cggctgataa ccggcgcggg tggtgtgctt    11640
gtccttgcgg ttggtgaagc ccgccaagcg gccatagtgg cggctgtcgg cgctggccgg    11700
gtcggcgtcg tactcgctgg ccagcgtccg ggcaatctgc ccccgaagtt caccgcctgc    11760
ggcgtcggcc accttgaccc atgcctgata gttcttcggg ctggtttcca ctaccagggc    11820
aggctcccgg ccctcggctt tcatgtcatc caggtcaaac tcgctgaggt cgtccaccag    11880
caccagacca tgccgctcct gctcggcggg cctgatatac acgtcattgc cctgggcatt    11940
catccgcttg agccatggcg tgttctggag cacttcggcg gctgaccatt cccggttcat    12000
catctggccg gtggtggcgt ccctgacgcc gatatcgaag cgctcacagc ccatggcctt    12060
gagctgtcgg cctatggcct gcaaagtcct gtcgttcttc atcgggccac caagcgcagc    12120
cagatcgagc cgtcctcggt tgtcagtggc gtcaggtcga gcaagagcaa cgatgcgatc    12180
agcagcacca ccgtaggcat catggaagcc agcatcacgg ttagccatag cttccagtgc    12240
cacccccgcg acgcgctccg ggcgctctgc gcggcgctgc tcacctcggc ggctacctcc    12300
cgcaactctt tggccagctc cacccatgcc gcccctgtct ggcgctgggc tttcagccac    12360
tccgccgcct gcgcctcgct ggcctgctgg gtctggctca tgacctgccg ggcttcgtcg    12420
gccagtgtcg ccatgctctg ggccagcggt tcgatctgct ccgctaactc gttgatgcct    12480
ctggatttct tcactctgtc gattgcgttc atggtctatt gcctcccggt attcctgtaa    12540
gtcgatgatc tgggcgttgg cggtgtcgat gttcagggcc acgtctgccc ggtcggtgcg    12600
gatgccccgg ccttccatct ccaccacgtt cggccccagg tgaacaccgg gcaggcgctc    12660
gatgccctgc gcctcaagtg ttctgtggtc aatgcgggcg tcgtggccag cccgctctaa    12720
tgcccggttg gcatggtcgg cccatgcctc gcgggtctgc tcaagccatg ccttgggctt    12780
gagcgcttcg gtcttctgtg ccccgccctt ctccggggtc ttgccgttgt accgcttgaa    12840
ccactgagcg gcgggccgct cgatgccgtc attgatccgc tcggagatca tcaggtggca    12900
gtgcgggttc tcgccgccac cggcatggat ggccagcgta tacggcaggc gctcggcacc    12960
ggtcaggtgc tgggcgaact cggacgccag cgccttctgc tggtcgaggg tcagctcgac    13020
cggcagggca aattcgacct ccttgaacag ccgcccattg gcgcgttcat acaggtcggc    13080
agcatcccag tagtcggcgg gccgctcgac gaactccggc atgtgcccgg attcggcgtg    13140
caagacttca tccatgtcgc gggcatactt gccttcgcgc tggatgtagt cggccttggc    13200
cctggccgat tggccgcccg acctgctgcc ggttttcgcc gtaaggtgat aaatcgccat    13260
gctgcctcgc tgttgctttt gcttttcggc tccatgcaat ggccctcgga gagcgcaccg    13320
cccgaagggt ggccgttagg ccagtttctc gaagagaaac cggtaagtgc gccctcccct    13380
acaaagtagg gtcgggattg ccgccgctgt gcctccatga tagcctacga gacagcacat    13440
taacaatggg gtgtcaagat ggttaagggg agcaacaagg cggcggatcg gctggccaag    13500
ctcgaagaac aacgagcgcg aatcaatgcc gaaattcagc gggtgcgggc aagggaacag    13560
cagcaagagc gcaagaacga aacaaggcgc aaggtgctgg tgggggccat gattttggcc    13620
aaggtgaaca gcagcgagtg gccggaggat cggctcatgg cggcaatgga tgcgtacctt    13680
gaacgcgacc acgaccgcgc cttgttcggt ctgccgccac gccagaagga tgagccgggc    13740
tgaatgatcg accgagacag gccctgcggg gctgcacacg cgcccccacc cttcgggtag    13800
ggggaaaggc cgctaaagcg gctaaaagcg ctccagcgta tttctgcggg gtttggtgtg    13860
gggtttagcg ggctttgccc gcctttcccc ctgccgcgca gcggtggggc ggtgtgtagc    13920
ctagcgcagc gaatagacca gctatccggc ctctggccgg gcatattggg caagggcagc    13980
agcgccccac aagggcgctg ataaccgcgc ctagtggatt attcttagat aatcatggat    14040
ggatttttcc aacaccccgc cagcccccgc ccctgctggg tttgcaggtt tgggggcgtg    14100
acagttattg caggggttcg tgacagttat tgcagggggg cgtgacagtt attgcagggg    14160
ttcgtgacag ttagtacggg agtgacgggc actggctggc aatgtctagc aacggcaggc    14220
atttcggctg agggtaaaag aactttccgc taagcgatag actgtatgta aacacagtat    14280
tgcaaggacg cggaacatgc ctcatgtggc ggccaggacg gccagccggg atcgggatac    14340
tggtcgttac cagagccacc gacccgagca aacccttctc tatcagatcg ttgacgagta    14400
ttacccggca ttcgctgcgc ttatggcaga gcagggaaag gaattgccgg gctatgtgca    14460
acgggaattt gaagaatttc tccaatgcgg gcggctggag catggctttc tacgggttcg    14520
ctgcgagtct tgccacgccg agcacctggt cgctttcagc tgtaagcgtc gcggtttctg    14580
cccgagctgt ggggcgcggc ggatggccga aagtgccgcc ttgctggttg atgaagtact    14640
gcctgaacaa cccatgcgtc agtgggtgtt gagcttcccg tttcagctgc gtttcctgtt    14700
tggggtcgtt tgcgggaagg ggcggaatcc tacgctaagg ctttggccag cgatattctc    14760
cggtgagatt gatgtgttcc caggggatag gagaagtcgc ttgatatcta gtatgacgtc    14820
tgtcgcacct gcttgatcgc ggcccaaggg ttggtttgcg cattcacagt tctccgcaag    14880
aattgattgg ctccaattct tggagtggtg aatccgttag cgaggtgccg ccggcttcca    14940
ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa cgcggggagg cagacaaggt    15000
atagggcggc gcctacaatc catgccaacc cgttccatgt gctcgccgag gcggcataaa    15060
tcgccgtgac gatcagcggt ccagtgatcg aagttaggct ggtaagagcc gcgagcgatc    15120
cttgaagctg tccctgatgg tcgtcatcta cctgcctgga cagcatggcc tgcaacgcgg    15180
gcatcccgat gccgccggaa gcgagaagaa tcataatggg gaaggccatc cagcctcgcg    15240
tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc catgccggcg ataatggcct    15300
gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa ggcttgagcg agggcgtgca    15360
agattccgaa taccgcaagc gacaggccga tcatcgtcgc gctccagcga aagcggtcct    15420
cgccgaaaat gacccagagc gctgccggca cctgtcctac gagttgcatg ataaagaaga  15480
cagtcataag tgcggcgacg atagtcatgc cccgcgccca ccggaaggag ctgactgggt  15540
tgaaggctct caagggcatc ggtcgacgct ctcccttatg cgactcctgc attaggaagc  15600
agcccagtag taggttgagg ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg  15660
agatggcgcc caacagtccc ccggccacgg ggcctgccac catacccacg ccgaaacaag  15720
cgctcatgag cccgaagtgg cgagcccgat cttccccatc ggtgatgtcg gcgatatagg  15780
cgccagcaac cgcacctgtg gcgccggtga tgccggccac gatgcgtccg gcgtagagga  15840
tccacaggac gggtgtggtc gccatgatcg cgtagtcgat agtggctcca agtagcgaag  15900
cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc tccgagaacg ggtgcgcata  15960
gaaattgcat caacgcatat agcgctagca gcacgccata gtgactggcg atgctgtcgg  16020
aatggacgat atcccgcaag aggcccggca gtaccggcat aaccaagcct atgcctacag  16080
catccagggt gacggtgccg aggatgacga tgagcgcatt gttagatttc atacacggtg  16140
cctgactgcg ttagcaattt aactgtgata aactaccgca ttaaagctta tcgatgataa  16200
gctgtcaaac atga                                                    16214
<210>10
<211>696
<212>PRT
<213>人工的
<220>
<223>保守序列
<220>
<221>MISC_FEATURE
<222>(5),(10),(11),(27),(29)..(31),(33),(35),(36),(62),(67),(72),(73),(76),(77),(79),(82)..(85),(89),(90),(92),(93),(95),(97),(102),(104),(105),(110),(114),(115),(117),(126),(128),(131)..(133),(135),(137),(139),(140),(147),(155),(157),(161),(168),(174),(177),(186),(187),(198),(204),(208),(209),(220)..(225),(228),(229),(231),(234),(236),(258),(263),(270),(272),(273),(278),(287),(289),(290),(293),(295),(298),(306),(310),(315),(318),(319),(332),(336),(340),(343),(347),(354),(355),(357),(360),(362),(366),(370),(374)..(377),(379)..(386),(389),(396)..(398),(400),(402),(403),(405),(409),(412),(413),(415),(416),(419),(420),(423),(426)..(428),(430)..(433),(436)..(438),(440),(441),(444),(445),(447),(448),(451)..(453),(455),(456),(460),(461),(466),(472),(476),(480),(482)..(484),(488),(491),(492),(501),(502),(511),(515),(524),(526),(528),(530),(531),(533)..(540),(543),(546),(547),(554)..(556),(567),(570),(571),(574),(577),(583),(595),(601),(602),(604),(606),(609),(610),(613),(614),(619),(630),(633),(635)..(653),(659),(660),(662)..(664),(667),(668),(675),(678),(685),(688)..(690),(693),(694),(696)
<223>Xaa=任何氨基酸残基
<400>10
Met Trp Arg Arg Xaa Ile Tyr His Pro Xaa Xaa Asn Tyr Ala Leu Arg
1               5                   10                  15
Gln Thr Leu Val Leu Cys Leu Pro Val Ala Xaa Gly Xaa Xaa Xaa Gly
            20                  25                  30
Xaa Leu Xaa Xaa Gly Leu Leu Phe Ser Leu Val Pro Ala Cys Cys Asn
        35                  40                  45
Ile Ala Gly Leu Asp Thr Pro His Lys Arg Phe Phe Lys Xaa Leu Ile
    50                  55                  60
Ile Gly Xaa Ser Leu Phe Ala Xaa Xaa Ser Leu Xaa Xaa Gln Xaa Leu
65                  70                  75                  80
Leu Xaa Xaa Xaa Xaa Pro Leu Pro Xaa Xaa Leu Xaa Xaa Leu Xaa Leu
                85                  90                  95
Xaa Leu Gly Val Thr Xaa Glu Xaa Xaa Pro Leu His Ala Xaa Leu Leu
            100                 105                 110
Pro Xaa Xaa Leu Xaa Ala Ala Ile Phe Thr Leu Ser Leu Xaa Gly Xaa
        115                 120                 125
Met Pro Xaa Xaa Xaa Pro Xaa Leu Xaa Tyr Xaa Xaa Gly Thr Leu Trp
    130                 135                 140
Tyr Gly Xaa Phe Asn Trp Phe Trp Phe Trp Xaa Trp Xaa Glu Gln Pro
145                 150                 155                 160
Xaa Arg Glu Ser Leu Ser Leu Xaa Tyr Arg Glu Leu Ala Xaa Tyr Cys
                165                 170                 175
Xaa Ala Lys Tyr Ser Leu Leu Thr Gln Xaa Xaa Asp Pro Glu Lys Ala
            180                 185                 190
Leu Pro Pro Leu Leu Xaa Arg Gln Gln Lys Ala Xaa Asp Leu Ile Xaa
        195                 200                 205
Xaa Cys Tyr Gln Gln Met His Met Leu Ser Ala Xaa Xaa Xaa Xaa Xaa
    210                 215                 220
Xaa Lys Arg Xaa Xaa Arg Xaa Phe Gln Xaa Ala Xaa Asp Leu Gln Glu
225                 230                 235                 240
His Ile Ser Val Ser Leu His Gln Pro Glu Glu Val Gln Lys Leu Val
                245                 250                 255
Glu Xaa Ser His Ala Glu Xaa Val Ile Arg Trp Asn Ala Xaa Thr Xaa
            260                 265                 270
Xaa Ala Arg Leu Arg Xaa Leu Ala Asp Asp Ile Leu Tyr His Xaa Leu
        275                 280                 285
Xaa Xaa Arg Phe Xaa Met Xaa Lys Gln Xaa Gly Ala Leu Glu Lys Ile
    290                 295                 300
Ala Xaa Gln His Pro Xaa Asn Pro Val Gly Xaa Phe Cys Xaa Xaa His
305                 310                 315                 320
Phe Ser Arg Ile Ala Arg Val Leu Arg Thr Gln Xaa Pro Leu Tyr Xaa
                325                 330                 335
Arg Asp Leu Xaa Ala Asp Xaa Gln Arg Arg Xaa Pro Leu Leu Pro Ala
            340                 345                 350
Leu Xaa Xaa Tyr Xaa Ser Leu Xaa Ser Xaa Ala Leu Arg Xaa Ala Gly
        355                 360                 365
Arg Xaa Ser Val Met Xaa Xaa Xaa Xaa Ser Xaa Xaa Xaa Xaa Xaa Xaa
    370                 375                 380
Xaa Xaa Pro Lys Xaa Tyr Trp Ile Leu Met Thr Xaa Xaa Xaa Val Xaa
385                 390                 395                 400
Gln Xaa Xaa Tyr Xaa Ala Thr Arg Xaa Arg Ile Xaa Xaa Arg Xaa Xaa
                405                 410                 415
Gly Thr Xaa Xaa Gly Leu Xaa Ile Ala Xaa Xaa Xaa Leu Xaa Xaa Xaa
            420                 425                 430
Xaa Pro Glu Xaa Xaa Xaa Leu Xaa Xaa Met Leu Xaa Xaa Thr Xaa Xaa
        435                 440                 445
Ser Tyr Xaa Xaa Xaa Arg Xaa Xaa Tyr Gly Trp Xaa Xaa Val Gly Phe
    450                 455                 460
Thr Xaa Thr Ala Val Tyr Thr Xaa Gln Leu Leu Xaa Leu Asn Gly Xaa
465                 470                 475                 480
Gln Xaa Xaa Xaa Pro Arg Leu Xaa Asp Thr Xaa Xaa Gly Cys Leu Ile
                485                 490                 495
Ala Phe Gly Gly Xaa Xaa Trp Leu Trp Pro Gln Trp Gln Ser Xaa Leu
            500                 505                 510
Leu Arg Xaa Asn Ala His Asp Ala Leu Glu Ala Xaa Gln Xaa Ala Xaa
        515                 520                 525
Arg Xaa Xaa Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Ala Xaa Gln
    530                 535                 540
Arg Xaa Xaa Val Asn Gln Ala His Asn Xaa Xaa Xaa Asn Ser Leu Asn
545                 550                 555                 560
Gln Ala Met Gln Glu Pro Xaa Phe Asn Xaa Xaa Tyr Leu Xaa Asp Met
                565                 570                 575
Xaa Leu Trp Val Thr His Xaa Gln Phe Ile Val Glu His Ile Asn Ala
            580                 585                 590
Met Thr Xaa Leu Ala Arg Glu His Xaa Xaa Leu Xaa Pro Xaa Leu Ala
        595                 600                 605
Xaa Xaa Tyr Leu Xaa Xaa Cys Glu Ile Ala Xaa Gln Arg Cys Gln Gln
    610                 615                 620
Arg Leu Glu Tyr Asp Xaa Pro Gly Xaa Ser Xaa Xaa Xaa Xaa Xaa Xaa
625                 630                 635                 640
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Leu Glu
                645                 650                 655
Gln His Xaa Xaa Arg Xaa Xaa Xaa His Leu Xaa Xaa Met His Thr Ile
            660                 665                 670
Ser Ser Xaa Ala Trp Xaa Gln Arg Pro His His Gly Xaa Trp Leu Xaa
        675                 680                 685
Xaa Xaa Leu Arg Xaa Xaa Lys Xaa
    690                 695
<210>11
<211>696
<212>PRT
<213>保守的
<220>
<221>MISC_FEATURE
<222>(10)..(696)
<223>
<220>
<221>MISC_FEATURE
<222>(10),(30),(33),(35),(72),(76),(83)..(85),(89),(80),(104),(105),(110),(117),(147),(155),(187),(198),(220),(223),(228),(231),(236),(293),(306),(310),(332),(340),(347),(355),(357),(370),(374),(382),(389),(398),(409),(412),(413),(419),(423),(428),(431),(432),(436),(437),(440),(444),(445),(453),(466),(472),(476),(482),(484),(491),(501),(524),(534),(538),(543),(556),(567),(570),(574),(601),(602),(604),(606),(610),(613),(630),(633),(637),(640),(641),(642),(644),(646),(648),(651)..(653),(662),(689),(690),(694),(696)
<223>Xaa=任何氨基酸残基
<400>11
Met Trp Arg Arg Leu Ile Tyr His Pro Xaa Ile Asn Tyr Ala Leu Arg
1               5                   10                  15
Gln Thr Leu Val Leu Cys Leu Pro Val Ala Val Gly Leu Xaa Leu Gly
            20                  25                  30
Xaa Leu Xaa Phe Gly Leu Leu Phe Ser Leu Val Pro Ala Cys Cys Asn
        35                  40                  45
Ile Ala Gly Leu Asp Thr Pro His Lys Arg Phe Phe Lys Arg Leu Ile
    50                  55                  60
Ile Gly Ala Ser Leu Phe Ala Xaa Cys Ser Leu Xaa Thr Gln Leu Leu
65                  70                  75                  80
Leu Ala Xaa Xaa Xaa Pro Leu Pro Xaa Xaa Leu Thr Gly Leu Thr Leu
                85                  90                  95
Val Leu Gly Val Thr Ala Glu Xaa Xaa Pro Leu His Ala Xaa Leu Leu
            100                 105                 110
Pro Ala Ser Leu Xaa Ala Ala Ile Phe Thr Leu Ser Leu Ala Gly Tyr
        115                 120                 125
Met Pro Val Trp Glu Pro Leu Leu Ile Tyr Ala Leu Gly Thr Leu Trp
    130                 135                 140
Tyr Gly Xaa Phe Asn Trp Phe Trp Phe Trp Xaa Trp Arg Glu Gln Pro
145                 150                 155                 160
Leu Arg Glu Ser Leu Ser Leu Leu Tyr Arg Glu Leu Ala Asp Tyr Cys
                165                 170                 175
Glu Ala Lys Tyr Ser Leu Leu Thr Gln His Xaa Asp Pro Glu Lys Ala
            180                 185                 190
Leu Pro Pro Leu Leu Xaa Arg Gln Gln Lys Ala Val Asp Leu Ile Thr
        195                 200                 205
Gln Cys Tyr Gln Gln Met His Met Leu Ser Ala Xaa Asn Asn Xaa Asp
    210                 215                 220
Tyr Lys Arg Xaa Leu Arg Xaa Phe Gln Glu Ala Xaa Asp Leu Gln Glu
225                 230                 235                 240
His Ile Ser Val Ser Leu His Gln Pro Glu Glu Val Gln Lys Leu Val
                245                 250                 255
Glu Arg Ser His Ala Glu Glu Val Ile Arg Trp Asn Ala Gln Thr Val
            260                 265                 270
Ala Ala Arg Leu Arg Val Leu Ala Asp Asp Ile Leu Tyr His Arg Leu
        275                 280                 285
Pro Thr Arg Phe Xaa Met Glu Lys Gln Ile Gly Ala Leu Glu Lys Ile
    290                 295                 300
Ala Xaa Gln His Pro Xaa Asn Pro Val Gly Gln Phe Cys Tyr Trp His
305                 310                 315                 320
Phe Ser Arg Ile Ala Arg Val Leu Arg Thr Gln Xaa Pro Leu Tyr Ala
                325                 330                 335
Arg Asp Leu Xaa Ala Asp Lys Gln Arg Arg Xaa Pro Leu Leu Pro Ala
            340                 345                 350
Leu Lys Xaa Tyr Xaa Ser Leu Lys Ser Pro Ala Leu Arg Asn Ala Gly
        355                 360                 365
Arg Xaa Ser Val Met Xaa Ser Val Ala Ser Leu Met Gly Xaa Ala Leu
    370                 375                 380
His Leu Pro Lys Xaa Tyr Trp Ile Leu Met Thr Val Leu Xaa Val Thr
385                 390                 395                 400
Gln Asn Gly Tyr Gly Ala Thr Arg Xaa Arg Ile Xaa Xaa Arg Ser Val
                405                 410                 415
Gly Thr Xaa Val Gly Leu Xaa Ile Ala Gly Val Xaa Leu His Xaa Xaa
            420                 425                 430
Ile Pro Glu Xaa Xaa Thr Leu Xaa Leu Met Leu Xaa Xaa Thr Leu Ala
        435                 440                 445
Ser Tyr Leu Ile Xaa Arg Lys Asn Tyr Gly Trp Ala Thr Val Gly Phe
    450                 455                 460
Thr Xaa Thr Ala Val Tyr Thr Xaa Gln Leu Leu Xaa Leu Asn Gly Glu
465                 470                 475                 480
Gln Xaa Ile Xaa Pro Arg Leu Ile Asp Thr Xaa Ile Gly Cys Leu Ile
                485                 490                 495
Ala Phe Gly Gly Xaa Val Trp Leu Trp Pro Gln Trp Gln Ser Gly Leu
            500                 505                 510
Leu Arg Lys Asn Ala His Asp Ala Leu Glu Ala Xaa Gln Glu Ala Ile
        515                 520                 525
Arg Leu Ile Leu Ser Xaa Asp Pro Gln Xaa Thr Pro Leu Ala Xaa Gln
    530                 535                 540
Arg Met Arg Val Asn Gln Ala His Asn Thr Leu Xaa Asn Ser Leu Asn
545                 550                 555                 560
Gln Ala Met Gln Glu Pro Xaa Phe Asn Xaa His Tyr Leu Xaa Asp Met
                565                 570                 575
Lys Leu Trp Val Thr His Ser Gln Phe Ile Val Glu His Ile Asn Ala
            580                 585                 590
Met Thr Thr Leu Ala Arg Glu His Xaa Xaa Leu Xaa Pro Xaa Leu Ala
        595                 600                 605
Gln Xaa Tyr Leu Xaa Ser Cys Glu Ile Ala Ile Gln Arg Cys Gln Gln
    610                 615                 620
Arg Leu Glu Tyr Asp Xaa Pro Gly Xaa Ser Gly Asp Xaa Asn Ile Xaa
625                 630                 635                 640
Xaa Xaa Pro Xaa Met Xaa Pro Xaa Glu Gly Xaa Xaa Xaa Thr Leu Glu
                645                 650                 655
Gln His Leu Gln Arg Xaa Ile Gly His Leu Asn Thr Met His Thr Ile
            660                 665                 670
Ser Ser Met Ala Trp Arg Gln Arg Pro His His Gly Ile Trp Leu Ser
        675                 680                 685
Xaa Xaa Leu Arg Asp Xaa Lys Xaa
    690                 695
<210>12
<211>696
<212>PRT
<213>保守的
<220>
<221>MISC_FEATURE
<222>(10),(30),(31),(33),(35),(36),(72),(76),(83),(84),(85),(89),(90),(104),(105),(110),(117),(147),(155),(187),(198),(220),(223),(228),(231),(236),(293),(306),(310),(332),(340),(347),(355),(357),(370),(374),(376),(382),(389),(398),(409),(412),(413),(419),(423),(428),(431),(432),(437),(440),(441),(444),(445),(453),(466),(472),(476),(483),(484),(491),(501),(524),(534),(538),(543),(556),(567),(570),(574),(601),(602),(604),(606),(610),(613),(630),(633),(637),(640),(641),(644),(646),(648),(649),(662),(689),(690),(694),(696)
<223>Xaa=任何氨基酸残基
<400>12
Met Trp Arg Arg Leu Ile Tyr His Pro Xaa Ile Asn Tyr Ala Leu Arg
1               5                   10                  15
Gln Thr Leu Val Leu Cys Leu Pro Val Ala Val Gly Leu Xaa Xaa Gly
            20                  25                  30
Xaa Leu Xaa Xaa Gly Leu Leu Phe Ser Leu Val Pro Ala Cys Cys Asn
        35                  40                  45
Ile Ala Gly Leu Asp Thr Pro His Lys Arg Phe Phe Lys Arg Leu Ile
    50                  55                  60
Ile Gly Ala Ser Leu Phe Ala Xaa Cys Ser Leu Xaa Thr Gln Leu Leu
65                  70                  75                  80
Leu Ala Xaa Xaa Xaa Pro Leu Pro Xaa Xaa Leu Thr Gly Leu Thr Leu
                85                  90                  95
Val Leu Gly Val Thr Ala Glu Xaa Xaa Pro Leu His Ala Xaa Leu Leu
            100                 105                 110
Pro Ala Ser Leu Xaa Ala Ala Ile Phe Thr Leu Ser Leu Ala Gly Tyr
        115                 120                 125
Met Pro Val Trp Glu Pro Leu Leu Ile Tyr Ala Leu Gly Thr Leu Trp
    130                 135                 140
Tyr Gly Xaa Phe Asn Trp Phe Trp Phe Trp Xaa Trp Arg Glu Gln Pro
145                 150                 155                 160
Leu Arg Glu Ser Leu Ser Leu Leu Tyr Arg Glu Leu Ala Asp Tyr Cys
                165                 170                 175
Glu Ala Lys Tyr Ser Leu Leu Thr Gln His Xaa Asp Pro Glu Lys Ala
            180                 185                 190
Leu Pro Pro Leu Leu Xaa Arg Gln Gln Lys Ala Val Asp Leu Ile Thr
        195                 200                 205
Gln Cys Tyr Gln Gln Met His Met Leu Ser Ala Xaa Asn Asn Xaa Asp
    210                 215                 220
Tyr Lys Arg Xaa Leu Arg Xaa Phe Gln Glu Ala Xaa Asp Leu Gln Glu
225                 230                 235                 240
His Ile Ser Val Ser Leu His Gln pro Glu Glu Val Gln Lys Leu Val
                245                 250                 255
Glu Arg Ser His Ala Glu Glu Val Ile Arg Trp Asn Ala Gln Thr Val
            260                 265                 270
Ala Ala Arg Leu Arg Val Leu Ala Asp Asp Ile Leu Tyr His Arg Leu
        275                 280                 285
Pro Thr Arg Phe Xaa Met Glu Lys Gln Ile Gly Ala Leu Glu Lys Ile
    290                 295                 300
Ala Xaa Gln His Pro Xaa Asn Pro Val Gly Gln Phe Cys Tyr Trp His
305                 310                 315                 320
Phe Ser Arg Ile Ala Arg Val Leu Arg Thr Gln Xaa Pro Leu Tyr Ala
                325                 330                 335
Arg Asp Leu Xaa Ala Asp Lys Gln Arg Arg Xaa Pro Leu Leu Pro Ala
            340                 345                 350
Leu Lys Xaa Tyr Xaa Ser Leu Lys Ser Pro Ala Leu Arg Asn Ala Gly
        355                 360                 365
Arg Xaa Ser Val Met Xaa Ser Xaa Ala Ser Leu Met Gly Xaa Ala Leu
    370                 375                 380
His Leu Pro Lys Xaa Tyr Trp Ile Leu Met Thr Val Leu Xaa Val Thr
385                 390                 395                 400
Gln Asn Gly Tyr Gly Ala Thr Arg Xaa Arg Ile Xaa Xaa Arg Ser Val
                405                 410                 415
Gly Thr Xaa Val Gly Leu Xaa Ile Ala Gly Val Xaa Leu His Xaa Xaa
            420                 425                 430
Ile Pro Glu Gly Xaa Thr Leu Xaa Xaa Met Leu Xaa Xaa Thr Leu Ala
        435                 440                 445
Ser Tyr Leu Ile Xaa Arg Lys Asn Tyr Gly Trp Ala Thr Val Gly Phe
    450                 455                 460
Thr Xaa Thr Ala Val Tyr Thr Xaa Gln Leu Leu Xaa Leu Asn Gly Glu
465                 470                 475                 480
Gln Tyr Xaa Xaa Pro Arg Leu Ile Asp Thr Xaa Ile Gly Cys Leu Ile
                485                 490                 495
Ala Phe Gly Gly Xaa Val Trp Leu Trp Pro Gln Trp Gln Ser Gly Leu
            500                 505                 510
Leu Arg Lys Asn Ala His Asp Ala Leu Glu Ala Xaa Gln Glu Ala Ile
        515                 520                 525
Arg Leu Ile Leu Ser Xaa Asp Pro Gln Xaa Thr Pro Leu Ala Xaa Gln
    530                 535                 540
Arg Met Arg Val Asn Gln Ala His Asn Thr Leu Xaa Asn Ser Leu Asn
545                 550                 555                 560
Gln Ala Met Gln Glu Pro Xaa Phe Asn Xaa His Tyr Leu Xaa Asp Met
                565                 570                 575
Lys Leu Trp Val Thr His Ser Gln Phe Ile Val Glu His Ile Asn Ala
            580                 585                 590
Met Thr Thr Leu Ala Arg Glu His Xaa Xaa Leu Xaa Pro Xaa Leu Ala
        595                 600                 605
Gln Xaa Tyr Leu Xaa Ser Cys Glu Ile Ala Ile Gln Arg Cys Gln Gln
    610                 615                 620
Arg Leu Glu Tyr Asp Xaa Pro Gly Xaa Ser Gly Asp Xaa Asn Ile Xaa
625                 630                 635                 640
Xaa Ala Pro Xaa Met Xaa Pro Xaa Xaa Gly Ala Ala Gly Thr Leu Glu
                645                 650                 655
Gln His Leu Gln Arg Xaa Ile Gly His Leu Asn Thr Met His Thr Ile
            660                 665                 670
Ser Ser Met Ala Trp Arg Gln Arg Pro His His Gly Ile Trp Leu Ser
        675                 680                 685
Xaa Xaa Leu Arg Asp Xaa Lys Xaa
    690                 695