会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 聚合物和橡胶 / 淀粉 / α-淀粉酶变体

α-淀粉酶变体

阅读:100发布:2021-02-23

IPRDB可以提供α-淀粉酶变体专利检索,专利查询,专利分析的服务。并且本发明涉及亲本Termamy1-样α淀粉酶的变体,此变体表现了改变的特性,尤其降低了靠近分支点酶解底物的能力,而且改进了底物特异性和/或改进了相对于亲本α-淀粉酶的比活性。,下面是α-淀粉酶变体专利的具体信息内容。

1.一种亲本Termamyl-样α-淀粉酶的变体,其在选自下组的一或多个位 置处包含改变:W13,G48,T49,S50,Q51,A52,D53,V54,G57,G107, G108,A111,S168,M197,其中(a)所述每一改变是(i)在占据此位置的氨基酸下游插入氨基酸,

(ii)占据此位置的氨基酸的缺失,或

(iii)占据此位置的氨基酸用另一氨基酸取代, (b)所述变体具有α-淀粉酶活性且(c)每一位置对应于具有SEQ ID NO:4之氨 基酸序列的亲本Termamyl-样α-淀粉酶氨基酸序列的位置。

2.权利要求1的变体,其包含一个突变,该突变的位置对应于SEQ ID NO:4中所示氨基酸序列中至少一个下列突变: V54N,A52S,A52S+V54N,T49L,T49+G1 07A,A52S+V54N+T49L+G107A, A52S+V54N+T49L,G107A,Q51R,Q51R+A52S,A52N;或 T49F+G107A,T49V+G107A,T49D+G107A,T49Y+G107A,T49S+G107A, T49N+G107A,T49I+G107A,T49L+A52S+G107A,T49L+A52T+G107A, T49L+A52F+G107A,T49L+A52L+G107A,T49L+A52I+G107A, T49L+A52VG107A;或 T49V,T49I,T49D,T49N,T49S,T49Y,T49F,T49W,T49M,T49E, T49Q,T49K,T49R,A52T,A52L,A52I,A52V,A52M,A52F,A52Y, A52W,V54M,G107V,G107I,G107L,G107C。

3.权利要求1或2的变体,其包含一个突变,该突变的位置对应于SEQ ID NO:4中所示氨基酸序列中的至少一个下列突变:W13F,L,I,V,Y,A;

G48A,V,S,T,I,L;

*48aD或*48aY(即D或Y的插入);

T49X;

*49aX(即任何氨基酸残基的插入);

S50X,尤其D,Y,L,T,V,I;

Q51R,K;

A52X,尤其A52S,N,T,F,L,I,V;

D53E,Q,Y,I,N,S,T,V,L;

V54X,尤其V54I,N,W,Y,F,L;

G57S,A,V,L,I,F,Y,T;

G107X,尤其G107A,V,S,T,I,L,C;

G108X,尤其G108A,V,S,T,I,L;

A111V,I,L;

S168Y;

M197X,尤其Y,F,L,I,T,A,G。

4.权利要求1-3中任一项的变体,其包含下列突变,所述突变对应于 SEQ ID NO:4中所示氨基酸序列中的至少一个下列突变:T49X+A52X+V54N/I/L/Y/F/W+G107A

5.权利要求1-4的变体,其进一步含有G108A。

6.权利要求1-5的变体,其包含下列突变,所述突变对应于SEQ ID NO:4 中所示氨基酸序列中的至少一个下列突变:T49L+G107A;

T49I+G107A;

T49L+G107A+V54I;

T49I+G107A+V54I;

A52S+V54N+T49L+G107A;

A52S+V54I+T49L+G107A;

A52S+T49L+G107A;

A52T+T49L+G107A;

A52S+V54N+T49I+G107A;

A52S+V54I+T49I+G107A;

A52S+T49I+G107A;

T49L+G108A;

T49I+G108A;

T49L+G108A+V54I;

T49I+G108A+V54I

7.权利要求1-6中任一项的变体,其中该变体与亲本α-淀粉酶相比,降 低了在靠近分支点酶解寡糖底物的能力。

8.权利要求1-7中任一项的变体,其还显示了相对于亲本Termamyl-样 α-淀粉酶改进的底物特异性和/或改进的比活性。

9.权利要求1-8中任一项的变体,其中亲本α-淀粉酶是SEQ ID NO:4 和SEQ ID NO:6的杂合型α-淀粉酶。

10.权利要求1-9中任一项的变体,其中亲本杂合型α-淀粉酶是含有 SEQ ID NO:4中所示地衣芽孢杆菌α-淀粉酶的445个C-末端氨基酸残基和 SEQ ID NO:6中所示解淀粉芽孢杆菌α-淀粉酶的37个N-末端氨基酸残基的 杂合型α-淀粉酶。

11.权利要求1-10中任一项的变体,其中亲本杂合型Termamyl-样α-淀 粉酶还含有下列突变:H156Y+A181T+N190F+A209V+Q264S(采用SEQ ID NO:4中的编号)或LE174。

12.权利要求1-11中任一项的变体,其中亲本杂合型Termamyl-样α-淀 粉酶还含有下列突变:H156Y+A181T+N190F+A209V+Q264S+I201F(采用 SEQ IDNO:4中的编号)或LE429。

13.DNA构建体,其含有编码权利要求1-12中任一项之α-淀粉酶变体的 DNA序列。

14.重组表达载体,其携有权利要求13的DNA构建体。

15.用权利要求13的DNA构建体或权利要求14的载体转化的细胞。

16.权利要求9的细胞,它是微生物,具体为细菌或真菌,如革兰氏阳 性细菌如枯草芽孢杆菌,地衣芽孢杆菌,迟缓芽孢杆菌,短芽孢杆菌,嗜热 脂肪芽孢杆菌,嗜碱芽孢杆菌,解淀粉芽孢杆菌,凝结芽孢杆菌,环状芽孢 杆菌,灿烂芽孢杆菌或苏云金芽孢杆菌。

17.一种组合物,其包括:

(i)具有SEQ ID NO:4中所示序列的地衣芽孢杆菌α-淀粉酶,与具有SEQ ID NO:8中所示序列之嗜热脂肪芽孢杆菌α-淀粉酶(作为亲本Termamyl-样α- 淀粉酶)的一或多个如权利要求1-12所述变体的混合物;或(ii)具有SEQ ID NO:8中所示序列的嗜热脂肪芽孢杆菌α-淀粉酶,与衍 生自一或多个其它亲本Termamyl-样α-淀粉酶的一或多个如权利要求1-12所 述变体的混合物;或(iii)具有SEQ ID NO:8中所示序列之嗜热脂肪芽孢杆菌α-淀粉酶(作为亲 本Termamyl-样α-淀粉酶)的一或多个如权利要求1-12所述变体,与衍生自一 或多个其它亲本Termamyl-样α-淀粉酶的一或多个本发明变体的混合物。

18.一种组合物,其包括:

具有SEQ ID NO:8中所示序列之嗜热脂肪芽孢杆菌α-淀粉酶(作为亲本 Termamyl-样α-淀粉酶)的一或多个如权利要求1-12所述变体,与衍生自地衣 芽孢杆菌具有SEQ ID NO:4中所示序列之α-淀粉酶的Termamyl-样α-淀粉酶 的混合物。

19.一种组合物,其包括:

具有SEQ ID NO:8中所示序列之嗜热脂肪芽孢杆菌α-淀粉酶(作为亲本 Termamyl-样α-淀粉酶)的一或多个如权利要求1-12所述变体,与含有SEQ ID NO:6中所示解淀粉芽孢杆菌α-淀粉酶之一部分和SEQ ID NO:4中所示地衣 芽孢杆菌α-淀粉酶之一部分的杂合型α-淀粉酶,的混合物。

20.一种组合物,其包括:

衍生自含有SEQ ID NO:6中所示解淀粉芽孢杆菌α-淀粉酶之一部分和 SEQ ID NO:4中所示地衣芽孢杆菌α-淀粉酶之一部分的杂合型α-淀粉酶(作 为亲本Termamyl-样α-淀粉酶)的一或多个如权利要求1-12所述变体的混合 物。

21.权利要求20的组合物,其中杂合型α-淀粉酶是包含SEQ ID NO:4 中所示地衣芽孢杆菌α-淀粉酶的445个C-末端氨基酸残基和SEQ ID NO:6 中所示解淀粉芽孢杆菌α-淀粉酶的37个N-末端氨基酸残基的杂合型α-淀粉 酶。

22.权利要求21的组合物,其中杂合型α-淀粉酶进一步含有下列突变:H156Y+A181T+N190F+A209V+Q264S(采用SEQ ID NO:4的编号)或 LE174。

23.权利要求21的组合物,其中杂合型α-淀粉酶进一步含有下列突变:如SEQ ID NO:2所示的H156Y+A181T+N190F+A209V+Q264S+I201F 或LE429。

24.一种产生亲本Termamyl-样α-淀粉酶的变体的方法,该变体相对于 所述亲本表现出在靠近分支点酶解底物的能力减小,并且进一步表现出底物 特异性改进和/或比活性改进,该方法包括:(a)对编码亲本Termamyl-样α-淀粉酶的DNA序列进行随机诱变,(b)在宿主细胞中表达步骤(a)所得突变的DNA序列,并且(c)筛选表达突变的α-淀粉酶的细胞,所表达的酶相对于亲本α-淀粉酶提 高了低pH和低钙浓度下的稳定性。

25.权利要求1-12中任一项的α-淀粉酶变体或权利要求17-23中任一项 的组合物的应用,所述应用为用于淀粉液化;用于洗涤剂组合物,如洗衣、 碗碟清洗和硬表面清洗组合物中;用于乙醇生产,如燃料、酒类和工业用乙 醇的生产;用于织物,纤维或衣物的退浆。

说明书全文

                       发明领域

本发明特别涉及亲本Termamyl-样α-淀粉酶的新变体,尤其是显示改变 的特性的变体,具体是改变了酶解模式(相对于亲本),这在此类变体的应用 中,特别是在工业淀粉处理中(例如,淀粉液化或糖化)是有利的。

                       发明背景

α-淀粉酶(α-1,4-葡聚糖-4-葡聚糖水解酶,EC 3.2.1.1)组成催化淀粉和其 它直链及支链1,4-葡糖苷寡糖和多糖水解的一组酶。

有大量的专利和科学文献涉及此类在工业上很重要的酶。许多α-淀粉 酶,例如Termamyl-样α-淀粉酶可从,例如WO 90/11352,WO 95/10603, WO 95/26397,WO 96/23873,WO 96/23874和WO 97/41213中了解。

在最近涉及α-淀粉酶的公开内容中,WO 96/23874提供了名为BA2的 Termamyl-样α-淀粉酶的三维,X-射线晶体结构数据,其由解淀粉芽孢杆菌 α-淀粉酶(包含本文SEQ ID NO:6中所示氨基酸序列)的300个N-末端氨基酸 残基,以及地衣芽孢杆菌α-淀粉酶(包含本文SEQ ID NO:4中所示氨基酸序 列)C-末端的氨基酸301-483(后者可以以商品名TermamylTM买到)组成,它因 此与工业上很重要的芽孢杆菌α-淀粉酶(在本文中包括在术语“Termamyl-样 α-淀粉酶”的意义中,并且尤其包括地衣芽孢杆菌,解淀粉芽孢杆菌,和嗜热 脂肪芽孢杆菌α-淀粉酶)密切相关。WO 96/23874进一步描述了根据对亲本 Termamyl-样α-淀粉酶的结构分析来设计亲本Termamyl-样α-淀粉酶的表现 出特性改变的变体的方法。

WO 96/23874和WO 97/41213(Novo Nordisk)公开了Termamyl-样α-淀 粉酶的一种变体,其酶解模式已发生改变、并包含在本文示于SEQ ID NO:4 的序列中氨基酸残基V54,D53,Y56,Q333,G57和A52的突变。

                      发明简述

本发明涉及Termamyl-样α-淀粉酶的新的α-淀粉分解变体(突变体),尤 其显示出改变的酶解模式(对照于亲本)的变体,所述改变在淀粉工业处理方 面(淀粉的液化,糖化及类似方面)是有利的。

本发明人意外发现一些具有改变的特性的变体,它们与WO 96/23874 和WO 97/41213(Novo Nordisk)中披露的Termamyl-样α-淀粉酶变体(其酶解 模式发生了改变,并包含SEQ ID NO:4中所示氨基酸序列中残基V54,D53, Y45,Q333,G57和A52的突变)相比,特性已改变,尤其改变了酶解模式 —降低了靠近分支点酶解底物的能力,而且进一步改进了底物特异性和/或改 进了比活性。

本发明进一步涉及编码本发明变体的DNA构建体,包含本发明变体的 组合物,制备本发明变体的方法,以及本发明变体和组合物单独或与其它α- 淀粉分解酶联合在各种工业处理过程中的应用,例如,淀粉液化,在洗涤剂 组合物中,例如洗衣,清洗碗碟和硬表面清洗的组合物;乙醇的生产,例如 燃料,酒类和工业乙醇的生产;织物,纤维或衣物的退浆等。

命名法

在本说明和权利要求中,使用传统的一个和三个字母表示氨基酸残基。 为便于引用,本发明的α-淀粉酶变体采用下述的命名法:

原氨基酸:位置:用于取代的氨基酸

根据该命名法,用天冬酰胺取代第30位的丙氨酸被示于:Ala30Asn 或A30N,在相同位置处缺失丙氨酸被示于:Ala30*或A30*,而插入另一个 氨基酸残基,如赖氨酸被示于:Ala30AlaLys或A30AK。缺失连续的一段氨 基酸残基,如氨基酸残基30-33被示于(30-33)*或Δ(A30-N33)。

当特定的α-淀粉酶相对于其它α-淀粉酶而言含有“缺失”,并在该位置 插入某个氨基酸,例如在第36位插入天冬氨酸时,被示于*36Asp或*36D。

多个突变由加号隔开,即:Ala30Asp+Glu34Ser或A30N+E34S分别表 示在第30和34位,丙氨酸和谷氨酸分别用天冬酰胺和丝氨酸取代。多个突 变也可以由下列与加号意义相同的符号隔开:Ala30Asp/Glu34Ser或 A30N/E34S。

当在给定的位置插入一个或多个其它氨基酸残基时,被示于A30N,E或 A30N或A30E。

另外,当本文鉴定出适于修饰的位置,而没有暗示任何具体的修饰时, 应理解为可用任一氨基酸残基取代该位置存在的氨基酸残基。因此,例如, 当提到修饰第30位的丙氨酸,但未具体说明或示于“X”时,应理解为丙氨 酸可缺失,或用任一其它氨基酸,即下列任一氨基酸所取代:R,N,D,C,Q,E, G,H,I,L,K,M,F,P,S,T,W,Y,V。

                     发明详述

Termamyl-样α-淀粉酶

众所周知,通过芽孢杆菌种产生的多种α-淀粉酶在氨基酸水平上高度同 源。例如,已发现含有SEQ ID NO:4中所示氨基酸序列的地衣芽孢杆菌α- 淀粉酶(商品为TermamylTM)与含有SEQ ID NO:5所示氨基酸序列的解淀粉芽 孢杆菌α-淀粉酶约89%同源,与含有SEQ ID NO:3所示氨基酸序列的嗜热脂 肪芽孢杆菌α-淀粉酶约79%同源。其它同源的α-淀粉酶包括衍生自芽孢杆菌 菌种NCIB 12289,NCIB 12512,NCIB 12513或DSM 9375的α-淀粉酶(皆详 细描述于WO 95/26397),和描述于Tsukamoto等,生物化学和生物物理研究 通讯,151(1988),p25-31中的α-淀粉酶。

其它同源的α-淀粉酶包括由EP 0252666所述的地衣芽孢杆菌菌株 (ATCC 27811)所产生的α-淀粉酶,和WO 91/00353和WO 94/18314中鉴定 的α-淀粉酶。其它可商购的Termamyl-样地衣芽孢杆菌α-淀粉酶是 OptithermTM和TakathermTM(可衍生自Solvay),MaxamylTM(可衍生自Gist- brocades/Genencor),Spezym AATM和Spezyme Delta AATM(可衍生自Genencor) 和KeistaseTM(可衍生自Daiwa)。

由于这些α-淀粉酶基本上同源,因此可以认为它们属于同一类α-淀粉 酶,即“Termamyl-样α-淀粉酶”。

因此,在本发明的上下文中,术语“Termamyl-样α-淀粉酶”欲指在氨 基酸水平上与TermamylTM(即具有本文SEQ ID NO:4中所示氨基酸序列的地 衣芽孢杆菌α-淀粉酶)基本上同源的α-淀粉酶。换句话说,Termamyl-样α-淀 粉酶是具有本文SEQ ID NO:2,4,6或8中所示氨基酸序列,和WO 95/26397 或Tsukamoto等,1988的SEQ ID NO:1或2所示氨基酸序列的α-淀粉酶,或 者,Termamyl-样α-淀粉酶是:i)与至少一个上述氨基酸序列的同源性至少为 60%,优选至少为70%,更优选至少为75%,甚至更优选至少为80%,尤其 是至少为85%,尤其优选至少为90%,尤其是至少为95%,甚至尤其更优选 至少为97%,尤其是至少为99%的α-淀粉酶,和/或ii)能与针对一种或多种 所述α-淀粉酶产生的抗体发生免疫交叉反应的α-淀粉酶,和/或iii)由能与编 码上述-特定α-淀粉酶的DNA序列杂交的DNA序列编码的α-淀粉酶,所述 特定α-淀粉酶的DNA序列分别示于本申请的SEQ ID NO:1,3,5和7,以及 WO 95/26397的SEQ ID NO:4。

关于特性i),可利用任何常规的算法测定“同源性”(同一性),优选使 用GCG程序包第7.3版(1993年6月)的缺口程序,该程序使用缺口得分的缺 省值,即缺口产生得分为3.0,缺口延伸得分为0.1(遗传学计算机组(1991)GCG 软件包程序手册,第7版,575 Science Drive,Madison,Wisconsin,美国53711)。

可使用Termamyl和Termamyl-样α-淀粉酶之间的结构对比来鉴定其它 Termamyl-样α-淀粉酶中等同的/相应的位置。得到所述结构对比的一个方法 是使用GCG程序包中的Pile Up程序,该程序使用缺省的缺口得分值,即缺 口产生得分为3.0,缺口延伸得分为0.1。其它结构对比方法包括疏水簇分析 (Gaboriaud等,(1987),FEBS LETTERS 224,p.149-155)和反向穿梭(threading) 法(Huber,T;Torda,AE,蛋白质科学,卷7,1期,142-149(1998))。α-淀粉酶 的特性ii),即免疫交叉反应性可利用针对或与相关Termamyl-样α-淀粉酶的 的至少一个表位反应的抗体进行分析。所述抗体(为单克隆或多克隆形式)可 用本领域已知方法得到,如Hudson等,免疫学实践(Practical Immunology), 第三版(1989),Blackwell Scientific Publications所述。免疫交叉反应性可利用 本领域已知试验来测定,如Western印迹或放射性免疫扩散试验,如Hudson 等,1989所述。在这方面,在分别含有氨基酸序列SEQ ID NOS:2,4,6, 或8的α-淀粉酶间发现了免疫交叉反应性。

可以在所述α-淀粉酶的完整或部分核苷酸或氨基酸序列的基础上适当 制备寡核苷酸探针,然后使用所述探针,根据上述特性iii)鉴定Termamyl- 样α-淀粉酶。

检测杂交的适当条件包括:在5×SSC中预浸泡,于~40℃,在20%甲酰 胺,5×Denhardt’s溶液,50mM磷酸钠,pH6.8和50mg变性的经超声处理的 小牛胸腺DNA中预杂交1小时,接着于~40℃,在添加有100mMATP的相 同溶液中杂交18小时,接着于40℃,用2×SSC,0.2%SDS将滤膜洗涤3次, 每次30分钟(低严紧性),优选在50℃(中度严紧性),更优选在65℃(高严紧 性),甚至更优选在~75℃(很高的严紧性)进行洗涤。有关杂交方法的更多细 节描述于Sambrook等,分子克隆:实验室手册,第2版,冷泉港,1989。

在本发明的上下文中,“衍生自”不仅仅表示由所述生物体产生或可由 所述生物体产生的α-淀粉酶,还指由分离自所述菌株的DNA序列编码的α- 淀粉酶,和由所述DNA序列转化的宿主生物体产生的α-淀粉酶。最后,该 术语还表示由合成的和/或cDNA来源的DNA序列编码的,并具有所述α-淀 粉酶的鉴定特征的α-淀粉酶。该术语还表示亲本α-淀粉酶可以是天然α-淀粉 酶的变体,即修饰(插入,取代,缺失)天然α-淀粉酶的一个或多个氨基酸残 基而得到的变体。

亲本杂合型α-淀粉酶

亲本α-淀粉酶可以是杂合型α-淀粉酶,即含有衍生自至少两种α-淀粉酶 的部分氨基酸序列组合的α-淀粉酶。

亲本杂合型α-淀粉酶可以是在氨基酸同源性和/或免疫交叉-反应性和/ 或DNA杂交(如上所述)的基础上被确定为属于Termamyl-样α-淀粉酶家族的 杂合型α-淀粉酶。此时,杂合型α-淀粉酶一般由Termamyl-样α-淀粉酶的至 少一个部分和一种或多种其它α-淀粉酶的部分组成,所述其它α-淀粉酶选自 微生物(细菌或真菌)和/或哺乳动物来源的Termamyl-样α-淀粉酶或非- Termamyl-样α-淀粉酶。

因此,亲本杂合型α-淀粉酶可含有衍生自至少两种Termamyl-样α-淀粉 酶,或衍生自至少一种Termamyl-样和至少一种非-Termamyl-样细菌α-淀粉 酶,或衍生自至少一种Termamyl-样和至少一种真菌α-淀粉酶的部分氨基酸 序列组合。衍生得到部分氨基酸序列的Termamyl-样α-淀粉酶可以是例如本 文所述的任何特定的Termamyl-样α-淀粉酶。

例如,亲本α-淀粉酶可含有衍生自地衣芽孢杆菌菌株的α-淀粉酶的C- 末端部分,和衍生自解淀粉芽孢杆菌菌株或嗜热脂肪芽孢杆菌菌株的α-淀粉 酶的N-末端部分。例如,亲本α-淀粉酶可含有地衣芽孢杆菌α-淀粉酶C-末 端部分的至少430个氨基酸残基,也可含有如SEQ ID NO:6中所示解淀粉芽 孢杆菌α-淀粉酶的37个N端氨基酸残基的对应氨基酸片段及如SEQ ID NO:4中所示地衣芽孢杆菌α-淀粉酶的445个C端氨基酸残基的对应氨基酸 片段,或b)对应于嗜热脂肪芽孢杆菌α-淀粉酶(具有SEQ ID NO:8中所示氨 基酸序列)的68个N-末端氨基酸残基的氨基酸区段,和对应于地衣芽孢杆菌 α-淀粉酶(具有SEQ ID NO:4中所示氨基酸序列)的415个C-末端氨基酸残基 的氨基酸区段。

在一优选实施方案中,亲本Termamyl-样α-淀粉酶是与SEQ ID NO:4中 所示地衣芽孢杆菌α-淀粉酶相同的杂合型Termamyl-样α-淀粉酶,不同在 于:(成熟蛋白质)N-末端的35个氨基酸残基被SEQ ID NO:6中所示解淀粉芽 孢杆菌α-淀粉酶(BAN)的成熟蛋白N-末端的33个氨基酸残基所取代。该杂 合型可以进一步含有下列突变:H156Y+A181T+N190F+A209V+Q264S(使用 SEQ ID NO:4的编号),指LE174。

另一优选的亲本杂合型α-淀粉酶是SEQ ID NO:6中所示的LE429。

非-Termamyl-样α-淀粉酶可以是例如真菌α-淀粉酶,哺乳动物或植物α- 淀粉酶或细菌α-淀粉酶(不同于Termamyl-样α-淀粉酶)。这种α-淀粉酶的具体 例子包括米曲霉TAKAα-淀粉酶,黑曲霉酸性α-淀粉酶,枯草芽孢杆菌α- 淀粉酶,猪胰腺α-淀粉酶和大麦α-淀粉酶。所有这些α-淀粉酶都具有已阐明 的,与本文所述典型Termamyl-样α-淀粉酶的结构显著不同的结构。

上述真菌α-淀粉酶,即得自黑曲霉和米曲霉的α-淀粉酶在氨基酸水平上 高度同源,一般认为它们属于相同的α-淀粉酶家族。得自米曲霉的真菌α-淀 粉酶可以商购,其商品名为FungamylTM。

另外,当提及Termamyl-样α-淀粉酶的特定变体(本发明的变体)时,提 到该变体是通过常规方法,修饰(例如缺失或取代)特定Termamyl-样α-淀粉酶 氨基酸序列中的特定氨基酸残基而获得的,应理解在另一个Termamyl-样α- 淀粉酶的等同位置(由各个氨基酸序列之间最有可能的氨基酸序列对比测定) 修饰得到的变体也包括在本发明的范围内。

本发明变体的优选实施方案是得自地衣芽孢杆菌α-淀粉酶(作为亲代 Termamyl-样α-淀粉酶)的变体,例如,上述α-淀粉酶中的一个,如具有SEQ ID NO:4中所示氨基酸序列的地衣芽孢杆菌α-淀粉酶的变体。

本发明变体的构建

可通过在适于生产变体的条件下,培养含有编码所述变体之DNA序列 的微生物来实现目标变体的构建。所述变体可随后从得到的培养液中回收。 这进一步详述于下。

改变的性质

下面讨论突变(本发明变体中出现的)及其导致的所需性质改变(相对于 亲本Termamyl-样α-淀粉酶)的关系。

本发明第一方面涉及亲本Termamyl-样α-淀粉酶变体,其在选自下组的 一或多个位置上包含改变:

W13,G48,T49,S50,Q51,A52,D53,V54,G57,G107,G108, A111,S168,M197,其中(a)所述每一改变是

(i)在占据此位置的氨基酸下游插入氨基酸,

(ii)占据此位置的氨基酸的缺失,或

(iii)占据此位置的氨基酸用另一氨基酸取代,

(b)所述变体具有α-淀粉酶活性且(c)每一位置对应于具有SEQ ID NO:4 之氨基酸序列的亲本Termamyl-样α-淀粉酶氨基酸序列的位置。

在优选实施方案中本发明上述变体包含一个突变,其位置对应于SEQ ID NO:4中所示氨基酸序列中的至少一个下列突变: V54N,A52S,A52S+V54N,T49L,T49+G107A,A52S+V54N+T49L+G107A, A52S+V54N+T49L,G107A,Q51R,Q51R+A52S,A52N;或 T49F+G107A,T49V+G107A,T49D+G107A,T49Y+G107A,T49S+G107A, T49N+G107A,T49I+G107A,T49L+A52S+G107A,T49L+A52T+G107A, T49L+A52F+G107A,T49L+A52L+G107A,T49L+A52I+G107A,T49L+A52V +G107A;或 T49V,T49I,T49D,T49N,T49S,T49Y,T49F,T49W,T49M,T49E, T49Q,T49K,T49R,A52T,A52L,A52I,A52V,A52M,A52F,A52Y, A52W,V54M,G107V,G107I,G107L,G107C。

在优选实施方案中,本发明变体在对应于SEQ ID NO:4中所示氨基酸序 列中的下列突变的位置包含至少一个突变:

W13F,L,I,V,Y,A;

G48A,V,S,T,I,L;

*48aD或*48aY(即D或Y的插入);

T49X;

*49aX(即任一可能的氨基酸残基的插入)

S50X,尤其D,Y,L,T,V,I;

Q51R,K;

A52X,尤其A52S,N,T,F,L,I,V;

D53E,Q,Y,I,N,S,T,V,L;

V54X,尤其V54I,N,W,Y,F,L;

G57S,A,V,L,I,F,Y,T;

G107X,尤其G107A,V,S,T,I,L,C;

G108X,尤其G108A,V,S,T,I,L;

A111V,I,L;

S168Y;

M197X,尤其Y,F,L,I,T,A,G。

在优选实施方案中,本发明变体包含SEQ ID NO:4所示氨基酸序列中下 列位置的突变:T49X+A52X+V54N/I/L/Y/F/W+G107A,并且可以进一步包 含G108A。

在优选实施方案中,本发明变体在SEQ ID NO:4所示氨基酸序列中的下 列位置包含至少一个突变:

T49L+G107A;

T49I+G107A;

T49L+G107A+V54I;

T49I+G107A+V54I;

A52S+V54N+T49L+G107A;

A52S+V54I+T49L+G107A;

A52S+T49L+G107A;

A52T+T49L+G107A;

A52S+V54N+T49I+G107A;

A52S+V54I+T49I+G107A;

A52S+T49I+G107A;

T49L+G108A;

T49I+G108A;

T49L+G108A+V54I;

T49I+G108A+V54I;

所有上述本发明变体相对于亲本α-淀粉酶具有改变了的特性(意指提高 或降低的性质),具体为至少一个下列性质:降低了接近分支点酶解底物的能 力,提高了底物特异性和/或提高了比活性,改变了底物结合,改变了热稳定 性,改变了pH/活性关系(profile),改变了pH/稳定性关系,改变了对氧化作 用的稳定性,改变了Ca2+倚赖性。

稳定性

在本发明内容中,在极低pH(即pH4-6)下获得改变的稳定性,具体如改 进的稳定性(即更高或更低),的重要突变(包括氨基酸取代和/或缺失),包括 列于上面“改变的特性”部分中的任一突变和下面提到的变体。

以下变体:Q360A,K;N102A,N326A,L,N190G,N190K;Y262A, K,E(采用BAN,即,SEQ ID N:6,编号)也进行pH稳定性测试。优选的 亲本α-淀粉酶可以是上述的BA2。按照“材料与方法”部分所述测定pH稳 定性。

Ca2+稳定性

改变的Ca2+稳定性意味着在Ca2+耗尽(depletion)的情况下改善了酶稳定 性,即提高或降低了稳定性。在本发明内容中,在极低pH(即pH4-6)下获得 改变的稳定性,具体如改进的稳定性(即更高或更低),的重要突变(包括氨基 酸取代),包括列于上面“改变的特性”部分中的任一突变。

比活性

在本发明另一方面,能获得比活性已改变的变体的重要突变,尤其在 60-100℃,优选70-95℃,特别是80-90℃提高或降低了比活性的突变,包括 列于上文“改变的特性”部分中的任一突变。

用“材料和方法”部分中所述Phadebas方法鉴定LE174和LE429的比 活性为16,000NU/mg。

改变的酶解模式

在淀粉液化过程中优选使用一种能将淀粉分子为降解长型带支链的寡 糖的α-淀粉酶,而不优选使用产生较短的带支链寡糖的α-淀粉酶(如传统的 Termamyl-样α-淀粉酶)。短型带支链的寡糖(潘糖前体)不能被液化过程中α- 淀粉酶处理后使用,或与糖化淀粉葡萄糖苷酶(葡糖淀粉酶)同时使用,或在 添加糖化淀粉葡萄糖苷酶(葡糖淀粉酶)之前使用的支链淀粉酶充分水解。故 在存在潘糖前体的情况下,葡糖淀粉酶处理后的产物混合物中含有很大比例 的短型带支链的所谓极限糊精,即三糖潘糖。潘糖的存在极大地降低了糖化 产率,这是不希望得到的。

以前有报道(US专利5,234,823),当用葡糖淀粉酶和支链淀粉酶进行糖 化时,如果不在糖化前使来自于液化步骤的残余α-淀粉酶失活,其活性的存 在能导致葡萄糖产量降低。典型的失活方法可以是在降低温度到60℃以进行 糖化之前,于95℃调pH到4.7以下。

这种处理对葡萄糖生产之负影响的原因还不完全清楚,但是设想液化所 用α-淀粉酶(例如地衣芽孢杆菌的Termamyl 120 L)通过水解支链淀粉中靠近 和位于分支点两侧的1,4-α-糖苷键而产生“极限糊精”(它们是支链淀粉酶较 难处理的底物)。葡糖淀粉酶对这些极限糊精的水解导致三糖潘糖的积累,而 此糖只能被葡糖淀粉酶缓慢水解。

能避免该缺陷的热稳定性α-淀粉酶的开发是一大进步,因为无需单独进 行失活步骤。

因此,本发明的目标就是得到突变的α-淀粉酶,它具有适当修饰的淀粉 降解特性但保留了亲本Termamyl-样α-淀粉酶的热稳定性。

相应地,本发明涉及Termamyl-样α-淀粉酶变体,其降低了靠近分支点 酶解底物的能力,并且进一步改进了底物特异性和/或比活性。

特定的目的是一种变体,它酶解支链淀粉底物,是从缩短的末端进行, 距分支点一个以上葡萄糖单位,优选两或三个以上葡萄糖单位,即比由野生 型地衣芽孢杆菌α-淀粉酶得到的距分支点更远的位置。

在此可以提及,依照WO 96/23874,预计包含至少一个下列突变的变体 能阻止靠近分支点的酶解:

V54L,I,F,Y,W,R,K,H,E,Q;

D53L,I,F,Y,W;

Y56W;

Q333W;

G57,所有可能的氨基酸残基;

A52,大于A的氨基酸残基,A52W,Y,L,F,I。

与获得本发明变体有关的目标突变包括SEQ ID NO:4所示地衣芽孢杆 菌α-淀粉酶中下列位置上的突变,其中所述变体降低了靠近分支点酶解底物 的能力,并进一步改进了底物特异性和/或比活性:H156,A181,N190,A209, Q264和I201

应该强调的是,不但可以采用下面特别提及的Termamyl-样α-淀粉酶, 而且也可以采用其它市售的Termamyl-样α-淀粉酶。下面所列并非这样的α- 淀粉酶的全部:产自EP 0252666中所述地衣芽孢杆菌(ATCC 27811)的α-淀 粉酶,在WO 91/00353和WO 94/18314中鉴定的α-淀粉酶。其它市售的地 衣芽孢杆菌Termamyl-样α-淀粉酶是OptithermTM和TakathermTM(从Solvay可 得),Maxamyl(从Gistbrocades/Genencor可得),Spezym AATM Spezyme Delta AATM(从Genencor可得),和KeistaseTM(从Daiwa可得)。

所有Termamyl-样α-淀粉酶都适合用作制备本发明变体的骨架。

在本发明优选的实施方案中,亲本Termamyl-样α-淀粉酶是SEQ ID NO:4和SEQ ID NO:6的杂合型α-淀粉酶。特别地,亲本杂合型Termamyl- 样α-淀粉酶可以是这样的杂合型α-淀粉酶,其包含示于SEQ ID NO:4的地衣 芽孢杆菌α-淀粉酶的445个C-末端氨基酸残基和衍生自解淀粉芽孢杆菌示于 SEQ ID NO:6的成熟α-淀粉酶的37个N-末端残基,它可以进一步有下列突 变:H156Y+A181T+N190F+A209V+Q264S(SEQ ID NO:4的编号)。此杂合型 称为LE174。LE174杂合型可与另一突变I201F组合而形成具有如下突变 H156Y+A181T+N190F+A209V+Q264S+I201F(SEQ ID NO:4的编号)的亲本 Termamyl-样α-淀粉酶。此杂合型变体示于SEQ ID NO:2且用在下面的例子 中,称作LE429。

同样,LE174或LE429(SEQ ID NO:2)或SEQ ID NO:4中所示的包含一 或多个下列突变的地衣芽孢杆菌α-淀粉酶可以用作骨架(采用SEQ ID NO:4 的编号给突变编号):

E119C;

S130C;

D124C;

R127C;

A52所有可能的氨基酸残基;

S85所有可能的氨基酸残基;

N96所有可能的氨基酸残基;

V129所有可能的氨基酸残基;

A269所有可能的氨基酸残基;

A378所有可能的氨基酸残基;

S148所有可能的氨基酸残基,尤其S148N;

E211所有可能的氨基酸残基,尤其E211Q;

N188所有可能的氨基酸残基,尤其N188S,N188P;

M197所有可能的氨基酸残基,尤其M197T,M197A,M197G,M197I, M197L,M197Y,M197F,M197I;

W138所有可能的氨基酸残基,尤其W138Y;

D207所有可能的氨基酸残基,尤其D207Y;

H133所有可能的氨基酸残基,尤其H133Y;

H205所有可能的氨基酸残基,尤其H205H,H205C,H205R;

S187所有可能的氨基酸残基,尤其S187D;

A210所有可能的氨基酸残基,尤其A210S,A210T;

H405所有可能的氨基酸残基,尤其H405D;

K176所有可能的氨基酸残基,尤其K176R;

F279所有可能的氨基酸残基,尤其F279Y;

Q298所有可能的氨基酸残基,尤其Q298H;

G299所有可能的氨基酸残基,尤其G299R;

L308所有可能的氨基酸残基,尤其L308F;

T412所有可能的氨基酸残基,尤其T412A;

此外,SEQ ID NO:4中所示、含至少一个下列突变的地衣芽孢杆菌α- 淀粉酶可用作骨架:

M15所有可能的氨基酸残基;

A33所有可能的氨基酸残基;

当通过组合LE174与突变I201F(SEQ ID NO:4编号)而利用LE429(SEQ ID NO:2中所示)作骨架(即,作为亲本Termamyl-样α-淀粉酶),可根据本发 明在一或多个下列位置产生,突变/改变,尤其取代,缺失和插入,以降低靠 近分支点酶解底物的能力,改进底物特异性和/或比活性:W13,G48,T49, S50,Q51,A52,D53,V54,G57,G107,G108,A111,S168,M197(采 用SEQ ID NO:4编号)

其中(a)所述每一改变是

(i)在占据此位置的氨基酸下游插入氨基酸,

(ii)占据此位置的氨基酸的缺失,或

(iii)占据此位置的氨基酸用另一氨基酸取代,

(b)所述变体具有α-淀粉酶活性且(c)每一位置对应于具有SEQ ID NO:4 之氨基酸序列的亲本Termamyl-样α-淀粉酶氨基酸序列的位置。

在优选实施方案中本发明的变体包含至少一个突变,其位置对应于下列 突变(在示于SEQ ID NO:4的氨基酸序列中的): V54N,A52S,A52S+V54N,T49L,T49+G107A,A52S+V54N+T49L+G107A, A52S+V54N+T49L,G107A,Q51R,Q51R+A52S,A52N;或 T49F+G107A,T49V+G107A,T49D+G107A,T49Y+G107A,T49S+G107A, T49N+G107A,T49I+G107A,T49L+A52S+G107A,T49L+A52T+G107A, T49L+A52F+G107A,T49L+A52L+G107A,T49L+A52I+G107A, T49L+A52V+G107A;或 T49V,T49I,T49D,T49N,T49S,T49Y,T49F,T49W,T49M,T49E, T49Q,T49K,T49R,A52T,A52L,A52I,A52V,A52M,A52F,A52Y, A52W,V54M,G107V,G07I,G107L,G107C。

在优选实施方案中,本发明变体在对应于SEQ ID NO:4中所示氨基酸序 列的下列突变的位置包含至少一个突变:

W13F,L,I,V,Y,A;

G48A,V,S,T,I,L;

*48aD或*48aY(即D或Y的插入);

T49X;

*49aX(即任一氨基酸残基的插入)

S50X,尤其D,Y,L,T,V,I;

Q51R,K;

A52X,尤其A52S,N,T,F,L,I,V;

D53E,Q,Y,I,N,S,T,V,L;

V54X,尤其V54I,N,W,Y,F,L;

G57S,A,V,L,I,F,Y,T;

G107X,尤其G107A,V,S,T,I,L,C;

G108X,尤其G108A,V,S,T,I,L;

A111V,I,L;

S168Y;

M197X,尤其Y,F,L,I,T,A,G。

在优选实施方案中,本发明变体包含至少一个下列突变,其位置对应于 SEQ ID NO:4中所示氨基酸序列中的下列突变:T49X+A52X+V54N/I/L/Y/F/ W+G107A,并且可以进一步包含G108A。

在优选实施方案中,本发明变体包含至少一个突变,其位置对应于下列 突变(在示于SEQ ID NO:4的氨基酸序列中):

T49L+G107A;

T49I+G107A;

T49L+G107A+V54I;

T49I+G107A+V54I;

A52S+V54N+T49L+G107A;

A52S+V54I+T49L+G107A;

A52S+T49L+G107A;

A52T+T49L+G107A;

A52S+V54N+T49I+G107A;

A52S+V54I+T49I+G107A;

A52S+T49I+G107A;

T49L+G108A;

T49I+G108A;

T49L+G108A+V54I;

T49I+G108A+V54I;

本发明变体中的一般突变

优选本发明的变体除了含有上述变化外,还含有一个或多个修饰。因 此,经修饰的α-淀粉酶变体中一个或多个脯氨酸残基被非脯氨酸残基取代较 为有利,所述非脯氨酸残基可以是任何可能的天然非脯氨酸残基,优选为丙 氨酸,甘氨酸,丝氨酸,苏氨酸,缬氨酸或亮氨酸。

类似地,优选亲代α-淀粉酶被修饰的氨基酸残基中存在的一个或多个半 胱氨酸残基被非半胱氨酸残基取代,所述非半胱氨酸残基可以是例如丝氨 酸,丙氨酸,苏氨酸,甘氨酸,缬氨酸或亮氨酸。

另外,本发明的变体可以(作为唯一的修饰或与上述任何修饰联合)被修 饰,以使对应于SEQ ID NO:4中185-209的氨基酸片段中存在的一个或多个 Asp和/或Glu分别被Asn和/或Gln取代。另外,用Arg取代对应于SEQ ID NO:4中185-209的氨基酸片段中存在的一个或多个Lys残基也很有意义。

应理解本发明包含掺入了两个或多个上述修饰的变体。

另外,在本文所述的任何变体中导入点突变较为有利。

制备α-淀粉酶的方法

将突变引入基因的多种方法为本领域所知。在对编码α-淀粉酶的DNA 序列的克隆进行简要讨论后,以下讨论在α-淀粉酶编码序列内的特定位点产 生突变的方法。

克隆编码本发明α-淀粉酶的DNA序列

可使用本领域众所周知的多种方法,从产生所述α-淀粉酶的任何细胞或 微生物中分离出编码亲代α-淀粉酶的DNA序列。首先,应使用源自产生待 研究之α-淀粉酶的生物的染色体DNA或信使RNA构建基因组DNA和/或 cDNA文库。然后,如果α-淀粉酶的氨基酸序列是已知的,可合成同源的经 标记的寡核苷酸探针,使用该探针从生产自所述生物的基因组文库中鉴定编 码α-淀粉酶的克隆。或者,将含有与已知α-淀粉酶基因同源之序列的经标记 的寡核苷酸探针用作探针,使用较低严紧度的杂交和洗涤条件鉴定编码α-淀 粉酶的克隆。

另一种鉴定编码α-淀粉酶的克隆的方法包括:将基因组DNA片段插入 表达载体,如质粒,用所得基因组DNA文库转化α-淀粉酶-阴性细菌,然后 将经转化的细菌铺于含有α-淀粉酶底物的琼脂上,从而鉴定出表达α-淀粉酶 的克隆。

或者,可通过已建立的标准方法合成生产编码酶的DNA序列,所述方 法例如S.L.Beaucage和M.H.Camthers(1981)所述的膦酰胺法或Matthes等 (1984)所述的方法。在膦酰胺法中,可在例如自动化的DNA合成仅中合成寡 核苷酸,对其进行纯化,退火,再连接并克隆至适当的载体。

最终,DNA序列可以是根据标准技术,通过连接合成的,基因组的或 cDNA来源的片段(适当时是对应于完整DNA序列的多个部分的片段)而生产 的混合的基因组和合成来源,混合的合成和cDNA来源或混合的基因组和 cDNA来源的DNA序列。也可以使用特定的引物,如US 4,683,202或R.K. Saiki等(1988)所述的引物经聚合酶链反应(PCR)生产DNA序列。

定点诱变

一旦分离出编码α-淀粉酶的DNA序列,并鉴定出合乎需要的突变位 点,可使用合成的寡核苷酸导入突变。这些寡核苷酸含有侧翼于所需突变位 点的核苷酸序列;在合成寡核苷酸的过程中插入突变的核苷酸。在特定的方 法中,在携有α-淀粉酶基因的载体中产生桥连α-淀粉酶-编码序列的单链 DNA缺口。然后,使携有所需突变的合成核苷酸与该单链DNA的同源部分 退火。然后用DNA聚合酶I(Klenow片段)补平其余缺口,使用T4连接酶连 接构建体。该方法的特例描述于Morinaga等(1984)。US 4,760,025公开了通 过对盒进行微小的改变而导入编码多个突变的寡核苷酸。然而,由于 Morinaga法可以导入多种长度的多个寡核苷酸,因此可在任何一次导入甚至 更多个突变。

Nelson和Long(1989)描述了另一种将突变导入编码α-淀粉酶的DNA序 列的方法。所述方法包括以3个步骤产生含有所需突变的PCR片段,所述突 变是通过使用化学合成的DNA链作为PCR反应的一个引物而导入的。通过 用限制性内切核酸酶裂解,可从PCR-产生的片段中分离出携有突变的DNA 片段,并将该片段重新插入表达质粒。

随机诱变

可在翻译成本文所示氨基酸序列的基因的至少3个部分中,或在整个基 因内适当地进行随机诱变,所述诱变可以是定域的或区域-特异性的随机诱 变。

利用本领域已知的任何方法,可以方便地对编码亲代α-淀粉酶的DNA 序列进行随机诱变。

关于上文,本发明的另一方面涉及产生亲代α-淀粉酶的变体的方法,例 如,其中变体相对于亲代而言,表现出经改变的或增加的热稳定性,所述方 法包括:

(a)对编码亲代α-淀粉酶的DNA序列进行随机诱变,

(b)在宿主细胞中表达步骤(a)中得到的突变DNA序列,和

(c)筛选表达α-淀粉酶变体的宿主细胞,所述变体相对于亲代α-淀粉酶而 言具有经改变的特性(如热稳定性)。

优选使用添加引物进行本发明上述方法中的步骤(a)。

例如,可使用适当的物理或化学诱变剂,使用适当的寡核苷酸,或通过 对DNA序列进行PCR以产生诱变来进行随机诱变。另外,可使用这些诱变 剂的任何组合进行随机诱变。诱变剂可以是例如诱导碱基转换,颠换,倒位, 倒频,缺失和/或插入的试剂。

适用于本发明目的的物理或化学诱变剂的例子包括紫外线(UV)照射,羟 胺,N-甲基-N’-硝基-N-亚硝基胍(MNNG),邻甲基羟胺,亚硝酸,乙基甲 磺酸(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。当使用这些诱变剂时,一 般通过在适于发生诱变的条件下,在选定诱变剂的存在下保温待诱变的编码 亲代酶的DNA序列来进行诱变,然后筛选具有所需特性的突变DNA。

当利用寡核苷酸进行诱变时,在合成待改变位置处的寡核苷酸的过程 中,可同时添加寡核苷酸和3个非-亲代核苷酸。添加的目的是避免不必要氨 基酸的密码子。可通过任何公开的技术如使用PCR,LCR或适当时使用任何 DNA聚合酶和连接酶,将添加的寡核苷酸掺入编码α-淀粉酶的DNA。

优选使用“恒随机的添加”进行添加,其中各个位置的野生型和突变的 百分比是预先确定好的。另外,添加可以导致优先导入某些核苷酸,从而优 先导入一个或多个特定的氨基酸残基。例如,进行添加后可在每个位置导入 90%野生型和10%突变。选择添加方案的其它考虑基于遗传学以及蛋白质- 结构的限制。可使用DOPE程序(见“材料和方法”部分)制订添加方案,所 述程序可特别地确保不导入终止密码子。

当使用PCR-产生的诱变时,可在增加核苷酸错误掺入的条件下,对经 化学处理或未经处理的编码亲代α-淀粉酶的基因进行PCR(Deshler 1992; Leung等,技术,Vol.1,1989,pp.11-15)。

可使用大肠杆菌(Fowler等,Molec.Gen.Genet.,133,1974,pp.179-191), 酿酒酵母或任何其它微生物的增变株对编码α-淀粉酶的DNA进行随机诱 变,诱变方法包括例如:将含有亲代糖基酶的质粒转化至增变株,培养含有 质粒的增变株,从增变株中分离突变的质粒。随后,将突变的质粒转化至表 达生物。

待诱变的DNA序列可以方便地存在于基因组或cDNA文库中,所述文 库生产自表达亲代α-淀粉酶的生物。或者,DNA序列可以存在于适当的载 体,如质粒或噬菌体上,再与诱变剂一起保温或要不然暴露于诱变剂中。待 诱变的DNA也可存在于宿主细胞中,或者整合于所述细胞的基因组中,或 者存在于细胞所携带的载体上。最后,待诱变的DNA也可以是分离的形式。 应理解接受随机诱变的DNA序列优选为cDNA或基因组DNA序列。

在某些情况下可于实施表达步骤b)或筛选步骤c)前方便地扩增突变的 DNA序列。可根据本领域已知的方法进行扩增,本发明优选的方法是:使用 根据亲代酶的DNA或氨基酸序列生产的寡核苷酸引物进行PCR扩增。

与诱变剂保温或暴露于诱变剂之后,通过在允许发生表达的条件下培养 携有突变DNA序列的适当宿主细胞来表达突变的DNA。用于此目的的宿主 细胞可以是被突变的DNA序列(任选其存在于载体上)转化的宿主细胞,或者 是在诱变处理的过程中携有编码亲代酶的DNA序列的宿主细胞。适当宿主 细胞的例子如下:革兰氏阳性细菌,如枯草芽孢杆菌,地衣芽孢杆菌,迟缓 芽孢杆菌,短芽孢杆菌,嗜热脂肪芽孢杆菌,嗜碱芽孢杆菌,解淀粉芽孢杆 菌,凝结芽孢杆菌,环状芽孢杆菌,灿烂芽孢杆菌,巨大芽孢杆菌,苏云金 芽孢杆菌,浅青紫链霉菌或鼠灰链霉菌;和革兰氏阴性细菌,如大肠杆菌。

突变的DNA序列可进一步含有能使突变的DNA序列表达的DNA序 列。

定域随机诱变

随机诱变可有利地定域于所述亲代α-淀粉酶的一部分。例如,当酶的某 些区域被鉴定为对酶的给定特性特别重要时,以及当预期修饰能导致具有改 良特性的变体时,定域随机诱变较为有利。当亲代酶的三级结构已被阐明, 且所述结构与酶的功能相关时,一般可鉴定出所述区域。

通过使用上述的PCR产生的诱变技术或本领域已知的任何其它适当的 技术,可以方便地进行定域的或区域-特异性的随机诱变。或者,通过例如插 入适当的载体来分离编码待修饰的DNA序列部分的DNA序列,随后可使用 上述任何诱变方法对所述部分进行诱变。

提供α-淀粉酶变体的其它方法

提供α-淀粉酶变体的其它方法包括本领域已知的基因改组方法,所述方 法包括例如WO 95/22625(Affymax Technologies N.V.)和WO 96/00343(Novo Nordisk A/S)所述的方法。

本发明α-淀粉酶变体的表达

根据本发明,可使用表达载体,以酶的形式表达通过上述方法,或通过 本领域已知的任何其它方法产生的编码变体的DNA序列,所述表达载体一 般包括编码启动子,操纵子,核糖体结合位点,翻译起始信号的控制序列, 并任选包括阻抑基因或多种激活基因。

携有编码本发明α-淀粉酶变体的DNA序列的重组表达载体可以是能对 其方便地进行重组DNA操作的任何载体,载体的选择经常取决于导入该载 体的宿主细胞。因此,载体可以是自我复制的载体,即作为染色体外实体存 在的载体,所述载体的复制独立于染色体的复制,所述载体包括例如质粒, 噬菌体或染色体外元件,微型染色体或人工染色体。或者,载体可以是当导 入宿主细胞时可以整合至宿主细胞基因组,并与整合了该载体的染色体一起 复制的载体。

在载体中,DNA序列应该与适当的启动子序列可操作相连。启动子可 以是在选定宿主细胞中显示出转录活性的任何DNA序列,启动子可以得自 编码与宿主细胞同源或异源之蛋白质的基因。介导编码本发明α-淀粉酶变体 之DNA序列转录,尤其是在细菌宿主中的转录的适当启动子的例子是:大 肠杆菌lac操纵子的启动子,天蓝色链霉菌琼脂酶基因dagA启动子,地衣芽 孢杆菌α-淀粉酶基因(amyL)启动子,嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因 (amyM)启动子,解淀粉芽孢杆菌α-淀粉酶(amyQ)启动子,枯草芽孢杆菌xylA 和xylB基因的启动子等。为了在真菌宿主中转录,有用的启动子的例子是得 自编码下列酶的基因的启动子:米曲霉TAKA淀粉酶,米赫根毛霉 (Rhizomucor miehei)天冬氨酸蛋白酶,黑曲霉中性α-淀粉酶,黑曲霉酸稳定的 α-淀粉酶,黑曲霉葡糖淀粉酶,米赫根毛霉脂肪酶,米曲霉碱性蛋白酶,米 曲霉丙糖磷酸异构酶或构巢曲霉乙酰胺酶。

本发明的表达载体也含有适当的转录终止子,在真核生物中,还含有与 编码本发明α-淀粉酶变体的DNA序列可操作相连的聚-腺苷酸化序列。终止 和聚腺苷酸化序列可适当地得自与启动子相同的来源。

载体可进一步含有能使载体在所述宿主细胞中复制的DNA序列。所述 序列的例子是质粒pUC19,pACYC177,pUB110,pE194,pAMB1和pIJ702的 复制起点。

载体也可含有选择标记,例如其产物可以补偿宿主细胞缺陷的基因,如 枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或能赋予抗生素抗性的基因,所 述抗生素抗性如氨苄青霉素,卡那霉素,氯霉素或四环素抗性。另外,载体 可含有曲霉属选择标记,如amdS,argB,niaD和sC,产生潮霉素抗性的标记, 或者可通过WO 91/17243中所述的共-转化来完成选择。

尽管细胞内表达在某些方面(例如当使用某些细菌作为宿主细胞时)有 利,但一般优选在细胞外进行表达。通常,本文所述的芽孢杆菌α-淀粉酶含 有允许表达的蛋白酶分泌至培养基的前区。必要时,该前区可被不同的前区 或信号序列取代,通过取代编码各个前区的DNA序列可以方便地实现此目 的。

分别连接编码α-淀粉酶变体的本发明DNA构建体,启动子,终止子和 其它元件,并将它们插入含有复制所需信息的适当载体的方法是本领域技术 人员众所周知的(参见例如Sambrook等,分子克隆:实验室手册,第2版, 冷泉港,1989)。

含有上文所定义的本发明DNA构建体或表达载体的本发明细胞可以有 利地用作宿主细胞,以重组产生本发明的α-淀粉酶变体。可以方便地通过将 编码变体的本发明DNA构建体(一个或多个拷贝)整合至宿主染色体,用所述 DNA构建体转化细胞。一般认为整合是有利的,因为整合后DNA序列可以 在细胞中更加稳定地维持。根据常规方法,例如通过同源或异源重组可以将 DNA构建体整合至宿主染色体。或者,可用与不同类型的宿主细胞有关的上 述表达载体转化细胞。

本发明的细胞可以是高等生物,如哺乳动物或昆虫的细胞,但优选其为 微生物细胞,例如细菌或真菌(包括酵母)细胞。

适合的细菌为革兰氏阳性菌,如枯草芽孢杆菌,地衣芽孢杆菌,迟缓芽 孢杆菌,短芽孢杆菌,嗜热脂肪芽孢杆菌,嗜碱芽孢杆菌(B.alkalophilus), 解淀粉芽孢杆菌,凝结芽孢杆菌,环状芽孢杆菌,灿烂芽孢杆菌,巨大芽孢 杆菌,苏云金芽孢杆菌,浅青紫链霉菌或鼠灰链霉菌,或革兰氏阴性菌如大 肠杆菌。细菌的转化可以被,例如原生质转化或以感受态细胞本身已知的方 式使用该细胞而影响。

酵母生物可优选糖酵母属或裂殖酵母属,例如酿酒酵母。丝状真菌优选 属于曲霉属,例如,米曲霉或黑曲霉。真菌细胞可用一种方法转化,该方法 涉及原生质形成、原生质转化、然后细胞壁以其本身已知的方式再生。曲霉 属宿主细胞转化的适合方法如EP 238 023所述。

在另一方面,本发明涉及生产本发明α-淀粉酶变体的方法,该方法包含 在有利于变体生产的条件下培养如上所述宿主细胞以及从细胞和/或培养液 中回收变体。

用于培养细胞的培养基可以是适于培养所述宿主细胞,并表达本发明α- 淀粉酶变体的任何常规培养基。适当的培养基可以商购,或者可根据公开的 配方(例如美国典型培养物保藏中心目录中所述的配方)生产。

通过众所周知的方法,包括通过离心或过滤将培养基与细胞分开,利用 诸如硫酸铵等盐沉淀培养基中的蛋白质成分,接着利用层析法,如离子交换 层析,亲和层析等,可以从培养基中方便地回收宿主细胞分泌的α-淀粉酶变 体。

工业化应用

本发明的α-淀粉酶变体具有能进行多种工业应用的有价值的特点。具体 地,本发明酶变体适于作为洗衣,碗碟清洗,硬表面清洗的洗涤剂组合物的 成分来应用。多种变体可特别有效用于从淀粉生产增甜剂和乙醇中,如燃 料,酒类或工业用乙醇,和/或用于织物退浆。传统淀粉转化工艺包括淀粉液 化和/或糖化加工的条件描述于,例如US 3,912,590和EP专利出版物252 730和63 909。

从淀粉生产增甜剂

将淀粉转化为果糖浆的“传统”过程通常由三个连续的酶处理步骤构 成,即液化步骤,然后是糖化步骤和异构化步骤。在液化期间,淀粉在pH 5.5-6.2,95-160℃下用α-淀粉酶(例如TermamylTM)降解约2小时而成为糊精。 为确保在这些条件下优化酶稳定性,添加了1mM钙(40ppm游离钙离子)。

液化步骤之后,通过添加葡糖淀粉酶(例如,AMGTM)和脱支酶如异淀粉 酶或支链淀粉酶(例如,PromozymeTM)可使糊精转化为葡萄糖。在此步骤之 前,将pH调到4.5以下,保持较高温度(95℃以上),使液化α-淀粉酶失活。 温度降低到60℃,加入葡糖淀粉酶和脱支酶。糖化步骤持续24-72小时。

糖化步骤后,pH升高到6-8,优选pH7.5,钙通过离子交换除去。接着 使用例如固定化葡糖异构酶(如SweetzymeTM)将葡萄糖浆转化为高果糖浆。

此步骤可至少有一个酶性改进:降低液化α-淀粉酶的钙倚赖性。需要加 入游离钙以确保α-淀粉酶的高度稳定性,但是游离钙会强烈限制葡糖异构酶 的活性,且需要通过一种昂贵的单元操作除去到一定程度(游离钙水平在3- 5ppm以下)。如果能避免使用这类操作就可以节约费用,液化步骤可以在未 加入游离钙离子的情况下进行。

为达到这一点,需要一种在低游离钙浓度(<40ppm)下仍保持稳定和高活 性的钙倚赖性较小的Termamyl-样α-淀粉酶。这类Termamyl-样α-淀粉酶的 最佳pH范围应为4.5-6.5,优选为4.5-5.5。

本发明还涉及一种组合物,其包括,衍生自具有SEQ ID NO:8中所示序 列之嗜热脂肪芽孢杆菌α-淀粉酶(作为亲本Termamyl-样α-淀粉酶)的一或多 个本发明变体与衍生自具有SEQ ID NO:4中所示序列的地衣芽孢杆菌 Termamyl-样α-淀粉酶的混合物。

此外,本发明还涉及一种组合物,其包括,衍生自具有SEQ ID NO:8中 所示序列之嗜热脂肪芽孢杆菌α-淀粉酶(作为亲本Termamyl-样α-淀粉酶)的 一或多种本发明变体,以及包含SEQ ID NO:6中所示解淀粉芽孢杆菌α-淀粉 酶的一部分和SEQ ID NO:4中所示地衣芽孢杆菌α-淀粉酶的一部分的杂合型 α-淀粉酶。后一杂合型Termamyl-样α-淀粉酶包含SEQ ID NO:4中所示地衣 芽孢杆菌α-淀粉酶的445个C-末端氨基酸残基和SEQ ID NO:6中所示解淀粉 芽孢杆菌α-淀粉酶的37个N-末端氨基酸残基。该后一杂合型α-淀粉酶优选 含有下列突变:H156Y+A181T+N190F+A209V+Q264S(采用SEQ ID NO:4编 号)。优选地,这后一杂合型α-淀粉酶最好含有下列突变: H156Y+A181T+N190F+A209V+Q264S+I201F(采用SEQ ID NO:4编号)。在 以下实例中,被称为LE429(示于SEQ ID NO:2)的该最后提及的亲本杂合型 Termamyl-样α-淀粉酶用于制备本发明的变体,这些变体可用于本发明的组 合物中。

本发明的α-淀粉酶变体或本发明的组合物在本发明的一个方面中可用 于淀粉液化,在洗涤剂组合物如洗衣、清洗碗碟和硬表面清洗的洗涤剂组合 物中使用,用于乙醇生产,如燃料,酒类和工业用乙醇的生产,用于织物, 纤维和衣物的退浆。

材料和方法

酶:

LE174:杂合型α-淀粉酶变体:

LE174是与Termamyl序列即,示于SEQ ID NO:4的地衣芽孢杆菌α- 淀粉酶相同的杂合型Termamyl-样α-淀粉酶,不同处在于其(成熟蛋白)N- 末端35个氨基酸残基被BAN,即示于SEQ ID NO:6的解淀粉芽孢杆菌α- 淀粉酶(成熟蛋白)的N-末端33个氨基酸残基取代。该LE174进一步具有 下列突变:H156Y+A181T+N190F+A209V+Q264S(SEQ ID NO:4)。

LE429:杂合型α-淀粉酶变体:

与Termamyl序列即,示于SEQ ID NO:4的地衣芽孢杆菌α-淀粉酶相同 的杂合型Termamyl-样α-淀粉酶,不同处在于其(成熟蛋白)N-末端35个氨 基酸残基被BAN,即示于SEQ ID NO:6的解淀粉芽孢杆菌α-淀粉酶(成熟蛋 白)的N-末端33个氨基酸残基取代。该LE429进一步具有下列突变: H156Y+A181T+N190F+A209V+Q264S+I201F(SEQ ID NO:4)。LE429示于 SEQ ID NO:2,其通过SOE-PCR(Higuchi等,1988,核酸研究16:7351)构建。

DextrozymeTM E:衍生自黑曲霉和Bacillus deramificans(可衍生自Novo NordiskA/S)所选菌株的葡糖淀粉酶(AMG)和支链淀粉酶的平衡混合物。

α-淀粉酶变体的发酵和纯化

携有相关表达质粒的一株枯草芽孢杆菌菌株在含有-80℃贮存的10微 克/毫升卡那霉素的LB-琼脂平板上划线接种,并在37℃下过夜培养。将菌 落转移到装在500ml摇瓶中的添加有10微克/毫升卡那霉素的100ml BPX 培养基中。

BPX培养基的组成:

马铃薯淀粉                         100g/l

大麦粉                             50g/l

BAN 5000 SKB                       0.1g/l

酪蛋白酸钠                         10g/l

大豆粉(Soy Bean Meal)              100g/l

Na2HPO4,12H2O                 9g/l

PluronicTM                        0.1g/l

培养物在37℃下以270rpm振荡培养5天。

通过4500rpm离心20-25分钟除去发酵液中的细胞和细胞碎片。然后将 上清液过滤来获得完全澄清的溶液。浓缩滤液并在UF滤器上进行洗涤(10000 截留膜),再将缓冲液换成20mM醋酸(Acetate)pH5.5。将UF滤液上样到S- Sepharose F.F上并且在同样的缓冲液中通过采用0.2MNaCl的逐步洗脱法进 行洗脱。洗脱液对10mM Tris pH9.0透析,上样到Q-Sepharose F.F上,利用 0-0.3M NaCl的线性梯度洗脱6个柱体积。收集具有活性(通过Phadebas分析 法测定)的馏分,调节pH到pH7.5并通过采用0.5%W/vol.的活性碳处理5分 钟来除去残留色素。

活性测定-(KNU)

一千个α-淀粉酶单位(1 KNU)是指,用Novo Nordisk的在下列条件下测 定α-淀粉酶的标准方法所测,每小时分解5.26g淀粉(Merck,Amylum Solubile,Erg.B 6,批号9947275)所需的酶量:

底物                     可溶性淀粉

溶剂中钙含量              0.0043M

反应时间                  7-20分钟

温度                      37℃

pH                        5.6

只要提出要求就可得到NovoNordisk分析方法(AF9)的详细描述。

α-淀粉酶活性的测定

通过以Phadebas片为底物的方法测定α-淀粉酶活性。Phadebas片 (Phadebas淀粉酶试验,由Pharmacia Diagnostic提供)含有交联的不可溶蓝色 淀粉聚合物,其与牛血清白蛋白和一种缓冲物质相混合并被压片。

每次测定时,将一个片剂悬浮在含有5ml 50mM Britton-Robinson缓冲 液(50mM醋酸、50mM磷酸、50mM硼酸、0.1mM CaCl2,用NaOH将pH 调到所需值)的试管中。试验在所需温度的水浴中进行。要测定的α-淀粉酶用 x ml的50mM Britton-Robinson缓冲液稀释。1ml的该α-淀粉酶溶液被加到 5ml 50mM Britton-Robinsond缓冲液中。淀粉被该α-淀粉酶水解并产生可溶 的蓝色片段。在620nm下分光光度法测定蓝色溶液的吸光度,其是α-淀粉酶 活性的函数。

重要的是经10或15分钟温育(试验时间)后在620nm下测定的吸光度是 在0.2至2.0个620nm光吸收单位的范围内。在这一光吸收范围内活性与光 吸收值之间成线性关系(Lambert-Beer定律)。因此必须调节酶的稀释度以适 合这一标准。在一系列特定的条件(温度、pH、反应时间、缓冲液)下,1mg 的给定α-淀粉酶将水解一定量的底物并产生蓝色。在620nm下测定颜色的强 度。测定的吸光值直接与在所述一系列特定条件下测得的目标α-淀粉酶的比 活性成比例(活性/mg纯α-淀粉酶蛋白)。

比活性的测定

采用Phadebas分析方法(Pharmacia)将比活性测定为活性/mg酶。

测定pH活性图谱(pH稳定性)

将变体保存在20mM TRIS pH7.5,0.1mM,CaCl2中,检测在30℃,50mM Britton-Robinson,0.1mM CaCl2中进行。使用上述Phadebas试验在pH4.0, 4.5,5.0,5.5,6.0,7.0,8.0,9.5,9.5,10,和10.5下测定pH活性。

测定AGU活性并表示为AGU/mg

一个Novo淀粉葡糖苷酶单位(AGU)定义为37℃,pH4.3下每分钟水解1 微摩尔麦芽糖的酶量。此分析方法的详述(AEL-SM-0131)可要求Novo Nordisk提供。

用Boehringer Mannheim,124036的葡萄糖GOD-Perid试剂盒以修饰的 (AEL-SM-0131)方法将活性为测定AGU/ml。标准品:AMG-标准品,批次 7-1195,195 AGU/ml。

375μL底物(50mM乙酸钠中加入1%麦芽糖,pH4.3)37℃温育5分钟。 添加25μL的酶的乙酸钠稀释液。10分钟后,加入100μL 0.25M NaOH终止 反应。20μL转到一96孔微滴板上,加入200μLGOD-Perid溶液。室温30分 钟后,测定650nm吸光度,参照AMG标准品以AGU/mg计算活性。

活性(AGU/ml)除以蛋白浓度(mg/ml)可算得以AGU/mg表示的比活性。

实施例

实施例1

本发明Termamyl变体的构建

Termamyl(地衣芽孢杆菌α-淀粉酶SEQ ID NO:4)由枯草芽孢杆菌中的 质粒pDN1528表达。此质粒包含了编码了Termamyl的完整基因,amyl,其 表达其自身启动子指导。此外,该质粒包含质粒pUB110的复制起点ori和 来自质粒pC194的赋予氯霉素抗性的cat基因。pDN1528示于WO 96/23874 的图9中。制备含有SEQ ID NO:3编码区之主要部分的特异性诱变载体。该 载体pJeEN1的重要特征包括来自pUC质粒的复制起点,赋予对氯霉素抗性 的cat基因,bla基因的移码型,所述bla基因的野生型(ampR表型)通常赋予 氨苄青霉素抗性。此突变型产生amps表型。质粒pJeEN1示于WO 96/23874 的图10中,大肠杆菌复制起点ori,bla,cat,Termamyl淀粉酶基因的5’- 截短型,以及所选限制性位点都指示在该质粒上。

按照Deng和Nickoloff(1992,Anal.Biochem.200,81-88页)所述方法将突 变引入amyl,不同处在于,带有“选择引物”(引物#6616;见下面)的质粒 根据转化的大肠杆菌细胞(该细胞携有含修复的bla基因的质粒)的ampR表型 来选择,而不采用Deng和Nickoloff所述的利用限制性酶消化的选择方法。 用于诱变的化学品和酶由Stratagene的Chameleon诱变试剂盒(目录号 200509)得到。

在确认变异质粒中的DNA序列后,含有所需改变的截短型基因被作为 PstI-EcoRI片段亚克隆至pDN1528,并转化至蛋白酶和淀粉酶已耗尽的枯草 芽孢杆菌SHA273株(述于WO92/11357和WO95/10603中)以表达这种酶变 体。

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 V54W:

PG GTC GTA GGC ACC GTA GCC CCA ATC CGC TTG(SEQ ID NO:9)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 A52W+V54W:

PG GTC GTA GGC ACC GTA GCC CCA ATC CCA TTG GCT CG(SEQ ID NO:10)

引物#6616(5’到3’从左到右书写;P表示5’磷酸):

P CTG TGA CTG GTG AGT ACT CAA CCA AGT C(SEQ ID NO:11)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 V54E:

PGG TCG TAG GCA CCG TAG CCC TCA TCC GCT TG(SEQ ID NO:12)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 V54M:

PGG TCG TAG GCA CCG TAG CCC ATA TCC GCT TG(SEQ ID NO:13)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 V54I:

PGG TCG TAG GCA CCG TAG CCA ATA TCC GCT TG(SEQ ID NO:14)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 Y290E和Y290K:

PGC AGC ATG GAA CTG CTY ATG AAG AGG CAC GTC AAA C(SEQ ID NO:15)

Y代表C和T的等量混合物。在位置290出现的编码谷氨酸或赖氨酸的 密码子由DNA测序证实。

通过使用下列诱变引物(5’到3’从左到右书写)构建Termamyl变体 N190F:

PCA TAG TTG CCG AAT TCA TTG GAA ACT TCC C(SEQ ID NO:16)

通过使用下列诱变引物(5’到3’从左到右书写)构建Termamyl变体 N188P+N190F:

PCA TAG TTG CCG AAT TCA GGG GAA ACT TCC CAA TC(SEQ ID NO:17)

通过使用下列诱变引物(5’到3’从左到右书写)构建Termamyl变体 H140K+H142D:

PCC GCG CCC CGG GAA ATC AAA TTT TGT CCA GGC TTT AAT TAG(SEQ ID NO:18)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 H156Y:

PCA AAA TGG TAC CAA TAC CAC TTA AAA TCG CTG(SEQ ID NO:19)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 A181T:

PCT TCC CAA TCC CAA GTC TTC CCT TGA AAC(SEQ ID NO:20)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 A209V:

PCTT AAT TTC TGC TAC GAC GTC AGG ATG GTC ATA ATC(SEQ ID NO:21)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 Q264S:

PCG CCC AAG TCA TTC GAC CAG TAC TCA GCT ACC GTA AAC(SEQ ID NO:22)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 S187D:

PGC CGT TTT CAT TGT CGA CTT CCC AAT CCC(SEQ ID NO:23)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 δ(K370-G371-D372)(即370,371,372号氨基酸缺失):

PGG AAT TTC GCG CTG ACT AGT CCC GTA CAT ATC CCC(SEQ ID NO:24)

通过使用下列诱变引物(5’到3’从左到右书写),构建Termamyl变体 δ(D372-S373-Q374):

PGG CAG GAA TTT CGC GAC CTT TCG TCC CGT ACA TAT C(SEQ ID NO:25)

用能切割pDN1528质粒两次,产生1116bp的片段和3850bp的载体部 分(即包含该质粒的复制起点)的限制酶ClaI,消化含有A181T的pDN1528 质粒样质粒(即在amyl内含有导致A181T改变之突变的pDN1528)和含有 A209V的pDN1528质粒样质粒(即在amyl内含有导致A209V改变之突变的 pDN1528),可将Termamyl变体A181T和A209V组合为A181T+A209V。 包含A209V突变的片段和包含A181T突变的载体部分在琼脂糖胶上分离 后,用QIAquick凝胶提取试剂盒(购买自QIAGEN)纯化。将所述片段和载 体连接并转化至上述蛋白酶和淀粉酶耗尽型枯草芽孢杆菌菌株。分析 amy+(含淀粉琼脂平板上的透明区)及氯霉素抗性转化体的质粒上两个突变是 否并存。

以上述相似的方式,利用限制性内切酶Acc65I和EcoRI将H156Y和 A209V相结合,得到H156Y+A209V。

利用限制性内切酶Acc65I和HindIII将H156Y+A209V和A181T+A209V 结合为H156Y+A181T+A209V。

通过SOE-PCR法(Higuchi等1988,核酸研究16:7351)将Termamyl 变体H156Y+A181T+A209V的成熟部分的35个N-末端残基用解淀粉芽孢 杆菌α-淀粉酶(SEQ ID NO:4)(在此上下文中称为BAN)33个N-末端残基取 代,如下所示:

引物19364(5’-3’排列):CCT CAT TCT GCA GCA GCA GCC GTA AAT GGC ACG CTG(SEQ ID NO:26)

引物19362:CCA GAC GGC AGT AAT ACC GAT ATC CGA TAA ATG TTC CG(SEQ ID NO:27)

引物19363:CGG ATA TCG GTA TTA CTG CCG TCT GGA TTC(SEQ ID NO:28)

引物1C:CTC GTC CCA ATC GGT TCC GTC(SEQ ID NO:29)

采用来自Boehringer Mannnheim的Pwo热稳定聚合酶按照生产商的指 导进行标准的PCR,聚合酶链式反应,温度循环为:94℃5分钟,(94℃30 秒,50℃45秒,72℃1分钟)的25个循环,72℃10分钟。

在首轮PCR (PCR1)中,用引物19364和19362在含有编码解淀粉芽孢 杆菌α-淀粉酶基因的DNA片段上对约130bp的片段进行扩增。

在另一轮PCR(PCR2)中,用引物19363和1C在模板pDN1528上对约 400bp的片段进行扩增。

PCR1和PCR2用琼脂糖凝胶纯化,并在PCR3中用作模板,以引物19364 和1C获得约520bp的片段。此片段因此包含编码BAN N-末端的一段DNA, 所述BAN与编码Termamyl的DNA的一部分从第35个氨基酸融合。

通过限制性内切酶PstI和SacII消化,如上所述进行枯草芽孢杆菌的连 接以及转化,将该520bp片段亚克隆至pDN1528样质粒(包含编码Termamyl 变体H156Y+A181T+A209V的基因)。在来自amy+及氯霉素抗性转化体的 提纯质粒中进行DNA测序,以确定在限制性位点PstI和SacII间的DNA序 列。

最终的构建体包含来自BAN的正确的N-末端和H156Y+A181T+ A209V,将其表示为BAN(1-35)+H156Y+A181T+A209V。

通过进行上述诱变,但用编码Termamyl变体BAN(1-35)+H156Y+ A181T+A209V的DNA序列取代pJeEN1中的amyL序列,而将N190F与 BAN(1-35)+H156Y+A181T+A209V组合为BAN(1-35)+H156Y+A181T+ N190F+A209V。

通过进行上述诱变,但将pJeEN中的amyL序列变为编码Termamyl变 体BAN(1-35)+H156Y+A181T+A209V的DNA序列,而将Q264S与 BAN(1-35)+H156Y+A181T+A209V组合为BAN(1-35)+H156Y+A181T+ A209V+Q264S。

利用限制性内切酶BsaHI(将BsaHI位点引至A209V突变附近)和PstI, 将BAN(1-35)+H156Y+A181T+A209V+Q264S和BAN(1-35)+H156Y +A181T+N190F+A209V组合为BAN(1-35)+H156Y+A181T+N190F+A209V +Q264S。

通过进行上述诱变使I201F与BAN(1-35)+H156Y+A181T+N190F +A209V+Q264S组合为BAN(1-35)+H156Y+A181T+N190F+A209V+Q264S+ I201F(SEQ ID NO:2)。使用诱变引物AM100,引入I201F取代,同时除去 ClaI限制性位点,其有利于突变体的简便的稳定定位(pin-point)。

引物AM100:

5’GATGTATGCCGACTTCGATTATGACC 3’(SEQ ID NO:30)

实施例2

本发明具有改变的酶解模式的Termamyl-样α-淀粉酶变体的构建

热稳定的地衣芽孢杆菌α-淀粉酶变体含有示于SEQ ID NO:4的地衣芽 孢杆菌α-淀粉酶445个C-末端氨基酸残基和示于SEQ ID NO:6的解淀粉芽孢 杆菌α-淀粉酶37个N-末端氨基酸残基,并且进一步含有下列突变: H156Y+A181T+N190F+A209V+Q264S+I201F(此变体的构建如实施例1所 述,氨基酸序列示于SEQ IDNO:2),此变体在接近分支点处酶解底物的能力 减小。

在进一步改进该α-淀粉酶变体在接近分支点处减小的酶解底物能力的 尝试中,采用Sarkar和Sommer,1990(生物技术(BioTechnigques)8:404-407) 所述的大范围引物(mega-primer)法进行定点诱变。

LE313的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+ A209V+Q264S+V54N:

用基因特异性引物27274和诱变引物AM115通过PCR扩增pDN1528 样质粒(在编码SEQ ID NO:4的淀粉酶的基因中携有突变BAN(1-35)+ H156Y+A181T+N190F+I201F+A209V+Q264S)中约440bp的DNA片段。

此440bp片段经琼脂糖凝胶纯化,并作为大范围引物与引物113711一 起以相同模板进行第二次PCR中。

所得约630bp的片段经限制性内切酶EcoRV和Acc65I消化,所得约 370bp的DNA片段经纯化并连接至以相同酶消化的pDN1528样质粒。枯草 芽孢杆菌SHA273(低淀粉酶和蛋白酶)的感受态细胞用该连接物转化,通过 DNA测序检测氯霉素抗性转化体,以证实质粒上存在正确的突变。

引物27274:

5’CATAGTTGCCGAATTCATTGGAAACTTCCC 3’(SEQ ID NO:31)

引物1B:

5’CCGATTGCTGACGCTGTTATTTGC 3’(SEQ ID NO:32)

引物AM115:

5’GCCAAGCGGATAACGGCTACGGTGC 3’(SEQ ID NO:33)

LE314的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+A52S以相似的方式进行,但使用的诱变引物是AM116。

AM116:

5’GAACGAGCCAATCGGACGTGGGCTACGG 3’(SEQ ID NO:34)

LE315的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+A52S+V54N以相似的方式进行,但使用的诱变引物是AM117。

AM117:

5’GGAACGAGCCAATCGGATAACGGCTACGGTGC 3’(SEQ ID NO:35)

LE316的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+T49L以相似的方式进行,但使用的诱变引物是AM118。

AM118:

5’GCATATAAGGGACTGAGCCAAGCGG 3’(SEQ ID NO:36)

LE317的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+T49L+G107A以相似的方式进行,但同时使用诱变引物AM118和 AM119。

AM119:

5’CAACCACAAAGCCGGCGCTGATGCG 3’(SEQ ID NO:37)

LE318的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+A52S+V54N+T49L+G107A以相似的方式进行,但同时使用诱变引 物AM120和AM119。

AM120:

5’GCATATAAGGGACTGAGCCAATCGGATAACGGCTACGGTGC 3’(SEQ ID NO:38)

LE319的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+A52S+V54N+T49L以相似的方式进行,但使用诱变引物AM120。

LE320的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+G107A以相似的方式进行,但使用诱变引物AM119。

LE322的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+Q51R+A52S以相似的方式进行,但使用诱变引物AM121。

AM121:

5’GAACGAGCCGATCGGACGTGGGCTACGG 3’(SEQ ID NO:39)

LE323的构建:BAN/Termamyl杂合型+H156Y+A181T+N190F+A209V +Q264S+A52N以相似的方式进行,但使用诱变引物AM122。

AM122:

5’GAACGAGCCAAA CGACGTGGGCTACGG 3’(SEQ ID NO:40)

实施例3

LE429变体的检验(糖化):

标准反应条件:

底物浓度      30%w/w

温度          60℃

初始pH(60℃)  5.5

酶剂量

葡糖淀粉酶    0.18 AGU/g DS

支链淀粉酶    0.06 PUN/g DS

α-淀粉酶     10μg酶/gDS

DextrozymeTME用于提供葡糖淀粉酶和支链淀粉酶活性。

糖化底物的制备如下,在去离子水中溶解普通玉米淀粉,调整至干物质 含量约30%w/w。pH调到5.5(在60℃测定),将相当于10g干重的底物等分 样移入蓝盖玻璃摇瓶中。

然后将摇瓶置于60℃平衡的振动水浴中,加入酶。如果需要,再次将 pH调整至5.5。糖化48小时后取样;将pH调整至3.0,然后沸水浴15分钟 使酶失活。冷却后,样品用0.1g混合床离子交换树脂(BIO-RAD 501 X8(D)) 在旋转混合器上处理30分钟,除去盐和可溶性N。过滤后,经HPLC测定 糖组成。得到下面结果:

此变体的亲本α-淀粉酶是LE 429。  加入的α-淀粉酶变体     DP1     DP2     DP3   比活性   (NU/mg)  V54N     96.1     1.75     1.18     8200  A52S     95.9     1.80     1.11     18800  A52S+V54N     96.3     1.84     1.08     10000  T49L     96.3     1.77     1.11     12300  T49L+G107A     96.4     1.87     0.72     13600  A52S+V54N+T49L+G107A     80.5     2.55     0.43     10000  A52S+V54N+T49L     95.8     1.76     0.84     8400  G107A     94.4     1.89     1.04     19600  Q51R+A52S     95.9     1.77     1.27     16500  A52N     95.5     1.89     1.56     17600  LE174(对照) 95.9/95.8  1.87/1.83  1.17/1.35     16000

与对照相比,液化过程中,本发明活性α-淀粉酶变体的存在导致了潘糖 水平的降低(DP3)。

尤其,LE429的T49L+G107A变体和LE429的A52S+V54N+T49L变体, 分别导致潘糖水平的显著降低(DP3)。如果这些α-淀粉酶变体用于淀粉液化, 将不需要在糖化开始之前使酶失活。

实施例4

LE429变体的液化和糖化

在相同条件下对其它多个LE429变体重复实施例3的实验。

结果如下:

变体/蔗糖图谱    DP1    DP2     DP3       DP4+

T4 9V+G107A    95.9%  1.72%  1.27%    1.11%

T4 9Y+G107A    95.3%  1.73%  1.29%    1.65%

T4 9N+G107A    95.7%  1.64%  1.51%    1.18%

T49L+A52S+G107A        95.7%  1.73%  0.95%  1.67%

T49L+A52T+G107A        95.8%  1.66%  1.03%  1.48%

T49L+A52F+G107A        95.7%  1.69%  1.16%  1.42%

T49L+A52L+G107A        95.5%  1.70%  1.40%  1.38%

T49L+A52I+G107A        95.9%  1.72%  1.31%  1.07%

T49L+A52V+G107A        94.7%  1.69%  1.16%  2.44%

T49L+A52V+G107A+A111V  94.5%  1.75%  0.72%  2.99%

LE429                  94.9%  1.71%  1.85%  1.51%

实施例5

对多个LE429变体重复实施例3的实验,但液化在95℃,pH6.0进行, 糖化在60℃,pH4.5,40ppm CaCl2下进行,然后使酶失活。下述变体是LE 429 变体。实验结果如下:   变体/蔗糖图谱       DP4+    DP3     DP2     DP1   T49F                1.15    0.92    1.83    96.12   T49D+G107A          0.84    1.03    1.82    96.3   T49I+G107A          0.97    o.64    1.84    96.55   T49L+G107A          0.96    0.81    1.82    96.42   T49L+A52S+G107A     1.37    0.75    1.88    96.01   T49L+A52T+G107A     0.87    0.81    1.8     96.52   T49L+A52F+G107A     0.98    0.83    1.87    96.31   T49V+G107A          0.65    0.8     2.13    96.43   T49Y+G107A          0.83    0.94    1.89    96.35   LE429               1.16    1.21    1.77    95.87

参考文献

Klein,C.,等,生物化学1992,31,8740-8746,

Mizuno,H.,等,分子生物学杂志(J.MoI.Biol.)(1993)234,1282-1283,

Chang,C.,等,分子生物学杂志(J.MoI.Biol.)(1993)229,235-238,

Larson,S.B.,分子生物学杂志(J.MoI.Biol.)(1994)235,1560-1584,

LawSon,C.L.,分子生物学杂志(J.MoI.Biol.)(1994)236,590-600,

Qian,M.,等,分子生物学杂志(J.MoI.Biol.)(1993)231,785-799,

Brady,R.L.等,结晶学报B辑(Acta Crystallogr.sect.B),47,527-535,

Swift,H.J.,等,结晶学报B辑,47,535-544

A.Kadziola,博士论文:“来自大麦α-淀粉酶及其与底物类似物抑制物 的结晶学X-射线研究”,哥本哈根大学化学系,1993,

MacGregor,E.A.,食物胶体学(Food Hydrocolloids),1987,卷1,5-6期,p.

B.Diderichsen and L.Christiansen,嗜热脂肪芽孢杆菌麦芽糖基因淀粉 酶的克隆,FEMS Microbiol.letters:56:pp.53-60(1988)

Hudson等,免疫学实践(PracticalImmunology),3版(i989),Blackwell 科学出版社,

Sambrook等,分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),2版,冷泉港,1989

S.L.Beaucage and M.H.Caruthers,Tetrahedron Letters 22,1981,pp.1859- 1869

Matthes等,The EMBO J.3,1984,pp.801-805.

R.K.Saiki等,科学239 1988 pp.487-491.

Morinaga等,(1984,生物技术2:646-639)

Nelson and Long,分析生物化学(Analytical Biochemistry)180,1989,pp 147-151

Hunkapiller等,1984,自然310:105-111

R.Higuchi,B.Krummel,和R.K.Saiki(1988)-DNA片段的胞外制备和特 异诱变:蛋白质和DNA相互作用研究.核酸研究(Nucl.Acids Res.)16:7351- 7367.

Dubnau等,1971,分子生物学杂志.56 pp.209-221.

Gryczan等,1978,细菌学杂志(J.Bacteriol.)134,pp.318-329

S.D.Erlich,1977,Proc.Natl.Acad.Sci.74 pp.1680-1682.,

Boel等,1990,生物化学29pp.6244-6249.

Sarkar和Sommer,1990,生物技术8,pp.404-407

              序列表 <110>Novo Nordisk A/S <120> <130> <160>40 <170>PatentIn Ver.2.1 <210>1 <211>1443 <212>DNA <213>解淀粉芽孢杆菌 <220> <221>CDS <222>(1)..(1443) <400> 1 gta aat ggc acg etg atg cag tat ttt gaa tgg tat acg ccg aac gac   48 Val Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Thr Pro Asn Asp   1               5                  10                  15 ggc cag cat tgg aaa cga ttg cag aat gat gcg gaa cat tta tcg gat   96 Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ala Glu His Leu Ser Asp

         20                  25                  30 atc ggt att act gcc gtc tgg att ccc ccg gca tat aag gga acg agc   144 Ile Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser

     35                  40                  45 caa gcg gat gtg ggc tac ggt gct tac gac ctt tat gat tta ggg gag   192 Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu

 50                  55                  60 ttt cat caa aaa ggg acg gtt cgg aca aag tac ggc aca aaa gga gag   240 Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Gly Glu  65                  70                  75                  80 ctg caa tct gcg atc aaa agt ctt cat tcc cgc gac att aac gtt tac   288 Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Val Tyr

             85                  90                  95 ggg gat gtg gtc atc aac cac aaa ggc ggc gct gat gcg acc gaa gat   336 Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp

        100                 105                 110 gta acc gcg gtt gaa gtc gat ccc gct gac cgc aac cgc gta att tca   384 Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val Ile Ser

    115                 120                 125 gga gaa cac cta att aaa gcc tgg aca cat ttt cat ttt ccg ggg cgc   432 Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Arg

130                 135                 140 ggc agc aca tac agc gat ttt aag tgg tat tgg tac cat ttt gac gga   480 Gly Ser Thr Tyr Ser Asp Phe Lys Trp Tyr Trp Tyr His Phe Asp Gly 145                 150                 155                 160 acc gat tgg gac gag tcc cga aag ctg aac cgc atc tat aag ttt caa   528 Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gln

            165                 170                 175 ggg aag act tgg gat tgg gaa gtt tcc aat gaa ttc ggc aac tat gat   576 Gly Lys Thr Trp Asp Trp Glu Val Ser Asn Glu Phe Gly Asn Tyr Asp

        180                 185                 190 tat ttg atg tat gcc gac ttt gat tat gac cat cct gat gtc gta gca   624 Tyr Leu Met Tyr Ala Asp Phe Asp Tyr Asp His Pro Asp Val Val Ala

    195                 200                 205 gag att aag aga tgg ggc act tgg tat gcc aat gaa ctg caa ttg gac   672 Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln Leu Asp

210                 215                 220 ggt ttc cgt ctt gat gct gtc aaa cac att aaa ttt tct ttt ttg cgg   720 Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe Leu Arg 225                 230                 235                 240 gat tgg gtt aat cat gtc agg gaa aaa acg ggg aag gaa atg ttt acg   768 Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met Phe Thr

            245                 250                 255 gta gct gag tac tgg tcg aat gac ttg ggc gcg ctg gaa aac tat ttg   816 Val Ala Glu Tyr Trp Ser Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu

        260                 265                 270 aac aaa aca aat ttt aat cat tca gtg ttt gac gtg ccg ctt cat tat   864 Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu His Tyr

    275                 280                 285 cag ttc cat gct gca tcg aca cag gga ggc ggc tat gat atg agg aaa   912 Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met Arg Lys

290                 295                 300 ttg ctg aac ggt acg gtc gtt tcc aag cat ccg ttg aaa tcg gtt aca   960 Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser Val Thr 305                 310                 315                 320 ttt gtc gat aac cat gat aca cag ccg ggg caa tcg ctt gag tcg act   1008 Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser Thr

            325                 330                 335 gtc caa aca tgg ttt aag ccg ctt gct tac gct ttt att ctc aca agg   1056 Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg

        340                 345                 350 gaa tct gga tac cct cag gtt ttc tac ggg gat atg tac ggg acg aaa   1104 Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly Thr Lys

    355                 360                 365 gga gac tcc cag cgc gaa att cct gcc ttg aaa cac aaa att gaa ccg   1152 Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro

370                 375                 380 atc tta aaa gcg aga aaa cag tat gcg tac gga gca cag cat gat tat   1200 Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His Asp Tyr 385                 390                 395                 400 ttc gac cac cat gac att gtc ggc tgg aca agg gaa ggc gac agc tcg   1248 Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ser Ser

            405                 410                 415 gtt gca aat tca ggt ttg gcg gca tta ata aca gac gga ccc ggt ggg   1296 Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly

        420                 425                 430 gca aag cga atg tat gtc ggc cgg caa aac gcc ggt gag aca tgg cat   1344 Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr Trp His

    435                 440                 445 gac att acc gga aac cgt tcg gag ccg gtt gtc atc aat tcg gaa ggc   1392 Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser Glu Gly

450                 455                 460 tgg gga gag ttt cac gta aac ggc ggg tcg gtt tca att tat gtt caa   1440 Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr Val Gln 465                 470                 475                 480 aga                                                               1443 Arg <210>2 <211>481 <212>PRT <213>解淀粉芽孢杆菌 <400> 2 Val Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Thr Pro Asn Asp   1               5                  10                  15 Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ala Glu His Leu Ser Asp

         20                  25                  30 Ile Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser

     35                  40                  45 Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu

 50                  55                  60 Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Gly Glu  65                  70                  75                  80 Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Val Tyr

             85                  90                  95 Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp

        100                 105                 110 Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val Ile Ser

    115                 120                 125 Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Arg

130                 135                 140 Gly Ser Thr Tyr Ser Asp Phe Lys Trp Tyr Trp Tyr His Phe Asp Gly 145                 150                 155                 160 Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gln

            165                 170                 175 Gly Lys Thr Trp Asp Trp Glu Val Ser Asn Glu Phe Gly Asn Tyr Asp

        180                 185                 190 Tyr Leu Met Tyr Ala Asp Phe Asp Tyr Asp His Pro Asp Val Val Ala

    195                 200                 205 Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln Leu Asp

210                 215                 220 Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe Leu Arg 225                 230                 235                 240 Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met Phe Thr

            245                 250                 255 Val Ala Glu Tyr Trp Ser Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu

        260                 265                 270 Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu His Tyr

    275                 280                 285 Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met Arg Lys

290                 295                 300 Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser Val Thr 305                 310                 315                 320 Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser Thr

            325                 330                 335 Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg

        340                 345                 350 Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly Thr Lys

    355                 360                 365 Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro

370                 375                 380 Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His Asp Tyr 385                 390                 395                 400 Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ser Ser

            405                 410                 415 Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly

        420                 425                 430 Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr Trp His

    435                 440                 445 Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser Glu Gly

450                 455                 460 Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr Val Gln 465                 470                 475                 480 Arg <210>3 <211>1920 <212>DNA <213>地衣芽孢杆菌 <220> <221>CDS <222>(421)..(1872) <400>3 cggaagattg gaagtacaaa aataagcaaa agattgtcaa tcatgtcatg agccatgcgg 60 gagacggaaa aatcgtctta atgcacgata tttatgcaac gttcgcagat gctgctgaag 120 agattattaa aaagctgaaa gcaaaaggct atcaattggt aactgtatct cagcttgaag 180 aagtgaagaa gcagagaggc tattgaataa atgagtagaa gcgccatatc ggcgcttttc 240 ttttggaaga aaatataggg aaaatggtac ttgttaaaaa ttcggaatat ttatacaaca 300 tcatatgttt cacattgaaa ggggaggaga atcatgaaac aacaaaaacg gctttacgcc 360 cgattgctga cgctgttatt tgcgctcatc ttcttgctgc ctcattctgc agcagcggcg 420 gca aat ctt aat ggg acg ctg atg cag tat ttt gaa tgg tac atg ccc   468 Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro   1               5                  10                  15 aat gac ggc caa cat tgg agg cgt ttg caa aac gac tcg gca tat ttg   516 Asn Asp Gly Gln His Trp Arg Arg Leu Gln Asn Asp Ser Ala Tyr Leu

         20                  25                  30 gct gaa cac ggt att act gcc gtc tgg att ccc ccg gca tat aag gga   564 Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly

     35                  40                  45 acg agc caa gcg gat gtg ggc tac ggt gct tac gac ctt tat gat tta   612 Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu

 50                  55                  60 ggg gag ttt cat caa aaa ggg acg gtt cgg aca aag tac ggc aca aaa   660 Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys  65                  70                  75                  80 gga gag ctg caa tct gcg atc aaa agt ctt cat tcc cgc gac att aac   708 Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn

             85                  90                  95 gtt tac ggg gat gtg gtc atc aac cac aaa ggc ggc gct gat gcg acc   756 Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr

        100                 105                 110 gaa gat gta acc gcg gtt gaa gtc gat ccc gct gac cgc aac cgc gta   804 Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val

    115                 120                 125 att tca gga gaa cac cta att aaa gcc tgg aca cat ttt cat ttt ccg   852 Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro

130                 135                 140 ggg cgc ggc agc aca tac agc gat ttt aaa tgg cat tgg tac cat ttt   900 Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe 145                 150                 155                 160 gac gga acc gat tgg gac gag tcc cga aag ctg aac cgc atc tat aag   948 Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys

            165                 170                 175 ttt caa gga aag gct tgg gat tgg gaa gtt tcc aat gaa aac ggc aac   996 Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn

        180                 185                 190 tat gat tat ttg atg tat gcc gac atc gat tat gac cat cct gat gtc   1044 Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val

    195                 200                 205 gca gca gaa att aag aga tgg ggc act tgg tat gcc aat gaa ctg caa   1092 Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln

210                 215                 220 ttg gac ggt ttc cgt ctt gat gct gtc aaa cac att aaa ttt tct ttt   1140 Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe 225                 230                 235                 240 ttg cgg gat tgg gtt aat cat gtc agg gaa aaa acg ggg aag gaa atg   1188 Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met

            245                 250                 255 ttt acg gta gct gaa tat tgg cag aat gac ttg ggc gcg ctg gaa aac   1236 Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn

        260                 265                 270 tat ttg aac aaa aca aat ttt aat cat tca gtg ttt gac gtg ccg ctt   1284 Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu

    275                 280                 285 cat tat cag ttc cat gct gca tcg aca cag gga ggc ggc tat gat atg   1332 His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met

290                 295                 300 agg aaa ttg ctg aac ggt acg gtc gtt tcc aag cat ccg ttg aaa tcg   1380 Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser 305                 310                 315                 320 gtt aca ttt gtc gat aac cat gat aca cag ccg ggg caa tcg ctt gag   1428 Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu

            325                 330                 335 tcg act gtc caa aca tgg ttt aag ccg ctt gct tac gct ttt att ctc   1476 Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu

        340                 345                 350 aca agg gaa tct gga tac cct cag gtt ttc tac ggg gat atg tac ggg   1524 Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly

    355                 360                 365 acg aaa gga gac tcc cag cgc gaa att cct gcc ttg aaa cac aaa att   1572 Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile

370                 375                 380 gaa ccg atc tta aaa gcg aga aaa cag tat gcg tac gga gca cag cat   1620 Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His 385                 390                 395                 400 gat tat ttc gac cac cat gac att gtc ggc tgg aca agg gaa ggc gac   1668 Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp

            405                 410                 415 agc tcg gtt gca aat tca ggt ttg gcg gca tta ata aca gac gga ccc   1716 Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro

        420                 425                 430 ggt ggg gca aag cga atg tat gtc ggc cgg caa aac gcc ggt gag aca   1764 Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr

    435                 440                 445 tgg cat gac att acc gga aac cgt tcg gag ccg gtt gtc atc aat tcg   1812 Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser    

450                 455                 460 gaa ggc tgg gga gag ttt cac gta aac ggc ggg tcg gtt tca att tat   1860 Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr 465                 470                 475                 480 gtt caa aga tag aagagcagag aggacggatt tcctgaagga aatccgtttt       1912 Val Gln Arg tttatttt                                                          1920 <210>4 <211>483 <212>PRT <213>地衣芽孢杆菌 <400>4 Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro   1               5              10                      15 Asn Asp Gly Gln His Trp Arg Arg Leu Gln Asn Asp Ser Ala Tyr Leu

         20                  25                  30 Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly

     35                  40                  45 Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu

 50                  55                  60 Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys  65                  70                  75                  80 Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn

             85                  90                  95 Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr

        100                 105                 110 Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val

    115                 120                 125 Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro

130                 135                 140 Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe 145                 150                 155                 160 Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys

            165                 170                 175 Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn

        180                 185                 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val

    195                 200                 205 Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln

210                 215                 220 Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe 225                 230                 235                 240 Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met

            245                 250                 255 Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn

        260                 265                 270 Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu

    275                 280                 285 His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met

290                 295                 300 Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser 305                 310                 315                 320 Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu

            325                 330                 335 Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu

        340                 345                 350 Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly

    355                 360                 365 Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile

370                 375                 380 Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His 385                 390                 395                 400 Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp

            405                 410                 415 Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro

        420                 425                 430 Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr

    435                 440                 445 Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser

450                 455                 460 Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr 465                 470                 475                 480 Val Gln Arg <210>5 <211>2604 <212>DNA <213>解淀粉芽孢杆菌 <220> <221>-10信号 <222>(707)..(712) <220> <221>-35信号 <222>(729)..(734) <220> <221>RBS <222>(759)..(762) <220> <221>信号肽 <222>(770)..(862) <220> <221>成熟_肽 <222>(863)..(2314) <220> <221>终止子 <222>(2321)..(2376) <220> <221>CDS <222>(863)..(2314) <400>5 aagcttcaag cggtcaatcg gaatgtgcat ctcgcttcat acttaggttt tcacccgcat 60 attaagcagg cgtttttgaa ccgtgtgaca gaagctgttc gaaaccccgg cgggcggttt 120 gattttaagg ggggacagta tgctgcctct tcacattaat ctcagcggaa aaagaatcat 180 cattgctggc gggggcaatg ttgcattaag aaggctgaaa cggtgtttcc ggaaggcgct 240 gatattaccg tgatcagtct gagcctgcct gaaattaaaa agctggcgga tgaaggacgc 300 atccgctgga ttccccggag aattgaaatg aaagatctca agcccgcttt tttcattatt 360 gccgcgacaa atgaccgagg cgtgaatcag gagatagccg caaacgcttc tgaaacgcag 420 ctggtcaact gtgtaagcaa ggctgaacaa ggcagcgtat atatgccgaa gatcatccgc 480 aaagggcgca ttcaagtatc agtatcaaca agcggggcaa gccccgcaca tacgaaaaga 540 ctggctgaaa acattgagcc tttgatgact gatgatttgg ctgaagaagt ggatcgattg 600 tttgagaaaa gaagaagacc ataaaaatac cttgtctgtc atcagacagg gtatttttta 660 tgctgtccag actgtccgct gtgtaaaaaa taggaataaa ggggggttgt tattatttta 720 ctgatatgta aaatataatt tgtataagaa aatgagaggg agaggaaaca tgattcaaaa 780 acgaaagcgg acagtttcgt tcagacttgt gcttatgtgc acgctgttat ttgtcagttt 840 gccgattaca aaaacatcag cc gta aat ggc acg ctg atg cag tat ttt gaa  892

                     Val Asn Gly Thr Leu Met Gln Tyr Phe Glu

                       1               5                  10 tgg tat acg ccg aac gac ggc cag cat tgg aaa cga ttg cag aat gat   940 Trp Tyr Thr Pro Asn Asp Gly Gln His Trp Lys Arg Leu Gln Asn Asp

             15                  20                  25 gcg gaa cat tta tcg gat atc gga atc act gcc gtc tgg att cct ccc   988 Ala Glu His Leu Ser Asp Ile Gly Ile Thr Ala Val Trp Ile Pro Pro

         30                  35                  40 gca tac aaa gga ttg agc caa tcc gat aac gga tac gga cct tat gat   1036 Ala Tyr Lys Gly Leu Ser Gln Ser Asp Asn Gly Tyr Gly Pro Tyr Asp

     45                  50                  55 ttg tat gat tta gga gaa ttc cag caa aaa ggg acg gtc aga acg aaa   1084 Leu Tyr Asp Leu Gly Glu Phe Gln Gln Lys Gly Thr Val Arg Thr Lys

 60                  65                  70 tac ggc aca aaa tca gag ctt caa gat gcg atc ggc tca ctg cat tcc   1132 Tyr Gly Thr Lys Ser Glu Leu Gln Asp Ala Ile Gly Ser Leu His Ser  75                  80                  85                  90 cgg aac gtc caa gta tac gga gat gtg gtt ttg aat cat aag gct ggt   1180 Arg Asn Val Gln Val Tyr Gly Asp Val Val Leu Asn His Lys Ala Gly

             95                 100                 105 gct gat gca aca gaa gat gta act gcc gtc gaa gtc aat ccg gcc aat   1228 Ala Asp Ala Thr Glu Asp Val Thr Ala Val Glu Val Asn Pro Ala Asn

        110                 115                 120 aga aat cag gaa act tcg gag gaa tat caa atc aaa gcg tgg acg gat   1276 Arg Asn Gln Glu Thr Ser Glu Glu Tyr Gln Ile Lys Ala Trp Thr Asp

    125                 130                 135 ttt cgt ttt ccg ggc cgt gga aac acg tac agt gat ttt aaa tgg cat   1324 Phe Arg Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp His

140                 145                 150 tgg tat cat ttc gac gga gcg gac tgg gat gaa tcc cgg aag atc agc   1372 Trp Tyr His Phe Asp Gly Ala Asp Trp Asp Glu Ser Arg Lys Ile Ser 155                 160                 165                 170 cgc atc ttt aag ttt cgt ggg gaa gga aaa gcg tgg gat tgg gaa gta   1420 Arg Ile Phe Lys Phe Arg Gly Glu Gly Lys Ala Trp Asp Trp Glu Val

            175                 180                 185 tca agt gaa aac ggc aac tat gac tat tta atg tat gct gat gtt gac   1468 Ser Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp

        190                 195                 200 tac gac cac cct gat gtc gtg gca gag aca aaa aaa tgg ggt atc tgg   1516 Tyr Asp His Pro Asp Val Val Ala Glu Thr Lys Lys Trp Gly Ile Trp

    205                 210                 215 tat gcg aat gaa ctg tca tta gac ggc ttc cgt att gat gcc gcc aaa   1564 Tyr Ala Asn Glu Leu Ser Leu Asp Gly Phe Arg Ile Asp Ala Ala Lys

220                 225                 230 cat att aaa ttt tca ttt ctg cgt gat tgg gtt cag gcg gtc aga cag   1612 His Ile Lys Phe Ser Phe Leu Arg Asp Trp Val Gln Ala Val Arg Gln 235                 240                 245                 250 gcg acg gga aaa gaa atg ttt acg gtt gcg gag tat tgg cag aat aat   1660 Ala Thr Gly Lys Glu Met Phe Thr Val Ala Glu Tyr Trp Gln Asn Asn

            255                 260                 265 gcc ggg aaa ctc gaa aac tac ttg aat aaa aca agc ttt aat caa tcc   1708 Ala Gly Lys Leu Glu Asn Tyr Leu Asn Lys Thr Ser Phe Asn Gln Ser

        270                 275                 280 gtg ttt gat gtt ccg ctt cat ttc aat tta cag gcg gct tcc tca caa   1756 Val Phe Asp Val Pro Leu His Phe Asn Leu Gln Ala Ala Ser Ser Gln

    285                 290                 295 gga ggc gga tat gat atg agg cgt ttg ctg gac ggt acc gtt gtg tcc   1804 Gly Gly Gly Tyr Asp Met Arg Arg Leu Leu Asp Gly Thr Val Val Ser

300                 305                 310 agg cat ccg gaa aag gcg gtt aca ttt gtt gaa aat cat gac aca cag   1852 Arg His Pro Glu Lys Ala Val Thr Phe Val Glu Asn His Asp Thr Gln 315                 320                 325                 330 ccg gga cag tca ttg gaa tcg aca gtc caa act tgg ttt aaa ccg ctt   1900 Pro Gly Gln Ser Leu Glu Ser Thr Val Gln Thr Trp Phe Lys Pro Leu

            335                 340                 345 gca tac gcc ttt att ttg aca aga gaa tcc ggt tat cct cag gtg ttc   1948 Ala Tyr Ala Phe Ile Leu Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe

        350                 355                 360 tat ggg gat atg tac ggg aca aaa ggg aca tcg cca aag gaa att ccc   1996 Tyr Gly Asp Met Tyr Gly Thr Lys Gly Thr Ser Pro Lys Glu Ile Pro

    365                 370                 375 tca ctg aaa gat aat ata gag ccg att tta aaa gcg cgt aag gag tac   2044 Ser Leu Lys Asp Asn Ile Glu Pro Ile Leu Lys Ala Arg Lys Glu Tyr

380                 385                 390 gca tac ggg ccc cag cac gat tat att gac cac ccg gat gtg atc gga   2092 Ala Tyr Gly Pro Gln His Asp Tyr Ile Asp His Pro Asp Val Ile Gly 395                 400                 405                 410 tgg acg agg gaa ggt gac agc tcc gcc gcc aaa tca ggt ttg gcc gct   2140 Trp Thr Arg Glu Gly Asp Ser Ser Ala Ala Lys Ser Gly Leu Ala Ala

            415                 420                 425 tta atc acg gac gga ccc ggc gga tca aag cgg atg tat gcc ggc ctg   2188 Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Arg Met Tyr Ala Gly Leu

        430                 435                 440 aaa aat gcc ggc gag aca tgg tat gac ata acg ggc aac cgt tca gat   2236 Lys Asn Ala Gly Glu Thr Trp Tyr Asp Ile Thr Gly Asn Arg Ser Asp

    445                 450                 455 act gta aaa atc gga tct gac ggc tgg gga gag ttt cat gta aac gat   2284 Thr Val Lys Ile Gly Ser Asp Gly Trp Gly Glu Phe His Val Asn Asp

460                 465                 470 ggg tcc gtc tcc att tat gtt cag aaa taa ggtaataaaa aaacacctcc     2334 Gly Ser Val Ser Ile Tyr Val Gln Lys 475                 480 aagctgagtg cgggtatcag cttggaggtg cgtttatttt ttcagccgta tgacaaggtc 2394 ggcatcaggt gtgacaaata cggtatgctg gctgtcatag gtgacaaatc cgggttttgc 2454 gccgtttggc tttttcacat gtctgatttt tgtataatca acaggcacgg agccggaatc 2514 tttcgccttg gaaaaataag cggcgatcgt agctgcttcc aatatggatt gttcatcggg 2574 atcgctgctt ttaatcacaa cgtgggatcc                                  2604 <210>6 <211>483 <212>PRT <213>解淀粉芽孢杆菌 <400>6 Val Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Thr Pro Asn Asp   1               5                  10                  15 Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ala Glu His Leu Ser Asp

         20                  25                  30 Ile Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Leu Ser

     35                  40                  45 Gln Ser Asp Asn Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu Gly Glu

 50                  55                  60 Phe Gln Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ser Glu  65                  70                  75                  80 Leu Gln Asp Ala Ile Gly Ser Leu His Ser Arg Ash Val Gln Val Tyr

             85                  90                  95 Gly Asp Val Val Leu Asn His Lys Ala Gly Ala Asp Ala Thr Glu Asp

        100                 105                 110 Val Thr Ala Val Glu Val Asn Pro Ala Asn Arg Asn Gln Glu Thr Ser

    115                 120                 125 Glu Glu Tyr Gln Ile Lys Ala Trp Thr Asp Phe Arg Phe Pro Gly Arg

130                 135                 140 Gly Asn Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly 145                 150                 155                 160 Ala Asp Trp Asp Glu Ser Arg Lys Ile Ser Arg Ile Phe Lys Phe Arg

            165                 170                 175 Gly Glu Gly Lys Ala Trp Asp Trp Glu Val Ser Ser Glu Asn Gly Asn

        180                 185                 190 Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Tyr Asp His Pro Asp Val

    195                 200                 205 Val Ala Glu Thr Lys Lys Trp Gly Ile Trp Tyr Ala Asn Glu Leu Ser

210                 215                 220 Leu Asp Gly Phe Arg Ile Asp Ala Ala Lys His Ile Lys Phe Ser Phe 225                 230                 235                 240 Leu Arg Asp Trp Val Gln Ala Val Arg Gln Ala Thr Gly Lys Glu Met

            245                 250                 255 Phe Thr Val Ala Glu Tyr Trp Gln Asn Asn Ala Gly Lys Leu Glu Asn

        260                 265                 270 Tyr Leu Asn Lys Thr Ser Phe Asn Gln Ser Val Phe Asp Val Pro Leu

    275                 280                 285 His Phe Asn Leu Gln Ala Ala Ser Ser Gln Gly Gly Gly Tyr Asp Met

290                 295                 300 Arg Arg Leu Leu Asp Gly Thr Val Val Ser Arg His Pro Glu Lys Ala 305                 310                 315                 320 Val Thr Phe Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu

            325                 330                 335 Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu

        340                 345                 350 Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly

    355                 360                 365 Thr Lys Gly Thr Ser Pro Lys Glu Ile Pro Ser Leu Lys Asp Asn Ile

370                 375                 380 Glu Pro Ile Leu Lys Ala Arg Lys Glu Tyr Ala Tyr Gly Pro Gln His 385                 390                 395                 400 Asp Tyr Ile Asp His Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp

            405                 410                 415 Ser Ser Ala Ala Lys Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro

        420                 425                 430 Gly Gly Ser Lys Arg Met Tyr Ala Gly Leu Lys Asn Ala Gly Glu Thr

    435                 440                 445 Trp Tyr Asp Ile Thr Gly Asn Arg Ser Asp Thr Val Lys Ile Gly Ser

450                 455                 460 Asp Gly Trp Gly Glu Phe His Val Asn Asp Gly Ser Val Ser Ile Tyr 465                 470                 475                 480 Val Gln Lys <210>7 <211>1548 <212>DNA <213>嗜热脂肪芽孢杆菌 <220> <221>CDS <222>(1)..(1548) <400>7 gcc gca ccg ttt aac ggc acc atg atg cag tat ttt gaa tgg tac ttg   48 Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu   1               5                  10                  15 ccg gat gat ggc acg tta tgg acc aaa gtg gcc aat gaa gcc aac aac   96 Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn

         20                  25                  30 tta tcc agc ctt ggc atc acc gct ctt tgg ctg ccg ccc gct tac aaa   144 Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys

     35                  40                  45 gga aca agc cgc agc gac gta ggg tac gga gta tac gac ttg tat gac   192 Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp

 50                  55                  60 ctc ggc gaa ttc aat caa aaa ggg acc gtc cgc aca aaa tac gga aca   240 Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr  65                  70                  75                  80 aaa gct caa tat ctt caa gcc att caa gcc gcc cac gcc gct gga atg   288 Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met

             85                  90                  95 caa gtg tac gcc gat gtc gtg ttc gac cat aaa ggc ggc gct gac ggc   336 Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly

        100                 105                 110 acg gaa tgg gtg gac gcc gtc gaa gtc aat ccg tcc gac cgc aac caa   384 Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln

    115                 120                 125 gaa atc tcg ggc acc tat caa atc caa gca tgg acg aaa ttt gat ttt   432 Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe

130                 135                 140 ccc ggg cgg ggc aac acc tac tcc agc ttt aag tgg cgc tgg tac cat   480 Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His 145                 150                 155                 160 ttt gac ggc gtt gat tgg gac gaa agc cga aaa ttg agc cgc att tac   528 Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr

            165                 170                 175 aaa ttc cgc ggc atc ggc aaa gcg tgg gat tgg gaa gta gac acg gaa   576 Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu

        180                 185                 190 aac gga aac tat gac tac tta atg tat gcc gac ctt gat atg gat cat   624 Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His

    195                 200                 205 ccc gaa gtc gtg acc gag ctg aaa aac tgg ggg aaa tgg tat gtc aac   672 Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn

210                 215                 220 aca acg aac att gat ggg ttc cgg ctt gat gcc gtc aag cat att aag   720 Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys 225                 230                 235                 240 ttc agt ttt ttt cct gat tgg ttg tcg tat gtg cgt tct cag act ggc   768 Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly

            245                 250                 255 aag ccg cta ttt acc gtc ggg gaa tat tgg agc tat gac atc aac aag   816 Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys

        260                 265                 270 ttg cac aat tac att acg aaa aca gac gga acg atg tct ttg ttt gat   864 Leu His Asn Tyr Ile Thr Lys Thr Asp Gly Thr Met Ser Leu Phe Asp

    275                 280                 285 gcc ccg tta cac aac aaa ttt tat acc gct tcc aaa tca ggg ggc gca   912 Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala

290                 295                 300 ttt gat atg cgc acg tta atg acc aat act ctc atg aaa gat caa ccg   960 Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro 305                 310                 315                 320 aca ttg gcc gtc acc ttc gtt gat aat cat gac acc gaa ccc ggc caa   1008 Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln

            325                 330                 335 gcg ctg cag tca tgg gtc gac cca tgg ttc aaa ccg ttg gct tac gcc   1056 Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala

        340                 345                 350 ttt att cta act cgg cag gaa gga tac ccg tgc gtc ttt tat ggt gac   1104 Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp

    355                 360                 365 tat tat ggc att cca caa tat aac att cct tcg ctg aaa agc aaa atc   1152 Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile

370                 375                 380 gat ccg ctc ctc atc gcg cgc agg gat tat gct tac gga acg caa cat   1200 Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His 385                 390                 395                 400 gat tat ctt gat cac tcc gac atc atc ggg tgg aca agg gaa ggg ggc   1248 Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Gly

            405                 410                 415 act gaa aaa cca gga tcc gga ctg gcc gca ctg atc acc gat ggg ccg   1296 Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro

        420                 425                 430 gga gga agc aaa tgg atg tac gtt ggc aaa caa cac gct gga aaa gtg   1344 Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val

    435                 440                 445 ttc tat gac ctt acc ggc aac cgg agt gac acc gtc acc atc aac agt   1392 Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser

450                 455                 460 gat gga tgg ggg gaa ttc aaa gtc aat ggc ggt tcg gtt tcg gtt tgg   1440 Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp 465                 470                 475                 480 gtt cct aga aaa acg acc gtt tct acc atc gct cgg ccg atc aca acc   1488 Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Arg Pro Ile Thr Thr

            485                 490                 495 cga ccg tgg act ggt gaa ttc gtc cgt tgg acc gaa cca cgg ttg gtg   1536 Arg Pro Trp Thr Gly Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val

        500                 505                 510 gca tgg cct tga                                                   1548 Ala Trp Pro

    515 <210>8 <211>515 <212>PRT <213>嗜热脂肪芽孢杆菌 <400>8 Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu   1               5                  10                  15 Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn

         20                  25                  30 Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys

     35                  40                  45 Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp

 50                  55                  60 Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr  65                  70                  75                  80 Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met

             85                  90                  95 Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly

        100                 105                 110 Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln

    115                 120                 125 Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe

130                 135                 140 Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His 145                 150                 155                 160 Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr

            165                 170                 175 Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu

        180                 185                 190 Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His

    195                 200                 205 Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn

210                 215                 220 Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys 225                 230                 235                 240 Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly

            245                 250                 255 Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys

        260                 265                 270 Leu His Asn Tyr Ile Thr Lys Thr Asp Gly Thr Met Ser Leu Phe Asp

    275                 280                 285 Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala

290                 295                 300 Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro 305                 310                 315                 320 Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln

            325                 330                 335 Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala

        340                 345                 350 Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp

    355                 360                 365 Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile

370                 375                 380 Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His 385                 390                 395                 400 Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Gly

            405                 410                 415 Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro

        420                 425                 430 Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val

    435                 440                 445 Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser

450                 455                 460 Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp 465                 470                 475                 480 Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Arg Pro Ile Thr Thr

            485                 490                 495 Arg Pro Trp Thr Gly Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val

        500                 505                 510 Ala Trp Pro

    515 <210>9 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>9 ggtcgtaggc accgtagccc caatccgctt g                         31 <210>10 <211>36 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>10 ggtcgtaggc accgtagccc caatcccatt ggctcg                    36 <210>11 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>11 ctgtgactgg tgagtactca accaagtc                             28 <210>12 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>12 ggtcgtaggc accgtagccc tcatccgctt g                         31 <210>13 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>13 ggtcgtaggc accgtagccc atatccgctt g                         31 <210>14 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>14 ggtcgtaggc accgtagcca atatccgctt g                       31 <210>15 <211>36 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>15 gcagcatgga actgctyatg aagaggcacg tcaaac                  36 <210>16 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>16 catagttgcc gaattcattg gaaacttccc                         30 <210>17 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>17 catagttgcc gaattcaggg gaaacttccc aatc                     34 <210>18 <211>41 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>18 ccgcgccccg ggaaatcaaa ttttgtccag gctttaatta g             41 <210>19 <211>32 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>19 caaaatggta ccaataccac ttaaaatcgc tg                       32 <210>20 <211>29 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>20 cttcccaatc ccaagtcttc ccttgaaac                           29 <210>21 <211>36 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>21 cttaatttct gctacgacgt caggatggtc ataatc                   36 <210>22 <211>38 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>22 cgcccaagtc attcgaccag tactcagcta ccgtaaac                 38 <210>23 <211>29 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>23 gccgttttca ttgtcgactt cccaatccc                           29 <210>24 <211>35 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>24 ggaatttcgc gctgactagt cccgtacata tcccc                    35 <210>25 <211>36 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>25 ggcaggaatt tcgcgacctt tcgtcccgta catatc                  36 <210>26 <211>36 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>26 cctcattctg cagcagcagc cgtaaatggc acgctg                  36 <210>27 <211>38 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>27 ccagacggca gtaataccga tatccgataa atgttccg                38 <210>28 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>28 cggatatcgg tattactgcc gtctggattc                         30 <210>29 <211>21 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>29 ctcgtcccaa tcggttccgt c                                  21 <210>30 <211>26 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>30 gatgtatgcc gacttcgatt atgacc                             26 <210>31 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>31 catagttgcc gaattcattg gaaacttccc                         30 <210>32 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>32 ccgattgctg acgctgttat ttgc                               24 <210>33 <211>25 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>33 gccaagcgga taacggctac ggtgc                              25 <210>34 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>34 gaacgagcca atcggacgtg ggctacgg                           28 <210>35 <211>32 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>35 ggaacgagcc aatcggataa cggctacggt gc                      32 <210>36 <211>25 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>36 gcatataagg gactgagcca agcgg                             25 <210>37 <211>25 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>37 caaccacaaa gccggcgctg atgcg                             25 <210>38 <211>41 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>38 gcatataagg gactgagcca atcggataac ggctacggtg c           41 <210>39 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>39 gaacgagccg atcggacgtg ggctacgg                        28 <210>40 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:引物 <400>40 gaacgagcca aaacgacgtg ggctacgg                        28

高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用