α-淀粉酶突变体转让专利

申请号 : CN200410061736.6

文献号 : CN100593034C

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 托宾·V·博彻特阿伦·斯文森卡斯滕·安德森比贾尼·R·尼尔森托宾·L·尼森索伦·克贾鲁尔夫

申请人 : 诺维信公司

摘要 :

本发明涉及亲本类透阿米尔α-淀粉酶的变体,它相对所述亲本α淀粉酶,至少以下性能之一发生改变:i)在pH8到10.5的pH稳定性提高;和/或ii)在pH8到10.5对Ca2+的稳定性提高,和/或iii)在10℃到60℃的温度范围,特异活性增强。

权利要求 :

1.亲本类透阿米尔α-淀粉酶的变体,该变体具有α-淀粉酶活性,并且亲本α-淀粉酶序列为SEQ ID NO:2,其中至少1个突变选自下组:Δ(D183-G184);ΔQ174;M323L;R181S;K185R;A186T,R,I;K311R;N195F;T461P;E346Q;K385R和K269S。

2. 权利要求l的变体,其中所述变体包含(i)A(D183-G184)缺失,和(ii) 至少1个选自下列的突变:AQ174; M323L; R181S; K185R; A186T, R, I; K311R; N195F; T461P; E346Q; K385R和K269S。

3. 权利要求1或2的变体,其在pH8到10.5的pH稳定性提高;并且 具有1或多个对应SEQIDNO:2编号的下列位点的突变:R181S,A186T,和 K311R。

4. 权利要求1或2的变体,其在pH8到10.5对Ca"的稳定性提高,具 有1或多个对应SEQIDNO:2编号的下列位点的突变:K185R; A186T,1, R; N195F; E346Q; K385R。

5. 权利要求1或2的变体,其中所述变体在温度为10到60。C具有增 强的比活性,并具有1个对应SEQ ID NO: 2编号的下列位点的突变: K269S。

6. 权利要求5的变体,其中所述变体在温度为20-50。C具有增强的比活 性,并具有1个对应SEQIDNO:2编号的下列位点的突变:K269S。

7. 权利要求5的变体,其中所述变体在温度为30-4(TC具有增强的比活 性,并具有1个对应SEQ ID NO: 2编号的下列位点的突变:K269S。

8. —种DNA构建体,它含有编码权利要求1-7任何一项所述a-淀粉 酶变体的DNA序列。

9. 一种携带权利要求8所述DNA构建体的重组表达载体。

10. —种用权利要求8所述DNA构建体或权利要求9所述载体进行转 4匕的细月包。

11. 权利要求10的细胞,它是一种微生物细胞。

12. 权利要求11的细胞,它是细菌或真菌。

13. 权利要求12的细胞,它是革兰氏阳性细菌。

14. 权利要求13的细胞,其中所述革兰氏阳性细菌是枯草芽孢杆菌,地衣形芽孢杆菌,迟緩芽孢杆菌,短芽孢杆菌,嗜热脂肪芽孢杆菌,嗜碱芽孢 杆菌,解淀粉芽孢杆菌,凝结芽孢杆菌,环状芽孢杆菌,灿烂芽孢杆菌,或 苏云金芽孢杆菌。

15. 权利要求1-7任何一项所述a-淀粉酶变体用于洗涤和/或清洗餐具 的用途。

16. 含有权利要求1-7任何一项所述a-淀粉酶变体的洗涤剂添加剂,任 选该添加剂是非dusting颗粒,稳定化的液体或被保护的酶。

17. 权利要求16的洗涤剂添加剂,它含有0.02-200mg酶蛋白/g添加剂。

18. 权利要求16或17的洗涤剂添加剂,它还含有选自蛋白酶、脂酶和 过氧化物酶的另 一种酶,另 一种淀粉水解酶和/或纤维素酶。

19. 一种包含权利要求1-7任何一项所述a-淀粉酶变体的洗涤剂组合物。

20. 权利要求19的洗涤剂组合物,它另外包含选自蛋白酶、脂酶和过 氧化物酶的另一种酶,另一种淀粉水解酶和/或纤维素酶。

21. —种手洗或自动餐具洗涤剂组合物,该组合物包含权利要求1-7任 何一项所述的a-淀粉酶变体。

22. 权利要求21的清洗餐具的洗涤剂组合物,该组合物另外包含选自 蛋白酶、脂酶和过氧化物酶的另一种酶,另一种淀粉水解酶和/或纤维素酶。

23. —种手洗或自动的衣物洗涤组合物,该组合物包含权利要求l-7任 何一项所述的a-淀粉酶变体。

24. 权利要求23的衣物洗涤组合物,该组合物另外包含选自蛋白酶、 脂酶和过氧化物酶的另 一种酶,淀粉水解酶和/或纤维素酶。

25. 制备权利要求1的a-淀粉酶的方法, 所述方法包括以下步骤:i) 将两个或多个pH,温度和/或稳定性曲线迥异的cc-淀粉酶的3D结构 之分子动力学进行比较,从而确定(a) a-淀粉酶突变的目标位点和/或区域;ii) 在所确定的位点和/或区域进行1或多个氨基酸的取代,添加和/或 缺失。

26. 权利要求25的方法,其中所述a-淀粉酶至少70%同源。

27. 权利要求26的方法,其中所述a-淀粉酶至少80%同源。

28. 权利要求27的方法,其中所述a-淀粉酶至少卯%同源。

29. 权利要求28的方法,其中所述a-淀粉酶至少95%同源。

30. 权利要求26的方法,其中所比较的a-淀粉酶是类透阿米尔a-淀粉酶。

31. 权利要求30的方法,其中所比较的a-淀粉酶是SEQ ID NO: 1到 SEQ ID NO: 8所示的^壬^f一个a-淀4分酶。

说明书 :

oc-淀粉酶突变体

本申请是题为"a-淀粉酶突变体"的中国专利申请98810871.2的分案 申请。该母案申请是国际申请PCT/DK98/00471,其公开号为WO 99/23211。 技术领域

本发明涉及亲本类透阿米尔(Termamyl-like) oc -淀粉酶的变体(突变体), 其在中温和/或高pH下的活性更高。 背景技术

cc-淀粉酶(cx-l,4-葡聚糖-4-葡聚糖水解酶,EC3.2.1.1)构成这样一组酶, 它们催化淀粉和其他线性及分枝l,4-葡萄糖苷寡-糖和多糖的水解。

有大量专利和科学文献涉及这类工业上非常重要的酶。从例如 WO90/11352, W095/10603, W095/26397, W096/23873和W096/23874可以 知道许多cc-淀粉酶,比如类透阿米尔a-淀粉酶变体。

在更近期的涉及a-淀粉酶的公开文献中,W096/23874提供了一种类 透阿米尔ot-淀粉酶的三维,X-射线晶体结构数据,该酶含有解淀粉芽孢杆菌 a-淀粉酶(BANW)的300个氨基端氨基酸残基以及含有所述氨基酸序列的 地衣形芽孢杆菌a-淀粉酶的羧基端301-483位氨基酸(后者以透阿米尔™ 的商品名出售),因此该酶与工业上很重要的芽孢杆菌a -淀粉酶(其在本文 中包含在术语"类透阿米尔a-淀粉酶"中,该术语特别包括地衣形芽孢杆 菌,解淀粉芽孢杆菌(BAN^)和嗜热脂肪芽孢杆菌(BSG™) ot -淀粉酶)有密 切的关系。W096/23874还描述了在分析亲本类透阿米尔a-淀粉酶之结构 的基础上,设计相对亲本改变了性质的亲本类透阿米尔a-淀粉酶之变体的 方法。

发明简述

本发明涉及新的类透阿米尔oc-淀粉酶的a-淀粉分解酶变体(突变体), 该变体在高pH和中温的洗涤能力(相对亲本a -淀粉酶艰高。

在本发明文中术语"中温"意指IO'C到60X:,优选20。C到50'C,特 别是30'C到40'C。

术语"高pH"意指目前用于洗涤的碱性pH,更具体说是大约pH8到

10.5。

在本发明文中,"低温a-淀粉酶"意指一种在0-30。C的温度范围内具有

5相对最佳活性的CC-淀粉酶。

在本发明文中,"中温oc-淀粉酶,,意指一种在30。C-60。C的温度范围内 具有最佳活性的a-淀粉酶。比如,SP690和SP722a-淀粉酶分别是"中温 oc-淀粉酶"。

在本发明文中,"高温a-淀粉酶,,意指一种在60。C-110。C的温度范围 内具有最佳活性的a-淀粉酶。比如,透阿米尔是一种"高温ot-淀粉酶"。 本发明的变体可以实现这些特性的改变:

类透阿米尔oc-淀粉酶在pH8到10.5的稳定性;和/或在pH8到10.5对 Ca"的稳定性;和/或在10。C-60°C,优选20。C-5(TC,特别是30。C-40。C的特 异活性。

应当注意的是,相对最适温度通常取决于所用的特定pH。换句话i兌, 在例如pH8确定的相对最适温度可能与例如pH10确定的相对最适温度非常 不同。

温度对酶活性的影响

活性部位及其周围的动力学取决于温度和氨基酸组成,并且对一种酶 的相对最适温度有重要意义。通过比较中温和高温cc-淀粉酶的动力学,可 以确定出高温a-淀粉酶在中等温度下的功能关键区域。图2显示了 SP722 a-淀粉酶(SEQ ID NO: 2)和地衣形芽孢杆菌a-淀粉酶(以TermanyKD购自 NovoNodisk)(SEQIDNO: 4)。

图中显示,在中温范围(30-60r), SP722绝对活性的相对最适温度比同 源的地衣形芽孢杆菌a-淀粉酶高,后者在60-10(TC左右具有最佳活性。这 些分布图主要取决于活性部位残基及其周围的温度稳定性和动力学。另外, 活性分布图取决于所用pH和活性部位残基的pKa。

本发明更具体地涉及:

1. 一种亲本类透阿米尔cc-淀粉酶的变体,该变体具有oc-淀粉酶活性, 所述变体包含l或多个突变,其对应于下列SEQIDNO: 2所示氨基酸序列 中的突变:

T141, K142, F143, D144, F145, P146, G147, R148, G149, Q174, R181, G182, D183, G184, K185, A186, W189, S193, N195, H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173, F267, W268, K269, N270, D271, L272, G273, A274, L275, K311, E346, K385, G456, N457, K458, P459, G460, T461,V462,T463。

2. 项1的变体,所述变体有1或多个下列取代或缺失:T"1A,D, R'NfCE^G'H'I'I^K'M'FASAY'V'-F143A,D,R,N,C,E,Q,G,H,工,L,K,M, P,S,T,W, Y,V; Dl"A,R,N,C,E,Q,G,H, I,L,K,M, E\ P, S, T, W, Y, V; F145A, D, R,N,C,E,Q,G,H,I,L,K,M,P,S,T,W,Y,V; P146A,D,R,N,C,E,Q,G,H,I,L;XM,F,S,T, W, Y, V; G147A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V; R148A,D,N,C,E,Q,G,H,I,L,K,M, F, P, S, T, W, Y, V; G149A, D,R,N,C,E,Q,H,I,:L,K,M, F, P,S,T,W, Y'V'-G182*,A,D,R,U,C,E,Q,H,I,L,K,M,F,P,S,T,W,Y,V; D183*,A,R,N,C,E,Q,G,H,I,L,K,M, F, P, S, T, W, Y, V;

WD'^ci'Q^l'l^K'M'F'P'S'T'W'H-KlSSA, D,R,N,C,E,Q,G,H, I,L,M, F, P,S,T, W, Y, V,. A186D,R,N,C,E,Q,G,H,I,L,K,M, F, P, S,T,W,Y,V; W189A,D,R,H,C,E,Q,G,H,工,L,K,M,F,P,S,T,Y,V; S193A, D, R, N, C, E, Q, G, H, I, L, K, M, P, T, W, Y, V/ N195A,D,R,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V; H107A,D,R,N,C,E,Q,G,I,L,K,M,F,P,S,T,W,Y,V; K108A,D,R,N,C,E,Q,G,H,I,:L,M, F, P, S,T,W,Y,V,. G109A,D,R,N,C,E,Q,K,X,L,K,M,F,P,S,T:,W,Y,V; D166A, R, N, C, E, Q, H, I, L, K, M, P, S, T, W, y, V,' W167A,D,R,N,C,E,Q,G,H, I,L, K, M, F, P, S, T, Y, V; D:l68A, R, N, C, E, Q, G, H, I, K, M, F, P,S工W,Y, V'. Q169A,D,R,N,C,E,G,H, I,L,K,M, F, P,S,T, W, Y, V; S1"70A, D,R,N,C,E,Q,G,H, I,L,K,M, F, P,T,W, Y, V; R171A, D,N,C,E,Q,G,H, I,L,K,M, F, P, S, T, W, Y, V'. Q172A, D, R,N,C,E,G,H,I,L,K,M, F, P, S, T, W, Y, V; F173A, D, R,N,C,E,Q,G, H, I,L,K,M, P, S,T,W,Y,V; Q174*,A,D, R,N,C,E,G, H,I,L,K,M, F, P,S,T,W,Y,V; F"267A, D, R,N,C,E,O,G,H,I,L,K,M,E",S,T,W, Y,V; W268A, D, R, N, C, E, Q, G, H, I, L, K, M, F", P, S, T, Y, V'. K263A,D,R,N,C,E,Q,G,H,I,L,M, P, S,T,W, Y, V; N270A,D,R,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V; D271A,R,N,C,E,Q,G,H, I, L, K,M, F, P, S, T, W, Y,V,. L272A, D, R, N, C, E, Q, G,H, I, K, M, F", P, S,T, W, Y, V; G273A,D, R,N,C,E,Q,H,I,L,K,M,E",P,S,T,W,Y,V; A274D,R,N,C,E,Q,G,H, I,L,K,M,F, P, S,T,W, Y,V,.

7L27 5A, D,R,N,C, E, Q, G,H, I,K,M, F, P, S,T, W, Y, V,-K311A,D,R,N,C,E,Q,G,H, I, L,M, F, P, S, T, W, Y, V;

E34 6A,D,R,H, c, Q,G,H,I, K, L, s, T, w, Y,

K385A, D,R,N, c, E,Q,G,H, I, L, s, T, w, Y, V;

G456A, D,R, N, c, E,Q,H,I, L, K, s, T, w, Y, V;

N457A, D,R, C, E, Q,G,H,I, L, M, F,P, s, T, w, Y,

K458A,D,R,U, c, E,Q,G,H, I, L, M,r,p, s, T, w, Y,

P459A,D,R,N, c, E,Q,G,H, I, L, K,M,F, s, T, w, Y, v?

G460A, D,R,N, c, E,Q,H,I, L, K, M, F, P, s, T, w, Y, V;

T461A, D,R,N, c, E,Q,G,H, I, I, p, s, w, Y, v,.

V462A,D,R,N, c, E,Q,G,H, I, !», K,M,F, p, T, W,

T4 63A, D,R,N, c, E,Q,G,H, I, K,M,F, p, s, w, Y, V.

3. 项2的变体,其中所述变体有1或多个下列取代或缺失:

K"2R'. S193P,' N195F; K269R,Q,' W70Y,R,D,' K3UR'. E346Q; K385R; K458R,' P459T,' T461Pf Q174" R181Q,N,S, G182T,S,N'. D183" G184" K1B5A,R,D,C,E,Q,G,H, I,L,M,N, F,P,S,T,W,Y, V; Al86T, S,U, I'V'R'-

WIS^SK^

4. 项1-3的变体,其中所述变体在D183+G184位点缺失,还有1或多 个下列取代或缺失:K142R; S193P; N195F; K269R, Q; N270Y, R, D; K311R; E346Q; K385R; K458R; P459T; T461P; Q174*; R181Q,N,S; G182T,S, N; D183*; G184*; K185A,R,D,C,E,Q,(iH,I,L,M,N,F,P, S,T, W,Y, V; A186T,S,N,I,V,R; W189T, S,N,Q。

5. 项l-4任何一项的变体,其中相对亲本a-淀粉酶所述变体至少下列 性能之一发生改变:

i) 在pH8到10.5的pH稳定性提高;和/或

ii) 在pH8到10.5的Ca2+稳定性提高,和/或

iii) 在温度为10到60。C,优选20-50"C,特别是30-40t:特异活性增强。

6. 项l-5任何一项的变体,在pH8到10.5稳定性提高,具有l或多个 对应下列位点(使用SEQIDNO: 2的编号)的位点的突变:T141,K142,F143, D144, F145, P146, G147, R148, G149, R181, A186, S193, N195, K269, N270, K311,K458,P459,T461。

7. 项6的变体,该变体具有1或多个下列取代:

T141A, D, R,N,C,E,Q,G,H,I,:L,K,M, F,P,S,W, Y,V'• K:U2A,D,R,^1,C,E,Q,G,H,I,L,M,F,P,S,T,W, Y,V; F14 3A, D, R,N,C,E,Q,G,H, I,L,K,M, P, S, T, W, Y, V,' D144A, R,N,C,E,Q,G,H, I,L,K,M, F, P,S,T,W, Y,V;F145A, D'RACE'C^G'H^I^K'M'PzS'TrWAV'-PnSA, D, R,N,C, E,Q,G, H, I,L,K,M, F, S, T, W, Y, V,-G14"7A, D, R,N,C,E,Q,H, I,!L,K,M, F, P, S,T,W, ^V'-RHSA, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V'-GMSA, D, R, N, C, E, Q, H, I, L, K,M, F, P, S, T, W, Y, V; K181A,D,R,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V; A186D, R, N, C, E, Q, G, H, I, L, P, K, M, F, S, r, W, Y, S193A,D,R,N,C,E,Q,G,H,I,L,K,M,F,P,T,W,Y,V; N195A, D,R,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V,. K269A,D,R,N,C,E,Q,、G,H,I,L,M,F, E^S-TAH-l^OA'D'R'C'E'Q'G'H'IfL'K'M'F'P'S'T'WfY'V; K311A, D,R,N,C, E,Q,G,H, I,L,M, F, P, S, T, W, Y, V; 'K458A, D, R,N,C,E,Q,G,H, I,L,M, F, P, S, T, W, Y, V,' P4 59A, D, R, N, C,E,Q,G,H, I,L, K,M, F,S,T, W, Y, V,. T461A, D,R,N,C,E,Q,G,H, I,L,K,M,F,P,S,W,Y,V.

8. 项7的变体,该变体具有1或多个下列取代:K142R,R181S,A186T, S193P, N195F, K269R, N270Y, K311艮K458R, P459T和T461P。

9. 项l-5的变体,在pH8到10.5对Ca"的稳定性提高,具有l或多个 对应下列位点(使用SEQIDNO:2的编号)的突变:R181, G182, D183, G184, K185, A186, W189, N195, N270, E346, K385, K458, P459。

10. 项9的变体,该变体具有l或多个下列取代或缺失: R:l81*, A, D,N,C, E,Q,G, H, I,L, K,M, F, P, S,T,W, Y, V'-Gm*, A, D, R,N,C,E,Q,H, I,:L,K,M, F, P, S, T, W, Y, V; [)18 3*, A,R,N,C,E,Q,G,H, I, L, K,M, F, P, S, T, W, Y, V; G18", A, R, D, N,C,E,Q,H, I'l^UF^P'S'TAY-V'-KlSSA, D,R,N,C,E,Q,G,H,I,L,M, F,P,S,T,W,Y,V; A186D,R,N,C,E,Q,G,H, I,L,K,M, F, P'S'T'W'Y'V'-WISSA, D, R,N,C,E,Q,G,H, I,L,K,M, F, P, S,T, Y,V,' N195A, D, R,C, E,Q,G,H, I,L,K,M, F, P,S,T, W, Y,V;

N270A,R, D,N,C,E,Q,H, I,L,K,M,F, P, S, T, W, Y, V;

E346A,R, D,N,C,Q,G,H, I, L, K, M, F, P, S, T, W, Y, V;

K385A,R,D,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V;

K458A,R, D,N,C,E,Q,G,H,I,:L,M, F,P,S,T,W, Y,V;

P4 59A,R, D,N,C,E.,Q,G,H, I,L,K,M,F,S,T,W, Y, V.

11. 项10的变体,k中所述变体具有l或多个下列取代或缺失: R181Q,N; G182T,S,N; D183*; G184*; K185A, R, D, C, E, Q, Q H, I,

L, M, N, F, P, S, T, W, Y, V; A186T, S, N, I, V; W189T, S, N, Q; N195F; N270R, D; E346Q; K385R; K458R; P459T。

912. 项l-ll的变体,其中所述亲本类透阿米尔a-淀粉酶选自:

具有SEQIDNO: 1所示序列的芽孢杆菌菌抹NCIB12512cc-淀粉酶; 具有SEQ ID NO: 5所示序列的解淀粉芽孢杆菌a -淀粉酶; 具有SEQ ID NO: 4所示序列的地衣形芽孢杆菌a -淀粉酶。

13. 项l-5的变体,在10-60。C,优选20-50。C,特别是30-40。C的温度 范围内特异活性提高,在l或多个下列位点(使用SEQIDNO: 2的编号)具 有突变:H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173, Q174, D183, G184, N195, F267, W268, K269, N270, D271, L272, G273, A274, L275, G456, N457, K458, P459, G460, T461, V462, T463。

14. 项13的变体,该变体含有1或多个下列取代:

H107A,D,R,N,C,E,Q,G,I,L,K,M,E",P,S,T,W, Y'V'-KlOBA'D'IUCE'Q'GfH'I'L'M, F,P,S,T,W, Y'V'-GIOSA, D,R,N,C,E,Q,H,I,L,K,M,F,P,S,T,W,Y,V;

D166A,R,N,C,E,Q,G,H,I,L,K,M, F, P, S, T, W, Y, V; W167A, D, R,N,C,E,Q,G,H,工,L,K,M, F,P,S,T, Y, V'-D168A, R,N,C, E,Q,G,H, I,L,K,M, F,P,S,T,W, Y, V; Q169A, D,R,N,C,E,G,H, I,L,K,M, F, P,S,T,W, Y, V; S1豫,D,R,N,C,E,Q,G,H,I,L,K,M, F, P,T,W, Y'V'-RmA, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V'. Q172A, D,R,N,C,E,G,H, I,L,K,M, F, P, S, T, W, V;

F17 3A, D,R,N,C,E,Q,G,H, I,JL,K,M,P,S,T,W, Y,V'.

Q17", A, D,R,N,C, E,G,H, I,:L,K,M, P, S,T,W, Y, V;

D183*, A, D,R,N,C,E,Q,G,H,I,L,K,M,F,P,S,W,Y,V;

G18",A,R,N,C,E,Q,G,H,I,L,K,M, F, P, S, T, W, Y, V;

N195A,D,R,C,E,Q,G,H, I, K, M, F, P, S, T, W, Y, V,.

F267A,D,R,N,C,E,Q,G,H,I,L,K,M, P,S,T,W,Y,V'.

W268A,D,R,N,C,E,Q,G,H,I,L,K,M, F1, P,S,T, Y,V,• K269A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S,T,W,Y,V;

N2豫,D,R,C,E,Q,G,H, I,L,K,M, F, P, S, T, W, Y, V'. D271A,R,N,C,E,Q,G,H, I,L,K,M, F, P, S, T, W, Y, V'.

L2"?2A,D,R,N,C,E,Q,G,H, I,K,M, F, P, S,T, W, Y, V; G273A, D,R,N,C,E,Q,H, I,L, K,M, F, P,S,T,W,Y, V; A274D,R,N,C,E,Q,G,H, I, L, K, M, F, P, S, T, W, Y, V'-I^SA, D, R, N, C, E, Q, G, H, I, K, M, F,P,S,T,W,Y,V; G4 56A,D,R,N,C,E,Q,H,I,L,K,M, F1, P, S, T, W, Y, V,' M57A,D,R,C,E,Q,G,H, I,L,K,M, F, P, S,T, W, Y, V; K458A,D,R,N,C,E,Q,G,H, I,L,M, F, P, S, T, W, V,. P459A,D,R,N,C,E,Q,G,H, I,L, K,M, F, S,T,W, Y, V;

10G4 60A,D, R,N,C, E,Q,H, I,L,K,M, F, E>, S'T^W'H-TASlA^Rf^C'E'Q'G'H, I,L,K,M,F, P,S,W,Y,V; V4 62A,D,R,N,C,E,Q)G,H, I, L, K,M,F,P,S,T,W,Y; T463A, D, R, N, C, E, Q, G, H, I,L,K,M,F, P,S,W,Y,V,

15. 项14的变体,其中所述变体含有l或多个下列取代或缺失: Q174*, D183*, G184*, N195F, K269S。

16. 项13-15的变体,其中所述亲本类透阿米尔ct-淀粉酶是具有SEQ ID NO: 4所示序列的地衣形芽孢杆菌ot -淀粉酶。

17. —种DNA构建体,它含有编码项l-16任何一项所述a-淀粉酶变 体的DNA序列。

18. —种携带项17所述DNA构建体的重组表达载体。

19. 一种用项17所述DNA构建体或项18所述载体进行转化的细胞。

20. 项19的细胞,它是一种微生物细胞。

21. 项20的细胞,它是细菌或真菌。

22. 项21的细胞,它是革兰氏阳性细菌,比如枯草芽孢杆菌,地衣形 芽孢杆菌,迟緩芽孢杆菌,短芽孢杆菌,嗜热脂肪芽孢杆菌,嗜碱芽孢杆菌, 解淀粉芽孢杆菌,凝结芽孢杆菌,环状芽孢杆菌,灿烂芽孢杆菌,或苏云金 芽孢杆菌。

23. 项1-16任何一项所述a-淀粉酶变体用于洗涤和/或清洗餐具的用途。

24. 含有项l-16任何一项所述a-淀并分酶变体的洗涤剂添加剂,任选该 添加剂是非dusting颗粒,稳定化的液体或被保护的酶。

25. 项24的洗涤剂添加剂,它含有0.02-200mg酶蛋白/g添加剂。

26. 项24或25的洗涤剂添加剂,它还含有另一种酶,比如蛋白酶,脂 酶,过氧化物酶,另一种淀粉水解酶和/或纤维素酶。

27. —种包含项l-16任何一项所述a-淀粉酶变体的洗涤剂组合物。

28. 项27的洗涤剂组合物,它另外包含另一种酶,比如蛋白酶,脂酶, 过氧化物酶,另一种淀粉水解酶和/或纤维素酶。

29. —种手洗或自动餐具洗涤剂组合物,该组合物包含项1-16任何一 项所述的a-淀粉酶变体。

30. 项29的清洗餐具的洗涤剂组合物,该组合物另外包含另一种酶, 比如蛋白酶,脂酶,过氧化物酶,另一种淀粉水解酶和/或纤维素酶。

31. —种手洗或自动的衣物洗涤组合物,该组合物包含项1-16任何一项所述的CX-淀4分酶变体。

32. 项31的衣物洗涤组合物,该组合物另外包含另一种酶,比如蛋白 酶,脂酶,过氧化物酶,淀粉水解酶和/或纤维素酶。

33. 制备oc-淀粉酶的方法,该a-淀粉酶具有

1) 改变了的pH最佳值,和/或

2) 改变了的温度最佳值,和/或

3) 稳定性提高, 所述方法包括以下步骤:

i) 将两个或多个pH,温度和/或稳定性曲线迥异的a-淀粉酶的3D结构 之分子动力学进行比较,从而确定(a)a-淀粉酶突变的目标位点和/或区域;

ii) 在所确定的位点和/或区域进行1或多个氨基酸的取代,添加和/或 缺失。

34. 项33的方法,其中将一种中温a-淀粉酶与一种高温ot-淀粉酶进 行比较。

35. 项33的方法,其中将一种低温a-淀粉酶与一种中温或高温a-淀 粉酶进行比较。

36. 项33-35的方法,其中所述a-淀粉酶至少70%,优选80%,达到 90%,比如达到95%,尤其是95%同源。

37. 项36的方法,其中所比较的a-淀粉酶是类透阿米尔a-淀粉酶。

38. 项28的方法,其中所比较的a-淀粉酶是SEQIDNO: 1到SEQID NO: 8所示的任何一个cc-淀粉酶。

本发明更进一步涉及编码本发明所述变体的DNA构建体;制备本发明 所述变体的方法;以及本发明所述变体单独地或与其他酶结合,在各种工 业产品或方法中的用途,例如,用在洗涤剂中或用于淀粉液化。

本发明最后一个方面涉及生产a-淀粉酶的方法,该酶的最适pH,和/ 或最适温度发生改变,和/或稳定性提高。

命名法则

在本说明书和项书中,使用了氨基酸残基的常规单字母和三字母编码。 为了便于参考,采用以下命名法则来描述本发明的ot-淀粉酶变体: 原氨基酸:位点:取代氨基酸

根据这一命名原则,例如在第30位丙氨酸到天冬酰胺的取代应表示为: Ala30Asn 或A30N在同 一位点的丙氨酸缺失表示为: Ala30* 或A30*

添加的氨基酸残基,比如赖氨酸插入表示为: Ala30AlaLys 或A3 OAK

连续的氨基酸残基片段,比如30-33位氨基酸残基缺失表示为(30-33)* 或A(A30-N33)。

当特定cc-淀粉酶与其他ct-淀粉酶相比含有一个"缺失",并且在该位 点做了一个插入,这种情况表示为(对于36位插入了一个天冬氨酸): 36Asp 或36D 多重突变用加号隔开,即: Ala30Asp+Glu34Ser或A30N+E34S

代表在30和34位分别将丙氨酸和谷氨酸取代为天冬氨酸和丝氨酸。 当在一个给定位点可以插入1或多个可选择的氨基酸残基时,将其表 示为:

A30N, E或 A30N或A30E

另外,当本文中确定了一个适合进行修饰的位置而没有建议具体的修 饰方式,应当理解为可以用任何氨基酸残基来取代该位点的氨基酸残基。 因此,例如,如果提及30位的丙氨酸修饰,但没有具体化,应当理解可以 将该丙氨酸缺失或用任何其他氨基酸来取代它,即下列之一的氨基酸:R,N, D, A, C, Q, E, G H, I, L, K, M, F, P, S, T, W, Y, V。

附图说明

图l是6个亲本类透阿米尔ci-淀粉酶的氨基酸序列对比。最左端的数 字代表下列各氨基酸序列: 1: SEQIDNO: 2 2: Kaoamyl 3:SEQIDN0: 1 4:SEQIDNO: 5 5:SEQIDNO: 4 6:SEQIDNO: 3
图2显示SP722(SEQ ID NO: 2)(pH9)和地衣形芽孢杆菌cc-淀粉酶(SEQ ID NO: 4)(pH7.3)的温度活性关系图。
13图3显示SP690(SEQIDNO: 1), SP722(SEQ ID NO: 2),地衣形芽孑包杆 菌oc-淀粉酶(SEQIDNO: 4)在pH10的温度分布图。
图4是5个ct-淀粉酶的氨基酸序列对比。最左端的数字代表下列各氨 基酸序列:
1: amyp-小鼠
2: amyp-大鼠
3: amyp-猪猪胰腺oc-淀粉酶(PPA) 4: amyp-人
发明详述
类透阿米尔oc-淀粉酶
众所周知,芽孢杆菌亚种所产生的许多a-淀粉酶在氨基酸水平上同源 性极高。例如,发现包含SEQIDNO: 4所示氨基酸序列的地衣形芽孢杆菌 a-淀粉酶(商品名为透阿米尔TM)与包含SEQIDNO: 5所示氨基酸序列的解 淀粉芽孢杆菌a-淀粉酶大约89%同源,与包含SEQIDNO: 3所示氨基酸 序列的嗜热脂肪芽孢杆菌a-淀粉酶大约79%同源。其他的同源a-淀粉酶包 括来源于芽孢杆菌菌林NCIB 12289, NCIB12512, NCIB12513或DSM9375的 a -淀粉酶(这些在W095/26397中都有详细的描述)以及Tsukamoto等描述过 的ct-淀粉酶(生物化学和生物物理研究通讯,151(1988), 25-31页,参见SEQ ID NO: 6)。
其他同源cc-淀粉酶包括EP0252666中描述的地衣形芽孢杆菌 (ATCC27811)产生的oc-淀粉酶,以及WO91/00353和W094/18314中鉴定到 的oc-淀粉酶。在产品Opt池ermTM和Takatherm™(Solvay有售),Maxamyl™ (Gist-brocades/Genencor 有售),Spezym AA™和 Spezym Delta AATM (Genencor有售)以及Keistase™ (Daiwa有售)中含有其他一些商品类透阿米 尔地衣形芽孢杆菌a -淀粉酶。
由于发现这些a -淀粉酶之间有极大的同源性,可以认为它们属于同类 a-淀粉酶,即"类透阿米尔a-淀粉酶,,类。
因此,在本文中,术语"类透阿米尔ct-淀粉酶"意指这类a-淀粉酶, 它在氨基酸水平上与透阿米尔TM(即具有文中SEQ ID NO: 4所示氨基酸序 列的地衣形芽孢杆菌a-淀粉酶)有极大的同源性。换句话说,以下所有具有SEQ ID NO: 1, 2, 3, 4, 5, 6, 7或8所示氨基酸序列,或者W095/26397中的 SEQ ID NO: 1所示氨基酸序列(与此处SEQ ID NO: 7所示氨基酸序列相同) 之ct -淀粉酶或者W095/26397中的SEQ ID NO: 2所示氨基酸序列(与此处 SEQ ID NO: 8所示氨基断列相同)或者Tsukamoto等文中(1988,该氨基 酸序列在文中见SEQIDNO: 6)之a-淀粉酶都被认为是"类透阿米尔a-淀 粉酶"。其他的类透阿米尔a-淀粉酶是这样一些cc-淀粉酶:i)与SEQ ID NO: 1-8所示氨基酸序列中的至少一个有至少60%,比如至少70%(例如至少 75%),或至少80%(例如至少85%),至少90%或至少95%同源,和/或ii)与 至少一个所述cc-淀粉酶的抗体有免疫交叉反应,和/或iii)由这样一种DNA 序列编码,这些序列能与编码以上特定a-淀粉酶的DNA序列进行杂交, 根据本申请的SEQIDNO: 9, 10,11或12(这些编码序列分别编码此处SEQ ID NO: 1, 2, 3, 4和5所示的氨基酸序列),W095/26397中的SEQ ID NO: 4(文中SEQ ID NO: 13显示了该DNA序列和终止密码子TAA,并编码文 中SEQ ID NO: 8所示的氨基酸序列)以及W095/26397中的SEQ ID NO: 5(文中SEQ ID NO: 14所示)很容易得到这些序列。
对于特性i),可以借助任何常规算法来确定"同源性",优选利用GCG 程序包7.3版本(1993年6月)中的GAP程序,该程序中GAP罚分采用缺省 值,即GAP生成罚分为3.0, GAP延伸罚分为O.l(Genetic computer group(1991)GCG程序包程序手册,版本7, 575 Science Drive, Madison, Wisconsin, USA53711)。
可以利用透阿米尔(SEQ ID NO: 4)和类透阿米尔oc-淀粉酶之间的结构 对比来鉴定其他类透阿米尔oc-淀粉酶中的等同/相应位点。获得所述结构对 比的 一个方法是利用GCG程序包中的Pile Up程序,该程序中GAP罚分采 用缺省值,即GAP生成罚分为3.0, GAP延伸罚分为O.l。其他结构对比方 法包括疏水簇分析(Gaboriaud等,(l卯7), FEBS快报224, 1M-155页)和反 相成丝技术(reversethreading)(HuberT,Torda, AE,蛋白质科学,7巻,1期: 142-149(1998))。
可以利用抗相关类透阿米尔oc -淀粉酶的至少 一个表位,或者与之反应 的抗体来检测a-淀粉酶的特性ii),即免疫交叉反应性。可以通过本领域的 已知方法,例如Hudson等(实用免疫学,笫3版(1989), Blackwell Scientific Publications)描述的方法来制备单克隆或多克隆抗体。可以利用本领域已知 的检测方法(这类例子有Western印迹或者Hudson等(1989)描述的径向免疫
15扩散法)来确定免疫交叉反应性。就这方面而言,发现具有SEQIDNO: 1,2, 3,4, 5, 6, 7或8所示氨基酸序列的cc -淀粉酶之间分别有免疫交叉反应。
可以在所研究的ct-淀粉酶的全长或部分核苷酸或氨基酸序列的基^?出上 适当地制备到用于根据特性iii)来鉴定类透阿米尔a-淀粉酶的寡核苷酸探 针。
检测杂交的适宜条件包括在5 x SSC中预浸泡,于〜40'C在含有20%曱 酰胺,5 x Denhardt's溶液,50mM磷酸钠(pH6.8)以及50mg超声变性小牛胸腺 DNA的溶液中预杂交1小时,然后于〜40'C在补充有100mMATP的同一溶 液中杂交18小时,随之将滤膜洗3次,每次在2 x SSC, 0.2%SDS中于40°C(低 严格性),优选50'C(中等严格性),更优选65'C(高严格性),还要优选的是 ~75'C(极高严格性)洗30分钟。有关杂交方法的其他细节可见Sambrook等, 分子克隆:实验手册,第2版,Cold Spring Harbor,1989.
在本文中,"来源于"不仅是指由所研究的微生物菌林产生或能产生的 oc-淀粉酶,也指分离自该菌林的DNA序列所编码的,并在用所述DNA序 列转化的宿主微生物中产生的cc-淀粉酶。最后,该术语意指这样的a-淀粉 酶,它由合成的和/或cDNA来源的DNA序列编码并且具备所述oc-淀粉酶 的鉴定特征。该术语还用来表示亲本a-淀粉酶可以是天然存在的a-淀粉酶 的变异体,即由天然存在的a-淀粉酶的1或多个氨基酸残基经过修饰(插入, 取代,缺失)所产生的变体。
条本杂交a-淀粉酶
亲本a-淀粉酶(即主链a-淀粉酶)可以是一种杂交a-淀粉酶,即包含组 合在一起的来源于至少两个a -淀粉酶的部分氨基酸序列。
亲本杂交a-淀粉酶可以是这样的酶,在氨基酸同源性和/或免疫杂交反 应性和/或DNA杂交(如上所述)的基础上可以确定它属于类透阿米尔a-淀 粉酶家族。在这种情况中,杂交a-淀粉酶通常包含类透阿米尔oc-淀粉酶的 至少一部分和1或多个其他a-淀粉酶的1个或多个部分,后者选自微生物 (细菌或真菌)和/或哺乳动物来源的类透阿米尔a-淀粉酶或非类透阿米尔a -淀粉酶。
因此,亲本杂交a-淀粉酶可以包括来源于至少两个类透阿米尔a-淀粉 酶,或者来源于至少一个类透阿米尔a-淀粉酶和至少一个非类透阿氷尔细 菌a-淀粉酶,或者来源于至少一个类透阿米尔和至少一个真菌a-淀粉酶的 部分氨基酸序列的组合。来源于部分氨基酸序列的类透阿米尔a-淀粉酶可以是,例如文中提到的那些特定类透阿米尔Ct-淀粉酶中的任何一个。
例如,亲本Ct-淀粉酶可以包括来源于地衣形芽孢杆菌菌抹的Ct-淀粉酶
的羧基端部分和来源于解淀粉芽孢杆菌菌林或嗜热脂肪芽孢杆菌菌抹的a-淀粉酶的氨基端部分。例如,亲本a-淀粉酶可以包括地衣形芽孢杆菌a-淀粉酶的羧基端部分的至少430个氨基酸残基,还可以,例如,包括a)与 具有SEQ ID NO: 5所示氨基酸序列的解淀粉芽孢杆菌oc -淀粉酶的37个氨 基端氨基酸残基相对应的氨基酸片段和与具有SEQ ID NO: 4所示氨基酸序 列的地衣形芽孢杆菌ct-淀粉酶的445个羧基端氨基酸残基相对应的氨基酸 片段,或者杂交类透阿米尔a-淀粉酶与透阿米尔序列(即SEQIDNO: 4所 示的地衣形芽孢杆菌ct-淀粉酶)相同,除了氨基端的35个氨基酸残基被 BAN(成熟蛋白质)(即SEQIDNO: 5所示的解淀粉芽孢杆菌cc-淀粉酶)的氨 基端33个残基(成熟蛋白质)取代;或者包括b)与具有SEQIDNO: 3所示 氨基酸序列的嗜热脂肪芽孢杆菌a-淀粉酶的68个氨基端氨基酸残基相对 应的氨基酸片段和与具有SEQIDNO: 4所示氨基酸序列的地衣形芽孢杆菌 oc-淀粉酶的415个羧基端氨基酸残基相对应的氨基酸片段。
另一合适的亲本杂交cc-淀粉酶是先前在W096/23874(Novo Nordisk申 请)中描述的酶,该酶由BAN(解淀粉芽孢杆菌ct-淀粉酶)的氨基端(成熟蛋 白质的1-300位氨基酸)和透阿米尔的羧基端(成熟蛋白质的301-483位氨基 酸)构成。通过将上述杂交oc-淀4分酶(BAN: 1-300/透阿米尔:301-483)的1 或多个以下位点取代使其活性提高:Q360, F290和N102。尤其有意义的 取代是1或多个以下取代:Q360E, D; F290A, C, D, E, Q H, I, K, L, M, N, P, Q, R,S,T;廳2D,E。
SEQ ID NO: 2所示SP722 a -淀粉酶中的相应位点是S365, Y295, N106 中的1或多个。在SEQIDNO: 2所示a-淀粉酶中尤其有意义的相应取代 是S365D, E; Y295A, C, D, E, Q H, I, K, L, M, N, P, Q, R, S, T;以及N106D, E 中的1或多个。
SEQ ID NO: 1所示SP6卯cc -淀粉酶中的相应位点是S365, Y295, N106 中的l或多个。尤其有意义的相应取代是S365D,E; Y295A, C, D, E, Q H, I, K, L, M, N, P, Q, S, T;以及N106D, E中的1或多个。
上面提到的非类透阿米尔a-淀粉酶可以,例如,是(与类透阿米尔a-淀粉酶不同的)真菌a-淀粉酶,哺乳动物或植物a -淀粉酶或者细菌a-淀粉 酶。这类a-淀粉酶的具体例子包括米曲霉TAKAa-淀粉酶,黑曲霉酸a-淀粉酶,枯草芽孢杆菌ct-淀粉酶,猪胰腺a-淀粉酶和大麦cc-淀粉酶。戶斤有 这些a-淀粉酶的结构与文中所述的典型类透阿米尔a-淀粉酶的结构显著 不同。
上面提到的真菌a-淀粉酶,即来源于黑曲霉和米曲霉,在氨基酸7jc平 上同源性极高,通常认为属于同族a-淀粉酶。来源于米曲霉的真菌ot-淀粉 酶以商品名FungamylTM销售。
另外,如果类透阿米尔cc-淀粉酶的特定变体(本发明的变体)是指一以 常规方式一特定类透阿米尔ot-淀粉酶的氨基酸序列中的特异氨基酸残基发 生的修饰(例如缺失或取代),那么应将其理解为涵盖了在等同位点(由各氨 基酸序列之间的最可能氨基酸对比所确定的)进行修饰的另一个类透阿米尔 a-淀粉酶的变体。
在本发明的一个优选实施方案中,cc -淀粉酶主链来源于地衣形芽;包杆 菌(与亲本类透阿米尔oc-淀粉酶一样),例如前面提到过的,比如具有SEQID NO:4所示氨基酸序列的地衣形芽孢杆菌ct-淀粉酶。
本发明变体的改变特性
以下讨论存在于本发明的变体中的突变与可能由该突变导致的预期性 状变化(相对亲本类透阿米尔oc-淀粉酶的这些性状)^间的关系。 在pH8-10.5的稳定性提高
在本发明文中,对于实现在高pH下稳定性提高有重要意义的突变(包 括氨基酸取代)包括与SP722 ot -淀粉酶(具有SEQ ID NO: 2所示氨基酸序列) 中的1或多个下列位点所发生的突变相对应的突变:T141, K142, F143, D144, F145, P146, G147, R148, G149, R181, A186, S193, N195, K269, N270, K311, K458,P459,T461。
本发明的变体具有1或多个下列取代(使用SEQ ID NO: 2的编号):
T141A, D,R,N,C,E,Q,G,H, I,L,K,M, F, P,S,W, Y, V; K142A,D,R,N,C,E,Q,G,H,I,L,M, F, P, S, T, W, Y, V'. F143A,D,R,N,C,E,Q,G,H, I,L,K,M, P,S,T,W, Y, V; D144A,R,N,C,E,Q,G,H, I,L,K,M, F, P, S,T, W, Y, V; n45A,D,R,N,C,E,Q,G,H,I,L,5,M,P,S,T,W,Y,V; P146A,D,R,N,C,E,Q,G,H, I,L,K,M,F,S,T,W, Y'V-Gll^A'D^N'CE'aH'UK'M, F,P,S,T,W,Y,V,' R148A,D,N,C,E,Q,G,H,工,L,K,M, F, E>, S, T, W, Y, V,. G149A,D,R,N,C,E,Q,H,I,L,K,M, F, P, S, T, W, Y, V;
18k181a, D,r,n,C,E,q,G,h,工,:l,M, F, P, S,T,W, YzV'-AlSGD'RfN'C'E'Q'G'H'IfL'P'KfM'F'S'T'W, Y,V; S193A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V; N195A,D,R,C,E,Q,G,H, I,L,K,M, F, P,S,T,W, Y, V; K269A,D,R,N,C,E,Q,G,H,I,L,M,F,P,S,T,W, Y'V'-l^OAfDfR'CEfQ'G'H,:!:,!^ K,M, F,P,S,T,W,Y,V; K311A,D,R,N,C,E,Q,G,H, I,L,M, F,P, S,T,W, Y, V; K458A,D,R,N,C,E,Q,G,H, I,L,M, F, P, S, T, W, V,. P459A,D,R,N,C,E,Q,G,H, I,L,K,M,F,S,T,W,Y,V; T461A,D,R,N,C,E,Q,G,H, I,L,K,M,F,P,S,W,Y,V.
优选的高pH稳定性变体包括SP722 a-淀粉酶(具有SEQ ID NO: 2所
示氨基酸序列)中的1或多个下列取代:
K142R, R181S, A186T, S193P, N195F, K269& N270Y, K311R, K458R, P459T和T461P。
在具体实施方案中,用具有SEQ ID NO: 1所示序列的芽孢杆菌菌抹 NCIB12512a-淀粉酶,或者具有SEQ ID NO: 3所示序列的嗜热脂肪芽孢 杆菌a-淀粉酶,或者具有SEQIDNO: 4所示序列的地衣形芽孢杆菌a-淀 粉酶,或者具有SEQIDNO: 5所示序列的解淀粉芽孢杆菌ot-淀粉酶作为 主链,即亲本类透阿米尔ct-淀粉酶来进行这些突变。
从图1的对比结果可以看到,嗜热脂肪芽孢杆菌oc-淀粉酶在与SP722 中的N270对应的位点已有一个酪氨酸。另外,芽孢杆菌菌抹NCIB12512 a-淀粉酶,嗜热脂肪芽孢杆菌ct-淀粉酶,地衣形芽孢杆菌ot-淀粉酶和解 淀粉芽孢杆菌a-淀粉酶在与SP722中的K458对应的位点早已有精氨酸。 另外,地衣形芽孢杆菌a-淀粉酶在与SP722中的T461对应的位点已有一 个脯氨酸。因此,所述取代与这些a-淀粉酶无关。
可以利用实施例2中提及的分子动力学模拟,通过在所发现的区域进 行取代来构建在高pH下稳定性提高的a-淀粉酶变体。模拟描述了那些在 高pH(即pH8-10.5)比在中等pH有更高柔性或可变性的区域。
利用任何与类透阿米尔a-淀粉酶(BA2,在Novo Nodisk提出的 W096/23874的附录1中公开了该酶的3D结构)同源(定义如下)的细菌cc-淀粉酶的结构,即有可能建立这些a-淀粉酶结构的模型并可以对它进行分 子动力学^=莫拟。用GCG程序包7.3版(1993年6月)中的UWGCG GAP程序 测量到所述细菌a-淀粉酶的同源性可以为至少60%,优选70%以上,更优 选80%以上,最优选卯%以上同源于前面提及的类透阿米尔a-淀粉酶 (BA2),测量采用缺省值作为GAP罚分(Genetic computer group(1991)GCG考呈序包禾呈序手册,版本7,575 Science Drive, Madison, Wisconsin, USA53711)。
将不利的残基取代为其他残基是可行的。 在pH8-10.5的Ca"稳定性提高
Ca"稳定性提高意味着酶在Ca^耗尽的情况下,稳定性已有提高。在本 发明文中,对于获得在高pH下C,稳定性提高有重要意义的突变(包括氨 基酸取代)包括与SP722a-淀粉酶(具有SEQ ID NO: 2所示氨基酸序列)中 的下列位点相对应的1或多个位点突变或缺失:R181, G182, D183, G184, K185, A186, W189, N195, N270, E346, K385, K458, P459。
本发明的变体具有1或多个下列取代或缺失:
R181*,A,D,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V'.
G182*,A, D,R,N,C,E,Q,H,I,L,K,M,F,P,S,T,W,Y,V; D183*,A,R,N,C,E,Q,G,H,I,L,i,M, F, P,S,T,W, Y,V; G184*,A,R,D,N,C,E,Q,H,I,L,K,M, F'P'S'T'W'Y'V'-KIBSA, D,R,N,C,E,Q,G,H,I,L,M,F, P,S,T,W, Y,V; A186D,R,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V; W189A,D,R,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,Y,V; N195A,D,R,C,E,Q,G,H, I,L,K,M, F, P, S,T, W, Y, V;
N270A,R, D,N,C,E,Q,H, I,L,K,M, F, P,S,T,W, Y, V;
E34 6A,R, D,N,C,Q,G,H, I,L,K,M, F, P, S, T, W, Y, V;
K385A,R, D,N,C,E,Q,G,H, I,L,M, F,P, S,T,W, Y,V<• K458A,R, D,N,C,E,Q,G,H,I,L,M, F, P, S,T,W, Y,V;
P4 59A,R, D, N,C, E,Q,G,H, I, L, K, M, F, S, T, W, V.
优选的是具有1或多个下列取代或缺失的变体: R181Q,N; G182T,S,N; D183" G184"
K185A,R,D,C,E,Q,G,H,工,L,M,N, F,P,S,T,W,Y,V; A186T,S,N,I,V; W189T,S,N,Q,. N195F, N270R,D,' E346Q'- K385Rz K458R'. P459T.
在具体实施方案中,用具有SEQIDNO: 1所示序列的芽孢杆菌菌抹 NCIB12512a-淀粉酶,或者具有SEQ ID NO: 5所示序列的解淀粉芽孢杆 菌oc-淀粉酶,或者具有SEQIDNO: 4所示序列的地衣形芽孢杆菌a-淀粉 酶作为进^f于这些突变的主链。
从图1的对比结果可看到,地衣形芽孢杆菌a-淀粉酶没有与SP722中 的D183和G184对应的位点。因此,所述缺失与该a-淀粉酶无关。
在一个优选实施方案中,变体是这样的芽孢杆菌菌抹NCIB12512ot-淀 粉酶,它在D183和G184缺失,并有下列取代之一:R181Q, N和/或G182T, S, N和/或D183*; G184承和/或K185A, R, D, C, E, Q, Q H, I, L, M, N, F, P, S, T, W, Y, V和/或A186T, S, N, I, V和/或W189T, S, N, Q和/或N195F和/或N270R,
20D和/或E346Q和/或K385R和/或K458R和/或P459T。在中温的特异活性增强
本发明另外一个方面,对于获得在10-60°C,优选20-50°C ,尤其是30-40。C特异活性增强的变体来说,重要的突变包括与SP722oc-淀粉酶(具有SEQID NO: 2所示氨基酸序列)中的l或多个下列位点相对应的突变:
H107, K108, G109, D166, W167, D168, Q169, S170, R171, Ql"72,
F173, Q174, D183, G184, N195, W268, K269, N270, D2"71,
L272, G273, A274, L275, G456, N457, K458, P459, G460, TM61,
V462, T4 63.
本发明的变体具有1或多个下列取代:H107A, D,R,N,C,E,Q,G,I,Ii,K,M,F, P,S,T,W, Y,VzK108A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V'-GIOSA, D, R, N, C, E, Q, H, I ,L, K,M, F, P, S, T, W, Y, V;
D166A,R,N,C, E,Q,G,H, I,L,K,M,F, P, S, T, W, Y, V,.W16"7A, D, R, N,C, E,Q,G,H, I,L,K,M, F, P,S,T, Y'V'-DIG^FMCE^CH^I^I^M, F, P,S,T, W, V/
Q169A,D,R,N,C,E,G,H,I,L,K,M,F,P,S,T,W,Y,V;S3違,D,R,N,C,E,Q, G,H, I,L,K,M, F, P, T, W, Y, V,'R171A, D,N,C,E,Q,G, H, I,:L,K,M,F,P,S,T,W, Y,V'.Q172A, D, R,N,C,E,G, H, I,L,K,M, F, P, S,T, W, Y, V'.F1"7 3A, D,R,N,C,E,Q,G,H, I,:L,K,M,P,S,T,W, Y, V,•Q174*,A,D,R,N,C,E,G,H,I,:L,K,M,F,P,S,T,W,Y,V;D183*,A, D,R,N,C,E,Q,G,H,I,:L,K,M,F,P,S,W, Y,V;G:L84*,A,R,N,C,E,Q,G,H,I,L,K,M,E1,P,S,T,W, Y,V;N195A,D,R,C,E,Q,G,H, I,L,K,M, F, P,S,T,W, Y, V;F267A,D,R,N,C,E,Q,G,H,I,L,K,M,P,S,T,W,Y,V;W268A,D,R,N,C,E,Q,G,H,I,L,K,M,F, P,S,T, Y,V;K269A,D,R,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V;N270A,D,R,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V,'D271A,R,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;L272A,D,R,N,C,E,Q,G,H,I,K,M,F,P,S,T,W, •^Vr-A274D,R,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;L275A,D,R,N,C,E,Q,G,H,I,K,M,F,P,S,T,W,Y,V;G456A,D,R,N,C,E,Q,H, I,L,K,M,F,P,S,T,W, Y,V;N457A,D,R,C,E,Q,G,H,I,L,K,M, F, P,S,T,W,y,V;K458A,D,R,N,C,E,Q,G,H,I,L-,M,F,P,S,T,W,Y,V;P459A,D,R,N,C,E,Q,G,H,I,L,K,M,F,S,T,W, Y,V'.G460A, 0, R, N,C, E, Q, H, I, !<, K,M, EV P, S, T, W, Y,
T461A,D,R,M,C,E,Q,G,H, I,L,K,M,F,P,S,W, Y,^;;V462A,D,R,N,C,E,Q,G,H,I,L,K,M,E",P,S,T,W,Y;TM63A,D,R,N,C,E,Q,5,H,I,L,K,M,F,P,S,W,Y,V.
优选的变体具有1或多个下列取代或缺失:Q174*, D183*, G184*,K269S。
在具体实施方案中,用具有SEQIDNO: 4所示序列的地衣形芽孢杆菌oc -淀粉酶作为进行这些突变的主链。
本发明变体的通用突变:在中温特异活性增强
特别有意义的氨基酸取代是那些能提高酶活性部位周围的可变性的取代。这可以通过那些能破坏活性部位附近(即优选与构成活性部位的任4可残基在10A或8A或6A或4A之内)的稳定性相互作用的改变来实现。
这类例子是那些能降低侧链尺寸的突变,比如
Ala到Gly
Val到Ala或Gly
lie或Leu到Val, Ala或Gly
Thr到Ser
我们希望,通过导入空腔或者通过能填塞突变造成的空间的结构重排,这些突变导致活性部位区域的柔性提高。
可以优选本发明的变体还包含1或多个除上面概括过的以外的修饰。因此,将被修饰的oc-淀粉酶变体某部分存在的l或多个脯氨酸取代为非脯氨酸残基可能是有益的,所述非脯氨酸可以是任何可能的,天然非脯氨酸残基,优选是Ala, Gly, Ser, Thr, Val或Leu。
类似地,可以优选将亲本a -淀粉酶被修饰的那些氨基酸残基中存在的1或多个Cys残基取代为非半胱氨酸残基,比如Ser, Ala, Thr, Gly, Val或Leu。
另外,可以将本发明的变体进行修饰 一作为唯一 的修饰或者结合上面概括的任何修饰一以便将与SEQIDNO: 4中的185-209位氨基酸片段所对应的氨基酸片段中存在的1或多个Asp和/或Glu分别取代为Asn或Gln。同样有意义的是在类透阿米尔cc -淀粉酶中,将与SEQ ID NO: 4中的185-209位氨基酸片段所对应的氨基酸片段中存在的1或多个Lys残基取代为Arg。
应当明白,本发明涵盖了含有两个或多个上述修饰的变体。
另外,向此处描述的任何变体导入点突变可能是有益的。
22活性部位周围可变性提高的a-淀粉酶变体
可以通过替换靠近底物部位的1或多个位点的1或多个氨基酸残基来提高本发明a-淀粉酶变体的可变性。这些位点是(使用SP722a-淀粉酶(SEQID NO: 2)的编号):V56,K108,賜8, Q169, Q172, L201, K269, L272, L275,K446, P459。
因此,本发明的一个方面涉及在1或多个上述位点发生突变的变体。优选的取代是下列中的l或多个:
V56A,G,S,T,'
KIOBA,D,E,Q,G,H,I,L,M,N,S,T,V;
D168A,G, I, V,N,S,T;Q169A,D,G, H, I, L, M, N, S, T, VzQ172A, D,G,H, IAMASfT'V'-I^OlA'GJ'VAT'-KSSSA, D, E,Q,G,H, I,L,M,N,S,T, V'-L272A,G, I, V,S,T,'L275A,G,I,V,S,T; 'Y295A,D,E,Q,G,H, I'l^MAF'S'T'V'-I^GA'DAQAH, I,L,M,N,S,T,V'.P459A,G,I,L,S,T,V.
在本发明的具体实施方案中,用具有SEQIDNO: 1所示序列的芽孢杆菌菌林NCIB12512a-淀粉酶,或者具有SEQ ID NO: 3所示序列的嗜热脂肪芽孢杆菌a-淀粉酶,或者具有SEQIDNO: 4所示序列的地衣形芽孢杆菌a-淀粉酶,或者具有SEQIDNO: 5所示序列的解淀粉芽孢杆菌ct-淀粉酶作为进行这些突变的主链。
从图1的对比可以看到,地衣形芽孢杆菌a-淀粉酶和解淀粉芽孢杆菌a-淀粉酶在与SP722中的K269相对应的位点有一个Glu。另外,嗜热脂肪芽孢杆菌a-淀粉酶在与SP722中的K269相对应的位点有一个Ser。因此,所述取代与这些a-淀粉酶无关。
另外,从图1的对比可以看到,解淀粉芽孢杆菌a-淀粉酶在与SP722中的L272相对应的位点有一个Ala,嗜热脂肪芽孢杆菌a-淀粉酶在与SP722中的L272相对应的位点有一个Ile。因此,所述取代与这些a-淀粉酶无关。
从图1的对比可以看到,芽孢杆菌菌株12512a-淀粉酶在与SP722中的L275相对应的位点有一个Ile。因此所述取代与该cc-淀粉酶无关。
从图1的对比可以看到,解淀粉芽孢杆菌a-淀粉酶在与SP722中的Y295相对应的位点有一个Phe。另外,嗜热脂肪芽孢杆菌a-淀粉酶在与SP722中的Y295相对应的位点有一个Asn。因此,所述取代与这些cx"定粉酶无关。
从图1的对比可以看到,地衣形芽孢杆菌cx-淀粉酶和解淀粉芽孢杆菌oc-淀粉酶在与SP722中的K446相对应的位点有一个Asn。另外,嗜热脂肪芽孢杆菌a-淀粉酶在与SP722中的K446相对应的位点有一个His。因此,所述取代与这些a-淀粉酶无关。
从图1的对比可以看到,地衣形芽孢杆菌a-淀粉酶,解淀粉芽孢杆菌oc-淀粉酶以及嗜热脂肪芽孢杆菌a-淀粉酶在与SP722中的P459相对应的位点有一个Ser。另夕卜,芽孢杆菌菌抹12512oc-淀粉酶在与SP722中的P459相对应的位点有一个Thr。因此,所述取代与这些a-淀粉酶无关。
在中温有较高活性的酶的稳定化
本发明另 一个实施方案涉及提高低温a -淀粉酶(例如河豚毒素交替单胞菌(Feller等,(l994),欧洲生物化学杂志n 4W-"")和中温a-淀粉酶(例如SP722和SP6卯)的稳定性,这些酶具有中温活性,即通常称为嗜冷酶和嗜温酶。对于这一特定酶类,稳定性应理解为热稳定性或在钙耗竭条件下的稳定性。
通常,在中温显示高活性的酶在那些对酶有抑制作用的条件(比如温度或4丐耗竭)下也会有严重问题。
从而,本发明的目的是提供在中温显示所需高活性,同时在轻微抑制条件下不丧失活性的酶。
应当优选稳定化变体于中温测定的活性是初始活性的100%或以上与
50%之间,更优选在100%或以上与70%之间,最优选在100%或以上与85%
之间,所述初始活性是酶在稳定化前在该特定温度的活性,并且得到的酶
应能在抑制条件下比野生型的酶忍受更长时间的温育。可以考虑的酶包括例如细菌或真菌来源的cx-淀粉酶。
一例这类低温a-淀粉酶是分离自河豚毒素交替单胞菌(Feller等,(1994),欧洲生物化学杂志222: 441-447)的酶。已得到了该a-淀粉酶的晶体结构(Aghajari等,(1998),蛋白质科学7: 564-572)。
河豚毒素交替单胞菌a-淀粉酶(图4所示对比结果的5)与猪胰腺a-淀粉酶(PPA)(图4所示对比结杲的3)大约66°/。同源。PPA 3D结构是已知的,并且可从Brookhaven数椐库中以IOSE或1DHK的名字获得。根据与其他更稳定的a -淀粉酶的同源性,可以使得来自河豚毒素交替单胞菌a -淀粉酶实现"低温高活性酶"的稳定化,并同时维持所需的中温高活性。
图4显示5个a-淀粉酶,包括AHA和PPAa-淀粉酶的多重序列对比。使河豚毒素交替单胞菌a-淀粉酶的稳定性提高的特异突变是:T66P, Q69P,Rl 55P, Q177R» A205P, A232P, L243R, V295P, S315R。
制备a -淀粉酶变体的方法
几种将突变导入基因的方法是本领域已知的。简要讨论a -淀粉酶-编码DNA序列之后,将讨论在a-淀粉酶-编码序列中的特定位点产生突变的方法。
克隆编码a-淀粉酶的DNA序列
可以利用多种本领域的公知方法,从任何能产生目的a -淀粉酶的细胞或微生物中分离编码亲本a-淀粉酶的DNA序列。首先,应当利用得自能产生目的a-淀粉酶的有机体的染色体DNA或信使RNA来构建基因组DNA和/或cDNA文库。然后,如果a-淀粉酶的氨基酸序列是已知的,可以合成并合成并用同源的,标记的寡核苷酸来由从目的有机体制备的基因组文库鉴定oc-淀粉酶-编码克隆。另外,可以使用标记的寡核苷酸探针(该探针含有与已知a-淀粉酶基因同源的序列)作为探针,采用低严谨性杂交和洗涤条件来鉴定ct -淀粉酶-编码克隆。
另一种鉴定a-淀粉酶-编码克隆的方法包括将基因组DNA片段插入表达栽体(比如质粒),用所得基因组DNA文库转化a-淀粉酶阴性的细菌,以及随后将转化细菌铺到含有a-淀粉酶底物的琼脂上,从而能鉴定表达cx-淀粉酶的克隆。
可选择地,可以通过已确立的标准方法来合成制备编码酶的DNA序列,例如S丄.Beaucage和M.H.Caruthers(1981)描述的磷酸脒方法或Matthes等(1984)描述的方法。在磷酸脒方法中,在例如自动DNA合成仪中合成寡核苷酸,将其纯化,退火,连接和克隆到合适的载体中。
最后,DNA序列可以是基因组和合成来源混合的,合成和cDNA来源混合的,或者基因组和cDNA来源混合的,其是依照标准技术,将合成的,基因组或cDNA来源的片段连接在一起而制备的(在合适时,对应完整DNA序列各部分的片段)。还可以如US4683202或R.K.Saiki等(1988)描述的,使
用特异引物通过聚合酶链反应(PCR)来制备DNA序列。表达cc-淀粉酶变体
25#4居本发明,可以利用表达载体将通过上述方法,或者通过本领知戈已知的任何替代方法制备的编码变体的DNA序列表达为酶的形式,栽体通常包括调控序列,该序列编码启动子,操纵子,核糖体结合位点,翻译起始信号以及任选地,阻遏子基因或各种激活子基因。
携带编码本发明所述oc-淀粉酶变体之DNA序列的重组表达载体可以是任何能方便地进行重组DNA操作的载体,且栽体的选择通常取决于它将要导入的宿主细胞。因此,载体可以是自主复制的载体,即以染色体外个体存在的载体,其复制独立于染色体的复制,例如质粒,噬菌体或染色体外元件,微小染色体或人工染色体。可选择地,栽体可以是这样的,当被导入宿主细胞时,它会整合到宿主基因组中,并与所整合到其中的染色体一起复制。
在所述载体中,DNA序列应当可操纵地连接到合适的启动子序列。该启动子可以是任何在所选宿主细胞中显示转录活性的DNA序列,并可以来源于编码宿主细胞的同源或异源蛋白质的基因。适于引导编码本发明所述a-淀粉酶变体的DNA序列的转录的合适的启动子序列是在所选宿主细胞中显示转录活性的序列,并可以来源于编码宿主细胞的同源或异源蛋白质的基因。适于引导编码本发明所述a-淀粉酶变体的DNA序列进行转录(特别是在细菌宿主中)的启动子的例子是大肠杆菌lac操纵子的启动子,天蓝色链霉菌琼脂糖酶基因dagA的启动子,地衣形芽孢杆菌oc-淀粉酶(amyL)的启动子,嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)的启动子,解淀粉芽孢杆菌a-淀粉酶(amyQ)的启动子,枯草芽孢杆菌xylA和xylB基因等的启动子。在真菌宿主中进行转录时,有用的启动子的例子是来源于这样一些基因的启动子,所述基因编码米曲霉TAKA淀粉酶,米赫氏根霉天冬氨酸蛋白酶,黑曲霉中性cc-淀粉酶,黑曲霉酸稳定a-淀粉酶,黑曲霉葡糖淀粉酶,米赫氏根霉脂酶,米曲霉碱性蛋白酶,米曲霉丙糖磷酸异构酶或构巢曲霉乙酰胺酶。
本发明的表达载体还可以包含合适的转录终止子以及,在真核细胞中时的多腺苷酸化序列,它们与编码发明所述a-淀粉酶变体的DNA序列可操纵地连接在一起。终止和多腺苷酸化序列可以适当地来自与启动子相同的来源。
载体还可以包含能使载体在目的宿主细胞中进行复制的DNA序列。这类序列的例子是质粒pUC19, pACYC177, pUB110, pE194, pAMBl和pIJ702
26载体还可以包含选择标记,例如一个其产物能补偿宿主细胞缺陷的基
因,比如来自枯草芽孢杆菌或地衣形芽孢杆菌的dal基因;或者赋予抗生素 抗性(比如氨千青霉素,卡那霉素,氯霉素或四环素抗性)的基因。另外,载 体可以包含曲霉选择标记,比如amdS,argB,niaD和sC,产生潮霉素抗'性的 标记,或者可以通过共转化(例如W091/17243中描述的)来实现选择。
胞内表达在某些方面可能是有益的,例如用某种细菌作为宿主细胞时, 但通常优选表达是胞外的。总之,此处提及的芽孢杆菌a-淀粉酶包含一个 允许被表达的蛋白酶分泌到培养基中的前导区。如果需要,可以方便地通 过取代编码该前区的DNA序列来将该前区替换为不同的前导区或信号序列。
用于分别将编码a-淀粉酶变体,启动子,终止子和其他元件的本发明 所述DNA构建体连接在一起,并将其插入合适的包含复制所用的必要4言息 之载体的步骤是本领域技术人员所熟知的(参考,例如,Sambrook等,分子 克隆:实验指南,第2版,Cold Spring Harbor, 1989)。
本发明的细胞,它包含如上所述的本发明DNA构建体或表达载体,可 以有效地作为重组制备本发明ot-淀粉酶变体的宿主细胞。可以用本发明编 码变体的DNA构建体,方便地通过将该构建体(以1或多拷贝)整合到宿主 染色体中来转化所述细胞。通常认为整合是有益的,因为这样DNA序列更 可能稳定地保持在细胞中。可以依照常规方法,例如通过同源或异源重组 将DNA构建体整合到宿主染色体中。可选择地,可以根据宿主细胞的不同 类型用上面描述过的表达栽体来转化细胞。
本发明的细胞可以是更高等的生物,比如哺乳动物或昆虫的细胞,但 优选是微生物细胞,比如细菌或真菌(包括酵母)细胞。
合适的细菌的例子是革兰氏阳性细菌,比如枯草芽孢杆菌,地衣形芽孢 杆菌,迟緩芽孢杆菌,短芽孢杆菌,嗜热脂肪芽孢杆菌,嗜碱芽孢杆菌,解 淀粉芽孢杆菌,凝结芽孢杆菌,环状芽孢杆菌,灿烂芽孢杆菌,巨大芽孢杆 菌,苏云金芽孢杆菌,或者浅青紫链霉菌或鼠灰链霉菌,或者是革兰氏阴性 细菌,比如大肠杆菌。可以通过例如原生质体转化或利用竟争细胞以已知 方式来实现细菌的转化。
可以有利地从酵母属或裂殖酵母属中选择酵母微生物,例如酿酒酵母。 丝状真菌最好是属于曲霉属的种,例如米曲霉或黑曲霉。可以通过一个包括原生质体形成和转化,以及随后以已知方式再生细胞壁的方法来转^f匕真
菌细胞。在EP238023中描迷了转化曲霉宿主细胞的适用步骤。
再一方面,本发明涉及制备发明所述a-淀粉酶变体的方法,该方法包 括在有助于变体生产的条件下培养以上描述的宿主细胞,以及从细胞和/或 培养基中回收变体。
所述01_淀:酶变体进;亍表^!的常规培;基。可以从供应商那里获得合适的
培养基或者可以根据公开的配方(例如,美国典型培养物保藏中心的目录中 所描述的)来制备。
可以通过公知方法从培养基中方便地回收宿主细胞所分泌的a-淀粉酶 变体,这些方法包括通过离心或过滤从培养基中分离细胞,以及借助盐(比 如硫酸铵)来沉淀培养基中的蛋白类成分,然后利用层析操作,比如离子交 换层析,亲合层析等。
工业应用
本发明的oc-淀粉酶变体具备适合多种工业应用的有价值的特性。具体 来说,本发明的酶变体可以作为洗涤,餐具清洗和硬金属表面清洁的洗涤剂 组合物的成分。
许多变体在由淀粉生产甜味剂和乙醇,和/或纺织品退浆时尤其有用。 在例如US3912590和欧洲专利公开号252730和63909中描述了在包括淀粉 液化和/或糖化步骤的常规淀粉转化过程中使用的条件。
洗涤剂组合物
如上所述,可以适当地将本发明的变体加入洗涤剂组合物中。涉及洗 涤剂组合物相关成分的进一步的细节,在这类洗涤剂组合物中配制变体的 合适方法以及洗涤剂组合物的有关类型,可以参考例如,W096/23874和 WO97/07202。
包含本发明变体的洗涤剂组合物可以另外含有1或多种其他酶,比如 脂酶,角质酶,蛋白酶,纤维素酶,过氧化物酶或漆酶,和/或另一种a淀粉 醉。
可以将本发明的a -淀粉酶变体以常规使用的浓度加入洗涤剂中。目前 考虑可以将本发明的变体以相当于每升使用常规剂量水平洗涤剂的洗涤/餐 具清洗液中含0.00001-lmg a -淀粉酶的用量加入。
本发明还涉及提供具有l)改变了的最适pH,和/或2)改变了的最适温度,和/或3)稳定性提高的ct-淀粉酶的方法,该方法包括以下步骤:
i)通过将两个或多个实质不同的pH,温度和/或稳定性曲线的cc-淀粉 酶3D结构的分子动力学进行比较,确定(a)进行cc-淀粉酶突变的目的位点 和/或区域,ii)在所确定的位点和/或区域取代,添加和/或缺失l或多个氨基 酸。
在本发明的实施方案中,将一个中温oc -淀粉酶与一个高温a -淀粉酶进 行比较。在另一个实施方案中,将低温a-淀粉酶与中温或高温a-淀粉酶进 行比较。
进行比较的a-淀粉酶应当优选相互之间至少70%,优选80%,到90%, 比如达到95%,特别是95%同源。
进行比较的oc-淀粉酶可以是上面定义的类透阿米尔a-淀粉酶。在具体 实施方案中,进行比较的a -淀粉酶是SEQ ID NO: 1到SEQ ID NO: 8所 示的a淀粉酶。
在另一个实施方案中,所比较的目的a-淀粉酶的稳定性曲线是Ca"+依 赖曲线。
材料和方法 酵
SP722(SEQIDNO: 2, Novo Nodisk有售) 透阿米尔TM(SEQIDNO: 4, Novo Nodisk有售) SP690(SEQIDNO: 1, Novo Nodisk有售) 枯草芽孢杆菌SHA273:见WO95/10603

pJEl包含编码SP722a-淀粉酶变体的基因(SEQIDNO: 2),即该基因 缺失了成熟蛋白质中M酸D183-G184所对应的6个核苷酸。JE1基因的 转录由amyL启动子引导。该质粒还包含复制原点和来自质粒 pUB110(Gryczan,TJ等,(1978),细菌杂志134: 318-329)的cat-基因,后者 赋予对卡那霉素的抗性。
方法
构建文库载体pDorK101
可以用大肠杆菌/芽孢杆菌穿梭载体pDorK101(以下有描述)在大肠杆菌 中导入突变,而不表达ct-淀粉酶,然后以在芽孢杆菌中a-淀粉酶具有活性 的方式进行修饰。如下构建载体:在SEQ ID NO: 2: SP722的5,编码区中的Pstl位点,用一个含有大肠杆菌复制原点的1.2kb片段通过基因打断使 pJEl中的JE1编码基因(缺失D183-G184的SP722)失活。所述片段是从 pUC19(GenBank入册编号弁:X02514)经PCR扩增到的,扩增使用正向引物: 5'-gacctgcagtcaggcaacta-3,和反向引物:5,-tagagtcgacctgcaggcat-3,。用Pstl于 37。C将PCR扩增产物和pJEl栽体消化2小时。于室温连接pJEl载体片段 和PCR片段1小时,并通过电转化转化到大肠杆菌中。所得载体命名为 pDorK101。
滤膜筛选检测
可以用该检测方法,依靠篩选温度设置来筛选较之亲本酶在高pH的稳 定性提高的类透阿米尔a-淀粉酶变体,以及较之亲本酶在高pH和中温的 稳定性提高的类透阿米尔a-淀粉酶变体。
高pH滤膜检测
将芽孢杆菌文库铺在含有10y g/ml卡那霉素的TY琼脂板上的醋酸纤 维素(OE67 , Schleicher&Schuell,Dassel,Germany)和滩酸纤维素滤膜 (Protran-Ba85, Schleicher&Schuell,Dassel,Germany)夹心上,于37。C保持至少 21小时。将醋酸纤维素层放在TY琼脂板上。
铺板之后,但要在保温之前用针将每个滤膜夹心特异地标记一下,以 便能够确定阳性变体在滤膜上的位置,并将结合了变体的硝酸纤维素滤膜 转移到盛有甘氨酸-NaOH緩冲液(pH8.6-10.6)的容器中,于室温(可以在 10-60。C变化)温育15分钟。将带有菌落的醋酸纤维素滤膜于室温保存在TY 平板上待用。温育后,在含有P/。琼脂糖,0.2%淀粉的甘氨酸-氢氧化钠緩沖 液(pH8.6-10.6)的平板上检测残存的活性。用与滤膜夹心相同的方式标记带 有硝酸纤维素滤膜的检测平板,并于室温培养2小时。移去滤膜后,用 10%Lugol溶液将检测平板染色。降解淀粉的变体检测为深蓝色背景上的白 色斑点,然后在保存平板上鉴定。在与第一次筛选相同的条件下将阳性变 体重筛两次。
低钙滤膜检测
将芽孢杆菌文库铺在含有关抗生素(例如卡那霉素或氯霉素)的TY琼脂 板上的醋酸纤维素(OE67, Schleicher&Schuell,Dassd,Germany)和硝酸纤维素 膜(Protran-Ba85,Schleicher&Schuell,Dassel,Germany)夹心上,于37。C保持至 少21小时。将醋酸纤维素层放在TY琼脂板上。
铺板之后,但要在培养之前用针将每个滤膜夹心特异地标记一下,以便能够将阳性变体固定在滤膜上,将结合了变体的硝酸纤维素滤膜转移到
盛有碳盐酸-碳酸氢盐緩冲液(pH8.5-10)和不同浓度(0.001mM-100mM)EDTA 的容器中,将膜于室温温育1小时。将带有菌落的醋酸纤维素滤膜于室温 保存在TY平板上待用。温育后,在含有1%琼脂糖,0.2%淀粉的碳酸盐-碳 酸氢盐緩沖液(pH8.5-10)的平板上检测残存活性。以与滤膜夹心相同的方式 标记带有硝酸纤维素滤膜的检测平板,并于室温培养2小时。移去滤膜后, 用10。/。Lugol溶液将检测平板染色。降解淀粉的变体检测为深蓝色背景上的 白色斑点,然后在保存平板上鉴定。在与第一次筛选相同的条件下将阳性 变体重筛两次。
获得目的区域的方法
有三个已知的细菌ct-淀粉酶3D结构。两个是地衣形芽孢杆菌ct-淀粉 酶的,Brookhaven数据库lBPL(Machius等,(1995),分子生物学杂志246: 545-559)和lVJS(Song等,(1996),用于糖类163工程的酶(生物技术进展, 12巻)。这两个结构在两个钙离子和一个钠离子的结合位点周围所谓B-结构 域的地方缺少 一 段重要的结构。因此我们使用了 a -淀粉酶 BA2(W096/23874,它是BAN"tm(SEQ ID NO: 5)和地衣形芽孢杆菌ct -淀粉 酶(SEQ ID NO: 4)的杂交体)的3D结构。在该结构的基础上,建立了地衣 形芽孢杆菌a -淀粉酶和SP722 a -淀粉酶的模型。
a-淀粉酶变体的发酵和纯化
可以利用本领域公知的方法进行发酵和纯化。
稳定性测定
全部稳定性实验使用相同的设置进行。方法是:
在相应条件(l-4)下温育酶。于不同时刻取样品,例如0, 5, 10, 15和30 分钟后,将样品在检测緩冲液(0.1M 50mM Britton緩冲液pH7.3)中稀释25 倍(所有取样稀释度相同),并采用Phadebas检测法(Pharmacia)在标准条件 (pH7.3, 37C)下测量活性。
以温育前(O分钟)测量的活性作为对照(100%)。将下降的百分比作为温 育时间的函数来计算活性。表中显示在温育例如30分钟后的残存活性。
特异活性测定
采用Phadebas检测法(Pharmacia)将特异活性确定为活性/mg酶,测定依 照产品说明书进行(还可见以下"oc-淀粉酶活性检测")。 oc-淀粉酶活性检测法1. Phadebas检测法
通过 一 种采用Phadebas®片剂作为底物的方法来测定a -淀粉酶的活 性。Phadebas片剂(Phadebas® Amylase Test,由Pharmacia Diagnostic提供)舍 有一种交联的不溶性兰色淀粉聚合物,该聚合物与牛血清白蛋白和緩冲物 质混合在一起并做成片剂。
进行每次测量时,将一个药片悬浮于含有5ml 50mM Britton-Robinson 緩冲液(50mM醋酸,50mM磷酸,50mM硼酸,O.lmM CaCl2,用NaOH调至所 需pH)的试管中。于所需温度在水浴中进行实验。将待测cc-淀粉酶在xml 50mM Britton-Robinson緩冲液中进行稀释。将1ml该a -淀粉酶溶液加入5ml 50mM Britton-Robinson緩冲液中。a-淀粉酶水解淀粉产生水溶性兰色碎片。 在620nm比色测定到的所得兰色溶液的吸光度是a-淀粉酶活性的函数。
重要的是温育10或15分钟后测量的620nm吸光度应在0.2到2.0吸收 单位内。在这样的吸光度范围内,活性和吸光度是线性关系(Lambert-Beer 定律)。因此,必须调节酶的稀释度以便符合该法则。在特别设置的条件(温 度,pH,反应时间,緩沖液条件)下,lmg给定oc-淀粉酶将水解一定量的底物 并产生兰色。在620nm测量兰色的强度。在给定条件下,所测得的吸光度 与受测oc-淀粉酶的特异活性直接成比例(活性/毫克纯a-淀粉酶蛋白质)。
2. 替代方法
通过一种采用PNP-G7作为底物的方法来确定ot-淀粉酶的活性。 PNP-G7(邻-硝基苯-cc, D-麦芽庚糖苷的缩写)是一种被封闭的寡糖,可以被 内-淀粉酶切割。切割之后,试剂盒中包含的a-葡糖苷酶消化底物释放出游 离的PNP分子,它呈现黄色,因此可以在入-405nm(400-420nm)的可见光处 比色测量。包含PNP-G7底物和a-葡糖苷酶的试剂盒由 Boehringer-Mannheim(cat.No. 1054635)制造。
将一瓶底物加入5ml緩冲液(BM1442309)来制备底物。将一瓶oc-葡糖 苷酶(BM1462309)加入45ml緩冲液(BM1442309)来制备oc -葡糖苷酶。将5ml oc-葡糖苷酶与0.5ml底物混匀制得工作溶液。
将20 n 1酶溶液转移到一个96孔微量滴定板上并于25'C温育来进行检 测。加入200pl工作溶液(25'C)。将溶液混匀,预保温l分钟,并在3分钟 内每15秒测量一次OD405nm处的吸光度。
在给定条件设置下,随时间变化的吸光度曲线的斜率与受测cc-淀粉酶 特异活性(活性/毫克酶)直接成比例。使用DOPE程序进行随机诱变的一般方法 可以通过以下步骤进行随机诱变:
1. 在亲本酶中选择目的修饰区域
2. 在所选区域内决定突变位点和非突变位点
3. 决定进行何种突变,例如相对要构建的变体的预期稳定性和/或性能
4. 选择结构上可行的突变
5. 相对步骤4来调整步骤3所选的残基
6. 利用合适的预测算法来分析核苷酸分布状态
7. 如果必要,根据遗传密码的可行性调节所需残基(例如,考虑遗传密码 带来的限制(例如,为了避免导入终止密码子))(本领域技术人员应意识到某 些密码子组合实际上不能用,需要进行调整)。
8. 制备引物
9. 利用引物进行随机诱变
10. 通过筛选选择具有预期的改善特性的所得a -淀粉酶变体。
适用于步骤6的预测算法是本领域所公知的。Tomandl, D.等(计算机辅 助的分子设计杂志,11(1997), 29-38)描述了一种算法。以下描述另一种 DOPE算法:
预测算法
"DOPE"程序是一种可用来以一定方式优化三联密码子的核苷酸组成 的算法,从而,三联密码子能编码与所需氨基酸分布最相似的氨基酸分布。 为了评价哪一个可能的分布状态与所需氨基酸分布最相似,需要一个评分 公式。在"DOPE"程序中,发现以下函数是合适的:
息",
其中Xi,是通过该程序计算得到的氨基酸和氨基酸组的数量,yi,是程序 使用者定义的氨基酸和氨基酸组的希望量(例如,明确需要导入20个氨基酸 或终止密码子中的哪一个,比如体现为一定的百分比(例如,90%Ala, 3%Ile, 7%Val)), Wi,是由程序使用者定义的重要因素(例如,取决于将某个特定氨 基酸残基插入所需位点的重要性)。N是21加上由程序使用者定义的氨基酸 组的数量。用于该函数,规定()G为1。
利用Monte-Carlo算法(Valleau,J.P.&Whittington,S.G(1977)描述过一个例 子:A guide to Mont Carlo for statictical mechanics: 1 highways. 《统计力学,
33Part A:平衡技术》B丄Berne编,New York:Plenum)来找出该函数的最大值。在 每次迭代中进行以下步骤:
1. 给每个碱基选择一个新的随机核苷酸组成,其中对于密码子所有三 个位置的4种核苷酸G A, T, C之一,目前和新组成之间的绝对差小于或等 于d(参见以下d的定义)。
2. 利用以上描述的函数s来比较新组成和目前组成的评分。如果新评 分高于或等于目前组成的评分,保留新组成,将目前组成改为这个新的。 如果新评分小,保留该组成的概率为exp(1000(新评分-目前评分))。
一个循环通常包括1000次上述迭代,其中的d由1线性降低至0。在 一个优化过程中,进行100或更多次循环。最终得到产生最高评分的核苷 酸组成。
实施例
实施例1
同源构建透阿米尔tm的实施例
地衣形芽孢杆菌a -淀粉酶与其他类透阿米尔a -淀粉酶的总的同源性
很高,相似百分比极高。用Wisconsin大学Genetics Computer Group的程序
GCG计算的透阿米尔tm与BSG(具有SEQIDNO: 3的嗜热脂肪芽孢杆菌a
-淀粉酶)和BAN(具有SEQIDNO: 5的解淀粉芽孢杆菌a-淀粉酶)的相似率
分别为89%和78%。与BANtm和BSG相比,TERM缺失残基G180和K181
这两个残基。与BAN和透阿米尔tm相比,BSG在G371和I372之间缺失3
个残基。另外与BANTM和透阿米尔tm相比,BSG在羧基端多出20个残基。
与BSGtm相比,在氨基端,BA1SFM少2个残基,透阿米尔tm少1个残基。
在W096/23974附录1所公开的结构的基础上,建立地衣形芽孢杆菌(透 阿米尔TM)和解淀粉芽孢杆菌a-淀粉酶(BANTM)的结构模型。可以类似地建
立其他类透阿米尔oc-淀粉酶(例如文中公开的)的结构。
与用来描述当前结构的a-淀粉酶相比,透阿米尔顶的区别在于它在 178-182位附近缺少两个残基。为了在模型结构中补偿这一点,用BIOSYM 的HOMOLOGY程序来取代该结构(不仅是结构保守的区域)中等同位点处 的残基,缺失位点除外。使透阿米尔tm(BAN^)中的G179(G177)和 K180(K180)之间形成肽键。在模型中只发现有很少几个原子过于接近,这
表明求解结构和模型结构之间结构关系密切(因此,后者是有效的)。
然后利用INSIGHT程序给这个非常粗略的透阿米尔tm结构在与求解结构相同的坐标处加上所述求解结构中的水(605)和离子(4个钙和1个钠)。这 可以在只有很少的重叠下做到,换句话说,即吻合得很好。然后利用200 步Steepest下降和600步共轭梯度(Conjugated gradient)对该模型结构进行最 小化(参见Brook等,1983,计算化学杂志4: 187-217)。然后对最小化了的 结构进行分子动力学处理,加热5皮秒,随之平衡至多200皮秒但要在35 皮秒以上。用Verlet算法进行动力学,利用偶联至水浴的Behrendsen (Behrendsen等,1984,化学物理学杂志81: 3684-3690)保持300K的平衡温 度。每皮秒去除旋转和翻译。 实施例2
提取鉴定pH稳定性提高和温度活性改变的a-淀粉酶变体的重要区域 的方法
对目的酶(此处是SP722和透阿米尔^)的X-射线结构和/或建立的模型 结构进行分子动力学模拟。利用CHARMM程序(得自分子模拟(MSI)程序或 其他的合适程序,例如DISCOVER(来自MSI)做分子动力学模拟。在真空中 进行分子动力学分析,更优选的是包含结晶水,或用包埋在水中(例如水球 或水箱)的酶来进行。模拟进行300皮秒或更长时间,例如300-1200皮秒。 提取结构中CA碳的各向同性波动,并在结构间进行比较。如果序列有缺失 和/或插入,插入来自其他结构的各向同性波动从而使各向同性波动的差异 为0。对各向同性波动的解释见CHARMM手册(可从MSI获得)。
可以利用标准电荷在可带电的氨基酸上进行分子动力学模拟。即令Asp 和Glu带负电,Lys和Arg带正电。该条件类似大约7的中性pH。为了分 析更高或更低pH,可以滴定分子以便使标准的可滴定残基的pKa(通常在 pH2-10)发生改变,可滴定残基是Lys, Arg, Asp, Glu, Tyr和His,还有Ser, Thr 和Cys也是可滴定的,但此处不考虑在内。此处将由pH导致的电荷改变描 述为Asp和Glu在高pH带负电,Arg和Lys不带电。这是模拟10到11左 右的pH,此时开始滴定Lys和Arg,因为这些残基正常pKa在9-11左右。
1.提取鉴定高pH稳定性之cc-淀粉酶变体的重要区域的方法:
对于构建高pH稳定性的变体来说,重要的区域是那些在极端pH显示 出最高可变性的区域,即有最高各向同性波动的区域。
通过进行两次分子动力学模拟来鉴定这种区域:i)一次高pH运行,这 时将碱性氨基酸Lys和Arg看作是中性的(即非质子化的),酸性氨基酸Asp 和Glu带(-l)电荷和ii) 一次中性pH运行,碱性氨基酸Lys和Arg带有(+l)
35净电荷,酸性氨基酸带有(-l)电荷。
比较这两次运行,鉴定出在高pH比在中性pH分析下可变性更高的区域。
导入这样一些残基,这些残基能提高总的稳定性(例如氩键),使该区域 更刚性(通过突变,比如用脯氨酸取代或替换甘氨酸残基),或者提高电荷或 它们的相互作用均能够提高酶的高pH稳定性。
2.提取鉴定中温活性提高之a-淀粉酶变体的区域的方法:
对于构建中温活性提高之变体来说,重要的区域反映在SP722和透阿 米尔各向同性波动的差值,即SP722减去透阿米尔CA的各向同性波动。 选择各向同性波动中具有最高可变性的区域。预计这些区域和残基能提高 酶在中温的活性。只有存在可变性正确的特定残基,才能表达ot-淀粉酶的 活性。如果残基的可变性太低,活性将下降或丧失。
实施例3
通过定域随机,预测的诱变来构建在中温Ca^稳定性比亲本酶提高的 类透阿米尔a-淀粉酶变体
为了提高a-淀粉酶在低钙浓度下的稳定性,在预选区域进行随机诱变。 区域: 残基: SAI: R181-W189
利用DOPE软件(参见材料与方法)确定出SA1区中每个建议变化的峰 值密码子,这些变化能減少终止密码子的数量(见表1)。计算密码子三个位 置处的.确切核苷酸分布状态以便给出氨基酸变化的建议数目。针对预测区 域中的指定位点进行具体预测从而更可能得到所需残基,但仍允许其他可 能性。
表1:
每个位点氨基酸残基的分布状态
R181: 72%R, 2簡,7%Q, 4%H, 4%K, 11%S
G182: 73%(U3%A, 120/oS,2%T
K185* 95%K 5%R
A186; 50%A: 4%N, 6%D, 1%E, 1%G 1%K, 5%S, 31%T W187; 100%W D188: 100%D W189: 92%W,80/oS
将所得预测的寡核苷酸链作为有义链在表2中显示:野生型核苷酸和 氨基酸序列以及每个预测位点的核苷酸分布状态。 表24立点 181 182 185 186 187 188 189
氨基酸序列 Arg Gly Lys Ala Thr Asp Thr
野生型核苦酸序列cga ggt aaa get tgg gat tgg
正向引物(SEQIDNO: 15)
FSA: 5,-caa aat cgt ate tac aaa ttc 123 456 a7g 8910 tgg gat tl lg gaa gta gat
teg gaaaat-3'
每个预测位点的核苷酸分布状态
1: 35%A, 65%C
2: 830/oG, 17%A
3: 63%G, 37%T
4: 86%G, 14%A
5: 85%G, 15%C
6: 50%T, 50%C
7: 95%A, 5%G
8: 58%G, 37%A, 5%T
9: 86%C, 130/oA, 1%G
10: 830/oT, 17%G
11: 92%G, 8%C
反向引物(SEQIDNO: 6)
RSA: 5,-gaa ttt gta gat acg att ttg-3 ,
随机诱变
利用表2中明显的峰值寡核苷酸(用一个常用术语称为FSA)和用于SA1区域的反向引物RSA以及跨越SacII和DraIII位点的SEQ ID NO: 2: SP722特异引物,经重叠延伸法(Horton等,基因77(1989): 61-68)来制备具有21个碱基对重叠的PCR-文库片段。质粒pJEl作为聚合酶链反应的模板。将PCR片段克隆到大肠杆菌/芽孢杆菌穿梭载体pDork101 (见材料与方法)中,该载体能在大肠杆菌中进行诱变,在枯草芽孢杆菌中瞬时表达从而防止大肠杆菌中淀粉酶致死性的累积。将克隆的PCR片段导入大肠杆菌中后,从质粒中切下修饰过的pUC19片段,将启动子和突变了的透阿米尔基因物理地连接在一起,在芽孢杆菌中进行表达。
筛选
可以用前面"材料与方法"部分描述的低钙滤膜检测法来筛选文库。实施例4
构建淀粉酶SEO ID NO: 1(SP6卯)的变体
将编码SEQIDNO: 1之淀粉酶的基因放入W096/23873中描述的质粒pTVB106中。从该构建体中的amyL启动子开始在枯草芽孢杆菌中表达淀蛋白质的一个变体是A (T183-G184)+Y243F+Q391E+K444Q 。W096/23873中描述了该变体的构建过程。
经Sarkar和Sommer(1990,生物技术8: 404-407)所描述的mega-引物法来构建A(T183-G184)+N195F。
利用基因特异引物B1(SEQIDN0: 17)和诱变引物101458(SEQ IDNO:19)经PCR来扩增一个接近645bp的DNA片段,该片段来自类pTVB106质粒(在编码SEQIDNO: 1之淀粉酶的基因中含有A(T183-G184)突变)。
从琼脂糖凝胶中纯化该645bp片段,并与引物Y2(SEQ ID NO: 18)—起作为在同 一模板上进行的第2次PCR中的mega-引物。
用限制酶BstEII和AflIII消化所得近1080bp的片段,纯化产生的约510bp的DNA片段,并将其与用相同酶消化过的类pTVB106质粒(在编码SEQIDNO: 1的淀粉酶的基因中含有A(T183-G184)突变)进行连接。用连接产物和氯霉素抗性转化子来转化感受态枯草芽孢杆菌SHA273(淀粉酶和蛋白酶低)细胞,并经DNA测序检测来证明质粒中正确的突变存在。
引物B1: (SEQIDNO: 17)
5' CGA TTG CTG ACG CTG TTA TTT GCG 3 ,
引物Y2: (SEQIDNO: 18)
5, CTT GTT CCC TTG TCA GAA CCA ATG 3,
引物101458: (SEQIDNO: 19)
5' GT CAT AGT TGC CGA AAT CTG TAT CGA CTT C 3'以相似的方法构建变体:A(T183-G184)+K185R+A186T,除了所用诱变引物为101638外。
引物101638: (SEQIDNO: 20)
5 , CC CAG TCC CAC GTA CGT CCC CTG AAT TTA TAT ATT TTG 3'以相似的方法来构建变体:△ (T183-G184)+A186T, △(T183-G184)+A186I, A(T183-G184)+A186S, A(T183-G184)+A186N,除了所用模板为类pTVB106质粒(携有变体A(T183-G184)+K185R+A186T),并用它作为克隆载体。
诱变寡核苷酸(01igol)是:
5, CC CAG TCC CAG NTCTTT CCC CTG AAT TTA TAT ATT TTG3'(SEQIDNO:21)N代表用于合成i秀变寡核苷酸(mutagenicoli-gonucleotide)的4种碱基: A, C,G和T的混合物。
测定转化子的序列来确定成熟淀粉酶中186位氨基酸的正确密码子。 如下构建变体:厶(T183-G184)+K185R+A186T+N195F: 用引物X2和引物101458在类pTVB106质粒(携有突变A (T183-G184)+K185R+A186T)上进行PCR。将所得DNA片段与引物Y2 —起 作为在类pTVB106质粒(携有突变A(T183-G1S4)+N195F)上进行的PCR中 的mega-引物。用限制性内切酶Acc651和AflIII消化第2次PCR的产物, 并将其克隆至用相同的酶消化过的类pTVB106质粒(△ (T183-G184)+層5F)。
引物X2: (SEQIDNO: 22)
5, GCG TGG ACA AAG TTT GAT TTT CCT G 3,
如下构建变体:△ (T183-G184)+K185R +A186T+ N195F+ Y243F+ Q391E+K444Q:
用引物X2(SEQ ID NO: 22)和引物10+K185R1458(SEQ ID NO: 19)在 类pTVB106质粒(携有突变A(T183-G184)+K185R+A186T)上做PCR。将所 得DNA片段与引物Y2(SEQIDNO: 18)—起作为在类pTVB106质粒(携有 突变△ (T183-G184)+Y243F+ Q391E+K444Q)上进行的PCR中的mega-引物。 用限制性内切酶Acc65I和AflIII消化第2次PCR的产物,并将其克隆至用 相同的酶消化过的类pTVB106质粒(△ (T183-G184)+Y243F十 Q391E+K444Q)。
实施例5
构建亲本SP722a-淀粉酶(SEOIDNO: 2〗的定点a-淀粉酶变体 如下所述构建淀粉酶SEQIDNO: 2(SP722)的变体。 将编码SEQIDNO: 2之淀粉酶的基因转入W096/23873中描述的质粒 pTVB112中。从该构建体中的amyL启动子开始在枯草芽孢杆菌中表达淀
经Sarkar和Sommer(1990,生物技术8: 404-407)所描述的mega-引物 法来构建△ (Dl 83-G184)+V56I。
利用基因特异引物DA03和诱变引物DA07经PCR来扩增一个接近 820bp的DNA片段,该片段来自类pTVB112质粒(在编码SEQ ID NO: 2 之a-淀粉酶的基因中含有A(D183-G184)突变)。从琼脂糖凝胶中纯化该820bp片段,并与引物DA01 —起作为在同一模 板上进行的第2次PCR中的mega-引物。
用限制酶NgoM I和Aat II消化所得近920bp的片段,纯化产生的约 170bp的DNA片段,并将其与用相同酶消化过的类pTVB112质粒(在编码 SEQIDNO: 2所示淀粉酶的基因中含有A(D183-G184)突变)进行连接。用 连接产物来转化感受态枯草芽孢杆菌SHA273(淀粉酶和蛋白酶低)细胞,并 经DNA测序检测氯霉素抗性转化子来证明质粒上含有正确的突变。
引物DA01: (SEQIDNO: 23)
5, CCTAATGATGGGAATCACTGG 3,
引物DA03: (SEQIDNO: 24)
5, GCATTGGATGCTTTTGAACAACCG 3,
引物DA07: (SEQIDNO: 25)
5, CGCAAAATGATATCGGGTATGGAGCC 3,
经Sarkar和Sommer(19卯,生物技术8: 404-407)4苗述的mega-引物法 来构建变体:△ (D183-G184)+K108L, A (D183-G184)+K108Q, △ (D183-G184)+K10犯,A(D183-G184)+K108V。
用引物DA03和诱变引物DA20在类pTVB112质粒(携有突变A (D183-G184))上做PCR。将所得DNA片段与引物DA01 —起作为在类 pTVB112质粒(携有突变A(D183-G184))上进行的PCR中的mega-引物。用 限制性内切酶AatII和Mlul消化约920bp的第2次PCR的产物,并将其克 隆至用相同的酶消化过的类pTVB112质粒(A(D183-G184))。
引物DA20(SEQIDNO: 26):
5, GTGATGAACCACSWAGGTGGAGCTGATGC 3,
S代表用于合成诱变寡核苷酸的2种碱基:C和G的混合物,W代表用 于合成诱变寡核苷酸的2种碱基:A和T的混合物。
测定转化子的序列来确定成熟淀粉酶中108位氨基酸的正确密码子。
以相似的方法构建变体:△ (D183-G184)+D168A, △ (D183-G184)+D168I, A(D183-G184)+D168V, A(D183-G184)+D168T,除了 所用诱变引物为DA14。
引物DA14(SEQIDNO: 27):
5, GATGGTGTATGGRYCAATCACGACAATTCC 3,
R代表用于合成诱变寡核苷酸的2种碱基:A和G的混合物,Y代表用
40于合成诱变寡核苷酸的2种碱基:C和T的混合物。
测定转化子的序列来确定成熟淀粉酶中168位氨基酸的正确密码子。 以相似的方法构建变体:A(D183-G184)+Q169N,除了所用诱变引物为
DA15。
引物DA15(SEQIDNO: 28):
5, GGTGTATGGGATAACTCACGACAATTCC 3,
以相似的方法构建变体:A(D183-G184)+Q169L,除了所用诱变引物为 DA16。
引物DA16(SEQIDNO: 29):
5, GGTGTATGGGATCTCTCACGACAATTCC 3,
以相似的方法构建变体:A(D183-G184)+Q172N,除了所用诱变引物为 DA17。
引物DA17(SEQIDNO: 30):
5, GGGATCAATCACGAAATTTCCAAAATCGTATC 3, 以相似的方法构建变体:A(D183-G184)+Q172L,除了所用诱变引物为 DA18。
引物DA18(SEQIDNO: 31):
5, GGGATCAATCACGACTCTTCCAAAATCGTATC 3, 以相似的方法构建变体:A(D183-G184)+L201I,除了所用诱变引物为 DA06。
引物DA06(SEQIDNO: 32):
5, GGAAATTATGATTATATCATGTATGCAGATGTAG 3' 以相似的方法构建变体:A(D183-G184)+K269S,除了所用诱变引物为 DA09。
引物DA09(SEQIDNO: 33): 5, GCTGAATTTTGGTCGAATGATTTAGGTGCC 3, 以相似的方法构建变体:A(D183-G184)+K269Q,除了所用诱变引物为 DAll。
引物DAll(SEQIDNO: 34): 5, GCTGAATTTTGGTCGAATGATTTAGGTGCC 3, 以相似的方法构建变体:A(D183-G184)+N270Y,除了所用诱变引物为 DA21。引物DA21(SEQEDN0: 35):
5, GAATTTTGGAAGTACGATTTAGGTCGG 3,
以相似的方法构建变体:A(D183-G184)+L272A, A(D183-G184)+L272I:
△ (D183-G184)+L272V, △ (D183-G184)+L272T ,除了所用诱变引物为 DA12。
引物DA12(SEQIDNO: 36): 5, GGAAAAACGATRYCGGTGCCTTGGAGAAC 3, R代表用于合成诱变寡核苷酸的2种碱基:A和G的混合物,Y代表用 于合成诱变寡核苷酸的2种碱基:C和T的混合物,
测定转化子的序列来确定成熟淀粉酶中272位氨基酸的正确密码子。 以相似的方法构建变体:A(D183-G184)+L275A, A(D183-G184)+L275I:
△ (D183-G184)+L275V, A (D183-G184)+L275T ,除了所用诱变引物为 DA13„
引物DA13(SEQEDNO: 37):
5, GATTTAGGTGCCTRYCAGAACTATTTA 3,
R代表用于合成诱变寡核苷酸的2种碱基:A和G的混合物,Y代表用
于合成诱变寡核苷酸的2种威基:C和T的混合物。
测定转化子的序列来确定成熟淀粉酶中275位氨基酸的正确密码子。 以相似的方法构建变体:△ (D 183-G184)+Y295E,除了所用诱变引物为
DA08。
引物DA08(SEQIDNO: 38):
5, CCCCCTTCATGAGAATCTTTATAACG 3,
以Sarkar和Sommer(1990,生物技术8: 404-407)描述的mega-引物法 来构建变体A(D183-G184)+K446Q。
利用基因特异引物DA04(该引物在终止密码子下游214-231bp退火)和 诱变引物DA10经PCR来扩增一个接近350bp的DNA片段,该片段来自 类pTVB112质粒(在编码SEQ ID NO: 2的淀粉酶的基因中含有A (D183-G184)突变)。
将所得DNA片段与引物DA05 —起作为在类pTVB112质粒(携有突变 A(D183-G184))上进行的PCR中的mega-引物。用限制性内切酶SnaB I和 Notl消化约460bp的第2次PCR产物,并将其克隆至用相同的酶消化过的 类pTVB106质粒(携有A(D183-G184)突变)。引物DA04(SEQ ID NO: 39):
5, GAATCCGAACCTCATTACACATTCG 3,
引物DA05(SEQIDNO: 40):
5, CGGATGGACTCGAGAAGGAAATACCACG 3,
引物DA10(SEQIDNO: 41):
5, CGTAGGGCAAAATCAGGCCGGTCAAGTTTGG 3, 以相似的方法构建变体:厶(D183-G184)+K458R,除了所用诱变引物为 DA22。
引物DA22(SEQIDNO: 42):
5, CATAACTGGAAATCGCCCGGGAACAGTTACG 3, 以相似的方法构建变体:△ (D183-G184)+P459S和△ (D183-G184)
+P459T,除了所用诱变引物为DA19。 引物DA19(SEQIDNO: 43): 5, CTGGAAATAAAWCCGGAACAGTTACG 3, W代表用于合成诱变寡核苷酸的2种碱基:A和T的混合物。 测定转化子的序列来确定成熟淀粉酶中495位氨基酸的正确密码子。 以相似的方法构建变体:A(D183-G184)+T461P,除了所用诱变引物为
DA23。
引物DA23(SEQEDNO: 44):
5,GGAAATAAACCAGGACCCGTTACGATCAATGC 3, 以相似方法构建变体:A(D183-G184)+Kl42艮除了所用诱变引物为 DA32。
引物DA32(SEQIDNO: 45): 5, GAGGCTTGGACTAGGTTTGATTTTCCAG 3, 以相似方法构建变体:A(D 183-G184)+K269R,除了所用诱变引物为 DA31。
引物DA31(SEQIDNO: 46):
5, GCTGAATTTTGGCGCAATGATTTAGGTGCC 3,
实施例6
构建亲本透阿米尔a-淀粉酶(SEOIDNO: 4)的定点a-淀粉酶变体 将编码透阿米尔a-淀粉酶的amyL基因转入WO96/10603(NovoNordisk) 中描述的质粒pDN1528中。通过W097/41213或上面描述的"mega引物法"
43200410061736.6 中N265R和N265D取代的变体。 诱变寡核苷酸是: 用于N265R取代的引物Ml:
5, PCC AGC GCG CCT AGG TCA CGC TGC CAA TAT TCA G(SEQ ID NO:56)
用于N265D取代的引物bl2:
5, PCC AGC GCG CCT AGG TCA TCC TGC CAA TAT TCA G(SEQ ID NO:57)
P代表磷酸根基团。 实施例7
确定具有SEO ID NO: 2所示氨基酸序列的亲本a-淀粉酶之变体在碱 性pH的pH稳定性
在这组分析中,利用了纯化的酶样品。用在100mM CAPS緩冲液(调至 pH10.5)中的各变体溶液进行测量。将溶液在75'C温育。
温育20和30分钟后,用PNP-G7检测法(在"材料与方法"部分描述 过)测量残存活性。用Britton Robinson緩冲液(pH7.3)测量样品中的残存活 性。测量残存活性相对0分钟同一酶的相应对照溶液的下降值,所述对照 溶液未在高pH和75 。C温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO: 2)和受测变体
的一个函数。table see original document page 44
在另 一组分析中,使用了培养物上清液。用溶在lOOmM CAPS緩冲液(调 至pH10.5)中的各变体溶液进行测量。将溶液在80。C温育。
温育30分钟后,用Phadebas检测法(在上述"材料与方法"部分描述 过)测量残存活性。用Britton Robinson緩冲液(pH7.3)测量样品中的残存活 性。测量残存活性相对0分钟同一酶的相应对照溶液的下降值,所述对照 溶液未在高pH和80°C温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO: 2)和受测变体 的一个函数。
table see original document page 45
实施例8
确定氨基酸序列如SEOIDNO: l,SEOIDNO: 2和SE0IDN0: 4所 示的亲本a -淀粉酶之变体在碱性pH的辆稳定性 A: SEOIDNO: 1序列之变体的钙稳定性
用溶在lOOmM CAPS緩冲液(调至pH10.5)中的各变体溶液进行测量, 并在(时间t = 0时)向其中加入聚磷酸盐至终浓度为2400ppm。将溶液于50 C温育。
温育20和30分钟后,用PNP-G7检测法(上面描述过)测量残存活性。 用Britton Robinson緩冲液(pH7.3)测量样品中的残存活性。测量残存活性相 对0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和 50。C温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO: l)和受测变体 的一个函数。
table see original document page 45

n.d,未测
B. SEOIDNO: 2序列之变体的钙稳定性
在这组分析中使用了纯化的酶样品。用溶在100mMCAPS緩冲液(调至 pH10.5)中的各变体溶液进行测量,并在(时间t = 0时)向其中加入聚磷酸盐 至终浓度为2400ppm。将溶液于50'C温育。
温育20和30分钟后,用PNP-G7检测法(上面描述过)测量残存活性。 用Bri加nRobinson緩冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和50。C温育。在下表中将初始活性的百分比作为亲本酶(SEQ ID NO: 2)和受测变体 的一个函数。
table see original document page 46
table see original document page 46
在这组分析中使用了培养物上清液。用溶在lOOmMCAPS緩冲液(调至 pH10.5)中的各变体溶液进行测量,并在(时间t = 0时)向其中加入聚磷酸盐 至终浓度为2400ppm。将溶液于50。C温育。温育30分钟后,用Phadebas检测法(上面描述过)测量残存活性。用 Britton Robinson緩沖液(pH7.3)测量样品中的残存活性。测量残存活性相对 0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和50c温育。在下表中将初始活性的百分比作为亲本酶(SEQ ID NO: 2)和受测变体 的一个函数。
table see original document page 46
C.SEOIDNO: 4中岸列之变体的钙稳定性用溶在100mM CAPS緩沖液(调至pH10.5)中的各变体溶液进行测量, 并加入聚磷酸盐(在时间t0)至终浓度为2400ppm。将溶液于60。C温育20温育20分钟后,用PNP-G7检测法(上面描述过)测量残存活性。用 Britton Robinson緩冲液(pH7.3)测量样品中的残存活性。测量残存活性相对 0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和60 。C温育。在下表中将初始活性的百分比作为亲本酶(SEQ ID NO: 4)和受测变体 的一个函数。变体 20分钟后的残存活性透阿米尔(SEQIDNO: 4) 17%N265R 28%N265D 25%实施例9在中温测量氨基酸序列如SEOIDNO: 1所示之a-淀粉酶的活性A: SEO ED NO: 1中序列的变体的a -淀粉酶活性用溶在50mM Britton Robinson緩冲液(调节至pH7.3)中的各变体溶液, 利用Phadebas检测法(上面描述过)进行测量。在37'C用50mM Britton Robinson緩沖液(pH7.3),并在25"C用50mM CAPS緩冲液(pH10.5)测量样品 中的活性。下表显示亲本酶(SEQ ID NO: l)和受测变体的温度依赖活性和在25°C 的活性相对37'C活性的百分比。变体 NU/mg25'C NU/mg37。C NU(25。C)/NU(37。C)SP690 1440 35000 4.1%A(T183-G184) 2卯0 40000 7.3%A(T183-G184)+K269S I860 12000 15.5%A(Q174) 3830 38000 7.9%用溶在50mM Britton Robinson緩冲液(调至pH7.3)中的各变体溶液,采 用Phadebas检测法(上面描述过)进行另一项测量。于37。C和5(TC用50mM Britton Robinson緩冲液(pH7.3)测量样品中的活性。下表显示亲本酶(SEQ ID NO: l)和受测变体的温度依赖活性以及在37 C的活性相对50"C的活性的百分比。变体 NU/mg37t: NU/mg50。C NU(37。C)婦(50匸)SP690(SEQIDNO: 1) 13090 21669 60%K269Q 7804 10063 78%47B: SEOIDNO: 2中的序列的变体的a-淀粉酶活性用溶在50mM Britton Robinson緩冲液(调至pH7.3)中的各变体溶液,采 用Phadebas检测法(上面描述过)进行测量。于25。C和37。C用50mM Britton Robinson緩冲液(pH7.3)测量样品中的酶活性。下表显示亲本酶(SEQ ID NO: 2)和受测变体的温度依赖活性以及在25 。C活性相对37'C活性的百分比。
table see original document page 48
用溶在50mM Britton Robinson緩冲液(调至pH7.3)中的各变体溶液,采 用Phadebas检测法(上述)测量。在37。C用50mM Britton Robinson緩沖液 (pH7.3),并在60"C用50mM CAPS緩沖液(pH10.5)测量样品中的活性。下表显示亲本酶(SEQ ID NO: 4)和受测变体的温度依赖活性以及在37 。C活性相对60。C活性的百分比。
table see original document page 48
实施例10构建亲本杂交体BAN:l-300/透阿米尔:301-483oc-淀粉酶之变体质粒pTVB191包含编码杂交体BAN:l-300/透阿米尔:301-483的基因以 及可在枯草芽孢杆菌中使用的复制原点和赋予氯霉素抗性的cat基因。采用mega-引物法(Sarkar和Sommer, 1990),以质粒pTVB191为模板来 构建变体BM4(F2卯E)。用引物pl(SEQIDNO: 52)和诱变寡核苷酸bm4(SEQ ID NO: 47)经聚 合酶链反应(PCR)在标准条件下扩增一个444bp的片段。从琼脂糖凝胶上纯化该片段,并与引物p2(SEQ ID NO: 53)—起作为第 2次PCR的"mega-引物",产生一个531bp的片段。用限制内切酶HinDIII 和TthlllT消化该片段。将这样产生的389 bp片段连接到用相同的两种酶 切割过的质粒pTVB191中。将所得质粒转化至枯草芽孢杆菌SHA273中。通过在含有氯霉素和不溶性淀粉的平板上培养转化子来挑选出氯霉素抗性 克隆。用碘蒸汽将平板染色后,选出形成晕圏的克隆,即分离到了表达活性a-淀粉酶的克隆。经DNA测序来证实所导入的突变。以类似的方法构建变体BM5(F290K), BM6(F290A), BM8(Q360E)和 BM11(N102D)。以下给出构建这些变体的细节。变体:BM5(F290K) 诱变寡核苷酸:bm5(SEQIDNO: 48) 引物(第一次PCR): pl(SEQIDNO: 52) 所得片段的大小:444bp 引物(第二次PCR): p2(SEQIDN0: 53) 限制内切酶:HinDIII,TthlllI 切割片段的大小:389bp变体:BM6(F2卯A) 诱变寡核苷酸:bm6(SEQIDNO: 49) 引物(第一次PCR): pl(SEQIDNO: 52) 所得片段的大小:444bp 引物(第二次PCR): p2(SEQIDNO: 53) 限制内切酶:HinDIII,TthlllI 切割片段的大小:389bp变体:BM8(Q360E) 诱变寡核苷酸:bm8(SEQIDNO: 50) 引物(第一次PCR): pl(SEQIDNO: 52) 所得片段的大小:230bp 引物(第二次PCR): p2(SEQIDNO: 53) 限制内切酶:HinD III , Tthl 1II 切割片段的大小:389bp变体:BM11(N102D) 诱变寡核苷酸:bmll(SEQIDNO: 51) 引物(第一次PCR): p3(SEQIDNO: 54) 所得片段的大小:577bp49引物(第二次PCR): p4(SEQIDNO: 55) 限制内切酶:HinDIII,PvuI 切割片段的大小:576bp诱变寡核苷酸:bm4(SEQIDNO: 47): F290E引物5, GTG TTT GAC GTC CCG CTT CAT GAG AAT TTA CAG G bm5(SEQIDNO: 48): F290K引物5 , GTG TTT GAC GTC CCG CTT CAT AAG AAT TTA CAG G bm6(SEQIDNO: 49): F290A引物5 , GTG TTT GAC GTC CCG CTT CAT GCC AAT TTA CAG G bm8(SEQIDNO: 50): Q360E引物5, AGG GAA TCC GGA TAC CCT GAG GTT TTC TAC GG bmll(SEQIDNO: 51): N102D引物5, GAT GTG GTT TTG GAT CAT AAG GCC GGC GCT GAT G 其他引物pi: 5, CTG TTATTA ATG CCG CCA AAC C(SEQ ID NO:52) p2: 5, G GAA AAG AAA TGT TTA CGG TTG CG(SEQ ID NO:53) p3: 5'GAAATGAAGC GGAACATCAAAC ACG(SEQIDNO:54) p4: 5 , GTA TGA TTT AGG AGA ATT CC(SEQ ID NO:55)实施例11亲本杂交体BAN:l-300/透阿米尔:301-483oc-淀粉酶变体在碱性pH下 的a-淀粉酶活性用各酶的溶液,采用Phadebas检测法(上面描述过)进行测量。在50mM Britton Robinson緩沖液(用NaOH调至所需pH)中于30。C温育15分钟后, 测量活性。NU/mgpH wt Q360E F290A F2卯K F290E 画2D8.0 5300 7800 8300 4200 6600 62009.0 1600 2700 3400 2100 l卯O 190050参考文献Klein, C.等,生物化学1992, 31: 8740-8746, Mizuno,H.等,分子生物学杂志(1993)234: 1282-1283, Chang,C.等,分子生物学杂志(1993)229: 235-238, Larson, S.B.,分子生物学杂志(1994)235: 1560-1584 Lawson,C丄.,分子生物学杂志(1994)236: 590-600, Qian,M.,等,分子生物学杂志(1993)231: 785-799, Brady, R丄.等,Acta Crystallogr.sect. B,47:527-535, Swift,H丄,等,ActaCrystallogr.sect.B.47:535-544,A.KadziolaJf士论文:"大麦ot-淀粉酶及采用X-射线晶体学研究的其与底物 类似物抑制剂形成的复合体",哥本哈根大学化学系1993 MacGregor, E.A.,Food Hydrocolloids, 1987, 1巻,5-6, RB.Diderichsen和 L.Christiansen,来自嗜热脂肪芽孢杆菌的产麦芽糖的ct-淀粉酶的克隆, FEMS微生物快报:56: 53-60(1988)Hudson等,实用免疫学,第3版(1989), Blackwell Scientific Publications,Sambrook等,分子克隆:实验指南,第2版,Cold Spring Harbor, 1989S丄.Beaucage和M,H.Caruthers,四面体快报22, 1981: 1859-1869Matthes等,EMBO杂志3, 1984: 801-805。R.K.Saiki等,科学239, 1988: 487-491。Morinaga等,1984,生物技术2: 646-639Nelson和Long,分析生物化学180, 1989: 147-151Hunkapiller等,1984,自然310: 105-111R. Higuchi, B. Krummel和R.K.Saiki(1988)。 DNA片段体外制备和特异突变 的一般方法:蛋白质和DNA相互作用的研究。核酸研究16: 7351-7367。 Dubnau等,1971,分子生物学杂志56: 209-221。 Gryczan等,1978,细菌杂志134: 318-329。 S.D.Erlich, 1977, Proc. Natl. Acad. Sci.序列表(1) 一般资料:(i)申请人:(A) 姓名:NovoNordiskA/S(B) 街道:NovoAlle(C) 城市:DK-2880 Bagsvaerd(E) 国家:丹麦(F) 邮政编码(ZIP): DK-2880(G) 电话:+45 44 44 88 88(H) 传真:+45 44 49 32 56(ii) 发明题目:a -淀粉酶变体(iii) 序列数:46(iv) 计算机可读形式:(A) 介质类型:软盘(B) 计算机:IBMPC兼容机(C) 操作系统:PC誦DOS/MS-DOS(D) 软件:Patent In Release #1.0, Version #1.25(EPO)(2)SEQIDNO:l的资料:(i) 序列特征:(A) 长度:485个氨基酸(B) 类型:氨基酸(C) 链型:单链(D) 拓朴结构:线性(ii) 分子类型:肽(xi)序列描述:SEQIDNO:l :His His Asn Gly Thr Asm Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr 15 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala 20 25 30Asn Leu Lys Ser Lys Gly lie Thr Ala Val Trp lie Pro Pro Ala Trp 35 40 4552Lys Gly Thr Ser Gin 50Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr 55 60Asp Leu Gly Giu Phe 65Asn Gin Lys Gly Thr Val Arg Thr !Lys Tyr Gly 70 75 80Thr Arg Asn Gin Leu 85Gin Ala Ala Val Thr Ser Leu Lys Asn Asn Gly 90 95lie Gin Val Tyr Gly 100Asp Val Val Met Asn His Lys Gly Gly Ala Asp 105 110Gly Thr Glu lie Val 115Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn 120 125Gin Glu Thr Ser Gly Glu Tyr Ala lie Glu Ala Trp Thr Lys Phe Asp 130 135 140Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr 145 150 155 ,His Phe Asp Gly Thr Asp Trp Asp Gin Ser Arg Gin Leu Gin Asn Lys 165 170 175lie Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp 180 . -185 190Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205Asp His Pro Glu Val lie His Glu Leu Arg Asn Trp Gly Val Trp Tyr 210 215 220Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg lie Asp Ala Val Lys His 225 230 235 240245250lie Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr Thr Gly Gly AlaLys Pro Met Phe Ala Val Ala Glu 260 265255Phe Trp Lys Asn Asp Leu 2"70lie Glu Asn Tyi 275L>eu Asn Lys Thr 280Ser Tip Asn 285His Ser ValPhe Asp Val Pro Leu His 290Tyr Asn Leu Tyr 295Asn Ala Ser 300Asn Ser GlyGly Tyr Tyr Asp Met Arg 305 310His Pro Thr His Ala Val 325Gly Glu Ala Leu Glu Ser 340Asn lie Leu AsnThrPhePhe Val Asp330Val Gin Gin 345Gly Ser Val 315Asn His Asp Trp Phe I^'sVal Gin Lys 320Ser Gin Pro335Pro L>eu Ala 35053Tyr Ala Leu Val Leu Thr Arg Glu Gin Gly Tyr Pro Ser Val Phe Tyr 355 360 365
Gly Asp Tyr Tyr Gly lie Pro Thr His Gly Val Pro Ala Met Lys Ser 370 375 380
Lys工le 385 Asp Pro L>eu 390 Gin Ala Arg Gin Thr Phe Ala Tyr 395 Gly Thr 400
Gin His Asp Tyr Phe 405 Asp His His Asp lie 410 lie Gly Trp Thr Arg Glu 415
Gly Asn Ser Ser 420 His Pro Asn Ser Gly 425 Leu Ala Thr lie Met 430 Ser Asp
Gly Pro Gly "5 Gly Asn Lys Trp Met 440 Tyr Val Gly Lys Asn Lys Ala Gly Gin Val 450 Trp Arg Asp lie Thr Gly 455 Asn Arg Thr Gly Thr Val 460 Thr lie
Asn Ala 465 Asp Gly Trp Gly 470 Asn Phe Ser Val Asn Gly Gly Ser 475 Val Ser 480
Val Trp Lys Gin
485
(2) SEQIDNO:2的资料:
(i) 序列特征:
(A) 长度:485个氨基酸
(B) 类型:氨基酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:肽
(xi)序列描述:SEQ IDNO:2 :
His His Asn Gly Thr Asn Gly Thr Met Met
1 5 . 10
Leu Pro Asn Asp Gly Asn His Trp Asn Arg 20 25
Asn Leu Arg Asn Arg Gly lie Thr Ala lie 35 40
Lys Gly Thr Ser Gin Asn Asp Val Gly Tyr 50 55
Asp I-eu Gly Glu Phe Asn Gin Lys Gly Thr 65 70 _
Thr Arg Ser Gin Leu Glu Ser Ala lie His
85 90
Gin Tyr Phe Glu Trp His 15
Leu Arg Asp Asp Ala Ser 30
Trp lie Pro Pro Ala Trp 45
Gly Ala Tyr Asp Leu Tyr 60
Val Arg Thr !>ys Tyr Gly 75 80
Ala Leu !Ala Thr Glu Asn Val Leu Ala Val 115 120
Gin Glu lie Ser Gly Asp Tyr Thr 130 ' 135
Phe Pro Gly Arg Gly Asn Thr Tyr 145 150
Met Asn His Lys Gly Gly Ala Asp 105 110
Glu Val Asn Pro Asn Asn Arg Asn 125
lie Glu Ala Trp Thr Lys Phe Asp 140
Ser Asp Phe Lys Trp Arg Trp Tyr 155 160
His Phe Asp Gly Val Asp Trp Asp Gin Ser Arg Gin Phe Gin Asn Arg 165 170 175
lie Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190
Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205
Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr 210 215 220
Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg lie Asp Ala Val Lys His 225 230 235 240
lie Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala 245 250 255
Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu 260 265 270
Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val 275 280 285
Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly 290 295 300
Gly Asn Tyr Asp Met Ala Lys 305 310
Leu Leu Asn Gly Thr Val 315
Val Gin Lys 320
His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gin Pro
325
Gly Glu Ser Leu Glu Ser Phe Val Gin 340 345
330
Glu Trp Phe !Lys
335
Pro Leu Ala 350
Tyr Ala Leu lie Leu Thr Arg Glu Gin 355 360
Gly Tyr Pro Ser 365
Val Phe Tyr
Gly Asp Tyr Tyr Gly lie Pro Thr His Ser Val Pro Ala Met Lys Ala
370 375 380
Lys lie Asp Pro lie Leu Glu Ala Arg Gin Asn Phe Ala Tyr Gly Thr
385 390 395 ,Gin His Asp Tyr Phe Asp His His Asn lie lie Gly Trp Thr Arg Glu 405 410 415
Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr lie Met Ser Asp 420 425 430
Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gin Asn JLys Ala Gly
"0 "5
Thr Gly Asn Lys Pro Gly Thr Val Thr lie 455 460
Asn Phe Ser Val Asn Gly Gly Ser Val Ser
475
480
435
Gin Val Trp His Asp lie 450
Asn Ma Asp Gly Trp Ala 465 470
lie Trp Val Lys Arg 485
(2) SEQIDNO:3的资料:
(i) 序列特征:
(A) 长度:514个氨基酸
(B) 类型:氨基酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:肽
(xi)序列描述:SEQ ID NO:3 :
Phe Glu Trp Tyr Leu
Ala Ala Pro Phe Asn Gly Thr Met Met Gin Tyr 1 5 10
Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala 20 25
Ser Leu Gly lie Thr Ala Leu Trp Leu 35 40
Ser Arg Ser Asp Val Gly Tyr Gly Val 55
Leu Ser
Asn Glu Ala Asn Asn 30
Pro Pro Ala Tyr Lys 45
Gly Thr 50
LGlu Phe Asn
Lys Ala Gin Gin Val Tyr
Tyr Leu 85
Ala Asp 100
Gin Lys Gly Ala Val Arg 70 75
Gin Ala lie Gin Ala Ala 90
Tyr Asp
60
Thr Lys
His Ala
Thr Glu Trp Val Asp
Glu lie Ser Gly Thr 130
Val Val Phe Asp His 105
Ala Val Glu Val Asn 120
Tyr Gin lie Gin Ma 135
Lys Gly Gly
Pro Ser Asp 125
Trp Thr Lys 140
Leu Tyr Asp
Tyr Giy Thr 80
Ala Gly Met 95
Ala Asp Gly 110
Arg Asn Gin Phe Asp Phe
56Pro Gly Arg Gly Asn Thr T乂r Ser Ser Phe 145 150
Lys Trp Arg Trp Tyr His 155 160
Phe Asp Gly Val Asp Trp Asp Glu Ser Arg _ 165 170
Lys Phe Arg Gly lie Gly Lys Ala Trp Asp 180 185
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala 195 200
Pro Glu Val Val Thr Glu Leu Lys Ser Trp 210 215
Thr Thr Asn 225
Lys Leu Ser Arg Trp Giu Asp Leu
Val Asp 190
Gly Lys 220
lie Asp Gly Phe Arg Leu Asp Ala Val 230 235
Asp 205
Trp Lys
lie Tyr 175
Thr Glu
Met Asp His Tyr Val Asn
His lie Lys 240
Phe Ser Phe Phe Pro Asp Trp Leu Ser Asp Val Arg Ser Gin Thr Gly 245 250 255
L»ys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser 260 265 '
Tyr Asp lie Asn Lys 270
Leu His Asn Tyr 275
lie Met Lys Thr Asn Gly Thr
280
Met Ser Leu Phe Asp 285
Aia Pro Leu His Asn Lys Phe Tyr Thr Ala Ser 290 295
Lys Ser Gly Gly Thr 300
Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pro
305
310
315
320
Thr Leu Ala Val Thr 325
Phe Val Asp Asn His Asp Thr Glu Pro Gly Gin 330 335
Ma Leu Gin Ser Trp 340
Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala 345 350
Phe lie Leu Thr Arg 355
Gin Glu Gly Tyr Pro Cys Val Phe 360 365
Tyr Tyr Gly lie 370
Pro Gin Tyr Asn lie Pro Ser Leu Lys 375 380
Tyr Gly Asp Ser Lys lie
Asp Pro Leu Leu 385
工le Ala Arg 390
Arg Asp Tyr Ala 395
Tyr Gly Thr Gin His 400
Asp Tyr Leu Asp
His Ser Asp lie lie Gly 405 410
Trp Thr Arg Glu Gly Val 415
Thr Glu Lys Pro Gly 420
Gly Gly Ser Lys Trp 435
Ser Gly Leu Ala Ala Leu
425
Met Tyr Val Gly Lys Gin "0
lie Thr Asp Gly Pro
430
His Ala Gly Lys ValPhe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr lie Asn Ser450 " 455 楊
Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp465 470 "5 480
Val Pro Arg Lys Thr Thr Val Ser Thr lie Ala Trp Ser lie Thr Thr485 490 495
Arg Pro Trp Thr Asp Giu Phe Val Arg Trp Thr Glu Pro Arg Leu Val500 505 510
Ala Trp
(2) SEQIDNO:4的资料:
(i) 序列特征:
(A) 长度:483个氨基酸
(B) 类型:氨基酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:蛋白质(xi)序列描述:SEQ IDNO:4 :
Ala Asn Leu Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp15 10
Asn Asp Gly Gin His Trp Arg Arg Leu Gin Asn Asp Ser20 25
Tyr Met Pro15
Ala Tyr LAla Glu His Gly lie Thr Ala Val Trp lie
35
Thr Ser Gin Ala Asp50
Gly Glu Phe His Gin65
Gly Glu Leu Gin Ser85
Val
Lys70
Gly55
40
Tyr
Gly AlaGly Thr Val Arg
Ala lie Lys
Ser Leu90
Pro Pro Ala
45
Tyr Asp Leu60
Thr Lys Tyr75 _
His Ser Arg
Tyr Lys Gly
Tyr Asp Leu
Gly Thr Lys80
Asp lie Asn95
Val Tyr Gly Asp Val Val lie Asn100
Glu Asp Val Thr Ala Val Glu Val115 120
lie Ser Gly Glu His Leu lie Lys130 135
His Lys Gly Gly Ala Asp Ala Thr105 110
Asp Pro Ala Asp Arg Asn Arg Val125
Ala Trp Thr His Phe His Phe Pro140
58Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe
U5
150
155
160
Asp Gly Thr Asp Trp Asp Glu165
Ser Arg Lys Leu Asn Arg lie Tyr Lys170 175
Phe Gin Gly Lys Ala Trp Asp180
Tyr Asp Tyr Leu Met Tyr Ala195
Trp Glu Val Ser Asn Glu Asn Gly Asn1S5 190
Asp lie Asp Tyr Asp His Pro Asp Val200 205
Ala Ala Glu lie Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gin210 215 220
Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His lie Lys Phe Ser Phe
225 230 235 240
Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Ala Glu Tyr Trp Gin Asn Asp Leu Gly Ala Leu Glu Asn
260
265
270
Tyr Leu Asn Lys275
His Tyr Gin Phe290
Arg Lys Leu l>eu305
Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu280 285
His Ala Ala Ser Thr Gin Gly Gly Gly Tyr Asp Met
295
Asn Gly Thr Val Val310
Ser
300
Lys His315
Pro
!Val Thr Phe Val
Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Glu325 330 335
Ser Thr Val Gin Thr Trp Phe Lys Pro340
Thr Arg Glu Ser Gly Tyi355
Thr Lys3;0
Gly Asp Ser Gin
Pro Gin360
Arg Glu375
345
Val
Leu
Phe
lie Pro
Ala TyrTyr Gly
Ala Leu380
Ala
Asp365
L>ys
Phe lie Leu350
Met Tyr GlyHis Lys lie
Glu Pro385
lie Leu Lys Ala Arg Lys Gin Tyr390
Asp Tyr Phe Asp His His Asp lie Val
Ser Ser
His405
Val Ala Asn Ser420
Gly410
Ala Tyr Gly Ala Gin His395 彻
Trp Thr Arg Glu Gly Asp415
Gly Leu Ala425
Ala Leu lie
Thr Asp Gly Pro430Gly Gly Ala Lys Arg Met Tyr Val 440 Gly Gin Asn Ala "5 Gly Glu
Trp His Asp lie Thr Gly Arg Ser Giu Pro Val 4 60 Val 工le Asn
Glu 465 Giy Trp Gly Glu Phe 470 His Val Asn Gly Gly 475 Ser Val Ser lie
Val Gin Arg
480
(2) SEQIDNO:5的资料:
(i) 序列特征:
(A) 长度:480个氨基酸
(B) 类型:氨基酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:蛋白质
(xi)序列描述:SEQ ID NO:5 :
Val Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Thr Pro Asn Asp15 10 15
Gly Gin His Trp Lys Arg Leu Gin Asn Asp Ala Glu His Leu Ser Asp20 25 30
lie Gly lie Thr Ala Val Trp lie Pro Pro Ala Tyr Lys Gly Leu Ser35 40 45
Gin Ser Asp Asn Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu Gly Glu50 55 60
Phe Gin Gin Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ser Glu65 70 "?5 80
Leu Gin Asp Ala lie Gly Ser Leu His Ser Arg Asn Val Gin Val Tyr85 90 95
Gly Asp Val Val Leu Asn His Lys Ala Gly Ala Asp Ala Thr Glu Asp
100
Val Thr Ala Val Glu Vsl Asn115
Glu Glu Tyr Gin130
lie Lys Ala135
105
Pro Al120
Asn ArgTrp Thr Asp Phe
110
Gin Glu125
Thr Ser
Arg140
Phe Pro Gly Arg
Gly Asn Thr Tyr145
Ala Asp Trp Asp
Ser Asp Phe150
Glu Ser Arg165
Lys Trp
Lys lie
His Trp155
Ser Arg170
Tyr His Phe
lie Phe Lys
鄉Gly
160
Phe Arg175
60Gly Glu Gly Lys Ala Trp Asp Trp Glu Val Ser Ser Glu Asn Gly Asn180 185 190
Tyr Asp Tyr Leu Met Tyr Ma Asp Val Asp Tyr Asp His Pro Asp Val.195 200 205
Val Ala Glu Thr Lys Lys Trp Gly lie Trp Tyr Ala Asn Glu Leu Ser
210
215
220
Leu Asp Gly Phe Arg225
lie Asp Ala Ala Lys His lie Lys Phe Ser Phe230 235 240
Leu Arg Asp Trp Val245
Gin Ala Val Arg Gin Ala Thr Gly Lys Glu Met250 255
Phe Thr Val Ala Glu260
Tyr Trp Gin Asn Asn Ala Gly Lys Leu Glu Asn- 265 270
Tyr Leu Asn Lys Thr Ser Phe Asn Gin Ser Val Phe Asp Val Pro Leu275 280 285
His Phe Asn Leu Gin Ala Ala Ser Ser Gin Gly Gly Gly Tyr Asp Met290 295 300
Arg Arg Leu Leu Asp Gly Thr Val Val Ser Arg His Pro Glu Lys Ala305 310 315 320
Val Thr Phe Val Glu Asn His Asp Thr Gin Pro Gly Gin Ser Leu Glu325 330 335
Ser Thr Val
Gin Thr Trp340
Phe Lys Pro Leu Ala Tyr Ala Phe lie Leu345 350
Thr Arg Glu Ser Gly Tyr355
Pro Gin Val Phe Tyr Gly Asp Met Tyr Gly360 365
Thr Lys Gly Thr Ser Pro370
Lys Giu lie Pro Ser Leu Lys Asp Asn lie375 380
Glu Pro lie Leu Lys Ala385 390
Arg Lys Glu Tyr Ala Tyr Gly Pro Gin His395 400
Asp Tyr lie Asp His Pro40S
Asp Val lie Gly Trp Thr Arg Glu Gly Asp410 415
Ser Ser Ala Ala Lys Ser
420
Gly L>eu Ala Ala Leu lie Thr Asp Gly Pro
425 430
Gly Gly Ser Lys Arg Met Tyr Ala Gly Leu Lys Asn Ala Gly435 440 "5
Glu Thr
Trp Tyr Asp lie Thr Gly Asn Arg Ser鄉Thr Val Lys lie Gly Ser450 455 460
Asp Gly Trp Gly Glu Phe His Val Asn Asp Gly Ser Val Ser lie Tyr4S5 470 475 480
61(2) SEQ ID NO:6的资料:
(i) 序列特征:
(A) 长度:485个氨基酸
(B) 类型:氨基酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:肽
(xi)序列描述:SEQ IDNO:6 :
His His Asn Gly Thr Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr15 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Asn Ser Asp Ala Ser20 25 30
Asn Leu Lys Ser Lys Gly lie Thr Ala Val Trp lie Pro Pro Ala Trp35 40 45
Lys Gly Ala Ser Gin Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60
Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80
Thr Arg Ser Gin Leu Gin Ala Ala Val Thr 85 90 Ser Leu Lys Asn Asn Gly 95
lie Gin Val Tyr 100 Gly Asp Val Val Met Asn 105 His Lys Gly Gly Ala Asp 110 Ala Thr Glu 115 Met Val Arg Ala Val Glu Val 120 Asn Pro Asn 125 Asn Arg Asn
Gin Glu Val 130 Thr Gly Glu Tyr Thr lie Glu 135 Ala Trp 140 Thr Arg Phe Asp
Phe 145 Pro Gly Arg Gly Asn Thr His Ser Ser 150 Phe 155 !Lys Trp Arg Trp Tyr 160
His Phe Asp Gly Val Asp Trp Asp Gin Ser 165 170 Arg Arg Leu Asn Asn Arg 175
lie Tyr Lys Phe 180 Arg Gly His Gly Lys Ala 185 Trp Asp Trp Glu 190 Val Asp
Thr Glu Asn 195 Gly Asn Tyr Asp Tyr Leu Met 200 Tyr Ala Asp 205 lie Asp Met
Asp His Pro 210 Glu Val Val Asn Glu Leu Arg 215 Asn Trp 220 Gly Val Trp Tyr
Thr 225 Asn Thr L>eu Gly Leu Asp Gly Phe Arg 230 lie 235 Asp Ala Val Lys His 240
62lie Lys Tyr Ser Phe Thr Arg Asp Trp lie Asn His Val Arg245 250
Thr Gly Lys Asn Met Phe Ala Val Ala Glu260 265
Phe
Gly Ala lie Glu Asn Tyr275
Phe Asp Val Pro Leu His290
Gly Asn Tyr Asp Met Arg305 310
His Pro Ser His Ala Val325
Leu Gin Lys280
Tyr Asn Leu295
Thr Asn
Tyr Asn
Trp Lys Asn270
Trp Asn His285
Ala Ser Lys300
Ser Ala255
Asp LeuSer ValSer Gly
Asn lie Phe Asn
Gly Thr Val Val Gin Arg315 320
330
Glu Glu Ala
Tyr Ala Leu355
Gly Asp Tyr370
Thr Phe Val Asp Asn His Asp Ser Gin Pro
335
Pro LLeu Glu Ser Ppe Val Glu Glu Trp Phe Lys340 345
360
365
Thr Leu Thr Arg Glu Gin Gly Tyr Pro Ser Val Phe Tyr
Met Arg Ser
Tyr Gly
iiys lie Asp Pro lie3B5
lie Pro Thr375
Leu Glu Ala390
His Gly Val Pro Ala380
Arg Gin Lys Tyr Ala395
Tyr Gly Lys400
Gin Asn Asp Tyr Leu Asp His His405
Gly Asn Thr Ala His Pro Asn Ser420
Asn lie lie Gly Trp Thr Arg Glu410 415
Gly Leu Ala Thr lie Met Ser Asp425 430
Gly Ala Gly Gly Ser Lys435
Trp Met Phe Val Giy Arg Asn Lys Ala Gly440 445
Gin Val Trp450
Asn Ala Asp465
lie Trp Val
Ser Asp lie Thr Gly Asn Arg Thr Gly Thr Val Thr lie455 460
Gly Trp Gly470
Asn Lys485
Asn Phe Ser Val Asn Gly Gly Ser Val Ser475 480
(2) SEQ ID NO:7的资料:
(i)序列特征:
(A) 长度:
(B) 类型
(C) 链型
485个氨基酸氨基酸单链(D)拓朴结构:线性
(ii)分子类型:肽
(xi)序列描述:SEQ ID NO:7 :
His His Asn Gly Thr Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr15 10 15
Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala20 25 30
Asn Leu Lys Ser Lys Gly lie Thr Ala Val Trp lie. Pro Pro Ala Trp35 40 45
Lys Gly Thr Ser Gin Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60
Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80
Thr Arg Asn Gin Leu Gin Ala Ala Val Thr Ser Leu Lys Asn Asn Gly85 90 95
lie Gin Val Tyr Gly Asp VaJ Val Met Asn His Lys Gly Gly Ala Asp100 105 110
Gly Thr Glu lie Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn115 120 125
Gin Glu Thr Ser Gly Glu Tyr Ala lie Glu Ala Trp Thr Lys Phe Asp130 135 140
Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr
145 150
His Phe Asp Gly Thr Asp165
lie Tyr Lys Phe Arg Gly180
Thr Glu Asn Gly Asn Tyr195
155 160
Trp Asp Gin Ser Arg Gin Leu Gin Asn Lys170 175
Thr Gly Lys Ala Trp Asp Trp Glu Val Asp185 190
Asp His210
Thr Asn225
lie LysThr Gly
Gly Ala
Pro Glu Val lie
Asp Tyr200
His Glu215
Thr Leu Asn Leu Asp Gly230
Tyr Ser
Lys Pro260
lie Glu275
Phe Thr Arg Asp245
Leu Met Tyr Ala Asp Val Asp Met205
Leu Arg Asn Trp Gly Val Trp Tyr220
Phe Arg lie Asp Ala Val Lys His235 240
Trp Leu Thr His Vsl Arg Asn Thr250 255
Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu
265 270
Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val
280 285Phe Asp Val Pro290
Gly Tyr Tyr Asp305
His Pro Thr His
Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly295 300
Met Arg Asn lie Leu Asn Gly Ser Val Val Gin Lys
310 315 320
Gly Giu Ala Leu340
Tyr Ala
Ala Val Thr Phe Val Asp Asn His Asp325 330
Glu Ser Phe Val Gin Gin Trp Phe Lys345
Leu Val Leu Thr Arg Glu Gin Gly Tyr Pro Ser355 360 365
Gly Asp370
Lys lie385
Gin His
380
Tyr Tyr Gly lie Pro Thr His Gly Val Pro Ala375
Asp Pro Leu Leu Gin Ala Arg Gin390
Ser Gin Pro335
Pro Leu Ala350
Val Phe TyrMet Lys Ser
Asp Tyr Phe Asp His His Asp405
Gly Asn Ser
Gly Pro Gly435
Gin Val Trp450
Asn Ala Asp465
Val Trp Val
Ser His420
Gly AsnArg AspGly Trp
Pro Asn Ser Gly425
Lys Trp Met Tyr440
lie
410
Leu
Val
Thr Phe Ala Tyr Gly Thr395 400
lie Gly Trp Thr Arg Glu415
Ala Thr lie Met4 30
Gly Lys Asn Lys445
lie Thr Gly Asn Arg Thr Gly Thr Val455 "0
Gly Asn Phe Ser Val Asn Gly Gly Ser470 475
Ser AspAla GlyThr lie
Val Ser480
Lys Gin485
(2) SEQIDNO:8的资料:
(i) 序列特征:
(A) 长度:485个氨基酸
(B) 类型:氨基酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:肽
(xi)序列描述:SEQ ID NO:8 :
His His Asn Gly Thr Asn Gly Thr Met Met Gin Tyr Phe Glu Trp His, 、 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser 20 25 3G
Asn Leu Arg Asn Arg Gly lie Thr Ala lie Trp 35 40
Lys Gly Thr Ser Gin Asn Asp Val Gly Tyr Gly 50 55
Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Val 65 70 75
Thr Arg Ser Gin Leu Glu Ser Ala lie His Ala 85 90
lie Pro Pro Ala Trp 45
Ala Tyr Asp Leu Tyr 60
Arg Thr Lys Tyr Gly 80
!Leu LVal Gin Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp 100 105 110
Ala Thr Glu Asq Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn 115 . 120 125
Gin Glu lie Ser Gly Asp Tyr Thr lie Glu Ala Trp Thr Lys Phe Asp 130 135 140
Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr 145 150 155 160
His Phe Asp Gly Val Asp Trp Asp Gin Ser Arg Gin Phe Gin Asn Arg 1S5 170 "5
lie Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp 180 185 190
Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met 195 200 205
Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr 210 215 220
Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg lie Asp Ala Val Lys His 225 230 235 240
lie Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala
245
Thr Gly Lys Glu Met 260
Gly Ala Leu Glu Asn 275
Phe Asp Val Pro Leu 290
Gly Asn Tyr Asp Met '305
250
Phe Ala Val Ala Glu 265
Tyr L>eu
His Tyr 295
Ala Lys 310
Asn Lys Thr 280
Asn Leu Tyr
Leu Leu Asn
255
Phe Trp Lys Asn Asp Leu 270
Asn Trp Asn His Ser Val 285
Asn Ala Ser Asn Ser Gly 300
Gly Thr Val Val Gin Lys 315 320His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gin Pro
325
330
Gly Glu Ser Leu Glu Ser Phe Val Gin Glu Trp Phe Lys 340 345
Tyr Ala Leu lie Leu Thr Arg Glu Gin Gly Tyr Pro 355 360
Ser 365
335
Pro Leu Ala 350
Val
Gly Asp Tyr Tyr Gly 370
Lys lie Asp Pro lie 385
Gin His Asp Tyr Phe 405
Gly Asn Thr Thr His 420
lie Pro Thr His Ser Val Pro 375 380
Phe Tyr Ala Met Lys Ala
Leu Glu Ala Arg Gin Asn Phe Ala Tyr Gly Thr 390 395 400
Asp His His Asn lie lie Gly Trp Thr Arg Glu 410 415
Pro Asn Ser Gly Leu Ala Thr lie Met Ser Asp 425 430
Gly Pro Gly Gly Glu Lys 435
Gin Val 450
Asn Ma 465
Trp Asp
His Asp Gly Trp
lie
Trp Met Tyr Val Gly Gin Asn ]Lys Ala Gly
Thr Gly Asn Lys Pro Gly Thr Val Thr lie 455 460
Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser 4"70 475 480
lie Trp Val
!Lys Arg 485
9
的资料: 1455个威基对
(2) SEQ ID NO :
(i) 序列特征:
(A) 长度:
(B) 类型:
(C) 链型:
(D) 拓朴结构:线性
(ii) 分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO : 9 :
CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC 60
GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGC濕CT TAAAGAGTAA AGGGATAACA 120
GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180
rATGATTTAT ATGATCTTGG AGAGTTTAAC CAGMGGGGA CGGTTCGTAC AAAATATGGA 24 0
ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300
GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG
ACAAAGTTTG ATTTTCCTGG AAGAGGAA^T AACCM"TCCA GCTTTAAGTG GCGCTGGTAT
CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT
CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG
GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT
ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA
ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT
AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA
TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA
CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG
GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA
CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG
GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG
CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC
CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG
TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC
ACCGTCACAA TTAATGCAGA CGGATGGGGT丽TTCTCTG TTAATGGAGG GTCCGTTTCG
GTTTGGGTGA AGCAA
(2) SEQ ID NO:
(i)序列特征:
(A) 长度:
(B) 类型
(C) 链型
IO的资料:
1455个>^对 核酸 单链
(D)拓朴结构:线性 (ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO: 10:
CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC
420 480
540
600
660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 l"O 1455
60 120 180TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 24 0
ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300
GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360
GAGGTGAATC CAAATAACCG GAATCAAGM ATATCTGGGG ACTACACAAT TGAGGCTTGG 420
ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTT丁AAATG GCGTTGGTAT 彻
CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 54 0
CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600
TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660
GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720
ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780
ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840
AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900
TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960
CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020
GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA 1080
CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 114 0
GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200
CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260
CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320
TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380
ACAGTTACGA TCAATGCAGA TGGATGGG(Et AATTTTTCAG TAAATGGAGG ATCTGTTTCC 14 4 0
ATTTGGGTGA AACGA 1455
(2)SEQIDN0: 11的资料:
(i) 序列特征:
(A) 长度:1548个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO : 11:
69GCCGCACCGT TTAACGGCAC CATGATGCAG TATTTTGAAT GGTACTTGCC GGATGATGGC
ACGT潔GGA CC磁GTGGC C脂GAAGCC AACAACTTAT CCAGCCTTGG CATCACCGCT
CTTTGGCTGC CGCCCGCTTA CAAAGGAACA AGCCGCAGCG ACGTAGGGTA CGGAGTATAC
GACTTGTATG ACCTCGGCGA ATTCAATCAA AAAGGGACCG TCCGCACAAA ATACGGAACA
AAAGCTCAAT ATCTTCAAGC CATTCAAGCC GCCCACGCCG CTGGAATGCA AGTGTACGCC
GATGTCGTGT TCGACCATAA AGGCGGCGCT GACGGCACGG AATGGGTGGA CGCCGTCGAA
GTCAATCCGT CCGACCGCAA CCAAGAAATC TCGGGCACCT ATCAAATCCA AGCATGGACG
AAATTTGATT TTCCCGGGCG GGGCAACACC TACTCCAGCT TTAAGTGGCG CTGG丁ACCAT TTTGACGGCG TTGATTGGGA CGAAAGCCGA AAATTGAGCC GCATTTACAA ATTCCGCC-GC
ATCGGCMAG CGTGGGATTG GGMGT歸C ACGGAAAACG GAAACTATGA CTACTTMTG
TATGCCGACC TTGATATGGA TCATCCCGAA GTCGTGACCG AGCTGAAAAA CTGGGGGAAA
TGGTATGTCA ACACAACGAA CATTGATGGG TTCCGGCTTG ATGCCGTCAA GCATATTAAG
TTCAGTTTTT TTCCTGATTG GTTGTCGTAT GTGCGTTCTC AGACTGGCAA GCCGCTATTT
ACCGTCGGGG AA雷TGGAG CTATGACATC MCAAGTTGC ACAATTACAT TACGAAAACA
GACGGAACGA TGTCTTTGTT TGATGCCCCG TTACACAACA AATTTTATAC CGCTTCCAAA
TCAGGGGGCG CATTTGATAT GCGCACGTTA ATGACCAATA CTCTCATGAA AGATCAACCG
ACATTGGCCG TCACCTTCGT TGATAATCAT GACACCGAAC CCGGCCAAGC GCTGCAGTCA
TGGGTCGACC CATGGTTCAA ACCGTTGGCT TACGCCTTTA TTCTAACTCG GCAGGAAGGA
TACCCGTGCG TCTTTTATGG TGACTATTAT GGCATTCCAC AATATAACAT TCCTTCGCTG
AAAAGCAAAA TCGATCCGCT CCTCATCGCG CGCAGGGATT.ATGCTTACGG AACGCAACAT
GATTATCTTG ATCACTCCGA CATCATCGGG TGGACAAGGG AAGGGGGCAC TGAAAAACCA
GGATCCGGAC TGGCCGCACT GATCACCGAT GGGCCGGGAG GAAGCAAATG GATGTACGTT
GGCAAACAAC ACGCTGGAAA AGTGTTCT;T GACCTTACCG GCAACCGGAG TGACACCGTC
ACCATCMCA GTGATGGATG GGGGGAATTC AAAGTCAATG GCGGTTCGGT TTCGGTTTGG
GTTCCTAGAA AAACGACCGT TTCTACCATC GCTCGGCCGA TCACAACCCG ACCGTGGACT
GGTGAATTCG TCCGTTGGAC CGAACCACGG TTGGTGGCAT GGCCTTGA
60
120
180
240
300
360
420
480 540
60D
660
■720
780
840
900
960
1020
1080
l"O
1200
1260
1320
1380
1440
1500
1548
(2) SEQIDNO: (i)序列特征:
(A) 长度:
(B) 类型:
12的资料:
1920个威基对 核酸(C) 链型:单链
(D) 拓朴结构:线性
(ii)分子类型:DNA(基因组) (ix)特性:
(A) 名称/关键词:CDS
(B) 位置:421 ...1872
(xi)序列描述:SEQ ID NO : 12 :
CGGAAGATTG GAAGTACAAA AATMGCAAA AGATTGTCAA TCATGTCATG AGCCATGCGG 60
GAGACGGAAA AATCGTCTTA ATGCACGATA TTTATGCAAC GTTCGCAGAT GCTGCTGAAG 120
AGATTATTAA AAAGCTGAAA GCAAAAGGCT ATCAATTGGT AACTGTATCT CAGCTTGAAG 180
AAGTGAAGAA GCAGAGAGGC TATTGAATM ATGAGTAGAA GCGCCATATC GGCGCTTTTC 24 0
TTTTGGAAGA AAA窗AGGG AAAATGGTAC TTGTTAAAAA TTCGGAATAT TTATACAACA 300
TCATATGTTT CACATTGAAA GGGGAGGAGA ATCATGAAAC AACAAAAACG GCTTTACGCC 360
CGATTGCTGA CGCTGTTATT TGCGCTCATC TTCTTGCTGC CTCATTCTGC AGCAGCGGCG 4 20
GCA AAT CTT AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC ATG CCC 4 68
AAT GAC GGC CAA CAT TGG AGG CGT TTG CAA AAC GAC TCG GCA TAT TTG 516
GCT GAA CAC GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT AAG GGA 564
ACG AGC CAA GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT GAT TTA 612
GGG GAG TTT CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC ACA AAA 660
GGA GAG CTG CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC ATT AAC 孺
GTT TAC GGG GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT GCG ACC 756
GAA GAT GTA ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC CGC GTA B04
ATT TCA GGA GAA CAC CTA ATT AAA GCC TGG ACA CAT TTT CAT TTT CCG 852
GGG CGC GGC AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC CAT TTT 900
GAC GGA ACC GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC TAT AAG 94 8
TTT CAA GGA AAG GCT TGG GAT TG(i GAA GTT TCC AAT GAA AAC GGC AAC 996
-TAT GAT TAT TTG ATG TAT GCC GAC ATC GAT TAT GAC CAT CCT GAT GTC 10"
GCA GCA GAA ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA CTG CAA 1092
TTG GAC GGT TTC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT TCT TTT 1140
TTG CGG GAT TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG GAA ATG 1188TTT ACG GTA GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG GAA AAC TAT TTG AAC AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG CCG CTT
CAT TAT CAG TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT GAT ATG
AGG AAA TTG CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG AAA TCG
gtt aca ttt gtc gat mc TCG ACT GTC CAA ACA TGG ACA AGG GAA TCT GGA TAC ACG AAA GGA GAC TCC. CAG GAA CCG ATC TTA AAA GCG
CM GAT ACA CAG CCG GGG CAA TCG CTT GAG TTT AAG CCG CTT GCT TAC GCT TTT ATT CTC CCT CAG GTT TTC TAC GGG GAT ATG TAC GGG CGC GAA ATT CCT GCC TTG ■ CAC纖ATT AGA AAA CAG TAT GCG TAC GGA GCA CAG CAT
GAT TAT TTC GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA GGC GAC AGC TCG GTT GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC GGA CCC
GGT GGG GCA AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT GAG ACA
TGG CAT GAC ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC AAT TCG
GAA GGC TGG GGA GAG TTT CAC GTA AAC GGC GGG TCG GTT TCA ATT TAT
GTT CAA AGA TAG AAGAGCAGAG AGGACGGATT TCCTGAAGGA AATCCGTTTT
TTTATTTT
(2) SEQ ID NO :
(i)序列特征
(A) 长度
(B)
(C)
(D)
12的资料:
类型 链型
2084个碱基对 核酸 单链 拓朴结构:线性 (ii)分子类型:DNA(基因组) (ix)特性:
(A) 名称/关键词:CDS
(B) 位置:343... 1794
(xi)序列描述:SEQ ID NO : 12 :
GCCCCGCACA TACGAAAAGA CTGGCTGAAA ACATTGAGCC TTTGATGACT GATGATTTGG CTGAAGAAGT GGATCGATTG TTTGAGAAAA GAAGAAGACC ATAAAAATAC CTTGTCTGTC ATCAGACAGG GTATTTTTTA TGCTGTCcSg ACTGTCCGCT GTGTAAAAAT AAGGAATAAA
1236 1284
1332
1380
"28
1476
1524
1572
1620
1"8 1716
17"
1812
18SO
1912
1920
60 120 180.GGGGGGTTGT TATTATTTTA CTGATATGTA AAATATAATT TGTATAAGAA AATGAGAGGG 24 0
AGAGGAAACA TGATTCAAAA ACGAAAGCGG ACAGTTTCGT TCAGACTTGT GCTTATGTGC 300
ACGCTGTTAT TTGTCAGTTT GCCGATTACA AAAACMCAG CC GTA AAT GGC ACG 354
CTG MG CAG TAT TTT GAA TGG TAT ACG CCG AAC GAC GGC CAG CAT TGG 402
AAA CGA TTG CAG AAT GAT GCG GAA CAT TTA TCG GAT ATC GGA ATC ACT 450
GCC GTC TGG ATT CCT CCC GCA TAC AAA GGA TTG AGC CAA TCC GAT AAC 4 98
GGA TAC GGA CCT TAT GAT TTG TAT GAT TTA GGA GAA TTC CAG CAA AAA 54 6
GGG ACG GTC AGA ACG AAA TAC GGC ACA AAA TCA GAG CTT CAA GAT GCG 594
ATC GGC TCA CTG CAT TCC CGG AAC GTC CAA GTA TAC GGA GAT GTG GTT 64 2
TTG AAT CAT AAG GCT GGT GCT GAT GCA ACA GAA GAT GTA ACT GCC GTC 690
GAA GTC AAT CCG GCC AAT AGA AAT CAG GAA ACT TCG GAG GAA TAT CAA 738
ATC AAA GCG TGG ACG GAT TTT CGT TTT CCG GGC CGT GGA AAC ACG TAC 786
AGT GAT TTT AAA TGG CAT TGG TAT CAT TTC GAC GGA GCG GAC TGG GAT 834
GAA TCC CGG AAG ATC AGC CGC ATC TTT AAG TTT CGT GGG GAA GGA AAA 882
GCG TGG GAT TGG GAA GTA TCA AGT GAA AAC GGC AAC TAT GAC TAT TTA 330
ATG TAT GCT GAT GTT GAC TAC GAC CAC CCT GAT GTC GTG GCA GAG ACA 978
AAA AAA TGG GGT ATC TGG TAT GCG AAT GAA CTG TCA TTA GAC GGC TTC 1026
CGT ATT GAT GCC GCC AAA CAT ATT AAA TTT TCA TTT CTG CGT GAT TGG 1074
GTT CAG GCG GTC AGA CAG GCG ACG GGA AAA GAA ATG TTT ACG GTT GCG 1122
GAG TAT TGG CAG AAT AAT GCC GGG AAA CTC GAA AAC TAC TTG AAT AAA 1170
ACA AGC TTT AAT CAA TCC GTG TTT GAT GTT CCG CTT CAT TTC AAT TTA 1218
CAG GCG GCT TCC TCA CAA GGA GGC GGA TAT GA丁 ATG AGG CGT TTG CTG 1266
GAC GGT ACC GTT GTG TCC AGG CAT CCG GAA AAG GCG GTT ACA TTT GTT 1314
GAA AAT CAT GAC ACA CAG CCG GGA CAG TCA TTG GM TCG ACA GTC CAA 1362
ACT TGG TTT AAA CCG CTT GCA TAC GCC TTT ATT TTG ACA AGA GAA TCC 1410
GGT TAT CCT CAG GTG TTC TAT GGG GAT ATG TAC GGG ACA AAA GGG ACA 14 58
TCG CCA AAG GAA ATT CCC TCA CTG AAA GAT AAT ATA GAG CCG ATT TTA 1506
AAA' GCG CGT AAG GAG TAC GCA TAC GGG CCC CAG CAC GAT潔ATT GAC^ 1554CAC CCG GAT GTG ATC GGA TGG ACG AGG GAA GGT GAC AGC TCC GCC GCC 1602
aaa tca ggt ttg gcc gct tta atc acg gac gga ccc ggc gga tca aag 1650
cgg atg tat gcc ggc ctg aaa aat gcc ggc gag aca tgg tat gac ata 1698
acg ggc aac cgt tca gat act gta aaa atc gga tct gac ggc tgg gga 17"
gag ttt cat gta aac gat ggg tcc gtc tcc att tat gtt cag aaa taa 17 9 4
ggtaataaaa aaacacctcc aagctgagtg cgggtatcag cttggaggtg cgtttatttt 18 54
ttcagccgta tgacaaggtc ggcatcaggt gtgacmata cggtatgctg gctgtcatag 19"
gtgacaaatc cgggttttgc gccgtttggc tttttcacat gtctgatttt tgtataatca 1974
acaggcacgg agccggaatc tttcgccttg gaaaaataag cggcgatcgt agctgcttcc 2034
aatatggatt gttcatcggg atcgctgctt ttaatcacaa cgtgggatcc 2084
(2)SEQIDNO: 13的资料:
(i) 序列特征:
(A) 长度:1455个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO : 13 :
catcataatg GAACAAATGG tactatgatg caatatttcg aatggtattt gccaaatgac 60
gggaatcatt ggaacaggtt gagggatgac gcagctaact taaagagtaa agggataaca 120
gctgtatgga tcccacctgc atggaagggg acttcccaga atgatgtagg ttatggagcc 180
tatgatttat atgatcttgg XgAGTTTAAC cagaagggga cggttcgtac aaaatatgga 240
acacgcaacc agctacaggc tgcggtgacc TCTTTAAAAA ataacggcat tcaggtatat 300
ggtgatgtcg tcatgaatca taaaggtgga gcagatggta cggaaattgt aaatgcggta 360
gaagtgaatc ggagcaaccg aaaccaggaa acctcaggag agtatgcaat agaagcgtgg 420
acaaagtitg attttcctgg aagaggaaat aaccattcca'gctttaagtg gcgctggtat 480
cattttgatg ggacagattg ggatcagtca cgccagcttc aaaacaaaat atataaattc 54 0
aggggaacag gcaaggcctg ggactgggaa gtcgatacag agaatggcaa ctatgactat 600
CTTATGTATG CAGACGTGGA TATGGATCAC CCAGMGTM T織TGMCT TAGAMCTGG 660
ggagtgtggt atacgaatac actgaacctt gatggmtta gaatagatgc agtgaaacat 720
ataaaatata gctttacgag agattggctt acacatgtgc gtaacaccac aggtaaacca 780
74MGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 84 0
AAAACAAGTT GGAATCACTC GGTGTTTgAt GTTCCTCTCC AC窗AATTT GTACAATGCA 900 TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA MGGTTCTGT GGTGCAAAAA 960
CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020
GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080
CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTG丁TCCG 114 0
GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200
CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CMGAGAGGG AAATAGCTCC 1260
CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320
TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380
ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 14 40
GTTTGGGTGA AGCAA 14 55
(2)SEQIDNO: 14的资料:
(i) 序列特征:
(A) 长度:1455个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:DNA(基因组)
(xi)序列描迷:SEQ ID NO : 14 :
CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60
GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120
GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180
TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TMGTATGGG 24 0
ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTT潔 300
GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360
GAGGTGAATC CAAATAACCG GAATCMGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420
ACTAAGTTTG ATTTTCCAGG GAGGGGTMT ACATACTCAG ACTTTAAATG GCGTTGG雷 4 80
CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAMTTC 54 0
CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600
75TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGA丁GG 660
GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT "720
ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780
ATGTTTGCTG TTGCTGAATT TTGGAAAA^T GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840
AAARCAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900
TCAAATAGTG GAGGCMCTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960
CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020
GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCT丁MTTT AACAAGAGAA 1080
CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 1140
GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200
CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260
CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320
TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380
ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG A丁CTGTTTC;C l"O
ATTTGGGTGA AACGA "55
(2)SEQIDN0: 15的资料:
(i) 序列特征:
(A) 长度:60个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-正向引物FSA (ix)特性:
(A) 名称/关键词:misc-feature
(B) 位置:22-27、 29、 31-33、 41
(C) 其他资料:/Note=l:35°/。A,65%C
2:83%G,17%A3:63%G,37%T 4:86%G,14%A 5:85%G,15%C 6:50%T,50%C 7:95%A,5%G 8:58%G,37%A,5%T 9:86%C,13%A,1%G 10:83%T,17o/oG 11:92%G,8%C (xi)序列描述:SEQIDNO: 15:
caaaatcgta tctacaaatt cl23456s"7g 8910tgggatt llggaagtaga ttcggaaaat 60
(2) SEQIDNO: 16的资料:
(i) 序列特征:
(A) 长度:21个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-反向引物RSA (xi)序列描述:SEQ ID NO : 16 :
gaatttgtag atacgatttt g 21
(2) SEQ ID NO: 17的资料: (i)序列特征:
(A) 长度:24个威基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性(ii)分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物Bl (xi)序列描迷:SEQIDNO: 17:
CGATTGCTGA CGCTGT潔T TGCG 2'
(2) SEQ ID NO : 18的资料:
(i) 序列特征:
(A) 长度:24个#对
(B) 类型:核酸
(C) 链型:.单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物Y2 (xi)序列描述:SEQ ID NO : 18:
CTTGTTCCCT TGTCAGAACC AATG 24
(2) SEQ ID NO : 19的资料:
(i) 序列特征:
(A) 长度:30个g对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性'.
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物101458 (xi)序列描述:SEQ ID NO : 19 :GTCATAGTTG CCGAAATCTG TATCGACTTC
(2)SEQIDN0: 20的资料:
(i) 序列特征:
(A) 长度:35个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物101638 (xi)序列描述:SEQ ID NO : 20 :
CCCAGTCCCA CGTACGTCCC CTGAATTTATATA TT1TG
(2) SEQ ID NO : 21的资t十:
(i) 序列特征:
(A) 长度:21个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc=01igol
(A) 名称/关键词:misc-feature
(B) 位置:12
(D)其他资料:/Note=N=25%A 、 25%C 、 25%G 、 25%T (xi)序列描述:SEQ ID NO : 21 :
CCCAGTCCCA GNTCTTTCCC CTGAATTTAT ATATTTTG 38(2) SEQ ID NO : 22的资料:
(1) 序列特征:
(A) 长度:25个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii)分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物X2 (xi)序列描述:SEQ ID NO: 22:
GCGTGGACAA AGTTTGATTT TCCTG 25
(2) SEQ ID NO: 23的资料:
(i) 序列特征:
(A) 长度:21个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA01 (xi)序列描述:SEQ ID NO : 23 :
(2) SEQ ID NO : 24的资料: (i)序列特征:
(A) 长度:24个碱基对
(B) 类型:核酸
(C) 链型'.单链
(D) 拓朴结构:线性
80(ii)分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc國feature
(B) 其他资料:/desc-引物DA03 (xi)序列描述:SEQ ID NO : 24 :
GCATTGGATG CTTTTGAACA ACCG 24
(2) SEQ ID NO : 25的资料:
(i) 序列特征:
(A) 长度:26个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA07 (xi)序列描述:SEQ ID NO: 25:
CGCAAAATGA TATCGGGTAT GGAGCC
(2) SEQ ID NO : 26的资料:
(i) 序列特征:
(A) 长度:29个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称、/关键词:misc-feature
(B) 其他资料:/desc-引物DA20 (ix)特性:
81(A) 名称/关键词:misc-feature
(B) 位置:13、 14
(D)其他资料:/Note:S-C和G的混合物
W-A和T的混合物 (xi)序列描述:SEQ ID NO: 26 :
GTGATGAACC ACSWAGGTGG AGCTGATGC 2 9
(2) SEQ ID NO: 27的资料:
(i) 序列特征:
(A) 长度:30个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA14 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 位置:13 、 14
(D)其他资料:/Note:R= A和G的混合物
Y-C和T的混合物 (xi)序列描述:SEQ ID NO : 27 :
GATGGTGTAT. GGRYCAATCA CGACAATTCC 30
(2) SEQ ID NO: 28的资料:
(i)序列特征:
(A) 长度:28个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性(ii)分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA15 (xi)序列描述:SEQ ID NO : 28 :
GGTGTATGGG ATAACTCACG ACAATTCC
(2) SEQ ID NO : 29的资料:
(i) 序列特征:
(A) 长度:28个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名^V关键词:misc-feature
(B) 其他资料:/desc-引物DAI 6 (xi)序列描述:SEQ ID NO: 29:
GGTGTATGGG ATCTCTCACG ACAATTCC
(2) SEQ ID NO : 30的资料:
(i) 序列特征:
(A) 长度:32个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA17 (xi)序列描述:SEQ ID NO: 30:CAAAATCGTA TC
(2)SEQIDNO: 31的资料:
(i) 序列特征:
(A) 长度:32个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA18 (xi)序列描述:SEQ ID NO : 31 :
GGGATCAATC ACGACTCTTC CAAAATCGTA TC
(2) SEQ ID NO : 32的资料:
(i) 序列特征:
(A) 长度:34个威基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA06 (xi)序列描述:SEQ ID NO : 32 :
GGAAATTATG ATTATATCAT GTATGCAGAT GTAG
(2) SEQ ID NO : 33的资料:
(i)序列特征:
(A)长度:30个碱基对(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性 (ii)分子类型:其他核酸
(ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA09 (xi)序列描述:SEQ ID NO : 33 :
GCTGAATTTT GGTCGAATGA TTTAGGTGCC
(2) SEQ ID NO: 34的资料:
(i) 序列特征:
(A) 长度:30个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称、/关键词:misc-feature
(B) 其他资料:/desc-引物DA11 (xi)序列描述:SEQ ID NO : 34 :
GCTGAATTTT GGTCGAATGA TTTAGGTGCC
(2) SEQ ID NO : 35的资料:
(i) 序列特征:
(A) 长度:27个碱基对
(B) 类型'.核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:(A) 名称/关键词:misc陽feature
(B) 其他资料:/desc-引物DA21 (xi)序列描述:SEQ ID NO : 35 :
GAATTTTGGA AGTACGATTT AGGTCGG '
(2) SEQ ID NO : 36的资料:
(0序列特征:
(A) 长度:29个威基对
(B) 类型:核酸
(C) 链型:.单链
(D) 拓朴结构:线性 (ii)分子类型:其他核酸
(ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA12 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 位置:12 、 13
(D)其他资料:/Note:R-A和G的混合物
Y-C和T的混合物 (xi)序列描述:SEQ ID NO : 36 :
GGAAAAACGA TRYCGGTGCC TTGGAGAAC 29
(2) SEQ ID NO: 37的资料:
(i) 序列特征:
(A) 长度:27个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
86(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA13 (ix)特性:
(A) 名称/关键词:misc-fea加re
(B) 位置:14, 15
(D)其他资料:/Note: R-A和G的混合物
yk:和t的混合物
(xi)序列描述:SEQ ID NO : 37 :
GATTTAGGTG CCTRYCAGAA CTATTTA
(2) SEQ ID NO: 38的资料:
(i) 序列特征:
(A)长度:26个威基对 (B>类型:核酸
(c) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA08 (xi)序列描述:SEQ ID NO: 38 :
CCCCCTTCAT GAGAATCTTT ATAACG
(2) SEQ ID NO: 39的资料:
(i) 序列特征:
(A) 长度:25个碱基对
(B) 类型:核酸
(c) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA04 (xi)序列描述:SEQ ID NO : 39 :
GAATCCGAAC CTCATTACAC MTCG
(2) SEQ ID NO: 40的资料:
(i) 序列特征:
(A) 长度:38个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA05 (xi)序列描述:SEQ ID NO : 40 :
CGGATGGACT CGAGAAGGAA ATACCACG
(2) SEQ ID NO: 41的资料:
(i) 序列特征:
(A) 长度:31个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA10 (xi)序列描述:SEQ ID NO: 41:
CGTAGGGCAA AATCAGGCCG GTCAAGTTTG G(2) SEQ ID NO : 42的资料:
(i) 序列特征:
(A) 长度:31个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA22 (xi)序列描述:SEQ ID NO: 42:
CATAACTGGA AATCGCCCGG GAACAGTTAC G
(2) SEQ ID NO : 43的资料:
(i) 序列特征:
(A) 长度:29个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA19 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 位置:12
(D)其他资料:/Note:W-A和T的混合物 (xi)序列描述:SEQ ID NO : 43 :
CTGGAAATAA AWCCGGAACA GTTACG
(2) SEQ ID NO: 44的资料:(i) 序列特征:
(A) 长度:32个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名^*、/关键词:misc-feature
(B) 其他资料:/desc-引物DA23 (xi)序列描述:SEQ ID NO : 44 :
GGAAATAAAC CAGGACCCGT TACGATCAAT GC
(2) SEQ ID NO : 45的资料:
(i) 序列特征:
(A) 长度:28个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA32 (xi)序列描迷:SEQ ID NO : 45 :
GAGGCTTGGA CTAGGTTTGA TTTTCCAG
(2) SEQ ID NO: 46的资料: (i)序列特征:
(A) 长度:30个威基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性(ii)分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物DA31 (xi)序列描述:SEQ ID NO : 46 :
GCTGAATTTT GGCGCAATGA TTTAGGTGCC
(2) SEQ ID NO: 47的资料:
(i) 序列特征:
(A) 长度:34个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物bm4 (xi)序列描述:SEQ ID NO: 47:
GTGTTTGACG TCCCGCTTCA TGAGAATTTA CAGG
(2) SEQ ID NO: 48的资料:
(i) 序列特征:
(A) 长度:34个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物bm5 (xi)序列描述:SEQ ID NO : 48 :GTGTTTGACG TCCCGCTTCA TAAGAATTTA CAGG
(2)SEQIDNO: 49的资料:
(i) 序列特征:
(A) 长度:34个碱基对
(B) 类型'.核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物bm6 (xi)序列描述:SEQ ID NO : 49 :
GTGTTTGACG TCCCGCTTCA TGCCAATTTA CAGG
(2) SEQ ED NO : 50的资料:
(i) 序列特征:
(A) 长度:32个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物bm8 (xi)序列描述:SEQ ID NO : 50 :
AGGGAATCCG GATACCCTGA GGTTTTCTAC GG
(2) SEQ ID NO : 51的资料:
(i)序列特征:
(A)长度:34个碱基对
92(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii)分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物bm11 (xi)序列描述:SEQ ID NO : 51 :
GATGTGGTTT TGGATCATAA GGCCGGCGST GATG
(2) SEQ ID NO : 52的资料:
(i) 序列特征:
(A) 长度:22个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物pl (xi)序列描述:SEQ ID NO : 52 :
CTGTTATTAA TGCCGCCAAA CC
(2) SEQ ID NO : 53的资料:
(i) 序列特征:
(A) 长度:24个威基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物p2 (xi)序列描述:SEQ ID NO : 53 :
GGAAAAGAAA TGTTTACGGT TGCG 2 4
(2) SEQ ID NO: 54的资料:
(i) 序列特征:
(A) 长度:25个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物p3 (xi)序列描述:SEQ ID NO: 54:
GAAATGAAGC GGAACATCAA ACACG 25
(2) SEQ ID NO: 55的资料:
(i) 序列特征:
(A) 长度:30个碱基对
(B) 类型:核酸
(C) 链型:单链
(D) 拓朴结构:线性
(ii) 分子类型:其他核酸 (ix)特性:
(A) 名称/关键词:misc-feature
(B) 其他资料:/desc-引物p4 (xi)序列描述:SEQ ID NO : 55 :
GTATGATTTA GGAGAATTCC 20