会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 葡萄栽培 / 葡萄扇叶病毒 / 淀粉酶和葡糖淀粉酶、编码其的核酸以及关于制备和使用其的方法

淀粉酶和葡糖淀粉酶、编码其的核酸以及关于制备和使用其的方法

阅读:442发布:2020-06-23

IPRDB可以提供淀粉酶和葡糖淀粉酶、编码其的核酸以及关于制备和使用其的方法专利检索,专利查询,专利分析的服务。并且在一个方面,本发明涉及具有淀粉酶和/或葡糖淀粉酶活性的多肽,编码多肽的多核苷酸,以及关于制备和使用这些多核苷酸和多肽的方法。在一个方面,本发明的多肽可以用作淀粉酶,例如α淀粉酶,以催化多糖、寡糖或淀粉水解成糖。在一个方面,本发明提供了包含由乳胶聚合物包衣包被的所需成分的延迟释放组合物。在可替代实施方案中,酶用于制备生物燃料,例如乙醇、丁醇、丙醇、或汽油-乙醇混合物,包括生物乙醇、生物丙醇、生物丁醇、或生物柴油,或用于任何形式的燃料或生物量加工。,下面是淀粉酶和葡糖淀粉酶、编码其的核酸以及关于制备和使用其的方法专利的具体信息内容。

1.一种分离的、合成或重组核酸,其包含

(a)在至少约25、30、40、50、75、100、150、200、250、300、 350、400、450、500、550、600、650、700、750、800、850、900、 950、1000、1050、1100、1150、1200、1250、1300、1350、1400、 1450、1500、1550个或更多残基的区域或基因或转录物的全长上,与 SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO: 19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO: 27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO: 35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO: 43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO: 51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO: 59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO: 67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO: 75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO: 81和/或SEQ ID NO:82具有至少50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、 75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%或99%或具有100%序列同一性的核酸序列, 其中所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的至少一种多肽;

(b)在严格条件下与包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO: 15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO: 23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO: 31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO: 39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO: 47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO: 55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO: 63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO: 71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO: 79、SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO:82的核酸杂 交的核酸序列,其中所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的 多肽;

(c)编码具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、 SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、 SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、 SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、 SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、 SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、 SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76和/或SEQ ID NO: 78的序列的多肽的核酸序列;

(d)编码具有淀粉酶和/或葡糖淀粉酶活性但缺乏信号序列或碳 水化合物结合组件的多肽的(a)、(b)或(c)的核酸;

(e)编码具有淀粉酶和/或葡糖淀粉酶活性的多肽且进一步包含 异源序列的(a)、(b)、(c)或(d)的核酸,(f)(e)的核酸序列,其中所述异源序列包含编码异源信号序 列、碳水化合物结合组件、催化结构域(CD)或其组合的序列,或者 所述异源信号序列、碳水化合物结合组件或催化结构域(CD)衍生自 另一种淀粉酶或非淀粉酶,或;

(g)编码下述多肽的(a)的核酸序列:所述多肽具有淀粉酶和/ 或葡糖淀粉酶活性,或能够产生与多肽SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、 SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、 SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、 SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、 SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、 SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、 SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76和/或SEQ ID NO: 78特异性结合的抗体;或(h)与(a)、(b)、(c)、(d)、(e)、(f)或(g)完 全互补的核酸序列。

2.权利要求1的分离的、合成或重组核酸,其中所述序列同一性 通过用序列比较算法分析或通过目视检查进行测定。

3.权利要求1的分离的、合成或重组核酸,其中所述序列同一性 在基因或转录物的全长上。

4.权利要求1的分离的、合成或重组核酸,其中所述核酸序列包 含如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:9、 SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、 SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、 SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、 SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、 SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、 SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID  NO:57、 SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、 SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、 SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:80、 SEQ ID NO:81和/或SEQ ID NO:82中所示的序列。

5.权利要求1的分离的、合成或重组核酸,其中所述核酸序列编 码具有如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO: 10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO: 18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO: 26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO: 34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SRQ ID NO: 42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO: 50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO: 58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO: 66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO: 74、SEQ ID NO:76和/或SEQ ID NO:78中所示的序列的多肽。

6.权利要求1的分离的、合成或重组核酸,其中所述序列比较算 法是BLAST版本2.2.2算法,其中过滤设置设为blastall-pblastp -d″nr pataa″-F F,并且所有其他选项设为缺省值。

7.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶和/ 或葡糖淀粉酶活性包含水解糖苷键。

8.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶活性 包含葡糖淀粉酶活性或1,4-α-D-葡聚糖葡糖水解酶活性。

9.权利要求8的分离的、合成或重组核酸,其中所述葡糖淀粉酶 活性包含α-葡糖苷酶活性。

10.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶活 性包含α-淀粉酶活性。

11.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶活 性包含外淀粉酶活性。

12.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶活 性包含β-淀粉酶活性。

13.权利要求7的分离的、合成或重组核酸,其中所述糖苷键包 含α-1,4-糖苷键。

14.权利要求7的分离的、合成或重组核酸,其中所述糖苷键包 含α-1,6-糖苷键。

15.权利要求7的分离的、合成或重组核酸,其中所述淀粉酶活 性包含水解多糖、寡糖或淀粉中的糖苷键。

16.权利要求15的分离的、合成或重组核酸,其中所述淀粉酶和 /或葡糖淀粉酶活性进一步包含水解多糖、寡糖或淀粉中的糖苷键,以 生产麦芽糖糊精。

17.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶和/ 或葡糖淀粉酶活性包含从多糖、寡糖或淀粉的非还原末端切割麦芽糖 或D-葡萄糖单位。

18.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶和/ 或葡糖淀粉酶活性是热稳定的。

19.权利要求18的分离的、合成或重组核酸,其中所述多肽在包 含下述温度范围的条件下保留淀粉酶和/或葡糖淀粉酶活性:约37℃- 约95℃、或约55℃-约85℃、或约70℃-约95℃、或约90℃-约95℃。

20.权利要求1的分离的、合成或重组核酸,其中所述淀粉酶和/ 或葡糖淀粉酶活性是耐热的。

21.权利要求20的分离的、合成或重组核酸,其中所述多肽在暴 露于下述范围的温度后保留淀粉酶和/或葡糖淀粉酶活性:超过37℃- 约95℃、超过55℃-约85℃、或超过90℃-约95℃。

22.权利要求1的分离的、合成或重组核酸,其中所述严格条件 包含在包含具有0.15M NaCl的缓冲液的条件下于72℃杂交15分钟。

23.权利要求1的分离的、合成或重组核酸,其中所述核酸长度 为至少约25、30、40、50、75、100、150、200、300、400、500、600、 700、800、900、1000个或更多残基或基因或转录物的全长。

24.权利要求22的分离的、合成或重组核酸,其中所述严格条件 包括包含在0.2X SSC中于约65℃洗涤约15分钟的洗涤步骤。

25.一种用于鉴定编码具有淀粉酶和/或葡糖淀粉酶活性的多肽 的核酸的核酸探针,其中所述探针包含含有SEQ ID NO:1、SEQ ID NO: 3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、 SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、 SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、 SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、 SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、 SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、 SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、 SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、 SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO: 82的序列的至少10个连续碱基,其中所述探针通过结合或杂交鉴定 所述核酸。

26.权利要求25的核酸探针,其中所述探针包含含有至少约 10-50、约20-60、约30-70、约40-80、约60-100、或约50-150个 连续碱基的寡核苷酸。

27.一种用于鉴定编码具有淀粉酶和/或葡糖淀粉酶活性的多肽 的核酸的核酸探针,其中所述探针包含含有SEQ ID NO:1、SEQ ID NO: 3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、 SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、 SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、 SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、 SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、 SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、 SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、 SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、 SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO: 82的至少约10个连续残基的核酸,其中所述序列同一性通过用序列 比较算法分析或通过目视检查进行测定。

28.权利要求27的核酸探针,其中所述探针包含含有至少约 10-50、约20-60、约30-70、约40-80、约60-100、或约50-150个 连续碱基的寡核苷酸。

29.一种用于扩增编码具有淀粉酶和/或葡糖淀粉酶活性的多肽 的核酸的扩增引物序列对,其中所述引物对能够扩增包含权利要求1 的核酸序列的核酸。

30.权利要求29的扩增引物对,其中所述扩增引物序列对的每个 成员包含含有所述序列的至少约10-50个连续碱基的寡核苷酸。

31.一种扩增编码具有淀粉酶和/或葡糖淀粉酶活性的多肽的核 酸的方法,其包括用能够扩增权利要求1的核酸序列的扩增引物序列 对来扩增模板核酸。

32.一种包含核酸的表达盒,所述核酸包含权利要求1的核酸序 列。

33.一种载体,其包含:

(a)包含权利要求1的核酸序列的核酸;

(b)(a)的载体,其中所述核酸与启动子可操作地连接;

(c)(b)的载体,其中所述启动子是植物启动子或病毒启动子;

(d)(c)的载体,其中所述植物启动子是玉米种子胚特异性启 动子;玉米种子胚乳特异性启动子;或稻种子胚乳特异性启动子。

34.一种包含含有权利要求1的核酸序列的核酸的克隆用载体, 其中所述克隆用载体包含病毒载体、质粒、噬菌体、噬菌粒、粘粒、 fosmid、细菌病毒或人工染色体。

35.权利要求34的克隆用载体,其中所述病毒载体包含腺病毒载 体、逆转录病毒载体或腺伴随病毒载体。

36.权利要求34的克隆用载体,其包含细菌人工染色体(BAC)、 质粒、噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)、或哺乳 动物人工染色体(MAC)。

37.一种转化细胞,其包含含有权利要求1的核酸序列的核酸。

38.一种转化细胞,其包含如权利要求32中所示的表达盒。

39.权利要求37或权利要求38的转化细胞,其中所述细胞是细 菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。

40.一种转基因非人动物,其包含权利要求1的核酸序列。

41.权利要求40的转基因非人动物,其中所述动物是小鼠。

42.一种转基因植物或由其衍生的植物细胞、种子、植物产品、 植物组织或植物部分,其包含(a)权利要求1的核酸序列、或权利要求33的载体、或权利要 求34的克隆用载体;

(b)(a)的转基因植物或由其衍生的植物细胞、种子、植物产 品、植物组织或植物部分,其中所述植物、或植物细胞、种子、植物 产品、植物组织或植物部分是或衍生自腰果属、须芒草族、花生属、 天门冬属、颠茄属、燕麦属、甜菜属、芸苔属、爪哇木棉属、柑橘属、 西瓜属、辣椒属、红花属、藜科、椰子属、咖啡属、甜瓜属、南瓜属、 胡萝卜属、油棕属、草莓属、大豆属、棉属、禾本科、向日葵属、 Heterocallis、大麦属、天仙子属、莴苣属、亚麻属、黑麦草属、羽 扇豆属、番茄属、苹果属、木薯属、花薄荷属、苜蓿属、烟草属、木 犀榄属、稻属、黍属、Pannisetum、鳄梨属、菜豆属、Pistachia、豌 豆属、丽春红属、梨属、李属、萝卜属、蓖麻属、黑麦属、千里光属、 芥属、茄属、高粱属、Theobromus、胡芦巴属、小麦属、蚕豆属、葡 萄属、豇豆属或玉蜀黍属。

43.权利要求42的转基因植物、植物细胞、种子、植物产品、植 物组织或植物部分,其中所述植物是:(a)双子叶植物(双子叶)或单子叶植物(单子叶);

(b)玉米、大豆、甘蔗、甜菜、柳枝稷、芒属、小麦、芸苔属、 木薯、棉花和大麦;

(c)高粱属植物、棕榈、向日葵、稻、大麦、花生植物、芝麻、 马铃薯植物、番茄植物、油料种子植物、油菜籽植物、大豆植物、草 或烟草植物;或(d)来自下述科或属的物种:腰果属、须芒草族、花生属、天门 冬属、颠茄属、燕麦属、甜菜属、芸苔属、爪哇木棉属、柑橘属、西 瓜属、辣椒属、红花属、藜科、椰子属、咖啡属、甜瓜属、南瓜属、 胡萝卜属、油棕属、草莓属、大豆属、棉属、向日葵属、Heterocallis、 大麦属、天仙子属、莴苣属、亚麻属、黑麦草属、羽扇豆属、番茄属、 苹果属、木薯属、花薄荷属、苜蓿属、烟草属、木犀榄属、稻属、黍 属、Pannisetum、鳄梨属、菜豆属、Pistachia、豌豆属、丽春红属、 梨属、李属、萝卜属、蓖麻属、黑麦属、千里光属、芥属、茄属、高 粱属、Theobromus、胡芦巴属、小麦属、蚕豆属、葡萄属、豇豆属和/ 或玉蜀黍属。

44.一种转基因种子,其包含权利要求1的核酸序列、或权利要 求33的载体、或权利要求34的克隆用载体。

45.权利要求44的转基因种子,其中所述种子是玉米种子、小麦 仁、油料种子、油菜籽、大豆种子、棕榈仁、向日葵种子、芝麻种子、 稻、大麦、花生或烟草植物种子。

46.一种反义寡核苷酸,其包含与权利要求1的核酸序列互补、 或在严格条件下能够与权利要求1的核酸序列杂交的核酸序列。

47.权利要求46的反义寡核苷酸,其中所述反义寡核苷酸长度为 约10-50、约20-60、约30-70、约40-80、或约60-100个碱基。

48.一种抑制细胞中的淀粉酶和/或葡糖淀粉酶信使的翻译的方 法,其包括给所述细胞施用反义寡核苷酸或在所述细胞中表达反义寡 核苷酸,所述反义寡核苷酸包含与权利要求1的核酸序列互补、或在 严格条件下能够与权利要求1的核酸序列杂交的核酸序列。

49.一种双链抑制RNA(RNAi)分子,其包含权利要求1的核酸 序列的子序列。

50.权利要求49的双链抑制RNA(RNAi)分子,其中所述RNAi 长度为约15、16、17、18、19、20、21、22、23、24、25个或更多双 链体核苷酸。

51.一种抑制细胞中的淀粉酶和/或葡糖淀粉酶的表达的方法,其 包括给所述细胞施用双链抑制RNA(iRNA)或在所述细胞中表达双链 抑制RNA(iRNA),其中所述RNA包含权利要求1的核酸序列的子序 列。

52.一种分离的、合成或重组多肽,其包含

(i)在至少约100个残基的区域上,与SEQ ID NO:2、SEQ ID NO: 4、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、 SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、 SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、 SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、 SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、 SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、 SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76和/或SEQ ID NO: 78的序列具有至少50%、51%、52%、53%、54%、55%、56%、57 %、58%、59%、60%、61%、62%、63%、64%、65%、66%、67 %、68%、69%、70%、71%、72%、73%、74%、75%、76%、77 %、78%、79%、80%、81%、82%、83%、84%、85%、86%、87 %、88%、89%、90%、91%、92%、93%、94%、95%、96%、97 %、98%或99%、或完全序列同一性的氨基酸序列;

(ii)由权利要求1的核酸编码的氨基酸序列;

(iii)具有(i)或(ii)的氨基酸序列,且包含至少一个氨基 酸残基保守置换,其中任选地保守置换包含用另一种脂肪族氨基酸替换脂肪族氨基 酸;用苏氨酸替换丝氨酸或反之亦然;用另一个酸性残基替换酸性残 基;用具有酰胺基的另一个残基替换具有酰胺基的残基;用另一个碱 性残基交换碱性残基;或用另一个芳香族残基替换芳香族残基,或其 组合,和任选地所述脂肪族残基包含丙氨酸、缬氨酸、亮氨酸、异亮氨 酸或其合成等价物;所述酸性残基包含天冬氨酸、谷氨酸或其合成等 价物;包含酰胺基的所述残基包含天冬氨酸、谷氨酸或其合成等价物; 所述碱性残基包含赖氨酸、精氨酸或其合成等价物;或,所述芳香族 残基包含苯丙氨酸、酪氨酸或其合成等价物;

(iv)具有淀粉酶和/或葡糖淀粉酶活性但缺乏信号序列或碳水化 合物结合组件的(i)、(ii)或(iii)的多肽;

(v)具有淀粉酶和/或葡糖淀粉酶活性且进一步包含异源序列的 (i)、(ii)、(iii)或(iv)的多肽;

(vi)(v)的多肽,其中所述异源序列包含异源信号序列、碳水 化合物结合组件、催化结构域(CD)或其组合,或者所述异源序列包 含异源表位、纯化标签或标记;

(vii)(vi)的多肽,其中所述异源信号序列、异源碳水化合物 结合组件或异源催化结构域(CD)衍生自另一种淀粉酶和/或葡糖淀粉 酶,或衍生自非淀粉酶和/或非葡糖淀粉酶;

(viii)(i)、(ii)、(iii)、(iv)、(v)、(v i)或(vii) 的多肽,其中所述多肽具有淀粉酶和/或葡糖淀粉酶活性,或可以用于 产生与多肽SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO: 10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO: 18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO: 26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO: 34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO: 42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO: 50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO: 58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO: 66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO: 74、SEQ ID NO:76和/或SEQ ID NO:78特异性结合的抗体;或(ix)以拟肽形式存在的(i)、(ii)、(iii)、(iv)、(v)、 (vi)、(vii)或(viii)的多肽。

53.权利要求52的分离的、合成或重组多肽,其中所述序列同一 性通过用序列比较算法分析或通过目视检查进行测定。

54.权利要求52的分离的、合成或重组多肽,其中所述序列同一 性在至少约10、15、20、25、30、35、40、45、50、75、100、150、 200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050个或更多残基的区域或酶的全长上。

55.权利要求52的分离的、合成或重组多肽,其中所述多肽具有 如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、 SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、 SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、 SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、 SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、 SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、 SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、 SEQ ID NO:76和/或SEQ ID NO:78中所示的序列。

56.权利要求52的分离的、合成或重组多肽,其中所述多肽具有 淀粉酶和/或葡糖淀粉酶活性。

57.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶活 性包含水解糖苷键。

58.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶活 性包含葡糖淀粉酶活性或1,4-α-D-葡聚糖葡糖水解酶活性。

59.权利要求56的分离的、合成或重组多肽,其中所述葡糖淀粉 酶活性包含α-葡糖苷酶活性。

60.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶活 性包含α-淀粉酶活性。

61.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶活 性包含外淀粉酶活性。

62.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶活 性包含β-淀粉酶活性。

63.权利要求57的分离的、合成或重组多肽,其中所述糖苷键包 含α-1,4-糖苷键。

64.权利要求57的分离的、合成或重组多肽,其中所述糖苷键包 含α-1,6-糖苷键。

65.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶和 /或葡糖淀粉酶活性包含水解多糖、寡糖或淀粉中的糖苷键。

66.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶和 /或葡糖淀粉酶活性进一步包含水解多糖、寡糖或淀粉中的糖苷键,以 生产麦芽糖糊精。

67.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶和 /或葡糖淀粉酶活性包含从多糖、寡糖或淀粉的非还原末端切割麦芽糖 或D-葡萄糖单位。

68.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶和 /或葡糖淀粉酶活性是热稳定的。

69.权利要求68的分离的、合成或重组多肽,其中所述多肽在包 含下述温度范围的条件下保留淀粉酶和/或葡糖淀粉酶活性:约37℃- 约95℃、约55℃-约85℃、约70℃-约95℃、或约90℃-约95℃。

70.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶和 /或葡糖淀粉酶活性是耐热的。

71.权利要求70的分离的、合成或重组多肽,其中所述多肽在暴 露于下述范围的温度后保留淀粉酶和/或葡糖淀粉酶活性:超过37℃- 约95℃、超过55℃-约85℃、或超过90℃-约95℃。

72.一种分离的、合成或重组多肽,其包含权利要求52的多肽且 缺乏信号序列。

73.一种分离的、合成或重组多肽,其包含权利要求52的多肽且 具有异源信号序列。

74.权利要求56的分离的、合成或重组多肽,其中所述淀粉酶和 /或葡糖淀粉酶活性包含于约37℃在下述范围中的比活性:约100-约 1000单位/毫克蛋白质、约500-约750单位/毫克蛋白质、约500-约 1200单位/毫克蛋白质、或约750-约1000单位/毫克蛋白质。

75.权利要求70的分离的、合成或重组多肽,其中所述耐热性包 含在加热至升高的温度后保留淀粉酶和/或葡糖淀粉酶于37℃的至少 一半比活性。

76.权利要求70的分离的、合成或重组多肽,其中所述耐热性包 含在加热至升高的温度后保留在约500-约1200单位/毫克蛋白质范围 内的于37℃的比活性。

77.权利要求52的分离的、合成或重组多肽,其中所述多肽包含 至少一个糖基化位点。

78.权利要求77的分离的、合成或重组多肽,其中所述糖基化是 N联糖基化。

79.权利要求78的分离的、合成或重组多肽,其中所述多肽在巴 斯德毕赤酵母或栗酒裂殖酵母中表达后是糖基化的。

80.权利要求56的分离的、合成或重组多肽,其中所述多肽在包 含约pH 6.5、pH 6.0、pH 5.5、5.0、pH 4.5或4.0的条件下保留淀 粉酶和/或葡糖淀粉酶活性。

81.权利要求56的分离的、合成或重组多肽,其中所述多肽在包 含约pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10或pH 10.5的条件下保 留淀粉酶和/或葡糖淀粉酶活性。

82.一种包含权利要求52的多肽的蛋白质制剂,其中所述蛋白质 制剂包含液体、固体或凝胶。

83.一种异二聚体,其包含权利要求52的多肽和第二结构域。

84.权利要求83的异二聚体,其中所述第二结构域是多肽且所述 异二聚体是融合蛋白。

85.权利要求84的异二聚体,其中所述第二结构域是表位或标 签。

86.一种同二聚体,其包含权利要求52的多肽。

87.一种固定多肽,其包含权利要求52的序列。

88.权利要求87的固定多肽,其中所述多肽固定在细胞、金属、 树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠、凝胶、板、阵 列或毛细管上。

89.一种包含固定多肽的阵列,所述固定多肽包含权利要求52 的多肽。

90.一种包含固定核酸的阵列,所述固定核酸包含权利要求1的 核酸。

91.一种分离的、合成或重组抗体,其与权利要求52的多肽特异 性结合。

92.权利要求91的分离的、合成或重组抗体,其中所述抗体是单 克隆或多克隆抗体。

93.一种杂交瘤,其包含与权利要求52的多肽特异性结合的抗 体。

94.一种用于动物或人类的食物或饲料补充剂,其包含权利要求 52的多肽或其子序列。

95.权利要求94的食物或饲料补充剂,其中所述多肽是糖基化 的。

96.一种可食用的酶递送基质,其包含权利要求52的多肽。

97.权利要求96的可食用的酶递送基质,其中所述递送基质包含 丸剂。

98.权利要求97的可食用的酶递送基质,其中所述多肽是糖基化 的。

99.权利要求97的可食用的酶递送基质,其中所述多肽具有耐热 的或热稳定的淀粉酶和/或葡糖淀粉酶活性。

100.一种分离或鉴定具有淀粉酶和/或葡糖淀粉酶活性的多肽的 方法,其包含步骤:(a)提供权利要求91的抗体;

(b)提供包含多肽的样品;和

(c)在其中所述抗体可以与所述多肽特异性结合的条件下,使步 骤(b)的样品与步骤(a)的抗体接触,从而分离或鉴定具有淀粉酶 和/或葡糖淀粉酶活性的多肽。

101.一种制备抗淀粉酶或抗葡糖淀粉酶抗体的方法,其包括以足 以产生体液免疫应答的量给非人动物施用权利要求1的核酸,从而制 备抗淀粉酶或抗葡糖淀粉酶抗体。

102.一种制备抗淀粉酶或抗葡糖淀粉酶抗体的方法,其包括以足 以产生体液免疫应答的量给非人动物施用权利要求52的多肽,从而制 备抗淀粉酶或抗葡糖淀粉酶抗体。

103.一种生产重组多肽的方法,其包括步骤:(a)提供与启动 子可操作地连接的核酸,其中所述核酸包含权利要求1的核酸序列; 和(b)在允许所述多肽表达的条件下表达步骤(a)的核酸,从而生 产重组多肽。

104.权利要求103的方法,其进一步包括用步骤(a)的核酸转 化宿主细胞,随后表达步骤(a)的核酸,从而在转化细胞中生产重组 多肽。

105.一种用于鉴定具有淀粉酶和/或葡糖淀粉酶活性的多肽的方 法,其包括下述步骤:(a)提供权利要求56的多肽;

(b)提供淀粉酶和/或葡糖淀粉酶底物;和

(c)使所述多肽与步骤(b)的底物接触,并且检测底物量的减 少或反应产物量的增加,其中所述底物量的减少或所述反应产物量的 增加检测具有淀粉酶和/或葡糖淀粉酶活性的多肽。

106.权利要求105的方法,其中所述底物包含多糖、寡糖或淀粉。

107.一种用于鉴定淀粉酶和/或葡糖淀粉酶底物的方法,其包括 下述步骤:

(a)提供权利要求56的多肽;

(b)提供测试底物;和

(c)使步骤(a)的多肽与步骤(b)的测试底物接触,并且检测 底物量的减少或反应产物量的增加,其中所述底物量的减少或所述反 应产物量的增加鉴定所述测试底物为淀粉酶和/或葡糖淀粉酶底物。

108.一种测定测试化合物是否与多肽特异性结合的方法,其包括 下述步骤:

(a)在允许所述核酸翻译成多肽的条件下表达核酸或包含所述核 酸的载体,其中所述核酸具有权利要求1的核酸序列;

(b)提供测试化合物;

(c)使所述多肽与所述测试化合物接触;和

(d)测定步骤(b)的测试化合物是否与所述多肽特异性结合。

109.一种测定测试化合物是否与多肽特异性结合的方法,其包括 下述步骤:

(a)提供具有权利要求52的序列的多肽;

(b)提供测试化合物;

(c)使所述多肽与所述测试化合物接触;和

(d)测定步骤(b)的测试化合物是否与所述多肽特异性结合。

110.一种用于鉴定淀粉酶和/或葡糖淀粉酶活性的调节剂的方 法,其包括下述步骤:(a)提供权利要求56的多肽;

(b)提供测试化合物;

(c)使步骤(a)的多肽与步骤(b)的测试化合物接触,并且测 量淀粉酶和/或葡糖淀粉酶活性,其中与在不存在所述测试化合物的情 况下的活性比较,在所述测试化合物的存在下测量的所述淀粉酶和/ 或葡糖淀粉酶活性的改变提供了所述测试化合物调节淀粉酶和/或葡 糖淀粉酶活性的测定。

111.权利要求110的方法,其中所述淀粉酶和/或葡糖淀粉酶活 性通过下述进行测量:提供淀粉酶和/或葡糖淀粉酶底物,并且检测底 物量的减少或反应产物量的增加,或者底物量的增加或反应产物量的 减少。

112.权利要求111的方法,其中与不含所述测试化合物的所述底 物或反应产物量比较,所述测试化合物的所述底物量的减少或所述反 应产物量的增加鉴定所述测试化合物为淀粉酶和/或葡糖淀粉酶活性 的活化剂。

113.权利要求111的方法,其中与不含所述测试化合物的所述底 物或反应产物量比较,所述测试化合物的所述底物量的增加或所述反 应产物量的减少鉴定所述测试化合物为淀粉酶和/或葡糖淀粉酶活性 的抑制剂。

114.一种包含处理器和数据存储设备的计算机系统,其中所述数 据存储设备已在其上储存多肽序列或核酸序列,其中所述多肽序列包 含权利要求52的序列、由如权利要求1或权利要求22中所示的核酸 编码的多肽。

115.权利要求114的计算机系统,其进一步包含序列比较算法和 具有在其上储存的至少一种参考序列的数据存储设备。

116.权利要求115的计算机系统,其中所述序列比较算法包含指 示多态性的计算机程序。

117.权利要求114的计算机系统,其进一步包含鉴定所述序列中 的一个或多个特征的鉴别器。

118.一种在其上已储存多肽序列或核酸序列的计算机可读介质, 其中所述多肽序列包含权利要求52的多肽;由如权利要求1或权利要 求22中所示的核酸编码的多肽。

119.一种用于鉴定序列中的特征的方法,其包括步骤:(a)使 用鉴定序列中的一个或多个特征的计算机程序阅读所述序列,其中所 述序列包含多肽序列或核酸序列,其中所述多肽序列包含权利要求52 的多肽;由如权利要求1或权利要求22中所示的核酸编码的多肽;和 (b)用所述计算机程序鉴定所述序列中的一个或多个特征。

120.一种用于比较第一序列与第二序列的方法,其包括步骤:(a) 通过使用比较序列的计算机程序阅读所述第一序列和所述第二序列, 其中所述第一序列包含多肽序列或核酸序列,其中所述多肽序列包含 权利要求52的多肽或由如权利要求1或权利要求22中所示的核酸编 码的多肽;和(b)用所述计算机程序测定所述第一序列和所述第二序 列之间的差异。

121.权利要求120的方法,其中所述测定所述第一序列和所述第 二序列之间的差异的步骤进一步包括鉴定多态性的步骤。

122.权利要求120的方法,其进一步包括鉴定序列中的一个或多 个特征的鉴别器。

123.权利要求122的方法,其包括使用计算机程序阅读所述第一 序列,和鉴定所述序列中的一个或多个特征。

124.一种用于从环境样品中分离或回收核酸的方法,所述核酸编 码具有淀粉酶和/或葡糖淀粉酶活性的多肽,所述方法包括步骤:(a)提供如权利要求29中所示的扩增引物序列对;

(b)从所述环境样品中分离核酸,或处理所述环境样品,从而使 得所述样品中的核酸可用于与所述扩增引物对杂交;和,(c)使步骤(b)的核酸与步骤(a)的扩增引物对组合,且扩增 来自所述环境样品的核酸,从而从环境样品中分离或回收核酸,所述 核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽。

125.权利要求124的方法,其中所述扩增引物序列对的每个成员 包含含有权利要求1的序列的至少约10-50个连续碱基的寡核苷酸。

126.一种用于从环境样品中分离或回收核酸的方法,所述核酸编 码具有淀粉酶和/或葡糖淀粉酶活性的多肽,所述方法包括步骤:(a)提供包含权利要求1的核酸序列的多核苷酸探针;

(b)从所述环境样品中分离核酸,或处理所述环境样品,从而使 得所述样品中的核酸可用于与步骤(a)的多核苷酸探针杂交;

(c)使步骤(b)的分离的核酸或处理的环境样品与步骤(a)的 多核苷酸探针组合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,从而 从环境样品中分离或回收核酸,所述核酸编码具有淀粉酶和/或葡糖淀 粉酶活性的多肽。

127.权利要求124或权利要求126的方法,其中所述环境样品包 含水样品、液体样品、土壤样品、空气样品或生物样品。

128.权利要求127的方法,其中所述生物样品衍生自细菌细胞、 原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动 物细胞。

129.一种产生编码具有淀粉酶和/或葡糖淀粉酶活性的多肽的核 酸的变体的方法,所述方法包括步骤:(a)提供包含权利要求1的核酸序列的模板核酸;和

(b)在所述模板序列中修饰、缺失或添加一个或多个核苷酸,或 其组合,以产生所述模板核酸的变体。

130.权利要求129的方法,其进一步包括表达所述变体核酸,以 产生变体淀粉酶和/或葡糖淀粉酶多肽。

131.权利要求129的方法,其中所述修饰、缺失或添加通过下述 方法引入:易错PCR、改组、寡核苷酸定向的诱变、装配PCR、有性 PCR诱变、体内诱变、盒式诱变、递归总体诱变、指数总体诱变、位 点特异性诱变、基因重新装配、基因位点饱和诱变(GSSM)、合成连 接重新装配(SLR)及其组合。

132.权利要求129的方法,其中所述修饰、缺失或添加通过下述 方法引入:重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿 嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺陷型宿主 菌株诱变、化学诱变、辐射产生的诱变、缺失诱变、限制-选择诱变、 限制-纯化诱变、人工基因合成、总体诱变、嵌合核酸多聚体产生及其 组合。

133.权利要求129的方法,其中所述方法反复重复直至产生淀粉 酶和/或葡糖淀粉酶,其具有与由模板核酸编码的多肽相比的改变的或 不同的活性、或者改变的或不同的稳定性。

134.权利要求133的方法,其中所述变体淀粉酶和/或葡糖淀粉 酶多肽是耐热的,并且在暴露于升高的温度后保留一定活性。

135.权利要求133的方法,其中与由模板核酸编码的淀粉酶和/ 或葡糖淀粉酶比较,所述变体淀粉酶和/或葡糖淀粉酶多肽具有增加的 糖基化。

136.权利要求133的方法,其中变体淀粉酶和/或葡糖淀粉酶多 肽在高温下具有淀粉酶和/或葡糖淀粉酶活性,其中由模板核酸编码的 淀粉酶和/或葡糖淀粉酶在高温下是无活性的。

137.权利要求129的方法,其中所述方法反复重复直至产生淀粉 酶和/或葡糖淀粉酶编码序列,其具有与模板核酸不同的改变的密码子 使用。

138.权利要求129的方法,其中所述方法反复重复直至产生淀粉 酶和/或葡糖淀粉酶基因,其具有与模板核酸不同的更高或更低水平的 信使表达或稳定性。

139.一种用于修饰核酸中的密码子以增强其在宿主细胞中的表 达的方法,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽,所 述方法包括下述步骤:(a)提供包含权利要求1的核酸序列、编码具有淀粉酶和/或葡 糖淀粉酶活性的多肽的核酸;和(b)鉴定步骤(a)的核酸中的非优选或较不优选的密码子,且 用编码相同氨基酸的优选或中立使用的密码子作为替换密码子替换 它,其中优选密码子是在宿主细胞的基因中的编码序列中过度表现的 密码子,并且非优选或较不优选的密码子是在宿主细胞的基因中的编 码序列中表现不足的密码子,从而修饰所述核酸以增强其在宿主细胞 中的表达。

140.一种用于修饰编码淀粉酶和/或葡糖淀粉酶多肽的核酸中的 密码子的方法,所述方法包括下述步骤:(a)提供包含权利要求1的核酸序列、编码具有淀粉酶和/或葡 糖淀粉酶活性的多肽的核酸;和,(b)鉴定步骤(a)的核酸中的密码子,且用编码相同氨基酸的 不同密码子作为替换密码子替换它,从而修饰编码淀粉酶和/或葡糖淀 粉酶的核酸中的密码子。

141.一种用于修饰核酸中的密码子以增强其在宿主细胞中的表 达的方法,所述核酸编码淀粉酶和/或葡糖淀粉酶多肽,所述方法包括 下述步骤:(a)提供包含权利要求1的核酸序列、编码淀粉酶和/或葡糖淀 粉酶多肽的核酸;和(b)鉴定步骤(a)的核酸中的非优选或较不优选的密码子,且 用编码相同氨基酸的优选或中立使用的密码子作为替换密码子替换 它,其中优选密码子是在宿主细胞的基因中的编码序列中过度表现的 密码子,并且非优选或较不优选的密码子是在宿主细胞的基因中的编 码序列中表现不足的密码子,从而修饰所述核酸以增强其在宿主细胞 中的表达。

142.一种用于修饰核酸中的密码子以减少其在宿主细胞中的表 达的方法,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽,所 述方法包括下述步骤:(a)提供包含权利要求1的核酸序列、编码淀粉酶和/或葡糖淀 粉酶多肽的核酸;和(b)鉴定步骤(a)的核酸中的至少一个优选密码子,且用编码 相同氨基酸的非优选或较不优选的密码子作为替换密码子替换它,其 中优选密码子是在宿主细胞的基因中的编码序列中过度表现的密码 子,并且非优选或较不优选的密码子是在宿主细胞的基因中的编码序 列中表现不足的密码子,从而修饰所述核酸以减少其在宿主细胞中的 表达。

143.权利要求141或142的方法,其中所述宿主细胞是细菌细胞、 真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。

144.一种用于生产核酸文库的方法,所述核酸编码多个经修饰的 淀粉酶和/或葡糖淀粉酶活性位点或底物结合位点,其中所述经修饰的 活性位点或底物结合位点衍生自包含编码第一活性位点或第一底物结 合位点的序列的第一核酸,所述方法包括下述步骤:(a)提供编码第一活性位点或第一底物结合位点的第一核酸,其 中所述第一核酸序列包含在严格条件下与如SEQ ID NO:1、SEQ ID NO: 3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、 SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、 SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、 SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、 SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、 SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、 SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、 SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、 SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81和/或SEQ ID NO: 82中所示的序列或其子序列杂交的序列,并且所述核酸编码淀粉酶和 /或葡糖淀粉酶活性位点或淀粉酶和/或葡糖淀粉酶底物结合位点;

(b)提供在所述第一核酸中在多个靶向密码子处编码天然存在的 氨基酸变体的一组诱变寡核苷酸;和,(c)使用该组诱变寡核苷酸以产生一组编码活性位点或编码底物 结合位点的变体核酸,其在诱变的每个氨基酸密码子处编码一系列氨 基酸变化,从而生产编码多个经修饰的淀粉酶和/或葡糖淀粉酶活性位 点或底物结合位点的核酸文库。

145.权利要求144的方法,其包括通过下述方法诱变步骤(a) 的第一核酸:优化定向进化系统、基因位点饱和诱变(GSSM)、或合 成连接重新装配(SLR)。

146.权利要求144的方法,其包括通过下述方法诱变步骤(a) 的第一核酸或变体:易错PCR、改组、寡核苷酸定向的诱变、装配PCR、 有性PCR诱变、体内诱变、盒式诱变、递归总体诱变、指数总体诱变、 位点特异性诱变、基因重新装配、基因位点饱和诱变(GSSM)、合成 连接重新装配(SLR)及其组合。

147.权利要求144的方法,其包括通过下述方法诱变步骤(a) 的第一核酸或变体:重组、递归序列重组、硫代磷酸酯修饰的DNA诱 变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺 陷型宿主菌株诱变、化学诱变、辐射产生的诱变、缺失诱变、限制- 选择诱变、限制-纯化诱变、人工基因合成、总体诱变、嵌合核酸多聚 体产生及其组合。

148.一种用于制备小分子的方法,其包括下述步骤:

(a)提供能够合成或修饰小分子的多种生物合成酶,其中所述酶 之一包含由核酸编码的淀粉酶和/或葡糖淀粉酶,所述核酸包含权利要 求1的核酸序列;

(b)提供步骤(a)的至少一种酶的底物;和

(c)使步骤(b)的底物与所述酶在有利于多种生物催化反应的 条件下反应,以通过一系列生物催化反应产生小分子。

149.一种用于修饰小分子的方法,其包括下述步骤:

(a)提供淀粉酶和/或葡糖淀粉酶,其中所述酶包含权利要求56 的多肽、或由包含如权利要求1或权利要求22中所示的核酸序列的核 酸编码的多肽;

(b)提供小分子;和

(c)使步骤(a)的酶与步骤(b)的小分子在有利于由淀粉酶和 /或葡糖淀粉酶催化的酶促反应的条件下反应,从而通过淀粉酶和/或 葡糖淀粉酶的酶促反应修饰小分子。

150.权利要求149的方法,其包括步骤(a)的酶的多种小分子 底物,从而产生通过至少一种酶促反应生产的经修饰的小分子文库, 所述酶促反应由淀粉酶和/或葡糖淀粉酶催化。

151.权利要求149的方法,其进一步包括多种另外的酶,在有利 于经由所述酶的多种生物催化反应的条件下,以形成通过多种酶促反 应生产的经修饰的小分子文库。

152.权利要求151的方法,其进一步包括测试文库的步骤,以测 定显示所需活性的特定经修饰的小分子是否存在于所述文库内。

153.权利要求152的方法,其中测试所述文库的步骤进一步包括 系统地消除在所述文库内除了一个以外的所有生物催化反应的步骤, 所述生物催化反应用于生产多个经修饰的小分子的部分,这是通过就 具有所需活性的特定经修饰的小分子的存在或不存在测试经修饰的小 分子的部分,并且鉴定生产具有所需活性的特定经修饰的小分子的至 少一种特异性生物催化反应来完成的。

154.一种用于测定淀粉酶和/或葡糖淀粉酶的功能片段的方法, 其包括步骤:

(a)提供淀粉酶和/或葡糖淀粉酶,其中所述酶包含权利要求56 的多肽、或由如权利要求1或权利要求22中所示的核酸编码的多肽; 和(b)使来自步骤(a)的序列的多个氨基酸残基缺失,且就淀粉 酶和/或葡糖淀粉酶活性测试其余子序列,从而测定淀粉酶和/或葡糖 淀粉酶的功能片段。

155.权利要求154的方法,其中所述淀粉酶和/或葡糖淀粉酶活 性通过下述进行测量:提供淀粉酶和/或葡糖淀粉酶底物,且检测所述 底物量的减少或所述反应产物量的增加。

156.一种通过使用实时代谢流分析用于新或修饰表型的全细胞 改造的方法,所述方法包括下述步骤:(a)通过修饰细胞的遗传组成制备经修饰的细胞,其中所述遗传 组成通过给所述细胞添加包含权利要求1的核酸序列的核酸进行修 饰;

(b)培养所述经修饰的细胞以产生多个经修饰的细胞;

(c)通过实时监控步骤(b)的细胞培养物测量所述细胞的至少 一种代谢参数;和,(d)分析步骤(c)的数据,以测定所测量的参数是否不同于在 相似条件下未经修饰的细胞中的可比较测量,从而使用实时代谢流分 析鉴定所述细胞中的改造表型。

157.权利要求156的方法,其中所述细胞的遗传组成通过下述方 法进行修饰,所述方法包括所述细胞中的序列缺失或序列修饰,或, 击倒基因的表达。

158.权利要求157的方法,其进一步包括选择包含新改造表型的 细胞。

159.权利要求158的方法,其进一步包括培养所选择的细胞,从 而产生包含新改造表型的新细胞株。

160.一种用于水解多糖、寡糖或淀粉的方法,其包括下述步骤:

(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供包含多糖、寡糖或淀粉的组合物;和

(c)使步骤(a)的多肽与步骤(b)的组合物在其中所述多肽水 解所述多糖、寡糖或淀粉的条件下接触。

161.如权利要求160中所示的方法,其中所述组合物包含α -1,4-糖苷键或α-1,6-糖苷键。

162.一种用于从组合物中液化或去除多糖、寡糖或淀粉的方法, 其包括下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供包含多糖、寡糖或淀粉的组合物;和

(c)使步骤(a)的多肽与步骤(b)的组合物在其中所述多肽去 除或液化所述多糖、寡糖或淀粉的条件下接触。

163.一种增加淀粉酶和/或葡糖淀粉酶多肽的耐热性或热稳定性 的方法,所述方法包括使淀粉酶和/或葡糖淀粉酶多肽糖基化,其中所 述多肽包含权利要求52的多肽、或由如权利要求1或权利要求22中 所示的核酸编码的多肽的至少30个邻接氨基酸,从而增加所述淀粉酶 和/或葡糖淀粉酶多肽的耐热性或热稳定性。

164.权利要求163的方法,其中所述淀粉酶和/或葡糖淀粉酶比 活性在超过约37℃-约95℃的温度下是热稳定的或耐热的。

165.一种用于在细胞中超表达重组淀粉酶和/或葡糖淀粉酶多肽 的方法,其包括表达包含核酸序列的载体,所述核酸序列与如权利要 求1或权利要求22中所示的核酸具有至少50%、51%、52%、53%、 54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、 64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、 74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%序列同一性,其中超表达通过 使用高活性启动子、双顺反子载体或通过所述载体的基因扩增来实现。

166.一种包含权利要求52的多肽、或由如权利要求1或权利要 求22中所示的核酸编码的多肽的洗涤剂组合物,其中所述多肽包含淀 粉酶和/或葡糖淀粉酶活性。

167.权利要求166的洗涤剂组合物,其中所述淀粉酶和/或葡糖 淀粉酶是非表面活性的淀粉酶和/或葡糖淀粉酶、或者表面活性的淀粉 酶和/或葡糖淀粉酶。

168.权利要求166的洗涤剂组合物,其中所述淀粉酶和/或葡糖 淀粉酶以非水性液体组合物、铸型固体、颗粒形式、微粒形式、压缩 片、凝胶形式、糊或浆形式进行配制。

169.权利要求166的洗涤剂组合物,其中所述淀粉酶和/或葡糖 淀粉酶在碱性条件下是有活性的。

170.权利要求166的洗涤剂组合物,其中所述淀粉酶和/或葡糖 淀粉酶在约30-40℃的低温和约pH 3.5-6.0的低pH下可以水解颗 粒状淀粉。

171.一种用于洗涤物体的方法,其包括下述步骤:

(a)提供包含具有淀粉酶和/或葡糖淀粉酶活性的多肽的组合物, 其中所述多肽包含权利要求56的多肽、或由如权利要求1或权利要求 22中所示的核酸编码的多肽;

(b)提供物体;和

(c)使步骤(a)的多肽与步骤(b)的物体在其中所述组合物可 以洗涤所述物体的条件下接触。

172.一种用于在由动物消耗前水解饲料或食物中的多糖、寡糖或 淀粉的方法,其包括下述步骤:(a)获得包含淀粉的饲料材料,其中所述多糖、寡糖或淀粉中的 多糖、寡糖或淀粉可以由具有淀粉酶和/或葡糖淀粉酶活性的多肽水 解,其中所述多肽包含权利要求56的多肽、或由如权利要求1或权利 要求22中所示的核酸编码的多肽;和(b)将步骤(a)的多肽以足够的量加入所述饲料或食物材料中, 持续足够的时间段,以引起所述多糖、寡糖或淀粉的水解和经处理的 食物或饲料的形成,从而在由所述动物消耗前水解所述食物或饲料中 的所述多糖、寡糖或淀粉。

173.如权利要求172中所示的方法,其中所述食物或饲料包含 稻、玉米、大麦、小麦、豆类或马铃薯。

174.一种饲料或食物,其包含权利要求56的多肽、或由如权利 要求1或权利要求22中所示的核酸编码的多肽。

175.一种组合物,其包含多糖、寡糖或淀粉和权利要求56的多 肽、或由如权利要求1或权利要求22中所示的核酸编码的多肽。

176.一种织物或织品,其包含权利要求56的多肽、或由如权利 要求1或权利要求22中所示的核酸编码的多肽。

177.一种用于织物脱浆的方法,其包括下述步骤:

(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供织品;和

(c)使步骤(a)的多肽和步骤(b)的织品在其中所述淀粉酶和 /或葡糖淀粉酶可以使所述织品脱浆的条件下接触。

178.一种纸或纸产品或纸浆,其包含权利要求56的多肽、或由 如权利要求1或权利要求22中所示的核酸编码的多肽。

179.一种用于使纸或纤维脱墨的方法,其包括下述步骤:

(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供包含纸或纤维的组合物;和

(c)使步骤(a)的多肽和步骤(b)的组合物在其中所述多肽可 以使所述纸或纤维脱墨的条件下接触。

180.一种用于处理木质纤维素纤维的方法,其包括下述步骤:

(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供木质纤维素纤维;和

(c)使步骤(a)的多肽和步骤(b)的纤维在其中所述多肽可以 处理所述纤维的条件下接触,从而改善所述纤维性质。

181.一种高麦芽糖或高葡萄糖液体或糖浆,其包含权利要求56 的多肽、或由如权利要求1或权利要求22中所示的核酸编码的多肽。

182.一种用于生产高麦芽糖或高葡萄糖糖浆的方法,其包括下述 步骤:

(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供包含多糖、寡糖或淀粉的组合物;和

(c)使步骤(a)的多肽和步骤(b)的织品在其中步骤(a)的 多肽可以水解步骤(b)的组合物的条件下接触,从而生产高麦芽糖或 高葡萄糖糖浆。

183.如权利要求182中所示的方法,其中所述多糖、寡糖或淀粉 来自稻、玉米、大麦、小麦、豆类、马铃薯或甘薯。

184.一种用于改善含多糖、寡糖或淀粉生产液的流动的方法,其 包括下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含权利要求56的多肽、或由如权利要求1或权利要求22中所示 的核酸编码的多肽;

(b)提供包含多糖、寡糖或淀粉的生产液;和

(c)使步骤(a)的多肽和步骤(b)的生产液在其中淀粉酶和/ 或葡糖淀粉酶可以水解所述生产液中的多糖、寡糖或淀粉的条件下接 触,从而通过减少其密度而改善其流动。

185.如权利要求184中所示的方法,其中所述生产液来自地层。

186.一种抗老化组合物,其包含权利要求56的多肽、或由如权 利要求1或权利要求22中所示的核酸编码的多肽。

187.一种用于预防烘焙产品的老化的方法,其包括下述步骤:

(a)提供包含权利要求56的多肽、或由如权利要求1或权利要 求22中所示的核酸编码的多肽的多肽;

(b)提供包含多糖、寡糖或淀粉的用于烘焙的组合物;

(c)在这样的条件下使步骤(a)的多肽与步骤(b)的组合物相 组合,其中所述多肽可以水解用于烘焙的所述组合物中的所述多糖、 寡糖或淀粉,从而防止所述烘焙产品的老化。

188.如权利要求187中所示的方法,其中所述烘焙产品是面包或 面包产品。

189.一种在酿造或醇生产中使用淀粉酶和/或葡糖淀粉酶的方 法,其包括下述步骤:(a)提供包含权利要求56的多肽、或由如权利要求1或权利要 求22中所示的核酸编码的多肽的多肽;

(b)提供包含多糖、寡糖或淀粉用于酿造或醇生产中的组合物;

(c)在这样的条件下使步骤(a)的多肽与步骤(b)的组合物相 组合,其中所述多肽可以水解用于酿造或醇生产的所述组合物中的所 述多糖、寡糖或淀粉。

190.如权利要求189中所示的方法,其中包含多糖、寡糖或淀粉 的所述组合物是啤酒。

191.一种酒精饮料,其包含权利要求56的多肽、或由如权利要 求1或权利要求22中所示的核酸编码的多肽。

192.一种啤酒,其包含权利要求56的多肽、或由如权利要求1 或权利要求22中所示的核酸编码的多肽。

193.一种药物组合物,其包含权利要求56的多肽、或由如权利 要求1或权利要求22中所示的核酸编码的多肽。

194.权利要求193的药物组合物,其进一步包含乳胶聚合物包 衣。

195.权利要求32的表达盒,其中所述核酸与植物启动子可操作 地连接。

196.权利要求195的表达盒,其进一步包含植物表达载体。

197.权利要求196的表达盒,其中所述植物表达载体包含植物病 毒。

198.权利要求195的表达盒,其中所述植物启动子包含马铃薯启 动子、稻启动子、玉米启动子、小麦或大麦启动子。

199.权利要求195的表达盒,其中所述启动子包含衍生自根瘤土 壤杆菌的T-DNA的启动子。

200.权利要求195的表达盒,其中所述启动子是组成型启动子。

201.权利要求200的表达盒,其中所述组成型启动子是CaMV35S。

202.权利要求195的表达盒,其中所述启动子是诱导型启动子或 组织特异性启动子。

203.权利要求202的表达盒,其中所述组织特异性启动子是种子 特异性、叶特异性、根特异性、茎特异性或脱落诱导型启动子。

204.权利要求39的转化细胞,其中所述植物细胞是马铃薯、稻、 玉米、小麦、烟草或大麦细胞。

205.一种制备转基因植物的方法,其包括下述步骤:

(a)将异源核酸序列引入所述细胞内,其中所述异源核酸序列包 含权利要求1的核酸序列,从而生产转化的植物细胞;

(b)由所述转化细胞生产转基因植物。

206.如权利要求205中所示的方法,其中所述步骤(a)进一步 包括通过植物细胞原生质体的电穿孔或显微注射引入所述异源核酸序 列。

207.如权利要求205中所示的方法,其中所述步骤(a)包括通 过DNA粒子轰击将所述异源核酸序列直接引入植物组织。

208.如权利要求205中所示的方法,其中所述步骤(a)包括使 用根瘤土壤杆菌宿主将所述异源核酸序列引入所述植物细胞DNA内。

209.一种在植物细胞中表达异源核酸序列的方法,其包括下述步 骤:

(a)用与启动子可操作地连接的异源核酸序列转化所述植物细 胞,其中所述异源核酸序列包含权利要求1的核酸序列;

(b)在其中所述异源核酸序列在所述植物细胞中表达的条件下培 养所述植物。

210.一种信号序列,其包含如表1中所示的肽。

211.一种信号序列,其由如表1中所示的肽组成。

212.一种嵌合蛋白质,其包含(a)包含权利要求210或权利要 求211的信号序列的第一结构域,和至少第二结构域;(b)(a)的 嵌合蛋白质,其中所述蛋白质是融合蛋白;(c)(a)或(b)的嵌合 蛋白质,其中所述第二结构域包含酶;或(d)(a)-(c)中任何一 个的嵌合蛋白质,其中所述酶是或包含淀粉酶和/或葡糖淀粉酶。

213.一种口腔护理产品,其包含(a)权利要求56的多肽、或由 如权利要求1或权利要求22中所示的核酸编码的多肽;或(b)(a) 的口腔护理产品,其中所述产品包含牙膏、牙科乳膏、凝胶或牙粉、 牙的、漱口剂、刷牙前或后冲洗制剂、口香糖、糖锭或糖果。

214.一种延迟释放或控制释放组合物,其包含

(a)由乳胶聚合物包衣包被的所需成分;

(b)(a)的延迟释放或控制释放组合物,其中所述所需成分包 含酶;

(c)(a)或(b)的延迟释放或控制释放组合物,其中所述所需 成分包含小分子、药物、多糖、脂质、核酸、维生素、抗生素或杀昆 虫剂;

(d)(a)、(b)或(c)的延迟释放或控制释放组合物,其中 所述所需成分包含丸剂或基质;

(e)(a)-(d)中任何一个的延迟释放或控制释放组合物,其 中所述丸剂或基质包含可食用材料;

(f)(a)-(e)中任何一个的延迟释放组合物或控制释放组合 物,其中所述乳胶聚合物包衣包含乳胶漆;或(g)(a)-(f)中任何一个的延迟释放或控制释放组合物,其 中所述乳胶聚合物包衣包含(甲基)丙烯酸酯、乙酸乙烯酯、苯乙烯、 乙烯、氯乙烯、丁二烯、乙烯叉氯、叔碳酸乙烯酯(vinyl versatate)、 丙酸乙烯酯、叔丁基丙烯酸酯、丙烯腈、氯丁橡胶、马来酸酯、延胡 索酸酯或其组合或其衍生物;或(h)(a)-(g)中任何一个的延迟释放或控制释放组合物,其 包含权利要求56的多肽、或由权利要求1的核酸编码的多肽。

215.一种用于组合物的延迟释放或控制释放的方法,其包括:

(i)(a)提供组合物,且提供乳胶聚合物包衣;和

(b)用所述乳胶聚合物包衣包被所述组合物;

(ii)(i)的方法,其中所述组合物包含药物或药品;或

(iii)(i)或(ii)的方法,其中所述组合物包含下列多肽或 由下列多肽组成:权利要求56的多肽、或由权利要求1的核酸编码的 多肽。

216.一种油井钻井液,其包含权利要求56的多肽、或由权利要 求1的核酸编码的多肽。

217.一种用于改变组合物的粘度的方法,其包括:

(i)(a)提供组合物和权利要求56的多肽、或由权利要求1 的核酸编码的多肽,且提供组合物;和(b)用权利要求56的多肽、或由权利要求1的核酸编码的多肽 处理所述组合物;或(ii)(i)的方法,其中所述组合物包含土壤或钻探泥浆。

218.一种用于帮助钻探泥浆的运走的方法,其包括:

(a)提供组合物和权利要求56的多肽、或由权利要求1的核酸 编码的多肽,以及钻探泥浆;和(b)用包含权利要求56的多肽、或由权利要求1的核酸编码的 多肽的组合物处理所述钻探泥浆。

219.一种生物漂白溶液,其包含权利要求56的多肽、或由权利 要求1的核酸编码的多肽。

220.一种用于生物漂白组合物的方法,其包括:

(i)(a)提供组合物和权利要求56的多肽、或由权利要求1 的核酸编码的多肽;和(b)用权利要求56的多肽、或由权利要求1的核酸编码的多肽 处理所述组合物;或(ii)(i)的方法,其中所述组合物是纸或浆产品。

221.一种用于制备燃料的方法,其包括:

(i)(a)提供如权利要求56中所示的葡糖淀粉酶或淀粉酶,或 由权利要求1的核酸编码的淀粉酶和/或葡糖淀粉酶;

(b)提供包含多糖、寡糖或淀粉的组合物;和

(c)使(a)的葡糖淀粉酶或淀粉酶与(b)的组合物在其中所述 淀粉酶和/或葡糖淀粉酶水解所述多糖、寡糖或淀粉的条件下接触;或(ii)(i)的方法,其中所述葡糖淀粉酶或淀粉酶是热稳定酶;

(iii)(i)的方法,其中所述燃料是基于乙醇的。

222.一种消毒剂,其包含权利要求56的多肽、或由权利要求1 的核酸编码的多肽。

223.一种生物防卫或生物解毒剂,其包含权利要求56的多肽、 或由权利要求1的核酸编码的多肽。

224.一种乳制品,其包含权利要求56的多肽、或由权利要求1 的核酸编码的多肽。

225.一种用于加工包含木质纤维素的生物质材料的方法,其包括

(i)(a)提供包含权利要求56的多肽、或由权利要求1的核酸 编码的多肽的组合物,且提供生物质材料;和(b)使包含权利要求56的多肽、或由权利要求1的核酸编码的 多肽的所述组合物与所述生物质材料接触;

(ii)(i)的方法,其中所述生物质材料包含或衍生自农业作物, 或是食物或饲料生产的副产品,或是木质纤维素废品,或是植物残渣 或废纸或废纸产品;

(iii)(i)或(ii)的方法,其中所述多肽具有包含淀粉酶、 葡糖淀粉酶、葡糖苷酶例如α-葡糖苷酶或β-葡糖苷酶活性的活性;

(iv)(ii)中任何一个的方法,其中所述植物残渣包含茎、叶、 外壳、外皮、穗轴、木材、木片、木浆和锯屑,或者,所述废纸包含 抛弃或用过的复印纸、计算机打印纸、笔记本纸、便签纸、打字机纸、 报纸、杂志、卡纸板和基于纸的包装材料;或(v)(i)-(iv)中任何一个的方法,其中所述生物质材料的加 工产生生物乙醇、生物丙醇、生物丁醇或生物柴油;

(vi)(i)-(v)中任何一个的方法,其中所述生物质材料包含 木质纤维素。

226.一种生物质材料,其包含权利要求56的多肽、或由权利要 求1的核酸编码的多肽。

227.一种用于制备生物乙醇、生物丙醇、生物丁醇或生物柴油的 方法,其包括:(i)(a)提供权利要求56的多肽、或由权利要求1的核酸编码 的多肽,且提供包含多糖或寡糖的组合物;和(b)使包含多糖或寡糖的组合物与权利要求56的多肽、或由权 利要求1的核酸编码的多肽接触;

(ii)(i)的方法,其中包含多糖或寡糖的所述组合物包含植物、 植物产品或植物衍生物;

(iii)(ii)的方法,其中所述植物或植物产品包含蔗糖植物或 植物产品、甜菜根或甜菜、小麦、玉米、大豆、马铃薯、稻或大麦;

(iv)(i)-(iii)中任何一个的方法,其中所述多肽具有包含 淀粉酶、葡糖淀粉酶、葡糖苷酶例如α-葡糖苷酶或β-葡糖苷酶活性 的活性;或(v)(i)-(iv)中任何一个的方法,其中所述多糖或寡糖包含 可发酵糖。

228.一种用于制备燃料的方法,其包括

(i)(a)提供权利要求56的多肽、或由权利要求1的核酸编码 的多肽,且提供包含可发酵糖的组合物;和(b)使包含可发酵糖的所述组合物与权利要求56的多肽、或由 权利要求1的核酸编码的多肽接触;

(ii)(i)的方法,其中包含可发酵糖的所述组合物包含植物、 植物产品或植物衍生物;

(iii)(ii)的方法,其中所述植物或植物产品包含蔗糖植物或 植物产品、甜菜根或甜菜、小麦、玉米、大豆、马铃薯、稻或大麦;

(iv)(i)-(iii)中任何一个的方法,其中所述多肽具有包含 淀粉酶、葡糖淀粉酶、葡糖苷酶例如α-葡糖苷酶或β-葡糖苷酶活性 的活性;或(v)(i)-(iv)中任何一个的方法,其中所述燃料包含生物乙 醇或汽油-乙醇混合物,或包含生物乙醇、生物丙醇、生物丁醇或生物 柴油。

229.一种燃料,其包含

(a)权利要求56的多肽、或由如权利要求1中所示的核酸编码 的多肽;

(b)(a)的燃料,其中所述多肽具有包含淀粉酶、葡糖淀粉酶、 葡糖苷酶例如α-葡糖苷酶或β-葡糖苷酶活性的活性;

(c)(a)或(b)的燃料,其中所述燃料衍生自植物材料,或所 述燃料衍生自马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、 小麦、甜菜根或甘蔗;或(d)(a)-(c)中任何一个的燃料,其中所述燃料包含生物乙 醇或汽油-乙醇混合物,或包含生物乙醇、生物丙醇、生物丁醇或生物 柴油。

230.一种用于生产糖的方法,所述方法包括:

(i)(a)提供具有淀粉酶或葡糖淀粉酶活性的至少一种多肽;

(b)提供包含多糖或寡糖的组合物;和

(c)使步骤(b)的组合物与步骤(a)的多肽接触,从而产生糖;

(ii)(i)的方法,其中包含多糖的所述组合物包含淀粉;

(iii)(i)或(ii)中任何一个的方法,其中所述糖是可发酵 糖;

(iv)(i)、(ii)或(iii)中任何一个的方法,其进一步包 括使所述糖发酵以生产醇;或(v)(iv)的方法,其中所述醇是乙醇、丙醇或丁醇。

说明书全文

提及经由EFS-WEB提交的序列表

本申请经由USPTO EFS-WEB服务器进行电子提交,如MPEP§1730 II.B.2.(a)(A)中批准和所示的,并且电子文件包括电子提交的序 列(SEQ ID)表;这个序列表的完整内容为了所有目的引入本文作为 参考。序列表如下在电子提交的.txt文件上得到鉴定:

文件名 创建日期 大小(字节) 564462015340Seqlist.txt 2007年12月20日 309,764

技术领域

本发明涉及分子和细胞生物学以及生物化学。在一个方面,本发 明涉及具有淀粉酶和/或葡糖淀粉酶活性的多肽,编码多肽的多核苷 酸,以及关于制备和使用这些多核苷酸和多肽的方法。在一个方面, 本发明的多肽可以用作内作用淀粉酶(例如,α淀粉酶)或用作外作 用葡糖淀粉酶,例如以催化包含葡萄糖单体的多糖例如淀粉(例如由 1,4-α或1,6-α键连接的葡萄糖单体聚合物)水解成糖。在一个方面, 本发明涉及具有热稳定的淀粉酶和/或葡糖淀粉酶活性的多肽,包括α 淀粉酶活性或1,4-α-D-葡聚糖葡糖水解活性。在一个方面,本发明 的多肽可以用作淀粉酶(例如,α淀粉酶)或葡糖淀粉酶,以催化多 糖例如淀粉水解成糖,例如葡萄糖。本发明还涉及包含本发明核酸序 列的核酸构建体、载体和宿主细胞,以及用于生产本发明多肽的重组 方法。本发明还涉及本发明的淀粉酶和/或葡糖淀粉酶在多糖(例如, 淀粉)转换过程中的使用,包括高果糖玉米糖浆(HFCS)、乙醇、右 旋糖、右旋糖糖浆的生产。
背景
淀粉是经常在人饮食中发现的复合碳水化合物。淀粉的结构是由 α-1,4和α-1,6糖苷键连接的葡萄糖聚合物。商业上,葡糖淀粉酶用 于进一步水解已由α-淀粉酶部分水解的玉米淀粉。最广泛利用的葡糖 淀粉酶由真菌黑曲霉(Aspergillus niger)生产;关于这种酶的商业 使用的问题之一是其相对低的热稳定性。
一般而言,淀粉至果糖加工由4个步骤组成:颗粒状淀粉的液化、 液化淀粉糖化成右旋糖、纯化和异构化成果糖。淀粉液化过程的目标 是将淀粉聚合物颗粒的浓缩悬浮液转换成低粘度的可溶性较短链长度 的糊精溶液。这个步骤对于用标准设备的方便处理和至葡萄糖或其他 糖的有效转换是必需的。为了液化颗粒状淀粉,必须通过使颗粒状淀 粉的温度升高至超过约72℃使颗粒凝胶化。加热过程立即使不溶性淀 粉颗粒断裂,以产生水溶性淀粉溶液。溶解的淀粉溶液随后通过淀粉 酶液化。淀粉颗粒由下述组成:69-74%支链淀粉、26-31%直链淀粉、 11-14%水、0.2-0.4%蛋白质、0.5-0.9%脂质、0.05-0.1%炭酸钠、 0.02-0.03%磷、0.1%戊聚糖。约70%的颗粒是无定形的和30%是晶 状的。
烘焙产品(例如面包)的老化已被认为是随着面包产品制备时刻 和消费时刻之间存在的时间越多而变得越严重的问题。术语老化用于 描述在离开烘箱后面包产品的性质中对于消费者不希望有的改变,例 如面包心硬度的增加、面包心弹性的减少以及面包皮中变得坚韧和革 质的变化。面包心的硬度在贮存期间进一步增加至一定水平,这视为 负面的。被视为老化的最重要方面的面包心硬度的增加在面包产品在 其他方面已变得不适合消费前很长时间由消费者认识到。
在工业中存在关于用于各种用途的新淀粉酶例如酸性淀粉酶的需 要,所述用途包括商业玉米淀粉液化过程或改善的制造,所述淀粉酶 具有超过例如来自地衣芽孢杆菌(Bacillus licheniformis)的工业 标准酶的新的或改良性能特征。还存在鉴定淀粉酶和葡糖淀粉酶的工 业动力,所述酶能够在低温下有效水解颗粒状淀粉(例如粗颗粒状淀 粉)而无需高温淀粉凝胶化步骤;本发明的酶,例如淀粉酶、葡糖淀 粉酶和葡糖苷酶可以用于满足这个需要。
还存在关于在自动洗碗(ADW)产品和衣物洗涤剂中具有功用的新 淀粉酶的需要。在ADW产品中,淀粉酶将在pH 10-11和45-60℃下在 钙螯合剂和氧化条件的存在下起作用。对于洗衣,将需要在pH 9-10 和40℃下在合适的洗涤剂基质的活性。淀粉酶也在织物脱浆、酿造过 程、造纸和制浆工业中的淀粉改性和本领域描述的其他过程中有用。
概述
本发明提供了分离的、合成或重组核酸,其包含在至少约10、15、 20、25、30、35、40、45、50、55、60、65、70、75、100、125、150、 175、200、250、300、350、400、450、500、550、600、650、700、 750、800、850、900、950、1000、1050、1100、1150、1200、1250、 1300、1350、1400、1450、1500、1550个或更多残基的区域上,与本 发明的核酸,例如本发明的示例性核酸具有至少约50%、51%、52%、 53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、 63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、 73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%、或更多、或完全(100 %)序列同一性的核酸序列。在一个方面,核酸编码具有淀粉酶和/ 或葡糖淀粉酶活性的至少一种多肽,并且序列同一性通过用序列比较 算法分析或通过目视检查进行测定。在另一个方面,本发明提供了用 于用作探针、抑制分子(例如,反义、iRNAs,例如siRNA、microRNA 或miRNAs),转录或翻译调节等的核酸。
本发明的示例性核酸包括分离的、合成或重组核酸,其包含如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO: 11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO: 19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO: 27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO: 35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO: 43、SEQ ID NO:45、ID NO:47、SEQ ID NO:49、SEQ ID NO: 51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO: 59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO: 67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO: 75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO: 81和/或SEQ ID NO:82和/或其子序列中所示的核酸序列,例如长度 至少约10、15、20、25、30、35、40、45、50、75、100、150、200、 250、300、350、400、450、500、550、600、650、700、750、800、 850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、 1400、1450、1500或更多残基,或在基因或转录物(信使)的全长上。
本发明的示例性核酸还包括编码本发明的多肽的分离的、合成或 重组核酸,例如具有如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、 SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、 SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、 SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、 SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、 SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、 SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、 SEQ ID NO:74、SEQ ID NO:76和/或SEQ ID NO:78中所示的序列, 及其子序列和其变体的示例性多肽,以及如本文所描述的,与本发明 的示例性多肽具有至少约50%、51%等或更多至100%的序列同一性 的多肽。
在一个方面,本发明的多肽具有内作用淀粉酶活性(例如α淀粉 酶)或外作用葡糖淀粉酶活性(下文进一步描述的可替代的淀粉酶活 性)。在一个方面,本发明的多肽充当免疫原或表位。在一个实施方 案中,本发明的多肽可以催化包含葡萄糖单体的多糖和/或寡糖,例如 淀粉(由1,4-α或1,6-α键连接的葡萄糖单体聚合物)的水解。
本发明的淀粉酶和/或葡糖淀粉酶可以在商业上用于多糖、寡糖或 淀粉加工的最初阶段(液化)中;湿玉米研磨中;醇生产中;用作洗 涤剂基质中的清洁剂;在纺织工业中用于淀粉脱浆;烘焙应用中;饮 料工业中;在油田钻探过程中;再循环纸的上墨和动物饲料中。本发 明的淀粉酶和/或葡糖淀粉酶可以用于织物脱浆,酿造过程,造纸和制 浆工业中的多糖、寡糖或淀粉修饰和其他过程中。例如,本发明提供 了使用本发明的多肽用于液化糖化的方法,如图5中举例说明的。
本发明的淀粉酶和/或葡糖淀粉酶可以用于催化多糖例如淀粉水 解成糖;或用于水解淀粉中的内部α-1,4-糖苷键,以产生更小分子量 的麦芽糖糊精。因为多糖和/或寡糖例如淀粉的断裂在消化系统和商业 制备过程中是重要的,所以本发明的淀粉酶和/或葡糖淀粉酶用于食物 和饲料以及关于制备其的过程中,以及用于消化帮助中或用作消化帮 助。本发明的淀粉酶和/或葡糖淀粉酶可以用于淀粉加工的最初阶段 (液化)中;湿玉米研磨中;醇生产中;用作洗涤剂基质中的清洁剂; 在纺织工业中用于淀粉脱浆;烘焙应用中;饮料工业中;在油田钻探 过程中;再循环纸的上墨中;和动物饲料中。
本发明的酶可以具有外作用葡糖淀粉酶活性,并且可以用于进一 步水解已由α-淀粉酶(其也可以是本发明的多肽)部分水解的玉米淀 粉,以产生葡萄糖;并且在本发明的这个过程的方面,葡萄糖通过葡 萄糖异构酶转变成葡萄糖和果糖的混合物。在本发明的这个过程的另 一个方面,使这种混合物富含果糖,以产生高果糖玉米糖浆。在可替 代的方面,本发明的多肽在多糖、寡糖或淀粉至果糖加工的任何步骤 中使用,例如包括4个步骤:颗粒状淀粉的液化,液化多糖、寡糖或 淀粉糖化成右旋糖,纯化和异构化成果糖。使用本发明的至少一种多 肽的本发明的一个方面包含多糖、寡糖或淀粉液化过程,用于将多糖、 寡糖或淀粉聚合物颗粒的浓缩悬浮液转换成低粘度的可溶性较短链长 度的糊精溶液。
本发明还提供了使用本发明的至少一种多肽的酶促液化过程,其 包括将颗粒状多糖、寡糖或淀粉浆的pH调整至待使用的本发明的酶 (例如,本发明的葡糖淀粉酶或淀粉酶)的最佳pH,例如6.0-6.5、 或约5.5-7.0;氢氧化钙、氢氧化钠或碳酸钠可以为了这个目的而加 入(氢氧化钙的添加具有也提供钙离子的优点,所述钙离子已知针对 灭活稳定α-淀粉酶)。在一个方面,在添加本发明的淀粉酶(例如, α-淀粉酶)后,悬浮液通过蒸汽喷嘴进行抽吸,以使温度即刻升高至 80℃-115℃,且使淀粉立即凝胶化,并且由于α-淀粉酶的存在,通过 经由α-淀粉酶的(1-4)糖苷键的随机水解而解聚成容易抽吸的液体 物质。
在关于这个多糖和/或寡糖(例如,淀粉)液化过程的可替代方面, 将本发明的淀粉酶(例如,α-淀粉酶)和/或葡糖淀粉酶加入多糖(例 如,淀粉)悬浮液中,使悬浮液保持于80-100℃,以使颗粒例如淀粉 颗粒部分水解,并且部分水解的多糖/淀粉悬浮液通过喷嘴在超过约 105℃的温度下进行抽吸,以使任何其余的颗粒状结构完全凝胶化。在 凝胶化的多糖/淀粉冷却后,可以进行本发明的葡糖淀粉酶和/或淀粉 酶(例如,α-淀粉酶)的第二次添加,以进一步水解多糖/淀粉。
在一个方面,本发明还提供了编码淀粉酶的和编码葡糖淀粉酶的 核酸,其共同新颖性之处在于它们衍生自混合培养物,例如来自环境 来源。本发明提供了从混合培养物中分离的编码淀粉酶的和编码葡糖 淀粉酶的核酸,其包含在至少约10、15、20、25、30、35、40、45、 50、55、60、65、70、75、100、150、200、250、300、350、400、 450、500、550、600、650、700、750、800、850、900、950、1000、 1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、 1550个或更多残基的区域上,与本发明的示例性核酸具有至少约50 %、51%、52%、53%、54%、55%、56%、57%、58%、59%、60 %、61%、62%、63%、64%、65%、66%、67%、68%、69%、70 %、71%、72%、73%、74%、75%、76%、77%、78%、79%、80 %、81%、82%、83%、84%、85%、86%、87%、88%、89%、90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或更 多、或完全(100%)序列同一性的核酸序列,其中核酸编码具有淀粉 酶和/或葡糖淀粉酶活性的至少一种多肽,并且序列同一性通过用序列 比较算法分析或通过目视检查进行测定。
在一个方面,本发明提供了从混合培养物例如环境来源中分离的 编码淀粉酶和编码葡糖淀粉酶的核酸,其包含本发明的核酸,例如本 发明的示例性核酸,例如如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO: 5、SEQ ID NO:9、SEQ ID NO:11等中所示的序列,及其子序列,例 如长度至少约10、15、20、25、30、35、40、45、50、75、100、150、 200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050、1100、1150、1200、1250、1300、 1350、1400、1450、1500个或更多残基,或在基因或转录物的全长上; 或编码本发明的多肽的核酸。
在一个方面,本发明还提供了编码淀粉酶的和编码葡糖淀粉酶的 核酸,其共同新颖性之处在于它们衍生自环境来源(关于从“未知” 或环境来源中分离的序列例子参见下表1,第2列),例如混合环境 来源。在一个方面,本发明提供了从环境来源例如混合环境来源中分 离的编码淀粉酶的和编码葡糖淀粉酶的核酸,其包含在至少约25、30、 40、50、75、100、150、200、250、300、350、400、450、500、550、 600、650、700、750、800、850、900、950、1000、1050、1100、1150、 1200、1250、1300、1350、1400、1450、1500、1550个或更多残基的 区域上,与本发明的示例性核酸具有至少约50%、51%、52%、53%、 54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、 64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、 74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多、或完全(100%)序列 同一性的核酸序列,其中核酸编码具有淀粉酶和/或葡糖淀粉酶活性的 至少一种多肽,并且序列同一性通过用序列比较算法分析或通过目视 检查进行测定。
在一个方面,本发明提供了从环境来源例如混合环境来源中分离 的编码淀粉酶的和编码葡糖淀粉酶的核酸,其包含本发明的核酸,例 如,如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:9、 SEQ ID NO:11等、SEQ ID NO:583、SEQ ID NO:585中所示的本发 明的示例性核酸,及其子序列,例如长度至少约10、15、20、25、30、 35、40、45、50、75、100、150、200、250、300、350、400、450、 500、550、600、650、700、750、800、850、900、950、1000、1050、 1100、1150、1200、1250、1300、1350、1400、1450、1500个或更多 残基,或在基因或转录物的全长上;或编码本发明的多肽的核酸。
在一个方面,本发明还提供了葡糖淀粉酶和淀粉酶、以及编码淀 粉酶的和编码葡糖淀粉酶的核酸,其共同新颖性之处在于它们衍生自 archael来源,包括本发明的archael衍生的淀粉酶和/或葡糖淀粉酶。
在一个方面,序列比较算法是BLAST版本2.2.2算法,其中过滤 设置设为blastall-pblastp-d″nr pataa″-FF,并且所有其他 选项设为缺省值。
本发明的另一个方面是包括本发明核酸序列,与其基本上相同的 序列,和与其互补的序列的至少10个连续碱基的分离的、合成或重组 核酸。
在一个方面,淀粉酶活性包含α-淀粉酶或β-淀粉酶活性,包括 水解淀粉中的内部α-1,4-糖苷键以产生更小分子量的麦芽糖糊精的 能力。在一个方面,α-淀粉酶活性包括随机水解淀粉中的内部α-1,4- 糖苷键。葡糖淀粉酶和/或淀粉酶活性可以包含α-淀粉酶活性、β- 淀粉酶活性、1,4-α-D-葡聚糖葡糖水解酶活性、外淀粉酶活性、葡聚 糖α-麦芽糖四水解酶(maltotetrahydrolase)活性、麦芽糖酶活性、 异麦芽糖酶活性、葡聚糖1,4,α-葡糖苷酶活性、α-葡糖苷酶活性、 蔗糖酶活性或琼脂糖酶活性(例如,β-琼脂糖酶活性)。
淀粉酶活性可以包含水解糖苷键。在一个方面,糖苷键包含α -1,4-糖苷键。在另一个方面,糖苷键包含α-1,6-糖苷键。在一个方 面,淀粉酶活性包含水解多糖例如淀粉例如液化淀粉中的糖苷键。淀 粉酶活性可以进一步包含将糖苷键水解成麦芽糖糊精。在一个方面, 淀粉酶活性包含从淀粉的非还原末端切割麦芽糖或D-葡萄糖单位。
在一个方面,分离的、合成或重组核酸编码具有热稳定的淀粉酶 和/或葡糖淀粉酶活性的多肽。多肽可以在包含下述温度范围的任何地 方的条件下保留淀粉酶活性:约0℃-约37℃、或约37℃-约95℃或更 多,例如98℃、100℃或更多;约55℃-约85℃、约70℃-约95℃、 或约90℃-约95℃。例如,具有如SEQ ID NO:437中所示序列的示例 性多肽是热稳定的,在不存在添加的钙的情况下,在100℃下25分钟 后保留50%活性。
在另一个方面,分离的、合成或重组核酸编码具有耐热的淀粉酶 和/或葡糖淀粉酶活性的多肽。在暴露于超过37℃-约95℃或超过55 ℃-约85℃范围中的任何地方的温度后,多肽可以保留淀粉酶和/或葡 糖淀粉酶活性。在一个方面,在pH 4.5下在暴露于超过90℃-约95 ℃的温度后,多肽保留淀粉酶和/或葡糖淀粉酶活性。
本发明提供了分离的、合成或重组核酸,其包含在严格条件下与 本发明的核酸杂交的序列,例如本发明的示例性核酸,包含如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO: 11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO: 19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO: 27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO: 35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO: 43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO: 51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO: 59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO: 67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO: 75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO: 81和/或SEQ ID NO:82中所示的序列的核酸,和/或其片段或子序列。 在一个方面,核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽。核酸 可以是长度至少约25、30、40、50、75、100、150、200、250、300、 350、400、450、500、550、600、650、700、750、800、850、900、 950、1000、1050、1100、1150、1200、1250、1300、1350、1400、 1450、1500个或更多残基,或基因或转录物的全长。在一个方面,严 格条件包括包含在0.2X SSC中于约65℃约15分钟的洗涤步骤。在一 个方面,严格条件包含在包含具有0.15M NaCl的缓冲液的条件下于 72℃杂交15分钟。
本发明提供了用于鉴定编码具有淀粉酶和/或葡糖淀粉酶活性的 多肽的核酸的核酸探针,其中探针包含含有本发明序列的序列,或其 片段或子序列的至少约10、15、20、25、30、35、40、45、50、55、 60、65、70、75、80、85、90、95、100、150、200、250、300、350、 400、450、500、550、600、650、700、750、800、850、900、950、 1000个或更多连续碱基,其中探针通过结合或杂交鉴定核酸。探针可 以包含含有本发明序列的序列,或其片段或子序列的至少约10-50、 约20-60、约30-70、约40-80、或约60-100个连续碱基的寡核苷酸。
本发明提供了用于鉴定编码具有淀粉酶和/或葡糖淀粉酶活性的 多肽的核酸的核酸探针,其中探针包含含有至少约10、15、20、25、 30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、 175、200、250、300、350、400、450、500、550、600、650、700、 750、800、850、900、950、1000个或更多残基的序列的核酸,其与 本发明的核酸具有至少约50%、51%、52%、53%、54%、55%、56 %、57%、58%、59%、60%、61%、62%、63%、64%、65%、66 %、67%、68%、69%、70%、71%、72%、73%、74%、75%、76 %、77%、78%、79%、80%、81%、82%、83%、84%、85%、86 %、87%、88%、89%、90%、91%、92%、93%、94%、95%、96 %、97%、98%、99%或更多、或完全(100%)序列同一性,其中序 列同一性通过用序列比较算法分析或通过目视检查进行测定。
探针可以包含含有本发明的核酸序列或其子序列的至少约 10-50、约20-60、约30-70、约40-80、或约60-100个连续碱基的寡 核苷酸。
本发明提供了用于扩增编码具有淀粉酶和/或葡糖淀粉酶活性的 多肽的核酸的扩增引物序列对,其中引物对能够扩增包含本发明序列 或其片段或子序列的核酸。扩增引物序列对的一个或每个成员可以包 含含有序列的至少约10-50个连续碱基的寡核苷酸。
本发明提供了扩增编码具有淀粉酶和/或葡糖淀粉酶活性的多肽 的核酸的方法,其包括用能够扩增本发明的核酸序列或其片段或子序 列的扩增引物序列对来扩增模板核酸。
本发明提供了包含本发明的核酸或其子序列的表达盒(包括,例 如载体和克隆用载体)。在一个方面,表达盒可以包含与启动子可操 作地连接的核酸。启动子可以是病毒、细菌、哺乳动物或植物启动子。 在一个方面,植物启动子可以是马铃薯、稻、玉米、小麦、烟草或大 麦启动子。启动子可以是组成型启动子。组成型启动子可以包含 CaMV35S。在另一个方面,启动子可以是诱导型启动子。在一个方面, 启动子可以是组织特异性启动子或环境调节或发育调节型启动子。因 此,启动子可以是例如种子特异性、叶特异性、根特异性、茎特异性 或脱落诱导型启动子。在一个方面,表达盒可以进一步包含植物或植 物病毒表达载体。在可替代实施方案中,植物启动子是玉米种子胚特 异性:球蛋白启动子(参见例如,Belanger(1991)Molecular basis for allelic polymorphism of the maize Globulin-1 gene.Genetics 129:863-872);或玉米种子胚乳特异性:γ-玉米醇溶蛋白(zein) 启动子(参见例如,Lopes(1995)Identification of two opaque2 modifier loci in Quality Protein Maize.Mol.Gen.Genet.247: 603-613);或稻种子胚乳特异性:GTL1启动子(参见例如,Takaiwa (1991)Analysis of the 5′flanking region responsible for the endosperm-specific expression of arice glutelin chimeric gene in transgenic tobacco.Plant Mol.Biol.16:49-58)。
本发明提供了包含本发明的表达盒(例如,载体)或本发明的核 酸的克隆用载体。克隆用载体可以是病毒载体、质粒、噬菌体、噬菌 粒、粘粒、fosmid、细菌病毒或人工染色体。病毒载体可以包含腺病 毒载体、逆转录病毒载体或腺伴随病毒载体。克隆用载体可以包含细 菌人工染色体(BAC)、质粒、噬菌体P1衍生载体(PAC)、酵母人工 染色体(YAC)、或哺乳动物人工染色体(MAC)。
本发明提供了转化细胞(或“宿主细胞”),其包含本发明的核 酸或本发明的表达盒(例如,载体)、或本发明的克隆用载体。在一 个方面,转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母 细胞、昆虫细胞或植物细胞。在一个方面,植物细胞可以来自任何植 物,例如用于任何动物包括反刍动物的草料和/或饲料的植物,或用作 原料的来源以产生能量或燃料。特别有利的植物可以包括农作物植物 和原料植物,例如玉蜀黍、苜蓿、向日葵、芸苔属(Brassica)、大 豆、棉花、红花、花生、高粱、小麦、燕麦、黑麦、粟、大麦、稻、 针叶树,草例如柳枝稷(Switch grass)和芒属(Miscanthus),豆 类作物,例如豌豆、豆和大豆,淀粉块茎/根,例如马铃薯、甘薯、木 薯、芋头、美人蕉、甜菜、甘蔗等。
本发明提供了包含本发明的核酸或本发明的表达盒(例如,载体) 的转基因非人动物。在一个方面,动物是小鼠。本发明提供了从这些 转基因非人动物中分离的细胞或细胞系。
本发明提供了包含本发明的核酸或本发明的表达盒(例如,载体) 的转基因植物。转基因植物可以是任何植物,但在一个实施方案中, 植物将是用于任何动物的草料和/或饲料,或用作原料以产生能量或燃 料,例如玉蜀黍、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、 高粱、小麦、燕麦、黑麦、粟、大麦、稻、针叶树,草例如柳枝稷和 芒属,豆类作物,例如豌豆、豆和大豆,淀粉块茎/根,例如马铃薯、 甘薯、木薯、芋头、美人蕉、甜菜、甘蔗等。
本发明提供了包含本发明的核酸或本发明的表达盒(例如,载体) 的转基因种子。转基因种子可以来自任何植物,但在一个实施方案中, 植物将是用于任何动物的草料和/或饲料,或用作原料以产生能量或燃 料,例如玉蜀黍、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、 高粱、小麦、燕麦、黑麦、粟、大麦、稻、针叶树,草例如柳枝稷和 芒属,豆类作物,例如豌豆、豆和大豆,淀粉块茎/根,例如马铃薯、 甘薯、木薯、芋头、美人蕉、甜菜、甘蔗等。
任何植物、植物部分、植物组织、植物种子或植物细胞可以用于 稳定地(例如,作为转基因植物、或由其衍生的细胞或细胞系)或瞬 时地引入本发明的核酸;因此本发明提供了包含本发明的核酸和/或多 肽的植物、植物部分、植物组织、植物种子和植物细胞,其中植物可 以是(但不限于)玉米(玉蜀黍(Zea mays))、芸苔属物种(例如 欧洲油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea)), 包括用作种子油来源的那些芸苔属物种,例如低芥酸菜子、苜蓿(紫 花苜蓿(Medicago sativa))、稻(水稻(Oryza sativa))、黑麦 (黑麦(Secale cereale))、高粱(双色高粱(Sorghum bicolor)、 高粱(Sorghum vulgare))、栗(例如珍珠栗(珍珠栗(Pennisetum glaucum))、黍(黍(Panicum miliaceum))、谷子(谷子(Setaria italica))、穇子(穇子(Eleusine coracana)))、向日葵(向 日葵(Helianthus annuus))、红花(红花(Carthamus tinctorius))、 小麦(小麦(Triticum aestivum))、大豆(大豆(Glycine max))、 烟草(烟草(Nicotiana tabacum))、马铃薯(马铃薯(Solanum tuberosum))、花生(花生(Arachis hypogaea))、棉花(海岛棉 (Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘 薯(甘薯(Ipomoea batatus))、木薯(木薯(Manihot esculenta))、 咖啡(咖啡属物种(Cofea spp.))、椰子(椰子(Cocos nucifera))、 菠萝(菠萝(Ananas comosus))、柑橘树(柑橘属物种(Citrus spp.))、 可可(可可(Theobroma cacao))、茶(山茶(Camellia sinensis))、 香蕉(芭蕉属物种(Musa spp.))、鳄梨(鳄梨(Persea americana))、 无花果(无花果(Ficus casica))、番石榴(番石榴(Psidium guajava))、 芒果(芒果(Mangifera indica))、橄榄(橄榄(Olea europaea))、 番木瓜(番木瓜(Carica papaya))、腰果(腰果(Anacardium occidentale))、澳洲坚果(澳洲坚果(Macadamia integrifolia))、 杏仁(杏仁(Prunus amygdalus))、甜菜(甜菜属物种(Beta sp.), 例如甜菜(Beta vulgaris))、甘蔗(甘蔗属物种(Saccharum spp.))、 须芒草族(Andropogoneae)(草)、藜科(Chenopodiaceae)(有花 植物)、燕麦、大麦、蔬菜、观赏植物和针叶树;以及蔬菜,例如番 茄(番茄(Lycopersicon esculentum))、莴苣(例如莴苣(Lactuca sativa))、菜豆(菜豆(Phaseolus vulgaris))、利马豆(利马 豆(Phaseolus limensis))、豌豆(香豌豆属物种(Lathyruss pp.)), 和甜瓜属(Cucumis)成员例如黄瓜(黄瓜(C.sativus))、甜瓜(甜 瓜(C.cantalupensis))、和香瓜(香瓜(C.melo));和观赏植 物,包括杜鹃花(杜鹃花属物种(Rhododendron spp.))、绣球花(绣 球花(Macrophylla hydrangea))、木槿((Hibiscus rosasanensis))、 玫瑰(蔷薇属物种(Rosa spp.))、郁金香(郁金香属物种(Tulipa spp.))、水仙花(水仙属物种(Narcissus spp.))、牵牛花(矮 牵牛(Petunia hybrida))、康乃馨(康乃馨(Dianthus caryophyllus))、一品红(一品红(Euphorbia pulcherrima))、 美人蕉(美人蕉属物种(Cannaceae spp.))和菊花;以及可以使用 的针叶树,包括例如松树例如火炬松(火炬松(Pinus taeda))、湿 地松(湿地松(Pinus elliotii))、美国黄松(美国黄松(Pinus ponderosa))、扭叶松(扭叶松(Pinus contorta))、和辐射松(辐 射松(Pinus radiata))、花旗松(花旗松(Pseudotsuga menziesii)); 加拿大铁杉(加拿大铁杉(Tsuga canadensis));北美云杉(北美 云杉(Picea glauca));红杉(红杉(Sequoia sempervirens)); 真正的冷杉例如银杉(冷杉(Abies amabilis))和香脂冷杉(香脂 冷杉(Abies balsamea));和雪松例如西部红松(西部红松(Thuja plicata))和黄扁柏(黄扁柏(Chamaecyparis nootkatensis)); 和豆科植物,包括但不限于,豆和豌豆,其中在可替代方面豆可以包 括瓜尔豆、刺槐豆、葫芦巴、大豆、菜豆、豇豆、绿豆、利马豆、蚕 豆、小扁豆、鹰嘴豆等,并且豆类可以包括但不限于花生属例如花生, 蚕豆属例如小冠花、毛苕子、赤豆、绿豆和鹰嘴豆,羽扇豆属例如羽 扇豆,三叶草属,菜豆属例如刀豆和利马豆,豌豆属例如芸豆,草木 犀属例如三叶草,苜蓿属例如苜蓿,莲属例如车轴草,兵豆属例如小 扁豆和紫穗槐;还包括草料和草地草,例如苜蓿、柳枝稷(柳枝稷 (Panicum virgatum))、芒属、果园草、高羊茅、多年生黑麦草、 匍匐性本特草和小糠草。
在可替代方面,包含本发明的核酸和/或多肽的植物、植物部分、 植物组织、植物种子和植物细胞还包括农作物植物和用于产生能量或 燃料(例如乙醇或其他生物燃料,例如生物乙醇、生物丙醇、生物丁 醇或生物柴油)的植物,例如玉米、苜蓿、向日葵、芸苔属、大豆、 棉花、红花、花生、高粱、小麦、燕麦、黑麦、栗、大麦、稻、针叶 树、草例如柳枝稷和芒属、豆类作物例如豌豆、豆和大豆、淀粉块茎/ 根例如马铃薯、甘薯、木薯、芋头、美人蕉、甘蔗和/或甜菜等。
本发明提供了反义寡核苷酸,其包含与本发明的核酸互补、或在 严格条件下能够与本发明的核酸杂交的核酸序列。本发明提供了抑制 细胞中的淀粉酶信使的翻译的方法,其包括给细胞施用反义寡核苷酸 或在细胞中表达反义寡核苷酸,所述反义寡核苷酸包含与本发明的核 酸互补、或在严格条件下能够与本发明的核酸杂交的核酸序列。
本发明提供了包含氨基酸序列的分离的、合成或重组多肽,其包 含在至少约10、15、20、25、30、35、40、45、50、55、60、65、70、 75、80、90、100、125、150、175、200、250、300、350、400、450、 500、550、600、650、700、750、800、850、900、950、1000、1050、 1100、1150、1200、1250、1300、1350、1400、1450、1500、1550个 或更多残基的区域上,或在多肽的全长上与本发明的示例性多肽或肽 具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58 %、59%、60%、61%、62%、63%、64%、65%、66%、67%、68 %、69%、70%、71%、72%、73%、74%、75%、76%、77%、78 %、79%、80%、81%、82%、83%、84%、85%、86%、87%、88 %、89%、90%、91%、92%、93%、94%、95%、96%、97%、98 %、99%或更多、或完全(100%)序列同一性,并且序列同一性通过 用序列比较算法分析或通过目视检查进行测定。本发明的示例性多肽 或肽序列包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO: 18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO: 26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO: 34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO: 42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO: 50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO: 58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO: 66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO: 74、SEQ ID NO:76和/或SEQ ID NO:78,和/或其子序列及其变体, 例如长度至少约10、15、20、25、30、35、40、45、50、75、100、 150、200、250、300、350、400、450、500、550、600、650、700、 750、800、850、900、950、1000、1050、1100、1150、1200、1250、 1300、1350、1400、1450、1500个或更多残基,或在酶的全长上。本 发明的示例性多肽或肽序列包括由本发明的核酸编码的序列。本发明 的示例性多肽或肽序列包括由本发明的抗体特异性结合的多肽或肽。 在一个方面,本发明的多肽具有至少一种淀粉酶活性,例如α淀粉酶 活性。
在可替代实施方案中,本发明的多肽缺乏信号序列(前导序列) 和/或碳水化合物结合组件。在可替代实施方案中,本发明的多肽进一 步包含一种或多种异源序列,其可以包含异源信号序列(前导序列)、 异源催化结构域(CD)(即,活性位点)、或异源碳水化合物结合组 件、或表位、纯化标签或标记。在一个方面,异源信号序列、异源碳 水化合物结合组件或异源催化结构域(CD)衍生自另一种淀粉酶(除 本发明的酶以外的淀粉酶),或衍生自非淀粉酶。
在可替代实施方案中,本发明的多肽具有淀粉酶活性,或可以用 于产生与本发明的示例性多肽(例如,SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、 SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、 SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、 SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、 SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、 SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、 SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76和/或SEQ ID NO: 78)特异性结合的抗体。
在可替代实施方案中,本发明的多肽可以是合成的或以拟肽形式。
本发明的另一个方面是分离的、合成或重组多肽或肽,其包括本 发明的多肽或肽序列,与其基本上相同的序列,和与其互补的序列的 至少10、15、20、25、30、35、40、45、50、75、100、125、150、 175、200、225、250、300、350、400、450或500个或更多连续氨基 酸残基。
在一个方面,本发明的多肽或肽的淀粉酶活性包含α-淀粉酶活 性,包括水解淀粉中的内部α-1,4-糖苷键以产生更小分子量的麦芽糖 糊精的能力。在一个方面,α-淀粉酶活性包括随机水解淀粉中的内部 α-1,4-糖苷键。淀粉酶活性可以包含葡糖淀粉酶活性、1,4-α-D-葡 聚糖葡糖水解酶活性、α-淀粉酶活性、外淀粉酶活性、或β-淀粉酶 活性。淀粉酶活性可以包含水解糖苷键。在一个方面,糖苷键包含α -1,4-糖苷键。在另一个方面,糖苷键包含α-1,6-糖苷键。在一个方 面,淀粉酶活性包含水解淀粉例如液化淀粉中的糖苷键。淀粉酶活性 可以进一步包含将糖苷键水解成麦芽糖糊精。在一个方面,淀粉酶活 性包含从淀粉的非还原末端切割麦芽糖或D-葡萄糖单位。
在一个方面,本发明的淀粉酶活性包含葡糖淀粉酶活性,其可以 包含糖苷键的水解的催化。本发明的葡糖淀粉酶活性可以包含催化D- 葡萄糖从淀粉或其他相关糊精的非还原末端的逐步水解释放。葡糖淀 粉酶活性可以包含1,4-α-D-葡聚糖葡糖水解酶活性。葡糖淀粉酶活 性可以包含麦芽糖糊精的水解的催化,导致游离葡萄糖的产生。葡糖 淀粉酶活性可以包含外淀粉酶活性。葡糖淀粉酶活性可以包含α-淀粉 酶活性或β-淀粉酶活性。水解的糖苷键可以包含α-1,4-糖苷键或α -1,6-糖苷键。葡糖淀粉酶活性可以包含水解淀粉中的糖苷键。葡糖淀 粉酶活性可以进一步包含水解淀粉中的糖苷键,以产生麦芽糖糊精。 葡糖淀粉酶活性可以包含从淀粉的非还原末端切割麦芽糖或D-葡萄 糖单位。
在一个方面,淀粉酶和/或葡糖淀粉酶活性可以是热稳定的。多肽 在包含下述温度范围的条件下可以保留淀粉酶和/或葡糖淀粉酶活性: 约37℃-约95℃、约55℃-约85℃、约70℃-约95℃、或约90℃-约 95℃。在另一个方面,淀粉酶和/或葡糖淀粉酶活性可以是耐热的。在 暴露于超过37℃-约95℃或超过55℃-约85℃范围中的任何地方的温 度后,多肽可以保留淀粉酶和/或葡糖淀粉酶活性。在一个方面,在 pH 4.5下在暴露于超过90℃-约95℃的温度后,多肽可以保留淀粉酶 和/或葡糖淀粉酶活性。
在一个方面,淀粉酶和/或葡糖淀粉酶活性是热稳定的,例如其中 多肽在包含下述温度范围的条件下保留淀粉酶和/或葡糖淀粉酶活性: 约-100℃-约-80℃、约-80℃-约-40℃、约-40℃-约-20℃、约-20℃- 约0℃、约0℃-约5℃、约5℃-约15℃、约15℃-约25℃、约25℃- 约37℃、约37℃-约45℃、约45℃-约55℃、约55℃-约70℃、约70 ℃-约75℃、约75℃-约85℃、约85℃-约90℃、约90℃-约95℃、 约95℃-约100℃、约100℃-约105℃、约105℃-约110℃、约110℃ -约120℃或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、 103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111 ℃、112℃、113℃、114℃、115℃或更高。在某些实施方案中,在上 文描述的温度范围下,在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、 约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、 约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、 约pH 11.0、约pH 11.5、约pH 12.0或更高下,根据本发明的热稳定 的多肽保留活性,例如淀粉酶活性和/或葡糖淀粉酶活性。
在一个方面,淀粉酶和/或葡糖淀粉酶活性是耐热的,例如其中多 肽在暴露于下述温度范围后保留淀粉酶和/或葡糖淀粉酶活性:约-100 ℃-约-80℃、约-80℃-约-40℃、约-40℃-约-20℃、约-20℃-约0℃、 约0℃-约5℃、约5℃-约15℃、约15℃-约25℃、约25℃-约37℃、 约37℃-约45℃、约45℃-约55℃、约55℃-约70℃、约70℃-约75 ℃、约75℃-约85℃、约85℃-约90℃、约90℃-约95℃、约95℃- 约100℃、约100℃-约105℃、约105℃-约110℃、约110℃-约120 ℃或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、 104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112 ℃、113℃、114℃、115℃或更高。在暴露于约-100℃-约-80℃、约-80 ℃-约-40℃、约-40℃-约-20℃、约-20℃-约0℃、约0℃-约5℃、约 5℃-约15℃、约15℃-约25℃、约25℃-约37℃、约37℃-约45℃、 约45℃-约55℃、约55℃-约70℃、约70℃-约75℃、约75℃-约85 ℃、约85℃-约90℃、约90℃-约95℃、约95℃-约100℃、约100℃ -约105℃、约105℃-约110℃、约110℃-约120℃或95℃、96℃、97 ℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106 ℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、 115℃或更高的温度后,根据本发明的耐热的多肽可以保留活性,例如 淀粉酶活性和/或葡糖淀粉酶活性。在某些实施方案中,在暴露于上文 描述的温度范围后,在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、 约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、 约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、 约pH 11.0、约pH 11.5、约pH 12.0或更高下,根据本发明的耐热的 多肽保留活性,例如淀粉酶活性和/或葡糖淀粉酶活性。
在一个方面,在包含约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5、 pH 4.0、pH 3.5、pH 3.0或更低(更酸性)pH的酸性条件下,由本发 明的核酸编码的多肽的淀粉酶活性和/或葡糖淀粉酶活性保留活性,或 在暴露于包含约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5、pH 4.0、pH 3.5、pH 3.0或更低(更酸性)pH的酸性条件后,保留淀粉酶活性和/ 或葡糖淀粉酶活性;或在包含约pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、  pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更高 (更碱性)的碱性条件下保留活性,或在暴露于包含约pH 7、pH 7.5 pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、 pH 12、pH 12.5或更高(更碱性)的碱性条件下,保留淀粉酶活性和 /或葡糖淀粉酶活性。在一个方面,在至少约80℃、81℃、82℃、83 ℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、 93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102 ℃、103℃、103.5℃、104℃、105℃、107℃、108℃、109℃或110℃ 或更高的温度下,和至少约pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、 pH 10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更高(更碱性) 的碱性pH下,由本发明的核酸编码的多肽的淀粉酶活性和/或葡糖淀 粉酶活性保留活性。
在一个方面,分离的、合成或重组多肽可以包含缺乏信号序列的 本发明的多肽。在一个方面,分离的、合成或重组多肽可以包含含有 异源信号序列的本发明的多肽,例如异源淀粉酶或非淀粉酶信号序列。
在一个方面,本发明提供了包含如表1中所示的肽的信号序列。 在一个方面,本发明提供了由包含表1中所示的肽的信号序列。在一 个方面,本发明提供了嵌合蛋白质,其包含含有本发明的信号序列的 第一结构域和至少第二结构域。蛋白质可以是融合蛋白。第二结构域 可以包含酶。酶可以是任何葡糖淀粉酶和/或淀粉酶(例如,本发明的 葡糖淀粉酶或淀粉酶,或另一种淀粉酶或葡糖淀粉酶)。
在一个方面,本发明的酶的酶促活性(例如葡糖淀粉酶和/或淀粉 酶活性)包含在约37℃下约1-约1200单位/毫克蛋白质、或约100- 约1000单位/毫克蛋白质的比活性。在另一个方面,本发明的酶的酶 促活性(例如葡糖淀粉酶和/或淀粉酶活性)包含约100-约1000单位 /毫克蛋白质、或约500-约750单位/毫克蛋白质的比活性。可替代地, 本发明的酶的酶促活性(例如葡糖淀粉酶和/或淀粉酶活性)包含在约 37℃下约1-约750单位/毫克蛋白质、或约500-约1200单位/毫克蛋 白质的比活性。在一个方面,本发明的酶的酶促活性(例如葡糖淀粉 酶和/或淀粉酶活性)包含在约37℃下约1-约500单位/毫克蛋白质、 或约750-约1000单位/毫克蛋白质的比活性。在另一个方面,本发明 的酶的酶促活性(例如葡糖淀粉酶和/或淀粉酶活性)包含在约37℃ 下约1-约250单位/毫克蛋白质的比活性。可替代地,本发明的酶的 酶促活性(例如葡糖淀粉酶和/或淀粉酶活性)包含在约37℃下约1- 约100单位/毫克蛋白质的比活性。在另一个方面,耐热性包含在加热 至升高的温度后保留本发明的酶的酶促活性(例如葡糖淀粉酶和/或淀 粉酶活性)于37℃的至少一半比活性,例如约0℃-约20℃、约20℃- 约37℃、约37℃-约50℃、约50℃-约70℃、约70℃-约75℃、约75 ℃-约80℃、约80℃-约85℃、约85℃-约90℃、约90℃-约95℃、 约95℃-约100℃、约100℃-约110℃或更高。可替代地,耐热性可以 包含在加热至升高的温度后保留约1-约1200单位/毫克蛋白质、或约 500-约1000单位/毫克蛋白质的于37℃的比活性。在另一个方面,如 上所述,耐热性可以包含在加热至升高的温度后保留约1-约500单位 /毫克蛋白质的于37℃的比活性。
本发明提供了本发明的分离的、合成或重组多肽,其中多肽包含 至少一个糖基化位点。在一个方面,糖基化可以是N联糖基化。在一 个方面,多肽在巴斯德毕赤酵母(P.pastoris)或栗酒裂殖酵母(S. pombe)中表达后可以是糖基化的。本发明还提供了翻译后或以化学方 法给多肽添加糖基化的方法,以改变多肽的性质,例如其热稳定性、 溶解性、聚集的趋势等。
在一个方面,在包含约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5、 pH 4.0、pH 3.5、pH 3.0或更低(更酸性)pH的条件下,多肽可以保 留本发明的酶的酶促活性(例如,葡糖淀粉酶和/或淀粉酶活性)。在 另一个方面,在包含约pH 7、pH 7.5 pH 8.0、pH 8.5、pH 9、pH 9.5、 pH 10、pH 10.5、pH 11.0、pH 11.5、pH 12、pH 12.5或更高(更碱 性)pH的条件下,多肽可以保留本发明的酶的酶促活性(例如,葡糖 淀粉酶和/或淀粉酶活性)。在一个方面,在暴露于包含pH 6.5、pH 6、 pH 5.5、pH 5、pH 4.5、pH 4.0、pH 3.5、pH 3.0或更低(更酸性) pH的条件后,多肽可以保留本发明的酶的酶促活性(例如,葡糖淀粉 酶和/或淀粉酶活性)。在另一个方面,在暴露于包含pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11.0、pH 11.5、 pH 12、pH 12.5或更高(更碱性)pH的条件下,多肽可以保留本发明 的酶的酶促活性(例如,葡糖淀粉酶和/或淀粉酶活性)。
本发明提供了包含本发明的多肽的蛋白质制剂,其中蛋白质制剂 包含液体、固体或凝胶。
本发明提供了包含本发明的多肽和第二结构域的异二聚体。在一 个方面,第二结构域可以是多肽,和异二聚体可以是融合蛋白。在一 个方面,第二结构域可以是表位或标记。在一个方面,本发明提供了 包含本发明的多肽的同二聚体。
本发明提供了具有淀粉酶和/或葡糖淀粉酶活性的固定多肽,其中 所述多肽包含本发明的多肽、由本发明的核酸编码的多肽、或包含本 发明的多肽和第二结构域的多肽。在一个方面,多肽可以固定在细胞、 金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠、凝胶、 板、阵列或毛细管上。
本发明提供了包含本发明的固体核酸的阵列。本发明提供了包含 本发明的抗体的阵列。
本发明提供了分离的、合成或重组抗体,其与本发明的多肽或由 本发明的核酸编码的多肽特异性结合。抗体可以是单克隆或多克隆抗 体。本发明提供了包含本发明的抗体的杂交瘤,所述抗体例如与本发 明的多肽或由本发明的核酸编码的多肽特异性结合的抗体。
本发明提供了用于动物的食物补充剂,其包含本发明的多肽,例 如由本发明的核酸编码的多肽。在一个方面,食物补充剂中的多肽可 以是糖基化的。本发明提供了可食用的酶递送基质,其包含本发明的 多肽,例如由本发明的核酸编码的多肽。在一个方面,递送基质包含 丸剂。在一个方面,多肽可以是糖基化的。在一个方面,淀粉酶活性 是耐热的。在一个方面,淀粉酶活性是热稳定的。
本发明提供了分离或鉴定具有淀粉酶和/或葡糖淀粉酶活性的多 肽的方法,其包括步骤:(a)提供本发明的抗体;(b)提供包含多 肽的样品;和(c)在其中所述抗体可以与所述多肽特异性结合的条件 下,使步骤(b)的样品与步骤(a)的抗体接触,从而分离或鉴定具 有淀粉酶和/或葡糖淀粉酶活性的多肽。
本发明提供了制备抗淀粉酶抗体的方法,其包括以足以产生体液 免疫应答的量给非人动物施用本发明的核酸或本发明的多肽或其子序 列,从而制备抗淀粉酶或抗葡糖淀粉酶抗体。本发明提供了形成抗葡 糖淀粉酶和/或抗淀粉酶免疫的方法,其包括以足以产生免疫应答的量 给非人动物施用本发明的核酸或本发明的多肽或其子序列。
本发明提供了生产重组多肽的方法,其包括步骤:(a)提供与启 动子可操作地连接的本发明的核酸;和(b)在允许多肽表达的条件下 表达步骤(a)的核酸,从而生产重组多肽。在一个方面,该方法可以 进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的 核酸,从而在转化细胞中生产重组多肽。
本发明提供了用于鉴定具有淀粉酶和/或葡糖淀粉酶活性的多肽 的方法,其包括下述步骤:(a)提供本发明的多肽;或由本发明的核 酸编码的多肽;(b)提供淀粉酶底物;和(c)使步骤(a)的多肽或 其片段或变体与步骤(b)的底物接触,并且检测底物量的减少或反应 产物量的增加,其中底物量的减少或反应产物量的增加检测具有淀粉 酶和/或葡糖淀粉酶活性的多肽。在一个方面,底物可以是多糖、寡糖 或淀粉,例如液化淀粉。
本发明提供了用于鉴定淀粉酶或葡糖淀粉酶底物的方法,其包括 下述步骤:(a)提供本发明的多肽;或由本发明的核酸编码的多肽; (b)提供测试底物;和(c)使步骤(a)的多肽与步骤(b)的测试 底物接触,并且检测底物量的减少或反应产物量的增加,其中底物量 的减少或反应产物量的增加鉴定测试底物为淀粉酶或葡糖淀粉酶底 物。
本发明提供了测定测试化合物是否与多肽特异性结合的方法,其 包括下述步骤:(a)在允许核酸翻译成多肽的条件下表达核酸或包含 所述核酸的载体,其中所述核酸包含本发明的核酸,或提供本发明的 多肽;(b)提供测试化合物;(c)使多肽与测试化合物接触;和(d) 测定步骤(b)的测试化合物是否与多肽特异性结合。
本发明提供了用于鉴定淀粉酶或葡糖淀粉酶活性的调节剂的方 法,其包括下述步骤:(a)提供本发明的多肽或由本发明的核酸编码 的多肽;(b)提供测试化合物;(c)使步骤(a)的多肽与步骤(b) 的测试化合物接触,并且测量淀粉酶或葡糖淀粉酶活性,其中与在不 存在测试化合物的情况下的活性比较,在测试化合物的存在下测量的 淀粉酶或葡糖淀粉酶活性的改变提供了测试化合物调节淀粉酶或葡糖 淀粉酶活性的测定。在一个方面,淀粉酶或葡糖淀粉酶活性通过下述 进行测量:提供淀粉酶或葡糖淀粉酶底物,并且检测底物量的减少或 反应产物量的增加,或者底物量的增加或反应产物量的减少。与不含 测试化合物的底物或反应产物量比较,底物量的减少或反应产物量的 增加鉴定测试化合物为淀粉酶或葡糖淀粉酶活性的活化剂。与不含测 试化合物的底物或反应产物量比较,底物量的增加或反应产物量的减 少鉴定测试化合物为淀粉酶或葡糖淀粉酶活性的抑制剂。
本发明提供了包含处理器和数据存储设备的计算机系统,其中所 述数据存储设备已在其上储存本发明的多肽序列或核酸序列(例如, 由本发明的核酸编码的多肽)。在一个方面,计算机系统可以进一步 包含序列比较算法和具有在其上储存的至少一种参考序列的数据存储 设备。在另一个方面,序列比较算法包含指示多态性的计算机程序。 在一个方面,计算机系统可以进一步包含鉴定所述序列中的一个或多 个特征的鉴别器。本发明提供了在其上已储存本发明的多肽序列或核 酸序列的计算机可读介质。本发明提供了用于鉴定序列中的特征的方 法,其包括步骤:(a)使用鉴定序列中的一个或多个特征的计算机程 序阅读序列,其中所述多肽序列包含本发明的多肽序列或核酸序列; 和(b)用计算机程序鉴定序列中的一个或多个特征。本发明提供了用 于比较第一序列与第二序列的方法,其包括步骤:(a)通过使用比较 序列的计算机程序阅读第一序列和第二序列,其中第一序列包含本发 明的多肽序列或核酸序列;和(b)用计算机程序测定第一序列和第二 序列之间的差异。测定第一序列和第二序列之间的差异的步骤可以进 一步包括鉴定多态性的步骤。在一个方面,该方法可以进一步包括鉴 定序列中的一个或多个特征的鉴别器。在另一个方面,该方法可以包 括使用计算机程序阅读第一序列,和鉴定序列中的一个或多个特征。
本发明提供了用于从环境样品中分离或回收核酸的方法,所述核 酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽,所述方法包括步骤: (a)提供用于扩增核酸的扩增引物序列对,所述核酸编码具有淀粉酶 和/或葡糖淀粉酶活性的多肽,其中引物对能够扩增本发明的核酸;(b) 从环境样品中分离核酸,或处理环境样品,从而使得样品中的核酸可 用于与扩增引物对杂交;和,(c)使步骤(b)的核酸与步骤(a)的 扩增引物对组合,且扩增来自环境样品的核酸,从而从环境样品中分 离或回收核酸,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多 肽。扩增引物序列对的一个或每个成员可以包含含有本发明的序列的 至少约10-50个连续碱基的寡核苷酸。
本发明提供了用于从环境样品中分离或回收核酸的方法,所述核 酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽,所述方法包括步骤: (a)提供包含本发明的核酸或其子序列的多核苷酸探针;(b)从环 境样品中分离核酸,或处理环境样品,从而使得样品中的核酸可用于 与步骤(a)的多核苷酸探针杂交;(c)使步骤(b)的分离的核酸或 处理的环境样品与步骤(a)的多核苷酸探针组合;和(d)分离与步 骤(a)的多核苷酸探针特异性杂交的核酸,从而从环境样品中分离或 回收核酸,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽。环 境样品可以包含水样品、液体样品、土壤样品、空气样品或生物样品。 在一个方面,生物样品可以衍生自细菌细胞、原生动物细胞、昆虫细 胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。
本发明提供了产生核酸的变体的方法,所述核酸编码具有淀粉酶 和/或葡糖淀粉酶活性的多肽,所述方法包括步骤:(a)提供包含本 发明的核酸的模板核酸;和(b)在模板序列中修饰、缺失或添加一个 或多个核苷酸,或其组合,以产生模板核酸的变体。在一个方面,该 方法可以进一步包括表达变体核酸,以产生变体淀粉酶和/或葡糖淀粉 酶多肽。修饰、缺失或添加可以通过下述方法引入:易错PCR、改组、 寡核苷酸定向的诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱 变、递归总体诱变、指数总体诱变、位点特异性诱变、基因重新装配、 基因位点饱和诱变(GSSM)、合成连接重新装配(SLR)及其组合。在 另一个方面,修饰、缺失或添加通过下述方法引入:重组、递归序列 重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双链体 诱变、点错配修复诱变、修复缺陷型宿主菌株诱变、化学诱变、辐射 产生的诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因 合成、总体诱变、嵌合核酸多聚体产生及其组合。
在一个方面,该方法可以反复重复直至产生淀粉酶或葡糖淀粉酶, 其具有与由模板核酸编码的多肽不同的改变或不同的活性、或者改变 或不同的稳定性。在一个方面,变体淀粉酶或葡糖淀粉酶多肽是耐热 的,并且在暴露于升高的温度后保留一定活性。在另一个方面,与由 模板核酸编码的淀粉酶或葡糖淀粉酶比较,变体淀粉酶或葡糖淀粉酶 多肽具有增加的糖基化。可替代地,变体淀粉酶或葡糖淀粉酶多肽在 高温下具有淀粉酶或葡糖淀粉酶活性,其中由模板核酸编码的淀粉酶 或葡糖淀粉酶在高温是无活性的。在一个方面,该方法可以反复重复 直至产生淀粉酶或葡糖淀粉酶编码序列,其具有与模板核酸不同的改 变的密码子使用。在另一个方面,该方法可以反复重复直至产生淀粉 酶或葡糖淀粉酶基因,其具有与模板核酸不同的更高或更低水平的信 使表达或稳定性。
本发明提供了用于修饰核酸中的密码子以增强其在宿主细胞中的 表达的方法,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽, 所述方法包括下述步骤:(a)提供编码具有淀粉酶和/或葡糖淀粉酶 活性的多肽的本发明的核酸;和,(b)鉴定步骤(a)的核酸中的非 优选或较不优选的密码子,且用编码相同氨基酸的优选或中立使用的 密码子作为替换密码子替换它,其中优选密码子是在宿主细胞的基因 中的编码序列中过度表现的密码子,并且非优选或较不优选的密码子 是在宿主细胞的基因中的编码序列中表现不足的密码子,从而修饰核 酸以增强其在宿主细胞中的表达。
本发明提供了用于修饰编码淀粉酶和/或葡糖淀粉酶多肽的核酸 中的密码子的方法;所述方法包括下述步骤:(a)提供本发明的核酸; 和,(b)鉴定步骤(a)的核酸中的密码子,且用编码相同氨基酸的 不同密码子作为替换密码子替换它,从而修饰编码淀粉酶或葡糖淀粉 酶的核酸中的密码子。
本发明提供了用于修饰核酸中的密码子以增强其在宿主细胞中的 表达的方法,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽, 所述方法包括下述步骤:(a)提供编码淀粉酶或葡糖淀粉酶多肽的本 发明的核酸;和,(b)鉴定步骤(a)的核酸中的非优选或较不优选 的密码子,且用编码相同氨基酸的优选或中立使用的密码子作为替换 密码子替换它,其中优选密码子是在宿主细胞的基因中的编码序列中 过度表现的密码子,并且非优选或较不优选的密码子是在宿主细胞的 基因中的编码序列中表现不足的密码子,从而修饰所述核酸以增强其 在宿主细胞中的表达。
本发明提供了用于修饰核酸中的密码子以减少其在宿主细胞中的 表达的方法,所述核酸编码具有淀粉酶和/或葡糖淀粉酶活性的多肽, 所述方法包括下述步骤:(a)提供本发明的核酸;和(b)鉴定步骤 (a)的核酸中的至少一个优选密码子,且用编码相同氨基酸的非优选 或较不优选的密码子作为替换密码子替换它,其中优选密码子是在宿 主细胞的基因中的编码序列中过度表现的密码子,并且非优选或较不 优选的密码子是在宿主细胞的基因中的编码序列中表现不足的密码 子,从而修饰所述核酸以减少其在宿主细胞中的表达。在一个方面, 宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细 胞或哺乳动物细胞。
本发明提供了用于生产核酸文库的方法,所述核酸编码多个经修 饰的淀粉酶或葡糖淀粉酶活性位点或底物结合位点,其中所述经修饰 的活性位点或底物结合位点衍生自包含编码第一活性位点或第一底物 结合位点的序列的第一核酸,所述方法包括下述步骤:(a)提供编码 第一活性位点或第一底物结合位点的第一核酸,其中所述第一核酸序 列包含在严格条件下与本发明的核酸杂交的序列,并且所述核酸编码 淀粉酶或葡糖淀粉酶活性位点或淀粉酶或葡糖淀粉酶底物结合位点; (b)提供在第一核酸中在多个靶向密码子处编码天然存在的氨基酸变 体的一组诱变寡核苷酸;和,(c)使用该组诱变寡核苷酸以产生一组 编码活性位点的或编码底物结合位点的变体核酸,其编码在诱变的每 个氨基酸密码子处的一系列氨基酸变化,从而生产编码多个经修饰的 淀粉酶或葡糖淀粉酶活性位点或底物结合位点的核酸文库。在一个方 面,该方法包括通过下述方法使步骤(a)的第一核酸诱变:优化定向 进化系统、基因位点饱和诱变(GSSM)、或合成连接重新装配(SLR)、 易错PCR、改组、寡核苷酸定向的诱变、装配PCR、有性PCR诱变、体 内诱变、盒式诱变、递归总体诱变、指数总体诱变、位点特异性诱变、 基因重新装配、基因位点饱和诱变(GSSM)、合成连接重新装配(SLR) 及其组合。在另一个方面,该方法包括通过下述方法使步骤(a)的第 一核酸或变体诱变:重组、递归序列重组、硫代磷酸酯修饰的DNA诱 变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺 陷型宿主菌株诱变、化学诱变、辐射产生的诱变、缺失诱变、限制- 选择诱变、限制-纯化诱变、人工基因合成、总体诱变、嵌合核酸多聚 体产生及其组合。
本发明提供了用于制备小分子的方法,其包括下述步骤:(a)提 供能够合成或修饰小分子的多种生物合成酶,其中所述酶之一包含由 本发明的核酸编码的淀粉酶或葡糖淀粉酶;(b)提供步骤(a)的至 少一种酶的底物;和(c)使步骤(b)的底物与所述酶在有利于多种 生物催化反应的条件下反应,以通过一系列生物催化反应产生小分子。 本发明提供了用于修饰小分子的方法,其包括下述步骤:(a)提供淀 粉酶或葡糖淀粉酶,其中所述酶包含本发明的多肽、或由本发明的核 酸编码的多肽、或其子序列;(b)提供小分子;和(c)使步骤(a) 的酶与步骤(b)的小分子在有利于由淀粉酶或葡糖淀粉酶催化的酶促 反应的条件下反应,从而通过淀粉酶或葡糖淀粉酶的酶促反应修饰小 分子。在一个方面,该方法可以包括关于步骤(a)的酶的多种小分子 底物,从而产生通过至少一种酶促反应生产的经修饰的小分子文库, 所述酶促反应由淀粉酶或葡糖淀粉酶催化。在一个方面,该方法可以 包括多种另外的酶,在有利于经由所述酶的多种生物催化反应的条件 下,以形成通过多种酶促反应生产的经修饰的小分子文库。在另一个 方面,该方法可以进一步包括测试文库的步骤,以测定显示所需活性 的特定经修饰的小分子是否存在于文库内。测试文库的步骤可以进一 步包括系统地消除在文库内除了一个以外的所有生物催化反应的步 骤,所述生物催化反应用于生产多个经修饰的小分子的部分,这是通 过就具有所需活性的特定经修饰的小分子的存在或不存在测试经修饰 的小分子的部分,并且鉴定生产具有所需活性的特定经修饰的小分子 的至少一种特异性生物催化反应来完成的。
本发明提供了用于测定淀粉酶或葡糖淀粉酶的功能片段的方法, 其包括步骤:(a)提供淀粉酶或葡糖淀粉酶,其中所述酶包含本发明 的多肽、或由本发明的核酸编码的多肽、或其子序列;和(b)使来自 步骤(a)的序列的多个氨基酸残基缺失,且就淀粉酶或葡糖淀粉酶活 性测试其余子序列,从而测定淀粉酶或葡糖淀粉酶的功能片段。在一 个方面,淀粉酶或葡糖淀粉酶活性通过下述进行测量:提供淀粉酶或 葡糖淀粉酶底物,且检测底物量的减少或反应产物量的增加。
本发明提供了通过使用实时代谢流分析用于新或修饰表型的全细 胞改造的方法,所述方法包括下述步骤:(a)通过修饰细胞的遗传组 成制备经修饰的细胞,其中所述遗传组成通过给细胞添加本发明的核 酸进行修饰;(b)培养经修饰的细胞以产生多个经修饰的细胞;(c) 通过实时监控步骤(b)的细胞培养物测量细胞的至少一种代谢参数; 和,(d)分析步骤(c)的数据,以测定测量参数是否不同于在相似 条件下未经修饰的细胞中的可比较测量,从而使用实时代谢流分析鉴 定细胞中的改造表型。在一个方面,细胞的遗传组成通过下述方法进 行修饰,所述方法包括细胞中的序列缺失或序列修饰,或,击倒基因 的表达。在一个方面,该方法可以进一步包括选择包含新改造表型的 细胞。在另一个方面,该方法可以包括培养所选择的细胞,从而产生 包含新改造表型的新细胞株。
本发明提供了用于水解多糖、寡糖或淀粉的方法,其包括下述步 骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多 肽包含本发明的多肽;(b)提供包含多糖、寡糖或淀粉的组合物;和 (c)使步骤(a)的多肽与步骤(b)的组合物在其中所述多肽水解多 糖、寡糖或淀粉的条件下接触。在一个方面,包含多糖、寡糖或淀粉 的组合物包含α-1,4-糖苷键或α-1,6-糖苷键。在一个方面,淀粉酶 活性是α-淀粉酶或β-淀粉酶活性。在一个方面,α-淀粉酶活性水解 淀粉或其他多糖中的内部键。
本发明提供了用于从组合物中液化或去除多糖、寡糖或淀粉的方 法,其包括下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的 多肽,其中所述多肽包含本发明的多肽;(b)提供包含多糖、寡糖或 淀粉的组合物;和(c)使步骤(a)的多肽与步骤(b)的组合物在其 中所述多肽去除或液化多糖、寡糖或淀粉的条件下接触。
本发明提供了增加淀粉酶多肽的耐热性或热稳定性的方法,所述 方法包括使淀粉酶或葡糖淀粉酶多肽糖基化,其中所述多肽包含本发 明的多肽;或由本发明的核酸序列编码的多肽的至少30个邻接氨基 酸,从而增加淀粉酶或葡糖淀粉酶多肽的耐热性或热稳定性。在一个 方面,淀粉酶或葡糖淀粉酶比活性在超过约37℃-约95℃的温度下可 以是热稳定的或耐热的。
本发明提供了用于在细胞中超表达重组淀粉酶或葡糖淀粉酶多肽 的方法,其包含含有本发明的核酸或本发明的核酸序列的核酸,其中 序列同一性通过用序列比较算法分析或通过目视检查进行测定,其中 超表达通过使用高活性启动子、双顺反子载体或通过载体的基因扩增 来实现。
本发明提供了包含本发明的多肽或由本发明的核酸编码的多肽的 洗涤剂组合物,其中所述多肽包含淀粉酶或葡糖淀粉酶活性。在一个 方面,淀粉酶或葡糖淀粉酶可以是非表面活性的淀粉酶或葡糖淀粉酶。 在另一个方面,淀粉酶或葡糖淀粉酶可以是表面活性的淀粉酶或葡糖 淀粉酶。
本发明提供了用于洗涤物体的方法,其包括下述步骤:(a)提供 包含具有淀粉酶和/或葡糖淀粉酶活性的多肽的组合物,其中所述多肽 包含本发明的多肽或由本发明的核酸编码的多肽;(b)提供物体;和 (c)使步骤(a)的多肽与步骤(b)的物体在其中组合物可以洗涤物 体的条件下接触。
本发明提供了用于在由动物消耗前水解饲料或食物中的多糖、寡 糖或淀粉的方法,其包括下述步骤:(a)获得包含多糖、寡糖或淀粉 的组合物,例如饲料材料,其中所述多肽包含本发明的多肽或由本发 明的核酸编码的多肽;和(b)将步骤(a)的多肽以足够的量加入组 合物例如饲料或食物材料中足够的时间段,以引起多糖、寡糖或淀粉 的水解,从而水解多糖、寡糖或淀粉。在一个方面,食物或饲料包含 稻、玉米、大麦、小麦、豆类或马铃薯。
例如,在一个实施方案中,本发明提供了包含淀粉酶和葡糖淀粉 酶的组合的组合物(其中这些酶中的一种或两种是本发明的酶),用 于水解多糖、寡糖或淀粉,例如稻、玉米、大麦、小麦、豆类或马铃 薯。在一个方面,关于淀粉酶和葡糖淀粉酶的组合的酶装载包含1: 10的淀粉酶:葡糖淀粉酶比;其中在一个实施方案中,酶总载量为完 全水解33%面粉例如玉米粉所需的0.015%-0.0255%酶。可替代地, 关于装载的示例性范围为用于水解23%纯化的玉米淀粉的约0.01% (w/w),和用于水解33%玉米粉中的玉米淀粉的0.015%-0.2% (w/w)。
本发明提供了用于织物脱浆的方法,其包括下述步骤:(a)提供 具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多肽包含本发明的 多肽或由本发明的核酸编码的多肽;(b)提供织品;和(c)使步骤 (a)的多肽和步骤(b)的织品在其中淀粉酶和/或葡糖淀粉酶可以使 织品脱浆的条件下接触。
本发明提供了用于使纸或纤维脱墨的方法,其包括下述步骤:(a) 提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多肽包含本发 明的多肽;(b)提供包含纸或纤维的组合物;和(c)使步骤(a)的 多肽和步骤(b)的组合物在其中所述多肽可以使纸或纤维脱墨的条件 下接触。
本发明提供了用于处理木质纤维素纤维的方法,其包括下述步骤: (a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中所述多肽包 含本发明的多肽;(b)提供木质纤维素纤维;和(c)使步骤(a)的 多肽和步骤(b)的纤维在其中所述多肽可以处理纤维的条件下接触, 从而改善纤维性质。
本发明提供了用于生产高麦芽糖或高葡萄糖糖浆的方法,其包括 下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽,其中 所述多肽包含本发明的酶;(b)提供包含多糖、寡糖或淀粉的组合物; 和(c)使步骤(a)的多肽和步骤(b)的织物在其中步骤(a)的多 肽可以水解步骤(b)的组合物的条件下接触,从而生产可溶性多糖、 寡糖或淀粉、水解产物,并且使可溶性多糖、寡糖或淀粉、水解产物 糖化,从而生产糖浆。在一个方面,淀粉可以来自稻、玉米、大麦、 小麦、豆类、马铃薯或甘薯。
本发明提供了用于改善含多糖例如含淀粉生产液的流动的方法, 其包括下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽, 其中所述多肽包含本发明的多肽;(b)提供生产液;和(c)使步骤 (a)的多肽和步骤(b)的生产液在其中淀粉酶和/或葡糖淀粉酶可以 水解生产液中的多糖、寡糖或淀粉的条件下接触,从而通过减少其密 度而改善其流动。在一个方面,生产液可以来自地层(subterranean formation)。
本发明提供了抗老化组合物,其包含本发明的多肽或由本发明的 核酸编码的多肽。本发明提供了用于预防烘焙产品的老化的方法,其 包括下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性的多肽, 其中所述多肽包含本发明的多肽;(b)提供包含多糖、寡糖或淀粉用 于烘焙的组合物;(c)在这样的条件下使步骤(a)的多肽与步骤(b) 的组合物相组合,其中所述多肽可以水解用于烘焙的组合物中的多糖、 寡糖或淀粉,从而防止烘焙产品的老化。在一个方面,烘焙产品可以 是面包。
本发明提供了关于在酿造或醇生产中使用淀粉酶或葡糖淀粉酶的 方法,其包括下述步骤:(a)提供具有淀粉酶和/或葡糖淀粉酶活性 的多肽,其中所述多肽包含本发明的多肽;(b)提供包含多糖、寡糖 或淀粉用于酿造或醇生产中的组合物;(c)在这样的条件下使步骤(a) 的多肽与步骤(b)的组合物相组合,其中所述多肽可以水解用于酿造 或醇生产的组合物中的多糖、寡糖或淀粉。在一个方面,包含多糖、 寡糖或淀粉的组合物可以是啤酒。
本发明提供了制备转基因植物的方法,其包括下述步骤:(a)将 异源核酸序列引入细胞内,其中所述异源核酸序列包含本发明的核酸 序列,从而生产转化的植物细胞;(b)由转化细胞生产转基因植物。 在一个方面,步骤(a)可以进一步包括通过植物细胞原生质体的电穿 孔或显微注射引入异源核酸序列。在另一个方面,步骤(a)可以进一 步包括通过DNA粒子轰击将异源核酸序列直接引入植物组织。可替代 地,步骤(a)可以进一步包括使用根瘤土壤杆菌(Agrobacterium tumefaciens)宿主将异源核酸序列直接引入植物细胞DNA内。在一个 方面,植物细胞可以是马铃薯、玉米、稻、小麦、烟草或大麦细胞。
本发明提供了在植物细胞中表达异源核酸序列的方法,其包括下 述步骤:(a)用与启动子可操作地连接的异源核酸序列转化植物细胞, 其中所述异源核酸序列包含本发明的核酸;(b)在其中异源核酸序列 在植物细胞中表达的条件下培养植物。
本发明还提供了用于制备生面团或由生面团制备的烘焙产品的过 程,其包括将本发明的淀粉酶或葡糖淀粉酶以有效延缓面包的老化的 量加入生面团中。本发明还提供了包含所述淀粉酶或葡糖淀粉酶的生 面团,和包含面粉连同所述淀粉酶或葡糖淀粉酶的预混合料。最后, 本发明提供了酶促烘焙添加剂,其包含所述淀粉酶或葡糖淀粉酶。淀 粉酶或葡糖淀粉酶依照本发明的使用提供了改善的抗老化效应,如通 过例如较少的面包心硬化、保留的面包心弹性、改善的切片能力(例 如较少的碎屑、非胶粘碎屑)、改善的适口性或滋味。
本发明的含酶组合物(例如,包含本发明的多肽、核酸和/或抗体) 可以以各种形式进行配制,例如作为液体、凝胶、丸剂、片剂、喷雾、 粉剂、食物、饲料丸剂或包囊形式,包括纳米包囊形式。这些实施方 案中的任何一种可以设计或进一步配制为延迟释放或“控制释放”组 合物。
本发明提供了包含由乳胶聚合物(或等价物)包衣包被的所需成 分的延迟释放(“控制释放”)组合物。在一个方面,所需成分包含 酶,例如本发明的酶。在一个方面,包被组合物包含药物或药品。在 一个方面,所需成分包含小分子、药物、多糖、脂质、核酸、维生素、 抗生素或杀昆虫剂。在一个方面,所需成分包含丸剂或基质,例如包 含可食用材料的丸剂或基质(例如,作为动物食物或饲料或补充剂或 药物)。本发明还提供了关于组合物的“控制释放”或“延迟释放” 的方法,其中组合物由乳胶聚合物(或等价物)包衣包被。
在一个方面,乳胶聚合物包衣包含乳胶漆或等价物。乳胶聚合物 包衣可以包含(甲基)丙烯酸酯、乙酸乙烯酯、苯乙烯、乙烯、氯乙 烯、丁二烯、乙烯叉氯、叔碳酸乙烯酯(vinyl versatate)、丙酸乙烯 酯、叔丁基丙烯酸酯、丙烯腈、氯丁橡胶、马来酸酯、延胡索酸酯、 其等价物、其组合和/或其衍生物。
本发明提供了用于组合物的延迟释放或控制释放的方法,其包括: (i)(a)提供组合物,且提供乳胶聚合物包衣;和(b)用乳胶聚合 物包衣包被组合物;(ii)(i)的方法,其中组合物包含药物或药品; 或(iii)(i)或(ii)的方法,其中组合物包含权利要求56的多肽 或权利要求1的核酸编码的多肽、或由权利要求56的多肽或权利要求 1的核酸编码的多肽组成。
本发明提供了包含本发明的多肽的油井钻井液。本发明提供了用 于改变组合物的粘度的方法,其包括:(i)(a)提供组合物和本发 明的多肽,且提供组合物;和(b)用本发明的多肽处理组合物;或(ii) (i)的方法,其中组合物包含土壤或钻探泥浆。
本发明提供了用于帮助运走钻探泥浆的方法,其包括:(a)提供 组合物和本发明的多肽,以及钻探泥浆;和(b)用包含本发明的多肽 的组合物处理钻探泥浆。
本发明提供了包含本发明的多肽的生物漂白溶液。本发明提供了 用于生物漂白组合物的方法,其包括:(i)(a)提供组合物和本发 明的多肽;和(b)用本发明的多肽处理组合物;或(ii)(i)的方 法,其中组合物是纸或浆产品。
本发明提供了用于制备燃料的方法,其包括:(i)(a)提供本 发明的多肽;(b)提供包含多糖、寡糖或淀粉的组合物;和(c)使 (a)的多肽与(b)的组合物在其中多肽水解多糖、寡糖或淀粉的条 件下接触;或(ii)(i)的方法,其中多肽是热稳定酶;(iii)(i) 的方法,其中燃料是基于乙醇的。
本发明提供了包含本发明的多肽的消毒剂。
本发明提供了包含本发明的多肽的生物防卫或生物解毒剂。
本发明提供了包含本发明的多肽的乳制品。
本发明提供了用于加工包含木质纤维素的生物质材料的方法,其 包括(i)(a)提供包含本发明的多肽的组合物,且提供生物质材料; 和(b)使包含本发明的多肽的组合物与生物质材料接触;(ii)(i) 的方法,其中生物质材料包含或衍生自农业作物,或是食物或饲料生 产的副产品,或是木质纤维素废品,或是植物残渣或废纸或废纸产品; (iii)(i)或(ii)的方法,其中多肽具有包含淀粉酶、葡糖淀粉 酶、葡糖苷酶例如α-葡糖苷酶或β-葡糖苷酶活性的活性;(iv)(ii) 中任何一个的方法,其中植物残渣包含茎、叶、外壳、外皮、穗轴、 木材、木片、木浆和锯屑,或者,纸废物包含丢弃或用过的复印纸、 计算机打印纸、笔记本纸、便签纸、打字机纸、报纸、杂志、卡纸板 和基于纸的包装材料;或(v)(i)-(iv)中任何一个的方法,其中 生物质材料的加工产生生物乙醇、生物丙醇、生物丁醇或生物柴油; (vi)(i)-(v)中任何一个的方法,其中生物质材料包含木质纤维 素。
本发明提供了包含本发明的多肽的生物质材料。
本发明提供了用于制备生物乙醇、生物丙醇、生物丁醇或生物柴 油的方法,其包括:(i)(a)提供本发明的多肽,且提供包含多糖 或寡糖的组合物;和(b)使包含多糖或寡糖的组合物与本发明的多肽 接触;(ii)(i)的方法,其中包含多糖或寡糖的组合物包含植物、 植物产品或植物衍生物;(iii)(ii)的方法,其中植物或植物产品 包含蔗糖植物或植物产品、甜菜根或甜菜、小麦、玉米、大豆、马铃 薯、稻或大麦;(iv)(i)-(iii)中任何一个的方法,其中多肽具 有包含淀粉酶、葡糖淀粉酶、葡糖苷酶例如α-葡糖苷酶或β-葡糖苷 酶活性的活性;或(v)(i)-(iv)中任何一个的方法,其中多糖或 寡糖包含可发酵糖。
本发明提供了用于制备燃料的方法,其包括(i)(a)提供本发 明的多肽,且提供包含可发酵糖的组合物;和(b)使包含可发酵糖的 组合物与本发明的多肽接触;(ii)(i)的方法,其中包含可发酵糖 的组合物包含植物、植物产品或植物衍生物;(iii)(ii)的方法, 其中植物或植物产品包含蔗糖植物或植物产品、甜菜根或甜菜、小麦、 玉米、大豆、马铃薯、稻或大麦;(iv)(i)-(iii)中任何一个的 方法,其中多肽具有包含淀粉酶、葡糖淀粉酶、葡糖苷酶例如α-葡糖 苷酶或β-葡糖苷酶活性的活性;或(v)(i)-(iv)中任何一个的 方法,其中燃料包含生物乙醇或汽油-乙醇混合物,或包含生物乙醇、 生物丙醇、生物丁醇或生物柴油。
本发明提供了燃料,其包含(a)本发明的多肽;(b)(a)的燃 料,其中多肽具有包含淀粉酶、葡糖淀粉酶、葡糖苷酶例如α-葡糖苷 酶或β-葡糖苷酶活性的活性;(c)(a)或(b)的燃料,其中燃料 衍生自植物材料,或燃料衍生自马铃薯、大豆(油菜籽)、大麦、黑 麦、玉米、燕麦、小麦、甜菜根或甘蔗;或(d)(a)-(c)中任何 一个的燃料,其中燃料包含生物乙醇或汽油-乙醇混合物,或包含生物 乙醇、生物丙醇、生物丁醇或生物柴油。
本发明提供了用于生产糖(例如,多糖)的方法,所述方法包括: (i)(a)提供具有淀粉酶或葡糖淀粉酶活性的至少一种多肽;(b) 提供包含多糖或寡糖的组合物;和(c)使步骤(b)的组合物与步骤 (a)的多肽接触,从而产生糖;(ii)(i)的方法,其中包含多糖 或寡糖的组合物包含淀粉;(iii)(i)或(ii)中任何一个的方法, 其中多糖、寡糖和/或糖包含或是可发酵糖;(iv)(i)、(ii)或 (iii)中任何一个的方法,其进一步包括使糖发酵以生产醇;或(v) (iv)的方法,其中醇是乙醇、丙醇或丁醇。
本发明的一个或多个实施方案的细节在附图和下文说明书中阐 述。本发明的其他特征、目的和优点由于说明书和附图以及权利要求 将是显而易见的。
本文引用的所有出版物、专利、专利申请、Genbank序列和ATCC 保藏为了所有目的在此特别引入作为参考。
附图描述
图1是计算机系统的方框图。
图2是举例说明关于使新核苷酸或蛋白质序列与序列数据库比较 的过程的一个方面的流程图,以便测定新序列和数据库中的序列之间 的同源性水平。
图3是举例说明在计算机中用于测定2个序列是否是同源的过程 的一个方面的流程图。
图4是举例说明用于检测序列中特征的存在的鉴别器过程300的 一个方面的流程图。
图5举例说明用于液化糖化的本发明的示例性方法,如下文详细 讨论的。
图6举例说明使用本发明的至少一种酶的本发明的示例性玉米湿 磨过程,如下文详细讨论的。
图7、图8和图9举例说明可替代的示例性多糖例如淀粉加工方 法(例如,工业过程),如下文详细讨论的。
图10和图11举例说明在约pH 3.5-6.0中的pH对淀粉经由本发 明的七(7)种葡糖淀粉酶和两(2)种淀粉酶的水解的影响,如下文 详细讨论的。
图12举例说明本发明的酶如何可以用于通过干研磨来自玉米的 醇生产中,包括其在“常规过程”和“同时液化糖化和发酵过程”中 的使用,如下文详细讨论的。
图13、图14、图15、图16、图17、图18、图19和图20举例说 明本发明的示例性酶在不同贮存缓冲液中的速率比较,如下文实施例 1中详细讨论的。
图21举例说明显示示例性酶SEQ ID NO:52经由胃蛋白酶的蛋白 酶解结果的SDS PAGE;和图22举例说明SEQ ID NO:52的这种胃蛋 白酶消化中产生的肽的表征;和图23A举例说明用于SEQ ID NO:52 经由胃蛋白酶的蛋白酶解产生的肽的小肽分离方案;图23B举例说明 小肽分离方案的SDS PAGE结果;图23C举例说明C18RP洗脱级分的 LC/MS谱;图23D举例说明通过LCMS/MS分析鉴定的肽的序列;图23E 和图23F举例说明在序列输出中的“Asn-Xaa-Ser/Thr”sequins(基 序)(以蓝色突出显示);预测为N联糖基化的天冬酰胺以红色突出 显示,如下文实施例22中详细讨论的。
图24举例说明表1,其概括了比较经由本发明的示例性酶和基准 酶黑曲霉(A.niger)葡糖淀粉酶的颗粒状玉米淀粉和可溶性淀粉(糊 精)水解的起始速率的数据,如下文实施例23中详细讨论的。
图25举例说明温度对示例性葡糖淀粉酶SEQ ID NO:20和黑曲霉 “基准”酶的活性的作用,用可溶性淀粉(糊精)作为底物,如下文 实施例23中详细讨论的。
图26举例说明概括示例性酶纯化方案对本发明选择的酶的效率, 以及尤其是比较纯化和未纯化的酶关于粗淀粉和可溶性淀粉的相应活 性数据的表,如下文实施例18中详细讨论的。
图27举例说明CERALPHA α-淀粉酶测定操作的理论基础,如下 文实施例27中详细讨论的。
图28A显示证实温度对例如本发明的示例性葡糖淀粉酶的活性的 作用的数据,使用颗粒状淀粉作为底物,如下文实施例29中详细讨论 的。
图28B显示证实温度对例如本发明的示例性葡糖淀粉酶的活性的 作用的数据,使用可溶性淀粉(糊精)作为底物,如下文实施例29 中详细讨论的。
图29A显示证实pH对例如本发明的示例性葡糖淀粉酶的活性的作 用的数据,使用颗粒状淀粉作为底物,如下文实施例29中详细讨论的。
图29B显示证实pH对例如本发明的示例性葡糖淀粉酶的活性的作 用的数据,使用可溶性淀粉(糊精)作为底物,如下文实施例29中详 细讨论的。
图30显示证实温度对经由所表征的α-淀粉酶的淀粉水解的作用 的数据,如下文实施例29中详细讨论的。
图31A显示证实pH对本发明的示例性α-淀粉酶和/或葡糖淀粉酶 的活性的作用的数据,使用颗粒状淀粉作为底物,如下文实施例29 中详细讨论的。
图31B显示证实pH对本发明的示例性α-淀粉酶和/或葡糖淀粉酶 的活性的作用的数据,使用可溶性淀粉作为底物,如下文实施例29 中详细讨论的。
各图中的相似参考符号指相似元素。
详述
本发明提供了淀粉酶例如α淀粉酶,编码酶的多核苷酸,以及制 备和使用这些多核苷酸和多肽的方法。本发明涉及具有淀粉酶和/或葡 糖淀粉酶活性例如α-淀粉酶活性的新多肽,编码其的核酸和与其结合 的抗体。本发明的多肽可以在各种诊断、治疗和工业背景中使用。本 发明的多肽可以用作例如添加剂,用于洗涤剂、用于加工食物和用于 利用可逆反应的化学合成。此外,本发明的多肽可以用于织品处理、 醇生产中,并且用作关于食物或动物饲料的添加剂。
在一个方面,本发明的淀粉酶和/或葡糖淀粉酶在高和/或低温下 是有活性的,或在广泛温度范围下是有活性的。例如,它们在20℃-90 ℃、30℃-80℃、或40℃-70℃的温度中可以是有活性的。本发明还提 供了在碱性pHs或酸性pHs例如低水酸性下具有活性的淀粉酶。在可 替代方面,本发明的淀粉酶和/或葡糖淀粉酶在低至pH 5.5、pH 5.0、 pH 4.5、pH 4.0和pH 3.5的酸性pH s下可以具有活性。在可替代方 面,本发明的淀粉酶和/或葡糖淀粉酶在高至pH 8、pH 9.5、pH 10、 pH 10.5和pH 11的碱性pH s下可以具有活性。在一个方面,本发明 的淀粉酶和/或葡糖淀粉酶在约40℃-约70℃的温度中在低水分活性 (低含水量)的条件下是有活性的。例如,本发明提供了在低温下, 例如约30℃-40℃;在低pH下,例如约pH 3.5-pH 6.0;以及在低温 和低pH下,例如约30℃-40℃和在约pH 3.5-pH 6.0的低pH下,具 有水解多糖、寡糖或淀粉例如颗粒状淀粉(包括粗颗粒状淀粉)的能 力的淀粉酶,包括葡糖淀粉酶。
本发明还提供了用于进一步修饰本发明的示例性淀粉酶和/或葡 糖淀粉酶的方法,以产生具有所需性质的蛋白质。例如,通过本发明 的方法产生的淀粉酶可以具有改变的酶活性、热稳定性、pH/活性谱、 pH/稳定性谱(例如,在低例如pH<6或pH<5或高例如pH>9的pH值下 增加的稳定性)、对于氧化的稳定性、Ca2+依赖性、比活性等。本发明 为改变任何目的性质作准备。例如,改变可以导致这样的变体,与亲 本酶比较,其具有改变的酶促活性、或pH或温度活性谱。
产生和处理核酸
在一个方面,本发明提供了分离的、合成或重组核酸,其包含在 至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、 100、150、200、250、300、350、400、450、500、550、600、650、 700、750、800、850、900、950、1000、1050、1100、1150、1200、 1250、1300、1350、1400、1450、1500、1550个或更多残基的区域上, 与本发明的示例性核酸具有至少约50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、 75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更多、或完全(100%)序列同一性 的核酸序列。在一个方面,核酸编码具有淀粉酶和/或葡糖淀粉酶活性 例如α淀粉酶活性的至少一种多肽。
本发明的“合成”核酸(包括寡核苷酸)、多肽或蛋白质包括通 过任何化学合成制备的那些,例如如下所述的。
短语“核酸”或“核酸序列”包括寡核苷酸、核苷酸、多核苷酸、 或这些中任何一个的片段,基因组、重组或合成起源的DNA或RNA(例 如mRNA、rRNA、tRNA),其可以是单链或双链的且可以表示有义或反 义链,肽核酸(PNA)、或天然或合成起源的任何DNA样或RNA样材料, 包括例如iRNA例如miRNA或siRNA,核糖核蛋白(例如iRNPs)。该 术语包括包含天然核苷酸的已知类似物的核酸,即寡核苷酸。该术语 还包含具有合成主链的核酸样结构,参见例如,Mata(1997)Toxicol. Appl.Pharmacol.144:189-197;Strauss-Soukup(1997) Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。
本发明提供了“重组”和合成核酸,其可以包括和它在其自然环 境中与之不相邻的“主链”核酸相邻的核酸。在一个方面,核酸表示 核酸“主链分子”的群体中5%或更多数目的核酸插入片段。根据本 发明的“主链”分子包括核酸,例如表达载体、自主复制核酸、病毒、 整合核酸、或用于维持或处理目的核酸插入片段的其他载体或核酸。 在一个方面,富集的核酸表示重组主链分子的群体中50%、51%、52 %、53%、54%、55%、56%、57%、58%、59%、60%、61%、62 %、63%、64%、65%、66%、67%、68%、69%、70%、71%、72 %、73%、74%、75%、76%、77%、78%、79%、80%、81%、82 %、83%、84%、85%、86%、87%、88%、89%、90%、91%、92 %、93%、94%、95%、96%、97%、98%、99%或更多数目的核酸 插入片段。“重组”多肽或蛋白质指通过重组DNA技术生产的多肽或 蛋白质;例如通过编码所需多肽或蛋白质的外源DNA构建体转化的细 胞生产的。
“寡核苷酸”包括单链多聚脱氧核苷酸或2条互补的多聚脱氧核 苷酸链,其可以是化学合成的(即,作为合成核酸)。在可替代实施 方案中,本发明的合成核酸和寡核苷酸不具有5′磷酸,且因此在激酶 的存在下,将不与另一种寡核苷酸连接,用ATP不添加磷酸。在可替 代实施方案中,合成寡核苷酸可以与未脱去磷酸的片段连接。
术语“基因”包括包含涉及产生转录产物(例如,信使)的DNA 区段的核酸序列,其依次进行翻译以产生多肽链,或调节基因转录、 复制或稳定性。基因可以包括在编码区前和后的区域,例如前导区和 尾部、启动子和增强子、以及可应用时在单个编码区段(外显子)之 间的间插序列(内含子)。
本发明提供了编码本发明的多肽的分离的和重组核酸,包括表达 盒例如表达载体。本发明提供了包含本发明的核酸或由本发明的核酸 组成的探针。本发明还包括使用本发明的核酸用于发现新淀粉酶序列 的方法。本发明还包括使用本发明的核酸用于抑制淀粉酶基因、转录 物和多肽的表达的方法。还提供了通过例如合成连接重新装配、优化 定向进化系统和/或基因位点饱和诱变(GSSM)修饰本发明的核酸的方 法。
本发明的核酸可以通过例如cDNA文库的克隆和表达、经由PCR 扩增信使或基因组DNA等进行制备、分离和/或处理。在实践本发明的 方法中,同源基因可以通过处理模板核酸进行修饰,如本文所描述的。 本发明可以与本领域已知的任何方法或方案或装置结合进行实践,其 在科学和专利文献中充分描述。
一般技术
用于实践本发明的核酸,无论是RNA、iRNA、反义核酸、cDNA、 基因组DNA、载体、病毒还是其杂交物,都可以从各种来源进行分离、 基因工程、扩增和/或重组表达/产生。由这些核酸产生的重组多肽可 以个别地进行分离或克隆,且就所需活性进行测试。可以使用任何重 组表达系统,包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。
本发明提供了用于优化编码淀粉酶和酶的核酸序列例如制备“变 体序列”的方法,其包括本发明的序列的使用,使用例如“饱和诱变” 或“GSSM”(包括使用简并寡核苷酸引物以将点突变引入多核苷酸内 的方法,如下文详细描述的);“优化定向进化系统”或“优化定向 进化”(包括用于重新装配相关核酸序列的片段例如相关基因的方法, 且在下文详细说明)和/或“合成连接重新装配”或“SLR”(包括以 非随机化方式连接寡核苷酸片段的方法,且在下文详细说明)。“变 体”包括在一个或多个碱基对、密码子、内含子、外显子或氨基酸残 基(分别地)处修饰的本发明的多核苷酸或多肽,仍保留本发明的淀 粉酶和/或葡糖淀粉酶的生物活性。变体可以通过任何方法进行生产, 包括方法例如易错PCR、改组、寡核苷酸定向的诱变、装配PCR、有性 PCR诱变、体内诱变、盒式诱变、递归总体诱变、指数总体诱变、位 点特异性诱变、基因重新装配、GSSM及其任何组合。本文提供了用于 产生例如与本发明的示例性酶不同的、在pH或温度下具有活性的变体 淀粉酶的技术。
本发明的核酸可以是完全或部分合成的,并且在可替代方面,它 们可以通过众所周知的化学合成技术进行体外合成,如例如Adams (1983)J.Am.Chem.Soc.105:661;Belousov(1997)Nucleic Acids Res.25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19: 373-380;Blommers(1994)Biochemistry 33:7886-7896;Narang (1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68: 109;Beaucage(1981)Tetra.Lett.22:1859;美国专利号 4,458,066中描述的。
用于核酸处理,例如亚克隆、标记探针(例如,使用Klenow聚合 酶的随机引物标记、缺口翻译、扩增)、测序、杂交等的技术在科学 和专利文献中充分描述,参见例如,Sambrook,编辑,MOLECULAR CLONING:A LABORATORY MANUAL(2ND ED.),第1-3卷,Cold Spring Harbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel,编辑John Wiley & Sons,Inc.,New York (1997);LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,Part I. Theory and Nucleic Acid Preparation,Tijssen,编辑Elsevier, N.Y.(1993)。
获得和处理用于实践本发明的方法的核酸的另一种有用方式是从 基因组样品中克隆,以及需要时,筛选且再克隆从例如基因组克隆或 cDNA克隆中分离或扩增的插入片段。在本发明的方法中使用的核酸的 来源包括在下述中包含的基因组或cDNA文库,例如哺乳动物人工染色 体(MACs),参见例如,美国专利号5,721,118;6,025,155;人类人 工染色体,参见例如,Rosenfeld(1997)Nat.Genet.15:333-335; 酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体, 参见例如,Woon(1998)Genomics 50:306-316;P1衍生载体(PAC), 参见例如,Kern(1997)Biotechniques 23:120-124;粘粒、重组病 毒、噬菌体或质粒。
在一个方面,编码本发明的多肽的核酸在合适的阶段装配有前导 序列,其能够指导翻译多肽或其片段的分泌。
本发明提供了融合蛋白和编码其的核酸。本发明的多肽可以与异 源肽或多肽融合,例如赋予所需特征例如增加的稳定性或简化的纯化 的N末端鉴定肽。本发明的肽和多肽也可以作为融合蛋白进行合成且 表达,所述融合蛋白具有与之连接的一个或多个另外的结构域,用于 例如产生更有免疫原性的肽,以更容易地分离重组合成的肽,鉴定且 分离抗体和表达抗体的B细胞等。检测和纯化促进结构域包括例如, 允许在固定金属上纯化的金属螯合肽例如多组氨酸束和组氨酸-色氨 酸分子,允许在固定免疫球蛋白上纯化的蛋白质A结构域,和在FLAGS 延伸/亲和纯化系统(Immunex Corp,Seattle WA)中使用的结构域。 在纯化结构域和含肽或多肽基序之间包括可切割的接头序列,例如因 子Xa或肠激酶(Invitrogen,San Diego CA),以促进纯化。例如, 表达载体可以包括编码与6组氨酸残基连接的表位核酸序列,随后为 硫氧还蛋白和肠激酶切割位点(参见例如,Williams(1995) Biochemistry 34:1787-1797;Dobeli(1998)Protein Expr.Purif. 12:404-414)。组氨酸残基促进检测和纯化,而肠激酶切割位点提供 用于纯化来自融合蛋白的其余部分的表位的方法。与编码融合蛋白的 载体和融合蛋白的应用有关的技术在科学和专利文献中充分描述,参 见例如,Kroll(1993)DNA Cell.Biol.,12:441-53。
转录和翻译控制序列
本发明提供了与一种或多种表达(例如,转录或翻译)控制序列 可操作地连接的本发明的核酸(例如,DNA)序列,例如启动子或增强 子,以指导或调节RNA合成/表达。用于实践本发明的启动子包括能够 驱动编码序列在细胞例如植物细胞中的转录的所有序列。因此,在本 发明的构建体中使用的启动子包括顺式作用的转录控制元件和调节序 列,其涉及调节或调整基因的转录时间选择和/或转录率。例如,用于 实践本发明的启动子可以是顺式作用的转录控制元件,包括增强子、 启动子、转录终止子、复制起点、染色体整合序列、5′和3′非翻译区、 或涉及转录调节的内含子序列。这些顺式作用序列一般与蛋白质或其 他生物分子相互作用,以进行(开始/关闭、调节、调整等)转录。用 于实践本发明的“组成型”启动子可以是在发育或细胞分化的大多数 环境条件和状态下驱动连续表达的那些。用于实践本发明的启动子可 以是在环境条件或发育条件的影响下,指导本发明的核酸表达的“诱 导型”或“调节型”启动子。可以影响经由诱导型启动子的转录的环 境条件例子包括缺氧条件、升高的温度、干旱或光的存在。
在一个实施方案中,启动子序列可以与本发明的编码序列“可操 作地连接”,例如当在启动子下起始转录的RNA聚合酶使编码序列转 录成mRNA时。
用于实践本发明的启动子包括“组织特异性”启动子,其是仅在 特定细胞或组织或器官中例如在植物或动物中有活性的转录控制元 件。组织特异性调节可以通过某些内因素来达到,所述内因素确保编 码对于给定组织特异的蛋白质的基因表达。此种因素已知存在于哺乳 动物和植物中,以便允许特定组织发育。
用于实践本发明的一种或多种表达控制序列可以在表达载体中。 示例性细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。 示例性真核启动子包括CMV立即早期、HSV胸苷激酶、早期和晚期SV40、 来自逆转录病毒的LTRs、和小鼠金属硫蛋白I。适合于在细菌中表达 多肽的启动子包括大肠杆菌(E.coli)lac或trp启动子、lacI启 动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启 动子、λPL启动子、来自编码糖酵解酶例如3-磷酸甘油酸酯激酶 (PGK)的操纵子的启动子、和酸性磷酸酶启动子。真核启动子包括 CMV立即早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚 期SV40启动子、来自逆转录病毒的LTRs、和小鼠金属硫蛋白I启动 子。也可以使用已知控制基因在原核或真核细胞或其病毒中的表达的 其他启动子。
组织特异性植物启动子
本发明提供了这样的表达盒,其可以以组织特异性方式进行表达, 例如其可以以组织特异性方式表达本发明的淀粉酶和/或葡糖淀粉酶。 本发明还提供了以组织特异性方式表达本发明的淀粉酶和/或葡糖淀 粉酶的植物或种子。组织特异性可以是种子特异性、茎特异性、叶特 异性、根特异性、果实特异性等。
在一个方面,组成型启动子例如CaMV 35S启动子可以用于在植物 或种子的特定部分或者植物各处中表达。例如,对于超表达,可以使 用植物启动子片段,其将指导核酸在植物例如再生植物的某些或所有 组织中的表达。此种启动子在本文中称为“组成型”启动子,并且在 发育或细胞分化的大多数环境条件和状态下有活性。组成型启动子的 例子包括花椰菜花叶病毒(CaMV)35S转录起始区、衍生自根瘤土壤 杆菌的T-DNA的1′-或2′-启动子、和本领域技术人员已知的来自各种 植物基因的其他转录起始区。此种基因包括,例如来自拟南芥属的 ACT11(Huang(1996)Plant Mol.Biol.33:125-139);来自拟南 芥属的Cat3(GenBank编号U43147,Zhong(1996)Mol.Gen.Genet. 251:196-203);来自欧洲油菜的编码硬脂酰-酰基载体蛋白质去饱和 酶的基因(Genbank编号X74782,Solocombe(1994)Plant Physiol. 104:1167-1176);来自玉蜀黍的GPcl(GenBank编号X15596; Martinez(1989)J.Mol.Biol 208:551-565);来自玉蜀黍的Gpc2 (GenBank编号U45855,Manjunath(1997)Plant Mol.Biol.33: 97-112);在美国专利号4,962,028;5,633,440中描述的植物启动子。
本发明使用衍生自病毒的组织特异性或组成型启动子,其可以包 括例如烟草花叶病毒属亚基因组启动子(Kumagai(1995)Proc.Natl. Acad.Sci.USA 92:1679-1683;水稻东格鲁杆状病毒(RTBV),其 仅在受感染的稻植物中的韧皮部细胞中复制,其启动子驱动强韧皮部 特异性报道基因表达;木薯叶脉花叶病毒(CVMV)启动子,在脉管元 件、叶肉细胞和根尖中具有最高活性(Verdaguer(1996)Plant Mol. Biol.31:1129-1139)。
可替代地,植物启动子可以指导淀粉酶表达核酸在特定组织、器 官或细胞类型中的表达(即组织特异性启动子),或可以另外处于更 精确的环境或发育控制下或者诱导型启动子控制下。可以影响转录的 环境条件例子包括缺氧条件、升高的温度、光的存在或用化学制品/ 激素喷射。例如,本发明掺入玉蜀黍的干旱诱导型启动子(Busk(1997) 同上);来自马铃薯的冷、干旱和高盐诱导型启动子(Kirch(1997) Plant Mol.Biol.33:897909)。
组织特异性启动子仅在那个组织内在发育阶段的某个时帧内促进 转录。参见,例如,表征拟南芥属LEAFY基因启动子的Blazquez(1998) Plant Cell 10:791-800。还参见描述转录因子SPL3的Cardon(1997) Plant J 12:367-77,其识别在拟南芥花的分生组织鉴定基因AP1的 启动子区中的保守序列基序;和描述分生组织启动子eIF4的Mandel (1995)Plant Molecular Biology,第29卷,第995-1004页。可 以使用在特定组织的生活周期自始至终有活性的组织特异性启动子。 在一个方面,本发明的核酸与主要仅在棉花纤维细胞中有活性的启动 子可操作地连接。在一个方面,本发明的核酸与主要在棉花纤维细胞 延长阶段过程中有活性的启动子可操作地连接,例如,如由Rinehart (1996)同上描述的。核酸可以与Fbl2A基因启动子可操作地连接, 以在棉花纤维细胞中优先表达(同前)。还参见描述棉花纤维特异性 启动子和用于构建转基因棉花植物的方法的John(1997)Proc.Natl. Acad.Sci.USA 89:5769-5773;John,等人,美国专利号5,608,148 和5,602,321。根特异性启动子也可以用于表达本发明的核酸。根特 异性启动子的例子包括来自醇脱氢酶基因的启动子(DeLisle(1990) Int.Rev.Cytol.123:39-60)。可以用于表达本发明的核酸的其他 启动子包括例如,胚珠特异性、胚芽特异性、胚乳特异性、外壳特异 性、种皮特异性启动子、或其某些组合;叶特异性启动子(参见例如, 描述玉蜀黍中的叶特异性启动子的Busk(1997)Plant J.11:1285 1295);来自毛根土壤杆菌(Agrobacterium rhizogenes)的ORF13 启动子(其显示在根中的高活性,参见例如,Hansen(1997)同上); 玉蜀黍花粉特异性启动子(参见例如,Guerrero(1990)Mol.Gen.Genet. 224:161168);可以使用在果实催熟、叶以及至较少程度的花枯萎 和脱落过程中有活性的番茄启动子(参见,例如,Blume(1997)Plant J.12:731746);来自马铃薯SK2基因的雌蕊特异性启动子(参见 例如,Ficker(1997)Plant Mol.Biol.35:425431);来自豌豆 的Blec4基因,其在转基因苜蓿的营养和花梗端的表皮组织中有活性, 使得其成为使外源基因的表达靶向活跃生长的芽或纤维的表皮层的有 力工具;胚珠特异性BEL1基因(参见例如,Reiser(1995)Cell 83: 735-742,GenBank编号U39944);和/或,描述植物启动子区的美国 专利号5,589,583,Klee中的启动子能够在分生组织和/或快速分裂细 胞中赋予高转录水平。
可替代地,在暴露于植物激素例如植物生长素后可诱导的植物启 动子用于表达本发明的核酸。例如,本发明可以使用大豆(大豆 (Glycine max L.))中的植物生长素应答元件E1启动子片段(AuxREs) (Liu(1997)Plant Physiol.115:397-407);植物生长素应答性 拟南芥属GST6启动子(也响应水杨酸和过氧化氢)(Chen(1996)Plant J.10:955-966);来自烟草的植物生长素诱导型parC启动子(Sakai (1996)37:906-913);植物生物素应答元件(Streit(1997)Mol. Plant Microbe Interact.10:933-937);和响应应激激素脱落酸 的启动子(Sheen(1996)Science 274:1900-1902)。
本发明的核酸也可以与在暴露于化学试剂后可诱导的植物启动子 可操作地连接,所述化学试剂可以应用于植物,例如除草剂或抗生素。 例如,可以使用由苯磺酰胺除草剂安全剂激活的玉蜀黍In2-2启动子 (De Veylder(1997)Plant Cell Physiol.38:568-577);不同 除草剂安全剂的应用诱导不同的基因表达模式,包括在根、排水器和 芽顶端分生组织中的表达。编码序列可以处于例如四环素诱导型启动 子的控制下,例如如用包含燕麦(Avena sativa L.)(燕麦)精氨酸 脱羧酶基因的转基因烟草植物描述的(Masgrau(1997)Plant J.11: 465-473);或,水杨酸应答元件(Stange(1997)Plant J.11: 1315-1324)。使用以化学方法(例如激素或杀虫剂)诱导的启动子, 即,响应可以在田间应用于转基因植物的化学制品的启动子,本发明 的多肽的表达可以在植物的特定发育阶段时诱导。因此,本发明还提 供了包含编码本发明的多肽的可诱导基因的转基因植物,其宿主范围 限制于在农作物的任何发育阶段时可诱导的转基因植物物种,例如玉 米、稻、大麦、小麦、马铃薯、甘蔗、甜菜或其他农作物。
技术人员应认识到组织特异性植物启动子可以驱动可操作地连接 的序列在除靶组织外的组织中表达。因此,组织特异性启动子是驱动 优先在靶组织或细胞类型中的表达,但也可以导致同样在其他组织中 的某些表达的启动子。
本发明的核酸也可以与在暴露于化学试剂后可诱导的植物启动子 可操作地连接。这些试剂包括例如可以应用于例如喷射在转基因植物 上的除草剂、合成植物生长素、或抗生素。本发明的淀粉酶生产核酸 的可诱导表达将允许栽培者选择具有最佳淀粉/糖比率的植物。因此可 以控制植物部分的发育。这样,本发明提供了促进植物和植物部分的 收获的方法。例如,在各种实施方案中,使用由苯磺酰胺除草剂安全 剂激活的玉蜀黍In2-2启动子(De Veylder(1997)Plant Cell Physiol. 38:568-577);不同除草剂安全剂的应用诱导不同的基因表达模式, 诱导在根、排水器和芽顶端分生组织中的表达。本发明的编码序列也 处于四环素诱导型启动子的控制下,例如如用包含燕麦(燕麦)精氨 酸脱羧酶基因的转基因烟草植物描述的(Masgrau(1997)Plant J.11: 465-473);或,水杨酸应答元件(Stange(1997)Plant J.11: 1315-1324)。
如果需要适当的多肽表达,那么应包括在编码区的3′末端处的多 腺苷酸化区域。多腺苷酸化区域可以衍生自天然基因,各种其他植物 基因,或土壤杆菌属T-DNA中的基因。
本发明提供了包含与转录调节剂“可操作地连接的”本发明的任 何序列的“表达盒”;例如其中如本文所使用的,“可操作地连接的” 指2个或更多核酸(例如,DNA)区段之间的功能关系。一般地,它指 转录调节序列与转录序列的功能关系。例如,启动子与编码序列例如 本发明的核酸可操作地连接,如果它刺激或调节编码序列在合适的宿 主细胞或其他表达系统中的转录。一般地,与转录序列可操作地连接 的启动子转录调节序列一般与转录序列在物理上邻接,即它们是顺式 作用的。然而,某些转录调节序列例如增强子无需与它们增强其转录 的编码序列在物理上邻接,或位于它们增强其转录的编码序列附近。
编码序列和相邻序列的修饰
衍生自异种来源的基因在植物中的转基因表达可以涉及这些基因 的修饰,以达到且优化其在植物中的表达。特别地,编码分开的酶但 在天然微生物中由相同转录物编码的细菌ORFs在分开的转录物上在 植物中最佳表达。为了达到这点,每个细菌ORF单独地进行分离,且 克隆在这样的盒内,所述盒提供在ORF的5′末端处的植物启动子序列 和在ORF的3′末端处的植物转录终止子。分离的ORF序列优选包括起 始ATG密码子和终止STOP密码子,但可以包括除起始ATG和STOP密 码子外的另外序列。此外,ORF可以是截短的,但仍保留所需活性; 对于特别长的ORFs,保留活性的截短形式可以优选用于在转基因生物 中表达。“植物启动子”和“植物转录终止子”意指在植物细胞内起 作用的启动子和转录终止子。这包括可以衍生自非植物来源例如病毒 (例子是花椰菜花叶病毒)的启动子和转录终止子。
在某些情况下,不需要对于ORF编码序列和相邻序列的修饰。分 离包含目的ORF的片段且将其插入植物启动子的下游就足够了。例如, Gaffney等人(Science 261:754-756(1993))已在转基因植物中 在CaMV 35S启动子和CaMV tml终止子的控制下成功地表达假单胞菌 属(Pseudomonas)nahG基因,而无需编码序列的修饰,和具有仍附 着的假单胞菌属基因ATG下游的核苷酸,并且STOP密码子下游的核苷 酸仍与nahG ORF附着。优选地应留下尽可能少的相邻微生物序列与 ATG的上游和STOP密码子的下游附着。在实践中,此种构建可以依赖 限制位点的可用性。
在其他情况下,衍生自微生物来源的基因的表达可能提供表达的 问题。这些问题已在本领域中充分表征,并且对于衍生自某些来源例 如芽孢杆菌属(Bacillus)的基因特别常见。这些问题可能应用于本 发明的核苷酸序列,并且这些基因的修饰可以使用本领域目前众所周 知的技术来实现。可能遇到下述问题:
密码子使用
植物中的优选密码子使用不同于某些微生物中的优选密码子使 用。在克隆的微生物ORF内的密码子使用与植物基因(并且特别是来 自靶植物的基因)中的使用的比较将使得能够鉴定在ORF内应优选改 变的密码子。一般地植物进化已趋向在单子叶植物的第三个碱基位置 中的核苷酸C和G的强偏爱,而双子叶植物通常在这个位置处使用核 苷酸A或T。通过修饰基因以掺入关于特定靶转基因物种的优选密码 子使用,将克服下文描述的关于GC/AT含量和不正常剪接的许多问题。
GC/AT含量
植物基因一般具有超过35%的GC含量。富含A和T核苷酸的ORF 序列在植物中可以造成几个问题。首先,ATTTA基序被认为造成信使 的去稳定作用,并且在许多短命mRNAs的3′末端处发现。其次,多腺 苷酸化信号例如AATAAA在信使内不合适位置处的出现被认为造成转 录的过早平截。此外,单子叶植物可能识别AT富含序列作为剪接位点 (参见下文)。
与起始甲硫氨酸相邻的序列
植物不同于微生物之处在于它们的信使不具有限定的核糖体结合 位点。相反,认为核糖体与信使的5′末端附着且扫描第一个可用的 ATG,在其上起始翻译。然而,认为存在与ATG相邻的某些核苷酸的优 先选择,并且微生物基因的表达可以通过在ATG处包括真核共有翻译 起始子得到增强。Clontech(1993/1994 catalog,page 210)已提 出一个序列作为关于大肠杆菌uidA基因在植物中的表达的共有翻译 起始子。此外,Joshi,N.A.R.15:6643-6653(1987)已比较与ATG 相邻的许多植物序列,并且提出另一个共有序列。在其中微生物ORFs 在植物中的表达遇到困难的情况下,这些序列之一在起始ATG处的包 括可以改善翻译。在此种情况下,由于它们第二个AA残基的修饰,共 有区的最后3个核苷酸可能不适合于包括在修饰序列中。与起始甲硫 氨酸相邻的优选序列在不同植物物种之间可能不同。位于Genbank数 据库中的14种玉蜀黍基因的研究提供下述结果:
在14种玉蜀黍基因中在起始ATG前的位置:
-10   -9   -8   -7   -6   -5   -4   -3   -2   -1
C3    8    4    6    2    5    6    0    10   7
T3    0    3    4    3    2    1    1    1    0
A2    3    1    4    3    2    3    7    2    3
G6    3    6    0    6    5    4    6    1    5
这种分析可以对于核苷酸序列引入其内的所需植物物种进行,并 且与ATG相邻的序列进行修饰以掺入所需核苷酸。
不正常剪接位点的去除
从非植物来源克隆且未对于植物中的表达优化的基因也可以包含 这样的基序,所述基序可以在植物中作为5′或3′剪接位点被识别,并 且可以被切割,从而产生截短的或缺失的信使。这些位点可以使用本 领域众所周知的技术进行去除。
用于修饰编码序列和相邻序列的技术是本领域众所周知的。在其 中微生物ORF的起始表达很低且如上所述对序列进行改变视为合适的 情况下,合成基因的构建随后可以根据本领域众所周知的方法来完成。 这些例如在公开的专利公开EP 0385962(Monsanto)、EP 0359472 (Lubrizol)和WO 93/07278(Ciba-Geigy)中描述。在大多数情况 下,优选在其转移至转基因植物前使用瞬时测定方案(这是本领域众 所周知的)测定基因构建体的表达。
植物启动子
本发明的组合物可以包含用于在目的植物中转化和表达的核酸序 列。核酸序列可以存在于DNA构建体或表达盒中。在可替代实施方案 中,如本文所使用的,“表达盒”意指这样的核酸分子,其能够指导 特定核苷酸序列在合适的宿主细胞中的表达,包含与目的核苷酸序列 可操作地连接的启动子,所述启动子与终止信号可操作地连接。一般 还包含核苷酸序列的正确翻译所需的序列。编码区通常编码目的蛋白 质,但也可以在有义或反义方向上编码目的功能RNA,例如反义RNA 或非翻译的RNA。包含目的核苷酸序列的表达盒可以是嵌合的,意指 它的至少一个组分就它的至少一个其他组分而言是异源的。表达盒还 可以是天然存在,但以用于异源表达的重组形式获得的那种。在可替 代实施方案中,表达盒就宿主而言是异源的,即,表达盒的特定DNA 序列在宿主细胞中未天然存在,并且必须已通过转化事件引入宿主细 胞或宿主细胞的祖先内。表达盒中的核苷酸序列的表达可以处于组成 型启动子或诱导型启动子的控制下,所述启动子仅在宿主细胞暴露于 某些特定外刺激时起始转录。在可替代实施方案中,启动子也可以对 于特定组织或器官或发育阶段特异。
本发明包含用能够表达多核苷酸的表达盒转化植物。在可替代实 施方案中,表达盒将以转录的5′-3′方向包括转录和翻译起始区(即 启动子)和目的多核苷酸。表达盒可以另外包含在植物中起作用的转 录和翻译终止区(即,终止区)。在某些实施方案中,表达盒包含可 选标记基因,以允许选择稳定转化体。本发明的表达构建体也可以包 含前导序列和/或允许目的多核苷酸的可诱导表达的序列。关于允许可 诱导表达的序列例子,参见,Guo等人(2003)Plant J.34:383-92 和Chen等人(2003)Plant J.36:731-40。
在可替代实施方案中,表达构建体的调节序列与目的多核苷酸可 操作地连接。“可操作地连接”意指启动子和第二序列之间的功能连 接,其中启动子序列起始且介导相应于第二序列的DNA序列的转录。 在可替代实施方案中,可操作地连接意指被连接的核苷酸序列是邻接 的。
能够在目的植物中驱动表达的任何启动子可以在本发明的实践中 使用。启动子对于植物宿主可以是天然的或相似的或外来的或异源的。 在可替代实施方案中,在本文中用于指核酸序列(例如DNA或RNA序 列)或基因时,术语“异源的”和“外源的”指源于对于特定宿主细 胞外来的来源的序列,或如果来自相同来源,根据其原始形式而被修 饰的序列。因此,宿主细胞中的异源基因包括对于特定宿主细胞内源 但已进行修饰的基因。该术语还包括天然存在的DNA序列的非天然存 在的多个拷贝。因此,该术语指这样的DNA区段,其对于细胞是外来 或异源的,或者如果对于细胞是同源的,但位于宿主细胞核酸内的所 述元件通常未发现的位置中。外源DNA区段进行表达以产生外源多肽。
在可替代实施方案中,“同源”核酸(例如DNA)序列是与它引 入其内的宿主细胞天然相关的核酸(例如DNA或RNA)序列。
待包括的启动子的选择可以依赖几个因素,包括但不限于,效率、 可选择性、诱导性、所需表达水平、和细胞或组织优先表达。对于本 领域技术人员而言,通过相对于那种序列适当地选择且放置启动子和 其他调节区来调节序列的表达是常规事件。
在可替代实施方案中,合适的启动子仅在某些细胞类型中或主要 在某些细胞类型中起始转录。因此,如本文所使用的,细胞类型或组 织优选启动子是驱动优先在靶组织中的表达,但也可以导致同样在其 他细胞类型或组织中的某些表达的启动子。用于鉴定和表征植物基因 组DNA中的启动子区的方法包括,例如下述参考文献中描述的那些: Jordano,等人,Plant Cell,1:855-866(1989);Bustos,等人, Plant Cell,1:839-854(1989);Green,等人,EMBO J.7,4035-4044 (1988);Meier,等人,Plant Cell,3,309-316(1991);和Zhang, 等人,Plant Physiology 110:1069-1079(1996)。
在可替代实施方案中,可以使用已在植物中报告的植物优先的调 节基因和/或启动子。在可替代实施方案中可以使用的报告的组织优选 基因包括编码种子贮藏蛋白(例如napin、cruciferin、β-伴大豆球 蛋白和菜豆球蛋白、醇溶谷蛋白、谷蛋白、球蛋白和玉米醇溶蛋白) 玉米醇溶蛋白或油体蛋白(例如油质蛋白)的基因,或涉及脂肪酸生 物合成的基因(包括酰基载体蛋白质、硬脂酰-ACP去饱和酶、和脂肪 酸去饱和酶(fad 2-1)),和在胚发育过程中表达的其他基因(例如 Bce4,参见例如,EP 255378和Kridl等人,(1991)Seed Science Research,1:209)。已得到描述的、可以用于实践本发明的组织特 异性启动子的例子包括凝集素(Vodkin,Prog.Clin.Biol.Res., 138;87(1983);Lindstrom等人,(1990)Der.Genet.,11:160)、 玉米醇脱氢酶1(Dennis等人,Nucleic Acids Res.,12:3983(1984))、 玉米获光复合物(参见例如,Simpson,(1986)Science,233:34; Bansal(1992)Proc.Natl.Acad.Sci.USA 89:3654)、玉米热 休克蛋白(参见例如,Odell等人,(1985)Nature,313:810;豌 豆小亚基RuBP羧化酶(参见例如,Poulsen等人,(1986)Mol.Gen. Genet.,205:193-200;Cashmore等人,(1983)Gen.Eng.of Plants, Plenum Press,New York,29-38);Ti质粒甘露碱合酶(参见例如, Langridge等人,(1989)Proc.Natl.Acad.Sci.USA,86: 3219-3223),Ti质粒胭脂碱合酶(Langridge等人,(1989)Proc. Natl.Acad.Sci.USA,86:3219-3223)、牵牛花查尔酮异构酶(参 见例如,vanTunen(1988)EMBO J.7:1257);豆甘氨酸富含蛋白质 1(参见例如,Keller(1989)Genes Dev.3:1639);截短的CaMV 35s (参见例如,Odell(1985)Nature 313:810);马铃薯patatin(参 见例如,Wenzler(1989)Plant Mol.Biol.13:347;根细胞(参 见例如,Yamamoto(1990)Nucleic Acids Res.18:7449);玉蜀 黍玉米醇溶蛋白(参见例如,Reina(1990)Nucleic Acids Res.18: 6425;Lopes等人(1995)Mol.Gen.Genet.247:603-613;Kriz (1987)Mol.Gen.Genet.207:90;Wandelt(1989)Nucleic Acids Res.,17:2354;Langridge(1983)Cell,34:1015;Reina(1990) Nucleic Acids Res.,18:7449),ADP-gpp promoter(参见例如, 美国专利号7,102,057);球蛋白-1(参见例如,Belanger(1991) Genetics 129:863);α-球蛋白(Sunilkumar,等人(2002), Transgenic Res.11:347-359);α-微管蛋白;cab(参见例如, Sullivan(1989)Mol.Gen.Genet.,215:431);PEPCase(参见 例如,Hudspeth & Grula,(1989)Plant Molec.Biol.,12:579-589); R基因复合物相关启动子(Chandler等人,(1989)Plant Cell,1: 1175);豌豆豌豆球蛋白启动子(Czako等人,(1992)Mol.Gen. Genet.,235:33;美国专利号5,625,136);GTL1启动子(Takaiwa 等人(1991)Plant Mol.Biol.16(1),49-58);查尔酮合酶启动 子(Franken等人,(1991)EMBO J.,10:2605);和/或GY1启动 子(Sims & Goldburg(1989)Nuc.Acid Res.17(11)4368)等。
在可替代实施方案中,使用在通过果实发育的对立(antithesis) 时或期间至少直至成熟开始表达的一类果实优先启动子,例如在U.S. 4,943,674中讨论的。关于聚半乳糖醛酸酶基因的启动子在果实成熟 中是有活性的。还可以使用聚半乳糖醛酸酶基因,例如如美国专利号 4,535,060、美国专利号4,769,061、美国专利号4,801,590和美国专 利号5,107,065中描述的。
可以使用的组织优选启动子的其他例子包括这样的启动子,其在 对叶的损害(例如来自咀嚼式昆虫)后的叶细胞、微管(例如,patatin 基因启动子)和纤维细胞(发育调节的纤维细胞蛋白质例子E6(John & Crow(1992)PNAS 89:5769-5773)中指导表达。E6基因在纤维中 最有活性,尽管在叶、胚珠和花中发现低水平的转录。
在可替代实施方案中,可以使用在光合组织中有活性的启动子, 以便在绿色组织例如叶和茎中驱动转录;这些启动子是合适的,当它 们仅在此种组织中或主要在此种组织中驱动表达时。在可替代实施方 案中,启动子可以赋予在植物各处组成地表达,或就绿色组织而言差 异地表达,或就其中表达发生的绿色组织的发育阶段而言、或响应外 刺激而差异地表达。
可以用于实践本发明的启动子的例子包括核酮糖-1,5-二磷酸羧 化酶(RbcS)启动子,例如来自美洲落叶松(美洲落叶松(Larix laricina))的RbcS启动子、松树cab6启动子(Yamamoto等人(1994) Plant Cell Physiol.35:773-778)、来自小麦的Cab-1基因启动 子(Fejes等人(1990)Plant Mol.Biol.15:921-932)、来自菠 菜的CAB-1启动子(Lubberstedt等人(1994)Plant Physiol.104: 997-1006)、来自稻的cab1R启动子(Luan等人(1992)Plant Cell 4:971-981)、来自玉米的丙酮酸磷酸盐双激酶(PPDK)启动子(Matsuoka 等人(1993)Proc.Natl.Acad.Sci USA 90:9586-9590)、烟草 Lhcb1*2启动子(Cerdan等人(1997)Plant Mol.Biol.33:245-255)、 拟南芥SUC2蔗糖-H+共运输体启动子(Truernit等人(1995)Planta 196:564-570)、和来自菠菜的类囊体膜蛋白质启动子(psaD、psaF、 psaE、PC、FNR、atpC、atpD、cab、rbcS。在茎、叶和绿色组织中驱 动表达的其他启动子在美国专利公开号2007/0006346中描述。
某些“组织优选”启动子的组织特异性可能不是绝对的;在可替 代实施方案中,使用报道基因例如Gus或绿色荧光蛋白、蓝色荧光蛋 白、黄色荧光蛋白或红色荧光蛋白。在可替代实施方案中,通过不同 组织优选启动子的组合,可以达到具有“遗漏”表达的组织优选表达。 可以使用其他组织优选启动子,并且它们通过本领域技术人员进行分 离(参见U.S.5,589,379)。
在一个方面,在暴露于植物激素例如植物生长素后可诱导的植物 启动子用于表达本发明的核酸。例如,本发明可以使用大豆(大豆) 中的植物生长素应答元件E1启动子片段(AuxREs)(Liu(1997)Plant Physiol.115:397-407);植物生长素应答性拟南芥属GST6启动子 (也响应水杨酸和过氧化氢)(Chen(1996)Plant J.10:955-966); 来自烟草的植物生长素诱导型parC启动子(Sakai(1996)37: 906-913);植物生物素应答元件(Streit(1997)Mol.Plant Microbe Interact.10:933-937);和响应应激激素脱落酸的启动子(Sheen (1996)Science 274:1900-1902)。
本发明的核酸也可以与在暴露于化学试剂后可诱导的植物启动子 可操作地连接,所述化学试剂可以应用于植物,例如除草剂或抗生素。 例如,在化学配体包括乙醇的存在下活化的基因表达系统例如可以在 WO 96/27673;WO 93/01294;WO 94/03619;WO 02/061102中找到, 所有专利在此引入作为参考。可以使用由苯磺酰胺除草剂安全剂激活 的玉蜀黍In2-2启动子(De Veylder(1997)Plant Cell Physiol.38: 568-577);不同除草剂安全剂的应用诱导不同的基因表达模式,包括 在根、排水器和芽顶端分生组织中的表达。编码序列可以处于例如四 环素诱导型启动子的控制下,例如如用包含燕麦(燕麦)精氨酸脱羧 酶基因的转基因烟草植物描述的(Masgrau(1997)Plant J.11: 465-473);雌激素例如蜕皮激素受体(WO 01/52620)或,水杨酸应 答元件(Stange(1997)Plant J.11:1315-1324)。使用以化学方 法(例如激素或杀虫剂)诱导的启动子,即,响应可以在田间应用于 转基因植物的化学制品的启动子,本发明的多肽的表达可以在植物的 特定发育阶段时诱导。
可以用于实践本发明并且已得到描述的某些组成型启动子的例子 包括稻肌动蛋白1(Wang等人(1992)Mol.Cell.Biol.,12:3399; 美国专利号5,641,876);其他肌动蛋白同种型(McElroy等人(1990) Plant Cell 2:163-171和McElroy等人(1991)Mol.Gen.Genet.231: 150-160);CaMV 35S(Odell等人(1985)Nature,313:810);CaMV 19S(Lawton等人(1987)Plant Mol.Biol.9:315-324;美国专利 号5,639,949);nos(Ebert等人(1987)PNAS USA 84:5745-5749); Adh(Walker等人(1987)PNAS USA 84:6624-6628)、蔗糖合酶(Yang & Russell(1990)PNAS USA 87:4144-4148);和泛素启动子(例 如,向日葵-Binet等人(1991)Plant Science 79:87-94;玉蜀 黍-Christensen等人(1989)Plant Molec.Biol.12:619-632; 和拟南芥属-Callis等人,J.Biol.Chem.(1990)265:12486-12493; 和Norris等人,Plant Mol.Biol.(1993)21:895-906。
各种转录终止子可以在表达盒中使用,以实践本发明。这些转录 终止子负责转基因外的转录终止,且校正mRNA多腺苷酸化。终止区可 以对于转录起始区是天然的,可以对于可操作地连接的目的DNA序列 是天然的,可以对于植物宿主是天然的,或可以衍生自另一个来源(即, 对于启动子、目的DNA序列、植物宿主、或其任何组合是外来或异源 的)。合适的转录终止子是已知在植物中起作用的那些,并且包括CAMV 35S终止子、tml终止子、胭脂碱合酶终止子和豌豆rbcs E9终止子。 这些可以在单子叶植物和双子叶植物中都使用。此外,可以使用基因 的天然转录终止子。
已发现众多序列增强来自转录单位内的基因表达,并且这些序列 可以与本发明的基因结合使用,以增强其在转基因植物中的表达。例 如,各种内含子序列已显示特别是在单子叶植物细胞中增强表达。例 如,已发现当引入玉蜀黍细胞内时,玉蜀黍Adh1基因的内含子显著增 强野生型基因在其同种启动子下的表达。
在可替代实施方案中,衍生自病毒的非翻译前导序列可以用于增 强表达,并且这些在双子叶植物细胞中特别有效。在可替代实施方案 中,使用来自烟草花叶病毒(TMV,“W序列”)、玉蜀黍枯黄斑点病 毒(MCMV)、和苜蓿花叶病毒(AMV)的前导序列,并且这些已显示在 增强表达中是有效的(例如Gallie等人Nucl.Acids Res.15: 8693-8711(1987);Skuzeski等人Plant Molec.Biol.15:65-79 (1990))。
基因产物在细胞内的靶向
在可替代实施方案中,使用用于靶向基因产物的各种机制;并且 这些已知存在于植物中,并且控制这些机制的功能的序列已相当详细 地进行表征。已表征引起基因产物靶向其他细胞区室的序列。氨基末 端序列可以负责使目的蛋白质靶向任何细胞区室,例如植物的液泡、 线粒体、过氧化物酶体、蛋白质体、内质网、叶绿体、淀粉颗粒、造 粉体、质外体或细胞壁(例如Unger等人Plant Molec.Biol.13: 411-418(1989);Rogers等人(1985)Proc.Natl.Acad.Sci.USA 82:6512-651;美国专利号7,102,057;WO 2005/096704,所有所述 参考文献在此引入作为参考)。在可替代实施方案中,使用各种信号 序列,例如信号序列可以是来自waxy的N末端信号序列、来自γ-玉 米醇溶蛋白的N末端信号序列、淀粉结合蛋白质、C末端淀粉结合结 构域、使成熟蛋白质输入叶绿体的叶绿体靶向序列(Comai等人(1988) J.Biol.Chem.263:15104-15109;van den Broeck,等人(1985) Nature 313:358-363;美国专利号5,639,949)、或来自糊粉细胞的 分泌信号序列(Koehler & Ho,Plant Cell 2:769-783(1990))。 在可替代实施方案中,氨基末端序列与羧基末端序列结合使用;这些 负责基因产物的液泡靶向(Shinshi等人(1990)Plant Molec.Biol. 14:357-368)。
所选择的信号序列可以包括已知切割位点,并且构建的融合物应 考虑到在切割所需的一个或多个切割位点后的任何氨基酸。在某些情 况下,通过在切割位点和转基因ATG之间添加少量氨基酸,或可替代 地替换转基因序列内的某些氨基酸可以满足这种需求。这些构建技术 是本领域众所周知的,并且可同等地应用于任何细胞区室。
关于细胞靶向的上述机制不仅可以与其同种启动子结合使用,还 可以与异源启动子结合使用,以便实现在启动子的转录调节下的特定 细胞靶向目的,所述启动子具有与驱动靶向信号的启动子不同的表达 模式。
表达载体和克隆用载体
本发明提供了包含本发明的核酸,例如编码本发明的淀粉酶和/ 或葡糖淀粉酶的序列的表达载体和克隆用载体。本发明的表达载体和 克隆用载体可以包含病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、 粘粒、fosmids、细菌人工染色体、病毒DNA(例如牛痘、腺病毒、禽 痘病毒、假性狂犬病和SV40的衍生物)、基于P1的人工染色体、酵 母质粒、酵母人工染色体、和对于特定目的宿主特异的任何其他载体 (例如杆状病毒、曲霉菌属(Aspergillus)和酵母)。本发明的载体 可以包括染色体、非染色体和合成DNA序列。大量合适的载体是本领 域技术人员已知的,并且是商购可得的。示例性载体包括:细菌的: pQE载体(Qiagen)、pBLUESCRIPTTM(pBluescript)质粒、pNH载 体、(λ-ZAP载体(Stratagene);ptrc99a、pKK223-3、pDR540、 pRIT2T(Pharmacia);真核的:pXT1、pSG5(Stratagene)、pSVK3、 pBPV、pMSG、pSVLSV40(Pharmacia)。然而,可以使用任何其他质粒 或其他载体,只要它们可在宿主中复制和存活。对于本发明可以使用 低拷贝数或高拷贝数载体。“质粒”可以是商购可得的,在不受限制 的基础上可公开获得的,或可以依照公开操作由可获得质粒构建的。 与本文描述的那些等价的质粒是本领域已知的,并且对于普通技术人 员将是显而易见的。
本发明提供了包含与转录调节物“可操作地连接的”本发明的任 何序列的“表达盒”;如本文所使用的,术语“表达盒”意指这样的 核苷酸序列,其能够影响结构基因(例如,蛋白质编码序列,例如本 发明的淀粉酶和/或葡糖淀粉酶)在与此种序列相容的宿主中的表达。 表达盒至少包括与多肽编码序列;和任选地,与其他序列例如转录终 止信号可操作地连接的启动子。还可以使用实现表达所需或在实现表 达中有用的另外因子,例如增强子。因此,表达盒还包括质粒、表达 载体、重组病毒、任何形式的重组“裸露DNA”载体等。
“载体”包含可以感染、转染、瞬时或永久转导细胞的核酸。应 认识到载体可以是裸露核酸,或与蛋白质或脂质复合的核酸。载体任 选包含病毒或细菌核酸和/或蛋白质,和/或膜(例如,细胞膜、病毒 脂质包膜等)。用于实践本发明的载体包括但不限于,DNA片段可以 与之附着且变得复制的复制子(例如,RNA复制子、细菌病毒)。用 于实践本发明的载体包括但不限于,RNA、自发性自主复制的环状或线 性DNA或RNA(例如,质粒、病毒等,参见例如,美国专利号5,217,879), 并且包括表达和非表达质粒。当重组微生物或细胞培养物描述为容纳 “表达载体”时,这包括已掺入宿主染色体内的染色体外环状和线性 DNA和RNA。当载体通过宿主细胞进行维持时,载体可以在有丝分裂期 间作为自主结构通过细胞稳定复制,或掺入宿主的基因组内。
表达载体可以包含启动子、用于转录起始的核糖体结合位点和转 录终止子。载体还可以包括用于扩增表达的合适序列。哺乳动物表达 载体可以包含复制起点、任何所需的核糖体结合位点、多腺苷酸化位 点、剪接供体和受体位点、转录终止序列、和5′侧翼非转录序列。在 某些方面,衍生自SV40剪接和多腺苷酸化位点的DNA序列可以用于提 供所需的非转录遗传元件。
在一个方面,表达载体包含一种或多种可选标记基因,以允许选 择包含载体的宿主细胞。此种可选标记包括编码二氢叶酸还原酶的基 因和对于真核细胞培养赋予新霉素抗性的基因,在大肠杆菌中赋予四 环素或氨苄青霉素抗性的基因,和酿酒酵母(S.cerevisiae)TRP1 基因。启动子区可以选自具有可选标记的氯霉素转移酶(CAT)载体或 其他载体选自任何所需基因。
用于在真核细胞中表达多肽或其片段的载体还可以包含增强子, 以增加表达水平。增强子是DNA的顺式作用元件,通常长度为约10- 约300bp,其作用于启动子以增加其转录。例子包括在复制起点bp 100-270的晚期侧(late side)上的SV40增强子、巨细胞病毒早期 启动子增强子、在复制起点的晚期侧上的多瘤增强子、和腺病毒增强 子。
核酸序列可以通过各种操作插入载体内。一般而言,在用合适的 限制性核酸内切酶消化插入片段和载体后,序列与载体中的所需位置 进行连接。可替代地,插入片段和载体中的平端可以进行连接。各种 克隆技术是本领域已知的,例如如Ausubel和Sambrook中描述的。此 种操作及其他视为在本领域技术人员的范围内。
载体可以是质粒、病毒颗粒或噬菌体的形式。其他载体包括染色 体、非染色体和合成DNA序列、SV40的衍生物;细菌质粒,噬菌体DNA, 杆状病毒,酵母质粒,衍生自质粒和噬菌体DNA的组合的载体,病毒 DNA例如牛痘、腺病毒、禽痘病毒和假性狂犬病。用于与原核和真核 宿主一起使用的各种克隆和表达载体由例如Sambrook描述。
可以使用的具体细菌载体包括包含众所周知的克隆载体的遗传元 件的商购可得质粒:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals、Uppsala、Sweden)、GEM1(Promega Biotec、Madison、 WI、USA)pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、 pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。 具体真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、 pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其他载体, 只要它可在宿主细胞中复制和存活。
本发明的核酸可以在表达盒、载体或病毒中进行表达,并且在植 物细胞和种子中进行瞬时或稳定表达。一种示例性瞬时表达系统使用 附加型表达系统,例如通过包含超螺旋DNA的附加型微型染色体的转 录在核中产生的花椰菜花叶病毒(CaMV)病毒RNA,参见例如,Covey (1990)Proc.Natl.Acad.Sci.USA 87:1633-1637。可替代地, 编码序列即本发明的序列的所有或亚片段可以插入植物宿主细胞基因 组内,成为宿主染色体DNA的整合部分。有义或反义转录物可以以这 种方式进行表达。包含来自本发明核酸的序列(例如启动子或编码区) 的载体可以包含标记基因,其对植物细胞或种子赋予可选表型。例如, 标记可以编码杀生物剂抗性,特别地抗生素抗性,例如对于卡那霉素、 G418、博来霉素、潮霉素的抗性,或除草剂抗性,例如对于氯磺隆或 草铵膦的抗性。
能够在植物中表达核酸和蛋白质的表达载体是本领域众所周知 的,并且可以包括例如来自下述的载体:土壤杆菌属物种、马铃薯X 病毒(参见例如,Angell(1997)EMBO J.16:3675-3684)、烟草花 叶病毒(参见例如,Casper(1996)Gene 173:69-73)、番茄茂密矮 小病毒(参见例如,Hillman(1989)Virology 169:42-50)、烟 草蚀纹病毒(参见例如,Dolja(1997)Virology 234:243-252)、 菜豆金黄花叶病毒(参见例如,Morinaga(1993)Microbiol Immunol. 37:471-476)、花椰菜花叶病毒(参见例如,Cecchini(1997)Mol. Plant Microbe Interact.10:1094-1101)、玉蜀黍Ac/Ds转位元 件(参见例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302; Kunze(1996)Curr.Top.Microbiol.Immunol.204:161-194)、 和玉蜀黍抑制基因-增变基因(Spm)转位元件(参见例如,Schlappi (1996)Plant Mol.Biol.32:717-725);及其衍生物。
在一个方面,表达载体可以具有2个复制系统,以允许它在2种 生物中维持,例如在哺乳动物或昆虫细胞中用于表达,和在原核宿主 中用于克隆和扩增。此外,为了整合型表达载体,表达载体可以包含 与宿主细胞基因组同源的至少一种序列。它可以包含与表达构建体侧 接的2个同源序列。通过选择用于包括在载体中的合适同源序列,可 以将整合型载体导向宿主细胞中的特定基因座。关于整合型载体的构 建是本领域众所周知的。
本发明的表达载体还可以包括可选标记基因,以允许选择已转化 的细菌菌株,例如给予对于药物的细菌抗性的基因,所述药物例如氨 苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素。可选标记 还可以包括生物合成基因,例如在组氨酸、色氨酸和赖氨酸生物合成 途径中的那些。
宿主细胞和转化细胞
本发明还提供了转化、转染、感染或转导细胞,其包含本发明的 核酸序列,例如编码本发明的淀粉酶和/或葡糖淀粉酶和/或葡聚糖酶 的序列、或本发明的载体。宿主细胞可以是本领域技术人员熟悉的任 何宿主细胞,包括原核细胞、真核细胞,例如细菌细胞、真菌细胞、 酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示例性细菌细胞包 括在下述属内的任何物种:埃希杆菌属(Escherichia)、芽孢杆菌属、 链霉素属(Streptomyces)、沙门氏菌属(Salmonella)、假单胞菌 属和葡萄球菌属(Staphylococcus),包括例如大肠埃希杆菌 (Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、枯草 芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、 鼠伤寒沙门氏菌(Salmonella typhimurium)、荧光假单胞菌 (Pseudomonas fluorescens)。示例性酵母细胞包括毕赤酵母属 (Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属 (Schizosaccharomyces)或许旺酵母属(Schwanniomyces)的任何 物种,包括巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母或栗酒裂 殖酵母。示例性昆虫细胞包括灰翅叶蛾属(Spodoptera)和果蝇属 (Drosophila)的任何物种,包括果蝇属S2和灰翅叶蛾属Sf9。示例 性动物细胞包括CHO、COS或Bowes黑素瘤或者任何小鼠或人细胞系。 合适宿主的选择在本领域技术人员的能力内。用于转化各种高等植物 物种的技术是众所周知的,并且在技术和科学文献中描述。参见例如, Weising(1988)Ann.Rev.Genet.22:421-477;美国专利号5,750,870。
载体可以使用各种技术引入宿主细胞内,包括转化、转染、转导、 病毒感染、基因枪、或Ti介导的基因转移。具体方法包括磷酸钙转染、 DEAE-右旋糖介导的转染、脂转染或电穿孔(Davis,L.,Dibner,M., Battey,I.,Basic Methods in Molecular Biology,(1986))。
在一个方面,将本发明的核酸或载体引入细胞内用于筛选,因此, 核酸以适合于核酸的后续表达的方式进入细胞。引入的方法在很大程 度上由所靶向的细胞类型指示。示例性方法包括CaPO4沉淀、脂质体 融合、脂转染(例如,LIPOFECTINTM)、电穿孔、病毒感染等。候选 核酸可以稳定地整合到宿主细胞的基因组内(例如,用逆转录病毒引 入),或可以瞬时或稳定地存在于细胞质中(即通过使用常规质粒, 利用标准调节序列、可选标记等)。因为许多药学上重要的筛选需要 人或模型哺乳动物细胞靶,所以能够转染此种靶的逆转录病毒载体是 优选的。
适当时,改造的宿主细胞可以在适当地修饰的常规营养培养基中 进行培养,用于活化启动子、选择转化体或扩增本发明的基因。合适 的宿主菌株转化和宿主菌株生长至合适的细胞密度后,所选择的启动 子可以通过合适的方式(例如,温度变动或化学诱导)进行诱导,并 且细胞可以培养另外的时期,以允许它们生产所需多肽或其片段。
细胞可以通过离心进行收获,通过物理或化学方法进行断裂,并 且所得到的粗提取物保留用于进一步纯化。用于表达蛋白质的微生物 细胞可以通过任何常规方法进行断裂,包括冻融循环、超声处理、机 械破碎、或使用细胞裂解试剂。此种方法是本领域技术人员众所周知 的。所表达的多肽或其片段可以通过方法从重组细胞培养中进行回收 和纯化,所述方法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子 交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石 层析和凝集素层析。必要时,在完成多肽的构型中可以使用蛋白质重 折叠步骤。需要时,可以使用高效液相层析(HPLC)用于最终纯化步 骤。
各种哺乳动物细胞培养系统也可以用于表达重组蛋白质。哺乳动 物表达系统的例子包括能够表达来自相容载体的蛋白质的猴肾成纤维 细胞的COS-7系和其他细胞系,例如C127、3T3、CHO、HeLa和BHK 细胞系。
宿主细胞中的构建体可以以常规方式使用,以生产由重组序列编 码的基因产物。依赖在重组生产操作中使用的宿主,由包含载体的宿 主细胞生产的多肽可以是糖基化的或非糖基化的。本发明的多肽也可 以包括或不包括起始甲硫氨酸氨基酸残基。
无细胞翻译系统也可以用于生产本发明的多肽。无细胞翻译系统 可以使用由DNA构建体转录的mRNAs,所述DNA构建体包含与编码多 肽或其片段的核酸可操作地连接的启动子。在某些方面,DNA构建体 可以在进行体外转录反应前进行线性化。转录的mRNA随后与合适的无 细胞翻译提取物例如兔网织红细胞提取物一起温育,以生产所需多肽 或其片段。
表达载体可以包含一种或多种可选标记基因,以提供表型性状用 于选择转化的宿主细胞,例如用于真核细胞培养的二氢叶酸还原酶或 新霉素抗性,或在大肠杆菌中的四环素或氨苄青霉素抗性。
核酸的扩增
在实践本发明中,本发明的核酸和编码本发明的多肽的核酸、或 本发明的修饰核酸可以通过扩增进行复制。扩增也可以用于克隆或修 饰本发明的核酸。因此,本发明提供了扩增引物序列对用于扩增本发 明的核酸。本领域技术人员可以设计用于这些序列的任何部分或全长 的扩增引物序列对。
扩增反应也可以用于定量样品中的核酸量(例如细胞样品中的信 使量),标记核酸(例如,将其应用于阵列或印迹),检测核酸,或 定量样品中的特定核酸量。在本发明的一个方面,扩增从细胞或cDNA 文库中分离的信使。
技术人员可以选择且设计合适的寡核苷酸扩增引物。扩增方法也 是本领域众所周知的,并且包括例如聚合酶链反应,PCR(参见例如, PCR PROTOCOLS,A GUIDE TO METHODS AND APPLICATIONS,编辑Innis, Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),编辑 Innis,Academic Press,Inc.,N.Y.,连接酶链反应(LCR)(参见 例如,Wu(1989)Genomics 4:560;Landegren(1988)Science 241: 1077;Barringer(1990)Gene 89:117);转录扩增(参见例如,Kwoh (1989)Proc.Natl.Acad.Sci.USA 86:1173);和,自主序列 复制(参见例如,Guatelli(1990)Proc.Natl.Acad.Sci.USA 87: 1874);Q β复制酶扩增(参见例如,Smith(1997)J.Clin. Microbiol.35:1477-1491),自动化Q-β复制酶扩增测定(参见 例如,Burg(1996)Mol.Cell.Probes 10:257-271)和其他RNA 聚合酶介导的技术(例如,NASBA,Cangene,Mississauga, Ontario);还参见Berger(1987)Methods Enzymol.152:307-316; Sambrook;Ausubel;美国专利号4,683,195和4,683,202; Sooknanan(1995)Biotechnology 13:563-564。
测定序列同一性的程度
本发明提供了这样的核酸,其包含在至少约25、30、40、50、75、 100、150、200、250、300、350、400、450、500、550、600、650、 700、750、800、850、900、950、1000、1050、1100、1150、1200、 1250、1300、1350、1400、1450、1500、1550个或更多残基的区域上, 与本发明的示例性核酸具有至少约50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、 75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更多、或完全(100%)序列同一性 的序列。本发明提供了这样的多肽,其包含与本发明的示例性多肽具 有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、 59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、 69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、 79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更多、或完全(100%)序列同一性的序列。序列同一性(同源 性)程度可以使用任何计算机程序和相关参数进行测定,包括本文描 述的那些,例如,BLAST 2.2.2.或FASTA版本3.0t 78,使用缺省参数。
在2个核酸或多肽的背景中,短语“基本上相同的”可以指,当 就最大对应性进行比较和比对时,具有例如至少约50%、51%、52%、 53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、 63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、 73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或更多核苷酸或氨基酸 残基(序列)同一性的2个或更多序列,如使用任何一种已知的序列 比较算法测量的,如下文详细讨论的,或通过目视检查。在可替代方 面,本发明提供了这样的核酸和多肽序列,其在至少约10、20、30、 40、50、100、150、200、250、300、350、400、450、500、550、600、 650、700、750、800、850、900、950、1000个或更多残基的区域上, 或约50个残基至核酸或多肽的全长的区域,与本发明的示例性序列具 有基本同一性。本发明的核酸序列可以在多肽编码区的整个长度上基 本上相同。
同源序列还包括其中尿苷替换核酸序列中的胸腺嘧啶的RNA序 列。同源序列可以使用本文描述的任何操作来获得,或可以产自测序 误差的校正。应当理解如本文所示的核酸序列可以以常规单字符形式 表示(参见例如,Stryer,Lubert.Biochemistry,第3版,W.H Freeman & Co.,New York),或以记录序列中的核苷酸同一性的任何 其他形式表示。
本文鉴定的各种序列比较算法可以用于本发明的这个方面中。蛋 白质和/或核酸序列同一性(同源性)可以使用本领域已知的各种序列 比较算法和程序中的任何一种进行评估。此种算法和程序包括但不限 于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman, Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988;Altschul 等人,J.Mol.Biol.215(3):403-410,1990;Thompson等人, Nucleic Acids Res.22(2):4673-4680,1994;Higgins等人, Methods Enzymol.266:383-402,1996;Altschul等人,J.Mol. Biol.215(3):403-410,1990;Altschul等人,Nature Genetics 3:266-272,1993)。
同源性或序列同一性可以使用序列分析软件(例如Genetics Computer Group的Sequence Analysis Software Package,University of Wisconsin Biotechnology Center,1710 University Avenue, Madison,WI 53705)进行测量。此种软件通过对各种缺失、置换和其 他修饰指定同源性程度使相似序列匹配。在2个或更多核酸或多肽序 列的背景中,术语“同源性”和“同一性”指,在比较窗或指定区域 上就最大对应性进行比较和比对时,相同或具有特定的相同氨基酸残 基或核苷酸百分比的2个或更多序列或子序列,如使用任何数目的序 列比较算法或通过人工比对和目视检查测量的。对于序列比较,一个 序列可以充当测试序列与之进行比较的参考序列,例如本发明的序列。 当使用序列比较算法时,将测试和参考序列输入计算机内,必要时指 定子序列配对物,并且指定序列算法程序参数。可以使用缺省程序参 数,或可以设计可替代的参数。序列比较算法随后基于程序参数,计 算测试序列相对于参考序列的序列同一性百分比。
如本文所使用的,“比较窗”包括提及任何数目的邻接残基的区 段。例如,在本发明的可替代方面,在2个序列进行最佳比对时,20 至本发明的示例性多肽或核酸序列全长的任何地方的邻接残基与相同 数目的邻接位置的参考序列进行比较。如果参考序列与本发明的示例 性多肽或核酸序列具有必要的序列同一性,例如与本发明的序列具有 例如50%、51%、52%、53%、54%、55%、56%、57%、58%、59 %、60%、61%、62%、63%、64%、65%、66%、67%、68%、69 %、70%、71%、72%、73%、74%、75%、76%、77%、78%、79 %、80%、81%、82%、83%、84%、85%、86%、87%、88%、89 %、90%、91%、92%、93%、94%、95%、96%、97%、98%、99 %或更多序列同一性,那么该序列在本发明的范围内。在可替代实施 方案中,在2个序列进行最佳比对后,约20-600、约50-200和约 100-150的子序列与相同数目的邻接位置的参考序列进行比较。
用于比较的序列比对方法是本领域众所周知的。在可替代方面, 可以进行用于比较的序列最佳比对,例如通过Smith & Waterman,Adv. Appl.Math.2:482,1981的局部同源性算法,通过Needleman & Wunsch,J.Mol.Biol.48:443,1970的同源性比对算法,通过 person & Lipman,Proc.Nat′l.Acad.Sci.USA 85:2444,1988 的搜索相似性方法,通过这些算法的计算机化实现(在Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA, Genetics Computer Group,575 Science Dr.,Madison,WI),或 通过人工比对和目视检查。用于测定同源性或同一性的其他算法包括 例如,加上BLAST程序(在美国国立生物信息学中心的Basic Local Alignment Search Tool)、ALIGN、AMAS(Analysis of Multiply Aligned Sequences)、AMPS(Protein Multiple Sequence Alignment)、ASSET (Aligned Segment Statistical Evaluation Tool)、BANDS、 BESTSCOR、BIOSCAN(Biological Sequence Comparative Analysis Node)、BLIMPS(BLocks IMProved Searcher)、FASTA、Intervals & Points、BMB、CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、 WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT (Forced Nucleotide Alignment Tool)、Framealign、Framesearch、 DYNAMIC、FILTER、FSAP(Fristensky Sequence Analysis Package)、 GAP(Global Alignment Program)、GENAL、GIBBS、GenQuest、ISSC (Sensitive Sequence Comparison)、LALIGN(Local Sequence Alignment)、LCP(Local Content Program)、MACAW(Multiple Alignment Construction & Analysis Workbench)、MAP(Multiple Alignment Program)、MBLKP、MBLKN、PIMA(Pattern-Induced Multi-sequence Alignment)、SAGA(Sequence Alignment by Genetic Algorithm)和WHAT-IF。此种比对程序也可以用于筛选基因组数据库, 以鉴定具有基本上相同的序列的多核苷酸序列。许多基因组数据库是 可获得的,例如,人基因组的基本部分可作为人类基因组测序计划 (Human Genome Sequencing Project)(Gibbs,1995)的部分获得。 几种基因组已进行测序,例如生殖支原体(M.genitalium)(Fraser 等人,1995)、詹氏甲烷球菌(M.jannaschii)(Bult等人,1996)、 流感嗜血杆菌(H.influenzae)(Fleischmann等人,1995)、大 肠杆菌(Blattner等人,1997)和酵母(酿酒酵母)(Mewes等人, 1997)、和黑腹果蝇(D.melanogaster)(Adams等人,2000)。 在模型生物例如小鼠、线虫(C.elegans)和拟南芥属物种的基因组 测序中已取得显著进展。包含用某些功能信息注解的基因组信息的数 据库由不同机构进行维持,并且经由互联网可获得。
BLAST、BLAST 2.0和BLAST 2.2.2算法也可以用于实践本发明。 它们在例如Altschul(1977)Nuc.Acids Res.25:3389-3402;Altschul (1990)J.Mol.Biol.215:403-410中描述。用于执行BLAST分析 的软件通过美国国立生物技术信息中心可公开获得。这种算法涉及首 先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSPs), 当与数据库序列中相同长度的字进行比对时,其符合或满足某一正值 阈值得分T。T称为邻域字(neighborhood word)得分阈值(Altschul (1990)同上)。这些起始邻域字命中(word hits)充当种子用于起始 搜索,以发现包含它们的更长HSPs。字命中沿着每个序列在2个方向 上进行延伸,只要累积比对得分可以增加。对于核苷酸序列,累积得 分使用参数M(关于匹配残基对的奖励得分;总是>0)进行计算。对 于氨基酸序列,评分矩阵用于计算累积得分。字命中在每个方向上的 延伸在下述情况下停止:累积得分与其达到的最大值减少X;由于一 个或多个负评分残基比对的积累,累积得分变成0或0以下;或达到 任一序列的末端。BLASTN算法参数W、T和X决定比对的灵敏度和速 度。BLASTN程序(用于核苷酸序列)使用字长(W)11、期望值(E) 10、M=5、N=-4和2条链的比较作为缺省值。对于氨基酸序列,BLASTP 程序使用字长3、期望值(E)10和BLOSUM62评分矩阵(参见Henikoff & Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)比对 (B)50、期望值(E)10、M=5、N=-4和2条链的比较作为缺省值。 BLAST算法也执行2个序列之间的相似性的统计分析(参见例如, Karlin & Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873)。 由BLAST算法提供的一种相似性测量是最小和概率(P(N)),其提 供经由其2个核苷酸或氨基酸序列之间的匹配将随机发生的概率指 示。例如,核酸视为与参考序列相似,如果在测试核酸与参考核酸的 比较中的最小和概率小于约0.2、更优选小于约0.01、和最优选小于 约0.001。在一个方面,蛋白质和核酸序列同源性使用Basic Local Alignment Search Tool(“BLAST”)进行评估。例如,5个具体BLAST 程序可以用于执行下述任务:(1)BLASTP和BLAST3针对蛋白质序列 数据库比较氨基酸查询序列;(2)BLASTN针对核苷酸序列数据库比 较核苷酸查询序列;(3)BLASTX针对蛋白质序列数据库比较查询核 苷酸序列(2条链)的6-框概念翻译产物;(4)TBLASTN针对在所有 6个阅读框(2条链)中翻译的核苷酸序列数据库比较查询蛋白质序列; 和,(5)TBLASTX针对核苷酸序列数据库的6-框翻译比较核苷酸查询 序列的6-框翻译。BLAST程序通过鉴定查询氨基酸或核酸序列和测试 序列之间的相似区段来鉴定同源序列,所述相似区段在本文中称为“高 评分区段对”,所述测试序列优选得自蛋白质或核酸序列数据库。高 评分区段对优选借助于评分矩阵进行鉴定(即,比对),所述评分矩 阵中的许多是本领域已知的。优选地,所使用的评分矩阵是BLOSUM62 矩阵(Gonnet等人,Science 256:1443-1445,1992;Henikoff和 Henikoff,Proteins 17:49-61,1993)。较不优选地,也可以使用 PAM或PAM250矩阵(参见,例如,Schwartz和Dayhoff,编辑,1978, Matrices for Detecting Distance Relationships:Atlas of Protein Sequence and Structure,Washington:National Biomedical Research Foundation)
在本发明的一个方面,为了测定核酸是否具有在本发明的范围内 需要的序列同一性,使用NCBI BLAST 2.2.2程序,运用blastp的缺 省选项。在BLAST 2.2.2程序中存在约38个设置选项。在本发明的这 个示例性方面,使用除缺省过滤设置外的所有缺省值(即,除设为OFF 的过滤外所有参数设为缺省);在它的位置中使用“-F F”设置,这 使过滤失效。由于序列的短长度,缺省过滤的使用通常导致 Karlin-Altschul扰乱。
如上文讨论的,在本发明的这个示例性方面使用且为了测定图3 中的值的缺省值包括:
“关于低复杂度的过滤器:ON
字大小:3
矩阵:Blosum62
缺口成本:存在:11
延伸:1”
其他缺省设置可以是:关于低复杂度的过滤器OFF,关于蛋白质 的字大小3、BLOSUM62矩阵,缺口存在罚分-11和缺口延伸罚分-1。 示例性NCBI BLAST 2.2.2程序设置具有缺省为0的“-W”选项。这意 味着,如果未设置,那么字长对于蛋白质缺省为3,和对于核苷酸为 11。
计算机系统和计算机程序产物
为了在计算机芯片上测定和鉴定序列同一性、结构同源性、基序 等,本发明的序列可以在任何介质上进行储存、记录且处理,所述介 质可以由计算机阅读且访问。因此,本发明提供了在其上记录或储存 本发明的核酸和多肽序列的计算机、计算机系统、计算机可读介质、 计算机程序产品等。如本文所使用的,单词“记录”和“储存”指用 于在计算机介质上储存信息的过程。技术人员可以容易地采用任何已 知方法用于在计算机可读介质上记录信息,以产生包含本发明的一种 或多种核酸和/或多肽序列的制造品。
本发明还提供了包含含有本发明的序列的计算机程序产品的计算 机和处理器;并且如本文所使用的,术语“计算机”、“计算机程序” 和“处理器”以其最广泛的一般语境使用,并且合并所有此种装置, 如下文详细描述的。特定多肽或蛋白质的“编码序列”或,“编码特 定多肽或蛋白质的序列”是当置于合适调节序列的控制下时,转录且 翻译成多肽或蛋白质的核酸序列。
本发明的另一个方面是在其上已记录本发明的至少一种核酸和/ 或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、 光学可读介质、电学可读介质和磁/光学介质。例如,计算机可读介质 可以是硬盘、软盘、磁带、CD-ROM、Digital Versatile Disk(DVD)、 Random Access Memory(RAM)、或Read Only Memory(ROM)以及本 领域技术人员已知的其他类型的其他介质。
本发明的方面包括储存且处理本文描述的序列和序列信息的系统 (例如,基于因特网的系统),特别是计算机系统。计算机系统100 的一个例子在图1中以方框图形式举例说明。如本文所使用的,“计 算机系统”指硬件部件、软件部件、和用于分析本发明的核苷酸或多 肽序列的数据存储部件。计算机系统100可以包括用于加工、访问和 处理序列数据的处理器。处理器105可以是众所周知类型的中央处理 装置,例如来自Intel Corporation的Pentium III,或来自Sun、 Motorola、Compaq、AMD或International Business Machines的相 似处理器。计算机系统100是通用系统,其包含处理器105和用于储 存数据的一个或多个内部数据存储部件110、和用于检索数据存储部 件上储存的数据的一个或多个数据检索设备。技术人员应当理解任何 一种目前可用的计算机系统是合适的。
在一个方面,计算机系统100包括与总线连接的处理器105,所 述总线与主存储器115(优选作为RAM执行)和一个或多个内部数据 存储设备110连接,例如在其上具有记录的数据的硬驱和/或其他计算 机可读介质。计算机系统100可以进一步包括一个或多个数据检索设 备118,用于阅读在内部数据存储设备110上储存的数据。数据检索 设备118可以代表例如硬盘驱动器、光盘驱动器、磁带驱动器、或能 够与远程数据存储系统连接的调制解调器(例如经由互联网)等。在 某些实施方案中,内部数据存储设备110是在其上包含控制逻辑和/ 或记录的数据的、可移动的计算机可读介质,例如软盘、光盘、磁带 等。计算机系统100可以有利地包括合适的软件或由合适的软件编程, 在插入数据检索装置中后,用于阅读来自数据存储部件的控制逻辑和/ 或数据。计算机系统100包括显示器120,其用于对计算机用户显示 输出。还应指出计算机系统100可以在网络或广域网中与其他计算机 系统125a-c连接,以提供对计算机系统100的集中访问。用于访问和 处理本发明的核苷酸或氨基酸序列的软件在执行过程中可以位于主存 储器115中。在某些方面,计算机系统100可以进一步包含序列比较 算法,用于比较本发明的核酸序列。一种或多种算法和序列可以储存 在计算机可读介质上。“序列比较算法”指在计算机系统100上执行 (本地或远程)的一种或多种程序,以使核苷酸序列与数据存储装置 内储存的其他核苷酸序列和/或化合物比较。例如,序列比较算法可以 使计算机可读介质上储存的本发明的核苷酸序列与计算机可读介质上 储存的参考序列比较,以鉴定同源性或结构基序。
与上述算法一起使用的参数可以依赖所研究的序列长度和同源性 程度而采用。在某些方面,参数可以是在不存在来自用户的指令的情 况下,由算法使用的缺省参数。图2是举例说明关于使新核苷酸或蛋 白质序列与序列数据库比较的过程200的一个方面的流程图,以便测 定新序列和数据库中的序列之间的同源性水平。序列数据库可以是在 计算机系统100内储存的私人数据库,或可通过互联网获得的公共数 据库例如GENBANK。过程200在起始状态201时开始,并且随后移动 至状态202,在其中将待比较的新序列储存于计算机系统100中的存 储器。如上所述,存储器可以是任何类型的存储器,包括RAM或内部 存储设备。过程200随后移动至状态204,在其中序列数据库开放用 于分析和比较。过程200随后移动至状态206,在其中数据库中储存 的第一序列阅读到计算机上的存储器内。随后在状态210处进行比较, 以测定第一序列是否与第二序列相同。必须指出这个步骤并不限于在 新序列和数据库中的第一序列之间执行精确比较。用于比较2个核苷 酸或蛋白质序列的众所周知的方法是本领域技术人员已知的,即使它 们并不等同。例如,可以将缺口引入一个序列内,以便提高2个测试 序列之间的同源性水平。控制缺口或其他特征是否在比较过程中引入 序列内的参数通常由计算机系统的用户输入。一旦在状态210时已进 行2个序列的比较,就在决定状态210时作出2个序列是否相同的确 定。当然,术语“相同的”并不限于绝对等同的序列。在由用户输入 的同源性参数内的序列在过程200中将标记为“相同的”。如果作出 了2个序列相同的确定,那么过程200移动至状态214,在其中来自 数据库的序列名称显示给用户。这个状态通知用户具有所显示名称的 序列满足输入的同源性限制。一旦储存序列的名称显示给用户,过程 200就移动至决定状态218,在其中作出更多序列是否存在于数据库中 的确定。如此数据库中不存在更多序列,那么过程200在结束状态220 时终止。然而,如果更多序列的确存在于数据库中,那么过程200移 动至状态224,在其中指针移动至数据库中的下一个序列,从而使得 它可以与新序列进行比较。以这种方式,新序列与数据库中的每一个 序列进行比对且比较。应当指出如果在决定状态212时已作出序列并 非同源的确定,那么过程200将立即移动至决定状态218,以测定任 何其他序列在数据库中是否可用于比较。因此,本发明的一个方面是 计算机系统,其包含处理器、在其上已储存本发明的核酸序列的数据 存储设备和用于进行比较的序列比较器。序列比较器可以指出所比较 的序列之间的同源性水平且鉴定结构基序,或者它可以鉴定与这些核 酸编码和多肽编码比较的序列中的结构基序。图3是举例说明计算机 中用于测定2个序列是否同源的过程250的一个实施方案的流程图。 过程250在起始状态252时开始,然后移动至状态254,在其中待比 较的第一序列储存至存储器。待比较的第二序列随后在状态256时储 存至存储器。过程250随后移动至状态260,在其中阅读第一序列的 第一个字符,然后移动至状态262,在其中阅读第个序列的第一个字 符。应当理解如果序列是核苷酸序列,那么字符通常将是A、T、C、G 或U。如果序列是蛋白质序列,那么它可以是单字母氨基酸编码,从 而使得第一和(第二)序列可以容易地进行比较。然后在决定状态264 时作出2个字符是否相同的确定。如果它们是相同的,那么过程250 移动至状态268,在其中阅读第一和第二序列中的下一个字符。然后 作出下一个字符是否相同的确定。如果它们相同,那么过程250继续 这个循环指令,直至2个字符并不相同。如果作出了接下来的2个字 符并不相同的确定,那么过程250移动至决定状态274,以测定任一 序列是否存在任何更多的字符阅读。如果不存在任何更多字符阅读, 那么过程250移动至状态276,在其中第一和第二序列之间的同源性 水平显示给用户。同源性水平通过计算在序列之间相同的字符在第一 序列的总序列数目中的比例进行测定。因此,如果前100个核苷酸序 列中的每一个字符与第二序列中的每一个序列进行比对,那么同源性 水平将是100%。
可替代地,计算机程序可以使参考序列与本发明的序列比较,以 测定序列在一个或多个位置处是否不同。程序可以记录就本发明的序 列或参考而言插入、缺失或置换的核苷酸或氨基酸残基的长度和同一 性。计算机程序可以是测定参考序列是否包含就本发明的序列而言的 单核苷酸多态性(SNP),或本发明的序列是否包含已知序列的SNP 的程序。因此,在某些方面,计算机程序是鉴定SNP s的程序。该方法 可以通过上文描述的计算机系统和图3中举例说明的方法来执行。该 方法可以通过经由使用计算机程序阅读本发明的序列和参考序列且用 计算机程序鉴定差异来执行。
在其他方面,基于计算机的系统包含用于鉴定本发明的核酸或多 肽内的特征的鉴别器。“鉴别器”指鉴定核酸序列内的某些特征的一 种或多种程序。例如,鉴别器可以包含鉴定核酸序列中的开放读码框 (ORF)的程序。图4是举例说明用于检测序列中特征的存在的鉴别器 过程300的一个方面的流程图。过程300在起始状态302时开始,并 且随后移动至状态304,在其中将待检查特征的第一序列储存于计算 机系统100中的存储器115。过程300随后移动至状态306,在其中序 列特征数据库开放。此种数据库将包括每种特征的属性连同特征名称 列表。例如,特征名称可以是“起始密码子”,和属性将是“ATG”。 另一个例子将是特征名称“TAATAA Box”,和特征属性将是“TAATAA”。 此种数据库的例子由University of Wisconsin Genetics Computer Group产生。可替代地,特征可以是结构多肽基序,例如α螺旋、β 折叠,或功能多肽基序例如酶促活性位点、螺旋-转角-螺旋基序或本 领域技术人员已知的其他基序。一旦特征数据库在状态306时打开, 过程300就移动至状态308,在其中从数据库中阅读第一个特征。随 后在状态310时进行与第一序列的第一个特征的属性的比较。然后在 决定状态316时进行特征的属性是否在第一序列中发现的确定。如果 发现属性,那么过程300移动至状态318,在其中所发现的特征名称 显示给用户。过程300随后移动至决定状态320,在其中进行移动特 征是否存在于数据库中的确定。如果未存在更多的特征,那么过程300 在结束状态324时终止。然而,如果更多的特征的确存在于数据库中, 那么过程300在状态326时阅读下一个序列特征,并且向后回到状态 310,在其中下一个特征的属性针对第一序列进行比较。如果在决定状 态316时在第一序列中未发现特征属性,那么过程300直接移动至决 定状态320,以便确定任何更多的特征是否存在于数据库中。因此, 在一个方面,本发明提供了鉴定开放读码框(ORFs)的计算机程序。
本发明的多肽或核酸序列可以以各种形式在各种数据处理器程序 中进行储存和处理。例如,序列可以作为文本储存于文字处理文件中, 例如MicrosoftWORD或WORDPERFECT,或作为ASCII文件储存于对于 本领域技术人员熟悉的各种数据库程序中,例如DB2、SYBASE或 ORACLE。此外,许多计算机程序和数据库可以用作待与本发明的核 酸序列比较的序列比较算法、鉴别器或者参考核苷酸序列或多肽序列 来源。用于实践本发明的程序和数据库包括但不限于:MACPATTERNTM (EMBL)、DiscoveryBase(Molecular Applications Group)、 GENEMINETM(Molecular Applications Group)、LOOKTM(Molecular Applications Group)、MACLOOKTM(Molecular Applications Group)、 BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等人,J.Mol. Biol.215:403、1990)、FASTA(Pearson和Lipman、Proc.Natl. Acad.Sci.USA、85:2444、1988)、FASTDBTM(Brutlag等人 Comp.App.Biosci.6:237-245、1990)、Catalyst(Molecular Simulations Inc.)、CATALYSTTM/SHAPETM(Molecular Simulations Inc.)、CERIUS2.DB ACCESSTM(Molecular Simulations Inc.)、HYPOGENTM(Molecular Simulations Inc.)、INSIGHT II 、(Molecular Simulations Inc.)、DISCOVERTM(Molecular Simulations Inc.)、CHARMMTM(CHARMmTM)(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DELPHITM 、(Molecular Simulations Inc.)、QUANTEMMTM、(Molecular Simulations Inc.)、HOMOLOGY(Molecular Simulations Inc.)、 MODELER(Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、QUANTA/Protein Design(Molecular Simulations Inc.)、WEBLAB(Molecular Simulations Inc.)、 WEBLAB DIVERSITY EXPLORER(Molecular Simulations Inc.)、 GENE EXPLORER(Molecular Simulations Inc.)、SEQFOLD (Molecular Simulations Inc.)、MDL Available Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、Derwent’s World Drug Index数据 库、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。 考虑到本公开内容,许多其他程序和数据库对于本领域技术人员将是 显而易见的。
可以使用上述程序检测的基序包括编码亮氨酸拉链、螺旋-转角- 螺旋基序、糖基化位点、遍在蛋白化位点、α螺旋和β折叠的序列, 编码指导所编码蛋白质的分泌的信号肽的信号序列、牵涉转录调节例 如同源异形框、酸性延长、酶促活性位点、底物结合位点、和酶促切 割位点的序列。
核酸的杂交
本发明提供了分离的、合成或重组核酸,其在严格条件下与本发 明的示例性序列、或编码本发明的多肽的核酸杂交。严格条件可以是 高严格条件、中等严格条件、低严格条件,包括本文描述的高和减少 的严格条件。在一个方面,洗涤条件的严格性阐述确定核酸是否在本 发明的范围内的条件,如下文讨论的。
用于实践本发明的“杂交”方案包括经由其核酸链通过碱基配对 与互补链连接的过程。杂交条件可以是灵敏和选择性的,从而使得可 以鉴定即使在其中它以低浓度存在的样品中的特定目的序列。严格条 件可以通过例如预杂交和杂交溶液中的盐或甲酰胺浓度、或通过杂交 温度进行限定,并且是本领域众所周知的。例如,严格性可以通过减 少盐浓度、增加甲酰胺浓度、或升高杂交温度、改变杂交时间而得到 增加,如下文详细描述的。在可替代方面,本发明的核酸通过其在各 种严格条件(例如,高、中、低)下杂交的能力进行限定,如本文所 述的。
在可替代实施方案中,如通过其在严格条件下杂交的能力限定的 本发明的核酸可以在约5个残基至本发明的核酸的全长之间;例如, 它们可以是长度至少5、10、15、20、25、30、35、40、50、55、60、 65、70、75、80、90、100、150、200、250、300、350、400、450、 500、550、600、650、700、750、800、850、900、950、1000个或更 多残基。还包括短于全长的核酸。这些核酸可以用作例如杂交探针、 标记探针、PCR寡核苷酸探针、iRNA、反义或编码抗体结合肽(表位) 的序列、基序、活性位点等。
在一个方面,本发明的核酸通过其在高严格性下杂交的能力进行 限定,所述高严格性包括在约37℃-42℃下约50%甲酰胺的条件。在 一个方面,本发明的核酸通过其在减少的严格性下杂交的能力进行限 定,所述减少的严格性包括在约30℃-35℃下在约35%-25%甲酰胺中 的条件。
可替代地,本发明的核酸通过其在高严格性下杂交的能力进行限 定,所述高严格性包括在50%甲酰胺、5X SSPE、0.3%SDS和重复序 列阻断核酸中于42℃的条件,所述阻断核酸例如cot-1或鲑精DNA(例 如,200ug/ml剪切且变性的鲑精DNA)。在一个方面,本发明的核酸 通过其在减少的严格条件下杂交的能力进行限定,所述减少的严格条 件包括在35℃降低的温度下35%甲酰胺。
杂交后,滤纸可以用6X SSC、0.5%SDS于50℃进行洗涤。这些 条件视为超过25%甲酰胺的“中等”条件和低于25%甲酰胺的“低” 条件。“中等”杂交条件的具体例子是当上述杂交在30%甲酰胺下进 行时。“低严格性”杂交条件的具体例子是当上述杂交在10%甲酰胺 下进行时。
对应于具体严格性水平的温度范围可以通过计算目的核酸的嘌呤 与嘧啶比且相应地调整温度进一步变窄。本发明的核酸也通过其在高、 中和低严格条件下杂交的能力进行限定,如Ausubel和Sambrook中所 述的。关于上述范围和条件的改变是本领域众所周知的。杂交条件在 下文进一步讨论。
上述操作可以进行修饰,以鉴定对于探针序列具有减少的同源性 水平的核酸。例如,为了获得对于可检测探针具有减少的同源性的核 酸,可以使用较不严格的条件。例如,在具有约1M的Na+浓度的杂交 缓冲液中,杂交温度可以以5℃的增量从68℃降低至42℃。杂交后, 滤纸可以用2X SSC、0.5%SDS在杂交温度下进行洗涤。这些条件视为 超过50℃的“中等”条件和低于50℃的“低”条件。“中等”杂交条 件的具体例子是当上述杂交在55℃下进行时。“低严格性”杂交条件 的具体例子是当上述杂交在45℃下进行时。
可替代地,杂交可以在包含甲酰胺的缓冲液例如6X SSC中于42 ℃进行。在这种情况下,杂交缓冲液中的甲酰胺浓度可以以5%的增 量从50%减少至0%,以鉴定对于探针具有减少的同源性水平的克隆。 杂交后,滤纸可以用6X SSC、0.5%SDS于50℃进行洗涤。这些条件 视为超过25%甲酰胺的“中等”条件和低于25%甲酰胺的“低”条件。 “中等”杂交条件的具体例子是当上述杂交在30%甲酰胺下进行时。 “低严格性”杂交条件的具体例子是当上述杂交在10%甲酰胺下进行 时。
然而,杂交形式的选择并不是关键的——洗涤条件的严格性阐述 确定核酸是否在本发明的范围内的条件。用于鉴定本发明的范围内的 核酸的洗涤条件包括,例如:在pH 7下约0.02摩尔的盐浓度和至少 约50℃或约55℃至约60℃的温度;或于72℃约0.15M NaCl的盐浓 度约15分钟;或,在至少约50℃或约55℃至约60℃下约0.2X SSC 的盐浓度约15-约20分钟;或,杂交复合物用包含0.1%SDS具有约 2X SSC的盐浓度的溶液在室温下洗涤2次,共15分钟,并且随后通 过包含0.1%SDS的0.1X SSC于68℃洗涤2次,共15分钟;或等价 条件。关于SSC缓冲液和等价条件的描述,参见Sambrook、Tijssen 和Ausubel。
这些方法可以用于分离本发明的核酸。
寡核苷酸探针和关于使用其的方法
本发明还提供了核酸探针,其可以用于例如鉴定编码具有淀粉酶 活性的多肽或其片段的核酸,或用于鉴定淀粉酶基因。在一个方面, 探针包含本发明的核酸的至少10个连续碱基。可替代地,本发明的探 针可以是如本发明的核酸中所示序列的至少约5、6、7、8、9、10、 15、20、25、30、35、40、45、50、60、70、80、90、100、110、120、 130、150个或约10-50、约20-60约30-70个连续碱基。探针通过结 合和/或杂交来鉴定核酸。探针可以在本发明的阵列中使用,参见下文 讨论,包括例如毛细管阵列。本发明的探针也可以用于分离其他核酸 或多肽。
本发明的探针可以用于测定生物样品例如土壤样品是否包含具有 本发明的核酸序列的生物,或由其获得核酸的生物。在此种操作中, 获得潜在具有由其分离核酸的生物的生物样品,并且从样品中获得核 酸。在允许探针与样品中存在的任何互补序列特异性杂交的条件下, 使核酸与探针接触。必要时,允许探针与互补序列特异性杂交的条件 可以通过下述进行测定:使探针放置与来自已知包含互补序列的样品 的互补序列,以及不包含互补序列的对照序列接触。杂交条件,例如 杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度、或杂交温度可以改 变,以鉴定允许探针与互补核酸特异性杂交的条件(参见关于特异性 杂交条件的讨论)。
如果样品包含由其分离核酸的生物,那么随后检测探针的特异性 杂交。通过用可检测试剂例如放射性同位素、荧光染料或能够催化可 检测产物形成的酶标记探针可以检测杂交。关于使用标记探针检测样 品中的互补核酸的存在的许多方法是本领域技术人员熟悉的。这些包 括DNA印迹、RNA印迹、集落杂交操作和斑点印迹。关于这些操作中 的每一种的方案在Ausubel和Sambrook中提供。
可替代地,可以在扩增反应中使用超过一种探针(其的至少一种 能够与核酸样品中存在的任何互补序列特异性杂交),以测定样品是 否包含含有本发明的核酸序列的生物(例如,由其分离核酸的生物)。 在一个方面,探针包含寡核苷酸。在一个方面,扩增反应可以包含PCR 反应。PCR方案在Ausubel和Sambrook中描述(参见关于扩增反应的 讨论)。在此种操作中,使样品中的核酸与探针接触,执行扩增反应, 并且检测任何所产生的扩增产物。扩增产物可以通过对反应产物执行 凝胶电泳且用嵌入剂例如溴化乙啶使凝胶染色进行检测。可替代地, 一种或多种探针可以用放射性同位素进行标记,并且在凝胶电泳后, 放射性扩增产物的存在可以通过放射自显影术进行检测。
衍生自本发明核酸序列的3′或5′末端附近的序列的探针也可以 用于染色体步移操作中,以鉴定包含另外的例如基因组序列的克隆。 此种方法允许从宿主生物中分离编码另外的目的蛋白质的基因。
在一个方面,本发明的核酸序列用作探针,以鉴定和分离相关核 酸。在某些方面,如此鉴定的相关核酸可以是来自除本发明的核酸首 先分离的那种外的生物的cDNAs或基因组DNAs。在此种操作中,在允 许探针与相关序列特异性杂交的条件下,使核酸样品与探针接触。探 针与来自相关生物的核酸的杂交随后使用上文描述的任何方法进行检 测。
在核酸杂交反应中,依赖待杂交核酸的性质,可以改变用于达到 具体严格性水平的条件。例如,在选择杂交条件中可以考虑长度、互 补性程度、核苷酸序列组成(例如,GC对AT含量)和核酸杂交区域 的核酸类型(例如,RNA对DNA)。另外的考虑是核酸之一是否固定例 如在滤纸上。杂交可以在低严格性、中等严格性或高严格性条件下进 行。作为核酸杂交的例子,包含固定的变性核酸的聚合物膜首先在溶 液中于45℃预杂交30分钟,所述溶液由0.9M NaCl、50mM NaH2PO4, pH 7.0,5.0mM Na2EDTA、0.5%SDS、10X Denhardt′s和0.5mg/ml 多核糖腺苷酸组成。约2×107cpm(比活性4-9×108cpm/ug)32P 末端标记的寡核苷酸探针随后可以加入溶液中。温育12-16小时后, 膜在室温(RT)下在包含0.5%SDS的1X SET(150mM NaCl、20mM Tris 盐酸化物,pH 7.8,1mM Na2EDTA)中洗涤30分钟,随后在Tm-10℃ 下在新鲜的1X SET中洗涤30分钟用于寡核苷酸探针。随后使膜暴露 于放射自显影膜用于检测杂交信号。
通过改变用于鉴定核酸例如cDNAs或基因组DNAs的杂交条件的严 格性,所述核酸与可检测探针杂交,可以鉴定和分离与探针具有不同 同源性水平的核酸。通过在低于探针的解链温度的各种温度下进行杂 交可以改变严格性。解链温度Tm是在其下50%的靶序列与完全互补 的探针杂交的温度(在限定离子强度和pH下)。选择非常严格的条件, 以等于或低于关于特定探针的Tm约5℃。探针的解链温度可以使用下 述示例性公式进行计算。对于长度14-70个核苷酸的探针,解链温度 (Tm)使用下式进行计算:Tm=81.5+16.6(log[Na+])+0.41(fraction G+C)-(600/N),其中N是探针的长度。如果杂交在包含甲酰胺的溶 液中进行,那么解链温度可以使用下述等式进行计算:Tm=81.5+16.6 (log[Na+])+0.41(fraction G+C)-(0.63%甲酰胺)-(600/N), 其中N是探针的长度。预杂交可以在6X SSC、5X Denhardt′s试剂、 0.5%SDS、100μg/ml变性断裂的鲑精DNA或6X SSC、5X Denhardt′s 试剂、0.5%SDS、100μg/ml变性断裂的鲑精DNA、50%甲酰胺中进 行。关于SSC和Denhardt′s及其他溶液的配方例如在Sambrook中列 出。
通过将可检测探针加入上文列出的预杂交溶液中进行杂交。当探 针包含双链DNA时,它在加入杂交溶液中之前进行变性。使滤纸与杂 交溶液接触足够的时间段,以允许探针和包含与其互补或与其同源的 序列的cDNAs或基因组DNAs杂交。对于长度超过200个核苷酸的探针, 杂交可以在低于Tm 15-25℃下进行。对于较短的探针,例如寡核苷酸 探针,杂交可以在低于Tm 5-10℃下进行。在一个方面,在6X SSC中 的杂交可以在约68℃下进行。在一个方面,在包含50%甲酰胺的溶液 中的杂交可以在约42℃下进行。所有上述杂交将视为在高严格性的条 件下。
杂交后,洗涤滤纸以去除任何非特异性结合的可检测探针。依赖 待杂交核酸的性质、待杂交核酸的长度、互补性程度、核酸序列组成 (例如,GC对AT含量)和核酸类型(例如,RNA对DNA),也可以改 变用于洗涤滤纸的严格性。渐进地更高的严格条件洗涤的例子如下: 2X SSC、0.1%SDS在室温下15分钟(低严格性);0.1X SSC、0.5% SDS在室温下30分钟-1小时(中等严格性);0.1X SSC、0.5%SDS 在杂交温度至68℃下15-30分钟(高严格性);和0.15M NaCl在72 ℃下15分钟(极高严格性)。最后的低严格性洗涤可以在0.1X SSC 中在室温下进行。上文例子仅是可以用于洗涤滤纸的一组条件的举例 说明。本领域技术人员将了解存在用于不同严格性洗涤的众多方案。
与探针杂交的核酸可以通过放射自显影术或其他常规技术进行鉴 定。上述操作可以进行修饰,以鉴定对于探针序列具有减少的同源性 水平的核酸。例如,为了获得对于可检测探针具有减少的同源性的核 酸,可以使用较不严格的条件。例如,在具有约1M的Na+浓度的杂交 缓冲液中,杂交温度可以以5℃的增量从68℃降低至42℃。杂交后, 滤纸可以用2X SSC、0.5%SDS在杂交温度下进行洗涤。这些条件视为 超过50℃的“中等”条件和低于50℃的“低”条件。“中等”杂交条 件的具体例子是当上述杂交在55℃下进行时。“低严格性”杂交条件 的具体例子是当上述杂交在45℃下进行时。
可替代地,用于实践本发明的杂交方案可以在包含甲酰胺的缓冲 液例如6X SSC中于42℃进行。在这种情况下,杂交缓冲液中的甲酰 胺浓度可以以5%的增量从50%减少至0%,以鉴定对于探针具有减 少的同源性水平的克隆。杂交后,滤纸可以用6X SSC、0.5%SDS于 50℃进行洗涤。这些条件视为超过25%甲酰胺的“中等”条件和低于 25%甲酰胺的“低”条件。“中等”杂交条件的具体例子是当上述杂 交在30%甲酰胺下进行时。“低严格性”杂交条件的具体例子是当上 述杂交在10%甲酰胺下进行时。
本发明的这些探针和方法可以用于分离核酸,其具有与本发明的 示例性核酸序列和与其互补的序列具有至少约50%、51%、52%、53 %、54%、55%、56%、57%、58%、59%、60%、61%、62%、63 %、64%、65%、66%、67%、68%、69%、70%、71%、72%、73 %、74%、75%、76%、77%、78%、79%、80%、81%、82%、83 %、84%、85%、86%、87%、88%、89%、90%、91%、92%、93 %、94%、95%、96%、97%、98%或99%序列同一性(“同源性”) 的序列,所述本发明的示例性核酸序列包含其至少约10、15、20、25、 30、35、40、50、75、100、150、200、250、300、350、400、500、 550、600、650、700、750、800、850、900、950、1000个或更多连 续碱基。同源性可以使用比对算法进行测量,如本文讨论的。例如, 同源多核苷酸可以具有编码序列,其是本文描述的编码序列之一的天 然存在的等位基因变体。当与本发明的核酸比较时,此种等位基因变 体可以具有一个或多个核苷酸的置换、缺失或添加。
此外,本发明的探针和方法可以用于分离核酸,所述核酸编码与 本发明的多肽具有至少约50%、51%、52%、53%、54%、55%、56 %、57%、58%、59%、60%、61%、62%、63%、64%、65%、66 %、67%、68%、69%、70%、71%、72%、73%、74%、75%、76 %、77%、78%、79%、80%、81%、82%、83%、84%、85%、86 %、87%、88%、89%、90%、91%、92%、93%、94%、95%、96 %、97%、98%或99%序列同一性(同源性)的多肽,所述本发明的 多肽包含至少5、10、15、20、25、30、35、40、50、75、100或150 个连续氨基酸,如使用序列比对算法(例如,具有缺省参数的FASTA 版本3.0t78算法,或具有如本文所述的示例性设置的BLAST 2.2.2 程序)测定的。
抑制淀粉酶的表达
本发明提供了与本发明的核酸序列互补的核酸(例如,关于其的 反义序列),例如包含反义的核酸、siRNA、miRNA、核酶。反义序列 能够抑制淀粉酶编码和葡糖淀粉酶编码基因的转运、剪接或转录。抑 制可以通过使基因组DNA或信使RNA的靶向来实现。靶核酸的转录或 功能可以例如通过杂交和/或切割得到抑制。由本发明提供的一组特别 有用的抑制剂包括能够结合淀粉酶基因或信使的寡核苷酸,在任一情 况下预防或抑制淀粉酶的生产或功能。结合可以通过序列特异性杂交。 另一类有用的抑制剂包括引起淀粉酶信使的灭活或切割的寡核苷酸。 寡核苷酸可以具有引起此种切割的酶活性,例如核酶。寡核苷酸可以 进行化学修饰,或者与能够切割互补核酸的酶或组合物缀合。许多不 同的此种寡核苷酸库可以进行筛选具有所需活性的那些。
用于抑制淀粉酶、葡糖淀粉酶、葡糖苷酶和其他多肽水解酶的表 达的本发明方法和组合物可以具有各种工业应用。例如,葡糖苷酶表 达的抑制可以减缓或预防腐败。当多糖、脂质或多肽例如结构多糖进 行酶促降解时,可以发生腐败。这可以导致水果和蔬菜的变质或腐烂。 在一个方面,抑制葡糖苷酶的表达和/或活性的本发明组合物,例如抗 体、反义寡核苷酸、核酶和RNAi的使用,用于减缓或预防腐败。因此, 在一个方面,本发明提供了包含将本发明的抗体、反义寡核苷酸、核 酶和RNA i应用于植物或植物产品(例如,果实、种子、根、叶等)上 的方法和组合物,例如以减缓或预防腐败,或用于另一种目的。这些 组合物也可以由植物(例如,转基因植物)或另一种生物(例如,用 本发明的葡糖苷酶基因转化的细菌或其他微生物)表达。
反义寡核苷酸
本发明提供了能够结合淀粉酶信使的反义寡核苷酸,所述淀粉酶 信使可以通过靶向mRNA抑制蛋白酶解活性。关于设计反义寡核苷酸的 策略在科学和专利文献中充分描述,并且技术人员可以使用本发明的 新试剂来设计此种淀粉酶寡核苷酸。例如,筛选有效反义寡核苷酸的 基因步移/RNA作图方案是本领域众所周知的,参见例如,描述RNA作 图测定的Ho(2000)Methods Enzymol.314:168-183,所述RNA作 图测定基于标准分子技术,以提供用于有效的反义序列选择的容易和 可靠方法。还参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
天然存在的核酸用作反义寡核苷酸。反义寡核苷酸可以具有任何 长度;例如,在可替代方面,反义寡核苷酸可以是约5-100、约10-80、 约15-60、约18-40。最佳长度可以通过常规筛选进行测定。反义寡核 苷酸可以以任何浓度存在。最佳浓度可以通过常规筛选进行测定。广 泛多样的合成、非天然存在的核苷酸和核酸类似物是已知的,这可以 解决这个潜在性问题。例如,可以使用包含非离子主链的肽核酸 (PNAs),例如N-(2-氨乙基)甘氨酸单位。也可以使用具有磷硫酰 键的反义寡核苷酸,如WO 97/03211;WO 96/39154;Mata(1997)Toxicol Appl Pharmacol 144:189-197;Antisense Therapeutics,编辑Agrawal (Humana Press,Totowa,N.J.,1996)中描述的。由本发明提供的 具有合成DNA主链类似物的反义寡核苷酸也可以包括二硫代磷酸酯、 甲基膦酸酯、氨基磷酸酯、烷基磷酸三酯、氨基磺酸盐、3′-硫缩醛、 亚甲基(甲基亚胺基)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸, 如上所述。
组合化学方法可以用于制备可以就特定寡核苷酸进行快速筛选的 大量寡核苷酸,所述特定寡核苷酸具有针对任何靶合适的结合亲和力 和特异性,所述靶例如为本发明的有义和反义淀粉酶序列(参见例如, Gold(1995)J.of Biol.Chem.270:13581-13584)。
抑制性核酶
本发明提供了能够结合淀粉酶信使的核酶。这些核酶可以通过例 如靶向mRNA抑制淀粉酶活性。关于设计核酶和选择淀粉酶特异性反义 序列用于靶向的策略在科学和专利文献中充分描述,并且技术人员可 以使用本发明的新试剂来设计此种核酶。核酶经由核酶的靶RNA结合 部分通过与靶RNA结合来起作用,所述核酶的靶RNA结合部分与切割 靶RNA的RNA酶促部分保持紧密接近。因此,核酶通过互补碱基配对 识别且结合靶RNA,并且一旦与正确位点结合,就酶促发挥作用,以 切割且灭活靶RNA。如果切割在编码序列中发生,那么靶RNA以此种 方式的切割将破坏其指导所编码蛋白质的合成的能力。核酶已结合且 切割其RNA靶后,它可以从那种RNA中释放,以重复结合且切割新靶。
在某些情况下,核酶的酶促性质可以有利的超过其他技术,例如 反义技术(其中核酸分子仅与核酸靶结合,以阻断其转录、翻译或与 另一种分子的结合),因为实现治疗处理所需的核酶的有效浓度可以 低于反义寡核苷酸的那种。这个潜在的优点反映核酶酶促发挥作用的 能力。因此,单个核酶分子能够切割许多靶RNA分子。此外,核酶一 般是高特异性抑制剂,具有不仅依赖结合的碱基配对机制、还依赖分 子通过其抑制它与之结合的RNA表达的机制的抑制特异性。即,抑制 由RNA靶的切割引起,并且因此特异性定义为靶RNA的切割率超过非 靶RNA的切割率的比。这种切割机制依赖除碱基配对中涉及的那些外 的因子。因此,核酶作用的特异性可以大于结合相同RNA位点的反义 寡核苷酸的那种。
本发明的核酶例如酶促核酶RNA分子可以以锤头状基序、发夹状 基序、作为δ肝炎病毒基序、I组内含子基序和/或与RNA指导序列结 合的RNA酶P样RNA形成。锤头状基序的例子由例如Rossi(1992) Aids Research和Human Retroviruses 8:183描述;发夹状基序由 Hampel(1989)Biochemistry 28:4929和Hampel(1990)Nuc.Acids Res.18:299描述;δ肝炎病毒基序由Perrotta(1992)Biochemistry 31:16描述;RNA酶P样基序由Guerrier-Takada(1983)Cell 35: 849描述;和I组内含子由Cech美国专利号4,987,071描述。这些具 体基序的描述并不预期是限制性的。本领域技术人员应认识到本发明 的核酶,例如本发明的酶促RNA分子,可以具有与一个或多个靶基因 RNA区域互补的特定底物结合位点。本发明的核酶可以具有在底物结 合位点内或周围的核苷酸序列,其对分子赋予RNA切割活性。
RNA干扰(RNAi)
在一个方面,本发明提供了RNA抑制分子,所谓的“RNAi”分子, 其包含本发明的淀粉酶序列(其包括有义和反义链)。RNAi分子可以 包含双链RNA(dsRNA)分子,例如siRNA和/或miRNA。RNAi分子包 含双链RNA(dsRNA)分子。RNAi可以抑制淀粉酶基因的表达。在一个 方面,RNAi例如siRNA和/或miRNA长度是约10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25个或更多双链体核苷 酸。尽管本发明并不限于任何具体作用机制,但RNAi可以进入细胞, 且引起相似或相同序列的单链RNA(ssRNA)包括内源mRNAs的降解。 当细胞暴露于双链RNA(dsRNA)时,来自同源基因的mRNA通过称为 RNA干扰(RNAi)的过程选择性降解。支持RNAi可能的基本机制是匹 配特定基因序列的双链RNA(dsRNA)断裂成称为小干扰RNA的短片段, 其触发匹配其序列的mRNA的降解。在一个方面,本发明的RNAi′s用 于基因沉默治疗,参见例如,Shuey(2002)Drug Discov.Today 7: 1040-1046。在一个方面,本发明提供了使用本发明的RNAi′s选择性 降解RNA的方法。该过程可以在体外、先体外后体内或在体内进行实 践。在一个方面,本发明的RNAi分子可以用于在细胞、器官或动物中 产生功能缺失突变。关于制备和使用RNAi分子例如siRNA和/或miRNA 用于选择性降解RNA的方法是本领域众所周知的,参见例如,美国专 利号6,506,559;6,511,824;6,515,109;6,489,127。
核酸的修饰
本发明提供了产生本发明核酸例如编码淀粉酶的那些的变体的方 法。这些方法可以进行重复或以各种组合进行使用,以产生具有与由 模板核酸编码的淀粉酶不同的改变或不同的活性、或者改变或不同的 稳定性的淀粉酶。这些方法也可以进行重复或以各种组合进行使用, 例如,以产生基因/信使表达、信使翻译或信使稳定性中的变化。在另 一个方面,细胞的遗传组成通过例如同源基因先体外后体内的修饰随 后将其再插入细胞内得到改变。
本发明的核酸可以通过任何方法加以改变。例如,任意或随机方 法、或非随机或“定向进化”方法,参见例如,美国专利号6,361,974。 用于基因的任意突变的方法是本领域众所周知的,参见例如,美国专 利号5,830,696。例如,诱变剂可以用于使基因任意突变。诱变剂包 括例如单独或组合的紫外线或γ辐射,或化学诱变剂,例如丝裂霉素、 亚硝酸、光敏化补骨脂素,以诱导顺应经由重组的修复的DNA断裂。 其他化学诱变剂包括例如,亚硫酸氢钠、亚硝酸、羟胺、肼或甲酸。 其他诱变剂是核苷酸前体类似物,例如亚硝基胍、5-溴尿嘧啶、2-氨 基嘌呤或吖啶。这些试剂可以加入PCR反应中代替核苷酸前体,从而 使序列突变。也可以使用嵌入剂例如原黄素、吖啶黄、奎纳克林等。
可以使用分子生物学中的任何技术,例如,随机PCR诱变,参见 例如,Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471; 或组合多重盒式诱变,参见例如,Crameri(1995)Biotechniques 18: 194-196。可替代地,核酸例如基因可以在任意或“随机”片段化后进 行重新组合,参见例如,美国专利号6,291,242;6,287,862; 6,287,861;5,955,358;5,830,721;5,824,514;5,811,238; 5,605,793。在可替代方面,修饰、添加或缺失通过下述方法引入:易 错PCR、改组、寡核苷酸定向的诱变、装配PCR、有性PCR诱变、体内 诱变、盒式诱变、递归总体诱变、指数总体诱变、位点特异性诱变、 基因重新装配、基因位点饱和诱变(GSSM)、合成连接重新装配(SLR)、 重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱 变、缺口双链体诱变、点错配修复诱变、修复缺陷型宿主菌株诱变、 化学诱变、辐射产生的诱变、缺失诱变、限制-选择诱变、限制-纯化 诱变、人工基因合成、总体诱变、嵌合核酸多聚体产生和/或这些和其 他方法的组合。
下述出版物描述了可以掺入本发明的方法内的各种递归重组操作 和/或方法:Stemmer(1999)″Molecular breeding of viruses for targeting and other clinical properties″Tumor Targeting 4: 1-4;Ness(1999)Nature Biotechnology 17:893-896;Chang(1999) ″Evolution of a cytokine using DNA family shuffling″Nature Biotechnology 17:793-797;Minshull(1999)″Protein evolution by molecular breeding″Current Opinion in Chemical Biology 3: 284-290;Chr i s t ians(1999)″Directed evolut ion of thymidine kinase for AZT phosphorylation using DNA family shuffling″ Nature Biotechnology 17:259-264;Crameri(1998)″DNA shuffling of a family of genes from diverse species accelerates directed evolution″Nature 391:288-291;Crameri(1997)″Molecular evolution of an arsenate detoxification pathway by DNA shuffling,″Nature Biotechnology 15:436-438;Zhang(1997) ″Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening″Proc.Natl.Acad. Sci.USA 94:4504-4509;Patten等人(1997)″Applications of DNA Shuffling to Pharmaceuticals and Vaccines″Current Opinion in Biotechnology 8:724-733;Crameri等人(1996)″Construction and evolution of antibody-phage libraries by DNA shuffling″Nature Medicine 2:100-103;Gates等人(1996)″Affinity selective isolation of ligands from peptide librariest hrough display on a lac repressor`headpiece dimer`″Journal of Molecular Biology 255:373-386;Stemmer(1996)″Sexual PCR and Assembly PCR″In: The Encyclopedia of Molecular Biology.VCH Publishers,New York. 第447-457页;Crameri和Stemmer(1995)″Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes″BioTechniques 18:194-195;Stemmer等人 (1995)″Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides″Gene,164: 49-53;Stemmer(1995)″The Evolution of Molecular Computation″ Science 270:1510;Stemmer(1995)″Searching Sequence Space″ Bio/Technology 13:549-553;Stemmer(1994)″Rapid evolution of a protein in vitro by DNA shuffling″Nature 370:389-391;和 Stemmer(1994)″DNA shuffling by random fragmentation and reassembly:In vitro recombination for molecular evolution.″ Proc.Natl.Acad.Sci.USA 91:10747-10751。
产生多样性的突变方法包括例如定点诱变(Ling等人(1997) ″Approaches to DNA mutagenesis:an overview″Anal Biochem.254 (2):157-178;Dale等人(1996)″Oligonucleotide-d irected random mutagenesis using the phosphorothioate method″Methods Mol.Biol.57:369-374;Smith(1985)″In vitro mutagenesis″Ann. Rev.Genet.19:423-462;Botstein & Shortle(1985)″Strategies and applications of in vitro mutagenesis″Science 229: 1193-1201;Carter(1986)″Site-directed mutagenesis″Biochem. J.237:1-7;和Kunkel(1987)″The efficiency of oligonucleotide directed mutagenesis″in Nucleic Acids & Molecular Biology (Eckstein,F.和Lilley,D.M.J.编辑,Springer Verlag, Berlin));使用含尿嘧啶模板的诱变(Kunkel(1985)″Rapid and efficient site-specific mutagenesis without phenotypic selection″Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等 人(1987)″Rapid and efficient site-specific mutagenesis without phenotypic selection″Methods in Enzymol.154,367-382;和Bass 等人(1988)″Mutant Trp repressors with new DNA-binding specificities″Science 242:240-245); oligonucleotide-directed mutagenesis(Methods in Enzymol. 100:468-500(1983);Methods in Enzymol.154:329-350(1987); Zoller & Smith(1982)″Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the product ion of point mutations in any DNA fragment″ Nucleic Acids Res.10:6487-6500;Zoller & Smith(1983) ″Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors″Methods in Enzymol.100:468-500;和Zoller & Smith(1987)Oligonucleotide-directed mutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template″Methods in Enzymol.154:329-350);磷硫酰修饰 的DNA诱变(Taylor 等人(1985)″The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA″Nucl.Acids Res.13:8749-8764;Taylor 等人(1985)″The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified  DNA″Nucl.Acids Res.13:8765-8787(1985);Nakamaye(1986) ″Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis″Nucl.Acids Res.14: 9679-9698;Sayers等人(1988)″Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis″ Nucl.Acids Res.16:791-802;和Sayers等人(1988)″Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide″Nucl.Acids Res.16:803-814);使用缺口双 链体DNA的诱变(Kramer等人(1984)″The gapped duplex DNA approach to oligonucleotide-directed mutation construction″Nucl.Acids Res.12:9441-9456;Kramer & Fritz(1987)Methods in Enzymol. ″Oligonucleotide-directed construction of mutations via gapped duplex DNA″154:350-367;Kramer等人(1988)″Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations″Nucl. Acids Res.16:7207;和Fritz等人(1988) ″Oligonucleotide-directed construction of mutations:a gapped duplex DNA procedure without enzymatic reactions in vitro″Nucl. Acids Res.16:6987-6999)。
可以用于实践本发明的另外方案包括点错配修复(Kramer(1984) ″Point Mismatch Repair″Cell 38:879-887)、使用修复缺陷型宿 主菌株的诱变(Carter等人(1985)″Improved oligonucleotide site-directed mutagenesis using M13 vectors″Nucl.Acids Res. 13:4431-4443;和Carter(1987)″Improved oligonucleotide-directed mutagenesis using M13 vectors″ Methods in Enzymol.154:382-403)、缺失诱变(Eghtedarzadeh (1986)″Use of oligonucleotides to generate large deletions″ Nucl.Acids Res.14:5115)、限制-选择以及限制-选择和限制-纯 化(Wells等人(1986)″Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin″Phil.Trans. R.Soc.Lond.A 317:415-423)、通过总基因合成的诱变(Nambiar 等人(1984)″Total synthesis and cloning of a gene coding for the ribonuclease S protein″Science 223:1299-1301;Sakamar 和Khorana(1988)″Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)″Nucl.Acids Res.14: 6361-6372;Wells等人(1985)″Cassette mutagenesis:an efficient method for generation of multiple mutations at defined sites″Gene 34:315-323;和Grundstrom等人(1985) ″Oligonucleotide-directed mutagenesis by microscale `shot-gun`gene synthesis″Nucl.Acids Res.13:3305-3316)、 双链断裂修复(Mandecki(1986);Arnold(1993)″Protein engineering for unusual environments″Current Opinion in Biotechnology 4:450-455.″Oligonucleoti de-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis″Proc.Natl.Acad.Sci. USA,83:7177-7181)。关于上述方法中许多的另外细节可以在Methods in Enzymology第154卷中找到,其也描述了关于使用各种诱变方法 的故障查找问题的有用控制。
可以用于实践本发明的方案在例如下述参考文献中描述:给予 Stemmer的美国专利号5,605,793(1997年2月25日),″Methods for In Vitro Recombination;″给予Stemmer等人的美国专利号 5,811,238(1998年9月22日)″Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;″给予Stemmer等人的美国专利号 5,830,721(1998年11月3日),″DNA Mutagenesis by Random Fragmentation and Reassembly;″给予Stemmer等人的美国专利号 5,834,252(1998年11月10日)″End-Complementary Polymerase Reaction;″给予Minshull等人的美国专利号5,837,458(1998年 11月17日),″Methods and Compositions for Cellular and Metabolic Engineering;″WO 95/22625,Stemmer和Crameri, ″Mutagenesis by Random Fragmentation and Reassembly;″经由 Stemmer和Lipschutz的WO 96/33207″End Complementary Polymerase Chain Reaction;″经由Stemmer和Crameri的WO 97/20078″Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;″经由Minshull和Stemmer的WO 97/35966, ″Methods and Compositions for Cellular and Metabolic Engineering;″经由Punnonen等人的WO 99/41402″Targeting of Genetic Vaccine Vectors;″经由Punnonen等人的WO 99/41383 ″Antigen Library Immunization;″经由Punnonen等人的WO 99/41369″Genetic Vaccine Vector Engineering;″经由Punnonen 等人的WO 99/41368″Optimization of Immunomodulatory Properties of Genetic Vaccines;″经由Stemmer和Crameri的EP 752008, ″DNA Mutagenesis by Random Fragmentation and Reassembly;″经 由Stemmer的EP 0932670″Evolving Cellular DNA Uptake by Recursive Sequence Recombination;″经由Stemmer等人的WO 99/23107,″Modification of Virus Tropism and Host Range by Viral Genome Shuffling;″经由Apt等人的WO 99/21979″Human Papillomavirus Vectors;″经由del Cardayre等人的WO 98/31837 ″Evolution of Whole Cells and Organisms by Recursive Sequence Recombination;″经由Patten和Stemmer的WO 98/27230,″Methods and Compositions for Polypeptide Engineering;″经由Stemmer 等人的WO 98/27230″Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection,″WO 00/00632, ″Methods for Generating Highly Diverse Libraries,″WO 00/09679,″Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences,″经由 Arnold等人的WO 98/42832″Recombination of Polynucleotide Sequences Using Random or Defined Primers,″经由Arnold等人 的WO 99/29902″Method for Creating Polynucleotide and Polypeptide Sequences,″经由Vind的WO 98/41653,″An in Vitro Method for Construction of a DNA Library,″经由Borchert等人 的WO 98/41622,″Method for Constructing a Library Using DNA Shuffling,″和经由Pati和Zarling的WO 98/42727,″Sequence Alterations using Homologous Recombination.″
可以用于实践本发明的方案(提供关于各种多样性产生方法的细 节)在例如下述参考文献中得到描述:1999年9月28日由Patten等 人提交的美国专利申请序列号(USSN)09/407,800,″SHUFFLING OF CODON ALTERED GENES″;经由del Cardayre等人的″EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION″,美国专利号6,379,964;经由Crameri等人的 ″OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION″,美国 专利号6,319,714;6,368,861;6,376,246;6,423,542;6,426,224 和PCT/US00/01203;经由Welch等人的″USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING″,美国专利 号6,436,675;2000年1月18日由Selifonov等人提交的″METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS″(PCT/US00/01202),和,例如 2000年1月18日由Selifonov等人提交的″METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS″(美国序列号09/618,579);2000年1 月18日由Selifonov和Stemmer提交的″METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS″ (PCT/US00/01138);和2000年9月6日由Affholter提交的 ″SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION″(美国序列号09/656,549); 和美国专利号6,177,263;6,153,410。
非随机、或“定向进化”方法包括例如基因位点饱和诱变(GSSM)、 合成连接重新装配(SLR)及其组合,用于修饰本发明的核酸,以产生 具有新或改变性质(例如在高酸性或碱性条件、高温等下的活性)的 淀粉酶。在就蛋白酶解或其他活性测试前,由修饰核酸编码的多肽可 以就活性进行筛选。可以使用任何测试方式或方案,例如使用毛细管 阵列平台。参见例如,美国专利号6,361,974;6,280,926;5,939,250。
饱和诱变或GSSM
本发明还提供了用于制备酶的方法,使用如本文以及美国专利号 6,171,820和6,579,258中所描述的基因位点饱和诱变或GSSM。
在一个方面,包含简并N,N,G/T序列的密码子引物用于将点突变 引入多肽内,例如本发明的淀粉酶或抗体,以便产生一组后代多肽, 其中全范围的单氨基酸置换在每个氨基酸位置处呈现,例如,靶向修 饰的酶活性位点或配体结合位点中的氨基酸残基。这些寡核苷酸可以 包含邻接的第一种同源序列、简并N,N,G/T序列、和任选地第二种同 源序列。来自此种寡核苷酸使用的下游后代翻译产物包括在沿着多肽 的每个氨基酸位点处所有可能的氨基酸改变,因为N,N,G/T序列的简 并性包括关于所有20种氨基酸的密码子。在一个方面,一个此种简并 寡核苷酸(包含例如一个简并N,N,G/T盒)用于对亲本多核苷酸模板 中的每个原始密码子实施全范围的密码子置换。在另一个方面,使用 至少2个简并盒,即,在相同寡核苷酸中或不在相同寡核苷酸中,用 于对亲本多核苷酸模板中的至少2个原始密码子实施全范围的密码子 置换。例如,超过一个N,N,G/T序列可以包含在一个寡核苷酸中,以 在超过一个位点处引入氨基酸突变。N,N,G/T序列的这种多重性可以 是直接邻接的,或由一个或多个另外的核苷酸序列分开。在另一个方 面,可用于引入添加和缺失的寡核苷酸可以单独或与包含N,N,G/T序 列的密码子组合使用,以引入氨基酸添加、缺失和/或置换的任何组合 或排列。
在一个方面,使用寡核苷酸完成2个或更多邻接氨基酸位置的同 时诱变,所述寡核苷酸包含邻接的N,N,G/T三联体,即简并(N,N,G/T) n序列。在另一个方面,使用具有比N,N,G/T序列更少的简并性的简 并盒。例如,在某些情况下,可能希望使用(例如在寡核苷酸中)包 含唯一1个N的简并三联体序列,其中所述N可以在三联体的第一个、 第二个或第三个位置中。包括其任何组合和排列的任何其他碱基可以 在三联体的其余2个位置中使用。可替代地,在某些情况下,可能希 望使用(例如,在寡核苷酸中)简并N,N,N三联体序列。
在一个方面,简并三联体(例如,N,N,G/T三联体)的使用允许 在多肽中的每个和每一个氨基酸位置内系统和容易的产生全范围的可 能天然氨基酸(对于总共20种氨基酸)(在可替代方面,该方法还包 括产生少于所有可能的置换/氨基酸残基、或密码子、位置)。例如, 对于100氨基酸多肽,可以产生2000种不同的种类(即20种可能的 氨基酸/位置X 100个氨基酸位置)。通过使用包含简并三N,N,G/T 联体的寡核苷酸或寡核苷酸组,32种单个序列可以编码所有可能的20 种天然氨基酸。因此,在其中使用至少一种此种寡核苷酸对亲本多核 苷酸序列实施饱和诱变的反应容器中,产生了编码20种不同多肽的 32种不同的后代多核苷酸。相比之下,非简并寡核苷酸在定点诱变中 的使用导致唯一1种后代多肽产物/反应容器。非简并寡核苷酸可以任 选与所公开的简并引物组合使用;例如,非简并寡核苷酸可以用于在 工作多核苷酸中产生特定点突变。这提供了产生特定沉默点突变,导 致相应的氨基酸改变的点突变,和引起终止密码子产生和多肽片段的 相应表达的点突变的一种方法。
在一个方面,每个饱和诱变反应容器包含编码至少20种后代多肽 (例如,淀粉酶)分子的多核苷酸,从而使得所有20种天然氨基酸呈 现在对应于亲本多核苷酸中诱变的密码子位置的一个特定氨基酸位置 处(其他方面使用少于所有20种天然组合)。可以对由每个饱和诱变 反应容器产生的32倍简并后代多肽实施克隆扩增(例如使用例如表达 载体克隆到合适的宿主例如大肠杆菌宿主内)且实施表达筛选。当单 个后代多肽通过筛选进行鉴定,以显示性质中有利的改变时(当与亲 本多肽比较时,例如在碱性或酸性条件下增加的蛋白酶解活性),它 可以进行测序,以鉴定在其中包含的相应有利的氨基酸置换。
在一个方面,如本文公开的,使用饱和诱变使亲本多肽的每个和 每一个氨基酸位置诱变后,可以鉴定在超过一个氨基酸位置处有利的 氨基酸改变。可以产生包含这些有利的氨基酸置换的所有或部分组合 的一个或多个新后代分子。例如,如果在多肽中的3个氨基酸位置的 每个中鉴定了2个特别有利的氨基酸改变,那么排列包括在每个位置 (与原始氨基酸没有改变,和2种有利改变中的每种)和3个位置处 的3种可能性。因此,存在3×3×3或27种总可能性,包括先前检 查的7种6种单个点突变(即在3个位置的每个处2种)和在任 何位置处无改变。
在另一个方面,位点饱和诱变可以连同另一种随机或非随机方法 组合使用以改变序列,例如合成连接重新装配(参见下文)、改组、 嵌合化、重组和其他诱变过程和诱变试剂。本发明提供了以迭代方式 的任何诱变过程的使用,包括饱和诱变。
合成连接重新装配(SLR)
本发明提供了称为“合成连接重新装配”、或简单地“SLR”、 “定向进化过程”的非随机基因修饰系统,以产生具有新或改变性质 的多肽,例如本发明的淀粉酶或抗体。SLR是使寡核苷酸片段非随机 地连接在一起的方法。这种方法不同于随机寡核苷酸改组之处在于, 核酸构件块不进行随机改组、链接或嵌合化,而是非随机地进行装配。 参见例如,美国专利号6,773,900;6,740,506;6,713,282;6,635,449; 6,605,449;6,537,776.。
在一个方面,SLR包含下述步骤:(a)提供模板多核苷酸,其中 模板多核苷酸包含编码同源基因的序列;(b)提供多个构件块多核苷 酸,其中构件块多核苷酸设计为可与模板多核苷酸在预定序列处交错 重新装配,并且构件块多核苷酸包含其为同源基因变体的序列和与变 体序列侧面的模板多核苷酸同源的序列;(c)使构件块寡核苷酸与模 板多核苷酸组合,从而使得构件块多核苷酸可与模板多核苷酸交错重 新装配,以产生包含同源基因序列变化的多核苷酸。
SLR不依赖待重排的多核苷酸之间的高同源性水平的存在。因此, 这种方法可以用于非随机地产生包含超过10100种不同嵌合体的后代分 子文库(或组)。SLR可以用于产生包含超过101000种不同后代嵌合体 的文库。因此,本发明的方面包括产生最终的嵌合核酸分子组的非随 机方法,所述最终的嵌合核酸分子共享(shaving)通过设计选择的总 体装配顺序。这种方法包括下述步骤:通过设计具有适用的彼此相容 的可连接末端的多个特定核酸构件块,和使这些核酸构件块装配,从 而使得达到设计的总体装配顺序。
待装配的核酸构件块的彼此相容的可连接末端被视为“适用”于 这个类型的有序装配,如果它们使得构件块能够以预定顺序偶联。因 此,其中可以偶联的核酸构件块的总体装配顺序通过可连接末端的设 计指定。如果待使用超过一个装配步骤,那么其中核酸构件块可以偶 联的总体装配顺序也通过一个或多个装配步骤的顺次顺序指定。在一 个方面,退火的构件片用酶例如连接酶(例如T4DNA连接酶)进行处 理,以达到构件片的共价键合。
在一个方面,寡核苷酸构件块的设计通过分析祖先核酸序列模板 组来获得,所述祖先核酸序列模板组充当用于产生最终的嵌合多核苷 酸后代组的基础。这些亲本寡核苷酸模板因此充当序列信息来源,其 帮助设计待诱变的例如嵌合化或改组的核酸构件块。在这种方法的一 个方面,多个亲本核酸模板的序列进行对比,以便选择一个或多个分 界点。分界点可以位于同源性区域处,并且包含一个或多个核苷酸。 这些分界点优选由至少2个祖先模板共享。分界点因此可以用于描绘 待产生的寡核苷酸构件块的边界,以便使亲本多核苷酸重排。在祖先 分子中鉴定和选择的分界点在最终嵌合后代分子的装配中充当潜在的 嵌合化点。分界点可以是由2个亲本多核苷酸序列共享的同源性区域 (包含至少一个同源核苷酸碱基)。可替代地,分界点可以是由至少 一半的亲本多核苷酸序列共享的同源性区域,或它可以是由至少三分 之二的亲本多核苷酸序列共享的同源性区域。甚至更优选地,适用的 分界点是由至少四分之三的亲本多核苷酸序列共享的同源性区域,或, 它可以由几乎所有亲本多核苷酸序列共享。在一个方面,分界点是由 所有亲本多核苷酸序列共享的同源性区域。
在一个方面,彻底地进行连接重新装配过程,以便产生详尽的后 代嵌合多核苷酸文库。换言之,核酸构件块的所有可能的有序组合呈 现在最终的嵌合核酸分子组中。同时,在另一个方面,在每个组合中 的装配顺序(即每个最终的嵌合核酸的5′至3序列中每个构件块的装 配顺序)经由如上所述的设计(或非随机的)。因为本发明的非随机 性质,极大减少了不希望有的副产品的可能性。
在另一个方面,系统地执行连接重新装配方法。例如,执行该方 法,以便产生后代分子的系统区室化文库,具有可以系统地例如一个 一个地筛选的区室。换言之,本发明提供了通过选择性和慎重使用特 定核酸构件块,与选择性和慎重使用顺次逐步装配反应偶联,可以达 到其中后代产物的特定组在几个反应容器的每一个中进行的设计。这 允许执行系统检查和筛选操作。因此,这些方法允许以较小的组系统 地检查潜在大量的后代分子。因为它以高度灵活但也彻底和系统的方 式执行嵌合化的能力,特别是当后代分子中存在低水平同源性时,这 些方法为产生包含大量后代分子的文库(或组)作准备。因为本连接 重新装配发明的非随机性质,所产生的后代分子优选包含具有通过设 计选择的总体装配顺序的最终嵌合核酸分子文库。饱和诱变和最佳定 向进化方法也可以用于产生不同的后代分子种类。应当理解本发明提 供了关于选择分界点、核酸构件块的大小和数目、以及偶联的大小和 设计的选择和控制自由。此外,应当理解关于分子间同源性的需求对 于本发明的操作性是高度放宽的。事实上,甚至可以在很少或无分子 间同源性的区域中选择分界点。例如,由于密码子摇摆,即密码子的 简并性,可以将核苷酸置换引入核酸构件块内,而不改变在相应的祖 先模板中最初编码的氨基酸。
可替代地,密码子可以这样改变,使得改变关于原始氨基酸的编 码。本发明提供了此种置换可以引入核酸构件块内,以便增加分子间 同源分界点的发生率,且从而允许在构件块中达到增加数目的偶联, 这依次允许产生大量后代嵌合分子。
在另一个方面,其中产生构件块的步骤的合成性质允许设计和引 入核苷酸(例如,一个或多个核苷酸,其可以是例如密码子或内含子 或调节序列),其随后可以在体外过程(例如,通过诱变)或体内过 程(例如通过利用宿主生物的基因剪接能力)中任选地去除。应当理 解在许多情况下,由于许多其他原因加上产生适用的分界点的潜在利 益,这些核苷酸的引入也可以是希望的。
在一个方面,核酸构件块用于引入内含子。因此,根据本文描述 的方法将功能内含子引入制造的人造基因内。一个或多个人为引入的 内含子可以在宿主细胞中对于基因剪接起作用,其方式非常类似天然 存在的内含子在基因剪接中功能地起作用。
最佳定向进化系统
本发明提供了称为“最佳定向进化系统”的非随机基因修饰系统, 以产生具有新或改变性质的多肽,例如本发明的淀粉酶或抗体。最佳 定向进化涉及减少再分布、重组和选择的重复循环的使用,其允许核 酸通过重组的定向分子进化。最佳定向进化允许产生大群体的进化嵌 合序列,其中所产生的群体就具有预定数目的交换事件的序列进行显 著富集。
交换事件是其中序列中的转变从一个亲本变体到另一个亲本变体 发生的嵌合序列中的点。此种点通常在接合处,其中来自2个亲本的 寡核苷酸连接在一起以形成单个序列。这种方法允许计算寡核苷酸序 列的正确浓度,从而使得序列的最终嵌合群体就所选择数目的交换事 件进行富集。这提供了超过选择具有预定数目的交换事件的嵌合变体 的更多控制。
此外,这种方法提供了与其他系统比较,关于使用极大量的可能 蛋白质变体空间的常规方法。先前,如果在反应过程中产生了例如1013 嵌合分子,那么将非常难以就比活性测试此种大量的嵌合变体。此外, 显著部分的后代群体将具有极高量的交换事件,这导致较不可能具有 增加水平的比活性的蛋白质。通过使用这些方法,嵌合分子群体可以 就具有特定数目的交换事件的那些变体就行富集。因此,尽管在反应 过程中仍可以产生1013嵌合分子,但选择用于进一步分析的每个分子 最可能具有例如仅3个交换事件。因为所产生的后代群体可以进行倾 斜,以具有预定数目的交换事件,但在嵌合分子之间的功能变种上的 边界减少。当计算来自最初亲本多核苷酸的何种寡核苷酸可能负责影 响特定性状时,这提供了更多可管理数目的变量。
用于制备嵌合后代多核苷酸序列的一种方法是制备对应于每个亲 本序列的片段或部分的寡核苷酸。每个寡核苷酸优选包括独特的重叠 区域,从而使得寡核苷酸混合在一起导致新变体,其具有以正确顺序 装配的每个寡核苷酸片段。用于实践本发明的这些方法的可替代方案 可以在美国专利号6,773,900;6,740,506;6,713,282;6,635,449; 6,605,449;6,537,776;6,361,974中找到。
对于每个亲本变体产生的寡核苷酸数目与最终制备的嵌合分子中 所产生的交换总数目具有关联。例如,可以提供3个亲本核苷酸序列 变体,以经历连接反应,以便发现例如在高温下具有更大活性的嵌合 变体。作为一个例子,可以产生对应于每个亲本变体的每个部分具有 50个寡核苷酸序列的组。因此,在连接重新装配过程中,在每个嵌合 序列内可能存在高达50个交换事件。每个所产生的嵌合多核苷酸将以 交替顺序包含来自每个亲本变体的寡核苷酸的可能性极低。如果每个 寡核苷酸片段以相同摩尔量存在于连接反应中,那么可能在某些位置 中来自相同亲本寡核苷酸的寡核苷酸将紧接于彼此连接,并且因此不 导致交换事件。如果在这个例子中来自每个亲本的每个寡核苷酸的浓 度在任何连接步骤过程中保持恒定,那么存在来自相同亲本变体的寡 核苷酸将在嵌合序列内连接且不产生交换的1/3机会(假定3个亲本)。
因此,给定亲本变体组数目,对应于每个变体的寡核苷酸数目、 和在连接反应中每个步骤过程中每个变体的浓度,可以测定概率密度 函数(PDF),以预测在连接反应中每个步骤过程中可能发生的交换事 件群体。在测定PDF后的统计学和数学在下文描述。通过利用这些方 法,可以计算此种概率密度函数,并且因此就起因于特定连接反应的 预定数目的交换事件富集嵌合后代群体。此外,可以预定靶数目的交 换事件,并且系统随后按程序工作,以计算在连接反应中每个步骤过 程中每个亲本寡核苷酸的起始量,以导致集中于预定数目的交换事件 的概率密度函数。这些方法涉及减少再分布、重组和选择的重复循环 的使用,其允许编码多肽的核酸通过重组的定向分子进化。这个系统 允许产生大群体的进化嵌合序列,其中所产生的群体就具有预定数目 的交换事件的序列进行显著富集。交换事件是其中序列中的转变从一 个亲本变体到另一个亲本变体发生的嵌合序列中的点。此种点通常在 接合处,其中来自2个亲本的寡核苷酸连接在一起以形成单个序列。 该方法允许计算寡核苷酸序列的正确浓度,从而使得序列的最终嵌合 群体就所选择数目的交换事件进行富集。这提供了超过选择具有预定 数目的交换事件的嵌合变体的更多控制。
此外,这些方法提供了与其他系统比较,关于运用极大量的可能 蛋白质变体空间的常规方法。通过使用本文描述的方法,嵌合分子群 体可以就具有特定数目的交换事件的那些变体就行富集。因此,尽管 在反应过程中仍可以产生1013嵌合分子,但选择用于进一步分析的每 个分子最可能具有例如仅3个交换事件。因为所产生的后代群体可以 进行倾斜,以具有预定数目的交换事件,但在嵌合分子之间的功能变 种上的边界减少。当计算来自最初亲本多核苷酸的何种寡核苷酸可能 负责影响特定性状时,这提供了更多可管理数目的变量。
在一个方面,通过制备对应于每个亲本序列的片段或部分的寡核 苷酸,该方法制备了嵌合后代多核苷酸序列。每个寡核苷酸优选包括 独特的重叠区域,从而使得寡核苷酸混合在一起导致新变体,其具有 以正确顺序装配的每个寡核苷酸片段。还参见美国专利号6,773,900; 6,740,506;6,713,282;6,635,449;6,605,449;6,537,776; 6,361,974。
测定交换事件
本发明的方面包括接受所需交换概率密度函数(PDF)、待重新装 配的亲本基因数目、和重新装配中的片段数目作为输入的系统和软件。 这个程序的输出是“片段PDF”,其可以用于测定关于生产重新装配 基因的配方,和这些基因估计的交换PDF。本文描述的过程优选在 MATLABTM(The Mathworks,Natick,Massachusetts)——用于技 术计算的编程语言和开发环境中进行。
迭代过程
在实践本发明中,这些过程可以进行迭代重复。例如,负责改变 或新淀粉酶表型的核酸(或,核酸)进行鉴定、重新分离、再次修饰、 就活性进行重新测试。这个过程可以迭代重复,直至改造所需表型。 例如,整个生物化学合成代谢或分解代谢途径可以改造到细胞内,包 括例如淀粉水解活性。
类似地,如果测定特定寡核苷酸对所需性状(例如,新淀粉酶表 型)完全没有影响,那么通过合成包括待去除序列的较大亲本寡核苷 酸,它可以作为变量被去除。因为在较大序列内掺入该序列阻止任何 交换事件,所以将不再存在这个序列在后代多核苷酸中的任何变化。 测定何种寡核苷酸与所需性状最相关和何种无关的这个迭代实践,允 许更有效的研究可能提供特定性状或活性的所有可能的蛋白质变体。
体内改组
分子的体内改组可以在本发明中使用,其提供本发明的多肽的变 体,例如抗体、淀粉酶等。利用细胞重组多聚体的天然性质可以执行 体内改组。尽管体内重组已提供关于分子多样性的主要天然途径,遗 传重组仍是相对复杂的过程,其涉及1)同源性的识别;2)链切割、 链侵入和导致产生重组交叉的代谢步骤;和最后地3)在不连续重组 分子内交叉的分辨。交叉的形成要求同源序列的识别。
在一个方面,本发明提供了用于从至少第一多核苷酸(例如,本 发明的淀粉酶和/或葡糖淀粉酶)和第二多核苷酸(例如,酶,例如本 发明的淀粉酶和/或葡糖淀粉酶或任何其他淀粉酶,或标签或表位)产 生杂交多核苷酸的方法。通过引入至少第一多核苷酸和第二多核苷酸, 本发明可以用于产生杂交多核苷酸,所述第一多核苷酸和第二多核苷 酸在合适的宿主细胞内共享至少一个部分序列同源性区域。部分序列 同源性区域促进导致产生杂交多核苷酸的序列重新组织的过程。如本 文所使用的,术语“杂交多核苷酸”是任何核苷酸序列,其起因于本 发明的方法,且包含来自至少2个原始多核苷酸序列的序列。此种杂 交多核苷酸可以起因于分子间重组事件,其促进DNA分子之间的序列 整合。此外,此种杂交多核苷酸可以起因于分子内的减少再分布过程, 其利用重复序列以改变DNA分子内的核苷酸序列。
产生序列变体
本发明还提供了用于制备本发明的核酸(例如,淀粉酶)序列的 序列变体的另外方法。本发明还提供了使用本发明的核酸和多肽用于 分离淀粉酶的另外方法。在一个方面,本发明提供了本发明的淀粉酶 编码序列(例如,基因、cDNA或信使)的变体,其可以通过任何方法 加以改变,包括例如任意或随机方法,或非随机或“定向进化”方法, 如上文描述的。
分离的变体可以是天然存在的。变体也可以在体外进行制备。变 体可以使用基因工程技术进行制备,例如定点诱变、随机化学诱变、 核酸外切酶III缺失操作、和标准克隆技术。可替代地,此种变体、 片段、类似物或衍生物可以使用化学合成或修饰操作进行制备。制备 变体的其他方法也是本领域技术人员熟悉的。这些包括其中得自天然 分离物的核酸序列进行修饰以产生核酸的操作,所述核酸编码具有增 强其在工业或实验室应用中的价值的特征的多肽。在此种操作中,产 生且表征就得自天然分离物的序列而言具有一个或多个核苷酸差异的 大量变体序列。这些核苷酸差异可以导致就由来自天然分离物的核酸 编码的多肽而言的氨基酸改变。
例如,变体可以使用易错PCR进行制备。在易错PCR中,PCR在 其中DNA聚合酶的复制保真度很低的条件下执行,从而使得沿着PCR 产物的全长获得高点突变率。易错PCR例如在Leung,D.W.,等人, Technique,1:11-15,1989)和Caldwell,R.C.& Joyce G.F., PCR Methods Applic.,2:28-33,1992中描述。简言之,在此种操 作中,使待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq 聚合酶和合适浓度的dNTPs混合,用于达到沿着PCR产物的全长的高 点突变率。例如,反应可以使用20fmoles的待诱变核酸、30pmole 的每种PCR引物、反应缓冲液来进行,所述反应缓冲液包含50mM KCl、 10mM Tris HCl(pH 8.3)和0.01%明胶、7mM MgCl2、0.5mM MnCl2、 5单位Taq聚合酶、0.2mM dGTP、0.2mM dATP、1mM dCTP和1mM dTTP。 PCR可以执行94℃1分钟、45℃1分钟和72℃1分钟的30个循环。 然而,应当理解适当时,这些参数可以加以改变。将诱变的核酸克隆 到合适的载体内,并且评估由诱变的核酸编码的多肽的活性。
变体也可以使用寡核苷酸定向的诱变进行制备,以产生在任何克 隆的目的DNA中的位点特异性突变。寡核苷酸诱变例如在 Reidhaar-Olson(1988)Science 241:53-57中描述。简言之,在此 种操作中,合成具有待引入克隆DNA内的一个或多个突变的多个双链 寡核苷酸,并且插入待诱变的克隆DNA内。回收包含诱变的DNA的克 隆,并且评估它们编码的多肽的活性。
用于产生变体的另一种方法是装配PCR。装配PCR涉及从小DNA 片段的混合物装配PCR产物。大量不同的PCR反应在相同小瓶中平行 发生,其中一个反应的产物引发另一个反应的产物。装配PCR在例如 美国专利号5,965,408中描述。
产生变体的另外一种方法是有性PCR诱变。在有性PCR诱变中, 由于DNA分子基于序列同源性的随机片段化,随后为在PCR反应中通 过引物延伸的交换固定,被迫的同源重组在体外在具有不同但高度相 关的DNA序列的DNA分子之间发生。有性PCR诱变例如在Stemmer (1994)Proc.Natl.Acad.Sci.USA 91:10747-10751中描述。简 言之,在此种操作中,待重组的多个核酸用DNA酶进行消化,以产生 具有50-200个核苷酸的平均大小的片段。所需平均大小的片段进行纯 化且重悬于PCR混合物中。PCR在促进核酸片段之间的重组的条件下 进行。例如,PCR可以通过使纯化片段以10-30ng/∶l的浓度重悬于 溶液中来进行,所述溶液具有0.2mM的每种dNTP、2.2mM MgCl2、50mM KCL、10mM Tris HCl、pH 9.0和0.1%Triton X-100。加入2.5单位 Taq聚合酶/100∶1反应混合物,并且使用下述方案进行PCR:94℃60 秒、94℃30秒、50-55℃30秒、72℃30秒(30-45次)和72℃5 分钟。然而,应当理解适当时,这些参数可以加以改变。在某些方面, 寡核苷酸可以包括在PCR反应中。在其他方面,DNA聚合酶I的Klenow 片段可以用于第一组PCR反应中,和Taq聚合酶可以用于后一组PCR 反应中。分离重组序列,并且评估它们编码的多肽的活性。
变体还可以通过体内诱变进行制备。在某些方面,在目的序列中 的随机突变通过在细菌菌株例如大肠杆菌菌株中繁殖目的序列来产 生,所述细菌菌株携带在一种或多种DNA修复途径中的突变。此种“增 变”菌株具有比野生型亲本更高的随机突变率。在这些菌株之一中繁 殖DNA将最终产生DNA内的随机突变。适合于用于体内诱变的增变菌 株例如在PCT公开号WO 91/16427中描述。
变体还可以使用盒式诱变来产生。在盒式诱变中,小区域的双链 DNA分子用不同于天然序列的合成寡核苷酸“盒”替换。寡核苷酸通 常包含完全和/或部分随机化的天然序列。
递归总体诱变也可以用于产生变体。递归总体诱变是开发用于蛋 白质工程(蛋白质诱变)的算法,以产生其成员在氨基酸序列方面不 同的表型相关突变体的不同群体。这种方法使用反馈机制以控制组合 盒式诱变的顺次循环。递归总体诱变例如在Arkin(1992)Proc.Natl. Acad.Sci.USA 89:7811-7815中描述。
在某些方面,使用指数总体诱变制备变体。指数总体诱变是用于 产生具有高百分比的独特和功能突变体的组合文库的过程,其中小群 体的残基平行随机化,以鉴定在每个改变的位置处导致功能蛋白质的 氨基酸。指数总体诱变例如在Delegrave(1993)Biotechnology Res. 11:1548-1552中描述。随机化和定点诱变在例如Arnold(1993) Current Opinion in Biotechnology 4:450-455中描述。
在某些方面,变体使用改组操作进行制备,其中编码不同多肽的 多个核酸的部分融合在一起,以制备编码嵌合多肽的嵌合核酸序列, 如在例如美国专利号5,965,408;5,939,250中描述的(还参见上文讨 论)。
本发明还提供了本发明的多肽(例如,淀粉酶)的变体,其包含 其中一个或多个氨基酸残基(例如,本发明的示例性多肽的)由保守 或非保守氨基酸残基(例如,保守氨基酸残基)置换的序列,并且此 种置换的氨基酸残基可以由或不由遗传密码编码。保守置换是经由类 似特征的另一个氨基酸置换多肽中的给定氨基酸的那些。因此,本发 明的多肽包括具有本发明序列,例如本发明的示例性多肽的保守置换 的那些,包括但不限于下述替换:用另一个脂肪族氨基酸替换脂肪族 氨基酸,例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸;用苏氨酸替换丝 氨酸或反之亦然;用另一个酸性残基替换酸性残基,例如天冬氨酸和 谷氨酸;用另一个具有酰胺基的残基替换具有酰胺基的残基,例如天 冬酰胺和谷氨酰胺;用另一个碱性残基交换碱性残基,例如赖氨酸和 精氨酸;和用另一个芳香族残基替换芳香族残基,例如苯丙氨酸、酪 氨酸。其他变体是其中本发明的多肽的一个或多个氨基酸残基包括取 代基的那些。保守氨基酸置换还可以包含用一个氨基酸置换相同类别 的另一个(例如,用一个疏水性氨基酸,例如异亮氨酸、缬氨酸、亮 氨酸或甲硫氨酸置换另一个,或用一个极性氨基酸置换另一个,例如 精氨酸置换赖氨酸、谷氨酸置换天冬氨酸或谷氨酰胺置换天冬酰胺)。 一个或多个氨基酸可以例如从淀粉酶中缺失,导致多肽的结构的修饰, 而不显著改变其生物活性。例如,可以去除并非淀粉酶活性所需的氨 基或羧基末端氨基酸。
在本发明的范围内的其他变体是其中多肽与另一种化合物结合的 那些,所述另一种化合物例如增加多肽的半衰期的化合物,例如聚乙 二醇。
在本发明的范围内的另外变体是其中另外的氨基酸与多肽融合融 合的那些,所述另外的氨基酸例如前导序列、分泌序列、前蛋白序列 或者促进多肽的纯化、富集或稳定的序列。
在某些方面,本发明的多肽的变体、片段、衍生物和类似物保留 与示例性多肽相同的生物功能或活性,例如淀粉酶活性,如本文所描 述的。在其他方面,变体、片段、衍生物或类似物包括前蛋白,从而 使得变体、片段、衍生物或类似物可以通过切割前蛋白部分进行激活, 以产生活性多肽。
优化密码子以在宿主细胞中达到高水平的蛋白质表达
本发明提供了用于修饰编码淀粉酶的和编码葡糖淀粉酶的核酸以 修饰密码子使用,以及密码子优化的编码淀粉酶的和编码葡糖淀粉酶 的核酸的方法,包括示例性SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81和SEQ ID NO:82;编码本发明的这些示例性的淀粉酶和编码 葡糖淀粉酶核酸如下文实施例28中详细讨论的分别由SEQ ID NO:51、 SEQ ID NO:3、SEQ ID NO:47和SEQ ID NO:25产生:
  酶   野生型SEQ ID   NO:   密码子优化的SEQ   ID NO:   淀粉   酶   51   79   淀粉   酶   3   80   葡糖   淀粉酶   47   81   葡糖   淀粉酶   25   82
在一个方面,本发明提供了用于修饰编码淀粉酶的核酸中的密码 子,以增加或减少其在宿主细胞中的表达的方法。本发明还提供了编 码淀粉酶的核酸,其被修饰以增加其在宿主细胞中的表达的,如此修 饰的淀粉酶,和制备经修饰的淀粉酶的方法。该方法包括鉴定编码淀 粉酶的和编码葡糖淀粉酶的核酸中的“非优选”或“较不优选的”密 码子,并且用编码与替换密码子相同的氨基酸的“优选密码子”替换 这些非优选或较不优选的密码子中的一个或多个,并且核酸中的至少 一个非优选或较不优选的密码子已由编码相同氨基酸的优选密码子替 换。优选密码子是在宿主细胞的基因中的编码序列中过度表现的密码 子,并且非优选或较不优选的密码子是在宿主细胞的基因中的编码序 列中表现不足的密码子。
用于表达本发明的核酸、表达盒和载体的宿主细胞包括细菌、酵 母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供 了用于优化所有这些细胞中的密码子使用的方法,密码子改变的核酸 和由密码子改变的核酸制备的多肽。示例性宿主细胞包括革兰氏阴性 菌,例如来自埃希杆菌属或假单胞菌属的任何物种,例如大肠埃希杆 菌和荧光假单胞菌);或革兰氏阳性菌,例如来自芽孢杆菌属、链霉 菌属、乳球菌属、乳杆菌属的任何物种,例如蜡状芽孢杆菌、加氏乳 杆菌(Lactobacillus gasseri)、乳酸乳球菌、乳脂乳球菌 (Lactococcus cremoris)、枯草芽孢杆菌。示例性宿主细胞还包括 真核生物,例如各种酵母,例如裂殖酵母属物种、曲霉菌属物种、汉 森酵母菌属(Hansenula sp.)、克鲁维酵母属、毕赤酵母属物种和酵 母菌属物种,包括例如,酿酒酵母、栗酒裂殖酵母、巴斯德毕赤酵母 和乳酸克鲁维酵母、多形汉森酵母(Hansenula polymorpha)、黑曲 霉,以及哺乳动物细胞和细胞系和昆虫细胞和细胞系。因此,本发明 还包括就在这些生物和物种中的表达优化的核酸和多肽。
例如,编码从细菌细胞中分离的淀粉酶的核酸的密码子如此进行 修饰,使得核酸在不同于淀粉酶从其中衍生的细菌的细菌细胞、酵母、 真菌、植物细胞、昆虫细胞或哺乳动物细胞中进行优化表达。用于优 化密码子的方法是本领域众所周知的。参见例如,美国专利号 5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale (1998)Protein Expr.Purif.12:185-188;Narum(2001)Infect. Immun.69:7250-7253。还参见描述在小鼠系统中的优化密码子的 Narum(2001)Infect.Immun.69:7250-7253;描述在酵母中的优 化密码子的Outchkourov(2002)Protein Expr.Purif.24:18-24; 描述在大肠杆菌中的优化密码子的Feng(2000)Biochemistry 39: 15399-15409;描述影响在大肠杆菌中的分泌的优化密码子使用的 Humphreys(2000)Protein Expr.Purif.20:252-264。
转基因非人动物
本发明提供了包含本发明的核酸、多肽(例如,淀粉酶)、表达 盒或载体或者转染或转化细胞的转基因非人动物。本发明还提供了制 备和使用这些转基因非人动物的方法。
转基因非人动物可以是例如包含本发明的核酸的山羊、兔、绵羊、 猪、牛、大鼠和小鼠。这些动物可以例如用作体内模型以研究淀粉酶 活性,或用作模型以筛选改变体内淀粉酶活性的试剂。关于待在转基 因非人动物中表达的多肽的编码序列可以设计为组成性的,或在组织 特异性、发育特异性或可诱导的转录调节因子的控制下。转基因非人 动物可以使用本领域已知的任何方法进行设计和产生;参见例如,描 述制备和使用转化细胞和卵和转基因小鼠、大鼠、兔、绵羊、猪和牛 的美国专利号6,211,428;6,187,992;6,156,952;6,118,044; 6,111,166;6,107,541;5,959,171;5,922,854;5,892,070; 5,880,327;5,891,698;5,639,940;5,573,933;5,387,742; 5,087,571。还参见例如,描述在转基因产乳动物的乳中生产重组蛋白 质的Pollock(1999)J.Immunol.Methods 231:147-157;证实转 基因山羊的生产的Baguisi(1999)Nat.Biotechnol.17:456-461。 美国专利号6,211,428描述了制备和使用在其脑中表达包含DNA序列 的核酸构建体的转基因非人动物。美国专利号5,387,742描述了将克 隆的重组或合成DNA序列注入受精小鼠卵内,将注射卵植入假孕雌性 中,并且生长成转基因小鼠,其细胞表达与阿尔茨海默病的病理学相 关的蛋白质。美国专利号6,187,992描述了制备和使用转基因小鼠, 其基因组包含编码淀粉样前体蛋白(APP)的基因的断裂。
“击倒动物”也可以用于实践本发明的方法。例如,在一个方面, 本发明的转基因或修饰动物包含经改造未表达内源基因的“击倒动 物”,例如“击倒小鼠”,所述内源基因用表达本发明的淀粉酶和/ 或葡糖淀粉酶,或包含本发明的淀粉酶和/或葡糖淀粉酶的融合蛋白的 基因替换。
转基因植物和种子
本发明提供了包含本发明的核酸、多肽(例如,葡聚糖酶、甘露 聚糖酶或木聚糖酶)、表达盒或载体或者转染或转化细胞的转基因植 物和种子。本发明还提供了包含本发明的核酸和/或多肽(例如,葡聚 糖酶、甘露聚糖酶或木聚糖酶)的植物产品,例如油、种子、叶、提 取物等。转基因植物可以是双子叶植物(双子叶)或单子叶植物(单 子叶)。本发明提供了具有改良的味道、干物质含量和/或纹理的转基 因植物,其中那种修饰通过在转基因植物(或种子、或果实等)中组 成性或选择性表达本发明的至少一种酶来产生,如例如美国专利申请 号20060195940中描述的。
本发明还提供了制备和使用这些转基因植物和种子的方法。表达 本发明的多肽的转基因植物或植物细胞可以依照本发明已知的任何方 法进行构建,参见例如,美国专利号6,309,872。
本发明的核酸和表达构建体可以通过任何方法引入植物细胞内。 在多核苷酸例如目的核苷酸构建体的背景中的术语“引入”,意指以 这样的方式将多核苷酸呈递给植物,使得多核苷酸进入植物细胞的内 部。当引入超过一种多核苷酸时,这些多核苷酸可以作为单个核苷酸 构建体的部分进行装配,或作为分开的核苷酸构建体进行装配,并且 可以位于相同或不同转化载体上。因此,这些多核苷酸可以在单个转 化事件中,在分开的转化事件中引入目的宿主细胞内,或例如作为育 种方案的部分引入植物中。本发明的方法不依赖用于将一种或多种多 核苷酸引入植物内的具体方法,仅依赖一种或多种多核苷酸进入植物 的至少一个细胞的内部。用于将多核苷酸引入植物内的方法是本领域 已知的,包括但不限于瞬时转化方法、稳定转化方法和病毒介导的方 法。
在多核苷酸的背景中的“瞬时转化”意指多核苷酸引入植物内, 并且不整合到植物的基因组内。
在多核苷酸引入植物内的背景中的“稳定引入”意指引入的多核 苷酸稳定掺入植物基因组内,并且因此植物用多核苷酸稳定转化。
在可替代实施方案中,“稳定转化”或“稳定转化的”意指,引 入植物内的多核苷酸例如本文描述的核苷酸构建体整合到植物的基因 组内,并且能够由其后代,更具体而言,由多个连续代的后代遗传。 引入所需植物的基因组内可以是这样的,使得酶由内源转录或翻译控 制元件调节。关于单子叶植物和单子叶植物的转化技术是本领域众所 周知的。
本发明的核酸可以用于对基本上任何植物赋予所需性状。本发明 的核酸可以用于操纵植物的代谢途径,以便优化或改变宿主的葡聚糖 酶、甘露聚糖酶或木聚糖酶表达。它们可以改变植物中的淀粉酶、葡 糖淀粉酶、葡聚糖酶、甘露聚糖酶或木聚糖酶活性。可替代地,本发 明的淀粉酶、葡糖淀粉酶、葡聚糖酶、甘露聚糖酶或木聚糖酶可以用 于生产转基因植物,以生产未天然地由那种植物生产的化合物。这可 以降低生产成本或制备新产物。在一个实施方案中,本发明的酶可以 以这样的方式进行表达,使得酶直到需要时才与其底物接触。例如, 本发明的酶可以靶向且保留在植物细胞的内质网中。酶在细胞的内质 网中的保留将阻止酶与其底物接触。酶和底物随后可以通过能够破坏 亚细胞构造的任何方式接触,所述方式例如研磨、磨碎、加热等。参 见WO 98/11235、WO 2003/18766和WO 2005/096704,所有所述专利 在此引入作为参考。
可选择的标记基因可以加入基因构建体中,以便鉴定已成功地整 合转基因的植物细胞或组织。这可能是必需的,因为达到基因在植物 细胞中的掺入和表达是罕见事件,在仅少数百分比的靶组织或细胞中 发生。可选标记基因编码提供对于试剂的抗性的蛋白质,所述试剂通 常对于植物是毒性的,例如抗生素或除草剂。当在包含合适的抗生素 或除草剂的培养基上生长时,仅已整合可选标记基因的植物细胞将存 活。在转化中常规使用的可选标记包括,赋予对于卡那霉素和相关抗 生素的抗性的npt11基因(Messing & Vierra.Gene 19:259-268 (1982);Bevan等人,Nature 304:184-187(1983)),赋予对 于除草剂草胺膦的抗性的bar基因(White等人,Nucl.Acids Res 18:1062(1990),Spencer等人Theor.Appl.Genet 79:625-631 (1990)),赋予对于抗生素潮霉素的抗性的hph基因(Blochinger & Diggelmann,Mol Cell Biol 4:2929-2931),赋予对于methatrexate (氨甲蝶呤)的抗性的dhfr基因(Bourouis等人,EMBO J.2(7): 1099-1104(1983)),赋予对于草甘膦的抗性的EPSPS基因(美国专 利号4,940,935和5,188,642)。
可替代地,转基因植物材料可以通过阳性选择系统进行鉴定,例 如利用甘露糖-6-磷酸异构酶的系统,其提供代谢甘露糖的能力(美国 专利号5,767,378和5,994,629)
在一个方面,制备转基因植物或种子包含将本发明的序列和任选 地标记基因掺入靶表达构建体(例如质粒)内,连同启动子和终止子 序列的定位。这可以涉及通过合适的方法将修饰基因转移到植物内。 本发明的一种或多种序列可以与这样的序列组合,所述序列赋予对于 昆虫、疾病、干旱的抗性,增加产量,改善谷粒的营养状况,改善乙 醇产量等。
例如,构建体可以使用诸如植物细胞原生质体的电穿孔和显微注 射的技术直接引入植物细胞的基因组DNA内,或构建体可以使用冲击 方法例如DNA粒子轰击直接引入植物组织内。例如,参见例如,讨论 使用粒子轰击以将转基因引入小麦内的Christou(1997)Plant Mol. Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30; Klein(1987)Nature 327:70-73;Takumi(1997)Genes Genet.Syst. 72:63-69;和关于使用粒子轰击以将YACs引入植物细胞内的Adam (1997)同上。例如,Rinehart(1997)同上,使用粒子轰击以产生 转基因棉花植物。关于使粒子加速的仪器在美国专利号5,015,580中 描述;和商购可得的粒子加速器械;还参见,描述裸子植物的粒子介 导的转化的美国专利号5,608,148;和Ellis,美国专利号5,681,730。
在一个方面,原生质体可以进行固定,且用核酸例如表达构建体 进行注射。尽管由原生质体的植物再生对于谷类是不容易的,但使用 来自原生质体衍生的愈伤组织的体细胞胚胎发育,植物再生在豆类中 是可能的。组织化的组织可以使用基因枪技术用裸露DNA进行转化, 其中将DNA包被在钨微粒上,击中细胞的百分之一大小,其携带DNA 深入细胞和细胞器内。转化组织随后通常通过体细胞胚胎发育进行诱 导以再生。这种技术已在几个谷类物种包括玉蜀黍和稻中成功。
核酸例如表达构建体可以使用重组病毒引入植物细胞内。植物细 胞可以使用病毒载体例如烟草花叶病毒衍生的载体(Rouwendal(1997) Plant Mol.Biol.33:989-999)进行转化,参见Porta(1996)“Use of viral replicons for the expression of genes in plants,”Mol. Biotechnol.5:209-221。
可替代地,核酸例如表达构建体可以与合适的T-DNA侧翼区组合, 且引入常规的根瘤土壤杆菌宿主载体内。当细胞由细菌感染时,根瘤 土壤杆菌宿主的毒性功能将使构建体和邻近标记的插入片段导入植物 细胞DNA内。根瘤土壤杆菌介导的转化技术,包括解除和双元载体的 使用,在科学文献中充分描述。参见例如,Horsch(1984)Science 233: 496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA80:4803(1983); Gene Transfer to Plants,Potrykus,编辑(Springerlag,Berlin 1995)。根瘤土壤杆菌细胞中的DNA包含在细菌染色体以及称为Ti(肿 瘤诱导的)质粒的另一种结构中。Ti质粒包含在传染过程中转移至植 物细胞的称为T-DNA的DNA段(长~20kb),和指导传染过程的一系 列vir(毒性)基因。根瘤土壤杆菌仅可以通过伤口感染植物:当植 物根或茎受伤时,它发出某些化学信号,土壤杆菌属的vir基因因响 应所述化学信号而变得激活,并且指导关于T-DNA从Ti质粒转移到植 物的染色体所需的一系列事件。T-DNA随后通过伤口进入植物细胞。 一个推测是T-DNA等待直至植物DNA被复制或转录,随后将其自身插 入暴露的植物DNA内。为了使用根瘤土壤杆菌作为转基因载体,必须 去除T-DNA的肿瘤诱导部分,而保留T-DNA边界区域和vir基因。转 基因随后插入T-DNA边界区域之间,在其中它转移至植物细胞,并且 变得整合到植物的染色体内。
本发明提供了使用本发明的核酸转化单子叶植物,包括重要的谷 类,参见Hiei(1997)Plant Mol.Biol.35:205-218。还参见,例 如讨论T-DNA整合到基因组DNA内的Horsch,Science(1984)233: 496;Fraley(1983)Proc.Natl.Acad.Sci USA 80:4803;Thykjaer (1997)同上;Park(1996)Plant Mol.Biol.32:1135-1148。还 参见描述关于包含基因的DNA稳定整合的过程的D′Halluin,美国专 利号5,712,135,所述基因在谷类或其他单子叶植物的细胞中起作用,
在一个方面,第三个步骤可以涉及能够将所整合的靶基因传递给 下一代的全植物的选择和再生。此种再生技术依赖在组织培养生长培 养基中某些植物激素的操作,一般依赖已连同所需核苷酸序列引入的 杀生物剂和/或除草剂标记。来自培养原生质体的植物再生在Evans 等人,Protoplasts Isolation and Culture,Handbook of Plant Cell Culture,第124-176页,MacMillilan Publishing Company,New York, 1983;和Binding,Regeneration of Plants,Plant Protoplasts, 第21-73页,CRC Press,Boca Raton,1985中描述。再生也可以得 自植物愈合组织、外植体、器官或其部分。此种再生技术一般在Klee (1987)Ann.Rev.of Plant Phys.38:467-486中描述。为了从转 基因组织例如未成熟胚获得全植物,它们可以在受控环境条件下在包 含营养素和激素的一系列培养基中生长,称为组织培养的过程。一旦 全植物生长且生产种子,就开始后代的评估。
在表达盒稳定掺入转基因植物后,它可以通过有性杂交引入其他 植物内。可以使用许多标准育种技术中的任何一种,依赖待杂交的物 种。参见例如,Welsh J.R.,Fundamentals of Plant Genetics and Breeding,John Wiley & Sons,NY(1981);Crop Breeding,Wood D.R.(Ed.)American Society of Agronomy Madison,Wis.(1983); Mayo O.,The Theory of Plant Breeding,Second Edition,Clarendon Press,Oxford(1987);Singh,D.P.,Breeding for Resistance to Diseases and Insect Pests,Springer-Verlag,NY(1986); 以及Wricke和Weber,Quantitative Genetics and Selection Plant Breeding,Walter de Gruyter and Co.,Berlin(1986)。
因为本发明的核酸的转基因表达导致表型改变,所以包含本发明 的重组核酸的植物可以与第二种植物进行有性杂交,以获得最终产物。 因此,本发明的种子可以衍生自本发明的2种转基因植物的杂交,或 本发明的植物和另一种植物之间的杂交。当2种亲本植物都表达本发 明的多肽(例如,葡聚糖酶、甘露聚糖酶或木聚糖酶)时,可以增强 所需效应(例如,本发明的多肽的表达以产生其中开花行为改变的植 物)。所需效应可以通过标准繁殖方法传给未来的植物代。
任何植物都可以用于引入目的核苷酸,包括但不限于,玉米或玉 蜀黍(玉蜀黍)、芸苔属物种(例如,欧洲油菜、芜菁、芥菜),特 别是用作种子油来源的那些芸苔属物种,例如低芥酸菜子、苜蓿(紫 花苜蓿)、稻(水稻)、黑麦(黑麦)、高粱(双色高粱、高粱)、 栗(例如珍珠栗(珍珠栗)、黍(黍)、谷子(谷子)、穇子(穇子)、 向日葵(向日葵)、红花(红花)、小麦(小麦)、大豆(大豆)、 烟草(烟草)、马铃薯(马铃薯)、花生(花生)、棉花(海岛棉、 陆地棉)、甘薯(甘薯)、木薯(木薯)、咖啡(咖啡属物种)、椰 子(椰子)、菠萝(菠萝)、柑橘树(柑橘属物种)、可可(可可)、 茶(山茶)、香蕉(芭蕉属物种)、鳄梨(鳄梨)、无花果(无花果)、 番石榴(番石榴)、芒果(芒果)、橄榄(橄榄)、番木瓜(番木瓜、 腰果(腰果)、澳洲坚果(澳洲坚果)、杏仁(杏仁)、甜菜(甜菜)、 甘蔗(甘蔗属物种)、燕麦、大麦、蔬菜、观赏植物和针叶树。
蔬菜可以包括番茄(番茄)、莴苣(例如莴苣)、菜豆(菜豆)、 利马豆(利马豆)、豌豆(香豌豆属物种),和甜瓜属成员例如黄瓜 (黄瓜)、甜瓜(甜瓜)、和香瓜(香瓜)。观赏植物可以包括杜鹃 花(杜鹃花属物种)、绣球花(绣球花)、木槿((Hibiscus rosasanensis))、玫瑰(蔷薇属物种)、郁金香(郁金香属物种)、 水仙花(水仙属物种)、牵牛花(矮牵牛)、康乃馨(康乃馨)、一 品红(一品红)、美人蕉(美人蕉属物种)和菊花。可以采用针叶树, 包括例如,松树例如火炬松(火炬松)、湿地松(湿地松)、美国黄 松(美国黄松)、扭叶松(扭叶松)、和辐射松(辐射松)、花旗松 (花旗松);加拿大铁杉(加拿大铁杉);北美云杉(北美云杉); 红杉(红杉);真正的冷杉例如银杉(冷杉)和香脂冷杉(香脂冷杉); 和雪松例如西部红松(西部红松)和黄扁柏(黄扁柏)。豆科植物可 以包括但不限于,豆和豌豆。豆可以包括瓜尔豆、刺槐豆、葫芦巴、 大豆、菜豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。豆类 可以包括但不限于花生属例如花生,蚕豆属例如小冠花、毛苕子、赤 豆、绿豆和鹰嘴豆,羽扇豆属例如羽扇豆,三叶草属,菜豆属例如刀 豆和利马豆,豌豆属例如芸豆,草木犀属例如三叶草,苜蓿属例如苜 蓿,莲属例如车轴草,兵豆属例如小扁豆和紫穗槐。草料和草地草可 以包括苜蓿、柳枝稷(柳枝稷)、芒属、果园草、高羊茅、多年生黑 麦草、匍匐性本特草和小糠草。
特别有利的植物可以包括用于农作物植物和产生能量或燃料的植 物,例如玉蜀黍、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、 高粱、小麦、燕麦、黑麦、粟、大麦、稻、针叶树,草例如柳枝稷和 芒属,豆类作物,例如豌豆、豆和大豆,淀粉块茎/根,例如马铃薯、 甘薯、木薯、芋头、美人蕉、甜菜、甘蔗等。
在可替代实施方案中,本发明的核酸可以在包含纤维细胞的植物 中表达,所述植物包括例如棉花、丝棉树(木棉花(Kapok)、爪哇木 棉(Ceiba pentandra))、沙漠柳树、杂酚树、winterfat、轻木、 苎麻、洋麻、大麻、洛神葵、黄麻、剑麻马尼拉麻和亚麻。在可替代 实施方案中,本发明的转基因植物可以是棉属成员,包括任何棉属物 种的成员,包括亚洲棉(G.arboreum);草棉(G.herbaceum)、海 岛棉和陆地棉。
本发明还提供了用于生产大量本发明的多肽(例如葡聚糖酶、甘 露聚糖酶、或木聚糖酶或抗体)的转基因植物。例如,参见Palmgren (1997)Trends Genet.13:348;Chong(1997)Transgenic Res.6: 289-296(在转基因马铃薯植物中生产人乳蛋白质β-酪蛋白,使用植 物生长素诱导型、双向甘露碱合酶(mas1′,2′)启动子与根瘤土壤杆 菌介导的叶盘转化方法)。
使用已知操作,本领域技术人员可以通过检测转基因植物中转基 因mRNA或蛋白质的增加或减少来筛选本发明的植物。用于检测和定量 mRNAs或蛋白质的方法是本领域众所周知的。
多肽和肽
在一个方面,本发明提供了分离的、合成或重组多肽,其与本发 明的示例性序列,例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、 SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、 SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、 SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、 SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、 SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、 SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、 SEQ ID NO:74、SEQ ID NO:76和/或SEQ ID NO:78、及其子序列 和其变体具有序列同一性(例如,至少约50%、51%、52%、53%、 54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、 64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、 74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多、或完全(100%)序列 同一性)。序列同一性(同源性)可以在多肽的全长上,或同一性可 以在至少约10、15、20、25、30、35、40、45、50、55、60、65、70、 75、80、90、100、125、150、175、200、250、300、350、400、450、 500、550、600、650、700个或更多残基的区域上。
在一个实施方案中,本发明的多肽可以催化包含葡萄糖单体的多 糖,例如淀粉(由1,4-α或1,6-α键连接的葡萄糖单体聚合物)的水 解。在一个方面,多肽具有淀粉酶活性,例如α淀粉酶活性、内淀粉 酶活性、或葡糖淀粉酶活性;并且如本文所使用的,术语“淀粉酶” 还包括催化多糖、寡糖或淀粉的水解的酶活性。本发明的淀粉酶和/ 或葡糖淀粉酶包括具有下述活性的多肽:α-淀粉酶活性、β-淀粉酶 活性、葡糖淀粉酶活性、1,4-α-D-葡聚糖葡糖水解酶活性、外淀粉酶 活性、葡聚糖α-麦芽糖四水解酶活性、麦芽糖酶活性、异麦芽糖酶活 性、葡聚糖1,4,α-葡糖苷酶活性、α-葡糖苷酶活性、蔗糖酶活性或 琼脂糖酶活性(例如,β-琼脂糖酶活性)。例如,本发明的淀粉酶活 性包含α-淀粉酶活性,包括水解淀粉中的内部α-1,4-糖苷键以产生 更小分子量的麦芽糖糊精的能力。在一个方面,α-淀粉酶活性包括随 机水解淀粉中的内部α-1,4-糖苷键。本发明的淀粉酶活性包括具有葡 糖淀粉酶活性的多肽,例如水解由α-1,4-和α-1,6-糖苷键连接的葡 萄糖聚合物的能力。在一个方面,本发明的多肽具有葡糖淀粉酶活性, 水解内部α-1,4-糖苷键以产生更小分子量的麦芽糖糊精。本发明的淀 粉酶活性还包括葡聚糖1,4-α-葡糖苷酶活性,或1,4-α-D-葡聚糖葡 糖水解酶,通常称为葡糖淀粉酶但也称为淀粉葡糖苷酶,和γ-淀粉酶, 在一个方面,它从1,4-α-、1,6-α-和1,3-α-连接的葡聚糖中释放 β-D-葡萄糖。本发明的淀粉酶活性还包括外淀粉酶活性。
在一个实施方案中,本发明的多肽可以用于产生抗体,其与本发 明的多肽,例如本发明的示例性酶(例如,SEQ ID NO:2、SEQ ID NO: 4等)特异性结合(对于其特异)。
在一个方面,本发明的多肽的葡糖淀粉酶活性包含催化糖苷键的 水解。葡糖淀粉酶活性可以包含催化D-葡萄糖从淀粉或其他相关糊精 的非还原末端逐步水解释放。葡糖淀粉酶活性可以包含1,4-α-D-葡 聚糖葡糖水解酶活性。葡糖淀粉酶活性可以包含催化麦芽糖糊精的水 解,导致游离葡萄糖的产生。葡糖淀粉酶活性可以包含外淀粉酶活性。 葡糖淀粉酶活性可以包含α-淀粉酶或β-淀粉酶活性。水解的糖苷键 可以包含α-1,4-糖苷键或α-1,6-糖苷键。葡糖淀粉酶活性可以包含 水解多糖、寡糖或淀粉中的糖苷键。葡糖淀粉酶活性可以进一步包含 水解淀粉中的糖苷键,以产生麦芽糖糊精。葡糖淀粉酶活性可以包含 从多糖、寡糖或淀粉的非还原末端切割麦芽糖或D-葡萄糖单位。
在一个方面,本发明提供了其为内作用酶的α-淀粉酶(α-淀粉 酶),其可以使淀粉——由1,4-α或1,6-α键连接的葡萄糖单体聚合 物水解成短麦芽糖糊精。在一个方面,本发明提供了其为外作用水解 酶的葡糖淀粉酶,其可以从淀粉和相关多糖的非还原末端释放β-D- 葡萄糖。本发明的淀粉酶和/或葡糖淀粉酶可以在醇生产过程中在商业 上用于液化和糖化淀粉,使用例如干研磨过程的过程。在本发明的过 程的一个方面,对干研磨过程研磨的整个玉米(糊状物)实施升高的 温度(以促进淀粉的明胶化),且通过一种或多种热稳定的淀粉酶水 解,包括本发明的至少一种酶,导致多糖例如淀粉液化。在一个方面, 水解的多糖例如淀粉通过本发明的葡糖淀粉酶进行进一步消化,这可 以在糊状物温度冷却后加入;并且在一个方面,从多糖例如淀粉中释 放的葡萄糖通过酵母发酵成乙醇,所述酵母在多糖例如淀粉水解过程 结束时或在多糖例如淀粉的糖化过程中加入。
在一个方面,本发明的葡糖苷酶(例如,葡糖淀粉酶、α葡糖苷 酶)水解多糖、寡糖或淀粉中的内部多糖键,例如α-1,4-和1,6-糖 苷键,以产生更小分子量的麦芽糖糊精。在一个方面,这种水解在很 大程度上是随机的。因此,本发明提供了用于生产更小分子量的麦芽 糖糊精的方法。本发明的葡糖苷酶可以在实验室和工业设置中,用于 水解多糖、寡糖或淀粉、或任何含麦芽糖糊精化合物用于各种目的。 这些葡糖苷酶可以单独用于提供特定水解,或可以与其他葡糖苷酶组 合以提供具有广谱活性的“混合剂(cocktail)”。示例性用途包括 多糖、寡糖或淀粉、或任何含麦芽糖糊精化合物从生物、食物、动物 饲料、药学或工业样品中的去除或部分或完全水解。
例如,本发明的葡糖苷酶(例如,葡糖淀粉酶)可以在衣物洗涤 剂中进行配制,以帮助去除含多糖例如含淀粉污点。本发明的葡糖苷 酶可以用作洗涤剂基质中的清洁剂(参见下文工业应用)。本发明的 葡糖苷酶可以用于多糖例如淀粉加工的最初阶段(液化)中、湿玉米 研磨中、醇生产中、在纺织工业中用于淀粉脱浆、烘焙应用中、饮料 工业中、在油田钻探过程中、再循环纸的上墨中、和动物饲料中。
本发明的葡糖苷酶(例如,葡糖淀粉酶)在各种条件,例如在极 端pH和/或温度中、氧化剂等下可以具有葡糖淀粉酶活性。本发明提 供了导致可替代葡糖苷酶制剂的方法,所述葡糖苷酶制剂具有例如针 对温度、氧化剂和改变洗涤条件的不同催化效率和稳定性。在一个方 面,葡糖苷酶变体可以使用定点诱变和/或随机诱变技术来产生。在一 个方面,定向进化可以用于产生具有可替代特异性和稳定性的各种各 样葡糖苷酶变体。
本发明的蛋白质也用作研究试剂,以鉴定淀粉酶和/或葡糖淀粉酶 调节剂,例如淀粉酶和/或葡糖淀粉酶活性的活化剂或抑制剂。简言之, 将测试样品(化合物、肉汤、提取物等)加入淀粉酶和/或葡糖淀粉酶 测定中,以测定其抑制底物切割的能力。这样鉴定的抑制剂可以用于 工业和研究中,以减少或预防不希望有的蛋白酶解。与淀粉酶和/或葡 糖淀粉酶一样,抑制剂可以进行组合以增加活性谱。
本发明的淀粉酶和/或葡糖淀粉酶活性也包括在高温、低温、碱性 pHs和酸性pHs下水解多糖、寡糖或淀粉。例如,在一个方面,本发 明提供了具有热稳定的淀粉酶和/或葡糖淀粉酶活性的多肽、和编码其 的核酸。多肽在包含下述温度范围的条件下可以保留淀粉酶和/或葡糖 淀粉酶活性:约37℃-约95℃;约55℃-约85℃、约70℃-约95℃、 或约90℃-约95℃。在另一个方面,本发明的多肽可以具有耐热的淀 粉酶和/或葡糖淀粉酶活性。在暴露于超过37℃-约95℃或超过55℃- 约85℃范围中的任何地方的温度后,多肽可以保留淀粉酶和/或葡糖 淀粉酶活性。在一个方面,在pH 4.5下在暴露于90℃-约95℃的温度 后,多肽可以保留淀粉酶活性。
本发明提供了“氨基酸”或“本发明的氨基酸序列”,包括寡肽、 肽、多肽或蛋白质序列,或这些中的任何一个的片段、部分或亚单位, 和天然存在的、重组或合成分子。术语“多肽”和“蛋白质”包括通 过肽键或经修饰的肽键即肽等排物、或非肽键(合成键、合成多肽) 彼此连接的氨基酸,并且可以包含除20种基因编码的氨基酸外的经修 饰的氨基酸。术语“多肽”还包括肽和多肽片段、基序等。该术语还 包括糖基化多肽。本发明的肽和多肽还包括所有“模拟物”和“拟肽” 形式,如下文进一步详细描述的。
术语“分离的”包括从其原始环境例如天然环境中取出的材料, 如果它是天然存在的。例如,活动物中存在的天然存在的多核苷酸或 多肽不是分离的,但与天然系统中的某些或所有共存材料分开的相同 多核苷酸或多肽是分离的。此种多核苷酸可以是载体的部分,和/或此 种多核苷酸或多肽可以是组合物的部分,并且仍是分离的,因为此种 载体或组合物不是其天然环境的部分。如本文所使用的,分离的材料 或组合物也可以是“纯化的”组合物,即它不要求绝对纯度;相反, 它预期作为相对定义。从文库中获得的单个核酸可以进行照常规纯化 至电泳同质性。在可替代方面,本发明提供了已从基因组DNA或文库 中的其他序列或其他环境中纯化至少1、2、3、4、5个或更多数量级 的核酸。
本发明还提供了“淀粉酶变体”和“葡糖淀粉酶变体”,其可以 包含衍生自“前体淀粉酶”的氨基酸序列的氨基酸序列,例如在一个 方面,本发明的示例性序列(例如,SEQ ID NO:2、SEQ ID NO:4等, 或本发明的任何多肽)。前体葡糖淀粉酶或淀粉酶还可以包括天然存 在的葡糖淀粉酶或淀粉酶和重组淀粉酶。葡糖淀粉酶或淀粉酶变体的 氨基酸序列可以通过前体氨基酸序列的一个或多个氨基酸的置换、缺 失或插入而“衍生”自前体葡糖淀粉酶或淀粉酶氨基酸序列。此种修 饰可以是编码前体淀粉酶的氨基酸序列的“前体DNA序列”而不是前 体淀粉酶本身的操作。用于前体DNA序列的此种操作的合适方法包括 本文公开的方法,以及本领域技术人员已知的方法。
本发明的示例性序列的活性紧接着在下表(“表1”)中列出。 为了帮助阅读该表,例如在第一行中,SEQ ID NO:1、2代表具有由 例如SEQ ID NO:1编码的、如SEQ ID NO:2中所示序列的本发明的 示例性多肽;并且这个示例性序列最初从异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331中分离;未预测信号序列(但在某些细 胞中在体内条件下,该序列可能具有信号序列);该多肽具有“葡糖 苷酶”活性,这可以更具体地指定“淀粉酶”酶活性;以及关于淀粉 酶的相应“EC”编号(EC编号是根据由Enzyme Commission of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology或IUBMB开发的标准化酶命名 法方案指定给一类酶的编号);“CMB20”指“碳水化合物结合结构域”; 和最后一列指示“遗传来源”,或示例性序列的来源,如通过它最初 从其中分离的细胞的18/16S RNA的同源性分析测定的。在第二行中, SEQ ID NO:11、12代表具有由例如SEQ ID NO:11编码的、如SEQ ID NO:12中所示序列的本发明的示例性多肽;并且这个示例性序列最初 从未知来源中分离;“SS位点”指定其为信号序列的氨基酸末端残基, 并且对于SEQ ID NO:12,它是构成信号序列的氨基末端21个氨基酸 残基(或MFNQVLYGLAATALWQGQVVA,即SEQ ID NO:12的残基1-21); 并且该多肽具有“糖苷酶”活性,其可以更具体地指定为“糖淀粉酶” 酶活性;这种酶具有3.2.1.3的EC编号;具有“碳水化合物结合结构 域”;和它最初从其中分离的细胞的18/16S RNA的遗传匹配是木贼镰 刀菌(Fusarium equiseti)。



本发明的多肽也可以短于示例性多肽的全长。在可替代方面,本 发明提供了大小为约5至多肽例如酶,例如淀粉酶的全长的多肽(肽、 片段);示例性大小为约5、10、15、20、25、30、35、40、45、50、 55、60、65、70、75、80、85、90、100、125、150、175、200、250、 300、350、400、450、500、550、600、650、700个或更多残基,例 如本发明的示例性淀粉酶和/或葡糖淀粉酶的邻接残基。本发明的肽可 以用作例如标记探针、抗原、耐受原、基序、淀粉酶活性位点。
本发明的多肽和肽可以从天然来源中分离,是合成的,或重组产 生的多肽。肽和蛋白质可以在体外或体内进行重组表达。本发明的肽 和多肽可以使用本领域已知的任何方法进行制备和分离。本发明的多 肽和肽也可以使用本领域众所周知的化学方法进行整体或部分合成。 参见例如,Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223; Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K., Therapeutic Peptides and Proteins,Formulation,Processing and Delivery Systems(1995)Technomic Publishing Co.,Lancaster, PA。例如,肽合成可以使用各种固相技术来进行(参见例如,Roberge (1995)Science 269:202;Merrifield(1997)Methods Enzymol. 289:3-13),并且自动化合成可以例如使用ABI 431A Peptide Synthesizer(Perkin Elmer)依照由制造商提供的说明书来达到。
本发明的肽和多肽也可以是糖基化的。糖基化可以用化学方法或 通过细胞生物合成机制翻译后添加,其中后者掺入已知糖基化基序的 使用,这可以对于序列是天然的,或可以作为肽添加或在核酸编码序 列中添加。糖基化可以是O联的或N联的。糖基化可以加入本发明的 任何多肽中,以产生比“亲本”酶(对其添加糖基化)更耐热或更热 稳定的酶。糖基化可以用化学方法或通过细胞生物合成机制添加。
本发明提供了经过广泛范围的温度例如在约37℃下,具有在约 10-10,000、或100-约1000单位/毫克蛋白质范围中广泛范围的比活 性的淀粉酶。本发明的淀粉酶和/或葡糖淀粉酶也可以在高至120℃的 温度下具有活性。在可替代方面,在这些方法中使用的淀粉酶在这些 温度下达到,例如在约80℃-约115℃、约100℃-约110℃、和约105 ℃-约108℃的温度下有活性。然而,本发明的淀粉酶和/或葡糖淀粉 酶也可以在低温例如低至4℃-5℃下具有活性。
本发明的酶的Tm也可以通过热灭活进行转变(例如,可以转变至 约10℃-90℃)。例如SEQ ID NO:336/337的Tm可以通过热灭活转 变至约17℃-87℃:例如80℃预温育5分钟。
如上文定义的,本发明的肽和多肽包括所有“模拟物”和“拟肽” 形式。术语“模拟物”和“拟肽”指合成化学化合物,其具有本发明 多肽的基本上相同的结构和/或功能特征。模拟物可以完全由氨基酸的 合成、非天然类似物组成,或是部分天然的肽氨基酸和部分氨基酸的 非天然类似物的嵌合分子。模拟物也可以掺入任何量的天然氨基酸保 守置换,只要此种置换也基本上不改变模拟物的结构和/或活性。与其 为保守变体的本发明的多肽一样,例行实验将测定模拟物是否在本发 明的范围内,即,它的结构和/或功能基本上不改变。因此,在一个方 面,模拟组合物在本发明的范围内,如果它具有淀粉酶活性。
本发明的多肽模拟组合物可以包含非天然结构组分的任何组合 (例如,它们可以是完全或部分合成的,或“模拟的”)。在可替代 方面,本发明的模拟组合物包括下述3个结构组中的一种或全部:a) 除天然酰胺键(“肽键”)连接外的残基连接基团;b)代替非天然存 在的氨基酸残基的非天然残基;或c)诱导次级结构模拟的残基,即 诱导或稳定次级结构,例如β转角、γ转角、β折叠、α螺旋构象等。 例如,当它的所有或某些残基通过除天然肽键外的化学方法进行连接 时,本发明的多肽可以表征为模拟物。单个拟肽残基可以通过肽键、 其他化学键或偶联方法进行连接,例如,戊二醛、N-羟基琥珀酰亚胺 酯、双功能马来酰亚胺、N,N’-二环己基碳化二亚胺(DCC)或N,N’ -二异丙基碳化二亚胺(DIC)。可以替代常规酰胺键(“肽键”)连 接的连接基团包括例如,酮亚甲基(例如-C(=O)-CH2-用于-C(=O) -NH-)、氨基亚甲基(CH2-NH)、乙烯、烯烃(CH=CH)、乙醚(CH2-O)、 硫醚(CH2-S)、四唑(CN4-)、噻唑、逆酰胺(retroamide)、硫代 酰胺、或酯(参见例如,Spatola(1983)in Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,第7卷,第267-357页, “Peptide Backbone Modifications,”Marcell Dekker,NY)。
本发明的多肽也可以通过包含所有或某些非天然残基代替天然存 在的氨基酸残基而表征为模拟物。非天然残基在科学和专利文献中充 分描述;用作天然氨基酸残基的模拟物的少数示例性非天然组合物和 指导在下文描述。芳香族氨基酸的模拟物可以通过经由下述替换来产 生:例如D-或L-naphyl丙氨酸;D-或L-苯基甘氨酸;D-或L-2 thieneyl丙氨酸;D-或L-1、-2,3-或4-pyreneyl丙氨酸;D-或L-3 thieneyl丙氨酸;D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基) -丙氨酸;D-或L-(2-吡嗪基)-丙氨酸;D-或L-(4-异丙基)-苯基 甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯丙氨酸; D-对-氟-苯丙氨酸;D-或L-p-联苯苯丙氨酸;D-或L-对甲氧基-联苯 苯丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和,D-或L-烷基ainines (丙氨酸),其中烷基可以是取代或未取代的甲基、乙基、丙基、己 基、丁基、戊基、异丙基、异丁基、叔isotyl、异戊基或非酸性氨基 酸。非天然氨基酸的芳环包括例如噻唑基、苯硫基、吡唑基、苯并咪 唑基、萘基、呋喃基、吡咯基和吡啶基芳环。
酸性氨基酸的模拟物可以通过经由例如非羧化物氨基酸置换同时 维持负电荷来产生;(膦酰)丙氨酸;硫酸化苏氨酸。羧基侧基(例 如天冬氨酰或谷氨酰)也可以通过与碳化二亚胺(R’-N-C-N-R’)反 应进行选择性修饰,所述碳化二亚胺例如1-环己基-3(2-吗啉基-4(- 乙基)碳化二亚胺或1-乙基-3(4-氮鎓-4,4-二甲基戊基)碳化二亚 胺。天冬氨酰或谷氨酰也可以通过与铵离子反应而转变成天冬酰胺酰 和谷氨酰胺基残基。碱性氨基酸的模拟物可以通过用例如(除赖氨酸 和精氨酸外)氨基酸鸟氨酸、瓜氨酸或(胍基)-乙酸或(胍基)烷基 -乙酸置换来产生,其中烷基在上文定义。腈衍生物(例如包含CN-部 分代替COOH)可以置换天冬酰胺或谷氨酰胺。天冬酰胺酰和谷氨酰胺 酰残基可以脱氨成相应的天冬氨酰和谷氨酰残基。精氨酸残基模拟物 可以通过使精氨酰与例如一种或多种常规试剂反应来产生,所述常规 试剂包括例如苯甲酰甲醛、2,3-丁二酮、1,2-环己二酮、或茚三酮, 优选在碱性条件下。酪氨酸残基模拟物可以通过使酪氨酰与例如芳香 族重氮化合物或四硝基甲烷反应来产生。N-乙酰imidizol(咪唑)和 四硝基甲烷可以分别用于形成O-乙酰酪氨酰种类和3-硝基衍生物。半 胱氨酸残基模拟物可以通过使半胱氨酰残基与例如α-卤素乙酸盐反 应来产生,所述α-卤素乙酸盐例如2-氯乙酸或氯乙酰胺和相应的胺; 以产生羧甲基或羧基氨甲基衍生物。半胱氨酸残基模拟物也可以通过 使半胱氨酰残基与下述反应来产生:例如溴三氟丙酮、α-溴-β-(5- imidozoyl)丙酸;氯乙酰磷酸盐、N-烷基马来酰亚胺、3-硝基-2-吡 啶基二硫化物;甲基2-吡啶基二硫化物;对氯汞苯甲酸;2-氯汞基-4 硝基酚;或氯-7-硝基苯并-氧杂-1,3-二唑。赖氨酸模拟物可以通过使 赖氨酰与例如琥珀酸酐或其他羧酸酐反应来产生(和氨基末端残基可 以加以改变)。赖氨酸和其他含α-氨基残基模拟物也可以通过与酰亚 胺酯反应来产生,例如甲基picolinimidate、磷酸吡哆醛、吡哆醛、 硼氢化氯、三硝基苯磺酸、邻甲基异脲、2,4,戊二酮和转酰胺基酶催 化的与乙醛酸盐的反应。甲硫氨酸的模拟物可以通过与例如甲硫氨酸 亚砜反应来产生。脯氨酸的模拟物包括例如哌啶酸、噻唑烷羧酸、3- 或4-羟基脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸、或3,3-二甲基 脯氨酸。组氨酸氨基模拟物可以通过使组氨酰与例如二乙基焦碳酸酯 或对溴苯酰甲基溴反应来产生。其他模拟物包括例如通过脯氨酸和赖 氨酸的羟基化产生的那些;丝氨酰或苏氨酰残基的羟基的磷酸化;赖 氨酸、精氨酸和组氨酸的α-氨基的甲基化;N末端胺的乙酰化;主链 酰胺残基的甲基化或用N-甲基氨基酸置换;或C末端羧基的酰胺化。
本发明的多肽的残基例如氨基酸也可以通过相反手性的氨基酸 (或拟肽残基)进行替换。因此,L-构型(其也可以称为R或S,依 赖化学个体的结构)中天然存在的任何氨基酸可以用具有相同化学结 构类型或拟肽、但具有相反手性的氨基酸替换,所述氨基酸称为D-氨 基酸,但也可以称为R-或S-型。
本发明还提供了用于修饰本发明的多肽的方法和所产生的修饰多 肽,通过天然过程例如翻译后加工(例如,磷酸化、乙酰化等),或 通过化学修饰技术。修饰可以在多肽中的任何地方发生,包括肽主链、 氨基酸侧链和氨基或羧基末端。应当理解相同类型的修饰可以以相同 或不同程度存在于给定多肽的几个位点处。此外,给定多肽可能具有 多个类型的修饰。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、 黄素的共价附着、血红素部分的共价附着、核苷酸或核苷酸衍生物的 共价附着、脂质或脂质衍生物的共价附着、磷脂酰肌醇的共价附着、 交联环化、二硫键形成、脱甲基化、共价交联的形成、半胱氨酸的形 成、焦谷氨酸盐的形成、甲酰化、γ-羧化、糖基化、GPI锚形成、羟 基化、碘化、甲基化、myristolyation、氧化、聚乙二醇化、蛋白酶 解加工、磷酸化、异戊烯化、外消旋化、selenoylation、硫酸化、和 转移RNA介导的给蛋白质添加氨基酸例如精氨酰化。参见例如, Creighton,T.E.,Proteins-Structure and Molecular Properties 第2版,W.H.Freeman and Company,New York(1993); Posttranslational Covalent Modification of Proteins,B.C. Johnson,Ed.,Academic Press,New York,第1-12页(1983)。
固相化学肽合成方法也可以用于合成本发明的多肽或片段。此种 方法自20世纪60年代早期以来已是本领域已知的(Merrifield,R. B.,J.Am.Chem.Soc.,85:2149-2154,1963)(还参见Stewart, J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第2版, Pierce Chemical Co.,Rockford,I11.,第11-12页)),并且近 期已用于商购可得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)中。此种商购可得的实验室试剂盒一般已采 用H.M.Geysen等人,Proc.Natl.Acad.Sci.,USA,81:3998(1984) 的教导,并且为在许多“杆”或“针”的尖端上合成肽作准备,所有 所述“杆”或“针”与单块板连接。当采用此种系统时,使杆或针板 倒转,且插入相应孔或储库的第二块板内,所述第二块板包含用于使 合适的氨基酸与针或杆的尖端附着或锚定的溶液。通过重复此种加工 步骤,即倒转且将杆或针的尖端插入合适的溶液内,将氨基酸构建到 所需肽内。此外,许多可用的FMOC肽合成系统是可用的。例如,多肽 或片段的装配可以在固体载体上进行,使用Applied Biosystems,Inc. Model431ATM自动化肽合成仪。此种设备提供了本发明的肽的现成接 近,通过直接合成或通过可以使用其他已知技术偶联的一系列片段的 合成。
本发明提供了新葡糖淀粉酶和淀粉酶(例如α淀粉酶),包括本 发明的示例性酶,编码其的核酸、结合其的抗体、和用于制备且使用 其的方法。在一个方面,本发明的多肽具有淀粉酶和/或葡糖淀粉酶活 性,如本文所描述的,包括例如使多糖、寡糖和/或淀粉水解成糖的能 力。在一个方面,本发明的多肽具有葡糖淀粉酶或淀粉酶(例如,α 淀粉酶)活性。在可替代方面,本发明的淀粉酶和/或葡糖淀粉酶具有 这样的活性,其已由本文描述的示例性淀粉酶和/或葡糖淀粉酶的那些 进行修饰。
本发明包括含和不含信号序列(包括本发明的信号序列,参见例 如表1,或其他信号序列)的本发明的淀粉酶和/或葡糖淀粉酶和其自 身的信号序列(例如,表1)。本发明还包括包含本发明的信号序列 的多肽(例如,融合蛋白),参见例如,表1。包含本发明的信号序 列的多肽可以是本发明的淀粉酶和/或葡糖淀粉酶或另一种淀粉酶或 另一种酶或其他多肽。
本发明包括固定的淀粉酶、葡糖淀粉酶、抗葡糖淀粉酶、抗淀粉 酶及其片段。本发明提供了用于抑制淀粉酶和/或葡糖淀粉酶活性的方 法,例如使用显性失活突变体或本发明的抗淀粉酶或抗葡糖淀粉酶抗 体。本发明包括包含本发明的淀粉酶和/或葡糖淀粉酶的杂络物,例如 融合蛋白、异二聚体等。
在一个方面,本发明的淀粉酶(例如,α淀粉酶)和/或葡糖淀粉 酶水解淀粉中的内部多糖或寡糖键,例如α-1,4-和1,6-糖苷键,以 产生更小分子量的麦芽糖糊精。在一个方面,这种水解在很大程度上 是随机的。因此,本发明提供了用于生产更小分子量的麦芽糖糊精的 方法。
本发明的淀粉酶和/或葡糖淀粉酶可以用于实验室和工业设置中, 以为了各种目的用于水解多糖、寡糖或淀粉、或任何含麦芽糖糊精化 合物。这些淀粉酶和/或葡糖淀粉酶可以单独用于提供特定水解,或可 以与其他淀粉酶组合以提供具有广谱活性的“混合剂”。示例性用途 包括多糖、寡糖或淀粉、或任何含麦芽糖糊精化合物从生物、食物、 动物饲料、药学或工业样品中的去除或部分或完全水解。
例如,本发明的淀粉酶可以在衣物洗涤剂中进行配制,以帮助去 除含多糖例如含淀粉污点。在一个方面,本发明提供了包含本发明的 淀粉酶和/或葡糖淀粉酶的洗涤剂,包括在碱性条件下的淀粉酶和/或 葡糖淀粉酶活性,和制备且使用其的方法。这些洗涤剂组合物包括洗 衣和洗碗(例如自动洗碗)溶液和应用。本发明的淀粉酶和/或葡糖淀 粉酶可以用作洗涤剂基质中的清洁剂(参见下文工业应用)。本发明 的淀粉酶和/或葡糖淀粉酶可以用于多糖例如淀粉加工的最初阶段(液 化)中、湿玉米研磨中、醇生产中、在纺织工业中用于多糖例如淀粉 脱浆、烘焙应用中、饮料工业中、在油田钻探过程中;再循环纸的上 墨中;和动物饲料中。
本发明的淀粉酶和/或葡糖淀粉酶在各种条件,例如在极端pH和/ 或温度中、氧化剂等下可以具有淀粉酶活性。本发明提供了导致可替 代淀粉酶制剂的方法,所述淀粉酶制剂具有例如针对温度、氧化剂和 改变洗涤条件的不同催化效率和稳定性。在一个方面,淀粉酶变体可 以使用定点诱变和/或随机诱变技术来产生。在一个方面,定向进化可 以用于产生具有可替代特异性和稳定性的各种各样淀粉酶变体。
本发明还提供了使用本发明的核酸、多肽和抗体开发新淀粉酶和/ 或葡糖淀粉酶的方法。在一个方面,就基于表达的淀粉酶开发筛选λ 噬菌体文库。在一个方面,本发明在筛选中使用λ噬菌体文库,以允 许检测毒性克隆;对底物改善的接近;关于改造宿主的减少需要,绕 过关于起因于文库的大量切除的任何偏移的潜力;和在低克隆密度下 的更快生长。λ噬菌体文库的筛选可以在液相或固相中。在一个方面, 本发明提供了在液相中的筛选。这产生了在测试条件下的更大灵活性; 另外的底物灵活性;关于弱克隆的更高灵敏度;和超过固相筛选的容 易自动化。
本发明提供了使用本发明的蛋白质和核酸以及机器人自动化的筛 选方法,以使得能够在短时间段例如每天内执行数千个生物催化反应 和筛选测定,以及确保高水平的精确度和重现性(参见下文阵列的讨 论)。因此,可以在数周内产生衍生化合物文库。关于分子包括小分 子修饰的进一步教导,参见PCT/US94/09174。
本发明包括其为非天然存在的羰基水解酶变体(例如淀粉酶和/ 或葡糖淀粉酶变体)的淀粉酶和/或葡糖淀粉酶,与变体的氨基酸序列 由其衍生的前体羰基水解酶比较,具有不同的蛋白酶解活性、稳定性、 底物特异性、pH谱和/或性能特征。具体地,此种淀粉酶变体具有在 自然界中未发现的氨基酸序列,其通过用不同氨基酸置换前体淀粉酶 和/或葡糖淀粉酶的多个氨基酸残基而获得。前体淀粉酶和/或葡糖淀 粉酶可以是天然存在的淀粉酶或重组淀粉酶。有用的淀粉酶和/或葡糖 淀粉酶变体包含在指定氨基酸残基位置处任何天然存在的L-氨基酸 的置换。
淀粉酶和葡糖淀粉酶信号序列
本发明提供了由肽组成或包含肽的信号序列,所述肽具有包含本 发明的多肽的残基1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、 1-20、1-21、1-22、1-23、1-24、1-25、1-26、1-27、1-28、1-28、 1-30或1-31、1-32、1-33、1-34、1-35、1-36、1-37、1-38或1-39、 或更长的序列。例如,本发明提供了淀粉酶(例如,α淀粉酶)或葡 糖淀粉酶信号序列和编码这些信号序列的核酸,例如具有如上表中所 示的序列的本发明的示例性肽。
本发明的淀粉酶和/或葡糖淀粉酶信号序列可以是分离的肽,或与 另一种淀粉酶和/或葡糖淀粉酶或非淀粉酶或非葡糖淀粉酶多肽连接 的序列,例如作为融合蛋白。在一个方面,本发明提供了包含本发明 的淀粉酶和/或葡糖淀粉酶信号序列的多肽。在一个方面,包含本发明 的淀粉酶和/或葡糖淀粉酶信号序列的多肽包含对于本发明的淀粉酶 和/或葡糖淀粉酶异源的序列(例如,包含本发明的淀粉酶信号序列和 来自另一种淀粉酶和非淀粉酶蛋白质的序列的融合蛋白)。在一个方 面,本发明提供了具有异源信号序列,例如具有酵母信号序列的序列 的淀粉酶和/或葡糖淀粉酶。例如,本发明的淀粉酶和/或葡糖淀粉酶 包含在载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中的异 源信号序列。
在一个方面,本发明的信号序列在鉴定新淀粉酶和/或葡糖淀粉酶 多肽后进行鉴定。通过其蛋白质进行分选且转运至其正确的细胞位置 的途径通常称为蛋白质靶向途径。在所有这些靶向系统中最重要的元 件之一是在称为信号序列的新合成多肽的氨基末端处的短氨基酸序 列。这种信号序列将蛋白质导向其在细胞中的合适位置,并且在转运 过程中或当蛋白质达到其最终目的地时去除。大多数溶酶体、膜或分 泌蛋白质具有氨基末端信号序列,这使得它们用于易位到内质网的腔 内。关于在这个组中的蛋白质的超过100种信号序列已得到测定。信 号序列在长度中可以从约13-36或约10-40个氨基酸残基中的任何地 方不同。识别信号序列的各种方法是本领域技术人员已知的。例如, 在一个方面,新淀粉酶信号肽通过称为SIGNALPTM的方法进行鉴定。 SIGNALPTM使用识别信号肽及其切割位点的组合神经网络;参见例如, Nielsen(1997)″Identification of pr okaryotic and eukaryotic signal peptides and prediction of their cleavage sites”,Protein Engineering,第10卷,no.1,第1-6页。
应当理解在某些方面,本发明的淀粉酶和/或葡糖淀粉酶可能不具 有信号序列。在一个方面,本发明提供了缺乏全部或部分信号序列, 例如本发明的信号序列(参见表1)的本发明的淀粉酶和/或葡糖淀粉 酶。在一个方面,本发明提供了编码来自一种淀粉酶的信号序列的核 酸序列,所述核酸序列与不同淀粉酶的核酸序列可操作地连接,或任 选地来自非淀粉酶蛋白质的信号序列可能是希望的。表1显示了本发 明的示例性信号序列。
淀粉酶和糖淀粉酶原初(prepro)和信号序列和催化结构域
除如上文讨论的信号序列(例如,信号肽(SPs))外,本发明提 供了原初结构域和催化结构域(CDs)。本发明的SPs、原初结构域和 /或CDs可以是分离的、合成或重组肽,或可以是融合蛋白的部分,例 如作为嵌合蛋白质中的异源结构域。本发明提供了编码这些催化结构 域(CDs)(例如,“活性位点”)、原初结构域和信号序列(SPs, 例如具有包含本发明多肽的氨基末端残基或由本发明多肽的氨基末端 残基组成的序列的肽)的核酸。
本发明的淀粉酶和/或葡糖淀粉酶信号序列(SPs)、催化结构域 (CDs)和/或原初结构域可以是分离的肽、或与另一种淀粉酶或非淀 粉酶或非葡糖淀粉酶多肽连接的序列,例如作为融合(嵌合)蛋白。 在一个方面,包含本发明的淀粉酶信号序列SPs和/或原初的多肽包含 对于本发明的淀粉酶和/或葡糖淀粉酶异源的序列(例如,包含本发明 的SP和/或原初和来自另一种淀粉酶和/或葡糖淀粉酶、或非淀粉酶或 非葡糖淀粉酶蛋白质的融合蛋白)。在一个方面,本发明提供了具有 异源CDs、SPs和/或原初序列,例如具有酵母信号序列的序列的本发 明的淀粉酶和/或葡糖淀粉酶。本发明的淀粉酶和/或葡糖淀粉酶可以 包含在载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中的异 源CD、SP和/或原初。
在一个方面,本发明的SPs、CDs和/或原初序列在鉴定新淀粉酶 多肽后进行鉴定。通过其蛋白质进行分选且转运至其正确的细胞位置 的途径通常称为蛋白质靶向途径。在所有这些靶向系统中最重要的元 件之一是在称为信号序列的新合成多肽的氨基末端处的短氨基酸序 列。这种信号序列将蛋白质导向其在细胞中的合适位置,并且在转运 过程中或当蛋白质达到其最终目的地时去除。大多数溶酶体、膜或分 泌蛋白质具有氨基末端信号序列,这使得它们用于易位到内质网的腔 内。信号序列在长度中可以从约13-45个或更多氨基酸残基不同。识 别信号序列的各种方法是本领域技术人员已知的。例如,在一个方面, 新水解酶信号肽通过称为SignalP的方法进行鉴定。SignalP使用识 别信号肽及其切割位点的组合神经网络。(Nielsen,等人, ″Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites.″Protein Engineering, 第10卷,no.1,第1-6页(1997)。
在某些方面,本发明的淀粉酶和/或葡糖淀粉酶可能不具有SPs 和/或原初序列和/或催化结构域(CDs)。在一个方面,本发明提供了 缺乏全部或部分SP、CD和/或原初结构域的淀粉酶和/或葡糖淀粉酶。 在一个方面,本发明提供了编码来自一种淀粉酶和/或葡糖淀粉酶的信 号序列(SP)、CD和/或原初的核酸序列,所述核酸序列与不同淀粉 酶和/或葡糖淀粉酶的核酸序列可操作地连接,或任选地来自非淀粉酶 或非葡糖淀粉酶蛋白质的信号序列(SPs)、CD和/或原初结构域可能 是希望的。
本发明还提供了分离的、合成或重组多肽,其包含本发明的信号 序列(SPs)、原初结构域和/或催化结构域(CDs)和异源序列。异源 序列是与SP、原初结构域和/或CD未天然结合(例如与淀粉酶)的序 列。SP、原初结构域和/或CD与其未天然结合的序列可以在SP、原初 结构域和/或CD的氨基末端、SP和/或CD的羧基末端和/或2个末端 上。在一个方面,本发明提供了分离的、合成或重组多肽,其包含(或 由......组成)含有本发明的信号序列(SP)、原初结构域和/或催化结 构域(CD)的多肽,条件是它不与任何序列结合,所述任何序列与其 天然结合(例如,淀粉酶和/或葡糖淀粉酶序列)。类似地在一个方面, 本发明提供了编码这些多肽的分离的、合成或重组核酸。因此,在一 个方面,本发明的分离的、合成或重组核酸包含关于本发明的信号序 列(SP)、原初结构域和/或催化结构域(CD)的信号序列和异源序列 (即,与本发明的信号序列(SP)、原初结构域和/或催化结构域(CD) 未天然结合的序列)。异源序列可以在SP、原初结构域和/或CD编码 序列的3′末端、5′末端和/或2个末端上。
本发明的多肽包括以活性或灭活形式的淀粉酶和/或葡糖淀粉酶。 例如,本发明的多肽包括在原初序列的“成熟”或加工前的前蛋白, 例如通过前蛋白加工酶,例如前蛋白转换酶,以产生“活性”成熟蛋 白质。本发明的多肽包括由于其他原因灭活的淀粉酶和/或葡糖淀粉 酶,例如在通过翻译后加工事件“活化”前,例如内肽酶或外肽酶或 蛋白水解酶作用、磷酸化事件、酰胺化、糖基化或硫酸化、二聚化事 件等。用于鉴定“原初”结构域序列、CDs和信号序列的方法是本领 域众所周知的,参见例如,Van de Ven(1993)Crit.Rev.Oncog.4 (2):115-136。例如,为了鉴定原初序列,蛋白质由细胞外间隙进 行纯化,并且N末端蛋白质序列进行测定且与未加工形式进行比较。
本发明的多肽包括本发明的酶的所有活性形式,包括活性子序列, 例如催化结构域(CDs)或活性位点。在一个方面,本发明提供了如下 文所示的催化结构域或活性位点。在一个方面,本发明提供了包含活 性位点结构域或由活性位点结构域组成的肽或多肽,如通过使用数据 库例如Pfam(其是包含许多常见蛋白质家族的多重序列比对和隐马尔 科夫模型的大集合,Pfam蛋白质家族数据库,A.Bateman,E.Birney, L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones, K.L.Howe,M.Marshall,and E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)或等价物预测的。
杂种淀粉酶和葡糖淀粉酶、以及肽文库
在一个方面,本发明提供了包含本发明的序列的杂种淀粉酶和/ 或葡糖淀粉酶和融合蛋白,包括肽文库。本发明的肽序列可以用于分 离靶的肽调节剂(例如活化剂或抑制剂),例如淀粉酶和/或葡糖淀粉 酶底物、受体、酶。本发明的肽文库可以用于鉴定靶的正式结合配偶 体,例如配体,例如细胞因子、激素等。
在一个方面,本发明的融合蛋白(例如,肽部分)在构象上稳定 (相对于线性肽),以允许对于靶的更高结合亲和力。本发明提供了 本发明的淀粉酶和/或葡糖淀粉酶和其他肽,包括已知和随机肽的融合 物。它们可以以这样的方式进行融合,使得淀粉酶和/或葡糖淀粉酶的 结构未显著扰乱,并且肽在代谢或结构上是构象稳定的。这允许制备 就其在细胞内的存在及其量容易进行监控的肽文库。
本发明的氨基酸序列变体可以通过变化的预定性质进行表征,使 它们远离天然存在的形式的特征,例如淀粉酶和/或葡糖淀粉酶序列的 等位基因或种间变化。在一个方面,本发明的变体显示与天然存在的 类似物相同性质的生物活性。可替代,变体可以就具有修饰特征进行 选择。在一个方面,尽管用于引入氨基酸序列变化的位点或区域是预 定的,但突变本身无需是预定的。例如,为了优化突变在给定位点处 的性能,随机诱变可以在靶密码子或区域处进行,并且所表达的淀粉 酶和/或葡糖淀粉酶变体就所需活性的最佳组合进行筛选。用于制备在 具有已知序列的DNA中的预定位点处的置换突变的技术是众所周知 的,如本文讨论的,例如M13引物诱变和PCR诱变。突变体的筛选可 以使用蛋白酶解活性的测定来完成。在可替代方面,氨基酸置换可以 是单个残基;插入可以是约1-20个氨基酸的等级,尽管可以完成明显 更大的插入。缺失可以是约1-约20、30、40、50、60、70个残基或 更多。为了获得具有最佳性质的最终衍生物,可以使用置换、缺失、 插入或其任何组合。一般地,这些改变可以对于少数氨基酸完成,以 使分子的改变降到最低。然而,在某些情况下,更大的改变可以是耐 受的。
本发明提供了淀粉酶和/或葡糖淀粉酶,其中多肽主链的结构、二 级或三级结构,例如α-螺旋或β-折叠结构已进行修饰。在一个方面, 电荷或疏水性已进行修饰。在一个方面,侧链容积已进行修饰。功能 或免疫学个性中的基本改变通过选择较不保守的置换来进行。例如, 可以制备更显著影响的置换:在改变区域中的多肽主链的结构,例如 α-螺旋或β-折叠结构;分子的电荷或疏水位点,这可以在活性位点 处;或侧链。本发明提供了在本发明的多肽中的置换,其中(a)亲水 残基,例如丝氨酰或苏氨酰,置换(或由其置换)疏水残基,例如亮 氨酰、异亮氨酰、苯丙氨酰、缬氨酰或丙氨酰;(b)半胱氨酸或脯氨 酸置换(或由其置换)任何其他残基;(c)具有正电性侧链的残基, 例如赖氨酰、精氨酰或组氨酰,置换(或由其置换)负电性残基,例 如谷氨酰或天冬氨酰;或(d)具有大侧链的残基,例如苯丙氨酸,置 换(或由其置换)不具有侧链的残基,例如甘氨酸。变体可以显示相 同性质的生物活性(即淀粉酶和/或葡糖淀粉酶活性),尽管需要时可 以选择变体,以修饰淀粉酶和/或葡糖淀粉酶的特征。
在一个方面,本发明的淀粉酶和/或葡糖淀粉酶包含表位或纯化标 签、信号序列或其他融合序列等。在一个方面,本发明的淀粉酶和/ 或葡糖淀粉酶可以与随机肽融合,以形成融合多肽。“融合的”或“可 操作地连接的”在本文中意指随机肽和淀粉酶和/或葡糖淀粉酶以这样 的方式连接在一起,以便使对于淀粉酶和/或葡糖淀粉酶结构的稳定性 的破坏降到最低,例如它保留淀粉酶和/或葡糖淀粉酶活性。融合多肽 (或编码融合多肽的融合多核苷酸)也可以包含进一步的组分,包括 在多个环处的多个肽。
在一个方面,肽和编码其的核酸进行随机化,完全随机化或它们 在其随机化方面进行偏移,例如在一般地核苷酸/残基频率或每个位置 中。“随机化的”意指每个核酸和肽分别由基本上随机的核苷酸和氨 基酸组成。在一个方面,产生肽的核酸可以进行化学合成,并且因此 可以在任何位置处掺入任何核苷酸。因此,当核酸进行表达以形成肽 时,任何氨基酸残基可以在任何位置处掺入。合成过程可以设计为产 生随机化的核酸,以允许所有或大多数可能的组合在核酸的全长上形 成,从而形成随机化核酸文库。文库可以提供足够地结构上分散的随 机化表达产物群体,以影响细胞应答的概率上足够的范围,以提供显 示所需应答的一种或多种细胞。因此,本发明提供了充分大的相互作 用文库,从而使得它的至少一种成员将具有对其给予关于某些分子、 蛋白质或其他因子的亲和力的结构。
筛选方法和“在线”监控装置
在实践本发明的方法中,各种仪器和方法可以与本发明的多肽和 核酸结合使用,例如以就淀粉酶和/或葡糖淀粉酶活性筛选多肽,以作 为淀粉酶和/或葡糖淀粉酶活性的潜在调节剂例如活化剂或抑制剂、就 与本发明的多肽结合的抗体、就与本发明的核酸杂交的核酸而筛选化 合物,以就表达本发明的多肽等的细胞筛选。
毛细管阵列
毛细管阵列例如GIGAMATRIXTM,Diversa Corporation,San Diego,CA可以用于本发明的方法中。本发明的核酸或多肽可以固定 或应用于阵列,包括毛细管阵列。阵列可以用于就其与本发明的核酸 或多肽结合或调节本发明的核酸或多肽的活性的能力筛选或监控组合 物(例如小分子、抗体、核酸等)文库。毛细管阵列提供用于保持且 筛选样品的另一个系统。例如,样品筛选仪器可以包括在邻近毛细管 的阵列上形成的多个毛细管,其中每个毛细管包含限定用于保留样品 的腔的至少一个壁。仪器可以进一步包括排列在阵列中的邻近毛细管 之间的间质材料,以及在间质材料内形成的一个或多个参考标记。用 于筛选样品的毛细管,其中毛细管适合于在毛细管阵列中结合,可以 包括限定用于限定用于保留样品的腔的第一个壁,和由过滤材料形成 的第二个壁,用于过滤提供给腔的激发能以激发样品。
多肽或核酸例如配体可以引入第一种组分内进入毛细管阵列的毛 细管的至少部分内。毛细管阵列的每个毛细管可以包含限定用于保留 第一种组分的腔的至少一个壁。气泡可以在第一种组分后引入毛细管 内。第二种组分可以引入毛细管内,其中第二种组分通过气泡与第一 种组分分开。目的样品可以作为用可检测颗粒标记的第一种液体引入 毛细管阵列的毛细管内,其中毛细管阵列的每个毛细管包含限定用于 保留第一种液体和可检测颗粒的腔的至少一个壁,和其中至少一个壁 用结合材料进行包被,所述结合材料用于使可检测颗粒与至少一个壁 结合。该方法可以进一步包括从毛细管中去除第一种液体,其中结合 的可检测颗粒维持在毛细管内,并且将第二种液体引入毛细管内。
毛细管阵列可以包括包含限定腔的至少一个外壁的多个单个毛细 管。毛细管的外壁可以是融合在一起的一个或多个壁。类似地,壁可 以限定其为圆柱形、正方形、六角形或任何其他几何形状的腔,只要 壁形成用于保留液体或样品的腔。毛细管阵列的毛细管可以紧密保持 在一起以形成平面结构。毛细管可以通过并行融合(例如,其中毛细 管由玻璃制成)、胶合、键合或夹紧而结合在一起。毛细管阵列可以 由任何数目的单个毛细管,例如100-4,000,000个毛细管形成。毛细 管阵列可以形成具有结合在一起的约100,000或更多单个毛细管的微 量滴定板。
阵列或“生物芯片”
本发明的核酸或多肽可以固定或应用于阵列,例如“阵列”或“微 阵列”或“生物芯片”或“芯片”,在一个实施方案中,其包含多个 靶元件,每个靶元件包含固定在底物表面的限定区域上的限定量的一 种或多种多肽(包括抗体)或核酸,其中至少一种“靶元件”是本发 明的多肽(例如酶或抗体)、或本发明的核酸。
本发明的阵列可以用于就其与本发明的核酸或多肽结合或调节本 发明的核酸或多肽的活性的能力筛选或监控组合物(例如小分子、抗 体、核酸等)文库。例如,在本发明的一个方面,监控参数是淀粉酶 和/或葡糖淀粉酶基因的转录物表达。细胞的一种或多种或所有转录物 可以通过下述进行测量:包含细胞转录物的样品、或代表细胞转录物 或与细胞转录物互补的核酸的杂交,或与在阵列或“生物芯片”上固 定的核酸杂交。通过使用在微芯片上的核酸“阵列”,细胞的某些或 所有转录物可以同时进行定量。可替代地,包含基因组核酸的阵列也 可以用于测定通过本发明的方法制备的新改造菌株的基因型。“多肽 阵列”也可以用于同时定量多个蛋白质。本发明可以用任何已知“阵 列”进行实践,所述“阵列”也称为“微阵列”或“核酸阵列”或“多 肽阵列”或“抗体阵列”或“生物芯片”或其变化。阵列在属类上是 多个“点”或“靶元件”,每个靶元件包含固定在底物表面的限定区 域上的限定量的一种或多种生物分子,例如寡核苷酸,用于与样品分 子例如mRNA转录物特异性结合。
在实践本发明的方法中,任何已知阵列和/或制备且使用阵列的方 法可以整体或部分掺入,或其变化,如例如下述中描述的:美国专利 号6,277,628;6,277,489;6,261,776;6,258,606;6,054,270; 6,048,695;6,045,996;6,022,963;6,013,440;5,965,452; 5,959,098;5,856,174;5,830,645;5,770,456;5,632,957; 5,556,752;5,143,854;5,807,522;5,800,992;5,744,305; 5,700,637;5,556,752;5,434,049;还参见例如,WO 99/51773;WO 99/09217;WO 97/46313;WO 96/17958;还参见例如,Johnston(1998) Curr.Biol.8:R171-R174;Schummer(1997)Biotechniques 23: 1087-1092;Kern(1997)Biotechniques 23:120-124; Solinas-Toldo(1997)Genes,Chromosomes & Cancer 20:399-407; Bowtell(1999)Nature Genetics Supp.21:25-32。还参见公开的 美国专利申请号20010018642;20010019827;20010016322; 20010014449;20010014448;20010012537;20010008765。
抗体和基于抗体的筛选方法
本发明提供了分离的、合成或重组抗体,其与本发明的淀粉酶和/ 或葡糖淀粉酶特异性结合。这些抗体可以用于分离、鉴定或定量本发 明的淀粉酶和/或葡糖淀粉酶或相关多肽。这些抗体可以用于分离在本 发明的范围内的其他多肽或其他相关淀粉酶和/或葡糖淀粉酶。抗体可 以设计为与淀粉酶和/或葡糖淀粉酶的活性位点结合。因此,本发明提 供了使用本发明的抗体抑制淀粉酶和/或葡糖淀粉酶的方法。
本发明提供了包含肽或多肽的抗体,所述肽或多肽衍生自一种或 多种免疫球蛋白基因或其片段、在一种或多种免疫球蛋白基因或其片 段后模拟,或基本上由一种或多种免疫球蛋白基因或其片段编码,能 够特异性结合抗原或表位,参见例如,Fundamental Immunology,第 3版,W.E.Paul,编辑,Raven Press,N.Y.(1993);Wilson(1994) J.Immunol.Methods 175:267-273;Yarmush(1992)J.Biochem. Biophys.Methods 25:85-97。术语抗体包括保留结合抗原的能力的 抗原结合部分,即“抗原结合位点”,(例如,片段、子序列、互补 决定区(CDRs)),包括(i)Fab片段,由VL、VH、CL和CH1结构 域组成的单价片段;(ii)F(ab′)2片段,包含在铰链区由二硫桥 连接的2个Fab片段的二价片段;(iii)由VH和CH1结构域组成的 Fd片段;(iv)由抗体的单条臂的VL和VH结构域组成的Fv片段, (v)由VH结构域组成的dAb片段(Ward等人,(1989)Nature 341: 544-546);和(vi)分离的互补决定区(CDR)。单链抗体也通过参 考术语“抗体”而包括。
抗体可以用于免疫沉淀、染色、免疫亲和柱等中。需要时,编码 特异性抗原的核酸序列可以通过下述来产生:免疫接种,随后分离多 肽或核酸,扩增或克隆以及多肽固定在本发明的阵列上。可替代地, 本发明的方法可以用于修饰通过待修饰的细胞产生的抗体的结构,例 如可以增加或减少抗体的亲和力。此外,制备或修饰抗体的能力可以 是通过本发明的方法改造到细胞内的表型。
免疫接种、生产和分离抗体(多克隆和单克隆的)的方法是本领 域技术人员已知的,并且在科学和专利文献中描述,参见例如, Coligan,CURRENT PROTOCOLS IN IMMUNOLOGY,Wiley/Greene,NY (1991);Stites(编辑)BASIC AND CLINICAL IMMUNOLOGY(第7 版)Lange Medical Publications,Los Altos,CA(“Stites”); Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE(第2 版)Academic Press,New York,NY(1986);Kohler(1975)Nature 256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring Harbor Publications,New York。抗体也可以在体外产生, 例如使用重组抗体结合位点表达噬菌体展示文库,加上使用动物的常 规体内方法。参见例如,Hoogenboom(1997)Trends Biotechnol.15: 62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26: 27-45。
多肽或肽可以用于产生抗体,其与本发明的多肽例如淀粉酶和/ 或葡糖淀粉酶特异性结合。所产生的抗体可以用于免疫亲和层析操作 中,以分离或纯化多肽,或测定多肽是否存在于生物样品中。在此种 操作中,使蛋白质制剂例如提取物或生物样品与能够与本发明的多肽 之一特异性结合的抗体接触。
在免疫亲和操作中,使抗体与固体载体例如珠或其他柱基质附着。 在其中抗体与本发明的多肽之一特异性结合的条件下,使蛋白质制剂 放置与抗体接触。在洗涤以去除非特异性结合的蛋白质后,洗脱特异 性结合的多肽。
蛋白质在生物样品中与抗体结合的能力可以使用本领域技术人员 熟悉的各种操作中的任何一种进行测定。例如,结合可以通过用可检 测标记例如荧光试剂、酶促标记或放射性同位素标记抗体进行测定。 可替代地,抗体与样品的结合可以使用在其上具有此种可检测标记的 次级抗体进行检测。特定测定包括ELISA测定、夹心测定、放射性免 疫测定和蛋白质印迹。
针对本发明的多肽产生的多克隆抗体可以通过将多肽直接注入动 物内或通过将多肽施用于非人动物来获得。如此获得的抗体随后将结 合多肽其自身。以这种方式,即使仅编码多肽片段的序列也可以用于 产生可以与整个天然多肽结合的抗体。此种抗体随后可以用于从表达 那种多肽的细胞中分离多肽。
对于单克隆抗体的制备,可以使用提供由连续细胞系培养生产的 抗体的任何技术。例子包括杂交瘤技术、三源杂交瘤技术、人B细胞 杂交瘤技术、和EBV-杂交瘤技术(参见例如,Cole(1985)in Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,第77-96 页)。
对于单链抗体的生产描述的技术(参见例如,美国专利号 4,946,778)可以适合于生产针对本发明的多肽的单链抗体。可替代地, 转基因小鼠可以用于表达针对这些多肽或其片段的人源化抗体。
针对本发明的多肽产生的抗体可以用于筛选来自其他生物和样品 的相似多肽(例如淀粉酶和/或葡糖淀粉酶)。在此种技术中,使来自 生物的多肽与抗体接触,并且检测特异性结合抗体的那些多肽。上文 描述的任何操作可以用于检测抗原结合。
试剂盒
本发明提供了包含组合物的试剂盒,所述组合物例如本发明的核 酸、表达盒、载体、细胞、转基因种子或植物或植物部分、多肽(例 如,淀粉酶和/或葡糖淀粉酶)和/或抗体。试剂盒还可以包含教导本 发明的方法和工业用途的指导材料,如本文描述的。
测量代谢参数
本发明的方法提供了细胞通过修饰细胞的遗传组成的全细胞进 化、或全细胞改造,以开发具有新表型例如新或修饰的淀粉酶和/或葡 糖淀粉酶活性的新细胞株。遗传组成可以通过给细胞添加本发明的核 酸进行修饰。为了检测新表型,在细胞中以“实时”或“在线”时帧 监控经修饰的细胞的至少一种代谢参数。在一个方面,多个细胞例如 细胞培养物以“实时”或“在线”进行监控。在一个方面,多个代谢 参数以“实时”或“在线”进行监控。。代谢参数可以使用本发明的 淀粉酶和/或葡糖淀粉酶进行监控。
代谢流分析(MFA)基于已知的生物化学构架。线性独立的代谢矩 阵基于质量守恒定律和关于细胞内代谢产物的伪稳态假设(PSSH)进 行构建。在实践本发明的方法中,建立代谢网络,包括:
所有途径底物、产物和中间代谢产物的鉴定
使途径代谢产物互变的所有化学反应的鉴定,途径反应的化 学计量学,
催化反应的所有酶的鉴定,酶反应动力学,
途径组分之间的调节相互作用,例如异构相互作用,酶-酶 相互作用等,
酶的细胞内区室化或酶的任何其他超分子组构,和,
代谢产物、酶或效应分子的任何浓度梯度的存在或关于其移 动的扩散壁垒。
一旦构建关于给定菌株的代谢网络,将可以引入通过矩阵概念的 数学呈现,以估计细胞内代谢流,如果在线代谢组数据是可用的。代 谢表型依赖细胞中的整体代谢网络的改变。代谢表型依赖就环境条件、 遗传调节、发育状态和基因型等而言的途径利用的改变。在本发明的 方法的一个方面,在线MFA计算后,细胞的动态行为、其表型和其他 性质通过研究途径利用进行分析。例如,如果在酵母发酵过程中葡萄 糖供应增加并且氧减少,那么呼吸途径的利用将减少和/或停止,并且 发酵途径的利用将占优势。在途径分析后,细胞培养物的生理学状态 的控制将变得可能。通过测定如何改变底物供应、温度、诱导物的使 用等,本发明的方法可以帮助测定如何操作发酵,以控制细胞的生理 学状态沿着所需方向移动。在实践本发明的方法中,MFA结果也可以 与转录组和蛋白质组数据比较,以设计用于代谢改造或基因改组等的 实验和方案。
在实践本发明的方法中,在细胞中可以赋予且检测任何修饰或新 表型,包括新或改善特征。可以监控代谢或生长的任何方面。
监控mRNA转录物的表达
在本发明的一个方面,改造表型包含增加或减少mRNA转录物(例 如淀粉酶和/或葡糖淀粉酶信使)的表达,或在细胞中产生新(例如, 淀粉酶和/或葡糖淀粉酶)转录物。这种增加或减少的表达可以通过测 试本发明的淀粉酶和/或葡糖淀粉酶的存在或者通过淀粉酶和/或葡糖 淀粉酶活性测定进行跟踪。mRNA转录物或信使也可以通过本领域已知 的任何方法进行检测且定量,包括例如RNA印迹、定量扩增反应、与 阵列杂交等。定量扩增反应包括例如,定量PCR,包括例如定量逆转 录聚合酶链反应,或RT-PCR;定量实时RT-PCR,或“实时动态RT-PCR” (参见例如,Kreuzer(2001)Br.J.Haematol.114:313-318;Xia (2001)Transplantation 72:907-914)。
在本发明的一个方面,改造表型通过击倒同源基因的表达来产生。 基因的编码序列或者一种或多种转录控制元件,例如启动子或增强子 可以被击倒。因此,转录物的表达可以被完全取消或仅减少。
在本发明的一个方面,改造表型包含增加同源基因的表达。这可 以通过击倒负控制元件包括顺式或反式作用的转录调节元件,或使正 控制元件诱变来实现。细胞的一种或多种或所有转录物可以通过下述 进行测量:包含细胞转录物的样品、或代表细胞转录物或与细胞转录 物互补的核酸的杂交,或与在阵列上固定的核酸杂交。
监控多肽、肽和氨基酸的表达
在本发明的一个方面,改造表型包含增加或减少多肽(例如淀粉 酶和/或葡糖淀粉酶)的表达,或在细胞中产生新多肽。这种增加或减 少的表达可以通过测定存在的淀粉酶和/或葡糖淀粉酶量或者通过淀 粉酶和/或葡糖淀粉酶活性测定进行跟踪。多肽、肽和氨基酸也可以通 过本领域已知的任何方法进行检测且定量,包括例如核磁共振(NMR), 分光光度法,射线照相法(蛋白质放射性标记),电泳,毛细管电泳, 高效液相层析(HPLC),薄层层析(TLC),超扩散层析,各种免疫学 方法例如免疫沉淀、免疫扩散、免疫电泳、放射性免疫测定(RIAs)、 酶联免疫吸附测定(ELISAs)、免疫荧光测定,凝胶电泳(例如 SDS-PAGE),用抗体染色,荧光激活细胞分选(FACS),热解质谱法, 傅里叶变换红外光谱法,拉曼光谱法,GC-MS,以及LC-电喷射和帽-LC- 串联电喷射质谱法等。新生物活性也可以使用美国专利号6,057,103 中描述的方法或其变化进行筛选。此外,如下文详细讨论的,细胞的 一种或多种或所有多肽可以使用蛋白质阵列进行测量。
工业应用
本发明提供了关于本发明的淀粉酶、葡糖淀粉酶、以及葡糖苷酶 和其他多肽(例如抗体)的许多工业用途和医学应用。例如,本发明 提供了用于液化多糖例如淀粉的酶和方法。在用于使液化多糖例如淀 粉转变成葡萄糖的过程中使用的许多淀粉酶和/或葡糖淀粉酶和葡糖 苷酶无法水解α(1,6)连接,并且这种缺乏留下约5%的糖作为 pannose(潘糖)和异麦芽糖。然而,在一个方面,本发明的酶可以使 多糖例如淀粉转变成葡萄糖,以使葡萄糖生产达到最大,包括使液化 多糖例如淀粉转变成葡萄糖。在一个方面,本发明提供了用于水解 1,4-α和/或1,6-α连接(例如水解淀粉)以及水解pannose(潘糖) 和异麦芽糖的酶和方法。本发明的葡糖苷酶可以在各种工业过程中使 用,包括生物量转变成燃料(例如生物燃料,例如生物乙醇、生物丙 醇、生物丁醇或生物柴油)等),例如包括其在多糖例如淀粉加工的 最初阶段(液化)中、湿玉米研磨中、醇生产中、在纺织工业中用于 多糖例如淀粉脱浆、烘焙应用中、饮料工业中、在油田钻探过程中; 再循环纸的上墨中;和动物饲料中的用途。因此,本发明还提供了包 含本发明的多肽的燃料,例如生物燃料(例如生物乙醇、生物丙醇、 生物丁醇或生物柴油)。
洗涤剂组合物
本发明提供了包含本发明的一种或多种多肽的洗涤剂组合物,所 述多肽例如本发明的淀粉酶和/或葡糖淀粉酶,例如α淀粉酶等,以及 制备和使用这些组合物的方法。本发明合并了制备和使用洗涤剂组合 物的所有方法,参见例如,美国专利号6,413,928;6,399,561; 6,365,561;6,380,147。洗涤剂组合物可以是一和两份水性组合物、 非水性液体组合物、浇铸固体、颗粒形式、微粒形式、压缩片、凝胶 和/或糊剂和浆形式。本发明还提供了使用这些洗涤剂组合物能够快速 去除肉眼可见的食物污物、食物残渣膜和其他较少的食物组成的方法。 本发明的淀粉酶和/或葡糖淀粉酶可以促进含多糖例如淀粉污点的去 除,通过多糖和/或寡糖例如淀粉的催化水解方法。本发明的淀粉酶和 /或葡糖淀粉酶可以在洗碗洗涤剂中在织物洗衣洗涤剂中使用。
实际活性酶含量依赖制造洗涤剂组合物的方法,并且不是关键的, 假定洗涤剂溶液具有所需酶促活性。在一个方面,最终溶液中存在的 淀粉酶和/或葡糖淀粉酶的量是约0.001mg-0.5mg/克洗涤剂组合物。 在本发明的过程和产品中选择使用的具体酶依赖最终利用的条件,包 括物理产品形式、使用pH、使用温度、和待降解或改变的土壤类型。 可以选择酶以提供关于任何给定利用条件组的最佳活性和稳定性。在 一个方面,本发明的多肽在约4-约12的pH范围中和约20℃-约95℃ 的温度范围中是活性的。本发明的洗涤剂可以包含阳离子、半极化非 离子或两性离子表面活性剂;或其混合物。
本发明的淀粉酶和/或葡糖淀粉酶可以配制成具有4.0-12.0的pH 在约0.01-约5质量%(优选0.1%-0.5%)水平下的粉末状和液体洗 涤剂。这些洗涤剂组合物还可以包括其他酶,例如已知的蛋白酶、纤 维素酶、脂肪酶或内切糖苷酶,以及增洁剂和稳定剂。本发明的淀粉 酶和/或葡糖淀粉酶给常规清洁组合物的添加不产生任何具有使用限 制。换言之,适合于洗涤剂的任何温度和pH也适合于本组合物,只要 pH在上述范围内,并且温度低于所述酶的变性温度。此外,本发明的 多肽可以在不含洗涤剂的清洁组合物中使用,再次单独或与增洁剂和 稳定剂组合。
本发明提供了清洁组合物,其包括用于清洁硬表面的洗涤剂组合 物、用于清洁织物或织品的洗涤剂组合物、洗碗组合物、口腔清洁组 合物、牙齿清洁组合物和隐形眼镜清洁液。
在一个方面,本发明提供了用于洗涤物体的方法,其包括在足以 用于洗涤的条件下使物体与本发明的多肽接触。在一个方面,本发明 的多肽(例如,碱性活性淀粉酶和/或葡糖淀粉酶)用于洗涤剂中,即 作为洗涤剂添加剂。本发明的洗涤剂组合物可以例如配制为包含本发 明的多肽的人工或机器衣物洗涤剂组合物。本发明的洗涤剂组合物包 括洗衣和洗碗(例如自动洗碗)液和应用。适合于沾污织品的预处理 的衣物添加剂可以包含本发明的多肽。衣物柔顺剂组合物可以包含本 发明的多肽。可替代地,本发明的多肽可以配制为用于在一般家庭硬 表面清洁操作中使用的洗涤剂组合物。在可替代方面,本发明的洗涤 剂添加剂和洗涤剂组合物可以包含一种或多种其他酶,例如蛋白酶、 脂肪酶、角质酶、另一种淀粉酶和/或葡糖淀粉酶、碳水化合物酶、纤 维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、 氧化酶例如乳酸酶和/或过氧化物酶。可以选择本发明的一种或多种酶 的性质,以与所选择的洗涤剂相容(即pH最适条件、与其他酶促或非 酶促成分的相容性等),并且一种或多种酶以有效量存在。在一个方 面,本发明的淀粉酶和/或葡糖淀粉酶可以用于从织品中去除恶臭材 料。可以用于实践本发明的各种洗涤剂组合物和用于制备其的方法在 例如美国专利号6,333,301;6,329,333;6,326,341;6,297,038; 6,309,871;6,204,232;6,197,070;5,856,164中描述。
处理织品
本发明提供了使用本发明的一种或多种多肽处理织品的方法。本 发明的多肽可以在任何织品处理方法中使用,所述织品处理方法是本 领域众所周知的,参见例如,美国专利号6,077,316。例如,在一个 方面,织品的触感和外观可以通过这样的方法加以改善,所述方法包 括使织品与本发明的淀粉酶和/或葡糖淀粉酶在溶液中接触。在一个方 面,织品在压力下用溶液进行处理。
在一个方面,在织物编织过程中或之后、或在脱浆阶段、或一个 或多个另外的织品加工步骤过程中应用本发明的酶。在织物编织过程 中,线暴露于相当大的机械张力。在机械织机上编织前,经纱通常用 施胶淀粉或淀粉衍生物包被,以便增加其的拉伸强度且预防断裂。可 以应用本发明的酶,以去除这些施胶淀粉或淀粉衍生物。在织物已编 织后,织品可以进行至脱浆阶段。这可以随后为一个或多个另外的织 品加工步骤。脱浆是去除织物处的胶水的作用。在编织后,胶水涂层 必须在进一步加工织品前去除,以便确保均质和耐洗结果。本发明提 供了脱浆方法,其包括通过本发明的酶的作用酶促水解胶水。
本发明的酶可以作为例如在水性组合物中的洗涤剂添加剂用于使 织品脱浆,包括含棉织品。本发明提供了用于在靛蓝染色的粗斜纹棉 布织品和服装上产生石磨外表的方法。对于衣服的制造,织品可以进 行切割且缝制成衣服或服装,这之后是修整。特别地,对于粗斜纹棉 布牛仔裤的制造,已开发了不同的酶促修整方法。粗斜纹棉布服装的 修整通常由酶促脱浆步骤起始,在这个过程中对服装实施淀粉水解酶 的作用,以便对于织品提供柔软性,且使得棉更易接近后续酶促修整 步骤。本发明提供了使用本发明的淀粉酶和/或葡糖淀粉酶来修整粗斜 纹棉布服装(例如,“生物打磨过程”),酶促脱浆且对于织品提供 柔软性的方法。本发明提供了在脱浆和/或修整过程中用于使粗斜纹棉 布服装快速软化的方法。
食物和食物加工:多糖例如淀粉的液化
本发明的酶在食物加工工业中具有众多应用。本发明的淀粉酶和/ 或葡糖淀粉酶在淀粉至果糖加工中使用。在可替代方面,本发明的过 程包含多糖例如淀粉至果糖加工,其包括4个步骤:颗粒状淀粉的液 化、液化多糖例如淀粉糖化成右旋糖、纯化和异构化成果糖;并且这 些步骤中的一个、数个或全部可以包含本发明的一种或多种酶的使用。 本发明的酶可以在通过湿或通过干研磨来自生物量例如玉米或草的醇 生产中使用;例如,图12举例说明本发明的酶如何可以用于通过干研 磨来自玉米的醇生产中,包括其在“常规过程”和“同时液化糖化和 发酵过程”中的使用。
本发明提供了使用本发明的酶的多糖例如淀粉液化的方法。将淀 粉聚合物颗粒的浓缩悬浮液转换成低粘度的可溶性较短链长度的糊精 溶液。这个步骤对于用标准设备的方便处理和至葡萄糖或103其他糖 的有效转换是有用的。在一个方面,颗粒状淀粉通过使颗粒状淀粉的 温度升高至超过约72℃使颗粒凝胶化而液化。加热过程立即使不溶性 淀粉颗粒断裂,以产生水溶性淀粉溶液。溶解的淀粉溶液随后可以通 过本发明的淀粉酶和/或葡糖淀粉酶液化。因此,本发明提供了使用本 发明的淀粉酶和/或葡糖淀粉酶的酶促淀粉液化过程。
图7、图8和图9举例说明使用本发明的至少一种酶,本发明的 可替代的示例性淀粉过程,包括淀粉液化过程。例如,图7举例说明 本发明的示例性淀粉液化过程,其包括用蒸汽处理淀粉浆(例如,具 有约30%-35%固体)用于初步液化(例如,在约105℃下约5分钟), 输入自蒸发罐内,随后为次级液化(例如,在约90℃-95℃下约90分 钟),这些步骤中的每个或一个涉及本发明的酶的使用。图8举例说 明本发明的另一个示例性淀粉液化过程,其包括在约pH 4-约pH 5例 如pH 4.5下处理淀粉浆,调整pH,钙添加,在约pH 5-pH 6例如pH 5.4 下于约95℃液化,使用本发明的淀粉酶(例如,α淀粉酶)和/或葡 糖淀粉酶,随后为另一个pH和温度调整用于在约pH 4-约pH 5例如 pH 4.5下、在约60℃-65℃下糖化,使用本发明的淀粉酶(例如,α 淀粉酶)和/或葡糖淀粉酶。图9举例说明本发明的另一个示例性淀粉 液化过程,其包括在约pH 4-约pH 5例如pH 4.5下(任选调整pH, 钙添加)处理淀粉浆,在约pH 4-约pH 5例如pH 4.5下、在超过约 90℃或超过约95℃下,使用本发明的α淀粉酶和/或葡糖淀粉酶的组 合液化-糖化,随后为另一个pH和温度调整用于在约pH 4-约pH 5例 如pH 4.5下、在约60℃-65℃下糖化,使用本发明的葡糖淀粉酶。在 一个方面,本发明的组合液化-糖化是“单罐”过程。在一个方面,整 个过程是“单罐”过程。这些过程中的任何一个以及这些步骤中的任 何一个还可以包括、或可以进一步包括本发明的另一种酶(例如,葡 糖苷酶例如α-1,6-葡糖苷酶、麦芽糖酶等),或另一种酶例如支链淀 粉酶或异构酶。
示例性酶促液化过程涉及将颗粒状淀粉浆的pH调整至6.0-6.5, 以及添加氢氧化钙、氢氧化钠或碳酸钠。在一个方面,添加氢氧化钙。 这提供了钙离子,以针对灭活稳定本发明的葡糖淀粉酶。在一个方面, 在添加淀粉酶后,悬浮液通过蒸汽喷嘴进行抽吸,以使温度即刻升高 至80℃-115℃。在一个方面,使淀粉立即凝胶化,并且由于α-淀粉 酶的存在,通过α-1,4-糖苷键经由淀粉酶的随机水解而解聚成液体物 质。液体物质可以容易地抽吸。
本发明提供了使用本发明的淀粉酶和/或葡糖淀粉酶的各种酶促 多糖、寡糖和/或淀粉液化过程。在本发明的液化过程的一个方面,将 淀粉酶加入多糖、寡糖和/或淀粉悬浮液中,并且使悬浮液保持于约 80-100℃,以使多糖、寡糖和/或淀粉颗粒部分水解。在一个方面,部 分水解的多糖、寡糖和/或淀粉悬浮液通过喷嘴在超过约105℃的温度 下进行抽吸,以使任何其余的颗粒状结构完全凝胶化。在一个方面, 在凝胶化的淀粉冷却后,可以进行淀粉酶和/或葡糖淀粉酶的第二次添 加,以进一步水解多糖、寡糖和/或淀粉。
本发明提供了用于水解液体(液化)和颗粒状多糖、寡糖和/或淀 粉的酶和过程。此种淀粉可以衍生自任何来源,例如玉米、小麦、蜀 黍、高粱、黑麦或bulgher。本发明应用于其在液化中有用的任何谷 类淀粉来源,例如已知产生适合于液化的淀粉的任何其他谷类或蔬菜 来源。本发明的方法包括液化来源任何天然材料的淀粉,例如稻、发 芽稻、玉米、大麦、蜀黍、小麦、豆类和甘薯。液化过程可以使淀粉 基本上水解以产生糖浆。液化的温度范围可以是已知在液化淀粉中有 效的任何液化温度。例如,多糖、寡糖和/或淀粉的温度可以是约80 ℃-约115℃、约100℃-约110℃、和约105℃-约108℃。在可替代方 面,在这些方法中使用的淀粉酶和/或葡糖淀粉酶在这些温度下是活性 的,例如在约80℃-约115℃、约100℃-约110℃、或约105℃-约108 ℃下是活性的。
本发明提供了如图5中举例说明的用于液化糖化的方法。在一个 方面,本发明的淀粉酶(例如α淀粉酶)和/或葡糖淀粉酶在举例说明 的液化步骤中使用(某些目前的工业方法使用地衣芽孢杆菌(B. licheniformis)α-淀粉酶)。在一个方面,该过程在约pH 6.0下在 约95℃-105℃范围中的任何地方的温度下发生,时间长度为约0.5-5 小时之间的任何地方,例如60、90和120分钟。在一个方面,在玉米 浸泡过程中,在液化前加入纤维素酶、蛋白酶和/或蛋白质 thioreductases。
在本发明的液化过程的一个方面,加入本发明的淀粉酶和/或葡糖 淀粉酶,其在约pH 4.5(或在约pH 5-pH 5之间的任何地方)下具有 活性,其可以是或不是Ca2+依赖性的。在过程的前段中消除盐的添加 消除了在过程的后段时去除它们的需要。在本发明的液化过程的一个 方面,使用更有活性的淀粉酶。这可以允许减少所需的酶量。在一个 方面,液化和糖化在同一罐中完成,作为“单罐过程”,例如在约90 ℃-95℃(或约80℃-105℃之间的任何地方)的条件下,作为约3小 时过程(或作为持续约1-5小时的过程)。在这个方面,酶载量可以 再次减半。
在本发明的糖化过程的一个方面,使用本发明的淀粉酶和/或葡糖 淀粉酶。在一个方面,本发明的淀粉酶和/或葡糖淀粉酶在糖化步骤中 使用(加上或替代黑曲霉葡糖淀粉酶)。在一个方面,该过程在约pH 4.5下在约60℃-62℃的温度范围中(或约50℃-72℃之间范围中的任 何地方,或约40℃-80℃之间)发生,作为持续约12-96或更多小时 的过程。在本发明的糖化过程的一个方面,使用本发明的葡糖淀粉酶, 以在糖浆中产生更高水平的右旋糖。在一个方面,加入其他酶例如支 链淀粉酶,以增加葡萄糖的量。
在一个方面,在本发明的过程中使用的一种、某些或所有酶(包 括本发明的酶)进行固定,例如固定在任何表面例如平表面或酶柱上, 例如固定在阵列、珠、纤维、孔、毛细管等上。在一个方面,通过被 固定,它们可以再次使用。
在一个方面,本发明提供了使用本发明的至少一种酶的“酶混合 剂”。在一个方面,“酶混合剂”在本发明的过程中使用,例如包括 如图5中举例说明的液化糖化方法。例如,在一个方面,使用细胞壁 降解酶(CWDE),例如用于本发明的织物、浆和纸以及洗衣过程,包 括例如纤维素酶、半纤维素酶、木聚糖酶、半乳甘露聚糖酶、葡萄糖- 甘露聚糖酶、阿拉伯呋喃糖酶及其他。在一个方面,在本发明的过程 中用于生物漂白(例如,浆和纸、洗衣过程)的“酶混合剂”,包括 漆酶、过氧化物酶、氧化酶等的组合。在一个方面,细胞壁降解酶与 本发明的生物漂白酶组合,以降解植物细胞壁以释放着色剂。
包含本发明的至少一种淀粉酶和/或葡糖淀粉酶的本发明的一种 示例性酶混合剂可以使研磨玉米中的约超过95%淀粉水解成可发酵 糖,在不超过60小时中在约30-40℃下和在约pH 3.5-pH 5.5下在酵 母的存在下。在一个方面,所需的酶蛋白质的总量不超过50克/吨玉 米(0.005%w/w)。
本发明的酶可以用于处理乳制品;并且本发明提供了包含本发明 的多肽的乳制品,其中任选地乳制品包含乳、冰激淋、干酪或酸奶酪。
本发明的酶可以在同时液化糖化和发酵(SLSF)过程中使用;并 且使用本发明的酶的优点可以包括:
·由于高温步骤消除的较低能量成本;
·由于更快速发酵的改善产量;
·减少的细菌污染危险;
·酵母比常规过程中更早产生乙醇;
·大量酵母减少的贮存和处理。
在本发明的这些过程中使用的本发明的酶的性质可以包括:粗多 糖、寡糖和/或淀粉水解活性;与工艺条件相容的温度和pH活性谱; 对非颗粒化多糖、寡糖和/或淀粉的高活性;和/或对粗淀粉的‘抗性’ 部分的活性。
在可替代方面,本发明的酶具有淀粉酶和/或葡糖淀粉酶活性,并 且可以水解(部分或完全)具有复杂多水平结构的多糖、寡糖和/或淀 粉颗粒,包括无定形和结晶区域和/或支链和直链,例如可以水解(部 分或完全)粗淀粉,包括:RS I-在物理上无法接近的淀粉;RS II -如在生马铃薯和香蕉中的抗性淀粉颗粒;RS III-如在熟马铃薯中 可逆的。
产生高MW右旋糖糖浆的过程
本发明提供了使用本发明的酶产生高MW右旋糖糖浆的过程,包括 用于产生具有在约20,000MW下紧密成群的MW的寡糖的方法。在一个 方面,本发明的淀粉酶和/或葡糖淀粉酶可以用于液化含多糖、含寡糖 和/或含淀粉组合物,例如玉米淀粉,以产生在约20,000MW下紧密成 群的寡糖模式(芽孢杆菌属淀粉酶将产生包含高得多的MW片段的糖 浆,和高MW寡糖在糖化过程中未由葡糖淀粉酶例如曲霉菌属葡糖淀粉 酶完全转变成葡萄糖)。
在一个方面,使用本发明的淀粉酶和/或葡糖淀粉酶催化含淀粉组 合物例如玉米淀粉的水解,产生约20,000MW片段。这些约20,000MW 片段可以快速且完全转变成葡萄糖。因此,在一个方面,起因于芽孢 杆菌属淀粉酶液化的糖化糖浆包含比来自使用本发明的淀粉酶和/或 葡糖淀粉酶的液化的糖化糖浆更少的右旋糖。
产生同质麦芽糖糊精的过程
本发明提供了使用本发明的酶产生同质麦芽糖糊精的过程。通过 本发明的方法生产的同质麦芽糖糊精可以用于各种各样的食物、药物 和包衣应用中。在一个方面,本发明的淀粉酶和/或葡糖淀粉酶可以用 于产生非常均匀的麦芽糖糊精组合物(使用淀粉的酸或酶促水解的常 规制造过程导致寡糖广泛的、一般双重峰的MW分布)。通过本发明的 方法产生的同质麦芽糖糊精具有同质MW分布,并且可以在各种含麦芽 糖糊精产品中使用,导致较低的粘度、澄清(无混浊)溶液、更好的 包被性质、更好的成膜性质等。
在一个方面,本发明的淀粉酶和/或葡糖淀粉酶用于使玉米淀粉液 化,以产生均匀的含麦芽糖糊精组合物。在一个方面,液化在约pH 4.5- 约pH 6.5,例如pH 5.0或5.5的pH下在高达约105℃的温度下进行。 均匀的麦芽糖糊精组合物可以在约5至高达约20的DE’s下产生。通 过本发明的这些淀粉酶和/或葡糖淀粉酶产生的糖浆可以过滤,用活性 炭处理和/或喷雾干燥,以产生含麦芽糖糊精产品。
在一个方面,一种或多种其他酶与包含本发明的酶的组合物结合 使用,用于在淀粉至果糖加工、颗粒状淀粉的液化、和产生同质麦芽 糖糊精或高MW右旋糖糖浆的过程,例如包括其他淀粉酶、β-半乳糖 苷酶、过氧化氢酶、漆酶、纤维素酶、内切糖苷酶、内切-β-1,4-漆 酶、淀粉葡糖苷酶、其他葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂 肪酶、磷脂酶、脂氧合酶、β-漆酶、内切-β-1,3(4)-漆酶、角质 酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、 脱羧酶、碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖酶 (arabinanases)、半纤维素酶、甘露聚糖酶、xylolaccases、木聚 糖酶、果胶乙酰酯酶、鼠李半乳糖醛酸聚糖乙酰酯酶、蛋白酶、肽酶、 蛋白水解酶、聚半乳糖醛酸酶、rhamnogalacturonases、半乳聚糖酶、 果胶裂解酶、转谷酰胺酶、果胶甲酯酶、纤维二糖水解酶和/或转谷酰 胺酶。
酶促干研磨过程
本发明提供了使用本发明的淀粉酶和/或葡糖淀粉酶的酶促干研 磨过程;示例性过程在图12中举例说明。在干研磨中,将整个谷粒磨 碎并且与水组合。胚芽任选通过浮选分离或等价技术去除。所得到的 混合物包含多糖例如淀粉、纤维、蛋白质和谷粒的其他组分,使用淀 粉酶进行液化。在一个方面,酶促液化在比上文讨论的多糖例如淀粉 液化过程更低的温度下完成。在一个方面,在多糖例如淀粉明胶化后, 溶液在淀粉酶的存在下保持在升高的温度下,直至达到10-20的DE。 在一个方面,这是约1-3小时的时期。右旋糖当量(DE)是用于测量 总还原糖浓度的工业标准,计算为基于干重的D-葡萄糖。未水解的颗 粒状淀粉具有实际上零的DE,而D-葡萄糖的DE定义为100。
本发明的酶可以在生物量湿或干研磨过程中使用。例如,在示例 性干研磨过程的一个方面,将整个谷粒磨碎且与水组合,并且用本发 明的酶处理。胚芽任选通过浮选分离或等价技术去除。在一个方面, 所得到的混合物包含多糖例如淀粉、纤维、蛋白质和谷粒的其他组分, 使用本发明的葡糖淀粉酶和/或淀粉酶(例如,α-淀粉酶)进行液化。 在一个方面,当使用干研磨过程时,这种酶促液化在相对更低的温度 下;然而,在使多糖例如淀粉转变成可溶性糊精中,低温液化被认为 比高温液化更不有效。因此,在一个方面,本发明提供了进一步的步 骤,其中在多糖例如淀粉明胶化后,溶液在本发明的葡糖淀粉酶和/ 或淀粉酶(例如,α-淀粉酶)的存在下保持在升高的温度下,在一个 方面,这直至达到约10-20的DE,通常约1-3小时的时期(右旋糖当 量(DE)是用于测量总还原糖浓度的工业标准,作为在干重基础上计 算的D-葡萄糖;未水解的颗粒状淀粉具有实际上零的DE,而D-葡萄 糖的DE定义为100)。
在可替代方面,本发明的淀粉酶和/或葡糖淀粉酶在干研磨乙醇过 程中的使用可以提供操作优点,例如:浆状玉米粉粘度中的快速减少, 可能无需另外的基本投资而产生溶解固体和处理量的增加;对于最佳 竞争者优良的热稳定性,这消除分次剂量;本发明的某些淀粉酶和/ 或葡糖淀粉酶是热稳定酶——并且这消除了在喷射熬炼前和之后投配 量的需要;在更高的加工温度下获得更低的粘度,并且提供在浆槽中 改善的微生物控制(过程在更高温度下进行,因此杀死不希望有的微 生物);更低的液化pH,其消除了关于pH调整的需要,减少结垢(草 酸钙沉淀在硬件等上形成;如果液化在低pH下完成,那么存在关于结 垢的更高可能性)且减少副产品形成。
总之,在可替代方面,本发明的淀粉酶和/或葡糖淀粉酶可以是热 稳定酶,其可以例如在某些条件下满足关键工业需要,快速减少高干 物质玉米粉浆的粘度,可以是热稳定的(最适温度95℃),可以是钙 不依赖性的,在低pH最适条件下可以是活性的,并且可以耐受高达 30%再循环逆流。在一个方面,推荐剂量在约0.4-0.6kg/MT淀粉范 围中。
酶促湿研磨过程
本发明提供了使用本发明的酶例如葡糖淀粉酶和/或淀粉酶的湿 研磨过程,例如玉米湿研磨。玉米湿研磨是产生玉米油、谷蛋白膳食、 谷蛋白饲料和多糖例如淀粉的过程。因此,本发明提供了使用本发明 的酶制备玉米油、谷蛋白膳食、谷蛋白饲料和多糖例如淀粉的方法。 在一个方面,本发明的碱性淀粉酶和/或碱性葡糖淀粉酶在多糖例如淀 粉的液化中使用。在一个方面,本发明的淀粉酶和/或葡糖淀粉酶在糖 化中使用,以产生葡萄糖。本发明的示例性玉米湿研磨过程(使用本 发明的至少一种酶)在图6中举例说明。图6举例说明本发明的示例 性玉米油过程,其包括浸泡、除胚、去纤维化和谷蛋白分离、随后为 使用本发明的酶(例如,α淀粉酶)的液化、和使用本发明的酶(例 如,葡糖淀粉酶)的糖化。
在一个方面,对玉米(由外种皮(纤维)、多糖例如淀粉、淀粉 和葡萄糖的组合以及内部胚芽组成的仁)实施4步骤过程,其导致淀 粉的产生。在一个方面,玉米进行浸泡、除胚、去纤维,并且分离谷 蛋白。在浸泡过程中,去掉溶解物。在溶解物去除后保留的产物进行 除胚,导致玉米油的产生和油饼的产生,将所述油饼加入来自浸泡步 骤的溶解物中。其余产物进行去纤维,并且将纤维固体加入油饼/溶解 物混合物中。这种纤维固体、油饼和溶解物的混合物形成谷蛋白饲料。 去纤维后,对其余产物实施谷蛋白分离。这种分离导致谷蛋白膳食和 淀粉。随后对淀粉实施使用本发明的多肽的液化和糖化,以产生葡萄 糖。
图6举例说明本发明的示例性湿研磨过程(使用本发明的至少一 种酶)。图7、图8和图9举例说明本发明的可替代的示例性淀粉加 工方法(例如,工业过程),包括淀粉液化过程(使用本发明的至少 一种酶)。
本发明的酶可以在生物量湿干研磨过程中使用;例如,玉米湿研 磨,以产生植物(例如,玉米)油、谷蛋白膳食、谷蛋白饲料和/或淀 粉。在一个方面,本发明的碱性淀粉酶在淀粉的液化中使用,并且葡 糖淀粉酶(其也可以是本发明的酶)在糖化中使用,产生葡萄糖。在 一个方面,对生物量(例如,玉米仁,其由外种皮(纤维)、淀粉、 淀粉和葡萄糖的组合以及内部胚芽组成)实施4步骤过程,以产生淀 粉。生物量(例如玉米)进行浸泡、除胚、去纤维,并且分离谷蛋白。 在浸泡过程中,去掉溶解物。在溶解物去除后保留的产物进行除胚, 导致植物油(例如,玉米油)的产生和油饼的产生,将所述油饼加入 来自浸泡步骤的溶解物中。其余产物进行去纤维,并且将纤维固体加 入油饼/溶解物混合物中。这种纤维固体、油饼和溶解物的混合物形成 谷蛋白饲料。去纤维后,对其余产物实施谷蛋白分离。这种分离导致 谷蛋白膳食和淀粉。在一个方面,随后对淀粉实施液化和糖化(例如 使用本发明的多肽),以产生葡萄糖。
本发明还提供了用于产生高品质玉米纤维胶质的高产量过程,通 过用本发明的酶处理玉米纤维,随后为过氧化氢处理,以获得研磨玉 米纤维的提取物。参见例如,美国专利号6,147,206。
在一个方面,一种或多种其他酶与包含本发明的酶的组合物结合 使用,用于与这些干或湿研磨过程使用,例如包括其他淀粉酶、β- 半乳糖苷酶、过氧化氢酶、漆酶、纤维素酶、内切糖苷酶、内切-β-1,4- 漆酶、淀粉葡糖苷酶、其他葡糖苷酶、葡萄糖异构酶、糖基转移酶、 脂肪酶、磷脂酶、脂氧合酶、β-漆酶、内切-β-1,3(4)-漆酶、角 质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、 脱羧酶、碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖酶、半纤维素 酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半 乳糖醛酸聚糖乙酰酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳糖醛酸 酶、rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷酰胺酶、 果胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
抗老化过程
本发明提供了使用本发明的淀粉酶和/或葡糖淀粉酶的抗老化过 程(例如烘焙产品,例如面包的)。本发明提供了使用本发明的淀粉 酶和/或葡糖淀粉酶减缓面包心(烘焙产品的)硬度的增加和面包心弹 性的减少的方法。烘焙产品(例如面包)的老化随着面包产品制备时 刻和消费时刻之间过去的时间而变得更严重。术语老化用于描述在离 开烘箱后面包产品的性质中对于消费者不希望有的改变,例如面包心 硬度的增加、面包心弹性的减少以及面包皮中变得坚韧和革质的变化。 面包心的硬度在贮存至一定水平的过程中进一步增加,这视为负面的。 本发明的淀粉酶和/或葡糖淀粉酶用于延缓面包的老化,如例如美国专 利号6,197,352;2,615,810;3,026,205;Silberstein(1964)Baker′s Digest 38:66-72中描述的。
在一个方面,本发明的酶用于用于延缓面包的老化同时使淀粉不 水解成分支糊精。分支糊精通过切割经由α-淀粉酶水解产生的糊精的 支链而形成,所述α-淀粉酶水解无法经由α-淀粉酶进一步降解。这 可以在所得到的面包中产生胶粘面包心。因此,本发明提供了用于延 缓烘焙产品(例如,膨松烘焙产品)的老化的过程,其包括将包含外 淀粉酶活性的本发明的酶加入用于生产烘焙产品的面粉或生面团中。 本发明的淀粉酶和/或葡糖淀粉酶可以具有葡糖淀粉酶、β-淀粉酶(其 释放β构型的麦芽糖)和/或生麦芽糖淀粉酶活性。
本发明还提供了用于制备生面团或由生面团制备的烘焙产品的过 程,其包括将本发明的淀粉酶和/或葡糖淀粉酶以有效延缓面包老化的 量加入生面团中。本发明还提供了包含所述淀粉酶的生面团以及包含 面粉连同所述淀粉酶的预混合料。最后,本发明提供了包含所述淀粉 酶的酶促烘焙添加剂。
动物饲料和添加剂
本发明提供了用于人和动物的包含本发明的多肽的饲料、食物、 食物添加剂、饲料添加剂、营养补充剂和/或饮食补充剂;并且本发明 提供了关于使用包含本发明的多肽的饲料、食物、食物添加剂、饲料 添加剂、营养补充剂和/或饮食补充剂;和/或使用本发明的葡糖淀粉 酶和/或淀粉酶处理人和动物的方法。本发明提供了包含本发明的淀粉 酶和/或葡糖淀粉酶的人和/或动物饲料、食物、食物添加剂、饲料添 加剂、营养补充剂和/或饮食补充剂。在一个方面,使用本发明的淀粉 酶和/或葡糖淀粉酶处理人和/或动物饲料、食物、添加剂、食物添加 剂、饲料添加剂、营养补充剂和/或饮食补充剂可以帮助多糖例如淀粉 在人和/或动物饲料、食物、食物添加剂、饲料添加剂、营养补充剂和 /或饮食补充剂中的可用性。这可以导致容易消化和易于吸收的糖的释 放。
本发明的葡糖淀粉酶和/或淀粉酶的使用可以增加动物和鸟类的 消化能力。本发明的淀粉酶和/或葡糖淀粉酶的使用可以确保足够营养 素补充的可用性用于更好的生长和性能。在一个方面,本发明的酶可 以作为饲料添加剂添加,或者在饲料、食物、添加剂、食物添加剂、 饲料添加剂、营养补充剂和/或饮食补充剂中添加用于动物。在另一个 方面,饲料、食物、添加剂、食物添加剂、饲料添加剂、营养补充剂 和/或饮食补充剂,例如动物饲料,可以在动物消费前用本发明的淀粉 酶和/或葡糖淀粉酶进行处理。在另一个方面,本发明的淀粉酶和/或 葡糖淀粉酶可以通过在转基因饲料作物(作为例如转基因植物、种子 等)例如玉米中直接表达酶来提供。如上所述,本发明提供了包含编 码本发明多肽的核酸序列的转基因植物、植物部分和植物细胞。在一 个方面,核酸这样表达,使得本发明的淀粉酶和/或葡糖淀粉酶以可回 收的量产生。本发明的淀粉酶和/或葡糖淀粉酶可以从任何植物或植物 部分中回收。可替代地,包含重组多肽的植物或植物部分可以像这样 用于改善食物或饲料、饲料添加剂、营养补充剂和/或饮食补充剂的品 质等,例如改善营养价值、适口性和流变性质,或破坏抗营养因子。
纸或浆处理
本发明的酶可以在纸或浆处理或者纸脱墨中。例如,在一个方面, 本发明提供了使用本发明的淀粉酶和/或葡糖淀粉酶的纸处理过程。在 一个方面,本发明的酶可以用于修饰纸中的多糖例如淀粉,从而将其 转变成液化形式。在另一个方面,在化学和酶促脱墨过程中再循环的 复印纸的纸组分。在一个方面,本发明的淀粉酶和/或葡糖淀粉酶可以 与纤维素酶组合使用。纸可以通过下述3个过程进行处理:1)在本发 明的酶的存在下的崩解作用,2)用脱墨化学制品和本发明的酶的崩解 作用,和/或3)在用本发明的酶浸泡后的崩解作用。与仅用纤维素酶 处理的纸比较,用淀粉酶处理的再循环纸在调色剂颗粒去除后可以具 有更高的亮度。尽管本发明不限于任何具体机制,但本发明的淀粉酶 和/或葡糖淀粉酶的作用可能是由于其在浆悬浮液中作为表面活性剂 的行为。
本发明提供了使用本发明的一种或多种多肽处理纸和纸浆的方 法。本发明的多肽可以在任何纸或浆处理方法中使用,所述纸或浆处 理方法是本领域众所周知的,参见例如,美国专利号6,241,849; 6,066,233;5,582,681。例如,在一个方面,本发明提供了用于使包 含染料的印刷纸脱墨和脱色的方法,其包括使印刷纸成浆状以获得液 体浆,并且在本发明的酶(也可以添加其他酶)的存在下移去液体浆 中的墨。在另一个方面,本发明提供了用于增强浆例如由二次纤维制 成的浆的自由度的方法,通过将包含本发明的酶的酶促混合物(也可 以包括其他酶,例如果胶酶)加入浆中,并且在引起产生酶促处理浆 的反应的条件下处理。酶促处理浆的自由度由二次纤维浆的起始自由 度增加而没有亮度中的损失。
在一个方面,一种或多种其他酶与包含本发明的酶的组合物结合 使用,用于与这些浆和/或纸处理方法一起使用,例如包括其他淀粉酶、 β-半乳糖苷酶、过氧化氢酶、漆酶、纤维素酶、内切糖苷酶、内切- β-1,4-漆酶、淀粉葡糖苷酶、其他葡糖苷酶、葡萄糖异构酶、糖基转 移酶、脂肪酶、磷脂酶、脂氧合酶、β-漆酶、内切-β-1,3(4)-漆 酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、 氧化酶、脱羧酶、碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖酶、 半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、 鼠李半乳糖醛酸聚糖乙酰酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳 糖醛酸酶、rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷 酰胺酶、果胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
再制浆:木质纤维素材料的处理
本发明还提供了用于处理木质纤维素纤维的方法,其中纤维用本 发明的多肽以足以改善纤维性质的量进行处理。本发明的淀粉酶和/ 或葡糖淀粉酶也可以在由多糖例如淀粉、强化废纸和卡纸板生产木质 纤维素材料例如浆、纸和卡纸板中使用,特别是其中再制浆在超过7 的pH下发生,和其中淀粉酶可以促进废料通过强化多糖例如淀粉的降 解的崩解作用。本发明的淀粉酶和/或葡糖淀粉酶在用于由淀粉包被的 印刷纸生产造纸浆的过程中可以是有用的。该过程可以如例如WO 95/14807中所述来进行。
示例性过程包含使纸崩解以生产浆,在崩解之前、之时或之后用 多糖降解例如淀粉降解酶处理,以及在崩解和酶处理后使墨颗粒与浆 分离。还参见美国专利号6,309,871和本文引用的其他美国专利。因 此,本发明包括再循环纸浆的酶促脱墨的方法,其中以对于纤维表面 的有效脱墨有效的量应用多肽。
废物处理
本发明的酶可以在各种其他工业应用例如废物处理中使用。例如, 在一个方面,本发明提供了使用本发明的酶的固体废物消化过程。该 方法可以包括减少基本上未处理的固体废物的量和体积。固体废物可 以在受控温度下在酶促溶液(包括本发明的酶)的存在下用酶促消化 过程进行处理。这导致没有来自添加微生物的可感觉到的细菌发酵的 反应。固体废物转变成液化废物以及任何残留的固体废物。所得到的 液化废物可以与所述任何残留的固体废物分开。参见例如,美国专利 号5,709,796。
在一个方面,一种或多种其他酶与包含本发明的酶的组合物结合 使用,用于与这些废物处理方法一起使用,例如包括其他淀粉酶、β- 半乳糖苷酶、过氧化氢酶、漆酶、纤维素酶、内切糖苷酶、内切-β-1,4- 漆酶、淀粉葡糖苷酶、其他葡糖苷酶、葡萄糖异构酶、糖基转移酶、 脂肪酶、磷脂酶、脂氧合酶、β-漆酶、内切-β-1,3(4)-漆酶、角 质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、 脱羧酶、碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖酶、半纤维素 酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半 乳糖醛酸聚糖乙酰酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳糖醛酸 酶、rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷酰胺酶、 果胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
口腔护理产品
本发明提供了包含本发明的淀粉酶和/或葡糖淀粉酶的口腔护理 产品。示例性口腔护理产品包括牙膏、牙科软膏、凝胶或牙粉、牙的、 漱口剂、刷牙前或后冲洗制剂、口香糖、糖锭或糖果。参见例如,美 国专利号6,264,925。
在一个方面,一种或多种其他酶与包含本发明的酶的口腔护理组 合物结合使用,并且用于与这些方法一起使用,例如包括其他淀粉酶、 β-半乳糖苷酶、过氧化氢酶、漆酶、纤维素酶、内切糖苷酶、内切- β-1,4-漆酶、淀粉葡糖苷酶、其他葡糖苷酶、葡萄糖异构酶、糖基转 移酶、脂肪酶、磷脂酶、脂氧合酶、β-漆酶、内切-β-1,3(4)-漆 酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、 氧化酶、脱羧酶、碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖酶、 半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、 鼠李半乳糖醛酸聚糖乙酰酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳 糖醛酸酶、rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷 酰胺酶、果胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
酿造和发酵
本发明提供了包括本发明的葡糖淀粉酶和/或淀粉酶的酿造(例 如,发酵)啤酒的方法。在一个示例过程中,含淀粉原材料进行崩解 且加工以形成麦芽。本发明的葡糖淀粉酶和/或淀粉酶可以在发酵过程 中的任何点上使用。例如,本发明的淀粉酶和/或葡糖淀粉酶可以在大 麦麦芽的加工中使用。啤酒酿造的主要原材料是大麦麦芽。这可以是 3步骤过程。首先,大麦粒可以浸泡以增加含水量,例如至约40%。 其次,当酶合成在赤霉素的控制下进行刺激时,谷粒可以通过于15-25 ℃温育3-6天进行发芽。在这个过程中,淀粉酶水平显著升高。在一 个方面,本发明的淀粉酶和/或葡糖淀粉酶在该过程的这个(或任何其 他)阶段时添加。淀粉酶的添加导致可发酵还原糖的增加。这可以表 示为糖化力DP,其可以于12℃在5天内从约80增至190。
本发明的淀粉酶和/或葡糖淀粉酶可以在任何啤酒加工过程中使 用,如例如美国专利号5,762,991;5,536,650;5,405,624;5,021,246; 4,788,066中描述的。
在一个方面,一种或多种其他酶与包含本发明的酶的饲料、饲料 或饮料结合使用,例如包括其他淀粉酶、β-半乳糖苷酶、过氧化氢酶、 漆酶、纤维素酶、内切糖苷酶、内切-β-1,4-漆酶、淀粉葡糖苷酶、 其他葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂肪酶、磷脂酶、脂氧 合酶、β-漆酶、内切-β-1,3(4)-漆酶、角质酶、过氧化物酶、淀 粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、碳酸氧化酶、 木质酶、支链淀粉酶、阿拉伯糖酶、半纤维素酶、甘露聚糖酶、 xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛酸聚糖乙酰 酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳糖醛酸酶、 rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷酰胺酶、果 胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
在钻井和采矿操作中的用途
本发明还提供了在井和钻探操作,例如气、油或其他钻探或采矿 操作中使用本发明的酶的方法。例如,在一个方面,本发明的酶用于 增加来自地层例如井或矿的生产液的流动。在一个方面,本发明的酶 用于去除可能损害的粘性含多糖和/或含淀粉液体,例如在生产操作中 形成的液体。这些含多糖和/或含淀粉液体可以在围绕完成的井眼的地 层内发现。在一个方面,本发明的淀粉酶和/或葡糖淀粉酶在油井钻井 液中用于帮助运走钻探泥浆。
本发明提供了用于改变组合物的粘度的方法,其包括:提供本发 明的组合物和多肽、和组合物;用本发明的多肽处理组合物;和在该 方法的一个方面,组合物包含土壤或钻探泥浆。
在一个方面,本发明的这些方法的使用允许来自井眼或矿的生产 液(包含本发明的酶)的流动。该方法可以包括使来自层的生产液的 流动减少至预期流速下,以及通过使水性液体和本发明的多肽混合在 一起配制酶处理。该方法可以包括抽出酶处理至井眼或其他钻杆内的 所需位置,并且允许酶处理降解粘性的、含淀粉的、损害液体。该方 法可以包括去除从地层到井或杆表面的液体。在一个方面,酶处理有 效攻击在含淀粉液体中的α糖苷键。在一个方面,本发明的淀粉酶和/ 或葡糖淀粉酶用于矿山钻探、钻井(例如,气或油井钻探)等中以运 走钻探泥浆,例如在钻孔的同时(井眼或杆)。
本发明的酶可以在任何井、杆或矿山钻探操作中使用,所述操作 中的许多是本领域众所周知的。例如,本发明提供了将本发明的酶引 入包含油和/或气的岩石层内的方法,其在一个方面还可以包含油或气 田生产化学制品,所述方法包括使包含酶(和在一个方面,化学制品) 的微乳液向下通过生产井然后进入层内。在一个方面,对生产井实施 “围绕”处理,由此在压力下将包含本发明的酶的水性组合物注入生 产井内,并且“挤”进层内并且保留在那里。参见例如,美国专利号 6,581,687。
在一个方面,在气、油或其他钻探或采矿操作中使用的本发明的 淀粉酶和/或葡糖淀粉酶在高或低pH和/或高或低温下是有活性的,例 如在这些过程中使用的本发明的淀粉酶和/或葡糖淀粉酶在包含约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4或更低的条件下,或在包 含pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5 或pH 11或更高的条件下是有活性的。在一个方面,在这些过程中使 用的本发明的淀粉酶和/或葡糖淀粉酶在包含约0℃-约37℃之间、或 约37℃-约95℃或更多之间、或约80℃-约120℃之间的任何地方的温 度范围的条件下是有活性的,例如85℃、90℃、95℃、98℃、100℃、 105℃、110℃、115℃、120℃或更多。
在一个方面,一种或多种其他酶与包含本发明的酶的组合物结合 使用,用于与这些方法一起使用,例如包括其他淀粉酶、β-半乳糖苷 酶、过氧化氢酶、漆酶、纤维素酶、内切糖苷酶、内切-β-1,4-漆酶、 淀粉葡糖苷酶、其他葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂肪酶、 磷脂酶、脂氧合酶、β-漆酶、内切-β-1,3(4)-漆酶、角质酶、过 氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、 碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖酶、半纤维素酶、甘露 聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛酸 聚糖乙酰酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳糖醛酸酶、 rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷酰胺酶、果 胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
在一个方面,在这些气、油或其他钻探或采矿操作或者包括任何 油和气井洗涤和/或压裂过程中使用的本发明的酶或酶混合剂,在高或 低pH和/或高或低温下是有活性的,例如本发明的聚合物降解或多糖 降解(“聚合物破坏物”)酶,其包括使用这些和其他酶的“混合剂”, 例如淀粉酶、葡糖淀粉酶、黄原胶酶、糖苷酶和/或纤维素酶,或木质 素降解酶、α淀粉酶、β淀粉酶、葡糖淀粉酶、糊精酶、纤维素酶、 纤维二糖水解酶、微晶粉末纤维素酶、羧甲基纤维素酶、β-葡聚糖酶、 葡糖苷酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖酶、漆酶、木质素 过氧化物酶、果胶酶、果胶酸裂解酶、黄原胶酶、黄原胶裂解酶、黄 原胶解聚酶、支链淀粉酶、苔聚糖酶、pachymanase、脂肪酶、蛋白酶、 蛋白水解酶、植酸酶、肽酶和过氧化氢酶,其包括使用这些和其他酶 的“混合剂”,在这些过程中使用,在包含约pH 6.5、pH 6、pH 5.5、 pH 5、pH 4.5、pH 4.0、pH 3.5、pH 3.0或更低(更酸性)的条件下, 或在包含约pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、 pH 10.5、pH 11.0、pH 11.5、pH 12、pH 12.5或更高(更碱性)的 条件下是有活性的。在一个方面,在这些过程中使用的本发明的酶或 酶混合剂在包含下述任何地方的温度范围的条件下是有活性的:约 -100℃-约-80℃、约-80℃-约-40℃、约-40℃-约-20℃、约-20℃-约 0℃、约0℃-约37℃、约0℃-约5℃、约5℃-约15℃、约15℃-约25 ℃、约25℃-约37℃、约37℃-约45℃、约45℃-约55℃、约55℃- 约70℃、约70℃-约75℃、约75℃-约85℃、约85℃-约90℃、约90 ℃-约95℃、约95℃-约100℃、约100℃-约105℃、约105℃-约110 ℃、约110℃-约120℃或95℃、96℃、97℃、98℃、99℃、100℃、 101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109 ℃、110℃、111℃、112℃、113℃、114℃、115℃、120℃或更高。
在一个实施方案中,“pH触发机制”包含使用嗜热酶,例如 “pyrolase”,例如多肽SEQ ID NO:4和/或SEQ ID NO:6(例如, 分别由SEQ ID NO:3和SEQ ID NO:5编码的)。在一个方面,本发 明提供了包含在泥浆或其以干燥形式的成分中产生的一种或多种酶的 系统,例如瓜尔胶粉末、砂或缓冲盐。在一个方面,酶由于泥浆的低 温而保持静止或“较少活性”,或由于酶装载量这样调整而保持静止 或“较少活性”,使得无或较少“过早的”(不希望有的)降解(底 物的)发生,直至泥浆加热至有助于一种或多种酶激活的更高温度。 这个实施方案可以提及为“具有温度触发机制的产生酶系统”。
在一个方面,本发明的组合物和方法用于降解“泥浆”中的聚合 物,其在可替代实施方案中包括其中酶、多糖和其他组分混合的含水 介质。在一个方面,本发明的组合物和方法作为溶液或干粉使用,其 可以与“泥浆”的成分或组分混合。在一个方面,在实际泥浆制备前 将酶掺入/产生到泥浆的成分内。例如,用于实践本发明的示例性制剂 或混合物包含与一种或多种酶混合的淀粉、黄原胶或纤维素粉,或缓 冲盐和一种或多种酶的混合物,其中此种含酶成分各自随后可以用于 制备泥浆。
游离和固定酶在水力压裂和钻探操作中的用途:
本发明提供了包含下述的组合物和方法:包括以游离形式或固定 形式的聚合物破坏(聚合物降解)例如多糖降解酶,例如以作为包被 在例如颗粒例如砂粒或陶瓷材料例如烧结铝矾土上的固定形式。
在一个方面,组合物和方法包含包括在树脂或类似材料中或其上 的聚合物破坏(聚合物降解)例如多糖降解酶,所述材料包被颗粒例 如砂粒或陶瓷材料例如烧结铝矾土;这些颗粒(例如砂粒)可以用作 水力压裂液体中的支撑剂(例如,树脂涂层砂或高张力陶瓷材料)或 与支撑剂一起使用。在一个方面,用于实践本发明的支撑剂是与压裂 液体混合的分级颗粒,以在水力压裂处理后使断口保持开放。除了天 然存在的砂粒外,还可以使用人造或特别改造的支撑剂,例如树脂涂 层砂或高张力陶瓷材料如烧结铝矾土。支撑剂材料可以就大小和球形 度进行分类,以提供用于产生液体从储库到井眼的有效管道。砂在井 裂缝和断口中沉降后,树脂结合酶可以散开且对浓缩且未破坏的聚合 物发挥作用,所述聚合物通常在压裂操作完成时沉积于层表面上。因 此,本发明的这个方面可以从压裂的油和气井中有效去除多糖、黄原 胶或瓜尔胶例如瓜尔胶滤饼,和/或可以增强压裂带的渗透性。
在一个实施方案中,在水力压裂操作过程中,大量水、砂、辅助 化学制品(包括本发明的酶和酶混合物)和基于多糖的聚合物(例如, 瓜尔胶和/或其衍生物)进行混合,且在压力下注入油和/或气井内, 以‘压裂’周围层且增强气或油流动到井眼内。如本文所描述的酶和 酶混合物可以用于水解这些多糖聚合物,并且减少液体(在水力压裂 操作中使用的)的粘度,用于更好的渗透到层内且在操作结束时更有 效的回流。
在一个实施方案中,本发明的组合物和方法在基础聚合物(例如, 基于多糖的聚合物,例如瓜尔胶、黄原胶和/或其衍生物)的酶促水解 中使用;实践本发明可以解决下述问题:其中这些基础聚合物的酶促 水解可能不完全,以在水力压裂操作中使用的液体中留下某些“未破 坏的”聚合物。随着液体含水量消失在层里,液体变得更浓缩且未破 坏的聚合物形成稠滤饼;这种滤饼塞住层孔且减少油或气流动到井眼 内在一个实施方案中,本发明的组合物和方法用于打碎这些滤饼 塞子。
压裂液体包含大量砂,通常称为支撑剂。随着液体泵到井内,支 撑剂沉降到裂缝和断口内且阻止它们关闭。这帮助增强层的有孔性和 渗透性用于更好的气/油流动。砂粒通常用不同工业树脂包被,以增加 其机械强度且使它们在层压力下不破碎。因此,在一个实施方案中, 本发明提供了在砂的涂层材料周围、其中或其上使用游离或固定聚合 物降解(“聚合物破坏”)酶的组合物和方法。在一个方面,这通过 将酶捕获在树脂中或通过固定在涂层表面上来完成。因此,在一个方 面,用于实践本发明的一种或多种酶可以保持与滤饼接触,从而改善 浓缩聚合物的连续水解,从断口处去除饼,且增强压裂层的渗透性。
在一个方面,本发明提供了在钻探操作例如一般的钻探操作中使 用这些所描述的酶的方法,其中井通过用石油钻机在土中钻探直径 5-30英寸(13-76cm)的洞来产生,所述石油钻机使钻头旋转。在钻 洞后,将比洞略小的钢管(套)置入洞内,且用水泥稳固。套对新钻 的井眼提供了结构完整性,另外使潜在危险的高压区彼此隔开且与表 面隔开。
对于安全隔开的这些区和通过套保护的层,井可以用更小的头钻 得更深(进入潜在更不稳定和剧烈的层内),并且也用更小尺寸的套 来套上。井可以具有在彼此内钻探的顺次更小孔径的2-5组,各自与 套粘牢。
为了钻井,通过旋转力矩和其上的钻环的压缩力辅助的钻头将土 打碎。包含包括以游离形式或固定形式的、本发明的聚合物破坏(聚 合物降解)例如多糖降解酶和酶混合物钻井液或“泥浆”,向下泵到 钻探管内。液体在钻头上流出,并且帮助打碎岩石,保持在头上的压 力,以及使头清洁、冷却和润滑。
所产生的岩石“碎屑”通过钻井液清除,随着它循环回到钻探管 外的表面。包含以游离形式或固定形式的、本发明的聚合物破坏(聚 合物降解)例如多糖降解酶和酶混合物的液体也可以在这个阶段时加 入。
液体随后越过“振荡器”,所述振荡器使在筛上的碎屑摇出,允 许良好流动性以返回到坑内。包含以游离形式或固定形式的、本发明 的聚合物破坏(聚合物降解)例如多糖降解酶和酶混合物的液体也可 以在这个阶段时加入。
本发明的这些过程可以通过加入以游离形式或固定形式的、本发 明的聚合物破坏(聚合物降解)例如多糖降解酶和酶混合物得到促进。 钻架可以包含所有必需设备,以使钻井液循环、升起且转动管,控制 井下压力、去除来自钻井液的碎屑,且产生用于这些操作的就地力量。
本发明的酶、酶混合物和方法可以对于任何钻探泥浆或钻井液(有 时优选保留术语“钻探泥浆”用于更复杂和定义明确的“泥浆”), 或在土中钻孔的操作中使用的任何液体进行实践。本发明的酶、酶混 合物和方法可以在钻探油和/或天然气井时,以及在研究钻架时包括对 更简单的洞使用进行实践。
本发明的酶、酶混合物和方法可以在任何井或钻探操作中使用, 与任何井或钻探操作混合和/或连同任何井或钻探操作一起实践,例如 在其中使用任何泥浆,包括使用3个泥浆主要分类方案中的任何一个, 其中“泥浆”广泛使用且基于构成泥浆的主要组分而分成3类:(1) “基于水的泥浆”(WBM),这可以再分成分散和未分散的泥浆;(2) “非水”或更通常地“基于油的泥浆”(OBM),包括合成油(SBM); 和/或(3)气或气体泥浆。
本发明的酶、酶混合物和方法可以在任何井或钻探操作中使用, 与任何井或钻探操作混合和/或连同任何井或钻探操作一起实践,例如 可以在下述中使用或与下述一起使用:
·生产井,当它们主要钻探用于生产油或气时,一旦生产结构和 特征确定,
·评估井,当它们用于评估证明烃聚集的特征(例如流速)时,
·研究井,当它们纯粹钻探用于在新区域中的研究(信息收集) 目的时,
·初探井,当它们主要基于希望在其中关于地下知之甚少的边界 区域中钻探时。
本发明的酶、酶混合物和方法可以在任何井或钻探操作中使用, 与任何井或钻探操作混合和/或连同任何井或钻探操作一起实践,例如 也可以与下述方法、设备和/或钻探操作结合使用,如例如美国专利申 请公开号20070089910,Hewson,等人中描述的,所述专利描述了形 成支持地下井眼的方法,以及使用例如螺杆钻具(positive displacement mud motor)。
本发明的酶、酶混合物和方法可以在下述方法、设备和/或钻探操 作中使用,与下述方法、设备和/或钻探操作混合和/或连同下述方法、 设备和/或钻探操作一起实践,如例如美国专利申请公开号 20070084638,Bohnsack;C.,等人中描述的,所述专利描述了例如用 于促进来自容器的沉降固体与钻探泥浆的流动的系统,该系统包括在 压力下可流动液体通过其的具有至少一个喷嘴的压力喷嘴器械,用于 使压力喷嘴器械选择性旋转的动力旋转器械,从而使得当液体通过至 少一个喷嘴泵到容器内时,至少一个喷嘴可在容器内移动;并且在一 个方面,当液体在压力泵到至少一个旋转喷嘴时,关于就容器而言移 动压力喷嘴器械的平移器械。泥浆罐和泥浆池也得到描述,并且本发 明的酶、酶混合物和方法可以在这些类型中使用的任何泥浆罐和泥浆 池中使用,或与这些类型中使用的任何泥浆罐和泥浆池一起使用。
本发明的酶、酶混合物和方法可以在下述方法、设备和/或钻探操 作中使用,与下述方法、设备和/或钻探操作混合和/或连同下述方法、 设备和/或钻探操作一起实践,如例如美国专利申请公开号 20070081157,Csutak;S.,等人中描述的,所述专利描述了用于估计 井下液体的性质的仪器,其包含用于在产生拉曼散射光的波长下将光 诱导到液体内的紫外线(UV)光源,在比响应诱导光由液体反射的基 本荧光的波长更短的波长下;检测拉曼散射光的光谱且响应检测到的 光谱提供信号的检测器;和加工信号以提供液体性质的估计的处理器。 本发明的酶、酶混合物和方法可以在这些液体和/或操作中的任何一种 中使用,或与这些液体和/或操作中的任何一种一起使用,以估计层液 体中的滤液污染。例如,这些方法包括在基于油的泥浆中存在的至少 一种组分的多个波长下检测拉曼散射,所述基于油的泥浆在层中非天 然存在,并且本发明的酶、酶混合物和方法可以用于帮助这种检测的 精确性。
本发明的酶、酶混合物和方法可以在下述方法、设备和/或钻探操 作中使用,与下述方法、设备和/或钻探操作混合和/或连同下述方法、 设备和/或钻探操作一起实践,如例如美国专利申请公开号 20070075706,Chen,S.,等人中描述的,所述专利描述了例如评估土 层的方法,其包括用井下工具在土层中的钻孔中进行测量;在其中进 行测量的深度处测量井下工具的触角的品质因子;以及使用在钻孔中 测量的泥浆的Q和电阻率以及层的电阻率、和/或钻孔大小指示器 (BSI),用于估计其他层电阻率和BSI,包括测量钻孔中的泥浆的电 阻率。本发明的酶、酶混合物和方法可以在这些液体和/或操作中的任 何一种中使用,或与这些液体和/或操作中的任何一种一起使用,以估 计土层。
本发明的酶、酶混合物和方法可以在下述方法、设备和/或钻探操 作中使用,与下述方法、设备和/或钻探操作混合和/或连同下述方法、 设备和/或钻探操作一起实践,如例如美国专利申请公开号 20070068675,Barry,M.,等人中描述的,所述专利描述了例如用于 钻探和完成砂砾充填井的方法,其包括用钻井液钻探井眼,调节钻井 液,运行砂砾充填装配工具至井眼中具有调节钻井液的深度,并且用 完井液砂砾充填井眼层段。完井液可以与钻井液相同。这种方法可以 与交替路径砂筛技术组合,以确保砂砾充填的正确分布。用于钻探、 砂砾充填和砂筛安装的合适液体是成功完井所需的。小心规划、井制 备和完成执行是增加完成生产力和长寿命必需的。通常,最低限度3 种液体已用于钻探和完成砂砾充填井。第一种液体是用于钻探完井层 段的含固体的钻井液。第二种液体是无固体的完井液,用于取代含固 体的钻井液,并且在一般无固体环境中运行防砂设备和砂砾充填工具。 第三种液体是在完井层段的砂砾充填过程中用于砂砾的载液。本发明 的酶、酶混合物和方法可以在这些液体(包括含固体的钻井液、无固 体的完井液和/或载液)和/或操作中的任何一种中使用,或与这些液 体和/或操作中的任何一种一起使用,用于钻探和完成砂砾充填井。
本发明的酶、酶混合物和方法可以在下述方法、设备和/或钻探操 作中使用,与下述方法、设备和/或钻探操作混合和/或连同下述方法、 设备和/或钻探操作一起实践,如例如美国专利申请公开号 20070066491,Bicerano;J.,等人中描述的,所述专利在油和天然气 井的构建、钻探、完成和/或压裂刺激中使用颗粒;例如作为支撑剂部 分单层、支撑剂包、砂砾充填完成的整体组分、滚珠轴承、固体润滑 剂、钻探泥浆组成成分和/或水泥添加剂,包括使用热固性聚合物颗粒 用于在这样的应用中使用,所述应用需要具有高硬度、强度、温度抵 抗力、和/或对侵蚀性环境的抵抗力的重量轻的颗粒。本发明的酶、酶 混合物和方法可以在下述中的任何一种中使用或与下述中的任何一种 一起使用:砂砾充填、滚珠轴承、固体润滑剂、钻探泥浆组成成分、 水泥添加剂和/或所描述的热固性聚合物颗粒。本发明的酶、酶混合物 和方法可以在纳米填充剂和/或纳米组合物中使用或与纳米填充剂和/ 或纳米组合物一起使用,包括异质纳米组合物形态。
本发明的酶、酶混合物和方法可以在下述方法、设备和/或钻探操 作中使用,与下述方法、设备和/或钻探操作混合和/或连同下述方法、 设备和/或钻探操作一起实践,如例如美国专利申请公开号 20070039735,Robertson;B.,等人中描述的,所述专利描述了封闭 地层内的可渗透带的方法,其包括:制备包含油、粘土、氯化镁和氧 化镁粉末的填塞组合物;且使填塞组合物与地层中的水接触,从而使 得填塞组合物形成封闭块,从而基本上封闭地层内的可渗透带。
本发明的酶、酶混合物和方法可以在可变密度钻探泥浆中使用, 与可变密度钻探泥浆混合和/或连同可变密度钻探泥浆一起实践,所述 可变密度钻探泥浆包含可压缩颗粒材料,例如如美国专利申请公开号 20070027036,Polizzotti;R.,等人中描述的。本发明的酶、酶混合 物和方法可以在钻探泥浆中使用或与钻探泥浆一起使用,所述钻探泥 浆包含在钻探泥浆中的可压缩颗粒材料,其中由于可压缩颗粒材料响 应压力或温度变化的体积变化,钻探泥浆的密度改变,并且其中可压 缩颗粒材料配置为维持钻探泥浆的密度在孔压力梯度和压裂梯度之 间,基于可压缩颗粒材料响应在一定深度处的压力变化的体积变化。
本发明的酶、酶混合物和方法可以单独或与所描述的(参见 Polizzotti;R.,等人)可压缩材料结合用于修饰钻探泥浆的粘度, 例如,在可泵需求内放置液体粘度,和/或调整孔压力梯度和压裂梯度。 本发明的酶、酶混合物和方法可以用于实现钻探泥浆中的体积变化, 例如其中钻探泥浆流变学配置为达到所需复合钻探泥浆流变学。
在一个方面,本发明的酶、酶混合物和方法用于改变钻探泥浆的 性质,以提供所需复合泥浆胶凝点,例如在钻探操作过程中可以使岩 石碎屑悬浮在井眼环状套管中的泥浆胶凝点;和/或与可压缩空心物体 (参见Polizzotti;R.,等人)结合或单独(不含)改变钻探泥浆的 粘度,以改变可泵需求。
在一个方面,本发明的酶、酶混合物和方法用于改变包含钻探泥 浆的井液、井净化液、修井液、隔离液、砂砾充填液、酸化液和/或压 裂液的性质。在一个方面,本发明的酶、酶混合物和方法使用可变密 度液体用于促进钻探、完成和/或刺激地层,且修饰可变密度液体。
在一个方面,本发明的酶、酶混合物和方法用于使用可变密度液 体钻探、完成和/或刺激地层的方法中,例如通过修饰和/或“调整” 液体的密度;例如包括下述步骤的方法(参见Polizzotti;R.,等人): 引入具有根据土层内的压力而变的密度的液体,其中该液体包含基础 液体和弹性颗粒的部分;以及使用可变密度液体(其可以包含本发明 的酶、酶混合物,或已通过本发明的方法进行修饰)钻探、完成和/ 或刺激地层。
在一个方面,本发明的酶、酶混合物和方法与如美国专利号 4,099,583中描述的方法和组合物一起使用,所述专利描述了双重梯 度钻探系统,其中将较轻的液体注入泥浆返回环状套管(一般在上升 器中)或其他途径内,以减少从注入点向上的泥浆密度,并且本发明 的酶、酶混合物和方法可以修饰和/或“调整”液体的密度。
在一个方面,本发明的酶、酶混合物和方法与如美国专利号 6,530,437和美国专利号6,588,501中描述的方法和组合物一起使用, 所述专利描述了用于减少水下上升器中的液压的多梯度钻探方法和仪 器;以及美国专利号6,422,326、美国专利号6,156,708、美国专利号 5,910,467和5,881,826,所述专利描述了向钻探泥浆制剂中添加各种 液体aphrons。
在一个方面,本发明的酶、酶混合物和方法与如美国专利号 6,497,289中描述的方法和组合物一起使用,所述专利描述了固体可 扩展衬垫的使用,例如陷入井内且扩展的管状系统。
在可替代实施方案中,本发明的酶、酶混合物和方法用于随着深 度改变钻探泥浆密度,从而使得有效的泥浆重量在所有深度时保持在 孔压力和压裂梯度之间。泥浆密度中的所需变化可以通过用本发明的 酶、酶混合物和方法改变液体性质来达到,以修饰/改变体积和密度, 以实现响应压力的变化。本发明的酶、酶混合物和方法可以与任何微 粒组分一起使用,例如各种形状,例如球形、立方形、,棱锥形、扁圆 或扁长球形、圆柱形、枕形和/或其他形状或结构。本发明的酶、酶混 合物和方法可以与任何微粒组分一起使用,例如充满加压气体的可压 缩空心物体,或如Polizzotti;R.,等人,同上中描述的可压缩固体 材料或物体。
在可替代方面,本发明的酶、酶混合物和方法可以在任何井或钻 探操作中使用,或与任何井或钻探操作一起使用,例如,包括定向钻 孔,有时称为倾斜钻孔,以钻探非垂直井;包括在定向钻孔3个主要 组中的任何一个中使用的;油田定向钻孔、实用安装定向钻孔(通常 称为H.D.D./水平定向钻孔/定向钻探);和/或内接缝定向钻孔 (Coal-Bed机器)。
在一个方面,本发明的酶、酶混合物和方法可以与测井结合使用, 所述测井是在油和气工业中用于记录岩石和液体性质的技术,以发现 在地壳内的地质建造中的烃带。可以执行测井以测量实践本发明的方 法的效果,例如将包含本发明的酶或酶混合物的液体泵到井内。测井 操作可以由将在电线的末端上的‘测井工具’下降到油井(或洞)内 组成,以测量层的岩石和液体性质。随后可以进行这些测量的解释, 以定位和定量包含油和气(烃)的可能深度带。这些年来开发的测井 工具测量岩石及其包含的液体的电、声、放射性、电磁和其他性质。 测井通常在测井工具拉出洞时执行。将这个数据记录至称为‘测井曲 线’的打印记录,并且通常数字传输给办公场所。测井在井钻探过程 中以及在钻探总深度时以各种间隔来进行,所述总深度可以为300 m-8000m(1000ft-25,000ft)或更多的深度。
除本文描述的方法、酶或酶混合物外,用于实践本发明的方法、 酶泥浆或其他钻井液可以包括基于水的钻探泥浆(的使用),所述基 于水的钻探泥浆可以包含膨润土(凝胶),并且在某些方面,还包括 添加剂例如硫酸钡(重晶石)、碳酸钙(白垩)或赤铁矿。各种增稠 剂也可以用于影响液体的粘度,例如木素磺酸盐、黄原胶、瓜尔胶、 乙二醇、羧甲基纤维素、聚阴离子纤维素(PAC)或淀粉。用于实践本 发明的本文描述的酶或酶混合物可以用于修饰液体的性质(例如,粘 度),例如以修饰木素磺酸盐、黄原胶、瓜尔胶、乙二醇、羧甲基纤 维素、聚阴离子纤维素(PAC)或淀粉的性质。
用于实践本发明的本文描述的方法、酶或酶混合物可以用于修饰 反絮凝剂的性质,所述反絮凝剂用于减少基于粘土的泥浆的粘度;阴 离子聚电解质,例如丙烯酸盐、聚磷酸盐、木质磺酸盐(Lig)或鞣酸 衍生物例如Quebracho(红泥是基于Quebracho的混合物的名称,按 红色鞣酸盐的颜色命名;它通常在1940s至1950s中使用,随后在木 质磺酸盐变得可用时而变得不再使用)。
用于实践本发明的本文描述的方法、酶或酶混合物可以用于(例 如加入)水注射器中用于将水注入制剂内,以维持储库压力或仅处理 与烃产生的水(例如,因为即使在处理后,它也将太油和太盐而不能 视为清洁的用于倾卸,例如倾卸在船外或在陆上井的情况下倾卸到淡 水源内)。因此,本发明的方法和组合物(例如,酶的混合物、固定 酶)与水注射一起用作储库管理和生产水处理的元素。
用于实践本发明的本文描述的方法、酶或酶混合物可以用于(例 如加入)蓄水层发生器中,例如作为在有意产生储库水用于再注入(例 如在井眼中)以管理压力;这实际上是将储库水从它不是那么有用的 地方移到它更有用的地方。这些井一般将仅在来自油或气发生器的生 产水不足以用于储库管理目的时使用。因此,在一个方面,本发明的 方法和组合物(例如,酶的混合物、固定酶)与蓄水层生产水和/或海 水一起使用。
延迟释放组合物
本发明提供了延迟释放或“控制释放”组合物,其包含由乳胶聚 合物例如乳胶漆或等价物包被的所需组合物。本发明的延迟释放/控制 释放组合物可以包含任何所需组合物,包括酶或任何活性成分,包括 小分子、药物、多糖、脂质、核酸、维生素、抗生素、杀虫剂等。在 一个方面,涂层在相对低的温度下将不容易溶解,但在相对较高的温 度下将分解以释放所需组合物(例如,酶)。
本发明提供了用于组合物的延迟释放/控制释放的方法,其中组合 物由乳胶聚合物例如乳胶漆或等价物包被。
本发明的延迟释放/控制释放组合物和方法可以用于各种医学和 工业应用中,例如,在一个方面,本发明的延迟释放/控制释放酶组合 物包含在油强化回收操作中涉及瓜尔胶破裂液体的酶。本发明的油田 瓜尔胶降解应用通过这样的涂层得到促进,所述涂层在低温下将不容 易溶解,但在较高的温度下将分解以释放酶。
在另一个方面,本发明的延迟释放/控制释放酶组合物包含动物饲 料或营养补充剂,其包含例如酶、维生素、抗生素和/或其他食物、药 物或营养补充剂。通过在本发明的延迟释放/控制释放组合物上的涂层 保护动物饲料或营养补充剂中的这些活性化合物不受造粒条件或胃消 化影响。
在一个方面,释放是温度激活释放,例如所需组合物(例如,酶) 在升高的温度下释放,例如约37℃-约95℃或更高,例如,85℃、90 ℃、95℃、98℃、100℃或更高。释放率可以通过应用于所需组合物的 “屏障”或乳胶聚合物的厚度或量加以控制,所述组合物例如包含所 需组合物的丸剂或基质。因此,本发明提供了具有乳胶聚合物或等价 物的厚度范围的丸剂或基质以及使用其的方法。
本发明提供了例如在一个方面,包含本发明的酶的延迟释放/控制 释放酶组合物。在一个方面,本发明提供了由乳胶聚合物例如乳胶漆 或等价物包被的酶(例如本发明的酶),或包含酶(例如本发明的酶) 的丸状组合物。在一个方面,本发明提供了制备延迟释放酶组合物的 方法,其包括用乳胶聚合物例如乳胶漆或等价物包被酶(例如本发明 的酶),或包含酶(例如本发明的酶)的丸状组合物。在一个方面, 本发明提供了制备延迟释放/控制释放组合物的方法,其包括用乳胶聚 合物例如乳胶漆或等价物包被所需化合物。
在本发明的酶的延迟释放/控制释放组合物(例如延迟释放/控制 释放酶组合物)和方法中使用的乳胶聚合物包括但不限于,各种类型 例如下述:丙烯酸酯;醇酸树脂;纤维素;香豆酮-茚;环氧酯;酯; 烃;马来酸(maleics);三聚氰胺;天然树脂;油树脂;酚醛塑料; 聚酰胺;聚酯;松香;硅酮;苯乙烯;萜烯;尿素;乌拉坦;乙烯树 脂;等。在本发明的延迟释放组合物和方法中使用的乳胶聚合物也包 括但不限于,包含下述单体中的一种或多种同聚物或共聚物:(甲基) 丙烯酸酯;乙酸乙烯酯;苯乙烯;乙烯;氯乙烯;丁二烯;乙烯叉氯; 柯赫酸乙烯;丙酸乙烯酯;丙烯酸叔丁酯;丙烯腈;氯丁橡胶;马来 酸酯;延胡索酸酯;等,包括其增塑或其他衍生物。
在本发明的乳胶组合物中使用的乳胶聚合物的量不是关键的,而 可以是根据使用乳胶聚合物的充分建立的操作的任何量。在可替代方 面,干乳胶聚合物的量是总乳胶组合物的至少约1,或约2-约50,或 约3-约40重量%。本发明的乳胶组合物可以任选包含其他组分,例 如在乳胶组合物中通常使用的那些。这些另外组分包括但不限于下述 中的一种或多种:溶剂例如脂肪族烃或芳香烃、醇、酯、酮、乙二醇、 乙二醇醚、硝基烷等;色素;填充剂、干燥剂;平光剂;增塑剂;稳 定剂;分散剂;表面活性剂;增粘剂包括聚合缔合增稠剂、基于多糖 的增稠剂等;悬浮剂;流动控制剂;消泡剂;防结皮剂;防腐剂;延 伸剂;镀膜助剂;交联剂;表面改进剂;缓蚀剂;和在乳胶组合物中 有用的其他成分。在一个方面,具有改善的流变学和稳定性的本发明 的乳胶组合物通过根据建立的操作使乳胶聚合物和多糖与水组合而提 供。参见例如,美国专利号6,372,901;5,610,225。
在一个方面,在制备由乳胶聚合物例如乳胶漆或等价物包被的本 发明的含丸状或基质组合物中,所述组合物包含活性组合物,例如酶 (例如本发明的酶),活性组合物(例如酶)包埋在丸剂的体内(在 一个方面,大多数或所有活性组合物(例如酶)包埋在丸剂内。因此, 可以是所需活性成分的灭活剂的粗糙化学制品例如乳胶涂层,可以用 于包被丸剂或基质的表面。涂层组合物可以通过下述因素破坏,例如 热、酸、碱、压力、酶、其他化学制品等,以具有通过暴露于涂层降 解因素触发的所需酶促活性的控制释放。
在一个方面,活性组合物,例如酶(例如本发明的酶或另一种酶 例如甘露聚糖酶)分散在玉米限制膳食和/或玉米淀粉基质中(例如作 为丸剂)。这种混合物(例如丸剂)在室温(例如,约22℃)水中在 10分钟内崩解,以释放所有(100%)活性组合物,例如释放所有酶 促活性。在更高的温度下,释放率增加。这对于许多用途并非可接受 的崩解率。
然而,当本发明的延迟释放/控制释放组合物,即这种混合物由乳 胶聚合物例如乳胶漆或等价物包被时,混合物(例如,丸剂、基质) 的崩解延迟。释放率和程度可以通过应用于丸剂或基质的包衣(屏障) 的厚度加以控制,例如,涂层颗粒在22℃水中在6小时后将仅释放30 %的活性。在60℃下,50%的酶在90分钟内释放。在80℃下,80% 的酶在1个小时内释放。
在一个方面,将一种或多种其他酶加入本发明的延迟释放/控制释 放组合物内,例如包括其他淀粉酶、β-半乳糖苷酶、过氧化氢酶、漆 酶、纤维素酶、内切糖苷酶、内切-β-1,4-漆酶、淀粉葡糖苷酶、其 他葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂肪酶、磷脂酶、脂氧合 酶、β-漆酶、内切-β-1,3(4)-漆酶、角质酶、过氧化物酶、淀粉 酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、碳酸氧化酶、 木质酶、支链淀粉酶、阿拉伯糖酶、半纤维素酶、甘露聚糖酶、 xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛酸聚糖乙酰 酯酶、蛋白酶、肽酶、蛋白水解酶、聚半乳糖醛酸酶、 rhamnogalacturonases、半乳聚糖酶、果胶裂解酶、转谷酰胺酶、果 胶甲酯酶、纤维二糖水解酶和/或转谷酰胺酶。
生物量转变和清洁生物染料的产生
本发明提供了用于将生物量转变成燃料(例如,生物乙醇、生物 丙醇、生物丁醇或生物柴油)和化学制品的酶和方法。因此,本发明 的酶和方法提供了关于基于石油的产品使用的有效和可支撑替代物。 本发明提供了表达本发明的酶的生物,所述酶用于参与涉及天然生物 量转变的化学循环。在一个方面,用于转变的酶和方法在酶总体中用 于使生物量聚合物有效解聚成可代谢的碳部分。如上所述,本发明提 供了用于开发和实现最有效的酶的方法,以使得这些重要的新“生物 量转变”和替代能源工业过程成为可能。
在一个方面,本发明的多肽在用于将木质纤维素和/或淀粉生物量 转变成乙醇的过程中使用。本发明还提供了用于从包含淀粉和/或木质 纤维素生物量的组合物制备乙醇(“生物乙醇”)、丙醇(“生物丙 醇”)、丁醇(“生物丁醇”)、或柴油燃料(“生物柴油”)的过 程。木质纤维素和/或淀粉生物质材料可以得自农业作物,作为食物或 饲料生产的副产品,或作为木质纤维素废品,例如植物残渣和废纸。 用于由本发明的多肽处理的合适植物残渣例子包括茎、叶、外壳、外 皮、穗轴等,以及木材、木片、木浆和锯屑。适合于由本发明的多肽 处理的合适纸废物例子包括丢弃的复印纸、计算机打印纸、笔记本纸、 便签纸、打字机纸等,以及报纸、杂志、卡纸板和基于纸的包装材料。
在一个方面,本发明的酶和方法可以与由生物量制备乙醇的更“一 般的”方法结合使用,例如作为包括通过在反应器中对干木质纤维素 材料实施催化剂而使木质纤维素材料水解的方法,所述催化剂包含强 酸和金属盐的稀释溶液;这可以降低纤维素水解的活化能或温度,以 获得更高的糖得率;参见例如,美国专利号6,660,506;6,423,145。
合并本发明的酶的使用的另一种示例性方法,包括催化包含葡萄 糖单体的多糖例如淀粉(例如由1,4-α或1,6-α键连接的葡萄糖单体 聚合物)水解成糖;这可以与用于水解木质纤维素材料的酶结合使用, 所述木质纤维素材料包含半纤维素、纤维素和木质素。在一个方面, 在所选择的温度和压力下在水介质中对生物量实施第一个阶段水解步 骤,以初步实现半纤维素解聚而不是纤维素主要解聚成葡萄糖。这个 步骤导致其中液体水相包含起因于半纤维素解聚的溶解单糖的浆,以 及包含纤维素和木质素的固相。第二个阶段水解步骤可以包括这样的 条件,使得纤维素的至少主要部分解聚,此种步骤导致包含纤维素的 溶解/可溶的解聚产物的液体水相,这可以用本发明的酶水解。参见例 如,美国专利号5,536,325。本发明的酶可以在这个示例性过程的任 何阶段时加入。
合并本发明的酶的另一种示例性方法包括:通过用约0.4%-2% 强酸的一个或多个稀释酸水解阶段加工含木质纤维素生物质材料;和 通过碱性脱木质化处理酸水解生物质材料的未反应固体木质纤维素组 分,以产生用于生物可降解热塑性塑料和衍生物的前体。参见例如, 美国专利号6,409,841。本发明的酶可以在这个示例性过程的任何阶 段时加入。
合并本发明的酶的使用的另一种示例性方法包括在预水解反应器 中使木质纤维素材料预水解;将酸性液体加入固体木质纤维素材料中 以制备混合物;使混合物加热至反应温度;使反应温度维持足以使木 质纤维素材料分馏成溶解部分和固体级分的时间,所述溶解部分包含 来自木质纤维素材料的至少约20%的木质素,所述固体级分包含纤维 素;在反应温度或接近反应温度时,去除固体级分中的溶解部分,其 中使得固体级分中的纤维素更顺应酶促消化;和回收溶解部分。参见 例如,美国专利号5,705,369。本发明的酶可以在这个示例性过程的 任何阶段时加入。
本发明提供了用于制备基于液态烃的发动机燃料组合物(例如, 用于火花点火发动机)的方法,所述液态烃与通过使用本发明的酶或 方法制备的燃料等级酒精混合。在一个方面,通过使用本发明的酶制 备的燃料包含例如煤气液或天然气液-乙醇混合物。在一个方面,共溶 剂是生物量衍生的2-甲基四氢呋喃(MTHF)。参见例如,美国专利号 6,712,866。
本发明的用于木质纤维素的酶促降解,例如用于由木质纤维素材 料生产乙醇的方法,也可以包括使用生物质材料的超声波处理;参见 例如,美国专利号6,333,181。
使用本发明的酶用于制备生物燃料包含例如生物乙醇、生物丙醇、 生物丁醇或生物柴油的另一个示例性过程,包括预处理包含木质纤维 素原料的原材料,所述木质纤维素原料包含至少半纤维素和纤维素。 在一个方面,原材料包含马铃薯、大豆(油菜籽)、大麦、黑麦、玉 米、燕麦、小麦、甜菜根或甘蔗或组分或废物或食物或饲料生产副产 品。原材料(“原料”)在破坏植物的纤维结构的条件下进行反应, 以实现半纤维素和纤维素的至少部分水解。破坏条件可以包括例如对 原材料实施在pH 0.5-2.5下180℃-270℃的平均温度约5秒-60分钟; 或在pH 0.5-2.5下220℃-270℃的温度5秒-120秒或等价条件。这产 生具有增加的被酶消化的易接近性的原料,所述酶例如本发明的淀粉 酶或葡糖淀粉酶。美国专利号6,090,595。
用于木质纤维素材料的酶水解的示例性条件包括在约30℃-48℃ 和/或pH约4.0-6.0下的反应。其他示例性条件包括约30℃-60℃和 pH约4.0-8.0。
在使用本发明至少一种酶的本发明这些生物燃料(例如生物乙醇、 生物丙醇、生物丁醇或生物柴油)产生过程的一个方面,加入一种或 多种其他酶,例如其他淀粉酶、β-半乳糖苷酶、过氧化氢酶、漆酶、 纤维素酶、内切糖苷酶、内切-β-1,4-漆酶、淀粉葡糖苷酶、其他葡 糖苷酶、葡萄糖异构酶、糖基转移酶、脂肪酶、磷脂酶、脂氧合酶、 β-漆酶、内切-β-1,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、 葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、碳酸氧化酶、木质 酶、支链淀粉酶、阿拉伯糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、 木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛酸聚糖乙酰酯酶、蛋白酶、 肽酶、蛋白水解酶、聚半乳糖醛酸酶、rhamnogalacturonases、半乳 聚糖酶、果胶裂解酶、转谷酰胺酶、果胶甲酯酶、纤维二糖水解酶和/ 或转谷酰胺酶。
因此,本发明提供了用于加工包含木质纤维素的生物质材料的方 法,其包括接触包含本发明的多肽的组合物,其中任选地生物质材料 包含或衍生自农业作物,或是食物或饲料生产的副产品,或是木质纤 维素废品,或是植物残渣或废纸或废纸产品,和任选地多肽具有包含 淀粉酶、葡糖淀粉酶、葡糖苷酶的活性,例如α-葡糖苷酶或β-葡糖 苷酶活性,和任选地植物残渣包含茎、叶、外壳、外皮、穗轴、木材、 木片、木浆和锯屑,和任选地纸废物包含丢弃或用过的复印纸、计算 机打印纸、笔记本纸、便签纸、打字机纸、报纸、杂志、卡纸板和基 于纸的包装材料,和任选地生物质材料的加工产生生物乙醇。本发明 提供了包含本发明的多肽的生物质材料。
本发明提供了用于制备生物燃料(例如生物乙醇、生物丙醇、生 物丁醇或生物柴油)的方法,其包括使包含可发酵糖的组合物与本发 明的多肽接触,其中任选地包含可发酵糖的组合物包含植物、植物产 品或植物衍生物,和任选地植物或植物产品包含蔗糖植物或植物产品、 甜菜根或甜菜、小麦、玉米、大豆、马铃薯、稻或大麦,和任选地多 肽具有包含淀粉酶、葡糖淀粉酶、葡糖苷酶的活性,例如α-葡糖苷酶 或β-葡糖苷酶活性。
本发明提供了用于制备燃料(例如生物乙醇、生物丙醇、生物丁 醇或生物柴油)的方法,其包括使包含可发酵糖的组合物与本发明的 多肽接触,其中任选地包含可发酵糖的组合物包含植物、植物产品或 植物衍生物,和任选地植物或植物产品包含蔗糖植物或植物产品、甜 菜根或甜菜、小麦、玉米、大豆、马铃薯、稻或大麦,和任选地多肽 具有包含淀粉酶、葡糖淀粉酶、葡糖苷酶的活性,例如α-葡糖苷酶或 β-葡糖苷酶活性,和任选地燃料包含生物乙醇或汽油-乙醇混合物。 本发明提供了包含本发明的多肽的燃料,其中任选地多肽具有包含淀 粉酶、葡糖淀粉酶、葡糖苷酶的活性,例如α-葡糖苷酶或β-葡糖苷 酶活性,其中任选地燃料衍生自植物材料,所述植物材料任选地包含 马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜根 或甘蔗,和任选地燃料包含生物乙醇、生物丙醇、生物丁醇、生物柴 油和/或汽油-乙醇混合物。
在另一个方面,包含本文描述的酶的植物材料可以在工业过程中 用于生产燃料或能量。在植物中表达的酶可以加入原料材料中、混合 到原料材料内或喷射到原料材料上。可替代地,酶可以直接在原料材 料中表达。在一个实施方案中,表达酶的植物材料可以进行磨碎、研 磨、加热等,以便破坏包含酶的植物细胞或器官的物理完整性,从而 释放酶以与底物接触。植物材料的示例性来源包括但不限于,玉蜀黍、 苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高粱、小麦、燕 麦、黑麦、粟、大麦、稻、针叶树,草例如柳枝稷和芒属,豆类作物, 例如豌豆、豆和大豆,淀粉块茎/根,例如马铃薯、甘薯、木薯、芋头、 美人蕉、甜菜等。
本发明提供了多肽包括本发明的淀粉酶和/或葡糖淀粉酶和抗体, 以及用于将生物量或任何木质纤维素材料(例如包含纤维素、半纤维 素和木质素的任何组合物)转变成燃料(例如生物乙醇、生物丙醇、 生物丁醇、生物丙醇、生物甲醇、生物柴油)的方法,加上饲料、食 物和化学制品。例如,在一个方面,本发明的酶具有β-葡糖苷酶活性, 以从纤维二糖二聚体中释放D-葡萄糖。在一个方面,酶具有外-或内- β-葡聚糖酶活性。
因此,本发明的组合物和方法提供了关于基于石油的产品使用的 有效和可支撑替代物或附加物,例如作为生物燃料例如生物甲醇、生 物乙醇、生物丙醇、生物丁醇等的混合物,关于柴油燃料、汽油、煤 油等。本发明提供了表达本发明的酶的生物,所述酶用于参与涉及天 然生物量转变的化学循环。在一个方面,用于转变的酶和方法在酶总 体中用于使多糖、纤维素和/或半纤维素聚合物有效解聚成可代谢(例 如,可发酵)的碳部分。本发明提供了用于开发和实现最有效的酶的 方法,以使得这些重要的新“生物量转变”和替代能源工业过程成为 可能。
本发明的组合物和方法可以用于提供关于基于石油的产品使用的 有效和可支撑替代物或附加物,例如作为生物燃料例如生物乙醇、生 物丙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油和汽油。本发 明提供了表达本发明的酶的生物,所述酶用于参与涉及天然生物量转 变的化学循环。本发明提供了用于开发和实现最有效的酶的方法,以 使得这些重要的新“生物量转变”和替代能源工业过程成为可能。
本发明提供了用于加工材料的本发明的方法、酶和酶混合物或“混 合剂”,所述例如生物质材料,包含纤维寡糖(原文为 cellooligsaccharide)、阿拉伯木聚糖寡聚物、木质素、木质纤维素、 木聚糖、葡聚糖、纤维素和/或可发酵糖,其包括使组合物与本发明的 多肽或由本发明的核酸编码的多肽接触,其中任选地材料衍生自农业 作物(例如,小麦、大麦、马铃薯、柳枝稷、白杨木),是食物或饲 料生产的副产品,是木质纤维素废品,或是植物残渣或废纸或废纸产 品,和任选地植物残渣包含茎、叶、外壳、外皮、玉米或玉米穗轴、 玉米秸秆、玉米纤维、干草、麦秆(例如稻草或麦秸)、甘蔗渣、甜 菜浆、柑橘类植物浆和柑橘类植物果皮、木材、间伐木材、木片、木 浆、浆废物、废材、木屑和锯屑、建筑和/或拆毁废物和残骸(例如木 材、木屑和锯屑),和任选地纸废物包含丢弃或用过的复印纸、计算 机打印纸、笔记本纸、便签纸、打字机纸、报纸、杂志、卡纸板和基 于纸的包装材料,以及再循环的纸材料。此外,可以使用城市废物, 例如市政固体废物的纸部分、市政废材和市政绿色废物,连同包含糖、 淀粉和/或纤维素的其他材料。任选地材料例如生物质材料的加工产生 生物酒精,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇。
可替代地,本发明的多肽可以在生物量植物材料或其自身原料中 表达。
本发明的方法还包括获得转变的木质纤维素材料(通过本发明的 酶加工),并且通过发酵和/或通过化学合成将其制成燃料(例如生物 酒精,例如生物乙醇、生物甲醇、生物丁醇、生物丙醇或生物柴油)。 在一个方面,所产生的糖是发酵的和/或不可发酵的产物是气化的。
本发明的方法还包括使用本发明的酶转变藻类、新鲜植物油、废 弃植物油、动物脂和油脂(例如,牛油、猪油和黄色油脂)、或污水, 并且通过发酵和/或通过化学合成或转变将其制成燃料(例如生物酒 精,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇、或生物柴油)。
本发明的酶(包括制备和在某些方面分泌本发明的重组酶的例如 生物,例如微生物,例如真菌、酵母或细菌)可以在任何生物量转变 过程的任何阶段时使用或包括/整合,例如在任何一个步骤、几个步骤 时,或包括在所有步骤、或生物量转变过程的所有下述方法、或所有 这些生物燃料替代物中:
直接燃烧:材料通过直接加热的燃烧并且是最简单的生物量技术; 如果生物量来源在附近时,那么可以是非常经济的。
高温分解:是在不存在氧的情况下生物量通过加热的热降解。在 一个方面,生物量加热至约800-1400华氏度的温度,但不引入氧支持 燃烧,导致气体、燃料油和木炭的产生。
气化:生物量可以通过加热或厌氧消化用于产生甲烷。合成气, 一氧化碳和氢的混合物可以衍生自生物量。
填埋气:通过在填埋物中埋藏垃圾的腐烂(厌氧消化)产生。当 有机废物分解时,它产生由约50%甲烷组成的气体,所述甲烷是天然 气的主要组分。
厌氧消化:将有机物质转变成甲烷——天然气的主要组分和二氧 化碳的混合物。在一个方面,生物量例如废水(污水)、肥料或食物 加工废物与水混合,且装进不含空气的消化罐内。
发酵
酒精发酵:燃料酒精通过下述进行生产:将纤维素物质和/或 淀粉转变成糖,使糖发酵成酒精,随后通过蒸馏分离酒精水混合物。 原料例如专用农作物(例如,小麦、大麦、马铃薯、柳枝稷、白杨木), 农业残渣和废物(例如稻草、玉米秸秆、麦秸、甘蔗渣、稻壳、玉米 纤维、甜菜浆、柑橘类植物浆和柑橘类植物果皮),林业废物(例如 间伐硬木材和软木材、来自木料操作的硬木材和软木材残渣、木屑和 锯屑),城市废物(例如市政固体废物的纸部分、市政废材和市政绿 色废物),废材(例如锯木厂废物、纸浆厂废物、建筑废物、拆毁废 物、木屑和锯屑),和废纸或包含糖、淀粉和/或纤维素的其他材料, 可以转变成糖,随后通过用酵母发酵转变成酒精。可替代地,包含糖 的材料可以通过发酵直接转变成酒精。
转酯化作用:用于将油转变成生物柴油的示例性反应称为转酯 化作用。转酯化作用过程使醇(如甲醇)与甘油三酯油、成形脂肪酸 烷基酯(生物柴油)和甘油反应,所述甘油三酯油包含在植物油、动 物脂或再循环油脂中。该反应需要加热和强碱催化剂,例如氢氧化钠 或氢氧化钾。
生物柴油:生物柴油是由植物油、动物脂或再循环油脂制备的脂 肪酸烷基酯混合物。生物柴油可以以其纯化形式用作燃料用于交通工 具,但它通常用作石油柴油添加剂,以减少来自柴油动力交通工具的 微粒、一氧化碳、烃和空气毒物水平。
水解:包括使用本发明的酶催化化合物的水解,所述化合物例如 生物量,例如木质纤维素材料。
联产(Congeneration):是使用单一燃料和设施同时产生超过一 种形式的能量。在一个方面,生物量联产具有比单独的生物量产生更 有效的增长,因为联产产生热和电。
在一个方面,本发明的多肽具有酶促活性(包括例如淀粉酶或葡 糖淀粉酶活性)用于由有机材料产生燃料(例如生物酒精,例如生物 乙醇、生物甲醇、生物丁醇或生物丙醇、或生物柴油),所述有机材 料例如生物量,例如衍生自植物和动物的组合物,包括任何农业作物 或其他可再生原料,农业残渣或动物废物,市政和工业废物的有机组 分,或建筑或拆毁废物或残骸,或微生物例如藻类或酵母。
在一个方面,本发明的多肽在用于将木质纤维素生物量转变成燃 料(例如生物酒精,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇、 或生物柴油)的过程中使用,或另外在用于水解或消化生物材料的过 程中使用,从而使得它们可以用作燃料(例如生物酒精,例如生物乙 醇、生物甲醇、生物丁醇或生物丙醇、或生物柴油),或用于使生物 量更易于加工成燃料。
在一个可替代方面,本发明的多肽包括本发明的酶混合物或“混 合剂”,在用于转酯化作用过程的过程中使用,所述转酯化作用过程 使醇(如乙醇、丙醇、丁醇、丙醇、甲醇)与甘油三酯油、成形脂肪 酸烷基酯(生物柴油)和甘油反应,所述甘油三酯油包含在植物油、 动物脂或再循环油脂中。在一个方面,生物柴油由大豆油或再循环的 烹饪油制成。动物的脂肪、其他植物油和其他再循环油也可以用于生 产生物柴油,依赖其成本和可用性。在另一个方面,所有种类的脂肪 和油的混合物用于生产本发明的生物柴油燃料。
本发明的酶包括本发明的酶混合物或“混合剂”,也可以在甘油 精炼中使用。甘油副产品包含未反应的催化剂和由酸中和的皂。去除 水和醇以产生50%-80%粗甘油。其余污染物包括未反应的脂肪和油, 其可以使用本发明的多肽进行加工。在本发明的大型生物柴油工厂中, 甘油可以进一步纯化例如至99%或更高纯度,用于药学和化妆品工 业。
使用本发明的多肽包括本发明的酶混合物或“混合剂”制备的燃 料(包括生物酒精,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇、 或生物柴油),可以与燃料充氧一起使用,以改善燃烧特性。添加氧 导致更完全的燃烧,这减少一氧化碳发散。这是用生物燃料(例如本 发明的燃料)替代石油燃料的另一个环境优点。使用本发明的组合物 和/或方法制备的生物燃料可以与汽油混合,以产生E10混合物(约5 %-10%乙醇和约90%-95%汽油),但它可以以更高浓度例如E85或 以其纯化形式使用。使用本发明的组合物和/或方法制备的生物燃料可 以与石油柴油混合,以形成B20混合物(20%生物柴油和80%石油柴 油),尽管也可以使用其他混合水平直至B100(纯生物柴油)。
本发明还提供了用于由包含木质纤维素生物量的组合物制备生物 燃料(包括生物酒精,例如生物乙醇、生物甲醇、生物丁醇或生物丙 醇、或生物柴油)的过程。木质纤维素生物质材料可以得自农业作物, 作为食物或饲料生产的副产品,或作为木质纤维素废品,例如植物残 渣、废纸或建筑和/或拆毁废物或残骸。用于由本发明的多肽处理的合 适植物来源或植物残渣例子包括海藻、藻类、谷物、种子、茎、叶、 外壳、外皮、玉米穗轴、玉米秸秆、麦秆、草(例如印度草,例如印 第安草(Sorghastrum nutans);或柳枝稷,例如黍属物种,例如柳 枝稷)等,以及木材、木片、木浆和锯屑。适合于用本发明的多肽处 理的废纸例子包括丢弃的复印纸、计算机打印纸、笔记本纸、便签纸、 打字机纸等,以及报纸、杂志、卡纸板和基于纸的包装材料。建筑和 拆毁废物和残骸例子包括木材、木材边角料、木屑和锯屑。
在一个实施方案中,本发明的酶包括酶混合物或“混合剂”和本 发明的方法可以与由生物量制备乙醇、甲醇、丙醇、丁醇、丙醇和/ 或柴油的更“一般的”方法结合使用,例如作为包括通过在反应器中 对干木质纤维素材料实施催化剂而使木质纤维素材料水解的方法,所 述催化剂包含强酸和金属盐的稀释溶液;这可以降低纤维素水解的活 化能或温度,以获得更高的糖得率;参见例如,美国专利号6,660,506 和6,423,145。
合并本发明的酶(包括本发明的酶混合物或“混合剂”)的使用 的另一种示例性方法,包括通过在所选择的温度和压力下在水介质中 对材料实施第一个阶段水解步骤,水解可以通过本发明的酶水解的木 质纤维素材料,包含半纤维素、纤维素和木质素,或任何其他多糖, 以初步实现半纤维素解聚而不是纤维素主要解聚成葡萄糖。这个步骤 导致其中液体水相包含起因于半纤维素解聚的溶解单糖的浆,以及包 含纤维素和木质素的固相。第二个阶段水解步骤可以包括这样的条件, 使得纤维素的至少主要部分解聚,此种步骤导致包含纤维素的溶解/ 可溶的解聚产物的液体水相。参见例如,美国专利号5,536,325。本 发明的酶(包括本发明的酶混合物或“混合剂”)可以在这个示例性 过程的任何阶段时加入。
合并本发明的酶(包括本发明的酶混合物或“混合剂”)的另一 种示例性方法,包括通过用约0.4%-2%强酸的一个或多个稀释酸水 解阶段加工含木质纤维素生物质材料;和通过碱性脱木质化处理酸水 解生物质材料的未反应固体木质纤维素组分,以产生用于生物可降解 热塑性塑料和衍生物的前体。参见例如,美国专利号6,409,841。本 发明的酶可以在这个示例性过程的任何阶段时加入。
合并本发明的酶(包括本发明的酶混合物或“混合剂”)的使用 的另一种示例性方法,包括在预水解反应器中使木质纤维素材料预水 解;将酸性液体加入固体木质纤维素材料中以制备混合物;使混合物 加热至反应温度;使反应温度维持足以使木质纤维素材料分馏成溶解 部分和固体级分的时间,所述溶解部分包含来自木质纤维素材料的至 少约20%的木质素,所述固体级分包含纤维素;在反应温度或接近反 应温度时,去除固体级分中的溶解部分,其中使得固体级分中的纤维 素更顺应酶促消化;和回收溶解部分。参见例如,美国专利号 5,705,369。本发明的酶可以在这个示例性过程的任何阶段时加入。
本发明提供了用于制备基于液态烃的发动机燃料组合物(例如, 用于火花点火发动机)的方法,所述液态烃与通过使用本发明的酶或 方法制备的燃料等级酒精混合。在一个方面,通过使用本发明的酶制 备的燃料包含例如煤气液或天然气液-乙醇混合物。在一个方面,共溶 剂是生物量衍生的2-甲基四氢呋喃(MTHF)。参见例如,美国专利号 6,712,866。
在一个方面,本发明的用于木质纤维素的酶促降解,例如用于由 木质纤维素材料生产生物燃料(包括生物酒精,例如生物乙醇、生物 甲醇、生物丁醇或生物丙醇、或生物柴油)的方法,也可以包括使用 生物质材料的超声波处理;参见例如,美国专利号6,333,181。
在另一个方面,本发明的用于由纤维素底物生产生物燃料(包括 生物酒精,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇、或生物 柴油)的方法,包括提供以浆形式的反应化合物,所述浆包含纤维素 底物、本发明的酶和发酵试剂(例如,在反应容器内,例如半连续固 体进料生物反应器),和反应混合物在足以起始和维持发酵反应的条 件下进行反应(如例如美国专利申请号20060014260中描述的)。在 一个方面,实验或理论计算可以确定最佳进料频率。在一个方面,另 外的纤维素底物和酶量可以以根据优化进料频率的间隔提供到反应容 器内。
用于制备本发明的生物燃料(包括生物酒精,例如生物乙醇、生 物甲醇、生物丁醇或生物丙醇、或生物柴油)的一个示例性过程在美 国专利申请公开号20050069998;20020164730中描述;并且在一个方 面,包括下述阶段:磨碎木质纤维素生物量(例如,至15-30mm的大 小),在反应器中对获得的产物实施蒸汽爆炸预处理(例如,在190-230 ℃的温度下)1-10分钟;在旋流器或相关制造产品中收集预处理材料; 和通过在压滤器中过滤使液体和固体级分分开,将固体级分引入发酵 沉淀中且加入本发明的一种或多种酶,例如淀粉酶、葡糖淀粉酶和/ 或葡糖苷酶(例如在柠檬酸盐缓冲剂pH 4.8中溶解)。
使用本发明的酶用于制备本发明的生物燃料(包括生物酒精,例 如生物乙醇、生物甲醇、生物丁醇或生物丙醇、或生物柴油)包含生 物乙醇、生物甲醇、生物丁醇或生物丙醇的另一个示例性过程,包括 预处理包含木质纤维素原料的原材料,所述木质纤维素原料包含至少 半纤维素和纤维素。在一个方面,原材料包含马铃薯、大豆(油菜籽)、 大麦、黑麦、玉米、燕麦、小麦、甜菜根或甘蔗或组分或废物或食物 或饲料生产副产品。原材料(“原料”)在破坏植物的纤维结构的条 件下进行反应,以实现半纤维素和纤维素的至少部分水解。破坏条件 可以包括例如对原材料实施在pH 0.5-2.5下180℃-270℃的平均温度 约5秒-60分钟;或在pH 0.5-2.5下220℃-270℃的温度5秒-120秒 或等价条件。这产生具有增加的被酶消化的易接近性的原料,所述酶 例如本发明的纤维素酶。美国专利号6,090,595。
关于在木质纤维素材料的水解中使用本发明的酶的示例性条件包 括在约30℃-48℃和/或pH约4.0-6.0下的反应。其他示例性条件包 括约30℃-60℃和pH约4.0-8.0。
本发明的淀粉酶和/或葡糖淀粉酶可以在生物量至燃料的转变中, 以及在醇生产中使用,例如如PCT申请号WO0043496和WO8100857中 描述的。本发明的淀粉酶和/或葡糖淀粉酶可以用于生产含可发酵糖和 葡聚糖的生物量,其可以转变成燃料酒精。
药物组合物、消毒剂和饮食补充剂
本发明还提供了包含本发明的酶(例如,具有淀粉酶、葡糖淀粉 酶或葡糖苷酶活性的酶)的药物组合物、消毒剂和饮食补充剂(例如, 饮食助剂)。在一个方面,药物组合物和饮食补充剂(例如,饮食助 剂)配制用于口部摄入,例如以改善具有高淀粉、纤维素或木质纤维 素组分的食物和饲料的可消化性。
牙周治疗化合物可以包含本发明的酶,例如如美国专利号 6,776,979中描述的。用于治疗或预防酸性肠综合征的组合物和方法 可以包含本发明的酶,例如如美国专利号6,468,964中描述的。
在一个方面,创伤敷料、埋植剂等包含抗微生物(例如,抗生素 作用)酶,包括本发明的酶。本发明的酶也可以用于海藻酸盐敷料、 抗微生物屏障敷料、烧伤敷料、压力绷带、诊断工具、凝胶敷料、水 选择性敷料、水解纤维素(泡沫)敷料、水胶体敷料、I.V敷料、切 口保护膜、低粘附敷料、气味吸收敷料、石膏绷带、手术后敷料、疤 痕处理、皮肤护理、透明膜敷料和/或创伤闭合。本发明的酶可以用于 创伤清洁、创面床准备中,以治疗压力性溃疡、小腿溃疡、烧伤、糖 尿病足溃疡、疤痕、IV固定、外科伤口和小伤口。本发明的酶可以用 于无菌酶促清创组合物例如软膏中。在各个方面,纤维素酶配制为片 剂、凝胶、丸剂、埋植剂、液体、喷雾剂、粉剂、食物、饲料丸剂或 配制为胶囊化制剂。
生物防卫应用
在其他方面,本发明的酶例如淀粉酶、葡糖淀粉酶或葡糖苷酶可 以用于生物防卫中,例如破坏孢子或细菌。本发明的酶在生物防卫应 用中的用途提供了显著利益,因为它们可以针对任何目前未知或未来 的生物战剂非常快速地发展。此外,本发明的酶可以用于净化受影响 的环境。在方面,本发明提供了包含本发明的多肽的生物防卫或生物 解毒剂,所述本发明的多肽具有淀粉酶、葡糖淀粉酶或葡糖苷酶活性。
本发明将参考下述实施例进行进一步描述;然而,应当理解本发 明并不限于此种实施例。
实施例
实施例1:热稳定α-淀粉酶的鉴定和表征
下述实施例描述了用于测定多肽是否在本发明的范围内的示例性 方法。筛选程序可以在中性和低pH条件下进行。DNA序列和生物信息 分析可以分类淀粉酶。
生物化学研究
淀粉酶基因组克隆的生物化学分析可以用于测定任何一种酶是否 具有小于pH 6的pH最适条件。这些基因组克隆的裂解产物可以就热 耐受性进行测试,通过在70℃、80℃、90℃或100℃下温育10分钟和 在pH 4.5下测量残留活性。选择在80℃下热处理后保留>50%活性的 那些克隆用于进一步分析。这些克隆可以在pH 6.0和4.5下于90℃ 温育10分钟,且就在pH 4.5下的残留活性进行测试。在pH 4.5下于 90℃热处理后具有残留活性的克隆的热活性可以在室温、70℃和90℃ 下在pH 4.5下进行测量。
在一个方面,淀粉降解酶就对于粗淀粉和‘抗性’淀粉的活性进 行筛选,用于任何形式的水解酶活性,包括淀粉酶、支链淀粉酶、环 糊精葡萄糖基转移酶、葡糖淀粉酶其他任何其他葡糖苷酶活性。在一 个方面,经鉴定的活性酶例如通过对于分支糖和/或较长寡糖的比活性 和特异性进行表征。
在一个方面,真菌分离物就新酶进行研究,使用本发明的探针和/ 或开发过程,例如筛选由动物、微生物或昆虫制备的gDNA和/或cDNA 文库,例如攻击且消耗贮存谷物的昆虫的肠内容物,包括就表达不足 的酶筛选环境文库。可以评估酶的组合。
在一个方面,执行稳定性测试:例如,在测试时,与新鲜酶的活 性比较,在其自身贮存缓冲液中的纯化酶;例如在较低温度下,例如 在约4℃至-20℃至-80℃贮存的20ul等分试样;并且在一个方面, 活性每月在颗粒状和可溶性淀粉中进行再测试。
淀粉酶可以在各种条件下进行评估。在下述方案中,No2黄色马齿 型玉米可以用作淀粉来源。
示例性液化测定
在95℃-119℃(例如,在约110℃下)范围中的各个温度下,对 包含35%干物质(“DS”)的淀粉浆实施5分钟初级液化,其中具有 0.2-0.8克/千克(g/kg)淀粉DS的酶浓度,具有在0-30百万分之一 (ppm)范围中的添加钙,在pH 4.0-pH 5.6下。次级液化包含在95 ℃下120分钟的条件。
示例性糖化测定
糖化使用35%干物质(“DS”)(淀粉浆)和葡糖淀粉酶AMG 300L (Novozymes A/S,Denmark)在0.225AGU/克DS(AGU=淀粉葡糖苷 酶、或葡糖淀粉酶单位),pH 4.3下于60℃最初测试44小时。
在一个方面,本发明的示例性淀粉酶和/或葡糖淀粉酶以0.5-0.7 kg/MT DS淀粉的剂量范围使用。
本发明提供了使用本发明的酶用于制备营养性甜味剂的方法,例 如包含使用本发明的淀粉酶和/或葡糖淀粉酶的上述液化和糖化方案 的过程。在一个方面,在这些过程中关于本发明的酶的剂量范围是约 0.5-0.7克/kg淀粉DS,约110℃的喷射温度(例如,使用喷射式蒸煮 锅),pH 4.5,不添加钙。
干研磨醇生产
本发明提供了使用本发明酶用于干研磨醇生产的方法。在评估本 发明的酶用于在干研磨醇生产中使用中,特别地,干研磨玉米粉的液 化,工作台规模反应器可以与源自商业干研磨的玉米粉一起使用。 TERMAMYLTM SC(Novozymes A/S,Denmark)淀粉酶可以用作竞争 基准。在可替代方面,最佳条件是85℃,pH 5.7。可以研究5个独立 变量:温度(在80℃-100℃范围中),0.2-1.0g/kg淀粉的酶剂量, pH 4.4-6.0,0ppm-200ppm范围中的钙,和约0%-40%的再循环逆 流。
在95℃下,在某些实施方案中,在其最佳条件下,包括在85℃下, 本发明的淀粉酶和/或葡糖淀粉酶可以比TERMAMYL SC(Novozymes A/S,Denmark)淀粉酶更快速地减少干研磨玉米粉的粘度。通过淀粉 酶的粘度减少率可以最主要受酶剂量和温度影响。可替代的最佳范围 可以在0.4-0.6g/kg淀粉范围中,具有在95℃下的最佳温度。
在某些实施方案中,本发明的淀粉酶和/或葡糖淀粉酶可以在比 TERMAMYLTM SC(Novozymes A/S,Denmark)淀粉酶更低的pH和更 高的温度下有效,在pH 4.4-pH 5.6范围中的pH下。钙添加可以在 95℃下对于粘度减少率具有最低限度影响。
如下所述,在37℃下温育1周后,纯化酶的活性在不同贮存缓冲 液中进行比较。选择与在+4℃下放置的相同酶的活性比较,具有最少 的活性丧失的缓冲液作为选择的贮存缓冲液。就淀粉酶活性测试的示 例性测定条件,例如以测定本发明的多肽在特定条件下是否保留活性, 包括(MPB:对羟基苯甲酸甲酯):
·在37℃下在PBS,pH 7.2中的20%葡萄糖、0.1%MPB
·在37℃下在乙酸盐缓冲液,pH 5中的20%葡萄糖、0.1% MPB
·在37℃下在PBS,pH 7.2中的20%蔗糖、0.1%MPB
·在37℃下在乙酸盐缓冲液,pH 5中的20%蔗糖、0.1%MPB
·在37℃下在PBS,pH 7.2中的0.1%MPB
·在37℃下在乙酸盐缓冲液,pH 5中的0.1%MPB
·在37℃下PBS,pH 7.2
·在37℃下乙酸盐缓冲液,pH 5
·在4℃下在PBS中,pH 7.2的20%葡萄糖、0.1%MPB
·在4℃下在乙酸盐缓冲液,pH 5中的20%葡萄糖、0.1%MPB
·在4℃下在PBS,pH 7.2中的20%蔗糖、0.1%MPB
·在4℃下在乙酸盐缓冲液,pH 5中的20%蔗糖、0.1%MPB
·在PBS中的20%麦芽糖(50mM磷酸钠pH7.5;100mM NaCl)
·在4℃下在PBS,pH 7.2中的0.1%MPB
·在4℃下在乙酸盐缓冲液,pH 5中的0.1%MPB
·在4℃下PBS,pH 7.2
·在4℃下乙酸盐缓冲液,pH 5
已在这些示例性测定条件下测试的本发明的示例性酶包括:SEQ ID NO:26;SEQ ID NO:18;SEQ ID NO:4;SEQ ID NO:28;SEQ ID NO:48;SEQ ID NO:76;SEQ ID NO:52;SEQ ID NO:70;SEQ ID NO: 66。对于SEQ ID NO:26和SEQ ID NO:4,选择在具有0.1%对羟基 苯甲酸甲酯的1X PBS,pH 7中的20%蔗糖(SMP*),并且对于SEQ ID NO:18,选择在具有150mM氯化钠和0.1%对羟基苯甲酸甲酯(SMA**) 的50mM乙酸钠中的20%蔗糖。图13举例说明示例性酶SEQ ID NO: 70在不同贮存缓冲液(如图中所示)中的起始速率比较(使用Vmax); 0.15ug总蛋白质/反应;图14举例说明示例性酶SEQ ID NO:76在 不同贮存缓冲液(如图中所示)中的起始速率比较(使用Vmax);0.5 ug总蛋白质/反应;图15举例说明示例性酶SEQ ID NO:4在不同贮 存缓冲液(如图中所示)中的起始速率比较(使用Vmax);图16举 例说明示例性酶SEQ ID NO:66在不同贮存缓冲液(如图中所示)中 的起始速率比较(使用Vmax);0.03ug总蛋白质/反应;图17举例 说明示例性酶SEQ ID NO:52在不同贮存缓冲液(如图中所示)中的 起始速率比较(使用Vmax);0.025ug总蛋白质/反应;图18举例说 明示例性酶SEQ ID NO:28在不同贮存缓冲液(如图中所示)中的起 始速率比较(使用nmol葡萄糖/分钟/ug酶);图19举例说明示例性 酶SEQ ID NO:26在不同贮存缓冲液(如图中所示)中的起始速率比 较(使用nmol葡萄糖/分钟/ug酶);图20举例说明示例性酶SEQ ID NO:18在不同贮存缓冲液(如图中所示)中的起始速率比较(使用nmol 葡萄糖/分钟/ug酶)。
Bradford和BCA测定以及SDS PAGE和在A280处的吸光度用于测 定纯化蛋白质的浓度。标准化淀粉酶溶液(Sigma A6211)和BSA在这 些测定中用作参考。通过BCA和A280的浓度是相似的,但通过 Bradford使用BSA作为标准则不同。
在这些测定中,蛋白质(酶)通过沉淀;疏水性相互作用;尺寸 排阻;离子交换;亲和力进行纯化;并且在一个示例性方案中,蛋白 质(酶)通过沉淀、疏水性相互作用、离子交换和作为最后一个步骤 的亲和力(层析)进行纯化。
示例性SEQ ID NO:18、SEQ ID NO:4和SEQ ID NO:26通过硫 酸铵(SEQ ID NO:26)或乙醇沉淀(SEQ ID NO:18和SEQ ID NO: 4)进行纯化。来自表达目的酶的培养物的冻干上清液以约1g/5ml 的浓度重悬于水中。SEQ ID NO:18和SEQ ID NO:4通过添加冷乙醇 (2体积的蛋白质溶液)进行沉淀。SEQ ID NO:26在80%硫酸铵溶 液中进行沉淀。在沉淀后,蛋白质悬浮液针对水随后针对贮存缓冲液 透析一次。
本发明的纯化示例性酶的稳定性在PBS在pH 7下或PBS pH 7.5 中(在这种情况下,参数是50mM磷酸钠;100mM NaCl)或在具有加 入的150mM NaCl的50mM乙酸钠pH 5.2中进行测试。将葡萄糖(20 %)或蔗糖(20%)以及抗微生物剂0.1%对羟基苯甲酸甲酯(Sigma) 加入缓冲液中。酶在其分别的缓冲液中于37℃温育1周,并且测试酶 活性且与在+4℃下贮存的相同酶的活性进行比较。
每种纯化的酶的浓度使用4种不同方法进行估计:使用淀粉酶 Sigma A-6211作为标准的Bradford测定,使用Sigma A-6211作为标 准的BCA测定,在8M尿素中在280nm处的吸光度,和染色蛋白质在 SDS PAGE后的光密度测量,使用Sigma A-6211淀粉酶作为参考。对 于每种纯化蛋白质用这些不同方法获得的数值呈现于表3.1中。对于 最后定量,使用通过在8M尿素中测量在280nm处的吸光度获得的浓度。 关于这些测定的大规模纯化的概括是:



通过不同方法估计的酶浓度
  Bradford   BCA(A6211)   吸光度(尿素)   SEQ ID NO:18   71.10   57.64   53.94   SEQ ID NO:26   43.98   57.64   39.29   SEQ ID NO:4   69.20   57.64   70.01
实施例2:在碱性pH下的热稳定淀粉酶活性
下述实施例描述了用于测定多肽是否在本发明的范围内,例如是 否是热稳定淀粉酶的示例性方法。
商业自动化洗碗(ADW)制剂可以用于测定多肽是否在本发明的范 围内,例如是否是热稳定淀粉酶。研究可以包括高pH淀粉酶的鉴定; 和具有降解淀粉的能力的酶。DNA序列和生物信息学分析可以将这些 基因中的许多分类为淀粉酶,或具有其他酶特异性,例如新支链淀粉 酶、淀粉支链淀粉酶(amylopullulanases)和淀粉麦芽糖酶。
生物化学研究
用于测定多肽是否在本发明的范围内,例如是否是热稳定淀粉酶 的一种示例性方法,是就其中酶可以在碱性pH例如高达pH 10和约 50℃下水解淀粉的活性测试。
使可溶性蛋白质纯化至同质性,并且比活性(单位/mg,其中1 单位=μmol还原糖/分钟)在pH 8和pH 10(40℃和50℃)下进行 测量,使用在缓冲液中的2%淀粉。比活性可以通过在30分钟反应过 程中的各个时间点时取出样品且就还原糖分析进行测定。起始速率可 以通过使发展曲线(或称“过程曲线”)与线性方程式拟合进行测定。
稳定性研究
在ADW制剂的存在下的稳定性可以通过生物化学分析进行测量。 关于这些研究的基准可以是制剂基质中的商业酶。在温育后测量的活 性可以表示为原始活性的百分比。
洗涤测试
可以执行使用淀粉包被载玻片的洗涤测试,以与商业酶比较估量 本发明的每种纯化酶的性能。可以根据下述方案制备通心管 (Spaghetti)淀粉包被载玻片:将2个称重前的淀粉包被载玻片背靠 背放置在50mL圆锥管和25mL ADW溶液中,每管加入+/-酶。管在 50℃下温育20分钟,伴随在垂直传送带上的轻轻旋转。温育期后,使 载玻片紧接着在水中进行漂洗且过夜烘干。所有试验一式两份地进行, 并且商业酶作为阳性对照运行。结果可以表示为去除的净淀粉%,例 如在ADW中由酶去除的淀粉%,减去在单独的ADW中去除的淀粉%。
实施例3:基因优化
下述实施例描述了用于测定多肽是否在本发明的范围内,例如评 估在ADW性能的存在下的酶性能的示例性方法。
酶的性质可以通过各种进化策略得到改善,包括Gene Site Saturation MutagenesisTM(GSSMTM)和GeneReassemblyTM技术(Diversa Corporation,San Diego,CA)。此种技术将应用于本发明的淀粉酶 核酸,以便产生可以就改良性能筛选的变体库。在一个方面,用于进 化的亲本分子包括本发明的任何核酸,例如编码SEQ ID NO:2;SEQ ID NO:4;SEQ ID NO:6等的序列。
高流通量筛选(HTS)可以用于评估在ADW性能的存在下的酶性能。 HTS可以自动化且已显示关于亲本淀粉酶的一致结果。
实施例4:在碱性pH下具有活性的α-淀粉酶的表征
下述实施例描述了用于测定多肽是否在本发明的范围内,例如在 碱性pH下具有α-淀粉酶活性的示例性方法。
在碱性pH下具有活性的本发明的淀粉酶和/或葡糖淀粉酶可以使 用在pH 8和10下(40℃和50℃)对于2%淀粉的动力学进行表征。1 单位活性可以定义为释放1μmol还原糖/分钟。
实施例5:淀粉酶活性测定:BCA还原末端测定
下述实施例描述了例如通过BCA还原末端测定用于测定多肽是否 在本发明的范围内的示例性方法。目的克隆的淀粉酶活性可以使用下 述方法进行测定。
1.如下制备2种底物溶液:
a)通过在100ml 100mM磷酸钠pH 8中溶解2克马铃薯淀粉 的2%可溶性淀粉(马铃薯或颗粒状玉米淀粉)pH 8溶液
b)通过在100ml 100mM碳酸钠中溶解2克马铃薯淀粉的2% 可溶性淀粉(马铃薯)pH 10溶液。
在混合的同时使2种溶液在沸水浴中加热30-40分钟,直至淀粉 溶解。
2.由64mg/ml一水碳酸钠、24mg/ml碳酸氢钠和1.95mg/ml BCA(4,4’-二羧基-2,2’-联喹啉二钠盐(Sigma Chemical目录#D-8284) 制备溶液A。将上述加入dH2O中。
3.通过使1.24mg/ml硫酸铜五水合物和1.26mg/ml L-丝氨酸 组合制备溶液B。将混合物加入dH2O中。
4.制备溶液A和B的1∶1定量的工作试剂。
5.制备10mM麦芽糖在dH2O中的麦芽糖标准溶液,其中10mM 麦芽糖在所需pH下在2%可溶性淀粉中组合至终浓度0、100、200、 300、400、600μM。将对于每组时间点产生标准曲线。因为曲线通过 将10u l标准加入工作试剂中进行测定,所以它被算出是0、1、2、3、 4、6nmole麦芽糖。
6.将1ml底物溶液等分到微量离心管内,在加热块或加热水浴 中平衡至所需温度(5分钟)。将50ul酶溶液加入管盖的内部。
7.当溶液在平衡时,使5ml溶液A和B混合。将100ul等分 至96孔PCR平板。将平板置于冰上。
8.5分钟温度平衡后,关闭管上的盖子,倒置且涡旋3次。当 t=0(零时间点)时,紧接着将10ul等分到平板内。使酶混合物留在 加热块中,并且在每个所需时间点时(例如,0、5、10、15、20、30 分钟)等分10ul。
9.确保使12个孔留空(仅等分工作试剂)用于添加10ul标 准,用于标准曲线。
10.当收集所有时间点且加入标准时,盖上平板且加热至80℃ 35分钟。使平板在冰上冷却10分钟。将100ul H2O加入所有孔内。 混合且将100ul等分到平底96孔平板内,并且阅读在560nm处的吸 光度。
11.每个样品的时间点针对其自身t=0调整归零(从其他A560 平均值中扣除平均t=0A560值)。将A560(实验)转变成umole(将A560 (实验)除以标准曲线的斜率(A560/umole)。产生时间点和umole的斜 率(以umole/分钟表示),乘以100(因为umole值仅占测定中使用 的10ul,而不是在1ml rxn中制备的量)。为了获得比活性,将斜 率(以umole/分钟表示)除以mg蛋白质。所有点应以最低限度一式 两份来完成,其中3是最佳的。
将蛋白质浓度(mg/ml)除以任何稀释度,以获得在测定中使用的 mg。
将上述斜率除以在测定中使用的mg,以获得比活性。
比活性=24.93umole/分钟/mg
参见例如,Dominic W.S.Wong,Sarah B.Batt和George H. Robertson(2000)J.Agric.Food Chem.48:4540-4543;Jeffrey D.Fox和John F.Robyt,(1991)Anal.Biochem.195,93-96。
实施例6:筛选α-淀粉酶活性
下述实施例描述了用于测定多肽是否在本发明的范围内的示例性 方法。克隆的淀粉酶活性可以通过本领域已知的许多方法进行评估。 下述是示例性方法。每块平板筛选的噬斑数目可以是约10,000pfu’ s。对于每个DNA文库:应筛选至少50,000个噬斑/分离文库和200,000 个噬斑/未分离文库,依赖关于λZap Express扩增的裂解产物的pfu 滴度。
λ文库的滴度测定
1)将μL Lambda Zap Express扩增的文库原种加入600μL大 肠杆菌MRF细胞(OD600=1.0)中。为了稀释MRF的原种,使用10mM MgSO4。
2)在37℃下温育15分钟。
3)在50℃下将悬浮液转移至5-6mL NZY顶层琼脂且轻轻混合。
4)紧接着将琼脂溶液倾到大(150mm)NZY培养平板上。
5)允许顶层琼脂完全固化(约30分钟),随后使平板倒置。
6)使平板在39℃下温育8-12小时。
7)估计噬斑数目。测定噬菌体滴度以给出10,000pfu/平板。 需要时,用SM缓冲液稀释文库噬菌体的等分试样。
底物筛选
1)将来自扩增文库的Lambda Zap Express(50,000pfu)加入 600μL大肠杆菌MRF细胞(OD600=1.0)中。对于非环境文库,制备4 个管(50,000pfu/管)。
2)在37℃下温育15分钟。
3)当噬菌体/细胞悬浮液在温育时,在50℃下将1.0mL红色淀 粉底物(1.2%w/v)加入6.0mL NZY顶层琼脂中,并且充分混合。使 溶液放置于50℃直至需要时。
4)将1/5(10,000pfu)细胞悬浮液转移至底物/顶层琼脂溶液, 且轻轻混合。
5)紧接着将溶液倾到大(150mm)NZY培养平板上。
6)允许顶层琼脂完全固化(约30分钟),随后使平板倒置。
7)对于其余细胞悬浮液将操作4-6重复4次(每次1/5悬浮液)。
8)使平板在39℃下温育8-12小时。
9)就噬斑周围的亮区(晕圈)观察平板。
10)从琼脂中取出具有晕圈的噬斑的核心,且转移至无菌微型管。 大孔径200μL吸管端良好工作,以取出(取出核心)包含所需噬斑的 琼脂塞。
11)使噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑 制任何进一步的细胞生长。
12)在下一个步骤前,纯噬菌体悬浮液在室温下温育4小时或过 夜。
纯克隆的分离
1)将10μL重悬的噬菌体悬浮液加入500μL大肠杆菌MRF细胞 (OD600=1.0)中。
2)在37℃下温育15分钟。
3)当噬菌体/细胞悬浮液在温育时,在50℃下将1mL红色淀粉 底物(1.2%w/v)加入6.0mL NZY顶层琼脂中,并且充分混合。使溶 液放置于50℃直至需要时。
4)将细胞悬浮液转移至底物/顶层琼脂溶液,且轻轻混合。
5)紧接着将溶液倾到大(150mm)NZY培养平板上。
6)允许顶层琼脂完全固化(约30分钟),随后使平板倒置。
7)使平板在39℃下温育8-12小时。
8)就单个噬斑(纯克隆)周围的亮区(晕圈)观察平板。如果 不能分离单个噬斑,那么调整滴度且使噬菌体悬浮液重新铺平板。
9)从琼脂中取出具有晕圈的单个噬斑的核心,且转移至无菌微 型管。大孔径200μL吸管端良好工作,以取出(取出核心)包含所需 噬斑的琼脂塞。为了扩增滴度,取出5个单个活性噬斑的核心置入微 型管内。
10)使噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑 制任何进一步的细胞生长。
11)在下一个步骤前,纯噬菌体悬浮液在室温下温育4小时或过 夜。通过将DMSO加入噬菌体悬浮液内(7%v/v)将纯噬菌体悬浮液贮 存于-80℃。
纯克隆的切除
1)将100μL纯噬菌体悬浮液加入200μL大肠杆菌MRF细胞 (OD600=1.0)中。向其中加入1.0μL EXASSIST辅助噬菌体(>1×106 pfu/mL;Stratagene)。使用2059 Falcon管用于切除。
2)使悬浮液在37℃下温育15分钟。
3)将3.0mL 2xYT培养基加入细胞悬浮液中。
4)在振荡的同时,在30℃下温育至少6小时或过夜。
5)将管转移至70℃20分钟。噬菌粒悬浮液可以贮存于4℃1-2 个月。
6)将100μL噬菌粒悬浮液转移至包含200μL大肠杆菌Exp 505 细胞(OD600=1.0)的微型管。
7)使悬浮液在37℃下温育15分钟。
8)将300μL SOB加入悬浮液中。
9)使悬浮液在37℃下温育30-45分钟。
10)对于Zap Express DNA文库,将100μL悬浮液转移至包含 卡那霉素的小(90mm)LB培养平板(具有卡那霉素50μg/mL的LB培 养基),或对于Zap II DNA文库,包含氨苄青霉素的小(90mm)LB 培养平板(具有卡那霉素100μg/mL的LB培养基)。
11)将其余悬浮液转移至另一个小LB培养基平板。
12)使用无菌玻璃珠以使悬浮液平均分布在平板上。
13)使平板在30℃下温育12-24小时。
14)就菌落观察平板。
15)将单个菌落接种到包含合适抗生素的LB液体培养基内,且在 30℃下温育12-24小时。
16)通过将80%甘油加入液体培养基中(15%v/v)可以制备甘 油母液,且贮存于-80℃。
活性验证
1)将50μL液体培养基转移至微型管。将500μL 8%pH 7支链 淀粉Azure加入同一管内。对于每个克隆制备2个管。
2)活性在50℃下测试3小时和过夜。使用pH 7缓冲液作为对 照。
3)使测试样品在冰水浴中冷却5分钟。
4)加入750μL乙醇且充分混合。
5)在13000rpm(16000g’s)下离心5分钟。
6)测量悬浮液在595nm下的OD。
RFLP分析
1)将1.0mL液体培养基转移至无菌微型管。
2)在13200rpm(16000g’s)下离心1分钟。
3)弃去上清液。将另外1.0mL液体培养基转移到同一无菌微型 管内。
4)在13200rpm(16000g’s)下离心1分钟。
5)弃去上清液。
6)遵循QIAPREP旋转微型试剂盒方案用于质粒分离。
7)使用BioPhotometer检查DNA浓度。
8)使用Sac I和Kpn I用于第一次双重消化。在37℃下温育1 小时。
9)使用Pst I和Xho I用于第二次双重消化。在37℃下温育1 小时。
10)将上样染料加入消化样品内。
11)在120伏下使消化样品在1.0%琼脂糖凝胶上电泳1-1.5小 时。
12)用凝胶成像仪观察凝胶。具有不同消化模式的所有克隆可以 进行序列分析。
实施例7:测定淀粉酶
下述实施例描述了用于测定多肽是否在本发明的范围内的示例性 方法。
宿主培养物的制备
1.开始XL1-BLUETM MRF宿主细胞的过夜培养。使用来自划线 平板的单个菌落,以接种补充有20ug/mL四环素的10mL LB。在37 ℃下振荡使过夜培养物生长至少16小时。
2.使用无菌技术,用来自过夜LBTet培养物的XL1-BLUETM  MRF 宿主接种新鲜的100mL LBTet白天培养物。
3.在37℃摇床中生长直至OD达到0.75-1.0。
4.使宿主细胞在1000xg下10分钟形成团块,且在OD5时轻 轻重悬于10mM MgSO4中。
5.使少量宿主细胞稀释至OD1用于在滴定和pintooling中使 用。
6.当贮存于冰上或4℃时,宿主制剂可以使用高达1周。
-为了缩短关于白天培养物的生长时间,使用1/2X在LB中的通 常Tet浓度(1/2X=10ug/mL),或完全省略抗生素。
-当用四环素选择时,不使用NZY。在NZY培养基中的高Mg++浓度 使得Tet无活性。
滴定λ文库
7.将3个无菌微型管放置在支架中。
8.将995uL制备的宿主细胞等分到一个管中,和45uL制备的 OD1宿主细胞等分在2个其余管的每一个内。
9.将5uLλ文库加入包含995uL宿主细胞的管中,且通过涡 旋混合。这导致200的稀释因子。
10.通过将5uL先前稀释物连续加入包含45uL制备的宿主细胞 的其余2个管中,制备1/2,000和1/20,000稀释度。在制备每个稀释 度后,通过涡旋混合。
11.通过在37℃下温育15分钟允许噬菌体与宿主吸附。
12.同时,将100uL制备的OD1宿主细胞吸取到3个Falcon 2059 管的每一个中。
13.将5uL每种稀释物加入包含宿主细胞的分开2059管中。
14.各自通过将3mL顶层琼脂加入每个管中且快速倾倒在90mm NZY平板上铺平板。在顶层琼脂变硬前确保平滑的平均分布。
15.使平板倒置且在37℃温育过夜。
16.计数噬斑且计算文库原种的滴度(以噬斑形成单位(pfu)/uL 表示)。
用于淀粉酶的λ微量滴定筛选
准备
1.对于计划筛选的量,如上所述制备足够量的XL1-Blue MRF宿 主培养物。100mL培养物通常足以筛选2-3个文库。
2.使与QFi112分配器相容的几个瓶高压灭菌。这些是在盖周围 Corning(包含密封圈的)广口Corning瓶,250mL。
3.确保存在可用于筛选的足够量平板、顶层琼脂、BODIPY淀粉、 红色淀粉溶液等。
4.用来自自动化的代表安排第2天的机器人运行。
第1天
1.用文库筛选和平板编号标记1536孔平板(黑色)。横向对半 切开的Tough-TagsTM 管贴纸对于标记1536孔平板是理想的。
2.计算对于筛选所需的文库、宿主细胞和NZY培养基体积。这 用Excel电子表格容易地完成。
3.使计算体积的λ文库和OD5宿主细胞在无菌250mL广口 Corning瓶(包含密封圈)中组合。
4.允许吸附在37℃下发生15分钟。
5.加入计算体积的NZY培养基且充分混合。这称为细胞-噬菌体 -培养基悬浮液。
6.通过使50uL细胞-噬菌体-培养基悬浮液与250uL OD1宿主 细胞在Falcon 2059管中组合执行伴随滴定,随后用9mL顶层琼脂铺 平板在150mm NZY平板上。使伴随滴定平板在37℃下温育过夜。
7.使分配器装载悬浮液的其余部分,且以4uL/孔排列每个标记 的1536孔平板。如果分配器在某些孔中留下气泡,那么它们可以通过 使平板在200xg下离心1分钟来去除。
8.将0.5uL阳性对照噬菌体加入测定平板的至少2个的孔位置 AD46中。使用强淀粉酶阳性λ克隆用于这个目的。
9.使测定平板在增湿(≥95%)培养箱中在37℃下温育过夜。
第2天
1.计数在伴随滴定平板上的pfu且测定平均种子密度/孔(以 pfu/孔表示)。
2.如下Pintool每次文库筛选的至少2块平板(优选包含阳性 对照的2块):
a)制备2块宿主菌苔平板以充当在其上pintool的表面:使250 uL OD1宿主细胞与2mL 2%红色淀粉组合,且用9mL顶层琼脂铺平 板在150mm NZY平板上。使每块平板加热至顶层琼脂尽可能固化的水 平,以便产生经过平板的均匀红色色泽。
b)使用2次火焰灭菌的1536阳性pintool,将至少2块筛选平 板复制到宿主菌苔平板上。
c)将pintooled的接受平板放置在层流通风橱中,伴随盖打开 约15-30分钟(以排出过量湿气)。
d)将盖复位且在37℃下倒置温育过夜。
3.如下制备2X BODIPY淀粉底物缓冲液:
a)计算对于以4uL/孔的所有筛选平板所需的2X底物缓冲溶液 总体积(包括由分配器所需的任何额外的无效腔体积),且将这个量 的100mM CAPS pH 10.4分派到适合于所使用的分配器的容器内。
b)回收足够的0.5mg管BODIPY淀粉,以产生以20-30ug/mL 终浓度的所需体积的2X底物溶液[在上文步骤a)中计算的]。
c)在室温下使每个0.5mg管溶解于50uL DMSO中,避光,伴 随频繁涡旋。这花费超过15分钟;BODIPY淀粉的某些生产批次比其 他溶解得更好。
d)将50uL 100mM CAPS缓冲液pH 10.4加入每个管中,且通过 涡旋混合。
e)合并所有管的内容物,且通过在微量离心机中以最高速度离 心1分钟去除任何未溶解的聚集物。
f)将上清液加入在上文a)中分派的其余100mM CAPS缓冲液 中。
g)通过包裹在箔中使2X底物缓冲液避光。
4.将平板和底物缓冲液拿到自动控制室且用下述参数给机器人 编程:
a)分配4uL底物溶液/孔
b)在底物后1小时时第一次读数、在9小时时第二次读数,和 在17小时时第三次读数;在读数之间伴随37℃温育
c)激发滤波器:485nm;发射滤波器:535nm
d)将Spectrafluor增益设为70,或关于制备的2X底物缓冲液 批的最佳增益
e)确保所使用的培养箱将使测定平板避光。
第3天
1.检查pintooled平板中对应于相关测定平板上的孔的所有 位置处细菌菌苔中的清除。还检查任何针位中红色淀粉中的清除。如 果包含阳性对照的平板用于pintooling,那么应能够看见红色背景中 的大亮区。当心也在红色淀粉中形成亮区的污染物(参见实施例7结 束时的注解“在红色淀粉中形成亮区的污染物”)。
2.鉴定来自通过机器人计算机产生的数据文件的假定命中。 由Engineering生产的KANAL程序简化了数据分析。作为经验法则, 假定命中表征为具有升高超过本底至少1.5倍的信号强度的孔。
3.对于每个假定,从孔中取出2uL,并且加入包含500uL SM 缓冲液和50uL CHCl3的管中。涡旋混合且贮存于4℃。这种溶液在 下文将称为4e-3母液。原始筛选平板应贮存于4℃,避光,至少直至 爆发完全。
这是爆发假定命中的示例性方法。它是依赖对于BODIPY淀粉的活 性证实的液相测定。可替代地,假定命中可以在包含红色淀粉的固相 平板上直接铺平板,从而使得就亮区检查2,000-3,000pfu/命中。然 而,无法观察到在红色淀粉上的亮区不一定指示假定命中为假阳性。 随后必须使用其中它最初鉴定的形式进行测定(即,使用BODIPY淀粉 作为底物的液相)。此外,使用下文详细描述的方法更容易鉴定非弱 的阳性。
第1天
1.在无菌50mL锥形管中,使0.5mL OD5宿主细胞与45.5mL NZY组合。这将称为宿主-培养基悬浮液。
2.对于待分析的每个假定命中,将1mL宿主-培养基悬浮液等 分到3个无菌微型管的每一个内。
3.将12-通道自动移液器(pipetman)设为多重分配模式,具 有20uL的等分试样大小和2x的等分试样次数。用干净的无菌尖端组 安装自动移液器。
4.将约1mL宿主-培养基悬浮液倾入新无菌溶液盆内,且装载 多通道自动移液器。
5.将20uL/孔分配到黑色384孔平板的最后一行(行P)内(12 个通道×2=24个孔)。这行将随后用于对照。
6.通过使尖端针对盆表面接触而排出尖端中的其余液体,且按 压在自动移液器上的复位(RESET)按钮。以防止尖端污染的方式将自 动移液器放下。在这个点上不需要更换尖端。
7.将盆中液体的其余部分倾入废物容器(如烧杯)内,小心避 免回溅污染。
8.对于待分析的第一个假定,获取111uL 4e-3母液(参见在 用于淀粉酶的λ微量滴定筛选中的第2天),且将其加入包含1mL 宿主-培养基悬浮液的一组3个管中的第一个中(步骤2)。涡旋混合。 这是稀释度A。
9.获取111uL稀释度A,且加入该组中的下一个管中。涡旋混 合。这是稀释度B。
10.获取111uL稀释度B,且加入该组中的最后一个管中。涡旋 混合。这是稀释度C。现在应具有噬菌体的3个稀释度,其中每个的 浓度相差因子10。
11.将稀释度C(3个样品的最大稀释度)的内容物倾入溶液盆内, 且装载多通道自动移液器。
12.将20uL/孔分配到384孔平板的第一行内(12个通道×2= 24个孔)。
13.通过使尖端针对盆表面接触而排出尖端中的其余液体,且按 压在自动移液器上的复位(RESET)按钮。以防止尖端污染的方式将自 动移液器放下。在这个点上不需要更换尖端。
14.如上所述倒空盆。
15.将稀释度B的内容物倾入同一盆内,且装载多通道自动移液 器。
16.将20uL/孔分配到384孔平板的第二行内。
17.类似地执行步骤13-16,以将稀释度A分配到平板的第三行 内。
18.在所有3个稀释度已排列到平板的前3行内后,将所有尖端 和溶液盆丢弃到生物危险品废物容器内。
19.用干净的无菌尖端组安装自动移液器,且打开新无菌溶液盆。
20.使用平板上的其余行直至行0,对于每个其余假定命中重复 步骤8-19。在384孔平板上可以分析5个假定命中,其中最后一行(行 P)保留用于对照。
21.将0.5uL每种对照加入分开孔内。使用至少2-3种分开对照, 优选包含活性范围。
22.使测定平板在增湿(≥95%)培养箱中在37℃下温育过夜。
第2天
1.使用对于在用于淀粉酶的λ微量滴定筛选中的第2天描述的 相同方法,将所有爆发平板Pintool到具有红色淀粉的宿主菌苔上, 除了使用384位pintool。
2.如下制备2X BODIPY淀粉底物缓冲液:
a)计算对于以20uL/孔的所有爆发平板所需的2X底物缓冲溶 液总体积(包括由分配器所需的任何额外的无效腔体积),且将这个 量的100mM CAPS pH 10.4分派到适合于所使用的分配器的容器内。
b)回收足够的0.5mg管BODIPY淀粉,以产生以20-30ug/mL 终浓度的所需体积的2X底物溶液[在上文步骤a)中计算的]。
c)在室温下使每个0.5mg管溶解于50uL DMSO中,避光,伴 随频繁涡旋。这花费超过15分钟;BODIPY淀粉的某些生产批次比其 他溶解得更好。
d)将50uL 100mM CAPS缓冲液pH 10.4加入每个管中,且通过 涡旋混合。
e)合并所有管的内容物,且通过在微量离心机中以最高速度离 心1分钟去除任何未溶解的聚集物。
f)将上清液加入在上文a)中分派的其余100mM CAPS缓冲液 中。
g)通过包裹在箔中使2X底物缓冲液避光。
3.将20uL/孔分配到所有爆发平板内。
4.将所有平板包裹在铝箔中且在室温下温育2-6小时。
5.在具有下述设置的Spectrafluor中阅读每块平板:
a)荧光读数(激发滤波器:485nm;发射滤波器:535nm)
b)平板限定:384孔黑色
c)从顶端阅读
d)最佳增益
e)闪光次数:3
6.在所得到的Excel电子表格上,在分开的图表中绘制每个假 定的3行且检查活性。确保阳性对照产生超过本底的信号。
7.对于看起来在孔中具有真实信号的每个假定,如下收获来自 阳性孔的样品:
a)从代表最高起始稀释度的行中选择阳性孔。
b)将来自那个孔的2uL转移到包含500uL SM和50uL CHCl3 的管内。这称为爆发原种。
c)贮存于4℃。
8.使用先前描述的方法,将约10uL每种爆发原种铺平板到使 用红色淀粉的150mm NZY平板上。目的是获得从其中取出分离物核心 的几个(至少20个)良好分离的噬斑。
第3天
1.检查pintooled平板中对应于相关测定平板上的孔的细菌菌 苔中的可接受清除发生率。还检查阳性对照和任何测试假定中红色淀 粉中的清除。当心也在红色淀粉中形成亮区的污染物(参见下文)。
2.从包含爆发原种稀释物的固相平板中,取出几个分离噬斑的 核心,各自置入具有50uL CHCl3的500uL SM内。这称为分离物原 种。
3.分离物原种随后可以使用上文描述的方法对于BODIPY淀粉 个别地进行测定。如果在步骤2中取出核心的噬斑在红色淀粉背景中 产生亮区,那么这个步骤可以跳过。分离物原种随后可以使用上文描 述的方法对于BODIPY淀粉个别地进行测定。然而,如果在步骤2中取 出核心的噬斑在红色淀粉背景中产生亮区,那么这个步骤可以跳过。
切除
第1天
1.在Falcon 2059管中,混合200uL OD1XL1-Blue MRF宿主、 100uLλ分离物原种和1uL EXASSIST噬菌体原种。
2.在37℃摇床中温育15分钟。
3.加入3mL NZY培养基。
4.在30℃摇床中温育过夜。
第2天
1.使切除管加热至70℃20分钟。
2.离心1000xg 10分钟。
3.在Falcon 2059管中,使50uL上清液与200uL EXP505 OD1 宿主组合。
4.在37℃摇床中温育15分钟。
5.加入300uL SOB培养基。
6.在37℃摇床中温育30-45分钟.
7.使用无菌玻璃珠在大LBKan50平板上铺平板50uL。如果平板是 “干燥”的,那么可以加入额外的SOB培养基以帮助分配细胞。
8.使平板在30℃下温育至少24小时。
9.培养分离物用于测序和/或RFLP。
在30℃下生长减少质粒拷贝数,且用于减轻某些淀粉酶克隆的明 显毒性。
在红色淀粉中形成亮区的污染物
当在固体培养基上使用红色淀粉以就淀粉酶活性测定噬菌体时, 通常可见在红色淀粉中形成亮区的污染性菌落形成单位(cfu)。对于 pintooled平板,重要的是无论何时它们与特定孔位置比对时,使淀 粉酶阳性噬菌体克隆与这些污染物区分开。污染微生物的来源推测是 2%红色淀粉储备液,这无法通过高压灭菌或通过在制备后过滤进行灭 菌。认为它们是通过代谢红色淀粉存活的条件致病菌。为了减少这些 污染物,当制备2%红色淀粉溶液且将原液贮存于4℃或冰上时,可以 使用无菌技术。
实施例8:α淀粉酶pH最适条件和比活性测定的表征
下述实施例描述了例如通过α淀粉酶活性pH最适条件和比活性 测定用于测定多肽是否在本发明的范围内的示例性方法。
本发明的酶可以用于例如关于玉米湿研磨的淀粉液化和织物脱 浆;例如在某些实施方案中,本发明的酶具有4.5-5.0的pH最适条件; 在这个较低pH下,可以使用很少的钙或不使用钙,这降低了总体操作 成本和更少的副产品形成。此外,在这个较低pH下,存在减少的化学 制品使用和离子交换载量。工业标准地衣芽孢杆菌淀粉酶在热稳定性 和pH最适条件方面是亚最佳的。在某些实施方案中,与地衣芽孢杆菌 淀粉酶比较,本发明的酶具有更高的应用比活性,且因此需要少得多 的酶以水解大量淀粉(例如,在某些实施方案中,可以使用多至20 倍更少的酶)。
关于淀粉水解的pH最适条件可以通过使50uL酶、0.35U/ml与 100ml 1%可溶性淀粉溶液(0.0175U/g淀粉)在95℃下反应30分钟 进行测定。在液化淀粉溶液中产生的还原末端可以通过本文描述的新 亚铜试剂(neocupronine)测定进行测量。玉米淀粉的水解百分比可 以通过用新亚铜试剂测定测量产生的糖还原末端数目进行测定。70克 缓冲溶液(pH4-7)进行称重,并且可以加入100ppm钙。30克玉米 淀粉可以混合到缓冲溶液内以形成淀粉浆。可以加入酶,并且使容器 密封且在95℃下温育30分钟,伴随6℃/分钟的起始加热速率。可以 从反应烧杯内提取1ml样品,且通过新亚铜试剂测定进行分析。在某 些实施方案中,本发明的酶具有在pH 4.5-5下的最适条件,而商业地 衣芽孢杆菌淀粉酶在约pH 6.0下最佳执行。
实施例9:淀粉酶活性测定
下述实施例尤其描述了例如通过下文描述的测定用于测定多肽是 否在本发明的范围内的示例性方法。
使用RBB-淀粉的测定
将75ul RBB-淀粉底物(在50mM NaAc缓冲液,pH=4.5中的1% RBB-不溶性玉米淀粉)加入新96孔平板(V型底)的每个孔内。使用 BIOMEK或ZYMARK 将5微升酶裂解产物转移到具有底物的每个孔 内。平板用铝密封胶带进行密封且在振荡器上短暂振荡。平板在90℃ 下温育30分钟,随后在室温下冷却约5-10分钟。将100微升100% 乙醇加入每个孔中,使平板密封且在振荡器上短暂振荡。随后使用台 式离心机使平板离心4000rpm 20分钟。通过BIOMEK将10ul上清 液转移到新96孔平板(平底)内,且读出OD595。应使用对照。
使用FITC-淀粉的测定
将50ul底物(在100mM NaAc缓冲液,pH=4.5中的0.01%FITC- 淀粉)加入新384孔平板的每个孔内。将5ul酶裂解产物转移到具有 底物的每个孔内,且使平板在室温下温育过夜。对于每个孔读出底物 的极化改变,激发485nm,发射535nm。应使用对照。96孔平板可以 用于所有测定。
新活性克隆的证实
来自筛选的每个阳性克隆使用标准方案进行生长且诱导。检查每 个克隆的生长(即,随着时间过去的细胞密度),在每个细胞水平上 的活性(RBB-淀粉测定和液化测定),蛋白质的表达(蛋白质凝胶) 和溶解性(通过显微镜分析)。转移经证实的新提高的克隆用于发酵。
实施例10:用于液化淀粉和测量结果的示例性方案
下述实施例描述了使用本发明的淀粉酶和/或葡糖淀粉酶用于液 化淀粉的示例性方案。一种示例性测定使用在pH 4.5或6.5下的液化 淀粉,使用下文显示的反应条件:
反应条件:100mM PO4pH 6.5,1%(w/w)液化淀粉DE 12在 55℃下。进行TLC和HPLC测定以验证活性。关于待测试的淀粉酶的 pH谱使用pH 3.0-6.5的磷酸盐缓冲液在55℃下进行。根据可观察 到的水解的量,可以在视觉上证实在上文指出的反应条件下,某些克 隆在某些pH值下比在其他值下更(或更不)活跃。
关于液化淀粉在pH 6.5下的糖化的示例性方案:
·将液化淀粉的pH调整至在其下执行糖化的pH。在具有 100mM磷酸钠盐的100mM乙酸钠缓冲液,pH 4.5中的液化淀粉这样 添加,使得在糖化前,pH调整至pH 6.5。
·将5克液化淀粉样品称重到配衡瓶内。
·使用0.04%(w/w)OPTIDEX L-400或约400mL 1-10 稀释的原种OPTIDEX L-400/100克液化淀粉。
·计算400mL 1-10稀释的原种OPTIDEX L-400中包含 的OPTIDEX L-400毫克。接下来,计算给出与OPTIDEX L-400相同 的酶浓度所需的裂解产物体积。
·将酶加入液化淀粉样品中且在所需温度(50℃)下温 育。在18小时后,测定DE且制备样品用于HPLC分析。
示例性DE测定:
示例性新亚铜试剂测定:
将100ml样品加入2.0ml新亚铜试剂溶液A(40g/L碳酸钠、16g/L 甘氨酸、0.45g/L硫酸铜)中。向其中加入2.0ml新亚铜试剂溶液B (1.2g/L新亚铜试剂盐酸盐-Sigma N-1626)。使管混合且在沸水浴 中加热12分钟;冷却,用DI水稀释至10ml体积,并且在分光光度计 上读出在450nm处的OD。根据同时运行的0.2mg/ml葡萄糖标准的应 答,推断在样品中的葡萄糖当量。
示例性HPLC分析:
糖化碳水化合物谱通过HPLC(以银形式的Bio-Rad Aminex HPX-87A柱,80℃)使用折射率检测进行测量。移动相是以0.7ml/ 分钟的流速使用的过滤Millipore水。糖化样品用酸化DI水(5滴6M HCl加入200mL DI水内)稀释1-10,随后通过0.45mm注射器式滤 器进行过滤。注入体积是20uL。
示例性TLC:
反应产物在以小时计的时间点上w/d,并且在TLC平板上点样且 干燥。平板随后溶解于10∶90水∶异丙醇中,且用香草醛染剂或CAM 染剂进行显现,随后加热以显示还原糖。在其中观察到活性的情况下, 液化淀粉部分水解成葡萄糖。
实施例11:使用本发明的淀粉酶和/或葡糖淀粉酶的淀粉液化
这个实施例描述了使用本发明的淀粉酶和/或葡糖淀粉酶用于液 化淀粉的本发明的示例性方法。
淀粉酶浓缩物可以由发酵液进行制备,通过热处理、细胞洗涤、 使用微量过滤和超滤的碱性提取(48%总体得率)。UF浓缩物可以用 乙酸进行中和,且用30%甘油在pH 4.5下进行配制。浆制剂的活性 水平可以代表商业产品(120U1/g-0.5kg/吨淀粉)。
标准淀粉酶活性测定
包含含有5mM PNP-α-D-己-(1→4)-吡喃葡萄糖苷的950μ L 50mM MOPS pH 7.0的1mL比色皿置于预热至80℃的Beckman DU-7400 分光光度计的Peltier控温仪中。分光光度计在405nm处成为空白, 且将50μL酶溶液加入比色皿中,充分混合,并且经过1分钟间隔监 控OD405nm中的增加。根据50μL1 μmole/mL PNP在950mL 50mM MOPS 中在pH 7.0-80℃下的OD405nm应答,将ΔOD405nm/分钟比转变成μmole/分 钟的标准单位。热稳定α淀粉酶(DTAA)的1个标准单位等价于在限 定测定条件下催化1μmole/mL/分钟pNP的释放的酶量。
标准葡糖淀粉酶活性测定
包含含有5mM PNP-α-D-吡喃葡萄糖苷的950μL 50mM MOPS pH 7.0的1mL比色皿置于预热至60℃的DU-7400分光光度计(Beckman) 的Peltier控温仪中。分光光度计在405nm处成为空白,且将50μL 酶溶液加入比色皿中,充分混合,并且经过1分钟间隔监控OD405nm中 的增加。根据50μL 1μmole/mL PNP在950mL 50mM MOPS中在pH 7.0-60℃下的OD405nm应答,将ΔOD405nm/分钟比转变成μmole/分钟的标 准单位。葡糖淀粉酶(DGA)的1个标准单位等价于在限定测定条件下 催化1μmole/mL/分钟pNP的释放的酶量。
右旋糖当量测定
新亚铜试剂测定法可以用于测定DE。可以通过本文描述的操作和 /或通过GPC分析员使用GPC Fehlings操作测量所选择的样品。
新亚铜试剂测定
将100μl样品加入2.0ml新亚铜试剂溶液A(40g/L碳酸钠、16g/L 甘氨酸、0.45g/L硫酸铜)中。向其中加入2.0ml新亚铜试剂溶液B (1.2g/L新亚铜试剂盐酸盐-Sigma N-1626)。使管混合且在沸水浴 中加热12分钟;冷却,用DI水稀释至10ml体积,并且在分光光度计 上在450nm处OD读数。根据同时运行的0.2mg/ml葡萄糖标准的应答, 推断在样品中的葡萄糖当量。
淀粉样品用DI水稀释~1至16,其中记录确切稀释度。将10毫 升稀释样品加入20mls DI水中。将10毫升Fehlings溶液A和B加 入稀释淀粉中。使样品煮沸3分钟且在冰上冷却。加入10毫升30% KI和10ml 6N H2SO4。溶液针对0.1N硫代硫酸钠进行滴定。记录滴定 剂体积且用于计算DE。
残留淀粉测定
糖化后样品可以使用Staley碘操作就残留淀粉进行检查。将20 克样品称重到大重量皿内。将45μL碘溶液加入重量皿中,并且使淀 粉溶液充分混合。深蓝色指示淀粉的存在,淡蓝色-绿色指示少量淀粉, 淡绿色指示痕量淀粉,和黄色红色,不存在淀粉。碘溶液通过使21.25 克碘和40.0克碘化钾溶解于1升水中进行制备。
寡糖谱
液化和糖化碳水化合物谱可以通过HPLC(例如以钙形式的AMINEX HPX-87C柱(Bio-Rad)-80℃)使用示差折光检测进行测量。
凝胶渗透层析
分子量分布可以通过层析进行测定,例如在PL AQUAGEL-OH column上,伴随通过折射率(Waters Model 2410)的质量检测。Model T60(Viscotek)检测器可以用于连续粘度和光散射测量。
毛细管电泳
可以使用用于在熔凝石英毛细管上分离APTS衍生寡糖的 Beckman Coulter P/ACE MDQ Glycoprotein System;在一个方面, 使用通过激光诱导荧光的检测。
初级液化
将直接来自GPC过程的线淀粉抽吸到60升进料罐内,其中pH、 DS(干物质)和钙水平可以在液化前进行调整。将淀粉酶加入浆中。 32%DS浆通过正排量泵以0.7升/分钟抽吸到喷嘴增压混合室, 其中淀粉浆通过蒸汽注入即时加热至超过100℃。凝胶化的部分液化 淀粉通过管道网络(仍在压力下)抽吸,以给出在温度下的所需采样 时间(5分钟)。将压力释放到闪蒸罐内且可以获得样品。样品一式 两份地获得。
次级液化
将液化淀粉收集到1升玻璃瓶中,且在95℃下的水浴中保持90 分钟。
糖化
使液化淀粉冷却至60℃,pH调整至4.5,并且用葡糖淀粉酶处理 样品。糖化过程可以随着时间过去例如通过HPLC进行监控。
紧接着在90分钟次级液化后用6N HCl将由每种淀粉酶产生的液 化糖浆调整至约pH 2.5,以灭活任何残留淀粉酶。糖浆随后调整至pH 4.5,置于60℃水浴中,并且用3个葡糖淀粉酶水平进行糖化。糖化 程度通过HPLC在18-88小时时间点上进行监控。
液化糖浆用标准剂量-0.04%双倍强度葡糖淀粉酶-和2个较低 剂量(50%和25%)进行糖化,以监控糖化过程中的任何差异。
糖化进展数据可以通过例如用0.04%葡糖淀粉酶的右旋糖发展 %对时间进行分析;或例如用0.02%葡糖淀粉酶的右旋糖发展%对时 间进行分析。
糖化后的糖谱
分子量分布
通过本发明的淀粉酶和/或葡糖淀粉酶,和在某些方面,使用对照, 例如商业酶,例如地衣芽孢杆菌或商业嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)液化至DE 12和18的糖浆的分子量分布,可以 通过凝胶渗透层析进行测量,使用通过折射率、光散射和粘度的检测。 地衣芽孢杆菌和嗜热脂肪芽孢杆菌淀粉酶产生双重峰分布第一波 峰集中于2000处,第二波峰在32,000处,伴随延伸超过160,000范 围的肩。较低分子量峰代表约60%的样品总量。在某些实施方案中, 本发明的淀粉酶和/或葡糖淀粉酶可以显示在2000处的单重峰,其中 极少超过30,000。
HPLC
通过本发明的淀粉酶和/或葡糖淀粉酶(和对照商业酶,例如来自 地衣芽孢杆菌的淀粉酶和/或商业嗜热脂肪芽孢杆菌淀粉酶)产生的 DE 12和18糖浆可以通过HPLC进行分析。2种技术产生每类淀粉酶的 指纹特征;寡糖模式对于地衣芽孢杆菌淀粉酶对嗜热脂肪芽孢杆菌淀 粉酶是不同的,并且本发明的淀粉酶和/或葡糖淀粉酶也预期产生其酶 类别的指纹特征。本发明的液化糖浆(例如,通过本发明的方法制备 和/或通过本发明的酶制备的糖浆)显示寡糖中的更多分支的证据。 HPLC仅分辨<DP15范围中的寡糖较大的片段在这些技术中不可 见。已知芽孢杆菌属淀粉酶以这样的方式液化淀粉,使得支链淀粉级 分比直链淀粉级分更不广泛地水解。这些>DP30支链淀粉片段包含在 集中于32,000处的高分子量级分中,并且因此,在芽孢杆菌属液化糖 浆的HPLC分析中可见很少的分支证据。在一个方面,使用本发明的淀 粉酶和/或葡糖淀粉酶制备的液化糖浆中的<DP15寡糖包含来自直链 淀粉和支链淀粉的片段。
实施例12:使用本发明的淀粉酶和/或葡糖淀粉酶在酸性条件下 的淀粉液化
本发明提供了使用本发明的淀粉酶和/或葡糖淀粉酶用于液化淀 粉的方法,包括在酸性条件下的淀粉酶活性,例如约pH 4.0-5.0,例 如pH 4.5。在一个实施方案中,淀粉转变成葡萄糖可以通过2种酶的 顺次作用进行催化:本发明的内淀粉酶,例如淀粉酶,例如α-淀粉酶, 和外淀粉酶,例如本发明的葡糖淀粉酶,以液化淀粉(例如,高分子 量葡萄糖聚合物通过本发明的淀粉酶水解成包含2-20个单糖单位的 寡糖,一般是10-12右旋糖当量),随后为用外淀粉酶例如葡糖淀粉 酶(其可以是本发明的葡糖淀粉酶)糖化。
在一个方面,加工在玉米湿研磨植物中,产生具有pH约4.0-4.5 的淀粉浆。在一个方面,pH在液化前升高至例如5.8-6.0,以适应具 有低pH活性和稳定性的α淀粉酶(其可以是本发明的α淀粉酶)。在 一个方面,本发明的淀粉酶和/或葡糖淀粉酶可以在pH 4.5下使淀粉 液化成12-18的右旋糖当量;在一个方面,使用在约3-6克/吨淀粉水 平下的本发明的α淀粉酶和/或葡糖淀粉酶。在这个方面,本发明的α 淀粉酶和/或葡糖淀粉酶的使用使得淀粉液化能够在pH 4.5下进行。
在一个方面,淀粉液化在pH 4.5下在105℃下进行5分钟,至在 95℃下90分钟,使用本发明的淀粉酶和/或葡糖淀粉酶。酶量可以进 行调整,以便使液化后的靶DE 12调整至15。在一个方面,液化淀粉 随后用葡糖淀粉酶,例如曲霉菌属葡糖淀粉酶,在约pH 4.5和60℃ 下糖化约48小时。如果糖化糖浆不包含至少95%葡萄糖,那么靶液 化DE升高且糖化重复,直至液化最终的确产生包含超过95%葡萄糖 的糖化糖浆。产生用于糖化的合适液化原料所需的淀粉酶蛋白质可以 例如通过PAGE或HPLC进行测定。
实施例13:使用本发明的淀粉酶和/或葡糖淀粉酶的淀粉液化
这个实施例描述了使用本发明的淀粉酶和/或葡糖淀粉酶用于液 化淀粉的示例性方法;且描述了使用商业地衣芽孢杆菌和嗜热脂肪芽 孢杆菌淀粉酶作为对照。这些测定可以包含糖化过程以及来自通过本 发明的酶和商业淀粉酶产生的糖浆的最终右旋糖水平。
右旋糖当量(DE)是用于测量总还原糖浓度的工业标准,计算为 基于干重的D-葡萄糖。未水解的颗粒状淀粉具有实际上零的DE,而 D-葡萄糖的DE定义为100。本发明的一个示例性过程在pH 4.5下使 用约60-70单位/千克淀粉的酶剂量,以达到19DE。
通过本发明的淀粉酶和/或葡糖淀粉酶和商业淀粉酶产生的寡糖 模式可以通过分子量(MW)分布进行分析,使用例如凝胶渗透层析伴 随通过光散射和粘度的检测。在一个方面,本发明的淀粉酶和/或葡糖 淀粉酶可以产生18DE和均匀的寡糖MW分布,没有任何超过20,000。 这与关于本发明的糖浆(例如,通过本发明的方法制备或使用本发明 的酶制备的糖浆)的较低粘度一致。如通过HPLC测量的DP(聚合度) 谱也可以用于分析作用模式中的差异。
淀粉酶浓缩物由发酵液进行制备,通过热处理、细胞洗涤、使用 微量过滤和超滤(UF)的碱性提取。UF浓缩物可以用乙酸进行中和, 且用30%甘油在pH 4.5下进行配制。浆制剂的活性水平可以进行分 析,例如120U1/g-0.5kg/吨淀粉代表商业产品。
实施例14:用于洗衣和自动洗碗应用的碱性淀粉酶
在一个方面,本发明提供了包含本发明的淀粉酶和/或葡糖淀粉酶 的洗涤剂,包括在碱性条件下有活性的淀粉酶和/或葡糖淀粉酶,和制 备且使用其的方法。
本发明提供了碱稳定淀粉酶和/或葡糖淀粉酶,其可以就在洗衣和 自动洗碗(ADW)应用中重要的特征而言,与一种或多种商业基准酶进 行比较:
○在淀粉包被载玻片上的ADW洗涤测试。
○在洗衣/ADW制剂的存在下使用可溶性底物的淀粉酶和/或 葡糖淀粉酶酶活性测试。
○在螯合剂的存在下,淀粉酶和/或葡糖淀粉酶酶活性测试。
○淀粉酶和/或葡糖淀粉酶酶活性测试和测定的碱性pH最佳 范围(例如,pH 10-11)。
○关于嗜热性质的淀粉酶和/或葡糖淀粉酶酶活性测试,例如 在约65-70℃下的性能。
淀粉酶和/或葡糖淀粉酶活性可以通过还原糖测定进行测量,或当 使用BODIPY-淀粉时,通过监控在520nm(485nm激发)处的荧光进 行测量。可以计算起始速率且转变成最高速率百分比。
应用测试
可以设计实验以评估本发明的碱性淀粉酶和/或葡糖淀粉酶在洗 衣/ADW制剂中以及关于个别组分的活性和稳定性。淀粉酶和/或葡糖 淀粉酶活性可以在包含螯合剂EDTA和/或过氧化氢的条件下进行评 估;商业基准酶可以是对照。
例如,纯化蛋白质可以在50℃下在5mM EDTA的存在或不存在下 温育所需时间,这之后使用可溶性底物测量残留淀粉酶活性。在EDTA 的存在下的活性表示为在不存在螯合剂的情况下的活性%。可替代地, 可以评估在过氧化氢的存在下的酶活性。纯化蛋白质在50℃下在1M H2O2的存在或不存在下温育所需时间,这之后使用可溶性淀粉测量残 留淀粉酶活性。在过氧化氢的存在下的活性表示为在不存在H2O2的情 况下的活性%。酶活性可以在ADW溶液(蒸馏水、硬化溶液、漂白剂、 螯合剂、表面活性剂)中用可溶性底物(BODIPY-淀粉)进行测试。纯 化蛋白质可以与可溶性淀粉在40℃下在洗衣/ADW制剂的存在下进行 反应。起始速率在5分钟后进行计算且表示为荧光单位(FU)/s/ng 蛋白质。
用淀粉包被载玻片的洗涤测试可以如下进行:使纯化蛋白质与载 玻片在50℃下在ADW溶液(蒸馏水、硬化溶液、漂白剂、螯合剂、表 面活性剂)的存在下温育30分钟。使酶处理后的重量减轻与载玻片的 起始重量比较来测量淀粉去除。
示例性淀粉酶的表征
编码淀粉酶的基因可以进行修饰,以包含淀粉/碳水化合物结合结 构域。蛋白质可以连同和不连同C末端组氨酸标签,并且在非糖基化 和糖基化宿主进行表达。酶可以以宿主/His标签组合进行表达,并且 测定pH和温度最适条件。具有His标签在糖基化宿主中表达的酶可以 用于测试实验。His标签的存在不应影响比活性,然而,糖基化可能 导致比不含糖基化的那种略微更低的比活性。
实施例15:热稳定淀粉酶的鉴定和表征
下述实施例描述了用于热稳定淀粉酶的鉴定和表征的示例性方 案。
在一项研究中,在包含颗粒状淀粉作为唯一碳源的固体培养基上 筛选350个真菌分离物。完全水解淀粉或显示出显著生长的菌株提交 用于cDNA分离及其分泌蛋白质的蛋白组学分析。基于序列的开发和蛋 白组学分析组合用于回收编码淀粉酶、葡糖淀粉酶和葡糖苷酶的DNA 序列,其通过蛋白组学显示在颗粒状淀粉上的生长过程中分泌。
回收的全长cDNA序列进行亚克隆用于在巴斯德毕赤酵母中表达, 并且表达的蛋白质用BCA测定(其用于测定在淀粉经由淀粉酶的水解 过程中还原末端浓度中的增加)和葡萄糖氧化酶(GO)测定(其用于 检测淀粉经由葡糖淀粉酶释放的葡萄糖)进行进一步表征,关于这2 种测定的示例性方案在本文中描述。
表1




  SEQ ID NO:44(由例   如SEQ ID NO:43编码)   α-葡糖苷   酶   异旋孢腔菌   SEQ ID NO:6(由例如   SEQ ID NO:5编码)   α-葡糖苷   酶   异旋孢腔菌
根据Marlida(2000)World J.Microbiol.Biotechnol.16: 573-578,真菌分离物在改良的固体培养基上进行筛选。培养基包含 Czapek Dox盐和1%MIMAIZE260TM(HiMaize260,National Starch & Chemical,Bridgewater,NJ)抗性淀粉作为唯一碳源。无需灭菌将 MIMAIZE260TM淀粉加入冷琼脂中,以便保存淀粉的颗粒状结构。此外, 相同真菌菌株在具有0.5%红色淀粉(Megazyme,Ireland)的培养基 上进行筛选,以便鉴定分泌淀粉水解酶的菌株。
在生长5天后,通过在红色淀粉培养基上的亮区显现的在抗性淀 粉和分泌淀粉上生长良好的分离物选择作为“初步命中”在第二个步 骤中,初步命中在具有Czapek Dox盐和1%抗性淀粉(MIMAIZE260) 抗性淀粉作为唯一碳源的液体培养基中生长约2周。完全清除淀粉溶 液或在这种培养基中显示出显著生长的菌株提交用于cDNA分离和培 养上清液的蛋白组学分析。基于序列的开发和蛋白组学分析组合用于 回收编码淀粉酶和葡糖淀粉酶的序列。
使用2种方法执行基于序列的开发。在一种中,基于已知真菌蛋 白质序列的比对设计用于淀粉酶和片段基因的PCR回收的通用简并引 物。在另一种方法中,使通用简并引物在PCR中与基于肽序列的引物 组合,所述肽序列得自来自在颗粒状淀粉上生长的真菌分离物的培养 上清液的蛋白组学分析。在2种情况下,引物用于PCR,其中模板DNA 包含由相同淀粉消化真菌菌株制备的cDNA。通过这种方法,回收部分 基因序列。肽数据也用于促进部分序列的全长形式的回收,使用5’ 和3’RACE PCR。
对于具有预测序基因组的已知真菌物种,蛋白组学分析用于测定 衍生自假定淀粉酶的肽序列,使用下述方法:1)在衍生自在抗性淀粉 作为唯一碳源上生长的真菌提取物的样品的SDS-PAGE分析后,对单个 条带实施蛋白酶消化;2)在LCQ仪器上进行回收肽的质谱法分析;3) 通过SEQUEST(Sage-N Research,Inc.and Thermo Scientific) 数据库搜索测定肽序列。
对于未知真菌物种,其中通过类似于上文描述的那种的方法测定 肽序列,除了肽及其组成成分氨基酸的精确质量使用QTOF仪器进行测 定。回收肽的序列用作模板,以产生简并寡核苷酸引物用于PCR扩增 来自cDNA的基因,所述cDNA由在MIMAIZE260颗粒状淀粉上生长的 相关真菌物种制备。
编码淀粉酶和葡糖淀粉酶的回收全长cDNA序列进行亚克隆用于 在巴斯德毕赤酵母中表达,并且表达的蛋白质用BCA测定(用于测定 在经由淀粉酶的淀粉水解过程中还原末端浓度中的增加)和GO测定 (用于检测经由葡糖淀粉酶的淀粉水解过程中释放的葡萄糖)进行进 一步表征。
为了测定淀粉酶和片段的活性,淀粉水解反应如下进行:测定在 伴随恒定振荡(800rpm)的Eppendorf台式培养箱中一式三份地进行, 在37℃和pH 5.0下在包含1%粗颗粒状淀粉的50mM乙酸钠缓冲液中。 反应通过将酶加入反应混合物中来起始。在不同时间点时,取出反应 的等分试样,并且通过添加1M Tris pH 7.5(葡糖淀粉酶)或BCA试 剂(淀粉酶)进行猝灭。
用于测量还原末端浓度中的增加的BCA测定。α-淀粉酶的活性通 过在淀粉水解过程中形成的还原基团的出现进行测量。还原糖的BCA -Bicincochinic Acid(铜-BCA)测定根据Wong(2000)Microassay for rapid screening of alpha-amylase activity,J.Agric.Food Chem.48:4540-4543;进行来进行;并且使用Fox(1991) Minia turization of three carbohydrate analyses using a micro sample plate reader,Anal.Biochem.195:93-96。
将10μl等分试样的淀粉酶淀粉水解反应猝灭到100μl BCA试 剂(由64mg/mL一水碳酸钠、24mg/mL碳酸氢钠、1.95mg/mL BCA、 1.24mg/mL硫酸铜五水合物、1.26mg/mL L-丝氨酸组成)内。显色 在猝灭反应于80℃35分钟的温育期间发生,并且随后为在560nm处 的吸光度测定。经过50分钟反应时间计算起始速率。构建使用麦芽糖 的标准曲线,以使A560nm与所产生的还原糖浓度(nmoles)相关。比活 性表示为nmoles/分钟/μg酶。
用于定量在淀粉水解期间释放的葡萄糖的葡萄糖氧化酶/过氧 化物酶(GO)测定:葡糖淀粉酶的活性通过经修饰的GO(偶联的葡萄 糖氧化酶)测定进行测量,根据Bergmeyer,In Determination with Glucose Oxidase and Peroxidase;Bergmeyer,H.U.,编辑;Methods of.Enzymatic Analysis,第2版;1974;第1205-1212页)。
在黑色Nunc 96孔平板中,通过将10μl猝灭的淀粉水解反应加 入90μl PBS来起始GO反应,所述PBS包含葡萄糖氧化酶(0.1U/ml)、 过氧化物酶(0.25U/ml)和0.05mM Amplex Red。在荧光平板阅读 器上用Ex/Em 545/590nm读数前,平板在室温下在黑暗中放置30分 钟。用葡萄糖构建的标准曲线用于评估在水解反应中产生的葡萄糖量。 淀粉水解的起始速率(由1%颗粒状淀粉释放的nmols葡萄糖/分钟/ μg葡糖淀粉酶)通过下述进行测定:标绘随着时间过去释放的葡萄 糖量,和通过时间点计算最佳线性拟合的斜率。
在约pH 3.5-6.0范围中的pH对经由本发明的七(7)种示例性葡 糖淀粉酶和2种示例性淀粉酶水解淀粉的影响在图10和图11中举例 说明。图10举例说明显示在37℃下pH对经由本发明的七(7)种示 例性葡糖淀粉酶的颗粒状淀粉水解的影响的数据;起始速率经过15 分钟进行计算且转变成观察到的最高速率百分比。图11举例说明显示 在37℃下pH对经由SEQ ID NO:4(由例如SEQ ID NO:3编码)和 SEQ ID NO:52(由例如SEQ ID NO:51编码)淀粉酶的颗粒状淀粉水 解的影响的数据;起始速率经过50分钟进行计算且转变成观察到的最 高速率百分比。
其他测定也可以用于表征本发明的酶,并且某些示例性方案在下 文描述:
示例性核酸提取方案:微生物例如丝状真菌在液体培养基中生长。 收集生物量,并且使用标准方案使用DNEASYTM(DNeasy)Plant Maxi Kit(Qiagen,Valencia,CA)分离高分子量基因组DNA。使用标准方 案使用RNEASY(RNeasy)Plant Mini Kit(Qiagen)分离总RNA。
示例性文库构建方案:基因组DNA可以用限制酶进行部分消化, 并且可以纯化1-10kb的片段用于构建基因组文库。根据制造商的说 明书,片段可以连接到Lambda Zap Express(Stratagene,San Diego, CA)载体内,并且包装到可感染噬菌体内。
示例性文库筛选方案:λ文库可以用于感染顶层琼脂中的XL1 Blue MRF细胞(Stratagene)。约50,000pfu噬菌体可以加入600 ul细胞OD600=1中。混合物在水浴中于37℃温育15分钟,随后加入 6ml融化的0.7%顶层琼脂中且在NZY琼脂平板上铺平板。平板随后 在39℃下温育过夜。尼龙环(F.Hoffmann-La Roche Ltd.,Basel Switzerland)可以放置到所产生的噬斑菌苔上,并且伴随与尼龙附着 的某些噬菌体往回提起来。尼龙可以浸入1.5M NaCl,0.5M NaOH中2 分钟,1.5M NaCl,0.5M Tris pH 7.6中5分钟,和2X SSC,0.2M Tris pH7.6中30秒。尼龙滤膜随后例如在Stratagene交联剂中进行UV交 联。
来自淀粉酶例如葡糖淀粉酶基因的PCR片段可以用于探测,例如 使用Expand High Fidelity PCR Kit(Roche),使用在热循环仪 中的95℃20秒、55℃30秒和72℃1分钟的30个循环。分离的PCR 片段可以制备为放射性探针,使用Prime It Kit(Stratagene)根 据制造商的说明书。
文库滤膜提起在杂交炉(Robbins)中在预杂交溶液(例如,DIG EASY HYB,Roche)中于42℃洗涤2小时。探针可以加入15ml新鲜 的DIG EASY HYB中,并且用于替换预杂交溶液。滤膜用探针例如在 45℃下洗涤过夜。可以去除探针,并且滤膜用2X SSC,0.1%SDS洗涤 1次15分钟,并且用0.1X SSC,0.1%SDS洗涤2次,各15分钟。尼 龙滤膜可以在-80℃下暴露于x射线胶片过夜。冲洗后,在x射线胶片 上的杂交斑点可以用于鉴定来自原始平板的克隆。可以从其中斑点排 列的平板中获得琼脂塞,并且悬浮于SM缓冲液中以将噬菌体释放到溶 液内。因此可以分离对应于包含所有或部分淀粉酶基因的基因组片段 的几个分离噬斑。
100ul分离的噬菌体原种可以加入200ul XL-1BLUE MRF细胞 (Stratagene)和1ul EXASSIST辅助噬菌体(Stratagene)中。 混合物可以在37℃下温育15分钟,并且可以加入3ml 2X YT培养基。 这可以在37℃下伴随振荡温育2.5小时。混合物可以在70℃下加热 20分钟,并且在冰上冷却。可以取出100ul混合物且加入200ul SOLR 细胞(Stratagene)中,并且在37℃下温育15分钟。50ul可以在 LB卡那霉素(50ug/ml)平板上铺平板,并且在37℃下温育过夜。所 得到的菌落可以包含在质粒pBK-CMV中的克隆基因组片段。
示例性测序方案:关于候选克隆的DNA测序可以用BIGDYE TERMINATOR循环测序VERSION 2.0Kit(Applied Biosystems, Foster City,CA)和3700DNA Analyzer(Applied Biosystems) 来进行,使用制造商的方案。通过使这种序列与在已知淀粉酶中关于 内含子的共有序列比较可以鉴定潜在内含子。
示例性cDNA合成方案:PCT引物在cDNA合成反应中使用,使用 THERMOSCRIPT rtPCR Kit(Invitrogen),使用制造商的方案。
示例性表达克隆方案:PCT引物用于产生PCR片段,使用cDNA克 隆作为模板,使用95℃20秒、55℃30秒和72℃2分钟的30个循 环,使用EXPAND HIGH FIDELITY PCR Kit(Roche)和制造商的方 案。PCR片段用限制酶进行消化,并且连接到质粒例如pPIC Z α (Invitrogen)的相应限制位点内。构建体可以转化到酵母例如巴斯 德毕赤酵母菌株X-33(Invitrogen)内,在其中构建体稳定整合到 毕赤酵母属染色体内。选择可以基于对zeocin的抗性。构建体可以这 样设计,使得毕赤酵母属克隆可以用甲醇诱导,以将成熟的淀粉酶分 泌到培养基内。1升表达克隆培养物可以用过夜酵母起始培养物在 BMGY中进行接种,并且在30℃下在摇瓶中生长过夜。第二天通过离心 收集酵母细胞,并且重悬于1升BMGY中。细胞在30℃下在摇瓶中培 养3天,其中每24小时加入甲醇至0.5%终。随后可以收集包含表达 的葡糖淀粉酶的培养基,并且在葡糖淀粉酶活性测定和SDSPAGE电泳 移动中进行测定,使用标准方案以测定蛋白质大小。
也可以设计引物用于在大肠埃希杆菌中超表达。PCR引物用于如 前由cDNA模板产生PCR产物。PCR片段可以用限制酶进行消化,并且 连接到质粒例如pSE420(Invitrogen)的相应限制位点内。构建体可 以转化到大肠埃希杆菌例如菌株XL-1Blue MR(Stratagene)内。关 于质粒的选择可以基于氨苄青霉素抗性。淀粉酶基因可以在lac-z启 动子的控制下,并且可以用IPTG(异丙基-硫代-吡喃半乳糖苷)进行 诱导。构建体可以这样设计,使得成熟的淀粉酶基因将在大肠埃希杆 菌细胞内表达,并且将包含在N末端处的额外甲硫氨酸残基。
示例性“标准”测定:酶等分试样可以在水浴中加入5mM缓冲液、 3mM麦芽-寡糖(Sigma,M-3639)溶液中。在时间点时可以取出100ul 等分试样至200ul葡萄糖氧化酶试剂(Sigma,GAGO-20),并且温育 37℃,30分钟。反应可以通过添加12N硫酸得到终止,并且测定在 540nm处的吸光度。全长形式的酶可以就pH、温度和底物利用进行测 试。
示例性“活性”测定:酶活性可以通过从寡糊精底物中释放的游 离葡萄糖进行测定。释放的葡萄糖可以在偶联反应中进行氧化,导致 有色产物。酶等分试样可以在水浴中加入5mM缓冲液、3mM麦芽-寡 糖(Sigma,M-3639)溶液中。在时间点时可以取出100ul等分试样 至200ul葡萄糖氧化酶试剂(Sigma,GAGO-20),并且温育37℃, 30分钟。反应可以通过添加12N硫酸得到终止,并且测定在540nm 处的吸光度。随后标绘时间点以测定关于反应的相对速率。pH谱:乙 酸盐缓冲液(pH 4.0、4.5、5.0和5.4)以及磷酸盐缓冲液(pH 6.2、 7.0、8.1)可以用于活性测定中,以测定在每个pH下关于葡糖淀粉酶 的相对速率。
温度谱:在各个温度(例如,50℃、60℃、70℃、80℃和85℃) 下酶的相对速率可以在乙酸盐缓冲液pH 5.3中进行测定。
温度稳定性数据:酶可以在所需指示温度下加入5mM乙酸盐缓冲 液中。酶等分试样可以以4分钟间隔取出至冰。等分试样随后就对底 物的活性在70℃下测试20分钟。
底物利用:糊精麦芽糖、麦芽三糖、潘糖、麦芽四糖和麦芽七糖 可以在活性测定中替代麦芽寡糖,以测试淀粉酶例如葡糖淀粉酶的底 物利用。关于各种底物的葡萄糖释放率可以在5mM乙酸盐缓冲液,70 ℃中进行测试。
实施例16:淀粉酶活性测定:BCA还原末端测定
下述实施例描述了例如通过BCA还原末端测定用于测定多肽是否 在本发明的范围内的示例性方法。淀粉酶(包括例如葡糖淀粉酶)活 性可以使用下述方法进行测定。
1.如下制备2种底物溶液:
a)通过在100ml 100mM磷酸钠pH 8)中溶解2克马铃薯淀 粉的2%可溶性淀粉(马铃薯或颗粒状玉米淀粉)pH 8溶液
b)通过在100ml 100mM碳酸钠中溶解2克马铃薯淀粉的2% 可溶性淀粉(马铃薯)pH 10溶液。
在混合的同时使2种溶液在沸水浴中加热30-40分钟,直至淀粉 溶解。
2.由64mg/ml一水碳酸钠、24mg/ml碳酸氢钠和1.95mg/ml BCA(4,4’-二羧基-2,2’-联喹啉二钠盐(Sigma Chemical目录#D-8284) 制备溶液A。将上述加入dH2O中。
3.通过使1.24mg/ml硫酸铜五水合物和1.26mg/ml L-丝氨酸 组合制备溶液B。将混合物加入dH2O中。
4.制备溶液A和B的1∶1定量的工作试剂。
5.制备10mM麦芽糖在dH2O中的麦芽糖标准溶液,其中10mM 麦芽糖在所需pH下在2%可溶性淀粉中组合至终浓度0、100、200、 300、400、600μM。将对于每组时间点产生标准曲线。因为曲线通过 将10ul标准加入工作试剂中进行测定,所以它被算出是0、1、2、3、 4、6nmole麦芽糖。
6.将1ml底物溶液等分到微量离心管内,在加热块或加热水浴 中平衡至所需温度(5分钟)。将50ul酶溶液加入管盖的内部。
7.当溶液在平衡时,使5ml溶液A和B混合。将100ul等分 至96孔PCR平板。将平板置于冰上。
8.5分钟温度平衡后,关闭管上的盖子,倒置且涡旋3次。当 t=0(零时间点)时,紧接着将10u l等分到平板内。使酶混合物留在 加热块中,并且在每个所需时间点时(例如,0、5、10、15、20、30 分钟)等分10ul。
9.确保使12个孔留空(仅等分工作试剂)用于添加10ul标 准,用于标准曲线。
10.当收集所有时间点且加入标准时,盖上平板且加热至80℃ 35分钟。使平板在冰上冷却10分钟。将100ul H2O加入所有孔内。 混合且将100ul等分到平底96孔平板内,并且阅读在560nm处的吸 光度。
11.每个样品的时间点针对其自身t=0调整归零(从其他A560 平均值中扣除平均t=0A560值)。将A560(实验)转变成umole(将A560 (实验)除以标准曲线的斜率(A560/umole)。产生时间点和umole的斜 率(以umole/分钟表示),乘以100(因为umole值仅占测定中使用 的10ul,而不是在1ml rxn中制备的量)。为了获得比活性,将斜 率(以umole/分钟表示)除以mg蛋白质。所有点应以最低限度一式 两份来完成,其中3是最佳的。将蛋白质浓度(mg/ml)除以任何稀释 度,以获得在测定中使用的mg。将上述斜率除以在测定中使用的mg, 以获得比活性。参见例如,Wong(2000)J.Agric.Food Chem.48: 4540-4543;Fox(1991)Anal.Biochem.195,93-96。
实施例17:筛选淀粉酶活性
下述实施例描述了用于测定多肽是否在本发明的范围内的示例性 方法。克隆的淀粉酶(例如葡糖淀粉酶)活性可以通过本领域已知的 许多方法进行评估。下述是可以使用的示例性方法。
每块平板筛选的噬斑数目可以是约10,000pfu’s。对于每个DNA 文库:应筛选至少50,000个噬斑/分离文库和200,000个噬斑/未分离 文库,依赖关于λZap Express扩增的裂解产物的pfu滴度。
λ文库的滴度测定
1)将μL Lambda Zap Express扩增的文库原种加入600μL大肠 杆菌MRF细胞(OD600=1.0)中。为了稀释MRF的原种,使用10mM MgSO4。
2)在37℃下温育15分钟。
3)在50℃下将悬浮液转移至5-6mL NZY顶层琼脂且轻轻混合。 紧接着将琼脂溶液倾到大(150mm)NZY培养平板上。
4)允许顶层琼脂完全固化(约30分钟),随后使平板倒置。
5)使平板在39℃下温育8-12小时。
6)估计噬斑数目。测定噬菌体滴度以给出10,000pfu/平板。
7)需要时,用SM缓冲液稀释文库噬菌体的等分试样。
底物筛选
-将来自扩增文库的Lambda Zap Express(50,000pfu)加入 600μL大肠杆菌MRF细胞(OD600=1.0)中。对于非环境文库,制备4 个管(50,000pfu/管)。
-在37℃下温育15分钟。
-当噬菌体/细胞悬浮液在温育时,在50℃下将1.0mL红色淀粉 底物(1.2%w/v)加入6.0mL NZY顶层琼脂中,并且充分混合。使溶 液放置于50℃直至需要时。
-将1/5(10,000pfu)细胞悬浮液转移至底物/顶层琼脂溶液, 且轻轻混合。
-紧接着将溶液倾到大(150mm)NZY培养平板上。
-允许顶层琼脂完全固化(约30分钟),随后使平板倒置。
-对于其余细胞悬浮液将操作4-6重复4次(每次1/5悬浮液)。
-使平板在39℃下温育8-12小时。
-就噬斑周围的亮区(晕圈)观察平板。
-从琼脂中取出具有晕圈的噬斑的核心,且转移至无菌微型管。 大孔径200μL吸管端良好工作,以取出(取出核心)包含所需噬斑的 琼脂塞。
-使噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑制 任何进一步的细胞生长。
-在下一个步骤前,纯噬菌体悬浮液在室温下温育4小时或过夜。
纯克隆的分离
-将10μL重悬的噬菌体悬浮液加入500μL大肠杆菌MRF细胞 (OD600=1.0)中。
-在37℃下温育15分钟。
-当噬菌体/细胞悬浮液在温育时,在50℃下将1mL红色淀粉底 物(1.2%w/v)加入6.0mL NZY顶层琼脂中,并且充分混合。使溶液 放置于50℃直至需要时。
-将细胞悬浮液转移至底物/顶层琼脂溶液,且轻轻混合。
-紧接着将溶液倾到大(150mm)NZY培养平板上。
-允许顶层琼脂完全固化(约30分钟),随后使平板倒置。
-使平板在39℃下温育8-12小时。
-就单个噬斑(纯克隆)周围的亮区(晕圈)观察平板。如果不 能分离单个噬斑,那么调整滴度且使噬菌体悬浮液重新铺平板。
-从琼脂中取出具有晕圈的单个噬斑的核心,且转移至无菌微型 管。大孔径200μL吸管端良好工作,以取出(取出核心)包含所需噬 斑的琼脂塞。为了扩增滴度,取出5个单个活性噬斑的核心置入微型 管内。
-使噬菌体重悬于500μL SM缓冲液中。加入20μL氯仿以抑制 任何进一步的细胞生长。
-在下一个步骤前,纯噬菌体悬浮液在室温下温育4小时或过夜。 通过将DMSO加入噬菌体悬浮液内(7%v/v)将纯噬菌体悬浮液贮存于 -80℃。
纯克隆的切除
-将100μL纯噬菌体悬浮液加入200μL大肠杆菌MRF细胞 (OD600=1.0)中。向其中加入1.0μL EXASSIST辅助噬菌体(>1×106 pfu/mL;Stratagene)。使用2059 Falcon管用于切除。
-使悬浮液在37℃下温育15分钟。
-将3.0mL 2xYT培养基加入细胞悬浮液中。
-在振荡的同时,在30℃下温育至少6小时或过夜。
-将管转移至70℃20分钟。噬菌粒悬浮液可以贮存于4℃1-2 个月。
-将100μL噬菌粒悬浮液转移至包含200μL大肠杆菌Exp 505 细胞(OD600=1.0)的微型管。
-使悬浮液在37℃下温育15分钟。
-将300μL SOB加入悬浮液中。
-使悬浮液在37℃下温育30-45分钟。
-对于Zap Express DNA文库,将100μL悬浮液转移至包含卡 那霉素的小(90mm)LB培养平板(具有卡那霉素50μg/mL的LB培养 基),或对于Zap II DNA文库,包含氨苄青霉素的小(90mm)LB培 养平板(具有卡那霉素100μg/mL的LB培养基)。
-将其余悬浮液转移至另一个小LB培养基平板。
-使用无菌玻璃珠以使悬浮液平均分布在平板上。
-使平板在30℃下温育12-24小时。
-就菌落观察平板。
-将单个菌落接种到包含合适抗生素的LB液体培养基内,且在 30℃下温育12-24小时。
-通过将80%甘油加入液体培养基中(15%v/v)可以制备甘油 母液,且贮存于-80℃。
活性验证
-将50μL液体培养基转移至微型管。将500μL 8%pH7支链淀 粉Azure加入同一管内。对于每个克隆制备2个管。
-活性在50℃下测试3小时和过夜。使用pH 7缓冲液作为对照。
-使测试样品在冰水浴中冷却5分钟。
-加入750μL乙醇且充分混合。
-在13000rpm(16000g’s)下离心5分钟。
-测量悬浮液在595nm下的OD。
RFLP分析
-将1.0mL液体培养基转移至无菌微型管。
-在13200rpm(16000g’s)下离心1分钟。
-弃去上清液。将另外1.0mL液体培养基转移到同一无菌微型管 内。
-在13200rpm(16000g’s)下离心1分钟。
-弃去上清液。
-遵循QIAPREPTM旋转微型试剂盒方案用于质粒分离。
-使用BioPhotometer检查DNA浓度。
-使用Sac I和Kpn I用于第一次双重消化。在37℃下温育1小 时。
-使用Pst I和Xho I用于第二次双重消化。在37℃下温育1小 时。
-将上样染料加入消化样品内。
-在120伏下使消化样品在1.0%琼脂糖凝胶上电泳1-1.5小时。
-用凝胶成像仪观察凝胶。具有不同消化模式的所有克隆将送出 用于序列分析。
实施例18:用于纯化酶的示例性方案
下述实施例描述了用于纯化本发明的酶的示例性方案。
SEQ ID NO:52:将表达SEQ ID NO:52的巴斯德毕赤酵母培养物 (参见下文实施例25中的讨论)的6g冻干上清液悬浮于24mL H2O 中,并且用冷乙醇进行沉淀。将沉淀的团块重悬于约40mL H2O,并且 针对水透析O/N。透析后,将浓缩的乙酸盐缓冲液pH 6.0加入样品中, 以获得50mM的终浓度。蛋白质在50mM Na乙酸盐pH6.0中与柱(Q SEPHAROSETM;将Amersham Pharmacia树脂倾入XK 50TM柱中)结 合,并且在Na乙酸盐pH6.0中0-400mM NaCl的梯度过程中洗脱。用 在Na乙酸盐pH6.0中的1M NaCl从柱中去除污染蛋白质。来自Q SEPHAROSETM的淀粉酶洗脱用SDS PAGE和活性测定进行追踪,并且 使用BODIPY-淀粉作为底物。运行多次纯化以获得足够的蛋白质,以 符合约1g的需求。将来自这些运行的纯化级分合并在一起,且通过搅 拌细胞浓缩器进行浓缩。
SEQ ID NO:48:将表达SEQ ID NO:48的巴斯德毕赤酵母培养物 的24g冻干上清液悬浮于20mL 50mM碳酸缓冲液pH 10.0;100mM NaCl中,并且用冷乙醇进行沉淀。将沉淀的团块重悬于约20mL 50mM 乙酸盐缓冲液pH 5.2;500mM NaCl中,并且针对50mM苹果酸缓冲 液pH 3.5;500mM NaCl透析O/N。蛋白质在50mM苹果酸缓冲液pH 3.5; 500mM NaCl中与100mL琼脂糖-直链淀粉(NEB)柱结合,并且用 在50mM碳酸盐pH 10.0;50mM NaCl中的0.5%玉米糊精洗脱。用 在50mM磷酸钠缓冲液pH 7.5;100mM NaCl从柱中去除污染蛋白质。 来自琼脂糖-直链淀粉的葡糖淀粉酶洗脱用SDS PAGE进行追踪。
本发明的其他酶包括示例性酶可以使用这些方案或其变化或类似 方案进行纯化。
图26举例说明概括用于示例性SEQ ID NO:4、SEQ ID NO:18、 SEQ ID NO:26的这些纯化方案的效率,和尤其是比较纯化和未纯化 酶对于粗淀粉和可溶性淀粉的相应活性数据的表。
示例性SEQ ID NO:52和SEQ ID NO:26的纯化酶制剂就活性(水 解活性)在粗淀粉制剂中进行分析;概括了关于纯度(通过密度计分 析测定)、浓度、量和贮存缓冲液的这个数据。
  SEQ ID NO:52   SEQ ID NO:48   类别   α-淀粉酶   葡糖淀粉酶   贮存缓冲液   GMP*   GMA**   浓度   25mg/ml   25mg/ml   送出的体积   40ml   20   总量   1.0g   0.5g   纯度   >90%   >95%
*GMP-20%葡萄糖;0.1%对羟基苯甲酸甲酯,PBS pH 7.0
**GMA-20%葡萄糖;0.1%对羟基苯甲酸甲酯;50mM乙酸钠pH 5.2;100mM NaCl。
实施例19:用于液化淀粉和测量结果的示例性方案
下述实施例描述了使用例如本发明的酶用于液化淀粉的示例性方 案。反应条件:100mM PO4pH 6.5,1%(w/w)液化淀粉DE 12在 55℃下。进行TLC和HPLC测定以验证活性。
关于液化淀粉在pH 6.5下的糖化的示例性方案:
·将液化淀粉的pH调整至在其下执行糖化的pH。在具有 100mM磷酸钠盐的100mM乙酸钠缓冲液,pH 4.5中的液化淀粉这样 添加,使得在糖化前,pH可以调整至pH 6.5。
·将5克液化淀粉样品称重到配衡瓶内。
·使用0.04%(w/w)OPTIDEX L-400或约400mL1-10 稀释的原种OPTIDEX L-400/100克液化淀粉。
·计算400mL1-10稀释的原种OPTIDEX L-400中包含的 OPTIDEX L-400毫克。接下来,计算给出与OPTIDEX L-400相同的 酶浓度所需的裂解产物体积。
·将酶加入液化淀粉样品中且在所需温度(50℃)下温 育。在18小时后,测定DE且制备样品用于HPLC分析。
示例性DE测定:
示例性新亚铜试剂测定:
可以将100ml样品加入2.0ml新亚铜试剂溶液A(40g/L碳酸钠、 16g/L甘氨酸、0.45g/L硫酸铜)中。向其中可以加入2.0ml新亚铜 试剂溶液B(1.2g/L新亚铜试剂盐酸盐-Sigma N-1626)。可以使管混 合且在沸水浴中加热12分钟;冷却,用DI水稀释至10ml体积,并且 在分光光度计上读出在450nm处的OD。根据同时运行的0.2mg/ml葡 萄糖标准的应答,可以推断在样品中的葡萄糖当量。
示例性HPLC分析:
糖化碳水化合物谱通过HPLC(以银形式的Bio-Rad Aminex HPX-87A柱,80℃)使用折射率检测进行测量。移动相是以0.7ml/ 分钟的流速使用的过滤Millipore水。糖化样品用酸化DI水(5滴6M HCl加入200mL DI水内)稀释1-10,随后通过0.45mm注射器式滤 器进行过滤。注入体积是20uL。
示例性TLC:
反应产物在以小时计的时间点上w/d,并且在TLC平板上点样且 干燥。平板随后可以溶解于10∶90水∶异丙醇中,且用香草醛染剂或 CAM染剂进行显现,随后加热以显示还原糖。在其中观察到活性的情 况下,液化淀粉可以部分水解成葡萄糖。
实施例20:使用葡糖淀粉酶的淀粉液化
这个实施例描述了使用本发明的淀粉酶和/或葡糖淀粉酶用于液 化淀粉的本发明的示例性方法。葡糖淀粉酶浓缩物可以由发酵液进行 制备,通过热处理、细胞洗涤、使用微量过滤和超滤的碱性提取(48 %总体得率)。UF浓缩物可以用乙酸进行中和,且用30%甘油在pH 4.5 下进行配制。商业产品的活性水平可以是约120U1/g 0.5kg/吨淀 粉。
示例性葡糖淀粉酶活性测定
包含含有5mM PNP-α-D-己-(1→4)-吡喃葡萄糖苷的950μ L 50mM MOPS pH 7.0的1mL比色皿置于预热至80℃的Beckman DU-7400 分光光度计的Peltier控温仪中。分光光度计在405nm处成为空白, 且将50μL酶溶液加入比色皿中,充分混合,并且经过1分钟间隔监 控OD405nm中的增加。根据50μL1μmole/mL PNP在950mL 50mM MOPS 中在pH 7.0-80℃下的OD405nm应答,将ΔOD405nm/分钟比转变成μmole/分 钟的标准单位。热稳定α淀粉酶(DTAA)的1个标准单位等价于在限 定测定条件下催化1μmole/mL/分钟pNP的释放的酶量。
标准葡糖淀粉酶活性测定
包含含有5mM PNP-α-D-吡喃葡萄糖苷的950μL 50mM MOPS pH 7.0的1mL比色皿置于预热至60℃的Beckman DU-7400分光光度计的 Peltier控温仪中。分光光度计在405nm处成为空白,且将50μL酶 溶液加入比色皿中,充分混合,并且经过1分钟间隔监控OD405nm中的 增加。根据50μL1μmole/mL PNP在950mL 50mM MOPS中在pH 7.0 -60℃下的OD405nm应答,将ΔOD405nm/分钟比转变成μmole/分钟的标准单 位。葡糖淀粉酶(DGA)的1个标准单位等价于在限定测定条件下催化 1μmole/mL/分钟pNP的释放的酶量。
右旋糖当量测定
新亚铜试剂测定法可以用于测定DE。可以通过上文描述的操作和 通过GPC分析员使用GPC Fehlings操作测量所选择的样品。
新亚铜试剂测定
将100μl样品加入2.0ml新亚铜试剂溶液A(40g/L碳酸钠、16g/L 甘氨酸、0.45g/L硫酸铜)中。向其中加入2.0ml新亚铜试剂溶液B (1.2g/L新亚铜试剂盐酸盐-Sigma N-1626)。使管混合且在沸水浴 中加热12分钟;冷却,用DI水稀释至10ml体积,并且在分光光度计 上在450nm处OD读数。根据同时运行的0.2mg/ml葡萄糖标准的应答, 推断在样品中的葡萄糖当量。
淀粉样品用DI水稀释~1至16,其中记录确切稀释度。将10毫 升稀释样品加入20mls DI水中。将10毫升Fehlings溶液A和B加 入稀释淀粉中。使样品煮沸3分钟且在冰上冷却。加入10毫升30% KI和10ml 6N H2SO4。溶液针对0.1N硫代硫酸钠进行滴定。记录滴定 剂体积且用于计算DE。
残留淀粉测定
糖化后样品可以使用Staley碘操作就残留淀粉进行检查。
将20克样品称重到大重量皿内。将45μL碘溶液加入重量皿中, 并且使淀粉溶液充分混合。深蓝色指示淀粉的存在,淡蓝色-绿色指示 少量淀粉,淡绿色指示痕量淀粉,和黄色红色,不存在淀粉。碘溶液 通过使21.25克碘和40.0克碘化钾溶解于1升水中进行制备。
寡糖谱
液化和糖化碳水化合物谱通过HPLC(例如以钙形式的AMINEX HPX-87CTM柱(Bio-Rad)-80℃)使用示差折光检测进行测量。
凝胶渗透层析
分子量分布可以通过层析进行测定,例如在PL AQUAGEL-OHTM column上,伴随通过折射率(Waters Model 2410)的质量检测。Model T60(Viscotek)检测器用于连续粘度和光散射测量。
毛细管电泳
Beckman Coulter P/ACE MDQ Glycoprotein System-在熔凝 石英毛细管上分离APTS衍生寡糖-通过激光诱导荧光的检测。
初级液化
将直接来自GPC过程的线淀粉抽吸到60升进料罐内,其中pH、 DS(干物质)和钙水平可以在液化前进行调整。将葡糖淀粉酶加入浆 中。32%DS浆通过正排量泵以0.7升/分钟抽吸到喷嘴增压混合 室,其中淀粉浆通过蒸汽注入即时加热至超过100℃。凝胶化的部分 液化淀粉通过管道网络(仍在压力下)抽吸,以给出在温度下的所需 采样时间(5分钟)。将压力释放到闪蒸罐内且可以获得样品。样品 一式两份地获得。
次级液化
将液化淀粉收集到1升玻璃瓶中,且在95℃下的水浴中保持90 分钟。
糖化
使液化淀粉冷却至60℃,pH调整至4.5,并且用葡糖淀粉酶处理 样品。糖化过程可以随着时间过去通过HPLC进行监控。
糖化
紧接着在90分钟次级液化后用6N HCl将由每种淀粉酶产生的液 化糖浆调整至约pH 2.5,以灭活任何残留葡糖淀粉酶。糖浆随后调整 至pH 4.5,置于60℃水浴中,并且用3个葡糖淀粉酶水平进行糖化。 糖化程度通过HPLC在18-88小时时间点上进行监控。
液化糖浆用标准剂量-0.04%双倍强度葡糖淀粉酶-和2个较低 剂量(50%和25%)进行糖化,以监控糖化过程中的任何差异。
糖化进展-右旋糖发展%对时间-0.04%葡糖淀粉酶。
实施例21:示例性淀粉液化过程
这个实施例描述了本发明的示例性淀粉液化过程,包括使用本发 明的酶。淀粉转变成葡萄糖可以通过2种酶的顺次作用进行催化:淀 粉酶(例如α-淀粉酶),包括本发明的酶,以液化淀粉(例如,高分 子量葡萄糖聚合物通过本发明的葡糖淀粉酶水解成包含2-20个单糖 单位的寡糖,一般是10-12右旋糖当量),随后为用葡糖淀粉酶(其 可以是本发明的葡糖淀粉酶)糖化。在一个方面,加工在玉米湿研磨 植物中,产生具有pH约4.0-4.5的淀粉浆。在一个方面,pH在液化 前升高至例如5.8-6.0,以适应具有低pH活性和稳定性的葡糖淀粉酶。 在一个方面,本发明的淀粉酶和/或葡糖淀粉酶可以在pH 4.5下使淀 粉液化成12-18的右旋糖当量;在一个方面,使用在约3-6克/吨淀粉 水平下的本发明的葡糖淀粉酶。在这个方面,本发明的葡糖淀粉酶的 使用使得淀粉液化能够在pH 4.5下进行。
在一个方面,淀粉液化在pH 4.5下在105℃下进行5分钟,至在 95℃下90分钟,使用本发明的葡糖淀粉酶。酶量可以进行调整,以便 使液化后的靶DE 12调整至15。在一个方面,液化淀粉随后用葡糖淀 粉酶,例如曲霉菌属葡糖淀粉酶,在约pH 4.5和60℃下糖化约48小 时。如果糖化糖浆不包含至少95%葡萄糖,那么靶液化DE升高且糖 化重复,直至液化最终的确产生包含超过95%葡萄糖的糖化糖浆。产 生用于糖化的合适液化原料所需的葡糖淀粉酶蛋白质通过PAGE进行 测定。
实施例22:起因于模拟胃液(SGF)测试中的蛋白酶蛋白酶解的 肽的鉴定
这个实施例描述了起因于本发明的示例性酶SEQ ID NO:52(例 如由SEQ ID NO:51编码)的胃蛋白酶蛋白酶解的小肽的鉴定。这个 实施例还描述了本发明的示例性酶在体外“模拟胃液”(SGF)测试中 的活性评估。SGF测试显示所有酶由胃蛋白酶快速消化。在一种情况 下,在处理60分钟后,观察到小胃蛋白酶抗性片段。
图21为SDS PAGE,其举例说明显示SEQ ID NO:52在pH 1.3 下经由胃蛋白酶的蛋白酶解结果(体外可消化性,SGF测试);胃蛋 白酶在Lys(K)和Phe(F)残基的C末端处切割(上箭头指示36.5K 条带,中箭头指示5K条带(参见下文讨论),和下箭头指示3K条 带)。使用来自Invitrogen的SEEBLUE PLUS2TM预染色标准,和来自 Invitrogen的MARKER12。所有样品在16%Tricine凝胶上电泳。 在所有测试中存在的共同条带是胃蛋白酶。
图22举例说明SEQ ID NO:52的这种消化中产生的肽的表征,如 使用LC MS/MS(液相层析/质谱法/质谱法)分析鉴定的;鉴定了N联 糖基化位点。
图23A举例说明所使用的小肽分离方案(用于SEQ ID NO:52经 由胃蛋白酶的蛋白酶解产生的肽)。图23B在下文讨论,且举例说明 小肽分离方案的SDS PAGE结果,其中泳道1仅是胃蛋白酶,泳道2 是未消化的淀粉酶SEQ ID NO:52,泳道3是由胃蛋白酶消化的淀粉 酶SEQ ID NO:52,泳道4是30kd截止顶端,如图23A中举例说明 的,泳道5是30kd流出,如图23A中举例说明的,泳道6是由C18RP (C18反相柱层析)捕获的样品,如图23A中举例说明的。
图23C举例说明C18RP洗脱级分的LC/MS谱,且在下文讨论。
图23D举例说明通过LCMS/MS分析鉴定的肽的序列;图23E和图 23F举例说明在序列输出中的“Asn-Xaa-Ser/Thr”sequins(基序) (以蓝色突出显示);预测为N联糖基化的天冬酰胺以红色突出显示。
体外可消化性测定:所测试酶中的任何一种的非全长形式在SGF 处理后通过SDS-PAGE进行检测,指出胃蛋白酶已消化每种全长蛋白 质;在SGF处理60分钟后,在α-淀粉酶SEQ ID NO:52的消化物中 观察到大小约6kDa的小蛋白酶解片段(参见实施例22中的讨论)。
在胃蛋白酶处理后的活性测试:为了确定在胃蛋白酶处理后是否 存在任何残留活性,修饰SGF测试,并且用糊精作为关于葡糖淀粉酶 的底物和BODIPY-淀粉作为关于α-淀粉酶的底物来执行活性测试。在 SGF处理60分钟后,对于所测试酶中的任何一种未观察到残留活性。 活性的丧失由测试蛋白质(例如SEQ ID NO:4、SEQ ID NO:76和SEQ ID NO:2)的胃蛋白酶消化,在低pH反应条件下酶的灭活或两者引起。
为了鉴定在SDS-PAGE上以5kDa范围移动的胃蛋白酶抗性肽条 带,通过在30kDa滤膜上过滤样品来浓缩小肽。流出使用C18固相萃 取柱进行进一步纯化。回收的肽随后通过Edmond降解N末端测序、 LC-MS和LC串联质谱法进行分析,以测定肽序列。通过LC串联质谱 法分析的样品首先用胰蛋白酶进行处理。
肽纯化:为了测定5kDa肽条带的序列,经由首先使胃蛋白酶处 理的SEQ ID NO:52反应经过30kDa滤膜来浓缩肽。流出随后使用 C18固相萃取柱进行纯化。回收的肽在SDS-PAGE上形成在5kDa范围 处的条带。图23B举例说明胃蛋白酶抗性α-淀粉酶SEQ ID NO:52 肽的SDS-PAGE分析。这种凝胶进行考马斯染色。泳道1是胃蛋白酶。 泳道2是淀粉酶SEQ ID NO:52。泳道3是用胃蛋白酶处理的淀粉酶 SEQ ID NO:52。泳道4与泳道3相同,其未流过30kDa滤膜。泳道 5是在经过30kDa滤膜后泳道3中的样品流出。泳道6是在由C18固 相萃取柱回收后的样品5。
为了测定回收样品中的肽质量,在C18固相萃取柱上通过LC-MS 分析来分析肽。这种样品的m/z谱显示存在这种样品中呈现的各种m/z 值的多重质量,如图23C中淀粉酶SEQ ID NO:52小肽的LC-MS分析 举例说明的。固相是C18RP材料。5%-80%ACN梯度(15-90分钟) 用作实验中的移动相。
Edmond降解N末端测序:为了测定SEQ ID NO:52小肽的序列, 纯化的肽送出用于使用Edmond降解法的N末端测序。关于这个分析的 结果是非结论性的,因为许多不同氨基酸在每个切割步骤时释放。这 个结果与LC/MS分析一致,所述LC/MS分析显示存在这种样品中呈现 的肽的超过一个占优势种类。
LC串联质谱法分析:为了测定淀粉酶SEQ ID NO:52纯化肽级分 中存在的肽的序列,用胰蛋白酶处理这些,并且通过LC MS/MS进行分 析。这个分析导致下述7种肽的鉴定;这些肽序列通过SEQUEST检 索由淀粉酶SEQ ID NO:52小胰蛋白酶肽的LC MS/MS分析进行鉴定。
  肽   肽序列   在SEQ ID NO:52内的残基定位   1   AGQEQHYSGGSDPANR   349-364   2   VFSGDPAYTCPYQN   251-264   3   SGDPAYTCPYQN   253-264   4   SLLLLLSVFGQATHA   6-20   5   YENTGDGTSYHG   90-101   6   VYCGGSWQGIINHLD   56-70   7   GYSAGATLVETYTCT   448-462
还测定在LC-MS谱中存在许多肽峰,其MS/MS谱既不匹配SEQ ID NO:52,也不匹配数据库中的其他肽。关于这点的一个可能原因可以 是在宿主生物巴斯德毕赤酵母中发生的亲本蛋白质的复杂N联糖基化 修饰。为了检验这个假设,所提取的肽首先用PNGase F进行处理,以 去除其N联糖基基团。所得到的肽随后进行胰蛋白酶处理,并且实施 LC MS/MS分析,以测定其肽组成。这个发现确定存在样品中呈现的至 少6个不同肽种类(参见上表概括)。去糖基化处理后这些肽的分辨 暗示这些肽是在样品中糖基化的其他肽的部分。
总的来说,N末端测序和LC-MS分析显示,起因于淀粉酶SEQ ID NO: 52的胃蛋白酶消化的5KDa肽条带由许多不同肽种类组成。这大部分 是由于淀粉酶SEQ ID NO:52经由胃蛋白酶的不完全消化,部分是由 于这些肽的糖基化状态。因此,在MS谱中不存在一个占优势的肽种类
存在多种肽;多个不同肽种类在样品中进行测序;N末端测序也提 供了关于多种肽存在的证据;存在仅在样品的PNGase F去糖基化后出 现的一个肽种类,暗示糖基化相关事件负责这种肽的出现。
这个示例性系列方案可以对本发明的任何多肽使用,例如本发明 的示例性序列,以测定序列、基序,包括糖基化基序、活性位点等。
实施例23:低温活性淀粉酶
这个实施例描述了制备且表征本发明的示例性酶SEQ ID NO: 56,SEQ ID NO:52;SEQ ID NO:62;SEQ ID NO:70,其在低温下 有活性,包括具有在低温下水解淀粉的能力。这个实施例还描述了本 发明的酶混合剂的开发,其在酵母的存在下在约30-40℃和约pH 3.5-pH 5.5下,在至多60小时中可以将研磨玉米中>95%的淀粉水 解成可发酵糖。在一个方面,所需酶蛋白质的总量不超过50克/吨玉 米,例如在可替代实施方案中,0.05%w/w、或0.005%w/w、或在0.05 %w/w-0.005%w/w范围中的任何地方。
测定关于淀粉水解的起始反应速率;并且研究在不同范围下例如 在约pH 3.5-7.0范围中的pH,和在不同范围下例如在约30-40℃范 围中的温度,对本发明酶的活性的影响;还测定本发明的示例性淀粉 酶和/或葡糖淀粉酶的键类型特异性。
方法:
1.蛋白质浓度的测定
表达葡糖淀粉酶和α-淀粉酶的巴斯德毕赤酵母培养物的冻干上 清液以~10mg粉末/ml的浓度悬浮于水中。在通过Br adford方案测 定蛋白质含量后,5μg蛋白质样品和标准化BSA溶液在4-20%Tris- 甘氨酸梯度凝胶上进行电泳。在考马斯蓝染色后,凝胶在BioRad GS800
凝胶扫描仪上进行扫描。Bio-Rad QUANTITY ONE软件用于BSA和 葡糖淀粉酶(或α-淀粉酶)条带的定量,然后计算实际酶浓度。相应 调整蛋白质浓度且通过另外的SDS PAGE加以证实。
2.起始反应速率的测定。
除非另有说明,测定在37℃和pH 5.0下在缓冲液(50mM NaCH3CO2、 10mM CaCl2;10mM NaN3和0.01%Triton X-100)中一式三份地进行, 所述缓冲液包含1%粗淀粉、或0.5%糊精或1%“可溶性玉米淀粉”。 测定对于葡糖淀粉酶以0.5ml规模和对于α-淀粉酶(α-淀粉酶)以 0.25ml规模在Eppendorf台式培养箱中进行,伴随恒定振荡(800 rpm)。
对于葡糖淀粉酶,通过将酶(终浓度0.25μg/ml)加入反应混 合物中起始反应。在0、2.5、5、7.5、10、15、20和30分钟时,取 出50μl反应等分试样,且通过加入100μl 1M Tris缓冲液,pH 7.5 中得到猝灭。对于α-淀粉酶(α-淀粉酶),通过将酶(对于SEQ ID NO:56、13434和SEQ ID NO:52终浓度0.4μg总蛋白质/ml;对于 SEQ ID NO:622μg/ml;对于SEQ ID NO:704μg/ml)加入反应混 合物中起始反应,并且在2、5、10、15、20、25、30和40分钟时, 取出10μl反应等分试样,且在BCA试剂中得到猝灭。对于温度谱的 测定,在30、34、37和40℃下进行测定。
pH对葡糖淀粉酶和淀粉酶活性的影响在pH 3.5、4、5、6和7下 进行评估,使用广pH范围Britton-Robinson缓冲液(50mM CH3COOH; H3PO4;H3BO3)。还在50mM乙酸盐缓冲液的存在下执行在pH 4、5和6 下的平行反应,以确保所使用的缓冲液不影响结果。对于2种钙依赖 性α-淀粉酶(α-淀粉酶)SEQ ID NO:56和SEQ ID NO:62的pH谱 测定,使用苹果酸/乙酸盐/MES缓冲液代替Britton-Robinson。
制备“可溶性玉米淀粉”用于与α-淀粉酶反应。由于高还原末端 背景,糊精(Sigma D2006)不能在BCAα-淀粉酶反应中用作底物。 因此采用加热的玉米淀粉(Syngenta材料)作为底物。使2%玉米淀 粉溶解于去离子水中,并且在沸水浴中伴随混合加热30-40分钟,直 至淀粉已溶解,和溶液看起来呈乳状,但半透明。加热淀粉溶液使用 2天,这之后观察到某些凝沉标记(淀粉凝块的出现),并且弃去溶 液。
3.用于定量在淀粉水解过程中释放的葡萄糖的葡萄糖氧化酶/ 过氧化物酶(GO)测定
偶联的葡萄糖氧化酶/过氧化物酶(GO)测定用于测定在淀粉水解 过程中由葡糖淀粉酶释放的葡萄糖量。在黑色Nunc 96孔平板中,通 过将10μl猝灭的淀粉水解反应加入90μl PBS来起始GO反应,所 述PBS包含葡萄糖氧化酶(0.1U/ml)、过氧化物酶(0.25U/ml)和 0.05mM Amplex Red。在荧光平板阅读器上用Ex/Em 545/590nm读 数前,平板在室温下在黑暗中放置30分钟。具有0-100μM葡萄糖浓 度的标准曲线用于评估水解反应中产生的葡萄糖量。淀粉水解的起始 速率(由1%颗粒状淀粉释放的nmols葡萄糖/分钟/μg葡糖淀粉酶) 通过下述进行测定:标绘随着时间过去释放的葡萄糖量,且计算通过 时间点的最佳线性拟合的斜率。
4.用于测定在淀粉水解过程中还原末端浓度中的增加的BCA测 定
将10μl等分试样的淀粉酶淀粉水解反应猝灭到100μl BCA试 剂(由64mg/mL一水碳酸钠、24mg/mL碳酸氢钠、1.95mg/mL BCA、 1.24mg/mL硫酸铜五水合物、1.26mg/mL L-丝氨酸组成)内。显色 在猝灭反应于80℃35分钟的温育期间发生,并且随后为在560nm处 的吸光度测定。经过40分钟反应时间计算起始速率。构建使用麦芽糖 (0-54μM)的标准曲线,以使A560nm与所产生的还原糖浓度(nmoles) 相关。比活性表示为nmoles/分钟/μg酶。
5.葡糖淀粉酶用麦芽糖和异麦芽糖作为底物的键类型特异性
通过将酶(对于麦芽糖终浓度5μg/ml,和对于异麦芽糖30μg /ml)加入反应混合物中起始反应。在2、5、10、15、20、25、30和 40分钟时,取出5μl反应等分试样,且通过加入10μl 1M Tris缓 冲液,pH 7.5中得到猝灭。在研究中使用9种底物浓度,对于麦芽糖 为0-12mM,和对于异麦芽糖为2.5-120mM。反应在37℃和pH 5.0 下在缓冲液(50mM NaCH3CO2、10mM CaCl2)中一式三份地进行,以 50ul规模在Eppendorf台式培养箱中,伴随恒定振荡(800rpm)。 在反应结束时使用葡萄糖氧化酶/过氧化物酶(GO)测定来测量葡萄糖 生产。
结果
1.葡糖淀粉酶的表征:
1.1起始反应速率:关于颗粒状和可溶性淀粉水解的起始速率在 表2中呈现,在图24中举例说明。如由表2可见的,当与基准黑曲霉 酶比较时,本发明的淀粉酶和/或葡糖淀粉酶显示针对颗粒状淀粉高达 3x更佳的活性(SEQ ID NO:48),对于可溶性淀粉具有相似或略微 更佳的活性。SEQ ID NO:20看起来在测试条件下不显示针对颗粒状 淀粉的任何活性(可能是由于缺乏淀粉结合结构域)。表2(图24) 概括在37℃、pH 5.0下比较经由本发明的示例性酶(包括具有葡糖淀 粉酶活性的那些)和基准酶黑曲霉葡糖淀粉酶的颗粒状玉米淀粉和可 溶性淀粉(糊精)的起始速率数据;起始速率表示为由1%颗粒状淀 粉或由0.5%糊精释放的nmols葡萄糖/分钟/μg葡糖淀粉酶蛋白质。 每个数值是来自6-10个数据点的平均值。
1.2温度谱:测定温度对本发明的示例性酶包括葡糖淀粉酶对于 作为底物的颗粒状淀粉的影响;使用“基准”酶,商购可得的黑曲霉 葡糖淀粉酶。在pH 5.0下30、32、34、36、38和40℃测量葡萄糖释 放。葡糖淀粉酶活性随着温度增加;它们在40℃下最有活性,但在30 ℃下保留约50%的峰活性。
图25举例说明用可溶性淀粉(糊精)作为底物,温度对示例性葡 糖淀粉酶SEQ ID NO:20和黑曲霉“基准”的影响。在pH 5.0下在所 示温度下测量葡萄糖释放。
1.3pH谱:分别用颗粒状和可溶性淀粉测试pH对淀粉水解的影 响。所有葡糖淀粉酶在较低pH下最好地水解2种底物,其中示例性 SEQ ID NO:26在特征方面是最酸性的。对于2种底物,在37℃下在 所示pH下测量葡萄糖释放。经过20分钟计算起始速率且转变成最高 速率百分比。
1.4键类型切割活性:对于7种所选择的葡糖淀粉酶和“基准” 黑曲霉葡糖淀粉酶测定关于麦芽糖(α-1,4-键)和异麦芽糖(α-1,6- 键)水解的动力学参数。用冻干的巴斯德毕赤酵母裂解物进行实验, 并且蛋白质未进行纯化;因此在本文中报告仅不依赖蛋白质浓度的数 据。下表3概括了关于麦芽糖和异麦芽糖的KM值,以及与关于异麦芽 糖的kcat/KM比较的关于麦芽糖的kcat/KM比。对于黑曲霉葡糖淀粉酶测 定的这些参数与公开数据良好一致;例如关于麦芽糖的KM报告为1.2 -2.1mM;关于异麦芽糖的KM报告为19.8-42.0,和关于麦芽糖的 kcat/KM超过关于异麦芽糖的kcat/KM报告为300-600,根据Frandesen (1995)Biochemistry.34:10162-10169;Sierks和Svensson(1996) Biochemistry 35:1865-1871;Fagerstrom和Kalkkinen(1995) Biotechnol.Appl.Biochem.21:223-231。
表3概括关于经由本发明的7种示例性葡糖淀粉酶和“基准”黑 曲霉葡糖淀粉酶的麦芽糖和异麦芽糖水解的动力学参数;每个数值是 来自5次不同实验的平均值:
表3

如由表3可见的,示例性葡糖淀粉酶SEQ ID NO:20对于麦芽糖 选择性最强,并且相对于α-1,6-键,具有针对α-1,4-键将近900倍 更高的特异性。选择性最少的葡糖淀粉酶是SEQ ID NO:14,相对于 α-1,6-键,具有针对α-1,4-键~100倍更高的特异性。
实施例24:本发明的α-淀粉酶和/或葡糖淀粉酶的表征
这个实施例描述了本发明的α-淀粉酶和/或葡糖淀粉酶的表征。
起始反应速率:经由八(8)种示例性α-淀粉酶的颗粒状和可溶 性淀粉水解的起始速率与来自米曲霉(A.oryzae)的“基准”α-淀 粉酶进行比较,并且结果概括于下表4中。由于用来自Sigma(A6211) 的米曲霉α-淀粉酶在BCA测定中可见的相对高本底,还评估来自 Megazyme(E-ANAAMTM)的相同淀粉酶的第二种制剂。用2种制剂获 得的结果非常相似。如由表34可见的,当与颗粒状淀粉比较时,测试 的所有淀粉酶显示出针对可溶性淀粉显著更高的活性。然而,这种差 异对于本发明的示例性淀粉酶和/或葡糖淀粉酶比对于“基准”米曲霉 酶更不明显。
表4显示比较在37℃和pH 5下,经由八(8)种本发明的示例性 α-淀粉酶和/或葡糖淀粉酶的颗粒状玉米淀粉和可溶性玉米淀粉水解 的起始速率数据(注:对于SEQ ID NO:56、SEQ ID NO:62、SEQ ID NO:2和SEQ ID NO:52,*起始速率表示为由1%淀粉释放的nmols 还原末端/分钟/μg α-淀粉酶蛋白质;对于SEQ ID NO:70、SEQ ID NO:66和SEQ ID NO:76,**起始速率表示为由1%淀粉释放的nmols 还原末端/分钟/μg总蛋白质;每个数值是来自5个数据点的平均值:
表4


温度谱:测定温度对经由表征的α-淀粉酶的淀粉水解的影响。 在pH 5.0下在40分钟温育期间在所示温度下测量活性,并且计算起 始速率且针对时间进行标绘。淀粉酶活性受温度影响至不同程度。本 发明的5种示例性淀粉酶和/或葡糖淀粉酶SEQ ID NO:56、SEQ ID NO: 70、SEQ ID NO:76和SEQ ID NO:66,在40℃下最有活性,并且在 30℃下保留约30%的活性。SEQ ID NO:2、SEQ ID NO:52和SEQ ID NO:62的活性仅在边上受超过研究范围的温度中的改变的影响。
pH谱:用颗粒状和可溶性淀粉底物测试pH对本发明的示例性淀 粉酶和/或葡糖淀粉酶对于淀粉水解的影响,并且测定结果。在37℃ 下在所示pH下测量还原末端中的增加。经过40分钟计算起始速率且 转变成最高速率百分比。示例性SEQ ID NO:52(最初真菌起源)具 有最低pH最适条件(约pH 4)。另一种示例性酶SEQ ID NO:2(同 样最初真菌起源)也显示对于酸性pH的优先,具有在约pH 4.5-5 下的表观最适条件。示例性淀粉酶SEQ ID NO:66(最初古细菌起源) 具有约pH 5.0的表观最适条件,在pH 4.0下保留约70%的峰活性。 本发明的其余示例性酶具有pH 5.0-6.0的表观最适条件,并且在pH 4.0和3.5下几乎无活性。
实施例25:本发明的淀粉酶和/或葡糖淀粉酶在宿主细胞中的表 达
这个实施例描述了本发明的示例性酶在不同宿主细胞中的表达评 估;特别地,研究三(3)种示例性淀粉酶在不同表达宿主中的表达: 巴斯德毕赤酵母、多形汉森酵母和异旋孢腔菌。
多形汉森酵母:使用2种表达载体(Artes Biotechnology GmbH, Erkrath,Germany):具有甲酸脱氢酶启动子的pFPMT-Mfa  和具有 海藻糖-6磷酸盐合酶启动子的pTPS1-MfaTM。在2种载体中,所使用 的分泌信号是来自酿酒酵母的交配因子MFa1的前原序列 (pre-prosequence)。
通过电穿孔将具有亚克隆的淀粉酶基因的质粒引入多形汉森酵母 感受态细胞内。选择来自每次转化的96个菌落,并且在液体培养基 (YNB-葡萄糖)中在选择条件下,通过各种传代培养步骤生长约30(3 次传代)-80(8次传代)代。这些步骤允许增加拷贝数且促进质粒整 合到染色体内。这些3或8次传代步骤后,转化株在非选择性条件下 (YPD培养基)中进行培养,以测试质粒稳定性(任何非整合质粒的 丧失)。关于阳性克隆的选择在红色淀粉-琼脂平板上进行。选择具 有比对照(在巴斯德毕赤酵母中表达的相同基因)亮区更大的克隆作 为初步命中。通过在BODIPY-淀粉底物上测定培养上清液来证实通过 所选择克隆的淀粉酶表达,并且SDS PAGE用于显现所产生的蛋白质。 制备1L培养物用于进一步测试。
异旋孢腔菌。将来自异旋孢腔菌的淀粉酶的cDNA和gDNA亚克隆 到pCh-ubi(泛素启动子)和pCh-GPD(GPD启动子)内,并且使用线 性化构建体DNA,通过PEG介导的原生质体转化靶向异旋孢腔菌的C5 菌株的PKS18基因座。构建体之一,在ubi(泛素)启动子下的基因 组形式,也引入在其中编码淀粉酶基因已缺失的JMD3菌株内。类似地, 如在巴斯德毕赤酵母的情况下,在红色淀粉平板上进行转化株的筛选, 并且通过BODIPY-淀粉测定和SDS PAGE用培养上清液加以证实。在 cDNA和基因组形式之间的表达中未观察到差异。类似地,用2种不同 启动子未观察到显著差异。
结果:构建用于比较的,表达3种示例性淀粉酶编码和葡糖淀粉 酶编码基因的多形汉森酵母和异旋孢腔菌,加上3种原始巴斯德毕赤 酵母菌株。用于比较的所有菌株和用这些菌株获得的预备发酵得率呈 现于表5中,概括在毕赤酵母属中产生的本发明的示例性淀粉酶和/ 或葡糖淀粉酶的估计表达得率(g/L):
表5
  淀粉酶基因的起源   巴斯德毕赤酵母   真菌   SEQ ID NO:2   0.01*   细菌   SEQ ID NO:70   0.07*   古细菌   SEQ ID NO:66   0.13*
*发酵得率
在表达评估后,在颗粒状淀粉水解测定中比较蛋白质纯度、比活 性和性能。这些比较导致下述结论:
·在不同宿主中表达的酶之间未观察到显著生物化学差异。
·在汉森酵母属中的表达看起来未导致超过在巴斯德毕赤酵母中 观察到的表达的改善。此外,所表达的蛋白质看起来是高度糖基化的。
实施例26:使用本发明的淀粉酶的粗淀粉发酵
这个实施例描述了使用本发明的淀粉酶用于粗淀粉发酵的示例性 方法。
最初鉴定由八(8)种α-淀粉酶和七(7)种葡糖淀粉酶组成的十 五(15)种示例性酶。基于在30℃-40℃、pH 3.5-7.0下和1%粗 淀粉水解的活性,测定“前导”示例性酶。未纯化的微生物酶首先就 蛋白质量和表达比分析;并且随后在粗淀粉发酵中进行评估。随后测 定酶总载量和α-淀粉酶与葡糖淀粉酶的比。
注:对于粗淀粉发酵工作,通过在巴斯德毕赤酵母中表达获得所 有酶,除了在荧光假单胞菌中表达(例如,如JBC,2002,277(29): 26501-26507中所述的)的SEQ ID NO:78(例如由SEQ ID NO:77 编码)。
表1.1.“前导”示例性α-淀粉酶和葡糖淀粉酶的酶表达和相 对纯度
  酶***   蛋白质/粉末   (g/g)*   表达比**   SEQ ID NO:56   0.12±0.42   0.6   SEQ ID NO:52   0.09±0.003   0.6   SEQ ID NO:66   0.05±0.005   0.1(0.5****)   SEQ ID NO:66   0.05   0.1(0.5****)   SEQ ID NO:66   0.059±0.002   0.5****   SEQ ID NO:66   0.085   0.5****   SEQ ID NO:2   0.03±0.005   0.3   SEQ ID NO:2   0.03±0.002   0.3   SEQ ID NO:70   0.09±0.003   0.05(0.25****)   SEQ ID NO:70   0.126±0.002   0.25****   SEQ ID NO:70   0.131   0.25****   SEQ ID NO:62   0.2±0.03   0.75   SEQ ID NO:78   10(mgs/ml)   0.25   SEQ ID NO:76   0.1±0.01   0.2   SEQ ID NO:26   0.2±0.026   0.8   SEQ ID NO:28   0.15±0.076   0.45   SEQ ID NO:28   0.36±0.042   0.45   SEQ ID NO:18   0.24±0.096   0.8   SEQ ID NO:74   0.21±0.016   0.8   SEQ ID NO:48   0.28±0.098   0.5   SEQ ID NO:20   0.28±0.066   0.7   SEQ ID NO:14   0.21±0.155   0.2   对照(空载体)   0.0063
*蛋白质含量使用Bradford的方案进行测定。
**表示为在澄清裂解产物中的总蛋白质百分比;使用5μg蛋白 质载量和Bio-Rad Quantity One软件通过SDS PAGE测定的。
***其中酶在这个列表中出现数次,使用不同批次。
****在去糖基化后的值。
实验方法
粗淀粉发酵
所有发酵使用通过0.5mm筛的Yellow Dent II玉米来完成,所 述Yellow Dent II玉米以12,000rpm在Ultra Gentrifugal Mill by Glen Mills上磨碎。玉米粉在Mettler HB-43TM测湿度天平上进行 分析,以测定含湿量,然后将10g干重玉米粉分派到具有搅拌棒的 50ml烧瓶内。然后加入水,随后加入四环素(0.5mg)、H2SO4(175 μl 0.9M溶液)、未纯化/纯化的酶原种和酵母,以使总浆达到33 %总固体。在30℃中将烧瓶置于搅拌板上72小时。在发酵50或72 小时时获取样品用于分析。Sigma黑曲霉葡糖淀粉酶(A-7095)用作 基准,以2.065单位(约0.707mg总蛋白质,或0.07%总蛋白质载 量)/g dw粉添加,并且基于所表达酶的总重量(g)/发酵中的玉米 粉干重(g)测试酶总载量(%)。
为了分析乙醇含量和糖谱,在50或72小时时从每个烧瓶中获取 1.5ml发酵浆,置于1.8ml微量离心管中,并且以13000rpm向下 旋转5分钟。将上清液倾入0.45μm旋转-x柱内,以7000rpm向下 旋转5分钟,并且将200μl旋转经过等分到HPLC小瓶内,且通过 HPLC进行分析。使用配备有折射率检测器的Waters HPLC。所使用的 柱是Bio-Rad AMINEX HPX-87H(目录#:125-0140)。所使用的移 动相是以0.6mL/分钟的0.005M H2SO4。
标准制备
用于本文描述的分析的标准包含葡萄糖、麦芽糖、麦芽三糖、麦 芽糖糊精、果糖、甘油、乳酸、乙酸、琥珀酸、乙醇和甲醇。制备一 个复合标准,并且随后进行稀释,以产生对于每种化合物建立标准曲 线所需的各种浓度。用于标准制备的所有试剂应贮存于干燥柜中,冷 藏或根据制造商的建议贮存。应采用用于测量组分的最精确方法。向 清洁的干燥100mL容量瓶内加入所有干燥试剂。
·加入~35mL水且使成漩涡,以溶解固体。
·将50mL Falcon管放置在天平上,加入25mL水然后称皮重。
·向水中加入甘油、乙醇、甲醇、乳酸和乙酸。
·轻轻涡旋以混合,并且将内容物加入具有糖溶液的容量瓶中。 使50mL Falcon管漂洗3次,每次用~5mL水,并且将漂洗液加入 容量瓶中。
·使烧瓶的整体体积达到100mL。这个溶液代表混合的20%乙醇 标准。溶液使用Millipore STERIFLIPTM 0.22或0.45μm滤器进 行灭菌。
·这个标准的稀释用于产生混合的5、10和15%乙醇标准。
·混合的5%标准由1份混合的20%标准和3份水组成。
·混合的10%标准是混合的20%标准的简单1∶1稀释。
·3份混合的20%标准和1份水的混合物将产生混合的15%标准。
·应运行经检验的10.3%v/v乙醇标准(Sigma目录#E2385),每 次或每月制备新标准,以验证混合标准组的精确度。
结果
7种α-淀粉酶和葡糖淀粉酶在粗淀粉发酵中以组合进行测试,以 0.001、0.01和0.1%(w/w)的不同酶总载量。测试的α-淀粉酶是 SEQ ID NO:56、SEQ ID NO:70、SEQ ID NO:52、SEQ ID NO:2、 SEQ ID NO:62和SEQ ID NO:66、SEQ ID NO:76。测试的葡糖淀粉 酶是SEQ ID NO:48、SEQ ID NO:26、SEQ ID NO:18、SEQ ID NO: 74、SEQ ID NO:28、SEQ ID NO:14和SEQ ID NO:20。所有组合给 出在实验过程中使用的ID。基于本文提供的表达比信息计算酶总载 量。基于先前数据确定α-淀粉酶与葡糖淀粉酶比。在发酵50或72 小时后通过HPLC分析测量乙醇得率。结果指出所有酶组合产生各种乙 醇水平,并且某些组合优于Sigma GA基准(表1.2)。
表1.2.在发酵50小时后,“前导”示例性α-淀粉酶和葡糖淀 粉酶在粗淀粉发酵中的乙醇得率a。


a在发酵72小时后的乙醇得率。
b酶总载量估计为约0.07%。
实施例27:酶在植物中的表达;粗淀粉发酵
这个实施例描述了本发明的9种示例性酶(不含密码子优化的酶) 的植物表达,和使用植物材料的粗淀粉发酵。
基于微生物酶在粗淀粉发酵中的高乙醇得率,选择五(5)种α- 淀粉酶SEQ ID NO:52、SEQ ID NO:4、SEQ ID NO:70、SEQ ID NO: 66和SEQ ID NO:76,以及4种葡糖淀粉酶SEQ ID NO:48、SEQ ID NO: 18、SEQ ID NO:26和SEQ ID NO:28用于植物表达。用不含密码子 优化的基因序列来进行这种玉蜀黍表达。这个研究的目标是评估这些 酶的潜在表达水平,以及评估这些酶的表达在其发育阶段自始至终是 否对玉蜀黍农业经济学具有不利影响。
实验方法
载体构建
表2.1概括在下文显示的图中用于DNA元件的缩写。
表2.1.在构建图中使用的缩写
  名称   功能   描述   cAMY(SEQ ID NO:   66)-02   CDS   α淀粉酶,SEQ ID NO:66,减去天然前导区,   与靶向质外体的γ玉米醇溶蛋白信号序列附   着   cAmy(SEQ ID NO:   18)-02   CDS   葡糖淀粉酶,SEQ ID NO:18,减去天然前导   区,与靶向质外体的γ玉米醇溶蛋白信号序列   附着   cAmy(SEQ ID NO:   52)-02   CDS   α淀粉酶,SEQ ID NO:52,减去天然前导区,   与靶向质外体的γ玉米醇溶蛋白信号序列附   着   cAmy(SEQ ID NO:   28)-02   CDS   葡糖淀粉酶,SEQ ID NO:28,减去天然前导   区,与靶向质外体的γ玉米醇溶蛋白信号序列   附着   cAmy(SEQ ID NO:   26)-02   CDS   葡糖淀粉酶,SEQ ID NO:26,减去天然前导   区,与靶向质外体的γ玉米醇溶蛋白信号序列   附着   cAmy(SEQ ID NO:   48)-02   CDS   葡糖淀粉酶,SEQ ID NO:48,减去天然前导   区,与靶向质外体的γ玉米醇溶蛋白信号序列   附着   cAmy(SEQ ID NO:   76)-02   CDS   α-淀粉酶,SEQ ID NO:76,减去天然前导区,   与靶向质外体的γ玉米醇溶蛋白信号序列附   着   cAmy(SEQ ID NO:   70)-02   CDS   α-淀粉酶,SEQ ID NO:70,减去天然前导区,   与靶向质外体的γ玉米醇溶蛋白信号序列附   着
下文命名为“15745”的示例性载体是双元载体,其包含α淀粉酶, 示例性SEQ ID NO:70减去其天然前导区。天然前导区由用于靶向质 外体的γ玉米醇溶蛋白信号序列替换。γ玉米醇溶蛋白-SEQ ID NO: 70融合物使用γ玉米醇溶蛋白启动子进行表达。双元载体还包含 Ubi-PMI-Nos盒用于甘露糖选择。
由质粒15649PCR扩增包含氨基酸86-525(加终止密码子)的cAmy (SEQ ID NO:70)-01片段。PCR扩增在片段的5′末端处引入AfeI 位点和3′末端处引入BglII位点。AfeI位点的添加在cAmy(SEQ ID NO: 70)片段(SY1709:92-93)前面添加丙氨酸。将这个PCR扩增子克隆 到pCR2.1-TOPO内且进行测序,以验证新限制酶位点(SY1709: 111-112,122-124)的存在。验证后,经由AfeI/BglII从TOPO主链 中消化cAmy(SEQ ID NO:70)。类似地,用AfeI/BglII消化构建体 15460ZeinAmyVN。将这个主链和cAmy(SEQ ID NO:70)连接在一起。 当连接时,cAmy(SEQ ID NO:70)与信号肽xGZein27ss-01一起保 留在框内,其中仅在克隆接头处添加丙氨酸残基。使用引物 ZeinAmy1199F和prGTL-03R,就淀粉酶基因的存在筛选转化株。阳性 克隆产生~1.6kB(SY1709:130)的扩增子。选择5个克隆,并且用 SanDI和RsrII进行消化,以去除prGZein-01:cAmy(SEQ ID NO: 70):t35s-08。构建体15468用RsrII进行线性化。双元主链和来自 阳性克隆(SanDI/RsrII)之一的消化盒在RsrII限制位点处连接在一 起。转化到Top10细胞内后,使用引物ZeinAmy1199F和Mubi-5 (SY1709:146,150),就盒的存在筛选转化株。选择3个阳性转化株, 并且经由BamHI诊断消化进行检查。这些克隆进行测序(SY1709:162; 2个克隆接头以及整个cAmy(SEQ ID NO:70)编码序列),证实所有 3个在序列中是正确的。
如图28中举例说明的,下文命名为“15750”的示例性载体是双 元载体,其包含葡糖淀粉酶,示例性SEQ ID NO:18减去其天然前导 区。天然前导区由用于靶向质外体的γ玉米醇溶蛋白信号序列替换。 γ玉米醇溶蛋白-SEQ ID NO:18融合物使用γ玉米醇溶蛋白启动子进 行表达。双元载体还包含Ubi-PMI-Nos盒用于甘露糖选择。
由质粒15652PCR扩增包含氨基酸88-712(加终止密码子)的cAmy (SEQ ID NO:18)-01片段。PCR扩增在片段的5′末端处引入AfeI 位点和3′末端处引入BglII位点。AfeI位点的添加导致氨基酸88从 丝氨酸变成丙氨酸(SY1709:113-114,116)。将这个PCR扩增子克隆 到pCR2.1-TOPO内且进行测序,以验证新限制酶位点(SY1709: 116,131)的存在。验证后,经由AfeI/BglII从TOPO主链中消化cAmy (SEQ ID NO:18)。类似地,用AfeI/BglII消化构建体15460ZeinAmyVN。 将这个主链和cAmy(SEQ ID NO:18)片段连接在一起。当连接时, cAmy(SEQ ID NO:18)与信号肽xGZein27ss-01一起保留在框内, 其中仅在克隆接头处添加丙氨酸残基。选择6个克隆,并且用SanDI 和RsrII进行消化,以去除prGZein-01:cAmy(SEQ ID NO:18): t35s-08。构建体15468用RsrII进行线性化。双元主链和来自阳性克 隆(SanDI/RsrII)之一的消化盒在RsrII限制位点处连接在一起。转 化到Top10细胞内后,使用引物ZeinAmy1199F和Mubi-5(SY1709: 181),就盒的存在筛选转化株。此外,选择所有6个转化株,并且经 由SacI诊断消化进行检查。3个阳性克隆进行测序(SY1709:189-190) (2个克隆接头以及整个cAmy(SEQ ID NO:18)编码序列),证实所 有3个在序列中是正确的。
如图29中举例说明的,下文命名为“15751”的示例性载体是双 元载体,其包含葡糖淀粉酶,示例性SEQ ID NO:48减去其天然前导 区。天然前导区由用于靶向质外体的γ玉米醇溶蛋白信号序列替换。 γ玉米醇溶蛋白-SEQ ID NO:48融合物使用γ玉米醇溶蛋白启动子进 行表达。双元载体还包含Ubi-PMI-Nos盒用于甘露糖选择。
使用15651作为模板,在多位点诱变反应(QUICKCHANGE, Stratagene)中使用诱变引物,以去除内部AfeI位点,在5′末端处 引入AfeI位点(突变在信号序列中,无肽改变),且引入外部3’BglII 位点用于克隆。执行限制酶分析,并且选择对于具有去除的内部AfeI 位点和引入的BglII位点阳性的克隆。阳性克隆送出用于序列分析加 以证实。这个克隆DNA随后用作模板用于PCR扩增,以在葡糖淀粉酶 结构域的5′末端处引入AfeI位点。突变在天然信号序列中,并且不 改变葡糖淀粉酶肽序列。PCR产物用AfeI随后用BglII顺次进行消化。 消化产物进行凝胶纯化,并且与15460AmyZeinVN主链连接,产生具有 靶向质外体的γ玉米醇溶蛋白信号序列的cAmy(SEQ ID NO:48)。 这个中间产物载体进行序列验证,然后用SanDI和RsrII顺次进行消 化。这个片段进行凝胶纯化,并且随后连接到用RsrII切割且CIP处 理的15468双元内。阳性克隆进行PCR大小筛选,然后将阳性克隆之 一送出用于连接到双元内的整个片段的序列分析。证实序列。
如图30中举例说明的,下文命名为“15761”的示例性载体是双 元载体,其包含α淀粉酶,示例性SEQ ID NO:66减去其天然前导区。 天然前导区由用于靶向质外体的γ玉米醇溶蛋白信号序列替换。γ玉 米醇溶蛋白-SEQ ID NO:66融合物使用γ玉米醇溶蛋白启动子进行表 达。双元载体还包含Ubi-PMI-Nos盒用于甘露糖选择。
根据Stratagene Quick Change方案,使用定点诱变使包含氨基 酸86-521的cAmy(SEQ ID NO:66)-01片段诱变。诱变需要3个单 个引物(所有以正向扩增)且引入3个突变:在5′末端处的AfeI位 点、在3′末端处的BglII位点(对于基因外部)、和内部AfeI位点 (SY1709:174)的去除。将诱变构建体转化到Top10细胞内用于筛选, 以测定是否存在任何/所有所需突变。选择15个转化株用于筛选,并 且用AfeI和BglII分别进行消化(SY1709:185-186)。由限制性消 化确定存在具有所有3个所需突变的6个可能克隆;这些克隆中的3 个送出用于测序(SY1709:190;SY1777:11)。对于所有3个克隆, AfeI位点已在5′末端处引入,和内部位点已去除。此外,3′BglII 位点已引入。证实后,用AfeI/BglII从诱变构建体中消化α淀粉酶, 且连接到已用AfeI和BglII消化的15460ZeinAmyVN主链内。当连接 时,cAmy(SEQ ID NO:66)与信号肽xGZein27ss一起保留在框内, 其中在克隆接头处无氨基酸改变。使用引物ZeinAmy1199F和 prGTL-03R,就淀粉酶基因的存在筛选转化株。阳性克隆产生~1.6kB 的扩增子(SY1777:24)。选择3个克隆,并且用SanDI/RsrII进行 消化,以去除prGZein-01:cAmy(SEQ ID NO:66):t35s-08。构建 体15468用RsrII进行线性化。双元主链和来自阳性克隆 (SanDI/RsrII)之一的消化盒在RsrII限制位点处连接在一起。转化 到Top10细胞内后,使用引物ZeinAmy1199F和prGTL-03R(SY1777: 47-48),就盒的存在筛选转化株。选择6个阳性转化株,并且经由 HindIII诊断消化进行检查。这些克隆中的3个在2个克隆接头以及 整个编码序列处进行测序(SY1777:56,62);证实所有3个在序列 中是正确的。
如图31中举例说明的,下文命名为“15756”的示例性载体是双 元载体,其包含葡糖淀粉酶,示例性SEQ ID NO:26减去其天然前导 区。天然前导区由用于靶向质外体的γ玉米醇溶蛋白信号序列替换。 γ玉米醇溶蛋白-SEQ ID NO:26融合物使用γ玉米醇溶蛋白启动子进 行表达。双元载体还包含Ubi-PMI-Nos盒用于甘露糖选择。
使用15653作为模板,在多位点诱变反应(QUICKCHANGE, Stratagene)中使用诱变引物,以去除内部AfeI位点,在5′末端处 引入AfeI位点(突变在信号序列中,无肽改变),且引入外部3’SacI 位点用于克隆。将反应转化到Top10感受态细胞内。挑选菌落且经由 限制酶分析进行筛选。选择对于具有去除的内部AfeI位点、插入的5’ Afe位点和引入的SacI位点阳性的克隆。阳性克隆送出用于序列分析 加以证实。这个克隆DNA随后用SacI和AfeI进行消化。消化物随后 进行凝胶纯化,且连接到15460AmyZeinVN主链内,产生具有靶向质外 体的γ玉米醇溶蛋白信号序列的cAmy(SEQ ID NO:26)。这个中间 产物载体进行序列验证,然后用SanDI和RsrII进行消化。这个片段 进行凝胶纯化,并且连接到用RsrII切割且CIP处理的15468双元载 体内。阳性克隆进行PCR大小筛选,然后将阳性克隆之一送出用于连 接到双元内的整个片段的序列分析。证实序列。
如图32中举例说明的,下文命名为“15742”的示例性载体是双 元载体,其具有(包含)葡糖淀粉酶的C末端616个氨基酸,与γ玉 米醇溶蛋白信号序列(xGZein27ss-01)框内融合的示例性SEQ ID NO: 28(cAmy(SEQ ID NO:28)-01),使葡糖淀粉酶靶向质外体,以产 生(cAmy(SEQ ID NO:28)-02)。表达由来自种子特异性启动子的 γ玉米醇溶蛋白A(prGZein-01)的5′区驱动。
通过添加NcoI位点(5-引物末端)和BglII位点(3-引物末端) 修饰的具有cAmy(SEQ ID NO:28)-01的载体15654充当PCR DNA 模板。PCR产物进行TOPO克隆,并且克隆#1进行测序用于验证(SY1533: 181)。别名“cAmy(SEQ ID NO:28)”的新组分用NcoI/BglII进 行消化,且进行凝胶纯化。使片段与别名“15460ZeinAmyVN”的克隆 载体的NcoI/BglII位点框内连接,从而产生具有prGZein-01: xGZein27ss-01:cAmy(SEQ ID NO:28):iPEPC9-01:t35s-08(SY1533: 183)的盒。基因盒用SanDI/RsrII顺次进行消化,凝胶纯化且连接到 双元载体15468的RsrII位点内。成功的连接通过PCR和DNA序列加 以证实(SY1533:185-187)。
如图33中举例说明的,下文命名为“15749”的示例性载体是双 元载体,其包含α淀粉酶,示例性SEQ ID NO:52减去其天然前导区。 天然前导区由用于靶向质外体的γ玉米醇溶蛋白信号序列替换(cAmy (SEQ ID NO:52)-02)。γ玉米醇溶蛋白-SEQ ID NO:52融合物使 用γ玉米醇溶蛋白启动子进行表达。双元载体还包含Ubi-PMI-Nos盒 用于甘露糖选择。
由质粒15648PCR扩增包含氨基酸88-674(加终止密码子)的cAmy (SEQ ID NO:52)-01片段。PCR扩增在片段的5′末端处引入AfeI 位点和3′末端处引入SacI位点。AfeI位点的添加导致氨基酸88从丝 氨酸变成丙氨酸(SY1709:95-96)。将这个PCR扩增子克隆到 pCR2.1TOPO内且进行测序,以验证新限制酶位点(SY1709: 103,111-112)的存在。验证后,经由AfeI/SacI从TOPO主链中消化 cAmy(SEQ ID NO:52)。类似地,用AfeI/SacI消化构建体 15460ZeinAmyVN。将这个主链和cAmy(SEQ ID NO:52)连接在一起。 当连接时,cAmy(SEQ ID NO:52)与信号肽xGZein27ss-01一起保 留在框内,其中仅第一个氨基酸残基从亮氨酸变成丙氨酸。使用引物 ZeinAmy1199F和prGTL-03R,就淀粉酶基因的存在筛选转化株。阳性 克隆产生~2.1kB(SY1709:130)的扩增子。选择5个克隆,并且用 SanDI和RsrII进行消化,以去除prGZein-01:cAmy(SEQ ID NO: 52):t35s08。构建体15468用RsrII进行线性化。双元主链和来自 阳性克隆(SanDI/RsrII)之一的消化盒在RsrII限制位点处连接在一 起。转化到Top10细胞内后,使用ZeinAmy1199F和Mubi-5(SY1709: 146,150),就盒的存在筛选转化株。选择3个阳性转化株,并且经 由BamHI诊断消化进行检查。这些克隆进行测序(SY1709:162;2个 克隆接头以及整个cAmy(SEQ ID NO:52)编码序列),并且确定在 prGZein序列内存在点突变。这个突变是在核苷酸340处的单碱基对 改变-T至C。在原始15460ZeinAmy主链内的启动子再次进行测序,以 检查突变,并且它在主链来源中不存在。然而,当阳性克隆第二次进 行测序时,它出现(SY1709:182,189)。这个突变可能已在细菌复制 过程中发生。
如图34中举例说明的,下文命名为“15718”的示例性载体是双 元载体,其包含α淀粉酶,示例性SEQ ID NO:76减去其天然前导区。 天然前导区由用于靶向质外体的γ玉米醇溶蛋白信号序列替换。γ玉 米醇溶蛋白-SEQ ID NO:76融合物(cAmy(SEQ ID NO:76)-02)使 用γ玉米醇溶蛋白启动子进行表达。双元载体还包含Ubi-PMI-Nos盒 用于甘露糖选择。
由质粒15650PCR扩增包含氨基酸87-508(加终止密码子)的cAmy (SEQ ID NO:76)-01。PCR扩增在片段的5′末端处引入AfeI位点和 3′末端处引入BglII位点。AfeI位点的添加使甘氨酸变成丙氨酸。PCR 产物用AfeI和BglII进行消化,并且克隆到用AfeI和BglII切开的 15460AmyZeinVN主链内,产生与γ玉米醇溶蛋白信号序列融合的cAmy (SEQ ID NO:76)。这个中间产物载体用SanDI和RsrII顺次进行消 化。这个片段进行凝胶纯化,并且随后连接到用RsrII切割且CIP处 理的15468双元载体内。阳性克隆进行PCR大小筛选,然后将阳性克 隆之一送出用于整个插入片段的序列分析。证实序列。
酶促活性分析
随机选择来自所选择事件的20粒种子且合并。种子随后磨碎,并 且对于α-淀粉酶使用Megazyme CERALPHA HR测定进行测定,或对 于葡糖淀粉酶使用Megazyme的葡糖淀粉酶测定进行测定。
活性计算
α-淀粉酶活性的1个CERALPHA  单位定义为在过量热稳定的α- 葡糖淀粉酶的存在下,在限定测定条件下在1分钟内释放1微摩尔对 硝基苯酚所需的酶量。测定条件是在pH 5.5(具有1mg/ml BSA的100 mM NaOAc,pH 5.5缓冲液),60℃下。应当指出计算的活性是CERALPHA 单位。
根据Megazyme,在1%磷酸三钠中的1mM PNP给出在400nm处 18.1的吸光度。因此在磷酸三钠中的1M PNP给出在400nm处18,100 的吸光度。
ΔA400/18,100=在最终平板中的[PNP](mol/l或M)。
在平板中的[PNP](mol/1×8×100×10-61×1×106(umol/mol) =PNP(mol/rxn)
PNP(mol/rxn)/(0.05ml×20分钟)=单位/ml稀释 的α-淀粉酶
稀释酶中的单位/ml×稀释度=在α-淀粉酶样品中的 Ceralpha单位/ml

ΔA400×0.0442×酶的稀释度=在α-淀粉酶样品中的Ceralpha U/ml。
这个SOP由CERALPHA HR测定法SOP和Megazymeα-淀粉酶测 定操作(CERALPHA方法)修饰,使用淀粉酶HR Reagent,ICC标 准号303。
图27举例说明CERALPHA α-淀粉酶测定操作的理论基础;来自 Megazyme的α-淀粉酶测定操作(CERALPHA方法),使用淀粉酶HR
试剂:该图举例说明总体反应方案:在α-淀粉酶切割在阻断的对硝 基苯基麦芽糖底物内的键后,包含对硝基苯基组成成分的非阻断反应 产物立即经由过量热稳定的α-葡糖苷酶切割成葡萄糖和游离对硝基 苯基,其是底物混合物的整合部分,并且释放游离对硝基苯基。该反 应终止,并且在添加磷酸三钠,在约11.0下的pH后发展酚盐颜色。
来自玉米粉的葡糖淀粉酶提取和关于淀粉水解的活性测定:来自 单个玉米种子的葡糖淀粉酶提取和测定
为了描述关于来自玉米粉的葡糖淀粉酶提取和测定的操作:
提取缓冲液的制备:
25mM硼酸钠,.01%Tween 20,pH 10缓冲液
操作:
合并的种子磨碎:
合并20粒种子。将种子加入Kelco研磨容器中。将钢珠置于每个 容器中在种子上。将橡皮垫圈放置在容器周围,并且将盖放在顶部上。 在Kelco中研磨45秒。使用scupula将粉从容器转移至重量蒸发皿, 然后倾入15mL锥形管内。用肥皂和水洗涤容器、垫圈和钢珠。
提取
1.将3ml提取缓冲液加入样品中。
2.使用锤子由盖将管密封。
3.剧烈振荡直至粉悬浮于缓冲液中。
4.在室温下在Rugged旋转器上以70%旋转5分钟。
5.于45℃在水浴中温育30分钟。
6.在温育后在室温下使样品旋转另外5分钟。
7.使样品在3000rpm下离心5分钟。
GA测定(试剂信息在测定操作后)
1.使样品在稀释缓冲液中稀释,以给出在0.5-1.5OD400中的测 定。
2.打开PCR机器。将程序设定为于40℃温育10分钟,随后下 降至4℃。
3.在冰上,将50μl每种稀释葡糖淀粉酶样品加入PCR平板 中。
4.将150μl终止溶液加入微量滴定板的每个孔中。应存在关 于测定的每种样品的2个终止溶液孔。
5.使50μl底物试剂与样品混合。吸取2次。如来自Megazyme 的说明书中所示制备底物(10ml水/瓶)。
6.立即取出20μl混合物,并且与150μl终止溶液混合。 伴随打转吸取3次。这是0时间点。
7.将平板置于培养箱中并且按下开始。确保当其加速时样品在 机器中。使PCR平板在40℃下温育10分钟。
8.当样品在机器中的同时,允许机器下降至4℃。
9.等待2分钟。
10.取出20μl产物,并且在微量滴定板中与150μl终止混 合。这是10分钟时间点。
11.使平板静置15分钟。
12.在平板阅读器中读出OD400。将Pathcheck设为ON(这将使 在路径长度1cm时阅读的样品吸光度标准化)。
13.计算ΔA400,在0-10分钟点之间ΔA400中的改变。
母液的制备:
底物(Megazyme目录#:R-AMGR3)
对硝基苯基-α-麦芽糖苷(4mM)
热稳定的α-葡糖淀粉酶(5U/ml)
使1个小瓶中的全部内容物溶解于10.0ml MilliQ水中。分成等 分试样且冷冻贮存。在使用期间贮存于冰上。
终止溶液:2%氨基丁三醇基液
2.0g氨基丁三醇基(Sigma T-1503)
加入MilliQ水至100ml的终体积。
稀释缓冲液:200mM乙酸钠缓冲液(pH 4.5)
活性计算
1单位α-葡糖淀粉酶活性定义为在在过量热稳定的α-葡糖苷酶 的存在下,在限定测定条件下在1分钟内释放1微摩尔对硝基苯酚所 需的酶量。
根据Megazyme,在2%氨基丁三醇基中的1mM PNP给出在400nm 处18.1的吸光度。
在样品中的GA活性(U/ml)=(A400/10)×(170/10)×(1/18.1) ×稀释度=A400×0.0939×稀释度
这个SOP由淀粉葡糖苷酶的Megazyme测定修饰,使用对硝基苯基 -α-麦芽糖苷加上热稳定的α-葡糖淀粉酶。
粗淀粉发酵:如上所述进行。
结果
TAQMAN测定和酶促活性测定
通过初级和次级TAQMAN测定来确定转基因拷贝数。在初级 TAQMAN测定中使用对于在上文描述的所有玉蜀黍转化载体中使用的 可选标记基因pmi特异的引物。在次级TAQMAN测定中使用对于pmi 基因和细菌可选标记基因spec特异的引物。
在所选择构建体的成熟干透T1转基因种子中α-淀粉酶或葡糖淀 粉酶的表达也通过酶促活性测定进行分析。由构建体15749产生的事 件中的基因拷贝数和示例性α-淀粉酶SEQ ID NO:52在这些事件中的 表达结果概括于表2.2中。
表2.2.由构建体15749产生的事件中的转基因拷贝数和α-淀 粉酶活性



由构建体15751产生的事件中的基因拷贝数和葡糖淀粉酶SEQ ID NO:48在这些事件中的表达结果概括于表2.3中:
表2.3.由构建体15751产生的事件中的转基因拷贝数和葡糖淀 粉酶活性


表2.4概括了由构建体15756产生的事件中的基因拷贝数和葡糖 淀粉酶SEQ ID NO:26在这些事件中的表达结果。合并分别来自表达 α-淀粉酶SEQ ID NO:66和SEQ ID NO:76的构建体15761和15718 的多个事件的种子,并且磨碎以产生混合样品。2种混合样品就α-淀 粉酶活性进行测定。类似地,合并分别来自表达葡糖淀粉酶SEQ ID NO: 28和SEQ ID NO:18的构建体15742和15750的多个事件的种子,并 且磨碎以产生混合样品。2种混合样品就葡糖淀粉酶活性进行测定。 结果概括于表2.5中。
表2.4.由构建体15756产生的事件中的转基因拷贝数和葡糖 淀粉酶活性


表2.5.由构建体15718、15761、15742和15750产生的种子中 的α-淀粉酶或葡糖淀粉酶活性
  构建体   变种   表达的酶   酶类型   合并种子活性(U/g)   15718   JHAX707   SEQ ID NO:76   α-淀粉酶   0.033   15761   JHAX708   SEQ ID NO:66   α-淀粉酶   0.085   15742   JHAX709   SEQ ID NO:28   葡糖淀粉酶   3.399   15750   JHAX710   SEQ ID NO:18   葡糖淀粉酶   3.55
使用玉蜀黍表达酶的粗淀粉发酵
合并来自表达α-淀粉酶或葡糖淀粉酶的所选择构建体的多个事 件的种子,并且磨碎以产生混合样品用于粗淀粉发酵。在所有实验中, 包含α-淀粉酶的玉米粉以20%(w/w)的包含率使用,和包含葡糖淀 粉酶的玉米粉以50%(w/w)的包含率使用。黄色马齿I I商品玉米粉 构成玉米粉的其他30%(w/w)。通过根据上文描述的标准SOP执行 粗淀粉发酵(部分I)。这些玉蜀黍表达的α-淀粉酶和葡糖淀粉酶组 合在粗淀粉发酵中产生乙醇的能力概括于表2.6中。
表2.6.使用在不含密码子优化的玉蜀黍中表达的“前导”示例 性酶的粗淀粉发酵72小时后的乙醇得率*
  构建体   (α-淀粉酶)   构建体(葡糖淀   粉酶)   包含率   (α-淀   粉酶)(%   w/w)   包含率   (葡糖   淀粉   酶)(%   w/w)   包含率   (商品)   (%   w/w)   乙醇得   率(%   v/v)   15749(SEQ ID   NO:52)   15756(SEQ ID   NO:26)   20   50   30   6.96   15749(SEQ ID   NO:52)   15742(SEQ ID   NO:28)   20   50   30   8.90   15761(SEQ ID   NO:66)   15751(SEQ ID   NO:48)   20   50   30   7.30   15718(SEQ ID   NO:76)   15750(SEQ ID   NO:18)   20   50   30   8.33   N/A   N/A   0   0   100   2.25
实施例28:使用合成玉蜀黍密码子优化基因的示例性酶的植物表 达和使用植物材料的粗淀粉发酵
对于2种α-淀粉酶SEQ ID NO:52(例如由SEQ ID NO:51编码) 和SEQ ID NO:4(例如由SEQ ID NO:3编码),和2种葡糖淀粉酶 SEQ ID NO:48(例如由SEQ ID NO:47编码)和SEQ ID NO:26(例 如由SEQ ID NO:25编码)产生具有就玉蜀黍表达优化的密码子的合 成基因。下表使野生型SEQ ID NO:与对于密码子优化序列指定的SEQ ID NO:关联。基于在粗淀粉发酵中给出的最高乙醇得率,选择用于密 码子优化的酶。这个研究的目标是产生商业事件用于产品开发,以及 产生足够的材料以评估玉蜀黍表达酶的粗淀粉发酵性能。
  酶   野生型SEQ ID NO:   密码子优化的SEQ ID NO:   淀粉酶   51   79   淀粉酶   3   80   葡糖淀粉酶   47   81   葡糖淀粉酶   25   82
实验方法
合成基因
合成基因由GENEART制备。序列使用GENEART的专利 GENEOPTIMIZER技术进行密码子优化。合成基因的序列在下文列出。 密码子使用适合于玉蜀黍基因的密码子偏爱。
载体构建
表3.1概括在下文显示的图中用于DNA元件的缩写。
表3.1.在商业构建图中使用的缩写


下文命名为“15740”的示例性载体是用于玉蜀黍转化的双元载体, 其具有驱动质外体靶向合成玉蜀黍优化形式的示例性α-淀粉酶SEQ ID NO:51的种子特异性启动子prGTL-03,优化形式是示例性SEQ ID NO:79或cAmy(SEQ ID NO:79)Apo-01。这种双元还包含Ubi-PMI-Nos 盒用于选择。
克隆载体:构建体别名15460ZeinAmyVN用SacI和RsrII进行消 化,以去除iPEPC9-01和t35s-08。同样,构建体15460用SacI和RsrII 进行消化,以去除tNOS-03-01。使用这些位点(SY1709:6)将终止 子t35s-08/iPEPC9-01连接到15460内。将连接反应转化到DH5-α细 胞内;转化株用菌落PCR进行筛选。测序4个阳性克隆,并且根据这 些序列,克隆接头和限制酶位点测定为正确的(SY1709:15-16)。为 了插入启动子prGTL-03,包含t35s08/iPEPC9-01的15460用BamHI 和HindIII进行消化,且进行凝胶纯化(SY1709:14)。包含prGTL-03 的构建体11267也用BamHI和HindIII进行消化,并且启动子进行凝 胶纯化(SY1710:3-4)。随后使用这些位点将它连接到15460主链内, 并且转化到感受态DH5-α细胞内。使用HindIII和BamHI筛选10个 转化株,以测定prGTL-03是否存在于载体中;所有10个都具有正确 的条带模式(SY1709:25)。测序2个克隆,以证实克隆接头和限制 酶位点,并且2个都是正确的,没有任何序列差异(SY1709:34-35)。 由克隆#1制备甘油原种,并且贮存于-80℃。克隆载体用BamHI/SacI 进行消化且进行CIP处理。称为SEQ ID NO:79(也称为cAmy(SEQ ID NO:79))的合成玉蜀黍密码子优化形式的α淀粉酶SEQ ID NO:51 用BamHI和SacI进行消化,并且连接到prGTL-03克隆载体的 BamHI/SacI位点内,以产生别名GTL+SYN(SEQ ID NO:79)(Sy1773: 48)。双元载体:将来自载体15468的AscI/BamHI片段连接到双元载 体12678的AscI/BamHI位点内,以产生别名“12678 RsrII”(SY1533: 189)。这个克隆随后用RsrII进行消化且进行CIP处理。克隆载体 “GTL+SYN(SEQ ID NO:79)”用SanDI/RsrII进行消化,并且连接 到RsrII位点内,以产生B-prGTL:(SEQ ID NO:79):t35S:PMI (SY1773:56)。阳性克隆通过PCR进行鉴定,并且通过DNA测序加 以证实。
如图37中举例说明的,下文命名为“15741”的示例性载体是用 于玉蜀黍转化的双元载体,其具有驱动质外体靶向合成玉蜀黍优化形 式的示例性葡糖淀粉酶SEQ ID NO:25的种子特异性启动子prGTL-03, 优化形式是示例性SEQ ID NO:82或cGAmy(SEQ ID NO:82)Apo-01。 这种双元还包含Ubi-PMI-Nos盒用于选择。
克隆载体:构建体别名15460ZeinAmyVN用SacI和RsrII进行消 化,以去除iPEPC9-01和t35s-08。同样,构建体15460用SacI和RsrII 进行消化,以去除tNOS-03-01。使用这些位点(SY1709:6)将终止 子t35s-08/iPEPC9-01连接到15460内。将连接反应转化到DH5-α细 胞内;转化株用菌落PCR进行筛选。测序4个阳性克隆,并且根据这 些序列,克隆接头和限制酶位点测定为正确的(SY1709:15-16)。为 了插入启动子prGTL-03,包含t35s08/iPEPC9-01的15460用BamHI 和HindIII进行消化,且进行凝胶纯化(SY1709:14)。包含prGTL-03 的构建体11267也用BamHI和HindIII进行消化,并且启动子进行凝 胶纯化(SY1710:3-4)。随后使用这些位点将它连接到15460主链内, 并且转化到感受态DH5-α细胞内。使用HindIII和BamHI筛选10个 转化株,以测定prGTL-03是否存在于载体中;所有10个都具有正确 的条带模式(SY1709:25)。测序2个克隆,以证实克隆接头和限制 酶位点,并且2个都是正确的,没有任何序列差异(SY1709:34-35)。 由克隆#1制备甘油原种,并且贮存于-80℃。克隆载体用BamHI/SacI 进行消化且进行CIP处理。称为SEQ ID NO:82(也称为cAmy(SEQ ID NO:82或SYN(SEQ ID NO:82)的合成玉蜀黍密码子优化形式的葡糖 淀粉酶SEQ ID NO:25用BamHI和SacI进行消化,并且连接到prGTL-03 克隆载体的BamHI/SacI位点内,以产生别名GTL+SYN(SEQ ID NO: 82)(SY1773:48)。双元载体:将来自载体15468的AscI/BamHI 片段连接到双元载体12678的AscI/BamHI位点内,以产生别名“12678 RsrII”(SY1533:189)。这个克隆随后用RsrII进行消化且进行CIP 处理。克隆载体“GTL+SYN(SEQ ID NO:82)”用SanDI/RsrII进行 消化,并且连接到RsrII位点内,以产生B-prGTL:(SEQ ID NO:82): t35S:PMI(SY1773:66)。阳性克隆通过PCR进行鉴定,并且通过 DNA测序加以证实。
如图38中举例说明的,下文命名为“15742”的示例性载体是双 元载体,其具有(包含)驱动质外体靶向合成玉蜀黍优化形式的示例 性葡糖淀粉酶SEQ ID NO:47的种子特异性启动子prGTL-03,优化形 式是示例性SEQ ID NO:81。这种双元还包含Ubi:PMI:NOS盒用于 选择。
克隆载体:构建体别名15460ZeinAmyVN用SacI和RsrII进行消 化,以去除iPEPC9-01和t35s-08。同样,构建体15460用SacI和RsrII 进行消化,以去除tNOS-03-01。使用这些位点(SY1709:6)将终止 子t35s-08/iPEPC9-01连接到15460内。将连接反应转化到DH5-α细 胞内;转化株用菌落PCR进行筛选。测序4个阳性克隆,并且根据这 些序列,克隆接头和限制酶位点测定为正确的(SY1709:15-16)。为 了插入启动子prGTL-03,包含t35s08/iPEPC9-01的15460用BamHI 和HindIII进行消化,且进行凝胶纯化(SY1709:14)。包含prGTL-03 的构建体11267也用BamHI和HindIII进行消化,并且启动子进行凝 胶纯化(SY1710:3-4)。随后使用这些位点将它连接到15460主链内, 并且转化到感受态DH5-α细胞内。使用HindIII和BamHI筛选10个 转化株,以测定prGTL-03是否存在于载体中;所有10个都具有正确 的条带模式(SY1709:25)。测序2个克隆,以证实克隆接头和限制 酶位点,并且2个都是正确的,没有任何序列差异(SY1709:34-35)。 由克隆#1制备甘油原种,并且贮存于-80℃。克隆载体用BamHI/SacI 进行消化且进行CIP处理。称为SEQ ID NO:81(也称为cAmy(SEQ ID NO:81)的合成玉蜀黍密码子优化形式的葡糖淀粉酶SEQ ID NO:47 用BamHI和SacI进行消化,并且连接到prGTL-03克隆载体的 BamHI/SacI位点内,以产生别名GTL+SYN(SEQ ID NO:81))(SY1773: 48)。双元载体:将来自载体15468的AscI/BamHI片段连接到双元载 体12678的AscI/BamHI位点内,以产生别名“12678RsrII”(SY1533: 189)。这个克隆随后用RsrII进行消化且进行CIP处理。克隆载体 “GTL+SYN(SEQ ID NO:81)”用SanDI/RsrII进行消化,并且连接 到RsrII位点内,以产生B-prGTL:(SEQ ID NO:81):t35S:PMI (SY1773:56)。阳性克隆通过PCR进行鉴定,并且通过DNA测序加 以证实(SY1773:58)。
如图39中举例说明的,下文命名为“15743”的示例性载体是双 元载体,其具有(包含)驱动质外体靶向合成玉蜀黍优化形式的示例 性葡糖淀粉酶SEQ ID NO:3的种子特异性启动子prGTL-03,优化形 式是示例性SEQ ID NO:80。这种双元还包含Ubi:PMI:NOS盒用于 选择。
克隆载体:构建体别名15460ZeinAmyVN用SacI和RsrII进行消 化,以去除iPEPC9-01和t35s-08。同样,构建体15460用SacI和RsrII 进行消化,以去除tNOS-03-01。使用这些位点(SY1709:6)将终止 子t35s-08/iPEPC9-01连接到15460内。将连接反应转化到DH5-α细 胞内;转化株用菌落PCR进行筛选。测序4个阳性克隆,并且根据这 些序列,克隆接头和限制酶位点测定为正确的(SY1709:15-16)。为 了插入启动子prGTL-03,包含t35s08/iPEPC9-01的15460用BamHI 和HindIII进行消化,且进行凝胶纯化(SY1709:14)。包含prGTL-03 的构建体11267也用BamHI和HindIII进行消化,并且启动子进行凝 胶纯化(SY1710:3-4)。随后使用这些位点将它连接到15460主链内, 并且转化到感受态DH5-α细胞内。使用HindIII和BamHI筛选10个 转化株,以测定prGTL-03是否存在于载体中;所有10个都具有正确 的条带模式(SY1709:25)。测序2个克隆,以证实克隆接头和限制 酶位点,并且2个都是正确的,没有任何序列差异(SY1709:34-35)。 由克隆#1制备甘油原种,并且贮存于-80℃。克隆载体用BamHI/SacI 进行消化且进行CIP处理。称为SEQ ID NO:80(也称为cAmy(SEQ ID NO:80)的合成玉蜀黍密码子优化形式的α葡糖淀粉酶SEQ ID NO:3 用BamHI和SacI进行消化,并且连接到prGTL-03克隆载体的 BamHI/SacI位点内,以产生别名GTL+SYN(SEQ ID NO:80)(SY1773: 48)。双元载体:将来自载体15468的AscI/BamHI片段连接到双元载 体12678的AscI/BamHI位点内,以产生别名“12678RsrII”(SY1533: 189)。这个克隆随后用RsrII进行消化且进行CIP处理。克隆载体 “GTL+SYN(SEQ ID NO:80)”用SanDI/RsrII进行消化,并且连接 到RsrII位点内,以产生B-prGTL:(SEQ ID NO:80):t35S:PMI (SY1773:56)。阳性克隆通过PCR进行鉴定,并且通过DNA测序加 以证实。
如图40中举例说明的,下文命名为“15862”的示例性载体是用 于玉蜀黍转化的双元载体,其具有(包含)驱动合成玉蜀黍优化形式 的示例性葡糖淀粉酶SEQ ID NO:47的种子特异性启动子prGTL-03, 优化形式是示例性SEQ ID NO:81或cGAmy(SEQ ID NO:81)ER-01, 其通过KDEL ER滞留信号靶向ER。这种双元还包含Ubi-PMI-Nos盒用 于选择。
称为SYN(SEQ ID NO:81)(cAMY(SEQ ID NO:81)-03)的玉 蜀黍密码子优化形式的SEQ ID NO:47进行PCR复制,并且用引物这 样进行TOPO克隆,使得ER滞留信号KDEL加入3-引物末端中(SY1773: 53)。KDEL的存在通过DNA测序加以证实(SY1773:54 & 60)。DNA 序列数据证实无差异(SY1773:63)。克隆#1用BamHI/BglII进行消 化,通过琼脂糖凝胶进行纯化,并且连接到具有prGTL-03启动子和 t35S-08的克隆载体内,以产生别名“GTL+SYN(SEQ ID NO:81)kdel v2”(SY1773:66)。基因盒prGTL-03:cAmy(SEQ ID NO:81)kdel: t35s-08作为SanDI/RsrII片段连接到修饰形式的双元载体12678的 RsrII位点内,以产生B-prGTL-(SEQ ID NO:81)KDEL:PMI(SY1773: 83)。双元载体的完整性通过PCR和DNA测序加以证实(SY1773:88)。
如图41中举例说明的,下文命名为“15880”的示例性载体是双 元载体,其含有(包含)玉蜀黍密码子优化形式的示例性α淀粉酶SEQ ID NO:51,密码子优化形式是示例性SEQ ID NO:79,使用稻谷蛋白 启动子(prGTL-03)进行表达。α淀粉酶还包含γ玉米醇溶蛋白信号 序列和KDEL序列用于ER滞留。这种载体包含Ubi-PMI-Nos盒用于甘 露糖选择。
称为SEQ ID NO:79或cAmy(SEQ ID NO:79)的玉蜀黍密码子 优化α淀粉酶SEQ ID NO:51用引物进行PCR复制,从而使得ER滞留 信号(KDEL)加入3-引物末端中(SY1777:180)。PCR产物随后进行 凝胶纯化,TOPO克隆,并且转化到TOP10感受态细胞内。不含任何差 异的KDEL的存在经由测序加以证实(SY1773:73)。TOPO克隆用BamHI 和BglII进行消化,以获得随后进行凝胶纯化的经修饰的淀粉酶基因。 将凝胶纯化产物连接到包含prGTL-03(稻谷蛋白启动子)和t35s-08 的15460内,以产生别名“GTL+syn(SEQ ID NO:79)KDEL v2” (SY1773:80;SY1777:180)。转化到DH5á感受态细胞内后,克隆 经由PCR就插入片段方向进行筛选。此外,在构建双元载体前(SY1777: 189,191),整个CDS以及克隆接头进行测序。基因盒prGTL:cAmy (SEQ ID NO:79):t35s08用SanDI/RsrII进行消化,并且在RsrII 位点(SY1818:12)处连接到修饰形式的构建体12678内。通过将来 自载体15468的AscI/BamHI片段连接到双元载体12678的AscI/BamHI 位点内来修饰这种构建体,以产生别名“12678RsrII”(SY1533:189)。 将连接反应转化到TOP10感受态细胞内,并且转化株随后用菌落PCR 进行筛选。2个筛选转化株对于基因盒是阳性的,并且用BamHI进行 消化,以证实其存在。在消化证实后,测序来自克隆#5的整个盒 (SY1818:34)。数据证实存在整个盒包括所有接头,没有任何序列 差异(SY1818:37-38)。
如图42中举例说明的,下文命名为“15884”的示例性载体是双 元载体,其含有(包含)玉蜀黍密码子优化形式的示例性SEQ ID NO: 25,玉蜀黍密码子优化形式是示例性SEQ ID NO:82,使用稻谷蛋白 启动子(prGTL-03)进行表达。葡糖淀粉酶还包含γ玉米醇溶蛋白信 号序列和ER滞留信号(KDEL)。这种载体包含Ubi-PMI-Nos盒用于甘 露糖选择。
称为SEQ ID NO:82或cAmy(SEQ ID NO:82)的玉蜀黍密码子 优化形式的葡糖淀粉酶SEQ ID NO:25用引物进行PCR复制,从而使 得ER滞留信号(KDEL)加入3-引物末端中(SY1777:184)。PCR产 物随后进行凝胶纯化,TOPO克隆,并且转化到TOP10感受态细胞内。 不含任何差异的KDEL的存在经由测序加以证实(SY1777:190)。TOPO 克隆用BamHI和BglII进行消化,以获得随后进行凝胶纯化的经修饰 的淀粉酶基因。将凝胶纯化产物连接到包含prGTL-03(稻谷蛋白启动 子)和t35s-08的15460内,以产生别名“GTL+syn(SEQ ID NO: 82)KDEL v2”(SY1818;1-3)。转化到Top10感受态细胞内后,克 隆经由PCR就插入片段方向进行筛选。此外,在构建双元载体前 (SY1818:29-30),整个CDS以及克隆接头进行测序。由测序确定在 cAmy(SEQ ID NO:82)编码序列内在碱基对156处存在单碱基对改变。 它是不改变蛋白质的氨基酸序列的T至C改变(SY1818:39-40)。基 因盒prGTL:syn(SEQ ID NO:82)KDEL:t35s08用SanDI/RsrII进 行消化,并且在RsrII位点处连接到修饰形式的构建体12678内 (SY1818:31)。通过将来自载体15468的AscI/BamHI片段连接到双 元载体12678的AscI/BamHI位点内来修饰这种构建体,以产生别名 “12678RsrII”(SY1533:189)。将连接反应转化到TOP10感受态 细胞内,并且转化株随后使用限制酶消化进行筛选。2个转化株用限 制酶包括NotI、SacI、EcoRV和PstI的各个组合进行消化,以证实基 因盒的存在(SY1818:45)。在消化证实后,测序来自克隆#7的整个 盒(SY1818:46-47)。数据证实存在整个盒包括所有接头,并且仅包 含较早描述的单碱基对改变(SY1818:50)。
如图43中举例说明的,下文命名为“15890”的示例性载体是用 于玉蜀黍转化的双元载体,其包含玉蜀黍密码子优化形式的示例性α- 淀粉酶SEQ ID NO:3,玉蜀黍密码子优化形式是示例性SEQ ID NO: 80,或cAmy(SEQ ID NO:80)使用稻谷蛋白启动子(prGTL-03)进 行表达。葡糖淀粉酶还包含γ玉米醇溶蛋白信号序列和ER滞留信号 (KDEL)。这种载体包含Ubi-PMI-Nos盒用于甘露糖选择。
称为cAmy(SEQ ID NO:80)的玉蜀黍密码子优化形式的示例性 α-淀粉酶SEQ ID NO:3用引物进行PCR复制,从而使得ER滞留信号 (KDEL)加入3-引物末端中(SY1777:184)。PCR产物随后进行凝胶 纯化,TOPO克隆,并且转化到TOP10感受态细胞内。不含任何差异的 KDEL的存在经由测序加以证实(SY1777:190)。TOPO克隆用BamHI 和BglII进行消化,以获得随后进行凝胶纯化的经修饰的淀粉酶基因。 将凝胶纯化产物连接到包含prGTL-03(稻谷蛋白启动子)和t35s-08 的15460内,以产生别名“GTL+syn(SEQ ID NO:80)KDEL v2” (SY1818;1-3)。转化到Top10感受态细胞内后,克隆经由PCR就插 入片段方向进行筛选。此外,在构建双元载体前(SY1818:51),整 个CDS以及克隆接头进行测序。基因盒prGTL:syn(SEQ ID NO:80) KDEL:t35s08用SanDI/RsrII进行消化,并且在RsrII位点处连接到 修饰形式的构建体12678内(SY1818:52)。通过将来自载体15468 的AscI/BamHI片段连接到双元载体12678的AscI/BamHI位点内来修 饰这种构建体,以产生别名“12678RsrII”(SY1533:189)。将连 接反应转化到TOP10感受态细胞内,并且转化株随后使用PCR和限制 酶消化进行筛选。具有阳性PCR结果的2个转化株用限制酶包括NcoI、 KpnI、EcoRV、XbaI和BglII的各个组合进行消化,以证实基因盒的 存在(SY1818:65-66)。在消化证实后,测序来自克隆#2的整个盒 (SY1818:67)。数据证实存在整个盒包括所有接头,不含任何序列 差异(SY1818:69-70)。
如图44中举例说明的,下文命名为“15889”的示例性载体是用 于玉蜀黍转化的双元载体,其包含密码子优化形式的示例性葡糖淀粉 酶SEQ ID NO:25的分子堆叠,密码子优化形式是示例性SEQ ID NO: 82,或cAmy(SEQ ID NO:82)由2种不同启动子驱动。在第一个盒 中,cAmy(SEQ ID NO:82)由稻谷蛋白启动子驱动,并且具有γ玉米 醇溶蛋白信号序列和KDEL信号用于在ER中滞留。在第二个盒中,葡 糖淀粉酶由α胰蛋白酶抑制剂基因驱动,并且由γ玉米醇溶蛋白信号 序列靶向质外体。这种构建体还包含Ubi-PMI-Nos盒用于甘露糖选择。
通过定点诱变使稻启动子prATI-01诱变,以去除内部RsrII位点, 并且提交作为在构建体#15882中的新组分。这个位点去除的序列证实 后,克隆载体“15460+prATI+t35s08”用BamHI/SacI进行消化,进 行CIP处理,并且进行凝胶提取(SY1777:162)。将合成的密码子优 化的葡糖淀粉酶Syn(SEQ ID NO:82)(BamHI/SacI)连接到消化的 主链内,并且所得到的构建体称为“15460prATIm.syn(SEQ ID NO: 82)”(SY1777:170)。使用菌落PCR和诊断NcoI/BglII消化,就 基因的存在筛选转化株。测序3个阳性克隆;对于3个克隆证实克隆 接头(SY1777:177-179)。序列证实后,用SanDI/RsrII消化 “15460prATIm.syn(SEQ ID NO:82)”,并且ATI:syn(SEQ ID NO: 82):t35s08盒进行凝胶纯化(SY1773:52)。双元载体#15884用 RsrII进行线性化,进行CIP处理,并且进行凝胶提取。纯化后,将 ATI:syn(SEQ ID NO:82):t35s08盒连接到双元主链内,并且转 化到TOP10感受态细胞内(SY1818:53)。选择10个转化株用于测序, 经由PCR,其中之一证实具有包含ATI启动子的盒(SY1818:56)。 随后用诊断限制酶消化筛选阳性克隆,使用下述酶:EcoRI、BglII、 NcoI和HindIII(SY1818:60,66)。通过分析来自各种消化的条带 模式,克隆#9测定为正确的。此外,克隆#9的克隆接头进行测序,且 同样证实为正确的(SY1818:65)。
如图45中举例说明的,下文命名为“15934”的示例性载体是用 于植物转化的双元载体,其包含密码子优化形式的示例性葡糖淀粉酶 SEQ ID NO:47的分子堆叠,密码子优化形式是示例性SEQ ID NO:81, 或cGAmy(SEQ ID NO:81)由2种不同启动子驱动。在第一个盒中, GAmy(SEQ ID NO:81)由稻谷蛋白启动子驱动,并且具有KDEL信号 用于在ER中滞留(组分是cGAmy(SEQ ID NO:81)ER-01)。在第二 个盒中,GAmy(SEQ ID NO:81)由α胰蛋白酶抑制剂启动子驱动,并 且靶向质外体(组分是cGAmy(SEQ ID NO:81)Apo-01)。这种构建 体还包含Ubi-PMI-Nos盒用于甘露糖选择。注:IT通过限制性消化和 测序左边界插入片段之一缺失进行测定。选择计划以由该载体进行。
克隆载体“15460+prATI+t35s08”用BamHI/SacI进行消化,进 行CI P处理,并且进行凝胶提取(SY1777:162)。将合成的密码子优 化的葡糖淀粉酶cGAmy(SEQ ID NO:81)Apo-01(BamHI/SacI)连接 到消化的主链内,并且所得到的构建体称为“15460prATIm.syn(SEQ ID NO:81)”(SY1777:170)。使用菌落PCR和诊断NcoI/BglII消化, 就基因的存在筛选转化株。测序3个阳性克隆;对于3个克隆证实克 隆接头(SY1777:177-179)。序列证实后,用SanDI/RsrII消化 “15460prATIm.syn(SEQ ID NO:81)”,并且ATI:cGAmy(SEQ ID NO:81)Apo-01:t35s08盒进行凝胶纯化(SY1773:72)。构建双元 载体“B-prGTL:(SEQ ID NO:81)KDEL:PMI”,且标记为构建体#15862 (SY17773:92)。它用RsrII进行线性化,进行CIP处理,并且进行 凝胶提取。纯化后,将ATI:cGAmy(SEQ ID NO:81)Apo-01:t35s08 盒连接到双元主链内,并且转化到TOP10感受态细胞内(SY1818: 22-23)。最初使用菌落PCR筛选转化株,使用仅在ATI启动子中退火 的引物。选择10个转化株,并且证实具有包含ATI启动子的盒。选择 克隆#8用于限制性分析,以进一步证实在双元载体内盒的存在。选择 在ATI启动子以及主链中特异性切割的2种酶,以排除双重盒的可能 性。当克隆#8用AvrII和NcoI进行消化时,确定仅存在每个盒的一 个拷贝(SY1818:93-94)。
酶促活性分析
单粒种子分析或合并种子分析用于测量转基因种子中的α-淀粉 酶或葡糖淀粉酶活性。对于单粒种子分析,随机选择来自每个事件的 12粒种子,且个别磨碎。对于合并种子分析,随机选择来自所选择事 件的20粒种子,合并且磨碎。随后对于α-淀粉酶使用Megazyme CERALPHA HR测定来测定粉,或对于葡糖淀粉酶使用Megazyme的葡 糖淀粉酶测定来测定粉。测定的标准操作程序(SOPs)在上文描述, 包括“酶促活性分析”,来自玉米粉的α-淀粉酶提取和活性测定,来 自玉米粉的葡糖淀粉酶提取和活性测定,以及粗淀粉发酵方案。
结果
Taqman测定和酶促活性测定
通过初级和次级Taqman测定来确定转基因拷贝数。在初级Taqman 测定中使用对于在上文描述的所有玉蜀黍转化载体中使用的可选标记 基因pmi特异的引物。在次级Taqman测定中使用对于pmi基因、细菌 可选标记基因、spec、和编码α-淀粉酶或葡糖淀粉酶基因特异的引物。
在所选择构建体的成熟干透T1转基因种子中α-淀粉酶或葡糖淀 粉酶的表达也通过酶促活性测定进行分析。由构建体15840产生的所 选择事件中的基因拷贝数结果概括于表3.2中。通过在个别随机选择 的12粒种子中的酶促活性分析,测量在这些事件中的示例性密码子优 化的α-淀粉酶SEQ ID NO:79的表达。关于每个事件的12粒种子的 平均活性也显示于下表3.2中。
类似地,表3.3显示由构建体15841产生的所选择事件中的基因 拷贝数。通过在个别随机选择的12粒种子中的酶促活性分析,也测量 在这些事件中的示例性密码子优化的葡糖淀粉酶SEQ ID NO:82的表 达,并且关于每个事件的12粒种子的平均活性概括于下表3.3中。
另一方面,合并来自由构建体15842和15843产生的每个所选择 事件的二十(20)粒种子用于酶促测定,以确定密码子优化的葡糖淀 粉酶SEQ ID NO:81和示例性密码子优化的α-淀粉酶SEQ ID NO:80 分别在这些事件中的表达水平。结果分别概括于下表3.4和3.5中。 还显示了转基因拷贝数。
表3.2.由构建体15840产生的所选择事件中的转基因拷贝数和 α-淀粉酶活性
  植物编号   12粒种子的平均活性(U/g)   1   377.3   2   291.9   3   95.1   4   119.4   5   155.4   6   129.4   7   125.3   8   539.4   9   1362.4   10   195.1   11   88.4   12   458.2   13   722.9   14   151.7   15   164.8
表3.3.由构建体15841产生的所选择事件中的转基因拷贝数和 葡糖淀粉酶活性


表3.4.由构建体15842产生的所选择事件中的转基因拷贝数和 葡糖淀粉酶活性


表3.5.由构建体15843产生的所选择事件中的转基因拷贝数和 α-淀粉酶活性



使用玉蜀黍表达酶的粗淀粉发酵
合并来自上文显示表达的α-淀粉酶或葡糖淀粉酶的事件的种子, 并且磨碎以产生混合样品用于粗淀粉发酵。在所有实验中,包含α- 淀粉酶的玉米粉以20%(w/w)的包含率使用,和包含葡糖淀粉酶的 玉米粉以50%(w/w)的包含率使用。黄色马齿I I商品玉米粉构成玉 米粉的其他30%(w/w)。通过根据上文描述的标准SOP执行粗淀粉 发酵(部分I)。使用玉蜀黍密码子优化的合成基因,这些玉蜀黍表 达的α-淀粉酶和葡糖淀粉酶组合在粗淀粉发酵中产生乙醇的能力概 括于表3.6中。
实施例29:巴斯德毕赤酵母表达构建体
这个实施例描述了使用例如示例性毕赤酵母属表达系统在酵母中 表达酶。
对于在pPICZalpha和pAO815载体(两者都来自Invitrogen, Carlsbad,CA)中的表达载体的构建,使用Xi-克隆技术。用EcoRI 消化pPICZalpha,然后用Xi-克隆混合剂进行处理(根据经由 Genlantis的制备方案,Gene Therapy Systems,Inc.,San Diego, CA公司)。基因通过PCR反应进行扩增,其中末端与载体序列匹配。 使PCR产物与载体混合且转化到大肠杆菌宿主TOP10(Invitrogen) 内,并且在zeocin 25(pPICZalpha)或羧苄青霉素100(pAO815) 下进行选择。最终构建体通过测序进行验证。对于转化到毕赤酵母属 宿主内,验证的质粒DNA进行消化,以产生线性DNA并且转化到毕赤 酵母属宿主内。转化在Zeocin(pPICZalpha)或组氨酸缺陷平板下进 行选择。
所有酶通过在巴斯德毕赤酵母中表达来获得,除了在荧光假单胞 菌(参见JBC,2002,277(29):26501-26507)中表达的SEQ ID NO: 78(由SEQ ID NO:77编码)。
I.葡糖淀粉酶和淀粉酶的表征
方法:
6.蛋白质浓度的测定
表达葡糖淀粉酶和α-淀粉酶的巴斯德毕赤酵母培养物的冻干上 清液以~10mg粉末/ml的浓度悬浮于水中。在通过Bradford方案测 定蛋白质含量后,在4-20%Tris-甘氨酸梯度凝胶上运行5μg蛋白质 样品和标准化BSA溶液。在考马斯蓝染色后,在BioRad GS800凝胶扫 描仪上扫描凝胶。Bio-Rad Quantity One软件用于定量BSA和葡糖淀 粉酶(或α-淀粉酶)条带,并且随后计算实际酶浓度。相应调整蛋白 质浓度并且通过另外的SDS PAGE加以证实。
7.起始反应速率的测定
除非另有说明,测定在37℃和pH 5.0下在缓冲液(50mM NaCH3CO2、 10mM CaCl2;10mM NaN3和0.01%Triton X-100)中一式三份地进行, 所述缓冲液包含1%粗淀粉、或0.5%糊精或1%“可溶性玉米淀粉” (参见下文关于“可溶性淀粉”制备的注解)。测定对于葡糖淀粉酶 以0.5ml规模和对于α-淀粉酶以0.25ml规模在Eppendorf台式培养 箱中进行,伴随恒定振荡(800rpm)。
对于葡糖淀粉酶,通过将酶(终浓度0.25μg/ml)加入反应混 合物中起始反应。在0、2.5、5、7.5、10、15、20和30分钟时,取 出50μl反应等分试样,且通过加入100μl 1M Tris缓冲液,pH 7.5 中得到猝灭。
对于α-淀粉酶,通过将酶(对于SEQ ID NO:56、SEQ ID NO:2 和SEQ ID NO:52终浓度0.4μg总蛋白质/ml;对于SEQ ID NO:62 2μg/ml;对于SEQ ID NO:70和SEQ ID NO:664μg/ml)加入反应 混合物中起始反应,并且在2、5、10、15、20、25、30和40分钟时, 取出10μl反应等分试样,且在BCA试剂中得到猝灭。
对于温度谱的测定,在30、34、37和40℃下进行测定。
pH对葡糖淀粉酶和淀粉酶活性的影响在pH 3.5、4、5、6和7下 进行评估,使用广pH范围Britton-Robinson缓冲液(50mM CH3COOH; H3PO4;H3BO3)。还在50mM乙酸盐缓冲液的存在下执行在pH 4、5和6 下的平行反应,以确保所使用的缓冲液不影响结果。对于2种钙依赖 性α-淀粉酶(SEQ ID NO:56和SEQ ID NO:62)的pH谱测定,使用 苹果酸/乙酸盐/MES缓冲液代替Britton-Robinson。
制备“可溶性玉米淀粉”用于与α-淀粉酶反应。由于高还原末端 背景,糊精(Sigma D2006)不能在BCA α-淀粉酶反应中用作底物。 因此采用加热的玉米淀粉作为底物。具体地,使2%玉米淀粉溶解于 去离子水中,并且在沸水浴中伴随混合加热30-40分钟,直至淀粉已 溶解,和溶液看起来呈乳状,但半透明。加热淀粉溶液使用2天,这 之后观察到某些凝沉标记(淀粉凝块的出现),并且弃去溶液。
8.用于定量在淀粉水解过程中释放的葡萄糖的葡萄糖氧化酶/ 过氧化物酶(GO)测定
偶联的葡萄糖氧化酶/过氧化物酶(GO)测定用于测定在淀粉水解 过程中由葡糖淀粉酶释放的葡萄糖量。在黑色Nunc 96孔平板中,通 过将10μl猝灭的淀粉水解反应加入90μl PBS来起始GO反应,所 述PBS包含葡萄糖氧化酶(0.1U/ml)、过氧化物酶(0.25U/ml)和 0.05mM Amplex Red。在荧光平板阅读器上用Ex/Em 545/590nm读 数前,平板在室温下在黑暗中放置30分钟。具有0-100μM葡萄糖浓 度的标准曲线用于评估水解反应中产生的葡萄糖量。淀粉水解的起始 速率(由1%颗粒状淀粉释放的nmols葡萄糖/分钟/μg葡糖淀粉酶) 通过下述进行测定:标绘随着时间过去释放的葡萄糖量,且计算通过 时间点的最佳线性拟合的斜率。
9.用于测定在淀粉水解过程中还原末端浓度中的增加的BCA测 定
将10μl等分试样的淀粉酶淀粉水解反应猝灭到100μl BCA试 剂(由64mg/mL一水碳酸钠、24mg/mL碳酸氢钠、1.95mg/mL BCA、 1.24mg/mL硫酸铜五水合物、1.26mg/mL L-丝氨酸组成)内。显色 在猝灭反应于80℃35分钟的温育期间发生,并且随后为在560nm处 的吸光度测定。经过40分钟反应时间计算起始速率。构建使用麦芽糖 (0-54μM)的标准曲线,以使A560nm与所产生的还原糖浓度(nmoles) 相关。比活性表示为nmoles/分钟/μg酶。
10.葡糖淀粉酶用麦芽糖和异麦芽糖作为底物的键类型特异性
通过将酶(对于麦芽糖终浓度5μg/ml,和对于异麦芽糖30μg /ml)加入反应混合物中起始反应。在2、5、10、15、20、25、30和 40分钟时,取出5μl反应等分试样,且通过加入10μl 1M Tris缓 冲液,pH 7.5中得到猝灭。在研究中使用9种底物浓度,对于麦芽糖 为0-12mM,和对于异麦芽糖为2.5-120mM。反应在37℃和pH 5.0 下在缓冲液(50mM NaCH3CO2、10mM CaCl2)中一式三份地进行,以 50u l规模在Eppendorf台式培养箱中,伴随恒定振荡(800rpm)。 在反应结束时使用葡萄糖氧化酶/过氧化物酶(GO)测定来测量葡萄糖 生产。
结果
2.葡糖淀粉酶的表征
1.1起始反应速率:
关于颗粒状和可溶性淀粉水解的起始速率呈现于表1中。如由表 1可见的,当与基准黑曲霉酶比较时,本发明的示例性葡糖淀粉酶显 示针对颗粒状淀粉高达3x更佳的活性(SEQ ID NO:48),对于可溶 性淀粉具有相似或略微更佳的活性。SEQ ID NO:48也在大肠杆菌中 表达(参见上文关于毕赤酵母属表达构建体的部分)-这种大肠杆菌 表达酶在下表中标记为SEQ ID NO:48(Ec)。SEQ ID NO:48(Ec) 在测试条件下不显示针对颗粒状淀粉的任何活性(可能是由于缺乏淀 粉结合结构域)。
表1:在37℃、pH 5.0下,经由“前导”示例性淀粉酶和/或葡 糖淀粉酶和基准酶黑曲霉葡糖淀粉酶(Sigma A7095)的颗粒状玉米淀 粉和可溶性淀粉(糊精)水解的起始速率比较:
表1
 酶   起始速率*±SD   颗粒状淀粉  起始速率*±SD  可溶性淀粉  SEQ ID NO:48   35.6±3.8  60.7±5.1
  SEQ ID NO:26   28.8±3.4   51.8±7.4   SEQ ID NO:74   25.1±2.5   84.3±3.5   SEQ ID NO:18   24.3±4.3   58.3±3.0   SEQ ID NO:28   17.8±4.3   33.8±4.0   SEQ ID NO:14   6.6±1.2   53.9±4.1   SEQ ID NO:48(Ec)   0   59.3±8.5   黑曲霉葡糖淀粉酶   (Sigma A7095)   11.3±2.7   43.3±7.4
*起始速率表示为由1%颗粒状淀粉或由0.5%糊精释放的nmols 葡萄糖/分钟/μg葡糖淀粉酶蛋白质。每个数值是来自6-10个数据点 的平均值。
1.2温度谱:温度(30℃-40℃)对经由表征的葡糖淀粉酶的 淀粉水解的影响呈现于图1A和图1B中。葡糖淀粉酶活性随着温度增 加;它们在40℃下最有活性,但在30℃下保留约50%的峰活性。
图28A:温度对示例性淀粉酶和/或葡糖淀粉酶和葡糖淀粉酶黑曲 霉葡糖淀粉酶(基准黑曲霉葡糖淀粉酶(Sigma A7095)用颗粒状淀粉 作为底物的活性的作用。在pH 5.0下在所示温度下测定葡萄糖释放。 示例性SEQ ID NO:20不包括在该图表中,因为如测试的,它在这些 具体条件下未显示出针对颗粒状淀粉的任何活性。
图28B:温度对示例性葡糖淀粉酶SEQ ID NO:20和葡糖淀粉酶 黑曲霉葡糖淀粉酶(Sigma A7095)用可溶性淀粉(糊精)作为底物的 活性的作用。在pH 5.0下在所示温度下测定葡萄糖释放。
1.3pH谱:用颗粒状和可溶性淀粉测试pH对淀粉水解的影响以 及结果分别呈现于图2A和图2B中。所有葡糖淀粉酶在较低pH下最好 地水解2种底物,其中示例性SEQ ID NO:26在特征方面是最酸性的。
图29A:pH对葡糖淀粉酶用颗粒状淀粉作为底物的活性的作用。 在37℃下在所示pH下测量葡萄糖释放。经过20分钟计算起始速率且 转变成最高速率百分比。示例性SEQ ID NO:20不包括在该图表中, 因为它在本文测试的具体条件下未显示出针对颗粒状淀粉的任何活 性。
图29B:pH对葡糖淀粉酶用可溶性淀粉作为底物的活性的作用。 在37℃下在所示pH下测量葡萄糖释放。经过20分钟计算起始速率且 转变成最高速率百分比。
1.4键类型切割特异性:对于7种所选择的葡糖淀粉酶和基准(黑 曲霉葡糖淀粉酶(Sigma A7095)测定关于麦芽糖(α-1,4-键)(麦 芽糖是2个α-D-葡萄糖)和异麦芽糖(α-1,6-键)水解的动力学参 数。用冻干的巴斯德毕赤酵母裂解物进行实验,并且蛋白质未进行纯 化;因此在这个文件中报告仅不依赖蛋白质浓度的数据。下表2概括 了关于麦芽糖和异麦芽糖的KM值,以及与关于异麦芽糖的kcat/KM比较 的关于麦芽糖的kcat/KM比。对于黑曲霉葡糖淀粉酶(Sigma A7095)测 定的这些参数与公开数据良好一致(关于麦芽糖的KM报告为1.2- 2.1mM;关于异麦芽糖的KM报告为19.8-42.0,和关于麦芽糖的kcat/KM 超过关于异麦芽糖的kcat/KM报告为300-600,Frandesen等人1995; Sierks和Svensson;1996;Fagerstrom和Kalkkinen;1995)。
如由表2可见的,示例性葡糖淀粉酶SEQ ID NO:20对于麦芽糖 选择性最强,并且相对于α-1,6-键,具有针对α-1,4-键将近900倍 更高的特异性。选择性最少的葡糖淀粉酶是SEQ ID NO:14,相对于 α-1,6-键,具有针对α-1,4-键~100倍更高的特异性。
表2.关于经由本发明的7种示例性葡糖淀粉酶和基准(黑曲霉 葡糖淀粉酶(Sigma A7095))的麦芽糖和异麦芽糖水解的动力学参数。

每个数值是来自5次不同实验的平均值。
参考文献
1.Frandsen TP,Christensen T,Stoffer B,Lehmbeck J, Dupont C,Honzatko RB,Svensson B(1995)Biochemistry.34: 10162-9.
2.Sierks MR和Svensson B.(1996)Biochemistry;35:1865-71.
3.Fagerstrom R和Kalkkinen N.(1995)Biotechnol Appl Biochem.21:223-31.
淀粉酶的表征
起始反应速率:颗粒状和可溶性淀粉水解的起始速率呈现于表3 中。8种示例性α-淀粉酶与来自米曲霉的基准α-淀粉酶进行比较。 如由下表3可见的,当与颗粒状淀粉比较时,测试的所有淀粉酶显示 出针对可溶性淀粉显著更高的活性。然而,这种差异对于淀粉酶和/ 或葡糖淀粉酶比对于基准霉酶更不明显。
表3:在37℃和pH 5下,经由8种α-淀粉酶和来自米曲霉的基 准α-淀粉酶的颗粒状玉米淀粉和可溶性玉米淀粉水解的起始速率比 较:
表3
  示例性酶   起始速率*±SD颗粒   状淀粉   起始速率*±SD   可溶性淀粉   SEQ ID NO:56   15.7±1.67   1607.9±518.22   SEQ ID NO:70**   20.5   109.1   SEQ ID NO:62   3.5±0.37   139.6±55.96   SEQ ID NO:66**   2.1   70.8   SEQ ID NO:2   7±0.75   381.2±74.15   SEQ ID NO:52   10.3±1.75   248.2±28.46   SEQ ID NO:78   0.4±0.06   232±52.63   SEQ ID NO:76**   25.2   809.1   米曲霉淀粉酶   (MegazymeE-ANAAM)   0.4±0.07   498.7±64.78
*起始速率表示为由1%淀粉释放的nmols还原末端/分钟/μgα -淀粉酶蛋白质。
**使用纯化酶获得的数据。
-每个数值是来自5个数据点的平均值:
温度谱:温度对经由表征的α-淀粉酶的淀粉水解的影响呈现于 图30中。淀粉酶活性受温度影响至不同程度。本发明的5种示例性淀 粉酶(SEQ ID NO:56、SEQ ID NO:70、SEQ ID NO:78、SEQ ID NO: 76和SEQ ID NO:66),在40℃下最有活性,并且在30℃下保留约 30%的活性。示例性SEQ ID NO:2、SEQ ID NO:52和SEQ ID NO: 62的活性仅在边上受超过研究范围的温度中的改变的影响。
图30举例说明:温度对经由9种α-淀粉酶的淀粉水解的影响。 在pH 5.0下在40分钟温育期间在所示温度下测量活性,并且计算起 始速率且针对时间进行标绘。在图30中:
*关于示例性SEQ ID NO:56、SEQ ID NO:2和SEQ ID NO:52 的速率呈现于左轴上;关于其余酶的速率呈现于右轴上。
*起始速率表示为在250μl反应中由1%颗粒状玉米淀粉释放的 nmols还原末端/分钟/μg酶。
-示例性SEQ ID NO:70、SEQ ID NO:66和SEQ ID NO:76的活 性以nmoles/分钟/μg在巴斯德毕赤酵母上清液中的总蛋白质表示。
pH谱:用颗粒状和可溶性淀粉底物测试pH对于淀粉水解的影响 以及结果分别呈现于图31A和图31B中。示例性SEQ ID NO:52(真 菌起源)具有最低pH最适条件(~pH 4)。另一种示例性酶(SEQ ID NO:2)(真菌起源)也显示对于酸性pH的优先,具有在~pH 4.5 5下的表观最适条件。示例性淀粉酶SEQ ID NO:66(古细菌起源)具 有~pH 5.0的表观最适条件,在pH 4.0下保留~70%的峰活性。其 余酶具有pH 5.0-6.0的表观最适条件,并且在pH 4.0和3.5下几乎 无活性。
图31A:pH对α-淀粉酶用颗粒状淀粉作为底物的活性的作用。在 37℃下在所示pH下测量还原末端中的增加。经过40分钟计算起始速 率且转变成最高速率百分比。
图31B:pH对α-淀粉酶用可溶性淀粉作为底物的活性的作用。在 37℃下在所示pH下测量还原末端中的增加。经过40分钟计算起始速 率且转变成最高速率百分比。
许多实施方案已得到描述。然而,应当理解可以进行各种修饰而 不背离精神和范围。因此,其他实施方案在下述权利要求的范围内。
序列表
<110>VERENIUM CORPORATION
     SYNGENTA PARTICIPATIONS AG
     SLUPSKA,Malgorzata
     HAZLEWOOD,Geoffrey
     CHANG,Cathy
     LUGINBUHL,Peter
     BURKE,Ellen
     CAYOUETTE,Michelle
     GUNAVARDENA,Uvini
     GHASSEMIAN,Majid
     SILVERSTONE,Aron
     ZHANG,Yan
<120>淀粉酶和葡糖淀粉酶、编码其的核酸以及关于制备和使用其的方法
<130>564462015340
<140>未指定
<141>与此同时递交
<150>US 60/892,823
<151>2007-03-02
<150>US 60/877,068
<151>2006-12-21
<160>82
<170>PatentIn 3.3
<210>1
<211>1710
<212>DNA
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<400>1
gccgacacca atgcttggaa gtcccgcagc atctactttg tcctgacgga tcgtattgcc    60
cgcaacagca gcgacacggg cggctcagcg tgcagcgacc tcggcaacta ctgcggtgga   120
actttccagg gcctcgagtc taagctcgac tacatcaagg gacttggatt cgatgccatt   180
tggatcaccc ccgtcgtctc aaacaaggct gctggatacc atggctactg ggccgaggac   240
ttgtatgccg tcaactcaaa ctacggcact gctgccgact tgaagagctt ggttgccgct   300
gcccatgcca agggcatcta catgatggtc gacgttgtcg caaaccacat gggtcctgga   360
gcaatcacaa acaaccgccc tgaacctctc aaccaggctt catcatacca ccctccttgc   420
aacatcgact acaacaacca aaccagtgtc gaggtatgtc aaatagccgg actccccgac   480
atctacacca ccaagagcga gatccgcacg ctcctcaaca cctgggtcaa ctggctcgta   540
aacgagtaca gcttcgacgg tgtccgcatc gacaccgtca agcacgtcga aaaggacttt   600
tggcctggct tctctgccgc taccggtgtc tacaacattg gcgaggtgtt tgacggagac   660
ccagcctacc ttgccccgta cgccaagctt atgcccggcc tcctcaacta cgcagtctac   720
tacccgatga acaactttta ccagcaaacg ggctcttccc aggcgcttgt agacatgatg   780
aacactgtca gcaacacctt ccctgaccca tctgccttgg gaaccttcct cgacaaccac   840
gacaacaagc gctggttgaa cgtcaagaac gaccagactc tgctcaagaa cgctcttgct   900
tatgtcatcc tcgcacgtgg tatccccatc ttgtactatg gtaccgagca gggatacgct   960
ggtggtgacg acccagctaa ccgagaggat ctgtggcgca gtggcttcaa caccaatgcc  1020
aacctctacc aagccatcaa gaaactgacc gccgcccgac aggctgccgg tggtctcgca  1080
ggaaacgacc acgtccacct gtacgtcgcc gacacggctt acgcctggag ccgtgccaac  1140
ggcaacctga ttgtcctcac caccaacgct ggcggcaact ccaacaccca gcactgcttc  1200
aacacgcaaa aggcaaacgg ccgctggacc aacgtctacg gcaacggcgc caccgtctct  1260
gccgatagca acggccaaat ctgcgtctcc gtcacaaacg gcgagcccgt tgtcctcctc  1320
gccggctccg ctacccccac cactggcact accctctcca cccgcaccgc cactgccacc  1380
gccacaccaa ccgcatgccc caccgccgtc tccgtctcct tcacccaccg cgtcaccact  1440
gttcccggtg acaccatcaa aatcactggc aacacggccc agctaggtaa ctggactccc  1500
gccaacggtc ttgccttgtc cgcagctagc tacacatcca gcaaccctat ctggaccatt  1560
accgtgcccc tggccgctgg atcctccatc tcgtacaagt ttgtcaagat tgacagtgga  1620
ggaactgtca cctgggagag tgaccccaac aggtcataca ctgcgccgag ctgccaggcg  1680
agtgccggtg tgaacagctc atggcaatag                                   1710
<210>2
<211>569
<212>PRT
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<220>
<221>结构域
<222>(13)...(353)
<223>α淀粉酶,催化结构域
<220>
<221>结构域(DOMAIN)
<222>(469)...(564)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(22)...(25)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(148)...(151)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(558)...(561)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(573)...(576)
<223>N-糖基化位点.Prosite id=PS00001
<400>2
Ala Asp Thr Asn Ala Trp Lys Ser Arg Ser Ile Tyr Phe Val Leu Thr
1               5                   10                  15
Asp Arg Ile Ala Arg Asn Ser Ser Asp Thr Gly Gly Ser Ala Cys Ser
            20                  25                  30
Asp Leu Gly Asn Tyr Cys Gly Gly Thr Phe Gln Gly Leu Glu Ser Lys
        35                  40                  45
Leu Asp Tyr Ile Lys Gly Leu Gly Phe Asp Ala Ile Trp Ile Thr Pro
    50                  55                  60
Val Val Ser Asn Lys Ala Ala Gly Tyr His Gly Tyr Trp Ala Glu Asp
65                  70                  75                  80
Leu Tyr Ala Val Asn Ser Asn Tyr Gly Thr Ala Ala Asp Leu Lys Ser
                85                  90                  95
Leu Val Ala Ala Ala His Ala Lys Gly Ile Tyr Met Met Val Asp Val
            100                 105                 110
Val Ala Asn His Met Gly Pro Gly Ala Ile Thr Asn Asn Arg Pro Glu
        115                 120                 125
Pro Leu Asn Gln Ala Ser Ser Tyr His Pro Pro Cys Asn Ile Asp Tyr
    130                  35                 140
Asn Asn Gln Thr Ser Val Glu Val Cys Gln Ile Ala Gly Leu Pro Asp
145                 150                 155                 160
Ile Tyr Thr Thr Lys Ser Glu Ile Arg Thr Leu Leu Asn Thr Trp Val
                165                 170                 175
Asn Trp Leu Val Asn Glu Tyr Ser Phe Asp Gly Val Arg Ile Asp Thr
            180                 185                 190
Val Lys His Val Glu Lys Asp Phe Trp Pro Gly Phe Ser Ala Ala Thr
        195                 200                 205
Gly Val Tyr Asn Ile Gly Glu Val Phe Asp Gly Asp Pro Ala Tyr Leu
    210                 215                 220
Ala Pro Tyr Ala Lys Leu Met Pro Gly Leu Leu Asn Tyr Ala Val Tyr
225                 230                 235                 240
Tyr Pro Met Asn Asn Phe Tyr Gln Gln Thr Gly Ser Ser Gln Ala Leu
                245                 250                 255
Val Asp Met Met Asn Thr Val Ser Asn Thr Phe Pro Asp Pro Ser Ala
            260                 265                 270
Leu Gly Thr Phe Leu Asp Asn His Asp Asn Lys Arg Trp Leu Asn Val
        275                 280                 285
Lys Asn Asp Gln Thr Leu Leu Lys Asn Ala Leu Ala Tyr Val Ile Leu
    290                 295                 300
Ala Arg Gly Ile Pro Ile Leu Tyr Tyr Gly Thr Glu Gln Gly Tyr Ala
305                 310                 315                 320
Gly Gly Asp Asp Pro Ala Asn Arg Glu Asp Leu Trp Arg Ser Gly Phe
                325                 330                 335
Asn Thr Asn Ala Asn Leu Tyr Gln Ala Ile Lys Lys Leu Thr Ala Ala
            340                 345                 350
Arg Gln Ala Ala Gly Gly Leu Ala Gly Asn Asp His Val His Leu Tyr
        355                 360                 365
Val Ala Asp Thr Ala Tyr Ala Trp Ser Arg Ala Asn Gly Asn Leu Ile
    370                 375                 380
Val Leu Thr Thr Asn Ala Gly Gly Asn Ser Asn Thr Gln His Cys Phe
385                 390                 395                 400
Asn Thr Gln Lys Ala Asn Gly Arg Trp Thr Asn Val Tyr Gly Asn Gly
                405                 410                 415
Ala Thr Val Ser Ala Asp Ser Asn Gly Gln Ile Cys Val Ser Val Thr
            420                 425                 430
Asn Gly Glu Pro Val Val Leu Leu Ala Gly Ser Ala Thr Pro Thr Thr
        435                 440                 445
Gly Thr Thr Leu Ser Thr Arg Thr Ala Thr Ala Thr Ala Thr Pro Thr
    450                 455                 460
Ala Cys Pro Thr Ala Val Ser Val Ser Phe Thr His Arg Val Thr Thr
465                 470                 475                 480
Val Pro Gly Asp Thr Ile Lys Ile Thr Gly Asn Thr Ala Gln Leu Gly
                485                 490                 495
Asn Trp Thr Pro Ala Asn Gly Leu Ala Leu Ser Ala Ala Ser Tyr Thr
            500                 505                 510
Ser Ser Asn Pro Ile Trp Thr Ile Thr Val Pro Leu Ala Ala Gly Ser
        515                 520                 525
Ser Ile Ser Tyr Lys Phe Val Lys Ile Asp Ser Gly Gly Thr Val Thr
    530                 535                 540
Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Ala Pro Ser Cys Gln Ala
545                 550                 555                 560
Ser Ala Gly Val Asn Ser Ser Trp Gln
                565
<210>3
<211>1770
<212>DNA
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<400>3
atgttgttgc tcaacatctt caccaccctc ttcttctaca tcacctgcat cgtctccgcc   60
gccgacacca atgcttggaa gtcccgcagc atctactttg tcctgacgga tcgtattgcc  120
cgcaacagca gcgacacggg cggctcagcg tgcagcgacc tcggcaacta ctgcggtgga  180
actttccagg gcctcgagtc taagctcgac tacatcaagg gacttggatt cgatgccatt  240
tggattaccc ccgtcgtctc aaacaaggct gctggatacc atggctactg ggccgaggac  300
ttgtatgccg tcaactcaaa ctacggcact gctgccgact tgaagagctt ggttgccgct  360
gcccatgcca agggcatcta catgatggtc gacgttgtcg caaaccacat gggtcctgga  420
gcaatcacaa acaaccgccc tgaacctctc aaccaggctt catcatacca ccctccttgc  480
aacatcgact acaacaacca aaccagtgtc gaggtatgtc aaatagccgg actccccgac  540
atctacacca ccaagagcga gatccgcacg ctcctcaaca cctgggtcaa ctggctcgta  600
aacgagtaca gcttcgacgg tgtccgcatc gacaccgtca agcacgtcga aaaggacttt  660
tggcctggct tctctgccgc taccggtgtc tacaacattg gcgaggtgtt tgacggagac   720
ccagcctacc ttgccccgta cgccaagctt atgcccggcc tcctcaacta cgcagtctac   780
tacccgatga acaactttta ccagcaaacg ggctcttccc aggcgcttgt agacatgatg   840
aacactgtca gcaacacctt ccctgaccca tctgccttgg gaaccttcct cgacaaccac   900
gacaacaagc gctggttgaa cgtcaagaac gaccagactc tgctcaagaa cgctcttgct   960
tatgtcatcc tcgcacgtgg tatccccatc ttgtactatg gtaccgagca gggatacgct  1020
ggtggtgacg acccagctaa ccgagaggat ctgtggcgca gtggcttcaa caccaatgcc  1080
aacctctacc aagccatcaa gaaactgacc gccgcccgac aggctgccgg tggtctcgca  1140
ggaaacgacc acgtccacct gtacgtcgcc gacacggctt acgcctggag ccgtgccaac  1200
ggcaacctga ttgtcctcac caccaacgct ggcggcaact ccaacaccca gcactgcttc  1260
aacacgcaaa aggcaaacgg ccgctggacc aacgtctacg gcaacggcgc caccgtctct  1320
gccgatagca acggccaaat ctgcgtctcc gtcacaaacg gcgagcccgt tgtcctcctc  1380
gccggctccg ctacccccac cactggcact accctctcca cccgcaccgc cactgccacc  1440
gccacaccaa ccgcatgccc caccgccgtc tccgtctcct tcacccaccg cgtcaccact  1500
gttcccggtg acaccatcaa aatcactggc aacacggccc agctaggtaa ctggactccc  1560
gccaacggcc ttgccttgtc cgcagctagc tacacatcca gcaaccctat ctggaccatt  1620
accgtgcccc tggccgctgg atcctccatc tcgtacaagt ttgtcaagat tgacagtgga  1680
ggaactgtca cctgggagag tgaccccaac aggtcataca ctgcgccgag ctgccaggcg  1740
agtgccagtg tgaacagctc atggcaatag                                   1770
<210>4
<211>589
<212>PRT
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<220>
<221>信号
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(33)...(373)
<223>α淀粉酶,催化结构域
<220>
<221>结构域(DOMAIN)
<222>(489)...(586)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(42)...(45)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(168)...(171)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(578)...(581)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(593)...(596)
<223>N-糖基化位点.Prosite id=PS00001
<400>4
Met Leu Leu Leu Asn Ile Phe Thr Thr Leu Phe Phe Tyr Ile Thr Cys
1               5                   10                  15
Ile Val Ser Ala Ala Asp Thr Asn Ala Trp Lys Ser Arg Ser Ile Tyr
            20                  25                  30
Phe Val Leu Thr Asp Arg Ile Ala Arg Asn Ser Ser Asp Thr Gly Gly
        35                  40                  45
Ser Ala Cys Ser Asp Leu Gly Asn Tyr Cys Gly Gly Thr Phe Gln Gly
    50                  55                  60
Leu Glu Ser Lys Leu Asp Tyr Ile Lys Gly Leu Gly Phe Asp Ala Ile
65                  70                  75                  80
Trp Ile Thr Pro Val Val Ser Asn Lys Ala Ala Gly Tyr His Gly Tyr
                85                  90                  95
Trp Ala Glu Asp Leu Tyr Ala Val Asn Ser Asn Tyr Gly Thr Ala Ala
            100                 105                 110
Asp Leu Lys Ser Leu Val Ala Ala Ala His Ala Lys Gly Ile Tyr Met
        115                 120                 125
Met Val Asp Val Val Ala Asn His Met Gly Pro Gly Ala Ile Thr Asn
    130                 135                 140
Asn Arg Pro Glu Pro Leu Asn Gln Ala Ser Ser Tyr His Pro Pro Cys
145                 150                 155                 160
Asn Ile Asp Tyr Asn Asn Gln Thr Ser Val Glu Val Cys Gln Ile Ala
                165                 170                 175
Gly Leu Pro Asp Ile Tyr Thr Thr Lys Ser Glu Ile Arg Thr Leu Leu
            180                 185                 190
Asn Thr Trp Val Asn Trp Leu Val Asn Glu Tyr Ser Phe Asp Gly Val
        195                 200                 205
Arg Ile Asp Thr Val Lys His Val Glu Lys Asp Phe Trp Pro Gly Phe
    210                 215                 220
Ser Ala Ala Thr Gly Val Tyr Asn Ile Gly Glu Val Phe Asp Gly Asp
225                 230                 235                 240
Pro Ala Tyr Leu Ala Pro Tyr Ala Lys Leu Met Pro Gly Leu Leu Asn
                245                 250                 255
Tyr Ala Val Tyr Tyr Pro Met Asn Asn Phe Tyr Gln Gln Thr Gly Ser
            260                 265                 270
Ser Gln Ala Leu Val Asp Met Met Asn Thr Val Ser Asn Thr Phe Pro
        275                 280                 285
Asp Pro Ser Ala Leu Gly Thr Phe Leu Asp Asn His Asp Asn Lys Arg
    290                 295                 300
Trp Leu Asn Val Lys Asn Asp Gln Thr Leu Leu Lys Asn Ala Leu Ala
305                 310                 315                 320
Tyr Val Ile Leu Ala Arg Gly Ile Pro Ile Leu Tyr Tyr Gly Thr Glu
                325                 330                 335
Gln Gly Tyr Ala Gly Gly Asp Asp Pro Ala Asn Arg Glu Asp Leu Trp
            340                 345                 350
Arg Ser Gly Phe Asn Thr Asn Ala Asn Leu Tyr Gln Ala Ile Lys Lys
        355                 360                 365
Leu Thr Ala Ala Arg Gln Ala Ala Gly Gly Leu Ala Gly Asn Asp His
    370                 375                 380
Val His Leu Tyr Val Ala Asp Thr Ala Tyr Ala Trp Ser Arg Ala Asn
385                 390                 395                 400
Gly Asn Leu Ile Val Leu Thr Thr Asn Ala Gly Gly Asn Ser Asn Thr
                405                 410                 415
Gln His Cys Phe Asn Thr Gln Lys Ala Asn Gly Arg Trp Thr Asn Val
            420                 425                 430
Tyr Gly Asn Gly Ala Thr Val Ser Ala Asp Ser Asn Gly Gln Ile Cys
        435                 440                 445
Val Ser Val Thr Asn Gly Glu Pro Val Val Leu Leu Ala Gly Ser Ala
    450                 455                 460
Thr Pro Thr Thr Gly Thr Thr Leu Ser Thr Arg Thr Ala Thr Ala Thr
465                 470                 475                 480
Ala Thr Pro Thr Ala Cys Pro Thr Ala Val Ser Val Ser Phe Thr His
                485                 490                 495
Arg Val Thr Thr Val Pro Gly Asp Thr Ile Lys Ile Thr Gly Asn Thr
            500                 505                 510
Ala Gln Leu Gly Asn Trp Thr Pro Ala Asn Gly Leu Ala Leu Ser Ala
        515                 520                 525
Ala Ser Tyr Thr Ser Ser Asn Pro Ile Trp Thr Ile Thr Val Pro Leu
    530                 535                 540
Ala Ala Gly Ser Ser Ile Ser Tyr Lys Phe Val Lys Ile Asp Ser Gly
545                 550                 555                 560
Gly Thr Val Thr Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Ala Pro
                565                 570                 575
Ser Cys Gln Ala Ser Ala Ser Val Asn Ser Ser Trp Gln
            580                 585
<210>5
<211>2541
<212>DNA
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<400>5
gtgaagatct acgacgcggc tgaacaggtc tttcagatcc aggaatccgt ctggcctcgc    60
cctgctgatg acgagggcac cgaccctgaa aagtcggctt tgaccttcac ttggaccgat   120
agcccgtttt cttttgccat taaacgtagg gccaccaatg agacgctctt cgatacttcg   180
gcagcttctc ttgttttcga gacgcagtac cttcgcttaa gaaccgctct accacctttg   240
ccaaacctgt acggtcttgg tgaatcaacg gatgctttcc atctcaacac caccaactat   300
acgcgaactc tttggaatcg agatgcctat ggcacgccac caggatccaa cctctacgga   360
gctcacccga tctactttga tcaccgcggt gagaatggta ctcacggtgt tttcttggct   420
agctctgagg gtatggacat caagattgat gatactgacg gccagttcct tgagtacaac   480
actctcggtg gtgttcttga cttctacttc cttgctggac ccggccctaa ggaagttgca   540
actcaatact cagccctttc tggcttgcct gctatgatgc cttactgggg tttcggctca   600
caccaatgca agtatggcta ccgtgatgtt tgggaggttg ccgaggttgt agcaaactac   660
tctgctgctg atatcccact tgagaccatg tggaccgata tcgactacat ggagcttcgc   720
cgcttgttca ccctggatcc cgagcgttac ccgcttgagc ttgttcgcca gcttgtagac   780
tatttgcatg ctcaccaaca gcactacatt ctgatggtca actccgctgt ctggagcggt   840
gactatgatg cctacaacaa cggtgcaaag cttgaagtct tccagaagaa gagcaacggc   900
tccttcgaac agggtgctgt ctggccaggc cctactgtct ttccagattg gttccatccc   960
aacacccaga aatactggga tgaggaattc gctcgcttct tcgaccccgc tactggtgtt  1020
gatatcgatg gactttggaa tgacatgaat gaacccgcca acttctgccc atacccctgc  1080
tcagaccctg aagcctattc tgaggagtcc aagaacccac ccgagccacc ggcggtgcgc  1140
acttctgcag gtcgccaaat ccctggcttc ccagcaggtt tccagccaca gtctaactct  1200
agcactgcaa ggcgttctgt tgtaaaggga ccatctagca tgcgtccttc caagcgccaa  1260
gcgcctaaca gcgctggaga tgctaagcac ctcggtcttc ccggtcgtga tctgatcaac  1320
cccaagtacc agatccacaa cgaagccggt tcaatcagca acaggaccct ggctacggat  1380
atcaagaatt acgatggctc ttatcactac gatacgcaca acttctgggg ctcgatgatg  1440
agcattacct ctcacaagtc tatgcaagct cgccgtcccg aaagacggcc attcattatc  1500
actaggtcat ctttccctgg cctcggttct tatctcggaa agtggcttgg tgacaacgtc  1560
tccgagtggg cacaataccg cttctcgatt gccggcatct tgaactteaa caccatcttc  1620
cagatcccca tggtcggtcc agatatttgc ggtttcgccg gaaacacgac cgagactctc  1680
tgcgcccgct ggaccactct tggtgctttc tacccgttca tgaggaacca cgccggcgac  1740
acttccatca gccaagaata ctatcgctgg cctctcacca gggccgcagc caagaacgcc  1800
atcgcagtca ggtacaggct cttggactac ttctacacgg ccttccaccg ccaggccacc  1860
accggtctac ccagcttgaa ccccctcttc ttccactacc ccaccgacgc caaaaccttc  1920
ggcattgagc accagttctt ctacggagac agcatcctcg tctcgcccgt cctcgaagaa  1980
aactccacct cagtctccat ctacctcccc aaagatgtct tctacgacta ctggaccggc  2040
gagcgcatcc aaggaaacgg cgagaacatt aacctcactg acgtaggatt cgacaccatc  2100
cccctccacg tcaaaggtgg atccatcctc cctctccgcg ccgaatccgc aaacacaacc  2160
accgagctcc gcaaacaaaa ctttgtcctc tggatcgcac caaatgctac caaccaagcc  2220
tctggctcgc tctacctcga tgatggagat tccctcgagc agaagtctac ttcgctcatt  2280
aacttctcct tcaacaacgg cgccttcagc atgagcggcg atttcggatt cgagactgag  2340
cttgtcattc agaatatcac catcctgggt acctcgcaga gcgtacaggg ccctgttgcg  2400
cttaccaagg gctgggaaca taactttggg gctggtgctg gtatgccgca gtttgatagt  2460
ggtgcagccg agtcgcgtcg agttgttgct gcagtttggg gtttggttgc gggggctgtc  2520
agtgtttggt tcagcttgta a                                            2541
<210>6
<211>846
<212>PRT
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<220>
<221>结构域(DOMAIN)
<222>(169)...(710)
<223>糖基水解酶家族31
<220>
<221>SITE
<222>(53)...(56)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(97)...(100)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(134)...(137)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(222)...(225)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(303)...(306)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(349)...(356)
<223>糖基水解酶家族31活性位点.Prosite id=PS00129
<220>
<221>SITE
<222>(405)...(408)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(554)...(584)
<223>糖基水解酶家族31标记2.Prosite id=PS00707
<220>
<221>SITE
<222>(563)...(566)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(671)...(674)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(701)...(704)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(729)...(732)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(746)...(749)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(772)...(775)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(797)...(800)
<223>N-糖基化位点.Prosite id=PS00001
<400>6
Met Lys Ile Tyr Asp Ala Ala Glu Gln Val Phe Gln Ile Gln Glu Ser
1               5                   10                  15
Val Trp Pro Arg Pro Ala Asp Asp Glu Gly Thr Asp Pro Glu Lys Ser
            20                  25                  30
Ala Leu Thr Phe Thr Trp Thr Asp Ser Pro Phe Ser Phe Ala Ile Lys
        35                  40                  45
Arg Arg Ala Thr Asn Glu Thr Leu Phe Asp Thr Ser Ala Ala Ser Leu
    50                  55                  60
Val Phe Glu Thr Gln Tyr Leu Arg Leu Arg Thr Ala Leu Pro Pro Leu
65                  70                  75                  80
Pro Asn Leu Tyr Gly Leu Gly Glu Ser Thr Asp Ala Phe His Leu Asn
                85                  90                  95
Thr Thr Asn Tyr Thr Arg Thr Leu Trp Asn Arg Asp Ala Tyr Gly Thr
            100                 105                 110
Pro Pro Gly Ser Asn Leu Tyr Gly Ala His Pro Ile Tyr Phe Asp His
        115                 120                 125
Arg Gly Glu Asn Gly Thr His Gly Val Phe Leu Ala Ser Ser Glu Gly
    130                 135                 140
Met Asp Ile Lys Ile Asp Asp Thr Asp Gly Gln Phe Leu Glu Tyr Asn
145                 150                 155                 160
Thr Leu Gly Gly Val Leu Asp Phe Tyr Phe Leu Ala Gly Pro Gly Pro
                165                 170                 175
Lys Glu Val Ala Thr Gln Tyr Ser Ala Leu Ser Gly Leu Pro Ala Met
            180                 185                 190
Met Pro Tyr Trp Gly Phe Gly Ser His Gln Cys Lys Tyr Gly Tyr Arg
        195                 200                 205
Asp Val Trp Glu Val Ala Glu Val Val Ala Asn Tyr Ser Ala Ala Asp
    210                 215                 220
Ile Pro Leu Glu Thr Met Trp Thr Asp Ile Asp Tyr Met Glu Leu Arg
225                 230                 235                 240
Arg Leu Phe Thr Leu Asp Pro Glu Arg Tyr Pro Leu Glu Leu Val Arg
                245                 250                 255
Gln Leu Val Asp Tyr Leu His Ala His Gln Gln His Tyr Ile Leu Met
            260                 265                 270
Val Asn Ser Ala Val Trp Ser Gly Asp Tyr Asp Ala Tyr Asn Asn Gly
        275                 280                 285
Ala Lys Leu Glu Val Phe Gln Lys Lys Ser Asn Gly Ser Phe Glu Gln
    290                 295                 300
Gly Ala Val Trp Pro Gly Pro Thr Val Phe Pro Asp Trp Phe His Pro
305                 310                 315                 320
Asn Thr Gln Lys Tyr Trp Asp Glu Glu Phe Ala Arg Phe Phe Asp Pro
                325                 330                 335
Ala Thr Gly Val Asp Ile Asp Gly Leu Trp Asn Asp Met Asn Glu Pro
            340                 345                 350
Ala Asn Phe Cys Pro Tyr Pro Cys Ser Asp Pro Glu Ala Tyr Ser Glu
        355                 360                 365
Glu Ser Lys Asn Pro Pro Glu Pro Pro Ala Val Arg Thr Ser Ala Gly
    370                 375                 380
Arg Gln Ile Pro Gly Phe Pro Ala Gly Phe Gln Pro Gln Ser Asn Ser
385                 390                 395                 400
Ser Thr Ala Arg Arg Ser Val Val Lys Gly Pro Ser Ser Met Arg Pro
                405                 410                 415
Ser Lys Arg Gln Ala Pro Asn Ser Ala Gly Asp Ala Lys His Leu Gly
            420                 425                 430
Leu Pro Gly Arg Asp Leu Ile Asn Pro Lys Tyr Gln Ile His Asn Glu
        435                 440                 445
Ala Gly Ser Ile Ser Asn Arg Thr Leu Ala Thr Asp Ile Lys Asn Tyr
    450                 455                 460
Asp Gly Ser Tyr His Tyr Asp Thr His Asn Phe Trp Gly Ser Met Met
465                 470                 475                 480
Ser Ile Thr Ser His Lys Ser Met Gln Ala Arg Arg Pro Glu Arg Arg
                485                 490                 495
Pro Phe Ile Ile Thr Arg Ser Ser Phe Pro Gly Leu Gly Ser Tyr Leu
            500                 505                 510
Gly Lys Trp Leu Gly Asp Asn Val Ser Glu Trp Ala Gln Tyr Arg Phe
        515                 520                 525
Ser Ile Ala Gly Ile Leu Asn Phe Asn Thr Ile Phe Gln Ile Pro Met
    530                 535                 540
Val Gly Pro Asp Ile Cys Gly Phe Ala Gly Asn Thr Thr Glu Thr Leu
545                 550                 555                 560
Cys Ala Arg Trp Thr Thr Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn
                565                 570                 575
His Ala Gly Asp Thr Ser Ile Ser Gln Glu Tyr Tyr Arg Trp Pro Leu
            580                 585                 590
Thr Arg Ala Ala Ala Lys Asn Ala Ile Ala Val Arg Tyr Arg Leu Leu
        595                 600                 605
Asp Tyr Phe Tyr Thr Ala Phe His Arg Gln Ala Thr Thr Gly Leu Pro
    610                 615                 620
Ser Leu Asn Pro Leu Phe Phe His Tyr Pro Thr Asp Ala Lys Thr Phe
625                 630                 635                 640
Gly Ile Glu His Gln Phe Phe Tyr Gly Asp Ser Ile Leu Val Ser Pro
                645                 650                 655
Val Leu Glu Glu Asn Ser Thr Ser Val Ser Ile Tyr Leu Pro Lys Asp
            660                 665                 670
Val Phe Tyr Asp Tyr Trp Thr Gly Glu Arg Ile Gln Gly Asn Gly Glu
        675                 680                 685
Asn Ile Asn Leu Thr Asp Val Gly Phe Asp Thr Ile Pro Leu His Val
    690                 695                 700
Lys Gly Gly Ser Ile Leu Pro Leu Arg Ala Glu Ser Ala Asn Thr Thr
705                 710                 715                 720
Thr Glu Leu Arg Lys Gln Asn Phe Val Leu Trp Ile Ala Pro Asn Ala
                725                 730                 735
Thr Asn Gln Ala Ser Gly Ser Leu Tyr Leu Asp Asp Gly Asp Ser Leu
            740                 745                 750
Glu Gln Lys Ser Thr Ser Leu Ile Asn Phe Ser Phe Asn Asn Gly Ala
        755                 760                 765
Phe Ser Met Ser Gly Asp Phe Gly Phe Glu Thr Glu Leu Val Ile Gln
    770                 775                 780
Asn Ile Thr Ile Leu Gly Thr Ser Gln Ser Val Gln Gly Pro Val Ala
785                 790                 795                 800
Leu Thr Lys Gly Trp Glu His Asn Phe Gly Ala Gly Ala Gly Met Pro
                805                 810                 815
Gln Phe Asp Ser Gly Ala Ala Glu Ser Arg Arg Val Val Ala Ala Val
            820                 825                 830
Trp Gly Leu Val Ala Gly Ala Val Ser Val Trp Phe Ser Leu
        835                 840                 845
<210>7
<211>1572
<212>DNA
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<400>7
atgctccctc gcgtgttcct cctcacaggc ttcgtccacc atgcctacac attatcaata    60
cctcgtcttc cctccctcgc cacttttgct gcttccagcc gtgtgcagca acagcaaccg   120
cttcaagaca cacttgatgc ctggataaag catgaagagc gtattgcact cgataaactg   180
ctcgccaaca tcgcgcctgg aggtagcaat gtccaaggaa aaggtgtggc tgagggcacc   240
gtcatcgcca gccctagtca agacggtccg gactactggt tccaatgggt ccgtgacgct   300
gctatcacca tggataccct cgtcaacatc tatgccgatg acccctcgtc ctcgcgtgcg   360
tcttctctat ccaccatcct agacgcatac acctccctcc aaggtgacat tcagcgcact   420
tcaaacccgt ctggcacatt tgacgacctt tccggactag gtgagcccaa gttccaagtc   480
gatggcaagc catttaccgg ctcgtgggga cgacctcagc gcgatgggcc ggcccttcgc   540
gcactgacgc ttatgcatta tctccgcgag tacaatgcat cccatccctc actatggagc   600
tctcccaact cggaagactt ttttggctcg ttctacaccg ctgaaatgcc ccctcgtagc   660
atcatcaaag cagatctcga gtatgtcagc catttctgga accagtcagg gttcgatctc   720
tgggaagagg tcgagggcct gcacttcttc accctcatgg tcagcgcgag gagtctgagg   780
gaaggcagtc acctggcaag agtctttgga gacgtcggtg cggcggattg gtaccaaaag   840
caagctggct acattgagaa cctgttgggc aaattctgga atgcgcaaaa aggacatctt   900
gttgagacgc tttggagcaa gaggagtggc ctcgactgcg gactgcttct cggctctttg   960
cacgcccttc ctaagagcgg atctgaagat gatgatgttg tgtaccctcc gtggtctgac  1020
gagattcttg tttctctgct tgctttgact cgagaccagc gcgaccgttt ccccatcaac  1080
agcaatcctt ctggccagga tgacgacgat gacgacgtag acgagtccac attccaggga  1140
acaggccttg gtcgttatcc cgaggatgta tacgacggct atggaaactc gaaccgtggt  1200
ggaaacccat ggttcctttg cacctcttct gccgccgaga ttctttaccg caccgcctcg  1260
cacatctctg caactggcaa cttgactctt accgatgttg gccttccctt ttacgagtct  1320
ctcctcggta gctcctccct agatgtcgac gttggcacgt ttggccccac agacgccctt  1380
ttccactccg tcatcgagcg ccttcagagc accggcgacg agtttctgca agtcgtcaag  1440
acgcatgtgg atgccgaggg cagcatgagt gagcagtttg accgtgtaac tgggtacatg  1500
cgtggtgccc agcatttgac ttggagttat ggtgcctttt tgcaggctgc tagagcaaga  1560
aagatttctg tg                                                      1572
<210>8
<211>524
<212>PRT
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48331
<220>
<221>结构域(DOMAIN)
<222>(54)...(518)
<223>糖基水解酶家族15
<220>
<221>SITE
<222>(194)...(197)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(237)...(240)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(239)...(249)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(433)...(436)
<223>N-糖基化位点.Prosite id=PS00001
<400>8
Met Leu Pro Arg Val Phe Leu Leu Thr Gly Phe Val His His Ala Tyr
1               5                   10                  15
Thr Leu Ser Ile Pro Arg Leu Pro Ser Leu Ala Thr Phe Ala Ala Ser
            20                  25                  30
Ser Arg Val Gln Gln Gln Gln Pro Leu Gln Asp Thr Leu Asp Ala Trp
        35                  40                  45
Ile Lys His Glu Glu Arg Ile Ala Leu Asp Lys Leu Leu Ala Asn Ile
    50                  55                  60
Ala Pro Gly Gly Ser Asn Val Gln Gly Lys Gly Val Ala Glu Gly Thr
65                  70                  75                  80
Val Ile Ala Ser Pro Ser Gln Asp Gly Pro Asp Tyr Trp Phe Gln Trp
                85                  90                  95
Val Arg Asp Ala Ala Ile Thr Met Asp Thr Leu Val Asn Ile Tyr Ala
            100                 105                 110
Asp Asp Pro Ser Ser Ser Arg Ala Ser Ser Leu Ser Thr Ile Leu Asp
        115                 120                 125
Ala Tyr Thr Ser Leu Gln Gly Asp Ile Gln Arg Thr Ser Asn Pro Ser
    130                 135                 140
Gly Thr Phe Asp Asp Leu Ser Gly Leu Gly Glu Pro Lys Phe Gln Val
145                 150                 155                 160
Asp Gly Lys Pro Phe Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly
                165                 170                 175
Pro Ala Leu Arg Ala Leu Thr Leu Met His Tyr Leu Arg Glu Tyr Asn
            180                 185                 190
Ala Ser His Pro Ser Leu Trp Ser Ser Pro Asn Ser Glu Asp Phe Phe
        195                 200                 205
Gly Ser Phe Tyr Thr Ala Glu Met Pro Pro Arg Ser Ile Ile Lys Ala
    210                 215                 220
Asp Leu Glu Tyr Val Ser His Phe Trp Asn Gln Ser Gly Phe Asp Leu
225                 230                 235                 240
Trp Glu Glu Val Glu Gly Leu His Phe Phe Thr Leu Met Val Ser Ala
                245                 250                 255
Arg Ser Leu Arg Glu Gly Ser His Leu Ala Arg Val Phe Gly Asp Val
            260                 265                 270
Gly Ala Ala Asp Trp Tyr Gln Lys Gln Ala Gly Tyr Ile Glu Asn Leu
        275                 280                 285
Leu Gly Lys Phe Trp Asn Ala Gln Lys Gly His Leu Val Glu Thr Leu
    290                 295                 300
Trp Ser Lys Arg Ser Gly Leu Asp Cys Gly Leu Leu Leu Gly Ser Leu
305                 310                 315                 320
His Ala Leu Pro Lys Ser Gly Ser Glu Asp Asp Asp Val Val Tyr Pro
                325                 330                 335
Pro Trp Ser Asp Glu Ile Leu Val Ser Leu Leu Ala Leu Thr Arg Asp
            340                 345                 350
Gln Arg Asp Arg Phe Pro Ile Asn Ser Asn Pro Ser Gly Gln Asp Asp
        355                 360                 365
Asp Asp Asp Asp Val Asp Glu Ser Thr Phe Gln Gly Thr Gly Leu Gly
    370                 375                 380
Arg Tyr Pro Glu Asp Val Tyr Asp Gly Tyr Gly Asn Ser Asn Arg Gly
385                 390                 395                 400
Gly Asn Pro Trp Phe Leu Cys Thr Ser Ser Ala Ala Glu Ile Leu Tyr
                405                 410                 415
Arg Thr Ala Ser His Ile Ser Ala Thr Gly Asn Leu Thr Leu Thr Asp
            420                 425                 430
Val Gly Leu Pro Phe Tyr Glu Ser Leu Leu Gly Ser Ser Ser Leu Asp
        435                 440                 445
Val Asp Val Gly Thr Phe Gly Pro Thr Asp Ala Leu Phe His Ser Val
    450                 455                 460
Ile Glu Arg Leu Gln Ser Thr Gly Asp Glu Phe Leu Gln Val Val Lys
465                 470                 475                 480
Thr His Val Asp Ala Glu Gly Ser Met Ser Glu Gln Phe Asp Arg Val
                485                 490                 495
Thr Gly Tyr Met Arg Gly Ala Gln His Leu Thr Trp Ser Tyr Gly Ala
            500                 505                 510
Phe Leu Gln Ala Ala Arg Ala Arg Lys Ile Ser Val
        515                 520
<210>9
<211>1467
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>9
atgttgacat tgaatgtttt gacggcactg ttggcacctg gtgtgctatc atctgccttg    60
cctgctcgcg atctcaatgt gcgtgccgat tcaaagcctc ctgctcttca agccatcctg   120
aataacattg gcgccgatgg atctgctgtt tcgggagcat ctgccggcgt tgtggtagca   180
tccccatcta aatcggatcc cgattacttt tacacctgga cgcgtgatgc agccttgaca   240
tacaaggtct tgattgatga gctcattgcc ggagacacct cgctggaatc taccatccag   300
gactacatct ctgctcaagc aaagctgcag gccgtgtcta acccatctgg tgacttgtcc   360
gatggatcag gtcttgcaga gcccaagtac cacgtggact tgactgcctt cacggaggcc   420
tggggtcgtc ctcagcgcga tggacccgct ctgcgagcga cagctctgat tacctatggt   480
aactatttga tttcgaagga gaagacatct gtcgtcaagt cgaacatctg gcccattgtg   540
caaaatgatc tgaactatgt tgcgcaatac tggaaccaaa ccggattcga tctgtgggag   600
gaggtccagg gctcctcatt cttcaccatt gctgcacaac accgcgcatt ggtggaaggc   660
agcgcatttg ccaaggcgct gggagagtcc tgcgagggat gcgattccca ggcacctcag   720
gtcttatgct tccagcaatc tttctggaat ggcaaggctg ttgtttccaa ctttgccaac   780
aatggtcgaa ccggtcttga tgccaattct gtacttactt cgattgtaaa ctttgacccc   840
aaagctccat gcgatgacgt taccttccag ccttgctctg ctcgtgccct gtcgaaccac   900
aagctatacg ttgactcgtt ccgtaagatc tatcccgtga acagcggcaa ggaagctgga   960
actgccgttg ctgttggacg ttatgccgag gacacttaca tgggcggcaa cccatggtac  1020
ttgaccaccc tggccgcggc cgagcagttg tatgatgctc tttaccagtg gaagcaactg  1080
ggatcgctgg aaatcaccga ggccagtctt cctttcttca aggatcttgt ttcgtctgcc  1140
gccgctggga agtaccctag ctcctcggaa acttacacgt ccatcactgc cgcagtcaag  1200
aaatatgccg atggatttat ggctgttgtt aaggagcaca cgcctagcga tggatctcta  1260
tccgaacaat tcactcggga caacggcagc ccggcctctg ctaaggactt gacctggtcc  1320
tacgcggcgt tgctgtctgc tactcgacgt gaggctggaa cagtgccccc tagctggggc  1380
gcgtcgactg ccaataaagt gccctcaaag tgtgagggaa gctcggccaa gggaagctac  1440
acgactccat cggtcggcaa gtggtaa    1467
<210>10
<211>488
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(22)
<220>
<221>结构域(DOMAIN)
<222>(33)...(449)
<223>糖基水解酶家族15
<220>
<221>SITE
<222>(194)...(197)
<223>N-糖基化位点.Prosite id=PS00001
<400>10
Met Leu Thr Leu Asn Val Leu Thr Ala Leu Leu Ala Pro Gly Val Leu
1               5                 10                  15
Ser Ser Ala Leu Pro Ala Arg Asp Leu Asn Val Arg Ala Asp Ser Lys
            20                  25                  30
Pro Pro Ala Leu Gln Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ser
        35                  40                  45
Ala Val Ser Gly Ala Ser Ala Gly Val Val Val Ala Ser Pro Ser Lys
    50                  55                  60
Ser Asp Pro Asp Tyr Phe Tyr Thr Trp Thr Arg Asp Ala Ala Leu Thr
65                  70                  75                  80
Tyr Lys Val Leu Ile Asp Glu Leu Ile Ala Gly Asp Thr Ser Leu Glu
                85                  90                  95
Ser Thr Ile Gln Asp Tyr Ile Ser Ala Gln Ala Lys Leu Gln Ala Val
            100                 105                 110
Ser Asn Pro Ser Gly Asp Leu Ser Asp Gly Ser Gly Leu Ala Glu Pro
        115                 120                 125
Lys Tyr His Val Asp Leu Thr Ala Phe Thr Glu Ala Trp Gly Arg Pro
    130                 135                 140
Gln Arg Asp Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly
145                 150                 155                 160
Asn Tyr Leu Ile Ser Lys Glu Lys Thr Ser Val Val Lys Ser Asn Ile
                165                 170                 175
Trp Pro Ile Val Gln Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn
            180                 185                 190
Gln Thr Gly Phe Asp Leu Trp Glu Glu Val Gln Gly Ser Ser Phe Phe
        195                 200                 205
Thr Ile Ala Ala Gln His Arg Ala Leu Val Glu Gly Ser Ala Phe Ala
    210                 215                 220
Lys Ala Leu Gly Glu Ser Cys Glu Gly Cys Asp Ser Gln Ala Pro Gln
225                 230                 235                 240
Val Leu Cys Phe Gln Gln Ser Phe Trp Asn Gly Lys Ala Val Val Ser
                245                 250                 255
Asn Phe Ala Asn Asn Gly Arg Thr Gly Leu Asp Ala Asn Ser Val Leu
            260                 265                 270
Thr Ser Ile Val Asn Phe Asp Pro Lys Ala Pro Cys Asp Asp Val Thr
        275                 280                 285
Phe Gln Pro Cys Ser Ala Arg Ala Leu Ser Asn His Lys Leu Tyr Val
    290                 295                 300
Asp Ser Phe Arg Lys Ile Tyr Pro Val Asn Ser Gly Lys Glu Ala Gly
305                 310                 315                 320
Thr Ala Val Ala Val Gly Arg Tyr Ala Glu Asp Thr Tyr Met Gly Gly
                325                 330                 335
Asn Pro Trp Tyr Leu Thr Thr Leu Ala Ala Ala Glu Gln Leu Tyr Asp
            340                 345                 350
Ala Leu Tyr Gln Trp Lys Gln Leu Gly Ser Leu Glu Ile Thr Glu Ala
        355                 360                 365
Ser Leu Pro Phe Phe Lys Asp Leu Val Ser Ser Ala Ala Ala Gly Lys
    370                 375                 380
Tyr Pro Ser Ser Ser Glu Thr Tyr Thr Ser Ile Thr Ala Ala Val Lys
385                 390                 395                 400
Lys Tyr Ala Asp Gly Phe Met Ala Val Val Lys Glu His Thr Pro Ser
                405                 410                 415
Asp Gly Ser Leu Ser Glu Gln Phe Thr Arg Asp Asn Gly Ser Pro Ala
            420                 425                 430
Ser Ala Lys Asp Leu Thr Trp Ser Tyr Ala Ala Leu Leu Ser Ala Thr
        435                 440                 445
Arg Arg Glu Ala Gly Thr Val Pro Pro Ser Trp Gly Ala Ser Thr Ala
    450                 455                 460
Asn Lys Val Pro Ser Lys Cys Glu Gly Ser Ser Ala Lys Gly Ser Tyr
465                 470                 475                 480
Thr Thr Pro Ser Val Gly Lys Trp
                485
<210>11
<211>1746
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>11
atgtttaatc aagttctcta tggcttggct gccactgcac tatggcaggg ccaagtcgtc     60
gcttcaccaa gcaaagacaa ctccctcgag aagttcatca ccaagcaagc cgatatttcc    120
atcaaaggtg tcctcgccaa tatcggctct gatggtaaac gtgcacaagg tgcagcgcct    180
ggtgccgtcg tcgcaagccc atcacgagaa gaccctgact attggtacac ttggacgcgt    240
gactcagcct tgacttataa ggtcctcgtc gagcgtctca tccacggcga aaagtctctc    300
cagcggaaga tagacgaata cgtctccgct caagccaaac ttcagaaaac cacaaaccca   360
tccggtagtc cagagtccgg tggtctcggc gagccaaagt tccacgtgaa cctcactgcc   420
ttcaccggat cttggggccg cccacagcgc gatggtcctc ctctgcgtgc tacagccttg   480
accctatacg cagagtggct catctcccac ggagacaagt ccaaggctgt gaacaaagtg   540
tggccagtga ttgagaagga tcttgcgtat actaccaagt tctggaatcg cactgggtat   600
gatctctggg aagaagtcaa tggatcttct ttctttacgc tatcggcttc gcatcgggct   660
ctcattgagg gagcggcttt ggcgaagaag ttgggcaagt cttgccctga ctgtgctgcc   720
aatgcccctc gtgtcctttg cttcatgcag agcttttgga ctggtggtta cattgactcg   780
aacatcaatg tgaaggatgg tcgcaagggc ttggatgcta actccattct gtcatcgatc   840
cacacatttg atcccaactc caaatgcacc gactcgacat tccagccttg ctcctcacga   900
gcgctcgcca accacaaggc ggtggtcgac tctttcaggt ccatctacat tgtcaacaag   960
aacagaggca aaggtaaagc cgcagctgtt ggcagataca gtgaggatgt gtactacaac  1020
ggcaaccctt ggtacttgac taccctcgcc gctgctgagc aattgtacgc cgcgctgtac  1080
caatggaaca aggttggggc tgtctcaatt gacgacgttt ctttaccttt cttccgggac  1140
cttgtgccta agggatccaa gggcacgtat aagaagaaca gcaagacgta caaggagatc  1200
gtcaaggctg tcaaggccta cgctgacggg tttgtcgctg ttgttcaaac ctacacaccc  1260
aaagatggtt cgctagccga gcagttcgac cgagccactg gtactcccaa atcggcggtc  1320
catctcactt ggtcttacgc ctccttcgtc agcgcgaccg aacgtcgctc cagcatcgtc  1380
tctccctctt ggggcgagag cagcgccaat aaggttcctg cagtatgcga agcagccccg  1440
gcttgtgaca cgacgataac cttcaacgtg aagaatgtgg aagtgtcttc tgaccagaag  1500
gtttacgtcg ttggctccgt gactgaactt tccaactggt cacctgatga gggcatacca  1560
ctcacggagg gtaccaaggg gttgtggagt gccaaggtta agattccttc tgatacaagc  1620
tttgagtata agtacatcaa gaagacaagt ggcggagatg ttacgtggtt gagcgacccg  1680
aacaatcggg ctgttacggg cagtaagtgt ggaagcgcga gtactcttga taatgagtgg  1740
aggtag                                                             1746
<210>12
<211>581
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(21)
<220>
<221>结构域(DOMAIN)
<222>(38)...(454)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(483)...(576)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(139)...(142)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(199)...(202)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(201)...(211)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(210)...(213)
<223>N-糖基化位点.Prosite id=PS00001
<400>12
Met Phe Asn Gln Val Leu Tyr Gly Leu Ala Ala Thr Ala Leu Trp Gln
1               5                   10                  15
Gly Gln Val Val Ala Ser Pro Ser Lys Asp Asn Ser Leu Glu Lys Phe
            20                  25                  30
Ile Thr Lys Gln Ala Asp Ile Ser Ile Lys Gly Val Leu Ala Asn Ile
        35                  40                  45
Gly Ser Asp Gly Lys Arg Ala Gln Gly Ala Ala Pro Gly Ala Val Val
    50                  55                  60
Ala Ser Pro Ser Arg Glu Asp Pro Asp Tyr Trp Tyr Thr Trp Thr Arg
65                  70                  75                  80
Asp Ser Ala Leu Thr Tyr Lys Val Leu Val Glu Arg Leu Ile His Gly
                85                  90                  95
Glu Lys Ser Leu Gln Arg Lys Ile Asp Glu Tyr Val Ser Ala Gln Ala
            100                 105                 110
Lys Leu Gln Lys Thr Thr Asn Pro Ser Gly Ser Pro Glu Ser Gly Gly
        115                 120                 125
Leu Gly Glu Pro Lys Phe His Val Asn Leu Thr Ala Phe Thr Gly Ser
    130                 135                 140
Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala Thr Ala Leu
145                 150                 155                 160
Thr Leu Tyr Ala Glu Trp Leu Ile Ser His Gly Asp Lys Ser Lys Ala
                165                 170                 175
Val Asn Lys Val Trp Pro Val Ile Glu Lys Asp Leu Ala Tyr Thr Thr
            180                 185                 190
Lys Phe Trp Asn Arg Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly
        195                 200                 205
Ser Ser Phe Phe Thr Leu Ser Ala Ser His Arg Ala Leu Ile Glu Gly
    210                 215                 220
Ala Ala Leu Ala Lys Lys Leu Gly Lys Ser Cys Pro Asp Cys Ala Ala
225                 230                 235                 240
Asn Ala Pro Arg Val Leu Cys Phe Met Gln Ser Phe Trp Thr Gly Gly
                245                 250                 255
Tyr Ile Asp Ser Asn Ile Asn Val Lys Asp Gly Arg Lys Gly Leu Asp
            260                 265                 270
Ala Asn Ser Ile Leu Ser Ser Ile His Thr Phe Asp Pro Asn Ser Lys
        275                 280                 285
Cys Thr Asp Ser Thr Phe Gln Pro Cys Ser Ser Arg Ala Leu Ala Asn
    290                 295                 300
His Lys Ala Val Val Asp Ser Phe Arg Ser Ile Tyr Ile Val Asn Lys
305                 310                 315                 320
Asn Arg Gly Lys Gly Lys Ala Ala Ala Val Gly Arg Tyr Ser Glu Asp
                325                 330                 335
Val Tyr Tyr Asn Gly Asn Pro Trp Tyr Leu Thr Thr Leu Ala Ala Ala
            340                 345                 350
Glu Gln Leu Tyr Ala Ala Leu Tyr Gln Trp Asn Lys Val Gly Ala Val
        355                 360                 365
Ser Ile Asp Asp Val Ser Leu Pro Phe Phe Arg Asp Leu Val Pro Lys
    370                 375                 380
Gly Ser Lys Gly Thr Tyr Lys Lys Asn Ser Lys Thr Tyr Lys Glu Ile
385                 390                 395                 400
Val Lys Ala Val Lys Ala Tyr Ala Asp Gly Phe Val Ala Val Val Gln
                405                 410                 415
Thr Tyr Thr Pro Lys Asp Gly Ser Leu Ala Glu Gln Phe Asp Arg Ala
            420                 425                 430
Thr Gly Thr Pro Lys Ser Ala Val His Leu Thr Trp Ser Tyr Ala Ser
        435                 440                 445
Phe Val Ser Ala Thr Glu Arg Arg Ser Ser Ile Val Ser Pro Ser Trp
    450                 455                 460
Gly Glu Ser Ser Ala Asn Lys Val Pro Ala Val Cys Glu Ala Ala Pro
465                 470                 475                 480
Ala Cys Asp Thr Thr Ile Thr Phe Asn Val Lys Asn Val Glu Val Ser
                485                 490                 495
Ser Asp Gln Lys Val Tyr Val Val Gly Ser Val Thr Glu Leu Ser Asn
            500                 505                 510
Trp Ser Pro Asp Glu Gly Ile Pro Leu Thr Glu Gly Thr Lys Gly Leu
        515                 520                 525
Trp Ser Ala Lys Val Lys Ile Pro Ser Asp Thr Ser Phe Glu Tyr Lys
    530                 535                 540
Tyr Ile Lys Lys Thr Ser Gly Gly Asp Val Thr Trp Leu Ser Asp Pro
545                 550                 555                 560
Asn Asn Arg Ala Val Thr Gly Ser Lys Cys Gly Ser Ala Ser Thr Leu
                565                 570                 575
Asp Asn Glu Trp Arg
            580
<210>13
<211>1749
<212>DNA
<213>Fusarium verticillioides GZ3639
<400>13
atgtttactc agatcttgta tggcctcacg gccttatctg ccctccaagg tcaggtcact     60
gcatcaccag gcggttccag ccttgatcgc ttcatttcca aagaggccga catctccatc    120
aagggcgtgc ttgccaatat tggcgccgat ggcaagcgag cccaaggcgc tgcacctggc    180
gccgttgtag caagtccatc gagaacagat ccagactact ggtacacatg gacccgagac    240
tccgccttga catacaaagt ccttgttgag cgcttcattc acggagacaa gtctctccag    300
cgcaagatcg acgaatatgt ctctgcccaa gccaagctcc agggcgtcac caacccatct    360
ggcggccccg agtcaggcgg ccttggggaa cccaagtttc acgtcaacct cacagctttc    420
acaggatcct ggggtcgtcc tcaacgagat ggccctcctc tgagagctac tgcattgacg    480
ctgtacgcca actggcttgt ttctcacggc gaccgctcca aggccgtcaa caaggtttgg    540
cctgteattg agaaggatct tgcatacacc gtcaagttct ggaacagaac cggttacgat    600
ctttgggagg aggttaacgg atcttcgttc ttcaccctct ctgcttcaca tcgtgctctg    660
gttgagggag ctgctcttgc taagaagctt ggcaagtctt gctccgactg cgcaaccaac    720
gccccccgtg ttctctgctt catgcaaagc ttctggaccg gcagctacat cgactcgaac    780
atcaatgtca acgatggccg caagggtctt gatgccaact ccattctgtc ttctattcac    840
acctttgatc cttcttcgaa gtgcacagac tctaccttcc agccttgttc ttcaagggct    900
cttgcgaacc acaaggaagt agtggactct ttccgctcca tctatggtgt caacaaaaac    960
agaggtaaag gtaaagctgc tgctgtcggt cgatacagtg aggatgtgta ctacgacggt   1020
aacccttggt acttggctac tcttgctgct gccgagcaac tgtacgctgc tgtctatcaa   1080
tggaacaaga tcggttccat cacagttgat agtgtgtcgc tccccttttt cagtgacctt   1140
gtaccaaagg tttccaaggg aacctatcgc aagaacagca agacatacaa ggctattatc   1200
aaggctgtca cttcatacgc tgatggcttt gtcgccgttg tgcagaccta tactcccaaa   1260
gatggctccc tcgcagagca gttcgataag tctactggaa ctcccaagtc agctgttcac   1320
ctaacctggt cctacgcctc ctttgtcggt gctgccgagc gtcgtactgg cgtcgttcct   1380
ccagcttggg gcgagagcaa cgccaacaag gtgcctgctg tttgcgaagc agctccagcc   1440
tgcgacacca ccatcacgtt caatgtgaag aacgttgatg tcacgtcgga ccagaaggtt   1500
tacattgttg gcgggatcac tcaactttcc aactgggccc ctgctgacgg cattgcgctt   1560
gaggaatcca cgagcaccaa gggcttgtgg actgtgaagg tcaagattcc atctgatacc   1620
agctttgagt ataagtatat aaagaagacg agtgatggaa ctgttacatg ggagagtgac   1680
cccaataaca gtgcggcgac gggcagcaag tgcggaagca gcagtaccat caacgatgag   1740
tggaggtag                                        1749
<210>14
<211>582
<212>PRT
<213>Fusarium verticillioides GZ3639
<220>
<221>信号(SIGNAL)
<222>(1)...(21)
<220>
<221>结构域(DOMAIN)
<222>(37)...(453)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(482)...(577)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(138)...(141)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(200)...(210)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(209)...(212)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(570)...(573)
<223>N-糖基化位点.Prosite id=PS00001
<400>14
Met Phe Thr Gln Ile Leu Tyr Gly Leu Thr Ala Leu Ser Ala Leu Gln
1               5                   10                  15
Gly Gln Val Thr Ala Ser Pro Gly Gly Ser Ser Leu Asp Arg Phe Ile
            20                  25                  30
Ser Lys Glu Ala Asp Ile Ser Ile Lys Gly Val Leu Ala Asn Ile Gly
        35                  40                  45
Ala Asp Gly Lys Arg Ala Gln Gly Ala Ala Pro Gly Ala Val Val Ala
    50                  55                  60
Ser Pro Ser Arg Thr Asp Pro Asp Tyr Trp Tyr Thr Trp Thr Arg Asp
65                  70                  75                  80
Ser Ala Leu Thr Tyr Lys Val Leu Val Glu Arg Phe Ile His Gly Asp
                85                  90                  95
Lys Ser Leu Gln Arg Lys Ile Asp Glu Tyr Val Ser Ala Gln Ala Lys
            100                 105                 110
Leu Gln Gly Val Thr Asn Pro Ser Gly Gly Pro Glu Ser Gly Gly Leu
        115                 120                 125
Gly Glu Pro Lys Phe His Val Asn Leu Thr Ala Phe Thr Gly Ser Trp
    130                 135                 140
Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala Thr Ala Leu Thr
145                 150                 155                 160
Leu Tyr Ala Asn Trp Leu Val Ser His Gly Asp Arg Ser Lys Ala Val
                165                 170                 175
Asn Lys Val Trp Pro Val Ile Glu Lys Asp Leu Ala Tyr Thr Val Lys
            180                 185                 190
Phe Trp Asn Arg Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly Ser
        195                 200                 205
Ser Phe Phe Thr Leu Ser Ala Ser His Arg Ala Leu Val Glu Gly Ala
    210                 215                 220
Ala Leu Ala Lys Lys Leu Gly Lys Ser Cys Ser Asp Cys Ala Thr Asn
225                 230                 235                 240
Ala Pro Arg Val Leu Cys Phe Met Gln Ser Phe Trp Thr Gly Ser Tyr
                245                 250                 255
Ile Asp Ser Asn Ile Asn Val Asn Asp Gly Arg Lys Gly Leu Asp Ala
            260                 265                 270
Asn Ser Ile Leu Ser Ser Ile His Thr Phe Asp Pro Ser Ser Lys Cys
        275                 280                 285
Thr Asp Ser Thr Phe Gln Pro Cys Ser Ser Arg Ala Leu Ala Asn His
    290                 295                 300
Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr Gly Val Asn Lys Asn
305                 310                 315                 320
Arg Gly Lys Gly Lys Ala Ala Ala Val Gly Arg Tyr Ser Glu Asp Val
                325                 330                 335
Tyr Tyr Asp Gly Asn Pro Trp Tyr Leu Ala Thr Leu Ala Ala Ala Glu
            340                 345                 350
Gln Leu Tyr Ala Ala Val Tyr Gln Trp Asn Lys Ile Gly Ser Ile Thr
        355                 360                 365
Val Asp Ser Val Ser Leu Pro Phe Phe Ser Asp Leu Val Pro Lys Val
    370                 375                 380
Ser Lys Gly Thr Tyr Arg Lys Asn Ser Lys Thr Tyr Lys Ala Ile Ile
385                 390                 395                 400
Lys Ala Val Thr Ser Tyr Ala Asp Gly Phe Val Ala Val Val Gln Thr
                405                 410                 415
Tyr Thr Pro Lys Asp Gly Ser Leu Ala Glu Gln Phe Asp Lys Ser Thr
            420                 425                 430
Gly Thr Pro Lys Ser Ala Val His Leu Thr Trp Ser Tyr Ala Ser Phe
        435                 440                 445
Val Gly Ala Ala Glu Arg Arg Thr Gly Val Val Pro Pro Ala Trp Gly
    450                 455                 460
Glu Ser Asn Ala Asn Lys Val Pro Ala Val Cys Glu Ala Ala Pro Ala
465                 470                 475                 480
Cys Asp Thr Thr Ile Thr Phe Asn Val Lys Asn Val Asp Val Thr Ser
                485                 490                 495
Asp Gln Lys Val Tyr Ile Val Gly Gly Ile Thr Gln Leu Ser Asn Trp
            500                 505                 510
Ala Pro Ala Asp Gly Ile Ala Leu Glu Glu Ser Thr Ser Thr Lys Gly
        515                 520                 525
Leu Trp Thr Val Lys Val Lys Ile Pro Ser Asp Thr Ser Phe Glu Tyr
    530                 535                 540
Lys Tyr Ile Lys Lys Thr Ser Asp Gly Thr Val Thr Trp Glu Ser Asp
545                 550                 555                 560
Pro Asn Asn Ser Ala Ala Thr Gly Ser Lys Cys Gly Ser Ser Ser Thr
                565                 570                 575
Ile Asn Asp Glu Trp Arg
            580
<210>15
<211>1188
<212>DNA
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48332
<400>15
atgttgtcca agatcttgct acccgttgtt gcacttgcag ccagtgccaa tgcgcatggc   60
tacctcactt cacccatgag ccgaacaggg ctgaatgcac agtctggggc tgatacgtgc  120
cccgaatgca caattctgga gccggtaaca gcatggcctg atcttgacgc cgcagctgtc  180
ggccgctcgg gtccttgcgg gtacaatgct cgtgtgtcag ttgactacaa ccagcccggg  240
cctcgctggg gttctgagcc cgtcattacc tacaaggctg gggatgtcgt cgatgtacag  300
tggtgtgtag atgccaacgg tgaccatggt ggcatgttca cctaccgcat ctgccaaaac  360
caagctcttg tcgacaagct cttgacccct ggatacctcc ctactgaagc agagaagcaa  420
gcagcagagg attgcttcca agctggagag ttgaagtgca cagatgtccc tggacagaca  480
tgcggattca actctgactg ccagcaaggc caagcctgct ggaggaatga ctggttcaca  540
tgcggtggct tcaacgacaa cctgaaatgc aggagcgtcg acaacgcccc cctaaattca  600
tgctacacca gcatcgcagg cggctacacc gtcagctcaa agatcaaaat cccaaactac  660
accagcaacc acaccctcct ctccttcaaa tggaactctt tccaaacccc gcaggtctac  720
ctcacctgcg ccgacatcaa aatcaccggc agcagctccg gcacctcccc acccccaact  780
tcgagcaaac cccctacgtc ctcctccaag cccacttcca cctccacctc cacctccgca  840
ccctccgcaa cccccaccgc ctgcgccacc cccgtctcca ccgtcgccgt aaccttcaac  900
tccaaaacca ccacctcctt tggccaaacc gtcaaactcg caggttccat ctcccagctc  960
ggcagctgga acactgccaa tgcgcctgcc ctgtccgccg cccagtacac ctcgtccaac  1020
ccgctctgga caaccaccct caacctacct gcaggcacca gcttcgagta caagtacatc  1080
aaagttgaca gtagtggcgc cgtcacgtac gagagtgggg ccaatagaca gtacactgtg  1140
cctaacgggt gcgctaacac tgtcactgta gaagggactt ggaaataa               1188
<210>16
<211>395
<212>PRT
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48332
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(294)...(390)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(222)...(225)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(226)...(229)
<223>N-糖基化位点.Prosite id=PS00001
<400>16
Met Leu Ser Lys Ile Leu Leu Pro Val Val Ala Leu Ala Ala Ser Ala
1               5                   10                  15
Asn Ala His Gly Tyr Leu Thr Ser Pro Met Ser Arg Thr Gly Leu Asn
            20                  25                  30
Ala Gln Ser Gly Ala Asp Thr Cys Pro Glu Cys Thr Ile Leu Glu Pro
        35                  40                  45
Val Thr Ala Trp Pro Asp Leu Asp Ala Ala Ala Val Gly Arg Ser Gly
    50                  55                  60
Pro Cys Gly Tyr Asn Ala Arg Val Ser Val Asp Tyr Asn Gln Pro Gly
65                  70                  75                  80
Pro Arg Trp Gly Ser Glu Pro Val Ile Thr Tyr Lys Ala Gly Asp Val
                85                  90                  95
Val Asp Val Gln Trp Cys Val Asp Ala Asn Gly Asp His Gly Gly Met
            100                 105                 110
Phe Thr Tyr Arg Ile Cys Gln Asn Gln Ala Leu Val Asp Lys Leu Leu
        115                 120                 125
Thr Pro Gly Tyr Leu Pro Thr Glu Ala Glu Lys Gln Ala Ala Glu Asp
    130                 135                 140
Cys Phe Gln Ala Gly Glu Leu Lys Cys Thr Asp Val Pro Gly Gln Thr
145                 150                 155                 160
Cys Gly Phe Asn Ser Asp Cys Gln Gln Gly Gln Ala Cys Trp Arg Asn
                165                 170                 175
Asp Trp Phe Thr Cys Gly Gly Phe Asn Asp Asn Leu Lys Cys Arg Ser
            180                 185                 190
Val Asp Asn Ala Pro Leu Asn Ser Cys Tyr Thr Ser Ile Ala Gly Gly
        195                 200                 205
Tyr Thr Val Ser Ser Lys Ile Lys Ile Pro Asn Tyr Thr Ser Asn His
    210                 215                 220
Thr Leu Leu Ser Phe Lys Trp Asn Ser Phe Gln Thr Pro Gln Val Tyr
225                 230                 235                 240
Leu Thr Cys Ala Asp Ile Lys Ile Thr Gly Ser Ser Ser Gly Thr Ser
                245                 250                 255
Pro Pro Pro Thr Ser Ser Lys Pro Pro Thr Ser Ser Ser Lys Pro Thr
            260                 265                 270
Ser Thr Ser Thr Ser Thr Ser Ala Pro Ser Ala Thr Pro Thr Ala Cys
        275                 280                 285
Ala Thr Pro Val Ser Thr Val Ala Val Thr Phe Asn Ser Lys Thr Thr
    290                 295                 300
Thr Ser Phe Gly Gln Thr Val Lys Leu Ala Gly Ser Ile Ser Gln Leu
305                 310                 315                 320
Gly Ser Trp Asn Thr Ala Asn Ala Pro Ala Leu Ser Ala Ala Gln Tyr
                325                 330                 335
Thr Ser Ser Asn Pro Leu Trp Thr Thr Thr Leu Asn Leu Pro Ala Gly
            340                 345                 350
Thr Ser Phe Glu Tyr Lys Tyr Ile Lys Val Asp Ser Ser Gly Ala Val
        355                 360                 365
Thr Tyr Glu Ser Gly Ala Asn Arg Gln Tyr Thr Val Pro Asn Gly Cys
    370                 375                 380
Ala Asn Thr ValThr Val Glu Gly Thr Trp Lys
385                 390                 395
<210>17
<211>1938
<212>DNA
<213>Fusarium verticillioides GZ3639
<400>17
atgtactttg tgtcttctgc ctttcttctc ggctcattcg ttcttcagaa cgtcttgggc     60
cgaccaacct tcgatgagag gagtctctta caagagagac agtcttcggt cgactccttt    120
atcaagtctg agagctcaat tgctattgag caactcctct gcaatatcgg ttccgatggc    180
tgcaactcca agaacgtagc cactggtatt gtcattgctt ctccagacac acaggatcct    240
gactactttt acacctggac tcgagatgct gctctagtct tcaagtacgt cgttgatagg    300
ttcatcaacc agtatgatgc tggcttgcag aggaagatcc aggagtacat cgcctcccaa    360
gccaagctcc agggtgtttc caacccttct gggtcgcttt cggatggctc aggtctggga   420
gaggccaagt tcaacgtcga catgagtgcc ttcactggtg gttggggtcg acctcagcga   480
gatggtccag ctctgcgtgc gactgctatg atcacctatg ccaactggct gattgccaac   540
ggctacacct ccacagccaa tgacattgtg tggcctgttg ttcgcaacga ccttaactat   600
gtggctcagt attggaatca aaccggattt gacttgtggg aggaggtcaa gggtagttcg   660
ttcttcacaa ctggttccca gtatcgagct ctcattgaag gcgccgctct ggccaagaag   720
ctcggcaagt cgggagacaa ctactccaac atcgctcctc aggctctctg cttcttgcag   780
acttactgga tctcttctgg caaatacgtc gactctaaca tcaatgtcaa tgacggccgc   840
actggcaagg acgccaacag tatcctgtcg tccatacaca atttcgaccc tgctctgaac   900
tgtgatcccg ccaccttcca gccatgcagt gacaaggccc tcgccaacca caaggcggtt   960
actgactctt tccgctcatg gaacatcaac aagggtatct ctcaaggctc agctgtcgcc  1020
gttggacgat acgtcgaaga tgtctactac aatggcaacc cctggtacct cgctacgctt  1080
gccgcggcag agcagctcta cgatgccatt tatgtctgga agcagcaggg atccatcact  1140
gtgtcggacg tctctctttc gttcttcaag gacctcgtct ctttggtctc taccggaaca  1200
tacgccagtg actctgccac cttcaagagc atcactgacg ccgtctccaa gtatgctgat  1260
gggtatgttg ccatcgttgc aaagtatgtc ggcacagatg gccacctcgc agagcagttt  1320
gacaagaacg acggccatcc tctttctgcc acagacttga cttggtcata tgccgcattc  1380
ctctcagctg ctgatcgtcg agctggtgtt attcctccct cttgggctgg aagcgtggct  1440
gctgtcccca accaatgcgg taccaatact gttgctggat cctactcatc ggctactgca  1500
acttcgttcc cagcatcgca aacacccaag ggtggtgtgc ccactccaac tggcgcccag  1560
acttccactt ccacttccac ttccacttcc agctcgtcca ctggtaccag ttgccctact  1620
gcaacctctg tggctgtcac tttccaagaa gttgtcacca ccaactttgg tgataccatc  1680
aagatcgttg gcaacatcgc tgctctcggt aactgggaca catcaaaggc tgttgccctg  1740
agcgcctccg actataccgc ctcgaaccct gtgtggaagg ccaccatttc cctaactgca  1800
ggacagtcca tccagtataa gtacatcaat gttaagaagg acggctctct tacctgggag  1860
aaggacccca accgcaccta cgctgttcct aagacatgtg ccacaacggc taccaagtct  1920
gacaagtggc agtcttga                                                1938
<210>18
<211>645
<212>PRT
<213>Fusarium verticillioides GZ3639
<220>
<221>结构域(DOMAIN)
<222>(46)...(465)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(543)...(639)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(209)...(212)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(211)...(221)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(250)...(253)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(633)...(636)
<223>N-糖基化位点.Prosite id=PS00001
<400>18
Met Tyr Phe Val Ser Ser Ala Phe Leu Leu Gly Ser Phe Val Leu Gln
1               5                   10                  15
Asn Val Leu Gly Arg Pro Thr Phe Asp Glu Arg Ser Leu Leu Gln Glu
            20                  25                  30
Arg Gln Ser Ser Val Asp Ser Phe Ile Lys Ser Glu Ser Ser Ile Ala
        35                  40                  45
Ile Glu Gln Leu Leu Cys Asn Ile Gly Ser Asp Gly Cys Asn Ser Lys
    50                  55                  60
Asn Val Ala Thr Gly Ile Val Ile Ala Ser Pro Asp Thr Gln Asp Pro
65                  70                  75                  80
Asp Tyr Phe Tyr Thr Trp Thr Arg Asp Ala Ala Leu Val Phe Lys Tyr
                85                  90                  95
Val Val Asp Arg Phe Ile Asn Gln Tyr Asp Ala Gly Leu Gln Arg Lys
            100                 105                 110
Ile Gln Glu Tyr Ile Ala Ser Gln Ala Lys Leu Gln Gly Val Ser Asn
        115                 120                 125
Pro Ser Gly Ser Leu Ser Asp Gly Ser Gly Leu Gly Glu Ala Lys Phe
    130                 135                 140
Asn Val Asp Met Ser Ala Phe Thr Gly Gly Trp Gly Arg Pro Gln Arg
145                 150                 155                 160
Asp Gly Pro Ala Leu Arg Ala Thr Ala Met Ile Thr Tyr Ala Asn Trp
                165                 170                 175
Leu Ile Ala Asn Gly Tyr Thr Ser Thr Ala Asn Asp Ile Val Trp Pro
            180                 185                 190
Val Val Arg Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn Gln Thr
        195                 200                 205
Gly Phe Asp Leu Trp Glu Glu Val Lys Gly Ser Ser Phe Phe Thr Thr
    210                 215                 220
Gly Ser Gln Tyr Arg Ala Leu Ile Glu Gly Ala Ala Leu Ala Lys Lys
225                 230                 235                 240
Leu Gly Lys Ser Gly Asp Asn Tyr Ser Asn Ile Ala Pro Gln Ala Leu
                245                 250                 255
Cys Phe Leu Gln Thr Tyr Trp Ile Ser Ser Gly Lys Tyr Val Asp Ser
            260                 265                 270
Asn Ile Asn Val Asn Asp Gly Arg Thr Gly Lys Asp Ala Asn Ser Ile
        275                 280                 285
Leu Ser Ser Ile His Asn Phe Asp Pro Ala Leu Asn Cys Asp Pro Ala
    290                 295                 300
Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ala Asn His Lys Ala Val
305                 310                 315                 320
Thr Asp Ser Phe Arg Ser Trp Asn Ile Asn Lys Gly Ile Ser Gln Gly
                325                 330                 335
Ser Ala Val Ala Val Gly Arg Tyr Val Glu Asp Val Tyr Tyr Asn Gly
            340                 345                 350
Asn Pro Trp Tyr Leu Ala Thr Leu Ala Ala Ala Glu Gln Leu Tyr Asp
        355                 360                 365
Ala Ile Tyr Val Trp Lys Gln Gln Gly Ser Ile Thr Val Ser Asp Val
    370                 375                 380
Ser Leu Ser Phe Phe Lys Asp Leu Val Ser Leu Val Ser Thr Gly Thr
385                 390                 395                 400
Tyr Ala Ser Asp Ser Ala Thr Phe Lys Ser Ile Thr Asp Ala Val Ser
                405                 410                 415
Lys Tyr Ala Asp Gly Tyr Val Ala Ile Val Ala Lys Tyr Val Gly Thr
            420                 425                 430
Asp Gly His Leu Ala Glu Gln Phe Asp Lys Asn Asp Gly His Pro Leu
        435                 440                 445
Ser Ala Thr Asp Leu Thr Trp Ser Tyr Ala Ala Phe Leu Ser Ala Ala
    450                 455                 460
Asp Arg Arg Ala Gly Val Ile Pro Pro Ser Trp Ala Gly Ser Val Ala
465                 470                 475                 480
Ala Val Pro Asn Gln Cys Gly Thr Asn Thr Val Ala Gly Ser Tyr Ser
                485                 490                 495
Ser Ala Thr Ala Thr Ser Phe Pro Ala Ser Gln Thr Pro Lys Gly Gly
            500                 505                 510
Val Pro Thr Pro Thr Gly Ala Gln Thr Ser Thr Ser Thr Ser Thr Ser
        515                 520                 525
Thr Ser Ser Ser Ser Thr Gly Thr Ser Cys Pro Thr Ala Thr Ser Val
    530                 535                 540
Ala Val Thr Phe Gln Glu Val Val Thr Thr Asn Phe Gly Asp Thr Ile
545                 550                 555                 560
Lys Ile Val Gly Asn Ile Ala Ala Leu Gly Asn Trp Asp Thr Ser Lys
                565                 570                 575
Ala Val Ala Leu Ser Ala Ser Asp Tyr Thr Ala Ser Asn Pro Val Trp
            580                 585                 590
Lys Ala Thr Ile Ser Leu Thr Ala Gly Gln Ser Ile Gln Tyr Lys Tyr
        595                 600                 605
Ile Asn Val Lys Lys Asp Gly Ser Leu Thr Trp Glu Lys Asp Pro Asn
    610                 615                 620
Arg Thr Tyr Ala Val Pro Lys Thr Cys Ala Thr Thr Ala Thr Lys Ser
625                 630                 635                 640
Asp Lys Trp Gln Ser
                645
<210>19
<211>1467
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>19
atgttgacat tgaatgtttt gacagcactg ttggctccta ttgtgctgtc atctgccttg   60
cctgctcgcg atctcaatgc gcgtgccgat tcgaagcctg ctgctcttca agccatcctg  120
aacaacattg gcgccgatgg atctgctgtt tcgggagcat ctgcaggcgt tgtggtagca  180
tccccatcca aatcggatcc cgattacttt tacacctgga ctcgtgatgc agccttgaca  240
tacaaggtct tgattgatga gttcattgcc ggagacacct cgctggaacc taccatccag  300
gactacgtct ctgctcaagc aaagctgcag gccgtgtcta acccatctgg tgacttgtcc  360
gatggatcag gacttgcaga gcctaagtac cacgtggact tgactgcctt cacggaggcc  420
tggggtcgtc ctcagcgcga cggacccgct ctgcgagcca cagcactgat tacctacggt  480
aactatttga tttcgaagga gagaacatcc gtcgtcaagt cgaacatctg gcccattgtg  540
caaaatgatc tcaactatgt tgcgcaatac tggaaccaaa ccggattcga tctgtgggag  600
gaggtcgagg gctcctcgtt ttttaccatt gctgcacaac accgcgcatt ggtggagggc  660
agcgcatttg ccaaggcgct gggagagtcc tgcgagggat gcgattccca ggcacctcag  720
gtcctatgct tccagcagtc cttctgggat ggcaaggcta ttgtttctaa cttcgccaac  780
aatggccgaa ccggtctcga tgccaattcg gtgcttacct cgatcggaaa cttcgacccc  840
aaggctccct gcgatgacgt gaccttccag ccttgctctg ctcgtgccct gtcgaatcac  900
aagctatacg ttgactcgtt ccgtaagatc tatcctgtga acagtggtaa ggaagctgga  960
actgccgttg ctgttggacg ttattccgaa gacacttaca tgggcgggaa cccatggtat 1020
ttgaccaccc tggccgcggc cgagcagctg tacgatgctc tttaccagtg gaagcaactg 1080
ggatcgctag aaatcaccga gatcagtctt cctttcttca aggaccttgt ttcgtctgcc 1140
gccgccggaa agtatcccag ctcctcggaa acttacacgt ccatcactgc cgcagtcaaa 1200
aagtatgccg atggatttgt ggctgttgtt aaggagcaca cgcccagcga tgggtctctg 1260
gctgaacaat acactcggga caacggcagc ccggcctctg ctaaggactt gacctggtcc  1320
tacgcggcgc tcctgtctgc tacccgccgt gaggctggaa cagtgccccc tacctggggt  1380
gcgtcgactg ccaataaggt accctcaaag tgtgagggta gctcggccaa gggaagctac  1440
acgacaccat cagtcggcaa gtggtaa                                      1467
<210>20
<211>488
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(22)
<220>
<221>结构域(DOMAIN)
<222>(33)...(449)
<223>糖基水解酶家族15
<220>
<221>SITE
<222>(194)...(197)
<223>N-糖基化位点.Prosite id=PS00001
<400>20
Met Leu Thr Leu Asn Val Leu Thr Ala Leu Leu Ala Pro Ile Val Leu
1               5                   10                  15
Ser Ser Ala Leu Pro Ala Arg Asp Leu Asn Ala Arg Ala Asp Ser Lys
            20                  25                  30
Pro Ala Ala Leu Gln Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ser
        35                  40                  45
Ala Val Ser Gly Ala Ser Ala Gly Val Val Val Ala Ser Pro Ser Lys
    50                  55                  60
Ser Asp Pro Asp Tyr Phe Tyr Thr Trp Thr Arg Asp Ala Ala Leu Thr
65                  70                  75                  80
Tyr Lys Val Leu Ile Asp Glu Phe Ile Ala Gly Asp Thr Ser Leu Glu
                85                  90                  95
Pro Thr Ile Gln Asp Tyr Val Ser Ala Gln Ala Lys Leu Gln Ala Val
            100                 105                 110
Ser Asn Pro Ser Gly Asp Leu Ser Asp Gly Ser Gly Leu Ala Glu Pro
        115                 120                 125
Lys Tyr His Val Asp Leu Thr Ala Phe Thr Glu Ala Trp Gly Arg Pro
    130                 135                 140
Gln Arg Asp Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly
145                 150                 155                 160
Asn Tyr Leu Ile Ser Lys Glu Arg Thr Ser Val Val Lys Ser Asn Ile
                165                 170                 175
Trp Pro Ile Val Gln Asn Asp Leu Asn Tyr Val Ala Gln Tyr Trp Asn
            180                 185                 190
Gln Thr Gly Phe Asp Leu Trp Glu Glu Val Glu Gly Ser Ser Phe Phe
        195                 200                 205
Thr Ile Ala Ala Gln His Arg Ala Leu Val Glu Gly Ser Ala Phe Ala
    210                 215                 220
Lys Ala Leu Gly Glu Ser Cys Glu Gly Cys Asp Ser Gln Ala Pro Gln
225                 230                 235                 240
Val Leu Cys Phe Gln Gln Ser Phe Trp Asp Gly Lys Ala Ile Val Ser
                245                 250                 255
Asn Phe Ala Asn Asn Gly Arg Thr Gly Leu Asp Ala Asn Ser Val Leu
            260                 265                 270
Thr Ser Ile Gly Asn Phe Asp Pro Lys Ala Pro Cys Asp Asp Val Thr
        275                 280                 285
Phe Gln Pro Cys Ser Ala Arg Ala Leu Ser Asn His Lys Leu Tyr Val
    290                 295                 300
Asp Ser Phe Arg Lys Ile Tyr Pro Val Asn Ser Gly Lys Glu Ala Gly
305                 310                 315                 320
Thr Ala Val Ala Val Gly Arg Tyr Ser Glu Asp Thr Tyr Met Gly Gly
                325                 330                 335
Asn Pro Trp Tyr Leu Thr Thr Leu Ala Ala Ala Glu Gln Leu Tyr Asp
            340                 345                 350
Ala Leu Tyr Gln Trp Lys Gln Leu Gly Ser Leu Glu Ile Thr Glu Ile
        355                 360                 365
Ser Leu Pro Phe Phe Lys Asp Leu Val Ser Ser Ala Ala Ala Gly Lys
    370                 375                 380
Tyr Pro Ser Ser Ser Glu Thr Tyr Thr Ser Ile Thr Ala Ala Val Lys
385                 390                 395                 400
Lys Tyr Ala Asp Gly Phe Val Ala Val Val Lys Glu His Thr Pro Ser
                405                 410                 415
Asp Gly Ser Leu Ala Glu Gln Tyr Thr Arg Asp Asn Gly Ser Pro Ala
            420                 425                 430
Ser Ala Lys Asp Leu Thr Trp Ser Tyr Ala Ala Leu Leu Ser Ala Thr
        435                 440                 445
Arg Arg Glu Ala Gly Thr Val Pro Pro Thr Trp Gly Ala Ser Thr Ala
    450                 455                 460
Asn Lys Val Pro Ser Lys Cys Glu Gly Ser Ser Ala Lys Gly Ser Tyr
465                 470                 475                 480
Thr Thr Pro Ser Val Gly Lys Trp
                485
<210>21
<211>1488
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>21
atggttctag ctcggcttgc ctggcttgcc ggcctggtta gcactgccgt tgctgcgacc     60
ccagcggaat ggcgctcgca gtccatctac ttcatgctca cggatcgttt tgcccggacg    120
gatggttcaa ctactgctgc ctgcgatacc gctgacagaa aatactgtgg cggaacctgg    180
cagggaatca ttgacaagct ggactatatc caaggaatgg gctttacagc catttggatc    240
actcctgtga ccggtcaatt gagcggggaa accgcgtacg gagatgccta tcacggatac    300
tggcagcagg atatctattc tctcgattcc aactatggaa ccgcagacga tctcaaggcc    360
ctcgctgcgg ctttgcacga acgcaacatg tatctcatgg tcgatgtcgt agctaaccac    420
atgggctaca atggcccagg tactgacgtg gactacacca aattcaaccc cttcaacgat    480
gcaaagtatt tccactcgta ctgcccaatc accgattaca acgacgacac catgtcgcaa    540
aactgctggc ttggcgataa caaggtctcg ctaccggacc tgaatacaca gagcaaggag    600
gtccaggatc tatggtatga ctgggttggg tctttggtct ccaactactc tatcgacggt    660
ctccgtgtcg acacagtcaa acatgtccag aaagatttct ggcccggcta caacaaagcc    720
gcgggcgtct actgcgtagg cgagatcctt gatggtgacc cagattacac ctgtccatac    780
caggaggtaa tggacggagt gctcaactac ccgatttatt acccactcct caaggccttc    840
caatcgacct cgggaagcat gaccgatcta tacaacatga tcaacacggt gaaatcgacc    900
tgcaaggact cgacccttct tggaaatttc ttggagaacc acgataaccc ccgttttgcc    960
cacgtcaccg acgacattgc cctcgccaag aacgcagcta cgtttaccat tatggcagac   1020
ggcattccta ttgtctatgc aggacaggag cagcactaca gtggtggcga ggacccggct   1080
aatcgcgaag ctctgtggtt gtcaggatac aacacggaca gtgagctgta caagctcata   1140
gccaaggcca atggtgctag aagccaggcc attgctaagg gtaccaacta tacgatttac   1200
cagaaccaac caatctacaa agatgagagc accatcgcca tgcggaaggg cttcgacggt   1260
ggacagacaa tcactgtcct gacgaatctc ggcgcagggg gtaaagagga ctctgtttcg   1320
attcctgata ccggattcaa ggctggtgca aagttgactg aggtcgtctc ctgcgctagt   1380
gttactgtcg gtgacaatgg ggaggtgtct gtccctatgg cggctggagc gccgaggatt   1440
ttgctcccta cctttttgct tgagggctcg actctgtgtt catcatag                1488
<210>22
<211>495
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(18)
<220>
<221>结构域(DOMAIN)
<222>(31)...(387)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(197)...(200)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(218)...(221)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(402)...(405)
<223>N-糖基化位点.Prosite id=PS00001
<400>22
Met Val Leu Ala Arg Leu Ala Trp Leu Ala Gly Leu Val Ser Thr Ala
1               5                   10                  15
Val Ala Ala Thr Pro Ala Glu Trp Arg Ser Gln Ser Ile Tyr Phe Met
            20                  25                  30
Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Ala Cys
        35                  40                  45
Asp Thr Ala Asp Arg Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile
    50                  55                  60
Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile
65                  70                  75                  80
Thr Pro Val Thr Gly Gln Leu Ser Gly Glu Thr Ala Tyr Gly Asp Ala
                85                  90                  95
Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asp Ser Asn Tyr
            100                 105                 110
Gly Thr Ala Asp Asp Leu Lys Ala Leu Ala Ala Ala Leu His Glu Arg
        115                 120                 125
Asn Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asn
    130                 135                 140
Gly Pro Gly Thr Asp Val Asp Tyr Thr Lys Phe Asn Pro Phe Asn Asp
145                 150                 155                 160
Ala Lys Tyr Phe His Ser Tyr Cys Pro Ile Thr Asp Tyr Asn Asp Asp
                165                 170                 175
Thr Met Ser Gln Asn Cys Trp Leu Gly Asp Asn Lys Val Ser Leu Pro
            180                 185                 190
Asp Leu Asn Thr Gln Ser Lys Glu Val Gln Asp Leu Trp Tyr Asp Trp
        195                 200                 205
Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Val Asp
    210                 215                 220
Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala
225                 230                 235                 240
Ala Gly Val Tyr Cys Val Gly Glu Ile Leu Asp Gly Asp Pro Asp Tyr
                245                 250                 255
Thr Cys Pro Tyr Gln Glu Val Met Asp Gly Val Leu Asn Tyr Pro Ile
            260                 265                 270
Tyr Tyr Pro Leu Leu Lys Ala Phe Gln Ser Thr Ser Gly Ser Met Thr
        275                 280                 285
Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Thr Cys Lys Asp Ser
    290                 295                 300
Thr Leu Leu Gly Asn Phe Leu Glu Asn His Asp Asn Pro Arg Phe Ala
305                 310                 315                 320
His Val Thr Asp Asp Ile Ala Leu Ala Lys Asn Ala Ala Thr Phe Thr
                325                 330                 335
Ile Met Ala Asp Gly Ile Pro Ile Val Tyr Ala Gly Gln Glu Gln His
            340                 345                 350
Tyr Ser Gly Gly Glu Asp Pro Ala Asn Arg Glu Ala Leu Trp Leu Ser
        355                 360                 365
Gly Tyr Asn Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Lys Ala Asn
    370                 375                 380
Gly Ala Arg Ser Gln Ala Ile Ala Lys Gly Thr Asn Tyr Thr Ile Tyr
385                 390                 395                 400
Gln Asn Gln Pro Ile Tyr Lys Asp Glu Ser Thr Ile Ala Met Arg Lys
                405                 410                 415
Gly Phe Asp Gly Gly Gln Thr Ile Thr Val Leu Thr Asn Leu Gly Ala
            420                 425                 430
Gly Gly Lys Glu Asp Ser Val Ser Ile Pro Asp Thr Gly Phe Lys Ala
        435                 440                 445
Gly Ala Lys Leu Thr Glu Val Val Ser Cys Ala Ser Val Thr Val Gly
    450                 455                 460
Asp Asn Gly Glu Val Ser Val Pro Met Ala Ala Gly Ala Pro Arg Ile
465                 470                 475                 480
Leu Leu Pro Thr Phe Leu Leu Glu Gly Ser Thr Leu Cys Ser Ser
                485                 490                 495
<210>23
<211>1389
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>23
atgaaactgt cccacaccct gacagctctt ctactccctc tgatatgcac tgtatcagca     60
gcggatgtga aagcatggaa gtcccgcaat atttactttg ccctgactga tcgcattgcc    120
cgtggaagcg atgatacagg tggagatgcc tgcggtaacc ttggaaacta ctgcggtgga    180
actttccaag gcttggagtc taagcttgac tatattaagg ggatgggctt tgatgcaatc    240
tggatcaccc ctgttatcgc taatgcgcca ggtggatatc atggatactg ggcgcgggat    300
ctctatagca tcaacgagaa ctatggcacc gctgatgatc tcaaaagcct agttgatgct    360
gctcataaga aggggatcta tgtcatggca gacgtagttg ccaaccacat gggaggcccc    420
atcagcgata acaagccgga gccattgaac caggagagct cctaccattc cacctgcaca    480
atcgactact caagccagga tagtgttgaa aactgccgta tcacagcaga cctacctgat    540
gtgaacacac agagtcccga gatccgtgcc ctcttccaga aatgggtcaa atggctcgtc    600
acggaatacg ggttcgacgg cttgcgcatt gacactgtta agcacgttga aaaggacttc    660
tggtcggcct tctcctccgc tgccggggtt tacaccatcg gcgaagtctg ggacggtgac    720
ccagcttacc ttgccggata tgcacaggac atggacggcc tgctcaacta tgcagtctac    780
tatcccgtga acaactttta ccagcaaaag ggctcttccc aggacatagt tgacatgcat    840
gataaaatcg acaccgcttt ccctgatccc agcgccctgg gcacattcat agacaatcac    900
gacaatgcgc gatggctgag cgtaaagaat gacaagtcgc ttttgaaaaa cgcactcgcc    960
tacgtgattc tcgcccgggg catccccatt gtctactacg gcacggaaca gggctacgcg   1020
ggcggcaacg accccgcaaa ccgcgaggac ctatggcgca gcaaattcag caccgacgcg   1080
gacttgtaca aggccatatc cctgctctca gcggcgagaa acgcttctgg tggcctcgct   1140
gacaacgacc atgtccatct gtacgtcgcg gagtcggcat atgcgtggag cagggcgggt   1200
ggaaacctca tcgtccttac gtccaatggt ggatctgggt ctgaggctaa tcactgcttc   1260
gactctaaga agcctggtgg gacatggaag aatacctttg gagaggggac aatcaccgcc   1320
gatgaaggcg gaaaaatttg catctctatc tctaatggtg agcctgcggt gctggttgca   1380
agcacttga                                                           1389
<210>24
<211>462
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(33)...(373)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(379)...(382)
<223>N-糖基化位点.Prosite id=PS00001
<400>24
Met Lys Leu Ser His Thr Leu Thr Ala Leu Leu Leu Pro Leu Ile Cys
1               5                   10                  15
Thr Val Ser Ala Ala Asp Val Lys Ala Trp Lys Ser Arg Asn Ile Tyr
            20                  25                  30
Phe Ala Leu Thr Asp Arg Ile Ala Arg Gly Ser Asp Asp Thr Gly Gly
        35                  40                  45
Asp Ala Cys Gly Asn Leu Gly Asn Tyr Cys Gly Gly Thr Phe Gln Gly
    50                  55                  60
Leu Glu Ser Lys Leu Asp Tyr Ile Lys Gly Met Gly Phe Asp Ala Ile
65                  70                  75                  80
Trp Ile Thr Pro Val Ile Ala Asn Ala Pro Gly Gly Tyr His Gly Tyr
                85                  90                  95
Trp Ala Arg Asp Leu Tyr Ser Ile Asn Glu Asn Tyr Gly Thr Ala Asp
            100                 105                 110
Asp Leu Lys Ser Leu Val Asp Ala Ala His Lys Lys Gly Ile Tyr Val
        115                 120                 125
Met Ala Asp Val Val Ala Asn His Met Gly Gly Pro Ile Ser Asp Asn
    130                 135                 140
Lys Pro Glu Pro Leu Asn Gln Glu Ser Ser Tyr His Ser Thr Cys Thr
145                 150                 155                 160
Ile Asp Tyr Ser Ser Gln Asp Ser Val Glu Asn Cys Arg Ile Thr Ala
                165                 170                 175
Asp Leu Pro Asp Val Asn Thr Gln Ser Pro Glu Ile Arg Ala Leu Phe
            180                 185                 190
Gln Lys Trp Val Lys Trp Leu Val Thr Glu Tyr Gly Phe Asp Gly Leu
        195                 200                 205
Arg Ile Asp Thr Val Lys His Val Glu Lys Asp Phe Trp Ser Ala Phe
    210                 215                 220
Ser Ser Ala Ala Gly Val Tyr Thr Ile Gly Glu Val Trp Asp Gly Asp
225                 230                 235                 240
Pro Ala Tyr Leu Ala Gly Tyr Ala Gln Asp Met Asp Gly Leu Leu Asn
                245                 250                 255
Tyr Ala Val Tyr Tyr Pro Val Asn Asn Phe Tyr Gln Gln Lys Gly Ser
            260                 265                 270
Ser Gln Asp Ile Val Asp Met His Asp Lys Ile Asp Thr Ala Phe Pro
        275                 280                 285
Asp Pro Ser Ala Leu Gly Thr Phe Ile Asp Asn His Asp Asn Ala Arg
    290                 295                 300
Trp Leu Ser Val Lys Asn Asp Lys Ser Leu Leu Lys Asn Ala Leu Ala
305                 310                 315                 320
Tyr Val Ile Leu Ala Arg Gly Ile Pro Ile Val Tyr Tyr Gly Thr Glu
                325                 330                 335
Gln Gly Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Asp Leu Trp
            340                 345                 350
Arg Ser Lys Phe Ser Thr Asp Ala Asp Leu Tyr Lys Ala Ile Ser Leu
        355                 360                 365
Leu Ser Ala Ala Arg Asn Ala Ser Gly Gly Leu Ala Asp Asn Asp His
    370                 375                 380
Val His Leu Tyr Val Ala Glu Ser Ala Tyr Ala Trp Ser Arg Ala Gly
385                 390                 395                 400
Gly Asn Leu Ile Val Leu Thr Ser Asn Gly Gly Ser Gly Ser Glu Ala
                405                 410                 415
Asn His Cys Phe Asp Ser Lys Lys Pro Gly Gly Thr Trp Lys Asn Thr
            420                 425                 430
Phe Gly Glu Gly Thr Ile Thr Ala Asp Glu Gly Gly Lys Ile Cys Ile
        435                 440                 445
Ser Ile Ser Asn Gly Glu Pro Ala Val Leu Val Ala Ser Thr
    450                 455                 460
<210>25
<211>1923
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>25
atgactattt ctcgcctctc ctccgtgctt tttgcactgg ctctaggtca aagtgcacta     60
gcagcccctc agctgtctcc tcgtgctaca actagcttgg acgcctggct tgccagtgaa    120
actactgtct ctctcaatgg aatcttggac aacatcggtg ccagcggtgc ctatgctcag    180
agtgccaagg ctggtgttgt tattgccagt cccagcacaa gcagcccgga ttattactac    240
acgtggacca gagactctgc ccttacgtta aaagtcctta tcgatctctt ccgtaatggg    300
aacgtagatc tgcagaccgt cattgaggaa tacatcactg cacaagctta tctacagacc    360
gtctccaacc cctccggaga tctctcaagc ggtgctggtc tcgctgagcc caagttcaac    420
gttgacatga gcgcttacac tggcgcttgg ggacgtccgc aacgcgacgg acctgctctc    480
cgtgctattg ccttgatcga ttttggcaac tggttgattg acaatggata ctctagctat    540
gccgttagca acgtctggcc cattgtacgc aacgatctgt cctacgttgc ccagtactgg    600
agccaaagcg gttatgatct ctgggaggag gtcaacagca tgtccttctt caccattgcc    660
aaccagcacc gtgccctcgt cgagggaagc acctttgccg gccgagttgg tgcatcctgc    720
tcgtggtgtg actctcaagc cccccagatc ctctgctaca tgcagaactt ctggaccgga    780
tcttacatca atgccaacac tggcggtggt cgttccggca aggacgccaa cactgttctg    840
gctagtatca gcacttttga tcccgaggct acctgtgacg acgtcacttt ccagccctgc    900
tcctcccgcg ccctggccaa ccacaaagtc tacactgact cgttccgatc tgtctattct    960
ctcgactccg gcattgctga gggcgttgct gtcgcggtag gacgctaccc tgaggattca  1020
tactataacg gcaatccgtg gtttttgacc actctcgctg ctgcggaaca gttgtacgat  1080
gccatatatc aatggaacaa gatcggctcc atcacaatca ccagcacctc tttggctttc  1140
tttaatgacg tctacagctc tgccgctgtt ggcacttacg cctctggcag cactgcctac  1200
acagccattg tcagcgcagt caagacctat gccgacggat atgtcagcat cgtgcaggct  1260
catgccatga ccaacggctc tctctccgag cagtttgaca aggcctccgg tacccagctc  1320
tctgcccgtg atcttacatg gtcgtacgct gccttgctca ctgctaacat gcgccgcaac  1380
ggaattgtgc ctccttcctg gggagctgcc tccgccaact caatccccag ttcttgctct  1440
acgggctctg caactggcac ttacagcact cctaccggaa cctcctggcc cagtacactg  1500
accagcggca ccgcaggtac cactaccact tctgctacta ctaccacctc cacctctgtc  1560
tccaaaacta ccactaccac caccagtact acctcttgca ccaccccgac ctccgtagcc  1620
gtcacctttg acgagattgc aaccacctac tacggcgaga acgtttacat ttctggctcg  1680
atctcgcagc tcggtagctg ggataccagc agtgccattg cgctcagcgc cagccagtac  1740
acttccagca acaacctctg gttcgtgact atcaacctgc ccgctggaac aacctttcag  1800
tacaagtaca ttcgcaagga gtcggatggt tcgattgttt gggagagtga tcctaaccgc  1860
tcgtacactg tgccttccgg ttgtggtgta agcacagcta ctgagagtga tacttggcga  1920
tag                                                                1923
<210>26
<211>640
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(21)
<220>
<221>结构域(DOMAIN)
<222>(42)...(457)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(538)...(634)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(206)...(216)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(431)...(434)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(628)...(631)
<223>N-糖基化位点.Prosite id=PS00001
<400>26
Met Thr Ile Ser Arg Leu Ser Ser Val Leu Phe Ala Leu Ala Leu Gly
1               5                   10                  15
Gln Ser Ala Leu Ala Ala Pro Gln Leu Ser Pro Arg Ala Thr Thr Ser
            20                  25                  30
Leu Asp Ala Trp Leu Ala Ser Glu Thr Thr Val Ser Leu Asn Gly Ile
        35                  40                  45
Leu Asp Asn Ile Gly Ala Ser Gly Ala Tyr Ala Gln Ser Ala Lys Ala
    50                  55                  60
Gly Val Val Ile Ala Ser Pro Ser Thr Ser Ser Pro Asp Tyr Tyr Tyr
65                  70                  75                  80
Thr Trp Thr Arg Asp Ser Ala Leu Thr Leu Lys Val Leu Ile Asp Leu
                85                  90                  95
Phe Arg Asn Gly Asn Val Asp Leu Gln Thr Val Ile Glu Glu Tyr Ile
            100                 105                 110
Thr Ala Gln Ala Tyr Leu Gln Thr Val Ser Asn Pro Ser Gly Asp Leu
        115                 120                 125
Ser Ser Gly Ala Gly Leu Ala Glu Pro Lys Phe Asn Val Asp Met Ser
    130                 135                 140
Ala Tyr Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu
145                 150                 155                 160
Arg Ala Ile Ala Leu Ile Asp Phe Gly Asn Trp Leu Ile Asp Asn Gly
                165                 170                 175
Tyr Ser Ser Tyr Ala Val Ser Asn Val Trp Pro Ile Val Arg Asn Asp
            180                 185                 190
Leu Ser Tyr Val Ala Gln Tyr Trp Ser Gln Ser Gly Tyr Asp Leu Trp
        195                 200                 205
Glu Glu Val Asn Ser Met Ser Phe Phe Thr Ile Ala Asn Gln His Arg
    210                 215                 220
Ala Leu Val Glu Gly Ser Thr Phe Ala Gly Arg Val Gly Ala Ser Cys
225                 230                 235                 240
Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Met Gln Asn
                245                 250                 255
Phe Trp Thr Gly Ser Tyr Ile Asn Ala Asn Thr Gly Gly Gly Arg Ser
            260                 265                 270
Gly Lys Asp Ala Asn Thr Val Leu Ala Ser Ile Ser Thr Phe Asp Pro
        275                 280                 285
Glu Ala Thr Cys Asp Asp Val Thr Phe Gln Pro Cys Ser Ser Arg Ala
    290                 295                 300
Leu Ala Asn His Lys Val Tyr Thr Asp Ser Phe Arg Ser Val Tyr Ser
305                 310                 315                 320
Leu Asp Ser Gly Ile Ala Glu Gly Val Ala Val Ala Val Gly Arg Tyr
                325                 330                 335
Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Thr Thr Leu
            340                 345                 350
Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Gln Trp Asn Lys Ile
        355                 360                 365
Gly Ser Ile Thr Ile Thr Ser Thr Ser Leu Ala Phe Phe Asn Asp Val
    370                 375                 380
Tyr Ser Ser Ala Ala Val Gly Thr Tyr Ala Ser Gly Ser Thr Ala Tyr
385                 390                 395                 400
Thr Ala Ile Val Ser Ala Val Lys Thr Tyr Ala Asp Gly Tyr Val Ser
                405                 410                 415
Ile Val Gln Ala His Ala Met Thr Asn Gly Ser Leu Ser Glu Gln Phe
            420                 425                 430
Asp Lys Ala Ser Gly Thr Gln Leu Ser Ala Arg Asp Leu Thr Trp Ser
        435                 440                 445
Tyr Ala Ala Leu Leu Thr Ala Asn Met Arg Arg Asn Gly Ile Val Pro
    450                 455                 460
Pro Ser Trp Gly Ala Ala Ser Ala Asn Ser Ile Pro Ser Ser Cys Ser
465                 470                 475                 480
Thr Gly Ser Ala Thr Gly Thr Tyr Ser Thr Pro Thr Gly Thr Ser Trp
                485                 490                 495
Pro Ser Thr Leu Thr Ser Gly Thr Ala Gly Thr Thr Thr Thr Ser Ala
            500                 505                 510
Thr Thr Thr Thr Ser Thr Ser Val Ser Lys Thr Thr Thr Thr Thr Thr
        515                 520                 525
Ser Thr Thr Ser Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp
    530                 535                 540
Glu Ile Ala Thr Thr Tyr Tyr Gly Glu Asn Val Tyr Ile Ser Gly Ser
545                 550                 555                 560
Ile Ser Gln Leu Gly Ser Trp Asp Thr Ser Ser Ala Ile Ala Leu Ser
                565                 570                 575
Ala Ser Gln Tyr Thr Ser Ser Asn Asn Leu Trp Phe Val Thr Ile Asn
            580                 585                 590
Leu Pro Ala Gly Thr Thr Phe Gln Tyr Lys Tyr Ile Arg Lys Glu Ser
        595                 600                 605
Asp Gly Ser Ile Val Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Val
    610                 615                 620
Pro Ser Gly Cys Gly Val Ser Thr Ala Thr Glu Ser Asp Thr Trp Arg
625                 630                 635                 640
<210>27
<211>1911
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>27
atgtatatcc tgtcttctgc ttttctcctc ggctccctcg ctcttcagag cgttctgggt     60
agaccggcgg ataagatcca agtgagacaa tctggtatcg aggactttat caagtccgag    120
agcccgattg ccatcgagca gcttctgtgc aacattggtt ccgaagggtg ccatgccaag    180
aatgttcccg ctggcatcgt cattgcttct ccagacaccc aagatcccga ctacttttat    240
acctggactc gagatgctgc tcttgttttc aagtatattg tcgacaggtt cattcaccag    300
tacgatgcta ctctccagaa gcgcattcag gagtacattg cctctcaagc caagctccag    360
ggcgtctcca acccctctgg atccctctcg gatggctctg gccttggtga agccaagtac    420
tacgtcaacc tgagccccta cactggtggc tggggtcgac ctcaacgtga tggccctgcc    480
cttcgagcca ccgccatgat cacttatgcc aactggctga tcgctaacgg ttacacctct    540
acggctaatg acattgtgtg gcccgtgatt cgcaacgatc tcaactacgt tgctcagtat    600
tggactcaaa ctggctttga cttgtgggaa gaggtcaggg gtagctcatt cttcacgact    660
gctgctcaat accgagctct cgtcgaaggt gctgcccttg ctaaggctct tggcaagtct    720
ggcgatacct attctaacat tgcgccccaa acactctgct tcttgcagac ctactgggtc    780
tcgaacggta gatacgtcga ctccaacatt aatgtgaacg atggccgcac cggcaaggac    840
gccaacagca tcctcgcatc tatccacaac tttgacccaa gcattggctg tgatgctgca    900
acattccaac cctgcagtga caaggccctc gccaaccaca aggcagtcac cgacaccttc    960
cgctcctaca acctcaacaa gggcatcgca cagggaactg ctgtggctat cggaagatac   1020
attgaagatg tctactacaa cggcaacccc tggtacctca ccacactcgc cgctgccgag   1080
cagctatatg atgccgtcta cgtctggaag cagaagggat ccatcactgt gactgataca   1140
tctctgtcgt tcttcaagga tcttgtgtcg agtgtttcca ctggcacata tgccagcggc   1200
tcgaccactt tccagcagat tatcgacgcc gtgtcgacct acgccgacgg atacgttgcc   1260
attgttcgca agtacgtggg tccgaacggc gccctggctg agcagttctc caaggacaat   1320
ggcactccca tgtccgctga tgatcttacg tggtcatatg ctgctttcct ctcagccact   1380
gaacgccgag ctggcattgt tcctcctact tggcaaaaga gtgttcctgc agttcccaac   1440
agctgtggat caagcacagt cgttggatca tacacatcgg ccacgcagac ctcgttccct   1500
ccttcgcaaa ccccccagga cggcgtgcca actcccacag gaccaactcc caccgacgga   1560
ggacctactt cctctcctac aagctgtgcc atcgccacat ctgtcgacgt cacctttaat   1620
gaggttgtca agaccgagta cggcgacacc atcaagattg tcggcagcat cgctgccctg   1680
ggcagctggg acaccacgaa ggccatctcc ctgagcgcct ccgactacac ggcctcgaac   1740
cccctgtgga agacgacaat ctccctcacg gctggtcagt cttttgagta caagtatatc   1800
aacatcaaga aggacggctc gctggtgtgg gagcgtgacc ccaaccgttc ttatactgtt   1860
cccaagactt gtgagaccaa ggctaccaag tcggatagtt ggcaaggata a    1911
<210>28
<211>636
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(42)...(461)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(534)...(630)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(207)...(217)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(624)...(627)
<223>N-糖基化位点.Prosite id=PS00001
<400>28
Met Tyr Ile Leu Ser Ser Ala Phe Leu Leu Gly Ser Leu Ala Leu Gln
1               5                   10                  15
Ser Val Leu Gly Arg Pro Ala Asp Lys Ile Gln Val Arg Gln Ser Gly
            20                  25                  30
Ile Glu Asp Phe Ile Lys Ser Glu Ser Pro Ile Ala Ile Glu Gln Leu
        35                  40                  45
Leu Cys Asn Ile Gly Ser Glu Gly Cys His Ala Lys Asn Val Pro Ala
    50                  55                  60
Gly Ile Val Ile Ala Ser Pro Asp Thr Gln Asp Pro Asp Tyr Phe Tyr
65                  70                  75                  80
Thr Trp Thr Arg Asp Ala Ala Leu Val Phe Lys Tyr Ile Val Asp Arg
                85                  90                  95
Phe Ile His Gln Tyr Asp Ala Thr Leu Gln Lys Arg Ile Gln Glu Tyr
            100                 105                 110
Ile Ala Ser Gln Ala Lys Leu Gln Gly Val Ser Asn Pro Ser Gly Ser
        115                 120                 125
Leu Ser Asp Gly Ser Gly Leu Gly Glu Ala Lys Tyr Tyr Val Asn Leu
    130                 135                 140
Ser Pro Tyr Thr Gly Gly Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala
145                 150                 155                 160
Leu Arg Ala Thr Ala Met Ile Thr Tyr Ala Asn Trp Leu Ile Ala Asn
                165                 170                 175
Gly Tyr Thr Ser Thr Ala Asn Asp Ile Val Trp Pro Val Ile Arg Asn
            180                 185                 190
Asp Leu Asn Tyr Val Ala Gln Tyr Trp Thr Gln Thr Gly Phe Asp Leu
        195                 200                 205
Trp Glu Glu Val Arg Gly Ser Ser Phe Phe Thr Thr Ala Ala Gln Tyr
    210                 215                 220
Arg Ala Leu Val Glu Gly Ala Ala Leu Ala Lys Ala Leu Gly Lys Ser
225                 230                 235                 240
Gly Asp Thr Tyr Ser Asn Ile Ala Pro Gln Thr Leu Cys Phe Leu Gln
                245                 250                 255
Thr Tyr Trp Val Ser Asn Gly Arg Tyr Val Asp Ser Asn Ile Asn Val
            260                 265                 270
Asn Asp Gly Arg Thr Gly Lys Asp Ala Asn Ser Ile Leu Ala Ser Ile
        275                 280                 285
His Asn Phe Asp Pro Ser Ile Gly Cys Asp Ala Ala Thr Phe Gln Pro
    290                 295                 300
Cys Ser Asp Lys Ala Leu Ala Asn His Lys Ala Val Thr Asp Thr Phe
305                 310                 315                 320
Arg Ser Tyr Asn Leu Asn Lys Gly Ile Ala Gln Gly Thr Ala Val Ala
                325                 330                 335
Ile Gly Arg Tyr Ile Glu Asp Val Tyr Tyr Asn Gly Asn Pro Trp Tyr
            340                 345                 350
Leu Thr Thr Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Val Tyr Val
        355                 360                 365
Trp Lys Gln Lys Gly Ser Ile Thr Val Thr Asp Thr Ser Leu Ser Phe
    370                 375                 380
Phe Lys Asp Leu Val Ser Ser Val Ser Thr Gly Thr Tyr Ala Ser Gly
385                 390                 395                 400
Ser Thr Thr Phe Gln Gln Ile Ile Asp Ala Val Ser Thr Tyr Ala Asp
                405                 410                 415
Gly Tyr Val Ala Ile Val Arg Lys Tyr Val Gly Pro Asn Gly Ala Leu
            420                 425                 430
Ala Glu Gln Phe Ser Lys Asp Asn Gly Thr Pro Met Ser Ala Asp Asp
        435                 440                 445
Leu Thr Trp Ser Tyr Ala Ala Phe Leu Ser Ala Thr Glu Arg Arg Ala
    450                 455                 460
Gly Ile Val Pro Pro Thr Trp Gln Lys Ser Val Pro Ala Val Pro Asn
465                 470                 475                 480
Ser Cys Gly Ser Ser Thr Val Val Gly Ser Tyr Thr Ser Ala Thr Gln
                485                 490                 495
Thr Ser Phe Pro Pro Ser Gln Thr Pro Gln Asp Gly Val Pro Thr Pro
            500                 505                 510
Thr Gly Pro Thr Pro Thr Asp Gly Gly Pro Thr Ser Ser Pro Thr Ser
        515                 520                 525
Cys Ala Ile Ala Thr Ser Val Asp Val Thr Phe Asn Glu Val Val Lys
    530                 535                 540
Thr Glu Tyr Gly Asp Thr Ile Lys Ile Val Gly Ser Ile Ala Ala Leu
545                 550                 555                 560
Gly Ser Trp Asp Thr Thr Lys Ala Ile Ser Leu Ser Ala Ser Asp Tyr
                565                 570                 575
Thr Ala Ser Asn Pro Leu Trp Lys Thr Thr Ile Ser Leu Thr Ala Gly
            580                 585                 590
Gln Ser Phe Glu Tyr Lys Tyr Ile Asn Ile Lys Lys Asp Gly Ser Leu
        595                 600                 605
Val Trp Glu Arg Asp Pro Asn Arg Ser Tyr Thr Val Pro Lys Thr Cys
    610                 615                 620
Glu Thr Lys Ala Thr Lys Ser Asp Ser Trp Gln Gly
625                 630                 635
<210>29
<211>1767
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>29
atgcttttct cgtcgcttct tcgtgccttg tcagcctcgc ttttggcggg cgctgtccag     60
ggctcaccgg ccaatctcca tgcgcgccaa acctctgtcg accaattcat tcaaacccag    120
gccgaaatat ccatcaaggg ggttctagcg aacatcggtg cagatggatc caaagcccaa    180
ggagcccctg ccgggatcgt cgttgcaagt ccatctcgtt ctaatccaga ctattggtat    240
acctggacca gagacgcagc attgacatac aaggccctca ttgagcgctt tgtcgatggt    300
gatacttctc tccgcacaaa ggtcgacgag tatgtctcag cgcaagcata cctgcaaggc    360
gtgtccaatc catcaggggg gcccgactct ggaggcctag gagagcccaa attcaacgta    420
gaccgcaccg ctttcacagg agcatggggg cgaccacagc gtgatgggcc tccgcttcgt    480
gctacagctc tgatcatcta cgcaaactgg ctggttgcaa acgggcagca gagtcaagca    540
ctcaacactg tgtggccggt cattgcaaag gacttggcgt acaccgttcg atactggaac    600
cagacaggct ttgatctgtg ggaagaagta aacggatcat ctttcttcac gctgtctgcg    660
tcccacagag cgcttgtcga gggcaatgca cttgctcaga aactcggaca aacttgcacc    720
ggatgcgcga acgctgcacc ccaggttctc tgctttgtgc aaagcttttg gacaggcagc   780
tatattgatt ctaatatcaa tgttaacgat gggcgtacgg gcaaggatgc aaactcaatt   840
ctgtcatcta tccatacgtt tgacccggag gctggatgca ctgatgccac attccaacct   900
tgttcttccc gtgctcttgc aaaccacaag gcagtcactg actctttccg atccgtgtat   960
ggcatcaacc gtggaattgc tcaaggcagt gcagtggccg tgggcaggta ctctgaagat  1020
gtgtattaca acggcaaccc atggtatctt accactctcg ccgctgccga gcaactatac  1080
tctgcgatct atcagtggaa taagaaaggc tccatcaccg tagatgcagt atccctcccc  1140
ttcttccgcg atctagtacc atccatcgcg acaggaacat atgccagcag ctcgtcaacc  1200
tacacatcca tcgtctcagc agtaaagacg tacgcagacg gttacatcag cgtgatccag  1260
aaatacacgc cctcgaacgg cgcgctcgcc gagcaattcg aaaagagcaa tggatcacca  1320
ctgtccgccg cagacctcac ctggtcctac gccgcgttcc tcaccgcaac agagcggcgc  1380
gcaggcgtcg taagtcccac ctggggcgaa cccaccaaca acgttccccc atcaacctgc  1440
actggcacac ccgcctgcaa cgcgcgcatc acgttcaacg tgcgcgccac caccacgttc  1500
ggcgacaaca tcttcatcgt ggggcagctg acacagctgg gtaattggga tcctgcgagc  1560
gccgtgccgc tcagtgccag caagtatact agcagcgatc cgttgtggta tgccgatatc  1620
aatctcccgg ccgagacaac gtttgagtac aagtatattc gcaagacgag tgcagggcag  1680
gtggtgtggg agagtgatcc gaatagacgg tatacgacgt ctgcggggtg tggaagtagt  1740
gcgacggtga atgattcttg gaggtag                                      1767
<210>30
<211>588
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(21)
<220>
<221>结构域(DOMAIN)
<222>(42)...(458)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(487)...(583)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(203)...(206)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(205)...(215)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(214)...(217)
<223>N-糖基化位点.Prosite id=PS00001
<400>30
Met Leu Phe Ser Ser Leu Leu Arg Ala Leu Ser Ala Ser Leu Leu Ala
1               5                   10                  15
Gly Ala Val Gln Gly Ser Pro Ala Asn Leu His Ala Arg Gln Thr Ser
            20                  25                  30
Val Asp Gln Phe Ile Gln Thr Gln Ala Glu Ile Ser Ile Lys Gly Val
        35                  40                  45
Leu Ala Asn Ile Gly Ala Asp Gly Ser Lys Ala Gln Gly Ala Pro Ala
    50                  55                  60
Gly Ile Val Val Ala Ser Pro Ser Arg Ser Asn Pro Asp Tyr Trp Tyr
65                  70                  75                  80
Thr Trp Thr Arg Asp Ala Ala Leu Thr Tyr Lys Ala Leu Ile Glu Arg
                85                  90                  95
Phe Val Asp Gly Asp Thr Ser Leu Arg Thr Lys Val Asp Glu Tyr Val
            100                 105                 110
Ser Ala Gln Ala Tyr Leu Gln Gly Val Ser Asn Pro Ser Gly Gly Pro
        115                 120                 125
Asp Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Arg Thr Ala
    130                 135                 140
Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg
145                 150                 155                 160
Ala Thr Ala Leu Ile Ile Tyr Ala Asn Trp Leu Val Ala Asn Gly Gln
                165                 170                 175
Gln Ser Gln Ala Leu Asn Thr Val Trp Pro Val Ile Ala Lys Asp Leu
            180                 185                 190
Ala Tyr Thr Val Arg Tyr Trp Asn Gln Thr Gly Phe Asp Leu Trp Glu
        195                 200                 205
Glu Val Asn Gly Ser Ser Phe Phe Thr Leu Ser Ala Ser His Arg Ala
    210                 215                 220
Leu Val Glu Gly Asn Ala Leu Ala Gln Lys Leu Gly Gln Thr Cys Thr
225                 230                 235                 240
Gly Cys Ala Asn Ala Ala Pro Gln Val Leu Cys Phe Val Gln Ser Phe
                245                 250                 255
Trp Thr Gly Ser Tyr Ile Asp Ser Asn Ile Asn Val Asn Asp Gly Arg
            260                 265                 270
Thr Gly Lys Asp Ala Asn Ser Ile Leu Ser Ser Ile His Thr Phe Asp
        275                 280                 285
Pro Glu Ala Gly Cys Thr Asp Ala Thr Phe Gln Pro Cys Ser Ser Arg
    290                 295                 300
Ala Leu Ala Asn His Lys Ala Val Thr Asp Ser Phe Arg Ser Val Tyr
305                 310                 315                 320
Gly Ile Asn Arg Gly Ile Ala Gln Gly Ser Ala Val Ala Val Gly Arg
                325                 330                 335
Tyr Ser Glu Asp Val Tyr Tyr Asn Gly Asn Pro Trp Tyr Leu Thr Thr
            340                 345                 350
Leu Ala Ala Ala Glu Gln Leu Tyr Ser Ala Ile Tyr Gln Trp Asn Lys
        355                 360                 365
Lys Gly Ser Ile Thr Val Asp Ala Val Ser Leu Pro Phe Phe Arg Asp
    370                 375                 380
Leu Val Pro Ser Ile Ala Thr Gly Thr Tyr Ala Ser Ser Ser Ser Thr
385                 390                 395                 400
Tyr Thr Ser Ile Val Ser Ala Val Lys Thr Tyr Ala Asp Gly Tyr Ile
                405                 410                 415
Ser Val Ile Gln Lys Tyr Thr Pro Ser Asn Gly Ala Leu Ala Glu Gln
            420                 425                 430
Phe Glu Lys Ser Asn Gly Ser Pro Leu Ser Ala Ala Asp Leu Thr Trp
        435                 440                 445
Ser Tyr Ala Ala Phe Leu Thr Ala Thr Glu Arg Arg Ala Gly Val Val
    450                 455                 460
Ser Pro Thr Trp Gly Glu Pro Thr Asn Asn Val Pro Pro Ser Thr Cys
465                 470                 475                 480
Thr Gly Thr Pro Ala Cys Asn Ala Arg Ile Thr Phe Asn Val Arg Ala
                485                 490                 495
Thr Thr Thr Phe Gly Asp Asn Ile Phe Ile Val Gly Gln Leu Thr Gln
            500                 505                 510
Leu Gly Asn Trp Asp Pro Ala Ser Ala Val Pro Leu Ser Ala Ser Lys
        515                 520                 525
Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Ala Asp Ile Asn Leu Pro Ala
    530                 535                 540
Glu Thr Thr Phe Glu Tyr Lys Tyr Ile Arg Lys Thr Ser Ala Gly Gln
545                 550                 555                 560
Val Val Trp Glu Ser Asp Pro Asn Arg Arg Tyr Thr Thr Ser Ala Gly
                565                 570                 575
Cys Gly Ser Ser Ala Thr Val Asn Asp Ser Trp Arg
            580                 585
<210>31
<211>1479
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>31
atggttctag ctcggcttgc ctggcttgcc ggcctggtta gcactgccat tgctgcgacc    60
ccagcggaat ggcgctcgca gtccatctac ttcatgctca cggatcgttt tgcccggacc   120
gatggttcaa ctactgctgc ctgtgatacc gctgacagaa aatactgtgg cggaacctgg   180
cagggtatca ttgacaagct ggactatatc caaggaatgg gctttacggc catttggatc   240
actccggtga ccggtcaatt gagcggggaa accgcgtacg gagatcccta tcacggatac   300
tggcagcagg atatctactc tctcgattcc aactatggaa ccgcagacga tctcaaggcc   360
ctcgctgcgg ctttgcacaa acgcgacatg tatctcatgg tcgatgtcgt agcaaaccac   420
atgggctaca atggcgcagg tgctgacgtg gactacacca aattcaaccc cttcaacgat   480
gcaaagtatt tccactccta ctgcccaatc accgattaca acgacgacac catgtcgcaa   540
aactgctggc ttggcgataa caaggtctcg ctaccggatc tgaatacaca gagcaaggag   600
gtgcaggatc tatggtatga ctgggttgga tctttggtct ccaactactc catcgatgga   660
cttcgcgtcg acacagtcaa acatgtccag aaagatttct ggcccggcta caacaaagcc   720
gcgggcgtct actgcgtagg cgaaatcctt gatggtgacc cagattacac ctatccatac   780
caggaggtaa tggacggagt gctcaactac ccgatttact acccactcct caaggccttc   840
cagtcgagct cgggaagcat gaccgatctg tacaacatga tcaacacggt gaaatcgacc   900
tgcaaggact caacccttct tggaaatttc ttggagaacc acgataaccc acgttttgcc   960
catgccaccg atgacattgc cctcgccaag aacgcagcca catttaccat tatggcagat  1020
ggcattccta ttgtctatgc aggacaggag cagcactaca gtggtggcga ggacccggct  1080
aatcgcgagg ctctgtggtt atccggatac aacaccgaca gcgagctgta caagctcatt  1140
gccaaggcca atggtgctag aaaccaggcc attgctaaga gtaccaatta tactatttac  1200
cagaaccacc caatctacaa agacgagagc gccatcgcca tgcggaaggg cttcgtcggt  1260
ggacagacaa tcactgtcct gacgaatctc ggtgcagggg gtaaagagta ttcagtttca  1320
attcctgata ctggattcaa ggctggtgcg aagttgactg aggttgtgtc ctgcactagt  1380
gttactgttg gtgatagtgg ggaggtgtct gttcctatgg cgagtggagc gccgaggatc  1440
ttgctcccca cgtctttgct cgagggctcg gctctgtgc                         1479
<210>32
<211>493
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(18)
<220>
<221>结构域(DOMAIN)
<222>(31)...(387)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(197)...(200)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(218)...(221)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(402)...(405)
<223>N-糖基化位点.Prosite id=PS00001
<400>32
Met Val Leu Ala Arg Leu Ala Trp Leu Ala Gly Leu Val Ser Thr Ala
1               5                   10                  15
Ile Ala Ala Thr Pro Ala Glu Trp Arg Ser Gln Ser Ile Tyr Phe Met
            20                  25                  30
Leu Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Ala Cys
        35                  40                  45
Asp Thr Ala Asp Arg Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile
    50                  55                  60
Asp Lys Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile
65                  70                  75                  80
Thr Pro Val Thr Gly Gln Leu Ser Gly Glu Thr Ala Tyr Gly Asp Pro
                85                  90                  95
Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asp Ser Asn Tyr
            100                 105                 110
Gly Thr Ala Asp Asp Leu Lys Ala Leu Ala Ala Ala Leu His Lys Arg
        115                 120                 125
Asp Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asn
    130                 135                 140
Gly Ala Gly Ala Asp Val Asp Tyr Thr Lys Phe Asn Pro Phe Asn Asp
145                 150                 155                 160
Ala Lys Tyr Phe His Ser Tyr Cys Pro Ile Thr Asp Tyr Asn Asp Asp
                165                 170                 175
Thr Met Ser Gln Asn Cys Trp Leu Gly Asp Asn Lys Val Ser Leu Pro
            180                 185                 190
Asp Leu Asn Thr Gln Ser Lys Glu Val Gln Asp Leu Trp Tyr Asp Trp
        195                 200                 205
Val Gly Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Val Asp
    210                 215                 220
Thr Val Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala
225                 230                 235                 240
Ala Gly Val Tyr Cys Val Gly Glu Ile Leu Asp Gly Asp Pro Asp Tyr
                245                 250                 255
Thr Tyr Pro Tyr Gln Glu Val Met Asp Gly Val Leu Asn Tyr Pro Ile
            260                 265                 270
Tyr Tyr Pro Leu Leu Lys Ala Phe Gln Ser Ser Ser Gly Ser Met Thr
        275                 280                 285
Asp Leu Tyr Asn Met Ile Asn Thr Val Lys Ser Thr Cys Lys Asp Ser
    290                 295                 300
Thr Leu Leu Gly Asn Phe Leu Glu Asn His Asp Asn Pro Arg Phe Ala
305                 310                 315                 320
His Ala Thr Asp Asp Ile Ala Leu Ala Lys Asn Ala Ala Thr Phe Thr
                325                 330                 335
Ile Met Ala Asp Gly Ile Pro Ile Val Tyr Ala Gly Gln Glu Gln His
            340                 35                 350
Tyr Ser Gly Gly Glu Asp Pro Ala Asn Arg Glu Ala Leu Trp Leu Ser
        355                 360                 365
Gly Tyr Asn Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Lys Ala Asn
    370                 375                 380
Gly Ala Arg Asn Gln Ala Ile Ala Lys Ser Thr Asn Tyr Thr Ile Tyr
385                 390                 395                 400
Gln Asn His Pro Ile Tyr Lys Asp Glu Ser Ala Ile Ala Met Arg Lys
                   405                 410                 415
Gly Phe Val Gly Gly Gln Thr Ile Thr Val Leu Thr Asn Leu Gly Ala
             420                 425                 430
Gly Gly Lys Glu Tyr Ser Val Ser Ile Pro Asp Thr Gly Phe Lys Ala
        435                 440                 445
Gly Ala Lys Leu Thr Glu Val Val Ser Cys Thr Ser Val Thr Val Gly
    450                 455                 460
Asp Ser Gly Glu Val Ser Val Pro Met Ala Ser Gly Ala Pro Arg Ile
465                 470                 475                 480
Leu Leu Pro Thr Ser Leu Leu Glu Gly Ser Ala Leu Cys
                485                 490
<210>33
<211>1485
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>33
atggtaggct tcaatatctt gactctcgcc ttgctggccc cagctgcact ctcatctgct     60
gtccaccctc accggcgcca gtctggactt gatgccttta ttcagtccga gtcatcggtt    120
tcactccaag gcattctgaa caatatcgga gccaatggct ctgctgtttc aggcgcatcc    180
gccggtgtag ttgttgcgtc accatccaag tcagaccccg attattttta cacttggact    240
cgcgatgcgg ccctgacact cgcggtactg attgaccaat tcatcgcggg agaaagctcc    300
ctagagacgg tcatccagca gtacatctcc gcccaagcaa aactgcagac agtgtccaac   360
ccatcaggag acctgtccga cggttcaggt ctggcagagc ccaaattcca aaccgatctc   420
agcgccttca ctagatcctg gggtcgacct caacgcgatg gacctgctct ccgtgcgaca   480
gcgctcatcg tgtacggaaa tcacctcctc tcttccggaa agcagtccgt cgtcaaatcc   540
aacatctggc cgatcgtgca gaacgatctc aactacgtgg cacagtactg gaaccagact   600
ggtttcgatc tgtgggaaga ggtccagggc tcgtcctttt tcaccatcgc agcgcaacac   660
cgtgccctgg tggagggagc tgcattcgcc aaatcgctcg gagaggcctg tgatggctgt   720
gattcacagg ctccgcaggt tctttgcttc ctccaggact tctggaatgg aaatgctgtt   780
gtttctaatc tggcaaatga tggtcgctca gggttggatg ccaattctat cctcagctcg   840
atccagacct tcgatcctag tgccacttgc gatgatagca ctttccagcc atgctctggt   900
cgtgcactgc taaaccacaa ggcggtggtt gattctttcc gatccatcta caacattaac   960
agtggtaaag aagctggcaa agccgtggct gttggtcgct atgccgaaga cacctaccag  1020
ggaggcaacc cttggtatct cgctactgct gctgccgccg agcagctgta tgatgctctc  1080
taccagtgga agaaacaggg atcgctggcg attacccaga cgagtcttcc cttcttccag  1140
gatttggact cgactgctcg tgttggcaat tactccagct cttcctcaac ctacacctct  1200
ttgactggcg ctgtcaagac ctatgcggat ggtttcctat cgattgttca gcagtatacg  1260
cccagcaatg gagctctggc cgagcagttc acgcgagaca atggcacccc cgtctctgca  1320
cacgacctga cctggtctta tgcatcattt ttgactgctg ccgaccgtcg caatggaatt  1380
gtccctgcta gctggggtgc atctaaggcc aaccaagtgc cgacgcagtg ccagggcagt  1440
tcagcgacgg ggtcttatac tacgccaact gtggggtcct ggtga                  1485
<210>34
<211>494
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域(DOMAIN)
<222>(39)...(455)
<223>糖基水解酶家族15
<220>
<221>SITE
<222>(52)...(55)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(201)...(204)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(203)...(213)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<400>34
Met Val Gly Phe Asn Ile Leu Thr Leu Ala Leu Leu Ala Pro Ala Ala
1               5                   10                  15
Leu Ser Ser Ala Val His Pro His Arg Arg Gln Ser Gly Leu Asp Ala
            20                  25                  30
Phe Ile Gln Ser Glu Ser Ser Val Ser Leu Gln Gly Ile Leu Asn Asn
        35                  40                  45
Ile Gly Ala Asn Gly Ser Ala Val Ser Gly Ala Ser Ala Gly Val Val
    50                  55                  60
Val Ala Ser Pro Ser Lys Ser Asp Pro Asp Tyr Phe Tyr Thr Trp Thr
65                  70                  75                  80
Arg Asp Ala Ala Leu Thr Leu Ala Val Leu Ile Asp Gln Phe Ile Ala
                85                  90                  95
Gly Glu Ser Ser Leu Glu Thr Val Ile Gln Gln Tyr Ile Ser Ala Gln
            100                 105                 110
Ala Lys Leu Gln Thr Val Ser Asn Pro Ser Gly Asp Leu Ser Asp Gly
        115                 120                 125
Ser Gly Leu Ala Glu Pro Lys Phe Gln Thr Asp Leu Ser Ala Phe Thr
    130                 135                 140
Arg Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala Thr
145                 150                 155                 160
Ala Leu Ile Val Tyr Gly Asn His Leu Leu Ser Ser Gly Lys Gln Ser
                165                 170                 175
Val Val Lys Ser Asn Ile Trp Pro Ile Val Gln Asn Asp Leu Asn Tyr
            180                 185                 190
Val Ala Gln Tyr Trp Asn Gln Thr Gly Phe Asp Leu Trp Glu Glu Val
        195                 200                 205
Gln Gly Ser Ser Phe Phe Thr Ile Ala Ala Gln His Arg Ala Leu Val
    210                 215                 220
Glu Gly Ala Ala Phe Ala Lys Ser Leu Gly Glu Ala Cys Asp Gly Cys
225                 230                 235                 240
Asp Ser Gln Ala Pro Gln Val Leu Cys Phe Leu Gln Asp Phe Trp Asn
                245                 250                 255
Gly Asn Ala Val Val Ser Asn Leu Ala Asn Asp Gly Arg Ser Gly Leu
            260                 265                 270
Asp Ala Asn Ser Ile Leu Ser Ser Ile Gln Thr Phe Asp Pro Ser Ala
        275                 280                 285
Thr Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Gly Arg Ala Leu Leu
    290                 295                 300
Asn His Lys Ala Val Val Asp Ser Phe Arg Ser Ile Tyr Asn Ile Asn
305                 310                 315                 320
Ser Gly Lys Glu Ala Gly Lys Ala Val Ala Val Gly Arg Tyr Ala Glu
                325                 330                 335
Asp Thr Tyr Gln Gly Gly Asn Pro Trp Tyr Leu Ala Thr Ala Ala Ala
            340                 345                 350
Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Lys Lys Gln Gly Ser
        355                 360                 365
Leu Ala Ile Thr Gln Thr Ser Leu Pro Phe Phe Gln Asp Leu Asp Ser
    370                 375                 380
Thr Ala Arg Val Gly Asn Tyr Ser Ser Ser Ser Ser Thr Tyr Thr Ser
385                 390                 395                 400
Leu Thr Gly Ala Val Lys Thr Tyr Ala Asp Gly Phe Leu Ser Ile Val
                405                 410                 415
Gln Gln Tyr Thr Pro Ser Asn Gly Ala Leu Ala Glu Gln Phe Thr Arg
            420                 425                 430
Asp Asn Gly Thr Pro Val Ser Ala His Asp Leu Thr Trp Ser Tyr Ala
        435                 440                 445
Ser Phe Leu Thr Ala Ala Asp Arg Arg Asn Gly Ile Val Pro Ala Ser
    450                 455                 460
Trp Gly Ala Ser Lys Ala Asn Gln Val Pro Thr Gln Cys Gln Gly Ser
465                 470                 475                 480
Ser Ala Thr Gly Ser Tyr Thr Thr Pro Thr Val Gly Ser Trp
                485                 490
<210>35
<211>1914
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>35
atggctcctc gtttttggac tacgctgtgt gcgctgactc ttggttcagc tgcgctggcc   60
gcgccacagt tggcaccgcg tgcaactggt agcttggaca cttggctggc atccgagaaa  120
gctgttgcaa gggagggtat tctcgataat atcgggtcgg atggggcgta tgctaagagc  180
tcgaagtcgg ggattgtcat tgccagtccg agtacagaca gtcccgatta ttactacact  240
tggactcgtg actcggccct ggtcatgaag accttggtgg acctgttcaa gaatggcgat  300
accgaccttc tcaccgttat cgaggagtac atcagctccc aggcctatat ccagaccgtt  360
tccaacccat ctggaagtct ttcgagtggt ggactcggtg aacccaagtt caatgttgat  420
gaaacatcgt ataccggatc ttggggtcga cctcagcgcg atggtcctgc actccgagct  480
actgcactgg ttgccttcgg acagtggttg attgacaacg gatatacatc taccgccacc  540
gatattgtgt ggccaattgt tcgcaatgat ctttcctacg tcgcacaata ctggaacagc  600
tctggatacg acctatggga agaggtcaac ggtgaatcat tcttcaccac cgccgttcaa  660
caccgtgctt tggtcgaggg cagcaagttc gccagccagg tgggatcatc ttgctcctac  720
tgcgactctc aggcacccca ggttctctgc ttccttcaat catactggac cggctcgtac  780
actctagcca atttcggtag cagccgcaca ggcaaagacg cgaacaccct cctgggcagc   840
attcacacat tcgaccccga ggcaggatgc gatgacacga ccttccagcc ttgctcggcc   900
cgcgcgctgg caaatcacaa ggtcgtcact gactcgttcc gctctattta taccgtcaat   960
tcaggcaaga gtgcgggaca agcagtggca gttggtcgat accccgagga ttcttactac  1020
aatggtaacc catggtactt gtgcactatg gctgctgccg agcttctcta cgatgctttg  1080
taccaatgga ataaagctgg ctctttgacc atcagcagcg tctcgctgag cttcttcacc  1140
gacctgtaca gctcagctgc aactggtacc tattcatcat ccagttctac gttctcatcg  1200
atagtcagcg cggtgaagac ctacgcggat ggctacatga gcattgccga gcaatatgcc  1260
tatacgaacg gctctatgtc tgaacaattc tccaagtctg atggaactcc agagtctgcc  1320
cgtgacctga cttggtcata tgcagccctg cttaccgcaa acatgcgtcg caactcggtt  1380
gttcccccaa cctggggcga gacatctgca agcagcgtcc cgggaacatg ctccgcgacg  1440
tcggcgacgg gaacctacag cactgcaacc aacacgaact ggcccgtcac attgactggt  1500
ggatcgggct ctactactac tggtggaaca acgaccagca aaaccagcac caccacaact  1560
tccaagacga gcactaccac tacatcatgc acgactccaa ctagtgtggc agttacattt  1620
gatgttatcg cgaccacttc atacggcgag aacatcaagt tggctgggtc aattgctgcc  1680
cttggtagct gggacaccag tagcgctatt gcactaagtg cagataaata tactagctcg  1740
aacaacctat ggtatgtaac tgtgaatctg gctgctggtc aggtcattca gtacaagtat  1800
atccgggttg aaagtgatag tacgattgag tgggagagtg atccgaaccg ctcttatact  1860
gtgccagcag cctgtgccac aactgccgtg acaatcagcg acacttggcg gtaa        1914
<210>36
<211>637
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(41)...(455)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(535)...(631)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(202)...(205)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(204)...(214)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(429)...(432)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(625)...(628)
<223>N-糖基化位点.Prosite id=PS00001
<400>36
Met Ala Pro Arg Phe Trp Thr Thr Leu Cys Ala Leu Thr Leu Gly Ser
1               5                   10                  15
Ala Ala Leu Ala Ala Pro Gln Leu Ala Pro Arg Ala Thr Gly Ser Leu
            20                  25                  30
Asp Thr Trp Leu Ala Ser Glu Lys Ala Val Ala Arg Glu Gly Ile Leu
        35                  40                  45
Asp Asn Ile Gly Ser Asp Gly Ala Tyr Ala Lys Ser Ser Lys Ser Gly
    50                  55                  60
Ile Val Ile Ala Ser Pro Ser Thr Asp Ser Pro Asp Tyr Tyr Tyr Thr
65                  70                  75                  80
Trp Thr Arg Asp Ser Ala Leu Val Met Lys Thr Leu Val Asp Leu Phe
                85                  90                  95
Lys Asn Gly Asp Thr Asp Leu Leu Thr Val Ile Glu Glu Tyr Ile Ser
            100                 105                 110
Ser Gln Ala Tyr Ile Gln Thr Val Ser Asn Pro Ser Gly Ser Leu Ser
        115                 120                 125
Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu Thr Ser Tyr
    130                 135                 140
Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala
145                 150                 155                 160
Thr Ala Leu Val Ala Phe Gly Gln Trp Leu Ile Asp Asn Gly Tyr Thr
                165                 170                 175
Ser Thr Ala Thr Asp Ile Val Trp Pro Ile Val Arg Asn Asp Leu Ser
            180                 185                 190
Tyr Val Ala Gln Tyr Trp Asn Ser Ser Gly Tyr Asp Leu Trp Glu Glu
        195                 200                 205
Val Asn Gly Glu Ser Phe Phe Thr Thr Ala Val Gln His Arg Ala Leu
    210                 215                 220
Val Glu Gly Ser Lys Phe Ala Ser Gln Val Gly Ser Ser Cys Ser Tyr
225                 230                 235                 240
Cys Asp Ser Gln Ala Pro Gln Val Leu Cys Phe Leu Gln Ser Tyr Trp
                245                 250                 255
Thr Gly Ser Tyr Thr Leu Ala Asn Phe Gly Ser Ser Arg Thr Gly Lys
            260                 265                 270
Asp Ala Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp Pro Glu Ala
        275                 280                 285
Gly Cys Asp Asp Thr Thr Phe Gln Pro Cys Ser Ala Arg Ala Leu Ala
    290                 295                 300
Asn His Lys Val Val Thr Asp Ser Phe Arg Ser Ile Tyr Thr Val Asn
305                 310                 315                 320
Ser Gly Lys Ser Ala Gly Gln Ala Val Ala Val Gly Arg Tyr Pro Glu
                325                 330                 335
Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Tyr Leu Cys Thr Met Ala Ala
            340                 345                 350
Ala Glu Leu Leu Tyr Asp Ala Leu Tyr Gln Trp Asn Lys Ala Gly Ser
        355                 360                 365
Leu Thr Ile Ser Ser Val Ser Leu Ser Phe Phe Thr Asp Leu Tyr Ser
    370                 375                 380
Ser Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr Phe Ser Ser
385                 390                 395                 400
Ile Val Ser Ala Val Lys Thr Tyr Ala Asp Gly Tyr Met Ser Ile Ala
                405                 410                 415
Glu Gln Tyr Ala Tyr Thr Asn Gly Ser Met Ser Glu Gln Phe Ser Lys
            420                 425                 430
Ser Asp Gly Thr Pro Glu Ser Ala Arg Asp Leu Thr Trp Ser Tyr Ala
        435                 440                 445
Ala Leu Leu Thr Ala Asn Met Arg Arg Asn Ser Val Val Pro Pro Thr
    450                 455                 460
Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys Ser Ala Thr
465                 470                 475                 480
Ser Ala Thr Gly Thr Tyr Ser Thr Ala Thr Asn Thr Asn Trp Pro Val
                485                 490                 495
Thr Leu Thr Gly Gly Ser Gly Ser Thr Thr Thr Gly Gly Thr Thr Thr
            500                 505                 510
Ser Lys Thr Ser Thr Thr Thr Thr Ser Lys Thr Ser Thr Thr Thr Thr
        515                 520                 525
Ser Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp Val Ile Ala
    530                 535                 540
Thr Thr Ser Tyr Gly Glu Asn Ile Lys Leu Ala Gly Ser Ile Ala Ala
545                 550                 555                 560
Leu Gly Ser Trp Asp Thr Ser Ser Ala Ile Ala Leu Ser Ala Asp Lys
                565                 570                 575
Tyr Thr Ser Ser Asn Asn Leu Trp Tyr Val Thr Val Asn Leu Ala Ala
            580                 585                 590
Gly Gln Val Ile Gln Tyr Lys Tyr Ile Arg Val Glu Ser Asp Ser Thr
        595                 600                 605
Ile Glu Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Val Pro Ala Ala
    610                 615                 620
Cys Ala Thr Thr Ala Val Thr Ile Ser Asp Thr Trp Arg
625                 630                 635
<210>37
<211>1923
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>37
atggctcctc gattctggat tgcgctttgg gcgcttactt tcggtcaggc gatcgctgcg     60
ccgcagatcg ccttggcacc tcgcgcgaca ggtagcttgg acacctggtt ggcatcggag    120
accacggtgg ccagacaagg tatcctgaac aatatcggtt ccgctggcgc gtattctgcg    180
agcgcgaagc cgggaatcct gattgctagt cctagcactt ccagtcccga ttattactac    240
acatggaccc gtgactctgc tttggtcttc aaggccttgg tggatatgtt caagaatggt    300
gacactgccc ttctcactgt gatcgaagaa tatatcagcg cacaggccta tatccagaca    360
gtctccaacc cttctggtgg tctttccagc ggaggactcg gagagcccaa attcaatgtt    420
gatgagactg ccttcaccgg gtcttggggc cgcccccagc gtgatggtcc ggctctccgc    480
gcaactgcct tgatctcatt cggacagtgg ctccttgaca acggatactc cacatacgcg    540
accaacattg tttggccggt tgtacgaaac gatctctctt acgttgctca atactggaac    600
caaactggat acgatctctg ggaagaggtt tccggctcct ccttcttcac gattgccgcc    660
cagcaccgcg ccttggtgga aggtagcact ttcgccacca gggtcggtgc ttcgtgctca    720
tactgtgatt ctcaggcacc ccaggtgctg tgcttcctcc aatccttctg gactggctca    780
tacacactgg ccaactttgg cggtggccgc tctggcaaag acgcgaatac tcttctcgga    840
agcattcaca catttgaccc cgaggccggc tgcgatgaca ccaccttcca accatgctcg    900
gctcgagcat tggccaacca caaggtggtg actgactctt tccgatcggt ttacacaatc    960
aactctggga ttgcggcagg caaggctgtc tctgttggcc gttactcgga ggattcttac   1020
tataatggaa acccttggta tctgtgtacc ctggctgcag cggagcagtt atatgacgct   1080
ctttacacgt ggaatcgggt tggctctttg actatcactt ctgtctcgct gagtttcttc   1140
aaagatttgt acagttctgc tgctactggt acctactcat cgtccagtgc tacatactct   1200
tcgatcgtca gcgcagtcaa gacttacgcc gatggatatg tcagtattgt ggagaactac   1260
gctctgacca atggctctat gtccgagcaa ttttcaaagt ccgatggttc tcaactgtcc   1320
gctcgtgact tgacttggtc atacgcagct cttctcactg ccaatgagcg ccgaaatgcc   1380
gtcgtcccgg cgccatgggg cgagacggcg gccagcagtg tacctgccca atgcagctcc   1440
acttctgcca ctggtacttt cagtacggcc accaacaccg catggccatc gaccctcact   1500
agcggaaccg gaagtggaac caccacgacc ggcactggga cgaccacaaa ggcaaccacc   1560
acaacttcta ccaagactac ctccacgacc acatcatgta ccacaccgac gtcggtggcg   1620
gtgacctttg atgtgattgc caccactgtg tatggagaga atatcaagct tgccggctct  1680
atttctcaac ttggctcgtg ggatacaagc agtgcgattg ctctcagcgc ttcttcttac  1740
acttcaagca accatctttg gtatgtgacg gtcacactgc ccgctggttc taccttcacc  1800
tataagtata ttcgggtcga gagtgatggc tcaatccagt gggagagtga tccaaacttg  1860
tcatacaccg tccctcaagc ttgcggcact tcagctgtca caattagcga tacttggagg  1920
tga                                                                1923
<210>38
<211>640
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(19)
<220>
<221>结构域(DOMAIN)
<222>(42)...(456)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(538)...(634)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(203)...(206)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(205)...(215)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(430)...(433)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(628)...(631)
<223>N-糖基化位点.Prosite id=PS00001
<400>38
Met Ala Pro Arg Phe Trp Ile Ala Leu Trp Ala Leu Thr Phe Gly Gln
1               5                   10                  15
Ala Ile Ala Ala Pro Gln Ile Ala Leu Ala Pro Arg Ala Thr Gly Ser
            20                  25                  30
Leu Asp Thr Trp Leu Ala Ser Glu Thr Thr Val Ala Arg Gln Gly Ile
        35                  40                  45
Leu Asn Asn Ile Gly Ser Ala Gly Ala Tyr Ser Ala Ser Ala Lys Pro
    50                  55                  60
Gly Ile Leu Ile Ala Ser Pro Ser Thr Ser Ser Pro Asp Tyr Tyr Tyr
65                  70                  75                  80
Thr Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Ala Leu Val Asp Met
                85                  90                  95
Phe Lys Asn Gly Asp Thr Ala Leu Leu Thr Val Ile Glu Glu Tyr Ile
            100                 105                 110
Ser Ala Gln Ala Tyr Ile Gln Thr Val Ser Asn Pro Ser Gly Gly Leu
        115                 120                 125
Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu Thr Ala
    130                 135                 140
Phe Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg
145                 150                 155                 160
Ala Thr Ala Leu Ile Ser Phe Gly Gln Trp Leu Leu Asp Asn Gly Tyr
                165                 170                 175
Ser Thr Tyr Ala Thr Asn Ile Val Trp Pro Val Val Arg Asn Asp Leu
            180                 185                 190
Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu Trp Glu
        195                 200                 205
Glu Val Ser Gly Ser Ser Phe Phe Thr Ile Ala Ala Gln His Arg Ala
    210                 215                 220
Leu Val Glu Gly Ser Thr Phe Ala Thr Arg Val Gly Ala Ser Cys Ser
225                 230                 235                 240
Tyr Cys Asp Ser Gln Ala Pro Gln Val Leu Cys Phe Leu Gln Ser Phe
                245                 250                 255
Trp Thr Gly Ser Tyr Thr Leu Ala Asn Phe Gly Gly Gly Arg Ser Gly
            260                 265                 270
Lys Asp Ala Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp Pro Glu
        275                 280                 285
Ala Gly Cys Asp Asp Thr Thr Phe Gln Pro Cys Ser Ala Arg Ala Leu
    290                 295                 300
Ala Asn His Lys Val Val Thr Asp Ser Phe Arg Ser Val Tyr Thr Ile
305                 310                 315                 320
Asn Ser Gly Ile Ala Ala Gly Lys Ala Val Ser Val Gly Arg Tyr Ser
                325                 330                 335
Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Tyr Leu Cys Thr Leu Ala
            340                 345                 350
Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Thr Trp Asn Arg Val Gly
        355                 360                 365
Ser Leu Thr Ile Thr Ser Val Ser Leu Ser Phe Phe Lys Asp Leu Tyr
    370                 375                 380
Ser Ser Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ala Thr Tyr Ser
385                 390                 395                 400
Ser Ile Val Ser Ala Val Lys Thr Tyr Ala Asp Gly Tyr Val Ser Ile
                405                 410                 415
Val Glu Asn Tyr Ala Leu Thr Asn Gly Ser Met Ser Glu Gln Phe Ser
            420                 425                 430
Lys Ser Asp Gly Ser Gln Leu Ser Ala Arg Asp Leu Thr Trp Ser Tyr
        435                 440                 445
Ala Ala Leu Leu Thr Ala Asn Glu Arg Arg Asn Ala Val Val Pro Ala
    450                 455                 460
Pro Trp Gly Glu Thr Ala Ala Ser Ser Val Pro Ala Gln Cys Ser Ser
465                 470                 475                 480
Thr Ser Ala Thr Gly Thr Phe Ser Thr Ala Thr Asn Thr Ala Trp Pro
                485                 490                 495
Ser Thr Leu Thr Ser Gly Thr Gly Ser Gly Thr Thr Thr Thr Gly Thr
            500                 505                 510
Gly Thr Thr Thr Lys Ala Thr Thr Thr Thr Ser Thr Lys Thr Thr Ser
        515                 520                 525
Thr Thr Thr Ser Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp
    530                 535                 540
Val Ile Ala Thr Thr Val Tyr Gly Glu Asn Ile Lys Leu Ala Gly Ser
545                 550                 555                 560
Ile Ser Gln Leu Gly Ser Trp Asp Thr Ser Ser Ala Ile Ala Leu Ser
                565                 570                 575
Ala Ser Ser Tyr Thr Ser Ser Asn His Leu Trp Tyr Val Thr Val Thr
            580                 585                 590
Leu Pro Ala Gly Ser Thr Phe Thr Tyr Lys Tyr Ile Arg Val Glu Ser
        595                 600                 605
Asp Gly Ser Ile Gln Trp Glu Ser Asp Pro Asn Leu Ser Tyr Thr Val
    610                 615                 620
Pro Gln Ala Cys Gly Thr Ser Ala Val Thr Ile Ser Asp Thr Trp Arg
625                 630                 635                 640
<210>39
<211>1896
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>39
atggctcctc gtttttggac tgcgctttgg gcgcttacgc ttggccatgc cgttgtggcc   60
acgccacaga tattggctcc tcgtgcgact ggcagtttgg atacctggtt ggcgtctgag  120
actgtggtgg caagacaggg tatcttggac aacatcggat cggctggtgc ccatgctgcc   180
aatgcaaagc cgggcgttgt actcgccagc ccgagtacct ccgaccctga ttattattat   240
acttggactc gtgactcggc cctagtgttc aaaaatctgg tcgacatgtt caggagcggc   300
gacagcgctt tgttggaggt tatcgaagaa tacatcagct cgcaggccta tatccagacg   360
gtgtcaaatc catctggagg tctttccggc ggcggtggat tgggagagcc caagttcaac   420
gccgatgaga cagctttcac tggctcttgg ggacgccctc agcgtgatgg accagccttg   480
cgagccactg ccttgatctc atttggccaa tggcttattg acaatgggta caccacctac   540
gcgaccgaca ttgtctggcc tgtcgtgcgc aatgatctct cctatgtttc ccagtactgg   600
aatcagactg gatttgatct ctgggaagaa gtttctggct catcattctt caccgtcgcg   660
gctcagcacc gcgctttggt ggagggaagc acattcgcaa gtcaggtcgg ttcttcatgt   720
ttgtactgtg actcccaggc tccgcaggtt ctgtgcttcc tacagtcctt ctggactgga   780
tcttacattc tggccaactt tggtggtggc cgctctggga aggacgccaa tacactgctc   840
ggcagcattc acacattcga cccagaggca ggatgcgatg acacgacgtt ccagccttgc   900
tcagcacgag cactcgcaaa ccacaaagtt gtaactgact cgttccgatc gatctactct   960
gtcaactctg gtatcgctgc gggtaaggct gtttctgttg gtcgataccc agaggactca  1020
tactacaatg gtaacccttg gtatctgtgc actttggctg cagctgagca gttgtatgat  1080
gctatctaca catggaaccg tattggttct ttgaccatta cctctgtctc tttgagcttc  1140
ttcaaagacc tatacagctc tgctgcgacc ggcacctact cctcatccag tgatacatac  1200
tcctcgatcg tggccgctgt aaaggaatat gcagatggat atgttagcat cgtggaaaaa  1260
tacgctgcat caagtggttc cttgtccgag caattctcca agtcagatgg ctcgcagctg  1320
tcagctcgtg acctgacttg gtcctacgca gccctactta ctgccaatga gcgtcgaaac  1380
gccatagtcc ctgcaccatg gggggagaca tctgctagca gtgtccctgg gcagtgtcaa  1440
tatacttcgg ccattggtac ttacagcagc gcaacaaaca ccgcctggcc taccactttg  1500
actagtggat cgggcagtgt aactaccacc aagacgacta ccactacctc gaagccgaca  1560
acaacatcat gcactactcc gaccactgtt gcagtgacgt tcaatgtgat tgctactact  1620
gaatatggcc agaacatcaa actcgctgga tctatctctc aacttggctc atggtcgcca  1680
agcagtgctg tcgcattgag cgcttccaaa tacaccacga gcaaccacct gtggtttgtg  1740
accgtgacac ttccagtagg cactagcttc agctacaagt acatccaggt ggcgagcgat  1800
ggcactatca agtgggaaag tgacccaaac cagtcgtata ccgttcccgc cacgtgtggt  1860
actactgctg tcaccgtcag tgatacatgg aggtag                            1896
<210>40
<21l>631
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(42)...(457)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(529)...(625)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(204)...(207)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(206)...(216)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(619)...(622)
<223>N-糖基化位点.Prosite id=PS00001
<400>40
Met Ala Pro Arg Phe Trp Thr Ala Leu Trp Ala Leu Thr Leu Gly His
1               5                   10                  15
Ala Val Val Ala Thr Pro Gln Ile Leu Ala Pro Arg Ala Thr Gly Ser
            20                  25                  30
Leu Asp Thr Trp Leu Ala Ser Glu Thr Val Val Ala Arg Gln Gly Ile
        35                  40                  45
Leu Asp Asn Ile Gly Ser Ala Gly Ala His Ala Ala Asn Ala Lys Pro
    50                  55                  60
Gly Val Val Leu Ala Ser Pro Ser Thr Ser Asp Pro Asp Tyr Tyr Tyr
65                  70                  75                  80
Thr Trp Thr Arg Asp Ser Ala Leu Val Phe Lys Asn Leu Val Asp Met
                85                  90                  95
Phe Arg Ser Gly Asp Ser Ala Leu Leu Glu Val Ile Glu Glu Tyr Ile
            100                 105                 110
Ser Ser Gln Ala Tyr Ile Gln Thr Val Ser Asn Pro Ser Gly Gly Leu
        115                 120                 125
Ser Gly Gly Gly Gly Leu Gly Glu Pro Lys Phe Asn Ala Asp Glu Thr
    130                 135                 140
Ala Phe Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu
145                 150                 155                 160
Arg Ala Thr Ala Leu Ile Ser Phe Gly Gln Trp Leu Ile Asp Asn Gly
                165                 170                 175
Tyr Thr Thr Tyr Ala Thr Asp Ile Val Trp Pro Val Val Arg Asn Asp
            180                 185                 190
Leu Ser Tyr Val Ser Gln Tyr Trp Asn Gln Thr Gly Phe Asp Leu Trp
        195                 200                 205
Glu Glu Val Ser Gly Ser Ser Phe Phe Thr Val Ala Ala Gln His Arg
    210                 215                 220
Ala Leu Val Glu Gly Ser Thr Phe Ala Ser Gln Val Gly Ser Ser Cys
225                 230                 235                 240
Leu Tyr Cys Asp Ser Gln Ala Pro Gln Val Leu Cys Phe Leu Gln Ser
                245                 250                 255
Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Gly Gly Gly Arg Ser
            260                 265                 270
Gly Lys Asp Ala Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp Pro
        275                 280                 285
Glu Ala Gly Cys Asp Asp Thr Thr Phe Gln Pro Cys Ser Ala Arg Ala
    290                 295                 300
Leu Ala Asn His Lys Val Val Thr Asp Ser Phe Arg Ser Ile Tyr Ser
305                 310                 315                 320
Val Asn Ser Gly Ile Ala Ala Gly Lys Ala Val Ser Val Gly Arg Tyr
                325                 330                 335
Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Tyr Leu Cys Thr Leu
            340                 345                 350
Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Thr Trp Asn Arg Ile
        355                 360                 365
Gly Ser Leu Thr Ile Thr Ser Val Ser Leu Ser Phe Phe Lys Asp Leu
    370                 375                 380
Tyr Ser Ser Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Asp Thr Tyr
385                 390                 395                 400
Ser Ser Ile Val Ala Ala Val Lys Glu Tyr Ala Asp Gly Tyr Val Ser
                405                 410                 415
Ile Val Glu Lys Tyr Ala Ala Ser Ser Gly Ser Leu Ser Glu Gln Phe
            420                 425                 430
Ser Lys Ser Asp Gly Ser Gln Leu Ser Ala Arg Asp Leu Thr Trp Ser
        435                 440                 445
Tyr Ala Ala Leu Leu Thr Ala Asn Glu Arg Arg Asn Ala Ile Val Pro
    450                 455                 460
Ala Pro Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Gln Cys Gln
465                 470                 475                 480
Tyr Thr Ser Ala Ile Gly Thr Tyr Ser Ser Ala Thr Asn Thr Ala Trp
                485                 490                 495
Pro Thr Thr Leu Thr Ser Gly Ser Gly Ser Val Thr Thr Thr Lys Thr
            500                 505                 510
Thr Thr Thr Thr Ser Lys Pro Thr Thr Thr Ser Cys Thr Thr Pro Thr
        515                 520                 525
Thr Val Ala Val Thr Phe Asn Val Ile Ala Thr Thr Glu Tyr Gly Gln
    530                 535                 540
Asn Ile Lys Leu Ala Gly Ser Ile Ser Gln Leu Gly Ser Trp Ser Pro
545                 550                 555                 560
Ser Ser Ala Val Ala Leu Ser Ala Ser Lys Tyr Thr Thr Ser Asn His
                565                 570                 575
Leu Trp Phe Val Thr Val Thr Leu Pro Val Gly Thr Ser Phe Ser Tyr
            580                 585                 590
Lys Tyr Ile Gln Val Ala Ser Asp Gly Thr Ile Lys Trp Glu Ser Asp
        595                 600                 605
Pro Asn Gln Ser Tyr Thr Val Pro Ala Thr Cys Gly Thr Thr Ala Val
    610                 615                 620
Thr Val Ser Asp Thr Trp Arg
625                 630
<210>41
<211>1563
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>41
atgctggttc ctgtggtcat tctcacacat tttctccact atgcttgcgc tttctcgata    60
ccccatttgc acttgaaatt tgcgagtgcc agtgacgcac aaataccaca gaagccgctg   120
cgggatacgc tggaagtctg gctcgaagct gaagagcgca tagctctaaa taaattactc   180
gccaacgtag ctccaggcgg tagcaatgtc gagggcaaag gcgtggcacc cggaactgtc   240
attgcgagtc cgagtcagga cgggccagat tattggtatc agtgggttcg agatgccgct   300
atcaccatga atacgctcgt agatttgtat gccgagaacc cttcatccgc cttatcatct   360
cgtctttcga cgaccttaga tgcatacgct tccctacaac gtgatctgca gcatacatca   420
aatccctcgg gctcatttga tgattcgtcc ggccttggtg aaccgaaatt tgaagtcgac   480
ggaacgccat ttacaggctc atggggaagg ccacaacgcg atggaccggc gttaagagcg   540
ctgactctta tgcggtatct tcgagaatac aacgctagcc atccttcgct ttggtcttca   600
aatgaggcta ccgacttcta tagtctttat tacgaagcag agatgccacc gcggagcgtg   660
atcaaggcag accttgaata cgtgagccat ttctggaacg aatccagttt tgatctttgg   720
gaagaaacag aaggtcttca cttctttaac ttgatggtca gcgcacgaag tctaagggag   780
ggcagtgagc tagcaagagc atttggagat attggtgcag cagaatggta tatcgaacaa   840
gctggctaca tcgaaaagct tctgagcaaa ttctggaacc cgaacaaagg ccatctcgtg   900
gagaccttgt ggagtaagcg ctcaggtcta gattgtggtc ttcttctcgg gtctctacat   960
gctcttcctg ctcagggctt ggaagaagag gcagttttcc cgccctggtc cgacgagatc  1020
ctcgtgagct tgcttgctct gacagaagat caaagagacc gcttcccaat caacagcaac  1080
ccatatgagg atcaagatgg atcccatcca gcgttcgagg gtacaggagt tggacgttat  1140
cccgaagacg tctacgacgg ctatggcacc agtaatcgcg gaggcaaccc atggttccta  1200
tgcacatcaa gcgcagccga aatactgtac cgcagtgctt cttacttcta tacagcctcc  1260
aacctcacca tctccaccgc atctcttccg ttctacacct ccctgcttgc aacttcaagc  1320
ctcgatgtcc aagtcggaac atttggaccc tcagatacgc ttttccactc tgtcatcgag  1380
catctcaagt ccgcaggcga ttcgttcctt gaagttgtga aaacgcatgt agatgatgag  1440
ggacgaatga gcgagcaatt tgacagagtg acgggttata tgcgcggtgc gcgggatttg  1500
acctggagtt acggtgcatt tctacaggcg gtgaaggcgc gaaggagtat tcaggaggtt  1560
tga                                                                1563
<210>42
<211>520
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域(DOMAIN)
<222>(53)...(512)
<223>糖基水解酶家族15
<220>
<221>SITE
<222>(193)...(196)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(236)...(239)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(427)...(430)
<223>N-糖基化位点.Prosite id=PS00001
<400>42
Met Leu Val Pro Val Val Ile Leu Thr His Phe Leu His Tyr Ala Cys
1               5                   10                  15
Ala Phe Ser Ile Pro His Leu His Leu Lys Phe Ala Ser Ala Ser Asp
            20                  25                  30
Ala Gln Ile Pro Gln Lys Pro Leu Arg Asp Thr Leu Glu Val Trp Leu
        35                  40                  45
Glu Ala Glu Glu Arg Ile Ala Leu Asn Lys Leu Leu Ala Asn Val Ala
    50                  55                  60
Pro Gly Gly Ser Asn Val Glu Gly Lys Gly Val Ala Pro Gly Thr Val
65                  70                  75                  80
Ile Ala Ser Pro Ser Gln Asp Gly Pro Asp Tyr Trp Tyr Gln Trp Val
                85                  90                  95
Arg Asp Ala Ala Ile Thr Met Asn Thr Leu Val Asp Leu Tyr Ala Glu
            100                 105                 110
Asn Pro Ser Ser Ala Leu Ser Ser Arg Leu Ser Thr Thr Leu Asp Ala
        115                 120                 125
Tyr Ala Ser Leu Gln Arg Asp Leu Gln His Thr Ser Asn Pro Ser Gly
    130                 135                 140
Ser Phe Asp Asp Ser Ser Gly Leu Gly Glu Pro Lys Phe Glu Val Asp
145                 150                 155                 160
Gly Thr Pro Phe Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro
                165                 170                 175
Ala Leu Arg Ala Leu Thr Leu Met Arg Tyr Leu Arg Glu Tyr Asn Ala
            180                 185                 190
Ser His Pro Ser Leu Trp Ser Ser Asn Glu Ala Thr Asp Phe Tyr Ser
        195                 200                 205
Leu Tyr Tyr Glu Ala Glu Met Pro Pro Arg Ser Val Ile Lys Ala Asp
    210                 215                 220
Leu Glu Tyr Val Ser His Phe Trp Asn Glu Ser Ser Phe Asp Leu Trp
225                 230                 235                 240
Glu Glu Thr Glu Gly Leu His Phe Phe Asn Leu Met Val Ser Ala Arg
                245                 250                 255
Ser Leu Arg Glu Gly Ser Glu Leu Ala Arg Ala Phe Gly Asp Ile Gly
            260                 265                 270
Ala Ala Glu Trp Tyr Ile Glu Gln Ala Gly Tyr Ile Glu Lys Leu Leu
        275                 280                 285
Ser Lys Phe Trp Asn Pro Asn Lys Gly His Leu Val Glu Thr Leu Trp
    290                 295                 300
Ser Lys Arg Ser Gly Leu Asp Cys Gly Leu Leu Leu Gly Ser Leu His
305                 310                 315                 320
Ala Leu Pro Ala Gln Gly Leu Glu Glu Glu Ala Val Phe Pro Pro Trp
                325                 330                 335
Ser Asp Glu Ile Leu Val Ser Leu Leu Ala Leu Thr Glu Asp Gln Arg
            340                 345                 350
Asp Arg Phe Pro Ile Asn Ser Asn Pro Tyr Glu Asp Gln Asp Gly Ser
        355                 360                 365
His Pro Ala Phe Glu Gly Thr Gly Val Gly Arg Tyr Pro Glu Asp Val
    370                 375                 380
Tyr Asp Gly Tyr Gly Thr Ser Asn Arg Gly Gly Asn Pro Trp Phe Leu
385                 390                 395                 400
Cys Thr Ser Ser Ala Ala Glu Ile Leu Tyr Arg Ser Ala Ser Tyr Phe
                405                 410                 415
Tyr Thr Ala Ser Asn Leu Thr Ile Ser Thr Ala Ser Leu Pro Phe Tyr
            420                 425                 430
Thr Ser Leu Leu Ala Thr Ser Ser Leu Asp Val Gln Val Gly Thr Phe
        435                 440                 445
Gly Pro Ser Asp Thr Leu Phe His Ser Val Ile Glu His Leu Lys Ser
    450                 455                 460
Ala Gly Asp Ser Phe Leu Glu Val Val Lys Thr His Val Asp Asp Glu
465                 470                 475                 480
Gly Arg Met Ser Glu Gln Phe Asp Arg Val Thr Gly Tyr Met Arg Gly
                485                 490                 495
Ala Arg Asp Leu Thr Trp Ser Tyr Gly Ala Phe Leu Gln Ala Val Lys
            500                 505                 510
Ala Arg Arg Ser Ile Gln Glu Val
        515                 520
<210>43
<211>3030
<212>DNA
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48332
<400>43
atgacgcaca caagtttcgt ccaggcttct actgtgctgt cctctcttct cgcactcaca     60
gctggccaag cgcccaccac ttcttcaaat ggtggatgga gtactacgct cgctggcacg    120
cccacctact tcaatcccat ctttaccatc cctccatctg cggatgaggg cgttcaacag    180
attcccaaca tctatgaccc acaagccgtg gatgcgcaag acgtttgccc tggttacaca    240
gcatcaaacc ctcagcagag tgatcgtggc ctgaccgcca cgttgaccct ggctggaaag    300
ccatgcaatg tttacggcac cgatatccag gaactagact tgaaagtcga gtaccaggcc    360
aagggaagac tgtcagtcaa cattgtacca aagtacactg gtgcaagcaa ccagtcgcat    420
tggattgttc ccgaagatct gattccgcgt cctcaggtcg aggaatcatc cgagcagacc    480
gatctcaagt tcaactgggg aaatgagcca tctttttggt tcaatgtcga gcgctcctcg    540
actggagaca tcatcttcac aactcaaggc acccatctca tttacgaaaa tcaatttgtt    600
gaatttgtaa acagcctgcc agaggactac aacctttacg gtctgggtga acgaattcac    660
ggtcttcgtc ttaacaacaa cttcactgcg accatctacg ctgctgacgt aggtgatcct    720
atcgaccgca acctgtacgg tagccaccct ttttacctag agacccggta ctttgagaag    780
ggcgaaaact gtagcaccaa gcccttgacg cagtccgaga tcggccagaa gaaggatacc    840
aaaacaaatg gttcgcccta cgagtcgcgt tcccacggcg tttattaccg caacactcat    900
ggtatggacg tggtgctgaa acctgatcac ctaacttgga ggaccctggg aggtgctatt    960
gatctgtact tcttcgatgg accttcacag ccggacgtta ctaaagcgta tcaaaaggcg   1020
gctattggcc tgccagcaat gcagcaatac tggacctttg gctttcatca atgccgttgg   1080
ggctaccgca actggaccga gactcgagaa attgttgaga ccatgagagc tttcaacatc   1140
ccaatggaaa ccatctggct cgacattgac tacatggacc agtaccgtga ctttacgctg   1200
gatcccgtgg ctttccctcc ctctgaagtg gccgacttct tcggatggct gcatggaaac   1260
aaccagcatt ttgtacccat cgttgatgca gctatttaca tccccaaccc gcaaaacgca   1320
agcgatgcat atgacacata tacgcgcggc aatgaatctg gtgtgttctt gtccaaccca  1380
gacggcagcc aatatatcgg tgctgtctgg cctgggtaca ccgttttccc tgattggttg  1440
tcgcccaacg gtgtatcttg gtgggtaaag gagatggtcg agtggtacaa agaggtacca  1500
tatagcggtt tctgggttga catgactgaa gtctcttctt tctgcgttgg atcctgtggt  1560
actggcaacg tcaccctgaa cccggctcac ccgcccttct cgcttcccgg tgaggtgaac  1620
aacgtcatct atgattaccc agagagcttc aacatcacaa atggtaccga ggcggcgtcc  1680
gcttctgcag cagcttccgc ccaagcatcc aggaaggcaa ctgcgacggc gacggtgacc  1740
gacgaagtga cttctacttc gacaagctac ttccgctcga cccctaccgc tggagagcga  1800
aacatcaact atcctcctta tgtcatcaac cacgtacaag atggcgctga tcttgctgtt  1860
catgctgtca gccccaatgc aactcatgca aatggtgtgg aggaatacga tgtccacaac  1920
ctctttggtc accagatcat taacgctact tatcacggtc tcctttcggt gttccctgga  1980
aagcggccct ttatcattgg acgctccaca tttgctggca gcggcaagtg ggctggtcat  2040
tggggtggcg acaacgcttc taaatgggcc tacatgttct tctcgattcc acaagcactt  2100
tccttttcac tatttggtat tccgatgttt ggtgtcgata cctgcggatt caacggaaac  2160
actgacatgg agctttgctc tcgatggatg cagctttcgg cctttttccc cttttaccgc  2220
aaccacaacg tactctccgc cattccccaa gagccctacc gatgggaggc cgtggcttct  2280
gcttcgagga ccgcaatgca catccgatac tctctgttgc catacatgta cacgctattc  2340
aatgacgctc acaagactgg gtcaactgtg atgcgggcgc tggcatggga attccccaac  2400
gagccccaac tcgctggtgt agatacacaa ttcttgcttg ggccaaacat cctagtcacg  2460
cctgtcctcg agcctcaagt tgatactgtc aagggagtgt tccctggtat tgtcgacggc  2520
gagacatggt ttgattggta ttctggcgag cgtgtccaag ccgaggctgg cgtaaacacg  2580
accatctcag cacctttggg ccacatcccg gtatacattc gcggaggttc ggtcctacct  2640
attcaggagc ctggatacac gactaccgag tcccgccgga acccctgggg tctcattgtc  2700
gcactctcca gtgaaggcac tgcatcgggt cacctatacg ttgatgatgg tgagtccatc  2760
gagccagact cgtgcctgaa tgttgcattt gctgctacga gcggaaagtt ggaggttgat  2820
gttcagggcg agttcaagga cacgaacgca cttgccaacg tgacagtttt gggagctcct  2880
gcggtccaaa acgtcaagct gaatggtgag gcgattgatg ctagcaatgt tgattacaac  2940
aagaccagta gcgttttgaa gctgacggga ctcaatgaac tgacaagttc tggagcttgg  3000
cagggtagct ggacgctgac ttgggaataa                                   3030
<210>44
<211>1009
<212>PRT
<213>异旋孢腔菌(Cochliobolus heterostrophus)ATCC 48332
<220>
<221>结构域(DOMAIN)
<222>(323)...(879)
<223>糖基水解酶家族31
<220>
<221>SITE
<222>(139)...(142)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(230)...(233)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(267)...(270)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(369)...(372)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(445)...(448)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(457)...(460)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(531)...(534)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(559)...(562)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(635)...(638)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(657)...(660)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(695)...(698)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(872)...(875)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(967)...(970)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(995)...(998)
<223>N-糖基化位点.Prosite id=PS00001
<400>44
Met Thr His Thr Ser Phe Val Gln Ala Ser Thr Val Leu Ser Ser Leu
1               5                   10                  15
Leu Ala Leu Thr Ala Gly Gln Ala Pro Thr Thr Ser Ser Asn Gly Gly
            20                  25                  30
Trp Ser Thr Thr Leu Ala Gly Thr Pro Thr Tyr Phe Asn Pro Ile Phe
        35                  40                  45
Thr Ile Pro Pro Ser AIa Asp Glu Gly Val Gln Gln Ile Pro Asn Ile
    50                  55                  60
Tyr Asp Pro Gln Ala Val Asp Ala Gln Asp Val Cys Pro Gly Tyr Thr
65                  70                  75                  80
Ala Ser Asn Pro Gln Gln Ser Asp Arg Gly Leu Thr Ala Thr Leu Thr
                85                  90                  95
Leu Ala Gly Lys Pro Cys Asn Val Tyr Gly Thr Asp Ile Gln Glu Leu
            100                 105                 110
Asp Leu Lys Val Glu Tyr Gln Ala Lys Gly Arg Leu Ser Val Asn Ile
        115                 120                 125
Val Pro Lys Tyr Thr Gly Ala Ser Asn Gln Ser His Trp Ile Val Pro
    130                 135                 140
Glu Asp Leu Ile Pro Arg Pro Gln Val Glu Glu Ser Ser Glu Gln Thr
145                 150                 155                 160
Asp Leu Lys Phe Asn Trp Gly Asn Glu Pro Ser Phe Trp Phe Asn Val
                165                 170                 175
Glu Arg Ser Ser Thr Gly Asp Ile Ile Phe Thr Thr Gln Gly Thr His
            180                 185                 190
Leu Ile Tyr Glu Asn Gln Phe Val Glu Phe Val Asn Ser Leu Pro Glu
        195                 200                 205
Asp Tyr Asn Leu Tyr Gly Leu Gly Glu Arg Ile His Gly Leu Arg Leu
    210                 215                 220
Asn Asn Asn Phe Thr Ala Thr Ile Tyr Ala Ala Asp Val Gly Asp Pro
225                 230                 235                 240
Ile Asp Arg Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Glu Thr Arg
                245                 250                 255
Tyr Phe Glu Lys Gly Glu Asn Cys Ser Thr Lys Pro Leu Thr Gln Ser
            260                 265                 270
Glu Ile Gly Gln Lys Lys Asp Thr Lys Thr Asn Gly Ser Pro Tyr Glu
        275                 280                 285
Ser Arg Ser His Gly Val Tyr Tyr Arg Asn Thr His Gly Met Asp Val
    290                 295                 300
Val Leu Lys Pro Asp His Leu Thr Trp Arg Thr Leu Gly Gly Ala Ile
305                 310                 315                 320
Asp Leu Tyr Phe Phe Asp Gly Pro Ser Gln Pro Asp Val Thr Lys Ala
                325                 330                 335
Tyr Gln Lys Ala Ala Ile Gly Leu Pro Ala Met Gln Gln Tyr Trp Thr
            340                 345                 350
Phe Gly Phe His Gln Cys Arg Trp Gly Tyr Arg Asn Trp Thr Glu Thr
        355                 360                 365
Arg Glu Ile Val Glu Thr Met Arg Ala Phe Asn Ile Pro Met Glu Thr
    370                 375                 380
Ile Trp Leu Asp Ile Asp Tyr Met Asp Gln Tyr Arg Asp Phe Thr Leu
385                 390                 395                 400
Asp Pro Val Ala Phe Pro Pro Ser Glu Val Ala Asp Phe Phe Gly Trp
                405                 410                 415
Leu His Gly Asn Asn Gln His Phe Val Pro Ile Val Asp Ala Ala Ile
            420                 425                 430
Tyr Ile Pro Asn Pro Gln Asn Ala Ser Asp Ala Tyr Asp Thr Tyr Thr
        435                 440                 445
Arg Gly Asn Glu Ser Gly Val Phe Leu Ser Asn Pro Asp Gly Ser Gln
    450                 455                 460
Tyr Ile Gly Ala Val Trp Pro Gly Tyr Thr Val Phe Pro Asp Trp Leu
465                 470                 475                 480
Ser Pro Asn Gly Val Ser Trp Trp Val Lys Glu Met Val Glu Trp Tyr
                485                 490                 495
Lys Glu Val Pro Tyr Ser Gly Phe Trp Val Asp Met Thr Glu Val Ser
            500                 505                 510
Ser Phe Cys Val Gly Ser Cys Gly Thr Gly Asn Val Thr Leu Asn Pro
        515                 520                 525
Ala His Pro Pro Phe Ser Leu Pro Gly Glu Val Asn Asn Val Ile Tyr
    530                 535                 540
Asp Tyr Pro Glu Ser Phe Asn Ile Thr Asn Gly Thr Glu Ala Ala Ser
545                 550                 555                 560
Ala Ser Ala Ala Ala Ser Ala Gln Ala Ser Arg Lys Ala Thr Ala Thr
                565                 570                 575
Ala Thr Val Thr Asp Glu Val Thr Ser Thr Ser Thr Ser Tyr Phe Arg
            580                 585                 590
Ser Thr Pro Thr Ala Gly Glu Arg Asn Ile Asn Tyr Pro Pro Tyr Val
        595                 600                 605
Ile Asn His Val Gln Asp Gly Ala Asp Leu Ala Val His Ala Val Ser
    610                 615                 620
Pro Asn Ala Thr His Ala Asn Gly Val Glu Glu Tyr Asp Val His Asn
625                 630                 635                 640
Leu Phe Gly His Gln Ile Ile Asn Ala Thr Tyr His Gly Leu Leu Ser
                645                 650                 655
Val Phe Pro Gly Lys Arg Pro Phe Ile Ile Gly Arg Ser Thr Phe Ala
            660                 665                 670
Gly Ser Gly Lys Trp Ala Gly His Trp Gly Gly Asp Asn Ala Ser Lys
        675                 680                 685
Trp Ala Tyr Met Phe Phe Ser Ile Pro Gln Ala Leu Ser Phe Ser Leu
    690                 695                 700
Phe Gly Ile Pro Met Phe Gly Val Asp Thr Cys Gly Phe Asn Gly Asn
705                 710                 715                 720
Thr Asp Met Glu Leu Cys Ser Arg Trp Met Gln Leu Ser Ala Phe Phe
                725                 730                 735
Pro Phe Tyr Arg Asn His Asn Val Leu Ser Ala Ile Pro Gln Glu Pro
            740                 745                 750
Tyr Arg Trp Glu Ala Val Ala Ser Ala Ser Arg Thr Ala Met His Ile
        755                 760                 765
Arg Tyr Ser Leu Leu Pro Tyr Met Tyr Thr Leu Phe Asn Asp Ala His
    770                 775                 780
Lys Thr Gly Ser Thr Val Met Arg Ala Leu Ala Trp Glu Phe Pro Asn
785                 790                 795                 800
Glu Pro Gln Leu Ala Gly Val Asp Thr Gln Phe Leu Leu Gly Pro Asn
                805                 810                 815
Ile Leu Val Thr Pro Val Leu Glu Pro Gln Val Asp Thr Val Lys Gly
            820                 825                 830
Val Phe Pro Gly Ile Val Asp Gly Glu Thr Trp Phe Asp Trp Tyr Ser
        835                 840                 845
Gly Glu Arg Val Gln Ala Glu Ala Gly Val Asn Thr Thr Ile Ser Ala
    850                 855                 860
Pro Leu Gly His Ile Pro Val Tyr Ile Arg Gly Gly Ser Val Leu Pro
865                 870                 875                 880
Ile Gln Glu Pro Gly Tyr Thr Thr Thr Glu Ser Arg Arg Asn Pro Trp
                885                 890                 895
Gly Leu Ile Val Ala Leu Ser Ser Glu Gly Thr Ala Ser Gly His Leu
            900                 905                 910
Tyr Val Asp Asp Gly Glu Ser Ile Glu Pro Asp Ser Cys Leu Asn Val
        915                 920                 925
Ala Phe Ala Ala Thr Ser Gly Lys Leu Glu Val Asp Val Gln Gly Glu
    930                 935                 940
Phe Lys Asp Thr Asn Ala Leu Ala Asn Val Thr Val Leu Gly Ala Pro
945                 950                 955                 960
Ala Val Gln Asn Val Lys Leu Asn Gly Glu Ala Ile Asp Ala Ser Asn
                965                 970                 975
Val Asp Tyr Asn Lys Thr Ser Ser Val Leu Lys Leu Thr Gly Leu Asn
            980                 985                 990
Glu Leu Thr Ser Ser Gly Ala Trp  Gln Gly Ser Trp Thr  Leu Thr Trp
        995                 1000                 1005
Glu
<210>45
<211>1380
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>45
atgaagcttc ttcaactcgc cgccctggtg gcgtccctca gccccttcac caacgctgcc     60
gacgcaaacg cctggaagtc gcgaaacatt tactttgcgc ttacagaccg cgttgcgcgc    120
agcggtagcg ataacggtgg caatgcctgt ggcaatcttg gaaattattg tggtggaacg    180
ttcaagggtc ttgaggctaa gcttgattac atcaagggca tgggctttga tgctatctgg    240
attactcctg ttgttgagaa caccgatgga ggataccatg gatactgggc taaagacctg    300
tacgcggtta attccaagta tggtaccaag gatgacttga agaatcttgt caaggctgcc    360
cacggcaaga acatgtacgt catggccgac gtcgtcgcaa accacatggg caagggcatc    420
caaaaccaca agccggagcc cctcaaccag caaagctcct accacagctc ctgcgccatc    480
gactacaaca accaaaacag catcgagcag tgcgaaatcg ccggtctgcc cgatctcaac    540
accggcaagg cagaagtcaa gaaggtcctc aacgactgga tcaagtggct cgtctccgag    600
tacagcttcg acggtatccg catcgacaca gtcaagcacg tcgagaagag cttctggcct    660
gatttccaga aggcagctgg cgttttcgcc atcggtgagg tttgggatgg aagccctgat    720
taccttgctg gttactccaa ggtcatgcct ggtctgctga actatgctat gtactatccc    780
atgaaccgat tctatcagca gaagggtgat ccttctgctg tggtggatat gtacaacgag    840
atcagccaga agttcgatga tcctacgcag cttggtacct tcatcgacaa ccacgacaat    900
gcgcgctggt tgagccaaaa gaacgacaag gccctcctca agaacgccct cgcattcacc    960
atcctcgccc gcggtattcc catcgtgtac tacggcaccg aacaaggcta cgcaggaggc   1020
aacgaccccg ccaaccgcga agatctctgg cgcagcaact tcagcaccga ctccgacctg   1080
taccaaacca tttccaagct cggcaaggct cgctccgccg tcggtggtct tgccggcaac   1140
gaccagaaat tcctcaagtc caatgacagc gcactcatct ggagccgcgc agacggcgat   1200
ctgatcgttg ttacgcttaa ccgtggaaag ggatattctg gagagtactg cttcaacact   1260
ggcaagaaca acaagacttg ggatcgtgtt ttgggatctg gaagtgttaa gtctgatggt   1320
agtggtaagc tttgtgttag ctacactaat ggtgagcctg aggttcttgt tgctgcttag   1380
<210>46
<211>459
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(19)
<220>
<221>结构域(DOMAIN)
<222>(32)...(371)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(358)...(361)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(393)...(396)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(430)...(433)
<223>N-糖基化位点.Prosite id=PS00001
<400>46
Met Lys Leu Leu Gln Leu Ala Ala Leu Val Ala Ser Leu Ser Pro Phe
1               5                   10                  15
Thr Asn Ala Ala Asp Ala Asn Ala Trp Lys Ser Arg Asn Ile Tyr Phe
            20                  25                  30
Ala Leu Thr Asp Arg Val Ala Arg Ser Gly Ser Asp Asn Gly Gly Asn
        35                  40                  45
Ala Cys Gly Asn Leu Gly Asn Tyr Cys Gly Gly Thr Phe Lys Gly Leu
    50                  55                  60
Glu Ala Lys Leu Asp Tyr Ile Lys Gly Met Gly Phe Asp Ala Ile Trp
65                  70                  75                  80
Ile Thr Pro Val Val Glu Asn Thr Asp Gly Gly Tyr His Gly Tyr Trp
                85                  90                  95
Ala Lys Asp Leu Tyr Ala Val Asn Ser Lys Tyr Gly Thr Lys Asp Asp
            100                 105                 110
Leu Lys Asn Leu Val Lys Ala Ala His Gly Lys Asn Met Tyr Val Met
        115                 120                 125
Ala Asp Val Val Ala Asn His Met Gly Lys Gly Ile Gln Asn His Lys
    130                 135                 140
Pro Glu Pro Leu Asn Gln Gln Ser Ser Tyr His Ser Ser Cys Ala Ile
145                 150                 155                 160
Asp Tyr Asn Asn Gln Asn Ser Ile Glu Gln Cys Glu Ile Ala Gly Leu
                165                 170                 175
Pro Asp Leu Asn Thr Gly Lys Ala Glu Val Lys Lys Val Leu Asn Asp
            180                 185                 190
Trp Ile Lys Trp Leu Val Ser Glu Tyr Ser Phe Asp Gly Ile Arg Ile
        195                 200                 205
Asp Thr Val Lys His Val Glu Lys Ser Phe Trp Pro Asp Phe Gln Lys
    210                 215                 220
Ala Ala Gly Val Phe Ala Ile Gly Glu Val Trp Asp Gly Ser Pro Asp
225                 230                 235                 240
Tyr Leu Ala Gly Tyr Ser Lys Val Met Pro Gly Leu Leu Asn Tyr Ala
                245                 250                 255
Met Tyr Tyr Pro Met Asn Arg Phe Tyr Gln Gln Lys Gly Asp Pro Ser
            260                 265                 270
Ala Val Val Asp Met Tyr Asn Glu Ile Ser Gln Lys Phe Asp Asp Pro
        275                 280                 285
Thr Gln Leu Gly Thr Phe Ile Asp Asn His Asp Asn Ala Arg Trp Leu
290                 295                 300
Ser Gln Lys Asn Asp Lys Ala Leu Leu Lys Asn Ala Leu Ala Phe Thr
305                 310                 315                 320
Ile Leu Ala Arg Gly Ile Pro Ile Val Tyr Tyr Gly Thr Glu Gln Gly
                325                 330                 335
Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Asp Leu Trp Arg Ser
            340                 345                 350
Asn Phe Ser Thr Asp Ser Asp Leu Tyr Gln Thr Ile Ser Lys Leu Gly
        355                 360                 365
Lys Ala Arg Ser Ala Val Gly Gly Leu Ala Gly Asn Asp Gln Lys Phe
    370                 375                 380
Leu Lys Ser Asn Asp Ser Ala Leu Ile Trp Ser Arg Ala Asp Gly Asp
385                 390                 395                 400
Leu Ile Val Val Thr Leu Asn Arg Gly Lys Gly Tyr Ser Gly Glu Tyr
                405                 410                 415
Cys Phe Asn Thr Gly Lys Asn Asn Lys Thr Trp Asp Arg Val Leu Gly
            420                 425                 430
Ser Gly Ser Val Lys Ser Asp Gly Ser Gly Lys Leu Cys Val Ser Tyr
        435                 440                 445
Thr Asn Gly Glu Pro Glu Val Leu Val Ala Ala
    450                 455
<210>47
<211>1905
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>47
atgacacgca ttctcaccct cgcccttcat gggctggctc ttgtccaaag tgttgttggg    60
gctccccaat tggcccccag agcgacaacc agtctggatg catggttggc atcggagacg   120
accgttgcgc tggatgggat ccttgacaac gtgggttcta gtggagccta cgccaaaagt   180
gcgaagtccg gtatcgtgat tgccagtcca agcaccgaca acccagacta ctactacacg   240
tggactcgcg atgctgcgtt gaccgtcaag gccctgatcg atcttttccg caatggcgag   300
acaagccttc agaccgtgat catggagtac attagctctc aggcgtacct ccagaccgta   360
tccaacccct cggggtcctt gtccaccggt ggtctggcag aaccaaaata ttatgtcgat   420
gagactgcct acacgggcag ctggggtcgt ccccagcggg atggtcctgc cctgagagcg   480
acggcgatga tcgactttgg taactggctc attgacaacg gatattcaac ctacgcctct   540
aacattgtgt ggccgatcgt ccgcaacgat ctgtcgtacg ttgcccaata ttggaaccaa   600
accggatatg acctctggga agaagtgaac ggatcctcct tcttcaccat tgccgtgcag   660
caccgggctc tggtggaagg cagcaccttc gcctccaaag ttggcgcctc atgctcgtgg   720
tgcgactcgc aggcgccgca ggtgctttgc ttcctgcaga gattctggac aggctcgtac   780
atcatggcca attttggcgg cgggcgatcg ggcaaagatg ccaacaccgt cctgggaagc   840
atccatacct tcgacccgaa tgccggttgc gacgacacca cgttccagcc atgctctccg   900
cgagcgctgg cgaaccacaa ggtctacacc gattcgttcc gttctatcta ctctatcaac   960
tcgggaatta gccagggcaa ggctgttgcc gtgggtcgct accccgagga ctcttactac  1020
aatggaaacc cgtggttcct tacgacgttg gctgccgcag agcagttgta cgatgccatt  1080
taccagtggc agaagattgg gtctattacc atcacggacg tctcgctggc cttcttcaag  1140
gatctttaca gctctgcggc cgttgggacg tacgcctctt cgagctcggc cttcacctcc  1200
atcgtgaatg ccgtgaagac gtacgctgat ggatatatga gtattgtgca aacccatgcg  1260
atgacgaatg gctccctttc tgagcagttc ggcaagtccg acggcttctc cctgtccgcc  1320
cgcgatctca cttggtcgta tgcagccctc ctcacagcca acttgagaag aaactcggtc  1380
gttcccccat cctggggtga gacgaccgca actagcgtac cctccgtctg ctccgcgacc  1440
tctgccactg gcacctacag taccgccacc aacaccgcgt ggcccagcac tctgaccagc  1500
gggactggcg ctacaacgac cacaagcaag gcgacttcta ctactactac ctcgtcggcc  1560
tcgacgacca cagctggatg tgtcgttccg accgcggtgg cagtcacctt tgatgagatt  1620
gctaccacaa cctatggcga gaatgtctac gtggtgggtt ccatctcgca actgggcagc  1680
tgggacacca gcaaggccgt ggccctgagt gccagcaaat acacctccag caacaatctc  1740
tggtatgcca cggtcaccct tcccgctggg acgaccttcc agtacaagtt catccgggtt  1800
tcgagcagcg ggactgttac atgggagagt gacccgaacc gttcatacac ggttccgtcc  1860
gcttgtggga cgtctactgc ggtggtgaac accacttggc gctag                  1905
<210>48
<211>634
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(20)    
<220>
<221>结构域(DOMAIN)
<222>(41)...(455)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(532)...(628)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(202)...(205)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(204)...(214)
<223>葡糖淀粉酶活性位点区标记.Prosite id=PS00820
<220>
<221>SITE
<222>(213)...(216)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(429)...(432)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(622)...(625)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(639)...(642)
<223>N-糖基化位点.Prosite id=PS00001
<400>48
Met Thr Arg Ile Leu Thr Leu Ala Leu His Gly Leu Ala Leu Val Gln
1               5                   10                  15
Ser Val Val Gly Ala Pro Gln Leu Ala Pro Arg Ala Thr Thr Ser Leu
            20                  25                  30
Asp Ala Trp Leu Ala Ser Glu Thr Thr Val Ala Leu Asp Gly Ile Leu
        35                  40                  45
Asp Asn Val Gly Ser Ser Gly Ala Tyr Ala Lys Ser Ala Lys Ser Gly
    50                  55                  60
Ile Val Ile Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr Tyr Tyr Thr
65                  70                  75                  80
Trp Thr Arg Asp Ala Ala Leu Thr Val Lys Ala Leu Ile Asp Leu Phe
                85                  90                  95
Arg Asn Gly Glu Thr Ser Leu Gln Thr Val Ile Met Glu Tyr Ile Ser
            100                 105                 110
Ser Gln Ala Tyr Leu Gln Thr Val Ser Asn Pro Ser Gly Ser Leu Ser
        115                 120                 125
Thr Gly Gly Leu Ala Glu Pro Lys Tyr Tyr Val Asp Glu Thr Ala Tyr
    130                 135                 140
Thr Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala
145                 150                 155                 160
Thr Ala Met Ile Asp Phe Gly Asn Trp Leu Ile Asp Asn Gly Tyr Ser
                165                 170                 175
Thr Tyr Ala Ser Asn Ile Val Trp Pro Ile Val Arg Asn Asp Leu Ser
            180                 185                 190
Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu Trp Glu Glu
        195                 200                 205
Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala Leu
    210                 215                 220
Val Glu Gly Ser Thr Phe Ala Ser Lys Val Gly Ala Ser Cys Ser Trp
225                 230                 235                 240
Cys Asp Ser Gln Ala Pro Gln Val Leu Cys Phe Leu Gln Arg Phe Trp
                245                 250                 255
Thr Gly Ser Tyr Ile Met Ala Asn Phe Gly Gly Gly Arg Ser Gly Lys
            260                 265                 270
Asp Ala Asn Thr Val Leu Gly Ser Ile His Thr Phe Asp Pro Asn Ala
        275                 280                 285
Gly Cys Asp Asp Thr Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala
    290                 295                 300
Asn His Lys Val Tyr Thr Asp Ser Phe Arg Ser Ile Tyr Ser Ile Asn
305                 310                 315                 320
Ser Gly Ile Ser Gln Gly Lys Ala Val Ala Val Gly Arg Tyr Pro Glu
                325                 330                 335
Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Thr Thr Leu Ala Ala
            340                 345                 350
Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Gln Trp Gln Lys Ile Gly Ser
        355                 360                 365
Ile Thr Ile Thr Asp Val Ser Leu Ala Phe Phe Lys Asp Leu Tyr Ser
    370                 375                 380
Ser Ala Ala Val Gly Thr Tyr Ala Ser Ser Ser Ser Ala Phe Thr Ser
385                 390                 395                 400
Ile Val Asn Ala Val Lys Thr Tyr Ala Asp Gly Tyr Met Ser Ile Val
                405                 410                 415
Gln Thr His Ala Met Thr Asn Gly Ser Leu Ser Glu Gln Phe Gly Lys
            420                 425                 430
Ser Asp Gly Phe Ser Leu Ser Ala Arg Asp Leu Thr Trp Ser Tyr Ala
       435                 440                 445
Ala Leu Leu Thr Ala Asn Leu Arg Arg Asn Ser Val Val Pro Pro Ser
    450                 455                 460
Trp Gly Glu Thr Thr Ala Thr Ser Val Pro Ser Val Cys Ser Ala Thr
465                 470                 475                 480
Ser Ala Thr Gly Thr Tyr Ser Thr Ala Thr Asn Thr Ala Trp Pro Ser
                485                 490                 495
Thr Leu Thr Ser Gly Thr Gly Ala Thr Thr Thr Thr Ser Lys Ala Thr
            500                 505                 510
Ser Thr Thr Thr Thr Ser Ser Ala Ser Thr Thr Thr Ala Gly Cys Val
        515                 520                 525
Val Pro Thr Ala Val Ala Val Thr Phe Asp Glu Ile Ala Thr Thr Thr
    530                 535                 540
Tyr Gly Glu Asn Val Tyr Val Val Gly Ser Ile Ser Gln Leu Gly Ser
545                 550                 555                 560
Trp Asp Thr Ser Lys Ala Val Ala Leu Ser Ala Ser Lys Tyr Thr Ser
                565                 570                 575
Ser Asn Asn Leu Trp Tyr Ala Thr Val Thr Leu Pro Ala Gly Thr Thr
            580                 585                 590
Phe Gln Tyr Lys Phe Ile Arg Val Ser Ser Ser Gly Thr Val Thr Trp
        595                 600                 605
Glu Ser Asp Pro Asn Arg Ser Tyr Thr Val Pro Ser Ala Cys Gly Thr
    610                 615                 620
Ser Thr Ala Val Val Asn Thr Thr Trp Arg
625                 630
<210>49
<211>1620
<212>DNA
<213>Aspergillus terreus
<400>49
atgtcctttt tcctgtcctg cctctatctg agcctgtgtg gctcagcact ggcagccaat     60
ctcacgtcat ggaaatccag atccatctac cagacgatga cggacaggtt cgcgcggacc    120
gacggctcga ccaccgccgc gtgcaacacc accgccggtt tatactgcgg agggacgtgg    180
cgcggcacga tcaatcatct cgactacatc caggggatgg gcttcgatgc ggtcatgatc    240
tcccccatca tcgagaatat cgatggccgc gtctcctacg gtgaagccta ccatgggtac    300
tggccgctgg acctggagtc tttgaacaca cgcttcggca cgaaacagga cctcctcgat    360
ttgagtaatg cgctccactc ccgcgggatg tacctgatga tggataccgt gattaataac    420
atggcatata tcacgcgtgg gcaggaccct gcgacggcaa ttgactactc ggtgttcacg    480
ccgttcaaca acgcggatta ttttcatccc tactgcaaga tcacggattg gaacaacctc    540
accgacgcta gtctgtgtca gacgggtgat ctggaggtcg cattgcccga cctgttcaca    600
gagcatacgg acgtgcagga tcgtctcata agctgggcca aggaaatgat ccaaacatat   660
tccatcgacg gacttcgcat tgacgccgcc aaacacgtcg atcctgagtt tctcgccaga   720
ttcgtgaacg aagtcgatgt attcaccacc ggagaggtcc tccagcgcga agtcgacatc   780
atctgcgact accacaacaa atacatcacc agcatgccca attacccgat ctacttctcc   840
atgctggatg ctttcacaga gggcaacacg tcgtcattga tgagccaagt ggaagcaatg   900
aagggtcctt gtcacgacgt taccgccctt gtgtcttttt ccgagaacca tgaccagccg   960
cggattccca gcatgaacaa agacatcgcg ctcgccaaaa atgttctcac tttcaccatt  1020
ctttttgatg gcattcccat ggtctatcaa ggtcaagagc aacacttgga cggatctggg  1080
acaccgaaaa accgtgaagc cctgtggttg tccaagtatg atacccaagc cgaattatac  1140
caactgctcg ccaaactcaa cgcgatccgc aaacatgcca cctccctggg cagcgactac  1200
ctctatgccc aaaccagacc tatctaccgg ggcggaagtg agctcgcatt ctacaaaggc  1260
attgagggcc gacaggtgat tacggttcta tcatcgcaag gcgctcaggg aaatccatac  1320
gatctgtatc tgcccgtgtc atataatccg ggaacagcgg tgatggaggt cctcaactgt  1380
gtgaactcca cggtgggtga cgacggtcag ctcaaggtgc ccatggagaa gggagagccg  1440
cgggtgttct tcccgattga gctgatgggc ggaagcggac tgtgtggata ttccaaggat  1500
aatgttacgg tttctcagtt gaaaacaggg cacgactcga catcccgggg aagcaagatg  1560
acgggcagtg ctgcacttct tatgatgctg tcgttgggag cgagcctggt gttatggtga  1620
<210>50
<211>539
<212>PRT
<213>Aspergillus terreus
<220>
<221>信号(SIGNAL)
<222>(1)...(18)
<220>
<221>结构域(DOMAIN)
<222>(31)...(390)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(20)...(23)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(49)...(52)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(181)...(184)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(293)...(296)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(469)...(472)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(508)...(511)
<223>N-糖基化位点.Prosite id=Ps00001
<400>50
Met Ser Phe Phe Leu Ser Cys Leu Tyr Leu Ser Leu Cys Gly Ser Ala
1               5                   10                  15
Leu Ala Ala Asn Leu Thr Ser Trp Lys Ser Arg Ser Ile Tyr Gln Thr
            20                  25                  30
Met Thr Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Ala Cys
        35                  40                  45
Asn Thr Thr Ala Gly Leu Tyr Cys Gly Gly Thr Trp Arg Gly Thr Ile
    50                  55                  60
Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Asp Ala Val Met Ile
65                  70                  75                  80
Ser Pro Ile Ile Glu Asn Ile Asp Gly Arg Val Ser Tyr Gly Glu Ala
                85                  90                  95
Tyr His Gly Tyr Trp Pro Leu Asp Leu Glu Ser Leu Asn Thr Arg Phe
             100                 105                 110
Gly Thr Lys Gln Asp Leu Leu Asp Leu Ser Asn Ala Leu His Ser Arg
        115                 120                 125
Gly Met Tyr Leu Met Met Asp Thr Val Ile Asn Asn Met Ala Tyr Ile
    130                 135                 140
Thr Arg Gly Gln Asp Pro Ala Thr Ala Ile Asp Tyr Ser Val Phe Thr
145                 150                 155                 160
Pro Phe Asn Asn Ala Asp Tyr Phe His Pro Tyr Cys Lys Ile Thr Asp
                165                 170                 175
Trp Asn Asn Leu Thr Asp Ala Ser Leu Cys Gln Thr Gly Asp Leu Glu
            180                 185                 190
Val Ala Leu Pro Asp Leu Phe Thr Glu His Thr Asp Val Gln Asp Arg
        195                 200                 205
Leu Ile Ser Trp Ala Lys Glu Met Ile Gln Thr Tyr Ser Ile Asp Gly
    210                 215                 220
Leu Arg Ile Asp Ala Ala Lys His Val Asp Pro Glu Phe Leu Ala Arg
225                 230                 235                 240
Phe Val Asn Glu Val Asp Val Phe Thr Thr Gly Glu Val Leu Gln Arg
                245                 250                 255
Glu Val Asp Ile Ile Cys Asp Tyr His Asn Lys Tyr Ile Thr Ser Met
            260                 265                 270
Pro Asn Tyr Pro Ile Tyr Phe Ser Met Leu Asp Ala Phe Thr Glu Gly
        275                 280                 285
Asn Thr Ser Ser Leu Met Ser Gln Val Glu Ala Met Lys Gly Pro Cys
    290                 295                 300
His Asp Val Thr Ala Leu Val Ser Phe Ser Glu Asn His Asp Gln Pro
305                 310                 315                 320
Arg Ile Pro Ser Met Asn Lys Asp Ile Ala Leu Ala Lys Asn Val Leu
                325                 330                 335
Thr Phe Thr Ile Leu Phe Asp Gly Ile Pro Met Val Tyr Gln Gly Gln
              340                 345                 350
Glu Gln His Leu Asp Gly Ser Gly Thr Pro Lys Asn Arg Glu Ala Leu
        355                 360                 365
Trp Leu Ser Lys Tyr Asp Thr Gln Ala Glu Leu Tyr Gln Leu Leu Ala
    370                 375                 380
Lys Leu Asn Ala Ile Arg Lys His Ala Thr Ser Leu Gly Ser Asp Tyr
385                 390                 395                 400
Leu Tyr Ala Gln Thr Arg Pro Ile Tyr Arg Gly Gly Ser Glu Leu Ala
                405                 410                 415
Phe Tyr Lys Gly Ile Glu Gly Arg Gln Val Ile Thr Val Leu Ser Ser
            420                 425                 430
Gln Gly Ala Gln Gly Asn Pro Tyr Asp Leu Tyr Leu Pro Val Ser Tyr
        435                 440                 445
Asn Pro Gly Thr Ala Val Met Glu Val Leu Asn Cys Val Asn Ser Thr
    450                 455                 460
Val Gly Asp Asp Gly Gln Leu Lys Val Pro Met Glu Lys Gly Glu Pro
465                 470                 475                 480
Arg Val Phe Phe Pro Ile Glu Leu Met Gly Gly Ser Gly Leu Cys Gly
                485                 490                 495
Tyr Ser Lys Asp Asn Val Thr Val Ser Gln Leu Lys Thr Gly His Asp
            500                 505                 510
Ser Thr Ser Arg Gly Ser Lys Met Thr Gly Ser Ala Ala Leu Leu Met
        515                 520                 525
Met Leu Ser Leu Gly Ala Ser Leu Val Leu Trp
    530                 535
<210>51
<211>1824
<212>DNA
<213>Aspergillus terreus
<400>51
atgaagtgga ccttctcgct cctcctctta ctgtccgtgt tcggtcaggc tactcatgcc     60
ctgaccccag cagaatggcg cagccagtca atctacttcc tgttgaccga tcgctttggt    120
cgaacagaca attccacaac tgctgcctgt gacaccaccg acagagtata ctgcggtggt    180
agctggcagg gaatcatcaa ccatctcgat tacatccaag ggatgggatt cactgccatc    240
tggatcaccc cggtcactgg acagttctac gaaaacacgg gcgacggcac ctcctaccat   300
ggatactggc agcaggacat ctacgacctc aactacaact acggaacggc ccaagacctc   360
aagaacctag ccagtgcttt gcacgagcgc ggcatgtatt tgatggttga tgtggttgcc   420
aatcacatgg gctatgacgg agcgggaaac accgtggact acagtgtttt caaccccttc   480
tcctcctcca gctactttca cccatactgc ctcatctcca attacgacaa ccagaccaat   540
gttgaagact gctggctggg tgataccacc gtttcgctgc cagatctcga cacgacaagc   600
acagccgtgc gggacatctg gtacgactgg gtggcagact tggtcgccaa ctattccatc   660
gacggtctgc gtgtcgacac tgtaaaacac gtcgaaaaag acttttggcc cgactacaac   720
agcgcagcag gcgtctactg tgtcggcgag gtcttttcag gcgatcctgc atacacatgc   780
ccgtaccaga actacatgga cggcgtgctc aactatccaa tctactacca gcttctctat   840
gcgtttgagt cgtccagcgg cagcatcagc gatctctata acatgatcag ctccgttgcc   900
tccagctgca aggatcccac actcctgggt aatttcatcg agaaccacga taacccccgc   960
tttgcttcct acacgagcga ctactcgcag gctaagaacg tgatcacctt catcttcctg  1020
agcgacggta ttcccatcgt ctacgccgga caggaacagc actacagcgg aggcagcgac  1080
ccagctaacc gcgaggccac ctggctgtct ggatactcca cgagcgccac gctgtacacc  1140
tggatcgcct ctacaaacca gatccgcagc ctggcgatct ccaaggacgc gggatacgtg  1200
caggccaaga acaacccctt ctactccgat tccaacacca tcgccatgcg caagggcacg  1260
acagccggcg cgcaagtcat caccgtcctc agcaacaagg gcgcctccgg cagctcctac  1320
accctctctt tgagcggcac aggctactcc gccggcgcga ccctggtcga gacgtacacc  1380
tgcactacgg tgactgtaga ctcgagcggc aacctgcccg tcccaatgac atccggcttg  1440
ccgcgagtgt ttgtcccgtc gtcctgggtg aatgggagcg cgctttgcaa cacagaatgc  1500
acggccgcca cgtccctccc ggttctcttc gaggaactgg ttacgacgac ctacggggag  1560
aacatttatc tgagcggctc gatcagccag ctgggcagtt ggaatacggc ctcggctgtt  1620
gctctgtcgg cgagtcaata tacctcgtcc aacccgaaat ggtatgtgag tgtgacgttg  1680
cctgtgggca cgtcgttcca gtacaagttt atcaagaagg ggtcggacgg gagtgttgtc  1740
tgggagagtg atccgaaccg gtcgtatacc gttccggctg ggtgcgaggg cgcgacggtg  1800
acagttgctg atacttggag gtga                                         1824
<210>52
<211>607
<212>PRT
<213>Aspergillus terreus
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(33)...(389)
<223>α淀粉酶,催化结构域
<220>
<221>结构域(DOMAIN)
<222>(505)...(602)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(44)...(47)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(179)...(182)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(220)...(223)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(498)...(501)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(595)...(598)
<223>N-糖基化位点.Prosite id=PS00001
<400>52
Met Lys Trp Thr Phe Ser Leu Leu Leu Leu Leu Ser Val Phe Gly Gln
1               5                   10                  15
Ala Thr His Ala Leu Thr Pro Ala Glu Trp Arg Ser Gln Ser Ile Tyr
            20                  25                  30
Phe Leu Leu Thr Asp Arg Phe Gly Arg Thr Asp Asn Ser Thr Thr Ala
        35                  40                  45
Ala Cys Asp Thr Thr Asp Arg Val Tyr Cys Gly Gly Ser Trp Gln Gly
    50                  55                  60
Ile Ile Asn His Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile
65                  70                  75                  80
Trp Ile Thr Pro Val Thr Gly Gln Phe Tyr Glu Asn Thr Gly Asp Gly
                85                  90                  95
Thr Ser Tyr His Gly Tyr Trp Gln Gln Asp Ile Tyr Asp Leu Asn Tyr
            100                 105                 110
Asn Tyr Gly Thr Ala Gln Asp Leu Lys Asn Leu Ala Ser Ala Leu His
        115                 120                 125
Glu Arg Gly Met Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly
    130                 135                 140
Tyr Asp Gly Ala Gly Asn Thr Val Asp Tyr Ser Val Phe Asn Pro Phe
145                 150                 155                 160
Ser Ser Ser Ser Tyr Phe His Pro Tyr Cys Leu Ile Ser Asn Tyr Asp
                165                 170                 175
Asn Gln Thr Asn Val Glu Asp Cys Trp Leu Gly Asp Thr Thr Val Ser
            180                 185                 190
Leu Pro Asp Leu Asp Thr Thr Ser Thr Ala Val Arg Asp Ile Trp Tyr
        195                 200                 205
Asp Trp Val Ala Asp Leu Val Ala Asn Tyr Ser Ile Asp Gly Leu Arg
    210                 215                 220
Val Asp Thr Val Lys His Val Glu Lys Asp Phe Trp Pro Asp Tyr Asn
225                 230                 235                 240
Ser Ala Ala Gly Val Tyr Cys Val Gly Glu Val Phe Ser Gly Asp Pro
                245                 250                 255
Ala Tyr Thr Cys Pro Tyr Gln Asn Tyr Met Asp Gly Val Leu Asn Tyr
            260                 265                 270
Pro Ile Tyr Tyr Gln Leu Leu Tyr Ala Phe Glu Ser Ser Ser Gly Ser
        275                 280                 285
Ile Ser Asp Leu Tyr Asn Met Ile Ser Ser Val Ala Ser Ser Cys Lys
    290                 295                 300
Asp Pro Thr Leu Leu Gly Asn Phe Ile Glu Asn His Asp Asn Pro Arg
305                 310                 315                 320
Phe Ala Ser Tyr Thr Ser Asp Tyr Ser Gln Ala Lys Asn Val Ile Thr
                325                 330                 335
Phe Ile Phe Leu Ser Asp Gly Ile Pro Ile Val Tyr Ala Gly Gln Glu
            340                 345                 350
Gln His Tyr Ser Gly Gly Ser Asp Pro Ala Asn Arg Glu Ala Thr Trp
        355                 360                 365
Leu Ser Gly Tyr Ser Thr Ser Ala Thr Leu Tyr Thr Trp Ile Ala Ser
    370                 375                 380
Thr Asn Gln Ile Arg Ser Leu Ala Ile Ser Lys Asp Ala Gly Tyr Val
385                 390                 395                 400
Gln Ala Lys Asn Asn Pro Phe Tyr Ser Asp Ser Asn Thr Ile Ala Met
                405                 410                 415
Arg Lys Gly Thr Thr Ala Gly Ala Gln Val Ile Thr Val Leu Ser Asn
            420                 425                 430
Lys Gly Ala Ser Gly Ser Ser Tyr Thr Leu Ser Leu Ser Gly Thr Gly
        435                 440                 445
Tyr Ser Ala Gly Ala Thr Leu Val Glu Thr Tyr Thr Cys Thr Thr Val
    450                 455                 460
Thr Val Asp Ser Ser Gly Asn Leu Pro Val Pro Met Thr Ser Gly Leu
465                 470                 475                 480
Pro Arg Val Phe Val Pro Ser Ser Trp Val Asn Gly Ser Ala Leu Cys
                485                 490                 495
Asn Thr Glu Cys Thr Ala Ala Thr Ser Leu Pro Val Leu Phe Glu Glu
            500                 505                 510
Leu Val Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Ser Gly Ser Ile
        515                 520                 525
Ser Gln Leu Gly Ser Trp Asn Thr Ala Ser Ala Val Ala Leu Ser Ala
    530                 535                 540
Ser Gln Tyr Thr Ser Ser Asn Pro Lys Trp Tyr Val Ser Val Thr Leu
545                 550                 555                 560
Pro Val Gly Thr Ser Phe Gln Tyr Lys Phe Ile Lys Lys Gly Ser Asp
                565                 570                 575
Gly Ser Val Val Trp Glu Ser Asp Pro Asn Arg Ser Tyr Thr Val Pro
            580                 585                 590
Ala Gly Cys Glu Gly Ala Thr Val Thr Val Ala Asp Thr Trp Arg
        595                 600                 605
<210>53
<211>1389
<212>DNA
<213>Aspergillus terreus
<400>53
atgaagctat cccgcgccct gacagtcttc cttctccacc ttacatccac tgcattggca     60
gcggatgtca atgcgtggaa gtctcgcaat atttactttg ctttgacgga tcgcattgcc    120
cgcagtagcg atgatactgg tggaagtgct tgcggtaacc tgggagacta ctgcggcgga    180
accttccaag gcttgcagtc caagcttgac tacatcaagg ggatgggctt tgatgctatc    240
tggatcactc ctgtggtagc taatgctccg ggtggttatc atggttattg ggcacaggat    300
ctctatagta tcaactccaa ctatggcacc gctgatgacc tcaaaagcct ggtcaatgct    360
gctcatgaga agggaatgta tgttatggcg gacgtcgtgg ccaaccacat gggaagtccc    420
atcagcgata acaagcccga gccaatgaac caggagagct cttaccattc agcctgcaca    480
attgactact cagaccagag tagcattgaa gattgccgta tcgcatcaga cctgcccgat    540
gtcaacacag aaagttccga aattcggacc ctcttccagg agtggatcag ctggctggtg    600
aaggaatacc agtttgacgg gctgcgtatc gacacggtca agcatgttga aaaagacttc    660
tggccgggct tctgctctgc cgccggcgtc tacaccatcg gcgaagtctg ggacggcgac    720
ccaaactacc ttgctggata cgcaaacagt atggacgctg tgctcaacta cgcaatctac    780
tatcccatga accgattcta ccagcaacag gggtcctcct ccgacatcgt cagcatgcac    840
gatcaaatca gttccctgtt ccccaaccca accgccctcg gcacgttcct ggacaaccac    900
gacaacgccc gttggctgag ccagaagaac gacgcctctc tgctgaaaaa cgccctcgcc    960
tatgtcattc tcgcccgcgg catccccatc gtgtactacg gcacggagca gggctacgcc   1020
ggcggcaatg accccgcaaa ccgcgaggac ctatggcgca gcaacttcga caccgacgcc   1080
gacttgtacc aggccatatc ccggctctcg gcggcgaggg catcatttgg cgggctcgct   1140
gatgacgacc atgtccatct gtatgtcgct gatacggcgt acgcgtggag cagggccggt   1200
ggggacctga ttgtcctcac gtctaatagt ggatctggct ctgagtctaa gtactgcttc   1260
gattcaaaga agcctggtgg atcatggaac aacacctttg gaacgggaac atatactgct   1320
gatggtgacg ggcaactctg tgtcaccacc tcaaatggtg aacccgtggt gctggttgca   1380
gatgtgtag                                                1389
<210>54
<211>462
<212>PRT
<213>Aspergillus terreus
<220>
<221>信号(SIGNAL)
<222>(1)...(20)
<220>
<221>结构域(DOMAIN)
<222>(33)...(373)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(436)...(439)
<223>N-糖基化位点.Prosite id=PS00001
<400>54
Met Lys Leu Ser Arg Ala Leu Thr Val Phe Leu Leu His Leu Thr Ser
1               5                   10                  15
Thr Ala Leu Ala Ala Asp Val Asn Ala Trp Lys Ser Arg Asn Ile Tyr
            20                  25                  30
Phe Ala Leu Thr Asp Arg Ile Ala Arg Ser Ser Asp Asp Thr Gly Gly
        35                  40                  45
Ser Ala Cys Gly Asn Leu Gly Asp Tyr Cys Gly Gly Thr Phe Gln Gly
    50                  55                  60
Leu Gln Ser Lys Leu Asp Tyr Ile Lys Gly Met Gly Phe Asp Ala Ile
65                  70                  75                  80
Trp Ile Thr Pro Val Val Ala Asn Ala Pro Gly Gly Tyr His Gly Tyr
                85                  90                  95
Trp Ala Gln Asp Leu Tyr Ser Ile Asn Ser Asn Tyr Gly Thr Ala Asp
            100                 105                 110
Asp Leu Lys Ser Leu Val Asn Ala Ala His Glu Lys Gly Met Tyr Val
        115                 120                 125
Met Ala Asp Val Val Ala Asn His Met Gly Ser Pro Ile Ser Asp Asn
    130                 135                 140
Lys Pro Glu Pro Met Asn Gln Glu Ser Ser Tyr His Ser Ala Cys Thr
145                 150                 155                 160
Ile Asp Tyr Ser Asp Gln Ser Ser Ile Glu Asp Cys Arg Ile Ala Ser
                165                 170                 175
Asp Leu Pro Asp Val Asn Thr Glu Ser Ser Glu Ile Arg Thr Leu Phe
            180                 185                 190
Gln Glu Trp Ile Ser Trp Leu Val Lys Glu Tyr Gln Phe Asp Gly Leu
        195                 200                 205
Arg Ile Asp Thr Val Lys His Val Glu Lys Asp Phe Trp Pro Gly Phe
    210                 215                 220
Cys Ser Ala Ala Gly Val Tyr Thr Ile Gly Glu Val Trp Asp Gly Asp
225                 230                 235                 240
Pro Asn Tyr Leu Ala Gly Tyr Ala Asn Ser Met Asp Ala Val Leu Asn
                245                 250                 255
Tyr Ala Ile Tyr Tyr Pro Met Asn Arg Phe Tyr Gln Gln Gln Gly Ser
            260                 265                 270
Ser Ser Asp Ile Val Ser Met His Asp Gln Ile Ser Ser Leu Phe Pro
        275                 280                 285
Asn Pro Thr Ala Leu Gly Thr Phe Leu Asp Asn His Asp Asn Ala Arg
    290                 295                 300
Trp Leu Ser Gln Lys Asn Asp Ala Ser Leu Leu Lys Asn Ala Leu Ala
305                 310                 315                 320
Tyr Val Ile Leu Ala Arg Gly Ile Pro Ile Val Tyr Tyr Gly Thr Glu
                325                 330                 335
Gln Gly Tyr Ala Gly Gly Asn Asp Pro Ala Asn Arg Glu Asp Leu Trp
            340                 345                 350
Arg Ser Asn Phe Asp Thr Asp Ala Asp Leu Tyr Gln Ala Ile Ser Arg
        355                 360                 365
Leu Ser Ala Ala Arg Ala Ser Phe Gly Gly Leu Ala Asp Asp Asp His
    370                 375                 380
Val His Leu Tyr Val Ala Asp Thr Ala Tyr Ala Trp Ser Arg Ala Gly
385                 390                 395                 400
Gly Asp Leu Ile Val Leu Thr Ser Asn Ser Gly Ser Gly Ser Glu Ser
                405                 410                 415
Lys Tyr Cys Phe Asp Ser Lys Lys Pro Gly Gly Ser Trp Asn Asn Thr
            420                 425                 430
Phe Gly Thr Gly Thr Tyr Thr Ala Asp Gly Asp Gly Gln Leu Cys Val
        435                 440                 445
Thr Thr Ser Asn Gly Glu Pro Val Val Leu Val Ala Asp Val
    450                 455                 460
<210>55
<211>1269
<212>DNA
<213>未知
<220>
<223>获自环境的样品
<400>55
atgttgaagc agttcacgaa gcgcctgatc accctgacga gcctgctggc gctcgtcctc   60
gtcgcaccgt tggccagcgc gggcccgctg gatggcaaca gcagcgacgt catgttgcag  120
ggcttccatt ggtactcgta ccagtcgttt ccgtggtggg gcgtcatcaa gaacaacgcg  180
gcgagcatca aggccgacgg cttcaccatg gtgtggctgc cgccgcccag cgacgcggcc    240
tccaacgagg gctacctgcc gcgccggctc gagctgctgg acagcaagta tggcacccgg    300
acggacctgg tcaacgccct gtccgcgctg aatgccaatg gtgtgaagcc cattgcggac    360
atcgtcatca accaccgcgt gggcaccacg ggctgggcgg acttcacgct gcctccgtgg    420
ggctcgaacg cggtgtgccg cggcgacgag tggagcgggg ccacgggcaa cgcggatacg    480
ggcgatggct tcaacgccgg gcgcgacatc gatcacacgc agaccttcgt gcaggacggc    540
atcgtcacct ggatgaacaa ctcgctgaag agcgtcgggt tcgcgggttg gcggtatgac    600
tacgtgaagg gctacagcgg ctcctacgtc ggctcgtaca acacccgcac gacgccgtac    660
ttctccgtgg gcgagctgtg gacggacctg gacctgaaca accccaaccc ccaccgccag    720
ctgatcatga attggatcga cgcgacgggt ggccggtccg cggcgttcga cttcacgacc    780
aagggcctgc tgcagcaggc ggtgcagtac aacgagttct ggcggctgaa ggatgcggcg    840
ggcgcgccag cgggtgccat tggttggtgg gcagcgaagt ccgtgacctt catcgacaat    900
cacgacacgg gcccgagcta tccgagcggc ggccagaacc actggccgtt ccctggtgac    960
aagatcctcc aggggtacgc ctacatcctg actcactctg gcatcccctg cgtgtactgg   1020
gtgcactaca aggactgggg ccaggcgaac acggacgcca tcaagaagct gatcagcatc   1080
cgcaagtcca agggcatcac cagcacctcc tcggtgagca tccaggccgc ggacagctcg   1140
aagtacgccg ccatcatcac cggcaacaac ggcaaggtgg ccgtgaagat cggcttcggc   1200
gcctggtctc cgccgggcac ctggacgctg gccacctccg gcaacaacta cgccgtctgg   1260
acgcagtaa                                                           1269
<210>56
<211>422
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(27)
<220>
<221>结构域(DOMAIN)
<222>(36)...(361)
<223>α淀粉酶,催化结构域
<220>
<221>结构域(DOMAIN)
<222>(362)...(422)
<223>α淀粉酶C末端β折叠结构域
<220>
<221>SITE
<222>(33)...(36)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(188)...(191)
<223>N-糖基化位点.Prosite id=PS00001
<400>56
Met Leu Lys Gln Phe Thr Lys Arg Leu Ile Thr Leu Thr Ser Leu Leu
1               5                   10                  15
Ala Leu Val Leu Val Ala Pro Leu Ala Ser Ala Gly Pro Leu Asp Gly
            20                  25                  30
Asn Ser Ser Asp Val Met Leu Gln Gly Phe His Trp Tyr Ser Tyr Gln
        35                  40                  45
Ser Phe Pro Trp Trp Gly Val Ile Lys Asn Asn Ala Ala Ser Ile Lys
    50                  55                  60
Ala Asp Gly Phe Thr Met Val Trp Leu Pro Pro Pro Ser Asp Ala Ala
65                  70                  75                  80
Ser Asn Glu Gly Tyr Leu Pro Arg Arg Leu Glu Leu Leu Asp Ser Lys
                85                  90                  95
Tyr Gly Thr Arg Thr Asp Leu Val Asn Ala Leu Ser Ala Leu Asn Ala
            100                 105                 110
Asn Gly Val Lys Pro Ile Ala Asp Ile Val Ile Asn His Arg Val Gly
        115                 120                 125
Thr Thr Gly Trp Ala Asp Phe Thr Leu Pro Pro Trp Gly Ser Asn Ala
    130                 135                 140
Val Cys Arg Gly Asp Glu Trp Ser Gly Ala Thr Gly Asn Ala Asp Thr
145                 150                 155                 160
Gly Asp Gly Phe Asn Ala Gly Arg Asp Ile Asp His Thr Gln Thr Phe
                165                 170                 175
Val Gln Asp Gly Ile Val Thr Trp Met Asn Asn Ser Leu Lys Ser Val
            180                 185                 190
Gly Phe Ala Gly Trp Arg Tyr Asp Tyr Val Lys Gly Tyr Ser Gly Ser
        195                 200                 205
Tyr Val Gly Ser Tyr Asn Thr Arg Thr Thr Pro Tyr Phe Ser Val Gly
    210                 215                 220
Glu Leu Trp Thr Asp Leu Asp Leu Asn Asn Pro Asn Pro His Arg Gln
225                 230                 235                 240
Leu Ile Met Asn Trp Ile Asp Ala Thr Gly Gly Arg Ser Ala Ala Phe
                245                 250                 255
Asp Phe Thr Thr Lys Gly Leu Leu Gln Gln Ala Val Gln Tyr Asn Glu
            260                 265                 270
Phe Trp Arg Leu Lys Asp Ala Ala Gly Ala Pro Ala Gly Ala Ile Gly
        275                 280                 285
Trp Trp Ala Ala Lys Ser Val Thr Phe Ile Asp Asn His Asp Thr Gly
    290                 295                 300
Pro Ser Tyr Pro Ser Gly Gly Gln Asn His Trp Pro Phe Pro Gly Asp
305                 310                 315                 320
Lys Ile Leu Gln Gly Tyr Ala Tyr Ile Leu Thr His Ser Gly Ile Pro
                325                 330                 335
Cys Val Tyr Trp Val His Tyr Lys Asp Trp Gly Gln Ala Asn Thr Asp
            340                 345                 350
Ala Ile Lys Lys Leu Ile Ser Ile Arg Lys Ser Lys Gly Ile Thr Ser
        355                 360                 365
Thr Ser Ser Val Ser Ile Gln Ala Ala Asp Ser Ser Lys Tyr Ala Ala
    370                 375                 380
Ile Ile Thr Gly Asn Asn Gly Lys Val Ala Val Lys Ile Gly Phe Gly
385                 390                 395                 400
Ala Trp Ser Pro Pro Gly Thr Trp Thr Leu Ala Thr Ser Gly Asn Asn
                405                 410                 415
Tyr Ala Val Trp Thr Gln
            420
<210>57
<211>1581
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>57
atgccaaact ggttaaaaga cgctgttttc tacgagattt accctcagtc cttcaaggac      60
accaactgcg acggtatcgg cgacatcaat ggaatcattg agaagctgga ttatgtgaag     120
gagctgggat gcaatgccct ttggatcaat ccttgtttcg attcaccatt taaggatgcc     180
ggctacgacg tcagagacta caagaaggta gcacccagat atggcacaaa tgctgacctt     240
tacagattat tcggcgaagc ccacaacaga ggcattcacg tactccttga cctggttccg     300
ggccacactt ccgaggaaca tgcgtggttc caggagagca aaaaggctga aaagaatgaa     360
tacacagacc gctatgtatg gaccaactgc tggatccatg gcattgctgg tcatccctat     420
attggcggcg aggctgacag agacggctgc tacatgctga acttctttaa gtgccagcct     480
gcccttaact acggattcct taaccgcacc gatgattggc agtctgcacc tgacgcacct     540
gagtgcatcg caacaagaga ggccctcaag gacatcatgc gtttctggct tgaccacggc     600
tgcgatggtt tccgtgttga tatggcagat tctctggtaa aagaggatga tgagaacaag     660
tccgctaccg gcgcaatctg gagaaatatt agagaaatgc ttgataagga ctatcctgaa     720
gctgccattg tttcagagtg gagcaatcct cagcaggccc ttaagagcgg cttccacgct     780
gacttctatc ttgatcacca cggaaacggc tataataccc ttatccgcga caatgagacc     840
ccgggcggcg accacagttt ccttaagaag gatggaaacg gcgatatcat gcgtttcctc     900
ctggattacc tgcccaagta tgacagcacc aagaatgatg gctacataag ctttatcacc     960
tgcaatcacg acactccaag agcccgcaga acactgggct acgatgagct taagattgca    1020
tgggctcttt tcctaacact tcccggagtt ccgttcatct actacggtga tgagattgga    1080
atgagatatc tggacattcc tacgaaggaa ggcggataca caagaaccgg caccagaact    1140
ccaatgcagt gggacaactc caagaaccac ggtttctcag atgcaggtgc tgatgtcctc    1200
tatcttccac aggatccgtc tggcgatgct cctacagtcg aagatcagga aaaagatcct  1260
tcttcactcc ttaacgtgac aaaagagctg acagctcttc gccataaata cactgacctg  1320
caggccgatg gctcttttga cgtcatctat gcagaaaaag agcagttccc atttatctac  1380
aaacgcggaa atctgctcct tgcgatcaac ccatcagaaa gcaagtccag tgctgccctt  1440
ccggatgagg catatataaa gaaggatgat acaaaagccg gcaagcttac acctgtatac  1500
tcaatcggtg agttcaagca ggaggatcac agcctcacgc ttcagggcca gtccttcgtt  1560
gtcttctcac tcgaatcata a                                            1581
<210>58
<211>526
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域(DOMAIN)
<222>(12)...(434)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(170)...(173)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(222)...(225)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(431)...(434)
<223>N-糖基化位点.Prosite id=PS00001
<400>58
Met Pro Asn Trp Leu Lys Asp Ala Val Phe Tyr Glu Ile Tyr Pro Gln
1               5                   10                  15
Ser Phe Lys Asp Thr Asn Cys Asp Gly Ile Gly Asp Ile Asn Gly Ile
            20                  25                  30
Ile Glu Lys Leu Asp Tyr Val Lys Glu Leu Gly Cys Asn Ala Leu Trp
        35                  40                  45
Ile Asn Pro Cys Phe Asp Ser Pro Phe Lys Asp Ala Gly Tyr Asp Val
    50                  55                  60
Arg Asp Tyr Lys Lys Val Ala Pro Arg Tyr Gly Thr Asn Ala Asp Leu
65                  70                  75                  80
Tyr Arg Leu Phe Gly Glu Ala His Asn Arg Gly Ile His Val Leu Leu
                85                  90                  95
Asp Leu Val Pro Gly His Thr Ser Glu Glu His Ala Trp Phe Gln Glu
            100                 105                 110
Ser Lys Lys Ala Glu Lys Asn Glu Tyr Thr Asp Arg Tyr Val Trp Thr
        115                 120                 125
Asn Cys Trp Ile His Gly Ile Ala Gly His Pro Tyr Ile Gly Gly Glu
    130                 135                 140
Ala Asp Arg Asp Gly Cys Tyr Met Leu Asn Phe Phe Lys Cys Gln Pro
145                 150                 155                 160
Ala Leu Asn Tyr Gly Phe Leu Asn Arg Thr Asp Asp Trp Gln Ser Ala
                165                 170                 175
Pro Asp Ala Pro Glu Cys Ile Ala Thr Arg Glu Ala Leu Lys Asp Ile
            180                 185                 190
Met Arg Phe Trp Leu Asp His Gly Cys Asp Gly Phe Arg Val Asp Met
        195                 200                 205
Ala Asp Ser Leu Val Lys Glu Asp Asp Glu Asn Lys Ser Ala Thr Gly
    210                 215                 220
Ala Ile Trp Arg Asn Ile Arg Glu Met Leu Asp Lys Asp Tyr Pro Glu
225                 230                 235                 240
Ala Ala Ile Val Ser Glu Trp Ser Asn Pro Gln Gln Ala Leu Lys Ser
                245                 250                 255
Gly Phe His Ala Asp Phe Tyr Leu Asp His His Gly Asn Gly Tyr Asn
            260                 265                 270
Thr Leu Ile Arg Asp Asn Glu Thr Pro Gly Gly Asp His Ser Phe Leu
        275                 280                 285
Lys Lys Asp Gly Asn Gly Asp Ile Met Arg Phe Leu Leu Asp Tyr Leu
    290                 295                 300
Pro Lys Tyr Asp Ser Thr Lys Asn Asp Gly Tyr Ile Ser Phe Ile Thr
305                 310                 315                 320
Cys Asn His Asp Thr Pro Arg Ala Arg Arg Thr Leu Gly Tyr Asp Glu
                325                 330                 335
Leu Lys Ile Ala Trp Ala Leu Phe Leu Thr Leu Pro Gly Val Pro Phe
            340                 345                 350
Ile Tyr Tyr Gly Asp Glu Ile Gly Met Arg Tyr Leu Asp Ile Pro Thr
        355                 360                 365
Lys Glu Gly Gly Tyr Thr Arg Thr Gly Thr Arg Thr Pro Met Gln Trp
    370                 375                 380
Asp Asn Ser Lys Asn His Gly Phe Ser Asp Ala Gly Ala Asp Val Leu
385                 390                 395                 400
Tyr Leu Pro Gln Asp Pro Ser Gly Asp Ala Pro Thr Val Glu Asp Gln
                405                 410                 415
Glu Lys Asp Pro Ser Ser Leu Leu Asn Val Thr Lys Glu Leu Thr Ala
            420                 425                 430
Leu Arg His Lys Tyr Thr Asp Leu Gln Ala Asp Gly Ser Phe Asp Val
        435                 440                 445
Ile Tyr Ala Glu Lys Glu Gln Phe Pro Phe Ile Tyr Lys Arg Gly Asn
    450                 455                 460
Leu Leu Leu Ala Ile Asn Pro Ser Glu Ser Lys Ser Ser Ala Ala Leu
465                 470                 475                 480
Pro Asp Glu Ala Tyr Ile Lys Lys Asp Asp Thr Lys Ala Gly Lys Leu
                485                 490                 495
Thr Pro Val Tyr Ser Ile Gly Glu Phe Lys Gln Glu Asp His Ser Leu
            500                 505                 510
Thr Leu Gln Gly Gln Ser Phe Val Val Phe Ser Leu Glu Ser
        515                 520                 525
<210>59
<211>1572
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>59
atgcccggat ggttgaagga tgcagtattt tacgaaatct acccccagtc ctttgccgat     60
tcaaacggcg acgggatcgg tgatctgcag gggatcatcg gaaagcttga ctatgtgaag    120
gagcttggat gcaacgcgct ctggatcaat ccctgttacg attcgccctt taaggatgcc    180
ggctacgacg tccgcgacta caaaaaggtg gccgaaaggt acggcacaaa cgacgatctg    240
aaggagctct tttcaaaggc acatgagaag ggcatccacg tccttctgga cctggtcccc    300
ggccacacct ccgaggaaca cgcctggttt aaggagagtt caaaagccga aaagaacgag    360
ttttccggcc gctatatctg gaccggacac tggctcgagg gcgtaccagg tcatccctgg    420
atcgcgggag aatgcgaaag accggcctgc tatatgctca acttcttcaa atgccagccg    480
gccctgaatt acggtttttt acatcccgaa aagccctggc agtcctccac ggattcccct    540
gaggcgagag cgacacatga agccatgaag gatgtcatgc gcttctggct ggacgccggc    600
tgcgacggct tccgcgtgga catggcagac agccttgtaa aggatgatga cgagaagaaa    660
tcctgtacct gcgcgctgtg gcgcgaggtg aggcagatgc tcgatgacga ttatccggag    720
gccgccatca tctccgagtg gtccaatccc gaattggcca ttaattccgc acattttcac    780
atggacttct gtctcgacca cgcgagcaac ggttatcata cacttctcag ggattactgg    840
ggtgacgacg gcgacaacag ctttttcaaa gccggcggtc acggcgatgt gatgcgtttc    900
cttgatgact atctgcccag atatgaggcg acaaaggata acggctttat aagccttata    960
tcctgcaatc acgacaccag aaggcctgct tattctctct cagagcgcga gatcaaggtg   1020
gcctatgcct ttatctatac gatgcccggc gtcccctttg tctactacgg ggacgagata   1080
gcgatgagat atctggatct tcccaccaaa gaaggcggat atgacaggac cggcagcagg   1140
acgccgatgc agtgggatgg cggcgccaac ttcggtttct cctccgctcc cgcggacaaa   1200
ctctacctgc cgcaggatcc ctcaaaggat gctcccacgg cagagaaggc catggccgat   1260
cccgcctctg tatatcacgt gataaaagcc cttctgacca taagacatga gcacaaagca   1320
ttgcaggcgg acggcggatt ggaagtacta tacgccgaaa aagaaaagct tccctttgtt  1380
tacgcaagaa gaagcggcga cgacggcgtg ctggtggcgc tcaatccgtc attaaatgag  1440
gtctcagccc gggtgaacgc cgcagtggat gacgagctcc tctccctcgg tgagacctcc  1500
gtatcctgtg aaggcagcga gagcaccata accatggggc ctcagtcatt catcatattt  1560
aagctggcct ga                                                      1572
<210>60
<211>523
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域(DOMAIN)
<222>(12)...(435)
<223>α淀粉酶,催化结构域
<400>60
Met Pro Gly Trp Leu Lys Asp Ala Val Phe Tyr Glu Ile Tyr Pro Gln
1               5                   10                  15
Ser Phe Ala Asp Ser Asn Gly Asp Gly Ile Gly Asp Leu Gln Gly Ile
            20                  25                  30
Ile Gly Lys Leu Asp Tyr Val Lys Glu Leu Gly Cys Asn Ala Leu Trp
        35                  40                  45
Ile Asn Pro Cys Tyr Asp Ser Pro Phe Lys Asp Ala Gly Tyr Asp Val
    50                  55                  60
Arg Asp Tyr Lys Lys Val Ala Glu Arg Tyr Gly Thr Asn Asp Asp Leu
65                  70                  75                  80
Lys Glu Leu Phe Ser Lys Ala His Glu Lys Gly Ile His Val Leu Leu
                85                  90                  95
Asp Leu Val Pro Gly His Thr Ser Glu Glu His Ala Trp Phe Lys Glu
            100                 105                 110
Ser Ser Lys Ala Glu Lys Asn Glu Phe Ser Gly Arg Tyr Ile Trp Thr
        115                 120                 125
Gly His Trp Leu Glu Gly Val Pro Gly His Pro Trp Ile Ala Gly Glu
    130                 135                 140
Cys Glu Arg Pro Ala Cys Tyr Met Leu Asn Phe Phe Lys Cys Gln Pro
145                 150                 155                 160
Ala Leu Asn Tyr Gly Phe Leu His Pro Glu Lys Pro Trp Gln Ser Ser
                165                 170                 175
Thr Asp Ser Pro Glu Ala Arg Ala Thr His Glu Ala Met Lys Asp Val
            180                 185                 190
Met Arg Phe Trp Leu Asp Ala Gly Cys Asp Gly Phe Arg Val Asp Met
        195                 200                 205
Ala Asp Ser Leu Val Lys Asp Asp Asp Glu Lys Lys Ser Cys Thr Cys
    210                 215                 220
Ala Leu Trp Arg Glu Val Arg Gln Met Leu Asp Asp Asp Tyr Pro Glu
225                 230                 235                 240
Ala Ala Ile Ile Ser Glu Trp Ser Asn Pro Glu Leu Ala Ile Asn Ser
                245                 250                 255
Ala His Phe His Met Asp Phe Cys Leu Asp His Ala Ser Asn Gly Tyr
            260                 265                 270
His Thr Leu Leu Arg Asp Tyr Trp Gly Asp Asp Gly Asp Asn Ser Phe
        275                 280                 285
Phe Lys Ala Gly Gly His Gly Asp Val Met Arg Phe Leu Asp Asp Tyr
    290                 295                 300
Leu Pro Arg Tyr Glu Ala Thr Lys Asp Asn Gly Phe Ile Ser Leu Ile
305                 310                 315                 320
Ser Cys Asn His Asp Thr Arg Arg Pro Ala Tyr Ser Leu Ser Glu Arg
                325                 330                 335
Glu Ile Lys Val Ala Tyr Ala Phe Ile Tyr Thr Met Pro Gly Val Pro
            340                 345                 350
Phe Val Tyr Tyr Gly Asp Glu Ile Ala Met Arg Tyr Leu Asp Leu Pro
        355                 360                 365
Thr Lys Glu Gly Gly Tyr Asp Arg Thr Gly Ser Arg Thr Pro Met Gln
    370                 375                 380
Trp Asp Gly Gly Ala Asn Phe Gly Phe Ser Ser Ala Pro Ala Asp Lys
385                 390                 395                 400
Leu Tyr Leu Pro Gln Asp Pro Ser Lys Asp Ala Pro Thr Ala Glu Lys
                405                 410                 415
Ala Met Ala Asp Pro Ala Ser Val Tyr His Val Ile Lys Ala Leu Leu
            420                 425                 430
Thr Ile Arg His Glu His Lys Ala Leu Gln Ala Asp Gly Gly Leu Glu
        435                 440                 445
yal Leu Tyr Ala Glu Lys Glu Lys Leu Pro Phe Val Tyr Ala Arg Arg
    450                 455                 460
Ser Gly Asp Asp Gly Val Leu Val Ala Leu Asn Pro Ser Leu Asn Glu
465                 470                 475                 480
Val Ser Ala Arg Val Asn Ala Ala Val Asp Asp Glu Leu Leu Ser Leu
                485                 490                 495
Gly Glu Thr Ser Val Ser Cys Glu Gly Ser Glu Ser Thr Ile Thr Met
            500                 505                 510
Gly Pro Gln Ser Phe Ile Ile Phe Lys Leu Ala
        515                 520
<210>61
<211>2061
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>61
atggtagcag gctttgggct ctacggagct gccttgctca ccccaatggc ggcacaggcc      60
gaaacgggca gagaagtcat gctgcagggc tttaactgga attccacctc gcaagcgggt     120
gggcactata atgagctggc aaatcgtgct ggtgaaatcg ctggggctgg tatcgacatt     180
gtttggttcc cacctccatc cagagccgca gaccgggttg gatacctgcc caacgagtgg     240
tataatatga actccaatta tggaaatcgg acgactctac aggcggctat cgggaatctt     300
cgcaacaacg gtgtcaaaac cgtcgcggat attgtcgtta accaccgtgt gggcacaacg     360
aattgggcgg acttcacgaa tccttctttc ggtgataaca accgtgccat cacacgcgat     420
gatgaatggc atcagtcgtc gggtaactgg gataccggtg aggcgtatag tgccgcccgt     480
gacttggacc acacctacgg ccccgtgcaa aatgagatta aaaactggct gaattggttg     540
aagagtgaca tcggctttga tggttggcgc tatgatatgg tcaagggatt cagcgggtac     600
tatgtgggcg agtacaacac agcaactagc ccctacattt ccgttggtga gttcttcgac     660
tatgatcgcc agaaggtggt cggctggatc aacgccacca atgctcgctc tcgcgccttc     720
gattttccaa cacgcaacct cctctatgtg gctgtcaccc aaaacaacta cggagttctt     780
cgtgatggtg aaggtaaggc caatggactc atcggttggt ggccacaacg ggctatcaca     840
ttcattgaga accatgatac ggaagaagcc cgcaacggtg agtacacccc cgccttcccc     900
caatgggcta ccatgcaggg ttatgcctac attttgacgc accccggcat tccatgcgtt     960
ttctggaatg attggcgttg ggacttccgt tcggaaatca atcaactgat cgccatccgc    1020
agggcccaag gcatcaacga tggcagcagc ctcagcatcc aggttgccga tggcagccgc    1080
tacggggcga tcatcaatgg aaacacggcg gtcaagattg gtcctggaaa ctggagccca    1140
agtggtagtt ggacgctggc tgccgccgga accaattacg ccgtctggac aaacggtggc    1200
ggaacaccaa cgccaacacc cacaccaacc ccaactcagg gccccacaac ggttacttgg    1260
aatccatcca ctccgacagc cggacaaaat gtgacgatca cttatccttc cggccgctcc    1320
cttgccagtt cctccaacgt caacctctac tggggtgtca atggatggac caatgtccaa    1380
accaaagcga tgaccaagaa cagttccaat gactggacaa ccacgatcac acttccctcc    1440
aacacaacac gtttgaactt tgtgttcaat aacggctcca gttgggacaa caacagcagt    1500
caggattgga atgtcaacgt gaccgctgta acgcccacac caacaccgac accgactccc    1560
acacctacgg caactccgac accgacaccc accccgacgc ccactgccac acccacccca    1620
actccgactc cttcgatcat ttggtatcgc atcgaagccc gtcacagtgg taaagttcta    1680
gacgttgcca gtgcatcaac ttcaaacggt ggcaatgtgc atcagtggtc ttatgctggt    1740
ggacagaacc aacaatggcg tgttgtcgac gctgggaacg ggtttgttta catcctaaac    1800
cggaacagtg gaaaagcact tgaagtgggc aacttctcca ccagtaacgg cgggaacgtc    1860
cagcaatggg attatgccgg tggttccagt caacagtgga agctcattga gacgaccaac  1920
ggatatgtgc aaatccagaa tcggaacagc ggcaaagcca ttgatgtttc cgctgcttcg  1980
actaccaatg gtgccaacat ccatcagtgg acctacggcg gcggcaacaa tcagcagtgg  2040
aagctgatcc caatcaatta a                                            2061
<210>62
<211>686
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)..(20)
<220>
<221>结构域(DOMAIN)
<222>(25)...(340)
<223>α淀粉酶,催化结构域
<220>
<221>结构域(DOMAIN)
<222>(341)...(398)
<223>α淀粉酶C末端β折叠结构域
<220>
<221>结构域(DOMAIN)
<222>(547)...(680)
<223>蓖麻蛋白类β-三叶形凝集素结构域(Ricin-type beta-trefoil lectin domain)
<220>
<221>SITE
<222>(34)...(37)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(90)...(93)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(234)...(237)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(436)...(439)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(474)...(477)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(488)...(491)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(498)...(501)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(504)...(507)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(513)...(516)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(620)...(623)
<223>N-糖基化位点.Prosite id=PS00001
<400>62
Met Val Ala Gly Phe Gly Leu Tyr Gly Ala Ala Leu Leu Thr Pro Met
1               5                   10                  15
Ala Ala Gln Ala Glu Thr Gly Arg Glu Val Met Leu Gln Gly Phe Asn
            20                  25                  30
Trp Asn Ser Thr Ser Gln Ala Gly Gly His Tyr Asn Glu Leu Ala Asn
        35                  40                  45
Arg Ala Gly Glu Ile Ala Gly Ala Gly Ile Asp Ile Val Trp Phe Pro
    50                  55                  60
Pro Pro Ser Arg Ala Ala Asp Arg Val Gly Tyr Leu Pro Asn Glu Trp
65                  70                  75                  80
Tyr Asn Met Asn Ser Asn Tyr Gly Asn Arg Thr Thr Leu Gln Ala Ala
                85                  90                  95
Ile Gly Asn Leu Arg Asn Asn Gly Val Lys Tnr Val Ala Asp Ile Val
            100                 105                 110
Val Asn His Arg Val Gly Thr Thr Asn Trp Ala Asp Phe Thr Asn Pro
        115                 120                 125
Ser Phe Gly Asp Asn Asn Arg Ala Ile Thr Arg Asp Asp Glu Trp His
    130                 135                 140
Gln Ser Ser Gly Asn Trp Asp Thr Gly Glu Ala Tyr Ser Ala Ala Arg
145                 150                 155                 160
Asp Leu Asp His Thr Tyr Gly Pro Val Gln Asn Glu Ile Lys Asn Trp
                165                 170                 175
Leu Asn Trp Leu Lys Ser Asp Ile Gly Phe Asp Gly Trp Arg Tyr Asp
            180                 185                 190
Met Val Lys Gly Phe Ser Gly Tyr Tyr Val Gly Glu Tyr Asn Thr Ala
        195                 200                 205
Thr Ser Pro Tyr Ile Ser Val Gly Glu Phe Phe Asp Tyr Asp Arg Gln
    210                 215                 220
Lys Val Val Gly Trp Ile Asn Ala Thr Asn Ala Arg Ser Arg Ala Phe
225                 230                 235                 240
Asp Phe Pro Thr Arg Asn Leu Leu Tyr Val Ala Val Thr Gln Asn Asn
                245                 250                 255
Tyr Gly Val Leu Arg Asp Gly Glu Gly Lys Ala Asn Gly Leu Ile Gly
            260                 265                 270
Trp Trp Pro Gln Arg Ala Ile Thr Phe Ile Glu Asn His Asp Thr Glu
        275                 280                 285
Glu Ala Arg Asn Gly Glu Tyr Thr Pro Ala Phe Pro Gln Trp Ala Thr
    290                 295                 300
Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly Ile Pro Cys Val
305                 310                 315                 320
Phe Trp Asn Asp Trp Arg Trp Asp Phe Arg Ser Glu Ile Asn Gln Leu
                325                 330                 335
Ile Ala Ile Arg Arg Ala Gln Gly Ile Asn Asp Gly Ser Ser Leu Ser
            340                 345                 350
Ile Gln Val Ala Asp Gly Ser Arg Tyr Gly Ala Ile Ile Asn Gly Asn
        355                 360                 365
Thr Ala Val Lys Ile Gly Pro Gly Asn Trp Ser Pro Ser Gly Ser Trp
    370                 375                 380
Thr Leu Ala Ala Ala Gly Thr Asn Tyr Ala Val Trp Thr Asn Gly Gly
385                 390                 395                 400
Gly Thr Pro Thr Pro Thr Pro Thr Pro Thr Pro Thr Gln Gly Pro Thr
                405                 410                 415
Thr Val Thr Trp Asn Pro Ser Thr Pro Thr Ala Gly Gln Asn Val Thr
            420                 425                 430
Ile Thr Tyr Pro Ser Gly Arg Ser Leu Ala Ser Ser Ser Asn Val Asn
        435                 440                 445
Leu Tyr Trp Gly Val Asn Gly Trp Thr Asn Val Gln Thr Lys Ala Met
    450                 455                 460
Thr Lys Asn Ser Ser Asn Asp Trp Thr Thr Thr Ile Thr Leu Pro Ser
465                 470                 475                 480
Asn Thr Thr Arg Leu Asn Phe Val Phe Asn Asn Gly Ser Ser Trp Asp
                485                 490                 495
Asn Asn Ser Ser Gln Asp Trp Asn Val Asn Val Thr Ala Val Thr Pro
            500                 505                 510
Thr Pro Thr Pro Thr Pro Thr Pro Thr Pro Thr Ala Thr Pro Thr Pro
        515                 520                 525
Thr Pro Thr Pro Thr Pro Thr Ala Thr Pro Thr Pro Thr Pro Thr Pro
    530                 535                 540
Ser Ile Ile Trp Tyr Arg Ile Glu Ala Arg His Ser Gly Lys Val Leu
545                 550                 555                 560
Asp Val Ala Ser Ala Ser Thr Ser Asn Gly Gly Asn Val His Gln Trp
                565                 570                 575
Ser Tyr Ala Gly Gly Gln Asn Gln Gln Trp Arg Val Val Asp Ala Gly
            580                 585                 590
Asn Gly Phe Val Tyr Ile Leu Asn Arg Asn Ser Gly Lys Ala Leu Glu
        595                 600                 605
Val Gly Asn Phe Ser Thr Ser Asn Gly Gly Asn Val Gln Gln Trp Asp
    610                 615                 620
Tyr Ala Gly Gly Ser Ser Gln Gln Trp Lys Leu Ile Glu Thr Thr Asn
625                 630                 635                 640
Gly Tyr Val Gln Ile Gln Asn Arg Asn Ser Gly Lys Ala Ile Asp Val
                645                 650                 655
Ser Ala Ala Ser Thr Thr Asn Gly Ala Asn Ile His Gln Trp Thr Tyr
            660                 665                 670
Gly Gly Gly Asn Asn Gln Gln Trp Lys Leu Ile Pro Ile Asn
        675                 680                 685
<210>63
<211>1611
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>63
atgacagagt ggtggcgtgg tgcagtgacc tatcaagtct atccaaggtc gtttcaggac     60
agcaacggcg acggcatcgg cgacctgccc ggcatcaccg cccggcttga gtatctggcc    120
gatcttggcg tggacgcggt ctggctgtca ccgttcttca aaagcccgat gaaggacatg    180
ggctatgacg tcagcgacta ttgcgatgtc gatccggtct tcggcaccct cgccgatttt    240
gacgccctgc tggcccgcgc gcatgagctg gggctcaagg tgatcatcga ccaggtcctt    300
agccacagtt ccgacctgca ccctgccttt gtgaccagtc gcagcgaccg cgtgaacccg    360
aaggcggact ggtatgtctg ggccgatccc aagcccgacg gcagcccgcc caacaactgg    420
ctgtcggtgt tcggtggctc ggcatgggcc tgggacgcgc gcagaaaaca gtattacctg    480
cacaatttcc tgaccagcca gccggacctg aactaccaca acccgaaggt gcaggactgg    540
gcgctggaca acatgcgttt ctggctggac cggggcgtgg acgggttccg ctttgacacc    600
gtcaactact tcttccacga tcccttgttg cgcagcaacc ctgccgatca ccgcaacaag    660
cctgaggctg acggcaatcc ctacggcatg cagtaccacc tgcatgacaa gaaccagccc    720
gagaacctga tctggatgga gcggatacgg gtgcttctgg accaatacgg tgccgcaagc    780
gtcggcgaga tgggcgaaag tcaccacgcc atccggatga tgggcgacta caccgctccg    840
gggcggctgc atcaatgcta cagctttgaa ttcatggggt atgaatacac cgcaaacctg    900
ttccgggacc ggatagaaag ctttttcaag ggtgccccta aaggctggcc gatgtgggcg    960
ttttcaaacc acgatgtcgt ccgccatgtc agtcgctggg caaaacatgg cctcaccccc   1020
gaggcggttg ccaagcagac aggtgcgttg cttctgtcgc ttgagggctc gatctgcctg   1080
tgggagggcg aggagctggg ccagaccgat accgaactgg ccttggatga gttgaccgat   1140
ccgcagggca tcgtcttttg gcccgaaccg atcggccgcg acaatactcg gacgccaatg  1200
gtttgggacg catcgccgca tggcgggttt tcgaccgtca caccctggct gccggtgaaa  1260
ccggaacagg ccgcgcgtca tgtggccggg caaaccggtg atgccgcctc ggtgctggaa  1320
agctaccggg cgatgctggc cttccggcgc gctgaaccgg cccttaggac cgggcggacg  1380
cggtttctgg atctggccga accggttctg ggctttgtgc gcggcgaagg ggagggtgcg  1440
atcctgtgcc tgttcaatct gtcgcctgtt gcgcgggggg ttgcggtcga aggcgtgggc  1500
ccgccgatcg gcccgggcca gcaggctatc ctttcgggcg gacggctagg ccttggcccg  1560
aacggcgccg ccttcctgcg ggtgaccgga acagtccgcg ttctggacta a           1611
<210>64
<211>536
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域(DOMAIN)
<222>(12)...(449)
<223>α淀粉酶,催化结构域
<400>64
Met Thr Glu Trp Trp Arg Gly Ala Val Thr Tyr Gln Val Tyr Pro Arg
1               5                   10                  15
Ser Phe Gln Asp Ser Asn Gly Asp Gly Ile Gly Asp Leu Pro Gly Ile
            20                  25                  30
Thr Ala Arg Leu Glu Tyr Leu Ala Asp Leu Gly Val Asp Ala Val Trp
        35                  40                  45
Leu Ser Pro Phe Phe Lys Ser Pro Met Lys Asp Met Gly Tyr Asp Val
    50                  55                  60
Ser Asp Tyr Cys Asp Val Asp Pro Val Phe Gly Thr Leu Ala Asp Phe
65                  70                  75                  80
Asp Ala Leu Leu Ala Arg Ala His Glu Leu Gly Leu Lys Val Ile Ile
                85                  90                  95
Asp Gln Val Leu Ser His Ser Ser Asp Leu His Pro Ala Phe Val Thr
            100                 105                 110
Ser Arg Ser Asp Arg Val Asn Pro Lys Ala Asp Trp Tyr Val Trp Ala
        115                 120                 125
Asp Pro Lys Pro Asp Gly Ser Pro Pro Asn Asn Trp Leu Ser Val Phe
    130                 135                 140
Gly Gly Ser Ala Trp Ala Trp Asp Ala Arg Arg Lys Gln Tyr Tyr Leu
145                 150                 155                 160
His Asn Phe Leu Thr Ser Gln Pro Asp Leu Asn Tyr His Asn Pro Lys
                165                 170                 175
Val Gln Asp Trp Ala Leu Asp Asn Met Arg Phe Trp Leu Asp Arg Gly
            180                 185                 190
Val Asp Gly Phe Arg Phe Asp Thr Val Asn Tyr Phe Phe His Asp Pro
        195                 200                 205
Leu Leu Arg Ser Asn Pro Ala Asp His Arg Asn Lys Pro Glu Ala Asp
    210                 215                 220
Gly Asn Pro Tyr Gly Met Gln Tyr His Leu His Asp Lys Asn Gln Pro
225                 230                 235                 240
Glu Asn Leu Ile Trp Met Glu Arg Ile Arg Val Leu Leu Asp Gln Tyr
                245                 250                 255
Gly Ala Ala Ser Val Gly Glu Met Gly Glu Ser His His Ala Ile Arg
            260                 265                 270
Met Met Gly Asp Tyr Thr Ala Pro Gly Arg Leu His Gln Cys Tyr Ser
        275                 280                 285
Phe Glu Phe Met Gly Tyr Glu Tyr Thr Ala Asn Leu Phe Arg Asp Arg
    290                 295                 300
Ile Glu Ser Phe Phe Lys Gly Ala Pro Lys Gly Trp Pro Met Trp Ala
305                 310                 315                 320
Phe Ser Asn His Asp Val Val Arg His Val Ser Arg Trp Ala Lys His
                325                 330                 335
Gly Leu Thr Pro Glu Ala Val Ala Lys Gln Thr Gly Ala Leu Leu Leu
            340                 345                 350
Ser Leu Glu Gly Ser Ile Cys Leu Trp Glu Gly Glu Glu Leu Gly Gln
        355                 360                 365
Thr Asp Thr Glu Leu Ala Leu Asp Glu Leu Thr Asp Pro Gln Gly Ile
    370                 375                 380
Val Phe Trp Pro Glu Pro Ile Gly Arg Asp Asn Thr Arg Thr Pro Met
385                 390                 395                 400
Val Trp Asp Ala Ser Pro His Gly Gly Phe Ser Thr Val Thr Pro Trp
                405                 410                 415
Leu Pro Val Lys Pro Glu Gln Ala Ala Arg His Val Ala Gly Gln Thr
            420                 425                 430
Gly Asp Ala Ala Ser Val Leu Glu Ser Tyr Arg Ala Met Leu Ala Phe
        435                 440                 445
Arg Arg Ala Glu Pro Ala Leu Arg Thr Gly Arg Thr Arg Phe Leu Asp
    450                 455                 460
Leu Ala Glu Pro Val Leu Gly Phe Val Arg Gly Glu Gly Glu Gly Ala
465                 470                 475                 480
Ile Leu Cys Leu Phe Asn Leu Ser Pro Val Ala Arg Gly Val Ala Val
                485                 490                 495
Glu Gly Val Gly Pro Pro Ile Gly Pro Gly Gln Gln Ala Ile Leu Ser
            500                 505                 510
Gly Gly Arg Leu Gly Leu Gly Pro Asn Gly Ala Ala Phe Leu Arg Val
        515                 520                 525
Thr Gly Thr Val Arg Val Leu Asp
    530                 535
<210>65
<211>1386
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>65
atgaagttga agtaccttgc cttagttttg ttggctgtgg cttcgatagg cctactctcg     60
actccagtgg gtgctgccaa gtactccgaa ctcgaagagg gcggtgttat aatgcaggcc    120
ttctactggg atgttcccgg agggggaatc tggtgggaca ccataagaca gaaaatcccg    180
gagtggtacg acgctggaat ctcggcgata tggattcctc cagctagcaa agggatgggc    240
ggtggttatt ccatgggcta cgatccctac gatttctttg acctcggcga gtactatcag    300
aagggaacag ttgagacgcg cttcggctca aaggaggaac tggtgaacat gataaacacc    360
gcacactcct atggcataaa ggtgatagcg gacatagtca taaaccaccg cgccggtgga    420
gaccttgagt ggaacccctt tgtaaacaac tatacttgga cagacttctc caaggtcgcc    480
tccggtaaat acacggccaa ctaccttgac ttccacccaa acgaggtcaa gtgctgcgat    540
gagggtacat ttggtgactt tccggacatc gcccacgaga agagctggga tcagtactgg    600
ctctgggcaa gcaatgagag ctacgccgca tatctccgga gcatagggat cgatgcatgg    660
cgtttcgact acgtcaaagg ttacggagcg tgggttgtta atgactggct cagctggtgg    720
ggaggctggg ccgttggaga gtactgggac acgaacgttg atgcactcct taactgggca    780
tacgacagcg gtgccaaggt ctttgacttc ccgctctact acaagatgga cgaagccttt    840
gacaacacca acatccccgc tttggtttac gccctccaga acggaggaac agtcgtttcc    900
cgcgatccct tcaaggcagt aactttcgtt gccaaccacg atacagatat aatctggaac    960
aagtatccgg cttatgcgtt catccttacc tatgagggac agcctgttat attttaccgc   1020
gactacgagg agtggctcaa caaggataag cttaacaacc ttatctggat acacgagcac   1080
cttgccggag gaagtaccaa gatcctctac tacgataacg atgagctaat attcatgagg   1140
gagggctacg ggagcaagcc gggcctcata acctacataa acctcggaaa cgactgggcc   1200
gagcgctggg tgaacgtcgg ctcaaagttt gccggctaca caatccatga atacacaggc   1260
aatctcggtg gctgggttga caggtgggtt cagtacgatg gatgggttaa actgacggca   1320
cctcctcatg atccagccaa cggatattac ggctactcag tctggagcta cgcaggcgtc   1380
ggatga                                                              1386
<210>66
<211>461
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(25)
<220>
<221>结构域(DOMAIN)
<222>(35)...(368)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(152)...(155)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(208)...(211)
<223>N-糖基化位点.Prosite id=PS00001
<400>66
Met Lys Leu Lys Tyr Leu Ala Leu Val Leu Leu Ala Val Ala Ser Ile
1               5                   10                  15
Gly Leu Leu Ser Thr Pro Val Gly Ala Ala Lys Tyr Ser Glu Leu Glu
            20                  25                  30
Glu Gly Gly Val Ile Met Gln Ala Phe Tyr Trp Asp Val Pro Gly Gly
        35                  40                  45
Gly Ile Trp Trp Asp Thr Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp
    50                  55                  60
Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly
65                  70                  75                  80
Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly
                85                  90                  95
Glu Tyr Tyr Gln Lys Gly Thr Val Glu Thr Arg Phe Gly Ser Lys Glu
            100                 105                 110
Glu Leu Val Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Val
        115                 120                 125
Ile Ala Asp Ile Val Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp
    130                 135                 140
Asn Pro Phe Val Asn Asn Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala
145                 150                 155                 160
Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Val
                165                 170                 175
Lys Cys Cys Asp Glu Gly Thr Phe Gly Asp Phe Pro Asp Ile Ala His
            180                 185                 190
Glu Lys Ser Trp Asp Gln Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr
        195                 200                 205
Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr
    210                 215                 220
Val Lys Gly Tyr Gly Ala Trp Val Val Asn Asp Trp Leu Ser Trp Trp
225                 230                 235                 240
Gly Gly Trp Ala Val Gly Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu
                245                 250                 255
Leu Asn Trp Ala Tyr Asp Ser Gly Ala Lys Val Phe Asp Phe Pro Leu
            260                 265                 270
Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu
        275                 280                 285
Val Tyr Ala Leu Gln Asn Gly Gly Thr Val Val Ser Arg Asp Pro Phe
    290                 295                 300
Lys Ala Val Thr Phe Val Ala Asn His Asp Thr Asp Ile Ile Trp Asn
305                 310                 315                 320
Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gln Pro Val
                325                 330                 335
Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn
            340                 345                 350
Asn Leu Ile Trp Ile His Glu His Leu Ala Gly Gly Ser Thr Lys Ile
        355                 360                 365
Leu Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Met Arg Glu Gly Tyr Gly
    370                 375                 380
Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Asn Asp Trp Ala
385                 390                 395                 400
Glu Arg Trp Val Asn Val Gly Ser Lys Phe Ala Gly Tyr Thr Ile His
                405                 410                 415
Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val Asp Arg Trp Val Gln Tyr
            420                 425                 430
Asp Gly Trp Val Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly
        435                 440                 445
Tyr Tyr Gly Tyr Ser Val Trp Ser Tyr Ala Gly Val Gly
    450                 455                 460
<210>67
<211>2022
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>67
ttgaaaaaaa acaccattag cgccctggtc gcaggtatgg tattaggctt tgcatccaac     60
gcaatggcgg ttcctagaac cgcttttgta cacctctttg aatggaaatg ggaagatgtt    120
gcacaggagt gtgaaacatt tctcggacct aaaggctttg ccgcagtgca agtctctccg     180
ccaactaaat ctcacaacac ggatgcatgg tggggccgtt atcaacccgt tagttatgct     240
tttgaaggac gcagcggtaa tcgcagccaa tttaaaaata tggtgcaacg ttgtaaagct     300
gtaggcgtcg atatatacgt agatgcagtg attaaccaca tggcagccta cgacagaaat     360
ttccctgatg taccctatag cagtaatgac tttaactcct gtacaggaga tattgactat     420
aataaccgtt ggcaaacaca gcattgtgat ttagtcggtc ttaatgatct aaaaacagga     480
tctgactacg tccgccaaaa aatagcggat tatatgaacg acgcaatcag tatgggtgta     540
gctggtttcc gtattgatgc agccaaacat ataccagcag gtgatatagc tgccattaaa     600
ggtaaattaa atggtaatcc atacatcttc caagaggtaa ttggtgcatc cggcgaacct     660
gttcgaccga ctgaatacac ctttatcggt ggtgtcacgg aatttcaatt tgctcgaaaa     720
ttgggtccag ccttccgcaa tagtaatatt gcttggttaa aagacattgg cagtcaaatg     780
gaattatcca gtgctgatgc cgtaacattt gtaacgaatc atgatgaaga gcgtcataac     840
ccgaatggtc ctatttggca cggcgttcaa ggtaatggtt atgcattagc aaatattttc     900
accttagctt acccttacgg ctatccaaaa atcatgtcag gatacttctt ccacggtgac     960
tttaacgcag ctccaccaag cagtggtata cacacaggaa atgcgtgtgg ttttgatggc    1020
ggagactggg tatgcgaaca caaatggcgc ggtattgcta acatggttgc cttccgcaac    1080
tatacagcaa gcgaatggcg tatcagtaat tggtggcaaa acagtaacga ccaaattgct    1140
tttggtcgcg gtggtttagg ttttgttgtt attaataaac gtgctaatgg tagcattaat    1200
caaagttttg atacgggaat gcctgatggc caatactgta acataataga agctaacttt    1260
gatgaaagca ccggccaatg tagtgcagct acagattcca acggtcaagc cgttattacc    1320
gtcagtggtg ggcaagctaa ctttaatgta gcaggcgatc atgctgctgc aattcatgtt    1380
ggcgcaaaaa ttggtgatca atgtagtggt gatgattgcc catgtacagg atccgattgt    1440
aataatgatc ctaaacctga ttttgcagta ccagcaacat caatttgtac atcagaaaat    1500
ttacctacgc tatattactg gggagcacag cctacagata gcttagcgaa tgcagcttgg    1560
ccaggtgtcg caatgcaaac aaatggcgac tttaagtgtc atgatttagg tgtcgaacta    1620
accaaaatta acgccatctt tagtgacaat ggtgcaaata aaacagctga tctaactgtt    1680
actggtgcag gttgttataa agacgggact tggagcacct tacaaaattg tggctttgaa    1740
attaccggtg cacaaaccaa tccagtcggt ggcgacgaag tctggtactt ccgaggtact    1800
gctaatgact ggggtaaagc acaattagat tatgacgcaa ctagcggttt gtattacaca    1860
atacaaagct ttaatggtga agaagcacct gcgcgtttta aaattgataa tggtagttgg    1920
actgaagctt atccaacagc tgattaccaa gttacagata acaattcata ccgcattaac    1980
tttaatagcg atagcaaagc gattacagta aacgcacaat aa                       2022
<210>68
<211>673
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(23)
<220>
<221>结构域(DOMAIN)
<222>(27)...(359)
<223>α淀粉酶,催化结构域
<220>
<221>结构域(DOMAIN)
<222>(372)...(463)
<223>α淀粉酶,C-terminal all-beta domain
<220>
<221>SITE
<222>(88)...(91)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(365)...(368)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(402)...(405)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(406)...(409)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(561)...(564)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(646)...(649)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(664)...(667)
<223>N-糖基化位点.Prosite id=PS00001
<400>68
Met Lys Lys Asn Thr Ile Ser Ala Leu Val Ala Gly Met Val Leu Gly
1               5                   10                  15
Phe Ala Ser Asn Ala Met Ala Val Pro Arg Thr Ala Phe Val His Leu
            20                  25                  30
Phe Glu Trp Lys Trp Glu Asp Val Ala Gln Glu Cys Glu Thr Phe Leu
        35                  40                  45
Gly Pro Lys Gly Phe Ala Ala Val Gln Val Ser Pro Pro Thr Lys Ser
    50                  55                  60
His Asn Thr Asp Ala Trp Trp Gly Arg Tyr Gln Pro Val Ser Tyr Ala
65                  70                  75                  80
Phe Glu Gly Arg Ser Gly Asn Arg Ser Gln Phe Lys Asn Met Val Gln
                85                  90                  95
Arg Cys Lys Ala Val Gly Val Asp Ile Tyr Val Asp Ala Val Ile Asn
            100                 105                 110
His Met Ala Ala Tyr Asp Arg Asn Phe Pro Asp Val Pro Tyr Ser Ser
        115                 120                 125
Asn Asp Phe Asn Ser Cys Thr Gly Asp Ile Asp Tyr Asn Asn Arg Trp
    130                 135                 140
Gln Thr Gln His Cys Asp Leu Val Gly Leu Asn Asp Leu Lys Thr Gly
145                 150                 155                 160
Ser Asp Tyr Val Arg Gln Lys Ile Ala Asp Tyr Met Asn Asp Ala Ile
                165                 170                 175
Ser Met Gly Val Ala Gly Phe Arg Ile Asp Ala Ala Lys His Ile Pro
            180                 185                 190
Ala Gly Asp Ile Ala Ala Ile Lys Gly Lys Leu Asn Gly Asn Pro Tyr
        195                 200                 205
Ile Phe Gln Glu Val Ile Gly Ala Ser Gly Glu Pro Val Arg Pro Thr
    210                 215                 220
Glu Tyr Thr Phe Ile Gly Gly Val Thr Glu Phe Gln Phe Ala Arg Lys
225                 230                 235                 240
Leu Gly Pro Ala Phe Arg Asn Ser Asn Ile Ala Trp Leu Lys Asp Ile
                245                 250                 255
Gly Ser Gln Met Glu Leu Ser Ser Ala Asp Ala Val Thr Phe Val Thr
            260                 265                 270
Asn His Asp Glu Glu Arg His Asn Pro Asn Gly Pro Ile Trp His Gly
        275                 280                 285
Val Gln Gly Asn Gly Tyr Ala Leu Ala Asn Ile Phe Thr Leu Ala Tyr
    290                 295                 300
Pro Tyr Gly Tyr Pro Lys Ile Met Ser Gly Tyr Phe Phe His Gly Asp
305                 310                 315                 320
Phe Asn Ala Ala Pro Pro Ser Ser Gly Ile His Thr Gly Asn Ala Cys
                325                 330                 335
Gly Phe Asp Gly Gly Asp Trp Val Cys Glu His Lys Trp Arg Gly Ile
            340                 345                 350
Ala Asn Met Val Ala Phe Arg Asn Tyr Thr Ala Ser Glu Trp Arg Ile
        355                 360                 365
Ser Asn Trp Trp Gln Asn Ser Asn Asp Gln Ile Ala Phe Gly Arg Gly
    370                 375                 380
Gly Leu Gly Phe Val Val Ile Asn Lys Arg Ala Asn Gly Ser Ile Asn
385                 390                 395                 400
Gln Ser Phe Asp Thr Gly Met Pro Asp Gly Gln Tyr Cys Asn Ile Ile
                405                 410                 415
Glu Ala Asn Phe Asp Glu Ser Thr Gly Gln Cys Ser Ala Ala Thr Asp
            420                 425                 430
Ser Asn Gly Gln Ala Val Ile Thr Val Ser Gly Gly Gln Ala Asn Phe
        435                 440                 445
Asn Val Ala Gly Asp His Ala Ala Ala Ile His Val Gly Ala Lys Ile
    450                 455                 460
Gly Asp Gln Cys Ser Gly Asp Asp Cys Pro Cys Thr Gly Ser Asp Cys
465                 470                 475                 480
Asn Asn Asp Pro Lys Pro Asp Phe Ala Val Pro Ala Thr Ser Ile Cys
                485                 490                 495
Thr Ser Glu Asn Leu Pro Thr Leu Tyr Tyr Trp Gly Ala Gln Pro Thr
            500                 505                 510
Asp Ser Leu Ala Asn Ala Ala Trp Pro Gly Val Ala Met Gln Thr Asn
        515                 520                 525
Gly Asp Phe Lys Cys His Asp Leu Gly Val Glu Leu Thr Lys Ile Asn
    530                 535                 540
Ala Ile Phe Ser Asp Asn Gly Ala Asn Lys Thr Ala Asp Leu Thr Val
545                 550                 555                 560
Thr Gly Ala Gly Cys Tyr Lys Asp Gly Thr Trp Ser Thr Leu Gln Asn
                565                 570                 575
Cys Gly Phe Glu Ile Thr Gly Ala Gln Thr Asn Pro Val Gly Gly Asp
            580                 585                 590
Glu Val Trp Tyr Phe Arg Gly Thr Ala Asn Asp Trp Gly Lys Ala Gln
        595                 600                 605
Leu Asp Tyr Asp Ala Thr Ser Gly Leu Tyr Tyr Thr Ile Gln Ser Phe
    610                 615                 620
Asn Gly Glu Glu Ala Pro Ala Arg Phe Lys Ile Asp Asn Gly Ser Trp
625                 630                 635                 640
Thr Glu Ala Tyr Pro Thr Ala Asp Tyr Gln Val Thr Asp Asn Asn Ser
                645                 650                 655
Tyr Arg Ile Asn Phe Asn Ser Asp Ser Lys Ala Ile Thr Val Asn Ala
            660                 665                 670
Gln
<210>69
<211>1455
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>69
atgaaccgtc caggcacggg cgcctcgggg cgcccacaat ctcgctccgc cacgtcgtgg      60
caatcccgca acggcggctg gctgctcgcc tcgctgctgg ccgtgtgttt cgcaacggcg     120
cccgtgcgcg ccgatgtcat cctgcatgca ttcaactggc cgtatgcgac ggtcgaagcc     180
cgcgccaacg agctgcgaga cctgggctat cgcgccgtac tggtcgcacc gccggtgaag     240
tccgaaggca atgcgtggtg ggcgcgctac cagccgcagg actaccgggt catcgagcat     300
ccgctcggca atcgcgagtc gttcgtgcgc atgtccagtg ctctgcgcgc ccgcggcatt     360
cgcgtctacg ccgacatcgt gctgaatcac atggccaatg aagccccgca gcgaccggat     420
ctgaactacc ccggtcaacg ggtcctggat cagtatgcag gcaataccgc gtacttcgcg     480
cagcaacgac tctacggcga tctccgctac aacttcatgt cggcctggga ctttggcccc     540
gcccactgca tcggcaacta ccacgacgtc tggcaggtgc agaactggcg gctgtgcagc     600
ggcgctggcg atgccggcct gcccgacctg ctggccagcg attacatcgt cggacagcag     660
cgcacctatc tccaggcact gaagaacctc ggcgtctccg ggttgcgcat cgacgcggcc     720
aagcacatgc cgctcagcca catcaaccgc gtactgactg ccgacctcaa ggccggcatg     780
catgtgttcg gcgaagtcat cacccacggt ggcgtcggtg atcccgaata cgatctgttt     840
ctccggccct atctggatgg caccgatcac ggtgcctacg acttcccgct cttcgaggcg     900
atccgccgcg cattcggctt cggtggcagc atgagcaccc tggtcgatcc tggggccgtc     960
ggactggccc tgcccaatgc ccggtcgatc accttcaccg tcacccacga catcccgaac    1020
aatggtgtgt tccggcatct gctgctggat gccggcgacg aaaccctggc gtacgcctac    1080
atcctgggtc gtgacggcgg cagtccactg ctgtactccg atcacaacga gagcggcgac    1140
aaccgctggg ttcatgccta tcggcgcaac gacctcgcgg ccatgatccg ctttcacaat    1200
gccaatcatg gcaatgacat gcaggtgctc gcacacggga actgccatct gctctttcgc    1260
cgcggcaatc gcggcatcgt ggcgatcaac aagtgcgggc atacggtcaa cgccacggtg    1320
aacatgaaca acagtgtgct gtggtggcat accccgtatc gcgatgtcct tgatgccggc    1380
agcgtggtgc agattggcag cgccagccac acgttcagcc ttccgccgcg gcgcgctcgg    1440
atgtggctgc gctga                                                     1455
<210>70
<211>484
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(44)
<220>
<221>结构域(DOMAIN)
<222>(45)...(399)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(381)...(384)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(443)...(446)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(449)...(452)
<223>N-糖基化位点.Prosite id=PS00001
<400>70
Met Asn Arg Pro Gly Thr Gly Ala Ser Gly Arg Pro Gln Ser Arg Ser
1               5                   10                  15
Ala Thr Ser Trp Gln Ser Arg Asn Gly Gly Trp Leu Leu Ala Ser Leu
            20                  25                  30
Leu Ala Val Cys Phe Ala Thr Ala Pro Val Arg Ala Asp Val Ile Leu
        35                  40                  45
His Ala Phe Asn Trp Pro Tyr Ala Thr Val Glu Ala Arg Ala Asn Glu
    50                  55                  60
Leu Arg Asp Leu Gly Tyr Arg Ala Val Leu Val Ala Pro Pro Val Lys
65                  70                  75                  80
Ser Glu Gly Asn Ala Trp Trp Ala Arg Tyr Gln Pro Gln Asp Tyr Arg
                85                  90                  95
Val Ile Glu His Pro Leu Gly Asn Arg Glu Ser Phe Val Arg Met Ser
            100                 105                 110
Ser Ala Leu Arg Ala Arg Gly Ile Arg Val Tyr Ala Asp Ile Val Leu
        115                 120                 125
Asn His Met Ala Asn Glu Ala Pro Gln Arg Pro Asp Leu Asn Tyr Pro
    130                 135                 140
Gly Gln Arg Val Leu Asp Gln Tyr Ala Gly Asn Thr Ala Tyr Phe Ala
145                 150                 155                 160
Gln Gln Arg Leu Tyr Gly Asp Leu Arg Tyr Asn Phe Met Ser Ala Trp
                165                 170                 175
Asp Phe Gly Pro Ala His Cys Ile Gly Asn Tyr His Asp Val Trp Gln
            180                 185                 190
Val Gln Asn Trp Arg Leu Cys Ser Gly Ala Gly Asp Ala Gly Leu Pro
        195                 200                 205
Asp Leu Leu Ala Ser Asp Tyr Ile Val Gly Gln Gln Arg Thr Tyr Leu
    210                 215                 220
Gln Ala Leu Lys Asn Leu Gly Val Ser Gly Leu Arg Ile Asp Ala Ala
225                 230                 235                 240
Lys His Met Pro Leu Ser His Ile Asn Arg Val Leu Thr Ala Asp Leu
                245                 250                 255
Lys Ala Gly Met His Val Phe Gly Glu Val Ile Thr His Gly Gly Val
            260                 265                 270
Gly Asp Pro Glu Tyr Asp Leu Phe Leu Arg Pro Tyr Leu Asp Gly Thr
        275                 280                 285
Asp His Gly Ala Tyr Asp Phe Pro Leu Phe Glu Ala Ile Arg Arg Ala
    290                 295                 300
Phe Gly Phe Gly Gly Ser Met Ser Thr Leu Val Asp Pro Gly Ala Val
305                 310                 315                 320
Gly Leu Ala Leu Pro Asn Ala Arg Ser Ile Thr Phe Thr Val Thr His
                325                 330                 335
Asp Ile Pro Asn Asn Gly Val Phe Arg His Leu Leu Leu Asp Ala Gly
            340                 345                 350
Asp Glu Thr Leu Ala Tyr Ala Tyr Ile Leu Gly Arg Asp Gly Gly Ser
        355                 360                 365
Pro Leu Leu Tyr Ser Asp His Asn Glu Ser Gly Asp Asn Arg Trp Val
    370                 375                 380
His Ala Tyr Arg Arg Asn Asp Leu Ala Ala Met Ile Arg Phe His Asn
385                 390                 395                 400
Ala Asn His Gly Asn Asp Met Gln Val Leu Ala His Gly Asn Cys His
                405                 410                 415
Leu Leu Phe Arg Arg Gly Asn Arg Gly Ile Val Ala Ile Asn Lys Cys
            420                 425                 430
Gly His Thr Val Asn Ala Thr Val Asn Met Asn Asn Ser Val Leu Trp
        435                 440                 445
Trp His Thr Pro Tyr Arg Asp Val Leu Asp Ala Gly Ser Val Val Gln
    450                 455                 460
Ile Gly Ser Ala Ser His Thr Phe Ser Leu Pro Pro Arg Arg Ala Arg
465                 470                 475                 480
Met Trp Leu Arg
<210>71
<211>1719
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>71
gtgcccgaac tgaaatggtg gcagacagct atattttatc aaatctaccc gcgctctttc     60
gccgacggca acggcgatgg catcggcgat ttcaaaggca tcatcggcaa actcgattat    120
ctacaaaatc ttggcataga tgcgctctgg ctctcgcctc acttcccctc ccccaactgg    180
gattgcggct acgatatcag cgattaccgc aacgttgcgc cggaatacgg cacgctggac    240
gatttcaaaa ccttcctgag cgaatcgcac aaacgcggta tccgcgtcat tctcgacctc    300
gtgctgaatc acacctccga tgaacatccg tggttcatcg aatcgaaatc cagccgcgat    360
aatcccaaat ccgattggta tgtgtgggtc gatacgccgc ccaacaattg gcagtcctgc   420
ttcgatggcg atgcctggac atacgtccct gaacgcggcc aatattatta tcactacttc   480
atgaaacagc agcccgatct caactggcat aatccgcagg tcaaacaggc catgtgggag   540
gcggtgcgct tctggctcga tctcggcgtg gacggcttcc gcctggacgc catcggcacg   600
atctacgaag acccaaatct cacgccgcat aatgtcccga tgaatttggc tgagctgcgt   660
cacttcacag atgtcgccaa aacgccggaa gagatcaagc tcaaagaaaa atactggcac   720
gacatgttca agcatcaatg gggtcagccc ggcgttcatg acctgatgaa agaactgcgc   780
gccatcctcg atgaatatga tggcgaccgc atgctggtcg gcgaagatga caacatcgat   840
tacatgggca acggagacga cgaattgcag ctggtcttca acttcccgtt gatgcgcgcc   900
gatcgtctca cccccgacca tattcggcgc aaccaaaaag agcgtttgac tcgtctgaat   960
gctttacccg ttaaaggctg ggcttgcaac acgctcggca accatgatag ttcacgcgtc  1020
tacaccaaat tcggtgaccg gatccacggc gcggaccatg cacgtctcaa cctggcgctt  1080
ttgctcaccc tgcacggcac gccgttctta tacaacggcg aagagatcgg catgaccgac  1140
cacatcatta ccgatcccac caaactgcgc gacaccatgg caacctggta ttacaacagc  1200
cttgtcaacg aaatgaaggt cgagccagcg gaggccgccc ttcgcgccgg acagatgacg  1260
cgcgacaaaa accgtacccc catgcaatgg gacaataagc ccaatgccgg tttttgccca  1320
gataaagccg aaccctggtt gccagtcaac cccaattacc gcgcaggcat taacgtccgc  1380
gagcaaacat cgaacccgaa ctcgctgctc aattactata aacgtctcat ccacttgcgg  1440
cgggaaacgc ctgccttgat cgctggagat tacgttccgc ttcaccagac atccaaagat  1500
catctggcct tcctgcgcaa aacagattca caaacgatcc tggtcgtttt gaattactcc  1560
cccaataaat tggaattgga tttctcgcgc accgtcgaaa tgaaaggccg cccgctgatc  1620
gcaattttct ccagcgcaga tgaccgcccg caggcggcac aaagcccaaa gaaagtatcg  1680
gtcggcgctt acggagttct gctggcagaa gtaaaatag                         1719
<210>72
<211>572
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域(DOMAIN)
<222>(14)...(405)
<223>α淀粉酶,催化结构域
<220>
<221>SITE
<222>(104)...(107)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(525)...(528)
<223>N-糖基化位点.Prosite id=PS00001
<400>72
Met Pro Glu Leu Lys Trp Trp Gln Thr Ala Ile Phe Tyr Gln Ile Tyr
1               5                   10                  15
Pro Arg Ser Phe Ala Asp Gly Asn Gly Asp Gly Ile Gly Asp Phe Lys
            20                  25                  30
Gly Ile Ile Gly Lys Leu Asp Tyr Leu Gln Asn Leu Gly Ile Asp Ala
        35                  40                  45
Leu Trp Leu Ser Pro His Phe Pro Ser Pro Asn Trp Asp Cys Gly Tyr
    50                  55                  60
Asp Ile Ser Asp Tyr Arg Asn Val Ala Pro Glu Tyr Gly Thr Leu Asp
65                  70                  75                  80
Asp Phe Lys Thr Phe Leu Ser Glu Ser His Lys Arg Gly Ile Arg Val
                85                  90                  95
Ile Leu Asp Leu Val Leu Asn His Thr Ser Asp Glu His Pro Trp Phe
            100                 105                 110
Ile Glu Ser Lys Ser Ser Arg Asp Asn Pro Lys Ser Asp Trp Tyr Val
        115                 120                 125
Trp Val Asp Thr Pro Pro Asn Asn Trp Gln Ser Cys Phe Asp Gly Asp
    130                 135                 140
Ala Trp Thr Tyr Val Pro Glu Arg Gly Gln Tyr Tyr Tyr His Tyr Phe
145                 150                 155                 160
Met Lys Gln Gln Pro Asp Leu Asn Trp His Asn Pro Gln Val Lys Gln
                165                 170                 175
Ala Met Trp Glu Ala Val Arg Phe Trp Leu Asp Leu Gly Val Asp Gly
            180                 185                 190
Phe Arg Leu Asp Ala Ile Gly Thr Ile Tyr Glu Asp Pro Asn Leu Thr
        195                 200                 205
Pro His Asn Val Pro Met Asn Leu Ala Glu Leu Arg His Phe Thr Asp
    210                 215                 220
Val Ala Lys Thr Pro Glu Glu Ile Lys Leu Lys Glu Lys Tyr Trp His
225                 230                 235                 240
Asp Met Phe Lys His Gln Trp Gly Gln Pro Gly Val His Asp Leu Met
                245                 250                 255
Lys Glu Leu Arg Ala Ile Leu Asp Glu Tyr Asp Gly Asp Arg Met Leu
            260                 265                 270
Val Gly Glu Asp Asp Asn Ile Asp Tyr Met Gly Asn Gly Asp Asp Glu
        275                 280                 285
Leu Gln Leu Val Phe Asn Phe Pro Leu Met Arg Ala Asp Arg Leu Thr
    290                 295                 300
Pro Asp His Ile Arg Arg Asn Gln Lys Glu Arg Leu Thr Arg Leu Asn
305                 310                 315                 320
Ala Leu Pro Val Lys Gly Trp Ala Cys Asn Thr Leu Gly Asn His Asp
                325                 330                 335
Ser Ser Arg Val Tyr Thr Lys Phe Gly Asp Arg Ile His Gly Ala Asp
             340                 345                 350
His Ala Arg Leu Asn Leu Ala Leu Leu Leu Thr Leu His Gly Thr Pro
        355                 360                 365
Phe Leu Tyr Asn Gly Glu Glu Ile Gly Met Thr Asp His Ile Ile Thr
    370                 375                 380
Asp Pro Thr Lys Leu Arg Asp Thr Met Ala Thr Trp Tyr Tyr Asn Ser
385                 390                 395                 400
Leu Val Asn Glu Met Lys Val Glu Pro Ala Glu Ala Ala Leu Arg Ala
                405                 410                 415
Gly Gln Met Thr Arg Asp Lys Asn Arg Thr Pro Met Gln Trp Asp Asn
            420                 425                 430
Lys Pro Asn Ala Gly Phe Cys Pro Asp Lys Ala Glu Pro Trp Leu Pro
        435                 440                 445
Val Asn Pro Asn Tyr Arg Ala Gly Ile Asn Val Arg Glu Gln Thr Ser
    450                 455                 460
Asn Pro Asn Ser Leu Leu Asn Tyr Tyr Lys Arg Leu Ile His Leu Arg
465                 470                 475                 480
Arg Glu Thr Pro Ala Leu Ile Ala Gly Asp Tyr Val Pro Leu His Gln
                485                 490                 495
Thr Ser Lys Asp His Leu Ala Phe Leu Arg Lys Thr Asp Ser Gln Thr
            500                 505                 510
Ile Leu Val Val Leu Asn Tyr Ser Pro Asn Lys Leu Glu Leu Asp Phe
        515                 520                 525
Ser Arg Thr Val Glu Met Lys Gly Arg Pro Leu Ile Ala Ile Phe Ser
    530                 535                 540
Ser Ala Asp Asp Arg Pro Gln Ala Ala Gln Ser Pro Lys Lys Val Ser
545                 550                 555                 560
Val Gly Ala Tyr Gly Val Leu Leu Ala Glu Val Lys
                565                 570
<210>73
<211>1836
<212>DNA
<213>Thermomyces lanuginosus ATCC 200065
<400>73
ttgtgcgcgg cccttggact cgccgccttg atcgtccaag gcggagaagc cagacctgaa     60
acaaccgtcc cacatgcaac gggctcgctc gacgacttcc tcgccgcaca gagtccgatt    120
gctttccaag gcatcctgaa caatatcggg cctagcggag cgtactcgga aggtgtcaat    180
ccgggtgtgg tcattgcgag tccaagtaaa caagatcccg actactttta cacctgggtg    240
cgcgacgctg ctctcactgt ccaatatctg gtggaggagc tggttgcagg aaatgccagt   300
cttcagttcc tcattcagga ctacatcagc tcccaggcac gactgcagac ggtggaaaat   360
ccatccggct ccctctcgtc gggtggtcta ggagagccca agtttcatgt cgacgagacc   420
gcctttacgg actcctgggg ccgaccacag cgggacggcc cgcctctccg cgccattgcc   480
atgatttcgt ttgccaatta cctgattgac aacggtcatc aatcgactgt ggaggacatc   540
atctggccga ttgttcgcaa tgacttgtcc tatgtctcgc agcattggaa cgaaacaact   600
tttgacatct gggaggaagt ccatagctca tcgtttttca ccacggctgt ccagtaccgt   660
gctctggtcc aaggcagtgc cttggctagc aagctcggcc atacctgcga caactgcggg   720
tcccaagcac cgcagatcct ttgcttcctg cagtcgtatt ggaccgggtc gcacatctta   780
gccaacaccg gtggcggccg ctcgggaaag gacgtcagca cgatcctcgg cgtcattggc   840
tcgtttgatc cgaacgccga ctgtgatgac gttaccttcc agccctgctc ggcccgggct   900
cttgcaaatc acaagcaggt cgttgacagc ttccgcagta tctatgccat caacgctggc   960
atcccgtcag ggtcggctgt tgcggttgga cgttatcccg aggatgtcta tcagggtgga  1020
cacccctggt acctaacaac ggctgcggcg gcggagcagc tttacgacgc catttaccag  1080
tggaaccatg tagggcacat cgacatcaat gctgtcaatc tggacttctt caagagcatt  1140
tatccgtcag ccgccgaggg cacatacaca tcagactctt caacatttca agacattata  1200
tctgctgtac ggacctatgc ggacgggttt ctcagcgtaa ttgagaaata cactccgccg  1260
gataacttgc ttgccgagca gttccaccgg gagacgggca ttccactatc ggcagcttct  1320
ctgacatggt cctacgccgc gctcaacacg gccgcgcagc ggcgagcgtc aatcgtgccc  1380
tcaccgtgga actctaacag cacagatctc ccggacaaat gctcggcaac ctcggcaaca  1440
gggccgtatg ccacgcccac aaacacggca tggccaacca ctacgcagcc accggagcgg  1500
ccggcatgca caccgccgtc ggaagtaaca ctcaccttca acgcgctcgt cgacaccgcg  1560
tttggccaga atatttatct cgtgggctcc attccggagc tcggatcgtg ggatccggcc  1620
aacgccctct tgatgagcgc aaagagctgg actagcggaa atccggtctg gacgctatcc  1680
atttcccttc cagcaggaac ctcttttgag tacaagttca ttcgaaagga tgatggttcc  1740
tcggatgttg tctgggaaag tgacccgaat cgttcgtaca acgtgccgaa ggattgcggt  1800
gccaacacgg ccaccgtgaa ttcttggtgg cgatga                            1836
<210>74
<211>611
<212>PRT
<213>Thermomyces lanuginosus ATCC 200065
<220>
<221>结构域(DOMAIN)
<222>(39)...(453)
<223>糖基水解酶家族15
<220>
<221>结构域(DOMAIN)
<222>(508)...(605)
<223>淀粉结合结构域
<220>
<221>SITE
<222>(99)...(102)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(200)...(203)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<221>SITE
<222>(473)...(476)
<223>N-糖基化位点.Prosite id=PS00001
<220>
<22L>SITE
<222>(599)...(602)
<223>N-糖基化位点.Prosite id=PS00001
<400>74
Met Cys Ala Ala Leu Gly Leu Ala Ala Leu Ile Val Gln Gly Gly Glu
1               5                   10                  15
Ala Arg Pro Glu Thr Thr Val Pro His Ala Thr Gly Ser Leu Asp Asp
            20                  25                  30
Phe Leu Ala Ala Gln Ser Pro Ile Ala Phe Gln Gly Ile Leu Asn Asn
        35                  40                  45
Ile Gly Pro Ser Gly Ala Tyr Ser Glu Gly Val Asn Pro Gly Val Val
    50                  55                  60
Ile Ala Ser Pro Ser Lys Gln Asp Pro Asp Tyr Phe Tyr Thr Trp Val
65                  70                  75                  80
Arg Asp Ala Ala Leu Thr Val Gln Tyr Leu Val Glu Glu Leu Val Ala
                85                  90                  95
Gly Asn Ala Ser Leu Gln Phe Leu Ile Gln Asp Tyr Ile Ser Ser Gln
            100                 105                 110
Ala Arg Leu Gln Thr Val Glu Asn Pro Ser Gly Ser Leu Ser Ser Gly
        115                 120                 125
Gly Leu Gly Glu Pro Lys Phe His Val Asp Glu Thr Ala Phe Thr Asp
    130                 135                 140
Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala Ile Ala
145                 150                 155                 160
Met Ile Ser Phe Ala Asn Tyr Leu Ile Asp Asn Gly His Gln Ser Thr
                165                 170                 175
Val Glu Asp Ile Ile Trp Pro Ile Val Arg Asn Asp Leu Ser Tyr Val
            180                 185                 190
Ser Gln His Trp Asn Glu Thr Thr Phe Asp Ile Trp Glu Glu Val His
        195                 200                 205
Ser Ser Ser Phe Phe Thr Thr Ala Val Gln Tyr Arg Ala Leu Val Gln
    210                 215                 220
Gly Ser Ala Leu Ala Ser Lys Leu Gly His Thr Cys Asp Asn Cys Gly
225                 230                 235                 240
Ser Gln Ala Pro Gln Ile Leu Cys Phe Leu Gln Ser Tyr Trp Thr Gly
                245                 250                 255
Ser His Ile Leu Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Val
            260                 265                 270
Ser Thr Ile Leu Gly Val Ile Gly Ser Phe Asp Pro Asn Ala Asp Cys
        275                 280                 285
Asp Asp Val Thr Phe Gln Pro Cys Ser Ala Arg Ala Leu Ala Asn His
    290                 295                 300
Lys Gln Val Val Asp Ser Phe Arg Ser Ile Tyr Ala Ile Asn Ala Gly
305                 310                 315                 320
Ile Pro Ser Gly Ser Ala Val Ala Val Gly Arg Tyr Pro Glu Asp Val
                325                 330                 335
Tyr Gln Gly Gly His Pro Trp Tyr Leu Thr Thr Ala Ala Ala Ala Glu
            340                 345                 350
Gln Leu Tyr Asp Ala Ile Tyr Gln Trp Asn His Val Gly His Ile Asp
        355                 360                 365
Ile Asn Ala Val Asn Leu Asp Phe Phe Lys Ser Ile Tyr Pro Ser Ala
    370                 375                 380
Ala Glu Gly Thr Tyr Thr Ser Asp Ser Ser Thr Phe Gln Asp Ile Ile
385                 390                 395                 400
Ser Ala Val Arg Thr Tyr Ala Asp Gly Phe Leu Ser Val Ile Glu Lys
                405                 410                 415
Tyr Thr Pro Pro Asp Asn Leu Leu Ala Glu Gln Phe His Arg Glu Thr
            420                 425                 430
Gly Ile Pro Leu Ser Ala Ala Ser Leu Thr Trp Ser Tyr Ala Ala Leu
        435                 440                 445
Asn Thr Ala Ala Gln Arg Arg Ala Ser Ile Val Pro Ser Pro Trp Asn
    450                 455                 460
Ser Asn Ser Thr Asp Leu Pro Asp Lys Cys Ser Ala Thr Ser Ala Thr
465                 470                 475                 480
Gly Pro Tyr Ala Thr Pro Thr Asn Thr Ala Trp Pro Thr Thr Thr Gln
                485                 490                 495
Pro Pro Glu Arg Pro Ala Cys Thr Pro Pro Ser Glu Val Thr Leu Thr
            500                 505                 510
Phe Asn Ala Leu Val Asp Thr Ala Phe Gly Gln Asn Ile Tyr Leu Val
        515                 520                 525
Gly Ser Ile Pro Glu Leu Gly Ser Trp Asp Pro Ala Asn Ala Leu Leu
    530                 535                 540
Met Ser Ala Lys Ser Trp Thr Ser Gly Asn Pro Val Trp Thr Leu Ser
545                 550                 555                 560
Ile Ser Leu Pro Ala Gly Thr Ser Phe Glu Tyr Lys Phe Ile Arg Lys
                565                 570                 575
Asp Asp Gly Ser Ser Asp Val Val Trp Glu Ser Asp Pro Asn Arg Ser
            580                 585                 590
Tyr Asn Val Pro Lys Asp Cys Gly Ala Asn Thr Ala Thr Val Asn Ser
        595                 600                 605
Trp Trp Arg
    610
<210>75
<211>1344
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>75
atgaaccggg ttaagagact ttcgattttg gtcgttcttt tccttaccgc cttcattccg     60
actgtttttg ccggcgagca gcctctcgcc atctttcacg cctttaacga ccccttcact    120
cttgttgaat cctatgtctg cgaactcgcc gggcagggat actcacatgt ccagatatct    180
ccagcgcaga agtcgaaccc tgctcgagcc tggtatgccc ggtatcaacc cgtagatttt    240
actgtcatcg aagggatggg cactgagagc gatctgagga agctcacgga taaggcccac    300
gcgtgtggaa taaaggtgat cgccgatgtg gtcttcaacc acatgtcgag catggacgag    360
tacaaggggc ttgacaagtt tccgggactt gctcctgctg atttccaccg gcagtgcggc    420
atcgattatt caaaacgaga ttcggtgcgg aactgttggc tcggaggcga cttgcccgat    480
ctggaccagt cccggccgag ggtacaggat gttcagagag cccacataag gaagctcctt    540
tccctcggca tagacggctt ccgcttcgat gcggctaaac acatcgaccc cattgttgtg    600
aaagactaca tcgatctcat cgacagggag agcaacggca ggacctggaa ctacctcgag    660
gtcatcgagg atgacggcac tcaggccacg gactacaact ggatagcggc agtgaccgat    720
ttcgtcctct acaaggagtc gttgaggaag gccttcagtc tcggcgggga cctgcgatcg    780
ctcaagatgc ctgtggctgt caatgattcg cggagtatcg tcttcgggag aaatcacgac    840
accgtgccgg agaataacca gaactgcatc gtcggctgct acgacagccg ggaggactcc    900
tatcttgcca cggcatacgt cctggcccgc gaatcgggag tcccgctggt cctcaactgg    960
gacaactacg acgcgcccta catcagcacc ggcgtgaagt tccgccagat catgacgcag   1020
cgaggacgat cggccatgaa cgtgaaggag aatgtgctgg gcgtcatcga cagtcctgtc   1080
gtcatgatga tggagcgcgg gagtgaaggc tttttcgtcc tcaacaagag cgccgaccgg   1140
ttcgatatcc cagttctgga tctgacactg accaatctcg agggatgtta tcgggagctg   1200
agaagaaaat tcaccgtcgc catcgagaga aagtacggta agaaatttgt cacccggtgg   1260
ggacgatggg accggggggg cctcgaaatc tacggccgcg acgctctcta cttcatacgg   1320
gaaccctggg agcagtgcag gtaa                                          1344
<210>76
<211>447
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号(SIGNAL)
<222>(1)...(24)
<400>76
Met Asn Arg Val Lys Arg Leu Ser Ile Leu Val Val Leu Phe Leu Thr
 1               5                  10                  15
Ala Phe Ile Pro Thr Val Phe Ala Gly Glu Gln Pro Leu Ala Ile Phe
            20                  25                  30
His Ala Phe Asn Asp Pro Phe Thr Leu Val Glu Ser Tyr Val Cys Glu
        35                  40                  45
Leu Ala Gly Gln Gly Tyr Ser His Val Gln Ile Ser Pro Ala Gln Lys
    50                  55                  60
Ser Asn Pro Ala Arg Ala Trp Tyr Ala Arg Tyr Gln Pro Val Asp Phe
65                  70                  75                  80
Thr Val Ile Glu Gly Met Gly Thr Glu Ser Asp Leu Arg Lys Leu Thr
                85                  90                  95
Asp Lys Ala His Ala Cys Gly Ile Lys Val Ile Ala Asp Val Val Phe
            100                 105                 110
Asn His Met Ser Ser Met Asp Glu Tyr Lys Gly Leu Asp Lys Phe Pro
        115                 120                 125
Gly Leu Ala Pro Ala Asp Phe His Arg Gln Cys Gly Ile Asp Tyr Ser
    130                 135                 140
Lys Arg Asp Ser Val Arg Asn Cys Trp Leu Gly Gly Asp Leu Pro Asp
145                 150                 155                 160
Leu Asp Gln Ser Arg Pro Arg Val Gln Asp Val Gln Arg Ala His Ile
                165                 170                 175
Arg Lys Leu Leu Ser Leu Gly Ile Asp Gly Phe Arg Phe Asp Ala Ala
            180                 185                 190
Lys His Ile Asp Pro Ile Val Val Lys Asp Tyr Ile Asp Leu Ile Asp
        195                 200                 205
Arg Glu Ser Asn Gly Arg Thr Trp Asn Tyr Leu Glu Val Ile Glu Asp
    210                 215                 220
Asp Gly Thr Gln Ala Thr Asp Tyr Asn Trp Ile Ala Ala Val Thr Asp
225                 230                 235                 240
Phe Val Leu Tyr Lys Glu Ser Leu Arg Lys Ala Phe Ser Leu Gly Gly
                245                 250                 255
Asp Leu Arg Ser Leu Lys Met Pro Val Ala Val Asn Asp Ser Arg Ser
            260                 265                 270
Ile Val Phe Gly Arg Asn His Asp Thr Val Pro Glu Asn Asn Gln Asn
        275                 280                 285
Cys Ile Val Gly Cys Tyr Asp Ser Arg Glu Asp Ser Tyr Leu Ala Thr
    290                 295                 300
Ala Tyr Val Leu Ala Arg Glu Ser Gly Val Pro Leu Val Leu Asn Trp
305                 310                 315                 320
Asp Asn Tyr Asp Ala Pro Tyr Ile Ser Thr Gly Val Lys Phe Arg Gln
                325                 330                 335
Ile Met Thr Gln Arg Gly Arg Ser Ala Met Asn Val Lys Glu Asn Val
            340                 345                 350
Leu Gly Val Ile Asp Ser Pro Val Val Met Met Met Glu Arg Gly Ser
        355                 360                 365
Glu Gly Phe Phe Val Leu Asn Lys Ser Ala Asp Arg Phe Asp Ile Pro
    370                 375                 380
Val Leu Asp Leu Thr Leu Thr Asn Leu Glu Gly Cys Tyr Arg Glu Leu
385                 390                 395                 400
Arg Arg Lys Phe Thr Val Ala Ile Glu Arg Lys Tyr Gly Lys Lys Phe
                405                 410                 415
Val Thr Arg Trp Gly Arg Trp Asp Arg Gly Gly Leu Glu Ile Tyr Gly
            420                 425                 430
Arg Asp Ala Leu Tyr Phe Ile Arg Glu Pro Trp Glu Gln Cys Arg
        435                 440                 445
<210>77
<211>1311
<212>DNA
<213>人工序列
<220>
<223>合成产生的多核苷酸
<400>77
atggccaagt acctggagct cgaagagggc ggggtcataa tgcaggcgtt ctactgggac     60
gtgccttcag gaggaatatg gtgggacaca atacggcaga agataccgga gtggtacgat    120
gccggaatct ccgcaatatg gattcctccc gcgagcaagg gtatgagcgg cggctattcg    180
atgggctacg acccctacga ttattttgac ctcggtgagt actaccagaa gggaacggtg    240
gaaacgaggt tcggctcaaa gcaggagctc ataaacatga taaacacggc ccatgcctac    300
ggcataaagg tcatagcgga catcgtcata aaccaccgcg caggcggaga cctcgagtgg    360
aacccgttcg ttggggacta cacctggacg gacttctcaa aggtggcctc gggcaaatat    420
actgccaact acctcgactt ccacccgaac gagctccatg cgggcgattc cggaacattt    480
ggaggctatc ccgacatatg ccacgacaag agctgggacc agtactggct ctgggccagc    540
caggagagct acgcggcata tctcaggagc atcggcatcg atgcctggcg ctttgactac    600
gtgaagggct acggagcgtg ggtcgtcaag gactggctca actggtgggg cggctgggcc    660
gttggcgagt actgggacac caacgttgat gcactcctca actgggccta ctcgagcggc    720
gccaaggtct tcgacttccc gctctactac aagatggacg cggcctttga caacaagaac    780
attcccgcac tcgtcgaggc cctcaagaac gggggcacag tcgtcagccg cgacccgttt    840
aaggccgtaa ccttcgttgc aaaccacgac accgatataa tctggaacaa gtatccagcc    900
tacgcgttca tcctcaccta cgagggccag ccgacaatat tctaccgcga ctacgaggag    960
tggctcaaca aggataagct caagaacctc atctggatac atgacaacct cgccggagga   1020
agcacgagca tagtttacta cgacagcgac gagatgatct tcgtgaggaa cggctatgga   1080
agcaagcctg gccttataac ttacatcaac ctcggctcga gcaaggttgg aaggtgggtt   1140
tatgtgccga agttcgcggg cgcgtgcatc cacgagtata ctggtaacct cggaggctgg   1200
gtagacaagt acgtctactc aagcggctgg gtctatctcg aagctccagc ttacgaccct   1260
gccaacgggc agtatggcta ctccgtgtgg agctactgcg gtgttgggtg a            1311
<210>78
<211>436
<212>PRT
<213>人工序列
<220>
<223>Synthetically generated polypeptide
<400>78
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
 1               5                  10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
        35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
    50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                 140
Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290                 295                 300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
            420                 425                 430
Cys Gly Val Gly
        435
<210>79
<211>1764
<212>DNA
<213>人工序列
<220>
<223>合成产生的多核苷酸
<400>79
cttactccag ctgagtggag gtctcagagc atctacttcc tcctcactga tcgcttcggc      60
aggaccgata actctactac cgctgcttgc gataccactg atagggttta ctgcggcggc     120
tcttggcagg gcatcatcaa ccacctggat tacatccagg gcatgggctt cactgctatc     180
tggatcactc cagtgactgg ccagttctac gagaacactg gcgatggcac ttcataccac     240
ggctactggc agcaggatat ctacgacctg aactacaact acggcactgc tcaggatctt     300
aagaacctgg cttctgctct tcacgagagg ggcatgtacc tgatggtgga tgtggtggct     360
aaccacatgg gctacgatgg cgctggcaac actgtggatt actccgtgtt caacccattc     420
agcagcagct cttacttcca cccgtactgc ctgatcagca actacgacaa ccagaccaac     480
gttgaggatt gctggcttgg cgatacaacc gtgtctctgc cagacctgga taccacttct     540
actgctgtga gggatatctg gtatgattgg gtggccgatc ttgtggctaa ctactctatc     600
gatggcctga gggtggacac tgttaagcac gtggagaagg atttctggcc agactacaac     660
tctgctgctg gcgtttactg tgttggggag gttttctctg gcgatccagc ttacacttgc     720
ccgtaccaga actacatgga tggcgtgctg aactacccaa tctactacca gctcctgtac     780
gctttcgagt caagctctgg ctctatcagc gacctgtaca acatgatcag cagcgtggct     840
tcttcttgca aggacccaac ccttcttggc aactttatcg agaaccacga caacccacgc     900
ttcgctagct acaccagcga ttactctcag gccaagaacg tgatcacctt catcttcctc     960
tcagacggca tcccaatcgt ttacgctggc caggagcagc attactctgg cggctctgat    1020
ccagctaacc gcgaggctac ttggctttct ggctactcta cctctgctac cctgtacact    1080
tggatcgcta gcactaacca gatccgctca ctggctatct ctaaggatgc tggctacgtc    1140
caggctaaga acaacccatt ctactccgac tctaacacca tcgctatgag gaagggcact    1200
actgctggcg ctcaggtgat cactgtgctg tctaacaagg gcgcttctgg ctcttcttac    1260
accctttctc tgtctggcac tggctactct gctggcgcta ctcttgtgga gacctacacc    1320
tgcaccactg tgaccgttga ttcttctggc aacctgccag tgccaatgac ttctggcctt    1380
ccaagggtgt tcgttccaag ctcttgggtt aacggctctg ctctgtgcaa cactgagtgc    1440
actgctgcta cttctctgcc agtgctgttc gaggagctgg tgactactac ttacggcgag    1500
aacatctacc ttagcggctc tatctctcag cttggctctt ggaacactgc ttctgctgtg    1560
gctctttctg ctagccagta caccagctct aacccaaagt ggtacgtgtc tgtgactctt    1620
ccagtgggca ctagcttcca gtacaagttt atcaagaagg gctctgacgg ctctgttgtt    1680
tgggagagcg acccaaacag gtcttacact gttccagctg gctgcgaggg cgctactgtt    1740
actgttgccg atacctggcg ctga                                           1764
<210>80
<211>1710
<212>DNA
<213>人工序列
<220>
<223>合成产生的多核苷酸
<400>80
gccgatacaa acgcttggaa gagccgctct atctacttcg tgctgaccga taggatcgct     60
aggaactctt ctgatactgg cggctctgct tgctctgatc ttggcaacta ctgcggcggc    120
actttccagg gccttgagag caagctggat tacatcaagg gccttggctt cgatgctatc    180
tggatcactc cagtggtgtc taacaaggct gctggctacc acggctactg ggctgaggat   240
ctgtacgctg tgaactctaa ctacggcact gctgctgatc tgaagtctct ggtggctgct   300
gctcacgcta agggcatcta catgatggtg gacgtggtgg ctaaccacat gggcccaggc   360
gctatcacta acaacaggcc agagccactt aaccaggctt caagctacca tccaccgtgc   420
aacatcgact acaacaacca gacttctgtg gaggtttgcc agatcgctgg ccttccagat   480
atctacacca ccaagagcga gatcaggact ctgctgaaca cttgggtgaa ctggcttgtg   540
aacgagtact ctttcgatgg cgtcaggatc gataccgtta agcacgtgga gaaggatttc   600
tggccaggct tctctgctgc tactggcgtt tacaacatcg gcgaggtgtt cgatggcgat   660
ccagcttacc ttgctccata cgccaagctg atgccaggcc ttcttaacta cgccgtgtac   720
tacccgatga acaacttcta ccagcagact ggctcttctc aggctctggt ggacatgatg   780
aacaccgtgt ccaacacttt cccagatccc tctgctcttg gcaccttcct ggacaaccac   840
gataacaagc ggtggctgaa cgtgaagaac gatcagaccc tgctgaagaa cgctctggct   900
tacgttatcc ttgctagggg catcccaatc ctttactacg gcacagagca gggctacgct   960
ggcggcgatg atccagctaa ccgcgaggat ctttggcgct ctggcttcaa cactaacgcc  1020
aacctgtacc aggctatcaa gaagctgact gctgctaggc aggctgctgg cggccttgct  1080
ggcaacgatc acgtccacct gtacgtggct gatactgctt acgcttggtc tagggctaac  1140
ggcaacctga tcgtgcttac tactaacgct ggcggcaact ctaacactca gcactgcttc  1200
aacacccaga aggctaacgg ccgctggact aacgtttacg gcaacggcgc tactgtttct  1260
gctgatagca acggccaaat ctgcgtgtct gttactaacg gcgagccagt ggttcttctt  1320
gctggctctg ctactccaac tactggcacc accctgtcta ctaggactgc taccgctact  1380
gctacaccaa ctgcttgccc aaccgctgtg tctgtgtctt tcacccacag ggtgacaact  1440
gttccaggcg acacgatcaa gatcactggc aacactgccc agcttggcaa ctggactcca  1500
gctaacggcc ttgctctttc tgctgctagc tacaccagct ctaacccaat ctggaccatc  1560
actgtgccac ttgctgctgg ctctagcatc agctacaagt tcgtgaagat cgattctggc  1620
ggcactgtta cttgggagag cgacccaaac aggtcttaca ctgctccatc ttgccaggct  1680
tcagctagcg ttaacagcag ctggcagtaa                                   1710
<210>81
<211>1851
<212>DNA
<213>人工序列
<220>
<223>合成产生的多核苷酸
<400>81
gaggctgctc cacagcttgc tccaagggct actacctctc tggatgcttg gcttgcttct   60
gagaccactg ttgctctgga tgggattctt gataatgttg gctcttctgg cgcttacgct  120
aagtctgcta agtcaggcat cgtgatcgct tctccatcta ccgacaaccc ggactactac  180
tacacttgga ccagggatgc tgctcttact gtgaaggccc tgatcgatct tttcaggaac  240
ggcgagacct ctcttcagac tgtgatcatg gagtacatca gctctcaggc ttacctccag  300
actgtgtcta acccatctgg ctcactttct actggcggcc ttgccgagcc aaagtactac  360
gtggatgaga ctgcttacac tggctcttgg ggcaggccac agagggatgg cccagctctt  420
agggctactg ccatgatcga tttcggcaac tggcttatcg ataacggcta ctctacctac     480
gctagcaaca ttgtgtggcc aattgtgagg aacgatctgt cttacgtggc tcagtactgg     540
aaccagactg gctacgatct ttgggaggag gttaacggct ctagcttctt cactatcgcc     600
gttcagcaca gggctcttgt tgagggctct accttcgctt ctaaggttgg ggcttcttgc     660
tcttggtgcg attctcaggc tccacaggtt ctgtgcttcc ttcagaggtt ctggactggc     720
tcttacatca tggctaactt cggcggcggc cgctctggca aggacgctaa cactgtgctg     780
ggctctatcc acactttcga tccaaacgct ggctgcgacg atacaacttt ccagccatgc     840
tctccaaggg ctctggctaa ccacaaggtg tacaccgata gcttccgctc tatctactct     900
atcaacagcg gcatctctca gggcaaggct gttgctgttg gccgctaccc agaggattct     960
tactacaacg gcaacccgtg gttccttact actcttgctg ctgccgagca gctttacgat    1020
gctatctacc agtggcagaa gatcggctct atcaccatca ctgacgtgtc tctggccttc    1080
ttcaaggacc tgtactcttc tgctgctgtt ggcacctacg cttctagctc ttctgccttc    1140
acctctatcg tgaacgccgt taagacttac gctgacggct acatgtctat cgttcagacc    1200
cacgctatga ctaacggctc tctgtctgag cagttcggca agtctgatgg cttctctctg    1260
tctgctaggg atctgacttg gtcttacgct gctctgctga ctgctaacct taggcgcaac    1320
tctgttgttc caccatcttg gggcgagact actgctactt ctgtgccatc tgtgtgctct    1380
gctacttcag ctaccggcac ctactctacc gctactaaca ctgcttggcc atctactctg    1440
acatctggca ctggcgctac cactactacc tctaaggcta cctctaccac cactaccagc    1500
tctgcttcta ctactactgc tggctgcgtt gttccaactg ctgtggctgt gaccttcgac    1560
gagatcgcta ctactactta cggcgagaac gtgtacgttg tgggctctat ctctcagctt    1620
ggcagctggg atacttctaa ggctgtggcc ctgtctgctt ctaagtacac cagcagcaac    1680
aacctttggt acgctaccgt tactcttcca gctggcacca ctttccagta caagtttatc    1740
agggtgtcat cttcaggcac tgtgacctgg gagtctgatc caaacaggtc ttacaccgtg    1800
ccatctgctt gcggcacttc tactgctgtg gtgaacacca cttggcgcta a             1851
<210>82
<211>1860
<212>DNA
<213>人工序列
<220>
<223>合成产生的多核苷酸
<400>82
gccccacagc tttctccaag ggctaccacc tctcttgatg cttggctggc ttctgagacc     60
actgttagcc tgaacgggat tcttgataat atcggcgctt caggcgctta cgctcagtct    120
gctaaggctg gcgttgttat cgctagccca agcacctcta gcccagacta ctactacacc    180
tggaccaggg attctgctct gacccttaag gtgctgatcg accttttcag gaacggcaac    240
gttgatcttc agaccgtgat cgaggagtac atcactgctc aggcttacct tcagactgtg    300
agcaacccat ctggcgatct ttcttcaggc gctggccttg ccgagccaaa gttcaacgtg    360
gacatgtctg cttacactgg cgcttggggc aggccacaga gggatggccc agctcttagg    420
gctatcgccc ttatcgattt cggcaactgg cttatcgata acggctactc tagctacgct    480
gtgtctaatg tgtggccaat tgtgaggaac gatctgtctt acgtggctca gtactggtct    540
cagtctggct acgatctttg ggaggaggtg aacagcatgt ctttcttcac catcgctaac     600
cagcacaggg ctcttgttga gggctctact ttcgctggca gagttggcgc ttcttgctct     660
tggtgcgatt ctcaggctcc acagatcctt tgctacatgc agaatttctg gaccggctct     720
tacatcaacg ctaacactgg cggcggccgc tctggcaagg atgctaacac cgtgctggct     780
agcatctcta ctttcgaccc agaggctact tgcgatgatg tgaccttcca gccatgctct     840
tctagggctc tggctaacca caaggtgtac accgattctt tccgctctgt gtactctctt     900
gactctggga tcgctgaggg cgttgctgtt gctgttggcc gctacccaga ggattcttac     960
tacaacggca acccgtggtt ccttactact cttgctgctg ccgagcagct ttacgacgct    1020
atctaccagt ggaacaagat cggctctatc accatcacct ctacctcact ggctttcttc    1080
aacgacgtgt actcttctgc tgctgttggc acttacgctt caggctctac cgcttacact    1140
gctatcgtgt ccgctgttaa gacttacgct gacggctacg tgtctatcgt tcaggctcac    1200
gctatgacta acggctctct gtctgagcag ttcgataagg cttctggcac tcagctttct    1260
gctagggatc tgacctggtc ttacgctgct ctgctgactg ctaacatgag gcgcaacggc    1320
atcgttccac catcttgggg cgctgcttca gctaactcta tcccaagctc ttgctctact    1380
ggctctgcta ctggcactta ctctacccca actggcactt cttggccatc tactctgact    1440
tcaggcactg ctggcaccac tactacctct gctaccacca ccacctctac tagcgtgtct    1500
aagaccacca ccactaccac ttctactacc agctgcacca ctccaacttc agtggctgtg    1560
accttcgatg agatcgctac cacttactac ggcgagaacg tgtacatcag cggctctatc    1620
tctcagcttg gcagctggga tacttcttct gccatcgccc tttctgcttc tcagtacacc    1680
agcagcaaca acctgtggtt cgtgaccatc aaccttccag ctggcactac tttccagtac    1740
aagtatatca ggaaggagtc tgacggctct atcgtttggg agagcgaccc aaacaggtct    1800
tacactgtgc catctggctg cggcgtttct actgctaccg agagcgatac ttggcgctaa    1860
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用