会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 杀虫毒素 / 新的杀虫毒素

新的杀虫毒素

申请号 CN02807409.2 申请日 2002-04-01 公开(公告)号 CN1527663A 公开(公告)日 2004-09-08
申请人 辛根塔参与股份公司; 发明人 P·迈尔斯; V·克拉默; 沈志诚; F·肖特科斯基; G·W·沃伦;
摘要 本发明公开了一种高度抗广谱鳞翅目昆虫害虫的新的杀虫毒素。可以利用编码该杀虫毒素的DNA转化各种原核生物和真核生物以表达所述杀虫毒素。还可以在各种环境中利用这些重组生物体控制鳞翅目昆虫。
权利要求

1.一种具有抗昆虫活性的分离的毒素,其中所述毒素包含:

(a)与SEQ ID NO:2有至少91%序列同一性的氨基酸序列; 或(b)通过包含与SEQ ID NO:1有至少92%序列同一性的核 苷酸序列的核酸分子表达产生的氨基酸序列。

2.如权利要求1所述的分离的毒素,其中所述毒素包含与SEQ ID NO:2中所示氨基酸序列有至少95%同一性的氨基酸序列。

3.如权利要求1所述的分离的毒素,其中所述毒素包含与SEQ ID NO:2中所示氨基酸序列有至少99%同一性的氨基酸序列。

4.如权利要求1所述的分离的毒素,其中所述毒素包含SEQ ID NO: 2中所示氨基酸序列。

5.如权利要求1所述的分离的毒素,其中所述毒素是通过核酸分 子的表达产生的,所述核酸分子包含与SEQ ID NO:1有至少95%序 列同一性的核苷酸序列。

6.如权利要求1所述的分离的毒素,其中所述毒素是通过核酸分 子的表达产生的,所述核酸分子包含与SEQ ID NO:1有至少99%序 列同一性的核苷酸序列。

7.如权利要求1所述的分离的毒素,其中所述毒素是通过核酸分 子的表达产生的,所述核酸分子包含含有SEQ ID NO:1核苷酸1- 2364或SEQ ID NO:3核苷酸1-2364的核苷酸序列。

8.如权利要求7所述的分离的毒素,其中所述毒素是通过核酸分 子的表达产生的,所述核酸分子包含含有SEQ ID NO:1核苷酸1- 2364的核苷酸序列。

9.如权利要求7所述的分离的毒素,其中所述毒素是通过核酸分 子的表达产生的,所述核酸分子包含含有SEQ ID NO:3核苷酸1- 2364的核苷酸序列。

10.如权利要求1所述的分离的毒素,其中所述毒素是通过表达包 含pNOV1325(ATCC PTA-3868)中所含的约2.4kbDNA片段的核苷酸序列 而产生的。

11.如权利要求1所述的分离的毒素,其中所述毒素是通过表达包 含pNOV1328(ATCC PTA-3869)中所含的约2.4kbDNA片段的核苷酸序列 而产生的。

12.如权利要求1所述的分离的毒素,其中所述昆虫是鳞翅目昆 虫。

13.如权利要求12所述的分离的毒素,其中所述鳞翅目昆虫选自: 欧洲玉米螟(Ostrinia nubilalis),小菜蛾(Plutella xylostella), 秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷 实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾 (Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉 铃虫(Helicoverpa armigera),烟草天蛾(Manduca Sexta),粉斑 夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和 向日葵细卷叶蛾(Cochylis hospes)。

14.包含有效控制昆虫量的权利要求1所述毒素的组合物。

15.控制昆虫的方法,包括向昆虫递送有效量的权利要求1所述毒 素。

16.如权利要求15所述的方法,其中所述昆虫是鳞翅目昆虫。

17.如权利要求16所述的方法,其中所述鳞翅目昆虫选自:欧洲 玉米螟(Ostrinia nubilalis),小菜蛾(Plutella xylostella),秋 粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实 夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾 (Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉 铃虫(Helicoverpa armigera),烟草天蛾(Manduca Sexta),粉斑 夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和 向日葵细卷叶蛾(Cochylis hospes)。

18.如权利要求15所述的方法,其中向昆虫口服递送所述的毒素。

19.包含编码具有抗昆虫活性之毒素的核苷酸序列的分离核酸分 子,其中所述核苷酸序列:(a)与SEQ ID NO:1有至少92%序列同一性;或

(b)与(a)的核苷酸序列属同类编码的;或

(c)编码与SEQ ID NO:2有至少91%序列同一性的氨基酸 序列。

20.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 与SEQ ID NO:1中所示核苷酸序列有至少92%序列同一性。

21.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 与SEQ ID NO:1中所示核苷酸序列有至少95%序列同一性。

22.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 与SEQ ID NO:1中所示核苷酸序列有至少99%序列同一性。

23.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 包含SEQ ID NO:1中核苷酸1-2364。

24.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 与同SEQ ID NO:1有至少92%序列同一性的核苷酸序列属同类编码。

25.如权利要求24所述的分离的核酸分子,其中所述核苷酸序列 包含SEQ ID NO:3的核苷酸1-2364。

26.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 编码与SEQ ID NO:2有至少91%序列同一性的氨基酸序列。

27.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 编码与SEQ ID NO:2有至少95%序列同一性的氨基酸序列。

28.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 编码与SEQ ID NO:2有至少99%序列同一性的氨基酸序列。

29.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 编码SEQ ID NO:2中所示氨基酸序列。

30.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 包含pNOV1325(ATCC PTA-3868)中所含的约2.4kb DNA片段。

31.如权利要求19所述的分离的核酸分子,其中所述核苷酸序列 包含pNOV1328(ATCC PTA-3869)中所含的约2.4kb DNA片段。

32.如权利要求19所述的分离的核酸分子,其中所述毒素具有抗 鳞翅目昆虫的活性。

33.如权利要求32所述的分离的核酸分子,其中所述鳞翅目昆虫 选自:欧洲玉米螟(Ostrinia nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫(Helicoverpa armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和向日葵细卷叶蛾(Cochylis hospes)。

34.包含可操作地连接了权利要求19所述核酸分子的异源启动子 序列的嵌合基因。

35.包含权利要求34所述嵌合基因的重组载体。

36.包含权利要求34所述嵌合基因的转基因宿主细胞。

37.包含权利要求34所述嵌合基因的动物病毒。

38.包含权利要求34所述嵌合基因的植物病毒。

39.如权利要求36所述的转基因宿主细胞,其是细菌细胞。

40.如权利要求36所述的转基因宿主细胞,其是酵母细胞。

41.如权利要求36所述的转基因宿主细胞,其是植物细胞。

42.包含权利要求41所述转基因植物细胞的转基因植物。

43.如权利要求42所述的转基因植物,其中所述植物选自:高粱, 小麦,向日葵,番茄,甘蓝作物,棉花,水稻,大豆,甜菜,甘蔗, 烟草,大麦,油籽油菜和玉米。

44.如权利要求43所述的转基因植物,其中所述植物是玉米植物。

45.来源于权利要求42所述转基因植物的转基因种子。

46.来源于权利要求44所述玉米植物的转基因种子。

47.生产具有抗昆虫活性的毒素的方法,包括:

(a)获得权利要求36所述转基因宿主细胞;和

(b)在所述细胞中表达核酸分子,产生至少一种具有抗昆虫活 性的毒素。

48.生产抗昆虫的转基因植物的方法,包括:将权利要求1 9所述 核酸分子引入所述转基因植物中,其中所述核酸分子可在所述转基因 植物中以控制昆虫的有效量表达。

49.如权利要求48所述的方法,其中所述昆虫是鳞翅目昆虫。

50.如权利要求49所述的方法,其中所述鳞翅目昆虫选自:欧洲 玉米螟(Ostrinia nubilalis),小菜蛾(Plutella xylostella),秋 粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon)),谷实 夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾 (Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉 铃虫(Helicoverpa armigera),烟草天蛾(Manduca sexta),粉斑 夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和 向日葵细卷叶蛾(Cochylis hospes)。

说明书全文

技术领域

本发明涉及来源于苏云金芽孢杆菌(Bacillus thuringiensis) 的新的Vip3毒素,其表达引起所述毒素的核酸序列,制备该毒素的 方法,及利用该毒素和相应的核酸序列控制昆虫的方法。

背景技术

植物害虫是世界重要农作物损失的主要因素。仅在美国,每年由 非哺乳动物害虫包括昆虫的侵染就损失约80亿美元。除了农田作物 损失外,昆虫害虫对于蔬菜和水果种植者,对于观赏花卉的生产者, 和对于家宅园丁也是负担。
目前主要通过化学杀虫剂的广泛应用来控制昆虫害虫,该化学杀 虫剂可积极抑制昆虫生长、妨碍昆虫进食或繁殖的方面,或引起死亡。 因此可以达到良好的昆虫控制,但是这些化学药品有时也影响其它有 益昆虫。化学杀虫剂的广泛应用所引起的另一问题是抗药性昆虫品种 出现。通过各种抗药性处理实践已经部分缓解了这种现象,但是对可 替代的控制害虫的药剂存在日益增加的需要。生物害虫控制药剂,如 表达杀虫毒素象δ-内毒素的苏云金芽孢杆菌(Bacillus thuringiensis)株系也已经施用于农作物,并且具有满意的结果, 这为化学杀虫剂提供了可替代物或补充物。已经分离了编码这些δ- 内毒素的一些基因,并已证实它们在异源宿主中的表达提供了用于经 济重要昆虫害虫控制的另一种工具。特别地,转基因植物中杀虫毒素 如苏云金芽孢杆菌(Bacillus thuringiensis)δ-内毒素的表达提 供了免受所针对的昆虫害虫侵害的有效保护,并且表达这种毒素的转 基因植物已经商品化,使得农民能够减少化学昆虫控制药剂的施用。
现在已经鉴定了其它非内毒素基因和它们编码的蛋白质。美国专 利5,877,012,6,107,279,6,137,033和6,291,156,及Estruch等 (1996,Proc.Natl.Acad.Sci.93:5389-5394)和Yu等(1997,Appl. Environ.Microbiol.63:532-536)描述了称为Vip3的新一类杀虫 蛋白质,这里并入所有这些文献为参考文献。Vip3编码序列编码芽 孢杆菌(Bacillus)营养生长阶段期间产生和分泌的约88kDa蛋白质 (营养杀虫蛋白质,VIP)。Vip3A蛋白质具有抗广谱鳞翅目害虫, 包括但不限于小地老虎(BCW,Agrotis ipsilon),草地粘虫(FAW, Spodoptera frugiperda),烟蚜夜蛾(TBW,Heliothis Virescens), 和谷实夜蛾(CEW,Helicoverpa zea)的杀虫活性。最近,已经发现表 达Vip3A蛋白质的植物抗半翅目昆虫害虫引起的进食损害。因此 Vip3A蛋白质显示了独特的杀虫活性谱。其它的专利公开WO 98/18932, WO 98/33991,WO 98/00546,和WO 99/57282现在也已经鉴定了Vip3A 类蛋白质的同源物。
化学和生物控制方法的连续应用增加了昆虫发展对这种控制方 法抗药性的机会。而且,用目前的方法仅仅可控制几种特定的昆虫害 虫。
因此,需要开发出能为农民提供经济利益,并且是环境可接受的 新的和有效的害虫控制药剂。特别需要的是靶向较广谱的经济重要昆 虫害虫和能有效控制对现存昆虫控制药剂有抗药性或可能产生抗药 性的昆虫株系的控制药剂。而且,也期望获得其施用对环境的影响降 至最小的药剂。
发明概述
本发明通过提供新的基因和毒素而致力于解决新的害虫控制药 剂的需要,所述新的基因和毒素不同于美国专利5,877,012, 6,107,279,和6,137,033,Estruch等(1996),Yu等(1997)及WO 98/18932,WO 98/33991,WO 99/57282,和WO 98/00546所公开的基 因和毒素。
本发明提供了控制植物害虫的组合物和方法。特别地,提供了从 苏云金芽孢杆菌(Bacillus Thuringiensis)分离的新vip3核酸序 列,基本与其相同的序列,所述序列的表达引起了对经济重要昆虫害 虫,特别是侵染植物的昆虫害虫具有高度特异毒性的杀虫毒性。本发 明进一步涉及由所述核酸序列表达产生的新的杀虫毒素,含有该杀虫 毒素的组合物和制剂,它们能抑制昆虫害虫存活、生长和繁殖的能力, 或能限制与昆虫有关的农作物损害或损失。本发明也涉及例如在制备 具有更强杀虫活性的杂合毒素中或在重组基因方法如DNA改组中利 用该核酸序列的方法。本发明进一步涉及制备该毒素的方法,例如在 微生物中利用该核酸序列控制昆虫的方法,或在转基因植物中利用该 核酸序列提供免受昆虫损害的保护作用的方法,涉及利用杀虫毒素和 包含该杀虫毒素的组合物和制剂的方法,例如向昆虫侵染的区域或预 防处理昆虫易侵染的区域或植物施用杀虫毒素或组合物或制剂以提 供免受昆虫害虫侵害的保护。
这里所述新的杀虫毒素抗昆虫的活性很高。例如,通过杀虫毒素 可以控制大量经济重要昆虫害虫,如鳞翅目欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),西南玉米螟(Diatraea grandiosella),蔗螟(Diatraea saccharalis),地中海玉米螟(Sesanlia nonagroides),细点突夜 蛾(Helicoverpa punctigera)和棉铃虫(Helicoverpa Armigera)。 所述杀虫毒素可以单独使用或与其它昆虫控制策略联合使用,以提供 具有最大害虫控制效力,同时将对环境的影响降至最小。
根据一个方面,本发明提供了包含编码毒素的核苷酸序列的分离 的核酸分子,所述毒素具有抗昆虫活性,其中所述核苷酸序列:(a) 与SEQ ID NO:1有至少92%序列同一性;或(b)与(a)的核苷酸序列 属同类编码(isocoding);或(c)编码与SEQ ID NO:3有至少91% 序列同一性的氨基酸序列。
在该方面一个实施方式中,分离的核酸分子包含与SEQ ID NO:1 有至少92%序列同一性的核苷酸序列。
在该方面的另一个实施方式中,分离的核酸分子包含与同SEQ ID NO:1有至少92%序列同一性的核苷酸序列属同类编码的核苷酸序 列。
在进一步实施方式中,分离的核酸分子包含SEQ ID NO:1或SEQ ID NO:3所示的核苷酸序列。
在该方面另一个实施方式中,分离的核酸分子包含编码与SEQ ID NO:2有至少91%序列同一性的氨基酸序列的核苷酸序列。在进一步 实施方式中,分离的核酸分子包含编码SEQ ID NO:3中所示氨基酸 序列的核苷酸序列。
在一个实施方式中,分离的核酸分子包含大肠杆菌(E.coli)株 系DH5α中含有的pNOV1325(命名为ATCC PTA-3868)所含的约2.4kb DNA片段。在另一个实施方式中,分离的核酸分子包含大肠杆菌 (E.coli)株系DH5α中含有的pNOV1328(命名为ATCC PTA-3869) 中所含的约2.4kb DNA片段。
根据本发明的一个实施方式,分离的核酸分子编码具抗鳞翅目昆 虫活性的毒素。在进一步实施方式中,鳞翅目昆虫选自:欧洲玉米螟 (Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫 (Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾 (Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾 (Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉 铃虫(Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑 夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和 向日葵细卷叶蛾(Cochylis hospes)。
本发明也提供了嵌合基因,其包含与本发明核酸分子可操作地连 接的异源启动子序列。进一步,本发明提供了包含这种嵌合基因的重 组载体。本发明也提供了包含这种嵌合基因的病毒。本发明该方面的 病毒可以是动物病毒或植物病毒。进一步,本发明提供了包含这种嵌 合基因的转基因宿主细胞。本发明该方面的转基因宿主细胞可以是动 物细胞,细菌细胞,酵母细胞或植物细胞,优选植物细胞。更进一步, 本发明提供了包含这种植物细胞的转基因植物。本发明该方面的转基 因植物可以是高梁,小麦,向日葵,番茄,甘蓝作物,棉花,水稻, 大豆,甜菜,甘蔗,烟草,大麦,油籽油菜或玉米,优选玉米。进一 步,本发明提供了来自转基因植物的种子,所述转基因植物包括:高 梁,小麦,向日葵,番茄,甘蓝作物,棉花,水稻,大豆,甜菜,甘 蔗,烟草,大麦,油籽油菜和玉米。在优选实施方式中,种子来自于 转基因玉米植物。
本发明也提供了进一步包含编码第二杀虫素的第二核酸序列或 核酸序列组的转基因植物。特别优选的第二核酸序列是编码δ-内毒 素的核酸序列,编码其它营养杀虫蛋白质毒素的核酸序列或编码用于 非蛋白质杀虫素产生途径的核酸序列。
根据一个方面,本发明提供了具有抗昆虫活性的分离的毒素,其 中毒素包含一氨基酸序列,该氨基酸序列:(a)与SEQ ID NO:2有 至少91%序列同一性;或(b)是通过包含与SEQ ID NO:1有至少92 %序列同一性的核苷酸序列的核酸分子的表达产生的。
在该方面一个实施方式中,分离的毒素包含与SEQ ID NO:2有至 少91%序列同一性的氨基酸序列。
在进一步实施方式中,分离的毒素包含SEQ ID NO:2中所示的氨 基酸序列。
在该方面另一实施方式中,该分离的毒素是通过包含与SEQ ID NO:1有至少92%序列同一性的核苷酸序列的核酸分子的表达产生 的。
在又一实施方式中,该分离的毒素是通过包含SEQ ID NO:1或SEQ ID NO:3中所示核苷酸序列的核酸分子的表达产生的。
在另一实施方式中,本发明毒素具有抗鳞翅目昆虫活性。在进一 步实施方式中,毒素具有抗如下昆虫的活性:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫 (Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾 (Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和向日 葵细卷叶蛾(Cochylis hospes)。
在进一步实施方式中,所述毒素是由保藏为ATCC保藏号 PPTA-3868的大肠杆菌(E.coli)株系或保藏为ATCC保藏号 PPTA-3869的大肠杆菌(E.coli)株系产生的。
本发明也提供了包含控制昆虫有效量的本发明内毒素的组合物。
在另一方面,本发明提供了生产具有抗昆虫毒素活性的方法,包 括(a)获得包含嵌合基因的转基因宿主细胞,所述嵌合基因本身包 含与本发明核酸分子可操作地连接的异源启动子序列;和(b)在转 基因细胞中表达该核酸分子,产生了至少一种具有抗昆虫活性的毒 素。
在进一步方面,本发明提供了生产抗昆虫转基因植物的方法,包 括向转基因植物中引入本发明的核酸分子,其中核酸分子可以在转基 因植物中以控制昆虫的有效量表达。根据一个实施方式,昆虫是鳞翅 目昆虫。在进一步实施方式中,鳞翅目昆虫选自:欧洲玉米螟 (Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫 (Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾 (Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾 (Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉 铃虫(Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑 夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和 向日葵细卷叶蛾(Cochylis hospes)。
在进一步方面,本发明提供了控制昆虫的方法,包括向昆虫递送 有效量的本发明毒素。根据一个实施方式,昆虫是鳞翅目昆虫。在进 一步实施方式中,鳞翅目昆虫选自:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫 (Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾 (Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和向日 葵细卷叶蛾(Cochylis hospes)。在另一实施方式中,口服递送给昆 虫毒素。在进一步实施方式中,所述毒素是通过包含表达本发明毒素 的核酸序列的转基因植物口服递送的。
本发明也提供了具有抗昆虫活性的杂合毒素,其中杂合毒素是由 包含本发明核苷酸序列的核酸分子编码的。
在一个实施方式中,本发明的杂合毒素具有抗鳞翅目昆虫活性。 在进一步实施方式中,鳞翅目昆虫选自欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫 (Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾 (Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和向日 葵细卷叶蛾(Cochylis hospes)。
在另一实施方式中,杂合毒素由SEQ ID NO:6中所述核苷酸序 列编码。
本发明也提供了包含杀虫有效量的本发明杂合毒素的组合物。
在另一方面,本发明提供了生产具有抗昆虫活性的杂合毒素的方 法,包括(a)获得包含嵌合基因的转基因宿主细胞,所述嵌合基因 本身包含与本发明核酸分子可操作地连接的异源启动子序列;和(b) 在转基因细胞中表达该核酸分子,这产生了至少一种具有抗昆虫活性 的杂合毒素。
在进一步方面,本发明提供了生产抗昆虫转基因植物的方法,包 括向转基因植物中引入本发明的核酸分子,其中所述核酸分子编码杂 合毒素,并且该杂合毒素可以在转基因植物中以控制昆虫的有效量表 达。根据一个实施方式,昆虫是鳞翅目昆虫。在另一实施方式中,鳞 翅目昆虫选自:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),棉红铃虫(Pectinophora gossypiella),粉斑夜蛾(Trichoplusia ni),向日葵细卷叶蛾 (Cochylis hospes)和向日葵head moth(Homoeosoma electellum)。
在另一个方面,本发明提供了控制昆虫的方法,包括给昆虫递送 有效量的本发明杂合毒素。根据一个实施方式,昆虫是鳞翅目昆虫。 在优选实施方式中,鳞翅目昆虫选自:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),棉红铃虫(Pectinophora gossypiella),粉斑夜蛾 (Trichoplusia ni),向日葵细卷叶蛾(Cochylis hospes)和向日葵 head moth(Homoeosoma electellum)。在另一实施方式中,杂合毒 素经口服递送给昆虫。在进一步实施方式中,通过转基因植物向昆虫 口服递送杂合毒素,所述转基因植物包含表达本发明杂合毒素的核酸 序列。
本发明也提供了具有抗昆虫活性的杂合毒素,其中从包含Vip3 毒素的羧基末端区域以及按氨基到羧基的方向与之连接的不同Vip3 毒素的氨基末端区域,其中羧基末端区域包含与SEQ ID NO:2氨基 酸579-787有至少75%同一性的氨基酸序列;氨基末端区域与SEQ ID NO:4氨基酸1-578有至少75%同一性。在进一步实施方式中,羧基 末端区域包含SEQ ID NO:2氨基酸578-787,氨基末端区域包含SEQ ID NO:5氨基酸1-579。在进一步实施方式中,杂合毒素包含SEQ ID NO:7氨基酸1-787。
根据本发明该方面的杂合毒素是具有抗鳞翅目昆虫活性的。在进 一步实施方式中,鳞翅目昆虫选自:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodop tera exigua),棉红铃虫(Pectinophora gossypiella),粉斑夜蛾 (Trichoplusia ni),向日葵细卷叶蛾(Cochylis hospes)和向日葵 head moth(Homoeosoma electellum)。
本发明该方面还包括包含编码该方面的杂合毒素的核苷酸序列 的核酸分子。
本发明也提供了控制昆虫的方法,其中转基因植物进一步包含编 码第二杀虫要素的第二核酸序列或核酸序列组。特别优选的第二核酸 序列是编码δ-内毒素的核酸序列,编码另外的营养杀虫蛋白质毒素 的核酸序列或编码用于非蛋白质性杀虫要素产生途径的核酸序列。
然而,本发明另一方面提供了突变本发明核酸分子的方法,其中 所述核酸分子已被切割为期望大小的双链随机片段库,该方法包括: (a)向双链随机片段库中加入一种或多种单链或双链寡核苷酸,其 中每种寡核苷酸包含与双链模板多核苷酸具有同一性的区域和具有 异源性的区域;(b)将由此得到的双链随机片段和寡核苷酸的混合 物变性为单链片段;(c)在引起单链片段在具有同一性的区域退火 的条件下,温育由此得到的单链片段库和聚合酶,以形成成对的退火 片段,同一性区域足以使配对的一个成员引发另一成员的复制,由此 形成突变的双链多核苷酸;和(d)重复第二和第三步骤至少另两轮 循环,其中在下一轮循环第二步骤中得到的混合物包含从前一轮第三 步骤得到的突变的双链多核苷酸,并且下一轮循环形成了进一步突变 的双链多核苷酸。
通过本发明下面的描述和非限制性实施例的学习,本发明的其它 方面和优点对于本领域技术人员将变得显而易见。
序列表中序列的简要说明
SEQ ID NO:1是天然vip3B基因的编码序列。
SEQ ID NO:2是SEQ ID NO:1.编码的氨基酸序列。
SEQ ID NO:3是玉米优化的vip3B基因的编码序列。
SEQ ID NO:4是天然vip3A基因的编码序列。
SEQ ID NO:5是SEQ ID NO:4.编码的氨基酸序列。
SEQ ID NO:6是杂合vip3A-B基因的编码序列。
SEQ ID NO:7是SEQ ID NO:6.编码的氨基酸序列。
SEQ ID NO:8-13是用在本发明中的引物。
保藏
根据国际承认用于专利程序目的的微生物保藏布达佩斯条约,下 面材料保藏在美国典型培养物中心(ATCC),10801 University Blvd., Manassas,VA。一旦授予专利权,将不可撤销地解除对保藏材料获得 的所有限制。
克隆       保藏号              保藏日期
pNOV1325    ATCC No.PTA-3868     2001年11月16日
pNOV1328    ATCC No.PTA-3869     2001年11月16日
定义
本发明毒素的“活性”意指毒素起具口服活性的昆虫控制药剂的 作用,有毒性作用,或者能破坏或阻止可能引起或不引起昆虫死亡的 昆虫进食。当将本发明毒素递送给昆虫时,结果通常是昆虫死亡,或 昆虫不以产生昆虫可得到毒素的资源为食。
“相关联”/“可操作地连接”指两个物理或功能相关的核酸序 列。例如,如果启动子或调节DNA序列和编码RNA或蛋白质的DNA序 列可操作地连接或定位以至于调节DNA序列将影响编码或结构DNA序 列的表达水平,那么称启动子或调节DNA序列与编码RNA或蛋白质的 DNA序列“相关”。
“嵌合基因”是重组核酸序列,其中启动子或调节核酸序列可操 作地连接编码mRNA或作为蛋白质表达的核酸序列,或与之相关联, 这样调节核酸序列能调节相关联核酸序列的转录或表达。如自然界中 所发现的,嵌合基因的调节核酸序列通常情况下并不是可操作地与相 关联的核酸序列连接。
“编码序列”是转录为RNA如mRNA,rRNA,tRNA,snRNA,有义 RNA或反义RNA的核酸序列。优选地,RNA随后在生物体中翻译以产 生蛋白质。
“控制”昆虫意指通过有毒作用抑制昆虫害虫存活、生长、进食 和/或繁殖的能力,或意指限制农作物中昆虫相关的损害或损失。尽 管“控制”昆虫优选意指杀死昆虫,但是“控制”昆虫也可以是指不 杀死昆虫。
“递送”毒素意指毒素与昆虫接触,引起有毒作用和昆虫的控制。 可以用许多公认的方法递送毒素,例如通过昆虫摄食口服或通过转基 因植物表达,制成的蛋白质组合物,可喷射的蛋白质组合物,食饵基 质,或任何其它本领域公认的毒素递送系统而与昆虫接触。
“有效的昆虫控制量”意指通过有毒作用抑制昆虫存活,生长, 进食和/或繁殖能力或者限制农作物中昆虫相关的损害或损失的毒素 浓度。尽管“有效昆虫控制量”优选意指杀死昆虫,但是“有效的昆 虫控制量”也可以指不杀死昆虫。
这里所用的“表达盒”意指能引导适合宿主细胞中特定核苷酸序 列表达的核酸序列,包含与目的核苷酸序列可操作地连接的启动子, 所述目的核苷酸序列可操作地连接终止信号。通常,它也包含该核苷 酸序列正确翻译所需的序列。包含目的核苷酸序列的表达盒可以是嵌 合的,意指至少其成分之一相对于它的至少一种其它成分是异源的。 表达盒也可以是天然的,但以重组形式获得以用于异源表达。然而, 通常表达盒相对于宿主是异源的,即,表达盒的特定核酸序列不天然 出现在宿主细胞中,而必须通过转化事件将其引入宿主细胞或宿主细 胞的前体。表达盒中核苷酸序列的表达可以受组成型启动子或仅当宿 主细胞暴露于一些特定外部刺激物时才起始转录的诱导型启动子控 制。在多细胞生物体的情况下,如植物,启动子也可以是对特定组织 或器官或发育阶段特异的。
“基因”是位于基因组内、除了前述编码核酸序列外还包含其它 主要调节核酸序列的确定区域,所述调节核酸序列负责编码部分的的 表达,即转录和翻译控制。基因也可以包含其它5’和3’非翻译序列和 终止序列。进一步可以存在的元件是,例如内含子。
“目的基因”指任何基因,当转移其到植物中时,可赋予植物以 期望的特性如抗生素抗性,病毒抗性,昆虫抗性,疾病抗性或对其它 害虫的抗性,除草剂耐受性,改进的营养价值,工业生产过程中改进 的性能或改变的繁殖能力。“目的基因”也可以是转移到植物中用于 植物中有商业价值的酶或代谢物生产的基因。
“异源”核酸序列是与其被引入的宿主细胞不天然相关的核酸序 列,包含天然核酸序列以多拷贝非天然存在。
“同源”核酸序列是与其被引入的宿主细胞天然相关联的核酸序 列。
“同源重组”是同源核酸分子间核酸片段的相互交换。
这里所用的“杂合毒素”是人工制备的杀虫毒素,其包含一个毒 素的氨基酸区域或片段与来源于不同毒素的氨基酸区域或片段相连 接,例如,将SEQ ID NO:2氨基酸579到氨基酸787的Vip3B C-末 端区域和SEQ ID NO:5氨基酸1到氨基酸578的Vip3A N-末端区域 相连接,但并不局限于此。
“杀虫的”定义为能控制昆虫,优选杀死它们的毒性生物活性。
当核酸序列编码与参照核酸序列编码的多肽有相同氨基酸序列 的多肽时,该核酸序列与参照核酸序列即属“同类编码的”。
“分离的”核酸分子或分离的酶是人工地与其天然环境分离存 在,因此不是天然产物的核酸分子或酶。分离的核酸分子或酶可以以 纯化形式存在,或者可以存在于非天然环境中,例如重组宿主细胞中。
“核酸分子”或“核酸序列”是可以从任何来源分离的单或双链 DNA或RNA的线性片段。在本发明上下文中,优选地,核酸分子是DNA 片段。
“植物”是在任何发育阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理学单位,包含原生质体和细胞 壁。植物细胞可以是分离单细胞或培养细胞形式,或作为高等有组织 的单位例如植物组织、植物器官或整个植物的一部分。
“植物细胞培养物”意指各种发育阶段的植物单位如,例如原生 质体,细胞培养物细胞,植物组织中的细胞,花粉,花粉管,胚珠, 胚囊,合子和胚的培养物。
“植物材料”指叶片,茎,根,花或花的部分,果实,花粉,卵 细胞,合子,种子,插条,细胞或组织培养物,或植物的任何其它部 分或产物。
“植物器官”是植物明显和可见的结构和分化部分,如根,茎, 叶,花蕾或胚。
这里所用的“植物组织”意指组织成结构和功能单位的一组植物 细胞。包括植物中或培养物中植物的任何组织。该术语包括但不限于 整个植物,植物器官,植物种子,组织培养物和组织成结构和/或功 能单位的任何植物细胞组。该术语与上述任何特定类型植物组织的联 合应用或单独应用或该定义包含其它应用不意味排除任何其它类型 植物组织。
“启动子”是编码区域上游的非翻译DNA序列,其包含RNA聚合 酶11的结合位点,并起始DNA的转录。启动子区域也可以包含作为 基因表达调节物的其它元件。
“原生质体”是没有细胞壁或仅有部分细胞壁的分离的植物细 胞。
”调节元件”指参与控制核苷酸序列表达的序列。调节元件包含 可操作地连接目的核苷酸序列和终止信号的启动子。通常它们也包含 核苷酸序列正确翻译所需的序列。
“改组”核酸是通过改组方法,如这里所述的任何改组方法产生 的核酸。通过人工并且可选地循环的方式(物理或实际上)重组两个 或多个核酸(或字符串)可产生改组核酸。一般地,在改组方法中利 用一步或多步筛选步骤以鉴定目的核酸;可以在任何重组步骤之前或 之后进行该筛选步骤。在一些(但不是所有)改组实施方式中,期望 在筛选前进行多轮重组以增加筛选库的多样性。任选地,可以循环重 复重组和筛选的全部过程。根据上下文,改组可以指重组和筛选的全 部过程,或者可以仅指全部过程的重组部分。
基本相同:在两个核酸或蛋白质序列上下文中的短语“基本相同” 指当如利用下面序列比较算法之一或目测而比较和比对测定最大对 应程度时,具有至少60%,优选80%,更优选90%,甚至更优选95 %和最优选至少99%核苷酸或氨基酸残基同一性的两个或多个序列 或亚序列。优选地,在至少约50个残基长度的序列区域、更优选至 少约100个残基的区域存在基本同一性,最优选地在至少约150个残 基中序列是基本相同的。在特别优选的实施方式中,在整个编码序列 长度中序列是基本相同的。而且,基本相同的核酸或蛋白质序列履行 基本相同的功能。
对于序列比较,通常,一个序列作为参照序列而与检测序列相比 较。当利用序列比较算法时,输入检测和参照序列进入计算机中,如 果必要的话,指定亚序列的坐标和序列算法程序的参数。然后,根据 选定的程序参数,序列比较算法将计算出检测序列相对于参照序列的 百分序列同一性。
例如,通过Smith & Waterman,Adv.Appl.Math.2:482(1981) 的局部同源性算法,通过Needleman & Wunsch,J.Mol.Biol.48: 443(1970)的同源性比对算法,通过Pearson & Lipman,Proc.Nat ‘l.Acad.Sci.USA 85:2444(1988)的相似性检索方法,通过这 些算法的计算机化实施(Wisconsin Genetics软件包中GAP,BESTFIT, FASTA和TFASTA,Genetics Computer Group,575 Science Dr., Madison,WI)或通过目测(通常参见,Ausubel等,下文)可以进行比 较序列的最佳比对。
适于测定百分序列同一性和序列相似性的一个算法例子是BLAST 算法,在Altschul等,J.Mol.Biol.215:403-410(1990)中描 述了该算法。通过国家生物技术信息中心(http://www.ncbi nlm. nih.gov/)可公开得到进行BLAST分析的软件。该算法包括:通过鉴 定出查寻序列中长度为W的短字而首先鉴定出高得分序列对(HSP), 所述短字在与数据库中相同长度的字比对的符合或满足一些正值域 值分T。T称为相邻字记分阈值(Altschul等,1990)。这些最初的 邻近字命中作为开始查寻的线索去发现包含它们的更长的HSP。然后, 这些字命中将沿每个序列的两个方向尽可能远的延伸,直到积累比对 分值不再增加。对于核苷酸序列,使用参数M(成对匹配残基的奖励 分值;总是大于零)和N(错配残基的罚分值;总是小于零)计算积 累分值。对于氨基酸序列,用记分矩阵计算积累分值。当积累比对分 值从所获得的最大值降低X时,终止向各方向的字击中延伸,由于一 个或更多负分值残基比对积累,或两个序列的任一个到达终点时,积 累分值达到或低于零。BLAST算法的参数W,T和X决定了比对的敏 感性和速度。BLASTN程序内部设定值(对于核苷酸序列)为字长值 (W)11,期望值(E)10,截断值100,M=5,N=-4,并比较两个链。 对于氨基酸序列,BLASTP程序内部设定值为字长值(W)3,期望值 (E)10和BLOSUM62记分矩阵(参见,Henikoff & Henikoff,Proc. Natl.Acad.SCI.USA 89:10915(1989))。
除了计算百分序列同一性外,BLAST算法也进行两种序列间相似 性的统计学分析(参见,例如Karlin & Altschul,Proc.Nat’l.Acad. Sci.USA 90:5873-5787(1993))。BLAST算法提供的一个相似性 测定是最小和概率(P(N)),其提供了两个核苷酸或氨基酸序列间 偶然出现匹配的概率指标。例如,如果检测核酸序列与参照核酸序列 比较时最小和概率少于约0.1,更优选少于约0.01,最优选少于约 0.001,那么认为检测核酸序列与参照序列相似。
两种核酸序列基本相同的另一个指标是两种分子在严格条件下 互相杂交。短语“特异性杂交”指当该序列存在于复杂混合物(例如, 总细胞的)DNA或RNA分子中时,在严格条件下,分子仅与特定核苷 酸序列结合,形成双螺旋或杂交。“基本结合”指探针核酸和靶核酸 间的互补杂交,并且包含较少的错配,通过降低杂交介质的严格性可 以耐受这种错配,以实现靶核酸序列的期望检测。
在核酸杂交试验如Southern和Northern杂交上下文中“严格杂 交条件”和“严格杂交漂洗条件”是序列依赖性的,并且在不同环境 参数下是不同的。较长的序列在较高温度下特异性杂交。在Tijssen (1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第2章第I 部分″Overview of principles of hybridization and the strategy of nucleic acid probe assays″Elsevier,New York中可以找到有 关核酸杂交的详尽的指南。一般地,严格性强的杂交和漂洗条件选定 为比特定序列在确定的离子浓度和pH下的热熔点温度(Tm)低约5 ℃。通常地,在“严格条件”下,探针将与其靶亚序列杂交,而不与 其它序列杂交。
Tm是(在确定的离子浓度和pH条件下)50%靶序列与完全匹配 的探针发生杂交时的温度。对于特定的探针,选择等于Tm的非常严 格的条件。对于Southern或Northern印迹中滤膜上长度为100个以 上互补残基的互补核酸的杂交,严格杂交条件的一个例子是在42℃, 具有1mg肝素的50%甲酰胺,过夜进行该杂交。高严格性的漂洗条 件的例子是72℃,0.15M NaCl约15分钟。严格漂洗条件的例子是在 65℃,0.2xSSC漂洗15分钟(参见,Sambrook,下文,SSC缓冲液 的描述)。通常,在高严格性洗涤之前进行低严格性的漂洗,以除去 背景探针信号。对于例如多于100个核苷酸的双螺旋而言,中度严格 性漂洗的例子是45℃,1xSSC漂洗15分钟。对于例如多于100个 核苷酸的双螺旋而言,低严格性漂洗的例子是40℃,4-6xSSC漂洗 15分钟。对于短探针(例如,约10到50个核苷酸),严格条件通 常包括少于约1.0M Na离子的盐浓度,通常在pH7.0到8.3,Na离子 浓度(或其它盐)约是0.01到1.0M,通常温度至少是约30℃。通过 添加去稳定剂如甲酰胺也可以获得严格条件。一般地,在特定杂交测 定中信噪比就无关探针所观察到的值高2倍(或更高)表明检测到了 特异杂交。在严格条件下不互相杂交的核酸,如果它们编码的蛋白质 是基本相同的,那么它们仍是基本相同的。例如,当用遗传密码所允 许的最大密码子简并性得到核酸拷贝时,就会出现这种情况。
下面是杂交/漂洗条件设置的例子,所述条件可以用于克隆与本 发明参照核苷酸序列基本相同的同源核苷酸序列:优选参照核苷酸序 列与参照核苷酸序列在50℃,7%十二烷基硫酸钠(SDS),0.5M NaPO4, 1mM EDTA中杂交,在50℃,2XSSC,0.1%SDS中漂洗,更优选在 50℃,7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交, 在50℃,1XSSC,0.1%SDS中漂洗,更优选在50℃,7%十二烷基 硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,在50℃,0.5XSSC, 0.1%SDS中漂洗,优选地在50℃,7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,在50℃,0.1XSSC,0.1%SDS中漂洗, 更优选地在50℃,7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA 中杂交,在65℃,0.1XSSC,0.1%SDS中漂洗。
两个核酸序列或蛋白质基本相同的另一个指标是第一核酸编码 的蛋白质与第二核酸编码的蛋白质可发生免疫交叉反应或特异结合。 因此,在例如其中两个蛋白质仅仅由于保守性置换而不同时,它们通 常是基本相同的。
“合成的”指包含天然序列中不存在的结构特征的核苷酸序列。 例如,G+C含量和正常密码子分布更接近于双子叶和/或单子叶植物 基因的人工序列是合成的。
“转化”是向宿主细胞或生物体中引入异源核酸的过程,特别地, 转化”意指DNA分子稳定整合进入目的生物体基因组中。
“转化的/转基因的/重组的”指已经引入异源核酸分子的宿主生 物体,如细菌或植物。核酸分子可以稳定地整合进入宿主基因组,或 者,核酸分子也可以作为染色体外分子存在。这种染色体外分子可以 是自主复制的。转化的细胞,组织,或植物理解为不仅包含转化过程 的最终产物,也包含其转基因子代。“非转化的”,“非转基因的”, 或“非重组的”宿主指不含有异源核酸分子的野生型生物体,例如细 菌或植物。
“Vip类蛋白质”包括Vip3A(a),Vip3A(b),Vip3A(c),Vip3B, Vip3C(a),Vip3C(b),Vip3Z和它们的同源物,但并不限于此。这 里所用的“同源物”意指所述蛋白质或多肽与Vip3类蛋白质的其它 成员具有确定的关系。这种确定的关系包括,但不限于:1)在序列 水平上与Vip3类蛋白质另一个成员有至少70%,更优选至少80%, 最优选至少90%同一性、同时还保持了杀虫活性的蛋白质,2)与免 疫识别Vip3类蛋白质另一个成员的抗体可发生交叉反应的蛋白质, 3)与Vip3类蛋白质另一个成员的受体可发生交叉反应,并且保留了 诱导程序性细胞死亡能力的蛋白质,和4)在序列水平上与Vip3类 蛋白质另一个成员的毒性核心区域有至少70%,更优选至少80%, 最优选至少90%同一性、同时还保持了杀虫活性的蛋白质。在WO 98/18932,WO 98/33991,WO 98/00546和WO 99/57282中已经公开 了其它Vip3同源物。
用下面的标准缩写的碱基表示核苷酸:腺嘌呤(A),胞嘧啶(C), 胸腺嘧啶(T)和鸟嘌呤(G)。同样地,用下面标准缩写表示氨基酸: 丙氨酸(Ala;A),精氨酸(Arg;R),天冬酰胺(Asn;N),天冬氨酸(Asp; D),半胱氨酸(Cys;C),谷氨酰胺(Gln;Q),谷氨酸(Glu;E),甘 氨酸(Gly;G),组氨酸(His;H),异亮氨酸(He;1),亮氨酸(Leu; L),赖氨酸(Lys;K),甲硫氨酸(Met;M),苯丙氨酸(Phe;F),脯氨 酸(Pro;P),丝氨酸(Ser;S),苏氨酸(Thr;T),色氨酸(Trp;W), 酪氨酸(Tyr;Y)和缬氨酸(Val;V)。

发明内容

本发明涉及其表达产生新的毒素的核酸序列,涉及可控制昆虫害 虫的所述毒素的制备和应用。核酸序列来源于芽孢杆菌属 (Bacillus),一种革兰氏阳性的形成孢子的微生物。特别地,提供 了可作为杀虫剂的新的Vip3蛋白质。
对于本发明的目的,昆虫害虫包括选自:鞘翅目,双翅目,膜翅 目,鳞翅目,食毛目,同翅目,半翅目,直翅目,缨翅目,革翅目, 等翅目,虱目,蚤目,毛翅目等,特别是鳞翅目的昆虫。
本发明核酸序列的表达产生了可用于控制例如如下鳞翅目昆虫 的毒素:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫(Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾(Trichoplusia ni),棉红铃虫(Pectinophora gossypiella)和向日葵细卷叶蛾(Cochylis hospes)。
在一个实施方式中,本发明包含分离的核酸分子,所述核酸分子 包含与SEQ ID NO:1序列有至少92%序列同一性的核苷酸序列,该 分离的核酸分子的表达产生了可控制昆虫的活性。当在异源宿主中表 达SEQ ID NO:1核酸分子时,其产生了抗如下昆虫的控制活性:欧 洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella), 秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷 实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪 夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera), 棉铃虫(Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉 斑夜蛾(Trichoplusia ni),棉红铃虫(Pec tinophora gossypiella) 和向日葵细卷叶蛾(Cochylis hospes)的控制昆虫的活性,表明SEQ ID NO:1所示的核苷酸序列足够产生这种控制昆虫的活性。在进一 步实施方式中,该分离的核酸分子包含与SEQ ID NO:1有至少93% 序列同一性的核苷酸序列。在另一个实施方式中,该分离的核酸分子 包含与SEQ ID NO:1有至少94%序列同一性的核苷酸序列。在另一 个实施方式中,该分离的核酸分子包含与SEQ ID NO:1有至少95% 序列同一性的核苷酸序列。在另一个实施方式中,该分离的核酸分子 包含与SEQ ID NO:1有至少96%序列同一性的核苷酸序列。在另一 个实施方式中,该分离的核酸分子包含与SEQ ID NO:1有至少97% 序列同一性的核苷酸序列。在另一个实施方式中,该分离的核酸分子 包含与SEQ ID NO:1有至少98%序列同一性的核苷酸序列。在另一 个实施方式中,该分离的核酸分子包含与SEQ ID NO:1有至少99% 序列同一性的核苷酸序列。在另一个实施方式中,该分离的核酸分子 包含SEQ ID NO:1所示的核苷酸序列。
在另一个实施方式中,本发明包括包含于pNOV1325中的核酸分 子,该核酸分子的表达产生了杀虫毒素,该pNOV1325保藏在命名为 ATCC保藏号PTA-3868的大肠杆菌(E.coli)株系DH5α中。
在一个实施方式中,本发明包括包含一种核苷酸序列的分离的核 酸分子,该核苷酸序列与同SEQ ID NO:1有至少92%序列同一性的 核苷酸序列属同类编码的,该分离的核酸分子的表达产生了控制昆虫 的活性。当在异源宿主中表达SEQ ID NO:3核酸分子时,其产生了 抗如下昆虫的控制活性:欧洲玉米螟(Ostrinia Nubilalis),小菜 蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小 地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜 蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突 夜蛾(Helicoverpa punctigera)和棉铃虫(Helicoverpa Armigera), 表明SEQ ID NO:3所示的核苷酸序列足够产生这种控制昆虫的活性。 在进一步实施方式中,本发明包括包含于pNOV1 328中的核酸分子, 该核酸分子的表达产生了杀虫毒素,该pNOV1328保藏在命名为ATCC 保藏号PTA-3869的大肠杆菌(E.coli)株系DH5α中。
在另一个实施方式中,该分离的核酸分子编码包含与SEQ ID NO: 2所示氨基酸序列有至少91%序列同一性的氨基酸序列的毒素。在另 一个实施方式中,该分离的核酸分子编码包含与SEQ ID NO:2所示 氨基酸序列有至少92%序列同一性的氨基酸序列的毒素。在另一个 实施方式中,该分离的核酸分子编码包含与SEQ ID NO:2所示氨基 酸序列有至少93%序列同一性的氨基酸序列的毒素。在另一个实施 方式中,该分离的核酸分子编码包含与SEQ ID NO:2所示氨基酸序 列有至少94%序列同一性的氨基酸序列的毒素。在另一个实施方式 中,该分离的核酸分子编码包含与SEQ ID NO:2所示氨基酸序列有 至少95%序列同一性的氨基酸序列的毒素。在另一个实施方式中, 该分离的核酸分子编码包含与SEQ ID NO:2所示氨基酸序列有至少 96%序列同一性的氨基酸序列的毒素。在另一个实施方式中,该分离 的核酸分子编码包含与SEQ ID NO:2所示氨基酸序列有至少97%序 列同一性的氨基酸序列的毒素。在另一个实施方式中,该分离的核酸 分子编码包含与SEQ ID NO:2所示氨基酸序列有至少98%序列同一 性的氨基酸序列的毒素。在另一个实施方式中,该分离的核酸分子编 码包含与SEQ ID NO:2所示氨基酸序列有至少99%序列同一性的氨 基酸序列的毒素。在另一个实施方式中,该分离的核酸分子编码包含 SEQ ID NO:2所示氨基酸序列的毒素。
本发明也包括包含本发明核酸序列的重组载体。在这种载体中, 优选地,该核酸序列包含在表达盒中,该表达盒包含用于在能表达所 述核苷酸序列的宿主细胞中表达该核苷酸序列的调节元件。这种调节 元件通常包含启动子和终止信号,优选地,也包含使得本发明核酸序 列编码的多肽能够有效翻译的元件。包含所述核酸序列的载体通常具 有在特定宿主细胞中复制的能力(优选地,其作为染色体外分子), 因此可利用它在宿主细胞中扩增本发明的核酸分子。在一个实施方式 中,用于这种载体的宿主细胞是微生物,如细菌,特别是大肠杆菌 (E.coli)或芽孢杆菌(Bacillus)。在另一个实施方式中,用于这 种重组载体的宿主细胞是内寄生菌或体表寄生菌。用于这种载体的优 选宿主细胞是真核生物细胞,如酵母细胞,植物细胞或昆虫细胞。植 物细胞如玉米细胞是最优选的宿主细胞。在另一个优选实施方式中, 这种载体是病毒载体,并且可用于在特定宿主细胞例如昆虫细胞或植 物细胞中复制所述核苷酸序列。重组载体也用于将本发明核苷酸序列 转化到宿主细胞内,从而该核苷酸序列稳定整合进入这种宿主细胞的 DNA中。在一个实施方式中,这种宿主细胞是原核生物细胞。在优选 实施方式中,这种宿主细胞是真核细胞,如酵母细胞,昆虫细胞或植 物细胞。在最优选的实施方式中,宿主细胞是植物细胞,如玉米细胞。
本发明也提供了生产具有抗昆虫活性的毒素的方法,包括(a) 获得本发明的转基因宿主细胞,和(b)在转基因宿主细胞中表达本 发明的核酸分子,从而产生至少一种具有抗昆虫活性的毒素。
本发明进一步提供了生产抗昆虫的转基因植物的方法,包括向转 基因植物中引入本发明的核酸分子,其中转基因植物中该核酸分子能 够以控制昆虫的有效量表达。在另一个实施方式中,昆虫是鳞翅目昆 虫。在另一个实施方式中,该鳞翅目昆虫选自:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helico verpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫 (Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾 (Trichoplusia ni),棉红铃虫(Pec tinophora gossypiella)和向日 葵细卷叶蛾(Cochylis hospes)。
在另一方面,本发明提供了具有抗昆虫活性的分离的毒素,其中 所述毒素包含:(a)与SEQ ID NO:2有至少91%序列同一性的氨 基酸序列;或(b)由包含与SEQ ID NO:1有至少92%序列同一性 的核苷酸序列的核酸分子编码的氨基酸序列。
在一个实施方式中,本发明提供了具有抗昆虫活性的分离的毒 素,其中所述毒素包含与SEQ ID NO:2有至少91%序列同一性的氨 基酸序列。在一个实施方式中,该毒素包含与SEQ ID NO:2有至少 92%序列同一性的氨基酸序列。在一个实施方式中,该毒素包含与 SEQ ID NO:2有至少93%序列同一性的氨基酸序列。在一个实施方 式中,该毒素包含与SEQ ID NO:2有至少94%序列同一性的氨基酸 序列。在一个实施方式中,该毒素包含与SEQ ID NO:2有至少95% 序列同一性的氨基酸序列。在一个实施方式中,该毒素包含与SEQ ID NO:2有至少96%序列同一性的氨基酸序列。在一个实施方式中,该 毒素包含与SEQ ID NO:2有至少97%序列同一性的氨基酸序列。在 一个实施方式中,该毒素包含与SEQ ID NO:2有至少98%序列同一 性的氨基酸序列。在一个实施方式中,该毒素包含与SEQ ID NO:2 有至少99%序列同一性的氨基酸序列。在一个实施方式中,毒素包 含SEQ ID NO:2所示的氨基酸序列。
在一个实施方式中,本发明提供了具有抗昆虫活性的毒素,其中 所述毒素是通过包含与SEQ ID NO:1有至少92%序列同一性的核苷 酸序列的核酸分子的表达产生的。在另一个实施方式中,所述核苷酸 序列与SEQ ID NO:1有至少93%序列同一性。在另一个实施方式中, 所述核苷酸序列与SEQ ID NO:1有至少94%序列同一性。在另一个 实施方式中,所述核苷酸序列与SEQ ID NO:1有至少95%序列同一 性。在另一个实施方式中,所述核苷酸序列与SEQ ID NO:1有至少 96%序列同一性。在另一个实施方式中,所述核苷酸序列与SEQ ID NO: 1有至少97%序列同一性。在另一个实施方式中,所述核苷酸序列与 SEQ ID NO:1有至少98%序列同一性。在另一个实施方式中,所述 核苷酸序列与SEQ ID NO:1有至少99%序列同一性。在另一个实施 方式中,所述毒素是通过包含SEQ ID NO:1核苷酸1-2364或SEQ ID NO:3核苷酸1-2364的核苷酸序列的表达产生的。
在一个实施方式中,本发明的毒素是通过对包含作为ATCC保藏 号PTA-3868保藏的pNOV1325中所含的约2.4kb DNA片段的核苷酸序 列进行表达而产生的。在另一个实施方式中,本发明的毒素是通过对 包含作为ATCC保藏号PTA-3869保藏的pNOV1328中所含的约2.4kb DNA片段的核苷酸序列进行表达而产生的。
在另一个实施方式中,本发明毒素是由命名为ATCC保藏号 PTA-3868的大肠杆菌(E.coli)株系产生的。在另一个实施方式中, 本发明毒素是由命名为ATCC保藏号PTA-3869的大肠杆菌(E.coli) 株系产生的。
当在生物测定中试验本发明毒素抗昆虫害虫时,本发明毒素有控 制昆虫的活性。在一个实施方式中,本发明毒素具有抗鳞翅目昆虫的 活性。在进一步实施方式中,鳞翅目昆虫选自:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helico verpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),细点突夜蛾(Helicoverpa punctigera),棉铃虫 (Helicoverpa Armigera),烟草天蛾(Manduca Sexta),粉斑夜蛾 (Trichoplusia ni),棉红铃虫(Pec tinophora gossypiella)和向日 葵细卷叶蛾(Cochylis hospes)。在实施例5和实施例8中进一步示 例阐述了本发明杀虫毒素的昆虫控制特性。
本发明也包括具有抗昆虫活性的杂合毒素,其中所述杂合毒素是 由包含如下核苷酸序列的核酸分子编码的,该核苷酸序列(a)在50 ℃,7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中能够与 SEQ ID NO:1核苷酸1734-2364杂交(在65℃,0.1XSSC,0.1% SDS中漂洗);或(b)与(a)的核苷酸序列属同类编码的;或(c) 包含按序与(a)或(b)核苷酸序列的连续20个碱基对核苷酸部分 相同的连续20个碱基对核苷酸部分,其中所述核酸分子的表达产生 了控制昆虫的活性。这里具体示例的是SEQ ID NO:6所示核苷酸序 列编码的杂合毒素。当在异源宿主中表达SEQ ID NO:6核酸分子时, 其产生了抗如下昆虫的控制活性:欧洲玉米螟(Ostrinia Nubilalis),小菜蛾(Plutella xylostella),秋粘虫(Spodoptera frugiperda),小地老虎(Agrotis ipsilon),谷实夜蛾(Helicoverpa zea),烟蚜夜蛾(Heliothis virescens),贪夜蛾(Spodoptera exigua),棉红铃虫(Pectinophora gossypiella),粉斑夜蛾 (Trichoplusia ni),向日葵细卷叶蛾(Cochylis hospes)和向日葵 head moth(Homoeosoma electellum)。
本发明也包括具有抗昆虫活性的杂合毒素,其包含Vip3毒素羧 基末端区域和按从氨基到羧基的方向与之连接的不同Vip3毒素的氨 基末端区域,其中所述羧基末端区域包含与SEQ ID NO:2氨基酸579 -787有至少75%同一性的氨基酸序列;所述氨基末端区域与SEQ ID NO:5氨基酸1-578有至少75%的同一性。在进一步实施方式中,该 羧基末端区域包含SEQ ID NO:2氨基酸579-787,该氨基末端区域包 含SEQ ID NO:5氨基酸1-578。在另一个实施方式中,杂合毒素包 含SEQ ID NO:6氨基酸1-787。
异源微生物宿主中核苷酸序列的表达
作为生物控制昆虫的试剂,杀虫毒素可通过在能表达核苷酸序列 的异源宿主细胞中表达该核苷酸序列而产生。在第一个实施方式中, 产生了包含本发明核苷酸序列修饰的苏云金芽孢杆菌(B. Thuringiensis)细胞。这种修饰包含现存调节元件的突变或缺失, 因此引起了核苷酸序列改变的表达,或者引入了控制核苷酸序列表达 的新调节元件。在另一个实施方式中,通过向染色体内插入或通过含 有该核苷酸序列的染色体外复制分子的引入,向苏云金芽孢杆菌 (Bacillus Thuringiensis)细胞中加入一个或多个所述核苷酸序列 的额外拷贝。
在另一个实施方式中,将至少一种本发明核苷酸序列插入到适合 的表达盒中,该表达盒包含启动子和终止信号。核苷酸序列的表达是 组成型的,或可利用对各种类型刺激物反应以起始转录的诱导型启动 子。在优选实施方式中,表达毒素的细胞是微生物,如病毒,细菌或 真菌。在优选实施方式中,病毒如杆状病毒基因组中含有本发明核苷 酸序列,感染适合病毒复制和所述核苷酸序列表达的真核生物细胞后 可表达大量的相应杀虫毒素。由此产生的杀虫毒素用作杀虫剂。可替 代地,用基因工程改造成包含该核苷酸序列的杆状病毒体内感染昆 虫,通过杀虫毒素的表达或通过病毒感染和杀虫毒素的表达的联合来 杀死昆虫。
细菌细胞也是用于本发明核苷酸序列表达的宿主。在优选实施方 式中,利用能在植物组织内生活和繁殖的非致病共生细菌(通常所说 的内寄生菌)或能在叶际或根际集落化的非致病共生细菌(通常所说 的体表寄生菌)。这种细菌包括农杆菌属(Agrobacterium),产碱 杆菌属(Alcaligenes),固氮根瘤菌属(Azospirillum),固氮菌属 (Azotobacter),芽孢杆菌属(Bacillus),棍状杆菌属 (Clavibacter),肠杆菌属(Enterobacter),欧文氏菌属(Erwinia), 黄杆菌属(Flavobacter),克氏杆菌属(Klebsiella),假单胞菌 属(Pseudomonas),根瘤菌属(Rhizobium),沙雷氏菌属(Serratia), 链霉菌属(Streptomyces)和黄单胞菌属(Xanthomonas)的细菌。 共生真菌,如木霉菌属(Trichoderma)和胶霉属(Gliocladium)也 可能用作本发明核苷酸序列表达的宿主以用于同一目的。
这些基因操作技术对于可供利用的不同宿主是特定的,而且是本 领域已知的。例如,表达载体pKK223-3和pKK223-2可以用于在大肠 杆菌(E.coli)中表达tac或trc启动子后转录或翻译融合形式的异 源基因。对于编码多ORFs(开放读框)操纵子的表达,最简单的方 法是以转录融合方式在载体,如pKK223-3中插入该操纵子,使得能 够利用异源基因的同源核糖体结合位点。在革兰氏阳性物种如芽孢杆 菌(Bacillus)中过量表达的技术也是本领域已知的,其也可以在本 发明上下文中使用(Quax等,In:Industrial Microorganisms: Basic and Applied Molecular Genetics,Baltz等编辑,American Society for Microbiology,Washington(1993))。可替代的过量 表达系统依赖于例如酵母载体,包括毕赤酵母属(Pichia),酵母属 (Saccharomyces)和克鲁维酵母菌属(Kluyveromyces) (Sreekrishna,In:Industrial microorganisms:basic and applied molecular genetics,Baltz,Hegeman和Skatrud编辑, American Society for Microbiology,Washington(1993);Dequin & Barre,Biotechnology L2:173-177(1994);van den Berg等, Biotechnology 8:135-139(1990))。
植物转化
在特别优选实施方式中,在高等生物体例如植物中表达至少一种 本发明的杀虫毒素。在这种情况下,表达有效量的毒素的转基因植物 保护其本身免受昆虫害虫的侵害。当昆虫开始以这种转基因植物为食 时,它也摄食了表达的毒素。这将阻止昆虫进一步咬食植物组织,或 者甚至伤害或杀死昆虫。可将本发明核苷酸序列插入到表达盒中,然 后优选地,表达盒稳定整合在所述植物基因组中。在另一个优选实施 方式中,所述核苷酸序列包含在非致病性的自我复制病毒中。按照本 发明转化的植物可以是单子叶植物或双子叶植物,包括但不限于玉 米,小麦,大麦,黑麦,甘薯,豆,豌豆,菊苣,莴苣,甘蓝,花椰 菜,花茎甘蓝,芜菁,萝卜,菠菜,芦笋,洋葱,大蒜,胡椒,芹菜, 笋瓜,南瓜,大麻,夏南瓜,苹果,梨,温桲,瓜,李子,樱桃,桃 子,油桃,杏,草莓,葡萄,木莓,黑莓,菠萝,鳄梨,蕃木瓜,芒 果,香蕉,大豆,番茄,高粱,甘蔗,甜菜,向日葵,油菜籽,三叶 草,烟草,胡萝卜,棉花,苜蓿,水稻,马铃薯,茄子,黄瓜,拟南 芥和木本植物如松柏科和落叶树木。
一旦已将期望的核苷酸序列转化进入特定植物物种中,就可以在 该物种中繁殖它或用常规育种技术将它转移进入相同物种的其它品 种,特别包括商业品种中。
优选地,在转基因植物中表达本发明的核苷酸序列,因此在转基 因植物中引起了相应毒素的生物合成。以这种方式,可产生具有增强 抗昆虫抗性的转基因植物。为了在转基因植物中表达本发明核苷酸序 列,本发明核苷酸序列可能需要修饰和优化。尽管在许多情况下来源 于微生物的基因不用修饰就可以在植物中高水平的表达,但是具有在 植物中不偏爱的密码子的微生物核苷酸序列可能引起转基因植物中 低水平的表达。所有生物体都有特定的密码子使用偏爱性,这是本领 域已知的,可以在保持本发明所述核苷酸序列编码的氨基酸的同时改 变其密码子以符合植物偏爱性。而且,从有至少约35%,优选多于 约45%,更优选多于50%,最优选多于约60%GC含量的编码序列可 以最好地实现植物中高水平的表达。由于存在可能使信息去稳定的 ATTTA基序和可以引起不合适的聚腺苷酸化的AATAAA基序,有低GC 含量的微生物核苷酸序列在植物中可能低水平地表达。尽管可以在单 子叶植物和双子叶植物物种中充分地表达优选的基因序列,可以修饰 序列以适应单子叶植物或双子叶植物的特异密码子偏好和GC含量偏 好,因为这些偏好已被证明是不同的(Murray等,Nucl.Acids Res. 17:477-498(1989))。此外,可筛选核苷酸序列以寻找引起信息截 短的非常规剪接位点。利用专利申请公开EP 0 385 962,EP 0 359 4721 和WO 93/07278中所述的方法,用本领域熟知的定点诱变技术,PCR 和合成基因构建可以进行上述这些核苷酸序列中需要进行的所有改 变。
在本发明一个实施方式中,根据这里并入作为参考文献的美国专 利5,625,136中公开的方法可制备vip3B基因。在该方法中,利用了 玉米优选的密码子,即最常常编码玉米中氨基酸的单密码子。特定氨 基酸的玉米优选密码子可以来源于,例如玉米的已知基因序列。在 Murray等,Nucleic Acids Research 17:477-498(1989)中教导 了玉米植物28种基因的玉米密码子使用,这里并入这篇文献的公开 内容为参考文献。制备的具有玉米最优密码子的合成序列如SEQ ID NO: 2中所示。
以这种方式可以优化核苷酸序列以便在任何植物中表达。公认基 因序列的所有或任何部分都可以优化或合成。即,也可以利用合成或 部分优化的序列。
为了翻译的有效起始,可能需要修饰邻近起始甲硫氨酸的序列。 例如,通过包含已知在植物中有效的序列可以修饰它们。Joshi提出 了植物适合的共有序列(NAR 15:6643-6653(1987)),Clonetech提 出了进一步的翻译起始子共有序列(1993/1994目录,210页)。这些 共有序列适合与本发明核苷酸序列一起使用。向包含所述核苷酸序列 掺入该序列,直到和包含ATG(同时保持第二个氨基酸没有被修饰), 或者直到和包含ATG后的GTC(有可能修饰转基因的第二个氨基酸)。
可将如上所述作为其天然序列或作为优化合成序列的本发明新 的vip3毒素基因可操作地与在植物中表达的各种启动子,包括组成 型,诱导型,时序调节,发育调节,化学调节,组织优选和组织特异 性启动子相隔合,以制备重组DNA分子,即嵌合基因。启动子的选择 将随着表达时间和空间需要而变化,而且也取决于靶物种。因此,优 选在叶片,主茎或茎杆,穗,花序(例如,穗状花序,圆锥花序,穗 轴等),根,和/或幼苗中表达本发明核苷酸序列。然而,在许多情 况下,需要提供抗多于一种类型的昆虫害虫的保护,因此期望在多组 织中表达。尽管证明了来源于双子叶植物的许多启动子在单子叶植物 中是可起作用的,反之亦然,但是理想地,选择双子叶植物启动子用 于双子叶植物中的表达,单子叶植物的启动子用于单子叶植物中的表 达。然而,没有限制所选启动子的起源,只要启动子能在期望细胞中 驱动所述核苷酸序列的表达就足够了。
优选的组成型启动子包括CaMV 35S和19S启动子(Fraley等, 1994年10月4日公布的美国专利号5,352,605)。另外优选的启动子 来源于在大多数细胞类型中表达的几种肌动蛋白基因的任何一种。可 以容易地修饰McElroy等(Mol.Gen.Genet.231:150-160(1991)) 所述的启动子表达盒以用于新毒素基因的表达,该基因表达盒特别适 合在单子叶植物宿主中使用。
另一个优选的组成型启动子来源于泛素,它是已知在许多细胞类 型中积累的另一种基因产物。已从几种物种,例如向日葵(Binet等, 1991.Plant Science 79:87-94),玉米(Christensen等,1989. Plant Molec.Biol.12:619-632)和拟南芥(Norris等1993.Plant Molec.Bi ol.21:895-906)克隆了泛素启动子,可以用于转基因植 物中。已发展了转基因单子叶植物系统中的玉米泛素启动(UbiP), 并且在专利公布EP 0 342 926中公开了其序列和用于单子叶植物转 化的载体。泛素启动子适合用于在转基因植物,特别是单子叶植物中 表达该新毒素基因。
可用于在植物,特别是玉米中表达本发明新毒素基因的组织特异 性或组织偏爱启动子是可在根,木髓(pith),叶片或花粉中引导表 达的启动子。在WO 93/07278中公开了这种启动子,这里整体并入其 为参考文献。其它可用在本发明中的组织特异性启动子包括美国专利 6,040,504中公开的棉花核酮糖二磷酸羧化酶-加氧酶启动子;美国 专利5,604,121中公开的水稻蔗糖合成酶启动子;和WO 01/73087 中公开的夜香树黄化叶卷曲病毒(cestrum yellow leaf curling virus)启动子,并入所有这些文献为参考文献。在美国专利 5,614,395中公开了用于指导植物中新毒素基因表达的化学诱导型 (cestrum yellow leaf curling virus)启动子,这里整体并入这 篇文献为参考文献。
也可以在化学调节型启动子调节下表达本发明核苷酸序列。这能 够使得仅仅在用诱导化学试剂处理农作物时才能合成Vip3毒素。在 公开的申请EP 0 332 104(申请人Ciba-Geigy)和美国专利5,614,395 中详述了基因表达化学诱导的优选技术。化学诱导的优选启动子是烟 草PR-1a启动子。
优选的启动子种类是创伤诱导型启动子。已描述了在创伤位点及 植物病原体感染位点表达的大量启动子。理想地,这种启动子应该仅 在感染位点局部有活性,从而杀虫毒素仅在需要合成杀虫毒素以杀死 入侵昆虫害虫的细胞中积累。优选的这种启动子包括Stanford等, Mol.Gen.Genet.215:200-208(1989),Xu等,Plant Molec.Biol. 22:573-588(1993),Logemann等,Plant Cell 1:151-158(1989), Rohrmeier & Lehle,Plant Molec.Biol.22:783-792(1993),Firek 等,Plant Molec.Biol.22:129-142(1993),和Warner等,Plant J.3:191-201(1993)所述的启动子。
优选的组织特异性表达模式包括绿色组织特异性,根特异性,茎 特异性和花特异性。适于绿色组织中表达的启动子包括许多调节参与 光合作用基因的启动子,这样的许多启动子已从单子叶植物和双子叶 植物中克隆出来了。优选的启动子是来源于磷酸烯醇羧化酶基因的玉 米PEPC启动子(Hudspeth & Grula,Plant Molec.Biol.12:579-589 (1989))。根特异性表达的优选启动子是de Framond(FEBS 290: 103-106(1991);EP 0 452 269 to Ciba-Geigy)所述的启动子。 优选的茎特异性启动子是美国专利5,625,136(授予Ciba-Geigy)中 所述的启动子,该启动子驱动玉米trpA基因的表达。
其它优选实施方式是以创伤诱导方式或病原体感染诱导方式表 达所述核苷酸序列的转基因植物。
除了适合启动子的选择外,植物中杀虫毒素表达的构建需要连接 在异源核苷酸序列下游的适合的转录终止子。可得到几种这样的终止 子,并且它们是本领域已知的(例如来源于CaMV的tml,来源于rbcS 的E9)。任何已知在植物中起作用的可得到的终止子都可以用在本 发明上下文中。
也可以向本发明所述表达盒中引入大量其它的序列。这些序列包 括已经证明可增强表达的序列,如内含子序列(例如来源于Adhl和 bronzel)和病毒前导序列(例如来源于TMV,MCMV和AMV)。
有可能优选将本发明核苷酸序列的表达靶向到植物中不同细胞 定位。在一些情况下,可能期望定位在细胞溶胶中,而在其它情况下, 可能优选定位在一些亚细胞细胞器中。转基因所编码的酶的亚细胞定 位可采用本领域熟知的技术。通常,操作编码来源于已知靶向细胞器 的基因产物的靶肽的DNA,使之融合到核苷酸序列的上游。已知用于 叶绿体的许多这种靶序列,并且已证明了它们在异源构建中的功能。 本发明核苷酸序列的表达也可靶向到宿主细胞的内质网或液泡中。实 现上述这些目的的技术是本领域熟知的。
在本说明书以外描述了适于植物转化的载体。对于农杆菌 (Agrobacterium)介导的转化,双元载体或带有至少一个T-DNA边 界序列的载体是适合的,而对于直接的基因转移,任何载体都是适合 的,并且优选仅含有目的构建体的线性DNA。在直接基因转移的情况 下,可以进行利用单一DNA种类的转化或共转化(Schocher等, Biotechnology 4:1093-1096(1986))。对于直接基因转移和农杆 菌(Agrobacterium)介导的转移,通常(但不是必需)采用选择标 记,该选择标记可以提供对抗生素(卡那霉素,潮霉素,或氨甲喋呤) 或除草剂(basta)的抗性。然而,选择标记的选择对本发明不是至关 重要的。
在另一个优选实施方式中,可直接将本发明核苷酸序列转化进入 质体基因组中。质体转化的主要优点是质体通常不需要实质修饰就能 表达细菌基因,并且质体能表达单一启动子控制下的多个开放读框。 在美国专利5 451 513,5 545 817和5 545 818中,PCT申请号WO 95/16783中和McBride等,(1994)Proc.Nati.Acad.Sci.USA 91,7301-7305中详尽地描述了质体转化技术。叶绿体转化的基本技 术包括例如利用biolistics或原生质体转化(例如氯化钙或PEG介 导的转化)将目的基因和位于选择标记侧翼的克隆质体DNA区域一起 引入适合的靶组织中。1到1.5kb侧翼区域,称为导向序列,可促进 与质体基因组的同源重组,因此允许原质体系(plastome)特定区域 的置换和修饰。最初,可利用在提供壮观霉素和/或链霉素抗性的叶 绿体16S rRNA和rps12基因的点突变作为转化的选择标记(Svab,Z., Hajdukiewicz,P.,和Maliga,P.(1990)Proc.Nati.Acad.Sci. USA 87,8526-8530;Staub,J.M.,和Maliga,P.(1992)Plant Cell 4,39-45)。这以约每100次靶叶片轰击约1次的频率产生稳定的同质 转化体。这些标记间存在的克隆位点可用来产生用于导入外源基因的 质体靶向载体(Staub,J.M.,和Maliga,P.(1993)EMBO J. 12,601-606)。通过用显性选择标记,如编码壮观霉素去毒酶 (cletoxifying enzyme)酶氨基糖苷-3’-腺苷酰转移酶的细菌aadA基 因置换隐性rRNA或r-蛋白质抗生素抗性基因可使转化频率显著增加 (Svab,Z.和Maliga,P.(1993)Proc.Natl.Acad.Sci.USA 90,913-917)。以前,该标记已成功地用于高频率转化Chlamydomonas reinhardtii的质体基因组((Goldschmidt-Clermont,)M.(1991) Nucl.Acids Res.19:4083-4089)。其它可用于质体转化的选择标 记是本领域已知的,并且包含在本发明范围内。通常,转化后需要约 15到20个细胞分裂循环以达到同质状态。通过同源重组将基因插入 每个植物细胞中存在的所有数千拷贝环形质体基因组中的质体表达 利用了拷贝数大大高于核表达基因的优势,使得表达水平可以容易地 超过总可溶植物蛋白质的10%。在优选实施方式中,将本发明核苷 酸序列插入到质体靶向载体中,并且转化进入期望的植物宿主质体基 因组中。获得了对于含有本发明核苷酸序列的质体基因组而言属同质 的植物,优选地,该植物具有高水平地表达该核苷酸序列的能力。 控制昆虫要素的联合
可以联合Btδ-内毒素或其它杀虫要素来使用本发明的杀虫毒素 以增加害虫靶范围。而且,本发明杀虫毒素与Btδ-内毒素或其它不 同特性的杀虫要素的联合使用,对于昆虫抗性的预防和/或处理具有 特定的用途。已经根据苏云金芽孢杆菌(Bacillus thuringiensis) 的各种杀虫结晶蛋白质的活性谱和序列相似性对其进行了分类。然 后,Hofte和Whiteley,Microbiol.Rev.53:242-255(1989)提 出的分类将已知的杀虫结晶蛋白质分为4大类。通常,通过活性谱定 义所述的大类,Cry1蛋白质具有抗鳞翅目活性,Cry2蛋白质具有抗 鳞翅目和双翅目活性,Cry3蛋白质具有抗鞘翅目活性,Cry4蛋白质 具有抗双翅目活性。
在每个大类中,根据序列相似性将δ-内毒素组分。Cry1蛋白质 通常以130-140kDa前毒素蛋白质产生,蛋白酶解切割该前毒素后产 生约60-70kDa的活性毒素。δ-内毒素的活性部分存在于全长分子 的NH2-末端部分。然后,Hofte和Whiteley(上文)将已知的Cry1 蛋白质分为δ组,lAa,lAb,lAc,1B,1C和1D。从此,也鉴定了分 类为CrylEa,CrylFa,Cry9A,Cry9C和Cry9B及其它类的蛋白质。
苏云金芽孢杆菌(Bacillus thuringiensis)各δ-内毒素的杀 虫活性谱趋向于非常窄,一种δ-内毒素仅仅抗几种昆虫。特异性是 参与产生活性毒素蛋白质的各个步骤的效率和其随后与昆虫消化道 上皮细胞相互作用的能力的结果。在一个优选实施方式中,转基因植 物中本发明核酸分子的表达伴随着一种或多种Btδ-内毒素的表达。 特别优选的Btδ-内毒素是在美国专利5,625,136中公开的Btδ-内 毒素,这里并入其为参考文献。
熟知许多苏云金芽孢杆菌(Bacillus thuringiensis)的δ-内 毒素蛋白质实际上以前毒素(protoxin)形式表达。这些前毒素在昆 虫肠道碱性环境中发生溶解,通过蛋白酶的蛋白酶解转化为有毒的核 心片段(Hofte和Whiteley,Microbiol.Rev.53:242-255(1989))。 对于Cry1类的δ-内毒素蛋白质,有毒的核心片段定位在前毒素N末 端一半中。在本发明范围内,在植物转化载体中可以利用编码全长前 毒素形式或新毒素蛋白质的截短形式的有毒核心片段的基因以提供 对宿主植物的杀虫特性。
其它的杀虫要素包括蛋白酶抑制剂(丝氨酸和半胱氨酸类型), 凝集素,α-淀粉酶,过氧化物酶和胆固醇氧化酶。本发明中也可利 用其它Vip编码序列,如美国专利5,849,870中所公开的vip1A(a) 和vip2A(a),这里并入其为参考文献。
可以通过基因工程改造植物以含有和表达所有必需的基因来实 现同一转基因植物中该多个杀虫要素的共表达。可替代地,可以基因 工程改造植物亲本1以表达本发明基因。可以基因工程改造第二株植 物即亲本2以表达补充的控制昆虫要素。通过杂交亲本1和亲本2, 可获得表达引入亲本1和亲本2中的所有基因的子代植物。
本发明也包含所公开核酸分子的变体。通过应用熟知的分子生物 学技术,例如,如下所概述的PCR和杂交技术,可以鉴定和/或分离 天然存在的变体序列。
变体vip3核苷酸序列包括合成来源的核苷酸序列,如,例如通 过利用定点诱变产生的核苷酸序列,或通过整个结构域交换产生的核 苷酸序列,但是这些核苷酸序列仍然显示了杀虫活性。诱变和核苷酸 序列改变的方法是本领域已知的。参见,例如Kunkel(1985)Proc. Natl.Acad.Sci.USA 82:488-492;Kunkel等(1987)Methods in Enzymol.154:367-382;美国专利号4,873,192;Walker和 Gaastra编辑(1983)Techniques in Molecular Biology(MacMillan) Publishing Company,New York)及其中引用的参考文献。通常,本 发明的核苷酸序列与其相应的参照vip3核苷酸序列有至少80%,优 选85%,90%,95%,达到98%或更多的序列同一性,并且有杀虫 活性。
变体Vip3核苷酸序列也包含来源于诱变和重组方法如DNA改组 的序列。用这种方法,可以将本发明的一种或多种不同的vip3序列 (例如vip3B和vip3A-B,但不限于此)重组在一起,或与其它vip3 或相关序列(例如非vip3A(SEQ ID NO:5),但不限于此)相重组, 以产生编码具有期望特性的Vip3毒素的新vip3核酸分子。用这种方 式,可从序列相关的vip3多核苷酸库产生重组vip3多核苷酸文库, 所述序列相关性vip3多核苷酸包含有基本序列同一性的序列区域, 并且可以在体外或体内同源重组。用于这种DNA改组的策略是本领域 已知的。参见,例如Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri 等,(1997)Nature Biotech.15:436-438;Moore等,(1997)J. Mol.Biol.272:336-347;Zhang等,(1997)Proc.Natl.Acad.Sci. USA 94:4504-4509;Crameri等,(1998)Nature 391:288-291; 国际专利申请WO 99/57128和美国专利号5,605,793,5,837,458和 6,335,179。
可以将这里公开的诱变方法和高处理量的筛选方法联合应用,以 检测宿主细胞中克隆的诱变Vip3多肽的杀虫活性。可以从宿主细胞 中回收编码活性Vip3多肽(例如,分泌性的和通过抗体检测的;或 昆虫生物测定中有杀虫活性的)的诱变DNA分子,并用标准工艺方法 快速测序。这些方法可以快速测定目的Vip3多肽中单个氨基酸残基 的重要性,可以应用于未知结构的多肽。
可对用DNA改组方法产生的重组vip3基因文库进行筛选,以鉴 定显示在用于保护植物抗害虫方面具有改进特性的重组vip3基因。 可利用DNA改组获得改进的vip3害虫抗性基因特性的是有增加的抗 靶害虫的效力,增加的靶害虫范围,害虫发展抗性的可能性降低,增 加的表达水平,对蛋白酶降解有增加的抗性,增加的环境稳定性和对 宿主植物的毒性降低。通过利用适合的筛选策略,能同时或依次获得 对多个特性进行了优化的vip3基因。
利用DNA改组可获得编码毒素的vip3害虫抗性基因,所述毒素 显示了增强的抗靶害虫效力。一旦完成改组,即可筛选由此得到的改 组vip3基因文库,以鉴定显示增强的杀虫活性的vip3基因。进行该 筛选的一个方法是将经过改组的vip3基因的蛋白质编码区域克隆进 入表达载体中,所述表达载体适于在选定宿主细胞,例如大肠杆菌 (E.coli)或苏云金芽孢杆菌(Bacillus thuringiensis)无晶体 株系中表达所述基因。本领域技术人员将认识到利用这两种表达系统 的优点和缺点。例如在产生分泌性Vip3蛋白质中将更期望使用苏云 金芽孢杆菌(Bacillus thuringiensis)。如果期望,可以对克隆进 行初步筛选,例如通过免疫测定法,以鉴定产生正确大小的Vip3蛋 白质的克隆。然后在功能筛选中检测初步筛选中的阳性克隆,以鉴定 编码有期望的增强活性的毒素的改组vip3基因。
完整昆虫测定法可以用于检测毒性。在这些测定法中,在昆虫饵 料,例如人工饵料或植物组织中放置改组vip3基因表达的Vip3毒素, 并且该靶昆虫将消耗该Vip3毒素。可以在进一步生物测定中检测引 起靶昆虫生长抑制或死亡的这些克隆以测定效力。编码具有增强效力 的毒素的改组vip3基因可以鉴定为有降低的EC50(降低昆虫生长50 %必需的毒素浓度)和/或LC50(引起50%死亡率必需的毒素浓度) 的改组vip3基因。
体外测定法也可以用于筛选改组vip3基因文库。这种测定法通 常包括应用对Vip3毒素敏感的培养昆虫细胞和/或表达Vip3毒素受 体的细胞,所述Vip3毒素或者是天然的或者是异源基因表达的结果。 可以利用其它的体外测定法,例如细胞形态学改变的测定,可用于测 定细胞死亡的染料和标记,或细胞ATPase释放的测定。利用培养的 昆虫细胞进行Vip3毒性测定的一个适合的体外测定例子是Sf9 (Spodoptera frugiperda)细胞。Sf9对Vip3毒素高度敏感。当混合 Vip3毒素和Sf9细胞时,细胞膜变得对小分子高度通透。当向细胞 悬浮液加入染料如台盼蓝时,那些被Vip3毒素杀死的细胞染色为蓝 色。因此,可以通过图象分析测定Vip3毒素的细胞毒性。
另一个体外测定法包括Vip3毒素受体的应用。在美国专利 6,291,156中公开了这样的一种受体,这里并其为参考文献。可以在 接受表面(例如96孔板或硝化纤维素膜,但不限于此)固定Vip3受 体蛋白质,并将其暴露于包含改组vip3基因的克隆。因此,可以根 据对Vip3受体的结合亲和性鉴定编码功能性毒素的改组vip3基因。 而且,利用本领域已知的方法(参见,例如Clem和Miller,1194,Mol. Cel.Biol.14:52 12-522),可以将编码Vip3受体的基因转化进入 非Vip3敏感细胞系例如Schneider 2(S2)果蝇细胞系中。然后,将 转化的S2细胞暴露于包含改组vip3基因的克隆。因此,可以根据细 胞死亡的诱导鉴定编码功能性毒素的改组vip3基因。
实施例
参考下面详细的实施例将进一步描述本发明。仅仅为了示例目的 而提供这些实施例,除了另外说明,这些实施例不意味着是限制性的。 这里所用的标准重组DNA和分子克隆技术也是本领域已知的,并且 Ansubel(编辑)Current Protocols in Molecular Biology,John Wiley和Sons,.Inc.(1994);T.Maniatis,E.F.Fritsch和J. Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor laboratory,Cold Spring Harbor,NY(1998);和T.J. Silhavy,M.L Berman,和L.W.Enquist,Experiments with Gene Fusions,Cold Spring Harbor Laboratory,Cold Spring Harbor, NY(1984)描述了这些技术。
实施例1:苏云金芽孢杆菌(Bacillus thuringiensis)株系 AB1183粘粒文库的构建
通过在37℃用2mg/ml溶菌酶处理重悬在100mM Tris pH8,10mM EDTA中的新鲜生长的细胞30分钟,从命名为AB1183的苏云金芽孢 杆菌(Bacillus thuringiensis)分离总DNA。在1%SDS,50mM EDTA, 1M脲中加入蛋白酶至终浓度100μg/ml,在55℃温育。加入等体积 的苯酚-氯仿-异戊醇。轻轻混合样品5分钟,以3K离心。重复该 步骤2次。然后用0.7体积异丙醇混合水相,离心。用70%乙醇洗 DNA沉淀3次,在0.5 X TE中轻轻重悬。在37℃,在100μl体积中, 用0.3单位Sau3A/μg DNA处理12μg DNA。每2分钟间隔取样,持 续10分钟。然后加入1/10体积10 X TE,在65℃加热样品30分钟 以灭活酶。对样品进行电泳以测定40kb范围的部分,并且在连接中 利用该样品。
利用BamHI克隆位点,如供应商所述制备SuperCos粘粒载体 (Stratagene,La Jolla,CA)。在5μl体积中,以2∶1比率将100 ηg/ml制备的SuperCos和事先用Sau3A消化的AB1183 DNA在6℃连 接过夜。如供应商所述,用Gigapack XL III(Stratagene)包装连 接混合物。如供应商所述,使包装的噬菌体感染进入XL-1MR大肠杆 菌(E.coli)细胞(Stratagene)。在有50μg/ml的L-琼脂上涂布 平板粘粒文库,在37℃温育16小时。挑选和培养1200个菌落用于 检测抗昆虫活性。
实施例2:粘粒克隆的生物测定
筛选实施例1的1200个菌落的抗烟蚜夜蛾(Heliothis virescens)新生幼虫的杀虫活性。在人工饵料上,用表面污染方法进 行生物测定。7天后对生物测定评分。发现8个克隆对烟蚜夜蛾 (Heliothis virescens)具有杀虫活性。
实施例3:杀虫活性粘粒克隆的分析
为了鉴定vip3同源序列,利用Carozzi等(1991,Appl.Env. Microbiol.57:3057-3061)的方法,用来自于vip3A基因(SEQ ID NO:4)5’引发区域的引物在8个烟蚜夜蛾(Heliothis virescens) 阳性克隆上进行PCR分析。用于该分析的引物是
正向:5’-GTGATCTAACCCTAGACG-3’        (SEQ ID NO:8)
反向:5’-GCTTTAGTTCCATTCACTCC-3’    (SEQ ID NO:9).
一个克隆产生了vip3类相关基因的预期大小的DNA条带。将来 自于该克隆的3.8kb EcoRI片段亚克隆进入pBluescript (Stratagene),转化进入大肠杆菌(E.coli)。用PCR分析证实了该 大肠杆菌(E.coli)克隆包含vip3同源编码序列。该vip3同源编码 序列被命名为vip3B。包含vip3B编码序列的大肠杆菌(E.coli)克 隆的生物测定结果证明了Vip3B毒素与烟蚜夜蛾(Heliothis virescens)活性有关。包含在该克隆中的质粒以及该克隆被命名为 pCIB9400。
实施例4:全长vip3B基因的克隆和测序
用BglII和EcoRV切割pCIB9400以除去vip3B编码序列3’末端 附近约800bp的侧翼序列。用Klenow聚合酶(New England Biolabs, Beverly,Mass.)补平由此得到的片段的末端,然后用T4连接酶(New England Biolabs,Beverly,Mass.)连接在一起。转化该连接混合 物进入大肠杆菌(E.coli)DH5α细胞中。用标准碱裂解方法从单菌 落中分离质粒DNA,进行几种限制性消化以确保删除了该800bp的侧 翼序列。由此得到的质粒命名为pNOV1325,并且保藏在ATCC保藏号 PTA-3868的大肠杆菌(E.coli)中。
用双脱氧链终止方法进行测序,用Applied Biosystems Inc.模 式3700自动DNA测序仪(Foster City,CA)完成测序。用Gene Codes Corporation(Ann Arbor,Michigan)的Sequencher 4.05装配序列。
序列分析鉴定了编码约88KDa分子量的787氨基酸蛋白质(SEQ ID NO:2)的2364bp编码序列(SEQ ID NO:1)。vip3B核苷酸序列与vip3A 基因核苷酸序列有86%同一性。Vip3B蛋白质氨基酸序列与Vip3A蛋 白质氨基酸序列有88%同一性。
实施例5:pNOV1325和pCIB9400中表达的Vip3B蛋白质的生物测定
向50mm培养皿中倾入熔化的小地老虎饵料(BioServ, Frenchtown,NJ),并且使其凝固。用移液管转移200μl含有 pNOV1325或pNOV9400(每种均含有vip3B编码序列)的 Top10(Invitrogen,)大肠杆菌(E.coli)细胞到饵料表面。用细菌 环均一地涂抹溶液以使悬浮液覆盖整个饵料的表面。使表面完全干 燥。用极细的尖刷在饵料上放置下表列出的鳞翅目物种的第一龄期幼 虫。分开检测每个物种。在幼虫侵染饵料后3天和5天记录幼虫死亡 率。用包含没有载体的Top10大肠杆菌(E.coli)细胞的样品作为阴 性对照。为了比较的目的,也可以在相同生物测定中检测Vip3A蛋白 质。对于该实施例,比较该实施例获得的Vip3B数据和Vip3A的已知 活性谱数据。
表1所示的是生物测定结果。表1中所示数据是从侵染后第5天 的记录。在大肠杆菌(E.coli)阴性对照中观察到很少活性或没有活 性。结果表明Vip3B毒素比Vip3A毒素有更广谱的活性,因为Vip3B 具有抗欧洲玉米螟(Ostrinia Nubilalis)和小菜蛾(Plutella xylostella)的活性。结果也表明Vip3B对谷实夜蛾(Helicoverpa zea)比Vip3A毒素有更高的比活性。
表1
昆虫                                                           百分死亡率
                                          pCIB9400   pNOV1325  大肠杆菌(E.coli)   Vip3A的活性
                                                               对照               谱b
烟草天蛾(Manduca sexta)                   100        100        0                 +
小地老虎(Agrotis ipsilon)                 100        100        5                 +
谷实夜蛾(Helicoverpa zea)                 100        100        10                +
烟蚜夜蛾(Heliothis virescens)             100        100        10                +
贪夜蛾(Spodoptera exigua)                 100        90         10                +
秋粘虫(Spodoptera frugiperda)             100        100        0                 +
欧洲玉米螟(Ostrinia nubilalis)            100        100        0                 -
小菜蛾(Plutella xylostella)               100        100        0                 -
粉斑夜蛾(Trichoplusia ni)                 100        100        0                 +
棉红铃虫(Pectinophora gossypiella)        50a       50a       0                 +
向日葵细卷叶蛾(Cochylis hospcs)           60a       80a       0                 + 
a观察到存活的昆虫有严重的进食和生长抑制。
b“+”表示对Vip3A敏感的昆虫物种,“-”表示对Vip3A几乎 没有或完全没有敏感性的昆虫物种。
实施例6:玉米优化的vip3B编码序列的构建
根据美国专利5,625,136中公开的方法制备合成的玉米优化 vip3B编码序列。在该方法中,利用了玉米偏爱的密码子,即最常编 码玉米中该氨基酸的单密码子。特定氨基酸的玉米偏爱密码子可从玉 米的已知基因序列推知。在Murray等,Nucleic Acids Research 17: 477-498(1989)中发现了玉米植物28个基因的密码子用法。将合成 的vip3B编码序列(SEQ ID NO:3)克隆进入pET101/D-Topo表达载 体。命名由此得到的载体为pNOV1328,将其转化进入大肠杆菌 (E.coli)DH5α细胞中,以ATCC保藏号PTA-3869保藏。
实施例7:包含vip3B基因的转基因玉米植物的产生
选择合成的玉米优化的vip3B(SEQ ID NO:3)编码序列用于转 化进入玉米植物。将包含合成vip3B编码序列的表达盒转移到用于农 杆菌(Agrobacterium)介导的玉米转化的适合载体。构建用于该实 施例的3个载体:(a)包含两个vip3B表达盒的载体,第一表达盒 包含MTL:vip3B,第二表达盒包含PEPC:vip3B,(b)包含CMP:vip3B 的载体,(c)包含UbiP:vip3B的载体。用在该实施例中的所有载体 也包含用于转基因系筛选的磷酸甘露糖异构酶(PMI)基因(Negrotto 等,(2000)Plant Cell Reports 19:(798-803)。
将所有3个载体分别转化进入玉米中。基本如Negrotto等,(2000) Plant Cell Reports 19:798-803所述进行未成熟玉米胚的转化。 对于该实施例,所有培养基组分都如上文Negrotto等中所述。然而, 可以替换本领域已知的各种培养基组分。
在28℃,在YEP(酵母提取物(5g/L),蛋白胨(10g/L), NaCl(5g/L),15g/L琼脂,pH 6.8)固体培养基上培养包含植物转化 质粒的农杆菌(Agrobacterium)株系LBA4404(pSBl)2-4天。在补充 了100μM As(Negrotto等,(2000)Plant Cell Rep 19:798-803) 的LS-inf培养基中悬浮大约0.8×109个农杆菌(Agrobacterium)。在 该培养基上预诱导细菌30-60分钟。
从8-12日龄的穗切下A188未成熟胚,放入液体LS-inf+100μ M As中。也可以利用其它玉米生殖质的未成熟胚形式。用新鲜感染 培养基润洗胚一次。然后加入农杆菌(Agrobacterium)溶液,涡旋胚 30秒,使其和细菌共存5分钟。然后,将胚以小盾片侧朝上的方向 转移到LSA培养基中,在黑暗中培养2到3天。随后,按每个培养皿 20到25个胚的方式将胚转移到补充了头孢噻肟(250mg/l)和硝酸 银(1.6mg/l)的LSDc培养基中,在28℃黑暗中培养约10天。
将产生胚性愈伤组织的未成熟胚转移到LSD1M 0.5S培养基中。 在该培养基上筛选培养物约6周,同时在约3周进行传代培养步骤。 转移存活的愈伤组织到补充了甘露糖的Reg1培养基中。在光中(16 小时光/8小时黑暗管理)培养后,转移绿色组织到没有生长调物的 Reg2培养基上,温育约1-2周。将小植物转移到含有Reg3培养基 的Magenta GA-7盒(Magenta Corp,Chicago I11.)中,在光下生长。 约2-3周后,通过PCR检测植物中PMI基因和vip3B基因的存在。 PCR检测为阳性的植物转移到温室,检测对鳞翅目害虫的抗性。 实施例8:表达Vip3B的转基因玉米植物的分析
昆虫的生物测定
当从Magenta GA-7盒移植植物到土壤中时,从植物取样。取样 包括切下两小片叶片(大约2-4cm长),放置每片叶片在小培养皿 中。阴性对照或者是来自于相同转化试验的vip3B基因呈PCR阴性的 转基因植物,或者是同转基因植物在类似生长条件下生长的(与检测 植物有相似大小的)非转基因植物。
通过在每个叶片上放置10只第一龄幼虫,用欧洲玉米螟 (Ostrinia Nubilalis)或秋粘虫(Spodoptera frugiperda)接种每 个植物的叶片样品。然后,严密地密封培养皿。也可以利用其它适合 的昆虫害虫。
在接种约3-4天后,收集数据。计算幼虫的百分死亡率。同时 可以确定叶片的可视损害等级。喂食损害分级为高级,中级,低级或 没有,数值分别为3,2,1或0。
表2所示是转基因植物的生物测定结果。结果表明包含vip3B基 因和表达Vip3B蛋白质的转基因玉米植物对欧洲玉米螟(Ostrinia Nubilalis)和秋粘虫(Spodoptera frugiperda)具有杀虫活性。
表2表达Vip3B的转基因玉米植物的效力 事件 启动子:vip3B 构建体 %FAW死亡率/植物a   %ECB死亡率/植物b 118A MTL:vip3B/ PEPC:vip3B 100,100,100,100,100,100,100,100,100, 100,100,100,100,100,100,100,100,100, 100,100,100,100,100,100,100,100,100, 100 90,100,100,90,100,100,80,100 100,100,100,90,90,90,100,100 90,100,70,80,70,100,100,100, 70,100,80,80 121A MTL:vip3B/ PEPC:vip3B 90,100,100,100,100,100,100,100,100, 100,100,100,100,100,100,100,100,100, 100,100,100,100,100,100,100,100,100, 100,100,100,100  70,80,70,90,80,80,90,80,80,90, 100,100,80,90,70,90,80,100,80, 100,70,80,70,70,90,100,100,90 90,90,90 142C MTL:vip3B/ PEPC:vip3B 100,100,100,100,100,100,100,100,100  80,100,90,80,90,70,70,90,90 145B MTL:vip3B/ PEPC:vip3B 100,100,100,100,100,100,100,100,100, 100,100,100,100,100,100,100,100,100, 100  80,70,90,100,70,70,100,80,80, 70,100,100,100,100,70,100,90, 90,90 89A CMP:vip3B 100,100,100,100,100,100,100,100   100,100,100,100,100,100,100,100 190A CMP:vip3B 100,100,100,100,100,100,100,100,100   100,80,90,80,90,100,80,100,80
aFAW=秋粘虫
aECB=欧洲玉米螟
ELISA测定
用ELISA测定各种转基因玉米组织中Vip3B蛋白质的水平。根据 美国专利5,625,136中公开的方法进行了ELISA分析。表3所示的是 ELISA分析的结果。
表3  转基因玉米中Vip3B蛋白质的水平  指定组织中Vip3B蛋白质平均水平(μg/mg可溶性蛋白) 事件  叶片  木髓  外皮  花粉 118A  20±12  0.316±0.240  0.686±0.645  0 121A  20±19  0.523±0.387  0.723±0.343  0 142C  18±17  1.12±0.770  3.75±1.30  0 145B  19±13  0.720±0.720  2.23±2.0  0
实施例9:杂合Vip3毒素
Vip3B对欧洲玉米螟(Ostrinia Nubilalis)和小菜蛾(Plutella xylostella)是有毒性的,而相关的Vip毒素Vip3A几乎没有或完全 没有活性。Vip3B和Vip3A主要不同在于它们各自氨基酸序列的C- 末端区域,特别是SEQ ID NO:2氨基酸579到氨基酸787区域。为 了证明Vip3B的该C-末端区域是Vip3B毒素中足够提供抗欧洲玉米 螟(Ostrinia Nubilalis)和小菜蛾(Plutella xylostella)的活性 的部分,构建了一种杂合毒素,其中包含由SEQ ID NO:2氨基酸579 开始、氨基酸787终止的Vip3B C-末端区域以及按从氨基到羧基方 面连接的由SEQ ID NO:5氨基酸1开始、氨基酸578终止的Vip3A N- 末端区域。命名该杂合毒素为Vip3A-B(SEQ ID NO:7)
用下面引物,利用两步PCR构建编码Vip3A-B杂合毒素的核酸分 子:
VIP3A-N:5’-ATGACCAAGAATAATACTAAATTAAGCAC-3’                       (SEQ ID NO:10)
VIPfus4:5’-TCCTTATGAACATATAAAGCTTTAGTTCCATT-3’                 (SEQ ID NO:11)
VIP3B-C:5’-GGCGAATTCTCACTTAATCGAAAAATTCCGGAAATTTAT-3’(SEQ ID NO:12)
VIPfus3:5’-AATGGAACTAAAGCTTTATATGTTCATAAGGA-3’                 (SEQ ID NO:13)
在第一步PCR中,用引物Vip3A-N(SEQ ID NO:10)和Vipfus4 (SEQ ID NO:11)产生编码N-末端区域的vip3A基因5’末端约1.7kb 的片段,用引物VipB-C(SEQ ID NO:12)和Vipfus3(SEQ ID NO: 13)产生编码C-末端区域的vip3B基因3’末端约0.7kb的片段。在 第二步PCR中,联合这两个片段作为引物Vip3A-N(SEQ ID NO:10) 和Vip3B-C(SEQ ID NO:12)的模板以产生约2.4kb的杂合 vip3A-vip3B基因,命名为vip3A-B(SEQ ID NO:6)。
用实施例5概述的方法,检测表达杂合Vip3A-B毒素的大肠杆菌 (E.coli)克隆的抗秋粘虫和欧洲玉米螟杀虫活性。一些生物测定的 结果表明,Vip3B的C-末端区域足以赋予杂合毒素以欧洲玉米螟活 性。
实施例10:通过DNA改组的vip3基因的体外重组
通过PCR扩增本发明的vip3基因之一,例如SEQ ID NO:1,3,或 6。基本如Stemmer等,PNAS 91:10747-10751(1994)所述,通过 DnaseI处理消化由此得到的DNA片段,从反应混合物除去PCR引物。 如Stemmer等(1994)所述,进行没有引物的PCR反应,随后进行有 引物的PCR反应。将由此得到的DNA片段克隆进入 pTRC99a(Pharmacia,目录号:27-5007-01),利用Biorad基因脉冲 发生器和制备商的条件,通过电穿孔转化进入大肠杆菌(E.coli)株 系SASX38。在培养基上过夜培养转化的细菌,筛选杀虫活性。
在相似的反应中,使包含本文所述vip3基因之一(SEQ ID NO:1,3, 或6或其突变体)的PCR扩增DNA片段和包含至少一个本文所述的其 它vip3基因的PCR扩增DNA片段(或其突变体)发生体外重组,如 下所述回收由此得到的具有改进杀虫特性的变体。
为了增加改组vip3基因文库的多样性,利用合成寡核苷酸改组 对一个或多个vip3基因(称为初级基因)进行改组。合成对应于至 少一个多样性区域的大量(例如,2,5,10,20,50,75,或100 或更多)寡核苷酸。可以直接对这些寡核苷酸改组,或可以与该核酸 家族的一种或多种重组。
可以从称为次级基因的其它vip3基因获取寡核苷酸序列。次级 基因与初级基因有一定程度的同源性。有几种选择用于寡核苷酸合成 的次级基因部分的方法。例如,可以随机选择次级基因的部分。DNA 改组方法将选择那些可以引入到改组基因中的寡核苷酸。
只要选定的部分适合合成,它们可以是任何长度。也可以根据初 级和次级基因之间的同源性设计寡核苷酸。一定程度的同源性对于改 组期间必需发生在DNA片段间的交换是必要的。同时,强的异质性对 于改组基因文库的多样性也是需要的。而且,根据蛋白质序列知识和 功能关系,可以选择用于寡核苷酸合成的次级基因特定部分。
本发明公开了Vip3B的C-末端结构域部分地与Vip3毒素的活性 谱有关。当利用DNA改组技术,通过本发明修饰杀虫谱时,可以选择 次级基因核苷酸序列的C-末端区域作为靶区域用于合成寡核苷酸改 组方法中应用的寡核苷酸。
因为Vip3蛋白质的杀虫活性至少部分地依赖于N-末端区域,可 以选择次级基因的N-末端区域进行寡核苷酸改组,以增加杀虫活性。
实施例11:高处理量筛选杀虫活性
筛选大肠杆菌(E.coli)或者苏云金芽孢杆菌(Bacillus thuringiensis)中改组vip3基因文库的杀虫活性。用Q-bot (Beckman)挑出菌落,放在标准96孔规格板中的生长培养基中,过 夜生长。然后,以96孔规格将每个克隆铺到昆虫饵料表面上,使表 面干燥。可选地,向每个孔加入转化细胞群以增加起始筛选循环中检 测的克隆数。例如,每孔筛选100个克隆,利用10000个孔可进行 106个克隆的筛选。
向每个孔加入几种新生靶昆虫幼虫,例如烟蚜夜蛾(Heliothis virescens),谷实夜蛾(Helicoverpa zea)或秋粘虫(Spodoptera frugiperda)。用透气膜包裹该板,以使幼虫保留在所放置的孔中。5 天后,对各孔评估消耗饵料的量和/或昆虫死亡率。选择显示几乎没 有或完全没有消耗饵料和/或观察到高昆虫死亡率的孔中的克隆用于 进一步分析。应该能发现有增强的抗靶昆虫活性的几个克隆。
在本发明说明书中提到的所有出版物和专利申请显示了本发明 所属领域普通技术人员的技术水平。这里单独并具体地并入所有出版 物和专利申请为参考文献。
应该理解这里所述的实施例和实施方式仅仅是示例目的,本领域 技术人员能够理解在其基础上的各种修饰或改变,这样的内容都包括 在该申请精神和范围内及所附权利要求范围内。
                             序列表
<110>Miles,Paul
Kramer,Vance
Shen,Zhicheng
Shotkoski,Frank
Warren,Greg
<120>新型杀虫毒素
<130>S-60000P1
<160>13
<170>PatentIn version 3.0
<210>1
<211>2364
<212>DNA
<213>苏云金芽孢杆菌
<220>
<221>CDS
<222>(1)..(2364)
<223>天然vip3B编码序列
<400>1
atg aac aag aat aat act aaa tta aac gca agg gcc tta ccg agt ttt        48
Met Asn Lys Asn Asn Thr Lys Leu Asn Ala Arg Ala Leu Pro Ser Phe
1               5                   10                  15
att gat tat ttt aat ggc att tat gga ttt gcc act ggt atc aaa gac        96
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
            20                  25                  30
acc acg aac atg att ttt aaa acg gat aca ggt gga aat cta acc cta        144
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asn Leu Thr Leu
        35                  40                  45
gac gaa att tta aaa aat cag cag tta tta aat gag att tct ggt aaa        192
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Glu Ile Ser Gly Lys
    50                  55                   60
ttg gat ggg gta aat ggg agc tta aac gat ctt atc gca cag gga aac        240
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65                  70                  75                  80
tta aat aca gaa tta tct aag gaa atc tta aaa att gca aat gag cag        288
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
                85                  90                  95
aat caa gtc tta aat gat gtt aat aac aaa ctt aat gcg ata aat aca        336
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asn Ala Ile Asn Thr
            100                 105                 110
atg ctt cac ata tat cta cct aaa att aca tct atg tta aat gat gta        384
Met Leu His Ile Tyr Leu Pro Lys Ile Thr Ser Met Leu Asn Asp Val
        115                 120                 125
atg aaa caa aat tat gca cta agt ctg caa ata gaa tac cta agt aaa        432
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
    130                 135                 140
caa ttg caa gaa att tcc gac aag tta gat gtc att aac gtg aat gta        480
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Val Ile Asn Val Asn Val
145                 150                 155                 160
ctt att aac tct aca ctt act gaa att aca cct gcg tat caa cgg atg        528
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Met
                165                 170                 175
aaa tat gta aat gaa aaa ttt gaa gat tta act ttt gct aca gaa acc        576
Lys Tyr Val Asn Glu Lys Phe Glu Asp Leu Thr Phe Ala Thr Glu Thr
            180                 185                 190
act tta aaa gta aaa aag aat agc tcc cct gca gat att ctt gat gag        624
Thr Leu Lys Val Lys Lys Asn Ser Ser Pro Ala Asp Ile Leu Asp Glu
        195                 200                 205
tta act gag tta act gaa cta gcg aaa agt gta aca aaa aat gac gtg        672
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
    210                 215                 220
gat ggt ttt gaa ttt tac ctt aat aca ttc cac gat gta atg gta gga        720
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225                 230                 235                 240
aac aat tta ttc ggg cgt tca gct tta aaa act gct tcg gaa tta atc        768
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
                245                 250                 255
gct aaa gaa aat gtg aaa aca agt aac agt gag gta gga aat gtt tat        816
Ala Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
            260                 265                 270
aat ttc tta att gta tta aca gct ctg caa gca aaa gct ttt ctt act         864
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
        275                 280                 285
tta aca aca tgc cgg aaa tta tta ggc tta gca gat att gat tat act         912
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
    290                 295                 300
ttc att atg aat gaa cat tta gat aag gaa aaa gag gaa ttt aga gta         960
Phe Ile Met Asn Glu His Leu Asp Lys Glu Lys Glu Glu Phe Arg Val
305                 310                 315                 320
aat atc ctt cct aca ctt tct aat act ttt tct aat cct aac tat gca        1008
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
                325                 330                 335
aaa gct aaa gga agc aat gaa gat gca aag ata att gtg gaa gct aaa        1056
Lys Ala Lys Gly Ser Asn Glu Asp Ala Lys Ile Ile Val Glu Ala Lys
            340                 345                 350
cca gga tat gct ttg gtt gga ttt gaa atg agc aat gat tca atc aca        1104
Pro Gly Tyr Ala Leu Val Gly Phe Glu Met Ser Asn Asp Ser Ile Thr
        355                 360                 365
gta tta aaa gca tat cag gct aag cta aaa caa gat tat caa gtt gat        1152
Val Leu Lys Ala Tyr Gln Ala Lys Leu Lys Gln Asp Tyr Gln Val Asp
    370                 375                 380
aaa gat tcg tta tca gaa att gtc tat ggt gat atg gat aaa tta ttg        1200
Lys Asp Ser Leu Ser Glu Ile Val Tyr Gly Asp Met Asp Lys Leu Leu
385                 390                 395                 400
tgc ccg gat caa tct gaa caa ata tat tat aca aat aac att gct ttt        1248
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Ala Phe
                405                 410                 415
ccc aat gaa tat gta att act aaa att act ttt act aaa aaa atg aat        1296
Pro Asn Glu Tyr Val Ile Thr Lys Ile Thr Phe Thr Lys Lys Met Asn
            420                 425                 430
agt tta aga tat gag gca aca gct aat ttt tat gat tct tct aca ggg        1344
Ser Leu Arg Tyr Glu Ala Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
        435                 440                 445
gat att gat cta aat aag aca aaa gta gaa tca agt gaa gca gag tat        1392
Asp Ile Asp Leu Asn Lys Thr Lys Val Glu Ser Ser Glu Ala Glu Tyr
    450                 455                 460
agt acg cta agt gct agt act gat gga gtc tat atg ccg tta ggt att        1440
Ser Thr Leu Ser Ala Ser Thr Asp Gly Val Tyr Met Pro Leu Gly Ile
465                 470                 475                 480
atc agt gaa aca ttt ttg act cca att aat ggg ttt gpa atc gta gtc        1488
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Ile Val Val
                485                 490                 495
gat gaa aat tca aaa tta gta aat tta aca tgt aaa tca tat tta aga        1536
Asp Glu Asn Ser Lys Leu Val Asn Leu Thr Cys Lys Ser Tyr Leu Arg    
            500                 505                 510
gag gta tta tta gca aca gac tta agt aat aaa gaa act aaa ttg att        1584
Glu Val Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
        515                 520                 525
gtc cca cct att ggt ttt att agc aat att gta gaa aat ggg aac tta        1632
Val Pro Pro Ile Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Asn Leu
    530                 535                 540
gag gga gaa aac tta gag ccg tgg aaa gca aat aac aaa aat gcg tat        1680
Glu Gly Glu Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545                 550                 555                 560
gta gat cat aca ggc ggc gta aat gga act aaa gct tta tat gtt cat        1728
Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
                565                 570                 575
aag gat ggt gag ttt tca caa ttt att gga gat aag ttg aaa tcg aaa        1776
Lys Asp Gly Glu Phe Ser Gln Phe Ile Gly Asp Lys Leu Lys Ser Lys
            580                 585                 590
aca gaa tat gta att caa tat att gta aag gga aaa gct tct att ctt        1824
Thr Glu Tyr Val Ile Gln Tyr Ile Val Lys Gly Lys Ala Ser Ile Leu
        595                 600                 605
ttg aaa gat gaa aaa aat ggt gat tgc att tat gaa gat aca aat aat        1872
Leu Lys Asp Glu Lys Asn Gly Asp Cys Ile Tyr Glu Asp Thr Asn Asn
    610                 615                 620
ggt tta gaa gat ttt caa acc att act aaa agt ttt att aca gga acg        1920
Gly Leu Glu Asp Phe Gln Thr Ile Thr Lys Ser Phe Ile Thr Gly Thr
625                 630                 635                 640
gat tct tca gga gtt cat tta ata ttt aat agt caa aat ggc gat gaa        1968
Asp Ser Ser Gly Val His Leu Ile Phe Asn Ser Gln Asn Gly Asp Glu
                645                 650                 655
gca ttt ggg gaa aac ttt act att tca gaa att agg ctt tcc gaa gat        2016
Ala Phe Gly Glu Asn Phe Thr Ile Ser Glu Ile Arg Leu Ser Glu Asp
            660                 665                 670
tta tta agt cca gaa ttg ata aat tca gat gct tgg gtt gga tct cag        2064
Leu Leu Ser Pro Glu Leu Ile Asn Ser Asp Ala Trp Val Gly Ser Gln
        675                 680                 685
gga act tgg atc tca gga aat tca ctc act att aat agt aat gtg aat        2112
Gly Thr Trp Ile Ser Gly Asn Ser Leu Thr Ile Asn Ser Asn Val Asn
    690                 695                 700
gga act ttt cga caa aac ctt tcg tta gaa agc tat tca act tat agt        2160
Gly Thr Phe Arg Gln Asn Leu Ser Leu Glu Ser Tyr Ser Thr Tyr Ser
705                 710                 715                 720
atg aac ttt aat gtg aat gga ttt gcc aag gtg aca gta aga aat tcc        2208
Met Asn Phe Asn Val Asn Gly Phe Ala Lys Val Thr Val Arg Asn Ser
                725                 730                 735
cgt gaa gta tta ttt gaa aaa aat tat ccg cag ctt tca cct aaa gat        2256
Arg Glu Val Leu Phe Glu Lys Asn Tyr Pro Gln Leu Ser Pro Lys Asp
            740                 745                 750
att tct gaa aaa ttc aca act gca gcc aat aat acc ggg ttg tat gta        2304
Ile Ser Glu Lys Phe Thr Thr Ala Ala Asn Asn Thr Gly Leu Tyr Val
        755                 760                 765
gag ctt tct cgt ttt aca tcg ggt ggc gct ata aat ttc cgg aat ttt        2352
Glu Leu Ser Arg Phe Thr Ser Gly Gly Ala Ile Asn Phe Arg Asn Phe
    770                 775                 780
tcg att aag tga                                                        2364
Ser Ile Lys
785
<210>2
<211>787
<212>PRT
<213>苏云金芽孢杆菌
<400>2
Met Asn Lys Asn Asn Thr Lys Leu Asn Ala Arg Ala Leu Pro Ser Phe
1               5                   10                  15
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
            20                  25                  30
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asn Leu Thr Leu
        35                  40                  45
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Glu Ile Ser Gly Lys
    50                  55                  60
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65                  70                  75                  80
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
                85                  90                  95
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asn Ala Ile Asn Thr
            100                 105                 110
Met Leu His Ile Tyr Leu Pro Lys Ile Thr Ser Met Leu Asn Asp Val
        115                 120                 125
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
    130                 135                 140
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Val Ile Asn Val Asn Val
145                 150                 155                 160
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Met
                165                 170                 175
Lys Tyr Val Asn Glu Lys Phe Glu Asp Leu Thr Phe Ala Thr Glu Thr
            180                 185                 190
Thr Leu Lys Val Lys Lys Asn Ser Ser Pro Ala Asp Ile Leu Asp Glu
        195                 200                 205
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
    210                 215                 220
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225                 230                 235                 240
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
                245                 250                 255
Ala Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
            260                 265                 270
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
        275                 280                 285
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
    290                 295                 300
Phe Ile Met Asn Glu His Leu Asp Lys Glu Lys Glu Glu Phe Arg Val
305                 310                 315                 320
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
                325                 330                 335
Lys Ala Lys Gly Ser Asn Glu Asp Ala Lys Ile Ile Val Glu Ala Lys
            340                 345                 350
Pro Gly Tyr Ala Leu Val Gly Phe Glu Met Ser Asn Asp Ser Ile Thr
        355                 360                 365
Val Leu Lys Ala Tyr Gln Ala Lys Leu Lys Gln Asp Tyr Gln Val Asp
    370                 375                 380
Lys Asp Ser Leu Ser Glu Ile Val Tyr Gly Asp Met Asp Lys Leu Leu
385                 390                 395                 400
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Ala Phe
                405                 410                 415
Pro Asn Glu Tyr Val Ile Thr Lys Ile Thr Phe Thr Lys Lys Met Asn
            420                 425                 430
Ser Leu Arg Tyr Glu Ala Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
        435                 440                 445
Asp Ile Asp Leu Asn Lys Thr Lys Val Glu Ser Ser Glu Ala Glu Tyr
    450                 455                 460
Ser Thr Leu Ser Ala Ser Thr Asp Gly Val Tyr Met Pro Leu Gly Ile
465                 470                 475                 480
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Ile Val Val
                485                 490                 495
Asp Glu Asn Ser Lys Leu Val Asn Leu Thr Cys Lys Ser Tyr Leu Arg
            500                 505                 510
Glu Val Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
        515                 520                 525
Val Pro Pro Ile Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Asn 5eu
    530                 535                 540
Glu Gly Glu Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545                 550                 555                 560
Val Asp His Thr Gly Gly Vai Asn Gly Thr Lys Ala Leu Tyr Val His
                565                 570                 575
Lys Asp Gly Glu Phe Ser Gln Phe Ile Gly Asp Lys Leu Lys Ser Lys
            580                 585                 590
Thr Glu Tyr Val Ile Gln Tyr Ile Val Lys Gly Lys Ala Ser Ile Leu
        595                 600                 605
Leu Lys Asp Glu Lys Asn Gly Asp Cys Ile Tyr Glu Asp Thr Asn Asn
    610                 615                 620
Gly Leu Glu Asp Phe Gln Thr Ile Thr Lys Ser Phe Ile Thr Gly Thr
625                 630                 635                 640
Asp Ser Ser Gly Val His Leu Ile Phe Asn Ser Gln Asn Gly Asp Glu
                645                 650                 655
Ala Phe Gly Glu Asn Phe Thr Ile Ser Glu Ile Arg Leu Ser Glu Asp
            660                 665                 670
Leu Leu Ser Pro Glu Leu Ile Asn Ser Asp Ala Trp Val Gly Ser Gln
        675                 680                 685
Gly Thr Trp Ile Ser Gly Asn Ser Leu Thr Ile Asn Ser Asn Val Asn
    690                 695                 700
Gly Thr Phe Arg Gln Asn Leu Ser Leu Glu Ser Tyr Ser Thr Tyr Ser
705                 710                 715                 720
Met Asn Phe Asn Val Asn Gly Phe Ala Lys Val Thr Val Arg Asn Ser
                725                 730                 735
Arg Glu Val Leu Phe Glu Lys Asn Tyr Pro Gln Leu Ser Pro Lys Asp
            740                 745                 750
Ile Ser Glu Lys Phe Thr Thr Ala Ala Asn Asn Thr Gly Leu Tyr Val
        755                 760                 765
Glu Leu Ser Arg Phe Thr Ser Gly Gly Ala Ile Asn Phe Arg Asn Phe
    770                 775                 780
Ser Ile Lys
785
<210>3
<211>2364
<212>DNA
<213>合成DNA
<220>
<221>misc_feature
<222>(1)..(2364)
<223>玉米优化的vip3B
<400>3
atgaacatga acaacaccaa gctcaacgcc cgcgccctcc cgtccttcat cgactacttc        60
aacggcatct acggcttcgc caccggcatc aaggacatca tgaacatgat cttcaagacc       120
gacaccggcg gcaacctcac cctcgacgag atcctcaaga accagcagct cctcaacgag       180
atttccggca agctcgacgg cgtgaacggc tccctcaacg acctcatcgc ccagggcaac       240
ctcaacaccg agctgtccaa ggagatcctc aagatcgcca acgagcagaa ccaggtgctc       300
aacgacgtga acaacaagct caacgccatc aacaccatgc tccacatcta cctcccgaag       360
atcacctcca tgctcaacga cgtgatgaag cagaactacg ccctctccct ccagatcgag       420
tacctctcca agcagctcca ggagatttcc gacaagctcg acgtgatcaa cgtgaacgtg       480
ctcatcaact ccaccctcac cgagatcacc ccggcctacc agcgcatgaa gtacgtgaac       540
gagaagttcg aggacctcac cttcgccacc gagaccaccc tcaaggtgaa gaagaactcc       600
tccccggccg acatcctcga cgagctgacc gagctgaccg agctggccaa gtccgtgacc       660
aagaacgacg tggacggctt cgagttctac ctcaacacct tccacgacgt gatggtgggc       720
aacaacctct tcggccgctc cgccctcaag accgcctccg agctgatcgc caaggagaac       780
gtgaagacct ccggctccga ggtgggcaac gtgtacaact tcctcatcgt gctcaccgcc       840
ctccaggcca aggccttcct caccctcacc acctgccgca agctcctcgg cctcgccgac       900
atcgactaca ccttcatcat gaacgagcac ctcgacaagg agaaggagga gttccgcgtg       960
aacatcctcc cgaccctctc caacaccttc tccaacccga actacgccaa ggccaagggc      1020
tccaacgagg acgccaagat catcgtggag gccaagccgg gctacgccct cgtgggcttc      1080
gagatgtcca acgactccat caccgtgctc aaggcctacc aggccaagct caagcaggac      1140
taccaggtgg acaaggactc cctctccgag atcgtgtacg gcgacatgga caagctcctc      1200
tgcccggacc agtccgagca aatctactac accaacaaca tcgccttccc gaacgagtac      1260
gtgatcacca agatcacctt caccaagaag atgaactccc tccgctacga ggccaccgcc      1320
aacttctacg actcctccac cggcgacatc gacctcaaca agaccaaggt ggagtcctcc      1380
gaggccgagt actccaccct ctccgcctcc accgacggcg tgtacatgcc gctcggcatc      1440
atctccgaga ccttcctcac cccgatcaac ggcttcggca tcgtggtgga cgagaactcc      1500
aagctcgtga acctcacctg caagtcctac ctccgcgagg tgctcctcgc caccgacctc      1560
tccaacaagg agaccaagct catcgtgccg ccgatcggct tcatctccaa catcgtggag      1620
aacggcaacc tggagggcga gaacctggag ccgtggaagg ccaacaacaa gaacgcctac   1680
gtggaccaca ccggcggcgt gaacggcacc aaggccctct acgtgcacaa ggacggcgag   1740
ttctcccagt tcatcggcga caagctcaag tccaagaccg agtacgtgat ccagtacatc   1800
gtgaagggca aggcctccat cctcctcaag gacgagaaga acggcgactg catctacgag   1860
gacaccaaca acggcctgga ggacttccag accatcacca agtccttcat caccggcacc   1920
gactcctccg gcgtgcacct catcttcaac tcccagaacg gcgacgaggc cttcggcgag   1980
aacttcacca tctccgagat ccgcctctcc gaggacctcc tctccccgga gctgatcaac   2040
tccgacgcct gggtgggctc ccagggcacc tggatctccg gcaactccct caccatcaac   2100
tccaacgtga acggcacctt ccgccagaac ctctccctgg agtcctactc cacctactcc   2160
atgaacttca acgtgaacgg cttcgccaag gtgaccgtgc gcaactcccg cgaggtgctc   2220
ttcgagaaga actacccgca gctctccccg aaggacatct ccgagaagtt caccaccgcc   2280
gccaacaaca ccggcctcta cgtggagctg tcccgcttca cctccggcgg cgccatcaac   2340
ttccgcaact tctccatcaa gtag                                          2364
<210>4
<211>2367
<212>DNA
<213>苏云金芽孢杆菌
<220>
<221>CDS
<222>(1)..(2367)
<223>天然vip3A编码序列
<400>4
atg aac aag aat aat act aaa tta agc aca aga gcc tta cca agt ttt        48
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe
1               5                   10                  15
att gat tat ttt aat ggc att tat gga ttt gcc act ggt atc aaa gac        96
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
            20                  25                  30
att atg aac atg att ttt aaa acg gat aca ggt ggt gat cta acc cta       144
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
        35                  40                  45
gac gaa att tta aag aat cag cag tta cta aat gat att tct ggt aaa        192
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
    50                  55                  60
ttg gat ggg gtg aat gga agc tta aat gat ctt atc gca cag gga aac        240
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65                  70                  75                  80
tta aat aca gaa tta tct aag gaa ata tta aaa att gca aat gaa caa        288
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
                85                  90                  95
aat caa gtt tta aat gat gtt aat aac aaa ctc gat gcg ata aat acg        336
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
            100                 105                 110
atg ctt cgg gta tat cta cct aaa att acc tct atg ttg agt gat gta        384
Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
        115                 120                 125
atg aaa caa aat tat gcg cta agt ctg caa ata gaa tac tta agt aaa        432
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
    130                 135                 140
caa ttg caa gag att tct gat aag ttg gat att att aat gta aat gta        480
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val
145                 150                 155                 160
ctt att aac tct aca ctt act gaa att aca cct gcg tat caa agg att        528
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
                165                 170                 175
aaa tat gtg aac gaa aaa ttt gag gaa tta act ttt gct aca gaa act        576
Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
            180                 185                 190
agt tca aaa gta aaa aag gat ggc tct cct gca gat att ctt gat gag        624
Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu
        195                 200                 205
tta act gag tta act gaa cta gcg aaa agt gta aca aaa aat gat gtg        672
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
    210                 215                 220
gat ggt ttt gaa ttt tac ctt aat aca ttc cac gat gta atg gta gga        720
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225                 230                 235                 240
aat aat tta ttc ggg cgt tca gct tta aaa act gca tcg gaa tta att        768
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
                245                 250                 255
act aaa gaa aat gtg aaa aca agt ggc agt gag gtc gga aat gtt tat        816
Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
            260                 265                 270
aac ttc tta att gta tta aca gct ctg caa gca aaa gct ttt ctt act        864
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
        275                 280                 285
tta aca aca tgc cga aaa tta tta ggc tta gca gat att gat tat act         912
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
    290                 295                 300
tct att atg aat gaa cat tta aat aag gaa aaa gag gaa ttt aga gta         960
Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
305                 310                 315                 320
aac atc ctc cct aca ctt tct aat act ttt tct aat cct aat tat gca        1008
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
                325                 330                 335
aaa gtt aaa gga agt gat gaa gat gca aag atg att gtg gaa gct aaa        1056
Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
            340                 345                 350
cca gga cat gca ttg att ggg ttt gaa att agt aat gat tca att aca        1104
Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
        355                 360                 365
gta tta aaa gta tat gag gct aag cta aaa caa aat tat caa gtc gat        1152
Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
    370                 375                 380
aag gat tcc tta tcg gaa gtt att tat ggt gat atg gat aaa tta ttg        1200
Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu
385                 390                 395                 400
tgc cca gat caa tct gaa caa atc tat tat aca aat aac ata gta ttt        1248
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
                405                 410                 415
cca aat gaa tat gta att act aaa att gat ttc act aaa aaa atg aaa        1296
Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
            420                 425                 430
act tta aga tat gag gta aca gcg aat ttt tat gat tct tct aca gga        1344
Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
        435                 440                 445
gaa att gac tta aat aag aaa aaa gta gaa tca agt gaa gcg gag tat        1392
Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
    450                 455                 460
aga acg tta agt gct aat gat gat ggg gtg tat atg ccg tta ggt gtc        1440
Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val
465                 470                 475                 480
atc agt gaa aca ttt ttg act ccg att aat ggg ttt ggc ctc caa gct        1488
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
                485                 490                 495
gat gaa aat tca aga tta att act tta aca tgt aaa tca tat tta aga        1536
Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
            500                 505                 510
gaa cta ctg cta gca aca gac tta agc aat aaa gaa act aaa ttg atc        1584
Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
        515                 520                 525
gtc ccg cca agt ggt ttt att agc aat att gta gag aac ggg tcc ata        1632
Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
    530                 535                 540
gaa gag gac aat tta gag ccg tgg aaa gca aat aat aag aat gcg tat        1680
Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545                 550                 555                 560
gta gat cat aca ggc gga gtg aat gga act aaa gct tta tat gtt cat        1728
Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
                565                 570                 575
aag gac gga gga att tca caa ttt att gga gat aag tta aaa ccg aaa        1776
Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
            580                 585                 590
act gag tat gta atc caa tat act gtt aaa gga aaa cct tct att cat        1824
Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
        595                 600                 605
tta aaa gat gaa aat act gga tat att cat tat gaa gat aca aat aat        1872
Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
    610                 615                 620
aat tta gaa gat tat caa act att aat aaa cgt ttt act aca gga act        1920
Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr
625                 630                 635                 640
gat tta aag gga gtg tat tta att tta aaa agt caa aat gga gat gaa        1968
Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu
                645                 650                 655
gct tgg gga gat aac ttt att att ttg gaa att agt cct tct gaa aag        2016
Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
            660                 665                 670
tta tta agt cca gaa tta att aat aca aat aat tgg acg agt acg gga        2064
Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
        675                 680                 685
tca act aat att agc ggt aat aca ctc act ctt tat cag gga gga cga        2112
Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
    690                 695                 700
ggg att cta aaa caa aac ctt caa tta gat agt ttt tca act tat aga        2160
Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg
705                 710                 715                 720
gtg tat ttt tct gtg tcc gga gat gct aat gta agg att aga aat tct        2208
Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser
                725                 730                 735
agg gaa gtg tta ttt gaa aaa aga tat atg agc ggt gct aaa gat gtt        2256
Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
            740                 745                 750
tct gaa atg ttc act aca aaa ttt gag aaa gat aac ttt tat ata gag        2304
Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
        755                 760                 765
ctt tct caa ggg aat aat tta tat ggt ggt cct att gta cat ttt tac        2352
Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
    770                 775                 780
gat gtc tct att aag                                                    2367
Asp Val Ser Ile Lys
785
<210>5
<211>789
<212>PRT
<213>苏云金芽孢杆菌
<400>5
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe
1               5                   10                  15
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
            20                  25                  30
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
        35                  40                  45
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
     50                 55                  60
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65                  70                  75                  80
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
                85                  90                  95
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
            100                 105                 110
Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
        115                 120                 125
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
    130                 135                 140
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val
145                 150                 155                 160
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
                165                 170                 175
Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
            180                 185                 190
Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu 
        195                 200                 205
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
    210                 215                 220
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225                 230                 235                 240
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
                245                 250                 255
Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
            260                 265                 270
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
        275                 280                 285
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
    290                 295                 300
Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
305                 310                 315                 320
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
                325                 330                 335
Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
            340                 345                 350
Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
        355                 360                 365
Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
    370                 375                 380
Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu
385                 390                 395                 400
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
                405                 410                 415
Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
            420                 425                 430
Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
        435                 440                 445
Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
    450                 455                 460
Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val
465                 470                 475                 480
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
                485                 490                 495
Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
            500                 505                 510
Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
        515                 520                 525
Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
    530                 535                 540
Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545                 550                 555                 560
Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
                565                 570                 575
Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys
            580                 585                 590
Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His
        595                 600                 605
Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn
    610                 615                 620
Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr
625                 630                 635                 640
Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu
                645                 650                 655
Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys
            660                 665                 670
Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly
        675                 680                 685
Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg
    690                 695                 700
Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg
705                 710                 715                 720
Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser
                725                 730                 735
Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val
            740                 745                 750
Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu
        755                 760                 765
Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr
    770                 775                 780
Asp Val Ser Ile Lys
785
<210>6
<211>2364
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(2364)
<223>杂合vip3A-B(1734)
<400>6
atg aac aag aat aat act aaa tta agc aca aga gcc tta cca agt ttt         48
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe
1               5                   10                  15
att gat tat ttt aat ggc att tat gga ttt gcc act ggt atc aaa gac         96
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
            20                  25                  30
att atg aac atg att ttt aaa acg gat aca ggt ggt gat cta acc cta        144
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
        35                  40                  45
gac gaa att tta aag aat cag cag tta cta aat gat att tct ggt aaa        192
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
    50                  55                  60
ttg gat ggg gtg aat gga agc tta aat gat ctt atc gca cag gga aac        240
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65                  70                  75                  80
tta aat aca gaa tta tct aag gaa ata tta aaa att gca aat gaa caa        288
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
                85                  90                  95
aat caa gtt tta aat gat gtt aat aac aaa ctc gat gcg ata aat acg        336
Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
            100                 105                 110
atg ctt cgg gta tat cta cct aaa att acc tct atg ttg agt gat gta        384
Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
        115                 120                 125
atg aaa caa aat tat gcg cta agt ctg caa ata gaa tac tta agt aaa        432
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
    130                 135                 140
caa ttg caa gag att tct gat aag ttg gat att att aat gta aat gta        480
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile IIe Asn Val Asn Val
145                 150                 155                 160
ctt att aac tct aca ctt act gaa att aca cct gcg tat caa agg att        528
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
                165                 170                 175
aaa tat gtg aac gaa aaa ttt gag gaa tta act ttt gct aca gaa act        576
Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
            180                 185                 190
agt tca aaa gta aaa aag gat ggc tct cct gca gat att ctt gat gag        624
Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu
        195                 200                 205
tta act gag tta act gaa cta gcg aaa agt gta aca aaa aat gat gtg        672
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
    210                 215                 220
gat ggt ttt gaa ttt tac ctt aat aca ttc cac gat gta atg gta gga        720
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225                 230                 235                 240
aat aat tta ttc ggg cgt tca get tta aaa act gca tcg gaa tta att        768
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
                245                 250                 255
act aaa gaa aat gtg aaa aca agt ggc agt gag gtc gga aat gtt tat        816
Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
            260                 265                 270
aac ttc tta att gta tta aca gct ctg caa gca aaa gct ttt ctt act        864
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
        275                 280                 285
tta aca aca tgc cga aaa tta tta ggc tta gca gat att gat tat act        912
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
    290                 295                 300
tct att atg aat gaa cat tta aat aag gaa aaa gag gaa ttt aga gta        960
Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
305                 310                 315                 320
aac atc ctc cct aca ctt tct aat act ttt tct aat cct aat tat gca       1008
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
                325                 330                 335
aaa gtt aaa gga agt gat gaa gat gca aag atg att gtg gaa gct aaa       1056
Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
            340                 345                 350
cca gga cat gca ttg att ggg ttt gaa att agt aat gat tca att aca       1104
Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
        355                 360                 365
gta tta aaa gta tat gag gct aag cta aaa caa aat tat caa gtc gat       1152
Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
    370                 375                 380
aag gat tcc tta tcg gaa gtt att tat ggt gat atg gat aaa tta ttg       1200
Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu
385                 390                 395                 400
tgc cca gat caa tct gaa caa atc tat tat aca aat aac ata gta ttt       1248
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
                405                 410                 415
cca aat gaa tat gta att act aaa att gat ttc act aaa aaa atg aaa       1296
Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
            420                 425                 430
act tta aga tat gag gta aca gcg aat ttt tat gat tct tct aca gga       1344
Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
        435                 440                 445
gaa att gac tta aat aag aaa aaa gta gaa tca agt gaa gcg gag tat       1392
Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
    450                 455                 460
aga acg tta agt gct aat gat gat ggg gtg tat atg ccg tta ggt gtc       1440
Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val
465                 470                 475                 480
atc agt gaa aca ttt ttg act ccg att aat ggg ttt ggc ctc caa gct        1488
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
                485                 490                 495
gat gaa aat tca aga tta att act tta aca tgt aaa tca tat tta aga        1536
Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
            500                 505                 510
gaa cta ctg cta gca aca gac tta agc aat aaa gaa act aaa ttg atc        1584
Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
        515                 520                 525
gtc ccg cca agt ggt ttt att agc aat att gta gag aac ggg tcc ata        1632
Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
    530                 535                 540
gaa gag gac aat tta gag ccg tgg aaa gca aat aat aag aat gcg tat        1680
Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545                 550                 555                 560
gta gat cat aca ggc gga gtg aat gga act aaa gct tta tat gtt cat        1728
Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
                565                 570                 575
aag gat ggt gag ttt tca caa ttt att gga gat aag ttg aaa tcg aaa        1776
Lys Asp Gly Glu Phe Ser Gln Phe Ile Gly Asp Lys Leu Lys Ser Lys
            580                 585                 590
aca gaa tat gta att caa tat att gta aag gga aaa gct tct att ctt        1824
Thr Glu Tyr Val Ile Gln Tyr Ile Val Lys Gly Lys Ala Ser Ile Leu
        595                 600                 605
ttg aaa gat gaa aaa aat ggt gat tgc att tat gaa gat aca aat aat        1872
Leu Lys Asp Glu Lys Asn Gly Asp Cys Ile Tyr Glu Asp Thr Asn Asn
    610                 615                 620
ggt tta gaa gat ttt caa acc att act aaa agt ttt att aca gga acg        1920
Gly Leu Glu Asp Phe Gln Thr Ile Thr Lys Ser Phe Ile Thr Gly Thr
625                 630                 635                 640
gat tct tca gga gtt cat tta ata ttt aat agt caa aat ggc gat gaa        1968
Asp Ser Ser Gly Val His Leu Ile Phe Asn Ser Gln Asn Gly Asp Glu
                645                 650                 655
gca ttt ggg gaa aac ttt act att tca gaa att agg ctt tcc gaa gat        2016
Ala Phe Gly Glu Asn Phe Thr Ile Ser Glu Ile Arg Leu Ser Glu Asp
            660                 665                 670
tta tta agt cca gaa ttg ata aat tca gat gct tgg gtt gga tct cag        2064
Leu Leu Ser Pro Glu Leu Ile Asn Ser Asp Ala Trp Val Gly Ser Gln
        675                 680                 685
gga act tgg atc tca gga aat tca ctc act att aat agt aat gtg aat        2112
Gly Thr Trp Ile Ser Gly Asn Ser Leu Thr Ile Asn Ser Asn Val Asn
    690                 695                 700
gga act ttt cga caa aac ctt tcg tta gaa agc tat tca act tat agt        2160
Gly Thr Phe Arg Gln Asn Leu Ser Leu Glu Ser Tyr Ser Thr Tyr Ser
705                 710                 715                 720
atg aac ttt aat gtg aat gga ttt gcc aag gtg aca gta aga aat tcc        2208
Met Asn Phe Asn Val Asn Gly Phe Ala Lys Val Thr Val Arg Asn Ser
                725                 730                 735
cgt gaa gta tta ttt gaa aaa aat tat ccg cag ctt tca cct aaa gat        2256
Arg Glu Val Leu Phe Glu Lys Asn Tyr Pro Gln Leu Ser Pro Lys Asp
            740                 745                 750
att tct gaa aaa ttc aca act gca gcc aat aat acc ggg ttg tat gta        2304
Ile Ser Glu Lys Phe Thr Thr Ala Ala Asn Asn Thr Gly Leu Tyr Val
        755                 760                 765
gag ctt tct cgt ttt aca tcg ggt ggc gct ata aat ttc cgg aat ttt        2352
Glu Leu Ser Arg Phe Thr Ser Gly Gly Ala Ile Asn Phe Arg Asn Phe
    770                 775                 780
tcg att aag tga                                                        2364
Ser Ile Lys
785
<210>7
<211>787
<212>PRT
<213>人工序列
<400>7
Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe
1               5                   10                  15
Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp
            20                  25                  30
Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu
        35                  40                  45
Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys
    50                  55                  60
Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn
65                  70                  75                  80
Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln
                85                  90                  95
Asn Gln Val Leu ASn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr
            100                 105                 110
Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val
        115                 120                 125
Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys
    130                 135                 140
Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val
145                 150                 155                 160
Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile
                165                 170                 175
Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr
            180                 185                 190
Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu
        195                 200                 205
Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val
    210                 215                 220
Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly
225                 230                 235                 240
Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile
                245                 250                 255
Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr
            260                 265                 270
Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr
        275                 280                 285
Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr
    290                 295                 300
Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val
305                 310                 315                 320
Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala
                325                 330                 335
Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys
            340                 345                 350
Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr
        355                 360                 365
Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp
    370                 375                 380
Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu
385                 390                 395                 400
Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe
                405                 410                 415
Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys
            420                 425                 430
Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly
        435                 440                 445
Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr
    450                 455                 460
Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val
465                 470                 475                 480
Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala
                485                 490                 495
Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg
            500                 505                 510
Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile
        515                 520                 525
Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile
    530                 535                 540
Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr
545                 550                 555                 560
Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His
                565                 570                 575
Lys Asp Gly Glu Phe Ser Gln Phe Ile Gly Asp Lys Leu Lys Ser Lys
            580                 585                 590
Thr Glu Tyr Val Ile Gln Tyr Ile Val Lys Gly Lys Ala Ser Ile Leu
        595                 600                 605
Leu Lys Asp Glu Lys Asn Gly Asp Cys Ile Tyr Glu Asp Thr Asn Asn
    610                 615                 620
Gly Leu Glu Asp Phe Gln Thr Ile Thr Lys Ser Phe Ile Thr Gly Thr
625                 630                 635                 640
Asp Ser Ser Gly Val His Leu Ile Phe Asn Ser Gln Asn Gly Asp Glu
                645                 650                 655
Ala Phe Gly Glu Asn Phe Thr Ile Ser Glu Ile Arg Leu Ser Glu Asp
            660                 665                 670
Leu Leu Ser Pro Glu Leu Ile Asn Ser Asp Ala Trp Val Gly Ser Gln
        675                 680                 685
Gly Thr Trp Ile Ser Gly Asn Ser Leu Thr Ile Asn Ser Asn Val Asn
    690                 695                 700
Gly Thr Phe Arg Gln Asn Leu Ser Leu Glu Ser Tyr Ser Thr Tyr Ser
705                 710                 715                 720
Met Asn Phe Asn Val Asn Gly Phe Ala Lys Val Thr Val Arg Asn Ser
                725                 730                 735
Arg Glu Val Leu Phe Glu Lys Asn Tyr Pro Gln Leu Ser Pro Lys Asp
            740                 745                 750
Ile Ser Glu Lys Phe Thr Thr Ala Ala Asn Asn Thr Gly Leu Tyr Val
        755                 760                 765
Glu Leu Ser Arg Phe Thr Ser Gly Gly Ala Ile Asn Phe Arg Asn Phe
    770                 775                 780
Ser Ile Lys
785
<210>8
<211>18
<212>DNA
<213>合成DNA
<220>
<221>misc_feature
<223>正向引物
<400>8
gtgatctaac cctagacg
<210>9
<211>20
<212>DNA
<213>合成DNA
<220>
<221>misc_feature
<223>反向引物
<400>9
gctttagttc cattcactcc
<210>10
<211>29
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>正向引物Vip3A-N
<400>10
atgaccaaga ataatactaa attaagcac
<210>11
<211>32
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>反向引物Vipfus4
<400>11
tccttatgaa catataaagc  tttagttcca tt
<210>12
<211>39
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>反向引物Vip3B-C
<400>12
ggcgaattct cacttaatcg aaaaattccg gaaatttat
<210>13
<211>32
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>正向引物Vipfus3
<400>13
aatggaacta aagctttata tgttcataag ga                                    32