会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 烟草制品及加工 / 无烟烟草 / 烟草细胞色素p450基因的克隆

烟草细胞色素p450基因的克隆

阅读:878发布:2020-09-13

IPRDB可以提供烟草细胞色素p450基因的克隆专利检索,专利查询,专利分析的服务。并且本发明涉及烟草中的p450酶和编码p450酶的核酸序列,并涉及使用这些酶和核酸序列来改变植物表型的方法。,下面是烟草细胞色素p450基因的克隆专利的具体信息内容。

1. 一种分离自烟草的核酸分子,其中,所述核酸分子包含选自以下序列编号的 核酸序列:SEQ.ID.No.:149,151,153,155,157,159,161,163,165,167,169, 171,173,175,177,179,181,183,185,187,189,191,193,195,197,199, 201,203,205,207,209,211,213,215,217,219,221,223,225,227,229, 231,233,235,237,239,241,243,245,247,249,251,253,255,257,259, 261,263,265,267,269,271,273,275,277,279,281,283,285,287,289, 291,293,295和297。

2. 一种分离自烟草的核酸分子,其中,所述核酸分子包含选自SEQ.ID.No.299 至SEQ.ID.No.357的核酸序列。

3. 一种分离自烟草的蛋白质,其中,所述蛋白质包含选自以下序列编号的氨基 酸序列:SEQ.ID.No.:.150,152,154,156,158,160,162,164,166,168,170, 172,174,176,178,180,182,184,186,188,190,192,194,196,198,200, 202,204,206,208,210,212,214,216,218,220,222,224,226,228,230, 232,234,236,238,240,242,244,246,248,250,252,254,256,258,260, 262,264,266,268,270,272,274,276,278,280,282,284,286,288,290, 292,294,296和298。

4. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.180或 SEQ.ID.No.182,SEQ.ID.No.184或SEQ.ID.No.224有至少85%氨基酸相同性的氨基 酸序列。

5. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.218或 SEQ.ID No.246有至少85%氨基酸相同性的氨基酸序列。

6. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.168有至少 85%氨基酸相同性的氨基酸序列。

7. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.202,204 或SEQ.ID.No.276有至少85%氨基酸相同性的氨基酸序列。

8. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.20, SEQ.ID.No.260或SEQ.ID.No.268有至少85%氨基酸相同性的氨基酸序列。

9. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.256和 SEQ.ID.No.254有至少85%氨基酸相同性的氨基酸序列。

10. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.266或 SEQ.ID.No.240有至少85%氨基酸相同性的氨基酸序列。

11. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.172, SEQ.ID.No.190或SEQ.ID.No.220有至少85%氨基酸相同性的氨基酸序列。

12. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.216或 SEQ.ID.No.262有至少85%氨基酸相同性的氨基酸序列。

13. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.50, SEQ.ID.No.152,SEQ.ID.No.196或SEQ.ID No.198有至少85%氨基酸相同性的氨基 酸序列。

14. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.296, SEQ.ID.No.160,SEQ.ID.No.158,SEQ.ID.No.204,SEQ.ID.No.206和SEQ.ID.No.208 有至少85%氨基酸相同性的氨基酸序列。

15. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.162或 SEQ.ID.No.164有至少85%氨基酸相同性的氨基酸序列。

16. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.212,214, 238或254有至少85%氨基酸相同性的氨基酸序列。

17. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.188或170 有至少85%氨基酸相同性的氨基酸序列。

18. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.214,241, 258或252有至少85%氨基酸相同性的氨基酸序列。

19. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.186, SEQ.ID.No.248或SEQ.ID.No.228有至少85%氨基酸相同性的氨基酸序列。

20. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.298或 SEQ.ID.No.176有至少85%氨基酸相同性的氨基酸序列。

21. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.234有至 少85%氨基酸相同性的氨基酸序列。

22. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.236有至 少85%氨基酸相同性的氨基酸序列。

23. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.230有至 少85%氨基酸相同性的氨基酸序列。

24. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.174有至 少85%氨基酸相同性的氨基酸序列。

25. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.174有至少 85%氨基酸相同性的氨基酸序列。

26. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.226有至 少85%氨基酸相同性的氨基酸序列。

27. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.178有至 少85%氨基酸相同性的氨基酸序列。

28. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.272有至 少85%氨基酸相同性的氨基酸序列。

29. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.180或 SEQ.ID.No.182,SEQ.ID.No.184或SEQ.ID.No.224有至少90%氨基酸相同性的氨基 酸序列。

30. 一种分离自烟草的蛋白质,其中,所述蛋白质与SEQ.ID.No.218或SEQ.ID No.246的氨基酸序列有至少90%的同源性。

31. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.168有至 少90%氨基酸相同性的氨基酸序列。

32. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.202,204 或SEQ.ID.No.276有至少90%氨基酸相同性的氨基酸序列。

33. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.20, SEQ.ID.No.260或SEQ.ID.No.268有至少90%氨基酸相同性的氨基酸序列。

34. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.256和 SEQ.ID.No.254有至少90%氨基酸相同性的氨基酸序列。

35. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.266或 SEQ.ID.No.240有至少85%氨基酸相同性的氨基酸序列。

36. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.172, SEQ.ID.No.190或SEQ.ID.No.220有至少90%氨基酸相同性的氨基酸序列。

37. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.216或 SEQ.ID.No.262有至少90%氨基酸相同性的氨基酸序列。

38. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.50, SEQ.ID.No.152,SEQ.ID.No.196或SEQ.ID No.198有至少90%氨基酸相同性的氨基 酸序列。

39. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.296, SEQ.ID.No.160,SEQ.ID.No.158,SEQ.ID.No.204,SEQ.ID.No.206和SEQ.ID.No.208 有至少90%氨基酸相同性的氨基酸序列。

40. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.162或 SEQ.ID.No.164有至少90%氨基酸相同性的氨基酸序列。

41. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.212,214, 238或254有至少90%氨基酸相同性的氨基酸序列。

42. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.188或170 有至少90%氨基酸相同性的氨基酸序列。

43. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.214,241, 258或252有至少90%氨基酸相同性的氨基酸序列。

44. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.186, SEQ.ID.No.248或SEQ.ID.No.228有至少90%氨基酸相同性的氨基酸序列。

45. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.298或 SEQ.ID.No.176有至少90%氨基酸相同性的氨基酸序列。

46. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.234有至 少90%氨基酸相同性的氨基酸序列.

47. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.236有至 少90%氨基酸相同性的氨基酸序列。

48. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.230有至 少90%氨基酸相同性的氨基酸序列。

49. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.174有至 少90%氨基酸相同性的氨基酸序列。

50. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.174有至 少90%氨基酸相同性的氨基酸序列。

51. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.226有至 少90%氨基酸相同性的氨基酸序列。

52. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.178有至 少90%氨基酸相同性的氨基酸序列。

53. 一种分离自烟草的蛋白质,其中,所述蛋白质包含与SEQ.ID.No.272有至 少90%氨基酸相同性的氨基酸序列。

54. 一种转基因植物,其中,所述转基因植物包含权利要求1或2所述的核酸 分子。

55. 如权利要求54所述的转基因植物,其中,所述植物是一种烟草植物。

56. 一种产生转基因植物的方法,其特征在于,所述方法包括以下步骤:

(i)将所述核酸分子操作性连接于如权利要求1或2中任一所述的在所述植物 中具有启动子功能的核酸分子,以产生植物转化载体;

(ii)用步骤(i)的所述植物植物转化载体转化所述植物;

(iii)选择被所述转化载体转化的植物细胞;以及

(iv)从所述转化的植物细胞再生出转化植物。

57. 如权利要求56所述的方法,其中,所述核酸分子呈反义取向。。

58. 如权利要求56所述的方法,其中,所述核酸分子呈正义取向。

59. 如权利要求56所述的方法,其中,所述核酸分子呈RNA干扰取向。

60. 如权利要求56所述的方法,其中,所述核酸分子以双链RNA分子表达。

61. 如权利要求56所述的方法,其中,所述双链RNA分子长约15-25个核苷酸。

62. 如权利要求56所述的方法,其中,所述转基因植物是烟草植物。

63. 一种选择含有以下核酸分子的植物的方法,其中,该方法中分析所述植物 中是否存在选自以下的核酸序列:149,151,153,155,157,159,161,163,165, 167,169,171,173,175,177,179,181,183,185,187,189,191,193,195, 197,199,201,203,205,207,209,211,213,215,217,219,221,223,225, 227,229,231,233,235,237,239,241,243,245,247,249,251,253,255, 257,259,261,263,265,267,269,271,273,275,277,279,281,283,285, 287,289,291,293,295和297。

64. 如权利要求63所述的选择植物的方法,其中,对所述植物进行DNA杂交分 析。

65. 如权利要求64所述的选择植物的方法,其中,所述DNA杂交是Southern 印迹分析。

66. 如权利要求65所述的选择植物的方法,其中,所述DNA杂交是Northern 印迹分析。

67. 如权利要求66所述的选择植物的方法,其中,通过PCR检测分析所述植物。

68. 如权利要求67所述的方法,其中,所述植物是烟草植物。

69. 如权利要求85所述的方法,其中,所述DNA杂交包括一种核酸探针,所述 核酸探针是含有选自以下核酸序列的核酸片段,所述核酸序列是:149,151,153, 155,157,159,161,163,165,167,169,171,173,175,177,179,181,183, 185,187,189,191,193,195,197,199,201,203,205,207,209,211,213, 215,217,219,221,223,225,227,229,231,233,235,237,239,241,243, 245,247,249,251,253,255,257,259,261,263,265,267,269,271,273, 275,277,279,281,283,285,287,289,291,293,295和297。

70. 如权利要求69所述的选择植物的方法,其中,所述植物是转基因植物。

71. 如权利要求69所述的选择植物的方法,其中,所述植物选自诱变植物群体。

72. 如权利要求69所述的选择植物的方法,其中,所述植物选自育种植物群体。

73. 如权利要求69所述的选择植物的方法,其中,所述植物选自烟草。

说明书全文

本发明涉及编码烟草植物细胞色素p450酶(以后称为p450和p450酶)的核酸序 列,并涉及使用这些核酸序列来改变植物表型的方法。

发明背景

细胞色素p450能催化多种化学性质上不相似底物的酶促反应,其中包括内源和 外源底物的氧化、过氧化和还原代谢。在植物中,p450参与包括苯丙酸(phenyl propanoid)、生物碱类、萜类、脂类、氰苷和葡糖异硫氰酸盐等植物产物的合成等 生化途径(Chappel,Annu.Rev.Plant Physiol.Plant Mol.Biol.198,49:311-343)。 细胞色素p450,也称为p450血红素-硫醇盐蛋白,它通常的作用是在称为含p450的 单加氧酶系统的多组分电子传递链中作为终末氧化酶。它所催化的特定反应包括脱 甲基化,羟基化,环氧化,N-氧化,磺氧化,N-、S-和O-脱烷基化、脱硫化、脱氨 以及偶氮、硝基和N-氧基团的还原。
烟草植物p450酶的各种作用涉及影响苯丙酸、生物碱类、萜类、脂类、氰苷和 葡糖异硫氰酸盐等多种植物代谢物,以及其它化学物质。近年来,已知一些p450酶 在植物中可能影响到植物代谢物的组成。例如,人们一直希望通过育种改变所选脂 肪酸的特性,来改善某些植物的味道和香气;然而,我们几乎不知道参与控制这些 叶组分水平的机制。下调脂肪酸修饰有关的p450酶可能有助于所需脂肪酸的积累从 而提供更优的叶子表型的品质。p450酶的功能以及它们对植物组成的广泛作用仍待 揭示。例如,发现一类特定的p450酶能催化脂肪酸降解成挥发性的C6-和C9-醛和 醇,这种醛和醇是构成水果和蔬菜“清新绿色”味道的主要物质。可改变其它新型 靶向p450的水平,以通过修饰烟草叶片的脂质组成和相关降解代谢物来提高叶片组 分的品质。烟草叶片中的一些这种组分受衰老的影响,而衰老会促进叶片品质特征 的成熟。其它报道证明,p450酶有改变脂肪酸的作用,这些脂肪酸参与植物-病原体 相互作用和对疾病的抗性。
在其它方面,已提出p450酶参与生物碱的生物合成。去甲烟碱是烟草(Nicotiana tabaceum)中发现的次要生物碱。已假设该物质是由p450介导的烟碱脱甲基随后在N 位酰化和硝基化产生的,从而可产生一系列N-酰基烟碱(N-acylnonicotine)和N-亚 硝基去甲烟碱。由假定的p450脱甲基酶催化的N-脱甲基化被认为是烟草中去甲烟碱 生物合成的主要来源。由于据信此酶是微粒体酶,因此至今未能成功纯化得到烟碱 脱甲基酶,也未能分离到与其有关的基因。
此外,预计p450酶的活性受遗传控制同时受到环境因素的强烈影响,但还未证 实。例如,当烟草长到成熟期时认为植物中烟碱的脱甲基化尤为增加。此外,预计 脱甲基酶基因包含一个可转运的元件,该元件存在时可抑制RNA的翻译,但也未证 实这一猜想。
在本发明之前,由于p450酶形式的多样性、它们的不同结构和功能使得对烟草 p450酶的研究变得非常困难。此外,由于这些膜定位蛋白通常以低丰度存在且常对 纯化不稳定,故而对p450酶的克隆至少部分受阻。因此,存在着对鉴定植物中p450 酶和这些p450酶相关核酸序列的需要。特别是只报道了烟草中的少数细胞色素p450 蛋白。这里本发明详细描述了一些细胞色素p450片段的发现,根据其序列相同性, 这些片段相应于几组p450类型。
发明概述
本发明涉及植物p450酶。本发明也涉及烟草的植物p450酶。本发明还涉及植物 中表达受乙烯和/或植物衰老所诱导的p450酶。本发明还涉及植物中具有酶活性(例 如,可分类为加氧酶、脱甲基酶等)或其它活性的核酸序列,以及这些序列在降低或 阻止这些酶表达或过表达中的应用。本发明还涉及在相对于具有较低去甲烟碱水平 的植物,含有较高去甲烟碱水平的植物中发现的p450酶。
一方面,本发明涉及SEQ.ID.Nos.1,3,5,7,9,11,13,15,17,19,21, 23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57, 59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,95, 97,99,101,103,105,107,109,111,113,115,117,119,121,123,125, 127,129,131,133,135,137,139,143,145,147,149,151,153,155,157, 159,161,163,165,167,169,171,173,175,177,179,181,183,185,187, 189,191,193,195,197,199,201,203,205,207,209,211,213,215,217, 219,221,223,225,227,229,231,233,235,237,239,241,243,245,247, 249,251,253,255,257,259,261,263,265,267,269,271,273,275,277, 279,281,283,285,287,289,291,293,295和297中列出的核酸序列。
在第二个相关方面,根据细胞色素p450基序GXRXCX(G/A)后至终止密码子之间的 的第一个核酸相应区域中它们的相同性,将那些核酸序列相同性超过75%的片段分成 不同的组。代表性核酸分组和代表性种类列在表I中。
在第三个方面,本发明涉及SEQ.ID.Nos.2,4,6,8,10,12,14,16,18,20, 22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56, 58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92, 96,98,100,102,104,106,108,110,112,114,116,118,120,122,124, 126,128,130,132,134,136,138,140,144,146,148,150,152,154,156, 158,160,162,164,166,168,170,172,174,176,178,180,182,184,186, 188,190,192,194,196,198,200,202,204,206,208,210,212,214,216, 218,220,222,224,226,228,230,232,234,236,238,240,242,244,246, 248,250,252,254,256,258,260,262,264,266,268,270,272,274,276, 278,280,282,284,286,288,290,292,294,296和298中列出的氨基酸序列。
在第四个相关方面,根据细胞色素p450基序GXRXCX(G/A)后至终止密码子之间的 第一氨基酸相应区域中它们相互之间的相同性,将那些氨基酸序列相同性超过71% 的片段分成不同的组。代表性氨基酸分组和代表性种类列在表II中。
在第五个方面,本发明涉及SEQ.ID.Nos.150,152,154,156,158,160,162, 164,166,168,170,172,174,176,178,180,182,184,186,188,190,192, 194,196,198,200,202,204,206,208,210,212,214,216,218,220,222, 224,226,228,230,232,234,236,238,240,242,244,246,248,250,252, 254,256,258,260,262,264,266,268,270,272,274,276,278,280,282, 284,286,288,290,292,294,296和298中列出的全长基因编码的氨基酸序列。
在第六个相关方面,根据它们相互之间的相同性,将那些所编码的氨基酸序列相 同性等于或大于85%的全长基因分成不同的组。代表性氨基酸分组和代表性种类列在 表III中。
在第七个方面,本发明涉及SEQ.ID.Nos.299-357中所列出的片段的氨基酸序列。
在第八个相关方面,根据第一细胞色素p450结构域UXXRXXZ至第三细胞色素结 构域GXRXO的相应区域中它们相互之间的相同性,将那些核酸序列相同性等于或大 于90%的片段分成不同的组,其中,U是E或K,X是任何氨基酸,Z是R、T、S或M。 代表性氨基酸分组和代表性种类列在表IV中。
在第九个相关方面,烟草植物中p450酶的还原或消除或过表达可用RNA病毒系 统暂时实现。
可评估所得被转化或感染的植物的表型变化,包括但不限于用此领域的一般技术 人员通常已知的常规技术来分析内源性p450RNA转录物、p450表达的肽和植物代谢 物的浓度。
在第十个重要方面,本发明还涉及制造具有改变的p450酶活性水平的转基因烟 草品系。根据本发明,这些转基因品系包含可有效降低或抑制或增强某些酶的表达 从而在烟草中产生表型效应的核酸序列。这种核酸序列包括SEQ.ID.Nos.1,3,5, 7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43, 45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79, 81,83,85,87,89,91,95,97,99,101,103,105,107,109,111,113,115, 117,119,121,123,125,127,129,131,133,135,137,139,143,145,147, 149,151,153,155,157,159,161,163,165,167,169,171,173,175,177, 179,181,183,185,187,189,191,193,195,197,199,201,203,205,207, 209,211,213,215,217,219,221,223,225,227,229,231,233,235,237, 239,241,243,245,247,249,251,253,255,257,259,261,263,265,267, 269,271,273,275,277,279,281,283,285,287,289,291,293,295和297。
在非常重要的本发明的第十一个方面,含有本发明核酸的植物栽培物相对于对照 植物将具有改变的代谢特征,利用所述核酸的全长基因或其片段的负调节能力,或 其全长基因过表达能力。
在本发明的第十二个方面,含有本发明核酸的植物栽培物可用于耐受某些外源化 学物质或植物害虫,利用所述核酸的全长基因或其片段来修饰植物或植物外植体代 谢物的生物合成或降解。所述核酸序列包括SEQ ID.Nos.1,3,5,7,9,11,13, 15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49, 51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85, 87,89,91,95,97,99,101,103,105,107,109,111,113,115,117,119, 121,123,125,127,129,131,133,135,137,139,143,145,147,149,151, 153,155,157,159,161,163,165,167,169,171,173,175,177,179,181, 183,185,187,189,191,193,195,197,199,201,203,205,207,209,211, 213,215,217,219,221,223,225,227,229,231,233,235,237,239,241, 243,245,247,249,251,253,255,257,259,261,263,265,267,269,271, 273,275,277,279,281,283,285,287,289,291,293,295和297。
在第十三个方面,本发明涉及对植物,尤其是烟草的选择,这些植物的基因含有 与所述核酸序列基本相同的核酸。应用本发明将有利于鉴定和选择含有完全相同或 基本相同的核酸序列的植物,其中,这种植物是传统或转基因品种育种方案、诱变 方案或自然产生的不同植物群体的一部分。选择核酸基本相同的植物,可通过用核 酸探针以及包括但不限于核酸杂交和PCR分析在内的核酸检测方法来评价植物核酸 物质来实现。所述核酸探针可由下述核酸序列或其片段构成:SEQ ID1,3,5,7,9, 11,13,15,17,19,21,23,25,27,29,31,33,35,37,39,41,43,45, 47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81, 83,85,87,89,91,95,97,99,101,103,105,107,109,111,113,115, 117,119,121,123,125,127,129,131,133,135,137,139,143,145,147, 149,151,153,155,157,159,161,163,165,167,169,171,173,175,177, 179,181,183,185,187,189,191,193,195,197,199,201,203,205,207, 209,211,213,215,217,219,221,223,225,227,229,231,233,235,237, 239,241,243,245,247,249,251,253,255,257,259,261,263,265,267, 269,271,273,275,277,279,281,283,285,287,289,291,293,295和297。
在第十四个方面,本发明涉及对植物基因,尤其是烟草基因的鉴定,所述基因具 有与下述核酸序列基本相同的氨基酸。对含有cDNA和基因组克隆、优选含有烟草的 cDNA和基因组克隆的植物基因的鉴定,可通过用核酸探针以及包括但不限于核酸杂 交和PCR分析在内的核酸检测方法选择植物cDNA文库来实现。所述核酸探针可由下 述核酸序列或其片段构成:SEQ ID 1,3,5,7,9,11,13,15,17,19,21,23, 25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59, 61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,95,97, 99,101,103,105,107,109,111,113,115,117,119,121,123,125,127, 129,131,133,135,137,139,143,145和147。
在第十五个方面,可用针对下述部分或全部氨基酸序列的抗体来选择表达肽的 cDNA表达文库。所述氨基酸序列包括SEQ ID 2,4,8,9,10,12,14,16,18, 20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54, 56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90, 92,96,98,100,102,104,106,108,110,112,114,116,118,120,122, 124,126,128,130,132,134,136,138,140,144,146,148。
在第十六个方面,本发明还涉及制造能过表达p450酶活性水平的转基因烟草品 系。根据本发明,这些转基因品系包含编码全长基因氨基酸序列的所有核酸序列, 所述全长基因可有效增强某些酶的表达从而在烟草中产生表型效应。所述氨基酸序 列包括SEQ.ID.150,152,154,156,158,160,162,164,166,168,170,172, 174,176,178,180,182,184,186,188,190,192,194,196,198,200,202, 204,206,208,210,212,214,216,218,220,222,224,226,228,230,232, 234,236,238,240,242,244,246,248,250,252,254,256,258,260,262, 264,266,268,270,272,274,276,278,280,282,284,286,288,290,292, 294,296和298。
附图简述
图1显示核酸SEQ.ID.No.:1和氨基酸SEQ.ID.No.:2。
图2显示核酸SEQ.ID.No.:3和氨基酸SEQ.ID.No.:4。
图3显示核酸SEQ.ID.No.:5和氨基酸SEQ.ID.No.:6。
图4显示核酸SEQ.ID.No.:7和氨基酸SEQ.ID.No.:8。
图5显示核酸SEQ.ID.No.:9和氨基酸SEQ.ID.No.:10。
图6显示核酸SEQ.ID.No.:11和氨基酸SEQ.ID.No.:12。
图7显示核酸SEQ.ID.No.:13和氨基酸SEQ.ID.No.:14。
图8显示核酸SEQ.ID.No.:15和氨基酸SEQ.ID.No.:16。
图9显示核酸SEQ.ID.No.:17和氨基酸SEQ.ID.No.:18。
图1Q显示核酸SEQ.ID.No.:19和氨基酸SEQ.ID.No.:20。
图11显示核酸SEQ.ID.No.:21和氨基酸SEQ.ID.No.:22。
图12显示核酸SEQ.ID.No.:23和氨基酸SEQ.ID.No.:24。
图13显示核酸SEQ.ID.No.:25和氨基酸SEQ.ID.No.:26。
图14显示核酸SEQ.ID.No.:27和氨基酸SEQ.ID.No.:28。
图15显示核酸SEQ.ID.No.:29和氨基酸SEQ.ID.No.:30。
图16显示核酸SEQ.ID.No.:31和氨基酸SEQ.ID.No.:32。
图17显示核酸SEQ.ID.No.:33和氨基酸SEQ.ID.No.:34。
图18显示核酸SEQ.ID.No.:35和氨基酸SEQ.ID.No.:36。
图19显示核酸SEQ.ID.No.:37和氨基酸SEQ.ID.No.:38。
图20显示核酸SEQ.ID.No.:39和氨基酸SEQ.ID.No.:40。
图21显示核酸SEQ.ID.No.:41和氨基酸SEQ.ID.No.:42。
图22显示核酸SEQ.ID.No.:43和氨基酸SEQ.ID.No.:44。
图23显示核酸SEQ.ID.No.:45和氨基酸SEQ.ID.No.:46。
图24显示核酸SEQ.ID.No.:47和氨基酸SEQ.ID.No.:48。
图25显示核酸SEQ.ID.No.:49和氨基酸SEQ.ID.No.:50。
图26显示核酸SEQ.ID.No.:51和氨基酸SEQ.ID.No.:52。
图27显示核酸SEQ.ID.No.:53和氨基酸SEQ.ID.No.:54。
图28显示核酸SEQ.ID.No.:55和氨基酸SEQ.ID.No.:56。
图29显示核酸SEQ.ID.No.:57和氨基酸SEQ.ID.No.:58。
图30显示核酸SEQ.ID.No.:59和氨基酸SEQ.ID.No.:60。
图31显示核酸SEQ.ID.No.:61和氨基酸SEQ.ID.No.:62。
图32显示核酸SEQ.ID.No.:63和氨基酸SEQ.ID.No.:64。
图33显示核酸SEQ.ID.No.:65和氨基酸SEQ.ID.No.:66。
图34显示核酸SEQ.ID.No.:67和氨基酸SEQ.ID.No.:68。
图35显示核酸SEQ.ID.No.:69和氨基酸SEQ.ID.No.:70。
图36显示核酸SEQ.ID.No.:71和氨基酸SEQ.ID.No.:72。
图37显示核酸SEQ.ID.No.:73和氨基酸SEQ.ID.No.:74。
图38显示核酸SEQ.ID.No.:75和氨基酸SEQ.ID.No.:76。
图39显示核酸SEQ.ID.No.:77和氨基酸SEQ.ID.No.:78。
图40显示核酸SEQ.ID.No.:79和氨基酸SEQ.ID.No.:80。
图41显示核酸SEQ.ID.No.:81和氨基酸SEQ.ID.No.:82。
图42显示核酸SEQ.ID.No.:83和氨基酸SEQ.ID.No.:84。
图43显示核酸SEQ.ID.No.:85和氨基酸SEQ.ID.No.:86。
图44显示核酸SEQ.ID.No.:87和氨基酸SEQ.ID.No.:88。
图45显示核酸SEQ.ID.No.:89和氨基酸SEQ.ID.No.:90。
图46显示核酸SEQ.ID.No.:91和氨基酸SEQ.ID.No.:92。
图48显示核酸SEQ.ID.No.:95和氨基酸SEQ.ID.No.:96。
图49显示核酸SEQ.ID.No.:97和氨基酸SEQ.ID.No.:98。
图50显示核酸SEQ.ID.No.:99.和氨基酸SEQ.ID.No.:100。
图51显示核酸SEQ.ID.No.:101和氨基酸SEQ.ID.No.:102。
图52显示核酸SEQ.ID.No.:103和氨基酸SEQ.ID.No.:104。
图53显示核酸SEQ.ID.No.:105和氨基酸SEQ.ID.No.:106。
图54显示核酸SEQ.ID.No.:107和氨基酸SEQ.ID.No.:108。
图55显示核酸SEQ.ID.No.:109和氨基酸SEQ.ID.No.:110。
图56显示核酸SEQ.ID.No.:111和氨基酸SEQ.ID.No.:112。
图57显示核酸SEQ.ID.No.:113和氨基酸SEQ.ID.No.:114。
图58显示核酸SEQ.ID.No.:115和氨基酸SEQ.ID.No.:116。
图59显示核酸SEQ.ID.No.:117和氨基酸SEQ.ID.No.:118。
图60显示核酸SEQ.ID.No.:119和氨基酸SEQ.ID.No.:120。
图61显示核酸SEQ.ID.No.:121和氨基酸SEQ.ID.No.:122。
图62显示核酸SEQ.ID.No.:123和氨基酸SEQ.ID.No.:124。
图63显示核酸SEQ.ID.No.:125和氨基酸SEQ.ID.No.:126。
图64显示核酸SEQ.ID.No.:127和氨基酸SEQ.ID.No.:128。
图65显示核酸SEQ.ID.No.:129和氨基酸SEQ.ID.No.:130。
图66显示核酸SEQ.ID.No.:131和氨基酸SEQ.ID.No.:132。
图67显示核酸SEQ.ID.No.:133和氨基酸SEQ.ID.No.:134。
图68显示核酸SEQ.ID.No.:135和氨基酸SEQ.ID.No.:136。
图69显示核酸SEQ.ID.No.:137和氨基酸SEQ.ID.No.:138。
图70显示核酸SEQ.ID.No.:139和氨基酸SEQ.ID.No.:140。
图72显示核酸SEQ.ID.No.:143和氨基酸SEQ.ID.No.:144。
图73显示核酸SEQ.ID.No.:145和氨基酸SEQ.ID.No.:146。
图74显示核酸SEQ.ID.No.:147和氨基酸SEQ.ID.No.:148。
图75显示核酸SEQ.ID No.:149和氨基酸SEQ.ID.No.:150。
图76显示核酸SEQ.ID No.:151和氨基酸SEQ.ID.No.:152。
图77显示核酸SEQ.ID No.:153和氨基酸SEQ.ID.No.:154。
图78显示核酸SEQ.ID No.:155和氨基酸SEQ.ID.No.:156。
图79显示核酸SEQ.ID No.:157和氨基酸SEQ.ID.No.:158。
图80显示核酸SEQ.ID No.:159和氨基酸SEQ.ID.No.:160。
图81显示核酸SEQ.ID No.:161和氨基酸SEQ.ID.No.:162。
图82显示核酸SEQ.ID No.:163和氨基酸SEQ.ID.No.:164。
图83显示核酸SEQ.ID No.:165和氨基酸SEQ.ID.No.:166。
图84显示核酸SEQ.ID No.:167和氨基酸SEQ.ID.No.:168。
图85显示核酸SEQ.ID No.:169和氨基酸SEQ.ID.No.:170。
图86显示核酸SEQ.ID No.:171和氨基酸SEQ.ID.No.:172。
图87显示核酸SEQ.ID No.:173和氨基酸SEQ.ID.No.:174。
图88显示核酸SEQ.ID No.:175和氨基酸SEQ.ID.No.:176。
图89显示核酸SEQ.ID No.:177和氨基酸SEQ.ID.No.:178。
图90显示核酸SEQ.ID No.:179和氨基酸SEQ.ID.No.:180。
图91显示核酸SEQ.ID No.:181和氨基酸SEQ.ID.No.:182。
图92显示核酸SEQ.ID No.:183和氨基酸SEQ.ID.No.:184。
图93显示核酸SEQ.ID No.:185和氨基酸SEQ.ID.No.:186。
图94显示核酸SEQ.ID No.:187和氨基酸SEQ.ID.No.:188。
图95显示核酸SEQ.ID No.:189和氨基酸SEQ.ID.No.:190。
图96显示核酸SEQ.ID No.:191和氨基酸SEQ.ID.No.:192。
图97显示核酸SEQ.ID No.:193和氨基酸SEQ.ID.No.:194。
图98显示核酸SEQ.ID No.:195和氨基酸SEQ.ID.No.:196。
图99显示核酸SEQ.ID No.:197和氨基酸SEQ.ID.No.:198。
图100显示核酸SEQ.ID No.:199和氨基酸SEQ.ID.No.:200。
图101显示核酸SEQ.ID No.:201和氨基酸SEQ.ID.No.:202。
图102显示核酸SEQ.ID No.:203和氨基酸SEQ.ID.No.:204。
图103显示核酸SEQ.ID No.:205和氨基酸SEQ.ID.No.:206。
图104显示核酸SEQ.ID No.:207和氨基酸SEQ.ID.No.:208。
图105显示核酸SEQ.ID No.:209和氨基酸SEQ.ID.No.:210。
图106显示核酸SEQ.ID No.:211和氨基酸SEQ.ID.No.:212。
图107显示核酸SEQ.ID No.:213和氨基酸SEQ.ID.No.:214。
图108显示核酸SEQ.ID No.:215和氨基酸SEQ.ID.No.:216。
图109显示核酸SEQ.ID No.:217和氨基酸SEQ.ID.No.:218。
图110显示核酸SEQ.ID No.:219和氨基酸SEQ.ID.No.:220。
图111显示核酸SEQ.ID No.:221和氨基酸SEQ.ID.No.:222。
图112显示核酸SEQ.ID No.:223和氨基酸SEQ.ID.No.:224。
图113显示核酸SEQ.ID No.:225和氨基酸SEQ.ID.No.:226。
图114显示核酸SEQ.ID No.:227和氨基酸SEQ.ID.No.:228。
图115显示核酸SEQ.ID No.:229和氨基酸SEQ.ID.No.:230。
图116显示核酸SEQ.ID No.:231和氨基酸SEQ.ID.No.:232。
图117显示核酸SEQ.ID No.:233和氨基酸SEQ.ID.No.:234。
图118显示核酸SEQ.ID No.:235和氨基酸SEQ.ID.No.:236。
图119显示核酸SEQ.ID No.:237和氨基酸SEQ.ID.No.:238。
图120显示核酸SEQ.ID No.:239和氨基酸SEQ.ID.No.:240。
图121显示核酸SEQ.ID No.:241和氨基酸SEQ.ID.No.:242。
图122显示核酸SEQ.ID No.:243和氨基酸SEQ.ID.No.:244。
图123显示核酸SEQ.ID No.:245和氨基酸SEQ.ID.No.:246。
图124显示核酸SEQ.ID No.:247和氨基酸SEQ.ID.No.:248。
图125显示核酸SEQ.ID No.:249和氨基酸SEQ.ID.No.:250。
图126显示核酸SEQ.ID No.:251和氨基酸SEQ.ID.No.:252。
图127显示核酸SEQ.ID No.:253和氨基酸SEQ.ID.No.:254。
图128显示核酸SEQ.ID No.:255和氨基酸SEQ.ID.No.:256。
图129显示核酸SEQ.ID No.:257和氨基酸SEQ.ID.No.:258。
图130显示核酸SEQ.ID No.:259和氨基酸SEQ.ID.No.:260。
图131显示核酸SEQ.ID No.:261和氨基酸SEQ.ID.No.:262。
图132显示核酸SEQ.ID No.:263和氨基酸SEQ.ID.No.:264。
图133显示核酸SEQ.ID No.:265和氨基酸SEQ.ID.No.:266。
图134显示核酸SEQ.ID No.:267和氨基酸SEQ.ID.No.:268。
图135显示核酸SEQ.ID No.:269和氨基酸SEQ.ID.No.:270。
图136显示核酸SEQ.ID No.:271和氨基酸SEQ.ID.No.:272。
图137显示核酸SEQ.ID No.:273和氨基酸SEQ.ID.No.:274。
图138显示核酸SEQ.ID No.:275和氨基酸SEQ.ID.No.:276。
图139显示核酸SEQ.ID No.:277和氨基酸SEQ.ID.No.:278。
图140显示核酸SEQ.ID No.:279和氨基酸SEQ.ID.No.:280。
图141显示核酸SEQ.ID No.:281和氨基酸SEQ.ID.No.:282。
图142显示核酸SEQ.ID No.:283和氨基酸SEQ.ID.No.:284。
图143显示核酸SEQ.ID No.:285和氨基酸SEQ.ID.No.:286。
图144显示核酸SEQ.ID No.:287和氨基酸SEQ.ID.No.:288。
图145显示核酸SEQ.ID No.:289和氨基酸SEQ.ID.No.:290。
图146显示核酸SEQ.ID No.:291和氨基酸SEQ.ID.No.:292。
图147显示核酸SEQ.ID No.:293和氨基酸SEQ.ID.No.:294。
图148显示核酸SEQ.ID No.:295和氨基酸SEQ.ID.No.:296。
图149显示核酸SEQ.ID No.:297和氨基酸SEQ.ID.No.:298。
图151显示了序列组的对比。
图152例举了全长克隆的比对。
图153显示了用于通过PCR克隆细胞色素p450cDNA片段的程序。
发明详述
定义
除非另有说明,本文使用的所有技术和科学术语具有本发明所属技术领域一般技 术人员通常所理解的相同含义。Singleton等在《微生物学和分子生物学字典》 (Dictionary of Microbiology and Molecular Biology,第二版,John Wiley and Sons(纽约),1994)中为此领域的技术人员提供了本发明中所用的许多术语。本文提 到的所有专利和出版物纳入本文作为参考。出于本发明的目的,下列术语的定义如 下:
″酶活性″包括脱甲基化、羟基化、环氧化、N-氧化、磺氧化、N-、S-和O-脱甲基 化、脱硫化、脱氨以及偶氮、硝基和N-氧化物基团的还原。术语″核酸″指单链或双 链形式或正义、或反义的脱氧核糖核苷酸或核糖核苷酸聚合物,除非另有限制,包 括能以天然产生的核苷酸类似的方式,与核苷酸杂交的天然核苷酸的已知类似物。 除非另有说明,特定的核酸序列包括其互补序列。
术语“可操作性连接”、“可操作性结合”和“以可操作顺序”指核酸表达控制序 列(如启动子、信号序列或转录因子结合位点的排列)与第2种核酸序列之间的功能 性连接,其中表达控制序列影响对应于第二序列的核酸的转录和/或翻译。
当用于指细胞时,术语“重组体”表示该细胞能复制异源核酸,表达所述核酸或 表达肽、异源肽或由异源核酸编码的蛋白质。重组细胞可表达正义或反义形式的基 因或基因片段,这些形式在天然细胞形式(非重组)中不被发现。重组细胞也能表达 天然细胞形式中发现的基因,但这些基因通过人工方式被修饰和再导入细胞。
“结构基因”是基因的一部分,包括编码蛋白、多肽或其部分的DNA区段,除了 能驱动转录起始的5’序列外。结构基因也可编码不能翻译的产物。结构基因可以是 细胞中正常发现的或者细胞或其导入的细胞位置中不常发现的,就导入而言,它称 为“异源基因”。异源基因可全部或部分获自本领域已知的任何来源,包括细菌基因 组或附加体,真核细胞的核或质粒DNA、cDNA,病毒DNA或化学合成的DNA。结构基 因可包含一种或多种能影响生物活性或其特征、表达产物的生物活性或化学结构、 表达速度或表达控制的方式的修饰。这种修饰包括但不限于一个或多个核苷酸的突 变、插入、缺失和取代。结构基因能构成不间断的编码序列或它可包括通过适当剪 接结合相连的一个或多个内含子。结构基因是可翻译或不能翻译的,包括反义方向。 结构基因可以是衍生自多种来源和多种基因序列的区段组合(天然产生或合成的,其 中合成的指化学合成的DNA)。
“衍生自”用于指取得、获得、接受、追踪、复制或遗传自某来源(化学和/或生 物)。衍生物可通过原始来源基因序列的化学或生物学操作而产生(包括但不限于取 代、添加、插入、缺失、提取、分离、突变和复制)。
关于DNA序列的“化学合成”指组分核苷酸部分的体外装配。手工化学合成DNA 可以良好建立的程序(Caruthers,《DNA和RNA测序的方法》(Methodology of DNA and RNA Sequencing),(1983),Weissman(编),Praeger Publishers,New York,第1 章)来完成;自动化学合成可用一些商业购买的机器之一进行。
进行序列的最佳比对可采用Smith和Waterman的局部同源性算法,Adv.Appl. Math.2:482(1981)、采用Needleman和Wunsch的同源性比对算法,J.Mol.Biol. 48:443(1970)、采用Pearson和Lipman的类似性方法检索,Proc.Natl.Acad.Sci. (U.S.A.)85:2444(1988)、采用这些算法(Wisconsin Genetics软件包中的GAP、 BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison, Wis.)的计算机化工具、或通过检查进行。
NCBI局部序列比对基本检索工具(BLAST)(Altschul等,1990)可得自一些来源, 包括国家生物信息中心(NCBI,Bethesda,Md.)和因特网,用于与序列分析程序 blastp、blastn、blastx、tblastn和tblastx相结合。可在http://www. ncbi.nlm.nih.gov/BLAST/上访问它。如何用此程序确定序列相同性的描述可获自 http://www.ncbi.nlm.nih.gov/BLAST/blast.help.html。
应用于氨基酸序列和本文使用的术语“显著的氨基酸相同性”或“显著的氨基酸 序列相同性”表示某多肽的特征,该肽中包括的序列与参比序列组相比,在从细胞 色素p450基序GXRXCX(G/A)后第一个氨基酸到被翻译肽的终止密码子相应区域内具 有至少70%的序列相同性,优选80%的氨基酸序列相同性,更优选90%的氨基酸序 列相同性,最优选至少99-100%的序列相同性。
应用于核酸序列和本文使用的术语“显著的核酸相同性”或“显著的核酸序列相 同性”表示某多核苷酸序列的特征,该多核苷酸中包括的序列与参比序列组相比, 在从细胞色素p450基序GXRXCX(G/A)后第一个核酸到被翻译肽的终止密码子相应区 域内具有至少75%的序列相同性,优选81%的氨基酸序列相同性,更优选91-99% 的序列相同性,最优选至少99-100%的序列相同性。
核苷酸序列基本相同的另一指标是2种分子能否在严谨条件下彼此杂交。严谨条 件是序列依赖性的且在不同环境下不同。一般,严谨条件选择为约5℃-20℃,通常 约10℃-15℃,低于特定序列在确定的离子强度和pH的解链点(Tm)。Tm是50%靶序 列与匹配探针杂交的温度(在确定的离子强度和pH下)。通常,严谨条件是盐浓度在 pH7约为0.02摩尔和温度为至少约60℃。例如,在标准Southern杂交过程中,严 谨条件包括先在42℃用6xSSC洗涤,接着在至少约55℃的温度,一般约60℃且通常 约65℃下用在0.2xSSC在洗涤一次或多次。
当它们编码的多肽和/或蛋白质基本相同时,用于本发明目的的核苷酸序列也基 本相同。因此,当一种核酸序列编码与第2种核酸序列几乎相同的多肽时,这两种 核酸序列基本相同,即使它们由于遗传密码子允许的简并性在严谨条件下不杂交(参 见Darnell等,(1990)《分子细胞生物学》(Molecular Cell Biology),第2版, Scientific American Books W.H.Freeman和Company New York关于密码子简并性 和遗传密码的解释)。蛋白质纯度或均一性可通过本领域熟知的一些方法表示,如蛋 白样品的聚丙烯酰胺凝胶电泳,然后染色观察。为了某些目的,需要高分辨率可使 用HPLC或类似的纯化方法。
如本文所用,术语“载体”用于之能将DNA区段移到细胞中的核酸分子。载体的 作用是复制DNA并可在宿主细胞中独立复制。术语“运载体”有时与“载体”互换 使用。如本文所用,术语“表达载体”指含有所需编码序列和能在特定宿主生物体 中表达操作性连接的该编码序列所需的适当核酸序列的重组DNA分子。在原核生物 中表达所必需的核酸序列通常包括启动子、操纵子(任选)、常常与其它序列一起的 核糖体结合位点。已知真核细胞使用启动子、增强子、终止与聚腺苷酸化信号。
为了再生带有根的完整遗传工程植物,可将核酸插入植物细胞中,例如可采用任 何技术如体内接种或任何已知的体外组织培养技术来产生能再生称为完整植物的转 化的植物细胞。因此,例如可通过体外接种致病性或非致病性根瘤土壤杆菌 (A.tumefaciens)来插入植物细胞。也可采用其它这种组织培养技术。
“植物组织”包括植物的分化和未分化组织,包括但不限于根、茎、叶、花粉、 种子、肿瘤组织及各种培养形式的细胞如单细胞、原生质体、胚和愈伤组织。植物 组织可以是在植物中或者在器官、组织或细胞培养中的组织。
如本文所用,“植物细胞”包括植物中的植物细胞及培养中的植物细胞和原生质 体。“cDNA”或“互补DNA”一般指其核酸序列与RNA分子互补的单链DNA分子。cDNA 可通过逆转录酶对RNA模板作用而形成。
获得核酸序列的方法
根据本发明,RNA提取自基因转变体和非转变体烟草品系的烟草组织。然后用提 取的RNA产生cDNA。然后用2种方法产生本发明的核酸序列。
在第一种方法中,富含多聚A的RNA提取自植物组织和逆转录PCR产生的cDNA。 随用该后单链cDNA来产生p450特异性PCR群,采用简并引物加寡d(T)反向引物。 引物设计以p450的高保守基序为基础。特异性简并引物的例子示于图1。进一步分 析含适当大小插入物的质粒的序列片段。这些插入物的大小一般范围在约300-800 个核苷酸,这取决于所用引物。
在第二种方法中,先构建一个cDNA文库。质粒中的cDNA来产生p450特异性PCR 群,采用简并引物加质粒上的T7引物作为反向引物。如在第1种方法中那样,进一 步分析含适当大小插入物的质粒的序列片段。
可将已知能产生高水平去甲烟碱(转变体)的烟草植物品系和去甲烟碱水平不能 检测到的植物品系用作起始材料。
然后可取下植物的叶片用乙烯处理来激活本文定义的p450酶活性。用本领域已 知技术提取总RNA。随后用PCR(RT-PCR)和寡d(T)引物产生cDNA片段,如图153中 所述。接着可构建cDNA文库,这在本文实施例中有更更充分的描述。
p450类酶的保守区可用作简并引物的模板(图75)。利用简并引物,可通过PCR 扩增p450特异性条带。显示为p450样酶的条带可通过DNA测序鉴定。可用BLAST 检索、比对或其它工具来特性分析PCR片段以鉴定适当的候选物。
来自被鉴定片段的序列信息可用于发展PCR引物。这些引物联合cDNA文库的质 粒引物可用于克隆全长p450基因。进行了大规模Southern反向分析以检测获得的 所有片段克隆和某些情况下全长克隆的不同表达。在本发明的此方面,可进行这些 大规模反向Southern试验,采用不同组织的标记的总cDNA作为探针与克隆的DNA 片段杂交,以选择所有克隆的插入物。
也可用非放射性和放射性(P32)Northern印迹试验来特征分析克隆p450片段和全 长克隆。
通过衍生一些全长克隆的氨基酸序列并选择具有抗原性的相对于其它克隆且有 独特性的肽区域,制备针对它们的肽特异性抗体。制备针对偶联于载体蛋白的合成 肽的兔抗体。采用这些抗体对植物组织进行Western印迹分析或其它免疫学方法。
如上鉴定的核酸序列可用病毒诱导的基因沉默技术检测(VIGS,Baulcombe,《植 物生物的当前观点》(Current Opinions in Plant Biology),1999,2:109-113)。
通过衍生一些全长克隆的氨基酸序列并选择具有潜在抗原性和相对于其它克隆 具有独特性的肽区域,制备针对它们的肽特异性抗体。制备针对偶联于载体蛋白的 合成肽的兔抗体。采用这些抗体进行Western印迹分析。
在发明的另一方面,采用干扰性RNA技术(RNAi)进一步特征分析本发明烟草植物 中细胞色素p450的酶活性。下列描述此技术的参考文献纳入本文供参考,Smith等, Nature,2000,407:319-320;Fir等,Nature,1998,391:306-311;Waterhouse 等,PNAS,1998,95:13959-13964;Setalberg等,Plant Molecular Biology,1993, 23:671-683;Baulcombe,《植物生物学的当前观点》,1999,2:109-113;Brigneti 等,EMBO Journal,1998,17(22):6739-6746。可用RNAi技术、反义技术或所述各 种其它方法转化植物。
已有几种技术可将外源遗传物质导入植物细胞,获得稳定维持和表达导入基因的 植物。这种技术包括加速包被在微粒上的遗传物质直接进入细胞(Cornell的美国专 利4,945,050和DowElanco的5,141,131)。可用农杆菌技术转化植物,参见 University of Toledo的美国专利5,177,010;Texas A&M的5,104,310;欧洲专利 申请0131624B1、欧洲专利申请120516、159418B1;欧洲专利申请120516、159418B1 和Schilperoot的176,112;美国专利5,149,645、5,469,976、5,464,763和4,940,838 以及Schilperoot的4,693,976;MaxPlanck的欧洲专利申请116718、290799、320500; Japan Nicotiana的欧洲专利申请604662和627752;Ciba Geigy的欧洲专利申请 0267159、0292435和美国专利5,231,019;Calgene的美国专利5,463,174和 4,762,785以及Agracetus的美国专利5,004,863和5,159,135。其它转化技术包括 噬菌体颈须技术(whiskers technology),参见Zeneca的美国专利5,302,523和 5,464,765。电穿孔技术也用于转化植物,参见Boyce Thompson Institute的WO 87/06614,Dekalb的5,472,869、5,384,253,PGS的WO9209696和WO9321335。所 有这些转化专利和出版物纳入供参考。除了用于转化植物的许多技术,接触外源基 因的组织类型也可不同。这种组织包括但不限于胚胎发生组织、愈伤组织I型和II 型、下胚轴、分生组织等。几乎所有植物组织都可在去分化时用本领域技术人员掌 握的合适技术转化。
导入植物的外源遗传物质包括一可选择的标记。对特定标记的优选在于技术人员 的斟酌决定,但任何下列可选择标记可与本文未列出但可作为可选择性标记起作用 的任何其它基因一起使用。这种可选择的标记包括但不限于编码对抗生素卡那霉素、 新霉素和G418抗性的转座子Tn5的氨基糖苷磷酸转移酶基因(Aph II)以及编码对草 甘膦;潮霉素;氨甲蝶呤;膦丝菌素(bar);咪唑啉酮、磺酰脲和三唑嘧啶除草剂如 chlorosulfuron;溴苯腈、茅草枯等抗性或耐受性的基因。
除了可选择性标记外,需要采用报告基因。在一些情况中,可采用报告基因而不 用可选择性标记。报告基因是受体生物体或组织中一般不存在或不表达的基因。报 告基因通常编码可提供一些表型变化或酶特性的蛋白质。这种基因的例子提供于 K.Weising等,Ann.Rev.Genetics,22,421(1988)中,它纳入本文供参考。优选的 报告基因不限于包括葡糖醛酸酶(GUS)基因和GFP基因。
一旦导入植物组织中,结构基因的表达可用本领域已知的任何方法测定,表达可 测定为转录的mRNA、合成的蛋白质或发生沉默的基因量(参见美国专利号5,583,021, 纳入本文供参考)。已知道体外培养植物组织,和在一些情况中,在完整植物中再生 的技术(EP申请号88810309.0)。将导入的表达复合体移到商业上有用的栽培物中的 方法是本领域技术人员已知的。
一旦获得能表达所需p450酶水平的植物细胞,可用本领域熟知的方法和技术从 其再生植物组织和整个植物。随后用常规方法再生此再生植物并将导入的基因用常 规植物育种技术移到其它品系和栽培物。
下列实施例阐述了实施本发明的方法并应理解为是阐明而非限制本发明的范围, 本发明的范围由附加权利要求书确定。
实施例
实施例1:植物组织的发育和乙烯处理
植物生长
将植物接种在盆中并在温室中生长4周。将4周大的苗移植到单独盆中并在温室 中生长2个月。植物在生长中每天浇2次含150ppm NPK肥料的水。将伸展开的绿叶 与植株分离以进行下述乙烯处理。
细胞系78379
烟草品系78379是一种肯塔基大学(University of Kentucky)公开推出的伯莱芋 烟草品系,用作植物材料的来源。按烟草栽培领域的标准培养了100株植物并以不 同数目(1-100)移植和标记。施肥和田地管理按推荐进行。
100株植物中四分之三20-100%的烟碱转变成去甲烟碱。100株植物中四分之一不 到5%的烟碱转变成去甲烟碱。编号87的植物转变最低(2%)而编号21的植物100%转 变。将转变小于3%的植物分类为非转变体。制备编号为87和21的植物的自花授粉 种子以及杂交(21x87和87x21)种子用于研究遗传和表型差异。自花授粉21的植物 是转变体,87的自花授粉99%是非转变体。87植物的其它1%显示低转变(5-15%)。 互交产生的植物都是转变体。
细胞系4407
烟草品系4407是用作植物材料来源的一种伯莱芋品系。选出完全一样和代表性 的植物(100)并标记。100株植物中97株是非转变体,3株是转变体。编号为56的 植物转变量最低(1.2%),编号为58的植物转变水平最高(96%)。用这2种植物制备 自花授粉种子和杂交种子。
自花授粉-58的植物以转变体与非转变体3∶1比例分离。58-33和58-25植物分 别鉴定为纯合转变体和非转变体植物品系。58-33的稳定转变通过分析其下一子代得 到证实。
细胞系PBLB01
PBLB01是ProfiGen公司开发的一种伯莱芋细纤维烟草品系,用作植物材料的来 源。这种转化体植物选自PBLB01的基础种子。
乙烯处理过程
从温室生长2-3个月的植物中分离得到绿叶用0.3%乙烯溶液(Prep牌乙烯磷 (Rhone-Poulenc))喷淋。将每张喷淋叶挂在装有增湿器和塑料覆盖的晾架上。在处 理中,样品叶用乙烯溶液定期喷淋。乙烯处理后约24-48小时,收集叶子用于RNA 提取。取另一小样品作代谢构成分析以确定叶子代谢物和更特别感兴趣成分如多种 生物碱的浓度。
例如,生物碱分析可如下进行。使样品(0.1g)与0.5ml 2N NaOH和5ml提取液 150rpm振荡,该提取液含有作为内部标准的喹啉及甲基t-丁基醚。在装有FID检测 器的HP 6890GC上分析。样品检测器和注射器所用的温度为250℃。HP柱 (30m-0.32nm-1m)由5%苯酚和95%甲基硅交联的熔融二氧化硅组成,此柱在110-185 ℃的温度梯度以10℃每分钟使用。此柱在100℃下操作,流速为1.7cm3/分钟,裂缝 比例为40∶1,注射体积为2.1,氦用作运载气体。
实施例2:RNA的分离
对于RNA提取,如上所述将2个月大温室生长植物的中等叶子用乙烯处理。采用 0时和24-48小时的样品作RNA提取。在一些情况中,衰老过程下的叶样品取自去除 头状花序10天后的植物。这些样品也用于提取。用Rneasy植物小型试剂盒(Qiagen, Inc.,Valencia,California)按厂商程序分离得到总RNA。
用DEPC处理的研钵和杵在液氮下将组织样品研磨成细粉。将大约100mg碾碎的 组织移到无菌1.5ml离心管。此样品管置于液氮直到收集了所有样品。随后在各管 中加入试剂盒中提供的450μl缓冲液RLT(加有β-巯基乙醇)。样品充分涡旋振荡并 在56℃孵育3分钟。然后将裂解液加到置于2-ml收集管中的QIAshredder旋转柱上, 以最高速离心2分钟。收集流过液并将0.5体积的乙醇加入澄清裂解液中。充分混 合的样品移到置于2ml收集管中的Rneasy微旋转柱上。以10,000rpm离心样品1分 钟。接着,将700μl缓冲液RW1吸到安置在新收集管中的Rneasy柱上,以10,000rpm 离心1分钟。再次将缓冲液RPE加到Rneasy旋转柱上以最高速离心2分钟以干燥膜。 为去除任何乙醇携带,将该膜置于另一收集管中以最高速再离心1分钟。将Rneasy 柱移到新的1.5ml收集管中,吸取40μl无RNA酶的水直接移到Rneasy膜上。将此 最后的洗脱管10,000rpm离心1分钟。通过变性甲醛凝胶和分光光度计分析总RNA 的质量和数量。
多聚(A)RNA用Oligotex多聚A RNA纯化试剂盒(Qiagen Inc.)按厂商程序分离。 使用250μl最大体积中的约200μg总RNA。将250μl体积的缓冲液OBB和15μl的 OligotexTM悬液加入250μl总RNA中。通过抽吸充分混合内含物并在加热块上70℃ 孵育3分钟。然后样品置于室温约20分钟。以最高速离心2分钟沉淀oligotex:mRNA 复合物。除了50μl悬液外,从微离心管中取出所有上清液。进一步用OBB缓冲液处 理样品。将oligotex:mRNA沉淀通过涡旋振荡重悬于400μl缓冲液OW2中。将此混 合物移到置于新管中的小旋转柱上以最高速离心1分钟。将旋转柱移到新管中再加 入400μl缓冲液OW2到柱上。随后以最高速离心该管1分钟。将旋转柱移到最终的 1.5ml微离心管。用60μl热(70C)缓冲液OEB洗脱样品。通过变性甲醛凝胶和分光光 度计分析多聚A产物。
实施例3:逆转录-PCR
用SuperScript逆转录酶按厂商程序(Invitrogen,Carlsbad,California)产生 第1条cDNA链。富含多聚A的RNA/寡dT引物混合物含不到5μg的总RNA、1μl 10mM dNTP混合物、1μl寡d(T)12-18(0.5μg/μl),加入DEPC-处理水至10μl。各样品65℃孵 育5分钟,然后置于冰上至少1分钟。通过顺序加入下列各成分:2μl 10X RT缓冲 液、4μl 25mM MgCl2、2μl 0.1M DTT和1μl去除RNA酶的重组RNA酶抑制剂制备反 应混合物。将9μl反应混合物加到各RNA/引物混合物中轻轻混合。42℃孵育2分钟 各管加入1μl Super Script IITM RT。各管42℃孵育5分钟。72℃ 15分钟终止反 应,在冰上冷却。离心收集样品,各管加入1μl RNA酶H,在37℃孵育20分钟。用 200皮摩尔正向引物(图75中的简并引物,SEQ.ID.149-156)和100皮摩尔反向引物 (18个核苷酸寡d(T)的混合物,接着是1个随机碱基)进行第二次PCR。
反应条件是94℃ 2分钟,然后进行40轮PCR:94℃ 1分钟、45-60℃ 2分钟、 72℃ 3分钟,72℃再延伸10分钟。
通过电泳用1%琼脂糖凝胶分析10微升扩增样品。从琼脂糖凝胶纯化得到正确大 小的片段。
实施例4:产生PCR片段群
将实施例3的PCR片段按厂商说明书连接到Easy载体中(Promega, Madison,Wisconsin)。连接产物转化入JM109感受态细胞中并接种在LB平板上作 蓝/白选择。选择菌落并在有1.2ml LB培养基的96孔板中37℃培养过夜。对所有选 择的菌落都制备了冷冻储存液。用Beckman Biomeck 2000miniprep机器人技术和 Wizard SV Miniprep试剂盒(Promega)纯化接种板的质粒DNA。用100μl水洗脱质粒 DNA保存于96孔板中。用EcoR1消化质粒并用1%琼脂糖凝胶分析以确定DNA的量和 插入物的大小。含400-600bp插入物的质粒用CEQ 2000测序仪(Beckman,Fullerton, California)测序。将序列通过BLAST检索与GenBank数据库比对。鉴定到P-450相 关片段并作进一步分析。或者从删减文库(substraction library)分离p450片段。 这些片段也用上述方法分析。
实施例5:构建CDNA文库
cDNA文库如下通过从乙烯处理的叶片中制备总RNA来构建。首先,用改良的酸性 苯酚和氯仿提取法提取烟草品系58-33乙烯处理叶片的总RNA。改良的此法采用1克 组织,研磨之后放在5ml提取缓冲液(100mM Tris-HCl,pH8.5;200mM NaCl;10mM EDTA; 0.5SDS)中涡旋振荡,在此缓冲液加入5ml苯酚(pH5.5)和5ml氯仿。离心提取样品, 保存上清。再重复此提取步骤2-3次直到上清液澄清。加入约5ml氯仿以去除痕量 苯酚。加入3倍体积ETOH和1/10体积3M NaOAc(pH5.2)并在-20℃保存1小时沉淀 合并上清液组分中的RNA。移到Corex玻璃容器后,4℃ 9,000RPM离心RNA组分45 分钟。沉淀用70%乙醇洗涤,4℃ 9,000RPM离心5分钟。干燥沉淀后,将沉淀的RNA 溶于0.5ml无RNA酶的水中。分别通过变性甲醛凝胶和分光光度计分析总RNA的质 量和数量。
通过下列程序分离所得总RNA中的多聚A+RNA,采用寡d(T)纤维素程序 (Invitrogen)和微离心旋转柱(Invitrogen)。约20mg总RNA进行2次纯化以获得高 质量多聚A+RNA。进行变性甲醛凝胶和随后已知全长基因的RT-PCR分析多聚A+RNA 产物确保高质量mRNA。
其次,利用cDNA合成试剂盒、合成试剂盒、III 金克隆试剂盒(Stratagene,La Jolla,California),用多聚A+RNA作为模板来 产生cDNA文库。该方法包括按照专门的厂商程序,用大约8μg多聚A+RNA来构建 cDNA文库。分析该初级文库显示约有2.5×106-1×107pfu。该文库的质量背景测试 通过互补试验用IPTG和X-gal完成,其中重组斑以高于背景反应100倍表达。
通过随机PCR定量分析该文库显示,插入cDNA的平均大小约为1.2kb。该方法采 用如下的两步骤PCR方法。对于第1步骤,反向引物的设计是以获自p450片段的初 步序列信息为基础。用设计的反向引物和T3(正向)引物扩增该cDNA文库的对应基因。 将PCR反应产物进行琼脂糖电泳,切下对应于高分子量的条带、纯化、克隆和测序。 在第2步骤中,如正向引物从p450的5’UTR区或起始编码区设计的新引物与反向引 物(从p4503’UTR设计)一起用于随后的PCR以获得全长p450克隆。
通过PCR扩增从构建的cDNA文库中产生p450片段,如实施例3所述,除了反向 引物不同外。采用位于质粒中cDNA插入物下游的T7引物(见图5)作为反向引物。分 离PCR片段、克隆和测序,如实施例4所述那样。
通过PCR法从构建的cDNA文库分离得到全长p450基因。采用基因特异性反向引 物(按p450片段的下游序列设计)和正向引物(文库质粒上的T3)来考虑该全长基因。 分离PCR片段、克隆和测序。如果需要可采用第二步PCR。在第二步骤中,将从克隆 的p450的5’UTR区设计的新的正向引物和从p450克隆的3’UTR区设计的反向引物用 于随后的PCR反应,以得到全长p450克隆。随后测序这些克隆。
实施例6:特征分析克隆的片段-反向SOUTHERN印迹分析
对上升实施例中鉴定的所有p450克隆进行非放射性大规模反向southern印迹试 验以检测差异表达。发现不同p450簇间的表达水平很不相同。对高表达的那些克隆 进行进一步的实时检测。
如下进行非放射性southern印迹法。
1)如实施例2所述,用Qiagen Rnaeasy试剂盒提取乙烯处理转变体(58-33)、 非转变体(58-33)和非转变体(58-25)的叶片总RNA。
2)通过生物素末端标记获自上面步骤的富含多聚A的RNA的单链cDNA,生成探针。 如实施例3所述,通过RT-PCR扩增转变体和非转变体的总RNA(Invitrogen)产生此 标记的单链cDNA,除了使用生物素化的寡dT作为引物(Promega)外;用这些探针与 克隆的DNA杂交。
3)用限制性酶EcoR1消化质粒DNA在琼脂糖凝胶上跑电泳。同时干燥凝胶并转至 2张尼龙膜上(Biodyne)。使1张膜与转变体探针杂交,另1张膜与非转变体探针 杂交。杂交前UV-交联膜(自动交联设置,254nm,Stratagene,Stratalinker)。
另外,PCR扩增各质粒中的插入物,采用位于p-GEM质粒、T3和SP6两臂的序列 作为引物。在96孔现成(ready-to-run)琼脂糖凝胶上跑电泳分析PCR产物。将经证 实的插入物点在2张尼龙膜上。使1张膜与转变体探针杂交,另1张膜与非转变体 探针杂交。
4)按厂商说明,修改了洗涤的严谨性杂交这些膜并洗涤(Enzo MaxSenceTM试剂盒, Enzo Diagnostics,Inc,Farmingdale,NY)。用杂交缓冲液(2xSSC缓冲甲酰胺,含 去污剂和杂交增强剂)在42℃预杂交这些膜30分钟,再与10μl变性探针42℃杂交 过夜。随后1X杂交洗涤缓冲液中室温洗涤膜1次10分钟和在65℃洗涤4次15分钟。 膜即可用于检测。
5)检测洗涤过的膜,通过碱性磷酸酶标记,接着进行NBT/BCIP比色检测,按厂 商检测程序所述进行(Enzo Diagnostics,Inc.)。用1x封闭液室温封闭膜1小时, 用1X检测试剂洗涤3次10分钟,用1x预显色反应缓冲液洗涤2次5分钟,然后在 显色溶液中显色印迹30-45分钟直到出现斑点。所有试剂由厂商提供(Enzo Diagnostics,Inc.)。此外,还按照厂商的说明(KPL,Gaithersburg,Maryland)用 KPL southern杂交和检测试剂盒进行了大规模反向Southern试验。
实施例7:克隆的特征分析-NORTHERN印迹分析
除了Southern印迹分析,将一些膜如Northern印迹试验实施例中所述进行杂交 并如下用Northern杂交检测烟草中mRNA的差异表达。
用随机引物方法制备克隆p450的探针(MegaprimeTM DNA Labelling Systems, Amersham Biosciences)。
混合下列成分:250μg变性DNA模板;未标记的dTTP、dGTP和dCTP各4μl;5μl 反应缓冲液,P32标记的dATP和2μl KlenowI并加水使反应提及达到50μl。混合物 37℃孵育1-4小时。用2μl 0.5M EDTA终止反应。使用前95℃孵育5分钟使探针变 性。
制备几对烟草品系的乙烯处理和非处理的新鲜叶片的RNA样品。在一些情况中, 采用富含多聚A的RNA。将大约15μg总RNA或1.8μg mRNA(RNA和mRNA的提取方法 描述于实施例5中)用DEPC H2O(5-10μl)加到相等体积。加入相同体积的上样缓冲液 (1x MOPS;18.5%甲醛;50%甲酰胺;4%Ficoll400;溴酚蓝)和0.5μl EtBr(0.5μg/μl)。 随后变性准备电泳分离RNA样品。
将样品在甲醛凝胶(1%琼脂糖,1x MOPS,0.6M甲醛)上进行电泳,采用1XMOP缓 冲液(0.4M吗啉代丙烷磺酸;0.1M乙酸钠-3xH2O;10mM EDTA;用NaOH调至pH7.2)。 用毛细管方法在10X SSC缓冲液(1.5M NaCl;0.15柠檬酸钠)中将RNA转移到Hybond-N +膜(尼龙,Amersham Pharmacia Biotech)上。含RNA样品的膜在杂交前进行UV- 交联(自动交联设置,254nm,Stratagene,Stratalinker)。
用5-10ml预杂交缓冲液(5xSSC;50%甲酰胺;5xDenhardt溶液;1%SDS;100μg/ml 热变性剪切的非同源性DNA)在42℃预杂交膜1-4小时。弃去旧的预杂交缓冲液,加 入新的预杂交缓冲液和探针。42℃杂交过夜。用2xSSC室温洗涤膜15分钟,接着用 2xSSC洗涤2次。
本发明的主要关注点是发现了新基因,这些基因可因乙烯处理而被诱导(表达)或 对烟草叶片的质量和组成发挥关键作用。如下表所示,Northern印迹和方向Southern 印迹可用于确定相对于非诱导植物,哪些基因可被乙烯处理所诱导。有趣的是,在 转变体和非转变体中不是所有片段都受类似影响。部分测定了感兴趣细胞色素p450 片段的序列以确定它们的结构相关性。此信息可用于随后的分离和特征分析感兴趣 的全长基因克隆。


对经乙烯处理诱导的转化体和非转化体细纤维烟草品系获得的烟草组织上,全长 克隆进行Northern分析。其目的是为了鉴定出在乙烯诱导的转化体品系中的表达比 在乙烯诱导的非转化体细纤维烟草品系中的表达有所提高的那些全长克隆。这样做 可通过比较转化体和非转化体品系之间叶片组成的生化差异来确定全长克隆的功能 性关系。如下表所示,与非转化体处理的组织(用+表示)相比,在乙烯处理的转化体 组织中,六个克隆显示出明显较高的表达(用++和+++表示)。在未用乙烯处理的转化 体和非转化体品系中所有这些克隆仅有少量表达或没有表达。
  全长克隆   转化体   非转化体   D101-BA2   ++   +   D207-AA5   ++   +   D208-AC8   +++   +   D237-AD1   ++   +   D89-AB1   ++   +   D90A-BB3   ++   +
实施例8:克隆的基因所编码p450的免疫检测
选择1)与其它克隆相比具有较低同源性或没有同源性和2)具有良好亲水性和抗 原性的与三个p450克隆的长度20-22个氨基酸相对应的肽区域。从各个p450克隆 选出的肽区域的氨基酸序列如下。将合成的肽与KHL偶联然后注射入兔中。在第4 次注射2周和4周后收集抗血清(Alpha DiagnosticIntl.Inc.San Antonio,TX)。
D234-AD1 DIDGSKSKLVKAHRKIDEILG
D90a-BB3 RDAFREKETFDENDVEELNY
D89-AB1 FKNNGDEDRHFSQKLGDLADKY
通过Western印迹分析检测抗血清与烟草植物组织的靶蛋白之间的交叉反应。获 得乙烯处理(0-40小时)的转化体和非转化体品系的中期叶片的粗制蛋白提取物。用 RC DC蛋白质分析试剂盒(RC DC Protein Assay Kit,BIO-RAD)按照厂商的说明测定 提取物的蛋白质浓度。
在每条泳道上加入2mg蛋白质并用Laemmli SDS-PAGE系统在10%-20%梯度凝胶上 分离这些蛋白质。将蛋白质从凝胶移到装有半干小室(Semi-Dry cell, BIO-RAD)的硝基纤维素转移膜(Nitrocellulose Transfer Membranes, Schleicher & Schuell)上。并用ECL AdvanceTM Western印迹检测试剂盒(Western Blotting Detection Kit,Amersham Biosciences)检测靶p450蛋白观察。在兔制 备抗合成的KLH偶联物的第一抗体。与过氧化物酶体偶联的抗兔IgG的第二抗体购 自Sigma。第一抗体和第二抗体都以1∶1000的稀释度使用。这些抗体对Western印 迹上的一条条带显示了强反应性,表明该抗血清对我们感兴趣的靶肽是单特异性的。 该抗血清也能育偶联有KLH的合成肽起交叉反应。
实施例9:分离核酸片段的核酸相同性和结构相关性
给超过100个克隆p450片段结合Northern印迹分析测序,以确定它们的结构相 关性。所用方法使用的正向引物以位于p450基因羧基末端附近的2个共同p450基 序之一为基础。该正向引物对应于细胞色素p450的基序FXPERF或GRRXCP(A/G),如 图1所示。反向引物采用二质粒位于pGEMTM质粒两臂的SP6或T7或多聚A尾部的标 准引物。所用程序见以下所述。
按厂商程序(Beckman Coulter)用分光光度测定法估计起始双链DNA浓度。将模 板用水稀释到合适浓度,95℃加热2分钟然后置于冰上使其变性。在冰上准备测序 反应体系,采用0.5-10μl变性DNA模板、2μl 1.6皮摩尔正向引物、8μl DTCS Quick Start Master混合物,总体积用水加至20μl。热循环程序包括30轮下列循环:96 ℃ 20秒,50℃ 20秒,60℃ 4分钟,接着保持于4℃。
加入5μl终止缓冲液(等体积3M NaOAc和100mM EDTA和1μl20mg/ml糖原)终止 序列延伸。样品用60μl冷的95%乙醇沉淀6000g离心6分钟。弃乙醇。沉淀用200μl 冷的70%乙醇洗涤。干燥沉淀后,加入40μl SLS溶液重悬沉淀。覆盖一层矿物油。 随后样品置于CEQ 8000自动测序仪上作进一步分析。
为验证核酸序列,以2个方向重测序核酸序列,使用针对p450基因FXPERF或 GRRXCP(A/G)区的正向引物和针对质粒或多聚A尾的反向引物。所有测序以2方向至 少进行2次。
相互比较诸细胞色素p450片段核酸序列的从对应于编码GRRXCP(A/G)基序区域 后第一个核酸到终止密码子之间的编码区。选择此区作为p450蛋白之间遗传多样性 的指标。观察到大量遗传基因不同的p450基因,超过70个基因类似于其它植物属 的基因。比较核酸序列时,发现可将这些基因根据它们的序列相同性置于不同序列 组中。发现p450成员的最佳独特分组确定为核酸相同性75%或更高的那些序列(示于 表I)。减少相同性百分比导致产生显著更多的组。优选组见于核酸组相同性为81% 或更高的序列,更优选的组为91%核酸相同性或更高,最优选的组为99%核酸相同性 或更高。大部分组包含至少2个成员,常为3个或多个成员。没有重复发现其它的 组,提示采用该方法能分离得到所用组织中的低表达和高表达mRNA。
在75%核酸相同性或更高的基础上,发现2个细胞色素p450组所含的核酸序列, 与前述基因结构与该组不同的烟草细胞色素基因相同。组23分别显示与前面Czernic 等的GenBank序列GI:1171579(CAA64635)和Ralston等的GI:14423327(或AAK62346) 的核酸相同性,采用表I参数作比较。GI:1171579与组23成员的核酸相同性范围从 96.9%-99.5%;而GI:14423327与此组的相同性范围从95.4%-96.9%。组31成员与 Ralston等报导的GenBank序列GI:14423319(AAK62342)的核酸相同性范围从 76.7%-97.8%。表1的其它p450相同性组没有一个含有与Ralston等、Czernic等、 Wang等或LaRosa和Smigocki报导的烟草p450基因的相同参数(见表1中所用的参 数)。
如图76所示,可产生具有适当核酸简并性探针的共有序列,用于组的优选鉴定 和分离烟草植物各组的其它成员。
表I:烟草p450核酸序列相同性组
组别 片段
1    D58-BG7(SEQ ID No.:1);D58-AB1(SEQ ID No.:3);D58-BE4(SEQ ID No.:7)
2    D56-AH7(SEQ ID No.:9);D13a-5(SEQ ID No.:11)
3    D56-AG10(SEQ ID No.:13);D35-33(SEQ ID No.:15);D34-62(SEQ ID No.:17)
4    D56-AA7(SEQ ID No.:19);D56-AE1(SEQ ID No.:21);185-BD3(SEQ ID No.:143)
5    D35-BB7(SEQ ID No.:23);D177-BA7(SEQ ID No.:25);D56A-AB6(SEQ ID No.:27);D144-AE2(SEQ ID No.:29)
6    D56-AG11(SEQ ID No.:31);D179-AA1(SEQ ID No.:33)
7    D56-AC7(SEQ ID No.:35);D144-AD1(SEQ ID No.:37)
8    D144-AB5(SEQ ID No.:39)
9    D181-AB5(SEQ ID No.:41);D73-Ac9(SEQ ID No.:43)
10   D56-AC12(SEQ ID No.:45)
11   D58-AB9(SEQ ID No.:47);D56-AG9(SEQ ID No.:49);D56-AG6(SEQ ID No.:51);D35-BG11(SEQ ID No.:53);D35-42(SEQ ID No.:55);D35-BA3(SEQ ID No.:57);D34-57(SEQ ID No.:59);D34-52(SEQ ID No.:61);D34-25(SEQ ID No.:63)
12   D56-AD10(SEQ ID No.:65)
13   56-AA11(SEQ ID No.:67)
14   D177-BD5(SEQ ID No.:69);D177-BD7(SEQ ID No.:83)
15   D56A-AG10(SEQ ID No.:71);D58-BC5(SEQ ID No.:73);D58-AD12(SEQ ID No.:75)
16   D56-AC11(SEQ ID No.:77);D35-39(SEQ ID No.:79);D58-BH4(SEQ ID No.:81);D56-AD6(SEQ ID No.:87)
17   D73A-AD6(SEQ ID No.:89);D70A-BA11(SEQ ID No.:91)
18   D70A-AB5(SEQ ID No.:95);D70A-AA8(SEQ ID No.:97)
19   D70A-AB8(SEQ ID No.:99);D70A-BH2(SEQ ID No.:101);D70A-AA4(SEQ ID No.:103)
20   D70A-BA1(SEQ ID No.:105);D70A-BA9(SEQ ID No.:107)
21   D70A-BD4(SEQ ID No.:109)
22   D181-AC5(SEQ ID No.:111);D144-AH1(SEQ ID No.:113);D34-65(SEQ ID No.:115)
23   D35-BG2(SEQ ID No.:117)
24   D73A-AH7(SEQ ID No.:119)
25   D58-AA1(SEQ ID No.:121);D185-BC1(SEQ ID No.:133);D185-BG2(SEQ ID No.:135)
26   D73-AE10(SEQ ID No.:123)
27   D56-AC12(SEQ ID No.:125)
28   D177-BF7(SEQ ID No.:127);D185-BE1(SEQ ID No.:137);D185-BD2(SEQ ID No.:139)
29   D73A-AG3(SEQ ID No.:129)
30   D70A-AA12(SEQ ID No.:131);D176-BF2(SEQ ID No.:85)
31   D176-BC3(SEQ ID No.:145)
32   D176-BB3(SEQ ID No.:147)
33   D186-AH4(SEQ ID No.:5)
实施例10:分离核酸片段的氨基酸序列相同性
推导出实施例8细胞色素p450片段核酸序列的氨基酸序列。该推导区域对应于 紧接GXRXCP(A/G)序列基序后到羧基末端或终止密码子的氨基酸序列。比较这些片段 的序列相同性时,观察到这些序列的特定氨基酸相同性为70%或更高。观察到这些序 列的优选组氨基酸相同性为80%或更高,更优选组为90%氨基酸相同性或更高,最优 选组为99%氨基酸相同性或更高。各组和组成员的对应氨基酸序列示于图2。发现一 些独特核酸序列与其它片段氨基酸完全相同,因此仅报告1个有相同氨基酸的成员。
表II组19的氨基酸相同性根据其核酸序列对应于3个不同组。各组成员的氨基 酸序列和其相同性示于图77。氨基酸差别作了适当标记。
选出各氨基酸相同性组的至少1个成员作基因克隆和用于植物的功能研究。另外, 选出受乙烯处理不同影响的或经Northern和Southern分析评估具有其它生物学差 异的组成员作基因克隆和功能研究。为协助基因克隆,表达研究和完整植物的评估、 将根据序列相同性和序列差异制备肽的特异性抗体。
表II:烟草p450氨基酸序列相同性组
组   片段
1    D58-BG7(SEQ ID No.:2),D58-AB1(SEQ ID No.:4)
2    D58-BE4(SEQ ID No.:8)
3    D56-AH7(SEQ ID No.:10);D13a-5(SEQ ID No.:12)
4    D56-AG10(SEQ ID No.:14);D34-62(SEQ ID No.:18)
5    D56-AA7(SEQ ID No.:20);D56-AE1(SEQ ID No.:22);185-BD3(SEQ ID No.:144)
6    D35-BB7(SEQ ID No.:24);D177-BA7(SEQ ID No.:26);D56A-AB6(SEQ ID No.:28);D144-AE2(SEQ ID No.:30)
7    D56-AG11(SEQ ID No.:32);D179-AA1(SEQ ID No.:34)
8    D56-AC7(SEQ ID No.:36);D144-AD1(SEQ ID No.:38)
9    D144-AB5(SEQ ID No.:40)
10   D181-AB5(SEQ ID No.:42);D73-Ac9(SEQ ID No.:44)
11   D56-AC12(SEQ ID No.:46)
12   D58-AB9(SEQ ID No.:48);D56-AG9(SEQ ID No.:50);D56-AG6(SEQ ID No.:52);
D35-BG11(SEQ ID No.:54);D35-42(SEQ ID No.:56);D35-BA3(SEQ ID No.:58);
D34-57(SEQ ID No.:60);D34-52(SEQ ID No.:62)
13   D56AD10(SEQ ID No.:66)
14   56-AA11(SEQ ID No.:68)
15   D177-BD5(SEQ ID No.:70);D177-BD7(SEQ ID No.:84)
16   D56A-AG10(SEQ ID No.:72);D58-BC5(SEQ ID No.:74);D58-AD12(SEQ ID No.:76)
17   D56-AC11(SEQ ID No.:78);D56-AD6(SEQ ID No.:88)
18   D73A-AD6(SEQ ID No.90:)
19   D70A-AB5(SEQ ID No.:96);D70A-AB8(SEQ ID No.:100);D70A-BH2(SEQ ID No.:102);D70A-AA4(SEQ ID No.:104);D70A-BA1(SEQ ID No.:106);D70A-BA9 (SEQ ID No.:108)
20   D70A-BD4(SEQ ID No.:110)
21   D181-AC5(SEQ ID No.:112);D144-AH1(SEQ ID No.:114);D34-65(SEQ ID No.:116)
22   D35-BG2(SEQ ID No.:118)
23   D73A-AH7(SEQ ID No.:120)
24   D58-AA1(SEQ ID No.:122);D185-BC1(SEQ ID No.:134);D185-BG2(SEQ ID No.:136)
25   D73-AE10(SEQ ID No.:124)
26   D56-AC12(SEQ ID No.:126)
27   D177-BF7(SEQ ID No.:128);185-BD2(SEQ ID No.:140)
28   D73A-AG3(SEQ ID No.:130)
29   D70A-AA12(SEQ ID No.:132);D176-BF2(SEQ ID No.:86)
30   D176-BC3(SEQ ID No.:146)
31   D176-BB3(SEQ ID No.:148)
32   D186-AH4(SEQ ID No.:6)
实施例11:全长克隆相关氨基酸序列的相同性
推导出实施例5中克隆的全长烟草基因核酸序列的完整的氨基酸序列。通过羧基 末端的三个保守p450结构域基序:UXXRXXZ、PXRFXF或GXRXC(其中U是E或K,X 是任何氨基酸,Z是P、T、S或M)来鉴定细胞色素p450基因。还发现有两个克隆看 来几乎是完整的但缺少合适的终止密码子,这两个克隆是D130-AA1和D101-BA2,但 这两个克隆都含有所有三个p450细胞色素结构域。采用BLAST程序将它们的全长序 列相互比较并与已知的烟草基因进行比较,鉴定了所有p450基因的氨基酸相同性。 该程序采用NCBI专用BLAST工具比对两个序列(bl2seq),http://www.ncbi.nlm. nih.gov/blast/bl2seq/bl2.html)。用没有滤器的BLASTN比对两个核酸序列,用 BLASTP比对两个氨基酸序列。根据它们的氨基酸相同性百分比将每个序列归类到相 同性组,其中,组成员间的相同性至少为85%。观察到优选组的那些序列氨基酸相同 性为90%或更高,更优选95%氨基酸相同性或更高,最优选分组为99%氨基酸相同性 或更高。采用这些标准鉴定了25个独特的组并列在表III中。
在表III中采用的氨基酸相同性参数中,发现三个组的基因与已知烟草基因的相 同性为85%或更高。组5各成员的全长序列与Ralston等的现有GenBank序列 GI:14423327(或AAK62346)的氨基酸相同性高达96%,组23与Ralston等的 GI:14423328(或AAK62347)的氨基酸相同性高达93%,组24与Ralston等的 GI:14423318(或AAK62343)的氨基酸相同性为92%。
表III:全长烟草p450基因的氨基酸序列相同性组
1    D208-AD9(SEQ.ID.No.224);D120-AH4(SEQ.ID.No.180);D121-AA8(SEQ.ID. No.182),D122-AF10(SEQ.ID.No.184);D103-AH3(SEQ.ID.No.222); D208-AC8(SEQ.ID.No.218);D-235-ABI(SEQ.ID.No.246)
2    D244-AD4(SEQ.ID.No.250);D244-AB6(SEQ.ID.No.274);D285-AA8; D285-AB9;D268-AE2(SEQ.ID.No.270)
3    D100A-AC3(SEQ.ID.No.168);D100A-BE2
4    D205-BE9(SEQ.ID.No.276);D205-BG9(SEQ.ID.No.202);D205-AH4(SEQ.ID. No.294)
5    D259-AB9(SEQ.ID.No.260);D257-AE4(SEQ.ID.No.268);D147-AD3(SEQ.ID. No.194)
6    D249-AE8(SEQ.ID.No.256);D-248-AA6(SEQ.ID.No.254)
7    D233-AG7(SEQ.ID.No.266;D224-BD11(SEQ.ID.No.240);DAF10
8    D105-AD6(SEQ.ID.No.172);D215-AB5(SEQ.ID.No.220);D135-AE1(SEQ.ID. No.190)
9    D87A-AF3(SEQ.ID.No.216),D210-BD4(SEQ.ID.No.262)
10   D89-AB1(SEQ.ID.No.150);D89-AD2(SEQ.ID.No.152);163-AG11(SEQ.ID. No.198);163-AF12(SEQ.ID.No.196)
11   D267-AF10(SEQ.ID.No.296);D96-AC2(SEQ.ID.No.160);D96-AB6(SEQ.ID. No.158);D207-AA5(SEQ.ID.No.204);D207-AB4(SEQ.ID.No.206);D207-AC4 (SEQ.ID.No.208)
12   D98-AG1(SEQ.ID.No.164);D98-AA1(SEQ.ID.No.162)
13   D209-AA12(SEQ.ID.No.212);D209-AA11;D209-AH10(SEQ.ID.No.214); D209-AH12(SEQ.ID.No.232);D90a-BB3(SEQ.ID.No.154)
14   D129-AD10(SEQ.ID.No.188);D104A-AE8(SEQ.ID.No.170)
15   D228-AH8(SEQ.ID.No.244);D228-AD7(SEQ.ID.No.241),D250-AC11(SEQ.ID. No.258);D247-AH1(SEQ.ID.No.252)
16   D128-AB7(SEQ.ID.No.186);D243-AA2(SEQ.ID.No.248);D125-AF11(SEQ.ID. No.228)
17   D284-AH5(SEQ.ID.No.298);D110-AF12(SEQ.ID.No.176)
18   D221-BB8(SEQ.ID.No.234)
19   D222-BH4(SEQ.ID.No.236)
20   D134-AE11(SEQ.ID.No.230)
21   D109-AH8(SEQ.ID.No.174)
22   D136-AF4(SEQ.ID.No.278)
23   D237-AD1(SEQ.ID.No.226)
24   D112-AA5(SEQ.ID.No.178)
25   D283-AC1(SEQ.ID.No.272)
还根据邻近羧基末端的UXXRXXZ p450结构域和GXRXC p450结构域之间高度保守 氨基酸的同源性对全长基因进一步分组。如图3所示,比较各个克隆保守性结构域 相互之间的序列同源性并将它们分置不同的相同性组中。在一些情况下,尽管克隆 的核酸序列是独特的,但该区域的核酸序列是相同的。观察到优选组这些序列的氨 基酸相同性为90%或更高,更优选具有95%氨基酸相同性或更高,最优选分组为99% 氨基酸相同性或更高。最后的分组类似于基于该克隆可完整氨基酸序列相同性百分 比的分组类似,但组17除外(表III),它被分成两个组。
在表IV采用的氨基酸相同性参数中,有三个组与已知烟草基因的相同性为90% 或更高。组5成员的全长序列与Ralston等的现有GenBank序列GI:14423326(或 AAK62346)的氨基酸相同性高达93.4%,组23与Ralston等的GI:14423328(或 AAK62347)的氨基酸相同性高达91.8%,组24与Ralston等的GI:14423318(或 AAK62343)的氨基酸相同性为98.8%。
表IV:烟草p450基因保守区之间区域的氨基酸序列相同性组
1    1D208-AD9(SEQ.ID.No.224);D120-AH4(SEQ.ID.No.180);D121-AA8(SEQ.ID. No.182),D122-AF10(SEQ.ID.No.184);D103-AH3(SEQ.ID.No.222); D208-AC8(SEQ.ID.No.218);D-235-ABI(SEQ.ID.No.246)
2    D244-AD4(SEQ.ID.No.250);D244-AB6(SEQ.ID.No.274);D285-AA8; D285-AB9;D268-AE2(SEQ.ID.No.270)
3    D100A-AC3(SEQ.ID.No.168);D100A-BE2
4    D205-BE9(SEQ.ID.No.276);D205-BG9(SEQ.ID.No.202);D205-AH4(SEQ.ID. No.294)
5    D259-AB9(SEQ.ID.No.260);D257-AE4(SEQ.ID.No.268);D147-AD3(SEQ.ID. No.194)
6    D249-AE8(SEQ.ID.No.256);D-248-AA6(SEQ.ID.No.254)
7    D233-AG7(SEQ.ID.No.266;D224-BD11(SEQ.ID.No.240);DAF10
8    D105-AD6(SEQ.ID.No.172);D215-AB5(SEQ.ID.No.220);D135-AE1(SEQ.ID. No.190)
9    D87A-AF3(SEQ.ID.No.216),D210-BD4(SEQ.ID.No.262)10D89-AB1(SEQ.ID. No.150);D89-AD2(SEQ.ID.No.152);
10   163-AG11(SEQ.ID.No.198);163-AF12(SEQ.ID.No.196)
11    D267-AF10(SEQ.ID.No.296);D96-AC2(SEQ.ID.No.160);D96-AB6(SEQ.ID. No.158);D207-AA5(SEQ.ID.No.204);D207-AB4(SEQ.ID.No.206);D207-AC4 (SEQ.ID.No.208)
12    D98-AG1(SEQ.ID.No.164);D98-AA1(SEQ.ID.No.162)
13    D209-AA12(SEQ.ID.No.212);D209-AA11;D209-AH10(SEQ.ID.No.214); D209-AH12(SEQ.ID.No.232);D90a-BB3(SEQ.ID.No.154)
14    D129-AD10(SEQ.ID.No.188);D104A-AE8(SEQ.ID.No.170)
15    D228-AH8(SEQ.ID.No.244);D228-AD7(SEQ.ID.No.241),D250-AC11(SEQ.ID. No.258);D247-AH1(SEQ.ID.No.252)
16    D128-AB7(SEQ.ID.No.186);D243-AA2(SEQ.ID.No.248);D125-AF11(SEQ.ID. No.228)
17    D284-AH5(SEQ.ID.No.298);D110-AF12(SEQ.ID.No.176)
18    D221-BB8(SEQ.ID.No.234)
19    D222-BH4(SEQ.ID.No.236)
20    D134-AE11(SEQ.ID.No.230)
21    D109-AH8(SEQ.ID.No.174)
22    D136-AF4(SEQ.ID.No.278)
23    D237-AD1(SEQ.ID.No.226)
24    D112-AA5(SEQ.ID.No.178)
25    D283-AC1(SEQ.ID.No.272)
26    D110-AF12(SEQ.ID.No.176)
实施例12:烟草细胞色素p450的克隆缺少一个或多个烟草细胞色素p450特异性 结构域
表III中列出了与其它烟草细胞色素基因的核酸同源性在90%-99%之间的具有高 核酸同源性的四个克隆。这四个克隆包括D136-AD5、D138-AD12、D243-AB3和 D250-AC11。然而,由于核苷酸移码,这些基因不包含三种C末端细胞色素p450结 构域中的一个或多个,且不包括在表III或表IV中列出的相同性组中。
不含有第三个结构域GXRXC的一个克隆D95-AG1的氨基酸相同性被用来将表III 或表IV中的p450烟草基因进行分组。这种克隆和其它烟草细胞色素基因的核酸同 源性低。这种克隆代表烟草细胞色素p450基因的一种新的且不同的组。
实施例13:烟草细胞色素p450片段和克隆在烟草特性的改变调节中的应用
烟草的p450核酸片段或其全基因可用于鉴定和选择那些具有改变的烟草表型或 烟草组成,以及更重要的具有改变的代谢物的植物。利用各种能将本文所述的核酸 片段或全长基因加入下游调控位置例如呈反义取向,或过表达位置例如呈正义取向 的各种转化系统制造了转基因烟草植物。为过表达全长基因,任何编码本发明所述 全长基因的完整氨基酸序列或其功能性片段的核酸序列,可有效增加某些酶的表达 并因此在烟草中造成表型效应。通过一系列回交获得了纯合的烟草品系并评价了其 表型变化,包括但不限于用此领域的一般技术人员通常可获得的技术分析内源p450 RNA、转录物、p450表达的肽和植物代谢物的浓度。烟草植物所显示出的变化为我 们所选感兴趣的基因的功能作用提供了信息,或者可被用作优选的烟草植物品种。
预期本领域技术人员在实践发明中会根据上述发明的详细说明作出许多修改和 变化。因此,这些修改和变化包括在下列权利要求范围中。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用