在植物中调节β大马酮转让专利

申请号 : CN201280064294.3

文献号 : CN104080802B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : L·博韦J·卡蒂诺特J·施瓦尔

申请人 : 菲利普莫里斯产品有限公司

摘要 :

一种突变、非天然存在的或转基因的植物细胞,其含有:(i)包含、由或基本上由编码新黄质合酶并且与SEQ ID NO:1或SEQ ID NO:6具有至少60%的序列同一性的序列所组成的多核苷酸;(ii)由如(i)所示的多核苷酸编码的多肽;(iii)与SEQ ID NO:2具有至少66%的序列同一性、或与SEQ ID NO:7具有至少60%的序列同一性的多肽;或者(iv)含有如(i)所示的分离多核苷酸的构建体、载体或表达载体,以及其中新黄质合酶的表达或活性与对照或野生型植物相比被调节。

权利要求 :

1.一种烟草制品,其包含突变的或转基因的烟草植物细胞,所述烟草植物细胞含有:(i)一种多核苷酸,其由SEQ ID NO:1或SEQ ID NO:6所示的编码新黄质合酶的序列所组成;

(i i)由(i)所示的多核苷酸编码的多肽;

(iii)由SEQ ID NO:2或SEQ ID NO:7组成的多肽;或者(iv)含有(i)所示的分离多核苷酸的构建体、载体或表达载体,以及其中,与对照或野生型烟草植物相比,新黄质合酶的表达或活性是增加的;并且加热所述烟草制品后形成的气雾中β大马酮含量比加热对照烟草制品后形成的气雾中β大马酮含量高至少10%,所述对照烟草制品包含所述对照或野生型烟草植物的细胞。

2.一种烟草制品,其中包含含有权利要求1所限定的烟草植物细胞的突变的或转基因的烟草植物材料。

3.一种用于生产烟草植物的方法,其中所述烟草植物具有增加的类胡萝卜素含量,所述方法包括以下步骤:(a)增加烟草植物中新黄质合酶的表达或活性,其中所述新黄质合酶含有:(i)一种多核苷酸,其由SEQ ID NO:1或SEQ ID NO:6所示的编码新黄质合酶的序列所组成;

(ii)由(i)所示的多核苷酸编码的多肽;或者

(iii)由SEQ ID NO:2或SEQ ID NO:7组成的多肽;

(b)在获自步骤(a)的突变的或转基因的烟草植物的至少部分中测量类胡萝卜素含量;

以及

(c)鉴定突变的或转基因的烟草植物,在所述烟草植物内的类胡萝卜素含量与对照烟草植物相比已经得以增加,在所述对照烟草植物中新黄质合酶的表达或活性未被增加,其中,增加新黄质合酶的表达或活性使所述烟草植物中的类胡萝卜素含量增加;并且在烤制的所述突变的或转基因的烟草植物的植物材料的气雾中β大马酮含量,比烤制的对照烟草植物的植物材料的气雾中β大马酮含量高至少10%。

4.根据权利要求3所述的方法,其中所述烟草植物中番茄红素β环化酶的表达或活性增加,或者所述烟草植物中9-顺式-环氧类胡萝卜素双加氧酶的表达或活性降低,或者其组合,由此增加所述烟草植物中的类胡萝卜素含量。

5.根据权利要求4所述的方法,其中番茄红素β环化酶由SEQ ID NO:8所示的多核苷酸序列组成、或者由SEQ ID NO:9所示的多肽序列组成,以及其中9-顺式-环氧类胡萝卜素双加氧酶由SEQ ID NO:13所示的多核苷酸序列组成。

6.一种用于生产烟草植物的方法,其中所述烟草植物具有增加的β大马酮含量,所述方法包括以下步骤:(a)增加烟草植物中的新黄质合酶的表达或活性,其中新黄质合酶含有:(i)一种多核苷酸,其由SEQ ID NO:1或SEQ ID NO:6所示的编码新黄质合酶的序列所组成;

(ii)由(i)所示的多核苷酸编码的多肽;或者

(iii)由SEQ ID NO:2或SEQ ID NO:7组成的多肽;

(b)在获自步骤(a)的突变的或转基因的烟草植物的至少部分中或其加热所产生的气雾中测量β大马酮含量;以及(c)鉴定突变的或转基因的烟草植物,在所述烟草植物中β大马酮含量与对照烟草植物相比已被增加,所述对照烟草植物中新黄质合酶的表达或活性未被增加,其中,增加新黄质合酶的表达或活性使所述烟草植物中的β大马酮含量增加;并且在烤制的所述突变的或转基因的烟草植物的植物材料的气雾中β大马酮含量,比烤制的对照烟草植物的植物材料的气雾中β大马酮含量高至少10%。

7.一种烟草制品,其包含通过权利要求6所述的方法获得的或可获得的突变的或转基因的烟草植物或者植物材料。

8.根据权利要求2或7所述的烟草制品,其中烟草植物的绿叶叶黄素含量或β胡萝卜素含量或组合的叶黄素和β胡萝卜素含量比对照烟草植物更高,所述对照烟草植物中新黄质合酶的表达或活性没有增加;以及其中:(i)烟草植物的绿叶叶黄素含量是至少18mg/100g;

(ii)其中烟草植物的β胡萝卜素含量是至少12mg/100g;以及(iii)其中加热时气雾中的β大马酮含量是至少1ng/mg。

9.一种用于生产β大马酮的方法,所述方法包括以下步骤:(a)提供权利要求2、7或8中任一项所限定的烟草植物的至少部分、植物材料、或者烟草制品;以及(b)对其供热以产生含有β大马酮的气雾。

说明书 :

在植物中调节β大马酮

技术领域

[0001] 本发明公开来自红花烟草和变体的新黄质合酶、番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶的多核苷酸序列、其同源物和片段。具体地,本发明描述修饰新黄质合酶的表达或由其编码的蛋白活性来调节β大马酮的量导致在烟草中新的风味谱,所述β大马酮的量在加热烟草的气雾中可检测到。

背景技术

[0002] β大马酮是烤烟的蒸馏气雾中的芳香因子。其具有典型的水果和熟苹果风味,其也可在大马士革玫瑰Mill(Rosa damascen Mill)(大马士革玫瑰)中天然发现,从而表明酶促途径的存在导致其在一些植物中合成。大马士革玫瑰的花以其细腻芬芳闻名,并为用于香水和制造玫瑰水的玫瑰精油进行商业收获。花瓣有时也直接用于风味食品或饮料,并且对于人类消耗被视作是安全的。
[0003] 类胡萝卜素是β大马酮生产的潜在前体。新黄质的热氧化导致β大马酮的形成。新黄质是一种含氧类胡萝卜素衍生物,其属于叶黄素类以及由8个类异戊二烯单元组成。在衰老和烤制叶子中,游离的新黄质不存在或仅在非常低水平被检测到。在发生在质体(如叶绿体)中的植物类胡萝卜素通路内,已知形成新黄质的酶属于新黄质合酶类。新黄质合酶催化从紫黄质形成新黄质,新黄质合酶由ABA4多核苷酸编码。番茄红素β环化酶也催化从紫黄质形成新黄质,番茄红素β环化酶由NeSy多核苷酸编码。9-顺式-环氧类胡萝卜素双加氧酶催化在C25-丙二烯-脱辅基醛和黄质中顺式-新黄质的切割,9-顺式-环氧类胡萝卜素双加氧酶由NCED2多核苷酸编码。
[0004] 在本领域中仍然需要具有改变风味谱的植物材料,例如烟草。本发明的目的是满足这种需求。

发明内容

[0005] 已经从红花烟草(Nicotiana tabacum)中克隆并测序了相应的ABA4、NeSy和NCED2基因,并且已调查了这些基因的调节的表达效果。认为由NeSy和NCED2多核苷酸编码的酶是类胡萝卜素生物合成通路的组分、以及发现在植物中上调NeSy多核苷酸的表达和下调NCED2多核苷酸的表达增加类胡萝卜素含量。然而,未检测到β大马酮的生产改变。令人吃惊地,本发明人发现增加ABA4多核苷酸的表达不仅增加了类胡萝卜素含量而且还显著地增加了在加热烟草植物制备的烤制烟草后形成的气雾中的β大马酮含量。这种发现甚至更令人吃惊,因为NeSy多核苷酸编码这样的酶,其在类胡萝卜素生物合成通路中与ABA4多核苷酸在相同点上发挥作用,但是发现NeSy多核苷酸对β大马酮水平没有显著效果。不愿由任何特定理论所约束,这种发现表示由ABA4多核苷酸编码的新黄质合酶在红花烟草的β大马酮合成中起核心作用。这允许产生这样的植物,所述植物中β大马酮的水平被调节并因此具有改变的风味谱。可工程化植物使得其中类胡萝卜素含量被调节。这样的植物可对消费者具有营养益处。此外,调节植物的类胡萝卜素含量可用于生成耐受抑制类胡萝卜素生物合成的除草剂的植物,其可延伸至类胡萝卜素抑制剂作为目前对这些化合物敏感的作物的除草剂的用途。有利地,这些变化基本没有改变植物的视觉外观,所述视觉外观是产业接受的重要标准并用于植物产量最大化等。
[0006] 发明的方面和实施方案
[0007] 本发明的方面和实施方案如所附权利要求所示。
[0008] 在一方面,提供分离的多核苷酸,其包含、由或基本上由编码新黄质合酶并且与SEQ ID NO:1或SEQ ID NO:6具有至少60%的序列同一性的序列所组成。
[0009] 在另一方面,提供由所述多核苷酸编码的分离的多肽。
[0010] 在另一方面,提供与SEQ ID NO:2具有至少66%的序列同一性、或与SEQ ID NO:7具有至少60%的序列同一性的分离的多肽。
[0011] 在另一方面,提供含有所述分离的多核苷酸的构建体、载体或表达载体。
[0012] 在另一方面,提供突变、非天然存在的或转基因的植物细胞,其含有本文所述的分离的多核苷酸、多肽或构建体、载体或表达载体,以及其中新黄质合酶的表达或活性与对照或野生型植物相比被调节。
[0013] 在一个实施方案中,突变、非天然存在的或转基因植物含有植物细胞。
[0014] 在另一方面,提供用于调节植物的类胡萝卜素含量的方法,包括步骤:(i)调节在植物中的新黄质合酶的表达或活性,优选地,其中所述新黄质合酶含有如本文所示的多核苷酸序列或多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分中的类胡萝卜素含量;以及(iii)鉴定其中其内类胡萝卜素含量与对照植物相比已经变化的突变、非天然存在的或转基因植物,在所述对照植物中新黄质合酶的表达或活性未被调节。
[0015] 在一个实施方案中,番茄红素β环化酶或9-顺式-环氧类胡萝卜素双加氧酶或其组合的表达或活性在植物中也被调节。
[0016] 在一个实施方案中,番茄红素β环化酶含有如SEQ ID NO:8所示的或者与其具有至少60%的序列同一性的多核苷酸序列、或者含有如SEQ ID NO:9所示或与其具有至少60%的序列同一性的多肽序列,以及其中9-顺式-环氧类胡萝卜素双加氧酶含有如SEQ ID NO:13所示的或者与其具有至少60%的序列同一性的多核苷酸序列。
[0017] 在另一方面,提供用于调节植物的β大马酮含量的方法,包括以下步骤:(i)调节在植物中的新黄质合酶的表达或活性,优选地,其中新黄质合酶含有本文所述的多核苷酸序列或多肽序列;(ii)测量获自步骤(i)的突变、非天然存在的或转基因植物的至少部分中的β大马酮含量;以及(iii)鉴定其中其内β大马酮含量与对照植物相比已变化的突变、非天然存在的或转基因植物,所述对照植物中新黄质合酶的表达或活性未被调节。
[0018] 在另一方面,提供通过本文所述的方法获得的或可获得的突变、非天然存在的或转基因植物或源自或可源自其的植物材料。
[0019] 在另一方面,提供突变、非天然存在的或转基因植物,其中新黄质合酶的表达或由其编码的蛋白的活性已经增加;其中植物的绿叶叶黄素含量或β胡萝卜素含量或组合的叶黄素和β胡萝卜素含量比对照植物更高,所述对照植物中新黄质合酶的表达或活性没有增加;以及其中在烤制植物材料的气雾中的β大马酮含量比来自对照植物的气雾中高至少10%,优选地,其中:(i)植物的绿叶叶黄素含量是至少约18mg/100g;(ii)其中植物的β胡萝卜素含量是至少约12mg/100g;以及(iii)其中加热来自植物的叶生物质时的气雾中的β大马酮含量是至少约1ng/mg。
[0020] 在另一方面,提供包括来自本文所述植物的植物材料,其包含生物质、种子或叶。
[0021] 在另一方面,提供含有本文所述的植物细胞、植物的至少部分或植物材料的烟草制品。
[0022] 在另一方面,提供用于生产β大马酮的方法,包括步骤:(a)提供如本文所述的植物的至少部分、植物材料或烟草制品;以及(b)对其供热以产生含β大马酮的气雾。
[0023] 其它方面包括下列。
[0024] 含有本文所述一个或多个分离多核苷酸的嵌合基因,所述分离多核苷酸可操作地连接到一个或多个调节序列。
[0025] 含有本文所述一个或多个分离多核苷酸的多核苷酸构建体,以及所述多核苷酸构建体包含、由或基本上由至少15-30个核苷酸、30-50个核苷酸、50-100个核苷酸、100-150个核苷酸、150-200个核苷酸、200-300个核苷酸、300-400个核苷酸、400-500个核苷酸、500-600个核苷酸或600-700个核苷酸所组成。
[0026] 整合或利用如本文所述的植物材料、生物质、种子或叶的可消费产品。
[0027] 含有本文所述的分离多核苷酸、嵌合基因、多核苷酸构建体、双链RNA、缀合物或表达载体等的细胞系。
[0028] 用于在细胞中调节本文所述的一个或多个多核苷酸表达、或者由其编码的一个或多个多肽活性的方法,所述方法包括施用如本文所述的嵌合基因、多核苷酸构建体、双链RNA、缀合物或表达载体。
[0029] 用于检测、分离、扩增、或分析本文所述的一个或多个多核苷酸的方法,所述方法包括步骤:提供含有多核苷酸的样本,以及将所述多核苷酸杂交至含有来自分离核苷酸序列的至少10个连续核苷酸的核苷酸序列的多核苷酸分子。
[0030] 一种用于在植物的至少部分中与对照植物相比调节类胡萝卜素含量和β大马酮含量、或者类胡萝卜素含量或β大马酮含量的方法,所述方法包括使用调节本文所述的一个或多个多核苷酸的表达、或由其编码的蛋白的活性的试剂。
[0031] 调节本文所述的一个或多个多核苷酸的表达、或由其编码的蛋白的活性的试剂,用于在植物的至少部分中与对照植物相比来调节类胡萝卜素含量和β大马酮含量、或者类胡萝卜素含量或β大马酮含量的用途。
[0032] 在一个实施方案中,所述试剂是或源自嵌合多核苷酸基因、含有一个或多个多核苷酸的多核苷酸构建体、反义RNA、双链RNA、cDNA、含有一个或多个多核苷酸的缀合物或者与其共价附着的至少一种非核苷酸或非多核苷酸半体、核酶、诱变剂、锌指、小分子或大范围核酸酶。
[0033] 在另一个实施方案中,多核苷酸片段编码反义核酸、核酶、影响剪接体介导的反式剪接的RNA、干扰RNA、向导RNA、或其它非翻译RNA等。在另一实施方案中,多核苷酸片段编码干扰RNA。

附图说明

[0034] 图1:在植物中的类胡萝卜素通路的简化版本。新黄质和叶黄素是有助于β大马酮在叶中形成的前体候选者。此外,至今未表征的步骤分别包括在烤制期间糖苷形成和细菌降解。
[0035] 图2:(A)从K326扩增的NtABA4 cDNA序列用于工程化35S::NtABA4植物;(B)NtABA4翻译序列;(C)用于扩增NtABA4序列的正向(F)和反向(R)引物。F引物中的5'cacc序列是克隆到pENTER Gateway载体所必须的。
[0036] 图3:克隆并测序与NtABA4基因拷贝对应的来自希克斯阔叶的烟草基因组序列。(A)具有五个外显子和4个内含子的此基因组序列覆盖总计1808bp(1792+16bp内含子边界)。(B)NtABA4 cDNA(T)和克隆的基因组N1ABA4同种型(CQ)不相同。(C)从基因组序列(Sbjct)推导出预测的786 bp长的NIABA4拷贝与克隆的N1ABA4 cDNA(Query)在7个氨基酸上不同,克隆的N1ABA4 cDNA包括在叶绿体转运肽上第9位1个丝氨酸,所述丝氨酸不存在于基因组拷贝中。
[0037] 图4:(A)从K326扩增的NtNeSy cDNA序列用于工程化35S::NtNeSy植物;(B)NtNeSy翻译序列;(C)用于扩增NtNeSy序列的正向(F)和反向(R)引物。F引物中的5'cacc序列是克隆到pENTER Gateway载体所必须的。
[0038] 图5:(A)用于工程化NtNCED2干扰RNA植物的NtNCED2部分cDNA序列;(B)用于扩增NtNCED2部分序列的正向(F)和反向(R)引物。F引物中的5'cacc序列是克隆到pENTER Gateway载体所必须的。
[0039] 图6:在TN90-4、35S::NtNeSy-1_2(NeSy1-2)、35S::NIABA4-2_2(ABA4-2_2)以及NtNCED2干扰RNA-1_4(CED2-1_4)选择系的“绿色”样本(叶池)中的叶黄素、β胡萝卜素浓度和半定量的新黄质。
[0040] 图7:在系TN90-4(TN90对照)、35S::NtNeSy-1_2(NeSy1-2)、35S::NtABA4-2_2(ABA4-2-2)以及NtNCED2-干扰RNA-1_4(CED2-1_4)的气雾形成之后(烟草块(plug)),在气雾(气雾)、烤烟(烟草)和烟草块中的β大马酮含量。β大马酮的定量一式三份进行,包括烟雾模拟器、气雾诱捕和β大马酮定量。T-检验分析表明,在系NtABA4-2_2的气雾中β大马酮含量在统计学上与TN90-4(P<0.01)不同,在系NtABA4-2_2的烟草块中的β大马酮含量在统计学上与TN90-4(P<0.05)不同。

具体实施方式

[0041] 定义
[0042] 在本申请的范围内,所用的技术术语和表达通常赋予普遍适用于植物和分子生物学相关领域中的含义。所有下列术语定义适用于本申请中的全部内容。词“包括”不排除其它元素或步骤,并且不定冠词“一”或“一个”不排除复数。单个步骤可能实现权利要求中记载的几个特征的功能。一个给定计算值或范围的上下文中,术语“约”、“基本上”和“近似地”指给定值或范围的20%内、10%内、或5%、4%、3%、2%或1%内的值或范围。
[0043] 术语“分离的”是指取自其天然环境的任何实体,但是所述术语并不意味着任何程度的纯化。
[0044] “载体”是指核酸载体,其包括能够转运核酸、核酸构建体和核酸缀合物等等的核酸组分的组合。合适的载体包括能够进行染色体外复制的附加体,如环形、双链核酸质粒;线性化的双链核酸质粒;以及任何来源的其它载体。
[0045] “表达载体”是指核酸载体,其包括能够表达核酸如ABA4多核苷酸、核酸构建体和核酸缀合物等的核酸组分的组合。合适的表达载体包括能够进行染色体外复制的附加体,如环形、双链核酸质粒;线性化的双链核酸质粒;以及任何来源的其它功能等同的表达载体。表达载体包括至少一个位于上游的并且可操作地连接至如下所限定的核酸、核酸构建体或核酸缀合物的启动子。
[0046] 术语“构建体”是指双链、重组核酸片段,其包括一个或更多多核苷酸。构建体包括与互补的“有义或编码链”碱基配对的“模板链”。给定的构建体可以按两个可能的方向插入到载体中,相对于位于载体(如表达载体)中启动子的方向相同(或有义)方向或相反(或反义)方向。
[0047] “启动子”是指通常位于上游并且可操作地连接至双链DNA片段的核酸元件/序列。启动子可完全源自靠近目标天然基因的区域,或可由源自不同天然启动子或合成DNA节段的不同元件所组成。
[0048] 术语“同源性、同一性或相似性”是指通过序列比对比较的两个多肽之间或两个核酸分子之间序列相似性的程度。待比较两个离散核酸序列之间的同源性程度是在可比较的位置上相同的、或匹配的核苷酸数目的函数。百分比同一性可通过目测和数学计算来确定。或者,可以通过使用计算机程序如ClustalW、BLAST、FASTA或Smith-Waterman比较序列信息来确定两个核酸序列的百分比同一性。
[0049] 术语“植物”是指在其生命周期或发育的任何阶段的任何植物及其后代。在一个实施方案中,植物是“烟草植物”,其是指属于烟草属的植物。本文描述了烟草植物的优选物种。
[0050] “植物细胞”指植物的结构和生理单元。植物细胞可以是没有细胞壁的原生质体的形式、分离的单细胞或培养细胞、或作为更高组织单元的部分,例如而不限于植物组织、植物器官或整个植物。
[0051] 术语“植物材料”是指可获自植物的任何固体、液体或气体组合物、或其组合,其包括生物质、叶、茎、根、花或花部分、果实、花粉、卵细胞、受精卵、种子、插条、分泌物、提取物、细胞或组织培养物、或植物的任何其它部分或产品。在一个实施方案中,植物材料包括或由生物质、种子或叶组成。在另一个实施方案中,植物材料包括或由叶组成。
[0052] 术语“品种”是指共享恒定特性的植物群体,所述特性将植物群体从相同物种的其它植物中分离出来。当具有一个或更多独特性状时,品种还通过所述品种内个体间非常小的整体差异来表征。品种往往是市售的。
[0053] 本文所用术语“系”或“育种系”表示植物育种期间所使用的一组植物。系不同于品种,因为系表现个体间一个或更多目标性状的小差异,尽管对于其它性状可有一些个体间差异。
[0054] 术语“调节”可指减少、抑制、增加或其它影响多肽的表达或活性。所述术语也可指减少、抑制、增加或其它影响编码多肽的基因活性,其可包括而非限制于调节转录活性。
[0055] 本文所用术语“减少”或“减少的”是指从约10%至约99%的减少,或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、至少99%、或至少100%、或更多的量或活性的减少,例如但不限于多肽活性、转录活性和蛋白表达。
[0056] 如本文所用术语“抑制”或“抑制的”是指从约98%至约100%的减少,或至少98%、至少99%、但尤其是100%的量或活性的减少,例如但不限于多肽活性、转录活性和蛋白表达。
[0057] 本文所用术语“增加”或“增加的”是指从约5%至约99%的增加,或至少5%、至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、至少99%、或至少100%、或更多的量或活性的增加,例如但不限于多肽活性、转录活性和蛋白表达。
[0058] 术语“对照”在对照植物的上下文中,指其中酶的表达或活性未经改变(例如增加或减少的)植物或植物细胞,因此其可以提供与其中酶的表达或活性已被改变的植物作比较。对照植物可包括空载体。对照植物可与野生型植物相对应。
[0059] 发明详述
[0060] 在一个实施方案中,提供分离多核苷酸,其包含、由或基本上由与本文所述的任何序列具有至少60%的序列同一性的多核苷酸序列所组成,包括在序列表中显示的任何多核苷酸。适宜地,所述分离多核苷酸包含、由或基本上由下列序列所组成:与其具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的序列。
[0061] 在另一个实施方案中,提供分离多核苷酸,其包含、由或基本上由编码新黄质合酶并且与SEQ ID NO:1具有至少60%的序列同一性的多核苷酸序列所组成。合适地,所述分离多核苷酸包含、由或基本上由与SEQ ID NO:1具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的序列所组成。
[0062] 在另一个实施方案中,提供分离多核苷酸,其包含、由或基本上由下列多核苷酸序列所组成,所述多核苷酸序列编码番茄红素β环化酶且与SEQ ID NO:8具有至少60%的序列同一性。合适地,分离多核苷酸包含、由或基本上由与SEQ ID NO:8具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的序列所组成。
[0063] 在又一个实施方案中,提供分离多核苷酸,其包含、由或基本上由编码9-顺式-环氧类胡萝卜素双加氧酶且与SEQ ID NO:13具有至少60%的序列同一性的多核苷酸序列所组成。合适地,所述分离多核苷酸包含、由或基本上由与SEQ ID NO:13具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的序列所组成。
[0064] 如本文所用,术语“多核苷酸”是指核苷酸的聚合物,其可以是未修饰或修饰的脱氧核糖核酸(DNA)或核糖核酸(RNA)。因此,多核苷酸可以是,而非限制于基因组DNA、互补DNA(cDNA)、mRNA、或反义RNA或其片段。此外,多核苷酸可以是单链或双链DNA、单链和双链区的混合物的DNA、包含DNA和RNA的杂交分子、或具有单链和双链区混合物的杂交分子或其片段。此外,所述多核苷酸可以由含有DNA、RNA或两者或其片段的三链区所组成。多核苷酸可以含有一个或更多修饰碱基如硫代磷酸酯(phosphothioates),以及可以是肽核酸。通常,多核苷酸可以从cDNA、基因组DNA、寡核苷酸、或单个核苷酸(individual nucleotides)、或上述的组合的分离的或克隆的片段来组装。虽然本文所述的多核苷酸序列以DNA序列显示,所述序列包括其对应的RNA序列,及其互补(例如,完全互补的)DNA或RNA序列,包括其反向互补。
[0065] 术语“NtABA4多核苷酸”涉及编码来自红花烟草的新黄质合酶的多核苷酸,以及包括其它多核苷酸,所述多核苷酸包含、由或基本上由与SEQ ID NO:1或SEQ ID NO:6基本上同源(即序列相似)或基本同一的多核苷酸所组成;多核苷酸变体,其与SEQ ID NO:1或SEQ ID NO:6的序列具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%的序列同一性;NtABA4多核苷酸的片段,其包括SEQ ID NO:1或SEQ ID NO:6的片段;SEQ ID NO:1或SEQ ID NO:6的片段,其与如下序列具有基本同源性(即序列相似性)或基本同一性,所述序列与SEQ ID NO:1或SEQ ID NO:6的相应片段具有至少约60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。所述NtABA4多核苷酸还包括这样的序列,所述序列含有与SEQ ID NO:1或SEQ ID NO:6具有足够或相当程度同一性或相似性以编码发挥新黄质合酶功能的多肽。在一个实施方案中,术语“NtABA4多核苷酸”指包含、由或者基本上由在本文中指定为SEQ ID NO:1或SEQ ID NO:6的多核苷酸所组成的核苷酸的聚合物。
[0066] 术语“NtNeSY多核苷酸”涉及编码来自红花烟草的番茄红素β环化酶的多核苷酸,以及包括其它多核苷酸,所述多核苷酸包含、由或基本上由与SEQ ID NO:8基本上同源(即序列相似)或基本同一的多核苷酸所组成;NtNeSy多核苷酸的片段,其包括SEQ ID NO:8的片段;多核苷酸变体,其与SEQ ID NO:8的序列具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、或99%的序列同一性;SEQ ID NO:8的片段,其与如下序列具有基本同源性(即序列相似性)或基本同一性,所述序列与SEQ ID NO:8的相应片段具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、
85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;以及SEQ ID NO:8的片段,其与如下序列具有基本同源性(即序列相似性)或基本同一性,所述序列与SEQ ID NO:8的相应片段具有至少约60%、61%、62%、63%、64%、
65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。所述NtNeSy多核苷酸还包括这样的序列,所述序列含有与SEQ ID NO:8具有足够或相当程度的同一性或相似性以编码发挥番茄红素β环化酶功能的多肽。在一个实施方案中,术语“NtNeSy多核苷酸”指包含、由或者基本上由在本文中指定为与其具有100%的序列同一性的SEQ ID NO:8的多核苷酸所组成的核苷酸的聚合物。
[0067] 术语“NtNCED2多核苷酸”涉及编码来自红花烟草的9-顺式-环氧类胡萝卜素双加氧酶的多核苷酸,以及包括其它多核苷酸,所述多核苷酸包含、由或基本上由与SEQ ID NO:13基本上同源(即序列相似)或基本同一的多核苷酸所组成;多核苷酸变体,其与SEQ ID NO:13具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、
85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性;NtNeSy多核苷酸的片段,其包括SEQ ID NO:13的片段;SEQ ID NO:13的片段,其与如下序列具有基本同源性(即序列相似性)或基本同一性,所述序列与SEQ ID NO:13的相应片段具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、
80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或
100%的序列同一性。所述NtNCED2多核苷酸还包括这样的序列,所述序列含有与SEQ ID NO:13具有足够或相当程度的同一性或相似性以编码发挥9-顺式-环氧类胡萝卜素双加氧酶功能的多肽。在一个实施方案中,术语“NtNCED2多核苷酸”指包含、由或者基本上由在本文中指定为与其具有100%的序列同一性的SEQ ID NO:13的多核苷酸所组成的核苷酸的聚合物。
[0068] 本文所述的多核苷酸将普遍含有磷酸二酯键,然而在某些情况下包括多核苷酸类似物,类似物可具有包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基氨基磷酸酯链接的替换主链;以及肽多核苷酸主链和链接。其它多核苷酸类似物包括具有阳性主链、非离子型主链和非核糖主链的那些。核糖-磷酸主链的修饰可以出于各种原因进行,例如为了增加这样的分子在生理环境中或在生物芯片上作为探针的稳定性和半衰期。可以制备天然存在的多核苷酸和类似物的混合物;或者,可以制备不同多核苷酸类似物的混合物、以及天然存在的多核苷酸和类似物的混合物。
[0069] 已知各种多核苷酸类似物,包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯、O-甲基氨基磷酸酯链接以及肽多核苷酸主链和链接。其它多核苷酸类似物包括具有阳性主链、非离子型主链和非核糖主链的那些。也包括含有一个或更多个碳环糖的多核苷酸。
[0070] 其它类似物包括肽多核苷酸,其是肽的多核苷酸类似物。与天然存在多核苷酸的高电荷磷酸二酯主链不同,这些主链在中性条件下基本上是非离子型的。这可能会带来优势。首先,肽多核苷酸主链可能会表现出改善的杂交动力学。相对于完全匹配的碱基对,肽多核苷酸对于错配的碱基对在解链温度上具有更大的变化。DNA和RNA对于内部错配在解链温度上通常表现出2-4℃的下降。对于非离子型的肽多核苷酸主链,下降接近7-9℃。相似地,由于其非离子性质,附着至这些主链的碱基的杂交对盐浓度相对不敏感。此外,肽多核苷酸可能不会被细胞酶降解或降解程度较小,因此可能会更稳定。
[0071] 在公开的多核苷酸、及其片段的组合的用途当中,是片段在核酸杂交分析中作为探针、或者在核酸扩增分析中用作引物的用途。这样的片段通常包括DNA序列的至少约10、11、12、13、14、15、16、17、18、19或20或更多个连续核苷酸。在其它实施方案中,DNA片段包括DNA序列的至少约10、15、20、30、40、50或60或更多个连续核苷酸。因此,在一方面,也提供用于检测ABA4多核苷酸的方法,包括使用探针或引物或两者。示例引物如SEQ ID NO:3至5所示。在另一方面,也提供用于检测NeSy多核苷酸的方法,包括使用探针或引物或两者。示例引物如SEQ ID NO:10至12所示。在另一方面,也提供用于检测NCED2多核苷酸的方法,包括使用探针或引物或两者。示例引物如SEQ ID NO:14至16所示。
[0072] 影响杂交条件选择的基本参数和制定合适条件的指南描述于Sambrook,J.,E.F.Fritsch和T.Maniatis(1989,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)。使用遗传密码子的知识结合本文所述氨基酸序列,可以制备简并寡核苷酸的集合。如在聚合酶链式反应(PCR)中,这样的寡核苷酸用作引物,由此分离并扩增DNA片段。在某些实施方案中,可以用简并引物作为遗传文库的探针。这种文库包括但不限于cDNA文库、基因组文库、以及甚至电子表达序列标签或DNA文库。然后将通过此方法鉴定的同源序列用作探针,来鉴定本文所鉴定序列的同源物。
[0073] 潜在用途还有多核苷酸和寡核苷酸(例如引物或探针),其在降低的严谨条件下、通常中等严谨条件下、以及通常高度严谨条件下杂交至本文所述的多核苷酸。影响杂交条件选择的基本参数和制定合适条件的指南描述于Sambrook,J.,E.F.Fritsch和T.Maniatis(1989,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.),并且可以由本领域普通技术人员基于如多核苷酸的长度或碱基组成很容易地确定。
[0074] 实现中等严谨条件的一种方法涉及使用含有5×标准柠檬酸钠、0.5%十二烷基硫酸钠、1.0mM乙二胺四乙酸(pH8.0)的预洗溶液,约50%甲酰胺、6×标准柠檬酸钠的杂交缓冲液,以及约55℃的杂交温度(或其它相似的杂交溶液,如含有约50%甲酰胺的一种,杂交温度约42℃),以及0.5×标准柠檬酸钠、0.1%十二烷基硫酸钠中约60℃的洗涤条件。一般来说,高度严谨条件定义为如上杂交条件,但在约68℃,0.2×标准柠檬酸钠、0.1%十二烷基硫酸钠中洗涤。SSPE(1×SSPE是0.15M氯化钠、10mM磷酸钠和1.25mM乙二胺四乙酸,pH值7.4)在杂交以及洗涤缓冲液中可替换为标准柠檬酸钠(1×标准柠檬酸钠是0.15M氯化钠和
15mM柠檬酸钠);杂交完成后,进行15分钟的洗涤。应当理解,洗涤温度和洗涤盐浓度,通过应用控制杂交反应和双链体稳定性的基本原则,可以根据需要进行调整以实现所需的严谨程度,如本领域技术人员所知的并在下面进一步描述(见,例如Sambrook,J.,E.F.Fritsch和T.Maniatis(1989,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)。当多核苷酸杂交至未知序列的靶多核苷酸时,杂交长度假定为杂交多核苷酸的长度。当已知序列的多核苷酸杂交时,杂交长度可通过比对多核苷酸的序列以及鉴定最佳序列互补性的区域或多个区域来确定。杂交期望小于
50碱基对长度的杂交温度应该是低于杂交的解链温度5至10℃,其中根据下列等式确定解链温度。对于小于18碱基对长的杂交,解链温度(℃)=2(A+T碱基数目)+4(G+C碱基数目)。
对于18碱基对长以上的杂交,解链温度(℃)=81.5+16.6(log10[Na+])+0.41(%G+C)-(600/N),其中N是杂交碱基数目,以及[Na+]是钠离子在杂交缓冲液中的钠离子的浓度(对于1×标准柠檬酸钠,[Na+]=0.165M)。一般来说,每个这种杂交多核苷酸具有这样的长度,是其所杂交的多核苷酸的长度的至少25%(通常至少50%、60%、或70%,并最常用为至少
80%),并且与其所杂交的多核苷酸具有至少60%的序列同一性(例如,至少70%、75%、
80%、85%、90%、95%、96%、97%、98%、99%或100%)。
[0075] 本领域技术人员将理解,线性DNA具有两个可能的方向:5'至3'方向和3'至5'方向。例如,如果参考序列处于5'至3'方向,并且如果第二序列在相同多核苷酸分子/链内处于5'至3'方向,那么参考序列和第二序列取向相同的方向,或具有相同的取向。一般来说,在给定启动子的调控下,启动子的序列和目标基因处于相同的取向。然而,相对于处于5'至3'方向的参考序列,如果第二序列在相同多核苷酸分子/链内处于3'至5'方向,那么参考序列和第二序列取向反义方向,或具有反义的取向。如果参考序列(5'至3'方向)和参考序列的反向互补序列(参考序列处于5'至3')处于相同多核苷酸分子/链内,相对于彼此具有反义取向的两条序列可以可选择地描述为具有相同的取向。本文所示序列以5'至3'方向显示。
[0076] 本文提供的重组构建体可用于转化植物或植物细胞以调节蛋白表达或活性水平。重组多核苷酸构建体可包括编码如本文所述的一个或更多多核苷酸的多核苷酸,其可操作地连接于适于在植物或植物细胞中表达多肽的调控区。因此,多核苷酸可包括编码本文所述多肽的编码序列。其中蛋白表达或活性水平得到调节的植物可包括突变植物、非天然存在的植物、转基因植物、人工植物或遗传工程化的植物。合适地,转基因植物含有通过重组DNA的稳定整合而得到改变的基因组。重组DNA包括已经遗传工程化和在细胞外构建的DNA、以及包括含有天然存在DNA或cDNA或合成DNA的DNA。转基因植物可包括由原始转化植物细胞再生的植物、以及来自转化植物后代或杂交的子代转基因植物。
[0077] 由重组多核苷酸编码的多肽可以是天然多肽、或可以是对细胞异源的。在一些情况中,重组构建体含有调节表达的多核苷酸,其可操作地连接到调控区。合适的调控区的实例在本文中描述。
[0078] 还提供了如本文所述的那些含有重组多核苷酸构建体的载体。合适的载体骨架包括例如本领域常规使用的那些,例如质粒、病毒、人工染色体、细菌人工染色体、酵母人工染色体或噬菌体人工染色体。合适的表达载体包括,但不限于,源自例如噬菌体、杆状病毒和逆转录病毒的质粒和病毒载体。许多载体和表达系统是商业上可获得的。
[0079] 载体还可以包括例如复制起点、支架附着区或标志物。标志物基因可以为植物细胞赋予可选择的表型。例如,标志物可以赋予杀生物剂抗性,比如对抗生素(例如卡那霉素、G418、博来霉素或潮霉素)或除草剂(例如草甘膦、氯磺隆或草铵膦)的抗性。此外,表达载体可以包括设计用来促进操作或检测(例如,纯化或定位)所表达多肽的标签序列。标签序列,如荧光素酶、β葡糖醛酸酶、绿色荧光蛋白、谷胱甘肽S-转移酶、多聚组氨酸、c-myc或血凝素序列,通常作为与所编码的多肽的融合体来表达。这样的标签可以插入多肽内的任何地方,包括在羧基末端或氨基末端。
[0080] 植物或植物细胞可以通过将重组多核苷酸整合至其基因组进行转化来成为稳定的转化。因此,本文所述的植物或植物细胞可以是稳定转化的。稳定转化的细胞通常在每次细胞分裂中保留所引入的多核苷酸。也可以瞬时转化植物或植物细胞,从而重组多核苷酸没有整合至其基因组中。瞬时转化的细胞通常在每次细胞分裂中丢失引入的重组多核苷酸的所有或一些部分,从而引入的重组多核苷酸在足够次数的细胞分裂之后不能在子细胞中检测到。
[0081] 用于转化植物细胞一些方法在本领域中是可用的,这些方法全部包括在本文中,包括生物弹技术、基因枪技术、农杆菌介导的转化、病毒载体介导的转化和电穿孔法。用于向植物染色体中整合外源DNA的农杆菌系统已经针对植物遗传工程进行了广泛的研究、改进和探索。包括DNA序列的裸重组DNA分子通过常规方法被连接到适当的T-DNA序列上,其中DNA序列对应着目标纯化的烟草蛋白,并按有义或反义方向可操作地连接至调控序列。通过聚乙二醇技术或通过电穿孔技术将这些引入烟草原生质体,两者都是标准的。或者,将这种含有编码目标纯化烟草蛋白的重组DNA分子的载体引入活的农杆菌细胞,随后所述农杆菌细胞将DNA转移到烟草植物细胞中。通过烟草原生质体与含有DNA的脂质体进行融合或者通过电穿孔可以实现不伴有T-DNA载体序列的裸DNA的转化。不伴有T-DNA载体序列的裸DNA也可通过惰性、高速微弹(microprojectile)用于转化烟草细胞。
[0082] 如果细胞或培养的组织用作转化受体组织,如果需要的话通过本领域技术人员已知的技术,植物可以从转化的培养物中再生。
[0083] 待纳入重组构建体的调控区选择取决于若干因素,包括但不限于效率、可选择性、可诱导性、所需的表达水平和细胞的或组织的优先表达。对于本领域技术人员而言,通过适当选择和相对于编码序列的定位调控区来调节编码序列的表达是一个常规的事情。多核苷酸的转录可以以类似方式调节。一些合适的调控区仅仅或主要在某些细胞类型中起始转录。用于鉴定和表征植物基因组DNA中调控区的方法是本领域已知的。
[0084] 合适的启动子包括组织特异性因子所识别的组织特异性启动子,其存在于不同组织或细胞类型中(例如,根特异性启动子、茎特异性启动子、木质部特异性启动子)、或不同发育阶段出现的、或者响应不同环境条件而出现的。合适的启动子包括组成型启动子,其可以在大多数细胞类型中被激活而无需特定的诱导物。用于控制RNAi多肽生产的合适启动子的实例包括花椰菜花叶病毒35S(CaMV/35S)、SSU、OCS、lib4、usp、STLS1、B33、nos或泛素或菜豆素启动子。本领域技术人员能够产生重组启动子的多种变体。
[0085] 组织特异性启动子是转录控制元件,其仅在植物发育期间的特定时间中在特定细胞或组织中有活性,如在营养组织或繁殖组织中。例如,当优选在某些组织中表达多核苷酸时,组织特异性表达可以是有利的。发育控制下的组织特异性启动子实例包括可以仅在(或主要仅在)某些组织(如营养组织例如根或叶,或生殖组织如果实、胚珠、种子、花粉、pistols、花或任何胚组织)中起始转录的启动子。生殖组织特异性启动子可以是例如花药特异性、胚珠特异性、胚特异性、胚乳特异性、珠被特异性、种子和种皮特异性、花粉特异性、花瓣特异性、萼片特异性的或其组合。
[0086] 合适的叶特异性启动子包括来自C4植物(玉米)的丙酮酸、正磷酸二激酶(PPDK)启动子、来自玉米的cab-m1 Ca+2启动子、拟南芥(Arabidopsis thaliana)myb相关基因的启动子(Atmyb5)、核酮糖二磷酸羧化酶(RBCS)启动子(例如,在叶和光照生长的幼苗中表达的番茄RBCS1、RBCS2和RBCS3A基因、在发育中的番茄果实中表达的RBCS1和RBCS2、或者几乎只在叶片和叶鞘的叶肉细胞中高水平表达的核酮糖二磷酸羧化酶启动子)。
[0087] 合适的衰老特异性启动子包括在果实成熟、衰老和叶脱落期间的番茄启动子,编码半胱氨酸蛋白酶的基因的玉米启动子。可以使用合适的花药特异性启动子。可以选择本领域技术人员已知合适的根优选启动子。合适的种子优选启动子包括种子特异性启动子(在种子发育期间有活性的那些启动子,比如种子贮藏蛋白的启动子)和种子萌发启动子(在种子萌发期间有活性的那些启动子)。这样的种子优选启动子包括但不限于Cim1(细胞分裂素诱导的信息);cZ19B1(玉米19kDa的玉米醇溶蛋白);milps(肌-肌醇-1-磷酸合酶);mZE40-2也称为Zm-40;nuclc;以及celA(纤维素合酶)。γ-玉米醇溶蛋白是胚乳特异性启动子。Glob-1是胚特异性启动子。对于双子叶植物,种子特异性启动子包括但不限于豆β菜豆素(bean beta-phaseolin)、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等。对于单子叶植物,种子特异性启动子包括但不限于玉米15kDa的玉米醇溶蛋白启动子、22kDa的玉米醇溶蛋白启动子、27kDa的玉米醇溶蛋白启动子、g-玉米醇溶蛋白启动子、27kDa的γ-玉米醇溶蛋白启动子(如gzw64A启动子,参阅GenBank登录号S78780)、糯质基因(waxy)启动子、超甜基因(shrunken)1启动子、超甜基因2启动子、球蛋白1启动子(见GenBank登录号L22344)、Itp2启动子、cim1启动子、玉米end1和end2启动子、nuc1启动子、Zm40启动子、eep1和eep2;lec1、硫氧还蛋白H启动子;mlip15启动子、PCNA2启动子;以及超甜基因2启动子。
[0088] 可诱导启动子的实例包括响应病原体攻击、厌氧条件、温度升高、光、干旱、低温或高盐浓度的启动子。病原体可诱导的启动子包括来自病理相关蛋白(PR蛋白)的那些,病理相关蛋白是病原体感染之后诱导的(例如PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、壳多糖酶)。
[0089] 除了植物启动子,其它合适的启动子可源自细菌来源,例如,章鱼碱合酶启动子、胭脂碱合酶启动子和源于Ti质粒的其它启动子),或可以源自病毒启动子(例如,花椰菜花叶病毒(CaMV)的35S和19S RNA启动子、烟草花叶病毒的组成型启动子、花椰菜花叶病毒(CaMV)19S和35S启动子、或玄参花叶病毒35S启动子)。
[0090] 术语“NtABA4多肽”指来自红花烟草的编码所谓“新黄质合酶”的多肽并包括其它多肽变体,所述多肽变体包含、由或基本上由多核苷酸变体编码的氨基酸序列所组成,所述多核苷酸变体与SEQ ID NO:1具有至少约66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,或多核苷酸变体与SEQ ID NO:6具有至少约60%、61%、62%、63%、64%、65%、66%、
67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%或99%的序列同一性;多肽变体,与SEQ ID NO:2具有至少约66%、
67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、或99%的序列同一性,或多肽变体与SEQ ID NO:7具有至少约60%、
61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;SEQ ID NO:2或SEQ ID NO:7的NtABA4多肽的片段;以及SEQ ID NO:2或SEQ ID NO:7的片段,其分别与SEQ ID NO:2或SEQ ID NO:7的对应片段具有至少约60%、65%、70%、75%、80%、85%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。所述NtABA4多肽也包括与SEQ ID NO:2或SEQ ID NO:7含有足够或相当程度的同一性或相似性以发挥新黄质合酶作用的序列。所述NtABA4多肽的片段通常保留新黄质合酶活性。只要NtABA4多肽仍作为新黄质合酶起作用,NtABA4多肽也包括通过引入任何类型的改变(例如,氨基酸的插入、删除或取代;糖基化状态的变化;影响重新折叠或异构化、三维结构或自我结合状态的变化)而产生的突变体,其可以有意地经过工程化或者是天然分离的。
NtABA4多肽可以处于线性形式或使用已知方法环化。术语“NtABA4多肽”也可指多肽,其是由SEQ ID NO:1或SEQ ID NO:6所编码的且与其具有100%的序列同一性,或多肽,其包含、由或基本上由如SEQ ID NO:2或SEQ ID NO:7所示的且与其具有100%的序列同一性的序列所组成。
[0091] 术语“NtNeSy多肽”指来自红花烟草的编码番茄红素β环化酶的多肽并包括其它多肽变体,所述多肽变体包含、由或基本上由多核苷酸编码的氨基酸序列所组成,所述多核苷酸与SEQ ID NO:9具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%或100%的序列同一性;多肽变体,其与SEQ ID NO:9具有至少87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;SEQ ID NO:9的NtNeSy多肽的片段;以及SEQ ID NO:9的片段,其与SEQ ID NO:9的对应片段具有至少约60%、61%、62%、63%、64%、65%、70%、75%、80%、85%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。所述NtNeSy多肽也包括与SEQ ID NO:9含有足够或相当程度的同一性或相似性以发挥番茄红素β环化酶作用的序列。所述NtNeSy多肽的片段通常保留番茄红素β环化酶活性。只要NtNeSy多肽仍作为番茄红素β环化酶起作用,NtNeSy多肽也包括通过引入任何类型的改变(例如,氨基酸的插入、删除或取代;糖基化状态的变化;影响重新折叠或异构化、三维结构或自我结合状态的变化)而产生的变体和突变体,其可以有意地经过工程化或者是天然分离的。NtNeSy多肽可以处于线性形式或使用已知方法环化。术语“NtNeSy多肽”也可指多肽,其包含、由或基本上由如SEQ ID NO:9所示的且与其具有100%的序列同一性的序列所组成。
[0092] 术语“NtNCED2多肽”指来自红花烟草的编码9-顺式-环氧类胡萝卜素双加氧酶的多肽并包括多肽,所述多肽包含、由或基本上由多核苷酸编码的氨基酸序列所组成,所述多核苷酸与SEQ ID NO:13具有100%的序列同一性;或多肽变体,其包含、由或基本上由多核苷酸所编码的并且与SEQ ID NO:13具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%或99%的序列同一性的氨基酸序列所组成。也包括NtNCED2多肽的片段,其通常保留9-顺式-环氧类胡萝卜素双加氧酶活性。只要NtNCED2多肽仍作为9-顺式-环氧类胡萝卜素双加氧酶起作用,NtNCED2多肽也包括通过引入任何类型的改变(例如,氨基酸的插入、删除或取代;糖基化状态的变化;影响重新折叠或异构化、三维结构或自我结合状态的变化)而产生的变体和突变体,其可以有意地经过工程化或者是天然分离的。NtNCED2多肽可以处于线性形式或使用已知方法环化。
[0093] 在另一方面,提供分离多肽,其包含、由或基本上由与本文所述的任何序列具有至少60%的序列同一性的多肽序列所组成的,其包括在序列表中显示的任何多肽。合适地,所述分离多肽包含、由或基本上由与其具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%或100%的序列同一性的序列所组成。
[0094] 多肽包括通过引入任何类型的改变所产生的变体(例如,氨基酸的插入、删除或取代;糖基化状态的变化;影响重新折叠或异构化、三维结构或自我结合状态的变化),其可以有意地经过工程化改造或是天然分离的。所述变体可具有产生沉默改变并导致功能等同蛋白的改变。只要保留底物的二级结合活性,基于在残基的极性、电荷、溶解度、疏水性、亲水性和两亲性上的相似性可进行有意的氨基酸取代。例如,带负电的氨基酸包括天冬氨酸和谷氨酸;带正电的氨基酸包括赖氨酸和精氨酸;以及具有相似亲水性值的具有不带电极性头部基团的氨基酸包括亮氨酸、异亮氨酸、缬氨酸、甘氨酸、丙氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。可进行保守取代,例如根据下表。在第二列相同方框中的氨基酸以及优选在第三列相同行中的氨基酸可互相取代:
[0095]
[0096] 所述多肽可以是成熟蛋白、或不成熟蛋白、或源自不成熟蛋白的蛋白。多肽可以处于线性形式或者使用已知方法环化。多肽通常包含至少10、至少20、至少30、或至少40个连续的氨基酸。
[0097] 在一个实施方案中,提供分离的NtABA4多肽,其包含、由或者基本上由编码新黄质合酶的序列所组成,并且所述序列与SEQ ID NO:2具有至少约66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%或100%的序列同一性、或者与SEQ ID NO:7具有至少约60%、61%、62%、63%、64%、
65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
[0098] 在另一个实施方案中,提供分离的NtNeSy多肽,其包含、由或者基本上由编码番茄红素β环化酶并且与SEQ ID NO:9具有至少约87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的序列所组成。
[0099] 在另一个实施方案中,提供分离的NtNCED2多肽,其由本文所述的NtNCED2多核苷酸所编码。
[0100] 在本文中还公开了所述多肽序列的片段,合适地,这样的片段保留了全长序列的活性。
[0101] 突变多肽变体可用于建立含有一个或更多突变多肽变体的突变、非天然存在的或转基因植物(例如,突变、非天然存在的、转基因的、人造的或遗传工程化的植物)。合适地,所述突变多肽变体保留未突变多肽的活性。突变多肽变体的活性可以比未突变多肽更高、更低或与之大约相同。
[0102] 在本文所述的核苷酸序列和多肽中的突变可包括人工突变或合成突变或遗传工程化的突变。在本文所述的核苷酸序列和多肽中的突变可以是通过包括体外或体内操作步骤的方法所获得的或可获得的突变。在本文所述的核苷酸序列和多肽中的突变可以是通过包括人工干扰的方法所获得的或可获得的突变。例如,所述方法可包括诱变,所述诱变使用外源添加的化学品,例如诱变、致畸或致癌的有机化合物,例如甲磺酸乙酯(EMS),其在遗传物质中产生随机突变。又例如,所述方法可以包括一个或更多遗传工程的步骤,如本文所述的遗传工程步骤中的一个或更多个或其组合。又例如,所述方法可包括一个或更多植物杂交步骤。
[0103] 如本文所用,术语“非天然存在的”意思是实体,例如,在自然中发现不了的多肽、多核苷酸、或植物等等,因此清楚地排除了在自然中存在的实体。这样的非天然存在的实体可以人为结构性地改变、合成或操作。在某些实施方案中,突变是非天然存在的突变,其天然地存在于核苷酸序列或多肽中,例如基因或蛋白质。
[0104] 通过在适合表达多肽的培养条件下培养转化的或重组的宿主细胞可以制备多肽。然后可使用已知的纯化方法从这种培养物中纯化出所产生的表达的多肽。多肽纯化可包括含有将与多肽结合的试剂的亲和柱;一个或更多穿过这种亲和树脂的柱步骤;一个或更多涉及疏水性相互作用色谱的步骤;或免疫亲和色谱。或者,所述多肽也可以表达为将促进纯化的形式。例如,其可以作为融合多肽表达,如麦芽糖结合多肽、谷胱甘肽-5-转移酶、或硫氧还蛋白的那些。用于表达和纯化融合多肽的试剂盒是商业上可获得的。多肽也可以用表位标记,并随后通过使用针对这种表位的特异性抗体进行纯化。可以采用一个或更多液相色谱步骤,例如反相高效液相色谱法以进一步纯化多肽。以不同的组合可采用一些或全部上述纯化步骤来提供基本上同质的重组多肽。因此,纯化的多肽可基本上不含其它多肽,在本文定义为“基本上纯化的多肽”;这样纯化的多肽包括多肽、片段、变体等。可以通过任何合适的技术包括但不限于本文所述的方法实现多肽和片段的表达、分离和纯化。
[0105] 也可能利用亲和柱,如产生的抗多肽的单克隆抗体来亲和纯化表达的多肽。可以用常规技术从亲和柱中除去这些多肽,例如在高盐洗脱缓冲液中,然后对较低盐的缓冲液进行透析备用、或取决于所用的亲和基质通过改变pH值或其它成分,或者使用天然存在的亲和半体的底物竞争性地除去。
[0106] 也可以通过已知的常规化学合成来产生多肽。通过合成方式来构建多肽或其片段的方法是本领域技术人员已知的。合成构建的多肽序列通过与天然多肽分享一级、二级或三级结构或构象特征,可拥有与其共同的生物学性质,包括生物活性。
[0107] 本文所用术语“非天然存在的”描述不由自然形成的或者不存在于自然当中的实体(例如,多核苷酸、遗传突变、多肽、植物、植物细胞和植物材料)。可以通过本文所述或本领域中已知的方法制造、合成、起始、修饰、干预或操纵这样的非天然存在的实体或人工实体。因此,例如可以使用传统植物育种技术(如回交)或通过遗传操作技术(如反义RNA、干扰RNA、大范围核酸酶等)制成非天然存在的植物、非天然存在的植物细胞或非天然存在的植物材料。再例如,可以通过将来自第一植物或植物细胞一个或更多遗传突变(例如一个或更多多态性)基因渗入或通过转移至第二植物或植物细胞(其本身可以是天然存在的)来制备非天然存在的植物、非天然存在的植物细胞或非天然存在的植物材料,从而得到的植物、植物细胞或植物材料或其后代含有非天然形成或者非天然存在的遗传组成(例如基因组、染色体或其节段)。因此,所得植物、植物细胞或植物材料是人工或者非天然存在的。因此,即使天然存在于第二植物或植物细胞中的所得遗传序列含有不同于第一植物或植物细胞的遗传背景,可以通过在第一天然存在的植物或植物细胞中修饰遗传序列来制成人工的或非天然存在的植物或植物细胞。通过表型差异或者通过本领域已知的分子生物学技术可以检测在遗传背景上的差异,如核酸测序、遗传标志物的存在或缺失(例如微卫星RNA标志物)。
[0108] 还提供对本文所述的NtABA4或NtNeSy或NtNCED2多肽免疫反应的抗体。如本文所示的多肽、片段、变体、融合多肽等等可用作“免疫原”来产生与其具有免疫反应的抗体。这样的抗体通过抗体的抗原结合位点可特异性地结合至多肽。特异性结合的抗体是将特异性识别并结合多肽、同源物和变体、而不识别和结合其它分子的那些。在一个实施方案中,所述抗体对具有本文所示氨基酸序列的多肽是特异的,并且不与其它多肽交叉反应。
[0109] 更具体而言,所述多肽、片段、变体、融合多肽等含有激发抗体形成的抗原决定簇或表位。这些抗原决定簇或表位可以是线性的或构象的(不连续的)。线性表位由多肽氨基酸的单一部分所组成,而构象的或不连续表位由来自多肽链不同区域的氨基酸部分所组成,所述氨基酸部分通过多肽折叠而极为靠近。可以通过本领域已知的任何方法鉴定表位。此外,来自多肽的表位可以用作分析中的研究试剂,以便用于从物质(如多克隆血清或来自培养杂交瘤的上清)中纯化特异性结合的抗体。可以使用本领域已知的技术如固相合成、多肽的化学或酶切割、或使用重组DNA技术来生产这样的表位或其变体。
[0110] 可以通过常规技术制备多肽的多克隆抗体和单克隆抗体两者。本文也考虑产生对多肽特异的单克隆抗体的杂交瘤细胞系。可以通过常规技术生产并鉴定这样的杂交瘤。可以通过注射多肽、片段、变体或其突变体来免疫各种宿主动物来产生抗体。举几个来说,这样的宿主动物可以包括但不限于兔、小鼠和大鼠。可以使用各种佐剂来增加免疫应答。根据宿主种类,这样的佐剂包括,但不限于,弗氏(完全和不完全)、矿物凝胶如氢氧化铝、表面活性物质如溶血卵磷脂、复合多元醇、聚阴离子、肽、油乳液、钥孔血蓝蛋白、二硝基苯酚和潜在有用的人佐剂如BCG(卡介苗)和短小棒状杆菌(Corynebacterium parvum)。可以通过常规技术回收单克隆抗体。这样的单克隆抗体可以是任何免疫球蛋白类,包括IgG、IgM、IgE、IgA、IgD及其任何亚类。
[0111] 抗体也可用在分析中来检测多肽或片段在体外或体内的存在。抗体也可以用于通过免疫亲和色谱来纯化多肽或片段。
[0112] 可调节(例如,增加)NtABA4或NtNeSy或NtNCED2(或其两个或更多、或三个或更多的组合)的表达或活性的组合物包括、而不限于序列特异性多核苷酸,其可干扰一个或更多內源基因的转录;序列特异性多核苷酸,其可干扰RNA转录物(例如,双链RNA、siRNA、核酶)的翻译;序列特异性多肽,其可干扰一个或更多蛋白稳定性;序列特异性多核苷酸,其可干扰一个或更多蛋白的酶活性、或一个或更多蛋白对于底物或调节蛋白的结合活性;抗体,其显示对一个或更多蛋白的特异性;小分子化合物,其可干扰一个或更多蛋白的稳定性、或一个或更多蛋白的酶活性、或者一个或更多蛋白的结合活性;锌指蛋白,其结合一个或更多多核苷酸;以及大范围核酸酶,其具有针对一个或更多多核苷酸的活性。基因编辑技术、遗传编辑技术和基因组编辑技术是本领域公知的。
[0113] 反义技术是一种公知的方法,其可以用来调节多肽的表达。待抑制基因的多核苷酸被克隆并被可操作地连接到调节区和转录终止序列,从而转录RNA的反义链。然后,将重组构建体转化到植物中并产生RNA的反义链。多核苷酸不需要是待抑制基因的整个序列,但通常将基本上互补于待抑制基因的正义链的至少部分。
[0114] 多核苷酸可被转录成核酶、或催化性RNA,其影响mRNA的表达。核酶可被设计成特异性地与几乎任何靶RNA配对,并在特定位置上切割磷酸二酯骨架,从而在功能上使靶RNA失活。异源多核苷酸可以编码设计用于切割特定mRNA转录物的核酶,从而阻止多肽表达。尽管可以使用在位点特异性识别序列上切割mRNA的各种核酶,锤头核酶用于破坏特定的mRNA。锤头核酶在侧翼区所规定的位置切割mRNA,侧翼区与靶mRNA形成互补碱基对。唯一要求是靶RNA包含5'-UG-3'核苷酸序列。锤头核酶的构建和生产是本领域已知的。锤头核酶序列可以被嵌入至稳定的RNA,如转移RNA(tRNA)中来增加体内切割效率。
[0115] 在一个实施方案中,可干扰RNA转录物翻译的序列特异性多核苷酸是干扰RNA。RNA干扰或RNA沉默是进化上保守的过程,通过它特异性mRNA可以被靶向酶促降解。双链RNA(双链RNA)被引入或由细胞产生(例如,双链RNA病毒、或干扰RNA多核苷酸)来启动干扰RNA通路。双链RNA可以被RNA酶III转换成多个21-23bp长的小干扰RNA双链体,RNA酶III是双链RNA特异性内切酶。小干扰RNA可以随后被RNA诱导的沉默复合物所识别,其通过ATP-依赖的过程促进小干扰RNA解旋。解旋的小干扰RNA的反义链将激活的RNA诱导的沉默复合物引导至含有互补于小干扰RNA反义链的序列的靶mRNA。靶mRNA和反义链可形成A-型螺旋,以及A-型螺旋的大沟可以被激活的RNA诱导的沉默复合物所识别。在小干扰RNA链的5'端结合位点所定义的单一位点处,靶mRNA可以被激活的RNA诱导的沉默复合物所切割。激活的RNA诱导的沉默复合物可以被回收以催化另一个切割事件。
[0116] 干扰RNA表达载体可包括编码干扰RNA多核苷酸的干扰RNA构建体,其通过降低mRNA、前mRNA(pre-mRNA)或相关RNA变体的表达水平来显示出RNA干扰活性。如本文进一步描述的,表达载体可包括位于上游并可操作地连接到干扰RNA构建体的启动子。干扰RNA表达载体可包括合适的最小核心启动子、目标干扰RNA构建体、上游(5')调控区、下游(3')调控区,包括转录终止和多腺苷酸化信号,以及本领域技术人员已知的其它序列,如各种选择标志物。
[0117] 多核苷酸可以以各种形式生产,包括双链结构(即,含有反义链和互补正义链的双链RNA分子)、双链发夹样结构、或单链结构(即,只含有反义链的ssRNA分子)。结构可以包括双链体、不对称双链体、发夹或不对称发夹二级结构、具有自身互补性的正义和反义链。双链干扰RNA可以被酶转化为双链小干扰RNA。小干扰RNA双链体的其中一条链可以退火至靶mRNA和相关RNA变体内的互补序列。小干扰RNA/mRNA双链体由RNA诱导的沉默复合物识别,其可以在多位点上以序列依赖性方式切割RNA,导致靶mRNA和相关RNA变体的降解。
[0118] 双链RNA分子可包括由单个寡核苷酸组装成茎环结构的小干扰RNA分子,其中小干扰RNA分子的自身互补正义和反义区通过基于多核苷酸或基于非多核苷酸接头的方式相连接,以及环状单链RNA具有两个或更多环结构、以及含有自身互补的正义和反义链的茎,其中环状RNA可以在体内或在体外进行加工来产生能够介导干扰RNA的活性小干扰RNA分子。
[0119] 还关注了小发夹RNA分子的用途。其包括除反向互补(正义)序列以外的特异性反义序列,其通常由间隔或环序列分开。间隔或环的切割提供单链RNA分子及其反向互补物,使得它们可以退火形成双链RNA分子(任选地具有附加的处理步骤,其可导致从一条或两条链的3'端或5'端添加或除去一个、两个、三个或更多个核苷酸)。间隔可以足够长以在切割间隔之前(和任选地随后的处理步骤,其可导致从一条或两条链的3'端或5'端添加或除去一个、两个、三个、四个或更多个核苷酸),允许反义和正义序列退火以形成双链结构(或茎)。间隔序列通常是无关的核苷酸序列,其位于退火成双链多核苷酸时的两个互补核苷酸序列区之间,包括小发夹RNA。间隔序列通常包括在约3至约100个核苷酸之间。
[0120] 通过选择适合产生发夹双链体的序列组合物、环尺寸和茎长度,可产生任何目标RNA多核苷酸。适合设计发夹双链体的茎长的范围,包括至少约10、11、12、13、14、15、16、17、18、19或20个核苷酸,如约14-30个核苷酸、约30-50个核苷酸、约50-100个核苷酸、约100-
150个核苷酸、约150-200个核苷酸、约200-300个核苷酸、约300-400个核苷酸、约400-500个核苷酸、约500-600个核苷酸以及约600-700个核苷酸的茎长。适于设计发夹双链体的环长的范围,包括约4-25个核苷酸、约25-50个核苷酸的环长、或当发夹双链体的茎长相当长时则更长的环长。在某些实施方案中,双链RNA或ssRNA分子是在约15和约40个核苷酸长之间。
在另一个实施方案中,小干扰RNA分子是在约15和约35个核苷酸长之间的双链RNA或ss RNA分子。在另一个实施方案中,小干扰RNA分子是在约17和约30个核苷酸长之间的双链RNA或ssRNA分子。在另一个实施方案中,小干扰RNA分子是在约19和约25个核苷酸长之间的双链RNA或ss RNA分子。在另一个实施方案中,小干扰RNA分子是在约21至约23个核苷酸长之间的双链RNA或ssRNA分子。在某些实施方案中,具有长于21个核苷酸的双链体区的发夹结构可促进有效的小干扰RNA指导的沉默,无论环序列和长度如何。
[0121] 靶mRNA序列通常是在约14至约50个核苷酸长之间。因此,可以扫描靶mRNA在约14和约50个核苷酸长之间的区,其对于靶序列优选地满足以下标准的一个或更多:在约2:1和约1:2之间的A+T/G+C比;靶序列的5'端的AA二核苷酸或CA二核苷酸;靶mRNA独有的至少10个连续核苷酸的序列(即,在相同植物的其它mRNA序列上不存在的序列);以及没有三个以上连续鸟嘌呤(G)核苷酸或三个以上连续胞嘧啶(C)核苷酸的“串”。使用本领域已知的各种技术可以评估这些标准,例如,计算机程序如BLAST可用于搜索公共可用数据库以确定是否所选靶序列是靶mRNA独有的。或者,使用商业上可获得的计算机软件(例如,OligoEngine、Target Finder以及商业上可获得的小干扰RNA Design Tool)可以选择靶序列(以及设计的小干扰RNA序列)。
[0122] 在另一个实施方案中,选择靶mRNA序列,其满足上述标准中的一个或更多且在约14和约30个核苷酸长之间。在另一个实施方案中,选择靶序列,其满足上述标准中的一个或更多且在约16和约30个核苷酸长之间。在又一个实施方案中,选择靶序列,其满足上述标准中的一个或更多且在约19和约30个核苷酸长之间。在再一个实施方案中,选择靶序列,其满足上述标准中的一个或更多且在约19和约25个核苷酸长之间。
[0123] 在一个示例实施方案中,小干扰RNA分子包括特异性反义序列,其互补于本文所述的多核苷酸序列中任一个的至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个连续核苷酸。
[0124] 小干扰RNA分子所含有的特异性反义序列可以与靶序列的互补物一致或基本一致。在一个实施方案中,小干扰RNA分子所含有的特异性反义序列与靶mRNA序列的互补物是至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%一致。确定序列同一性的方法是本领域已知的,并且能够通过例如使用威斯康星大学计算机组(GCG)软件或NCBI网站上提供的BLASTN程序来确定。
[0125] 通过与靶mRNA序列在一个、两个、三个、四个或更多个核苷酸上有差别(例如,通过核苷酸取代,包括转换或颠换),小干扰RNA分子的特异性反义序列可以表现出变异性。当这样的核苷酸取代存在于双链RNA分子的反义链中时,与取代核苷酸通常形成氢键碱基配对的正义链中的互补核苷酸可能或可能不会被相应地取代。也可以考虑双链RNA分子,其中一个或更多核苷酸取代发生在正义序列中,但不在反义链中。当小干扰RNA分子的反义序列包括在小干扰RNA的核苷酸序列和靶核苷酸序列之间的一个或更多错配时,如上所述,所述错配可能会发现在反义序列的3'末端、5'末端或中央部分。
[0126] 在另一个实施方案中,小干扰RNA分子可包括特异性反义序列,其能够在严谨条件下选择性地杂交至天然存在的靶基因或靶mRNA的部分。如本领域普通技术人员所知,可以通过改变杂交和洗涤步骤中所用时间、温度或溶液浓度来实现杂交条件的严谨性上的变化。适当的条件也可以部分依赖于所用的特定核苷酸序列,例如靶mRNA或基因的序列。
[0127] 一种用于在植物中诱导双链RNA沉默的方法是用产生发夹RNA的基因构建体进行转化(参见Smith等,(2000)Nature,407,319-320)。这样的构建体包含由合适间隔所分开的靶基因序列的反转区。由于生成内含子剪接的发夹RNA,作为间隔片段的功能植物内含子区的插入额外地增加基因沉默诱导的效率(Wesley等,(2001)Plant J.,27,581-590)。合适地,茎长是约50核苷酸至约1千碱基长。用于产生内含子剪接发夹RNA的方法在本领域详述(参见例如,Bioscience,Biotechnology,and Biochemistry(2008)72,2,615-617)。
[0128] 具有双链体或双链结构的干扰RNA分子,例如双链RNA或小发夹RNA,可具有平端,或者可具有3'或5'突出。如本文所用,“突出”是指未配对的核苷酸,或者当一条RNA链的3'-末端延伸超出另一条链的5'-末端时突出于双链体结构的核苷酸(3'突出),或反之亦然(5'突出)。含有突出的核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或其修饰的版本。在一个实施方案中,干扰RNA分子的至少一条链具有3'突出,其从约1至约6个核苷酸长。在其它实施方案中,所述3'突出是从约1至约5个核苷酸,从约1至约3个核苷酸以及从约2至约4个核苷酸长。
[0129] 当干扰RNA分子在分子的一端包括3'突出时,另一端可以是平端或也具有突出(5'或3')。当干扰RNA分子在分子的两端包括突出时,突出的长度可以相同或不同。在一个实施方案中,干扰RNA分子在分子两端包括约1至约3个核苷酸的3'突出。在另一个实施方案中,干扰RNA分子是在分子两端具有2个核苷酸的3'突出的双链RNA。在又一个实施方案中,含有干扰RNA突出的核苷酸是TT二核苷酸或UU二核苷酸。
[0130] 当确定含有一个或更多突出的干扰RNA分子与靶mRNA序列的百分比同一性时,可以考虑或不用考虑突出。例如,来自3'突出的核苷酸以及来自双链的5'-或3'-末端的至多2个核苷酸可以经过修饰而没有显著损失小干扰RNA分子的活性。
[0131] 干扰RNA分子可以包括一个或更多5'或3'-帽结构。干扰RNA分子可以包括帽结构,所述帽结构在干扰RNA分子的正义链、反义链、或正义和反义链两者的3'-端;或在干扰RNA分子的正义链、反义链、或正义和反义链两者的5'-端。或者,干扰RNA分子可以在干扰RNA分子的3'-端和5'-端两者含有帽结构。术语“帽结构”指在寡核苷酸的任一末端并入的化学修饰,其保护分子免于外切核酸酶降解,并且还可有助于细胞内的递送或定位。
[0132] 适于干扰RNA分子的另一种修饰是将一个或更多半体或缀合物化学链接至干扰RNA分子,所述半体或缀合物增强干扰RNA分子的活性、细胞分布、细胞吸收、生物利用度或稳定性。所述多核苷酸可以通过本领域公认的方法进行合成或修饰。化学修饰可包括但不限于2'修饰、引入非天然碱基、与配体的共价附着、以及用硫代磷酯键替换磷酯键。在本实施方案中,双链体结构的完整性通过至少一个、以及典型地两个化学链接得到加强。化学链接可以通过各种公知技术的任意者来实现,例如通过引入共价、离子或氢键;疏水相互作用、范德华力或堆积相互作用;通过金属离子配位的方式、或通过使用嘌呤类似物。
[0133] 在两条单链的一条或两条上的核苷酸可被修饰以调节细胞酶的激活,如例如但不限于某些核酸酶。用于减少或抑制细胞酶激活的技术是本领域已知的,包括但不限于2'-氨基修饰、2'-氟修饰、2'-烷基修饰、不带电荷的骨架修饰、吗啉基修饰、2'-O-甲基修饰和氨基磷酸酯。因此,在双链RNA上的核苷酸的至少一个2'-羟基基团被化学基团所取代。此外,至少一个核苷酸可被修饰以形成锁核苷酸。这种锁核苷酸包含连接核糖的2'-氧与核糖的4'-碳的亚甲基或亚乙基桥。将锁核苷酸引入到寡核苷酸改善了对互补序列的亲和性并将解链温度提高若干度。
[0134] 配体可缀合至干扰RNA分子,例如,以便增强其细胞吸收。在某些实施方案中,疏水性配体缀合至分子以利于细胞膜的直接渗透。使用这些方法以促进反义寡核苷酸的细胞渗透。在某些情况下,阳离子配体和寡核苷酸的缀合通常导致改善的对核酸酶的抗性。阳离子配体的代表性实例包括丙基铵和二甲基丙基铵。当阳离子配体分散在寡核苷酸时,反义寡核苷酸可以保留其对mRNA的高结合亲和性。
[0135] 本文所述的分子和多核苷酸可使用公知的固相合成技术来制备。可以附加地或可选择地采用本领域已知用于这样合成的任何其它方法。
[0136] 各种实施方案针对含有NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多的表达载体、或含有一个或更多多核苷酸的干扰RNA构建体。
[0137] 各种实施方案针对含有NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多的表达载体、或一个或更多干扰RNA构建体。
[0138] 各种实施方案针对含有一个或更多NtABA4或NtNeSy或NtNCED2多核苷酸的表达载体、或编码一个或更多能够自退火形成发夹结构的干扰RNA多核苷酸的一个或更多干扰RNA构建体,其中所述构建体含有(a)本文所述的多核苷酸中的一个或更多;(b)编码形成发夹结构环的间隔元件的第二序列;以及(c)含有第一序列的反向互补序列的第三序列,其定位在与第一序列相同的方向,其中第二序列定位在第一序列和第三序列之间,并且第二序列可操作地连接于第一序列和第三序列。
[0139] 可利用所公开的序列来构建各种不形成发夹结构的NtABA4或NtNeSy或NtNCED2多核苷酸。例如,通过(1)经由可操作地连接到第一启动子来转录所述DNA的第一链、和(2)通过可操作地连接到第二启动子来转录所述DNA片段的第一链的反向互补序列,可形成双链RNA。可以从同一表达载体,或从不同表达载体转录出所述多核苷酸的每条链。具有RNA干扰活性的RNA双链体可以通过酶转化为小干扰RNA来调节RNA水平。
[0140] 因此,各种实施方案针对含有一个或更多NtABA4或NtNeSy或NtNCED2多核苷酸的表达载体、或编码能够自退火的干扰RNA多核苷酸的干扰RNA构建体,其中所述构建体包括(a)本文所述的多核苷酸中的一个或更多;和(b)含有第一序列的互补(例如,反向互补)序列的第二序列,其定位在与第一序列相同的方向。
[0141] 通过促进基因表达的共抑制来提供各种组合物和方法用于调节NtABA4或NtNeSy或NtNCED2多肽中的一个或更多(或其两个或更多、或三个或更多的组合)的內源表达水平。作为向植物细胞宿主中引入多拷贝转基因的结果而发生共抑制现象。多拷贝转基因的整合可导致转基因和靶向内源性基因的调节表达。共抑制程度依赖于转基因和靶向内源性基因之间序列同一性程度。内源性基因和转基因两者的沉默可以通过沉默的基因座(即,目标内源性启动子和内源性基因)的广泛甲基化而发生,其可以阻止转录。或者在某些情况下,内源性基因和转基因的共抑制可以通过转录后基因沉默发生,其中可以产生转录物,但增强的降解速度阻止转录物的积累。转录后基因沉默的共抑制机制被认为类似于RNA干扰,其中RNA似乎是这些过程中的重要的起始子(initiator)和靶,并且可以通过相同的分子机制、可能通过RNA引导的mRNA降解至少部分地被介导。
[0142] 可以通过将多个拷贝的核酸或其片段作为转基因整合到目标植物的基因组中来实现核酸的共抑制。使用含有可操作地连接到核酸或其片段的启动子的表达载体可转化宿主植物。各种实施方案针对用于促进内源性基因共抑制的表达载体,其包括可操作地连接到多核苷酸的启动子。
[0143] 各种实施方案针对通过将多拷贝的多核苷酸整合至(烟草)植物基因组而用于调节NtABA4或NtNeSy或NtNCED2多核苷酸(或其两个或更多、或三个或更多的组合)表达水平的方法,所述方法包括:使用含有可操作地连接到多核苷酸的启动子的表达载体来转化植物细胞宿主。
[0144] 提供各种组合物和方法通过调节mRNA的翻译来调节內源基因表达水平。使用表达载体可转化宿主(烟草)植物细胞,所述表达载体含有:可操作地连接到多核苷酸的启动子,其相对于能够表达与mRNA部分具有序列互补性的RNA多核苷酸的启动子定位在反义方向。
[0145] 用于调节mRNA翻译的各种表达载体可包括:可操作地连接到多核苷酸的启动子,其中多核苷酸的序列相对启动子位于反义方向。反义RNA多核苷酸的长度可变,以及可以从约15-20个核苷酸、约20-30个核苷酸、约30-50个核苷酸、约50-75个核苷酸、约75-100个核苷酸、约100-150个核苷酸、约150-200个核苷酸、以及约200-300个核苷酸。
[0146] 还提供用于获得突变多核苷酸和多肽的方法。任何目标植物,包括植物细胞或植物材料,可以通过各种已知用于诱导诱变的方法进行遗传修饰,包括位点定向诱变、寡核苷酸定向诱变、化学诱导的诱变、辐射诱导的诱变、利用修饰碱基的诱变、利用缺口双链体DNA的诱变、双链断裂诱变、利用修复缺陷的宿主株的诱变、通过全基因合成的诱变、DNA改组和其它等同的方法。
[0147] 或者,可以通过向目标植物基因组中引入转座子(例如,IS元件)使基因靶向失活。可以通过有性杂交受精引入这些可移动的遗传元件,通过蛋白活性丢失筛选插入突变体。
通过将亲本植物与未经转座子诱导诱变的植物进行杂交,例如通过有性杂交受精,可以将亲本植物中破坏的基因引入到其它植物中。可以利用本领域技术人员已知的任何标准育种技术。在一个实施方案中,可以通过插入一个或更多转座子使一个或更多基因失活。突变可导致一个或更多基因的纯合子破坏,导致一个或更多基因的杂合子破坏,或者如果破坏一个以上基因则导致纯合子和杂合子组合的破坏。合适的可转座的元件包括反转录转座子、反转录子(retroposon)和SINE样元件。这样的方法是本领域的技术人员已知的。
[0148] 或者,可以通过引入源自一些能够自我切割并在植物中复制的小环状RNA的核酶靶向基因进行失活。这些RNA可以单独复制(类病毒RNA)或与辅助病毒(卫星RNA)一起复制。合适的RNA实例包括源自鳄梨日斑类病毒(avocado sunblotch viroid)的那些、以及源自烟草环斑病毒(tobacco ringspot virus)、紫花苜蓿短暂条纹病毒(lucerne transient streak virus)、绒毛烟斑驳病毒(velvet tobacco mottle virus)、茄属植物斑驳病毒(solanum nodiflorum mottle virus)和地三叶草斑驳病毒(subterranean clover mottle virus)的卫星RNA。各种靶RNA特异性核酶是本领域技术人员已知的。
[0149] 在一些实施方案中,通过非转基因方式(例如在基因中建立突变)来调节多肽的表达。在基因序列中随机引入突变的方法可以包括化学诱变、EMS诱变和辐射诱变。向细胞中引入一个或更多靶向突变的方法包括但不限于基因组编辑技术,特别是锌指核酸酶介导的诱变、tilling(靶向诱导的基因组局部损伤)、同源重组、寡核苷酸定向诱变以及大范围核酸酶介导的诱变。
[0150] 突变的一些非限制性实例是至少一个核苷酸的删除、插入和错义突变、单核苷酸多态性和简单序列重复。突变后,可以进行筛选以鉴定产生提前终止密码子或者其它非功能基因的突变。突变后,可以进行筛选以鉴定产生能够以升高的水平表达的功能基因的突变。通过测序、或通过使用对基因或蛋白特异的一个或更多探针或引物可以进行突变体的筛选。也可以产生多核苷酸中的特异性突变,其可导致调节的基因表达、调节的mRNA稳定性、或者调节的蛋白稳定性。这样的植物本文称为“非天然存在的”或“突变的”植物。通常,突变的或非天然存在的植物将在操作不存在于植物中的外源的或合成的或人造的核酸(例如,DNA或RNA)之前包括其至少部分。外源核酸可以是单一核苷酸,两个或更多核苷酸、两个或更多连续核苷酸,或两个或更多非连续核苷酸,例如至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400或1500个或更多个连续或非连续核苷酸。
[0151] 突变的或非天然存在的植物可具有一个或更多突变的任意组合,所述突变导致调节的蛋白水平。例如,突变或非天然存在的植物可以具有在单基因中的单突变;在单基因中的多突变;在两个或更多或者三个或更多基因中的单突变;在两个或更多或者三个或更多基因中的多突变。例如,突变或非天然存在的植物可具有在基因的特别部分,如在编码蛋白的活性位点或其部分的基因区中,的一个或更多突变。又例如,突变或非天然存在的植物可具有在一个或更多基因之外的区上的一个或更多突变,例如在其调节的基因上游或下游的区中,如果所述区调节基因的活性或表达。上游元件可包括启动子、增强子或转录因子。一些元件,例如增强子,可定位在其调节基因的上游或下游。所述元件不需定位接近其调节的基因,因为已发现一些元件定位在其调节的基因的几十万(hundred thousand)碱基对的上游或下游。所述突变或非天然存在的植物可具有一个或更多突变,所述突变定位在基因的首先100个核苷酸内、在基因的首先200个核苷酸内、在基因的首先300个核苷酸内、在基因的首先400个核苷酸内、在基因的首先500个核苷酸内、在基因的首先600个核苷酸内、在基因的首先700个核苷酸内、在基因的首先800个核苷酸内、在基因的首先900个核苷酸内、在基因的首先1000个核苷酸内、在基因的首先1100个核苷酸内、在基因的首先1200个核苷酸内、在基因的首先1300个核苷酸内、在基因的首先1400个核苷酸内或在基因的首先1500个核苷酸内。所述突变的或非天然存在的植物可具有一个或更多突变,所述突变定位在基因的第一、第二、第三、第四、第五、第六、第七、第八、第九、第十、第十一、第十二、第十三、第十四或第十五组100个核苷酸或其组合内。公开了含有突变多肽变体的突变的或非天然存在的植物(例如,如本文所述的突变、非天然存在的或转基因植物等)。
[0152] 在一个实施方案中,来自植物的种子被诱变,然后生长成第一代突变植物。然后,允许第一代植物自花传粉,以及来自第一代植物的种子生长成第二代植物,然后筛选在第二代植物基因座中的突变。虽然可以筛选诱变植物材料的突变,筛选第二代植物的优点是所有体细胞突变对应于种系突变。本领域技术人员理解,为产生突变植物可诱变各种植物材料,包括但不限于种子、花粉、植物组织或植物细胞。然而,当筛选植物核酸的突变时,诱变的植物材料类型可能产生影响。例如,当在非诱变植物授粉前对花粉进行诱变时,所述授粉所得到的种子生长成第一代植物。第一代植物的每一个细胞将包含花粉中产生的突变;因此,随后可以筛选这些第一代植物的突变,而不是等到第二代。
[0153] 主要产生点突变以及短的删除、插入、颠换和或转换的诱变剂,包括化学诱变剂或辐射,可用于产生突变。诱变剂包括但不限于甲磺酸乙酯、甲磺酸甲酯、N-乙基-N-亚硝基脲、三乙基三聚氰胺、N-甲基-N-亚硝基脲、甲基苄肼、苯丁酸氮芥、环磷酰胺、硫酸二乙酯、丙烯酰胺单体、美法仑、氮芥、长春新碱、二甲基亚硝胺、N-甲基-N'-硝基-亚硝基胍、亚硝基胍、2-氨基嘌呤、7,12二甲基-苯并蒽、环氧乙烷、六甲基磷酰胺、白消安(bisulfan)、二环氧烷烃(二环氧辛烷、二环氧丁烷等)、2-甲氧基-6-氯-9[3-(乙基-2-氯-乙基)氨丙基氨基]吖啶二盐酸盐和甲醛。
[0154] 只要它们产生期望的表型,也可以考虑不是由诱变剂直接造成的基因座中的自发突变。合适的诱变试剂还包括,例如电离辐射,如X-射线、γ射线、快中子辐射和UV辐射。本领域技术人员已知的植物核酸制备的任何方法可用来制备用于突变筛选的植物核酸。
[0155] 来自个体植物、植物细胞、或植物材料的制备核酸可以任选地进行合并,以便加快筛选源自诱变的植物组织、细胞或材料的植物群体的突变。可以筛选植物、植物细胞或植物材料的一代或随后更多代。任选合并组的尺寸取决于所用筛选方法的灵敏度。
[0156] 任选地合并核酸样本之后,可对其进行多核苷酸特异性扩增技术,如聚合酶链式反应。对基因特异的、或对基因紧邻的序列特异的任何一个或更多引物或探针,可用于扩增任选合并的核酸样本中的序列。示例引物如SEQ ID NO:3至5、10至12以及14至16所示。优选地,设计一个或更多引物或探针用于扩增最有可能产生有用突变的基因座区域。最优选,设计引物用于检测多核苷酸区内的突变。此外,优选引物和探针以避免已知多态性位点以便于点突变的筛选。为方便扩增产物的检测,可以使用任何常规标记方法来标记一个或更多引物或探针。可以基于本文所述序列使用本领域公知的方法来设计引物或探针。
[0157] 为促进扩增产物的检测,可以使用任何常规标记方法来标记引物或探针。可以基于本文所述序列使用本领域公知的方法来设计这些。
[0158] 通过本领域已知的方法可鉴定多态性,并且一些已经描述在文献中。
[0159] 在另一方面,提供制备突变植物的方法。方法涉及提供含有编码功能性NtABA4或NtNeSy或NtNCED2(或者其两个或更多、或三个或更多的组合)多核苷酸的基因的植物的至少一个细胞。接着,在有效调节NtABA4或NtNeSy或NtNCED2多核苷酸活性的条件下,处理所述植物的至少一个细胞。然后,将至少一个突变植物细胞繁殖成突变植物,其中突变植物与对照植物相比具有调节的NtABA4或NtNeSy或NtNCED2多肽(或者其两个或更多、或三个或更多的组合)水平。在制成突变植物的这种方法的一个实施方案中,处理步骤涉及在有效产生至少一个突变植物细胞的条件下,让至少一个细胞经受如上所述的化学诱变试剂。在本方法的另一个实施方案中,处理步骤涉及在有效产生至少一个突变植物细胞的条件下,让至少一个细胞经受辐射源。术语“突变植物”包括突变植物,其中基因型与对照植物相比适当地通过除遗传工程或遗传修饰以外的方式得到修饰。
[0160] 在某些实施方案中,突变植物、突变植物细胞或突变植物材料可包括一个或更多突变并赋予期望的性状,所述突变天然存在于另一植物、植物细胞或植物材料中。这种突变可以并入(例如,基因渗入)另一植物、植物细胞或植物材料(例如,具有与突变所源自植物的遗传背景不同的植物、植物细胞或植物材料)来赋予其性状。因此,举例来说,天然存在于第一植物中的突变可被引入第二植物,如具有与第一植物遗传背景不同的第二植物。因此,技术人员能够搜索和鉴定植物,在所述植物基因组中天然携带本文所述基因的一个或更多赋予期望性状的突变等位基因。可以通过各种方法(包括育种、回交和基因渗入)将天然存在的突变等位基因转移到第二植物,以产生在本文所述基因中具有一个或更多突变的系、品种或杂种。可从突变植物的库中筛选出显示期望性状的植物。合适地,利用如本文所述的核苷酸序列的知识进行选择。因而,可能筛选与对照相比的遗传性状。这种筛选方法可涉及如本文所述的常规核酸扩增和/或杂交技术的应用。因此,本发明的其它方面涉及用于鉴定突变植物的方法,所述方法包括步骤:(a)提供来自植物的含有NtABA4或NtNeSy或NtNCED2多核苷酸的样本;以及(b)确定所述多核苷酸中的核酸序列,其中NtABA4或NtNeSy或NtNCED2多核苷酸的序列与对照植物多核苷酸序列的差异表明所述植物是NtABA4或NtNeSy或NtNCED2突变植物。在另一方面,提供用于鉴定突变植物的方法,所述突变植物与对照植物相比积累升高水平的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮,包括步骤:(a)提供来自待筛植物的样本;(b)确定是否所述样本含有在NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多突变;以及(c)确定所述植物的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮含量;其中如果所述样本含有在NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多突变,其与对照植物相比调节编码蛋白的表达或活性,以及烟草植物的部分与对照烟草植物(其中NtABA4或NtNeSy或NtNCED2的表达或活性没有得到调节)相比具有在(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮上至少5%的增加,表明突变植物积累了升高水平的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮。在另一方面,提供制备突变植物的方法,所述突变植物与对照植物相比积累了升高水平的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮,所述方法包括步骤:(a)提供来自第一植物的样本;(b)确定所述样本是否包含NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多突变,其导致积累升高水平的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮;以及(c)将一个或更多突变转移到第二植物。使用本领域已知的各种方法,例如通过遗传工程、遗传操作、基因渗入、植物育种、回交等等可将突变转移到第二植物中。在一个实施方案中,第一植物是天然存在的植物。在一个实施方案中,第二植物具有不同于第一植物的遗传背景。在另一个方面中,提供用于制备突变植物的方法,所述突变植物与对照植物相比积累升高水平的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮,所述方法包括步骤:(a)提供来自第一植物的样本;(b)确定所述样本是否包含在NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多突变,其导致积累升高水平的(i)类胡萝卜素或β大马酮;或者(ii)类胡萝卜素和β大马酮;以及(c)将来自第一植物的一个或更多突变基因渗入到第二植物中。在一个实施方案中,基因渗入的步骤包括植物育种,任选地包括回交等。在一个实施方案中,第一植物是天然存在的植物。在一个实施方案中,第二植物具有不同于第一植物的遗传背景。在一个实施方案中,第一植物不是栽培品种或优良栽培品种。在一个实施方案中,第二植物是栽培品种或优良栽培品种。再一方面涉及通过本文所述方法获得或可获得的突变植物(包括栽培品种或优良栽培品种突变植物)。在某些实施方案中,所述“突变植物”可具有仅位于植物特定区域的一个或更多突变,如在NtABA4或NtNeSy或NtNCED2多核苷酸序列内。
根据本实施方案,突变植物的其余基因组序列和诱变之前的植物相同或基本上相同。
[0161] 在某些实施方案中,突变植物可以具有位于植物一个以上的区域(如NtABA4或NtNeSy或NtNCED2多核苷酸的序列内)以及基因组的一个或更多其它区域中的一个或更多突变。根据本实施方案,突变植物的其余基因组序列和诱变之前的植物不相同或基本上不相同。在某些实施方案中,突变植物可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的一个或更多、两个或更多、三个或更多、四个或更多或五个或更多外显子中具有一个或更多突变;或者可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的一个或更多、两个或更多、三个或更多、四个或更多或五个或更多内含子中具有一个或更多突变;或者可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的启动子中具有一个或更多突变;或者可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的3’非翻译区具有一个或更多突变;可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的5’非翻译区具有一个或更多突变;可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的编码区具有一个或更多突变;或可以不在NtABA4或NtNeSy或NtNCED2多核苷酸的非编码区具有一个或更多突变;或两个或更多、三个或更多、四个或更多、五个或更多的任意组合;或其部分的六个或更多。
[0162] 在另一方面中,提供了鉴定在编码NtABA4或NtNeSy或NtNCED2的基因中含有突变的植物、植物细胞或植物材料的方法,所述方法包括:(a)使植物、植物细胞或植物材料经诱变;(b)从所述植物、植物细胞或植物材料或其后代获得核酸样本;以及(c)确定编码NtABA4或NtNeSy或NtNCED2的基因、或其变体或片段的核酸序列,其中所述序列中的差异指示着其中一个或更多突变。
[0163] 锌指蛋白可用于调节本文所述的NtABA4或NtNeSy或NtNCED2多核苷酸中的一个或更多的表达或活性。在各种实施方案中,通过锌指核酸酶介导的诱变来修饰含有部分或全部多核苷酸编码序列的基因组DNA序列。搜索基因组DNA序列以找寻锌指蛋白结合的独特位点。或者,搜索基因组DNA序列以找寻锌指蛋白结合的两个独特位点,其中两个位点在相对的链上并彼此靠近,例如,相隔1、2、3、4、5、6或更多个碱基对。因此,提供结合多核苷酸的锌指蛋白。
[0164] 可将锌指蛋白工程化以在基因上识别选择的靶向位点。通过截短、或扩展、或定点诱变的方法偶联选择方法(例如而非限制于噬菌体展示选择、细菌双杂交选择或细菌单杂交选择),锌指蛋白可含有源自天然锌指DNA结合结构域和非天然锌指DNA结合结构域的基序的任何组合。术语“非天然锌指DNA结合结构域”是指锌指DNA结合结构域,其结合靶核酸中的3碱基对序列并且不存在于含有待修饰核酸的细胞或生物中。结合对靶基因独特的特异核苷酸序列的锌指蛋白的设计方法是本领域已知的。
[0165] 可以通过制备第一多核苷酸和第二多核苷酸的融合体来构建锌指核酸酶,所述第一多核苷酸编码结合多核苷酸的锌指蛋白,以及第二多核苷酸编码非特异性核酸内切酶,例如但不限于IIS型核酸内切酶的那些。在锌指蛋白和核酸酶之间的融合蛋白可包括由两个碱基对组成的间隔区(spacer)、或者可替代地,所述间隔区可由3、4、5、6、7或更多碱基对所组成。在各种实施方案中,在多核苷酸的基因组DNA序列的调控区、编码区、或非编码区,锌指核酸酶引入一个双链断裂、并导致多核苷酸表达水平的降低、或者多核苷酸编码的蛋白活性的降低。锌指核酸酶的切割频繁导致在切割位点上的DNA删除,随后是通过非同源端连接的DNA修复。
[0166] 在其它实施方案中,可选择锌指蛋白来结合多核苷酸的调控序列。更具体地,所述调控序列可包含转录起始位点、起始密码子、外显子区、外显子-内含子边界、终止子或终止密码子。因此,本发明提供在本文所述的一个或更多多核苷酸附近或内部通过锌指核酸酶介导的诱变所产生的突变的、非天然存在的或转基因植物或植物细胞,以及通过锌指核酸酶介导的诱变制成这种植物或植物细胞的方法。用于将锌指蛋白和锌指核酸酶递送至烟草植物的方法与下述用于递送大范围核酸酶的那些相似。
[0167] 在另一方面,描述了使用大范围核酸酶(比如I-CreI)产生突变的、非天然存在的或转基因的或者其它遗传修饰的植物的方法。天然存在的大范围核酸酶以及重组大范围核酸酶可用于在植物基因组DNA中的单个位点或在相对较少位点上特异性造成双链断裂,从而允许破坏本文所述的一个或更多个多核苷酸。大范围核酸酶可以是具有改变的DNA识别性能的工程化的大范围核酸酶。可以通过本领域已知的各种不同机制将大范围核酸酶蛋白递送到植物细胞中。
[0168] 本发明包括使用大范围核酸酶在植物细胞或植物中失活NtABA4或NtNeSy或NtNCED2多核苷酸(或其两个或更多、或三个或更多的组合)。具体地,本发明提供使用大范围核酸酶失活植物中多核苷酸的方法,包括:a)提供含有本文所述的多核苷酸的植物细胞;(b)向所述植物细胞中引入大范围核酸酶或编码大范围核酸酶的构建体;以及(c)允许大范围核酸酶使所述多核苷酸基本上失活。
[0169] 大范围核酸酶可用于切割多核苷酸编码区内的大范围核酸酶识别位点。这种频繁切割导致大范围核酸酶识别位点的DNA删除,随后是通过非同源端连接的致突变的DNA修复。这种在基因编码序列中的突变通常足以使所述基因失活。首先,这种改变植物细胞的方法涉及使用合适的转化方法将大范围核酸酶表达盒递送至植物细胞。为获得最高效率,需要将大范围核酸酶表达盒连接至可选择的标志物,并在选择试剂存在下选择成功转化的细胞。这种方法将导致大范围核酸酶表达盒整合到基因组中,然而如果植物有可能需要监管批准,这种方法则是不可取的。在这种情况下,可以使用常规育种技术将大范围核酸酶表达盒(以及相连的选择性标志物基因)在后代植物中分离出来。或者,可以最初用缺乏选择性标志物的大范围核酸酶表达盒转化植物细胞,所述植物细胞可在缺乏选择试剂的介质中生长。在这种条件下,部分处理后的细胞将获得大范围核酸酶表达盒并将瞬时表达工程化的大范围核酸酶而没有将大范围核酸酶表达盒整合到基因组中。因为没有考虑转化效率,所述后者转化过程需要筛选更多处理的细胞以获得所需的基因组修饰。当使用锌指蛋白或锌指核酸酶时,上述方法也可用于修饰植物细胞。
[0170] 递送大范围核酸酶表达盒之后,植物细胞最初在对于所用特定转化过程典型的条件下生长。这可能意味着,通常在黑暗中在低于26℃温度下的介质上,使转化细胞生长。这样的标准条件可使用一段时间,优选1-4天以允许植物细胞从转化过程中恢复。此初始恢复期后的任何点上,可提高生长温度以刺激工程化的大范围核酸酶的活性来切割并突变大范围核酸酶识别位点。
[0171] 对于某些应用,可能需要从植物基因组中精确除去多核苷酸。使用一对工程化的大范围核酸酶这种应用是可行的,其中每种切割位于所预期的删除各侧的大范围核酸酶识别位点。
[0172] 可以使用TAL效应物核酶(TALEN),其能够识别并结合基因以及向基因组引入双链断裂。因此,在另一方面,关注使用TAL效应物核酶用于产生本文所述的突变的、非天然存在的或转基因的或其它遗传修饰的植物的方法。
[0173] 适用于遗传修饰的植物包括但不限于单子叶和双子叶植物以及植物细胞系统,包括来自下列科之一的种:爵床科(Acanthaceae)、葱科(Alliaceae)、六出花科(Alstroemeriaceae)、石蒜科(Amaryllidaceae)、夹竹桃科(Apocynaceae)、槟榔科(Arecaceae)、菊科(Asteraceae)、小檗科(Berberidaceae)、红木科(Bixaceae)、十字花科(Brassicaceae)、凤梨科(Bromeliaceae)、大麻科(Cannabaceae)、石竹科
(Caryophyllaceae)、三尖杉科(Cephalotaxaceae)、藜科(Chenopodiaceae)、秋水仙科(Colchicaceae)、葫芦科(Cucurbitaceae)、薯蓣科(Dioscoreaceae)、麻黄科
(Ephedraceae)、古柯科(Erythroxylaceae)、大戟科(Euphorbiaceae)、蝶形花科(Fabaceae)、唇形科(Lamiaceae)、亚麻科(Linaceae)、石松科(Lycopodiaceae)、锦葵科(Malvaceae)、黑药花科(Melanthiaceae)、芭蕉科(Musaceae)、桃金娘科(Myrtaceae)、蓝果树科(Nyssaceae)、罂粟科(Papaveraceae)、松科(Pinaceae)、车前草科(Plantaginaceae)、禾本科(Poaceae)、蔷薇科(Rosaceae)、茜草科(Rubiaceae)、杨柳科(Salicaceae)、无患子科(Sapindaceae)、茄科(Solanaceae)、紫杉科(Taxaceae)、山茶科(Theaceae)或葡萄科(Vitaceae)。
[0174] 合适的种可包括黄秋葵(Abelmoschus)、冷杉(Abies)、槭(Acer)、翦股颖(Agrostis)、葱(Allium)、六出花(Alstroemeria)、凤梨(Ananas)、穿心莲(Andrographis)、须芒草(Andropogon)、蒿(Artemisia)、芦竹(Arundo)、颠茄(Atropa)、小檗(Berberis)、甜菜(Beta)、红木(Bixa)、芸苔(Brassica)、金盏菊(Calendula)、山茶花(Camellia)、喜树(Camptotheca)、大麻(Cannabis)、辣椒(Capsicum)、红花(Carthamus)、长春花(Catharanthus)、三尖杉(Cephalotaxus)、菊花(Chrysanthemum)、金鸡纳(Cinchona)、西瓜(Citrullus)、咖啡(Coffea)、秋水仙(Colchicum)、彩叶草(Coleus)、黄瓜(Cucumis)、南瓜(Cucurbita)、狗牙根(Cynodon)、曼陀罗(Datura)、石竹(Dianthus)、洋地黄(Digitalis)、薯蓣(Dioscorea)、油棕(Elaeis)、麻黄草(Ephedra)、斑茅(Erianthus)、古柯
(Erythroxylum)、桉树(Eucalyptus)、羊茅(Festuca)、草莓(Fragaria)、雪花莲(Galanthus)、大豆(Glycine)、棉花(Gossypium)、向日葵(Helianthus)、橡胶树(Hevea)、大麦(Hordeum)、天仙子(Hyoscyamus)、麻疯树(Jatropha)、莴苣(Lactuca)、亚麻(Linum)、黑麦草(Lolium)、羽扇豆(Lupinus)、番茄(Lycopersicon)、石松(Lycopodium)、木薯(Manihot)、苜蓿(Medicago)、薄荷(Mentha)、芒草(Miscanthus)、香蕉(Musa)、烟草(Nicotiana)、水稻(Oryza)、黍(Panicum)、罂粟(Papaver)、银胶菊(Parthenium)、狼尾草(Pennisetum)、矮牵牛(Petunia)、虉(Phalaris)、猫尾(Phleum)、松(Pinus)、早熟禾(Poa)、一品红(Poinsettia)、胡杨(Populus)、萝芙木(Rauwolfia)、蓖麻(Ricinus)、蔷薇(Rosa)、甘蔗(Saccharum)、柳(Salix)、血根草(Sanguinaria)、莨菪(Scopolia)、黑麦(Secale)、茄(Solanum)、高粱(Sorghum)、米草(Spartina)、菠菜(Spinacea)、艾菊(Tanacetum)、紫杉(Taxus)、可可(Theobroma)、小黑麦(Triticosecale)、小麦(Triticum)、北美穗草(Uniola)、藜芦(Veratrum)、长春花(Vinca)、葡萄(Vitis)和玉米(Zea)属的成员。
[0175] 合适的种可包括黍(Panicum spp.)、高粱(Sorghum spp.)、芒(Miscanthus spp.)、甘蔗(Saccharum spp.)、蔗茅(Erianthus spp.)、杨(Populus spp.)、大须芒草(Andropogon gerardii)(大须芒草(big bluestem))、象草(Pennisetum purpureum)(象草(elephant grass))、虉草(Phalaris arundinacea)(虉草(reed canarygrass))、狗牙根(Cynodon dactylon)(狗牙根(bermudagrass))、高羊茅(Festuca arundinacea)(高羊茅(tall fescue))、草原索草(Spartina pectinata)(草原绳草(prairie cord-grass))、紫花苜蓿(Medicago sativa)(紫花苜蓿(alfalfa))、芦竹(Arundo donax)(芦竹(giant reed))、黑麦(Secale cereale)(黑麦(rye))、柳(Salix spp.)(柳(willow))、桉树(Eucalyptus spp.)(桉树(eucalyptus))、小黑麦(Triticosecale)(小麦属小麦杂交黑麦(tritic wheat times rye))、竹(bamboo)、向日葵(Helianthus annuus)(向日葵(sunflower))、红花(Carthamus tinctorius)(红花(safflower))、麻风(Jatropha curcas)(麻风(jatropha))、蓖麻(Ricinus communis)(蓖麻(castor))、油棕(Elaeis guineensis)(油棕(palm))、亚麻(Linum usitatissimum)(亚麻(flax))、芥菜(Brassica juncea)、甜菜(Beta vulgaris)(甜菜(sugarbeet))、木薯(Manihot esculenta)(木薯(cassaya))、番茄(Lycopersicon esculentum)(西红柿(tomato))、莴苣(Lactuca sativa)(莴苣(lettuce))、香蕉(Musyclise alca)(香蕉(banana))、马铃薯(Solanum tuberosum)(马铃薯(potato))、甘蓝(Brassica oleracea)(西兰花(broccoli)、花椰菜(cauliflower)、芽甘蓝(Brussels sprouts))、茶(Camellia sinensis)(茶(tea))、草莓(Fragaria ananassa)(草莓(strawberry))、可可(Theobroma cacao)(可可(cocoa))、咖啡(Coffea ycliseca)(咖啡(coffee))、葡萄(Vitis vinifera)(葡萄(grape))、菠萝(Ananas comosus)(菠萝(pineapple))、辣椒(Capsicum annum)(辣甜椒(hot & sweet pepper))、洋葱(Allium cepa)(洋葱(onion))、甜瓜(Cucumis melo)(甜瓜(melon))、黄瓜(Cucumis sativus)(黄瓜(cucumber))、南瓜(Cucurbita maxima)(南瓜(squash))、南瓜(Cucurbita moschata)(南瓜(squash))、菠菜(Spinacea oleracea)(菠菜(Spinach))、西瓜(Citrullus lanatus)(西瓜(watermelon))、秋葵(Abelmoschus esculentus)(秋葵(okra))、茄子(Solanum melongena)(茄子(eggplant))、蔷薇(Rosa spp.)(蔷薇(rose))、康乃馨(Dianthus caryophyllus)(康乃馨(carnation))、矮牵牛(Petunia spp.)(矮牵牛(petunia))、一品红(Poinsettia pulcherrima)(一品红(poinsettia))、羽扇豆(Lupinus albus)(羽扇豆(lupin))、燕麦(Uniola paniculata)(燕麦(oats))、翦股颖(bentgrass)(翦股颖(Agrostis spp.))、山杨(Populus tremuloides)(山杨(aspen))、松(Pinus spp.)(松(pine))、冷杉(Abies spp.)(冷杉(fir))、槭(Acer spp.)(枫(maple))、大麦(Hordeum vulgare)(大麦(barley))、早熟禾(Poa pratensis)(早熟禾(bluegrass))、黑麦草(Lolium spp.)(黑麦草(ryegrass))和猫尾草(Phleum pratense)(猫尾草(timothy)、柳(Panicum virgatum)(柳(switchgrass))、高粱(Sorghu yclise)或(高粱(sorghum)、苏丹草(sudangrass))、芒草(Miscanthus giganteus)(芒草(miscanthus))、甘蔗(Saccharum sp.)(甘蔗(energycane))、白杨(Populus balsamifera)(白杨(poplar))、玉米(Zea mays)(玉米(corn))、大豆(Glycine max)(大豆(soybean))、油菜(Brassica napus)(油菜(canola))、小麦(Triticum aestivum)(小麦(wheat))、棉花(Gossypium hirsutum)(棉花(cotton))、水稻(Oryza sativa)(水稻(rice))、向日葵(Helianthus annuus)(向日葵(sunflower))、紫花苜蓿(Medicago sativa)(紫花苜蓿(alfalfa))、甜菜(Beta vulgaris)(甜菜(sugarbeet))或者珍珠粟(Pennisetum glaucum)(珍珠粟(pearl millet))。
[0176] 各种实施方案针对突变烟草植物、非天然存在的烟草植物或转基因烟草植物经修饰用以调节基因表达水平,从而产生植物如烟草植物,在其中目标植物组织内的多肽表达水平和对照植物相比是调节的。公开的组合物和方法可应用于烟草属的任何种,包括黄花烟草(N.rustica)和红花烟草(N.tabacum)(例如,LA B21、LN KY171、TI 1406、巴斯玛(Basma)、Galpao、珀里克(Perique)、Beinhart 1000-1和Petico)。其它物种包括N.acaulis、N yclise ta、N yclise ta var.multiflora、N yclise na、花叶烟草(N.alata)、抱茎烟草(N.amplexicaulis)、N.arentsii、N yclise ta、N.benavidesii、本塞姆氏烟草(N.benthamiana)、N.bigelovii、N.bonariensis、N.cavicola、克氏烟草(N.clevelandii)、心叶烟草(N.cordifolia)、N.corymbosa、N.debneyi、N.excelsior、福氏烟草(N.forgetiana)、N.fragrans、粉蓝烟草(N.glauca)、粘性烟草(N.glutinosa)、N.goodspeedii、野生烟草(N.gossei)、N.hybrid、N.ingulba、N.kawakamii、N.knightiana、郎氏烟草(N.langsdorffii)、N.linearis、长花烟草(N.longiflora)、N yclise ma、麦格隆熄丰烟草(N.megalosiphon)、N.miersii、夜花烟草(N.noctiflora)、N.nudicaulis、N.obtusifolia、西方烟草(N.occidentalis)、N.occidentalis subsp.hesperis、耳状烟草(N.otophora)、圆锥烟草(N.paniculata)、N.pauciflora、矮牵牛状烟草(N.petunioides)、蓝茉莉叶烟草(N.plumbaginifolia)、N.quadrivalvis、N.raimondii、波缘烟草(N.repanda)、莲座叶烟草(N.rosulata)、N.rosulata subsp.ingulba、N.rotundifolia、N.setchellii、N.simulans、N.solanifolia、N.spegazzinii、斯托克通氏烟草
(N.stocktonii)、N.suaveolens、种林烟草(N.sylvestris)、N.thyrsiflora、绒毛烟草(N.tomentosa)、拟茸毛烟草(N.tomentosiformis)、N.trigonophylla、N.umbratica、N yclise ta、N.velutina、N.wigandioides和N.×sanderae。
[0177] 本文也考虑使用烟草栽培品种和优良烟草栽培品种。因此转基因、非天然存在的或突变的植物可以是烟草品种或优良烟草栽培品种,其包括一个或多个转基因、或一个或多个遗传突变或其组合。遗传突变(例如,一个或多个多态性)可以是非天然存在于个体烟草品种或烟草栽培品种(例如,优良烟草栽培品种)的突变,或只要突变非天然存在于个体烟草品种或烟草栽培品种(例如,优良烟草栽培品种)中,所述遗传突变可以是天然存在的遗传突变。
[0178] 特别有用的红花烟草品种包括白肋烟型、深型、烤烟型和东方型烟草。品种或栽培品种的非限制性实例是:BD 64、CC 101、CC 200、CC 27、CC 301、CC 400、CC 500、CC 600、CC 700、CC 800、CC 900、Coker 176、Coker 319、Coker 371 Gold、Coker 48、CD 263、DF911、DT 
538 LC Galpao烟草、GL 26H、GL 350、GL 600、GL 737、GL 939、GL 973、HB 04P、HB 04P LC、HB3307PLC、杂交403LC、杂交404LC、杂交501 LC、K 149、K 326、K 346、K 358、K394、K 399、K 
730、KDH 959、KT 200、KT204LC、KY10、KY14、KY 160、KY 17、KY 171、KY 907、KY907LC、KTY14xL8 LC、Little Crittenden、McNair 373、McNair 944、msKY 14xL8、窄叶Madole、窄叶Madole LC、NBH 98、N-126、N-777LC、N-7371LC、NC 100、NC 102、NC 2000、NC 291、NC 
297、NC 299、NC 3、NC 4、NC 5、NC 6、NC7、NC 606、NC 71、NC 72、NC 810、NC BH 129、NC 
2002、Neal Smith Madole、OXFORD 207、PD 7302 LC、PD 7309 LC、PD 7312 LC、“珀里克”(Periq’e)烟草、PVH03、PVH09、PVH19、PVH50、PVH51、R 610、R 630、R 7-11、R 7-12、RG 17、RG 81、RG H51、RGH 4、RGH 51、RS 1410、Speight 168、Speight 172、Speight 179、Speight 
210、Speight 220、Speight 225、Speight 227、Speight 234、Speight G-28、Speight G-
70、Speight H-6、Speight H20、Speight NF3、TI 1406、TI 1269、TN 86、TN86LC、TN 90、TN 
97、TN97LC、TN D94、TN D950、TR(Tom Rosson)Madole、VA 309、VA359、AA 37-1、B 13P、Xanthi(Mitchell-Mor)、Bel-W3、79-615、沙姆逊福尔摩斯NN、KTRDC 2号杂交49、白肋21、KY 
8959、KY 9、MD 609、PG 01、PG 04、PO1、PO2、PO3、RG 11、RG 8、VA 509、AS44、Banket A1、巴斯玛Drama B84/31、巴斯玛I Zichna ZP4/B、巴斯玛Xanthi BX 2A、Batek、Besuki Jember、C104、Coker 347、Criollo Misionero、Delcrest、Djebel 81、DVH 405、 Comum、HB04P、希克斯阔叶、Kabakulak Elassona、Kutsage E1、LA BU 21、NC 2326、NC 297、PVH 
2110、红色俄罗斯(Red Russian)、Samsun、Saplak、Simmaba、Talgar 28、Wislica、Yayaldag、Prilep HC-72、Prilep P23、Prilep PB 156/1、Prilep P12-2/1、Yaka JK-48、Yaka JB 125/3、TI-1068、KDH-960、TI-1070、TW136、巴斯玛、TKF 4028、L8、TKF 2002、GR141、巴斯玛xanthi、GR149、GR153、Petit Havana。即使本文未特别指明,也考虑上述低转化亚变种(low converter subvariety)。
[0179] 实施方案还针对用于产生突变植物、非天然存在的植物、杂交植物、或转基因植物的组合物和方法,其中植物已被修饰以调节NtABA4或NtNeSy或NtNCED2多核苷酸(或者其两个或更多、或三个或更多的组合)、或者NtABA4或NtNeSy或NtNCED2多肽(或者其两个或更多、或三个或更多的组合)表达或活性。有利地,所述获得的突变植物、非天然存在的植物、杂交植物、或转基因植物可在整体外观上与对照植物相似或基本相同。各种表型特征,例如成熟程度、每植物的叶数、秆高、叶插入角度、叶尺寸(宽度和长度)、节间距离、以及叶片-中脉比可通过田间观察来评估。
[0180] 一方面涉及本文所述的突变植物、非天然存在的植物、杂交植物、或转基因植物的种子。优选地,所述种子是烟草种子。另一方面涉及本文所述的突变植物、非天然存在的植物、杂交植物、或转基因植物的花粉或胚珠。此外,提供还含有赋予雄性不育的核酸的本文所述的突变植物、非天然存在的植物、杂交植物、或转基因植物。
[0181] 还提供本文所述的突变植物、非天然存在的植物、杂交植物、或转基因植物或其部分的可再生细胞的组织培养物,其中培养物再生成能够表达亲本的所有形态和生理特征的植物。可再生细胞包括,但不限于来自叶、花粉、胚、子叶、下胚轴、根、根尖、花药、花和其部分、胚珠、芽、茎、秆、髓和荚膜、或源自其的愈伤组织或原生质体的细胞。
[0182] 一个目标是提供突变、转基因的或非天然存在的植物,其显示调节的类胡萝卜素或β大马酮水平、或者调节的类胡萝卜素和β大马酮水平,同时维持与对照植物基本相同的视觉外观。因此,本文描述了突变、转基因的或非天然存在的植物或植物细胞,其与对照细胞或对照植物相比具有调节水平的类胡萝卜素或β大马酮水平、或者调节水平的类胡萝卜素和β大马酮水平。所述突变、转基因的或非天然存在的植物或植物细胞已被改变以通过调节编码本文所述的多核苷酸序列的一个或更多个多肽的表达来调节本文所述酶中的一个或更多的合成或活性。
[0183] 另一方面涉及突变、非天然存在的或转基因植物或细胞,其中本文所述的酶中的一个或更多个的表达或活性被调节,并且所述植物的部分(例如,叶)与对照植物相比在类胡萝卜书水平上具有至少5%的增加或减少,其中所述对照植物中所述酶的表达或活性未被调节。在又一方面,涉及突变、非天然存在的或转基因植物或细胞,其中新黄质合酶的表达或由其编码的蛋白的活性被调节,以及在其中气雾中的β大马酮水平与来自对照植物的气雾相比增加或减少了至少5%。
[0184] 与对照植物相比,在类胡萝卜素含量上的改变可以是至少约5%、至少约10%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%或更多,例如200%或300%或更多的改变。
[0185] 与对照植物相比,在β大马酮含量上的改变可以是至少约5%、至少约10%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约
75%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约
99%或约100%或更多,例如200%或300%或更多的改变。
[0186] 合适地,在植物(例如,叶)的部分中的叶黄素含量为至少约18mg/100g,合适地,至少约18.5mg/100g,合适地,至少约19mg/100g,合适地,至少约19.5mg/100g,合适地,至少约20mg/100g,合适地,至少约25mg/100g或更多。
[0187] 合适地,在植物的部分(例如,叶)中的β胡萝卜素含量为收获的植物(例如,叶)材料的至少约11.5mg/100g,合适地,至少约12mg/100g,合适地,至少约12.5mg/100g,合适地,至少约13mg/100g,合适地,至少约13.5mg/100g,合适地,至少14mg/100g,合适地,至少约14.5mg/100g,或者合适地,至少约15mg/100g,或更多。
[0188] 合适地,在植物的部分(例如,叶)中的叶黄素含量为收获的植物(例如,叶)的材料的至少约18mg/100g,合适地,至少约18.5mg/100g,合适地,至少约19mg/100g,合适地,至少约19.5mg/100g,合适地,至少约20mg/100g,合适地,至少约25mg/100g或更多,以及在植物的部分(例如,叶)中的β胡萝卜素含量为至少约11.5mg/100g,合适地,至少约12mg/100g,合适地,至少约12.5mg/100g,合适地,至少约13mg/100g,合适地,至少约13.5mg/100g,合适地,至少14mg/100g,合适地,至少约14.5mg/100g,或者合适地,至少约15mg/100g,或更多。
[0189] 合适地,在燃烧或加热叶的气雾中的β大马酮水平是燃烧或收获的植物(例如,叶)材料的至少约1ng/mg,合适地,至少约1.05ng/mg,合适地,至少约1.1ng/mg,合适地,至少约1.15ng/mg,或合适地,至少约2ng/mg或更多。
[0190] 合适地,(i)在植物(例如,叶)的部分中的叶黄素含量为收获的植物(例如,叶)材料的至少约18mg/100g,合适地,至少约18.5mg/100g,合适地,至少约19mg/100g,合适地,至少约19.5mg/100g,合适地,至少约20mg/100g;合适地,至少约25mg/100g或更多;合适地(ii)在植物的部分(例如,叶)中的β胡萝卜素含量为收获的植物(例如,叶)材料的至少约11.5mg/100g,合适地,至少约12mg/100g,合适地,至少约12.5mg/100g,合适地,至少约
13mg/100g,合适地,至少约13.5mg/100g,合适地,至少14mg/100g,合适地,至少约14.5mg/
100g,或者合适地,至少约15mg/100g,或更多;以及(iii)合适地,在燃烧或加热叶的气雾中的β大马酮水平是燃烧或收获的植物(例如,叶)材料的至少约1ng/mg,合适地,至少约
1.05ng/mg,合适地,至少约1.1ng/mg,合适地,至少约1.15ng/mg,或合适地,至少约2ng/mg或更多。
[0191] 植物可加热至100℃或以上,如至少125℃、至少150℃、至少175℃或至少200℃,来释放气雾。
[0192] 在另一方面,提供突变、非天然存在的或转基因植物,其中酶的表达或者其所编码的蛋白的活性是增加的,所述酶选自新黄质合酶、番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶或者其两个或更多、或三个或更多的组合(所述组合是本文公开的),以及(i)在植物的部分(例如,叶)中的叶黄素含量是收获的植物(例如,叶)材料的至少约18mg/100g;(ii)在植物的部分(例如,叶)中的β胡萝卜素含量是收获的植物(例如,叶)材料的至少约
11.5mg/100g;以及(iii)在燃烧或加热叶的气雾中的β大马酮水平是燃烧或收获的植物(例如,叶)材料的至少约1ng/mg。合适地,所述植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。
[0193] 实施方案还针对用于产生突变、非天然存在的或转基因植物的组合物和方法,所述植物已被改变以调节新黄质合酶表达或活性;或番茄红素β环化酶表达或活性;或9-顺式-环氧类胡萝卜素双加氧酶表达活性,其可产生与对照相比具有调节的类胡萝卜素水平(例如,而非限制于叶黄素或β胡萝卜素或两者)的植物或植物组分(例如叶,如绿叶或烤制叶)。实施方案还针对用于产生突变、非天然存在的或转基因植物的组合物和方法,所述植物已被改变以调节新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶的两个或更多、或三个或更多的组合的表达或活性。因此,一个实施方案涉及调节新黄质合酶、番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶的表达或活性;另一个实施方案涉及调节新黄质合酶和番茄红素β环化酶的表达或活性;另一个实施方案涉及调节新黄质合酶和
9-顺式-环氧类胡萝卜素双加氧酶的表达或活性;以及另一个实施方案涉及调节番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶、或这些两个或更多序列的任何其它组合的表达或活性。在植物中调节类胡萝卜素的水平可对消费者具有营养益处,特别是当在植物中的类胡萝卜素水平升高时。特别当在植物中的类胡萝卜素水平升高时,在植物中调节类胡萝卜素的水平可用于生成植物,其对除草剂有抗性并抑制类胡萝卜素生物合成。因此,在一个具体实施方案中,提供用于产生突变、非天然存在的或转基因植物的组合物和方法,所述植物已被改变以升高上述多核苷酸和其组合物的表达或活性,其可产生具有改善的营养益处或升高的除草剂抗性的植物或植物组分(例如叶,如绿叶或烤制叶)。
[0194] 实施方案还针对用于产生突变、非天然存在的或转基因植物的组合物和方法,所述植物已被改变以调节新黄质合酶表达或活性,其可产生与对照相比具有调节的β大马酮水平的植物或植物组分(例如,加热的烤制叶)。因此,在另一实施方案中,提供用于产生突变、非天然存在的或转基因植物的组合物和方法,所述植物已被改变以调节新黄质合酶表达或活性,其可产生植物或植物材料,如加热的或燃烧烤制的烟草叶,其中的β大马酮水平被调节。因此,增加或减少β大马酮含量可导致具有改变的风味谱的植物材料。在一个具体实施方案中,提供用于产生突变、非天然存在的或转基因植物的组合物和方法,所述植物已被改变以增加新黄质合酶表达或活性,其可产生植物或植物材料,如加热的或燃烧烤制的烟草叶,其中的β大马酮水平增加。增加的β大马酮含量可产生具有熟苹果风味的风味谱的植物材料。减少的β大马酮含量可产生具有改变风味谱的植物材料。根据某些实施方案,本文对β大马酮的引用也可包括其前体。这样的改变也可调节植物的类胡萝卜素含量。
[0195] 有利地,根据本文所述方法获得的突变、非天然存在的或转基因植物与对照植物在视觉外观上相似或基本相同。在一个实施方案中,突变、非天然存在的或转基因植物的秆高与对照植物基本相同,例如在田间移植后一、二、或三或更多个月、或者在打顶后10、20、30或36或更多天。例如,突变、非天然存在的或转基因植物的秆高不低于对照植物的秆高。
在另一个实施方案中,突变、非天然存在的或转基因植物的叶绿素含量与对照植物基本相同。在另一个实施方案中,突变、非天然存在的或转基因植物的秆高与对照植物基本相同,以及突变、非天然存在的或转基因植物的叶绿素含量与对照植物基本相同。在其它实施方案中,突变、非天然存在的或转基因植物的叶子的尺寸、或形状、或数目、或着色与对照植物基本相同。适宜地,所述植物是烟草植物。
[0196] 在另一方面,提供至少在植物的部分(例如,叶)中用于调节类胡萝卜素含量的方法,其包括下列步骤:(i)调节在植物中酶的表达或活性,所述酶选自新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶或者其两个或更多、或三个或更多的组合(所述组合在上公开),优选地,其中所述新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶含有本文所述的多核苷酸序列或本文所述的多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分(例如,叶)中的类胡萝卜素含量;以及(iii)鉴定其中类胡萝卜素含量与对照植物相比已得到调节的突变、非天然存在的或转基因植物。合适地,所述突变、非天然存在的或转基因植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。
[0197] 在另一方面,提供在植物的至少部分(例如,叶子)中用于增加类胡萝卜素含量的方法,其包括下列步骤:(i)增加在植物中酶的表达或活性,所述酶选自新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶或者其两个或更多、或三个或更多的组合(所述组合在上公开),优选地,其中所述新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶含有本文所述的多核苷酸序列或本文所述的多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分(例如,叶)中的类胡萝卜素含量;以及(iii)鉴定其中类胡萝卜素含量与对照植物相比已增加的突变、非天然存在的或转基因植物。合适地,所述突变、非天然存在的或转基因植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。
[0198] 在另一方面,提供在植物的至少部分(例如,叶子)中用于减少类胡萝卜素含量的方法,其包括下列步骤:(i)减少在植物中酶的表达或活性,所述酶选自新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶或者其两个或更多、或三个或更多的组合(所述组合在上公开),优选地,其中所述新黄质合酶、番茄红素β环化酶以及9-顺式-环氧类胡萝卜素双加氧酶含有本文所述的多核苷酸序列或本文所述的多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分(例如,叶)中的类胡萝卜素含量;以及(iii)鉴定其中类胡萝卜素含量与对照植物相比已减少的突变、非天然存在的或转基因植物。合适地,所述突变、非天然存在的或转基因植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。
[0199] 与对照植物相比在表达上的增加可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%或更多,例如200%或300%或更多的增加,其包括在转录活性或蛋白表达或两者上的增加。
[0200] 与对照植物相比在活性上的增加可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%或更多,例如200%或300%或更多的增加。
[0201] 与对照植物相比在表达上的减少可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%的减少,其包括在转录活性或蛋白表达或两者上的减少。
[0202] 与对照植物相比在活性上的减少可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%的减少。
[0203] 与对照植物相比在类胡萝卜素含量上的增加可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或多达100%或更多,例如200%或300%或更多的增加。
[0204] 与对照植物相比在类胡萝卜素含量上的减少可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或多达100%的减少。
[0205] 在另一方面,提供用于调节植物的β大马酮含量的方法,包括以下步骤:(i)调节在植物中的新黄质合酶的表达或活性,优选地,其中新黄质合酶含有本文所述的多核苷酸序列或多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分或其气雾中的β大马酮含量;以及(iii)鉴定其中β大马酮含量与对照植物相比已变化的突变、非天然存在的或转基因植物,所述对照植物中的新黄质合酶的表达或活性未得到调节。合适地,所述突变、非天然存在的或转基因植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。合适地,在加热烤制烟草叶后形成的气雾中测量β大马酮含量。
[0206] 在另一方面,提供用于增加植物的β大马酮含量的方法,包括以下步骤:(i)增加在植物中的新黄质合酶的表达或活性,优选地,其中新黄质合酶含有本文所述的多核苷酸序列或多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分中的β大马酮含量;以及(iii)鉴定其中β大马酮含量与对照植物相比已增加的突变、非天然存在的或转基因植物,所述对照植物中的新黄质合酶的表达或活性没有增加。合适地,所述突变、非天然存在的或转基因植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。合适地,在加热烤制烟草叶后形成的气雾中测量β大马酮含量。
[0207] 在另一方面,提供用于减少或抑制(例如,基本抑制)植物的β大马酮含量的方法,包括以下步骤:(i)减少或抑制在植物中的新黄质合酶的表达或活性,优选地,其中新黄质合酶含有本文所述的多核苷酸序列或多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分中的β大马酮含量;以及(iii)鉴定其中β大马酮含量与对照植物相比已减少或已抑制的突变、非天然存在的或转基因植物,所述对照植物中的新黄质合酶的表达或活性没有被减少或抑制。合适地,所述突变、非天然存在的或转基因植物的视觉外观与对照植物基本相同。合适地,所述植物是烟草植物。合适地,在加热烤制烟草叶后形成的气雾中测量β大马酮含量。
[0208] 与对照植物相比在新黄质合酶表达上的增加可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%或更多,例如200%或300%或更多的增加,其包括在转录活性或蛋白表达或两者上的增加。
[0209] 与对照植物相比在新黄质合酶活性上的增加可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%或更多,例如200%或300%或更多的增加。
[0210] 与对照植物相比在新黄质合酶表达上的减少可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%的减少,其包括在转录活性或蛋白表达或两者上的减少。
[0211] 与对照植物相比在新黄质合酶活性上的减少可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或100%或更多的减少。
[0212] 与对照植物相比在β大马酮含量上的增加可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或多达100%或更多,例如200%或300%或更多的增加。
[0213] 与对照植物相比在β大马酮含量上的减少可从约5%至约100%、或至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、或多达100%的减少。
[0214] 本文所述的多核苷酸和重组构建体可用于在目标植物种(合适地烟草)中调节本文所述酶的表达。
[0215] 一些基于多核苷酸的方法可用于增加基因在植物中的表达。例如,可制备和待转化的植物兼容的构建体、载体或表达载体,其包括目标基因连同能够在植物中过表达所述基因的上游启动子。在本文描述示例性启动子。转化后当生长在合适条件下,所述启动子可驱动表达以调节(例如,增加)这种酶在植物或在其特定组织中的水平。在一个示例性实施方案中,生成携带NtABA4或NtNeSy或NtNCED2多核苷酸(或本文所述的其任意组合)的载体以在植物中过表达所述基因。所述载体携带位于转基因上游的合适启动子(例如花椰菜花叶病毒CaMV 35S启动子)以驱动所述基因在植物的所有组织中组成型表达。为转化的愈伤组织和细胞系赋予选择性,所述载体还可携带抗生素抗性基因。
[0216] 因此,各种实施方案针对通过整合多拷贝多核苷酸至植物基因组中来调节(例如,增加)NtABA4或NtNeSy或NtNCED2多核苷酸(或本文所述的其任意组合)表达水平的方法,所述方法包括:使用包含可操作地连接到NtABA4或NtNeSy或NtNCED2多核苷酸的启动子的表达载体来转化植物细胞宿主。由重组多核苷酸编码的NtABA4或NtNeSy或NtNCED2多肽可以是天然多肽、或可以是对细胞异源的。
[0217] 根据本发明,携带NtABA4或NtNeSy或NtNCED2(或本文所述的其任意组合)的突变等位基因的烟草植物可用于植物育种程序中以建立有用的系、品种和杂种。特别地,可使所述突变等位基因基因渗入至上述商业上重要的品种。因此,提供植物育种的方法,其包括将本文所述的突变植物、非天然存在植物或转基因植物与含有不同遗传同一性的植物进行杂交。所述方法可以进一步包括将后代植物与另一植物杂交,和任选地重复杂交直到获得具有期望的遗传性状或遗传背景的后代。这样的育种方法的一个目的是向其它品种、育种系、杂种或栽培品种,尤其是具有商业利益的那些,引入期望的遗传性状。另一个目的是便于在单一植物品种、系、杂种或栽培品种中叠加不同基因的遗传修饰。考虑种内和种间交配。从这样的杂交中所产生的后代植物也称为育种系,是本发明的非天然存在的植物的实例。
[0218] 在一个实施方案中,提供用于生产非天然存在烟草植物的方法,包括:(a)将突变或转基因烟草植物与第二烟草植物杂交以产生后代烟草种子;(b)在植物生长条件下使后代烟草种子生长以产生非天然存在烟草植物。所述方法可进一步包括:(c)将非天然存在烟草植物的上一代与自身或另一烟草植物杂交以产生后代烟草种子;(d)在植物生长条件下使步骤(c)的后代烟草种子生长,以产生额外的非天然存在的烟草植物;以及(e)重复多次(c)和(d)的杂交和生长步骤,以产生非天然存在烟草植物的其它世代。方法在步骤(a)之前可任选地包括提供亲本植物的步骤,亲本植物包括表征的遗传同一性且不同于突变或转基因植物。在一些实施方案中,根据育种程序,杂交和生长步骤重复从0到2次、从0到3次、从0到4次、从0到5次、从0到6次、从0到7次、从0到8次,从0到9次或从0到10次,以产生非天然存在烟草植物的世代。回交是这种方法的实例,其中后代与其亲本之一或与其亲本遗传相似的另一植物进行杂交,以便获得具有接近亲本之一的遗传同一性的下一代中的后代植物。用于植物育种(尤其是烟草植物育种)的技术,是公知的并可以用于本发明的方法。本发明还提供了通过这些方法产生的非天然存在的烟草植物。
[0219] 在本文所述方法的一些实施方案中,使用标准田间程序在田间评价获自育种和筛选变体基因的系。包括原始未诱变亲本的对照基因型包括在内,并且按随机的完全区组设计或其它适当的田间设计将入选者(entries)排布于田间。对于烟草,使用标准的农学操作,例如在烤制之前和期间,收获、称量和取样烟草用于化学和其它常见测试。进行数据的统计分析以确认所选择系与亲本系之间的相似性。任选进行所选植物的细胞遗传学分析来确认染色体互补性和染色体配对关系。
[0220] DNA指纹、单核苷酸多态性、微卫星标志物或类似技术可用在标志物辅助选择(MAS)的育种程序中,以便向其它如本文所述的烟草转移或培育基因的突变等位基因。例如,育种人员可以采用含有突变等位基因的基因型与农学期望基因型进行杂交而建立分离的群体。可使用本文所列出的技术之一,使用从基因组序列或其片段所开发的标志物来筛选F2中的植物或回交世代。鉴定为具有突变等位基因的植物可以回交或自花授粉以建立待筛选的第二群体。取决于预期遗传样式或所用MAS技术,有必要在每轮回交之前对所选择的植物进行自花授粉,以帮助鉴定期望的个体植物。可以重复进行回交或其它育种过程直到恢复轮回亲本的期望表型。
[0221] 根据本公开,在育种程序中,成功的杂交产生可育的F1植物。所选择的F1植物可以与亲本之一杂交,并且第一回交世代植物进行自花授粉以产生再次筛选变体基因表达的群体(例如,基因的无效版本)。重复回交、自花授粉和筛选的过程,例如至少4次,直到最终筛选产生可育并且与轮回亲本相当相似的植物。如果需要的话,这种植物进行自花授粉,并且随后再次筛选后代以确认植物显示出变体基因表达。在一些实施方案中,筛选F2代中植物群体的变体基因表达,例如,根据标准方法,如通过使用具有引物的PCR方法鉴定由于缺失基因而没有表达多肽的植物,所述引物基于针对包括本文所述NtABA4或NtNeSy或NtNCED2多核苷酸(或其任何组合)的多核苷酸的核苷酸序列信息。
[0222] 杂交烟草品种可通过以下产生:阻止第一品种的雌性亲本植物(即,种子亲本)的自花授粉、允许来自第二品种的雄性亲本植物的花粉使雌性亲本植物受精、并允许在雌性植物上形成F1杂种种子。可以通过在花发育早期阶段将花朵去雄来防止雌性植物的自花授粉。或者,可以使用雄性不育的形式防止在雌性亲本植物上的花粉形成。例如,通过细胞质雄性不育(CMS)或转基因雄性不育可以产生雄性不育,其中转基因抑制孢子和/或花粉形成、或自交不兼容。含有CMS的雌性亲本植物特别有用。在实施方案中,其中雌性亲本植物是CMS,从雄性可育植物收获花粉并人工施加到CMS雌性亲本植物的柱头,从而收获得到的F1种子。
[0223] 本文所述品种和系可用于形成单杂交烟草F1杂种。在这样的实施方案中,亲本品种的植物可以生长为基本均质的相邻群,以便雄性亲本植物对雌性亲本植物的天然交叉授粉。通过常规方式选择性收获在雌性亲本植物上形成的F1种子。还可大批种植两个亲本植物品种,并收获作为自花授粉结果的在雌性亲本上形成的F1杂种种子和在雄性亲本上形成的种子的混合。或者,可以进行三元杂交,其中单杂交F1杂种用作雌性亲本,并与不同的雄性亲本杂交。作为另一种选择,可以建立双杂交杂种,其中两个不同单杂交的F1后代进行自身自交。
[0224] 可以筛选或选择突变的、非天然存在的或转基因植物群体中具有期望性状或表型的那些群体成员。例如,可以对单一转化事件的后代群体进行筛选那些具有NtABA4或NtNeSy或NtNCED2或其所编码的多肽的期望表达或活性水平的植物。物理和生物化学的方法可用于鉴定表达或活性水平。这些包括用于检测多核苷酸的Southern分析或PCR扩增;用于检测RNA转录物的Northern印迹、S1 RNA酶保护、引物延伸或RT-PCR扩增;用于检测多肽和多核苷酸的酶或核酶活性的酶法分析;以及检测多肽的蛋白凝胶电泳、Western印迹、免疫沉淀和酶联免疫分析。其它技术如原位杂交、酶染色和免疫染色以及酶分析也可用于检测多肽或多核苷酸的存在或表达或活性。
[0225] 如本文所述的突变的、非天然存在的或转基因的植物细胞和植物包括一个或多个重组多核苷酸,例如一个或多个分离NtABA4或NtNeSy或NtNCED2多核苷酸(或者其两个或更多、或三个或更多的组合)、一个或多个多核苷酸构建体、一个或多个双链RNA、一个或多个缀合物或者一个或多个载体/表达载体。
[0226] 没有限制,本文所述的植物出于其它目的在表达或活性根据本发明已经被调节之前或之后可经过修饰。下列遗传修饰中的一个或更多个可以存在于突变的、非天然存在的或转基因植物中。在一个实施方案中,修饰参与重金属吸收或重金属转运的一个或多个基因,产生比未经修饰的对照植物或其部分具有更低重金属含量的植物或植物部分(如叶)。非限制性实例包括在多药物抗性相关蛋白家族、助阳离子扩散蛋白(CDF)家族、Zrt-、Irt样蛋白(ZIP)家族、阳离子交换蛋白(CAX)家族、铜转运蛋白(COPT)家族、重金属P型ATP酶家族(HMA,如WO2009074325中所述)、天然抗性相关的巨噬细胞蛋白(NRAMP)同源物家族、以及参与重金属(如镉)转运的ATP结合盒(ABC)转运蛋白家族中的基因。如本文所用,术语重金属包括过渡金属。在另一个实施方案中,参与含氮代谢中间体转化的一个或多个基因被修饰,产生这样的植物或植物部分(如叶),当加热所述植物时产生和对照植物或其部分相比更低水平的至少一种烟草特异性亚硝胺(例如4-(甲基亚硝胺)-1-(3-吡啶基)-1-丁酮、N-亚硝基去甲基烟碱、N-亚硝基新烟草碱和N-亚硝基假木贼碱)。可以被修饰的基因的非限制性实例包括编码烟碱去甲基化酶的基因,如CYP82E4、CYP82E5和CYP82E10,其参与烟碱向去甲基烟碱的转化,并描述在WO2006091194、WO2008070274、WO2009064771和PCT/US2011/021088中。
[0227] 其它修饰的实例包括除草剂耐受性,例如,草甘膦是许多广谱除草剂的活性成分。已经通过转移aroA基因(来自鼠伤寒沙门氏菌(Salmonella typhimurium)和大肠杆菌的草甘膦EPSP合成酶)开发了草甘膦抗性转基因植物。已经通过转化来自拟南芥的突变ALS(乙酰乳酸合成酶)基因制备了磺脲抗性植物。来自突变绿穗苋(Amaranthus hybridus)的光系统II的OB蛋白已经转移至植物中以产生阿特拉津(atrazine)抗性转基因植物;以及通过并入来自细菌肺炎克雷伯菌(Klebsiella pneumoniae)的bxn基因来产生溴苯腈抗性转基因植物。另一示例性的修饰产生对昆虫有抗性的植物。苏云金芽孢杆菌(Bacillus 
thuringiensis)(Bt)毒素可以提供延迟Bt抗性害虫出现的有效途径,如最近在西兰花中所示,其中渐增的(pyramided)cry1Ac和cry1C Bt基因控制的小菜蛾(diamondback moths)对单一蛋白的抗性,并显著延迟抗性昆虫的进化。另一个示例性修饰产生抵抗病原体(如病毒、细菌、真菌)引起的疾病的植物。工程改造了表达Xa21基因的植物(细菌性叶斑病抗性)以及表达Bt融合基因和几丁质酶基因的植物(三化螟抗性和鞘耐受)。另一个示例性的修饰产生改变的生殖能力,如雄性不育。另一个示例性的修饰产生耐受非生物胁迫(例如,干旱、温度、盐度)的植物,以及通过转移来自拟南芥的酰基甘油磷酸酶产生耐受转基因植物;编码参与甘露醇和山梨醇合成的甘露醇脱氢酶和山梨醇脱氢酶的基因改善抗旱性。另一个示例性的修饰产生这样的植物,其产生可具有在人体使用中良好免疫原性性质的蛋白质。例如,可使用能够产生在其N-聚糖中基本上缺失α-1,3-连接的岩藻糖残基、β-1,2-连接的木糖残基、或两者的蛋白质的植物。其它示例性修饰可以产生具有改善的贮藏蛋白和油的植物、具有增强的光合效率的植物、具有延长的货架期的植物、具有增强的碳水化合物含量的植物以及抗真菌的植物;编码参与生物碱生物合成的酶的植物。也可考虑这样的转基因植物,其中S-腺苷-L-甲硫氨酸(SAM)和/或胱硫醚γ-合酶(CGS)的表达已被调节。
[0228] 一个或更多这样的性状可基因渗入到来自另一个烟草栽培品种的突变的、非天然存在的或转基因的烟草植物,或可以直接转化至其中。可以通过本领域已知的任何植物育种方法实现将性状基因渗入到本发明的突变的、非天然存在的或转基因的烟草植物中,所述植物育种方法例如谱系育种、回交、双单倍体育种等(参见,Wernsman,E.A,和Rufty,R.C.1987.第17章Tobacco.669-698页,在Cultivar Development.Crop Species.W.H.Fehr(编),MacMillan Publishing Co,Inc.,New York,N.Y 761页中)。如上所述的基于分子生物学的技术,尤其是RFLP和微卫星标志物可用于这样的回交中来鉴定与轮回亲本具有最高遗传同一性程度的后代。这允许加快生产与轮回亲本具有至少90%、优选至少95%、更优选至少99%遗传同一性的烟草品种,以及更优选地与轮回亲本遗传上一致的烟草品种,并还包括来自供体亲本的基因渗入性状。这种遗传同一性的确定可以基于本领域已知的分子标志物。
[0229] 最后的回交世代可进行自交以便为待转移的核酸提供纯的育种后代。除了转移的性状(例如,一个或多个单基因性状)以外,所得植物一般具有基本上本发明的突变的、非天然存在的或转基因的烟草植物的全部形态和生理特性。精确的回交操作规程将取决于待改变的性状来确定合适的测试操作规程。虽然当被转移的性状是显性等位基因时回交方法简化了,也可以转移隐性等位基因。在这种情况下,可能有必要引入对后代的测试以确定是否已成功转移期望性状。
[0230] 各种实施方案提供突变植物、非天然存在的植物或转基因植物以及生物质,其中NtABA4或NtNeSy或NtNCED2多核苷酸(或其任何组合)的表达水平被调节用来在加热由所述植物制备的烤制烟草后形成的气雾中调节类胡萝卜素含量或β大马酮含量。
[0231] 这样的植物(特别是烟草植物)的部分,以及更特别的是烟草植物的叶片和中脉,可以并入或用于制造各种消费品,包括但不限于气雾形成材料、气雾形成装置、吸烟物品、可抽吸物品、无烟制品和烟草制品。气雾形成材料的实例包括但不限于烟草组合物、烟草、烟草提取物、烟丝、切丝填料、烤烟、膨胀烟草、均质烟草、再造烟草和烟斗烟草。吸烟物品和可抽吸物品是气雾形成装置的类型。吸烟物品或可抽吸物品的实例包括但不限于香烟、小雪茄和雪茄。无烟制品的实例包括咀嚼烟草和鼻烟。在某些气雾形成装置而不是燃烧装置中,烟草组合物或另一气雾形成材料被一个或多个电加热元件进行加热而产生气雾。在加热气雾形成装置的另一种类型中,通过将热从可燃性燃料元件或热源转移至物理上分开的可位于热源之内、周围或下游的气雾形成材料来产生气雾。无烟烟草制品和各种含烟草的气雾形成材料可包含任何形式的烟草,包括沉积在、混合于、包围有或组合有任何形式(比如片、膜、卡(tab)、泡沫、或珠)其它成分的干燥的颗粒、片、小粒、粉或匀浆。如本文所用,术语“烟”用来描述一种类型的气雾,其由吸烟物品如香烟、或通过气雾形成材料的燃烧而产生。
[0232] 在一个实施方案中,提供来自本文所述的突变、转基因以及非天然存在烟草植物的烤制材料。烤制绿色烟叶的工艺是本领域技术人员已知的,并包括而不限于空气烤制、火烤制、烤干和日光烤制。烤制绿色烟叶的工艺取决于收获的烟草的类型。例如,弗吉尼亚烤烟(轻型(bright))烟草通常是烤干的,白肋烟和某些深色株通常是空气烤制的,而烟斗烟草、咀嚼烟草和鼻烟通常是火烤制的。
[0233] 在另一实施方案中,描述了包括含有烟草的气雾形成材料的烟草制品,其包括来自本文所述的突变烟草植物、转基因烟草植物或非天然存在的烟草植物的叶,优选烤制的叶。本文所述的烟草制品可以是混合的烟草制品,其还可以包括未修饰的烟草。
[0234] 在这些可抽吸物品和无烟制品及其气雾中的%类胡萝卜素或β大马酮或者%类胡萝卜素和β大马酮,当与源自非突变、非天然存在的或非转基因的对应物的可消费产品相比时,可以是至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、以及100%或更多,例如
200%或300%或更高。
[0235] 在这些可抽吸物品和无烟制品及其气雾中的%类胡萝卜素或β大马酮或者%类胡萝卜素和β大马酮,当与源自非突变、非天然存在的或非转基因的对应物的可消费产品相比时,可以是低至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、以及100%。
[0236] 突变的、非天然存在的或转基因植物可以具有其它用途,例如在农业中。例如,本文所述的突变的、非天然存在的或转基因植物可用于制造动物饲料和人类食品。
[0237] 本公开还提供了用于生产种子的方法,所述方法包括:培养本文所述的突变植物、非天然存在的植物或转基因植物,并从培养的植物收集种子。来自本文所述植物的种子可以通过本领域中已知的方式进行调整处理并包装在包装材料中而形成制造的物品。包装材料如纸和布是本领域众所周知的。种子的包装可以带有标记,例如固定到包装材料的标签或标记、印刷在包装上的标记,其描述其中种子的性质。
[0238] 另一方面涉及产生β大马酮的方法,包括以下步骤:(a)提供本文所述的突变、非天然存在的或转基因植物的部分;生物质、种子或叶;或烟草制品;和(b)对其供热。
[0239] 用于植物基因分型以鉴定、选择或育种的组合物、方法和试剂盒可包括在多核苷酸样本中检测NtABA4或NtNeSy或NtNCED2多核苷酸(或者其两个或更多、或三个或更多的组合)存在的方式。因此,描述组合物,其包括一个或多个用于特异性扩增多核苷酸中的一个或多个的至少一部分的引物(例如,一个或多个引物或探针,其包含、由或基本上由如SEQ ID NO:3至5、10至12或14至16所示的序列所组成),以及用于进行扩增或检测的任选的一个或多个探针和任选的一种或多种试剂。
[0240] 因此,公开了基因特异性的寡核苷酸引物或探针,其包括对应于NtABA4或NtNeSy或NtNCED2多核苷酸的约10个或更多的连续多核苷酸。所述引物或探针可包括或由约15、20、25、30、40、45或50或更多连续多核苷酸组成,其杂交(例如,特异性地杂交)至NtABA4或NtNeSy或NtNCED2多核苷酸。在一些实施方案中,引物或探针可包括或由约10至50个连续核苷酸、约10至40个连续核苷酸、约10至30个连续核苷酸、或约15至30个连续核苷酸组成,其可用于基因鉴定的序列依赖性方法(例如,Southern杂交)或分离(例如,细菌克隆或噬菌体噬菌斑的原位杂交)或基因检测(例如,作为核酸扩增或检测中的一个或多个扩增引物)。可设计一个或多个特异性引物或探针并用于扩增或检测NtABA4或NtNeSy或NtNCED2多核苷酸的部分或全部。具体例如,两个引物可用于聚合酶链式反应规程中来扩增编码NtABA4或NtNeSy或NtNCED2核酸的核酸片段,如DNA或RNA。也可以使用源自NtABA4或NtNeSy或NtNCED2核酸序列的一个引物和杂交至NtABA4或NtNeSy或NtNCED2核酸序列(如NtABA4或NtNeSy或NtNCED2启动子序列、mRNA前体的3'端或源自载体的序列)的上游或下游序列的第二引物进行聚合酶链式反应。可用于多核苷酸体外扩增的热和等温技术的实例是本领域中公知的。样本可以是或可源自植物、植物细胞或植物材料、或者从本文所述的植物、植物细胞或植物材料所制得的或来源的烟草制品。
[0241] 因此,在另一方面中,还提供了检测样本中NtABA4或NtNeSy或NtNCED2多核苷酸(或者其两个或更多、或三个或更多的组合)的方法,包括步骤:(a)提供包括、或疑似包括多核苷酸的样本;(b)使所述样本接触多个引物之一、或一个或多个探针以便特异性检测多核苷酸的至少部分;以及(c)检测扩增产物的存在,其中扩增产物的存在指示着样本中存在所示多核苷酸。在另一方面,还提供使用一个或多个引物或探针来特异性地检测多核苷酸的至少部分。还提供了用于检测多核苷酸的至少部分的试剂盒,其包括用于特异性检测多核苷酸的至少部分的多个引物或探针中的一个。试剂盒可以包括用于多核苷酸扩增(如PCR)的试剂,或用于探针杂交检测技术(如Southern印迹、Northern印迹、原位杂交或微阵列)的试剂。试剂盒可以包括用于抗体结合检测技术(如Western印迹、ELISA、SELDI质谱法或测试条)的试剂。试剂盒可以包括用于DNA测序的试剂。试剂盒可以包括试剂和说明书用以确定类胡萝卜素(例如,叶黄素或β胡萝卜素;或叶黄素和β胡萝卜素)和β大马酮含量或β大马酮含量。试剂盒可以包括试剂和说明书用以确定类胡萝卜素(例如,叶黄素或β胡萝卜素;或叶黄素和β胡萝卜素)和β大马酮含量或β大马酮含量。
[0242] 在一些实施方案中,试剂盒可以包括用于所述方法的一个或多个的说明书。所述试剂盒可用于遗传同一性确定、系统发育研究、基因分型、单倍体分型、谱系分析或植物育种,特别是共显性评分。
[0243] 本发明还提供了对含有本文所述的多核苷酸的植物、植物细胞或植物材料进行基因分型的方法。基因分型提供了区分染色体对的同源物的方式,并可以用来区分在植物群体中的分离子(segregant)。分子标志物方法可用于系统发育研究、表征作物品种之间的遗传关系、鉴定杂交或体细胞杂种、定位影响单基因性状的染色体节段、图位克隆和定量遗传研究。基因分型的具体方法可以采用任意数目的分子标志物分析技术,包括扩增片段长度多态性(AFLP)。AFLP是由核苷酸序列变异性引起的扩增片段之间等位基因差异的产物。因此,本发明还提供了使用像AFLP分析这样的技术来跟踪一个或多个基因或核酸的分离、以及遗传连锁至这些基因或核酸的染色体序列的方式。
[0244] 在一个实施方案中,还提供了来自本文所述的突变、转基因的和非天然存在的植物的烤制材料。例如,烤制绿烟叶的工艺是本领域技术人员已知的,并包括而不限于空气烤制、火烤制、烤干和太阳烤制。烤制绿烟叶的工艺取决于收获的烟草的类型。例如,弗吉尼亚烤烟(轻型(bright))烟草通常是烤干的,白肋烟和某些深色株通常是空气烤制的,而烟斗烟草、咀嚼烟草和鼻烟通常是火烤制的。
[0245] 在另一个实施方案中,描述了烟草制品,其包括含有来自本文所述的突变、转基因的和非天然存在的植物的叶子(优选烤制的叶)的烟草制品、或通过本文所述的方法生产的烟草制品。本文所述的烟草制品还可以包括未修饰的烟草。
[0246] 在另一个实施方案中,描述了烟草制品,其含有来自本文所述的突变、转基因的和非天然存在的植物的植物材料,优选叶,例如烤制的叶。例如,所述植物材料可被添加到烟草制品内或外,因此通过燃烧释放期望的芳香。根据此实施方案的烟草制品可以甚至是未修饰的烟草或修饰的烟草。根据此实施方案的烟草制品可以甚至是源自突变、转基因的或非天然存在的植物,其在一个或多个基因而不是本文公开的基因上具有修饰。
[0247] 另一方面涉及分离多核苷酸,其包含、由或基本上由编码番茄红素β环化酶并与SEQ ID NO:8具有至少60%的序列同一性的序列所组成。另一方面涉及由此多核苷酸编码的分离多肽。另一方面涉及与SEQ ID NO:9具有至少87%的序列同一性的分离多肽。另一方面涉及含有分离多核苷酸的构建体、载体或表达载体。另一方面涉及突变、非天然存在的或转基因的植物细胞,其含有分离多核苷酸、多肽或构建体、载体或表达载体,以及其中番茄红素β环化酶的表达或活性与对照或野生型植物相比被调节,优选地,其中新黄质合酶或9-顺式-环氧类胡萝卜素双加氧酶;或者新黄质合酶和9-顺式-环氧类胡萝卜素双加氧酶的表达或活性也被调节。另一方面涉及含有这种植物细胞的突变、非天然存在的或转基因植物。另一方面涉及调节植物的类胡萝卜素含量的方法,包括步骤:(i)调节在植物中的番茄红素β环化酶的表达或活性,优选地,其中所述番茄红素β环化酶含有本文所述的多核苷酸序列或多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分中的类胡萝卜素含量;以及(iii)鉴定其中类胡萝卜素含量与对照植物相比已经改变的突变、非天然存在的或转基因植物,在所述对照植物中,番茄红素β环化酶的表达或活性未被调节。在一个实施方案中,番茄红素β环化酶或9-顺式-环氧类胡萝卜素双加氧酶;以及番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶的表达或活性也被调节。另一方面涉及通过这种方法获得的或可获得的突变、非天然存在的或转基因植物或源自其或可源自于其的植物材料。另一方面涉及突变、非天然存在的或转基因植物,其中番茄红素β环化酶的表达或其所编码的蛋白的活性已经增加;其中植物的绿叶叶黄素含量或β胡萝卜素含量或组合的含量比对照植物更高,所述对照植物中番茄红素β环化酶的表达或活性没有增加,优选地,其中:(i)植物的绿叶叶黄素含量是至少约17mg/100g(例如,至少约17.5mg/100g;至少约18mg/100g、至少约18.5mg/100g或至少约19mg/100g);以及(ii)植物的β胡萝卜素含量是至少约10mg/100g(例如,至少约10.5mg/100g;至少约11mg/100g、至少约11.5mg/100g或至少约12mg/100g)。另一方面涉及植物材料,其包括含有来自植物的细胞或组织的生物质、种子或叶。另一方面涉及烟草制品,其含有植物细胞、植物的至少部分或植物材料。
[0248] 另一方面涉及分离多核苷酸,其包含、由或基本上由编码9-顺式-环氧类胡萝卜素双加氧酶并与SEQ ID NO:13具有至少60%的序列同一性的序列所组成。另一方面涉及由此多核苷酸编码的分离多肽。另一方面涉及含有分离多核苷酸的构建体、载体或表达载体。另一方面涉及突变、非天然存在的或转基因的植物细胞,其含有分离多核苷酸、多肽或构建体、载体或表达载体,以及其中9-顺式-环氧类胡萝卜素双加氧酶的表达或活性与对照或野生型植物相比被调节,优选地,其中新黄质合酶或番茄红素β环化酶;或者新黄质合酶和番茄红素β环化酶的表达或活性也被调节。另一方面涉及含有植物细胞的突变、非天然存在的或转基因植物。另一方面涉及调节植物的类胡萝卜素含量的方法,包括步骤:(i)调节在植物中的9-顺式-环氧类胡萝卜素双加氧酶的表达或活性,优选地,其中9-顺式-环氧类胡萝卜素双加氧酶含有本文所述的多核苷酸序列或多肽序列;(ii)测量在获自步骤(i)的突变、非天然存在的或转基因植物的至少部分中的类胡萝卜素含量;以及(iii)鉴定其中类胡萝卜素含量与对照植物相比已经改变的突变、非天然存在的或转基因植物,在所述对照植物中,9-顺式-环氧类胡萝卜素双加氧酶的表达或活性未被调节。在一个实施方案中,新黄质合酶或番茄红素β环化酶;以及新黄质合酶和番茄红素β环化酶的表达或活性也被调节。另一方面涉及通过这种方法获得的或可获得的突变、非天然存在的或转基因植物或源自其或可源自于其的植物材料。另一方面涉及突变、非天然存在的或转基因植物,其中9-顺式-环氧类胡萝卜素双加氧酶的表达或其所编码的蛋白的活性已经增加;其中植物的绿叶叶黄素含量或β胡萝卜素含量或组合含量比对照植物更高,所述对照植物中9-顺式-环氧类胡萝卜素双加氧酶的表达或活性没有增加,优选地,其中:(i)植物的绿叶叶黄素含量是至少约15mg/100g(例如,至少约15.5mg/100g;至少约16mg/100g、至少约16.5mg/100g或至少约17mg/100g);以及(ii)植物的β胡萝卜素含量是至少约11mg/100g(例如,至少约11.5mg/100g;至少约12mg/100g、至少约12.5mg/100g或至少约13mg/100g)。另一方面涉及植物材料,其包括含有来自植物的细胞或组织的生物质、种子或叶。另一方面涉及烟草制品,其含有植物细胞、至少部分的植物或植物材料。
[0249] 将于下列实施例中进一步描述本发明,提供下列实施例以更详细地描述本发明。这些实施例,其阐述用于实施本发明的当前设想的优选方式,是意欲阐明而非限制本发明。
[0250] 实施例
[0251] 实施例1:克隆来自红花烟草的ABA4
[0252] 异位表达与ABA4同源的红花烟草编码序列。所述基因基于与拟南芥(A.thaliana)ABA4的序列同源性命名为红花烟草ABA4(NtABA4)。NtABA4是属于催化从紫黄质形成反式-新黄质的新黄质合酶的延伸“家族”的基因。通过与AtABA4类比以及根据WoLFPSORT分析,所述基因产物很可能定位于质体。使用叶K326 cDNA作为PCR模板,鉴定并扩增出663kb的全长编码序列,将所述全长编码序列克隆入pENTR Gateway载体(Invitrogen)中,测序并转移到pK2WG7(Gateway载体获自佛兰德斯校际生物技术研究所(Flanders Interuniversity Institute for Biotechnology),根特,比利时)以便在红花烟草中组成型表达。NtABA4的核苷酸和氨基酸序列分别如SEQ ID No.1和SEQ ID NO:2、以及在图2中所示。NtABA4在氨基酸水平上显示与拟南芥蛋白AtABA4 Atlg6708065%的同一性。以希克斯阔叶的gDNA作为模板开始PCR扩增,使我们鉴定1808bp的NtABA4同源物。通过比较cDNA和gDNA序列,推导出的基因结构证明NtABA4具有4个内含子和5个外显子(图3A)。在K326和希克斯BL NtABA4同种型之间存在差异(图3B)。来自希克斯阔叶的NtABA4氨基酸序列与K326序列具有97%的同一性,其是由于6个氨基酸的差异以及在位置9上的一个缺失的丝氨酸(图3C)。如表达序列标签比较所示,NtABA4基因组序列不是假基因,因为已经在来自SNN烟草的NCBI冷应激序列文库中鉴定出在N末端具有相同特征的表达序列标签(AM824569)。对于烟草工程而言,NtABA4 K326 cDNA序列在强大的病毒CaMV35S启动子的控制下被使用并组成型表达在TN90中。
[0253] 实施例2:克隆来自红花烟草的新黄质合酶(NeSy)
[0254] NeSy(番茄红素β环化酶)如ABA4,催化从紫黄质形成新黄质(顺式-新黄质)(参见图1)。所述酶有可能定位在质体中(基于与拟南芥NeSy的同源性)。使用在TGI数据库中可用的序列开始,从K326 RNA扩增1482 kb的全长编码序列(参见图4),将所述全长编码序列克隆入pENTR Gateway载体(Invitrogen)中,测序并亚克隆到Gateway载体pK2WG7(获自佛兰德斯校际生物技术研究所,根特,比利时)以便过表达。鉴定出BAC克隆。在此BAC克隆上存在的基因组序列显示NtNeSy在基因组结构上没有内含子,以及在烟草中很可能是单拷贝基因。与35S::NtABA4植物相比,NtNeSy K326 cDNA在CaMV35S启动子的控制下组成型表达在TN90中。
[0255] 实施例3:克隆来自红花烟草的9-顺式-环氧类胡萝卜素双加氧酶(CED2)
[0256] CED2(9-顺式-环氧类胡萝卜素双加氧酶)催化在C25-丙二烯-脱辅基醛和黄质素中的顺式-新黄质的切割(参见图1)。NtCED2与拟南芥AtNCED4共享强同源性,其存在于质体球中(plastoglobule)以及可能切割叶的叶绿体中的新黄质。在TGI数据库中鉴定出烟草cDNA片段。从此,将部分序列(407bp)克隆入pENTR Gateway载体(Invitrogen)中,测序并亚克隆到Gateway载体pK7GWIWG2(II),获自佛兰德斯校际生物技术研究所,根特,比利时。在这种情况下,NtCED2片段在烟草植物中作为RNA发夹表达,其诱导对应內源NtCED2转录物的基因沉默(图5)。
[0257] 实施例4:工程化具有NtABA4 cDNA的TN90白肋烟草
[0258] 生成携带NtABA4编码序列(图2)的双元质粒pK2WG7以便在红花烟草中过表达此基因。此载体包括位于转基因上游的花椰菜花叶病毒CaMV 35S启动子以驱动其在植物的全部组织中的组成型表达,以及此载体包括用于在琼脂平板上(100mg/ml)卡那霉素(抗生素)筛选转基因红花烟草系的kan/nptll基因。通过根瘤农杆菌(Agrobacterium tumefaciens)采用经典的叶盘转化过程用此构建体转化白肋烟草TN90。从愈伤组织中,再生出个体系并以卡那霉素选择。然后,通过对基因组DNA使用在35S启动子上的一个引物(5'-GAGCATCGTGGAAAAAGAAGAC)和在NtABA4编码序列中的一个引物进行PCR,通过RT-PCR使用特异的NtABA4引物特异性地检测NtABA4的转基因拷贝,对T0过表达系进行监测。收集T1种子,使其重新生长在含卡那霉素的琼脂平板上,并确切地如对T0苗一样进行监测。在gDNA上的PCR显示含有NtABA4 cDNA的T-DNA插入在选择系的基因组中,RT-PCR分析允许鉴定其中所述基因的过表达的三个系。随后,在田间培养前,将卡那霉素抗性植物种植在漂浮的托盘中。三个NtABA4系(NtABA4-1、NtABA-2和NtABA-3)、对照载体(VC,空pK7GWIWG2(II))和TN90 US背景烟草的二十个植物以20个植物的4次重复进行培养。移栽到田间(打顶(topping)后
36天)后三个月,从在小块试验田(subplot)所述20个植物中对10个相同植物取样中秆(mid-stalk)位置的一片叶代表一个实验重复。这些叶(“绿叶”)被立即存储在干冰中并冻干。在田间两个月后,35S::NtABA4植物没有表现出与TN90和VC植物任何视觉表型不同。在相同系中,植物高和叶绿素含量分析证明转基因的35S::NtABA4系类似于TN90和VC对照,表明NtABA4过表达对表型性质没有可见的影响。根据白肋农业实践,取样所述每个小块试验田和系的10个选择植物中剩余叶材料,并烤制。烤制后,取样中秆位置的3个叶。为监测在3个转基因系(NtABA4-1、NtABA4-2和NtABA4-3)中增加NtABA4表达的效果,研磨“绿叶”和“烤制叶”并经类胡萝卜素分析。
[0259] 实施例5:在35S::NtABA4转基因系的绿色和烤制叶中类胡萝卜素分析
[0260] 由于技术的限制,在“绿叶”的类胡萝卜素的量化分析中不可能对所有的叶黄素、特别是对新黄质定量(在红花烟草中的低浓度和不良的分析分离)。据推测,在TN90、VC、NtABA4-1、NtABA4-2以及Nt-ABA4-3中的新黄质的池(基于半定量分析,数据未示出)与叶黄素(以及在较小程度上还有β胡萝卜素)含量具有类似趋势。后两者色素被用作其它类胡萝卜素(叶黄素)在绿叶中浓度的代表性测量。与此相反,在衰老和烤制叶中不考虑这样的假设,因为已知新黄质池迅速和完全降解。采用经典的HPLC方法和可视检测执行类胡萝卜素分析。在NtABA4过表达系中显示,在NtABA4-2和NtABA4-3系中的叶黄素与野生型和载体对照相比时显著升高。NtABA4过表达导致在NtABA4-2和NtABA4-3系中叶的叶黄素与TN90和载体对照背景系相比分别增加30%和26%。此外,在NtABA4系中的β胡萝卜素与野生型TN90相比也显著更高(大约高15%)。这些数据表明,过表达NtABA4在类胡萝卜素含量上具有整体升高的效果。在转基因植物系内类胡萝卜素的升高是显著的(P<0.05,T检验)。
[0261] 在烤制叶中的类胡萝卜素分析显示与绿叶相比在叶黄素和β胡萝卜素池中的整体减少。在所有野生型、载体对照和35S::NtABA4转基因系中存在于绿样本中的87至95%的叶黄素和β胡萝卜素在烤制期间被降解。这表明,这些类胡萝卜素在烤制期间受到活性酶促或化学修饰。每个烤制样本组内大变化的存在表明,与绿叶中的类胡萝卜素合成相比,在烤制期间类胡萝卜素分解代谢是一个更少“受控制的”和均质的过程。T-检验分析表明,当与以下系相比时,叶黄素含量显著不同:NtABA4-2比TN90(P<0.001I)和载体对照(P<0.05)更高;载体对照比TN90(P<0.05)更高,以及NtABA4-1比TN90(P<0.05)更高。与TN90相比,在载体对照(P<0.05)和NtABA4-1(P<0.01Ⅰ)中的β胡萝卜素含量更高。
[0262] 实施例6:选择的35S::NeSy和NtCED2-干扰RNA系的类胡萝卜素分析
[0263] 如对35S::NtABA4所描述的,基于基因分型和RT-PCR选择35S::NtNeSy和NtNCED2干扰RNA转化系。结果是,鉴定出2个35S::NtNeSy和3个NtNCED2干扰RNA系、并在相同时间在相同田中以4个重复种植。在NCED2干扰RNA和35S::NtNeSy系中确定主要类胡萝卜素(叶黄素和β胡萝卜素)的含量。NCED2干扰RNA和35S::NtNeSy系两者显示在绿叶中在主要类胡萝卜素上的增加,其确认这两个候选基因用于植物转化影响在烟草叶中的类胡萝卜素代谢。然而,当比较所有选择的转基因系时,NtABA4过表达似乎最有效地实现绿叶中的总类胡萝卜素增加。
[0264] 收获的叶材料进行空气烤制(air-curing),以证实所观察到的类胡萝卜素变化导致在各自气雾中产生的β大马酮的改变量。为选择最有前途的烤制样本,选取具有在绿叶中在叶黄素、β胡萝卜素和新黄质中最剧烈变化(半定量数据)的样本/系。这些样本/系分别是NtNeSy-I_2、NtABA4-2_2、和NtNCED2干扰RNA-I-4(图6)。此处假设的是,积聚在绿叶中的新黄质或可能其它类胡萝卜素在烤制叶中转换为β大马酮-葡糖苷或其它β大马酮的前体,然后通过加热将其释放。
[0265] 实施例7:在选择的转基因系中的β大马酮分析
[0266] 为分析在加热TN90-4(对照)、NtNeSy-I_2、NtABA4-2_2、和NtNCED2-干扰RNA-I_4样本系的烤制烟草后形成的气雾中的β大马酮含量,生成来自浸渍烟草切丝填料的气雾。所使用的吸烟平台是具有NHS热源(54W)的吸烟模拟器,包括每两秒12次吹吸(Puff)的策略。吸烟之前,切断烟草烤制的叶片并用20%甘油浸渍。通过加热浸渍烤制烟草(100mg,3个完全重复)产生的气雾被困在Cambridge滤器PAD中。将PAD引入到含有10ml水/乙醇(9/1,v/v)的小瓶中。通过搅拌棒Sorbtive提取方法(描述在Lancas等人(2009)J.Sep.Sci.32,813-
824)提取β大马酮。此方法允许提取对吸附相显示亲和力的化学化合物。在GC-MS进样器中热解搅拌棒以及分析β大马酮。与TN90(对照)相比,NtABA4-2_2样本显示出在气雾中β大马酮68%的增加(图7)。这个差异是统计学相关的(P<0.01,T检验)。这些结果表明,通过NtABA4异位表达来增强在烤制叶中β大马酮前体的池,而两个其它靶基因NtNeSy(过表达)和NtNCED2(干扰RNA沉默)的效果类似TN90对照。因此,在烟草叶中过表达NtABA4而不工程化NtNeSy或NtNCED可能导致升高的β大马酮前体生产。
[0267] 本文引用或描述的任何出版物提供本申请提交日之前公开的有关信息。本文的陈述不能被解释为承认本发明人无权早于这种公开。在以上说明书中提到的所有出版物通过参考并入本文。本发明的各种改变和变化,在不脱离本发明的范围和精神时,对于本领域技术人员是显而易见的。虽然本发明已结合具体的优选实施方案进行了描述,应当理解,所要求的本发明不应该被不适当地限制于这种具体的实施方案。实际上,用于实施本发明的所述形式的各种改变,其对于细胞、分子和植物生物学或相关领域的技术人员是显而易见的,其意欲在如下权利要求的范围内。
[0268] 序列
[0269] SEQ ID NO:1(来自红花烟草K326的ABA4的核苷酸序列)
[0270]atgtcactttcttttaattcttcttgtttttgttcccctcttaataagtcaagtatggacttctcttcttcttgcttctgctactctcacatctcactcaagatgaactgcagggcacctgccttgatgtccaggagaaaccagcctacctcttatacttttctagaaaagaattctgacattgtaaatcaacaagtagtggaattcggaaccaagtttagaagtggagcgaatttcctgggaggatcaagagtcattattcaacttaatcttcaaacaactcttgctcaaagaaaaagctccagggtgactgcttgtttgccaagttctgaaattgcttctactgttttcacactgggaacagcagcagttcttccgttttatactctcatggttgtggctcctaaaactgaacttaccagaaaagtgatgaaaagcagcatacccaatattggctttggacttctgtacacatatctagtatacctctcttggacaccagatacagttcggctgatgtttgctagtaaatactggcttccggagctgcccggcataactaagatgttctccaacgagatgacattagcttctgcatggattcacttgttggctgtagatctttttgctgcaaggcaggtttatcatgatggattgcaaaatgatattgaaacccgccattctgtgtctctgtgcttgctgttttgccccgtcggaattgttactcacttcatcaccaaagctctagccagtagcccagaaaagagacagcataggactcattaa
[0271] SEQ ID NO:2(来自红花烟草K326的ABA4的氨基酸序列)
[0272] MSLSFNSSCFCSPLNKSSMDFSSSCFCYSHISLKMNCRAPALMSRRNQPTSYTFLEKNSDIVNQQVVEFGTKFRSGANFLGGSRVIIQLNLQTTLAQRKSSRVTACLPSSEIASTVFTLGTAAVLPFYTLMVVAPKTELTRKVMKSSIPNIGFGLLYTYLVYLSWTPDTVRLMFASKYWLPELPGITKMFSNEMTLASAWIHLLAVDLFAARQVYHDGLQNDIETRHSVSLCLLFCPVGIVTHFITKALASSPEKRQHRTH
[0273] SEQ ID NO:3(用于扩增来自红花烟草K326的NtABA4的正向引物的核苷酸序列,在引物中具有用于克隆的cacc序列)
[0274] caccatgtcactttcttttaattcttcttgt
[0275] SEQ ID NO:4(用于扩增来自红花烟草K326的NtABA4的正向引物的核苷酸序列,在引物中不具有用于克隆的cacc序列)
[0276] atgtcactttcttttaattcttcttgt
[0277] SEQ ID NO:5(用于扩增来自红花烟草K326的NtABA4的反向引物的核苷酸序列)[0278] ttaatgagtcctatgctgtctcttttc
[0279] SEQ ID NO:6(来自红花烟草希克斯阔叶的ABA4的核苷酸序列)
[0280]atgtcactttcttttaattcttcttcttgtttttgttcccctcttaataagtcaagtatggacttctcttcttcttgcttctgctactctcacatctcactcaagatgaactgcagggcacctgccttgatgtccaggagaaaccagcctacctcttatacttttctagaaaagaattctgacattgtaaatcaacgagtagtggaattcagaaccaagtttagaagtggagcgaatttcctgggaggatcaagagtcattattcaacttaatcttcaaacaactcttgctcaaagaaaaagctccagggtgactgcttgtttgccaagttctgaaattgcttctactgttttcacactgggaacagcagcggttcttccgttttatacactcatggtagtggctcctaaagctgaacttaccagaaaagtgatgaaaagcagcataccctatattggctttggacttctgtacacatatctagtatacctctcttggacaccagatacagttcggctgatgtttgctagtaaatactggcttccggagctgcccggcataactaagatgttctccaacgagatgacattagcttctgcatggattcacttgttggccgtagatctttttgctgcaaggcaggtttatcatgatggattgcaaaatgatattgaaacccgccattctgtgtctctgtgcttgctgttttgccccttcggaattgttactcacttcatcaccaaagctctaaccagtagcccagaaaagagacagcataggactcattaa
[0281] SEO ID NO:7(来自红花烟草希克斯阔叶的ABA4的氨基酸序列)
[0282] MSLSFNSSSCFCSPLNKSSMDFSSSCFCYSHISLKMNCRAPALMSRRNQPTSYTFLEKNSDIVNQRVVEFRTKFRSGANFLGGSRVIIQLNLQTTLAQRKSSRVTACLPSSEIASTVFTLGTAAVLPFYTLMVVAPKAELTRKVMKSSIPYIGFGLLYTYLVYLSWTPDTVRLMFASKYWLPELPGITKMFSNEMTLASAWIHLLAVDLFAARQVYHDGLQNDIETRHSVSLCLLFCPFGIVTHFITKALTSSPEKRQHRTH
[0283] SEQ ID NO:8(来自红花烟草K326的NeSy的核苷酸序列)
[0284]atggaaactcttctcaaaccttttccatctcctttacttttcactcctacacctcacaggtctatttttcaactgaattctacttttctgaatccaaccacccagaacttttcaagaaaagttcatcgcagaaacaaaagtagtagtaacaaattttgtagctttcttgacttagcacccacatcaaaaccagagtctttagatgttgacatctcatgggttgatcctaattcgggccgggctctattcgacgtgatcatcatcggagctggtcctgcgggcctccggctagctgagcaagtatcaagatatggtattaaggtatgttgtgttgacccttcaccactttccatgtggccaaataattatggtgtttgggttgatgagtttgagaagttaggattggaagattgtttagatcataagtggcctatgacttgtgttcatataaatgataacaagactaagtatttgggaagaccatatggtagagtcagtagaaaaaagttgaagttgaaattgttgaatagttgtgttgataatggagggaagttttataaagccaaggtttggaaagtggagcatgaagaatttgagtcttcagttgtttgtgatgatggtaggaagataaggggtagtttgattgtagatgcaagtggttttgctagtccttttatagaatatgacaagccaagaaaccatggttatcaaatagctcatgggattttagcacaagtggataatcatccatttgatttggataaaatggtgcttatggattggagggattctcatctgggaaatgagccatatttgagggtgaacaatactaaagaaccaacattcttgtatgtgatgccatttgataggaatttggtattcttggaagagacttctttggtgagtcggcctgtgctatcgtatagggaagtgaaaaataggatggtggcaaggttaaggcatttggggatcaaagtgacaagtgttattgaggatgagaaatgtgtgatccccatgggaggaccacttccgcggatccctcaaaatgttatggcaattggtggaaattcagggatagttcatccatcgacagggtacatggtggctcggagcatggcattggcaccagttttggctgaggccattgctgagagcctcggcacaaccagaatgataagaggatctccactttaccataaagtttggaatggtttgtggcctctagagagaagaagtgtgagagaatgttactcttttgggatggagactttgttgaagcttgatttgaaagggactaggagattgtttgatgctttctttgatcttgatcccaaatactggcaagggttcctttcctcaaggttgtctgtcaaagaacttgctatgcttagcttgtacctttttgggcatgcctcaaatttggctaggttggatattgttacaaaatgcccggtgcccttggttaaaatgatggaaatctag
[0285] SEQ ID NO:9(来自红花烟草K326的NeSy的氨基酸序列)
[0286] METLLKPFPSPLLFTPTPHRSIFQLNSTFLNPTTQNFSRKVHRRNKSSSNKFCSFLDLAPTSKPESLDVDISWVDPNSGRALFDVIIIGAGPAGLRLAEQVSRYGIKVCCVDPSPLSMWPNNYGVWVDEFEKLGLEDCLDHKWPMTCVHINDNKTKYLGRPYGRVSRKKLKLKLLNSCVDNGGKFYKAKVWKVEHEEFESSVVCDDGRKIRGSLIVDASGFASPFIEYDKPRNHGYQIAHGILAQVDNHPFDLDKMVLMDWRDSHLGNEPYLRVNNTKEPTFLYVMPFDRNLVFLEETSLVSRPVLSYREVKNRMVARLRHLGIKVTSVIEDEKCVIPMGGPLPRIPQNVMAIGGNSGIVHPSTGYMVARSMALAPVLAEAIAESLGTTRMIRGSPLYHKVWNGLWPLERRSVRECYSFGMETLLKLDLKGTRRLFDAFFDLDPKYWQGFLSSRLSVKELAMLSLYLFGHASNLARLDIVTKCPVPLVKMMEI
[0287] SEQ ID NO:10(用于扩增来自红花烟草K326的NeSy的正向引物的核苷酸序列,在引物中具有用于克隆的cacc序列)
[0288] caccatggaaactcttctcaaaccttttc
[0289] SEQ ID NO:11(用于扩增来自红花烟草K326的NeSy的正向引物的核苷酸序列,在引物中不具有用于克隆的cacc序列)
[0290] atggaaactcttctcaaaccttttc
[0291] SEQ ID NO:12(用于扩增来自红花烟草K326的NeSy的反向引物的核苷酸序列)[0292] ctagatttccatcattttaaccaag
[0293] SEQ ID NO:13(来自红花烟草的NCED2的核苷酸序列)
[0294]acacaagcttggctttattcggaggcaaactattcgctcttggtgaatctgatttaccgtatgcagtaaaattagccccagatggtgatattattaccctcggccgttacgatttcgacggaaaacttttcatgagcatgacggcacatcccaaaattgacccagatactaacgaggcttttgctttccgttacggtccaatgcctccttttttaacttactttagaatcgaaccaaatggtacaaaaacaccagacgtgccaatattttctatgacacgtccgtcatttcttcatgactttgcaattacaaataaatttgcgatattctcggacatacaaataggaatgaacccacttgagttcatcaccggtggttcaccggtgagttcagactcggggaaaatc
[0295] SEQ ID NO:14(用于扩增来自红花烟草的NCED2的正向引物的核苷酸序列,在引物中具有用于克隆的cacc序列)
[0296] caccacacaagcttggctttattcg
[0297] SEQ ID NO:15(用于扩增来自红花烟草的NCED2的正向引物的核苷酸序列,在引物中不具有用于克隆的cacc序列)
[0298] acacaagcttggctttattcg
[0299] SEQ ID NO:16(用于扩增来自红花烟草的NCED2的反向引物的核苷酸序列)[0300] gattttccccgagtctgaact。