用于增强植物中组成型基因表达的调节性核酸分子转让专利

申请号 : CN201510543571.4

文献号 : CN105132425B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : J·M·库恩L·P·洛亚尔M·西伯特E·杜维尼哥

申请人 : 巴斯夫植物科学有限公司

摘要 :

本发明属于植物分子生物学领域并且提供了用于产生高表达的组成型启动子的方法和产生具有增强的核酸组成型表达的植物的方法,其中将增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或导入植物中。

权利要求 :

1.用于产生高表达组成型植物启动子的方法,包括将一个或多个增强核酸表达的核酸(NEENA)分子与启动子功能性连接,其中所述增强核酸表达的核酸(NEENA)分子相对于所述启动子是异源的,所述增强核酸表达的核酸的核苷酸序列为SEQ ID NO:2。

2.用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强的组成型表达,所述方法包括步骤a)将一个或多个SEQ ID NO:2所示的NEENA导入所述植物或其部分;

b)将所述一个或多个NEENA与组成型启动子和与处在所述组成型启动子控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。

3.根据权利要求1和2任一项所述的方法,包括步骤

a)将一个或多个SEQ ID NO:2所示的NEENA导入植物或其部分,和b)将所述一个或多个NEENA整合至所述植物或其部分的基因组中,从而所述一个或多个NEENA与相对所述一个或多个NEENA为异源的内源组成型表达的核酸功能性连接,和任选地c)从所述转化的细胞再生出包含所述一个或多个NEENA的植物或其部分。

4.根据权利要求1至2任一项所述的方法,包括步骤

a)提供表达构建体,所述表达构建体包含一个或多个SEQ ID NO:2所示的NEENA,所述NEENA功能性连接到组成型启动子和一个或多个核酸分子,所述一个或多个核酸分子与所述一个或多个NEENA为异源的并处在所述组成型启动子控制下,和b)将包含所述一个或多个NEENA的所述表达构建体整合至所述植物或其部分的基因组中,和任选地c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。

5.根据权利要求1至2任一项所述的方法,其中所述植物是单子叶或双子叶植物。

6.根据权利要求1至2任一项所述的方法,其中所述一个或多个NEENA与靠近所述异源核酸分子的转录起始位点的组成型启动子功能性连接。

7.根据权利要求6所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点2500bp或更少的组成型启动子功能性连接。

8.根据权利要求6所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点2000bp或更少的组成型启动子功能性连接。

9.根据权利要求6所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点1500bp或更少的组成型启动子功能性连接。

10.根据权利要求6所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点1000bp或更少的组成型启动子功能性连接。

11.根据权利要求6所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点500bp或更少的组成型启动子功能性连接。

12.根据权利要求1至2任一项所述的方法,其中所述一个或多个NEENA与核酸分子的翻译起始位点上游的组成型启动子功能性连接,所述核酸分子的表达处在所述组成型启动子的控制下。

13.根据权利要求1至2任一项所述的方法,其中所述一个或多个NEENA与核酸分子的5’UTR内部的组成型启动子功能性连接,所述核酸分子的表达处在所述组成型启动子的控制下。

14.包含一个或多个NEENA的重组表达构建体,所述的NEENA的核苷酸序列为SEQ ID NO:2。

15.根据权利要求14所述的包含一个或多个SEQ ID NO:2所示的NEENA的重组表达构建体,所述NEENA功能性连接到一个或多个组成型启动子和一个或多个表达的核酸分子,所述一个或多个表达的核酸分子与所述一个或多个NEENA为异源的。

16.重组表达载体,其包含根据权利要求14或15所述的一个或多个重组表达构建体。

17.转基因细菌或真菌细胞,其包含权利要求16的重组表达载体或权利要求14或15的重组表达构建体。

18.衍生自根据权利要求17所述的转基因细菌或真菌细胞的转基因细胞培养物,其包含权利要求1所定义的所述异源NEENA、权利要求14或15的重组表达构建体或权利要求16的重组载体。

19.权利要求1中所定义的NEENA或权利要求14至16中任一项所定义的重组构建体或重组载体的用途,用于增强在植物或其部分中的表达。

20.权利要求18中所述的转基因细胞培养物的用途,用于食物、动物饲料、种子或精细化学品的生产。

21.权利要求20的用途,用于药物的生产。

说明书 :

用于增强植物中组成型基因表达的调节性核酸分子

[0001] 本申请是申请日为2010年8月11日、发明名称为“用于增强植物中组成型基因表达的调节性核酸分子”的中国专利申请201080038708.6(国际申请号PCT/EP2010/061659)的分案申请。
[0002] 发明描述
[0003] 本发明属于植物分子生物学领域并且提供了用于产生高表达的组成型启动子和产生具有增强的核酸组成型表达的植物的方法,其中将增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或导入植物中。
[0004] 转基因在植物中的表达强烈地受多种外部和内部因素影响,从而导致变动和不可预测水平的转基因表达。经常不得不产生大量的转化体并进行分析,以鉴定具有合乎需要的表达强度的株系。由于转化并筛选表达强度合乎需要的株系是昂贵和耗费人力的,故需要一个或多个转基因在植物中高表达。当不得不在转基因植物中协调表达几个基因以实现特定效应时,鉴于必须鉴定其中每个基因均强烈表达的植物,这个问题尤其严重。
[0005] 例如,取决于构建体设计和各个转化事件中T-DNA插入基因座的位置效应,转基因的表达可以显著地变动。强启动子可以部分地克服这些难题。然而,显示强烈表达同时特异性合乎需要的合适启动子的可获得性经常是有限的。为了确保可获得具有合乎需要的表达特异性的充足启动子,额外启动子的鉴定和表征可能有助于弥合这种缺口。然而,具有相应特异性和强度的启动子的天然可获得性和费时的候选启动子表征阻碍了合适的新启动子的鉴定。
[0006] 为了克服这些难题,已经显示多样的遗传元件和/或基序积极地影响基因表达。在它们当中,已经认可一些内含子作为具有改善基因表达的强大潜能的遗传元件。虽然机制大多未知,但是已经显示一些内含子积极地影响成熟mRNA的稳态量,这可能通过增强转录活性、改善mRNA成熟、增强胞核mRNA输出和/或改善翻译起始来影响(例如Huang和Gorman,1990;Le Hir等人,2003;Nott等人,2004)。由于显示仅所选的内含子增加表达,故剪接本身很可能解释不了观察到的效果。
[0007] 将内含子与启动子功能性连接时观察到的基因表达增加称作内含子介导的基因表达增强(IME)并且已经在多种单子叶植物(例如Callis等人,1987;Vasil等人,1989;Bruce等人,1990;Lu等人,2008)和双子叶植物(例如Chung等人,2006;Kim等人,2006;Rose等人,2008)得到显示。在这个方面,显示内含子相对于翻译起始位点(ATG)的位置对于内含子介导的基因表达增强至关重要(Rose等人,2004)。
[0008] 继一些内含子增强基因表达的潜能之后,显示这些内含子还在植物中于其原有核苷酸环境下影响组织特异性。发现报道基因表达依赖于含有多达2个内含子的基因组区域的存在(Sieburth等人,1997;Wang等人,2004)。也已经报道5’UTR内含子对启动子元件的恰当功能性是重要的,这可能归因于内含子中存在的组织特异性基因控制元件(Fu等人,1995a;Fu等人,1995b;Vitale等人,2003;Kim等人,2006)。然而,这些研究还显示内含子与异源启动子的组合可能对基因表达的强度和/或特异性产生强烈的不利影响(Vitale等人,
2003;Kim等人,2006、WO2006/003186、WO2007/098042)。例如,花椰菜花叶病毒CaMV35S组成型强启动子因与芝麻SeFAD25’UTR内含子组合而不利地影响表达(Kim等人,2006)。与这些观察结果相反,一些文献显示通过IME增强核酸的表达而不影响相应启动子的组织特异性(Schünmann等人,2004)。
[0009] 在本申请中,描述了与组成型启动子功能性连接时增强所述启动子的表达同时不影响其特异性的其他核酸分子。在本申请中将这些核酸分子描述为“增强核酸表达的核酸”(NEENA)。内含子具有从分别的前mRNA剪接下来的内在特征。与其相反,本申请中即将陈述的核酸不必要一定包含于mRNA中,或如果存在于mRNA中,没有必要一定从mRNA中剪接下来,以增强源自与NEENA功能性连接的启动子的表达。
[0010] 发明详述
[0011] 本发明的第一实施方案包括用于产生高表达的组成型启动子的方法,所述高表达的组成型启动子包含与启动子功能性连接的一个或多个增强核酸表达的核酸(NEENA)分子,所述方法包括
[0012] i)具有如SEQ ID NO:1至19、优选地SEQ ID NO:1至9的任一者中所定义序列的核酸分子,或
[0013] ii)具有下述序列的核酸分子,所述序列与如SEQ ID NO:1至19、优选地SEQ ID NO:1至9所定义的任一序列具有80%或更大的同一性,优选地,该同一性是85%或更大,更优选地,该同一性是90%或更大,甚至更优选地,该同一性是95%或更大、96%或更大、97%或更大、98%或更大或99%或更大,在最优选的实施方案中,该同一性相对于如SEQ ID NO:1至19、优选地SEQ ID NO:1至9所定义的任一序列是100%,或
[0014] iii)i)或ii)的核酸分子的100个或更多连续碱基、优选地150个或更多连续碱基、更优选地200个或更多连续碱基、或甚至更优选地250个或更多连续碱基的片段,所述片段具有如具备SEQ ID NO:1至19、优选地SEQ ID NO:1至9所定义任一序列的相应核酸分子那样的增强表达活性,例如65%或更大、优选地70%或更大、更优选地75%或更大,甚至更优选地80%或更大、85%或更大或90%或更大,在一个最优选的实施方案中,95%或更大的增强表达活性,或
[0015] iv)作为前文在i)至iii)下提及的核酸分子中任一者的互补物或反向互补物的核酸分子,或
[0016] v)使用由SEQ ID NO:20至57、优选地如表2中所示SEQ ID NO:20/21;26/27;30/31;38/39;42/43;44/45;46/47;50;51和56/57描述的寡核苷酸引物,通过PCR可获得的核酸分子,或
[0017] vi)100个或更多核苷酸、150个或更多核苷酸、200个或更多核苷酸或250个或更多核苷酸的核酸分子,所述核酸分子在等同于在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA杂交,以及在50℃或65℃、优选地65℃于2×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:1至19、优选地SEQ ID NO:1至9描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交。优选地,所述核酸分子在等同于在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA杂交,以及在50℃或65℃、优选地65℃于1×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:1至19、优选地SEQ ID NO:1至9描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少
200、最优选地至少250个连续核苷酸的核酸分子杂交;更优选地,所述核酸分子在等同于在
50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA杂交,以及在50℃或65℃、优选地
65℃于0.1×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:1至19、优选地SEQ ID NO:
1至9描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少
150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交。
[0018] 在一个实施方案中,一个或多个NEENA相对于与NEENA功能性连接的启动子是异源的。
[0019] 如以上在v)下所述,使用如表2中所示由SEQ ID NO:20至57、优选地SEQ ID NO:20/21;26/27;30/31;38/39;42/43;44/45;46/47;50/51和56/57所定义的寡核苷酸,通过PCR可获得的核酸分子是例如使用如下文实施例1中所述的条件,从来自拟南芥属
(Arabidopsis)植物如拟南芥(A.thaliana)的基因组DNA中可获得的。
[0020] 技术人员知晓变动温度特征、循环数和/或缓冲液组成或浓度以获得相应的NEENA分子。表2中描述在用于获得相应NEENA分子的相应PCR反应中待使用的寡核苷酸的特定组合。
[0021] 本领域技术人员知晓用于使单向启动子变成双向启动子的方法和使用启动子序列的互补物或反向互补物以产生与原始序列具有相同启动子特异性的启动子的方法。用于组成型及诱导型启动子的此类方法例如由Xie等人(2001)“Bidirectionalization of polar promoters in plants(植物中极性启动子的双向化)”nature biotechnology 19第677-679页描述。作者描述了添加最小启动子至任意给定启动子的5’引发端足以在两个方向获得启动子控制表达,同时具有相同的启动子特异性。因而,与如上文所述NEENA功能性连接的高表达启动子在互补或反向互补情况下是有功能的,并且因此所述NEENA在互补或反向互补情况下也是有功能的。
[0022] 如本文中所用的组成型启动子意指在基本上全部植物组织中贯穿植物或其部分的基本上整个生活期限表达的启动子。在基本上全部植物组织中表达的启动子也可以包括在主要植物组织如叶、茎和/或根的至少两者中并且可以在或可以不在一些或全部次要组织或细胞如表皮、气孔、毛状体、花、种子或分生组织中表达的启动子。在一个优选的实施方案中,如本文中所意指的组成型启动子至少在绿色组织如叶和茎中表达。
[0023] 贯穿植物或其部分的基本上整个生活期限表达的启动子也可以包括在嫩的和已发育的组织中表达,但是可以在植物生活期限中的特定时间点或在特定条件下如在萌发和/或衰老期间或在生物性和/或非生物性胁迫条件如真菌性或细菌性感染、干旱、热或寒冷下缺少表达的启动子。在一个优选的实施方案中,贯穿植物的基本上整个生活期限表达的组成型启动子至少在充分扩大的组织中表达直至开始衰老。
[0024] 原则上,NEENA可以与任意的启动子如组织特异性、诱导型、发育特异性或组成型启动子功能性连接。相应的NEENA将导致在与至少一种NEENA功能性连接的相应启动子控制下的异源核酸的增强表达。增强除组成型启动子之外的启动子例如组织特异性启动子的表达将给予这些启动子的特异性。核酸在相应启动子控制下的表达将是在无NEENA的情况下检测不到所述核酸的转录物的额外组织或发育阶段中可检测的。因此,组织特异性或发育特异性或任意其他启动子可以通过将至少一种如上文所述的NEENA分子与所述启动子功能性连接而变成组成型启动子。因此,本发明的另一个实施方案是提供用于将植物中有功能的任意给定启动子的特异性通过相应启动子与NEENA分子连接而赋予组成型启动子的方法,其中所述NEENA分子包含如以上在i)至vi)下所述的序列。
[0025] 优选地,一个或多个NEENA与任意的组成型启动子功能性连接并且将增强在所述启动子控制下的核酸分子的表达。待用于本发明任意方法中的组成型启动子可以源自植物例如单子叶或双子叶植物、源自细菌和/或病毒或可以是合成性启动子。待使用的组成型启动子例如是来自欧芹(P.crispum)的PcUbi-启动子(WO 2003102198)、来自玉米的ZmUbi-启动子、来自编码腈水解酶1的拟南芥基因At3g44310的AtNit-启动子、来自玄参(figwort)花叶病毒的34S-启动子、来自烟草花叶病毒的35S-启动子、源自农杆菌的nos启动子和ocs启动子、ScBV-启动子(US 5994123)、SUPER-启动子(Lee等人2007,Plant.Phys.)、来自编码铁氧还蛋白NADH还原酶的拟南芥基因At5g66190的AtFNR-启动子、来自豌豆(Pisum sativum)的ptxA启动子(WO2005085450)、来自编码磷酸三糖易位蛋白的拟南芥基因At5g46110的AtTPT-启动子、来自拟南芥基因At4g14880和At4g14890的双向AtOASTL-启动子、来自编码甘油醛-3-磷酸脱氢酶的拟南芥基因的At1g13440的PRO0194启动子、来自编码二磷酸果糖醛缩酶的拟南芥基因At3g52930的PRO0162启动子、AHAS-启动子(WO2008124495)或咖啡酰辅酶A-MT启动子和来自稻的OsCP12(WO2006084868)。
[0026] 与NEENA功能性连接的本发明高表达的组成型启动子可以用于任意植物中,所述植物包括例如苔藓、蕨类、裸子植物或被子植物,例如单子叶或双子叶植物。在一个优选的实施方案中,与NEENA功能性连接的本发明所述启动子可以用于单子叶或双子叶植物中,优选地是作物植物如谷物、大豆、卡诺拉油菜、棉属植物、马铃薯、甜菜、稻、小麦、高粱、大麦、芭蕉属植物、甘蔗、芒属植物等。在本发明的一个优选的实施方案中,与NEENA功能性连接的所述启动子可以用于单子叶作物植物如谷物、稻、小麦、高粱、芭蕉属植物、芒属植物、甘蔗或大麦中。在一个特别优选的实施方案中,与NEENA功能性连接的启动子可以用于双子叶作物植物如大豆、卡诺拉油菜、棉属植物、甜菜或马铃薯中。
[0027] 如本申请中所用的高表达的组成型启动子意指例如与NEENA功能性连接的启动子,所述NEENA引起该启动子在植物或其部分中增强的组成型表达,其中源自功能性连接于NEENA的相应启动子控制下的核酸分子的RNA积累或RNA合成速率比由缺少本发明NEENA的相同启动子引起的表达高,优选地显著更高。优选地,与相同条件下培育的包含不与本发明NEENA功能性连接的相同组成型启动子的同龄对照植物相比,植物中相应核酸的RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更大、优选地200%或更大、更优选地5倍或更大、甚至更优选地10倍或更大、最优选地20倍或更大,例如50倍。
[0028] 在本文中使用时,显著更高指技术人员知晓如何确定的统计显著性,例如通过对相应的数据集合应用统计检验如t-检验。
[0029] 用于检测由启动子赋予的表达的方法是本领域已经的。例如,该启动子可以与标记基因如GUS、GFP或萤光素酶基因功能性连接,并且可以在植物或其部分中测定由相应标记基因编码的相应蛋白质的活性。作为代表性实例,下文详细描述用于检测萤光素酶的方法。其他方法例如是通过本领域已知的方法,例如RNA印迹分析法、qPCR、连缀(run-on)测定法或本领域所述的其他方法测量受该启动子控制的核酸分子的RNA稳态水平或合成速率。
[0030] 技术人员知晓多种用于功能性连接两个或多个核酸分子的方法。此类方法可以包括限制性切割/连接法、不依赖连接酶的克隆法、重组工程法、重组或合成法。其他方法可以用来功能性连接两个或多个核酸分子。
[0031] 本发明的又一个实施方案是用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强的组成型表达,所述方法包括步骤:将包含如上文在i)至vi)下所定义核酸分子的一个或多个NEENA导入所述植物或其部分,和将所述一个或多个NEENA与启动子、优选地组成型启动子并且与处在所述启动子、优选地组成型启动子控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。
[0032] NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0033] 就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于,或受到操作以变得有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。例如,本发明的NEENA在其天然环境中与其天然启动子功能性连接,而在本发明中,它与可以源自相同生物、不同生物或合成性启动子如SUPER-启动子的另一个启动子连接。它也可以意指本发明的NEENA与其天然启动子连接,但是处于所述启动子控制下的核酸分子相对于包含其天然NEENA的启动子为异源。此外,应当理解,启动子和/或处在与本发明NEENA功能性连接的所述启动子控制下的核酸分子相对于所述NEENA为异源,原因是它们的序列已经受到例如突变如插入、缺失等操作,从而启动子和/或处在所述启动子控制下的核酸分子的天然序列被修饰并且因此已经变得相对于本发明的NEENA为异源。也可以理解,当NEENA与其天然启动子功能性连接,其中NEENA的位置相对于所述启动子改变,从而该启动子在这种操作后显示更高表达时,该NEENA相对于功能性连接至NEENA的核酸为异源。
[0034] 如本文中所意指的显示增强的核酸分子组成型表达的植物意指与相同条件下培育的没有与相应核酸分子功能性连接的相应NEENA的对照植物相比,具有更高的、优选地统计显著更高的核酸分子组成型表达的植物。这种对照植物可以是野生型植物或是包含控制与本发明植物中相同的基因的相同启动子的转基因植物,其中所述启动子不与本发明的NEENA连接。
[0035] 产生如本文中所用的植物包括用于稳定转化的方法,如借助农杆菌介导的转化、原生质体转化、粒子轰击等将重组DNA构建体导入植物或其部分并且任选地随后再生出转基因植物。它还包括用于瞬时转化植物或其部分的方法,如病毒感染法或农杆菌浸润法。技术人员知晓用于稳定和/或瞬时转化植物或其部分的其他方法。方法如育种方法或原生质体融合法可以用于本发明植物的产生并且由本发明涵盖。
[0036] 本发明的方法可以应用于任意植物,例如裸子植物或被子植物,优选地是被子植物,例如双子叶或单子叶植物,优选地是双子叶植物。优选的单子叶植物例如是谷物、小麦、稻、大麦、高粱、芭蕉属植物、甘蔗、芒属植物和短柄草属植物(Brachypodium),特别优选的单子叶植物是谷物、小麦和稻。优选的双子叶植物是例如大豆、油菜籽、卡诺拉油菜、亚麻、棉属植物、马铃薯、甜菜、万寿菊和拟南芥属植物(Arabidopsis),特别优选的双子叶植物是大豆、油菜籽、卡诺拉油菜和马铃薯。
[0037] 在本发明的一个实施方案中,如上文定义的方法包括以下步骤:
[0038] a)将包含如上文的i)至vi)中所定义核酸分子的一个或多个NEENA导入植物或其部分,和
[0039] b)将所述一个或多个NEENA整合至所述植物或其部分的基因组中,从而所述一个或多个NEENA与相对所述一个或多个NEENA为异源的优选地组成型表达的内源核酸功能性连接,和任选地
[0040] c)从所述转化的细胞再生出包含所述一个或多个NEENA的植物或其部分。
[0041] NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0042] 可以将一个或多个NEENA分子借助粒子轰击法、原生质体电穿孔法、病毒感染法、农杆菌介导的转化法或本领域已知的任意其他方法导入植物或其部分。可以将NEENA分子导入整合例如至质粒或病毒DNA或病毒RNA中。NEENA分子也可以在导入植物或植物部分中之前包含于BAC、YAC或人工染色体上。也可以将NEENA分子作为包含NEENA序列的线性核酸分子导入,其中额外的序列可以紧邻该核酸分子上的NEENA序列存在。毗邻NEENA序列的这些序列可以长约20bp,例如20bp至数百碱基对,例如100bp或更多,并且可以促进整合至基因组中,例如通过同源重组。可以使用用于基因组整合的任何其他方法,无论它是定向整合法,如同源重组,或随机整合法,如非常规(illegitimate)重组。
[0043] 可以与NEENA分子功能性连接的优选地组成型表达的内源核酸可以是任意核酸,优选地是任意的组成型表达的核酸分子。该核酸分子可以是编码蛋白质的核酸分子或非编码性分子如反义RNA、rRNA、tRNA、miRNA、ta-siRNA、siRNA、dsRNA、snRNA、snoRNA或本领域已知的任何其他非编码性RNA。
[0044] 技术人员知晓用于鉴定组成型表达的核酸分子的方法,例如通过微阵列芯片杂交、qPCR、RNA印迹分析、下一代测序法等,其中本发明的方法可以优选地应用于所述核酸分子。
[0045] 实施本发明方法的又一种方式可以是
[0046] a)提供包含一个或多个NEENA的表达构建体,所述NEENA包含如上文i)至vi)中所定义的与启动子、优选地组成型启动子并且与相对于所述一个或多个NEENA为异源并处在所述启动子、优选地组成型启动子控制下的一种或多种核酸分子功能性连接的核酸分子,和
[0047] b)将包含所述一个或多个NEENA的所述表达构建体整合至所述植物或其部分的基因组中,和任选地
[0048] c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。
[0049] NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0050] 表达构建体可以借助本领域已知的任何方法整合至相应植物的基因组中。使用如粒子轰击法或农杆菌介导的转化法的方法时,整合可以是随机的。在一个优选的实施方案中,整合借助定向整合,例如通过同源重组进行。后一种方法将允许包含与NEENA功能性连接的高表达启动子的表达构建体整合至有利的基因组区域中。有利的基因组区域例如是已知包含例如在种子中高度表达的基因的基因组区域,并且因而与显示无转录活性的基因组区域相比,可以增加源自所述表达构建体的表达。
[0051] 在另一个优选的实施方案中,所述一个或多个NEENA与靠近所述异源核酸分子的转录起始位点的启动子、优选地组成型启动子功能性连接。
[0052] 如本文中所意指的靠近转录起始位点包含一个或多个NEENA与距离所述异源核酸分子的转录起始位点2500bp或更少、优选地2000bp或更少、更优选地1500bp或更少、甚至更优选地1000bp或更少并且最优选地500bp或更少的启动子、优选地组成型启动子功能性连接。应当理解,该NEENA可以距相应启动子的转录起始位点以相应距离在上游或下游整合。因而,一个或多个NEENA不必一定包含于处在与所述一个或多个NEENA功能性连接的优选地组成型启动子控制下的相应异源核酸的转录物中。优选地,一个或多个NEENA整合在相应启动子、优选地组成型启动子的转录起始位点的下游。转录起始位点下游的整合位点可以位于5’UTR、3’UTR、外显子或内含子中,或它可以替换内含子或部分或完全地替换处于优选地组成型启动子控制下的异源核酸的5’UTR或3’UTR。优选地,一个或多个NEENA整合在5’UTR或内含子中,或所述NEENA替换内含子或部分或全部5’UTR,最优选地,它整合在相应异源核酸的5’UTR中。
[0053] 本发明的又一个实施方案包括含有一个或多个NEENA的重组表达构建体,其中所述的NEENA包含上文i)至vi)中所定义的核酸分子。
[0054] 重组表达构建体可以还包含与一个或多个NEENA功能性连接的一个或多个启动子,优选地组成型启动子和任选地一个或多个表达的核酸分子,所述核酸分子相对于所述一个或多个NEENA为异源。
[0055] NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
[0056] 该表达构建体可以包含与NEENA功能性连接的启动子、优选地组成型启动子和待表达核酸分子的1个或多个,例如2个或更多个,例如5个或更多个,如10个或更多个组合,所述的待表达核酸分子相对于相应的NEENA为异源。该表达构建体也可以包含其他启动子,所述的其他启动子不包含与相对于相应的启动子为同源或异源的待表达核酸分子功能性连接的NEENA。
[0057] 包含如上文定义的一个或多个重组表达构建体的重组表达载体是本发明的另一个实施方案。可以在本发明中使用的多种表达载体是技术人员已知的。用于将包含这种表达构建体的此种载体导入植物基因组中的方法和用于从转化的细胞恢复转基因植物的方法也是本领域熟知的,其中所述的表达构建体包含例如与NEENA功能性连接的启动子和任选地其他元件如终止子。取决于用于转化植物或其部分的方法,完整载体可以整合至所述植物或其部分的基因组中,或者载体的某些组分可以整合至所述基因组中,例如T-DNA。
[0058] 本发明中还包括转基因植物或其部分,其包含如上文i)至vi)中所定义的一种或多种异源NEENA。如果NEENA是合成的、源自另一种生物或源自相同生物,但是其天然基因组位置与对照植物例如野生型植物相比被改变,则将NEENA理解为相对于该植物是异源的。应当理解,改变的基因组位置意指,NEENA位于另一条染色体上或位于同一条染色体上,但是脱离例如在野生型植物中其天然基因组位置10kb或更远,例如10kb,优选地5kb或更远,例如5kb,更优选地1000bp或更远,例如1000bp,甚至更优选地500bp或更远,例如500bp,特别优选地100bp或更远,例如100bp,最优选地10bp或更远,例如10bp。
[0059] 包含如上文定义的重组表达载体或如上文定义的重组表达构建体的转基因细胞或转基因植物或其部分是本发明的又一个实施方案。转基因细胞、转基因植物或其部分可以选自细菌、真菌、酵母或植物、昆虫细胞或哺乳动物细胞或植物。优选地,转基因细胞是细菌、真菌、酵母或植物细胞。优选的细菌是肠杆菌属细菌如大肠杆菌(E.coli)和农杆菌属的细菌,例如根癌农杆菌(Agrobacterium tumefaciens)和发根农杆菌(Agrobacterium rhizogenes)。优选的植物是单子叶或双子叶植物,例如单子叶或双子叶作物植物,如谷物、大豆、卡诺拉油菜、棉属植物、马铃薯、甜菜、稻、小麦、高粱、大麦、芒属植物、芭蕉属植物、甘蔗等。优选的作物植物是谷物、稻、小麦、大豆、卡诺拉油菜、棉属植物或马铃薯。尤其优选的双子叶作物植物是大豆、卡诺拉油菜、棉属植物或马铃薯。尤其优选的单子叶作物植物是谷物、小麦和稻。
[0060] 源自如上文所定义的转基因细胞或植物或其部分中的转基因细胞培养物、转基因种子、部分或繁殖材料是本发明的其他实施方案,其中所述的转基因细胞或植物或其部分包含如上文在i)至vi)中定义的所述异源NEENA或如上文定义的所述重组表达构建体或所述重组载体。
[0061] 如本文中所意指的转基因部分或繁殖材料包含含有相应NEENA、重组表达构建体或重组载体的全部组织和器官,例如叶、茎和果实以及用于植物繁殖和/或再生的材料如插条、接穗、压条、枝条或幼苗。
[0062] 本发明的又一个实施方案是如上文在i)至vi)中定义的NEENA或如上文定义的重组构建体或重组载体用于增强植物或其部分中表达的用途。
[0063] 因而,本申请即将提供种子特异的和/或种子优先的增强基因表达的核酸分子,其包含一个或多个启动子,优选地是与一个或多个NEENA功能性连接的种子特异的和/或种子优先的启动子。另外,提供了此类增强基因表达的核酸分子和包含此类增强基因表达的核酸分子的表达构建体、表达载体、转基因植物或其部分和转基因细胞的用途。
[0064] 本发明中还包括源自如上文定义的转基因细胞或植物或其部分中的转基因细胞培养物、转基因种子、部分或繁殖材料用于生产食物、动物饲料、种子、药物或精细化学品的用途。
[0065] 定义
[0066] 缩写:NEENA–增强核酸表达的核酸,GFP–绿色荧光蛋白,GUS–β-葡糖苷酸酶,BAP–6-苄氨基嘌呤,2,4-D–2,4-二氯苯氧乙酸,MS–Murashige-Skoog培养基,NAA–1-萘乙酸,MES,2-(N-吗啉代)-乙磺酸,IAA:吲哚乙酸,Kan:硫酸卡那霉素,GA3–赤霉酸,TimentinTM:替卡西林二钠/克拉维酸钾,microl:微升。
[0067] 应当理解,本发明不限于具体的方法或方案。还应当理解本文所用的术语目的仅在于描述具体实施方案,并且不意图限制本发明,本发明将仅受所附权利要求书限制。必须指出,如本文中和所附权利要求中所用,单数形式“一个”、“一种”和“该”包括复数指称,除非上下文另外明确地指明并非如此。因此,例如,对“一个载体”的提及是对一个或多个载体的提及并且包括本领域技术人员已知的其等同物等。术语“约”在本文中用来指大约、大致、左右和在……范围内。当术语“约”与一个数字范围联合使用时,它通过使界限值扩展高于和低于所述数值而修饰该范围。通常而言,术语“约”在本文中用来通过20%、优选地10%之上或之下(更高或更低)变异而修饰高于和低于所述值的数值。如本文中所用,词汇“或”意指特定列出的任何一成员并且还包括该列出的成员的任意组合。在本说明书中及以下权利要求中使用时,词汇“包含”、“包含着”、“包括”、“包括着”和“包括了”意图指明一个或多个所述特征、整数、组分或步骤的存在,但是它们不排除一个或多个其他特征、整数、组分、步骤或其组的存在或添加。为清晰起见,将本说明书中使用的某些术语如下定义并使用。
[0068] 反平行:“反平行”在本文中指经互补性碱基残基之间氢键配对的两个核苷酸序列,其中磷酸二酯键在一个核苷酸序列中以5’-3’方向分布并且在另一个核苷酸序列中以3’-5’方向分布。
[0069] 反义:术语“反义”指相对于其转录或发挥作用的正常方向为反向并且从而表达下述RNA转录物的核苷酸序列,其中所述的RNA转录物与宿主细胞内部表达的靶基因mRNA分子互补(例如,它可以借助Watson-Crick碱基配对作用与靶基因mRNA分子或单链基因组DNA杂交)或与靶DNA分子(例如宿主细胞中存在的基因组DNA)互补。
[0070] 编码区:如本文中所用,术语“编码区”在谈及结构基因使用时,指编码在作为mRNA分子翻译结果的新生多肽中存在的氨基酸的核苷酸序列。在真核生物中,编码区在5’侧以编码起始物甲硫氨酸的核苷酸三联体“ATG”为界并且在3’侧以特定终止密码子的3种三联体(即TAA、TAG、TGA)为界。除含有内含子之外,基因的基因组形式也可以包含位于RNA转录物中存在的序列的5’-及3’-端的序列。这些序列称作“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’-侧翼区可以含有控制或影响基因转录的调节序列如启动子和增强子。3’-侧翼区可以含有指导转录终止、转录后剪切和聚腺苷酸化的序列。
[0071] 互补的:“互补的”或“互补性”指包含反平行核苷酸序列的两个核苷酸序列,其中一旦在反平行核苷酸序列中的互补性碱基残基之间形成氢键,则所述反平行核苷酸序列能够相互配对(通过碱基配对原则)。例如,序列5’-AGT-3’与序列5’-ACT-3’互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则未匹配的情况。核酸分子之间的“全部”或“完全”互补性是其中每个核酸碱基按照碱基配对规则与另一个碱基匹配的情况。核酸分子链之间互补性的程度对核酸分子链之间杂交的效率和强度具有明显影响。如本文中所用的核酸序列“互补物”指这样的核苷酸序列,其核酸分子显示与该核酸序列的核酸分子的全部互补性。
[0072] 双链RNA:“双链RNA”分子或“dsRNA”分子包含核苷酸序列的有义RNA片段和该核苷酸序列的反义RNA片段,二者均包含彼此互补的核苷酸序列,因而允许有义RNA片段和反义RNA片段配对并形成双链RNA分子。
[0073] 内源的:“内源的”核苷酸序列指存在于未转化植物细胞的基因组中的核苷酸序列。
[0074] 增强的表达:“增强”或“增加”核酸分子在植物细胞中的表达在本文中同等地使用,并且意指该核酸分子在应用本发明方法之后在植物、植物部分或植物细胞中的表达水平比其在应用该方法之前在植物、植物部分或植物细胞中的表达更高,或与缺少本发明重组核酸分子的参照植物相比更高。例如,参照植物包含仅缺少相应NEENA的相同构建体。如本文中所用的术语“增强”或“增加”是同义的,并且在本文中意指待表达的核酸分子的更高、优选地显著更高的表达。如本文中所用的,“增强”或“增加”某物质(如蛋白质、mRNA或RNA)的水平意指相对于基本上相同条件下培育的、缺少本发明重组核酸分子(例如缺少本发明的NEENA分子、重组构建体或重组载体)的基本上相同植物、植物部分或植物细胞,该水平增加。如本文中所用的,“增强”或“增加”某物质(例如由靶基因表达的前RNA、mRNA、rRNA、tRNA、snoRNA、snRNA和/或由其编码的蛋白质产物)的水平意指相对于缺少本发明重组核酸分子的细胞或生物,该水平增加50%或更多,例如100%或更多,优选地200%或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。可以通过技术人员熟悉的方法测定所述增强或增加。因而,可以例如通过蛋白质的免疫学检测法确定核酸或蛋白质量的增强或增加。另外,可以使用技术如蛋白质测定法、荧光法、RNA杂交法、核酸酶保护测定法、逆转录法(定量RT-PCR)、ELISA(酶联免疫吸附测定法)、蛋白质印迹法、放射免疫测定法(RIA)或其他免疫测定法和荧光激活的细胞分析(FACS)来测量植物或植物细胞中的特定蛋白质或RNA。取决于所诱导蛋白质产物的类型,也可以确定其活性或对生物或细胞表型的影响。用于确定蛋白质数量的方法是技术人员已知的。可以提到的实例是:微量Biuret法(Goa J(1953)Scand J Clin Lab Invest 5:218-222)、Folin-Ciocalteau法(Lowry OH等人(1951)J Biol Chem 193:265-275)或测量CBB G-250的吸光度(Bradford MM(1976)Analyt Biochem 72:248-254)。作为用于量化蛋白质的活性的一个实例,在下文实施例中描述萤光素酶活性检测法。
[0075] 表达:“表达”指基因产物的生物合成,优选地指细胞中核苷酸序列例如内源基因或异源基因的转录和/或翻译。例如,在结构基因的情况下,表达涉及结构基因转录成mRNA并且任选地随后mRNA翻译成一种或多种多肽。在其他情况下,表达可以仅指携带RNA分子的DNA的转录。
[0076] 表达构建体:如本文中所用的“表达构建体”意指能够指导特定核苷酸序列在适宜植物部分或植物细胞中表达的DNA序列,该DNA序列包含在导入此DNA序列的所述植物部分或植物细胞中有功能的启动子,所述启动子与任选地有效连接至终止信号的目的核苷酸序列有效连接。如果需要翻译,该DNA序列一般还包含为正确翻译所述核苷酸序列所需的序列。编码区可以编码目的蛋白,但也可以以有义或反义方向编码功能性目的RNA,例如RNAa、siRNA、snoRNA、snRNA、microRNA、ta-siRNA或任何其他非编码的调节性RNA。包含目的核苷酸序列的表达构建体可以是嵌合的,这意指该表达构建体的组件中一者或多者相对于该表达构建体的其他组件中一者或多者是异源的。该表达构建体也可以是一种这样的表达构建体,它天然地存在,但已经以用于异源表达的重组形式获得。然而,一般而言,该表达构建体相对于宿主是异源,即,该表达构建体的特定DNA序列不天然存在于宿主细胞中并且必须已经通过转化事件导入宿主细胞或该宿主细胞的祖先中。该表达构建体中的核苷酸序列的表达可以处于组成型启动子或处于仅在宿主细胞暴露于一些特定外部刺激时才启动转录的诱导型启动子的控制下。在植物的情况下,该启动子也可以是针对特定组织或器官或发育阶段特异的。
[0077] 外来:术语“外来”指任何核酸分子(例如,基因序列),所述核酸分子通过实验操作导入细胞的基因组中并且可以包括该细胞中存在的序列,只要导入的序列含有一些修饰(例如,点突变、存在可选择标记基因等)和因此相对于天然存在序列是不同的。
[0078] 功能性连接:将术语“功能性连接”或“功能性连接的”理解为意指例如调节性元件(例如启动子)与待表达的核酸序列并且根据需要与其他调节性元件(例如,终止子或NEENA)以如此方式依次排列,从而每种调节性元件可以履行其目的功能以允许、修饰、促进或影响所述核酸序列的表达。作为同义词,可以使用“有效连接”或“有效连接的”。可以根据所述核酸序列相对于有义或反义RNA的排列,产生表达。为此目的,不是必需要求化学意义上的直接连接。遗传控制序列例如增强子序列也能够从远离的位置或甚至从其它DNA分子对靶序列产生其作用。优选的排列是这样的排列,其中待表达的核酸序列重组地位于充当启动子的序列之后,从而这两个序列相互共价地连接。该启动子序列与待重组表达的核酸序列之间的距离优选地小于200碱基对、特别优选地小于100碱基对、非常特别优选地小于
50碱基对。在一个优选的实施方案中,待转录的核酸序列以如此方式位于启动子之后,其中转录起点与本发明嵌合RNA的合乎需要的开端相同。功能性连接和表达构建体可以借助如(例如,在Maniatis T,Fritsch EF和Sambrook J(1989)Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy等人(1984)Experiments with Gene Fusions,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Ausubel等人(1987)Current Protocols in Molecular Biology,Greene Publishing Assoc.and Wiley Interscience;Gelvin等人(编著)(1990)Plant Molecular Biology Manual;Kluwer Academic Publisher,Dordrecht,The Netherlands)所述的惯用重组和克隆技术产生。然而,其他序列,例如充当带限制性酶特定切割位点的接头或充当信号肽的序列,也可以位于这两个序列之间。序列的插入也可以导致融合蛋白的表达。优选地,由调节性区域例如启动子和待表达核酸序列的连接组成的表达构建体可以以载体整合的形式存在并且被插入植物基因组,例如通过转化法。
[0079] 基因:术语“基因”指与能够以某种方式调节基因产物(例如,多肽或功能性RNA)表达的适宜调节序列有效连接的区域。基因包括DNA中位于编码区(可读框,ORF)之前(上游)和之后(下游)的不翻译的调节区(例如启动子、增强子、阻抑物等),以及在可用的情况下,在各个编码区(例如外显子)之间的间插序列(例如内含子)。如本文中所用的术语“结构基因”意图指转录成mRNA的DNA序列,其中所述的mRNA随后翻译成作为具体多肽的特征的氨基酸序列。
[0080] 基因组和基因组DNA:术语“基因组”或“基因组DNA”指宿主生物的可遗传信息。所述基因组DNA包括胞核的DNA(也称作染色体DNA),还包括质体(例如,叶绿体)和其他细胞器(例如,线粒体)的DNA。优选地,术语“基因组”或“基因组DNA”指胞核的染色体DNA。
[0081] 异源的:就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于,或受到操作以变得有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。包含核酸分子和与之连接的一个或多个调节性核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体,在所述构建体中,a)所述核酸分子或b)所述调节性核酸分子或c)二者(即(a)和(b))不位于其天然(原有)遗传环境中或已经因实验操作受到修饰,修饰的实例是一个或多个核苷酸残基的置换、添加、缺失、倒位或插入。天然遗传环境指源生物中的天然染色体基因座或指存在于基因组文库中。在基因组文库的情况下,优选地保留,至少部分地保留该核酸分子的序列的天然遗传环境。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选地至少500bp,特别优选地至少1,000bp,非常特别优选地至少5,000bp序列长度。
天然存在的表达构建体例如启动子与相应基因的天然存在组合-在通过非天然的合成性“人工”方法例如诱变法修饰时变成转基因表达构建体。已经描述了此类方法(US 5,565,
350;WO 00/15815)。例如,与启动子有效连接的编码蛋白质的核酸分子相对于该启动子视为异源,其中所述的启动子不是该核酸分子的天然启动子。优选地,异源DNA相对于导入该异源DNA的细胞不是内源的或不天然与该细胞相关,但是已经从另一种细胞获得或已经合成。异源DNA还包括含有一些修饰的内源DNA序列、不天然存在的多拷贝内源DNA序列或这样的DNA序列,该DNA序列不与同物理连接于所述DNA序列的另一个DNA序列天然接合。通常地但不是必需地,异源DNA编码在细胞中表达的RNA或蛋白质,而所述RNA或蛋白质正常情况下不被所述细胞产生。
[0082] 高表达组成型启动子:如本文中所用的“高表达组成型启动子”意指在植物或其部分中引起组成型表达的启动子,其中衍生自处于相应启动子控制下的核酸分子中的RNA积累或合成速率或RNA稳定性比缺少本发明NEENA的启动子所引起的表达更高,优选地显著更高。优选地,相对于缺少本发明NEENA的组成型启动子,RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更多,优选地200%或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。
[0083] 杂交:如本文中所用,术语“杂交”包括“核酸分子的链通过碱基配对作用与互补链结合的任意过程”。(J.Coombs(1994)Dictionary of Biotechnology,Stockton Press,New York)。杂交和杂交的强度(即,核酸分子之间结合的强度)受此类因素影响,如核酸分子之间的互补性程度、所涉及条件的严格性、所形成杂合体的Tm和核酸分子内部的G:C比。如本文中所用,术语“Tm”用来指“解链温度”。解链温度是双链核酸分子群体一半解离成单链的温度。用于计算核酸分子的Tm的等式是本领域熟知的。如标准参考文献所示,当核酸分子处于1M NaCl的水溶液中时,可以通过等式:Tm=81.5+0.41(%G+C)计算来进行Tm值的简单估计[见例如,Anderson和Young,Quantitative Filter Hybridization,in Nucleic Acid Hybridization(1985)]。其他参考文献包括更复杂计算法,这些算法考虑了结构特征及序列特征以计算Tm。严格条件是本领域技术人员已知的并且可以在Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6中找到。
[0084] “同一性”:在比较两个或多个核酸或氨基酸分子使用时,“同一性”意指所述分子的序列共有某种程度的序列相似性,即所述序列是部分相同的。
[0085] 为确定两个氨基酸序列或两个核酸分子的同一性(同源性在本文可互换地使用)百分数,将所述序列以一个序列在另一个序列下的方式书写以最佳比较(例如,可以将空位插入蛋白质的序列或核酸的序列,旨在与另一种蛋白质或另一种核酸产生最佳比对)。
[0086] 随后在对应氨基酸位置或核苷酸位置处比较氨基酸残基或核酸分子。当一个序列中的位置由另一个序列中对应位置处的相同氨基酸残基或相同核酸分子占据时,则所述分子在这个位置处是同源的(即,如本上下文中所用的氨基酸或核酸“同源性”对应于氨基酸或核酸“同一性”。这两个序列之间的同一性百分数是所述序列共有的相同位置的数值的函数(即同源性百分数=相同位置的数值/位置总数×100)。术语“同源性”和“同一性”因而视为同义词。
[0087] 为确定两个或多个氨基酸序列或两个或多个核苷酸序列的同一性百分数,已经开发了几个计算机软件程序。两个或更多序列的同一性可以用例如软件fasta计算,其中软件fasta已经以fasta 3版本使用(W.R.Pearson和D.J.Lipman,PNAS 85,2444(1988);W.R.Pearson,Methods in Enzymology 183,63(1990);W.R.Pearson和D.J.Lipman,PNAS 
85,2444(1988);W.R.Pearson,Enzymology 183,63(1990))。用于计算不同序列的同一性的另一种有用程序是标准blast程序,其中该程序包含于Biomax pedant软件(联邦德国慕尼黑Biomax)中。不幸地,该程序有时产生次优结果,因为blast不总是包含主题和查询对象的完整序列。然而,由于该程序非常高效,因而它可以用于庞大数目序列的比较。以下设置通常用这样的序列比较:
[0088] -p程序名称[字符串];-d数据库[字符串];默认=nr;-i查询文件[FileIn];默认=stdin;-e期望值(E)[Real];默认=10.0;-m比对浏览选项:0=配对;1=查询-比上区域(query-anchored),显示同一性;2=查询-比上区域,不显示同一性;3=查询-比上区域的屏文形式,显示同一性;4=查询-比上区域的屏文形式,不显示同一性;5=查询-比上区域,不显示同一性和突然结束;6=查询-比上区域的屏文形式,不显示同一性和突然结束;7=XML Blast输出;8=TAB格式输出;9带注释行的TAB格式输出[整数];默认=0;-o BLAST报告输出文件[File Out]任选;默认=stdout;-F过滤软件查询序列(DUST用blastn,SEG用其他方法)[字符串];默认=T;-G空位开口成本(零激发默认行为)[整数];默认=0;-E开口延伸成本(零激发默认行为)[整数];默认=0;-X X空位比对的下降值(比特)(零激发默认行为);blastn 30,megablast 20,tblastx 0,全部其他方法15[整数];默认=0;-I在定义行中显示GI'[T/F];默认=F;-q核苷酸错配罚分(仅blastn)[整数];默认=-3;-r核苷酸匹配回报(仅blastn)[整数];默认=1;-v显示对(V)的单-线描述的数据库序列数[整数];默认=500;-b显示对(B)的比对结果的数据库序列数[整数];默认=250;-f延伸命中的阈值,若为零,则默认;blastp 11,blastn 0,blastx 12,tblastn 13;tblastx 13,megablast 0[整数];默认=0;-g执行空位比对(对tblastx不可用)[T/F];默认=T;-Q查询使用的遗传密码[整数];默认=1;-D DB遗传密码子(仅用tblast[nx])[整数];默认=1;-a使用的处理器数目[整数];默认=1;-O SeqAlign文件[File Out]任选;-J相信查询定义行[T/F];默认=F;-M矩阵[字符串];默认=BLOSUM62;-W字大小,如果为零,则默认(blastn 11,megablast 28,全部其他方法3)[整数];默认=0;-z数据库的有效长度(对于真实大小,使用零)[Real];默认=0;-K来自保持区域的最佳命中数(默认关闭;若使用,则推荐值为100)[整数];默认=0;-P 0用于多重命中;1用于单一命中[整数];默认=0;-Y搜索空间的有效长度(对真实大小,使用零)[Real];默认=0;-S针对数据库搜索的查询链(对于blast[nx]和tblastx);3用于两者,1是顶端,2是底部[整数];默认=3;-T产生HTML输出结果[T/F];默认=F;-l限制数据库搜索至GI's列表[字符串]任选;-U使用FASTA序列的较低事件过滤作用[T/F]任选;默认=F;-y无空位延伸的X下降值(比特)(0.0激发默认行为);blastn 20,megablast 10,全部其他方法7[Real];默认=0.0;-Z最终空位比对的X下降值(比特)(0.0激发默认行为);blastn/megablast50,tblastx 0,全部其他方法25[整数];默认=0;-R PSI-TBLASTN检查点文件[File In]任选;-n MegaBlast搜索[T/F];默认=F;-L查询序列上的位置[字符串]任选;-A多重命中窗口大小,如果为零,则默认(blastn/megablast 0,全部其他方法40[整数];默认=0;-w移码罚分(OOF算法用于blastx)[整数];默认=0;-t允许tblastn中用于联系HSP的最大内含子的长度(0取消连接联系)[整数];默认=0。
[0089] 通过使用Needleman和Wunsch或者Smith和Waterman算法获得高质量的结果。因而,优选基于所述算法的程序。有利地,可以用程序PileUp(J.Mol.Evolution.,25,351(1987),Higgins等人,CABIOS 5,151(1989))或优选地用均基于Needleman和Wunsch算法(J.Mol.Biol.48;443(1970))的程序“Gap”与“Needle”和基于Smith和Waterman(Adv.Appl.Math.2;482(1981))算法的“BestFit”进行序列的比较。“Gap”和“BestFit”是GCG软件包[Genetics Computer Group,575Science Drive,Madison,Wisconsin,USA 
53711(1991);Altschul等人(Nucleic Acids Res.25,3389(1997)),“Needle”是欧洲分子生物学开放软件包(The European Molecular Biology Open Software Suite(EMBOSS))的部分(Trends in Genetics 16(6),276(2000))。因而,优选地,用程序“Gap”或“Needle”在所述序列的整个范围内进行确定序列同一性百分数的计算。用于比较核酸序列的以下标准调整用于“Needle”:矩阵:EDNAFULL,空位罚分:10.0,延伸罚分:0.5。用于比较核酸序列的以下标准调整用于“Gap”:空位权重:50,长度权重:3,平均匹配:10.000,平均错配:
0.000。
[0090] 例如,将声称在核酸水平与序列SEQ ID NO:1具有80%同一性的序列理解为意指,通过上述程序“Needle”以设置的上述参数与序列SEQ ID NO:1所代表的序列比较时具有80%同一性的序列。优选地,在查询序列例如SEQ ID NO:1的完整长度上计算同一性。
[0091] 内含子:指基因内部的DNA区段(间插序列),该DNA区段不编码该基因产生的蛋白质的部分,并且从该基因转录的mRNA中在该mRNA从细胞核输出之前剪切下来。内含子序列指内含子的核酸序列。因而,内含子是DNA序列的这些区域,它们随编码序列(外显子)一起转录但是在成熟mRNA形成期间被除去。内含子可以位于实际编码区内部或位于前mRNA(未剪接的mRNA)的5’或3’非翻译前导序列中。初级转录物中的内含子被切下并且编码序列同时且精确地连接以形成成熟的mRNA。内含子和外显子的交界形成剪接位点。内含子的序列始于GU并止于AG。另外,在植物中,已经描述AU-AC内含子的两个实例:来自拟南芥(Arabidopsis thaliana)的RecA样蛋白基因第14内含子和G5基因第7内含子是AT-AC含子。
含有内含子的前mRNA具有3种短序列,连同其他序列,这些短序列对于精确剪接内含子是必需的。这些序列是5’剪接位点、3’剪接位点和分支点。mRNA剪接是除去初级mRNA转录物中存在的间插序列(内含子)并接合或连接外显子序列。这又称作顺式剪接作用,所述顺式剪接作用将相同RNA上的两个外显子接合,同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体的特定蛋白质组分(例如其剪接内含子末端处的共有序列)识别并结合的序列。
功能性元件与剪接体的相互作用导致从不成熟mRNA除去内含子序列和外显子序列的再接合。内含子具有3种短序列,这些短序列对于精确剪接内含子是必需的,但是并非足够的。这些序列是5’剪接位点、3’剪接位点和分支点。分支点序列是在植物中剪接过程和剪接位点选择方面重要的。分支点序列通常位于3’剪接位点上游10-60个核苷酸处。
[0092] 同基因的:除可以因存在或不存在异源DNA序列而不同之外,在遗传上相同的生物(例如植物)。
[0093] 分离的:如本文中所用的术语“分离”意指材料已经通过人工取出并且离开其原来的天然环境存在并且因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化的形式存在或可以存在于非天然环境中如例如存在于转基因宿主细胞中。例如,活植物中存在的天然存在多核苷酸或多肽不是分离的,然而与该天然系统中一些或全部共存物质分开的相同多核苷酸或多肽是分离的。此类多核苷酸可以是载体的一部分和/或此类多核苷酸或多肽可以是组合物的一部分,和是分离的,因为这种载体或组合物不是其最初环境的一部分。优选地,术语“分离的”相对于核酸分子使用时,如在“分离的核酸序列”中,指被鉴定并且与该核酸序列天然来源中通常与其接合的至少一种杂质性核酸分子分开的核酸序列。分离的核酸分子是这样的核酸分子,其在与自然界中找到该核酸分子的形式或环境不同的形式或环境下存在。相反,未分离的核酸分子是以其在自然界中存在的状态所找到的核酸分子如DNA和RNA。例如,在宿主细胞染色体上相邻基因附近找到给定的DNA序列(例如,基因);作为与编码多种蛋白质的众多其他mRNA的混合物,在细胞中找到RNA序列,如编码特定蛋白质的特定mRNA序列。然而,包含例如SEQ ID NO:1的分离的核酸序列包括例如在细胞中通常含有SEQ ID NO:1的此类核酸序列,其中所述核酸序列位于不同于天然细胞的染色体或染色体外位置中,或侧翼分布有不同于自然界中存在的核酸序列。分离的核酸序列可以以单链或双链形式存在。当分离的核酸序列用来表达蛋白质时,该核酸序列将最少含有有义链或编码链的至少一部分(即,该核酸序列可以是单链的)。备选地,它可以含有有义链和反义链(即,该核酸序列可以是双链的)。
[0094] 最小启动子:在缺少上游激活情况下无活性或启动子活性大大降低的启动子元件,尤其是TATA元件。在合适的转录因存在下,最小启动子发挥作用以引起转录。
[0095] NEENA:参见“增强核酸表达的核酸”。
[0096] 非编码:术语“非编码”指核酸分子中不编码所表达蛋白质的部分或全部的序列。非编码序列包括但不限于内含子、增强子、启动子区、3’非翻译区和5’非翻译区。
[0097] 增强核酸表达的核酸(NEENA):术语“增强核酸表达的核酸”指这样的序列和/或核酸分子,其是具有在与NEENA功能性连接的启动子的控制下增强核酸表达的内在特性的特定序列。不同于启动子序列,NEENA本身不能驱动表达。为了履行增强与NEENA功能性连接的核酸分子表达的职能,NEENA本身应当与启动子功能性连接。与本领域已知的增强子序列的区别在于,NEENA以顺式方式而不以反式方式起作用,并且必需靠近待表达核酸的转录起始位点存在。
[0098] 核酸和核苷酸:术语“核酸”和“核苷酸”指天然存在的或合成的或人工核酸或核苷酸。术语“核酸”和“核苷酸”包括处于单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体。除非另外说明,特定核酸序列也隐含地包括其保守方式修饰的变体(例如简并密码子置换)和互补序列,以及明确指出的序列。术语“核酸”在本文中与“基因”、“DNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换地使用。核苷酸类似物包括在碱基、糖和/或磷酸酯的化学结构中具有修饰的核苷酸,所述修饰包括但不限于5-位置嘧啶修饰、8-位置嘌呤修饰、胞嘧啶环外环胺处的修饰、5-溴-尿嘧啶置换等;和
2'-位置糖修饰,包括但不限于糖修饰的核糖核苷酸,其中2'-OH由选自H、OR、R、卤素、SH、SR、NH2、NHR、NR2或CN的基团替换。短发夹RNA(shRNA)也可以包含非天然元件如非天然碱基,例如,肌苷和黄嘌呤,非天然糖,例如,2'-甲氧基核糖,或非天然磷酸二酯键,例如甲基磷酸酯、硫代磷酸酯和肽。
[0099] 核酸序列:短语“核酸序列”指从5’-端至3’-端读取的脱氧核糖核苷酸或核糖核苷酸的单链或双链聚合物。它包括染色体DNA、自我复制型质粒、DNA或RNA的感染性聚合物、和主要发挥结构性作用的DNA或RNA。“核酸序列”也指代表核苷酸的缩写、字母、字符或字的连续串。在一个实施方案中,核酸可以是“探针”,所述探针是相对短的核酸,通常长度小于100个核苷酸。经常地,核酸探针具有约50个核苷酸长度至约10个核苷酸长度。核酸的“靶区域”是核酸中被鉴定为有目标的部分。核酸的“编码区”是核酸的部分,其中置于适宜的调节性序列控制下时,所述部分以序列特异性方式转录和翻译以产生特定的多肽或蛋白质。称该编码区编码这种多肽或蛋白质。
[0100] 寡核苷酸:术语“寡核苷酸”指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的低聚物或聚合物,以及具有类似发挥作用的非天然存在部分的寡核苷酸。此类修饰或取代的寡核苷酸因合乎需要的特性,例如增强的细胞摄取、增强的核酸靶亲和力和在核酸酶存在下增加的稳定性而经常优选地胜过其天然形式。寡核苷酸优选地包括通过键(例如,磷酸二酯键)或取代键(substitute linkage)相互共价偶联的两个或多个核苷酸单体(nucleomonomer)。
[0101] 突出端:“突出端”是双链寡核苷酸分子的5’-或3’-羟基端上相对短的单链核苷酸序列(也称作“延伸”、“伸出端”或“粘末端”)。
[0102] 植物:通常理解为意指能够光合作用的任何真核单细胞或多细胞生物或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。为本发明的目的,包括植物界(Plant Kingdom)的全部属和物种的高等和低等植物。优选地一年生、多年生、单子叶和双子叶植物。该术语包括成熟植物、种子、幼苗和籽苗及其衍生部分、繁殖材料(如种子或微孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物(例如细胞培养物),和归并成产生功能单元或结构单元的任何其他类型的植物细胞。成熟植物指在除籽苗之外的任何目的发育阶段的植物。籽苗指在早期发育阶段的年幼不成熟植物。一年生、二年生、单子叶和双子叶植物是用于产生转基因植物的优选宿主生物。基因的表达在全部观赏植物、用材树或观赏树、花、切花、灌木或草坪草中是更进一步有利的。可以用举例方式、但非限制方式提到的植物是被子植物、苔藓植物例如獐耳细辛属(Hepaticae)(地钱类(liverwort))和藓纲(Musci)(藓类植物);蕨类植物如蕨类、木贼类和石松类;裸子植物如松柏类植物、苏铁植物、银杏(ginkgo)和买麻藤科(Gnetaeae)植物;藻类如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲
(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻类)和裸藻纲(Euglenophyceae)。优选地用于食物或饲料目的的植物,如豆科(Leguminosae)如豌豆、苜蓿和大豆;禾本科(Gramineae)如稻、玉米、小麦、大麦、高粱、黑麦、黑小麦或燕麦;伞形科(Umbelliferae),具体地是胡萝卜属(Daucus)(非常特别地是物种胡萝卜(carota))和芹属(Apium)(非常特别地是物种旱芹(Graveolens dulce(celery)))及众多其它植物;茄科(Solanaceae),特别地是番茄属(Lycopersicon),非常特别地是物种番茄(tomato),和茄属(Solanum),非常特别地是物种马铃薯(tomato)和茄子(aubergine)和众多其它植物(如烟草(tobacco)),和辣椒属(Capsicum),非常特别地是物种辣椒(Capsicum annum(pepper))物种及众多其它植物;豆科(Leguminosae),特别地是大豆属(Glycine),非常特别地是物种大豆(soybean)、苜蓿、豌豆、紫花苜蓿、菜豆或花生及众多其它植物;和十字花科(Brassicacae),特别地是芸苔属(Brassica),非常特别地是物种欧洲油菜(oilseed rape)、芸苔(beet)、甘蓝(Brassica oleracea cvTastie(卷心菜))、花椰菜(Brassica oleracea cv Snowball Y(花椰菜))和花茎甘蓝(oleracea cv Emperor(broccoli));和拟南芥属,非常特别地是物种拟南芥及众多其它植物;菊科(Compositae),具体地是莴苣属(Lactuca),非常特别地是物种莴苣(lettuce)及众多其它植物;菊科(Asteraceae)如向日葵、万寿菊、莴苣或金盏花及众多其它植物;葫芦科(Cucurbitaceae)如甜瓜、西葫芦/南瓜或夏南瓜,和亚麻。更优选地是棉属植物、甘蔗、大麻、亚麻、辣椒和多种树、坚果和藤本(wine)物种。
[0103] 多肽:术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在文中互换地使用,用来指连续氨基酸残基的聚合物或低聚物。
[0104] 前蛋白:正常情况下靶向细胞器如叶绿体并且仍包含其转运肽的蛋白质。
[0105] 初级转录物:如本文中所用的术语“初级转录物”指基因的不成熟RNA转录物。“初级转录物”例如仍包含内含子和/或仍不包含聚腺苷酸尾或帽结构和/或是缺少对其作为转录物正常发挥作用必需的其他修饰,例如修剪或编辑。
[0106] 启动子:术语“启动子”或“启动子序列”是等同物并且如本文中所用的,指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。此类启动子可以例如在以下公共数据库中http://www.grassius.org/grasspromdb.html、http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom、http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi找到。其中所列的启动子可以用于本发明的方法并且在此引用而包括。启动子位于由该启动子控制转录成mRNA的目的核苷酸序列的5’(即,上游),靠近其转录起始位点,并且为RNA聚合酶和用于转录起始的其他转录因子的特异性结合提供位点。所述启动子包含靠近转录起始位点例如至少10kb,例如5kb或2kb。它也可以包含靠近转录起始位点至少1500bp,优选地至少1000bp,更优选地至少500bp,甚至更优选地至少
400bp,至少300bp,至少200bp或至少100bp。在又一个优选的实施方案中,启动子包含靠近转录起始位点至少50bp,例如至少25bp。启动子不包含外显子和/或内含子区或5’非翻译区。启动子可以例如相对于相应植物为异源或同源。如果多核苷酸序列源自外来物种,或如果来自相同物种,但从其原有形式中被修饰,则它相对于某生物或第二多核苷酸序列为“异源”。例如,与异源编码序列有效连接的启动子指编码序列来自不同于衍生该启动子的物种中,或,如果来自相同物种,编码序列与该启动子不天然接合(例如基因修饰的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以源自其中应当出现表达的宿主细胞的基因或源自该宿主细胞的病原体(例如,植物或植物病原体如植物病毒)。植物特异性启动子是适于调节植物中表达的启动子。这种启动子可以源自植物,也可以源自植物病原体,或它可以是由人设计的合成性启动子。如果启动子是诱导型启动子,则转录的速率应答于诱导剂而增加。另外,启动子可以以组织特异性或组织优先的方式受到调节,从而它仅仅或优势地在特定组织类型如叶、根或分生组织中转录所接合的编码区方面有活性。用于启动子时,术语“组织特异性”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的组织(例如,花瓣)中选择性表达,同时相同目的核苷酸序列在不同类型组织(例如,根)中相对缺少的表达。可以例如通过这样的方式评价启动子的组织特异性:将报道基因与该启动子序列有效连接以产生报道构建体,将报道构建体导入植物的基因组,从而该报道构建体整合至所产生的转基因植物的每种组织中,并且检测报道基因在转基因植物的不同组织中的表达(例如,检测mRNA、蛋白质或由报道基因编码的蛋白质的活性)。相对于报道基因在其他组织中的表达水平,检测到该报道基因在一种或多种组织中的更大表达水平表明该启动子对其中检测到更大表达水平的组织是特异性的。用于启动子时,术语“细胞类型特异的”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的细胞中选择性表达,同时相同目的核苷酸序列在相同组织内部的不同类型细胞中相对缺少的表达。用于启动子时,术语“细胞类型特异的”还意指能够促进目的核苷酸序列在单一组织内部的某区域中选择表达的启动子。使用本领域熟知的方法,例如GUS活性染色法、GFP蛋白法或免疫组织化学染色法,可以评估启动子的细胞类型特异性。谈及启动子或源自启动子的表达时,术语“组成型”意指能够指导有效连接的核酸分子在刺激物(例如,热休克、化学品、光等)不存在下在大部分植物组织和细胞中贯穿植物或植物部分的基本上整个生活期限转录的启动子。一般而言,组成型启动子能够指导转基因在基本上任何细胞和任何组织中的表达。
[0107] 启动子特异性:谈及启动子时,术语“特异性”意指由相应启动子引起的表达的样式。特异性描述了植物或其部分的组织和/或发育状态,在其中该启动子引起处于相应启动子控制下的核酸分子表达。启动子的特异性也可以包含环境条件,在所述环境条件下可以激活或下调该启动子,如由生物胁迫或环境胁迫如寒冷、干旱、受伤或感染诱导或阻遏。
[0108] 纯化:如本文中所用,术语“纯化的”指从其天然环境取出、分离或分开的分子,即核酸序列或氨基酸序列。“基本上纯化的”分子至少60%没有、优选地至少75%没有和更优选地至少90%没有与它们天然结合在一起的其他组分。纯化的核酸序列可以是分离的核酸序列。
[0109] 重组:就核酸分子而言,术语“重组”指通过重组DNA技术产生的核酸分子。重组核酸分子也可以包括本身不存在于自然界中但是被人修饰、改变、突变或操纵的分子。优选地,“重组核酸分子”是在序列方面与天然存在的核酸分子有至少一个核酸不同的非天然存在的核酸分子。“重组核酸分子”也可以包括“重组构建体”,其包含不天然地以这种顺序存在的一系列核酸分子,所述核酸分子优选地有效地连接。用于产生所述重组核酸分子的优选方法可以包括克隆技术、定向或非定向诱变法、合成或重组技术。
[0110] 有义:术语“有义”理解为意指核酸分子,其具有与靶序列互补或相同的序列,例如与蛋白质转录因子结合和参与给定基因表达的序列。根据一个优选的实施方案,该核酸分子包含目的基因和允许表达该目的基因的元件。
[0111] 显著的增加或减少:大于测量技术中固有误差幅度的增加或减少,例如在酶活性或在基因表达方面,优选地是对照酶的活性或对照细胞中的表达增加或减少约2倍或更多,更优选地增加或减少约5倍或更多,并且最优选地增加或减少约10倍或更多。
[0112] 小核酸分子:“小核酸分子”理解为由核酸或其衍生物如RNA或DNA组成的分子。它们可以是双链或单链的,并且其长度在约15和约30bp之间,例如在15和30bp之间,更优选地在约19和约26bp之间,例如在19和26bp之间,甚至更优选地在约20和约25bp之间,例如在20和25bp之间。在一个特别优选的实施方案中,寡核苷酸的长度在约21和约24bp之间,例如在21和24bp之间。在一个最优选的实施方案中,小核酸分子的长度是约21bp和约24bp,例如
21bp和24bp。
[0113] 基本上互补的:在最广意义上,本文中就核苷酸序列相对于参比或靶核苷酸序列而言使用时,术语“基本上互补的”意指这样的核苷酸序列,其具有在基本上互补的核苷酸序列和所述参比或靶核苷酸序列的完全互补序列之间至少60%,更希望地至少70%,更希望地至少80%或85%,优选地至少90%,更优选地至少93%,仍更优选地至少95%或96%,仍旧更优选地至少97%或98%,依旧更优选地至少99%或最优选地100%的同一性百分数(后者等同于本上下文中的术语“同一的”)。优选地,在至少19个核苷酸长度、优选地至少50个核苷酸长度、更优选地核酸序列的全部长度范围内针对所述参比核苷酸序列评估同一性(如果不是,则另外在下文说明)。使用威斯康辛大学GCG的默认GAP分析,GAP的SEQWEB应用,基于Needleman和Wunsch算法(Needleman和Wunsch(1970)J Mol.Biol.48:443-453;如上文定义)实施序列比较。与参比核苷酸序列“基本上互补的”核苷酸序列与该参比核苷酸序列在低严格性条件、优选地中等严格性条件、最优选地高严格性条件(如上文定义)下杂交。
[0114] 转基因:如本文中所用的术语“转基因”指通过实验操作导入细胞的基因组中的任何核酸序列。转基因可以是“内源DNA序列”或“异源DNA序列”(即,“外来DNA”)。术语“内源DNA序列”指这样的核苷酸序列,其天然存在于导入该核苷酸序列的细胞中,只要它相对于天然存在序列不含有一些修饰(例如,点突变、存在可选择标记基因等)。
[0115] 转基因的:当提及生物时,术语“转基因的”意指用重组DNA分子转化生物,优选地稳定转化生物,其中所述重组DNA分子优选地包含与目的DNA序列有效连接的合适启动子。
[0116] 载体:如本文中所用,术语“载体”指能够运输已经与之连接的另一个核酸分子的核酸分子。一种类型的载体是基因组整合的载体,或“整合的载体”,所述载体可以整合至宿主细胞的染色体DNA中。另一个类型的载体是游离型载体,即,能够进行染色体外复制的核酸分子。本文中将能够指导与它们有效连接的基因表达的载体称作“表达载体”。在本说明书中,“质粒”和“载体”互换地使用,除非从上下文显而易见并非如此。设计旨在体外或体内产生如本文所述RNA的表达载体可以含有被任何RNA聚合酶识别的序列,所述的RNA聚合酶包括线粒体RNA聚合酶、RNA pol I、RNA pol II和RNA pol III。这些载体可以用来在根据本发明的细胞中转录想要的RNA分子。将植物转化载体理解为适用于植物转化过程中的载体。
[0117] 野生型:就生物、多肽或核酸序列而言,术语“野生型”、“天然”或“天然来源”意指所述生物是天然存在的或是在至少一种天然存在生物中可获得的,其没有被改变、突变或由人类操作。实施例
[0118] 化学品和常用方法
[0119] 除非另外说明,如(Sambrook等人,1989)所述为本发明的目的进行克隆过程,包括限制性消化、琼脂糖凝胶电泳、核酸的纯化、核酸的连接、细菌细胞的转化、选择和培养。使用Sanger技术(Sanger等人,1977),用激光荧光DNA测序仪(Applied Biosystems,Foster City,CA,USA)进行重组DNA的序列分析。除非另外描述,从Sigma Aldrich(Sigma Aldrich,St.Louis,USA)、Promega(Madison,WI,USA)、Duchefa(Haarlem,The Netherlands)或Invitrogen(Carlsbad,CA,USA)获得化学品和试剂。限制性核酸内切酶来自New England Biolabs(Ipswich,MA,USA)或Roche Diagnostics GmbH(Penzberg,Germany)。寡核苷酸由Eurofins MWG Operon(Ebersberg,Germany)合成。
[0120] 实施例1:从具有组成型表达的基因鉴定增强核酸表达的核酸(NEENA)
[0121] 1.1从拟南芥(A.thaliana)基因鉴定NEENA分子
[0122] 使用公开可获得的基因组DNA序列(例如http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html)和转录物表达数据(例如http://
www.weigelworld.org/resources/microarray/AtGenExpress/),选择源自高度表达性组成型基因的拟南芥(Arabidopsis thaliana)转录物中的一组18个潜在NEENA候选物用于详细分析。此外,该分析中还包括源自欧芹的推定的NEENA分子。候选物命名如下:
[0123] 表1:组成型NEENA候选物(NEENAc)。
[0124]
[0125]
[0126] 1.2NEENA候选物的分离
[0127] 使用Qiagen DNeasy Plant Mini试剂盒(Qiagen,Hilden,Germany)从拟南芥绿色组织提取基因组DNA。对于具有SEQ ID  NO1的推定的NEENA分子,使用载体构建体1bxPcUbi4-2GUS(WO 2003102198)的DNA。通过常规的聚合酶链反应(PCR)分离含有推定的NEENA分子的基因组DNA片段。该聚合酶链反应包含19组引物(表2)。基于具有多种NEENA候选物的拟南芥基因组序列设计出引物。将载体构建体1bxPcUbi4-2GUS(WO 2003102198)的核苷酸序列用于设计引物(SEQ ID NO56和57),所述引物用于扩增带有SEQ ID NO1的NEENA候选物(表2)。该聚合酶链反应遵从由Phusion高保真DNA聚合酶(目录编号F-540L,New England Biolabs,Ipswich,MA,USA)概述的方案。使用分离的DNA作为利用以下引物的PCR扩增中的模板DNA:
[0128] 表2:引物序列
[0129]
[0130]
[0131]
[0132] PCR期间按以下组成实施扩增(50微升):
[0133] 3.00微升拟南芥基因组DNA(50ng/微升基因组DNA,5ng/微升载体构建体)
[0134] 10.00微升5x Phusion HF缓冲液
[0135] 4.00微升dNTP(2.5mM)
[0136] 2.50微升正向引物(10μM)
[0137] 2.50微升反向引物(10μM)
[0138] 0.50微升Phusion HF DNA聚合酶(2U/微升)
[0139] 将递降方法用于以下参数的PCR:98.0℃30秒(1个循环),98.0℃30秒,56.0℃30秒和72.0℃60秒(4个循环),额外4个循环,每个循环的复性温度是:54.0℃,51.0℃和49.0℃,随后20个循环:98.0℃30秒,46.0℃30秒和72.0℃60秒(4个循环)及72.0℃5分钟。将扩增产物载于2%(w/v)琼脂糖凝胶上并且在80V分离。将PCR产物从该凝胶切下并且用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。用KpnI(10U/微升)和NcoI(10U/微升)或EcoRV(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物再次用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
[0140] 1.3载体构建
[0141] 1.3.1产生带有潜在NEENA分子的载体构建体
[0142] 使用Multisite Gateway系统(Invitrogen,Carlsbad,CA,USA),将启动子::NEENA::报道基因盒装配入用于植物转化的双元构建体。将拟南芥p-AtNit1(At3g44310,GenBank X86454;WO03008596,前缀p-指启动子)启动子用于报道基因构建体中,并且将萤火虫萤光素酶(Promega,Madison,WI,USA)用作报道蛋白以定量地测定待分析的推定的NEENA分子的表达增强作用。
[0143] 根据制造商手册(Invitrogen,Carlsbad,CA,USA),在任一端处带有位点特异性重组位点的基因组DNA(见上文)上,用引物p-AtNit1-for和p-AtNit1-rev(表3),通过pDONR/A载体和p-AtNit1扩增产物之间的位点特异性重组(BP反应)克隆携带有p-AtNit1启动子的pENTR/A载体。对阳性pENTR/A克隆进行序列分析以确保p-AtNit1启动子的正确性。
[0144] 表3:引物序列(p-AtNit1)
[0145]
[0146] 产生ENTR/B载体,其含有萤火虫萤光素酶编码序列(Promega,Madison,WI,USA),后接t-nos胭脂碱合酶转录终止子(Genbank V00087)。使用KpnI和NcoI或EcoRV限制酶,将NEENA候选物PCR片段(见上文)分别克隆在萤火虫萤光素酶编码序列的上游。表4中汇总所产生的pENTR/B载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
[0147] 表4:带有和不带有NEENA候选物的全部pENTR/B载体
[0148]
[0149]
[0150] 通过经KpnI和HindIII限制性位点导入一个多克隆位点(SEQ ID NO60)构建pENTR/C载体。通过进行位点特异性重组(LR反应),根据制造商(Invitrogen,Carlsbad,CA,USA)的Multisite Gateway手册,将产生的pENTR/A、pENTR/B和pENTR/C与pSUN目的载体(pSUN衍生物)组合。所述反应产生了具有p-AtNit1启动子、萤火虫萤光素酶编码序列c-LUC和t-nos终止子的1个双元载体和紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1、NO2、NO3、NO4、NO5、NO6、NO7、NO8、NO9、NO10、NO11、NO12、NO13、NO14、NO15、NO16、NO17、NO18和NO19的19个载体(表5),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO61)。
除了SEQ ID NO2至NO19变化外,全部载体中的核苷酸序列是相同的(表5)。表5中汇总所产生的植物转化载体。
[0151] 表5:用于拟南芥转化的植物表达载体
[0152]
[0153]
[0154] 所产生的载体随后用来瞬时转化拟南芥叶原生质体。
[0155] 1.3.2海肾(Renilla)萤光素酶对照构建体
[0156] 使用10ng来自Promega(Madison,WI,USA)的质粒pRL-null作为DNA模板并且使用引物R-LUC_for和R-LUC_rev(表6),以如上文所述的PCR参数,扩增海肾萤光素酶cDNA。
[0157] 表6:引物序列(c-RLUC)
[0158]
[0159]
[0160] 用KpnI(10U/微升)和SacI(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物再次用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
[0161] 将片段通过KpnI和SacI限制性位点克隆至含有胭脂碱合酶组成型启动子p-nos(Genbank V00087)接续t-nos胭脂碱合酶转录终止子(Genbank V00087)的ENTR/B载体中,从而产生pENTR/B克隆,对所述pENTR/B克隆进行序列分析以确保含有海肾萤光素酶的表达盒的正确性。
[0162] 实施例2:筛选在瞬时转化的拟南芥叶原生质体中增强基因表达的NEENA候选分子[0163] 本实施例说明仅选择的NEENA分子能够增强基因表达。
[0164] 2.1拟南芥叶原生质体的分离和瞬时转化
[0165] 根据建立的方案(Damm和Willmitzer,1988;Damm等人,1989)修订拟南芥叶原生质体的分离和瞬时转化。将4周龄拟南芥植物的叶用剃须刀片切成小片并且转移至具有1.5%纤维素酶R10(Duchefa,Haarlem,The Netherlands)、0.3%离析酶R10(Duchefa,Haarlem,The Netherlands)、400mM甘露醇、20mM KCl、20mM MES、10mM CaCl2、pH5.7的溶液,并且在室温孵育过夜。鉴于瞬时拟南芥叶原生质体转化法的变异性,使用海肾萤光素酶(双萤光素酶 报道分子测定系统,Promega,Madison,WI,USA)来归一化上述构建体的萤火虫萤光素4
酶表达能力。使用PEG(聚乙二醇)和1x 10 个原生质体,一式三份用6微克质粒DNA进行无NEENA的载体构建体(LJK132)和每种含NEENA的载体构建体(LJK66–LJK114)的瞬时转化,所述质粒在转化前与25微克含有海肾萤光素酶的构建体混合。
[0166] 2.2双萤光素酶报道基因测定法
[0167] 通过以100g离心收集转染的拟南芥原生质体并且在除去上清液后冷冻于液氮中。根据制造商(Promega,Madison,WI,USA)的双萤光素酶报道分子分析系统手册进行转染细胞中检测萤火虫和海肾萤光素酶活性的测定法。发光测量在MicroLumat Plus LB96V
(Berthold Technologies,Bad Wildbad,Germany)中实施,在添加萤光素酶底物后记录。通过产生萤火虫萤光素酶和海肾萤光素酶之间的比率,使两种萤光素酶记录的仪器读数归一化。来自三个实验的数据对每种构建体平均化,并且基于这些平均表达值,计算倍数变化值以评估推定的NEENA的存在对缺少相应推定的NEENA的报道基因构建体的影响。与仅有p-AtNit1启动子缺少NEENA的报道基因构建体相比,19个含有NEENA候选物的受检构建体显示阴性作用以及阳性作用,范围从0.1倍至18.1倍萤火虫萤光素酶活性诱导作用(图1)。总计,基于萤光素酶报道基因活性,与缺少NEENA仅有启动子的报道基因构建体相比(图1),包含SEQ ID NO1、NO2、NO3、NO4、NO5、NO6、NO7、NO8和NO9序列的9个推定的NEENA分子引起基因表达增加大于2倍,并且因而是有功能的NEENA分子。由于众多的受检NEENA候选分子对基因表达增强作用产生边际的或甚至负性影响,故并非全部推定的NEENA分子介导共同的刺激性作用,而是选择的NEENA序列传递显著的基因表达增强作用(SEQ ID NO.1至9)。
[0168] 实施例3:在油籽油菜植物中测试用于增强基因表达的NEENA分子
[0169] 本实施例说明与缺少NEENA仅有启动子的方法相比,NEENA分子可以跨物种使用以增强全部受检组织中的基因表达。
[0170] 选择预筛选中介导最强基因表达增强作用的NEENA分子(参考实施例2,SEQ ID NO1、NO2、NO3、NO4和NO5)用于测定对转基因油籽油菜植物中基因表达水平的增强作用。
[0171] 3.1构建用于欧洲油菜植物转化的载体
[0172] 为了转化油籽油菜植物,将具有或没有基因表达控制分子(SEQ IDs NO1–NO5)的报道基因表达盒与pENTR/C载体内部携带用于检测转基因植物品系的选择标记基因的基因表达盒组合。如前文所述(见上文1.4),通过进行位点特异性重组(LR反应),根据制造商(Invitrogen,Carlsbad,CA,USA)的Multisite Gateway手册,将携带所述选择标记盒的pENTR/A、pENTR/B和pENTR/C与pSUN目的载体组合。所述反应产生了具有p-AtNit1启动子、萤火虫萤光素酶编码序列c-LUC、t-nos终止子和所述选择标记盒的1个双元载体,以及紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1、NO2、NO3、NO4和NO5的5个载体(表7),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO64)。除了SEQ ID NO2至NO5变化外,全部载体中的核苷酸序列是相同的(表7)。表7中汇总所产生的植物转化载体:
[0173] 表7:用于欧洲油菜(B.napus)转化的植物表达载体
[0174]
[0175] 3.2转基因油菜籽植物的产生(根据Moloney等人,1992,Plant Cell Reports,8:238-242的修订方案)
[0176] 在产生转基因油菜籽植物的准备工作中,将所述双元载体转化至根癌农杆菌C58C1:pGV2260(Deblaere等人,1985,Nucl.Acids.Res.13:4777-4788)中。将携带相应双元构建体的农杆菌的过夜培养物的1:50稀释物在Murashige-Skoog培养基(Murashige和
Skoog,1962,Physiol.Plant 15,473)的补充有3%蔗糖的培养基(3MS培养基)中培育。为转化油菜籽植物,将无菌植物的叶柄或下胚轴与1:50农杆菌溶液孵育5–10分钟,随后在黑暗下25℃于补充有0.8%细菌培养用琼脂的3MS培养基上共孵育3日。在3日后,将外植体转移至含有500mg/l凯福隆(头孢噻肟-钠)、100nM咪唑烟(Imazetapyr)、20μM苄氨基嘌呤(BAP)和1.6g/l葡萄糖的MS-培养基中于16小时光照/8小时黑暗的光照方案下,该过程以每周期间重复。将正在生长的幼苗转移至含有2%蔗糖、250mg/l凯福隆和0.8%细菌培养用琼脂的MS-培养基。3周后,将生长激素2-吲哚丁酸添加至该培养基以促进根形成。根发育后,将幼苗转移至土壤,在生长室中培育2周并且在温室条件下培育直至成熟。
[0177] 3.3植物分析
[0178] 组织样品从产生的转基因植物中自叶、花和长角果收集,贮藏在-80℃的冰箱中,进行萤光素酶报道基因测定(根据Ow等人,1986的修订方案)。在研磨后,将冷冻的组织样品重悬于800微升缓冲液I(0.1M磷酸盐缓冲液pH7.8,1mM DTT(Sigma Aldrich,St.Louis,MO,USA),0.05%Tween 20(Sigma Aldrich,St.Louis,MO,USA))中,随后以10000g离心10分钟。将75微升含水上清液转移至96孔平板。在添加25微升缓冲液II(80mM甘氨酰甘氨酸(Carl Roth,Karlsruhe,Germany),40mM MgSO4(Duchefa,Haarlem,The Netherlands),60mM ATP(Sigma Aldrich,St.Louis,MO,USA),pH 7.8)和D-萤光素至终浓度0.5mM(目录编号:L-
8220,BioSynth,Staad,Switzerland)后,在MicroLumat Plus LB96V(Berthold 
Technologies,Bad Wildbad,Germany)中记录发光,从而产生单位,是相对光照单位RLU/分钟(RLU/min)。
[0179] 为了归一化样品之间的萤光素酶活性,与萤光素酶活性平行地测定上清水液中的蛋白质浓度(改编自Bradford,1976,Anal.Biochem.72,248)。将缓冲液I中的5微升细胞水质提取物与250微升Bradford试剂(Sigma Aldrich,St.Louis,MO,USA)混合,在室温孵育10分钟。在平板读数仪(Thermo Electron Corporation,Multiskan Ascent 354)中在595nm测定吸收。用事先产生的标准浓度曲线计算出样品中的总蛋白量。从RLU/min和mg蛋白质/ml样品的比率中产生的值对携带相同构建体的转基因植物平均化,并且计算倍数变化以评估NEENA分子存在对缺少NEENA的报道基因构建体的影响。
[0180] 3.4NEENA序列在油籽油菜植物中介导强烈的基因表达增强作用
[0181] 为评估所选择NEENA分子(SEQ ID NO:1、2、3、4和5)在油籽油菜植物中增强基因表达的潜力,收集具有相同发育阶段并且在同等生长条件下培育的植物的叶、花和携带种子的长角果。样品取自独立的转基因油籽油菜植物品系,所述的转基因油籽油菜植物品系携带仅有启动子的报道基因构建体或含有NEENA(SEQ ID NO1,2,3,4和5)的萤光素酶报道基因构建体。从每个转基因事件收集10粒种子,加工并如上文所述(实施例3.3)分析萤光素酶活性。
[0182] 与仅有组成型p-AtNit1启动子缺少NEENA的报道基因构建体相比,5个受检NEENA分子均在叶组织中介导强烈的基因表达增强作用(图2,a)。在油籽油菜的花和包含种子的长角果中检测到由NEENA(SEQ ID NO1、2、3、4和5)介导的可比较的基因表达增强作用(图2,b和c)。
[0183] 实施例4:在大豆植物中分析基因表达的组成型增强作用
[0184] 本实施例说明与缺少NEENA仅有启动子的方法相比,NEENA分子可以在广泛类型的植物物种中并且跨越不同植物科的物种界限使用以增强全部组织中的基因表达。
[0185] 选择预筛选中介导最强基因表达增强作用的NEENA序列分子(参考实施例2,SEQ ID NO1、2、3、4和5)用于测定对转基因大豆植物中基因表达水平的增强作用。将植物表达载体LJK138、LJK139、LJK141、LJK142、LJK143和LJK144(参考实施例3.1)用于稳定的大豆转化。
[0186] 4.1转基因大豆植物的产生(根据WO2005/121345;Olhoft等人,2007的修订方案)[0187] 大豆种子萌发、繁殖、发根农杆菌和腋生分生组织外植体制备和接种如先前所述进行(WO2005/121345;Olhoft等人,2007),除了使用的构建体LJK138、LJK139、LJK141、LJK142、LJK143和LJK144(参考实施例3.1)各自含有受欧芹遍在蛋白启动子PcUbi4-2驱动的突变AHAS基因,所述的突变AHAS基因介导耐受用于选择的咪唑啉酮除草剂。
[0188] 4.2NEENA序列在大豆植物中介导强烈的基因表达增强作用
[0189] 从产生的转基因植物中自叶、花和种子收集组织样品。组织样品如上文所述(参考实施例3.3)加工和分析。
[0190] 与仅有组成型p-AtNit1启动子缺少NEENA的报道基因构建体相比,5个受检NEENA分子均在叶中介导强烈的基因表达增强作用(图3a)。在大豆的花和长角果中检测到由NEENA(SEQ ID NO1至NO 5)介导的可比较的基因表达增强作用(图3,b和c)。
[0191] 实施例5:在单子叶植物中分析NEENA活性
[0192] 本实施例描述在单子叶植物中对具有SEQ ID NO 1、2、3、4和5的NEENA序列的分析。
[0193] 5.1载体构建
[0194] 为在单子叶植物中分析具有SEQ ID NO 1、2、3、4和5的NEENA序列,将携带表达盒的基于pUC的表达载体与接续胭脂碱合酶(NOS)转录终止子的β-葡糖苷酸酶(GUS)基因的编码序列组合,其中所述的表达盒包含缺少NEENA的来自玉米(Z.mais)的组成型单子叶启动子p-Ubi。使用Qiagen DNeasy Plant Mini试剂盒(Qiagen,Hilden,Germany)从拟南芥绿色组织提取基因组DNA。通过常规的聚合酶链反应(PCR)分离含有NEENA分子的基因组DNA片段。基于具有多种NEENA候选物的拟南芥基因组序列设计出引物。该反应包含5组引物(表8)并且使用以下引物,遵从由Phusion高保真DNA聚合酶(目录编号F-540L,New England Biolabs,Ipswich,MA,USA)概述的方案:
[0195] 表8:引物序列
[0196]
[0197]
[0198] PCR期间的扩增和扩增产物的纯化如上述那样(实施例1.2)实施。用AscI(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
[0199] 使用AscI限制性位点,将NEENA PCR片段(见上文)分别克隆在β-葡糖苷酸酶编码序列的上游。所述反应产生了具有p-Ubi启动子、β-葡糖苷酸酶编码序列c-GUC和t-nos终止子的1个双元载体,以及紧邻β-葡糖苷酸酶编码序列上游携带SEQ ID NO1、NO2、NO3、NO4和NO5的5个载体(表9),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ IDNO75)。除了SEQ ID NO2至NO5变化外,全部载体中的核苷酸序列是相同的(表9)。表9中汇总所产生的载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
[0200] 表9:植物表达载体
[0201]
[0202] 使用所产生的载体在下文概述的实验中分析NEENA分子(实施例5.2)
[0203] 5.2在单子叶植物组织中分析增强基因表达的NEENA分子
[0204] 这些实验通过轰击单子叶植物组织或培养细胞(实施例6.2.1)、通过PEG介导(或相似方法学)将DNA导入植物原生质体(实施例6.2.2)或通过农杆菌介导的转化(实施例6.3.3)进行。用于这些实验的靶组织可以是植物组织(例如叶组织)、培养的植物细胞(例如墨西哥黑色甜玉米(Black Mexican Sweet Corn,BMS)或用于农杆菌方案的植物胚。
[0205] 5.2.1使用微抛射体轰击的瞬时测定法
[0206] 使用Qiagen质粒试剂盒(目录号12143)分离质粒构建体。根据Sanford等人,(1993)(Optimizing the biolistic process for different biological applications(为不同生物学应用优化生物射弹方法).Methods in Enzymology,217:483-509)描述的方案,将DNA沉淀在0.60μM金粒子(Bio-Rad目录编号165-2262),并且使用PDS-1000/He系统装置(Bio-Rad)加速到靶组织(例如2周龄玉米叶、BMS培养的细胞等)。
[0207] 全部DNA沉淀步骤和轰击步骤在无菌条件下在室温进行。悬浮培养的墨西哥黑色甜玉米(BMS)细胞在BMS细胞培养液体培养基[Murashige和Skoog(MS)盐(4.3g/L),3%(w/v)蔗糖,肌醇(100mg/L),3mg/L 2,4-二氯苯氧乙酸(2,4-D),酪蛋白水解物(1g/L),硫胺素(10mg/L)和L-脯氨酸(1.15g/L),pH 5.8]中增殖。每周转移10mL稳定期细胞的培养物至40mL新鲜培养基并且在110转/分钟运转的回转摇床上的250mL烧瓶中于27℃培养。
[0208] 将硅化Eppendorf管中的60mg金粒子重悬于100%乙醇中,随后离心30秒。将沉淀在100%乙醇中淋洗1次并且在无菌水中淋洗2次,每次洗涤后离心。沉淀最终重悬于1mL无菌50%甘油中。随后将金悬液分成50微升等份并且在4℃贮藏。添加以下试剂至一等份中:5微升的1微克/微升总DNA,50微升2.5M CaCl2,20微升0.1M亚精胺,游离碱。将DNA溶液涡旋混合1分钟并置于-80℃持续3分钟,随后离心10秒。除去上清液。通过轻击该管小心地使沉淀重悬于1mL 100%乙醇中,随后离心10秒。除去上清液,并且将沉淀小心地重悬于50微升100%乙醇中并置于-80℃直至使用(轰击前30分钟至4小时)。如果在溶液中可见到金聚集物,则将管在临用前才在水浴超声波仪中超声处理1秒。
[0209] 为了轰击,将2周龄的玉米叶切成长度大约1cm的条并且近轴侧向上放置在渗透性诱导培养基M-N6-702[N6盐(3.96g/L),3%(w/v)蔗糖,1.5mg/L 2,4-二氯苯氧乙酸(2,4-D),酪蛋白水解物(100mg/L)和L-脯氨酸(2.9g/L),MS维生素母液(1mL/L),0.2M甘露醇,0.2M山梨醇,pH 5.8]上。将叶条孵育1-2小时。
[0210] 在BMS培养的细胞的情况下,在Beckman/Coulter Avanti J25离心机中以1000g沉淀1周龄的悬浮细胞,并且弃去上清液。使用刮铲,将细胞置于一张作为1/16英寸厚层的圆形、无尘42号Whatman滤纸上。将承载植物材料的滤纸安置在27℃黑暗下的渗透性诱导培养基上持续1-2小时,随后轰击。就在轰击前,将滤纸从培养基取下并置于上一叠无菌滤纸上以允许愈伤组织表面部分地干燥。
[0211] 对于叶材料,每个平板用6μL金-DNA溶液以1800psi射击2次,并且对于BMS培养的细胞,以1100psi射击2次。为保持植物材料的位置,将一张消毒的金属网铺在样品的顶部。轰击后,将承载样品的滤纸转移到缺少甘露醇和山梨醇的M-N6-702培养基上并且在瞬时测定法之前于27℃在黑暗下孵育2日。
[0212] 使用例如Wang等人,1988(Transient expression of foreign genes in rice,wheat and soybean cells following particle bombardment(粒子轰击后外来基因在稻细胞、小麦细胞和大豆细胞中的瞬时表达).Plant Molecular Biology,11(4),433-439),Christou,1997(Rice transformation:bombardment(稻转化:轰击).Plant Mol Biol.35(1-2))中描述的技术,借助于微抛射体轰击其他单子叶植物实施瞬时转化。
[0213] 使用本领域方法,通过GUS染色、发光/荧光定量、RT-PCR和蛋白丰度(由特异性抗体检测)测定上述构建体(实施例5.1)中表达的基因的表达水平。GUS染色通过如下方式进行:将植物材料在GUS溶液[100mMNaHPO4,10mM EDTA,0.05%Triton×100,0.025%X-Gluc溶液(溶解于DMSO中的5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸),10%甲醇,pH 7.0]中在37℃孵育16-24小时。将植物组织真空浸润2次持续15分钟以辅助均匀染色。萤光素酶活性的分析如上文所述(实施例2和3.3)进行。
[0214] 与仅有组成型p-Ubi启动子缺少NEENA的报道基因构建体相比,所述NEENA分子均在这些测定法中介导强烈的基因表达增强作用。
[0215] 5.2.2使用原生质体的瞬时测定法
[0216] 通过遵循Sheen(1990)(Metabolic Repression of Transcription in Higher Plants(高等植物中转录的代谢抑制).The Plant Cell 2(10),1027-1038)开发的方案,实施原生质体的分离。将玉米籽苗在黑暗中于25℃培育10日并且在原生质体制备之前光照20小时。将叶的中间部分切成0.5mm的条(长度约6cm)并且在23℃在含有1%(w/v)纤维素RS、0.1%(w/v)离析酶R10(两者均来自日本西宫Yakult Honsha)、0.6M甘露醇、10mM Mes(pH 
5.7)、1mM CaCl2、1mM MgCl2、10mMβ-巯基乙醇和0.1%BSA(w/v)的酶溶液中孵育3小时,随后以80转/分钟轻轻振摇以释放原生质体。将原生质体通过100x g离心2分钟收集,在冷的
0.6M甘露醇溶液中洗涤1次,离心并且重悬于冷的0.6M甘露醇(2x 106/mL)中。
[0217] 将总体积100微升无菌水中的总计50微克质粒DNA添加至0.5mL玉米原生质体悬液(1x 106个细胞/mL)并且轻柔地混合。将0.5mL PEG溶液(40%PEG 4000,100mM CaNO3,0.5甘露醇)添加并在70℃预温,伴以轻柔振摇,随后添加4.5mL MM溶液(0.6M甘露醇,15mM MgCl2和0.1%MES)。该混合物在室温孵育15分钟。将原生质体通过600转/分钟沉淀5分钟并重悬于1.0mL的MMB溶液[0.6M甘露醇,4mM Mes(pH 5.7)和雀麦花叶病毒(BMV)盐(任选)]中洗涤2次,并且在25℃于黑暗下温育48小时。在终末洗涤步骤后,将原生质体收集于3mL MMB培养基中,并且在25℃于黑暗下温育48小时。
[0218] 使用例如在Hodges等人,1991(Transformation and regeneration of rice protoplasts(稻原生质体的转化和再生).Biotechnology in agriculture No.6,Rice Biotechnology.International Rice Research Institute,ISBN:0-85198-712-5)或Lee等人,1990(Transient gene expression in wheat(Triticum aestivum)protoplasts(小麦(Triticum aestivum)原生质体中的瞬时基因表达).Biotechnology in agriculture and forestry 13–Wheat.Springer Verlag,ISBN-10:3540518096)中描述的技术,实施其他单子叶植物原生质体的瞬时转化。
[0219] 使用本领域方法,通过GUS染色、发光/荧光定量、RT-PCR或蛋白丰度(由特异性抗体检测)测定上述构建体(实施例5.1)中表达的基因的表达水平。GUS染色通过如下方式进行:将植物材料在GUS溶液[100mM NaHPO4,10mM EDTA,0.05%Triton×100,0.025%X-Gluc溶液(溶解于DMSO中的5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸),10%甲醇,pH 7.0]中在37℃孵育16-24小时。萤光素酶活性的分析如上文所述(实施例2和3.3)进行。
[0220] 与仅有组成型p-Ubi启动子缺少NEENA的报道基因构建体相比,所述NEENA分子在这些测定法中介导强烈的基因表达增强作用。
[0221] 5.2.3单子叶作物植物的转化和再生
[0222] 也可以为了转化作物植物的目的而实施使用标准转化和再生技术的农杆菌介导的植物转化法(Gelvin和Schilperoort,1995,Plant Molecular Biology Manual,第2版,Dordrecht:Kluwer Academic Publ.ISBN 0-7923-2731-4;Glick和Thompson(1993)Methods in Plant Molecular Biology and Biotechnology,Boca Raton:CRC Press,
ISBN 0-8493-5164-2)。可以使用例如US 5,591,616中描述的技术实施玉米或其他单子叶植物的转化。使用粒子轰击、聚乙二醇介导的DNA摄取或借助碳酸硅纤维技术的植物转化法例如由Freeling和Walbot(1993)“The maize handbook(玉米手册)”ISBN 3-540-97826-7,Springer Verlag New York)描述。
[0223] 使用本领域方法,通过GUS染色、发光或荧光定量、RT-PCR、蛋白丰度(由特异性抗体检测)测定上述构建体(实施例5.1)中表达的基因的表达水平。GUS染色通过如下方式进行:将植物材料在GUS溶液[100mM NaHPO4,10mM EDTA,0.05%Triton×100,0.025%X-Gluc溶液(溶解于DMSO中的5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸),10%甲醇,pH 7.0]中在37℃孵育16-24小时。将植物组织真空浸润2次持续15分钟以辅助均匀染色。萤光素酶活性的分析如上文所述(实施例2和3.3)进行。
[0224] 与仅有组成型p-Ubi启动子缺少NEENA的报道基因构建体相比,所述NEENA分子在植物中介导强烈的基因表达增强作用。
[0225] 实施例6:在谷物植物中定量分析NEENA活性
[0226] 本实施例描述在谷物植物中对具有SEQ ID NO 1和2的NEENA序列的分析。
[0227] 6.1载体构建
[0228] 为在单子叶植物中定量地分析具有SEQ ID NO 1和2的NEENA序列,将携带表达盒的基于pUC的表达载体与接续胭脂碱合酶(NOS)转录终止子的萤火虫萤光素酶(LUC)基因(Promega,Madison,WI,USA)的编码序列组合,其中所述的表达盒包含缺少NEENA的来自玉米(Z.mais)的组成型单子叶启动子p-Ubi。使用Qiagen DNeasy Plant Mini试剂盒(Qiagen,Hilden,Germany)从拟南芥绿色组织提取基因组DNA。通过常规的聚合酶链反应(PCR)分离含有NEENA分子的基因组DNA片段。基于具有多种NEENA候选物的拟南芥基因组序列设计出引物。该反应包含2组引物(表10)并且使用以下引物,遵从由Phusion高保真DNA聚合酶(目录编号F-540L,New England Biolabs,Ipswich,MA,USA)概述的方案:
[0229] 表10:引物序列
[0230]
[0231] PCR期间的扩增和扩增产物的纯化如上述那样(实施例1.2)实施。用MluI(10U/微升)和AscI(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
[0232] 使用AscI限制性位点,将NEENA PCR片段(见上文)分别克隆在萤火虫萤光素酶编码序列的上游。所述反应产生了具有p-Ubi启动子、萤火虫萤光素酶编码序列c-LUC和t-nos终止子的1个双元载体,以及紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1和NO2的2个载体(表11),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO80)。除了SEQ ID NO2变化外,所述载体中的核苷酸序列是相同的(表11)。表11中汇总所产生的载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
[0233] 表11:植物表达载体
[0234]
[0235] 使用所产生的载体在下文概述的实验中分析NEENA分子(实施例6.2)
[0236] 6.2转基因玉米植物的产生
[0237] 玉米萌发、繁殖、根癌农杆菌制备和接种如先前所述进行(WO2006136596,US20090249514),除了使用的构建体LJK309,LJK326和LJK327(参考实施例6.1)各自含有受谷物遍在蛋白启动子p-Ubi驱动的突变AHAS基因,所述的突变AHAS基因介导耐受用于选择的咪唑啉酮除草剂。
[0238] 6.3NEENA序列在玉米植物中介导强烈的基因表达增强作用
[0239] 从产生的转基因植物中自叶和谷粒收集组织样品。组织样品如上文所述(参考实施例3.3)加工和分析。
[0240] 与仅有组成型p-Ubi启动子缺少NEENA的报道基因构建体相比,2个受检NEENA分子在叶中介导强烈的基因表达增强作用(图4a)。在玉米谷粒中检测到由NEENA(SEQ ID NO1至NO 2)介导的可比较的基因表达增强作用(图4b)。
[0241] 实施例7:在稻植物中定量分析NEENA活性
[0242] 本实施例描述在稻植物中对具有SEQ ID NO 1的NEENA序列的分析。
[0243] 7.1载体构建
[0244] 为在稻植物中定量地分析具有SEQ  ID NO 1的NEENA序列,根据制造商(Invitrogen,Carlsbad,CA,USA)Gateway手册,使用位点特异性重组(LR反应),将pENTR/B载体LJK1和LJK4(比较实施例1.3)与重组位点上游携带组成型PRO0239启动子的目的载体组合。所述反应产生了具有PRO0239启动子、萤火虫萤光素酶编码序列c-LUC和t-nos终止子的1个双元载体,以及紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1的1个载体(表
12)。表12中汇总所产生的载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
[0245] 表12:植物表达载体
[0246]
[0247] 使用所产生的载体在下文概述的实验中分析NEENA分子(实施例7.2)
[0248] 7.2转基因稻植物的产生
[0249] 使用含有相应表达载体的农杆菌来转化稻(Oryza sativa)植物。将粳稻栽培品种日本晴(Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗下孵育4周后,将生胚性盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。生胚性愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
[0250] 将含有相应表达载体的农杆菌菌株LBA4404用于共培育。将农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并且在液体共培育培养基中悬浮至密度(OD600)约1。随后将混悬液转移至培养皿内,并且将所述愈伤组织浸入该混悬液中15分钟。将所述愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并且在25℃于黑暗下孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗下在选择剂存在时培育4周。在此期间,迅速生长的抗性愈伤组织团发育。在转移这种材料至再生培养基并在光照下孵育后,生胚潜能释放并且幼苗在随后4至5周内发育。将幼苗从愈伤组织切下并且在含有植物生长素的培养基上孵育2至3周,其中从所述培养基转移幼苗至土壤。硬化的幼苗在温室中在高湿度和短日照下培育。
[0251] 对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在验证T-DNA插入物拷贝数的定量PCR分析后,仅保留显示所述选择剂抗性的单拷贝转基因植物用于收获T1种子。随后在移栽后3至5个月收获种子。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
[0252] 7.3NEENA序列在稻植物中介导强烈的基因表达增强作用
[0253] 从产生的转基因植物中自叶和谷粒收集组织样品。组织样品如上文所述(参考实施例3.3)加工和分析。
[0254] 与仅有组成型p-PRO239启动子缺少NEENA的报道基因构建体相比,受检NEENA分子(SEQ ID NO 1)在叶中介导强烈的基因表达增强作用(图5a)。在稻种子中检测到由NEENA(SEQ ID NO1)介导的强烈的基因表达增强作用(图5b)。
[0255] 附图简述
[0256] 图1:在缺少NEENA(LJK132)和含有NEENA的构建体(LJK91-LJK133)瞬时转化的拟南芥叶原生质体中的萤光素酶报道基因表达分析,其中所述的构建体代表处于p-AtNit1启动子控制下的源自组成型表达的基因的推定的NEENA分子。归一化通过海肾萤光素酶的共转化和分析来进行,并且显示了相对于缺少NEENA的对照构建体(LJK132=1)的表达值。显示了相对于缺少NEENA的对照构建体(LJK134=1)的表达值。
[0257] 图2:独立转基因油籽油菜植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量(平均值,20个所分析的独立转基因植物的组织)归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因油籽油菜植物品系携带缺少NEENA(LJK138)或含有NEENA的报道基因构建体,所述的构建体代表在p-AtNit1启动子控制下组成型表达的基因(LJK139–LJK144)中的NEENA分子。A)叶组织,B)花,C)长角果。
[0258] 图3:独立转基因大豆植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量(平均值,10个所分析的独立转基因植物的组织)归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因大豆植物品系携带缺少NEENA(LJK138)或含有NEENA的报道基因构建体,所述的构建体代表在p-AtNit1启动子控制下组成型表达的基因(LJK139–LJK144)中的NEENA分子。A)叶组织,B)花,C)种子。
[0259] 图4:独立转基因玉米植物品系的显示为相对光照单位(RLU)(对数尺度)并且针对每份样品的蛋白质含量(平均值,15个所分析的独立转基因植物的组织)归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因玉米植物品系携带缺少NEENA(LJK309)或含有NEENA的报道基因构建体,所述的构建体代表在p-ZmUbi启动子控制下组成型表达的基因(LJK326–LJK327)中的NEENA分子。A)叶组织,B)谷粒。
[0260] 图5:独立转基因稻植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量(平均值,15个所分析的独立转基因植物的组织)归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因稻植物品系携带缺少NEENA(CD30963)或含有NEENA的报道基因构建体,所述的构建体代表在组成型p-PRO239启动子控制下组成型表达的基因(CD30964)中的NEENA分子。A)叶组织,B)种子。