一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆与应用转让专利

申请号 : CN201110325278.2

文献号 : CN102352367B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张红生张晓军蓝虹霞王建飞王才林唐海娟

申请人 : 南京农业大学

摘要 :

本发明涉及植物基因工程技术领域,公开了一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆与应用。本发明从水稻中分离克隆一个同时控制水稻籽粒粒长和粒重的主效QTL SEQ ID NO:1及其优势功能的半显性等位基因SEQ ID NO:3,这两个基因具有改良水稻的产量和外观品质的能力。同时克隆并证明了此基因在水稻中的两个同源基因同样具有对水稻籽粒长度的调节作用。因此基因qGL3、其优势等位基因qGL3-D以及基因qGL3的两个同源基因qGL3-L1、qGL3-L2均可在作物遗传改良中应用。

权利要求 :

1.SEQ ID NO:1所示基因qGL3在改良作物粒长和/或粒重中的应用。

2.SEQ ID NO:3所示基因qGL3-D 在改良作物粒长和/或粒重中的应用。

3.SEQ ID NO:5所示基因qGL3-L1 在改良作物粒长和/或粒重中的应用。

4.SEQ ID NO:7所示基因qGL3-L2 在改良作物粒长和/或粒重中的应用。

说明书 :

一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆

与应用

技术领域

[0001] 本发明涉及植物基因工程技术领域,涉及一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆与应用,具体涉及到一个位于水稻第三染色体长臂上的控制籽粒粒长和粒重的主效半显性基因qGL3的基因克隆和作物改良应用。

背景技术

[0002] 随着世界人口的增长,水稻作为主要的粮食作物面临着提高产量的迫切需要。估计到2030年,水稻产量需要提高40%以上才能满足人类的需要。同时,随着人类生活水平的提高,对于水稻的外观品质也提出了越来越高的要求。中国南部、美洲和欧洲国家的人偏向于喜好细长粒型,而中国北部、日本和韩国偏向于喜好短圆粒型(Unnevehr et al.,1992)。为了满足人类的需要,水稻遗传育种学家对水稻的产量和粒型进行了越来越深入的研究。
[0003] 水稻的产量性状是由多基因控制的数量性状,表现为连续变异,受环境的影响较大。在水稻错综复杂的产量因子中,直接构成因子包括粒重、每穗颖花数、有效穗数和结实率。此外,植株高度、分蘖数、穗型、叶型等性状也能间接影响水稻群体的产量。产量的形成是这些众多性状在特定环境条件下共同作用的结果。
[0004] 尽管粒重是受多基因控制的数量性状,但其较高的遗传力说明该性状可以分离出某些主效基因位点。粒重可以分解为粒长、粒宽、粒厚和灌浆密度等多个组分。早在1980年,Takeda和saito就报道了水稻籽粒长度受单基因LK-f控制;Mckenziedeng(1983)报道认为粒长由2-3个或者更多的基因控制。随着计算机技术为基础的数量遗传分析方法的改进和分子标记的大量开发,人们越来越多的借助于QTLs分析方法来研究水稻粒重和粒形。众多研究者采用不同的遗传群体定位到了有关粒重和粒形的QTL位点约315个(http://www.gramene.org/,截止2011年9月),几乎分布于水稻的所有12条染色体上,而对粒重贡献大的QTL集中分布在第2、3、5、6、8等染色体。这其中有的位点很可能有大量的重复,如关于粒长的QTL LK-4(t)、gl-3、gw3.1、GW3与克隆的GS3处于相同的染色体区间。
[0005] 近十多年来,由于水稻基因组计划的完成,一些水稻粒重、穗粒数、分蘖、株高、株型等水稻产量相关基因得到分离。有多个粒重相关基因被克隆,包括第3染色体上的控制粒长的基因GS3,SRS3和位于第5染色体的D1;位于第2染色体上控制粒宽的GW2和第5染色体上的粒宽基因qSW5/GW5。GS3是由范楚川等于2006年利用长粒水稻材料明恢63与短粒材料川7构建的BC3F2群体定位得到的。它是一个位于水稻第三染色体着丝粒附近的跨膜蛋白。GS3存在三种不同截断部位的等位变异,来自于明恢63的位点(截掉所有功能域,蛋白完全失活)控制长粒型籽粒(9.91±0.10mm,mean±SD),来自于珍汕97的位点(完整功能的蛋白)形成中等粒(8.08±0.07mm),来自于川7的位点(截掉C端TNFR和VWFC功能域,仅保留N端的OSR功能域)形成短粒(6.30±0.09mm)(Mao et al.,2010)。GS3对于籽粒长度的调节是通过控制细胞分裂来调节颖壳纵向的细胞数目来调节的(Mao et al.,2010)。D1是Ashikari等和Fujisawa等(1999)发现的,此基因的功能缺失突变d1会形成不正常的短籽粒,它编码一个G蛋白的a亚基,此类蛋白被认为是激素调控途径处于受体下游的分子开关。SRS3基因是由Kitagawa等(2010)通过突变体的研究发现的。突变基因srs3通过减少颖壳纵向的细胞数目降低谷粒的长度形成不正常的谷粒,它是一个驱动蛋白-13家族中的一员。GW2(Song et al.,2007)和GW5/qSW5(Wan et al.,2008;Shomura et al.,2008)是两个控制水稻籽粒宽度的QTL位点,这两个基因均是功能缺失型突变导致籽粒颖壳横向细胞分离增多,进而导致横向细胞数目的增加形成较宽的籽粒。初步研究证明GW2是一个RING型的E3泛素连接酶,而qSW5/GW5是一个未知功能的蛋白,酵母双杂发现它的一个互作蛋白也是一种多聚泛素,是否两个位点通过同一个泛素蛋白酶体分子途径调节了籽粒的宽度还有待进一步研究。
[0006] 另外一些控制水稻粒重或粒型的QTL位点也到了精细定位可以通过分子标记辅助选择的程度,例如gw8.1(Xie et al.,2006),gw9.1(Xie et al.,2008)和GW6(Guo et al.,2009),但是还没有获得克隆和进一步的功能验证。在其他粮食作物中关于粒重或者粒型的研究也取得了一定的进展(Gegas et al.,2010)。

发明内容

[0007] 本发明的目的是从水稻中分离克隆一个同时控制水稻籽粒粒长和粒重的主效QTL及其优势功能的半显性等位基因的完整编码区段DNA片度,利用这个基因改良水稻的产量和外观品质的能力。同时克隆并证明了此基因在水稻中的两个同源基因同样具有对水稻籽粒长度的调节作用。
[0008] 一种控制水稻籽粒长度和粒重的半显性基因qGL3,核苷酸序列如SEQ ID NO:1所示。
[0009] 所述的基因qGL3编码的蛋白,即SEQ ID NO:1中第219~3230位翻译所对应的氨基酸多肽,氨基酸序列如SEQ ID NO:2所示。
[0010] 所述的基因qGL3的优势等位基因qGL3-D,核苷酸序列如SEQ ID NO:3所示。
[0011] 所述的优势等位基因qGL3-D编码的蛋白,由SEQ ID NO:3中第219~3230位翻译所对应的氨基酸多肽,氨基酸序列如SEQ ID NO:4所示。
[0012] 所述基因qGL3在水稻中的同源基因qGL3-L1,核苷酸序列如SEQ ID NO:5所示,其编码的蛋白序列如SEQ ID NO:6所示,即SEQ ID NO:5中99~2774位翻译所对应的氨基酸多肽。
[0013] 所述基因qGL3在水稻中的同源基因qGL3-L2,核苷酸序列如SEQ ID NO:7所示,其编码的蛋白序列如SEQ ID NO:8所示,即SEQ ID NO:7中78~3107位翻译所对应的氨基酸多肽
[0014] 所述的基因qGL3在作物遗传改良中的应用,优选在改良作物粒长和/或粒重中的应用。
[0015] 所述的基因qGL3-D在作物遗传改良中的应用,优选在改良作物粒长和/或粒重中的应用。
[0016] 所述的基因qGL3-L1在作物遗传改良中的应用,优选在改良作物粒长和/或粒重中的应用。
[0017] 所述的基因qGL3-L2在作物遗传改良中的应用,优选在改良作物粒长和/或粒重中的应用。
[0018] 本发明的有益效果:
[0019] (1)申请者于2005年从水稻地方品种资源材料中发现一份大粒粳稻种质N411,其千粒重达71.1±0.22克。随后分别与小粒籼稻家系05-643、中粒型品种93-11正反杂交以及回交,对粒重及其相关性状展开研究。初步的研究表明,粒重相关性状没有细胞质效应。通过N411/05-643 F2群体的QTL分析,在SSR分子标记RM6266-RM3350区间检测到1个贡献率达52.5%的主效粒长QTL:qGL3,该位点同时对粒重贡献率达31%,此位点物理位置位于已经报道的粒长控制基因GS3的下游8.5Mb左右,序列分析表明N411、05-643、93-11与明恢63具有相同的GS3突变位点。从F2选择携有RM6266-RM3350大粒亲本标记型的个体与05-643、93-11分别回交,进一步通过对93-11回交产生的BC2F2群体的QTL分析确认了这一位点对于粒长和粒重的单因子遗传效应。在此基础上利用籽粒长度出现单因子分离的四个回交BC2F3群体,将qGL3定位在Indel标记xj39和xj26之间约46.6kb的区间内(图
4)。
[0020] 对此区段内的两个预测表达基因在两个亲本中进行克隆测序比较发现,其中一个基因的cDNA序列在两亲本间没有差异。而另外的一个基因在大粒亲本N411和小粒亲本93-11间存在两处突变。具体为:来自于大粒亲本N411的位点(SEQ ID NO:3)与来自于小粒亲本93-11的位点(SEQ ID No.1)相比:一处位于cDNA序列的5`UTR区域的-72位置存在一个单碱基G的缺失;另一处位于第10个外显子上的编码区+1092位置的一个单核苷酸替换:C→A,进而导致蛋白质一个氨基酸的替换:364位的天冬氨酸(Asp,D)转变成了谷氨酸(Glu,E),D364E;将该发生两处突变的基因命名为qGL3-D。对两个基因在背景亲本和近等基因系间的表达比较发现,两个基因在亲本和近等基因系间不存在表达差异。将存在序列差异的基因定为qGL3的候选基因。对此基因的结构和编码蛋白产物的预测和分析,发现该基因由21个外显子和20个内含子构成。编码区长度为3012bp,编码1003个氨基酸的多肽。根据蛋白质功能域预测发现其编码的多肽是一个含有2个kelch重复结构域的丝氨酸/苏氨酸磷酸(酯)酶。在水稻中,此基因是由三个同源基因构成的小家族,申请人将其分别命名为qGL3(SEQ ID NO:1)、qGL3-L1(SEQ ID NO:5)和qGL3-L2(SEQ ID NO:7)。对来自两个亲本的等位基因进一步分析发现,其优势等位基因qGL3-D位于蛋白364位的天冬氨酸(Asp,D)转变成了谷氨酸(Glu,E),D364E,此突变恰好发生在结构域kelch的保守基序AVLDT的D位置上(图5)。对qGL3及其另外两个同源基因qGL3-L1和qGL3-L2的Real-Time PCR表达分析发现,该家族基因在水稻的根、茎、叶片、叶鞘、穗子的不同发育时期组织中表达,优势表达在穗发育的中后期(图6)。通过将此基因的启动子(SEQ ID NO:9)连接GUS基因进行的转基因启动子GUS表达活性分析,同样印证了Real-Time PCR的结果,同时可以发现qGL3在根尖、茎的维管组织、叶片的中脉、叶鞘的外围、顶点生长点、未成熟颖壳的基部、成熟的颖壳中,以及雌蕊的基部优势表达,而不再成熟的花药中表达(图7)。通过对此基因编码蛋白的在洋葱表皮中的亚细胞定位发现:野生型的蛋白(如SEQ ID NO:2所示)分布于整个细胞质中,在细胞核中未有优势分布,而突变后的蛋白(如SEQ ID NO:4所示)分布于细胞质中,同时优势分布于细胞核中(图8)。推断此基因编码的蛋白的亚细胞定位的改变是其发挥不同作用的关键。将野生型基因qGL3(序列如SEQ ID NO:1所示)完整阅读框连接到过表达载体PCAMBIA-1300S中,转化水稻品种中花11中,转基因T0代和转基因T1代超表达阳性单株均表现出变短的粒型,而对穗型和株型没有显著影响(图10)。同时将此基因编码的两个预测的功能域分别截断,如图12,两个截断后多肽存在中间连接区
296个氨基酸的跨叠,构建过表达载体转化水稻品种中花11,OX-Kelch转基因T0代阳性过表达植株表现出变短的粒型而OX-PP2Ac转基因T0代阳性过表达植株的粒型没有发生变化(图12)。这说明在对水稻籽粒长度的调节功能主要来自于kelch结构域,而与PP2Ac结构域关系不大。在水稻品种中花11中对目标基因的RNAi干涉T0代转基因阳性单株及其T1代转基因阳性单株分析发现,表达抑制植株的籽粒都发生了变小(图10)。
[0021] 同时对其中一个同源基因qGL3-L1的插入敲除突变体的表型分析发现:qGL3-L1的功能完全缺失导致籽粒明显变小,同时对qGL3-L1和qGL3-L2的过表达转基因T0代表型分析发现过表达qGL3的同源基因qGL3-L1和qGL3-L2可以微弱使水稻的籽粒增长,图13D。这说明qGL3及其同源基因qGL3-L1和qGL3-L2在调节水稻籽粒长度上具有类似的功能。
[0022] 通过分子标记选择获得的以93-11为背景导入来自大粒亲本N411的等位基因qGL3-D的近等基因系93-11NIL-qGL3-D分析发现:基因qGL3的优势等位变异qGL3-D(如SEQ ID NO:3所示)对于水稻除了使籽粒变长,粒重增加之外,对于其他的农艺表型没有统计学上的改变(如表2;图13)。同时利用此近等基因系93-11NIL-qGL3-D与93-11杂交和作为两系杂交稻恢复系与两系不育系广占63S构建的杂交组合的获得F1的粒型分析发现,来自于大粒亲本的等位变异在杂合状态下同样可以使籽粒长度增加(图14)。同时对水稻品种热研背景的近等基因系(GS3的短粒等位背景gs3)和水稻品种龙里黑糯的近等基因系(D1的短粒等位背景d1)分析发现,qGL3可以掩盖gs3和d1使籽粒长度缩短的效果(图15)。
[0023] 综上结果说明:野生型粒长控制基因qGL3(SEQ ID NO:1)在中花11背景下,无论发生上调还是下调都会使籽粒变短变小。而qGL3的优势等位变异基因qGL3-D(SEQ ID NO:3)发生在kelch结构域中的保守基序AVLDT的D位置上的天冬氨酸(Asp,D)转变成了谷氨酸(Glu,E),引起了此基因编码的蛋白从胞质大量的进入细胞核中,进而发挥了使水稻籽粒变长的功能,这是一种功能获得性的突变。同时证明了qGL3在水稻中的两个同源基因qGL3-L1和qGL3-L2同样具有对水稻籽粒粒长和粒重的调节功能。并且qGL3的优势等位基因qGL3-D(SEQ ID NO:3)作为一个控制水稻籽粒长度的遗传学下游基因,可以很好的拯救上游基因如gs3,d1等的负调控作用,同时半显性特性使其可以用于恢复系的改良进而用于杂交稻育种。
[0024] (2)本发明中克隆的上述基因为水稻等谷类作物的高产优质育种提供了新的基因资源,也为其他作物中克隆相关基因提供了技术借鉴,也可以为水稻、小麦、玉米、高梁等禾谷类作物以及大豆、油菜等双子叶作物的分子进化研究提供证据。

附图说明

[0025] 图1:本发明使用的总体技术路线图。
[0026] 图2:利用N411和05-643构建的分子标记遗传图谱及定位的QTLs。
[0027] 图3:N411与93-11构建的精细定位群体BC2F3中随机206株籽粒表型次数分布图,填充样式显示qGL3位点的基因型。
[0028] 图4:qGL3的精细定位过程图,A.所示2968个个体中标记间的重组个体数目;B.所示进一步更小区间的重组个体数目;C.所示表型与基因型间的高精度连锁分析;D.所示根据日本晴基因组注释所示标记xj39和xi26间的物理距离。
[0029] 图5:禾本科代表植物和拟南芥中qGL3同源基因家族的kelch结构域部分蛋白比对,箭头表示大粒亲本N411中qGL3-D的等位变异:D364E。
[0030] 图6:qGL3及其同源基因qGL3-L1和qGL3-L2的半定量表达分析和实时定量Real-Time PCR表达分析。
[0031] A.所示半定量表达分析,B.所示实时定量表达分析;其中:R:根,C:茎,LB:叶片,LS:叶鞘、PP:2cm-3cm的初级穗,YP:8cm-10cm幼穗,MP:刚要抽出的成熟穗子,YL:未抽出的幼叶。
[0032] 图7:qGL3基因启动子GUS表达活性分析。
[0033] 图8:qGL3基因野生型和优势等位蛋白的亚细胞定位。
[0034] 93-11-qGL3-GFP表示qGL3基因野生型蛋白的亚细胞定位图,N411-qGL3-D-GFP表示qGL3基因突变后的优势等位蛋白的亚细胞定位。
[0035] 图9:过表达转基因载体pCAMBIA-1304、pCAMBIA-1300S和RNA干涉载体pCK303的结构酶切位点图。
[0036] 其中,A为pCAMBIA-1304的结构酶切位点图,B为pCAMBIA-1300S的结构酶切位点图,C为pCK303的结构酶切位点图。
[0037] 图10:过表达和RNAi干涉转基因株系的表达情况检测。
[0038] 其中,A为半定量表达分析结果图,B为实时定量表达分析结果统计图。
[0039] 图11:野生型基因过表达和RNAi干涉转基因株系农艺表型及穗子、籽粒表型。
[0040] 其中,A为野生型基因过表达和RNAi干涉转基因株系农艺表型;B为野生型基因过表达和RNAi干涉转基因株系穗子表型;C为野生型基因过表达和RNAi干涉转基因株系籽粒表型。
[0041] 图12:截断功能域的过表达转基因载体构建所对应的多肽,以及转基因植株对应的籽粒表型。A为截断功能域的过表达转基因载体构建所对应的多肽示意图;B为转基因植株对应的籽粒表型;其中OX-qGL3表示qGL3的过表达转基因载体构建所对应的多肽示意图,OX-kelch表示qGL3中的kelch功能域过表达转基因载体构建所对应的多肽示意图,OX-PP2Ac表示qGL3中的PP2Ac功能域过表达转基因载体构建所对应的多肽示意图。
[0042] 图13:qGL3-L1插入敲除突变体的植株和籽粒表型,以及同源基因qGL3-L1和qGL3-L2过表达转基因植株的籽粒表型。
[0043] 其中,A为野生型东津DJ和突变体qgl3-l1的植株表型,B为野生型东津DJ和突变体qgl3-l1的穗子表型,C为野生型东津DJ和突变体qgl3-l1的籽粒表型,D为qGL3的同源基因qGL3-L1和qGL3-L2过表达转基因植株的籽粒表型;中花11为受体亲本。
[0044] 图14:qGL3处于水稻品种热研B背景下的近等基因系(GS3的短粒等位背景gs3)和水稻品种龙里黑糯的近等基因系(D1的短粒等位背景d1)籽粒。
[0045] 图15:背景亲本93-11和近等基因系93-11NIL-qGL3-D的株型、穗子、及籽粒表型对照图。A为背景亲本93-11和近等基因系93-11NIL-qGL3-D的株型对照图,B为背景亲本93-11和近等基因系93-11NIL-qGL3-D的穗子对照图,C为背景亲本93-11和近等基因系93-11NIL-qGL3-D的籽粒表型对照图。图16:93-11及近等基因系93-11NIL-qGL3-D以及它们与两系不育系广占63S配置的杂交稻穗子和籽粒的比较。
[0046] 其中A为93-11及近等基因系93-11NIL-qGL3-D以及它们与两系不育系广占63S配置的杂交稻穗子的比较图;
[0047] B为93-11及近等基因系93-11NIL-qGL3-D以及它们与两系不育系广占63S配置的杂交稻籽粒的比较图。

具体实施方式

[0048] 下面结合具体实施例,进一步阐述本发明。应理解为,这些具体的实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未标明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室指南(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照各公司销售产品所建议的条件。其中用到的SSR分子标记RM系列除特殊说明外,都按照gramene(http://www.gramene.org/)网站公布的序列合成。
[0049] 实施例1 水稻粒长基因qGL3的分离与获得
[0050] (一)材料与方法:
[0051] 1.大粒种质N411与05-643、93-11杂交群体的构建(具体流程参见图1):
[0052] (1)利用水稻大粒种质N411(由南京农业大学水稻所种质库保存,其优势等位基因可以从南农籼5号中获得,品种申请受理号20110730.0)作为有利基因的供体材料,与05-643(由水稻品种粤丰B和龙特普B杂交选育而成)、93-11杂交,种植杂交种,自交获得F1。将F1自交获得的种子种植成单株构成F2群体,用于定位粒长、粒重QTL。
[0053] (2)F2群体中选择籽粒较长的单株连续回交给05-643或93-11,回交高代BCF2群体用于精细定位主效粒长、粒重QTL。
[0054] 2.主效粒长QTL分子定位与标记开发方法
[0055] (1)用SDS法提取群体各株系DNA(具体方法参见分子克隆:实验室指南(New York:Cold Spring Harbor Laboratory Press,1989))。
[0056] (2)首先用976对SSR引物(根据gramene:http://www.gramene.org/,网站公布的序列合成)对大粒种质N411和品种05-643、93-11亲本的DNA多态性进行初步分析。获得亲本间有多态的标记用于构建遗传连锁图谱。
[0057] (3)PCR反应体积为10微升,其中10×buffer1微升,带有2.5mM MgCl2的buffer1微升,2.5mMdNTPs 0.1微升,Taq酶(5单位/微升)0.1微升,模板DNA 1微升,加水至10微升。SSR反应程序为95℃预变性5min后,95℃变性30s,50-58℃退火30s,72℃延伸展30s,循环35次,最后72℃延伸10min,4度保存。在PCR扩增仪上进行PCR扩增,扩增产物在8%非变性聚丙烯酰胺凝胶(100ml聚丙烯酰胺溶液中含7.6克丙烯酰胺和0.4克甲叉双丙烯酰胺)上进行电泳分离,然后银染,照相,统计结果。利用多态性标记通过F2分离群体建立连锁图,分析谷粒的粒型和粒重QTLs。
[0058] (4)标记开发:在初定位目标区域内设计新的InDel标记:从水稻基因组数据库网站下载目标基因所在定位区间的水稻基因组公布序列,根据日本晴和93-11的基因组序列比对差异,设计InDel标记(见表1)。
[0059] 表1.初定位目标区域内设计新的InDel标记
[0060]
[0061] ①所示位置IRGSP Build04
[0062] (5)根据连锁交换规律,利用群体基因型资料构建水稻的遗传图谱,所用软件为Mapmaker3.0,LOD阈值设为3.0,获得连锁图谱。
[0063] (6)利用WinQTLcart2.5软件和IciMapping软件对F2群体各个单株的分子标记的基因型资料与其对应每个单株的籽粒性状进行软件分析,定位QTLs。
[0064] (二)结果与分析:
[0065] 水稻粳稻大粒种质N411(千粒重71.1克)与05-643(千粒重17.9克)93-11(千粒重28.3克)杂交获得F1。F1粒长、千粒重均处于中亲值或中亲偏低亲值。F2的籽粒长度和千粒重做成次数分布图,表现出连续的数量性状特征,说明粒长和粒重是由多基因控制的性状。利用分布于12条染色体的107个SSR多态性标记,利用N411/05-643的F2代的182个个体,建立了分子标记图谱,如图2。利用WinQTLcart2.5软件对粒重及其组分:粒长、粒宽和粒厚进行QTLs定位,采用符合区间作图法,抽样1000次迭代来确定LOD值。QTLs分析表明,控制粒长的QTLs分布于第3染色体,其中贡献率最大的粒长QTL位于分子标记RM5864-RM3199之间,如图2。
[0066] 进一步采用逐步回交逐步定位的方法,精细定位粒长QTL。利用N411/05-643的BC1F2群体,将目的QTL定位在RM6266-RM3350之间。从N411/93-11的BC2F2群体中,通过分子标记选择,挑选目标区域较小,并且背景单一,整株表型接近93-11的个体回交给93-11,在BC3F1群体中,通过分子标记选择,挑选含有目的区域又背景接近93-11的个体,收取单株种子,种植形成BC3F2群体约3000株。
[0067] 对BC3F2群体随机前212株单株收种子,考察种子的长宽厚,同时分析群体目标区域的分子标记数据,如图3。对剩余的BC3F2群体的两侧标记筛选交换株,通过考察交换株的表型数据,结合加密的内部标记,确认QTL的位置(图4)。
[0068] 对2968株分离个体的筛查,获得了91个在分子标记SSR标记RM15561和RM15630间的交换株,加密两标记间的分子标记,并对分子标记稀疏的区域对照日本晴和9311的序列开发新的InDel标记。利用加密的分子标记分析重组个体,确定重组发生的具体位置。结合分析籽粒长度数据,进行高精度连锁分析,将qGL3确定在InDel标记xj39和xj26之间的46.6kb之内,与标记xj24、xj18共分离(图4)。
[0069] 同时根据获得的重组个体:在93-11背景下导入N411的等位基因qGL3-D,区间跨度从InDel标记xj39到RM3601之间约700kb的一个株系经过自交纯和之后,确定为粒长基因qGL3的近等基因系93-11NIL-qGL3-D。
[0070] 2、基因的克隆
[0071] 根据日本晴的基因组序列,水稻基因组注释系统(MSU Rice Genome Annotation(Osa1)Release6.1:http://rice.plantbiology.msu.edu/cgi-bin/gbrowse/rice/)在这一区间预测了5个基因,其中三个是转座子或者逆转座子,没有任何的EST信息。另外两个假定的基因:LOC_Os03g44484和LOC_Os03g44500具有部分EST信息,但是没有全长eDNA序列。根据预测序列,我们设计了LOC_Os03g44500基因的克隆引物qGL3-F(SEQ ID NO:10),qGL3-R(SEQ ID NO:11)和LOC_Os03g44484基因的克隆引物G12-F(SEQ ID NO:12),G12R(SEQ ID NO:13);分别以上述引物对两个亲本N411和93-11的穗部cDNA模板进行扩增,从两个亲本N411和93-11的穗部cDNA模板中成功的分别扩增出了这两个基因(常规PCR程序,退火温度适当调整),通过T-A克隆,将扩增获得的序列连接到pMD18-Tsimple载体上(购买自Takara),转化大肠杆菌感受态细胞DH5a,涂布氨苄抗性的LB平板,挑取单克隆通过PCR阳性检测(分以别使用各自基因的克隆引物),将若干个单独的阳性克隆送金斯瑞生物公司测序。比较发现LOC_Os03g44484的eDNA序列在两个亲本N411和93-11中没有差异。而LOC_Os03g44500的cDNA序列在大粒亲本N411和93-11中存在两处差异:与来自93-11的等位基因(SEQ ID NO:1)相比,来自大粒亲本N411的等位基因(SEQ ID NO:3)的5`UTR区域的-72位置存在一个单碱基G的缺失;位于第10个外显子上的编码区+1092位置的一个单核苷酸替换,C→A,进而导致蛋白质一个氨基酸的替换:364位的天冬氨酸(Asp,D)转变成了谷氨酸(Glu,E),D364E。由此我们将93-11亲本中的LOC_Os03g44500定为qGL3的候选基因,序列为SEQ ID NO:1;而将其来自来自大粒亲本N411的等位变异命名为qGL3-D,序列为SEQ ID NO:3。
[0072] 生物信息学预测发现qGL3是由21个外显子和20个内含子构成。编码区长度为3012bp,编码1003个氨基酸的多肽。根据蛋白质功能域预测发现其编码的多肽是一个含有2个kelch重复的丝氨酸/苏氨酸磷酸(酯)酶(kelch repeat-containing serine/threonine phosphatase)。在水稻中,这一亚基因家族含有三个成员,分别是LOC_Os03g44500;LOC_Os05g05240和LOC_Os12g42310,我们将其分别命名为qGL3、qGL3-L1、qGL3-L2。在拟南芥中,其同源基因属于一个四成员的亚家族,分别为AtBSU1,AtBSL1,AtBSL2,AtBSL3,它们是BRs信号途径的正调节因子。
[0073] 实施例2 qGL3及其同源基因家族表达分析
[0074] 根据NCBI上,水稻的EST profiles数据库分析发现:水稻的qGL3家族的三个成员在多种组织中都有表达,尤其是在分裂旺盛的幼嫩组织中。为了更好的了解这个基因家族的表达模式,根据基因注释和EST数据库拼接的mRNA序列,我们设计了三个基因qGL3、qGL3-L1、qGL3-L2各自的特异性表达引物对qGL3Seq-F(SEQ ID NO:14),qGL3Seq-R(SEQ ID NO:15);qGL3-L1Seq-F(SEQ ID NO:16),qGL3-L1Seq-R(SEQ ID NO:17)和qGL3-L2Seq-F(SEQ ID NO:18),qGL3-L2Seq-R(SEQ ID NO:19)。利用半定量分析的方法对这个基因家族的表达情况进行了分析。
[0075] 分别提取93-11和93-11NIL-qGL3的根(R)、茎(C)、刚抽出的叶片(LB)、叶鞘(LB)、2cm-3cm的初级穗(PP)、8cm-10cm幼穗(YP)、刚要抽出的成熟穗子(MP)的RNA(使用天为公司的RNA提取试剂盒),并反转为cDNA,反转试剂体系采用的是:RT Master Mix Perfect Real Time,购自Takara公司。利用OsRac1作为内参(引物对OsRacl-F(SEQ ID NO:20),OsRacl-R(SEQ ID NO:21))调模板浓度到一致。然后利用三个基因特异的引物表达引物对:qGL3Seq-F/qGL3Seq-R;qGL3-L1Seq-F/qGL3-L1Seq-R和qGL3-L2Seq-F/qGL3-L2Seq-R,通过同一次PCR反应来分析三个同源基因在各个组织中表达情况。从图中可以看出,qGL3基因家族成员在各个组织中都有表达,尤其是在叶片中的表达量最高。同时可以看出背景亲本93-11和近等基因系93-11NIL-qGL3中各个组织的表达量没有差异(图6A)。因而在后面的实时荧光定量分析中未对近等基因系进行分析。
[0076] 为了进一步的细致比较qGL3及其同源基因qGL3-L1、qGL3-L2的表达情况,我们通过qPCR primer design tool网站(http://www.quantprime.de/main.php?page=home)提供的qPCR引物设计工具设计了qGL3、qGL3-L1、qGL3-L2三个基因的特异引物对,依次为:qP1-F(SEQ ID NO:22),qP1-R(SEQID NO:23);qP2-F(SEQ ID NO:24),qP2-R(SEQ ID NO:
25);qP3-F(SEQ ID NO:26),qP3-R(SEQ IDNO:27),进一步通过Quantitative PCR的方法TM
来分析三个基因在各个组织中的表达情况。具体试剂采用的是: Premix Ex Taq //(Perfect Real Time),购自Takara公司,荧光PCR仪使用的是ABI公司的7500fast。本分析在半定量的基础上添加了未抽出的幼叶(YL),采用在同一块96孔板上同时进行三个重复,内参基因采用的是18S(引物对18S-F(SEQ ID NO:28),18S-R(SEQ ID NO:29))结果如图6B。
[0077] 从图6B中可以看出,整个基因家族在各个组织中都有表达,并且qGL3和qGL3-L2比qGL3-L1表达量要高,同时具有更加相似的表达模式,在穗中随着发育进程整个家族都出现表达量上升的趋势,qGL3-L2在幼嫩的叶片,成熟的叶片和叶鞘中一直维持较高的表达量,不同于qGL3的逐渐上升趋势。
[0078] 针对基因qGL3的启动子(SEQ ID NO:9),我们设计了引物qGL3Pro-F(SEQ ID NO:30,酶切位点Pst I)和qGL3Pro-R(SEQ ID NO:31,酶切位点Nco I),利用大粒亲本N411的基因组DNA作为模板,通过PCR扩增获得了基因qGL3的启动子序列,将获得PCR产物通过T-A克隆,连接到pMD-18TsimpleT-simple载体上(购买自Takara),通过热激法转化大肠杆菌DH5a感受态细胞,涂布氨苄抗性LB平板,挑取单克隆通过PCR阳性检测(利用引物对qGL3Pro-F和qGL3Pro-R),将阳性单克隆送交生物公司测序,将序列正确的菌株摇菌提取带有目标片段的质粒。将获得的质粒利用限制性内切酶Pst I和Nco I酶切连接到同样酶切的载体质粒pCAMBIA-1304(酶切位点结构图如图9A)上,构成重组质粒pCAMBIA-qGL3Pro-GUS。将此质粒通过农杆菌介导法转化水稻品种中花11。对阳性T0代转基因植株进行GUS染色分析(具体方法参照分子克隆:实验室指南)。连接GUS基因进行的转基因启动子GUS表达活性分析,同样印证了Real-Time PCR的结果,同时可以发现qGL3在根尖、茎的维管组织、叶片的中脉、叶鞘的外围、顶点生长点、未成熟颖壳的基部、成熟的颖壳中,以及雌蕊的基部优势表达,而不再成熟的花药中表达(图7)。
[0079] 实施例3 qGL3野生型蛋白及优势等位蛋白qGL3-D的亚细胞定位
[0080] 利用引物对qGL3GFP-F(SEQ ID NO:32),qGL3GFP-R(SEQ ID NO:33)分别将克隆到T载体上的qGL3(见具体实施例一)及其等位变异基因qGL3-D的全长编码区扩增出来,通过T-A克隆连接到pMD-18Tsimple载体上(购买自Takara),通过热激法转化大肠杆菌DH5a感受态细胞,涂布氨苄抗性LB平板,挑取单克隆通过PCR阳性检测(利用引物对qGL3Seq-F/qGL3Seq-R),将阳性单克隆送交生物公司测序,将序列正确的菌株摇菌提取带有目标片段的质粒。将获得的质粒利用Smal I酶切连接到同样酶切的载体质粒pBI121上,构成重组质粒pBI121-qGL3和pBI121-qGL3-D。将连接产物转化大肠杆菌Top10感受态细胞,涂布氨苄抗性LB平板,挑取单克隆通过PCR阳性检测(利用引物对qGL3Seq-F/R),并通过酶切验证其连接的方向性,将阳性单克隆送交生物公司测序,将正确连接的菌体扩繁提取整合后的pBI121质粒。将质粒通过基因枪法转化洋葱的表皮细胞。过夜培养后,荧光显微镜下寻找转化成功的细胞。
[0081] 从图8中可以看出:未发生突变的蛋白93-11-qGL3-GFP(SEQ ID NO:2)在整个细胞中都有分布,在质壁分离之后的细胞质浓缩区会有荧光信号的聚集。而突变后的蛋白N411-qGL3-D-GFP(SEQ ID NO:4)也是布满整个细胞的,但是在细胞核中会有更多的积累,这可能与蛋白的突变后功能获得直接相关的。
[0082] 实施例4 qGL3基因的水稻转基因研究
[0083] (1)qGL3野生型过表达和RNAi表达干涉研究
[0084] 利用引物对0XqGL3-F(SEQ ID NO:34)0XqGL3-R(SEQ ID NO:35)将克隆到T载体上的qGL3(见具体实施例一)编码区扩增出来,通过T-A克隆连接到pMD18-Tsimple载体上,通过热激法转化大肠杆菌DH5a感受态细胞,涂布氨苄抗性LB平板,挑取单克隆通过PCR阳性检测(利用引物对qGL3Seq-F/R),将阳性单克隆送交生物公司测序,将序列正确的菌株摇菌提取带有目标片段的质粒。利用限制性内切酶KpnI和Sal I同时酶切带有目标片段的质粒,跑胶回收小片段,与同样利用Kpn I和Sal I酶切的pCAMBIA-1300S载体质粒(通过对载体pCAMBIA-1300改造而来(Zhou et al.,2009),质粒结构图如图9B所示)跑胶回收的大片段利用T4连接酶连接。将连接产物热激法转化大肠杆菌DH5a感受态细胞,涂布卡那霉素抗性LB平板,挑取单克隆通过PCR阳性检测(利用引物对qGL3Seq-F,qGL3Seq-R),将阳性单克隆送交生物公司测序,将序列正确的菌株摇菌提取带有目标片段的质粒,即为qGL3野生型过表达质粒:pCAMBIA-1300S-qGL3。将qGL3野生型过表达质粒pCAMBIA-1300S-qGL3转化农杆菌感受态细胞,涂布卡那霉素抗性LB平板,挑取单克隆后通过PCR检测阳性(利用引物对qGL3Seq-F,qGL3Seq-R),将阳性菌株与中花11的愈伤组织共培养,通过多次分化后获得了四株独立的转基因株系。将T0代单株收获的种子种成株行,利用跨内含子的qGL3Seq-F(SEQ ID NO:14),qGL3Seq-R(SEQ ID NO:15)引物对进行阳性验证。各个不同的株系都有阳性单株出现。对阳性单株OX-1,OX-2和OX-3进行表达分析和表型调查。
[0085] 针 对qGL3 的 特 异 区 域 (SEQ ID NO:1中 1260~1743bp) 设 计 引 物 对RNAi-qGL3F2(SEQ ID NO:36)/RNAi-qGL3R2(SEQ ID NO:37)和RNAi-qGL3F1(SEQ ID NO:38)/RNAi-qGL3R1(SEQ ID NO:39)。以插入qGL3的T载体为模板,以RNAi-qGL3F2和RNAi-qGL3R2为引物,扩增得到正向插入片段,通过酶切位点Spe I和Sac I插入载体pCK303,酶切位点结构图如图9C所示(ZHEN WANG,CHANGBIN CHEN,YUNYUAN XU,RONGXI JIANG,YE HAN,ZHIHONG XU and KANG CHONG,Plant Molecular BiologyReporter 22:
409-417,December 2004)。以插入qGL3的T载体为模板,以RNAi-qGL3F1和RNAi-qGL3R1为引物,扩增得到反向插入片段,将该反向插入片段通过酶切位点Kpn I和BamH I插入到测序验证成功的插入正向插入片段的pCK303载体的Kpn I和BamH I的酶切位点间,将构建成功的载体送交Takara生物公司测序,验证正确性,得到qGL3 RNAi干涉载体:pCK303-qGL3。
将正确构建的pCK303-RNAi干涉载体通过农杆菌介导法转化水稻品种中花11(具体方法如上述过表达转基因),总共获得了23株独立的转基因T0代株系。将长势较好的18个株系种成株行,利用位于载体上的LAZ-F(SEQ IDNO:50)和303P1(SEQ ID NO:51)引物,PCR检测各株系的阳性:确定株行的整体是否有阳性出现之后,选取代表性单株进行再次验证,最终选定三个阳性株系Ri-4,Ri-5和Ri-6进行进一步的表达情况分析。
[0086] 将三个独立的阳性过表达株系中的单株OX-1,OX-2和OX-3,和三个独立的RNAi的阳性株系中的单株Ri-4,Ri-5和Ri-6以及野生型中花11同时进行qGL3的表达鉴定,同时分析过表达和干涉株系中qGL3-L1和qGL3-L2的表达情况(所用引物与实施例2中的表达分析引物相同)。取各个单株刚刚展开的箭叶分析各个基因的表达情况。
[0087] 如图10通过半定量表达分析表明(利用引物对qGL3Seq-F/R),过表达株系的目标基因qGL3的表达量发生了明显的提高,而干涉植株发生了明显的表达降低,而对于同源基因的表达没有发生影响。实时定量表达分析发现,过表达植株的表达量都发生了明显的提高。RNAi植株中目标基因qGL3的表达量受到了明显的抑制,只有野生型植株中大约10%,同时另外的两个同源基因的表达量也受到了一定程度的干涉,但是抑制的程度不是很明显,大约干涉掉了10%~50%。
[0088] 表型调查发现:无论是过表达阳性植株,还是RNAi干涉植株整体株型都没有发生明显的变化,只有籽粒的长度和重量发生了明显的变小,(图11)。
[0089] (2)qGL3野生型功能域截断过表达研究
[0090] 针对基因qGL3编码蛋白功能域的预测,qGL3编码的蛋白具有两个明显的结构域kelch和PP2Ac结构域,如图12。为了进一步检测两个功能域哪一个部位在水稻籽粒长度调节中发挥关键作用,我们通过区段特异性引物对OXqGL3-F(SEQ ID NO:34,酶切位点Kpn I)和OXkelch-R(SEQ ID NO:40,酶切位点Sal I),从带有qGL3的T载体上扩增出片段,此片段编码去除PP2Ac功能域的多肽OX-kelch。利用特异性引物对OXPP2A-F(SEQ ID NO:41,酶切位点Kpn I)和OXqGL3-R(SEQ ID NO:35,酶切位点Sal I),从带有qGL3的T载体上扩增出片段,此片段编码去除kelch功能域的多肽OX-PP2Ac(如图12所示)。分别构建到过表达载体pCAMBIA-1300s上,形成两个过表达载体pCAMBIA-1300S-OX-kelch和pCAMBIA-1300S-OX-PP2Ac。通过农杆菌介导法转化水稻品种中花11。通过表型考察发现OX-kelch转基因T0代阳性过表达植株表现出变短的粒型而OX-PP2Ac转基因T0代阳性过表达植株的粒型没有发生统计学意义上的变化(图12)。这说明在对水稻籽粒长度的调节功能来自于kelch结构域,而与PP2Ac结构域,以及kelch和PP2Ac之间的约290个氨基酸的链接区关系不大,如图12。
[0091] (4)qGL3水稻中同源基因qGL3-L1和qGL3-L2过表达研究和插入敲除突变体表型分析
[0092] 通过生物信息学比对,根据预测信息,我们设计了qGL3水稻中同源基因qGL3-L1和qGL3-L2的特异性克隆引物对qGL3-L1-F(SEQ ID NO:42)/qGL3-L1-R(SEQ ID NO:43)和qGL3-L2-F(SEQ ID NO:44)/qGL3-L2-R(SEQ ID NO:45),从水稻品种93-11的cDNA中扩增出了两个同源基因所对应的完整CDs区域,通过T-A克隆,连接到pMD18-Tsimple载体上,得到重组质粒T-qGL3-L1和T-qGL3-L2。通过热激法转化大肠杆菌DH5a感受态细胞,涂布氨苄抗性LB平板,挑取单克隆通过PCR阳性检测(利用克隆引物对qGL3-L1-F/R和qGL3-L2-F/R),将阳性单克隆送交生物公司测序,qGL3-L1序列为SEQ ID NO:5,qGL3-L2序列为SEQ ID NO:7;将序列正确的菌株摇菌提取带有目标片段的质粒保存备用。之后分别利用带有酶切位点的引物对qGL3-L1-KpnF(SEQ ID NO:46,酶切位点KpnF)和qGL3-L1-SalR(SEQ ID NO:47,酶切位点SalR);qGL3-L2-KpnF(SEQ ID NO:48,酶切位点KpnF)和qGL3-L2-SalR(SEQ ID NO:49,酶切位点SalR)从带有目标基因的质粒中分别扩增出两个同源基因qGL3-L1和qGL3-L2,然后通过酶切连接到过表达载体pCAMBIA-1300S的上的35S启动子之后,获得了两个同源基因的过表达载体pCAMBIA-1300S-qGL3-L1和pCAMBIA-1300S-qGL3-L2。通过农杆菌介导法转化水稻品种中花11(具体方法如上述过表达转基因)。分别获得了若干的转基因阳性T0代株系。分析阳性单株的籽粒之后发现过表达qGL3的同源基因qGL3-L1和qGL3-L2可以使水稻的籽粒增长很微弱,图13D。
[0093] 同时,在水稻公共突变体数据库(http://signal.salk.edu/cgi-bin/RiceGE)查询后,从韩国的PFGT-DNA突变体库购得了qGL3-L1基因的插入敲除突变体qgl3-l1。通过表型观察可以发现,qGL3-L1基因的缺失,是株高明显降低,如图13A,穗子变短如图13B,籽粒明显变短小,如图13C所示。
[0094] 实施例5 qGL3基因优势等位变异对于GS3,D1的功能优势研究
[0095] 通过大粒种质N411与水稻品种热研B和龙里黑糯构建的杂交组合,以及多次的连续回交自交之后,通过分子标记分析整体标记达到背景亲本90%以上,同时分离世代BC4F2的籽粒粒长的分离出现简单的三峰分布,并且通过统计分析三峰个体数目符合1∶2∶1的单基因分离,我们同样获得了以热研B和龙里黑糯为背景的近等基因系:热研NIL-qGL3和龙里黑糯NIL-qGL3。通过观察发现,在热研B背景下(GS3是完整功能的等位基因,能使籽粒较短,短于93-11)qGL3的优势等位变异依然可以发挥使籽粒变长的效果(如图14)。在龙里黑糯背景下(D1基因失去功能,使籽粒超短,短于热研B)qGL3的优势等位变异也依然可以发挥使籽粒变长的效果(如图14)。这说明本发明的基因处于遗传通路的较下游的位置,可以很好的镇压籽粒长度控制通路中上游负调控位点的抑制作用。
[0096] 实施例6 qGL3的分子标记辅助选择育种试验
[0097] 通过大粒亲本N411与育种骨干亲本93-11杂交以及以93-11为轮回亲本的多次回交,自交之后的回交BC3F2群体中,根据整体植株形态选择接近93-11同时籽粒长度较长的单株继续回交给93-11,在BC4F1中通过与qGL3周围的分子标记分析各个单株的基因系,挑选目标区域导入最小的单株,同时背景标记型最接近93-11的单株自交获得纯和小片段插入的近等基因系93-11NIL-qGL3-D(具体如实施例一)。整体株型如图15所示。分析近等基因系93-11NIL-qGL3-D和轮回亲本93-11在农艺性状上的差异发现,通过杂交导入的qGL3的优势等位变异基因qGL3-D可以使轮回亲本93-11的籽粒长度增加2mm以上,是水稻的粒重增加37%以上。而对于其他的农艺表型没有明显的影响,特别注意的是并没有使穗粒数减少。具体表型差异如表2所示。同时利用此近等基因系93-11NIL-qGL3-D与两系恢复系广占63S杂交构建杂交稻F1-2,与普通93-11与广占63S构建的杂交稻F1-1进行各个农艺表型和产量的比较分析发现:含有qGL3优势等位基因的近等基因系93-11NIL-qGL3-D能使杂交稻F1的粒长增加17.8%(从9.56mm增加到11.26mm),粒重增加30.7%(百粒重从2.676g增加到3.498g),如图16。
[0098] 表2:背景亲本93-11和近等基因系93-11NIL-qGL3的各个农艺学表型比较(江苏南京,2010正季)
[0099]
[0100] 本发明所述的qGL3是一个基因的名称,它包含两个不同的等位变异,一个是大粒长粒的,我们命名为qGL3-D,一个是小粒较短粒的,我们命名为qGL3。