预测粳稻亚种穗粒数强优势杂交组合的SNP标记及其高通量检测方法转让专利

申请号 : CN201911190497.7

文献号 : CN110735000B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张洪亮谢建引祝晓阳王学强张淑阳张志方李自超李金杰张战营

申请人 : 中国农业大学

摘要 :

本发明涉及一种高通量检测用于预测粳稻亚种穗粒数强优势杂交组合的SNP标记的方法。本发明还涉及用于预测粳稻亚种穗粒数强优势杂交组合的标签SNP以及用于检测或扩增所述标签SNP的引物组。本发明进一步涉及评估和预测粳稻穗粒数强优势杂交组合的方法以及本发明的标签SNP和引物组在评估和预测粳稻穗粒数强优势杂交组合中的应用。

权利要求 :

1.标签SNP的组合在下列任一项中的应用:

1)预测长沙环境下粳稻亚种F1穗粒数;

2)制备用于预测长沙环境下粳稻亚种F1穗粒数的产品;

3)筛选长沙环境下粳稻亚种穗粒数强优势组合;或

4)制备用于筛选长沙环境下粳稻亚种穗粒数强优势组合的产品,所述标签SNP的组合为下列的组合:

并且所述粳稻选自以下品种的任一粳稻品种或两种以上的任意组合:江花稻、清津早生、黑标、三穗锦、早生白、竹原、秋光藤系104号、晚实、矮陆羽、八香、红色90、乌兹罗斯215、奥米尔特168、阿尔季托、吉0992、临果、美国黄壳稻、高丽秋、Khao Mack Kheua、Djanda Mandja、Kalijira 245、阿尔巴尼亚种、克罗多B、IAC 150/76、Jijucas Claro、Nanoay P.A、Nabated A Smar、YR 83‑23‑11、赤毛、宫城香、秋田小町、珍富8、清糯キョハタモチ、IRAT 

36、IRAT 266、IRAT 669、ITA 221、80A60YR71009‑1‑5、京2644、80A97YR303‑304‑1‑3、

80050YR72136‑43、YR196、铁秆乌、秀水115、台东陆稻328、红米三担白、光壳香糯、隆化毛葫芦、高阳淀稻大红芒、丹东陆稻、老光头83、白毛稻、木樨球、寸三粒、一支香、赤壳糯、霸王鞭

1、木瓜糯、红旗5号、南天纲酒、本邦谷、五子堆、红壳折糯(2)、寸谷糯、贯推白禾1、阳壳糯、麻谷子、老红稻、黑芒稻、毫补卡、毫巴永1、冷水谷2、黄皮糯、半节芒、飞蛾糯2、紫芒飞蛾糯、立新粳、中花8号、晋稻1号、辽粳287、粳87‑304、郑稻5号、西什15、拉木加、鱼眼糯、宁恢21、

76‑1、湖恢628、山酒谷、冷水糯、安农晚粳B、早熟农虎6号B、黎明B、兴国、水原300粒、叶里藏花、卫国、黄壳早廿日、毫马克(K)、细麻线、IRAT109/苏引稻2号、越富、毫格劳和日本晴。

2.以下任一项产品:

1)用于预测长沙环境下粳稻亚种F1穗粒数的产品,所述产品包含用于扩增权利要求1所述的标签SNP的引物组;或

2)用于筛选长沙环境下粳稻亚种穗粒数强优势组合的产品,所述产品包含用于扩增权利要求1所述的标签SNP的引物组。

3.权利要求2所述的产品,其特征在于所述产品是试剂盒。

说明书 :

预测粳稻亚种穗粒数强优势杂交组合的SNP标记及其高通量

检测方法

技术领域

[0001] 本发明属于水稻生物技术与分子标记应用领域,具体地涉及用于预测粳稻亚种内(Oryza sativa L.ssp.Keng,Oryza sativa L.ssp.japonica)穗粒数杂种F1强优势杂交组
合的标签SNP标记及其高通量检测方法。

背景技术

[0002] 水稻是世界上主要的粮食作物之一,作为我国和东南亚国家的主要口粮,其产量的稳定和提高关系着我国乃至全球的粮食安全。目前,杂交稻在我国种植面积占到一半以
上,对粮食增产作用显著,但是自上世纪90年代以来,水稻单产遇到了瓶颈,我国南方的杂
交籼稻产量徘徊不前,北方杂交粳稻在单产上也没有超过常规粳稻,其中最主要的原因是
亲本的遗传基础狭窄,如三系杂交籼稻仍主要在利用我国南方的野败型不育细胞质类型与
东南亚恢复系间的杂种优势。相比玉米杂种优势群的成功划分,水稻的现有研究主要针对
一些常用的强优势组合,较少有从遗传多样性丰富的水稻种质资源的角度对杂种优势群进
行研究。近几年随着大量水稻品种基因组测序的完成,以及成熟的全基因组关联分析方法
的建立,利用核心种质鉴定杂种优势QTL已经成为可能。基于杂种QTL进行杂种F1表现的预
测不仅对于提高杂种优势利用效率具有着重要的理论意义,对于拓宽杂交水稻亲本遗传基
础更有着现实的指导意义。
[0003] 穗粒数作为水稻产量三大因子之一,其杂种优势最为明显,对杂种产量的遗传贡献也最大。开展水稻杂种穗粒数QTL检测,杂种穗粒数QTL标记开发和杂种预测研究,有助于
实现水稻杂种穗粒数的精准预测和强优势组合筛选,进而培育出高产杂交稻,避免大量盲
目的测配工作,提高杂交组配亲本选择的质量和效率。

发明内容

[0004] 为解决现有技术中的上述问题,本发明利用水稻栽培稻微核心种质的粳稻与测验系(例如,日本晴)的杂交组合,通过全基因组关联分析检测与水稻杂种F1穗粒数关联的
SNP,并针对这些SNP开发了可用于MassARRAY平台检测的一套可预测粳稻杂种穗粒数的SNP
标记组合及其扩增引物。
[0005] 在第一个方面,本发明提供了一种用于预测粳稻亚种穗粒数强优势杂交组合的SNP标记的高通量检测方法(下文中有时简称为“本发明的检测方法”),该方法包括以下步
骤:
[0006] 1)选择多份目标粳稻亚种亲本材料分别与粳稻测验系材料杂交,得到一套含目标粳稻和粳稻测验系组合的杂种F1群体;
[0007] 2)将步骤1中获得的杂种F1群体采用两个重复的随机区组种植,对所有粳稻亲本和杂种F1进行穗粒数的田间考察,获得亲本和杂种F1的穗粒数表型数据,所述穗粒数为每穗
总颖花数;
[0008] 3)利用高通量测序法完成对所述目标粳稻亲本材料的基因组测序,获得至少5X的测序深度(优选,15.2X的测序深度),通过生物信息软件(例如,BWA或GATK)提取SNP,以MAF
(最小等位基因频率)>=0.05和缺失率低于50%作为筛选条件,筛选获得多个SNP作为基础
SNP库;通过目标粳稻亲本材料和粳稻测验系双亲的基因型派生出每个目标粳稻和粳稻测
验系组合的F1基因型;
[0009] 4)利用步骤2)中获得的F1穗粒数表型和步骤3)所得的SNP基因型,开展F1穗粒数的全基因组关联分析(GWAS),将相邻两个SNP间隔不超过170kb且至少3个以上SNP定义为一个
QTL,据此获得F1穗粒数QTL;
[0010] 5)针对步骤4)中获得的F1穗粒数QTL,利用haploview软件计算所述F1穗粒数QTL内所有显著位点的标签SNP,并通过Perl脚本提取与每个QTL内的所述标签SNP强连锁的SNP位
2
点(在本发明的具体实施方案中,设定连锁不平衡系数r≥0.8为强连锁),将所述提取的标
签SNP以及与所述标签SNP强连锁的SNP位点作为每个QTL内的显著标签SNP;
[0011] 6)针对步骤5)中获得的每个QTL内的显著标签SNP,对其进行MassARRAY检测,通过GWAS信号强度评估获得每个能用于MassARRAY检测的标签SNP的综合得分,并选取一组综合
得分最高的标签SNP作为每个QTL中的最优标签SNP用于最终MassARRAY检测。
[0012] 在第二个方面,本发明提供了一种评估和预测粳稻亚种F1穗粒数或强优势杂交组合的方法,所述方法包括通过上述方法获得最优标签SNP,然后执行下列步骤:
[0013] 7)提取与步骤6)中获得的每个QTL中的最优标签SNP高度关联(在本发明的具体实2
施方案中,设定连锁不平衡系数r≥0.8为高度关联)的所有SNP,将其在GWAS中所估计的效
应的平均值作为每个QTL的标签SNP的效应;所述每个QTL的标签SNP效应包括加性效应值和
显性效应值,其中杂种F1中SNP为杂合基因型的为显性效应,纯合基因型为加性效应;利用
所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程:y=b×Qeff+a,其中y表
示表型矩阵,a和b分别表示回归截距和回归系数,Qeff为每个个体所有标签SNP的基因型效
应的累加值,即Qeff=ΣQTLadd+ΣQTLdomi,ΣQTLadd表示所有QTL的标签SNP的加性效应值累
加值,ΣQTLdomi表示所有QTL的标签SNP的显性效应值累加值;利用每个组合的F1基因型计算
的穗粒数累加效应Qeff和实际观察到每个组合的穗粒数表型,估计a和b的参数,建立目标群
体和环境下杂交组合穗粒数的预测方程,利用所建立的预测方程预测各个目标粳稻亲本材
料和粳稻测验系材料组合的杂种F1穗粒数,所述杂种F1穗粒数用以评估所述目标粳稻亲本
配制穗粒数强优势杂交组合的潜力。
[0014] 在一个实施方案中,上述第二个方面的方法还包括:确定大于所有被预测的组合表现分布的最高10%分位,优选最高5%分位的杂交组合为穗粒数强优势杂交组合。
[0015] 在本发明中,综合得分可以包括GWAS信号强度、MassARRAY检测的干扰点个数(其综合得分=‑log10(P)/干扰SNP个数)。
[0016] 在一个实施方案中,每个SNP加性效应计算公式为:QTLadd=abs(PAA–(PAA+Paa)/2),显性效应值计算公式为:QTLdomi=FAa‑(FAA+Faa)/2,其中测验系的基因型被定义为AA,非测
验系的基因型被定义为aa,其中,PAA和Paa分别表示AA和aa基因型亲本穗粒数平均值,FAa、FAA
和Faa分别表示AA、aa和Aa基因型杂种F1穗粒数平均值。
[0017] 在一个具体的实施方案中,所述测验系材料是日本晴,加性效应和显性效应值是根据粳稻亲本以及粳稻×日本晴组合的杂种F1计算得到。但是本领域技术人员要理解的
是,根据本发明,测验系材料不限于日本晴,其可以是下面所述的任一粳稻亚种。
[0018] 在一个实施方案中,每穗总颖花数包括主穗的饱粒数和瘪粒数。
[0019] 在一个优选实施方案中,全基因组关联分析(GWAS)采用压缩的混合线性模型cMLM(compressed mixed linear model)模型;优选地,通过多次置换检验获得F1穗粒数QTL,更
优选地,通过500‑20000次置换检验。在一个优选实施方案中,可以采用10000次置换检验。
[0020] 在本发明中,生物信息软件可采用本领域中熟知的各种生物信息软件,包括,但不限于,基因组工具软件BWA、GATK等。
[0021] 在一个优选实施方案中,所述高通量测序法可以采用本领域中已知的任何高通量测序仪来进行,优选采用二代高通量测序技术的仪器,例如,hiseq2000平台(具体操作可参
考Wang,W.,et al.(2018)."Genomic variation in 3,010diverse accessions of Asian 
cultivated rice."Nature 557(7703):43‑49)。
[0022] 在第三个方面,本发明涉及一种评估和预测粳稻亚种F1穗粒数或强优势杂交组合的方法,该方法包括利用通过本发明的检测方法获得的显著标签SNP鉴定供试粳稻亚种亲
本自交系的基因型,然后通过上述第二方面的方法中获得的表型矩阵公式预测杂交F1粳稻
穗粒数,用以评估所述供试粳稻亚种亲本配制穗粒数强优势杂交组合的潜力。
[0023] 在第四个方面,本发明涉及一种筛选用于培育高产杂交稻的亲本品种的方法,该方法包括选择多份目标粳稻亲本材料和粳稻测验系材料,通过上述方法获得F1穗粒数强优
势杂交组合(目标亲本与测验系间或目标亲本间),选取F1穗粒数强优势杂交组合中的目标
粳稻亲本材料作为用于培育高产杂交稻的亲本品种。
[0024] 在一个实施方案中,上述筛选方法在获得F1穗粒数强优势杂交组合后,可以计算与所述杂交组合中的粳稻亲本所有可能的杂交组合F1的平均穗粒数,其中平均数较高的材
料可作为配制其它高产杂交稻的优选亲本品种。
[0025] 在第五个方面,本发明涉及一种培育高产杂交稻的方法,该方法包括选择多份目标粳稻亲本材料和粳稻测验系材料,通过上述方法获得F1穗粒数强优势杂交组合,将所述F1
穗粒数强优势杂交组合中的目标粳稻亲本与另一个粳稻品种杂交,获得杂种F1,即所述高
产杂交稻。优选地,所述另一个粳稻品种是粳稻测验系。
[0026] 在第六个方面,本发明涉及通过上述本发明的检测方法获得的标签SNP(下文中有时简称为“本发明的标签SNP”)。优选地,所述标签SNP是步骤5)中所获得的显著标签SNP,更
优选是步骤6)中获得的可用于MassARRAY检测的最优标签SNP(下文中有时也称“核心标签
SNP”),具体地是表3中所示的任一SNP或其任意组合,优选地是表4中所列举的核心标签
SNP。
[0027] 在第七个方面,本发明提供了用于扩增或检测上述核心标签SNP的引物组(下文中有时简称为“本发明的引物组”),所述引物组包括表4中用于检测核心标签SNP的任一个引
物组以及两个或两个以上引物组的任意组合,每个引物组包括正向引物、反向引物和延伸
引物。
[0028] 在本发明中,引物的设计主要根据SNP两侧的DNA序列进行(SNP左右两侧各200bp的DNA序列通过perl脚本提取),引物设计原则是要求待检测SNP左右两侧各15bp内不存在
或者仅存在少于两个干扰SNP位点。
[0029] 在第八个方面,涉及本发明的标签SNP的任意组合或本发明的引物组的任意组合在下列任一项中的应用:
[0030] 1)预测粳稻亚种杂交组合F1的穗粒数;
[0031] 2)制备用于预测粳稻亚种F1穗粒数的产品;
[0032] 3)培育高产杂交粳稻亲本;
[0033] 4)筛选粳稻亚种穗粒数强优势组合;或
[0034] 5)制备用于筛选粳稻亚种穗粒数强优势组合的产品。
[0035] 在第九个方面,本发明提供了以下任一项产品:
[0036] 1)用于预测粳稻亚种F1穗粒数的产品,所述产品包含本发明的引物组的任意组合,优选地,所述产品是试剂盒;或
[0037] 2)用于筛选粳稻亚种穗粒数强优势组合的产品,所述产品包含本发明的引物组的任意组合,优选地,所述产品是试剂盒。
[0038] 在本发明中,粳稻(包括目标粳稻亲本材料和粳稻测验系材料)包括但不限于以下的品种:江花稻、清津早生、黑标、三穗锦、早生白、竹原、秋光藤系104号、晚实、矮陆羽、八
香、红色90、乌兹罗斯215、奥米尔特168、阿尔季托、吉0992、临果、美国黄壳稻、高丽秋、Khao 
Mack Kheua、Djanda Mandja、Kalijira 245、阿尔巴尼亚种、克罗多B、IAC 150/76、Jijucas 
Claro、Nanoay P.A、Nabated A Smar、YR 83‑23‑11、赤毛、宫城香、秋田小町、珍富8、清糯キ
ョハタモチ、IRAT 36、IRAT 266、IRAT 669、ITA 221、80A60YR71009‑1‑5、京2644、
80A97YR303‑304‑1‑3、80050YR72136‑43、YR196、铁秆乌、秀水115、台东陆稻328、红米三担
白、光壳香糯、隆化毛葫芦、高阳淀稻大红芒、丹东陆稻、老光头83、白毛稻、木樨球、寸三粒、
一支香、赤壳糯、霸王鞭1、木瓜糯、红旗5号、南天纲酒、本邦谷、五子堆、红壳折糯(2)、寸谷
糯、贯推白禾1、阳壳糯、麻谷子、老红稻、黑芒稻、毫补卡、毫巴永1、冷水谷2、黄皮糯、半节
芒、飞蛾糯2、紫芒飞蛾糯、立新粳、中花8号、晋稻1号、辽粳287、粳87‑304、郑稻5号、西什15、
拉木加、鱼眼糯、宁恢21、76‑1、湖恢628、山酒谷、冷水糯、安农晚粳B、早熟农虎6号B、黎明B、
兴国、水原300粒、叶里藏花、卫国、黄壳早廿日、毫马克(K)、细麻线、IRAT109/苏引稻2号、越
富、毫格劳和日本晴。在本发明中,测验系材料采用日本晴。本领域技术人员还要理解的是,
只要属于粳稻亚种,均可在本发明中作为目标品种或者粳稻测验系使用。
[0039] 本发明的有益效果
[0040] 1.本发明首次针对具有丰富多样性和代表性的水稻微核心种质材料进行穗粒数杂种F1预测,该方法具有一定的普适性,对于其他作物杂种表现预测研究具有极好的参考
价值。
[0041] 2.本发明针对粳稻筛选了60个核心标签SNP标记,利用训练群体获得每个标记的加性和显性效应值,对粳稻59个组合的F1穗粒数进行了预测,并配制其杂交组合于2016年
在长沙种植评价,59个组合预测穗粒数与实际穗粒数的相关系数达到0.7618,说明本实验
筛选的SNP能够较为准确的评估和预测杂种F1穗粒数。
[0042] 3.通过对自交系亲本中60个标签SNP基因型(即,60个QTL中针对每个QTL选取了一个最优标签SNP)鉴定,直接评估自交系的杂种F1穗粒数表现和利用潜力,可以避免大量盲
目的测配工作,提高杂交组配亲本选择的质量和效率。

附图说明

[0043] 图1显示了粳稻×日本晴组合F1的GWAS曼哈顿图:图中黑色的点(即,灰度较高的点)表示1000次置换检验显著,且位于QTL内的SNP位点。
[0044] 图2为粳稻×日本晴F1中检测到的标签SNP对粳稻杂种F1训练群体的预测情况。图中横坐标为基于基因型效应预测得到的穗粒数表型值,纵坐标为训练群体的实际杂种F1穗
粒数。
[0045] 图3显示了59个粳粳组合预测值与田间实际观测值之间的相关性。图中横坐标为基于基因型效应预测得到的穗粒数表型值,纵坐标为2016年田间考察获得的实际杂种F1穗
粒数,其中黑色的点(即,灰度较高的点)表示预测处于最高5%组合F1在实际组合中的表
现。
[0046] 图4显示了表4,即用于检测基于MassARRAY平台检测的最优标签SNP的引物序列。

具体实施方式

[0047] 定义:
[0048] QTL:QTL是Quantitative Trait Locus的缩写,即数量性状座位或者数量性状基因座,它指的是控制数量性状的基因在基因组中的位置。对QTL的定位必须使用遗传标记,
即,标记和QTL是连锁的。
[0049] SNP:全称Single Nucleotide Polymorphisms,SNP主要是指在基因组水平上由单个核苷酸的变异所引起的DNA变异,包括转换和颠换,其数量很多,多态性丰富。
[0050] 标签SNP:在基因组中,有些区域是较为紧密连锁在一起的,这个区域可大可小,组成一个单倍型框,在区域里也会存在很多的SNP。从中选出一个代表性的SNP,其可以反映这
个区域的情况。这个被选取能够代表整个单倍型框的SNP就被称为标签SNP。
[0051] MAF:指最小等位基因频率。
[0052] Haploview软件:本发明采用的是java命令版的Haploview 4.2,软件可从官网:https://www.broadinstitute.org/haploview/haploview免费获取。在本发明中,该软件
的主要参数可以如下选择:‑hwcutoff  0‑maxMendel  1‑maxDistance 2000‑
pairwiseTagging‑mintagdistance 500‑taglodcutoff 3‑tagrsqcutoff 0.8。但是要理解
的是,本领域技术人员可以根据本发明所教导的原理和应用场景选择合适的参数,本发明
不限于上述参数。
[0053] MassARRAY检测平台: 分子量阵列技术是Sequenom公司推出的世界上领先的基因分析工具,通过引物延伸或切割反应与灵敏、可靠的MALDITOF质谱技术相
结合,实现基因分型检测。Sequenom SNP检测系统基本原理为基质辅助激光解吸电离飞行
时间质谱(MALDT‑TOF MS)技术。
[0054] GWAS(Genome‑Wide Association Study):即全基因组关联分析,是指在全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中鉴定出与目标性状相关的
SNPs。
[0055] BWA软件:BWA是一款将序列比对到参考基因组上的软件,通常情况下选择BWA‑MEM算法。BWA的源代码存储在github上,可从https://github.com/lh3/bwa获得。
[0056] GATK软件:GATK是Genome Analysis ToolKit的缩写,是一款从高通量测序数据中分析变异信息的软件,目前最新版本为4.0.4.0,称为GATK4。其下载链接为https://
software.broadinstitute.org/gatk/download/。
[0057] 下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为
常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。
以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊
说明,所示的引物序列以及序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷
酸,末位均为相应DNA/RNA的3′末端核苷酸。
[0058] 粳稻测验系日本晴:日本晴(Nipponbare,Oryza sativa ssp.japonica),公众可从位于中国农业科学院作物科学研究所的国家种质资源库获得。记载过该材料的非专利文
献如下:Yongqing Jiao,Yonghong Wang,Dawei Xue,Jing Wang,Meixian Yan,Guifu Liu,
Guojun Dong,Dali Zeng,Zefu Lu,Xudong Zhu,Qian Qian and Jiayang Li(2010)
Regulation of OsSPL14by OsmiR156defines ideal plant architecture in 
rice.Nature Genetics,42,541‑544。
[0059] 栽培稻微核心种质粳稻(实施例中的103份测试粳稻):这些材料收录在国家种质资源库,公众可以根据国家种质资源库编号/品种名(参见表1)从中国农业大学农学院稻种
资源基因组学与分子育种实验室或中国农业科学院作物科学研究所的国家种质资源库获
得表1中所列举的材料。记载过IRAT109/苏引稻2号、越富和毫格劳三份材料的非专利文献
如下:Fengmei Li,Jianyin Xie,Xiaoyang Zhu,Xueqiang Wang,Yan Zhao,Xiaoqian Ma,
Zhanying Zhang,Muhammad A.R.Rashid,Zhifang Zhang,Linran Zhi,Shuyang Zhang,
Jinjie Li,Zichao Li and Hongliang Zhang.(2018)Genetic Basis Underlying 
Correlations Among Growth Duration and Yield Traits Revealed by GWAS in Rice
(Oryza sativa L.).Frontiers in Plant Science 9(2018)。
[0060] 实施例1杂种优势关联分析群体构建和穗粒数表型的鉴定
[0061] 选取栽培稻微核心种质103份测试粳稻(其国家统一编号、品种名和来源地参见表1),与粳稻测验系日本晴进行组配得到粳稻×日本晴组合的F1群体。
[0062] 表1试验材料名称及来源
[0063]
[0064]
[0065]
[0066] 所有F1组合于2013年长沙,设置两个重复进行种植,成熟后每一份材料收取中间的5个单株,每个单株选取1个主穗考察饱粒数和瘪粒数,最终以每穗总颖花数(包括饱粒数
和瘪粒数)作为穗粒数表型;
[0067] 实施例2穗粒数全基因组关联分析和标签SNP的获得
[0068] 利用高通量二代测序技术(HiSeq2000)完成103份测试粳稻的基因组测序,获得15.2×的测序深度数据,通过BWA(release 0.7.10)提取SNP,并以MAF>=0.05和缺失率低
于50%作为筛选条件,筛选获得1640303个SNP作为基础SNP库;通过测试粳稻亲本材料和粳
稻测验系双亲的基因型派生出每个目标粳稻和粳稻测验系组合的F1基因型。然后采用
GAPIT软件(2016.03.01(Kinship defined by Zhiwu Zhang),http://zzlab.net/GAPIT)
中提供的压缩的混合线性模型cMLM对F1穗粒数表型和SNP基因型间进行全基因组关联分
析,将相邻两个不超过170kb的显著关联的SNP且至少3个SNP合并为一个QTL,通过1000次置
换检验获得F1穗粒数QTL(结果参见图1的GWAS曼哈顿图)。
[0069] 针对每个F1穗粒数QTL,利用haploview软件(Haploview 4.2)计算F1穗粒数QTL内所有显著SNP位点的标签SNP,并通过perl脚本提取每个QTL内与标签SNP强连锁的显著SNP,
2
即与标签SNP连锁不平衡程度≥0.8(r≥0.8)的所有SNP,标签SNP及与标签SNP强连锁的显
著SNP作为每个QTL内的显著标签SNP。
[0070] 针对上面获得的每个QTL内的显著标签SNP,对其进行MassARRAY检测,通过GWAS信号强度评估获得每个能用于MassARRAY检测的标签SNP的综合得分,并选取一组综合得分最
高的标签SNP用于最终MassARRAY检测,所述综合得分包括GWAS信号强度、MassARRAY检测的
干扰点个数(综合得分=‑log10(P)/干扰SNP个数)。
[0071] 提取每个QTL中的最优标签SNP所高度关联的SNP(r2≥0.8),将其在GWAS中所估计的效应的平均值作为每个QTL中标签SNP的效应;所述每个QTL的标签SNP效应包括加性效应
值和显性效应值(其中,杂种F1中SNP为杂合基因型的为显性效应,纯合基因型为加性效应,
参见下面的表2);利用所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程:y
=b×Qeff+a,其中y表示表型矩阵,a和b分别表示回归截距和回归系数,Qeff为每个个体所有
标签SNP的基因型效应的累加值,即Qeff=ΣQTLadd+ΣQTLdomi,ΣQTLadd表示所有QTL的标签
SNP的加性效应值累加值,ΣQTLdomi表示所有所有QTL的标签SNP的显性效应值累加值。
[0072] 表2粳稻×日本晴检测到的QTL及其标签SNP基因型及其效应
[0073]
[0074]
[0075] 表3 QTL内MassARRAY测试通过的标签SNP位点
[0076]
[0077]
[0078]
[0079]
[0080]
[0081]
[0082]
[0083]
[0084]
[0085]
[0086]
[0087]
[0088]
[0089]
[0090]
[0091]
[0092]
[0093]
[0094]
[0095] 针对选取的60个核心标签SNP(见表3中最右列),设计了可在MassARRAY平台上进行粳稻亚种内检测的引物(参见表3和图4中的表4),每个引物组包括正向引物、反向引物和
延伸引物。设计原则是根据SNP两侧的DNA序列进行(SNP左右两侧各200bp的DNA序列通过
perl脚本提取),引物设计原则是要求待检测SNP左右两侧各15bp内不存在或者仅存在少于
两个干扰SNP位点,引物质量评估利用Extend Primer Assay Design(v4.1.0.17)软件进
行:具体参数如下:
[0096] Assay Type:Replex
[0097] Replex Mode:Re‑design extend primers
[0098] Multiplexing:40,1
[0099] Max alleles/SNP:4
[0100] Allow multiSnp strand design:Yes
[0101] Allow INDEL/MNP strand design:Yes
[0102] Mutant allele occulsion control:Optimize
[0103] Annotation type:Scan and Restrict
[0104] SNP Set Representation:Once per Run
[0105] Use exchange replexing:Yes,0,No
[0106] Report verbosity:Detailed
[0107] Amplicon length control:80,100,200
[0108] Amplicon design score cutoffs(u/m‑plex):0.3,0.4
[0109] 实施例3建立利用标签SNP预测水稻杂种F1穗粒数的预测方程
[0110] 利用103份测试粳稻与日本晴配制的杂交组合(最终成功杂交组合88份),通过上面实施例所确定的标签SNP基因型及其在长沙环境下估计所得累加遗传效应以及每个组合
F1的实际穗粒数,对方程y=bQeff+a进行求解,最终建立了可以预测粳稻组合长沙环境下F1
穗粒数的预测方程:y=0.1414Qeff+213.54,其中,每个SNP加性效应计算公式为abs(PAA–
(PAA+Paa)/2),显性效应值计算公式为FAa‑(FAA+Faa)/2(此处定义测验系的基因型为AA,非测
验系的基因型为aa,其中Faa=Paa+(FAA‑PAA),PAA、Paa表示AA基因型和aa基因型亲本穗数平均
值,FAA、Faa和FAa分别表示AA、aa和Aa杂合基因型F1的穗粒数平均值);该方程所得粳稻×日
本晴预测值与实际观测值的相关性达到0.8670,5倍交叉检验得到的相关系数为0.812,说
明这种预测具有较高的准确度和可靠性(图2和表5)。
[0111] 表5粳稻训练群体以及验证群体的预测值与实际观测值
[0112]
[0113]
[0114]
[0115] 实施例4对59个粳稻杂交组合的田间验证
[0116] 从104份(即103份测试粳稻和日本晴)粳稻品种中随机选取63份材料,理论上63份材料两两组配可以配制63×(63‑1)/2=1953个组合。随机配制了其中的59个组合,根据亲
本推算得到这59个组合F1的基因型,并利用方程y=0.1414Qeff+213.54预测这59个组合的
表现。
[0117] 对这随机配制的59份杂交组合,于2016年长沙地区,以每行9株,16cm×25cm行株距种植两个重复进行田间种植,成熟后,收取中间5株,每株选取主穗考察穗粒数,并以5株
×2重复的平均值作为最终的穗粒数表型数据。
[0118] 对比预测的表型与实际得到的表型数据,二者相关性为0.7618,可见该预测方程对实际组合的预测效率较高,具有较高实用性(参见表5和图3)。
[0119] 虽然已经举例说明和描述了本发明的具体实施方案,但是对于本领域技术人员来说显而易见的是,在不脱离本发明实质和范围的情况下可以做出多种其他改变和变型。因
此,在随附的权利要求书中包括属于本发明范围内的所有这些改变和变型。