预测粳稻亚种穗粒数强优势杂交组合的SNP标记及其高通量检测方法转让专利
申请号 : CN201911190497.7
文献号 : CN110735000B
文献日 : 2021-07-09
发明人 : 张洪亮 , 谢建引 , 祝晓阳 , 王学强 , 张淑阳 , 张志方 , 李自超 , 李金杰 , 张战营
申请人 : 中国农业大学
摘要 :
权利要求 :
1.标签SNP的组合在下列任一项中的应用:
1)预测长沙环境下粳稻亚种F1穗粒数;
2)制备用于预测长沙环境下粳稻亚种F1穗粒数的产品;
3)筛选长沙环境下粳稻亚种穗粒数强优势组合;或
4)制备用于筛选长沙环境下粳稻亚种穗粒数强优势组合的产品,所述标签SNP的组合为下列的组合:
并且所述粳稻选自以下品种的任一粳稻品种或两种以上的任意组合:江花稻、清津早生、黑标、三穗锦、早生白、竹原、秋光藤系104号、晚实、矮陆羽、八香、红色90、乌兹罗斯215、奥米尔特168、阿尔季托、吉0992、临果、美国黄壳稻、高丽秋、Khao Mack Kheua、Djanda Mandja、Kalijira 245、阿尔巴尼亚种、克罗多B、IAC 150/76、Jijucas Claro、Nanoay P.A、Nabated A Smar、YR 83‑23‑11、赤毛、宫城香、秋田小町、珍富8、清糯キョハタモチ、IRAT
36、IRAT 266、IRAT 669、ITA 221、80A60YR71009‑1‑5、京2644、80A97YR303‑304‑1‑3、
80050YR72136‑43、YR196、铁秆乌、秀水115、台东陆稻328、红米三担白、光壳香糯、隆化毛葫芦、高阳淀稻大红芒、丹东陆稻、老光头83、白毛稻、木樨球、寸三粒、一支香、赤壳糯、霸王鞭
1、木瓜糯、红旗5号、南天纲酒、本邦谷、五子堆、红壳折糯(2)、寸谷糯、贯推白禾1、阳壳糯、麻谷子、老红稻、黑芒稻、毫补卡、毫巴永1、冷水谷2、黄皮糯、半节芒、飞蛾糯2、紫芒飞蛾糯、立新粳、中花8号、晋稻1号、辽粳287、粳87‑304、郑稻5号、西什15、拉木加、鱼眼糯、宁恢21、
76‑1、湖恢628、山酒谷、冷水糯、安农晚粳B、早熟农虎6号B、黎明B、兴国、水原300粒、叶里藏花、卫国、黄壳早廿日、毫马克(K)、细麻线、IRAT109/苏引稻2号、越富、毫格劳和日本晴。
2.以下任一项产品:
1)用于预测长沙环境下粳稻亚种F1穗粒数的产品,所述产品包含用于扩增权利要求1所述的标签SNP的引物组;或
2)用于筛选长沙环境下粳稻亚种穗粒数强优势组合的产品,所述产品包含用于扩增权利要求1所述的标签SNP的引物组。
3.权利要求2所述的产品,其特征在于所述产品是试剂盒。
说明书 :
预测粳稻亚种穗粒数强优势杂交组合的SNP标记及其高通量
检测方法
技术领域
合的标签SNP标记及其高通量检测方法。
背景技术
上,对粮食增产作用显著,但是自上世纪90年代以来,水稻单产遇到了瓶颈,我国南方的杂
交籼稻产量徘徊不前,北方杂交粳稻在单产上也没有超过常规粳稻,其中最主要的原因是
亲本的遗传基础狭窄,如三系杂交籼稻仍主要在利用我国南方的野败型不育细胞质类型与
东南亚恢复系间的杂种优势。相比玉米杂种优势群的成功划分,水稻的现有研究主要针对
一些常用的强优势组合,较少有从遗传多样性丰富的水稻种质资源的角度对杂种优势群进
行研究。近几年随着大量水稻品种基因组测序的完成,以及成熟的全基因组关联分析方法
的建立,利用核心种质鉴定杂种优势QTL已经成为可能。基于杂种QTL进行杂种F1表现的预
测不仅对于提高杂种优势利用效率具有着重要的理论意义,对于拓宽杂交水稻亲本遗传基
础更有着现实的指导意义。
实现水稻杂种穗粒数的精准预测和强优势组合筛选,进而培育出高产杂交稻,避免大量盲
目的测配工作,提高杂交组配亲本选择的质量和效率。
发明内容
SNP,并针对这些SNP开发了可用于MassARRAY平台检测的一套可预测粳稻杂种穗粒数的SNP
标记组合及其扩增引物。
骤:
总颖花数;
(最小等位基因频率)>=0.05和缺失率低于50%作为筛选条件,筛选获得多个SNP作为基础
SNP库;通过目标粳稻亲本材料和粳稻测验系双亲的基因型派生出每个目标粳稻和粳稻测
验系组合的F1基因型;
QTL,据此获得F1穗粒数QTL;
2
点(在本发明的具体实施方案中,设定连锁不平衡系数r≥0.8为强连锁),将所述提取的标
签SNP以及与所述标签SNP强连锁的SNP位点作为每个QTL内的显著标签SNP;
得分最高的标签SNP作为每个QTL中的最优标签SNP用于最终MassARRAY检测。
施方案中,设定连锁不平衡系数r≥0.8为高度关联)的所有SNP,将其在GWAS中所估计的效
应的平均值作为每个QTL的标签SNP的效应;所述每个QTL的标签SNP效应包括加性效应值和
显性效应值,其中杂种F1中SNP为杂合基因型的为显性效应,纯合基因型为加性效应;利用
所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程:y=b×Qeff+a,其中y表
示表型矩阵,a和b分别表示回归截距和回归系数,Qeff为每个个体所有标签SNP的基因型效
应的累加值,即Qeff=ΣQTLadd+ΣQTLdomi,ΣQTLadd表示所有QTL的标签SNP的加性效应值累
加值,ΣQTLdomi表示所有QTL的标签SNP的显性效应值累加值;利用每个组合的F1基因型计算
的穗粒数累加效应Qeff和实际观察到每个组合的穗粒数表型,估计a和b的参数,建立目标群
体和环境下杂交组合穗粒数的预测方程,利用所建立的预测方程预测各个目标粳稻亲本材
料和粳稻测验系材料组合的杂种F1穗粒数,所述杂种F1穗粒数用以评估所述目标粳稻亲本
配制穗粒数强优势杂交组合的潜力。
验系的基因型被定义为aa,其中,PAA和Paa分别表示AA和aa基因型亲本穗粒数平均值,FAa、FAA
和Faa分别表示AA、aa和Aa基因型杂种F1穗粒数平均值。
是,根据本发明,测验系材料不限于日本晴,其可以是下面所述的任一粳稻亚种。
优选地,通过500‑20000次置换检验。在一个优选实施方案中,可以采用10000次置换检验。
考Wang,W.,et al.(2018)."Genomic variation in 3,010diverse accessions of Asian
cultivated rice."Nature 557(7703):43‑49)。
本自交系的基因型,然后通过上述第二方面的方法中获得的表型矩阵公式预测杂交F1粳稻
穗粒数,用以评估所述供试粳稻亚种亲本配制穗粒数强优势杂交组合的潜力。
势杂交组合(目标亲本与测验系间或目标亲本间),选取F1穗粒数强优势杂交组合中的目标
粳稻亲本材料作为用于培育高产杂交稻的亲本品种。
料可作为配制其它高产杂交稻的优选亲本品种。
穗粒数强优势杂交组合中的目标粳稻亲本与另一个粳稻品种杂交,获得杂种F1,即所述高
产杂交稻。优选地,所述另一个粳稻品种是粳稻测验系。
优选是步骤6)中获得的可用于MassARRAY检测的最优标签SNP(下文中有时也称“核心标签
SNP”),具体地是表3中所示的任一SNP或其任意组合,优选地是表4中所列举的核心标签
SNP。
物组以及两个或两个以上引物组的任意组合,每个引物组包括正向引物、反向引物和延伸
引物。
或者仅存在少于两个干扰SNP位点。
香、红色90、乌兹罗斯215、奥米尔特168、阿尔季托、吉0992、临果、美国黄壳稻、高丽秋、Khao
Mack Kheua、Djanda Mandja、Kalijira 245、阿尔巴尼亚种、克罗多B、IAC 150/76、Jijucas
Claro、Nanoay P.A、Nabated A Smar、YR 83‑23‑11、赤毛、宫城香、秋田小町、珍富8、清糯キ
ョハタモチ、IRAT 36、IRAT 266、IRAT 669、ITA 221、80A60YR71009‑1‑5、京2644、
80A97YR303‑304‑1‑3、80050YR72136‑43、YR196、铁秆乌、秀水115、台东陆稻328、红米三担
白、光壳香糯、隆化毛葫芦、高阳淀稻大红芒、丹东陆稻、老光头83、白毛稻、木樨球、寸三粒、
一支香、赤壳糯、霸王鞭1、木瓜糯、红旗5号、南天纲酒、本邦谷、五子堆、红壳折糯(2)、寸谷
糯、贯推白禾1、阳壳糯、麻谷子、老红稻、黑芒稻、毫补卡、毫巴永1、冷水谷2、黄皮糯、半节
芒、飞蛾糯2、紫芒飞蛾糯、立新粳、中花8号、晋稻1号、辽粳287、粳87‑304、郑稻5号、西什15、
拉木加、鱼眼糯、宁恢21、76‑1、湖恢628、山酒谷、冷水糯、安农晚粳B、早熟农虎6号B、黎明B、
兴国、水原300粒、叶里藏花、卫国、黄壳早廿日、毫马克(K)、细麻线、IRAT109/苏引稻2号、越
富、毫格劳和日本晴。在本发明中,测验系材料采用日本晴。本领域技术人员还要理解的是,
只要属于粳稻亚种,均可在本发明中作为目标品种或者粳稻测验系使用。
价值。
在长沙种植评价,59个组合预测穗粒数与实际穗粒数的相关系数达到0.7618,说明本实验
筛选的SNP能够较为准确的评估和预测杂种F1穗粒数。
目的测配工作,提高杂交组配亲本选择的质量和效率。
附图说明
粒数。
粒数,其中黑色的点(即,灰度较高的点)表示预测处于最高5%组合F1在实际组合中的表
现。
具体实施方式
即,标记和QTL是连锁的。
个区域的情况。这个被选取能够代表整个单倍型框的SNP就被称为标签SNP。
的主要参数可以如下选择:‑hwcutoff 0‑maxMendel 1‑maxDistance 2000‑
pairwiseTagging‑mintagdistance 500‑taglodcutoff 3‑tagrsqcutoff 0.8。但是要理解
的是,本领域技术人员可以根据本发明所教导的原理和应用场景选择合适的参数,本发明
不限于上述参数。
结合,实现基因分型检测。Sequenom SNP检测系统基本原理为基质辅助激光解吸电离飞行
时间质谱(MALDT‑TOF MS)技术。
SNPs。
software.broadinstitute.org/gatk/download/。
常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。
以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊
说明,所示的引物序列以及序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷
酸,末位均为相应DNA/RNA的3′末端核苷酸。
献如下:Yongqing Jiao,Yonghong Wang,Dawei Xue,Jing Wang,Meixian Yan,Guifu Liu,
Guojun Dong,Dali Zeng,Zefu Lu,Xudong Zhu,Qian Qian and Jiayang Li(2010)
Regulation of OsSPL14by OsmiR156defines ideal plant architecture in
rice.Nature Genetics,42,541‑544。
资源基因组学与分子育种实验室或中国农业科学院作物科学研究所的国家种质资源库获
得表1中所列举的材料。记载过IRAT109/苏引稻2号、越富和毫格劳三份材料的非专利文献
如下:Fengmei Li,Jianyin Xie,Xiaoyang Zhu,Xueqiang Wang,Yan Zhao,Xiaoqian Ma,
Zhanying Zhang,Muhammad A.R.Rashid,Zhifang Zhang,Linran Zhi,Shuyang Zhang,
Jinjie Li,Zichao Li and Hongliang Zhang.(2018)Genetic Basis Underlying
Correlations Among Growth Duration and Yield Traits Revealed by GWAS in Rice
(Oryza sativa L.).Frontiers in Plant Science 9(2018)。
和瘪粒数)作为穗粒数表型;
于50%作为筛选条件,筛选获得1640303个SNP作为基础SNP库;通过测试粳稻亲本材料和粳
稻测验系双亲的基因型派生出每个目标粳稻和粳稻测验系组合的F1基因型。然后采用
GAPIT软件(2016.03.01(Kinship defined by Zhiwu Zhang),http://zzlab.net/GAPIT)
中提供的压缩的混合线性模型cMLM对F1穗粒数表型和SNP基因型间进行全基因组关联分
析,将相邻两个不超过170kb的显著关联的SNP且至少3个SNP合并为一个QTL,通过1000次置
换检验获得F1穗粒数QTL(结果参见图1的GWAS曼哈顿图)。
2
即与标签SNP连锁不平衡程度≥0.8(r≥0.8)的所有SNP,标签SNP及与标签SNP强连锁的显
著SNP作为每个QTL内的显著标签SNP。
高的标签SNP用于最终MassARRAY检测,所述综合得分包括GWAS信号强度、MassARRAY检测的
干扰点个数(综合得分=‑log10(P)/干扰SNP个数)。
值和显性效应值(其中,杂种F1中SNP为杂合基因型的为显性效应,纯合基因型为加性效应,
参见下面的表2);利用所有QTL的最优标签SNP基因型及其效应估计值建立线性回归方程:y
=b×Qeff+a,其中y表示表型矩阵,a和b分别表示回归截距和回归系数,Qeff为每个个体所有
标签SNP的基因型效应的累加值,即Qeff=ΣQTLadd+ΣQTLdomi,ΣQTLadd表示所有QTL的标签
SNP的加性效应值累加值,ΣQTLdomi表示所有所有QTL的标签SNP的显性效应值累加值。
延伸引物。设计原则是根据SNP两侧的DNA序列进行(SNP左右两侧各200bp的DNA序列通过
perl脚本提取),引物设计原则是要求待检测SNP左右两侧各15bp内不存在或者仅存在少于
两个干扰SNP位点,引物质量评估利用Extend Primer Assay Design(v4.1.0.17)软件进
行:具体参数如下:
F1的实际穗粒数,对方程y=bQeff+a进行求解,最终建立了可以预测粳稻组合长沙环境下F1
穗粒数的预测方程:y=0.1414Qeff+213.54,其中,每个SNP加性效应计算公式为abs(PAA–
(PAA+Paa)/2),显性效应值计算公式为FAa‑(FAA+Faa)/2(此处定义测验系的基因型为AA,非测
验系的基因型为aa,其中Faa=Paa+(FAA‑PAA),PAA、Paa表示AA基因型和aa基因型亲本穗数平均
值,FAA、Faa和FAa分别表示AA、aa和Aa杂合基因型F1的穗粒数平均值);该方程所得粳稻×日
本晴预测值与实际观测值的相关性达到0.8670,5倍交叉检验得到的相关系数为0.812,说
明这种预测具有较高的准确度和可靠性(图2和表5)。
本推算得到这59个组合F1的基因型,并利用方程y=0.1414Qeff+213.54预测这59个组合的
表现。
×2重复的平均值作为最终的穗粒数表型数据。
此,在随附的权利要求书中包括属于本发明范围内的所有这些改变和变型。