一种紫菜经济性状快速精准染色体定位的方法及应用转让专利

申请号 : CN202010122553.X

文献号 : CN111270001B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 茅云翔于欣孜孔凡娜曹敏

申请人 : 中国海洋大学

摘要 :

本发明公开了一种紫菜经济性状快速精准染色体定位的方法及应用,属于基因组学、分子育种领域。本发明利用色素突变体的颜色差异,区分由减数分裂形成的不同基因型区域,通过单色块区域无性生殖诱导放散单孢子,构建子代CMD群体;将野生型的亲本作为参考基因组,利用SNP/InDel标记对子代CMD群体的极端表型池进行QTL‑seq分析,并结合KASP以及RNA‑seq的方法进行质量性状基因或主效QTL的定位预测。解决了由紫菜杂交后代叶状体基因型不统一造成的遗传性状统计解析困难的问题;将QTL‑seq、KASP和RNA‑seq的组合方法应用于紫菜性状定位,极大地拓展了紫菜性状解析的思路,具有很好的应用前景。

权利要求 :

1.一种条斑紫菜经济性状快速精准染色体定位的方法,其特征在于,利用色素突变体的颜色差异,标记区分由减数分裂四分子形成的条斑紫菜叶状体不同基因型区域,通过叶片单色块区域无性生殖诱导放散单孢子,而批量获得基因型一致的完整叶片,构成子代CMD群体,并用于目标遗传性状平行性的评估和测量;将野生型的亲本作为参考基因组,利用SNP/InDel标记对子代CMD群体的极端表型池进行QTL‑seq分析;并结合KASP以及RNA‑seq的方法进行目标性状基因或主效QTL的定位预测;

所述的构建子代CMD群体为:

①野生型×红色突变体杂交得到F1代嵌合体叶片,通过红色突变体颜色标记区分嵌合叶片上由减数分裂四分子形成的条斑紫菜叶状体不同基因型区域,每个分离的区域为单基因型;

②通过对这些单基因型区域分别进行无性生殖诱导放散单孢子,从而获得单基因型的完整叶片,构成子代CMD群体,用于遗传性状测量和分析;

所述的QTL‑seq分析为:

共构建了五个DNA文库,分别为:红色突变体叶片的DNA文库、子代CMD群体中24个红色个体组成的红色池和24个野生型组成的野生型池、56个红色个体组成的红色池和56个野生型组成的野生型池;进行全基因组测序;对测得的原始序列过滤并注释SNP和/或InDels;提取两个亲本之间不同的纯合SNP/InDels;以野生型亲本的基因型作为参考,计算子代池的Δ(SNP/InDel‑index);以确定与突变型性状相关的候选基因组区域;

所述原始序列过滤并注释SNP和/或InDels为:使用Picard软件标记重复;SAMtools和GATK软件用于检测单核苷酸多态性和InDels;SNP/InDels过滤标准如下:覆盖深度≥4,≤

1000;位点质量≥20;相邻SNP距离≥5bp;使用ANNOVER软件注释SNP或InDels;

所述Δ(SNP/InDel‑index)为每个SNP/InDel在一个子代混池中的SNP/InDel‑index减去另一个子代混池的SNP/InDel‑index的差值;

所述SNP/InDel‑index为:提取两个亲本之间不同的纯合SNP/InDels;使用亲本野生型的基因型作为参考,统计子代池中这些位点的亲本突变型类型变异的reads条数,并计算reads条数占总条数的比例,即为该变异位点的SNP/InDel‑index。

说明书 :

一种紫菜经济性状快速精准染色体定位的方法及应用

技术领域

[0001] 本发明属于基因组学、分子育种领域,具体涉及一种利用色素突变体区分减数分裂四分子进行紫菜经济性状快速精准定位的方法及应用。

背景技术

[0002] 紫菜的生活史和世代的变化与高等植物的生活史和世代的变化大不相同,这导致高等植物中用于遗传分析的群体构建的常规方法不适用于紫菜。紫菜的叶片是从壳孢子
(2n)发育而来的。在壳孢子萌发期间,发生减数分裂并产生单倍体的有序四分子;它不同于
动物和高等植物中减数分裂形成单个生殖细胞的过程,紫菜减数分裂产生的四个细胞(有
序四分子(n)) 结合在一起;四分子中每个细胞的基因型可以由于减数分裂过程中发生的
同源重组而不同。随后有序四分子的每个细胞(n)通过有丝分裂依次发育成叶片的一部分,
因此紫菜的叶片是基因型嵌合的单倍体(除了从纯合子的壳孢子发育而来)。在发现色素突
变体之前,无法从视觉上分离出由四个四分体细胞形成的基因型嵌合叶片,使得性状定位
的相关研究受到制约。借助于色素突变体,可以清楚地区分减数分裂过程中同源重组产生
的具有不同基因型的四分子的四个细胞,从而获得经过同源重组交换的单基因型色块。单
基因型色块的生物量较小且叶片不完整,这限制了性状的测量和测序。而紫菜叶片具有可
通过无性繁殖释放出大量单孢子的特点,经过对单基因型色块进行诱导放散单孢子并培
养,可以为平行重复测量单基因型性状快速提供大量材料。
[0003] 作为遗传定位研究必不可少的分子标记,从最早的RFLP到前些年流行的SSR,标记密度不断提高。当SSR等第二代标记的密度和均匀性已经无法满足育种学家对遗传图谱等
遗传学研究的需求时,第三代分子标记—SNP应运而生。采用SNP标记制作的图谱是目前技
术下质量最好、密度最高、最为均匀的图谱。而且随着测序成本的降低,使得研究人员可以
基于已知的基因组,通过全基因组重测序的方法迅速获得大量SNP标记。将SNP与其他分子
标记相结合应用于分子辅助育种,也能大大提高分辨率并使得遗传资源得到更有效的利
用。
[0004] QTL‑seq是近年发展起来的采用高通量测序技术进行集群分离分析(BSA)定位数量性状主效基因或质量性状基因的一种方法,适用于双亲具有一对相对性状的子代群体。
该方法选择常用作图群体中20‑50个表现极端表型的单株组成极端表型池进行全基因测
序,以双亲之一的基因组为参照对两个极端表型池进行分析,寻找两个池中的SNP,计算每
个SNP的 SNP‑index,根据SNP‑index的分布进行QTL或基因预测。尽管QTL‑seq方便且有效
地缩小了候选QTL区域的范围,但它也有许多局限性,例如对于减数分裂重组事件不足的区
域,可能无法鉴定出目标基因。

发明内容

[0005] 针对现有技术中存在的高等植物中用于遗传分析的群体构建的常规方法不适用于紫菜的问题,本发明旨在利用色素标记区分单基因型色块以及紫菜叶片放散单孢子的特
性,快速得到大量经历过重组的单基因型完整叶片并构成定位CMD群体(Color‑secored 
Monospore Developed Population,CMD Population),并结合QTL‑seq、开发竞争性等位基
因特异性PCR (KASP)技术和RNA‑seq,以实现紫菜性状基因精确定位。
[0006] 为了达到上述目的,本发明采用如下技术方案:
[0007] 一种紫菜经济性状快速精准染色体定位的方法,利用色素突变体的颜色标记,区分紫菜叶片上由减数分裂四分子形成的紫菜叶状体不同基因型区域,通过单色块叶片区域
无性生殖诱导放散单孢子,从而批量获得基因型一致的完整叶片,构成子代CMD群体,并应
用于目标遗传性状平行性的评估和测量;将野生型的亲本作为参考基因组,利用SNP/InDel
标记对子代的极端表型池进行QTL‑seq分析;并结合KASP以及RNA‑seq的方法进行目标性状
基因或主效QTL的定位预测。
[0008] 在上述方案的基础上,所述的构建CMD群体为:
[0009] ①野生型×色素突变体杂交得到F1代嵌合体叶片,通过色素突变体颜色标记区分嵌合叶片上由减数分裂四分子形成的紫菜叶状体不同基因型区域,每个分离的区域为单基
因型;
[0010] ②通过对这些单基因型区域分别进行无性生殖诱导放散单孢子,从而获得单基因型的完整叶片,构成子代CMD群体,用于遗传性状测量和分析。
[0011] 在上述方案的基础上,所述的QTL‑seq分析为:
[0012] ①野生型×色素突变体杂交组合子代的CMD群体中,将一定量子代CMD个体根据性状混合组成同等个体量的一对性状相对的极端性状子代池;
[0013] ②将亲本野生型、色素突变体与子代池进行全基因组测序;对测得的原始序列过滤并注释SNP和/或InDels;
[0014] ③提取两个亲本之间不同的纯合SNP/InDels;以野生型亲本的基因型作为参考,计算子代池的Δ(SNP/InDel‑index);以确定与目标性状相关的候选基因组区域。
[0015] 在上述方案的基础上,所述原始序列过滤并注释SNP和/或InDels为:使用Picard软件标记重复;SAMtools和GATK软件用于检测单核苷酸多态性和InDels;SNP/InDels过滤
标准如下:覆盖深度≥4,≤1000;位点质量≥20;相邻SNP距离≥5bp;使用ANNOVER软件注释
SNP或InDels。
[0016] 在上述方案的基础上,所述每个子代池个体的数量≥24,且数目越多定位效果越好。
[0017] 在上述方案的基础上,所述Δ(SNP/InDel‑index)是每个SNP/InDel在其中一个子代混池中的SNP/InDel‑index减去另一个子代混池中的SNP/InDel‑index的差值。
[0018] 在上述方案的基础上,所述SNP/InDel‑index为:
[0019] 提取两个亲本之间不同的纯合SNP/InDels;使用亲本野生型的基因型作为参考,统计子代池中这些位点的亲本突变型类型变异的reads条数,并计算reads条数占总条数的
比例,即为该变异位点的SNP/InDel‑index。
[0020] 上述紫菜经济性状快速精准染色体定位的方法在条斑紫菜叶片红色性状位点定位中得到应用,应用QTL‑seq对野生型RZ×红色突变体HT杂交组合子代CMD群体的野生型混
池和红色突变型混池进行分析,能够将所述的紫菜叶片红色性状位点定位在4.9Mb内;采用
KASP 进一步将候选区间缩小到1.42Mb;结合RNA‑seq的方法确定HT中控制红色着色潜在的
候选基因为Py08429。
[0021] 本发明技术方案的优点:
[0022] 以红色突变体为代表的色素突变体是区分杂交子代叶片上嵌合基因型良好的视觉标记,本发明利用红色颜色标记或其他色素突变体颜色标记区分杂交子代叶片基因型,
快速构建 CMD群体,并进行所需性状的测量和评估;然后通过QTL‑seq、KASP和RNA‑seq的组
合方法对野生型×色素突变体杂交组合子代CMD群体组成的极端表型子代池进行分析,为
紫菜以及红毛菜纲物种的遗传性状定位提供了新的研究思路。
[0023] 以抗病性状的筛选为例,通过将正常不抗病的色素突变体与抗病的野生型品系杂交,可以轻松地区分从四分子发育的叶片的单一基因型色块,然后获得CMD种群,然后评估
不同 CMD个体的抗病水平,将这些CMD个体中极端抗病和极端不抗病性状的个体进行混池
分析进而筛选抗病性候选基因。因此,在本发明应用实例中,通过红突变和野生型之间的交
叉实验从F1后代获得的CMD群体用于鉴定和定位红色着色性状候选基因,不仅可以加深对
红藻着色机理的理解,而且可以通过颜色标记辅助构建群体从而分析和定位其他遗传性状
(数量性状和质量性状),为之后利用色素突变体进行紫菜以及红毛菜纲物种其他性状的分
析奠定基础。

附图说明

[0024] 图1是现有技术中SNP/InDel‑index计算原理图(Takagi,Abe et al.2013);
[0025] 图2表示两对含有不同个体数量混池的All‑index和Δ(All‑index)曼哈顿图(横坐标是 Chromosome物理位置,纵坐标是Δ(All‑index)),a—c:每个子代混池中含有24个
个体,d—f:每个子代混池中含有56个个体;
[0026] 图3 13个差异表达基因(DEG)在1.42Mb目标区域中的分布以及表达模式的热图,其中a为13个差异表达基因(DEG)在1.42Mb目标区域中的分布;b为目标区域中13个差异表
达基因(DEG)表达模式热图。

具体实施方式

[0027] 在本发明中所使用的术语,除非有另外说明,一般具有本领域普通技术人员通常理解的含义。
[0028] 下面结合具体实施例,并参照数据进一步详细的描述本发明。以下实施例只是为了举例说明本发明,而非以任何方式限制本发明的范围。
[0029] 实施例1
[0030] 1材料来源
[0031] 本发明使用了两种实验室培养的条斑紫菜纯系,即野生型RZ和红突变HT。从野生型 PYL‑349中分离出自发的红突变HT。由于子代四色块嵌合体的每个色块和三色块嵌合体
的两端色块各自分别具有统一的基因型,然后从F1叶片中筛选出四色块嵌合体和三色块嵌
合体 (单基因型),以上述方法构建CMD群体,并对其颜色性状进行评估。
[0032] 供试材料为野生型RZ×红色突变体HT杂交组合子代CMD群体中24个红色个体组成的红色池和24个野生型组成的野生型池,以及56个红色个体组成的红色池和56个野生型组
成的野生型池两对混池。
[0033] 2方法
[0034] 2.1建库测序
[0035] DNA提取使用植物基因组DNA提取试剂盒(中国天根)分别从亲本叶片和每个CMD 子代个体中提取DNA。使用Qubit.2.0荧光计(Invitrogen)和1%琼脂糖凝胶电泳和N60UV‑
Vis 分光光度计(Implen,慕尼黑,德国)检测DNA的浓度和质量。
[0036] 2.2QTL‑seq
[0037] 因其中作为亲本的RZ有高质量参考基因组,为了进一步探究混池个体数量对定位效果的影响,因此总共构建了五个DNA文库:来自HT叶片的DNA文库(父系);以及通过定量混
合24个红色(Red‑type,RT)CMD个体和24个野生型(Wild‑type,WT)CMD个体DNA分别构建代
表红色表型混池和野生型混池表型的RT24混池和WT24混池;并以相同的方式,通过等量混
合56个红色(Red‑type,RT)CMD个体和56个野生型(Wild‑type,WT)CMD个体 DNA构建的RT56
混池和WT56混池。使用Illumina HiSeq 2000平台(Illumina,美国)对插入片段大小约为
350bp,读取长度为150bp的双端测序进行全基因组重测序。
[0038] 将从亲本和四个子代库中获得的原始序列并进行过滤,并使用Burrows‑Wheeler比对工具(BWA)与条斑紫菜RZ基因组序列进行比对。使用Picard软件  (https://
sourceforge.net/projects/picard/)标记重复。SAMtools(设置:‑bS‑t,“rmdup”)和 GATK
软件用于检测单核苷酸多态性(SNPs)和InDels。SNP/InDels过滤标准如下:覆盖深度≥4,
≤1000;位点质量≥20;相邻SNP距离≥5bp。基于参考基因组的GFF3文件,使用ANNOVER软件
注释SNP或InDels。
[0039] 从VCF文件中提取了两个亲本之间不同的纯合SNP/InDels。使用RZ的基因型作为参考,统计子代池(RT24和WT24;RT56和WT56)中这些位点的亲本HT类型变异的reads条数,
并计算reads条数占总条数的比例,即为该变异位点的SNP/InDel‑index。完全与参考基因
组相同的SNP‑index为0;完全与参考基因组不同的SNP‑index为1。其原理如附图1所示。Δ 
(SNP/InDel‑index)是每个SNP/InDel在红色混池中的SNP/InDel‑index减去野生型混池中
的 SNP/InDel‑index的差值。计算SNP/InDel‑index和Δ(SNP/InDel‑index)值,以鉴定与
HT的红色型性状相关的候选基因组区域。使用具有1Mb窗口大小和100kb步长的滑动窗口方
法,计算了位于给定基因组区间内的平均Δ(SNP/InDel‑index)。将RT和WT池的Δ (SNP/
InDel‑index)绘制曼哈顿图。如果基因组区域包含目标基因,则Δ(SNP/InDel‑index) 值
应与0显著不同。我们计算了所有具有给定读取深度的SNP位置的统计置信区间Δ (SNP/
InDel‑index),并获得了95%的置信区间。通过检测Δ(SNP/InDel‑index),将置信度值上
方的区域定义为与红色着色相关联的候选区域。
[0040] 2.3候选区间验证
[0041] 使用来自F1后代的86个CMD个体,按照上述相同的方案筛选筛选构建基因图的变异标记,且筛选条件更严格(基因型缺失率≤0.2,MAF(最低等位基因频率)≥0.05)。使用R/ 
qtl软件进行QTL定位。区间定位法(interval mapping,IM)和复合区间定位法(composite
interval mapping,CIM)分别使用R/qtl中的scanone()和cim()函数进行。扫描步长为1 
cM,其他参数设置为默认值。为了LOD分数的阈值,每个性状permutation 1000次,并选择了
5%置信度阈值。LOD超过阈值的点为显著点,连续的显著点构成显著区间,LOD值最高的点
所在的位置作为该区间的peak,以peak点的LOD值为基准,下降1.5LOD值后所能涵盖的区间
作为该QTL的置信区间,如果两个peak之间的距离不超过给定的10cM长度,则合并为一个显
著区间。该方法参考eqtl软件包的define.peak()函数。
[0042] 2.4进一步缩小红色基因座位(rcl‑1)所在区间范围
[0043] 使用QTL‑seq分析中与目标区域相关的变异信息,使用竞争性等位基因特异性PCR (KASP)方法确定了用于精确定位的标记。总共设计了10个KASP标记以对328个个体进行基
因分型,包括亲本个体8个和F1的CMD个体的320个。
[0044] 2.5RNA‑seq
[0045] 为了候选区域中进行基因表达分析,对来自具有相同生活条件的两个亲本的叶片进行 RNA‑seq采样。每个亲本采样均进行了三个生物学重复。使用植物RNA试剂盒(OMEGA) 
提取总RNA,并使用用于qPCR试剂盒的HiScript II Q RT SuperMix(Vazyme Biotech)制备
第一条链cDNA。使用RNA Nano 6000分析试剂盒和Bioanalyzer 2100系统(Agilent
Technologies)评估RNA质量。使用VAHTS总RNA‑Seq文库制备试剂盒(Vazyme Biotech) 生
成测序文库。然后在Illumina HiSeq 2000平台(Illumina,美国)上以150bp的测序读长对
文库进行双末端测序。
[0046] 使用FastQC和Trimmomatic评估了原始测序读数的质量。使用TopHat和Cufflinks进行差异基因和转录本表达分析。
[0047] 3结果
[0048] 3.1QTL‑seq
[0049] 通过对库中的五个基因组文库(包括亲本和四个后代)进行重新测序,总共生成了133.4 Gb。将五个DNA库的测序序列与参考基因组比对,并检测出SNP位点和InDels。计算
All‑index 的变异包含在亲本HT中存在而不在RZ中存在的总共24,159个SNP/InDels,并基
于RT混池和WT混池的All‑index计算Δ(All‑index)。如果是包含目标基因的基因组区域,
则其Δ (All‑index)值应与0显著不同。对于RT24和WT24池,在95%的显着性水平下四个区
域与0显著不同,它们的总跨度为7.9Mb(表1)。对于RT56和WT56池,只有1号染色体末端的两
个区域与0显著不同,其总跨度为4.9Mb(表1)。这些结果表明,包含个体数目越多的混池定
位效果越好,在应用于其他性状定位时建议使用≥50个体数的混池。具体在本实验中,由于
结合两组混池定位区间可以进一步缩小候选区间,所以本实验中结合两组混池定位结果将
红色基因座位(rcl‑1)的候选区域确定在染色体1上从39,700,001到43,000,000(表1)。
[0050] 表1通过QTL‑seq确定的候选区域
[0051]
[0052] 3.2候选区域验证
[0053] 使用来自RZ×HT的86个CMD个体进一步确认1号染色体上的39,700,001‑43,000,000 区域。总共筛选了17888个Maker来构建遗传图谱,然后将共分离的Makers聚集成重组
Maker bins,最后共有243个重组Maker bins是实际上用来构建遗传图谱的。该图谱由3条
染色体组成,覆盖472.45cM,平均距离为1.94cM。使用R/qtl软件包对红色和野生型性状进
行QTL 分析。在染色体1中鉴定了位于QTL‑seq候选区域附近的在Marker4105和Marker4115
之间的QTL区间。Marker4105和Marker4115相距3.57cM,对应于2.74Mb的物理距离(基于条
斑紫菜RZ基因组序列,位于第1号染色体上的区域40,839,807‑43,583,607),该区域与QTL‑
seq 鉴定的区域重叠。传统的QTL分析结果证明了QTL‑seq定位结果的准确性。
[0054] 3.3KASP进一步缩小候选区间
[0055] 通过QTL‑seq鉴定的候选区域中共有36个高质量SNP/Indel位点。为了进一步缩小候选区间范围,我们开发了10个KASP标记,最后确定使用其中4个(SNP1‑4)对328个样本进
行了基因分型。在这些样本中,有九个样本(F1‑CMD‑PWT14‑2,F1‑CMD‑PWT2‑2, F1‑CMD‑
W12‑1,F1‑CMD‑W21‑3,F1‑CMD‑W22‑1,F1‑CMD‑WT16,F1‑CMD‑WT33, F1‑CMD‑WT55,F1‑CMD‑
WT81)在SNP1基因座位发现重组事件。由于高的共分离强度,在其他三个基因座中未发现重
组事件。这样红色基因座位(rcl‑1)的候选区间缩小到1.42Mb (第1号染色体上的41,578,
129‑43,000,000)。以RZ基因组为参考,在该目标区域中注释了 141个基因。在最终的候选
区间中鉴定出的27个SNP中:24个SNP位于基因间区域;两个 SNP位于基因上/下调控区,分
别与基因Py04887,Py08429和Py08430相关;一个位于Py08429 编码区域的非同义SNP[A/
C]。
[0056] 3.4RNA‑seq确定候选基因
[0057] 为了进一步确定条斑紫菜中红色着色相关的候选基因,对从两个亲本中收集的样品进行了RNAseq分析。总共检测到1459个差异表达基因(|log2(fold‑change|>1),包括605
个被注释的基因和854个预测的新基因。与RZ相比,HT中有718个基因被上调,而741个基因
被下调。值得注意的是,在这些基因中,与RZ相比,HT中上调了一个与色素直接相关的藻红
蛋白(Py09239)γ亚基基因(Py09239);在叶绿素代谢途径中,HT中的镁螯合酶亚基H 
(Py02527)的表达水平低于RZ。然而在结果3.3中的候选区间中不包括Py09239和Py02527,
表明候选基因可能是通过调节色素含量的变化进而改变叶色。
[0058] 为了确定HT中控制红色着色潜在的候选基因,将1.42Mb候选区间中的141个基因挑选出来,结果发现其中只有13个基因显示RZ和HT之间存在显着差异(|log2(fold‑change
|>1)。结合结果3.3中的区间内变异信息,我们可以推测一个携带SNP(A/C)并在红色突变体
HT 中表现出明显的上调(>6倍)的Py08429基因是调节条斑紫菜红色着色的候选基因。
[0059] 我们从RZ和HT克隆了Py08429。结果表明,存在一个外显子,克隆的Py08429 cDNA 的预测编码序列(CDS)为1338bp,预测的相应蛋白质长度为446个氨基酸。Py08429序列在野
生型和红色突变体之间的比对显示外显子中有一个非同义的A→C突变,导致第331氨基酸
从谷氨酰胺(Gln,Q)在残基转化为脯氨酸(Pro,P)。
[0060] 3.5候选基因验证
[0061] 为了研究红色突变体基因座的保守性,随机选择了实验室中21个不同的野生型条斑紫菜进行PCR,然后Sanger测序检测。发现在该基因座中,这21个野生型条斑紫菜翻译的
氨基酸位点与RZ蛋白位点相同。这些发现间接表明Py08429可能是调控条斑紫菜红色着色
的候选基因。
[0062] 以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等
效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所
作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。