一种异源六倍体遗传连锁分析方法转让专利

申请号 : CN201410009514.3

文献号 : CN103745134B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邬荣领叶梅霞李鑫庞晓明

申请人 : 北京林业大学

摘要 :

本发明公开一种异源六倍体遗传连锁分析方法,其推导是基于异源多倍体减数分裂过程中染色体的优先配对现象;优先配对包括三种类型;分别获取:六条染色体两两优先配对的1种情况,六条染色体中的两条染色体优先配对且其他四条染色体自由配对的6种情况,六条染色体全部随机配对的8种情况;生成基于异源六倍体优先配对因子的分子标记共分离基础模型,并建立共分离概率矩阵;根据概率矩阵中的每一个元素,构建过渡矩阵;统计实际数据中每一种配子的真实数量,并根据可能的配子情况统计出M矩阵;根据总概率矩阵、过渡矩阵、M矩阵计算异源六倍体减数分裂过程中优先配对因子的估算值;通过不断迭代重新计算重组率r;以此构建异源六倍体遗传连锁图。

权利要求 :

1.一种异源六倍体遗传连锁分析方法,其特征在于,包括:步骤1、根据异源六倍体的六条染色体两两优先配对、两条优先配对四条随机配对、六条全部随机配对的三种配对方式,分别获取:六条染色体两两优先配对的1种情况,六条染色体中的两条染色体优先配对且其他四条染色体自由配对的6种情况,六条染色体全部随机配对的8种情况;

步骤2、根据步骤1的三种配对方式,确定每种配对方式的单个亲本的三倍体配子;

步骤3、针对每一种配对方式中的每一种情况分别构建每一种配子产生的概率矩阵作为概率表;针对每一种情况的每一种配子产生的概率表,计算每一种配对方式中的全部配子的概率总表,作为六倍体优先配对因子估算的基础模型;根据每种配对方式的配子的概率总表,计算每一优先配对情况下的配子产生概率,并针对所有配子生成总概率矩阵;

步骤4、根据总概率矩阵中的每一元素,构建过渡矩阵;统计实际数据中每一种配子的真实数量,并根据可能的配子情况统计出M矩阵;通过迭代循环计算重组率r;

步骤5、根据总概率矩阵、过渡矩阵、M矩阵计算六倍体减数分裂过程中优先配对因子的估算值。

2.根据权利要求1所述的异源六倍体遗传连锁分析方法,其特征在于,所述步骤2具体为:步骤21、在六条染色体两两配对的15种配对方式下,每一种配对情况产生8种三倍体的配子,经过合并共得到20种三倍体的配子:

3.根据权利要求2所述的异源六倍体遗传连锁分析方法,其特征在于,所述步骤3具体为:步骤31、在六条染色体两两优先配对的配对方式下,通过一条染色体上两个标记位点之间的重组率推导出20种配子的概率;这些概率是由重组率以及优先配对因子决定的;

步骤32、计算15种配对情况中的每一种配对情况的配子的概率矩阵:其中Pf1至Pf15在数值上相等;

步骤33、将15个概率矩阵合并生成20种配子的概率总表以作为六倍体优先配对因子估算的基础模型。

4.根据权利要求3所述的异源六倍体遗传连锁分析方法,其特征在于,所述步骤4具体为:步骤41、在六条染色体两两配对的配对方式下,根据所述概率总表计算20种配子的总概率矩阵P;

其中Ak为第k种优先配对情况中各种配子的概率矩阵;

其中Pfk(k=1,…,15)为所述15种情况下的第k种优先配对情况下配子产生的概率矩阵;

步骤42、构建过渡矩阵Q;

总概率矩阵P当中的每一个元素都是由若干个加号连接的关于重组率r以及优先配对因子θ的多项式;把加号连接的每一个多项式作为独立的个体,把每一个独立多项式中r的幂指数乘以该多项式,形成新的矩阵作为过渡矩阵Q:步骤43、构建过渡矩阵Ψ;

步骤44、统计实际数据中每一种配子的真实数量,按照20种理论上可能产生的配子情况,统计得出M矩阵;

步骤45、根据EM算法估算重组率r:

其中N为染色体的数量。

5.根据权利要求4所述的异源六倍体遗传连锁分析方法,其特征在于,所述步骤5具体为:步骤51、在六条染色体两两配对的配对方式下,根据P矩阵、Q矩阵、M矩阵、Ψ矩阵,计算所述配对方式下的优先配对因子θ1,θ2;

步骤52、根据θ1,θ2计算θ3;(θ1+θ2+θ3)=1。

说明书 :

一种异源六倍体遗传连锁分析方法

技术领域

[0001] 本发明涉及生物建模技术领域,特别是指一种异源六倍体遗传连锁分析方法。

背景技术

[0002] 多倍体在被子植物中是很常见的,大约有70%的被子植物在他们各自的进化历程中发生过多倍体化(Masterson,1994),多倍体化在植物进化过程中起到了至关重要的作用。植物多倍体化被认为是植物进化的主要动力,因此多倍体研究对植物进化研究具有指导意义。
[0003] 多倍体按照起源可以分为同源多倍体和异源多倍体。同源多倍体的多个染色体组是由同一物种经染色体加倍形成的;异源多倍体的染色体组由不同物种得来。根据同源染色体倾向于优先配对的原则,多倍体的多条染色体在减数分裂过程中,异源多倍体的染色体会产生优先配对现象。根据对多倍体染色体优先配对因子的估算,有助于探究多倍体的物种起源,并且对多倍体的进化研究有重要意义。
[0004] 2001年国际上首次把优先配对现象融入多倍体统计模型之中。但是在近10年,对多倍体优先配对现象及优先配对因子的估算,还仅仅停留在对四倍体的分析上,而对六倍体优先配对因子的估算尚属空白。其主要原因在于:现有估算四倍体优先配对因子的模型仅仅涉及一个参数,估算系统相对简单;而六倍体由于具有六条染色体,若想估算其优先配对因子至少需要同时估算两个参数,这就为估算增大了难度。

发明内容

[0005] 本发明要解决的技术问题是提供一种异源六倍体遗传连锁分析方法,能够对多倍体优先配对因子进行估算。
[0006] 为了解决上述问题,本发明实施例提出了一种异源六倍体遗传连锁分析方法,包括:
[0007] 步骤1、根据异源六倍体的六条染色体两两优先配对、两条优先配对四条随机配对、六条全部随机配对的三种配对方式,分别获取:六条染色体两两优先配对的1种情况,六条染色体中的两条染色体优先配对且其他四条染色体自由配对的6种情况,六条染色体全部随机配对的8种情况;
[0008] 步骤2、根据步骤1的三种配对方式,确定每种配对方式的单个亲本的三倍体配子;
[0009] 步骤3、针对每一种配对方式中的每一种情况分别构建每一种配子产生的概率矩阵作为概率表;针对每一种情况的每一种配子产生的概率表,计算每一种配对方式中的全部配子的概率总表,作为六倍体优先配对因子估算的基础模型;根据每种配对方式的配子的概率总表,计算每一优先配对情况下的配子产生概率,并针对所有配子生成总概率矩阵;
[0010] 步骤4、根据总概率矩阵中的每一元素,构建过渡矩阵;统计实际数据中每一种配子的真实数量,并根据可能的配子情况统计出M矩阵;通过迭代重新计算重组率r;
[0011] 步骤5、根据总概率矩阵、过渡矩阵、M矩阵计算异源六倍体减数分裂过程中优先配对因子的估算值。
[0012] 作为上述技术方案的优选,所述步骤2具体为:
[0013] 步骤21、在异源六条染色体两两配对的15种配对方式下,每一种配对情况产生8种三倍体的配子,经过合并共得到20种三倍体的配子:
[0014]
[0015] 作为上述技术方案的优选,所述步骤3具体为:
[0016] 步骤31、在异源六条染色体两两优先配对的配对方式下,通过一条染色体上两个标记位点之间的重组率推导出20种配子的概率;这些概率是由重组率以及优先配对因子决定的;
[0017] 步骤32、计算15种配对情况中的每一种配对情况的配子的概率矩阵:
[0018]
[0019] 其中Pf1至Pf15在数值上相等;
[0020] 步骤33、将15个概率矩阵合并生成20种配子的概率总表以作为异源六倍体优先配对因子估算的基础模型;
[0021] 作为上述技术方案的优选,所述步骤4具体为:
[0022] 步骤41、在六条染色体两两配对的配对方式下,根据所述概率总表计算20种配子的总概率矩阵P;
[0023]
[0024] 其中Ak为第k种优先配对情况中各种配子的概率矩阵;
[0025]
[0026] 其中Pf(k k=1,…,15)为所述15种情况下的第k种优先配对情况下配子产生的概率矩阵。
[0027] 步骤42、构建过渡矩阵Q;
[0028] 总概率矩阵P当中的每一个元素都是由若干个加号连接的关于重组率r以及优先配对因子θ的多项式;把加号连接的每一个多项式作为独立的个体,把每一个独立多项式中r的幂指数乘以该多项式,形成新的矩阵作为过渡矩阵Q:
[0029] 步骤43、构建过渡矩阵Ψ;
[0030]
[0031] 步骤44、统计实际数据中每一种配子的真实数量,按照20种理论上可能产生的配子情况,统计得出M矩阵;
[0032] 步骤45、根据EM算法估算重组率r:
[0033] 其中N为染色体的数量;
[0034] 作为上述技术方案的优选,所述步骤5具体为:
[0035] 步骤51、在六条染色体两两配对的配对方式下,根据P矩阵、Q矩阵、M矩阵、Ψ矩阵,计算所述配对方式下的优先配对因子θ1,θ2;
[0036]
[0037]
[0038] 步骤52、根据θ1,θ2计算θ3;(θ1+θ2+θ3)=1。
[0039] 本发明的上述技术方案的有益效果如下:
[0040] 本发明提供了一种异源六倍体遗传连锁分析方法,通过实验可以看出,采用本发明的方法获得的参数估算的结果与其真值非常接近,均值相差很小,方差也很小,说明本发明的估算方法具有很好的准确度和精确度。

附图说明

[0041] 图1为本发明实施例的方法的流程示意图。

具体实施方式

[0042] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0043] 本发明提供了一种异源六倍体遗传连锁分析方法,其流程如图1所示的,包括:
[0044] 步骤A、构建估算异源六倍体杂交群体优先配对因子的统计模型;构建步骤为:
[0045] 步骤1、定义优先配对因子:
[0046] 把异源六倍体的六条染色体分别标号为:1、2、3、4、5、6。这六条染色体配对会有三种配对方式:①六条染色体两两优先配对、②两条优先配对四条随机配对、③六条全部随机配对的三种配对方式。其中:
[0047] ①六条染色体两两优先配对会产生1种配对情况(:1)1和2配对,3和4配对,则5和6自然配对,把这种情况命名为全部亲和。把这种情况的优先配对因子定义为θ1。
[0048] ②两条优先配对四条随机配对,其余四条染色体自由组合:这样的配对情况有6种,把这些配对情况的优先配对因子定义为θ2。
[0049] ③异源六倍体的六条染色体在减数分裂过程中不出现亲和配对,全部随机配对:这样的配对情况有8种,把这些配对情况的优先配对因子定义为θ3。
[0050] 步骤2、估算异源六倍体亲本减数分裂产生的配子类型。
[0051] 在第一种配对方式下,如果异源六倍体的六条染色体中1和2配对,3和4配对,则5和6自然配对。即会产生如下1种配对情况⑴1|2| 3|4| 5|6|;同时这个六倍体亲本将产生8种3倍体的配子:1|3|5|,1|3|6|,2|3|5|,2|3|6|,1|4|5|,1|4|6|,2|4|5|,2|4|6|;其中1|代表1号染色体,以此类推。如果考虑两位点的情况,位点A会产生8种配子,位点B会产生8中配子,那么综合考虑两个位点的信息则会产生64种配子类型。这种情况下配子的概率如下表所示:
[0052]
[0053] 表1.情况⑴对应产生两位点64种配子概率
[0054] 在第二种配对方式下,如果六倍体的六条染色体中某两条染色体优先配对,其余四条染色体随机组合配对。则会产生如下6种配对情况;
[0055] ⑵1|2| 3|5| 4|6|,⑶1|2| 3|6| 4|5|(,1号2号染色体优先配对)[0056] ⑷1|5|3|4|2|6|,⑸1|6|3|4|2|5|(,3号4号染色体优先配对)
[0057] ⑹1|3|2|4|5|6|,⑺1|4|2|3|5|6|。(5号6号染色体优先配对)
[0058] 同时每一种配对情况六倍体亲本将对应产生8种3倍体的配子:
[0059] 情况⑵对应的8种三倍体配子为:1|3|4|,1|3|6|,2|3|4|,2|3|6|,1|4|5|,1|5|6|,2|4|5|,2|5|6|;情况⑶对应的8种三倍体配子为:1|3|4|,1|3|5|,2|3|4|,2|3|5|,1|6|4|,1|6|5|,2|6|4|,2|6|5|;情况⑷对应的8种三倍体配子为:1|2|3|,1|3|6|,2|3|5|,3|5|6|,1|2|4|,1|4|6|,2|4|5|,4|5|6|;情况⑸对应的8种三倍体配子为:1|3|2|,1|3|5|,1|4|2|,1|4|5|,6|3|2|,3|5|6|,2|4|6|,4|5|6|;情况⑹对应的8种三倍体配子为:1|2|5|,1|2|6|,1|4|5|,1|4|6|,2|3|5|,2|3|6|,3|4|5|,3|4|6|;情况⑺对应的8种三倍体配子为:1|2|5|,1|2|6|,1|3|5|,1|3|6|,2|4|5|,2|4|6|,3|4|5|,3|4|6|;
[0060] 在第三种配对方式下,六倍体的六条染色体全部随机组合配对。则会产生如下8种配对情况;
[0061] ⑼1|3|2|5|4|6|,⑼1|3|2|6|4|5|,⑽1|4|2|5|3|6|,
[0062] ⑾1|4|2|6|3|5|,⑿1|5|2|3|4|6|,⒀1|5|3|6|2|4|,
[0063] ⒁1|6|2|3|4|5|,⒂1|6|3|5|2|4|。
[0064] 同时每一种配对情况六倍体亲本将对应产生8种3倍体的配子:
[0065] 情况⑻对应的8种三倍体配子为:1|2|4|,1|2|6|,1|4|5|,1|5|6|,2|3|4|,2|3|6|,3|4|5|,3|5|6|;情况⑼对应的8种三倍体配子为:1|2|4|,1|2|5|,1|4|6|,1|5|6|,2|3|4|,2|3|5|,3|4|6|,3|4|5|;情况⑽对应的8种三倍体配子为:1|2|3|,1|2|6|,1|3|5|,1|5|6|,2|3|4|,2|4|6|,3|4|5|,4|5|6|;情况⑾对应的8种三倍体配子为:1|2|3|,1|2|5|,1|3|6|,1|5|6|,2|3|4|,2|4|5|,3|4|6|,4|5|6|;情况⑿对应的8种三倍体配子为:1|2|4|,1|2|6|,1|3|4|,1|3|6|,2|4|5|,2|5|6|,3|4|5|,3|5|6|;情况⒀对应的8种三倍体配子为:1|2|3|,1|3|4|,1|2|6|,1|4|6|,2|3|5|,3|4|5|,2|5|6|,4|5|6|;情况⒁对应的8种三倍体配子为:1|2|4|,1|2|5|,1|3|4|,1|3|5|,2|4|6|,2|5|6|,3|4|6|,3|5|6|;情况⒂对应的8种三倍体配子为:1|2|3|,1|3|4|,1|2|5|,1|4|5|,2|3|6|,3|4|6|,2|5|6|,4|5|6|;
[0066] 因此一共会产生如下所示的20种三倍体的配子:
[0067]
[0068] 步骤3、构建估算六倍体杂交群体优先配对因子的统计模型。
[0069] 步骤31、首先需要构建每一种配子产生的概率矩阵:
[0070] 根据一条染色体上两个标记位点之间的重组率能够推导出这20种配子的概率;这些概率是由重组率以及优先配对因子决定的。
[0071] 根据步骤1可知六倍体减数分裂理论上会产生3倍体的配子,每一种优先配对情况都对应产生8种配子。例如,全部优先配对情况下(1|2|3|4|5|6|)会产生8种配子:1|3|5|,1|3|6|,1|4|5|,1|4|6|,2|3|5|,2|3|6|,2|4|5|,2|4|6|。如果考虑两个标记位点,那么配对情况⑴产生的配子概率情况如下表:
[0072]
[0073] 表1.情况⑴对应产生两位点64种配子概率
[0074] 情况⑵-⑻对应的64种配子概率分别由表2-表8给出:
[0075]
[0076]
[0077] 表2.情况⑵对应产生两位点64种配子概率
[0078]
[0079] 表3.情况⑶对应产生两位点64种配子概率
[0080]
[0081] 表4.情况⑷对应产生两位点64种配子概率
[0082]
[0083]
[0084] 表5.情况⑸对应产生两位点64种配子概率
[0085]
[0086] 表6.情况⑹对应产生两位点64种配子概率
[0087]
[0088] 表7.情况⑺对应产生两位点64种配子概率
[0089] 情况⑻-⒂对应的64种配子概率分别由表8-表15给出:
[0090]
[0091]
[0092] 表8.情况⑴对应产生两位点64种配子概率
[0093]
[0094] 表9.情况⑼对应产生两位点64种配子概率
[0095]
[0096] 表10.情况⑽对应产生两位点64种配子概率
[0097]
[0098]
[0099] 表11.情况⑾对应产生两位点64种配子概率
[0100]
[0101] 表12.情况⑿对应产生两位点64种配子概率
[0102]
[0103] 表13.情况⒀对应产生两位点64种配子概率
[0104]
[0105]
[0106] 表14.情况⒁对应产生两位点64种配子概率
[0107]
[0108] 表15.情况⒂对应产生两位点64种配子概率
[0109] 步骤32、根据步骤1可知,异源六倍体减数分裂染色体配对方式共有15种配对情况,对每一种情况按照步骤2计算对应配子的概率表,这样会将得到15个8*8的概率矩阵。将这15个概率矩阵合并,得到全部20种配子的概率总表;这个概率总表就是异源六倍体优先配对因子估算的基础模型;
[0110]
[0111] Pf2…Pf15在数值上与Pf1相等。
[0112] 位点A共可能产生20种配子,位点B共可能产生20种配子,则考虑两个位点的情况,六倍体共可能产生400种配子类型;该400种配子类型为一20*20的矩阵。
[0113] 步骤4、估算重组率r;
[0114] 步骤41、根据前述的概率总表,设这15种情况下的第k种优先配对情况下,配子产生的概率为Pf(k k=1,…,15);设Ak为第k种优先配对情况中各种配子的概率矩阵;
[0115]
[0116] 则全部20种配子的总概率矩阵P为
[0117]
[0118] 步骤42、构建过渡矩阵Q;Q矩阵是根据计算系统临时定义的矩阵,没有实际生物学含义。根据估算参数不同,Q矩阵形式也不同,分为Qr矩阵、Qθ1矩阵和Qθ2矩阵。
[0119] 总概率矩阵P当中的每一个元素都是由若干个加号连接的关于重组率r以及优先配对因子θ的多项式。把加号连接的每一个多项式看成独立的个体,要估算重组率r,就要把每一个独立多项式中r的幂指数乘以该多项式,得到
[0120]
[0121] 估算Qθ1矩阵和Qθ2矩阵的方法与估算Qr矩阵类似,这里不再赘述。并统称过渡矩阵为Q矩阵。
[0122] 步骤43、构建过渡矩阵Ψ。Ψ矩阵是根据计算系统临时定义的矩阵,没有实际生物学含义。
[0123]
[0124] 步骤44、统计实际数据中每一种配子的真实数量,按照20种理论上可能产生的配子情况,统计得出M矩阵。
[0125] 步骤45、根据EM算法估算重组率r:
[0126]
[0127] 其中N为染色体的数量;
[0128] 步骤5、由步骤4可以得出P矩阵、Q矩阵、M矩阵、Ψ矩阵,由此计算。则[0129]
[0130] 其中,步骤5具体为:
[0131] 步骤51、在异源六条染色体两两配对的配对方式下,根据P矩阵、Q矩阵、M矩阵、Ψ矩阵,计算所述配对方式下的优先配对因子θ1,θ2;
[0132]
[0133]
[0134] 步骤52、根据θ1,θ2计算θ3;(θ1+θ2+θ3)=1。
[0135] 根据步骤1-5得出异源六倍体减数分裂过程中优先配对因子的估算值。
[0136] 以下通过计算机模拟实验验证算法准确性及精度。
[0137] 假设优先配对因子θ(i i=1,2,3)满足以下两个条件:(1)(0﹤θi<1,i=1,2,3).(2)(θ1+θ2+θ3)=1。
[0138] 假设一个亲本分别为P(1 1|2|3|4|5|6|)和P(2 1|1|1|1|1|1|)。假设他们子代样本量分别为n=200,400,800。
[0139] 假设两个标记位点A和B之间的重组率有四种,分别是两个高度连锁(r=0.05,0.15)和两个低连锁程度(r=0.25,0.35)。
[0140] 针对两位点全信息量连锁相 两位点部分信息连锁相以及显性标记连锁相 这三种有代表性的连锁相,其中每一种连锁相都对应上述参数做1000次计算机模拟实验,充分验证估算六倍体染色体优先配对因子模型的准确度与精确度。
[0141] 其中,在样本量n=200时,各参数的估算结果如下表所示的:
[0142]
[0143] 以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。