一种蛋鸡全基因组SNP芯片及其应用转让专利

申请号 : CN201880004561.5

文献号 : CN113039288B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨宁孙从佼刘壮闫奕源吴桂琴

申请人 : 中国农业大学

摘要 :

提供了一种蛋鸡全基因组SNP芯片及其应用,该芯片上的SNP位点分别源于中国主要蛋鸡各品系共有的14624个SNP位点;与蛋鸡抗病性状相关的3677个SNP位点;与蛋鸡经济性状相关联的1.6万个SNP位点;弥补前述探针未覆盖的基因组区域的9358个SNP位点。该蛋鸡全基因组SNP芯片上的43681个SNP具有SEQ ID NO.1‑43681所示的DNA序列,该芯片可以特异性地鉴定商业化蛋鸡与地方品种蛋鸡的亲缘关系,还可以进行全基因组关联分析、全基因组选择育种,以及目标性状QTL定位分析和群体遗传学分析等应用。

权利要求 :

1.一种蛋鸡全基因组SNP芯片,其特征在于,由43681个SNP分子标记组成,其核苷酸序列分别如SEQ ID NO.1 43681所示;

~

所述分子标记的SNP位点位于SEQ ID NO.1 43681所示的核苷酸序列的第61位。

~

2.如权利要求1所述的蛋鸡全基因组SNP芯片,其特征在于,所述分子标记与蛋鸡抗病性状相关联、或与蛋鸡经济性状相关联;所述蛋鸡经济性状为产蛋性能、产蛋品质、饲料报酬、免疫力。

3.权利要求1所述的蛋鸡全基因组SNP芯片在商品化蛋鸡与地方品种蛋鸡亲缘关系鉴定中的应用。

4.权利要求1所述的蛋鸡全基因组SNP芯片在蛋鸡品种鉴定中的应用。

5.权利要求1所述的蛋鸡全基因组SNP芯片在蛋鸡育种中的应用。

6.权利要求1所述的蛋鸡全基因组SNP芯片在蛋鸡种质资源改良中的应用。

7.权利要求1所述的蛋鸡全基因组SNP芯片在蛋鸡群体遗传多样性分析中的应用。

8.权利要求1所述的蛋鸡全基因组SNP芯片在蛋鸡目标性状QTL定位分析中的应用。

说明书 :

一种蛋鸡全基因组SNP芯片及其应用

技术领域

[0001] 本发明涉及分子生物学、功能基因组学、生物信息学和基因组育种领域,更具体涉及一种鸡全基因SNP芯片及其用途。

背景技术

[0002] SNP是指基因组水平上由单个核苷酸碱基的改变而导致核酸序列的多态性,其变异形式包括转换、颠换、缺失和插入等,具有数量多、分布广泛和易检测等特点。SNP作为一
种遗传标记分子,对质量性状、经济性状以及一些复杂的疾病性状的遗传变异具有贡献,因
此被广泛应用于遗传研究中。SNP芯片是将大量带有荧光标记的DNA探针固定在玻璃基片上
通过光蚀刻而成,其原理是通过探针DNA链与检测目标基因组DNA进行杂交、结合,再经染色
剂染色后利用激光扫描从而对SNP进行基因分型。SNP生物芯片的优势在于检测通量很大,
一次可以检测几十万甚至几百万个SNP位点,其检测的准确性也很高。
[0003] 全基因组SNP芯片即单核苷酸多态性(SNP)微阵列(Array),将数百万DNA标记序列排列在玻片或特殊硅片上,固定形成SNP探针阵列。它的工作原理是通过固定在芯片上的
DNA标记序列与目标基因组发生碱基配对反应,从而精准鉴定基因信息。基因芯片运用先进
的微生化反应技术、显微标记技术、微米级扫描分辨成像技术和生物信息计算机处理技术,
准确鉴定检测生物个体中特定的mRNA或DNA序列。鸡的商业化SNP芯片主要有两款,
Illumina公司的iSelect chicken 60K SNP芯片(已经下架,归美国科宝公司所有)和
Affymetrix公司的600K高密度芯片。目前市场上仅售的Affymetrix 600K SNP芯片富含约
56万个SNP,其位点主要来源于国外的商业化肉鸡品系、蛋鸡品系和一些近交系,相比之前
Illumina 60K芯片,该芯片密度有了很大的提高,但是这些位点在中国地方品种中的应用
却没有达到理想的效果。申请人前期的检测结果(约2,600个蛋鸡个体)发现Affymetrix 
600K高密度SNP芯片上约一半的位点多态性较差,再加上昂贵的成本也进一步阻碍了它在
我国大规模群体中的实际应用。
[0004] 畜禽全基因组SNP芯片由于标记密度高,均匀覆盖全基因组、具有测定准确率高、易实现标准化和自动化检测等诸多优势,可以应用于分子遗传研究和分子辅助育种等各个
方面,可为育种上下游过程提供支持,包括种质资源遗传多样性分析、亲缘关系分析、全基
因组关联分析、数量性状QTL定位分析和选择进化研究等。其中非常重要的应用是在全基因
组选择育种(Genomic Selection)中的应用。全基因组选择是当前畜禽育种中主要选育技
术,运用全基因组标记,估计所有可能的遗传效应,解释全部的遗传变异,通过统计标记的
遗传效应,进行全基因组育种值的预测,具有育种值估计准确性高、遗传进展快的优点,已
应用于奶牛、生猪、国外高产蛋鸡和快大型白羽肉鸡的商业化品系选育实践。
[0005] 然而,现有鸡600K商业化SNP芯片( Genome‑Wide Chicken Genotyping Array)位点信息多来源于国外商业蛋鸡和肉鸡品种,缺少中国地方鸡种(肉用或优质蛋用
鸡品种)基因组变异信息,在应用于中国地方鸡种选育及相关基础科学研究中具有较大局
限性。其次,由于鸡与其他动物相比,具有品种繁多、群体量大、但是个体价格低廉等特点,
所以进行大群体样本检测中,需要一款价格相对低廉的全基因组SNP芯片。因此,蛋鸡育种
行业及科研领域均亟待开发一种通量适中,包含中国地方蛋鸡品种特有遗传变异信息,通
量适中的蛋鸡全基因组SNP芯片。

发明内容

[0006] 本发明的目的在于提供一种蛋鸡全基因组SNP芯片及其应用。
[0007] 本发明首先提供一种用于蛋鸡全基因组SNP分子标记组合,由43681个SNP分子标记组成,其核苷酸序列分别如SEQ ID NO.1~43681所示。
[0008] 本发明提供一种蛋鸡全基因组SNP芯片,包含43681个SNP分子标记,其具有SEQ ID NO.1~43681所示的核苷酸序列。
[0009] 本发明提供蛋鸡全基因组SNP芯片中,SNP位点包括五类探针:第一类是从中国国内7个品系(洛岛红Line1,洛岛白Line2、Line3,白来航Line4、Line5,贵妃鸡,东乡绿壳蛋
鸡)共479个个体重测序数据筛选出的多态性良好的SNP位点,包含14,624个位点;第二类探
针涉及申请人前期对蛋鸡抗病性状研究的发现的功能位点,包含3,677个SNP;第三类探针
包含申请人前期通过全基因组关联分析(GWAS)技术挖掘出与蛋鸡重要经济性状(产蛋性
能、蛋品质、饲料效率等)相关的显著位点,共2,677个SNP;第四类探针是根据已有的相关候
选基因的文献和QTL数据库报道的跟蛋鸡经济性状相关的位点,共13,345个SNP;第五类是
从SNP database数据库(ftp://ftp.ncbi.nlm.nih.gov/snp/organisms/archive/
chicken_9031/)补充前几类未能覆盖的区域,包含9,358个SNP位点。以上五类探针共计包
含43,681个SNP位点。
[0010] 本发明的上述蛋鸡全基因组SNP分子标记组合及上述的蛋鸡全基因组SNP芯片中,所述分子标记的SNP位点位于SEQ ID NO.1~43681所示的核苷酸序列的第61位。
[0011] 所述分子标记与蛋鸡抗病性状相关联、或与蛋鸡经济性状相关联;所述抗病为抗马立克氏病;所述蛋鸡经济性状为产蛋性能、产蛋品质、饲料报酬、免疫力。
[0012] 本发明还提供了上述蛋鸡全基因组SNP芯片在检测蛋鸡DNA样品中的应用,该芯片可以对中外蛋鸡品种资源进行种质资源评价、对地方蛋鸡和商业化蛋鸡进行全基因组选择
育种、目标性状QTL、关联位点及候选基因鉴定、亲缘关系鉴定等。
[0013] 具体地,本发明提供了上述蛋鸡全基因组SNP分子标记组合和/或上述的蛋鸡全基因组SNP芯片在鸡种质资源改良中的应用。
[0014] 本发明提供了上述蛋鸡全基因组SNP分子标记组合和/或上述的蛋鸡全基因组SNP芯片在鸡品种鉴定中的应用。
[0015] 本发明提供了上述蛋鸡全基因组SNP分子标记组合和/或上述的蛋鸡全基因组SNP芯片在蛋鸡育种中的应用。
[0016] 本发明提供了上述蛋鸡全基因组SNP分子标记组合和/或上述的蛋鸡全基因组SNP芯片在商品化蛋鸡与地方品种蛋鸡亲缘关系鉴定中的应用。
[0017] 本发明提供了上述蛋鸡全基因组SNP分子标记组合和/或上述的蛋鸡全基因组SNP芯片在蛋鸡遗传多样性分析中的应用。
[0018] 本发明提供了上述鸡全基因组SNP分子标记组合和/或上述的蛋鸡全基因组SNP芯片在蛋鸡目标性状QTL定位分析中的应用。
[0019] 本发明蛋鸡全基因组SNP芯片上所有SNP标记根据SNP数据库名称命名,其核苷酸序列来源于鸡的5版本参考基因组(Gallus_gallus‑5.0,2016)。
[0020] 本发明的优点在于:1).优化设计:全基因组各染色体均匀分布,覆盖度高,保证了蛋鸡基因组遗传评估的准确性;2).功能相关性:该芯片收集了与蛋鸡产蛋性能、抗病性状、
饲料利用效率和蛋品质等性状相关的显著位点,增加了芯片的实用性;3).适用性:芯片位
点来源于自主选育的商业化高产蛋鸡品种和我国地方品种中多态性较高的SNP,既满足了
科研工作者的科研需求也满足了蛋鸡企业进行全基因组分子育种的工作。

附图说明

[0021] 图1为本申请的蛋鸡全基因组SNP芯片在鸡基因组分布情况,横坐标分别为20、40、60、80、100、120、140、160、180、200Mb,纵坐标由下到上分别表示chr1、chr2、chr3、chr4、
chr5、chr6、chr7、chr8、chr9、chr10、chr11、chr12、chr13、chr14、chr15、chr16、chr17、
chr18、chr19、chr20、chr21、chr22、chr23、chr24、chr25、chr26、chr27、chr28、chr33、
chrLGE64和chrZ。
[0022] 图2为本申请所有SNP位点在全基因组各染色体占有比例。
[0023] 图3为各个品种鸡的主成分分析图。图上数字分别代表10个品种,1表示北京油鸡,2表示白来航鸡,3表示贵妃鸡,4表示东乡绿壳鸡,5表示丝羽乌骨鸡,6表示黄羽肉鸡,7表示
洛岛白鸡,8表示藏鸡,9表示矮脚鸡,10表示洛岛红鸡。
[0024] 图4为各个品种鸡的聚类分析图。枝条的大分叉代表每个品种都能独立区分开,小分叉代表每个个体。
[0025] 图5为洛岛红鸡36周龄蛋重的曼哈顿图。

具体实施方式

[0026] 以下实施例进一步说明本发明的内容,但不应理解为对本发明的限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改或替换,均属于本发明
的范围。
[0027] 若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
[0028] 实施例1蛋鸡全基因组SNP芯片的制备方法
[0029] 本发明第一类探针获得:对中国国内自主选育的商业化品种以及地方品种蛋鸡进行全基因组重测序,其中包括洛岛红鸡、洛岛白鸡、白来航鸡、贵妃鸡和东乡绿壳蛋鸡等7个
品系(洛岛白和白来航有两个品系)的479个个体(洛岛红Line1:92个,洛岛白Line2:74个,
洛岛白Line3:91个,白来航Line4:60个,白来航Line5:69个,贵妃鸡:68个,东乡绿壳蛋鸡:
25个),剔除每个品种MAF<0.05的SNP位点,同时筛选出各个品系共有的SNP以及以洛岛红
鸡为主导的至少在其他一个品系中也共有的SNP位点,这样很大程度地保证了SNP位点的多
态性和通用性。最终,各系共有的64,396个SNP以及以洛岛红鸡为主导的3,782,699个SNP位
点作为本芯片的核心备选SNP。
[0030] 本发明第二类探针获得:申请人前期对鸡的抗病性状研究,利用美国农业部下属的禽病与肿瘤实验室组建的抗马立克氏病的近交系白来航群体(其中抗病系和易感系各三
个个体),通过全基因组重测序技术挖掘出各品系内存在的遗传变异,挑选出与抗病性状相
关的系特异性SNP位点,共计1,554,188个,再通过与上一步所述的7个品系479个个体重测
序得到的多态性较好的SNP进行overlapping,这样极大程度地保证了这些SNP位点在其他
蛋鸡品种中的适用性,最终备选了480,341个抗病特异性的SNP。
[0031] 本发明第三类探针获得:这类探针是根据申请人前期对蛋鸡重要经济性状的全基因组关联分析研究筛选得到,共两部分:第一部分是利用分别来自40个家系的385个白来航
和361个矮脚蛋鸡对产蛋性能(产蛋数和蛋重)和蛋品质进行关联分析;第二部分是利用白
来航和东乡绿壳蛋鸡正反交得到的F2代资源群体,对1,512个母鸡的产蛋性能,饲料利用效
率,蛋品质和繁殖性能进行全基因组关联分析。以上获得的与蛋鸡重要经济性状相关联的
SNP位点,再通过生物统计学方法分析去重后,得到2,677个功能性位点加入到芯片中。
[0032] 本发明第四类探针获得:通过查找已发表文献的相关候选基因和在线QTL database数据库(https://www.animalgenome.org/cgi‑bin/QTLdb/GG/index)获得与鸡的
蛋品质、产蛋性能、饲料效率和免疫相关的QTL,剔除置信区间较大和P值不显著(P>0.05)
的QTL,最终得到了1,238个候选QTL区间,再利用重测序数据得到的SNP与候选基因和QTL进
行overlapping,筛选出589,164个SNP作为性状相关的备选位点。
[0033] 本发明第五类探针获得:通过NCBI(https://www.ncbi.nlm.nih.gov/snp)的鸡SNP database数据库下载得来。
[0034] SNP位点鉴定流程:考虑到鸡不同染色体片段大小差异较大,并且不同染色体上突变位点的重组率不一致,第一步先对每条染色体上的连锁不平衡水平进行检测,从而设置
每条染色体的最优窗口/区间的大小,利用这些窗口/区间使得SNP在各条染色体上均匀分
布,每个区间优先选择1个第一类各个品系共有的SNP探针,如果小于1个,则选择第二类探
针中的SNP,第三类探针是强制放入芯片中的SNP,如果第一类探针和第二类探针选择完后,
仍然不能覆盖的窗口,则选取第四类探针的SNP,第五类探针是补充上述几类探针不能覆盖
的区间。
[0035] 将鉴定好的SNP位点提交至Illumina公司,利用Infinium XT打分系统(http://www.illumina.com/)进行打分,将所有分值<0.8的位点去掉。对于删除的不合格SNP位点,
选取距离其最近的SNP位点进行补充,并且再次进行打分。按照以上步骤鉴定和筛选,最后
共获得50,000个标签SNP位点。由于Illumina Infinium XT平台利用这5万个SNP位点制作
芯片时,存在成功转化率的问题,因此最终完成的蛋鸡全基因组50K SNP芯片上的有效SNP
位点数为43,681个(见图1和图2)。
[0036] 表1本发明蛋鸡全基因组SNP芯片位点在各染色体分布数量
[0037]
[0038] 实施例2基于本发明蛋鸡全基因组SNP芯片进行主成分和聚类分析
[0039] 使用本发明提供的蛋鸡全基因组50K SNP芯片对20只洛岛红鸡(Rhode Island Red)、20只洛岛白鸡(Rhode Island white)、19只北京油鸡(Beijing You)、19只白来航鸡
(White Leghorn)、19只贵妃鸡(Houdan)、20只东乡绿壳蛋鸡(Dongxiang)、20只丝羽乌骨鸡
(Silkie)、8只黄羽肉鸡(Yellow broiler)、20只藏鸡(Tibetan)和20只矮脚鸡(Dwarf)的
DNA基因型进行检测,先剔除MAF小于0.01的SNP位点(641个),再分别利用PLINK和SNPhylo
软件进行主成分和聚类分析。主成分分析和聚类进化树分析的结果见图3和图4所示,所有
的品种都能单独分开,这也说明了本发明的芯片在不同品种中的适用性,其中我国地方品
种的北京油鸡、东乡和丝羽乌骨鸡聚成一类,国外的商业品种洛岛白鸡、白来航和贵妃鸡聚
成一类,特别注意的是洛岛红鸡单独聚成一类,且遗传距离相离其他品种较远,这也由于该
品种已经经历了多个世代的高强度人工选择,基因组遗传结构以及核酸多态性发生了变
化。上述的主成分和聚类分析结果都能够很好地证明芯片的适用性,其鉴定结果准确可靠。
[0040] 实施例3本发明蛋鸡全基因组SNP芯片在全基因组关联分析中的应用
[0041] 使用本发明提供的蛋鸡全基因组SNP芯片对北京市华都峪口禽业有限公司提供的680只洛岛红母鸡进行基因型检测,同时收集了这些母鸡36周龄的蛋重表型数据(EW36),
SNP基因分型的质控标准:样本的检出率大于95%(sample Call rate>95%)、最小等位基
因频率大于0.01(MAF>0.01)、哈迪温伯格平衡检验P值小于1e‑06,质控后剩余673个个体
和38,627个SNP用于接下来的全基因组关联(GWAS)分析。分析的模型采用线性混合模型,以
SNP独立次数检验的P值8.1e‑06和1.62e‑04作为全基因组显著和潜在显著的阈值,GWAS结
果的曼哈顿图见图5所示。结果显示,在一号染色体上存在一段与蛋重相关联的显著区域,
这一结果也与之前研究报道的结果相一致(Liu et al.,2018,Frontiers in Genetics)。
[0042] 实施例4本发明蛋鸡全基因组SNP芯片在基因组选择育种中的应用——遗传评估
[0043] 使用本发明提供的蛋鸡全基因组SNP芯片进行基因组遗传评估。对北京市华都峪口禽业有限公司提供的某一品系三个世代的2,950只蛋鸡(285只公鸡,2,665只母鸡)的DNA
进行SNP基因分型,同时使用基于系谱的选择方法和基于基因组的选择方法对这些个体达
到28周龄的体重(BW28),母鸡28周龄的产蛋重(EW28)和38周龄的产蛋数(EN38)进行遗传评
估。具体步骤如下:
[0044] (1)对2,950只鸡的分型检测结果进行质控,样本的检出率大于95%(sample Call rate>95%)、最小等位基因频率大于0.01(MAF>0.01)、哈迪温伯格平衡检验P值小于1e‑
06,质控后剩余2,950个个体和38,413个合格SNP用于全基因组选择分析;
[0045] (2)模型:BW28=Date+Hatch+Sex+Animal+Error
[0046] EW28/EN38=Date+Hatch+Animal+Error
[0047] √Date,Hatch,Sex分别为个体出生日期,孵化批次,以及性别的固定效应;
[0048] √Animal为动物个体的随机加性遗传效应,即个体育种值
[0049] √Error为随机残差
[0050] (3)分别使用基于系谱的选择方法(PBLUP模型)和基于基因组选择的方法(ssGBLUP:一步法基因组模型)进行遗传评估
[0051] PBLUP模型:常规育种值通过单性状动物模型估计:
[0052] y=Xb+Zu+e
[0053] 其中y是表型值向量,X是固定效应设计矩阵,b是固定效应向量,包括世代(出生年)、孵化批次和性别,Z是随机效应关联矩阵,u是育种值向量并假设其服从
其中A是分子血缘关系矩阵, 是加性遗传方差,e是残差向量并假设其服从
其中I是单位矩阵, 是残差方差。
[0054] ssGBLUP模型:ssGBLUP模型在形式上与PBLUP模型相似,区别在于ssGBLUP模型中的随机效应向量服从 其中H是将系谱信息和基因组信息整合的矩阵
(Christensen and Lund,2010;Legarra,et al.,2009)。H矩阵构建如下:
[0055]
[0056] 下标1和2分别代表没有基因型的个体和有基因型的个体,H矩阵的逆矩阵在形式上相当简单(Aguilar,et al.,2010):
[0057]
[0058] (4)结果:
[0059] 表2不同遗传评估方法的准确性比较
[0060]
[0061] (5)能够看出使用本发明芯片进行基因组选择相比传统选择方法,能够有效提高遗传评估的准确性。
[0062] 工业实用性
[0063] 本发明提供的蛋鸡全基因组SNP芯片上的SNP位点分别源于中国主要蛋鸡各品系共有的14624个SNP位点;与蛋鸡抗病性状相关的3677个SNP位点;与蛋鸡经济性状相关联的
1.6万个SNP位点;弥补前述探针未覆盖的基因组区域的9358个SNP位点。本发明蛋鸡全基因
组SNP芯片上的43681个SNP具有SEQ ID NO.1‑43681所示的DNA序列,该芯片可以特异性地
鉴定商业化蛋鸡与地方品种蛋鸡的亲缘关系,还可以进行全基因组关联分析、全基因组选
择育种,以及目标性状QTL定位分析和群体遗传学分析等应用,具有中外鸡品种通用性,能
够有助于加快蛋鸡行业的快速发展,具有很大的经济实用价值和科研价值。