一种快速筛选物种鉴定用DNA分子标记的方法转让专利

申请号 : CN201811016441.5

文献号 : CN110111845A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 倪加加胡艳吴瑶

申请人 : 广东美立康生物科技有限公司

摘要 :

一种快速筛选物种鉴定用DNA分子标记的方法。它通过预先判断待测物种的大概分类;和确定待筛选的DNA分子标记,从数据库中下载拟选用的DNA分子标记对应的DNA序列,并根据这些序列检索下载相似性>95%的其他物种对应DNA片段的序列,对所有序列进行多序列排序并计算不同物种之间的碱基差异数量,根据种内和种间序列差异碱基数在进行物种分子鉴定前判断拟选用的分析标记是否适合用于物种鉴定。

权利要求 :

1.一种快速筛选物种鉴定用DNA分子标记的方法,通过从公共数据库中下载拟选用的DNA分子标记对应的DNA序列并进行多序列排序后统计序列中种内和种间序列差异碱基数,根据该差异碱基数判断该分析标记是否适合用于物种鉴定。

2.根据权利要求书1所述的快速筛选物种鉴定用DNA分子标记的方法,其特征是:首先,确定待测物种的大概分类;随后,确定待筛选的DNA分子标记;然后,从数据库中下载拟选用的DNA分子标记对应的DNA序列,并根据这些序列检索下载相似性>95%的其他物种对应DNA片段的序列,对所有序列进行多序列排序,计算不同物种之间的碱基差异数量;最后,根据种内和种间序列差异碱基数判断该分析标记是否适合用于物种鉴定。

3.根据权利要求书1所述的快速筛选物种鉴定用DNA分子标记的方法,判断拟选用的分析标记是否适合用于物种鉴定的标准为:物种内碱基差异数少于物种间碱基差异数,且物种内碱基差异数比物种间碱基差异数至少要少3 bp;同时还需至少满足以下两个条件之一,(1)物种内碱基差异数比物种间碱基差异数至少要少0.5倍,或者(2)物种内碱基差异数比物种间碱基差异数至少要少拟选用的分子标记长度的1%。如果拟选用的分子标记能够满足以上标准,则认为该分子标记适合用于物种的分子鉴定;如果拟选用的分子标记不满足以上标准,则认为该分子标记不适合用于物种的分子鉴定。

说明书 :

一种快速筛选物种鉴定用DNA分子标记的方法

技术领域

[0001] 本发明专利涉及物种DNA分子鉴定领域,尤其是快速筛选物种鉴定用DNA分子标记的方法。

背景技术

[0002] 尽管通常情况下能够通过外部形态对物种进行分类和确定,但对于很多物种,仅通过外部形态难以准确进行鉴定和分类,如细菌、鱼卵、动物组织等,甚至对于有些鱼类,仅通过外部形态也很难鉴定到种甚至是属水平。随着DNA测序技术的发展,DNA测序的通量得到了飞速提高,DNA测序的成本不断降低,因此通过DNA测序技术对物种进行鉴定已广泛应用于科学研究和环境评估领域。理论上,通过全基因组测序技术才能够得到最准确、最可靠的物种鉴定结果,并能够充分揭示物种代谢上的潜在差异。但是,由于全基因组测序程序繁琐、技术要求高、后续计算分析量大,导致目前技术条件下难以开展大范围的物种鉴定应用。
[0003] 为了克服全基因组测序难以用于大范围物种鉴定的限制,科技人员开发了多种用于物种鉴定的DNA分子标记,如核糖体小亚基rRNA基因、核糖体大亚基rRNA基因、线粒体细胞色素B(cytB)基因、线粒体CO I基因等。尽管这些分子标记能够大体上将物种区分到较高的分类阶元,如科、属甚至种水平,但是由于不同的生物在不同的DNA分子标记上的变异不同,从而导致一个特定的DNA分子标记能够很好地区分某一个属中不同的物种,而无法区分另一个属中不同的物种,最终导致单独采用该分子标记无法对所有的物种进行鉴定。如果在物种鉴定中选错了DNA分子标记,不仅浪费大量的人力物力,也无法得到准确的鉴定结果。

发明内容

[0004] 为了解决在物种鉴定时如何快速选择有效的DNA分子标记的技术问题,本发明专利提DNA分子标记对应的DNA序列进行比对分析,在考虑了PCR扩增、测序引物的碱基错配和错读的情况下,在鉴定开展之前就能够快速评估所选DNA分子标记的可靠性和准确性,从而提供一种快速筛选物种鉴定用DNA分子标记的方法。
[0005] 本发明专利为解决其技术问题所采用的技术方案是:首先,确定待测物种的大概分类,如鱼类、鸟类、哺乳动物等;随后,确定待筛选的DNA分子标记,如线粒体细胞色素B基因、核糖体小亚基RNA基因等;然后,从数据库中下载拟选用的DNA分子标记对应的DNA序列,对序列进行多序列排序,计算不同物种之间的碱基差异数量;最后,根据以下原则判断拟选用的分子标记是否适合用于物种鉴定:物种内碱基差异数少于物种间碱基差异数,且物种内碱基差异数比物种间碱基差异数至少要少3 bp;同时还需至少满足以下两个条件之一,(1)物种内碱基差异数比物种间碱基差异数至少要少0.5倍,或者(2)物种内碱基差异数比物种间碱基差异数至少要少拟选用的分子标记长度的1%。如果拟选用的分子标记能够满足以上标准,则认为该分子标记适合用于物种的分子鉴定;如果拟选用的分子标记不满足以上标准,则认为该分子标记不适合用于物种的分子鉴定。
[0006] 本发明专利的有益效果是,提供了一种快速筛选物种分子鉴定用DNA分子标记的方法,该方法能够在鉴定之前通过数据库中已有DNA序列信息判断所选用的分子标记是否适合用于物种的鉴定,从而减少因DNA分子标记选择错误导致无法进行有效的物种分子鉴定的风险。

附图说明

[0007] 图1阐述了本发明专利的技术路线,本发明的实施过程按该技术路线开展。
[0008] 图2为本发明专利的技术路线图。

具体实施方式

[0009] 实施例1拟对一种淡水鱼类进行DNA分子鉴定,根据该鱼类外部形态学特征,初步鉴定为鮈亚科(Cyprinidae)鳈属(Sarcocheilichthys)鱼类。拟选用线粒体细胞色素B(cytB)基因和核糖体小亚基rRNA基因进行DNA分子鉴定,线粒体细胞色素B(cytB)基因扩增所采用的引物序列为L14724如SEQ ID NO:1所示(5’ – GAC TTG AAA AAC CAC CGT TGA – 3’)和H15915如SEQ ID NO:2所示(5’ – CTC CGA TCT CCG GAT TAC AAG AC – 3’);核糖体小亚基rRNA基因扩增所采用的引物序列为AR如SEQ ID NO:3所示(5’ – CGC CTG TTT AWC AAA AAC AT – 3’)和BR如SEQ ID NO:4所示(5’ – CCG GTC TGA ACT CAG ATC AYG T – 3’)。从NCBI网站的GenBank数据库中根据以上两对引物扩增的DNA片段下载所有鳈属鱼类对应的DNA序列,并根据这些序列检索下载相似性>95%的其他物种对应DNA片段的序列,采用Clustalx 2.0软件对所下载的序列分别进行多序列排序,统计物种间和物种内的序列碱基差异,结果显示采用cytB基因进行该物种鉴定时,鳈属所有鱼类的DNA序列都与序列最相似的Coreoperca、Hemibarbus、Rhinogobio和Squalidus属的鱼类相差超过10%(即碱基差异超过50 bp),说明采用cytB基因进行鉴定至少能够准确鉴定到属水平;在鳈属内,除S. biwaensis与S. variegatus、S. czerskii与S. nigripinnis和S. soldatovi、S. lacustris与S. sinensi、S. soldatovi与S. nigripinnis的部分序列差异小于4%(即碱基差异小于21 bp)外,其他物种间的差异都大于21 bp,且除了S. nigripinnis、S. parvus的序列在物种内的差异大于4%(即碱基差异大于21 bp),其他物种的种内序列差异都小于2.7%(即碱基差异小于15 bp),因此推断除了该DNA序列鉴定为S. nigripinnis或S. parvus可能得到不准确的结果而只能准确鉴定到属水平外,其他物种则可以准确鉴定到种水平。采用核糖体小亚基rRNA基因片段进行物种鉴定时,尽管在物种水平上只有S. parvus的种内序列差异超过2%(即碱基差异大于10 bp),其他物种的种内序列差异都小于1%,但是S. biwaensis与S. variegatus、S. sinensis与S. lacustris的种间序列差异也小于1%,并且部分Sarcocheilichthys序列与Rhinogobio、Gnathopogon、Squalidus、Coreius和Sinibrama属的序列相似性超过Sarcocheilichthys属内的序列相似性,因此采用该DNA片段的序列进行物种鉴定难以鉴定到属水平。采用上述两对引物以拟鉴定的该物种基因组为模板进行PCR扩增得到对应的DNA片段后进行DNA测序,测序得到的高质量的cytB基因序列如SEQ ID NO:
5所示(5’ – GAA ACA TAA TGG CAG CCT ACG AAA ACA CAC CCA CTG ATC AAA ATC GCC AAC GAC GCG CTA GTC GAC CTA CCA ACA CCA TCA AAT ATC TCC GTA TGA TGA AAC TTC GGA TCA CTA CTG GGA CTA TGT CTG ATT GCA CAA ATC CTA ACA GGA CTA TTC CTA GCC ATG CAC TAC ACC TCA GAC ATC TCA ACT GCA TTT TCA TCC GTA GCT CAC ATC TGT CGA GAC GTA AAT TAC GGC TGA TTC ATC CGC AAC ATG CAC GCC AAC GGA GCA TCA TTT TTC TTC ATC TGT ATT TAT CTA CAT GTT GCC CGA GGA CTA TAC TAT GGA TCC TAC CTC TAC AAA GAG ACC TGA AAT ATC GGA GTC GTC CTC CTA CTA TTA GTA ATA ATA ACG GCC TTT GTG GGC TAT GTT CTG CCA TGA GGA CAG ATA TCC TTC TGA GGT GCT ACA GTA ATC ACA AAC CTG TTA TCA GCG GTC CCC TAT ATG GGC GAC ACC CTT GTT CAA TGA ATT TGA GGG GGC TTC TCT GTA GAT AAC GCA ACC CTA ACA CGA TTC TTC GCA TTT CAC TTC CTC CTA CCA TTC ATC ATT GCC GCC GCC ACT ATT ATT CAC CTG CTG TTT CTA CAC GAA ACA GGG TCA AAC AAC CCA GCC GGA CTA AAT TCC GAC TCA GAT AAA ATT TCC TTT CAC CCC TAC TTT TCG TAC AAA GAC CTC CTT GGC TTC GTG CTA ATA CTA TTA GCC CTT ACA TCA TTA GCC CTA TTT TCT CCC AAC CTC CTA GGG GAC CCA GAT AAT TTT ACG CCC GCC AAC CCC ATA GTC ACA CCC CCA CAC ATC AAA CCA GAG TGA TAC TTC CTA TTT GCC TAC GCC ATC TTA CGC TCA ATC CCA AAC AAG TTG GGG GGA GTT CTC GCA TTA CTA TTC TCC ATT CTC GTC CTG ATA GTA GTC CCA ATT CTT CAC ACC TCA AAA CAA CGA GGA CTC ACA TTC CGC CCA GCC ACC CAG TTT TTA TTT TGA ACT CTC GTA GCA GAT ATA TTA ATT CTG ACA TGA ATT GGA GGC ATA CCC GTA GAA ACA TCC ATA TGT TAT TAT TGG ACA AAT TGC ATC CGT CCT AAT ACT TCG CAC CTT – 3’),得到的DNA序列在NCBI网站的GenBank数据库中采用blastn检索,最终采用cytB基因序列能够得到准确的鉴定结果,为Sarcocheilichthys kiangsiensis,与形态学鉴定结果一致;采用核糖体小亚基rRNA基因片段测序得到的序列如SEQ ID NO:6所示(5’ – GGT CTG TAG TAT AGG AGG TCA GCC TGC CCA GTG ACT ACG GGT TCA ACG GCC GCG GTA TTT TGA CCG TGC AAA GGT AGC GCA ATC ACT TGT CTT TTA AAT AGA GAC CTG TAT GAA TGG CTA AAC GAG GGC TTA ACT GTC TCC CCC TTC AAG TCA GTG AAA TTG ATC TAT CCG TGC AGA AGC GGA TAT ATA AAT ACA AGA CGA GAA GAC CCT TTG GAG CTT AAG GTA CAA AAC TTA ACC ACG TCA AAC AAC TTA ATA AAA AGC AAG AAC CTA GTG GAC CAT AAA ATT TTA CCT TCG GTT GGG GCG ACC GCG GAG GAA AAC CCA GCC TCC GAG TGG AAT GGG CTA AAC CCC TAA AAC CAA GAG AAA CAT CTC TAA GCC GCA GAA CAT CTG ACC AAA AAT GAT CCG GCC AAA GCC GAT CAA CGA ACC AAG TTA CCC TAG GGA TAA CAG CGC AAT CCT CTC CCA GAG TCC ATA TCG ACG AGG GGG TTT ACG ACC TCG ATG TTG GAT CAG GAC ATC CTA ATG GTG CAG CCG CTA TTA AGG GTT CGT TTG TTC AAC GAT TAA AGT CCT ACG TGA – 3’),根据该序列在NCBI网站的GenBank数据库中进行blastn比对无法得到准确的鉴定结果,因为该序列在Sarcocheilichthys sp.、Rhinogobio sp.、Gnathopogon elongatus、Squalidus argentatus、Coreius heterodon和Sinibrama macrops等物种中的相似性太高,无法准确确定该DNA序列来自哪一物种。以上结果证明本发明专利描述的方法能够有效可靠地对拟采用的分子鉴定标记进行筛选。
[0010] 序列表<110> 广东美立康生物科技有限公司
<120> 一种快速筛选物种鉴定用DNA分子标记的方法
<130> 2017
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 21
<212> DNA
<213> 人工序列
<400> 1
gacttgaaaa accaccgttg a                                                21<210> 2
<211> 23
<212> DNA
<213> 人工序列
<400> 2
ctccgatctc cggattacaa gac                                              23<210> 3
<211> 20
<212> DNA
<213> 人工序列
<400> 3
cgcctgttta wcaaaaacat                                                  20<210> 4
<211> 22
<212> DNA
<213> 人工序列
<400> 4
ccggtctgaa ctcagatcay gt                                               22<210> 5
<211> 1092
<212> DNA
<213> 人工序列
<400> 5
gaaacataat ggcagcctac gaaaacacac ccactgatca aaatcgccaa cgacgcgcta      60gtcgacctac caacaccatc aaatatctcc gtatgatgaa acttcggatc actactggga     120ctatgtctga ttgcacaaat cctaacagga ctattcctag ccatgcacta cacctcagac     180atctcaactg cattttcatc cgtagctcac atctgtcgag acgtaaatta cggctgattc     240atccgcaaca tgcacgccaa cggagcatca tttttcttca tctgtattta tctacatgtt     300gcccgaggac tatactatgg atcctacctc tacaaagaga cctgaaatat cggagtcgtc     360ctcctactat tagtaataat aacggccttt gtgggctatg ttctgccatg aggacagata     420tccttctgag gtgctacagt aatcacaaac ctgttatcag cggtccccta tatgggcgac     480acccttgttc aatgaatttg agggggcttc tctgtagata acgcaaccct aacacgattc     540ttcgcatttc acttcctcct accattcatc attgccgccg ccactattat tcacctgctg     600tttctacacg aaacagggtc aaacaaccca gccggactaa attccgactc agataaaatt     660tcctttcacc cctacttttc gtacaaagac ctccttggct tcgtgctaat actattagcc     720cttacatcat tagccctatt ttctcccaac ctcctagggg acccagataa ttttacgccc     780gccaacccca tagtcacacc cccacacatc aaaccagagt gatacttcct atttgcctac     840gccatcttac gctcaatccc aaacaagttg gggggagttc tcgcattact attctccatt     900ctcgtcctga tagtagtccc aattcttcac acctcaaaac aacgaggact cacattccgc     960ccagccaccc agtttttatt ttgaactctc gtagcagata tattaattct gacatgaatt    1020ggaggcatac ccgtagaaac atccatatgt tattattgga caaattgcat ccgtcctaat    1080acttcgcacc tt                                                        1092<210> 6
<211> 567
<212> DNA
<213> 人工序列
<400> 6
ggtctgtagt ataggaggtc agcctgccca gtgactacgg gttcaacggc cgcggtattt      60tgaccgtgca aaggtagcgc aatcacttgt cttttaaata gagacctgta tgaatggcta     120aacgagggct taactgtctc ccccttcaag tcagtgaaat tgatctatcc gtgcagaagc     180ggatatataa atacaagacg agaagaccct ttggagctta aggtacaaaa cttaaccacg     240tcaaacaact taataaaaag caagaaccta gtggaccata aaattttacc ttcggttggg     300gcgaccgcgg aggaaaaccc agcctccgag tggaatgggc taaaccccta aaaccaagag     360aaacatctct aagccgcaga acatctgacc aaaaatgatc cggccaaagc cgatcaacga     420accaagttac cctagggata acagcgcaat cctctcccag agtccatatc gacgaggggg     480tttacgacct cgatgttgga tcaggacatc ctaatggtgc agccgctatt aagggttcgt     540ttgttcaacg attaaagtcc tacgtga                                        567