一种用于法医检测的微单倍型遗传标记及其试剂盒转让专利

申请号 : CN201810207821.0

文献号 : CN108504744B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 严江伟赵晶杨雅冉刘志勇陈曼陈彤

申请人 : 中国科学院北京基因组研究所

摘要 :

本发明属于法医学领域,公开了一种用于法医检测的微单倍型遗传标记及其试剂盒。本发明提供了一组由位于常染色体上的21个微单倍型组成的遗传标记组合,该遗传标记组合能够有效的用于法医检测,且本发明提供的用于法医检测的微单倍型遗传标记及其试剂盒进行个体识别,相较于传统的检测试剂盒,灵敏度高、检测结果准确、适用性广,能够在较短时间内,对人类生物检材进行个体识别,为法医案件破获争取宝贵时间。

权利要求 :

1.一种复合扩增系统,其特征在于:所述的复合扩增系统包括可识别或扩增一组遗传标记组合的引物对,所述的遗传标记组合包括分别位于21个常染色体上的21个微单倍型,所述的21个微单倍型的SNP位点组成及其所位于的染色体编号为:微单倍型1:rs6688242、rs2796542、rs6688263和rs11206895,共4个SNP位点,在Chr1上;

微单倍型2:rs3771843、rs3821317、rs17640500、rs10194954、rs10207441、rs3771844,共6个SNP位点,在Chr2上;

微单倍型3:rs496999、rs497931、rs623776,共3个SNP位点,在Chr3上;

微单倍型4:rs10028632、rs9995529、rs10028725、rs10028726、rs10028792,共5个SNP位点,在Chr4上;

微单倍型5:rs7722440、rs6555369、rs6555370、rs11420883,共4个SNP位点,在Chr5上;

微单倍型6:rs6951466、rs6950322、rs6955448、rs6955464,共4个SNP位点,在Chr7上;

微单倍型7:rs2958791、rs2958792、rs2922478、rs16904981、rs2922477,共5个SNP位点,在Chr8上;

微单倍型8:rs13283582、rs13302236、rs13283720、rs13283735、rs13302511、rs13302526,共6个SNP位点,在Chr9上;

微单倍型9:rs11812842、rs7094192、rs3125501、rs6482878、rs7095329,共5个SNP位点,在Chr10上;

微单倍型10:rs11601972、rs10502217、rs11600212、rs11604300,共4个SNP位点,在Chr11上;

微单倍型11:rs11830564、rs11830584、rs10859943,共3个SNP位点,在Chr12上;

微单倍型12:rs9301125、rs9520014、rs9520015,共3个SNP位点,在Chr13上;

微单倍型13:rs7148418、rs7148133、rs7148148,共3个SNP位点,在Chr14上;

微单倍型14:rs4777688、rs4777689、rs10716161、rs6650545,共4个SNP位点,在Chr15上;

微单倍型15:rs11149710、rs12444150、rs7498574,共3个SNP位点,在Chr16上;

微单倍型16:rs9303200、rs9303201、rs9906240、rs9284355,共4个SNP位点,在Chr17上;

微单倍型17:rs11081354、rs10853359、rs11081355、rs11081356、rs11081357,共5个SNP位点,在Chr18上;

微单倍型18:rs8112077、rs8109109、rs11672261、rs12973540,共4个SNP位点,在Chr19上;

微单倍型19:rs11904993、rs35828530、rs11905009、rs8114278,共4个SNP位点,在Chr20上;

微单倍型20:rs35669839、rs35474219、rs34884265、rs34111579,共4个SNP位点,在Chr21上;

微单倍型21:rs5750066、rs5755608、rs5995069、rs5999743、rs9610223,共5个SNP位点,在Chr22上。

2.如权利要求1所述的复合扩增系统,其特征在于:所述的复合扩增系统还包括可识别或扩增性别鉴定基因座的引物对,所述的性别鉴定基因座为Amelogenin基因座。

3.如权利要求2所述的复合扩增系统,其特征在于:所述的复合扩增系统包括:用于扩增权利要求2所述的21个微单倍型和Amelogenin基因座的22对引物以及每对引物在复合扩增系统中的浓度:

4.一种用于法医检测的微单倍型遗传标记试剂盒,其特征在于:所述的微单倍型遗传标记试剂盒包括用于扩增权利要求2所述的21个微单倍型和Amelogenin基因座的22对引物。

5.如权利要求4所述的微单倍型遗传标记试剂盒,其特征在于:所述的微单倍型遗传标记试剂盒包括以下22对引物:

6.如权利要求4-5任意一项所述的微单倍型遗传标记试剂盒,其特征在于:所述的微单倍型遗传标记试剂盒还包括DNA聚合酶。

说明书 :

一种用于法医检测的微单倍型遗传标记及其试剂盒

技术领域

[0001] 本发明属于法医学领域,具体涉及一种用于法医检测的微单倍型遗传标记及其频率试剂盒。

背景技术

[0002] 以法医学和遗传学为基础学科背景的法医DNA技术在刑事案件侦查举证、打击拐卖妇女儿童、灾害遇难者及失踪人员身份认定、民事亲权关系鉴定等领域具有广泛应用,法医遗传学发展进步的历史就是对新遗传标记的发现、研究与检测应用的历史,开发可供法医学应用的多态性位点一直都是法医遗传学研究的热点和基础问题。
[0003] 早期的DNA分析主要是限制性片段长度多态性(RLFP),技术原理是检测DNA在限制性内切酶酶切后形成的特定DNA片段的大小,因此凡是可以引起酶切位点变异的突变如点突变,如新产生和去除酶切位点,和一段DNA的重新组织,如插入和缺失造成酶切位点间的长度发生变化等均可导致RFLP的产生,但该方法对DNA的质量要求高,故无法对降解或微量的DNA进行分析;随着聚合酶链式反应(PCR)以及人类基因组计划的完成,短串联重复序列(STR)成为法医学中广泛应用的第二代遗传标记,STR具有多态性高,扩增的等位基因片段长度一般小于400bp等特点,是目前非常成熟的法医学遗传标记,如中国专利201610922569.2公开了一种快速鉴定法医常染色体STR分型的试剂盒,包括盒体以及与所述盒体相连的翻盖式盒盖,所述盒体内放置一纸托,所述纸托上设置十个孔槽,此发明所述试剂盒具有检测范围广、节约资本和操作简单等优点,但STR在分析的时候也存在很多缺点,如存在stutter峰、等位基因扩增不平衡等缺陷;单核苷酸多态性(SNP)广泛的存在于基因组中,其数量要比STR基因座超出几个数量级,而且不存在影子峰等特点,被一些学者认为是第三代遗传标记,如本专利申请人之前的专利201610076872.5公开了一种基于21个线粒体SNP位点的法医学快速检测试剂盒及其在个体识别中的应用,此发明提供的试剂盒成本低廉、操作简单、灵敏度高、检测结果准确,通过单管反应即可获得检测结果,但SNP存在多态性低的特点,大多是二等位基因,要达到法医学中要求的个体识别效果,需要大量的SNP组成复合体系。
[0004] 微单倍型(microhaplotype)是近年来国际法医遗传学界广泛关注的一类新型遗传标记,它兼具STR和SNP遗传标记的优势,在混合DNA分型领域展现出巨大潜力,且支持人类种族地域推断、复杂亲缘关系鉴定、微量降解检材检验等法医学应用。单倍型(haplotype)是指在一条染色体或线粒体上,紧密连锁的多个等位基因的线性组合,每一种组合方式即为一种单倍型,更进一步地讲,单倍型是具有统计学关联性的遗传标记,可由多个SNP位点构成,包含丰富的遗传信息,研究单倍型比单个SNP位点具有更好的分析效果。
[0005] 近年来单倍型在法医学中的应用越来越广泛,主要涉及Y染色体、X染色体及线粒体上STR和SNP多态性的研究,常染色体由于没有简单快速的分型方法,在法医学中的研究很少,为了进一步筛选更适合法医学应用的单倍型基因座,微单倍遗传标记首次被引入法庭科学领域,相较于迷你单倍型,微单倍型的片段长度更短,其定义是在较短片段内(一般指二代测序的reads长度)包含2~5个SNP的组合,由于微单倍型基因座内含有多个SNP位点,所以微单倍型是多等位基因遗传标记,包含更加丰富的遗传信息。
[0006] 综上所述,微单倍型兼具STR和SNP遗传标记的优势,且不存在影子峰干扰,在混合DNA检验领域具有巨大潜力,而且,比STR突变率更低,扩增子更短,更适于法医遗传学的应用。

发明内容

[0007] 术语:
[0008] 除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同意义。
[0009] 本发明中的术语“ddH2O”指双蒸水。
[0010] 本发明中的术语“rs号”指在美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的SNP数据库中的rs号;
[0011] 本发明中的术语“Chr1-Chr22”分别指第1-22号常染色体。
[0012] 本发明中的术语“dbSNP”指寡核苷酸多态性数据库。
[0013] 本发明中的术语“bp”指DNA的碱基对数量单位。
[0014] 本发明中的术语“A、T、C、G、U”分别指A腺嘌呤、T胸腺嘧啶、C胞嘧啶G鸟嘌呤、U尿嘧啶。
[0015] 本发明中的术语“HGVS”指人类基因组变异协会(HGVS:Human Genome Variation Society)。
[0016] 本发明中的术语“fastq文件”指一种基于文本的存储生物序列和对应碱基或氨基酸质量的文件格式。
[0017] 本发明中的术语“fasta”指用于快速数据库扫描的一种广泛使用的序列比较工具。
[0018] 本发明中的术语“blast”指一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。
[0019] 本发明中的术语“reads”指一小段短的测序片段,是高通量测序仪产生的测序数据。
[0020] 本发明中的术语“ucsc”指一种基因组浏览器。
[0021] 本发明要解决的技术问题是提供一种用于法医检测的微单倍型遗传标记及其试剂盒。现有的对单倍型的研究主要集中在X染色体、Y染色体以及线粒体上,常染色体由于没有简单快速的分型方法,在法医学中的研究很少,本发明针对微单倍型的特点,在每条染色体上均设计了一对引物,并提供了在每条染色体上选择的SNP位点数以及对应的rs号,通过调整复合体系中每条染色体的至特定浓度,构建复合扩增体系用来扩增目的片段,并通过二代测序技术对得到的序列进行分析,得到每个样本的分型结果,对设计的单倍型位点进行频率计算。
[0022] 为解决上述技术问题,一方面,发明提供了一组遗传标记组合,所述的遗传标记组合包括分别位于常染色体上的21个微单倍型,所述的21个微单倍型的SNP位点组成及其所位于的染色体编号为:SNP位点以美国国立生物技术信息中心的SNP数据库中的rs号命名:
[0023] 微单倍型1:rs6688242、rs2796542、rs6688263和rs11206895,共4个SNP位点,在Chr1上;
[0024] 微单倍型2:rs3771843、rs3821317、rs17640500、rs10194954、rs10207441、rs3771844,共6个SNP位点,在Chr2上;
[0025] 微单倍型3:rs496999、rs497931、rs623776,共3个SNP位点,在Chr3上;
[0026] 微单倍型4:rs10028632、rs9995529、rs10028725、rs10028726、rs10028792,共5个SNP位点,在Chr4上;
[0027] 微单倍型5:rs7722440、rs6555369、rs6555370、rs11420883,共4个SNP位点,在Chr5上;
[0028] 微单倍型6:rs6951466、rs6950322、rs6955448、rs6955464,共4个SNP位点,在Chr7上;
[0029] 微单倍型7:rs2958791、rs2958792、rs2922478、rs16904981、rs2922477,共5个SNP位点,在Chr8上;
[0030] 微单倍型8:rs13283582、rs13302236、rs13283720、rs13283735、rs13302511、rs13302526,共6个SNP位点,在Chr9上;
[0031] 微单倍型9:rs11812842、rs7094192、rs3125501、rs6482878、rs7095329,共5个SNP位点,在Chr10上;
[0032] 微单倍型10:rs11601972、rs10502217、rs11600212、rs11604300,共4个SNP位点,在Chr11上;
[0033] 微单倍型11:rs11830564、rs11830584、rs10859943,共3个SNP位点,在Chr12上;
[0034] 微单倍型12:rs9301125、rs9520014、rs9520015,共3个SNP位点,在Chr13上;
[0035] 微单倍型13:rs7148418、rs7148133、rs7148148,共3个SNP位点,在Chr14上;
[0036] 微单倍型14:rs4777688、rs4777689、rs10716161、rs6650545,共4个SNP位点,在Chr15上;
[0037] 微单倍型15:rs11149710、rs12444150、rs7498574,共3个SNP位点,在Chr16上;
[0038] 微单倍型16:rs9303200、rs9303201、rs9906240、rs9284355,共4个SNP位点,在Chr17上;
[0039] 微单倍型17:rs11081354、rs10853359、rs11081355、rs11081356、rs11081357,共5个SNP位点,在Chr18上;
[0040] 微单倍型18:rs8112077、rs8109109、rs11672261、rs12973540,共4个SNP位点,在Chr19上;
[0041] 微单倍型19:rs11904993、rs35828530、rs11905009、rs8114278,共4个SNP位点,在Chr20上;
[0042] 微单倍型20:rs35669839、rs35474219、rs34884265、rs34111579,共4个SNP位点,在Chr21上;
[0043] 微单倍型21:rs5750066、rs5755608、rs5995069、rs5999743、rs9610223,共5个SNP位点,在Chr22上。
[0044] 更进一步,为了确定性别,本发明提供的一组遗传标记组合还可以包括性别鉴定基因座Amelogenin基因座。
[0045] 应当指出的是,以上SNP位点是根据NCBI的SNP数据库的命名方式来表示的,该方式是以rs或者ac加数位阿拉伯数字来表示一个确定的SNP位点。本领域技术人员知道,一个SNP位点还可以有其它表示方式,如以HGVS命名法标注某位点在参考gDNA上的位置来表示。采用其他命名方式来标注指代与本发明一样的SNP位点或SNP位点组合也属于本发明的范围。
[0046] 另一方面,本发明还提供了一种复合扩增系统,所述的复合扩增系统包括:用于扩增上述21个微单倍型和Amelogenin基因座的22组引物以及每组引物在复合扩增系统中的浓度。
[0047] 虽然针对单一目的片段的扩增可以通过引物设计原则设计多组引物,然而在复合扩增体系中,由于每组引物对模板、底物和酶的竞争会使得每组引物之间有着无法预料的相互影响,仅仅是引物中一个碱基的变化都有可能造成复合扩增体系中的一个或若干个,甚至全部目的片段无法或者无法完整的被扩增出来,而目前也没有任何方法、技术或者是原则来预测复合扩增体系中引物序列的变化将会对目的微单倍型片段的扩增结果有何影响,更没有技术原理来指导在某一种特定的复合扩增体系中什么样的引物组成能够获得良好的平衡的扩增结果。
[0048] 然而,意料之外的是,本发明在一次实验中采用了如下表1所示的22组引物及其引物浓度同时复合扩增上述21个微单倍型和Amelogenin基因座,使得所有21个微单倍型和Amelogenin基因座均被扩增且均被以较为一致的扩增效率被扩增出来。
[0049] 表1
[0050]
[0051] 进一步的,本发明提供了复合扩增体系中,每组引物的浓度指每组引物中的正向引物和反向引物的浓度和为该浓度。申请人意料不到地发现,只有在上述表1中的特定浓度下,才能使每条染色体上的扩增效率尽可能的保持一致,也就是使得每个微单倍型均能扩增出来。在其它引物浓度下(例如22组引物浓度均为0.5μM或均为1μM)均有个别微单倍型无法扩增出来。
[0052] 再一方面,本发明提供了一种法医检测的微单倍型遗传标记试剂盒,所述的微单倍型遗传标记试剂盒包括用于扩增上述21个微单倍型和Amelogenin基因座的22组引物。
[0053] 进一步地,所述的微单倍型遗传标记试剂盒包括下表2中的22组引物。
[0054] 表2
[0055]
[0056]
[0057] 所述的微单倍型遗传标记试剂盒还可以包括DNA聚合酶。
[0058] 又一个方面,本发明还提供了上述一组遗传标记组合、复合扩增系统和微单倍型遗传标记试剂盒在案件排查、个体识别以及尸源认定等法医学检测领域中的应用。
[0059] 本发明的有益效果:
[0060] 本发明提供了一组由位于常染色体上的21个微单倍型组成的遗传标记组合,该遗传标记组合能够有效的用于法医检测。
[0061] 本发明将微单倍型作为判断个体识别的遗传标记,并设计了扩增上述21个微单倍型的复合扩增系统。
[0062] 本发明提供的试剂盒,针对微单倍型的特点,在每条染色体上均设计了一对特定引物且采用特定的引物浓度,构建了复合扩增体系用来扩增目的片段,使每条染色体上的扩增效率尽可能的一致,扩增结果最大程度地保持平衡有效。
[0063] 综上所述,利用本发明提供的用于法医检测的微单倍型遗传标记及其试剂盒进行个体识别,相较于传统的检测试剂盒,灵敏度高、检测结果准确、适用性广,能够在较短时间内,对人类生物检材进行个体识别,为法医案件破获争取宝贵时间。

附图说明

[0064] 图1为实施例3,应用实施例(1)中的琼脂糖凝胶电图。
[0065] 图2为实施例3,对比实验(1)中的琼脂糖凝胶电图。
[0066] 图3为实施例3,对比实验(2)中的琼脂糖凝胶电图。
[0067] 图4为实施例5中的随机个体单样本微单倍型分型结果。

具体实施方式

[0068] 下面通过具体实施方式结合附图对本发明作进一步详细说明。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围之内。
[0069] 实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。
[0070] 实施例1一组遗传标记组合
[0071] 本实施例列出了一组遗传标记组合,所述的遗传标记组合包括分别位于人类22个常染色体上的22个微单倍型,所述的22个微单倍型的SNP位点组成及其所位于的染色体编号为:SNP位点以美国国立生物技术信息中心的SNP数据库中的rs号命名:
[0072] 微单倍型1:rs6688242、rs2796542、rs6688263和rs11206895,共4个SNP位点,在Chr1上;
[0073] 微单倍型2:rs3771843、rs3821317、rs17640500、rs10194954、rs10207441、rs3771844,共6个SNP位点,在Chr2上;
[0074] 微单倍型3:rs496999、rs497931、rs623776,共3个SNP位点,在Chr3上;
[0075] 微单倍型4:rs10028632、rs9995529、rs10028725、rs10028726、rs10028792,共5个SNP位点,在Chr4上;
[0076] 微单倍型5:rs7722440、rs6555369、rs6555370、rs11420883,共4个SNP位点,在Chr5上;
[0077] 微单倍型6:rs6951466、rs6950322、rs6955448、rs6955464,共4个SNP位点,在Chr7上;
[0078] 微单倍型7:rs2958791、rs2958792、rs2922478、rs16904981、rs2922477,共5个SNP位点,在Chr8上;
[0079] 微单倍型8:rs13283582、rs13302236、rs13283720、rs13283735、rs13302511、rs13302526,共6个SNP位点,在Chr9上;
[0080] 微单倍型9:rs11812842、rs7094192、rs3125501、rs6482878、rs7095329,共5个SNP位点,在Chr10上;
[0081] 微单倍型10:rs11601972、rs10502217、rs11600212、rs11604300,共4个SNP位点,在Chr11上;
[0082] 微单倍型11:rs11830564、rs11830584、rs10859943,共3个SNP位点,在Chr12上;
[0083] 微单倍型12:rs9301125、rs9520014、rs9520015,共3个SNP位点,在Chr13上;
[0084] 微单倍型13:rs7148418、rs7148133、rs7148148,共3个SNP位点,在Chr14上;
[0085] 微单倍型14:rs4777688、rs4777689、rs10716161、rs6650545,共4个SNP位点,在Chr15上;
[0086] 微单倍型15:rs11149710、rs12444150、rs7498574,共3个SNP位点,在Chr16上;
[0087] 微单倍型16:rs9303200、rs9303201、rs9906240、rs9284355,共4个SNP位点,在Chr17上;
[0088] 微单倍型17:rs11081354、rs10853359、rs11081355、rs11081356、rs11081357,共5个SNP位点,在Chr18上;
[0089] 微单倍型18:rs8112077、rs8109109、rs11672261、rs12973540,共4个SNP位点,在Chr19上;
[0090] 微单倍型19:rs11904993、rs35828530、rs11905009、rs8114278,共4个SNP位点,在Chr20上;
[0091] 微单倍型20:rs35669839、rs35474219、rs34884265、rs34111579,共4个SNP位点,在Chr21上;
[0092] 微单倍型21:rs5750066、rs5755608、rs5995069、rs5999743、rs9610223,共5个SNP位点,在Chr22上。
[0093] 更进一步,为了确定性别,本实施例提供的一组遗传标记组合还包括性别鉴定基因座Amelogenin基因座。
[0094] 实施例2一种复合扩增系统
[0095] 本实施例中该复合扩增系统包括:用于扩增上述21个微单倍型和Amelogenin基因座的22组引物以及每组引物在扩增系统中的浓度。
[0096] 本实施例采用了如表3所示的22组引物及其引物浓度同时复合扩增实施例1中的21个微单倍型和Amelogenin基因座,使得所有21个微单倍型和Amelogenin基因座均被扩增且均被以较为一致的扩增效率被扩增出来。
[0097] 表3
[0098]
[0099] 实施例3
[0100] (1)应用实施例1:采用本发明实施例2的复合扩增系统对来源于已知个体的DNA样本进行检测。
[0101] 以源于已知个体的DNA样本为PCR扩增模板,利用本发明实施例2中的22组引物及其相应浓度进行复合扩增。
[0102] 复合扩增PCR体系为:模板DNA,5-10ng;dNTP混合物,2μl;10×扩增缓冲液(含Mg+),2μl;22条正向引物的混合物,4μl;22条反向引物的混合物,4μl;Taq DNA聚合酶,0.1μl;ddH2O补足至20μL。
[0103] 复合扩增PCR程序为:95℃,3min;95℃,30s,59℃,45s,72℃,1min30s,30个循环;72℃,7min;4℃,贮存。
[0104] 结果1:对扩增产物进行琼脂糖凝胶电泳检测,电泳图谱如图1所示,可以看出21个微单倍型和Amelogenin基因座均被扩增且均被以较为一致的扩增效率被扩增出来。
[0105] 结果2:如表4,列出了利用PCR将在每条染色体上选择的SNP位点扩增出来的扩增片段长度以及对应的rs号,其中,PCR的扩增长度均在250bp范围内,且包括的SNP都在3-6个。
[0106] 表4
[0107]
[0108]
[0109] (2)对比实验1
[0110] 本对比实验采用本实施例2的复合扩增体系,但引物浓度统一改为0.5uM,对来源已知个体的DNA样本进行复合扩增,其中复合扩增PCR体系和复合扩增PCR程序均和应用实施例1相同。
[0111] 对扩增产物进行凝胶电泳检测,电泳图谱如图2所示,可以看出当引物浓度统一改成0.5uM后,微单倍型编号2、7、8、20、23和Amelogenin基因座均未被扩增出来。
[0112] (3)对比实验2
[0113] 本对比实验采用本实施例2的复合扩增体系,但引物浓度统一改为1uM,对来源已知个体的DNA样本进行复合扩增,其中复合扩增PCR体系和复合扩增PCR程序均和应用实施例1相同。
[0114] 对扩增产物进行凝胶电泳检测,电泳图谱如图3所示,可以看出当引物浓度统一改成1uM后,微单倍型编号2、7、9、11、13、17、20、23和Amelogenin基因座均未被扩增出来。
[0115] 实施例4微单倍型标记的频率计算
[0116] 因上述微单倍型为自主研发设计,没有相应的频率信息,因此需要先计算这些标记的频率。
[0117] 计算方法为:
[0118] (1)DNA提取:利用DNeasy Blood & Tissue Kit提取试剂盒提取50个无关个体的全基因组DNA。
[0119] (2)复合PCR扩增:利用本发明构建的复合扩增体系对提取的DNA进行复合PCR扩增。
[0120] (3)建库以及二代测序:对PCR产物进行纯化,并利用KAPA  LTP Library Preparation Kit试剂盒对纯化后的PCR产物进行建库,库检合格后,用MiSeq测序仪进行测序。
[0121] (4)二代测序数据分析:对测序得到的fastq文件进行质量控制,去掉一些低质量的序列,将质控过后的fastq文件转化为fasta文件,利用正方向引物调出测序得到的每条染色体上包含正反向引物的序列,对得到的序列做blast,其中blast的库文件为每条染色体上利用正反向引物从ucsc中的电子PCR得到的序列,然后找到每个个体中,对应位置处的SNP碱基,将每条染色体上对应的SNP组合到一起,即为该个体在该染色体上的单倍型分型。
[0122] (5)微单倍型频率计算:主要是利用haploview软件对单倍型的频率进行计算,由于该软件无法识别ATCG,因此需要对数据进行进一步的转化,其中A=1,C=2,G=3,T=4,无基因型用0表示。
[0123] 计算结果如下:
[0124] 结果(1)如表4,为50个北京地区无关个体样本中,每条染色体上出现的单倍型以及对应的频率:
[0125] 表4
[0126]
[0127]
[0128] 结果(2)如图4,表示随机个体的单样本微单倍型分型结果。其中纵轴表示该分型对应的reads数,横轴表示对应的染色体上的分型,如果该染色体上是纯和的分型,那么就对应一种微单倍型分型,如Chr14的单倍型分型为AGCA;如果该染色体上有两种分型,那么就表示在这个位点是杂合的,就对应两种单倍型分型,如Chr10染色体就是CGTC和TAGT的杂合分型。
[0129] 以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。