一种碱基选择性可控延伸的STR序列高通量检测方法及其检测试剂转让专利

申请号 : CN201210193643.3

文献号 : CN102703595B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李俊吉陆祖宏刘全俊

申请人 : 东南大学

摘要 :

本发明一种碱基选择性可控延伸的STR序列高通量检测方法及其检测试剂,将STR序列检测方法的基本原理与高通量DNA测序技术结合,提供了一种在高通量测序平台上运行的、对海量STR序列样本进行检测的方法以及相应的检测试剂。根据测序系统相应的文库制备方法,将待测样本的STR序列直接或间接固定在检测芯片上,按照检测的流程加入合适的检测试剂,并控制反应的条件,采用碱基选择性可控延伸的技术方案,检测样本所在的各个反应位点发出的荧光强度信号,最终,通过分析检测全过程中各个检测位点的荧光信号照片得到海量样本的检测结果。本发明的最大优点是极大提高了每次可检测的样本数量,从而大大降低了检测的成本以及耗费的时间。

权利要求 :

1.一种碱基选择性可控延伸的STR序列高通量检测方法,其特征在于包括如下操作:

(1)基因座的选取和扩增:根据不同的检测需要,选取相应数量的STR序列,作为检测对象;通过PCR技术,将上述选取的STR序列从人类DNA样本的相应基因座上扩增出来;

所述作为检测对象的STR序列所在的基因座为ACTBP2、APOAI1、CYAR04、FABP 、FOLP23、GABARB1、PLA2A1、TFIIDA 、CD4、CSF1PO 、F13A1、F13B 、FES/FPS 、FGA (FIBRA) 、HPRTB、LPL 、Penta D 、Penta E、SE33、TH01、TPOX、VWA、D1S1656、D2S441、D2S1338 、D3S1358 、D5S818 、D6S1043、D7S820、D8S1179、D10S1248、D12S391 、D13S317、D14S1434、D16S539、D18S51、D19S433、D21S11、D22S1045 、DYS19、DYS385 a/b、DYS388 、DYS389 I/II、DYS390、DYS391 、DYS392 、DYS393、DYS434、DYS437 、DYS438 、DYS439、DYS447 、DYS448、DYS456、DYS458 、DYS460、DYS464、DYS635、Y-GATA-A4 、Y-GATA-A7.1、Y-GATA-A7.2 、Y-GATA-A10、Y-GATA-H4、Amelogenin、D22-GATA198B05这些与身份识别检测相关的基因座中的一种或几种;

(2)检测芯片上STR序列文库的制备:芯片的每一个反应位点上仅有唯一样本的同一种STR单链序列拷贝;上述STR单链序列拷贝可以直接固定于芯片的平面固体基片表面,也可以通过微小球体,间接地先将单链序列拷贝固定在微小球体的表面,然后再将固定完单链序列拷贝的微小球体固定于平面基片的表面;

(3)STR核心序列重复次数的检测:在延伸反应进行之前,先要读取出芯片上每个反应位点上的STR序列所属的样本信息以及基因座信息,通过杂交的方法,将延伸起始引物和

3’端封闭的延伸终止引物结合在检测芯片中反应位点的单链序列上;加入由延伸单体试剂、DNA聚合酶、延伸引物试剂、反应缓冲液、荧光剪切试剂、延伸恢复试剂、变性液构成的检测试剂,进行延伸反应;上述一次延伸反应完成后检测微阵列上点阵的荧光信号,然后将荧光剪切并恢复单体3’端的延伸活性;接着继续加入上述由四种核苷酸单体以及DNA聚合酶等构成的检测试剂,进行下一轮延伸反应,直到芯片上的所有反应位点均检测不出荧光信号为止;

其中,读取芯片上每个反应位点上的STR序列所属的样本信息以及基因座信息时,需要根据芯片上是否具有样本的分隔性选择不同的样本标识和读取方法;若芯片具有样本分隔性,检测时需要用组合荧光法区分序列所属的基因座,检测结果需要根据芯片上样本区域的编号查询得到样本的信息;若芯片不具有样本分隔性,需要引入核酸标识片段来记录样本信息以及所属基因座的信息,检测时需要进行对核酸标识片段读取的过程;所述组合荧光法区分序列所属的基因座,其方法为选择合适数量的特异性序列片段,将其修饰上若干种荧光,通过这些特异性序列片段和STR序列杂交时产生的不同荧光结果,区分出芯片的各个反应位点上连接的STR序列类型;

所述的延伸反应采用的是选择性延伸的方法,如果当前延伸位点不是需检测的碱基位点,则延伸反应不会中止,继续进行;如果当前延伸位点是需要检测的碱基位点,延伸反应中止;

(4)荧光信号的分析:通过记录芯片上STR微阵列的各个反应位点检测到的荧光出现次数以及荧光强度,确定待检测基因座的STR核心序列的重复数;通过对同一反应位点在每次延伸反应结果中的荧光强度进行分析,判断该反应位点上连接的STR序列所在基因座是否具有两个不同的等位基因,并分析出两个等位基因STR序列各自的核心序列重复次数。

2.根据权利要求1 所述的一种碱基选择性可控延伸的STR序列高通量检测方法,其特征在于步骤(1)中基因座选取时,可根据STR序列中核心序列重复单元的序列信息来选择相应的检测碱基位点以及设计多基因座同时检测的分组检测方案。

3.根据权利要求1所述的一种碱基选择性可控延伸的STR序列高通量检测方法,其特征在于步骤(2)中所述的STR序列文库制备时需要将样本的STR序列拷贝直接或间接地固定在高通量测序仪器的芯片上:直接固定为将STR序列的引物通过化学基团间的相互作用直接固定在测序芯片上,间接固定为把样本引物先固定在微小球体上,再将微小球体固定在测序芯片上。

4.根据权利要求1 所述的一种碱基选择性可控延伸的STR序列高通量检测方法,其特征在于:步骤(4)中所述的荧光信号分析时需要根据芯片上反应位点在每轮延伸反应结果中的荧光强度信息来判断样本中各个STR序列所在基因座的两个等位基因是否相同;若相同,得到唯一核心序列重复次数结果;若不同,需要分析得出两个等位基因STR序列各自的核心序列重复次数结果。

5.权利要求1 所述的一种碱基选择性可控延伸的STR序列高通量检测方法的检测试剂,其特征在于:步骤(3)中所述的检测试剂包括延伸单体试剂、DNA聚合酶、延伸引物试剂、反应缓冲液、荧光剪切试剂、延伸恢复试剂、变性液,这些检测过程中各种生化反应进行时需要用到的生化试剂;其中的延伸单体试剂包含了四种不同的核苷酸单体dNTP,N为A、T、C、G四种碱基中的一个;其中三种与检测碱基位点不配对的单体为普通核苷酸单体,剩下的一种与检测碱基位点配对的单体经过如下的修饰:单体上标记了可剪切的荧光,且单体的3’端修饰有可控延伸的化学基团;四种核苷酸单体的混合体系作为延伸单体试剂,单独封装保存;检测时使用的DNA聚合酶需要根据实验设计时测序终止引物的5’端是否修饰有保护基团,选择相应类型的聚合酶。

6.根据权利要求5 所述的一种碱基选择性可控延伸的STR序列高通量检测方法的检测试剂,其特征在于:所述延伸引物试剂、反应缓冲液、荧光剪切试剂、延伸恢复试剂、变性液试剂,均选用生物学实验中常用的生化试剂。

说明书 :

一种碱基选择性可控延伸的STR序列高通量检测方法及其

检测试剂

技术领域

[0001] 本发明一种碱基选择性可控延伸的STR序列高通量检测方法及其检测试剂属于生物技术中高通量DNA测序领域,特别涉及运用第二代高通量测序技术来进行STR序列的检测方法。

背景技术

[0002] 第二代高通量DNA测序:人类基因组计划和各种模式生物基因组计划的开展和完成,对当代的生物学研究和医学研究产生了巨大的影响。人们能够从基因水平上认识生命现象的差异,疾病发生、发展的规律,以及药物与生命体的相互作用。就基因序列分析而言,后基因组时代的重点已由单个物种的全基因组序列测定转移到了对某一物种在基因组DNA序列层次上个体遗传差异及物种间遗传差异的比较。目前,在寻找新的功能基因和疾病相关的突变位点方面,人们仍然主要使用常规的Sanger DNA测序法。这一方法存在通量低和成本高的问题。第一个人类基因组序列测定的费用大约为10亿美元,但是尽管目前这一费用已经降低到大约2千万美元以下,功能基因组的研究进展仍然受限于DNA测序技术。为此,美国Venter基金会在2003年提出了1000美元人类全基因组测序的研究目标。2004年初,美国国立卫生院投入巨资支持DNA测序新技术的研究。他们的目标是在近年内发展10万美元的人类全基因组DNA测序技术,并最终减低为1千美元。
[0003] 自从2005年454 Life Sciences公司(2007年该公司被Roche正式收购)推出了454 FLX焦磷酸测序平台以来,曾推出过3730xl DNA测序仪的Applied BioSystem(ABI)这家一直占据着测序市场最大份额的公司的领先地位就开始动摇了,因为他们的拳头产品毛细管阵列电泳测序仪系列遇到了两个强有力的竞争对手,一个就是罗氏公司(Roche)的
454测序仪,另一个就是2006年美国Illumina公司推出的Solexa基因组分析平台。为此,
2007年ABI公司推出了自主研发的SOLiD测序仪。这三个测序平台即为目前高通量测序平台的代表。
[0004] 这些平台共同的特点是极高的测序通量,相对于传统测序的96道毛细管测序,高通量测序一次实验可以读取40万到400万条序列。读取长度根据平台不同从25bp到450bp,不同的测序平台在一次实验中,可以读取1G到14G不等的碱基数,这样庞大的测序能力是传统测序仪所不能比拟的。
[0005] DNA指纹识别以及STR检测技术:1984年英国莱斯特大学的遗传学家Jefferys及其合作者首次将分离的人源小卫星DNA用作基因探针,意思是它同人的指纹一样是每个人所特有的。DNA指纹的图像在X光胶片中呈一系列条纹,很像商品上的条形码。DNA指纹图谱,开创了检测DNA多态性(生物的不同个体或不同种群在DNA结构上存在着差异)的多种多样的手段,如RFLP(限制性内切酶酶切片段长度多态性)分析、串联重复序列分析、RAPD(随机扩增多态性DNA)分析等等。各种分析方法均以DNA的多态性为基础,产生具有高度个体特异性的DNA指纹图谱,由于DNA指纹图谱具有高度的变异性和稳定的遗传性,且仍按简单的孟德尔方式遗传,成为目前最具吸引力的遗传标记。它具有如下的特点:
[0006] 1.高度的特异性:研究表明,两个随机个体具有相同DNA图形的概率仅3×10-11;-19
如果同时用两种探针进行比较,两个个体完全相同的概率小于5×10 。全世界人口约50
9
亿,即5×10。因此,除非是同卵双生子女,否则几乎不可能有两个人的DNA指纹的图形完全相同。2.稳定的遗传性:DNA是人的遗传物质,其特征是由父母遗传的。分析发现,DNA指纹图谱中几乎每一条带纹都能在其双亲之一的图谱中找到,这种带纹符合经典的孟德尔遗传规律,即双方的特征平均传递50%给子代。3.体细胞稳定性:即同一个人的不同组织如血液、肌肉、精液等产生的DNA指纹图形完全一致。
[0007] 1985年Jefferys博士首先将DNA指纹技术应用于法医鉴定。1989年该技术获美国国会批准作为正式法庭物证手段。我国警方利用DNA指纹技术已侦破了数千例疑难案件。DNA指纹技术具有许多传统法医检查方法不具备的优点,如它从四年前的精斑、血迹样品中,仍能提取出DNA来作分析;如果用线粒体DNA检查,时间还将延长。此外千年古尸的鉴定,在俄国革命时期被处决沙皇尼古拉的遗骸,以及最近在前南地区的一次意外事故中机毁人亡的已故美国商务部长布朗及其随行人员的遗骸鉴定,都采用了DNA指纹技术。 [0008] 此外,它在人类医学中被用于个体鉴别、确定亲缘关系、医学诊断及寻找与疾病连锁的遗传标记;在动物进化学中可用于探明动物种群的起源及进化过程;在物种分类中,可用于区分不同物种,也有区分同一物种不同品系的潜力。在作物的基因定位及育种上也有非常广泛的应用。
[0009] 短串联重复序列(short tandem repeat,STR)又称简单重复序列(simple sequence repeat,SSR)或微卫星DNA(microsatellite DNA),由2~6bp的核心序列组成,重复次数通常在15~30次。STR广泛存在于真核生物基因组中。由于STR核心序列的重复次数存在个体间差异,具有高度多态性,因而被作为一种遗传标记广泛地应用于植物、动物的种类鉴定中。在人类基因组中,STR分散在人的整个基因组中,平均每15~20kb就存在一个STR基因座,约占人基因组的3%。STR标记还具有多态性丰富、易于检测等特点,因此被广泛应用于人类遗传制图、基因定位、连锁分析、亲子鉴定、罪犯鉴定和人类遗传研究等方面,也是DNA指纹检测中运用最为广泛的方法。
[0010] 目前对STR序列的检测普遍采用试剂盒的方法。其基本原理就是利用基因座内等位基因长度的不同以及扩增的基因座之间片段长度范围的不同,采用高分辨率的毛细管电泳技术进行分离。通常,对于每个基因座中一条引物进行荧光标记,不同的基因座引物标记不同的荧光,结合扩增片段的迁移率和荧光的颜色,应用基因序列分析仪及采用相应的分析软件可自动化检出复合扩增的众多STR 基因座的所有信息。可以看出,目前的检测手段以类似于第一代测序的毛细管电泳法为基础,检测的通量较小,并不能满足同时对海量样本进行同时检测的要求。

发明内容

[0011] 本发明的目的是针对上述不足之处提供一种碱基选择性可控延伸的STR序列高通量检测方法及其检测试剂,是一种基于第二代DNA测序技术的高通量、低成本、快速STR序列检测方法及其检测试剂。本发明提出了一种碱基选择性可控延伸的合成测序技术,大幅度提高了STR序列的样本检测通量,在相同的时间内,相对现有的检测手段,检测的样本数可以达到数个数量级的提升,相应地,单个样本的检测成本也得到了大幅度的降低。通过设计对应于第二代测序技术的STR序列的新检测方法,实现将第二代测序的高通量特点引入到STR序列的检测技术中,从而使得STR序列检测技术在身份识别、法医检测、案件侦破以及个人基因身份信息采集等重大领域的广泛应用成为可能。
[0012] 本发明一种碱基选择性可控延伸的STR序列高通量检测方法及其检测试剂是采取以下技术方案实现:
[0013] 一种碱基选择性可控延伸的STR序列高通量检测方法的步骤为:
[0014] (1)基因座的选取和扩增:根据不同的检测需要,选取相应数量的STR序列,作为检测对象;通过PCR技术,将上述选取的STR序列从人类DNA样本的相应基因座上扩增出来。
[0015] 所述STR序列所在的基因座为ACTBP2、APOAI1、CYAR04、FABP 、FOLP23、GABARB1、PLA2A1、TFIIDA 、CD4、CSF1PO 、F13A1、F13B 、FES/FPS 、FGA (FIBRA) 、HPRTB、LPL 、Penta D 、Penta E、SE33、TH01、TPOX、VWA、D1S1656、D2S441、D2S1338 、D3S1358 、D5S818 、D6S1043、D7S820、D8S1179、D10S1248、D12S391 、D13S317、D14S1434、D16S539、D18S51、D19S433、D21S11、D22S1045 、DYS19、DYS385 a/b、DYS388 、DYS389 I/II、DYS390、DYS391 、DYS392 、DYS393、DYS434、DYS437 、DYS438 、DYS439、DYS447 、DYS448、DYS456、DYS458 、DYS460、DYS464、DYS635、Y-GATA-A4 、Y-GATA-A7.1、Y-GATA-A7.2 、Y-GATA-A10、Y-GATA-H4、Amelogenin、D22-GATA198B05等与身份识别相关的基因座中的一种或几种。
[0016] 选取完需要检测的STR序列后,根据STR序列中核心序列重复单元的序列信息来选择相应的检测碱基位点以及设计多基因座同时检测的分组检测方案。
[0017] (2)检测芯片上STR序列文库的制备:芯片的每一个反应位点上仅有唯一样本的同一种STR单链序列拷贝。上述STR单链序列拷贝可以直接固定于芯片的平面固体基片表面;也可以通过微小球体,间接地先将单链序列拷贝固定在微球的表面,然后再将固定完单链序列拷贝的微球固定于平面基片的表面。
[0018] 所述的微小球体可选用磁珠或非磁性微珠,其粒径一般小于等于10微米。
[0019] STR单链序列拷贝采取直接法或是间接法固定在芯片表面,需要依据用于检测芯片的高通量测序仪各自采用的测序文库制备类型。
[0020] (3)STR核心序列重复次数的检测:在延伸反应进行之前,先要读取出芯片上每个反应位点上的STR序列所属的样本信息以及基因座信息;通过杂交的方法,将延伸起始引物和3’端封闭的延伸终止引物结合在检测芯片中反应位点的单链序列上;加入由3种与需检测碱基不相配对的核苷酸单体和另一种与需检测碱基配对、带有可剪切的荧光基团、3’端是可控封闭的核苷酸单体以及DNA聚合酶等构成的检测试剂,进行延伸反应;上述一次延伸反应完成后检测微阵列上点阵的荧光信号,然后将荧光剪切并恢复单体3’端的延伸活性;接着继续加入上述由四种核苷酸单体以及DNA聚合酶等构成的检测试剂,进行下一轮延伸反应,直到芯片上的所有反应位点均检测不出荧光信号为止。
[0021] 读取STR序列的所属信息时,需要根据芯片上是否具有样本的分隔性选择不同的样本标识和读取方法。若芯片具有样本分隔性,检测时需要用组合荧光法区分序列所属的基因座,检测结果需要根据芯片上样本区域的编号查询得到样本的信息。若芯片不具有样本分隔性,需要引入核酸标识片段来记录样本信息以及所属基因座的信息,检测时需要进行对核酸标识片段读取的过程。
[0022] 组合荧光区分STR序列所属基因座的方法为:选择合适数量的特异性序列片段,将其修饰上若干种荧光,通过这些特异性序列片段和STR序列杂交时产生的不同荧光结果,区分出芯片的各个反应位点上连接的STR序列类型。
[0023] 选择性延伸方法的目的在于跳过无需检测的碱基位点。如果当前延伸位点不是需检测的碱基位点,则延伸反应不会中止,继续进行;如果当前延伸位点是需要检测的碱基位点,延伸反应中止。
[0024] (4)荧光信号的分析:通过记录芯片上STR微阵列的各个反应位点检测到的荧光出现次数以及荧光强度,确定待检测基因座的STR核心序列的重复数;通过对同一反应位点在每次延伸反应结果中的荧光强度进行分析,判断该反应位点上连接的STR序列所在基因座是否具有两个不同的等位基因,并分析出两个等位基因STR序列各自的核心序列重复次数。最终的检测结果为STR序列所在基因座是否具有两个不同等位基因,以及STR序列的核心序列重复次数,包括唯一的或者两种不同的核心序列重复次数。
[0025] 最终得到的检测结果可以运用到不同的检测领域,如:对Amelogenin基因座的单独检测结果可用于未知样本的性别检测;对Amelogenin、D18S1364、D12S391、D13S325、D6S1043、D2S1772、D11S2368、D8S1132、D7S3048、D22-GATA198B05这10个基因座的检测结果可用于亲子鉴定,来判断不同样本间的生物学亲缘性关系;对D3S1358、TH01、D21S11、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1PO、Penta D、Amelogenin、vWA、D8S1179、TPOX、FGA、D19S433、D12S391、D6S1043、D2S1338这20个基因座的检测结果,可以用于DNA指纹检测技术中来进行个体的身份识别,从而进一步应用于犯罪数据库建立、法医检测、案件侦破以及个人基因身份信息采集等重大领域。
[0026] 所述的一种碱基选择性可控延伸的STR序列高通量检测方法的检测试剂包括延伸单体试剂、DNA聚合酶、延伸引物试剂、反应缓冲液、荧光剪切试剂、延伸恢复试剂、变性液这些检测过程中各种生化反应进行时需要用到的生化试剂;其中延伸单体试剂包含了四种不同的核苷酸单体dNTP,其中N为A、T、C、G四种碱基中的一个;四种核苷酸单体中的三种与检测碱基位点不配对的单体为普通核苷酸单体,剩下的一种与检测碱基位点配对的单体经过如下的修饰:单体上标记了可剪切的荧光,且单体的3’端修饰有可控延伸的化学基团;四种核苷酸单体的混合体系作为延伸单体试剂,单独封装保存;检测时使用的DNA聚合酶需要根据实验设计时测序终止引物的5’端是否修饰有保护基团,选择相应类型的聚合酶。所述延伸引物试剂、反应缓冲液、荧光剪切试剂、延伸恢复试剂、变性液试剂,均选用生物学实验中常用的生化试剂。检测反应前,将足量的相应检测试剂按照实验标准要求的比例以及顺序加入到反应体系中。
[0027] 本发明有益效果:本发明与现有技术相比,具有如下优点:
[0028] 1.本发明的最大优点是发明了一种碱基选择性可控延伸的合成测序技术,并将其运用在STR序列的检测中,使得STR序列检测与第二代高通量测序技术相适应,极大提高了每次可检测的样本数量,从而大大降低了检测的成本以及耗费的时间。现有的技术检测时采用的是第一代测序使用的毛细管电泳法,每次仅能检测十数个样本,而本发明的检测技术基于第二代高通量测序技术,每次可以检测数万甚至于数十万的样本,提高了至少3个数量级。检测通量的提高可以极大促进STR序列检测技术在身份识别、犯罪数据库建立、法医检测、案件侦破以及个人基因身份信息采集等重大领域的应用。
[0029] 2.本发明在序列检测的过程中,引入了一对延伸起始引物和延伸终止引物,大大减少了需要检测的碱基位点数。同时,由于采用了可控延伸的方法,把传统的对每个位点的逐个测序模式转变为更加适合STR检测的跳跃式碱基选择性检测模式。这样,检测的长度可以很长,且无需将基因座序列片段化,降低了检测的复杂度。
[0030] 3.本发明采用的检测方法广泛适用于现有的第二代商用测序仪器,甚至一些第三代测序仪器(如PacBio RS等),而且它对测序仪的性能要求不高,一般的中低端第二代测序仪器即可完成检测过程。而且,本发明的应用范围广泛,可运用于性别检测、身份识别、亲子鉴定、法医学检测等许多生物学检测领域。

附图说明

[0031] 图 1是本发明中STR序列所在的一个基因座示意图。图中1表示基因座中扩增前引物所在位置,2表示基因座上延伸终止引物杂交的位置,3表示基因座的核心序列区域,AGAA为核心序列的重复单元,4表示延伸前引物的杂交位置,5表示扩增后引物的杂交位置。
[0032] 图 2是本发明一种碱基选择性可控延伸的STR序列高通量检测方法的一组STR序列所在基因座,分别为D7S820,CSF1PO,D3S1358和D13S317基因座。其中它们的核心序列重复单元中具有相同的单个核苷酸碱基位点,也就是G这个碱基,后续的检测中,选择特殊修饰的核苷酸单体dCTP即可对这四个基因座扩增出的STR序列同时进行检测。
[0033] 图3是本发明一种碱基选择性可控延伸的STR序列高通量检测方法的芯片直接检测法示意图。图中左侧为检测芯片,图中1表示的是某条STR序列上扩增前引物所在位置的序列,将其5’端加以修饰,与图中7所示的芯片反应表面上的化学基团发生连接反应,形成图中6所示的连接基团。图中2表示延伸终止引物,其3’端封闭,无法继续延伸。图中3表示STR序列的核心序列重复区域,需要检测的就是该区域中核心序列的重复次数。图中4表示延伸起始引物,检测的起点就是其3’端。通过在其3’端不断重复延伸反应、荧光检测、荧光剪切和恢复延伸活性的步骤,检测出图中3区域中的核心序列重复次数。图中5表示的是STR序列上扩增后引物所在位置的序列。
[0034] 图4是本发明一种碱基选择性可控延伸的STR序列高通量检测方法的引入核酸标识片段的磁珠检测法示意图。图中左侧为检测芯片,图中1表示某条STR序列上扩增前引物所在位置的序列,将其5’端加以修饰,与图中9所示的磁珠表面上的化学基团发生连接反应,形成图中6所示的连接基团。再将磁珠均匀铺到芯片的流道中,选择合适的反应条件,将磁珠连接到图中7所示的芯片反应面上。图中2表示延伸终止引物,其3’端封闭,无法继续延伸。图中3表示STR序列的核心序列重复区域,需要检测的就是该区域中核心序列的重复次数。图中4表示延伸起始引物,检测的起点就是其3’端。通过在其3’端不断重复延伸反应、荧光检测、荧光剪切和恢复延伸活性的步骤,检测出图中3区域中的核心序列重复次数。图中8表示的是引入的核酸标识片段,它包含基因座所属的样本信息以及基因座种类信息,可以在核心序列重复次数检测之前进行核酸标识片段信息的读取。图中5表示的是STR序列上扩增后引物所在位置的序列。
[0035] 图5是本发明一种碱基选择性可控延伸的STR序列高通量检测方法的实时检测图像结果中的部分区域。图中每个点位(包括亮点和暗点)代表某一检测位点上STR序列在该轮检测中的荧光情况。其中较亮的点位表示该反应位点上的STR序列在本轮仍能检测到荧光信号,对核心序列重复次数的计数继续进行。其中较暗的点位表示由于该STR序列所在基因座包含两种等位基因,其中对较短的那条STR序列计数已经结束,整体荧光强度值下降;而较长的那条则在继续计数,仍能检测到一定量的荧光。而剩下的不发光的点位则需要根据检测开始时这些点位的荧光信号情况来判断该点位是失效点位,还是由于该STR序列核心区域较短,已经完成核心序列重复次数计数的有效点位。

具体实施方式

[0036] 实施例1:利用一种碱基选择性可控延伸的STR序列高通量检测方法对Amelogenin基因座的STR序列进行多样本的高通量性别检测:
[0037] 利用一种碱基选择性可控延伸的STR序列高通量检测方法,检测步骤为:
[0038] (1)基因座的选取和扩增:将Amelogenin基因座的一对PCR扩增引物,与待测样本的DNA模板一起加入扩增体系中,控制合适的反应条件,进行PCR反应,得到Amelogenin基因座的STR序列扩增产物。其中,一对扩增引物中一条的5’端上修饰有可连接的基团。不同的样本需要在独立的扩增体系中扩增。
[0039] (2)检测芯片上STR序列文库的制备:通过点样的方式,将不同样本的Amelogenin基因座扩增产物体系点到检测芯片反应基面上的分隔区域中。芯片反应基面上修饰有另一种连接基团,控制合适的反应条件,使得扩增产物体系中有连接基团的那条STR序列单链与反应基面上的连接基团相结合,完成STR序列的固定。
[0040] (3)STR核心序列重复次数的检测:
[0041] a)在芯片上进行STR序列与相应的延伸起始引物和3’端封闭的延伸终止引物的杂交反应。其中,延伸终止引物的5’端未做任何修饰。
[0042] b).由于延伸终止引物的5’端未做任何修饰,需使用不带有5’外切酶活性的kelnow聚合酶进行延伸反应。由于选择的Amelogenin基因座在不同性别的样本中具有不同个数的A(腺嘌呤)碱基,所以,可以把A(腺嘌呤)位点作为检测核苷酸位点。因此,延伸单体试剂中核苷酸单体的组合为未经修饰的dATP、dGTP、dCTP普通核苷酸单体以及如下特殊修饰的dTTP核苷酸单体:单体上修饰有可剪切的荧光,且单体3’端修饰有可控延伸的基团,在一定的反应条件下,单体的3’端能够恢复延伸活性。按照实验标准的规定,加入相应的其他反应试剂,并控制好合适的反应条件,进行延伸反应。
[0043] c).检测并成像记录芯片上所有检测位点的荧光信号。
[0044] d).荧光信号检测和记录完成后,依次进行荧光剪切反应和恢复单体3’端的延伸活性反应。
[0045] e).重复b、c、d步骤,直到芯片上所有检测位点的荧光信号消失。
[0046] (4)荧光信号的分析:分析各轮荧光图像中每个荧光位点的荧光出现次数以及强度变化规律,确定荧光位点对应的芯片检测位点上STR序列的核心序列重复数及其所在的基因座是否具有两条不同的等位基因。在对Amelogenin基因座进行性别检测时,如果某个反应点位出现了荧光信号减弱的现象,则表示该位点对应的样本扩增体系中含有两条长度不同的STR序列,也就代表该样本来自于男性;若荧光信号没有减弱,而是直接消失,说明该位点对应的样本扩增体系中只有唯一长度的STR序列,样本来源于女性。
[0047] 实施例2:利用一种碱基选择性可控延伸的STR序列高通量检测方法对D3S1358、TH01、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1PO、Penta D、TPOX、SE33、D8S1179、D21S11、vWA、FGA 16个基因座的STR序列进行样本分隔的身份识别检测,文库制备采用芯片直接制备法:
[0048] 利用一种碱基选择性可控延伸的STR序列高通量检测方法,检测步骤为:
[0049] (1)基因座的选取和扩增:将上述16个基因座相应的一对PCR扩增引物,与待测样本的DNA模板一起加入扩增体系中,控制合适的反应条件,进行PCR反应,得到基因座的STR序列扩增产物。不同的样本需要在独立的扩增体系中扩增。
[0050] (2)检测芯片上STR序列文库的制备:分别将16条STR序列相应的、带有可连接基团的一侧扩增引物,通过点样的方式,点到检测芯片反应基面上的分隔区域中。芯片反应基面上修饰有另一种连接基团,控制合适的反应条件,使得引物上的连接基团与反应基面上的连接基团相结合,完成引物的固定。其中一侧扩增引物在选择时需要注意其所在的STR序列单链中,是否具有相同的检测核苷酸位点:D3S1358、TH01、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1PO、Penta D、TPOX、SE33这12个基因座的核心序列中都包含G(鸟嘌呤)碱基检测位点,因此可以同组检测。而D8S1179、D21S11、vWA、FGA这4个基因座的核心序列包含的是C(胞嘧啶)碱基检测位点,无法直接与上面的12个基因座直接同时检测。但是由于DNA双链中的两条单链满足互补配对的原则,因此D8S1179、D21S11、vWA、FGA基因座扩增出的反义链上核心序列检测位点为G(鸟嘌呤)位点。这样,在引物选择时,选择D3S1358、TH01、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1PO、Penta D、TPOX、SE33基因座的正义链引物和D8S1179、D21S11、vWA、FGA基因座的反义链引物,即可对这16个基因座的STR序列进行同组检测。
[0051] 芯片与引物的固定完成后,将不同样本的16个基因座混合扩增体系分别点样到芯片上的分割区域中,进行杂交反应,让芯片上的引物捕获到扩增体系中相应样本基因座。在将样本点样到测序芯片上时,需要对样本点样到的区域进行记录,确保芯片上的分隔区域与样本编号一一对应。控制合适的反应条件,再次进行扩增反应,将待检测的基因座扩增到芯片的反应面上。这样,就完成了检测芯片上STR序列文库的制备。
[0052] (3)STR核心序列重复次数的检测:
[0053] a).在选取的16条STR序列中选择两段特异性短序列片段,并将其互补短序列片段分别标记上四色荧光,分两次与STR序列杂交。利用得到的16种荧光组合结果,区分出芯片中所有反应位点上基因座的种类。具体步骤为:首先将第一条互补短序列片段与芯片进行杂交反应,杂交完成后检测四色荧光通道的荧光强度信号,然后切除荧光。再将第二条互补短序列与芯片杂交,杂交完成后检测四色荧光通道的荧光强度信号。最后,通过变性,去除STR序列上的短序列片段。
[0054] b).在芯片上进行16条STR序列与各自相应的延伸起始引物和3’端封闭的延伸终止引物的杂交反应。其中,延伸终止引物的5’端未做任何修饰。
[0055] c).由于延伸终止引物的5’端未做任何修饰,需使用不带有5’外切酶活性的kelnow聚合酶进行延伸反应。由于选择的16条STR序列具有相同检测核苷酸位点G(鸟嘌呤)位点。因此,延伸单体试剂中核苷酸单体的组合为未经修饰的dATP、dGTP、dTTP普通核苷酸单体以及如下特殊修饰的dCTP核苷酸单体:单体上修饰有可剪切的荧光,且单体3’端修饰有可控延伸的基团,在一定的反应条件下,单体的3’端能够恢复延伸活性。按照实验标准的规定,加入相应的其他反应试剂,并控制好合适的反应条件,进行延伸反应。
[0056] d).检测并成像记录芯片上所有检测位点的荧光信号。
[0057] e).荧光信号检测和记录完成后,依次进行荧光剪切反应和恢复单体3’端的延伸活性反应。
[0058] f).重复c、d、e步骤,直到芯片上所有检测位点的荧光信号消失。
[0059] (4)荧光信号的分析:分析各轮荧光图像中每个荧光位点的荧光出现次数以及强度变化规律,确定荧光位点对应的芯片检测位点上STR序列的核心序列重复数及其所在的基因座是否具有两条不同的等位基因。如:检测结果中某个样本的D18S51基因座,在前13轮荧光检测中,均出现荧光信号,而在第14轮向后,不再检测出荧光信号。因此得出该样本的D18S51基因座的两个等位基因相同,具有13个核心序列重复单元。另一样本的D8S1179基因座,在前9轮荧光检测中,均出现较强荧光信号,在10到15轮检测中,荧光信号强度衰减、但未消失,16轮之后的检测中,荧光信号完全消失。因此得出结论为该样本的D8S1179基因座具有两个不同的等位基因,其核心序列重复单元分别为9和15。同一样本的上述16个基因座的检测结果,即可用于对样本个体的身份识别检测中。
[0060] 运用本方法对标准样本进行检测,检测结果与试剂盒检测方法的检测结果互相对应。
[0061] 实施例3: 利用一种碱基选择性可控延伸的STR序列高通量检测方法对F13A1、F13B 、FES/FPS 、HPRTB、LPL、D22S1045 、DYS19、DYS385 a/b、DYS388 、DYS389 I/II、DYS390、DYS391 、DYS392 、DYS393、DYS434、DYS437、Y-GATA-H4这17个基因座同时进行混合样本的检测,文库制备采用磁珠制备法:
[0062] 利用一种碱基选择性可控延伸的STR序列高通量检测方法,检测步骤为:
[0063] (1)基因座的选取和扩增:由于是混合样本体系,需要引入核酸标识片段来区分不同的样本和不同的基因座。首先在上述17个基因座相应的一对PCR扩增引物上引入相应的核酸标识片段,再将引入了核酸标识片段的扩增引物与待测样本的DNA模板一起加入扩增体系中,控制合适的反应条件,进行PCR反应,得到基因座的STR序列含核酸标识片段的扩增产物。不同的样本需要在独立的扩增体系中扩增。扩增完成后,将每个扩增体系分装成等量的两份。
[0064] (2)检测芯片上STR序列文库的制备:分别将17条STR序列相应的、带有可连接基团的一侧扩增引物,滴入到表面修饰有另一种连接基团的磁珠浊液中,控制合适的反应条件,使得引物上的连接基团与磁珠表面的的连接基团相结合,完成引物在磁珠上的固定,形成了17种表面上固定有不同引物序列的磁珠。
[0065] 由于17个基因座各自的检测碱基位点有所不同,因此需要将上述基因座分两组进行检测。由于碱基的互补配对原则,可以将检测碱基位点为G(鸟嘌呤)位点和C(胞嘧啶)位点的归为一组,同理,检测碱基位点为A(腺嘌呤)位点和T(胸腺嘧啶)位点的归为另一组。这样,检测C(胞嘧啶)位点的上述17个基因座为:F13A1、DYS385 a/b、DYS389 I/II、DYS390、DYS391、DYS434、DYS437这7个基因座,其中扩增引物选用反义链引物的为F13A1和DYS385 a/b。检测T(胸腺嘧啶)位点的上述17个基因座为:F13B 、FES/FPS、HPRTB、LPL、D22S1045、DYS19、DYS388、DYS392 、DYS393、Y-GATA-H4这10个基因座,其中扩增引物选用反义链引物的为D22S1045、DYS388和DYS392。
[0066] 将17种表面上固定有不同引物序列的磁珠根据上述的分组规则,分为两组。分别加入到第一步制得的两份独立样本扩增体系中,控制合适的反应条件,再次进行扩增反应,将含核酸标识片段的待检测的17个基因座STR序列分两组扩增到磁珠的表面。随后,将两组磁珠分别注入测序芯片不同的流道内,均匀铺开后,再次进行固定反应,将磁珠固定在芯片的反应基面上,至此,基于磁珠的文库制备完毕。
[0067] (3)STR核心序列重复次数的检测:
[0068] a).按照核酸标识片段的读取步骤,对芯片每个磁珠上的STR序列进行核酸标识片段的测序,并对照编码表,读出每个磁珠位点基因座的类型信息和所属样本信息。
[0069] b).在芯片流道内分别进行两组STR序列与各自相应的延伸起始引物和3’端封闭的延伸终止引物的杂交反应。其中,延伸终止引物的5’端修饰有外切保护基团。
[0070] c).由于延伸终止引物的5’端被保护基团保护,可以使用普通的Taq聚合酶进行延伸反应。由于17条STR序列有两个不同的检测核苷酸位点C(胞嘧啶)位点和T(胸腺嘧啶)位点。因此,不同流道内需要加入的延伸单体试剂不同:由于检测位点是C(胞嘧啶)位点,铺满固定上F13A1、DYS385 a/b、DYS389 I/II、DYS390、DYS391、DYS434、DYS437基因座STR序列的磁珠所在的流道中延伸单体试剂的核苷酸单体组合为未经修饰的dATP、dCTP、dTTP普通核苷酸单体以及修饰有可剪切的荧光、3’端修饰有可控延伸基团的dGTP核苷酸单体;由于检测位点是T(胸腺嘧啶)位点,铺满固定上F13B 、FES/FPS、HPRTB、LPL、D22S1045、DYS19、DYS388、DYS392 、DYS393、Y-GATA-H4基因座STR序列的磁珠所在的流道中延伸单体试剂的核苷酸单体组合为未经修饰的dGTP、dCTP、dTTP普通核苷酸单体以及修饰有可剪切的荧光、3’端修饰有可控延伸基团的dATP核苷酸单体。按照实验标准的规定,加入相应的其他反应试剂,并控制好合适的反应条件,进行延伸反应。
[0071] d).检测并成像记录芯片上所有检测位点的荧光信号。
[0072] e).荧光信号检测和记录完成后,依次进行荧光剪切反应和恢复单体3’端的延伸活性反应。
[0073] f).重复c、d、e步骤,直到芯片上所有检测位点的荧光信号消失。
[0074] (4)荧光信号的分析:分析各轮荧光图像中每个荧光位点的荧光出现次数以及强度变化规律,确定荧光位点对应的芯片磁珠位点上STR序列的核心序列重复数及其所在的基因座是否具有两条不同的等位基因。具体实验结果与实施例2的结果相类似,不再重复介绍。