一种染色体特异位点的筛选方法及应用转让专利

申请号 : CN201310098346.5

文献号 : CN103215349B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 梁波孔令印

申请人 : 赛业(苏州)生物信息技术有限公司

摘要 :

本发明提供了一种染色体特异位点的筛选方法,包括染色体特异位点的初步筛选、染色体特异位点的比较去除、利用PCR引物设计方法对染色体特异位点的筛选、利用实时定量PCR反应对PCR引物筛选位点的精筛等步骤。本发明还提供了该筛选方法在产前检测中的应用。本发明提供的染色体特异位点的筛选方法利用常用计算机软件在特定的一条染色体上筛选出特异位点序列,操作简单、成本低廉、筛选得到的特异位点序列数量少、特异性高。

权利要求 :

1.一种染色体特异位点的筛选方法,其特征在于:包括以下步骤:步骤一,染色体特异位点的初步筛选:根据已知人类基因组序列,对待研究的一条染色体特异位点初步筛选,得20-30万个初筛位点序列,所述初筛位点序列满足以下条件:(1)序列长度的取值范围50-70bp;

(2)GC含量在45%~55%之间;

(3)序列中不包含字符“N”;

(4)与单核苷酸多态性位点库进行比较,序列中不存在任何单核苷酸多态性位点;

(5)与基因组变异数据库中拷贝数变异信息进行比较,位点不能包含在任何已知的拷贝数变异中;

(6)位点片段之间在Tm值以及互补方面具有较大的兼容性,即两位点片段间不能有超过10bp的同源序列,片段间的Tm值相差在4度以内;

步骤二,染色体特异位点的比较去除:将步骤一得到的初筛位点序列与人类基因组序列比较分析,去除在多个地方匹配的位点,仅保留在一个位点匹配的序列,得5-10万个单一匹配位点序列;

步骤三,利用PCR引物设计方法对染色体特异位点的筛选:对步骤二中获得的单一匹配位点序列设计PCR引物,并去除不符合以下条件的单一匹配位点序列,得5000-1万个PCR引物筛选位点序列:单一匹配位点序列的PCR引物不能互补,且所有PCR引物Tm值基本一致,即Tm值相差不超过4;

步骤四,利用实时定量PCR对步骤三中筛选出的位点进行精筛:对步骤三中获得的PCR引物筛选位点序列混合并利用实时定量PCR反应检测验证,去除不符合条件的PCR引物筛选位点序列,得2000-3000个染色体特异位点:PCR引物筛选位点的扩增效率基本一致,即通过实时定量PCR绘制出的标准曲线斜率相差不超过0.2。

2.根据权利要求1所述的一种染色体特异位点的筛选方法,其特征在于:步骤一中,初步筛选利用软件完成,包括以下步骤:(1)从人类基因组序列提取位点序列,筛选出不包含字符“N”以及GC含量在45%~

55%的位点;

(2)将步骤(1)得到的位点与单核苷酸多态性位点库以及基因组变异数据库中拷贝数变异信息进行比较,筛选出不存在任何单核苷酸多态性位点和拷贝数变异信息的位点;

(3)将步骤(2)得到的位点与BWA索引数据库比较,并过滤,使位点片段之间在Tm值以及互补方面具有较大的兼容性,即两位点片段间不能有超过10bp的同源序列,片段间的Tm值相差在4度以内。

说明书 :

一种染色体特异位点的筛选方法及应用

技术领域

[0001] 本发明属于生物技术领域,涉及一种染色体特异位点的筛选方法,还涉及该筛选方法的应用,如产前检测。

背景技术

[0002] 我国是人口大国,也是出生缺陷高发国家。根据卫生部最新发布的《中国出生缺陷防治报告(2012)》显示,出生缺陷日益成为我国突出的公共卫生问题和社会问题。目前我国每年出生新生儿约为1600万,出生缺陷发生率在5.6%左右,即每年新增出生缺陷约90万例。
[0003] 造成大量先天缺陷的主要原因是染色体异常,其中染色体异常主要是指染色体的数目或者结构发生异常。数量异常指体细胞组织中正常二倍体46条染色体数目的改变,包括三体(一条额外的染色体)、单体(一条染色体缺失)和多倍体(整套额外的染色体)。结构异常指由染色体断裂及随后断裂的染色体末端在异常的位置愈合导致结构重拍,包括易位、倒位和插入等。染色体非整倍性是导致胎儿先天缺陷的重要原因之一,其引起最为常见的疾病包括唐氏综合征(T21)、爱德华氏综合征(T18)、帕陶氏综合征(T13)等,这三种染色体非整倍性异常占染色体非整倍体畸变95%以上,占全部染色体异常的80%~90%。
[0004] 由于目前没有治疗染色体疾病的有效手段,降低生育染色体疾病患儿风险的最好方法就是通过产前遗传咨询及产前检测、诊断,尽早发现并解决问题。对于一些染色体遗传疾病的产前检测手段主要是血清学筛查(唐氏筛查)、颈项透明带(NT)检测、绒毛取样、羊水穿刺以及脐静脉血穿刺等,其中血清学筛查(唐氏筛查)和颈项透明带(NT)检测假阳性率比较高为5%,同时漏诊率也比较高为20%-40%。虽然绒毛取样、羊水穿刺以及脐静脉血穿刺准确率较高,但是具有一定的流产风险,同时能够进行穿刺的医生也比较少,资源比较紧缺。
[0005] 新的检测方法在不断的研究之中。1997年,Lo等人(Lo Y.M.et al.1997.Lancet)在孕妇的外周血浆中发现了胎儿的游离DNA,使得科学家在理论上可以通过母亲血液检测胎儿DNA,从而检测胎儿的出生缺陷。然而血液中的游离胎儿DNA片段短,一般为166bp左右,而且含量较少,一般能够占总的游离DNA5%-30%,因而给全面的检测这些胎儿DNA带来了困难。近年来,随着高通量测序技术的发展,科学家可以通过测序技术来分析母体外周血中的胎儿游离DNA,这时候,无创DNA产前检测技术便从理论变成了现实。随后大量的临床试验验证了此技术,准确率高达99%以上,具有安全,无侵入性,准确率高,孕早期即可检测等特点。然而,此技术还有一定的不足,由于此技术需要对整个基因组DNA片段都进行检测,人类整个基因组的基因序列就有30多亿个碱基,对所有的这些碱基进行测序,需要测序量比较大,导致产前检测的价格比较高,不利于大规模的推广,如目前利用Illumina公司的Hiseq2000测序仪进行无创DNA产前检测,一个泳道最多能够完成12个样品,一个样品的检测价格5000多元。

发明内容

[0006] 发明目的:本发明的目的是提供一种操作简单、成本低廉、测定准确的染色体特异位点的筛选方法。
[0007] 本发明的第二目的是提供上述筛选方法在产前检测中的应用。
[0008] 技术方案:本发明提供的一种染色体特异位点的筛选方法,其特征在于:包括以下步骤:
[0009] 步骤一,染色体特异位点的初步筛选:根据美国国立生物技术信息中心(NCBI)的人类基因组序列(GRCH Build37),对待研究的一条染色体特异位点初步筛选,得20-30万个初筛位点序列,所述初筛位点序列满足以下条件:
[0010] (1)序列长度的取值范围50-70bp;
[0011] (2)GC含量在45%~55%之间;
[0012] (3)序列中不包含字符“N”;
[0013] (4)与美国国立生物技术信息中心(NCBI)的单核苷酸多态性位点库(dbSNP)进行比较,序列中不存在任何单核苷酸多态性位点(SNP);
[0014] (5)与美国国立生物技术信息中心(NCBI)的基因组变异数据库(DGV)中拷贝数变异(CNV)信息进行比较,位点不能包含在任何已知的拷贝数变异(CNV)中;
[0015] (6)位点之间在Tm值以及互补方面具有较大的兼容性;即两位点片段间不能有超过10bp的同源序列,片段间的Tm值相差在4度以内。
[0016] 步骤二,染色体特异位点的比较去除:利用一些开源的工具(如:BWA、Bowtie等)将步骤一得到的初筛位点序列与人类基因组序列(GRCH Build37)比较分析,去除在多个地方匹配的位点,仅保留在一个位点匹配的序列,得5-10万个单一匹配位点序列;
[0017] 步骤三,利用PCR引物设计方法对染色体特异位点的筛选:利用引物设计方法(如:Primer3、Primer Premier5.0、Oligo等)对步骤二中获得的单一匹配位点序列设计PCR引物,并去除不符合以下条件的单一匹配位点序列,得5000-1万个PCR引物筛选位点序列:单一匹配位点序列的PCR引物不能互补,且所有PCR引物Tm值基本一致,Tm值相差不超过
4;
[0018] 步骤四,利用实时定量PCR对PCR引物筛选位点的精筛:对步骤三中获得的PCR引物筛选位点序列混合并利用实时定量PCR反应检测验证,去除不符合以下条件的PCR引物筛选位点序列,得2000-3000个染色体特异位点:PCR引物筛选位点的扩增效率基本一致,即通过实时定量PCR绘制出的标准曲线斜率相差不超过0.2。
[0019] 步骤一中,初步筛选可利用软件完成,包括以下步骤:
[0020] (1)从人类基因组序列提取位点序列,筛选出不包含字符“N”以及GC含量在45%~55%的位点;
[0021] (2)将步骤(1)得到的位点与单核苷酸多态性位点库以及基因组变异数据库中拷贝数变异信息进行比较,筛选出不存在任何单核苷酸多态性位点和拷贝数变异信息的位点;
[0022] (3)将步骤(2)得到的位点与BWA索引数据库比较,并过滤,使位点片段之间在Tm值以及互补方面具有较大的兼容性,即两位点片段间不能有超过10bp的同源序列,片段间的Tm值相差在4度以内。
[0023] 本发明还给出了上述染色体特异位点的筛选方法在产前检测中的应用,即将步骤四获得的2000-3000个染色体特异位点中随机选择500-1000个特异位点对待测染色体进行检测。
[0024] 有益效果:本发明提供的染色体特异位点的筛选方法利用常用计算机软件在特定的一条染色体上筛选出特异位点序列,操作简单、成本低廉、筛选得到的特异位点序列数量少、特异性高。
[0025] 本发明提供的染色体特异位点的筛选方法在特定染色体上筛选出的特异位点序列可用于无创DNA产前检测,分析孕妇的胎儿患有染色体疾病的可能性。由于可测定特定染色体上的特异位点,克服了现有检测技术针对整个基因组的所有染色体进行高通量测序需要测量大量无关数据的缺陷,可显著的提高无创DNA检测的通量,从而可以降低产前检测的成本。如目前利用Illumina公司的HiSeq2000测序仪,一个泳道最多能够分析12个样品,而利用本发明以后一个泳道可以运行80-100个样品,显著的提高了检测的通量,降低了无创DNA产前检测成本,从而更加有利于无创DNA产前检测的大规模推广。

附图说明

[0026] 图1为本发明染色体特异位点的筛选方法流程图。
[0027] 图2为本发明染色体特异位点的筛选方法在产前检测中应用的流程图。

具体实施方式

[0028] 根据下述实施例,可以更好地理解本发明。然而,本领域的技术人员容易理解,实施例所描述的具体的物料配比、工艺条件及其结果仅用于说明本发明,而不应当也不会限制权利要求书中所详细描述的本发明。
[0029] 本发明所使用的试剂及软件分别为:
[0030] 试剂:
[0031] QiAamp Blood Mini Kit(Qiagen)提取DNA试剂盒;
[0032] Taq DNA聚合酶购自MBI公司;
[0033] dNTPs购自TOYOBO公司;
[0034] 引物由上海生物工程公司合成;
[0035] 荧光定量试剂盒购自Takara公司;
[0036] TruSeq DNA HT Sample Prep Kit Support(illumina)文库构建试剂盒[0037] SYBR Premix Ex Taq TM(2×) Takara公司
[0038] ROX Reference Dye(50×) Takara公司
[0039] MgCl225Mm Takara公司
[0040] PCR Forward Primer(90ng/μl) 上海生物工程公司
[0041] PCR Forward Primer(90ng/μl) 上海生物工程公司
[0042] DNA模板(20ng/μl) 提取的孕妇外周血血浆游离DNA
[0043] ddH2O 普通重蒸水
[0044] dNTP TOYOBO公司
[0045] Buffer Takara公司
[0046] 正向引物 上海生物工程公司
[0047] 反向引物 上海生物工程公司
[0048] DNA聚合酶 MBI公司
[0049] 软件:
[0050] BWA,Primer Premier5.0,自编perl脚本
[0051] 实施例1
[0052] 染色体特异位点的筛选方法,包括以下步骤:
[0053] 步骤一,染色体特异位点的初步筛选:根据美国国立生物技术信息中心(NCBI)的人类基因组序列(GRCH Build37),对待研究的一条染色体特异位点初步筛选,得20-30万个初筛位点序列,所述初筛位点序列满足以下条件:
[0054] (1)序列长度的取值范围50-70bp;
[0055] (2)GC含量在45%~55%之间;
[0056] (3)序列中不包含字符“N”;
[0057] (4)与美国国立生物技术信息中心(NCBI)的单核苷酸多态性位点库(dbSNP)进行比较,序列中不存在任何单核苷酸多态性位点(SNP);
[0058] (5)与美国国立生物技术信息中心(NCBI)的基因组变异数据库(DGV)中拷贝数变异(CNV)信息进行比较,位点不能包含在任何已知的拷贝数变异(CNV)中;
[0059] (6)位点之间在Tm值以及互补方面具有较大的兼容性;即两位点片段间不能有超过10bp的同源序列,片段间的Tm值相差在4度以内。
[0060] 其中,步骤一中,初步筛选可利用软件完成,包括以下步骤:
[0061] (1)从人类基因组序列提取位点序列,筛选出不包含字符“N”以及GC含量在45%~55%的位点;
[0062] (2)将步骤(1)得到的位点与单核苷酸多态性位点库以及基因组变异数据库中拷贝数变异信息进行比较,筛选出不存在任何单核苷酸多态性位点和拷贝数变异信息的位点;
[0063] (3)将步骤(2)得到的位点与BWA索引数据库比较,并过滤,使位点片段之间在Tm值以及互补方面具有较大的兼容性,即两位点片段间不能有超过10bp的同源序列,片段间的Tm值相差在4度以内。
[0064] 步骤二,染色体特异位点的比较去除:利用一些开源的工具(如:BWA、Bowtie等)将步骤一得到的初筛位点序列与人类基因组序列(GRCH Build37)比较分析,去除在多个地方匹配的位点,仅保留在一个位点匹配的序列,得5-10万个单一匹配位点序列;
[0065] 步骤三,利用PCR引物设计方法对染色体特异位点的筛选:利用引物设计方法(如:Primer3、Primer Premier5.0、Oligo等)对步骤二中获得的单一匹配位点序列设计PCR引物,并去除不符合以下条件的单一匹配位点序列,得5000-1万个PCR引物筛选位点序列:单一匹配位点序列的PCR引物不能互补,且所有PCR引物Tm值基本一致,Tm值相差不超过
4。;
[0066] 步骤四,利用实时定量PCR对PCR引物筛选位点精筛:对步骤三中获得的PCR引物筛选位点序列混合并检测验证,并去除不符合以下条件的PCR引物筛选位点序列,得2000-3000个染色体特异位点:PCR引物筛选位点的扩增效率基本一致,通过实时定量PCR绘制出的标准曲线斜率相差不超过0.2。
[0067] 反应体系:
[0068] 其中,荧光定量PCR反应体系为11.2μl,包括:
[0069] SYBR Premix Ex Taq TM(2×) 5μl
[0070] ROX Reference Dye(50×) 0.2μl
[0071] MgCl225Mm 0.2μl
[0072] PCR Forward Primer(90ng/μl) 0.2μl
[0073] PCR Forward Primer(90ng/μl) 0.2μl
[0074] DNA模板(20ng/μl) 2μl
[0075] ddH2O 3.4μl
[0076] 反应在ABI Prism7900荧光定量PCR仪上进行,分三个阶段,第一阶段95℃30s,1个循环;第二阶段95℃5s,62℃20s,75℃15s,35个循环;第三阶段为融解曲线:95℃15s,62℃15s,95℃15s。
[0077] 根据上述步骤分别对21、18、13号染色体特异位点筛选,每条染色体得到2000-3000个染色体特异位点。
[0078] 实施例2
[0079] 上述染色体特异位点的筛选方法在产前检测中的应用,见图1,包括以下步骤:
[0080] (1)样品制备
[0081] 抽取200位孕12周以上孕妇外周血5-10ml,其中5位孕有21三体患儿,2位孕有18三体患儿,1位孕有13三体患儿,用离心法进行血浆分离,用QiAamp Blood Mini Kit试剂盒提取血浆中游离的DNA;
[0082] (2)位点DNA片段分离
[0083] 根据实施例1获得的2000-3000个染色体特异位点,分别从21、18、13号染色体上,随机选择500-1000个特异位点序列,并设计探针,结合生物磁珠,捕获目的DNA片段;具体采取以下步骤:根据特异位点序列设计探针;将探针绑定到生物磁珠上;将提取的待测血浆中游离DNA加入到带有探针的生物磁珠中,使DNA与探针杂交;用商品化磁珠试剂盒中的清洗液洗去多余的DNA;再用试剂盒中的洗脱液将绑定的样品DNA从生物磁珠上洗脱下来
[0084] (3)目的片段扩增
[0085] 根据选择出来的位点序列结合引物设计原则进行引物设计,PCR扩增目的片段,得PCR产物。
[0086] 其中,PCR反应体系为15μl,包括:
[0087] ddH2O 10.25μl
[0088] dNTP 1.5μl
[0089] Buffer 1.5μl(含20mM镁离子缓冲液)
[0090] 20μM正向引物 0.3μl
[0091] 20μM反向引物 0.3μl
[0092] DNA聚合酶 0.15μl
[0093] 10ngDNA 1.0μl
[0094] PCR反 应 条 件:(1)94 ℃ for4min,1cycle,(2)94 ℃for30s,53 ℃ for50s,70℃for1min,32cycle,(3)72℃for7min,1cycle;在PE9600型PCR仪进行。
[0095] (4)对目的片段进行高通量测序
[0096] 将步骤(3)得到的PCR产物进行测序,可选用现有的第二代高通量测序技术,本发明采用了illumina测序平台,具体操作根据illumina测序流程进行:首先是文库制备;包括末端修饰,加A到3’端,两端加接头,选择加上接头的DNA,扩增达到合适的上样量;接着将模板杂交到flow cell上进行桥式扩增形成簇;最后对模板序列执行测序。
[0097] (5)数据统计分析
[0098] 将获得的测序结果与选择的位点进行匹配分析,分别统计21、18、13号染色体上每个位点片段数量,对每个染色体的所有位点数量求平均值。
[0099] 将样品的平均值与已知正常的样品进行比较分析,从而检测样品患有染色体疾病的可能概率。结果显示,21号染色体数目异常的有5名,18三体异常的有3名,13号染色体异常的有1名,检测21号和18号染色体的灵敏度和特异性均达到100%,检测13号染色体的灵敏度为100%,特异性达到99.5%,假阳性率为0.5%。