致病性单亲二倍体的筛查装置及存储介质和处理器转让专利

申请号 : CN201910491767.1

文献号 : CN110211630B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘晶星赵薇薇陈白雪

申请人 : 广州金域医学检验中心有限公司广州金域医学检验集团股份有限公司

摘要 :

本发明涉及一种致病性单亲二倍体的筛查装置及存储介质和处理器,属于基因检测技术领域。该筛查装置包括:数据获取模块:用于获取全外显子组测序数据;位点筛选模块:用于筛选得到预定条件的突变;LOH判断模块:用于根据上述得到的突变情况进行LOH判断;UPD判定模块:用于根据LOH判断UPD,如发生LOH的染色体数超过2条,判定为近亲关系;如发生LOH的区段为单拷贝,判定为片段缺失;其余发生LOH的区段判定为UPD。该筛查装置通过筛选出特定的突变位点,进行LOH判断并最终得到UPD的判定结果。可基于全外显子组测序的数据,在检查常规致病突变的同时提示存在致病性UPD的风险,无需额外实验和人力成本。

权利要求 :

1.一种致病性单亲二倍体的筛查装置,其特征在于,包括:

数据获取模块:用于获取全外显子组测序数据;

位点筛选模块:用于筛选得到预定条件的突变;

LOH判断模块:用于根据上述得到的突变情况进行LOH判断,当连续纯合位点数与其覆盖范围乘积大于预设值时,则判定该区间为LOH;

UPD判定模块:用于根据LOH判断UPD,当发生LOH的染色体数超过2条时,判定为近亲关系;当发生LOH的区段为单拷贝时,判定为片段缺失;其余发生LOH的区段判定为UPD;

所述预定条件的突变通过以下方法筛选得到:

筛选高质量位点:在全外显子组测序数据中筛选高质量突变位点;

除Y染色体突变:去除上述突变位点中位于Y染色体上的突变;

筛选点突变:筛选上述除Y染色体突变步骤得到突变中的点突变;

等位基因频率筛选:筛选上述点突变在群体数据库中各人种中人群等位基因频率均低于0.7的点突变位点;

突变频率筛选:去除上述点突变位点中杂合位点突变频率高于70%的位点,并且去除纯合位点突变频率低于85%的位点,即得预定条件的突变。

2.根据权利要求1所述的致病性单亲二倍体的筛查装置,其特征在于,所述筛选高质量位点步骤中,所述高质量突变位点指:通过GATK-VQSR质控、总覆盖>40X、且突变频率>

30%。

3.根据权利要求1所述的致病性单亲二倍体的筛查装置,其特征在于,所述等位基因频率筛选步骤和突变频率筛选步骤之间,还包括排除假阳性位点步骤,所述排除假阳性位点步骤为:根据Hardy-Weinberg平衡在待评估区域人群频率库中排除存在的假阳性位点。

4.根据权利要求1所述的致病性单亲二倍体的筛查装置,其特征在于,所述位点筛选模块中还包括质控单元,所述质控单元用于检测筛选得到的突变数量,当所述突变数量≥1万时,则所述质控单元提示通过;当所述突变数量<1万时,则所述质控单元提示不通过。

5.根据权利要求1所述的致病性单亲二倍体的筛查装置,其特征在于,所述LOH判断模块中,所述连续纯合位点数≥20,所述覆盖范围≥3Mbp。

6.根据权利要求5所述的致病性单亲二倍体的筛查装置,其特征在于,所述LOH判断模块中,当连续纯合位点数与其覆盖范围乘积大于200Mbp时,则判定该区间为LOH。

7.根据权利要求1所述的致病性单亲二倍体的筛查装置,其特征在于,所述UPD判定模块中,还包括致病风险判断单元,所述致病风险判断单元中,将判定为UPD的LOH区段进行印记基因比对,当所述LOH区段未覆盖印记基因或对应条带,则提示良性UPD;当所述LOH区段覆盖印记基因或对应条带时,则提示致病UPD风险。

8.一种存储介质,其特征在于,所述存储介质包括存储的程序,所述程序实现权利要求

1-7任一项所述筛查装置的功能。

9.一种处理器,其特征在于,所述处理器用于运行程序,所述程序实现权利要求1-7任一项所述筛查装置的功能。

说明书 :

致病性单亲二倍体的筛查装置及存储介质和处理器

技术领域

[0001] 本发明涉及基因检测技术领域,特别是涉及一种致病性单亲二倍体的筛查装置及存储介质和处理器。

背景技术

[0002] 基因组印记(Genomic imprinting),又称遗传印记,是通过生化途径,在一个基因或基因组域上标记其双亲来源信息的遗传学过程。这类基因称作印记基因,这类基因表达与否取决于它们所在染色体的来源(父系或母系)以及在其来源的染色体上该基因是否发生沉默(沉默机制主要为甲基化)。有些印记基因只从母源染色体上表达,而有些则只从父源染色体上表达。
[0003] 正常二倍体中,一对同源染色体分别来源于父本和母本,单亲二倍体(UniParental Disomy简称UPD)是指一对同源染色体(或染色体的部分区段)来源于同一个亲本,如果这些区段包含印记基因,则会导致基因表达紊乱。
[0004] 目前诊断UPD的方法主要有检测甲基化水平和SNP芯片法。其中,检测甲基化水平方法即检测一对同源染色体的同一段区间的甲基化水平是否一致,但是,甲基化的方法只能处理染色体局部的小片段,而且针对不同区域需要设计不同的实验,效率低速度慢,并不适用于全基因组范围的筛查。而使用SNP芯片检测是否存在连续的大片段纯合位点,又存在SNP芯片的方法成本较高的缺陷,且其靶标探针为多态性位点,无法同时检测其他的致病微小突变(点突变、微小插入缺失等)。

发明内容

[0005] 基于此,有必要针对上述问题,提供一种致病性单亲二倍体的筛查装置,采用该筛查装置进行筛查,可基于全外显子组测序的数据,在检查常规致病突变的同时提示存在致病性UPD的风险,无需额外实验和人力成本。
[0006] 一种致病性单亲二倍体的筛查装置,包括:
[0007] 数据获取模块:用于获取全外显子组测序数据;
[0008] 位点筛选模块:用于筛选得到预定条件的突变;
[0009] LOH判断模块:用于根据上述得到的突变情况进行LOH判断,如连续纯合位点数与其覆盖范围乘积大于预设值,则判定该区间为LOH;
[0010] UPD判定模块:用于根据LOH判断UPD,如发生LOH的染色体数超过2条,判定为近亲关系;如发生LOH的区段为单拷贝,判定为片段缺失;其余发生LOH的区段判定为UPD。
[0011] 全外显子测序是目前检测基因缺陷疾病最普遍的方法,可以检测致病性点突变、微小插入缺失、拷贝数变异等,是大多数此类患者的首选项目。本发明人在长期实践经验的基础上,通过创造性的实验设计和反复摸索,在全外显子测序的基础上增加一项致病性UPD的筛查,在不增加任何成本的前提下提高了诊断阳性率。
[0012] 考虑到UPD来源于一方亲本的同一条染色体的两个拷贝,因此表现为该区域所有碱基均为纯合,即杂合性丢失(loss of heterozygosity,LOH),而造成LOH的原因主要有三种:片段缺失、UPD、近亲结婚。这三种情况造成的LOH在片段大小、分布、以及临床表现上各有不同,因此可以通过检测LOH的方法来推断UPD的存在,在此理论基础之上,本发明人通过筛选出特定的突变位点,进行LOH判断并最终得到UPD的判定结果。
[0013] 对于近亲关系的判定,由于UPD发生的偶然性,同时在多条染色体上发生的概率非常小,据此可用于区分近亲结婚的情况,即发生LOH的染色体数超过2条(即大于2条)的判定为近亲结婚;对于片段缺失的判定,按照常规方式判定即可,如可结合全外显子测序拷贝数变异(CNV)分析结果进行,即参考LOH区段的测序数据覆盖深度与同批次其他样本的对比,若CNV分析提示该LOH区段为单拷贝,则判定为片段缺失;特别的,很大段的缺失一般是致死性的,如果LOH区段达到整条染色体的一半以上甚至为整条染色体,若样本来源非胚胎,基本可以排除片段缺失。
[0014] 在其中一个实施例中,所述预定条件的突变通过以下方法筛选得到:
[0015] 筛选高质量位点:在全外显子组测序数据中筛选高质量突变位点;
[0016] 除Y染色体突变:去除上述突变位点中位于Y染色体上的突变;
[0017] 筛选点突变:筛选上述除Y染色体突变步骤得到突变中的点突变;
[0018] 等位基因频率筛选:筛选上述点突变在群体数据库中各人种中人群等位基因频率均低于0.7的点突变位点;
[0019] 突变频率筛选:去除上述点突变位点中杂合位点突变频率高于70%的位点,并且去除纯合位点突变频率低于85%的位点,即得预定条件的突变。
[0020] 以上述突变进行分析,可以排除假阳性突变、体细胞突变、以及人群高频突变对LOH判定的影响,具有判定准确的优点。例如一段较大的LOH,中间掺杂有几个假阳性或体细胞的杂合突变,将会被拆成几个小的LOH,如果每个小的LOH达不到预定长度阈值(如3M),则无法识别,导致判定不准确。
[0021] 上述群体数据库包括千人基因组、ESP6500、ExAC、gnomAD等,对于各人种的分类包括东亚、南亚、非洲/非裔美洲、美洲、芬兰、非芬兰欧洲等。
[0022] 在其中一个实施例中,所述筛选高质量位点步骤中,所述高质量突变位点指:通过GATK-VQSR质控、总覆盖>40X、且突变频率>30%。
[0023] 上述GATK-VQSR质控指在GATK软件中variant quality score recalibration得到的结果为PASS;“总覆盖>40X”是指该位点上覆盖的有效reads数超过40条。上述“突变频率>30%”是指该位点上含突变碱基的reads占所有reads的比例。
[0024] 在其中一个实施例中,所述等位基因频率筛选步骤和突变频率筛选步骤之间,还包括排除假阳性位点步骤,所述排除假阳性位点步骤为:根据Hardy-Weinberg平衡在待评估区域人群频率库中排除存在的假阳性位点。所述待评估区域人群频率库指待评估个体所在地域频率库,即根据地域性特点,排除假阳性位点。
[0025] 在其中一个实施例中,所述位点筛选模块中还包括质控单元,所述质控单元用于检测筛选得到的突变数量,如所述突变数量≥1万,则所述质控单元提示通过;如所述突变数量<1万,则所述质控单元提示不通过。如筛选得到的位点数过少,太少的话连续纯合位点数不够导致统计上没有显著性。
[0026] 在其中一个实施例中,所述LOH判断模块中,所述连续纯合位点数≥20,所述覆盖范围≥3Mbp。
[0027] 在其中一个实施例中,所述LOH判断模块中,如连续纯合位点数与其覆盖范围乘积大于200Mbp,则判定该区间为LOH。例如:连续5Mbp范围都是Hom(纯合)位点,其中Hom位点数为60,60×5>200,判断该区间是LOH。
[0028] 上述200Mbp的预设值,是本发明人通过反复试验、不断测试后得到的阈值,具有判断准确,误判率低的优点。
[0029] 在其中一个实施例中,所述UPD判定模块中,还包括致病风险判断单元,所述致病风险判断单元中,将判定为UPD的LOH区段进行印记基因比对,如所述LOH区段未覆盖印记基因或对应条带,提示良性UPD;如所述LOH区段覆盖印记基因或对应条带,提示致病UPD风险。
[0030] 本发明还公开了一种存储介质,所述存储介质包括存储的程序,所述程序实现上述模块的功能。
[0031] 本发明还公开了一种处理器,所述处理器用于运行程序,所述程序实现上述模块的功能。
[0032] 与现有技术相比,本发明具有以下有益效果:
[0033] 本发明的一种致病性单亲二倍体的筛查装置,通过数据获取模块、位点筛选模块、LOH判断模块和UPD判定模块的依次分析判断,通过筛选出特定的突变位点,进行LOH判断并最终得到UPD的判定结果。可基于全外显子组测序的数据,在检查常规致病突变的同时提示存在致病性UPD的风险,无需额外实验和人力成本。

附图说明

[0034] 图1为实施例1中LOH在染色体上的分布示意图;
[0035] 图2为图1中5号和7号染色体上LOH分布放大示意图;
[0036] 图3为图1中14号、16号和19号染色体上LOH分布放大示意图;
[0037] 图4为实施例2中LOH在染色体上的分布示意图;
[0038] 图5为图4中15号染色体上LOH分布放大示意图;
[0039] 图6为实施例3中LOH在染色体上的分布示意图;
[0040] 图7为图6中5号染色体上12.57(M)LOH分布放大示意图;
[0041] 其中:图1,4,6中,横坐标为各染色体号,图下半部分为连续的纯合片段占整个染色体长度的比例,图上半部分为各染色体上突变位点的分布情况;
[0042] 图2,3,5,7的LOH放大示意图中,中间黑色线段为全外显子测序覆盖范围(exome bed),左边菱形点为检测到的杂合(Het)突变,右边五角星点为检测到的纯合(Hom)突变,右侧点状虚线段为印记区段(imprint location),其上四角点为印记基因范围(imprint gene)。

具体实施方式

[0043] 为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
[0044] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0045] 实施例1
[0046] 一种致病性单亲二倍体的筛查,采用以下装置进行,该筛查装置包括:
[0047] 数据获取模块:用于获取全外显子组测序数据;
[0048] 位点筛选模块:用于筛选得到预定条件的突变;
[0049] LOH判断模块:用于根据上述得到的突变情况进行LOH判断,如连续纯合位点数与其覆盖范围乘积大于预设值,则判定该区间为LOH;
[0050] UPD判定模块:用于根据LOH判断UPD,如发生LOH的染色体数超过2条,判定为近亲关系;如发生LOH的区段为单拷贝,判定为片段缺失;其余发生LOH的区段判定为UPD。
[0051] 以上述筛查装置按照下述方法运行程序,包括以下步骤:
[0052] 1、数据获取
[0053] 获取某例样本的全外显子组测序数据,其中突变为59312个。
[0054] 2、位点筛选
[0055] 2.1筛选高质量位点:
[0056] 在全外显子组测序数据中筛选高质量突变位点,具体为筛选通过GATK-VQSR质控、总覆盖>40X、且突变频率>30%的突变位点,在本实施例中为45260个。
[0057] 2.2除Y染色体突变:
[0058] 去除上述突变位点中位于Y染色体上的突变,得到45256个突变。
[0059] 2.3筛选点突变:
[0060] 筛选上述除Y染色体突变步骤得到突变中的点突变,得到41273个突变。
[0061] 2.4等位基因频率筛选:
[0062] 筛选上述点突变在群体数据库(千人基因组、ESP6500、ExAC、gnomAD)中各人种(东亚、南亚、非洲/非裔美洲、美洲、芬兰、非芬兰欧洲)中人群等位基因频率均低于0.7的点突变位点,得到22231个突变。
[0063] 2.5排除假阳性位点:
[0064] 根据Hardy-Weinberg平衡在待评估区域人群频率库中排除存在的假阳性位点,得到21705个突变。
[0065] 2.6突变频率筛选:
[0066] 去除上述点突变位点中杂合位点突变频率高于70%的位点,并且去除纯合位点突变频率低于85%的位点,即得预定条件的突变,21644个。
[0067] 3、LOH判断
[0068] 上述得到的位点中,如连续纯合位点数与其覆盖范围乘积大于200Mbp,则判定该区间为LOH,其中连续纯合位点数≥20,覆盖范围≥3Mbp。
[0069] 按照该标准判断,本实施例的样本中检测到5段LOH,如下表所示。
[0070] 表1.LOH区间
[0071]
[0072] 从上述结果可以看出,上述5段LOH分别位于5条染色体上。图1为这5段LOH在染色体上的分布情况,图中椭圆圈部分表示LOH区间,图2和3分别为图1中5,7,14,16,19号染色体上的LOH放大示意图。
[0073] 4、UPD判定
[0074] 由于上述5段LOH分别位于5条染色体上,据此判断为近亲结婚,排除UPD致病的可能。
[0075] 该病例经后期证实为近亲结婚后代。
[0076] 实施例2
[0077] 一种致病性单亲二倍体的筛查,以某例样本进行,采用实施例1的装置,其中:
[0078] 1、数据获取
[0079] 参照实施例1。
[0080] 2、位点筛选
[0081] 参照实施例1,得到符合预定条件的突变22210个。
[0082] 3、LOH判断
[0083] 上述得到的位点中,如连续纯合位点数与其覆盖范围乘积大于200,则判定该区间为LOH,其中连续纯合位点数≥20,覆盖范围≥3Mbp。
[0084] 按照该标准判断,本实施例的样本中检测到1段LOH,如下表所示。
[0085] 表2.LOH区间
[0086]
[0087] 从上述结果可以看出,上述LOH位于15号染色体上,长度为12.28M。图4为这段12.28M的LOH在染色体上的分布情况,图中椭圆圈部分表示LOH区间,图5为图4中15号染色体上的LOH放大示意图。
[0088] 4、UPD判定
[0089] 4.1基础判定
[0090] 由于该段LOH不符合近亲关系判定规则,不符合片段缺失规则,判定为UPD。
[0091] 4.2致病风险判断
[0092] 上述12.28M的LOH覆盖的印记基因与Prader-Willi综合征相关。
[0093] 该病例经后期证实具有Prader-Willi综合征病征。
[0094] 实施例3
[0095] 一种致病性单亲二倍体的筛查,以某例样本进行,采用实施例1的装置,其中:
[0096] 1、数据获取
[0097] 参照实施例1。
[0098] 2、位点筛选
[0099] 参照实施例1,得到符合预定条件的突变22947个。
[0100] 3、LOH判断
[0101] 上述得到的位点中,如连续纯合位点数与其覆盖范围乘积大于200,则判定该区间为LOH,其中连续纯合位点数≥20,覆盖范围≥3Mbp。
[0102] 按照该标准判断,本实施例的样本中检测到两段LOH,如下表所示。
[0103] 表3.LOH区间
[0104]
[0105] 从上述结果可以看出,上述LOH位于5号染色体上,长度分别为93.6M和12.36M。图6为其在染色体上的分布情况,图中椭圆圈部分表示LOH区间,图7分别为图6中12.57M的LOH放大示意图。
[0106] 注:该例样本同时做了CMA基因芯片检测(芯片型号为CytoScan HD),检测结果为chr5:2667631-99572420和chr5:166974594-180520810两段LOH,与本方法得到结果基本一致。
[0107] 4、UPD判定
[0108] 4.1基础判定
[0109] 由于该段LOH不符合近亲关系判定规则,不符合片段缺失规则,判定为UPD。
[0110] 4.2致病风险判断
[0111] 上述长度为93.6M的LOH区间覆盖了印记基因ERAP2,RNU5D-1,但目前与之相关的研究较少,不能明确为致病原因,但可提示相关风险。
[0112] 实施例4
[0113] 一种致病性单亲二倍体的筛查,以送检本单位的12444例全外显子测序数据为基础,中筛查致病性UPD,按照实施例1的方法进行筛查,检测到LOH为1018例,排除近亲结婚之后余800例,进行分析后发现覆盖了印记基因的为142例,其中部分案例经回访后证实与筛查结果相符度大于95%。
[0114] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0115] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。