复杂疾病遗传风险参数检测系统转让专利

申请号 : CN201510917832.4

文献号 : CN105740597B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 曹志敏张伟薄联锋赵东杨玲祖党校

申请人 : 西安时代基因健康科技股份有限公司

摘要 :

本发明提供了一种新的复杂疾病遗传风险参数检测系统,最大程度地解决了Navigenics公司的CGR综合风险分析模型中所存在的问题。该复杂疾病遗传风险参数检测系统,包括1)本地数据库;2)用户信息输入模块;3)数据获取模块,用于根据输入的疾病检测需求关联特定的微效位点集合,从所述本地数据库中获取该微效位点集合中各个微效位点具有的基因型及其对应的OR值、群体分布频率;4)风险参数计算模块,主要计算式为本发明的复杂疾病遗传风险参数检测系统输出的结果更接近于真实情况,更加科学、合理。

权利要求 :

1.复杂疾病遗传风险参数检测系统,包括

1)本地数据库;存储有以下已知的数据:

1.1)若干个微效位点集合,每一个微效位点集合与一种疾病相关联;

1.2)每一个微效位点集合中各个微效位点具有的基因型及其对应的OR值;

1.3)每个微效位点的每种基因型的群体分布频率;

2)用户信息输入模块,用于接收用户输入的疾病检测需求和相应的所有微效位点的基因型;

3)数据获取模块,用于根据输入的疾病检测需求关联特定的微效位点集合,从所述本地数据库中获取该微效位点集合中各个微效位点具有的基因型及其对应的OR值、群体分布频率;

4)风险参数计算模块,主要计算式为

①以上计算式所列CGR值代表检测结果;

②以上计算式所列∑为求和公式代表字母;

③以上计算式所列n为某种疾病关联的微效位点集合的微效位点个数;

④以上计算式所列sORi为用户输入的受测个体各位点的具体OR值;

⑤以上计算式所列pORi=ORnAA×PnAA+ORnAB×PnAB+ORnBB×PnBB,即各位点群体的加权平均OR值;

⑥以上⑤的pORi的表达式中AA、AB、BB为群体中各位点的基因型;

⑦以上⑤的pORi的表达式中PnAA、PnAB、PnBB为每种基因型的群体分布频率;

⑧-n+1为计算综合遗传风险的调整参数。

2.根据权利要求1所述的复杂疾病遗传风险参数检测系统,其特征在于:所述本地数据库具有数据更新和补充功能。

3.根据权利要求1所述的复杂疾病遗传风险参数检测系统,其特征在于:该复杂疾病遗传风险参数检测系统还包括用户提示模块;当用户仅输入疾病检测需求时,所述数据获取模块关联到特定的微效位点集合,先通过所述用户提示模块输出该微效位点集合信息,以便用户补充提供受测个体相应各个微效位点的基因型。

说明书 :

复杂疾病遗传风险参数检测系统

技术领域:

[0001] 本发明属于医疗检测技术领域,具体涉及一种复杂疾病遗传风险的检测工具或设备。背景技术:
[0002] 复杂疾病又称多基因病,指相关性状的表型没有明显的孟德尔遗传模式,遗传机理较为复杂,不是由一对基因控制,而是受多个基因与环境因素的协同调控,在医学上难以治愈、严重影响人民群众身体健康的常见的慢性疾病。为积极做好慢性病预防控制工作,遏制我国慢性病快速上升的势头,保护和增进人民群众身体健康,促进经济社会可持续发展,根据我国慢性病流行和防治情况,2012年5月8日,前卫生部、国家发展改革委和科技部等15部委联合印发了《中国慢性病防治工作规划(2012-2015年)》(以下简称“规划”)。规划指出“影响我国人民群众身体健康的常见慢性病主要有心脑血管疾病、糖尿病、恶性肿瘤、慢性呼吸系统疾病等。慢性病发生和流行与经济社会、生态环境、文化习俗和生活方式等因素密切相关。伴随工业化、城镇化、老龄化进程加快,我国慢性病发病人数快速上升,现有确诊患者2.6亿人,是重大的公共卫生问题。慢性病病程长、流行广、费用贵、致残致死率高。慢性病导致的死亡已经占到我国总死亡的85%,导致的疾病负担已占总疾病负担的70%,是群众因病致贫返贫的重要原因,若不及时有效控制,将带来严重的社会经济问题”。
[0003] 自人类基因组计划完成后,基因组与健康事业的发展势如破竹,研究成果大量涌现,一个个与疾病相关的致病基因及变异被不断确定,使得我们通过基因检测对复杂疾病进行早期患病风险评估并在此基础上进行早期个性化健康干预成为可能。如何将海量基因组信息迅速转化为具体的疾病预防实践,这里的核心内容即遗传分析。复杂疾病的遗传分析主要指运用特定的分析方法和模型,对个体遗传基因检测数据进行分析整理,并根据一定的风险判定标准,对疾病易感性和易患性及患病风险进行评估,从而对疾病进行早期预警;同时,根据相应的评估结果为客户提供基因导向下的具体的健康管理建议,为疾病的早期干预、指导人们有针对性的开展个性化的疾病预防、改善健康状况、提高生活质量提供科学依据。作为遗传分析核心技术之一的遗传风险计算模型的创建,对复杂疾病的风险评估,早期预警及防治的重要性自是不言而喻。
[0004] 复杂疾病是在众多因素(如多个基因、一个基因的多个突变、环境以及未知的随机因素)共同作用下发生的。对于复杂疾病而言,每个基因影响有限,单独不足以致病,对遗传性状或疾病形成的作用是微小的,称为微效基因。多对微效基因其表型作用的累加则会形成明显的表型效应。复杂疾病就是在多个微效基因与个别主效基因的共同作用,以及环境因素的协同作用下而发生的。对复杂疾病易感基因在疾病的发生发展过程中所起到的作用或所占权重的分析属于遗传分析范畴,通过运用适当的遗传分析模型可以计算出疾病的遗传风险,从而为疾病的预防、诊断和治疗提供科学的参考依据。
[0005] 单基因病可通过有效的系谱分析,调查三代以上所有成员相关遗传信息等方式判定疾病的遗传方式,最终确定遗传风险。基于单体型的遗传分析方法可用于研究多区域单体型在疾病中的共同作用,目前主要有Clark’s algorithm;Expectation-Maximisation;algorithm(EM算法)和Bayesian等。多基因病的遗传分析方法目前主要有基因组多位点的关联分析法、主基因与多基因混合遗传分析法、利用Bayes概率模型预测遗传病复发风险(家族病史)等方法,但对于普通人群多基因复杂疾病遗传风险的计算方法和计算模型甚为少见。目前国际上应用较广的复杂疾病遗传风险分析模型为美国Navigenics公司的CGR综合风险计算模型,国内在多基因复杂疾病的遗传风险计算方法和计算模型领域尚属空白。
[0006] 美国Navigenics公司的CGR综合风险分析模型是以CGR值为主导的疾病风险评估模型,依据受检者的疾病相关检测位点基因分型结果,进行疾病风险评估。CGR是综合疾病相关的所有SNP位点基因型患病风险与相应位点的同民族人群之平均患病风险比值的乘积计算得来的,CGR呈现患病风险与同民族人群之平均患病风险相比的结果。例如高血压的检测位点有n个,每个位点有三种基因型:AA、AB、BB,对应发病风险为or1、or2、or3,对应基因型频率为fre1、fre2、fre3。用SGR(single-site genetic risk)值表示疾病中单位点的遗传风险;用SOR表示个体各检测位点具体的风险值,则各位点的遗传风险分别为[0007] SGR1=SOR1/(or11×fre11+or21×fre21+or31×fre31),SGR2=SOR2/(or12×fre12+or22×fr e22+or32×fre32),以此类推,SGRn=SORn/(or1n×fre1n+or2n×fre2n+or3n×n 1 2 nfre3),该个体高血压的综合发病风险CGR=SGR×SGR×……×SGR 。由于应用CGR综合发病风险模型计算式所有CGR值时使用SGR累积的计算模式,很容易出现指数增长效应,结果异常大,往往出现CGR值1000或更大的计算结果,通过CGR值与疾病的发病率相乘来计算个体遗传角度的发病率,最很容易导致个体发病率大于100%或者更高的结果,然而实际上由于复杂疾病的遗传度(遗传因素在疾病发生中所贡献的程度)最高的也才80%左右,所以遗传因素决定的个体的复杂疾病发病风险不可能高于100%。
[0008] 复杂疾病遗传风险由多个微效位点及少数主效位点的累加共同作用所决定。对于某种复杂疾病而言,可能存在众多微效位点,每个位点最终计算所得的单位点发病风险SGR值可能介于1-3之间。由于Navigenics的CGR综合风险计算模型存在指数效应,如一种疾病有10个或者更多的微效位点,单位点发病风险SGR值为2,则通过该模型计算所得CGR值为1024或者更高,结果因位点数的增多而呈指数增长,若某一疾病的发病率为0.1%,最终遗传风险判定结果为该个体的发病率大于1024×0.1%,结果为102.4%,应用CGR综合风险分析模型很容易出现与现实情况相背离的结果,最终无法解释。
发明内容:
[0009] 本发明提供了一种新的复杂疾病遗传风险参数检测系统,最大程度地解决了Navigenics公司的CGR综合风险分析模型中所存在的上述问题,使复杂疾病的遗传发生风险结果更接近于真实情况,结果更加科学、合理。
[0010] 本发明的解决方案如下:
[0011] 复杂疾病遗传风险参数检测系统,包括
[0012] 1)本地数据库;存储有以下已知的数据:
[0013] 1.1)若干个微效位点集合,每一个微效位点集合与一种疾病相关联;
[0014] 1.2)每一个微效位点集合中各个微效位点具有的基因型及其对应的OR值;
[0015] 1.3)每个微效位点的每种基因型的群体分布频率;
[0016] 注:数据库中所涉及的基因型及每种基因型在各个民族中的频率均来自于美国国立生物技术信息中心NCBI(National Center for Biotechnology Information),该生物信息中心是国际公认的顶级生物信息中心,参考网址:http://www.ncbi.nlm.nih.gov/[0017] 2)用户信息输入模块,用于接收用户输入的疾病检测需求和相应的所有微效位点的基因型;
[0018] 3)数据获取模块,用于根据输入的疾病检测需求关联特定的微效位点集合,从所述本地数据库中获取该微效位点集合中各个微效位点具有的基因型及其相应的OR值、群体平均OR值、群体分布频率;
[0019] 4)风险参数计算模块,主要计算式为
[0020]
[0021] ①模型所列CGR值代表检测结果;
[0022] ②模型所列∑为求和公式代表字母;
[0023] ③模型所列n为某种疾病关联的微效位点集合的微效位点个数;
[0024] ④模型所列sORi为用户输入的受测个体各位点的具体OR值;
[0025] ⑤模型所列pORi=ORnAA×PnAA+ORnAB×PnAB+ORnBB×PnBB,即各位点群体的加权平均OR值;
[0026] ⑥模型所列AA、AB、BB为群体中各位点的基因型;
[0027] ⑦模型所列PnAA、PnAB、PnBB为每种基因型的群体分布频率;
[0028] ⑧-n+1为计算综合遗传风险的调整参数。
[0029] 上述本地数据库还具有数据更新和补充功能,可定期更新全球最新的疾病与基因关联相关信息,从而对数据库进行数据更新和补充,以达到数据信息的最新和最优组合。
[0030] 该复杂疾病遗传风险参数检测系统还可以设置一个用户提示模块;当用户仅输入疾病检测需求时,所述数据获取模块关联到特定的微效位点集合,先通过所述用户提示模块输出该微效位点集合信息,以便用户补充提供受测个体相应各个微效位点的基因型。
[0031] 本发明具有以下技术效果:
[0032] 充分利用数据资源,检测结果更接近于真实情况,更加科学、合理地确定复杂疾病的遗传风险,为疾病的早期知道、早期预防、早期干预等提供参考依据。
[0033] 本发明作为医疗设备,检测效率高,可以在医院、专业体检机构等推广使用。具体实施方式:
[0034] 本发明的复杂疾病遗传风险参数检测系统中建立的计算模型如下:
[0035]
[0036] 参数说明:
[0037] ①.模型所列CGR值为复杂疾病的遗传风险。
[0038] ②.模型所列∑为求和公式代表字母。
[0039] ③.模型所列n为某种疾病微效位点个数。
[0040] ④.模型所列sORi为受测个体各位点的具体OR值
[0041] ⑤.模型所列pORi=ORnAA×PnAA+ORnAB×PnAB+ORnBB×PnBB(各位点群体的加权平均OR值)
[0042] ⑥.模型所列AA、AB、BB为群体中各位点的基因型。
[0043] ⑦.模型所列PnAA、PnAB、PnBB为每种基因型的群体分布频率。
[0044] 模型拆解:
[0045]
[0046] 即:
[0047]
[0048] 模型解释:
[0049] 复杂疾病遗传风险计算模型是基于复杂疾病特殊的遗传方式而构建的,目前针对复杂疾病的遗传方式学说主要有两种理论体系,一种为位点微效累加理论;另一种为主要位点决定理论。
[0050] 微效位点累加理论认为每一对基因对遗传性状或复杂疾病的作用都是微小的,疾病的发生是多个基因多个位点变异所引起的表型效应,即加性效应。主要位点决定论则认为主要基因位点的变异在疾病的发生过程中起着决定的作用,而次要基因位点则起着相关或辅助的作用。不论哪一种疾病风险理论体系,在评估疾病与基因或者位点的关联强度时基本都是以OR值为基础的。
[0051] OR值又称比值比、优势比,是流行病学研究中病例对照研究中的一个常用指标。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。在疾病与基因关联性研究中所列的暴露因素或未暴露因素指个体是否是某个基因突变型或野生型的携带者,用病例组中突变基因携带者人数与野生型携带者人数的比值除以正常对照组中突变基因携带者人数与野生型携带者人数的比值得到OR值,其大小代表单个位点或少数几个位点对疾病的贡献大小,因为OR计算方式的局限性,其大小所能代表的意义局限在与正常个体的比较上。
[0052] 群体中既存在正常个体又存在患病个体,既存在突变基因型携带者又存在野生基因型携带者,因此与群体相比较,个体的遗传风险需要用个体携带基因型的遗传风险(sOR)除以群体平均的遗传风险(pOR)得到的。对于一个位点而言,在人群中会存在三种基因型,每种基因型都会有其与之对应的OR值。sOR为受测个体实际测得的基因型所对应的OR值(来自病例对照、GWAS或者META分析等权威研究文献),pOR通过三种基因型和其对应频率的乘积累加得到,即pOR=ORAA×PAA+ORAB×PAB+ORBB×PBB,pOR代表群体平均风险。其中各种基因型的频率可通过大样本的研究、NCBI或hapmap等国际权威数据库中获取。用sOR除以pOR可得到受测个体与群体相比较在某位点上所具有的遗传风险,用公式表示为 即单位点遗传风险。由于复杂疾病受到多个基因的多个位点共同作用决定,对N个位点而言,通过累加的方式 计算得出个体与群体比较某复杂疾病的综合遗传风险,即 (式中-n+1为计算综合遗传风险的调整参数)。
[0053] 实施例一 判定某个体出血性脑卒中的发病风险
[0054] 2013国家医改重大专项“脑卒中高危人群筛查和干预项目”中期数据分析显示,我国脑卒中标化患病率约为1.82%。我们依据权威文献建立的中国人群复杂疾病基因数据库中,与出血性脑卒中发生发展相关的易感位点有10个,分别为SNP1、SNP2、SNP3、SNP4、SNP5、SNP6、SNP7、SNP8、SNP9、SNP10,受测个体的OR值分别为2.1、2.3、3.4、1.7、1.9、2.0、3.2、3.1、2.3、2.7。群体平均风险pOR分别为1.11、1.13、1.02、1.23、1.31、1.24、0.96、1.22、
1.21、1.11。应用复杂疾病的遗传风险计算模型 计算所得CGR
值为11.51,结合出血性脑卒中发病率1.82%,可算出该个体遗传综合风险为正常人群的
11.51倍,从遗传角度讲,该个体的发病风险=群体发病率×CGR=1.82%×11.51,即该个体患出血性脑卒中的遗传风险概率为20.95%。
[0055] 若应用Navigenics公司的CGR综合风险分析模型最终结果CGR值1607.39,该个体遗传发病风险将是群体发病率×CGR=1.82%*1607.39,即该个体患出血性脑卒中的遗传风险概率为2925.45%,结果明显背离个体疾病自然状态下的患病概率。
[0056] 实施例二 判定某个体肥胖的发病风险
[0057] 中国疾病控制中心数据显示我国肥胖的发病率约为9.9%。我们依据权威文献建立的中国人群复杂疾病基因数据库中,与肥胖相关的易感位点有5个,分别为SNP1、SNP2、SNP3、SNP4、SNP5,受测个体各个位点的OR值分别为2.9、1.8、1.5、1.3、1.7。群体平均风险pOR分别为1.12、1.03、1.07、1.13、1.01。应用复杂疾病的遗传风险计算模型计算所得CGR值为4.47,结合出血性脑卒中发病率9.9%,可算出该个体遗传综合风险为正常人群的4.47倍,从遗传角度讲,该个体的发病风险=群体发病率×CGR=9.9%×4.47,即该个体患肥胖的遗传风险概率为44.25%。
[0058] 若不应用模型来计算疾病发生的遗传风险,用一个位点的检测结果来评估个体的患病的遗传风险显然是不科学的,因为单个位点所能解释的只是单位点突变情况下,疾病发生的遗传风险,而对于复杂疾病而言,这种疾病风险评估方式显然存在明显的错误。
[0059] 实施例三 判定某个体冠心病的发病风险
[0060] 2012中国肿瘤登记年报数据显示我国肺癌的发病率约为36.21/10万。我们依据权威文献建立的中国人群复杂疾病基因数据库中,与肥胖相关的易感位点有6个,分别为SNP1、SNP2、SNP3、SNP4、SNP5、SNP6,受测个体各个位点的OR值分别为1.6、1.4、1.5、1.6、2.1、1.7。群体平均风险pOR分别为1.1、1.04、1.09、0.93、1.01、0.97。应用复杂疾病的遗传风险计算模型 计算所得CGR值为4.73,结合出血性脑卒中发
病率36.21/10万,可算出该个体遗传综合风险为正常人群的4.73倍,从遗传角度讲,该个体的发病风险=群体发病率×CGR=36.21/10万×4.73,即该个体患肺癌的遗传风险概率为
0.17%。
[0061] 若不应用模型来计算疾病发生的遗传风险,简单的用乘积或者求和的方式求取平均结果,最终得到的数据虽然与应用模型计算的结果差异不是很明显,但对结果的解释则为某个体的遗传风险是所有正常人群的多少倍,而冠心病的患病率是建立在对整体人群(包含患病人群和未患病人群)患病情况的基础上的,因此,应用复杂疾病遗传风险模型来计算疾病的遗传风险是更为精确的。
[0062] 基于21世纪初人类基因组计划的顺利完成,复杂疾病的遗传分析技术得以发展,但该项技术尚处在起步阶段,相关分析计算模型仍处在探索之中。目前还没有全球公认的复杂疾病遗传风险计算模型,有鉴于此,我们依据目前科学界对复杂疾病遗传因素参与发病机制的基本认知(微效和主效基因累加共同作用),创建了复杂疾病遗传风险计算模型。除前面列举的某个体出血性脑卒中的发病风险等检测外,对其他常见复杂疾病遗传风险均可利用本发明进行检测,且相比于Navigenics公司的CGR模型结果更加科学、合理。本发明不仅有助于在现有基因组医学发现的基础上,更科学、更合理地确定复杂疾病的遗传风险,为疾病的早期预防、干预等提供参考依据,还将在复杂疾病的防治、降低医疗费用、促进人民群众的健康水平等方面产生难以估量的社会效益和经济效益。