一种与结直肠癌早期筛查和辅助诊断相关的增强子功能位点及其应用转让专利

申请号 : CN202210779427.0

文献号 : CN115786501B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 田剑波缪小平应聘婷李艳敏朱颖鲁泽群

申请人 : 武汉大学

摘要 :

本发明涉及一种与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物及其应用,该标志物为rs4810856。经大规模人群数据以及生物功能学实验证实,rs4810856位点具有增强子功能调控活性,且携带rs4810856[C]基因型的个体更易与转录因子ZEB1结合,从而影响该区域与靶基因的启动子的染色质交互作用,促进靶基因PREX1、CSE1L及STAU1的表达水平,进而促进癌细胞增殖,导致个体结直肠癌患病风险增加。通过针对rs4810856进行巧妙的引物和探针设计,依靠荧光定量PCR,即可对正常人群进行rs4810856危险位点的检测,从而鉴别结直肠癌的高危人群,辅助结直肠癌患者的诊断。

权利要求 :

1.增强子功能位点rs4810856的检测试剂在制备结直肠癌辅助诊断试剂盒中的应用。

说明书 :

一种与结直肠癌早期筛查和辅助诊断相关的增强子功能位点

及其应用

技术领域

[0001] 本发明涉及基因工程及肿瘤医学领域,具体涉及一种与结直肠癌早期筛查有关的增强子功能位点及其应用。

背景技术

[0002] 结直肠癌是常见的消化道恶性肿瘤之一,严重威胁了人类生命健康。其发病率位列我国恶性肿瘤第三位,且随着国家经济水平的发展以及居民生活方式和饮食结构的改变,我国结直肠癌的发病率和死亡率均呈现逐年上升的趋势,结直肠癌已成为中国乃至全世界亟待解决的重大公共卫生问题。目前,针对结直肠癌最有效的筛查方法是粪便隐血检查(F I T)结合结肠镜检查。但是,这种方法也存在着检出率不高、患者接受度不高等问题。因此,如果能更为精准的针对结直肠癌的高危个体开展早期筛查和早期诊断,则可以使得患者的接受度更高,且能为国家节省大量的医疗支出。
[0003] 近年来,以分子遗传学为基础的个体化筛查方案,成为结直肠癌高危人群筛查的重点。单核苷酸多态性(Single Nucleotide Polymorphism,SNP)是最常见的遗传变异,是一类已被证实与肿瘤发生风险相关的分子标志物,其反映了个体的遗传背景差异。迄今为止,GWAS已鉴定出了100多个结直肠癌遗传易感SNP,在GWAS所发现的易感SNP中,超过90%的位于基因组非编码区域可通过参与基因表达调控来影响结直肠癌风险。GWAS飞速发展的同时,在基因组高通量检测技术的支持下,研究者发现非编码区域中包含着许多顺式调控元件(Cis‑Regulatory Element,CRE),比如启动子、增强子及绝缘子等,它们可在基因表达调控中发挥巨大的作用,从而影响肿瘤的发生和易感性。随着表观组学以及三维基因组学的兴起,研究者对CREs的特征以及作用机制也越来越明了。例如,通过染色质转座酶可及性测序(Assay for Transposase Accessible Chromatin with high‑throughput sequencing,ATAC‑seq)技术发现CREs常富集在染色质开放区域,裸露的DNA使其更容易与转录因子(Transcription Factor,TF)结合,进而参与基因表达调控。通过染色质免疫共沉淀测序(Chromatin Immunoprecipitation and high‑throughput sequencing,ChIP‑seq)技术发现CREs附近的核小体常具有特定的组蛋白修饰,包括H3K27ac、H3K27me3及H3K4me1。
这些特殊的表观遗传标记可以帮助预测CREs的活性状态,并对不同的CREs加以区分。此外,随着高通量染色质三维构象捕获技术(High‑Through Chromosome Conformation Capture,Hi‑C)的不断成熟。研究者发现染色质可通过三维折叠形成环状结构(Chromatin Looping),从空间上拉近了增强子和启动子的距离,进而激活基因转录。
[0004] 然而,如何有效地整合这些多组学数据,从而在全基因组范围内寻找CREs并确定它们的靶基因,始终是一个巨大的挑战。近期,为优化对CREs及其靶基因的预测,研究者们开发了接触活动模型(Activity‑by‑Contact Model,ABC model),通过整合代表调控元件活性状态(Activity)的ATAC‑seq和H3K27ac ChIP‑seq信号峰及代表染色质接触频率(Contact)的Hi‑C数据,在全基因组范围内鉴定出活性增强子元件并确定其所调控的靶基因。ABC模型基于简单的生化概念,即远端候选调控元件对靶基因表达的定量影响应该取决于它作为增强子的活性(Activity),加权于它与靶基因启动子的染色质接触频率(Contact);而一个候选调控元件对靶基因表达的相对贡献值取决于该元件的定量影响除以靶基因所在区域内所有候选调控元件的总定量影响。该模型最终得到每个增强子‑靶基因对应的ABC分数,以评估增强子对基因表达调控效应的强弱。

发明内容

[0005] 本发明的目的在于克服现有技术的不足,提供一种结直肠癌早期筛查和辅助诊断的增强子功能SNP位点标志物及其应用。
[0006] 本发明解决上述技术问题的技术方案如下:
[0007] 一种与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物,该标志物为rs4810856。
[0008] 所述的与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物的特异性扩增引物,所述rs4810856的特异性扩增引物序列为SEQ ID NO:1和SEQ ID NO:2。
[0009] 所述的与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物的特异性探针,所述rs4810856的探针序列为SEQ ID NO:3和SEQ ID NO:4。
[0010] 所述的与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物的检测试剂在制备结直肠癌辅助诊断试剂盒中的应用。
[0011] 一种结直肠癌早期筛查和辅助诊断试剂盒,用于检测外周血DNA中的rs4810856。
[0012] 所述的结直肠癌早期筛查和辅助诊断试剂盒,包括上述SNP标志物的特异性扩增引物和SNP标志物的特异性探针。
[0013] 本发明的有益效果为:从分子生物学及基因诊断水平上,提供了筛选结直肠癌高危人群的技术方法。此方法基于我们前期通过ABC模型整合多组学技术显示,rs4810856位点与中国人群的结直肠癌易感性相关。通过针对rs4810856位点进行巧妙的引物和探针设计,能够依靠荧光定量PCR,即可对正常人群进行rs4810856危险位点的检测,从而鉴别结直肠癌的高危人群,辅助结直肠癌早期筛查及诊断,该技术方法设计巧妙、简易可行、结果准确可靠,可在各级医院进行推广,对于评估结直肠癌的患病风险提供了帮助,有助于临床上对该类人群进行结直肠癌筛查和早期干预。

附图说明

[0014] 图1ABC图谱法鉴定结直肠癌易感位点rs4810856的流程图;
[0015] 图2增强子位点rs4810856人群筛选及潜在调控效果示意图;
[0016] 图3基于SNP位点rs4810856的结直肠癌风险预测模型AUC曲线图;
[0017] 图4为rs4810856双荧光素酶报告基因实验结果示意图;
[0018] 图5为rs4810856基因型对靶基因PREX1、CSE1L和STAU1表达水平的调控示意图;
[0019] 图6 CRISPR/Cas9构建SW480和HCT116细胞中rs4810856单核苷酸突变示意图;
[0020] 图7 rs4810856位点影响结直肠癌细胞增殖能力示意图;
[0021] 图8靶基因PREX1、CSE1L及STAU1过表达对结直肠癌细胞系增殖能力的影响示意图;
[0022] 图9靶基因PREX1、CSE1L及STAU1过表达对裸鼠皮下成瘤的影响示意图。

具体实施方式

[0023] 以下对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0024] 本发明解决上述技术问题的技术方案如下:
[0025] 一种与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物,该标志物为rs4810856。
[0026] 所述rs4810856的特异性扩增引物序列为SEQ ID NO:1和SEQ ID NO:2。
[0027] 所述与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物的特异性探针,所述rs4810856的探针序列为SEQ ID NO:3和SEQ ID NO:4。
[0028] 所述与结直肠癌早期筛查和辅助诊断相关的增强子功能位点标志物的检测试剂在制备结直肠癌辅助诊断试剂盒中的应用。
[0029] 一种结直肠癌早期筛查和辅助诊断试剂盒,该试剂盒用于检测外周血DNA中的rs4810856。
[0030] 所述试剂盒包括上述SNP标志物的特异性扩增引物和上述SNP标志物的特异性探针。
[0031] 具体地说,本发明解决问题的技术方案包括:(1)建立统一标准的标本库和数据库:以标准操作程序(SOP)采集符合标准的受试者血液样本,系统收集完整的人口学资料和临床资料。(2)基因型检测:选择结直肠癌病例和健康对照,利用ABC模型结合ATAC‑seq、CHIP‑seq、RNA‑se、Hi‑C等多组学,更精准的找到与结直肠癌发病相关的SNP标志物rs4810856(3)对筛选出的阳性关联标志物,在独立的大人群样本中进行验证,以判断其关联的稳定性。(4)结直肠癌辅助诊断试剂盒的研制:根据结直肠癌病例和健康对照中基因型分布频率有显著差异的遗传标志物开发早期筛查及辅助诊断试剂盒。
[0032] 具体来说本发明的研究的实验方法主要包括以下内容:
[0033] 首先,我们从华中科技大学附属同济医院收集由结直肠癌外科手术切除的10例新鲜结直肠癌组织样本。10例样本均分别进行了ATAC‑seq、H3K27ac ChIP‑seq以及RNA‑seq实验。我们利用ABC模型系统整合ATAC‑seq、H3K27acChIP‑seq、RNA‑seq及Hi‑C组学数据,Hi‑C实验数据由ENCODE数据库下载获得,综合考虑增强子活性以及与靶基因启动子的染色质交互作用对基因表达的影响,进而在全基因组范围内鉴定增强子元件及其调控的靶基因,绘制出增强子‑靶基因映射图谱。以ABC分数≥0.02作为显著性阈值,共鉴定出26,877个显著性的ABC增强子SNPs位点,具体流程如图1所示。
[0034] 接着,我们从dbGaP数据库中下载了欧洲人群三个结直肠癌GWAS数据集,合并数据后共包含17,789名结直肠癌病例和19,951名对照样本。基本人口学特征如表1所示。基于非条件Logistic回归模型,并在校正年龄和性别混杂因素后,我们计算鉴定出的ABC增强子SNPs与结直肠癌易感性的关联,并由此绘制曼哈顿图,结果如图2中A图所示。在计算过程中,我们以P值<0.05作为显著性阈值,共鉴定出4,847个与结直肠癌风险相关的ABC增强子SNPs。其中,我们发现rs4810856所在的增强子区域:chr20:48682097‑48683408,具有最强的基因表达调控效应,并可同时调控三个靶基因:PREX1、CSE1L及STAU1,结果如图2中B图所示。病例对照研究结果表明,携带rs4810856风险基因型的个体,在欧洲人群样本中,结直肠‑5癌的患病风险分别较正常人增加4%(OR=1.04,95%CI:1.01‑1.08,P=3.68×10 )。
[0035] 表1.研究中采用的欧洲人群和中国人群结直肠癌患者和正常对照的基本资料[0036]
[0037] 表2.欧洲人群样本rs4810856结直肠癌风险关联分析结果
[0038]
[0039] 同时,从中国北京武汉两地区共募集了具有完整病历资料的6,024例结直肠癌患者和10,022例无肿瘤病史的正常对照,对这些人进行了基因分型。患者经组织病理学确诊,无年龄限制;正常对照无肿瘤病史,经体检无肿瘤体征。同时收集了研究对象的性别、年龄、吸烟和饮酒等信息。每个研究对象均知情同意参加本研究并捐献2ml外周静脉血,用于分离制备淋巴细胞基因组DNA。基本人口学特征如表1所示。
[0040] 我们将两地募集到的人群样本用于两阶段人群验证,通过运用非条件logistic回归模型对两个阶段人群样本分别计算SNP位点rs4810856与结直肠癌易感性的关联,并校正性别、年龄、吸烟和饮酒情况。中国人群两阶段病例对照分析结果显示,携带rs4810856[C]风险基因型的个体,结直肠癌的患病风险分别增加30%和14%(OR=1.30,95%CI:1.12‑‑4 ‑41.49,P=2.72×10 ;OR=1.14,95%CI:1.05‑1.22,P=3.76×10 )。为加强病例对照研究的检验效能,合并两阶段的样本,检验rs4810856与结直肠癌易感性的关联。发现中国人群病例对照研究结果与欧洲人群结直肠癌样本的结果一致,携带rs4810856[C]风险基因型的‑7
个体罹患结直肠癌的风险增加16%(OR=1.16,95%CI:1.10‑1.23,P=9.74×10 ),详细结果见表3。
[0041] 表3.中国人群样本rs4810856结直肠癌风险关联分析结果
[0042]
[0043] *采用Logistic回归模型计算,校正性别、年龄、吸烟和饮酒情况。
[0044] 前期大样本人群关联分析结果显示该位点是结直肠癌风险位点,因此我们用这一风险SNP位点建立了结直肠癌的风险预测模型。我们构建了一个公式,综合考虑SNP的三种基因型和性别、年龄、吸烟及饮酒情况。其中,对于SNP基因分型,野生纯合型=“1”,杂合型=“2”,突变纯合型=“3”;对于性别,男性为“1”,女性为“0”;对于年龄,大于或等于60岁为“1”,小于60岁为“0”。分析时以多因素logistic回归系数β为权重,得到基于rs4810856分型危险评分的公式如下:
[0045] 中国人群危险评分=(0.1064×性别的评分)+(‑0.0121×年龄的评分)+(0.2015×吸烟评分)+(‑0.1129×饮酒评分)+(‑0.0648×rs8100241分型的评分)。
[0046] 欧洲人群危险评分=(‑0.1889×性别的评分)+(‑0.0296×年龄的评分)+(‑0.0437×rs8100241分型的评分)
[0047] 通过绘制AUC曲线,可得该模型曲线下面积在欧洲人群和中国人群分别为0.591和0.561,结果如图3所示。
[0048] 为在功能上解析rs4810856标志物的结直肠癌风险关联,探索了该SNP位点影响结直肠癌发生发展的作用机制。
[0049] 首先,我们通过报告基因试验,验证了rs4810856所在区域的增强子功能调控功能。将包含rs4810856不同等位基因的DNA片段正向或反向构建于报告基因质粒载体,并分别与内部对照质粒pRL‑SV40共转染SW480和HCT116两种人结直肠癌细胞系,随后检测双荧光素酶基因表达情况,并比较不同组别间的相对荧光素酶活性差异。我们发现无论DNA片段插入方向如何,含有rs4810856[C]等位基因的重组质粒的报告基因活性均显著高于pGL3‑Promoter空载组,表明目的位点所在DNA片段具有增强子活性。相较于rs4810856[C]基因型组,rs4810856[T]基因型组的报告基因活性显著下降。以上实验结果表明rs4810856所在区域具有增强子活性,且该位点rs4810856[C]的增强子的转录激活效应比rs4810856[T]更强,结果如图4所示。eQTL分析结果显示,具有增强子活性的rs4810856位点在人群样本CRC组织中与靶基因PREX1、CSE1L和STAU1表达水平的密切相关,结果如图5所示。
[0050] 为深入探究rs4810856单碱基基因编辑以及靶基因对结直肠癌细胞增殖的影响,我们分别进行了细胞增殖实验、克隆形成实验和体内裸鼠皮下成瘤等实验。细胞增殖实验中,我们用CRISPR/Cas9构建SW480和HCT116细胞中rs4810856单核苷酸突变型细胞系作为实验模型,研究rs4810856位点对结直肠癌细胞恶性表型的影响,构建过程见图6所示。与rs4810856[T]细胞系相比,携带rs4810856[C]细胞系的细胞增殖能力明显更强,结果如图7所示。然后,我们以PREX1、CSE1L及STAU1分别过表达和联合过表达的稳转细胞系作为实验模型,检测靶基因对结直肠癌细胞增殖能力的影响。实验发现与空白对照组细胞相比,靶基因分别过表达的细胞系克隆形成能力明显增强,并且靶基因联合过表达细胞系的克隆形成能力最强,结果如图8所示。在体内裸鼠皮下成瘤实验中,我们用稳转细胞系注射至裸鼠的皮下,定期测量不同组别间裸鼠皮下荷瘤的体积大小,并绘制皮下成瘤生长曲线。我们发现与注射空白对照细胞系的裸鼠相比,注射PREX1、CSE1L及STAU1分别过表达细胞系的裸鼠,其皮下肿瘤的体积明显增大,而注射靶基因联合过表达细胞系的裸鼠,其皮下肿瘤的体积最大,结果如图9所示。细胞表型和体内裸鼠皮下成瘤实验结果均显示PREX1、CSE1L及STAU1可发挥一定的协同效应促进结直肠癌细胞的增殖。
[0051] 结合上述大规模人群分析、生物信息学分析以及严谨的实验设计,结果显示位于染色质20q13.13增强子区域的rs4810856风险位点,使得相对于携带rs4810856[T]的个体,携带[C]等位基因变异的个体显著增加结直肠癌患病风险。且其作用机制是通过影响rs4810856与转录因子ZEB1的结合能力,从而抑制其所在区域与靶基因的启动子的染色质交互作用,进而降低靶基因PREX1、CSE1L及STAU1的表达水平,抑制AKT信号通路激活,降低结直肠癌发病风险。因此,位于非编码区的rs4810856风险位点与结直肠癌患病风险存在着密切的关系,有望在临床上应用,辅助结直肠癌的早期诊断,早期发现结直肠癌高危人群。
[0052] 实验方法:
[0053] 1.外周血DNA提取:
[0054] 我们用常规酚‑氯仿法提取DNA,具体步骤如下:
[0055] 1)取约3ml抗凝血,室温下5,000×g离心15min,弃去上层,留约0.3ml血细胞。加入0.5ml新鲜配制的终浓度为20μg/ml RNA酶的抽提缓冲液,混匀后37℃孵育1h。
[0056] 2)加入终浓度为100μg/ml的蛋白酶K,混匀后37℃孵育过夜。
[0057] 3)每管加入Tris缓冲液平衡的酚(pH=7.0)0.7ml,充分混匀,室温下8,000×g离心15min。
[0058] 4)将上层液体转移到另一1.5ml离心管中,加入等体积酚–氯仿(1:1)0.7ml,充分混匀15min;室温8,000×g离心15min。
[0059] 5)将上层液体转移到另一干净1.5ml离心管中,加入10%体积的10M乙酸铵溶液,加入2倍体积预冷的无水乙醇,–20℃静置2h以沉淀DNA。
[0060] 6)沉淀出的DNA用75%乙醇洗涤,12,000×g离心15min后弃上层液体;再用75%乙醇洗涤,12,000×g离心15min后弃上层液体。
[0061] 7)将管倒立在吸水纸上,待乙醇挥发干净后,每管加适当TE缓冲液,4℃放置一周后保存于–20℃备用。
[0062] 2.基因分型
[0063] 采用的分型平台为TaqMan基因分型技术(ABI 7900HT Real Time PCR system,Applied Biosystems),5μl PCR反应体系如表4所示:
[0064] 表4.TaqMan基因分型体系配制
[0065]
[0066] 反应条件为:95℃预变性10min,然后95℃15sec和60℃1min共45个循环,降温到4℃。
[0067] 反应所用的引物和探针如下:
[0068] rs4810856引物:
[0069] 正向引物:caatacctctcattagttatgcctaagc(SEQ ID NO:1)
[0070] 反向引物:cagggaggagtctggtattttttaata(SEQ ID NO:2)
[0071] rs4810856探针:
[0072] 正向探针:fam‑acctaccatctttc‑mgb(SEQ ID NO:3)
[0073] 反向探针:vic‑acctaccacctttc‑mgb(SEQ ID NO:4)
[0074] 3.细胞增殖实验
[0075] 1)细胞计数
[0076] 在进行CCK‑8增殖实验和克隆形成实验前,需要进行细胞计数,保证不同组别孔板中接种数量合适的细胞。本实验使用血球计数板进行细胞计数,该计数板由两个大小相同的计数池组成,每个计数池又由九个1mm×1mm方格组成,每个方格可容纳0.1mm3液体体积。具体计数步骤如下:
[0077] ①将已培养一段时间后的细胞孔板进行消化,获得细胞悬液,尽量充分混匀打散细胞。
[0078] ②对计数板进行消毒后盖上盖玻片。
[0079] ③吸取10mL细胞悬液,沿玻片边缘缓慢滴入计数板中,保证盖玻片和计数板中间无气泡产生)。
[0080] ④放置1min,于显微镜下观察计数板,并按如下原则对四角的方格进行计数:a.对于压住方格边线的细胞,只对上边和左边的细胞进行计数,b.若细胞成团块状,则计为一个细胞。
[0081] ⑤细胞悬液浓度=四角方格内细胞总数/4×104个/mL。
[0082] 2)CCK‑8细胞增殖实验
[0083] 本研究采用CCK‑8试剂盒(Dojindo,日本)检测结直肠癌细胞增殖能力。
[0084] ①吸取细胞悬液100mL并按计数浓度稀释至细胞量为2,000左右,接种于96孔板中。
[0085] ②在24h、48h、72h和96h四个时间点进行细胞活性检测。向每个孔内加入10mL CCK‑8试剂,上下左右摇晃以轻柔混匀,放回细胞培养箱继续培养1.5h。
[0086] ③使用酶标仪进行吸光度测定,波长设定为450nm,根据四个时间点的吸光度值绘制不同实验组别的细胞增殖曲线以比较其差异。
[0087] 3)克隆形成实验
[0088] ①在转染细胞36h后,进行细胞计数并稀释至合适浓度。在6孔板的每孔中加入2mL细胞悬液使得细胞量为1,000左右,继续培养2周左右。
[0089] ②期间每2~3天观察细胞形态并更换新鲜培养基。若显微镜下观察到细胞克隆时,可进行固定染色。
[0090] ③从培养箱中取出6孔板,吸去废液并缓慢加入PBS清洗2次。吸净每孔PBS后加入2mL甲醇溶液,于室温放置30min。
[0091] ④吸去甲醇后加入0.25%结晶紫溶液,避光放置30min进行染色。
[0092] ⑤染色完成后,吸去孔中废液,并用双蒸水清洗孔板直至视野清晰,进行拍照保存。
[0093] 综上,我们通过运用ABC模型,系统的整合了ATAC‑seq、CHIP‑seq、RNA‑seq以及Hi‑C在内的多组学数据,由此构建了结直肠癌增强子‑靶基因映射图谱。进一步地,结合欧洲人群和中国人群大样本的病例对照研究、生物学实验等技术方法。发现,位于20q13.13区域的rs4810856具有最强的基因表达调控效应,相比于rs4810856[T]个体,携带[C]等位基因的个体结直肠癌患病风险显著增加。机制上,我们发现位于染色质20q13.13区域的rs4810856可同时调控三个靶基因:PREX1、CSE1L及STAU1。且rs4810856[C]与转录因子ZEB1的结合能力比rs4810856[T]携带者强,从而影响其所在区域与靶基因的启动子的染色质交互作用,进而促进靶基因PREX1、CSE1L及STAU1的表达水平,且影响AKT信号通路激活,从而促进结直肠癌发病风险。因此,位于非编码区的rs4810856变异与结直肠癌患病风险有着密切的关系,有望在临床上应用,辅助结直肠癌的早期诊断,早期发现结直肠癌患者。
[0094] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。