一种针对cfDNA的简化甲基化测序方法及应用转让专利

申请号 : CN201811300568.X

文献号 : CN109295188B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 许明炎屈宏越张晓妮方文

申请人 : 深圳海普洛斯医学检验实验室

摘要 :

本发明提供了一种针对cfDNA的简化甲基化测序方法及应用,所述方法包括以下步骤:(1)采用识别TpA位点的限制性内切酶酶切cfDNA;(2)将酶切的cfDNA连接接头序列,构建cfDNA测序文库。本发明采用能够识别TpA位点的限制性内切酶酶切cfDNA,将富含T/A的片段切割为长度较小的片段,而富含C/G的片段不被切割,使得富含C/G的片段和富含T/A的片段长度具有较大的差异,实现了在cfDNA中有效富集含有CpG位点的片段的目的,有利于增加CpG位点的测序深度,提高检测的灵敏性。

权利要求 :

1.一种简化甲基化测序的文库构建方法,其特征在于,所述方法包括以下步骤:(1)采用识别TpA位点的限制性内切酶酶切cfDNA;

(2)将酶切的cfDNA连接接头序列,构建cfDNA测序文库。

2.根据权利要求1所述的方法,其特征在于,步骤(1)所述cfDNA来源于体液。

3.根据权利要求2所述的方法,其特征在于,所述体液包括血清、血浆、尿液或唾液中的任意一种或至少两种的组合。

4.根据权利要求1所述的方法,其特征在于,步骤(1)所述限制性内切酶包括MseI限制性内切酶。

5.根据权利要求1所述的方法,其特征在于,步骤(1)所述酶切的体系相对于20μL体系包括:MseI限制性内切酶2U,1×MseI缓冲液,cfDNA>20ng,双蒸水定容至20μL。

6.根据权利要求1所述的方法,其特征在于,步骤(1)所述酶切的条件为:35~38℃孵育

0.8~1.2h,62~68℃处理15~25min。

7.根据权利要求6所述的方法,其特征在于,步骤(1)所述酶切的条件为:37℃孵育1h,

65℃处理20min。

8.根据权利要求1所述的方法,其特征在于,步骤(2)所述接头序列经甲基化和/或羟甲基化处理。

9.根据权利要求8所述的方法,其特征在于,步骤(2)所述接头序列具体为:连接于酶切后的cfDNA的3’端的接头序列的5’端含有磷酸化基团,连接于酶切后的cfDNA的5’端接头序列的3’端含有T粘性末端。

10.一种以非疾病诊断为目的的简化甲基化测序方法,其特征在于,所述方法包括以下步骤:(1)采用如权利要求1-9任一项所述的方法构建文库;

(2)对步骤(1)所述文库进行重亚硫酸盐处理;

(3)PCR扩增文库;

(4)筛选cfDNA的甲基化片段。

11.根据权利要求10所述的方法,其特征在于,步骤(3)所述PCR的模板为重亚硫酸盐处理的文库。

12.根据权利要求10所述的方法,其特征在于,步骤(3)所述PCR的引物为连接于酶切后的cfDNA两端的接头序列。

13.根据权利要求10所述的方法,其特征在于,步骤(4)所述筛选采用磁珠法进行。

14.根据权利要求13所述的方法,其特征在于,所述磁珠法包括第一次筛选和第二次筛选。

15.根据权利要求14所述的方法,其特征在于,所述第一次筛选中磁珠和PCR扩增产物的体积比为0.8~0.9。

16.根据权利要求15所述的方法,其特征在于,所述第一次筛选中磁珠和PCR扩增产物的体积比为0.85。

17.根据权利要求14所述的方法,其特征在于,所述第二次筛选中磁珠和PCR扩增产物的体积比为1.0~1.1。

18.根据权利要求17所述的方法,其特征在于,所述第二次筛选中磁珠和PCR扩增产物的体积比为1.05。

19.根据权利要求10-18任一项所述的方法,其特征在于,所述方法包括以下步骤:(1)采用MseI限制性内切酶酶切从体液中提取的cfDNA,所述酶切的体系相对于20μL体系为:MseI限制性内切酶2U,1×MseI缓冲液,cfDNA>20ng,双蒸水定容至20μL,酶切的条件为:37℃1h,65℃20min;

(2)将酶切的cfDNA连接经甲基化和/或羟甲基化处理的接头序列,构建cfDNA测序文库,其中,连接于酶切后的cfDNA的3’端接头序列的5’端含有磷酸化基团,连接于酶切后的cfDNA的5’端接头序列的3’端含有T粘性末端;

(3)对步骤(2)所述文库进行重亚硫酸盐处理;

(4)以重亚硫酸盐处理的文库为模板,以连接于酶切后的cfDNA两端的接头序列为引物,进行PCR扩增文库;

(5)采用磁珠法筛选cfDNA的甲基化片段,第一次筛选中磁珠和PCR扩增产物的体积比为0.85,第二次筛选中磁珠和PCR扩增产物的体积比为1.05。

说明书 :

一种针对cfDNA的简化甲基化测序方法及应用

技术领域

[0001] 本发明属于分子生物学领域,涉及一种针对cfDNA的简化甲基化测序方法及应用,尤其涉及一种针对cfDNA的简化甲基化测序的文库构建方法及应用。

背景技术

[0002] 循环DNA(cell-free circulating DNA,cfDNA)是存在于血液、尿液等体液中游离的DNA碎片,通常来源于机体的正常细胞、癌细胞或胎儿,具有非侵入性的特点,在肿瘤治疗、产前诊断和器官移植等领域具有广泛的应用。
[0003] 基因组DNA的甲基化,是指在DNA甲基转移酶的作用下,硫腺苷甲硫氨酸作为甲基供体,将一个甲基添加到胞嘧啶的5’-碳原子上,形成5’-甲基胞嘧啶。CpG位点指G在DNA链中紧随C的核苷酸对,主要位于基因的启动子区或转录起始位点,易发生甲基化修饰。位于基因启动子区的CpG的甲基化修饰具有抑制基因转录的作用,形成基因稳定的沉默,其甲基化密度与基因转录的抑制程度有关。基因组DNA的异常甲基化与癌症、衰老、老年痴呆等多种疾病密切相关,是表观遗传学的重要研究内容之一。研究表明,肿瘤组织中存在着基因组普遍的低甲基化和局部区域的过甲基化现象,原癌基因的去甲基化和抑癌基因的过甲基化,造成了癌基因的激活和抑癌基因的失活,从而导致了癌症的发生。
[0004] 简化甲基化测序(Reduced Representation Bisulfite Sequencing,RRBS)是检测基因甲基化的常用方法。该方法主要通过特异性识别CpG位点的限制性内切酶,如MspI(C↓CGG),对基因组DNA进行酶切,产生不同长度的DNA片段,其中,长度为40-220bp的DNA片段上富集了CpG位点,而长度超过220bp的DNA片段则富集了A或T碱基,通过片段筛选去除长度较大的片段,仅保留40-220bp的DNA片段,从而富集基因组DNA序列中潜在的甲基化位点。上述方法配合文库制备、重亚硫酸盐转化和片段富集等步骤进行二代测序,在单碱基分辨率下分析DNA的甲基化水平,不仅减少了数据量,而且增加了CpG位点的测序深度。
[0005] 然而,现有的RRBS仅适用于基因组DNA而无法适用于cfDNA,原因为cfDNA的片段长度约160bp,经MspI酶切后,富集有CpG位点和富集有A或T碱基的片段的长度十分接近,均处于40-180bp左右,无法采用现有的片段筛选方法进行有效区分,因此无法有效富集CpG位点。
[0006] CN105002567A公开了无参考基因组高通量简化甲基化测序文库的构建方法,对样品基因组酶切和加A,获得5’末端具有磷酸化修饰和3’粘性末端A的DNA片段,将其与含有不同条形码序列的甲基化接头相连;连接产物分为两组,一组进行PCR扩增,另一组经重亚硫酸盐转化后再扩增,获得两组含有相同条形码、仅在无甲基化的胞嘧啶位点不同的扩增产物序列;两组PCR产物分别混合,选择相同的特定长度片段序列进行低循环PCR,扩增产物分别分离纯化构建高通量简化甲基化测序文库。该方法通量高、成本低、序列一致,无需参考基因组,在大量无参考基因组或参考基因组组装不全物种的DNA甲基化表观遗传学研究领域应用前景广阔。该方法采用甲基化不敏感型限制性内切酶对样品基因组进行酶切,是为了保证样品间酶切片段的一致性,有利于应用于无参考基因组的DNA甲基化检测,但不适用于小片段cfDNA的甲基化检测。
[0007] 因此,有必要提供一种适用于小片段cfDNA的甲基化检测方法。

发明内容

[0008] 针对现有技术的不足,本发明提供了一种针对cfDNA的简化甲基化测序方法及应用,所述方法可以有效富集CpG位点,从而提高CpG位点的测序深度和检测灵敏性。
[0009] 为达此目的,本发明采用以下技术方案:
[0010] 第一方面,本发明提供了一种简化甲基化测序的文库构建方法,所述方法包括以下步骤:
[0011] (1)采用识别TpA位点的限制性内切酶酶切cfDNA;
[0012] (2)将酶切的cfDNA连接接头序列,构建cfDNA测序文库。
[0013] 在人类全基因组序列中,TTAA酶切位点的数量是CCGG位点的8倍以上,其两端的碱基60%以上为A或T,同时在CpG富集区TTAA的数量很少。本发明采用能够识别TpA位点的限制性内切酶酶切cfDNA,将富含T/A的片段切割为长度较小的片段,而富含C/G的片段不被切割,使得富含C/G的片段和富含T/A的片段长度具有较大的差异,实现了在cfDNA中有效富集含有CpG位点的片段的目的,有利于增加CpG位点的测序深度,提高检测的灵敏性。
[0014] 优选地,步骤(1)所述cfDNA来源于体液。
[0015] 优选地,所述体液包括血清、血浆、尿液或唾液中的任意一种或至少两种的组合。
[0016] 优选地,步骤(1)所述限制性内切酶包括MseI限制性内切酶。
[0017] 本发明中,MseI限制性内切酶特异性识别TTAA序列的TpA位点,将TTAA切割为T↓TAA。
[0018] 优选地,步骤(1)所述酶切的体系相对于20μL体系包括:MseI限制性内切酶2U,1×MseI缓冲液,cfDNA>20ng,双蒸水定容至20μL。
[0019] 优选地,步骤(1)所述酶切的条件为:35~38℃孵育0.8~1.2h,62~68℃处理15~25min,例如可以是35℃孵育1.2h、62℃处理25min,37℃孵育1h、65℃处理20min,或38℃孵育0.8h、68℃处理15min。
[0020] 优选地,步骤(1)所述酶切的条件为:37℃孵育1h,65℃处理20min。
[0021] 优选地,步骤(2)所述接头序列经甲基化和/或羟甲基化处理。
[0022] 本发明中,接头序列中的所有胞嘧啶经过甲基化和/或羟甲基化处理,从而不能被重亚硫酸盐修饰,不会对测序结果造成干扰。
[0023] 本发明中,可根据测序平台的不同选择适用于不同测序平台的接头序列,优选为Illumina接头序列。
[0024] 优选地,步骤(2)所述接头序列具体为:连接于酶切后的cfDNA的3’端接头序列的5’端含有磷酸化基团,连接于酶切后的cfDNA的5’端接头序列的3’端含有T粘性末端。
[0025] 本发明中,酶切后的cfDNA的5’端为磷酸化修饰的平末端,3’端加A后获得3’A粘性末端,因此配合的接头序列具体为:连接于酶切后的cfDNA的3’端接头序列的5’端含有磷酸化基团,连接于酶切后的cfDNA的5’端接头序列的3’端含有T粘性末端。
[0026] 第二方面,本发明提供了一种简化甲基化测序方法,所述方法包括以下步骤:
[0027] (1)采用如第一方面所述的方法构建文库;
[0028] (2)对步骤(1)所述文库进行重亚硫酸盐处理;
[0029] (3)PCR扩增文库;
[0030] (4)筛选cfDNA的甲基化片段。
[0031] 优选地,步骤(3)所述PCR的模板为重亚硫酸盐处理的文库。
[0032] 优选地,步骤(3)所述PCR的引物为连接于酶切后的cfDNA两端的接头序列。
[0033] 本发明中,PCR采用的引物与连接于酶切后的cfDNA两端的接头序列相同。
[0034] 优选地,步骤(4)所述筛选采用磁珠法进行。
[0035] 优选地,所述磁珠法包括第一次筛选和第二次筛选。
[0036] 优选地,所述第一次筛选中磁珠和PCR扩增产物的体积比为0.8~0.9,例如可以是0.8、0.81、0.82、0.83、0.84、0.85、0.86、0.87、0.88、0.89或0.9,优选为0.85。
[0037] 优选地,所述第二次筛选中磁珠和PCR扩增产物的体积比为1.0~1.1,例如可以是1.0、1.01、1.02、1.03、1.04、1.05、1.06、1.07、1.08、1.09或1.1,优选为1.05。
[0038] 本发明中,采用两轮磁珠法进行片段筛选,第一次筛选后去除了含有T/A的短片段,第二次筛选后富集含有C/G的长片段,实现了cfDNA中CpG位点的有效富集。
[0039] 作为优选技术方案,本发明提供了一种简化甲基化测序方法,所述方法包括以下步骤:
[0040] (1)采用MseI限制性内切酶酶切从体液中提取的cfDNA,所述酶切的体系相对于20μL体系为:MseI限制性内切酶2U,1×MseI缓冲液,cfDNA>20ng,双蒸水定容至20μL,酶切的条件为:37℃1h,65℃20min;
[0041] (2)将酶切的cfDNA连接经甲基化和/或羟甲基化处理的接头序列,构建cfDNA测序文库,其中,连接于酶切后的cfDNA的3’端接头序列的5’端含有磷酸化基团,连接于酶切后的cfDNA的5’端接头序列的3’端含有T粘性末端;
[0042] (3)对步骤(2)所述文库进行重亚硫酸盐处理;
[0043] (4)以重亚硫酸盐处理的文库为模板,以连接于酶切后的cfDNA两端的接头序列为引物,进行PCR扩增文库;
[0044] (5)采用磁珠法筛选cfDNA的甲基化片段,第一次筛选中磁珠和PCR扩增产物的体积比为0.85,第二次筛选中磁珠和PCR扩增产物的体积比为1.05。
[0045] 第三方面,本发明提供了一种如第二方面所述的简化甲基化测序方法得到的cfDNA甲基化片段。
[0046] 第四方面,本发明提供了一种如第一方面所述的简化甲基化测序的文库构建方法和/或如第二方面所述的简化甲基化测序方法在cfDNA甲基化检测中的应用。
[0047] 与现有技术相比,本发明具有如下有益效果:
[0048] (1)本发明的方法利用能够识别TpA位点的限制性内切酶,如MseI(T↓TAA)酶切cfDNA,将富含T/A的片段切割为长度较小的片段,而富含C/G的片段不被切割,使得富含C/G的片段和富含T/A的片段长度具有较大的差异,克服了现有的RRBS不适用于cfDNA、不能有效富集cfDNA中CpG位点的缺陷;
[0049] (2)采用本发明的方法进行cfDNA测序,测序结果的Q30、GC含量、测序深度和CpG位点深度相较于RRBS均具有显著提高;
[0050] (3)本发明的方法兼具ctDNA检测和DNA简化甲基化测序的优势,不仅具有非侵入性的特点,而且有效富集了cfDNA中的CpG位点,提高了CpG位点的测序深度和检测灵敏性。

附图说明

[0051] 图1为现有的RRBS和本发明方法的原理对比示意图。

具体实施方式

[0052] 为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
[0053] 实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
[0054] 实施例1血浆中cfDNA的提取
[0055] cfDNA的提取可以采用现有技术中的任何标准手段进行。本实施例从血浆中提取cfDNA,抽取的外周血在两个小时内进行处理,分离得到血浆:
[0056] (1)将抽取的外周血在4℃条件下1,600g离心10min,将得到的上清转移入新的2.0mL离心管中;
[0057] (2)4℃下16,000g离心10min去除残余细胞,得到血浆,保存于-80℃冰箱中或干冰中;
[0058] (3)采用核酸提取或纯化试剂盒(宁波市重鼎生物技术有限公司),从分离的血浆中提取得到cfDNA。
[0059] 实施例2 cfDNA的酶切和纯化
[0060] (1)采用MseI限制性内切酶对提取的cfDNA进行酶切,酶切体系如表1所示:
[0061] 表1 MseI酶切体系
[0062]试剂名称 体积
10×MseI酶切缓冲液 2μL
MseI限制性内切酶(10U/μL) 0.2μL
cfDNA ~30ng
双蒸水 补齐至20μL
[0063] 将配置好的酶切体系置于37℃下孵育1h进行酶切反应,随后在65℃下处理20min终止反应;
[0064] (2)将得到的酶切产物利用QIAquick Nucleotide Removal Kit(Qiagen)试剂盒进行纯化,得到纯化的酶切产物,用于cfDNA的文库构建。
[0065] 实施例3 cfDNA的文库构建
[0066] 利用NEB Multiplex Oligos for (NEB)试剂盒构建cfDNA的甲基化文库:
[0067] (1)对酶切后的cfDNA进行末端修复,并在cfDNA 3’端连接A碱基;
[0068] (2)在cfDNA片段两端连接Illumina甲基化接头,其中,3’端接头的5’端含有磷酸化基团,5’端接头的3’端含有T粘性末端;
[0069] (3)利用磁珠法纯化cfDNA甲基化文库。
[0070] 实施例4重亚硫酸盐处理和文库扩增
[0071] (1)将得到的cfDNA文库采用ZYMO EZ DNA Methylation Gold Kit试剂盒进行重亚硫酸盐处理和纯化;
[0072] (2)利用PCR,将Index标签连接到cfDNA的甲基化文库上,进行文库扩增,扩增体系如表2所示:
[0073] 表2 PCR扩增体系
[0074]试剂名称 体积
cfDNA甲基化文库 30μL
NEBNext通用PCR引物 2.5μL
NEBNext Index引物 2.5μL
dNTP(10mM) 1μL
5×EpiMark Hot Start Taq缓冲液 10μL
EpiMark Hot Start Taq酶(2U/μL) 0.25μL
双蒸水 补齐至50μL
[0075] PCR循环条件为:95℃30s;95℃15s,61℃30s,68℃30s,18个循环;68℃5min,保存于4℃。
[0076] 实施例5片段筛选
[0077] 利用磁珠法对得到的PCR产物进行两次片段筛选,具体步骤如下:
[0078] (1)向PCR产物中加入42.5μL磁珠(0.85×),待富含T/A碱基的小片段连接到磁珠上后,吸取90μL上清至新的EP管中;
[0079] (2)加入10μL磁珠(1.05×),回收文库得到富含C/G碱基的大片段cfDNA。
[0080] 对比例1
[0081] 采用MspI限制性内切酶对提取的cfDNA进行切割后,采用与实施例3-5相同的方法进行cfDNA的文库构建、重亚硫酸盐处理和文库扩增、以及片段筛选。
[0082] 数据结果
[0083] 图1所示为本发明的方法与常规RRBS的比较:对于长度约为166bp的cfDNA,常规的RRBS采用特异性识别CpG位点的限制性内切酶,如MspI(C↓CGG),对cfDNA进行酶切,需要保留的富集CpG位点的cfDNA片段的长度为40-166bp,而不需要保留的富集A或T碱基的cfDNA片段的长度为126-166bp,两种片段的长度十分接近,无法采用现有的片段筛选方法进行有效区分;本发明的方法采用特异性识别TpA位点的限制性内切酶,如MseI(T↓TAA),对cfDNA进行酶切,需要保留的富集CpG位点的cfDNA片段的长度为80-166bp,而不需要保留的富集A或T碱基的cfDNA片段的长度为40-80bp,两种被切割片段的长度差异较大,可以采用现有的片段筛选方法进行有效区分,适用于cfDNA中CpG位点的有效富集。
[0084] 对采用本发明的方法得到的cfDNA进行数据分析,并与采用RRBS(对比例1)得到的cfDNA进行比较,测序结果如表3所示:
[0085] 表3结果分析
[0086]
[0087] 可以看出,采用本发明的方法得到的cfDNA的GC含量、测序深度和CpG位点深度明显高于采用RRBS得到的结果,本发明的针对cfDNA的简化甲基化测序方法有效富集了含有CpG位点的片段,增加了CpG位点的测序深度,提高了检测的灵敏性。
[0088] 综上所述,本发明的方法利用能够识别TpA位点的限制性内切酶,如MseI(T↓TAA)酶切cfDNA,将富含T/A的片段切割为长度较小的片段,而富含C/G的片段不被切割,使得富含C/G的片段和富含T/A的片段长度具有较大的差异,克服了现有的RRBS不适用于cfDNA、不能有效富集cfDNA中CpG位点的缺陷;采用本发明的方法进行cfDNA测序,测序结果的Q30、GC含量、测序深度和CpG位点深度相较于RRBS均具有显著提高;本发明的方法兼具ctDNA检测和DNA简化甲基化测序的优势,不仅具有非侵入性的特点,而且有效富集了cfDNA中的CpG位点,提高了CpG位点的测序深度和检测灵敏性。
[0089] 申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。