一种甲基化DNA的高通量测序方法及其应用转让专利

申请号 : CN201080067524.2

文献号 : CN102971434B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王燕叶明芝韩旭张秀清孙中生

申请人 : 中国科学院心理研究所深圳华大基因科技有限公司

摘要 :

本发明涉及一种甲基化DNA的高通量测序方法及其应用,具体而言本发明提供了将甲基化DNA免疫共沉淀,重复序列去除和亚硫酸氢盐处理三者结合的甲基化DNA的高通量测序方法,通过本发明的方法减小了测序文库大小,降低了测序成本。

权利要求 :

1.用于甲基化DNA的测序的建立甲基化DNA文库的方法,包括以下步骤:A)DNA样品的片段化;

B)将A)得到的片段化DNA的末端与可剪切的辅助接头连接;

C)富集甲基化的DNA片段;

D)去除C)得到的单链DNA片段中的含中度、高度重复序列的片段;

E)通过亚硫酸氢盐处理将D)得到的产物中未甲基化的胞嘧啶碱基转化为尿嘧啶碱基;

F)将E)得到的单链DNA通过引物进行扩增以获得双链DNA;G)去除可剪切的辅助接头。

2.一种甲基化DNA的测序方法,包括以下步骤:

A)DNA样品的片段化;

B)将A)得到的片段化DNA的末端与可剪切的辅助接头连接;

C)富集甲基化的DNA片段;

D)去除C)得到的产物中的中度,高度重复序列;

E)将D)得到的产物中未甲基化的胞嘧啶碱基转化为尿嘧啶碱基;

F)将E)得到的单链DNA通过引物进行扩增以获得双链DNA;G)去除可剪切的辅助接头;

H)对G)中获得的双链DNA进行测序。

3.权利要求2的方法,还包括将H)步骤的测序结果与样品DNA的序列或参考序列进行比对,确认甲基化胞嘧啶碱基的个数和位置信息。

4.权利要求1或2或3的方法,其中步骤A)包括:a)将基因组DNA片段化成为DNA片段;

b)将a中得到的DNA片段末端修复以获得具有平末端的DNA片段;

c)将b中得到的DNA片段的3’末端加上A碱基。

5.权利要求1的方法,其中步骤G)进一步包括:对不具有辅助接头的DNA进行末端修复,对经末端修复的DNA连接测序接头以获得甲基化DNA文库。

6.权利要求1或2或3的方法,其中步骤G)通过在辅助接头和/或引物中设计限制性酶切识别位点来实现。

7.权利要求6的方法,其中,步骤B)中辅助接头与片段化DNA连接的一端为连接末端,另一端为非连接末端,辅助接头选自下述a-h中的至少一种:a为不含酶切位点,非连接端为一条链突出结构,连接端为平末端;

b为含酶切位点,非连接端为一条链突出结构,连接端为平末端;

c为不含酶切位点,非连接端为树杈结构,连接端为平末端;

d为含酶切位点,非连接端为树杈结构,连接端为平末端;

e为不含酶切位点,非连接端为一条链突出结构,连接端为粘末端;

f为含酶切位点,非连接端为一条链突出结构,连接端为粘末端;

g为不含酶切位点,非连接端为树杈结构,连接端为粘末端;

h为含酶切位点,非连接端为树杈结构,连接端为粘末端;

步骤B)中的辅助接头,步骤F)中的引物和步骤G)中切割酶的设计和组合应用选自下述(I)-(VI)中的至少一种:(I)当辅助接头为a和c时,引物设计成互补于经过E)转化的辅助接头的序列,且在5’末端额外连接有限制性内切酶的识别位点,所述的限制性内切酶的识别位点位于引物上,并保证该酶的切割位点位于辅助接头与待测DNA连接点的上下游5bp的范围内;当进行步骤G)时,采用针对所设计的限制性内切酶的酶切位点的酶进行单酶切;

(II)当辅助接头为b和d时,在辅助接头中靠近辅助接头与待测DNA连接点的上游5bp内位置设计酶切位点,该酶切位点需符合以下三个特点:1)该酶切位点至少包含一个甲基化胞嘧啶;2)酶切位点内不含有非甲基化的胞嘧啶;3)该酶切位点不含有CpG二核苷酸位点;引物设计成与经过E)转化的辅助接头互补的序列,当进行步骤G)时,采用针对所设计的甲基化的酶切位点进行切割的酶进行单酶切;

(III)当辅助接头为e和g时,辅助接头和引物的设计与a、c方案相同,不同处在于与待测DNA片段连接方式不同:a、c连接方式为“T-A”连接,e和g为粘性末端连接;(IV)当辅助接头为f和h时,辅助接头和引物的设计与b、d方案相同,不同处在于与待测DNA片段连接方式不同:b、d连接方式为“T-A”连接,f和h为粘性末端连接;(V)辅助接头设计同b、d接头设计,进一步在辅助接头中靠近辅助接头与待测DNA连接点的上游20-30bp内位置设计酶切位点,该酶切位点同时满足以下四点:1)该酶切位点至少包含一个甲基化胞嘧啶;2)酶切位点内不含有非甲基化的胞嘧啶;3)该酶切位点不含有CpG二核苷酸位点;4)该酶的切割位点位于辅助接头与待测DNA连接点的上、下游5bp内;

在引物设计成与经过E)转化的辅助接头互补的序列,当进行步骤G)时,采用针对所设计的甲基化的酶切位点进行切割的酶进行单酶切;(VI)是(V)和b、d、f、h的组合,通过调整辅助接头的长度使两个酶切位点重合,该方案可以使用双酶切去除辅助接头;在引物设计成与经过E)转化的辅助接头互补的序列,当进行步骤G)时,采用针对所设计的甲基化的酶切位点进行切割的酶进行双酶切。

8.权利要求7的方法,其中在(II)中,在所述引物5’端设计另外一个酶切位点,通过调整辅助接头的长度使两个酶切位点重合;当进行步骤G)时,采用针对所设计的限制性内切酶的酶切位点的酶进行双酶切。

9.权利要求1或2或3的方法,其中步骤C)中富集甲基化DNA是通过MeDIP或MBD技术进行的。

10.权利要求1或2或3的方法,其中步骤D)是通过基于COT1DNA结合的杂交而进行的。

11.权利要求7或8的方法,其中步骤F)中酶切位点甲基化是指辅助接头中设计的酶切位点里的胞嘧啶位点是甲基化的。

12.权利要求1或2或3的方法,其中的辅助接头设计成防止自体连接的结构,并且在

5’末端标记有生物素。

13.用于甲基化DNA的测序的甲基化DNA文库,由权利要求1的方法构建得到。

14.一种试剂盒,其中至少包含用于DNA末端修复的试剂,辅助接头试剂、通过MeDIP或MBD技术富集甲基化DNA的试剂,用于将未甲基化的胞嘧啶转化为尿嘧啶的试剂亚硫酸氢盐,用于扩增的试剂和用于剪切辅助接头的试剂;

其中辅助接头包括部分或全部互补的正反向寡聚核苷酸,经退火可形成双链的辅助接头;所述的辅助接头是被设计成能与双链DNA末端相连接的双链DNA序列,其中辅助接头与修复的双链DNA连接的一端为连接末端,另一端为非连接末端,所述用于扩增的试剂包括引物;

辅助接头的序列设计为配合引物的序列设计使得辅助接头是可剪切的。

15.权利要求14的试剂盒,其中:

所述辅助接头与双链DNA连接的一端为连接末端,另一端为非连接末端;

所述剪切试剂为限制性内切酶;

所述辅助接头选自下述a-h中的至少一种的辅助接头:a为不含酶切位点,非连接端为一条链突出结构,连接端为平末端;

b为含酶切位点,非连接端为一条链突出结构,连接端为平末端;

c为不含酶切位点,非连接端为树杈结构,连接端为平末端;

d为含酶切位点,非连接端为树杈结构,连接端为平末端;

e为不含酶切位点,非连接端为一条链突出结构,连接端为粘末端;

f为含酶切位点,非连接端为一条链突出结构,连接端为粘末端;

g为不含酶切位点,非连接端为树杈结构,连接端为粘末端;

h为含酶切位点,非连接端为树杈结构,连接端为粘末端;

所述扩增试剂引物选自下述(I)-(VI)中的至少一种:(I)当辅助接头为a和c时,PCR扩增试剂中的引物设计成互补于经过亚硫酸氢盐转化的辅助接头的序列,且在5’末端额外连接有限制性内切酶的识别位点,所述的限制性内切酶的识别位点位于引物上,并保证该酶的切割位点位于辅助接头与待测DNA连接点的上下游5bp的范围内;

(II)当辅助接头为b和d时,在辅助接头中靠近辅助接头与待测DNA连接点的上游5bp内位置设计酶切位点,该酶切位点需符合以下三个特点:1)该酶切位点至少包含一个甲基化胞嘧啶;2)酶切位点内不含有非甲基化的胞嘧啶;3)该酶切位点不含有CpG二核苷酸位点;引物设计成与经过亚硫酸氢盐转化的辅助接头互补的序列;(III)当辅助接头为e和g时,辅助接头和引物的设计与a、c方案相同,不同处在于与待测DNA片段连接方式不同:a、c连接方式为“T-A”连接,e和g为粘性末端连接;(IV)当辅助接头为f和h时,辅助接头和引物的设计与b、d方案相同,不同处在于与待测DNA片段连接方式不同:b、d连接方式为“T-A”连接,f和h为粘性末端连接;(V)辅助接头设计同b、d接头设计,进一步在辅助接头中靠近辅助接头与待测DNA连接点的上游20-30bp内位置设计酶切位点,该酶切位点同时满足以下四点:1)该酶切位点至少包含一个甲基化胞嘧啶;2)酶切位点内不含有非甲基化的胞嘧啶;3)该酶切位点不含有CpG二核苷酸位点;4)该酶的切割位点位于辅助接头与待测DNA连接点的上、下游5bp内;

在引物设计成与经过亚硫酸氢盐转化的辅助接头互补的序列;(VI)是(V)和b、d、f、h的组合,通过调整辅助接头的长度使两个酶切位点重合,该方案可以使用双酶切去除辅助接头;在引物设计成与经过亚硫酸氢盐转化的辅助接头互补的序列。

16.权利要求14的试剂盒,其中用于富集甲基化DNA的试剂包含5’甲基化胞嘧啶抗体或甲基-CpG结合结构域蛋白(MBD)。

17.权利要求14的试剂盒,其中所述用于将甲基化胞嘧啶转化为尿嘧啶的试剂为亚硫酸氢盐。

18.权利要求14的试剂盒用于建立甲基化DNA文库或者用于甲基化DNA测序的用途。

19.一种执行权利要求2的方法的自动装置,其包括:A)DNA样品的片段化单元;

B)将A)得到的双链DNA的两端与辅助接头连接的连接单元;

C)富集B)的产物的甲基化DNA的单元;

D)去除C)的产物中的中度,高度重复序列的去除单元;

E)通过亚硫酸氢盐处理将D)得到的产物中的未甲基化胞嘧啶转化为尿嘧啶的单元;

F)将E)得到的单链DNA用引物进行扩增以获得双链DNA的单元;

G)去除可剪切辅助接头的单元;

H)对G)中获得的双链DNA测序的测序单元。

20.权利要求19的装置,其中A)还包括末端修复单元,G)还包括对不具有辅助接头的双链DNA进行末端修复的单元、对经过末端修复的DNA的末端进行测序接头连接的单元。

说明书 :

一种甲基化DNA的高通量测序方法及其应用

技术领域

[0001] 本发明涉及基因组学、生物技术领域,具体而言涉及将甲基化DNA免疫共沉淀、重复序列去除以及亚硫酸氢盐处理高通量测序技术结合,进行基因组功能区的胞嘧啶5’碳原子的甲基化状态进行精确测序的方法;进一步还提供了能够实施这种测序的装置,进而能够使测序成本降低、并且减少信息处理量,更高效地对甲基化DNA进行高通量测序。

背景技术

[0002] DNA甲基化与基因调控或疾病间的关系
[0003] 在高等真核生物基因组中,DNA甲基化是在不改变DNA碱基种类与数量的前提下使得被修饰DNA的空间结构发生改变导致基因的沉默或过度表达,从而使生物体表型呈现出多样化。
[0004] 例如,在正常细胞中常在CpG位点发生甲基化,但在启动子区域的CpG岛不发生甲基化。肿瘤细胞的整体DNA甲基化水平显著降低,基因丰度低的区域发生显著的去甲基化。这种DNA的低甲基化导致染色体的不稳定性与癌症的发生。如像睾丸特异性基因、黑素瘤相关基因和与增殖相关的基因在体细胞中被沉默,其启动子CpG岛被甲基化,而在相应的癌细胞中,这些启动子发生去甲基化,从而使得这些基因能够表达。另外,甲基化水平的降低促使了某些基因(如:与增殖相关的转录因子)的表达。在肿瘤发育过程中,DNA甲基化程度的降低还会使得损伤进一步的加剧,促进从良性扩增到恶性扩增的转变。
[0005] DNA甲基化对基因表达模式以及基因组稳定性均起着至关重要的作用。鉴于DNA甲基化在人类疾病发生、发展过程中的重要作用已经得到了世界上大多数研究者的普遍重视,已经成为当前研究的热点之一,并且DNA甲基化修饰作用于全基因组水平,因此其检测技术的发展左右着对甲基化的研究与认识,进而在很大程度上影响着研究者们对于人类疾病特别是癌症相关疾病的研究。
[0006] DNA甲基化测序方法的现状
[0007] 目前,现有的基于测序仪的DNA甲基化检测技术根据建序库方法的不同可分为直接亚硫酸氢盐测序、MeDIP测序、MBD测序、酶切-亚硫酸氢盐测序等几种方法。
[0008] ●亚硫酸氢盐(bisulfite)直接测序
[0009] 亚硫酸盐直接测序法的主要步骤包括断裂DNA、DNA片段末端修复、连接甲基化测序接头、亚硫酸氢盐翻转、PCR扩增、测序和序列比较。具体而言是将断裂的DNA在经过末端修饰和3’端加“A”碱基后,直接连接到甲基化的测序接头(adapter)(接头上所有位点修饰成甲基化状态)上,在合适的反应条件下,针对单链DNA分子,使用亚硫酸氢盐脱去未甲基化胞嘧啶的氨基而使之转变成尿嘧啶,而甲基化的胞嘧啶保持不变,即进行亚硫酸氢盐翻转。然后进行PCR扩增使尿嘧啶全部转化成胸腺嘧啶。最后,对PCR产物进行测序,并且与未经处理的序列比较,判断CpG位点是否发生甲基化。
[0010] 这种测序方法已经应用在拟南芥甲基化测序和人细胞系测序中,均得到了billion级的数据,测深分别达到20×和14×,即基因组碱基平均测序深度分别达到20倍和14倍。
[0011] 该测序方法虽然解决了在全基因水平对DNA甲基化谱扫描的序列高通量问题,但是该方法产生了海量核苷酸序列,这也带来了新问题:首先是海量数据分析问题。尤其是对于高等哺乳动物这种庞大基因组的测序数据分析(20×的覆盖率,大约达到600亿碱基对的数量),测序后对海量数据的拼接和重新比对,工作量巨大,工作步骤复杂。其次是测序成本问题。按此方法即便使用最新型的3G测序芯片,仅测序成本一项就很昂贵,所以无法适应大多数分子生物学实验室作为常用实验技术的要求。
[0012] ●MeDIP测序和MBD测序
[0013] 由于在哺乳动物中甲基化一般发生在CpG的胞嘧啶5位碳原子上,所以可通过特异性结合甲基化DNA的蛋白MBD或5’-甲基胞嘧啶抗体MeDIP富集高甲基化的DNA片段。并结合第二代高通量测序,对富集到的DNA片段进行测序。具体而言,MDB方法分离甲基化DNA片段的方法被称为甲基化CpG免疫沉淀(MCIp)。MeDIP是通过5-甲基胞嘧啶抗体可用来进行免疫沉淀高特异性的富集甲基化DNA片段,5-甲基胞嘧啶抗体也可以结合非CpG位点的单个甲基化的胞嘧啶,因此比MBD有更高的特异性。这项技术被称为甲基化DNA免疫沉淀,结合新一代测序技术可以高通量的筛选异常甲基化的基因,此法避免了应用限制性酶在酶切位点上的局限性。
[0014] 当采用MeDIP测序、MBD测序时,要进行测序文库制备,基因组DNA经片段化之后,连接没有化学基团修饰的测序接头,连接好后先用MBD或者5-甲基胞嘧啶抗体将含有甲基化胞嘧啶的DNA片段与未甲基化的DNA片段分离。甲基化的DNA片段纯化后不经亚硫酸氢盐翻转直接进行PCR和测序。
[0015] 例如,David Serre对HCT116结肠癌细胞系DNA进行MBD测序,测序结果显示将近一千九百万(占用芯片中两道)的数据可检测到所有已知的甲基化和一些未知甲基化区域,大大降低了测序费用。但是由于该技术没有在测序前进行亚硫酸氢盐的磺酸化处理,必需对甲基化位点进行鉴定,大大增加了后续的工作量。
[0016] ●酶切-亚硫酸氢盐测序
[0017] 基于酶切方法的亚硫酸氢盐测序的目的是富集待测DNA片段,降低测序DNA文库大小并降低测序费用。该方法能够成功地富集到一些CpG岛(所测数据的8%比对到了不同的CpG岛)。而且该方法在一定程度上降低了测序DNA文库大小,并且利用亚硫酸氢盐翻转之后,不用再做后续的甲基化位点的鉴定工作。
[0018] 例如,已知Michael Zeschnigk利用基于酶切方法的亚硫酸氢盐测序时利用4种内切酶对CpG富集区进行DNA片段的富集[Smiraglia DJ,Plass C.The study of aberrant methylation in cancer via restriction landmarkgenomic scanning.Oncogene 2002;21:5414-5426]。该方法的制作原理是DNA的片段化不是用超声断裂,而是利用多内切酶联合酶(MseI,Tsp 509I,NlaIII和Hpy CH4V)切方法断裂DNA,MseI,Tsp509I,NlaIII和Hpy CH4V酶切识别位点分别是TTAA,AATT,CATG和TGCA。根据作者做的计算机预测,这四种酶的联合酶切在DNA片段大小,CpG岛能被切割的个数等因素方面比其他酶联合酶切的优势大,因此选该四种酶联合酶切。酶切后选择300bp-800bp的片段进行纯化,连接甲基化的测序接头,经亚硫酸氢盐翻转PCR后进行测序。
[0019] 但是该方法由于对基因组DNA的片段化是利用酶切完成的,酶切识别位点的固定性会导致片段大小的分布差异很大,小于300bp和大于800bp的DNA被舍弃将使部分基因组DNA不可能被测序到;另外,测序的读长只有130bp、300bp-800bp的片段不能被测通。因此,该方法使部分有生物学意义和功能的DNA甲基化不能被检测到。
[0020] 无论是上述哪一种测序方法,都存在一个值得注意的问题,就是以上各种方法的测序均会致使大量无生物学功能的测序数据的产生。其原因在于在现有的建库和测序方法中,基因组由大量重复序列组成的异染色质区域数据占据测序数据的很大比例,这是因为在待测基因中含有高甲基化CpG的重复序列区(例如,丝粒和端粒含有重复序列尤其是高度重复序列,这些重复序列被认为参与染色体的结构组成,但是尚未发现它直接参与基因的表达和调控)。而重复序列尤其是高度重复序列及其DNA甲基化谱与目的基因表达关系的分析相对联系较弱[Herman JG等人,Methylation-specific PCR:anovel PCR assay for methylation status of CpG islands.Proc Natl AcadSci U S A 1996;93:9821-9826],因此,去除掉重复序列后只对功能区DNA的甲基化片段进行测序可大大节省测序成本。
[0021] 重复序列去除技术
[0022] 如何去除重复序列,目前已有研究人员对此进行了研究,例如将亚硫酸氢盐测序技术与高密度芯片结合,先通过芯片技术将待测甲基化DNA的范围进行控制。已知Agilent和NimbleGen公司设计出的芯片探针位置集中于基因组的启动子和第一外显子以控制目标DNA的范围,这种方法可以去除如来自异染色质DNA片段的冗余。另外,还有以高通量测序技术为基础的单碱基多态性检测也同样用外显子捕获芯片来捕获外显子DNA片段以降低测序文库的大小来降低每个样本测序的检测成本。但是由于外显子捕获芯片的捕获DNA量有限,对后续的实验有影响,其去除冗余甲基化DNA的能力根本不足以满足在基因组水平的甲基化DNA的测序分析。
[0023] 此外,C0T-1 DNA是一种荧光原位杂交和比较基因组杂交等杂交试验中重复序列的封闭的序列。发明人认为其可以作为去除重复序列的一个有力手段,已知C0T-1 DNA富含高度和中度重复序列,是根据高、中度重复序列DNA变性后可以复性而单拷贝和低拷贝的DNA很难复性的原理制成。
[0024] C0T-1 DNA重复序列去除的常用方式如下所述:用生物素标记C0T-1 DNA,用亲和素包被磁珠,利用亲和素磁珠与生物素结合的原理,将标记有生物素的C0T-1 DNA结合在包被有亲和素的磁珠上,得到生物素标记C0T-1 DNA-亲和素包被磁珠四者的复合体,将此复合体与可能存在重复序列的待测DNA片段杂交,根据高、中度重复序列DNA变性后可以复性而单拷贝和低拷贝的DNA很难复性的原理,重复序列被杂交在标记生物素的C0T-1 DNA上,得到含有重复序列-生物素标记C0T-1 DNA-亲和素包被磁珠五者的磁珠复合体,分离磁珠复合体并舍弃,同时回收经过磁珠处理的待测DNA,回收的DNA即是去除了重复序列的DNA片段。
[0025] 利用C0T-1 DNA去除重复序列的特点在于位于功能区的甲基化DNA片段(启动子,外显子,部分内含子等区域)不会被捕获移除,而位于异染色质区的高度和中度甲基化重复序列被移除。这种重复序列去除方式能够满足基因组水平的甲基化DNA的测序分析的要求。

发明内容

[0026] 发明人面对现有技术的缺陷,设想通过前期处理,去除冗余的甲基化序列,然后再进行测序,以此减少后期处理的信息量并降低测序成本。经过多方面的选择和调查,发明人首次构思了下述技术路线:
[0027] (1)先通过MeDIP或MBD技术从待测DNA中富集甲基化DNA片段;
[0028] (2)将(1)中富集得到甲基化DNA片段通C0T-1 DNA重复序列去除技术处理,得到去除冗余序列的仅含有功能区DNA的甲基化片段的DNA文库;
[0029] (3)然后对(2)中的文库进行亚硫酸氢盐测序的高通量测序。
[0030] 在该技术路线中首次将C0T-1 DNA重复序列去除技术应用到高通量测序当中。
[0031] 但是在实际实施时,遇到了很多技术问题。最关键的就是接头的匹配衔接问题。
[0032] 目前,甲基化DNA的亚硫酸氢盐测序利用的甲基化的接头,由于该接头的所有胞嘧啶位点都是甲基化的,DNA片段在连接甲基化的测序接头后经亚硫酸氢盐翻转之后,接头的序列不发生改变,PCR之后仍和测序引物匹配。
[0033] 但是将MeDIP和亚硫酸氢盐测序法联合应用的话,会出现下述几种情况:(1)先亚硫酸氢盐测序后MeDIP处理,在构建亚硫酸氢盐测序文库时,在亚硫酸氢盐磺酸化处理前引入甲基化修饰的接头的话,甲基化的接头的引入会造成后续的MeDIP甲基化免疫共沉淀出现“假阳性”的甲基化DNA富集。(2)先进行MeDIP处理然后进行亚硫酸氢盐测序,并在MeDIP处理前不加接头,双链DNA经MeDIP和亚硫酸氢盐之后变成单链DNA,并且序列发生改变,常规建库所用的测序接头与测序引物无法使用。(3)先进行MeDIP处理然后进行亚硫酸氢盐测序,如果在MeDIP前连接没有甲基化的接头,亚硫酸氢盐翻转会致使接头序列发生改变而和测序引物不匹配。
[0034] 为实现以上两种甲基化DNA富集技术和甲基化DNA的亚硫酸氢盐测序技术结合,发明人通过合理设计辅助接头及引物,合理安排该接头的连接和去除与各技术的使用顺序解决了上述难题。由此首次提供了甲基化DNA免疫共沉淀与重复序列去除的亚硫酸氢盐处理的高通量测序方法(MeDIP-repetitive elements removal-bisulfite,简称MRERB技术),这种方法既满足了对待测DNA片段检测的要求又降低了每个样本测序文库的大小和测序量,减少了测序后期处理信息量进而节约了检测费用,实现了低成本对功能区DNA甲基化片段进行甲基化精细图谱的绘制的目标。
[0035] 具体而言,本发明提供了下述内容:
[0036] 1.一种甲基化DNA的高通量测序方法,包括建库步骤和测序步骤,[0037] 其中建库步骤是指获得待检测的甲基化DNA文库的步骤,所述建库步骤包括:
[0038] A)基因组DNA的片段化及双链DNA片段末端修复;
[0039] B)将A)得到的双链DNA与辅助接头连接,所述的辅助接头是指设计成能与修复后的双链DNA末端部分相连接的双链DNA序列,它可以使经磺酸化处理的单链DNA经PCR后变成双链DNA。辅助接头与修复的双链DNA连接的一端为连接末端,另一端为非连接末端;
[0040] C)将B)的产物进行甲基化免疫共沉淀;
[0041] D)去除C)的产物中的中度,高度重复序列;
[0042] E)将D)得到的产物进行亚硫酸氢盐翻转处理;
[0043] F)将E)得到的单链DNA通过引物(根据辅助接头序列设计)进行PCR扩增获得双链DNA,G)酶切去除辅助接头;
[0044] 其中测序步骤是指对前述建库步骤获得的文库进行序列测定,包括步骤:
[0045] H)对G)中获得的双链DNA进行末端修复,连接测序接头;
[0046] J)对H)中的产物进行DNA测序。
[0047] 2.项目1的测序方法:
[0048] 其中,步骤B)中辅助接头选自下述a-h中的至少一种:
[0049] a为不含酶切位点,非连接端为一条链突出结构,连接端为平末端;
[0050] b为含酶切位点,非连接端为一条链突出结构,连接端为平末端;
[0051] c为不含酶切位点,非连接端为树杈结构,连接端为平末端;
[0052] d为含酶切位点,非连接端为树杈结构,连接端为平末端;
[0053] e为不含酶切位点,非连接端为一条链突出结构,连接端为粘末端;
[0054] f为含酶切位点,非连接端为一条链突出结构,连接端为粘末端;
[0055] g为不含酶切位点,非连接端为树杈结构,连接端为粘末端;
[0056] h为含酶切位点,非连接端为树杈结构,连接端为粘末端。
[0057] 步骤B)中的辅助接头,步骤F)中的引物和步骤G)中切割酶如下设计:
[0058] 当辅助接头为a和c时,引物设计成互补于经过E)翻转的辅助接头的序列,且在5’末端额外连接有限制性内切酶的识别位点,所述的限制性内切酶的识别位点位于引物上,并保证该酶的切割位点位于辅助接头与待测DNA连接点的上下游5bp;所述的限制性内切酶选自:EcoP15I和MmeI。当进行步骤G时,采用针对所设计的限制性内切酶的酶切位点的酶进行单酶切;
[0059] 当辅助接头为b和d时,在辅助接头中靠近辅助接头与待测DNA连接点的上游5bp内位置设计酶切位点,该酶切位点需符合以下三个特点:1)该酶切位点至少包含一个甲基化胞嘧啶;2)酶切位点内不含有非甲基化的胞嘧啶;3)该酶切位点不含有CpG二核苷酸位点。所述的限制性内切酶选自:AluI,BclI,BfaI,BglII,BsrGI,BspHI,CviAII,FatI,HindIII,HpyCH4V,NlaIII,NsiI,PciI,ScaI,SpeI,XbaI等等。在引物设计成与经过E)翻转的辅助接头互补的序列,当进行步骤G时,采用针对所设计的甲基化的酶切位点进行切割的酶进行单酶切;或者,在引物5’端设计另外一个酶切位点,通过调整辅助接头的长度使两个酶切位点重合;当进行步骤G时,采用针对所设计的限制性内切酶的酶切位点的酶进行双酶切。
[0060] 当辅助接头为e和g时,辅助接头和引物的设计原理与a、c方案相同,不同处在于与目的DNA片段连接方式不同:a、c连接方式为“T-A”连接,e和g为粘性末端连接。因此,对辅助接头和引物的设计原理不再赘述。
[0061] 当辅助接头为f和h时,辅助接头和引物的设计原理与b、d方案相同,不同处在于与目的DNA片段连接方式不同:b、d连接方式为“T-A”连接,f和h为粘性末端连接。因此,对辅助接头和引物的设计原理不再赘述。
[0062] 3.项目1或2的测序方法,其中步骤A)包括:
[0063] a将基因组DNA片段化成为双链DNA片段;
[0064] b将a中的双链DNA片段末端修复为平末端;
[0065] c将b中的平末端的3’末端加上A碱基。
[0066] 4.项目1或2的测序方法,其中步骤C)的甲基化免疫共沉淀选自MeDIP和MBD。
[0067] 5.项目1或2的测序方法,其中步骤d)的重复序列去除使用C0T1 DNA。
[0068] 6.项目2的测序方法,其中步骤F)中酶切位点甲基化是指b、d、f、h方案,具体如以上方案所述。
[0069] 7.项目1的测序方法,其中的辅助接头设计成防止自体连接的结构,在5’末端标记有生物素。
[0070] 8.一种执行项目1或2的方法的自动装置。
[0071] 9.项目8的装置,其包括
[0072] A)基因组DNA的片段化单元和末端修复单元;
[0073] B)将A)得到的双链DNA与辅助接头连接的连接单元;
[0074] C)将B)的产物进行甲基化免疫共沉淀的单元;
[0075] D)去除C)的产物中的中度,高度重复序列的去除单元;
[0076] E)将D)得到的产物进行亚硫酸盐翻转处理的单元;
[0077] F)将E)得到的单链DNA通过引物进行PCR扩增获得双链DNA的单元;
[0078] G)酶切去除辅助接头的单元;
[0079] H)对G)中获得的双链DNA进行末端修复的单元
[0080] J)对H)中修复的DNA进行测序接头连接的单元;
[0081] K)对J)中的产物进行甲基化DNA测序的测序单元。附图说明:
[0082] 图1:功能区甲基化DNA精细图测序样本制备原理图。主要实验步骤依次为基因组DNA的片段化、DNA片段末端修复、DNA片段3’端加A碱基、连接辅助接头、甲基化免疫共沉淀、去除甲基化DNA片段中的重复序列、亚硫酸氢盐翻转DNA、使用根据辅助接头设计的引物进行PCR将经翻转的DNA变成双链、去除辅助接头、末端修去除辅助接头的PCR产物并在3’端加A碱基、连接测序接头、测序。
[0083] 图2:辅助接头的设计示意图。辅助接头的设计按是否含有酶切位点分为两类,含有酶切位点的辅助接头和不含有酶切位点的接头(b,d,f,h);辅助接头的非连接端可以设计成三种形式:树杈(forked)结构(图c和d)、一条链突出结构(a和b)和平端结构。结合辅助接头连接端的TA连接或其他粘性连接特性,共分八种情况。分别如下所示:
[0084] a为不含酶切位点,非连接端为一条链突出结构,连接端为平末端形式;
[0085] b为含酶切位点,非连接端为一条链突出结构,连接端为平末端形式;
[0086] c为不含酶切位点,非连接端为树杈结构,连接端为平末端形式;
[0087] d为含酶切位点,非连接端为树杈结构,连接端为平末端形式;
[0088] e为不含酶切位点,非连接端为一条链突出结构,连接端为粘末端形式;
[0089] f为含酶切位点,非连接端为一条链突出结构,连接端为粘末端形式;
[0090] g为不含酶切位点,非连接端为树杈结构,连接端为粘末端形式;
[0091] h为含酶切位点,非连接端为树杈结构,连接端为粘末端形式。
[0092] 图3:平末端的辅助接头的连接和移除方式(1),本方式中的辅助接头使用其中图2中的两种:a和c。因为设计成采用酶切方式移除辅助接头1,而且移除的时间点在经过亚硫酸氢盐翻转之后,所要移除的辅助接头1以单链的形式存在于待测DNA的末端,此时为了有效移除所述辅助接头1同时使单链DNA成为双链DNA以方便后续测序接头连接,发明人设计出与经过亚硫酸氢盐翻转后辅助接头1序列相匹配的引物(A),同时在靠近引物的5’位点处设计酶切识别位点(B),酶切识别位点不与辅助接头序列相匹配,处于引物的突出延伸部分。选用的酶切位点是与限制切割酶相适应的,所选用的限制性内切酶的特点为能在酶切识别位点下游20-30bp处对DNA进行酶切,通过控制辅助接头的长度将酶切位点设计在DNA片段末端连接辅助接头处5bp范围内。
[0093] 图4:平末端的辅助接头1的连接和移除方式(2)。辅助接头1中包含甲基化酶切位点方式的辅助接头1的连接和去除。本方式中的辅助接头1可以使用图2中的两种:b和d。辅助接头1中含有甲基化的酶切位点,通过甲基化酶切位点可以保证在酶切去除辅助接头时DNA片段的完整性(但可允许DNA片段末端5bp内的损伤)和经亚硫酸氢盐翻转之后酶切识别序列不改变。
[0094] 图5:平末端的辅助接头连接和移除方式(3)。辅助接头中包含甲基化酶切位点和引物中包含酶切位点方式的辅助接头的连接和去除。辅助接头中同样在靠近连接处设计甲基化的酶切位点。引物中在5’端设计另外一个酶切位点,通过调整辅助接头的长度使两个酶切位点重合。通过两次酶切保证酶切的彻底性。
[0095] 图6:粘性末端的辅助接头的连接和去除方式(1)。本方式中的辅助接头可以使用其中两种:e和g。设计与bisulfite翻转后辅助接头序列相匹配的引物,同时在靠近引物的5’位点处设计酶切识别位点。
[0096] 图7:粘性末端的辅助接头的连接和去除方式(2)。辅助接头中包含甲基化酶切位点方式的辅助接头的连接和去除。本方式中的辅助接头可以使用其中两种:f和h。辅助接头中含有甲基化的酶切位点,保证DNA片段不被切割和经亚硫酸氢盐翻转之后酶切识别序列不改变。
[0097] 图8:粘性末端的辅助接头的连接和去除方式(3)。辅助接头中包含甲基化酶切位点和引物中包含酶切位点方式的辅助接头的连接和去除。辅助接头中同样在靠近连接处设计甲基化的酶切位点。引物中在5’端设计另外一个酶切位点,通过调整辅助接头的长度使两个酶切位点重合。通过两次酶切保证酶切的彻底性。
[0098] 图9:去除甲基化的重复序列示意图。C0T-1 DNA标记生物素后,利用亲和素磁珠与生物素结合的原理,将标记有生物素的C0T-1 DNA标记在包被有亲和素的磁珠上并去除未标记生物素的C0T-1 DNA片段。将与生物素-DNA结合的亲和素磁珠与经甲基化免疫共沉淀后的甲基化DNA片段进行杂交,甲基化的重复序列将会被杂交在标记生物素的C0T-1 DNA上,分离磁珠并舍弃磁珠,将溶液中的DNA收回,回收的DNA即功能区甲基化的DNA片段。
[0099] 图10:全基因磺酸化处理测序与本技术测序结果共同比对的单个CpG位点的测序深度分析。比对说明单个CpG位点的测序深度趋势一致。其中左图为MRERB测序结果;右图为全基因磺酸化测序结果。
[0100] 图11-图18为所有类型的辅助接头和引物序列说明:
[0101] 图11:平末端的辅助接头连接和去除方式(1)的接头序列和引物序列,本辅助接头连接和去除方式中的接头序列不包含特殊的碱基序列,但要保证该接头经磺酸化后能成功扩增。本接头的连接端的3‘端设计了“T”碱基的突出、5’端修饰了磷酸基团以便和DNA连接时能以“T-A”连接式相连接。在PCR产物中接头去除方面,我们在PCR引物的5‘端引入酶识别序列,该酶的特点是能在酶识别位点下游的大于20bp的地方切割DNA片段,可以将辅助接头完全切去。另外可以引物的5’端引入生物素基团(也可以不修饰生物素基团,不修饰的情况下去除小片段时可以用Ampure Beads去除。)。因此,去除接头前的PCR产物片段包括待测DNA片段、对称的两个酶切位置、对称的匹配接头序列及其对称的两个酶识别位点序列。
[0102] 图12:平末端的辅助接头连接和去除方式(2)的接头序列和引物序列。本辅助接头连接和去除方式中的接头序列包含要保证该接头经磺酸化后能成功扩增的20-30bp的序列和一个甲基化的酶识别序列。该酶的特征是酶识别位点和切割位点相同。本接头的连接端的3‘端设计了“T”碱基的突出、5’端修饰了磷酸基团以便和DNA连接时能以“T-A”连接式相连接。在PCR产物中接头去除方面,由于该酶在接头中做了甲基化修饰,因为经过磺酸化之后序列不变,用该酶进行酶切可把接头去除。另外可以引物的5’端引入生物素基团(也可以不修饰生物素基团,不修饰的情况下去除小片段时可以用Ampure Beads去除。)。因此,去除接头前的PCR产物片段包括待测DNA片段、对称的两个酶识别切割序列、对称的匹配接头序列。
[0103] 图13:平末端的辅助接头连接和去除方式(3)的接头序列和引物序列。本辅助接头连接和去除方式中的接头序列包含要保证该接头经磺酸化后能成功扩增的20-30bp的序列和一个甲基化的酶识别序列。该酶的特征是酶识别位点和切割位点相同。本接头的连接端的3‘端设计了“T”碱基的突出、5’端修饰了磷酸基团以便和DNA连接时能以“T-A”连接式相连接。在PCR产物中接头去除方面,由于该酶在接头中做了甲基化修饰,因为经过磺酸化之后序列不变,用该酶进行酶切可把接头去除;另外,我们同时在PCR产物中接头去除方面,我们在PCR引物的5‘端引入酶识别序列,该酶的特点是能在酶识别位点下游的大于20bp的地方切割DNA片段,可以将辅助接头完全切去。另外可以引物的5’端引入生物素基团(也可以不修饰生物素基团,不修饰的情况下去除小片段时可以用Ampure Beads去除。)。因此,去除接头前的PCR产物片段包括待测DNA片段、对称的两个酶切位共同切割的位置、对称的匹配接头序列及酶2对称的两个酶识别位点序列。
[0104] 图14:粘性末端的辅助接头连接和去除方式(1)的接头序列和引物序列。本辅助接头连接和去除方式类同平末端的辅助接头连接和去除的方式(1)。不同的是本接头的连接端的3‘端非“T-A”连接式相连接。而且设计和DNA末端的粘性末端序列匹配的序列。
[0105] 图15:粘性末端的辅助接头连接和去除方式(2)的接头序列和引物序列。本辅助接头连接和去除方式类同平末端的辅助接头连接和去除的方式(2)。不同的是本接头的连接端的3‘端非“T-A”连接式相连接。而且设计和DNA末端的粘性末端序列匹配的序列。
[0106] 图16:粘性末端的辅助接头连接和去除方式(3)的接头序列和引物序列。本辅助接头连接和去除方式类同平末端的辅助接头连接和去除的方式(3)。不同的是本接头的连接端的3‘端非“T-A”连接式相连接。而且设计和DNA末端的粘性末端序列匹配的序列。
[0107] 图17:其他接头设计方案说明。
[0108] 系列一(b-1,d-1,f-1,h-1)辅助接头设计方案类似b、d接头设计,是在辅助接头中靠近辅助接头与待测DNA连接点的上游20-30bp内位置设计酶切位点,该酶切位点需符合以下四个特点:1)该酶切位点至少包含一个甲基化胞嘧啶;2)酶切位点内不含有非甲基化的胞嘧啶;3)该酶切位点不含有CpG二核苷酸位点;4)该酶的切割位点位于辅助接头与待测DNA连接点的上、下游5bp内。所述的限制性内切酶选自:EcoP15I和MmeI等等。在引物设计成与经过E)翻转的辅助接头互补的序列,当进行步骤G时,采用针对所设计的甲基化的酶切位点进行切割的酶进行单酶切。
[0109] 系列二(b-2,d-2,f-2,h-2)辅助接头设计方案是系列一方案和b、d、f、h的结合,通过调整辅助接头的长度使两个酶切位点重合,该方案可以使用双酶切去除辅助接头。在引物设计成与经过E)翻转的辅助接头互补的序列,当进行步骤G时,采用针对所设计的甲基化的酶切位点进行切割的酶进行双酶切。
[0110] 发明详述
[0111] 定义
[0112] 为了更清楚地阐述本发明,在本发明中的各个定义解释如下。
[0113] DNA片段化及修复
[0114] DNA片段化是指:将基因组用机械或者酶切等方法将基因组DNA剪切成小的DNA片段(如几百碱基或几千碱基)。
[0115] DNA片段的修复是指:剪切后的DNA片段,尤其是机械方法打断的DNA片段,DNA片段双链末端可能会出现以下情况:双链同侧末端断裂位置不一致、3’末端或者5’末端有损伤,DNA片段修复的意义在于将这些末端补齐或者3’、5’有损伤的片段修复成5’连接磷酸基团和3’连接羟基的平末端结构。
[0116] 根据高通量测序仪对测序文库的要求(WO2008096146A1),需制备合适长度的DNA片段文库。首先将DNA片段化成适合测序仪测序长度大小的DNA片段。片段化效果一般以所要求制备的文库片段大小在所片段化DNA Smear的主带位置较为理想。例如,若要求制备插入100bp的Paired End文库,则断裂后DNA Smear主带在100bp处即可,若断裂效果不理想则需要进行重新断裂。样品片段化步骤也可使用其他断裂系统,具体参数可根据仪器的要求进行调整。
[0117] 用于断裂DNA的方法包括酶切和超声断裂的方法。
[0118] 酶切的方法可选用单一内切酶或多种不含CpG位点的内切酶联合酶切。酶切方法由于酶切识别位点的固定性,可能致使部分DNA片段长度不适合而舍弃在文库之外;而超声断裂DNA是随机断裂DNA,断裂位点不固定,理论上整个基因组可包含在测序文库之中。本发明实验方案中片段化基因组既可用酶切的方法,也可选用超声断裂的方法,但实例用超声断裂方法。
[0119] 如果是由超声断裂的DNA,需对DNA片段末端修复,修复成平末端。该修复的目的是将双链DNA片段损伤的5’端磷酸化,损伤的3‘端羟基化,修复成平末端的DNA片段3’末端加“A”碱基使连接辅助接头时形成“TA”的粘性末端连接;如果是多种酶联合酶切方法片段化的基因组DNA,由于酶切末端序列不一样,首先将DNA片段修饰成平末端后在3’端加“A”碱基使连接辅助接头时形成“TA”的粘性末端连接;如果是单一酶切,若酶切末端是平末端在末端的3’端加“A”碱基使连接辅助接头时形成“TA”的粘性末端连接;如果是粘性末端,设计辅助接头的时候可设计成与DNA片段粘性末端匹配的接连末端,进行粘性末端的连接。
[0120] 辅助接头(adapter)的连接和切除
[0121] 辅助接头是指:加入辅助接头的目的是在DNA在进行MeDIP和bisulfite磺酸化后能经过PCR反应后使单链DNA变成双链,从而能进行常规文库制备
[0122] 辅助接头的类型:根据DNA片段化的方法不同以及碱基修饰的不同的分类。目前,甲基化的bisulfite测序利用的甲基化的接头(WO2009024019A1)。由于该接头的所有胞嘧啶位点都是甲基化的,DNA片段在连接甲基化的测序接头后经bisulfite翻转之后,接头的序列不发生改变,PCR之后仍和测序引物匹配。
[0123] 但是甲基化接头影响了MeDIP实验中甲基化抗体绑定甲基化片段,因此该接头不适用于MeDIP后bisulfite甲基化测序。而如果在MeDIP前连接没有甲基化的接头,bisulfite翻转会致使接头序列发生改变而和测序引物不匹配。如果在bisulfite前不加接头,双链DNA经MeDIP和bisulfite之后变成单链DNA,并且序列发生改变,常规建库(以solexa测序文库为例)所用的Paired End adapter与PairedEnd primer无法在本实验方法中使用。因此本发明引入辅助接头(图2)解决MeDIP与bisulfite翻转导致序列改变之间的矛盾,能够在不影响MeDIP的情况下,经bisulfite之后成功扩增DNA片段库并能进行后续的常规建库。
[0124] 辅助接头的的接连和剪切
[0125] 辅助接头的作用是解决甲基化免疫共沉淀与bisulfite致使接头序列改变导致测序引物无法匹配的矛盾,因此在bisulfite PCR之后要把辅助接头剪切去掉,以减少测序成本。
[0126] 辅助接头的接连和剪切结合起来考量可分为以下几种情况:
[0127] 1.多酶切DNA片段或超声断裂片段的连接辅助接头及酶切方式一---引物中包含酶切位点(图3)。
[0128] 多酶切DNA片段或超声断裂片段经末端修复和3’端加“A”碱基后需连接辅助接头,本方式中的辅助接头可以使用其中两种:a和c。该辅助接头除了在其中一条5’端修饰磷酸基团便于和DNA片段中3’的羟基连接外不必做任何其他修饰。
[0129] 连接辅助接头之后的DNA片段经MeDIP等一系列处理后,设计与bisulfite翻转后辅助接头序列相匹配的引物(图3A),同时在靠近引物的5’位点处设计酶切识别位点(图3B),酶切识别位点不与辅助接头序列相匹配,处于引物的延伸部分。该酶的特点为能在酶切识别位点下游20-30bp处对DNA进行酶切,通过控制辅助接头的长度将酶切位点设计在DNA片段末端连接辅助接头处5bp范围内。DNA片段经PCR之后在DNA的两端多了酶切识别序列,通过酶对双链序列的识别便可在酶切处酶切DNA片段。由于在引物的5’标记生物素,酶切掉的辅助接头部分和未被酶切的DNA片段可与亲和素的结合,能迅速、彻底的被去除。可用于引物中酶包括:EcoP15I和MmeI。
[0130] 在本发明的一个实施方式中,采用引物中包含酶切位点方式的辅助接头的连接和去除(图2)。本方式中的辅助接头可以使用其中两种:a和c。设计与bisulfite翻转后辅助接头序列相匹配的引物(A),同时在靠近引物的5’位点处设计酶切识别位点(B),酶切识别位点不与辅助接头序列相匹配,处于引物的延伸部分。该酶的特点为能在酶切识别位点下游20-30bp处对DNA进行酶切,通过控制辅助接头的长度将酶切位点设计在DNA片段末端连接辅助接头处5bp范围内。
[0131] 2.多酶切DNA片段或超声断裂片段的连接辅助接头及酶切方式二---辅助接头中包含甲基化酶切位点(图3)。
[0132] 本方式中多酶切DNA片段或超声在断裂片段经末端修复和3’端加“A”碱基后连接辅助接头可用(图2)b和d两种。b和d辅助外链子在靠近连接端设计酶切位点,设计该位点的目的是为了PCR之后能在此处将辅助接头酶切掉去除。因此,该酶切位点设计在辅助接头的靠近连接处。由于经过亚硫酸氢盐转化之后未甲基化的胞嘧啶会转化为鸟嘧啶,并在PCR后变成胸腺嘧啶。发明人在设计酶切位点时如果酶识别序列中含有胞嘧啶,需将此处的胞嘧啶做甲基化修饰以保证经亚硫酸氢盐翻转后酶识别序列不发生改变。由于亚硫酸氢盐转化后的PCR产物序列中腺嘌呤(A)和胸腺嘧啶(T)增多,发明人在设计酶切位点时为了不切割到DNA片段,选择的酶切识别位点中含有一个非CpG位点的C,并且该胞嘧啶不在酶切识别序列的末位。可用在此处的酶包括:AluI,BclI,BfaI,BglII,BsrGI,BspHI,CviAII,FatI,HindIII,HpyCH4V,NlaIII,NsiI,PciI,ScaI,SpeI,XbaI等等。另外,该辅助接头也在其中一条5’端修饰磷酸基团便于和DNA片段中3’的羟基连接。
[0133] 连接辅助接头之后的DNA片段经MeDIP等一系列处理后,设计与bisulfite翻转后辅助接头序列相匹配的引物并在5’端修饰生物素(图4)。由于在引物5’端修饰了生物素,酶切掉的辅助接头部分和未被酶切的DNA片段可与亲和素的结合,能迅速、彻底的被去除。
[0134] 在本发明的一个实施方式中,采用辅助接头中包含甲基化酶切位点方式的辅助接头的连接和去除(图4)。本方式中的辅助接头可以使用其中两种:图4的b和d。辅助接头中含有甲基化的酶切位点,保证DNA片段不被切割和经亚硫酸氢盐翻转之后酶切识别序列不改变。
[0135] 3.多酶切DNA片段或超声断裂片段的连接辅助接头及酶切方式三---辅助接头中包含甲基化酶切位点和引物中包含酶切位点(图5)。
[0136] 单一种酶进行酶切时往往不够彻底,有时候有必要利用两种或多种酶进行酶切处理。本方式中多酶切DNA片段或超声在断裂片段经末端修复和3’端加“A”碱基后连接辅助接头如同方式二用(图2)b和d两种,并同样在靠近连接处设计甲基化的酶切位点。
[0137] 设计与bisulfite翻转后辅助接头序列相匹配的引物时如同方式一,在靠近引物的5’位点处设计酶切识别位点(图5),该酶在酶切识别位点下游20-30bp处对DNA进行酶切,通过控制辅助接头的长度将两个酶切位点设计在DNA片段的同一个位置。通过两次酶切,保证切割的彻底性。在引物的5’标记生物素,酶切掉的辅助接头部分和未被酶切的DNA片段可与亲和素的结合,能迅速、彻底的被去除。
[0138] 在本发明的一个实施方式中,采用辅助接头中包含甲基化酶切位点和引物中包含酶切位点方式的辅助接头的连接和去除(图5)。辅助接头中同样在靠近连接处设计甲基化的酶切位点。引物中在5’端设计另外一个酶切位点,通过调整辅助接头的长度使两个酶切位点重合。通过两次酶切保证酶切的彻底性。
[0139] 4.单酶切DNA片段的连接辅助接头及酶切方式一---引物中包含酶切位点(图6)。
[0140] 单酶切DNA片段为粘性末端的DNA片段不必做末端修复和3’端加“A”碱基,可直接设计和酶切粘性末端匹配的辅助接头,本方式中的辅助接头可以使用其中两种:e和g。该辅助接头除了在其中一条5’端修饰磷酸基团便于和DNA片段中3’的羟基连接外不必做任何其他修饰。
[0141] 连接辅助接头之后的DNA片段经MeDIP等一系列处理后,设计与bisulfite翻转后辅助接头序列相匹配的引物(图6),同时在靠近引物的5’位点处设计酶切识别位点(图6),酶切识别位点不与辅助接头序列相匹配,处于引物的延伸部分。该酶的特点为能在酶切识别位点下游20-30bp处对DNA进行酶切,通过控制辅助接头的长度将酶切位点设计在DNA片段末端连接辅助接头处5bp范围内。DNA片段经PCR之后在DNA的两端多了酶切识别序列,通过酶对双链序列的识别便可在酶切处酶切DNA片段。由于在引物的5’标记生物素,酶切掉的辅助接头部分和未被酶切的DNA片段可与亲和素的结合,能迅速、彻底的被去除。
可用于引物中酶包括:EcoP15I和MmeI。
[0142] 在本发明的一个实施方式中,采用粘性末端的辅助接头的连接和去除(引物中包含酶切位点方式)(图6)。本方式中的辅助接头可以使用其中两种:e和g。设计与bisulfite翻转后辅助接头序列相匹配的引物,同时在靠近引物的5’位点处设计酶切识别位点。
[0143] 5.单酶切DNA片段的连接辅助接头及酶切方式一---辅助接头中包含甲基化酶切位点(图7)。
[0144] 单酶切DNA片段为粘性末端的DNA片段不必做末端修复和3’端加“A”碱基,可直接设计和酶切粘性末端匹配的辅助接头,本方式中的辅助接头可以使用其中两种:f和h。该辅助接头除了在其中一条5’端修饰磷酸基团便于和DNA片段中3’的羟基连接外不必做任何其他修饰。
[0145] 辅助外链子在靠近连接端设计包含一个甲基化酶切位点,酶切位点时为了不切割到DNA片段,选择的酶切识别位点中含有一个非CpG位点的C,并且该胞嘧啶不在酶切识别序列的末位。为了经亚硫酸氢盐翻转后酶切识别序列不发生改变,发明人将酶切识别序列里的胞嘧啶甲基化,其他碱基不做修饰。可用在此处的酶包括:AluI,BclI,BfaI,BglII,BsrGI,BspHI,CviAII,FatI,HindIII,HpyCH4V,NlaIII,NsiI,PciI,ScaI,SpeI,XbaI等等。另外,该辅助接头也在其中一条5’端修饰磷酸基团便于和DNA片段中3’的羟基连接。
[0146] 连接辅助接头之后的DNA片段经MeDIP等一系列处理后,设计与bisulfite翻转后辅助接头序列相匹配的引物并在5’端修饰生物素(图4)。由于在引物5’端修饰了生物素,酶切掉的辅助接头部分和未被酶切的DNA片段可与亲和素的结合,能迅速、彻底的被去除。
[0147] 在本发明的一个实施方式中,采用辅助接头中包含甲基化酶切位点方式的辅助接头的连接和去除(图7)。本方式中的辅助接头可以使用其中两种:f和h。辅助接头中含有甲基化的酶切位点,保证DNA片段不被切割和经亚硫酸氢盐翻转之后酶切识别序列不改变。
[0148] 6.单酶切DNA片段的连接辅助接头及酶切方式三---辅助接头中包含甲基化酶切位点和引物中包含酶切位点(图8)。
[0149] 在本发明的一个实施方式中,单一种酶进行酶切时往往不够彻底,有时候有必要利用两种或多种酶进行酶切处理。本方式中多酶切DNA片段或超声在断裂片段经末端修复和3’端加“A”碱基后连接辅助接头如同方式二用(图8)f和h两种,并同样在靠近连接处设计甲基化的酶切位点。
[0150] 设计与bisulfite翻转后辅助接头序列相匹配的引物时如同方式一,在靠近引物的5’位点处设计酶切识别位点(图8),该酶在酶切识别位点下游20-30bp处对DNA进行酶切,通过控制辅助接头的长度将两个酶切位点设计在DNA片段的同一个位置。通过两次酶切,保证切割的彻底性。在引物的5’标记生物素(biotin),酶切掉的辅助接头部分和未被酶切的DNA片段可与亲和素的结合,能迅速、彻底的被去除。
[0151] 在本发明的一个实施方式中采用辅助接头中包含甲基化酶切位点和引物中包含酶切位点方式的辅助接头的连接和去除(图8)。辅助接头中同样在靠近连接处设计甲基化的酶切位点。引物中在5’端设计另外一个酶切位点,通过调整辅助接头的长度使两个酶切位点重合。通过两次酶切保证酶切的彻底性。
[0152] 甲基化免疫共沉淀
[0153] 甲基化免疫共沉淀(MeDIP)是通过5-甲基胞嘧啶抗体可用来进行免疫沉淀高特异性的富集甲基化DNA片段,结合新一代测序技术可以高通量的筛选异常甲基化的基因,此法避免了应用限制性酶在酶切位点上的局限性。本发明所使用甲基化免疫共沉淀技术根据Michael Weber的免疫共沉淀技术略有改动。为了测序DNA片段长度的需要,将DNA片段大小由原来的200-1000bp调整为100-300bp;另外,5-甲基胞嘧啶抗体孵育时间经过优化后发现孵育效果最优时间为12小时而非文献报道的2小时。
[0154] 亚硫酸盐翻转
[0155] 亚硫酸盐翻转是采用亚硫酸氢盐对单链DNA分子进行化学修饰,导致未甲基化胞嘧啶(C)可被亚硫酸氢盐脱去氨基而转变成尿嘧啶(U),而5mC不能被修饰,仍保持为5mC,在PCR反应过程中,尿嘧啶与腺嘌呤(A)配对,尿嘧啶则被胸腺嘧啶(T)取代。这一化学反应过程首先由Frommer等(M.Frommer等人,A genomic sequencing protocol that yields a positive displayof 5-methylcytosine residues in individual DNA strands.Proc Natl AcadSci U S A 89(1992)1827-31)报导。具体过程为:第一步,亚硫酸氢钠使胞嘧啶磺酸化;第二步,对苯二酚脱氨基;第三步,在碱性环境下,磺基消失,成为尿嘧啶。目前,该实验可由天漠(zymo)bisulfite-Golden试剂盒进行实施。
[0156] 辅助接头的酶切和去除
[0157] 根据辅助接头的不同设计方案中选择不同的酶,利用合适量的酶和通过延长酶切时间使接头尽可能彻底被酶切掉。考虑到酶切的不彻底性以及短片段辅助接头用普通试剂盒难去除干净,发明人在引物的5’端修饰生物素,通过用亲和素包被的磁珠结合生物素的方法去掉短片段的辅助接头和未被酶切的DNA片段。
[0158] DNA末端修复和测序接头连接
[0159] 经内切酶酶切的DNA片段末端首先进行修复成可以和测序adapter(Solexa,454,Solid)匹配的末端。以Solexa为例,经酶酶切的DNA片段末端,若为粘性末端,首先修复成平末端,然后在DNA平末端的3’端加“A”碱基,和Solexa公司提供的PE adapter形成“T-A”连接;若酶切末端为平末端,直接在DNA平末端的3’端加“A”碱基后和Solexa公司提供的PE adapter形成“T-A”连接。
[0160] PCR
[0161] 在DNA经过磺酸化(bisulfite)之后,Bisulfite-PCR的目的是将单链的DNA片段变成双链便于测序接头的连接。同时扩增DNA的量。Bisulfite PCR扩增用引物和磺酸化之后的辅助接头的序列进行匹配。
[0162] PE PCR在辅助接头酶切去除之后,加连接PE接头后扩增,扩增的目的是将DNA片段两端的PE分叉接头(forked PE adapter)变成可与测序引物匹配的序列。
[0163] 测序
[0164] 去除辅助接头后的DNA片段可直接用于后续Genome Sequencer FLX系统高通量测序的常规实验步骤如使用罗氏公司的GS FLX Standard DNA文库制备试剂盒;或Illumina公司Genome Analyzer(GA)系统高通量测序的常规实验步骤如使用Paired End DNA文库制备试剂盒构建常规Paired End DNA测序文库;也可以用于AB公司SOLiD系统的SOLiD Library Oligos试剂盒常规实验步骤进行高通量测序。实施例
[0165] 下面通过实施例对本发明的具体实施方式进行阐述,所述的实施方式仅仅用来解释和说明本发明,其并不限制本发明的保护范围。任何本领域技术人员根据公知的知识和现有技术的教导能够想到的等价的变体都包含在本发明的保护范围中。
[0166] 实施例1
[0167] 实施例中接头、qPCR检测引物与磺酸化处理后DNA的PCR扩增引物为人工合成序列由Invitrogen公司合成;所使用的C0T1 DNA购买于Invitrogen公司,qPCR检测使用AB公司的SYBR与配套试剂;EcoP15I酶购买于NEB公司。实施例的操作原理如图5所示。
[0168] 1.获取基因组DNA
[0169] 取血样1(取自志愿者)10毫升,用QIAamp DNA Blood Mini Kit(Qiagen公司)提取样品DNA。将提取得到的DNA编号为YH-1,取其中10微克DNA样品作为起始材料,参照图1的流程构建文库,本实施例中构建的是IlluminaGA System Paired End文库。
[0170] 2.片段化基因组DNA
[0171] 采用Covaris system(AB公司)将前述步骤1中的DNA样品进行断裂,样品断裂结束后,取约总量的1/30(体积比)的断裂后的样品在2%琼脂糖凝胶上进行1×TAE电泳检测,从所述电泳凝胶回收待测DNA片段。为将样品DNA片段控制在100~500bp范围内,Covaris system断裂具体操作为:
[0172] 1)双击打开Covaris主程序“SonoLAB S-Series V2.54”后点击“Start[Enter]”,待仪器排气30分钟,且水温降为10℃左右后方可使用。打开主程序之前须先确定打碎仪和冷却仪的电源开关是否打开,否则主程序会提示错误并重试。
[0173] 2)将样品加入待用的100ul的covaris micro Tube中,样品加入量5μg,最后将终体积用TE补至100μl,用移液器将样品溶液吹打混匀。点击“Configure”,设置参数:
[0174]
[0175] 选择模式为“Frequency Sweeping”。所有设置完成后点击“Save”或“Save As...”保存好程序,再点击“Return to Main Panel”回到主界面。将断裂管放入Covaris装置中,选择已保存程序,开始打碎。按所设置的程序打碎完成后关闭打碎仪和制冷仪的电源,然后关闭打碎主程序和电脑。
[0176] 3)将前述2)中断裂后的样品从玻璃管中吸出,放入1.5ml EP管中。取出3μl的样品用于2%琼脂糖凝胶进行1×TAE电泳检测,并用QIAquick PCR纯化试剂盒进行回收,产物溶于32μl的洗脱缓冲液(Elution buffer,EB)中。
[0177] 3.末端修复
[0178] 先从-20℃保存的试剂盒(Illumina Paired End测序文库构建试剂盒)中取出10×多聚核苷酸激酶缓冲液和10mM dNTPs mix,将其置于冰上融解并充分混匀10×多聚核苷酸激酶缓冲液。在1.5mL的离心管中配制100μL末端修复反应体系:取前述步骤
2最后获得的30μL的片段化回收产物、45uL超纯水、10μL 10×多聚核苷酸激酶缓冲液(B904)、4μL dNTP solution set(稀释混合为10mM each)、5μL T4 DNA聚合酶、1μL Klenow Fragment与5μL T4多聚核苷酸激酶。20℃温浴30分钟后,用QIAquick PCR纯化试剂盒回收纯化经过末端修复的DNA,将产物DNA溶于34μL的EB中。
[0179] 4.添加A碱基
[0180] 先从-20℃保存的试剂盒(Illumina Paired End测序文库构建试剂盒)中取出10x blue buffer和1mM dATP,将其置于冰上融解并使其充分混匀。在1.5mL的离心管中配制50μL的DNA末端加“A”反应的体系:32μL前述步骤3获得的末端修复纯化回收产物、
5μL 10x blue buffer、10μLdATP(稀释为1mM,GE公司)与3μL Klenow(3’-5’exo-)。
37℃温浴30分钟后用QIAquick PCR纯化试剂盒回收纯化加A体系中的DNA,将产物溶于
32μL的EB中。取1μL于NanoDrop 1000上测OD值并记录样品浓度、OD260/280比值以及OD260/230比值等参数。
[0181] 5.辅助接头1的连接
[0182] 从-20℃保存的试剂盒(Illumina Paired End测序文库构建试剂盒)中取出2×Rapid连接缓冲液和Alu Linker,将其置于冰上融解并充分混匀2×Rapid连接缓冲液。在1.5mL的离心管中配制100μL的连接反应体系:30μL步骤3得到的加A回收产物、
50μL 2x Rapid连接缓冲液、6μL(辅助接头)(50uM)(5’-AGCTGGGCACCGCTCATGCCACTCCGGCT,5’-pGCCGGAGTGGCATGAGCGGTGCCCAG)、10μLT4 DNA连接酶与4μL超纯水。20℃温浴
15分钟后用ZYMO DNA Clean & ConcentratorPTMP-5(ZYMO公司)回收纯化加有辅助接头
1的DNA,产物溶于40μL的TE中。
[0183] 6.甲基化DNA的免疫共沉淀(MeDIP)
[0184] (1)取来自步骤5的样品,参考步骤4 NanoDrop 1000测定结果,此时DNA为4μg左右,加TE补至体积为450μL,充分混匀。在98℃的水浴锅中处理10分钟,然后置于冰上10分钟。
[0185] (2)在样品中加入51μL的10×IP缓冲液和10μL Anti-5-MethylcytosineMouse mAb(Abcam公司),充分混匀;将样品竖直放置在rotator上,4℃孵育12小时。
[0186] (3)取30μL Dynabeads M-280山羊抗小鼠IgG(Invitrogen公司),用800μL0.1% PBS-BSA将磁珠洗涤2次,加入30μL 1×IP缓冲液混匀。
[0187] (4)将Dynabeads加到DNA-Antibody混合物中,4℃震荡混合3小时。
[0188] (5)用800μl 1×IP缓冲液将磁珠洗涤3次,第一次洗时在vertex上涡旋2-4秒,涡旋3次;后两次洗涤用移液器反复吹打混合。用磁力架收集后将上清移除。
[0189] (6)加入200μL蛋白水解酶K消化缓冲液和3μL蛋白水解酶K(50μg/μl),50℃烘箱中旋转3小时。
[0190] (7)用ZYMO DNA Clean & ConcentratorPTMP-5回收步骤(6)这一反应体系中的DNA,用7倍DNA溶液体积(步骤6)的结合缓冲液(binding buffer),溶于20μL经60℃水浴过的超纯水中。1μL于NanoDrop 1000上测得OD值并记录样品浓度,并Q-PCR检测MeDIP效果。
[0191] 7.C0T1 DNA去除重复序列
[0192] (1)重复序列的生物素标记:在1.5mL管中加入4μL C0T1 DNA(100ng/μL)(Invitrogen公司)、8μL随机引物(8N,1ug/μL)(Invitrogen)与25μL超纯水后97℃处理10分钟并置于冰上10分钟。然后继续加入5μL 10×Klenow缓冲液、5μL生物素/dNTP mix(Biotin-16-dUTP:0.35mM;dTTP:0.65mM;dCTP:1mM;dGTP:1mM;dATP:1mM.) 与3μL Klenow Enzyme(exo-,Fermentas)使最终反应体积为50μL。37℃处理过夜,第二天继续反应并补加1μL KlenowEnzyme,继续反应3-5小时。反应结束用QIAquick PCR纯化试剂盒回收纯化反应体系中的DNA,产物溶于100μL的EB中并用Nano-drop1000检测浓度。若总质量小于2μg,可认为标记失败,需重新标记。
[0193] (2)吸取100μL of Streptavidin- M-280(Invitrogen)到1.5mL不粘管,用800μL TE缓冲液或者1×B&W缓冲液(5mM Tris-HCL pH 7.5,0.5mM EDTA,1M NaCl)洗磁珠两次。
[0194] (3)将 磁 珠 重 新 悬 浮 于100μL 2×B&W 缓 冲 液 (10mM Tris-HCL pH7.5,1mMEDTA,2M NaCl)。
[0195] (4)将用生物素标记好的C0T-1 DNA(预先变性,97℃处理10分钟,后置于冰上10分钟)。加入悬浮磁珠中(步骤(3));
[0196] (5)常温低速旋转1小时;
[0197] (6)移除上清,1×B&W缓冲液轻洗两次。
[0198] (7)抽干MeDIP后的DNA样品,加入65℃预热的杂交液100μL,移至含有磁珠的不粘管,65℃翻转过夜。
[0199] (8)将磁珠上清移至新的1.5mL Eppendorf管,用ZYMO-5纯化,结合缓冲液量为7倍,22μL洗脱。1μL于NanoDrop 1000上测得OD值并记录样品浓度。
[0200] 8.亚硫酸氢盐处理(Bisulfite treatment)
[0201] 本实验使用ZYMO EZ DNA Methyla ion-Gold Kit PTMP(ZYMO公司)进行亚硫酸氢盐处理
[0202] (1)在PCR管中添加130μL的CT翻转试剂到每20μL DNA样品中。如果DNA样品的体积小于20μL,则用水来弥补差量。通过轻弹试管或移液器操作来混合样品。
[0203] (2)将样品管放到循环变温器并按以下步骤操作:98℃放置10分钟,64℃放置2.5小时后立刻进行下述操作或者在4℃下存储(最多20小时)。
[0204] (3)吸取600μL的M结合缓冲液到Zymo-Spin ICPTMP柱中,并将柱放如试剂盒所提供的收集管中。
[0205] (4)装填样品(从步骤2)到Zymo-Spin ICPTMP柱含有M结合缓冲液。盖上盖子将柱颠倒数次来混合样品。
[0206] (5)全速(>10,000×g)离心30秒,去除流出液。
[0207] (6)吸取200μL的M洗涤缓冲液到柱中,全速离心30秒。
[0208] (7)吸取200μL的M-Desulphonation缓冲液到柱中并且在室温(20℃-30℃)下放置15-20分钟。在培养后,全速离心30秒。
[0209] (8)吸取200μL的M洗涤缓冲液到柱中,全速离心30秒。再添加200μL的M洗涤缓冲液并且离心30秒。
[0210] (9)吸取20μL的M洗脱缓冲液到柱基质中,将柱放置在1.5mL的管中,全速离心来洗脱DNA。
[0211] 9.亚硫酸氢盐磺酸化处理后DNA的PCR扩增
[0212] (1)从-20℃保存的试剂盒中取出,将其置于冰上化冻并充分混匀JumpStartPTMP Taq DNA聚合酶。在0.2mL的PCR管中配制50μL的PCR反应体系:5μL亚硫酸氢盐处理纯化后产物、5μL 10×PCR缓冲液(Sigma)、4μL dNTP、0.5μL JumpStartPTMP Taq DNA聚合酶(Sigma)、2μL辅助接头引物1.0(10pmol/μL)(Invitrogen)、2μL辅助接头引物(10pmol/μL)(Biotin-5’-GGTCAGCAGCTAAACACCACTCATACCACTC CA,Biotin-5’-GGTCAGCAGTTGGGTATTGTTTATGTTATTTTGGT)(Invitrogen)与35.5μL超纯水。
[0213] (2)在热循环仪中运行下列扩增程序:94℃10秒、10个循环的94℃30秒/52℃30秒/72℃30秒、72℃5分钟于4℃存储。
[0214] (3)反应结束后用QIAquick PCR纯化试剂盒回收纯化反应体系中的DNA,产物溶于50μL的EB中。取1μL于NanoDrop 1000上测得OD值并记录样品浓度。
[0215] 10.酶切去除辅助接头1
[0216] (1)在1.5mL的离心管中配制100μL反应体系:PCR扩增产物(~350ng,不超过400ng),10μL 10×缓冲液3(NEB),1μL 100×BSA,2μL sinefungine(10mM),20μL10×ATP,3μL EcoP15I(10U/μL),补超纯水至100μL;
[0217] (2)37℃酶切过夜,第二天补1μL酶继续酶切2小时。ZYMO-5纯化,结合缓冲液用量为5倍,50μL洗脱;
[0218] (3)吸取50μL of Streptavidin- M-280(Invitrogen)到1.5mL不粘管,用800μL TE缓冲液或1×B&W缓冲液洗磁珠两次;
[0219] (4)将磁珠重悬于50μL 2×B&W缓冲液,加50μL酶切产物(step 2);
[0220] (5)常温旋转30分钟(转速小不超过600rpm);
[0221] (6)将磁珠上清移至新的1.5mL Eppendorf管中,用Qiagen(Mini)纯化,取1μL纯化产物于NanoDrop 1000上测得OD值并记录样品浓度。
[0222] 11.测序
[0223] 将步骤10中去除辅助接头1后的DNA片段直接用于后续Illumina公司Genome Analyzer(GA)系统,进行高通量测序,其采用的实验步骤参见使用Paired End DNA文库制备试剂盒构建常规Paired End DNA测序文库。
[0224] 实施例1的结果评价和分析
[0225] 1.MeDIP富集效果的检测
[0226] 对本发明使用的MeDIP方法的富集效果与商业MeDIP试剂盒(Diagenode)的富集效果进行比较(表1),其中甲基化富集效果(4994)为62.71%,大于Diagenode的甲基化富集效果,非甲基化的富集率(8804)为0.33%,小于Diagenode的非甲基化富集率。
[0227] 因此,本MeDIP方法的回收率达到商业MeDIP试剂盒(Diagenode)的回收率要求范围,并相对商业MeDIP试剂盒富集量大,因此认为该MeDIP方法可与商用试剂盒相媲美,其试验结果平行可信。
[0228] 表1.YH-1 DNA样品的MeDIP富集效率
[0229]
[0230] 2.对EcoP15I酶切效果的检测
[0231] 对EcoP15I酶切产物分别进行挑克隆后利用Sanger法测序,检测结果表明(表2),EcoP15I的酶切效率达86%。该酶的高酶切效率结果表明该Linker可被高效切除,对后续接头连接等实验没有干扰。
[0232] 表2.EcoP15I酶切效率检测
[0233]
[0234] 3.Sanger法测序库检
[0235] 对用本次发明的测序库样本制备技术所制备的测序库进行克隆处理并使用Sanger法进行小范围的测序检测。库检结果(表3)中有76%的reads能比对回基因组区,且其甲基化化率高达87%;亚硫酸盐(磺酸化)对非甲基化胞嘧啶的翻转率为99%;片段扩增重复率为零。
[0236] 表3:YH-1基因组甲基化免疫共沉淀后重复序列去除结合磺酸化处理文库Sanger法测序结果
[0237]
[0238] 实施例2
[0239] 实施例2的原理如图6所示,其中除了下述步骤与实施例一不同外,所有步骤与实施例1相同,用下述步骤5、9和10分别替代实施例一中的步骤5、9和10:
[0240] 5.辅助接头的连接
[0241] 从-20℃保存的试剂盒中取出2x Rapid连接缓冲液和Alu Linker,将其置于冰上融解并充分混匀2x Rapid连接缓冲液。在1.5mL的离心管中配制100μL的连接反应体系:30μL加A回收产物、50μL 2x Rapid连接缓冲液、6μL辅助接头(50uM)5m 5m
(5’-CTGGGCACCGCTCATGCCACTCCGGC TAAG CT,5’-pG CTTAGCCGGAGTGGCATGAGCGGTGCCCAG)、10μLT4 DNA连接酶与4μL超纯水。20℃温浴15分钟后用ZYMO DNA Clean & ConcentratorPTMP-5回收纯化连接有辅助接头中的DNA,产物溶于40μL的TE中。
[0242] 9.亚硫酸氢盐处理后DNA的PCR扩增(AluI linker介导的PCR反应)[0243] (1)从-20℃保存的试剂盒中取出,将其置于冰上化冻并充分混匀JumpStartPTMP Taq DNA聚合酶。在0.2mL的PCR管中配制50μL的PCR反应体系:5μL亚硫酸氢盐处理纯化后产物、5μL 10×PCR buffer(Sigma)、4μL dNTP、0.5μL JumpStartPTMP Taq DNA聚合酶(Sigma)、2μL Alu I引物1.0(10pmol/μL)(Invitrogen)、2μL辅助接头引物(10pmol/μL)(Biotin-5’-CTAAACACCACTCATACCACT CCA,Biotin-5’-TTGGGTATTGTTTATGTTATTTTGGT)(Invitrogen)与35.5μL超纯水。
[0244] (2)在热循环仪中运行下列扩增程序:94℃10秒、10个循环的94℃30秒/52℃30秒/72℃30秒、72℃5分钟与4℃存储。
[0245] (3)反应结束后用QIAquick PCR纯化试剂盒回收纯化反应体系中的DNA,产物溶于50μL的EB中。取1μL于NanoDrop 1000上测得OD值并记录样品浓度。
[0246] 10.酶切去除辅助接头
[0247] (1)在1.5mL的离心管中配制100μL反应体系:PCR扩增产物(<400ng)、10μL10×缓冲液2(NEB)、3μL Alu I,补超纯水至100μL;
[0248] (2)37℃酶切过夜,第二天补1μL酶继续酶切2小时。ZYMO-5纯化,结合缓冲液用量为5倍,50μL洗脱;
[0249] (3)吸取100μL的Streptavidin Dynabeads P P M-280(Invitrogen)到1.5mL不粘管,用800μL TE缓冲液或者1×B&W缓冲液洗磁珠两次;
[0250] (4)将磁珠重悬于50μL 2×B&W缓冲液。加入50μL(2)的酶切产物;
[0251] (5)常温旋转30分钟(转速小不超过600rpm);
[0252] (6)将磁珠上清移至新的1.5mL Eppendorf管,Qiagen(Mini)纯化,取1μL于NanoDrop 1000上测得OD值并记录样品浓度。
[0253] 实施例2的结果评价和分析
[0254] 1.辅助接头效率检测
[0255] 由于辅助接头中含有一个甲基化胞嘧啶,因此首先检测该甲基化位点是否对MeDIP有影响。对比辅助接头,设计和其对应的非甲基化接头。使用甲基化检测引物编号为4994与GAPDH两对、非甲基化检测引物编号为8804与TSH2B两对分别在MeDIP后对甲基化与非甲基化的辅助接头含量进去检测。检测结果(表4)所示,甲基化的辅助接头与非甲基化对应的富集率一致。因此对甲基化的辅助接头对MeDIP的本底影响可忽略。
[0256] 表4.甲基化与非甲基化辅助接头对MeDIP的影响验证
[0257]
[0258] 2.MeDIP富集效果的检测
[0259] 分别利用检测甲基化富集效果的引物(4994)和非甲基化富集效果的引物(8804)对MeDIP富集效果进行检测(表5),其中甲基化富集效果为45.6%,和Diagenode的甲基化富集效果(表2)相差无几,非甲基化的富集率为2.9%,尽量略高于Diagenode的非甲基化富集率,但远远低于甲基化的富集效果。因此,本次MeDIP富集DNA效率成功。
[0260] 表5.YH-1 DNA样品的MeDIP富集效率
[0261]
[0262] 3.对AluI酶切效果的检测
[0263] 对AluI酶酶切产物分别进行挑克隆后利用Sanger法测序,检测结果表明(表6),两次AluI酶的酶切效率分别为94%和100%。该酶切效率结果表明该Linker可被高效切除,对后续接头连接等实验没有干扰。
[0264] 表6.AluI的酶切效率检测
[0265]
[0266] 4.Sanger法测序库检
[0267] 对用本次发明的测序库样本制备技术所制备的测序库进行克隆处理并使用Sanger法进行小范围的测序检测。库检结果(表7)中有85%的reads能比对回基因组区,且其甲基化化率高达93%;说明连接AluI接头的DNA片段经过MeDIP处理能富集到基因组中大部分甲基化区域的序列。另外,高达97%的转化率说明亚硫酸盐(磺酸化)处理的效果也是非常明显的。因此,通过AluI接头连接的DNA片段经过MeDIP处理、重复序列去除、亚硫酸盐处理与AluI酶切后仍可得到有效的序列信息。文库检测合格并用于构建Illumina公司GA系统高通量测序的Paired End DNA文库与进行相应的测序。
[0268] 表7:YH-1基因组甲基化免疫共沉淀后重复序列去除结合磺酸化处理文库Sanger法测序结果
[0269]
[0270] 发明人仅仅在实施例1和2是仅用了平末端的辅助接头连接和去除方式(1)和(2)进行了说明。具有一定的代表性。由于平末端的辅助接头连接和去除方式(3)是平末端的辅助接头连接和去除方式(1)和(2)的综合,因此,平末端的辅助接头连接和去除方式(1)和(2)实施的成功可以说明(3)也可以成功。平末端相对粘性末端的原理在于连接接头的方式的不同,而平末端相对粘性末端连接效率低,因此,在平末端实施成功的情况下粘性末端的辅助接头连接和去除方式(4-6)定能实施成功。
[0271] 5.与亚硫酸氢盐测序法的有效数据比较
[0272] 在Illumina公司GA系统进行高通量测序,所述的测序是45cycle PairedEnd测序。具体测序流程与试剂均采用Illumina公司标准流程与试剂盒。测序结果产生2.53Gb数据,能比对(mapping)到参考基因组(homo sapienss)达一半,和其他亚硫酸氢盐测序比对率近似[H.Xiang等人,Singlebase-resolution methylome of the silkworm reveals a sparse epigenomicmap.Nat Biotechnol 28 516-20],具体结果可以参见表8。其中DNA平均甲基化水平达84.2%,全基因组甲基化测序的约70%甲基化水平相比说明MeDIP结合甲基化胞嘧啶的特异性较高。
[0273] 表8:YH-1基因组甲基化免疫共沉淀后重复序列去除结合磺酸化处理文库GA系统测序结果
[0274]
[0275] 6.与Sanger测序法比较文库的重复序列含量
[0276] 对45cycle Paired End测序数据的比对至基因组的序列进行高级生物信息分析,结果如表9所示,重复序列为30.87%,和Sanger测序法检测的MeDIP的重复序列含量比(75%)降低了一半多。以上结果说明该MeDIP结合bisulfite方法有很高的特异性,能有效的分离DNA甲基化片段和非甲基化片段。GA测序序列比对到重复序列区比率(30.8%),重复序列去除将近一半,降低了测序文库大小和冗余数据。
[0277] 表9 YH-1基因组甲基化免疫共沉淀后重复序列去除结合磺酸化处理文库GA系统测序其他参数结果
[0278]
[0279] 7.全基因磺酸化处理测序与本技术测序结果共同比对的单个CpG位点的测序深度分析
[0280] 对1号染色体采用MRERB方法和全基因组磺酸化处理测序结果进行比较,针对在基因组功能区共同比对到的CpG位点做测序深度比较发现,二者测序深度的趋势基本一致,具体参见图10。但是测序深度差4倍,因此,利用本发明的MRERB方法只需10G的数据将达到70G全基因组亚硫酸氢盐测序的水平,整体数据量降低了7倍。
[0281] 因此,通过对MRERB文库制备技术的Solexa测序数据初步分析表明该方法能够从全基因组中特异性的分离出甲基化DNA片段,并能去除大部分重复序列;经亚硫酸氢盐翻转之后,能对GA系统读取的序列进行比对、定位,并可以进行单个胞嘧啶的甲基化分析,可用于不同样本的甲基化检测。
[0282] 综上所述,本技术既能检测到基因组功能区DNA甲基化,又能精准比对单个胞嘧啶甲基化状态。在技术成本上,在功能区甲基化测序数据饱和的情况下可比全基因组亚硫酸氢盐测序的数据量少80%-90%,节约每个样本检测成本70-80%。