一种基于高通量测序的DNA标签文库构建方法转让专利

申请号 : CN201010299271.3

文献号 : CN102409048B

文献日 : 2013-10-23

相似专利: 请登录后查看

本发明提供了长度为7bp独特的标签序列，可以分别通过接头连接和PCR反应分别将标签序列导入DNA标签文库。本发明基于目前illumina公司的solexa测序平台提供了使用所述标签序列构建DNA标签文库的方法，应用于solexa DNA测序，提高了DNA标签文库的制备的效率，增大了DNA样品的测序通量，降低了单个样品的solexa测序费用。

1.一组DNA标签，所述DNA标签至少包括表2所示的59个DNA标签中的DNA Index1～DNA Index5。

2.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index6～DNA Index10。

3.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index11～DNA Index15。

4.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index16～DNA Index20。

5.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index21～DNA Index25。

6.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index26～DNA Index30。

7.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index31～DNA Index35。

8.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index36～DNA Index40。

9.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index41～DNA Index45。

10.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index46～DNA Index50。

11.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index51～DNA Index55。

12.权利要求1所述的一组DNA标签，其还包括表2所示的59个DNA标签中的DNA Index55～DNA Index59。

13.权利要求1-12中任一项所述的一组DNA标签用于构建DNA标签文库的用途，其中DNA标签文库的DNA标签接头在3’末端包含所述DNA标签，从而构成各自相对应的DNA标签接头。

14.权利要求13所述的用途，其中所述DNA标签接头用作DNA标签文库的接头。

15.权利要求13所述的用途，其中所述DNA标签插入DNA标签接头中的3’末端中，或通过或不通过连接子连接在DNA接头的3’末端。

16.权利要求15所述的用途，其中所述DNA标签插入DNA标签接头中的3’末端中。

17.权利要求16所述的用途，其中所述DNA标签距离DNA标签接头中的3’末端1个碱基插入DNA标签接头中。

18.通过权利要求1-12中任一项所述的DNA标签构建的DNA标签文库。

19.一组DNA标签接头，其中DNA标签文库的DNA标签接头在3’末端包含权利要求

1-12中任一项所述的标签，

所述DNA标签接头至少包括表3所示的59个DNA标签接头中的DNA Index1F/R_adapter～DNA Index5F/R_adapter。

20.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index6F/R_adapter～DNA Index10F/R_adapter。

21.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index11F/R_adapter～DNA Index15F/R_adapter。

22.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index16F/R_adapter～DNA Index20F/R_adapter。

23.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index21F/R_adapter～DNA Index25F/R_adapter。

24.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index26F/R_adapter～DNA Index30F/R_adapter。

25.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index31F/R_adapter～DNA Index35F/R_adapter。

26.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index36F/R_adapter～DNA Index40F/R_adapter。

27.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index41F/R_adapter～DNA Index45F/R_adapter。

28.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index46F/R_adapter～DNA Index50F/R_adapter。

29.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index51F/R_adapter～DNA Index55F/R_adapter。

30.权利要求19所述的一组DNA标签接头，其还包括表3所示的59个DNA标签接头中的DNA Index55F/R_adapter～DNA Index59F/R_adapter。

31.权利要求19-30中任一项所述的DNA标签接头用于构建DNA标签文库的用途。

32.权利要求31所述的用途，其中所述DNA标签接头用作DNA标签文库的接头。

33.通过权利要求19-30中任一项所述的DNA标签接头构建的DNA标签文库。

34.一种标签文库的构建方法，其包括：

1)提供n个DNA样品，n为整数且1≤n≤59的整数，所述DNA样品来自所有真核和原核DNA样品，包括但不限于人DNA样品；

2)将人基因组DNA打断，其中打断方法包括超声波打断方法；

3)末端修复；

4)DNA片段3’末端加“A”碱基；

5)连接DNA标签接头；

6)将步骤5)得到的连接产物进行凝胶回收纯化，并将各个DNA样品的回收产物混合在一起；

7)PCR反应，使用步骤6)的回收产物的混合物作为模板，在适于扩增目的核酸的条件下进行PCR扩增，将PCR产物进行胶回收纯化；

其中DNA标签接头如权利要求19-30中任一项所述。

35.权利要求34所述的方法，其中步骤1)中，n为整数且2≤n≤59。

36.权利要求34所述的方法，其中步骤2)中，使打断后的DNA条带集中在180bp左右。

37.权利要求34所述的方法，其中步骤5)中，每一个标签接头连接到DNA片段的两端。

38.权利要求34所述的方法，其中步骤6)中，连接产物通过2％的琼脂糖胶进行电泳并回收。

39.权利要求34所述的方法，其中步骤7)中，回收280～300bp的目的片段。

40.权利要求34所述的方法，其中步骤7)PCR反应中使用的引物选自与所使用DNA标签接头相对应的表4中的上游引物PCR1.0标签引物和表5中的下游引物PCR2.0标签引物。

41.通过权利要求34所述的方法构建的标签文库。

一种基于高通量测序的DNA标签文库构建方法

技术领域

[0001] 本发明涉及核酸测序技术领域，特别是高通量测序技术领域。另外，本发明还涉及标签技术，以及实现多个样品在同一反应体系中进行构建标签文库的方法。本发明的方法特别适用于第二代测序技术，尤其是solexa测序技术。

背景技术

[0002] Illumina公司提供的Solexa DNA测序平台，可在一个反应中同时加入四种带荧光标记的核苷酸，采用边合成边测序(Sequencing BySynthesis，SBS)，具有所需样品量少，高通量，高精确性，拥有简单易操作的自动化平台和功能强大等特点[1-4]。文库构建首先需要将目的片段进行末端修复，在目的片段的3’末端连接A碱基，将3’末端带有“A”碱基的目的片段与DNA接头连接，通过PCR反应将目的片段进行扩增，最后回收含有DNA接头的目的片段文库，见图1。目的片段文库与测序芯片上面的DNA接头进行杂交，通过桥式PCR进行扩增后，最后边合成边测序。在每个循环过程里，荧光标记的核苷和聚合酶被加入到单分子阵列中。互补的核苷和核苷酸片断的第一个碱基配对，通过酶加入到引物上。多余的核苷被移走。这样每个单链DNA分子通过互补碱基的配对被延伸，针对每种碱基的特定波长的激光激发结合上的核苷的标记，这个标记会释放出荧光，最后收集到的荧光信号来翻译成碱基序列。目前这种DNA建库方法可以根据需求运用于各种研究领域，如基因组的De Novo测序，基因组重测序、转录组测序和表观基因组测序等。

[0003] 基于上述建库方法illumina公司也推出了DNA标签(也称为index)建库方法，如图2所示。在DNA标签建库流程中，PCR过程使用了3条PCR标签引物，通过PCR导入标签来构建DNA标签文库[5]。专利申请WO2005068656A1和WO2008093098A2中公开了一种使用标签序列标记核酸样品的来源从而可以将样品进行混合测序的方法，可以通过PCR的过程将特定的核苷酸序列(标签序列)通过PCR导入到文库中，PCR标签引物序列见表1。这些带有标签的文库可以根据需求进行任意混合，然后通过solexa测序仪器进行测序，最后将数据按标签标签序列进行分类。

[0004] 但是illumina公司提供的标签文库制备的方法存在着一些缺陷：第一、目前illumina公司只提供12个长度为6bp的标签序列，标签的数量较少，随着solexa测序通量的增加，不能对大量样本进行混合测序将是一个巨大的缺陷；第二、目前illumina公司提供的标签建库方法是通过PCR反应将标签序列导入到目的片段文库中，需要3条PCR引物对目的片段进行扩增(两条公用引物和一条PCR标签引物，如表1)，而且PCR扩增效率不高。

[0005] 在标签混合量少于12个样品的情况下，必须考虑到混合后的标签上的每个碱基位点的GT含量。因为solexa测序过程中，碱基G和T的激发荧光一样，碱基A和C的激发光是一样的，因此必须考虑碱基“GT”含量与碱基“AC”含量的“平衡”，最适碱基“GT”含量为50％，能保证标签识别率最高。

[0006] 因此将标签引物进行优化和改进就十分必要了，不仅能提高文库制备的效率和标签的识别率，也能提高目前DNA样品的测序通量，极大的降低了单个文库的测序费用。

[0007] 表1illumina公司提供的标签序列及PCR标签引物(indexN PCR引物)序列[0008]

发明内容

[0010] 基于目前illumina公司的solexa测序平台提供的DNA标签文库制备方法，本发明改良了index序列，分别设计了长度为7bp独特的index序列，可以通过接头连接和PCR反应导入组合标签序列，成功的建立了DNA标签文库的建库方法，并应用于solexa DNA测序，提高了DNA标签文库的制备的效率，极大的增大了DNA样品的测序通量，降低了单个样品的solexa测序费用。

[0011] 标签设计首先需要考虑标签序列之间的可识别性和识别率的问题，然后需要考虑标签序列混合之后的每个位点的GT与AC碱基含量的平衡问题，最后考虑数据产出的可重复性和准确性。在设计标签的过程中，本发明充分考虑到以上几个因素，同时避免了标签的核酸序列出现3或3个以上连续的碱基，这样可以降低序列在合成过程中或测序过程中的错误率。同时尽量避免标签引物自身形成发夹结构，而导致PCR反应扩增效率。

[0012] 本发明对illumina提供的DNA接头(也称为adapter)和标签PCR引物序列进行优化，将标签设计为长度为7bp的特殊序列，通过标签接头的连接将标签导入，另外将illumina公司提供的的3条DNA标签PCR引物优化为两条PCR引物导入标签，通过接头连接和PCR反应导入组合标签序列。优化后的标签序列，与illumina公司的DNA标签引物相比，提高了PCR扩增反应的效率，并提高了标签序列的识别效率。如图3所示为illumina公司的DNA标签建库流程图，图4为优化后的DNA标签建库实验流程图。

[0013] 本发明基于目前illumina公司提供的Solexa Paired End测序平台，设计一段长度为7bp的特定标签核酸序列。通过测试PCR标签引物的扩增效率和标签核酸序列的识别率，最后优化并筛选出59条长度为7bp的DNA标签序列(如表2，7bp的DNA标签序列)及DNA标签PCR引物。这些长度为7bp的标签之间的差异在3个碱基，即至少3个碱基序列不同。表3为DNA标签接头序列及其标签序列。表4为PCR1.0标签引物序列及其标签序列。表5为PCR2.0标签引物序列及其标签序列。将长度为7bp的标签嵌DNA标签接头中、PCR1.0标签引物和PCR2.0标签引物中，预测形成的二级结构及稳定的能量值见以下说明；通过DNA标签接头、PCR1.0标签引物和PCR2.0标签引物中的标签进行排列组合，最终可以构建庞大的标签集群，满足高通量测序的需求。当标签的7个碱基中的任意一个碱基出现测序错误或合成错误，都不影响到标签的最终识别。

[0014] 表2：长度为7bp的DNA标签序列(DNA indexN)

[0015]

[0016] 表3：DNA标签接头序列(其由正反2个互补序列DNA Index-NF_adapter和DNA Index-NR_adapter组成)及其标签序列，序列均以5’-3’方向表示。正反2个互补序列DNA Index-NF/R_adapter等摩尔退火后形成DNA标签接头。退火条件为：DNA Index-NF/R_adapter等摩尔量混合后，95℃10min，70℃10min，65℃10min，60℃10min，55℃10min，50℃10min，4℃∞。升温至95℃后，所有降温速度控制为每秒0.1℃缓慢降温，让两条引物序列结合在一起形成Y型结构的PCR-Free标签接头。

[0017]

[0018]

[0019]

[0020]

[0021]

[0022]

[0023]

[0024]

[0025] 使用Lasergene的PrimerSelect软件预测59个DNA标签接头(DNA indexN adapter)的最稳定接头序列(the most stable dimeroverrall)及能量值，其中标签长度为7bp。

[0026] DNA index1adapter

[0027] The most stable dimer overall：20bp，-40.3kcal/mol

[0028] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCAT 3′

[0029] ::: : ||||||||||||||||||||

[0030] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATTGGCGT 5′

[0031] DNA index2adapter

[0032] The most stable dimer overall：20bp，-38.3kcal/mol

[0033] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGAGGCT 3′

[0034] ::: : ||||||||||||||||||||

[0035] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATTCTCCG 5′

[0036] DNA index3adapter

[0037] The most stable dimer overall：20bp，-37.4kcal/mol

[0038] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGCTTGT 3′

[0039] ::: : ||||||||||||||||||||

[0040] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATTCGAAC 5′

[0041] DNA index4adapter

[0042] The most stable dimer overall：20bp，-40.5kcal/mol

[0043] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGCCGT 3′

[0044] ::: : ||||||||||||||||||||

[0045] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATTACGGC 5′

[0046] DNA index5adapter

[0047] The most stable dimer overall：20bp，-34.5kcal/mol

[0048] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTACATATGT 3′

[0049] ::: : ||||||||||||||||||||

[0050] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATGTATAC 5′

[0051] DNA index6adapter

[0052] The most stable dimer overall：20bp，-36.2kcal/mol

[0053] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTACCACTCT 3′

[0054] ::: : ||||||||||||||||||||

[0055] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATGGTGAG 5′

[0056] DNA index7adapter

[0057] The most stable dimer overall：20bp，-36.5kcal/mol

[0058] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTACCTTCTT 3′

[0059] ::: : ||||||||||||||||||||

[0060] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATGGAAGA 5′

[0061] DNA index8adapter

[0062] The most stable dimer overall：20bp，-35.0kcal/mol

[0063] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTCAACT 3′

[0064] ::: : ||||||||||||||||||||

[0065] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATGAGTTG 5′

[0066] DNA index9adapter

[0067] The most stable dimer overall：20bp，-36.7kcal/mol

[0068] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGAATCCT 3′

[0069] ::: : ||||||||||||||||||||

[0070] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATCTTAGG 5′

[0071] DNA index10adapter

[0072] The most stable dimer overall：20bp，-36.5kcal/mol

[0073] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGTCAGT 3′

[0074] ::: : ||||||||||||||||||||

[0075] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATCCAGTC 5′

[0076] DNA index11adapter

[0077] The most stable dimer overall：20bp，-35.0kcal/mol

[0078] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGTCTGAT 3′

[0079] ::: : ||||||||||||||||||||

[0080] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATCAGACT 5′

[0081] DNA index12adapter

[0082] The most stable dimer overall：20bp，-35.3kcal/mol

[0083] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTAGTTGTTT 3′

[0084] ::: : ||||||||||||||||||||

[0085] 3′CACTGACC TCAAGT CTGCACACGAGAAGGC TAGATCAACAA 5′

[0086] DNA index13adapter

[0087] The most stable dimer overall：20bp，-34.8kcal/mol

[0088] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTATCATAAT 3′

[0089] ::: : ||||||||||||||||||||

[0090] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATAGTATT 5′

[0091] DNA index14adapter

[0092] The most stable dimer overall：20bp，-40.1kcal/mol

[0093] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTATCGCGTT 3′

[0094] ::: : ||||||||||||||||||||

[0095] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATAGCGCA 5′

[0096] DNA index15adapter

[0097] The most stable dimer overall：20bp，-36.7kcal/mol

[0098] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTATGCACTT 3′

[0099] ::: : ||||||||||||||||||||

[0100] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATACGTGA 5′

[0101] DNA index16adapter

[0102] The most stable dimer overall：20bp，-34.8kcal/mol

[0103] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTATTGATAT 3′

[0104] ::: : ||||||||||||||||||||

[0105] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGATAACTAT 5′

[0106] DNA index17adapter

[0107] The most stable dimer overall：20bp，-37.6kcal/mol

[0108] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCAAGGATT 3′

[0109] ::: : ||||||||||||||||||||

[0110] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGTTCCTA 5′

[0111] DNA index18adapter

[0112] The most stable dimer overall：20bp，-38.8kcal/mol

[0113] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCACGACCT 3′

[0114] ::: : ||||||||||||||||||||

[0115] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGTGCTGG 5′

[0116] DNA index 19adapter

[0117] The most stable dimer overall：20bp，-40.8kcal/mol

[0118] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCATCCGCT 3′

[0119] ::: : ||||||||||||||||||||

[0120] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGTAGGCG 5′

[0121] DNA index20adapter

[0122] The most stable dimer overall：20bp，-40.3kcal/mol

[0123] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCCGCTAAT 3′

[0124] ::: : ||||||||||||||||||||

[0125] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGGCGATT 5′

[0126] DNA index21adapter

[0127] The most stable dimer overall：20bp，-37.7kcal/mol

[0128] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTACCTT 3′

[0129] ::: : ||||||||||||||||||||

[0130] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGGATGGA 5′

[0131] DNA index22adapter

[0132] The most stable dimer overall：20bp，-38.9kcal/mol

[0133] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTGAGGT 3′

[0134] ::: : ||||||||||||||||||||

[0135] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGGACTCC 5′

[0136] DNA index23adapter

[0137] The most stable dimer overall：20bp，-36.9kcal/mol

[0138] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCGATAGAT 3′

[0139] ::: : ||||||||||||||||||||

[0140] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGCTATCT 5′

[0141] DNA index24adapter

[0142] The most stable dimer overall：20bp，-42.6kcal/mol

[0143] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCGCACGGT 3′

[0144] ::: : ||||||||||||||||||||

[0145] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGCGTGCC 5′

[0146] DNA index25adapter

[0147] The most stable dimer overall：20bp，-40.5kcal/mol

[0148] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCGCGTTAT 3′

[0149] ::: : ||||||||||||||||||||

[0150] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGCGCAAT 5′

[0151] DNA index26adapter

[0152] The most stable dimer overall：20bp，-36.9kcal/mol

[0153] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTAATCT 3′

[0154] ::: : ||||||||||||||||||||

[0155] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGCATTAG 5′

[0156] DNA index27adapter

[0157] The most stable dimer overall：20bp，-34.4kcal/mol

[0158] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTAACTAT 3′

[0159] ::: : ||||||||||||||||||||

[0160] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGATTGAT 5′

[0161] DNA index28adapter

[0162] The most stable dimer overall：20bp，-36.7kcal/mol

[0163] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTAGTCGT 3′

[0164] ::: : ||||||||||||||||||||

[0165] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGATCAGC 5′

[0166] DNA index29adapter

[0167] The most stable dimer overall：20bp，-35.2kcal/mol

[0168] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTCTATTT 3′

[0169] ::: : ||||||||||||||||||||

[0170] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGAGATAA 5′

[0171] DNA index30adapter

[0172] The most stable dimer overall：20bp，-35.6kcal/mol

[0173] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTCTGTGACT 3′

[0174] ::: : ||||||||||||||||||||

[0175] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAGACACTG 5′

[0176] DNA index31adapter

[0177] The most stable dimer overall：20bp，-36.1kcal/mol

[0178] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGAACATCT 3′

[0179] ::: : ||||||||||||||||||||

[0180] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACTTGTAG 5′

[0181] DNA index32adapter

[0182] The most stable dimer overall：20bp，-35.0kcal/mol

[0183] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGACTCTAT 3′

[0184] ::: : ||||||||||||||||||||

[0185] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACTGAGAT 5′

[0186] DNA index33adapter

[0187] The most stable dimer overall：20bp，-37.4kcal/mol

[0188] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGAGTGCTT 3′

[0189] ::: : ||||||||||||||||||||

[0190] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACTCACGA 5′

[0191] DNA index34adapter

[0192] The most stable dimer overall：20bp，-35.8kcal/mol

[0193] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGATTAAGT 3′

[0194] ::: : ||||||||||||||||||||

[0195] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACTAATTC 5′

[0196] DNA index35adapter

[0197] The most stable dimer overall：20bp，-38.3kcal/mol

[0198] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCAGGTAT 3′

[0199] ::: : ||||||||||||||||||||

[0200] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACGTCCAT 5′

[0201] DNA index36adapter

[0202] The most stab1e dimer overall：20bp，-37.6kcal/mol

[0203] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCATCACT 3′

[0204] ::: : ||||||||||||||||||||

[0205] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACGTAGTG 5′

[0206] DNA index37adapter

[0207] The most stable dimer overall：20bp，-41.1kcal/mol

[0208] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCGAATT 3′

[0209] ::: : ||||||||||||||||||||

[0210] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACGGCTTA 5′

[0211] DNA index38adapter

[0212] The most stable dimer overall：20bp，-39.3kcal/mol

[0213] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCGATGTT 3′

[0214] ::: : ||||||||||||||||||||

[0215] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACGCTACA 5′

[0216] DNA index39adapter

[0217] The most stable dimer overall：20bp，-42.9kcal/mol

[0218] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGCTCGCGT 3′

[0219] ::: : ||||||||||||||||||||

[0220] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACGAGCGC 5′

[0221] DNA index40adapter

[0222] The most stable dimer overall：20bp，-40.4kcal/mol

[0223] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGGAGCCTT 3′

[0224] ::: : ||||||||||||||||||||

[0225] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACCTCGGA 5′

[0226] DNA index41adapter

[0227] The most stable dimer overall：20bp，-39.5kcal/mol

[0228] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGGCAACAT 3′

[0229] ::: : ||||||||||||||||||||

[0230] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACCGTTGT 5′

[0231] DNA index42adapter

[0232] The most stable dimer overall：20bp，-39.8kcal/mol

[0233] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGGCCTAGT 3′

[0234] ::: : ||||||||||||||||||||

[0235] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACCGGATC 5′

[0236] DNA index43adapter

[0237] The most stable dimer overall：20bp，-38.6kcal/mol

[0238] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGGTGGACT 3′

[0239] ::: : ||||||||||||||||||||

[0240] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACCACCTG 5′

[0241] DNA index44adapter

[0242] The most stable dimer overall：20bp，-37.9kcal/mol

[0243] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGTACGGTT 3′

[0244] ::: : ||||||||||||||||||||

[0245] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACATGCCA 5′

[0246] DNA index45adapter

[0247] The most stable dimer overall：20bp，-39.5kcal/mol

[0248] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGTGGCAAT 3′

[0249] ::: : ||||||||||||||||||||

[0250] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACACCGTT 5′

[0251] DNA index46adapter

[0252] The most stable dimer overall：20bp，-35.8kcal/mol

[0253] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTGTTATTGT 3′

[0254] ::: : ||||||||||||||||||||

[0255] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGACAATAAC 5′

[0256] DNA index47adapter

[0257] The most stable dimer overall：20bp，-39.0kcal/mol

[0258] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTAATCGGT 3′

[0259] ::: : ||||||||||||||||||||

[0260] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAATTAGCC 5′

[0261] DNA index48adapter

[0262] The most stable dimer overall：20bp，-34.9kcal/mol

[0263] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTATAAGAT 3′

[0264] ::: : ||||||||||||||||||||

[0265] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAATATTCT 5′

[0266] DNA index49adapter

[0267] The most stable dimer overall：20bp，-35.2kcal/mol

[0268] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTATCTCTT 3′

[0269] ::: : ||||||||||||||||||||

[0270] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAATAGAGA 5′

[0271] DNA index50adapter

[0272] The most stable dimer overall：20bp，-37.7kcal/mol

[0273] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTCCAGAGT 3′

[0274] ::: : ||||||||||||||||||||

[0275] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAAGGTCTC 5′

[0276] DNA index51adapter

[0277] The most stable dimer overall：20bp，-39.4kcal/mol

[0278] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTCGGACAT 3′

[0279] ::: : ||||||||||||||||||||

[0280] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAAGCCTGT 5′

[0281] DNA index52adapter

[0282] The most stable dimer overall：20bp，-37.9kcal/mol

[0283] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTCGTCTTT 3′

[0284] ::: : ||||||||||||||||||||

[0285] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAAGCAGAA 5′

[0286] DNA index53 adapter

[0287] The most stable dimer overall：20bp，-35.7kcal/mol

[0288] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGATTATT 3′

[0289] ::: : ||||||||||||||||||||

[0290] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAACTAATA 5′

[0291] DNA index54adapter

[0292] The most stable dimer overall：20bp，-39.2kcal/mol

[0293] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGCCAGTT 3′

[0294] ::: : ||||||||||||||||||||

[0295] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAACGGTCA 5′

[0296] DNA index55adapter

[0297] The most stable dimer overall：20bp，-41.0kcal/mol

[0298] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGCTGCCT 3′

[0299] ::: : ||||||||||||||||||||

[0300] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAACGACGG 5′

[0301] DNA index56adapter

[0302] The most stable dimer overall：20bp，-40.3kcal/mol

[0303] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGCGTAT 3′

[0304] ::: : ||||||||||||||||||||

[0305] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAACCGCAT 5′

[0306] DNA index57adapter

[0307] The most stable dimer overall：20bp，-35.9kcal/mol

[0308] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTTACAAGT 3′

[0309] ::: : ||||||||||||||||||||

[0310] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAAATGTTC 5′

[0311] DNA index58adapter

[0312] The most stable dimer overall：20bp，-39.7kcal/mol

[0313] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGACCGT 3′

[0314] ::: : ||||||||||||||||||||

[0315] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAAACTGGC 5′

[0316] DNA index59adapter

[0317] The most stable dimer overall：20bp，-39.5kcal/mol

[0318] 5′TACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGGTGCT 3′

[0319] ::: : ||||||||||||||||||||

[0320] 3′CACTGACCTCAAGTCTGCACACGAGAAGGCTAGAAACCACG 5′

[0321] 表4：PCR1.0标签引物序列(PCR1.0_index_N primer)及其标签序列

[0322]

[0323]

[0324]

[0325]

[0326]

[0327] 表5：PCR2.0标签引物序列(PCR2.0_index_N primer)及其标签序列

[0328]

[0329]

[0330]

[0331]

[0332]

附图说明

[0333] 图1：llumina公司提供的常规DNA建库流程示意图。

[0334] 图2：illumina公司提供的常规DNA标签建库流程示意图。

[0335] 图3：illumina公司的DNA标签建库流程图。其中DNA insert表示目的插入片段。

[0336] 图4：优化后的DNA标签建库流程图。

[0337] 图5：构建的DNA标签文库及不同位置的标签组合。

[0338] 图6：构建的DNA标签文库及不同位置的标签组合。

[0339] 图7：构建的DNA标签文库及不同位置的标签组合。

[0340] 图8为构建的DNA标签组合文库电泳检测结果，目的片段文库如箭头所指，为800bp；D2000marker条带大小依次为：2000bp、1000bp、750bp、500bp、250bp、100bp；1、D2000marker；2、IndextagA-1；3、Index tagA-2；4、Index tagA-3；5、Index tagA-58；6、Index tagA-59；7、Index tagB-2；8、Index tagB-3；9、Index tagB-58；10、Index tagB-59；
11、Index tagC-2；12、Index tagC-3；13、IndextagC-58；14、D2000marker；文库大小与预期大小一致，文库构建成功。

具体实施方式

[0341] 下面将结合实施例对本发明的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本发明，而不应视为限定本发明的范围。

[0342] 按图4优化的DNA标签建库流程进行构建DNA标签文库

[0343] 本发明一方面提供了一组DNA标签，所述DNA标签包括如下或由如下组成：表2所示DNA标签或与之相差1个碱基的DNA标签中的至少5个，或至少10个，或至少15个，或至少20个，至少25个，或至少30个，或至少35个，或至少40个，或45个，或至少50个，或至少55个，或全部59个，

[0344] 所述DNA标签优选地至少包括表2所示的59个DNA标签的DNAIndex1～DNA Index5，或 DNA Index6～ DNA Index10，或DNAIndex11 ～DNA Index15，或 DNA Index16～DNA Index20，或DNAIndex21～DNA Index25，或DNA Index26～DNA Index30，或DNAIndex31～DNA Index35，或DNA Index36～DNA Index40，或DNAIndex41～DNA Index45，或DNA Index46～DNA Index50，或DNAIndex51～DNA Index55，或DNA Index55～DNA Index59，或者他们任何两个或多个的组合。

[0345] 在本发明的一个具体实施方式中，所述DNA标签中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。

[0346] 在本发明的一个具体实施方式中，提供了所述的DNA标签用于构建DNA标签文库的用途，其中DNA标签文库的DNA标签接头在3’末端包含所述DNA标签，从而构成各自相对应的DNA标签接头，所述DNA标签接头优选地用作DNA标签文库的接头。

[0347] 在本发明的一个具体实施方式中，本发明提供的用途中，所述DNA标签插入DNA标签接头中的3’末端中，或通过或不通过连接子连接在DNA接头的3’末端，优选地插入DNA标签接头中的3’末端中；更优选地距离DNA标签接头中的3’末端1个碱基插入DNA标签接头中。

[0348] 在本发明的一个具体实施方式中，进一步提供了通过上文所述的DNA标签构建的DNA标签文库。

[0349] 本发明另一方面提供了含有上文所述的DNA标签的一组DNA标签接头，其中DNA标签文库的DNA标签接头在3’末端包含所述的标签，并且优选地用作接头，所述一组所述DNA标签接头包括如下或由如下组成：表3所示59个DNA标签接头或与其所包含的DNA标签序列相差1个碱基的DNA标签接头中的至少5个，或至少10个，或至少15个，或至少20个，至少25个，或至少30个，或至少35个，或至少40个，或45个，或至少50个，或至少55个，或全部59个，

[0350] 所述DNA标签接头优选地至少包括表3所示的59个DNA标签接头中的DNA Index1F/R_adapter ～ DNA Index5F/R_adapter，或 DNAIndex6F/R_adapter ～DNA Index10F/R_adapter，或DNAIndex11F/R_adapter～DNA Index15F/R_adapter，或DNAIndex16F/R_adapter～DNA Index20F/R_adapter，或DNAIndex21F/R_adapter～DNA Index25F/R_adapter，或 DNAIndex26F/R_adapter～ DNA Index30F/R_adapter，或DNAIndex31F/R_adapter～DNA Index35F/R_adapter，或DNAIndex36F/R_adapter～DNA Index40F/R_adapter，或DNAIndex41F/R_adapter～DNA Index45F/R_adapter，或DNAIndex46F/R_adapter～DNA Index50F/R_adapter，或DNAIndex51F/R_adapter～DNA Index55F/R_adapter，或DNAIndex55F/R_adapter～DNA Index59F/R_adapter，或者他们任何两个或多个的组合。

[0351] 在本发明的一个具体实施方式中，本发明所提供的DNA标签接头中，所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。

[0352] 在本发明的一个具体实施方式中，还提供了所述DNA标签接头用于构建DNA标签文库的用途，优选地所述DNA标签接头用作DNA标签文库的接头。

[0353] 在本发明的一个具体实施方式中，本发明进一步提供了通过所述DNA标签接头构建的DNA标签文库。

[0354] 本发明另一方面还提供了一组PCR标签引物，所述PCR标签引物与上文所述本发明提供的DNA标签接头相对应，所述PCR标签引物包括上游引物PCR1.0标签引物和下游引物PCR2.0标签引物，其中

[0355] 所述PCR1.0标签引物包括如下或由如下组成：表4所示59个PCR1.0标签引物或与其所包含的DNA标签序列相差1个碱基的PCR1.0标签引物中的至少5个，或至少10个，或至少15个，或至少20个，至少25个，或至少30个，或至少35个，或至少40个，或45个，或至少50个，或至少55个，或全部59个，

[0356] 所述PCR1.0标签引物优选地至少包括表3所示的59个PCR1.0标签引物中的PCR1.0_Index_1primer～PCR1.0_Index_5primerr，或PCR1.0_Index_6primer～PCR1.0_Index_10primerr，或PCR1.0_Index_11primer～PCR1.0_Index_15primerr，或 PCR1.0_Index_16primer ～ PCR1.0_Index_20primerr，或 PCR1.0_Index_21primer ～ PCR1.0_Index_25primerr，或PCR1.0_Index_26primer～PCR1.0_Index_30primerr，或 PCR1.0_Index_31primer ～ PCR1.0_Index_35primerr，或 PCR1.0_Index_36primer ～ PCR1.0_Index_40primerr，或PCR1.0_Index_41primer～PCR1.0_Index_45primerr，或 PCR1.0_Index_46primer ～ PCR1.0_Index_50primerr，或 PCR1.0_Index_51primer ～ PCR1.0_Index_55primerr，或PCR1.0_Index_55primer～PCR1.0_Index_59primerr，或者他们任何两个或多个的组合；并且

[0357] 所述PCR2.0标签引物包括如下或由如下组成：表5所示59个PCR2.0标签引物或与其所包含的DNA标签序列相差1个碱基的PCR2.0标签引物中的至少5个，或至少10个，或至少15个，或至少20个，至少25个，或至少30个，或至少35个，或至少40个，或45个，或至少50个，或至少55个，或全部59个，

[0358] 所述PCR2.0标签引物优选地至少包括表5所示的59个PCR2.0标签引物中的PCR2.0_Index_1primer～PCR2.0_Index_5primerr，或PCR2.0_Index_6primer～PCR2.0_Index_10primerr，或PCR2.0_Index_11primer～PCR2.0_Index_15primerr，或 PCR2.0_Index_16primer ～ PCR2.0_Index_20primerr，或 PCR2.0_Index_21primer ～ PCR2.0_Index_25primerr，或PCR2.0_Index_26primer～PCR2.0_Index_30primerr，或 PCR2.0_Index_31primer ～ PCR2.0_Index_35primerr，或 PCR2.0_Index_36primer ～ PCR2.0_Index_40primerr，或PCR2.0_Index_41primer～PCR2.0_Index_45primerr，或 PCR2.0_Index_46primer ～ PCR2.0_Index_50primerr，或 PCR2.0_Index_51primer ～ PCR2.0_Index_55primerr，或PCR2.0_Index_55primer～PCR2.0_Index_59primerr，或者他们任何两个或多个的组合。

[0359] 在本发明的一个具体实施方式中，本发明所提供的PCR标签引物中，所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。

[0360] 在本发明的一个具体实施方式中，本发明提供了所述PCR标签引物用于构建DNA标签文库的用途。

[0361] 在本发明的一个具体实施方式中，本发明还提供了通过上文所述的PCR标签引物构建的DNA标签文库。

[0362] 本发明另一方面进一步提供了一种标签文库的构建方法，所述方法的特征在于使用包含标签的DNA接头来构建标签文库。

[0363] 在本发明的一个具体实施方式中，本发明提供了一种标签文库的构建方法，所述的方法包括：

[0364] 1)提供n个DNA样品，n为整数且1≤n≤59的整数，优选地n为整数且2≤n≤59，所述DNA样品来自所有真核和原核DNA样品，包括但不限于人DNA样品；

[0365] 2)将人基因组DNA打断，其中打断方法包括但不限于超声波打断方法，优选地使打断后的DNA条带集中在180bp左右；

[0366] 3)末端修复；

[0367] 4)DNA片段3’末端加“A”碱基；

[0368] 5)连接DNA标签接头，其中优选地每一个标签接头连接到DNA片段的两端，；

[0369] 6)将步骤5)得到的连接产物进行凝胶回收纯化，优选地通过2％的琼脂糖胶进行电泳并回收，并将各个DNA样品的回收产物混合在一起；

[0370] 7)PCR反应，使用步骤6)的回收产物的混合物作为模板，在适于扩增目的核酸的条件下进行PCR扩增，将PCR产物进行胶回收纯化，优选地回收280～300bp的目的片段。

[0371] 在本发明的一个具体实施方式中，本发明所提供的方法中，DNA标签文库的DNA标签接头包括如下或由如下组成：表3所示59个DNA标签接头或与其所包含的DNA标签序列相差1个碱基的DNA标签接头中的至少5个，或至少10个，或至少15个，或至少20个，至少25个，或至少30个，或至少35个，或至少40个，或45个，或至少50个，或至少55个，或全部59个，

[0372] 所述DNA标签接头优选地至少包括表3所示的59个DNA标签接头中的DNA Index1F/R_adapter ～ DNA Index5F/R_adapter，或 DNAIndex6F/R_adapter ～ DNA Index10F/R_adapter，或 DNAIndex11F/R_adapter ～ DNA Index15F/R_adapter，或DNAIndex16F/R_adapter ～ DNA Index20F/R_adapter，或 DNAIndex21F/R_adapter ～DNA Index25F/R_adapter，或 DNAIndex26F/R_adapter～ DNA Index30F/R_adapter，或DNAIndex31F/R_adapter～DNA Index35F/R_adapter，或DNAIndex36F/R_adapter～DNA Index40F/R_adapter，或DNAIndex41F/R_adapter～DNA Index45F/R_adapter，或DNAIndex46F/R_adapter～DNA Index50F/R_adapter，或DNAIndex51F/R_adapter～DNA Index55F/R_adapter，或DNAIndex55F/R_adapter～DNA Index59F/R_adapter，或者他们任何两个或多个的组合。

[0373] 在本发明的一个具体实施方式中，本发明所提供的方法中，所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。

[0374] 在本发明的一个具体实施方式中，本发明所提供的方法中，步骤7)PCR反应中使用的引物是如权利要求10或11所述的PCR Primer1.0和PCR Primer 2.0。

[0375] 在本发明的一个具体实施方式中，本发明进一步还提供了通过上文所述的方法构建的标签文库。

[0376] 主要实验仪器及试剂

[0377]

[0378]

[0379]

[0380]

[0381] 1.1DNA模板准备

[0382] pMD18-T质粒载体 (日本 takara)，为模板，使用PrimerPremier5.0 软件设计引物，pMD18-T 引物 1：CGGGGAGAGGCGGTTTGCGTATTGG；pMD18-T 引物 2：TTTTGTGATGCTCGTCAGGGGGGCG；PCR扩增产物长度为250bp的片段，使用NanoDrop 1000仪器(美国NanoDrop)检测扩增产物的浓度，然后根据浓度取1ug的该PCR产物作为文库构建的插入片段，补水使其体积至35μL。

[0383] pMD18-T质粒DNA模板 2μL

[0384] Taq酶 0.5μL

[0385] pMD18-T引物1 1μL

[0386] pMD18-T引物2 1μL

[0387] dNTP混合液 5μL

[0388] 10×PCR缓冲液 5μL

[0389] ddH2O 35.5μL

[0390] 总体积 50μL

[0391] PCR反应条件

[0392] 98℃ 30s

[0393]

[0394] 72℃ 5min

[0395] 4℃ 保存

[0396] 然后PCR产物用QIAquick PCR纯化试剂盒进行纯化

[0397] 1.2末端修复[6]

[0398] 按照下列的配比准备反应混合：

[0399] DNA模板 35μL

[0400] T4DNA连接酶缓冲液 50μL

[0401] dNTPs混合液 4μL

[0402] T4DNA聚合酶 5μL

[0403] Klenow DNA聚合酶 1μL

[0404] T4多聚核苷酸激酶 5μL

[0405] 总体积 100μL

[0406] 将舒适型恒温混匀器调至20℃，反应30min，然后用QIAquickPCR纯化试剂盒进行纯化，最后将样品溶于32μL EB solution。

[0407] 1.3DNA片段3′末端加“A”碱基

[0408] 按照下列的配比准备反应混合物：

[0409] 末端修复后的DNA 32μL

[0410] Klenow酶缓冲液 5μL

[0411] dATP(1mM) 10μL

[0412] Klenow酶(3′到5′外切酶活性)3μL

[0413] 总体积 50μL

[0414] 将舒适型恒温混匀器调至37℃，反应30min，然后用MiniElute PCR纯化试剂盒进行纯化，最后将样品溶于10μL EB solution。

[0415] 1.4连接PCR-Free标签接头

[0416] 按照下列的配比准备反应混合物，：

[0417] DNA 10μL

[0418] T4DNA连接酶缓冲液 25μL

[0419] DNA标签接头 10μL

[0420] T4DNA连接酶 5μL

[0421] 总体积 50μL

[0422] 注：DNA标签接头可以为表3中的59条DNA标签接头中的任何一条标签接头(其由正反2个互补序列DNA Index-NF_adapter和DNAIndex-NR_adapter组成)。

[0423] 将舒适型恒温混匀器调至20℃，反应15min，然后用QIAquickPCR纯化试剂盒进行纯化，最后将样品溶于30μL EB solution。

[0424] 1.5连接产物的胶回收纯化

[0425] 将连接产物于2％的琼脂糖胶中进行电泳分离；随后将目的片段条带切胶转移至Eppendorf管中。用QIAquick胶纯化试剂盒进行胶纯化回收，回收产物溶于20μL EB solution。

[0426] 1.6PCR反应导入标签接头

[0427] PCR反应：按照下列的反应体系准备反应混合物，将试剂放置于冰上。

[0428] 胶回收纯化后的DNA 10μL

[0429] Phusion DNA聚合酶 25μL

[0430] PCR1.0_indexN primer 1μL

[0431] PCR2.0_indexN primer 1μL

[0432] ddH2O 13μL

[0433] 总体积 50μL

[0434] 注：PCR1.0_indexN引物可以为表4中的59条PCR1.0_indexprimerN中的任何一条标签引物；PCR2.0_index primer可以为表5中的59条PCR2.0_index primerN中的任何一条标签引物；

[0435] PCR反应条件

[0436] 98℃ 30s

[0437]

[0438] 72℃ 5min

[0439] 4℃ 保存

[0440] 1.7PCR产物的胶回收纯化

[0441] 将PCR产物于2％琼脂糖胶中电泳分离，切割回收目的片段，用QIAquick胶纯化试剂盒进行胶纯化回收，回收产物溶于30μL EBsolution。

[0442] 1.8DNA制备产物检测

[0443] 1)使用Agilent 2100Bioanalyzer检测文库产量。

[0444] 2)使用QPCR定量检测文库产量。

[0445] 最后构建完的DNA标签文库可以通过不同的标签组合来判断该文库的标签标签，如图5、图6、图7所示，可以通过DNA标签接头中、PCR1.0 index primer和PCR2.0 index primer中的标签组合来判断样品的标签序列，这样的组合可以达到205379种不同的标签组合(59×59×59种)，极大的提高了标签标签的数量。

[0446] 例如插入片段的信息序列为：

[0447] CGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTT

[0448] GCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAA

[0449] 如图5所示则构建的文库序列信息如下

[0450] >Index tagA-1：index1+index1+index1

[0451] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0452] >Index tagA-2：index2+index1+index1

[0453] AATGATACGGCGACCACCGAGATCTGCCTCTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0454] >Index tagA-3：index3+index1+index1

[0455] AATGATACGGCGACCACCGAGATCTCAAGCTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0456] >Index tagA-58：index58+index1+index1

[0457] AATGATACGGCGACCACCGAGATCTCGGTCAAACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0458] >Index tagA-59：index59+index1+index1

[0459] AATGATACGGCGACCACCGAGATCTGCACCAAACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCC

[0460] CCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0461] 例如插入片段的片段信息序列为：

[0462] CGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAA

[0463] 如图6所示则构建的文库序列信息如下

[0464] >Index tagB-1：index1+index1+index1

[0465] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0466] >Index tagB-2：index1+index2+index1

[0467] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGAGGCTCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAAGCCTCTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0468] >Index tagB-3：index1+index3+index1

[0469] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0470] >Index tagB-58：index1+index58+index1

[0471] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGCTTGTCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0472] >Index tagB-59：index1+index59+index1

[0473] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0474] 例如插入片段的信息为：

[0475] CGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAA

[0476] 如图7所示则构建的文库序列信息如下

[0477] >Index tagC-1：index1+index1+index1

[0478] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0479] >Index tagC-2：index1+index1+index2

[0480] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATGCGGTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAAGAGGCATCTCGTATGCCGTCTTCTGCTTG

[0481] >Index tagC-3：index1+index1+index3

[0482] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTAACCGCATCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAACAAGCTTAGATCGGAAGAGCACACGTCTGAACTCCAGTCACAACCGCAATCTCGTATGCCGTCTTCTGCTTG

[0483] >Index tagC-58：index1+index1+index58

[0484] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGACCGTCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAACGGTCAAAGATCGGAAGAGCACACGTCTGAACTCCAGTCACTTGACCGATCTCGTATGCCGTCTTCTGCTTG

[0485] >Index tagC-59：index1+index1+index59

[0486] AATGATACGGCGACCACCGAGATCTTGCGGTTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGGTGCTCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAAGCACCAAAGATCGGAAGAGCACACGTCTGAACTCCAGTCACTTGGTGCATCTCGTATGCCGTCTTCTGCTTG

[0487] 图8为构建的DNA标签组合文库电泳检测结果，目的片段文库如箭头所指，为800bp；D2000marker条带大小依次为：2000bp、1000bp、750bp、500bp、250bp、100bp；1、D2000marker；2、Index tagA-1；3、Index tagA-2；4、Index tagA-3；5、Index tagA-58；6、Index tagA-59；7、Index tagB-2；8、Index tagB-3；9、Index tagB-58；10、Index tagB-59；
11、Index tagC-2；12、Index tagC-3；13、Index tagC-58；14、D2000marker；电泳结果显示文库构建正常，能用于DNA index建库，满足solexa测序需求。

[0488] 尽管本发明的具体实施方式已经得到详细的描述，本领域技术人员将会理解。根据已经公开的所有教导，可以对那些细节进行各种修改和替换，这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。

[0489] 参考文献

[0490] 1、Paired-End sequencing User Guide；illumina part#1003880

[0491] 2、Preparing samples for ChIP sequencing for DNA ；illuminapart#11257047Rev.A；

[0492] 3、mRNA sequencing sample preparation Guide；illuminapart#1004898Rev.D[0493] 4、Preparing 2-5kb samples for mate pair library sequencing；illumina part#1005363Rev.B；

[0494] 5、Preparing samples for multiplexed Paired-End sequencing；illumina part#1005361Rev.B；

一种基于高通量测序的DNA标签文库构建方法转让专利

申请号 : CN201010299271.3

文献号 : CN102409048B

文献日 : 2013-10-23

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 章文蔚 , 张艳艳 , 于竞 , 田方 , 陈海燕 , 龚梅花 , 周妍

申请人 : 深圳华大基因科技服务有限公司

摘要 :

权利要求 :

说明书 :