靶标序列中所需核酸区的选择性扩增转让专利

申请号 : CN201780007649.8

文献号 : CN108699594B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 乌尔夫·克朗比安德斯·黑德拉姆斯蒂芬·海姆

申请人 : 德福塞尔控股公司

摘要 :

提供了用于在两阶段聚合酶链式反应中选择性扩增所需的扩增子的方法和试剂盒。所述方法和试剂盒使用包含错配控制序列的靶标引物;其中位于所需的扩增子序列侧翼的任何引物对具有非匹配错配控制序列,并且位于非所需的扩增子序列侧翼的任何引物对具有匹配的错配控制序列。

权利要求 :

1.用于在两阶段聚合酶链式反应中选择性扩增所需的扩增子的方法,其包括以下步骤:提供靶标遗传物质;

使所述靶标遗传物质变性;

在允许引物与所述靶标遗传物质退火的条件下添加一组靶标引物;

所述靶标引物组中的每种引物包含

靶标特异性序列

错配控制序列,和

通用杂交序列;

所述通用杂交序列在每个靶标引物中是相同的;

所述错配控制序列和通用杂交序列彼此紧邻;并且所述靶标引物组包含至少两个引物对,所述引物对适于扩增所述靶标遗传物质中至少两个重叠的所需的扩增子,使得有可能在重叠区域中获得至少一个非所需的扩增子;

所述靶标引物组的进一步特征在于,位于所需的扩增子序列侧翼的任何引物对具有非匹配错配控制序列,而位于非所需的扩增子序列侧翼的任何引物对具有匹配的错配控制序列;

进行第一多重聚合酶链式反应,产生与第一组引物中引物的不同的可能的成对的组合相对应的重叠的扩增子,所述重叠的扩增子保持在这样的条件下,使得其通过由每个引物中的通用杂交序列产生的互补序列之间的碱基对偶联而自杂交;

在选择条件下处理所述重叠的扩增子,所述选择条件使得所需的扩增子由于由非匹配错配控制序列产生的非互补序列而变性,而非所需的扩增子由于由匹配的错配控制序列产生的额外互补序列而保持自杂交;

添加通用引物,其各自包含与通用杂交序列互补的序列;

进行第二聚合酶链式反应,导致所需的扩增子的选择性扩增。

2.根据权利要求1所述的方法,其中所述第一和第二聚合酶链式反应在不同的反应容器中进行。

3.根据权利要求1所述的方法,其中所述第一和第二聚合酶链式反应在同一反应容器中进行。

4.根据权利要求2或3所述的方法,其中在所述第一多重聚合酶链式反应之前加入所述靶标引物,并且在所述第一多重聚合酶链式反应之后并且在所述第二聚合酶链式反应之前加入所述通用引物。

5.根据权利要求3所述的方法,其中在所述第一多重聚合酶链式反应之前加入所述靶标引物和通用引物。

6.根据权利要求1所述的方法,其中所述靶标引物组中靶标引物的总长度为7至200个核苷酸。

7.根据权利要求1所述的方法,其中所述错配控制序列的长度为1至7个核苷酸。

8.根据权利要求1所述的方法,其中所述通用杂交序列的长度为1至75个核苷酸。

9.根据权利要求1所述的方法,其中所述靶标特异性序列的长度为5至100个核苷酸。

10.根据权利要求1所述的方法,其中至少一对中的至少一个引物被可检测地标记。

11.根据权利要求1所述的方法,其中所述通用引物还包含用于测序所述所需的扩增子的衔接序列。

12.根据权利要求11所述的方法,其还包括对所述所需的扩增子进行测序的步骤。

13.根据权利要求12所述的方法,其中所述测序使用大规模平行测序进行。

14.根据权利要求1所述的方法,其中所述通用引物还包含索引序列。

15.根据权利要求1所述的方法,其中至少一个靶标引物与靶标遗传物质中的诊断序列互补。

16.用于实施根据权利要求1所述的方法的试剂盒,其包括:靶标引物组;

所述靶标引物组中的每种引物包含

靶标特异性序列

错配控制序列,和

通用杂交序列;

所述通用杂交序列在每个靶标引物中是相同的;

所述错配控制序列和通用杂交序列彼此紧邻;并且所述靶标引物组包含至少两个引物对,所述引物对适于扩增靶标遗传物质中至少两个重叠的所需的扩增子,使得有可能在重叠区域中获得至少一个非所需的扩增子;

所述靶标引物组的进一步特征在于,位于所需的扩增子序列侧翼的任何引物对具有非匹配错配控制序列,而位于非所需的扩增子序列侧翼的任何引物对具有匹配的错配控制序列;

通用引物,其各自包含与通用杂交序列互补的序列;和使用所述引物进行根据权利要求1所述的方法的使用说明。

17.根据权利要求16所述的试剂盒,其中所述引物如权利要求6-11和14-15中任一项所定义。

说明书 :

靶标序列中所需核酸区的选择性扩增

[0001] 公开领域
[0002] 本公开内容属于核酸分析领域,特别涉及聚合酶链式反应和随后的大规模平行测序。
[0003] 背景
[0004] 几十年来,双脱氧DNA测序(“桑格(Sanger)”测序,Sanger等(1977),ProcNatl Acad Sci USA 74:5463–5467)已被用作大多数基因实验室中的标准测序技术。使用桑格测序时,通量受到限制,因为该过程是对靶序列的单个分子进行的。寻求更快,更便宜和更准确的测序方法(这些方法增加了高通量的优势)导致了目前称为“大规模平行测序”(massive parallel sequencing,MPS)或“下一代测序”(next-generation sequencing,NGS)的若干种新技术的发展。
[0005] MPS方法的引入改变了DNA测序的范例(Mardis(2008),Trends Genet 24:133–141;Shendure&Ji(2008),Nat.Biotechnol 26:1135–1145)。MPS方法能够平行处理数十万到数百万个DNA模板,从而产生高通量和生成序列的每个碱基的低成本。MPS方法的引入还允许用户快速测序整个复杂基因组,例如人类基因组。
[0006] 然而,整个复杂人类基因组的完全大规模常规测序对于诊断用途尚不可行,因为成本和时间仍然太大。用于诊断用途的人类基因组的常规测序需要每个核苷酸至少100-1000倍的覆盖,导致需要对每个患者测序和处理300-3000 Gb的测序数据。使用可用的MPS方法,这将需要若干次测序运行/患者并且花费数万美元。除了经济负担之外,还需要大量的数据处理和数据存储能力,这将给基因实验室的信息基础设施带来沉重的负担。
[0007] 因此,旨在简化该过程并富集感兴趣区域用于例如测序的若干种方法即靶标富集方法已经被开发。靶标富集方法用于定义可在测序前从DNA样品中选择性捕获和富集的基因组区域。仅对那些富集的基因组区域进行重新测序比全基因组测序更具时间和成本效益,并且得到的数据分析相当简单,并且需要较低的数据存储能力。
[0008] 已知的靶标富集方法包括分子倒置探针(MIP),阵列上-和溶液中-杂交捕获和聚合酶链式反应(PCR)。每个都在下面单独讨论。
[0009] 分子倒置探针(MIP):MIP是修饰的锁式探针。当探针与相应的基因组靶标杂交时,在一个或多个核苷酸位置处存在缺口。在例如单核苷酸多态性(SNP)位置中探针缺乏互补核苷酸的设计可用于检测和鉴定多态性。如果杂交探针的缺口超过单个核苷酸,则探针通常称为“连接器倒置探针”(CIP)。使用这种探针的优点是它们可用于SNP基因分型,拷贝数变异(CNV)分析和检测等位基因失衡。可以设计探针使得它们含有用于鉴定探针的标签序列,以及用于测序靶标区域的引物序列。与其他靶标富集技术相比,分子倒置探针显示出良好的特异性,但可能在测定中显示不同探针之间的性能的一些变化。
[0010] 阵列上和溶液内杂交捕获:如果对使用溶液内捕获技术捕获基因组区域感兴趣,可以使用许多寡核苷酸(探针)并将它们杂交到溶液中的片段化基因组DNA(与基于杂交或阵列的方法相反)。可以将与顺磁珠连接的探针与感兴趣的DNA杂交。杂交后,可以分离含有探针和互补DNA片段的小珠,并通过洗涤小珠除去未结合的DNA材料。从小珠移除后,可以使用桑格测序或MPS方法对DNA进行测序。与基于阵列的技术相比,该技术的一个优点是由于高探针/靶标比率而改善的靶标富集。然而,这可能会对降低MPS成本的尝试产生影响。
[0011] 聚合酶链式反应(PCR):PCR已被广泛用于预测序样品制剂(Saiki等(1988),Science 239:487–491),因为它与传统的基于桑格测序的方法很好地兼容。PCR也与任何当前的MPS平台兼容。然而,为了充分利用MPS技术实现的高通量,必须一起处理和测序大量PCR扩增产物(“扩增子”)。多重(multiplex)PCR允许用户从单个PCR反应产生多个不同的PCR扩增子,并且在MPS的靶标富集期间特别有用。多重PCR可能难以进行,因为同时使用多个引物对经常产生高水平的非特异性扩增,这是由引物之间的相互作用引起的(Cho等(1999),Nat Genet 23:203–207;Wang等(1998),Science 280:1077–1082)。已经开发了多种克服多重PCR中的非特异性扩增的方法(Fredriksson等(2007),Nucleic Acids Res 35:e47;Meuzelaar等(2007),Nat Methods 4:835–837;Varley&Mitra(2008),Genome Res 18:
1844–1850;美国专利5677152)。
[0012] 对于许多MPS平台,对于可以在一次运行中测序的DNA片段的长度存在上限。因此,许多靶DNA片段必须分成较短的扩增子,每个扩增子由特定的引物对表示,以便在数据分析后获得连续的DNA序列。为了最大化通量,通常还必须不使用太短的PCR扩增子,因为这将减少测序运行中潜在碱基读数的总数。
[0013] 为了获得人类基因组内限定区域的完整测序覆盖,可以使用引物平铺设计将扩增子设计为重叠。为了获得有效的PCR扩增和最佳扩增子长度,并避免广泛的非特异性扩增,当使用重叠引物设计时,当前有必要将多重PCR反应分成若干个单独的反应。以这种方式,实际重叠设计被分成不同的PCR反应。如果需要将临床样品分成若干个不同的多重PCR反应,则样品混淆和样品污染的风险会增加。当可用于分析的DNA量有限时,使用多个PCR反应来分析临床样品也可能是一个问题。
[0014] 已经提出数字PCR作为MPS文库制备的合适方法。数字PCR基于核酸的克隆扩增,并且需要高度专业化的设备以便有效地进行。也认为数字PCR在没有经验的用户手中容易出错(Sykes等(1992),BioTechniques 13(3):444–9;Perkel(2015),BioTechniques 58(5):217–21,Pekin等(2011),Lab on a Chip 11(13):2156–66)。与单一反应PCR相比,通过数字PCR的样品制备需要更多可用的DNA用于分析。
[0015] 本领域需要整体上改善多重PCR反应的方法。特别需要在若干个阶段(例如在用于基因诊断应用的靶标扩增,文库制备,重新测序和其他情况期间)中解决多重PCR反应中的非特异性和/或不需要的扩增的问题的方法。
[0016] 发明概述
[0017] 本公开的一个目的是通过能够选择性扩增靶标序列中的所需的核酸区域来满足这种需要。
[0018] 另一个目的是提供方法,所述方法引入核酸片段的自杂交特性的差异,作为在所需的和非所需的扩增产物之间进行选择的工具。
[0019] 另一个目的是提供能够在单一反应中对重叠的短扩增子进行选择性PCR扩增的方法。
[0020] 另一个目的是提供方法,所述方法将在单一反应中提供覆盖长的连续的DNA片段的短的重叠的扩增子。
[0021] 这些目的以及本领域技术人员从本文的教导中显而易见的其他目的通过本文和所附权利要求中限定的本公开的不同方面得到满足。
[0022] 因此,在第一方面,本发明提供了用于在两阶段聚合酶链式反应中选择性扩增所需的扩增子的方法,所述方法包括以下步骤:
[0023] 提供靶标遗传物质;
[0024] 使所述靶标遗传物质变性;
[0025] 在允许引物与靶标遗传物质退火的条件下添加一组靶标引物;
[0026] 所述靶标引物组中的每种引物包含
[0027] 靶标特异性序列,
[0028] 错配控制序列,和
[0029] 通用杂交序列;
[0030] 所述通用杂交序列在每个靶标引物中是相同的;
[0031] 所述错配控制序列和通用杂交序列彼此紧邻;并且
[0032] 所述靶标引物组包含至少两个引物对,所述引物对适于扩增靶遗传物质中至少两个重叠的所需的扩增子,使得有可能在重叠区域中获得至少一个非所需的扩增子;
[0033] 所述靶标引物组的进一步特征在于,位于所需的扩增子序列侧翼的任何引物对具有非匹配错配控制序列,而位于非所需的扩增子序列侧翼的任何引物对具有匹配的错配控制序列;
[0034] 进行第一多重聚合酶链式反应,产生与第一组引物中引物的不同的可能的成对的组合相对应的重叠的扩增子,所述重叠的扩增子保持在这样的条件下,使得其通过由每个引物中的通用杂交序列产生的互补序列之间的碱基对偶联而自杂交;
[0035] 在选择条件下处理所述重叠的扩增子,所述选择条件使得所需的扩增子由于由非匹配错配控制序列产生的非互补序列而变性,而非所需的扩增子由于由匹配的错配控制序列产生的额外互补序列而保持自杂交;
[0036] 添加通用引物,其各自包含与通用杂交序列互补的序列;
[0037] 进行第二聚合酶链式反应,导致所需的扩增子的选择性扩增。
[0038] 在第二方面,本公开提供了用于实施该方法的试剂盒,其包括必要的关键试剂和用于将该方法付诸实践的使用说明。在这方面,提供了一种用于执行根据第一方面的方法的试剂盒,其包括:
[0039] 靶标引物组;
[0040] 所述靶标引物组中的每种引物包含
[0041] 靶标特异性序列,
[0042] 错配控制序列,和
[0043] 通用杂交序列;
[0044] 所述通用杂交序列在每个靶标引物中是相同的;
[0045] 所述错配控制序列和通用杂交序列彼此紧邻;并且
[0046] 所述靶标引物组包含至少两个引物对,所述引物对适于扩增靶标遗传物质中至少两个重叠的所需的扩增子,使得有可能在重叠区域中获得至少一个非所需的扩增子;
[0047] 所述靶标引物组的进一步特征在于,位于所需的扩增子序列侧翼的任何引物对具有非匹配错配控制序列,而位于非所需的扩增子序列侧翼的任何引物对具有匹配的错配控制序列;
[0048] 通用引物,其各自包含与通用杂交序列互补的序列;和
[0049] 使用所述引物进行根据第一方面的方法的使用说明。
[0050] 因此,本公开涉及以下情况:进行第一PCR反应,并且将所得的扩增片段或扩增子用作第二PCR反应中的模板。具体地,所述第一PCR反应使得它有可能产生至少两种可选的扩增子,其中一种扩增子在用作第二反应的模板方面不如另一种扩增子。本公开的基本见解之一是可以促进使用所需的扩增子作为模板,并抑制非所需的扩增子的使用。这是通过增强来自第一PCR反应的扩增子在序列互补区域自杂交的内在趋势来完成的。由于存在通用杂交序列(其用于第二PCR中的引物退火),来自第一PCR反应的所有扩增子将具有互补序列。在正常PCR反应条件下,这将导致扩增子在第一PCR反应后形成茎-环结构。为了使这种茎-环结构充当第二PCR反应的模板,自杂交的序列段需要变性以允许通用引物在相同序列退火。在正常条件下,无论是否希望或不希望扩增子作为模板,这种变性都会以相同的程度发生。在反应容器已经含有通用引物的情况下尤其如此,因为这些将与通用序列竞争碱基配对。本文的公开允许通过确保非所需的扩增子形成比由所需的扩增子形成的对应环结构更不易变性的茎-环结构来调节由来自第一PCR反应的扩增子形成的茎-环结构中的自杂交的强度。这是通过在第一PCR反应的引物中插入相对较短的序列来完成的,所述序列被设计成赋予非所需的扩增子额外的自身互补性,而没有为所需的扩增子提供这种额外的自身互补性。该短序列在本公开中表示为“错配控制序列”。在第二PCR后不被希望作为最终结果的靶标序列的区域侧接含有匹配的错配控制序列的引物(用于第一PCR),因为这样的匹配序列将增强所得扩增子的自杂交并使它们在第二PCR开始时不易引物退火。相反,作为最终结果希望的靶标序列的区域(例如,用于测序,检测或任何其他目的)侧翼为包含非匹配错配控制序列的第一PCR引物。所公开方法的一个实施方案在图9中示意性地示出。
[0051] 技术人员将认识到,可以在若干不同的设置中受益于本公开的一般原理,这些设置都旨在被所附权利要求所涵盖。这适用于例如方法中的步骤顺序。可以在不同的反应容器中进行两个PCR阶段,但同样优选在同一反应容器中进行。在一个实施方案中,在第一PCR反应后加入通用引物(即第二PCR反应的引物)。在另一个实施方案中,其中反应在相同的反应容器中进行,通用引物在第一PCR反应之前加入,例如在加入靶标引物(即第一PCR反应的引物)的同时加入。
[0052] 相同的推理适用于PCR反应的反应条件。这些可以由技术人员定制,使得存在对于所公开方法的步骤适当的退火和变性条件。特别地,第二PCR反应开始时的条件需要使得链分离(变性)和通用引物退火到具有不匹配错配控制序列的扩增子(即具有较短自互补序列段的扩增子)上,而在具有匹配的错配控制序列的扩增子(即具有较长自互补序列段的扩增子)中通用引物退火被抑制。关于变性温度,退火和延伸温度等因素以及Mg2+离子,DMSO,甜菜碱和甲酰胺等添加剂浓度等因素的校准将取决于每种情况的具体情况和目标。但是,找到它们将在PCR技术的现有技术领域的技术人员的能力范围内(关于PCR技术的综述参见例如Bartlett和Stirling(2003),PCR Protocols.Methods in Molecular Biology 226:3-6,或Sambrook和Russel(2001),Molecular Cloning:A Laboratory Manual(3rd ed.).Cold Spring Harbor,N.Y.:Cold Spring Harbor Laboratory Press.ISBN 0-879-
69576-5.Chapter 8:“In vitro Amplification of DNA by the Polymerase Chain Reaction”)。
[0053] 关于靶标引物,这些引物包括在本公开的上下文中具有不同功能的三个不同序列段。这三者可以是截然不同的,并且可以直接或非常接近地相互跟随。因此,靶标特异性序列之后可以是错配控制序列,然后接着是通用杂交序列。然而,在一些实施方案中,这三个功能上限定的序列段可以重叠。这例如以下情况:如果错配控制序列的一个或多个碱基也与靶标序列互补,使得靶标特异性序列的一个末端实现错配控制以及靶标结合的功能。还可能通过在靶特异性序列和通用杂交序列中的一个或两个中引入的错配提供错配控制,这意味着三个不同的序列元件实际上完全或部分地沿着靶标引物寡核苷酸散布。用于所公开的方法和试剂盒的靶标引物的精确定义并不重要,只要它根据侧翼的靶标序列对于扩增是否是所需的或非所需的而允许不同的自杂交强度即可。出于以下关于不同序列长度的讨论的目的,更容易将它们视为不同的序列区段,但同样,也可以使用其中错配控制的功能混杂在靶标特异性或通用杂交序列之中的引物。
[0054] 在一个实施方案中,该组中靶标引物的总长度为约7至约200个核苷酸,通常其条件是存在靶结合,错配控制和通用杂交的必要功能。
[0055] 在一个实施方案中,其中错配控制序列是不同的序列,错配控制序列的长度为1至7个核苷酸,例如1至5个,1至3个核苷酸,例如1至2个核苷酸。长度并不重要,但取决于其他因素,特别是第二PCR反应初始阶段的退火和变性条件。
[0056] 通用杂交序列的长度也不重要,只要它允许在第二PCR反应中通过相应的通用引物进行退火和引发即可。在一个实施方案中,通用杂交序列长度为1至75个核苷酸,例如3至75个核苷酸,5至60个核苷酸,5至40个核苷酸或5至20个核苷酸,例如10至20个核苷酸或7到
15个核苷酸。技术人员能够基于例如碱基配对强度等设计合适的通用杂交序列,其中使用更强的碱基配对可以允许更短的杂交序列,而使用更弱的碱基配对可以允许更长的杂交序列。
[0057] 关于靶标特异性序列,这需要足够长以确保在靶标核酸的希望的区域处的特异性杂交。同样,技术人员知道所涉及的设计考虑因素,并且能够设计这样的引物而无需过多的实验。在一个实施方案中,靶标特异性序列长度为5至100个核苷酸,例如8至70个核苷酸,10至50个核苷酸或10至40个核苷酸,例如15至30个核苷酸,例如18至25个核苷酸,例如20至25个核苷酸。
[0058] 通常但不总是地,靶标特异性序列与靶标遗传物质中的诊断序列互补,因此该序列的检测或测序具有诊断或临床意义。
[0059] 在一个实施方案中,参与不同反应的至少一些引物被可检测地标记,例如以便跟踪反应和/或检测最终产物。技术人员知道用于标记核苷酸分子的不同选择,例如,用荧光标签,并且无需过多的实验。
[0060] 在一个实施方案中,所公开的方法用于从由待测序的基因组DNA组成的靶遗传物质制备序列文库。该序列文库随后可用于核酸测序。在这些应用中,在所公开的方法的第二PCR反应中使用并包含在公开的试剂盒中的通用引物可以进一步包含用于希望的测序方法的衔接序列。而且,在一个这样的实施方案中,所公开的方法还包括对由PCR扩增的两个阶段产生的所需的扩增子进行测序的步骤。在一个具体实施方案中,所述测序使用大规模平行测序进行。适当地,在一个实施方案中,通用引物还包含索引序列,使得如果与来自其他靶遗传物质或来自不同个体的样品的单独反应的扩增子合并,则可以鉴定扩增子产物。因此,在这些实施方案中,可以使用所公开的方法和试剂盒以患者特异性靶标文库的形式获得患者特异性的,靶标记的,索引的,纯化的和标准化的靶特异性扩增子的集合,然后可以将其与来自其他患者的靶标特异性文库一起汇集或在进行测序例如进行大规模并行测序前单独分析。只要第二PCR反应中使用的索引序列对于每个患者是唯一的,就可以从相同靶标的几个患者样品或同一患者的多个靶标或两者的组合制备文库池。
[0061] 虽然已经参考各种示例性方面和实施方案描述了本发明,但是本领域技术人员将理解,在不脱离本文公开的范围的情况下,可以进行各种改变并且可以用等同物替换其要件。另外,在不脱离本发明的实质范围的情况下,可以进行许多修改以使特定情况适应本发明的教导。因此,意图是本发明不限于所设想的任何特定实施方案,而是包括落入所附权利要求范围内的所有实施方案。
[0062] 附图简要说明
[0063] 图1是本文公开并用于该方法的各种实施方案中的引物构建体的示意图。
[0064] 图2是实施例1中使用的引物对以及它们相对于靶标序列人CFTR基因外显子14的位置的示意图。
[0065] 图3显示了使用引物对TT-EX14_02F/TT-EX14_02R、然后是引物对ID-Ion P1和ID-Ion A后使用毛细管电泳检测A)TT PCR片段和B)ID PCR片段的色谱图。
[0066] 图4显示了使用引物对TT-EX14_01F/TT-EX14_02R、然后是引物对ID-Ion P1和ID-Ion A后使用毛细管电泳检测A)TT PCR片段和B)ID PCR片段的色谱图。
[0067] 图5显示了使用引物对TT-EX14_02F/TT-EX14_03R、然后是引物对ID-Ion P1和ID-Ion A后使用毛细管电泳检测A)TT PCR片段和B)ID PCR片段的色谱图。
[0068] 图6是通过A)引物对TT-EX14_02F/TT-EX14_02R和B)引物对TT-EX14_02F/TT-EX14_03R扩增的TT PCR产物的自退火结构的示意图。13bp通用杂交序列以粗体表示。2bp错配控制序列加下划线。
[0069] 图7是重叠PCR引物在一段靶基因组DNA扩增中的应用的示意图。
[0070] 图8是本方法克服的问题之一的示意图。当在第一阶段PCR期间使用没有错配控制序列的重叠引物时,在第二阶段PCR期间产生大量非所需的PCR扩增子。
[0071] 图9是所公开方法的概要示意图。在TT PCR期间产生并在两侧具有匹配的错配控制序列的扩增子(1-1或2-2)被描绘在靶标基因序列之上,并且在TT PCR期间产生在左下描绘的更长的自互补环结构。具有非匹配错配控制序列的扩增子(1-2,2-1)描绘在靶标基因序列下方,并且在TT PCR期间产生在右下角描绘的较短的自互补环结构。
[0072] 图10是本方法对图8所示问题的结果的示意图。在ID PCR期间对短的非所需的ID PCR扩增子的抑制由X表示。
[0073] 图11显示了在以下之后的毛细管电泳分析的色谱图:A)使用不具有错配控制序列的TT PCR引物组的多重TT PCR(上部2道),随后是显示大量非所需的短ID PCR产物的ID PCR(底部道);B)使用包括错配控制序列(前2个泳道)的TT PCR引物组的多重TT PCR(上部2道),随后是显示没有非所需的短ID PCR产物的ID PCR(底部道)。
[0074] 图12是一段靶标DNA的多重PCR扩增的可能产物的示意图,显示通过本文公开的方法消除的短的非所需的产物,较长的所需的扩增子和在通读后获得的扩增子。
[0075] 图13示意性地说明了在实施例3中描述的方法中计算参数扩增子覆盖度(CA)和重叠覆盖度(CO)时计数的PCR产物的区域。实施例
[0076] 以下实施例说明了在不同设置中实施的本公开的实施方案。
[0077] 实施例1
[0078] 所公开方法的基本原理的建立
[0079] 材料和方法
[0080] 该实施例涉及进行两个单独的实验,每个实验包括对纯化的人基因组DNA进行的第一靶标标记(TT)PCR反应。TT PCR之后进行第二索引(ID)PCR反应步骤。在进行ID PCR之前,将TT PCR反应中产生的PCR扩增子在水中1:50稀释。
[0081] 设计TT PCR引物以包括约20-25个核苷酸的3'靶标特异性部分和寡核苷酸5'末端的通用杂交序列。设计ID PCR引物以在3'末端包含寡核苷酸序列,其能够与所有TT PCR引物中存在的通用杂交序列特异性退火。ID引物还包括特异性测序衔接子和索引序列,以允许MPS和索引识别。在这个实施例中,使用的测序衔接序列是“Ion A”和“Ion P1”衔接序列,专门设计用于在ThermoFisher Ion PGM MPS仪器上进行测序。
[0082] 图1示意性描绘了使用的引物,图2再次示意性地显示了它们与靶序列CFTR基因外显子14的关系。所用引物的核苷酸序列如下表1所示,其中各寡核苷酸的杂交部分是下划线和粗体字。
[0083] 表1:用于两个阶段的多重PCR的寡核苷酸引物
[0084]
[0085] 在第一实验中,对CFTR外显子14内的序列特异的引物组合TT-EX14_02F/TT-EX14_02R用于作为第一阶段PCR反应的TT PCR。完成该PCR程序后,将所得溶液稀释50倍,并在随后的ID PCR第二阶段多重反应中加入2μl稀释液作为模板。使用ID-Ion P1和ID-Ion A引物进行ID PCR。通过毛细管电泳检测荧光标记的扩增的PCR片段分析TT和ID PCR反应,得到的色谱图如图3所示。
[0086] 进行类似的第二实验,但是在两个独立的第一阶段TT PCR反应中代替地使用两种引物对TT-EX14_01F/TT-EX14_02R和TT-EX14_02F/TT-EX14_03R,模拟在重叠靶序列的情况下的多重PCR。使用这两个引物对,并参考图2,两个所需的扩增子是分别侧接i)正向引物TT-EX14_01F和反向引物TT-EX14_02R和ii)正向引物TT-EX14_02F和反向引物TT-EX14_03R的区域。在真正的多重PCR反应中,理论上也可能的是TT PCR在重叠区域产生非所需的扩增子,即侧翼为正向引物TT-EX14_02F和反向引物TT-EX14_02R的区域,即正是通过这两个引物在第一实验中获得的产物。
[0087] 在完成TT PCR反应后,将所得溶液稀释50倍,并在相应的第二阶段ID PCR反应中加入2μl稀释液作为模板。使用ID-Ion P1和ID-Ion A引物进行ID PCR。通过毛细管电泳检测荧光标记的扩增的PCR片段分析TT和ID PCR反应,色谱图如图4和5所示。
[0088] 结果
[0089] 对于第一实验,使用引物组TT-EX14_02F/TT-EX14_02R的TT PCR反应的毛细管电泳导致在FAM通道中检测到预期长度为180bp的PCR片段(图3A)。然而,使用得到的TT PCR产物作为模板,在第二阶段ID PCR反应后未检测到PCR扩增子(图3B)。在组合的TT和ID PCR反应后不存在可检测的PCR扩增子表明在ID PCR期间没有发生扩增。
[0090] 在第二实验中,TT PCR引物组TT-EX14_01F/TT-EX14_02R和TT-EX14_02F/TT-EX14_03R用于单独的TT PCR反应,可以在对于TT引物组合TT-EX14_01F/TT-EX14_02R的FAM通道(图4A)中以及在对于TT引物组合TT-EX14_02F/TT-EX14_03R的HEX通道(图5A)中观察到具有预期片段长度的片段。
[0091] 重要的是,在使用ID-Ion P1和ID-Ion A引物的ID PCR反应后,在FAM和HEX通道中也可以检测到两种不同的PCR片段(图4B和5B)。在两次ID PCR反应的毛细管电泳后每个检测通道中两个PCR片段的出现与使用两种不同ID PCR引物(ID-Ion P1和ID-Ion A,各自单独地能够退火到TT PCR扩增子的两端)的通用引发后产生的预期的四个PCR片段一致。
[0092] 结论
[0093] 不希望受理论束缚,使用TT-EX14_02F/TT-EX14_02R引物组后缺乏ID PCR产物被解释为是由于在TT PCR扩增子中形成15碱基对长的自退火结构(其包括通用杂交序列和至少两个另外的互补碱基)。在该组实验中使用的PCR条件下,自退火结构阻碍了ID PCR引物在ID PCR期间与模板TT PCR扩增子的退火。相反,当在TT PCR扩增子中自退火结构的长度仅限于13个碱基对长的通用杂交序列时,ID PCR引物与通用杂交结构的退火是可能的。为了进一步解释当引物组合为TT-EX14_02F/TT-EX14_02R时第一实验中缺乏ID PCR产物,观察到这些TT PCR引物由靶特异性部分(下划线)和通用杂交序列组成(粗体)组成:
[0094] 引物TT-EX14_02F:
[0095]
[0096] 引物TT-EX14_02R:
[0097]
[0098] 使用TT-EX14_02F和TT-EX14_02R的TT PCR产生如下所述的TT PCR扩增子(箭头表示位于侧翼引物序列之间的扩增的靶标序列):
[0099]
[0100]
[0101] 得到的TT PCR扩增子在5'和3'末端包含自互补序列。在标准PCR条件下,每个扩增子的自互补5'和3'末端自退火并在扩增子内产生自互补环结构。当使用引物组TT-EX14_02F/TT-EX14_02R时,互补区长15个碱基对,包括13bp通用杂交序列加上来自引物TT-EX14_
02F和TT-EX14_02R的靶标特异性序列的另外两个互补碱基(图6A)。通过阻断ID PCR引物对通用杂交序列的接近,15碱基对自互补环结构足够稳定以在随后的ID PCR期间阻碍对扩增子的进一步PCR扩增。
[0102] TT-EX14_02F/TT-EX14_03R和TT-EX14_01F/TT-EX14_02R引物组的互补区缺少额外的互补序列,并且长度仅为13个碱基对(例如如图6B所示的引物组TT-EX14_02F/TT-EX14_03R)。在相同条件下,该段不足以产生足够稳定以在ID PCR期间阻碍对扩增子的进一步PCR扩增的自互补环结构。
[0103] 换句话说,当自退火区域在PCR实验条件下足够长时(在这种情况下为15个碱基对),自退火结构优先于ID PCR引物的退火(可能是因为PCR产物的5'和3'末端的互补序列的空间接近)。在这种情况下,ID PCR引物不能杂交,因此不会发生自退火TT PCR产物的扩增(图3B和6A)。相反,当自退火区域较短时(在这种情况下为13个碱基对),ID PCR引物能够与自退火结构竞争,接近TT PCR扩增子模板以与其退火。结果,可以发生ID PCR扩增(图4B和6B)。来自靶标特异性序列的另外两个自互补碱基可以被认为是通用杂交序列和靶标结合区之间的中间序列。由于该中间序列对第二阶段PCR反应中的扩增的影响,其在本文中表示为“错配控制序列”,其可被设计为允许或阻断另外的碱基对的匹配,从而形成与通用杂交序列本身产生的自退火结构相比更长、更强的自退火结构。
[0104] 实施例2
[0105] 在多重PCR中选择需要的扩增子
[0106] 接下来,假设在使用重叠引物的多重PCR反应中,错配控制序列或接头序列可以包括在第一阶段PCR引物中以允许选择性形成自互补结构,并且因此可以确保形成想要的PCR扩增子,而同时不需要的PCR扩增子被抑制。
[0107] 为了在实验中测试该选择性自互补结构的假设,按照实施例1中给出的一般原理设计两组的七对引物。因此,设计每对TT PCR引物以与下一个扩增子的引物对的第一引物重叠,以覆盖CFTR基因的整个外显子14(图7)。
[0108] 在第一组七个TT PCR引物对中,如图1和7中所示设计引物。这些引物在通用杂交序列和靶标特异性序列之间不包括另外的错配控制或接头序列。因此,推测用该引物组的PCR产生的所有扩增子都包括仅13个碱基对的自退火区。当在单管多重TT PCR反应中组合时,预期有大量短和长TT PCR扩增子(如图8所示)。
[0109] 在第二组七个TT PCR引物对中,引物与第一组相同,但在每个引物中的通用杂交序列和靶特异性序列之间添加3bp错配控制序列。设计每个引物中的错配控制序列(例如基于相邻引物和重叠)以在不需要的较短TT PCR扩增子中选择性地产生16个碱基对长的自互补环结构,以及在需要的较长的TT PCR扩增子中选择性地产生13个碱基对长的自互补环结构。除了13bp自互补环结构序列之外,还通过插入3bp自互补序列构建16bp自互补环结构。本实验中使用的两个3bp错配控制或接头序列是:
[0110] 接头1:5'-GAC-3'
[0111] 接头2:5'-TCA-3'
[0112] 定位3bp接头序列以便在不需要的短PCR扩增子中产生较长的自互补环结构,并在较长的需要的PCR扩增子中产生较短的自互补环结构(图9)。
[0113] 在合适的条件下,TT PCR扩增子中较长的自互补环结构的形成阻碍了其在随后的ID PCR反应中作为模板使用,而在TT PCR扩增子中形成较短的自互补环结构允许其在随后的ID PCR反应中的作为模板使用。因此,从ID PCR反应仅产生特异的预定义的ID PCR扩增子(图10)。实验地测试了图7-10中描绘的原理。
[0114] 上述两种TT引物组分别用于单管第一阶段多重TT PCR反应中。对于两种引物组,对人基因组DNA进行单管多重TT PCR。将得到的TT PCR扩增子在水中1:50稀释,然后使用ID PCR引物ID-Ion P1/ID-Ion A进行第二阶段多重ID PCR。
[0115] 当使用没有设计的错配控制序列的引物组时,在TT PCR后通过毛细管电泳检测预期的7种希望的PCR扩增子。此外,检测到许多小的不需要的PCR产物(图11A,上两个泳道)。检测到的TT PCR扩增子在ID PCR反应期间均作为模板,产生大量短的不需要的ID PCR产物。通过毛细管电泳证实了不需要的ID PCR扩增子的形成(图11A,下部泳道)。
[0116] 当使用具有设计的错配控制序列的引物组时,在多重TT PCR后通过毛细管电泳检测预期的7种希望的PCR扩增子。此外,检测到许多小的不需要的PCR产物(图11B,上部两个泳道)。然而,在这种情况下,只有想要的较长的TT PCR扩增子在ID PCR期间用作模板,因此仅产生希望的ID PCR产物。通过毛细管电泳证实仅形成需要的ID PCR扩增子(图11B,下部泳道)。
[0117] 计算毛细管电泳实验中所有峰的曲线下面积(AUC),如图11A和11B,下部图中所示,得到以下数字:
[0118]
[0119]
[0120] 实施例3
[0121] 评估需要与不需要的扩增产物的比例
[0122] 为了评估用于制备用于下一代测序的模板扩增子的多重PCR中短的、不需要的产物的量与较长的、需要的扩增子产物的量相比较,将在所需的扩增子区域的测序反应中产生的读数的数量与重叠区域的读数的数量进行比较。图12描绘了覆盖感兴趣区域的四个扩增子的实施例。在这种情况下,在第一次多重或“TT”PCR期间,产生三种短的不需要的产物,四种较长的需要产物和两个通读产物。通过第一正向引物与第三反向引物和第二正向引物与第四反向引物的PCR相互作用分别产生通读产物。图13显示了引物修剪后序列读数相对于彼此的位置。通过计数每个扩增子的标记位置处的读数数量来产生扩增子计数(或扩增子覆盖计数,CA)。覆盖这些位置的所有读数都对评估的扩增子具有特异性。通过计数重叠区域内的读数的数量来生成重叠区域计数(或重叠区域的覆盖计数,CO),由图13中的圆圈标记。
[0123] 如果在TT PCR期间产生的短的不需要的产物在ID PCR期间用作模板,则重叠区域的覆盖范围超过相邻扩增子的覆盖范围的总和。这种情况表述如下:
[0124] CAn+CAn+1<COn
[0125] 另一方面,如果如本文所公开的那样在TT PCR中使用错配控制序列防止短的不需要的产物在第二次多重或“ID”PCR期间用作模板,重叠区域的覆盖范围应当等于相邻扩增子的覆盖范围之和。这种情况表述如下:
[0126] CAn+CAn+1=COn
[0127] 为了确定由于来自短的不需要的TT PCR产物(即未能形成自互补结构并因此在ID PCR中形成不需要的短扩增子)的序列读数导致的重叠区域的覆盖量,计算了覆盖率(CR)。
[0128]
[0129] 覆盖率为1表示重叠区域的覆盖仅来自形成重叠的扩增子。覆盖率大于1表明短的不需要的TT PCR产物有助于重叠区域的覆盖。这意味着在ID PCR期间不需要的PCR扩增子的形成没有如希望的那样被抑制。在以下实施例中,覆盖率CR用作本文公开的方法是否具有希望效果的量度。
[0130] 实施例4
[0131] BRCA 2基因的39个重叠扩增子
[0132] 重复实施例2,但使用BRCA 2基因外显子11作为靶标。使用根据本公开设计的78个TT PCR引物(以包括如实施例2中的3bp的错配控制序列),用39个重叠扩增子扩增靶标。如实施例2中所述,对39个TT PCR扩增子进行ID PCR。在Illumina MiSeq MPS仪器上对得到的文库进行测序。如实施例3中所述计算39个扩增子中的每一个的覆盖率,结果示于表2中。
[0133] 表2
[0134]
[0135]
[0136]
[0137] 表2显示了用于产生BRCA 2基因外显子11的测序文库的39个扩增子的38个重叠区域的覆盖率。38个重叠区域中只有两个的覆盖率高于1.00。对于重叠区域8,发现最高覆盖率1.06。这意味着覆盖该重叠区域的读数中只有6%来自不需要的短TT PCR产物。
[0138] 大多数覆盖率小于1的原因是形成了通读产物,其分别对扩增子和重叠区域的读数计数贡献不等。这是因为对于扩增子读数CA(对于扩增子n一次和对于扩增子n+1一次),一个通读产物被计数两次,但对于重叠读数计数CO仅一次。
[0139] 实施例5
[0140] BRCA 1基因的31个重叠扩增子
[0141] 重复实施例2,但使用BRCA 1基因外显子10和11作为靶标。使用根据本公开设计的62个TT PCR引物(以包括如实施例2中的3bp的错配控制序列),用31个重叠扩增子扩增靶标。如实施例2中所述,对31个TT PCR扩增子进行ID PCR。在Illumina MiSeq MPS仪器上对得到的文库进行测序。如实施例3中所述计算31个扩增子中的每一个的覆盖率,结果示于表
3中。
[0142] 表3
[0143]
[0144]
[0145]
[0146] 表3显示了用于产生BRCA 1基因外显子10和11的测序文库的31个扩增子的30个重叠区域的覆盖率。30个重叠区域中只有两个的覆盖率高于1.00。对于重叠区域25,发现最高覆盖率1.02。这意味着覆盖该重叠区域的读数中只有2%来自不需要的短TT PCR产物。
[0147] 实施例6
[0148] CFTR基因的7个重叠扩增子
[0149] 重复实施例2。使用根据本公开设计的14个TT PCR引物(以包括如实施例2中的3bp的错配控制序列),用7个重叠扩增子扩增靶标。如实施例2中所述,对7个TT PCR扩增子进行ID PCR。在Illumina MiSeq MPS仪器上对得到的文库进行测序。如实施例3中所述计算7个扩增子中的每一个的覆盖率,结果示于表4中。
[0150] 表4
[0151]
[0152] 表4显示了用于产生CFTR基因外显子14的测序文库的7个扩增子的6个重叠区域的覆盖率。7个重叠区域中只有两个的覆盖率高于1.00。对于重叠区域1,发现最高覆盖率1.01。这意味着覆盖该重叠区域的读数中只有1%来自不需要的短TT PCR产物。
[0153] 实施例7
[0154] TP53基因的7个重叠扩增子
[0155] 重复实施例2,但使用TP53基因外显子4和5作为靶标。使用根据本公开设计的14个TT PCR引物(以包括如实施例2中的3bp的错配控制序列),用7个重叠扩增子扩增靶标。如实施例2中所述,对7个TT PCR扩增子进行ID PCR。在Illumina MiSeq MPS仪器上对得到的文库进行测序。如实施例3中所述计算7个扩增子中的每一个的覆盖率,结果示于表5中。
[0156] 表5
[0157]
[0158] 表5显示了用于产生TP53基因外显子4和5的测序文库的7个扩增子的6个重叠区域的覆盖率。7个重叠区域中没有一个具有高于1.00的覆盖率,表明没有形成不需要的短TT PCR产物。
[0159] 实施例8
[0160] KIT基因的5个重叠扩增子
[0161] 重复实施例2,但使用KIT基因外显子12和13作为靶标。使用根据本公开设计的10个TT PCR引物(以包括如实施例2中的3bp的错配控制序列),用5个重叠扩增子扩增靶标。如实施例2中所述,对5个TT PCR扩增子进行ID PCR。在Illumina MiSeq MPS仪器上对得到的文库进行测序。如实施例3中所述计算5个扩增子中的每一个的覆盖率,结果示于表6中。
[0162] 表6
[0163]
[0164] 表6显示了用于产生TP53基因外显子12和13的测序文库的6个扩增子的5个重叠区域的覆盖率。5个重叠区域中没有一个具有高于1.00的覆盖率,表明没有形成不需要的短TT PCR产物。
[0165] 实施例9
[0166] PDGFRA基因的3个重叠扩增子
[0167] 重复实施例2,但使用PDGFRA基因外显子12作为靶标。使用根据本公开设计的6个TT PCR引物(以包括如实施例2中的3bp的错配控制序列),用3个重叠扩增子扩增靶标。如实施例2中所述,对3个TT PCR扩增子进行ID PCR。在Illumina MiSeq MPS仪器上对得到的文库进行测序。如实施例3中所述计算3个扩增子中的每一个的覆盖率,结果示于表7中。
[0168] 表7
[0169]
[0170] 表7显示了用于产生PDGFRA基因外显子12的测序文库的3个扩增子的2个重叠区域的覆盖率。2个重叠区域中没有一个具有高于1.00的覆盖率,表明没有形成不需要的短TT PCR产物。