会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~

用于表面结合的多核苷酸的金属定向裂解的方法

申请号 CN202280045355.5 申请日 2022-12-15 公开(公告)号 CN117813390A 公开(公告)日 2024-04-02
申请人 因美纳有限公司; 发明人 G·坎齐;
摘要 本公开的实施方案涉及用于边合成边测序的双链多核苷酸的化学线性化方法。具体地讲,使用多相钴催化剂在这些双链多核苷酸的一条链的预定裂解位点处裂解一个或多个二醇部分。
权利要求

1.一种使多个固定化双链多核苷酸化学线性化的方法,所述方法包括:
使钴催化剂与包括所述多个固定化双链多核苷酸的固体载体接触,每个双链多核苷酸包括第一链和第二链,其中所述第一链和所述第二链在它们的5'端处固定到所述固体载体,其中每条第二链包括裂解位点;以及
用所述钴催化剂在所述裂解位点处化学裂解一条或多条第二链,并且产生一种或多种裂解的第二核酸和裂解的固定化第二链。
2.根据权利要求1所述的方法,所述方法还包括从所述固体载体上去除所述一种或多种裂解的第二核酸。
3.根据权利要求1或2所述的方法,其中每条第二链的所述裂解位点包括一个或多个二醇接头。
4.根据权利要求1至3中任一项所述的方法,其中所述二醇接头包括式(I)的结构:
其中
r为2、3、4、5或6;并且
s为2、3、4、5或6。
5.根据权利要求4所述的方法,其中所述二醇接头包括式(Ia)的结构:
6.根据权利要求1至5中任一项所述的方法,其中每条第二链从固定到所述固体载体的第二延伸引物延伸,并且其中所述第二延伸引物包括第二裂解位点。
7.根据权利要求6所述的方法,其中所述第二延伸引物包括P17序列。
8.一种对多核苷酸进行测序的方法,所述方法包括:
使第一线性化试剂与包括多个固定化双链多核苷酸的固体载体接触,每个双链多核苷酸包括第一链和第二链,其中所述第一链和所述第二链在它们的5'端处固定到所述固体载体,其中每条第一链包括第一裂解位点,并且其中每条第二链包括包含一个或多个二醇接头的第二裂解位点;
用所述第一线性化试剂在所述第一裂解位点处裂解一条或多条第一链,并且产生一种或多种裂解的第一核酸和裂解的固定化第一链;
从所述固体载体上去除所述裂解的第一核酸;
对固定化第二链进行测序;
重新合成与所述第二链互补的衍生第一链;
使钴催化剂与一条或多条第二链接触以在所述第二裂解位点处裂解所述第二链,并且产生一种或多种裂解的第二核酸和裂解的固定化第二链;
从所述固体载体上去除所述一种或多种裂解的第二核酸;以及
对固定化衍生第一链进行测序。
9.根据权利要求8所述的方法,其中所述第一线性化试剂是Pd催化剂。
10.根据权利要求9所述的方法,其中所述Pd催化剂是由Pd(II)化合物和溶性膦原位产生的Pd(0)催化剂。
11.根据权利要求9或10所述的方法,其中每条第一链的所述第一裂解位点包括乙烯基部分。
12.根据权利要求11所述的方法,其中所述第一裂解位点包括包含式(II)的结构的经修饰的核苷酸:
其中基是腺嘌呤、7‑脱氮腺嘌呤、嘌呤、7‑脱氮鸟嘌呤、胞嘧
啶、胸腺嘧啶或尿嘧啶或它们的衍生物
13.根据权利要求8至12中任一项所述的方法,其中每条第一链从固定到所述固体载体的第一延伸引物延伸,并且其中所述第一延伸引物包括P15序列。
14.根据权利要求8至13中任一项所述的方法,其中所述二醇接头包括式(I)的结构:
其中
r为2、3、4、5或6;并且
s为2、3、4、5或6。
15.根据权利要求14所述的方法,其中所述二醇接头包括式(Ia)的结构:
16.根据权利要求8至15中任一项所述的方法,其中每条第二链从固定到所述固体载体的第二延伸引物延伸,并且其中所述第二延伸引物包括P17序列。
17.根据权利要求1至16中任一项所述的方法,其中所述钴催化剂是多相钴催化剂。
18.根据权利要求17所述的方法,其中所述钴催化剂包含原子分散在中孔氮掺杂材料上的钴。
19.根据权利要求18所述的方法,其中所述钴催化剂包括具有约3.8wt%Co的Meso‑Co‑NC‑800。
20.根据权利要求1至19中任一项所述的方法,其中所述二醇接头在约25℃至约50℃的温度下裂解。

说明书全文

用于表面结合的多核苷酸的金属定向裂解的方法

技术领域

[0001] 本公开的实施方案涉及用于边合成边测序(SBS)的双链多核苷酸的化学线性化的组合物和方法。
[0002] 序列表的参考
[0003] 本申请连同电子格式的序列表一起提交。序列表以于2022年12月14日创建的大小为18.0KB的以Sequence_listing_ILLINC.692WO.xml命名的文件提供。序列表的电子格式的信息全文以引用方式并入本文。

背景技术

[0004] 各种核酸测序方法是本领域已知的。美国专利第5,302,509号描述了一种用于对多核苷酸模板进行测序的方法,其涉及使用DNA聚合酶或DNA连接酶执行多个延伸反应以连续地掺入与模板链互补的标记的多核苷酸。在此类SBS反应中,通过连续掺入与模板链互补的单个核苷酸,在5'至3'方向上构建与模板链配对的新多核苷酸链。在测序反应中所用的底物核苷三磷酸利用不同3'标记在3'位处进行标记,从而允许在添加连续核苷酸时测定掺入的核苷酸的同一性。
[0005] 为了使核酸测序反应的通量最大化,有利的是能够并行对多个模板分子测序。可通过使用核酸阵列技术来实现多个模板的并行处理。这些阵列通常由固定到固体载体材料上的多核苷酸的高密度矩阵组成。
[0006] 本领域已描述了用于制造固定化核苷酸测定的阵列的各种方法。WO 98/44151和WO 00/18957均描述了核酸扩增方法,其允许将扩增产物固定在固体载体上以便形成阵列,这些阵列由簇或“集落”组成,其中簇或“集落”由多条相同的固定化多核苷酸链和多条相同的固定化互补链形成。这种类型的阵列在本文中被称为“成簇阵列”。在根据这些方法制备的聚类阵列上的DNA集落中存在的核酸分子可提供用于测序反应的模板,例如如WO 98/44152中所述。固相扩增反应的产物(诸如WO 98/44151和WO 00/18957中描述的那些)是所谓的“桥接”结构,这些结构通过对成对的固定化多核苷酸链和固定化互补链(两条链均在
5'端连接到固体载体上)进行退火而形成。为了提供更适合的模板用于核酸测序,优选的是除去“桥接”结构的其中一条固定化链的基本上全部或至少一部分,以便产生至少部分是单链的模板。因此,该模板的单链部分将可用于与测序引物杂交。除去“桥接”双链核酸结构中的一条固定化链的全部或一部分的过程被称为“线性化”。线性化的方式有多种,包括但不限于酶促裂解、光化学裂解或化学裂解。线性化方法的非限制性示例公开于PCT公开第WO 
2007/010251号、美国专利公开第2009/0088327号和美国专利公开第2009/0118128号中,这些专利全文以引用方式并入。
[0007] 已知酶促方法促进寡核苷酸或多核苷酸的有效位点特异性裂解以使双链DNA簇线性化并使表面结合的引物脱保护。目前,在各种测序应用中,酶已经广泛用于这两种类型的反应中。然而,酶促方法存在某些问题,包括酶稳定性、酶生产成本、特定储存和处理要求、酶活性的变化和测序读数中的高背景强度。因此,需要开发用于有效DNA测序的替代线性化和脱保护方法。然而,由于试剂、条件和副产物(a)必须与上游和下游反应(包括寡核苷酸杂交和变性、引物PCR延伸和DNA合成)相容,(b)必须在酸性、碱性和化条件下表现出良好的稳定性,(c)必须实现快速清洁的化学反应,以及(d)必须不干扰核苷酸检测方法,因此在这种情况下对可应用于线性化步骤的反应类型存在许多限制。本公开描述了用于双链DNA的化学裂解的组合物,其是满足上述要求的有效替代方案。发明内容
[0008] 本公开的一个方面涉及一种使多个固定化双链多核苷酸化学线性化的方法,该方法包括:
[0009] 使钴催化剂与包括该多个固定化双链多核苷酸的固体载体接触,每个双链多核苷酸包括第一链和第二链,其中该第一链和该第二链在它们的5'端处固定到该固体载体,其中每条第二链包括裂解位点;以及
[0010] 用该钴催化剂在该裂解位点处化学裂解一条或多条第二链,并且产生一种或多种裂解的第二核酸和裂解的固定化第二链。
[0011] 在本文所述的化学线性化方法的一些实施方案中,该方法还包括从该固体载体上去除该一种或多种裂解的第二核酸。在一些实施方案中,每条第二链的该裂解位点包括一个或多个二醇接头。在一些实施方案中,该二醇接头包括式(I)的结构:
[0012] 其中r为2、3、4、5或6;并且s为2、3、4、5或6。在一个实施方案中,该二醇接头包括式(Ia)的结构:
[0013] 在另外的实施方案中,每条第二链从固定到该固体载体的第二延伸引物延伸,并且其中该第二延伸引物包括第二裂解位点。在另一个实施方案中,该第二延伸引物包括P17序列。
[0014] 本公开的另一方面涉及一种对多核苷酸进行测序的方法,该方法包括:
[0015] 使第一线性化试剂与包括多个固定化双链多核苷酸的固体载体接触,每个双链多核苷酸包括第一链和第二链,其中该第一链和该第二链在它们的5'端处固定到该固体载体,其中每条第一链包括第一裂解位点,并且其中每条第二链包括包含一个或多个二醇接头的第二裂解位点;
[0016] 用该第一线性化试剂在该第一裂解位点处裂解一条或多条第一链,并且产生一种或多种裂解的第一核酸和裂解的固定化第一链;从该固体载体上去除这些裂解的第一核酸;
[0017] 对固定化第二链进行测序;
[0018] 重新合成与这些第二链互补的衍生第一链;
[0019] 使钴催化剂与一条或多条第二链接触以在该第二裂解位点处裂解该第二链,并且产生一种或多种裂解的第二核酸和裂解的固定化第二链;
[0020] 从该固体载体上去除该一种或多种裂解的第二核酸;以及
[0021] 对固定化衍生第一链进行测序。
[0022] 在本文所述的测序方法的一些实施方案中,该第一线性化试剂是Pd催化剂。在另外的实施方案中,该Pd催化剂是由Pd(II)化合物和溶性膦原位产生的Pd(0)催化剂。在一些实施方案中,每条第一链的该第一裂解位点包括乙烯基部分。在一些实施方案中,该第一裂解位点包括包含式(II)的结构的经修饰的核苷酸:
[0023] 其中碱基是腺嘌呤、7‑脱氮腺嘌呤、嘌呤、7‑脱氮鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶或它们的衍生物。在另外的实施方案中,每条第一链从固定到该固体载体的第一延伸引物延伸,并且其中该第一延伸引物包括P15序列。在一些实施方案中,该二醇接头包括式(I)的结构:
[0024] 其中r为2、3、4、5或6;并且s为2、3、4、5或6。在一个实施方案中,该二醇接头包括式(Ia)的结构:
[0025] 在另外的实施方案中,每条第二链从固定到该固体载体的第二延伸引物延伸,并且其中该第二延伸引物包括P17序列。
[0026] 在本文所述的方法的任何实施方案中,钴催化剂可以是多相催化剂。在一些实施方案中,该钴催化剂包含原子分散在中孔氮掺杂材料上的钴。在一些实施方案中,该钴催化剂包括包含约3.8wt%Co的Meso‑Co‑NC‑800。在任何实施方案中,该二醇接头在约25℃至约50℃的温度下裂解。附图说明
[0027] 图1展示了使用化学线性化的因美纳(Illumina)的边合成边测序(SBS)化学的工作流程的实施方案。
[0028] 图2是含有邻位1,2‑二醇的P17引物的钴催化的化学裂解的反应方案。

具体实施方式

[0029] 非酶促化学线性化策略是用于在每次测序读取之前裂解桥接的双链多核苷酸结构的有吸引的替代方案。具体地讲,化学品通常可在室温下长期储存并且与酶相比相对便宜。此外,化学组合物还可以冻干形式运输和/或储存,并且在使用前重构成水溶液。如果需要,双链核酸分子的一条或两条链可包括一个或多个非核苷酸化学部分和/或非天然核苷酸和/或非天然主链键,以允许在特定裂解位点,优选地在预定裂解位点处的化学裂解反应。
[0030] 适于掺入到多核苷酸链中的基于亚磷酰胺化学的二醇接头单元可从富达系统公司(Fidelity Systems,Inc)(美国里兰州盖瑟斯堡(Gaithersburg,MD,USA))商购获得。可使用用于自动化化学DNA合成的标准方法将一个或多个二醇单元掺入到多核苷酸中。为了将二醇接头定位在离固体载体的最佳距离处,可在二醇接头与连接到固体载体的位点之间包含一个或多个间隔子分子。间隔子分子可是非核苷酸化学部分。富达系统公司也供应与二醇接头结合使用的基于亚磷酰胺化学的合适间隔子单元。通过用“裂解剂”处理来裂解二醇接头,该“裂解剂”可以是促进二醇裂解的任何物质。用于二醇裂解最常用的技术是使用强氧化剂(诸如高碘酸钠(NaIO4))。
[0031] 本公开的实施方案涉及通过使用钴催化剂,例如多相钴催化剂,氧化裂解1,2‑邻二醇的替代解决方案。本文所述的钴催化的线性化方法可以在环境温度下和大气氧存在的情况下执行。另外,多相催化剂的一个优点是在催化剂的再利用和回收方面相对容易。此类线性化技术可用于替代酶的使用,这些酶不一定是稳健的并且需要保持冷冻或处于低温。相反,本文所述的钴催化的线性化方法不需要任何缓冲。此外,此类化学线性化可以在温和的反应温度和与边合成边测序相容的条件下进行。
[0032] 定义
[0033] 本文所用的章节标题仅用于组织目的,而不应理解为限制所述主题。
[0034] 除非另有定义,否则本文所用的所有技术和科学术语的含义与本领域的普通技术人员通常理解的含义相同。术语“包括”以及其他形式(诸如“包括(include/includes/included)”)的使用不是限制性的。术语“具有”以及其他形式(诸如“具有(have/has/had)”)的使用不是限制性的。如本说明书中所用,无论是在过渡短语中还是在权利要求的正文中,术语“包含(comprise(s))”和“包含(comprising)”都将被解释为具有开放式含义。即,上述术语应与短语“至少具有”或“至少包括”同义地解释。例如,当在过程的上下文中使用时,术语“包含”表示该过程至少包括所列举的步骤,但是也可包括额外步骤。当在化合物、组合物或设备的上下文中使用时,术语“包含”是指该化合物、组合物或设备至少包含所列举的特征或组分,但是也可包含额外特征或组分。
[0035] 如本文所用,术语“共价连接的”或“共价键合的”是指形成特征在于原子之间共用电子对的化学键合。例如,共价连接的聚合物涂层是指与底物的官能化表面形成化学键的聚合物涂层,这与经由其他方式(例如,粘附或静电相互作用)粘附到该表面形成比较。
[0036] 如本文所用,术语“延伸引物”是指固定在固体载体上的寡核苷酸或多核苷酸,其中该寡核苷酸或多核苷酸能够特异性结合靶单链核酸分子的序列。杂交过程后,寡核苷酸或多核苷酸被延伸以包括与靶核酸分子互补的序列。在一些情况下,术语“延伸引物”可与“扩增引物”互换使用。本文所述的延伸引物可包括P5/P7或P15/P17引物。P5和P7引物用于因美纳公司(Illumina Inc.)出售的商业流动池的表面,用于测序。合适的引物的具体示例TM包括P5和/或P7引物,其用于因美纳公司出售的商业流动池的表面上,以用于在HISEQ 、TM TM TM TM TM TM TM
HISEQX 、MISEQ 、MISEQDX 、MINISEQ 、NEXTSEQ 、NEXTSEQDX 、NOVASEQ 、GENOME TM TM
ANALYZER 、ISEQ 和其他仪器平台上进行测序。引物序列描述于美国专利公开第2011/
0059865A1号中,该专利公开以引用方式并入本文。用于成对端测序的标准P5和P7引物序列包括以下:
[0037] P5:成对端5'→3'
[0038] AATGATACGGCGACCACCGAGAUCTACAC(SEQ ID NO.1)
[0039] P7:成对端5'→3'
[0040] CAAGCAGAAGACGGCATACGAG*AT(SEQ ID NO.2)
[0041] 其中G*是8‑氧代‑鸟嘌呤。
[0042] 任选地,P5和P7引物中的一者或两者可包括poly T尾。poly T尾通常位于上文序列的5'端处,但在一些情况下可位于3'端处。poly T序列可包含任何数量(例如2个至20个)的T核苷酸。
[0043] 在具有poly‑T间隔子的PAZAM涂覆的流通池中使用的标准P5和P7引物序列包括如下:
[0044] 具有poly‑T间隔子的P5引物:
[0045] 5'‑炔‑TTTTTTTTTTAATGATACGGCGACCACCGAGAUCTACAC(SEQ ID NO.3)
[0046] 具有poly‑T间隔子的P7引物:
[0047] 5'‑炔‑TTTTTTTTTTCAAGCAGAAGACGGCATACGAG*AT(SEQ ID NO:4)
[0048] 其中G*是8‑氧代‑鸟嘌呤。
[0049] 另外的引物序列包括用于单个读段SBS的一组P5和P7引物:
[0050] P5:单个读段:5'→3'
[0051] AATGATACGGCGACCACCGA(SEQ ID NO.5)
[0052] P7:单个读段5'→3'
[0053] CAAGCAGAAGACGGCATACGA(SEQ ID NO.6)
[0054] 如本文所用,当标准P5/P7引物或寡核苷酸被修饰以掺入能够经历化学裂解(例如,通过Pd络合物)的第一裂解位点或第二裂解位点时,P5/P7引物的修饰可以指P5/P7序列中的现有核苷酸(或核苷)被不同的化学实体(例如,具有特定功能以使得能够实现位点特异性化学裂解的经修饰的核苷酸或核苷类似物)替代或取代。修饰还可以指将新的化学实体插入到现有的P5/P7序列中,其中该新的化学实体能够经历位点特异性化学裂解。在一些实施方案中,经修饰的P5/P7引物分别称为P15/P17引物,其公开于美国公开第2019/0352327号中并且全文以引用方式并入。具体地讲,P15/P17引物可包括以下:
[0055] P15:5'→3'
[0056] AATGATACGGCGACCACCGAGAT*CTACAC(SEQ ID NO.7)
[0057] P17引物5'→3'
[0058] YYYCAAGCAGAAGACGGCATACGAGAT(SEQ ID NO.8)
[0059] P15引物5'→3'
[0060] 5'‑炔‑TTTTTTAATGATACGGCGACCACCGAGAT*CTACAC(SEQ ID NO.9)
[0061] P17引物5'→3'
[0062] 5'‑炔‑TTTTTTYYYCAAGCAGAAGACGGCATACGAGAT(SEQ ID NO.10)
[0063] 其中T*是乙烯基取代的T核苷;并且Y是经受化学裂解的二醇接头,例如,通过用试剂(诸如高碘酸盐)氧化,如在美国公开第2012/0309634号中公开的,该美国公开全文以优选方式并入。在一些实施方案中,二醇接头包括如本文所述的式(I)或(Ia)。在一些实施方案中,乙烯基取代的T核苷包括如本文所述的式(II)。
[0064] 如本文所用,术语“核酸”和“核苷酸”旨在与它们在本领域中的用途保持一致并且包含天然存在的物种或它们的功能类似物。核酸的特定有用的功能类似物能够以序列特异性方式与核酸杂交或者能够用作用于复制特定核苷酸序列的模板。天然存在的核酸通常具有包含磷酸二酯键的主链。类似结构可具有替代的主链键,包括本领域已知的多种主链键中的任一种。天然存在的核酸通常具有脱氧核糖(例如,存在于脱氧核糖核酸(DNA)中)或核糖(例如,存在于核糖核酸(RNA)中)。核酸可以含有具有本领域已知的这些糖部分的各种类似物的任何类似物的核苷酸。核酸可以包含天然或非天然核苷酸。就这一点而言,天然脱氧核糖核酸可具有选自由腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤组成的组的一个或多个碱基,并且核糖核酸可具有选自由尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤组成的组的一个或多个碱基。可以包含在核酸或核苷酸中的有用的非天然碱基是本领域已知的。除非另有明确说明,否则术语“探针”或“靶”当用于提及核酸时,旨在作为本文所示的方法或组合物的上下文中核酸的语义标识符并且不一定限制核酸的结构或功能。术语“探针”和“靶”可以类似地应用于其他分析物(诸如蛋白质、小分子、细胞等)。
[0065] 如本文所用,术语“多核苷酸”通常指核酸,包括DNA(例如基因组DNA cDNA)、RNA(例如mRNA)、合成的寡核苷酸和合成的核酸类似物。多核苷酸可包含天然或非天然碱基或它们的组合以及天然或非天然主链键,例如硫代磷酸酯、PNA或2'‑O‑甲基‑RNA或它们的组合。在一些情况下,术语“多核苷酸”、“寡核苷酸(oligonucleotide)”或“寡核苷酸(oligo)”可互换使用。
[0066] 如本文所使用的术语“裂解位点”是指多核苷酸序列上的一个位置,在该位置可以通过裂解反应去除多核苷酸的一部分。裂解位点的位置优选地是预先确定的,这意味着裂解反应发生的位置是预先确定的,这与在随机位点处的裂解相反,在随机位点处,裂解反应发生的位置是预先未知的。
[0067] 如本文所用,术语“固体载体”是指不溶于水性液体的刚性基底。该基底可以为无孔的或多孔的。该基底可任选地能够吸收液体(例如,由于孔隙率),但是通常将足够刚性,使得基底在吸收液体时不显著膨胀,并且在通过干燥去除液体时基本上不收缩。无孔固体载体一般来讲对液体或气体不可渗透。示例性固体载体包括但不限于玻璃和改性或官能化的玻璃、塑料(例如,丙烯酸、聚苯乙烯以及苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚TM丁烯、聚酯、Teflon 、环烯、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化或基于二氧化硅的材料(包括硅和改性硅)、碳、金属、无机玻璃、光纤束和聚合物。对于一些实施方案特别有用的固体载体是流动池的部件或位于流动池设备内。固体载体可以具有平面表面,例如,流动池或非平面表面,例如,珠粒。
[0068] 当取代基被描述为二基(即,具有与分子的其余部分的两个连接点)时,应理解,除非另外指明,否则取代基可以任何定向构型连接。因此,例如,描绘为‑AE‑或的取代基包括被定向成使得A连接在分子的最左侧连接点处的取代基,以及其中A连接在该分子的最右侧连接点处的取代基。
[0069] 如本文所用,“核苷酸”包括含氮杂环碱基、糖以及一个或多个磷酸基团。它们是核酸序列的单体单元。在RNA中,糖为核糖,并且在DNA中为脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮杂环碱基可为嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G)以及它们的修饰衍生物或类似物,诸如7‑脱氮腺嘌呤或7‑脱氮鸟嘌呤。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及它们的经修饰的衍生物或类似物。脱氧核糖的C‑1原子与嘧啶的N‑1或嘌呤的N‑9键合。
[0070] 如本文所用,“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团连接到糖分子的核苷类似物。术语“核苷”在本文中以本领域技术人员所理解的常规含义使用。示例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。经修饰的戊糖部分是其中氧原子已被碳取代和/或碳已被硫或氧原子取代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。另外,核苷可以掺入较大的DNA和/或RNA聚合物和低聚物中。
[0071] 术语“嘌呤碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。类似地,术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。任选地取代的嘌呤碱基的非限制性列表包括嘌呤、腺嘌呤、鸟嘌呤、脱氮嘌呤、7‑脱氮腺嘌呤、7‑脱氮鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7‑烷基鸟嘌呤(例如7‑甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的示例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6‑二氢尿嘧啶和5‑烷基胞嘧啶(例如5‑甲基胞嘧啶)。
[0072] 如本文所用,“衍生物”或“类似物”意指具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide Analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543‑584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键和氨基磷酸酯键。如本文所用,“衍生物”、“类似物”和“修饰的”可以互换使用,并且由本文定义的术语“核苷酸”和“核苷”涵盖。
[0073] 钴催化的化学线性化的方法
[0074] 本公开的一些实施方案涉及一种使多个固定化双链多核苷酸化学线性化的方法,该方法包括:使钴催化剂与包括该多个固定化双链多核苷酸的固体载体接触,每个双链多核苷酸包括第一链和第二链,其中该第一链和该第二链在它们的5'端处固定到该固体载体,其中每条第二链包括裂解位点;以及用该钴催化剂在该裂解位点处化学裂解一条或多条第二链,并且产生一种或多种裂解的第二核酸和裂解的固定化第二链。在一些实施方案中,该方法还包括从该固体载体上去除该一种或多种裂解的第二核酸。
[0075] 在本文所述的钴线性化方法的一些实施方案中,每条第二链从固定到该固体载体的第二延伸引物延伸,并且每个第二延伸引物包括裂解位点。
[0076] 在一些实施方案中,每条第二链的该裂解位点包括一个或多个二醇接头。在一些实施方案中,该二醇接头包括式(I)的结构:
[0077] 其中r为2、3、4、5或6;并且s为2、3、4、5或6。在另外的实施方案中,该二醇接头包括或具有结构: 其中“a”氧是第一核苷酸的3'羟
基氧;并且“b”氧是第二核苷酸的5'羟基氧。
[0078] 在一个实施方案中,该二醇接头包括式(Ia)的结构:
[0079] 在另外的实施方案中,该二醇接头包括或具有 的结构,其中“a”氧是第一核苷酸的3'羟基氧;并且“b”氧
是第二核苷酸的5'羟基氧。在另外的实施方案中,第二延伸引物包括P17引物(SEQ ID NO.8或10)。在一个实施方案中,该第二延伸引物是P17引物。
[0080] 在本文所述的方法的任何实施方案中,二醇接头可以在约20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃或80℃的温度下裂解。在本文所述的钴催化的线性化方法的一个实施方案中,例如,二醇接头在约25℃至约50℃的温度下裂解。
[0081] 钴试剂
[0082] 在本文所述的钴线性化方法的一些实施方案中,在化学线性化方法中使用的钴催化剂是水溶性的。在其他实施方案中,钴催化剂是多相催化剂。在一些情况下,钴催化剂包括在中孔氮掺杂碳材料上原子分散的钴。在一个此类实施方案中,钴催化剂包括Meso‑Co‑NC‑800,其包括约1wt%、2wt%、3wt%、3.1wt%、3.2wt%、3.3wt%、3.4wt%、3.5wt%、3.6wt%、3.7wt%、3.8wt%、3.9wt%、4wt%、5wt%、6wt%、7wt%、8wt%、9wt%或10wt%或由前述值中的任意两个限定的范围内的钴。在另一个实施方案中,钴催化剂是包括约3wt%钴的Meso‑Co‑NC‑800。在一个实施方案中,钴催化剂是包括约4wt%钴的Meso‑Co‑NC‑800。
在另一个实施方案中,钴催化剂是包括约3.8wt%钴的Meso‑Co‑NC‑800。
[0083] 过渡金属催化的化学线性化的方法
[0084] 本公开的一些实施方案涉及一种使多个固定化双链多核苷酸线性化的方法,该方法包括:提供包括双链多核苷酸的固体载体,其中每个双链多核苷酸包括第一链和第二链,其中该第一链和该第二链各自在它们的5'端处固定到该固体载体,并且其中每条第一链包括能够在裂解试剂(例如,过渡金属催化剂)存在的情况下经历化学裂解的第一裂解位点;使该双链多核苷酸与该裂解试剂接触,从而在该第一裂解位点处裂解一条或多条第一链,并且产生一条或多条裂解的第一核酸和裂解的固定化第一链。在一些实施方案中,该方法还包括从该固体载体上去除该裂解的第一核酸。在某个方面,裂解位点能够在Pd络合物(例如,Pd(0)络合物)存在的情况下经历化学裂解。在某个方面,裂解试剂是Pd络合物的水溶液。在某个方面,原位制备裂解试剂(例如,Pd(0)络合物)。
[0085] 在本文所述的Pd催化的线性化方法的一些实施方案中,每条第一链从固定到该固体载体的第一延伸引物延伸。
[0086] 在本文所述的Pd线性化方法的一些实施方案中,该第一延伸引物包括该第一裂解位点。在一些另外的实施方案中,该第一裂解位点包括能够经历化学裂解(例如通过钯络合物)的经修饰的核苷/核苷酸。在一些实施方案中,掺入该经修饰的核苷/核苷酸部分的第一裂解位点包括式(II)的结构,其中乙烯基取代的核苷或核苷酸的3'氧共价连接到另一个核苷酸的5'端(结构未示出):
[0087] 其中碱基是腺嘌呤、7‑脱氮腺嘌呤、鸟嘌呤、7‑脱氮鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶或类似物或它们的衍生物。在一些实施方案中,该经修饰的核苷酸或核苷是胸腺嘧啶(T)核苷或核苷酸类似物。在一些实施方案中,裂解位点位于第一延伸引物的3'端附近,例如,位于距第一延伸引物的3'端1、2、3、4、5、6、7、8、9或10个核苷酸距离内。在一些其他实施方案中,裂解位点位于第一延伸引物的5'端附近,例如,位于距第一延伸引物的5'端1、2、3、4、5、6、7、8、9或10个核苷酸距离内。在一些情况下,为了确保有效的DNA重新合成,裂解位点优选地位于朝第一引物的3'端,例如,在2至8、或3至7、或4至6个核苷酸距离内。在一个实施方案中,第一延伸引物是P5引物,并且第一裂解位点位于P5引物序列中(例如,通过添加或替代一个核苷酸,将经修饰的核苷酸掺入P5引物序列中)。因此,本文公开的P5序列(SEQ ID NO.1或SEQ ID NO.3)被修饰以包含能够通过Pd/Ni络合物经历化学裂解的第一裂解位点,从而形成经修饰的P5引物。在一个实施方案中,经修饰的P5引物包括或为本文公开的P15引物(SEQ ID NO.7或9)。
[0088] 钯试剂
[0089] 在本文所述的Pd线性化方法的一些实施方案中,在化学线性化方法中使用的Pd络合物是水溶性的。在一些此类实施方案中,Pd络合物是Pd(0)络合物。在一些情况下,Pd(0)络合物可以通过试剂诸如烯烃、醇、胺、膦或金属氢化物还原Pd(II)络合物而原位生成。合适的钯源包括Na2PdCl4、K2PdCl4、(PdCl(C3H5))2、[Pd(C3H5)(THP)]Cl、[Pd(C3H5)(THP)2]Cl、Pd(OAc)2、Pd(Ph3)4、Pd(dba)2和Pd(TFA)2。在一个此类实施方案中,Pd(0)络合物由Na2PdCl4原位产生。在另一个实施方案中,钯源是烯丙基氯化钯(II)二聚体[(PdCl(C3H5))2]。在一些实施方案中,Pd(0)络合物通过将Pd(II)络合物与膦混合而在水溶液中产生。合适的膦包括水溶性膦,诸如三(羟丙基)膦(THP)、三(羟甲基)膦(THM)、1,3,5‑三氮杂‑7‑磷杂金刚烷(PTA)、双(对磺酸基苯基)苯基膦二水合物盐、三(羧乙基)膦(TCEP)和三苯基膦‑3,3',3”‑三磺酸三钠盐。
[0090] 在一些实施方案中,Pd络合物是Pd(II)络合物(例如,Pd(OAc)2、[(烯丙基)PdCl]2或Na2PdCl4),其在膦(例如,THP)存在的情况下原位产生Pd(0)。例如,Pd(0)催化剂可通过将Pd(II)络合物[(PdCl(C3H5))2]与THP原位混合来制备。Pd(II)络合物和THP的摩尔比可以为约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一些另外的实施方案中,可以添加一种或多种还原剂,诸如抗坏血酸或其盐(例如,抗坏血酸钠)。在一些其他实施方案中,Pd(0)通过将Pd(II)预催化剂(诸如[Pd(C3H5)(THP)]Cl、[Pd(C3H5)(THP)2]Cl)与另外的THP混合来制备。[Pd(C3H5)(THP)]Cl和[Pd(C3H5)(THP)2]Cl可以通过使(PdCl(C3H5))2与1至5当量的THP反应来制备,并且它们可以在用于化学线性化反应之前被分离。
[0091] 变性
[0092] 在用于裂解的方法的任何实施方案中,可以使裂解反应的产物经受变性条件,以便去除未连接到固体载体的裂解链的部分。适合的变性条件对于技术人员而言将是显而易见的,参考标准分子生物学方案(Sambrook等人,2001,Molecular Cloning,A Laboratory Manual,第三版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor Laboratory Press,NY;Current Protocols,Ausubel等人编辑)。变性(并且后续对裂解链的重新退火)导致产生部分或基本上单链的测序模板。然后可通过将测序引物与模板的单链部分杂交来引发测序反应。
[0093] 在其他实施方案中,测序可以在裂解步骤后直接开始,而不需要变性以去除裂解链的一部分。如果裂解步骤在仍与互补链杂交的一条裂解链上产生游离的3'羟基基团,那么可以使用链置换聚合酶从这一点开始进行测序,而不需要初始变性步骤。具体地讲,链置换测序可以与通过用切口核酸内切酶裂解或通过用核酸内切酶、加热或碱处理水解脱碱基位点产生模板结合使用。
[0094] 测序方法
[0095] 本公开的另一方面涉及一种对多核苷酸进行测序的方法,该方法包括:
[0096] 使第一线性化试剂与包括多个固定化双链多核苷酸的固体载体接触,每个双链多核苷酸包括第一链和第二链,其中该第一链和该第二链在它们的5'端处固定到该固体载体,其中每条第一链包括第一裂解位点,并且其中每条第二链包括包含一个或多个二醇接头的第二裂解位点;
[0097] 用该第一线性化试剂在该第一裂解位点处裂解一条或多条第一链,并且产生一种或多种裂解的第一核酸和裂解的固定化第一链;
[0098] 对固定化第二链进行测序;
[0099] 重新合成与这些第二链互补的衍生第一链;
[0100] 使钴催化剂与一条或多条第二链接触以在该第二裂解位点处裂解该第二链,并且产生一种或多种裂解的第二核酸和裂解的固定化第二链;以及
[0101] 对固定化衍生第一链进行测序。
[0102] 在本文所述测序方法的一些实施方案中,该方法还包括在对固定化第二链进行测序之前,用3'羟基封端基团保护裂解的固定化第一链的任何游离3'羟基基团。在一些实施方案中,该方法还包括在对固定化第二链进行测序之前从固体载体去除该一种或多种裂解的第一核酸。在一些实施方案中,该方法还包括在对固定化衍生第一链进行测序之前从固体载体去除该一种或多种裂解的第二核酸。
[0103] 在本文所述的测序方法的一些实施方案中,固定化第二链的测序是通过边合成边测序(SBS)进行的,这在下文详细描述。在一些另外的实施方案中,该方法还包括变性步骤,以在固定化衍生第一链开始重新合成之前,去除由固定化第二链的SBS形成的互补链。在另外的实施方案中,该方法还包括在重新合成步骤之前将裂解的固定化第一链的3'羟基封端基团脱保护。在另外的实施方案中,固定化衍生第一链的测序也通过SBS进行。
[0104] 在本文所述的测序方法的一些实施方案中,第一线性化试剂包括或为化学线性化试剂,诸如钯催化剂(例如,本文所述的Pd(0)催化剂)。此线性化的步骤也称为第一化学裂解线性化。在一些实施方案中,每条第一链的该第一裂解位点包括乙烯基部分。在第二裂解位点处钴催化剂裂解二醇接头的步骤也称为第二化学裂解线性化。
[0105] 在本文所述的测序方法的一些实施方案中,第一裂解位点包括经修饰的核苷酸,该经修饰的核苷酸包括式(II)的结构:
[0106] 其中碱基是腺嘌呤、7‑脱氮腺嘌呤、鸟嘌呤、7‑脱氮鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶或它们的衍生物。在另外的实施方案中,每条第一链从固定到该固体载体的第一延伸引物延伸,并且其中该第一延伸引物包括P15序列。在一些实施方案中,该二醇接头包括式(I)的结构:
[0107] 其中r为2、3、4、5或6;并且s为2、3、4、5或6。在一个实施方案中,该二醇接头包括式(Ia)的结构:
[0108] 在另外的实施方案中,每条第二链从固定到该固体载体的第二延伸引物延伸,并且其中该第二延伸引物包括P17序列。
[0109] 在其他实施方案中,第一裂解位点可通过选自由光裂解、酶促裂解或它们的组合组成的组的方法裂解。在一个实施方案中,第一裂解位点可以通过酶促裂解反应裂解。在一个实施方案中,第一延伸引物是本文公开的P5引物(SEQ ID NO.1或3),其含有可被酶USER酶促裂解的脱氧尿苷(U)。
[0110] 图1描述了因美纳SBS化学的标准工作流程的实施方案。首先,提供包括固定在固体载体表面上的多种P5/P7引物的固体载体。P5引物和P7引物中的每一种在序列内具有裂解位点。在一个实施方案中,P5引物上的裂解位点是脱氧尿苷(U)。在一个实施方案中,P7引物上的裂解位点是8‑氧代‑鸟嘌呤核苷酸(氧代‑G)。待测序的一组靶DNA分子与固定化P5/P7引物杂交。杂交后,去除原始靶DNA分子,仅留下含有P5/P7引物的延伸的多核苷酸的互补拷贝。此步骤也被称为“接种”步骤。然后,通过称为“桥式扩增”的方法扩增延伸的P5/P7多核苷酸,形成双链簇,其中两条链在5'端处连接到固体载体。在“成簇”步骤后,执行第一线性化以去除含有P5引物的延伸的多核苷酸的一部分。在一个实施方案中,通过使用酶USER裂解P5引物上的U位置的酶促裂解反应(第一线性化步骤)来促进此类去除。在第一轮SBS(读段1)之后,进行重新合成以再次形成双链多核苷酸。然后,执行第二线性化以去除含有P7引物的延伸的多核苷酸的一部分。在一个实施方案中,通过使用酶FPG裂解P7引物的氧代‑G位置的酶促裂解反应促进此类去除。然后进行第二轮SBS(读段2)以对靶DNA进行测序。
[0111] 替代性地,P5引物可被P15引物替代,并且P7引物可被P17引物替代。在此情况下,第一线性化步骤可以通过使用本文所述的Pd催化剂的化学裂解线性化来实现。第二线性化步骤也可以通过使用本文所述的钴催化剂的化学裂解线性化来实现。
[0112] 替代性地,固体载体可包括P5/P17引物。在此情况下,第一线性化步骤可以通过使用USER的酶促线性化来实现。第二线性化步骤可以通过使用本文所述的钴催化剂(例如,钴络合物)的化学裂解线性化来实现。
[0113] 在本文所述的测序方法的一些实施方案中,钴催化剂是多相催化剂。在一些情况下,钴催化剂包括在中孔氮掺杂碳材料上原子分散的钴。在一个此类实施方案中,钴催化剂包括Meso‑Co‑NC‑800,其包括约1wt%、2wt%、3wt%、3.1wt%、3.2wt%、3.3wt%、3.4wt%、3.5wt%、3.6wt%、3.7wt%、3.8wt%、3.9wt%、4wt%、5wt%、6wt%、7wt%、8wt%、9wt%或
10wt%或由前述值中的任意两个限定的范围内的钴。在另一个实施方案中,Meso‑Co‑NC‑
800包括约3wt%钴。在一个实施方案中,Meso‑Co‑NC‑800包括约4wt%钴。在另一个实施方案中,Meso‑Co‑NC‑800包括约3.8wt%钴。
[0114] 在本文所述的方法的任何实施方案中,二醇接头可以在约20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃或80℃的温度下裂解。在本文所述的测序方法的一个实施方案中,例如,二醇接头在约25℃至约50℃的温度下裂解。
[0115] 在一些实施方案中,本文所述的方法可用于确定多核苷酸的核苷酸序列。在此类实施方案中,该方法可包括以下步骤:(a)使多核苷酸聚合酶与连接到底物表面(例如,经由本文所述的聚合物或凝胶涂层中的任何一种)的去线性多核苷酸(下文也描述为靶多核苷酸)簇接触;(b)向底物表面提供核苷酸,使得当多核苷酸聚合酶利用一种或多种核苷酸时产生可检测信号;(c)检测在一种或多种连接的多核苷酸(或由连接的多核苷酸产生的一种或多种簇)处的信号;以及(d)重复步骤(b)和(c),从而确定底物连接的多核苷酸的核苷酸序列。
[0116] 标记的核苷酸可以用于任何分析方法(诸如包括检测连接到此类核苷酸的荧光标记的方法)中,无论是以其本身使用,还是掺入较大的分子结构或缀合物中或者与较大的分子结构或缀合物缔合。在该语境中,术语“掺入到多核苷酸中”可以意味着5'磷酸以磷酸二酯键与第二核苷酸的3'羟基基团接合,该第二核苷酸本身可以形成较长多核苷酸链的一部分。本文示出的核苷酸的3'端可以以磷酸二酯键或可以不以磷酸二酯键与另外的核苷酸的5'磷酸接合。因此,在一个非限制性实施方案中,本公开提供了检测掺入到多核苷酸中的标记的核苷酸的方法,该方法包括:(a)将至少一种本公开的标记的核苷酸掺入到多核苷酸中,以及(b)通过检测来自连接到所述核苷酸的染料化合物的荧光信号,来确定掺入到多核苷酸中的核苷酸的身份。
[0117] 此方法可以包括:合成步骤(a),其中将根据本公开的一种或多种标记的核苷酸掺入到单链多核苷酸中;以及检测步骤(b),其中通过检测或定量测量掺入到多核苷酸中的一种或多种标记的核苷酸的荧光,来检测该一种或多种标记的核苷酸。
[0118] 本申请的一些实施方案涉及一种确定靶多核苷酸(例如,单链靶多核苷酸)的序列的方法,该方法包括:(a)使引物多核苷酸与一种或多种标记的核苷酸(诸如核苷三磷酸A、G、C和T)接触,并且其中该引物多核苷酸与该靶多核苷酸的至少一部分互补;(b)将标记的核苷酸掺入到该引物多核苷酸中;以及(c)执行一次或多次荧光测量以确定所掺入的核苷酸的身份。在一些此类实施方案中,引物多核苷酸/靶多核苷酸络合物通过使靶多核苷酸和与靶多核苷酸的至少一部分互补的引物多核苷酸接触来形成。在一些实施方案中,该方法还包括(d)从掺入到引物多核苷酸中的核苷酸中去除标记部分和3'羟基封端基团。在一些另外的实施方案中,该方法还可以包括(e)从引物多核苷酸链洗掉去除的标记部分和3'封端基团。在一些实施方案中,重复步骤(a)至步骤(d)或步骤(a)至步骤(e),直至确定靶多核苷酸链的至少一部分的序列。在一些情况下,步骤(a)至(d)或步骤(a)至(e)重复至少30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250或300个循环。
在一些实施方案中,在单一化学反应中去除来自掺入到引物多核苷酸链中的核苷酸的标记部分和3'封端基团。在一些另外的实施方案中,该方法在自动化测序仪器上执行,并且其中该自动化测序仪器包含在不同波长下操作的两个光源。在一些实施方案中,在完成本文所述的测序步骤的重复循环之后进行序列确定。
[0119] 在一些实施方案中,至少一种核苷酸在合成步骤中通过聚合酶的作用被掺入到多核苷酸(诸如本文所述的单链引物多核苷酸)中。然而,可以使用将核苷酸接合到多核苷酸的其他方法,诸如,化学寡核苷酸合成或者将标记的寡核苷酸与未标记的寡核苷酸连接。因此,当术语“掺入”关于核苷酸和多核苷酸使用时,可以涵盖通过化学方法以及酶促方法进行的多核苷酸合成。
[0120] 在一个特定实施方案中,进行了合成步骤并且该合成步骤可以任选地包括将模板多核苷酸链或靶多核苷酸链与包含本公开的荧光标记的核苷酸的反应混合物一起温育。还可以在允许在退火到模板或靶多核苷酸链的多核苷酸链上的游离3'羟基基团和标记的核苷酸上的5'磷酸基团之间形成磷酸二酯键的条件下提供聚合酶。因此,合成步骤可以包括通过核苷酸与模板/靶链的互补碱基配对来指导多核苷酸链的形成。
[0121] 在这些方法的所有实施方案中,检测步骤可以在向其中掺入了标记的核苷酸的多核苷酸链退火到模板/靶链上时进行,或者在其中将两条链分离的变性步骤之后进行。在合成步骤和检测步骤之间可以包括另外的步骤,例如化学反应步骤或酶促反应步骤,或者纯化步骤。具体地讲,可以分离或纯化掺入了标记的核苷酸的多核苷酸链,然后进一步加工或用于后续的分析。以举例的方式,在合成步骤中掺入如本文所述的标记核苷酸的多核苷酸链随后可以用作标记的探针或引物。在其他实施方案中,本文示出的合成步骤的产物可以经受进一步的反应步骤,并且如果需要,这些后续步骤的产物被纯化或分离。
[0122] 用于合成步骤的合适条件将为熟悉标准分子生物学技术的人员所熟知。在一个实施方案中,合成步骤可以类似于标准引物延伸反应,该标准引物延伸反应在合适的聚合酶的存在下使用核苷酸前体(包括如本文所述的标记的核苷酸)形成与模板/靶链互补的延伸的多核苷酸链(引物多核苷酸链)。在其他实施方案中,合成步骤本身可以形成产生标记的双链扩增产物的扩增反应的一部分,该标记的双链扩增产物由来源于引物多核苷酸链和模板多核苷酸链的复制的退火互补链组成。其他示例性合成步骤包括切口平移、链置换聚合、随机引发的DNA标记等。用于合成步骤的特别有用的聚合酶是能够催化如本文示出的标记的核苷酸的掺入的聚合酶。可以使用多种天然存在的或突变的/经修饰的聚合酶。以举例的方式,热稳定聚合酶可以用于使用热循环条件进行的合成反应,而热稳定聚合酶可能不是等温引物延伸反应所期望的。能够掺入根据本公开的标记的核苷酸的合适的热稳定聚合酶包括WO 2005/024010或WO06120433中描述的那些,这些公开中的每一篇以引用方式并入本文。在较低温度诸如37℃处进行的合成反应中,聚合酶不必是热稳定聚合酶,因此对聚合酶的选择将取决于许多因素,诸如反应温度、pH、链置换活性等。
[0123] 在具体的非限制性实施方案中,本公开涵盖以下的方法:核酸测序、重新测序、全基因组测序、单核苷酸多态性评分、涉及当用本文示出的染料标记的经修饰的核苷酸或核苷掺入到多核苷酸中时对其进行检测的任何其他应用。
[0124] 本公开的特定实施方案提供了包含根据本公开的染料部分的标记的核苷酸在多核苷酸边合成边测序反应中的用途。合成测序通常涉及使用聚合酶或连接酶在5'至3'方向上将一个或多个核苷酸或寡核苷酸顺序添加至生长的多核苷酸链,以便形成与待测序的模板/靶核酸互补的延伸多核苷酸链。存在于一个或多个添加的核苷酸中的碱基的身份可以在检测或“成像”步骤中确定。添加的碱基的身份可以在每个核苷酸掺入步骤之后测定。然后可以使用常规的Watson‑Crick碱基配对规则来推断模板的序列。使用用本文示出的染料标记的核苷酸来测定单个碱基的身份可能是有用的,例如,在单核苷酸多态性的评分中,并且此类单碱基延伸反应在本公开的范围内。
[0125] 在本公开的一个实施方案中,模板/靶多核苷酸的序列通过检测连接到掺入的核苷酸的荧光标记,检测一个或多个核苷酸掺入到与待测序的模板多核苷酸互补的新生链中来确定。模板多核苷酸的测序可以用合适的引物(或制备成发夹构建体,其将包含引物作为发夹的一部分)引发,并且新生链通过在聚合酶催化的反应中向引物的3'端添加核苷酸而以逐个方式延伸。
[0126] 在特定实施方案中,不同的核苷酸三磷酸(A、T、G和C)中的每一种可以用独特的荧光团进行标记,并且还在3'位置处包含封端基团以防止不受控制的聚合。替代性地,四种核苷酸中的一种可以是未标记的(暗色)。聚合酶将核苷酸掺入到与模板多核苷酸/靶多核苷酸互补的新生链中,并且封端基团防止核苷酸的进一步掺入。任何未掺入的核苷酸都可以被洗掉,并且来自每种掺入的核苷酸的荧光信号可以通过合适的装置(如使用光源激发和合适的发射滤光器的电荷耦合装置)以光学方式“读取”。然后可以(同时或顺序地)除去(脱保护)3'封端基团和荧光染料化合物,以暴露新生链用于进一步掺入核苷酸。通常,将在每个掺入步骤之后确定所掺入的核苷酸的身份,但这不是严格必需的。类似地,美国专利第5,302,509号(以引用方式并入本文)公开了对固定在固体载体上的多核苷酸进行测序的方法。
[0127] 如上文所例示,该方法利用了在DNA聚合酶的存在下将荧光标记的3'‑封端的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的生长链中。聚合酶掺入与靶多核苷酸互补的碱基,但是被3'‑封端基团防止进一步添加。然后可以确定掺入的核苷酸的标记,并且通过化学裂解除去封端基团以允许发生进一步的聚合。在合成测序反应中待测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板将通常包含具有游离的3'羟基基团的双链区域,该双链区域充当用于在测序反应中添加另外的核苷酸的引物或起始点。待测序模板的该区域将在互补链上悬垂该游离的3'羟基基团。待测序模板的悬垂区域可以是单链的,但也可以是双链的,前提条件是在与待测序的模板链互补的链上存在“切口”,以提供用于引发测序反应的游离3'OH基团。在此类实施方案中,测序可以通过链置换进行。在某些实施方案中,可以添加带有游离的3'羟基基团的引物,作为与待测序模板的单链区域杂交的单独组分(例如,短寡核苷酸)。替代性地,待测序的引物和模板链可以各自形成能够形成分子内双链体(诸如发夹环结构)的部分自身互补核酸链的一部分。发夹多核苷酸及其可以连接到固体载体的方法在PCT公开号WO0157248和WO2005/047301中公开,这些公开中的每一篇以引用方式并入本文。核苷酸可以被连续地添加到生长引物,导致在5'至3'方向上合成多核苷酸链。可以确定已添加的碱基的性质,特别是但不必在每次添加核苷酸之后,从而提供核酸模板的序列信息。因此,通过经由与核苷酸的5'磷酸基团形成磷酸二酯键而将核苷酸接合到核酸链的游离的3'羟基基团,从而将该核苷酸掺入到核酸链(或多核苷酸)中。
[0128] 待测序的核酸模板可以是DNA或RNA,或者甚至是由脱氧核苷酸和核糖核苷酸组成的杂合分子。核酸模板可以包含天然存在的和/或非天然存在的核苷酸以及天然或非天然的骨架键,前提条件是这些不阻止测序反应中模板的复制。
[0129] 在某些实施方案中,待测序的核酸模板可以经由本领域已知的任何合适的连接方法(例如经由共价连接)连接到固体载体。在某些实施方案中,模板多核苷酸可以直接连接到固体载体(例如,基于二氧化硅的载体)。然而,在本公开的其他实施方案中,固体载体的表面可以以某种方式修饰,以便允许模板多核苷酸的直接共价连接,或者通过本身可以非共价地连接到固体载体的水凝胶或聚电解质多层来固定模板多核苷酸。
[0130] 其中多核苷酸已直接连接到载体(例如,基于二氧化硅的载体,诸如WO00/06770(以引用方式并入本文)中所公开的那些)的阵列,其中通过玻璃上的环氧侧基团与多核苷酸上的内部氨基基团之间的反应将多核苷酸固定在玻璃载体上。此外,可以通过硫基亲核物质与固体载体的反应将多核苷酸连接到固体载体,例如,如W02005/047301(以引用方式并入本文)中所述。固体支撑的模板多核苷酸的其他另外的示例是模板多核苷酸连接到在基于二氧化硅或其他固体载体上负载的水凝胶,例如如WO00/31148、WO01/01143、WO02/12566、WO03/014392、美国专利第6,465,178号和WO00/53812中所述,这些专利中的每一篇以引用方式并入本文。
[0131] 模板多核苷酸可以固定于其上的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶描述于上文引用的参考文献和WO2005/065814中,该专利以引用方式并入本文。可以使用的特定水凝胶包括WO2005/065814和美国公开第2014/0079923号中所述的那些。在一个实施方案中,水凝胶为PAZAM(聚(N‑(5‑叠氮基乙酰氨基戊基)丙烯酰胺‑共‑丙烯酰胺))。
[0132] DNA模板分子可以连接到珠粒或微粒,例如,如美国专利第6,172,218号(以引用方式并入本文)中所述。与珠粒或微粒的连接可以用于测序应用。可以制备珠粒文库,其中每个珠粒包含不同的DNA序列。示例性文库及其产生方法描述于Nature,437,376‑380(2005);Science,309,5741,1728‑1732(2005),这些文献各自以引用方式并入本文。使用本文示出的核苷酸对此类珠粒的阵列进行测序在本公开的范围内。
[0133] 待测序的模板可以形成固体载体上的“阵列”的一部分,在这种情况下,阵列可以采取任何方便的形式。因此,本公开的方法适用于所有类型的高密度阵列,包括单分子阵列、成簇阵列和珠粒阵列。用本公开的染料化合物标记的核苷酸可以用于对基本上任何类型的阵列上的模板(包括但不限于通过将核酸分子固定在固体载体上而形成的那些)进行测序。
[0134] 然而,用本公开的染料化合物标记的核苷酸在对成簇阵列进行测序的背景中是特别有利的。在成簇阵列中,阵列上的不同区域(通常称为位点或特征)包含多个多核苷酸模板分子。一般来讲,该多个多核苷酸分子不能通过光学手段单独地分辨,而是作为整体被检测到。取决于阵列的形成方式,阵列上的每个位点可以包含一个单独多核苷酸分子的多个拷贝(例如,该位点对于特定的单链核酸种类或双链核酸种类是同质的)或甚至少量不同多核苷酸分子的多个拷贝(例如,两个不同核酸种类的多个拷贝)。核酸分子的成簇阵列可以使用本领域中公知的技术产生。以举例的方式,WO 98/44151和WO00/18957(这些专利中的每一篇以引用方式并入本文)描述了扩增核酸的方法,其中模板和扩增产物均保持固定在固体载体上,以便形成由固定的核酸分子的簇或“集落”组成的阵列。根据这些方法制备的成簇阵列上存在的核酸分子是使用用本公开的染料化合物标记的核苷酸进行测序的合适模板。
[0135] 用本公开的染料化合物标记的核苷酸也可用于对单分子阵列上的模板进行测序。如本文所用的术语“单分子阵列”或“SMA”,是指分布(或排列)在固体载体上的多核苷酸分子群,其中任何单独的多核苷酸与该分子群的所有其他多核苷酸的间距使得有可能单独地分辨单独的多核苷酸分子。因此,在一些实施方案中,固定到固体载体的表面上的靶核酸分子能够通过光学手段分辨。这意味着一个或多个不同的信号(每个信号代表一种多核苷酸)将出现在所用的特定成像装置的可分辨区域内。
[0136] 可以实现单分子检测,其中阵列上的相邻多核苷酸分子之间的间距为至少100nm,更具体地讲至少250nm,还更具体地讲至少300nm,甚至更具体地讲至少350nm。因此,每个分子能够作为单分子荧光点来单独地分辨和检测,并且来自所述单分子荧光点的荧光也表现出单步光漂白
[0137] 术语“单独分辨的”和“单独分辨”在本文中用于规定,当可视化时,有可能将阵列上的一个分子与其相邻分子区分开。阵列上各个分子之间的间隔将部分地通过用于分辨各个分子的特定技术来确定。通过参考已公布的申请WO00/06770和WO 01/57248将理解单分子阵列的一般特征,这些申请中的每个申请以引用方式并入本文。虽然本公开的标记的核苷酸的一种用途是用于合成测序反应中,但此类核苷酸的效用却不限于此类方法。事实上,本文所述的标记的核苷酸可以有利地用于需要检测连接于掺入到多核苷酸中的核苷酸的荧光标记的任何测序方法。
[0138] 具体地讲,用本公开的染料化合物标记的核苷酸可以用于自动化荧光测序方案,尤其是基于Sanger和同事的链终止测序方法的荧光染料‑终止子循环测序。此类方法通常使用酶和循环测序将荧光标记的双脱氧核苷酸掺入引物延伸测序反应中。所谓的Sanger测序方法和相关方案(Sanger型)利用带有标记的双脱氧核苷酸的随机化链终止。
[0139] 因此,本公开还涵盖用染料化合物标记的核苷酸,这些核苷酸是在3'位置和2'位置处都缺乏羟基基团的双脱氧核苷酸,此类经修饰的双脱氧核苷酸适合在Sanger型测序方法等中使用。
[0140] 应当理解,用掺入3'封端基团的本公开的染料化合物标记的核苷酸也可以用于Sanger方法和相关方案,因为通过使用具有3'OH封端基团的核苷酸可以实现与通过使用双脱氧核苷酸所实现的效果相同的效果:两者均防止随后的核苷酸的掺入。在根据本公开的并且具有3'封端基团的核苷酸将用于Sanger型测序方法的情况下,应当理解,连接到核苷酸的染料化合物或可检测标记不需要经由可裂解的连接基连接,因为在掺入本公开的标记的核苷酸的每种情况下;随后不需要掺入核苷酸,因此不需要从核苷酸上除去标记。
[0141] 另选地,还可以使用未标记的核苷酸和含有本文所述的荧光染料的亲和试剂来进行本文所述的测序方法。例如,在步骤(a)的掺入混合物中,四种不同类型的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)中的一种类型、两种类型、三种类型或每种类型可以未被标记。四种类型的核苷酸中的每一种类型的核苷酸(例如,dNTP)具有3'羟基封端基团,以确保仅单个碱基可以通过聚合酶添加到引物多核苷酸的3'端。在步骤(b)中掺入未标记的核苷酸后,洗掉剩余未掺入的核苷酸。然后引入亲和试剂,其特异性地识别并结合掺入的dNTP以提供包含掺入的dNTP的标记的延伸产物。在WO 2018/129214和WO 2020/097607中已经公开了未标记的核苷酸和亲和试剂在边合成边测序中的用途。使用未标记核苷酸的本公开的修饰的测序方法可以包括以下步骤:
[0142] (a')使引物多核苷酸/靶多核苷酸络合物与一种或多种未标记的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)接触,其中引物多核苷酸与靶多核苷酸的至少一部分互补;
[0143] (b')将核苷酸掺入到引物多核苷酸中以产生延伸的引物多核苷酸;
[0144] (c')使延伸的引物多核苷酸与一组亲和试剂在一种亲和试剂特异性结合掺入的未标记的核苷酸的条件下接触,以提供标记的延伸的引物多核苷酸/靶多核苷酸络合物;
[0145] (d')对标记的延伸的引物多核苷酸/靶多核苷酸络合物执行一次或多次荧光测量,以确定掺入的核苷酸的身份。
[0146] 在本文所述的修饰的测序方法的一些实施方案中,掺入混合物中的未标记核苷酸中的每一者含有3'羟基封端基团。在另外的实施方案中,在下一掺入循环之前去除掺入的核苷酸的3'羟基封端基团。在其他另外的实施方案中,该方法还包括从掺入的核苷酸中去除亲和试剂。在其他另外的实施方案中,在相同反应中去除3'羟基封端基团和亲和试剂。在一些实施方案中,亲和试剂组可以包含特异性结合第一类型的核苷酸的第一亲和试剂、特异性结合第二类型的核苷酸的第二亲和试剂和特异性结合第三类型的核苷酸的第三亲和试剂。在一些另外的实施方案中,第一亲和试剂、第二亲和试剂和第三亲和试剂中的每一者均包含一个或多个可检测的、光谱可区分的标记。在一些实施方案中,亲和试剂可以包括蛋白质标签、抗体(包括但不限于抗体的结合片段、单链抗体、双特异性抗体等)、适体、打结素、affimer或以合适的特异性和亲和力结合掺入的核苷酸的任何其他已知的试剂。在一个实施方案中,至少一种亲和试剂是抗体或蛋白质标签。在另一个实施方案中,第一类型的亲和试剂、第二类型的亲和试剂和第三类型的亲和试剂中的至少一种是包括一个或多个可检测标记(例如,相同可检测标记的多个拷贝)的抗体或蛋白质标签。
[0147] 实施例
[0148] 在以下实施例中更详细地公开了附加的实施方案,这些实施例并非旨在以任何方式限制权利要求书的范围。
[0149] 实施例1
[0150] 在此实施例中,在用P15/P17引物接枝的新型流动池上测试本文所述的Pd(0)线性化方法和钴催化的二醇裂解方法,并且收集 (配置为2通道仪器)上的测序数据,并且将该测序数据与用P5/P7引物接枝的标准流动池进行比较,并使用图1所述的酶促线性化。新流动池和标准流动池均涂覆有PAZAM聚合物,并且对于两种类型的引物,表面上的引物密度旨在为约200K。
[0151] 用NovaSeqTM掺入混合物对两个流动池执行测序运行,并且在20℃下执行成像。对于标准表面引物(P5/P7),在读段1中用USER酶(LMX1)在38℃下温育20分钟以及在读段2中用FpG酶在40℃下温育20分钟进行线性化。对于新的P15/P17表面引物,通过将[Pd(C3H5)Cl]2与THP和抗坏血酸钠混合,在60℃下温育2分钟,用原位产生的Pd(0)催化剂进行第一化学线性化。对于第二线性化,使用含有3.8%钴的多相钴催化剂Meso‑Co‑NC‑800(Meso:中孔;800是热解温度),并且反应方案如图2所展示。Luo等人在Communications Chemistry(2019)2:17中描述了钴催化剂的制备。使用维生素B12(VB12)作为Co源并与水和胶态二氧化硅混合。然后使混合物在高温下反应(取决于所需的Co‑Nx比率)以获得中孔Co‑Nx分散物种。观察到Meso‑Co‑NC‑800可实现超过99%的总裂解转化率和高达99%的产率。钴催化剂反应在K2CO3存在的情况下在水溶液或质子溶剂(诸如甲醇)中在25℃下进行。