会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~

制备用于DNA测序的基底表面的方法

申请号 CN202280046049.3 申请日 2022-07-20 公开(公告)号 CN117813391A 公开(公告)日 2024-04-02
申请人 因美纳有限公司; 发明人 H·布拉克; M·莱萨德-瓦伊格; J·特萨伊;
摘要 本公开的实施方案涉及制备用于边合成边测序的基底的方法,该方法包括在接枝引物寡核苷酸之前使用低盐缓冲溶液将文库DNA捕获到表面。通过本文所述的方法制备的基底具有增加的簇单克隆性,并且还描述了使用通过该方法制备的该基底的边合成边测序。
权利要求

1.一种制备用于测序的基底的方法,所述方法包括:
使包含模板多核苷酸的第一缓冲溶液与所述基底的表面接触,其中所述基底的所述表面包含用于捕获模板多核苷酸的第一多个结合位点和用于捕获引物寡核苷酸的第二多个结合位点;以及
通过在所述模板多核苷酸与所述表面的所述第一多个结合位点之间形成共价结合或非共价结合将所述模板多核苷酸附接到所述基底的所述表面;
其中所述第一缓冲溶液包含约100mM或更低的一种或多种盐的总浓度。
2.根据权利要求1所述的方法,其中所述模板多核苷酸是单链多核苷酸。
3.根据权利要求1或2所述的方法,其中所述表面的所述第一多个结合位点包括非共价结合位点。
4.根据权利要求3所述的方法,其中所述非共价结合位点包括链霉抗生物素蛋白。
5.根据权利要求4所述的方法,其中所述模板多核苷酸中的每一个模板多核苷酸包含生物素部分。
6.根据权利要求1或2所述的方法,其中所述表面的所述第一多个结合位点包括共价结合位点。
7.根据权利要求6所述的方法,其中所述共价结合位点包括基结合位点、羧基结合位点、硫醇结合位点、结合位点、叠氮基结合位点、羟基结合位点、反式环辛烯结合位点、降片烯结合位点、环辛炔结合位点、代胺结合位点、SpyTag结合位点、Snap‑tag结合位点、CLIP‑tag结合位点或具有被分选酶识别的N‑末端的蛋白质或者它们的组合。
8.根据权利要求7所述的方法,其中所述模板多核苷酸中的每一个模板多核苷酸包含NHS酯部分、醛部分、亚氨酸酯部分、五氟苯基酯部分、羟甲基膦部分、化二亚胺部分、来酰亚胺部分、卤代乙酰基部分、吡啶基二硫化物部分、硫代磺酸酯部分、乙烯基砜部分、肼部分、烷氧基胺部分、异氰酸酯部分、炔部分、环炔部分、膦部分、四嗪部分、叠氮基部分、
6 6
SpyCatcher部分、O‑苄基嘌呤部分、O‑苄基胞嘧啶部分或能够进行分选酶偶联的片段
9.根据权利要求1至8中任一项所述的方法,其中所述第一缓冲溶液中所述模板多核苷酸的浓度为约10pM至约2000pM、约100pM至约1000pM、约200pM至约500pM、或约250pM至约
350pM。
10.根据权利要求1至9中任一项所述的方法,其中所述第一缓冲溶液具有约3.5或更低的pH。
11.根据权利要求1至10中任一项所述的方法,其中所述第一缓冲溶液还包含一种或多种拥挤剂。
12.根据权利要求1至11中任一项所述的方法,所述方法还包括:
使包含所述引物寡核苷酸的第二缓冲溶液与所述基底的所述表面接触;以及通过在所述引物寡核苷酸与所述表面的所述第二多个结合位点之间形成共价结合或非共价结合将所述引物寡核苷酸附接到所述基底的所述表面;
其中所述第二缓冲溶液包含约250mM或更高的一种或多种盐的总浓度。
13.根据权利要求12所述的方法,其中所述引物寡核苷酸包括第一类型的引物寡核苷酸和第二类型的引物寡核苷酸。
14.根据权利要求13所述的方法,其中所述引物寡核苷酸包含P5引物序列和P7引物序列。
15.根据权利要求12或13所述的方法,其中所述表面的所述第二多个结合位点包括共价结合位点。
16.根据权利要求15所述的方法,其中所述表面的所述第二多个结合位点包括氨基结合位点、羧基结合位点、硫醇结合位点、醛结合位点、叠氮基结合位点、羟基结合位点、反式环辛烯结合位点、降冰片烯结合位点、环辛炔结合位点、氧代胺结合位点、SpyTag结合位点、Snap‑tag结合位点、CLIP‑tag结合位点或具有被分选酶识别的N‑末端的蛋白质或者它们的组合。
17.根据权利要求16所述的方法,其中所述多个引物寡核苷酸中的每一个引物寡核苷酸包含NHS酯部分、醛部分、亚氨酸酯部分、五氟苯基酯部分、羟甲基膦部分、碳化二亚胺部分、马来酰亚胺部分、卤代乙酰基部分、吡啶基二硫化物部分、硫代磺酸酯部分、乙烯基砜部分、肼部分、烷氧基胺部分、异氰酸酯部分、炔部分、环炔部分、二苯并环辛炔部分、膦部分、
6 6
四嗪部分、叠氮基部分、SpyCatcher部分、O‑苄基鸟嘌呤部分、O‑苄基胞嘧啶部分或能够进行分选酶偶联的片段。
18.根据权利要求12至17中任一项所述的方法,所述方法还包括扩增所述模板多核苷酸。
19.根据权利要求1至18中任一项所述的方法,其中所述基底的所述表面包括多个图案化纳米孔。
20.根据权利要求19所述的方法,其中至少50%的所述纳米孔各自被仅一个模板多核苷酸簇或仅一个优势模板多核苷酸簇占据。
21.一种用于测序的基底,所述基底包括:
模板多核苷酸,所述模板多核苷酸通过第一多个结合位点经由共价或非共价结合附接到所述基底的表面;以及
用于捕获引物寡核苷酸的第二多个结合位点;
其中所述基底的所述表面包括多个图案化纳米孔,并且其中至少50%的所述纳米孔各自被单个模板多核苷酸占据。

说明书全文

制备用于DNA测序的基底表面的方法

技术领域

[0001] 本公开涉及制备用于测序应用(诸如核酸测序)的基底表面的方法。
[0002] 序列表的参考
[0003] 本申请连同电子格式的序列表一起提交。该序列表作为创建于2022年7月14日的名称为“Sequence_listing_ILLINC565WO.xml”的文件提供,该文件的大小为14.1Kb。序列表的电子格式的信息全文以引用方式并入本文。

背景技术

[0004] 许多当前测序平台使用“边合成边测序”(SBS)技术和基于荧光的检测方法。在一些示例中,在称为接种的过程中,将从文库分离的待测序的许多靶多核苷酸或者模板多核苷酸附接到基底的表面。然后,在称为聚类的过程中,可合成模板多核苷酸的多个拷贝,这些拷贝附接到表面上靠近作为拷贝的模板多核苷酸接种的位置。随后,在以下条件下合成聚类多核苷酸的新生拷贝:当每个核苷酸附接到新生链时,聚类多核苷酸的新生拷贝发射识别每个核苷酸的信号。接种的模板多核苷酸的多个拷贝靠近其最初接种的位置进行聚类使得在可视化聚合期间产生的信号扩增,从而改善检测。
[0005] 当模板多核苷酸接种尽可能多的可用基底表面时,SBS的接种和聚类效果很好,这可最大化可在测序运行期间获得的测序信息量。一般来说,用于接种和聚类的基底的可用表面积越小,SBS过程的效率可能越低,从而导致用于获得给定文库的给定量的测序信息的时间、反应物、费用增加以及数据处理变得复杂。
[0006] 模板多核苷酸的文库一般可包括大量的模板多核苷酸分子,这些模板多核苷酸分子的核苷酸序列彼此不同。如果两个这样的模板多核苷酸在基底的表面(例如,未图案化表面)上接种得太近,则聚类可能会产生拷贝多核苷酸的空间混合群体,其中一些具有接种在附近的模板多核苷酸中的一个的序列,而其他具有在表面上也接种在附近的另一个模板多核苷酸的序列。或者,由彼此靠太近接种的两个不同模板多核苷酸形成的两个簇可能彼此太相邻或彼此邻接,使得在SBS过程中使用的成像系统可能无法将它们区分为单独的簇,即使这些簇之间可能没有或极少有基底附接的序列的空间混合。这种不利条件通常被称为多克隆性。对于含有多个受限隔室或位置的图案化表面(诸如含有被间隙区域分开的多个纳米孔的表面),多克隆性一般由不同模板多核苷酸在同一受限位置中的多次接种产生,并且随后的扩增过程在同一受限位置中产生拷贝模板多核苷酸的多个混合群体。当来自文库的具有不同序列的模板多核苷酸彼此足够远地接种或附接到表面(例如,未图案化表面)的各个位置,使得聚类产生各自由单个模板多核苷酸的接种产生的拷贝多核苷酸的空间不同簇(这种情况一般称为单克隆性)时,接种和聚类效果也很好。对于图案化表面,单克隆性是指当用单个模板多核苷酸或单个优势模板多核苷酸接种每个隔室或受限区域(例如,纳米孔)时,使得聚类产生同一模板多核苷酸的相同拷贝的单个簇或者在同一隔室或受限位置中产生单个优势簇的情况。多克隆性可能导致文库捕获效率较低、测序期间噪声信号比较高以及数据质量较低。因此,期望在以下条件下进行SBS:基底表面的尽可能多的可用表面积用于接种和聚类,同时还促进接种的模板多核苷酸的分离,以便尽可能最大化簇的单克隆性并最小化多克隆簇。因此,需要开发新方法来改善聚类过程期间多核苷酸的单克隆性。发明内容
[0007] 本文公开了可用于改善SBS中的单克隆聚类的组合物和方法。
[0008] 本发明的一些方面涉及一种制备用于测序的基底的方法,所述方法包括:
[0009] 使包含模板多核苷酸的第一缓冲溶液与所述基底的表面接触,其中所述基底的所述表面包含用于捕获模板多核苷酸的第一多个结合位点和用于捕获引物寡核苷酸的第二多个结合位点;以及
[0010] 通过在所述模板多核苷酸与所述表面的所述第一多个结合位点之间形成共价结合或非共价结合将所述模板多核苷酸附接到所述基底的所述表面;
[0011] 其中所述第一缓冲溶液包含约100mM或更低的一种或多种盐的总浓度。
[0012] 在一些实施方案中,模板多核苷酸是单链多核苷酸。在其他实施方案中,模板多核苷酸是双链多核苷酸。在一些实施方案中,引物寡核苷酸包括第一类型的引物寡核苷酸和第二类型的引物寡核苷酸。在进一步的实施方案中,引物寡核苷酸包括P5和P7引物、P15和P17引物、PA和PB引物或者PC和PD引物。
[0013] 在一些实施方案中,表面的第一多个结合位点包括或是非共价结合位点。在进一步的实施方案中,非共价结合位点包括抗生物素蛋白(例如,链霉抗生物素蛋白)。在一些此类实施方案中,模板多核苷酸中的每一个模板多核苷酸包含或是允许与链霉抗生物素蛋白非共价结合的生物素部分。
[0014] 在其他实施方案中,表面的第一多个结合位点包括或是共价结合位点。在进一步的实施方案中,共价结合位点包括基结合位点、羧基结合位点、硫醇结合位点、结合位点、叠氮基结合位点、羟基结合位点、反式环辛烯结合位点、降片烯结合位点、环辛炔结合位点、代胺结合位点、SpyTag结合位点、Snap‑tag结合位点、CLIP‑tag结合位点或具有被分选酶识别的N‑末端的蛋白质或者它们的组合。在一些此类实施方案中,模板多核苷酸中的每一个模板多核苷酸包含允许与表面的共价结合位点共价结合的功能部分。模板多核苷酸的功能部分包括或选自NHS酯部分、醛部分、亚氨酸酯部分、五氟苯基酯部分、羟甲基膦部分、化二亚胺部分、来酰亚胺部分、卤代乙酰基部分、吡啶基二硫化物部分、硫代磺酸酯部分、乙烯基砜部分、肼部分、烷氧基胺部分、异氰酸酯部分、炔部分、环炔部分、膦部分、四6 6
嗪部分、叠氮基部分、SpyCatcher部分、O‑苄基嘌呤部分、O‑苄基胞嘧啶部分或能够进行分选酶偶联的片段。在其他实施方案中,表面的第一多个结合位点和多核苷酸的功能部分可颠倒。第一多个结合位点与模板多核苷酸的功能部分之间的共价结合包括但不限于胺‑NHS酯键合、胺‑亚氨酸酯键合、胺‑五氟苯基酯键合、胺‑羟甲基膦键合、羧基‑碳化二亚胺键合、硫醇‑马来酰亚胺键合、硫醇‑卤代乙酰基键合、硫醇‑吡啶基二硫化物键合、硫醇‑硫代磺酸酯键合、硫醇‑乙烯基砜键合、醛‑酰肼键合、醛‑烷氧基胺键合、羟基‑异氰酸酯键合、叠氮化物‑炔键合、叠氮化物‑膦键合、反式环辛烯‑四嗪键合、降冰片烯‑四嗪键合、叠氮化物‑环辛炔键合、叠氮化物‑降冰片烯键合、氧代胺‑醛键合、SpyTag‑SpyCatcher键合、Snap‑
6 2
tag‑O‑苄基鸟嘌呤键合、CLIP‑tag‑O‑苄基胞嘧啶结合位点或分选酶‑偶联键合。
[0015] 在一些实施方案中,第一缓冲溶液中模板多核苷酸的浓度为约10pM至约2000pM、约100pM至约1000pM、约200pM至约500pM、或约250pM至约350pM。在一些实施方案中,第一缓冲溶液具有约7的pH。在一些实施方案中,第一缓冲溶液具有约3.5或更低的pH。在一些实施方案中,第一缓冲溶液还包含一种或多种拥挤剂。在一个实施方案中,拥挤剂包括或是聚乙二醇(PEG)。
[0016] 在一些实施方案中,本文所述的方法还包括:
[0017] 使包含所述引物寡核苷酸的第二缓冲溶液与所述基底的所述表面接触;以及[0018] 通过在所述引物寡核苷酸与所述表面的所述第二多个结合位点之间形成共价结合或非共价结合将所述引物寡核苷酸附接到所述基底的所述表面;
[0019] 其中所述第二缓冲溶液包含约250mM或更高的一种或多种盐的总浓度。在一个实施方案中,第二缓冲溶液中一种或多种盐的总浓度为约750mM。
[0020] 在一些实施方案中,引物寡核苷酸包括第一类型的引物寡核苷酸和第二类型的引物寡核苷酸。在进一步的实施方案中,引物寡核苷酸包含如本文所述的P5、P7、P15、P17、PA、PB、PD或PD引物序列。在一个实施方案中,引物寡核苷酸包含P5引物序列或P7引物序列。
[0021] 在一些实施方案中,表面的第二多个结合位点包括共价结合位点。在进一步的实施方案中,表面的第二多个结合位点包括氨基结合位点、羧基结合位点、硫醇结合位点、醛结合位点、叠氮基结合位点、羟基结合位点、反式环辛烯结合位点、降冰片烯结合位点、环辛炔结合位点、氧代胺结合位点、SpyTag结合位点、Snap‑tag结合位点、CLIP‑tag结合位点或具有被分选酶识别的N‑末端的蛋白质或者它们的组合。在一些实施方案中,多个引物寡核苷酸中的每一个引物寡核苷酸包含可以与表面上的第二多个结合位点形成共价结合的功能部分。引物多核苷酸的功能部分包括或选自NHS酯部分、醛部分、亚氨酸酯部分、五氟苯基酯部分、羟甲基膦部分、碳化二亚胺部分、马来酰亚胺部分、卤代乙酰基部分、吡啶基二硫化物部分、硫代磺酸酯部分、乙烯基砜部分、肼部分、烷氧基胺部分、异氰酸酯部分、炔部分、环6 6
炔部分、膦部分、四嗪部分、叠氮基部分、SpyCatcher部分、O‑苄基鸟嘌呤部分、O ‑苄基胞嘧啶部分或能够进行分选酶偶联的片段。在其他实施方案中,表面的第二多个结合位点和多核苷酸的功能部分可颠倒。第二多个结合位点与模板多核苷酸的功能部分之间的共价结合包括但不限于胺‑NHS酯键合、胺‑亚氨酸酯键合、胺‑五氟苯基酯键合、胺‑羟甲基膦键合、羧基‑碳化二亚胺键合、硫醇‑马来酰亚胺键合、硫醇‑卤代乙酰基键合、硫醇‑吡啶基二硫化物键合、硫醇‑硫代磺酸酯键合、硫醇‑乙烯基砜键合、醛‑酰肼键合、醛‑烷氧基胺键合、羟基‑异氰酸酯键合、叠氮化物‑炔键合、叠氮化物‑膦键合、反式环辛烯‑四嗪键合、降冰片烯‑四嗪键合、叠氮化物‑环辛炔键合、叠氮化物‑降冰片烯键合、氧代胺‑醛键合、SpyTag‑
6 2
SpyCatcher键合、Snap‑tag‑O‑苄基鸟嘌呤键合、CLIP‑tag‑O‑苄基胞嘧啶结合位点或分选酶‑偶联键合。在一个实施方案中,表面的第二多个结合位点包含叠氮基基团,并且引物寡核苷酸的功能部分包含二苯并环辛炔(DBCO)部分,其经历应变促进的无点击反应以形成共价结合。
[0022] 在一些实施方案中,第一多个结合位点和第二多个结合位点是不同的,这允许与模板多核苷酸和引物寡核苷酸进行正交反应。
[0023] 在一些实施方案中,所述方法还包括扩增模板多核苷酸。
[0024] 在一些实施方案中,基底的表面包括多个图案化纳米孔。在一些此类实施方案中,至少约50%、60%、70%、80%、90%、95%、98%或99%的纳米孔各自被至少一个模板多核苷酸簇占据。在一些进一步的实施方案中,至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的纳米孔各自被仅一个模板多核苷酸簇或仅一个优势模板多核苷酸簇占据。
[0025] 本公开的附加方面涉及一种用于测序的基底,所述基底包括:
[0026] 模板多核苷酸,所述模板多核苷酸通过第一多个结合位点经由共价或非共价结合附接到所述基底的表面;以及
[0027] 用于捕获引物寡核苷酸的第二多个结合位点;
[0028] 其中所述基底的所述表面包括多个图案化纳米孔,并且其中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的所述纳米孔各自被单个模板多核苷酸占据。
附图说明
[0029] 图1示出了在基底的图案化表面上进行的标准的基于杂交的接种方法的横截面图。
[0030] 图2示出了根据本公开的一个实施方案的在基底的图案化表面上进行的新的基于杂交的低盐接种方法的横截面图。
[0031] 图3示出了(A)PCR文库制备和(B)无PCR的文库制备的示例性工作流程。
[0032] 图4示出了根据本公开的实施方案的修改文库,该修改文库使得能够使用(A)文库DNA链的非共价捕获或(B)文库DNA链的共价捕获进行新的基于杂交的低盐接种方法。

具体实施方式

[0033] 本公开涉及用于在边合成边测序(SBS)期间增加单克隆聚类的组合物和方法。所述方法通过首先在低盐缓冲液中将文库DNA捕获在固体载体上然后接枝引物寡核苷酸(例如,P5/P7引物)来逆转标准接种过程。低盐接种条件允许已经占据给定区域(即,纳米孔)的DNA对任何另外的DNA链产生静电排斥。因此,任何二次接种事件都是不受欢迎的。本文所述的过程改善了文库链占据的纳米孔的百分比的单克隆性。另外,所述方法还提高了纳米孔对固体载体的占用率、信号强度和测序数据质量以及文库捕获的效率。
[0034] 本文所用的章节标题仅用于组织目的,而不应理解为限制所述主题。
[0035] 定义
[0036] 除非另有定义,否则本文所用的所有技术和科学术语的含义与本领域的普通技术人员通常理解的含义相同。术语“包含(including)”以及如“包含(include)”、“包含(includes)”、和“包含(included)”等其他形式的使用不具限制性。术语“具有(having)”以及如“具有(have)”、“具有(has)”、和“具有(had)”等其他形式的使用不具限制性。如本说明书中所用,无论是在过渡短语中还是在权利要求的正文中,术语“包含(comprise(s))”和“包含(comprising)”都将被解释为具有开放式含义。即,上述术语应与短语“至少具有”或“至少包括”同义地解释。例如,当在过程的上下文中使用时,术语“包含”表示该过程至少包括所列举的步骤,但是也可包括额外步骤。当在化合物、组合物或设备的上下文中使用时,术语“包含”是指该化合物、组合物或设备至少包含所列举的特征或组分,但是也可包含额外特征或组分。
[0037] 如本文所用,常见的有机缩写如下定义:
[0038] dATP  三磷酸脱氧腺苷
[0039] dCTP  三磷酸脱氧胞苷
[0040] dGTP  三磷酸脱氧鸟苷
[0041] dTTP  三磷酸脱氧胸苷
[0042] PAZAM 任何丙烯酰胺与Azapa比率的聚(N‑(5‑叠氮基乙酰胺基戊基)丙烯酰胺‑共‑丙烯酰胺)
[0043] SBS   边合成边测序
[0044] 如本文所用,术语“附接”是指两个物体彼此接合、紧固、粘附、连接或结合的状态。例如,分析物(诸如核酸)可以通过共价键或非共价键附接到材料(诸如凝胶或固体载体)。
共价键的特征在于原子之间共享电子对。非共价键是不涉及共享电子对的化学键,并且可以包括例如氢键、离子键、范德华、亲相互作用和疏水相互作用。
[0045] 如本文所用,术语“阵列”是指附接到一个或多个基底的不同探针(例如,探针分子)的群体,使得可以根据相对位置来彼此区分不同的探针。阵列可以包括各自位于基底上的不同可寻址位置处的不同探针。另选地或另外,阵列可以包括各自带有不同探针的单独基底,其中可以根据基底在基底所附接到的表面上的位置或根据基底在液体中的位置来识别不同的探针。其中单独基底位于表面上的示例性阵列包括但不限于在孔中包括珠粒的那些,如例如美国专利号6,355,431 Bl、US 2002/0102578和PCX公布号WO 00/63437中所述。可以用于本发明以例如使用微流体设备(诸如荧光活化细胞分选器(FACS))来区分液体阵列中的珠粒的示例性形式例如描述于美国专利号6,524,793。可以用于本发明的阵列的另外的示例包括但不限于美国专利号5,429,807、5,436,327、5,561,071、5,583,211、5,658,
734、5,837,858、5,874,219、5,919,523、6,136,269、6,287,768、6,287,776、6,288,220、6,
297,006、6,291,193、6,346,413、6,416,949、6,482,591、6,514,751和6,610,482以及WO 
93/17126、WO 95/11995、WO 95/35505、EP 742 287和EP 799 897中所述的那些。
[0046] 如本文所用,术语“共价附接”或“共价结合”是指形成特征在于原子之间共用电子对的化学键合。例如,共价附接的水凝胶是指与经由其他方式(例如,粘附或静电相互作用)附接到基底的官能化表面相比,与该表面形成化学键的水凝胶。应当理解,共价附接到表面的聚合物也可以经由除共价附接之外的方式键合。
[0047] 如本文所用,术语“可逆共价键”是指例如在施加热、光或其他(生物)化学方法(例如,通过暴露于降解剂,诸如酶或催化剂)下可以裂解的共价键,而“不可逆共价键”在此类条件下对于降解是稳定的。可逆共价键的非限制性示例包括可热裂解或可光解裂解的环加合物(例如,呋喃‑马来酰亚胺环加合物)、亚烯基键、酯、酰胺、缩醛、半缩醛胺醚、缩醛胺、亚胺、腙、多硫化物键(例如,二硫化物键)、基于的键(例如,硼醇酸和硼酸/酯)、基于的键(例如,甲硅烷基醚、硅氧烷)和基于磷的键(例如,亚磷酸酯、磷酸酯)。
[0048] 如本文所用,术语“非共价相互作用”与共价键的不同之处在于,它不涉及共用电子,而是涉及分子之间或分子内电磁相互作用更分散的变化。非共价相互作用一般可以分为四类:静电效应、π效应、范德华力和疏水效应。静电相互作用的非限制性示例包括离子相互作用、氢键合(特定类型的偶极‑偶极相互作用)、卤素键合等,范德华力是涉及永久或诱导偶极或多极的静电相互作用的子集,π效应可以分拆成许多类,包括(但不限于)π‑π相互作用、阳离子‑π和阴离子‑π相互作用和极性‑π相互作用。一般来讲,π‑效应跟分子与分子系统(诸如苯)的π‑轨道的相互作用相关。疏水效应是非极性物质在水性溶液中聚集并排斥水分子的倾向。非共价相互作用可以是分子间的和分子内的。非共价相互作用可以是分子间的和分子内的。
[0049] 如本文所用,术语“主客体相互作用”是指两个或更多个基团能够通过分子识别经由一种或多种类型的非共价相互作用(诸如离子键合、氢键合、疏水相互作用、范德华相互作用和π‑π相互作用)形成结合的复合物。例如,主客体相互作用可包括以下项之间形成的相互作用:葫芦脲与金刚烷类(例如,1‑金刚烷胺)、铵离子(例如,氨基酸)、二茂;环糊精与金刚烷(例如,1‑金刚烷胺)、铵离子(例如,氨基酸)、二茂铁,杯芳与金刚烷(例如,1‑金刚烷胺)、铵离子(例如,氨基酸)、二茂铁;冠醚(例如,18‑冠‑6、15‑冠‑5、12‑冠‑4)或穴状配体(例如,[2.2.2]穴状配体)与阳离子(例如,金属阳离子、铵离子);抗生物素蛋白(例如,链霉抗生物素蛋白)和生物素;以及抗体和半抗原
[0050] 如本文所用,术语“离子键”是指两个或更多个离子之间涉及阳离子和阴离子之间的静电吸引的化学键。例如,阳离子可选自如本文所述的“金属阳离子”或“非金属阳离子”。非金属阳离子可包括铵盐(例如,烷基铵盐)或鏻盐(例如,烷基鏻盐)。阴离子可选自磷酸根、硫代磷酸根、膦酸根、硫代膦酸根、亚膦酸根、硫代亚膦酸根、硫酸根、磺酸根、亚硫酸根、亚磺酸根、碳酸根、羧酸根、醇盐、苯酚根和硫代苯酚根。
[0051] 如本文所用,术语“氢键”是指富电子原子(例如,氮、氧或氟)上的孤电子对与附接到负电性原子(例如,氮或氧)的氢原子之间的键合相互作用。
[0052] 如本文所用,术语“主客体相互作用”是指两个或更多个基团能够通过分子识别经由一种或多种类型的非共价相互作用(诸如离子键合、氢键合、疏水相互作用、范德华相互作用和π‑π相互作用)形成结合的复合物。例如,主客体相互作用可包括以下项之间形成的相互作用:葫芦脲与金刚烷类(例如,1‑金刚烷胺)、铵离子(例如,氨基酸)、二茂铁;环糊精与金刚烷(例如,1‑金刚烷胺)、铵离子(例如,氨基酸)、二茂铁,杯芳烃与金刚烷(例如,1‑金刚烷胺)、铵离子(例如,氨基酸)、二茂铁;冠醚(例如,18‑冠‑6、15‑冠‑5、12‑冠‑4)或穴状配体(例如,[2.2.2]穴状配体)与阳离子(例如,金属阳离子、铵离子);抗生物素蛋白(例如,链霉抗生物素蛋白)和生物素;以及抗体和半抗原。
[0053] 如本文所用,术语“通过过滤器百分比”或“%PF”是在测序期间成功“读取”纳米孔的能力的量度。随着接枝密度增加,%PF最初增加,随后迅速下降,因为孔内的多克隆性增加,从而导致清晰可读的目标信号减少。换句话说,随着引物密度增加,两个或更多个模板杂交到孔的表面上的可能性增加。多于一个模板的存在增加了两个模板都被扩增从而导致多克隆性的可能性,并且增加了信号强度降低或不可读的可能性。因此,被占据的孔的%PF可以用于测量克隆程度。虽然上面提到了纳米孔,但是相同的概念适用于任何固体载体或基底。
[0054] 如本文所用,术语“涂覆”当用作动词时旨在意指在表面上提供层或覆盖物。表面的至少一部分可以设置有层或覆盖物。在一些情况下,整个表面可以设置有层或覆盖物。在另选情况下,表面的仅一部分将设置有层或覆盖物。术语“涂层”当用于描述表面与材料之间的关系时旨在意指材料作为表面上的层或覆盖物存在。材料可以密封表面,例如防止液体或气体与表面接触。然而,材料不必形成密封。例如,材料对于液体、气体或者液体或气体中携带的一种或多种组分可以是多孔的。可以涂覆表面的示例性材料包括但不限于凝胶、聚合物、有机聚合物、液体、金属、第二表面、塑料、二氧化硅或气体。
[0055] 如本文所用,术语“分析物”旨在包括待检测、表征、修饰、合成等的多种分析物中的任一种。示例性分析物包括但不限于核酸(例如,DNA、RNA或它们的类似物)、蛋白质、多糖、细胞、细胞核、细胞器、抗体、表位、受体、配体、酶(例如,激酶、磷酸酶或聚合酶)、肽、小分子候选药物等。阵列可以包括来自分析物文库的多个不同种类。例如,这些种类可以是来自抗体文库的不同抗体、来自核酸文库的具有不同序列的核酸、来自蛋白质文库的具有不同结构和/或功能的蛋白质、来自小分子组合文库的药物候选物等。
[0056] 如本文所用,术语“轮廓”旨在表示意指表面形状的局部变化。示例性轮廓包括但不限于孔、坑、沟、杆、柱和脊。轮廓可以作为表面中的各种凹陷或表面的突出中的任一种出现。轮廓的全部或部分可以充当阵列中的特征。例如,在固体载体的特定平面中出现的轮廓的一部分可以充当该特定平面中的特征。在一些实施方案中,轮廓以规则或重复图案设置在表面上。
[0057] 当材料在轮廓“内”时,其位于轮廓的空间中。例如,对于孔,材料在孔内部,而对于柱或杆,材料覆盖在表面的平面上方延伸的轮廓。
[0058] 如本文所用,术语“不同”当关于核酸使用时意指核酸具有彼此不相同的核苷酸序列。两个或更多个核酸可以具有沿其整个长度不同的核苷酸序列。另选地,两个或更多个核酸可以具有沿其长度的相当大部分不同的核苷酸序列。例如,两个或更多个核酸可以具有对于两个或更多个分子不同的靶核苷酸序列部分,同时还具有在两个或更多个分子上相同的通用序列部分。该术语可以类似地应用于可基于氨基酸序列差异而区别为彼此不同的蛋白质。
[0059] 如本文所用,术语“一个模板多核苷酸簇”是指由于在基底的特定受限位置或隔室处(例如,同一纳米孔内)捕获的单个模板多核苷酸的扩增而固定在基底的特定受限位置或隔室上(例如,同一纳米孔内)的多个相同模板多核苷酸。术语“一个优势模板多核苷酸簇”在如本文所述的多克隆性的上下文中使用,当聚类产生由接种在同一受限位置或隔室中(例如,同一纳米孔内)的两个或更多个不同模板多核苷酸形成的两个或更多个簇时。当在SBS过程中使用的成像系统能够将它们区分为单独的簇时,负责测序中的基调用的簇被称为“优势簇”。
[0060] 如本文所用,当参考项目的集合使用时,术语“每个”旨在识别集合中的单个项目,但不一定是指集合中的每个项目。如果明确公开或上下文另有明确规定,则可能会出现例外情况。
[0061] 如本文所用,术语“特征”意指阵列中被配置为附接特定分析物的位置。例如,特征可以是表面上的轮廓的全部或部分。特征可以仅含有单一分析物,或其可以含有若干分析物的群体,任选地若干分析物可以是相同种类。在一些实施方案中,特征在附接分析物之前存在于固体载体上。在其他实施方案中,特征通过将分析物附接到固体载体而产生。
[0062] 如本文所用,术语“流通池”旨在意指具有其中可以进行反应的室、用于将试剂递送到室的入口以及用于从室中移除试剂的出口的容器。在一些实施方案中,室被配置用于检测在室中(例如,在与室流体接触的表面上)发生的反应。例如,室可以包括允许对室中的阵列、光学标记分子等进行光学检测的一个或多个透明表面。示例性流通池包括但不限于在核酸测序装置中使用的那些,诸如用于以下平台的流通池:Illumina,Inc.(San Diego,CA)商业化的Genome 或 平台;或者Life TechnologiesTM TM
(Carlsbad,CA)商业化的SOLiD 或Ion Torrent 测序平台。示例性流通池及其制造和使用方法还描述于例如WO 2014/142841 A1、美国专利申请公布号2010/0111768 A1和美国专利号8,951,781,这些专利中的每一项以引用方式并入本文。
[0063] 如本文所用,术语“凝胶材料”旨在意指可渗透液体和气体的半刚性材料。通常,凝胶材料在吸收液体时可以溶胀并且在去除液体(例如,通过干燥)时可以收缩。示例性凝胶包括但不限于具有以下项的那些:胶体结构,诸如琼脂糖;聚合物网状结构,诸如明胶;或交联的聚合物结构,诸如聚丙烯酰胺、无硅烷丙烯酰胺(参见例如美国专利申请公布号2011/0059865 A1)、PAZAM(参见例如美国专利号9,012,022,其以引用方式并入本文)以及美国专利公布号2015/0005447和2016/0122816(它们全部全文以引用方式并入)中描述的聚合物。
特别有用的凝胶材料将符合其所在的孔或其他轮廓的形状。一些有用的凝胶材料既可以(a)符合其所在的孔或其他轮廓的形状,又可以(b)具有基本上不超过其所在的孔或轮廓的体积的体积。在一些特定实施方案中,凝胶材料是聚合物水凝胶。
[0064] 如本文所用,术语“间隙区域”是指基底中或表面上的将基底或表面的其他区域分开的区域。例如,间隙区域可以将表面上的一个轮廓或特征与另一轮廓或特征分开。彼此分开的两个区域可以是离散的,彼此缺乏接触。在许多实施方案中,间隙区域是连续的,而轮廓或特征是离散的,例如,如原本连续的表面中的孔阵列的情况。由间隙区域提供的分离可以是部分分离或完全分离。间隙区域通常将具有与表面上的轮廓或特征的表面材料不同的表面材料。例如,阵列的轮廓可以具有超过间隙区域处存在的量或浓度的凝胶材料或分析物的量或浓度。在一些实施方案中,凝胶材料或分析物可不存在于间隙区域处。
[0065] 如本文所用,术语“核酸”和“核苷酸”旨在与其在本领域中的使用一致并且包括天然存在的物质或其功能类似物。核酸的特别有用的功能类似物能够以序列特异性方式与核酸杂交或能够用作复制特定核苷酸序列的模板。天然存在的核酸一般具有含有磷酸二酯键的主链。类似结构可以具有另选主链键,包括本领域已知的多种主链键中的任一种。天然存在的核酸一般具有脱氧核糖(例如,在脱氧核糖核酸(DNA)中发现)或核糖(例如,在核糖核酸(RNA)中发现)。核酸可以含有具有本领域已知的这些糖部分的多种类似物中的任一种的核苷酸。核酸可以包括天然或非天然核苷酸。就这一点而言,天然脱氧核糖核酸可以具有选自由腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤组成的组的一种或多种碱基,并且核糖核酸可以具有选自由尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤组成的组的一种或多种碱基。可以包括在核酸或核苷酸中的有用的非天然碱基是本领域已知的。术语“探针”和“靶标”当关于核酸使用时旨在作为本文阐述的方法或组合物的上下文中核酸的语义标识符并且不一定限制核酸的结构或功能,除非另有明确说明。术语“探针”和“靶标”可以类似地应用于其他分析物,诸如蛋白质、小分子、细胞等。
[0066] 如本文所用,术语“表面”旨在意指固体载体或凝胶材料的外部部分或外部层。表面可以与另一种材料(诸如气体、液体、凝胶、聚合物、有机聚合物、类似或不同材料的第二表面、金属或涂层)接触。该表面或其区域可以是基本上平坦的或平面的。表面可以具有表面轮廓,诸如孔、坑、沟、脊、凸起区域、钉、杆等。
[0067] 如本文所用,术语“凹入部”是指图案化支撑件中的离散凹面特征部,该离散凹面特征部具有完全被图案化支撑件表面的间隙区域包围的表面开口。凹入部可在其表面中的开口处具有多种形状中的任一种,包括例如圆形、椭圆形、正方形、多边形、星形(具有任何数量的顶点)等。与该表面正交截取的凹入部的横截面可为弯曲的、正方形、多边形、双曲线形、圆锥形、形等。
[0068] 如本文所用,术语“基底”或“固体载体”可互换使用,并且两者均指不溶于水性液体的刚性基底。基底可以是无孔的或多孔的。基底可以任选地能够吸收液体(例如,由于孔隙率),但是通常将足够刚性,使得基底在吸收液体时不会显著溶胀,并且在通过干燥去除液体时不会显著收缩。无孔固体载体一般不可渗透液体或气体。示例性固体载体包括但不限于玻璃以及改性或官能化玻璃、塑料(例如,丙烯酸、聚苯乙烯以及苯乙烯和其他材料的TM共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、Teflon 、环烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化硅或基于二氧化硅的材料(包括硅和改性硅)、碳、金属、无机玻璃、光纤束和聚合物。特别有用的材料是玻璃。其他合适的基底材料可包括聚合物材料、塑料、硅、石英(熔融石英)、硼浮法玻璃、二氧化硅、基于二氧化硅的材料、碳、金属(包括金)、光纤或光纤束、蓝宝石或塑料材料(诸如COC和环氧化物)。可基于特定用途所期望的特性来选择特定材料。例如,对期望波长辐射是透明的材料可用于将利用期望波长的辐射的分析技术,诸如本文所阐述的技术中的一种或多种。相反,可能期望选择不通过特定波长的辐射的材料(例如,不透明的、吸收性的或反射性的)。这可用于形成待在结构化基底的制造期间使用的掩模;或用于使用结构化基底进行的化学反应或分析检测。可利用的材料的其他特性是对下游过程中使用的某些试剂的惰性或反应性;或在制造加工期间易于操作或低成本。可以用于本公开的结构化基底或方法中的材料的另外的示例描述于美国专利申请公布号2012/
0316086 A1和2013/0116153,这些专利中的每一项以引用方式并入本文。
[0069] 如本文所用,术语“孔”是指固体载体中具有完全被表面的间隙区域包围的表面开口的离散轮廓。孔可以在其表面中的开口处具有多种形状中的任一种,包括但不限于圆形、椭圆形、正方形、多边形、星形(具有任何数量的顶点)等。与表面正交截取的孔的横截面可以是弯曲的、正方形、多边形、双曲线形、圆锥形、角形等。在一些实施方案中,孔是微孔或纳米孔。
[0070] P5和P7引物用于Illumina Inc.销售的商业流通池的表面上进行测序。合适引物的具体示例包括P5和/或P7引物,这些引物用于Illumina Inc.销售的商业流通池的表面TM TM TM TM TM TM TM上,以在HISEQ 、HISEQX 、MISEQ 、MISEQDX 、MINISEQ 、NEXTSEQ 、NEXTSEQDX 、TM TM TM
NOVASEQ 、GENOME ANALYZER 、ISEQ 和其他仪器平台上进行测序。这些引物序列描述于美国专利公布号2011/0059865A1,该专利以引用方式并入本文。P5和P7引物序列包括以下项:
[0071] 双端组:
[0072] P5:双端5'→3'
[0073] AATGATACGGCGACCACCGAGAUCTACAC(SEQ ID NO.1)
[0074] P7:双端5'→3'
[0075] CAAGCAGAAGACGGCATACGAGAT(SEQ ID NO.2)
[0076] 单端组:
[0077] P5:单端:5'→3'
[0078] AATGATACGGCGACCACCGA(SEQ ID NO.3)
[0079] P7:单端5'→3'
[0080] CAAGCAGAAGACGGCATACGA(SEQ ID NO.4)
[0081] 在一些实施方案中,P5和P7引物可在5'端处包含接头或间隔子。可包括这种接头或间隔子,以便允许裂解,或赋予一些其他期望的特性,例如以能够共价附接到聚合物或固体载体,或充当间隔子以将裂解位点定位在距固体载体最佳距离处。在某些情况下,可将0‑50个间隔子或10‑50个间隔子核苷酸定位在P5或P7引物与聚合物或固体载体的附接点之间。在一些实施方案中,使用polyT间隔子,但也可以使用其他核苷酸以及它们的组合。TET是染料标记的寡核苷酸,其具有与P5/P7引物互补的序列。TET可以与表面上的P5/P7引物杂交;可以洗掉过量的TET,并且可以使用扫描仪器诸如Typhoon扫描仪(General Electric)通过荧光检测来测量附接的染料浓度。除P5/P7引物之外,测序引物序列的其他非限制性示例(诸如P15/P17引物)也已公开于美国公布号2019/0352327。另外,引物PA、PB、PC和PD已公开于美国序列号63/128,663。这些另外的测序引物包括以下:
[0082] P15:5'→3'
[0083] AATGATACGGCGACCACCGAGAT*CTACAC(SEQ.ID.NO.5),其中T*是指烯丙基修饰的T[0084] P17引物5'→3'
[0085] YYYCAAGCAGAAGACGGCATACGAGAT(SEQ ID NO.6),其中Y是经受化学裂解(例如,通过用试剂诸如高碘酸盐氧化)的二醇接头,如美国公布号2012/0309634中所公开,该公布全文以引用方式并入。
[0086] PA:5'→3'
[0087] GCTGGCACGTCCGAACGCTTCGTTAATCCGTTGAG(SEQ ID NO.7)
[0088] PB:5'→3'
[0089] CGTCGTCTGCCATGGCGCTTCGGTGGATATGAACT(SEQ ID NO.8)
[0090] PC:5'→3'
[0091] ACGGCCGCTAATATCAACGCGTCGAATCCGCAACT(SEQ ID NO.9)
[0092] PD:5'→3'
[0093] GCCGCGTTACGTTAGCCGGACTATTCGATGCAGC(SEQ ID NO.10)
[0094] 如本文所用,术语“正交”在将文库模板多核苷酸和表面引物寡核苷酸捕获到表面的上下文中意指用于将模板文库固定到表面的捕获机制不同于用于产生簇的表面引物。
[0095] 接种文库DNA的方法
[0096] 目前在Illumina的SBS平台上使用的文库接种方法依赖于杂交事件来将文库DNA捕获到流通池表面上。图1以固体载体100上的一个纳米孔101的横截面图示出了标准的基于杂交的接种过程,其中固体载体含有被间隙区域分开的多个纳米孔。在该过程中,首先用水凝胶官能化纳米孔101,该水凝胶允许与多个引物寡核苷酸102共价结合以将引物寡核苷酸固定到固体载体的表面。然后,首先将文库DNA(即,文库链)与具有与结合在表面上的引物寡核苷酸互补的序列的衔接子连接。然后,使文库DNA在含有高浓度盐的缓冲溶液中流过表面。经由与表面结合的引物寡核苷酸102杂交将文库链103捕获在表面上。在理想的过程中,仅将一条文库链捕获在一个单个纳米孔内。扩增后,单克隆聚类产生簇104。需要高盐缓冲溶液(即,盐浓度高于100mM)以便从表面上的带负电荷的引物寡核苷酸中筛选文库DNA的带负电荷的主链。高盐缓冲液的相同筛选效果使得多于一条文库链即文库链103和103a能够共同定位在单个纳米孔内的流通池表面上,从而在扩增后在同一纳米孔中产生不期望的簇104和104a(多克隆性)。如本文所述的盐浓度是指负责筛选带负电荷的DNA主链的阳离子的浓度。
[0097] 本公开的一些实施方案涉及一种通过逆转文库接种和表面引物接枝步骤将文库DNA接种在固体载体的表面上的新方法。
[0098] 本发明的一些方面涉及一种制备用于测序的基底的方法,所述方法包括:
[0099] 使包含模板多核苷酸的第一缓冲溶液与所述基底的表面接触,其中所述基底的所述表面包含用于捕获模板多核苷酸的第一多个结合位点和用于捕获引物寡核苷酸的第二多个结合位点;以及
[0100] 通过在所述模板多核苷酸与所述表面的所述第一多个结合位点之间形成共价结合或非共价结合将所述模板多核苷酸附接到所述基底的所述表面;
[0101] 其中所述第一缓冲溶液包含约100mM或更低的一种或多种盐的总浓度。
[0102] 如本文所述的模板多核苷酸可具有任何合适的长度,包括用于SBS过程中的测序。例如,模板多核苷酸的长度可以是约50至2000个核苷酸、约75至1000个核苷酸、约100至500个核苷酸、约125至450个核苷酸、约150至400个核苷酸、约175至350个核苷酸或约200至300个核苷酸。
[0103] 在一些实施方案中,模板多核苷酸是单链多核苷酸。在其他实施方案中,模板多核苷酸是双链多核苷酸。在一些实施方案中,引物寡核苷酸包括第一类型的引物寡核苷酸和第二类型的引物寡核苷酸。在进一步的实施方案中,引物寡核苷酸包括P5和P7引物、P15和P17引物、PA和PB引物或者PC和PD引物。在一个实施方案中,引物寡核苷酸包括本文所述的P5和P7引物。引物寡核苷酸也被称为表面引物或聚类引物,因为它们被接枝在固体载体的表面上以便进行接种模板多核苷酸的扩增并形成簇。
[0104] 在本文所述的接种方法的一些实施方案中,第一缓冲溶液包含约90mM、85mM、80mM、75mM、70mM、65mM、60mM、55mM、50mM、45mM、40mM、35mM、30mM、25mM、20mM、15mM、10mM或
5mM的盐或更少。第一缓冲溶液可包含一种或多种缓冲剂和一种或多种非缓冲盐。缓冲剂的非限制性示例包括Tris、甘氨酸、抗坏血酸钠、磷酸钠、HEPES、MOPS、PIPES、TAPS等。非缓冲盐的非限制性示例包括KCl、NaCl、LiCl、MgCl2、MnCl2等。在一些实施方案中,盐浓度的总量是指第一缓冲溶液中缓冲剂和非缓冲盐阳离子两者的总浓度。在其他实施方案中,盐浓度的总量是指第一缓冲溶液中非缓冲盐阳离子的总浓度。在其他实施方案中,盐浓度的总量是指第一缓冲溶液中无机盐阳离子的总浓度。在进一步的实施方案中,第一缓冲溶液还可包含一种或多种表面活性剂,诸如Tween‑20或十二烷基硫酸钠(SDS)。在一些实施方案中,第一缓冲溶液还包含一种或多种拥挤剂。在一个实施方案中,拥挤剂包括或是聚乙二醇(PEG)。
[0105] 在一些实施方案中,第一缓冲溶液的pH可在约3至约11的范围内。在一些实施方案中,第一缓冲溶液具有约7的pH。在一些实施方案中,第一缓冲溶液具有约3.5或更低的pH。在一些情况下,已经观察到许多表面(例如,玻璃表面或树脂表面)上固有的负表面电荷往往会排斥DNA。这种效应可通过在较低pH下接种来减轻,其中表面电荷通过质子化而减少(磷酸盐在大于约3.5的pH下保持未质子化)。另外,可实施表面改性以减少基底表面的负电荷,以便改进本文所述的低盐接种方法。
[0106] 在本文所述的接种方法的一些实施方案中,表面的第一多个结合位点包括或是非共价结合位点。在进一步的实施方案中,非共价结合位点包括抗生物素蛋白(例如,链霉抗生物素蛋白)。在一些此类实施方案中,模板多核苷酸中的每一个模板多核苷酸包含或是允许与链霉抗生物素蛋白非共价结合的生物素部分。在其他实施方案中,表面的第一多个结合位点包括或是共价结合位点。在进一步的实施方案中,共价结合位点包括氨基结合位点、羧基结合位点、硫醇结合位点、醛结合位点、叠氮基结合位点、羟基结合位点、环烯结合位点(诸如反式环辛烯结合位点或降冰片烯结合位点)、环炔结合位点(诸如环辛炔结合位点、二苯并环辛炔(DBCO)结合位点或双环壬炔结合位点)、氧代胺结合位点、SpyTag结合位点、Snap‑tag结合位点、CLIP‑tag结合位点或具有被分选酶识别的N‑末端的蛋白质或者它们的组合。在一些此类实施方案中,模板多核苷酸中的每一个模板多核苷酸包含允许与表面的共价结合位点共价结合的功能部分。模板多核苷酸的功能部分包括或选自NHS酯部分、醛部分、亚氨酸酯部分、五氟苯基酯部分、羟甲基膦部分、碳化二亚胺部分、马来酰亚胺部分、卤代乙酰基部分、吡啶基二硫化物部分、硫代磺酸酯部分、乙烯基砜部分、肼部分、烷氧基胺部6
分、异氰酸酯部分、炔部分、环炔部分、膦部分、四嗪部分、叠氮基部分、SpyCatcher部分、O ‑
6
苄基鸟嘌呤部分、O‑苄基胞嘧啶部分或能够进行分选酶偶联的片段。在其他实施方案中,表面的第一多个结合位点和多核苷酸的功能部分可颠倒。第一多个结合位点与模板多核苷酸的功能部分之间的共价结合包括但不限于胺‑NHS酯键合、胺‑亚氨酸酯键合、胺‑五氟苯基酯键合、胺‑羟甲基膦键合、羧基‑碳化二亚胺键合、硫醇‑马来酰亚胺键合、硫醇‑卤代乙酰基键合、硫醇‑吡啶基二硫化物键合、硫醇‑硫代磺酸酯键合、硫醇‑乙烯基砜键合、醛‑酰肼键合、醛‑烷氧基胺键合、羟基‑异氰酸酯键合、叠氮化物‑炔键合、叠氮化物‑膦键合、反式环辛烯‑四嗪键合、降冰片烯‑四嗪键合、叠氮化物‑环辛炔键合、叠氮化物‑降冰片烯键合、
6 2
氧代胺‑醛键合、SpyTag‑SpyCatcher键合、Snap‑tag‑O‑苄基鸟嘌呤键合、CLIP‑tag‑O‑苄基胞嘧啶结合位点或分选酶‑偶联键合。如本文所述,表面结合位点处的部分或模板多核苷酸的功能部分中的每一者可以是未取代的或取代的。
[0107] 互补结合配偶体的非排他性列表在表1中呈现:
[0108]
[0109]
[0110]
[0111]
[0112] 在一些实施方案中,第一缓冲溶液中模板多核苷酸的浓度为约10pM至约2000pM、约100pM至约1000pM、约200pM至约500pM、或约250pM至约350pM。在一个实施方案中,所述第一缓冲溶液中所述模板多核苷酸的浓度为约250pM。
[0113] 表面引物接枝
[0114] 在一些实施方案中,本文所述的方法还包括:
[0115] 使包含所述引物寡核苷酸的第二缓冲溶液与所述基底的所述表面接触;以及[0116] 通过在所述引物寡核苷酸与所述表面的所述第二多个结合位点之间形成共价结合或非共价结合将所述引物寡核苷酸附接到所述基底的所述表面;
[0117] 其中所述第二缓冲溶液包含约250mM、300mM、350mM、400mM、450mM、500mM、550mM、600mM、650mM、700mM、750mM、800mM、850mM、900mM、950mM或1000mM或更高的一种或多种盐的总浓度。在一个实施方案中,第二缓冲溶液中一种或多种盐的总浓度为约750mM。
[0118] 在一些实施方案中,引物寡核苷酸包括第一类型的引物寡核苷酸和第二类型的引物寡核苷酸。在进一步的实施方案中,引物寡核苷酸包含如本文所述的P5、P7、P15、P17、PA、PB、PD或PD引物序列。在一个实施方案中,引物寡核苷酸包含P5引物序列或P7引物序列。
[0119] 在一些实施方案中,表面的第二多个结合位点包括共价结合位点。在进一步的实施方案中,表面的第二多个结合位点包括氨基结合位点、羧基结合位点、硫醇结合位点、醛结合位点、叠氮基结合位点、羟基结合位点、反式环辛烯结合位点、降冰片烯结合位点、环辛炔结合位点、氧代胺结合位点、SpyTag结合位点、Snap‑tag结合位点、CLIP‑tag结合位点或具有被分选酶识别的N‑末端的蛋白质或者它们的组合。在一些实施方案中,多个引物寡核苷酸中的每一个引物寡核苷酸包含可以与表面上的第二多个结合位点形成共价结合的功能部分。引物多核苷酸的功能部分包括或选自NHS酯部分、醛部分、亚氨酸酯部分、五氟苯基酯部分、羟甲基膦部分、碳化二亚胺部分、马来酰亚胺部分、卤代乙酰基部分、吡啶基二硫化物部分、硫代磺酸酯部分、乙烯基砜部分、肼部分、烷氧基胺部分、异氰酸酯部分、炔部分、环6 6
炔部分、膦部分、四嗪部分、叠氮基部分、SpyCatcher部分、O‑苄基鸟嘌呤部分、O ‑苄基胞嘧啶部分或能够进行分选酶偶联的片段。在其他实施方案中,表面的第二多个结合位点和多核苷酸的功能部分可颠倒。第二多个结合位点与模板多核苷酸的功能部分之间的共价结合包括但不限于胺‑NHS酯键合、胺‑亚氨酸酯键合、胺‑五氟苯基酯键合、胺‑羟甲基膦键合、羧基‑碳化二亚胺键合、硫醇‑马来酰亚胺键合、硫醇‑卤代乙酰基键合、硫醇‑吡啶基二硫化物键合、硫醇‑硫代磺酸酯键合、硫醇‑乙烯基砜键合、醛‑酰肼键合、醛‑烷氧基胺键合、羟基‑异氰酸酯键合、叠氮化物‑炔键合、叠氮化物‑膦键合、反式环辛烯‑四嗪键合、降冰片烯‑四嗪键合、叠氮化物‑环辛炔键合、叠氮化物‑降冰片烯键合、氧代胺‑醛键合、SpyTag‑
6 2
SpyCatcher键合、Snap‑tag‑O‑苄基鸟嘌呤键合、CLIP‑tag‑O‑苄基胞嘧啶结合位点或分选酶‑偶联键合。在一个实施方案中,表面的第二多个结合位点包含叠氮基基团,并且引物寡核苷酸的功能部分包含二苯并环辛炔(DBCO)部分,其经历应变促进的无铜点击反应以形成共价结合。互补配偶体(第二多个结合位点与表面引物寡核苷酸的功能部分之间)的另外的示例性实施方案在上表1中呈现。
[0120] 在一些实施方案中,第一或第二多个结合位点可通过聚合物(包括共聚物,可以是无规、嵌段、直链和/或支链共聚物)或水凝胶附接到基底的表面,所述聚合物或水凝胶中的每一者以任何次序或构型包含两个或更多个重复单体单元,并且可以是直链的、交联的或支链的或它们的组合。在一个示例中,聚合物可以是杂聚物,并且杂聚物可包括丙烯酰胺单体,诸如 或其取代的类似物(“取代的”是指指定基团中的一个或多个氢原子被另一个原子或基团替换)。在一个示例中,聚合物是杂聚物并且还可包括含叠氮基的丙烯酰胺单体。胶可通过共价或非共价附接将聚合物或水凝涂覆在表面上。
[0121] 在一些实施方案中,杂聚物包括: 以及任选地 其z
中每个R 独立地为H或C1‑4烷基。在一个示例中,所使用的聚合物可包括以下示例:诸如聚(N‑(5‑叠氮基乙酰胺基戊基)丙烯酰胺‑共‑丙烯酰胺),也称为PAZAM:
[0122] 其中n为1至20,000范围内的整数,并且m为1至100,000范围内的整数。在一些示例中,丙烯酰胺单体可包括叠氮基乙酰胺基戊基丙烯酰胺单体: 在一些示例中,
丙烯酰胺单体可包括N‑异丙基丙烯酰胺
[0123] 在一些实施方案中,杂聚物可包括以下结构:
[0124] 其中x为1至20,000范围内的整数,并且y为1至100,000范围内的整数,或者 其中y为1至20,000范围内的整
z
数,并且x和z为整数,其中x和z的总和可在1至100,000的范围内,其中每个R独立地为H或C1‑4烷基,并且分别地,x:y的比率可为大约10:90至大约1:99,或可为大约5:95,或者(x:y):
z的比率可为大约85:15至大约95:5,或可为大约90:10(其中x:(y:z)的比率可为大约1:
(99)至大约10:(90),或可为大约5:(95))。
[0125] 在本文所述方法的任何实施方案中,固体载体上的第一多个结合位点和/或模板多核苷酸的功能部分可包含选自以下项的官能团:取代或未取代的烯基、取代或未取代的炔基、取代或未取代的环烯基(例如,降冰片烯基、顺式或反式环辛烯基)、取代或未取代的环炔基(例如,环辛炔基、二苯并环辛炔基、双环壬炔基)、叠氮基、取代或未取代的四嗪基、取代或未取代的肼基、取代或未取代的四唑基、醛、、羧酸、磺酰氟、重氮基(例如,α重氮羰基)、取代或未取代的肟、羟肟酰卤、氧化腈、硝酮、取代或未取代的氨基、取代或未取代的肼、硫醇或羟基。
[0126] 在本文所述方法的任何实施方案中,固体载体上的第二多个结合位点和/或表面引物寡核苷酸的功能部分可包含选自以下项的官能团:取代或未取代的烯基、取代或未取代的炔基、取代或未取代的环烯基(例如,降冰片烯基、顺式或反式环辛烯基)、取代或未取代的环炔基(例如,环辛炔基、二苯并环辛炔基、双环壬炔基)、叠氮基、取代或未取代的四嗪基、取代或未取代的肼基、取代或未取代的四唑基、醛、酮、羧酸、磺酰氟、重氮基(例如,α‑重氮羰基)、取代或未取代的肟、羟肟酰卤、氧化腈、硝酮、取代或未取代的氨基、取代或未取代的肼、硫醇或羟基。
[0127] 在一些实施方案中,第一多个结合位点和第二多个结合位点是不同的。在进一步的实施方案中,模板多核苷酸的功能部分不同于表面引物寡核苷酸的功能部分。在进一步的实施方案中,用于捕获模板多核苷酸的化学作用与用于捕获表面引物的化学作用正交。
[0128] 本文所述的方法的一个实施方案在图2中示出。图2示出了在固体载体200上的一个纳米孔201的横截面图,其中固体载体含有被间隙区域分开的多个纳米孔。在第一步中,首先用允许捕获文库DNA(通过共价捕获或非共价捕获化学作用)的第一多个结合位点202官能化纳米孔201。然后,首先将文库DNA(即,文库链)与具有与引物寡核苷酸互补的序列的衔接子连接,然后用可以被表面上的第一多个结合位点捕获的官能团204修饰。然后,使文库DNA在含有低浓度盐的缓冲溶液中流过表面。经由第一捕获侧204与官能团204之间的相互作用将文库链203捕获在表面上。在该过程中,可以避免多条文库链共同定位在流通池表面上的单个纳米孔内,因为在没有高盐缓冲液的筛选的情况下,由于来自已经占据纳米孔的文库链的静电排斥,二次接种事件(诸如引入第二文库链203a)是不受欢迎的。接种后,然后将引物寡核苷酸205(诸如P5或P7引物)接枝在表面上。在一些实施方案中,可将引物寡核苷酸在高盐缓冲液中接枝在表面上。在其他实施方案中,可将引物寡核苷酸在低盐缓冲液或甚至纯水中接枝在表面上。随后的扩增步骤在表面上产生单克隆簇206。
[0129] 在本文所述的低盐接种方法的一些实施方案中,该方法将%PF改善至至少60%、65%、70%、75%、80%、85%、90%、95%、98%或99%。在一些进一步的实施方案中,该方法改善了单克隆性,使得基底的表面上的至少50%、55%、60%、65%、70%、75%、80%、85%、
90%、95%、98%或99%的占据的纳米孔呈现足够的单克隆性,以产生足够质量的SBS数据(即,仅存在一个模板多核苷酸簇或仅存在一个优势模板多核苷酸簇)。在进一步的实施方案中,该方法改善了基底的表面上的纳米孔的总体占据率,使得表面上的至少60%、65%、
70%、75%、80%、85%、90%、95%、98%或99%的可用纳米孔被模板多核苷酸占据。纳米孔还可呈表面上的任何其他形式的凹陷或轮廓、如本文所述的任何形状或尺寸。在进一步的实施方案中,表面上的纳米孔、凹陷或轮廓形成图案化阵列,其中纳米孔、凹陷或轮廓被间隙区域分开。
[0130] 文库制备
[0131] 文库制备是任何高通量测序平台的第一步。在文库制备期间,将核酸序列(例如,基因组DNA样品或cDNA或RNA样品)转化成测序文库,然后可以对其进行测序。以DNA样品为例,文库制备的第一步是DNA样品的随机片段化。首先将样品DNA片段化,并将特定大小(通常为200bp‑500bp,但可以更大)的片段连接、亚克隆或“插入”在两个寡核苷酸衔接子(衔接子序列)之间。这之后可进行扩增和测序。原始样品DNA片段被称为“插入物”,另选地,“标签化”可以用于将样品DNA附接到衔接子。在标签化中,同时将双链DNA片段化并用衔接子序列和PCR引物结合位点进行标签化。该组合反应消除了文库制备期间对单独的机械剪切步骤的需要。在用衔接子序列修饰之前,还可有利地对靶多核苷酸进行大小分级。
[0132] 如本文所用,“衔接子”序列包含作为文库制备的一部分连接到测序文库中每个DNA(或RNA)片段的5'和3'端的短序列特异性寡核苷酸。
[0133] 如技术人员将理解的,双链核酸通常将由两个互补的多核苷酸链形成,所述两个互补多核苷酸链由通过磷酸二酯键连接的脱氧核糖核苷酸构成,但可另外包含一个或多个核糖核苷酸和/或非核苷酸化学部分和/或非天然存在的核苷酸和/或非天然存在的主链键。具体地讲,双链核酸可包括非核苷酸化学部分,例如在一条或两条链的5'端处的接头或间隔子。作为非限制性示例,双链核酸可包括甲基化核苷酸、尿嘧啶碱基、硫代磷酸根基团,也可包括肽缀合物等。可包括此类非DNA或非天然修饰以便赋予核酸一些期望的特性,例如以能够共价、非共价或金属配位附接到固体载体,或者充当间隔子以将裂解位点定位在距固体载体最佳距离处。单链核酸由一条这种多核苷酸链组成。在多核苷酸链仅与互补链部分杂交(例如,长多核苷酸链与短核苷酸引物杂交)的情况下,其在本文中仍可被称为单链核酸。
[0134] 在本文所述的方法的一些实施方案中,文库DNA链被修饰以具有能够被捕获在基底的表面处(例如,被如本文所述的基底的表面上的第一多个结合位点捕获)的官能团。图3示出了用于制备修饰的DNA文库的两种不同的工作流程:(A)基于PCR的文库和(B)无PCR的文库。在一些实施方案中,文库DNA的化学官能化可以在聚类之前通过一轮PCR扩增来共价掺入(基于PCR的文库)或通过修改现有的工作流程步骤(包括文库制备期间的衔接子杂交)来添加(无PCR的文库)。
[0135] 对于基于PCR的文库制备,制备双链模板,包括将文库片段化并将衔接子序列连接到插入物。这会产生在其5'和3'端两侧有包含引物结合序列的衔接子序列的插入序列。一旦形成文库,就使文库变性,并在PCR富集期间引入期望的化学官能化。如图3(A)所示,引物结合序列的互补序列与模板链中的互补序列(例如,P5'或P7')退火。P7或P5引物的延伸产生例如在5'端存在生物素或BDCO部分的双链模板。
[0136] 不同的工作流程适用于无PCR的文库制备。在图3(B)中,通过标准程序构建无PCR的文库,然后使其变性以产生游离单链文库。在中和变性反应后,过量添加带有期望化学官能化的封闭寡聚物。该寡聚物含有例如生物素或DBCO,其中序列与无PCR的3'末端上的P7'互补。这些封闭寡聚物有效地使P7'成为双链,因此它不能与FC退火,同时提供可用于在纳米孔中化学结合文库的官能化。
[0137] 除了与表面引物(诸如P5'或P7')互补的序列之外,还可将另外的序列添加到文库链中。索引序列(也称为条形码或标签序列)是在文库制备期间添加到每个DNA片段中的独特的短DNA序列。这些独特的序列允许将许多文库汇集在一起并同时测序。在最终数据分析之前,基于条形码来鉴定并计算分类来自汇集文库的测序读数。当处理小基因组或靶向感兴趣的基因组区域时,文库复用也是一种有用的技术。与条形码复用可以指数地增加在单次运行中分析的样品的数量,而不会大幅增加运行成本或运行时间。标签序列的示例见于WO 2005/068656,该文献的内容全文以引用方式并入本文。标签可以在第一次读取结束时通过与索引读取引物杂交来读取,或者在第二次读取结束时通过使用表面引物作为索引读取引物P7来读取。本发明不受每个簇的读数数量(例如,每个簇两个读数)的限制:每个簇三个或更多个读数可简单地通过在簇重新成群/链重新合成步骤之前或之后重新杂交第一延伸测序引物和重新杂交第二引物来获得。也可使用单索引或双索引。利用单索引,可以使用多达48个独特的6碱基索引来产生多达48个独特标记的文库。利用双索引,可以组合使用多达24个独特的8碱基索引1序列和多达16个独特的8碱基索引2序列来产生多达384个独特标记的文库。也可以使用索引对,使得仅使用一次每个i5索引和每个i7索引。利用这些独特的双索引,可以鉴定并过滤索引的跳变读数,从而在复用样品中提供甚至更高的置信度
[0138] 测序结合位点是测序和/或索引引物结合位点并且指示测序读数的起始点。在测序过程期间,测序引物与模板链上的测序结合位点的一部分退火(即,杂交)。DNA聚合酶与该位点结合并将互补核苷酸逐个碱基掺入生长的相反链中。在一个实施方案中,测序过程包括第一和第二测序读数。第一测序读数可包括第一测序引物(读数1测序引物)与第一测序结合位点(例如,SBS3')的结合,随后是互补链的合成和测序。这使得对插入物进行测序。在第二步中,索引测序引物(例如,i7测序引物)与第二测序结合位点(例如,SBS12)结合,使得对索引序列进行合成和测序(例如,对i7引物进行测序)。第二测序读数可包括索引测序引物(例如,i5测序引物)与模板上的第一测序结合位点的互补序列(例如,SBS3)的结合,以及索引序列(例如,i5)的合成和测序。在第二步中,与引物(例如,i7测序引物)的互补序列结合的第二测序引物(读数2测序引物)与第二测序结合位点(例如,SBS12')结合,使得在反向方向上对插入物进行合成和测序。
[0139] 一旦形成双链核酸模板文库,通常将使该文库经受变性条件以提供单链核酸。合适的变性条件对于技术人员而言将是显而易见的,参考标准分子生物学方案(Sambrook等人,2001,Molecular Cloning,A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor Laboratory Press,NY;Current Protocols,Ausubel等人编辑)。在一个实施方案中,使用化学变性,诸如NaOH或甲酰胺。在另一个实施方案中,通过加热使DNA热变性。
[0140] 变性后,可以使单链模板文库在游离溶液中接触到包含表面捕获部分(例如,P5和P7引物)的固体载体上。该固体载体通常是流通池,尽管在另选的实施方案中,可以使用例如微珠等在流通池外进行接种和聚类。
[0141] 图4示出了根据本公开的实施方案的修改文库的两个示例,该修改文库使得能够使用(A)文库DNA链(模板多核苷酸)的非共价捕获或(B)文库DNA链的共价捕获进行新的基于杂交的低盐接种方法。
[0142] 在如图4(A)中所示的一个实施方案中,根据图3(A)中所述的工作流程来制备在P5或P7衔接子序列的5'端具有生物素官能度的双链模板多核苷酸。基底的表面包含多个抗生物素蛋白结合位点(例如,链霉抗生物素蛋白),这些结合位点允许链霉抗生物素蛋白与生物素部分之间的非共价相互作用,从而捕获模板多核苷酸。另选地,固体载体可包含生物素,并且可用抗生物素蛋白部分官能化模板多核苷酸。也可使用其他非共价相互作用。这些非共价相互作用可包括本文所述的离子键、氢键、疏水相互作用、π‑π相互作用、范德华相互作用和主客体相互作用中的一种或多种。当使用非共价相互作用时,相互作用的类型没有特别限制,条件是相互作用(总体上)足够强以使模板在延伸期间保持附接到固体载体。非共价相互作用也可足够弱,使得一旦模板的拷贝在表面引物上延伸,就可以从固体载体上去除模板。
[0143] 在如图4(B)所示的另一个实施方案中,模板多核苷酸可通过共价键附接到固体载体。基底的表面包含多个叠氮基结合位点(例如,将叠氮基结合位点引入PAZAM涂覆的表面)。根据图3(A)中所述的工作流程来制备在P5或P7衔接子序列的5'端具有DBCO官能度的双链模板多核苷酸。模板多核苷酸通过DBCO和叠氮基的反应与表面共价结合,从而形成 当使用共价键时,键可
以是稳定的,使得模板保持附接到固体载体。共价键的非限制性示例包括亚烷基键、亚烯基键、亚炔基键、醚键(例如,乙二醇、丙二醇、聚乙二醇)、胺键、酯键、酰胺键、碳环或杂环键、基于硫的键(例如,硫醚、二硫化物、聚硫化物或亚砜键)、缩醛、半缩醛胺醚、缩醛胺、亚胺、腙、基于硼的键(例如,硼醇酸和硼酸/酯)、基于硅的键(例如,甲硅烷基醚、硅氧烷)和基于磷的键(例如,亚磷酸酯、磷酸酯)。
[0144] 在一些实施方案中,共价键可以是可逆共价键,使得一旦模板的拷贝在表面引物上延伸,就可以从固体载体上去除模板。在其他实施方案中,共价键可以是不可逆键。
[0145] 可使用用于将功能部分添加到模板多核苷酸或表面引物的任何合适的生物缀合方法。具有功能部分或结构的修饰的核苷酸可商购获得,并且用于将它们附接或包括到聚合物、核苷酸或多核苷酸的方法也是已知的。在一端具有来自表1中列出的一对互补结合配偶体的部分或结构并且具有来自表1中列出的另一对互补结合配偶体的部分或结构的双功能接头分子也可商购获得。模板多核苷酸或引物寡核苷酸可与这种接头的一端结合,使得初始部分或结构被另一部分(即,存在于接头的另一端上的部分或结构)有效替代。
[0146] 例如,双功能接头可在一端具有来自表1中列出的那些部分的部分,诸如NHS‑酯基团。其可在另一端具有另一基团,诸如叠氮基基团。这些端可通过接头(诸如连接序列中的一个或多个PEG基团、烷基链、它们的组合等)彼此连接。如果模板多核苷酸具有胺基团,则双功能接头的NHS‑酯端可以与胺基团结合,从而使游离的叠氮基端可用于与带有叠氮基基团的结合配偶体(例如,炔烃、膦、环辛烯或降冰片烯等)的第一多个结合位点结合。在一端包括在表1中鉴定的用于形成一种类型的结合位点或功能部分的部分并且在另一端包括在表1中鉴定的用于形成另一类型的结合位点或功能部分的不同部分的双功能接头的许多其他示例可商购获得。
[0147] 在另一个示例中,模板多核苷酸可包括第一多肽序列,并且基底的第一多个结合位点可具有能够与模板多核苷酸的第一多肽序列共价结合的第二多肽序列。此类对的非限6 2
制性示例包括SpyTag/SpyCatcher系统、Snap‑tag/O‑苄基鸟嘌呤系统和CLIP‑tag/O ‑苄基胞嘧啶系统。类似地,表面引物寡核苷酸和基底的第二多个结合位点可具有第一多核苷酸序列和第二多核苷酸序列。可获得互补SpyTag/SpyCatcher系统对和编码它们的多核苷酸的氨基酸序列。序列的示例在表1中提供。可获得SpyTag序列和SpyCatcher序列的若干氨基
6
酸位点突变以包括在重组多肽中。Snap‑tag是功能性O‑甲基鸟嘌呤‑DNA甲基转移酶,并且CLIP‑tag是Snap‑tag的修饰版本。编码Snap‑tag、CLIP‑tag、SpyCatcher的核苷酸序列可商购获得以用于亚克隆和包括在工程化多肽序列中。
[0148] 另选地,用于将模板多核苷酸或表面引物分别附接在第一或第二多个结合位点上的互补对可经由酶促催化形成共价键而彼此共价附接。例如,模板多核苷酸和第一结合位点可包括能够通过分选酶介导的偶联彼此共价附接的基序,例如一者上的LPXTG氨基酸序列和另一者上的寡聚甘氨酸亲核序列(具有例如3至5个甘氨酸的重复序列)。然后可进行分选酶介导的转肽作用,以使支架和模板多核苷酸在单个模板位点处共价附接。
[0149] 在另一个示例中,模板多核苷酸(或表面引物)、第一多个结合位点(或第二多个结合位点)可包括或附接到互补肽结合位点。例如,模板多核苷酸可包括或附接到可作为互补卷曲螺旋基序对彼此结合的肽序列。卷曲螺旋基序是一些多肽的结构特征,其中两个或更多个多肽链各自形成α‑螺旋二级结构,并且α‑螺旋卷曲在一起以形成紧密的非共价键。卷曲螺旋序列可包括七肽重复序列,即七个氨基酸HPPHCPC的重复模式(其中H表示疏水性氨基酸,C通常表示带电氨基酸,并且P表示极性的亲水性氨基酸)。七肽重复序列的示例在亮氨酸拉链卷曲螺旋中发现,其中七肽的第四个氨基酸通常为亮氨酸。
[0150] 在另一个示例中,模板多核苷酸(或表面引物)、第一多个结合位点(或第二多个结合位点)可包括或附接到非共价结合在一起的肽对。示例包括生物素‑抗生物素蛋白结合对。生物素和抗生物素蛋白肽(诸如抗生物素蛋白、链霉抗生物素蛋白和中性抗生物素蛋白,除非另外特别说明,否则所有这些均统称为“抗生物素蛋白”)彼此形成强非共价键。这种对的一个部分(无论是生物素还是抗生物素蛋白的结合部分)可以是模板多核苷酸或表面引物的一部分或者附接到模板多核苷酸或表面引物,其中互补部分相应地是第一多个结合位点或第二多个结合位点的一部分或者附接到第一多个结合位点或第二多个结合位点,反之亦然,从而允许在它们之间进行非共价附接。
[0151] 许多方法可用于在DNA分子或模板多核苷酸中包括一个或多个生物素部分或者将一个或多个生物素部分添加到DNA分子或模板多核苷酸。例如,可商购获得生物素化的核苷酸以用于通过聚合酶掺入DNA分子中,并且可商购获得试剂盒以用于将生物素部分添加到多核苷酸或多肽中。也可以将生物素残基添加到氨基酸或修饰的氨基酸或者核苷酸或修饰的核苷酸中。表1中所示的连接化学还可以用于将生物素基团添加到蛋白质的诸如羧酸基团、胺基团或硫醇基团上。若干生物素连接酶也可用于酶促靶向生物素化,诸如多肽(例如,多肽中包括的AviTag氨基酸序列GLNDIFEAQKIEWHE的赖氨酸残基)的酶促靶向生物素化。基因工程化的抗坏血酸盐过氧化物酶(APEX)也可用于修饰生物素,以允许富含电子的氨基酸(诸如酪氨酸以及可能的色氨酸、半胱氨酸或组氨酸)的生物素化。
[0152] 在另一个示例中,包括氨基酸序列DSLEFIASKLA的多肽可被生物素化(在序列中存在的两个S残基的更靠N末端),其是Sfp磷酸泛酰巯基乙胺基转移酶催化的利用辅酶A(CoA)缀合的小分子共价附接到其上的基底。例如,包括该序列的多肽可以通过利用CoA‑生物素缀合物共价附接到其上而被生物素化。该系统还可以用于附接表1中鉴定的许多其他类型的结合部分或结构,以用于形成如本文所公开的使支架结合到DNA分子或多肽或其他分子的结合位点。例如,与表1中鉴定的反应对部分中的任一种缀合的CoA可以通过Sfp磷酸泛酰巯基乙胺基转移酶共价附接到含有上述序列的多肽,从而允许包括互补结合配偶体的另一种组合物与其结合。
[0153] 其他酶可用于将结合部分添加到多肽。例如,硫辛酸连接酶可以添加硫辛酸分子或者包括表1中鉴定的结合部分(诸如炔烃或叠氮化物基团)的修饰的硫辛酸分子可以共价连接到多肽中包括的氨基酸序列DEVLVEIETDKAVLEVPGGEEE或GFEIDKVWYDLDA中的赖氨酸残基的侧基的胺。在另一个示例中,其中包括或旨在与其结合的支架、模板多核苷酸或其他多肽或DNA分子可包括或附接到活性丝氨酸水解酶。氟代膦酸盐分子共价连接到丝氨酸水解酶的活性位点中的丝氨酸残基。包括表1中鉴定的结合部分(诸如叠氮化物基团或脱硫生物素基团)的氟代膦酸盐分子的可商购获得的类似物是可以与抗生物素蛋白结合的生物素的类似物。因此,此类基团可以共价附接到包括在或附接到如本文所公开的支架中所用或附接的多肽或DNA分子中的丝氨酸水解酶,并且此类结合部分或结构可以通过附接合适的修饰的氟代膦酸盐分子来共价添加到其上,以在此类蛋白质上为来自表1的互补结合配偶体(诸如叠氮化物‑炔烃、叠氮化物‑膦、叠氮化物‑环辛炔、叠氮化物‑降冰片烯或脱硫生物素‑抗生物素蛋白结合)产生结合位点。
[0154] 前述生物素化组合物(以促进与包括抗生物素蛋白序列的多肽(诸如包括在或附接到另一种组合物中的抗生物素蛋白多肽)结合或者以其他方式将官能团添加到多肽作为支架的一部分、附接到支架、作为辅助物的一部分或附接到辅助物或模板多核苷酸,以用于在支架与模板多核苷酸之间或在支架与辅助物之间进行结合)方法中的任何一种可用于允许或促进在如本文所公开的此类组分之间进行结合。
[0155] 扩增
[0156] 作为简单示例,在附接P5和P7引物之后,可在允许模板与固定引物之间杂交(或退火—此类术语可互换使用)的条件下使固体载体与待扩增的模板接触。通常在合适的杂交条件下在游离溶液中添加模板,这对于技术人员将是显而易见的。通常,杂交条件是例如在40℃下5xSSC。然后可以进行固相扩增。扩增的第一步是引物延伸步骤,其中使用模板将核苷酸添加到固定引物的3'端以产生完全延伸的互补链。然后通常将模板从固体载体上洗掉。互补链将在其3'端包括能够与固定在固体载体上的第二引物分子桥接并结合的引物结合序列(即,P5'或P7')。另外轮次的扩增(类似于标准PCR反应)使得形成与固体载体结合的模板分子的簇或集落。
[0157] 基底
[0158] 本公开的附加方面涉及一种用于测序的基底,所述基底包括:
[0159] 模板多核苷酸,所述模板多核苷酸通过第一多个结合位点经由共价或非共价结合附接到所述基底的表面;以及
[0160] 用于捕获引物寡核苷酸的第二多个结合位点;
[0161] 其中所述基底的所述表面包括多个图案化纳米孔,并且其中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的所述纳米孔各自被一个模板多核苷酸占据。在进一步的实施方案中,根据本文所述的低盐接种方法来制备基底。
[0162] 在基底的任何实施方案中,第一多个结合位点和/或第二多个结合位点可与在低盐引晶方法中描述的那些相同。
[0163] 在一些实施方案中,基底包括图案化表面。例如,基底可利用由基底或基质(例如,载玻片、聚合物小珠等)组成的固体载体,该基底或基质已例如通过施加包含反应性基团的中间材料的层或涂层被官能化,这些反应性基团允许共价附接到生物分子诸如表面引物寡核苷酸。此类载体的示例包括但不限于基底,诸如玻璃。在此类实施方案中,生物分子(例如,表面引物)可直接共价附接到中间材料,但中间材料本身可非共价附接到基底或基质(例如,玻璃基底)。另选地,可处理基底(诸如玻璃)以允许生物分子的直接共价附接;例如,可用盐酸处理玻璃,从而暴露玻璃的羟基基团,并且使用亚磷酸三酯化学物质来经由玻璃的羟基基团与核苷酸的磷酸基团之间的共价键将核苷酸直接附接到玻璃。在一个实施方案中,可用叠氮基基团官能化固体载体。在进一步的实施方案中,可通过中间材料诸如PAZAM涂覆引入叠氮基基团。
[0164] 在其他实施方案中,可通过施加包含允许非共价连接到生物分子的基团的中间材料的层或涂层来“官能化”固体载体。在此类实施方案中,固体载体上的基团可与生物分子(例如,多核苷酸)上对应基团形成离子键、氢键、疏水相互作用、π‑π相互作用、范德华相互作用和主客体相互作用中的一种或多种。在固体载体上的基团与生物分子上的对应基团之间形成的相互作用可被配置为在旨在使用载体的条件下(例如,在需要核酸扩增和/或测序的应用中)引起固定或附接。例如,在固体载体上的基团与生物分子上的对应基团之间形成的相互作用可被配置为使得生物分子在扩增和/或测序期间保持附接到固体载体。在一个实施方案中,可官能化固体载体以引入抗生物素蛋白结合位点(例如,链霉抗生物素蛋白)。
[0165] 在其他实施方案中,可通过施加包含允许经由金属配位键附接到生物分子的基团的中间体材料来“官能化”固体载体。在此类实施方案中,固体载体上的基团可包括能够与生物分子上的金属部分结合的配体(例如,金属配位基团)。另选地或另外,固体载体上的基团可包括能够与生物分子上的配体结合的金属部分。在配体与金属部分之间形成的金属‑配位相互作用可被配置为在旨在使用载体的条件下(例如,在需要核酸扩增和/或测序的应用中)引起生物分子的固定或附接。例如,在固体载体上的基团与生物分子上的对应基团之间形成的相互作用可被配置为使得生物分子在扩增和/或测序期间保持附接到固体载体。
[0166] 当提及将分子(例如,核酸)固定或附接到固体载体时,术语“固定”和“附接”在本文中可互换使用,并且两个术语旨在涵盖直接或间接、共价或非共价附接,除非另外明确地或通过上下文指明。在本发明的某些实施方案中,共价附接可能是优选的;在其他实施方案中,使用非共价相互作用的附接可能是优选的;在其他实施方案中,使用金属配位键的附接可能是优选的。然而,一般来讲,分子(例如,核酸)在旨在使用载体的条件下(例如,在需要核酸扩增和/或测序的应用中)保持固定或附接到载体。当提及将核酸附接到其他核酸时,则本文使用术语“固定”和“杂交”,并且一般是指互补核酸之间的氢键合。
[0167] 如果用单个或多个可延伸引物在小珠上进行扩增,则可在溶液中、在微量滴定板或皮量滴定板的各个孔中分析小珠,将小珠固定在各个孔中,例如固定在光纤型装置中,或作为阵列固定在固体载体上。固体载体可以是平面表面,例如显微镜载玻片,其中小珠随机沉积并用聚合物膜(例如,琼脂糖或丙烯酰胺)保持在适当位置。
[0168] 测序应用
[0169] 一些实施方案涉及使用通过本文所述的方法制备的具有图案化表面的基底来检测分析物的方法。在一些实施方案中,分析物选自核酸、多核苷酸、蛋白质、抗体、抗体的表位、酶、细胞、细胞核、细胞器或小分子药物。在一个实施方案中,分析物是多核苷酸。在一个实施方案中,检测包括确定多核苷酸的核苷酸序列。
[0170] 使用核酸的一些实施方案可以包括在基底上扩增核酸的步骤。许多不同的DNA扩增技术可以与本文所述的基底结合使用。可以使用的示例性技术包括但不限于聚合酶链反应(PCR)、滚环扩增(RCA)、多重置换扩增(MDA)或随机引发扩增(RPA)。在特定实施方案中,用于扩增的一种或多种寡核苷酸引物可以附接到基底(例如,经由叠氮基硅烷层)。在PCR实施方案中,用于扩增的引物中的一种或多种可以附接到基底。利用两个种类的附接引物的形式通常被称为桥扩增,因为双链扩增子在侧接已被拷贝的模板序列的两个附接引物之间形成桥样结构。可以用于桥扩增的示例性试剂和条件描述于例如美国专利号5,641,658、美国专利公布号2002/0055100、美国专利号7,115,400、美国专利公布号2004/0096853、美国专利公布号2004/0002090、美国专利公布号2007/0128624以及美国专利公布号2008/0009420,这些专利中的每一项以引用方式并入本文。
[0171] PCR扩增也可以用附接到基底的一种扩增引物和溶液中的第二引物进行。使用一种附接引物和可溶性引物的组合的示例性形式是乳液PCR,如描述于例如Dressman等人,Proc.Natl.Acad.Sci.USA 100:8817‑8822(2003)、WO 05/010145或美国专利公布号2005/0130173或2005/0064460,这些文献中的每一项以引用方式并入本文。乳液PCR是该形式的示例,并且应当理解,为了本文所述方法的目的,乳液的使用是任选的,并且实际上几个实施方案不使用乳液。此外,引物不需要如ePCR参考文献中所阐述直接连接到基底或固体载体,而是可以如本文所阐述附接到凝胶或聚合物涂层。
[0172] 可以修改RCA技术以用于本公开的方法中。可以用于RCA反应的示例性组分和RCA产生扩增子的原理描述于例如Lizardi等人,Nat.Genet.19:225‑232(1998)以及US2007/0099208 A1,这些文献中的每一项以引用方式并入本文。用于RCA的引物可以在溶液中或者附接到凝胶或聚合物涂层。
[0173] 可以修改MDA技术以用于本公开的方法中。MDA的一些基本原理和有用条件描述于例如Dean等人,Proc Natl.Acad.Sci.USA 99:5261‑66(2002);Lage等人,Genome Research 13:294‑307(2003);Walker等人,Molecular Methods for Virus Detection,Academic Press,Inc.,1995;Walker等人,Nucl.Acids Res.20:1691‑96(1992);US 5,455,166;US 5,
130,238;以及US 6,214,587,这些文献中的每一项以引用方式并入本文。用于MDA的引物可以在溶液中或者附接到凝胶或聚合物涂层。
[0174] 在特定实施方案中,可以使用上文例示的扩增技术的组合。例如,可以组合使用RCA和MDA,其中RCA用于在溶液中生成多联体扩增子(例如,使用溶液相引物)。然后该扩增子可以用作模板,以使用附接到基底(例如,经由凝胶或聚合物涂层)的引物进行MDA。在该示例中,在组合RCA和MDA步骤后产生的扩增子将附接到基底。
[0175] 含有核酸阵列的本公开的基底可以用于多种目的中的任一种。核酸的特别理想的用途是充当与具有互补序列的靶核酸杂交的捕获探针。靶核酸一旦与捕获探针杂交就可以被检测到,例如经由募集到捕获探针的标记。经由与捕获探针杂交来检测靶核酸的方法在本领域中是已知的,并且包括例如美国专利号7,582,420、6,890,741、6,913,884或6,355,431或者美国专利公布号2005/0053980A1、2009/0186349A1或2005/0181440A1中所述的那些,这些专利中的每一项以引用方式并入本文。例如,可以借助于捕获探针与带有标记的靶探针的杂交来将标记募集到捕获探针。在另一个示例中,可以通过使靶探针与捕获探针杂交使得捕获探针可以通过连接到标记的寡核苷酸(例如,经由连接酶活性)或通过添加标记的核苷酸(例如,经由聚合酶活性)而延伸来将标记募集到捕获探针。
[0176] 在一些实施方案中,本文所述的基底可以用于确定多核苷酸的核苷酸序列。在此类实施方案中,所述方法可以包括以下步骤:(a)在聚合酶(例如,DNA聚合酶)存在下使基底附接的多核苷酸/拷贝多核苷酸复合物与一种或多种不同类型的核苷酸接触;(b)将一种类型的核苷酸掺入到拷贝多核苷酸链中以形成延伸的拷贝多核苷酸;(c)对一种或多种延伸的拷贝多核苷酸进行一种或多种荧光测量;其中重复步骤(a)至(c),从而确定基底附接的多核苷酸的序列。
[0177] 核酸测序可以用于通过本领域已知的各种过程来确定多核苷酸的核苷酸序列。在优选的方法中,利用边合成边测序(SBS)来确定附接到基底的表面(例如,经由本文所述的聚合物涂层中的任一种)的多核苷酸的核苷酸序列。在这种过程中,向与多核苷酸聚合酶相关的模板多核苷酸提供一个或多个核苷酸。多核苷酸聚合酶将一个或多个核苷酸掺入与多核苷酸模板互补的新合成的核酸链中。从与模板多核苷酸的一部分或者与在模板多核苷酸一端共价结合的通用或非可变核酸的一部分互补的寡核苷酸引物开始合成。随着针对模板多核苷酸掺入核苷酸,产生可检测信号,该信号允许确定在测序过程的每个步骤期间已经掺入哪个核苷酸。以这种方式,可以产生与模板多核苷酸的至少一部分互补的核酸序列,从而允许确定模板多核苷酸的至少一部分的核苷酸序列。
[0178] 流通池提供了用于容纳通过本公开的方法产生并且经受边合成边测序(SBS)或涉及在循环中重复递送试剂的其他检测技术的阵列的方便形式。例如,为了启动第一SBS循环,可以使一种或多种标记的核苷酸、DNA聚合酶等流入/流过容纳通过本文阐述的方法制备的核酸阵列的流通池。可以检测其中引物延伸引起标记的核苷酸掺入的那些阵列位点。任选地,核苷酸还可以包括一旦将核苷酸添加到引物就终止进一步的引物延伸的可逆终止属性。例如,可以将具有可逆终止子部分的核苷酸类似物添加到引物,使得后续的延伸直到递送解封闭剂以去除该部分才发生。因此,对于使用可逆终止的实施方案,可以将解封闭试剂递送到流通池(在检测发生之前或之后)。洗涤可以在各个递送步骤之间进行。然后可以重复该循环n次以使引物延伸n个核苷酸,从而检测长度为n的序列。可以容易地适于与通过本公开的方法产生的阵列一起使用的示例性SBS程序、流体系统和检测平台在描述于例如Bentley等人,Nature 456:53‑59(2008)、WO 04/018497、US 7,057,026、WO 91/06678、WO 
07/123744、US 7,329,492、US 7,211,414、US 7,315,019、US 7,405,281和US2008/
0108082,这些文献中的每一项全文以引用方式并入本文。
[0179] 在采用流通池的上述方法的一些实施方案中,在单个流动步骤期间流通池中仅存在单一类型的核苷酸。在此类实施方案中,核苷酸可以选自由dATP、dCTP、dGTP、dTTP以及它们的类似物组成的组。在采用流通池的上述方法的其他实施方案中,在单个流动步骤期间流通池中存在多种不同类型的核苷酸。在此类方法中,核苷酸可以选自dATP、dCTP、dGTP、dTTP以及它们的类似物。
[0180] 通过检测在多核苷酸模板处或附近产生的信号来实现对附接到流通池中存在的基底表面上的聚合物涂层的一个或多个多核苷酸在每个流动步骤期间掺入的一个或多个核苷酸的确定。在上述方法的一些实施方案中,可检测信号包括光学信号。在其他实施方案中,可检测信号包括非光学信号。在此类实施方案中,非光学信号包括多核苷酸模板中的一个或多个处或附近的pH的变化。
[0181] 本文已经针对核酸例示了本公开的基底的应用和用途。然而,应当理解,其他分析物可以附接到本文阐述的基底并对其进行分析。一种或多种分析物可以存在于本公开的基底中或基底上。本公开的基底特别可用于检测分析物,或用于与分析物进行合成反应。因此,多种待检测、表征、修饰、合成等的分析物中的任一种可以存在于本文阐述的基底中或基底上。示例性分析物包括但不限于核酸(例如,DNA、RNA或它们的类似物)、蛋白质、多糖、细胞、抗体、表位、受体、配体、酶(例如,激酶、磷酸酶或聚合酶)、小分子候选药物等。基底可以包括来自分析物文库的多个不同种类。例如,这些种类可以是来自抗体文库的不同抗体、来自核酸文库的具有不同序列的核酸、来自蛋白质文库的具有不同结构和/或功能的蛋白质、来自小分子组合文库的药物候选物等。
[0182] 在一些实施方案中,分析物可以分布到基底上的特征,使得它们可单独解析。例如,每种分析物的单个分子可以存在于每个特征处。另选地,分析物可以作为集落或群体存在,使得不一定对单个分子进行解析。就仅含有单一种类的分析物而言,集落或群体可以是同质的(尽管有多个拷贝)。以核酸为例,基底上的每个特征可以包括核酸的集落或群体,并且集落或群体中的每个核酸可以具有相同的核苷酸序列(单链或双链)。此类集落可以通过如本文先前阐述的簇扩增或桥扩增来产生。靶序列的多个重复可以存在于单个核酸分子中,诸如使用滚环扩增程序产生的多联体。因此,基底上的特征可以含有单一种类的分析物的多个拷贝。另选地,位于特征处的分析物的集落或群体可以包括两个或更多个不同种类。例如,基底上的一个或多个孔可以各自含有具有两个或更多个不同核酸种类(即,具有不同序列的核酸分子)的混合集落。混合集落中的两个或更多个核酸种类可以以不可忽略的量存在,例如允许在混合集落中检测到多于一种核酸。