多次甲基化合物和其作为荧光标记物的用途转让专利

申请号 : CN201580023977.8

文献号 : CN106459001B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 尼古拉·尼古拉耶维奇·罗曼诺夫

申请人 : 伊鲁米纳剑桥有限公司

摘要 :

本公开内容涉及式(I)的化合物和其作为荧光标记物的用途。该化合物可以在核酸测序应用中被用作用于核苷酸的荧光标记物。

权利要求 :

1.一种化合物,所述化合物由式(IV):

或其盐来表示,其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且m是整数0-3;

n是整数1-5;并且

Rc1和Rc2中的每个独立地是烷基或被取代的烷基。

2.根据权利要求1所述的化合物,其中Rc1或Rc2是甲基、乙基、丙基或-(CH2)qSO3-,其中q是1-6。

3.根据权利要求2所述的化合物,其中Rc1或Rc2是-(CH2)4-SO3-。

4.根据权利要求1-3中任一项所述的化合物,其中所述化合物被附接至核苷酸或寡核苷酸。

5.一种用根据权利要求1-3中任一项的化合物标记的核苷酸或寡核苷酸。

6.根据权利要求5所述的标记的核苷酸或寡核苷酸,其中标记物经由从COOH部分形成的酰胺键来附接。

7.根据权利要求5或6所述的标记的核苷酸或寡核苷酸,其中标记物通过连接基部分被附接至嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位。

8.根据权利要求5-6中任一项所述的标记的核苷酸或寡核苷酸,还包含共价地附接至所述核苷酸的核糖或脱氧核糖的3’OH阻断基团。

9.根据权利要求7所述的标记的核苷酸或寡核苷酸,还包含共价地附接至所述核苷酸的核糖或脱氧核糖的3’OH阻断基团。

10.一种试剂盒,包含两种或更多种核苷酸,其中至少一种核苷酸是根据权利要求5-9中任一项的标记的核苷酸。

11.根据权利要求10所述的试剂盒,其中所述标记的核苷酸中的两种使用单激光器来激发。

12.根据权利要求11所述的试剂盒,其中四种核苷酸中的第一核苷酸是根据权利要求

5-9中任一项的标记的核苷酸,并且第二核苷酸、第三核苷酸和第四核苷酸各自用不同的化合物来标记,其中每种化合物具有有区别的吸光度最大值,并且化合物中的每种与其他三种化合物是可区别的。

13.根据权利要求12所述的试剂盒,其中四种核苷酸的第一核苷酸是用根据权利要求

1-3中任一项的化合物标记的核苷酸,并且化合物中的两种具有低于600nm的有区别的吸光度最大值。

14.根据权利要求5-9中任一项的核苷酸或根据权利要求5-9中任一项的寡核苷酸在制备用于测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定的试剂盒中的用途。

15.根据权利要求14所述的用途,在自动测序仪器上进行,其中所述自动测序仪器包括在不同的波长下操作的两种激光器。

16.一种合成根据权利要求1-3中任一项的化合物的方法,所述方法利用以下起始材料中的一种:或其盐,其中n是整数1-5;Rc2是烷基或被取代的烷基;Ar是芳香族基团并且R是烷基。

说明书 :

多次甲基化合物和其作为荧光标记物的用途

技术领域

[0001] 本公开内容涉及新的多次甲基化合物和其作为荧光标记物的用途。特别地,该化合物可以在核酸测序应用中被用作用于核苷酸的荧光标记物。
[0002] 背景
[0003] 在本申请中引用若干出版物和专利文献,以便更充分地描述本公开内容所属的领域的状态。这些出版物和文献中的每个的公开内容通过引用并入本文。
[0004] 利用荧光标记物的核酸的非放射性检测是分子生物学中的重要的技术。在重组DNA技术中采用的许多程序先前主要地依赖于用例如32P放射性地标记的核苷酸或多核苷酸的使用。放射性化合物允许核酸和其他感兴趣的分子的灵敏检测。然而,在放射性同位素的使用中存在严重的限制,例如它们的费用、有限的储存期以及更重要的安全考量。排除对放射性标记物的需求提高了安全性,同时降低了与例如试剂处置有关的环境影响和成本。服从非放射性荧光检测的方法通过非限制性实例的方式包括自动DNA测序、杂交法、聚合酶链反应产物的实时检测以及免疫测定。
[0005] 对于许多应用,合意的是,采用多重光谱可区别的荧光标记物以便实现多个空间上重叠的分析物的独立检测。在此类多重方法中,反应容器的数目可以减少,这简化了实验方案并且有助于生产特定应用的试剂盒。在多色自动DNA测序中,例如,多重荧光检测允许在单电泳泳道中分析多核苷酸碱基,从而使总处理能力(throughput)增加超过单色方法并且降低与泳道之间的电泳迁移率变化有关的不确定性。
[0006] 然而,多重荧光检测可能是有问题的并且存在限制荧光标记物的选择的许多重要因素。首先,可能难以发现发射光谱在给定的应用中被合适地光谱地分辨的染料化合物。此外,当若干荧光染料被一起使用时,通过同时激发在可区别的光谱区中产生荧光信号可能是困难的,因为对此可以是可用的染料的吸收带通常宽泛地被分开,所以难以实现几乎相等的荧光激发效率(甚至对于两种染料)。许多激发方法使用高功率光源,如激光器并且因此染料必须具有充分的光稳定性以经受这样的激发。分子生物学方法中特别重要的最终考量是荧光染料必须与使用的试剂化学品例如比如DNA合成溶剂和试剂、缓冲剂、聚合酶以及连接酶相容的程度。
[0007] 概述
[0008] 随着测序技术发展,对于另外的荧光染料化合物、其核酸轭合物和满足所有上文限制并且特别服从高通量分子方法例如固相测序及类似方法的染料组需要开发。
[0009] 具有改进的荧光性质例如荧光带的荧光强度、形状和波长最大值的荧光染料分子可以改进核酸测序的速度和精确度。当在基于水的生物缓冲剂中并且在较高温度下做出测量时,强荧光信号是尤其重要的,因为大部分染料的荧光强度在此类条件下是明显地较低的。此外,染料被附接到其的碱基的性质也影响荧光最大值、荧光强度和其他光谱染料性质。核碱基(mucleobase)和荧光染料之间的序列特定的相互作用可以通过荧光染料的特定设计来裁制。荧光染料的结构的优化可以改进核苷酸并入的效率、降低测序误差的水平并且减少核酸测序中试剂的使用,并且因此降低核酸测序的成本。
[0010] 本文描述改进的多次甲基构建体和其作为生物分子标记物、特别地作为用于在核酸测序中使用的核苷酸的标记物的用途。可以看到在使用新的荧光构建体可获得的标记的核苷酸并入的效率和测序读取的长度方面的具体改进。
[0011] 根据第一方面,本公开内容提供式(I)的化合物或其内消旋形式:
[0012]
[0013] 其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且
[0014] m是整数0-3;
[0015] n是整数1-5;
[0016] Rf是OH或O-;
[0017] Ra1和Ra2中的每个独立地是H、SO3-、磺酰胺、卤素、或稠合至相邻碳原子的另外的环;其中Ra1或Ra2是磺酰胺或SO3-;并且
[0018] Rc1和Rc2中的每个独立地是烷基或被取代的烷基。
[0019] 在某些实施方案中,其中Ra1或Ra2是SO3-;Rc1或Rc2能够是烷基磺酸基。
[0020] 在另一个实施方案中,本公开内容的化合物可以与多种底物部分例如比如核苷、核苷酸、多核苷酸、多肽、碳水化合物、配体、颗粒、细胞、半固体表面(例如凝胶)以及固体表面轭合。轭合可以经由可以转变成酰胺或酯的羧基CORf进行。
[0021] 因此,根据本公开内容的另外的方面,提供包含连接基以使例如共价附接至此类底物部分成为可能的染料化合物。
[0022] 根据另外的方面,本公开内容提供通过式:N-L-染料定义的核苷化合物或核苷酸化合物,其中N是核苷酸,L是任选的连接基部分并且染料是根据本公开内容的荧光化合物。
[0023] 在另外的方面中,本公开内容提供使用本公开内容的染料化合物测序的方法。
[0024] 根据另外的方面,本公开内容还提供包含染料化合物(游离的或呈轭合物的形式)的试剂盒,所述试剂盒可以被用于各种免疫测定、寡核苷酸与核酸标记以及用于通过合成的DNA测序。在又另一方面中,本公开内容提供包含染料‘组’的试剂盒,该试剂盒特别适合于在自动仪器平台上进行通过合成的测序循环。
[0025] 本公开内容的另外的方面是本公开内容的化合物的化学制备。
[0026] 本公开内容涉及以下项目:
[0027] 项目1.一种式(I)的化合物或其内消旋形式:
[0028]
[0029] 其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且
[0030] m是整数0-3;
[0031] n是整数1-5;
[0032] Rf是OH或O-;
[0033] Ra1和Ra2中的每个独立地是H、SO3-、磺酰胺、卤素、或稠合至相邻碳原子的另外的环;其中Ra1或Ra2是磺酰胺或SO3-;并且
[0034] Rc1和Rc2中的每个独立地是烷基或被取代的烷基;其中当Ra1或Ra2是SO3-时,i)Rc1或Rc2是烷基磺酸基,或ii)Ra1或Ra2是磺酰胺。
[0035] 项目2.根据项目1所述的化合物,其中Ra1是磺酰胺。
[0036] 项目3.根据项目1所述的化合物,其中Ra2是磺酰胺。
[0037] 项目4.根据项目2所述的化合物,其中Ra2是H或SO3-。
[0038] 项目5.根据项目3所述的化合物,其中Ra1是H或SO3-。
[0039] 项目6.根据任一前述项目所述的化合物,其中Rc1或Rc2是甲基、乙基、丙基或-(CH2)qSO3-,其中q是1-6。
[0040] 项目7.根据项目6所述的化合物,其中Rc1或Rc2是-(CH2)4-SO3-。
[0041] 项目8.根据任一前述项目所述的化合物,其中所述磺酰胺是式(II)的结构的一部分:
[0042]
[0043] 其中Rc1是烷基或被取代的烷基。
[0044] 项目9.根据任一前述项目所述的化合物,其中所述磺酰胺是式(III)的结构的一部分:
[0045]
[0046] 其中m是整数0-3,n是整数1-5,Rf是OH或O-;并且Rc2是烷基或被取代的烷基。
[0047] 项目10.根据项目1所述的化合物,所述化合物由式(IV):
[0048]
[0049] 或其盐来表示,其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且
[0050] m是整数0-3;
[0051] n是整数1-5;并且
[0052] Rc1和Rc2中的每个独立地是烷基或被取代的烷基。
[0053] 项目11.根据任一前述项目所述的化合物,其中所述化合物被附接至核苷酸或寡核苷酸。
[0054] 项目12.一种用根据项目1-10中任一项的化合物标记的核苷酸或寡核苷酸。
[0055] 项目13.根据项目12所述的标记的核苷酸或寡核苷酸,其中标记物经由从COOH部分形成的酰胺键来附接。
[0056] 项目14.根据项目12或13所述的标记的核苷酸或寡核苷酸,其中标记物通过连接基部分被附接至嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位。
[0057] 项目15.根据项目12-14中任一项所述的标记的核苷酸或寡核苷酸,还包含共价地附接至所述核苷酸的核糖或脱氧核糖的3’OH阻断基团。
[0058] 项目16.一种试剂盒,包含两种或更多种核苷酸,其中至少一种核苷酸是根据项目12-15中任一项的标记的核苷酸。
[0059] 项目17.根据项目16所述的试剂盒,其中所述标记的核苷酸中的两种使用单激光器来激发。
[0060] 项目18.根据项目17所述的试剂盒,其中四种核苷酸中的第一核苷酸是根据项目12-15中任一项的标记的核苷酸,并且第二核苷酸、第三核苷酸和第四核苷酸各自用不同的化合物来标记,其中每种化合物具有有区别的吸光度最大值,并且化合物中的每种与其他三种化合物是可区别的。
[0061] 项目19.根据项目18所述的试剂盒,其中四种核苷酸的第一核苷酸是用根据项目7-10中任一项的化合物标记的核苷酸,并且化合物中的两种具有低于600nm的有区别的吸光度最大值。
[0062] 项目20.根据项目12-15中任一项的核苷酸、根据项目12-15中任一项的寡核苷酸或根据项目16-19中任一项的试剂盒在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定中的用途。
[0063] 项目21.根据项目20所述的用途,在自动测序仪器上进行,其中所述自动测序仪器包括在不同的波长下操作的两种激光器。
[0064] 项目22.一种合成根据项目1-10中任一项的化合物的方法,所述方法利用以下起始材料中的一种:
[0065]
[0066]
[0067] 或其盐,其中Ra是H、SO3-、磺酰胺、卤素或稠合至相邻碳原子的另外的环;R1、R2、R3和R4独立地是H、烷基或芳基;Rc是烷基或被取代的烷基;Ar是芳香族基团并且R是烷基。
[0068] 项目23.一种合成根据项目1-10中任一项的化合物的方法,所述方法利用以下起始材料中的一种:
[0069]
[0070]
[0071] 或其盐,其中n是整数1-5;Rc2是烷基或被取代的烷基;Ar是芳香族基团并且R是烷基。

具体实施方式

[0072] 本公开内容提供新颖的化合物,其特别地适合于荧光检测和通过合成的测序的方法。相比于N-烷基类似物,具有吲哚N-苯基部分的化合物在荧光强度、光稳定性方面是有利的并且因此改进某些核酸测序应用。
[0073] 根据第一方面,本公开内容提供式(I)的化合物或其内消旋形式:
[0074]
[0075] 其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且
[0076] m是整数0-3;
[0077] n是整数1-5;
[0078] Rf是OH或O-;
[0079] Ra1和Ra2中的每个独立地是H、SO3-、磺酰胺、卤素、或稠合至相邻碳原子的另外的环;其中Ra1或Ra2是磺酰胺或SO3-;并且
[0080] Rc1和Rc2中的每个独立地是烷基或被取代的烷基;其中当Ra1或Ra2是SO3-时,i)Rc1或Rc2是烷基磺酸基,或ii)Ra1或Ra2是磺酰胺。
[0081] 本发明的可选择的方面提供式(I)的化合物或其内消旋形式:
[0082]
[0083] 其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且
[0084] m是整数0-3;
[0085] n是整数1-5;
[0086] Rf是OH或O-;
[0087] Ra1和Ra2中的每个独立地是H、SO3-、磺酰胺、卤素、或稠合至相邻碳原子的另外的环;其中Ra1或Ra2是磺酰胺或SO3-;并且
[0088] Rc1和Rc2中的每个独立地是烷基或被取代的烷基;其中当Ra1或Ra2是SO3-时,Rc1或Rc2是烷基磺酸基。
[0089] 可选择的方面,本公开内容提供式(I)的化合物或其内消旋形式:
[0090]
[0091] 其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且
[0092] m是整数0-3;
[0093] n是整数1-5;
[0094] Rf是OH或O-或其酯轭合物或酰胺轭合物;
[0095] Ra1和Ra2中的每个独立地是H、SO3-、磺酰胺、卤素、或稠合至相邻碳原子的另外的环;其中Ra1或Ra2是磺酰胺;并且
[0096] Rc1和Rc2中的每个独立地是烷基或被取代的烷基。
[0097] 该分子在位置Ra处可以包含一个或更多个磺酰胺部分或SO3-部分。Ra1和/或Ra2可以是磺酰胺。其他Ra(Ra1或Ra2)可以独立地是H、SO3-、磺酰胺、卤素、或稠合至相邻碳原子的另外的环。Ra1或Ra2可以是H。Ra1或Ra2可以是SO3-。Ra1可以不同于Ra2,例如该结构可以在Ra1处具有单个磺酰胺基团,并且H作为Ra2。Ra1和Ra2两者均可以是磺酰胺。磺酰胺可以是SO2NH2或SO2NHR,其中R是烷基、被取代的烷基、芳基或被取代的芳基。
[0098] Ra1或Ra2可以是稠合至吲哚环的相邻碳的另外的脂肪族环、芳香族环或杂环。例如,在此类情况下,当芳香族环被稠合时,染料端基可以代表以下类型的结构:
[0099]
[0100] 其中Rd可以是H、烷基、被取代的烷基、芳基、被取代的芳基、卤素、羧基、磺酰胺、或磺酸。
[0101] 因此,本公开内容的染料可以通过式(1A)或式(IB)来描述:
[0102]
[0103] 其中
[0104] m是整数0-3;
[0105] n是整数1-5;
[0106] Rf是OH或O-;
[0107] Rd是H、烷基、被取代的烷基、芳基、被取代的芳基、卤素、羧基、磺酰胺、或磺酸;并且
[0108] Rc1和Rc2中的每个独立地是烷基或被取代的烷基;其中Rc1或Rc2是烷基磺酸基。
[0109] 在式(IA)或式(IB)中,稠合至吲哚环的相邻碳原子的另外的环可以任选地被例如磺酸或磺酰胺取代。
[0110] 化合物可以是,其中磺酰胺是式(II)的结构的一部分:
[0111]
[0112] 其中Rc1是烷基或被取代的烷基。
[0113] 化合物可以是,其中磺酰胺是式(III)的结构的一部分:
[0114]
[0115] 其中m是整数0-3,n是整数1-5,Rf是OH或O-;并且Rc2是烷基或被取代的烷基。
[0116] CORf羧基或其衍生物通过长度n的烷基链附接至吲哚氮原子,其中n是1-5个碳原子或杂原子。链可以是(CH2)n,其中n是1-5。基团可以是(CH2)5COOH。
[0117] 该分子在位置Rc处可以包含一个或更多个烷基磺酸盐部分。Rc1和/或Rc2可以是烷基-SO3-。其他Rc(Rc1或Rc2)可以独立地是烷基或被取代的烷基。Rc1和Rc2可以是甲基、乙基、丙基、丁基、戊基、己基或(CH2)qSO3H,其中q是1-6。q可以是1-4。q可以是4。Rc1和Rc2可以是被取代的烷基。Rc1和Rc2可以包含COOH或-SO3H部分或其酯衍生物或酰胺衍生物。
[0118] 在某些实施方案中,当Ra1或Ra2中的一个是SO3-并且Ra1或Ra2中的另一个是H或SO3-时,Rc1或Rc2必须是烷基磺酸基。如果需要,可以从某些权利要求中放弃其中Ra1或Ra2中的一个是SO3-,并且Ra1或Ra2中的另一个是H或SO3-并且Rc1和Rc2是甲基的化合物。出版物WO2013041117公开了某些化合物,其中Ra1是H或SO3-,Ra2是SO3-并且Rc1和Rc2是甲基。此出版物没有公开其中Rc是烷基磺酸基的分子。此出版物没有公开其中Ra是磺酰胺的分子。
[0119] COOH基团可以充当用于进一步附接至另外的分子的连接部分或被连接至另外的分子。在已经发生轭合之后,COOH或COO-可以转变成酰胺或酯。
[0120] 化合物的实例包括根据式(IV)的结构:
[0121]
[0122] 或其盐,其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且[0123] m是整数0-3;
[0124] n是整数1-5;并且
[0125] Rc1和Rc2中的每个独立地是烷基或被取代的烷基。
[0126] 化合物的另外的实例包括根据式(IVa)至式(IVd)的结构:
[0127]
[0128]
[0129] 或其盐,其中mCat+或mAn-是有机或无机的带正电荷/带负电荷的反离子,并且[0130] m是整数0-3;
[0131] n是整数1-5;并且
[0132] q是从1-6的整数。
[0133] 特别有用的化合物是用如本文描述的染料标记的核苷酸或寡核苷酸。
[0134] 标记的核苷酸或寡核苷酸可以具有经由烷基羧基附接至吲哚的氮原子以形成酰胺的标记物。标记的核苷酸或寡核苷酸可以具有通过连接基部分附接至嘧啶碱基的C5位或7-脱氮嘌呤碱基(7-deaza purine base)的C7位的标记物。
[0135] 标记的核苷酸或寡核苷酸还可以具有共价地附接至核苷酸的核糖或脱氧核糖的阻断基团(blocking group)。阻断基团可以在核糖或脱氧核糖的任何位置处被附接。在特定的实施方案中,阻断基团在核苷酸的核糖或脱氧核糖的3’OH位。
[0136] 本文提供包含两种或更多种核苷酸的试剂盒,其中至少一种核苷酸是用本公开内容的化合物标记的核苷酸。试剂盒可以包含两种或更多种标记的核苷酸。核苷酸可以用两种或更多种荧光标记物来标记。可以使用单激发源激发标记物中的两种或更多种,所述单激发源可以是激光器。例如,两种或更多种标记物的激发带可以是至少部分重叠的,使得在光谱的重叠区中的激发引起两种标记物均发射荧光。在特定的实施方案中,来自两种或更多种标记物的发射将在光谱的不同区域中发生,使得标记物中的至少一种的存在可以通过光学地区别该发射而确定。
[0137] 试剂盒可以包含四种标记的核苷酸,其中四种核苷酸中的第一核苷酸用如本文公开的化合物标记。在这样的试剂盒中,第二核苷酸、第三核苷酸和第四核苷酸可以各自用任选地不同于第一核苷酸上的标记物且任选地不同于彼此上的标记物的化合物标记。因此,化合物中的一种或更多种可以具有有区别的吸光度最大值和/或发射最大值,使得该化合物与其他化合物是可区别的。例如,每种化合物可以具有有区别的吸光度最大值和/或发射最大值,使得化合物中的每种与其他三种化合物是可区别的。将理解的是,除了最大值之外的吸光度光谱和/或发射光谱的部分可以不同并且这些差异可以被利用以区别化合物。试剂盒可以为使得化合物中的两种或更多种具有高于600nm的有区别的吸光度最大值。本发明的化合物典型地吸收在高于640nm的区域中的光。
[0138] 本文陈述的化合物、核苷酸或试剂盒可以被用于检测、测量或确定生物系统(包括,例如其过程或其组分)。可以采用化合物、核苷酸或试剂盒的示例性技术包括测序、表达分析、杂交分析、基因分析、RNA分析、细胞测定(例如,细胞结合或细胞功能分析)或蛋白质测定(例如,蛋白质结合测定或蛋白质活性测定)。用途可以是在用于进行特定技术的自动仪器上进行,例如自动测序仪器。测序仪器可以包括在不同的波长下操作的两种激光器。
[0139] 本文公开合成本公开内容的化合物的方法。式(X)和/或式(X1)、式(X2)的化合物或其盐可以被用作用于合成对称的或不对称的多次甲基染料的起始材料:
[0140]
[0141] 或其盐,其中Ra是H、SO3-、磺酰胺、卤素或稠合至相邻碳原子的另外的环;R1、R2、R3和R4独立地是H、烷基或芳基;Rc2是烷基或被取代的烷基;Ar是芳香族基团并且R是烷基。
[0142] 本文公开合成本公开内容的化合物的方法。式(X3)、式(X4)或式(X5)的化合物或其盐可以被用作用于合成对称的或不对称的多次甲基染料的起始材料:
[0143]
[0144] 或其盐,其中n是整数1-5;Rc2是烷基或被取代的烷基;Ar是芳香族基团并且R是烷基。
[0145] 如本文所使用的,术语“烷基”指的是C1-C20烃并且可以包括C3-C10非芳香族的碳环。在特定的实施方案中,烷基是C1-C6烷基,所述C1-C6烷基指的是分别包含一个和六个之间的碳原子的饱和的、直链的或支链的烃基。烷基可以包含一个或更多个不饱和的基团,并且因此包括烯基和炔基。
[0146] 如本文所使用的术语“卤素”指的是氟-(下文中指定为F)、氯-(下文中指定为Cl)、溴-(下文中指定为Br)或碘-(下文中指定为I),并且通常涉及有机化合物中氢原子的取代,此取代任选地是氢的完全取代。
[0147] 术语“被取代的烷基”,指的是如上文定义的烷基、烯基或炔基,其中它们可以任选地被(但不限于)卤素、氰基、SO3-、SRa、ORa、NRbRc、氧代、CONRbRc、COOH以及COORb进一步取代。Ra、Rb和Rc可以各自独立地选自:H、烷基、被取代的烷基、烯基、被取代的烯基、炔基、被取代的炔基、芳基以及被取代的芳基。另外,所述被取代的烷基、被取代的烯基和被取代的炔基可以任选地通过选自:O、NRb、S(O)t(其中t是0至2)以及类似物的至少一个杂原子或基团来中断。被取代的烷基还覆盖比如苄基的基团,其中烷基包含另外的芳基或被取代的芳基部分。
[0148] 根据本公开内容的染料可以从包括N-苯基吲哚的多种不同的起始材料合成。染料可以被对称地制备,使得相同的吲哚在三次甲基链的两端;或被不对称地制备,使得不同的吲哚在发色团的任一端。用于制备多次甲基染料的方法是本领域熟知的。
[0149] 根据本公开内容的方面,提供适合于附接至底物部分的染料化合物,所述染料化合物特别地包含能够附接至底物部分的连接基。实际上,底物部分可以是本公开内容的染料可以被轭合至的任何分子或物质,并且通过非限制性实例的方式,底物部分可以包括核苷、核苷酸、多核苷酸、碳水化合物、配体、颗粒、固体表面、有机的和无机的聚合物、染色体、细胞核、活细胞以及其组合或集合物。染料可以通过包括疏水吸引力、离子吸引力和共价附接的多种手段被任选的连接基轭合。特别地,染料通过共价附接被轭合至底物。更特别地,共价附接借助于连接基。
[0150] 染料化合物至底物的轭合可以经由可以转变成酰胺或酯的羧基CORf进行。
[0151] 根据本公开内容的染料可以在取代位置中的一个处包含反应性连接基,用于染料至另一个分子的共价附接。反应性连接基是能够形成键(例如,共价键或非共价键)的部分。在特定的实施方案中,连接基可以是可裂解的连接基。术语“可裂解的连接基”的使用不意指意味着整个连接基需要被除去。裂解位点可以位于导致连接基的一部分在裂解之后保持附接至染料和/或底物部分的连接基上的位置处。通过非限制性实例的方式,可裂解的连接基可以是亲电性可裂解的连接基、酶促可裂解的连接基、亲核性可裂解的连接基、光可裂解的连接基、在还原条件(例如包含二硫化物或叠氮化物的连接基)、氧化条件下可裂解的、经由保险栓(safety-catch)连接基的使用可裂解的以及通过消除机制可裂解的。使用可裂解的连接基以将染料化合物附接至底物部分提供除去标记物的选择,例如在检测之后,从而避免下游步骤中的任何干扰信号。
[0152] 可以在PCT公布号WO2004/018493(通过引用并入本文)中发现有用的连接基,所述连接基的实例包括可以使用水溶性膦或由过渡金属和至少部分地水溶性配体形成的水溶性过渡金属催化剂裂解的连接基。在水溶液中,后者形成至少部分地水溶性的过渡金属络合物。此类可裂解的连接基可以被用于将核苷酸的碱基连接至标记物,例如本文陈述的染料。
[0153] 可以在PCT公布号WO2004/018493(通过引用并入本文)中发现特别的连接基,例如包含下式的部分的那些连接基:
[0154]
[0155](其中X选自包括O、S、NH和NQ的基团,其中Q是C1-10被取代的或未被取代的烷基,Y选自包括O、S、NH和N(烯丙基)的基团,T是氢或C1-C10被取代的或未被取代的烷基并且*指示该部分被连接至核苷酸或核苷的剩余部分)。
[0156] 在特定的实施方案中,相比于通过本领域已知的其他连接附接至鸟嘌呤碱基的相同的荧光团,荧光染料(荧光团)和鸟嘌呤碱基之间的连接基的长度可以例如通过引入聚乙二醇间隔基来改变,从而增加荧光强度。示例性连接基和其性质被陈述在公布为WO07020457的英国专利申请第0517097.2号(通过引用并入本文)中。连接基的设计以及尤其其增加的长度可以允许附接至鸟苷核苷酸的鸟嘌呤碱基的荧光团在被并入多核苷酸例如DNA中时的亮度的改进。因此,当染料用于在采用附接至包含鸟嘌呤的核苷酸的荧光染料标记物的检测的任何分析方法中时,使用具有式-((CH2)2O)n-的间隔基的连接基可以是有利的,其中n是2和50之间的整数,例如,如在WO07020457中所描述。
[0157] 本公开内容还提供用本文陈述的染料中的一种或更多种标记的核苷和核苷酸的轭合物(改性的核苷酸)。标记的核苷和核苷酸对于标记通过酶促合成形成的多核苷酸是有用的,例如,通过非限制性实例的方式,在PCR扩增、等温扩增、固相扩增、多核苷酸测序(例如固相测序)、切口平移反应及类似过程中。
[0158] 核苷和核苷酸可以在糖或核碱基上的位点处被标记。如本领域已知的,“核苷酸”由含氮碱基、糖和一个或更多个磷酸酯基组成。在RNA中,糖是核糖并且在DNA中糖是脱氧核糖,即缺少存在于核糖中的羟基的糖。含氮碱基是嘌呤或嘧啶的衍生物。嘌呤可以是腺嘌呤(A)或鸟嘌呤(G),并且嘧啶可以是胞嘧啶(C)、胸腺嘧啶(T),或在RNA的情形下是尿嘧啶(U)。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9结合。核苷酸还是核苷的磷酸酯,在附接至糖的C-3或C-5的羟基上发生酯化。核苷酸通常是一磷酸酯、二磷酸酯或三磷酸酯。
[0159] “核苷”在结构上与核苷酸类似但没有磷酸酯部分。核苷类似物的实例将是其中标记物被连接至碱基并且不存在附接至糖分子的磷酸酯基的核苷。
[0160] 虽然碱基通常被称为嘌呤或嘧啶,但技术人员将理解,不改变核苷酸或核苷经历沃森-克里克碱基配对(Watson-Crick base pairing)的能力的衍生物和类似物是可用的。“衍生物”或“类似物”意指芯结构与母体化合物的芯结构相同或非常相似但具有化学改性或物理改性(例如比如允许衍生的核苷酸或核苷被连接至另一个分子的不同的或另外的侧基)的化合物或分子。例如,碱基可以是脱氮嘌呤。在特定的实施方案中,衍生物能够经历沃森-克里克配对。“衍生物”和“类似物”还包括例如具有改性的碱基部分和/或改性的糖部分的合成的核苷酸衍生物或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley&Son,1980)和Uhlman等人Chemical Reviews 90:543-584,1990中被讨论。核苷酸类似物还可以具有改性的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基磷酸酯键、磷苯酰胺键(phosphoranilidate linkage)、磷酰胺键及类似键。
[0161] 染料可以例如通过连接基附接至核苷酸碱基上的任何位置。在特定的实施方案中,对于所产生的类似物,沃森-克里克碱基配对仍然可以进行。特别的核碱基标记位点包括嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位。如上文所描述的,连接基可以被用于将染料共价地附接至核苷或核苷酸。
[0162] 在特定的实施方案中,标记的核苷或核苷酸可以是酶促地可并入的和酶促地可延伸的。因此,连接基部分可以具有充分的长度以将核苷酸连接至化合物,使得该化合物不明显地干扰核苷酸通过核酸复制酶的总结合和识别。因此,连接基还可以包含间隔基单元。例如,间隔基使核苷酸碱基远离裂解位点或标记物。
[0163] 用本公开内容的染料标记的核苷或核苷酸可以具有下式:
[0164]
[0165] 其中染料是根据本公开内容的染料化合物,B是核碱基,例如比如尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤、鸟嘌呤及类似物,并且L是可以存在或可以不存在的任选的连接基。R’可以是H、一磷酸酯、二磷酸酯、三磷酸酯、硫代磷酸酯、磷酸酯类似物、附接至反应性含磷基团的-O-或被阻断基团保护的-O-。R”可以是H、OH、亚磷酰胺或3'OH阻断基团并且R”’是H或OH。
[0166] 在R”是亚磷酰胺的情况下,R’是酸可裂解的羟基保护基,所述酸可裂解的羟基保护基允许在自动合成条件下的随后的单体偶联。
[0167] 在特定的实施方案中,阻断基团是单独的并且独立于染料化合物,即不直接附接至染料化合物。在可选择的实施方案中,染料可以包含3'OH阻断基团的全部或一部分。因此,R”可以是可以包含或可以不包含本文公开的染料化合物的3'OH阻断基团。
[0168] 在还另一可选择的实施方案中,在戊糖的3'碳上不存在阻断基团,并且例如,附接至碱基的染料(或染料构建体和连接基构建体)可以具有足以充当另外的核苷酸的并入的阻断物的大小或结构。因此,阻断可以是由于立体位阻或可以是由于大小、电荷和结构的组合,无论染料是否被附接至糖的3'位。
[0169] 在还另一可选择的实施方案中,阻断基团存在于戊糖的2'碳或4'碳上并且可以具有足以充当另外的核苷酸的并入的阻断物的大小或结构。当改性的核苷酸被并入时,阻断基团的使用允许聚合例如通过终止延伸来控制。如果阻断作用例如通过非限制性实例的方式通过改变化学条件或通过除去化学阻断物是可逆的,那么延伸可以在某些点停止并且然后允许继续。
[0170] 在另一个特定的实施方案中,3'OH阻断基团将包含WO2004/018497(通过引用并入本文)中公开的部分。例如,阻断基团可以是叠氮甲基(CH2N3)或烯丙基。
[0171] 在特定的实施方案中,连接基(染料和核苷酸之间)和阻断基团两者均存在并且是单独的部分。在特定的实施方案中,连接基和阻断基团两者在大体上类似的条件下是可裂解的。因此,脱保护和脱阻断过程可以是更有效的,因为将仅需要单次处理来除去染料化合物和阻断物两者。然而,在某些实施方案中,连接基和阻断基团不需要是在类似的条件下可裂解的,而在有区别的条件下是单独地可裂解的。
[0172] 本公开内容还涵盖并入染料化合物的多核苷酸。此类多核苷酸可以是分别包含以磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的DNA或RNA。根据本公开内容的多核苷酸可以包括与本文陈述的至少一种改性的核苷酸(例如用染料化合物标记的)组合的天然存在的核苷酸、不同于本公开内容的改性的核苷酸的非天然存在的(或改性的)核苷酸或其任何组合。根据本公开内容的多核苷酸还可以包括非天然骨架连接和/或非核苷酸化学改性。还预期包括包含根据本公开内容的至少一种改性的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物的嵌合结构。
[0173] 包含根据本公开内容的染料化合物的改性的核苷酸(或核苷)可以在任何分析方法中被使用,例如包括检测附接至核苷酸或核苷的荧光标记物(无论以其自身或并入较大分子结构或轭合物中或与较大分子结构或轭合物缔合)的方法。在本上下文中,术语“并入多核苷酸中”可以意指,5'磷酸酯以磷酸二酯键连接至自身可以形成较长多核苷酸链的一部分的第二(改性的或未改性的)核苷酸的3'羟基。本文陈述的改性的核苷酸的3'末端可以或可以不以磷酸二酯键连接至另外的(改性的或未改性的)核苷酸的5'磷酸酯。因此,在一个非限制性实施方案中,本公开内容提供检测并入到多核苷酸中的改性的核苷酸的方法,所述方法包括:(a)将本公开内容的至少一种改性的核苷酸并入到多核苷酸中,以及(b)通过检测来自附接至所述改性的核苷酸的染料化合物的荧光信号而检测并入到多核苷酸中的改性的核苷酸。
[0174] 此方法可以包括:合成步骤(a),其中将根据本公开内容的一种或更多种改性的核苷酸并入到多核苷酸中;以及检测步骤(b),其中并入到多核苷酸中的一种或更多种改性的核苷酸通过检测或定量地测量它们的荧光来检测。
[0175] 在本公开内容的一个实施方案中,至少一种改性的核苷酸在合成步骤中通过聚合酶的作用并入到多核苷酸中。然而,可以使用将改性的核苷酸连接至多核苷酸的其他方法,例如比如,化学寡核苷酸合成或标记的寡核苷酸与未标记的寡核苷酸的连接。因此,当关于核苷酸和多核苷酸使用时,术语“并入”可以涵盖通过化学方法以及酶促方法的多核苷酸合成。
[0176] 在特定的实施方案中,合成步骤被进行并且可以任选地包括用包含本公开内容的荧光标记的改性的核苷酸的反应混合物温育模板多核苷酸链。还可以在以下条件下提供聚合酶,所述条件允许在退火为模板多核苷酸链的多核苷酸链上的游离3'羟基和改性的核苷酸上的5'磷酸酯基之间形成磷酸二酯键。因此,合成步骤可以包括如通过核苷酸与模板链的互补的碱基配对引导的多核苷酸链的形成。
[0177] 在本方法的所有实施方案中,在将改性的核苷酸并入到其中的多核苷酸链被退火成模板链的同时,或在其中使两种链分开的变性步骤之后,可以进行检测步骤。另外的步骤,例如化学反应步骤或酶促反应步骤或纯化步骤可以被包括在合成步骤和检测步骤之间。特别地,并入改性的核苷酸的靶链(target strand)可以被分离或纯化并且然后被进一步加工或在随后的分析中被使用。通过实例的方式,在合成步骤中用改性的核苷酸标记的靶多核苷酸可以随后被用作标记的探针或引物。在其他实施方案中,本文陈述的合成步骤的产物可以经受另外的反应步骤,并且如果需要,这些随后步骤的产物可以被纯化或分离。
[0178] 用于合成步骤的合适的条件对于熟悉标准分子生物学技术的人员将是熟知的。在一个实施方案中,合成步骤可以类似于标准引物延伸反应,使用包括本文陈述的改性的核苷酸的核苷酸前体,以在合适的聚合酶的存在下形成与模板链互补的延伸的靶链。在其他实施方案中,合成步骤本身可以形成产生标记的双链的扩增产物的扩增反应的一部分,所述标记的双链的扩增产物包括源自靶多核苷酸链和模板多核苷酸链的复制的退火的互补链。其他示例性合成步骤包括切口平移、链置换聚合、随机引导的DNA标记(random primed DNA labelling)等等。用于合成步骤的特别有用的聚合酶是能够催化本文陈述的改性的核苷酸中的一种或更多种的并入的聚合酶。可以使用多种天然存在的或改性的聚合酶。通过实例的方式,热稳定聚合酶可以被用于使用热循环条件进行的合成反应,然而热稳定聚合酶对于等温引物延伸反应可能不是期望的。能够并入根据本公开内容的改性的核苷酸中的合适的热稳定聚合酶包括在WO 2005/024010或WO06120433(其各自通过引用并入本文)中描述的那些。在于较低温度例如37℃下进行的合成反应中,聚合酶不一定需要是热稳定聚合酶,因此聚合酶的选择将取决于许多因素,例如反应温度、pH、链置换活性以及类似因素。
[0179] 在特定的非限制性实施方案中,本公开内容涵盖核酸测序、再测序、全基因组测序、单核苷酸多态性评分的方法、或包括当并入到多核苷酸中时检测用本文陈述的染料标记的改性的核苷酸或核苷的任何其他应用。受益于用包含荧光染料的改性的核苷酸标记的多核苷酸的使用的多种其他应用中的任一种可以使用用本文陈述的染料标记的改性的核苷酸或核苷。
[0180] 在特定的实施方案中,本公开内容提供包含根据本公开内容的染料化合物的改性的核苷酸在通过合成反应的多核苷酸测序中的用途。通过合成测序一般包括使用聚合酶或连接酶在5’至3’方向上将一种或更多种核苷酸或寡核苷酸相继添加至生长的多核苷酸链,以便形成与待被测序的模板核酸互补的延伸的多核苷酸链。存在于添加的核苷酸中的一种或更多种中的碱基的同一性可以在检测步骤或“成像”步骤中被确定。添加的碱基的同一性可以在每个核苷酸并入步骤之后被确定。然后,模板的序列可以使用常规的沃森-克里克碱基配对法则来推论。例如,在单核苷酸多态性的评分中,使用用本文陈述的染料标记的改性的核苷酸用于确定单碱基的同一性可以是有用的,并且此类单碱基延伸反应在本公开内容的范围内。
[0181] 在本公开内容的实施方案中,通过经由检测附接至并入的核苷酸的荧光标记物来检测将一种或更多种核苷酸并入到与待被测序的模板多核苷酸互补的新生链中,从而确定模板多核苷酸的序列。模板多核苷酸的测序可以用合适的引物来引发(或被制备为将包含作为发夹的部分的引物的发夹构建体),并且新生链通过在聚合酶催化的反应中将核苷酸添加至引物的3'末端以逐步方式延伸。
[0182] 在特定的实施方案中,不同的核苷酸三磷酸酯(A、T、G和C)中的每个可以用独特的荧光团来标记并且还包含在3’位的阻断基团以阻止不受控制的聚合。可选择地,四种核苷酸中的一种可以是未被标记(深色的)。聚合酶使核苷酸并入与模板多核苷酸互补的新生链中,并且阻断基团阻止核苷酸的进一步并入。任何未并入的核苷酸可以被洗去,并且来自每个并入的核苷酸的荧光信号可以通过合适的手段例如使用激光器激发和合适的发射滤光器的电荷耦合装置被光学地“读取”。然后,可以除去(脱保护)3'阻断基团和荧光染料化合物(同时地或相继地),以暴露新生链用于进一步的核苷酸并入。通常,并入的核苷酸的同一性将在每个并入步骤之后被确定,但这不是严格地必要的。类似地,美国专利第5,302,509号(其通过引用并入本文)公开测序固定在固体支撑体上的多核苷酸的方法。
[0183] 如上文所示例,该方法利用在DNA聚合酶的存在下将荧光标记的、3'阻断的核苷酸A、G、C和T并入到与固定的多核苷酸互补的生长的链中。聚合酶并入与靶多核苷酸互补的碱基,但通过3’-阻断基团来阻止进一步的添加。然后,并入的核苷酸的标记物可以被确定并且阻断基团通过化学裂解除去以允许进一步的聚合发生。在通过合成反应的测序中待被测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板将典型地包含具有游离的3’羟基的双链区,所述游离的3’羟基在测序反应中充当用于另外的核苷酸的添加的引物或起始点。待被测序的模板的区域将使此游离的3’羟基悬垂于互补链上。待被测序的模板的悬垂区域可以是单链的,但可以是双链的,条件是,“切口存在”于与待被测序的模板链互补的链上以提供用于引发测序反应的游离的3’OH基团。在此类实施方案中,测序可以通过链置换进行。在某些实施方案中,具有游离的3’羟基的引物可以作为与待被测序的模板的单链区杂交的单独组分(例如,短寡核苷酸)被添加。可选择地,引物和待被测序的模板链可以各自形成能够形成分子内双链体(duplex)例如比如发夹环结构的部分地自补的核酸链的一部分。发夹多核苷酸和发夹多核苷酸可以通过其附接至固体支撑体的方法在国际申请公布第WO0157248号和第WO 2005/047301号(其各自通过引用并入本文)中被公开。核苷酸可以连续地添加至生长的引物,导致多核苷酸链在5'至3'方向上的合成。已经被添加的碱基的性质可以特别地但不一定地在每次核苷酸添加之后被确定,因此为核酸模板提供序列信息。因此,通过经由与核苷酸的5'磷酸酯基形成磷酸二酯键而将核苷酸连接至核酸链的游离3'羟基,将核苷酸并入到核酸链(或多核苷酸)中。
[0184] 待被测序的核酸模板可以是DNA或RNA,或甚至是包括脱氧核苷酸和核糖核苷酸的杂交分子。核酸模板可以包含天然存在的和/或非天然存在的核苷酸以及天然的或非天然的骨架连接,条件是这些不阻止测序反应中的模板的复制。
[0185] 在某些实施方案中,待被测序的核酸模板可以经由本领域已知的任何合适的连接方法例如经由共价附接附接至固体支撑体。在某些实施方案中,模板多核苷酸可以直接地附接至固体支撑体(例如基于二氧化硅的支撑体)。然而,在本公开内容的其他实施方案中,固体支撑体的表面可以以某种方式来改性,以便允许模板多核苷酸的直接共价附接,或以便通过自身可以非共价地附接至固体支撑体的水凝胶或聚合电解质多层固定模板多核苷酸。
[0186] 其中多核苷酸已经被直接地附接至基于二氧化硅的支撑体的阵列是例如在WO00006770(通过引用并入本文)中公开的阵列,其中多核苷酸通过玻璃上的下垂环氧基与多核苷酸上的内部氨基之间的反应来固定在玻璃支撑体上。此外,多核苷酸可以通过基于硫的亲核试剂与固体支撑体的反应来附接至固体支撑体,例如,如在WO2005/047301(通过引用并入本文)中描述的。固体支撑的模板多核苷酸的还另外的实例是其中模板多核苷酸被附接至被支撑在基于二氧化硅的或其他的固体支撑体上的水凝胶,例如,如在WO00/31148、WO01/01143、WO02/12566、WO03/014392、美国专利第6,465,178号和第WO00/53812号中描述的,这些专利中的每个通过引用并入本文。
[0187] 模板多核苷酸可以被固定至的特定的表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶在上文引用的参考文献中和在WO2005/065814(其通过引用并入本文)中被描述。
[0188] DNA模板分子可以被附接至珠或微颗粒,例如,如在美国专利第6,172,218号(其通过引用并入本文)中描述的。附接至珠或微颗粒对于测序应用可以是有用的。珠库可以被制备,其中每个珠包含不同的DNA序列。示例性库和用于其产生的方法在Nature.437,376-380(2005);Science.309,5741,1728-1732(2005)(其各自通用引用并入本文)中被描述。使用本文陈述的核苷酸的此类珠的阵列的测序在本公开内容的范围内。
[0189] 待被测序的模板可以形成在固体支撑体上的“阵列”的一部分,在此情况下,阵列可以采取任何便利的形式。因此,本公开内容的方法对于所有类型的高密度阵列,包括单分子阵列、成簇的阵列和珠阵列是可应用。用本公开内容的染料化合物标记的改性的核苷酸可以被用于测序在本质上任何类型的阵列(包括但不限于通过使核酸分子固定在固体支撑体上形成的阵列)上的模板。
[0190] 然而,用本公开内容的染料化合物标记的改性的核苷酸在测序成簇的阵列的上下文中是特别有利的。在成簇的阵列中,阵列上有区别的区域(常称为位点或特征)包含多个多核苷酸模板分子。通常,多个多核苷酸分子通过光学手段单独地不是可分辨的并且代替地作为总体被检测。取决于阵列如何形成,阵列上的每个位点可以包含一个单独的多核苷酸分子的多个拷贝(例如,位点对于特别的单链核酸物种或双链核酸物种是同质的)或甚至小数目的不同的多核苷酸分子的多个拷贝(例如,两个不同的核酸物种的多个拷贝)。核酸分子的成簇的阵列可以使用本领域通常已知的技术来产生。通过实例的方式,WO 98/44151和WO00/18957(其各自被并入本文)描述了核酸扩增的方法,其中模板和扩增产物两者均保持固定在固体支撑体上,以便形成包括固定的核酸分子的簇或“集群”的阵列。存在于根据这些方法制备的成簇的阵列上的核酸分子是用于使用用本公开内容的染料化合物标记的改性的核苷酸测序的合适的模板。
[0191] 用本公开内容的染料化合物标记的改性的核苷酸在测序单分子阵列上的模板中也是有用的。如本文所使用的术语“单分子阵列”或“SMA”指的是分布(或排列)在固体支撑体上的多核苷酸分子的群体,其中任何单独的多核苷酸与群体中的所有其他多核苷酸的间距是这样的:使得单独地分辨单独的多核苷酸分子是可能的。因此,在某些实施方案中,固定至固体支撑体的表面上的靶核酸分子可以能够通过光学手段来分辨。这意指一个或更多个有区别的信号(各自代表一种多核苷酸)将出现在所使用的特定成像装置的可分辨区域内。
[0192] 可以实现单分子检测,其中阵列上相邻的多核苷酸分子之间的间距是至少100nm,更特别地至少250nm,还更特别地至少300nm,甚至更特别地至少350nm。因此,每个分子作为单分子荧光点是单独地可分辨的且可检测的,并且来自所述单分子荧光点的荧光还呈现单步光漂白。
[0193] 本文使用术语“单独地分辨(individually resolved)”和“单独分辨(individual resolution)”来说明,当可视化时,使阵列上的一个分子与其邻近的分子相区别是可能的。阵列上的单独分子之间的分离将部分地通过用于分辨单独分子的特别的技术来确定。单分子阵列的一般特征将通过参考公布的申请WO00/06770和WO 01/57248来理解,其各自通过引用并入本文。虽然本公开内容的改性的核苷酸的一种用途是在通过合成反应测序中,但改性的核苷酸的用途不限于此类方法。事实上,核苷酸可以有利地用于需要检测附接至并入到多核苷酸中的核苷酸的荧光标记物的任何测序方法中。
[0194] 特别地,用本公开内容的染料化合物标记的改性的核苷酸可以被用于自动荧光测序方案,特别是基于Sanger和合作者的链终止测序方法的荧光染料终止子循环测序。这类方法通常使用酶和循环测序以将荧光标记的双脱氧核苷酸并入引物延伸测序反应中。所谓的Sanger测序方法以及有关的方案(Sanger型)利用以标记的双脱氧核苷酸的随机化链终止。
[0195] 因此,本公开内容还涵盖用染料化合物标记的改性的核苷酸,所述改性的核苷酸是在3'位和2'位两处均缺少羟基的双脱氧核苷酸,此类改性的双脱氧核苷酸适合用于Sanger型测序方法以及类似方法中。
[0196] 将认识到的是,并入3'阻断基团的用本公开内容的染料化合物标记的改性的核苷酸还可以在Sanger法和有关的方案中具有用途,因为通过使用改性的双脱氧核苷酸实现的相同的效果可以通过使用具有3'-OH阻断基团的改性的核苷酸来实现:两者均阻止随后核苷酸的并入。在根据本公开内容的且具有3'阻断基团的核苷酸将被用于Sanger型测序方法的情况下,将理解的是,附接至核苷酸的染料化合物或可检测的标记物不需要经由可裂解的连接基来连接,因为在本公开内容的标记的核苷酸被并入的每种情形下;核苷酸不需要被随后并入并且因此标记物不需要从核苷酸中被除去。
[0197] 本公开内容还提供包含用染料标记的改性的核苷和/或核苷酸的试剂盒。此类试剂盒将通常包含用本文陈述的染料标记的至少一种改性的核苷酸或核苷连同至少一种另外的组分。另外的组分可以是在上文陈述的方法中或在下文实施例部分中确定的组分中的一种或更多种。下文陈述可以被组合到本公开内容的试剂盒中的组分的某些非限制性实例。
[0198] 在特定的实施方案中,试剂盒可以包含用本文陈述的染料标记的至少一种改性的核苷酸或核苷连同改性的或未改性的核苷酸或核苷。例如,用根据本公开内容的染料标记的改性的核苷酸可以与未标记的或天然的核苷酸组合和/或与荧光标记的核苷酸组合或其任何组合被供应。因此,试剂盒可以包含用根据本公开内容的染料标记的改性的核苷酸和用其他例如现有技术染料化合物标记的改性的核苷酸。核苷酸的组合可以作为分开的单独组分(例如,每容器或管一种核苷酸类型)或作为核苷酸混合物(例如,在相同的容器或管中混合的两种或更多种核苷酸)被提供。
[0199] 在试剂盒包含用染料化合物标记的多种、特别地两种、更特别地四种改性的核苷酸的情况下,不同的核苷酸可以用不同的染料化合物来标记,或一种核苷酸可以是深色的,不具有染料化合物。在用不同的染料化合物标记不同的核苷酸的情况下,试剂盒的特征是,所述染料化合物是光谱上可区别的荧光染料。如本文所使用,术语“光谱上可区别的荧光染料”指的是,当两种或更多种此类染料存在于一种样品中时,在可以通过荧光检测设备(例如,基于商用毛细管的DNA测序平台)区别的波长下发射荧光能量的荧光染料。当用荧光染料化合物标记的两种改性的核苷酸以试剂盒形式被供应时,某些实施方案的特征是,光谱上可区别的荧光染料可以在相同的波长下(例如比如通过相同的激光器)来激发。当用荧光染料化合物标记的四种改性的核苷酸以试剂盒形式被供应时,某些实施方案的特征是,光谱上可区别的荧光染料中的两种可以两者均在一个波长下被激发,并且另两种光谱上可区别的染料可以两者均在另一波长下被激发。特定的激发波长是532nm、630nm至700nm,特别地660nm。
[0200] 在一个实施方案中,试剂盒包含用本公开内容的化合物标记的改性的核苷酸和用第二染料标记的第二改性的核苷酸,其中染料在吸光度最大值上具有至少10nm、特别地20nm至50nm的差异。更特别地,两种染料化合物具有15-40nm之间的斯托克斯位移,其中“斯托克斯位移”是峰值吸收波长和峰值发射波长之间的距离。
[0201] 在另外的实施方案中,试剂盒还可以包含用荧光染料标记的两种其他改性的核苷酸,其中染料通过相同的激光器在488nm至550nm、特别地532nm下被激发。染料在吸光度最大值上可以具有至少10nm、特别地20nm至50nm的差异。更特别地,两种染料化合物可以具有在20-40nm之间的斯托克斯位移。还更特别地,两种染料化合物可以具有低于640nm、特别地低于600nm的不同的吸光度最大值。光谱上可区别于本公开内容的多次甲基染料并且满足上文标准的特别的染料是如在美国专利第5,268,486号(例如Cy3)或WO 0226891(Alexa 532;Molecular Probes A20106)中描述的多次甲基类似物或如在美国专利第6,924,372号中公开的不对称的多次甲基,其各自通过引用并入本文。可选择的染料包括若丹明类似物,例如四甲基若丹明及其类似物。
[0202] 在可选择的实施方案中,本公开内容的试剂盒可以包含其中相同的碱基被两种不同的化合物标记的核苷酸。第一核苷酸可以用本公开内容的化合物来标记。第二核苷酸可以用光谱上有区别的化合物(例如在小于600nm处吸收的‘绿色’染料)来标记。第三核苷酸可以被标记为本公开内容的化合物和光谱上有区别的化合物的混合物,并且第四核苷酸可以是‘深色的’并且不包含标记物。因此,简言之,核苷酸1-4可以被标记为‘绿色’、‘红色’、‘红色/绿色’以及深色。为进一步简化仪器,四种核苷酸可以用由单激光器激发的两种染料来标记,并且因此核苷酸1-4的标记可以是‘红色1’、‘红色2’、‘红色1/红色2’和深色。
[0203] 核苷酸可以包含本公开内容的两种染料。其中Ra1或Ra2是稠合至吲哚环的相邻的碳的另外的芳香族环的染料,相比于在染料不具有另外的芳香族轭合的情况在较长的波长下吸收。试剂盒可以包含用本公开内容的染料标记的两种或更多种核苷酸。试剂盒可以包含:用本公开内容的化合物标记的核苷酸,在该化合物中,Ra1和Ra2中的每个独立地是H、SO3-、磺酰胺或卤素;以及用本公开内容的化合物标记的一种核苷酸,在该化合物中,Ra1和Ra2一个或两者是稠合至相邻的碳原子的另外的环。试剂盒可以包含另外的核苷酸,其中该核苷酸用在520nm至560nm的区域内吸收的染料来标记。试剂盒还可以包含未标记的核苷酸。
[0204] 虽然上文关于具有不同核苷酸的配置来示例试剂盒,该不同核苷酸被不同的染料化合物标记,但将理解的是,试剂盒可以包含具有相同染料化合物的2种、3种、4种或更多种不同的核苷酸。
[0205] 在特定的实施方案中,试剂盒可以包含能够催化将改性的核苷酸并入到多核苷酸中的聚合酶。待被包含在此类试剂盒中的其他组分可以包括缓冲剂及类似物。用根据本公开内容的染料标记的改性的核苷酸和包括不同核苷酸的混合物的其他任何核苷酸组分,可以以待在使用之前被稀释的浓缩的形式被提供在试剂盒中。在此类实施方案中,还可以包括合适的稀释缓冲剂。再次,在本文陈述的方法中确定的组分中的一种或更多种可以被包含在本公开内容的试剂盒中。
[0206] 应注意,如在本说明书和所附权利要求中所使用,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物,除非清楚地且明确地受限于一个指示物。对本领域技术人员将明显的是,可以对本文描述的各种实施方案作出各种修改和变型而不偏离本教导的精神或范围。因此,意图的是,本文描述的各种实施方案覆盖在所附权利要求及其等同物的范围内的其他修改和变型。
[0207] 实验细节
[0208] 2,3,3-三甲基-1-苯基-3H-吲哚鎓-5-磺酸盐(1)
[0209]
[0210] 将2-亚甲基-3,3-二甲基-1-苯基-2,3-二氢-1H-吲哚(1g,4.25mmol)在温度<5℃下溶解在1ml的硫酸中,并且在搅拌下添加1ml发烟硫酸(20%)。将溶液在室温下搅拌1h,然后在60℃下加热持续3h。将用二乙醚沉淀的产物用丙酮和乙醇洗涤。收率0.7g(52%)。结构通过NMR来确证。
[0211] 2-(4-苯胺基丁间二烯基-1)-3,3-二甲基-1-苯基-3H-吲哚鎓-5-磺酸盐(2-1)[0212]
[0213] 反应方案:
[0214]
[0215] 将2,3,3-三甲基-1-苯基-3H-吲哚鎓-5-磺酸盐(0.63g)、苯胺(0.2g)和1,1,3,3-四乙氧基丙烷(0.35ml)的混合物在70℃下加热持续90分钟。形成红色熔化物。产物用乙醚磨碎并且滤出。收率0.6g(68%)。
[0216] 2-(4-乙酰苯胺基丁间二烯基-1)-3,3-二甲基-1-苯基-3H-吲哚鎓-5-磺酸盐(2-2)
[0217]
[0218] 反应方案:
[0219]
[0220] 将2,3,3-三甲基-1-苯基-3H-吲哚鎓-5-磺酸盐(0.315g)、丙二醛二苯胺盐酸盐(0.25g)、乙酸(1ml)和乙酸酐(2ml)的混合物在60℃下加热持续3小时并且然后在50℃下过夜。形成橙色溶液。将产物滤出并且用二乙醚洗涤。收率0.24g(49%)。
[0221] 1,2-二甲基-1-(4-磺丁基)-3-苯基-1H-苯并[e]吲哚鎓(3)
[0222]
[0223] 反应方案:
[0224]
[0225] 将在绝对乙醇(30ml)中的N-(2-萘基),N-苯基肼盐酸盐(19.51mmol,5.28g)、5-甲基-6-氧代庚烷磺酸(17.18mmol,3.70g)和无水ZnCl2(17.18mmol,2.34g)在室温下搅拌持续30分钟,然后在80℃下搅拌持续2h。通过TLC(在CH3CN中的10%H2O)检查反应进程。在完成之后,将反应冷却下来并且将溶剂在真空下除去。将残余物溶解在DCM中并且通过硅胶快速柱纯化。收率:3.06g,42%。
[0226] 质子NMR:(MeOH-D4):8.28(0.5H,d,J=8Hz);8.05-8.02(1H,m);7.89(0.5H,d,J=8Hz);7.75-7.66(3H,m);7.65-7.60(1H,m);1.49-1.43(1.5H,m);7.31-7.25(2H,m);7.16(.5H,d,J=9Hz);7.07(.5H,appt,J=7.4Hz);6.61(0.5H,d,J=8Hz);2.85-2.35(4H,m);
1.88(3H,appd,J=9Hz);1.75-1.4(5H,m);1.35-1.25(0.5H,m);1.1-0.95(0.5H,m);0.8-
0.65(0.5H,m);0.58-0.45(0.5H,m)。
[0227] 1,2-二甲基-1-(3-磺丙基)-3-苯基-1H-苯并[e]吲哚鎓(4)
[0228]
[0229] 反应方案:
[0230]
[0231] 将标题化合物如先前化合物从N-(2-萘基)-N-苯基肼盐酸盐和4-甲基-5-氧代戊烷磺酸来制备。产物通过硅胶快速柱纯化。收率:40%。结构通过NMR光谱确证。
[0232] 2,3-二甲基-3-(4-磺丁基)-1-苯基-3H-吲哚鎓(5)
[0233]
[0234] 反应方案:
[0235]
[0236] 将在冰乙酸(20ml)中的N,N-二苯基肼盐酸盐(0.01mol,2.2g)、5-甲基-6-氧代庚烷磺酸(0.017mol,3.0g)在室温(~20℃)下搅拌持续一小时,然后在100℃下搅拌持续3小时(TLC检查)。将反应混合物冷却下来并且将溶剂在真空下除去。将残余物用二乙醚洗涤并且通过硅胶快速柱纯化。收率:2g(56%)。结构通过NMR光谱确证。
[0237] 产物名称:NR650C5
[0238] 产物合成方案:
[0239]
[0240] 染料合成程序:
[0241] 将2,3-二甲基-3-(4-磺丁基)-1-苯基-3H-吲哚鎓(5)(70mg)和丙二醛二苯胺盐酸盐(II,51mg)在乙酸酐和乙酸(4ml/1ml)的混合物中在90℃下搅拌持续2h(通过在MeCN中的15%H2O的TLC控制反应)。将反应混合物留在RT下过夜。将溶剂在真空中除去,将黄色残余物用二乙醚洗涤并且溶解在乙酸(5ml)中。将吲哚鎓盐(III,85mg)添加至在先前步骤中制备的中间体的溶液,随后是吡啶(0.5ml)。将反应混合物在80℃下搅拌持续3h并且留在室温下过夜。将溶剂在真空下除去。将深蓝色残余物用二乙醚洗涤,溶解在水-乙腈(~5%)混合物中,过滤并且通过制备型HPLC纯化。收集蓝颜色(吸光度最大值~650nm)的级分,并且在真空中除去溶剂。
[0242] 使用合适的起始材料类似地制备染料D1-D7。
[0243] 在表1中,与已知结构类似物染料Std(EP1810998A2)的类似的参数相比较的以此方式制备的某些染料(在水中的溶液)的光谱性质。
[0244] 表1
[0245]
[0246]
[0247] 5染料D4核苷酸轭合物(FFA4)
[0248]
[0249] 制备:
[0250] 将无水DMA(5mL)和Hunig’s碱(0.06mL)添加至染料D4的干燥样品(88mg)。然后,将TSTU(25mg)在5mL的干燥DMA中的溶液添加至此。形成蓝色的活化酯。将反应混合物在室温下搅拌持续1h。根据TLC(在CH3CN中的20%H2O),完成活化。在活化完成之后,将此溶液添加至pppT-LN3作为三乙铵盐(47mg)在水(7mL)中的溶液。将反应混合物在室温下在氮气气氛下搅拌持续3h。通过TLC(在乙腈中的20%H2O)检查偶联进程。将反应混合物用冰浴冷却至~4℃,然后添加0.1M TEAB(5mL)在水中的溶液并且将混合物在室温下搅拌持续10分钟。将反应混合物应用于具有~50g的在0.05M TEAB水溶液中的DEAE葡聚糖凝胶树脂悬浮液的柱并且用TEAB(浓度梯度从0.1M多达0.5M)洗涤。收集有色级分并且蒸发,然后再次与水共蒸发以除去更多TEAB并且抽真空至干燥。然后,将残余物重新溶解在TEAB 0.1M中。将此溶液通过0.2nm孔大小的注射器式过滤器过滤到康宁烧瓶中并且储存在冰箱中。将产物通过使用C18反相柱用乙腈-0.1M TEAB的HPLC纯化。收率76%(基于使用消光系数评估的溶液的光密度)。
[0251] 染料D7核苷酸轭合物(FFA7)
[0252]
[0253] 制备:
[0254] 将无水DMA(5mL)和Hunig’s碱(0.06mL)添加至染料D7的干燥样品(100mg)。然后,将TSTU(25mg)在5mL的干燥DMA中的溶液添加至此。形成蓝色的活化酯。将反应混合物在室温下搅拌持续1h。根据TLC(在CH3CN中的20%H2O),完成活化。在活化完成之后,将此溶液添加至pppT-LN3作为三乙铵盐(47mg)在水(7mL)中的溶液。将反应混合物在室温下在氮气气氛下搅拌持续3h。通过TLC(在乙腈中的20%H2O)检查偶联进程。将反应混合物用冰浴冷却至~4℃,然后添加0.1M TEAB(5mL)在水中的溶液并且将混合物在室温下搅拌持续10分钟。将反应混合物应用于具有~50g的在0.05M TEAB水溶液中的DEAE葡聚糖凝胶树脂悬浮液的柱并且用TEAB(浓度梯度从0.1M多达0.5M)洗涤。收集有色级分并且蒸发,然后再次与水共蒸发以除去更多TEAB并且抽真空至干燥。然后,将残余物重新溶解在TEAB 0.1M中。将此溶液通过0.2nm孔大小的注射器式过滤器过滤到康宁烧瓶中并且储存在冰箱中。将产物通过使用C18反相柱用乙腈-0.1M TEAB的HPLC纯化。收率57%(基于使用消光系数评估的溶液的光密度)。
[0255] 使用合适的起始材料类似地制备具有染料D1-D7的轭合物。
[0256] 在表2中,与基于已知染料Std(US7109314B2,EP1810998A2)的已知结构类似物的类似的参数相比较的用以此方式制备的新的染料标记的某些轭合物的荧光性质。
[0257] 表2
[0258]核苷酸 染料 20℃的荧光强度(%) 60℃的荧光强度(%)
FFA1 D1 493(175) 294(167)
FFA4 D4 365(130) 225(128)
FFA5 D5 517(184) 330(188)
FFAStd std 281(100) 176(100)
[0259] 从这些数据,可以看到,与用已知现有结构类似物(std)(其中R1不是苯基)标记的核苷酸比较,用新的染料(其中R1是苯基)标记的核苷酸的荧光强度明显地是较高的。
[0260] 用新的染料标记的核苷酸中的某些已经在Illumina测序系统中被测试并且数据(在下文表3中示出)揭示,与已知结构类似物(其中R1不是苯基)比较,使用新的化合物对于核酸测序应用提供较低的误差率。
[0261] 表3
[0262]