具有产生长扩增子的能力的杂合聚合酶转让专利

申请号 : CN201280030878.9

文献号 : CN103620049B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王焱约翰·苏利文

申请人 : 伯乐实验室公司

摘要 :

本发明提供DNA聚合酶,其具有增加的长扩增子的扩增效率。本发明还提供利用所述DNA聚合酶扩增靶核酸分子以提高长扩增子的扩增效率的方法。

权利要求 :

1.多肽,所述多肽包含与非特异性DNA结合结构域连接的DNA聚合酶,其中所述DNA聚合酶由SEQ ID NO:2组成,其中所述DNA聚合酶与由SEQ ID NO:7组成的DNA聚合酶相比,对至少5kb的扩增子具有更高的核酸扩增效率。

2.权利要求1的多肽,其中,与由SEQ ID NO:8组成的DNA聚合酶相比,与所述非特异性DNA结合结构域连接的所述DNA聚合酶对至少7.5kb的扩增子具有更高的扩增效率。

3.权利要求1的多肽,其中所述非特异性DNA结合结构域由与SEQ ID NO:4具有至少

80%同一性的氨基酸序列组成。

4.权利要求1的多肽,其中所述非特异性DNA结合结构域由SEQ ID NO:4组成。

5.权利要求1的多肽,其中所述多肽与SEQ ID NO:5具有至少99%同一性。

6.权利要求1的多肽,其中所述多肽由SEQ ID NO:5组成。

7.分离的核酸,所述分离的核酸包含编码权利要求1的多肽的多核苷酸。

8.权利要求7的分离的核酸,还包含与所述多核苷酸可操作相连的启动子。

9.权利要求7的分离的核酸,其中所述DNA聚合酶由SEQ ID NO:2组成。

10.权利要求7的分离的核酸,其中所述非特异性DNA结合结构域由与SEQ ID NO:4具有至少80%同一性的氨基酸序列组成。

11.权利要求7的分离的核酸,其中所述非特异性DNA结合结构域由SEQ ID NO:4组成。

12.权利要求7的分离的核酸,其中所述多肽与SEQ ID NO:5具有至少99%同一性。

13.权利要求7的分离的核酸,其中所述多肽由SEQ ID NO:5组成。

14.权利要求7的分离的核酸,其中,与由SEQ ID NO:8组成的DNA聚合酶相比,与所述非特异性DNA结合结构域连接的所述DNA聚合酶对至少7.5kb的扩增子具有更高的扩增效率。

15.分离的宿主细胞,所述分离的宿主细胞包含异源表达盒,所述异源表达盒包含与多核苷酸可操作相连的启动子,所述多核苷酸编码权利要求1的多肽。

16.权利要求15的分离的宿主细胞,其中所述DNA聚合酶,当与非特异性DNA结合结构域连接时,与由SEQ ID NO:8组成的DNA聚合酶相比,对至少5kb的扩增子具有更高的扩增效率。

17.权利要求15的分离的宿主细胞,其中所述DNA聚合酶由SEQ ID NO:2组成。

18.权利要求15的分离的宿主细胞,其中所述非特异性DNA结合结构域由与SEQ ID NO:

4具有至少80%同一性的氨基酸序列组成。

说明书 :

具有产生长扩增子的能力的杂合聚合酶

[0001] 对相关专利申请的交叉引用
[0002] 本发明申请要求于2011年6月21日提交的美国专利申请号13/165,373的优先权的利益,所述专利申请为所有目的通过引用结合。
[0003] 关于作为ASCII文档提交的″序列表″、表格或计算机程序列表附件
[0004] 以文本-945-1PC.TXT写成,创建于2012年6月18日,53,248字节,机器格式IBM-PC,MS-Windows操作系统的序列表为所有目的通过引用完整地结合于此。
[0005] 发明背景
[0006] 核酸扩增反应,诸如聚合酶链反应(PCR),一般是模板依赖性反应,其中所需的核酸序列通过使用过量的两种寡核苷酸引物处理靶核酸的分离的互补链来扩增。所述引物延伸形成互补引物延伸产物,所述产物起模板作用,以用于合成所需的核酸序列。在这样的过程中,选择性扩增各DNA链上的引物之间的核酸序列。但是,许多因素可以消极地影响核酸扩增反应的效率,尤其是对于长扩增子序列。
[0007] 发明概述
[0008] 本发明提供用于扩增核酸分子的组合物和方法。在一方面中,本发明提供多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,97%,98%,或99%)同一性。
[0009] 在一些实施方案中,所述DNA聚合酶包含SEQ ID NO:2。
[0010] 在一些实施方案中,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,97%,98%,或99%)同一性,其中所述DNA聚合酶与非特异性DNA结合结构域连接。在一些实施方案中,非特异性DNA结合结构域包含的氨基酸序列与SEQ ID NO:4具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。在一些实施方案中,非特异性DNA结合结构域包含SEQ ID NO:4。
[0011] 在一些实施方案中,与由SEQ ID NO:8组成的DNA聚合酶相比,与非特异性DNA结合结构域连接的DNA聚合酶对至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。在一些实施方案中,与由SEQ ID NO:8组成的DNA聚合酶相比,与非特异性DNA结合结构域连接的DNA聚合酶对至少5kb的扩增子具有更高的扩增效率。
[0012] 在一些实施方案中,所述多肽包含SEQ ID NO:5。在一些实施方案中,所述多肽包含的氨基酸序列与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。
[0013] 在另一方面中,本发明提供分离的核酸,所述分离的核酸编码本发明的多肽。在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,97%,98%,或99%)同一性。在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶包含SEQ ID NO:2。在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码多肽,所述多肽与由SEQ ID NO:7组成的DNA聚合酶相比对至少5kb,至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0014] 在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,97%,98%,或99%)同一性,其中DNA聚合酶与非特异性DNA结合结构域连接。在一些实施方案中,非特异性DNA结合结构域包含的氨基酸序列与SEQ ID NO:4具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少
97%,至少98%,或至少99%)同一性。在一些实施方案中,非特异性DNA结合结构域包含SEQ ID NO:4。在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码与非特异性DNA结合结构域连接的DNA聚合酶,所述DNA聚合酶与由SEQ ID NO:8组成的DNA聚合酶相比对至少5kb,至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少
25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0015] 在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码多肽,所述多肽包含SEQ ID NO:5。在一些实施方案中,分离的核酸包含多核苷酸,所述多核苷酸编码多肽,所述多肽包含的氨基酸序列与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少
99%)同一性。
[0016] 在一些实施方案中,分离的核酸还包含与多核苷酸可操作相连的启动子。
[0017] 在另一方面中,本发明提供分离的宿主细胞,所述分离的宿主细胞包含异源表达盒,所述异源表达盒包含与多核苷酸可操作相连的启动子,所述多核苷酸编码多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,97%,98%,或99%)同一性。
[0018] 在一些实施方案中,DNA聚合酶包含SEQ ID NO:2。在一些实施方案中,DNA聚合酶,当与非特异性DNA结合结构域连接时,与由SEQ ID NO:7组成的DNA聚合酶相比,对至少5kb,至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0019] 在一些实施方案中,DNA聚合酶与非特异性DNA结合结构域连接。在一些实施方案中,非特异性DNA结合结构域包含的氨基酸序列与SEQ ID NO:4具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。在一些实施方案中,非特异性DNA结合结构域包含SEQ ID NO:4。
在一些实施方案中,与由SEQ ID NO:8组成的DNA聚合酶相比,与非特异性DNA结合结构域连接的DNA聚合酶对至少5kb,至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少
20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0020] 在一些实施方案中,分离的宿主细胞包含异源表达盒,所述异源表达盒包含与多核苷酸可操作相连的启动子,所述多核苷酸编码多肽,所述多肽包含SEQ ID NO:5或者包含与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性的氨基酸序列。
[0021] 在另一方面中,本发明提供扩增核酸分子的方法。在一些实施方案中,所述方法包括在反应混合物中温育靶核酸,所述反应混合物含有至少一种引物和包含DNA聚合酶的多肽,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性,其中所述温育是在使得多肽扩增靶核酸的条件下;由此扩增靶核酸。
[0022] 在一些实施方案中,与由SEQ ID NO:7组成的DNA聚合酶相比,所述多肽对至少5kb,至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0023] 在一些实施方案中,DNA聚合酶包含SEQ ID NO:2。
[0024] 在一些实施方案中,DNA聚合酶与非特异性DNA结合结构域连接。在一些实施方案中,非特异性DNA结合结构域包含的氨基酸序列与SEQ ID NO:4具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。在一些实施方案中,非特异性DNA结合结构域包含SEQ ID NO:4。
在一些实施方案中,与由SEQ ID NO:8组成的DNA聚合酶相比,与非特异性DNA结合结构域连接的DNA聚合酶对至少5kb,至少7kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0025] 在一些实施方案中,所述多肽包含SEQ ID NO:5。在一些实施方案中,所述多肽包含的氨基酸序列与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。
[0026] 在另一方面中,本发明提供用于扩增核酸分子的反应混合物。在一些实施方案中,反应混合物包含多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性。在一些实施方案中,DNA聚合酶包含SEQ ID NO:2。
[0027] 在另一方面中,本发明提供用于扩增核酸分子的试剂盒。在一些实施方案中,试剂盒包含多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性。在一些实施方案中,DNA聚合酶包含SEQ ID NO:2。
[0028] 在一些实施方案中,反应混合物和/或试剂盒包含多肽,所述多肽与由SEQ ID NO:7组成的DNA聚合酶相比对至少5kb,至少7kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。
[0029] 在一些实施方案中,反应混合物和/或试剂盒包含多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,97%,98%,或99%)同一性,其中DNA聚合酶与非特异性DNA结合结构域连接。在一些实施方案中,非特异性DNA结合结构域包含的氨基酸序列与SEQ ID NO:4具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。在一些实施方案中,非特异性DNA结合结构域包含SEQ ID NO:4。在一些实施方案中,与由SEQ ID NO:8组成的DNA聚合酶相比,与非特异性DNA结合结构域连接的DNA聚合酶对至少5kb,至少7.5kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少
22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子具有更高的扩增效率。在一些实施方案中,多肽包含SEQ ID NO:5。在一些实施方案中,所述多肽包含的氨基酸序列与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性。
[0030] 定义
[0031] 术语“聚合酶”表示进行多核苷酸的模板指导的合成的酶。该术语包括具有聚合酶活性的全长多肽和结构域。DNA聚合酶是本领域技术人员公知的,包括但不限于,由激烈火球菌(Pyrococcus furiosus),Thermococcus litoralis,和海栖热袍菌(Thermotoga maritime),或其修饰形式分离或来源的DNA聚合酶。它们包括DNA-依赖性聚合酶和RNA-依赖性聚合酶(诸如逆转录酶)二者。已知至少5个DNA-依赖性DNA聚合酶家族,尽管大部分属于家族A、B和C。不同家族之间存在很少或不存在序列相似性。大多数家族A聚合酶是单链蛋白,其可以含有多酶功能包括聚合酶、3′至5′外切核酸酶活性和5′至3′外切核酸酶活性。家族B聚合酶典型地具有聚合酶的单催化结构域和3′至5′外切核酸酶活性,以及辅助因子。家族C聚合酶典型地是多亚单元蛋白,其具有聚合和3′至5′外切核酸酶活性。在大肠杆菌(E.coli)中,已经发现三种类型的DNA聚合酶,即DNA聚合酶I(家族A)、II(家族B)和III(家族C)。在真核细胞中,三种不同的家族B聚合酶,即DNA聚合酶α、δ和ε,参与核复制,且家族A聚合酶,即聚合酶γ,用于线粒体DNA复制。其它类型的DNA聚合酶包括噬菌体聚合酶。类似地,RNA聚合酶典型地包括真核RNA聚合酶I、II和III,和细菌RNA聚合酶以及噬菌体和病毒聚合酶。RNA聚合酶可以是DNA-依赖性和RNA-依赖性的。在一些实施方案中,本发明的聚合酶与SEQ ID NO:2相同或基本上相同(例如,具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列同一性),保留在SEQ ID NO:2和SEQ ID NO:7之间变化的位置处的至少一个(并且在一些实施方案中,每个)SEQ ID NO:2中的氨基酸,同时在其他位置变化。
[0032] 本文中使用的“热稳定的聚合酶”表示利用DNA或RNA作为模板,通过将核苷酸单元加入至核苷酸链来催化多核苷酸合成的任何酶,并在高于45℃的温度下具有最佳活性。
[0033] 本文中使用的术语“Sso7-样蛋白”或“Sso7”表示这样的多肽变体、等位基因、突变体、和种间同源物:(1)其具有的氨基酸序列与SEQ ID NO:4或10有大于约60%的氨基酸序列同一性、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更大的氨基酸序列同一性;或者(2)其结合抗体(例如,多克隆抗体),所述抗体针对包含SEQ ID NO:4或10的氨基酸序列的免疫原而产生。该术语包括全长Sso7多肽和所述多肽的具有序列非特异性双链结合活性的片段。Sso7-样蛋白包括Sac7d、Sac7e、Ssh7b和Sto7e。
[0034] “结构域”表示蛋白或蛋白复合物的单元,其包括多肽子序列(subsequence)、完整多肽序列、或许多多肽序列,其中所述单元具有定义的功能。理解所述功能是广泛定义的,且可以是配体结合、催化活性或可以对蛋白的结构具有稳定作用。
[0035] 术语“DNA结合结构域”表示以序列非特异性的方式结合DNA的蛋白结构域。在一些实施方案中,所述DNA结合结构域是以显著亲和力结合DNA的蛋白结构域,对于该结构域,没有已知核酸与所述蛋白结构域的结合亲和力比具有相同核苷酸组成、但是不同核苷酸序列的另一种核酸高超过100倍。
[0036] 本文中使用的术语“聚合酶-Sso7缀合物”表示经修饰的聚合酶,其包含至少一个与聚合酶结构域或所述聚合酶结构域的催化亚基连接的Sso7DNA结合结构域。聚合酶-Sso7缀合物可以包含多个Sso7DNA结合结构域。
[0037] 术语″相连″或″连接″表示本领域中关于功能性连接蛋白结构域的任何已知方法,包括但不限于具有或不具有干扰结构域的重组融合、内含肽-介导的融合、非共价连接、和共价键结合、包括二硫键结合;氢键结合;静电结合;和构象结合,例如,抗体-抗原,和生物素-抗生物素蛋白连接。
[0038] 术语“核酸扩增”或“扩增反应”表示用于增加核酸靶序列拷贝的任意体外方法。这样的方法包括但不限于聚合酶链反应(PCR)、DNA连接酶链反应(参见美国专利号4,683,195和4,683,202;PCR Protocols:A Guide to Methods and Applications(PCR流程:方法和应用指导)(Innis等编,1990)),(LCR)、QBeta RNA复制酶、和基于RNA转录的(诸如TAS和3SR)的扩增反应以及本领域技术人员已知的其它方法。
[0039] “扩增”表示使溶液经历足以容许扩增多核苷酸的条件的步骤,条件是反应的全部组分是完整的。扩增反应的组分包括,例如,引物,多核苷酸模板、聚合酶、核苷酸等。术语“扩增”典型地表示靶核酸的“指数”增加。然而,本文中使用的“扩增”还可以表示核酸的选择靶序列数量的线性增加,诸如使用循环测序获得的。
[0040] 术语“扩增反应混合物”或“扩增反应组合物”表示包含用于扩增靶核酸的多种试剂的水溶液。这些包括酶、水性缓冲液、盐、扩增引物、靶核酸、和核苷三磷酸。如本文中进一步讨论地,扩增反应混合物还可以进一步包括稳定剂和其它用于最优化效率和特异性的添加剂。根据上下文,所述混合物可以是完全的或不完全的扩增反应混合物。
[0041] “聚合酶链反应”或“PCR”表示这样的方法,通过该方法以几何级数扩增靶双链DNA的特定区段或子序列。PCR是本领域技术人员公知的技术;参见,例如,美国专利号4,683,195和4,683,202;和PCR Protocols:A Guide to Methods and Applications(PCR流程:方法和应用指导),Innis等编,1990。示范性PCR反应条件典型地包括两步骤或三步骤循环。两步骤循环具有变性步骤,随后是杂交/延伸步骤。三步骤循环包括变性步骤,随后是杂交步骤,随后是单独的延伸步骤。
[0042] 术语″增加的效率″或″提高的效率″当关于核酸扩增使用时表示:与在核酸扩增中在指定轮次(即,循环)的扩增期间在对照DNA聚合酶存在下产生的扩增产物的量相比,在核酸扩增中在指定轮次(即,循环)的扩增期间在本发明的DNA聚合酶存在下产生的扩增产物的量的可检测的增加。可以根据任何方法测量扩增反应的效率,所述方法包括但不限于熔点曲线分析或凝胶分析。在一些实施方案中,本发明的DNA聚合酶存在下的扩增反应将显示在指定轮次中产生的扩增产物的量与使用对照DNA聚合酶(例如,由SEQ ID NO:7或SEQ ID NO:8组成的DNA聚合酶)在相同轮次中产生的扩增产物的量相比的至少10%,15%,20%,25%,30%,40%,50%,100%,2倍(200%),2.5倍(250%),3倍(300%)或以上的增加。
[0043] “寡核苷酸引物”或“引物”表示与靶核酸上的序列杂交并担当核酸合成的起始点的寡核苷酸序列。引物可以具有不同的长度,且通常长度小于50个核苷酸,例如,长度为12-30个核苷酸。用于PCR中的引物的长度和序列可以基于本领域技术人员已知的原则来设计,参见,例如,Innis等,见上文。
[0044] 术语″扩增子″是指作为天然或人工扩增事件(例如,聚合酶链反应)的产物形成的多核苷酸(例如,DNA)片段。在一些实施方案中,扩增子是″长″扩增子,其长度为至少5kb,或至少6kb,7kb,8kb,9kb,10kb,11kb,12kb,13kb,14kb,15kb,16kb,17kb,18kb,19kb,20kb,31kb,22kb,23kb,24kb,25kb,26kb,27kb,28kb,29kb,30kb,31kb,32kb,33kb,34kb,35kb,
36kb,37kb,38kb,39kb或40kb。
[0045] 术语“核酸”和“多核苷酸”在本文中互换地用于表示,处于单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。该术语包括含有已知核苷酸类似物或经修饰的主链残基或键的核酸,其是合成的、天然存在的、和非天然存在的,其具有与参考核酸类似的结合性能,且其以与参考核苷酸类似的方式被代谢。这样的类似物的例子包括、但不限于,硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性-甲基膦酸酯、2-O-甲基核糖核苷酸和肽核酸(PNAs)。
[0046] 术语“多肽”、“肽”和“蛋白”在本文中互换使用,表示氨基酸残基的聚合物。该术语应用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人造化学模拟物的氨基酸聚合物,以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。
[0047] 术语“氨基酸”表示天然存在和合成的氨基酸,以及以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些,以及稍后修饰的那些氨基酸,例如,羟基脯氨酸,γ-羧基谷氨酸,和O-磷酸丝氨酸。氨基酸类似物表示与天然存在的氨基酸具有相同基础化学结构(即,与氢、羧基、氨基、和R基结合的α碳)的化合物,例如,高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这样的类似物具有修饰的R基(例如,正亮氨酸)或修饰肽主链,但是保持与天然存在的氨基酸相同的基础化学结构。氨基酸模拟物表示具有与氨基酸的一般化学结构不同的结构但以与天然存在的氨基酸类似的方式起作用的化学化合物。
[0048] 氨基酸在本文中可以通过其普遍已知的三字母符号或通过由IUPAC-IUB生物化学命名委员会推荐的单字母符号来提及。同样地,核苷酸可以通过其普遍接受的单字母密码来提及。
[0049] “保守修饰变体”应用于氨基酸和核酸序列二者。关于特定的核酸序列,保守修饰变体表示编码相同或基本相同氨基酸序列,或其中核酸不编码氨基酸序列的那些核酸,表示基本相同序列。由于遗传密码的简并,大量功能相同的核酸编码任何给定蛋白。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在通过密码子指定丙氨酸的各个位置处,该密码子可以改变为所述相应密码子中任一个,而不改变编码的多肽。这样的核酸变化是“沉默变化”,其是保守修饰变化的一种。本文中编码多肽的各核酸序列也描述各种可能的核酸的沉默变化。本领域技术人员应该认识到,核酸中的各密码子(除AUG(其通常仅编码甲硫氨酸)和TGG(其通常仅编码色氨酸外)可以修饰为产生功能相同的分子。因此,编码多肽的核酸的各沉默变化是各所述序列中固有的。
[0050] 关于氨基酸序列,本领域技术人员应该认识到,在编码的序列中改变、添加或缺失单氨基酸或小比例氨基酸的各置换、缺失或添加核酸、肽、多肽、或蛋白序列是“保守修饰的变体”,其中变化导致氨基酸被化学类似的氨基酸置换。提供功能相似氨基酸的保守置换表是本领域中公知的。这样的保守修饰变体是本发明多形变体、种间同源物、和等位基因以外的,但不排除这些。
[0051] 术语“启动子”表示位于转录起始上游和/或下游并参与识别和结合RNA聚合酶和其它蛋白以起始转录的区域或序列。
[0052] 术语“相同”或百分比“同一性”在两个或多个核酸或多肽序列的背景下,表示2个或多个相同的序列或子序列。在下述情况下,序列是彼此“基本上相同的”:当使用一种下述序列比较算法或通过手工比对和视觉观察来测量,在比较和比对以在比较窗或特定区域中获得最大对应性时,在指出的特定区域内,或者如果没有另外指出则跨整个参考序列,它们具有特定百分比的相同的核苷酸或氨基酸残基(例如,至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)。这些定义也表示测试序列的补体。
[0053] 为了序列比较,典型地,一个序列担当参考序列,测试序列与所述参考序列进行比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。通常使用默认的程序参数,或可以指定备选的参数。序列比较算法然后基于程序参数,计算测试序列相对于参考序列的百分比序列同一性或相似性。
[0054] 本文中使用的“比较窗”包括对连续位置区段的提及,例如20-600连续位置,约50至约200,或约100至约150,其中当两序列最佳比对后,序列可以与相同数量的连续位置的参考序列进行比较。比对序列以进行比较的方法是本领域中公知的。用于比较的最佳序列比对可以,例如,通过Smith和Waterman(Adv.Appl.Math.(现代应用数学)2:482,1970)的局部同源比对算法,通过Needleman和Wunsch(J.Mol.Biol.(分子生物学杂志)48:443,1970)的同源比对算法,通过Pearson和Lipman(Proc.Natl.Acad.Sci.USA(美国国家科学院学报)85:2444,1988)的相似方法的搜索,通过这些算法的计算机执行(例如,在Wisconsin Genetics Software Package(威斯康辛州遗传学软件包)中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,Wis.)或通过人工比对和视觉观察(参见,例如,Ausubel等Current Protocols in Molecular Biology(1995增刊))来进行。
[0055] 适合用于确定百分比序列同一性和序列相似性的算法的例子是BLAST和BLAST2.0算法,其分别记述在Altschul等(Nuc.Acids Res.25:3389-402,1977)和Altschul等(J.Mol.Biol.215:403-10,1990)中。用于进行BLAST分析的软件可公共地获自国家生物技术信息中心(National  Center for  Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)。该算法包括首先通过识别查询序列中长度W的短词来识别高评分序列对(HSPs),其在与数据库序列中相同长度的词比对时,匹配或满足一些正值阈值评分T。T指邻近词评分阈值(Altschul等,见上文)。这些起始邻近词击中(word hits)担当开始搜索的种子,以发现包含它们的较长的HSPs。词击中以两个方向沿各序列延伸,以直至可以增加累积比对评分。词击中在各方向的延伸在以下时刻停止:累积比对评分由其最大获得值下降量X;累积评分变为0或以下,这归因于一个或多个负评分残基比对的累积;或达到各序列的末端。BLAST算法参数W,T,和X确定算法的灵敏性和速度。BLAST程序默认词长(W)为11,使用BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA(美国国家科学院学报)89:10915(1989))比对(B)为50,期望值(E)为10,M=5,N=-4,和比较两条链。
[0056] BLAST算法也进行两序列之间相似性的统计学分析(参见,例如,Karlin&Altschul,Proc.Nat′l.Acad.Sci.USA(美国国家科学院学报)90:5873-5787(1993))。由BLAST算法提供的相似性的一个测量值是最小综合可能性(P(N)),其提供两核苷酸或氨基酸序列之间的匹配偶然发生的可能性指示。例如,核酸被认为与参考序列相似,条件是测试核酸与参考核酸的比较中的最小总和可能性小于约0.2,更优选小于约0.01,且最优选小于约0.001。
[0057] 附图简述
[0058] 图1.在扩增来自λDNA的20kb靶标中,H10融合聚合酶具有比野生型融合聚合酶更高的效率。效率提高反映为使用相等单位的酶时更高的终产物产率(比较A和B),或产生相同的产率所需的酶更少(比较A和C)。
[0059] 图2.将SEQ ID NO:2的DNA聚合酶的氨基酸序列与SEQ ID NO:7的DNA聚合酶的氨基酸序列比较的序列比对。共有序列=SEQ ID NO:17。
[0060] 详述
[0061] I.导言
[0062] 本发明提供用于提高核酸扩增效率,尤其是提高长扩增子扩增效率的方法和组合物。发现了具有提高的活性的DNA聚合酶。该DNA聚合酶初始被鉴别为具有比其3′-5′核酸外切酶活性更大的聚合酶活性的聚合酶。进一步发现:与SEQ ID NOs:7或8相比,该DNA聚合酶具有实质上更好的扩增长的(例如,7.5或20kb)扩增子的能力(如由扩增子产率确定的)。
[0063] 因此,在一方面中,本发明提供多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性。在一些实施方案中,与由SEQ ID NO:7组成的DNA聚合酶相比,所述多肽对长扩增子(例如,至少5kb,至少7.5kb,至少10kb,至少15kb,或至少20kb的扩增子)具有更高的扩增效率。在一些实施方案中,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性并且与非特异性DNA结合结构域(例如,包含与SEQ ID NO:4具有至少80%,85%,90%,95%,99%,或100%同一性的氨基酸序列的非特异性DNA结合结构域)连接。
[0064] 在另一方面中,本发明提供扩增核酸分子的方法。在一些实施方案中,该方法包括在反应混合物中温育靶核酸,所述反应混合物含有至少一种引物和多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性,其中所述温育是在导致所述聚合酶扩增靶核酸的条件下,由此扩增靶核酸。在一些实施方案中,所述聚合酶包括DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性并且与非特异性DNA结合结构域(例如,包含与SEQ ID NO:4具有至少80%,85%,90%,95%,99%,或100%同一性的氨基酸序列的非特异性DNA结合结构域)连接。
[0065] 在另一方面中,本发明提供用于进行使用聚合酶的核酸扩增反应的反应混合物和/或试剂盒。在一些实施方案中,所述反应混合物和/或试剂盒包含多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性。在一些实施方案中,反应混合物和/或试剂盒包含多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性并且与非特异性DNA结合结构域(例如,包含与SEQ ID NO:4具有至少80%,85%,90%,95%,99%,或100%同一性的氨基酸序列的非特异性DNA结合结构域)连接。
[0066] II.本发明的聚合酶
[0067] 本发明的示例性聚合酶包含SEQ ID NO:2或至少包含在SEQ ID NO:2的全长上实质上相同的多肽。这些聚合酶是合成的、非天然存在的聚合酶。
[0068] 可以制备实质上保持SEQ ID NO:2的聚合酶活性的SEQ ID NO:2的变体,例如,通过保留在SEQ ID NO:2和SEQ ID NO:7之间变化的位置处的SEQ ID NO:2中的每个氨基酸,同时在其他位置变化。本领域技术人员可以确定在SEQ ID NO:2和SEQ ID NO:7之间变化的位置,并且因此确定要保留的位置和/或与SEQ ID NO:2不同的位置,参考序列比对,例如图2中所示的序列比对。还要理解,聚合酶中的一些位置在不同聚合酶之间高度保守,并且因此这些位置中的变化比在聚合酶之间可变的位置中的变化更可能改变或破坏聚合酶活性。
在SEQ ID NO:2和其他聚合酶之间保守的序列的一个实例是YGYYGYAKARWYCKECAESVTAWGR(SEQ ID NO:9)。参见,例如,美国专利号7,560,260。因此,在一些实施方案中,本发明的聚合酶与SEQ ID NO:2实质上相同并且包含SEQ ID NO:9以及保留在SEQ ID NO:2和SEQ ID NO:7之间变化的位置处的SEQ ID NO:2中的每个氨基酸。在一些实施方案中,本发明的聚合酶包含这样的多肽,其与SEQ ID NO:2具有至少95%同一性。
[0069] 在一方面中,本发明的聚合酶表征为在扩增长扩增子(例如,至少5kb,至少7.5kb,至少10kb,至少15kb,或至少20kb的扩增子)方面是高效的。例如,在一些实施方案中,与包含SEQ ID NO:7的聚合酶相比,本发明的聚合酶在核酸扩增反应中更有效(即,产生更多的产物)。在一些实施方案中,本发明的聚合酶在核酸扩增反应中比包含SEQ ID NO:8的聚合酶更有效(即,产生更多的产物)。
[0070] 在一些实施方案中,本发明的聚合酶包括导致聚合酶外切核酸酶缺陷的突变。“外切核酸酶缺陷”用于本文中时意指聚合酶具有充分减小(即,小于来自激烈火球菌(Pyrococcus furiosus)的Pfu DNA聚合酶的3′-5′外切核酸酶活性的10%,5%或1%)的或无外切核酸酶活性。例如,聚合酶结构域中取代位置D141和E143处的丙氨酸的双点突变可以去除或消除3’-5’外切核酸酶活性。参见,例如Derbyshire等,Methods in Enzymology(酶学方法),卷262(1995),第363-385页。包含这样的双点突变的杂合聚合酶应该通常在核酸扩增反应中显示增加的特异性,从而导致较少的扩增副产物(诸如引物二聚体的扩增)和扩增所需靶核酸的增加的效率。
[0071] 在一些实施方案中,本发明的聚合酶(包括杂合聚合酶)可以为分离形式的。在一些实施方案中,所述聚合酶(包括杂合聚合酶)是冻干的。备选地,所述聚合酶(包括杂合聚合酶)为在水溶液中的可溶形式。在一些实施方案中,所述聚合酶(包括杂合聚合酶)是重组制备的并因此是在完整的细胞内或在细胞裂解物中。
[0072] 核酸结合结构域
[0073] 在一些实施方案中,本发明的聚合酶与DNA结合结构域融合。这样的融合体在本文中有时候被称为″杂合聚合酶″。DNA结合结构域是蛋白,或蛋白的确定区域,其以不依赖序列的方式结合核酸,例如,结合不展示对特定序列的显著偏好。DNA结合结构域可以结合单链核酸或双链核酸。
[0074] 本发明中使用的DNA结合蛋白通常是热稳定的。这样的蛋白的实例包括,但不仅限于,古细菌小碱性DNA结合蛋白Sso7d和Sso7d-样蛋白(参见,例如,Choli等,Biochimica et Biophysica Acta950:193-203,1988;Baumann等,Structural Biol.(结构生物学)1:808-819,1994;和Gao等,Nature Struc.Biol.(自然结构生物学)5:782-786,1998),古细菌HMf-样蛋白(参见,例如,Starich等,J.Molec.Biol.(分子生物学杂志)255:187-203,1996;
Sandman等,Gene(基因)150:207-208,1994),和PCNA同源物(参见,例如,Cann等,J.Bacteriology(细菌学杂志)181:6591-6599,1999;Shamoo和Steitz,Cell(细胞):99,
155-166,1999;De Felice等,J.Mol.Biol.(分子生物学杂志)291,47-57,1999;和Zhang等,Biochemistry(生物化学)34:10703-10712,1995)。
[0075] HMf样蛋白是古菌组蛋白,其与真核H4组蛋白具有氨基酸序列和结构上的同源性,真核H4组蛋白被认为与DNA直接相互作用。HMf家族的蛋白在溶液中形成稳定的二体,并且从热稳定性物种(例如,炽热甲烷嗜热菌(Methanothermus fervidus)和火球菌属(Pyrococcus)菌株GB-3a)鉴别了若干HMf同系物。HMf家族的蛋白,在与Taq DNA聚合酶或具有低的固有持续合成能力的任何DNA修饰酶连接后,可以增强酶沿DNA底物滑动的能力并且因此提高其持续合成能力。例如,二体HMf样蛋白可以共价连接到Taq DNA聚合酶的N末端,例如,经由化学修饰,并且因此提高聚合酶的持续合成能力。
[0076] 某些螺旋-发夹-螺旋基序被证实非特异性地结合DNA并且增强与其融合的DNA聚合酶的持续合成能力(Pavlov等,Proc Natl Acad Sci USA.99:13510-5,2002)。
[0077] Sso7d和Sso7d-样蛋白,Sac7d和Sac7d-样蛋白,例如,Sac7a,Sac7b,Sac7d,和Sac7e是小(约7,000kd  MW),碱性染色体蛋白,其分别来自超嗜热古细菌(hyperthermophilic archaebacteria)硫磺矿硫化叶菌(Sulfolobus solfataricus)和嗜酸热硫化叶菌(S.acidocaldarius)。这些蛋白富含赖氨酸并具有高热、酸和化学稳定性。它们以不依赖序列的方式结合DNA,且当在一些条件下结合时,增加DNA的Tm高至40℃(McAfee等,Biochemistry(生物化学)34:10063-10077,1995;Gao等,Nat.Struct.Biol.(自然结构生物学)5(9):782-786,1998)。这些蛋白及其同源物典型地被认为在升高的温度下参与稳定化基因组DNA。适合用于本发明的Sso7d-样DNA结合结构域可以基于它们与Sso7d的序列同源性来修饰。典型地,在约25个氨基酸,任选地约50-100个氨基酸,或整个蛋白长度的比较窗范围内,与已知DNA结合蛋白相同或实质相同的DNA结合结构域可以用于本发明中。序列可以在比较窗,或如使用一种所述比较运算法则或通过手工比对和视觉观察测量的指定区域范围内比较和比对以获得最大对应性。在一些实施方案中,DNA结合结构域包含SEQ ID NO:4或SEQ ID NO:10或其实质(例如,至少60%,70%,80%,90%,或95%)相同序列。Sso7结合结构域中的多种突变已经记述在例如,美国专利申请号2005/0048530和2007/
0141591。
[0078] 适合用于本发明的另外的DNA结合结构域可以通过与已知DNA结合蛋白的同源性和/或通过抗体交叉反应性来识别,或可以通过生物化学测定手段来发现。DNA结合结构域可以使用本文中所述的和本领域中已知的技术来合成或分离。
[0079] 用于本发明的序列非特异性双链核酸结合结构域也还使用与已知核酸结合结构域结合的抗体,包括但不仅限于多克隆抗体,通过交叉反应性来识别。多克隆抗体使用本领域中普通技术人员公知的方法来生成(参见,例如,Coligan,Current Protocols in Immunology(当前免疫学方案)(1991);Harlow&Lane,Antibodies,A Laboratory Manual(抗体,实验室手册)(1988))。作为免疫学交叉反应性结合蛋白的那些蛋白可以然后通过多种测定法来检测。为了描述可以使用的不同形式和条件,参见,例如,Methods in Cell Biology:Antibodies in Cell Biology(细胞生物学方法:细胞生物学抗体),卷37(Asai,编1993),Coligan,见上文,和Harlow&Lane,见上文。
[0080] 关于与双链核酸的结合的特异性可以多种本领域中普通技术人员已知的测定来测试。这些包括这样的测定,诸如滤器结合测定或凝胶移动测定。例如,在滤器结合测定中,待评估与双链DNA结合活性的多肽与放射性标记的DNA,双链或单链,在适当的缓冲液中预混合。混合物通过保留蛋白和蛋白-DNA复合物的膜(例如硝化纤维)来过滤。保留在滤器上的DNA量表示与蛋白结合的量。结合可以通过竞争分析来量化,其中标记的DNA的结合受到添加增加量的未标记的DNA的竞争。以比单链DNA10-倍或更高亲和性结合双链DNA的多肽在本文中定义为双链DNA结合蛋白。备选地,结合活性可以通过凝胶移动测定来测定,其中放射性标记的DNA与测试多肽一起温育。蛋白-DNA复合物将以比未结合的DNA更慢地移动通过凝胶,由此导致移动的条带。结合量通过以下步骤来评估:使用增加量的双链或单链未标记DNA温育样品和量化移动的条带中的放射性量。
[0081] 适合用于本发明的结合结构域以不依赖序列的方式结合双链核酸,即,本发明的结合结构域以显著的亲和性结合双链核酸,但不存在以比具有相同核苷酸组成但不同核酸序列的另一核酸超过100倍更高的亲和性结合该结构域的已知核酸。非特异性结合可以利用与关于确定双链vs.单链核酸结合所述的类似的方法来测定。滤器结合测定或凝胶迁移移动测定可以如上利用相同核苷酸组成但不同核酸序列的竞争DNA来进行,以确定结合的特异性。
[0082] 用于本发明的序列非特异性双链核酸结合结构域也可以例如通过测定双链结合结构域增加修饰酶的持续合成能力或效率或增加核酸双链体稳定性至少1℃的能力来评估。
[0083] 本发明的结合结构域还通过直接评估所述结构域稳定化双链核酸构象的能力来识别。例如,引物-模板构建体的解链曲线可以在存在或不存在蛋白条件下,通过监测260nm处的DNA的UV吸光度来获得。双链底物的Tm可以由解链曲线的中点确定。序列非特异性双链核酸结合蛋白对Tm的影响可以然后通过比较在存在修饰的酶的条件下获得的Tm和在存在未修饰的酶的条件下获得的Tm来确定。(所述蛋白不显著贡献UV吸光度,因为其在260nm处具有比DNA低得多的消光系数)。可以然后选择将Tm增加1℃,通常5℃,10℃或更多的结构域,以用于本发明。
[0084] 本发明的新型序列非特异性双链核酸结合蛋白也可以通过利用它们的DNA结合活性,例如通过在DNA纤维素柱上纯化来分离。分离的蛋白可以然后通过常规手段来进一步纯化,测序,并且基因通过常规手段经由PCR来克隆。由这些克隆过表达的蛋白可以然后通过任何上述方法来测试。
[0085] 将聚合酶与核酸结合结构域缀合
[0086] 本发明的DNA聚合酶(例如,SEQ ID NO2或其变体)可以通过本领域技术人员已知的方法连接到序列非特异性DNA结合结构域。这些方法包括化学方法和重组方法。
[0087] 可以进行DNA聚合酶与非特异性DNA结合结构域的化学连接,例如,如在Bioconjugate Techniques(生物缀合技术),Hermanson,编,Academic Press(科学出版社)(1996)中所述。连接可以包括,例如,以通过蛋白化学领域中公知的方法,直接或通过连接化合物,相互连接两种蛋白为目的的衍生化作用。例如,在一个化学缀合实施方案中,连接催化结构域和核酸结合结构域的手段包括异双功能-偶联试剂,其最终促进在两个结构部分之间形成分子间二硫键。在该能力方面有效用于本发明的其他类型的偶联试剂记述在,例如,美国专利4,545,985中。备选地,分子间二硫键可以方便地在各结构部分中的半胱氨酸之间形成,所述半胱氨酸天然地存在或通过遗传改造插入。连接结构部分的手段还可以使用异双功能交联试剂之间的硫醚键或特异性低pH可裂解交联剂或特异性蛋白酶可裂解连接体或其他可裂解或不可裂解化学键。
[0088] 将DNA聚合酶与非特异性DNA结合结构域连接也可以包括在通过标准肽合成化学或重组手段分别合成的结构部分之间形成的肽键。缀合蛋白本身也可以利用合成完整或部分氨基酸序列的化学方法来生成。例如,肽可以通过固相技术,诸如,例如,Merrifield固相合成法来合成,其中将氨基酸顺序加入至正在增长的氨基酸链(参见,Merrifield(1963)J.Am.Chem.Soc.(美国化学协会杂志),85:2149-2146)。自动化合成多肽的设备可商购自供应商诸如PE Corp.(Foster City,CA),并通常可以根据制造商的说明书来操作。合成的肽可以然后从树脂切割,并例如通过制备高效液相层析法来纯化(参见Creighton,Proteins Structures and Molecular Principles(蛋白结构与分子原理),50-60(1983))。合成的多肽或所述多肽的子片段的组成可以通过氨基酸分析或测序来验证(例如,Edman降解程序;参见Creighton,Proteins,Structures and Molecular Principles(蛋白、结构与分子原理),第34-49页(1983))。
[0089] 此外,非经典氨基酸或化学氨基酸类似物可以作为置换或添加引入到序列中。非经典氨基酸通常包括,但不限于,普通氨基酸的D-异构体,α-氨基异丁酸,4-氨基丁酸,Abu,2-氨基丁酸,γ-Abu,ε-Ahx,6-氨基己酸,Aib,2-氨基异丁酸,3-氨基丙酸,鸟氨酸,正亮氨酸,正缬氨酸,羟基-脯氨酸,肌氨酸,瓜氨酸,半胱磺酸,叔丁基甘氨酸,叔丁基丙氨酸,苯基甘氨酸,环己基丙氨酸,β-丙氨酸,氟-氨基酸,设计者氨基酸如β-甲基氨基酸,Cα-甲基氨基酸,N-甲基氨基酸,和氨基酸类似物。此外,氨基酸可以是D(右旋的)或L(左旋的)。
[0090] 在另一个实施方案中,DNA聚合酶和非特异性DNA结合结构域经由连接基团连接。连接基团可以是化学交联剂,其包括,例如,琥珀酰亚氨-(N-马来酰亚胺甲基)-环己烷-1-甲酸酯(SMCC)。所述接头基团还可以是额外的氨基酸序列,包括、例如,聚丙氨酸、聚甘氨酸,或类似地,接头基团。
[0091] 备选地,在一些实施方案中,杂合聚合酶中的每个多肽的编码序列在其氨基或羧基端通过肽键以任意顺序直接连接。可替换地,氨基酸接头序列可以用于通过足以确保各多肽折叠为其二级和三级结构的距离使第一和第二多肽组分分开。利用本领域中公知的标准技术将这样的氨基酸接头序列引入至融合蛋白中。合适的肽接头序列可以基于以下因素来选择:(1)它们采取柔性延伸构象的能力;(2)它们不能采取能够与第一和第二多肽上的功能性表位相互作用的二级结构;和(3)缺乏可以与多肽功能性表位相互作用的疏水性或带电残基。典型的肽接头序列包含Gly、Ser、Val和Thr残基。其它接近中性的氨基酸(诸如Ala)也可以用于接头序列中。可以有效用作接头的氨基酸序列包括Maratea等(1985)Gene(基因)40:39-46;Murphy等(1986)Proc.Natl.Acad.Sci.USA(美国国家科学院学报)83:8258-8262;美国专利号4,935,233和4,751,180中公开的那些。接头序列通常可以是长度为
1-约50个氨基酸,例如,长度为3,4,6,或10个氨基酸,但是长度可以为100或200个氨基酸。
当第一和第二多肽具有非必需N端氨基酸区时,可以不需要接头序列,所述非必需N端氨基酸区可以用于分离功能性结构域和防止位阻干扰。
[0092] 其它化学接头包括糖类接头、脂质接头、脂肪酸接头、聚醚接头,例如,PEG等。例如,聚乙二醇接头可获自Shearwater Polymers,Inc.Huntsville,Alabama。这些接头任选地具有酰胺键、巯基键、或异双功能键。
[0093] 连接DNA聚合酶和非特异性DNA结合结构域的其它方法包括:通过表达阴性和阳性尾部的离子结合,和通过抗体和链霉抗生物素-生物素相互作用的间接结合。(参见,例如,Bioconjugate Techniques(生物缀合技术),见上文)。所述结构域也可以通过中间相互作用序列连接在一起。例如,Sso7d-相互作用序列,即结合Sso7d的序列可以与聚合酶连接。然后可以使得到的融合蛋白与Sso7d非共价连接,以生成Sso7d-聚合酶缀合物。
[0094] 在一些实施方案中,通过编码本发明的杂合聚合酶的核酸的重组表达来生产所述蛋白。这样的杂合聚合酶可以如下制备:通过本领域已知的方法,在适当的编码框中使编码期望的氨基酸序列的适当核酸序列彼此连接,并通过本领域已知的方法表达产物。
[0095] 编码要掺入本发明杂合聚合酶中的结构域的核酸可以利用重组遗传学领域中的常规技术来获得。公开本发明中使用的一般方法的基础课本包括Sambrook和Russell,Molecular Cloning,A Laboratory Manual(分子克隆,实验室手册)(第3版2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(基因转移和表达:实验室手册)(1990);和Current Protocols in Molecular Biology(当前分子生物学方案)(Ausubel等编.,1994-1999)。
[0096] 使用多种方法中的任一种,可以得到编码DNA聚合酶和非特异性DNA结合结构域多肽的核酸序列。在一些实施方案中,所述编码多肽的核酸序列通过与探针杂交而从cDNA和基因组DNA文库进行克隆,或使用扩增技术用寡核苷酸引物进行分离。更常见地,使用DNA或RNA模板,使用扩增技术来扩增和分离Sso7和聚合酶序列(参见,例如,Dieffenfach和Dveksler,PCR Primers:A Laboratory Manual(PCR引物:实验室手册)(1995))。可替换地,可以合成地制备重叠寡核苷酸,并连接以产生一个或多个结构域。还可以使用抗体作为探针从表达文库中分离出编码催化或双链核酸结合结构域的核酸。
[0097] 在使用PCR获得编码DNA聚合酶或非特异性DNA结合结构域的核酸的一个例子中,使用含有一个限制位点的有义引物和含有另一个限制位点的反义引物,PCR扩增核酸序列或子序列。这将产生编码期望的结构域序列或子序列和具有末端限制位点的核酸。然后可以将该核酸连接进载体中,所述载体含有编码第二结构域且具有适当的对应限制位点的核酸。所述结构域可以直接地连接,或者可以被接头或其它蛋白序列隔开。本领域技术人员使用在GenBank或其它来源中提供的序列信息,可以确定合适的PCR引物。还可以通过定位诱变将适当的限制位点添加至编码蛋白或蛋白子序列的核酸。用适当的限制性内切核酸酶切割含有编码结构域的核苷酸序列或子序列的质粒,然后根据标准方法连接进适当的载体中进行扩增和/或表达。
[0098] 本发明的示例性杂合聚合酶包括,例如,具有SEQ ID NO:5的氨基酸序列的聚合酶或包含的氨基酸序列与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%)同一性的聚合酶。
[0099] 测定评估聚合酶活性
[0100] 聚合酶的活性可以使用可以用于确定聚合酶的持续合成能力或修饰活性的多种测定来测量。活性的提高可以包括持续合成能力的提高和效率的提高。
[0101] 本发明的聚合酶,例如,SEQ ID NO:5,显示聚合酶活性,例如,持续合成能力,引物/模板结合特异性,以及3′至5′核酸外切酶活性。所述活性可以使用本领域中的标准技术来测量。
[0102] 例如,聚合酶持续合成能力可以通过本领域中技术人员已知的多种方法来测量。聚合酶持续合成能力一般定义为在修饰酶与引物模板的单次结合事件过程中引入的核苷酸数。例如,5′FAM-标记的引物复性为环状或线性化ssM13mp18DNA,以形成引物模板。在测量持续合成能力中,引物模板通常以比聚合酶显著摩尔过量的量存在,以使得任何引物模板被聚合酶延伸多于一次的机会最小化。因此,在存在缓冲液和dNTPs的条件下,引物模板以比率诸如约4000:1(引物DNA:DNA聚合酶)与聚合酶混合。加入MgCl2,以开始DNA合成。开始后样品在不同时刻猝灭,并在测序凝胶上分析。在这样的聚合酶浓度下,其中中间产物长度不随时间或聚合酶浓度而变化,所述长度对应于该酶的持续合成能力。然后将本发明的蛋白(例如,SEQ ID NO:2或SEQ ID NO:5)的持续合成能力与野生型酶的持续合成能力进行比较。
[0103] 效率可以通过测量酶生成产物的能力来证明。增加的效率可以通过测量酶生成产物能力的增加来证明。这样的分析测量通过确定反应中获得的产物量间接测量双链核酸双链体的稳定性。例如,可以使用PCR测定来测量使用短,例如长度为12个核苷酸的,在升高的温度,例如50℃复性的引物获得的PCR产物量。在该分析中,提高的效率通过聚合酶在使用在50℃复性的12个核苷酸的引物的PCR反应中产生更多的产物的能力来显示。
[0104] 效率也可以在例如实时PCR中测量。Ct值表示产生可检测量的DNA所需的循环次数(DNA的″可检测″量通常为在背景以上2倍,一般5倍,10倍,100倍或以上)。有效的聚合酶可以能够通过更接近PCR的理论最大扩增效率在较少次的循环中制备可检测量的DNA。因此,低的Ct值表示酶的扩增效率更高。
[0105] 长PCR可以用作证明提高的效率的另一种方法。例如,与具有相对较低效率的酶相比,具有提高的效率的酶典型地容许以更短的延伸时间扩增长扩增子(>5kb)。
[0106] 测定如盐灵敏性也可以用于证明本发明的聚合酶的效率或等效效率(equivalent efficiency)的提高。本发明的聚合酶可以显示增加的对高盐浓度的耐受,即,具有提高的持续合成能力的加工酶可以在更高盐浓度产生更多的产物。例如,可以进行PCR分析以确定:在具有高盐(例如,80mM)的反应条件中,与野生型聚合酶相比,在使用本发明的聚合酶的反应中获得的产物的量。
[0107] 评估本发明的聚合酶的效率的其他方法可以由本领域技术人员使用指定修饰酶的酶活性的标准测定来确定。
[0108] 引物/模板特异性是酶辨别匹配引物/模板双链体和错配引物/模板双链体的能力。特异性可以例如通过比较两个反应的相对产率来确定,一个反应使用匹配引物,且另一个反应使用错配引物。具有增加辨别力的酶应该与匹配引物具有比与错配引物更高的相对产率,即利用匹配引物的反应对比使用错配引物的反应的产率比为约1以上。该比率可以然后与使用野生型聚合酶的平行反应组中获得的产率进行比较。
[0109] 生产聚合酶
[0110] 本发明的聚合酶可以使用本领域中已知的技术制备。编码聚合酶并且任选地与DNA结合结构域连接的核酸可以使用重组遗传学领域中的常规技术获得。编码SEQ ID NO:2的示例性核酸被作为SEQ ID NO:1提供。取决于所述聚合酶要在其中表达的宿主细胞,可以采用密码子优化来优化所述聚合酶在特定宿主细胞中的表达。公开本发明中使用的一般方法的基础课本包括Sambrook和Russell,Molecular Cloning,A Laboratory Manual(分子克隆,实验室手册)(第3版2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(基因转移和表达:实验室手册)(1990);和Current Protocols in Molecular Biology(当前分子生物学方案)(Ausubel等编.,1994-1999)。这样的核酸还可以通过体外扩增方法诸如本文中和Berger,Sambrook,和Ausubel,以及Mullis等,(1987)美国专利号4,683,202;PCR Protocols A Guide to Methods and Applications(PCR流程,方法和应用指导)(Innis等编)Academic Press Inc.(科学出版社)San Diego(圣地亚哥),加利福尼亚(1990)(Innis);Arnheim&Levinson(1990年10月1日)C&EN36-47;The Journal OfNIH Research(NIH研究杂志)(1991)3:81-94;Kwoh等(1989)Proc.Natl.Acad.Sci.USA(美国国家科学院学报)86:1173;Guatelli等(1990)Proc.Natl.Acad.Sci.USA(美国国家科学院学报)87,1874;Lomell等(1989)J.Clin.Chem.(临床化学杂志),35:1826;Landegren等,(1988)Science(科学)241:1077-1080;Van Brunt(1990)Biotechnology(生物技术)8:291-294;Wu和Wallace(1989)Gene(基因)4:560;和Barringer等(1990)Gene(基因)89:117中记述的那些来获得,为了全部目的,特别是为了与扩增方法相关的全部教导,将其每一篇通过参考整体引入。
[0111] 技术人员应该认识到可以在不消除其生物学活性的条件下,对本发明的聚合酶另外进行修饰。可以进行一些修饰,以促进结构域克隆、表达或引入融合蛋白中。这样的修饰是本领域中技术人员公知的,且包括,例如,在编码结合结构域的多核苷酸任一端添加密码子以提供,例如,在氨基端添加的甲硫氨酸以提供起始位点,或置于任一端上的另外的氨基酸(例如,聚His)以构建方便定位的限制性位点或终止密码子或纯化序列。
[0112] 本发明的聚合酶可以在多种宿主细胞,包括,大肠杆菌,其它细菌宿主,酵母,丝状真菌,和各种高等真核细胞诸如COS,CHO和HeLa细胞系和骨髓瘤细胞系中表达。在微生物体中基因表达的技术记述在,例如,Smith,Gene  Expression  in Recombinant Microorganisms(在重组微生物中的基因表达)(Bioprocess Technology(生物处理技术),卷22),Marcel Dekker,1994中。有效用于表达的细菌的例子包括,但不仅限于,埃希氏菌属(Escherichia)、肠杆菌属(Enterobacter)、固氮菌属(Azotobacter)、欧文氏菌属(Erwinia)、杆菌属(Bacillus)、假单胞菌属(Pseudomonas)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、沙门氏菌属(Salmonella)、沙雷氏菌属(Serratia)、志贺氏菌属(Shigella)、根瘤菌属(Rhizobia)、透明颤菌属(Vitreoscilla)、和副球菌属
(Paracoccus)。有效用作表达宿主的丝状真菌包括,例如,以下属:曲霉属(Aspergillus),木霉属(Trichoderma),链孢霉属(Neurospora),青霉属(Penicillium),头孢菌属(Cephalosporium),绵霉属(Achlya),柄孢壳菌属(Podospora),毛霉属(Mucor),旋孢腔菌属(Cochliobolus),和Pyricularia。参见,例如,美国专利号5,679,543和Stahl和Tudzynski编.,Molecular Biology in Filamentous Fungi(丝状真菌分子生物学),John Wiley&Sons,1992。酵母中异源蛋白的合成是公知的且记述在文献中。Methods in Yeast Genetics(酵母遗传学方法),Sherman,F.,等,Cold Spring Harbor Laboratory(冷泉港实验室),(1982)是公认的描述可用于在酵母中生成酶的各种方法的作品。
[0113] 存在许多本领域中普通技术人员公知的用于生成本发明的聚合酶多肽的表达系统。(参见,例如,Gene Expression Systems(基因表达系统),Femandex和Hoeffler编.Academic Press(科学出版社),1999;Sambrook和Russell,见上文;和Ausubel等,见上文.)。典型地,将编码聚合酶的多核苷酸置于启动子的控制下,所述启动子在所需宿主细胞中起作用。许多不同的启动子是本领域中技术人员可获得的并已知的,且可以用于本发明的表达载体中,这取决于具体的应用。一般地,所选的启动子取决于其中所述启动子将具有活性的细胞。还任选地包括其它表达控制序列诸如核糖体结合位点、转录终止位点等。包括这些控制序列中的一个或多个的构建体称为“表达盒”。因此,引入编码连接的多肽的核酸,以在所需宿主细胞中获得高水平表达。
[0114] 适合用于特定宿主细胞中的表达控制序列通常通过克隆在该细胞中表达的基因来获得。常用的原核控制序列,其在本文中定义为包括用于转录起始的启动子,任选地,与操纵子一起,连同核糖体结合位点序列,包括这样的常用启动子,如β-内酰胺酶(青霉素酶)和乳糖(lac)启动子系统(Change等,Nature(自然)(1977)198:1056),色氨酸(trp)启动子系统(Goeddel等,Nucleic Acids Res.(核酸研究)(1980)8:4057),tac启动子(DeBoer,等,Proc.Natl.Acad.Sci.U.S.A.(美国国家科学院学报)(1983)80:21-25);和λ-来源的PL启动子和N-基因核糖体结合位点(Shimatake等,Nature(自然)(1981)292:128)。特定的启动子系统对于本发明不是关键的,可以使用任何可获得的在原核生物中起作用的启动子。标准细菌表达载体包括质粒诸如基于pBR322的质粒,例如,pBLUESCRIPTTM,pSKF,pET23D,λ-噬菌体来源的载体,和融合表达系统诸如GST和LacZ。还可以将表位标签添加至重组蛋白,以提供方便的分离方法,例如,c-myc、HA-标签、6-His(SEQ ID NO:15)标签、麦芽糖结合蛋白、VSV-G标签、抗-DYKDDDDK(SEQ ID NO:16)标签或任何这样的标签,其中很多是本领域中技术人员公知的。
[0115] 为了在除大肠杆菌以外的原核细胞中表达,需要在特定原核物种中起作用的启动子。这样的启动子可以获自已经从该物种克隆的基因,或可以使用异源启动子。例如,除大肠杆菌外,杂合trp-lac启动子还在杆菌属物种(Bacillus sp.)中起作用。这些和其它合适的细菌启动子是本领域中公知的,且记述在,例如,Sambrook等和Ausubel等中。用于表达本发明蛋白的细菌表达系统可以在例如,大肠杆菌,杆菌属物种,和Salmonella(Palva等,Gene(基因)22:229-235(1983);Mosbach等,Nature(自然)302:543-545(1983)中获得。用于这样的表达系统的试剂盒可商购。
[0116] 用于哺乳动物细胞、酵母、和昆虫细胞的真核表达系统是本领域中公知的,且也是可商购的。在酵母中,载体包括酵母整合质粒(例如,YIp5)和酵母复制质粒(YRp系列质粒)和pGPD-2。包含真核病毒的调节元件的表达载体典型地用于真核表达载体,例如,SV40载体,乳头瘤病毒载体,和源自EB病毒的载体中。其它示范性真核载体包括pMSG,pAV009/A+,pMTO10/A+,pMAMneo-5,杆状病毒pDSVE,和容许在CMV启动子,SV40早期启动子,SV40晚期启动子,金属硫蛋白启动子,鼠类乳腺肿瘤病毒启动子,劳氏肉瘤病毒启动子,多角体蛋白(polyhedrin)启动子,或显示出对在真核细胞中表达有效的其它启动子的指导下表达蛋白的任何其它载体。
[0117] 组成型或调节型启动子可以用于本发明中。调节型启动子可以是有利的,因为在诱导融合多肽表达前宿主细胞可以生长至高密度。异源蛋白的高水平表达在一些情形中延缓细胞生长。诱导型启动子是在可通过环境或发育因素诸如,例如,温度、pH、无氧或有氧条件、光、转录因子和化学制品改变表达水平的情况下指导基因表达的启动子。
[0118] 关于大肠杆菌和其它细菌宿主细胞,诱导型启动子是本领域中技术人员已知的。这些包括,例如,lac启动子,噬菌体λPL启动子,杂合trp-lac启动子(Amann等(1983)Gene(基因)25:167;de Boer等(1983)Proc.Nat′l.Acad.Sci.USA(美国国家科学院学报)80:
21),和噬菌体T7启动子(Studier等(1986)J.Mol.Biol.(分子生物学杂志);Tabor等(1985)Proc.Nat′l Acad.Sci.USA(美国国家科学院学报)82:1074-8)。这些启动子及其应用也在Sambrook等,见上文中讨论。
[0119] 翻译偶联可以用于增强表达。该策略使用源自对翻译系统天然的高度表达基因的短上游可读框,其置于启动子的下游,和核糖体结合位点,及随后相隔几个氨基酸密码子的终止密码子。紧挨着终止密码子之前是第二核糖体结合位点,且终止密码子之后是用于起始翻译的起始密码子。该系统溶解RNA中的二级结构,容许翻译的有效起始。参见Squires,等(1988),J.Biol.Chem.(生物化学杂志)263:16297-16302。
[0120] 多核苷酸构建体的构造可以涉及使用能够在细菌中复制的载体。这样的载体常用TM TM于本领域中。可商购许多试剂盒,以纯化来自细菌的质粒(例如,EasyPrep ,FlexiPrep ,来自Pharmacia Biotech(药物生物技术);StrataCleanTM,来自Stratagene;和,表达系统,Qiagen)。分离的和纯化的质粒可以然后进一步操作,以生成其它
质粒,并用于转化细胞。
[0121] 本发明的多肽可以在细胞内表达,或可以由细胞分泌。细胞内表达通常导致高产率。如果需要,可溶的活性融合多肽的量可以通过执行再折叠程序来增加(参见,例如,Sambrook等,见上文.;Marston等,Bio/Technology(生物/技术)(1984)2:800;Schoner等,Bio/Technology(生物/技术)(1985)3:151)。本发明的多肽可以在多种宿主细胞,包括大肠杆菌,其它细菌宿主、酵母和各种高等真核细胞诸如COS、CHO和HeLa细胞系和骨髓瘤细胞系中表达。所述宿主细胞可以是哺乳动物细胞、昆虫细胞、或微生物,诸如,例如,酵母细胞、细菌细胞、或真菌细胞。
[0122] 一旦表达,所述多肽可以根据本领域的标准程序,包括硫酸铵沉淀、亲和柱、柱层析、凝胶电泳等来纯化(参见,一般地,R.Scopes,Protein Purification(蛋白质纯化),Springer-Verlag,N.Y.(1982),Deutscher,Methods in Enzymology(酶学方法)卷182:Guide to Protein Purification.(蛋白质纯化指导),Academic Press,Inc.(科学出版社)N.Y.(1990))。在一些实施方案中,至少约90-95%的同质性的基本纯组成是优选的,且
98-99%以上的同质性是最优选的。一旦纯化,部分地或如果需要,纯化至同质,则可以然后使用所述多肽(例如,在DNA扩增中)。
[0123] 为了促进本发明的多肽的纯化,编码所述多肽的核酸还可以包括关于表位或“标签”的编码序列,关于所述表位或“标签”可以获得亲和结合试剂。合适的表位的例子包括myc和V-5报告基因;有效用于重组生成具有这些表位的融合多肽的表达载体是可商购的(例如,Invitrogen(Carlsbad加利福尼亚)载体pcDNA3.1/Myc-His和pcDNA3.1/V5-His适合于在哺乳动物细胞中表达)。适合于使标签与本发明的融合蛋白连接的另外的表达载体和相应的检测系统是本领域中技术人员已知的,且许多是可商购的(例如,FLAG″(Kodak,Rochester NY)。合适的标签的另一个实例是聚组氨酸序列,其能够结合金属螯合的亲和配体。典型的,使用6个相邻的组氨酸,尽管人们可以使用多于或少于6个。可以担当聚组氨酸标签的结合结构部分的合适金属螯合亲和配体包括次氮基三乙酸(NTA)(Hochuli,E.(1990)″Purification of recombinant proteins with metal chelating adsorbents(使用金属螯合吸附剂纯化重组蛋白)″,在Genetic Engineering:Principles and Methods(遗传工程:原理和方法),J.K.Setlow,编,Plenum Press,N.Y.;可商购自Qiagen(Santa Clarita,CA))。
[0124] 本领域中技术人员应该认识到在生物表达或纯化后,聚合酶缀合物可以具有与组成型(constituent)多肽的天然构象实质不同的构象。在该情形中,可能必须或需要变性和还原多肽并然后导致多肽再折叠为优选的构象。还原和变性蛋白和诱导再折叠的方法是本领域中技术人员公知的(参见,Debinski等(1993)J.Biol.Chem.(生物化学杂志)268:14065-14070;Kreitman和Pastan(1993)Bioconjug.Chem.(生物缀合化学)4:581-585;和Buchner等(1992)Anal.Biochem.(分析生物化学)205:263-270)。Debinski等,例如,描述在胍-DTE中变性和还原内含体蛋白。蛋白然后在含有氧化的谷胱甘肽和L-精氨酸的氧化还原缓冲液中再折叠。
[0125] III.方法
[0126] 在另一方面中,本发明提供使用本发明的聚合酶(例如,这样的多肽,所述多肽包含具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性的DNA聚合酶或者与序列非特异性DNA结合结构域连接的聚合酶)扩增靶核酸的方法。这样的扩增反应包括但不限于聚合酶链反应(PCR)。可以使用本文中所述的组合物进行的聚合酶链反应包括但不限于反转录PCR(rt-PCR)和定量PCR(qPCR)。
[0127] 在一些实施方案中,本发明的方法可用于扩增长扩增子,例如,至少5kb,至少7kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子。在一些实施方案中,与由SEQ ID NO:7或SEQ ID NO:
8组成的DNA聚合酶相比,使用本发明的聚合酶(例如,这样的多肽,所述多肽包含具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性的DNA聚合酶或与序列非特异性DNA结合结构域连接的聚合酶)扩增靶核酸的方法导致至少5kb,至少7kb,至少10kb,至少12kb,至少15kb,至少17kb,至少20kb,至少22kb,至少25kb,至少27kb,至少30kb,至少35kb,或至少40kb的扩增子的更高的扩增效率。
[0128] 使用聚合酶(例如,这样的多肽,所述多肽包含具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性DNA聚合酶或与序列非特异性DNA结合结构域连接的聚合酶)的本发明的扩增方法使用足以扩增核酸分子的反应混合物进行。在一些实施方案中,除了DNA聚合酶或杂合聚合酶以外,扩增反应混合物还包含一种或多种以下组分:核苷酸三磷酸,一种或多种寡核苷酸引物,盐,缓冲剂,水,稳定剂,和DNA-结合染料。
[0129] 在一些实施方案中,本发明的扩增方法包括一起使用聚合酶(例如,这样的多肽,所述多肽包含具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性的多肽DNA聚合酶或与序列非特异性DNA结合结构域连接的聚合酶)和提高扩增特异性的试剂,例如,所述试剂选自精氨酸、亚精胺和精胺。在一些实施方案中,除了DNA聚合酶或杂合聚合酶以外,扩增反应混合物还包含一种或多种以下组分:核苷酸三磷酸,一种或多种寡核苷酸引物,盐,缓冲剂,水,稳定剂,和DNA-结合染料;以及选自精氨酸、亚精胺和精胺的试剂。
[0130] 在一些实施方案中,本发明的扩增反应混合物包含:浓度为约1U/ml至约75U/ml(例如,约1U/ml,5U/ml,10U/ml,15U/ml,20U/ml,25U/ml,30U/ml,35U/ml,40U/ml,45U/ml,50U/ml,55U/ml,60U/ml,65U/ml,70U/ml,或75U/ml)的如本文所述的聚合酶(例如,这样的多肽,所述多肽包含具有的氨基酸序列与SEQ ID NO:2有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性的DNA聚合酶或与序列非特异性DNA结合结构域连接的聚合酶);浓度为约0.1mM至约10mM(例如,约0.1mM,0.2mM,0.3mM,0.4mM,0.5mM,0.6mM,0.7mM,
0.8mM,0.9mM,1mM,2mM,3mM,4mM,5mM,6mM,7mM,8mM,9mM,或10mM)的dNTPs;浓度为约1mM至约20mM(例如,约1mM,2mM,3mM,4mM,5mM,6mM,7mM,8mM,9mM,10mM,11mM,12mM,13mM,14mM,
15mM,16mM,17mM,18mM,19mM,或20mM)的镁,例如,MgCl2;浓度为约10mM至约100mM(例如,约
10mM,20mM,30mM,40mM,50mM,60mM,70mM,80mM,90mM,或100mM)的(MH4)2SO4;浓度为约50mM至约200mM(例如,约50mM,60mM,70mM,80mM,90mM,100mM,110mM,120mM,130mM,140mM,
150mM,160mM,170mM,180mM,190mM,或200mM)的钾,例如,KCl;浓度为约50mM至约200mM(例如,约50mM,60mM,70mM,80mM,90mM,100mM,110mM,120mM,130mM,140mM,150mM,160mM,
170mM,180mM,190mM,或200mM)的缓冲剂,例如,Tris pH8.5-9.5;浓度为约100mM至约500mM(例如,约100mM,125mM,150mM,175mM,200mM,225mM,250mM,275mM,300mM,325mM,350mM,
375mM,400mM,425mM,450mM,475mM,或500mM)的二糖,例如,海藻糖;浓度为约50mM至约
200mM(例如,约50mM,60mM,70mM,80mM,90mM,100mM,110mM,120mM,130mM,140mM,150mM,
160mM,170mM,180mM,190mM,或200mM)的一种或多种渗压剂(osmolyte),例如,肌氨酸、三甲胺N-氧化物(TMAO)、二甲基巯基丙酸(dimethylsulfoniopropionate)和三甲基甘氨酸;浓度为约0.1%至约0.5%(例如,约0.1%,0.2%,0.3%,0.4%,或0.5%)的Tween-20;浓度为约1%至约5%(例如,约1%,2%,3%,4%,或5%)的甘油;浓度为约1%至约10%(例如,约
1%,1.5%,2%,2.5%,3%,3.5%,4%,4.5%,5%,5.5%,6%,6.5%,7%,7.5%,8%,
8.5%,9%,9.5%或10%)的DMSO;浓度为约0.001%至约0.01%(例如,约0.001%,
0.002%,0.003%,0.004%,0.005%,0.006%,0.007%,0.008%,0.009%或0.01%)的荧光素;浓度为约0.5X至约5X(例如,约0.5X,0.6X,0.7X,0.8X,0.9X,1X,1.5X,2X,2.5X,3X,
3.5X,4X,4.5X,或5X)的DNA结合染料(例如,花青染料);和任选地,浓度为约1mM至约100mM(例如,约1mM,5mM,10mM,15mM,20mM,25mM,30mM,35mM,40mM,45mM,50mM,55mM,60mM,65mM,
70mM,75mM,80mM,85mM,90mM,95mM,或100mM)的精氨酸、亚精胺或精胺或其盐。
[0131] 使用本领域已知的和在下面更详细地描述的测定,可以鉴别和定量由本发明的一些方面引起的效率和特异性的提高。
[0132] 在一些实施方案中,可以使用基于染料的qPCR检测方法来监测利用本发明组分的扩增反应。这样的检测方法一般依赖于监测由于DNA结合染料与扩增的DNA的结合而引起的荧光信号增加。例如,SYBR Green I,即一种常用的荧光DNA结合染料,结合所有双链DNA并且通过测量整个循环中荧光增加来监测检测。SYBR Green I具有分别在494nm和521nm的激发和发射最大值。
[0133] 在其它实施方案中,使用基于探针的qPCR检测方法来监测利用本发明组分的扩增反应。这样的检测方法一般依赖于所需PCR产物的序列特异性检测。与检测全部双链DNA的基于染料的qPCR方法不同,基于探针的qPCR利用荧光标记的靶标特异性探针,其检测扩增DNA中的特定序列。
[0134] 在一些方面,可能需要包括另外的化合物作为添加剂来提高扩增反应,包括但不仅限于qPCR中的效率。在一些实施方案中,与缺乏添加剂的对照混合物相比,包含添加剂足以使聚合酶缀合物的效率增加至少5、10、15、20、25、35、40或50%或更多。
[0135] 在一些实施方案中,本发明的聚合酶缀合物在用于包括一些结合染料(诸如,EvaGreen DNA结合染料)的制剂中时,表现出对于一些靶标的低效率。所述低效率在一些实施方案中,可以导致与低输入DNA浓度相关的Ct值延迟。用于测量特定反应的效率的方法是本领域中已知的并在下文中更详细地描述。
[0136] 在一些实施方案中,所述添加剂是包括在本发明的扩增反应中的渗压剂(osmolyte),以提高效率。渗压剂家族的成员已经显示出提高蛋白的热稳定性(Santoro,Biochemistry(生物化学),1992)以及降低DNA双螺旋稳定性(Chadalavada,FEBS Letters(FEBS书信),1997)。在一些实施方案中,渗压剂是小分子或化合物,其通过有生命的生物体应答环境压力诸如极端温度、脱水、或盐度而产生并且保护它们的细胞成分并帮助维持最佳胞质条件。用于本发明中的渗压剂可以包括但不仅限于肌氨酸,三甲胺N-氧化物(TMAO),二甲基巯基丙酸,和三甲基甘氨酸。肌氨酸化学上类似甜菜碱,即一种已经显示出改善常规PCR的化学制品(Henke,Nucleic Acids Research(核酸研究),1997)。
[0137] 在渗压剂的常规应用中,该化合物的稳定作用一般在相对高浓度(>1M)下观察到。然而,在本发明的方法中,已经发现毫摩尔浓度的渗压剂有效提高扩增反应诸如qPCR的反应效率。在不受作用机制束缚的条件下,效率的提高可能是提高含有低浓度输入DNA样品的反应中的DNA聚合酶与DNA模板靶向区域的易接近性的结果。在一些实施方案中,浓度为约100-约1000mM的渗压剂用于本发明的方法和试剂盒中。在其它实施方案中,浓度为约50-约700、约100-约600、约150-约500、约200-约400mM和约300-约350mM的渗压剂用于本发明的方法和试剂盒中。在一些实施方案中,本发明的方法、反应混合物、和试剂盒中使用的渗压剂是肌氨酸(任选地,处于以上列出的浓度)。
[0138] IV.反应混合物
[0139] 在另一方面中,本发明提供反应混合物,所述反应混合物包含本发明的聚合酶。在一些实施方案中,反应混合物包含DNA聚合酶,所述DNA聚合酶具有SEQ ID NO:2的氨基酸序列,或者所述DNA聚合酶包含与SEQ ID NO:2具有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性的氨基酸序列。在一些实施方案中,反应混合物包含多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性并且与非特异性DNA结合结构域(例如,包含与SEQ ID NO:4或SEQ ID NO:10具有至少80%同一性的氨基酸序列的非特异性DNA结合结构域)连接。在一些实施方案中,反应混合物包含多肽,所述多肽具有SEQ ID NO:5的氨基酸序列,或者所述多肽包含的氨基酸序列与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少
95%,至少96%,至少97%,至少98%,或至少99%)同一性。
[0140] 反应混合物还可以包含一种或多种用于扩增靶核酸的试剂,包括但不限于靶核酸,一种或多种寡核苷酸,缓冲剂,核苷酸三磷酸,盐,稳定剂,一种或多种用于提高效率的添加剂,不含核酸酶的水,和/或双链DNA结合染料。
[0141] 在一些实施方案中,反应混合物可以包含足量的用于提高核酸扩增特异性的试剂。例如,在一些实施方案中,所述试剂选自精氨酸(例如,L-精氨酸或D-精氨酸)、亚精胺和精胺或其盐。在一些实施方案中,反应混合物可以包含另外的化合物作为添加剂以提高扩增反应的效率。在一些实施方案中,所述添加剂是渗压剂,包括但不限于,肌氨酸、三甲胺N-氧化物(TMAO)、二甲基巯基丙酸或三甲基甘氨酸。
[0142] V.试剂盒
[0143] 在另一方面中,本发明提供用于进行核酸扩增反应的试剂盒。所述试剂盒包括本发明的聚合酶(例如,这样的多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性,或这样的多肽,所述多肽包含DNA聚合酶,所述DNA聚合酶具有的氨基酸序列与SEQ ID NO:2有至少95%同一性并且与非特异性DNA结合结构域连接)。在一些实施方案中,试剂盒包含这样的DNA聚合酶:具有SEQ ID NO:2的氨基酸序列的DNA聚合酶或包含与SEQ ID NO:2具有至少95%(或至少96%,至少97%,至少98%,或至少99%)同一性的氨基酸序列的DNA聚合酶。在一些实施方案中,试剂盒包含这样的多肽:具有SEQ ID NO:5的氨基酸序列的多肽或包含与SEQ ID NO:5具有至少80%(或至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少
98%,或至少99%)同一性的氨基酸序列的多肽。
[0144] 任选地,所述试剂盒包含一种或多种dNTP,至少一种缓冲剂,和/或双链DNA结合染料。这样的试剂盒还可以包括稳定剂和其他添加剂(例如,肌氨酸)以提高扩增反应的效率。这样的试剂盒还可以包括一种或多种引物以及使用所述试剂盒的组分进行核酸扩增反应的使用说明。任选地,所述试剂盒还可以包含足量的试剂以提高核酸扩增的特异性。例如,在一些实施方案中,所述试剂选自精氨酸(例如,L-精氨酸或D-精氨酸)、亚精胺和精胺或其盐。
实施例
[0145] 下述实施例意图解释、而不是限制要求保护的发明。
[0146] 实施例1
[0147] 测试来自杂合聚合酶变体的文库的96个克隆的裂解物的DNA聚合酶活性,3’-5’核酸外切酶活性和蛋白表达水平。选择显示聚合酶活性与核酸外切酶活性之比>1的克隆用于进一步纯化和表征。在使用等单位的纯化的酶的PCR中测试的若干克隆中,指定为“H10”的变体显示提高的扩增长扩增子(20kb)的能力。见图1。对7.5kb扩增子观察到类似的结果,其中与对照杂合聚合酶(SEQ ID NO:8)相比,变体H10产生显著更多的7.5kb产物。
[0148] 对H10以及Taq聚合酶和对照杂合聚合酶(SEQ ID NO:8)进行聚合酶保真度测试。结果显示:与Taq DNA聚合酶相比,H10具有明显更高的保真度,并且与之前表征的杂合聚合酶克隆相比,H10具有可比的或稍高的保真度。
[0149] H10的氨基酸序列(SEQ ID NO:5)由聚合酶序列(SEQ ID NO:2)和序列非特异性DNA结合结构域(SEQ ID NO:4)组成。图2显示H10的聚合酶序列与对照杂合聚合酶的聚合酶序列的比对。不意在限制本发明的范围,据信,两种聚合酶的氨基酸序列的一种或多种差异导致与对照相比的在H10变体中观察到的效率提高。
[0150] 应当理解,本文所述的实施例和实施方案仅用于例证目的,并且提示本领域技术人员可以以此为依据进行各种修饰或改变,且它们包括在本申请的精神和范围和所附权利要求范围内。本文引述的所有公开文献、专利和专利申请通过参考引用为所有目的整体并入本文。
[0151] 序列表
[0152] SEQ ID NO:1(SEQ ID NO:2的编码序列)
[0153] ATGATCCTGGATGCTGACTACATCACTGAAGAAGGCAAACCGGTTATCCGTCTGTTCAAAAAAGAGAACGGCAAATTTAAGATTGAGCATGATCGCACCTTTCGTCCATACATTTACGCTCTGCTGAAAGATGATTCTAAGATTGATGAAGTTAGAAAAATCACTGGTGAGCGCCATGGCAAGATTGTTCGTATCGTTGATGCGGAAAAGGTAGAAAAGAAATTTCTGGGCAGACCAATCGAGGTGTGGAAACTGTATCTCGAACATCCACAAGATGTTCCGGCTATTCGCGATAAAGTTCGCGAACATCCTGCAGTTGTTGACATCTTCGAATACGATATTCCATTTGCAAAGCGTTACCTCATCGACAAAGGCCTGATACCAATGGAGGGCGAGGAAGAACTCAAGATCCTGGCGTTCGATATAGAAACCCTCTATCACGAAGGCGAAGAGTTTGGTAAAGGCCCAATTATAATGATCAGCTATGCAGATGAAAACGAAGCAAAGGTGATTACTTGGAAAAACATAGATCTCCCATACGTTGAGGTTGTATCTTCCGAGCGCGAGATGATTAAGCGCTTTCTCAGAGTTATCCGCGAGAAGGATCCGGACGTTATCATTACTTATAACGGCGACTCTTTTGACTTCCCATATCTGGTGAAACGCGCAGAAAAACTCGGTATTAAACTGACTATCGGCCGTGATGGTTCCGAGCCGAAGATGCAGCGTCTCGGCGATATGACCGCTGTAGAAATTAAGGGTCGTATCCATTTCGACCTGTATCATGTAATTCGTCGTACTATTAACCTCCCGACTTACACTCTCGAGGCTGTATATGAAGCAATTTTTGGTAAGCCGAAGGAGAAGGTATACGCCGATGAGATTGCAGAGGCGTGGGAATCCGGTGAGGGCCTCGAGCGTGTTGCAAAATACTCCATGGAAGATGCAAAGGTGACTTATGAACTCGGCAAAGAATTCCTCCCAATGGAAATCCAGCTCTCTCGCCTGGTTGGCCAACCACTGTGGGATGTTTCTCGTTCTTCCACCGGTAACCTCGTAGAGTGGTTTCTCCTGCGCAAAGCGTACGAACGCAACGAAGTGGCTCCGAACAAGCCATCTGAAGAAGAGTATGAACGCCGTCTCCGCGAGTCTTACGCTGGTGGCTATGTTAAAGAGCCAGAAAAGGGCCTCTGGGAAAACATCGTGTCCCTCGATTTTCGCTCTCTGTATCCGTCTATTATCATTACCCACAACGTGTCTCCGGATACTCTCAACCGCGAGGGCTGCAGAGAGTATGATATTGCTCCGGAAGTAGGCCACAAGTTCTGCAAGGACTTCCCGGGCTTTATTCCGTCTCTCCTGAAACATCTGCTCGAGGAACGCCAAAAGATTAAGACTAAAATGAAGGAGTCCCAGGATCCGATTGAAAAAAAAATGCTCGACTATCGCCAAAGAGCGATTAAAATCCTCGCAAACTCTTTTTACGGCTATTATGGCTATGCAAAAGCACGCTGGTACTGTAAGGAGTGTGCTGAGTCCGTTACTGCTTGGGGTCGCAAATACATCGAGTTCGTGTGGAAGGAGCTCGAAGAAAAGTTTGGCTTTAAAGTTCTCTACATTGACACTGATGGTCTCTATGCGACTATTCCGGGTGGTGAGCCTGAGGAAATTAAGAAAAAGGCTCTAGAATTTGTGAAATACATTAACTCGAAGCTCCCGGGTCTCCTGGAGCTCGAATATGAAGGCTTTTATGTTCGCGGCTTCTTCGTTACCAAGAAGAGATATGCGGTGATTGATGAAGAAGGCAAAGTTATTACTCGTGGTCTCGAGATTGTGCGCCGTGATTGGAGCGAAATTGCGAAAGAAACTCAAGCTAGAGTTCTCGAGACTATTCTCAAACACGGCAACGTTGAAGAAGCTGTGAAAATTGTAAAAGAAGTAACCCAAAAGCTCGCTAACTATGAAATTCCGCCAGAGAAGCTCGCGATTTATGAGCAGATTACTCGCCCGCTGCATGAGTATAAGGCGATTGGTCCGCACGTGGCTGTTGCAAAGAAACTGGCTGCTAGAGGCGTGAAAATTAAACCGGGTATGGTAATTGGCTACATTGTACTCCGCGGCGATGGTCCGATTAGCAAACGTGCAATTCTAGCTGAGGAATTCGATCCGAGAAAGCACAAGTATGACGCAGAATATTACATTGAGAACCAGGTGCTCCCGGCGGTACTCCGTATTCTGGAGGGTTTTGGCTACCGTAAGGAAGACCTCCGCTGGCAAAAGACTAAACAGGTTGGCCTCACTTCTTGGCTCAACATTAAAAAATCCGG
[0154] SEQ ID NO:2(聚合酶序列)
[0155] MILDADYITEEGKPVIRLFKKENGKFKIEHDRTFRPYIYALLKDDSKIDEVRKITGERHGKIVRIVDAEKVEKKFLGRPIEVWKLYLEHPQDVPAIRDKVREHPAVVDIFEYDIPFAKRYLIDKGLIPMEGEEELKILAFDIETLYHEGEEFGKGPIIMISYADENEAKVITWKNIDLPYVEVVSSEREMIKRFLRVIREKDPDVIITYNGDSFDFPYLVKRAEKLGIKLTIGRDGSEPKMQRLGDMTA VEIKGRIHFDLYHVIRRTINLPTYTLEAVYEAIFGKPKEKVYADEIAEAWESGEGLERVAKYSMEDAKVTYELGKEFLPMEIQLSRLVGQPLWDVSRSSTGNLVEWFLLRKAYERNEVAPNKPSEEEYERRLRESYAGGYVKEPEKGLWENIVSLDFRSLYPSIIITHNVSPDTLNREGCREYDIAPEVGHKFCKDFPGFIPSLLKHLLEERQKIKTKMKESQDPIEKKMLDYRQRAIKILANSFYGYYGYAKARWYCKECAESVTAWGRKYIEFVWKELEEKFGFKVLYIDTDGLYATIPGGEPEEIKKKALEFVKYINSKLPGLLELEYEGFYVRGFFVTKKRYAVIDEEGKVITRGLEIVRRDWSEIAKETQARVLETILKHGNVEEAVKIVKEVTQKLANYEIPPEKLAIYEQITRPLHEYKAIGPHVA VAKKLAARGVKIKPGMVIGYIVLRGDGPISKRAILAEEFDPRKHKYDAEYYIENQVLPAVLRILEGFGYRKEDLRWQKTKQVGLTSWLNIKKS
[0156] SEQ ID NO:3
[0157] 接头
[0158] gtgggg
[0159] SEQ ID NO:4
[0160] 示例性非特异性DNA结合结构域
[0161] Atvkfkykgeekevdiskikkvwrvgkmisftydegggktgrgavsekdapkellqmlekqkk
[0162] SEQ ID NO:5
[0163] 包含非特异性DNA结合结构域的示例性杂合聚合酶
[0164] MILDADYITEEGKPVIRLFKKENGKFKIEHDRTFRPYIYALLKDDSKIDEVRKITGERHGKIVRIVDAEKVEKKFLGRPIEVWKLYLEHPQDVPAIRDKVREHPAVVDIFEYDIPFAKRYLIDKGLIPMEGEEELKILAFDIETLYHEGEEFGKGPIIMISYADENEAKVITWKNIDLPYVEVVSSEREMIKRFLRVIREKDPDVIITYNGDSFDFPYLVKRAEKLGIKLTIGRDGSEPKMQRLGDMTA VEIKGRIHFDLYHVIRRTINLPTYTLEAVYEAIFGKPKEKVYADEIAEAWESGEGLERVAKYSMEDAKVTYELGKEFLPMEIQLSRLVGQPLWDVSRSSTGNLVEWFLLRKAYERNEVAPNKPSEEEYERRLRESYAGGYVKEPEKGLWENIVSLDFRSLYPSIIITHNVSPDTLNREGCREYDIAPEVGHKFCKDFPGFIPSLLKHLLEERQKIKTKMKESQDPIEKKMLDYRQRAIKILANSFYGYYGYAKARWYCKECAESVTAWGRKYIEFVWKELEEKFGFKVLYIDTDGLYATIPGGEPEEIKKKALEFVKYINSKLPGLLELEYEGFYVRGFFVTKKRYAVIDEEGKVITRGLEIVRRDWSEIAKETQARVLETILKHGNVEEAVKIVKEVTQKLANYEIPPEKLAIYEQITRPLHEYKAIGPHVA VAKKLAARGVKIKPGMVIGYIVLRGDGPISKRAILAEEFDPRKHKYDAEYYIENQVLPAVLRILEGFGYRKEDLRWQKTKQVGLTSWLNIKKSgtggggatvkfkykgeekevdiskikkvwrvgkmisftydegggktgrgavsekdapkellqmlekqkk
[0165] SEQ ID NO:6
[0166] 编码SEQ ID NO:5的核酸序列
[0167] ATGATCCTGGATGCTGACTACATCACTGAAGAAGGCAAACCGGTTATCCGTCTGTTCAAAAAAGAGAACGGCAAATTTAAGATTGAGCATGATCGCACCTTTCGTCCATACATTTACGCTCTGCTGAAAGATGATTCTAAGATTGATGAAGTTAGAAAAATCACTGGTGAGCGCCATGGCAAGATTGTTCGTATCGTTGATGCGGAAAAGGTAGAAAAGAAATTTCTGGGCAGACCAATCGAGGTGTGGAAACTGTATCTCGAACATCCACAAGATGTTCCGGCTATTCGCGATAAAGTTCGCGAACATCCTGCAGTTGTTGACATCTTCGAATACGATATTCCATTTGCAAAGCGTTACCTCATCGACAAAGGCCTGATACCAATGGAGGGCGAGGAAGAACTCAAGATCCTGGCGTTCGATATAGAAACCCTCTATCACGAAGGCGAAGAGTTTGGTAAAGGCCCAATTATAATGATCAGCTATGCAGATGAAAACGAAGCAAAGGTGATTACTTGGAAAAACATAGATCTCCCATACGTTGAGGTTGTATCTTCCGAGCGCGAGATGATTAAGCGCTTTCTCAGAGTTATCCGCGAGAAGGATCCGGACGTTATCATTACTTATAACGGCGACTCTTTTGACTTCCCATATCTGGTGAAACGCGCAGAAAAACTCGGTATTAAACTGACTATCGGCCGTGATGGTTCCGAGCCGAAGATGCAGCGTCTCGGCGATATGACCGCTGTAGAAATTAAGGGTCGTATCCATTTCGACCTGTATCATGTAATTCGTCGTACTATTanAACCTCCCGACTTACACTCTCGAGGCTGTATATGAAGCAATTTTTGGTAAGCCGAAGGAGAAGGTATACGCCGATGAGATTGCAGAGGCGTGGGAATCCGGTGAGGGCCTCGAGCGTGTTGCAAAATACTCCATGGAAGATGCAAAGGTGACTTATGAACTCGGCAAAGAATTCCTCCCAATGGAAATCCAGCTCTCTCGCCTGGTTGGCCAACCACTGTGGGATGTTTCTCGTTCTTCCACCGGTAACCTCGTAGAGTGGTTTCTCCTGCGCAAAGCGTACGAACGCAACGAAGTGGCTCCGAACAAGCCATCTGAAGAAGAGTATGAACGCCGTCTCCGCGAGTCTTACGCTGGTGGCTATGTTAAAGAGCCAGAAAAGGGCCTCTGGGAAAACATCGTGTCCCTCGATTTTCGCTCTCTGTATCCGTCTATTATCATTACCCACAACGTGTCTCCGGATACTCTCAACCGCGAGGGCTGCAGAGAGTATGATATTGCTCCGGAAGTAGGCCACAAGTTCTGCAAGGACTTCCCGGGCTTTATTCCGTCTCTCCTGAAACATCTGCTCGAGGAACGCCAAAAGATTAAGACTAAAATGAAGGAGTCCCAGGATCCGATTGAAAAAAAAATGCTCGACTATCGCCAAAGAGCGATTAAAATCCTCGCAAACTCTTTTTACGGCTATTATGGCTATGCAAAAGCACGCTGGTACTGTAAGGAGTGTGCTGAGTCCGTTACTGCTTGGGGTCGCAAATACATCGAGTTCGTGTGGAAGGAGCTCGAAGAAAAGTTTGGCTTTAAAGTTCTCTACATTGACACTGATGGTCTCTATGCGACTATTCCGGGTGGTGAGCCTGAGGAAATTAAGAAAAAGGCTCTAGAATTTGTGAAATACATTAACTCGAAGCTCCCGGGTCTCCTGGAGCTCGAATATGAAGGCTTTTATGTTCGCGGCTTCTTCGTTACCAAGAAGAGATATGCGGTGATTGATGAAGAAGGCAAAGTTATTACTCGTGGTCTCGAGATTGTGCGCCGTGATTGGAGCGAAATTGCGAAAGAAACTCAAGCTAGAGTTCTCGAGACTATTCTCAAACACGGCAACGTTGAAGAAGCTGTGAAAATTGTAAAAGAAGTAACCCAAAAGCTCGCTAACTATGAAATTCCGCCAGAGAAGCTCGCGATTTATGAGCAGATTACTCGCCCGCTGCATGAGTATAAGGCGATTGGTCCGCACGTGGCTGTTGCAAAGAAACTGGCTGCTAGAGGCGTGAAAATTAAACCGGGTATGGTAATTGGCTACATTGTACTCCGCGGCGATGGTCCGATTAGCAAACGTGCAATTCTAGCTGAGGAATTCGATCCGAGAAAGCACAAGTATGACGCAGAATATTACATTGAGAACCAGGTGCTCCCGGCGGTACTCCGTATTCTGGAGGGTTTTGGCTACCGTAAGGAAGACCTCCGCTGGCAAAAGACTAAACAGGTTGGCCTCACTTCTTGGCTCAACATTAAAAAATCCGGTACCGGCGGTGGCGGTGCAACCGTAAAGTTCAAGTACAAAGGCGAAGAAAAAGAGGTAGACATCTCCAAGATCAAGAAAGTATGGCGTGTGGGCAAGATGATCTCCTTCACCTACGACGAGGGCGGTGGCAAGACCGGCCGTGGTGCGGTAAGCGAAAAGGACGCGCCGAAGGAGCTGCTGCAGATGCTGGAGAAGCAGAAAAAGTGAGCTAGC
[0168] SEQ ID NO:7(对照聚合酶)
[0169] MILDADYITEEGKPVIRLFKKENGEFKIEHDRTFRPYIYALLKDDSKIEEVKKITAERHGKIVRIVDAEKVEKKFLGRPITVWRLYFEHPQDVPTIREKIREHSAVVDIFEYDIPFAKRYLIDKGLIPMEGDEELKLLAFDIETLYHEGEEFGKGPIIMISYADEEEAKVITWKKIDLPYVEVVSSEREMIKRFLKIIREKDPDIIITYNGDSFDLPYLAKRAEKLGIKLTIGRDGSEPKMQRIGDMTA VEVKGRIHFDLYHVIRRTINLPTYTLEA VYEAIFGKPKEKVYADEIAKAWETGEGLERVAKYSMEDAKATYELGKEFFPMEAQLSRLVGQPLWDVSRS STGNLVEWFLLRKAYERNELAPNKPDEREYERRLRESYAGGFVKEPEKGLWENIVSLDFRALYPSIIITHNVSPDTLNREGCRNYDVAPEVGHKFCKDFPGFIPSLLKRLLDERQKIKTKMKASQDPIEKIMLDYRQRAIKILANSYYGYYGYAKARWYCKECAESVTAWGREYIEFVWKELEEKFGFKVLYIDTDGLYATIPGGKSEEIKKKALEFVDYINAKLPGLLELEYEGFYKRGFFVTKKKYALIDEEGKIITRGLEIVRRDWSEIAKETQARVLEAILKHGNVEEAVRIVKEVTQKLSKYEIPPEKLAIYEQITRPLHEYKAIGPHVAVAKRLAAKGVKIKPGMVIGYIVLRGDGPISNRAILAEEYDPRKHKYDAEYYIENQVLPAVLRILEGFGYRKEDLRWQKTKQTGLTSWLNIKKS
[0170] SEQ ID NO:8(具有Sso7D DNA结合结构域的对照聚合酶)
[0171] MILDADYITEEGKPVIRLFKKENGEFKIEHDRTFRPYIYALLKDDSKIEEVKKITAERHGKIVRIVDAEKVEKKFLGRPITVWRLYFEHPQDVPTIREKIREHSAVVDIFEYDIPFAKRYLIDKGLIPMEGDEELKLLAFDIETLYHEGEEFGKGPIIMISYADEEEAKVITWKKIDLPYVEVVSSEREMIKRFLKIIREKDPDIIITYNGDSFDLPYLAKRAEKLGIKLTIGRDGSEPKMQRIGDMTA VEVKGRIHFDLYHVIRRTINLPTYTLEA VYEAIFGKPKEKVYADEIAKAWETGEGLERVAKYSMEDAKATYELGKEFFPMEAQLSRLVGQPLWDVSRS STGNLVEWFLLRKAYERNELAPNKPDEREYERRLRESYAGGFVKEPEKGLWENIVSLDFRALYPSIIITHNVSPDTLNREGCRNYDVAPEVGHKFCKDFPGFIPSLLKRLLDERQKIKTKMKASQDPIEKIMLDYRQRAIKILANSYYGYYGYAKARWYCKECAESVTAWGREYIEFVWKELEEKFGFKVLYIDTDGLYATIPGGKSEEIKKKALEFVDYINAKLPGLLELEYEGFYKRGFFVTKKKYALIDEEGKIITRGLEIVRRDWSEIAKETQARVLEAILKHGNVEEAVRIVKEVTQKLSKYEIPPEKLAIYEQITRPLHEYKAIGPHVAVAKRLAAKGVKIKPGMVIGYIVLRGDGPISNRAILAEEYDPRKHKYDAEYYIENQVLPAVLRILEGFGYRKEDLR WQKTKQTGLTSWLNIKKS gtggggatvkfkykgeekevdiskikkvwrvgkmisftyde
[0172] gggktgrgav
[0173] sekdapkellqmlekqkk
[0174] SEQ ID NO:9
[0175] YGYYGYAKARWYCKECAESVTAWGR
[0176] SEQ ID NO:10
[0177] Sso7d/Ssh7A/SsoP2
[0178] MATVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKK[0179] SEQ ID NO:11
[0180] Ssh7b
[0181] >gi|3138797|dbj|BAA28275.1[希氏硫化叶菌(Sulfolobus shibatae)]
[0182] MVTVKFKYKGEEKEVDTSKIKKVWRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKK[0183] SEQ ID NO:12
[0184] Sac7d
[0185] >gi|152933|gb|AAA80315.1|DNA-结合蛋白[硫化叶菌属物种(Sulfolobus sp.)]
[0186] MVKVKFKYKGEEKEVDTSKIKKVWRVGKMVSFTYDDNGKTGRGAVSEKDAPKELLDMLARAEREKK[0187] SEQ ID NO:13
[0188] Sac7e
[0189] >gi|70606201|ref|YP_255071.1|DNA-结合蛋白7e[嗜酸热硫化叶菌
[0190] (Sulfolobus acidocal darius)DSM639]
[0191] MAKVRFKYKGEEKEVDTSKIKKVWRVGKMVSFTYDDNGKTGRGAVSEKDAPKELMDMLARAEKKK[0192] SEQ ID NO:14
[0193] Sto7e
[0194] >gi|15920860|ref|NP_376529.1|DNA-结合蛋白7e[Sulfolobus tokodaii菌株7]
[0195] MVTVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDDNGKTGRGA VSEKDAPKELLQMLEKSGKK