糖苷水解酶61家族蛋白在纤维素加工中的用途转让专利

申请号 : CN201180040308.3

文献号 : CN103080306B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 蒂普纳斯·贝德亚洛伊路易斯·克拉克奥诺拉托·坎波皮亚诺克丽帕·拉奥洛兰·绍博亚诺什·托罗克杨劼

申请人 : 科德克希思公司

摘要 :

本发明提供从嗜热毁丝霉(Myceliophthora thermophila)获得的重组GH61蛋白、和编码所述蛋白的核酸。本发明还提供从嗜热毁丝霉上清液分离的、具有GH61蛋白活性的蛋白级分。这些制品可用于增加含纤维素的基质经历被一种或多种纤维素酶诸如内切葡聚糖酶、β-葡糖苷酶或纤维二糖水解酶糖化的反应中产物的产量。在乙醇生产中GH61蛋白与纤维素酶的组合可用于分解纤维素生物质为可发酵糖类。

权利要求 :

1.一种用于在含纤维素的基质经历被选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)和纤维二糖水解酶(CBH)的一种或多种纤维素酶糖化的反应中增加可发酵糖类的产量的方法,所述方法包括:在重组GH61蛋白存在下进行所述反应,所述重组GH61蛋白的氨基酸序列选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:26;

由此所述反应导致葡萄糖产量比从在所述重组GH61蛋白不存在时的相同条件下的糖化反应获得的葡萄糖产量高至少20%。

2.如权利要求1所述的方法,其中所述纤维素酶是内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)和2型纤维二糖水解酶(CBH2)的组合。

3.一种产生包括乙醇的生物燃料的方法,所述方法包括:

a)在藉以从含纤维素的基质产生简单糖类的条件下将所述基质与以下接触:i)选自内切葡聚糖酶(EG)、β-葡糖苷酶和纤维二糖水解酶(CBH)的多种纤维素酶;

ii)重组GH61蛋白,所述重组GH61蛋白的氨基酸序列选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:26;

b)在藉以发生发酵和产生乙醇的条件下将步骤(a)中产生的简单糖类与真菌细胞组合。

4.如权利要求3所述的方法,其中所述纤维素酶来自嗜热毁丝霉(M.thermophila)。

5.如权利要求3所述的方法,其中所述真菌细胞是酵母细胞。

6.如权利要求1或权利要求3所述的方法,其中所述含纤维素的基质获自小麦、麦秆、高粱、大米、大麦、甘蔗秆、甘蔗渣、草、柳枝稷、玉米粒、玉米芯、玉米纤维、玉米秸秆或其组合。

7.如权利要求1或权利要求3所述的方法,其中所述基质获自麦秆。

8.一种产生包括乙醇的生物燃料的方法,所述方法包括:

a)将含纤维素的基质与:

i)选自内切葡聚糖酶(EG)、β-葡糖苷酶、纤维二糖水解酶(CBH)的多种纤维素酶;和ii)重组GH61蛋白,所述重组GH61蛋白的氨基酸序列选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:26;在其中所述重组GH61蛋白增强所述纤维素酶的纤维素酶活性的条件下接触,从而从所述基质产生简单糖类;

b)在藉以发生发酵和产生乙醇的条件下将步骤(a)中产生的简单糖类与真菌细胞组合;

其中步骤(a)包括将所述含纤维素的基质与选自SEQ ID NO:61-68的一种或多种纤维素酶接触。

9.如权利要求8所述的方法,其中所述真菌细胞是酵母细胞。

10.一种从含纤维素的基质产生可发酵糖类的方法,包括将所述基质与以下组合:a)由一种或多种β-葡糖苷酶和一种或多种纤维二糖水解酶组成的酶组合物;和b)重组GH61蛋白,所述重组GH61蛋白的氨基酸序列选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:26;

其中所述酶组合物基本上无重组内切葡聚糖酶。

11.一种用于在含纤维素的基质经历被选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)和纤维二糖水解酶(CBH)的一种或多种纤维素酶糖化的反应中增加可发酵糖类的产量的方法,所述方法包括:在重组GH61蛋白存在下进行所述反应,所述重组GH61蛋白的氨基酸序列选自由以下组成的组:SEQ ID NO:2、SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:26。

12.如权利要求11所述的方法,其中所述纤维素酶是内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)和2型纤维二糖水解酶(CBH2)的组合。

说明书 :

糖苷水解酶61家族蛋白在纤维素加工中的用途

[0001] 相关申请的交叉引用
[0002] 本专利公开文件要求2010年8月20日提交的美国专利申请号61/375,788的优先权权益。该优先权申请特此通过引用全文并入本文。发明领域
[0003] 本发明总体涉及糖酵解酶及其用途的领域。更具体地,本发明提供来自嗜热毁丝霉(Myceliophthora thermophila)的GH61蛋白、和所述蛋白在从纤维素生物质产生可发酵糖类和乙醇中的用途。
[0004] 背景
[0005] 纤维素生物质是用于生成可发酵糖类的重要的可再生资源。这些糖类可用作发酵和其他代谢工艺的基质以产生生物燃料、化学化合物和其他有商业价值的终产物。虽然将糖类诸如单糖发酵为乙醇相对直接,但将纤维素生物质有效转化为可发酵的糖类是有挑战的。Ladisch等人,1983,Enzyme Microb.Technol.5:82。
[0006] 纤维素生物质向可发酵糖类的转化可以开始于化学、机械、酶促或其他预处理以提高纤维素对水解的敏感性。这种预处理之后可以是使用分解纤维素的酶进行的纤维素向纤维二糖、纤维寡糖、葡萄糖和其他糖类与糖聚合物的酶促转化。这些酶总称为“纤维素酶”,并包括内切葡聚糖酶、β-葡糖苷酶和纤维二糖水解酶。
[0007] 发明概述
[0008] 在一个方面,本发明提供从嗜热毁丝霉获得的重组糖苷水解酶61家族(GH61)蛋白和编码所述蛋白的核酸。本发明还提供来自嗜热毁丝霉培养物肉汤的分离和纯化的GH61蛋白。这些蛋白可用于增加含纤维素的基质经历被纤维素酶诸如内切葡聚糖酶、β-葡糖苷酶和纤维二糖水解酶之一或其组合糖化的反应的产物的产量。重组或分离的GH61蛋白的加入或存在可增加纤维素酶的产物的产量,例如,至少20%、30%、50%、70%、2倍、3倍或更多。
[0009] 本发明的一个实施方案是包含分离的或重组的GH61蛋白的组合物和用于制备这样的组合物的方法。蛋白可从嗜热毁丝霉分离,或可通过重组产生来获得。提供了二十四种全长嗜热毁丝霉GH61蛋白的氨基酸序列。本发明的GH61蛋白包括包含与所列的蛋白(SEQ ID NO:1-30)的任一种或其生物活性片段至少约60%、约70%、约80%、约85%、约90%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%相同的氨基酸序列的蛋白。示例性的GH61蛋白是GH61a(SEQ ID NO:2)。其他示例性GH61蛋白包括GH61o、GH61v、GH61x、GH61b和GH61e(SEQ ID NO:6、13、15、16、19、30)。其他示例性的GH61蛋白包括GH61f、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:7、13、20、21、23、26)。
[0010] 在一个方面,根据本发明的方法制备的组合物包括分离的或重组的GH61蛋白和本公开文件中列出的一种或多种纤维素酶,包括但不限于选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)和2型纤维二糖水解酶(CBH2)的纤维素酶。GH61蛋白和纤维素酶可从相同或不同的宿主细胞类型获得。
[0011] 本发明的另一实施方案是从纤维素基质产生可发酵糖类的方法。将包含基质的浆料与包含GH61蛋白的组合物接触,从而从基质产生可发酵糖类诸如葡萄糖和木糖。组合物还可包含选自纤维素酶蛋白(内切葡聚糖酶、β-葡糖苷酶、1型纤维二糖水解酶和2型纤维二糖水解酶)、酯酶、木聚糖酶、半纤维素酶、脂酶、蛋白酶、淀粉酶和葡糖淀粉酶的一种或多种酶。基质可获取自,例如,小麦、麦秆、高粱、玉米、大米、大麦、甘蔗渣、草、柳枝稷、玉米粒、玉米芯、玉米纤维、或其组合,以预处理的麦秆示例。
[0012] 可发酵糖类可被回收并用于产生终产物诸如醇(诸如乙醇或丁醇)、糖醇(诸如山梨醇)、有机酸(诸如乳酸、丙烯酸、乙酸、琥珀酸、谷氨酸、柠檬酸或丙酸)、氨基酸(诸如甘氨酸、赖氨酸或天冬氨酸)、有机酸、烷、烯、二醇或甘油。
[0013] 本发明的另一实施方案是在用一种或多种纤维素酶的糖化反应中,通过在上述GH61蛋白的存在下进行反应来增加可发酵糖类的产量的方法。
[0014] 在另一个方面,本发明提供水解纤维素基质的方法。将基质与包含一种或多种重组GH61蛋白、一种或多种β-葡糖苷酶(BGL)以及一种或多种纤维二糖水解酶(CBH)的组合物接触。在一些实施方案中,酶组合物基本上无内切葡聚糖酶(EG)。水解可导致葡萄糖产量比在所述GH61蛋白不存在时进行的相同反应的产量多至少20%、30%、50%、70%、2倍、3倍或更多。
[0015] 本发明的另一实施方案是从纤维素基质产生终产物的方法。在藉以产生可发酵糖类的条件下将基质与包含上述GH61蛋白的组合物接触。然后在发酵中将可发酵糖类与微生物接触以产生终产物,诸如以上列出的那些。该方法适于制备醇,尤其是乙醇,其中微生物是酵母。
[0016] 本发明的其他实施方案包括:a)上述重组GH61蛋白,任选地被产生为带有异源信号肽;b)编码GH61蛋白的核酸序列,其可以可操作地连接于异源启动子;c)产生所述重组GH61蛋白的宿主细胞,以嗜热毁丝霉、酵母、毛壳属(Chaetomium)、梭孢壳属(Thielavia)、支顶孢属(Acremonium)、毁丝霉属(Myceliophthora)、曲霉属(Aspergillus)或木霉属(Trichoderma)宿主细胞示例。
[0017] 本发明还包括重组产生的GH61蛋白在产生乙醇中的用途。GH61蛋白包括与所列的蛋白的任一种、或其具有GH61活性的片段至少60%、约70%、约80%、约85%、约90%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%相同的氨基酸序列。
[0018] 在一个相关的方面,本发明提供编码GH61蛋白的核酸。本发明还提供包含编码本发明的蛋白序列(SEQ ID NO:1至30)、可操作地连接于异源启动子的重组核酸序列的细胞。宿主细胞可以是(例如)嗜热毁丝霉细胞或酵母细胞。在一个实施方案中,重组核酸序列包括SEQ ID NO:31;或SEQ ID NO:32至59的任一种。该细胞还可表达选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)、和/或2型纤维二糖水解酶(CBH2)的至少一种重组纤维素酶蛋白。在一个实施方案中,该细胞表达GH61蛋白和选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL1)、1型纤维二糖水解酶(CBH1)、和/或2型纤维二糖水解酶(CBH2)、和/或所述纤维素酶蛋白的变体的至少一种、至少两种、或至少三种重组纤维素酶蛋白。
[0019] 在一个方面,本发明提供包含GH61蛋白(例如,SEQ ID NO:2)、内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)和2型纤维二糖水解酶(CBH2)的组合物,其中GH61蛋白、EG、BGL、CBH1和CBH2的组合质量是组合物中总的无细胞的蛋白的至少约20%、40%、60%、70%、80%、90%、95%、或基本上全部。组合物中可存在的CBH1、CBH2、EG和BGL酶的一种、两种、三种、或所有四种可以是衍生自天然存在的纤维素酶蛋白的变体。组合物还可以是包含纤维素酶蛋白的细胞培养物肉汤。
[0020] 在一个方面,本发明提供包含SEQ ID NO:3至30的任一种的GH61蛋白或其分泌片段。任选地,该蛋白包含分泌片段和相应的信号肽序列,如果存在信号肽序列的话。在一个相关的方面中,本发明提供与本文提供的多肽或生物活性片段具有至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的GH61蛋白变体。
[0021] 在一个方面,本发明提供编码上述蛋白的重组核酸序列,其可具有天然存在的基因或其片段的序列。在一个实施方案中,核酸的蛋白编码序列可操作地连接于异源信号序列。通常,该重组核酸序列可操作地连接于异源启动子。在一个方面,本发明提供包含本发明的重组核酸的宿主细胞。该细胞可表达选自内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)、和/或2型纤维二糖水解酶(CBH2)的至少一种、两种、三种或四种重组纤维素酶蛋白。
[0022] 在一个方面,本发明提供包含包括选自SEQ ID NO:1至30、和或其至少一种生物活性片段的分泌部分的序列的至少一种分离的蛋白的组合物。在一个实施方案中,该组合物还包含至少一种内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)、和/或2型纤维二糖水解酶(CBH2),其中GH61蛋白、EG、BGL、CBH1和/或CBH2的组合质量是组合物中总的无细胞的蛋白的至少约70%。
[0023] 在一个方面,本发明提供用于糖化的方法:(a)在至少一种GH61蛋白被分泌进入培养物肉汤的条件下培养本发明的细胞,和(b)在发生糖化的条件下混合所述肉汤与纤维素生物质,其中(a)可在(b)之前发生或与(b)同时发生。
[0024] 在一个方面,本发明提供水解淀粉的方法,包括将淀粉与包含一种或多种重组GH61蛋白和一种或多种淀粉酶的组合物接触。
[0025] 本发明的其他实施方案将由以下说明变得明显。

附图说明

[0026] 图1取自使用来自嗜热毁丝霉的重组产生的GH61a蛋白的实验。使用来自嗜热毁丝霉的培养物肉汤的纤维素酶试验了该蛋白的纤维素酶增强活性。图1(A)显示与在GH61a不存在时的糖化反应相比,在GH61a存在下进行的相同反应的产量改进的百分比。在图1(B)中,将数据绘图来显示总的葡萄糖产量。
[0027] 图2取自使用从嗜热毁丝霉的培养物肉汤分离的包含GH61的级分(fraction)的实验。将GH61蛋白GH61f、GH61p、和/或GH61a与CBH1a和CBH2b混合。这些结果证明,包含这些组分的酶混合物具有将纤维素基质转化为葡萄糖的足够的酶活性。
[0028] 图3显示GH61a蛋白对纤维素生物质的粘度的影响。
[0029] 详述
[0030] I.引言
[0031] 已确定,丝状真菌嗜热毁丝霉产生GH61蛋白。当含纤维素的基质经历被一种或多种纤维素酶糖化时,GH61蛋白增加可发酵糖类的产量。除了其他用途以外,由糖化产生的可发酵糖类可用在发酵反应中以产生终产物,诸如但不限于乙醇。
[0032] GH61蛋白可从嗜热毁丝霉细胞分离。GH61蛋白还可通过表达编码本公开文件中提供的GH61蛋白序列的任一种的核酸来重组地产生,本公开文件中提供的GH61蛋白序列包括野生型序列以及野生型序列的变体和片段。
[0033] 本发明的GH61蛋白和组合物的制备和用途在以下部分更详细地描述。
[0034] II:定义
[0035] 本文提到的所有专利和出版物,包括在这些专利和出版物中公开的所有序列均通过引用明确地并入本文。除非另外指明,否则本发明的实施涉及在分子生物学领域、发酵领域、微生物学领域和相关领域中通常使用的常规技术,这些技术是所属领域普通技术人员已知的。除非在本文中另外定义,否则本文使用的所有技术术语和科学术语均具有本发明所属领域的普通技术人员所通常理解的含义。尽管在本发明的实施或试验中可使用与本文所述的方法和材料相似或等同的任何方法和材料,但描述了一些优选的方法和材料。实际上,意图在于本发明不限于本文所述的特定方法学、方案和试剂,因为这些可随使用它们的背景而改变。本文提供的标题不是对本发明的多个方面或实施方案的限制。
[0036] 尽管如此,为了促进对本发明的理解,以下定义了若干术语。数值范围包括限定范围的数字。这样,本文公开的每个数值范围旨在包括落在这种较宽的数值范围内的每个较窄的数值范围,如同这种较窄的数值范围全部被明确写在本文一样。意图还在于本文公开的每个最大(或最小)的数值限制(numerical limitation)包括每个较低(或较高)的数值限制,如同这种较低(或较高)的数值限制被明确地写在本文一样。
[0037] 如本文所用,术语“包括”及其同源词以其包含的意义使用(即,等同于术语“包含”及其对应的同源词)。
[0038] 如在此处和在所附权利要求中所用,除非上下文另外清楚地表示,否则单数“一(a)”、“一(an)”和“该(the)”包括复数指代。因此,例如,提到“宿主细胞”包括多个此类宿主细胞。
[0039] 除非另外指明,否则分别以5'至3'方向从左到右书写核酸;以氨基到羧基方向从左到右书写氨基酸序列。本文提供的标题不是对可通过参照作为整体的说明书而具有的本发明的多个方面或实施方案的限制。据此,通过参照作为整体的说明书更完全地定义以下所定义的术语。
[0040] 如本文所用,“GH61蛋白”是具有GH61(或“纤维素酶增强”)活性的蛋白。“GH61蛋白”或GH61多肽可具有天然存在的(野生型)蛋白的序列,或可包括相对于野生型蛋白的变异。
[0041] 如本文所用,表1和表2所示的GH61蛋白序列(SEQ ID NO:1-30)被认为是野生型序列。
[0042] 如果当蛋白被包括在糖化反应(例如,使用内切葡聚糖酶、β-葡糖苷酶、以及1型和2型纤维二糖水解酶进行)中时比在GH61蛋白不存在时在相同条件下进行的糖化反应导致更大量(即,更大产量)的一种或多种可溶性糖类(例如,葡萄糖),则该蛋白具有“GH61活性”或“纤维素酶增强活性”或是“生物活性”的。“生物活性变体”是保留野生型蛋白的GH61活性的至少一些(例如,至少10%)的变体或片段。
[0043] 如本文所用,“变体”GH61蛋白(或编码GH61蛋白的多核苷酸)是包含相对于野生型GH61(或编码GH61的野生型多核苷酸)的一种或多种修饰的GH61蛋白。修饰包括一个或多个氨基酸残基(或多核苷酸中的一个或多个核苷酸或密码子)的取代、插入、缺失、和/或氨基或羧基截短。包含相对于野生型蛋白的缺失的变体可称为“片段”。
[0044] 如本文所用,GH61蛋白的“片段”是(a)具有野生型序列但包含相对于SEQ ID NO:1-30的缺失的多肽或(b)包含相对于多肽SEQ ID NO:1-30的缺失的GH61变体。
[0045] 蛋白序列中的氨基酸“取代”是该序列中的单个氨基酸被另一种氨基酸代替。
[0046] 氨基酸取代可以是“保守的”取代,在这种情况中取代氨基酸与其代替的氨基酸共有一种或多种化学特性。共有的特性包括以下:碱性氨基酸:精氨酸(R)、赖氨酸(K)、组氨酸(H);酸性氨基酸:谷氨酸(E)和天冬氨酸(D);不带电荷的极性氨基酸:谷氨酰胺(Q)和天冬酰胺(N);疏水氨基酸:亮氨酸(L)、异亮氨酸(I)、缬氨酸(V);芳族氨基酸:苯丙氨酸(F)、色氨酸(W)和酪氨酸(Y);含硫氨基酸:半胱氨酸(C)、甲硫氨酸(M);小氨基酸:甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、脯氨酸(P)、半胱氨酸(C)和甲硫氨酸(M)。
[0047] 术语“前蛋白”具有其在本领域中的标准含义,是指包括附加的氨基末端信号肽(或前导序列)区域的多肽。随着蛋白的分泌,信号肽酶将信号肽从前蛋白上切割。蛋白的分泌部分可称为“成熟的”或“分泌的”蛋白。因此,前蛋白的氨基酸序列,该序列包括信号肽部分和分泌的(成熟)部分。
[0048] 如本文所用,术语“信号肽”具有其在本领域中的通常含义,是指与多肽的氨基末端连接的氨基酸序列,指导编码的多肽进入细胞的分泌途径。
[0049] “糖化”是指酶催化的反应,导致复杂碳水化合物水解为可发酵糖类(例如,单糖类诸如葡萄糖或木糖)。该酶可以是纤维素酶,诸如内切葡聚糖酶、β-葡糖苷酶、1型和/或2型纤维二糖水解酶、和这些纤维素酶的组合。该纤维素酶可来自产生纤维素酶的野生型或纤维素酶-工程化的生物体(例如,真菌诸如嗜热毁丝霉或酵母)的培养物肉汤。
[0050] 当相邻单糖的至少一些之间的糖苷键被水解,从而将此前键合的单体对彼此分开时,“水解”纤维素或另一种多糖(例如,淀粉)发生。
[0051] 当在反应期间存在的特定组分(诸如GH61蛋白)导致与在相同条件下以相同的基质和其他代用品、但不存在目标组分时进行的反应相比产生更多产物时,出现“增加”反应产物(诸如可发酵糖类)的产量。
[0052] 术语“改进的”或“改进的特性”在描述GH61变体的特性的语境中使用时,是指与野生型GH61(例如,SEQ ID NO:2)或指定参考多肽相比表现出一种或多种特性的改进的GH61变体多肽。改进的特性可包括但不限于,增加的蛋白表达、增加的热活性、增加的热稳定性、增加的pH活性、增加的稳定性(例如,增加的pH稳定性)、增加的产物特异性、增加的比活性、增加的底物特异性、增加的对底物或终产物抑制的抗性、增加的化学稳定性、减少的被葡萄糖抑制、增加的对抑制剂(例如,乙酸、凝集素、鞣酸和苯酚化合物)的抗性、和改变的pH/温度曲线。
[0053] 术语“纤维素酶(cellulase)”(或“纤维素酶(cellulose enzyme)”)宽泛地是指催化纤维素β-1,4-糖苷键水解为更短的纤维素链、寡糖、纤维二糖和/或葡萄糖的酶,例如,内切葡聚糖酶、β-葡糖苷酶和纤维二糖水解酶。
[0054] 如本文所用,术语“多核苷酸”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸的聚合物、及其互补物。
[0055] 如本文所用,“基因”是编码蛋白的核酸序列。该核酸可具有或不具有任何内含子,可以是或不是重组的,并可还包括或不包括影响转录或翻译的元件。为了本说明书的目的,编码蛋白的cDNA序列有时可称为“基因”。
[0056] 术语“重组核酸”具有其常规含义。重组核酸或等义地“多核苷酸”,是被插入到异源位置,以使其不与自然界发现的正常情况下在该核酸两侧的核苷酸序列缔合的核酸(例如,被插入到载体中或异源生物体的基因组中的核酸)。同样,不在自然界出现的核酸序列例如天然存在的基因的变体是重组的。包含重组核酸或从重组核酸体外或体内表达的蛋白的细胞也是“重组的”。重组核酸的实例包括(i)可操作地连接于异源启动子和/或(ii)编码带有蛋白序列和异源信号肽序列的融合多肽的编码蛋白的DNA序列:。
[0057] 当核酸缔合,通常在溶液中缔合时,它们“杂交”。核酸杂交是由于各种被很好表征的物理-化学力,诸如氢键键合、溶剂排斥(solvent exclusion)、碱基堆积等。如本文所用,在核酸杂交实验诸如Southern杂交或Northern杂交的背景下术语“严格的杂交洗涤条件”是序列依赖性的,并且在不同环境参数下是不同的。有关核酸杂交的深入指导见于Tijssen,1993,“Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,”Part I,Chapter2(Elsevier,New York),其通过引用并入本文。对于至少100个核苷酸长度的多核苷酸而言,对低严格条件到极高严格条件限定如下:在标准的DNA印迹程序后,在42℃在5×SSPE,0.3%SDS,200μg/ml剪切和变性的鲑鱼精DNA,以及对于低严格性的25%甲酰胺,对于中等和中-高严格性的35%甲酰胺,或对于高严格性和极高严格性的50%甲酰胺中预杂交和杂交。对于至少100个核苷酸长度的多核苷酸,使用2×SSC,0.2%SDS在50℃(低严格性)、在55℃(中等严格性)、在60℃(中-高严格性)、在65℃(高严格性)或在70℃(极高严格性)将载体材料(carrier material)最终洗涤三次,每次15分钟。
[0058] 术语“表达载体”是指包括编码本发明的多肽的区段,并且所述区段可操作地连接于提供其转录的另外区段(例如,启动子、转录终止序列、增强子)和任选地选择性标记的线性或环状的DNA分子。
[0059] 为了本公开的目的,如果启动子在自然界不与基因序列缔合时,该启动子对该基因是“异源的”。当信号肽序列在自然界不与蛋白序列缔合时,该信号肽对该蛋白是“异源的”。
[0060] 关于调节序列(例如,启动子),术语“可操作地连接”是指如下配置:在该配置中调节序列被安放在相对于多肽编码序列的位置以使得该调节序列影响多肽的表达。关于信号序列,术语“可操作地连接”是指如下配置:在该配置中信号序列编码与多肽融合的氨基末端信号肽,以使该基因的表达产生前蛋白。
[0061] 如本文所用,术语“肽”、“多肽”和“蛋白”在本文可互换地使用,是指氨基酸残基的聚合物。
[0062] 如本文所用,术语“氨基酸”是指天然存在的和合成的氨基酸、以及氨基酸类似物。
[0063] 术语“生物质”、“生物质基质”、“纤维素生物质”、“纤维素原料”、“木质纤维素原料”和“纤维素基质”都是指包含纤维素的材料。为了简化,本文使用的术语“纤维素基质”是指通常在预处理后,能够被纤维素酶(任选地存在GH61蛋白)作用来产生可发酵糖类的包含纤维素的材料。纤维素基质的实例包括但不限于,生物质诸如木头、木纸浆、纸浆、玉米纤维、玉米粒、玉米芯、谷物残渣诸如玉米皮、玉米秸秆、草、小麦、麦秆、大麦、大麦秆、干草、稻草、柳枝稷、废纸、纸和纸浆加工废料、木质或草本植物、果浆或蔬菜浆、酒糟、稻壳、棉、大麻、亚麻、剑麻、甘蔗渣、高粱、大豆、碾磨谷物、树、树枝、根、叶、木片、锯末、灌木丛、蔬菜、果实、和花获得的组分、及其混合物。在一些实施方案中,使用本领域已知的方法“预处理”或处理纤维素材料,诸如化学预处理(例如,氨预处理、稀酸预处理、稀碱预处理、或溶剂暴露)、物理预处理(例如,蒸汽爆破或辐照)、机械预处理(例如,研磨或碾磨)和生物预处理(例如,施加增溶木质素的微生物)和其组合,以增加纤维素对水解的敏感性。纤维素基质及其加工在以下更详细地描述。
[0064] 纤维素基质通过包括以下的方法“获取自”特定来源(诸如玉米或小麦):获得该来源或该来源的实体部分(诸如玉米芯或麦秆),然后任选地预处理该来源或部分。
[0065] 纤维素酶蛋白序列(即,纤维素变体)当通过使用体外诱变或分子进化方法向野生型序列引入变异来产生时,“衍生自”野生型纤维素酶序列。通常蛋白序列将与野生型序列至少70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%相同。
[0066] 纤维素基质已经通过一些物理和/或化学手段加工来帮助糖化时,被称为是“预处理的”。
[0067] “可发酵糖类”意为简单糖类(simple sugars)(单糖、二糖和短寡糖),诸如但不限于葡萄糖、木糖、半乳糖、阿拉伯糖、甘露糖和蔗糖。可发酵糖类是微生物能够利用或发酵的任何糖。
[0068] 术语“转化(transform)”或“转化(transformation)”在提到细胞使用时,表示细胞具有整合入其基因组或作为经过多代被维持的附加体(例如,质粒)的非天然核酸序列。
[0069] 术语“引入”在将核酸序列插入细胞的语境中使用时表示被接合、转染、转导或转化(统称为“转化”)或以其他方式并入到细胞的基因组中或作为附加体被保持在细胞内。
[0070] “纤维素酶工程化的”细胞是包含编码纤维素酶或纤维素酶变体的至少一种、至少两种、至少三种、或至少四种重组序列且其中纤维素酶或纤维素酶变体的表达相对于野生型形式已被修饰的细胞。当非天然存在的纤维素酶变体被表达或当天然存在的纤维素酶被过表达时,纤维素酶的表达是“被修饰的”。过表达纤维素酶的一种方式是可操作地连接强(任选地组成型)启动子于纤维素酶编码序列。过表达纤维素酶的另一种方式是增加异源的、变异的、或内源的纤维素酶基因的拷贝数。纤维素酶工程化的细胞可以是真菌细胞,诸如酵母细胞或丝状真菌细胞(例如,解纤维素热酸菌(Acidothermus cellulolyticus)、Thermobifida fusca、灰腐质霉(Humicola grisea)、嗜热毁丝霉、嗜热毛壳菌(Chaetomium thermophilum)、枝顶孢属、梭孢壳属、里氏木霉(Trichoderma reesei)、曲霉属)。在一些实施方案中,纤维素酶工程化的细胞是嗜热毁丝霉细胞。
[0071] 术语“培养”是指在液体或固体培养基中使微生物(例如真菌)细胞的群体生长。一些培养的细胞表达和分泌蛋白,诸如例如,GH61蛋白或纤维素酶蛋白。当细胞在液体培养基中生长时,蛋白可能被分泌到培养基中,该培养基被称为多种术语,包括细胞培养培养基、细胞培养上清液和细胞肉汤。
[0072] 如本文所用,术语“回收”是指从细胞肉汤或可选地从固体培养基收获、分离、收集或离析蛋白、糖、细胞或终产物(例如,醇)。
[0073] 如本文所用,术语“分离的”是指从与之在自然界中通常缔合的组分(诸如其他蛋白、核酸或细胞)中部分地或完全地分开的核酸、多肽、或其他组分。
[0074] 已经被“纯化”的产物是已经从获得其的来源富集至少10倍、任选地至少100倍、或至少1000倍的产物。例如,从其占总蛋白0.1%的培养物肉汤获得的蛋白可被纯化,使得其为制品中蛋白的1%、2.5%、10%、25%、50%、80%、95%或100%(wt/wt)。“部分纯化的”产物已经从产生其的来源富集至少2倍、或至少5倍,但仍包含至少50%、有时至少90%(wt/wt)的溶剂以外的不相关组分。
[0075] “分级(fractionating)”液体产物诸如培养物肉汤表示施加分离工艺(诸如盐沉淀、柱色谱、尺寸排阻、和过滤)或所述工艺的组合,从而获得一种溶液,其中期望蛋白(诸如GH61蛋白、纤维素酶、或其组合)在该溶液中为比在最初液体产物中占总蛋白的百分比更大的百分比。
[0076] “浆料”是其中分散一种或多种固体组分诸如纤维素基质的水溶液。
[0077] 如本文所用,包含一种或多种蛋白的“组合物”可以是,例如,包含蛋白的无细胞组合物、细胞溶解产物、包含例如以分泌形式的蛋白的细胞肉汤;包含蛋白的细胞,诸如表达蛋白的重组细胞;表达不同蛋白的两种或多种细胞群体的混合物(例如,表达重组GH61蛋白的一种细胞和表达纤维素酶蛋白的第二细胞)。
[0078] 术语“无细胞组合物”是指其中已经去除了细胞和细胞碎片的包含蛋白的组合物,诸如纯化的纤维素酶混合物或包含分泌的蛋白的、已经从其去除了细胞和不溶性物质的细胞培养物肉汤。
[0079] 术语“同一性百分比”、“%同一性”、“百分比相同”和“%相同”在本文可互换地使用,是指两条最佳地对齐的序列跨比较窗的比较。为了优化比较,比较窗可在任一条序列中包括添加或缺失。同一性百分比是序列之间相同的位置数目除以比较窗中位置的总数(包括其中一条序列具有缺口的位置)。例如,具有在310个位置与序列GH61a(其分泌形式具有323个氨基酸)匹配的氨基酸序列的蛋白,将与该参考序列具有310/323=95.9%同一性。类似地,具有300个残基(即,小于全长)并在280个位置与参考序列匹配的蛋白变体将具有280/300=93.3%同一性。尽管最佳比对和评分可手动完成,但通过使用计算机执行的比对算法可促进该过程。实例是BLAST和BLAST2.0算法,描述在Altschul等,1990,J.Mol.Biol.215:403-410和Altschul等,1977,Nucleic Acids Res.3389-3402中。可选地,两条氨基酸序列之间的同一性程度可使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-53)确定,该算法已经在EMBOSS软件包的Needle程序中实现(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics16:276-77),优选地以3.0.0或后来的版本。使用的任选参数是:缺口开放罚分10、缺口延伸罚分0.5、和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。Needle的标为“最长同一性”的输出值(使用nobrief选项获得的)用作同一性百分比,并如下计算:(相同残基×100)÷(比对的长度–比对中的缺口总数)。
[0080] III:GH61基因的鉴定
[0081] 如实施例1所述,鉴定了对嗜热毁丝霉内源的二十四种GH61蛋白。参见下表1和表2。如实施例2和3所示,名称为GH61a的特定嗜热毁丝霉GH61蛋白(SEQ ID NO:2)显示为在纤维素酶存在时增强糖化反应。类似地,本发明的其他GH61蛋白(SEQ ID NO:3至30)可用于增强纤维素酶活性。
[0082] 表1提供GH61前蛋白的序列(SEQ ID NO:1),以加下划线显示预测的天然信号肽,和预测的分泌的(成熟)形式(SEQ ID NO:2)。序列ID NO:2的长度是323个氨基酸。预期本发明的某些GH61a蛋白变体包括SEQ ID NO:2的残基11-323(包括但不限于,氨基末端截短的片段),或与SEQ ID NO:2的残基11-323具有至少:约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%的序列同一性。在一些实施方案中,GH61s蛋白变体与SEQ ID NO:2的残基11-323具有至少90%的同一性并长至少315个残基。
[0083] 表2提供28种GH61前蛋白序列,预测的天然信号肽加下划线。预测GH61t和GH61n不具有信号肽。除了另外指明或从上下文清楚的情况以外,提及表2中所列的一种或多种序列意为涵盖前蛋白形式和分泌形式(即,包含完整序列的蛋白、和不包括加下划线的序列的蛋白)的一种或两种。还预期本发明的某些GH61蛋白包括表2所示的序列的残基11至C末端(包括但不限于,氨基末端截短的片段),或与这些序列的残基11至C末端具有至少:约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%的序列同一性。在表2中可使用以下名称:B=全长蛋白(包括信号肽)的SEQ ID NO.;C=信号肽(加下划线的);D=成熟蛋白(不加下划线的);E=D的开始于分泌部分的残基11的部分(即,在最后一个缺口与C末端之间,亦即氨基末端截短部分)。
[0084] 表1和表2中的信号肽边界是基于对基本序列的分析来预测的。实际的裂解位点与预测的位点差达数个残基(例如,1-10个,例如,达1、2、3、4、5、6、7、8、9或10个)是有可能的。异源信号肽的存在也可以影响裂解位点。信号肽裂解位点可通过表达全长序列,并鉴定分泌的GH61蛋白的氨基末端残基来确定。预计在成熟蛋白氨基末端添加或缺失数个残基可以对分泌的蛋白的活性影响很小或无影响。
[0085] 表1
[0086] 糖苷水解酶61蛋白GH61a
[0087]
[0088] 表2
[0089] 糖苷水解酶61蛋白
[0090]
[0091]
[0092]
[0093]
[0094]
[0095] IV:重组核酸和蛋白
[0096] 在一个方面,本发明提供编码表1或表2中所列的蛋白序列和其变体(例如,生物活性变体)的重组核酸。本发明还提供包含重组核酸的表达载体、包含重组核酸或载体的细胞、由该细胞产生的重组蛋白、和使用该细胞和蛋白的方法。
[0097] 在一个方面,本发明提供编码包含SEQ ID NO:1-30的前蛋白、SEQ ID NO:1-30中编码的成熟(分泌的)蛋白、或SEQ ID NO:1-30的氨基末端截短的片段的重组核酸序列。
[0098] 在一个方面,本发明提供具有包含SEQ ID NO:1-30的序列、SEQ ID NO:1-30中编码的成熟(分泌的)蛋白、或SEQ ID NO:1-30的氨基末端截短的片段的重组、分离或纯化的GH61蛋白。
[0099] 在一个方面,本发明提供编码与包含SEQ ID NO:1-30的序列、SEQ ID NO:1-30中编码的成熟(分泌的)蛋白、或SEQ ID NO:1-30的氨基末端截短的片段具有至少约70%、至少约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%序列同一性的GH61蛋白的重组核酸序列。在相关的方面,本发明提供具有以上所列序列的重组、分离或纯化的GH61蛋白。在一些情形中,保守氨基酸取代可以是比其他类型的取代优选的。
[0100] GH61蛋白可以是从真菌(例如,嗜热毁丝霉)细胞分离的内源蛋白或可以是重组产生的。
[0101] 如以下详细讨论的,GH61蛋白可包括内源或异源信号肽。如以下详细讨论的,编码GH61蛋白的核酸可以可操作地连接于启动子,诸如异源启动子。
[0102] 在一个实施方案中,本发明提供包含选自SEQ ID NO:31-59的序列的重组核酸序列。
[0103] 用于表达GH61蛋白的核酸序列可以是从嗜热毁丝霉获得的编码对应蛋白的天然序列、或其编码成熟蛋白的部分。来自嗜热毁丝霉的示例性GH61编码序列显示在SEQ ID NO:31至59。可选地,编码指定蛋白的许多核酸序列可通过提及遗传密码来设计。在一些实施方案中,可为使用的嗜热毁丝霉以外的宿主细胞(例如,酵母细胞)对序列进行密码子优化。参见GCG CodonPreference,Genetics Computer Group Wisconsin Package;Codon W,John Peden,University of Nottingham;McInerney,J.O,1998,Bioinformatics14:372-73,在这种情况中核酸序列不同于天然存在的序列。
[0104] 在一些实施方案中,本发明的GH61蛋白是生物活性的,即,具有GH61活性。GH61活性可使用本领域已知的方法来测量,包括下文描述的方法。缺乏GH61活性的多肽也有多种用途,包括产生用于纯化GH61蛋白的抗体的用途。除了从上下文清楚的情况以外,本文提及GH61蛋白(包括变体)是指具有GH61活性的蛋白。
[0105] 在优选的实施方案中,为SEQ ID NO:1-30的变体的GH61蛋白具有相同摩尔量的它们所衍生自的野生型蛋白的活性的至少10%。它们可具有野生型蛋白的活性的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。
[0106] 与参考(野生型)序列和/或其中GH61蛋白部分与一种或多种其他序列连接的融合蛋白的部分相比,为SEQ ID NO:1-30的变体的GH61蛋白可以比野生型蛋白短约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约15%、约20%、约25%、约30%、约35%、约
40%、约45%、或约50%、或约60%、或约70%、或约80%。这些变体可具有与包含SEQ ID NO:1-30的序列、SEQ ID NO:1-30中编码的成熟(分泌的)蛋白、或SEQ ID NO:1-30的氨基末端截短的片段至少约70%、至少约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约
95%、约96%、约97%、约98%、或约99%的序列同一性。相对于野生型序列,GH61蛋白可具有内部的缺失、或在氨基或羧基末端的缺失。
[0107] GH61蛋白可包括氨基末端和/或羧基末端的缺失和/或内部的缺失,但其中其余的氨基酸序列与被比较的序列(例如,本发明的全长GH61变体)的对应位置至少约60%、70%、75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%、或100%相同。在一些实施方案中,去除了几丁质结合结构域或GH61结构域。在一些实施方案中,蛋白保留全长多肽的基本上全部的活性。
[0108] 在一些实施方案中,成熟GH61蛋白与野生型序列具有至少70%、80%、90%、或95%的序列同一性,并基本上是全长的(野生型序列长度的至少90%)。
[0109] 本发明还提供重组GH61核酸序列和从其表达的蛋白,其中该蛋白具有GH61f、GH61a、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:2、7、13、20、21、23、26)、或其分泌的片段;以及与GH61f、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:7、13、20、21、23、26)的任一种、或与GH61a、GH61o、GH61v、GH61x、GH61b和GH61e(SEQ ID NO:2、6、13、15、16、19、30)的任一种至少约70%、至少约75%、约80%、约85%、约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%相同的变体的序列;
其片段和变体、和编码所述蛋白的核酸。本发明还包括包含上述核酸序列的任一种的表达载体、包含所述表达载体的细胞、以及由该细胞产生的分离的GH61蛋白。优选地,变体GH61蛋白具有纤维素酶增强活性。蛋白编码序列可包括异源信号肽和/或可以可操作地连接于异源启动子。
[0110] 不希望被具体作用机制束缚,在GH61存在时,当GH61蛋白存在时,与GH61蛋白不存在时的相同条件下的类似反应相比,酶对糖聚合物(例如,纤维素基质)的水解经过特定时间段产生更多产物,进展更快速,或更加完全。
[0111] 本发明的具有纤维素酶增强活性的GH61蛋白可利用本领域已知的定位多肽中功能的标准方法来鉴定。例如,可表达截短变体,然后在GH61活性测定中检验。可引入另外的截短,直到失去活性,此时将鉴定出蛋白的最小功能单元。包含少至所鉴定的大小的蛋白的任何部分的片段通常将是功能性的,正如将是包含至少蛋白的功能核心的融合构建体。
[0112] 为了产生在GH61编码序列(SEQ ID NO:1至30的任一种)中掺入一种或多种氨基酸改变的生物活性变体,可向蛋白序列引入取代,并检验表达的蛋白对活性的保留。
[0113] 随机或半随机突变策略可用来产生活性变体的大的集合。标准教科书PROTOCOLS IN MOLECULAR BIOLOGY(Ausubel 等 编 著 ) 和 MOLECULAR CLONING:A LABORATORY MANUAL(Sambrook等编著)描述了采用化学诱变、盒式诱变、简并寡核苷酸、相互引发寡核苷酸(mutually priming oligonucleotide)、接头扫描诱变、丙氨酸扫描诱变和试错PCR的技术。其他有效方法包括Stratagene的大肠杆菌(E.coli)突变基因(mutator)菌株(Greener等,Methods Mol.Biol.57:375,1996)和Maxygen的DNA改组技术(Patten等 ,Curr.Opin.Biotechnol.8:724,1997;Harayama,Trends Biotechnol.16:76,1998;美国专利5,605,793和6,132,970)。为了增加变异,可使用产生更突然的改变的技术,诸如DNA改组技术。
[0114] 商业上可获得的试剂盒可以用来获得变体,所述试剂盒包括由InVitrogenTMLife TMTechnologies 出 售 的 GeneTailor Site-Directed Mutagenesis System; 由 BD TM TM
Biosciences/Clontech出 售 的BD Diversify PCR Random Mutagenesis Kit ;由 MJ TM TM
Research Inc.出售的Template Generation System ,由Stratagene出售的XL1-Red大肠杆菌突变基因菌株;和也由Stratagene出售的 Random Mutagenesis
Kit。通过采用这些系统的任一种联合适合的GH61活性测定,能够以高通量方式产生和试验变体。
[0115] 可选地或此外,使用者可采用定向进化策略。参见例如,美国专利 7,981,614:Methods For Generating Polynucleotides Having Desired
Characteristics;US2011/0034342A1:Method Of Generating An Optimized,Diverse Population Of Variants;美国专利7,795,030:Methods And Compositions For Cellular And Metabolic Engineering;美国专利7,647,184:High Throughput Directed Evolution By Rational Mutagenesis;美国专利6,939,689:Exonuclease-Mediated Nucleic Acid Reassembly In Directed Evolution;和美国专利6,773,900:End Selection In Directed Evolution。诱变可根据本领域已知的技术的任一种进行,包括随机和位点特异性诱变。定向进化可以本领域已知的筛选变体的产生的技术的任一种进行,包括改组。
[0116] 诱变和定向进化方法是本领域公知的。参见例如,美国专利号5,605,793、5,830,721、6,132,970、6,420,175、6,277,638、6,365,408、6,602,986、7,288,375、
6,287,861、6,297,053、6,576,467、6,444,468、5,811238、6,117,679、6,165,793、
6,180,406、6,291,242、6,995,017、6,395,547、6,506,602、6,519,065、6,506,603、
6,413,774、6,573,098、6,323,030、6,344,356、6,372,497、7,868,138、5,834,252、
5,928,905、6,489,146、6,096,548、6,387,702、6,391,552、6,358,742、6,482,647、
6,335,160、6,653,072、6,355,484、6,03,344、6,319,713、6,613,514、6,455,253、
6,579,678、6,586,182、6,406,855、6,946,296、7,534,564、7,776,598、5,837,458、
6,391,640、6,309,883、7,105,297、7,795,030、6,326,204、6,251,674、6,716,631、
6,528,311、6,287,862、6,335,198、6,352,859、6,379,964、7,148,054、7,629,170、
7,620,500、6,365,377、6,358,740、6,406,910、6,413,745、6,436,675、6,961,664、
7,430,477、7,873,499、7,702,464、7,783,428、7,747,391、7,747,393、7,751,986、
6,376,246、6,426,224、6,423,542、6,479,652、6,319,714、6,521,453、6,368,861、
7,421,347、7,058,515、7,024,312、7,620,502、7,853,410、7,957,912、7,904,249,和所有相关的非美国对应物;Ling等,Anal.Biochem.,254(2):157-78[1997];Dale等 ,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];
Botstein 等 ,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];
Kramer 等 ,Cell,38:879-887[1984];Wells 等 ,Gene,34:315-323[1985];
Minshull 等 ,Curr.Op.Chem.Biol.,3:284-290[1999];Christians 等 ,Nat.
Biotechnol.,17:259-264[1999];Crameri 等 ,Nature,391:288-291[1998] ;
Crameri 等 ,Nat.Biotechnol.,15:436-438[1997];Zhang 等 ,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];
WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767; 和WO2009/152336,其每一篇通过引用并入本文。
[0117] 在一些实施方案中,本发明的GH61蛋白具有被在严格条件(即,中-高、高、或极高严格性)下与SEQ ID NO:31-59的互补物杂交的核酸编码的氨基酸序列,并包括GH61活性。
[0118] V:GH61活性测定
[0119] 本发明的GH61蛋白的纤维素酶增强活性可使用任何适合的GH61活性测定确定。例如,获得本发明的纯化的或重组的GH61蛋白,然后通过将其与纤维素酶在糖化反应中混合来测定GH61活性,并确定与无GH61进行的相同糖化反应相比是否有葡萄糖产量的增加。
[0120] 在一种方法中,GH61活性可通过在GH61蛋白存在和不存在时混合纤维素基质与纤维素酶(例如,每克基质5-10mg总重量的纤维素酶)来测定。在一些实施方案中,纤维素酶是来自嗜热毁丝霉的确定的一组重组纤维素酶。
[0121] 在另一种方法中,使用来自野生型嗜热毁丝霉培养物的肉汤(补充有和未补充GH61蛋白)。GH61活性由在外源GH61存在时增强的葡萄糖产量来证实(即,超过肉汤中内源GH61导致的任何增强)。
[0122] 使用补充有一种或多种纯化的酶的肉汤也是可能的。
[0123] 适合的酶包括从嗜热毁丝霉克隆的分离的重组酶,诸如以适于所选基质产生可测量的产物的任何组合的内切葡聚糖酶(EG)、β-葡糖苷酶(BGL)、1型纤维二糖水解酶(CBH1)、和/或2型纤维二糖水解酶(CBH2)。可用于测定GH61活性的示例性纤维素酶可具有选自SEQ ID NO:61至68的任一种的氨基酸序列。
[0124] 在用于测量嗜热毁丝霉来源的GH61蛋白和变体蛋白的GH61活性的一种示例性测定中,使用的纤维素酶是嗜热毁丝霉BGL1(SEQ ID NO:66;Badhan等,Bioresour Technol.2007Feb;98(3):504-10);嗜热毁丝霉CBH1(SEQ ID NO:67;Park JI等,Badhan等,Bioresour Technol.2007Feb;98(3):504-10);和嗜热毁丝霉CBH2(SEQ ID NO:68)。在一些实施方案中,还使用内切葡聚糖酶:嗜热毁丝霉EG2(SEQ ID NO:65;Rosgaard L.等,Prog.2006;22(2):493-8;Badhan等,同上)。
[0125] 可选地,可使用商业上可获得的包含纤维素酶混合物的制品,诸如来自Genencor TM TM TMInternational的Laminex 和Spezyme 、来自Rohm GmbH的Rohament 、和来自Novozymes TM TM TM
Inc的Celluzyme 、Cereflo 和Ultraflo 。
[0126] 纤维素酶测定通常在50℃进行,但也可在35、45、55、60或65℃进行。将GH61蛋白和酶与基质混合,并孵育以产生可发酵糖类。然后回收糖类并定量葡萄糖的产量。一种适合的基质是麦秆(例如,预处理的麦秆)。本公开文件中列出的其他纤维素基质可用作替代物,包括以硫酸预处理的玉米秸秆(参见美国专利7,868,227)、和在以下XIII部分描述的其他基质。
[0127] 还可使用由Harris等,2010,Biochemistry49:3305-3316提供的测定方法,通过引用并入本文。在这一方法中,用硫酸预处理玉米秸秆,洗涤,与纤维素酶和GH61孵育数天,然后通过折射定量糖类的产量。
[0128] 另一种测定方法提供于美国专利7,868,227,通过引用并入本文。在这一方法中,纤维素基质是PCS(以热和稀硫酸预处理的玉米秸秆;WO2005/074647);纤维素酶混合物是可从Sigma-Aldrich获得的 是来自真菌里氏木霉的纤维素酶混合物。PCS的水解在总反应体积1.0mL中进行,PCS浓度为1mM硫酸镁、50mM乙酸钠缓冲液pH5.0中50mg/mL。将试验蛋白与基础纤维素酶混合物(base cellulase mixture)以0与100%总蛋白之间的相对浓度混合。将蛋白组合物与PCS在65℃孵育7天。葡萄糖和纤维二糖的总产量可通过折射率检测来测量。
[0129] GH61活性被计算为与GH61蛋白不存在时的相同反应混合物相比,在GH61蛋白存在时从基质被纤维素酶产生的葡萄糖的增加。通常,该增加在至少3倍范围的浓度内是剂量依赖性的。GH61活性可表示为“协同”程度,如实施例8讨论的。
[0130] 重组或分离的GH61蛋白的添加或存在可增加纤维素酶的产物的产量,例如,至少1%、至少5%、至少10%、至少20%、30%、50%、70%、2倍、3倍或更多。
[0131] VI.GH61蛋白的表达
[0132] 本发明的GH61蛋白、组合物和其他产物的表达、产生和使用中可采用的细胞培养、重组遗传学、蛋白工程和发酵技术是本领域已知的。为了方便,以下简单描述某些方面。尽管主要在GH61蛋白的表达的上下文中描述,应理解的是,相同方法、细胞等可用于表达纤维素酶蛋白和其他蛋白,诸如但不限于本文别处描述的那些。
[0133] 在一些实施方案中,构建体还包括与蛋白编码序列可操作地连接的调节序列,包括例如,启动子。大量的适合的载体和启动子是本领域技术人员已知的。
[0134] 信号肽
[0135] 在一些实施方案中,GH61蛋白可包括信号肽,从而当在宿主细胞中表达时,成熟形式(例如,SEQ ID NO:2)被分泌到细胞培养物肉汤中。GH61蛋白(或变体)可包括其相应的天然信号肽,如表1或2所示。可选地,编码包含SEQ ID NO:2的蛋白、或SEQ ID NO:3至30的任一种的分泌的部分、SEQ ID NO:2至30的任一种的氨基末端截短部分、或其变体的重组核酸序列可具有融合于N末端的异源信号肽。
[0136] 取决于宿主细胞和其他因素,可使用多种信号肽。丝状真菌宿主细胞可用的信号肽包括获自米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶、柔毛腐质霉(Humicola lanuginosa)脂酶、和里氏木霉纤维二糖水解酶II(TrCBH2)的信号肽。
[0137] 细菌宿主细胞可用的信号肽是获自芽孢杆菌NClB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)α-淀粉酶、地衣芽孢杆菌(Bacillus licheniformis)枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌(Bacillus subtilis)prsA的基因的信号肽。另外的信号肽描述在Simonen和Palva,1993,Microbiol Rev57:109-137。
[0138] 酵母宿主细胞可用的信号肽还包括来自酿酒酵母(Saccharomyces cerevisiae)α-因子、酿 酒酵母SUC2转 化酶(参见 Taussig和Carlson,1983,Nucleic Acids Res11:1943-54;SwissProt获取号P00724)及其他的基因的那些信号肽。Romanos等,1992,Yeast8:423-488。这些信号肽和其他信号肽的变体是适合的。
[0139] 本发明还提供了包含表1或表2所示的信号肽与异源蛋白(即,自然界中信号肽不与之缔合的蛋白,可以是GH61蛋白以外的蛋白)的氨基末端融合的重组蛋白。如此,表1和2中所示的信号肽可用于导致在宿主细胞中表达的重组表达的异源蛋白分泌。在一些实施方案中,宿主细胞是嗜热毁丝霉。
[0140] 启动子
[0141] 为了在特定宿主中获得高水平表达,通常有用的是在异源启动子的控制下表达本发明的GH61变体。启动子序列可以使用常规方法可操作地连接于GH61编码序列的5’区。
[0142] 用于表达GH61的有用的启动子的实例包括来自真菌的启动子。在一些实施方案中,可使用在真菌菌株中驱动GH61基因以外的基因的表达的启动子序列。作为非限制性实例,可使用来自编码内切葡聚糖酶的基因的真菌启动子。在一些实施方案中,可使用在GH61变体所来自的真菌菌株以外的真菌菌株中驱动GH61基因的表达的启动子序列。作为非限制性实例,如果GH61变体来自于C1,可使用来自里氏木霉GH61基因的启动子或WO2010107303中描述的启动子,诸如但不限于在WO2010107303中标为SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29的序列。
[0143] 其他可用于指导本发明的核苷酸构建体在丝状真菌宿主细胞中转录的适合启动子的实例是从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶、以及尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO96/00787,其通过引用并入本文)的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),启动子诸如cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy和glaA(Nunberg等人,1984,Mol.Cell Biol.,4:2306-2315,Boel等人,1984,EMBO J.3:1581-85和EPA137280;其全部通过引用并入本文),及其突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子可以来自酿酒酵母烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸酯激酶的基因。用于酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast8:423-488描述,其通过引用并入本文。可使用与真菌中几丁质酶的产生有关的启动子。参见,例如,Blaiseau和Lafay,1992,Gene120243-248(丝状真菌白色扁丝霉(Aphanocladium album));Limon等人,1995,Curr.Genet,28:478-83(哈茨木霉(Trichoderma harzianum)),二者均通过引用并入本文。
[0144] 已知在原核细胞或真核细胞或其病毒中控制基因表达且可用在本发明的一些实施方案中的启动子包括SV40启动子、大肠杆菌lac或trp启动子、噬菌体λPL启动子、tac启动子、T7启动子等。在细菌宿主细胞中,适合的启动子包括从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyl)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、枯草芽孢杆菌xylA和xylB基因,和原核β-内酰胺酶基因获得的启动子。
[0145] 可使用在适合的宿主细胞中驱动表达的任何其他的启动子序列。适合的启动子序列可使用熟知方法来鉴定。在一种方法中,推定的启动子序列与编码报道蛋白的序列5’连接,将该构建体转染到宿主细胞(例如,C1)中并测量报道基因的表达水平。可通过测量例如报道基因序列的mRNA水平、报道蛋白的酶活性、或产生的报道蛋白的量来确定报道基因的表达。例如,可通过使用绿色荧光蛋白作为编码序列(Henriksen等人,1999,Microbiology145:729-34,通过引用并入本文)或lacZ报道基因(Punt等人,1997,Gene,197:189-93,通过引用并入本文)来确定启动子活性。可使用借助定向进化法从自然存在的启动子序列获取功能启动子。参见,例如,Wright等人,2005,Human Gene Therapy,16:881-892,通过引用并入本文。
[0146] 其他启动子包括来自嗜热毁丝霉的那些,在2010年8月22日提交的美国专利申请号13/214,406、以及WO2010/107303中提供,通过引用全文并入本文。
[0147] 载体
[0148] 本发明利用包含上述编码GH61的序列的重组构建体。本发明的核酸构建体包括本发明的核酸序列被插入其中的载体诸如质粒、黏粒、噬菌体、病毒、细菌人工染色体(BAC)、酵母人工染色体(YAC)等等。本发明的多核苷酸可被并入适于表达多肽的各种表达载体中的任何一种。适合的载体包括染色体、非染色体和合成的DNA序列,例如,SV40的衍生物;细菌质粒;噬菌体DNA;杆状病毒;酵母质粒;从质粒和噬菌体DNA的组合衍生的载体;病毒DNA诸如,牛痘苗、腺病毒、鸡痘病毒、伪狂犬病毒、腺病毒、腺相关病毒、逆转录病毒及许多其他病毒。可使用将遗传物质转导到细胞中并且,如果复制是令人期望的,在相关宿主中可复制和可维持的任何载体。
[0149] 本发明提供用于导致GH61蛋白从适合的宿主细胞产生的表达载体,上述宿主细胞可以是真菌(例如,嗜热毁丝霉或酵母)。这样的载体可选自但不限于以下的衍生物:病毒载体;细菌质粒;噬菌体DNA;杆状病毒;酵母质粒;从质粒和噬菌体DNA的组合衍生的载体;和重组穿梭载体。载体可被引入具有GH61编码多核苷酸的宿主细胞,从而其可操作地连接于在宿主细胞中有活性的启动子。选择载体以表达编码的蛋白,并可作为附加体在预期宿主细胞中复制,或整合进入宿主细胞的基因组。
[0150] 在特别的方面,本发明提供了包括与异源启动子可操作地连接的GH61多核苷酸的表达载体。本发明的表达载体可用于转化适当宿主细胞以允许宿主表达GH61蛋白。用于在真菌和其他生物体中重组表达蛋白的方法是本领域熟知的,并且许多表达载体是可用的或可使用常规方法来构建。参见例如,Tkacz和Lange,2004,ADVANCES IN FUNGAL BIOTECHNOLOGY FOR INDUSTRY,AGRICULTURE,AND MEDICINE,KLUWER ACADEMIC/PLENUM UBLISHERS.New York;Zhu等,2009,Construction of two Gateway vectors for gene expression in fungi Plasmid6:128-33;Kavanagh,K.2005,FUNGI:BIOLOGY AND APPLICATIONS Wiley,其全部通过引用并入本文。
[0151] 宿主细胞
[0152] 本发明的GH61蛋白可在包含编码GH61蛋白的重组核酸的宿主细胞中表达。宿主细胞还可表达感兴趣的其他蛋白,尤其是在糖化工艺中与GH61蛋白协同作用的一种或多种纤维素酶。在一个实施方案中,宿主细胞是纤维素酶工程化的细胞。如此,纤维素酶可被宿主细胞内源地表达,或它们可从其他核酸表达。
[0153] 在另一种方法中,可一起培养各自表达不同的蛋白或蛋白组(例如,GH61蛋白和纤维素酶)的两种或多种的宿主细胞群体。两种宿主细胞可以是相同或不同细胞物种(cell species)。可将表达GH61蛋白的细胞和表达纤维素酶的细胞混合并一起培养来产生包含GH61蛋白和纤维素酶二者的本发明的组合物。可选地,可分别地收集来自每种细胞群体的培养物肉汤,任选地分级以富集各自的活性,随后混合在一起以产生期望的组合。
[0154] 适合的真菌宿主细胞包括但不限于子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、不完全菌(Deuteromycota)、接合菌门(Zygomycota)、半知菌(Fungi imperfecti)。在一些实施方案中,优选的真菌宿主细胞是酵母细胞和丝状真菌细胞,包括真菌亚门(Eumycotina)和卵菌门(Oomycota)的所有丝状形式。Hawksworth等 , 于 Ainsworth and Bisby’s DICTIONARY OF THE FUNGI, 第 8 版 ,1995,CAB International,University Press,Cambridge,UK。丝状真菌的特征为营养菌丝和由几丁质、纤维素及其他复杂多糖组成的细胞壁,且与酵母在形态学上是不同的。木霉属也可以是用于与GH61蛋白组合的一种或多种纤维素酶的来源。
[0155] 宿主细胞可以是以下属的物种:绵霉属(Achlya)、枝顶孢属、曲霉属、短梗霉属(Aureobasidium)、固氮螺菌属(Azospirillum)、烟管菌属(Bjerkandera)、纤维单胞菌属(Cellulomonas)、头孢霉属(Cephalosporium)、拟蜡菌属(Ceriporiopsis)、金孢属(Chrysosporium)、梭菌属(Clostridium)、球孢子菌属(Coccidioides)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、盘基网柄菌属(Dictyostelium)、色二孢属(Diplodia)、伊丽莎白金菌属(Elizabethkingia)、内座壳属(Endothia)、欧文氏菌属(Erwinia)、埃希氏菌属(Escherichia)、镰孢菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、葡糖醋杆菌属(Gluconacetobacter)、腐质霉属、肉座菌属(Hypocrea)、Kuraishia、毛霉属(Mucor)、毁丝霉属、链孢霉属(Neurospora)、烟草属(Nicotiana)、类芽孢杆菌属(Paenibacillus)、青霉属(Penicillium)、黑团孢属(Periconia)、暗球腔菌属(Phaeosphaeria)、射脉革菌属(Phlebia)、Piromyces、柄孢 壳菌 属(Podospora)、普雷 沃氏 菌属(Prevotella)、梨 孢属(Pyricularia)、根瘤菌属(Rhizobium)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、瘤胃球菌属(Ruminococcus)、复膜孢酵母属(Saccharomycopsis)、沙门氏菌属(Salmonella)、裂褶菌属(Schizophyllum)、节格孢属(Scytalidium)、壳针孢属(Septoria)、侧孢霉属(Sporotrichum)、链霉菌属(Streptomyces)、篮状菌属(Talaromyces)、嗜热厌氧杆菌属(Thermoanaerobacter)、嗜热子囊菌属(Thermoascus)、栖热袍菌属(Thermotoga)、梭孢壳属、弯颈霉属(Tolypocladium)、栓菌属(Trametes)、木霉属、旱金莲属(Tropaeolum)、单孢锈菌属(Uromyces)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、Wickerhamomyces、或相应的有性型或无性型,以及同义词或分类学等同物。
[0156] 示例性宿主细胞是酵母。实例是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyce)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)或耶氏酵母属(Yarrowia)。酵母细胞可以是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母、卡氏酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、奇异酵母(Saccharomyces norbensis)、克氏酵母(Saccharomyces kluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichia finlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia kodamae、膜醭毕赤酵母(Pichia membranaefaciens)、Pichia opuntiae、耐热毕赤酵母(Pichia thermotolerans)、柳毕赤酵母(Pichia salictaria)、Pichia quercuum、皮杰普毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色假丝酵母(Candida albicans)或解脂耶氏酵母(Yarrowia lipolytica)。
[0157] 示例性细胞可以是嗜热毁丝霉,有时称为“C1”。如本文所用,术语“C1”是指嗜热毁丝霉,包括由Garg描述的真菌菌株(参见,Garg,Mycopathol.,30:3-4[1966])。如本文所用,“Chrysosporium lucknowense”包括描述于美国专利号6,015,707、5,811,381和6,573,086;美 国 专 利 公 布 号 2007/0238155、US2008/0194005、US2009/0099079;国际专利公布号.,WO2008/073914和WO98/15633的菌株,其全部通过引用并入本
文,并且包括但不限于Chrysosporium lucknowense Garg27K、VKM-F3500D(获取号VKM F-3500-D)、C1菌株UV13-6(获取号VKM F-3632D)、C1菌株NG7C-19(获取号VKM F-3633D)、和C1菌株UV18-25(VKM F-3631D),其全部被保藏在俄罗斯科学院全俄微生物菌种保藏中心(VKM),Bakhurhina St.8,Moscow,Russia,113184,以及其任何衍生菌株(derivative)。尽管最初被描述为Chrysosporium lucknowense,目前可认为C1是嗜热毁丝霉的菌株。其他C1菌株包括以获取号ATCC44006、CBS(Centraalbureau voor Schimmelcultures)122188、CBS251.72、CBS143.77、CBS272.77、CBS122190、CBS122189和VKM F-3500D保藏的细胞。示例性C1衍生菌株包括其中一个或多个内源基因或序列被缺失或修饰和/或一个或多个外源基因或序列被引入的修饰的生物体。衍生菌株包括但不限于UV18#100fΔalpl、UV18#100fΔpyr5Δalp1、UV18#100.fΔalp1Δpep4Δalp2、UV18#100.fΔpyr5Δalp1Δpep4Δalp2 和 UV18#100.fΔpyr4Δpyr5ΔaIp1Δpep4Δalp2, 如 在WO2008073914和WO2010107303所描述的,其每一篇通过引用并入本文。
[0158] 在一些实施方案中,宿主细胞可以是木霉属物种,诸如长枝木霉(T.longibrachiatum)、绿色木霉(T.viride)、红褐肉座菌(Hypocrea jecorina)或里氏木霉、康宁木霉(T.koningii)、和哈茨木霉(T.harzianum)。可选地,宿主细胞是曲霉属物种,诸如泡盛曲霉、烟曲霉(A.funigatus)、日本曲霉(A.japonicus)、构巢曲霉、黑曲霉、棘孢曲霉(A.aculeatus)、臭曲霉(A.foetidus)、米曲霉、酱油曲霉(A.sojae)、和A.kawachi。可选地,宿主细胞是链孢霉属物种,诸如杆孢状镰孢(F.bactridioides)、谷类镰孢(F.cerealis)、克地镰孢(F.crookwellense)、黄色镰孢(F.culmorum)、禾谷镰孢(F.graminearum)、禾谷镰孢霉(F.graminum)、尖孢镰孢(F.oxysporum)、粉红镰孢(F.roseum)、和镶片镰孢(F.venenatum)。
[0159] 宿主细胞还可以是脉孢属物种,诸如粗糙脉孢霉(N.crassa)。可选地,宿主细胞是腐质霉属物种,诸如特异腐质霉、灰腐质霉和柔毛腐质霉。可选地,宿主细胞是毛霉属物种,诸如米赫毛霉(M.miehei)和卷枝毛霉(M.circinelloides)。宿主细胞可以是根霉属物种,诸如米根霉和雪白根霉(R.niveus)。可选地,宿主细胞是青霉属物种,诸如产紫青霉(P.purpurogenum)、产黄青霉(P.chrysogenum)和疣孢青霉(P.verruculosum)。
[0160] 可选地,宿主细胞为梭孢壳属物种,诸如太瑞斯梭孢壳(T.terrestris)。可选地,宿主细胞为弯颈霉属物种,诸如膨胀弯颈霉(T.inflatum)和地生弯颈霉(T.geodes)。可选地,宿主细胞为栓菌属物种,诸如长绒毛栓菌(T.villosa)和杂色栓菌(T.versicolor)。可选地,宿主细胞是金孢属物种,诸如C.lucknowense、嗜角蛋白金孢(C.keratinophilum)、热带金孢(C.tropicum)、粪状金孢(C.merdarium)、贫乏金孢(C.inops)、C.pannicola、和C.zonatum。在特定实施方案中,宿主是C.lucknowense。可选地,宿主细胞是藻类,诸如衣藻(Chlamydomonas)(诸如莱茵衣藻(C.reinhardtii))和席藻(Phormidium)(P.sp.ATCC29409)。
[0161] 可选地,宿主细胞是原核细胞。适合的原核细胞包括革兰氏阳性菌细胞、革兰氏阴性菌细胞和革兰氏染色不定细菌细胞。细菌宿主细胞的实例包括芽孢杆菌属(诸如枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌(B.megaterium)、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌(B.amyloliquefaciens))、链霉菌属(例如,产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌、天蓝色链霉菌(S.coelicolor)、金霉素链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)、和浅青紫链霉菌)、和链球菌属(诸如马链球菌(S.equisimiles)、化脓链球菌(S.pyogenes)、和乳房链球菌(S.uberis))物种。
[0162] 这一部分中的细胞类型的非限制性实例包括棘孢曲霉、伊拉克固氮螺菌(Azospirillum irakense)KBC1、芽孢杆菌属GL1、双氮纤维单胞菌(Cellulomonas biazotea)、热 纤 梭 菌(Clostridium thermocellum)、布 氏 嗜 热 厌 氧 杆 菌(Thermoanaerobacter brockii)、Coccidioides posadasii、盘基网柄菌(Dictyostelium discoideum)、脑膜败血伊丽莎白金菌(Elizabethkingia meningoseptica)、菊欧文氏菌(Erwinia chrysanthemi)、大肠杆菌、木葡糖醋杆菌(Gluconacetobacter xylinus)、红褐肉座菌、Kuraishia capsulata、烟草(Nicotiana tabacum)、类芽孢杆菌属C7、巴西青霉(Penicillium brasilianum)、黑团孢属BCC2871、燕麦暗球腔菌(Phaeosphaeria avenaria)、Prevotella albensis、豌豆根瘤菌(Rhizobium leguminosarum)、米赫毛霉、白色瘤胃球菌(Ruminococcus albus)、扣囊复膜孢酵母(Saccharomycopsis fibuligera)、鼠伤寒沙门氏菌(Salmonella typhimurium)、番茄壳针孢(Septoria lycopersici)、天蓝色链霉菌、埃默森篮状菌(Talaromyces emersonii)、海栖热袍菌(Thermotoga maritima)、旱金莲(Tropaeolum majus)、蚕豆单胞锈菌(Uromyces viciae-fabae)、和Wickerhamomyces anomalus。
[0163] 可用于本发明的实践中的菌株(原核菌株和真核菌株)可以从任何适当的来源获得,包括但不限于美国典型培养物保藏中心(ATCC)、或其他生物保藏处,诸如德国微生物与细胞培养物保藏中心(DSM)、荷兰真菌保藏所(CBS)、和美国北方农业研究所培养物保藏中心(NRRL)。
[0164] 宿主细胞可被遗传修饰以具有改进遗传操作、蛋白分泌、蛋白稳定性的特征或对于蛋白表达或分泌所期望的其他特性。例如,Alp1功能的敲除得到蛋白酶缺陷的细胞。pyr5功能的敲除得到具有嘧啶缺陷表型的细胞。宿主细胞可被修饰以缺失内源性纤维素酶蛋白编码序列或以其他方式消除一种或多种内源性纤维素酶的表达。可抑制一种或多种不需要的内源性纤维素酶的表达以增加感兴趣的纤维素酶的比例,例如通过化学诱变或紫外线诱变以及随后的选择。可使用同源重组通过在体内特异性地靶向基因抑制编码蛋白的表达来诱导靶基因修饰。
[0165] 转化和细胞培养
[0166] 可将本发明的多核苷酸、编码的GH61蛋白、纤维素酶蛋白或其他蛋白导入宿主细胞中以表达。多核苷酸可作为自复制附加体(例如,表达载体)被导入细胞中或可被稳定地整合入宿主细胞DNA中。将载体或DNA构建体导入到宿主细胞中可通过任何适合的方法,包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、电穿孔或其它常用技术来实现(参见Davis等,1986,BASIC METHODS IN MOLECULAR BIOLOGY;Sambrook等(2001)Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press,New York;“Guide to Yeast Genetics and Molecular Biology,”C.Guthrie 和 G.Fink 编著,Methods in Enzymology350(Academic Press,San Diego,2002)。在一些实施方案中,被导入宿主细胞的多核苷酸保持在基因组中或细胞中的质粒或其他稳定维持的载体上,并能够被其后代继承。稳定的转化通常通过用包含目标多核苷酸以及选择性标记基因(例如,赋予对抗生素的抗性的基因)的表达载体转化宿主细胞来实现。只有在其基因组中整合了表达载体的多核苷酸序列的宿主细胞才能在用标记(例如,抗生素)选择时存活。然后可按照本领域已知的方法繁殖这些稳定转化的宿主细胞。
[0167] 可将工程化的宿主细胞培养在改良为适合激活启动子、选择转化子或扩增GH61多核苷酸的常规营养培养基中。有关细胞培养技术和营养培养基的一般参考文献包括GENE MANIPULATIONS IN FUNGI,Bennett,J.W.等编著,Academic Press,1985;MORE GENE MANIPULATIONS IN FUNGI,Bennett,J.W.等编著,Academic Press,1991;和THE HANDBOOK OF MICROBIOLOGICAL MEDIA,CRC Press,Boca Raton,FL,1993。用于C1宿主细胞的培养条件描述在US2008/0194005、US2003/0187243、WO2008/073914和WO01/79507。培养条件诸如温度、pH等是被选择用于表达的宿主细胞之前所用的培养条件,并且将对本领域技术人员是明显的。如所指出的,描述许多细胞的培养和产生的许多参考文献是可用的,所述细胞包括细菌、植物、动物(尤其是哺乳动物)和古细菌来源的细胞。Atlas和Parks(编著)The Handbook of Microbiological Media(1993)CRC Press,Boca Raton,FL,其通过引用并入本文。另外的细胞培养信息见于可用的商业文献,诸如来自Sigma-Aldrich,Inc(St Louis,MO)的Life Science Research Cell Culture Catalogue(1998)(“Sigma-LSRCCC”)和例如同样来自Sigma-Aldrich,Inc(St Louis,MO)的The Plant Culture Catalogue及增刊(1997)(“Sigma-PCCS”),其全部通过引用并入本文。
[0168] 蛋白富集和纯化
[0169] 可从细胞或肉汤回收表达的多肽。任选地,可使用本领域公知的方法富集(例如,纯化或部分纯化)蛋白。例如,可通过常规程序将多肽从营养培养基中分离,所述常规程序包括但不限于离心、过滤、提取、喷雾干燥、蒸发、色谱(例如,离子交换色谱、固相结合色谱、亲和色谱、疏水相互作用色谱、色谱聚焦和尺寸排阻色谱)和/或过滤、或沉淀。蛋白重折叠步骤可根据期望使用,以完成成熟蛋白的构型。最后,在最后的纯化步骤中可利用高效液相色谱(HPLC)。参见例如,Parry等,2001,Biochem.J.353:117,和 Hong 等 ,2007,Appl.Microbiol.Biotechnol.73:1331,均 通 过 引用并入本文。本领域已知的其他纯化方法包括以下列出的那些:Sandana (1997)Bioseparation of Proteins,Academic Press,Inc.;Bollag等(1996)Protein Methods,第 2 版 ,Wiley-Liss,NY;Walker(1996)The Protein Protocols Handbook Humana Press,NJ;Harris 和 Angal(1990)Protein Purification Applications:A Practical Approach,IRL Press at Oxford,Oxford,England;Harris和Angal Protein Purification Methods:A Practical Approach,IRL Press at Oxford,Oxford,England;Scopes(1993)Protein Purification:Principles and Practice 第 3 版 ,Springer Verlag,NY;
Janson 和 Ryden(1998)Protein Purification:Principles,High Resolution Methods and Applications, 第 二 版,Wiley-VCH,NY;和Walker(1998)Protein Protocols on CD-ROM,Humana Press,NJ,PROTEIN PURIFICATION:PRINCIPLES,HIGH RESOLUTION METHODS,AND APPLICATIONS,J.C.Janson(编著),Wiley2011;HIGH THROUGHPUT PROTEIN EXPRESSION AND PURIFICATION:METHODS AND PROTOCOLS,S.A.Doyle( 编 著 ),Humana Press2009;其全部通过引用并入本文。
[0170] 一般技术
[0171] 编码GH61蛋白和其他蛋白的多核苷酸可以,例如,使用由Beaucage,等,1981,Tetrahedron Letters,22:1859-69描述的经典亚磷酰胺方法或由Matthes,等,1984,EMBO J.3:801-05描述的方法通过化学合成来制备。单独地合成达约40个碱基的寡核苷酸,然后连接(例如,通过酶促或化学连接方法、或聚合酶介导的方法)以基本上形成任何期望的连续序列。
[0172] 描述分子生物学技术,包括使用载体、启动子、包括聚合酶链式反应(PCR)和连接酶链式反应(LCR)的体外扩增方法的一般教科书是Berger和Kimmel,GUIDE TO MOLECULAR CLONING TECHNIQUES,METHODS IN ENZYMOLOGY volume152Academic Press,Inc.,San Diego,CA(Berger);Sambrook等,MOLECULAR CLONING-A LABORATORY MANUAL(第2版),1-3卷,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,1989和CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,F.M.Ausubel等编著,Current Protocols(2009增刊)。
[0173] VII:从培养物肉汤纯化内源GH61蛋白
[0174] 作为重组表达本发明的GH61蛋白的替代方式,分泌的GH61蛋白可以从产生和分泌一种或多种具有GH61活性的内源蛋白的嗜热毁丝霉的培养物肉汤分级。同样地,非分泌的内源GH61可以通过裂解嗜热毁丝霉细胞来回收。
[0175] 可使用标准蛋白分离技术诸如上述的技术并在分级期间以适合的GH61活性测定跟踪GH61活性从表达GH61蛋白的细胞获得本发明的GH61蛋白。
[0176] 如实施例中所示,当从嗜热毁丝霉培养物肉汤分离蛋白时,有效的组合是呈递苯基的树脂上的色谱,随后是阴离子交换色谱。分离技术的结果是,GH61蛋白的比活性(活性测定中每单位总蛋白观察到的活性)可增加约10倍、约25倍、约100倍、约250倍、约1000倍、或更多。
[0177] 已经从适合的来源分级GH61活性后,各级分可互相再次组合和/或与重组GH61蛋白以任何组合再次组合(参见实施例)。然后这样的级分或组合可用于促进本文所述的一种或多种纤维素酶的活性。本发明的纯化的或重组GH61蛋白、和其组合,可导致转化纤维素生物质或其他基质为可发酵糖类的比例纤维素酶活性增加至少约1%、5%、10%、15%、20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约75%、至少约80%、至少约2倍、至少约4倍、或更多。
[0178] 通过使用这样的蛋白分离技术联合GH61活性测定,已经确定,具有对应于GH61f、GH61a、GH61v、GH61p、GH61g和GH61i(SEQ ID NO:2、7、13、20、21、23、26)的完整或部分序列数据的蛋白级分具有增强纤维素酶活性的能力,与其作为GH61蛋白的分类一致(参见实施例)。
[0179] VIII:纤维素酶
[0180] 本发明的GH61蛋白可用于增加一种或多种纤维素酶的糖化反应中可发酵糖类的产量。GH61蛋白和纤维素酶可以在相同细胞或不同细胞中产生。在任一种情形中,纤维素酶可以从重组编码区或从组成型基因表达。纤维素酶可以以培养物肉汤或上清液的形式提供,或被纯化到任何期望的程度。
[0181] 用在本发明中的纤维素酶可以来自于产生纤维素酶的任何生物体,并可以在例如但不限于,本文所述的任何宿主细胞中表达。在一些实施方案中,纤维素酶来自于和/或表达于丝状真菌(例如,毁丝霉属、曲霉属、固氮螺菌属和木霉属物种)或酵母细胞。作为例子,可使用来自于以下任一种细胞的纤维素酶:例如,许多真菌(包括但不限于梭孢壳属、腐质霉属(Humicola)、毛壳属、链孢霉属、毛喙壳属(Chaetomidium)、葡萄座腔菌属(Botryosphaeria)、长毛盘菌属(Trichophaea)、曲霉属、裂褶菌属、伞菌属(Agaricus)、侧孢霉属(Sporotrichium)、棒囊壳属、毁丝霉属、支顶孢属、嗜热子囊菌属、链格孢属(Alternaria)、葡萄孢盘菌属(Botryotinia)、原毛平革菌属(Phanerochaete)、麦角菌属(Claviceps)、旋孢腔菌属、隐丛赤壳属、裸孢壳属(Emericella)、镰孢菌属、赤霉菌属、肉座菌属、耙齿菌属(Irpex)、大角间座壳属(Magnaporthe)、丛赤壳菌属(Nectria)、新萨托菌属(Neosartorya)、青霉属、原毛平革菌属、侧耳属(Pleurotus)、柄孢壳菌属、多孔属(Polyporus)、核盘菌属(Sclerotinia)、粪壳菌属(Sordaria)、篮状菌属、木霉属和小包脚菇属物种。例如,嗜热支顶孢(Acremonium thermophilum);双孢蘑菇(Agaricus bisporus);交替链格孢(Alternaria alternate);棘孢曲霉;棒曲霉(Aspergillus clavatus);黄曲霉(Aspergillus flavus);烟曲霉(Aspergillus fumigatus);构巢曲霉;黑曲霉;米曲霉;土曲霉(Aspergillus terreus);富氏葡萄孢盘菌(Botryotiniafuckeliana);嗜热毛壳菌;黄孢原毛平革菌(Phanerochaete Chrysosporium);黑麦麦角菌(Claviceps purpurea);玉米旋孢腔菌(Cochliobolus carbonum);寄生隐丛赤壳菌(Cryphonectria parasitica);构巢裸胞壳(Emericellanidulans);尖镰孢;梨孢镰孢菌(Fusarium poae);镶片镰孢(Fusarium venenatum);Gibberella avenacea;Gibberella pulicaris;玉蜀黍赤霉(Gibberella zeae);灰腐质霉;康宁肉座菌(Hypocrea koningii);Hypocrea lixii;Hypocrea virens;
白囊耙齿菌(Irpex lacteus);灰色大角间座壳菌(Magnaporthe grisea);红球丛赤壳(Nectria haematococca);费氏新萨托菌(Neosartorya fischeri);粗糙链孢霉(Neurospora crassa);产黄青霉(Penicillium chrysogenum);斜卧青霉(Penicillium decumbens);绳状青霉(Penicillium funiculosum);微紫青霉(Penicillium janthinellum);马尔尼菲青霉(Penicillium marneffei);Penicillium occitanis;草酸青霉(Penicillium oxalicum);
黄孢原毛平革菌(Phanerochaete chrysosporium);侧耳属‘佛罗里达(Florida)’种;
鹅掌柄孢壳(Podospora anserine);漏斗多孔菌(Polyporus arcularius);核盘菌(Sclerotinia sclerotiorum);大孢粪壳菌(Sordaria macrospora);埃默森篮状菌;柄篮状菌(Talaromyces stipitatus);金黄色嗜热子囊菌(Thermoascus aurantiacus);木霉属;绿色木霉;Trichoderma reseipdb;草菇(Volvariella volvacea)。在一个实施方案中,细胞是嗜热毁丝霉。
[0182] 内切葡聚糖酶(EG)
[0183] 本发明提供表达GH61蛋白联合重组内切葡聚糖酶的细胞。术语“内切葡聚糖酶”或“EG”是指分类为E.C.3.2.1.4的一组纤维素酶。这些酶催化纤维素内部的β-1,4糖苷键水解。
[0184] 例如,细胞可包含编码EG蛋白的重组多核苷酸序列。在一些实施方案中,EG多核苷酸序列可操作地连接于异源启动子和/或EG多肽序列包括信号序列。EG蛋白可作为前蛋白表达,其从细胞分泌的同时失去信号肽。
[0185] EG可包括内源嗜热毁丝霉内切葡聚糖酶诸如嗜热毁丝霉EG2a(参见WO2007/109441)或其变体。EG可来自除虫链霉菌(S.avermitilis),具有GenBank获取号NP_821730中所列的序列、或诸如US2010/0267089A1中描述的变体。EG可以是金黄色嗜热子囊菌EG,或是来自细菌、酵母、或嗜热毁丝霉以外的丝状真菌的内源EG。实际上,预计任何适合的EG可联合本文提供的GH61蛋白使用。并非意在本发明限于任何特定的EG。
[0186] β-葡糖苷酶(BGL)
[0187] 本发明提供表达GH61蛋白联合重组β-葡糖苷酶的细胞。术语“β-葡糖苷酶”、“纤维二糖酶”或“BGL”是指分类为E.C.3.2.1.21的一组纤维素酶。这些酶水解纤维二糖为葡萄糖。
[0188] 例如,细胞可包含编码BGL蛋白的重组多核苷酸序列,其中多核苷酸序列可操作地连接于异源启动子和/或信号序列。BGL蛋白可作为前蛋白表达,其从细胞分泌的同时失去信号肽。
[0189] 在一个实施方案中,BGL可以是嗜热毁丝霉BGL1或其变体。BGL1可包括SEQ ID NO:60或SEQ ID NO:66中所列的序列,或是其变体、或US2011/0129881A1中所述的变体。可选地,BGL来自金黄色嗜热子囊菌(TaBGL),具有SEQ ID NO:61所列的序列,或是其变体、或诸如US2011/0124058A1中所述的那些变体。
[0190] 可选地,BGL来自伊拉克固氮螺菌(CelA),具有SEQ ID NO:62中所列的序列,或是其变体、或US2011/0114744A1中所述的变体。可选地,BGL描述在PCT申请号PCT/US2010/038902的表14中。可选地,BGL是来自细菌、酵母、或嗜热毁丝霉以外的丝状真菌的内源BGL。还预期这种天然存在的BGL的变体的使用。实际上,预计任何适合的BGL可联合本文提供的GH61蛋白使用。并非意在本发明限于任何特定的BGL。
[0191] 1型和2型纤维二糖水解酶
[0192] 本发明提供表达GH61蛋白联合重组的1型纤维二糖水解酶的细胞。术语“纤维二糖水解酶”、“外切葡聚糖酶”、“外切-纤维二糖水解酶”或“CBH”是指分类为E.C.3.2.1.91的一组纤维素酶。1型纤维二糖水解酶(CBH1)从纤维素链的还原末端进行性地水解纤维二糖。2型纤维二糖水解酶(CBH2)从纤维素链的非还原末端进行性地水解纤维二糖。
[0193] 例如,细胞可包含编码CBH蛋白的重组多核苷酸序列,其中多核苷酸序列可操作地连接于异源启动子和/或信号肽序列。CBH蛋白可作为前蛋白表达,其从细胞分泌的同时失去信号肽。
[0194] 细胞可以是嗜热毁丝霉细胞,且可以是内源纤维二糖水解酶诸如CBH1a,具有SEQ ID NO:63或67所列的序列,或是其变体。可选地,CBH1是来自细菌、酵母、或嗜热毁丝霉以外的丝状真菌的内源CBH1、或这种天然存在的CBH1的变体。实际上,预计任何适合的CBH可联合本文提供的GH61蛋白使用。并非意在本发明限于任何特定的CBH。
[0195] IX:其中GH61蛋白与纤维素酶混合的无细胞组合物
[0196] 在一个方面,本发明提供包含本文所述的至少一种GH61蛋白(例如,包含SEQ ID NO:1-30的序列、包含GH61蛋白的分泌部分、包含GH61蛋白的氨基末端截短部分、和其生物活性变体)联合至少一种、至少两种、至少三种或更多种选自EG、BGL、CBH1、和/或CBH2的纤维素酶的组合物,其中GH61、EG、BGL、CBH1和/或CBH2的组合质量是组合物中总无细胞蛋白的至少约50%、至少约60%、或至少约70%。GH61蛋白(在肉汤中或以部分纯化的形式)可与来自嗜热毁丝霉或来自其他产生纤维素酶的生物体(包括,例如以下所列的生物体)的纤维素酶混合。
[0197] 在本发明的一些组合物中,GH61蛋白包括SEQ ID NO:2;和(a)CBH1是与SEQ ID NO:63或67具有至少约80%、至少约85%、有时至少约90%、和有时至少约95%序列同一性的嗜热毁丝霉CBH1a变体;和/或(b)CBH2是与SEQ ID NO:64或68具有至少约80%、至少约85%、有时至少约90%、和有时至少约95%序列同一性的嗜热毁丝霉CBH2b变体;和/或(c)BGL是与SEQ ID NO:60或66具有至少约80%、至少约85%、有时至少约90%、和有时至少约
95%序列同一性的嗜热毁丝霉BGL1变体。
[0198] 组合物还可以是包含分泌的重组GH61和纤维素酶蛋白的细胞培养基(即,培养物肉汤)。这样的培养基可通过在其中酶(例如,GH61、EG、CBH和/或BGL蛋白)的组合被表达和分泌的条件下培养上述重组细胞来产生。细胞培养基可以实质上无细胞,例如,通过离心或过滤去除细胞。用于降解纤维素的组合物可通过在其中酶(例如,GH61、EG、CBH和/或BGL蛋白)被表达和分泌的条件下培养上述重组细胞,任选地从培养基去除细胞,任选地富集培养基以增加蛋白的浓度来产生。
[0199] X:GH61蛋白在糖化反应中的用途
[0200] 糖化反应可通过将纤维素基质(例如,预处理的生物质)暴露于GH61蛋白和纤维素酶来进行,GH61蛋白和纤维素酶协同作用来水解纤维素和产生可发酵糖类。
[0201] 通常,纤维素酶包括至少一种内切葡聚糖酶(EG)、至少一种β-葡糖苷酶(BGL)、至少一种1型纤维二糖水解酶(CBH1)、和/或至少一种2型纤维二糖水解酶(CBH2)。
[0202] 本发明的细胞和组合物(包括培养物肉汤或细胞溶解产物)可用于从纤维素生物质产生可发酵糖类。可通过以下将生物质基质转化为可发酵糖类:(a)任选地预处理纤维素基质以增加其对水解的敏感性;(b)在适于产生纤维二糖和可发酵糖类(例如,葡萄糖)的条件下将步骤(a)的任选地预处理的纤维素基质与包含GH61蛋白和纤维素酶的组合物、培养基或细胞溶解产物接触。
[0203] 在一个实施方案中,为了进行糖化反应,可将以上提及的每一种GH61蛋白和纤维素酶部分或基本上纯化,并将纯化的蛋白与纤维素基质混合。在另一个实施方案中,在不同细胞中重组地表达各种单独的蛋白,将包含分泌的蛋白的培养基添加至生物质。
[0204] 组合物可在约25℃至约110℃、约30℃至约90℃、约30℃至约80℃、约40℃至约80℃、约35℃至约75℃、约55℃至100℃或至约90℃的范围中的温度与基质反应。过程可在约pH3.0至约8.5、约pH3.5至约8.5、约pH4.0至约7.5、约pH4.0至约7.0、和约pH4.0至约6.5的范围中的pH进行。用于转化特定生物质基质为可发酵糖类的反应时间可变化,但最佳反应时间可容易地确定。示例性反应时间可在从约1至约240小时、从约5至约180小时、和从约10至约150小时的范围中。例如,培养时间可以是至少1小时、至少5h、至少
10h、至少15h、至少25h、至少50h、至少100h、或至少180h。
[0205] 在一些实施方案中,本发明的GH61多肽联合其他任选成分诸如至少一种缓冲液或表面活性剂使用。在一些实施方案中,至少一种缓冲液与本发明的GH61多肽(任选地混合其他酶)一起使用以保持其中采用GH61的溶液中的期望pH。适合的缓冲液是本领域公知的。在一些实施方案中,至少一种表面活性剂与本发明的GH61一起使用。二价金属阳离++ ++ ++ ++子(例如,0.001至50mM、5μM至1mM、10-50μM或10-20μM浓度的Cu 、Mn 、Co 、Mg 和++
Ca )可被包括在反应中。
[0206] GH61蛋白和纤维素酶的示例性组合包括:GH61蛋白与一种或多种内切葡聚糖酶(EG);GH61蛋白与一种或多种β-葡糖苷酶(BGL);GH61蛋白与一种或多种1型纤维二糖水解酶(CBH1);或GH61蛋白与一种或多种2型纤维二糖水解酶(CBH2)。其他组合是GH61蛋白与EG和BGL;GH61蛋白与EG和CBH1;GH61蛋白与EG和CBH2;GH61蛋白与BGL和CBH1;GH61蛋白与BGL和CBH2,或GH61蛋白与CBH1和CBH2。其他组合是GH61蛋白与EG、BGL和CBH1;GH61蛋白与EG、BGL和CBH2;GH61蛋白与EG、CBH1、CBH2;GH61蛋白与BGL、CBH1和CBH2;以及GH61蛋白与EG、BGL、CBH1和CBH2的所有。本公开文件中所列的其他酶可被包括在这些组合的任何一种或多种中。
[0207] 在一些实施方案中,酶混合物包括本文提供的分离的GH61和至少一种或多种分离的纤维二糖水解酶1a型诸如CBH1a、分离的CBH2b、分离的内切葡聚糖酶(EG)诸如2型内切葡聚糖酶(EG2)或1型内切葡聚糖酶(EG1)、和/或分离的β-葡糖苷酶(BGL)。在一些实施方案中,至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或至少50%的酶混合物是GH61。在一些实施方案中,酶混合物还包括纤维二糖水解酶1a型(例如,CBH1a)、和GH61,其中各酶一起构成酶混合物的至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、或至少
80%。在一些实施方案中,酶混合物还包括β-葡糖苷酶(BGL)、GH61、CBH2b,其中这三种酶一起构成酶混合物的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、或至少85%。在一些实施方案中,酶混合物还包括内切葡聚糖酶(EG)、GH61、CBH2b、CBH1a、BGL,其中这五种酶一起构成酶混合物的至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、或至少90%。在一些实施方案中,酶混合物以适合期望反应的任何适合的比例包括GH61、CBH2b、CBH1、BGL、和至少一种EG。
[0208] 在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶(其中纤维素酶的总重量是100%):约20%-10%的BGL、约30%-25%的CBH1a、约10%-30%的GH61、约20%-10%的EG1b、和约20%-25%的CBH2b。在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约20%-10%的GH61、约25%-15%的BGL、约20%-30%的CBH1a、约10%-15%的EG、和约25%-30%的CBH2b。在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约30%-20%的GH61、约15%-10%的BGL、约25%-10%的CBH1a、约25%-10%的CBH2b、约15%-10%的EG。在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约40-30%的GH61、约15%-10%的BGL、约20%-10%的CBH1a、约20%-10%的CBH2b、和约15%-10%的EG。
[0209] 在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约50-40%的GH61、约15%-10%的BGL、约20%-10%的CBH1a、约15%-10%的CBH2b、和约10%-5%的EG。在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约
10%-15%的GH61、约20%-25%的BGL、约30%-20%的CBH1a、约15%-5%的EG、和约25%-35%的CBH2b。在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约
15%-5%的GH61、约15%-10%的BGL、约45%-30%的CBH1a、约25%-5%的EG1b、和约40%-10%的CBH2b。在一些实施方案中,酶混合物组合物包括以以下重量比例的分离的纤维素酶:约
10%的GH61、约15%的BGL、约40%的CBH1a、约25%的EG、和约10%的CBH2b。
[0210] 在一些实施方案中,酶组分以任何合适的组合包括多于一种CBH2b、CBH1a、EG、BGL、和/或GH61酶(例如,2、3或4种不同的酶)。在一些实施方案中,本发明的酶混合物组合物还包括至少一种另外的蛋白和/或酶。在一些实施方案中,本发明的酶混合物组合物还包括GH61、BGL、CBH1a、GH61、和/或CBH以外的至少一种另外的酶。在一些实施方案中,本发明的酶混合物组合物还包括本文提及的GH61、BGL、CBH1a、GH61、和/或CBH变体以外的至少一种另外的纤维素酶。在一些实施方案中,本发明的GH61多肽还在与降解纤维素、半纤维素、果胶、和/或木质纤维素的非纤维素酶、和/或以下描述的其他酶的混合物中存在。
[0211] 示例性嗜热毁丝霉实施方案
[0212] 为了示例而非限制,提供了以下示例性实施方案:
[0213] 本发明的一个实施方案是宿主细胞,其是表达包含SEQ ID NO:1-30、包含GH61蛋白的分泌部分、包含GH61蛋白的氨基末端截短部分的重组蛋白、和其生物活性变体的嗜热毁丝霉细胞。在一些情形中,细胞表达选自SEQ.ID NO:3至12的GH61或相应的分泌的蛋白、或选自SEQ ID NO:13至25的GH61或相应的分泌的蛋白。
[0214] 本发明提供包括编码GH61蛋白的重组核酸序列的细胞。在一些方面,本发明提供包括编码以下蛋白的重组核酸序列的细胞:与SEQ ID NO:2具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的蛋白,或与SEQ ID NO:1至30的任一种的分泌部分具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的蛋白,包含GH61蛋白(例如,SEQ ID NO:2)的分泌部分的蛋白,包含GH61蛋白的氨基末端截短部分的蛋白,和其生物活性变体。重组核酸序列可编码与表1或表2中所列的GH61蛋白具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约
96%、至少约97%、至少约98%、或至少约99%序列同一性的蛋白。
[0215] 核酸可包括SEQ.ID NO:31至59的任一种所示的核苷酸序列、或其片段、或在严格条件(即,中-高、高、或极高严格性)条件下与SEQ ID NO:31-59(或精确互补序列)杂交且编码具有GH61活性的多肽的核酸。可选地,核酸可编码与所述序列或片段的任一种至少约70%、至少约80%、至少约90%、或至少约95%、或至少99%相同的多肽,其中核酸编码并可被表达以提供具有GH61活性的多肽。任选地,可为在特定物种诸如酵母中表达而对所述核酸序列进行密码子优化,如本公开文件中别处描述的。
[0216] 在本发明的一个实施方案中,宿主细胞表达包含SEQ ID NO:1至30的任一种的至少一种重组GH61、和/或与SEQ ID NO:1至25具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的至少一种重组GH61蛋白;还表达:
[0217] a)与嗜热毁丝霉EG2a(SEQ ID NO:65)具有至少约70%、至少约75%、至少约80%、至少约85%、有时至少约90%、和有时至少约95%序列同一性的重组EG蛋白;和/或
[0218] b)与SEQ ID NO:63或67具有至少约70%、至少约75%、至少约80%、至少约85%、有时至少约90%、和有时至少约95%序列同一性的重组CBH1a蛋白;和/或
[0219] c)与SEQ ID NO:64或68具有至少约70%、至少约75%、至少约80%、至少约85%、有时至少约90%、和有时至少约95%序列同一性的重组CBH2b蛋白;和/或
[0220] d)与SEQ ID NO:60、61、62或66具有至少约70%、至少约75%、至少约80%、至少约85%、有时至少约90%、和有时至少约95%序列同一性的重组BGL蛋白。
[0221] 在本发明的某些实施方案中,细胞表达(a)、(b)、(c)和(d)的至少一种、至少两种、至少三种(例如,b-d)或所有四种。
[0222] XI.外源EG不存在时的糖化
[0223] 在一个方面,本发明提供水解纤维素基质的方法,包括在实质上无内切葡聚糖酶(EG)的组合物中将GH61蛋白与β-葡糖苷酶(BGL)和纤维二糖水解酶(CBH)酶混合。应理解的是,由GH61蛋白贡献的EG-样活性不被认为是内切葡聚糖酶。如以下实施例示例的,糖化反应可在存在GH61蛋白、β-葡糖苷酶和一种或多种纤维二糖水解酶、无重组EG、或不加入EG、或基本上无EG时进行。I型或II型纤维二糖水解酶的任一种或二者可存在。在EG不存在时,GH61可增加BGL和单种CBH的糖化反应的产量超过1.5倍或1.7倍。
[0224] 如果(a)反应中不存在可检测的内切葡聚糖酶活性,或(b)存在的EG酶的量是存在的BGL的量的少于2%、通常少于1%、通常少于0.5%、通常少于0.2%、和通常少于0.1%(wt/wt),或(c)存在的EG酶的量是存在的CBH的量的少于2%、通常少于1%、通常少于0.5%、通常少于0.2%、和通常少于0.1%(wt/wt),或(d)存在的EG酶的量是存在的GH61的量的少于2%、通常少于1%、通常少于0.5%、通常少于0.2%、和通常少于0.1%(wt/wt),或(e)或(d)存在的EG酶的量是存在的总纤维素酶的量的少于2%、通常少于1%、通常少于0.5%、通常少于
0.2%、和通常少于0.1%(wt/wt),则称反应“基本上无”内切葡聚糖酶。
[0225] XII:包含其他酶的组合物
[0226] 可在糖化工艺中协同作用以水解纤维素基质(诸如纤维素或含淀粉的基质)的另外的酶可被包括在本发明的组合物中或被掺入本发明的方法中。这样的酶包括但不限于,木聚糖酶、半纤维素酶、淀粉酶、酯酶、和纤维素酶、α-葡糖苷酶、氨基肽酶、糖酶、羧肽酶、催化酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、转化酶、漆酶、脂酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶溶解酶(pectinolytic enzyme)、过氧化物酶、磷脂酶、植酸酶、多酚氧化酶、核糖核酸酶、和谷氨酰胺转移酶、以及其他纤维素酶(例如,1型和2型纤维二糖水解酶、内切葡聚糖酶、和β-葡糖苷酶)。用于有效酶促水解纤维素的纤维素酶混合物是已知的(参见例如,Viikari等,2007,Adv.Biochem.Eng.Biotechnol.,108:121-45;和美国专利公布2009/0061484;US2008/0057541;和US2009/0209009,每一篇均通过引用并入本文)。在一些实施方案中,将纯化的天然存在的或重组的酶的混合物与纤维素原料或纤维素水解的产物组合。在一些实施方案中,将各自产生一种或多种天然存在或重组的纤维素酶的一个或多个细胞群体与纤维素原料或纤维素水解产物组合。
[0227] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种内切木聚糖酶。内切木聚糖酶(EC3.2.1.8)催化木聚糖中的1,4-β-D-木糖苷键的内切水解(endohydrolysis)。这种酶还可以被称为内切-1,4-β-木聚糖酶或1,4-β-D-木聚糖木聚糖水解酶。在一些实施方案中,替代物是EC3.2.1.136,葡糖醛酸阿拉伯木聚糖内切木聚糖酶,是能够水解葡糖醛酸阿拉伯木聚糖中的1,4木糖苷键的酶。
[0228] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种β-木糖苷酶。β-木糖苷酶(EC3.2.1.37)催化1,4-β-D-木聚糖的水解以从非还原性末端除去逐个的D-木糖残基。这种酶还可以被称为木聚糖1,4-β-木糖苷酶、1,4-β-D-木聚糖木水解酶(1,4-β-D-xylan xylohydrolase)、外切-1,4-β-木糖苷酶或木二糖酶(xylobiase)。
[0229] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种α-L-阿拉伯呋喃糖苷酶。α-L-阿拉伯呋喃糖苷酶(EC3.2.1.55)催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶作用于α-L-阿拉伯呋喃糖苷、包含(1,3)-键和/或(1,5)-键的α-L-阿拉伯聚糖(alpha-L-arabinan)、阿拉伯木聚糖和阿拉伯半乳聚糖。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶和α-L-阿拉伯聚糖酶。
[0230] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种α-葡糖醛酸酶。α-葡糖醛酸酶(EC3.2.1.139)催化α-D-葡糖醛酸苷水解为D-葡糖醛酸和醇。
[0231] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种乙酰基木聚糖酯酶。乙酰基木聚糖酯酶(EC3.1.1.72)催化乙酰基从聚合的木聚糖、乙酰化的木糖、乙酰化的葡萄糖、α-萘基乙酸酯和对硝基苯基乙酸酯水解。
[0232] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种阿魏酰酯酶。阿魏酰酯酶(EC3.1.1.73)具有催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基从酯化的糖(其通常是“自然”底物中的阿拉伯糖)水解以产生阿魏酸(4-羟基-3-甲氧基肉桂酸酯)的4-羟基-3-甲氧基肉桂酰-糖水解酶活性(EC3.1.1.73)。阿魏酰酯酶还被称为阿魏酸酯酶、羟基肉桂酰酯酶、FAE-III、肉桂酰酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。
[0233] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种香豆酰酯酶。香豆酰酯酶(EC3.1.1.73)催化如下形式的反应:香豆酰-糖+H2O=香豆酸酯+糖。在一些实施方案中,糖是寡糖或多糖。这种酶还可以被称为反式-4-香豆酰酯酶、反式-对-香豆酰酯酶、对-香豆酰酯酶或对-香豆酸酯酶。该酶还落在EC3.1.1.73之内,所以还可以被称为阿魏酰酯酶。
[0234] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种α-半乳糖苷酶。α-半乳糖苷酶(EC3.2.1.22)催化α-D-半乳糖苷中的末端非还原性α-D-半乳糖残基的水解,所述α-D-半乳糖苷包括半乳糖寡糖、半乳糖甘露聚糖、半乳聚糖和阿拉伯半乳聚糖。这种酶还可以被称为蜜二糖酶。
[0235] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种β-半乳糖苷酶。β-半乳糖苷酶(EC3.2.1.23)催化β-D-半乳糖苷中的末端非还原性β-D-半乳糖残基的水解。在一些实施方案中,该多肽还能够水解α-L-阿拉伯糖苷。这种酶还可以被称为外切-(1->4)-β-D-半乳聚糖酶或乳糖酶。
[0236] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种β-甘露聚糖酶。β-甘露聚糖酶(EC3.2.1.78)催化甘露聚糖、半乳糖甘露聚糖和葡甘露聚糖中的1,4-β-D-甘露糖苷键的随机水解。这种酶还可以被称为甘露聚糖内切-1,4-β-甘露糖苷酶或内切-1,4-甘露聚糖酶。
[0237] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种β-甘露糖苷酶。β-甘露糖苷酶(EC3.2.1.25)催化β-D-甘露糖苷中的末端非还原性β-D-甘露糖残基的水解。这种酶还可以被称为甘露聚糖酶(mannanase)或甘露聚糖酶(mannase)。
[0238] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种葡糖淀粉酶。葡糖淀粉酶(EC3.2.1.3)催化D-葡萄糖从寡糖和多糖分子的非还原末端释放。葡糖淀粉酶通常被认为是称为淀粉-葡糖苷酶的一种类型的淀粉酶。
[0239] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种淀粉酶。淀粉酶(EC3.2.1.1)是以内-或外-作用方式水解α-1,4和/或α-1,6糖苷键来降解淀粉和相关化合物的淀粉裂解酶。淀粉酶包括α-淀粉酶(EC3.2.1.1);β-淀粉酶(3.2.1.2)、淀粉-淀粉酶(EC3.2.1.3)、α-葡糖苷酶(EC3.2.1.20)、支链淀粉酶(EC3.2.1.41)、和异淀粉酶(EC3.2.1.68)。在一些实施方案中,淀粉酶是α-淀粉酶。在一些实施方案中,降解果胶的一种或多种酶被包括在包括本发明的GH61的酶混合物中。果胶酶催化果胶水解成较小的单元,诸如寡糖或单体糖。在一些实施方案中,酶混合物包括任何果胶酶,例如内切-聚半乳糖醛酸酶、果胶甲基酯酶、内切-半乳聚糖酶、果胶乙酰基酯酶、内切-果胶裂解酶、果胶酸裂解酶、α鼠李糖苷酶、外切-半乳糖醛酸酶、外切-聚半乳糖醛酸裂解酶、鼠李聚糖半乳糖醛酸(rhamnogalacturonan)水解酶、鼠李聚糖半乳糖醛酸裂解酶、鼠李聚糖半乳糖醛酸乙酰基酯酶、鼠李聚糖半乳糖醛酸半乳糖醛酸水解酶和/或木半乳糖醛酸酶(xylogalacturonase)。
[0240] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种内切-聚半乳糖醛酸酶。内切-聚半乳糖醛酸酶(EC3.2.1.15)催化果胶酸和其他半乳糖醛酸聚糖(galacturonan)中的1,4-α-D-半乳糖苷醛酸键(1,4-α-D-galactosiduronic linkage)的随机水解。这种酶还可以被称为聚半乳糖醛酸酶果胶解聚酶、果胶酶(pectinase)、内切聚半乳糖醛酸酶、果胶酶(pectolase)、果胶水解酶、果胶聚半乳糖醛酸酶、聚-α-1,4-半乳糖醛酸苷聚糖水解酶、内切半乳糖醛酸酶;内切-D-半乳糖醛酸酶或聚(1,4-α-D-半乳糖醛酸苷)聚糖水解酶。
[0241] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种果胶甲基酯酶。果胶甲基酯酶(EC3.1.1.11)催化如下反应:果胶+n H2O=n甲醇+果胶酸。这种酶还可以称为果胶酯酶、脱甲氧基果胶酶(pectindemethoxylase)、果胶甲氧基酶、果胶甲基酯酶、果胶酶、果胶酯酶(pectinoesterase)或果胶甲酯水解酶(pectin pectylhydrolase)。
[0242] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种内切半乳聚糖酶。内切半乳聚糖酶(EC3.2.1.89)催化阿拉伯半乳聚糖中的1,4-β-D-半乳糖苷键的内切水解(endohydrolysis)。该酶还可以称为阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶、内切-1,4-β-半乳聚糖酶、半乳聚糖酶、阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4-β-D-半乳聚糖水解酶。
[0243] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种果胶乙酰基酯酶。果胶乙酰基酯酶催化果胶GaIUA残基的羟基处的乙酰基的脱乙酰基作用。
[0244] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种内切-果胶裂解酶。内切-果胶裂解酶(EC4.2.2.10)催化(1→4)-α-D-半乳糖醛酸聚糖甲基酯的消除性切割以给予在非还原性末端具有4-脱氧-6-O-甲基-α-D-半乳-4-烯醛酸糖基(4-deoxy-6-O-methyl-α-D-galact-4-enuronosyl)基团的寡糖。该酶还可以称为果胶裂解酶、果胶反式-消除酶(pectin trans-eliminase);内切-果胶裂解酶、聚甲基半乳糖醛酸反式消除酶、果胶甲基反式消除酶、果胶裂解酶(pectolyase)、PL、PNL或PMGL或(1→4)-6-O-甲基-α-D-半乳糖醛酸聚糖裂解酶。
[0245] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种果胶酸裂解酶。果胶酸裂解酶(EC4.2.2.2)催化(1→4)-α-D-半乳糖醛酸聚糖的消除性切割以给予在非还原性末端具有4-脱氧-α-D-半乳-4-烯醛酸糖基(4-deoxy-α-D-galact-4-enuronosyl)基团的寡糖。该酶还可以称为聚半乳糖醛酸反式消除酶(polygalacturonic transeliminase)、果胶酸反式消除酶、聚半乳糖醛酸裂解酶、内切果胶甲基反式消除酶、果胶酸反式消除酶、内切半乳糖醛酸反式消除酶、果胶酸裂解酶、果胶裂解酶、α-1,4-D-内切聚半乳糖醛酸裂解酶、PGA裂解酶、PPase-N、内切-α-1,4-聚半乳糖醛酸裂解酶、聚半乳糖醛酸裂解酶、果胶反式消除酶、聚半乳糖醛酸反式消除酶或(1→4)-α-D-半乳糖醛酸聚糖裂解酶。
[0246] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种α-鼠李糖苷酶。α-鼠李糖苷酶(EC3.2.1.40)催化α-L-鼠李糖苷或可选的鼠李聚糖半乳糖醛酸中的末端非还原性α-L-鼠李糖残基的水解。这种酶还可以称为α-L-鼠李糖苷酶T、α-L-鼠李糖苷酶N或α-L-鼠李糖苷鼠李糖水解酶。
[0247] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种外切-半乳糖醛酸酶。外切-半乳糖醛酸酶(EC3.2.1.82)从非还原性末端水解果胶酸,释放二半乳糖醛酸(digalacturonate)。该酶还可以称为外切-聚-α-半乳糖醛酸苷酶、外切聚半乳糖苷酶或外切聚半乳糖醛酸苷酶。
[0248] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种半乳糖醛酸聚糖1,4-α-半乳糖醛酸苷酶(galacturan1,4-α-galacturonidase)。半乳糖醛酸聚糖1,4-α-半乳糖醛酸苷酶(EC3.2.1.67)催化如下类型的反应:(1,4-α-D-半乳糖醛酸苷)n+H2O=(1,4-α-D-半乳糖醛酸苷)n-i+D-半乳糖醛酸。该酶还可以称为聚[1->4)α-D-半乳糖醛酸苷]半乳糖醛酸水解酶、外切聚半乳糖醛酸酶、聚(半乳糖醛酸)水解酶、外切-D-半乳糖醛酸酶、外切-D-半乳糖醛酸酶、外切聚-D-半乳糖醛酸酶或聚(1,4-α-D-半乳糖醛酸苷)半乳糖醛酸水解酶。
[0249] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种外切聚半乳糖醛酸裂解酶。外切聚半乳糖醛酸裂解酶(EC4.2.2.9)催化4-(4-脱氧-α-D-半乳-4-烯醛酸糖基)-D-半乳糖醛酸从果胶酸(即去酯化的果胶)的还原性末端的消除性切割。这种酶还可以称为果胶酸二糖裂解酶、果胶酸外切裂解酶、外切果胶酸反式消除酶、外切果胶酸裂解酶、外切聚半乳糖醛酸-反式-消除酶、PATE、外切-PATE、外切-PGL或(1→4)-α-D-半乳糖醛酸聚糖还原性末端二糖裂解酶。
[0250] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种鼠李聚糖半乳糖醛酸酶。鼠李聚糖半乳糖醛酸酶在由二糖[(1,2-α-L-鼠李糖酰-(1,4)-α-半乳糖基醛酸]组成的严格交替的鼠李聚糖半乳糖醛酸结构中以内切方式水解半乳糖基醛酸与吡喃鼠李糖基之间的键。
[0251] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种鼠李聚糖半乳糖醛酸裂解酶。鼠李聚糖半乳糖醛酸裂解酶在鼠李聚糖半乳糖醛酸中借助β-消除以内切方式切割α-L-Rhap-(1→4)-α-D-GalpA键。
[0252] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种鼠李聚糖半乳糖醛酸乙酰基酯酶。鼠李聚糖半乳糖醛酸乙酰基酯酶催化鼠李聚糖半乳糖醛酸中交替的鼠李糖和半乳糖醛酸残基的主链的脱乙酰基作用。
[0253] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种鼠李聚糖半乳糖醛酸半乳糖醛酸水解酶。鼠李聚糖半乳糖醛酸半乳糖醛酸水解酶以外切方式水解来自严格交替的鼠李聚糖半乳糖醛酸结构的非还原性末端的半乳糖醛酸。这种酶还可以称为木半乳糖醛酸聚糖(xylogalacturonan)水解酶。
[0254] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种内切-阿拉伯聚糖酶。内切-阿拉伯聚糖酶(EC3.2.1.99)催化1,5-阿拉伯聚糖中的1,5-α-阿拉伯呋喃糖苷键的内切水解。该酶还可以称为内切-阿拉伯酶、阿拉伯聚糖内切1,5-α-L-阿拉伯糖苷酶、内切-1,5-α-L-阿拉伯聚糖酶(endo-1,5-α-L-arabinanase)、内切-α-1,5-阿拉伯聚糖酶(endo-α-1,5-arabinase);内切-阿拉伯聚糖酶或1,5-α-L-阿拉伯聚糖1,5-α-L-阿拉伯糖水解酶。
[0255] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种在酶混合物中参与木质素降解的酶。酶促木质素解聚可由通常协同起作用的木质素过氧化物酶、锰过氧化物酶、虫漆酶和纤维二糖脱氢酶(CDH)完成。这些胞外酶常常被称为“木质素改性酶(lignin-modifying enzyme)”或“LME”。这些酶中的三种包括含两个糖基化的血红素的过氧化物酶:木质素过氧化物酶(LIP);Mn依赖性过氧化物酶(MNP);以及含铜的酚氧化酶虫漆酶(LCC)。
[0256] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种虫漆酶。虫漆酶是在许多植物、真菌和微生物中发现的含铜的氧化酶。虫漆酶对酚类和类似分子具有酶活性并且进行一个电子的氧化。虫漆酶可以是聚合的并且酶活性形式可以是二聚体或三聚体。
[0257] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种Mn依赖性过氧化物酶。Mn依赖性过氧化物酶(MnP)的酶活性依赖于Mn2+。不受理论束缚,已表明这种酶的主要作用是将Mn2+氧化成Mn3+(参见例如,Glenn等,Arch.Biochem.Biophys.,251:688-696[1986])。随后,酚类底物被产生的Mn3+氧化。
[0258] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种木质素过氧化物酶。木质素过氧化物酶是催化体外的聚合木质素的稀溶液的氧化解聚作用的胞外血红素。一些LiP的底物,最值得注意的是3,4-二甲氧基苄醇(藜芦醇,VA),是显示充当氧化还原介质(mediator)的活性氧化还原化合物。VA是与LiP同时被黄孢原毛平革菌的木质素分解培养物产生的次生代谢产物,且不受理论限制,已提出VA作为体内木质素的LiP催化氧化中的生理学氧化还原介质起作用(参见例如,Harvey,等,FEBS Lett.,195:242-246[1986])。
[0259] 在一些另外的实施方案中,本发明提供至少一种GH61和参与纤维素降解的至少一种蛋白酶、淀粉酶、葡糖淀粉酶、和/或脂酶。
[0260] 如本文所用,术语“蛋白酶”包括水解肽键的酶(肽酶)以及水解肽与其他部分诸如糖之间的键的酶(糖肽酶)。许多蛋白酶被表征在EC3.4之下并且适于在本发明中使用。一些特定类型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶、木瓜蛋白酶)和丝氨酸蛋白酶(包括糜蛋白酶、羧肽酶和金属内切肽酶)。
[0261] 如本文所用,术语“脂酶”包括水解脂质、脂肪酸和酰基甘油酯(包括磷酸甘油酯、脂蛋白、二酰基甘油等)的酶。在植物中,脂质被用作限制水分损失和病原体感染的结构组分。这些脂质包括从脂肪酸获取的蜡以及角质和木栓质。
[0262] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种扩展蛋白(expansin)或扩展蛋白样蛋白,诸如纤维膨胀因子(swollenin)(参见例如,Salheimo等,Eur.J.Biochem.,269:4202-4211[2002])或纤维膨胀因子样蛋白。扩展蛋白与植物细胞生长过程中细胞壁结构的松弛有关。已提出扩展蛋白破坏纤维素与其他细胞壁多糖之间的氢键而没有水解活性。以这种方法,认为它们允许纤维素纤维的滑动和细胞壁的扩展。纤维膨胀因子是一种扩展蛋白样蛋白,包括N端碳水化合物结合模块家族1结构域(CBD)和C端扩展蛋白样结构域。在一些实施方案中,扩展蛋白样蛋白或纤维膨胀因子样蛋白包括此类结构域中的一个或两个和/或破坏细胞壁的结构(诸如破坏纤维素结构),任选地不产生可检测的量的还原糖。
[0263] 在一些另外的实施方案中,本发明提供至少一种GH61和纤维素整合蛋白(cellulose integrating protein)、支架蛋白或支架蛋白样蛋白的至少一种多肽产物,例如分别来自热纤梭菌或解纤维梭菌(Clostridium cellulolyticum)的CipA或CipC。支架蛋白和纤维素整合蛋白是可将分解纤维素的亚基组织成多酶复合体的多功能整合亚基。这是通过两个互补类别的结构域(即支架蛋白上的粘附结构域(cohesion domain)和每个酶单位上的锚定结构域(dockerin domain))的相互作用而完成的。支架蛋白亚基还具有介导纤维素体(cellulosome)附在其底物上的纤维素结合模块。支架蛋白或纤维素整合蛋白为本发明的目的可包括此类结构域中的一种或两种。
[0264] 在一些另外的实施方案中,本发明提供至少一种GH61和至少一种纤维素诱导蛋白或纤维素调节蛋白,例如,由来自里氏木霉的cip1或cip2基因或类似基因所编码的蛋白(参见例如,Foreman等,J.Biol.Chem.,278:31988-31997[2003])。
[0265] 在一些另外的实施方案中,本发明提供至少一种GH61和上述多肽类别中的每一种的至少一个成员、一个多肽类别中的若干成员、或这些多肽类别的任何组合,以提供适于多种用途的酶混合物。
[0266] 在一些实施方案中,酶混合物包括其他类型的纤维素酶,选自但不限于纤维二糖水解酶、内切葡聚糖酶、β-葡糖苷酶、和糖苷水解酶61蛋白(GH61)纤维素酶。这些酶可以是野生型或重组酶。在一些实施方案中,纤维二糖水解酶是1型纤维二糖水解酶(例如,里氏木霉纤维二糖水解酶I)。在一些实施方案中,内切葡聚糖酶包括衍生自除虫链霉菌内切葡聚糖酶的催化结构域的催化结构域(参见例如,美国专利申请公布号2010/0267089,通过引用并入本文)。在一些实施方案中,至少一种纤维素酶衍生自嗜酸纤维素分解菌、嗜热放线菌、灰腐质霉、嗜热毁丝霉、嗜热毛壳菌、支顶孢属、梭孢壳属、里氏木霉、曲霉属或金孢属。纤维素酶混合物的各纤维素酶共同作用,导致纤维素从生物质基质解晶和水解来产生可发酵糖类,诸如但不限于葡萄糖。
[0267] 用于有效酶促水解纤维素的一些纤维素酶混合物是已知的(参见例如,Viikari等,Adv.Biochem.Eng.Biotechnol.,108:121-45[2007];和美国专利申请公布号US2009/0061484、US2008/0057541、和US2009/0209009,其每一篇通过引用全文并入本文)。在一些实施方案中,将纯化的天然存在的或重组酶的混合物与纤维素原料或纤维素水解产物混合。可选地或此外,将各自产生一种或多种天然存在的或重组纤维素酶的一种或多种细胞群体与纤维素原料或纤维素水解产物混合。
[0268] 在一些实施方案中,酶混合物包括商业上可获得的纯化的纤维素酶。商业纤维素酶是已知和可获得的(例如,来自里氏木霉ATCC No.25921的C2730纤维素酶,可从Sigma-Aldrich,Inc.获得;和C9870 1500,可从Genencor获得)。
[0269] XIII.纤维素基质
[0270] 纤维素基质可获取自任何包含纤维素的材料,诸如获取自植物、动物或微生物的生物质,并可包括农业、工业、和林业残余物、工业和市政废弃物、以及为了能源目的而种植的陆地和水生作物。“纤维素基质”宽泛地包括包含多糖基质的任何活的或死亡的生物材料,包括但不限于纤维素、淀粉、其他形式的长链碳水化合物聚合物、和这些来源的混合物。其可以是或可以不是完全或主要地从葡萄糖或木糖组装,并可任选地还包含多种其他的戊糖或己糖单体。木糖是包含五个碳原子和醛基的戊醛糖。它是半纤维素的前体,并通常是生物质的主要组成部分。
[0271] 纤维素基质通常作为可在被纤维素酶水解之前被加工的木质纤维素原料提供。如本文所用,术语“木质纤维素原料”是指任何类型的植物生物质,诸如但不限于栽培作物(例如,草、包括C4草,诸如柳枝稷、大米草、黑麦草、芒草、草芦、或其任何组合)、糖加工残渣,例如但不限于,蔗渣(例如,甘蔗渣、甜菜浆、或其组合)、农业残渣(例如,大豆秸秆、玉米秸秆、玉米纤维、稻秸、甘蔗秆、大米、稻壳、大麦秆、玉米芯、麦秆、油菜秆、燕麦秆、燕麦壳、玉米纤维、大麻、亚麻、剑麻、棉花、或其任何组合)、果浆、蔬菜浆、酒糟、林业生物质(例如,木头、木纸浆、纸浆、回收的木浆纤维、锯末、硬木,诸如白杨木、软木材、或其组合)。而且,在一些实施方案中,木质纤维素原料包括纤维素废料和/或林业废料,包括但不限于,纸和纸浆加工废料、新闻纸、纸板和类似物。生物质还可包括表达木质素酶和/或纤维素酶的转基因植物(US2008/0104724A1)。
[0272] 在一些实施方案中,木质纤维素原料包括一种纤维物质,而在一些替代实施方案中,木质纤维素原料包括来源于不同木质纤维素原料的纤维的混合物。在一些其他实施方案中,木质纤维素原料包括新鲜木质纤维素原料、部分干燥的木质纤维素原料、完全干燥的木质纤维素原料、和/或其任何组合。在一些实施方案中,木质纤维素原料包括多于约20%、更优选地多于约30%、更优选地多于约40%(w/w)的量的纤维素。例如,在一些实施方案中,木质纤维素材料包括从约20%至约90%(w/w)的纤维素、或其间的任何量,而在一些实施方案中,木质纤维素材料包括少于约19%、少于约18%、少于约17%、少于约16%、少于约15%、少于约14%、少于约13%、少于约12%、少于约11%、少于约10%、少于约9%、少于约8%、少于约7%、少于约6%、或少于约5%的纤维素(w/w)。而且,在一些实施方案中,木质纤维素原料包括以多于约10%的量、更通常地以多于约15%(w/w)的量的木质素。在一些实施方案中,木质纤维素原料包括少量的蔗糖、果糖和/或淀粉。
[0273] 木质纤维素原料通常首先通过包括但不限于以下的方法经受尺寸减少:研磨、碾磨、振荡、撕碎、压制/膨胀、或其他类型的机械作用。通过机械作用的尺寸减少可通过适应该目的的任何类型的设备进行,例如但不限于,锤式粉碎机、筒式粉碎机、辊式压制机、精磨机和水力碎浆机。在一些实施方案中,从尺寸减少产生的颗粒的按重量计至少90%具有少于约1/16至约4英寸(in)的长度(测量值可以是体积或重量平均长度)。在一些实施方案中,用于减少粒径减少的设备是锤式粉碎机或撕碎机。在尺寸减少后,通常将原料在水中浆化,因为这促进原料的泵送。在一些实施方案中,粒径少于约6英寸的木质纤维素原料不需要尺寸减少。任选地可通过化学、物理和生物学预处理(例如,蒸汽爆破、制浆、研磨、酸水解、溶剂暴露等等及其组合)对生物质进行预处理以提高纤维素对水解的敏感性。
[0274] 在一些实施方案中,在预处理之前将原料浆化。在一些实施方案中,原料浆料的一致性是约2%至约30%,更通常地约4%至约15%。在一些实施方案中,在预处理之前对浆料进行水和/或酸浸泡操作。在一些实施方案中,在预处理之前使用任何适合的方法将浆料脱水以减少蒸气和化学品的使用。脱水装置的实例包括但不限于加压螺旋压制机(pressurized screw press)(参见例如,WO2010/022511,通过引用并入本文)加压过滤器和挤压机。
[0275] 如本文所用,术语“预处理的木质纤维素原料”和“预处理的木质纤维素”是指已经受物理和/或化学工艺以使纤维更可及和/或更易接受纤维素分解酶作用的木质纤维素原料。如此,“预处理的木质纤维素原料”是“预处理的纤维素基质”的实例。在一些实施方案中,进行预处理以将半纤维素、和/或木质纤维素原料中存在的其部分水解为单体戊糖和己糖糖类(例如,木糖、阿拉伯糖、甘露糖、半乳糖、和/或其任何组合)。在一些实施方案中,进行预处理从而发生半纤维素的几乎完全水解和纤维素向葡萄糖的少量转化。在一些实施方案中,含水浆料中从约0.02%(w/w)至约2%(w/w)、或其间的任何量的酸浓度通常用于处理木质纤维素原料。任何适合的酸可用于这些方法,包括但不限于,盐酸、硝酸、和/或硫酸。在一些实施方案中,预处理期间使用的酸是硫酸。蒸汽爆破是进行原料的酸预处理的一种方法(参见例如,美国专利号4,461,648)。预处理原料浆料的另一种方法包括连续预处理(即,将木质纤维素原料连续地泵入反应器)。这种方法是本领域技术人员公知的(参见例如,美国专利号7,754,457)。
[0276] 在一些实施方案中,预处理中使用碱。不同于酸预处理,碱预处理可以不水解原料的半纤维素组分。而是,碱与半纤维素上存在的酸性基团反应来打开基质的表面。在一些实施方案中,碱的加入改变纤维素的晶体结构,从而使纤维素更顺从于水解。可用于预处理的碱的实例包括但不限于,氨、氢氧化铵、氢氧化钾、和氢氧化钠。碱预处理的一种方法是氨冷冻爆破法、氨纤维爆破法或氨纤维膨胀法(“AFEX”工艺;参见例如,美国专利号5,171,592;5,037,663;4,600,590;6,106,888;4,356,196;5,939,544;6,176,176;5,037,663 和
5,171,592)。在这一工艺期间,在加压容器中将木质纤维素原料与氨或氢氧化铵接触足够的时间以使氨或氢氧化铵能够改变纤维素纤维的晶体结构。然后快速地减少压力,这允许氨闪蒸或沸腾并爆炸纤维素纤维结构。在一些实施方案中,然后使用本领域已知的方法回收闪蒸的氨。在替代方法中,使用稀氨预处理。稀氨预处理方法利用比AFEX更稀的氨或氢氧化铵溶液(参见例如,WO2009/045651和US2007/0031953)。这一预处理工艺可产生或不产生任何单糖类。
[0277] 用在本发明中的另外的预处理工艺包括用有机溶剂化学处理原料,诸如在预处理系统中利用有机液体的那些方法(参见例如,美国专利号4,556,430;通过引用并入本文)。这些方法具有以下益处:低沸点液体可以容易地回收和再利用。其他预处理,诸如TMOrganosolv 工艺,也使用有机液体(参见例如,美国专利号7,465,791,其也通过引用并入本文)。使原料经受加压水也可以是适合的预处理方法(参见例如,Weil等(1997)Appl.Biochem.Biotechnol.,68(1-2):21-40,其通过引用并入本文)。
[0278] 在一些实施方案中,在预处理之后,通过多个步骤的任一个加工预处理的木质纤维素原料,所述步骤诸如水稀释、水洗、缓冲、过滤、或离心、或这些工艺的任何组合,随后酶促水解,如本领域技术人员熟悉的。预处理产生包含包括半纤维素水解产生的糖类、任选地乙酸和其他抑制剂的可溶组分、和包括未水解的原料和木质素的固体的预处理的原料组合物(例如,“预处理的原料浆料”)。在一些实施方案中,从固体分离预处理原料组合物的可溶组分以产生可溶级分。在一些实施方案中,然后将包括预处理期间释放的糖类、和其他可溶组分(例如,抑制剂)的可溶级分送去发酵。然而,在其中半纤维素没有在预处理期间被有效水解的一些实施方案中,包括一个或多个另外的步骤(例如,进一步的水解步骤和/或酶促处理步骤和/或进一步的碱和/或酸处理)以产生可发酵糖类。在一些实施方案中,通过以水溶液洗涤预处理的原料组合物来进行分离,以产生洗液流和包含未水解的、预处理的原料的固体流。
[0279] 可选地,通过使用任何适合的方法(例如,离心、微量过滤、板框压滤、交叉流过滤、加压过滤、真空过滤等)对预处理的原料组合物进行固液分离,从固体分离可溶组分。任选地,在一些实施方案中,在固液分离中掺入洗涤步骤。在一些实施方案中,然后对包含纤维素的分离的固体以纤维素酶进行酶促水解以将纤维素转化为葡萄糖。在一些实施方案中,将预处理的原料组合物供料进入发酵工艺而不分离其中包含的固体。在一些实施方案中,在发酵工艺后对未水解的固体以纤维素酶进行酶促水解以将纤维素转化为葡萄糖。对预处理的木质纤维素以纤维素酶进行酶促水解。
[0280] 预处理产生包含包括半纤维素的水解产生的糖类、任选地乙酸和其他抑制剂的可溶组分、和包括未水解的原料和木质素的固体的预处理的原料组合物(例如,预处理的原料浆料)。
[0281] 可从固体分离预处理的原料组合物的可溶组分以产生用于糖化反应中的可溶级分。
[0282] 分离可通过以水溶液洗涤预处理的原料组合物来进行,以产生洗液流、和包含未水解的、预处理的原料的固体流。可选地,通过使用方法诸如离心、微量过滤、板框压滤、交叉流过滤、加压过滤和/或真空过滤,对预处理的原料组合物进行固液分离,从固体分离可溶组分。任选地,可在固液分离中掺入洗涤步骤。然后可对包含纤维素的分离的固体以纤维素酶进行酶促水解以转化为葡萄糖。
[0283] 可对适合地制备的木质纤维素在根据本发明的一种或多种GH61蛋白或制品存在时使用一种或多种纤维素酶进行酶促水解。
[0284] 木质纤维素原料的半纤维素和纤维素组分的水解产生包含木糖和葡萄糖的木质纤维水解产物。通常存在的其他糖类包括半乳糖、甘露糖、阿拉伯糖、岩藻糖、鼠李糖、或其组合。不论水解木质纤维素原料的方式(完全酸水解、或带有或不带有随后酶促水解的化学预处理),木糖和葡萄糖通常构成存在的糖类的大部分。
[0285] 如果木质纤维水解产物是酸预处理产生的半纤维素水解产物,木糖将是主要的糖且将存在较少量的葡萄糖,因为在预处理期间通常发生中等量的纤维素水解。在这种情形中,木糖可构成木质纤维水解产物的总碳水化合物含量的约50至约90wt%。如果木质纤维水解产物是由木质纤维素原料的连续预处理和酶促水解产生的(即,预处理后无固体分离步骤),木糖可构成总碳水化合物含量的约30至约50wt%。木质纤维水解产物中存在的木糖的相对量将取决于采用的原料和预处理。
[0286] 可从固体分离水解的基质的可溶组分以产生可溶级分。然后可溶级分(包括水解期间释放的糖类,有时包括抑制剂)可用于发酵。如果在预处理期间半纤维素没有被有效水解,包括进一步的一个或多个酶水解步骤或进一步的碱或酸处理以产生可发酵糖类可以是期望的。
[0287] XIV:糖类的发酵
[0288] 利用本发明的GH61蛋白在糖化反应中产生的可发酵糖类可用于产生多种目标终产物。
[0289] 在一些实施方案中,发酵工艺中使用糖类来产生终产物。术语“发酵”宽泛地使用,是指利用简单的糖类诸如可发酵糖类作为能源来获得期望产物的微生物或微生物培养物的培养。在一个不同的实施方案中,可用本发明的组合物处理纤维素生物质来制备动物饲料。
[0290] 终产物包括醇(例如,乙醇、丁醇)、丙酮、氨基酸(例如,甘氨酸和赖氨酸)、有机酸(例如,乳酸、乙酸、甲酸、柠檬酸、草酸、3-羟基丙酸、丙烯酸、琥珀酸、苹果酸、富马酸或尿酸)、甘油、二醇类(诸如1,3丙二醇或丁二醇)、具有1-20个碳原子的烃(例如,长链酯类)、糖醇(例如,木糖醇)、脂肪醇、β-内酰胺、和其他终产物。
[0291] 任何适合的微生物可用于将糖水解产物中的糖转化为乙醇或其他发酵产物。这些包括来自酵母属、汉逊酵母属、毕赤酵母属、克鲁维酵母属和假丝酵母属的酵母。可使用商业上可获得的酵母,诸如Turbo酵母、EthanolTM
或Superstart 。
[0292] 可以遗传改造酵母以发酵己糖和戊糖二者为包括但不限于乙醇的终产物。可选地,酵母可以是已经通过一种或多种非重组方法诸如适应性进化或随机诱变和筛选使得能够发酵木糖和葡萄糖的菌株。例如,发酵可以以重组酵母属酵母进行。重组酵母可以是已经通过重组并入编码木糖还原酶(XR)和木糖醇脱氢酶(XDH)的基因(美国专利5,789,210、5,866,382、6,582,944和7,527,927、和EP450530)和/或编码一种或多种木糖异构酶(XI)的基因(美国专利6,475,768和7,622,284)使得能够发酵木糖的菌株。此外,改造的酵母菌株可过表达编码木酮糖激酶(XK)的内源或异源基因。其他酵母能够发酵己糖和戊糖为包括但不限于乙醇的至少一种终产物,诸如汉逊酵母属、毕赤酵母属、克鲁维酵母属和假丝酵母属的酵母(WO2008/130603)。
[0293] 采用酵母属物种发酵糖为乙醇的典型温度范围是约25℃至约37℃,然而如果酵母天然或被遗传修饰为耐热的,温度可以更高(达55℃)。采用酵母属物种典型发酵的pH是约3至约6,取决于发酵微生物的最佳pH。还可对糖水解产物补充发酵微生物的生长和发酵表现所需的另外的营养。例如,酵母提取物、特定氨基酸、磷酸盐、氮源、盐类、痕量元素和维生素(Verduyn等,1992,Yeast8(7):501-170, 2009,Appl BiochemBiotechnol,153:44-57,和Zhao等,2009,Journal of Biotechnology,139:55-60)。通常发酵在厌氧条件下进行,而还可使用需氧或微好氧条件。
[0294] 如此,本发明提供用于产生发酵产物的工艺,其中该工艺包括:提供本文提供的重组宿主细胞、包括可发酵糖类诸如葡萄糖和/或木糖的发酵培养基;和在适于产生发酵产物的条件下将发酵培养基与重组真菌宿主细胞接触。在一些实施方案中,该工艺还包括回收发酵产物的步骤。在一些另外的实施方案中,发酵步骤在微好氧或需氧条件下进行。在一些实施方案中,发酵步骤在厌氧条件下进行。在一些实施方案中,发酵培养基包括来自糖化过程的产物。
[0295] 本发明的GH61蛋白和纤维素酶可在用来从纤维素产生醇类或其它生物燃料的任何方法中应用,并且不必限于本文所描述的那些方法。两种常用的方法是分步糖化发酵(SHF)方法(参见,Wilke等人.,Biotechnol.Bioengin.6:155-75(1976))或同步糖化发酵(SSF)方法,例如在美国专利第3,990,944号和第3,990,945号中所公开的。
[0296] 本发明的糖化的SHF方法包括以下步骤:将GH61蛋白纤维素酶与含纤维素的基质接触以将纤维素酶促分解成可发酵糖类(例如,诸如葡萄糖的单糖类),将可发酵糖类与产醇微生物接触以产生醇(例如,乙醇或丁醇)并回收该醇。在一些实施方案中,可使用整体的生物加工(CBP)方法,其中从宿主产生纤维素酶同时伴有从一种宿主或从混合的培养的糖化和发酵。
[0297] 除SHF方法之外,可使用SSF方法。在一些情况中,SSF方法与SHF方法所提供的醇产生相比导致了较高效率的醇产生(Drissen等人,Biocatalysis and Biotransformation27:27-35(2009)。SSF相比SHF的一个缺点是SSF所需的温度高于SHF所需的温度。
[0298] 在一个实施方案中,本发明使用具有比野生型纤维素酶高的热稳定性的纤维素酶多肽。实施例
[0299] 实施例1.嗜热毁丝霉中GH61蛋白的鉴定
[0300] 获得了嗜热毁丝霉野生型真菌菌株的基因组序列。分析了完整基因组以鉴定和评价蛋白编码区。基于包括糖水解酶家族61(GH61)序列基序(Pfam结构域)的存在的因素,选择了嗜热毁丝霉菌株内源的二十四种蛋白。使用由Wellcome Trust Sanger Institute(Henrissat等,1995,Proc Natl Acad Sci USA92:7090-94)开发的软件算法“PFAM v.24”鉴定了Pfam结构域。
[0301] 表1提供GH61前蛋白的序列(SEQ ID NO:1),和预测的分泌的(成熟)形式(SEQ ID NO:2)。成熟蛋白称为“GH61a”。表2提供其他GH61前蛋白的序列,预测的天然信号肽加下划线。预测表2中的两种蛋白不具有信号肽。
[0302] 相应的多核苷酸序列编号和结构域结构分析显示在以下表3。
[0303]
[0304]
[0305] SEQ ID NO:7具 有 第 二GH61结 构 域(GH61-GH61),SEQ ID NO:1、20、21 具有结构GH61-CBM1(其中“CBM1”是碳水化合物结合模块1),SEQ ID NO:6具有结构GH61-GH61-CBM1,SEQ ID NO:4、5、8-19和22-25具有结构GH61,SEQ ID NO:3具有结构Chitin_bind_3-GH61(其中“Chitin_bind_3”是几丁质结合模块3)。SEQ ID NO:26-30是对应于分别编码SEQ ID NO:7-9、11和19的基因的可选序列。
[0306] 实施例2.GH61蛋白的重组表达
[0307] 在实施例1中鉴定的GH61蛋白中,基于预测的结构和功能方面,诸如蛋白是否被从细胞分泌、和其结构域结构,选择一些样本用于表达。
[0308] 将下表中列出的六种GH61蛋白各自克隆到表达载体中处于CHI启动子(对靶细胞是组成型的)控制下,并转化到称为“CF-405”的嗜热毁丝霉菌株中,该菌株已经被修改从而在内源纤维素酶的产生方面是缺陷的。
[0309]
[0310] 选择表达重组GH61蛋白的转化的细胞并准备种子培养物(seed culture)。培养后代细胞5天,并收集包含分泌的GH61蛋白的肉汤(“GH61肉汤”)。
[0311] 实施例3.GH61蛋白的纤维素酶增强活性
[0312] 收集表达包含SEQ ID NO:2的重组GH61蛋白的细胞的肉汤(实施例2),通过SDS-PAGE定量重组GH61的水平。进行纤维素酶测定来确定添加GH61蛋白是否增强纤维素材料被纤维素酶的水解。
[0313] 培养物肉汤从称为“CF-402”的过表达β-葡糖苷酶的嗜热毁丝霉菌株的培养物收集。纤维素消化测定使用添加或不添加GH61的肉汤进行。反应在Costar96深孔板中进行,总反应体积为约80微升。反应在55℃使用已经在酸性条件下被预处理的麦秆制品(以下称为“预处理的麦秆”)作为含纤维素的基质运行。向每种样品加入每克基质8.1mg肉汤蛋白(0.81%)。此外,向样品加入0(对照)、0.22%、0.44%或0.66%GH61肉汤蛋白(最终总肉汤蛋白浓度0.81%、1.03%、1.25%或1.47%)。在未加入GH61肉汤的对照孔中,使用水来调整体积,从而所有孔中的基质装载量相等。在其他实验中,向每种样品加入每克基质6-10mg肉汤蛋白(0.6-1%),至最终总肉汤蛋白浓度为0.6-1.7%。
[0314] 图1显示在培养48小时后超出对照(未加入GH61的肉汤)的额外的葡萄糖产量。在图1(A)中,显示比对照改进的产量的百分比。在图1(B)中,将数据绘图来显示总的葡萄糖产量。
[0315] 实施例4.GH61a在CXP菌株中的过表达
[0316] 重组GH61a基因的构建
[0317] 基因组DNA从称为“CF-409”的嗜热毁丝霉菌株分离。这一菌株内源地产生内切葡聚糖酶、β-葡糖苷酶、1型纤维二糖水解酶和2型纤维二糖水解酶。程序如下。将菌丝接种物接种到生长培养基中并允许在35℃生长72小时。通过离心收集菌丝丛,洗涤,加入50μL DNA提取缓冲液(200M Tris pH8.0;250mM NaCl;125mM EDTA;0.5%SDS)。用锥形研磨器研磨菌丝体,用250μL提取缓冲液再次提取,并离心悬液。将上清液转移到包含300μL异丙醇的新试管中。离心收集DNA,用70%乙醇洗涤两次,并再次溶于100μL去离子水中。
[0318] 使用引物PchiC1GH61a_F和TcbhC1GH61a_R从CF-409细胞扩增GH61a DNA序列。PCR反应通过使用Phusion聚合酶,在98℃持续30”、随后是98℃持续10”、72℃持续1’的
35个循环、最后在72℃延伸5’来进行。使用In-fusion克隆技术(带有克隆增强子的TM
In-Fusion Advantage PCR克隆试剂盒,Clontech目录号639617,按照制造商的说明书)将所得的产物克隆到pC1DX20PhR载体中chi1启动子的3’以产生在chi1启动子控制下表达GH61a蛋白转录物的表达载体(pC1DX20PhR-GH61a)。
[0319] PchiC1GH61a_F tacttcttctccaccATGTCCAAGGCCTCTGCTCT SEQ ID NO:69
[0320] TcbhC1GH61a_R ggatccgaattcttaTTACAAACACTGGGAGTACCA SEQ ID NO:70[0321] 为了转化CXP准备原生质体
[0322] 使用106个孢子/mL将嗜热毁丝霉细胞(“CF-405”,Alp1缺失的菌株)接种到500mL Erlenmeyer烧瓶中的100mL生长培养基。在35℃、250rpm培养培养物24小时。为了TM
收获菌丝体,将培养物经无菌Myracloth 滤器(Calbiochem)过滤,并用100mL1700mosmol NaCl/CaCl2溶液(0.6M NaCl、0.27M CaCl2·H2O)洗涤。将洗涤过的菌丝体转移到50mL试管并称重。将Caylase(20mg/克菌丝体)溶于1700mosmol NaCl/CaCl2中并紫外灭菌90秒。将3ml无菌Caylase溶液加入包含洗涤过的菌丝体的试管并混合。将另外15mL的
1700mosmol NaCl/CaCl2溶液加入试管并混合。
[0323] 在30℃、70rpm培养菌丝体/Caylase悬液2小时。通过经无菌Myracloth滤器过滤到无菌50mL试管中来收获原生质体。将25mL冷的STC加入该流穿物(flowthrough)中,并以4℃在2720rpm离心10min。将小团(pellet)重悬于50mL STC(1.2M山梨糖醇、50mM CaCl2·H2O、35mM NaCl、10mM Tris-HCl)中并再次离心。在洗涤步骤后,将小团重悬于1mL STC中。
[0324] 转化
[0325] 向15mL无菌试管的底部移入2μg质粒DNA并加入1μL金精三羧酸和100μL原生质体。混合内含物,在室温孵育原生质体和DNA25min。加入1.7mL PEG4000溶液(60%PEG4000[聚乙二醇,平均分子量4000道尔顿]、50mM CaCl2·H2O、35mM NaCl、10mM Tris-HCl)并彻底混合。将溶液在室温保持20min。向试管填充STC,混合并在4℃以2500rpm离心10min。倒出STC并将小团重悬于其余的STC中,并铺板在基本培养基的平板上。在35℃培养平板5天。将菌落再次平板划线,并检查整合的质粒的存在。选择数个分离株并试验其GH61a表达。
[0326] 转化在CF405菌株中进行。用SDS-PAGE试验GH61a转化体的GH61a过表达,试验额外的条带的存在,用MS-MS分析证实。
[0327] 实施例5.从纤维素酶上清液纯化GH61蛋白
[0328] 在这一实验中,从称为“CF-401”的嗜热毁丝霉菌株的培养上清液分级GH61蛋白活性。CF-401是CDXF的具有CDH1和CDH2基因缺失的衍生物。这一菌株内源地产生内切葡聚糖酶、β-葡糖苷酶、1型纤维二糖水解酶和2型纤维二糖水解酶。
[0329] 为了准备色谱,通过以12,000rpm离心35分钟来澄清CF-401全纤维素酶上清液。TM
将上清液进一步经0.22μm PES 膜过滤,然后将其浓缩并缓冲液交换到25mM bis-tris缓冲液,pH5.7中。加入25mM bis-tris中的饱和硫酸铵至终浓度为0.9M硫酸铵和20-25mM bis-tris中~50g/L蛋白。将这一溶液立即上样到苯基(High Sub)FF柱(装备有
TM
Phenyl-Sepharose 的快流速柱)上并用25mM bis-tris中的0.9M硫酸铵漂洗,直到A280降低至接近基线。以25mM bis-tris中的0.9M硫酸铵至25mM bis-tris中的0M硫酸铵的梯度洗脱蛋白,经约10倍的柱体积。根据色谱峰(A280)收集各级分(在这种情形中是25种)。
为了抑制污染物生长,向所有级分加入NaN3至终浓度为0.05%。在SDS-PAGE凝胶上运行每种级分后,合并相似的级分以产生具有最小组的组分(minimal set of components)的池。
TM
这里,从产生的25种级分,获得11个池。为了准备下一个柱,使用装备有5kDa MWCO PES膜的切向流过滤元件(tangential flow filtration unit)将每个池浓缩至~150mL。然后用去离子水使蛋白溶液的体积达到500mL,并再次浓缩为~150mL;重复这一步骤5次,对溶液进行有效地缓冲液交换。
[0330] 将11种CF-401来源的池的每一个进一步以Q柱(季铵离子交换树脂)分级。使用BCA(二辛可宁酸)测定定量总蛋白后,为每个池准备10mM bis-tris pH7.5缓冲液中的50g/L蛋白溶液。施加至柱之后,用10mM bis-tris,pH7.5洗涤树脂直到A280降低至接近基线。然后使用逐步梯度(5%经过10分钟)用10mM Bis-Tris,pH7.5中的1M NaCl洗脱结合的蛋白,并保持在该浓度,直到蛋白峰开始不断地下降。为了分析,运行每种级分的SDS-PAGE凝胶,并汇集具有类似组成的级分。然后将这些第二阶段池的每一个脱盐/用切向流过滤来浓缩。
[0331] 总之,以这种方式制备CF-401来源的酶的79个池。为了帮助在糖化测定中装载,使用BCA蛋白测定测量每个池的总蛋白的每一种。
[0332] 实施例6.使用GH61蛋白来促进糖化
[0333] 在获自称为“CF-404”的细胞菌株的全纤维素酶系统存在时,在糖化中试验按照前一实施例分级的GH61酶。这些细胞衍生自CF-401菌株并过表达β-葡糖苷酶。作为对照实验,将0.21%(通常0.1-0.4%)的CF-404加至0.61%(通常0.6-1.5%)的CF-401。如此,所有反应的总蛋白装载量相等。然后在55℃、pH4.6-5将这些混合物与110g/L葡聚糖(预处理的麦秆)孵育53h。实验完成后,通过加入10mM硫酸来猝灭反应。对于葡萄糖分析,使用装备有HPX-87H离子排阻柱(300mM x7.8mM)的Agilent HPLC1200以5mM H2SO4作为流动相以0.6mL/min的流速在65℃分析样品。葡萄糖的保留时间是9.1分钟。
[0334] 证明改进的葡萄糖产量的一个实例显示在表5。
[0335]
[0336] 部分蛋白序列获自质谱,并通过使用由Bioinformatics Organization,Hudson MA可获得的BIFX比对软件与嗜热毁丝霉基因组序列中鉴定的蛋白编码序列(实施例1)比较。与已知嗜热毁丝霉序列的一致性显示在上表中。
[0337] 实施例7.转化纤维素为葡萄糖的最小蛋白组合
[0338] 将嗜热毁丝霉的酶CBH1和CBH2与GH61蛋白:GH61a、GH61f和GH61p的不同组合混合,并在不同相对浓度测定转化葡聚糖为葡萄糖的能力。还测定来自菌株CF-401的培养上清液(其包括纤维素酶和GH61蛋白二者)用于比较。对于110g/L葡聚糖,可能的最大葡萄糖产量是大约135至145g/L。
[0339] 糖化反应以110g/L葡聚糖装载量的预处理的麦秆在pH5.0、55℃的温度、950rpm、在高通量(HTP)96深孔板中95μL的总体积中进行。将81g/L木糖和128mM乙酸盐加至预处理的麦秆。还补充过量(相对于葡聚糖)β-葡糖苷酶以缓解来自纤维二糖的产物抑制。通过标准BCA测定定量总蛋白来表征全纤维素酶(来自CP-401细胞的肉汤)、以及单独的酶。通过加入已知的总蛋白来进行酶混合物的剂量响应(计算为加入的蛋白重量/葡聚糖重量)。试验的总蛋白水平是0.73、1和3%(加入的蛋白重量/葡聚糖重量)。在pH5.0和
55℃测量剂量响应72小时。使用酶的以下组合(联合BGL1):
[0340] a.CF-401培养上清液(对照;包含所有4种酶+GH61蛋白)
[0341] b.50%(CBH1a+CBH2b)+50%GH61f
[0342] c.50%(CBH1a+CBH2b)+50%GH61p
[0343] d.50%(CBH1a+CBH2b)+25%GH61f+25%GH61p
[0344] e.50%(CBH1a+CBH2b)+16.6%GH61a+16.6%GH61f+16.6%GH61p
[0345] 通过在72小时加入10mM硫酸来猝灭反应。对于葡萄糖分析,使用装备有HPX-87H离子排阻柱(300mM x7.8mM)的Agilent HPLC1200以5mM H2SO4作为流动相以0.6mL/min流速在65℃分析样品。葡萄糖的保留时间是9.1分钟。
[0346] 图2显示结果。将纤维素酶CBH1和CHB2与不同GH61蛋白组合。对照实验(虚线)是来自包含多种纤维素酶和内源GH61活性的CF-401细胞的培养上清液。总蛋白装载量以图上指定的比例加入。
[0347] 这些结果证实,最小的酶组合能够实现与对照相似的葡萄糖水平:具体地,纤维素酶CBH1和CBH2、与GH61f、GH61p和GH61a的一种或多种组合。所有组合产生比CP-401培养物肉汤高的葡萄糖产量。因此,使用最小组的酶实现最大的理论转化是可能的。这还证实,本文使用的最小酶混合物具有完全转化纤维素为葡萄糖所需的所有组分。然而,预期另外的酶组合可用于糖化工艺中。
[0348] 实施例8.GH61活性与其他CXP衍生酶的协同
[0349] 本实施例描述对GH61a与其他嗜热毁丝霉衍生酶如CBH1a、CBH2b和EG2的协同的评价。
[0350] 糖化反应以110g/L葡聚糖装载量的预处理的麦秆在pH5.0、55℃的温度、950rpm、在高通量(HTP)96深孔板中95μL的总体积中进行。将81g/L木糖和128mM乙酸盐加至预处理的麦秆。还补充过量β-葡糖苷酶(重量/葡聚糖重量)以缓解来自纤维二糖的产物抑制。通过标准BCA测定定量总蛋白来表征全纤维素酶以及单独的酶。
[0351]
[0352] 对于包含两种酶A和B的酶系统,通过下式计算协同程度:
[0353]
[0354] 表中所示的葡萄糖产量是获自GH61和酶的组合的产量。将这除以分别对GH61和酶混合物(未示出)测量的葡萄糖产量以定量两者之间的协同。
[0355] 结果显示,GH61a与试验的所有嗜热毁丝霉衍生酶系统是协同的。对于完全转化纤维素为葡萄糖,GH61a的存在是有益的。
[0356] 实施例9.使用GH61a来减少预处理的麦秆的粘度
[0357] 评价来自嗜热毁丝霉的纯化的GH61a以确定酶功能并评价用于减少纤维素链长度、从而实现粘度减少的任何内切葡聚糖酶类型活性。
[0358] 在葡聚糖装载量为75g/L葡聚糖和在pH5.0、50℃试验了单独和与EG2联合的GH61a的预处理的麦秆的粘度减少。粘度减少试验以(在80RPM运行30分钟)在RVA-super4粘度计(Newport Scientific,Australia)中进行,总重量为21g。
[0359] 图3显示结果。添加相对于葡聚糖0.02%的GH61a在pH5、50℃表现出大约2-3%粘度减少。相比之下,添加相对于葡聚糖0.01%的嗜热毁丝霉EG2在相同条件下表现出大约19%粘度减少。以0.02%GH61a和0.01%EG2的组合,总粘度减少大约21%。
[0360] 序列
[0361] 示例性纤维素酶序列
[0362] C1 BGLl前体:SEQ ID NO:60
[0363] MKAAALSCLFGSTLAVAGAIESRKVHQKPLARSEPFYPSPWMNPNADGWAEAYAQAKSFVSQMTLLEKVNLTTGVGWGAEQCVGQVGAIPRLGLRSLCMHDSPLGIRGADYNSAFPSGQTVAATWDRGLMYRRGYAMGQEAKGKGINVLLGPVAGPLGRMPEGGRNWEGFAPDPVLTGIGMSETIKGIQDAGVIACAKHFIGNEQEHFRQVPEAQGYGYNISETLSSNIDDKTMHELYLWPFADAVRAGVGSVMCSYQQVNNSYACQNSKLLNDLLKNELGFQGFVMSDWQAQHTGAASAVAGLDMSMPGDTQFNTGVSFWGANLTLAVLNGTVPAYRLDDMAMRIMAALFKVTKTTDLEPINFSFWTDDTYGPIHWAAKQGYQEINSHVDVRADHGNLIREIAAKGTVLLKNTGSLPLNKPKFVAVIGEDAGSSPNGPNGCSDRGCNEGTLAMGWGSGTANYPYLVSPDAALQARAIQDGTRYESVLSNYAEEKTKALVSQANATAIVFVNADSGEGYINVDGNEGDRKNLTLWNNGDTLVKNVSSWCSNTIVVIHSVGPVLLTDWYDNPNITAILWAGLPGQESGNSITDVLYGKVNPAARSPFTWGKTRESYGADVLYKPNNGNGAPQQDFTEGVFIDYRYFDKVDDDSVIYEFGHGLSYTTFEYSNIRVVKSNVSEYRPTTGTTAQAPTFGNFSTDLEDYLFPKDEFPYIYQYIYPYLNTTDPRRASADPHYGCTAEEFLPPHATDDDPQPLLRSSGGNSPGGNRQLYDIVYTITADITNTGSVVGEEVPQLYVSLGGPEDPKVQLRDFDRMRIEPGETRQFTGRLTRRDLSNWDVTVQDWVISRYPKTAYVGRSSRKLDLKIELP
[0364] TaBGL前体(金黄色嗜热子囊菌):SEQ ID NO:61
[0365] MRLGWLELAVAAAATVASAKDDLAYSPPFYPSPWMDGNGEWAEAYRRAVDFVSQLTLAEKVNLTTGVGWMQEKCVGETGSIPRLGFRGLCLQDSPLGVRFADYVSAFPAGVNVAATWDKNLAYLRGKAMGEEHRGKGVDVQLGPVAGPLGRHPDGGRNWEGFSPDPVLTGVLMAETIKGIQDAGVIACAKHFIGNEMEHFRQASEAVGYGFDITESVSSNIDDKTLHELYLWPFADAVRAGVGSFMCSYNQVNNSYSCSNSYLLNKLLKSELDFQGFVMSDWGAHHSGVGAALAGLDMSMPGDTAFGTGKSFWGTNLTIAVLNGTVPEWRVDDMAVRIMAAFYKVGRDRYQVPVNFDSWTKDEYGYEHALVGQNYVKVNDKVDVRADHADIIRQIGSASVVLLKNDGGLPLTGYEKFTGVFGEDAGSNRWGADGCSDRGCDNGTLAMGWGSGTADFPYLVTPEQAIQNEILSKGKGLVSAVTDNGALDQMEQVASQASVSIVFVNADSGEGYINVDGNEGDRKNLTLWKGGEEVIKTVAANCNNTIVVMHTVGPVLIDEWYDNPNVTAIVWAGLPGQESGNSLVDVLYGRVSPGGKTPFTWGKTRESYGAPLLTKPNNGKGAPQDDFTEGVFIDYRRFDKYNETPIYEFGFGLSYTTFEYSDIYVQPLNARPYTPASGSTKAAPTFGNISTDYADYLYPEDIHKVPLYIYPWLNTTDPKKSSGDPDYGMKAEDYIPSGATDGSPQPILPAGGAPGGNPGLYDEMYRVSAIITNTGNVVGDEVPQLYVSLGGPDDPKVVLRNFDRITLHPGQQTMWTTTLTRRDISNWDPASQNWVVTKYPKTVYIGSSSRKLHLQAPLPPY
[0366] CelA BGL前体(伊拉克固氮螺菌):SEQ ID NO:62
[0367] MGALRLLGSISIVALTCGGIHASTAIAQEGAAPAAILHPEKWPRPATQRLIDPAVEKRVDALLKQLSVEEKVGQVIQGDIGTITPEDLRKYPLGSILAGGNSGPNGDDRAPPKEWLDLADAFYRVSLEKRPGHTPIPVLFGIDAVHGHGNIGSATIFPHNIALGATHDPELLRRIGEVTAVEMAATGIDWTFAPALSVVRDDRWGRTYEGFSEDPEIVAAYSAAIVEGVQGKFGSKDFMAPGRIVASAKHFLADGGTDQGRDQGDARISEDELIRIHNAGYPPAIDAGVLTVMASFSSWQGIKHHGHKQLLTDVLKGQMGFNGFIVGDWNAHDQVPGCTKFNCPTSLIAGLDMYMAADSWKQLYENTLAQVKDGTIPMARLDDAVRRILRVKVLAGLFEKPAPKDRPGLPGLETLGSPEHRAVGREAVRKSLVLLKNDKGTLPLSPKARVLVAGDGADNIGKQSGGWTISWQGTGNRNDEFPGATSILGGIRDAVADAGGSVEFDVAGQYKTKPDVAIVVFGEEPYAEFQGDVETLEYQPDQKQDLALLKKLKDQGIPVVAVFLSGRPMWVNPELNASDAFVAAWLPGTEGGGVADVLFTDKAGKVQHDFAGKLSYSWPRTAAQTTVNRGDADYNPLFAYGYGLTYKDKSKVGTLPEESGVPAEARQNAGIYFRAGALRLPGRFL[0368] C1 CBHla:SEQ ID NO:63
[0369] QNACTLTAENHPSLTWSKCTSGGSCTSVQGSITIDANWRWTHRTDSATNCYEGNKWDTSYCSDGPSCASKCCIDGADYSSTYGITTSGNSLNLKFVTKGQYSTNIGSRTYLMESDTKYQMFQLLGNEFTFDVDVSNLGCGLNGALYFVSMDADGGMSKYSGNKAGAKYGTGYCDSQCPRDLKFINGEANVENWQSSTNDANAGTGKYGSCCSEMDVWEANNMAAAFTPHPCTVIGQSRCEGDSCGGTYSTDRYAGICDPDGCDFNSYRQGNKTFYGKGMTVDTTKKITVVTQFLKNSAGELSEIKRFYVQNGKVIPNSESTIPGVEGNSITQDWCDRQKAAFGDVTDFQDKGGMVQMGKALAGPMVLVMSIWDDHAVNMLWLDSTWPIDGAGKPGAERGACPTTSGVPAEVEAEAPNSNVIFSNIRFGPIGSTVSGLPDGGSGNPNPPVSSSTPVPSSSTTSSGSSGPTGGTGVAKHYEQCGGIGFTGPTQCESPYTCTKLNDWYSQCL
[0370] C1 CBH2a前体:SEQ ID NO:64
[0371] MKFVQSATLAFAATALAAPSRTTPQKPRQASAGCASAVTLDASTNVFQQYTLHPNNFYRAEVEAAAEAISDSALAEKARKVADVGTFLWLDTIENIGRLEPALEDVPCENIVGLVIYDLPGRDCAAKASNGELKVGELDRYKTEYIDKIAEILKAHSNTAFALVIEPDSLPNLVTNSDLQTCQQSASGYREGVAYALKQLNLPNVVMYIDAGHGGWLGWDANLKPGAQELASVYKSAGSPSQVRGISTNVAGWNAWDQEPGEFSDASDAQYNKCQNEKIYINTFGAELKSAGMPNHAIIDTGRNGVTGLRDEWGDWCNVNGAGFGVRPTANTGDELADAFVWVKPGGESDGTSDSSAARYDSFCGKPDAFKPSPEAGTWNQAYFEMLLKNANPSF
[0372] 嗜热毁丝霉内切葡聚糖酶2(EG2):SEQ ID NO:65
[0373] QSGPWQQCGGIGWQGSTDCVSGYHCVYQNDWYSQCVPGAASTTLQTSTTSRPTATSTAPPSSTTSPSKGKLKWLGSNESGAEFGEGNYPGLWGKHFIFPSTSAIQTLINDGYNIFRIDFSMERLVPNQLTSSFDEGYLRNLTEVVNFVTNAGKYAVLDPHNYGRYYGNVITDTNAFRTPWTNLAKQFASNSLVIFDTNNEYNTMDQTLVLNLNQAAIDGIRAAGATSQYIFVEGNAWSGAWSWNTTNTNMAALTDPQNKIVYEMHQYLDSDSSGTHAECVSSNIGAQRVVGATQWLRANGKLGVLGEFAGGANAVCQQAVTGLLDHLQDNSDVWLGALWWAAGPWWGDYMYSFEPPSGTGYVNYNSILKKYLP[0374] 嗜热毁丝霉β-葡糖苷酶(BG):SEQ ID NO:66
[0375] IESRKVHQKPLARSEPFYPSPWMNPNADGWAEAYAQAKSFVSQMTLLEKVNLTTGVGWGAEQCVGQVGAIPRLGLRSLCMHDSPLGIRGADYNSAFPSGQTVAATWDRGLMYRRGYAMGQEAKGKGINVLLGPVAGPLGRMPEGGRNWEGFAPDPVLTGIGMSETIKGIQDAGVIACAKHFIGNEQEHFRQVPEAQGYGYNISETLSSNIDDKTMHELYLWPFADAVRAGVGSVMCSYQQVNNSYACQNSKLLNDLLKNELGFQGFVMSDWQAQHTGAASAVAGLDMSMPGDTQFNTGVSFWGANLTLAVLNGTVPAYRLDDMAMRIMAALFKVTKTTDLEPINFSFWTDDTYGPIHWAAKQGYQEINSHVDVRADHGNLIREIAAKGTVLLKNTGSLPLNKPKFVAVIGEDAGSSPNGPNGCSDRGCNEGTLAMGWGSGTANYPYLVSPDAALQARAIQDGTRYESVLSNYAEEKTKALVSQANATAIVFVNADSGEGYINVDGNEGDRKNLTLWNNGDTLVKNVSSWCSNTIVVIHSVGPVLLTDWYDNPNITAILWAGLPGQESGNSITDVLYGKVNPAARSPFTWGKTRESYGADVLYKPNNGNGAPQQDFTEGVFIDYRYFDKVDDDSVIYEFGHGLSYTTFEYSNIRVVKSNVSEYRPTTGTTAQAPTFGNFSTDLEDYLFPKDEFPYIYQYIYPYLNTTDPRRASADPHYGQTAEEFLPPHATDDDPQPLLRSSGGNSPGGNRQLYDIVYTITADITNTGSVVGEEVPQLYVSLGGPEDPKVQLRDFDRMRIEPGETRQFTGRLTRRDLSNWDVTVQDWVISRYPKTAYVGRSSRKLDLKIELP
[0376] 1a型嗜热毁丝霉纤维二糖水解酶(Cbhla):SEQ ID NO:67
[0377] QNACTLTAENHPSLTWSKCTSGGSCTSVQGSITIDANWRWTHRTDSATNCYEGNKWDTSYCSDGPSCASKCCIDGADYSSTYGITTSGNSLNLKFVTKGQYSTNIGSRTYLMESDTKYQMFQLLGNEFTFDVDVSNLGCGLNGALYFVSMDADGGMSKYSGNKAGAKYGTGYCDSQCPRDLKFINGEANVENWQSSTNDANAGTGKYGSCCSEMDVWEANNMAAAFTPHPCTVIGQSRCEGDSCGGTYSTDRYAGICDPDGCDFNSYRQGNKTFYGKGMTVDTTKKITVVTQFLKNSAGELSEIKRFYVQNGKVIPNSESTIPGVEGNSITQDWCDRQKAAFGDVTDFQDKGGMVQMGKALAGPMVLVMSIWDDHAVNMLWLDSTWPIDGAGKPGAERGACPTTSGVPAEVEAEAPNSNVIFSNIRFGPIGSTVSGLPDGGSGNPNPPVSSSTPVPSSSTTSSGSSGPTGGTGVAKHYEQCGGIGFTGPTQCESPYTCTKLNDWYSQCL
[0378] 2b型嗜热毁丝霉纤维二糖水解酶(CBH2b):SEQ ID NO:68
[0379] APVIEERQNCGAVWTQCGGNGWQGPTCCASGSTCVAQNEWYSQCLPNSQVTSSTTPSSTSTSQRSTSTSSSTTRSGSSSSSSTTPPPVSSPVTSIPGGATSTASYSGNPFSGVRLFANDYYRSEVHNLAIPSMTGTLAAKASAVAEVPSFQWLDRNVTIDTLMVQTLSQVRALNKAGANPPYAAQLVVYDLPDRDCAAAASNGEFSIANGGAANYRSYIDAIRKHIIEYSDIRIILVIEPDSMANMVTNMNVAKCSNAASTYHELTVYALKQLNLPNVAMYLDAGHAGWLGWPANIQPAAELFAGIYNDAGKPAAVRGLATNVANYNAWSIASAPSYTSPNPNYDEKHYIEAFSPLLNSAGFPARFIVDTGRNGKQPTGQQQWGDWCNVKGTGFGVRPTANTGHELVDAFVWVKPGGESDGTSDTSAARYDYHCGLSDALQPAPEAGQWFQAYFEQLLTNANPPF
[0380] GH61a编码序列
[0381] SEQ ID NO:3 1
[0382] atgtccaagg cctctgctct cctcgctggc ctgacgggcg cggccctcgt cgctgcacat 60[0383] ggccacgtca gccacatcgt cgtcaacggc gtctactaca ggaactacga ccccacgaca 120[0384] gactggtacc agcccaaccc gccaacagtc atcggctgga cggcagccga tcaggataat 180[0385] ggcttcgttg aacccaacag ctttggcacg ccagatatca tctgccacaa gagcgccacc 240[0386] cccggcggcg gccacgctac cgttgctgcc ggagacaaga tcaacatcgt ctggaccccc 300[0387] gagtggcccg aatcccacat cggccccgtc attgactacc tagccgcctg caacggtgac 360[0388] tgcgagaccg tcgacaagtc gtcgctgcgc tggttcaaga ttgacggcgc cggctacgac 420[0389] aaggccgccg gccgctgggc cgccgacgct ctgcgcgcca acggcaacag ctggctcgtc 480[0390] cagatcccgt cggatctcaa ggccggcaac tacgtcctcc gccacgagat catcgccctc 540[0391] cacggtgctc agagccccaa cggcgcccag gcctacccgc agtgcatcaa cctccgcgtc 600[0392] accggcggcg gcagcaacct gcccagcggc gtcgccggca cctcgctgta caaggcgacc bbU[0393] gacccgggca tcctcttcaa cccctacgtc tcctccccgg attacaccgt ccccggcccg 720[0394] gccctcattg ccggcgccgc cagctcgatc gcccagagca cgtcggtcgc cactgccacc 780[0395] ggcacggcca ccgttcccgg cggcggcggc gccaacccta ccgccaccac caccgccgcc 840[0396] acctccgccg ccccgagcac caccctgagg acgaccacta cctcggccgc gcagactacc 900[0397] gccccgccct ccggcgatgt gcagaccaag tacggccagt gtggtggcaa cggatggacg 960[0398] ggcccgacgg tgtgcgcccc cggctcgagc tgctccgtcc tcaacgagtg gtactcccag 1020[0399] tgtttgtaa 1029
[0400] SEQ ID NO:32至59出现在本公开文件的正式序列表中。
[0401] * * * * *
[0402] 本发明的GH61蛋白的使用不意为以任何方式被理论和其作用方式限制。理论上,产物的产量可通过GH61蛋白对基质的作用,通过GH61蛋白与混合物中任何一种或多种纤维素酶直接相互作用,通过降低反应混合物的粘度,或通过任何其他机制来增加。本发明可以使用本公开文件描述的测定方法以经验方式跟踪GH61活性来实践,而无需知晓被使用的GH61蛋白的操作机理。
[0403] 尽管已参考具体实施方案对本发明进行了描述,但可以做出各种改变并且可以替换等同物以适应具体情况、材料、物质组成、工艺、一个或多个工艺步骤,从而实现本发明的益处而不背离请求保护的范围。
[0404] 为了在美国的所有目的,本文引用的每个和每篇出版物和专利文件均通过引用并入本文,如同每篇此类出版物或文件被具体地和单独地指出通过引用并入本文。出版物和专利文件的引用并非旨在指示任何此类文件是相关现有技术,并且其不构成对任何此类文件的内容或日期的任何承认。