用于生物合成罗汉果苷化合物的方法和材料转让专利

申请号 : CN201580062037.X

文献号 : CN107466320B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 延斯·霍顿-拉森卡塔尔济纳·克日什塔内克安格利卡·塞姆莱尔艾弗·克拉夫斯·里谢德·汉森索伦·达姆基埃尔加里·刘刘耀权约恩·汉森萨西什·库马尔穆特斯瓦米·潘沙佩奇萨·穆拉利尼纳·尼科利纳·拉斯穆森

申请人 : 埃沃尔瓦公司

摘要 :

本发明提供了用于重组和酶促产生罗汉果苷化合物和含有罗汉果苷化合物之组合物的方法。

权利要求 :

1.能够在细胞培养物中产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的重组宿主细胞,其包含:

(a)编码能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯之多肽的基因,其中所述能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯的多肽由SEQ ID NO:54所示的氨基酸序列构成;

(b)编码能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成24,25环氧葫芦二烯醇之多肽的基因,其中所述能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成

24,25环氧葫芦二烯醇的多肽由SEQ ID NO:43所示的氨基酸序列构成;

(c)编码能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇之多肽的基因,其中所述能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇的多肽由SEQ ID NO:74所示的氨基酸序列构成;

(d)编码能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇之多肽的基因,其中所述能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇的多肽由SEQ ID NO:44所示的氨基酸序列构成;

(e)编码能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇之多肽的基因,其中所述能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽由SEQ ID NO:74所示的氨基酸序列构成;

(f)编码能够还原细胞色素P450复合物之多肽的基因,其中所述能够还原细胞色素P450复合物的多肽由SEQ ID NO:46所示的氨基酸序列构成;以及(g)编码能够从11‑羟基‑24,25环氧葫芦二烯醇合成所述罗汉果苷前体之多肽的基因,其中所述能够从11‑羟基‑24,25环氧葫芦二烯醇合成所述罗汉果苷前体的多肽由SEQ ID NO:38或40所示的氨基酸序列构成;

所述重组宿主细胞还包含以下的一种或更多种:(h)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处将其糖基化的多肽由SEQ ID NO:62或68或22所示的氨基酸序列构成;

(i)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C24羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C24羟基处将其糖基化的多肽由SEQ ID NO:21、23、24、25、22、48或68中任一个所示的氨基酸序列构成;

(j)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化的多肽由SEQ ID NO:22或68所示的氨基酸序列构成;

(k)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C11羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C11羟基处将其糖基化的多肽由SEQ ID NO:24所示的氨基酸序列构成;

(l)编码能够使所述罗汉果苷前体和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化之多肽的基因,其中所述能够使所述罗汉果苷前体和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化的多肽由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成;和/或

(m)编码能够使所述罗汉果苷前体和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑1,2糖基化和/或C6’位β‑1,6糖基化之多肽的基因,其中所述能够使所述罗汉果苷前体和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑1,2糖基化和/或C6’位β‑1,6糖基化的多肽由SEQ ID NO:53或72所示的氨基酸序列构成;

其中至少一种所述基因是重组基因。

2.权利要求1所述的重组宿主细胞,其包含基因(a)‑(g)和(h)‑(m)。

3.权利要求1或2中任一项所述的重组宿主细胞,其中所述重组宿主细胞已被修饰成减少羊毛甾醇合酶(ERG7)多肽的表达。

4.权利要求3所述的重组宿主细胞,其中所述ERG7多肽由SEQ ID NO:55所示的氨基酸序列构成。

5.权利要求1或2中任一项所述的重组宿主细胞,其中一种或更多种所述基因还包含编码融合标签的核苷酸序列。

6.权利要求5所述的重组宿主细胞,其中所述融合标签是蛋白质或多肽。

7.权利要求6所述的重组宿主细胞,其中所述融合标签是绿色荧光蛋白(GFP)、人流感血凝素(HA)、谷胱甘肽S转移酶(GST)、多组氨酸标签(HIS标签)、和FLAG标签、叶绿体转运肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。

8.权利要求1或2中任一项所述的重组宿主细胞,其中一种或更多种所述基因表达为融合蛋白。

9.权利要求1或2中任一项所述的重组宿主细胞,其中所述罗汉果醇前体是角鲨烯、氧化角鲨烯、环氧角鲨烯、葫芦二烯醇、24,25环氧葫芦二烯醇、11‑羟基‑葫芦二烯醇、11‑羟基

24,25环氧葫芦二烯醇或11‑氧代‑罗汉果醇。

10.权利要求1或2中任一项所述的重组宿主细胞,其中所述罗汉果苷前体是罗汉果醇、或者糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇。

11.权利要求10所述的重组宿主细胞,其中所述四糖基化罗汉果醇是罗汉果苷IV或赛门苷I。

12.权利要求1或2中任一项所述的重组宿主细胞,其中所述罗汉果苷化合物是糖基化罗汉果苷化合物、二糖基化罗汉果苷化合物、三糖基化罗汉果苷化合物、四糖基化罗汉果苷化合物或五糖基化罗汉果苷化合物。

13.权利要求12所述的重组宿主细胞,其中:(a)所述糖基化罗汉果苷化合物是罗汉果苷IA1或罗汉果苷IE1;

(b)所述二糖基化罗汉果苷化合物是罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2或罗汉果苷II E;

(c)所述三糖基化罗汉果苷化合物是罗汉果苷IIIA1、罗汉果苷III A2、罗汉果苷III或罗汉果苷III E;

(d)所述四糖基化罗汉果苷化合物是罗汉果苷IV、罗汉果苷IV A或赛门苷;以及(e)所述五糖基化罗汉果苷化合物是罗汉果苷V。

14.权利要求1或2中任一项所述的重组宿主细胞,其中所述重组宿主细胞包含植物细胞、真菌细胞、藻类细胞或细菌细胞。

15.在细胞培养物中产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的方法,其包括在表达基因的条件下,在细胞培养物中培养权利要求1至14中任一项所述的重组宿主细胞;其中所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物由所述重组宿主细胞产生。

16.权利要求15所述的方法,其中所述重组宿主细胞在一定温度下在发酵罐中培养一段时间,其中所述温度和时间促进所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的产生。

17.权利要求15或16中任一项所述的方法,其还包括从所述细胞培养物分离所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物。

18.权利要求17所述的方法,其中所述分离步骤包括将所述细胞培养物的液相与所述细胞培养物的固相分离以获得包含所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的上清液;以及:

(a)将所述上清液与一种或更多种吸附树脂接触以获得至少一部分所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;或者(b)将所述上清液与所述一种或更多种离子交换或反向色谱柱相接触以获得至少一部分所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;或者(c)结晶或提取所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;

从而分离所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物。

19.权利要求15所述的方法,其还包括从所述细胞培养物回收所述罗汉果醇前体、所述罗汉果苷前体和/或罗汉果苷化合物,从而提供罗汉果苷组合物。

20.权利要求19所述的方法,其中相对于来自罗汉果(s.grosvenorii)植物的罗汉果苷组合物,所述回收的罗汉果苷组合物富含所述罗汉果苷前体和/或罗汉果苷化合物并且相对于植物来源的罗汉果提取物,具有降低水平的罗汉果植物来源组分。

21.产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的方法,其包括使用以下多肽的植物来源的或合成的罗汉果醇前体或罗汉果苷前体在重组宿主细胞的细胞培养基中的全细胞生物转化,并且由此产生所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物:

(a)能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯的多肽,其中所述多肽由SEQ ID NO:

54所示的氨基酸序列构成;

(b)能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:43所示的氨基酸序列构成;

(c)能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成

11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:74所示的氨基酸序列构成;

(d)能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成

11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:44所示的氨基酸序列构成;

(e)能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽,其中所述多肽由SEQ ID NO:74所示的氨基酸序列构成;

(f)能够还原细胞色素P450复合物的多肽,其中所述多肽由SEQ ID NO:46所示的氨基酸序列构成;以及

(g)能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽,其中所述多肽由SEQ ID NO:38或40所示的氨基酸序列构成;

以及以下的至少一种:

(h)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:62、68或22中任一个所示的氨基酸序列构成;

(i)能够在罗汉果醇和/或罗汉果苷化合物的C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:21、23、24、25、22、48或68中任一个所示的氨基酸序列构成;

(j)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:22或68所示的氨基酸序列构成;

(k)能够在罗汉果醇和/或罗汉果苷化合物的C11羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:24所示的氨基酸序列构成;

(l)能够使罗汉果醇和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化的多肽,其中所述多肽由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成;和/或(m)能够使罗汉果醇和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑

1,2糖基化和/或C6’位β‑1,6糖基化的多肽,其中所述多肽由SEQ ID NO:72所示的氨基酸序列构成;

其中至少一种所述多肽是在所述重组宿主细胞中表达的重组多肽。

22.产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的体外方法,其包括添加以下多肽和植物来源的或合成的罗汉果醇前体或罗汉果苷前体至反应混合物,并且由此产生所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物:(a)能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯的多肽,其中所述多肽由SEQ ID NO:

54所示的氨基酸序列构成;

(b)能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:43所示的氨基酸序列构成;

(c)能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成

11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:74所示的氨基酸序列构成;

(d)能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成

11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:44所示的氨基酸序列构成;

(g)能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽,其中所述多肽由SEQ ID NO:38或40所示的氨基酸序列构成;

以及以下的至少一种:

(h)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:62或68中任一个所示的氨基酸序列构成;

(i)能够在罗汉果醇和/或罗汉果苷化合物的C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:48或68中任一个所示的氨基酸序列构成;

(j)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:68所示的氨基酸序列构成;

(k)能够在罗汉果醇和/或罗汉果苷化合物的C11羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:24所示的氨基酸序列构成;

(l)能够使罗汉果醇和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化的多肽,其中所述多肽由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成;和/或(m)能够使罗汉果醇和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑

1,2糖基化和/或C6’位β‑1,6糖基化的多肽,其中所述多肽由SEQ ID NO:72所示的氨基酸序列构成;

其中至少一种所述多肽是重组多肽。

23.向罗汉果苷前体和/或罗汉果苷化合物的C3羟基、C24羟基、C3羟基和C24羟基二者、

3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位和/或C6’位转移糖部分的方法,其包括在用于将所述糖部分转移至所述罗汉果苷前体和/或罗汉果苷化合物的合适反应条件下,将所述罗汉果苷前体和/或罗汉果苷化合物与以下重组多肽和UDP糖相接触:所述多肽由SEQ ID NO:

48、50、53、62、68或72中任一个所示的氨基酸序列构成并且能够在所述C3羟基处糖基化所述罗汉果苷前体和/或罗汉果苷化合物、在所述C24羟基处糖基化所述罗汉果苷前体和/或罗汉果苷化合物、在所述C3羟基和C24羟基处糖基化所述罗汉果苷前体和/或罗汉果苷化合物、在所述3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位处β‑1,2糖基化和/或C6’位处β‑1,6糖基化所述罗汉果苷前体和/或罗汉果苷化合物,其中所述罗汉果苷前体是罗汉果醇、或者糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇;并且其中在转移所述糖部分后产生糖基化罗汉果苷化合物、二糖基化罗汉果苷化合物、三糖基化罗汉果苷化合物、四糖基化罗汉果苷化合物或五糖基化罗汉果苷化合物、其异构体、和/或其罗汉果苷组合物。

24.权利要求23所述的方法,其中(a)所述糖部分是葡萄糖,并且在将所述葡萄糖部分转移至罗汉果醇后产生罗汉果苷I A1;

(b)所述糖部分是葡萄糖,并且在将所述葡萄糖部分转移至罗汉果醇后产生罗汉果苷I E1;

(c)所述糖部分是葡萄糖,并且在将所述葡萄糖部分转移至罗汉果醇后产生罗汉果苷II E1;

(d)所述罗汉果苷前体是罗汉果苷IA1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA;

所述罗汉果苷前体是罗汉果苷I A1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA2;

(e)所述罗汉果苷前体是罗汉果苷IA1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷II E;

(f)所述罗汉果苷前体是罗汉果苷IA1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA1;

(g)所述罗汉果苷前体是罗汉果苷IE1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷II E;

所述罗汉果苷前体是罗汉果苷IE1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA1;

(h)所述罗汉果苷前体是罗汉果苷II A,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA1;

(i)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA1;

(j)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA2;

(k)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷III E;

(l)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷III;

(m)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV A;

(n)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV A;

(o)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV;

(p)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷V;

(q)所述罗汉果苷前体是罗汉果苷III E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA2;

(r)所述罗汉果苷前体是罗汉果苷III A2,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV;

(s)所述罗汉果苷前体是罗汉果苷III,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV A;

(t)所述罗汉果苷前体是罗汉果苷III A1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生赛门苷1;

(u)所述罗汉果苷前体是罗汉果苷IV,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生赛门苷1;或者

(v)所述罗汉果苷前体是赛门苷1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷V。

25.权利要求23所述的方法,其中在细胞培养液中产生罗汉果醇、所述糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇、所述糖基化罗汉果苷化合物、二糖基化罗汉果苷化合物、三糖基化罗汉果苷化合物、四糖基化罗汉果苷化合物或五糖基化罗汉果苷化合物、其异构体、和/或其罗汉果苷组合物,所述方法包括在表达一种或更多种以下基因的条件下,培养包含以下基因的重组宿主细胞:(i)编码由SEQ ID NO:62和68中任一个所示的氨基酸序列构成并且能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处将其糖基化之多肽的基因;(ii)编码由SEQ ID NO:48或68中任一个所示的氨基酸序列构成并且能够在所述罗汉果苷前体和/或罗汉果苷化合物的C24羟基处将其糖基化之多肽的基因;(iii)编码由SEQ ID NO:68所示的氨基酸序列构成并且能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化之多肽的基因;(iv)编码由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成并且能够使所述罗汉果苷前体和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化之多肽的基因;和/或(v)编码由SEQ ID NO:53或72中任一个所示的氨基酸序列构成并且能够使所述罗汉果苷前体和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑1,2糖基化和/或C6’位β‑1,6糖基化之多肽的基因,

其中至少一种所述基因是重组基因,

其中将所述糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇与重组多肽相接触包括将所述糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇与所述重组宿主细胞产生的至少一种多肽相接触。

26.包含权利要求1所述的重组宿主细胞的细胞培养物,所述细胞培养物还包含:(a)所述重组宿主细胞产生的罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;

(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)‑葡萄糖、UDP‑鼠李糖、UDP‑木糖和/或N‑乙酰‑葡糖胺;以及

(c)补充营养物质,包含痕量金属、维生素、盐、YNB和/或氨基酸;

其中所述罗汉果苷前体和/或罗汉果苷化合物以至少1mg/升细胞培养物的浓度存在;

其中相对于来自罗汉果植物的罗汉果苷组合物,所述细胞培养物富含所述罗汉果苷前体和/或罗汉果苷化合物;并且

其中相对于植物来源的罗汉果提取物,所述细胞培养物具有降低水平的罗汉果植物来源组分。

27.在细胞培养物中培养的权利要求1所述的重组宿主细胞的细胞裂解物,其中所述细胞裂解物包含:

(a)所述重组宿主细胞产生的罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;

(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)‑葡萄糖、UDP‑鼠李糖、UDP‑木糖和/或N‑乙酰‑葡糖胺;以及

(c)补充营养物质,包含痕量金属、维生素、盐、YNB和/或氨基酸;

其中所述罗汉果苷前体和/或罗汉果苷化合物以至少1mg/升细胞裂解物的浓度存在。

28.权利要求1所述的重组宿主细胞,其中所述重组宿主细胞是解脂耶氏酵母(Yarrowia lipolytica)细胞。

说明书 :

用于生物合成罗汉果苷化合物的方法和材料

[0001] 发明背景

技术领域

[0002] 本发明涉及用于生物合成罗汉果醇前体、罗汉果醇和/或罗汉果苷的方法和材料。更具体地说,本发明涉及使用葫芦二烯醇合酶、细胞色素P450、细胞色素P450还原酶和/或
环氧化物水解酶以产生罗汉果醇前体和/或罗汉果醇的方法。本发明还涉及使用尿苷‑5′‑
二磷酸(uridine‑5’‑diphospho,UDP)依赖性葡糖基转移酶(UGT)来糖基化罗汉果醇并产生
多种罗汉果苷的方法。

背景技术

[0003] 罗汉果苷是分离自罗汉果(Siraitia grosvenorii(S.grosvenorii,Swingle))果实的三萜糖苷家族,罗汉果也被称为Momordica grosvenori。果实提取物在商业上被用作
天然甜味剂。已经从罗汉果中鉴定了有助于果实甜度的四种主要化合物,即罗汉果苷V、罗
汉果苷IV、赛门苷I和11‑氧代罗汉果苷V(参见图1).罗汉果苷V是这四种化合物中最丰富
的,约为干果实的0.57%(w/w),其次是罗汉果苷IV和赛门苷I,其各自含有四个葡萄糖部
分.11‑氧代罗汉果苷V在C11处具有酮基而非羟基.参见例如Takemoto等,1983,Yakugaku 
Zasshi 103:1151‑4;1155‑66;1167‑73;Kasai等,1989,Agric.Biol.Chem.53:3347‑9;
Matsumoto Chem.Pharm.Bull.,1990,38:2030‑2;和Prakash等,2011,J.Carbohydrate 
Chem.30:16‑26。
[0004] 所有的罗汉果苷共有相同的罗汉果醇三萜核心。糖苷配基(aglycone)罗汉果醇被不同数目的葡萄糖部分糖基化以形成多种罗汉果苷化合物。可以以下列方式合成罗汉果
苷:从常见的三萜前体氧化角鲨烯合成葫芦二烯醇,将葫芦二烯醇氧化以产生罗汉果醇,并
且将罗汉果醇糖基化以产生多种罗汉果苷。参见Tang等,BMC Genomics 12:343(2011)。
Tang等,2011,BMC Genomics 12:343描述了作为参与罗汉果苷生物合成之潜在候选物的七
种细胞色素P450和五种UGT。然而,Tang等没有具体鉴定参与罗汉果苷生物合成的任何细胞
色素P450或UGT。因此,仍然需要鉴定能够作用于任何罗汉果代谢物的细胞色素P450和UGT。
另外,虽然可以从罗汉果中提取罗汉果苷,但是仍然需要在用于商业用途的重组宿主中改
进罗汉果苷的产生。
[0005] 发明概述
[0006] 在上述背景下,本发明提供了相对于现有技术的某些优点和进步。
[0007] 本发明提供了用于生物合成罗汉果苷化合物的方法和材料,并提供了参与罗汉果苷生物合成的酶。
[0008] 尽管本文公开的本发明不限于具体的优点或功能,但是本发明提供了重组宿主,其包含以下的一种或更多种:
[0009] (a)编码角鲨烯环氧酶多肽的基因;
[0010] (b)编码葫芦二烯醇合酶多肽的基因;
[0011] (c)编码细胞色素P450多肽的基因;
[0012] (d)编码细胞色素P450还原酶多肽的基因;
[0013] (e)编码环氧化物水解酶多肽的基因;
[0014] (f)编码与SEQ ID NO:48所示的氨基酸序列具有60%或更高同一性的UGT1576多肽的基因;
[0015] (g)编码与SEQ ID NO:62所示的氨基酸序列具有45%或更高同一性的UGT430多肽的基因;
[0016] (h)编码与SEQ ID NO:68所示的氨基酸序列具有45%或更高同一性的UGT1697多肽的基因;
[0017] (i)编码与SEQ ID NO:72所示的氨基酸序列具有50%或更高同一性的UGT11789多肽的基因;
[0018] (j)编码与SEQ ID NO:53所示的氨基酸序列具有70%或更高同一性的UGT98多肽的基因;
[0019] (k)编码与SEQ ID NO:50所示的氨基酸序列具有70%或更高同一性的UGTSK98多肽的基因;
[0020] 其中至少一种所述基因是重组基因;
[0021] 其中所述宿主能够产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物。
[0022] 在本文所公开的重组宿主的一些方面中:
[0023] (a)所述角鲨烯环氧酶多肽包含与SEQ ID NO:54所示的氨基酸序列具有45%或更高同一性的多肽;
[0024] (b)所述葫芦二烯醇合酶多肽包含与SEQ ID NO:43所示的氨基酸序列具有70%或更高同一性的多肽;
[0025] (c)所述细胞色素P450多肽包含与SEQ ID NO:44所示的氨基酸序列具有50%或更高同一性的CYP5491多肽,和/或与SEQ ID NO:74所示的氨基酸序列具有70%或更高同一性
的CYP1798多肽;
[0026] (d)所述细胞色素P450还原酶多肽包含与SEQ ID NO:46所示的氨基酸序列具有50%或更高同一性的CPR4497多肽;和/或
[0027] (e)所述环氧化物水解酶多肽包含与SEQ ID NO:38所示的氨基酸序列具有75%或更高同一性的环氧化物水解酶1多肽,或与SEQ ID NO:40所示的氨基酸序列具有65%或更
高同一性的环氧化物水解酶2多肽。
[0028] 本发明还提供了重组宿主,其包含以下的一种或更多种:
[0029] (a)编码能够催化环氧角鲨烯(dioxidosqualene)转化以产生24,25环氧葫芦二烯醇的一种或更多种酶的一种或更多种基因;
[0030] (b)编码能够催化氧化角鲨烯转化以产生葫芦二烯醇的一种或更多种酶的一种或更多种基因;
[0031] (c)编码能够催化24,25环氧葫芦二烯醇羟基化以产生11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶的一种或更多种基因;
[0032] (d)编码能够催化葫芦二烯醇羟基化以产生11‑羟基‑葫芦二烯醇的一种或更多种酶的一种或更多种基因;
[0033] (e)编码能够催化葫芦二烯醇环氧化以产生24,25环氧葫芦二烯醇的一种或更多种酶的一种或更多种基因;或者
[0034] (f)编码能够催化11‑羟基‑葫芦二烯醇环氧化以产生11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶的一种或更多种基因;
[0035] (g)编码能够催化11‑羟基‑24,25环氧葫芦二烯醇转化以产生罗汉果醇的一种或更多种酶的一种或更多种基因;或者
[0036] (h)编码能够催化罗汉果苷前体糖基化以产生罗汉果苷化合物的一种或更多种酶的一种或更多种基因;
[0037] 其中至少一种所述基因是重组基因。
[0038] 在本文公开的重组宿主的一个方面中,所述重组宿主还包含编码与SEQ ID NO:54所示的氨基酸序列具有45%或更高同一性的角鲨烯环氧酶多肽的基因。
[0039] 在本文公开的重组宿主的一个方面中,所述重组宿主已被修饰成减少羊毛甾醇合酶(ERG7)多肽的表达.
[0040] 在本文公开的重组宿主的一个方面中,所述ERG7多肽包含具有SEQ ID NO:55所示的氨基酸序列的多肽。
[0041] 本发明还提供了产生罗汉果苷前体和/或罗汉果苷化合物的方法,其包括:
[0042] (a)在表达本文公开的所述基因的条件下,在培养基中培养本文公开的重组宿主;
[0043] 其中所述罗汉果苷前体和/或罗汉果苷化合物由所述重组宿主合成;并且
[0044] (b)任选地分离所述罗汉果苷前体和/或罗汉果苷化合物。
[0045] 在本文公开的方法的一些方面中,所述罗汉果苷前体是通过以下合成的罗汉果醇:将11‑羟基‑葫芦二烯醇环氧化以合成11‑羟基‑24,25环氧葫芦二烯醇,并且将11‑羟基‑
24,25环氧葫芦二烯醇水解以合成罗汉果醇。
[0046] 在本文公开的方法的一些方面中,将11‑羟基‑葫芦二烯醇环氧化以合成11‑羟基‑24,25环氧葫芦二烯醇是由与SEQ ID NO:74所示的氨基酸序列具有70%或更高同一性的
CYP1798多肽所催化的。
[0047] 本发明还提供了在体外产生罗汉果醇前体的方法,其包括:
[0048] (a)将环氧角鲨烯与能够催化环氧角鲨烯转化以产生24,25环氧葫芦二烯醇的一种或更多种酶接触;或者
[0049] (b)将氧化角鲨烯与能够催化氧化角鲨烯转化以产生葫芦二烯醇的一种或更多种酶接触;或者
[0050] (c)将24,25环氧葫芦二烯醇与能够催化24,25环氧葫芦二烯醇羟基化以产生11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶接触;或者
[0051] (d)将葫芦二烯醇与能够催化葫芦二烯醇羟基化以产生11‑羟基‑葫芦二烯醇的一种或更多种酶接触;或者
[0052] (e)将葫芦二烯醇与能够催化葫芦二烯醇环氧化以产生24,25环氧葫芦二烯醇的一种或更多种酶接触;或者
[0053] (f)将11‑羟基‑葫芦二烯醇与能够催化11‑羟基‑葫芦二烯醇环氧化以产生11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶接触。
[0054] 本发明还提供了在体外产生罗汉果醇的方法,其包括将11‑羟基‑24,25环氧葫芦二烯醇与能够催化11‑羟基‑24,25环氧葫芦二烯醇转化以产生罗汉果醇的一种或更多种酶
接触。
[0055] 本发明还提供了在体外产生罗汉果苷化合物的方法,其包括将罗汉果苷前体与能够催化罗汉果苷前体糖基化以产生罗汉果苷化合物的一种或更多种酶接触。
[0056] 在本文公开的方法的一个方面中,所述方法还包括分离所述罗汉果醇前体、罗汉果醇或所述罗汉果苷化合物.
[0057] 在本文公开的重组宿主和方法的一些方面中:
[0058] (a)所述能够催化环氧角鲨烯转化以产生24,25环氧葫芦二烯醇的一种或更多种酶包含与SEQ ID NO:43所示的氨基酸序列具有70%或更高同一性的葫芦二烯醇合酶;
[0059] (b)所述能够催化氧化角鲨烯转化以产生葫芦二烯醇的一种或更多种酶包含与SEQ ID NO:43所示的氨基酸序列具有70%或更高同一性的葫芦二烯醇合酶;
[0060] (c)所述能够催化24,25环氧葫芦二烯醇转化以产生11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶包含与SEQ ID NO:44所示的氨基酸序列具有50%或更高同一性的
CYP5491;
[0061] (d)所述能够催化葫芦二烯醇转化以产生11‑羟基‑葫芦二烯醇的一种或更多种酶包含与SEQ ID NO:44所示的氨基酸序列具有50%或更高同一性的CYP5491;
[0062] (e)所述能够催化葫芦二烯醇环氧化以产生24,25环氧葫芦二烯醇的一种或更多种酶包含与SEQ ID NO:74所示的氨基酸序列具有70%或更高同一性的CYP1798;
[0063] (f)所述能够催化11‑羟基‑葫芦二烯醇环氧化以产生11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶包含与SEQ ID NO:74所示的氨基酸序列具有70%或更高同一性的
CYP1798;
[0064] (g)所述能够催化11‑羟基‑24,25环氧葫芦二烯醇转化以产生罗汉果醇的一种或更多种酶包含这样的多肽:其包含与SEQ ID NO:38所示的氨基酸序列具有75%或更高同一
性的环氧化物水解酶1或与SEQ ID NO:40所示的氨基酸序列具有65%或更高同一性的环氧
化物水解酶2;和/或
[0065] (h)所述能够催化罗汉果苷前体转化成罗汉果苷化合物的一种或更多种酶包含与SEQ ID NO:48所示的氨基酸序列具有60%或更高同一性的UGT1576;与SEQ ID NO:53所示
的氨基酸序列具有70%或更高同一性的UGT98;与SEQ ID NO:50所示的氨基酸序列具有
70%或更高同一性的UGTSK98;与SEQ ID NO:62所示的氨基酸序列具有45%或更高同一性
的UGT430;与SEQ ID NO:68所示的氨基酸序列具有45%或更高同一性的UGT1697;或者与
SEQ ID NO:72所示的氨基酸序列具有50%或更高同一性的UGT11789.
[0066] 本发明还提供了产生罗汉果苷化合物的方法,其包括使表达以下一种或更多种的重组宿主与罗汉果苷前体接触:
[0067] (a)与SEQ ID NO:48所示的氨基酸序列具有60%或更高同一性的UGT1576多肽;
[0068] (b)与SEQ ID NO:62所示的氨基酸序列具有45%或更高同一性的UGT430多肽;
[0069] (c)与SEQ ID NO:68所示的氨基酸序列具有45%或更高同一性的UGT1697多肽;
[0070] (d)与SEQ ID NO:72所示的氨基酸序列具有50%或更高同一性的UGT11789多肽;
[0071] (e)与SEQ ID NO:53所示的氨基酸序列具有70%或更高同一性的UGT98多肽;或者
[0072] (f)与SEQ ID NO:50所示的氨基酸序列具有70%或更高同一性的UGTSK98多肽。
[0073] 在本文公开的方法的一个方面中,所述罗汉果苷前体是植物来源的或合成的罗汉果苷前体。
[0074] 在本文公开的方法的一个方面中,所述方法还包括分离所述罗汉果苷化合物。
[0075] 在本文公开的重组宿主和方法的一些方面中,所述罗汉果苷化合物是:
[0076] (a)在C3位糖基化的罗汉果醇;或者
[0077] (b)在C24位糖基化的罗汉果醇;或者
[0078] (c)在C3位和C24位糖基化的罗汉果醇。
[0079] 在本文公开的重组宿主和方法的一些方面中,所述罗汉果苷化合物是罗汉果苷I A1、罗汉果苷I E1、罗汉果苷II A、罗汉果苷II A1、罗汉果苷II A2、罗汉果苷II E、罗汉果
苷III A1、罗汉果苷III A2、罗汉果苷III、罗汉果苷III E、罗汉果苷IV、罗汉果苷IV A、罗
汉果苷V或赛门苷(siamenoside)中的一种或更多种。
[0080] 在本文公开的重组宿主和方法的一些方面中,所述罗汉果醇前体是角鲨烯、环氧角鲨烯、氧化角鲨烯、24,25环氧葫芦二烯醇、葫芦二烯醇、11‑羟基‑葫芦二烯醇、11‑羟基
24,25环氧葫芦二烯醇或11‑氧代‑罗汉果醇中的一种或更多种。
[0081] 在本文公开的重组宿主和方法的一些方面中,所述罗汉果苷前体是罗汉果醇、糖基化罗汉果醇、二糖基化罗汉果醇或三糖基化罗汉果醇中的一种或更多种.
[0082] 在本文公开的重组宿主和方法的一些方面中,所述重组宿主包含这样的微生物,其为酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。
[0083] 在本文公开的重组宿主和方法的一些方面中,所述细菌细胞包括埃希氏菌属(Escherichia)细菌细胞、乳杆菌属(Lactobacillus)细菌细胞、乳球菌属(Lactococcus)细
菌细胞、棒杆菌属(Cornebacterium)细菌细胞、醋杆菌属(Acetobacter)细菌细胞、不动杆
菌属(Acinetobacter)细菌细胞或假单胞菌属(Pseudomonas)细菌细胞。
[0084] 在本文公开的重组宿主和方法的一些方面中,所述酵母细胞是来自以下物种的细胞:酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces 
pombe)、解脂耶氏酵母(Yarrowia lipolytica)、光滑假丝酵母(Candida glabrata)、棉阿
舒囊霉(Ashbya gossypii)、Cyberlindnera jadinii、巴斯德毕赤酵母(Pichia 
pastoris)、乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉逊酵母(Hansenula 
polymorpha)、博伊丁假丝酵母(Candida boidinii)、Arxula adeninivorans、红发夫酵母
(Xanthophyllomyces dendrorhous)或白假丝酵母(Candida albicans)。
[0085] 在本文公开的重组宿主和方法的一些方面中,所述酵母细胞是酵母菌(Saccharomycete)。
[0086] 在本文公开的重组宿主和方法的一些方面中,所述酵母细胞是来自酿酒酵母物种的细胞。
[0087] 在本文公开的重组宿主的一些方面中,一种或更多种所述基因还包含编码融合标签的核苷酸序列。
[0088] 在本文公开的重组宿主的一个方面中,所述融合标签是蛋白质或多肽。
[0089] 在本文公开的重组宿主的一个方面中,所述融合标签是绿色荧光蛋白(GFP)、人流感血凝素(HA)、谷胱甘肽S转移酶(GST)、多组氨酸标签(HIS标签)、和FLAG标签、叶绿体转运
肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。
[0090] 在本文公开的重组宿主的一个方面中,一种或更多种所述基因表达为融合蛋白。
[0091] 本发明还提供了通过本文公开的重组宿主或方法产生的罗汉果苷组合物,其中所述组合物包含罗汉果苷I A1、罗汉果苷I E1、罗汉果苷II A、罗汉果苷II E、罗汉果苷III 
A1、罗汉果苷III A2、罗汉果苷III、罗汉果苷III E、罗汉果苷IV、罗汉果苷V和赛门苷中的
一种或更多种。
[0092] 本发明还提供了食品或饮品,其包含本文所公开的罗汉果苷组合物。
[0093] 从下文对本发明的详细描述并结合所附权利要求,将更充分地理解本发明的这些和其他特征和优点。应当注意,权利要求的范围由其中的叙述定义,而不是通过对在本说明
书中所示的特征和优点的具体讨论而定义。
[0094] 附图简述
[0095] 当结合以下附图阅读时,可以最好地理解以下对本发明一些实施方案的详细描述,其中类似结构用类似的参考数字表示,并且其中:
[0096] 图1显示了罗汉果苷V、罗汉果苷IV、赛门苷I和11‑氧代罗汉果苷V的化学结构。
[0097] 图2A是从葡萄糖产生罗汉果苷之途径的示意图。
[0098] 图2B显示了用于产生罗汉果醇前体、罗汉果醇和罗汉果苷的途径.图2B显示了使用葫芦二烯醇合酶从氧化角鲨烯产生葫芦二烯醇(步骤A),使用葫芦二烯醇合酶从环氧角
鲨烯产生24,25环氧葫芦二烯醇(步骤B),使用细胞色素P450从葫芦二烯醇产生11‑羟基‑葫
芦二烯醇(步骤C),使用细胞色素P450从24,25环氧葫芦二烯醇产生11‑羟基24,25环氧葫芦
二烯醇(步骤D),使用细胞色素P450从葫芦二烯醇产生24,25环氧葫芦二烯醇(步骤E),使用
细胞色素P450从11‑羟基‑葫芦二烯醇产生11‑羟基24,25环氧葫芦二烯醇(步骤F),使用环
氧化物水解酶从11‑羟基24,25环氧葫芦二烯醇产生罗汉果醇(步骤G),使用细胞色素P450
和环氧化物水解酶从11‑羟基‑葫芦二烯醇产生罗汉果醇(步骤F和G),以及使用一种或更多
种UGT产生一种或更多种罗汉果苷化合物(步骤H)。
[0099] 图2C显示了能够催化图2B中步骤A‑H的反应的代表性酶。图2C显示了使用SEQ ID NO:43的罗汉果葫芦二烯醇合酶从氧化角鲨烯产生葫芦二烯醇(步骤A),使用SEQ ID NO:43
的罗汉果葫芦二烯醇合酶从环氧角鲨烯产生24,25环氧葫芦二烯醇(步骤B),使用SEQ ID 
NO:44的CYP5491从葫芦二烯醇产生11‑羟基‑葫芦二烯醇(步骤C),使用SEQ ID NO:44的
CYP5491从24,25环氧葫芦二烯醇产生11‑羟基24,25环氧葫芦二烯醇(步骤D),使用SEQ ID 
NO:74的CYP1798从葫芦二烯醇产生24,25环氧葫芦二烯醇(步骤E),使用SEQ ID NO:74的
CYP1798从11‑羟基‑葫芦二烯醇产生11‑羟基24,25环氧葫芦二烯醇(步骤F),使用SEQ ID 
NO:38的环氧化物水解酶1或SEQ ID NO:40的环氧化物水解酶2从11‑羟基24,25环氧葫芦二
烯醇产生罗汉果醇(步骤G),使用SEQ ID NO:74的CYP1798和SEQ ID NO:38的环氧化物水解
酶1或SEQ ID NO:40的环氧化物水解酶2从11‑羟基‑葫芦二烯醇产生罗汉果醇(步骤F和G),
以及使用SEQ ID NO:48的UGT1576、SEQ ID NO:62的UGT430、SEQ ID NO:68的UGT1697、SEQ 
ID NO:53的UGT98和/或SEQ ID NO:72的UGT11789产生罗汉果苷化合物(步骤H)。
[0100] 图3A显示了如本文公开的用于从葫芦二烯醇产生罗汉果醇的代表性途径。图3B是在Tang等,2011,BMC Genomics 12:343中提出的用于从葫芦二烯醇产生罗汉果醇的途径的
示意图。
[0101] 图4是使用UGT从罗汉果醇生物合成罗汉果苷I E1、罗汉果苷I A1、罗汉果苷II E、罗汉果苷III A2、罗汉果苷III、罗汉果苷IV和罗汉果苷V的途径的示意图。图4的UGTa可以
是例如UGT1576(SEQ ID NO:48)或UGT1697(SEQ ID NO:68)。图4的UGTb可以是例如UGT430
(SEQ ID NO:62)或UGT1697(SEQ ID NO:68)。图4的UGTc可以是例如UGT430(SEQ ID NO:62)
或UGT1697(SEQ ID NO:68)。图4的UGTd可以是例如UGT1576(SEQ ID NO:48)或UGT1697(SEQ 
ID NO:68)。图4的UGTe可以是例如UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:72).图4
的UGTf可以是例如UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:72)。图4的UGTg可以是例
如UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:72)。
[0102] 图5是显示从罗汉果苷V酶促产生罗汉果苷IVA、罗汉果苷III、罗汉果苷I E1、罗汉果苷I A1、罗汉果苷II E、罗汉果苷II A1和罗汉果醇的示意图.
[0103] 图6显示了来自酵母菌株的样品中对应于四羟基角鲨烯的质子加Na+加合物的LC‑MS质谱峰501,用表达罗汉果环氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:40)的质粒转化
所述酵母菌株,如实施例8所述。
[0104] 图7A显示了LC‑MS色谱图,其表示在不表达葫芦二烯醇合酶的酵母菌株中的羊毛甾醇产生。图7B显示了LC‑MS色谱图,其表示在表达葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID 
NO:43)的酵母菌株中的葫芦二烯醇和羊毛甾醇产生,如实施例9所述。
[0105] 图8显示了在酵母中表达CYP5491(SEQ ID NO:14,SEQ ID NO:44)和CPR4497(SEQ ID NO:45,SEQ ID NO:46)后产生的具有三个峰的LC‑MS色谱图(上图),如实施例10所述;三
个下图显示了这三个峰的碎片谱。3个峰的质量(443.38、441.37和457.36)在重量上分别对
应于羟基化葫芦二烯醇、氧代葫芦二烯醇和羟基加氧代葫芦二烯醇的质子加合物。
[0106] 图9A和9B显示了用罗汉果CYP5491(SEQ ID NO:14,SEQ ID NO:44)、罗汉果CYP1798(SEQ ID NO:5,SEQ ID NO:73,SEQ ID NO:74)和罗汉果环氧化物水解酶2(SEQ ID 
NO:39,SEQ ID NO:40)进行的从葫芦二烯醇到罗汉果醇和11‑氧代‑罗汉果醇的生物合成途
径。图9C显示了用酿酒酵母角鲨烯环氧酶ERG1(SEQ ID NO:54)、罗汉果CYP1798(SEQ ID 
NO:5,SEQ ID NO:73,SEQ ID NO:74)、罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID NO:
43)、罗汉果CYP5491(SEQ ID NO:14,SEQ ID NO:44)和罗汉果环氧化物水解酶2(SEQ ID 
NO:39,SEQ ID NO:40)进行的从氧化角鲨烯到罗汉果醇和11‑氧代‑罗汉果醇的潜在生物合
成途径。参见实施例9和15。
[0107] 图10A显示了参照罗汉果苷I A1的LC‑MS色谱图.图10B显示了在供给50μM罗汉果醇的培养物中,表达UGT1576(SEQ ID NO:47,SEQ ID NO:48)的酵母菌株样品的LC‑MS色谱
图,如实施例11所述.
[0108] 图11A显示了来自共表达UGT SK98以及UGT1576之酵母菌株的样品的LC‑MS色谱图,并显示了二糖基化罗汉果醇(罗汉果苷II A)的产生,如实施例11所述.图11B显示了来
自共表达UGT98以及UGT1576之酵母菌株的样品的LC‑MS色谱图,并显示了二糖基化和三糖
基化罗汉果醇(中框和下框)的产生,如实施例11所述.
[0109] 图12显示了本文提供的从罗汉果醇到罗汉果苷III A1的生物合成途径,如实施例11所述。
[0110] 图13A显示了罗汉果苷I E1标准品的洗脱.图13B显示了通过UGT430(SEQ ID NO:61,SEQ ID NO:62)产生的罗汉果苷I E1,如实施例12所述。
[0111] 图14A显示了罗汉果苷II E1、罗汉果苷IIA、罗汉果苷I E1和罗汉果苷I A1标准品的洗脱.图14B显示通过UGT1697(SEQ ID NO:67,SEQ ID NO:68)产生的罗汉果苷I A1、罗汉
果苷II A和罗汉果苷II E1,如实施例13所述。
[0112] 图15A显示了参照化合物罗汉果苷V(上图)和罗汉果苷II E(下图)的洗脱。图15B显示了在共表达UGT1576、UGT430和UGT98的酵母细胞中产生罗汉果苷V(上图)和罗汉果苷
II E(下图)。图15C显示了在共表达UGT1576、UGT430、UGT98和UGT11789的酵母细胞中产生
罗汉果苷V(上图)和罗汉果苷II E(下图),如实施例14所述。图15D显示了在共表达
UGT1576、UGT430和UGT11789的酵母细胞中产生三糖基化罗汉果苷,如实施例14所述。
[0113] 图16A显示了罗汉果醇标准品的洗脱。图16B显示了在表达CYP5491(SEQ ID NO:14,SEQ ID NO:44)、CPR4497(SEQ ID NO:45,SEQ ID NO:46)、CYP1798(SEQ ID NO:5,SEQ 
ID NO:73,SEQ ID NO:74)和环氧化物水解酶的葫芦二烯醇产生宿主中产生的罗汉果醇,如
实施例15所述。
[0114] 图17显示了罗汉果苷V产生酿酒酵母菌株的粗分离物的代表性LC‑MS色谱图,如实施例16所述.
[0115] 图18A、18B和18C分别显示了罗汉果苷V、罗汉果苷II A2和罗汉果苷IV A的NMR明1 1 13
确结构、H NMR谱以及H与 C NMR化学位移(以ppm计),如实施例16所述。图18D显示了罗汉
1 1
果苷I E1的NMR明确结构、H NMR谱和H NMR化学位移(以ppm计),如实施例16所述。
[0116] 发明详述
[0117] 在详细描述本发明之前,将定义多个术语.如本文所使用的,除非上下文另有明确规定,否则未指定具体数量的形式和“该/所述”包括复数指示物.例如,提及“核酸”是指一
种或更多种核酸。
[0118] 应注意,术语如“优选”、“一般”和“通常”在本文中并不是用于限制要求保护的发明的范围,或暗示某些特征对于要求保护的发明的结构或功能是关键的、必要的或甚至是
重要的。相反,这些术语仅旨在突出可被用在或不被用在本发明的特定实施方案中的替选
的或额外的特征。
[0119] 为了描述和限定本发明的目的,应注意术语“基本上”在本文中用于表示可归因于任何定量比较、值、测量或其他表述的固有的不确定程度。术语“基本上”在本文中也用于表
示在不导致所讨论主题之基本功能改变的情况下,定量表达可不同于所述参照的程度。
[0120] 如本文中使用的术语“多核苷酸”、“核苷酸”、“寡核苷酸”和“核酸”可互换使用,是指包括DNA、RNA、其衍生物、或其组合的核酸.
[0121] 如本文所使用的术语“和/或”用于描述多种组分的组合或彼此排除。例如,“x、y和/或z”可以单独指“x”,单独指“y”,单独指“z”,“x、y和z”,“(x和y)或z”,“x和(y或z)”或“x
或y或z”。在一些实施方案中,“和/或”用于指重组细胞包含的外源核酸,其中重组细胞包含
选自一组的一种或更多种外源核酸.在一些实施方案中,“和/或”用于指罗汉果苷的产生,
其中产生了一种或更多种罗汉果苷。在一些实施方案中,“和/或”用于指罗汉果苷的产生,
其中通过一个或更多个以下步骤产生一种或更多种罗汉果苷:培养重组微生物,在重组微
生物中合成一种或更多种罗汉果苷,并分离一种或更多种罗汉果苷。
[0122] 罗汉果苷和罗汉果苷的产生
[0123] 如本文所用的术语“罗汉果苷”和“罗汉果苷化合物”可以互换使用以描述在一个或更多个位置糖基化的罗汉果醇。特别地,罗汉果苷化合物可以是在1、3、11、24和25位用一
个或更多个葡萄糖部分糖基化的罗汉果醇。罗汉果醇是下面提供的式I化合物,其中R1和R2
均是‑H。
[0124] 罗汉果苷可以为下式I:
[0125]
[0126] 其中R1和R2独立地是‑H、单葡糖苷、二葡糖苷、三葡糖苷,并且其中R1和R2中的至少一个不是‑H.特别地,罗汉果苷可以是表1中所述的一种罗汉果苷。在表1中,“Glc”表示葡萄
糖,并且表示了1,6‑和1,2‑键。例如,罗汉果苷V的R2基团包含通过一个1,6‑键和一个1,2‑
键连接的3个葡萄糖分子,构象表示为“Glc6‑Glc2‑Glc‑”。罗汉果苷IV、罗汉果苷V、11‑氧
代‑罗汉果苷V和赛门苷的结构见图1。
[0127] 表1.式I的罗汉果苷。(Glc=葡萄糖)
[0128] 名称 R1 R2罗汉果苷V Glc6‑Glc‑ Glc6‑Glc2‑Glc
赛门苷I Glc‑ Glc6‑Glc2‑Glc‑
罗汉果苷IV Glc6‑Glc‑ Glc2‑Glc‑
罗汉果苷IV A Glc6‑Glc‑ Glc6‑Glc‑
罗汉果苷III Glc‑ Glc6‑Glc‑
罗汉果苷III A1 H Glc6‑Glc2‑Glc‑
罗汉果苷III A2(罗汉果苷IIIa) Glc6‑Glc‑ Glc‑
罗汉果苷III E Glc‑ Glc2‑Glc‑
罗汉果苷II A H Glc2‑Glc‑
罗汉果苷II A1 H Glc6‑Glc‑
罗汉果苷II A2 Glc6‑Glc‑ H
[0129]名称 R1 R2
罗汉果苷II E Glc‑ Glc‑
罗汉果苷I A1(罗汉果苷Ib) H Glc‑
罗汉果苷I E1(罗汉果苷Ia) Glc‑ H
[0130] 罗汉果苷可以由多种罗汉果苷前体产生。在一些实施方案中,罗汉果苷前体是罗汉果醇、糖基化罗汉果醇、二糖基化罗汉果醇或三糖基化罗汉果醇。罗汉果醇前体又包括角
鲨烯、环氧角鲨烯、氧化角鲨烯、24,25环氧葫芦二烯醇、葫芦二烯醇、11‑羟基‑葫芦二烯醇、
11‑羟基24,25环氧葫芦二烯醇、11‑氧代‑罗汉果醇。参见例如图2和图9。例如,罗汉果苷I 
A1是产物罗汉果苷II A和罗汉果苷III A1的前体。参见图12。在另一个实例中,罗汉果苷II 
E通过三个酶促糖基化转化成罗汉果苷V。在一种可能的途径中,通过不限于UGT98(SEQ ID 
NO:53)或UGT11789(SEQ ID NO:72)的UGT,首先经由1,6‑键将两个葡萄糖部分连接到罗汉
果苷II E的两个葡萄糖分子。通过不限于UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:
72)的UGT将第三葡萄糖部分用1,2键添加到C24结合的葡萄糖部分。参见图4。
[0131] 在Tang等,2011,BMC Genomics 12:343中提出了从葫芦二烯醇到罗汉果醇的途径。已经从罗汉果中分离出了前体葫芦二烯醇和罗汉果醇。参见Ukiya等,2002,
J.Agric.Food Chem.50:6710‑5。糖苷中间体存在于11‑羟基和11‑氧代系列两者中,并且随
着果实成熟,它们逐渐从罗汉果苷I转变为罗汉果苷V,表明在随后的糖基化之前,P450酶完
全氧化罗汉果醇前体(如葫芦二烯醇)的三萜核心.根据Tang等提出的方案,由三种独立的
细胞色素P450酶催化的氧化导致了由葫芦二烯醇形成罗汉果醇(图3B)。然而,所提出的初
步反应是不可能的,因为在通过细胞色素P450酶的两个羟基化反应之前需要24‑25双键的
饱和。如图3A所示,通过一种细胞色素P450酶对葫芦二烯醇环氧化,然后进行自发或酶催化
的水合,以及第二次P450酶催化的氧化可以导致产生罗汉果醇.如实施例11所述,产生罗汉
果醇或11‑氧代‑罗汉果醇的另一些途径如图9所示。
[0132] 在一些实施方案中,产生了一种或更多种罗汉果醇前体。如下所述,可以在体内(即在重组宿主中)、体外(即,经酶促)或通过全细胞生物转化来产生罗汉果醇前体、罗汉果
醇和/或罗汉果苷.如本文所用的术语“可检测量”、“可检测浓度”、“可测量量”和“可测量浓
度”是指以AUC、μM/OD600、mg/L、μM或mM测量的罗汉果苷和罗汉果苷前体的水平。可通过本领
域技术人员通常可用的技术来检测和/或分析罗汉果苷产生(即,总的、上清的和/或细胞内
的甜菊醇糖苷水平),所述技术例如但不限于液相色谱‑质谱法(liquid chromatography‑
mass spectrometry,LC‑MS)、薄层色谱法(thin layer chromatography,TLC)、高效液相色
谱法(high‑performance liquid chromatography,HPLC)、紫外‑可见光谱/分光光度法
(ultraviolet‑visible spectroscopy/spectrophotometry,UV‑Vis)、质谱法(mass 
spectrometry,MS)和核磁共振光谱法(nuclear magnetic resonance spectroscopy,
NMR)。如本文所用,术语“相对丰度”用于指由MS或LC‑MS测量的特定离子的浓度,其中最强
的离子被指定100的相对丰度分数,并被称为基峰。
[0133] 罗汉果苷产生途径
[0134] 在一些实施方案中,如本文所述地产生罗汉果醇前体(例如角鲨烯或氧化角鲨烯)、罗汉果醇或罗汉果苷。可以使用角鲨烯合酶由法呢基焦磷酸产生角鲨烯,并且可以使
用角鲨烯环氧酶由角鲨烯产生氧化角鲨烯。角鲨烯合酶可以是根据EC 2.5.1.21分类的任
何酶。角鲨烯产生可以包括在NADPH存在下通过角鲨烯合酶催化法呢基焦磷酸转化的步骤。
因此在本发明的一些实施方案中(其中所述方法在体内进行),重组宿主可包含编码角鲨烯
合酶的异源核酸。在另一些方面中,角鲨烯合酶可以是内源性的。
[0135] 角鲨烯合酶可以是例如来自绞股蓝(Gynostemma pentaphyllum,一种葫芦科植物)的角鲨烯合酶(蛋白质登录号C4P9M2)。角鲨烯合酶还可以包括来自以下的角鲨烯合酶:
拟南芥(Arabidopsis thaliana)(蛋白质登录号C4P9M3)、欧洲油菜(Brassica napus)、来
檬(Citrus macrophylla)、绿玉树(Euphorbia tirucalli)(蛋白质登录号B9WZW7)、大豆
(Glycine max)、光果甘草(Glycyrrhiza glabra)(蛋白质登录号Q42760、Q42761)、甘草
(Glycrrhiza uralensis)(蛋白质登录号D6QX40、D6QX41、D6QX42、D6QX43、D6QX44、D6QX45、
D6QX47、D6QX39、D6QX55、D6QX38、D6QX53、D6QX37、D6QX35、B5AID5、B5AID4、B5AID3、C7EDD0、
C6KE07、C6KE08、C7EDC9)、百脉根(Lotusjaponicas)(蛋白质登录号Q84LE3)、蒺藜苜蓿
(Medicago truncatula)(蛋白质登录号Q8GSL6)、豌豆(Pisum sativum)、蓖麻(Ricinus 
communis)(蛋白质登录号B9RHC3)、梅(Prunus mume),或与任意前述角鲨烯合酶具有至少
70%同一性的功能同源物。
[0136] 氧化角鲨烯可以通过角鲨烯环氧酶(也称为角鲨烯单加氧酶)从角鲨烯产生。参见例如Leber等,1998,Mol Biol Cell.9(2):375‑86。角鲨烯环氧酶可以是根据EC 1.4.99.7
分类的任何酶。氧化角鲨烯产生可以包括在NADPH存在下通过角鲨烯环氧酶催化角鲨烯转
化的步骤。参见例如实施例8。
[0137] 角鲨烯环氧酶还可以是来自酿酒酵母的ERG1基因的产物。因此,角鲨烯环氧酶可以是SEQ ID NO:54的多肽或与其具有至少45%序列同一性的功能同源物。在某些方面中,
ERG1被过表达。
[0138] 所述角鲨烯环氧酶可以是例如来自绞股蓝的角鲨烯环氧酶(蛋白质登录号C4P9M2;SEQ ID NO:88)。所述角鲨烯环氧酶可以包括来自以下的角鲨烯环氧酶:拟南芥(蛋
白质登录号Q9SM02(SEQ ID NO:89)、O65403(SEQ ID NO:90)、O65402(SEQ ID NO:91)、
O65404(SEQ ID NO:92)、O81000(SEQ ID NO:93)或Q9T064(SEQ ID NO:94))、欧洲油菜(蛋
白质登录号O65727(SEQ ID NO:95)、O65726(SEQ ID NO:96))、绿玉树(蛋白质登录号
A7VJN1(SEQ ID NO:97))、蒺藜苜蓿(蛋白质登录号Q8GSM8(SEQ ID NO:98)、Q8GSM9(SEQ ID 
NO:99))、豌豆和蓖麻(蛋白质登录号B9R6V0(SEQ ID NO:100)、B9S7W5(SEQ ID NO:101)、
B9S6Y2(SEQ ID NO:102)、B9T0Y3(SEQ ID NO:103)、B9S7T0(SEQ ID NO:104)、B9SX91(SEQ 
ID NO:105)),或与上述任何角鲨烯环氧酶具有至少70%同一性的功能同源物。
[0139] 能够催化氧化角鲨烯转化以形成葫芦二烯醇的一种或更多种酶包含葫芦二烯醇合酶.参见实施例9以及图2B和2C的步骤A。葫芦二烯醇合酶可以是例如被分类为氧化角鲨
烯环化酶的葫芦二烯醇合酶,例如Shibuya,Tetrahedron,60:6995‑7003(2004)所描述的氧
化角鲨烯环化酶。
[0140] 本文提供了作为SEQ ID NO:1的来自西葫芦(Cucurbita pepo)的葫芦二烯醇合酶的氨基酸序列.在一些实施方案中,葫芦二烯醇合酶是SEQ ID NO:1的多肽或与其具有至少
70%序列同一性的功能同源物.在一些实施方案中,与SEQ ID NO:1所示的氨基酸序列具有
至少70%同一性的多肽包括但不限于来自以下的多肽:百脉根(Lotus japonicas)
(BAE53431)、毛果杨(Populus trichocarpa)(XP_002310905)、黑升麻(Actaea racemosa)
(ADC84219)、白桦(Betula platyphylla)(BAB83085)、光果甘草(BAA76902)、葡萄(Vitis 
vinifera)(XP_002264289)、积雪草(Centella asiatica)(AAS01524)、人参(Panax 
ginseng)(BAA33460)、和白桦(BAB83086).所述葫芦二烯醇合酶可以是与上述葫芦二烯醇
合酶具有至少70%同一性的任何葫芦二烯醇合酶。
[0141] 如实施例5所述,本文鉴定了来自罗汉果(monk fruit)的葫芦二烯醇合酶,并确定了多肽C末端部分的序列。本文中提供了作为SEQ ID NO:2的罗汉果多肽C末端部分的氨基
酸序列。因此,在一些实施方案中,葫芦二烯醇合酶是具有SEQ ID NO:2所示氨基酸序列的
多肽。
[0142] 在另一些实施方案中,葫芦二烯醇合酶是SEQ ID NO:43的多肽或与其具有至少70%同一性的功能同源物。
[0143] 在一些实施方案中,使用能够催化氧化角鲨烯转化以形成葫芦二烯醇的一种或更多种酶,从环氧角鲨烯产生24,25环氧葫芦二烯醇。能够催化环氧角鲨烯转化为24,25环氧
葫芦二烯醇的一种或更多种酶优选包含葫芦二烯醇合酶。参见实施例9以及图2B和2C的步
骤B。葫芦二烯醇合酶可以是例如Shibuya,Tetrahedron 60:6995‑7003(2004)所述的葫芦
二烯醇合酶,或如上所述的葫芦二烯醇合酶。在一些实施方案中,催化环氧角鲨烯转化为
24,25环氧葫芦二烯醇的葫芦二烯醇合酶是SEQ ID NO:1的多肽或与其具有至少70%同一
性的功能同源物。
[0144] 在一些实施方案中,从葫芦二烯醇产生11‑羟基‑葫芦二烯醇。在一些实施方案中,细胞色素P450酶催化葫芦二烯醇的羟基化以形成11‑羟基‑葫芦二烯醇。在一些实施方案
中,CYP5491(SEQ ID NO:14,SEQ ID NO:44)催化葫芦二烯醇转化为11‑羟基‑葫芦二烯醇.
参见实施例10以及图2B和2C的步骤C。
[0145] 如实施例6和15所示,可以使用CYP533、CYP937、CYP1798、CYP1994、CYP2048、CYP2740、CYP3404、CYP3968、CYP4112、CYP4149、CYP4491、CYP5491、CYP6479、CYP7604、
CYP8224、CYP8728、CYP10020或CYP10285(分别由SEQ ID NO:3‑20编码)中的一种或更多种
产生罗汉果醇。eYAC技术可用于评估细胞色素P450酶的活性,如实施例8所述.或者,体外反
应可用于评估该活性.因此,在本发明的一个实施方案中,至少一种细胞色素P450酶包含由
以下核酸序列编码的多肽:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID 
NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID 
NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID 
NO:19、SEQ ID NO:20,或与其具有至少70%同一性的功能同源物.
[0146] 在一些实施方案中,使用能够催化24,25环氧葫芦二烯醇的羟基化以形成11‑羟基‑24,25环氧葫芦二烯醇的一种或更多种酶,从24,25环氧葫芦二烯醇产生11‑羟基‑24,25
环氧葫芦二烯醇。在一些实施方案中,细胞色素P450酶催化24,25环氧葫芦二烯醇的羟基化
以形成11‑羟基‑24,25环氧葫芦二烯醇。在一些实施方案中,能够催化24,25环氧葫芦二烯
醇的羟基化以形成11‑羟基‑24,25环氧葫芦二烯醇的酶是CYP5491(SEQ ID NO:14,SEQ ID 
NO:44),或与SEQ ID NO:44具有至少50%序列同一性的功能同源物。参见实施例9以及图2B
和2C的步骤D。
[0147] 在一些方面中,从葫芦二烯醇产生24,25环氧葫芦二烯醇。在一些方面中,细胞色素P450催化葫芦二烯醇转化为24,25环氧葫芦二烯醇。细胞色素P450可以是SEQ ID NO:74
的CYP1798。参见图2B和2C的步骤E。在一些方面中,11‑羟基24,25环氧葫芦二烯醇由11‑羟
基‑葫芦二烯醇产生。在一些方面中,细胞色素P450催化11‑羟基‑葫芦二烯醇的转化以产生
11‑羟基24,25环氧葫芦二烯醇。细胞色素P450可以是SEQ ID NO:74的CYP1798。参见图2B和
2C的步骤F。
[0148] 在一些方面中,使用能够催化11‑羟基‑葫芦二烯醇转化以形成罗汉果醇的酶,由11‑羟基‑葫芦二烯醇产生罗汉果醇。具有细胞色素P450活性和环氧化物水解酶活性的酶催
化11‑羟基‑葫芦二烯醇向罗汉果醇的转化。参见图2B和2C的步骤F和G.具有细胞色素P450
活性的酶包括由以下所示核酸序列编码的多肽:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、
SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ 
ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ 
ID NO:18、SEQ ID NO:19、SEQ ID NO:20,或与其具有至少70%序列同一性的功能同源物。
优选具有环氧化物水解酶活性的酶催化从环氧化物和水产生乙二醇。具有环氧化物水解酶
活性的酶的非限制性实例包括罗汉果环氧化物水解酶1和罗汉果环氧化物水解酶2。因此,
具有环氧化物水解酶活性的酶可以包含与SEQ ID NO:38所示的氨基酸序列具有至少75%
序列同一性的多肽、与SEQ ID NO:40所示的氨基酸序列具有至少65%序列同一性的多肽,
及其功能同源物。
[0149] 在一些实施方案中,从11‑羟基‑24,25环氧葫芦二烯醇产生罗汉果醇。能够催化11‑羟基‑24,25环氧葫芦二烯醇的转化以形成罗汉果醇的一种或更多种酶优选包含具有环
氧化物水解酶活性的酶。参见图2B和2C的步骤G。具有环氧化物水解酶活性的酶的实例包括
如上所述的罗汉果环氧化物水解酶1和罗汉果环氧化物水解酶2。在一些实施方案中,能够
催化11‑羟基‑24,25环氧葫芦二烯醇的转化以产生罗汉果醇的酶包含与SEQ ID NO:38所示
的氨基酸序列具有至少75%序列同一性的多肽、与SEQ ID NO:40所示的氨基酸序列具有至
少65%序列同一性的多肽,及其功能同源物。
[0150] 在一些实施方案中,CYP1798(SEQ ID NO:5,SEQ ID NO:73,SEQ ID NO:74)催化葫芦二烯醇、11‑羟基‑葫芦二烯醇或11‑氧代‑葫芦二烯醇之24‑25碳双键的环氧化。图9A和9B
是从葫芦二烯醇产生罗汉果醇和11‑氧代‑罗汉果醇的示意图,而图9C是从氧化角鲨烯产生
罗汉果醇和11‑氧代‑罗汉果醇的示意图。另参见实施例15。
[0151] 能够催化罗汉果醇糖基化的一种或更多种酶优选包含尿苷‑5′‑二磷酸(UDP)依赖性葡糖基转移酶(UGT)。UGT可以催化产生罗汉果苷但不限于以下:罗汉果苷I A1、罗汉果苷
I E1、罗汉果苷II A、罗汉果苷II A1、罗汉果苷II A2、罗汉果苷II E、罗汉果苷III A1、罗
汉果苷III A2、罗汉果苷III、罗汉果苷III E、罗汉果苷IV、罗汉果苷IV A或赛门苷.这样的
UGT可以包含例如SEQ ID NO:21的拟南芥UGT73C3、SEQ ID NO:23的拟南芥UGT73C6、SEQ ID 
NO:25的甜叶菊(Stevia rebaudiana)UGT85C2、SEQ ID NO:22的拟南芥UGT73C5、SEQ ID 
NO:24的甜叶菊UGT73E1,或与上述UGT具有至少70%同一性的功能同源物.UGT还可以包含
SEQ ID NO:53的UGT98、由SEQ ID NO:27编码的UGT1495、由SEQ ID NO:28编码的UGT1817、
由SEQ ID NO:30编码的UGT5914、由SEQ ID NO:31编码的UGT8468、由SEQ ID NO:32编码的
UGT10391,或上述任何UGT的功能同源物。参见实施例4和7。
[0152] UGT73C3、UGT73C6、UGT85C2和UGT73E1能够在罗汉果醇或罗汉果苷的C24位催化糖基化.因此,在本发明的一些方法中(其中待产生的罗汉果苷包含在C24位的糖基化),至少
一个UGT可以是SEQ ID NO:21的UGT73C3、SEQ ID NO:23的UGT73C6、SEQ ID NO:25的
UGT85C2、SEQ ID NO:24的UGT73E1,或与上述UGT具有至少70%同一性的功能同源物。参见
实施例4。
[0153] UGT73C5能够在罗汉果醇和罗汉果苷的C3‑OH和C24位两者处催化糖基化。因此,在本发明的一些方法中(其中待产生的罗汉果苷包含在C24位的糖基化和/或在C3‑OH位的糖
基化),至少一个UGT可以是SEQ ID NO:22的UGT73C5或与其具有至少60%序列同一性的功
能同源物.参见实施例4。
[0154] 在一些实施方案中,UGT是SEQ ID NO:48的UGT1576或与SEQ ID NO:48的UGT1576具有至少60%序列同一性的UGT。在一些实施方案中,UGT1576具有罗汉果醇C24‑OH UDP‑糖
基转移酶活性。参见实施例11。
[0155] 在一些实施方案中,UGT是SEQ ID NO:53的UGT98或与其具有至少70%序列同一性的功能同源物。特别是在本发明的一些实施方案中,待产生的罗汉果苷包含C‑24位处葡萄
糖的1,2‑糖基化和1,6‑糖基化以形成罗汉果苷III A1。参见实施例11。在一些实施方案中,
UGT98(SEQ ID NO:53)可以用于将罗汉果苷II E转化成罗汉果苷IV、罗汉果苷V、11‑氧代‑
罗汉果苷V和/或赛门苷I。参见实施例7。
[0156] 在一些实施方案中,例如在其中待产生的罗汉果苷包含C‑24位处葡萄糖的1,2糖基化以形成罗汉果苷IIA的实施方案中,UGT是SEQ ID NO:50的UGTSK98或与SEQ ID NO:50
的UGTSK98具有至少70%同一性的UGT.参见实施例11。在某些方面中,UGT98催化1,2和1,6
葡萄糖连接以将罗汉果苷II E转化成罗汉果苷V。参见实施例14.
[0157] 在一些实施方案中,UGT是罗汉果UGT430(SEQ ID NO:61,SEQ ID NO:62)。UGT430是UGT家族85A的成员,并且其将罗汉果醇和特定罗汉果苷的3C位糖基化.参见实施例12。
[0158] 在一些实施方案中,UGT是罗汉果UGT1697(SEQ ID NO:67,SEQ ID NO:68)。UGT1697是UGT家族85A的成员,并且将罗汉果醇和特定罗汉果苷3C和24C位糖基化.参见实
施例13。
[0159] 在一些实施方案中,UGT是罗汉果UGT11789(SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:72).UGT11789催化罗汉果苷化合物24‑O‑葡萄糖和/或3‑O‑葡萄糖上的
1,2和/或1,6葡萄糖连接。在一些实施方案中,UGT11789将罗汉果苷I E1、罗汉果苷I A1、罗
汉果苷II E、罗汉果苷II A、罗汉果苷III E、罗汉果苷III A2、罗汉果苷III、罗汉果苷IV或
赛门苷糖基化。在一些实施方案中,将UGT11789与罗汉果苷I E1、罗汉果苷I A1、罗汉果苷
II E、罗汉果苷II A、罗汉果苷III E、罗汉果苷III A2、罗汉果苷III、罗汉果苷IV或赛门苷
接触,产生罗汉果苷II A1、罗汉果苷II A2、罗汉果苷III、罗汉果苷III A1、罗汉果苷III 
A2、罗汉果苷IV、罗汉果苷IV A、赛门苷或罗汉果苷V。参见实施例14。
[0160] 体内产生罗汉果苷的方法
[0161] 在一些实施方案中,通过宿主(其表达编码参与罗汉果苷途径的一种或更多种酶的一种或更多种核酸分子)在体内产生罗汉果醇前体、罗汉果醇或罗汉果苷。例如,这样的
氧化角鲨烯产生重组宿主可以在体内产生罗汉果醇前体、罗汉果醇或罗汉果苷,所述宿主
表达一种或更多种编码葫芦二烯醇合酶多肽的基因、编码细胞色素P450多肽的基因、编码
细胞色素P450还原酶多肽的基因、编码环氧化物水解酶多肽的基因和编码UGT多肽的基因。
参见实施例15和16。
[0162] 在一些实施方案中,使用多于一种宿主来产生罗汉果醇前体、罗汉果醇或罗汉果苷。在一个非限制性实例中,可以使用能够产生罗汉果醇的宿主和表达UGT的宿主来产生罗
汉果苷。所述方法还可以使用重组和非重组宿主的混合。在包括使用两种或更多种宿主的
实施方案中,可以共培养或分别培养宿主。如果分别培养宿主,则可以回收中间产物并任选
地将中间产物纯化或部分纯化,并使用中间产物作为底物加入重组宿主。合适的重组宿主
如下所述。
[0163] 在一些方面中,如下所述,可以在体内进行罗汉果醇前体、罗汉果醇或罗汉果苷的产生,并且可以将罗汉果醇前体、罗汉果醇或罗汉果苷产物用作底物以用于随后在体外进
行的反应。参见WO 2013/076577和WO2014/086842。
[0164] 在一些实施方案中,宿主通过麦角固醇途径从葡萄糖产生氧化角鲨烯。参见例如WO 2014/0027118。在一些方面中,表达编码角鲨烯合酶多肽的核酸分子的宿主可以产生角
鲨烯。在一些实施方案中,角鲨烯合酶是ERG9,ERG9的氨基酸序列如SEQ ID NO:87所示。在
一些实施方案中,角鲨烯合酶对于宿主是内源的。在一些实施方案中,内源角鲨烯合酶和/
或角鲨烯环氧酶拷贝数的增加、编码角鲨烯合酶和/或角鲨烯环氧酶的异源核酸分子的表
达,或者内源角鲨烯合酶和/或角鲨烯环氧酶的表达提高可以改善在重组宿主中产生的罗
汉果苷的水平。
[0165] 在一个实施方案中,重组宿主包含编码角鲨烯环氧酶的异源核酸,其有效地连接于引导宿主中角鲨烯环氧酶高表达的序列.因此,角鲨烯环氧酶对于重组宿主可以是内源
性的,但可以通过编码角鲨烯环氧酶的核酸的额外拷贝和/或通过使用更强的启动子来提
高表达水平。
[0166] 氧化角鲨烯充当产生羊毛甾醇的底物。因此,在一些实施方案中,通过降低羊毛甾醇合酶活性可以提高氧化角鲨烯的水平。在表达内源羊毛甾醇合酶的重组宿主中,这可以
通过用引导较低水平羊毛甾醇合酶表达的较弱启动子代替羊毛甾醇合酶的内源启动子引
导的表达来实现。在酵母中,ERG7基因编码羊毛甾醇合酶。因此,当重组宿主是酵母时,ERG7
基因启动子可以被替换为另一个启动子,后者引导的表达水平低于ERG7的内源表达水平。
因此,羊毛甾醇合酶可以是酿酒酵母的ERG7基因的产物(其序列在本文中提供为SEQ ID 
NO:55),或与其具有至少50%序列同一性的功能同源物。参见实施例8和15。
[0167] 此外,表达酶3‑羟基‑3‑甲基戊二酰‑辅酶A还原酶(tHMG1,SEQ ID NO:77,SEQ ID NO:78)的截短形式也可以导致氧化角鲨烯的水平提高。在Donald等,1997,
Appl.Environ.Microbiol.63:3341‑4中描述了一种可用的截短形式的酵母HMG还原酶
(tHMG1)。
[0168] 可以通过角鲨烯环氧酶的高表达来提高环氧角鲨烯水平。角鲨烯环氧酶可以是酿酒酵母ERG1基因的产物.因此,角鲨烯环氧酶可以是SEQ ID NO:54的多肽或与其具有至少
45%序列同一性的功能同源物。还可以通过降低羊毛甾醇合酶活性来提高环氧角鲨烯的水
平.还可以通过表达截短形式的3‑羟基‑3‑甲基戊二酰‑辅酶A还原酶(tHMG1,SEQ ID NO:
77,SEQ ID NO:78)来提高环氧角鲨烯的水平。参见实施例8和15。
[0169] 在一些实施方案中,可通过至少一种CYP活化剂辅助葫芦二烯醇的羟基化以形成11‑羟基‑葫芦二烯醇,或辅助24,25环氧葫芦二烯醇的羟基化以形成11‑羟基‑24,25环氧葫
芦二烯醇。重组宿主可以共表达编码一种或更多种细胞色素P450酶的异源核酸和编码CYP
活化剂的异源核酸.CYP活化剂可以是例如CPR4497(SEQ ID NO:45,SEQ ID NO:46)或与SEQ 
ID NO:46具有至少50%序列同一性的功能同源物。参见实施例10、15和16.
[0170] 在一些实施方案中,由共表达罗汉果CYP5491(SEQ ID NO:14,SEQ ID NO:44)、罗汉果CYP1798(SEQ ID NO:5,SEQ ID NO:73,SEQ ID NO:74)、罗汉果CPR4497(SEQ ID NO:
45,SEQ ID NO:46)和环氧化物水解酶的葫芦二烯醇产生酿酒酵母菌株产生罗汉果醇。在一
些实施方案中,环氧化物水解酶是环氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:40)。在一
些实施方案中,葫芦二烯醇产生酿酒酵母菌株还过表达由ERG1编码的角鲨烯环氧酶(SEQ 
ID NO:54),表达截短的HMG还原酶(tHMG1,SEQ ID NO:77,SEQ ID NO:78),表达罗汉果葫芦
二烯醇合酶(SEQ ID NO:42,SEQ ID NO:43),其缺失TRP1基因,并且包含被破坏的内源ERG7
基因的启动子(SEQ ID NO:55).参见实施例15。
[0171] 在一些实施方案中,在这样的重组宿主中产生罗汉果醇前体、罗汉果醇或罗汉果苷,所述宿主包含一种或更多种编码角鲨烯环氧酶多肽的基因、编码葫芦二烯醇合酶多肽
的基因、编码细胞色素P450多肽的基因、编码细胞色素P450还原酶多肽的基因、编码环氧化
物水解酶多肽的基因和/或编码糖基转移酶的基因。在一些方面中,编码糖基转移酶的基因
包含编码与SEQ ID NO:48所示的氨基酸序列具有60%或更高同一性的UGT1576多肽的基
因、编码与SEQ ID NO:62所示的氨基酸序列具有45%或更高同一性的UGT430多肽的基因、
编码与SEQ ID NO:68所示的氨基酸序列具有45%或更高同一性的UGT1697多肽的基因、编
码与SEQ ID NO:72所示的氨基酸序列具有50%或更高同一性的UGT11789多肽的基因,和/
或编码与SEQ ID NO:53所示的氨基酸序列具有70%或更高同一性的UGT98多肽的基因。参
见实施例16。
[0172] 在一些实施方案中,在这样的酿酒酵母菌株中产生罗汉果苷V,所述菌株包含:罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID NO:43)、CYP5491(SEQ ID NO:81,SEQ ID NO:
44)、CYP1798(SEQ ID NO:5,SEQ ID NO:74)、CYP1798‑II(SEQ ID NO:86,SEQ ID NO:74)、
CPR4497(SEQ ID NO:82,SEQ ID NO:46)、环氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:
40)、UGT1576(SEQ ID NO:83,SEQ ID NO:48)、UGT430(SEQ ID NO:84,SEQ ID NO:62)、
UGT1697(SEQ ID NO:85,SEQ ID NO:68)、UGT98(SEQ ID NO:52,SEQ ID NO:53)和UGT11789
(SEQ ID NO:71,SEQ ID NO:72)。在一些实施方案中,所述菌株是具有酿酒酵母EXG1基因缺
失的酿酒酵母288C的Matα衍生物。在一些实施方案中,所述宿主还产生罗汉果苷IVA、罗汉
果苷II A2、罗汉果苷I E1和罗汉果醇。参见实施例16。
[0173] 在体外产生罗汉果苷的方法
[0174] 在一些实施方案中,通过在体外将罗汉果醇前体、罗汉果醇或糖基化罗汉果醇与参与罗汉果苷途径的一种或更多种酶接触来产生罗汉果苷。例如,将罗汉果醇与UGT多肽接
触可导致在体外产生罗汉果苷。在一些实施方案中,通过在体外将上游罗汉果苷前体与参
与罗汉果苷途径的一种或更多种酶接触来产生罗汉果醇前体。例如,将葫芦二烯醇与细胞
色素P450多肽和环氧化物水解酶接触可导致在体外产生罗汉果醇。
[0175] 在一些实施方案中,通过一个或更多个以下步骤产生罗汉果醇前体:
[0176] a.将氧化角鲨烯与葫芦二烯醇合酶(例如但不限于与SEQ ID NO:43所示的氨基酸序列具有70%或更高同一性的葫芦二烯醇合酶)接触,以产生葫芦二烯醇(参见图2B和2C的
步骤A);或者
[0177] b.将环氧角鲨烯与葫芦二烯醇合酶(例如但不限于与SEQ ID NO:43所示的氨基酸序列具有70%或更高同一性的葫芦二烯醇合酶)接触,以产生24,25环氧葫芦二烯醇(参见
图2B和2C的步骤B);或者
[0178] c.将葫芦二烯醇与细胞色素P450(例如但不限于与SEQ ID NO:44所示的氨基酸序列具有50%或更高同一性的CYP5491)接触,以产生11‑羟基‑葫芦二烯醇(参见图2B和2C的
步骤C);或者
[0179] d.将24,25环氧葫芦二烯醇与细胞色素P450(例如但不限于与SEQ ID NO:44所示的氨基酸序列具有50%或更高同一性的CYP5491)接触,以产生11‑羟基‑24,25环氧葫芦二
烯醇(参见图2B和2C的步骤D);或者
[0180] e.将葫芦二烯醇与细胞色素P450(例如但不限于与SEQ ID NO:74所示的氨基酸序列具有70%或更高同一性的CYP1798)接触,以产生24,25环氧葫芦二烯醇(参见图2B和2C的
步骤E);或者
[0181] f.将11‑羟基‑葫芦二烯醇与细胞色素P450(例如但不限于与SEQ ID NO:74所示的氨基酸序列具有70%或更高同一性的CYP1798)接触,以产生11‑羟基‑24,25环氧葫芦二烯
醇(参见图2B和2C的步骤F)。
[0182] 在一些实施方案中,通过在体外将11‑羟基‑24,25环氧葫芦二烯醇与环氧化物水解酶接触以产生罗汉果醇,所述环氧化物水解酶例如但不限于与SEQ ID NO:38所示的氨基
酸序列具有75%或更高同一性的环氧化物水解酶1,或者与SEQ ID NO:40所示的氨基酸序
列具有65%或更高同一性的环氧化物水解酶2(参见图2B和2C的步骤G).
[0183] 在一些实施方案中,如下在体外产生罗汉果苷(参见图2B和2C的步骤H):
[0184] a.将罗汉果醇与UGT73C3(SEQ ID NO:21)、UGT73C6(SEQ ID NO:23)、UGT85C2(SEQ ID NO:25)和/或UGT1576(SEQ ID NO:48)接触以产生罗汉果苷I A1;或者
[0185] b.将罗汉果醇与UGT73C5(SEQ ID NO:22)接触以产生罗汉果苷I E1和/或罗汉果苷I A1;或者
[0186] c.将罗汉果醇与UGT73E1(SEQ ID NO:24)接触以产生罗汉果苷1A1和/或在C11‑OH上糖基化的罗汉果苷;或者
[0187] d.将罗汉果醇与UGT430(SEQ ID NO:62)接触以产生罗汉果苷I E1;或者
[0188] e.将罗汉果醇与UGT1697(SEQ ID NO:68)接触以产生罗汉果苷II E1和/或罗汉果苷I A1;或者
[0189] f.将罗汉果苷I A1与UGT98(SEQ ID NO:53)、UGTSK98(SEQ ID NO:50)和/或UGT11789(SEQ ID NO:72)接触以产生罗汉果苷IIA;或者
[0190] g.将罗汉果苷I A1与UGT430(SEQ ID NO:62)接触以产生罗汉果苷II E;或者
[0191] h.将罗汉果苷I A1与UGT98(SEQ ID NO:53)和/或UGT11789(SEQ ID NO:72)接触以产生罗汉果苷III A1;或者
[0192] i.将罗汉果苷I E1与UGT1576(SEQ ID NO:48)和/或UGT1697(SEQ ID NO:68)接触以产生罗汉果苷II E;或者
[0193] j.将罗汉果苷II A与UGT98(SEQ ID NO:53)和/或UGT11789(SEQ ID NO:72)接触以产生罗汉果苷III A1;或者
[0194] k.将罗汉果苷II E与UGT98(SEQ ID NO:62)和/或UGT11789(SEQ ID NO:72)接触以产生罗汉果苷III A1、罗汉果苷III A2、罗汉果苷III E、罗汉果苷III、罗汉果苷IV A、罗
汉果苷IV、赛门苷或罗汉果苷V;或者
[0195] l.将罗汉果苷III A1与UGT73C5(SEQ ID NO:22)接触以产生赛门苷1;或者
[0196] m.将赛门苷1与UGT98(SEQ ID NO:53)和/或UGT11789(SEQ ID NO:72)接触以产生罗汉果苷V。
[0197] 可以分别进行上述每个步骤。在一些实施方案中(其中分开进行至少两个步骤),步骤的产物可以在进行后续步骤之前纯化或部分纯化。或者,可以在同一混合物内同时进
行一个或更多个步骤。
[0198] 在一些实施方案中,从表达以下一种或更多种基因的宿主制备细胞裂解物:编码角鲨烯环氧酶多肽的基因、编码葫芦二烯醇合酶多肽的基因、编码细胞色素P450多肽的基
因、编码环氧化物水解酶多肽的基因和编码UGT多肽的基因。例如,可以从表达一种或更多
种UGT的宿主制备细胞裂解物并将其用于接触罗汉果醇,以使得可以在体外产生罗汉果苷。
[0199] 通过全细胞生物转化产生罗汉果苷的方法
[0200] 在一些实施方案中,通过全细胞生物转化产生罗汉果醇前体、罗汉果醇或罗汉果苷。为了进行全细胞生物转化,使表达参与罗汉果苷途径的一种或更多种酶的宿主吸收并
修饰细胞中的罗汉果醇或罗汉果苷前体;在体内修饰后,将罗汉果苷分泌到培养基中。参见
实施例11‑14。
[0201] 在一些实施方案中,罗汉果醇前体是氧化角鲨烯、环氧角鲨烯、葫芦二烯醇、24,25环氧葫芦二烯醇,而罗汉果苷前体是罗汉果醇。在全细胞生物转化的非限制性实例中,表达
编码UGT多肽之基因的宿主可以在细胞中摄取罗汉果醇并糖基化罗汉果醇;在体内糖基化
后,将罗汉果苷分泌到培养基中。
[0202] 在细胞生长期间或细胞生长后,可以向细胞供给罗汉果醇前体或罗汉果苷前体.细胞可以处于悬浮或固定。细胞可以在发酵液或反应缓冲液中.在一些实施方案中,使用透
化剂以将罗汉果醇前体或罗汉果苷前体转移到细胞中。在一些实施方案中,可以以纯化形
式或者作为组合物或提取物的一部分提供罗汉果醇前体或罗汉果苷前体。
[0203] 在一些方面中,在体外产生罗汉果醇前体或罗汉果苷前体;此后,将罗汉果醇前体或罗汉果苷前体提供给能够催化罗汉果醇前体或罗汉果苷前体转化的宿主。
[0204] 在一些实施方案中,表达UGT98、UGT1576和UGT430的重组宿主将所供给的罗汉果醇转化为罗汉果苷V.参见实施例14。在一些实施方案中,表达UGT11789的宿主催化罗汉果
苷II E转化为三糖基化罗汉果苷。在一些实施方案中,表达UGT11789、UGT1576和UGT430的
宿主催化罗汉果醇转化为三糖基化罗汉果苷。在一些实施方案中,共表达UGT11789、UGT98、
UGT1576和UGT430的重组宿主比表达UGT98、UGT1576和UGT430的重组宿主更有效地将所供
给的罗汉果醇转化为罗汉果苷V。参见实施例14。
[0205] 重组基因和功能同源物
[0206] 术语“重组基因”是指引入接受者宿主的基因或DNA序列,不管相同或相似的基因或DNA序列是否可能已经存在于这样的宿主中。在本上下文中,“引入”或“增加”在本领域中
已知是指人工(by the hand of man)引入或增加。因此,重组基因可以是来自另一物种的
DNA序列,或者可以是源自或存在于相同物种但已通过重组方法并入宿主以形成重组宿主
的DNA序列。应当理解,引入宿主的重组基因可以与正常存在于被转化宿主中的DNA序列相
同,并且被引入以提供所述DNA的一个或更多个另外的拷贝,从而允许该DNA基因产物的过
表达或经修饰表达。在一个优选的实施方案中,DNA是在细胞中产生的基因mRNA转录物的
cDNA拷贝。
[0207] 在一些实施方案中,本文所述的多肽的编码序列(例如UGT多肽的编码序列)是异源序列。短语“异源序列”和“异源编码序列”用于描述来自重组宿主以外的物种的序列.在
一些实施方案中,重组宿主是酿酒酵母细胞,异源序列来自酿酒酵母以外的生物体。异源编
码序列例如可以来自原核微生物、真核微生物、植物、动物、昆虫或不同于表达异源序列的
重组宿主的真菌.在一些实施方案中,编码序列是对宿主天然的序列。
[0208] 在本发明的一些方面中,角鲨烯环氧酶多肽、葫芦二烯醇合酶多肽、细胞色素P450多肽、细胞色素P450还原酶多肽、环氧化物水解酶多肽,和/或糖基转移酶多肽是融合蛋白。
在一些实施方案中,角鲨烯环氧酶多肽(包括但不限于SEQ ID NO:54的角鲨烯环氧酶多
肽)、葫芦二烯醇合酶多肽(包括但不限于SEQ ID NO:43的葫芦二烯醇合酶多肽)、细胞色素
P450多肽(包括但不限于SEQ ID NO:44的CYP5491多肽)、细胞色素P450还原酶多肽(包括但
不限于SEQ ID NO:46的CPR4497多肽)、环氧化物水解酶多肽(包括但不限于SEQ ID NO:38
的EH1多肽或SEQ ID NO:40的EH2多肽)和/或UGT多肽(包括但不限于SEQ ID NO:48的
UGT1576,SEQ ID NO:62的UGT430,SEQ ID NO:68的UGT1697,SEQ ID NO:72的UGT11789,SEQ 
ID NO:53的UGT98,或SEQ ID NO:50的UGTSK98)是融合多肽。术语“嵌合体”、“融合多肽”、
“融合蛋白”、“融合酶”、“嵌合蛋白”、“嵌合多肽”和“嵌合酶”在本文中可互换使用,是指通
过连接编码不同蛋白质的两种或更多种基因而改造的蛋白质.在一些实施方案中,编码角
鲨烯环氧酶多肽、葫芦二烯醇合酶多肽、细胞色素P450多肽、细胞色素P450还原酶多肽、环
氧化物水解酶多肽和/或糖基转移酶多肽的核酸序列包含编码“标签”的标签序列,其被设
计成辅助对所编码多肽的随后的操作(例如,辅助纯化或检测)、分泌或定位.标签序列可插
入编码多肽的核酸序列中,以使得所编码标签位于多肽的羧基或氨基末端。所编码标签的
非限制性实例包括绿色荧光蛋白(GFP)、人流感血凝素(HA)、谷胱甘肽S转移酶(GST)、多组
TM
氨酸标签(HIS标签)和Flag 标签(Kodak,New Haven,CT)。标签的其他实例包括叶绿体转运
肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。
[0209] 在一些实施方案中,融合蛋白是通过域交换而改变的蛋白质。如本文所用的术语“域交换”用于描述用第二蛋白质的结构域替换第一蛋白质的结构域的过程。在一些实施方
案中,第一蛋白质的结构域和第二蛋白质的结构域在功能上是相同的或功能上相似。在一
些实施方案中,第二蛋白质结构域的结构和/或序列与第一蛋白质结构域的结构和/或序列
不同。在一些实施方案中,通过域交换改变细胞色素P450还原酶多肽。例如,在一些方面中,
CPR4497(SEQ ID NO:46)的细胞色素P450结构域或还原酶结构域被CPR4497(SEQ ID NO:
46)以外的细胞色素P450结构域或细胞色素P450还原酶的还原酶结构域所代替。在另一些
方面中,通过域交换来改变UGT多肽。
[0210] 上述多肽的功能同源物也适用于在重组宿主中产生甜菊醇糖苷。功能同源物是与参照多肽具有序列相似性并且执行参照多肽的一种或更多种生化或生理功能的多肽。功能
同源物和参照多肽可以是天然存在的多肽,并且序列相似性可以归因于收敛或发散的演化
事件。因此,功能同源物有时在文献中指定为同源物、或直系同源物或旁系同源物.天然存
在的功能同源物的变体(例如由野生型编码序列的突变体编码的多肽)本身可以是功能同
源物。还可以通过对多肽编码序列的定点诱变,或通过组合来自不同天然存在多肽的编码
序列的结构域(“域交换”)来产生功能同源物。用于修饰编码本文所述功能性多肽的基因的
技术是已知的,并且尤其包括定向演化技术,定点诱变技术和随机诱变技术,并且可用于增
加多肽的比活性、改变底物特异性、改变表达水平、改变亚细胞定位或以期望的方式修饰多
肽‑多肽相互作用。这种经修饰的多肽被认为是功能同源物.术语“功能同源物”有时应用于
编码功能同源多肽的核酸.
[0211] 功能同源物可以通过分析核苷酸和多肽序列比对来鉴定。例如,对核苷酸或多肽序列的数据库进行查询可以鉴定甜菊醇糖苷生物合成多肽的同源物。序列分析可以涉及使
用UGT氨基酸序列作为参照序列的非冗余数据库的BLAST、交互BLAST或PSI‑BLAST分析。在
某些情况下,氨基酸序列是从核苷酸序列推导的。数据库中那些具有大于40%序列同一性
的多肽是进一步评估其作为甜菊醇糖苷生物合成多肽的适用性的候选物.氨基酸序列相似
性允许进行保守氨基酸替换,例如以一个疏水性残基替换另一个疏水性残基,或以一个极
性残基替换另一个极性残基。如果需要,可以对这些候选物进行手动检查,以缩小待进一步
评估的候选物数目。可以通过选择那些似乎具有存在于甜菊醇糖苷生物合成多肽中的结构
域(例如保守功能结构域)的候选物来进行手动检查。
[0212] 可以通过在甜菊醇糖苷生物合成多肽的一级氨基酸序列内定位这样的区域来鉴定保守区,其为重复序列,形成一些二级结构(例如螺旋和β片层),建立带正电或带负电的
结构域,或代表蛋白质基序或结构域。参见例如在万维网上描述多种蛋白质基序和结构域
的共有序列的Pfam网站,sanger.ac.uk/Software/Pfam/和pfam.janelia.org/。包括在
Pfam数据库中的信息在Sonnhammer等,Nucl.Acids Res.,26:320‑322(1998);Sonnhammer
等,Proteins,28:405‑420(1997);和Bateman等,Nucl.Acids Res.,27:260‑262(1999)中描
述。保守区也可以通过对来自密切相关物种的相同或相关多肽的序列进行比对来确定.密
切相关的物种优选来自同一科。在一些实施方案中,对来自两种不同物种的序列比对足以
鉴定此类同源物。
[0213] 通常,表现出至少约40%氨基酸序列同一性的多肽可用于鉴定保守区。相关多肽的保守区表现出至少45%的氨基酸序列同一性(例如至少50%,至少60%,至少70%,至少
80%,或至少90%的氨基酸序列同一性).在一些实施方案中,保守区表现出至少92%、
94%、96%、98%或99%的氨基酸序列同一性。
[0214] 重组宿主
[0215] 下文所述的重组宿主可用于产生罗汉果醇前体、罗汉果醇或罗汉果苷的方法。例如,如果重组宿主是微生物,则该方法可以包括在这样的条件下在培养基中培养重组微生
物,其中表达一种或更多种催化本发明方法步骤的酶(例如合酶、水解酶、CYP450和/或
UGT)。在本文的上下文中,术语“微生物”和“微生物宿主”和“重组宿主”可以互换使用来表
示微观生物体,包括细菌或微观真菌,包括酵母。微生物可以是但不限于真核细胞或永生化
细胞.
[0216] 示例性的原核和真核物种在下文中更详细地描述。然而,应当理解,其他物种也是合适的。例如,合适的物种可以是这样的属,包括伞菌属(Agaricus)、曲霉属
(Aspergillus)、芽孢杆菌属(Bacillus)、假丝酵母属(Candida)、棒杆菌属
(Corynebacterium)、埃希氏菌属(Escherichia)、镰孢菌(Fusarium)/赤霉属
(Gibberella)、克鲁维酵母属(Kluyveromyce)、硫磺菌属(Laetiporus)、香菇属
(Lentinus)、红发夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤酵母属(Pichia)、
藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母属
(Schizosaccharomyces)、痂圆孢属(Sphaceloma)、红发夫酵母属(Xanthophyllomyces)和
耶氏酵母属(Yarrowia)。来自这些属的示例性物种包括虎皮香菇(Lentinus tigrinus)、硫
磺菌(Laetiporus sulphureus)、黄孢原毛平革菌(Phanerochaete chrysosporium)、巴斯
德毕赤酵母(Pichia  pastoris)、小立碗藓(Physcomitrella patens)、粘红酵母
(Rhodoturula glutinis)32、胶红酵母(Rhodoturula mucilaginosa)、红发夫酵母
(Phaffia rhodozyma)UBV‑AX、红发夫酵母(Xanthophyllomyces dendrorhous)、藤仓镰刀
菌(Fusarium fujikuroi)/腾仓赤霉(Gibberella fujikuroi)、产朊假丝酵母(Candida 
utilis)和解脂耶氏酵母。在一些实施方案中,微生物可以是子囊菌(Ascomycete),例如腾
仓赤霉、乳酸克鲁维酵母、粟酒裂殖酵母、黑曲霉(Aspergillus niger)或酿酒酵母。在一些
实施方案中,微生物可以是原核生物,例如大肠杆菌(Escherichia coli)、类球红细菌
(Rhodobacter sphaeroides)或荚膜红细菌(Rhodobacter capsulatus).应当理解,可以使
用某些微生物以高通量方式筛选和测试目的基因,而使用具有所需生产力或生长特性的其
他微生物以大规模生产罗汉果醇前体、罗汉果醇或罗汉果苷。
[0217] 在本发明的某些实施方案中,微生物包括但不限于酿酒酵母(S.cerevisiae)、黑曲霉(A.niger)、米曲霉(A.oryzae)、大肠杆菌(E.coli)、乳酸乳球菌(L.lactis)和枯草芽
孢杆菌(B.subtilis)。本发明提供的经构建和经遗传改造的微生物可以使用常规发酵方法
培养,尤其包括恒化器、分批、补料分批培养、持续灌注发酵和持续灌注细胞培养。
[0218] 包含细菌细胞的示例性实施方案包括但不限于,属于芽孢杆菌属、埃希氏菌属、乳杆菌属、乳杆菌属、棒杆菌属(Corynebaclerium)、醋杆菌属、不动杆菌属或假单胞菌属的物
种细胞。
[0219] 微生物可以是真菌,更具体地,属于曲霉属的丝状真菌,例如黑曲霉、泡盛曲霉(A.awamori)、米曲霉或构巢曲霉(A.nidulans);属于酵母属的酵母,例如酿酒酵母、克鲁弗
酵母(S.kluyveri),贝酵母(S.bayanus)、少孢酵母(S.exiguus)、S.sevazzi或葡萄汁酵母
(S.uvarum);属于克鲁维酵母属的酵母,例如K.laclis、马克斯克鲁维酵母变种
(K.marxianus var.marxianus)或K.thermololerans。属于假丝酵母属的酵母,例如
C.ulilis、C.iropicalis、白假丝酵母、解脂假丝酵母(C.lipolylica)或C.versalilis;属
于毕赤酵母属的酵母,例如R.slipidis、R.pasloris或P.sorbilophila;或者其他酵母属,
例如隐球酵母属(Cryplococcus)、德巴利酵母属(Debaromyces)、汉逊酵母属(Hansenula)、
毕赤酵母属、耶氏酵母属(Yarrowia)、接合酵母属(Zygosaccharomyces)或裂殖酵母属
(Schizosaccharomyces)。关于其他微生物,提供了适当的丝状真菌的非穷尽列表:属于青
霉菌属(Penicillium)、根霉菌属(Rhizopus)、镰刀菌属(Fusarium)、梭链孢菌属
(Fusidium)、赤霉菌属(Gibberella)、毛霉菌属(Mucor)、Morlierella属和木霉菌属
(Trichoderma)的物种。
[0220] 酿酒酵母
[0221] 酿酒酵母是合成生物学中广泛使用的经典生物体,并且可以用作重组微生物平台。存在可用于酿酒酵母的突变体、质粒、代谢的详细计算机模型和其他信息的文库,从而
允许合理设计多种模块以提高产物产量.用于制备重组微生物的方法是已知的。
[0222] 可以使用许多已知的启动子中的任一种在酵母中表达本文所述的基因。超量产生苯丙素类(phenylpropanoids)的菌株是已知的,并且可以用作产生罗汉果醇前体、罗汉果
醇或罗汉果苷的接受分子。
[0223] 曲霉属
[0224] 曲霉属物种(例如米曲霉、黑曲霉和酱油曲霉(A.sojae))是食品生产中广泛使用的微生物,并且还可用作重组微生物平台。构巢曲霉、烟曲霉(A.fumigatus)、米曲霉、棒曲
霉(A.clavatus)、黄曲霉(A.flavus)、黑曲霉和土曲霉(A.terreus)的基因组核苷酸序列均
是可获得的,从而允许合理设计和修饰内源途径以提高通量和提高产物产率。已经开发了
用于曲霉属的代谢模型,以及转录组学研究和蛋白组学研究。黑曲霉被培养用于工业化生
产多种食品成分,例如柠檬酸和葡糖酸,并且因此例如黑曲霉的物种通常适用于产生罗汉
果醇前体、罗汉果醇或罗汉果苷。
[0225] 大肠杆菌
[0226] 大肠杆菌是合成生物学中另一种广泛使用的平台生物体,也可以用作重组微生物平台。与酵母相似,大肠杆菌拥有可供使用的突变体文库、质粒、代谢的详细计算机模型以
及其他信息,从而允许合理设计多种模块以提高产物的产率。可使用与上文针对酵母属所
述的那些类似的方法来制备重组大肠杆菌微生物。
[0227] 伞菌属、赤霉属和平革菌属
[0228] 因为已知伞菌属、赤霉属和平革菌属在培养物中产生大量的赤霉素,所以其可能是有用的。因此,在产生罗汉果醇前体、罗汉果醇或罗汉果苷中用作接受分子的萜烯的前体
已经由内源基因产生。因此,可以将含有用于生物合成萜烯的重组基因的模块从这些属引
入到物种中,而不需要引入其他化合物或途径基因。
[0229] Arxula adeninivorans(Blastobotrys adeninivorans)
[0230] Arxula adeninivorans是具有独特生化特征的二态酵母(其在高至42℃的温度下生长为类似于面包酵母的出芽酵母,高于该阈值时,其以丝状形式生长)。其可在多种底物
上生长,并且可同化硝酸盐。其已成功地应用于产生可以生产天然塑料的菌株或者应用于
开发用于环境样品中之雌激素的生物传感器。
[0231] 解脂耶氏酵母
[0232] 解脂耶氏酵母是二态酵母(参见Arxula adeninivorans)并且属于半子囊菌科(family Hemiascomycetes)。解脂耶氏酵母的整个基因组是已知的。耶氏酵母属物种是需
氧的并且被认为是非致病性的.耶氏酵母在使用疏水性底物(例如烷烃、脂肪酸、油)方面是
高效的,并且可以在糖上生长。它具有很高的工业应用潜力,是一种产油微生物。解脂耶氏
酵母可以将脂质含量积累到其干细胞重量的约40%,并且是用于脂质积累和再活化的模式
生物体.参见例如Nicaud,2012,Yeast 29(10):409‑18;Beopoulos等,2009,Biochimie 91
(6):692‑6;Bankar等,2009,Appl Microbiol Biotechnol.84(5):847‑65。
[0233] 红酵母属(Rhodotorula sp.)
[0234] 红酵母是单细胞的、含色素的酵母。产油的红酵母,粘红酵母已经显示从粗甘油生产脂质和类胡萝卜素(Saenge等,2011,Process Biochemistry46(1):210‑8)。圆红冬孢酵
母(Rhodotorula toruloides)菌株已经显示为用于改善生物质和脂质生产力的高效补料
分批发酵系统(Li等,2007,Enzyme and Microbial Technology 41:312‑7)。
[0235] 圆红冬孢酵母(Rhodosporidium toruloides)
[0236] 圆红冬孢酵母是产油酵母,并且可用于工程化脂质生产途径(参见例如Zhu等,2013,Nature Commun.3:1112;Ageitos等,2011,Applied Microbiology and 
Biotechnology 90(4):1219‑27).
[0237] 博伊丁假丝酵母
[0238] 博伊丁假丝酵母是甲基营养型酵母(其可在甲醇上生长)。与其他的甲基营养型物种(例如多形汉逊酵母和巴斯德毕赤酵母)类似,博伊丁假丝酵母为生产异源蛋白质提供优
异的平台.已报道了分泌型外来蛋白的多克级范围的产率.最近,计算方法IPRO在实验上预
测了将博伊丁假丝酵母木糖还原酶的辅因子特异性从NADPH转化至NADH的突变。参见例如
Mattanovich等,2012,Methods Mol Biol.824:329‑58;Khoury等,2009,Protein Sci.18
(10):2125‑38。
[0239] 多形汉逊酵母(安格斯毕赤酵母,Pichia angusta)
[0240] 多形汉逊酵母是甲基营养型酵母(参见,博伊丁假丝酵母)。其还可在多种其他底物上生长;其耐热并且可以同化硝酸盐(另参见乳酸克鲁维酵母)。多形汉逊酵母已被应用
于生产乙型肝炎疫苗、胰岛素和用于治疗丙型肝炎的干扰素α‑2a,还用于一系列技术酶。参
见例如Xu等,2014,Virol Sin.29(6):403‑9。
[0241] 乳酸克鲁维酵母
[0242] 乳酸克鲁维酵母是常规地应用于生产克非尔(kefir)的酵母。其可在数种糖上生长,最重要的是可在存在于乳和乳清中的乳糖上生长。乳酸克鲁维酵母已被成功地应用于
生产凝乳酶(通常存在于牛的胃中的一种酶)等以生产奶酪。生产以40,000L的规模在发酵
罐中进行。参见例如van Ooyen等,2006,FEMS Yeast Res.6(3):381‑92。
[0243] 巴斯德毕赤酵母
[0244] 巴斯德毕赤酵母是甲基营养型酵母(参见博伊丁假丝酵母和多形汉逊酵母)。巴斯德毕赤酵母为外来蛋白质的生产提供有效的平台。平台元件可作为试剂盒获得并且在世界
范围内在学术界中被用于生产蛋白质。已将菌株改造成可生产复杂的人N‑多糖(酵母多糖
与在人中发现的那些类似但不相同)。参见例如Piirainen等,2014,N Biotechnol.31(6):
532‑7。
[0245] 小立碗藓属(Physcomitrella spp.)
[0246] 小立碗藓苔藓(Physcomitrella mosse)在悬浮培养物中生长时具有与酵母或其他真菌培养物相似的特征。该属可用于生产可能难以在其他类型的细胞中生产的植物次级
代谢物。
[0247] 对于本领域技术人员明显的是,能够糖基化罗汉果醇和罗汉果苷的特定UGT之选择过程的细节取决于可选择标志物的身份.在所有情况下的选择促进或允许包含标志物的
细胞的增殖,同时抑制或阻止缺乏标志物的细胞的增殖.如果可选择标志物是抗生素抗性
基因,则可以在存在可选择标志物赋予其抗性之抗生素的条件下培养转染的宿主群体。如
果可选择标志物是补充宿主营养缺陷型的基因,则可以在不存在宿主营养缺陷型之化合物
的情况下培养转染的宿主群体.
[0248] 选择后,可以根据本领域已知的任何合适的方法克隆重组宿主。例如,可以将重组微生物宿主在选择条件下铺在固体培养基上,之后可以挑选单个克隆以用于进一步选择、
表征或使用。该过程可以重复一次或更多次以增强宿主内表达构建体的稳定性。为了产生
罗汉果苷途径多肽,可以培养包含一个或更多个表达载体的重组宿主以在本领域已知的任
何合适的培养装置中扩增细胞数目,例如摇动培养瓶或发酵罐。
[0249] 用于多种重组宿主的培养基是本领域公知的.用于培养重组细菌细胞的培养基将取决于细菌的身份。用于培养重组酵母细胞的培养基将取决于酵母的身份。培养基通常包
含无机盐和化合物、氨基酸、碳水化合物、维生素和对于宿主的生长或者改善宿主的健康或
2+ 2+
生长或者两者必需的其他化合物。特别地,培养基通常包含锰(Mn )和镁(Mg )离子,其是
许多(但不是全部)糖基转移酶的辅因子。
[0250] 如本文所用的术语“补料分批培养”或“半分批培养”可互换使用以指生物技术方法中的这种操作技术:其中在培养期间将一种或更多种营养物(底物)进料(供应)给生物反
应器,并且其中产物保留在生物反应器中直到运行结束。在一些实施方案中,将所有营养物
进料到生物反应器中。
[0251] 在一些实施方案中,可以修饰重组宿主以降低葡聚糖水解酶活性,特别是葡聚糖水解酶活性,其可导致罗汉果苷的去糖基化。因此,重组宿主可以例如被修饰以降低甚至消
除外‑1,3‑β‑葡聚糖水解酶活性。在本发明的一些实施方案中,当重组宿主是酵母时,可以
通过缺失EXG1基因(SEQ ID NO:63,SEQ ID NO:64)和/或EXG2基因(SEQ ID NO:65,SEQ ID 
NO:66)来实现,两者均编码外‑1,3‑β‑葡聚糖水解酶。
[0252] 表2表明了本文使用的序列的身份。
[0253] 表2.本文所使用的序列
[0254]
[0255]
[0256]
[0257]
[0258]
[0259] 将在以下实施例中进一步描述本发明,这些实施例不限制权利要求中描述的本发明的范围。
实施例
[0260] 下面的实施例举例说明了本发明的一些具体实施方案及其多种用途。它们仅用于解释目的,而不应被认为是限制本发明。
[0261] 实施例1:罗汉果苷V的纯化
[0262] 从市售的罗汉果提取物( Swanson)纯化罗汉果苷V。将三瓶(240g)溶于水(900mL)中并加载在HP‑20树脂(400g树脂)柱上.将柱用水(2.5升)洗涤,再用
20%甲醇的水溶液洗涤。将产物用甲醇洗脱。在高真空下溶剂蒸发和干燥后,得到罗汉果苷
V(2.5g)。该产物纯度约为80%,其中11‑氧代罗汉果苷V是最大的杂质。
[0263] 实施例2:从罗汉果苷V酶促合成罗汉果醇
[0264] 将罗汉果苷V(300mg)溶于0.1M乙酸钠缓冲液(pH 4.5,100mL)中,添加来自黑曲霉的粗果胶酶(25mL,Sigma P2736)。将混合物在50℃下搅拌48小时。将反应混合物用乙酸乙
酯(2×100mL)提取。将有机提取物真空干燥,随后用制备型HPLC纯化。得到纯的罗汉果醇
(40mg),通过NMR和质谱法确认其结构。参见图5。
[0265] 实施例3:从罗汉果苷V酶促合成罗汉果醇3‑O‑葡糖苷(罗汉果苷I E1)和罗汉果醇24‑O‑葡糖苷(罗汉果苷I A1)
[0266] 将罗汉果苷V(300mg)溶于0.1M乙酸钠缓冲液(pH 4.5,100mL)中,添加来自黑曲霉的粗果胶酶(25mL,Sigma P2736)。将混合物在50℃下搅拌6.5小时,然后用乙酸乙酯(2×
100mL)提取.将有机提取液真空干燥并用制备型HPLC纯化。得到纯的罗汉果苷I  E1
(11.0mg)和罗汉果苷I A1(8.0mg).通过NMR和质谱法确认其结构.参见图5。
[0267] 实施例4:体外UGT筛选和反应
[0268] 发现UGT73C3(SEQ ID NO:21)、UGT73C5(SEQ ID NO:22)、UGT73C6(SEQ ID NO:23)、UGT73E1(SEQ ID NO:24)和UGT85C2(SEQ ID NO:25)在体外糖基化罗汉果醇。反应混合
物包含4X Tris缓冲液、罗汉果醇(250μM)、UDP‑葡萄糖(750μM)和1%碱性磷酸酶。将5μL每
种部分纯化的UGT酶或粗酶提取物添加至反应,并将反应体积用水加至50μL.将反应物在30
℃孵育过夜,并在灭菌的96孔板中进行反应。随后将25μL的DMSO添加至每个反应,并将反应
板离心5分钟.从每孔中取出40μL样品并过滤以用于LC‑MS分析。
[0269] 发现UGT73C3(SEQ ID NO:21)、UGT73C6(SEQ ID NO:23)和UGT85C2(SEQ ID NO:25)将全部罗汉果醇底物转化为罗汉果苷I A1。UGT73C5(SEQ ID NO:22)产生罗汉果苷I E1
和罗汉果苷I A1两者。UGT73E1(SEQ ID NO:24)将罗汉果醇转化为罗汉果苷1 A1(主要产
物)和既不是罗汉果苷I E1也不是罗汉果苷I A1的糖基化罗汉果醇.该产物由C11‑OH上的
糖基化事件产生;精确质量显示为罗汉果苷I。
[0270] 实施例5:罗汉果葫芦二烯醇合酶
[0271] CirCS基因编码罗汉果中的葫芦二烯醇合酶,并通过用来自西葫芦的葫芦二烯醇合酶查询序列(登录号BAD34645.1,SEQ ID NO:1)对集合数据进行tBLASTn(翻译的核苷酸
数据库)分析,从而鉴定了涵盖所推测的764氨基酸序列中的338个的部分基因序列。在蛋白
质水平上,部分CirCS与西葫芦基因具有97.5%同一性(SEQ ID NO:2;SEQ ID NO:1的残基
515至764)。
[0272] 实施例6:罗汉果基因编码催化从葫芦二烯醇形成罗汉果醇的P450酶
[0273] 为了鉴定催化从葫芦二烯醇形成罗汉果醇的P450酶,使用罗汉果转录物组的重新集合的测序读数来进行tBLASTn(翻译的核苷酸数据库)分析(参见Tang等,BMC Genomics 
12:343(2011))。使用10E‑10或更低的E值来鉴定与数据库查询序列同源的序列。
[0274] 鉴定了18个全长或近全长基因。将集合的基因命名为CYP533、CYP937、CYP1798、CYP1994、CYP2048、CYP2740、CYP3404、CYP3968、CYP4112、CYP4149、CYP4491、CYP5491、
CYP6479、CYP7604、CYP8224、CYP8728、CYP10020和CYP10285(参见表2,SEQ ID NO:3‑20)。
[0275] 将CYP533(SEQ ID NO:3)、CYP937(SEQ ID NO:4)、CYP1798(SEQ ID NO:5)、CYP1994(SEQ ID NO:6)、CYP2740(SEQ ID NO:8)、CYP4112(SEQ ID NO:11)、CYP4149(SEQ 
ID NO:12)、CYP4491(SEQ ID NO:13)、CYP5491(SEQ ID NO:14、SEQ ID NO:44)、CYP7604
(SEQ ID NO:16)、CYP8224(SEQ ID NO:17)和CYP10285(SEQ ID NO:20)的全长合成的罗汉
果基因序列克隆到酵母表达载体中。
[0276] 实施例7:罗汉果基因编码催化罗汉果苷II E糖基化的酶
[0277] 为了鉴定编码能够将罗汉果苷II E转化成罗汉果苷V的UGT的罗汉果基因序列,使用罗汉果转录物组的重新集合的测序读数进行tBLASTn(翻译的核苷酸数据库)分析(参见
Tang等,BMC Genomics 12:343(2011)).所鉴定的基因是UGT98(SEQ ID NO:26)、UGT1495
(SEQ ID NO:27)、UGT1817(SEQ ID NO:28)、UGT3494(SEQ ID NO:29)、UGT5914(SEQ ID NO:
30)、UGT8468(SEQ ID NO:31)、UGT10391(SEQ ID NO:32)、UGT11789(SEQ ID NO:33)、
UGT11999(SEQ ID NO:34)、UGT13679(SEQ ID NO:35)和UGT15423(SEQ ID NO:36)。
[0278] 其中,UGT98(SEQ ID NO:26)、UGT1495(SEQ ID NO:27)、UGT1817(SEQ ID NO:28)、UGT5914(SEQ ID NO:30)、UGT8468(SEQ ID NO:31)和UGT10391(SEQ ID NO:32)是基于由可
公开获得的序列读数形成的重叠群(contig)合成的(Tang等,BMC Genomics 12:343
(2011))。将所述基因插入酵母表达载体中。
[0279] 实施例8:增强罗汉果醇途径前体的可用性
[0280] 为了提高酵母中氧化角鲨烯和环氧角鲨烯的可用性,将内源ERG7基因(SEQ ID NO:55)的启动子替换为包含Nurseothricin标志物(NatMX)和CUP1铜诱导型启动子的PCR片
段。当酵母菌株在正常SC培养基中生长时,ERG7表达因此降低。ERG7编码羊毛甾醇合酶,已
知降低的表达导致面包酵母中氧化角鲨烯和环氧角鲨烯的积累.氧化角鲨烯通常是三萜类
化合物的前体。为了进一步提高氧化角鲨烯和环氧角鲨烯的可用性,将ERG1(SEQ ID NO:
54)编码的角鲨烯环氧酶过表达,并表达酵母HMG还原酶(tHMG1,SEQ ID NO:77,SEQ ID NO:
78)的截短拷贝.
[0281] 当在该菌株中表达两种可溶性罗汉果环氧化物水解酶中的任一种时,通过四羟基角鲨烯的产生来证明在酵母中氧化角鲨烯和环氧角鲨烯产生的成功增强。罗汉果环氧化物
水解酶1如SEQ ID NO:38所示,密码子优化的罗汉果环氧化物水解酶1如SEQ ID NO:37所
示。罗汉果环氧化物水解酶2如SEQ ID NO:40所示,密码子优化的罗汉果环氧化物水解酶2
如SEQ ID NO:39所示。图6显示了在用表达罗汉果环氧化物水解酶2的质粒转化之酵母菌株
的样品中对应于四羟基角鲨烯的质子加Na+加合物的LC‑MS质量峰501.四羟基角鲨烯是通
过环氧角鲨烯的2,3和22,23‑环氧键的水解产生的.在背景酵母菌株中没有检测出四羟基
角鲨烯的积累。通过将培养物等分试样在50%DMSO中煮沸来制备样品,然后通过离心沉淀
细胞材料。然后通过ESI LC‑MS测量上清液。
[0282] 实施例9:在酵母菌株中产生葫芦二烯醇
[0283] 在酿酒酵母中整合SEQ ID NO:42和SEQ ID NO:43所示的罗汉果葫芦二烯醇合酶的密码子优化的基因拷贝导致产生葫芦二烯醇(参见图7B)。酵母菌株在含有2%葡萄糖的
SC培养基中在30℃下生长5天。通过在50%乙醇/20%KOH中煮沸培养物样品5分钟来提取葫
芦二烯醇,然后用等体积的己烷提取。然后将样品用己烷蒸发,将干燥的提取物重悬于甲醇
中。
[0284] 图7A和7B显示了表达SEQ ID NO:42和SEQ ID NO:43所示之葫芦二烯醇合酶的酵母样品的LC‑MS色谱图。图7A显示羊毛甾醇峰,图7B显示葫芦二烯醇和羊毛甾醇峰.对应于
羊毛甾醇的峰显示保留时间为约8.05,而对应于葫芦二烯醇的峰的保留时间为7.85。在LC‑
MS色谱图中,羊毛甾醇和葫芦二烯醇二者都显示质量为409.4(质子加合物减去一个H2O分
子的质量)。
[0285] 实施例10:通过CYP5491修饰酿酒酵母中的葫芦二烯醇
[0286] 在用包含罗汉果CYP5491基因(SEQ ID NO:14,SEQ ID NO:44)的质粒和包含罗汉果CPR4497基因(SEQ ID NO:45,SEQ ID NO:46)的质粒转化葫芦二烯醇产生酵母菌株后(参
见实施例9),LC‑MS可见三个峰(参见图8)。图8中的上框显示了具有这三个峰的LC‑MS色谱
图,而三个下框显示了这三个峰的碎片谱.3个峰的质量(443.38、441.37和457.36)在重量
上分别对应于羟基化葫芦二烯醇、氧代葫芦二烯醇和羟基加氧代葫芦二烯醇的质子加合
物.羟基化葫芦二烯醇(质子化质量443.38)和氧化葫芦二烯醇(质子化质量441.37)分别为
11‑羟基‑葫芦二烯醇和11‑氧代‑葫芦二烯醇,如通过NMR所证实(图9).
[0287] 实施例11:通过表达罗汉果UGT98、UGTSK98和UGT1576在酿酒酵母中进行罗汉果醇的糖基化
[0288] 基于由可公开获得的序列读数制成的重叠群来合成UGT98、UGTSK98和UGT1576基因(Tang等,2011,BMC Genomics 12:343)。UGT98的核苷酸和氨基酸序列分别如SEQ ID NO:
51和SEQ ID NO:53所示,而SEQ ID NO:52对应于UGT98的密码子优化形式。UGTSK98的核苷
酸和氨基酸序列在本文中分别如SEQ ID NO:49和SEQ ID NO:50所示,UGT1576的核苷酸和
氨基酸序列在本文中分别如SEQ ID NO:47和SEQ ID NO:48所示。
[0289] 当向外‑1,3‑β葡聚糖水解酶EXG1和EXG2缺失(以防止产生的罗汉果苷的脱糖基化)的酵母菌株供给罗汉果醇(10‑100μM),并用表达UGT1576(SEQ ID NO:47和SEQ ID NO:
48)的质粒转化时,形成了罗汉果苷I A1(图11B)。通过将培养物等分试样与DMSO以1∶1混
合,随后煮沸(80℃)5分钟并通过离心沉淀来制备样品.然后对上清液进行ESI LC‑MS。图
10A显示了参照罗汉果苷I A1的LC‑MS色谱图,而图10B显示了来自供给有50μM罗汉果醇的
培养物中之表达UGT1576的酵母样品的峰.这些数据显示,UGT1576基因编码具有罗汉果醇
C24‑OH UDP‑糖基转移酶活性的糖基转移酶。
[0290] 当将UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)和UGTSK98(SEQ ID NO:49,SEQ ID NO:50)克隆到酵母表达质粒中,并随后转化到缺失外‑1,3‑β葡聚糖水解酶EXG1
和EXG2的酵母菌株中时,没有检测到供给的罗汉果醇的转化。相比之下,将UGT98(SEQ ID 
NO:51,SEQ ID NO:52,SEQ ID NO:53)或UGT SK98(SEQ ID NO:49,SEQ ID NO:50)与
UGT1576(SEQ ID NO:47和SEQ ID NO:48)在供给罗汉果醇的酵母中共表达导致罗汉果苷I 
A1的进一步糖基化。将UGTSK98与UGT1576共表达导致产生二糖基化罗汉果醇(罗汉果苷II 
A,图11A),而与UGT98共表达产生二糖基化和三糖基化罗汉果醇(中框和下框,图11B)。在
LC‑MS中,通过UGT98和UGTSK98二者形成的二糖基化罗汉果醇具有不同于罗汉果苷II E和
罗汉果苷II A1的保留时间。
[0291] 因此,UGT98和UGTSK98二者均被发现能够催化罗汉果苷I A1的葡萄糖的1,2‑糖基化.发现UGT98是多功能的,其催化罗汉果苷I A1的1,2‑糖基化,导致罗汉果苷II A的产生,
然后催化罗汉果苷II A的1,6‑糖基化以形成罗汉果苷III A1(图11B)。UGT98和UGTSK98属
于UDP葡萄糖糖基转移酶的UGT91家族,已知该家族成员是1,2‑和1,6‑糖基转移酶。图12示
意性地概述了从罗汉果醇到罗汉果苷III A1的糖基化反应。
[0292] 实施例12:通过表达罗汉果UGT430在酿酒酵母中进行罗汉果醇糖基化
[0293] 从合成DNA克隆85A UGT家族的UGT430(SEQ ID NO:61,SEQ ID NO:62),以获得与罗汉果UGT430相同的序列。将克隆的基因转化到缺失EXG1和EXG2(以防止所产生的罗汉果
苷的脱糖基化)的酵母菌株中。使酵母菌株在减去色氨酸(以用于选择质粒维持)并含有10μ
M罗汉果醇的SC培养基中生长。将细胞在30℃下以140rpm摇动培养2天。2天后,将300μL培养
物样品与300μL 96%乙醇混合,并在80℃下孵育10分钟。然后将样品离心,通过LC‑MS分析
上清液。
[0294] 使用Waters Acquity I‑Class UPLC(Waters Corporation,Milford,MA)来进行LC‑MS分析,其具有Waters Acquity C18柱(2.1×50mm,1.7μm颗粒,
孔径),该柱偶联到具有负模式的电喷雾离子化(electrospray ionization,ESI)的Waters 
Xevo TQD三重四极杆质谱仪。通过两种流动相A(含有0.1%甲酸的水)和B(含有0.1%甲酸
的MeCN)的梯度来实现化合物分离,其中在0.3至2.0分钟从20%增加到50%B,在2.01分钟
时增加到100%B,保持100%B 0.6分钟,并再平衡0.6分钟。流量为0.6mL/分钟,柱温为55
℃。使用SIR(Single Ion Recording,单离子记录)监测罗汉果苷I E1(m/z 683.5;[M+

FA]),并与标准品进行比较。
[0295] 得到的LC‑MS色谱图显示在图13中.属于MW=683.5的化合物的一个大峰由UGT430形成(图13B)。该峰的质量对应于单糖基化罗汉果醇的甲酸加合物。该产物与图13A所示的
罗汉果苷I E1参照化合物具有相同的保留时间.UGT430有效并完全地将罗汉果醇糖基化,
因为在表达UGT430的酵母的2天生长期后没有所供给的罗汉果醇残留.因此,罗汉果UGT430
是在罗汉果的罗汉果苷生物合成途径中导致罗汉果醇分子C‑3位上的羟基糖基化的UGT。
[0296] 实施例13:通过表达罗汉果UGT1697在酿酒酵母中进行罗汉果醇的糖基化
[0297] 从合成DNA克隆85A UGT家族的UGT1697(SEQ ID NO:67,SEQ ID NO:68)以获得与罗汉果UGT1697相同的序列。将克隆的基因转化到缺失EXG1和EXG2(以防止所产生的罗汉果
苷的脱糖基化)的酵母菌株中。使酵母菌株在减去组氨酸(以用于选择质粒维持)并含有10μ
M罗汉果醇的SC培养基中生长。将细胞在30℃下以140rpm摇动培养2天。2天后,将300μL培养
物样品与300μL 96%乙醇混合,并在80℃下孵育10分钟。然后将样品离心,通过LC‑MS分析
上清液。
[0298] 使用Waters Acquity I‑Class UPLC(Waters Corporation,Milford,MA)来进行LC‑MS分析,其具有Waters Acquity C18柱(2.1×50mm,1.7μm颗粒,
孔径),该柱偶联到具有负模式的电喷雾离子化(ESI)的Waters Xevo TQD三重四极杆质谱
仪。通过两种流动相A(含有0.1%甲酸的水)和B(含有0.1%甲酸的MeCN)的梯度来实现化合
物分离,其中在0.3至2.0分钟从20%增加到50%B,在2.01分钟时增加到100%B,保持100%
B 0.6分钟,并再平衡0.6分钟。流量为0.6mL/分钟,柱温为55℃。使用SIR(单离子记录)监测

罗汉果苷I E1(m/z 683.5;[M+FA]),并与标准品进行比较。
[0299] 得到的LC‑MS色谱图显示在图14中。属于MW=683.5的化合物的一个大峰由UGT1697形成(图14B).该峰的质量对应于单糖基化罗汉果醇的甲酸加合物.峰对应于罗汉
果苷I A1。参见图14A。该结果表明,罗汉果UGT1697将罗汉果醇C‑24位上的羟基糖基化.如
实施例11所示,UGT1576还表现出罗汉果醇的C‑24糖基化。
[0300] 此外,UGT1697也作用于C‑3位,因为检测到罗汉果苷II E的存在(其在C‑24位上含有一个葡萄糖,并且在C‑3上含有一个葡萄糖),如图14B所示(保留时间为2.22分钟)。因此,
UGT1697将罗汉果醇上的C‑3和C‑24位糖基化,并且是罗汉果的罗汉果苷生物合成途径的一
部分。
[0301] 实施例14:通过表达罗汉果UGT11789、UGT98、UGT430和UGT1576在酿酒酵母中进行罗汉果醇和罗汉果苷的糖基化
[0302] 从合成DNA克隆UGT11789(SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:72)的全长序列以获得与罗汉果UGT11789相同的序列.用UGT11789(SEQ ID NO:69,SEQ 
ID NO:70,SEQ ID NO:71,SEQ ID NO:72)、UGT430(SEQ ID NO:61,SEQ ID NO:62)、UGT1576
(SEQ ID NO:47,SEQ ID NO:48)和UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)共
转化EXG1和EXG2缺失的酵母菌株。另外,用UGT430(SEQ ID NO:61,SEQ ID NO:62)、UGT1576
(SEQ ID NO:47,SEQ ID NO:48)和UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)共
转化EXG1和EXG2缺失的酵母菌株。使酵母菌株在减去组氨酸、尿嘧啶、色氨酸和亮氨酸(用
于选择质粒维持)并包含10μM罗汉果醇的SC培养基中生长。细胞在30℃下以140rpm摇动培
养2天。2天后,将300μL培养物样品与300μL 96%乙醇混合,并在80℃下孵育10分钟。然后将
样品离心,并通过LC‑MS分析上清液.
[0303] 使用Waters Acquity I‑Class UPLC(Waters Corporation,Milford,MA)来进行LC‑MS分析,其具有Waters Acquity C18柱(2.1×50mm,1.7μm颗粒, 孔
径),该柱偶联到具有负模式的电喷雾离子化(ESI)的Waters Xevo TQD三重四极杆质谱仪。
通过梯度I或梯度II实现化合物分离。对于梯度I,将80%流动相A(含有0.1%甲酸的水)和
20%流动相B(含有0.1%甲酸的MeCN)的初始缓冲液浓度在0.3分钟至2.0分钟从20%增加
至40%B,在2.01分钟时增加到100%B,在100%B下保持0.6分钟,并再平衡0.6分钟。对于梯
度II,将80%流动相A(含有0.1%甲酸的水)和20%流动相B(含有0.1%甲酸的MeCN)的初始
缓冲液浓度在0.3分钟至2.0分钟从20%增加至50%B,在2.01分钟时增加到100%B,在
100%B下保持0.6分钟,并再平衡0.6分钟.对于梯度I和梯度II二者,流量为0.6mL/分钟,柱
温为55℃.使用SIR(单离子记录)监测罗汉果醇和罗汉果苷,并与来自植物提取物(3W 
botanical extract.Inc.)的市售罗汉果苷混合物进行比较。SIR示踪如下:罗汉果醇(m/z 
‑ ‑
521.4;[M+FA‑H]),罗汉果醇+1葡萄糖(m/z 683.5;[M+FA‑H]),罗汉果醇+2葡萄糖(m/z 
‑ ‑
799.5;[M‑H]),罗汉果醇+3葡萄糖(m/z 961.6;[M‑H]),罗汉果醇+4葡萄糖(m/z 1123.6;
‑ ‑
[M‑H])以及罗汉果醇+5葡萄糖(m/z 1285.66;[M‑H])。得到的LC‑MS色谱图如图15所示。
[0304] 图15A显示了罗汉果苷参照标准,并且表明了与罗汉果苷V和罗汉果苷II E相对应的峰。图15B和图15C的比较证明了UGT11789密码子优化的序列A(SEQ ID NO:70,SEQ ID 
NO:72)表达的效果。图15B显示,在酿酒酵母菌株中共表达罗汉果UGT1576(SEQ ID NO:47,
SEQ ID NO:48)和UGT430(SEQ ID NO:61,SEQ ID NO:62)后产生了罗汉果苷II E,所述酿酒
酵母菌株通过多功能UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)的共表达将供给
的罗汉果醇转化为罗汉果苷V.图15B中的罗汉果苷V峰的强度测量为8.65E3(LC‑MS色谱图
中的峰离子强度)。罗汉果UGT1576(SEQ ID NO:47,SEQ ID NO:48)、UGT430(SEQ ID NO:61,
SEQ ID NO:62)、UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)和UGT11789(SEQ ID 
NO:70,SEQ ID NO:72)在酿酒酵母菌株中的共表达更有效地将供给的罗汉果醇转化为罗汉
果苷V,如图15C所示。图15C中的罗汉果苷V峰的强度测量为2.22E5(LC‑MS色谱图中的峰离
子强度)。
[0305] 该实验表明,共表达的罗汉果UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)和UGT11789(SEQ ID NO:69,SEQ ID NO:70,SEQ ID NO:71,SEQ ID NO:72)催化对于在
酵母中有效产生罗汉果苷V所需的每个葡萄糖‑葡萄糖1,2‑和1,6‑连接。罗汉果苷II E可以
被UGT11789糖基化以形成连接有3个葡萄糖的罗汉果苷(图15D).因为UGT11789属于UGT91
家族并且不能糖基化罗汉果醇核心,所以罗汉果苷IIE的这种糖基化通过1,2‑键或1,6‑键
进行,因此UGT11789的产物是罗汉果苷III或罗汉果苷IIIA2。
[0306] 实施例15:通过表达罗汉果CYP1798在酿酒酵母中产生罗汉果醇
[0307] 从合成DNA克隆CYP1798以获得与罗汉果CYP1798(SEQ ID NO:5,SEQ ID NO:74)相同的序列。核苷酸序列经密码子优化以用于在酿酒酵母中的表达(SEQ ID NO:5).为了提高
氧化角鲨烯的可用性,将内源ERG7基因(SEQ ID NO:55)的启动子破坏以降低羊毛甾醇合酶
在缺失TRP1基因的酿酒酵母菌株中的表达。为了进一步提高酿酒酵母中氧化角鲨烯的可用
性,将由ERG1编码的角鲨烯环氧酶(SEQ ID NO:54)过表达,并且表达截短的HMG还原酶
(tHMG1,SEQ ID NO:77,SEQ ID NO:78).将编码罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ 
ID NO:43)的密码子优化基因和编码罗汉果CPR4497(SEQ ID NO:45,SEQ ID NO:46)的密码
子优化基因整合到酿酒酵母菌株的基因组中,导致通过ESI LC‑MS可检测的葫芦二烯醇的
产生(图7B)。
[0308] 随后,用携带罗汉果CYP5491(SEQ ID NO:14,SEQ ID NO:44)、罗汉果CYP1798(SEQ ID NO:5,SEQ ID NO:73,SEQ ID NO:74)和罗汉果环氧化物水解酶2(SEQ ID NO:39,SEQ ID 
NO:40)的质粒转化葫芦二烯醇产生酿酒酵母菌株,并在减去尿嘧啶、亮氨酸、组氨酸和色氨
酸以用于质粒维持的SC培养基中生长。细胞在30℃下以140rpm摇动培养4天.4天后,将300μ
L培养物样品与300μL的96%乙醇混合,并在80℃下孵育10分钟。然后离心样品,通过LC‑MS
分析上清液。使用Waters Acquity I‑Class UPLC(Waters Corporation,Milford,MA)来进
行LC‑MS分析,其具有Waters Acquity C18柱(2.1×50mm,1.7μm颗粒,
孔径),该柱偶联到具有负模式的电喷雾离子化(ESI)的Waters Xevo TQD三重四极杆质谱
仪。通过两种流动相A(含有0.1%甲酸的水)和B(含有0.1%甲酸的MeCN)的梯度来实现化合
物分离,其中在0.3至3.5分钟从20%增加到40%B,在1.0分钟内增加到100%B,保持100%B 
1.0分钟,并再平衡0.6分钟。流量为0.6mL/分钟,柱温为55℃。使用SIR(单离子记录)监测罗

汉果醇(m/z 521.4;[M+FA‑H]),并与标准品进行比较。
[0309] 罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID NO:43)、CYP5491、CYP1798(SEQ ID NO:5,SEQ ID NO:74)、CPR4497(SEQ ID NO:45,SEQ ID NO:46)和环氧化物水解酶2(SEQ 
ID NO:39,SEQ ID NO:40)的表达导致罗汉果醇的产生(图16)。图8表明CYP5491单独在葫芦
二烯醇产生菌株中的表达。显示了11‑羟基‑葫芦二烯醇(质量443)和11‑氧代‑葫芦二烯醇
(质量441)的峰。仅在CYP1798与环氧化物水解酶2共表达后有效地产生罗汉果醇。因此,
CYP1798催化葫芦二烯醇和/或11‑羟基‑葫芦二烯醇的24‑25碳双键的环氧化。
[0310] 实施例16:在酿酒酵母中产生罗汉果苷V
[0311] 在酿酒酵母S288C的EXG1(SEQ ID NO:63,SEQ ID NO:64)敲除、Matα衍生株中产生罗汉果苷V。通过在活跃转录的染色体区域中的同源重组,将罗汉果葫芦二烯醇合酶(SEQ 
ID NO:42、SEQ ID NO:43)、CYP5491(SEQ ID NO:81、SEQ ID NO:44)、CYP1798(SEQ ID NO:
5、SEQ ID NO:74)、CYP1798‑II(SEQ ID NO:86、SEQ ID NO:74)、CPR4497(SEQ ID NO:82、
SEQ ID NO:46)、环氧化物水解酶2(SEQ ID NO:39、SEQ ID NO:40)、UGT1576(SEQ ID NO:
83、SEQ ID NO:48)、UGT430(SEQ ID NO:84、SEQ ID NO:62)、UGT1697(SEQ ID NO:85、SEQ 
ID NO:68)、UGT98(SEQ ID NO:52、SEQ ID NO:53)和UGT11789(SEQ ID NO:71、SEQ ID NO:
72)在两侧为生长选择性标志物的表达盒中整合到酿酒酵母菌株中。通过Genscript合成密
码子优化的罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID NO:43)、CYP1798(SEQ ID NO:
5,SEQ ID NO:74)、CPR4497(SEQ ID NO:81,SEQ ID NO:46)和UGT98(SEQ ID NO:52,SEQ ID 
NO:53).密码子优化的CYP5491(SEQ ID NO:81,SEQ ID NO:44)、UGT1576(SEQ ID NO:83,
SEQ ID NO:48)、UGT430(SEQ ID NO:84,SEQ ID NO:62)和UGT11789(SEQ ID NO:71,SEQ ID 
NO:72)如酿酒酵母 基因片段(Integrated DNA Technologies)合成。密码子优化
的CYP1798‑II(SEQ ID NO:86,SEQ ID NO:74)和UGT1697(SEQ ID NO:85,SEQ ID NO:68)以
TM
及天然CPR4497(SEQ ID NO:45,SEQ ID NO:46)如 Strings  DNA片段(Life 
Technologies)合成。密码子优化的环氧化物水解酶1(SEQ ID NO:37,SEQ ID NO:38)和环
氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:40)通过DNA2.0合成。
[0312] 酿酒酵母菌株在30℃下的SC培养基中生长5天。然后将培养物用液氮冷冻,并将残余物浓缩至接近干燥.将残余物重悬在50%(v/v)乙醇中并加热至55℃持续约30分钟。然后
将悬浮液在4400rpm和4℃下离心15分钟。使用0.22μm SterilFlip过滤器(Millipore)过滤
上清液。图17显示了过滤后的罗汉果苷V产生菌株的LC‑MS色谱图.然后将粗产物在半制备
型Agilent 1200 HPLC系统上分离。该系统装备有Synergi 4u Hydro RP 柱
(Phenomenex:柱尺寸250×21.2mm,4微米).使用流动相洗脱液B(含有0.02%三氟乙酸的乙
腈)和洗脱剂A(含有0.02%三氟乙酸的水)进行洗脱,其通过从0.0分钟至2.0分钟将梯度从
5%线性提高到8%B,从2.0分钟至12.0分钟将梯度从8%线性提高到25%B,从12.0分钟至
20.0分钟将从25%提高至50%B,从20.0分钟至32.0分钟将梯度从50%提高至100%B,最后
用100%B洗涤并重新平衡来进行。使用15mL/分钟的流量进行分离,其在室温下进行。通过
LC‑MS分析所有级分,合并包含有单一罗汉果苷化合物的级分,并真空干燥.
[0313] 将合并的级分用于NMR分析。使用装配有1.7mm低温TCI探针的Bruker Avance III 600MHz NMR光谱仪15在25℃下在DMSO‑d6中进行所有NMR实验。通过标准的同核和异核多脉
1 1 1 13 1 13
冲NMR实验,即H,H‑COSY、H,C‑HSQC和H,C‑HMBC实验解析结构。来自酿酒酵母产生菌株
的纯化罗汉果苷峰被确认为罗汉果苷I E1、罗汉果苷II A2、罗汉果苷IV A,和主要产物罗
1 1 13
汉果苷V。图18A显示了罗汉果苷V的NMR阐明的结构、H NMR谱以及H和 C NMR化学位移(以
1 1 13
ppm计)。图18B显示了罗汉果苷II A2的NMR阐明的结构、H NMR谱以及 H和 C NMR化学位移
1 1 13
(以ppm计)。图18C显示了罗汉果苷IV A的NMR阐明的结构、H NMR谱以及H与 C NMR化学位
1 1
移(以ppm计)。图18D显示了罗汉果苷I E1的NMR阐明的结构、H NMR谱和H化学位移(以ppm
计)。
[0314] 表3:本文公开的序列(也参见表2)
[0315] SEQ ID NO:1
[0316] 西葫芦蛋白质序列
[0317]
[0318]
[0319]
[0320]
[0321] 罗汉果蛋白质序列
[0322]
[0323]
[0324] 罗汉果核苷酸序列
[0325]
[0326]
[0327] 罗汉果核苷酸序列
[0328]
[0329]
[0330] 编码CYP1798的密码子优化的DNA序列
[0331]
[0332]
[0333] 罗汉果核苷酸序列
[0334]
[0335]
[0336] 罗汉果DNA序列
[0337]
[0338]
[0339] 罗汉果DNA序列
[0340]
[0341]
[0342] 罗汉果DNA序列
[0343]
[0344]
[0345] 罗汉果DNA序列
[0346]
[0347]
[0348] 罗汉果DNA序列
[0349]
[0350] 罗汉果DNA序列
[0351]
[0352]
[0353] 罗汉果DNA序列
[0354]
[0355]
[0356] 罗汉果DNA序列
[0357]
[0358]
[0359] 罗汉果DNA序列
[0360]
[0361]
[0362] 罗汉果DNA序列
[0363]
[0364]
[0365] 罗汉果DNA序列
[0366]
[0367]
[0368] 罗汉果DNA序列
[0369]
[0370]
[0371]
[0372] 罗汉果DNA序列
[0373]
[0374]
[0375] 罗汉果DNA序列
[0376]
[0377]
[0378] 拟南芥蛋白质序列
[0379]
[0380]
[0381] 拟南芥蛋白质序列
[0382]
[0383]
[0384] 拟南芥蛋白质序列
[0385]
[0386]
[0387] 甜叶菊蛋白质序列
[0388]
[0389]
[0390]
[0391] 甜叶菊蛋白质序列
[0392]
[0393]
[0394]
[0395] 罗汉果DNA序列
[0396]
[0397]
[0398] 罗汉果DNA序列
[0399]
[0400]
[0401] 罗汉果DNA序列
[0402]
[0403]
[0404] 人工序列;来自罗汉果的部分核苷酸序列
[0405]
[0406]
[0407] 罗汉果DNA序列
[0408]
[0409] 罗汉果DNA序列
[0410]
[0411] 罗汉果DNA序列
[0412]
[0413] 人工序列;来自罗汉果的部分核苷酸序列
[0414]
[0415] 人工序列;来自罗汉果的部分核苷酸序列
[0416]
[0417] 人工序列;来自罗汉果的部分核苷酸序列
[0418]
[0419]
[0420] 人工序列;来自罗汉果的部分核苷酸序列
[0421]
[0422]
[0423] 人工序列;编码环氧化物水解酶1的密码子优化核苷酸序列
[0424]
[0425] 罗汉果蛋白质序列
[0426]
[0427]
[0428] 人工序列;编码环氧化物水解酶2的密码子优化核苷酸序列
[0429]
[0430] 罗汉果蛋白质序列
[0431]
[0432]
[0433] 罗汉果DNA序列
[0434]
[0435]
[0436] 人工序列;编码葫芦二烯醇合酶的密码子优化核苷酸序列
[0437]
[0438]
[0439] 罗汉果蛋白质序列
[0440]
[0441]
[0442]
[0443]
[0444] 罗汉果蛋白质序列
[0445]
[0446]
[0447]
[0448] 罗汉果DNA序列
[0449]
[0450]
[0451]
[0452] 罗汉果蛋白质序列
[0453]
[0454]
[0455]
[0456] 罗汉果DNA序列
[0457]
[0458]
[0459] 罗汉果蛋白质序列
[0460]
[0461]
[0462] 罗汉果DNA序列
[0463]
[0464]
[0465] 罗汉果蛋白质序列
[0466]
[0467]
[0468]
[0469] 罗汉果DNA序列
[0470]
[0471]
[0472] 人工序列;编码UGT98的密码子优化核苷酸序列
[0473]
[0474]
[0475] 罗汉果蛋白质序列
[0476]
[0477]
[0478]
[0479] 酿酒酵母蛋白质序列
[0480]
[0481]
[0482]
[0483] 酿酒酵母蛋白质序列
[0484]
[0485]
[0486]
[0487]
[0488] 拟南芥蛋白质序列
[0489]
[0490]
[0491] 拟南芥蛋白质序列
[0492]
[0493]
[0494] 拟南芥蛋白质序列
[0495]
[0496]
[0497] 甜叶菊蛋白质序列
[0498]
[0499]
[0500]
[0501] 甜叶菊蛋白质序列
[0502]
[0503]
[0504]
[0505] 罗汉果DNA序列
[0506]
[0507]
[0508] 罗汉果蛋白质序列
[0509]
[0510]
[0511]
[0512] 酿酒酵母DNA序列
[0513]
[0514]
[0515] 酿酒酵母蛋白质序列
[0516]
[0517]
[0518]
[0519] 酿酒酵母DNA序列
[0520]
[0521]
[0522] 酿酒酵母蛋白质序列
[0523]
[0524]
[0525]
[0526] 罗汉果DNA序列
[0527]
[0528]
[0529] 罗汉果蛋白质序列
[0530]
[0531]
[0532]
[0533] 罗汉果DNA序列
[0534]
[0535]
[0536] 人工序列;编码UGT11789的密码子优化核苷酸序列A
[0537]
[0538]
[0539] 人工序列;编码UGT11789的密码子优化核苷酸序列B
[0540]
[0541]
[0542] 罗汉果蛋白质序列
[0543]
[0544]
[0545]
[0546] 罗汉果DNA序列
[0547]
[0548]
[0549] 罗汉果蛋白质序列
[0550]
[0551]
[0552]
[0553] 酿酒酵母DNA序列
[0554]
[0555]
[0556] 酿酒酵母蛋白质序列
[0557]
[0558]
[0559] 酿酒酵母DNA序列
[0560]
[0561]
[0562] 酿酒酵母蛋白质序列
[0563]
[0564]
[0565]
[0566] 罗汉果DNA序列
[0567]
[0568]
[0569] 罗汉果DNA序列
[0570]
[0571]
[0572] 人工序列;编码CYP5491的密码子优化核苷酸序列
[0573]
[0574]
[0575] 人工序列;编码CYP4497的密码子优化核苷酸序列
[0576]
[0577]
[0578] 人工序列;编码UGT1576的密码子优化核苷酸序列
[0579]
[0580]
[0581] 人工序列;编码UGT430的密码子优化核苷酸序列
[0582]
[0583]
[0584] 人工序列;编码UGT1697的密码子优化核苷酸序列
[0585]
[0586]
[0587] 人工序列;编码CYP1798的密码子优化核苷酸序列
[0588]
[0589]
[0590] 酿酒酵母蛋白质序列
[0591]
[0592]
[0593]
[0594] 绞股蓝角鲨烯环氧酶蛋白质序列
[0595]
[0596]
[0597]
[0598] 拟南芥角鲨烯环氧酶1蛋白质序列
[0599]
[0600]
[0601]
[0602] 拟南芥角鲨烯环氧酶4蛋白质序列
[0603]
[0604]
[0605]
[0606] 拟南芥角鲨烯环氧酶6蛋白质序列
[0607]
[0608]
[0609]
[0610] 拟南芥角鲨烯环氧酶5蛋白质序列
[0611]
[0612]
[0613]
[0614] 拟南芥角鲨烯环氧酶2蛋白质序列
[0615]
[0616]
[0617]
[0618] 拟南芥角鲨烯环氧酶3蛋白质序列
[0619]
[0620]
[0621]
[0622] 欧洲油菜角鲨烯单加氧酶1,1蛋白质序列
[0623]
[0624]
[0625]
[0626] 欧洲油菜角鲨烯单加氧酶1,2蛋白质序列
[0627]
[0628]
[0629]
[0630] 绿玉树角鲨烯环氧酶蛋白质序列
[0631]
[0632]
[0633]
[0634] 蒺藜苜蓿角鲨烯环氧酶蛋白质序列
[0635]
[0636]
[0637]
[0638] 蒺藜苜蓿角鲨烯单加氧酶蛋白质序列
[0639]
[0640]
[0641]
[0642] 蓖麻角鲨烯单加氧酶蛋白质序列
[0643]
[0644]
[0645]
[0646] 蓖麻角鲨烯单加氧酶蛋白质序列
[0647]
[0648]
[0649]
[0650] 蓖麻角鲨烯单加氧酶蛋白质序列
[0651]
[0652]
[0653]
[0654] 蓖麻角鲨烯单加氧酶蛋白质序列
[0655]
[0656]
[0657]
[0658] 蓖麻角鲨烯单加氧酶蛋白质序列
[0659]
[0660]
[0661] 蓖麻角鲨烯单加氧酶蛋白质序列
[0662]
[0663]
[0664]
[0665] 已经详细地并通过参考其具体实施方案描述了本发明,明显的是,可以进行修改和变化,而不脱离所附权利要求限定的本发明的范围。更具体地说,尽管本发明的某些方面
在本文中被认为是特别有利的,但是预期本发明不一定限于本发明的这些特定方面。