用于生物合成罗汉果苷化合物的方法和材料转让专利
申请号 : CN201580062037.X
文献号 : CN107466320B
文献日 : 2021-11-05
发明人 : 延斯·霍顿-拉森 , 卡塔尔济纳·克日什塔内克 , 安格利卡·塞姆莱尔 , 艾弗·克拉夫斯·里谢德·汉森 , 索伦·达姆基埃尔 , 加里·刘 , 刘耀权 , 约恩·汉森 , 萨西什·库马尔 , 穆特斯瓦米·潘沙佩奇萨·穆拉利 , 尼纳·尼科利纳·拉斯穆森
申请人 : 埃沃尔瓦公司
摘要 :
权利要求 :
1.能够在细胞培养物中产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的重组宿主细胞,其包含:
(a)编码能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯之多肽的基因,其中所述能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯的多肽由SEQ ID NO:54所示的氨基酸序列构成;
(b)编码能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成24,25环氧葫芦二烯醇之多肽的基因,其中所述能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成
24,25环氧葫芦二烯醇的多肽由SEQ ID NO:43所示的氨基酸序列构成;
(c)编码能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇之多肽的基因,其中所述能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇的多肽由SEQ ID NO:74所示的氨基酸序列构成;
(d)编码能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇之多肽的基因,其中所述能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成11‑羟基‑24,25环氧葫芦二烯醇的多肽由SEQ ID NO:44所示的氨基酸序列构成;
(e)编码能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇之多肽的基因,其中所述能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽由SEQ ID NO:74所示的氨基酸序列构成;
(f)编码能够还原细胞色素P450复合物之多肽的基因,其中所述能够还原细胞色素P450复合物的多肽由SEQ ID NO:46所示的氨基酸序列构成;以及(g)编码能够从11‑羟基‑24,25环氧葫芦二烯醇合成所述罗汉果苷前体之多肽的基因,其中所述能够从11‑羟基‑24,25环氧葫芦二烯醇合成所述罗汉果苷前体的多肽由SEQ ID NO:38或40所示的氨基酸序列构成;
所述重组宿主细胞还包含以下的一种或更多种:(h)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处将其糖基化的多肽由SEQ ID NO:62或68或22所示的氨基酸序列构成;
(i)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C24羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C24羟基处将其糖基化的多肽由SEQ ID NO:21、23、24、25、22、48或68中任一个所示的氨基酸序列构成;
(j)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化的多肽由SEQ ID NO:22或68所示的氨基酸序列构成;
(k)编码能够在所述罗汉果苷前体和/或罗汉果苷化合物的C11羟基处将其糖基化之多肽的基因,其中所述能够在所述罗汉果苷前体和/或罗汉果苷化合物的C11羟基处将其糖基化的多肽由SEQ ID NO:24所示的氨基酸序列构成;
(l)编码能够使所述罗汉果苷前体和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化之多肽的基因,其中所述能够使所述罗汉果苷前体和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化的多肽由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成;和/或
(m)编码能够使所述罗汉果苷前体和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑1,2糖基化和/或C6’位β‑1,6糖基化之多肽的基因,其中所述能够使所述罗汉果苷前体和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑1,2糖基化和/或C6’位β‑1,6糖基化的多肽由SEQ ID NO:53或72所示的氨基酸序列构成;
其中至少一种所述基因是重组基因。
2.权利要求1所述的重组宿主细胞,其包含基因(a)‑(g)和(h)‑(m)。
3.权利要求1或2中任一项所述的重组宿主细胞,其中所述重组宿主细胞已被修饰成减少羊毛甾醇合酶(ERG7)多肽的表达。
4.权利要求3所述的重组宿主细胞,其中所述ERG7多肽由SEQ ID NO:55所示的氨基酸序列构成。
5.权利要求1或2中任一项所述的重组宿主细胞,其中一种或更多种所述基因还包含编码融合标签的核苷酸序列。
6.权利要求5所述的重组宿主细胞,其中所述融合标签是蛋白质或多肽。
7.权利要求6所述的重组宿主细胞,其中所述融合标签是绿色荧光蛋白(GFP)、人流感血凝素(HA)、谷胱甘肽S转移酶(GST)、多组氨酸标签(HIS标签)、和FLAG标签、叶绿体转运肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。
8.权利要求1或2中任一项所述的重组宿主细胞,其中一种或更多种所述基因表达为融合蛋白。
9.权利要求1或2中任一项所述的重组宿主细胞,其中所述罗汉果醇前体是角鲨烯、氧化角鲨烯、环氧角鲨烯、葫芦二烯醇、24,25环氧葫芦二烯醇、11‑羟基‑葫芦二烯醇、11‑羟基
24,25环氧葫芦二烯醇或11‑氧代‑罗汉果醇。
10.权利要求1或2中任一项所述的重组宿主细胞,其中所述罗汉果苷前体是罗汉果醇、或者糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇。
11.权利要求10所述的重组宿主细胞,其中所述四糖基化罗汉果醇是罗汉果苷IV或赛门苷I。
12.权利要求1或2中任一项所述的重组宿主细胞,其中所述罗汉果苷化合物是糖基化罗汉果苷化合物、二糖基化罗汉果苷化合物、三糖基化罗汉果苷化合物、四糖基化罗汉果苷化合物或五糖基化罗汉果苷化合物。
13.权利要求12所述的重组宿主细胞,其中:(a)所述糖基化罗汉果苷化合物是罗汉果苷IA1或罗汉果苷IE1;
(b)所述二糖基化罗汉果苷化合物是罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2或罗汉果苷II E;
(c)所述三糖基化罗汉果苷化合物是罗汉果苷IIIA1、罗汉果苷III A2、罗汉果苷III或罗汉果苷III E;
(d)所述四糖基化罗汉果苷化合物是罗汉果苷IV、罗汉果苷IV A或赛门苷;以及(e)所述五糖基化罗汉果苷化合物是罗汉果苷V。
14.权利要求1或2中任一项所述的重组宿主细胞,其中所述重组宿主细胞包含植物细胞、真菌细胞、藻类细胞或细菌细胞。
15.在细胞培养物中产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的方法,其包括在表达基因的条件下,在细胞培养物中培养权利要求1至14中任一项所述的重组宿主细胞;其中所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物由所述重组宿主细胞产生。
16.权利要求15所述的方法,其中所述重组宿主细胞在一定温度下在发酵罐中培养一段时间,其中所述温度和时间促进所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的产生。
17.权利要求15或16中任一项所述的方法,其还包括从所述细胞培养物分离所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物。
18.权利要求17所述的方法,其中所述分离步骤包括将所述细胞培养物的液相与所述细胞培养物的固相分离以获得包含所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的上清液;以及:
(a)将所述上清液与一种或更多种吸附树脂接触以获得至少一部分所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;或者(b)将所述上清液与所述一种或更多种离子交换或反向色谱柱相接触以获得至少一部分所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;或者(c)结晶或提取所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;
从而分离所产生的所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物。
19.权利要求15所述的方法,其还包括从所述细胞培养物回收所述罗汉果醇前体、所述罗汉果苷前体和/或罗汉果苷化合物,从而提供罗汉果苷组合物。
20.权利要求19所述的方法,其中相对于来自罗汉果(s.grosvenorii)植物的罗汉果苷组合物,所述回收的罗汉果苷组合物富含所述罗汉果苷前体和/或罗汉果苷化合物并且相对于植物来源的罗汉果提取物,具有降低水平的罗汉果植物来源组分。
21.产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的方法,其包括使用以下多肽的植物来源的或合成的罗汉果醇前体或罗汉果苷前体在重组宿主细胞的细胞培养基中的全细胞生物转化,并且由此产生所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物:
(a)能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯的多肽,其中所述多肽由SEQ ID NO:
54所示的氨基酸序列构成;
(b)能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:43所示的氨基酸序列构成;
(c)能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成
11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:74所示的氨基酸序列构成;
(d)能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成
11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:44所示的氨基酸序列构成;
(e)能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽,其中所述多肽由SEQ ID NO:74所示的氨基酸序列构成;
(f)能够还原细胞色素P450复合物的多肽,其中所述多肽由SEQ ID NO:46所示的氨基酸序列构成;以及
(g)能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽,其中所述多肽由SEQ ID NO:38或40所示的氨基酸序列构成;
以及以下的至少一种:
(h)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:62、68或22中任一个所示的氨基酸序列构成;
(i)能够在罗汉果醇和/或罗汉果苷化合物的C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:21、23、24、25、22、48或68中任一个所示的氨基酸序列构成;
(j)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:22或68所示的氨基酸序列构成;
(k)能够在罗汉果醇和/或罗汉果苷化合物的C11羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:24所示的氨基酸序列构成;
(l)能够使罗汉果醇和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化的多肽,其中所述多肽由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成;和/或(m)能够使罗汉果醇和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑
1,2糖基化和/或C6’位β‑1,6糖基化的多肽,其中所述多肽由SEQ ID NO:72所示的氨基酸序列构成;
其中至少一种所述多肽是在所述重组宿主细胞中表达的重组多肽。
22.产生罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物的体外方法,其包括添加以下多肽和植物来源的或合成的罗汉果醇前体或罗汉果苷前体至反应混合物,并且由此产生所述罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物:(a)能够从角鲨烯合成氧化角鲨烯或环氧角鲨烯的多肽,其中所述多肽由SEQ ID NO:
54所示的氨基酸序列构成;
(b)能够从氧化角鲨烯合成葫芦二烯醇,或者从环氧角鲨烯合成24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:43所示的氨基酸序列构成;
(c)能够从葫芦二烯醇合成24,25环氧葫芦二烯醇,或者从11‑羟基‑葫芦二烯醇合成
11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:74所示的氨基酸序列构成;
(d)能够从葫芦二烯醇合成11‑羟基‑葫芦二烯醇,或者从24,25环氧葫芦二烯醇合成
11‑羟基‑24,25环氧葫芦二烯醇的多肽,其中所述多肽由SEQ ID NO:44所示的氨基酸序列构成;
(g)能够从11‑羟基‑24,25环氧葫芦二烯醇合成罗汉果醇的多肽,其中所述多肽由SEQ ID NO:38或40所示的氨基酸序列构成;
以及以下的至少一种:
(h)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:62或68中任一个所示的氨基酸序列构成;
(i)能够在罗汉果醇和/或罗汉果苷化合物的C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:48或68中任一个所示的氨基酸序列构成;
(j)能够在罗汉果醇和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:68所示的氨基酸序列构成;
(k)能够在罗汉果醇和/或罗汉果苷化合物的C11羟基处将其糖基化的多肽,其中所述多肽由SEQ ID NO:24所示的氨基酸序列构成;
(l)能够使罗汉果醇和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化的多肽,其中所述多肽由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成;和/或(m)能够使罗汉果醇和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑
1,2糖基化和/或C6’位β‑1,6糖基化的多肽,其中所述多肽由SEQ ID NO:72所示的氨基酸序列构成;
其中至少一种所述多肽是重组多肽。
23.向罗汉果苷前体和/或罗汉果苷化合物的C3羟基、C24羟基、C3羟基和C24羟基二者、
3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位和/或C6’位转移糖部分的方法,其包括在用于将所述糖部分转移至所述罗汉果苷前体和/或罗汉果苷化合物的合适反应条件下,将所述罗汉果苷前体和/或罗汉果苷化合物与以下重组多肽和UDP糖相接触:所述多肽由SEQ ID NO:
48、50、53、62、68或72中任一个所示的氨基酸序列构成并且能够在所述C3羟基处糖基化所述罗汉果苷前体和/或罗汉果苷化合物、在所述C24羟基处糖基化所述罗汉果苷前体和/或罗汉果苷化合物、在所述C3羟基和C24羟基处糖基化所述罗汉果苷前体和/或罗汉果苷化合物、在所述3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位处β‑1,2糖基化和/或C6’位处β‑1,6糖基化所述罗汉果苷前体和/或罗汉果苷化合物,其中所述罗汉果苷前体是罗汉果醇、或者糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇;并且其中在转移所述糖部分后产生糖基化罗汉果苷化合物、二糖基化罗汉果苷化合物、三糖基化罗汉果苷化合物、四糖基化罗汉果苷化合物或五糖基化罗汉果苷化合物、其异构体、和/或其罗汉果苷组合物。
24.权利要求23所述的方法,其中(a)所述糖部分是葡萄糖,并且在将所述葡萄糖部分转移至罗汉果醇后产生罗汉果苷I A1;
(b)所述糖部分是葡萄糖,并且在将所述葡萄糖部分转移至罗汉果醇后产生罗汉果苷I E1;
(c)所述糖部分是葡萄糖,并且在将所述葡萄糖部分转移至罗汉果醇后产生罗汉果苷II E1;
(d)所述罗汉果苷前体是罗汉果苷IA1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA;
所述罗汉果苷前体是罗汉果苷I A1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA2;
(e)所述罗汉果苷前体是罗汉果苷IA1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷II E;
(f)所述罗汉果苷前体是罗汉果苷IA1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA1;
(g)所述罗汉果苷前体是罗汉果苷IE1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷II E;
所述罗汉果苷前体是罗汉果苷IE1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA1;
(h)所述罗汉果苷前体是罗汉果苷II A,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA1;
(i)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA1;
(j)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIIA2;
(k)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷III E;
(l)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷III;
(m)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV A;
(n)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV A;
(o)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV;
(p)所述罗汉果苷前体是罗汉果苷II E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷V;
(q)所述罗汉果苷前体是罗汉果苷III E,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IIA2;
(r)所述罗汉果苷前体是罗汉果苷III A2,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV;
(s)所述罗汉果苷前体是罗汉果苷III,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷IV A;
(t)所述罗汉果苷前体是罗汉果苷III A1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生赛门苷1;
(u)所述罗汉果苷前体是罗汉果苷IV,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生赛门苷1;或者
(v)所述罗汉果苷前体是赛门苷1,其中所述糖部分是葡萄糖,并且在转移所述葡萄糖部分后产生罗汉果苷V。
25.权利要求23所述的方法,其中在细胞培养液中产生罗汉果醇、所述糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇、所述糖基化罗汉果苷化合物、二糖基化罗汉果苷化合物、三糖基化罗汉果苷化合物、四糖基化罗汉果苷化合物或五糖基化罗汉果苷化合物、其异构体、和/或其罗汉果苷组合物,所述方法包括在表达一种或更多种以下基因的条件下,培养包含以下基因的重组宿主细胞:(i)编码由SEQ ID NO:62和68中任一个所示的氨基酸序列构成并且能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处将其糖基化之多肽的基因;(ii)编码由SEQ ID NO:48或68中任一个所示的氨基酸序列构成并且能够在所述罗汉果苷前体和/或罗汉果苷化合物的C24羟基处将其糖基化之多肽的基因;(iii)编码由SEQ ID NO:68所示的氨基酸序列构成并且能够在所述罗汉果苷前体和/或罗汉果苷化合物的C3羟基处和C24羟基处将其糖基化之多肽的基因;(iv)编码由SEQ ID NO:50、53或72中任一个所示的氨基酸序列构成并且能够使所述罗汉果苷前体和/或罗汉果苷化合物的24‑O‑葡萄糖的C2’位β‑1,2糖基化之多肽的基因;和/或(v)编码由SEQ ID NO:53或72中任一个所示的氨基酸序列构成并且能够使所述罗汉果苷前体和/或罗汉果苷化合物的3‑O‑葡萄糖和/或24‑O‑葡萄糖的C2’位β‑1,2糖基化和/或C6’位β‑1,6糖基化之多肽的基因,
其中至少一种所述基因是重组基因,
其中将所述糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇与重组多肽相接触包括将所述糖基化罗汉果醇、二糖基化罗汉果醇、三糖基化罗汉果醇或四糖基化罗汉果醇与所述重组宿主细胞产生的至少一种多肽相接触。
26.包含权利要求1所述的重组宿主细胞的细胞培养物,所述细胞培养物还包含:(a)所述重组宿主细胞产生的罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;
(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)‑葡萄糖、UDP‑鼠李糖、UDP‑木糖和/或N‑乙酰‑葡糖胺;以及
(c)补充营养物质,包含痕量金属、维生素、盐、YNB和/或氨基酸;
其中所述罗汉果苷前体和/或罗汉果苷化合物以至少1mg/升细胞培养物的浓度存在;
其中相对于来自罗汉果植物的罗汉果苷组合物,所述细胞培养物富含所述罗汉果苷前体和/或罗汉果苷化合物;并且
其中相对于植物来源的罗汉果提取物,所述细胞培养物具有降低水平的罗汉果植物来源组分。
27.在细胞培养物中培养的权利要求1所述的重组宿主细胞的细胞裂解物,其中所述细胞裂解物包含:
(a)所述重组宿主细胞产生的罗汉果醇前体、罗汉果苷前体和/或罗汉果苷化合物;
(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)‑葡萄糖、UDP‑鼠李糖、UDP‑木糖和/或N‑乙酰‑葡糖胺;以及
(c)补充营养物质,包含痕量金属、维生素、盐、YNB和/或氨基酸;
其中所述罗汉果苷前体和/或罗汉果苷化合物以至少1mg/升细胞裂解物的浓度存在。
28.权利要求1所述的重组宿主细胞,其中所述重组宿主细胞是解脂耶氏酵母(Yarrowia lipolytica)细胞。
说明书 :
用于生物合成罗汉果苷化合物的方法和材料
技术领域
环氧化物水解酶以产生罗汉果醇前体和/或罗汉果醇的方法。本发明还涉及使用尿苷‑5′‑
二磷酸(uridine‑5’‑diphospho,UDP)依赖性葡糖基转移酶(UGT)来糖基化罗汉果醇并产生
多种罗汉果苷的方法。
背景技术
天然甜味剂。已经从罗汉果中鉴定了有助于果实甜度的四种主要化合物,即罗汉果苷V、罗
汉果苷IV、赛门苷I和11‑氧代罗汉果苷V(参见图1).罗汉果苷V是这四种化合物中最丰富
的,约为干果实的0.57%(w/w),其次是罗汉果苷IV和赛门苷I,其各自含有四个葡萄糖部
分.11‑氧代罗汉果苷V在C11处具有酮基而非羟基.参见例如Takemoto等,1983,Yakugaku
Zasshi 103:1151‑4;1155‑66;1167‑73;Kasai等,1989,Agric.Biol.Chem.53:3347‑9;
Matsumoto Chem.Pharm.Bull.,1990,38:2030‑2;和Prakash等,2011,J.Carbohydrate
Chem.30:16‑26。
苷:从常见的三萜前体氧化角鲨烯合成葫芦二烯醇,将葫芦二烯醇氧化以产生罗汉果醇,并
且将罗汉果醇糖基化以产生多种罗汉果苷。参见Tang等,BMC Genomics 12:343(2011)。
Tang等,2011,BMC Genomics 12:343描述了作为参与罗汉果苷生物合成之潜在候选物的七
种细胞色素P450和五种UGT。然而,Tang等没有具体鉴定参与罗汉果苷生物合成的任何细胞
色素P450或UGT。因此,仍然需要鉴定能够作用于任何罗汉果代谢物的细胞色素P450和UGT。
另外,虽然可以从罗汉果中提取罗汉果苷,但是仍然需要在用于商业用途的重组宿主中改
进罗汉果苷的产生。
的CYP1798多肽;
高同一性的环氧化物水解酶2多肽。
24,25环氧葫芦二烯醇水解以合成罗汉果醇。
CYP1798多肽所催化的。
接触。
CYP5491;
CYP1798;
性的环氧化物水解酶1或与SEQ ID NO:40所示的氨基酸序列具有65%或更高同一性的环氧
化物水解酶2;和/或
的氨基酸序列具有70%或更高同一性的UGT98;与SEQ ID NO:50所示的氨基酸序列具有
70%或更高同一性的UGTSK98;与SEQ ID NO:62所示的氨基酸序列具有45%或更高同一性
的UGT430;与SEQ ID NO:68所示的氨基酸序列具有45%或更高同一性的UGT1697;或者与
SEQ ID NO:72所示的氨基酸序列具有50%或更高同一性的UGT11789.
苷III A1、罗汉果苷III A2、罗汉果苷III、罗汉果苷III E、罗汉果苷IV、罗汉果苷IV A、罗
汉果苷V或赛门苷(siamenoside)中的一种或更多种。
24,25环氧葫芦二烯醇或11‑氧代‑罗汉果醇中的一种或更多种。
菌细胞、棒杆菌属(Cornebacterium)细菌细胞、醋杆菌属(Acetobacter)细菌细胞、不动杆
菌属(Acinetobacter)细菌细胞或假单胞菌属(Pseudomonas)细菌细胞。
pombe)、解脂耶氏酵母(Yarrowia lipolytica)、光滑假丝酵母(Candida glabrata)、棉阿
舒囊霉(Ashbya gossypii)、Cyberlindnera jadinii、巴斯德毕赤酵母(Pichia
pastoris)、乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉逊酵母(Hansenula
polymorpha)、博伊丁假丝酵母(Candida boidinii)、Arxula adeninivorans、红发夫酵母
(Xanthophyllomyces dendrorhous)或白假丝酵母(Candida albicans)。
肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。
A1、罗汉果苷III A2、罗汉果苷III、罗汉果苷III E、罗汉果苷IV、罗汉果苷V和赛门苷中的
一种或更多种。
书中所示的特征和优点的具体讨论而定义。
鲨烯产生24,25环氧葫芦二烯醇(步骤B),使用细胞色素P450从葫芦二烯醇产生11‑羟基‑葫
芦二烯醇(步骤C),使用细胞色素P450从24,25环氧葫芦二烯醇产生11‑羟基24,25环氧葫芦
二烯醇(步骤D),使用细胞色素P450从葫芦二烯醇产生24,25环氧葫芦二烯醇(步骤E),使用
细胞色素P450从11‑羟基‑葫芦二烯醇产生11‑羟基24,25环氧葫芦二烯醇(步骤F),使用环
氧化物水解酶从11‑羟基24,25环氧葫芦二烯醇产生罗汉果醇(步骤G),使用细胞色素P450
和环氧化物水解酶从11‑羟基‑葫芦二烯醇产生罗汉果醇(步骤F和G),以及使用一种或更多
种UGT产生一种或更多种罗汉果苷化合物(步骤H)。
的罗汉果葫芦二烯醇合酶从环氧角鲨烯产生24,25环氧葫芦二烯醇(步骤B),使用SEQ ID
NO:44的CYP5491从葫芦二烯醇产生11‑羟基‑葫芦二烯醇(步骤C),使用SEQ ID NO:44的
CYP5491从24,25环氧葫芦二烯醇产生11‑羟基24,25环氧葫芦二烯醇(步骤D),使用SEQ ID
NO:74的CYP1798从葫芦二烯醇产生24,25环氧葫芦二烯醇(步骤E),使用SEQ ID NO:74的
CYP1798从11‑羟基‑葫芦二烯醇产生11‑羟基24,25环氧葫芦二烯醇(步骤F),使用SEQ ID
NO:38的环氧化物水解酶1或SEQ ID NO:40的环氧化物水解酶2从11‑羟基24,25环氧葫芦二
烯醇产生罗汉果醇(步骤G),使用SEQ ID NO:74的CYP1798和SEQ ID NO:38的环氧化物水解
酶1或SEQ ID NO:40的环氧化物水解酶2从11‑羟基‑葫芦二烯醇产生罗汉果醇(步骤F和G),
以及使用SEQ ID NO:48的UGT1576、SEQ ID NO:62的UGT430、SEQ ID NO:68的UGT1697、SEQ
ID NO:53的UGT98和/或SEQ ID NO:72的UGT11789产生罗汉果苷化合物(步骤H)。
示意图。
是例如UGT1576(SEQ ID NO:48)或UGT1697(SEQ ID NO:68)。图4的UGTb可以是例如UGT430
(SEQ ID NO:62)或UGT1697(SEQ ID NO:68)。图4的UGTc可以是例如UGT430(SEQ ID NO:62)
或UGT1697(SEQ ID NO:68)。图4的UGTd可以是例如UGT1576(SEQ ID NO:48)或UGT1697(SEQ
ID NO:68)。图4的UGTe可以是例如UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:72).图4
的UGTf可以是例如UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:72)。图4的UGTg可以是例
如UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:72)。
所述酵母菌株,如实施例8所述。
NO:43)的酵母菌株中的葫芦二烯醇和羊毛甾醇产生,如实施例9所述。
个下图显示了这三个峰的碎片谱。3个峰的质量(443.38、441.37和457.36)在重量上分别对
应于羟基化葫芦二烯醇、氧代葫芦二烯醇和羟基加氧代葫芦二烯醇的质子加合物。
NO:39,SEQ ID NO:40)进行的从葫芦二烯醇到罗汉果醇和11‑氧代‑罗汉果醇的生物合成途
径。图9C显示了用酿酒酵母角鲨烯环氧酶ERG1(SEQ ID NO:54)、罗汉果CYP1798(SEQ ID
NO:5,SEQ ID NO:73,SEQ ID NO:74)、罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID NO:
43)、罗汉果CYP5491(SEQ ID NO:14,SEQ ID NO:44)和罗汉果环氧化物水解酶2(SEQ ID
NO:39,SEQ ID NO:40)进行的从氧化角鲨烯到罗汉果醇和11‑氧代‑罗汉果醇的潜在生物合
成途径。参见实施例9和15。
图,如实施例11所述.
自共表达UGT98以及UGT1576之酵母菌株的样品的LC‑MS色谱图,并显示了二糖基化和三糖
基化罗汉果醇(中框和下框)的产生,如实施例11所述.
果苷II A和罗汉果苷II E1,如实施例13所述。
II E(下图)。图15C显示了在共表达UGT1576、UGT430、UGT98和UGT11789的酵母细胞中产生
罗汉果苷V(上图)和罗汉果苷II E(下图),如实施例14所述。图15D显示了在共表达
UGT1576、UGT430和UGT11789的酵母细胞中产生三糖基化罗汉果苷,如实施例14所述。
ID NO:73,SEQ ID NO:74)和环氧化物水解酶的葫芦二烯醇产生宿主中产生的罗汉果醇,如
实施例15所述。
确结构、H NMR谱以及H与 C NMR化学位移(以ppm计),如实施例16所述。图18D显示了罗汉
1 1
果苷I E1的NMR明确结构、H NMR谱和H NMR化学位移(以ppm计),如实施例16所述。
种或更多种核酸。
重要的。相反,这些术语仅旨在突出可被用在或不被用在本发明的特定实施方案中的替选
的或额外的特征。
示在不导致所讨论主题之基本功能改变的情况下,定量表达可不同于所述参照的程度。
或y或z”。在一些实施方案中,“和/或”用于指重组细胞包含的外源核酸,其中重组细胞包含
选自一组的一种或更多种外源核酸.在一些实施方案中,“和/或”用于指罗汉果苷的产生,
其中产生了一种或更多种罗汉果苷。在一些实施方案中,“和/或”用于指罗汉果苷的产生,
其中通过一个或更多个以下步骤产生一种或更多种罗汉果苷:培养重组微生物,在重组微
生物中合成一种或更多种罗汉果苷,并分离一种或更多种罗汉果苷。
个或更多个葡萄糖部分糖基化的罗汉果醇。罗汉果醇是下面提供的式I化合物,其中R1和R2
均是‑H。
糖,并且表示了1,6‑和1,2‑键。例如,罗汉果苷V的R2基团包含通过一个1,6‑键和一个1,2‑
键连接的3个葡萄糖分子,构象表示为“Glc6‑Glc2‑Glc‑”。罗汉果苷IV、罗汉果苷V、11‑氧
代‑罗汉果苷V和赛门苷的结构见图1。
赛门苷I Glc‑ Glc6‑Glc2‑Glc‑
罗汉果苷IV Glc6‑Glc‑ Glc2‑Glc‑
罗汉果苷IV A Glc6‑Glc‑ Glc6‑Glc‑
罗汉果苷III Glc‑ Glc6‑Glc‑
罗汉果苷III A1 H Glc6‑Glc2‑Glc‑
罗汉果苷III A2(罗汉果苷IIIa) Glc6‑Glc‑ Glc‑
罗汉果苷III E Glc‑ Glc2‑Glc‑
罗汉果苷II A H Glc2‑Glc‑
罗汉果苷II A1 H Glc6‑Glc‑
罗汉果苷II A2 Glc6‑Glc‑ H
罗汉果苷II E Glc‑ Glc‑
罗汉果苷I A1(罗汉果苷Ib) H Glc‑
罗汉果苷I E1(罗汉果苷Ia) Glc‑ H
鲨烯、环氧角鲨烯、氧化角鲨烯、24,25环氧葫芦二烯醇、葫芦二烯醇、11‑羟基‑葫芦二烯醇、
11‑羟基24,25环氧葫芦二烯醇、11‑氧代‑罗汉果醇。参见例如图2和图9。例如,罗汉果苷I
A1是产物罗汉果苷II A和罗汉果苷III A1的前体。参见图12。在另一个实例中,罗汉果苷II
E通过三个酶促糖基化转化成罗汉果苷V。在一种可能的途径中,通过不限于UGT98(SEQ ID
NO:53)或UGT11789(SEQ ID NO:72)的UGT,首先经由1,6‑键将两个葡萄糖部分连接到罗汉
果苷II E的两个葡萄糖分子。通过不限于UGT98(SEQ ID NO:53)或UGT11789(SEQ ID NO:
72)的UGT将第三葡萄糖部分用1,2键添加到C24结合的葡萄糖部分。参见图4。
J.Agric.Food Chem.50:6710‑5。糖苷中间体存在于11‑羟基和11‑氧代系列两者中,并且随
着果实成熟,它们逐渐从罗汉果苷I转变为罗汉果苷V,表明在随后的糖基化之前,P450酶完
全氧化罗汉果醇前体(如葫芦二烯醇)的三萜核心.根据Tang等提出的方案,由三种独立的
细胞色素P450酶催化的氧化导致了由葫芦二烯醇形成罗汉果醇(图3B)。然而,所提出的初
步反应是不可能的,因为在通过细胞色素P450酶的两个羟基化反应之前需要24‑25双键的
饱和。如图3A所示,通过一种细胞色素P450酶对葫芦二烯醇环氧化,然后进行自发或酶催化
的水合,以及第二次P450酶催化的氧化可以导致产生罗汉果醇.如实施例11所述,产生罗汉
果醇或11‑氧代‑罗汉果醇的另一些途径如图9所示。
醇和/或罗汉果苷.如本文所用的术语“可检测量”、“可检测浓度”、“可测量量”和“可测量浓
度”是指以AUC、μM/OD600、mg/L、μM或mM测量的罗汉果苷和罗汉果苷前体的水平。可通过本领
域技术人员通常可用的技术来检测和/或分析罗汉果苷产生(即,总的、上清的和/或细胞内
的甜菊醇糖苷水平),所述技术例如但不限于液相色谱‑质谱法(liquid chromatography‑
mass spectrometry,LC‑MS)、薄层色谱法(thin layer chromatography,TLC)、高效液相色
谱法(high‑performance liquid chromatography,HPLC)、紫外‑可见光谱/分光光度法
(ultraviolet‑visible spectroscopy/spectrophotometry,UV‑Vis)、质谱法(mass
spectrometry,MS)和核磁共振光谱法(nuclear magnetic resonance spectroscopy,
NMR)。如本文所用,术语“相对丰度”用于指由MS或LC‑MS测量的特定离子的浓度,其中最强
的离子被指定100的相对丰度分数,并被称为基峰。
用角鲨烯环氧酶由角鲨烯产生氧化角鲨烯。角鲨烯合酶可以是根据EC 2.5.1.21分类的任
何酶。角鲨烯产生可以包括在NADPH存在下通过角鲨烯合酶催化法呢基焦磷酸转化的步骤。
因此在本发明的一些实施方案中(其中所述方法在体内进行),重组宿主可包含编码角鲨烯
合酶的异源核酸。在另一些方面中,角鲨烯合酶可以是内源性的。
拟南芥(Arabidopsis thaliana)(蛋白质登录号C4P9M3)、欧洲油菜(Brassica napus)、来
檬(Citrus macrophylla)、绿玉树(Euphorbia tirucalli)(蛋白质登录号B9WZW7)、大豆
(Glycine max)、光果甘草(Glycyrrhiza glabra)(蛋白质登录号Q42760、Q42761)、甘草
(Glycrrhiza uralensis)(蛋白质登录号D6QX40、D6QX41、D6QX42、D6QX43、D6QX44、D6QX45、
D6QX47、D6QX39、D6QX55、D6QX38、D6QX53、D6QX37、D6QX35、B5AID5、B5AID4、B5AID3、C7EDD0、
C6KE07、C6KE08、C7EDC9)、百脉根(Lotusjaponicas)(蛋白质登录号Q84LE3)、蒺藜苜蓿
(Medicago truncatula)(蛋白质登录号Q8GSL6)、豌豆(Pisum sativum)、蓖麻(Ricinus
communis)(蛋白质登录号B9RHC3)、梅(Prunus mume),或与任意前述角鲨烯合酶具有至少
70%同一性的功能同源物。
分类的任何酶。氧化角鲨烯产生可以包括在NADPH存在下通过角鲨烯环氧酶催化角鲨烯转
化的步骤。参见例如实施例8。
ERG1被过表达。
白质登录号Q9SM02(SEQ ID NO:89)、O65403(SEQ ID NO:90)、O65402(SEQ ID NO:91)、
O65404(SEQ ID NO:92)、O81000(SEQ ID NO:93)或Q9T064(SEQ ID NO:94))、欧洲油菜(蛋
白质登录号O65727(SEQ ID NO:95)、O65726(SEQ ID NO:96))、绿玉树(蛋白质登录号
A7VJN1(SEQ ID NO:97))、蒺藜苜蓿(蛋白质登录号Q8GSM8(SEQ ID NO:98)、Q8GSM9(SEQ ID
NO:99))、豌豆和蓖麻(蛋白质登录号B9R6V0(SEQ ID NO:100)、B9S7W5(SEQ ID NO:101)、
B9S6Y2(SEQ ID NO:102)、B9T0Y3(SEQ ID NO:103)、B9S7T0(SEQ ID NO:104)、B9SX91(SEQ
ID NO:105)),或与上述任何角鲨烯环氧酶具有至少70%同一性的功能同源物。
烯环化酶的葫芦二烯醇合酶,例如Shibuya,Tetrahedron,60:6995‑7003(2004)所描述的氧
化角鲨烯环化酶。
70%序列同一性的功能同源物.在一些实施方案中,与SEQ ID NO:1所示的氨基酸序列具有
至少70%同一性的多肽包括但不限于来自以下的多肽:百脉根(Lotus japonicas)
(BAE53431)、毛果杨(Populus trichocarpa)(XP_002310905)、黑升麻(Actaea racemosa)
(ADC84219)、白桦(Betula platyphylla)(BAB83085)、光果甘草(BAA76902)、葡萄(Vitis
vinifera)(XP_002264289)、积雪草(Centella asiatica)(AAS01524)、人参(Panax
ginseng)(BAA33460)、和白桦(BAB83086).所述葫芦二烯醇合酶可以是与上述葫芦二烯醇
合酶具有至少70%同一性的任何葫芦二烯醇合酶。
酸序列。因此,在一些实施方案中,葫芦二烯醇合酶是具有SEQ ID NO:2所示氨基酸序列的
多肽。
葫芦二烯醇的一种或更多种酶优选包含葫芦二烯醇合酶。参见实施例9以及图2B和2C的步
骤B。葫芦二烯醇合酶可以是例如Shibuya,Tetrahedron 60:6995‑7003(2004)所述的葫芦
二烯醇合酶,或如上所述的葫芦二烯醇合酶。在一些实施方案中,催化环氧角鲨烯转化为
24,25环氧葫芦二烯醇的葫芦二烯醇合酶是SEQ ID NO:1的多肽或与其具有至少70%同一
性的功能同源物。
中,CYP5491(SEQ ID NO:14,SEQ ID NO:44)催化葫芦二烯醇转化为11‑羟基‑葫芦二烯醇.
参见实施例10以及图2B和2C的步骤C。
CYP8224、CYP8728、CYP10020或CYP10285(分别由SEQ ID NO:3‑20编码)中的一种或更多种
产生罗汉果醇。eYAC技术可用于评估细胞色素P450酶的活性,如实施例8所述.或者,体外反
应可用于评估该活性.因此,在本发明的一个实施方案中,至少一种细胞色素P450酶包含由
以下核酸序列编码的多肽:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID
NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID
NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID
NO:19、SEQ ID NO:20,或与其具有至少70%同一性的功能同源物.
环氧葫芦二烯醇。在一些实施方案中,细胞色素P450酶催化24,25环氧葫芦二烯醇的羟基化
以形成11‑羟基‑24,25环氧葫芦二烯醇。在一些实施方案中,能够催化24,25环氧葫芦二烯
醇的羟基化以形成11‑羟基‑24,25环氧葫芦二烯醇的酶是CYP5491(SEQ ID NO:14,SEQ ID
NO:44),或与SEQ ID NO:44具有至少50%序列同一性的功能同源物。参见实施例9以及图2B
和2C的步骤D。
的CYP1798。参见图2B和2C的步骤E。在一些方面中,11‑羟基24,25环氧葫芦二烯醇由11‑羟
基‑葫芦二烯醇产生。在一些方面中,细胞色素P450催化11‑羟基‑葫芦二烯醇的转化以产生
11‑羟基24,25环氧葫芦二烯醇。细胞色素P450可以是SEQ ID NO:74的CYP1798。参见图2B和
2C的步骤F。
化11‑羟基‑葫芦二烯醇向罗汉果醇的转化。参见图2B和2C的步骤F和G.具有细胞色素P450
活性的酶包括由以下所示核酸序列编码的多肽:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、
SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ
ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ
ID NO:18、SEQ ID NO:19、SEQ ID NO:20,或与其具有至少70%序列同一性的功能同源物。
优选具有环氧化物水解酶活性的酶催化从环氧化物和水产生乙二醇。具有环氧化物水解酶
活性的酶的非限制性实例包括罗汉果环氧化物水解酶1和罗汉果环氧化物水解酶2。因此,
具有环氧化物水解酶活性的酶可以包含与SEQ ID NO:38所示的氨基酸序列具有至少75%
序列同一性的多肽、与SEQ ID NO:40所示的氨基酸序列具有至少65%序列同一性的多肽,
及其功能同源物。
氧化物水解酶活性的酶。参见图2B和2C的步骤G。具有环氧化物水解酶活性的酶的实例包括
如上所述的罗汉果环氧化物水解酶1和罗汉果环氧化物水解酶2。在一些实施方案中,能够
催化11‑羟基‑24,25环氧葫芦二烯醇的转化以产生罗汉果醇的酶包含与SEQ ID NO:38所示
的氨基酸序列具有至少75%序列同一性的多肽、与SEQ ID NO:40所示的氨基酸序列具有至
少65%序列同一性的多肽,及其功能同源物。
是从葫芦二烯醇产生罗汉果醇和11‑氧代‑罗汉果醇的示意图,而图9C是从氧化角鲨烯产生
罗汉果醇和11‑氧代‑罗汉果醇的示意图。另参见实施例15。
I E1、罗汉果苷II A、罗汉果苷II A1、罗汉果苷II A2、罗汉果苷II E、罗汉果苷III A1、罗
汉果苷III A2、罗汉果苷III、罗汉果苷III E、罗汉果苷IV、罗汉果苷IV A或赛门苷.这样的
UGT可以包含例如SEQ ID NO:21的拟南芥UGT73C3、SEQ ID NO:23的拟南芥UGT73C6、SEQ ID
NO:25的甜叶菊(Stevia rebaudiana)UGT85C2、SEQ ID NO:22的拟南芥UGT73C5、SEQ ID
NO:24的甜叶菊UGT73E1,或与上述UGT具有至少70%同一性的功能同源物.UGT还可以包含
SEQ ID NO:53的UGT98、由SEQ ID NO:27编码的UGT1495、由SEQ ID NO:28编码的UGT1817、
由SEQ ID NO:30编码的UGT5914、由SEQ ID NO:31编码的UGT8468、由SEQ ID NO:32编码的
UGT10391,或上述任何UGT的功能同源物。参见实施例4和7。
一个UGT可以是SEQ ID NO:21的UGT73C3、SEQ ID NO:23的UGT73C6、SEQ ID NO:25的
UGT85C2、SEQ ID NO:24的UGT73E1,或与上述UGT具有至少70%同一性的功能同源物。参见
实施例4。
基化),至少一个UGT可以是SEQ ID NO:22的UGT73C5或与其具有至少60%序列同一性的功
能同源物.参见实施例4。
基转移酶活性。参见实施例11。
糖的1,2‑糖基化和1,6‑糖基化以形成罗汉果苷III A1。参见实施例11。在一些实施方案中,
UGT98(SEQ ID NO:53)可以用于将罗汉果苷II E转化成罗汉果苷IV、罗汉果苷V、11‑氧代‑
罗汉果苷V和/或赛门苷I。参见实施例7。
的UGTSK98具有至少70%同一性的UGT.参见实施例11。在某些方面中,UGT98催化1,2和1,6
葡萄糖连接以将罗汉果苷II E转化成罗汉果苷V。参见实施例14.
施例13。
1,2和/或1,6葡萄糖连接。在一些实施方案中,UGT11789将罗汉果苷I E1、罗汉果苷I A1、罗
汉果苷II E、罗汉果苷II A、罗汉果苷III E、罗汉果苷III A2、罗汉果苷III、罗汉果苷IV或
赛门苷糖基化。在一些实施方案中,将UGT11789与罗汉果苷I E1、罗汉果苷I A1、罗汉果苷
II E、罗汉果苷II A、罗汉果苷III E、罗汉果苷III A2、罗汉果苷III、罗汉果苷IV或赛门苷
接触,产生罗汉果苷II A1、罗汉果苷II A2、罗汉果苷III、罗汉果苷III A1、罗汉果苷III
A2、罗汉果苷IV、罗汉果苷IV A、赛门苷或罗汉果苷V。参见实施例14。
氧化角鲨烯产生重组宿主可以在体内产生罗汉果醇前体、罗汉果醇或罗汉果苷,所述宿主
表达一种或更多种编码葫芦二烯醇合酶多肽的基因、编码细胞色素P450多肽的基因、编码
细胞色素P450还原酶多肽的基因、编码环氧化物水解酶多肽的基因和编码UGT多肽的基因。
参见实施例15和16。
汉果苷。所述方法还可以使用重组和非重组宿主的混合。在包括使用两种或更多种宿主的
实施方案中,可以共培养或分别培养宿主。如果分别培养宿主,则可以回收中间产物并任选
地将中间产物纯化或部分纯化,并使用中间产物作为底物加入重组宿主。合适的重组宿主
如下所述。
行的反应。参见WO 2013/076577和WO2014/086842。
鲨烯。在一些实施方案中,角鲨烯合酶是ERG9,ERG9的氨基酸序列如SEQ ID NO:87所示。在
一些实施方案中,角鲨烯合酶对于宿主是内源的。在一些实施方案中,内源角鲨烯合酶和/
或角鲨烯环氧酶拷贝数的增加、编码角鲨烯合酶和/或角鲨烯环氧酶的异源核酸分子的表
达,或者内源角鲨烯合酶和/或角鲨烯环氧酶的表达提高可以改善在重组宿主中产生的罗
汉果苷的水平。
性的,但可以通过编码角鲨烯环氧酶的核酸的额外拷贝和/或通过使用更强的启动子来提
高表达水平。
通过用引导较低水平羊毛甾醇合酶表达的较弱启动子代替羊毛甾醇合酶的内源启动子引
导的表达来实现。在酵母中,ERG7基因编码羊毛甾醇合酶。因此,当重组宿主是酵母时,ERG7
基因启动子可以被替换为另一个启动子,后者引导的表达水平低于ERG7的内源表达水平。
因此,羊毛甾醇合酶可以是酿酒酵母的ERG7基因的产物(其序列在本文中提供为SEQ ID
NO:55),或与其具有至少50%序列同一性的功能同源物。参见实施例8和15。
Appl.Environ.Microbiol.63:3341‑4中描述了一种可用的截短形式的酵母HMG还原酶
(tHMG1)。
45%序列同一性的功能同源物。还可以通过降低羊毛甾醇合酶活性来提高环氧角鲨烯的水
平.还可以通过表达截短形式的3‑羟基‑3‑甲基戊二酰‑辅酶A还原酶(tHMG1,SEQ ID NO:
77,SEQ ID NO:78)来提高环氧角鲨烯的水平。参见实施例8和15。
芦二烯醇。重组宿主可以共表达编码一种或更多种细胞色素P450酶的异源核酸和编码CYP
活化剂的异源核酸.CYP活化剂可以是例如CPR4497(SEQ ID NO:45,SEQ ID NO:46)或与SEQ
ID NO:46具有至少50%序列同一性的功能同源物。参见实施例10、15和16.
45,SEQ ID NO:46)和环氧化物水解酶的葫芦二烯醇产生酿酒酵母菌株产生罗汉果醇。在一
些实施方案中,环氧化物水解酶是环氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:40)。在一
些实施方案中,葫芦二烯醇产生酿酒酵母菌株还过表达由ERG1编码的角鲨烯环氧酶(SEQ
ID NO:54),表达截短的HMG还原酶(tHMG1,SEQ ID NO:77,SEQ ID NO:78),表达罗汉果葫芦
二烯醇合酶(SEQ ID NO:42,SEQ ID NO:43),其缺失TRP1基因,并且包含被破坏的内源ERG7
基因的启动子(SEQ ID NO:55).参见实施例15。
的基因、编码细胞色素P450多肽的基因、编码细胞色素P450还原酶多肽的基因、编码环氧化
物水解酶多肽的基因和/或编码糖基转移酶的基因。在一些方面中,编码糖基转移酶的基因
包含编码与SEQ ID NO:48所示的氨基酸序列具有60%或更高同一性的UGT1576多肽的基
因、编码与SEQ ID NO:62所示的氨基酸序列具有45%或更高同一性的UGT430多肽的基因、
编码与SEQ ID NO:68所示的氨基酸序列具有45%或更高同一性的UGT1697多肽的基因、编
码与SEQ ID NO:72所示的氨基酸序列具有50%或更高同一性的UGT11789多肽的基因,和/
或编码与SEQ ID NO:53所示的氨基酸序列具有70%或更高同一性的UGT98多肽的基因。参
见实施例16。
44)、CYP1798(SEQ ID NO:5,SEQ ID NO:74)、CYP1798‑II(SEQ ID NO:86,SEQ ID NO:74)、
CPR4497(SEQ ID NO:82,SEQ ID NO:46)、环氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:
40)、UGT1576(SEQ ID NO:83,SEQ ID NO:48)、UGT430(SEQ ID NO:84,SEQ ID NO:62)、
UGT1697(SEQ ID NO:85,SEQ ID NO:68)、UGT98(SEQ ID NO:52,SEQ ID NO:53)和UGT11789
(SEQ ID NO:71,SEQ ID NO:72)。在一些实施方案中,所述菌株是具有酿酒酵母EXG1基因缺
失的酿酒酵母288C的Matα衍生物。在一些实施方案中,所述宿主还产生罗汉果苷IVA、罗汉
果苷II A2、罗汉果苷I E1和罗汉果醇。参见实施例16。
触可导致在体外产生罗汉果苷。在一些实施方案中,通过在体外将上游罗汉果苷前体与参
与罗汉果苷途径的一种或更多种酶接触来产生罗汉果醇前体。例如,将葫芦二烯醇与细胞
色素P450多肽和环氧化物水解酶接触可导致在体外产生罗汉果醇。
步骤A);或者
图2B和2C的步骤B);或者
步骤C);或者
烯醇(参见图2B和2C的步骤D);或者
步骤E);或者
醇(参见图2B和2C的步骤F)。
酸序列具有75%或更高同一性的环氧化物水解酶1,或者与SEQ ID NO:40所示的氨基酸序
列具有65%或更高同一性的环氧化物水解酶2(参见图2B和2C的步骤G).
汉果苷IV、赛门苷或罗汉果苷V;或者
行一个或更多个步骤。
因、编码环氧化物水解酶多肽的基因和编码UGT多肽的基因。例如,可以从表达一种或更多
种UGT的宿主制备细胞裂解物并将其用于接触罗汉果醇,以使得可以在体外产生罗汉果苷。
修饰细胞中的罗汉果醇或罗汉果苷前体;在体内修饰后,将罗汉果苷分泌到培养基中。参见
实施例11‑14。
编码UGT多肽之基因的宿主可以在细胞中摄取罗汉果醇并糖基化罗汉果醇;在体内糖基化
后,将罗汉果苷分泌到培养基中。
化剂以将罗汉果醇前体或罗汉果苷前体转移到细胞中。在一些实施方案中,可以以纯化形
式或者作为组合物或提取物的一部分提供罗汉果醇前体或罗汉果苷前体。
苷II E转化为三糖基化罗汉果苷。在一些实施方案中,表达UGT11789、UGT1576和UGT430的
宿主催化罗汉果醇转化为三糖基化罗汉果苷。在一些实施方案中,共表达UGT11789、UGT98、
UGT1576和UGT430的重组宿主比表达UGT98、UGT1576和UGT430的重组宿主更有效地将所供
给的罗汉果醇转化为罗汉果苷V。参见实施例14。
已知是指人工(by the hand of man)引入或增加。因此,重组基因可以是来自另一物种的
DNA序列,或者可以是源自或存在于相同物种但已通过重组方法并入宿主以形成重组宿主
的DNA序列。应当理解,引入宿主的重组基因可以与正常存在于被转化宿主中的DNA序列相
同,并且被引入以提供所述DNA的一个或更多个另外的拷贝,从而允许该DNA基因产物的过
表达或经修饰表达。在一个优选的实施方案中,DNA是在细胞中产生的基因mRNA转录物的
cDNA拷贝。
一些实施方案中,重组宿主是酿酒酵母细胞,异源序列来自酿酒酵母以外的生物体。异源编
码序列例如可以来自原核微生物、真核微生物、植物、动物、昆虫或不同于表达异源序列的
重组宿主的真菌.在一些实施方案中,编码序列是对宿主天然的序列。
在一些实施方案中,角鲨烯环氧酶多肽(包括但不限于SEQ ID NO:54的角鲨烯环氧酶多
肽)、葫芦二烯醇合酶多肽(包括但不限于SEQ ID NO:43的葫芦二烯醇合酶多肽)、细胞色素
P450多肽(包括但不限于SEQ ID NO:44的CYP5491多肽)、细胞色素P450还原酶多肽(包括但
不限于SEQ ID NO:46的CPR4497多肽)、环氧化物水解酶多肽(包括但不限于SEQ ID NO:38
的EH1多肽或SEQ ID NO:40的EH2多肽)和/或UGT多肽(包括但不限于SEQ ID NO:48的
UGT1576,SEQ ID NO:62的UGT430,SEQ ID NO:68的UGT1697,SEQ ID NO:72的UGT11789,SEQ
ID NO:53的UGT98,或SEQ ID NO:50的UGTSK98)是融合多肽。术语“嵌合体”、“融合多肽”、
“融合蛋白”、“融合酶”、“嵌合蛋白”、“嵌合多肽”和“嵌合酶”在本文中可互换使用,是指通
过连接编码不同蛋白质的两种或更多种基因而改造的蛋白质.在一些实施方案中,编码角
鲨烯环氧酶多肽、葫芦二烯醇合酶多肽、细胞色素P450多肽、细胞色素P450还原酶多肽、环
氧化物水解酶多肽和/或糖基转移酶多肽的核酸序列包含编码“标签”的标签序列,其被设
计成辅助对所编码多肽的随后的操作(例如,辅助纯化或检测)、分泌或定位.标签序列可插
入编码多肽的核酸序列中,以使得所编码标签位于多肽的羧基或氨基末端。所编码标签的
非限制性实例包括绿色荧光蛋白(GFP)、人流感血凝素(HA)、谷胱甘肽S转移酶(GST)、多组
TM
氨酸标签(HIS标签)和Flag 标签(Kodak,New Haven,CT)。标签的其他实例包括叶绿体转运
肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。
案中,第一蛋白质的结构域和第二蛋白质的结构域在功能上是相同的或功能上相似。在一
些实施方案中,第二蛋白质结构域的结构和/或序列与第一蛋白质结构域的结构和/或序列
不同。在一些实施方案中,通过域交换改变细胞色素P450还原酶多肽。例如,在一些方面中,
CPR4497(SEQ ID NO:46)的细胞色素P450结构域或还原酶结构域被CPR4497(SEQ ID NO:
46)以外的细胞色素P450结构域或细胞色素P450还原酶的还原酶结构域所代替。在另一些
方面中,通过域交换来改变UGT多肽。
同源物和参照多肽可以是天然存在的多肽,并且序列相似性可以归因于收敛或发散的演化
事件。因此,功能同源物有时在文献中指定为同源物、或直系同源物或旁系同源物.天然存
在的功能同源物的变体(例如由野生型编码序列的突变体编码的多肽)本身可以是功能同
源物。还可以通过对多肽编码序列的定点诱变,或通过组合来自不同天然存在多肽的编码
序列的结构域(“域交换”)来产生功能同源物。用于修饰编码本文所述功能性多肽的基因的
技术是已知的,并且尤其包括定向演化技术,定点诱变技术和随机诱变技术,并且可用于增
加多肽的比活性、改变底物特异性、改变表达水平、改变亚细胞定位或以期望的方式修饰多
肽‑多肽相互作用。这种经修饰的多肽被认为是功能同源物.术语“功能同源物”有时应用于
编码功能同源多肽的核酸.
用UGT氨基酸序列作为参照序列的非冗余数据库的BLAST、交互BLAST或PSI‑BLAST分析。在
某些情况下,氨基酸序列是从核苷酸序列推导的。数据库中那些具有大于40%序列同一性
的多肽是进一步评估其作为甜菊醇糖苷生物合成多肽的适用性的候选物.氨基酸序列相似
性允许进行保守氨基酸替换,例如以一个疏水性残基替换另一个疏水性残基,或以一个极
性残基替换另一个极性残基。如果需要,可以对这些候选物进行手动检查,以缩小待进一步
评估的候选物数目。可以通过选择那些似乎具有存在于甜菊醇糖苷生物合成多肽中的结构
域(例如保守功能结构域)的候选物来进行手动检查。
结构域,或代表蛋白质基序或结构域。参见例如在万维网上描述多种蛋白质基序和结构域
的共有序列的Pfam网站,sanger.ac.uk/Software/Pfam/和pfam.janelia.org/。包括在
Pfam数据库中的信息在Sonnhammer等,Nucl.Acids Res.,26:320‑322(1998);Sonnhammer
等,Proteins,28:405‑420(1997);和Bateman等,Nucl.Acids Res.,27:260‑262(1999)中描
述。保守区也可以通过对来自密切相关物种的相同或相关多肽的序列进行比对来确定.密
切相关的物种优选来自同一科。在一些实施方案中,对来自两种不同物种的序列比对足以
鉴定此类同源物。
80%,或至少90%的氨基酸序列同一性).在一些实施方案中,保守区表现出至少92%、
94%、96%、98%或99%的氨基酸序列同一性。
物,其中表达一种或更多种催化本发明方法步骤的酶(例如合酶、水解酶、CYP450和/或
UGT)。在本文的上下文中,术语“微生物”和“微生物宿主”和“重组宿主”可以互换使用来表
示微观生物体,包括细菌或微观真菌,包括酵母。微生物可以是但不限于真核细胞或永生化
细胞.
(Aspergillus)、芽孢杆菌属(Bacillus)、假丝酵母属(Candida)、棒杆菌属
(Corynebacterium)、埃希氏菌属(Escherichia)、镰孢菌(Fusarium)/赤霉属
(Gibberella)、克鲁维酵母属(Kluyveromyce)、硫磺菌属(Laetiporus)、香菇属
(Lentinus)、红发夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤酵母属(Pichia)、
藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母属
(Schizosaccharomyces)、痂圆孢属(Sphaceloma)、红发夫酵母属(Xanthophyllomyces)和
耶氏酵母属(Yarrowia)。来自这些属的示例性物种包括虎皮香菇(Lentinus tigrinus)、硫
磺菌(Laetiporus sulphureus)、黄孢原毛平革菌(Phanerochaete chrysosporium)、巴斯
德毕赤酵母(Pichia pastoris)、小立碗藓(Physcomitrella patens)、粘红酵母
(Rhodoturula glutinis)32、胶红酵母(Rhodoturula mucilaginosa)、红发夫酵母
(Phaffia rhodozyma)UBV‑AX、红发夫酵母(Xanthophyllomyces dendrorhous)、藤仓镰刀
菌(Fusarium fujikuroi)/腾仓赤霉(Gibberella fujikuroi)、产朊假丝酵母(Candida
utilis)和解脂耶氏酵母。在一些实施方案中,微生物可以是子囊菌(Ascomycete),例如腾
仓赤霉、乳酸克鲁维酵母、粟酒裂殖酵母、黑曲霉(Aspergillus niger)或酿酒酵母。在一些
实施方案中,微生物可以是原核生物,例如大肠杆菌(Escherichia coli)、类球红细菌
(Rhodobacter sphaeroides)或荚膜红细菌(Rhodobacter capsulatus).应当理解,可以使
用某些微生物以高通量方式筛选和测试目的基因,而使用具有所需生产力或生长特性的其
他微生物以大规模生产罗汉果醇前体、罗汉果醇或罗汉果苷。
孢杆菌(B.subtilis)。本发明提供的经构建和经遗传改造的微生物可以使用常规发酵方法
培养,尤其包括恒化器、分批、补料分批培养、持续灌注发酵和持续灌注细胞培养。
种细胞。
酵母(S.kluyveri),贝酵母(S.bayanus)、少孢酵母(S.exiguus)、S.sevazzi或葡萄汁酵母
(S.uvarum);属于克鲁维酵母属的酵母,例如K.laclis、马克斯克鲁维酵母变种
(K.marxianus var.marxianus)或K.thermololerans。属于假丝酵母属的酵母,例如
C.ulilis、C.iropicalis、白假丝酵母、解脂假丝酵母(C.lipolylica)或C.versalilis;属
于毕赤酵母属的酵母,例如R.slipidis、R.pasloris或P.sorbilophila;或者其他酵母属,
例如隐球酵母属(Cryplococcus)、德巴利酵母属(Debaromyces)、汉逊酵母属(Hansenula)、
毕赤酵母属、耶氏酵母属(Yarrowia)、接合酵母属(Zygosaccharomyces)或裂殖酵母属
(Schizosaccharomyces)。关于其他微生物,提供了适当的丝状真菌的非穷尽列表:属于青
霉菌属(Penicillium)、根霉菌属(Rhizopus)、镰刀菌属(Fusarium)、梭链孢菌属
(Fusidium)、赤霉菌属(Gibberella)、毛霉菌属(Mucor)、Morlierella属和木霉菌属
(Trichoderma)的物种。
允许合理设计多种模块以提高产物产量.用于制备重组微生物的方法是已知的。
醇或罗汉果苷的接受分子。
霉(A.clavatus)、黄曲霉(A.flavus)、黑曲霉和土曲霉(A.terreus)的基因组核苷酸序列均
是可获得的,从而允许合理设计和修饰内源途径以提高通量和提高产物产率。已经开发了
用于曲霉属的代谢模型,以及转录组学研究和蛋白组学研究。黑曲霉被培养用于工业化生
产多种食品成分,例如柠檬酸和葡糖酸,并且因此例如黑曲霉的物种通常适用于产生罗汉
果醇前体、罗汉果醇或罗汉果苷。
及其他信息,从而允许合理设计多种模块以提高产物的产率。可使用与上文针对酵母属所
述的那些类似的方法来制备重组大肠杆菌微生物。
已经由内源基因产生。因此,可以将含有用于生物合成萜烯的重组基因的模块从这些属引
入到物种中,而不需要引入其他化合物或途径基因。
上生长,并且可同化硝酸盐。其已成功地应用于产生可以生产天然塑料的菌株或者应用于
开发用于环境样品中之雌激素的生物传感器。
氧的并且被认为是非致病性的.耶氏酵母在使用疏水性底物(例如烷烃、脂肪酸、油)方面是
高效的,并且可以在糖上生长。它具有很高的工业应用潜力,是一种产油微生物。解脂耶氏
酵母可以将脂质含量积累到其干细胞重量的约40%,并且是用于脂质积累和再活化的模式
生物体.参见例如Nicaud,2012,Yeast 29(10):409‑18;Beopoulos等,2009,Biochimie 91
(6):692‑6;Bankar等,2009,Appl Microbiol Biotechnol.84(5):847‑65。
母(Rhodotorula toruloides)菌株已经显示为用于改善生物质和脂质生产力的高效补料
分批发酵系统(Li等,2007,Enzyme and Microbial Technology 41:312‑7)。
Biotechnology 90(4):1219‑27).
异的平台.已报道了分泌型外来蛋白的多克级范围的产率.最近,计算方法IPRO在实验上预
测了将博伊丁假丝酵母木糖还原酶的辅因子特异性从NADPH转化至NADH的突变。参见例如
Mattanovich等,2012,Methods Mol Biol.824:329‑58;Khoury等,2009,Protein Sci.18
(10):2125‑38。
于生产乙型肝炎疫苗、胰岛素和用于治疗丙型肝炎的干扰素α‑2a,还用于一系列技术酶。参
见例如Xu等,2014,Virol Sin.29(6):403‑9。
生产凝乳酶(通常存在于牛的胃中的一种酶)等以生产奶酪。生产以40,000L的规模在发酵
罐中进行。参见例如van Ooyen等,2006,FEMS Yeast Res.6(3):381‑92。
范围内在学术界中被用于生产蛋白质。已将菌株改造成可生产复杂的人N‑多糖(酵母多糖
与在人中发现的那些类似但不相同)。参见例如Piirainen等,2014,N Biotechnol.31(6):
532‑7。
代谢物。
细胞的增殖,同时抑制或阻止缺乏标志物的细胞的增殖.如果可选择标志物是抗生素抗性
基因,则可以在存在可选择标志物赋予其抗性之抗生素的条件下培养转染的宿主群体。如
果可选择标志物是补充宿主营养缺陷型的基因,则可以在不存在宿主营养缺陷型之化合物
的情况下培养转染的宿主群体.
表征或使用。该过程可以重复一次或更多次以增强宿主内表达构建体的稳定性。为了产生
罗汉果苷途径多肽,可以培养包含一个或更多个表达载体的重组宿主以在本领域已知的任
何合适的培养装置中扩增细胞数目,例如摇动培养瓶或发酵罐。
含无机盐和化合物、氨基酸、碳水化合物、维生素和对于宿主的生长或者改善宿主的健康或
2+ 2+
生长或者两者必需的其他化合物。特别地,培养基通常包含锰(Mn )和镁(Mg )离子,其是
许多(但不是全部)糖基转移酶的辅因子。
应器,并且其中产物保留在生物反应器中直到运行结束。在一些实施方案中,将所有营养物
进料到生物反应器中。
除外‑1,3‑β‑葡聚糖水解酶活性。在本发明的一些实施方案中,当重组宿主是酵母时,可以
通过缺失EXG1基因(SEQ ID NO:63,SEQ ID NO:64)和/或EXG2基因(SEQ ID NO:65,SEQ ID
NO:66)来实现,两者均编码外‑1,3‑β‑葡聚糖水解酶。
实施例
20%甲醇的水溶液洗涤。将产物用甲醇洗脱。在高真空下溶剂蒸发和干燥后,得到罗汉果苷
V(2.5g)。该产物纯度约为80%,其中11‑氧代罗汉果苷V是最大的杂质。
酯(2×100mL)提取。将有机提取物真空干燥,随后用制备型HPLC纯化。得到纯的罗汉果醇
(40mg),通过NMR和质谱法确认其结构。参见图5。
100mL)提取.将有机提取液真空干燥并用制备型HPLC纯化。得到纯的罗汉果苷I E1
(11.0mg)和罗汉果苷I A1(8.0mg).通过NMR和质谱法确认其结构.参见图5。
物包含4X Tris缓冲液、罗汉果醇(250μM)、UDP‑葡萄糖(750μM)和1%碱性磷酸酶。将5μL每
种部分纯化的UGT酶或粗酶提取物添加至反应,并将反应体积用水加至50μL.将反应物在30
℃孵育过夜,并在灭菌的96孔板中进行反应。随后将25μL的DMSO添加至每个反应,并将反应
板离心5分钟.从每孔中取出40μL样品并过滤以用于LC‑MS分析。
和罗汉果苷I A1两者。UGT73E1(SEQ ID NO:24)将罗汉果醇转化为罗汉果苷1 A1(主要产
物)和既不是罗汉果苷I E1也不是罗汉果苷I A1的糖基化罗汉果醇.该产物由C11‑OH上的
糖基化事件产生;精确质量显示为罗汉果苷I。
数据库)分析,从而鉴定了涵盖所推测的764氨基酸序列中的338个的部分基因序列。在蛋白
质水平上,部分CirCS与西葫芦基因具有97.5%同一性(SEQ ID NO:2;SEQ ID NO:1的残基
515至764)。
12:343(2011))。使用10E‑10或更低的E值来鉴定与数据库查询序列同源的序列。
CYP6479、CYP7604、CYP8224、CYP8728、CYP10020和CYP10285(参见表2,SEQ ID NO:3‑20)。
ID NO:12)、CYP4491(SEQ ID NO:13)、CYP5491(SEQ ID NO:14、SEQ ID NO:44)、CYP7604
(SEQ ID NO:16)、CYP8224(SEQ ID NO:17)和CYP10285(SEQ ID NO:20)的全长合成的罗汉
果基因序列克隆到酵母表达载体中。
Tang等,BMC Genomics 12:343(2011)).所鉴定的基因是UGT98(SEQ ID NO:26)、UGT1495
(SEQ ID NO:27)、UGT1817(SEQ ID NO:28)、UGT3494(SEQ ID NO:29)、UGT5914(SEQ ID NO:
30)、UGT8468(SEQ ID NO:31)、UGT10391(SEQ ID NO:32)、UGT11789(SEQ ID NO:33)、
UGT11999(SEQ ID NO:34)、UGT13679(SEQ ID NO:35)和UGT15423(SEQ ID NO:36)。
公开获得的序列读数形成的重叠群(contig)合成的(Tang等,BMC Genomics 12:343
(2011))。将所述基因插入酵母表达载体中。
段。当酵母菌株在正常SC培养基中生长时,ERG7表达因此降低。ERG7编码羊毛甾醇合酶,已
知降低的表达导致面包酵母中氧化角鲨烯和环氧角鲨烯的积累.氧化角鲨烯通常是三萜类
化合物的前体。为了进一步提高氧化角鲨烯和环氧角鲨烯的可用性,将ERG1(SEQ ID NO:
54)编码的角鲨烯环氧酶过表达,并表达酵母HMG还原酶(tHMG1,SEQ ID NO:77,SEQ ID NO:
78)的截短拷贝.
水解酶1如SEQ ID NO:38所示,密码子优化的罗汉果环氧化物水解酶1如SEQ ID NO:37所
示。罗汉果环氧化物水解酶2如SEQ ID NO:40所示,密码子优化的罗汉果环氧化物水解酶2
如SEQ ID NO:39所示。图6显示了在用表达罗汉果环氧化物水解酶2的质粒转化之酵母菌株
的样品中对应于四羟基角鲨烯的质子加Na+加合物的LC‑MS质量峰501.四羟基角鲨烯是通
过环氧角鲨烯的2,3和22,23‑环氧键的水解产生的.在背景酵母菌株中没有检测出四羟基
角鲨烯的积累。通过将培养物等分试样在50%DMSO中煮沸来制备样品,然后通过离心沉淀
细胞材料。然后通过ESI LC‑MS测量上清液。
SC培养基中在30℃下生长5天。通过在50%乙醇/20%KOH中煮沸培养物样品5分钟来提取葫
芦二烯醇,然后用等体积的己烷提取。然后将样品用己烷蒸发,将干燥的提取物重悬于甲醇
中。
羊毛甾醇的峰显示保留时间为约8.05,而对应于葫芦二烯醇的峰的保留时间为7.85。在LC‑
MS色谱图中,羊毛甾醇和葫芦二烯醇二者都显示质量为409.4(质子加合物减去一个H2O分
子的质量)。
见实施例9),LC‑MS可见三个峰(参见图8)。图8中的上框显示了具有这三个峰的LC‑MS色谱
图,而三个下框显示了这三个峰的碎片谱.3个峰的质量(443.38、441.37和457.36)在重量
上分别对应于羟基化葫芦二烯醇、氧代葫芦二烯醇和羟基加氧代葫芦二烯醇的质子加合
物.羟基化葫芦二烯醇(质子化质量443.38)和氧化葫芦二烯醇(质子化质量441.37)分别为
11‑羟基‑葫芦二烯醇和11‑氧代‑葫芦二烯醇,如通过NMR所证实(图9).
51和SEQ ID NO:53所示,而SEQ ID NO:52对应于UGT98的密码子优化形式。UGTSK98的核苷
酸和氨基酸序列在本文中分别如SEQ ID NO:49和SEQ ID NO:50所示,UGT1576的核苷酸和
氨基酸序列在本文中分别如SEQ ID NO:47和SEQ ID NO:48所示。
48)的质粒转化时,形成了罗汉果苷I A1(图11B)。通过将培养物等分试样与DMSO以1∶1混
合,随后煮沸(80℃)5分钟并通过离心沉淀来制备样品.然后对上清液进行ESI LC‑MS。图
10A显示了参照罗汉果苷I A1的LC‑MS色谱图,而图10B显示了来自供给有50μM罗汉果醇的
培养物中之表达UGT1576的酵母样品的峰.这些数据显示,UGT1576基因编码具有罗汉果醇
C24‑OH UDP‑糖基转移酶活性的糖基转移酶。
和EXG2的酵母菌株中时,没有检测到供给的罗汉果醇的转化。相比之下,将UGT98(SEQ ID
NO:51,SEQ ID NO:52,SEQ ID NO:53)或UGT SK98(SEQ ID NO:49,SEQ ID NO:50)与
UGT1576(SEQ ID NO:47和SEQ ID NO:48)在供给罗汉果醇的酵母中共表达导致罗汉果苷I
A1的进一步糖基化。将UGTSK98与UGT1576共表达导致产生二糖基化罗汉果醇(罗汉果苷II
A,图11A),而与UGT98共表达产生二糖基化和三糖基化罗汉果醇(中框和下框,图11B)。在
LC‑MS中,通过UGT98和UGTSK98二者形成的二糖基化罗汉果醇具有不同于罗汉果苷II E和
罗汉果苷II A1的保留时间。
然后催化罗汉果苷II A的1,6‑糖基化以形成罗汉果苷III A1(图11B)。UGT98和UGTSK98属
于UDP葡萄糖糖基转移酶的UGT91家族,已知该家族成员是1,2‑和1,6‑糖基转移酶。图12示
意性地概述了从罗汉果醇到罗汉果苷III A1的糖基化反应。
苷的脱糖基化)的酵母菌株中。使酵母菌株在减去色氨酸(以用于选择质粒维持)并含有10μ
M罗汉果醇的SC培养基中生长。将细胞在30℃下以140rpm摇动培养2天。2天后,将300μL培养
物样品与300μL 96%乙醇混合,并在80℃下孵育10分钟。然后将样品离心,通过LC‑MS分析
上清液。
孔径),该柱偶联到具有负模式的电喷雾离子化(electrospray ionization,ESI)的Waters
Xevo TQD三重四极杆质谱仪。通过两种流动相A(含有0.1%甲酸的水)和B(含有0.1%甲酸
的MeCN)的梯度来实现化合物分离,其中在0.3至2.0分钟从20%增加到50%B,在2.01分钟
时增加到100%B,保持100%B 0.6分钟,并再平衡0.6分钟。流量为0.6mL/分钟,柱温为55
℃。使用SIR(Single Ion Recording,单离子记录)监测罗汉果苷I E1(m/z 683.5;[M+
‑
FA]),并与标准品进行比较。
罗汉果苷I E1参照化合物具有相同的保留时间.UGT430有效并完全地将罗汉果醇糖基化,
因为在表达UGT430的酵母的2天生长期后没有所供给的罗汉果醇残留.因此,罗汉果UGT430
是在罗汉果的罗汉果苷生物合成途径中导致罗汉果醇分子C‑3位上的羟基糖基化的UGT。
苷的脱糖基化)的酵母菌株中。使酵母菌株在减去组氨酸(以用于选择质粒维持)并含有10μ
M罗汉果醇的SC培养基中生长。将细胞在30℃下以140rpm摇动培养2天。2天后,将300μL培养
物样品与300μL 96%乙醇混合,并在80℃下孵育10分钟。然后将样品离心,通过LC‑MS分析
上清液。
孔径),该柱偶联到具有负模式的电喷雾离子化(ESI)的Waters Xevo TQD三重四极杆质谱
仪。通过两种流动相A(含有0.1%甲酸的水)和B(含有0.1%甲酸的MeCN)的梯度来实现化合
物分离,其中在0.3至2.0分钟从20%增加到50%B,在2.01分钟时增加到100%B,保持100%
B 0.6分钟,并再平衡0.6分钟。流量为0.6mL/分钟,柱温为55℃。使用SIR(单离子记录)监测
‑
罗汉果苷I E1(m/z 683.5;[M+FA]),并与标准品进行比较。
果苷I A1。参见图14A。该结果表明,罗汉果UGT1697将罗汉果醇C‑24位上的羟基糖基化.如
实施例11所示,UGT1576还表现出罗汉果醇的C‑24糖基化。
UGT1697将罗汉果醇上的C‑3和C‑24位糖基化,并且是罗汉果的罗汉果苷生物合成途径的一
部分。
ID NO:70,SEQ ID NO:71,SEQ ID NO:72)、UGT430(SEQ ID NO:61,SEQ ID NO:62)、UGT1576
(SEQ ID NO:47,SEQ ID NO:48)和UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)共
转化EXG1和EXG2缺失的酵母菌株。另外,用UGT430(SEQ ID NO:61,SEQ ID NO:62)、UGT1576
(SEQ ID NO:47,SEQ ID NO:48)和UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)共
转化EXG1和EXG2缺失的酵母菌株。使酵母菌株在减去组氨酸、尿嘧啶、色氨酸和亮氨酸(用
于选择质粒维持)并包含10μM罗汉果醇的SC培养基中生长。细胞在30℃下以140rpm摇动培
养2天。2天后,将300μL培养物样品与300μL 96%乙醇混合,并在80℃下孵育10分钟。然后将
样品离心,并通过LC‑MS分析上清液.
径),该柱偶联到具有负模式的电喷雾离子化(ESI)的Waters Xevo TQD三重四极杆质谱仪。
通过梯度I或梯度II实现化合物分离。对于梯度I,将80%流动相A(含有0.1%甲酸的水)和
20%流动相B(含有0.1%甲酸的MeCN)的初始缓冲液浓度在0.3分钟至2.0分钟从20%增加
至40%B,在2.01分钟时增加到100%B,在100%B下保持0.6分钟,并再平衡0.6分钟。对于梯
度II,将80%流动相A(含有0.1%甲酸的水)和20%流动相B(含有0.1%甲酸的MeCN)的初始
缓冲液浓度在0.3分钟至2.0分钟从20%增加至50%B,在2.01分钟时增加到100%B,在
100%B下保持0.6分钟,并再平衡0.6分钟.对于梯度I和梯度II二者,流量为0.6mL/分钟,柱
温为55℃.使用SIR(单离子记录)监测罗汉果醇和罗汉果苷,并与来自植物提取物(3W
botanical extract.Inc.)的市售罗汉果苷混合物进行比较。SIR示踪如下:罗汉果醇(m/z
‑ ‑
521.4;[M+FA‑H]),罗汉果醇+1葡萄糖(m/z 683.5;[M+FA‑H]),罗汉果醇+2葡萄糖(m/z
‑ ‑
799.5;[M‑H]),罗汉果醇+3葡萄糖(m/z 961.6;[M‑H]),罗汉果醇+4葡萄糖(m/z 1123.6;
‑ ‑
[M‑H])以及罗汉果醇+5葡萄糖(m/z 1285.66;[M‑H])。得到的LC‑MS色谱图如图15所示。
NO:72)表达的效果。图15B显示,在酿酒酵母菌株中共表达罗汉果UGT1576(SEQ ID NO:47,
SEQ ID NO:48)和UGT430(SEQ ID NO:61,SEQ ID NO:62)后产生了罗汉果苷II E,所述酿酒
酵母菌株通过多功能UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)的共表达将供给
的罗汉果醇转化为罗汉果苷V.图15B中的罗汉果苷V峰的强度测量为8.65E3(LC‑MS色谱图
中的峰离子强度)。罗汉果UGT1576(SEQ ID NO:47,SEQ ID NO:48)、UGT430(SEQ ID NO:61,
SEQ ID NO:62)、UGT98(SEQ ID NO:51,SEQ ID NO:52,SEQ ID NO:53)和UGT11789(SEQ ID
NO:70,SEQ ID NO:72)在酿酒酵母菌株中的共表达更有效地将供给的罗汉果醇转化为罗汉
果苷V,如图15C所示。图15C中的罗汉果苷V峰的强度测量为2.22E5(LC‑MS色谱图中的峰离
子强度)。
酵母中有效产生罗汉果苷V所需的每个葡萄糖‑葡萄糖1,2‑和1,6‑连接。罗汉果苷II E可以
被UGT11789糖基化以形成连接有3个葡萄糖的罗汉果苷(图15D).因为UGT11789属于UGT91
家族并且不能糖基化罗汉果醇核心,所以罗汉果苷IIE的这种糖基化通过1,2‑键或1,6‑键
进行,因此UGT11789的产物是罗汉果苷III或罗汉果苷IIIA2。
氧化角鲨烯的可用性,将内源ERG7基因(SEQ ID NO:55)的启动子破坏以降低羊毛甾醇合酶
在缺失TRP1基因的酿酒酵母菌株中的表达。为了进一步提高酿酒酵母中氧化角鲨烯的可用
性,将由ERG1编码的角鲨烯环氧酶(SEQ ID NO:54)过表达,并且表达截短的HMG还原酶
(tHMG1,SEQ ID NO:77,SEQ ID NO:78).将编码罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ
ID NO:43)的密码子优化基因和编码罗汉果CPR4497(SEQ ID NO:45,SEQ ID NO:46)的密码
子优化基因整合到酿酒酵母菌株的基因组中,导致通过ESI LC‑MS可检测的葫芦二烯醇的
产生(图7B)。
NO:40)的质粒转化葫芦二烯醇产生酿酒酵母菌株,并在减去尿嘧啶、亮氨酸、组氨酸和色氨
酸以用于质粒维持的SC培养基中生长。细胞在30℃下以140rpm摇动培养4天.4天后,将300μ
L培养物样品与300μL的96%乙醇混合,并在80℃下孵育10分钟。然后离心样品,通过LC‑MS
分析上清液。使用Waters Acquity I‑Class UPLC(Waters Corporation,Milford,MA)来进
行LC‑MS分析,其具有Waters Acquity C18柱(2.1×50mm,1.7μm颗粒,
孔径),该柱偶联到具有负模式的电喷雾离子化(ESI)的Waters Xevo TQD三重四极杆质谱
仪。通过两种流动相A(含有0.1%甲酸的水)和B(含有0.1%甲酸的MeCN)的梯度来实现化合
物分离,其中在0.3至3.5分钟从20%增加到40%B,在1.0分钟内增加到100%B,保持100%B
1.0分钟,并再平衡0.6分钟。流量为0.6mL/分钟,柱温为55℃。使用SIR(单离子记录)监测罗
‑
汉果醇(m/z 521.4;[M+FA‑H]),并与标准品进行比较。
ID NO:39,SEQ ID NO:40)的表达导致罗汉果醇的产生(图16)。图8表明CYP5491单独在葫芦
二烯醇产生菌株中的表达。显示了11‑羟基‑葫芦二烯醇(质量443)和11‑氧代‑葫芦二烯醇
(质量441)的峰。仅在CYP1798与环氧化物水解酶2共表达后有效地产生罗汉果醇。因此,
CYP1798催化葫芦二烯醇和/或11‑羟基‑葫芦二烯醇的24‑25碳双键的环氧化。
ID NO:42、SEQ ID NO:43)、CYP5491(SEQ ID NO:81、SEQ ID NO:44)、CYP1798(SEQ ID NO:
5、SEQ ID NO:74)、CYP1798‑II(SEQ ID NO:86、SEQ ID NO:74)、CPR4497(SEQ ID NO:82、
SEQ ID NO:46)、环氧化物水解酶2(SEQ ID NO:39、SEQ ID NO:40)、UGT1576(SEQ ID NO:
83、SEQ ID NO:48)、UGT430(SEQ ID NO:84、SEQ ID NO:62)、UGT1697(SEQ ID NO:85、SEQ
ID NO:68)、UGT98(SEQ ID NO:52、SEQ ID NO:53)和UGT11789(SEQ ID NO:71、SEQ ID NO:
72)在两侧为生长选择性标志物的表达盒中整合到酿酒酵母菌株中。通过Genscript合成密
码子优化的罗汉果葫芦二烯醇合酶(SEQ ID NO:42,SEQ ID NO:43)、CYP1798(SEQ ID NO:
5,SEQ ID NO:74)、CPR4497(SEQ ID NO:81,SEQ ID NO:46)和UGT98(SEQ ID NO:52,SEQ ID
NO:53).密码子优化的CYP5491(SEQ ID NO:81,SEQ ID NO:44)、UGT1576(SEQ ID NO:83,
SEQ ID NO:48)、UGT430(SEQ ID NO:84,SEQ ID NO:62)和UGT11789(SEQ ID NO:71,SEQ ID
NO:72)如酿酒酵母 基因片段(Integrated DNA Technologies)合成。密码子优化
的CYP1798‑II(SEQ ID NO:86,SEQ ID NO:74)和UGT1697(SEQ ID NO:85,SEQ ID NO:68)以
TM
及天然CPR4497(SEQ ID NO:45,SEQ ID NO:46)如 Strings DNA片段(Life
Technologies)合成。密码子优化的环氧化物水解酶1(SEQ ID NO:37,SEQ ID NO:38)和环
氧化物水解酶2(SEQ ID NO:39,SEQ ID NO:40)通过DNA2.0合成。
将悬浮液在4400rpm和4℃下离心15分钟。使用0.22μm SterilFlip过滤器(Millipore)过滤
上清液。图17显示了过滤后的罗汉果苷V产生菌株的LC‑MS色谱图.然后将粗产物在半制备
型Agilent 1200 HPLC系统上分离。该系统装备有Synergi 4u Hydro RP 柱
(Phenomenex:柱尺寸250×21.2mm,4微米).使用流动相洗脱液B(含有0.02%三氟乙酸的乙
腈)和洗脱剂A(含有0.02%三氟乙酸的水)进行洗脱,其通过从0.0分钟至2.0分钟将梯度从
5%线性提高到8%B,从2.0分钟至12.0分钟将梯度从8%线性提高到25%B,从12.0分钟至
20.0分钟将从25%提高至50%B,从20.0分钟至32.0分钟将梯度从50%提高至100%B,最后
用100%B洗涤并重新平衡来进行。使用15mL/分钟的流量进行分离,其在室温下进行。通过
LC‑MS分析所有级分,合并包含有单一罗汉果苷化合物的级分,并真空干燥.
1 1 1 13 1 13
冲NMR实验,即H,H‑COSY、H,C‑HSQC和H,C‑HMBC实验解析结构。来自酿酒酵母产生菌株
的纯化罗汉果苷峰被确认为罗汉果苷I E1、罗汉果苷II A2、罗汉果苷IV A,和主要产物罗
1 1 13
汉果苷V。图18A显示了罗汉果苷V的NMR阐明的结构、H NMR谱以及H和 C NMR化学位移(以
1 1 13
ppm计)。图18B显示了罗汉果苷II A2的NMR阐明的结构、H NMR谱以及 H和 C NMR化学位移
1 1 13
(以ppm计)。图18C显示了罗汉果苷IV A的NMR阐明的结构、H NMR谱以及H与 C NMR化学位
1 1
移(以ppm计)。图18D显示了罗汉果苷I E1的NMR阐明的结构、H NMR谱和H化学位移(以ppm
计)。
在本文中被认为是特别有利的,但是预期本发明不一定限于本发明的这些特定方面。