杜仲3-羟基-3-甲基戊二酰辅酶A还原酶蛋白编码序列转让专利

申请号 : CN200410065000.6

文献号 : CN1760363B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 蒋继宏曹小迎开国银陈凤美

申请人 : 蒋继宏

摘要 :

一种杜仲eu-Hmgr蛋白编码序列,属于基因工程领域。所分离出的DNA分子包括:编码具有杜仲eu-Hmgr蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ IDNO.3中从核苷酸第170-1952位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55℃条件下与SEQ ID NO.3中从核苷酸第170-1952位的核苷酸序列杂交。本发明是一种3-羟基-3-甲基戊二酰辅酶A的还原酶,有助于提高杜仲中次生代谢产物或其前体的含量,次生代谢产物具有双向调节人体血压的作用,并可降低人体胆固醇含量,预防心脑血管硬化等功能。对于保护人民的健康生长有所帮助。

权利要求 :

1.一种编码杜仲3-羟基-3甲基戊二酰辅酶A还原酶的基因,其特征在于所述的核苷酸序列由SEQ ID NO.3中第170-1942位的核苷酸所构成。

2.根据权利要求1所述的一种杜仲3-羟基-3甲基戊二酰辅酶A还原酶,其特征是所述的氨基酸序列即为SEQ ID NO.4所示的氨基酸序列。

3.根据权利要求1所述的杜仲3-羟基-3甲基戊二酰辅酶A还原酶蛋白的核苷酸序列转化的宿主细胞,其特征是所述的宿主细胞是真核细胞。

说明书 :

技术领域

本发明涉及分子生物学、基因工程技术领域。具体地,本发明涉及一种在杜仲中表达的eu-Hmgr蛋白(杜仲3-羟基-3-甲基戊二酰辅酶A还原酶蛋白,Eucommiaulmoides 3-hydroxy-3-methylglutaryl-CoA Reductase,EUHMGR)及其核酸序列。

背景技术

杜仲(Eucommia ulmoides Oliver)又名丝连皮、扯丝皮、丝棉皮、玉丝皮、思仲等,属落叶乔木,在植物分类学上属杜仲科杜仲属。杜仲是我国特有树种,经济价值很高,资源稀少,被我国有关部门定为国家二级珍贵保护树种。近代医学研究发现,杜仲除传统的医疗功效外,还具有双向调节血压的作用,并可降低人体胆固醇含量,预防心脑血管硬化。医学上研究发现胆固醇的合成与HMGR活性相关,由于HMGR在调控胆固醇中起重要作用,所以人们将植物类异戊二烯途径研究的焦点也多集中在HMGR上。
近年来,对许多植物材料的次生代谢的研究证明,HMGR是甲羟戊酸途径中一个关键酶。在甲羟戊酸途径中3-羟基-3-甲基戊二酸单酰CoA(HMGCoA)在HMGR的作用下生成甲羟戊酸(MVA)。由于该反应是一个不可逆过程,因此HMGR被认为是该途径中第一个限速酶。通过提高3-羟基-3-甲基戊二酰辅酶A还原酶的活性或含量,可以间接的提高杜仲中次生代谢产物或其前体的含量。近代科学研究发现,次生代谢产生天然活性物质,是解决目前世界面临的西药毒副作用大,癌症、艾滋病等疑难疾病无法医治等难题的一条新途径。
在对现有文献的分析中,“Plant Cell(植物细胞),1992,4(10):1333-1344”报道了从马铃薯中克隆了3-羟基-3-甲基戊二酰辅酶A还原酶基因,NCBI网站上公布了橡胶树等的3-羟基-3-甲基戊二酰辅酶还原酶基因的序列。但至今尚未有杜仲eu-Hmgr蛋白序列及其核酸序列报道。
在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的杜仲eu-Hmgr蛋白序列及其核酸序列。

发明内容

本发明的目的在于克服现有技术中的不足,提供一种杜仲eu-Hmgr蛋白编码序列。使其包含所说基因的融合基因构建体,携带该构建体的新的重组表达载体,被所说的表达载体转化植物细胞,以及由转化细胞产生的所说基因的转基因植物及其后代,包括植物种子及植物组织,所获得的转基因植物将具有显著提高的次生代谢产物含量。
本发明是通过以下技术方案实现的,本发明所分离出的DNA分子包括:编码具有杜仲eu-Hmgr蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸第170-1942位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55℃条件下与SEQ ID NO.3中从核苷酸第170-1942位的核苷酸序列杂交。
较佳地,所述的序列编码具有SEQ ID NO.3所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.3中从核苷酸第170-1942位的核苷酸序列。
本发明分离出的杜仲eu-Hmgr蛋白多肽,它包括:具有SEQ ID NO.3氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.3序列的多肽。
本发明所提供的载体DNA分子转化的宿主细胞,它是真核细胞。它包含所述的DNA分子中8-100个连续核苷酸。
本发明用上述载体。在实例中该宿主细胞是烟草。
在本发明中,“分离的”、“纯化的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组分分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“杜仲eu-Hmgr蛋白(或多肽)编码序列”指编码具有杜仲eu-Hmgr蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中第170-1942位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框第170-1942位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中第170-1942位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.3所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.3中从核苷酸第170-1942位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.3中从核苷酸第170-1942位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的杜仲eu-Hmgr蛋白相同功能的蛋白的SEQ IDNO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,术语“杜仲eu-Hmgr蛋白或多肽”指具有杜仲eu-Hmgr蛋白活性的SEQ ID NO.3序列的多肽。该术语还包括具有与天然杜仲eu-Hmgr蛋白相同功能的SEQ ID NO.4序列的变异形式。这些交异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括杜仲eu-Hmgr蛋白的活性片段和活性衍生物。
本发明的杜仲eu-Hmgr蛋白多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与杜仲eu-Hmgr蛋白DNA杂交的DNA所编码的蛋白、以及利用杜仲tm-Hmgr蛋白多肽的血清获得的多肽或蛋白。
在本发明中,“杜仲eu-Hmgr蛋白保守性变异多肽”指与SEQ ID NO.3的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1
  最初的残基   代表性的取代   优选的取代   Ala(A)   Val;Leu;Ile   Val   Arg(R)   Lys;Gln;Asn   Lys   Asn(N)   Gln;His;Lys;Arg   Gln   Asp(D)   Glu  Glu   Cys(C)   Ser  Ser   Gln(Q)   Asn  Asn   Glu(E)   Asp  Asp   Gly(G)   Pro;Ala  Ala   His(H)   Asn;Gln;Lys;Arg  Arg   Ile(I)   Leu;Val;Met;Ala;Phe  Leu   Leu(L)   Ile;Val;Met;Ala;Phe  Ile   Lys(K)   Arg;Gln;Asn  Arg   Met(M)   Leu;Phe;Ile  Leu   Phe(F)   Leu;Val;Ile;Ala;Tyr  Leu   Pro(P)   Ala  Ala   Ser(S)   Thr  Thr   Thr(T)   Ser  Ser   Trp(W)   Tyr;Phe  Tyr   Tyr(Y)   Trp;Phe;Thr;Ser  Phe   Val(V)   Ile;Leu;Met;Phe;Ala  Leu
表2
87% identity in 208 nt overlap
Query:1695 aggtgggtactgttggagggggcactcaacttgcatctcagtctgcttgcttgaacttac  1754
            |||||||||| || ||||| || ||||||||||||||||||||||||||  | || || |
Sbjct:2128 aggtgggtacagtcggaggtggaactcaacttgcatctcagtctgcttgtctcaatttgc  2187
Query:1755 ttggggttaagggtgcaaacaaagagtcccctggatcaaattcaaggctcttagcggcca  1814
            ||||||| |||||||||||||||||||| || |||||||| ||||||||| | || ||||
Sbjct:2188 ttggggtgaagggtgcaaacaaagagtcgccaggatcaaactcaaggctccttgctgcca  2247
Query:1815 tagttgctggttctgttttggcaggagagctctcattgatgtctgctattgccgctgggc 1874
            | || |||||||| |||||||| || |||||||| ||||||||||| ||||| |||||||
Sbjct:2248 tcgtagctggttcagttttggctggtgagctctccttgatgtctgccattgcagctgggc 2307
Query:1875 agctggtcaatagtcacatgaagtacaac 1903
            |||| ||||| ||||||||||||||||||
Sbjct:2308 agcttgtcaagagtcacatgaagtacaac 2336
81% identity in 337 nt overlap
Query:1349 ggaaacttctgttcagataagaaaccggctgcggtaaattggattgagggccgtggaaaa 1408
            ||||| || ||||| |||||||| || ||||| |||||||||||||| || ||||| |||
Sbjct:1688 ggaaatttttgttcggataagaagcctgctgctgtaaattggattgaaggacgtggcaaa 1747
Query:1409 tcagttgtttgtgaggcaatcatctcggaagacatagtgaggaaggtacttaaaactact 1468
            |||||||||||||||||||| |||  ||||||  | |||| |||||| |  ||||| | |
Sbjct:1748 tcagttgtttgtgaggcaattatcaaggaagaggtggtgaagaaggtgttgaaaaccaat 1807
Query:1469 gttccagcccttgtagagcttaatatgcttaagaaccttgccggatcggcggttgctggt 1528
            ||  |  |||| || |||||||| |||| |||||| ||||| || || || |||||||||
Sbjct:1808 gtggcctccctagtggagcttaacatgctcaagaatcttgctggttctgctgttgctggt 1867
Query:1529 gctctgggtggtttcaatgcccatgcagccaacatcgtttctgcagtgtttatagctact 1588
            ||| ||||||| || ||||||||||||| ||||||||| |||||| | ||||| || |||
Sbjct:1868 gctttgggtggatttaatgcccatgcaggcaacatcgtatctgcaatctttattgccact 1927
Query:1589 ggccaagacccggcccaaaatattgaaagctctcactgtataacaatgatggaagcggtg 1648
            ||||| || || || || ||| |||| || ||||| || || || ||||||||||| ||
Sbjct:1928 ggccaggatccagcacagaatgttgagagttctcattgcattaccatgatggaagctgtc 1987
Query:1649 aatgatgggaaggatcttcacatttccgtgactatgcc 1686
            |||||||| |||||||| || || || ||||| |||||
Sbjct:1988 aatgatggaaaggatctccatatctctgtgaccatgcc 2025
80% identity in 220 nt overlap
Query:299 gcgctcccccttcccctttacctaaccaatggaattttcttcacgctcttcttctccgta 358
           ||||| || |||||||| ||||| ||||| |   ||||||||||||| |||||||| ||
Sbjct:127 gcgcttccgcttcccctctacctgaccaacgcggttttcttcacgctgttcttctcggtg 186
Query:359 gcctactaccttctccaccggtggcgcgacaagatccgcaattcgactcctctccacgtc 418
           || || ||||| || |||||||||||||||||||||||||| || ||||| || ||  ||
Sbjct:187 gcgtattacctccttcaccggtggcgcgacaagatccgcaactccactccccttcatatc 246
Query:419 ttgactctttctgagctcgccgccattgtttctcttatagcctcatttatatatctccta 478
           | ||||| |||||   | |  || ||||| || || || ||||| || || || ||||||
Sbjct:247 gttactctctctgaaattgttgctattgtctccctcattgcctctttcatttacctccta 306
Query:479 ggttttttcggcatcgatttcgtgcagtccttcattgcacg 519
           || || ||||| |||||||| |||||||| |||||||||||
Sbjct:307 ggattcttcggtatcgattttgtgcagtcattcattgcacg 347
81% identity in 169 nt overlap
Query:1178 tttgcaaggcttcaaggcattcagtgttctatagcgggaaaaaatctttacatgagattt 1237
            ||||| ||||| ||||||||| | || || || || || || |||||||| || |||||
Sbjct:1140 tttgcgaggctccaaggcattaaatgctcaattgctggtaagaatctttatataagattc 1199
Query:1238 acctgtagcactggtgatgctatggggatgaacatggtgtcaaaaggtgtgcagaatatt 1297
            | ||| |||||||| ||||| ||||||||||||||||| || ||||| || || ||  ||
Sbjct:1200 agctgcagcactggcgatgcaatggggatgaacatggtttctaaaggggttcaaaacgtt 1259
Query:1298 ctcgagtttcttcaaaatgattttccagatatggatgtaattggtatctc 1347
            || || |||||||||| ||||||| | ||||||||||| ||||| |||||
Sbjct:1260 cttgaatttcttcaaagtgatttttctgatatggatgtcattggaatctc 1309
78% identity in 259 nt cverlap
Query:755 ctcggggactgctatcgtgcggcctcaattcgccgcgaggcgattcagaggatcacaggt 814
           |||||||||||| | || ||||| |  ||||| ||||||||  | |||||||| ||| |
Sbjct:588 ctcggggactgcaaacgagcggctgcgattcgacgcgaggctttgcagaggatgacaagg 645
Query:815 aagtcgctgtcgggcttgccattggaaggatttgattacgaggcgattttagggcagtgt 874
           | |||||||   ||||||||| | ||||| || ||||||||| |||||||||| || ||
Sbjct:646 aggtcgctggaaggcttgccagtagaagggttcgattacgagtcgattttaggacaatgc 705
Query:875 tgtgagatgccgattggcttccttcaaatcccggtcggtattgcgggacctttgttgttg 934
           ||||| |||||  | || | | | || || ||||| || |||||||| || |||||| ||
Sbjct:706 tgtgaaatgccagtgggatacgtgcagattccggtggggattgcggggccgttgttgctg 765
Query:935 aacggctgcgaatactcggtgccaatggcgacgacagaggggtgcttggttgcgagtacc 994
           |||||  | || ||||| || ||||||||||| || ||||| || ||||| ||||| ||
Sbjct:766 aacgggcgggagtactctgttccaatggcgaccacggagggttgtttggtggcgagcact 825
Query:995 aacagaggatgcaaggcgat 1014
           || ||||| || ||||||||
Sbjct:826 aatagagggtgtaaggcgat 845
Query:杜仲eu-Hmgr的核酸序列
Sbjct:帕拉橡胶树hb-Hmgr的核酸序列(AY352338.1)
表2为本发明的杜仲eu-Hmgr与帕拉橡胶树(Para rubber tree)ps-Hmgr的核苷酸序列的同源比较(GAP)表。
表3
78% identity in 576 aa overlap,86% similarity in 576 aa overlap
Query:13  TNGRNHHLHHQGNSSSPAIDCSPSPIPKASDALPLPLYLTNGIFFTLFFSVAYYLLHRWR 72
           T GR HH  H   ++P   D SP+  PKASDALPLPLYLTN +FFTLFFSVAYYLLHRWR
Sbjct:3   TTGRLHHRKH----ATPVEDRSPT-TPKASDALPLPLYLTNAVFFTLFFSVAYYLLHRWR 57
Query:73  DKIRNSTPLHVLTLSELAAIVSLIASFIYLLGFFGIDFVQSFIARASHDPWDVDD-DERF 131
           DKIRNSTPLH++TLSE+ AIVSLIASFIYLLGFFGIDFVQSFIARASHD WD++D D  +
Sbjct:58  DKIRNSTPLHIVTLSEIVAIVSLIASFIYLLGFFGIDFVQSFIARASHDVWDLEDTDPNY 117
Query:132 ILEEDRRRGPCTAALDCLVGPVAPSISDVRKLMDPPAPLPSVEDEQMVKSVISGTVPSYS 191
           +++ED R    C A      +  + + +       APL S EDE +V SV+ G +PSYS
Sbjct:118 LIDEDHRLVTCPPANISTKTTIIAAPTKLPTSEPLIAPLVSEEDEMIVNSVVDGKIPSYS 177
Query:192 LESKLGDCYRAASIRREAIQRITGKSLSGLPLEGFDYEAILGQCCEMPIGFLQIPVGIAG 251
           LESKLGDC RAA+IRREA+QR+T+SL  GLP+EGFDYE+ILGQCCEMP+G++QIPVGIAG
Sbjct:178 LESKLGDCKRAAAIRREALQRMTRRSLEGLPVEGFDYESILGQCCEMPVGYVQIPVGIAG 237
Query:252 PLLLNGCEYSVPMATTEGCLVASTNRGCKAIYASGGATSILLRDGMTRAPVVRFPSAKRA 311
           PLLLNG EYSVPMATTEGCLVASTNRGCKAIY SGGATS+LL+DGMTRAPVVRF SA RA
Sbjct:238 PLLLNGREYSVPMATTEGCLVASTNRGCKAIYLSGGATSVLLKDGMTRAPVVRFASATRA 297
Query:312 SELKFFLEDPLNFETLSMVFNKSSRFARLQGIQCSIAGKNLYMRFTCSTGDAMGMNMVSK 371
           +ELKFFLEDP NF+TL++VFNKSSRFARLQGI+CSIAGKNLY+RF+CSTGDAMGMNMVSK
Sbjct:298 AELKFFLEDPDNFDTLAVVFNKSSRFARLQGIKCSIAGKNLYIRFSCSTGDAMGMNMVSK 357
Query:372 GVQNILEFLQNDFPDMDVIGISGNFCSDKKPAAVNWIEGRGKSVVCEAIISEDIVRKVLK 431
           GVQN+LEFLQ+DF DMDVIGISGNFCSDKKPAAVNWIEGRGKSVVCEAII E++V+KVLK
Sbjct:358 GVQNVLEFLQSDFSDMDVIGISGNFCSDKKPAAVNWIEGRGKSVVCEAIIKEEVVKKVLK 417
Query:432 TTVPALVELNMLKNXXXXXXXXXXXXFNAHAANIVSAVFIATGQDPAQNIESSHCITMME 491
           T  V +LVELNMLKN             FNAHA NIVSA+FIATGQDPAQN+ESSHCITMME
Sbjct:418 TNVASLVELNMLKNLAGSAVAGALGGFNAHAGNIVSAIFIATGQDPAQNVESSHCITMME 477
Query:492 AVNDGKDLHISVTMPSIEVGTVGGGTQLASQSACLNLLGVKGANKESPGSNSRLLAAIVA 551
           AVNDGKDLHISVTMPSIEVGTVGGGTQLASQSACLNLLGVKGANKESPGSNSRLLAAIVA
Sbjct:478 AVNDGKDLHISVTMPSIEVGTVGGGTQLASQSACLNLLGVKGANKESPGSNSRLLAAIVA 537
Query:552 GSVLAGELSLMSAIAAGQLVNSHMKYNRSNRDFTKVTS 589
            GSVLAGELSLMSAIAAGQLV SHMKYNRS++D+K  S
Sbjct:538 GSVLAGELSLMSAIAAGQLVKSHMKYNRSSKDMSKAAS 575
Query:杜仲eu-Hmgr氨基酸序列
Sbjct:帕拉橡胶树hb-Hmgr氨基酸序列(GenBank Accession No.AAQ63055.1)
表3为本发明的杜仲eu-Hmgr蛋白的氨基酸序列与帕拉橡胶树hb-Hmgr的氨基酸序列的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。
发明还包括杜仲eu-Hmgr蛋白或多肽的类似物。这些类似物与天然3-羟基-3-甲基戊二酰辅酶A还原酶多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的杜仲eu-Hmgr蛋白多肽时,可以将杜仲eu-Hmgr蛋白编码序列可操作地连于表达调控序列,从而形成杜仲eu-Hmgr蛋白表达载体。
如本发明所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”为真核细胞。常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。
还可用Northern印迹法技术分析杜仲eu-Hmgr蛋白基因产物的表达,即分析杜仲eu-Hmgr蛋白的RNA转录物在细胞中的存在与否和数量。
此外,本发明中可用作探针的核酸分子,该分子通常具有杜仲eu-Hmgr蛋白核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码杜仲eu-Hmgr蛋白的核酸分子。
本发明涉及检测样品中是否存在杜仲eu-Hmgr蛋白核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于杜仲eu-Hmgr蛋白核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的杜仲tm-Hmgr蛋白核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选杜仲eu-Hmgr蛋白同源基因或同源蛋白。
为了得到与杜仲eu-Hmgr蛋白基因相关的杜仲cDNAs的点阵,可以用DNA探针筛选杜仲cDNA文库,这些探针是在低严紧条件下,用32P对杜仲eu-Hmgr蛋白的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自杜仲的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与杜仲eu-Hmgr蛋白的基因家族的核苷酸序列。
本发明的杜仲eu-Hmgr蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH FreemanCo.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
利用本发明的杜仲eu-Hmgr蛋白,通过各种常规筛选方法,可筛选出与杜仲eu-Hmgr蛋白发生相互作用的物质,或者受体、抑制剂或拮剂等。本发明的杜仲eu-Hmgr蛋白基因可通过基因工程技术用来提高杜仲中次生代谢产物或其前体的含量,而这些次生代谢产物在临床上具有巨大的应用价值,对保护人民的健康生长有所帮助。因而本发明具有很大的应用前景。

具体实施方式

下面结合实验室具体的试验数据和结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
杜仲eu-Hmgr蛋白基因的克隆
1.组织分离(isolation)
杜仲幼嫩叶片来源于江苏省药用植物生物技术重点实验室,采取材料后,立即置于液氮中冷冻保存。
2.RNA的分离(RNA isolation)
取部分组织,用研钵研碎,加入盛有裂解液的1.5mL EP管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至1.5mL EP管中,抽提总RNA(TRIzol Reagents,GIBCOBRL,USA)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。
3.基因的全长克隆(Cloning of Full-length cDNA)
根据一些植物Hmgr的氨基酸保守序列,设计兼并引物,利用同源性基因克隆原理,采用Smart-RACE方法(Clonetech试剂盒)进行cDNA全长克隆,分三个阶段进行:
(1)3’-RACE
PCR  (UPM+F2)得到EUF2’(862bp),回收,连接到pGEMT-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知的木本植物如橡胶树(Heveabrasiliensis)等的Hmgr基因的同源性很高,故初步认为它是一个Hmgr基因。
(2)5’-RACE
根据3’RACE结果,设计反向特异引物R2,经PCR(UPM+R2)得到EUR2’(1489bp)(过程同(1))。回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。
(3)将5’RACE测序结果与3’RACE测序结果比序并进行拼接,得到全长片段序列信息,并设计一对特异引物进行PCR扩增eu-Hmgr编码区(DF1+DR1)得到eu-Hmgr编码区(1770bp)(过程同(1))。
BLAST的结果证明从杜仲中新得到的基因确为一个植物Hmgr基因。通过组合使用上述3种方法,获得了候选的杜仲EuHMGR的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物EuHMGRF1:5’-GCGGGGAAGAACAGTCCAATA-3’(SEQ ID NO.1)为正向引物,寡核苷酸EuHMGRR1:5’-GCAATAATATGAGTTGAGACT-3’(SEQ ID NO.2)为反向引物,以总RNA为模板,进行RT-PCR扩增,EuHMGRF1/EuHMGRR1的PCR条件为94℃5分钟,随之以94℃1分钟、58℃1分钟和72℃2分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为1776bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ ID NO.3所示的序列。
实施例2
杜仲eu-Hmgr蛋白基因的序列信息与同源性分析
本发明新的杜仲eu-Hmgr蛋白全长cDNA的长度为2281 bp,详细序列见SEQ IDNO.3,其中开放读框位于170-1952位核苷酸。根据全长cDNA推导出杜仲eu-Hmgr蛋白的氨基酸序列,共590个氨基酸残基,分子量63313.88,pI为6.83。详细序列见SEQ ID NO.4。
将杜仲eu-Hmgr蛋白的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与帕拉橡胶树3-羟基-3-甲基戊二酰辅酶A还原酶基因(AY352338.1)在核苷酸水平上具有较高的同源性(附表2);在氨基酸水平上,它与帕拉橡胶树3-羟基-3-甲基戊二酰辅酶A还原酶(GenBank Accession No.AAQ63055.1)有78%的相同性和86%的相似性(见表3)。由此可见,杜仲eu-Hmgr蛋白与帕拉橡胶树3-羟基-3-甲基戊二酰辅酶A还原酶无论从核酸还是蛋白水平上都存在较高的同源性,故可以认为杜仲eu-Hmgr蛋白在功能上也相似。
实施例3
杜仲eu-Hmgr蛋白在大肠杆菌中进行原核表达及提纯
在该实施例中,将全长的杜仲eu-Hmgr蛋白编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
将杜仲eu-Hmgr蛋白多肽以融合蛋白的形式在大肠杆菌中进行原核表达。
原核表达载体的构建,以及转化大肠杆菌
根据杜仲eu-Hmgr蛋白的氨基酸序列,设计蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将杜仲eu-Hmgr蛋白基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-3-羟基-3-甲基戊二酰辅酶A还原酶表达载体的工程菌BL21-pET32a(+)-3-羟基-3-甲基戊二酰辅酶A还原酶。
表达Trx-eu-Hmgr重组蛋白的工程菌的分离鉴定
挑取单菌落的BL21-pET32a(+)-eu-Hmgr工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达Trx-3-eu-Hmgr融合蛋白的工程菌。
Trx-3-eu-Hmgr融合蛋白的提取纯化
按上述方法诱导表达Trx-eu-Hmgr融合表达蛋白的工程菌BL21-pET32a(+)-eu-Hmgr,经离心沉淀收集菌体,并根据厂家(Novagen)的说明书以BugBuster试剂和Benzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mM CAPS,pH 11.0,0.3% N-lauroylsarcosine)来溶解,再用透析缓冲液(200mMTris-HCl,pH8.5)来透析。然后用组氨酸结合(His·Bind)树脂进行亲和层析,并经洗脱缓冲液(1M imidazole,500mM NaCl,20mM Tris-HCl pH 7.9)洗脱来收集Trx-eu-Hmgr融合蛋白。融合蛋白经肠激酶20℃酶切16小时后即可分离获得eu-Hmgr的表达蛋白。
纯化的3-羟基-3-甲基戊二酰辅酶A还原酶的活力测定
按Thorsness等(Mol.Cell.Biol,1989,9:5702~5712)的方法对表达纯化的3-羟基-3-甲基戊二酰辅酶A还原酶进行酶活力的测定,研究在其作用下3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸的能力。反应体系含有0.05M Tris-HCL(pH=7.5),5mM DTT,200mM NADPH,300mM 14C标记的乙酰辅酶A(1mCi/mmol)及20mM磷酸葡萄糖,每毫升9.75mU磷酸葡萄糖脱氢酶用于NADPH的再生,总体积为100ul.反应流程如下:首先加入400mg蛋白质37℃水浴5分钟.然后加入20ml 6N的HCL终止反应,混合物再37℃水浴15分钟,使3-羟基-3-甲基戊二酰辅酶A转化成甲羟戊酸。反应终产物和酶作用物在Bio-Rex 5柱子上分离,反应终产物可从柱子中水洗下来。可用液体闪烁记数器测定14C标记的反应终产物的含量。结果表明,表达的蛋白的确具有催化3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸的酶活性。
实施例4
杜仲eu-Hmgr蛋白在烟草中进行真核细胞表达
将含目的基因(杜仲eu-Hmgr蛋白基因)的表达载体的构建,根据杜仲eu-Hmgr蛋白的全长序列(SEQ ID NO.3),设计扩增出完整编码阅读框的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将杜仲eu-Hmgr蛋白基因cDNA克隆至中间载体(如pBluescript),进一步克隆到双元表达载体(如pBI121和改进的pCAMBIA2300),在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌中,利用叶盘法技术转化模式植物烟草。
利用叶盘法转化烟草
1.用无菌牙签挑取YEB选择平板上的阳性菌落,接种于2ml YEB液体(Sm+,Kan+),28度,200rpm振荡培养24-36小时;
2.室温下4,000g离心10min;
3.弃上清,菌体用1/2MS液体培养基悬浮,稀释到原体积的5-20倍,使菌液的OD600=0.5左右;
4.取生长两周左右的烟草的无菌叶片,去掉其主叶脉,将其剪成约1平方厘米见方的小叶片;
5.将叶片放入制备好的菌液中,浸泡2-5min,在无菌滤纸上吸干菌液;
6.把经侵染的叶片放于MS培养基上,28℃暗培养48小时;
7.将叶片转到愈伤培养基(MS+6-BA 1.0mg/L+NAA 0.1mg/L+Kan 50mg/L+cb250mg/L)上,25-28℃光照下培养,7-15天可见愈伤组织的形成;
8.约20天后可见分化芽长出,待芽长大后,切下,置于生根培养基(1/2MS+NAA0.5mg/L+Kan 25mg/L)上进行生根培养,2-7天左右生根;
9.等根系发达后,将植株取出,用无菌水洗净附着的固体培养基,移入土壤中,刚开始用玻璃罩罩几天,待植株健壮后再取下玻璃罩,温室中培养。
利用Northern blotting检测eu-Hmgr蛋白在转基因烟草植株中的表达
1.RNA的提取:待转基因烟草叶片长到2-3片叶时抽取烟草叶的RNA。以正常生长的植株作为对照(条件同上),利用TRIzol试剂盒(GIBCO BRL,USA)提取并参考《分子克隆》有关RNA的制备章节(Sambrook等,1989)。
2.RNA的定量:参考《分子克隆》(Sambrook等,1989),分光光度计测OD260;RNA含量计算:1 OD260=40μg/ml。
3总RNA琼脂糖凝胶电泳分离:1)取6ml 25*(倍)电泳缓冲液,加入117ml无菌水,混匀。2)称取1.5g琼脂糖,加入到上述溶液中,于微波炉里加热融化,转入55℃水浴中。3)于通风橱中取26.8ml甲醛,加入到55℃的凝胶溶液中,混匀。4)迅速倒入制胶板中,室温水平放置30分钟,待胶凝固。5)将提取的RNA(20μg)溶解于RNA变性溶液中,在65℃下加热10分钟,然后立即放在冰上。6)在样品中加入2ul 10*上样缓冲液,混匀。7)在电泳液未盖过胶的条件下点样,5V/cm电压电泳5小时左右。
4.RNA尼龙膜上转移:1)转移之前,将尼龙膜用10*SSC浸泡。2)将湿润的膜准确地盖在膜上,将两张与膜大小相同的滤纸置2*SSC溶液中湿润,盖在膜上,排除气泡。3)滤纸上放一叠与膜大小相同的吸水纸,在吸水纸上放一玻璃板和一重物,水平放置,转移12-20小时。4)转移后,将膜于80℃烘烤2小时。
5.膜上杂交信号的检出:1)将膜浸在含有5×Dendart’s,0.1%SDS,0.1mg/ml鲑鱼精DNA的溶液中,65℃下预杂交2小时。2)将用Gene ImagesTM ContentsCDP-StarTM labelling module标记的探针在沸水中变性5分钟,直接加入1)的杂交液中,于65℃杂交16-24小时。3)取出膜,置于洗膜液I(1*SSC,1%SDS)中,于65℃漂洗3次,每次15分钟。转入洗膜液II(0.1*SSC,1%SDS)中于65℃漂洗3次,每次15分钟。4)用X光片压片60-90分钟,然后显影、定影(方法参照RocheDIG labeled试剂盒说明书)。Northern杂交表明;转基因烟草的eu-HMGR转录水平比未转基因的对照材料的表达水平明显高得多。
含杜仲3-羟基-3-甲基戊二酰辅酶A还原酶基因(euhmgr)的转基因烟草植株中的eu-Hmgr蛋白活性测定
1.蛋白的提取:a)取500mg叶片,加入1000ul 1*PBS(KH2PO4 0.2g/l,Na2HPO4 1.15g/l,KCl 0.2g/l,NaCl 8g/l)于50ml eppondorf管中研磨;b)13000,4℃离心10分钟;c)取上清,备用。注:以上过程于冰上进行。
2.蛋白的定量:参考Bradford法(Bradford,1976)。取2ul蛋白样品,加入1mlBradford试剂,混匀后,分光光度计测OD595;蛋白含量计算:1 OD595=28.57μg。
3.eu-Hmgr蛋白活性测定参考Thorsness等(Mol.Cell.Biol,1989,9:5702~5712)的方法(详细操作过程同实例3)。结果表明,转基因烟草植株的中的eu-Hmgr蛋白酶活性比没有转基因的对照明显高得多(P<0.05)。从而再次证明所克隆的杜仲3-羟基-3-甲基戊二酰辅酶A还原酶基因的确具有催化3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸的酶活性,将可用于利用转基因技术来提高植物的次生代谢产物的研究和产业化中。
本发明涉及的序列及记号分列如下:
(1)SEQ ID NO.1的信息
(i)序列特征:
(A)长度:21bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:寡核苷酸
(iii).序列描述:SEQ ID NO.1
GCGGGGAAGAACAGTCCAATA
(2)SEQ ID NO.2的信息
(i)序列特征:
(A)长度:21bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii)分子类型:寡核苷酸
(iii)序列描述:SEQ ID NO.2
GCAATAATATGAGTTGAGACT
(3)SEQ ID NO.3的信息
(i)序列特征:
(A)长度:2281bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii)分子类型:核苷酸
(iii)序列描述:SEQ ID NO.3
acgcggggaa gaacagtcca atagcacacc tcgtgccagc acatcatcgc ccccccgcct    60
cgcctgtgtt ccttgttata tccctcccaa attcccgatt ccttcgctca gccgcccctc    120
ttaaaccata ccacaacaca cattttcccc catttacttc tgcccggcca tggatctccg    180
ccggagaccc cctaagccag cagcgacaaa tggccgaaac caccacctcc accaccaggg    240
caattcgtct tcaccggcga ttgattgcag cccttcaccg attccaaagg cttccgatgc    300
gctccccctt cccctttacc taaccaatgg aattttcttc acgctcttct tctccgtagc    360
ctactacctt ctccaccggt ggcgcgacaa gatccgcaat tcgactcctc tccacgtctt    420
gactctttct gagctcgccg ccattgtttc tcttatagcc tcatttatat atctcctagg    480
ttttttcggc atcgatttcg tgcagtcctt cattgcacgt gcgtcgcacg atccatggga    540
cgtggacgac gacgaacgat tcattctcga agaagaccgc cggcgcggtc cttgcactgc    600
cgctcttgat tgcctcgtcg gtccagtcgc tccctctatt tctgacgtac gaaagttaat    660
ggatccaccg gctcctcttc catcggtaga agacgaacaa atggtgaaat cggtcatttc    720
agggacagtt ccgtcgtact cacttgaatc aaaactcggg gactgctatc gtgcggcctc    780
aattcgccgc gaggcgattc agaggatcac aggtaagtcg ctgtcgggct tgccattgga    840
aggatttgat tacgaggcga ttttagggca gtgttgtgag atgccgattg gcttccttca    900
aatcccggtc ggtattgcgg gacctttgtt gttgaacggc tgcgaatact cggtgccaat    960
ggcgacgaca gaggggtgct tggttgcgag taccaacaga ggatgcaagg cgatatatgc    1020
atccggcggt gcaaccagca ttcttttgag agatgggatg accagagccc ccgttgtgag    1080
gtttccatct gctaagaggg cgtcggagtt gaaatttttc ttggaagacc cactcaattt    1140
cgaaacattg tctatggttt ttaacaaatc aagcaggttt gcaaggcttc aaggcattca    1200
gtgttctata gcgggaaaaa atctttacat gagatttacc tgtagcactg gtgatgctat    1260
ggggatgaac atggtgtcaa aaggtgtgca gaatattctc gagtttcttc aaaatgattt    1320
tccagatatg gatgtaattg gtatctccgg aaacttctgt tcagataaga aaccggctgc    1380
ggtaaattgg attgagggcc gtggaaaatc agttgtttgt gaggcaatca tctcggaaga    1440
catagtgagg aaggtactta aaactactgt tccagccctt gtagagctta atatgcttaa    1500
gaaccttgcc ggatcggcgg ttgctggtgc tctgggtggt ttcaatgccc atgcagccaa    1560
catcgtttct gcagtgttta tagctactgg ccaagacccg gcccaaaata ttgaaagctc    1620
tcactgtata acaatgatgg aagcggtgaa tgatgggaag gatcttcaca tttccgtgac    1680
tatgccttct atcgaggtgg gtactgttgg agggggcact caacttgcat ctcagtctgc    1740
ttgcttgaac ttacttgggg ttaagggtgc aaacaaagag tcccctggat caaattcaag    1800
gctcttagcg gccatagttg ctggttctgt tttggcagga gagctctcat tgatgtctgc    1860
tattgccgct gggcagctgg tcaatagtca catgaagtac aaccgctcaa acagggattt    1920
caccaaagtt acctcttcct aagaggggaa aaaaggaaaa gaaaccccta gcaatgattt    1980
tgagaactcg gaggagacat tttacaaacc aaaccaaaaa aaaaaaaaaa aaaaaaaaaa    2040
aaaaagcact aagatacaga atatgaattt gttcctcatc gcagctgtaa agtaaggaat    2100
cactaccact tccagctgca gtggagagca aaaatatatc tgaaggtaat attaaatgcc    2160
aagttgtgct ttgtctgtcc caattgtaac cctctgattt cttttcggat ttttttctct    2200
cgagtctcaa ctcatattat tgctgttaat tgtccaaaaa aaaaaaaaaa aaaaaaaaaa    2280
a                                                                    2281
(4)SEQ ID NO.4的信息
(i)序列特征:
(A)长度:590氨基酸
(B)类型:氨基酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:多肽
(iii).序列描述:SEQ ID NO.4
Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Ala Ala Thr Asn Gly Arg
1               5                   10                   15
Asn His His Leu His His Glu Gly Asn Ser Ser Ser Pro Ala Ile Asp
            20                  25                   30
Cys Ser Pro Ser Pro Asn Pro Lys Ala Ser Asp Ala Leu Pro Pro Pro
        35                  40                   45
Pro Tyr Leu Thy Asn Gly Ile Phe Phe Thr Leu Phe Phe Phe Val Ala
     50                 55                  60
Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys Ile Arg Asn Ser Thr Pro
65                   70                 75                   80
Leu His Val Leu Thr Pro Ser Glu Leu Ala Ala Asn Val Ser Leu Ile
                85                  90                   95
Ala Ser Phe Ile Tyr Leu Leu Gly Phe Phe Gly Ile Asp Phe Val Glu
            100                 105                 110
Ser Phe Ile Ala Arg Ala Ser His Asp Pro Trp Asp Val Asp Asp Asp
        115                 120                 125
Glu Arg Phe Ile Leu Glu Glu Asp Arg Arg Arg Gly Pro Cys Thr Ala
    130                 135                 140
Ala Leu Asp Cys Leu Val Gly Pro Val Ala Pro Ser Ile Ser Asp Val
145                 150                 155                 160
Arg Lys Leu Met Asp Pro Pro Ala Pro Leu Pro Ser Val Glu Asp Glu
                165                 170                 175
Glu Met Val Lys Ser Val Ile Ser Gly Thr Val Pro Ser Tyr Ser Pro
            180                 185                 190
Glu Ser Lys Leu Gly Asp Cys Tyr Arg Ala Ala Ser Ile Arg Arg Glu
        195                 200                 205
Ala Ile Glu Arg Ile Thr Gly Lys Ser Leu Ser Gly Leu Pro Leu Glu
    210                 215                 220
Gly Phe Asp Tyr Glu Ala Ile Leu Gly Glu Cys Cys Glu Met Pro Ile
225                 230                 235                 240
Gly Phe Leu Glu Ile Pro Val Gly Asn Val Gly Pro Leu Leu Leu Asn
                245                 250                 255
Gly Cys Glu Tyr Ser Val Pro Met Val Thr Thr Glu Glu Cys Leu Val
            260                 265                 270
Ala Ser Thr Asn Arg Gly Cys Lys Ala Ile Tyr Ala Ser Gly Gly Ala
        275                 280                 285
Thr Ser Ile Leu Leu Arg Asp Gly Met Thr Arg Ala Pro Val Val Arg
    290                 295                 300
Phe Pro Ser Ala Lys Arg Ala Ser Glu Leu Lys Phe Phe Leu Glu Asp
305                 310                 315                 320
Pro Leu Asn Phe Glu Thr Leu Ser Met Val Lys Asn Lys Ser Ser Arg
                325                 330                 335
Phe Ala Arg Leu Glu Gly Ile Glu Cys Ser Ile Ala Gly Lys Asn Leu
            340                 345                 350
Tyr Met Arg Phe Thr Cys Ser Thr Gly Asp Thr Met Gly Met Asn Met
        355                 360                 365
Val Ser Lys Gly Val Glu Asn Ile Leu Glu Phe Leu Glu Asn Asp Phe
    370                 375                 380
Pro Asp Met Asp Val Ile Gly Ile Ser Gly Asn Phe Cys Ser Asp Lys
385                 390                 395                 400
Lys Pro Ala Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val
                405                 410                 415
Cys Glu Ala Ile Ile Ser Glu Asp Ile Val Arg Lys Val Leu Lys Thr
            420                 425                 430
Thr Val Pro Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly
        435                 440                 445
Ser Ala Val Ala Gly Ala Leu Gly Gly Phe Asn Ala His Ala Ala Asn
    450                 455                 460
Ile Val Ser Ala Val Phe Ile Ala Thr Gly Glu Asp Pro Ala Glu Asn
465                 470                 475                 480
Ile Glu Ser Ser His Cys Ile Thr Met Met Glu Ala Val Asn Asp Gly
               485                 490                 495
Lys Asp Pro His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr
            500                 505                 510
Val Gly Gly Gly Thr Glu Leu Ala Ser Glu Ser Ala Cys Leu Asn Leu
        515                 520                 525
Val Gly Val Lys Gly Ala Asn Lys Glu Ser Pro Gly Ser Asn Ser Arg
    530                 535                 540
Leu Leu Ala Ala Ile Val Ala Gly Ser Val Leu Ala Gly Glu Leu Ser
545                 550                 555                 560
Leu Met Ser Ala Ile Ala Ala Gly Glu Leu Val Asn Ser His Met Lys
            565                 570                 575
Tyr Asn Arg Ser Asn Arg Asp Phe Thr Lys Val Thr Ser Ser    
            580                 585
tccaaaaaaa aaaaaaaaaa aaaaaaaaa                                      2281
<210>2
<211>590
<212>PRT    
<213>杜仲(Eucommia ulmoides)
<400>2
Met Asp Leu Arg Arg Arg Pro Pro Lys Pro Ala Ala Thr Asn Gly Arg
1                5                  10                   15
Asn His His Leu His His Glu Gly Asn Ser Ser Ser Pro Ala Ile Asp
            20                  25                   30
Cys Ser Pro Ser Pro Asn Pro Lys Ala Ser Asp Ala Leu Pro Pro Pro
        35                  40                  45
Pro Tyr Leu Thy Asn Gly Ile Phe Phe Thr Leu Phe Phe Phe Val Ala
    50                  55                  60
Tyr Tyr Leu Leu His Arg Trp Arg Asp Lys Ile Arg Asn Ser Thr Pro
65                  70                  75                  80
Leu His Val Leu Thr Pro Ser Glu Leu Ala Ala Asn Val Ser Leu Ile
                85                  90                  95
Ala Ser Phe Ile Tyr Leu Leu Gly Phe Phe Gly Ile Asp Phe Val Glu
            100                 105                 110
Ser Phe Ile Ala Arg Ala Ser His Asp Pro Trp Asp Val Asp Asp Asp
        115                 120                 125
Glu Arg Phe Ile Leu Glu Glu Asp Arg Arg Arg Gly Pro Cys Thr Ala
    130                 135                 140
Ala Leu Asp Cys Leu Val Gly Pro Val Ala Pro Ser Ile Ser Asp Val
145                 150                 155                 160
Arg Lys Leu Met Asp Pro Pro Ala Pro Leu Pro Ser Val Glu Asp Glu
                165                 170                 175
Glu Met Val Lys Ser Val Ile Ser Gly Thr Val Pro Ser Tyr Ser Pro
            180                 185                 190
Glu Ser Lys Leu Gly Asp Cys Tyr Arg Ala Ala Ser Ile Arg Arg Glu
        195                 200                 205
Ala Ile Glu Arg Ile Thr Gly Lys Ser Leu Ser Gly Leu Pro Leu Glu
    210                 215                 220
Gly Phe Asp Tyr Glu Ala Ile Leu Gly Glu Cys Cys Glu Met Pro Ile
225                 230                 235                 240
Gly Phe Leu Glu Ile Pro Val Gly Asn Val Gly Pro Leu Leu Leu Asn
                245                 250                 255
Gly Cys Glu Tyr Ser Val Pro Met Val Thr Thr Glu Glu Cys Leu Val
            260                 265                 270
Ala Ser Thr Asn Arg Gly Cys Lys Ala Ile Tyr Ala Ser Gly Gly Ala
        275                 280                 285
Thr Ser Ile Leu Leu Arg Asp Gly Met Thr Arg Ala Pro Val Val Arg
    290                 295                 300
Phe Pro Ser Ala Lys Arg Ala Ser Glu Leu Lys Phe Phe Leu Glu Asp
305                 310                 315                 320
Pro Leu Asn Phe Glu Thr Leu Ser Met Val Lys Asn Lys Ser Ser Arg
                325                 330                 335
Phe Ala Arg Leu Glu Gly Ile Glu Cys Ser Ile Ala Gly Lys Asn Leu
            340                 345                 350
Tyr Met Arg Phe Thr Cys Ser Thr Gly Asp Thr Met Gly Met Asn Met
        355                 360                 365
Val Ser Lys Gly Val Glu Asn Ile Leu Glu Phe Leu Glu Asn Asp Phe
    370                 375                 380
Pro Asp Met Asp Val Ile Gly Ile Ser Gly Asn Phe Cys Ser Asp Lys
385                 390                 395                 400
Lys Pro Ala Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val
                405                 410                 415
Cys Glu Ala Ile Ile Ser Glu Asp Ile Val Arg Lys Val Leu Lys Thr
            420                 425                 430
Thr Val Pro Ala Leu Val Glu Leu Asn Met Leu Lys Asn Leu Ala Gly
        435                 440                 445
Ser Ala Val Ala Gly Ala Leu Gly Gly Phe Asn Ala His Ala Ala Asn
    450                 455                 460
Ile Val Ser Ala Val Phe Ile Ala Thr Gly Glu Asp Pro Ala Glu Asn
465                 470                 475                 480
Ile Glu Ser Ser His Cys Ile Thr Met Met Glu Ala Val Asn Asp Gly
                485                 490                 495
Lys Asp Pro His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr
           500                 505                 510
Val Gly Gly Gly Thr Glu Leu Ala Ser Glu Ser Ala Cys Leu Asn Leu
        515                 520                 525
Val Gly Val Lys Gly Ala Asn Lys Glu Ser Pro Gly Ser Asn Ser Arg
    530                 535                 540
Leu Leu Ala Ala Ile Val Ala Gly Ser Val Leu Ala Gly Glu Leu Ser
545                 550                 555                 560
Leu Met Ser Ala Ile Ala Ala Gly Glu Leu Val Asn Ser His Met Lys
                565                 570                 575
Tyr Asn Arg Ser Asn Arg Asp Phe Thr Lys Val Thr Ser Ser
            580                 585