自我组装脱落荧光蛋白系统转让专利

申请号 : CN200480035241.4

文献号 : CN1886420B

文献日 : 2012-02-29

相似专利: 请登录后查看

本发明公开了一种基于荧光蛋白和生色蛋白自行互补片段的蛋白标签和检测系统。本发明的系统以来源于水母(Aequorea victoria)的绿色荧光蛋白(Green FluorescentProtein GFP)的自行互补片段的各种结合为例，所述片段可被用于以多种检验形式检测和定量体内和体外蛋白的溶解性。

1.一种分离的多肽，其特征在于，它是GFP变异蛋白的β11链，该链的氨基酸序列选自SEQ ID NOS：12、14、16、18和20中的一种。

2.一种试剂盒，其特征在于，它包含权利要求1所述的分离的多肽。

3.一种分离的核苷酸分子，其特征在于，它编码权利要求1所述的多肽。

4.一种分离的核苷酸分子，其特征在于，它的核苷酸序列选自SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17和SEQ ID NO：19中的一种。

5.一种表达载体，其特征在于，它包含权利要求3或4所述的核苷酸分子。

6.一种宿主细胞，其特征在于，它含有权利要求5所述的表达载体。

7.一种pTET-SpecR质粒载体，其特征在于，它具有SEQ ID NO：22所示序列，一编码荧光蛋白β1和3相邻肽链之间标签片段的多核苷酸被插入到载体的Spel和Kpnl两个单一限制性酶切位点之间的读码框内，且在所述标签片段的3’末端、Kpnl限制性酶切位点之前的读码框内引入一个终止密码子，以终止标签的翻译，所述标签片段选自SEQ ID NO：12、

14、16、18和20所示序列。

8.如权利要求7所述的载体，其特征在于，它还包含一段编码异源多肽的多核苷酸，该段多核苷酸插在载体的Ndel和BamHl两个单一限制性酶切位点之间的读码框内。

9.一种包含权利要求7所述载体的大肠杆菌。

10.一种含有权利要求9所述大肠杆菌的试剂盒。

11.一种检测体内可溶性试验蛋白的方法，其特征在于，它包括如下步骤：(a)提供一个多核苷酸结构，它包含：报告蛋白片段的自行互补片段的可溶性第一标签片段的编码序列，该序列与试验蛋白的编码序列融合，且受控于第一独立可诱导启动子；

(b)提供一个多核苷酸结构，它包含：报告蛋白片段的自行互补片段的可溶性第二检测片段的编码序列，该序列受控于第二独立可诱导启动子；

(c)培养同时含有(a)和(b)两个结构的细胞，在基础条件下使其中的两个独立可诱导启动子受抑制；

(d)诱导(a)中结构编码的第一片段与试验蛋白的融合蛋白表达，用足够的时间使融合蛋白表达，接着如果融合蛋白不溶，再用足够的时间使表达的融合蛋白聚集；

(e)然后诱导(b)中结构编码的第二片段表达，用足够的时间使第二检测片段表达并使其与可溶性第一标签片段和试验蛋白的融合蛋白自行互补；

(f)检定细胞中的报告蛋白活性，从而检测到可溶性试验蛋白；

所述第一标签片段选自SEQ ID NOS：12、14和16所示序列，所述第二检测片段选自SEQ ID NOS：4和6所示序列。

12.一种检测体内可溶性试验蛋白的方法，其特征在于，它包括如下步骤：(a)提供一个多核苷酸结构，它包含：编码报告蛋白的自行互补片段的可溶性第一标签片段的多核苷酸序列，该序列与试验蛋白的编码序列融合；

(b)在一定条件下培养含有(a)结构的哺乳动物细胞，并用足够的时间使试验蛋白与标签片段的融合蛋白得到表达，如果该融合蛋白不溶，再用足够的时间使表达的融合蛋白聚集；

(c)将报告蛋白的自行互补片段的可溶性第二检测片段通过化学方法转染至哺乳动物细胞中；

(d)检定细胞中的报告蛋白活性，从而检测出可溶性试验蛋白；

所述第一标签片段选自SEQ ID NOS：12、14和16所示序列，所述第二检测片段选自SEQ ID NOS：4和6所示序列。

13.一种定量体内总试验蛋白的检测方法，其特征在于，它包括如下步骤：(a)提供一个多核苷酸结构，它包含编码荧光蛋白的自行互补片段的可溶性第一标签片段的核苷酸序列，该序列与试验蛋白的编码序列融合；

(b)提供一个多核苷酸结构，它包含编码荧光蛋白的自行互补片段的可溶性第二检测片段的核苷酸序列；

(c)培养同时含有(a)和(b)结构的细胞，并在一定条件下使(a)结构编码的第一片段和试验蛋白的融合蛋白表达，同时使(b)结构编码的第二片段也表达，且用足够的时间使标签片段和检测片段自行互补；

(d)定量检测荧光以确定总蛋白量；

所述第一标签片段选自SEQ ID NOS：12、14和16所示序列，所述第二检测片段选自SEQ ID NOS：4和6所示序列。

14.一种检测体外可溶性试验蛋白的方法，其特征在于，它包括如下步骤：(a)提供一个多核苷酸结构，它包含编码报告蛋白的自行互补片段的可溶性第一标签片段的核苷酸序列，该序列与试验蛋白的编码序列融合；

(b)培养含有(a)结构的细胞，并在一定条件下使(a)结构编码的标签片段和试验蛋白的融合蛋白表达，且用足够的时间让融合蛋白表达，如果该融合蛋白不溶，接着再用足够的时间使表达的融合蛋白聚集；

(c)裂解细胞；

(d)让裂解液与报告蛋白的自行互补片段的第二互补检测片段接触；

(e)检定报告蛋白活性，而检测到报告蛋白活性就表明该试验蛋白是可溶的；

所述第一标签片段选自SEQ ID NOS：12、14和16所示序列，所述第二检测片段选自SEQ ID NOS：4和6所示序列。

15.一种定量体外不溶性试验蛋白的检测方法，其特征在于，它包括如下步骤：(a)提供一个多核苷酸结构，它包含编码报告蛋白的自行互补片段的可溶性第一标签片段的核苷酸序列，该序列与试验蛋白的编码序列融合；

(b)培养含有(a)结构的细胞，并在一定条件下使(a)结构编码的第一标签片段和试验蛋白的融合蛋白表达，且用足够的时间让融合蛋白表达，如果该融合蛋白不溶，接着再用足够的时间使表达的融合蛋白聚集；

(c)裂解细胞，并从中分离出不溶性成分；

(d)用化学变性的方法溶解不溶性成分；

(e)将溶解变性的不溶性蛋白成分以适当配比在一种含有报告蛋白自行互补片段的第二互补检测片段的稀释液中进行复性，在一定条件下并用足够的时间使其自行互补；

(f)定量检测荧光以确定不溶性蛋白量；

所述第一标签片段选自SEQ ID NOS：12、14和16所示序列，所述第二检测片段选自SEQ ID NOS：4和6所示序列。

16.如权利要求11-15任一项所述的方法，其特征在于，所述试验蛋白通过一个接头多肽与报告蛋白的自行互补片段的标签片段的N末端相融合。

17.如权利要求16所述的方法，其特征在于，所述报告蛋白是一种荧光蛋白。

自我组装脱落荧光蛋白系统

[0001] 声明本发明的权利项是在联邦政府资助下进行研究和发展取得的成果。

[0002] 本发明是加利福尼亚大学董事会在政府支持下，得到来自美国能源部门的DE-FG02-98ER62647资助项目的资助，同时还得到美国能源部门的W-7405-ENG-36合同项
目的资助而完成的。政府对本发明拥有一定的所有权。

[0003] 相关申请

[0004] 本专利申请主张美国临时专利申请号为No.60/514,363的申请日的优先权。

背景技术

[0005] 获得足够量的既可溶解又正确折叠的重组蛋白，以应用于下游，这对许多应用蛋白表达技术领域，仍是一个重大的瓶颈(Makrides1996；Baneyx 1999；Fahnert，Lilieet
al.2004)，这里包括结构基因组项目(Yokoyama 2003；Goh，Lan et al.2004；Terwilliger
2004)。目前，使可溶性蛋白最佳化的方法包括筛选大量的蛋白突变体(突变异种、片段、融
合标签、折叠伴侣)并检测许多表达或折叠的条件(Armstrong，de Lencastre et al.1999；
Fahnert，Lilie et 2004)。最近已有方法能筛选可溶性表达蛋白(Waldo 2003)，包括免
疫印迹法检测多聚组氨酸标签蛋白的抗体(Knaustand Nordlund 2001)，但这些方法需要
多重步骤，且不能在体内实现。蛋白用lacZα片段标签，再与lacZΩ进行结构互补后能
被检测到(Ullmann，Jacob et al.1967；Nixon and Benkovic 2000；Wigley，Stidham et
al.2001；Wehrman，Kleaveland etal.2002)，但是lacZα片段相对较大(52个氨基酸)
(Wigley，Stidham et al.2001)，且关于它对融合蛋白的折叠和溶解性能的影响，还没有
作出详细研究。利用一种敏感的荧光底物(Kelemen，Klink et al.1999)((FretWorks ，
Novagen，Madison，WI)与S蛋白(Richards and Vithayathil 1959)互补后，15个氨基酸
的S肽标记的蛋白(Lim and Raines 1993)在体外能被定量检测，但这种检测方法不能用
于估计大肠杆菌体内表达的可溶性蛋白。

[0006] GFP和它的许多相关荧光蛋白目前被广泛用来作为蛋白标签剂(参见Verkhusha等2003，珊瑚纲类GFP类似荧光蛋白和生色蛋白；在蛋白质结构中，结构特性和功能的纷繁
复杂，Ch.18，pp.405-439，Research Signpost，Kerala，India)。此外，GFP已经被用作一
种末端与试验蛋白融合的可溶性报告蛋白(Waldo et 1999，Nat.17：691-695；U.S.Patent
No.6,448,087，发明名称为“确定和改变蛋白或肽溶解性的方法”)。GFP类似蛋白是一个同
源的、且具有一个保守的β11链桶状结构的25-30kDa多肽的扩大家族。该GFP类似蛋白
家族现在包含约100个成员，它们是从各种珊瑚纲和水螅纲动物中克隆得到的，且该蛋白
家族目前包括红、黄、绿荧光蛋白及多种非荧光生色蛋白(Verkhusha et supra)。各种各
样商业上可利用的荧光蛋白标签的检验和试剂盒包含GFP光谱变异体和GFP类似荧光蛋白
的较宽光谱，它包括红荧光蛋白(DsRed)和其他红色荧光蛋白(Clontech，Palo Alto，CA；
Amersham，Piscataway，NJ.)。

[0007] 各种改进GFP和相关蛋白可溶性的策略已备有证明文件，且已产生许多具有改良的折叠、可溶性和扰动耐受特性的突变体。Stemmer和他的同事将人工定向进化方法应用
于筛选在大肠杆菌中能增加荧光和折叠域的GFP蛋白的突变体或变异体(Crameriet al.，
Nat.Biotechnol.143：315-319，1996)。他们确定了一种能增加折叠能力的突变体。该种
GFP，称为cycle-3或GFP3，其含有突变位点F99S、M153T和V163A。GFP3对表达环境相对
不敏感，且它在各种宿主细胞包括大肠杆菌中都能很好折叠。GFP3在27℃和37℃条件下能
一样正确折叠。因此，GFP3的突变也消除了野生型GFP在折叠过程中可能会出现的温度敏
感折叠中间状态。

[0008] GFP3可能由于和另一个较差折叠的多肽组成的融合蛋白的表达而被错误折叠。GFP3已被用于报告在大肠杆菌中表达的N-末端融合蛋白的“折叠旺盛”(Waldo等1999，见
上文)。在这种方法中，报告蛋白的序列，如GFP3结构域，仍然保持连续，且一个较差折叠的
上游结构域被突变。X结构域较好折叠的变异体通过增加的荧光被确定。

[0009] 现有的蛋白标签和检测平台是有效的，但也有缺点。脱落蛋白标签可能会扰乱蛋白溶解性(Ullmann，Jacob et 1967；Nixon and Benkovic 2000；Fox，Kapust et al.2001；
Wigley，Stidham et al.2001；Wehrman，et al.2002)或者在活细胞中不工作(Richards
and Vithayathil 1959；Kim and Raines 1993；Kelemen，Klink et al.1999)。绿色荧光蛋
白的融合蛋白可能会错误折叠(Waldo，Standish et 1999)或出现改变的过程(Bertens，
Heijne et al.2003)。双砷化合物FlaSH或ReASH(Adams，Campbell et al.2002)的荧光
底物克服了许多这样的限制，但需要一个聚半胱氨酸标签模体、一个还原环境以及细胞转
染或通透状态(Adams，Campbell et 2002)。

[0010] GFP片段重组系统已被描述过，主要是为检定蛋白与蛋白的相互作用，但没有一个能独力自我组装成正确折叠、可溶的荧光重组GFP，且从这些方法中也没有出现全面的脱
落GFP折叠报告蛋白系统。例如，Ghosh等在2000年报道，两个GFP片段，分别是GFP结构
的1-157位氨基酸和158-238位氨基酸，当该两个独立的片段与能够形成反向平行亮氨酸
拉链的螺旋序列融合时，其能在体外或通过大肠杆菌(E.coli)中共表达被重组产生一荧
光产物(Ghosh et 2000，反向平行亮氨酸拉链定向蛋白重组应用于绿色荧光蛋白.J.Am.
Chem.Soc.122：5658-5659)。同样地，美国专利No.6,780,599描述了能够形成反向平行亮
氨酸拉链的螺旋结构加入GFP分子脱落片段的用途。该专利说明书确定：GFP片段上不附
有互补的螺旋结构，就不可能发生重组。尤其是，说明书指出在对照实验中，没有亮氨酸拉
链对的GFP片段“不能显示任何绿色克隆，因此强调需要NZ和CZ亮氨酸拉链的同时存在，
以介导GFP在体内和体外组装”。

[0011] 同样地，Hu等在2002年表明相互作用的蛋白bZIP和Rel，在与GFP的两个片段发生融合时，能通过它们之间的相互作用介导GFP重组(Hu等2002，利用双分子荧光互补
呈现活细胞内bZIP和Rel家族蛋白之间的相互作用Mol.Cell 9：789-798)。Nagai等在
2001年说明黄色荧光蛋白(YFP)片段与钙调素和M13融合后能在有钙的条件下介导YFP重
2+
组(Nagai等2001，设计循环序列改变的绿色荧光蛋白来检测Ca Proc.Acad.Sci.USA 98：
3197-3202)。作为这种方法的一种变化形式，Ozawa等通过自我剪接内含多肽序列将钙调素
和M13与两个GFP片段融合，从而在有钙的条件下介导GFP片段共价重组(Ozawa等2001，基
于蛋白剪接检测体内蛋白与蛋白之间相互作用的荧光指示剂Anal.Chem.72：5151-5157；
Ozawa等2002，监控细菌内蛋白与蛋白之间相互作用的脱落绿色荧光蛋白的基于剪接的蛋
白重组：改良的敏感性及简化的筛选次数Anal.Chem.73：5866-5874)。这些研究者中有
一位随后报道将基于剪接的GFP重组系统应用于培养的哺乳动物细胞中(Umezawa，2003，
Chem.Rec.3：22-28)。最近，Zhang等在2004年表明上文中Ghosh et al.，2000的螺旋状
结构剪接GFP系统在线虫C.elegans中共表达时能被用于重组GFP(YFP和CFP也可以)荧
光，且证明该系统在体内的有效共表达的用途(Zhang et al.，2004，与重组的荧光蛋白组
合标记的细胞和细胞器官Cell 119：137-144)。

[0012] 虽然上述GFP重组系统优于两个明显不同的荧光蛋白标签的使用，但是它们受到以下限制：片段大小和相对差的折叠特性(Ghosh et al.，Hu et al.，supra)，需要化学
连接或融合相互作用的伴侣多肽以促使重组(Ghosh et al.，2000，supra；Ozawaet al.，
2001，2002supra；Zhang et al.，2004，supra)，共表达或共再折叠以产生可检测的折叠和
荧光的GFP(Ghosh et al.，2000；Hu et al.，2001，supra)。较差的折叠特性限制了这些片
段用于一起同时表达或同时重折叠的情况。这样的片段不适用于体外检验，因为它要求各
片段在互补之前具有长时间的稳定性和可溶性。这种脱落蛋白片段不适用的例子是，标签
有一对脱落蛋白片段之一的多肽的定量，然后再通过加入互补片段被检测。

[0013] 一种理想的蛋白标签应该是遗传编码的，并在体内体外都能工作，且能提供一个灵敏的分析信号，而不需要外在试剂或底物。然而，至今还没有一种脱落荧光蛋白标签系统
的描述，该种系统不依赖于使用融合异源多肽结构域去驱使荧光报告蛋白活性的重建。在
本发明要求和提出的一种脱落荧光蛋白标签系统中，片段不需要融合的相互作用蛋白的结
构域就能自发地进行自我联结，并在联结前能保持可溶状态，且不改变融合目标蛋白的可
溶性。

[0014] 发明概述

[0015] 本发明提供了一种基于荧光蛋白和生色蛋白自行互补片段的蛋白标签和检测系统。本发明的系统以来源于水母(aequorea victoria)的绿色荧光蛋白(GreenFluorescent
Protein GFP)的自行互补片段的各种结合为例，所述片段可被用于以多种检验形式检测和
定量体内和体外蛋白的溶解性。

[0016] 在一个特别实施方式中，试验蛋白与GFP的一个16个氨基酸的片段(β11链，氨基酸215-230)融合，并用遗传工程方法使融合蛋白的可溶性不受破坏。当加入GFP互补片
段(β1-10链，氨基酸1-214)，GFP片段的自发结合导致结构互补、折叠，从而伴随产生GFP
荧光。

[0017] 脱落GFP系统是非常简单的，它不需要外在试剂，并提供一个直接与标签蛋白量成比例的灵敏分析信号，在不到15分钟时间内就能定量工作台上典型相遇的蛋白，也能报
告可溶或不可溶蛋白，且在体内和体外都能工作。目前还没有别的蛋白标签和检测系统能
结合上述这些功能。如以下实施例所详细描述的，脱落GFP系统已被用于定量多孔板内的
蛋白，并被用于监控活的大肠杆菌内蛋白的表达和溶解性。

[0018] 本发明的脱落GFP系统对于检验蛋白溶解性、定量蛋白以及对报告蛋白的检验是特别有用的，所述报告蛋白检验可监控目的在于改进特殊多肽或蛋白的折叠和溶解性的人
工定向进化方法是否成功。此外，本发明的系统可被用于检测抑制和/或促进蛋白不正确
折叠的因素，尤其是在高通量药物发展模式中。

[0019] 本发明还提供了产生报告蛋白自行互补片段的方法。这些方法以产生GFP基因工程片段为例，且这些方法可被用于创造其他GFP类似荧光和非荧光蛋白的自行互补片段。

[0020] 附图的简要说明

[0021] 图1A是pTET-SpecR质粒的示意图，它是来自Clontech(Palo Alto，CA)的pPROTet.6*HN载体的修饰形式。氯霉素抗性基因在pPROlar抗性标记的卡那霉素启动子的
控制下被奇放线菌素抗性标记所取代(pPROlar来自Clontech，Palo Alto，CA)。在T0转
录终止序列的上游，相同的顺反子上编码了四环素抑制基因。抑制基因翻译的量由在Sacl
下游的一个弱的Shine-Delgarno序列调节。

[0022] 图1B展示了设计的pTET-SpecR质粒的不同元件。粗体表示的序列＝侧面与NcolCCATGG和KphlGGTACC相接的，表达在tet启动子下基因的vl克隆盒。灰色序列
＝SpecR-tetR顺反子的T0转录终止子；绿色序列＝tetR抑制基因；黄色序列＝控制
tetR翻译的RBS；品红色序列＝奇放线菌素(SpecR)基因；青色序列＝来自PROlAR载体
(Clontech，Palo Alto，CA)的卡那霉素启动子元件。

[0023] 图2显示了脱落GFP互补的原理。目的蛋白(X)通过一个可伸缩的接头(L)与一个小的GFP片段(β-链11，215-230个残基)融合。互补的GFP片段(β1-10链，1-214个
残基)被分开表达。两片段在单独的情况下均无荧光。当两片段混合时，大小GFP片段会
自发结合，发生GFP折叠和形成荧光团。使得小的GFP标签片段难以接近的过程，如错误折
叠或聚集，都会阻止片段互补的发生。

[0024] 图3为11个β-链GFP家族成员的拓扑二级结构示意图。(A)氨基酸的链和编号。被圈起来的数字标记了链之间的转角(是蛋白剪接的优选位点)，黑色的圆圈是折叠的
报告突变，白色的圆圈是超折叠的GFP突变。(B)显示了11条β-链的编号惯例。(C)显
示了通过用一个短的可伸缩的接头连接N末端和C末端而生成的环形GFP突变体，它在173
位氨基酸处产生了一个新的起始密码子，在172位氨基酸后产生了终止密码子。

[0025] 图4显示了在位置157或172处进行GFP片段剪接(如1-156+157-238片段和1-171+172-238片段)，然后在培养皿上的大肠杆菌克隆中兼容的质粒共表达两片段，最后
在体内互补产生的荧光图像。左列显示了来自于折叠报告蛋白GFP的片段，右列显示了来
自于超折叠的GFP的相同片段。和预想的一样，跟折叠报告蛋白GFP相比，超折叠片段的效
果更好并且能产生更亮的克隆，被改进的超折叠GFP的折叠也有相同效果。

[0026] 图5显示了体外GFP1-10变异体的互补效率。在加入180μl含有1mg/ml与野生型GFP11融合的可溶性亚硫酸还原酶的缓冲液后，20μl的1mg/ml重折叠的超折叠
GFP1-10(较低的曲线)或相同量的可溶的最优化的GFP1-10OPT片段(较高的曲线)与其
进行互补产生的荧光增强曲线。插图显示了体内GFP1-10变异体的互补，是在硝化纤维膜
上共表达与野生型GFP S11融合的亚硫酸还原酶和来自超折叠GFP(上部)，或折叠报告
GFP(下部)的GFP1-10片段的大肠杆菌BL21(DE3)克隆的荧光图像。

[0027] 图6显示了单独表达己酮糖磷酸盐合酶蛋白(HPS)或表达HPS的N末端与野生型GFP S11融合的蛋白(WT)，或表达与三个GFP S11最优变异体(M1，M2，M3)融合的HPS的大
肠杆菌细胞在可溶部分和沉淀部分的SDS聚丙烯酰胺凝胶图谱。结果表明HPS-GFP S11野
生型融合蛋白是不可溶的，而单独的HPS是60％可溶。

[0028] 图7显示了组织培养皿上的体外实验中，在加入过量GFP1-10OPT(800pmol)后，三个与亚硫酸还原酶融合的GFPS11变异体M1，M2和M3(50pmol)的荧光互补动力曲线。每个
检测的最终体积为200μl。

[0029] 图8显示了运用三个不同的GFP1-10构体进行连续诱导(左列)或联合诱导操作(右列)的效果。图为三排表达了具有更好效果和溶解性的GFP1-10构体的大肠杆菌克隆
的荧光图像：折叠报告蛋白(FR，第一排)，超折叠蛋白(SF，第二排)，或最优化的GFP1-10
变异体(OPT，第三排)。超折叠GFP1-10单独表达时是不溶的。第一列：在表达亚硫酸还原
酶-GFP S11融合蛋白后GFP1-10的瞬时表达。第二列：与亚硫酸还原酶-GFP S11野生型
融合蛋白共表达GFP1-10。超折叠GFP1-10是不溶的，在进行瞬时诱导操作后细胞出现微弱
的荧光，很可能因为超折叠GFP1-10可以在表达亚硫酸还原酶-GFP S11野生型融合蛋白之
前聚集，从而削弱了互补的效率。共表达产生了发光的细胞很可能因为在超折叠GFP1-10
和亚硫酸还原酶-GFP S11融合蛋白之间可发生迅速的结合和互补，从而挽救了GFP1-10，
避免其发生错误折叠和聚集。相反地，不论这些构造是连续表达还是共表达，部分可溶的
GFP1-10OPT细胞都能发出荧光。

[0030] 图9显示了运用GFP S11M3标签片段和GFP1-10OPT检测片段进行脱落GFP互补的灵敏度。含有0.1-200pmol亚硫酸还原酶-GFP S11M3融合蛋白片段的20μl等量样本与
含有800pmolGFP1-10OPT片段的180μl等量样本进行混合互补。(A)在加入GFP1-10OPT
片段后15分钟每份溶液的荧光测量值。(B)在加入GFP1-10OPT片段后1小时每份溶液的
荧光测量值。

[0031] 图10显示了50，25，12.5，6.25，3.13，和1.56pmol亚硫酸还原酶与GFP S11M3融合蛋白样本的互补进程曲线。通过减去一个小的常数并应用一个缩放比例因素(参见图10
中插入的表)得出适合50pmol的进程曲线的数据，再应用EXCEL数据分析工具求解器(微
软公司)进行非线性最小平方计算。极好的重叠说明了进程曲线的形状并不依赖于标签蛋
白的浓度或未连接的GFP110OPT片段层的缺失。

[0032] 图11显示了C末端GFPS11M3标签的折叠报告蛋白与结合Talon树脂的6HISGFP1-10OPT的结合和互补情况。(1)结合Talon树脂的6HIS GFP1-10OPT，(2)与C末端融
合有GFP S11M3的折叠报告GFP的结合小珠荧光迅速增强，(3)基于互补的缓慢的荧光生
成。

[0033] 图12显示了尿素浓度对互补反应的影响。2M以上的尿素会使反应结束。

[0034] 图13显示了pH值对互补反应的影响。(A)在加入GFP1-10OPT后的6小时亚硫酸还原酶-GFP S11M3融合蛋白的最终荧光具有pH值依赖性。(B)在加入GFP1-10OPT后的6
小时人工合成肽GFP S11的最终荧光具有pH值依赖性。在pH值小于6.5时，荧光互补反
应不能有效进行。

[0035] 图14的柱状图显示了体外应用脱落GFP系统，对带有C末端GFP S11M3标签的18个试验蛋白(参看之前的表3)的蛋白定量。应用GFP1-10OPT与GFP片段互补可检测可溶
部分(黑色柱)和非折叠的沉淀部分(灰色柱)的荧光。SDS聚丙烯酰胺凝胶图显示了相
应的可溶部分(S)，和沉淀部分(P)。应指出，#8蛋白，酒石酸脱水酶β-亚基在ca.13kD处
有另一条较低的条带。

[0036] 图15显示了应用脱落GFP检测系统进行体内蛋白溶解性和表达筛选。来自tet-启动子质粒的N末端6HIS片段和C末端GFP S11M3片段标签的18个Pyrobaculum试
验蛋白(参看之前表3)被克隆入一个大肠杆菌BL21(DE3)菌株中表达，同时该菌株还含有
表达GFP1-10OPT片段的pET质粒。对带有标签的结构和GFP1-10OPT进行联合诱导表达后
(上部)，或在瞬时表达标签结构后再表达GFP1-10OPT(连续诱导，中部)，然后观察平板培
养基上克隆的荧光图像，以及在液体培养基中连续诱导的细胞的Talon树脂结合小珠的可
溶部分(B)和沉淀部分(P)的SDS-聚丙烯酰胺凝胶图像(下部)。箭头指示为偶然结合的
GFP1-10OPT(易可见分子量为ca.29kD)。需要注意的是核苷二磷酸激酶(蛋白#7)是部分
可溶的(在Talon树脂结合部分GFP1-10OPT的相应条带略微下面可看见一条带)。多硫还
原酶-GFP S11M3融合物(参看之前表3)产生出颜色很深的红色克隆。它吸收488纳米的
激发光，并在共表达两片段时削弱整个细胞的荧光，尽管蛋白能够很好表达。

[0037] 图16显示了应用GFP S10-11OPT标签片段和GFP1-9OPT检测片段进行脱落GFP互补的灵敏度。含有亚硫酸还原酶-GFP S10-11OPT融合蛋白的20μl等量样本与含有250μM
GFP1-9OPT片段的180μl等量样本进行混合互补。加入GFP1-10OPT后6小时每份溶液测
量荧光值。由于GFP1-9OPT的浓度是受限的，在亚硫酸还原酶-GFPS10-11大于约250μM
时，荧光值达到平稳状态。

[0038] 图17显示了三明治标签形式的原理，其中试验蛋白X是作为两个GFP结构域(链10和链11)之间的融合蛋白表达，并由第三个GFP结构域(GFP1-9OPT)检测。(a)当标签
链均被完整的目标蛋白X连接时，互补反应有效发生。(b)如果标签链分离，则互补反应不
能有效进行。

[0039] 图18(A)显示了来自用GFP1-9OPT作为互补目标的(GFP S10)-L1-Ndel::GGGSGSGG::BamH1-L2-(GFP S11)改进的六个最适结构的序列，该序列后接有起始序列(底部序
列)。GFP S10和GFP S11用蓝色区域进行了强调。相对于起始序列的六个最适结构的突
变以黄色区域显示。优选第五个最适结构，被称作(GFP S10SM5)-Ll-Nde-1::X::BamH1-L2
-(GFP S11SM5)，其中X作为目标蛋白。(B)显示了十四个诱导突变的变性引物，用于在GFP
S10的目标位点诱导突变。

[0040] 图19显示了参考序列(GFP S10)-L1-Ndel::GGGSGSGG::BamH1-L2-(GFP S11)，来自图18A(GFP S10SM5)-L1-Nde-1::X::BamH1-L2-(GFP S11SM5)的最适序列，以及八个最适
结构(GFP S10)-L1-Nde-1::HPS::BamH1-L2-(GFP S11SM5)的序列。在目标链GFP S10中
的，可增加起始序列(GFP S10SM5)-L1-Nde-1::HPS::BamH1-L2-(GFP S11SM5)的溶解度的
突变用红色强调显示。这八个最适结构序列的每个序列后面都接有可伸缩的连接序列和
GFP S11SM5(参看列表中第二个序列的末端)，通过HPS编码序列继续延伸，并在BamH1位
点重新开始。

[0041] 图20显示了体外和体内十八个Pyrobaculum控制蛋白X的互补检测，它们被克隆到一个带有(GFP S10A10)-GGGS-Nde1-X-BamHI-GGGS-(GFP S11 SM5)的pTET载体的Nde1/
BamHI克隆位点，然后转化到一个BL21(DE3)菌株中，该菌株在以p15为起始点的pET 28载
体上含有GFP1-9OPT。对于体外检测，液体培养液只能通过AnTET诱导。(a)用GFP1-10OPT
进行的20μl可溶等量样本的检测。(b)用GFP1-10OPT进行的10μl尿素增溶的沉淀等量
样本的检测。(c)用GFP1-9OPT进行的20μl可溶等量样本的检测。(d)用GFP1-9OPT进
行的10μl尿素增溶的沉淀等量样本的检测。(e)用AnTET试剂瞬时诱导来自pTET的三明
治标签结构，然后用IPTG对GFP1-9进行诱导，之后观察大肠杆菌的荧光图像。

[0042] 图21显示了用GFP1-10A4对可溶的亚硫酸还原酶-S11H7融合蛋白进行互补的灵敏度图像。该检测显示了皮摩尔的灵敏度。在该实验中，不使用0.5％的牛血清(BSA)溶液
封闭96孔板。低浓度下(插图)标准曲线的非线性化可能是因为孔板表面的吸收导致标
签蛋白的损失。

[0043] 图22显示了折叠报告蛋白GFP-(GFP-S11H7)融合蛋白和N6HIS-折叠报告蛋白GFP融合蛋白的粗提液和纯化片段的SDS-聚丙烯酰胺凝胶染色图。

[0044] 图23是在不同咪唑浓度下，N6-HIS-GFP，折叠报告蛋白GFP-(GFP S11H7)和折叠报告蛋白GFP-(GFP S11H9)与Talon树脂小珠结合后被洗脱的片段的荧光强度柱状图。与
结合更紧密的(GFP S11H9)相比，(GFP S11H7)标签物在更低浓度的咪唑下开始洗脱。而
信号强度是与被释放到上清液中的蛋白量相关，信号越强，在指定咪唑浓度下蛋白与树脂
的结合越不紧密。

[0045] 图24显示了几个试验蛋白的小规模纯化，该些试验蛋白来自Pyrobaculum并在C末端带有(GFP S11H9)标签，且用Talon树脂进行纯化。该图为在TNG缓冲液中加入150mM
咪唑的裂解液的可溶部分(S)，不结合的部分(U)和被洗脱的蛋白(E)的SDS-聚丙烯酰胺
凝胶图像。

[0046] 发明的详细描述

[0047] 定义

[0048] 除了其他特殊说明外，所有在此运用的技术、符号及其他科学术语所指的含义都是本领域技术人员普遍能理解接受的含义。其中，为了充分清楚地阐述或作为现成的参考，
有时会给出一些普遍被理解接受术语的定义，而这些定义所包含的内容与该技术领域通常
理解的含义没有实质上的区别。本领域技术人员一般都能明确理解在此被描述或引用的
技术方法和步骤，并能用常规的方法实施应用。例如，在Sambrook等分子克隆中描述的已
被广泛应用的分子克隆方法：纽约Cold Spring Harbor(冷泉港)的Cold Spring Harbor
实验室出版的第三版(2001年)实验操作手册和通用分子生物操作规程(2001年John &
Sons公司出版)。除其他特殊说明外，合适的情况下，大体可按商业上直接可用的试剂盒和
试剂所提供的操作规程和/或参数进行实验操作。

[0049] 本发明提到的“荧光蛋白”是指一种水母绿色荧光蛋白(GFP)，GFP的结构变异体(如环形突变体，单节显性的变体)，GFP的折叠变异体(如高可溶性，超折叠性变异体)，
GFP的光学变异体(如YFP，CFP)，以及GFP类似荧光蛋白(如DsRed)。术语“GFP类似荧光
蛋白”是指拥有β11链“管式”结构的珊瑚类动物荧光蛋白，GFP的结构变异体、折叠变异
体及光学变异体也都拥有β11链“管式”结构。术语“GFP类似非荧光蛋白”和“GFP类似
生色蛋白”(简称“生色蛋白”或“色(素)蛋白”)是指珊瑚和水螅纲类动物的生色蛋白，
它们含有GFP的β11链“管式”结构及其结构变异体、折叠变异体和光学变异体。GFP类似
蛋白都拥有共有的结构和功能特征，除了氧分子，不需要附加的辅因子、外加酶催化剂或底
物就能无限形成内在生色蛋白。

[0050] 一种荧光蛋白的“变异体”来源于一种“母体”荧光蛋白，它保留了β11链的管式结构和内在的荧光性，它还包括氨基酸替代、剔除或插入的结构，该种结构可能会赋予该蛋
白新的或改良的生物特性(如更好的稳定性、提高的溶解性，改善的折叠程度与散发或激
发光谱中的迁移，减少或消除多聚体的形成等)，同时还包括具有被修饰过的N末端和C末
端的结构(如环形突变体)。

[0051] 当涉及报告多肽时使用术语“互补片段”或“补充片段”，它是指独自无活性的多肽片段(如不表达该报告多肽的表型)，其中互补片段的结合能恢复报告多肽活性。术语“自
行互补”，“自我组装”和“自发结合”在描述两个或更多的荧光(或生色)蛋白片段时，是指
在单个片段可溶的情况下，这些片段能够重新组成一个完整的荧光(或生色)蛋白。

[0052] 本发明中的″MMDB Id：5742结构″是指在分子建模数据库(MMDB)中被Ormo和Remington公开的MMDB编号为5742GFP蛋白结构。PDB编号：1EMA PDB作者：M.Ormo和
S.J.Remington PDB证明书1-Aug-96PDB分类：荧光蛋白PDB题目：来自水母的绿色荧光蛋
白。蛋白数据库编号参考是PDB编号：1EMA PDB作者：M.Ormo和S.J.Remington PDB证明
书：1-Aug-96PDB分类：荧光蛋白PDB题目：来自水母的绿色荧光蛋白。(参看Ormo等.“水
母绿色荧光蛋白的晶体结构”，科学，1996年九月第六期；273(5280)；Yang等，“绿色荧光蛋
白的分子结构”，自然生物技术，1996年十月；14(10)：1246-51)。

[0053] ″均方根差″(″RMSD″)是指在埃单位下平方均值叠加的平方根的剩余值。该数在两个结构的最佳叠加后计算得出，作为等价α碳原子间距离的平方平均值的平方根。

[0054] 当涉及一个核酸的一部分时会使用术语″异源的″，它是指这个核酸由两个或更多个在自然界中未被发现的彼此同一相关的亚序列组成。例如，代表性地重组合成一个核
酸，该核酸具有两个或更多的来自不相关基因的序列重组形成了一个新的功能性核酸，一
个核酸序列编码一种来源的荧光蛋白，另一个核酸则为编码不同来源的另一个多肽序列。
同样地，一个异源蛋白指它由两个或更多个在自然界中没有被发现彼此同一相关的亚序列
组成(如融合蛋白)。

[0055] 在上下文中两个或多个核酸或多肽序列的“同一性的”或“同一性”百分比是指两个或多个序列相同或有特定百分比的氨基酸残基或核苷是相同的(例如，在通过一个比较
窗口比较和线性化求最大相关性时的特定区域内，或应用一个以下缺省参数描述的BLAST
或BLAST 2.0序列比对运算法则或通过手工校正和观察来测定的指定区域内，序列大概是
70％同一性，优选75％，80％，85％，90％，或95％的同一性。这种序列就被认为是“实质上
相同的”。这种序列定义也涉及到一个测试序列的优化。优选一个区域的相同在长度上最
好至少是大约22个氨基酸或核苷，而30，40或50-100个氨基酸或核苷则更优选。

[0056] 对序列比对来说，通常需要就相对被测试序列列出一个相应的参考序列。当运用一个序列比对算法时，被测序列和参考序列都被输入到电脑中，必要时需指定匹配的亚序
列，并且指定序列比对算法程序中的参数。可以使用缺省的程序参数，也可指定其他的参数
值。然后序列比对算法会基于本程序的参数计算出被测序列相对于参考序列的序列同一性
百分比。

[0057] 这里所用的“比对窗口”，包括涉及一种从序列中选取的，具有从20到600，通常为50到200左右，更常见的为100到150之间的任何长度的连续位点的片段。该片段序列可与
具有相同长度连续位点的参考序列比较，此比较通常在两序列都被线性优化后进行。在该
技术领域中比对序列的线性化方法已广为人知。比对序列的线性优化方法可采用如Smith
和Waterman发表在1981年Adv.Appl.Math.2：482上的局部同源性运算法则，Needleman和
Wunsch在1970年J.Mol.Biol.48：443中报道的同源性优化运算法则，Pearson和Lipman
在1988年Proc.Acad.Sci.USA中85：2444发表的相似性方法的探寻中的运算法则等，以
及这些匀速阿法则的计算机化(在Wisconsin遗传学软件包中的GAP，BESTFIT，FASTA，和
TFASTA，遗传学计算机组，575Science Dr.，Madison，WI)，或通过手工线性化和视觉观察
(参看，分子生物学中的通用规程(Ausubel等，eds.1995年，附注))。

[0058] 在序列同一性百分比的测定中一个合适的首选运算法则为BLAST和BLAST 2.0运算法则，两种方法分别在1997年的Nuc.Acids Res.25：3389-3402和1990的J.Mol.
Biol.215：403-410中被Altschul等人所阐述。BLAST和BLAST 2.0用于测定本发明的核
酸和蛋白的序列同一性百分比，测定中通常使用本发明描述的缺省参数。进行BLAST分析
的软件是由国家生物技术信息中心提供的公众可用软件。该运算法则包括通过鉴定在可
疑序列中W长度的短字来第一次确定高分值序列对(HSPs)，当用一个数据库序列中相同长
度的短字线性化时，它匹配或满足某个正估计阈值T。T是作为邻近字符的分值阈值而言的
(Altschul等，见上文)。这些初始的邻近字符的采样被作为样源，从而可开始搜寻包括这
些字符的更长的HSP。这些字符样从每个序列的两个方向延伸，因为其累积线性的分值是
可以增加的。对于核苷酸序列来说，累积的分值用参数M(一对匹配残基的正反馈分值；通
常＞0)和N(不配对残基的负反馈分值；通常＜0)来计算。对于氨基酸序列来说，用一个
分值矩阵来计算其累积分值。以下情况出现时字符样沿两个方向的延伸停止：由X的量来
反映的累积线性分值从它能达到的最大值下落时；因为一个或更多负分值残基的线性的累
加，累积分值下落到零或者负值时；或者是因为已经达到了其中一个序列的末端时。BLAST
的算法参数W，T，和X决定了线性化的灵敏度和速度。BLASTN程序(对核苷酸序列来说)
使用的缺省参数是一个为11的字符长度(W)，一个为10的期望值，M＝5，N＝-4以及两条
链的比对。对氨基酸序列来说，使用的缺省参数是一个为3的字符长度(W)和为10的期望
值，以及50的BLOSUM62分值矩阵线性化参数(B)(参看Henikoff & Henikoff，Proc.Natl.
Acad.Sci.USA 89：10915(1989))，10的期望值，M＝5，N＝-4以及两条链的比对。

[0059] BLAST运算法则也可用于进行两序列间相似性的统计学分析(参看范例Karlin&Altschul，1993，Proc.Acad.Sci.USA 90：5873-5787)。通过BLAST算法进行的一个相似性
测量的标准是测定最小加和概率(P(N))，可指示两核苷酸序列或氨基酸序列之间偶然匹配
的概率。比如，在一个被测核苷酸序列和参考核苷酸序列的比对中，如果最小加和概率的可
能性小于0.2，更佳的小于0.01，最佳的小于0.001，就认为该被测核苷酸序列和参考序列
相似。

[0060] 本发明中当涉及到一个SEQ ID NO参考时，术语“通过最大相关性决定”指一个序列运用一种算法时，如带有缺省参数的BLAST算法，在参考序列的长度上最大程度地与参
考SEQ ID NO一致。本领域技术人员容易做此决定。

[0061] 本发明中“连接”是既指物理上的连接，也指在生物微粒如噬菌体、细菌、酵母或其他真核细胞中共存而发生的连接。

[0062] “物理连接”是指在该领域中已知的连接两个分子的任何方法(被称为“物理地连接”)，包括无限制的连接，带有或不带有干扰结构域的重组融合，切除肽-介导的融合，非共
价键结合，共价键结合(如双硫键结合和其他共价键结合)，氢键结合；静电的键合连接以
及构象的键合连接，如抗体-抗原，生物素-抗生物素蛋白结合。

[0063] “融合”是指通过共价键结合的连接。

[0064] 本发明中“接头”或“间隔团”是指连接两个分子如一个荧光连接配体和一个显示蛋白或核苷酸的一个分子或分子基团，通过把两个分子放在首选的构型上起作用。

[0065] 本发明中交替提到的术语“多肽”，“肽”和“蛋白”指氨基酸残基的聚合物。该术语可用于描述其中有一个或多个氨基酸残基是与天然存在的氨基酸相应的人造化学模仿
的氨基酸聚合物，也指天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。

[0066] 术语“氨基酸”是指天然存在和人工合成的氨基酸，也指氨基酸的类似物和在功能上与天然存在的氨基酸相似的氨基酸模仿物。天然存在的氨基酸包括由遗传密码子编码的
氨基酸和后来被修饰的氨基酸，如羟基脯氨酸，γ-羧基谷氨酸和o-磷酸化丝氨酸。氨基
酸类似物是指那些与天然氨基酸有着相同基本化学结构的化合物，即一个α碳原子与一
个氢原子，一个羧基、一个氨基和一个R基团如高丝氨酸，己氨酸，甲硫氨酸亚砜，甲硫氨酸
甲基锍等相连。这些类似物拥有修饰的R基团(如己氨酸)或修饰的多肽骨架，但仍保持
天然氨基酸的基本化学结构。氨基酸模仿物是指结构上与氨基酸的常规化学结构不同，但
功能上与天然氨基酸相似的一类化合物。

[0067] 本发明的氨基酸可能是用通常已知的三字母代号或由IUPAC-IUB生物化学命名委员会推荐的单字母代号表示。同样地，核苷酸也可能用已普遍接受的单字母编码表示。

[0068] 熟语“核苷酸”是指脱氧核糖核酸或核糖核酸以及它们单链或双链形式的聚合物。除非特别限制说明，该术语还包括那些与天然的参考核苷酸有着相似结合特性的，并在代
谢形式上与天然核苷酸相似的天然核苷酸的类似物。除非其他说明，一个特殊的核苷酸序
列也包括其保守修饰的变异体(如简并密码子取代物)、互补的序列以及明确指明的序列。
特别说明的是，简并密码子取代物可能通过将一个或多个选定的(或所有的)密码子的第
三个位置的碱基用一个混合碱基和/或脱氧肌苷残基取代而得到(参看Batzer等，1991，
Nucleic Acid Res.19：5081；Ohtsuka等，1985，J.Biol.Chem.260：2605-2608；Cassol等，
1992；Rossolini等，1994，Mol.Cell.Probes 8：91-98)。术语核苷酸会与基因，cDNA，和基
因编码的mRNA交替使用。

[0069] “保守修饰的变异体”既可用于氨基酸序列也可用于核苷酸序列。至于特殊的核苷酸序列，其保守修饰的变异体是指那些编码相同或基本上相同氨基酸序列的核苷酸，或
对于基本上相同的序列不编码氨基酸序列的核苷酸。由于遗传密码子的简并性，很多功能
上相同的核苷酸编码一个特定的蛋白。比如，密码子GCA，GCC，GCG和GCU都编码丙氨酸。
这样，每个由一个特定的密码子编码的丙氨酸的地方，密码子都能转变为相应的不改变被
编码多肽的密码子。这种核苷酸的变化为“沉默变异”，是保守修饰变异的一种。本发明编
码一个多肽的每个核苷酸序列也用于描述这个核苷酸的每种可能的沉默变异体。一种技术
能够辨认出一个核苷酸中的每个密码子(AUG除外，它通常是甲硫氨酸的唯一密码子，以及
TGG也除外，它通常是色氨酸的唯一密码子)能被修饰成一个功能上完全相同的分子。相应
地，每个编码一个多肽的核苷酸的沉默变异体都默认包括在每个被描述的序列中。

[0070] 对于氨基酸序列来说，一种技术能够辨认出一个核酸，肽，多肽或蛋白质序列的个别替代，缺失或增加会导致氨基酸被一个化学上相似的氨基酸替代的“保守修饰的变异
体”，这些变化为单个氨基酸或编码序列氨基酸一小部分的改变，增加或缺失。提供功能上
相似氨基酸的保守替代表是这个领域中广为人知的。这些保守修饰的变异体包括了本发明
的多形态的变异体、种间同源体和等位基因。

[0071] 以下八个组每组包含相互保守替代的氨基酸：1)丙氨酸(A)，甘氨酸(G)；2)天冬酰胺氨酸(D)，谷胱酰胺氨酸(E)；3)天冬氨酸(N)，谷氨酸(Q)；4)精氨酸(R)，赖氨酸(K)；
5)异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，缬氨酸(V)；6)苯丙氨酸(F)，酪氨酸(Y)，色氨
酸(W)；7)丝氨酸(S)，苏氨酸(T)；8)半胱氨酸(C)，甲硫氨酸(M)(参看Creighton，蛋白
质(1984))。

[0072] 像多肽结构这种大分子结构可以用不同的组织水平来描述。关于这种组织的常规讨论参看Alberts等著，细胞的分子生物学(1994年第三版)和Cantor和Schimmel著，生
物物理化学第一部分：生物大分子的构象(1980)。“一级结构”是指一个特定多肽的氨基酸
序列。“二级结构”是指在一个多肽中局部有序的三维结构。这些结构通常被认为是结构
域。结构域是一个多肽的一部分，它能够形成该多肽的紧密单元，通常长度约为25到500
个氨基酸。典型结构域由较小的组织结构如β-折叠和α-螺旋的扭曲所组成。“三级结
构”是指一个多肽单体的完整的三维结构。“四级结构”是指由独立的三级结构单元以非共
价键的结合方式形成的三维结构。各向异性项也被称为能量项。

[0073] 术语“分离的”和“纯化的”是指能充分地或必要地从一个组分中直接得到的物质，该组分通常在天然状态下即含有此物质。不过，“分离的”并不指在一块电泳胶或其他分离
介质中存在的组分。一个分离的组分是与这些分离介质脱离的，并将在其他方面应用或已
经在新的环境应用。

[0074] 脱落荧光和生色蛋白系统

[0075] 本发明的一个方面是提供可溶的荧光或生色蛋白的自行互补的片段。这些片段并不分别地显示出荧光或发色的“报告”表型。当物理空间上最接近时，这些片段自发地进行
互补，从而重新组成它们所来源的那个蛋白质，重新恢复报告表型。这种互补片段的集合被
定义为“脱落荧光”或“脱落生色”蛋白系统。这些系统可由GFP，GFP类似荧光蛋白，GFP类
似非荧光蛋白和它们的变异体产生，可有效标记和检测活细胞、细胞裂解液，或其他体外分
析形式中的可溶或不溶蛋白。同时也对本发明的脱落荧光和脱落生色系统的其他多种不同
用途进行了展望。

[0076] 本发明的脱落荧光和脱落生色蛋白系统使用简单，而且不需要用于检测报告表型的外源试剂。在一些具体实施方式中，这些片段不会改变与之融合的试验蛋白的溶解特性。
在另一些具体实施方式中，一个片段可能会扰乱与之融合的试验蛋白的溶解性，但这样该
片段即可用于蛋白质的溶解性筛选。

[0077] 为举例说明本发明的这个方面，一个溶解性增强的GFP(美国专利申请No.10/423,688：WO03/095610)的多个自行互补片段被构建，并应用于一系列蛋白的检测、
定量分析及纯化方法，下文中的例6，9，10有进一步的描述。这些“脱落GFP”蛋白检测系
统展示了可靠的体内和体外可溶性、不溶性和/或总蛋白含量的定量检测(例如，来自活细
胞、未加工的裂解液及在纯化和下游处理中的任何样品中的可溶性表达蛋白)。

[0078] 任何GFP，GFP类似荧光蛋白，GFP类似生色蛋白均可在本发明的实际应用中使用(参看下文中在副标题荧光和生色蛋白下该家族蛋白的描述)。除此之外，本发明的内容可
延伸到其他脱落报告蛋白系统的生成，这些系统中使用任何带有可检测表型的蛋白，例如
β内酰胺酶，β半乳糖苷酶((Ullmann，Jacob等.1967；Welply，Fowler等.1981；Worrall
and Goss 1989；Jappelli，Luzzago等.1992；Rossi，Blakely等.2000；Wigley，Stidham
等.2001；Lopes Ferreira and Alix 2002))，二氢叶酸还原酶(Gegg，Bowers等.1997；
lwakura 和 Nakamura 1998；Pelletier，Campbell-Valois 等 .1998；Pelletier，Arndt
等.1999；Nakamura等.2000；Smith andMatthews 2001；Arai，Maki等.2003)，以及抗氯霉
素蛋白。

[0079] 脱落荧光和脱落生色蛋白系统可以实现许多蛋白的检测和定量化分析。相比常规的蛋白检测和定量化技术，如SDS-聚丙烯酰胺凝胶，dot-blots以及类似的方法均耗时且
难以自动化，该系统的分析具有更大的优点。。例如，用本发明的脱落GFP系统进行的蛋白
检测和定量具有高灵敏度，可用于活细胞中或未加工的细胞裂解液中的蛋白检测(参看下
文范例9和10)。另外，此分析系统耐用性好(如对变性剂、pH条件和辅助剂的耐受度，见
下文例8)，容许将展开的沉淀进行蛋白定量，因此提供了一种总体蛋白表达量的定量方法
和一种在筛选蛋白重折叠剂中评估可溶蛋白复原的方法。

[0080] 以下简要举例说明本发明的脱落荧光蛋白系统的设计。该蛋白检测系统的设计包括该领域技术人员所知的相同的步骤和原理。第一，目为了确定生成单独片段的合适切割
位点，目标荧光蛋白被进行结构分析。该领域的技术人员都明白，这可通过在与GFP晶体结
构或其他荧光蛋白的晶体结构重叠或不重叠的情况下，参考该荧光蛋白的已知晶体结构来
实现，也可通过与GFP一级序列线性化来实现，还可通过预测性的结构建模(参考一个已知
的荧光蛋白结构，如GFP)等来实现。

[0081] 合适的剪切(或“分裂”)位点存在于β-折叠，特别是成环和旋转模体的序列中(见图3A，3B)。在一个简单的两片段系统设计中，一个荧光蛋白可在连续的β-链中(比如
在β-链的成环和旋转结构中)的分子内的任何位点被裂分成两个片段，从而生成一个相
应于连续的β链第一部分的第一个片段和相应于连续的β-链第二部分的第二个片段。两
个片段结合部分包含β-链所有的互补。例如，可将荧光蛋白裂分为对应于链1-9和10-11
的片段或对应于链1-10和11的片段。在片段结合后，荧光(或发色)蛋白的所有的11条
β-链都存在。需要注意的是，也可通过将原有的N末端和C末端连起来并引入新的起始和
终止密码子也可以创建一个荧光蛋白的环形突变体，然后根据相应的连续的β-链进行片
段剪接(如相应裂分为环形突变体的前体链9-1和2-8的片段)(图3C)。可仿效的两片段
脱落GFP系统在实施例2，11，13中进行了描述。

[0082] 同样的，如当这个荧光蛋白被相应的剪接为β-链1-9，10和11片段时，就产生了一个三片段系统。可仿效的三片段脱落GFP系统在实施例12中进行了描述。

[0083] 一旦完成片段设计，即可运用该领域公知的克隆方法构建编码这些片段的核苷酸(如参见实施例1和实施例2)。

[0084] 另一种可选择的方法则以互补性的经验为主来评估相同或相关荧光蛋白的不同片段。如实施例2中所描述的，几对GFP片段能在可共存于大肠杆菌的质粒中共表达，并用
于互补性和相对荧光的评估。该方法可实现对来自一组荧光蛋白变异体进行有希望片段的
初始快速筛选(参看实施例2中的超折叠GFP和环3GFP)。接着，筛选得到的单个片段可在
增加溶解性和削弱试验蛋白的溶解性扰动方面做进一步改进(参看下文中副标题脱落蛋
白片段设计和实施例3，4)。

[0085] 使用本发明的脱落荧光或生色蛋白系统检测蛋白需遵循以下应用原则。简要地说，该荧光(或生色)蛋白的一个片段(“标签”片段)要与试验蛋白融合表达。如果试验
蛋白是可溶的，那么融合蛋白也可溶，于是可与该报告蛋白的其他片段(“检测”片段)进
行互补。通过如在相同细胞中表达此检测片段，或在表达融合蛋白的细胞溶解液中加入此
检测片段等方式来实现该试验蛋白和标签片段的融合蛋白的检测。相反地，如果试验蛋白
不可溶，或仅仅部分可溶，这些试验蛋白将会聚集，从而把被融合的标签片段“包埋”起来，
使得试验蛋白和标签片段的融合蛋白不可溶并且不能与检测片段互补。如果互补发生，就
会激活可检测到的报告表型。比如，当用一个荧光蛋白作为报告蛋白时，单独表达片段的自
行互补会重建特有的β-管式结构，形成发色团，发出可检测到的荧光。图2显示了一个脱
落GFP系统怎样运作的示意图。

[0086] 脱落荧光蛋白片段可以在应用的特殊分析环境中折叠和溶解。在优选的具体实施方式中，检测并改进这些单独片段的折叠性/溶解性，以分离出一个可溶的“标签”片段和
一个可溶的“检测”片段。在优选的溶解性检测应用中，标签片段在β1和3链之间，在最
优选的应用中，标签片段为一个单独的β链。然后试验蛋白与标签片段融合，而在与试验
蛋白融合时，标签片段最好是完全不干扰试验蛋白。即，单独存在的试验蛋白的溶解性和折
叠性应当和与标签片段融合的试验蛋白的溶解性和折叠性相似。

[0087] 基于应用脱落GFP系统(参看实施例2)的实验结果，溶解性检测中的最优化形式是通过应用一个相对大的检测片段(例如：约8-10个连续β链)和一个相对小的能与试
验蛋白融合的标签片断(例如：约1-3个连续β链)获得，其中，检测片段是可溶的，且可
与标签片段-试验蛋白融合蛋白互补，并且标签片段不干扰试验蛋白的溶解性。对于多数
应用的理想情况是，试验蛋白单独存在时的溶解性和与标签片段融合后试验蛋白的溶解性
大致相同。检测片段最好是单节显性的，且不会自发聚集或发生错误折叠。

[0088] 尽管在很多应用中，优选使用不干扰试验蛋白的标签片段，但倘若荧光量和溶解性之间存在固定的比例关系(不必是直接的比例关系)，标签片段不过是影响试验蛋白溶
解性，它在溶解性筛选分析中仍可使用。在一些具体实施方式中，使用一个或多个干扰性的
标签片段实际上是需要的(参看下文中三明治-形式检测的阐述)，例如为筛选高溶解性的
蛋白质。在这种情况下，应用干扰性标记片段可在所有蛋白中有效地选出溶解性最好的蛋
白或翻译产物。此外，这些应用中的检测片段应是可溶的，因为不溶的翻译产物将不能与可
溶的试验蛋白-标签片段融合蛋白互补。

[0089] 本发明还提供了荧光蛋白片段最优化处理的改进方法，在下文脱落蛋白片段设计中有阐述，并在实施例3和4中进行了举例说明。这些方法也可同样地应用于生色蛋白，以
及带有可检测表型的任何蛋白，以生成具有本发明所述的脱落荧光蛋白系统特性的脱落蛋
白系统。

[0090] 当使用本发明的脱落荧光蛋白和脱落生色蛋白系统时，可运用多种检测分析形式来检测和定量蛋白。下文进一步阐述了一些用于蛋白检测和定量的典型分析。此外，下面
实施例部分已对大部分检测分析作了实验证明。

[0091] 本发明的脱落荧光蛋白和脱落生色蛋白系统在蛋白溶解性筛选，蛋白检测和定量，蛋白纯化，蛋白的折叠和聚集，提高蛋白溶解性和产量的人工定向进化方法等方面中有
多种应用。现在简要地描述一下这些应用，在下面的实施例部分也能找到这些应用的实施
例。

[0092] 蛋白质检测及定量分析

[0093] 本发明的脱落荧光和脱落生色蛋白系统可以用来在体内或体外检测和定量蛋白，下面的实施例对此进行了详细的描述。在本发明的这一方面，提供可溶的或不可溶的蛋白
的检测分析，以及提供可溶的、不可溶的或总的蛋白表达的定量分析。在检测和定量分析
中，使用上文描述的脱落荧光和脱落生色蛋白系统。下文将概述作为本发明一方面的利用
脱落荧光系统的各种具体实施方式。然而，应当理解为类似的具体实施方式同样存在于脱
落生色蛋白系统中。

[0094] 体外检测分析

[0095] 在一个具体实施方式中，提供了一个检测可溶解蛋白的快速体外分析，其包括裂解细菌(或其它)细胞，该细胞表达第一个荧光蛋白标签片段和试验蛋白X(例如X-GFPS11
或GFP S11-X)的融合蛋白，其将裂解产物与第二互补荧光蛋白质检测片段接触，并筛选可
检测的荧光。分析中可检测荧光的存在显示试验蛋白是可溶的。该检测系统应当服从能高
通过量地从变异体文库中筛选一个蛋白质的可溶解变异体，且能快速辨认那些显示改良的
溶解性特征的变异体，允许快速辨别最优化特征，该优化特征可以被进一步改进。如下文实
施例9中所述，该检测分析可以直接在液体细胞培养物的天然裂解产物中进行。

[0096] 下面将简要描述利用一个两片段脱落GFP系统在体外检测可溶解蛋白。试验蛋白被融合于GFP标签片段(例如，X-GFP S11)的N末端，且在大肠杆菌中表达，细胞裂解后的
过量的互补GFP检测片段(如GFP1-10)与裂解产物或裂解产物的样品结合。可检测的荧光
表明检测片段和试验蛋白与标签片段的融合蛋白之间的互补，从而显示试验蛋白是可溶解
的。此外，如果所用标签片段没有干扰试验蛋白的溶解性，那么所获荧光信号的强度对于可
溶解试验蛋白的数量是直接成比例的。因此，在本系统中，荧光的程度提供了裂解产物样品
中的可溶解试验蛋白的精确定量(参考校准的蛋白数量曲线，见下文实施例6)。确实，甚至
如果标签片段干扰了试验蛋白的溶解性，那么试验蛋白量和荧光强度之间成比例关系。完
全或实质上没有可检测的荧光表明标签片段与试验蛋白的融合蛋白是不可溶的，或者实质
上是不可溶的，因此不能与可溶的大片段互补，从而表明试验蛋白本身在大肠杆菌中是不
可溶的。

[0097] 在所述的脱落-GFP系统中，试验蛋白的溶解性决定融合蛋白的标签GFP片段成分是否能与其补体结合。如果试验蛋白能正确折叠且是可溶解的，那么融合蛋白也是可溶解
的，从而能与可溶的试验片段互补。然而，如果试验蛋白是不可溶的，它会聚集起来，遮蔽或
包埋标签结构域，造成融合蛋白不可溶解。通常，试验蛋白与标签片段(试验蛋白-标签)
的N末端融合。C末端融合蛋白(标签-试验蛋白)也可以被使用，但在此应用中，标签片
段更有可能会反过来影响试验蛋白的折叠。然而，在期望仅仅筛选那些溶解性强的蛋白的
应用中，利用C末端融合蛋白(标签-试验蛋白)就可以仅仅选择那些溶解性最高的蛋白。

[0098] 不同的三片段系统也能被预见。在一个具体实施方式中，GFP被剪接成3个片段，典型地作为一个更大的检测片段和二个更小的标签片段。试验蛋白被插入到二个标签片
段(如S10-X-S11)之间的读码框中，且如果试验蛋白是可溶的，与检测片段(在本例中，
GFP1-9)的互补会重新建立GFP荧光。三片段系统(如S1-9+S10-X-S11脱落GFP系统)进
一步在名为设计一种(GFP S10)-X-(GFP S11)三明治标签形式和利用检测片段GFP1-9OPT
进行检测这些分部中得到阐述，见下文中实施例12。这些″三明治″类型的可溶解蛋白
检测分析形式在某些应用中有优势，例如筛选变异蛋白质文库得到更高可溶解的蛋白质产
量。三明治形式确保仅有的那些全长和完整无缺的试验蛋白被检测。读码框移位或通过突
变作用引入试验蛋白的内部核糖体连接位点不会造成完全融合的S10-X-S11，这样互补就
不会发生。因此，在人工定向进化方法中使用该系统能有效地筛选出这些异常的克隆。

[0099] 体内蛋白质检测分析

[0100] 相关的，体内具体实施方式中，细胞被设计用来表达两个(或所有)互补片段，其中的一个或两个片段被融合到试验蛋白。该片段可以被同时或顺序表达，这依赖试验的目
的是否是检测(和定量)总蛋白表达或仅仅可溶的和/或不可溶的部分。一般优选两个片
段的顺序表达；因为共同表达可能会掩饰不溶性试验蛋白(见上文)。试验蛋白与标签片
段的融合蛋白顺序表达(或添加)之后，紧接着是互补检测片段的表达，其提供时间让不溶
的试验蛋白与标签片断的融合蛋白聚集并防止互补。

[0101] 更明确地，举个例子，试验蛋白的编码序列融合到报告蛋白的自行互补片段的可溶性第一标签片段的读码框(5’-＞3’)内，然后放置于第一个独立诱导启动子的控制下。
自行互补片段的可溶性第二检测片段的编码序列放置于第二个独立诱导启动子的调控下。
这两个目的核酸结构可以合并到相同或不同的载体(如一个或两个质粒)，假如启动子保
持独立诱导，宿主细胞同载体一起被转移或转染。携带结构体的细胞最初在基本条件下进
行培养，从而能抑制这两个独立诱导启动子。然后细胞在一段充分可以表达融合蛋白的时
间内(如在大肠杆菌中，典型的大约0.5-3.5小时)被诱导表达试验蛋白与标签片段的融
合蛋白，之后一段“休止”期内(大肠杆菌中大约0.5-1.5小时)诱导试剂扩散出细胞(或
在哺乳动物细胞内，通过主动抑制启动子，如用反义多核苷酸来切断启动子)。然后细胞被
诱导表达检测片段，在大肠杆菌中典型的约0.5-4小时。一种对哺乳动物可选择的实施方
式是，在“休止”期之后或在主动抑制第一诱导启动子之后利用蛋白转染诱导检测片段蛋白
(见下文)。

[0102] 两个独立的可控制的启动子系统已被描述，且其在本技术领域是公知的。例如，Lutz和Bujard，1997，在大肠肝菌中通过lacR/O，TetR/O和AraC/11-12调控要素独立严格
的调控转录单元，核酸研究.25(6)：1203-1210)。

[0103] 在一个实施例中，启动子位于Laclq蛋白和树胶醛糖诱导物/阻抑物的抑制下的载体可以被用来表达检测片段(如从Clontech，Palo Alto，CA得到的pPROLAR载体)。通
过供给生长媒介以IPTG和树胶醛糖能减轻抑制，造成克隆检测片段的表达。在该系统中，
宿主大肠杆菌细胞的遗传背景提供了araC阻抑物。为了试验蛋白-标签融合蛋白结构的
可控表达，采用一个在它内部这种结构受四环素阻抑物蛋白的抑制的载体(如pPROTET载
体；Clontech)。在该系统中，通过供给脱水四环素到生长媒介从而减轻抑制，造成试验蛋
白-标签的融合蛋白构体的表达。tetR和Laclq阻抑物蛋白可以被提供给第三载体，或可
以结合于携带片段的载体(见下文实施例1)。

[0104] 将上述系统用于试验蛋白-标签融合蛋白和之后检测片段的顺序表达，将脱水四环素添加到同上述构体一起转变的细胞中，该添加取代了tet阻抑物，且试验蛋白-标签融
合蛋白的表达被诱导。然后细胞被转移到带有新鲜介质的新培养皿上，经过大约1小时使
脱水四环素扩散到媒介中，这之后tet阻抑物再次结合到启动子，关闭表达。然后，通过添
加IPTG，独立诱导的T7启动子被激活，诱导检测片段的表达。检测片段的表达经历了一段
充分的时间使其与可溶性第一片段-试验蛋白的融合蛋白自行互补。荧光检测(或颜色，
在此使用脱落生色蛋白系统)检测出可溶性试验蛋白-标签融合蛋白。见下文实施例4。

[0105] 体内溶解性检测对于高产量筛选是有责任的，作为表达试验蛋白变异体的大量细胞，其与标签片段融合，能通过在细胞内表达的检测片段或提供给细胞的检测片段的互补
产生的荧光来检测溶解性。细胞分选可以被用来分离那些显示可检测荧光的细胞，因此从
那些没有显示可检测荧光或仅显示微弱荧光的细胞中表达试验蛋白的可溶解变异体。

[0106] 体内溶解性检测优选的例子是个体片段被顺序表达，如表达试验蛋白-标签片段的融合蛋白和之后的报告蛋白自行互补片段的表达。顺序表达允许不溶性试验蛋白聚合，
从而使得该报告片段无法与其它报告片段互补。因此，通常为了本发明体内溶解性检测的
应用，试验蛋白-标签片段融合蛋白的表达应当先于自行互补片段的表达一段充分的时间
使不溶性融合蛋白聚集。在一些具体实施方式中(如使用哺乳动物细胞)，在融合蛋白被表
达后试验蛋白-标签片段融合蛋白的表达被关闭，然后自行互补片段的表达被激活。按照
这种方式，最精确的检测被实施。相反，两个报告片段-试验蛋白融合蛋白与自行互补片段
的共同表达可以折衷溶解性检测结果，因为其允许在表达后立刻出现其它不溶性试验蛋白
的短暂溶解性，因此允许自行互补。

[0107] 蛋白定量分析

[0108] 以上两个溶解性检测分析可以扩展到试验蛋白的定量，尤其是可溶解部分，不可溶解部分和总蛋白表达的定量。例如，在一个可溶解和不可溶解蛋白部分的体外定量分析
中，表达试验蛋白-标签片段融合蛋白(如x-GFP sll)的细胞被裂解，不可溶解的部分被
沉淀。然后，包含可溶解部分的上清液同互补检测片段(如在包含互补片段的一系列微型
滴定板孔中)混合，荧光被监控。可选择地，监测片段可以被添加到裂解产物，然后添加到
反应容器。荧光度与可溶解的蛋白数量是直接成比例的，可溶解的蛋白数量可以根据标准
刻度曲线(下文实施例6所述)决定。通过变性和再次折叠沉淀的蛋白以及通过将该准备
与互补检测片段结合，不可溶解的蛋白部分被定量。该方法换一种方式，总蛋白表达被测量
且与可溶解物的数量比较用来确定不可溶解的数量。在相关的实施方式中，通过展开的互
补片段的共同再次折叠，总蛋白数量(可溶解或不可溶解)可以在体外被定量。

[0109] 在一个相关的实施方式中，通过试验蛋白-标签片段融合蛋白和互补片段的共同表达，总蛋白数量(可溶解或不可溶解)可以在体内被测试。荧光度与总蛋白的数量是成
比例的。见下文实施例9。

[0110] 三明治形式的脱落荧光蛋白系统

[0111] 报告荧光和生色蛋白可以被剪接成三个(或更多)个体片段，该片段能自行互补而形成重组的报告蛋白。在一个三明治形式蛋白检测分析的实施方式中，荧光或生色蛋白
的两个标签片段被融合于试验蛋白，其和片段一起能与第三片段互补而重组荧光表型或生
色表型。例如，试验蛋白可以被插入在两个相邻的GFPβ链之间，如GFPS10-x-GFP S11。通
过与GFP1-9的可检测互补，可溶性蛋白检测被完成。在本实施方式中，三个片段的互补确
定试验蛋白是可溶解的，而且是全长，显示融合于X的GFP两个片段与X官能上连接。尤
其在人工定向进化方法的上下文中，该方法提供确保试验蛋白x实际上是全长并完整无缺
(反之，X-GFP S11仅互补GFP1-10，而非GFP1-9)的优势，并预防截短的试验蛋白，或具体
表现为内在核糖体结合位点的试验蛋白，或经蛋白质水解的试验蛋白的出现。

[0112] 相关的严格的可溶解性检测实施方式利用融合于一个试验蛋白的两个标签片段，其中通过功能性地与独立的可区别的第三互补检测片段重组，每个片段可以被独立地检
测。更明确的，例如，在GFPS10-x-GFP S11的融合蛋白中，通过环形突变体GFP11-9δ10(环
形突变体11-1-2-34-5-67-8-9，在这里11和1被连接在一起，10不见了，数字指链，见图
3)链10是可检测的，反之，通过1-10δ11(1-2-3-4-5-6-7-8-9-10，在这里11不见了)链
11是可检测的。利用在一个或两个互补对中GFP的色彩变化变异体(如GFP11-9δ10可
以是蓝绿色变异体(Y66W)，而GFP1-10δ11可以是黄色变异体(T203Y))，可以推动两个标
签独立地同时检测。可选择地，标签片段可以来自有独特氨基酸序列的荧光蛋白，且和适
当的相应检测片段一起被检测。例如，来自GFP的链11能被用来标签试验蛋白X的N末
端，也能和GFP的链1-10一起被检测，然而来自红色荧光蛋白DsRed(Matz et 1999，Nat.
iotechnol.17：969-973)的链11可以同时被使用作为相同试验蛋白X的C末端的融合蛋
白，且和DsRed的链1-10一同被检测。

[0113] 一个可选择的实施方式利用FRET，其在两个重组的与试验蛋白连接的GFP之间被显示。例如，CFP 11-9δ10::10-X-11::YFP1-10可以被利用。这样一种构体与CFP-x-YFP
在官能上是相同的，只要X是完整无缺的，预先显示从CFP原料物质到YFP接受体的FRET，
6
如果X是裂开的，则放松FRET，使CFP和YFP从接近的状态下自由，FRET的效率依赖(l/r)，
在这里r是原料物质和接受体之间的距离。

[0114] 原核和真核细胞培养基的应用

[0115] 本发明的脱落荧光和脱落生色蛋白系统可以应用在实质上的任何细胞类型，非限制地包括细菌细胞(如大肠杆菌)和哺乳动物细胞(如CHO细胞)。有一个限制是GFP和
GFP类似蛋白的表达必须在高酸性的环境下(如pH＝4.0或更小)。同样地，在pH为6.5
或更低的条件下，通常互补率是低效率的(见下文实施例8)。

[0116] 本领域技术人员欣赏的是，用于表达标签和/或检测片段的载体必须与寄居于载体的宿主细胞相兼容。同样的，多样的启动子系统是可获得的，且应选择和细胞类型、菌株
等相兼容的启动子系统。众所周知，密码子的最优化技术可以被用来适应那些在其它细胞
中使用的序列。

[0117] 当使用哺乳动物细胞作为本发明的互补检测时，对于密码子最优化的选择是利用化学转染试剂，如最近描述的“chariot”系统(Morris et 2001，转移生物活性蛋白到哺乳
TM
动物细胞的肽载体，自然生物19：1173-1176)。该chariot 试剂可以被用来直接转染蛋白
到哺乳动物细胞的细胞质。因此，这种方法对于体内蛋白检测分析是有用的，其中通过细胞
在表达遗传编码的试验蛋白-标签片段融合蛋白的之前或者之后，检测片段可以被引入细
胞。

[0118] 溶解性增强的蛋白变异体的分离方法

[0119] 上文描述的蛋白溶解性检测可以被用来与人工定向进化方法结合从而分离出相对于亲本没有进化过的蛋白而言增强了溶解性的蛋白变异体。

[0120] 本技术领域公知的一种产生突变蛋白变异体文库的方法可以被用来产生候选的试验蛋白，该蛋白可以作为标签片段的融合蛋白而被表达。通常通过突变核酸会使
目标蛋白或多肽被突变。在本技术领域突变的技术是公知的。这些技术包括易错PCR，
化学突变，暗盒突变，但不限于此。可选择的，宿主细胞的突变菌株可以被用来增加突
变频率(Greener和Callahan(1995)策略分子生物学7：32)。例如，易错性PCR(见上
文如Ausubel)使用低精确度的聚合条件在一个长序列的任意位置上随机引入低水平
的点突变。其它突变的方法包括，例如，重组(WO98/42727)；寡核苷酸定向的突变(见
Smith发表于遗传学研究年报19：423-462(1985)上的的评论；Botsteinand Shortie，
科学229：1193-1201(1985)；Carter，生物化学期刊237：1-7(1986)；Kunkel，“寡核苷酸
定向突变的效率”，在核酸和分子生物，Eckstein and Lilley，eds，Springer Verlag，
Berlin(1987)，酶学方法100：468-500(1983)，和酶学方法154：329-350(1987))；磷脂
酸化物修饰的DNA突变(Taylor等，核酸研究.13：8749-8764(1985)；Taylor等，核酸研
究.13：8765-8787(1985)；Nakamaye and Eckstein，核酸研究.14：9679-9698(1986)；
Sayers等，核酸研究.16：791-802(1988)；Sayers等，核酸研究.16：803-814(1988))，使
用含有尿嘧啶的模板的突变(Kunkel，Proc.Nat’l.Acad.Sci.USA 82：488-492(1985)和
Kunkel等，酶学方法154：367-382，1987)；使用有缺口的双DNA的突变(Kramer等，核酸
研究.12：9441-9456(1984)；Kramer and Fritz，酶学方法，154：350-367(1987)；Kramer
等，核酸研究.16：7207(1988))；Frita等，核酸研究.16：6987-6999(1988))。附加的方
法包括点错配修复(Kramer等，细胞38：879-887(1984))，使用修复不足宿主链的突变
(Carter等，核酸研究.13：4431-4443(1985)；Carter，酶学方法154：382-403(1987))，
删除突变(Eghtedarzadeh and Henikoff，核酸研究.14：5115(1986))，限制选择和限
制纯化(Wells等，Phil.Trans.R.Soc.Lond.A 317：415-423(1986))，通过总遗传合成
的突变(Nambiar等，自然科学223：1299-1301(1984)；Sakamar and Khorana，核酸研
究.14：6361-6372(1988)；Wells等，基因34：315-323(1985)；和Grundstrom等，核酸
研究.13：3305-3316(1985)。突变试剂盒在商业上是提供的(如Bio-Rad，Amersham
International)。更多最近的方法包括基于密码子的突变，在该方法中整个密码子被取代，
从而增加了产生的突变体的多样性，例如，在Murakami等2002在自然生物技术，20：76-81
杂志中描述的RID方法。

[0121] 在细菌表达系统中，利用上文描述的体内或体外检测，表达变异体的克隆根据溶解度被快速筛选。因此，在一个体内实施方式中，在大肠杆菌中产生克隆文库，在第一个独
立的可诱导启动子的控制下，每个克隆都隐藏了编码与标签片段相融合的单个变异体蛋白
的表达结构。在第二个分离的可诱导启动子或者检测片段多肽本身的控制下，细胞通常可
以隐藏编码互补检测片段的一个可表达构体(引自蛋白转染方法如上文所述的Morris等
2001)。

[0122] 在一个体内实施例中，细胞被诱导用来表达标签片段-蛋白变异体融合蛋白，从而表达细胞中互补片段。在大多数优选的实施方式中，融合蛋白的表达被抑制或关闭一段
时间足以使不溶性融合蛋白聚合(如1小时，见下文实施例4和实施例10)，之后互补片段
表达被诱导。在本方法的另一种变化方式中，细胞仅隐藏融合蛋白构体，优选在可诱导/可
抑制启动子的控制下，通过蛋白转染方法引入互补片段。

[0123] 不同的体外实验是可能的。一般，这些包含如在大肠杆菌内的突变蛋白-标签片段融合蛋白的表达，之后细胞裂解并且与互补检测片段多肽进行反应。

[0124] 蛋白纯化

[0125] 本发明的另一方面是利用脱落荧光和脱落生色蛋白系统纯化蛋白，该蛋白在上文的溶解性检测中被确定为可溶解的。简单地，标签片段被修饰包含一部分或氨基酸残余物，
其使标签被分配结合到底物上，利用标准的纯化技术可以进行分离。在一个实施方式中，标
签多肽利用公知且商业可用的化学(如，分子探针公司)被分配结合到玻璃珠上。可选择
的，如下文实施例13所述，标签片段被修饰并结合到组氨酸残基，从而分配该标签结合到
金属亲和树脂珠。在一个特殊的实施方式中，GFPS11片段被设计出来以使在β-链外围的
指示残余物被组氨酸残余物取代。该HIS-标签片段没有扰乱融合的试验蛋白，于是能够检
测与GFP1-10检测片段互补的可溶解蛋白(实施例13)。该HIS-标签片段可以被用来纯化
钴类滴柱中的蛋白，不仅能使可溶解和不可溶解的蛋白定量，且不需要其它纯化标签系统
就能纯化并洗提蛋白至95％的纯度。见下文实施例13-17。

[0126] 预先互补

[0127] 相对于那些生色团环化过程从未在其中发生过得片段，通过利用GFP片段内预先形成的带有相当生色氨基酸的生色团，能够使在GFP片段的互补过程中荧光形成的速率得
到巨增。简单的，一个非荧光的预先互补的带有生色氨基酸的GFP片段可以通过以下方式
形成：(1)将片段与不包含生色氨基酸的互补片段混合；(2)完成荧光的互补反应和形成；
(3)伸展片段，如通过化学方法产生展开的非荧光GFP片段；(4)恢复含有生色氨基酸的片
段且将其与其它片段分离；(5)使显示生色氨基酸的片段恢复原来属性。该片段实质上保
持非荧光性，即使其包含环化生色团，因为其实质上已经通过化学或其它方法被展开以至
于成为非荧光，当缺乏互补片段时，其仍保持展开的。在没有产生与生色团共价修饰的情况
下，仅仅通过再次增加互补、不包含生色团的GFP片段，可以获得荧光的快速恢复。通过这
种方法，由于缓慢的生色体环化反应是完全的，互补中荧光的形成仅受互补片段结合速度
及折叠β-管本身结构形成的限制。

[0128] 脱落蛋白片段设计

[0129] 分离可溶性自行互补片段的人工定向进化方法

[0130] 本发明的另一方面涉及通过人工定向进化方法和片段的连续诱导产生理想的脱落蛋白中间体的方法。连续诱导的结合与现有出版的方法相比，详细说明了脱落片段的联
合诱导。简单地，在连续诱导方法中，片段1不变，片段2进化。当片段1不变，片段2进化
时，片段2首先被表达，然后表达被关闭。片段被允许聚合或保持可溶解。接着，片段1被
表达。如果两个片段被同时表达，会导致假阳性，因为互补可以在聚合之前发生。连续表达
可以选择真阳性，如可溶解的变异体。在最适宜的片段2变异体选择之后，该变异体保持不
变，然后片段1进化。当利用进一步连续诱导时，这个过程可以被持续至得到想要的片段溶
解度。利用该方法，目标片段可以在互补前被设计成本身是可溶解的。

[0131] 削弱溶解度对可检测蛋白的干扰

[0132] 可溶解片段可以被进一步设计用来减小对融合过客区域(试验蛋白)的溶解性的干扰影响。简单的，一种当与片段融合时相对于单独表达时溶解度较低的试验蛋白在人
工定向进化方法中被用作为诱饵结构域，用来设计一种片段，这样融合蛋白与非融合蛋白
的溶解性是相似的，可以减轻该片段对试验蛋白溶解性的影响。该方法在最优化GFP的一
个短小片段中被使用，导致产生一种削弱融合过客蛋白干扰影响的变异体(见下文实施例
4)。

[0133] 试剂盒

[0134] 本发明的另一方面提供脱落荧光和脱落生色蛋白系统试剂盒，该试剂盒用于上文所述的各种检测中。本发明的试剂盒可以使本发明的脱落荧光和脱落生色系统的使用更方
便。实施本发明试验的各种材料和试剂可以被提供。试剂盒可以包括不受限制的试剂，多
肽或多核苷酸，细胞转换和转染试剂，纯化多肽的试剂和材料，恢复本身属性的蛋白和再次
折叠的试剂，还有在本发明的试验和其它方法中使用的其它溶液或缓冲液。试剂盒也可以
包括控制样品，用于校准本发明试验的材料，及容器、试管、微型滴定盘等类似物，其中检测
反应可以被操作。试剂盒可以在容器中被打包，其可以包含接受试剂盒内容的隔间，操作试
验的说明等。

[0135] 例如，试剂盒可以提供本发明的一个或更多的脱落荧光蛋白片段，编码一个或更多荧光蛋白片段的一个或更多多核苷酸载体，适宜繁殖载体的细菌细胞菌株，预先转换的
细胞或与编码一个或多个荧光蛋白片段的构体进行转染的细胞，及用于表达的融合蛋白的
纯化试剂。

[0136] 在试剂盒的一个实施方式中，其便于操作本发明的蛋白测试分析，该试剂盒包含一个易接受的核酸载体，该载体包含标签荧光或生色蛋白片段(如GFP S11)的编码序列，
其包括一个多样的克隆位点，该克隆位点用于插入读码框中试验蛋白到标签片段编码序列
的N末端。随意地，插入位点可以跟在读码框中连接多肽的编码序列与下游标签序列的编
码序列之后。一个特殊的实施方式是pTET-SpecR质粒，其设计在实施例1中被描述且在图
1中被说明。pTET-SpecR质粒的完整核苷酸序列如图1B中所示。

[0137] 该接受体，或“标签载体”被用来提供适用于宿主细胞的试验蛋白-标签融合蛋白。在体外检测实时方式中，该试剂盒还包含一个预先纯化的检测片段(如GFP1-10多肽)，
其用于检测被标签载体表达的试验蛋白-标签片段融合蛋白。在一个体内检测实施方式
中，试剂盒还包含一个“检测载体”，在独立调节启动子的控制下该“检测载体”与标签载体
兼容且编码检测片段。在体内检测的替换实施方式中，包含检测载体的细胞(如在可诱导
启动子的控制下编码GFP1-10的载体)与兼容的标签载体一起在试剂盒中被提供，在该标
签载体中试验蛋白可以被克隆，其中通过分离的可诱导启动子被控制表达。包含检测载体
的细胞可以与标签载体及被监控的细胞荧光一起被转换。

[0138] 校准本发明溶解性检测的材料可以被提供。在一个实施方式中，试剂盒包含纯化的亚硫酸还原酶GFP S11融合蛋白试剂。

[0139] 荧光和生色蛋白

[0140] 本发明提供用来设计脱落荧光和脱落生色蛋白系统的方法和原理，在这里以通过用于蛋白检测和定量的最佳脱落GFP系统的产生和分子进化为例。然而，其他GFP类似蛋
白可以被用于本发明的实施。

[0141] 荧光蛋白的基团包括从水母(Aequorea Victoria)(GFP)中分离的绿色荧光蛋白，还包括大量的GFP变异体，如青色荧光蛋白，蓝色荧光蛋白，黄色荧光蛋白等(Zimmer，
2002，化学革命.102：759-781；Zhang等2002，自然科学评论3：906-918)。典型地，这些变
异体共享大约80％，或者更多的与SEQ ID NO：2(或SEQ ID NO：8)一致的序列。这些有色
转移的GFP突变异种具有从蓝色到黄绿色的散发颜色、增加的亮度和耐光性(Tsien，1998，
生物化学评论年报67：509-544)。一个这样的GFP突变异种被称为增强的黄色荧光蛋白，
其显示散发的最大值达529nm。通过将色氨酸的非自然变异体合并入青色变异体，产生另一
个最近描述的突变异种，即一个黄金变异体，其具有574nm的红色转移散发最大值的特征
(Bae等.，2003，分子生物学期刊.328：1071-1081)。

[0142] 其它以GFP为基础的变异体具有改进的激发和散发光谱(Tsien等美国专利申请号U.S.Patent Appn.20020123113A1)，其增强了荧光强度和热容量(Thastrup等美
国专利申请号U.S.Patent Appn.20020107362A1；Bjorn等美国专利申请号U.S.Patent
Appn.20020177189A1)，且在减少氧含量的情况下生色团的形成(Fisher，美国专利申请号
U.S.Patent No.6,414,119)也已被描述。来自Anthozoans Renillareniformis和Renilla
kollikeri的GFP也已被描述(Ward等美国专利申请号U.S.Patent Appn.20030013849)。

[0143] 此外，超过100个GFP类似荧光蛋白和来自珊瑚类的非荧光生色蛋白现在已被识别(作为参考，见Verkusha等，2003，GFP类似荧光蛋白和珊瑚类的生色蛋白，在蛋白结构：
结构性质和功能的万花筒，pp.405-439，Ed.V.Uversky.Research SignpostPress，India)。
珊瑚蛋白基团包括与Discosoma珊瑚类分离的红色荧光蛋白，DsRed(Matz et 1999，Nat.
Biotechnol.17：969-973)，及不同的DsRed变异体(如DsRedl，DsRed2)。DsRed和其它珊
瑚荧光蛋白仅分享大约26-30％的氨基酸序列，其与来自水母的野生型GFP一致，然而所有
重要的模体被保藏，显示GFP的β11链管式结构特性的形成。DsRed的晶体结构已被解答，
并显示GFP MMDB Id：5742的β11链管式结构的保藏。

[0144] 大量更长波长的红色荧光蛋白DsRed的突变异种已被描述。例如，最近被描述的进一步转移到红色荧光蛋白的具有散发光谱的DsRed突变异种可以在本发明的实施中
被使用(Wiehler等，2001，FEBS Letters 487：384-389；Terskikh等，2000，Science290：
1585-1588；Baird等.，2000，Proc.Natl.Acad.Sci.USA 97：11984-11989)。最近一个
DsRed的单节显性变异体被描述(Campell et al.，2002，Proc.Natl.Acad.Sci USA 99：
7877-7882)。该变异体被称为“mRFPl”，其很快成熟(野生型的DsRed与之相比需要超过
30小时时间成熟)，没有残留的绿色荧光，有比其它DsRed变异体长大约25nm的激发和散
发波长。

[0145] 来自大量海洋生命形态的日益增加的大量其它荧光蛋白最近被描述，目前蛋白数据库列出大量GFP和GFP突变晶体结构，还有不同的GFP类似物晶体结构。推断与来自珊
瑚、海鳃、海鞘和海葵的GFP结构相似的相关荧光蛋白已被描述，其可以用于产生本发明脱
落荧光蛋白系统(作为参考，见Zimmer，2002，Chem.Rev.102：759-781；Zhang等，2002，自
然评论3：906-918).

[0146] 此外，来自Anemonia majano，Zoanthus sp.，Discosoma striata，Discosomasp.和Clavularia sp.的荧光蛋白也已被报道(Matz等，见上文)。克隆自石头珊瑚
种类的荧光蛋白，Trachyphyllia geoffroyi，已被报道散发绿色、黄色和红色光，暴
露于UV光上从绿色光转变到红色光散发(Ando et al.，2002，Proc.Natl.Acad.Sci.
USA 99：12651-12656)。近来描述的来自海葵的荧光蛋白包括绿色和桔红色荧光蛋白，
其克隆自Anemonia sulcata(Wiedenmann et al.，2000，Proc.Natl.Acad.Sci.USA97：
14091-14096)，一个自然增强的绿色荧光蛋白克隆自Heteractis magnifica的触角
(Hongbin et al.，2003，生化研究.Commun.301：879-885)，一个普通的非荧光紫色生色
蛋白显示微弱的红色荧光，其克隆自Anemonia sulcata，及一个显示远红外转移散发光谱
(595nm)的突变异种(Lukyanov et al.，2000，J.Chem.275：25879-25882)。

[0147] 最近被描述的与海葵Entacmaea quadricolor，EqFP611分离的红色荧光蛋白是一个具有单一共平面及贯穿生色团的远红外高荧光蛋白(Wiedenmann等，2002，Proc.
Natl.Acad.Sci USA 99：11646-11651)。EqFP611的晶体结构已被解答，显示GFP MMDBId：
5742的β11链管式结构的保藏(Petersen et al.，2003，生物化学杂志，August8，2003；
M307896200)。

[0148] 还有更多类型的具有生色和荧光特性的GFP类似蛋白已被描述。这样一个源自珊瑚的蛋白基团，pocilloporins，显示宽范围的光谱和荧光特性(Dove and
Hoegh-Guldberg，1999，PCT申请WO00/46233；Dove等，2001，Coral Reefs 19：197-204)。
最近，来自暗礁建筑珊瑚Montipora efflorescens的pocilloporin Rtms5的纯化和结晶
化已被描述(Beddoe et 2003，Acta Cryst.D59：597-599)。Rtms5是深蓝色的，还是弱荧光
的。然而，据报道Rtms5和Rtms5同族序列的其它生色蛋白，经过单一氨基酸置换能被互换
成远红外荧光蛋白(Beddoe等，2003，见上文；Bulina等.，2002，BMC生化.3：7；Lukyanov
等.，2000，见上文)。

[0149] 与pocilloporins密切相关的各种其它源自珊瑚的生色蛋白也是已知的(见例如，Lukyanov等2000，生物化学杂志.275：25879-82；Gurskaya等，2001，FEBS Letters507：
16-20)。到此程度，这些生色蛋白包含被保藏的GFP和其它荧光蛋白的β11链管式结构，
它们可以被剪接到自行互补片段，且能被使用在此所述的检测系统中。

[0150] 具有来自MMDB Id：5742的β11链管式结构少于5埃，通常少于3或4埃，优先少于2埃的根中间正方形偏离结构的任何荧光蛋白可以在自行互补片段的生长中使用。有
些时候，荧光蛋白以多聚的形式存在。例如，DsRed是四聚的(Cotlet et al.，2001，Proc.
Natl.Acad.Sci.USA 98：14398014403)。值得本领域技术人员欣赏的是，该多聚荧光蛋白与
GFP(一个单体)之间的结构偏离在荧光蛋白结构的单节显性单位的基础上被估计。

[0151] 本领域的普通技术人员欣赏的是，使用本领域公知的对比方法，这样一个适合的荧光蛋白或生色蛋白结构可以被识别。在识别该蛋白中，在MMDB Id：5742结构的线性化
和对比的关键特性是β-管式结构的保藏(如，典型的包括β11链，但至少在一种情况下，
更少的β链(见上文Wiedenmann et al.，2000)和第二结构元素的布局或连接顺序(见
如Ormo等“水母绿色荧光蛋白的晶体结构”Yang等，1996，科学273：5280，1392-5；Yang等
1996自然生物.10：1246-51)。典型地，在荧光蛋白和GFP结构之间的多数偏离，其长度为
关键β链之间的连接链或接头(如见，DsRed和GFP的对比，Yarbrough等.，2001，.Proc
Acad Sci USA 98：462-7)。在Yarbrough等，DsRed和GFP的线性化如图显示。从该立体
图中明显看出β11链管严格被保藏在两个结构之间。尽管与DsRed和GFP相比，序列一致
率只有23％，C-α脊椎被线性化在1埃RMSD内超过169个氨基酸。

[0152] 在对比结构中，使用本技术领域熟知的运算法则，如使用CCP4程序组，合作计算方案，第4.1994。“CCP4组：蛋白结晶学程序”，Acta Cryst.D50，760-763，两个被比较的结
构被线性化。在使用该程序中，用户输入被线性化的两个结构的PDB坐标文件，该程序产生
输出线性化结构的原子坐标，其使用严格的身体转化(旋转和平移)来使位于该两个结构
中原子的全部不同点最小化。输出的每一个结构的线性化坐标可以被分别显现，或作为一
个重叠，其通过可用的分子制图程序如RASMOL，Sayle和Milner-White，1995年9月，生物
化学科学趋势(TIBS)，卷20，No.9，p.374)或者Swiss PDB阅读器Guex，N and Peitsch，
M.C.，1996 Swiss-Pdb阅读器：一个针对微机和PC机蛋白数据库的快速且易使用的PDB阅
读器季刊时事通讯77，pp.7。

[0153] 考虑到RMSD，RMSD的价值衡量与结构线性化是同一程度的，且当使用RMSD作为全部结构相似点的描述符，其大小要被考虑。通过包括氨基酸块缩放比例的RMSD版本典型地
被处理，该氨基酸在一定的限度内被线性化。满足特定标准的线性化序列的完整块越长，结
构就线性化得越好。在DsRed例子中，c-α碳的164能被线性化在GFP的1埃中。典型地，
本领域技术人员会选择一个程序，该程序可以线性化两个基于严格身体转化的试验结构，
例如，Dali等分子生物杂志1993，233，123-138.中所述。运算法则的输出是序列块，通过
使用严格身体转化，其在两个结构之间可以有层次。具有Z刻痕的区域在Z＝2或在Z＝
2之上被相似报道。对于每个这样的块，全部RMSD被报道。

[0154] 本发明使用的荧光蛋白或生色蛋白的RMSD在5埃内，至少80％的序列在β11链内。优选的，RMSD在2埃内，至少90％的序列在β11链内(通过如图所示重叠的两个线性
化结构的视觉检查及与通过DALI程序输出报道的线性化块的对比，β链被确定)。作为本
技术领域人员欣赏的，在β链之间的接头可以相当地变化，且不需要结构之间的重叠。

[0155] 在优选实施方式中，荧光蛋白或生色蛋白是蛋白的变异版本，或与该蛋白相比改进其折叠或溶解特性的蛋白变异体。通常这种蛋白能被识别，例如通过使用WO0123602中
描述的方法和其它方法来选择增加的折叠。

[0156] 例如，为了获得具有增加折叠特性的荧光蛋白，减少荧光蛋白折叠产量的一个“诱饵”或“过客”肽被连接到荧光蛋白。该过客肽可以是当被插入时减少荧光蛋白折叠产量的
任何肽。变异荧光蛋白文库被创造。该诱饵肽被插入荧光蛋白且蛋白的荧光程度被检测。
那些克隆显示相对包含诱饵肽的融合蛋白而增加的荧光，且母荧光蛋白被选择(荧光强度
反映适当折叠的荧光蛋白的数量)。该过客肽可以在末端被连接到荧光蛋白，或可以在中间
位置被插入。

[0157] 在一个特殊的实施方式中，用于本发明实施的野生型和变异荧光蛋白及生色蛋白可以在实验上被改进而产生非常稳定的“重叠”变异体。结合2003年4月24日申请的共
同未决、共有的美国专利申请10/423,688描述的方法的全部作为参考，该方法可以被使用
到GFP、DsRed和其它相关荧光蛋白及生色蛋白的人工定向进化中。这种重叠的变异体可以
被剪接到自行互补片段中，该片段可以进一步被改进用来单独调节片段的溶解特性或当其
融合于试验蛋白时进行调节。

[0158] 改进脱落荧光或生色蛋白片段的可溶解和非干扰(对试验蛋白溶解性)变异体的特殊方法在上文中副标题脱落蛋白片段设计下面被提出。

[0159] 实施例

[0160] 发明的各种不同方面将会进一步描述，并且通过下面几个具体实施例的方式进行阐述，但不是为了对发明范围进行限制。

[0161] 实施例1：构建质粒pTET-SpecR

[0162] 商业用tet-启动子PRO细菌表达系统(Clontech，Palo Alto，CA)利用从表达质粒中分离出来的第二次质粒上得到调控蛋白tetR，使得创建巨型质粒库的效率很低。为了
克服这个缺陷，我们将控制目标蛋白表达的tet启动子和tetR调控蛋白重组于含有四坏素
诱导启动子的tet的单个质粒上，tet启动子调控蛋白tetR，以及选择性抗生素标记SpecR，
所述抗生素标记对奇放线菌素这种抗生素有抗性。复制起点ColEl允许所述重组质粒在带
有像p15起点这样的兼容性起点的质粒在细胞内共存。这样某种标记有GFP片段的蛋白就
可以在pTET质粒中表达，而另外一种GFP检测片段的结构互补物蛋白，则可以在另外一种
像pET载体(Novagen，Madison，WI)这样的质粒中表达。pTET-SpecR质粒如图1A所示，所
述质粒的序列以及遗传单位如图1B所示。

[0163] pTET-SpecR质粒通过重叠PCR得到，从商业化pPROTet.6xHN载体，pPROLAR载体，以及BL21-PR菌株(Clontech，Palo Alto，CA)自带的能够自我复制的质粒上重组元
件。氯霉素抗性基因用从BL21-PRO菌株自带的能够自我复制的质粒上克隆得到的奇放线
菌素抗性标记替代，并且置于pPROLAR载体的卡那霉素抗性标记的启动子的控制之下。我
们利用分离自BL21-PRO菌株的奇放线菌素抗性的能够自我复制的质粒，克隆了位于TO转
录终止密码子序列上游的四环素抑制(tetR)蛋白。tetR的翻译量由位于SacI下游的弱
shine-Delgarno序列调节，通过从小型简并性文库中选择一个shine-Delgarno突变子使
得添加脱水四环素(如下所述)之后减少漏检并且得到最大化的诱导。商业化pTET-SpecR
质粒上的Spel限制性位点被压制。新质粒“pTET-SpecR”用Ncol和Xbal限制性内切酶
(New England Biolabs，Beverly，MA)进行酶切，来接收GFP S11脱落GFP克隆盒。最终的
克隆位点结构是Nco-1::6HIS::凝血酶分裂位点::Nde-1::frame shift stuffer::BamHI：
(GGGS)：Spel::GFP S11(TAAStop)::Kpnl。克隆片段的有义链两边连接Ncol和Kpnl：

[0164] NcoI NdeI

[0165] CCATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCATATG

[0166] BamHI SpeI KpnI

[0167] GGTGGCGGTTCTGGATCCGGAGGCACTAGTGGTGGCGGCTCAGGTACC[SEQ ID NO：23]

[0168] 一段读码框移码(frame shift stuffer)完美地加入到Ndel和BamHI限制性位点之间，从而避免了基于重组载体而产生的背景表达。

[0169] 读码框移码实施例1：FS0

[0170] 序列CATATGTGTTAACTGAGTAGGATCCG[SEQ ID NO：24]

[0171] 读码框1 H M C * L S R I

[0172] 读码框2 I C V N * V G S

[0173] 读码框3 Y V L T E * D P

[0174] 读码框移码实施例2：FS1

[0175] 序列：CATATGTAATTAATTAATTGGATCCG [SEQ ID NO：25]

[0176] 读码框1 H M * L I N W I

[0177] 读码框2 I C N * L I G S

[0178] 读码框3 Y V I N * L D P

[0179] C末端脱落蛋白片段，例如GFP链11或者GFP链10-11，是通过特异性低聚核苷酸引物提供的Spel和Kpnl两侧的限制性位点以及目标编码序列克隆自限制性位点Spel和
Kpnl之间的片段。同样片段也可以通过特异性低聚核苷酸引物和PCR扩增包含有限制性位
点的模板DNA得到，这是行业内的公知技术。业内人士同样清楚完整的Ncol/Kpnl盒可以
通过对目标载体进行设计合适的限制性位点，从而转移到如pET载体等其他表达载体或系
统中。

[0180] TetR基因由BL21(DE3)PRO细胞(Clontech，Palo Alto，CA)中分离出的质粒上克隆得到。通过利用tetR基因序列的5’和3’端特异性引物扩增完整的基因。上游引
物包含一个SacI限制性位点以及之后的tet启动子调控下的优化抑制/诱导重组蛋白
Shine-Delgamo序列(本实施例，及如下所述)。下游引物包含一个与PROTet质粒的T0转
TM
录终止子序列同原的区域。PCR产物与T0终止子扩增物装配起来，重产物通过PROTet 6xHN
载体(Clontech，Palo Alto，CA)的Sacl/Spel限制性位点克隆得到，之前利用公知技术通
过PCR介导位点指向性突变反应静止了共同限制位点从而进行修改。奇放线菌素抗性基因
利用基因特异性引物从BL21DE3PRO的质粒上扩增：

[0181] P1：CAGGATGAGGATCGTTTCGCATGGTAACGGCGCAGTGGCG，[SEQ ID NO：26]

[0182] P2：CGCCACTGCGCCGTTACCATGCGAAACGATCCTCATCCTG，[SEQ ID NO：27]

[0183] P3：GCATTATTTGCCGACTACCTTGGTGATCTCGCC，[SEQ ID NO：28]

[0184] P4：ACCCCAGAGTCCCGCATTATTTGCCGACTACCTT，[SEQ IDNO：29].

[0185] P1和P2引物包含pPROLar载体(Clontech，Palo Alto，CA)的卡那霉素启动子序列，P3和P4引物包含卡那霉素位点末端到SacI之间的连接序列。完整的盒通过AatII/
SacI限制性位点插入到新的pTET-SpecR质粒内。插入序列vl：CATATGGGTGGCGGTTCT

[0186] GGATCCGGAGGCACTAGTGGTGGCGGCTCAGGTACCTAACTCGAG[SEQ ID NO：

[0187] 30] 和 v2：CATATGGGTGGCACTAGTGGTGGCGGCTCAGGTACCTAACTCGAG[SEQID NO：31]来自于重叠引物，并且通过NcoI和Xbal位点克隆到pTET-SpecR质粒上，从而产生
pTET-SpecR vl和pTET-SpecR v2质粒。调控tetR蛋白翻译的Shing-Delgarno序列通过
突变和选择进行优化。简单来说，折叠报告子GFP基因克隆到插入序列vlpTET-SpecR质粒
的Ndel-BamHI之间再转化到DH10B菌株。tetR基因利用简并引物进行扩增，所述简并引
物是针对Shine-Delgarno序列的4个核苷酸设计的，并且盒克隆到包含有pTET-SpecR接
受载体的GFP的SacI/Spel之间。最终文库转化到BL21DE3菌株。优化突变子通过计算
诱导率(诱导后的GFP荧光细胞除以诱导前的GFP荧光细胞)进行筛选，并且选择在添加
0.25μg/ml脱水四环素(anhydrotetracycline，AnTET)(表1)后有最大突变率的突变子。
优化的tetR序列的Shine-Delgatno序列显示出最大的诱导率是：AATAAA CATTAATG[SEQ
ID NO：32]。

[0188] 表1：

[0189] 表达于优化pTET-SpecR载体和PROTetCmR商业载体中的GFP全细胞荧光

[0190]a

[0191] 诱导前荧光。b

[0192] 3小时37℃诱导于250ng/ml脱水四环素后的荧光。

[0193] 实施例2：寻找可行的脱落GFP对

[0194] 为了实现脱落GFP蛋白的标签作用和如图2所示的监测作用，我们首先测试了几对片段，分别来自折叠报告GFP和异常稳定的“超级折叠”GFP，折叠报告GFP上面有突变
F99S，M153T，V163A(Crameri，Whitehorn et al.1996)，F64L，和S65T(Patterson，Knobel
et al.1997)，“超级折叠”GFP包含折叠报告GFP的突变以及S30R，Y39N，N105T，Y145F，
I171V以及A206V。我们分别在兼容性大肠杆菌质粒上共表达了几对GFP片段，包括氨基
酸1-145+145-238，1-155+156-238，1-171+171-238，1-195+196-238，1-214+214-238。连接
点适应β-链之间的环卡和转角(Tsien 1998；Baird，Zacharias et al.1999)(如图3所
示)。从超级折叠GFP得到的片段对呈现出比从折叠报告GFP得到的片段对更亮的菌落。
例如，超级折叠GFP在156和172断裂点处的片段要比来自于折叠报告GFP的片段亮(如
图4所示)。我们的目标是要最小化片段的尺寸以满足作为一个蛋白标签的作用，所以我
们选择了最小片段(1-214+214-238)。为了进一步减小标签结构域的尺寸，我们也检测了
1-214(GFP1-10)来与214-230(GFP S11)互补，从小片段中除掉杂乱的残基231-238(Tsien
1998)。表2所示为GFP S11结构的序列包含野生型以及人工突变子。

[0195] 表2

[0196] GFP S11变异体序列

[0197]

[0198] a通过直接进化得到的点突变用粗体表示。序列在GFP230位氨基酸处停止，添加的C末端GT氨基酸模体用Kpnl位点编码。

[0199] b相应于全长GFP位置的计数。

[0200] cC末端GT氨基酸模体来自Kpnl位点，后接TAA终止密码子。

[0201] d序列终止于GFP的228位氨基酸，后接来自于Kpnl位点的GT。

[0202] e序列开始于GFP的215位氨基酸。230位之后为终止密码子。

[0203] 从带有兼容性起始位点(Novagen，Madison，WI)的pET载体中共表达的超级折叠GFP片段1-214(GFP1-10)和214-230(GFPS11野生型)表达生长出了有荧光的大肠杆菌菌
落(如图5所示)。没有监测到与相应的折叠报告GFP片段(如图5所示)发生的互补。
超级折叠GFP1-10是不溶性的，但是当再次折叠包含体(实施例9，下述)与C端标记有野
生型GFP S11野生型的耐超高温热棒菌(Pyrobaculumaerophilum)(Fitz-Gibbon，Choi et
al.1997)来源的可溶性亚硫酸还原酶一同培养之后可以得到亚硫酸还原酶-GFPS11野生
型融合蛋白，可以产生时间依赖性的荧光增长(图5，曲线图)。

[0204] 实施例3：设计GFP检测片段GFP1-10

[0205] 我们通过DNA改组技术(Stemmer 1994)改进了超级折叠GFP1-10，增强了它的溶解能力以及与亚硫酸还原酶-GFP 11的互补能力。超级折叠GFP1-10的PCR扩增物参照
已经出版了的实验步骤(Stemmer 1994)进行DNA断裂和改组。GFP1-10cDNA文库质粒转
染到pPROTET载体(Clontech，Palo Alto，CA)上的含有亚硫酸还原酶-GFPS11野生型标
签蛋白的大肠杆菌BL21(DE3)PRO表达菌株(Clontech，Palo Alto，CA)上。通过2次连续
添加1.0OD600nm冷冻的保存于20％甘油/LB原液的400倍稀释液，使表达文库质粒附着在
硝基纤维膜上。经37℃过夜培养后，把硝基纤维膜转移到含有50μg/ml卡那霉素，35μg/
ml氯霉素，和50μg/ml奇放线菌素介质的LB/琼脂培养皿上，加入1mM IPTG 37℃3小时，
然后转移到新的培养皿内，同样，培养皿内含有上述同样的抗生素和600ng/ml脱水四环素
(AnTET)。挑出最快出现荧光反应的菌落，冷冻于-80℃的20％甘油冰冻体系中。使这些菌
落生长并用1mM IPTG诱导，利用过量的纯化亚硫酸还原酶-GFP S11野生型融合蛋白进行
体外互补效率检测(实施例9)，筛选可溶性溶解产物。最佳的候选菌落被集中起来，准备
进行另一轮的进化。通过荧光染色终止子DNA测序确定突变。3轮DNA改组并选择最亮的
克隆之后，在体外进行最佳突变体的可溶性溶解产物互补，称之为GFP1-10OPT，相比于同样
量的再次折叠超级折叠GFP1-10改进了80倍。除了折叠报告GFP的突变体(如上所述)，
来自于超级折叠GFP的GFP1-10OPT包括S30R，Y145F，I171V，A206V，以及7个新的突变体
N39I，T105K，E111V，I 128T，K166T，I167V，S205T，37℃在大肠杆菌种约50％可溶性表达。
10mg/ml非荧光GFP1-10OPT溶液的可视紫外线光谱缺少红色移位(red-shift)GFP(Tsien
1998)的480nm吸收条带，表明添加的GFP 11激发了产生环化发色团(Tsien 1998)所需的
折叠步骤。纯化的GFP1-10OPT，超级折叠GFP，以及折叠报告GFP通过10mg/ml分析凝胶过
滤进行研究。GFP1-10OPT洗脱出60％二聚体，35％单体，以及5％多聚体，而全长折叠报告
子GFP和超级折叠GFP均洗脱出多于95％的单体，和少量二聚体和多聚体。

[0206] 实施例4：设计GFPS11

[0207] C末端野生型GFP S11融合标签极大的减少了多种耐超高温热棒菌(Pyrobaculumaerophilum，Fitz-Gibbon，Choi et al.1997)试验蛋白(表3)。3-己酮
糖6-磷酸盐合酶(3-hexulose 6-phosphate synthase，HPS)单独的溶解度是60％，当和
野生型GFP 11(图6，表3)融合时就不可溶。蛋白质的溶解性用之前提到过的SDS-PAGE
和凝胶分析检测(Waldo，Standish et al.1999；Waldo 2003)。简单来讲，对高输出筛选
而言，1ml培养细胞菌液离心沉淀，加入110μl含有100mM TRIS，PH 7.5，150mM NaCl，和
10％v：v甘油的缓冲液(TNG缓冲液)再次悬浊。同时，3ml培养细胞菌液离心沉淀，加入
300μl TNG缓冲液再次悬浊。超声波破壁之后离心就得到可溶性沉淀部分。这些沉淀部
分用等体积TNG再次悬浊。15μl可溶性沉淀部分与15μ1含有100mMTRIS，200mM二硫苏
糖醇(dithiothreitol，DTT)，4％SDS，0.2％溴酚蓝(bromophenol blue)，和20％甘油的
2xSDS变性缓冲液混合100℃加热15分钟。变性样品用4-20％梯度标准SDS-PAGE(Biorad，
Hercules，CA)进行分离。蛋白样品使用凝胶编码蓝色染色试剂(Gel Code Blue stain
reagent，Pierce，Rockford，IL)进行染色和使用GS-800校准显像密度计(Calibrated
Densitometer，Biorad，Hercules，CA)成像。标准扫描仪提供蛋白质点完整的光学密度D。
总表达蛋白含量通过将溶解性蛋白点光学密度(Ds)和沉淀部分(Dp)相加得到，溶解度定
义为S＝Ds/(Ds+Dp)。我们将HPS作为人工定向进化方法的“诱饵”来寻找大肠杆菌内那些
HPS-GFP S11融合溶解度与HPS不融合溶解度相匹配的GFP S11突变体。

[0208] 表3

[0209] GFP S11标签对来自耐超高温热棒菌的18个试验蛋白溶解度的影响c沉淀部分溶解性

[0210]# a蛋白质 bMW dNF eWT fM1 fM2 fM3
指向DNA的RNA聚合酶(DNA-directed RNA
1 12.5 0.05 0.00 0.00 0.35 0.10
polymerase)
2 亚硫酸还原酶(Sulfite reductase) 12.7 1.00 1.00 1.00 1.00 1.00

[0211]5 5 5 0 0 0 0 5
6.0 4.0 7.0 0.0 1.0 0.0 6.0 5.0

68. 07. 08. 00. 51. 00. 58. 07.
0 0 0 0 0 0 0 0
95. 08. 57. 00. 00. 00. 03. 04.
0 0 0 0 0 0 0 0
82 03 05 00 00 00 00 50
.0 .0 .0 .0 .0 .0 .0 .0
77.0 04.0 07.0 00.0 00.0 00.0 56.0 53.0

4. 4. 4. 0. 6. 8. 1. 8.
41 51 61 12 12 32 32 62
epyt-c(子因物生素色胞细型类-c )rotcaf sisenegoib emorhcotyc noitaitini noitalsnarT(子因始起译翻 )rotcaf )p9S nietorp lamosobiR(p9S白蛋体糖核 esatcuder ediflusyloP(组酶原还硫多 )tinubus etahpsohpid edisoelcuN(酶激酸硫二苷核 )esanik 组β酶水脱盐酸石酒 )tinubus-βesatardyhed etartraT( 酶成合盐酸磷-6糖酮己-3 )esahtnys etahpsohp-6 esoluxeh-3( Epyh白蛋成形酶化氢 )Epyh nietorp noitamrof esanegordyH(
3 4 5 6 7 8 9 01
5 0 5 5 0 0 0 0
0.0 7.0 9.0 4.0 0.0 0.0 9.0 0.0

50. 56. 09. 56. 50. 50. 59. 01.
0 0 0 0 0 0 0 0
00. 53. 09. 04. 00. 00. 58. 00.
0 0 0 0 0 0 0 0
00 00 07 51 00 00 03 00
.0 .0 .0 .0 .0 .0 .0 .0
00.0 07.0 59.0 07.0 00.0 00.0 08.0 50.0
3. 3. 0. 7. 3. 4. 4. 7.
92 92 63 63 73 73 73 14
)esarefsnartlyhteM(酶基甲转 )esatum etamsirohC(酶位变岩合混 ANR-t enisoryT(酶成合ANR-t酸氨酪 )esatehtnys )nietorp Drin(白蛋Drin )esanegordyh elbuloS(酶化氢性溶可酶氢脱醛半酸氨冬门天 edyhedlaimes-etatrapsA( )esanegordyhed )esalcyc etahpsohP(酶化环酸磷酶化酸磷苷核呤嘌 )esalyrohpsohp edisoelcun-eniruP(
11 21 31 41 51 61 71 81
a

[0212] 18种来自极端嗜盐的古细菌群的耐超高温热棒菌(Fitz-Gibbon，Choi等1997)b
的蛋白，表达于37℃大肠杆菌BL21(DE3)。从氨基酸序列计算得到的理论上的分子重量
c
kD。SDS-PAGE密度计量决定的片段溶解性。相对不确定度是约5％，各三个重复取平均值。
d e f
不融合(non-fusion，NF)溶解度。C末端与野生型GFP S11(WT)融合。C末端与GFP S11
优化物融合(M1，M2，M3)。

[0213] HPS-GFP 11变异体和GFP1-10OPT的文库分别通过pTET-SpecR载体(实施例1，上述)和pET 28载体顺序表达。顺序诱导试验过程利用可独立诱导的兼容性质粒，从而
避免了共翻译折叠以及不溶性变异体HPS-GFPS11与GFP1-10OPT互补时的假阳性。己酮
糖磷酸合酶-GFP11(HPS-GFPS11)融合体用PCR进行扩增，并且用公知技术改组(Stemmer
1994)。GFPS11突变体文库表达成C末端与带有N末端6-HIS标签的诱饵蛋白HPS融合，表
达载体是带有AnTET-诱导性tet启动子的pTET质粒(Lutz和Bujard 1997)(如图1和实
施例1所示，如上所述)，并且质粒转染入在包含有p15复制起点经过修改的pET载体的表
达GFP1-10OPT的BL21(DE3)菌株里。最优物通过下述连续诱导试验步骤进行筛选。37℃过
夜培养后，带有菌落的硝基纤维膜转移到选择性LB/琼脂鲍尔培养皿上，所述培养皿含有
300ng/ml AnTet，在37℃培养3小时，表达HPS-GFP S11文库，转移到干净的“静止”培养皿
内1小时让AnTet从菌落中弥漫开来切断HPS-GFP S11的表达，最终转移到包含lmM IPTG
的LB/琼脂培养皿内2小时从pET质粒中诱导表达互补的GFP1-10OPT。由于HPS-GFP S11野
生型结构完全是不溶性的，按照连续表达试验步骤表达HPS-GFP S11野生型和GFP1-10OPT
的菌落仅仅呈现微弱的荧光。较亮的菌落，与溶解性较好的HPS-GFP11优选物有关，他们被
挑选出来放到带有选择性液体培养液的96孔组织培养皿上，-80℃保存于20％甘油冻存液
内。菌落在1ml液体培养液内生长并用300ng/ml AnTET诱导。可溶性部分筛选出来在体
外与过量的纯化的GFP1-10OPT进行互补效率测试(如下所述，实施例9)。互补速率最快
的菌落被挑选出来并收集等待下一轮进化与筛选。两轮进化之后得到2个不同的GFP S11
突变体，L221H和T225N。我们先研究L221H变异体，命名为GFP 11M1。这个突变体在体内
可以与GFP1-10OPT有效的互补，并且与HPS GFPS11野生型相比溶解能力也得到提高，但是
不能完全除去GFP S11在融合蛋白溶解能力方面的有害效果(如图6和表3所示)。GFP
11M2是结合F223S和T225N(表3，如上所述)而得到的，F223S能够惊人地增加不同脱落
GFP片段的溶解性(实施例11，如下所述)。HPS-GFP 11M2的溶解性相比于HPS-GFP11M1
或者HPS-GFP 11野生型都得到了极大改进(图6，表3)。HPS-GFP 11M2与GFP1-10OPT的
互补速率相对于HPS-GFP 11M1与同样量的可溶性融合蛋白减少了约5倍(图7)。我们从
GFP S11M2中移去了K214，K214是GFP1-10OPT的C末端残留物的复制体，并且在热点位点
223利用一套简并引物筛选得到64倍的简并文库，(公知技术)，并且克隆得到C末端与HPS
融合的GFP 11M2结果变异体从而寻找更稳定的突变体。约200克隆的可溶性部分在体外
与GFP1-10OPT进行筛选(如实施例9所示)。最佳的GFP S11结构(L221H，F223Y，T225N)
(命名为GFP S11M3，氨基酸序列RDHMVLHEYVNAAGIT[SEQ IDNO：16]，表2，如上所述)用一
个合适的互补平衡了融合蛋白溶解度(图6，表2如上所述)的减少的波动(图7)。我们
同样尝试了根据上述实施例3的进行人工定向进化方法来改进GFP 1-10OPT的互补，这种
方法利用了GFP S11M2标签作为互补目标物。由此产生了变异体命名为GFP1-10A4，它与
GFP S11M2互补的速率是GFP1-10OPT的约5倍。GFP1-10A4包含超级折叠突变体以及附加
突变体R80Q，S99Y，T105N，E111V，I128T，K166T，E172V，以及S205T。A4变异体在大肠杆菌
中主要表达成包涵体的形式并且相比于GFP1-10OPT，A4在体内测试中不太有用。然而，突
变体A4在体外测试中很有用，因为它通过用干净的TNG缓冲液稀释用尿素溶解的沉淀可以
很容易的由包涵体再次折叠，并且互补GFP S11M2或者GFP S11M3是GFP1-10OPT的约4倍
速率。

[0214] 实施例5：利用可溶性与不溶性GFP1-10比较先后连续诱导或者联合诱导的效果

[0215] 为了验证联合诱导会导致不溶性聚合的超级折叠GFP1-10的互补，我们比较了先后连续诱导方式和联合诱导方式的试验步骤。BL21(DE3)大肠杆菌细胞与巨型GFP1-10片
段(折叠报告GFP1-10，超级折叠GFP1-10，或者GFP1-10OPT)共同转染入带有ColEl启动子
的pTET载体，同时亚硫酸还原酶-GFP S11野生型转染入带有p15启动子的pET质粒中，它
们被放置在营养琼脂培养皿上的双层硝基纤维膜上，过夜生长直到菌落直径达到1毫米。
其中一层硝基纤维膜采用上述的连续诱导处理(如上述实施例4所述)。简单说就是GFP
1-10首先用AnTET表达，然后放置在干净的板上并除去AnTET，之后在另一块干净加有1mM
异丙基硫代-β-D-半乳糖苷(IPTG)的培养皿上表达亚硫酸还原酶-GFP S11野生型。另一
块培养皿进行同时诱导表达(培养皿同时内含有AnTET和IPTG)。荧光克隆通过光波工具用
488nm光波激发(LightToolsResearch，Encinitas，CA)，柯达DC290数码相机520nm波长条
件下成像。当超级折叠GFP1-10瞬间表达，并先在体内积累而不是诱导亚硫酸还原酶-GFP
S11野生型，细胞的荧光反应很微弱(图8所示)。相反，细胞表达部分可溶性GFP1-10OPT
及亚硫酸还原酶-GFP S11时无论是共表达还是连续表达都如预期明亮(图8所示)。

[0216] 实施例6：体外脱落GFP敏感性测试

[0217] 我们用微型滴定管培养皿测量了200微升体系下不同量的纯化亚硫酸还原酶-GFPS11M3的荧光进程曲线(如图9所示)。为了避免可能的高阶动力学效果，我们利
用高浓度和大过量的GFP1-10OPT(800pmol)启动互补。为这些敏感性试验，96孔板首先
用0.5％小牛血清蛋白溶液封闭10分钟，所述小牛血清溶液的溶剂为TNG缓冲液(100mM
TRIS PH值为7.5，150mM NaCl，10％的v∶v甘油)。同样的缓冲液2倍连续稀释Talon
树脂纯化(Clontech，Palo Alto，CA)的6HIS-亚硫酸还原酶-GFP S11M3溶解蛋白。稀
释物范围在每20μl等量样本有200-0.1pmol，等量样本加到96孔板中，然后将大过量
(800pmol)的GFP1-10OPT(约0.5mg/ml)加入到180μl等量样品进行互补，这样较大片段
的浓度不会受到限制。为了检测未加工的大肠杆菌裂解产物对这个反应的敏感性，我们在
另外一个试验中，样本先添加20μl表达不相关无标签蛋白的大肠杆菌BL21(DE3)裂解产
物，再添加GFP1-10OPT。用FL600显微培养皿荧光读数器(FL600microplate fluorescence
reader，Bio-tek，Winooski，VT)监控荧光动力学(λexc＝488nm，λem＝530nm)，记录间隔
为3分钟，记录时间为15小时。空白对照(20μl表达不相关蛋白的大肠杆菌裂解产物，
100μl 0.5mg/ml GFP1-10OPT，和100μl TNG缓冲液中0.5％BSA)的背景荧光从最终的
荧光值中减去。空白对照少于最低的目标浓度的30％信号(0.1pmol亚硫酸还原酶-GFP
S11M3)。互补荧光是分析物浓度的线性函数(如图9所示)。10到200pmol量的亚硫酸
还原酶-GFPS11M3在添加了GFP1-10OPT(图9A所示)之后15分钟内都能被精确定量，并
且0.1到10pmol需要约1小时(如图9B所示)。广泛浓度范围的进程曲线都能通过简单
的线性缩放比例进行添加(如图10所示)，表明反应的动力学不受限于GFP1-10OPT的浓
度。如图9所示的对应于反应曲线的平滑线条标记了GFP标签结构域的测试样品所需要的
蛋白量，只要测试样品的测量条件与用已知浓度样品来做反应曲线时的条件相同即可(例
如：标准曲线中举例了如图9A所示亚硫酸还原酶-GFP利用同样的GFP1-10OPT试剂浓度和
同样的样品体积)。这样，在图9A中，荧光线性拟合(Y)对应于单位pmol的Y由公式Y＝
2.46x(pmol)+22.8给出。假设我们要在与标准曲线同样的条件下检测一个未知浓度的标记
蛋白，产生出200单位的检测荧光。利用公式pmol＝(Y-22.8)/2.46，Y用200代替，就可
以计算出pmol＝(200-22.8)/2.46＝72.0pmol。

[0218] 实施例7：快速连接脱落GFP片段

[0219] 为了区分脱落GFP片段的连接动力学和发色团形成动力学，我们将结合在Talon树脂上的6HIS-GFP1-10OPT与N末端折叠报告GFP标记的GFP S11M3互补。50％v/v的
Talon树脂的悬浊液中的100μl等量样本浸满了带有N末端6HIS亲和标签(200μl 2mg/
ml的蛋白质)的GFP1-10OPT。珠子(50μl容积)用300μl TNG缓冲液洗3次除去未连接
的GFP1-10OPT，吸起剩下的缓冲液并弃之，并在96孔微量滴定板上进行荧光测试(图11，
步骤一)。过量的折叠报告GFP-GFP S11M3溶解蛋白(200μl 5mg/ml的蛋白质)加上珠子，
吹打混合15秒，快速转移到小的0.2μl过滤离心管中，用0.5ml等体积的TNG清洗3次除
去未连接的折叠报告GFP-GFP S11M3蛋白。这一过程需要大约5分钟。珠子转移到干净的微
量滴定板(图11，步骤二)并且进行荧光检测，每3分钟检测一次，检测12小时(图11，步
骤三)。珠子的荧光显示折叠报告GFP-GFP S11M3蛋白已迅速连接到6HIS-GFP1-10OPT(图
11，步骤二)。清洗过的珠子获得附加荧光的速率可以与在溶液中观测的媲美(图11，步骤
三)，表明荧光反应动力学没有被连接GFP片段的速率所限制。

[0220] 实施例8：互补检测的稳定性和辅助物及PH的影响

[0221] 我们检测了一般化学辅助物和PH对互补反应的影响。10份连续2倍连续稀释的9M尿素与TNG协同作用。10种溶液的100μl等量样本，其浓度范围在9M到0.019M尿素
之间，和10μl亚硫酸还原酶-GFP 11M3，10μl GFP1-10OPT测试片段，及80μl TNG缓冲
液结合。用FL-600培养皿读数器每3分钟收集一次共收集12小时的荧光数据(BLOTEK，
Winooski，VT)。反应在尿素含量超过2M时终止(图12)。另外一个试验，互补速率通过5mM
二硫苏糖醇改良了约30％，但是当SDS浓度达到0.1％w/v时停止。我们接着测试了不同PH
的溶液对互补反应的效率的影响。10μl等摩尔的亚硫酸还原酶-GFP S11M3融合蛋白或者
S11野生型多肽溶液加入到180μl含有适当量缓冲液MES(pH5-5.6)，HEPES(pH6.5-7.5)，
TRIS(pH7.5-8.5)，BICINE(pH8.5-9.0)的0.1M溶液中，pH范围在5.0到9.0之间，每0.5pH
为一个单位。通过加入10μlGFP1-10OPT(4mg/ml)启动互补，并且互补动力学通过FL-600
平板读数器(BIOTEK，Winooski，VT)每3分钟监控一下，监控过夜。当低于pH6.5且具有约
pH7.3的明显pKa时互补的效率很低(图13)。互补之后在高于5M尿素的情况下一部分荧
光GFP显示为慢的，荧光的时间依赖性的降低(t1/2≈20小时)，并且约5.5的pKa与“增
强的”GFP相似(Patterson，Knobel等，1997)。

[0222] 实施例9：体外蛋白定量

[0223] 为了检测脱落GFP系统是否可以在体外精确定量不同的蛋白质，我们表达了18个热棒菌蛋白(Pyrobaculum)作为pET载体与C末端GFP S11M3标签共同构建于液体培养
液中，再利用SDS-PAGE和脱落GFP互补系统分析可溶性和沉淀部分(图14)。为了pET表
达蛋白定量测试我们检测了18个热棒菌(Pyrobaculum)蛋白的可溶部分，并且通过直接
估计GFP S11和GFP1-10突变体进行优化试验，20μl目标蛋白可溶性部分的细胞裂解产
物与再次折叠的180μl 0.35mg/ml GFP1-10OPT(约600pmol)在96孔微量滴定板中混合
TM
(Nunc-lmmuno plate，Rochester，NY)。为了检测不溶性沉淀部分，每个再次悬浊不溶性部
分的50μl被离心，干燥的沉淀部分用50单位的9M尿素溶解，通过迅速添加190μl溶解
于TNG中的0.35mg/ml的GFP1-10OPT来检测10μl没有折叠的样品。沉淀部分的荧光值
用两个因素之一进行衡量来弥补相对可溶性检测而言较小体积，从而可以与可溶性部分检
测进行直接比较。测试中的尿素最终浓度为约0.4M(如上述实施例8和图12所示)。通
过SDS-PAGE来定量，15μl可溶性和沉淀部分的样品与15μ12xSDS变性缓冲液混合，缓冲
液中有100mM TRIS，200mM二硫苏糖醇，4％SDS，0.2％溴酚蓝，和20％甘油，100℃加热15
分钟。变性样品通过4％-20％梯度标准SDS-PAGE(Biorad，Hercules，CA)分离。凝胶上
的蛋白斑点用凝胶编码蓝色染色剂(Pierce，rockford，IL)染色并形成图片，蛋白斑点的
光学密度用GS-800校准扫描显像密度计(Biorad，Hercules，CA)定量。即使这样，库马
斯亮蓝染料(Coomassie dye)染色后在染色效率方面依然呈现了蛋白依赖性差异(Tal，
Silberstein et al.1985)，完成蛋白的互补和折叠后(约6小时)会发现测量的荧光反应
值与通过SDS-PAGE看到的蛋白量之间呈高度相关(图14)。不溶性蛋白溶解于9M的尿素
(如前面的实施例所述)，并且用含有过量GFP1-10OPT的缓冲液稀释20倍之后发出的荧
光与通过SDS-PAGE(图14)所呈现的不溶性蛋白质质量呈现出较好的相关性。相反，当可
溶性部分先用新鲜缓冲液进行稀释，再等体积添加浓缩的GFP1-10OPT后，多种表达地很好
的不溶性蛋白(例如，聚硫还原酶和核苷二磷酸激酶，如表3和图14所示)没有出现可检
测的互补现象。很有可能这些蛋白质发生了错误折叠，并且通过稀释而发生聚集，使得GFP
11M3标记物难以接近之后添加的部分GFP1-10OPT。

[0224] 实施例10：利用脱落GFP检测系统估算体内可溶性蛋白和总蛋白

[0225] 可操作性脱落蛋白质标签系统能够用来体内标签并且检测可溶性与不可溶性蛋白质。我们理论上论证了可溶性蛋白质能够通过在有限时间内首次表达标签蛋白从而在
活的大肠杆菌细胞中被检测到，并且随后关闭表达让标签蛋白能够发展它固有的溶解能力
表型，之后再在同样的细胞内表达互补的GFP片段。从我们的体外共再折叠沉淀物测试结
果来看(实施例9)，我们期望共表达的GFP S11M3标签蛋白和GFP1-10OPT会产生结构互
补并且先产生GFP荧光，之后才有试验蛋白体内聚集的发生，这样可以对总表达蛋白进行
估计。共表达带有N末端6HIS和来自于pTET-SpecR质粒的C末端GFP S11M3标签的热棒
菌试验蛋白(图1)，和来自于pET载体的GFP1-10OPT(Novagen，Madison，WI)的大肠杆菌
BL21(DE3)细胞在含有50μg/ml卡那霉素和70μg/ml奇放线菌素的LB溶液中生长，当OD
600nm＝1.0时稀释在20％甘油内-80℃冻存。细胞连续用2次400倍的LB稀释液稀释然
后置于硝酸纤维膜上。32℃过夜生长，细胞连续诱导(实施例4)或者联合诱导。对连续诱
导而言，带有过夜菌落的膜上的细胞平板在摇床培养1.5小时，平板含有250ng/mlAnTet，
放置在静止平板上1小时，最后1小时放置在加有1mM IPTG的平板上(注意相比于实施例
4制造GFP S11较短的摇床培养时间)。对共诱导试验步骤而言，带有过夜菌落的膜转移到
含有600ng/mlAnTET和1mM IPTG的平板上37℃培养4小时，共表达GFP S11和巨型GFP片
段1-10。平板上的培养克隆通过光波照射工具系统(LightTools Research，Encinitas，CA)
用488nm激发滤光片进行光照，DC290数码相机(柯达)通过彩色玻璃滤光器(520nm长波
滤过，LightTools Research，Encinitas，CA)进行成像。荧光克隆在共表达或者连续表达
之后成像，同样构造的可溶性和沉淀部分在液体培养基中连续诱导之后利用SDS-PAGE(图
15)进行分析。我们通过连接可溶性部分到过量的Talon树脂(Novagen，Madison，WI)上
估计可利用的，非聚合6HIS-标记的蛋白量，之后进行SDS-PAGE检测。简单说来，为了分
析用来进行体内全细胞平板互补检测的同样克隆的可溶性和沉淀部分，克隆被分离出来在
1ml 96孔板培养板中37℃培养。细胞在指数阶段用250ng/ml AnTET诱导1小时，新鲜LB
清洗3次，然后用1mMIPTG诱导1.5小时。诱导之后，培养沉淀部分用110μlTNG缓冲液
进行再悬浊，并用超声波降解。裂解产物离心分流得到可溶性和沉淀部分。40μl可溶性
连续诱导液体培养菌提取物与等体积50％v/v金属吸附树脂珠(Talon resin，Clontech，
PaloAlto，CA)的悬浊液混合至TNG缓冲液中并稍微离心。吸走没有连接上的片段，珠子用
过量TNG缓冲液连续冲洗2次。最后一次离心之后，丢弃缓冲液。加入40μl 2×SDS变性
缓冲液，并100℃加热15分钟。不溶性部分被变性(实施例4，如上所述)。连接到Talon
树脂的变性的样品分离于4-20％梯度标准SDS-PAGE凝胶(Bio-Rad，Hercules，CA)。蛋白
质样品用凝胶编码蓝色染色剂(Pierce，Rockford，IL)染色并且用GS-800标准显像密度
计(Biorad，Hercules，CA)成像。体内联合诱导克隆荧光报道了和SDS-PAGE一致的全部蛋
白，然而连续诱导克隆荧光与Talon连接可溶性蛋白的SDS-PAGE(图15)一致。表达高溶
解性蛋白质的克隆无论GFP1-10是共诱导还是连续诱导都很亮(蛋白质2，4和5，图15)。
表达不溶性蛋白质的克隆当共诱导时GFP1-10更亮(蛋白质8，11，15，16，和18，图15)。蛋
白质1，4，5，7，9，12和14的溶解性在pET系统(表3和图14，如上所述)中很强的T7启
动子(Studier，Rosenberg等1990)表达时较从pTET质粒(图15)的较弱的tet启动子
区(Lutz和Bujard 1997)表达时来得低。启动子区的强弱对蛋白质表达水平和溶解度的
影响在之前就已经被注意到了(Makrides 1996；Baneyx 1999；Gerstein，Edwards等2003；
Yokoyama 2003；Fahnert，Lilie等2004)。

[0226] 实施例11：设计一种脱落GFP互补对，其由一GFP S10-11标签片段和GFP1-9检测片段组成

[0227] 按照上文中实施例2的方法，我们定义了一个可行性脱落GFP对，其由一个含有超级折叠GFP氨基酸198-238的标签结构域，(GFPS10-11)，和一个带有超级折叠GFP氨基酸
1-198的互补检测片段(GFP1-9)组成，当两个片段在大肠杆菌中共表达时，其产生荧光细
胞。GFP1-9是不溶性单独表达于大肠杆菌。单独表达的片段也不是荧光。按照上文中实施
例3的描述，并且利用亚硫酸还原酶-GFP S10-11融合蛋白作为互补标签，我们通过人工定
向进化方法改进了GFP1-9的折叠性和溶解性，产生新的变异体GFP1-9OPT，它包含了超级
折叠GFP的突变(实施例2，如上所述)和附加突变S2R，T43S，A87V，F114S，和K166T。这
个片段在大肠杆菌pET28载体(Novagen，Madison，WI)37℃时约50％可溶性表达。下一步
我们根据上文中实施例4，利用改进的GFP1-9OPT作为互补目标改进GFP S10-11的溶解性，
改善它的融合蛋白折叠性和溶解性的不稳定性。超级折叠GFP S10-11标签有序列：NHYLST
QSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK[SEQ ID NO：35]，而优选的GFP S10-11有序列：DH
YLSTQTILSKDPNEERDHMVLLESVTAAGITHGMDELYK[SEQ ID NO：36](突变N198D，S205T，V206I，
K214E，F223S)。利用这些片段进行体外脱落GFP测试的敏感性根据上文中实施例6进行检
测，但具有有限量的GFP1-9OPT(2.5μM GFP1-9OPT)。在这些条件下，荧光如预期达到了稳
定水平，大于等于2.5μM标签片段浓度(图16)。

[0228] 实施例12：设计一种(GFP S10)-X-(GFP S11)三明治标签形态和利用检测片段GFP1-9OPT进行检测

[0229] 为了在目标蛋白的两端共价连接的情况下进行严格的检测，和为了减少潜在的由于仅标签目标蛋白一端所产生的人工物，像蛋白质水解或者内部核糖体连接位点产生的短
片段，我们设计了一种三明治形态，此时试验蛋白被表达成融合在GFP的两个小结构域之
间，然后与GFP的第三个结构域互补。在本实施例中，试验蛋白X表达成像三明治一样夹在
GFP链10和11之间形成(GFP S10)-X-(GFP S11)(图17)。这种类型与GFP的第三结构域
互补，即GFP1-9OPT，从而产生完整的GFP。我们利用公知技术设计了结构(GFP S10)-L1X
L2-(GFPS11)，在此L1和L2是接头，其中每个接头由氨基酸GGGS组成，通过插入试验蛋白
到超级折叠GFP S10-11标签(图18A)中的GFPS11和GFPS11之间。我们利用GFP1-9OPT
成功地检测到(GFP S10)-L1-亚硫酸还原酶-L2-(GFP S11)，尽管互补仅是C末端GFP
S11M3+GFP1-10OPT形态的约1/30有效。我们也发现了当其他部分可溶性蛋白以这种三明
治形态表达时，其变成了不可溶解的。首先我们改进了互补的效率而不考虑溶解性。我们
由一个DNA结构开始，该结构编码(GFP S10)-L1-Ndel::GGGSGSGG::BamHI-L2-(GFP S11)，
GFPS10链和GFP S11链来自于超级折叠GFP(图18A)，并且短氨基酸序列GGGSGSGG[SEQID
NO：37]提供了两条GFP链之间的可伸缩接头。这是通过DNA重排技术突变得到，并且通过
连续诱导来自pTET载体的文库，在体内筛选带有改进的与GFP1-10OPT互补的变异体文库，
其紧跟在来自作为板上克隆的大肠杆菌细胞内的pET载体的GFP1-9OPT的表达之后(如实
施例4所述)。6个最亮的克隆在三轮进化后被测序(图18A)。我们注意六个中的第五个突
变，这个结构被称为(GFP S10SM5)-L1-X-L2-(GFP S11SM5)(SM5＝三明治突变第5)。优先序
*
列：YTMDLPDNHYLSTQTILLKDLNGTGVGSGGGS GGGSGSGG GGGSTSEKRDHMVLLEYVTAAGITDAS，
[SEQ ID NO：38]，其中，GFP S10和GFPS11链用下划线表示，星号是终止密码子。第一个
斜体序列来自Ndel克隆位点CATATG，编码氨基酸HM。第二个斜体序列来自BamHI限制性
位点GGATCC，编码氨基酸GS。带有框内Ndel和BamHI限制性位点的试验蛋白克隆到包含
用本领域公知的方法先前被Ndel和BamHI限制性内切酶消化的结构的载体中。典型地，
克隆盒内的Ndel和BamHI位点之间的框内结构域包含了能被带有终止密码子的移码替换
的结构，它能够防止由于未消化载体或转移载体带来的假阳性(如上所述的实施例1，典型
的移码序列)。这种方式是公知技术。克隆盒由Ncol和Xhol限制性位点包围并克隆到
pTET载体中。尽管克隆到Nde-1/BamH-1位点的可溶性亚硫酸还原酶的互补速率与起始链
结构想比增长了约20倍，通过检测部分溶解性HPS蛋白发现对蛋白质溶解性的有害影响也
增大了(实施例4，如上所述)。接下来，为了同时选择改进的互补和提高的融合蛋白稳定
性，我们利用同样的诱饵蛋白已酮糖磷酸盐合成酶，HPS，我们已经在改进GFP S11溶解性
和互补时用过这个蛋白(实施例4，如上所述)。HPS是约60％可溶性单独表达自pTET载
体(蛋白质#9，图15)，但是不溶性表达成(GFP S10SM5)-L1-HPS-L2-(GFP S11SM5)融合蛋
白。我们来看上游(GFP S10SM5)结构域，在一层14个合成的寡核苷酸的引物中利用重排
和引物预测突变发生(图18B)。每条引物都集中在GFP S10SM5结构域的14个氨基酸之，
包含一个NNN编码简并了中心目标氨基酸和在克隆载体上周围与GFP S10 SM5的同源序列
(目标序列如图18B和图19所示)。该层简并引物在重组反应(如实施例4所述的重组)
时加入到碎片DNA中。这种引物-预测突变发生技术是公知技术。我们重排并扩增了被
Ncol上游和BamHI下游包围的结构域，Ncol：(GFP S10 SM5)-L1-Nde-1::HPS::BamH1-L2-
(GFP S11SM5)，在通过PCR反应进行片段重排时加入简并引物混合物。我们再次扩增了来
自重组突变结构的结构域，然后消化出包含突变(GFP S10)层、利用标准技术纯化的凝胶的
Ncol/Nde-1片段，然后克隆到包含Ncol//Ndel::HPS::BamH1-L2-(GFP S11SM5)的接受载
体。利用来自pTET和互补检测)的连续诱导进行3轮选择，8个最好的克隆的序列中的每
个序列通过荧光染色中断测序仪测序(图19)。表现最好的克隆，命名为(GFP S10 A10)-L
1-Ndel::HPS::BamH1-L2-(GFP S11SM5)是约45％可溶性表达于大肠杆菌，有标记的改进相
对于不溶性起始结构，并且现在互补信号是利用GFP1-10OPT检测三明治结构中唯一的GFP
S11SM5标签(如上所述)的互补的约1/5到1/4倍。下面我们检测利用18个热棒菌试验
蛋白的测试(见上文表3，为明确的非融合的溶解性)。根据先前描述的方法利用本实施例
的即时片段检测可溶性沉淀部分(实施例9)。我们利用GFP1-10OPT仅特异性检测(GFP
S11SM5)标签作为参考，检测了这些三明治-形态标记的蛋白质，也用到了GFP1-9OPT，它需
要三明治形态标签蛋白的(GFP S10A10)和(GFP S11SM5)链的连接。正如预期，当检测仅
需一条链时互补更有效(GFP1-10OPT例中)，并且利用尿素-溶解的沉淀来检测沉淀部分
在GFP1-10OPT检测例中是最有效的(图20)。但是，利用GFP1-9OPT检测到的三明治的可
溶性部分荧光反应与利用GFP1-10检测的信号密切相关，报告了如预期的可溶性蛋白。相
似地，体内连续诱导与可溶性pTET和GFP S11M3融合表达也相关(图20，实施例9所示，图
15)。优化的选择有如下氨基酸序列：YTMDLPDDHYLSTQTILSKDLNGTDVGSGGGS GGGSGSGG
*
GGGSTSEKRDHMVLLEYVTAAGITDAS，[SEQ ID NO：39]，GFP S10和GFP S11链用下划线表示，
星号代表终止密码子。第一个斜体序列来自Ndel克隆位点CATATG，编码氨基酸HM。第二
个斜体序列来自BamHI限制性位点GGATCC，编码氨基酸GS。带有框内Ndel和BamHI限制
性位点的试验蛋白质通过公知技术克隆到包含有之前已被Ndel和BamHI限制酶消化的结
构的载体上。这个盒子由可以克隆到pTET载体的Ncol和Xhol限制性位点包围。典型地，
克隆盒内的Ndel和BamHI位点之间的读码框内区域包含了能被带有终止密码子的读码框
移码替换的结构，它能够防止由于未消化载体带来的假阳性(实施例1，如上所述，典型的
读码框移码序列)。

[0230] 实施例13：设计GFP S11标签的富含组氨酸的突变子用于检测和纯化

[0231] 我们设计了对金属亲和蛋白纯化珠有强亲和性的GFP S11，从而组合成具有蛋白检测和蛋白纯化双重功能的单个蛋白。我们猜测暴露到溶剂环境下并且侧链伸出GFP结
构( ，Cubitt等1996；Tsien 1998)外的GFP链11的残基能够改变为另一种氨基
酸，且不用破坏具有巨型GFP1-10检测片段的GFP S11标签的互补。4个指向外部的残基
利用特异性引物通过PCR手段突变为组氨酸：P1，GATATAACTAGTCATGACCACATGCACCTTCAT
GAG[SEQ ID NO：40]；P2，CACATGCACCTTCATGAGCATGTACATGCTCAT[SEQ ID NO：41]；和P3，
GATATAGGTACCCCCATGAGCATGTACATGCTCATGAAGGTGCA[SEQ ID NO：42]。结果GFP 11H7片
段KHDHMHLHEHVHAHGGT[SEQ ID NO：18]被克隆成C末端带有可溶性控制蛋白亚硫酸还原
酶。GFP的X射线晶体结构检测( ，Cubitt等1996；Tsien 1998)(PDB ID REF：1GFL)
(Yang，Moss等1996)显示了2个GFP 11H7末端附加的残基与GFP1-10上其他氨基酸没
有特异性联系。这些附加的残基在GFP S11H7标签内突变成组氨酸，从而产生GFP S11H9，
HDHMHLHEHVHAHHHT[SEQ ID NO：20]。该18个热棒菌调控蛋白(表3，如上所述)融合到GFP
S11H7或者GFP S11H9并从pET载体中表达(实施例9，如上所述)，从而检测这些标签是否
能够用来作为新的检测和纯化系统并在体外精确定量和纯化融合蛋白。过夜液体培养物用
新鲜LB稀释，当长到600nm下0.50D时，用1mM IPTG 37℃诱导4小时。可溶性沉淀部分通
过超声波分馏并离心。对这18个带有C末端GFP S11H7或者GFP S11H9融合标签的热棒
菌调控蛋白的SDS-PAGE溶解性进行如前所述的评估(实施例9，如上所述)(表4)。先决
定这些蛋白的非融合溶解度(实施例9，如上所述)。GFP S11H7和GFP S11H9标签对蛋白
溶解度的影响最小。

[0232] 表4：

[0233] GFP S11H7或者H9标签对18种耐超高温热棒菌蛋白溶解度的影响

[0234]

[0235] a18种来自极端嗜盐的古细菌群的耐超高温热棒菌(Fitz-Gibbon，Choi等1997)的蛋白。b从氨基酸序列计算得到的理论上的分子重量kD。SDS-PAGE密度计量(试验手段)
决定片段溶解性。相对不确定度是约5％，各三个重复取平均值。d非融合(non-fusion，NF)
溶解度和eC末端与野生型GFP S11(WT)融合，如实施例4fC末端与GFP S11组氨酸突变体
融合(H7，H9)。

[0236] 实施例14：S11H7融合蛋白和GFP1-10A4之间互补反应的敏感度

[0237] 根据上文描述制得纯化的亚硫酸还原酶-GFP S11H7融合蛋白稀释物(实施例6，如上所述)。稀释物范围从每100μl等量样本中含有670pmol到0.7pmol，等量样本加到
96孔板中，然后用大过量(800pmol)的GFP1-10A4(约0.5mg/ml)加入100μl等量体积中，
完成互补。GFP1-10A4检测片段由于具有比GFP1-10OPT更高的互补速率而被用来检测GFP
S11H7。荧光互补动力学印记(λexc＝480nm，λem＝520nm)通过FL600显微平板荧光阅
读器(Bio-Tek，Winooski，VT)被监控过夜。最终荧光值相对于亚硫酸还原酶-GFP S11H7
融合蛋白量作图(图21)。

[0238] 实施例15：通过N-6HIS标签或者C末端GFP S11H7标签比较GFP的纯化

[0239] 折叠报告GFP克隆到一个N-6HIS pET 28载体中(Novagen，Madison，WI)，或者克隆到带有C末端GFP S11H7标签(没有N-6HIS标签)的pET载体中。表达每一种融合蛋白
的200ml BL21(DE3)培养物生长到OD600~0.5时，加入1mM IPTG 37℃诱导4小时。培养物沉
淀用2ml TNG悬浊并超声降解。可溶性片段放到Talon树脂纯化珠(TALON，Clonteck，Palo
Alto，CA)上。过量TNG缓冲液冲洗两次之后再用加入5ml咪唑的TNG缓冲液冲洗一次，蛋
白用TNG缓冲液中添加的150mM咪唑洗提。粗提物和纯化后的片段(150mM咪唑洗提)用
SDS-变性缓冲液混合然后100℃加热15分钟，溶解于4-20％梯度标准SDS-PAGE(Biorad，
Hercules，CA)。蛋白样本用凝胶编码蓝色试剂(Pierce，Rockford，IL)染色，用GS-800校
准的扫描显像密度计(Biorad，Hercules，CA)成像(图22)。

[0240] 实施例16：融合有S11H7，S11H9，或者带有N-6HIS标签，结合到Talon树脂上的折叠报告GFP的咪唑洗提属性

[0241] 为了判断Talon纯化树脂(Talon Resin，Clontech，Palo Alto，CA)对6HIS，GFPS11H7，和GFP S11H9标签的相对亲和性，绿色荧光蛋白(GFP)克隆到N末端融合有GFP
S11H7或者GFP S11H9的非-6HIS标签的pET载体和N-6HIS标签的pET载体中。每个融
合蛋白在大肠杆菌中的3ml培养物生长到OD600~0.5时，加入1mM IPTG37℃诱导4小时。
培养物沉淀用150μl TNG悬浊并超声降解。50μl可溶性片段经过TNG缓冲液预孵后放
到200μl Talon树脂纯化珠(TALON，Clonteck，Palo Alto，CA)上。1ml TNG缓冲液冲洗
3次后，20μl 50％v∶v珠浆转移到7个含有50μlTNG缓冲液，并分别加有0，5，10，25，
50，75，和100mM咪唑的PCR管中，混匀，离心并沉淀珠，然后10μl洗提片段用190μl TNG
缓冲液在96孔微型板中稀释(Nunc-ImmunoTMplate，Nunc，Rochester，NY)。利用FL600微
型平板荧光阅读器(Bioteck，Winooski，VT)检测荧光(λex＝488nm，λem＝530nm)(图
23)。结果显示GFP S11H9标签相对于GFP S11H7标签对Talon树脂有更强的亲和性，也许
更适合在蛋白连接之后用高密度咪唑清洗来进行纯化。

[0242] 实施例17：钴纯化几类融合于S11 H9的试验蛋白

[0243] 7种部分可溶(热棒菌试验蛋白)-GFP S11H9融合蛋白被选择来进行Talon树脂珠纯化，它利用了GFP S11H9突变体对Talon树脂的亲和性。大肠杆菌BL21(DE3)中每个
融合蛋白的3ml培养物生长到OD600~0.5，加入1mM IPTG 37℃诱导4小时。培养物沉淀
用150μl TNG悬浊并超声降解。50μl可溶性片段与50μl TNG洗涤过的Talon树脂珠
(Talon，Clontech，Palo Alto，CA)混合于300μl eppendorf管中。在周围温度约25℃时
孵化10分钟后，悬浊液离心并移去上清液，上清液作为未连接上的片段进行保存。小珠用
含有5mM咪唑的1ml TNG缓冲液洗涤，然后用含有10mM咪唑的1mlTNG缓冲液冲洗去掉连
接不牢的蛋白。通过旋转0.2u滤筒中的小珠(Pierce，Rockford，IL)移去过量的上清液。
连接上的蛋白用75μl含有150mM咪唑的TNG缓冲液孵育10分钟来洗提，悬浊液通过0.2u
滤筒进行离心并且过滤得上清液作为洗提片段保存。带有每种蛋白的结合的粗提物(S)，
未结合部分(U)，和洗提部分(E)的Talon树脂用2×SDS缓冲液变性，加载到4-20％标准
SDS-PAGE(Biorad，Hercules，CA)(图24)。

[0244] 参考文献

[0245] Adams，S.R.，R.E.Campbell等(2002).“新的双砷化合物配体和四巯基丙氨酸小分子在体内体外作为蛋白质标签的合成及生物学应用。”美国化学社会期刊124(21)：
6063-76.

[0246] Arai，M.，K.Maki等(2003).“检测折叠能力与来自大肠杆菌的二氢叶酸还原酶的早期折叠事件的关系。”分子生物学期刊328(1)：273-88.

[0247] Armstrong，N.，A.de Lencastre等(1999).“一种新的蛋白折叠筛选：应用到一种谷氨酸和海人藻酸受体的配体连接结构域和应用到溶菌酶和胰蛋白酶”蛋白质科学8(7)：
1475-83.

[0248] Baird，G.S.，D.A.Zacharias等(1999).“绿色荧光蛋白的循环排列及受体插入”美国科学学术发展96(20)：111241-6.Baneyx，F.(1999).“大肠杆菌中重组蛋白表达”当前
生物技术观点10(5)：411-21.

[0249] Bertens，P.，W.Heijne等(2003).“豇豆花叶病毒转运蛋白的C末端研究”农业滤过性微生物学148(2)：265-79.

[0250] Crameri，A.，E.A.Whitehorn等(1996).“利用DNA改组技术的分子进化方式得到的改良绿色荧光蛋白”自然生物技术14(3)：315-9.

[0251] Fahnert，B.，H.Lilie等(2004).“包涵体：形成与利用”先进生物化学工程技术89：93-142.

[0252] Fitz-Gibbon，S.，A.J.Choi等(1997).“基于fosmid的遗传图谱以及定义474个超嗜热菌的基因”嗜特异环境微生物1(1)：36-51.

[0253] Fox，J.D.，R.B.Kapust等(2001).“大肠杆菌麦芽糖连接蛋白表面的单个氨基酸替代能对融合蛋白的溶解性产生巨大影响”蛋白质科学10(3)：622-30.

[0254] Gegg，C.V.，K.E.Bowers等(1997).“分子解剖学探针寻找二氢叶酸还原酶上最小的独立折叠单元”蛋白质科学6(9)：1885-92.

[0255] Gerstein，M.，A.Edwards等(2003).“结构基因组：当前进展”科学299(5613)：1663.

[0256] Goh，C.S.，N.Lan等(2004).“挖掘机构基因组的途径：识别影响高输出实验分析的蛋白属性”分子生物学期刊336(1)：115-30.

[0257] Iwakura，M.and等(1998).“氨基乙酸接头的长度对连接循环排列的二氢叶酸还原酶的N和C端的效果的影响”蛋白质工程11(8)：707-13.

[0258] Iwakura，M.，T.Nakamura等(2000).“完整蛋白的系统循环排列揭示了基本折叠元素”生物的自然结构7(7)：580-5.

[0259] Jappelli，R.，A.Luzzago等(1992).“环形突变能够导致铁蛋白羧基端实质性构造改变”分子生物学期刊227(2)：532-43.

[0260] Kelemen，B.R.，T.A.Klink等(1999).“超敏感的核糖核酸酶培养基”核酸研究27(18)：3696-701.

[0261] Kim，J.S.and R.T.Raines(1993).“核糖核酸酶S-肽作为融合蛋白的载体”蛋白质科学2(3)：348-56.

[0262] Knaust，R.K.and P.Nordlund(2001).“在96孔板内筛选可溶性表达的重组蛋白”生物化学年报297(1)：79-85.

[0263] Lopes Ferreira，N.and J.H.Alix(2002).“伴侣蛋白DnaK对大肠杆菌的β-牛乳糖的α-互补是必须的”细菌学期刊184(24)：7047-54.

[0264] Lutz，R.and H.Bujard(1997).“大肠杆菌中独立转录调节因子与LacR/O，TetR/O和AraC/I1-12调节因子”核苷酸研究25(6)：1203-10.

[0265] Makrides，S.C.(1996).“在大肠杆菌中实现基因高表达的方法”微生物革命60(3)：512-38.

[0266] Nixon，A.E.and S.J.Benkovic(2000).“苷氨酰胺核苷酸转甲酰酶消化酶的甲酸基转移效果的改进”蛋白质工程13(5)：323-7.

[0267] ，M.，A.B.Cubitt等(1996).“水母绿色荧光蛋白的晶体结构”科学273(5280)：1392-1395.

[0268] Patterson，G.H.，S.M.Knobel，et al.(1997).在定量荧光显微方法中运用绿色荧光蛋白和他的突变体生物物理学期刊73(5)：2782-90.

[0269] Pelletier，J.N.，K.M.Arndt等(1999).“体内文库-对-优化的蛋白之间交互作用文库”自然生物技术17(7)：683-90.

[0270] Pelletier，J.N.，F.X.Campbell-Valois等(1998).“理性设计的二氢叶酸还原酶片断进行寡聚化重组”美国科学学术发展95(21)：12141-6.

[0271] Richards，F.M.and P.J.Vithayathil(1959).“枯草杆菌蛋白酶修饰的核糖核酸酶的制备和多肽与蛋白成分的分离”生物化学期刊234(6)：1459-65.

[0272] Rossi，F.M.，B.T.Blakely等(2000).“在活哺乳动物细胞内通过β-牛乳糖互补监控蛋白-蛋白交互反应”酶学方法328：231-51.

[0273] Smith，V.F.and C.R.Matthews(2001).“检测链连接对于大肠杆菌二氢叶酸还原酶的稳定性和结构的影响：片断互补和循环排列揭示稳定性，可选择的折叠形式”蛋白质科
学10(1)：116-28.

[0274] Stemmer，W.P.(1994).“运用随机碎片和重组进行DNA改组：分子进化的体外重组”美国科学学术发展91(22)：10747-51.

[0275] Studier，F.W.，A.H.Rosenberg等(1990).“利用T7RNA聚合酶直接表达克隆基因”酶方法185：60-89.

[0276] Tal，M.，A.Silberstein等(1985).“为什么库马斯亮蓝R能够与不同的蛋白发生不同的交互反应？部分答案”生物化学期刊260(18)：9976-80.

[0277] Terwilliger，T.C.(2004).给生物学家的结构与技术分子生物自然结构11(4)：296-7.

[0278] Tsien，R.Y.(1998).绿色荧光蛋白进化生物化学年报67：509-44.

[0279] Ullmann，A.，F.Jacob等(1967).“运用与大肠杆菌的β-牛乳糖的结构基因操纵子近侧片段相应的多肽进行体外互补的描述”分子生物学期刊24(2)：339-43.

[0280] Waldo，G.S.(2003).“蛋白溶解性的基因筛选及人工定向进化方法”生物化学当前观点7(1)：33-8.

[0281] Waldo，G.S.(2003).“通过人工定向进化方法利用GFP折叠报告来改进蛋白折叠效率”分子生物学方法230：343-59.

[0282] Waldo，G.S.，B.M.Standish等(1999).“通过绿色荧光蛋白进行快速蛋白-折叠测试”自然生物技术17(#7)：691-695.

[0283] Wehrman，T.，B.Kleaveland等(2002).“通过β-内酰胺酶片段的互补来调控哺乳动物细胞中蛋白-蛋白交互作用”美国科学学术发展99(6)：3469-74.

[0284] Welply，J.K.，A.V.Fowler等(1981).“β-牛乳糖α-互补。单个核苷酸替代的效果”生物化学期刊256(13)：6811-6.

[0285] Wigley，W.C.，R.D.Stidham等(2001).“通过基因标记蛋白进行的结构互补在体内调控蛋白质的可溶性和折叠”自然生物技术19(2)：131-6.

[0286] Worrall，D.M.and N.H.Goss(1989).“大肠杆菌体内具有生物活性的β-牛乳糖包涵体的形成”澳大利亚生物技术期刊3(1)：28-32.

[0287] Yang，F.，L.G.Moss(1996).“绿色荧光蛋白的分子结构”自然生物技术14(10)：1246-1251.

[0288] Yokoyama，S.(2003).“结构基因组和蛋白组学的蛋白质表达系统”生物化学当前观点7(1)：39-43.

自我组装脱落荧光蛋白系统转让专利

申请号 : CN200480035241.4

文献号 : CN1886420B

文献日 : 2012-02-29

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 杰弗里·S·沃尔多 , 斯蒂芬妮·克本特斯

申请人 : 加利福尼亚大学

摘要 :

权利要求 :

说明书 :

自我组装脱落荧光蛋白系统

背景技术