苹果酸脱氢酶的靶向修饰转让专利

申请号 : CN201380031853.5

文献号 : CN104428414B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : V.舒克拉M.格普塔F.厄诺夫D.古希恩M.詹德博斯P.邦多克L.萨斯特赖-登特

申请人 : 陶氏益农公司桑格摩生物科学股份有限公司

摘要 :

本申请公开了用于靶向修饰一种或多种内源性植物苹果酸脱氢酶基因的方法和组合物。

权利要求 :

1.一种产生具有修饰的内源苹果酸脱氢酶(MDH)基因的番茄植物细胞的方法,该方法包括将包含第一融合蛋白和第二融合蛋白的锌指核酸酶引入番茄植物细胞中,从而纯合地破坏所述植物细胞中的MDH基因的开放阅读框,使得该植物细胞中的MDH蛋白活性降低,其中:所述第一融合蛋白包含核酸酶结构域以及结合SEQ ID NO:5内的靶序列的锌指DNA结合结构域,所述锌指DNA结合结构域包含依次以F1至F6指代的6个锌指结构域,其中F1至F6包含如下识别螺旋区:

所述第二融合蛋白包含核酸酶结构域以及结合SEQ ID NO:6内的靶序列的锌指蛋白,所述锌指蛋白包含依次以F1至F5指代的5个锌指结构域,其中F1至F5包含如下识别螺旋区:

2.权利要求1的方法,其中所述内源MDH基因是线粒体MDH(mMDH)基因。

3.权利要求1‑2中任一项所述的方法,进一步包括将外源核酸序列导入所述细胞内,其中所述外源序列被整合入MDH基因中。

4.一种产生具有纯合修饰的MDH基因的番茄植物的方法,该方法包括根据权利要求1‑3中任一项的方法产生番茄植物细胞,

从该植物细胞产生番茄植物。

5.一种提高作物产量的方法,包括种植自权利要求4的方法产生的植物。

说明书 :

苹果酸脱氢酶的靶向修饰

[0001] 对相关申请的交叉引用
[0002] 本申请要求2012年5月2日提交的美国临时申请No.61/641,776和2013年3月13日提交的美国临时申请No.61/780,512的权益,其公开通过引用全文并入本文。
[0003] 对在联邦科研资助下完成的发明的权利声明
[0004] 不适用。

技术领域

[0005] 本申请公开为基因组工程领域,尤其是内源的植物苹果酸脱氢酶(malate dehydrogenase)(MDH)基因的改变表达和/或靶向修饰。
[0006] 背景
[0007] 生物技术作为一种努力满足食品生产的全球性增加需求的挑战的关键性技术而出现。改善如增加产量或工程化的抗虫性的农业生产力的传统方法,依赖于突变育种或将
新基因通过转化导入到作物品种的基因组中。两种处理均为内在非特异性和相对低效的。
例如,传统的植物转化方法递送整合到随机位置的基因组中的外源基因。由此,为了鉴定和
分离具有所需属性的转基因系,需要产生成千的独特的随机整合事件并接着筛选所需要的
事件。因此,传统植物性状工程化是一项费力的、耗时且不可预测的事情。并且这些整合的
随机性质使得难以预测多效性结果是否由于无意的基因组中断而发生。因此,具有工程化
的转基因或性状的植物系的产生、分离以及表征是一项极为劳动和成本密集性且具有低成
功可能性的过程。
[0008] 靶基因修饰克服了植物系统中传统操作上的逻辑性挑战,并且由此已经是基础植物生物研究和农业生物技术中的一个长期存在但难理解的目标。然而,除了通过在稻中的
阳性‑阴性药物选择或使用预工程化的限制性位点的“基因靶向”以外,在所有植物物种(包
括模式和作物)中的靶向性基因组修饰直至最近仍被证实是非常困难的。Terada等人,
(2002)Nat Biotechnol 20(10):1030;Terada等人,(2007)Plant Physiol 144(2):846;D'
Halluin等人,(2008)Plant Biotechnology J.6(1):93。
[0009] 最近,基因组DNA靶向切割的方法和组合物已经被记载。这样的靶向性切割事件可以用于,例如诱导靶向性诱变,诱导细胞DNA序列的靶向突变(例如缺失、取代和/或插入),
和易化在预先确定的染色体基因座处的靶向重组和整合。参见,例如Urnov等人,(2010)
Nature 435(7042):646‑51;美国专利公开号20030232410;20050208489;20050026157;
20050064474;20060188987;20090263900;20090117617;20100047805;20110207221;
20110301073;2011089775和国际公开号WO 2007/014275,其公开出于所有目的通过引用全
文并入本文中。切割可以通过使用特定核酸酶例如工程化的锌指核酸酶(ZFN)、转录激活物
样效应物核酸酶(TALEN)、归巢内切核酸酶(homing endonucleases)而发生,或使用具有工
程化的crRNA/tracr RNA('single guide RNA')的CRISPR/Cas系统以引导特异性的切割。
美国专利公开号20080182332记载了使用非规范性(non‑canonical)锌指核酸酶用于植物
基因组的靶向修饰;美国专利公开号20090205083记载了在植物EPSPS基因座由ZFN介导的
靶向修饰;美国专利公开号20100199389记载了在植物Zpl5基因座的靶向修饰和美国专利
公开号20110167521记载了对参与脂肪酸生物合成的植物基因的靶向修饰。此外,Moehle等
人,(2007)Proc.Natl.Acad,Sci.USA 104(9):3055‑3060记载了利用设计的ZFN在特定基因
座进行靶向性基因添加。
[0010] 碳同化对所有活生物体的代谢功能是至关重要的。合成ATP并将其能量用于内稳态、生长和繁殖的能力在界中是保守的,并影响了大事多数已知生物过程。真核生物中ATP
合成的基本成分是三羧酸(TCA)循环,也称为柠檬酸或克雷伯氏(Krebs)循环,其将电子由
有机酸转移至氧化的氧化还原辅因子NAD+和FAD,从而形成NADH、FADH2和二氧化碳。TCA循
环在线粒体中发生;在植物中,在其反应中产生的中间体作为大量生物合成途径的底物;为
生产天门冬氨酸,谷氨酸,核酸,卟啉和脂肪酸的主要输入均来自于TCA循环。此外,TCA循环
中间体在光呼吸和光合作用的能量处理中发挥关键作用。因此,TCA循环被认为充当叶绿
体,线粒体和细胞质氧化还原功能之间的连接。
[0011] 苹果酸是TCA循环中的一种中间体并作为产生丙酮酸的苹果酸酶和苹果酸脱氢酶(MDH)两者的底物。MDH通过NADH催化草酰乙酸(OAA)到苹果酸的可逆还原反应,并参与苹果
酸/天冬氨酸穿梭。大多数植物含有MDH的多个同等型,其包含线粒体和胞质酶,由核基因编
码。植物线粒体MDH(mMDH)参与3种类型反应:将苹果酸转化为OAA,还原OAA为苹果酸,和OAA
的C4途径还原反应。在玉米(C4草类植物)中,在5个独立的染色体上有5个不同的MDH基因
座,其中的2个编码胞质同等型而其它的3个编码线粒体酶。使用传统的突变分析,证实了
MDH的2种胞质形式的功能完全丧失对植物生长和繁殖没有有害影响‑胞质的功能显示为非
必须的。相反,3个线粒体酶的完全丧失则导致致死性‑植物为了能够存活需要至少一个功
能性等位基因(Goodman等人,(1981)Proc.Nat.Acad.Sci.USA 78:1783‑1785)。相似的,大
豆线粒体MDH‑1的自然产生的自发无效(null)等位基因(Mdhl‑n)的发现显示了只要线粒体
Mdh2基因保持稳定就没有明显的植物表型(Imsande等人,(2001)J Heredity 92:333‑
338)。
[0012] 尽管苹果酸在植物代谢中具有基础性的作用,但是苹果酸在TCA循环中的功能仍没有完全被理解。MDH突变植物显示出更缓慢的生长速率和改变的光呼吸特征。参见,例如
Tomaz等人,(2010)Plant Physiol.154(3):1 143‑1157。在完整植物和果实中的反义和
RNAi研究已显示相反的结果,包括具有增加的干果实(非新鲜的)重量的植物以及较野生型
对照在其叶中具有更高的抗坏血酸水平的植物,在生长于短日照条件下时(其有利光呼
吸),该植物显示出矮小表型以及在叶片、茎和根中具有减少的生物量。Nunes‑Nesi等人,
(2005)Plant Physiol.137:611‑622);Nunes‑Nesi等人,(2007)Physiol.Plant.129:45‑
56);Nunes‑Nesi(2008)J Exp.Bot.59:1675‑1684;Finkmeier and Sweetlove(2009)
F1000Biology Reports 1:47;doi:10.3410/Bl‑47。另外,具有降低的mMDH表达的mMDH反义
系显示该酶的降低的活性(野生型39%),导致降低的根面积和受阻碍的根生长。Van der 
Merwe等人,(2009)Plant Physiol.149:653‑669);Van Der Merwe等人,(2010)Plant 
Physiol.153:611‑621)。另外,mMDH反义系显示了果实干燥的增加(更多的水分丢失)和增
加的真菌感染易感性。Centeno等人,(2011)Plant Cell 23:162‑184。美国专利公开号
20090123626记载了使用MDH RNAi来减少天冬酰胺水平,其相应地降低了在植物和植物产
品的处理相关加热(processing‑associated heating)时聚集的丙烯酰胺水平。
[0013] 因此,仍然需要用于在植物中改变MDH基因表达的组合物和方法,例如通过对MDH基因的靶向性基因组修饰,从而在植物和其后代中建立稳定的、可遗传的基因修饰。
[0014] 概述
[0015] 本公开提供了用于MDH基因以及细胞(例如,种子)、细胞系、生物体(例如,植物)等的靶向修饰的方法和组合物,所述靶向修饰包括MDH中的一种或多种靶向突变。MDH基因可
以是,例如,线粒体MDH基因(mMDH)。如上所述,显示通过反义和RNA干扰技术降低MDH酶学功
能的研究在对MDH抑制的效果上提供了有冲突的结果,比如,对于果实产量。在这些研究的
基础上,将预期TCA循环流量的抑制将对光合作用产生负作用。因此,惊人的且出乎预料的
是,发明人已显示在MDH中含有降低MDH功能(活性)的靶向性突变的植物(和植物细胞)产生
了来自包括MDH修饰的细胞的植物的增高的作物产量。增高的作物产量可包括,例如,增高
的果实产量、增高的植物生物量(或植物的果实)、更高含量的果肉、较大的植物、增加的干
重、增加的固体组织,更高的收获的总重量、作物色泽的增强的强度和/或一致性,改变的化
学(例如,油、脂肪酸、碳水化合物、蛋白质)性质,等。
[0016] 因此,在一方面,本文公开的是包括其中修饰了内源性MDH基因的表达以使MDH的表达降低的植物细胞,且其中植物表现出增高的作物产量的植物。在某些实施方案中,利用
包括DNA结合蛋白(例如,锌指蛋白、TAL效应结构域)和功能结构域的融合蛋白改变了内源
性MDH基因的表达。在某些实施方案中,植物细胞含有MDH基因的靶向性修饰(例如,mMDH),
其中通过核酸酶来诱导降低MDH表达的靶向修饰,所述核酸酶例如,包含DNA结合结构域和
切割内源基因并降低其表达的功能结构域的融合蛋白(例如,锌指核酸酶)。修饰(例如,缺
失、替换和/或插入)可以是,例如,对于MDH基因的NADH结合区内的一个或多个氨基酸(例
如,基因的第一和/或第二NADH结合区)。在某些实施方案中,修饰包括改变植物细胞中的内
源MDH基因的第一和/或第二NADH结合区中的一个或者多个氨基酸,例如,相对于野生型MDH
氨基酸序列(例如,SEQ ID NO:1(野生型番茄MDH序列),SEQ ID NO:126(野生型玉米MDH序
列)和/或SEQ ID NO:125(野生型大豆MDH序列))编号和联配的第104‑136位和/或第171‑
220位的一个或多个氨基酸(例如,图10)。
[0017] 锌指蛋白可包括显示在表1A中的一个单行中和/或与表1B中所示的靶序列相结合的识别螺旋区。在另外的实施方案中,核酸酶包含TAL效应结构域,归巢内切核酸酶(homing 
endonuclease)和/或Crispr/Cas单向导RNA。MDH表达的靶向改变(例如,靶向性基因组修
饰)可增强或降低MDH活性,例如,通过制造导致基因产物的异常转录的突变来降低MDH活性
(例如,经由移码;新的终止密码子或其他突变来进行)。在某些实施方案中,利用核酸酶进
行的靶向修饰包括小的插入和/或缺失,也称作插入和缺失(indel),例如,表4中所示的
indel。细胞中的修饰可以是对一种或多种等位基因的修饰(例如,旁系同源基因中的纯合
子和杂合子)。这里所描述的任何植物细胞可属于植物或植物部分(例如,种子、花、果实),
例如,任何品种的番茄(例如,M82或Moneymake),大豆、玉米、土豆、苜蓿等。
[0018] 在另一方面,这里所描述的是特异性结合MDH基因的DNA结合结构域(例如,锌指蛋白(ZFP))。锌指蛋白可包含一个或者多个锌指(例如,2个、3个、4个、5个、6个、7个、8个、9个
或者更多个锌指),且可经基因工程化以结合于任意MDH基因中的任何序列。本文所描述的
任何锌指蛋白可结合MDH的编码序列中或邻近序列(比如启动子或者其他表达元件)中的靶
位点,只要实现了MDH表达的修饰。在某些实施方案中,锌指蛋白结合于mMDH基因中的靶位
点,比如,如表1B中所示的靶序列。在另外的实施方案中,组分锌指的识别螺旋区按指1到指
5(F1到F5)或指1到指6(F1到F6)来排序,如表1A中的单行所示。锌指蛋白的一个或多个锌指
结合结构域组分可以是规范的(C2H2)锌指,或是非规范的(例如,C3H)锌指(例如,N端和/或
C端锌指可以是非规范锌指)。
[0019] 在另一方面,本文所公开的是融合蛋白,每个融合蛋白包括与一个或多个MDH基因特异性结合的DNA结合结构域(比如,锌指蛋白)。在某些实施方案中,蛋白是融合蛋白,所述
融合蛋白包含MDH结合锌指蛋白和功能结构域,例如,转录激活结构域、转录抑制结构域和/
或裂解结构域(或裂解半结构域)。在某些实施方案中,融合蛋白是锌指核酸酶(ZFN)。裂解
结构域和裂解半结构域可从不同的限制性内切酶或者归巢核酸内切酶获取。在一个实施方
案中,裂解半结构域源自IIS型限制性内切酶。
[0020] 在另外的方面,本文提供了编码本文所描述的任何DNA结合结构域(例如,锌指蛋白)和/或融合蛋白的多核苷酸。在某些实施方案中,本文所描述的是包括编码本文所描述
的一种或多种ZFP的多核苷酸的ZFP表达载体,所述多核苷酸与启动子上可操作地连接。在
一个实施方案中,一种或多种ZFP是ZFN。
[0021] ZFP和含有这些ZFP的融合蛋白可结合和/或切割基因中编码区内或基因中非编码序列或与基因临近的非编码序列中的一种或多种MDH基因(例如,mMDH基因),比如,例如,前
导序列、尾随序列或内含子、或启动子序列、或在编码区的上游或下游的非转录的区域内。
在某些实施方案中,ZFP或ZFN结合和/或切割MDH基因的编码序列或调控序列。
[0022] 在另一方面,本文所描述的是含有如本文所描述的一种或多种蛋白、融合蛋白和/或多核苷酸的组合物。植物细胞可包含一种独特的MDH基因靶标或多个旁系同源的MDH靶
标。因此,本文所描述的组合物可包含靶向植物细胞中的一种或多种MDH基因的一种或多种
含ZFP的蛋白(和编码其的多核苷酸)。ZFP可靶向植物细胞中的全部旁系同源基因或同源基
因和选择的特定的旁系同源基因或同源基因,或一些旁系同源基因和一些同源基因的组
合。
[0023] 在另一方面,本文提供的是用于在植物细胞中改变一种或多种MDH基因(例如,内源mMDH基因)的表达的方法,该方法包括,在细胞中表达一种或多种含有蛋白(如锌指蛋白)
的DNA结合结构域,从而改变MDH的表达。在某些实施方案中,方法包括采用一对锌指核酸酶
(蛋白和/或编码所述蛋白的多核苷酸)来构建破坏MDH表达的小的插入和/或缺失
(“indel”)。在另外的实施方案中,方法包括利用一对锌指核酸酶来增强MDH表达,比如通过
靶向插入转基因或表达增强元件。在另外的实施方案中,改变MDH表达的方法包括采用一种
或多种锌指转录因子(包含MDH结合锌指蛋白和作为转录调控结构域诸如激活结构域或抑
制结构域的功能结构域的融合蛋白)。在某些实施方案中,改变的MDH表达/功能在植物细胞
中产生了增强的光合作用。在某些实施方案中,改变的MDH表达/功能在植物细胞中产生了
对柠檬酸循环的修饰。在某些实施方案中,改变的MDH表达/功能导致了植物细胞内更高水
平的苹果酸(酯)。在另外的实施方案中,MDH的改变的表达/功能导致了细胞中降低的OAA水
平。在一个实施方案中,植物细胞中的改变的MDH表达/功能产生了具有增加的产量的植物。
在某些实施方案中,这种产量的增加导致获得的每个果实的鲜重增加且从突变植物的第一
穗束(truss)收获的所有果实的总鲜重增加。
[0024] 在另一方面,本文提供的是核酸和抗体,和利用其的方法,以用于检测和/或测量对MDH基因的改变的表达和修饰。
[0025] 在另一方面,本文所描述的是用于修饰细胞中的一种或多种MDH基因的方法。在某些实施方案中,方法包括:(a)将一种或多种蛋白形式的核酸酶和/或一种或多种表达载体
导入到所述植物细胞中,所述一种或多种表达载体编码在表达核酸酶(例如,ZFN)并切割一
种或多种MDH基因的条件下与一种或多种MDH基因中的靶位点结合,从而修饰一种或多种
MDH基因的一种或多种核酸酶(例如,ZFN)。在某些实施方案中,至少一个靶位点在mMDH基因
中。在另外的实施方案中,超过一个MDH基因被切割。并且,在任何本文所描述的方法中,一
种或多种基因的切割可导致切割的区域中核苷酸的缺失、增加和/或替代,例如,从而改变
MDH活性(例如,增强了或降低了)。
[0026] 在又一方面,本文描述的是用于将外源序列(转基因)导入到植物细胞的基因组中从而改变植物细胞中的MDH活性的方法,该方法包括如下步骤:(a)将外源序列(供体载体)
与细胞接触;和(b)在细胞中表达如本文所描述的一种或多种核酸酶(例如,锌指核酸酶),
其中一种或多种核酸酶切割染色体DNA;从而步骤(b)中的染色体DNA的切割刺激供体载体
通过同源重组掺入到基因组中。在某些实施方案中,外源序列被导入到MDH基因中。在另外
的实施方案中,外源序列被导入到MDH基因附近。MDH活性可能增加或减少。在本文描述的任
何方法中,所述一种或多种核酸酶可以是IIs型限制性内切酶的切割结构域和基因工程化
的锌指结合结构域之间的融合物。在另外的实施方案中,核酸酶包括归巢核酸内切酶,比如
携带修饰后的DNA结合结构域的归巢核酸内切酶。在本文所描述的任何方法中,外源序列可
编码蛋白产物。
[0027] 在又一方面,还提供根据本文所述的任一方法获得的植物细胞。
[0028] 另一方面,本文中提供包含本文所述植物细胞的植物。
[0029] 另一方面,本文中提供来自包含如本文所述获得的植物细胞的植物的种子。
[0030] 另一方面,本文中提供从包含如本文所述获得的植物细胞的植物得到的果实。
[0031] 在本文所述的任一组成(细胞或植物)或方法中,植物细胞可以包括单子叶或双子叶植物细胞。在某些实施方案中,植物细胞是作物植物,如番茄(或其他水果作物),土豆,玉
米,大豆,苜蓿(alfalfa)等。

附图说明

[0032] 图1是来自番茄(Solanum lyocpersicum)(v.M82)的线粒体MDH(mMDH)基因的各结构要素的示意图。
[0033] 图2,版面A和B是番茄线粒体苹果酸脱氢酶(mMDH)基因的基因组结构和序列。图2A显示了在外显子1,3,4和6中ZFN(位于外显子上方左右指向的短箭头)的目标位点。图2A中
标注的ZFN结合序列号与表1中所述的ZFN编号相对应;表1中的107830L在图2A中描述为
830L;表1中的107830R在图2中描述为830R;表1中的107832L在图2A中描述为832L;表1中的
107832R在图2A中描述为832R;表1中的107833L在图2A中描述为833L;表1中的107833R在图
2A中描述为833R;表1中的107835L在图2A中描述为835L,表1中的107835R在图2A中描述为
835R。图2B(SEQ ID N0:2)显示了mMDH基因座的序列;下划线部分为外显子,ZFN目标位点用
粗体标出。
[0034] 图3为pKG7479质粒图谱的示意图。
[0035] 图4为pKG7480质粒图谱的示意图。
[0036] 图5为pKG7481质粒图谱的示意图。
[0037] 图6为pKG7482质粒图谱的示意图。
[0038] 图7显示的是通过原生质体中ZFN活性向番茄mMDH基因中引入的小插入或缺失(“indels”)的序列分析。ZFN在番茄原生质体中瞬时表达,通过HRM分析检测插入或缺失
(indels)。每个ZFN的mMDH目标位点显示为结合位点带下划线。包含有缺失(以‑表示)或插
入(粗体)的扩增产物显示在每个目标序列的下方。
[0039] 图8,版面A和B,是在F2植物中显示mMDH活性的图。图8A显示了在源自系107832_9‑6(‑3bp indel)的F2植物中mMDH活性的测量的图。“126 9‑6 WT”表示缺少indel突变的F2植
物的生化测定结果,“115 9‑6M”表示的是对indel突变纯合的F2植物,而“132 9‑6H”表示对
indel突变杂合的F2植物。图8B示出了在源自系107832_10‑2(‑2bp indel)的F2植物中mMDH
活性的测量的图。WT48表示缺少indel突变的F2植物,“M60”表示对indel突变纯合的F2植
物,“H32”表示对indel突变杂合的F2植物。
[0040] 图9示出了系107832 9‑6的番茄果实产量的图。Y轴显示了对于针对在mMDH基因座中‑3bp突变分离的3类F2植物的平均番茄重量(g)。“WT”表示缺少indel的F2植物,“Het”表
示对indel杂合的F2植物,而“Homo”表示对indel纯合的F2植物。
[0041] 图10显示的是大豆(SEQ ID NO:125),玉米(SEQ ID NO:126),和番茄(SEQ ID NO:1)的mMDH酶的序列比对图。
[0042] 图11显示的是在番茄基因组中发生的mMDH突变的序列比对图。
[0043] 图12显示的是由mMDH酶催化的生化反应的示意图。
[0044] 图13显示的是野生型和两种突变番茄mMDH酶的比活性示意表,通过分光光度计监测NADH氧化进行测量。“mMDH del3”突变体保持了野生型酶的约23%的活性,“mMDH del3 
NADH BS1”突变的活性显著减弱为野生型酶活性的约1.5%。
[0045] 发明详述
[0046] 本文涉及用于改变植物细胞或植物中一个或多个苹果酸脱氢酶(MDH)基因表达的方法和组合物(compositions),例如MDH基因如植物细胞(玉米,番茄,大豆(soy)等)中的线
粒体苹果酸脱氢酶(mMDH)基因的靶向性基因组修饰。特别是,通过使用含有DNA结合域(如
锌指蛋白)和功能域(如转录调控域和/或核酸酶)的融合蛋白来改变MDH的表达。在某些实
施方案中,靶向性修饰是通过采用一个或多个核酸酶(如ZFN)切割MDH基因,在MDH基因处产
生修饰(如突变)而获得的。切割是靶向性的,通过采用包括DNA结合域如大范围核酸酶DNA‑
结合域(meganuclease DNA‑binding domain),亮氨酸拉链(leucine zipper)DNA结合域,
TAL DNA融合域,锌指蛋白(ZFP),Crispr/Cas系统或如前所述的嵌合组合的融合蛋白来完
成。在某些实施方案中,修饰包括MDH基因的突变(替换,删除,和/或插入),从而使内源MDH
基因的第一和/或第二NADH结合区中一个或多个氨基酸被改变,比如,相对于SEQ ID NO:1
(野生型番茄MDH序列),SEQ ID NO:125(野生型玉米MDH序列)和/或SEQ ID NO:126(野生型
大豆MDH序列)编号和联配的一个或多个位于104‑136和/或171‑220位置上的氨基酸。
[0047] 在某些实施方案中,核酸酶包括一个或多个ZFN。ZFN一般包括切割域(cleavage domain)(或切割半域(cleavage half‑domain))和结合在内源MDH基因目标位点上的锌指
结合域。可以以蛋白质,编码这些蛋白质的多核苷酸,和/或多肽与编码多核苷酸的多肽的
组合物的形式引入ZFN。锌指核酸酶通常以在切割半域二聚作用后的二聚体蛋白形式起作
用,并可形成同二聚体或异二聚体。已描述了专性(obligate)异二聚体ZFN,其中结合“左”
和“右”识别域的ZFN单体可联合以形成活性核酸酶。参见如美国专利公布号2008/0131962。
因此,当给出合适的目标位点,“左”单体可以与任意“右”单体形成有活性的ZF核酸酶。在经
过证实的左和右域可以用在不同组合的基础上,显著增加了有用的核酸酶位点的数量。例
如,4个同二聚体ZF核酸酶的结合位点的重新组合产生12个额外的异二聚体ZF核酸酶。更重
要的是,它使对转基因设计的系统研究成为可能,从而每个新引入的外源序列(转基因)侧
翼为独特的ZFN位点,该位点可用于切除基因或靶向其附近的别的基因。另外,这一方法简
化了由ZFN依赖性双链断裂驱动的堆积入单基因座的策略。
[0048] 锌指结合域可以是规范性(C2H2)锌指或非规范性(如C3H)的锌指。另外,锌指结合区可以包括一个或多个锌指(如,2,3,4,5,6,7,8,9或更多个锌指),还可以工程化为与任意
MDH基因内任意序列相结合。用于结合MDH基因的示例性MDH结合锌指蛋白的识别螺旋区显
示在表1A中,且MDH基因中示例性目标位点显示在表1B中。这类融合蛋白(或蛋白质和/或编
码该融合蛋白的多核苷酸)在细胞中的存在,会导致融合蛋白结合至其结合位点并在MDH基
因内切割。
[0049] 一般概述
[0050] 实施所述方法,以及准备和使用所述组合物,除非另外指出,传统的分子生物学技术,生物化学,核染色质的结构和分析,计算机化学,细胞结构,DNA重组和相关领域都属于
现有技术的范畴。这些技术在文献中都有详细的阐述。参见,例如,Sambrook等MOLECULAR 
CLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor Laboratory出版社,1989和
第三版,2001;Ausubel等,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley & 
Sons,纽约,1987和定期的更新;METHODS IN ENZYMOLOGY系列,Academic出版社,圣地亚哥;
Wolffe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic出版社,圣地亚哥,1998;
METHODS IN ENZYMOLOGY,卷304,"Chromatin"(P.M.Wassarman and A.P.Wolffe,编),
Academic出版社,圣地亚哥,1999;和METHODS IN MOLECULAR BIOLOGY,卷119,"Chromatin 
Protocols"(P.B.Becker,ed.)Humana出版社,托托瓦,1999。
[0051] 定义
[0052] 术语“核酸”“多核苷酸”和“寡核苷酸”是可互换的,指代线性或环形构象,单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。就本公开目的而言,这些术语不解释为
对聚合物长度的限定。该术语可包括已知的天然核苷酸的类似物,以及碱基、糖和/或磷酸
根模块(如,硫代磷酸骨架(phosphorothioate backbones))中经修饰的核苷酸。一般而言,
特定核苷酸的类似物具有相同的碱基配对特异性,即A的类似物将与T配对。
[0053] 术语“多肽”、“肽”和“蛋白质”是可互换的,指代氨基酸残基的聚合物。该术语也适用于氨基酸聚合物,其中一个或多个氨基酸是相应的天然产生的氨基酸的化学类似物或修
饰后的衍生物。
[0054] “结合”指代大分子(如,蛋白质和核酸之间)之间序列特异性的,非共价的相互作用。并非所有结合相互作用的成分都需要序列特异性(如,与DNA骨架中的磷酸根/盐残基相

接触),只要相互作用作为整体是序列特异性的。这种相互作用一般以解离常数(Kd)为10
6 ‑1
M 或者更低为特点。“亲和力”指代结合的强度:结合亲和力增加则Kd降低。
[0055] “结合蛋白”是一种能结合另一分子的蛋白质。结合蛋白可结合到,如,DNA分子(DNA结合蛋白),RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)上。在蛋白质
结合蛋白中,它可与自身结合(形成同二聚体,同三聚体等)和/或结合到一个或多个不同的
蛋白质分子上。结合蛋白可具有超过一种类型的结合活性。如,锌指蛋白具有DNA结合,RNA
结合和蛋白质结合的活性。
[0056] “锌指DNA结合蛋白”(或结合域)是一种蛋白质,或一种更大蛋白质内的域,其通过一个或多个锌指以序列特异性的方式结合DNA,所述锌指是结合域内的氨基酸序列区域,其
结构通过与锌离子的配位而稳定。术语锌指DNA结合蛋白通常简称为锌指蛋白或ZFP。
[0057] 锌指结合域可被“工程化”为结合预定的核苷酸序列。用于工程化锌指蛋白的方法的非限制性例子是设计和选择。设计的锌指蛋白是非自然界产生的蛋白质,其设计/组成主
要来自合理的标准(rational criteria)。用于设计的合理的标准包括应用替换原则和计
算机化算法对存储已有ZFP设计和结合数据的信息的数据库进行信息处理。参见,如美国专
利6,140,081;6,453,242,和6,534,261;以及WO98/53058;WO98/53059;WO98/53060;WO02/
016536和WO03/016496。
[0058] “选择”的锌指蛋白是一种未见于自然界的蛋白质,其产生主要来自经验过程,如噬菌体展示,相互作用捕获(interaction trap),或杂合选择。参见如US5,789,538;US5,
925,523;US6,007,988;US6,013,453;US6,200,759;WO95/19431;WO96/06116;WO98/53057;
WO98/54311;WO 00/27878;WO 01/60970;WO 01/88197和WO 02/099084。
[0059] 术语“序列”指代任意长度的核苷酸序列,可以为DNA或RNA,线形,环形或分支形,单链或双链。术语“供体序列”指代插入基因组中的核苷酸序列。供体序列可以为任意长度,
如长度在2‑10,000个核苷酸之间(或其间或其上的任意整数),优选长度在100‑1,000个核
苷酸之间(或其间任意整数),更优选长度在200‑500核苷酸之间。
[0060] “同源,非同一序列”指代与第二序列具有一定程度的序列同一性,但其序列与第二序列的不相同的第一序列。比如,包括突变基因的野生型序列的多核苷酸对于突变基因
序列是同源和非同一的。在某些实施方案中,两条序列之间的同源程度足以允许其间利用
正常的细胞机制产生同源重组。两条同源非同一序列可以为任意长度,并且其非同源程度
可以小至一个单一核苷酸(如,通过靶向同源重组修正基因组的点突变)或大至10或更多千
个碱基(如,在染色体上预先确定的异位位点插入基因)。两个包括同源非同一序列的多核
苷酸不需要长度相同。例如,长度在20‑10,000个核苷酸或核苷酸对的外源多核苷酸(如,供
体多核苷酸)可以被使用。
[0061] 检测核酸和氨基酸序列同一性的技术是现有技术已知的。典型地,这类技术包括检测基因的mRNA的核苷酸序列和/或检测由此编码的氨基酸序列,以及将这些序列与第二
核苷酸或氨基酸序列比较。基因组序列也可通过这一方式进行测定和对比。通常,同一性指
代分别在两条多核苷酸或多肽序列中准确的核苷酸对核苷酸或氨基酸对氨基酸的一致性。
两条或更多条序列(多核苷酸或氨基酸)可通过检测同一性百分数进行对比。两条序列(无
论核苷酸或氨基酸序列)的同一性百分数,是两条联配的序列之间准确匹配的数目,除以较
短序列的长度再乘以100获得的。核酸序列的大致联配由Smith和Waterman,Advances in 
Applied Mathematics 2:482‑489(1981)中的局部同源算法(local homology algorithm)
所提供。该算法可应用于氨基酸序列,通过使用Dayhoff,Atlas of Protein Sequences 
and Structure,M.O.Dayhoff ed.,5suppl.3:353‑358,国家生物医学研究基金,华盛顿,
D.C.,美国中开发的计分矩阵(scoring matrix),并通过Gribskov,Nucl.Acids Res.14
(6):6745‑6763(1986)进行标准化。示例性执行该算法以测定序列同一性百分比由
Genetics Computer Group(Madison,WI)"BestFit"实用新型申请(utility application)
中提供。用于计算序列之间同一性或相似性百分比的适用程序是现有技术已知的,例如,另
一种比对程序是BLAST,在缺省参数下使用。例如,BLASTN和BLASTP可使用以下缺省参数进
行:遗传码=标准;过滤器=无;链数=双链;截留=60;期望值=10;矩阵=BLOSUM62;描述
=50个序列;分类依据=HIGH SCORE;数据库=non‑redundant,GenBank+EMBL+DDBJ+PDB+
GenBank CDS translations+Swiss protein+Spupdate+PIR。这些程序的细节可在网上查
询。关于本文所述序列,期望的序列同一性程度的范围为约80%到100%以及其间任意整数
值。典型地,序列间同一性百分比至少为70‑75%,优选80‑82%,更优选85‑90%,甚至更优
选92%,仍更优选95%,且最优选98%。
[0062] 或者,多核苷酸之间的序列相似性程度可通过在允许同源区域之间形成稳定双链体,随后通过单链特异性核酸酶消化,通过消化后的片段来确定大小的条件下的多核苷酸
杂交来确定。当两条核酸或两条多肽序列显示出在一限定分子长度上具有至少约70‑75%,
优选80‑82%,更优选85‑90%,甚至更优选92%,仍更优选95%,最优选98%的序列同一性
时,这两条序列是基本上同源的,如使用上文方法测定的。如本文使用的,基本上同源也指
代对于特定DNA或多肽序列显示完全同一性的序列。基本同源的DNA序列可通过Southern杂
交试验,例如在由特定系统界定的严格条件下进行确定。合适的杂交条件的确定对于本领
域技术人员是已知的。(参见,如,Sambrook等,见上文;Nucleic Acid Hybridization:A 
Practical Approach,B.D.Hames和S.J.Higgins编辑,(1985)牛津大学,华盛顿,DC;IRL出
版社)。
[0063] 两条核酸片段的选择性杂交如下测定。两个核酸分子的序列同一性程度影响这类分子之间杂交事件的效率和强度。部分相同的核酸序列会至少部分的抑制完全相同序列对
目标分子的杂交。完全相同序列的杂交抑制,可通过现有技术已知的杂交试验(如,
Southern(DNA)blot,Northern(RNA)blot,溶液杂交,等,参见Sambrook等人,Molecular 
Cloning:A Laboratory Manual,Second Edition,(1989)Cold Spring Harbor,N.Y.)进行
评估。这些实验可采用不同程度的选择性,例如,采用条件从低到高严格度变化来进行。如
果使用低严格度条件,非特异性结合的缺失可通过次级探针(secondary probe)来评估,次
级探针缺少甚至部分程度的序列同一性(如,具有与目标分子低于约30%序列同一性的探
针),这样,在非特异性结合事件缺失时,次级探针不会与目标杂交。
[0064] 当使用基于杂交的检测系统,选择与参考(reference)核酸序列互补的核酸探针,然后通过选择合适的条件,探针与参考序列彼此选择性杂交或结合以形成双链体分子。能
够与参考序列在适度严格的杂交条件下选择性杂交的核酸分子,通常在如下条件下杂交,
该条件允许检测具有与选择的核酸探针序列至少约70%的序列同一性的、长度至少约10‑
14个核苷酸的目标核酸序列。严格杂交条件典型地允许检测与选择的核酸探针序列具有高
于约90‑95%的序列同一性,长度至少为至少约10‑14个核苷酸的目标核酸序列。可如本领
域中已知地确定可用于探针/参考序列杂交的杂交条件,其中探针和参考序列具有特定的
序列同一性程度(参见,例如,Nucleic Acid Hybridization:A Practical Approach,
B.D.Hames and S.J.Higgins编辑,(1985)牛津大学,华盛顿,DC;IRL出版社)。
[0065] 杂交条件是本领域技术人员已知的。杂交的严格度指杂交条件不利于含有错配的核苷酸的杂合体形成的程度,更高的严格度对应对错配杂合体的更低的容忍度。影响杂交
严格度的因素是本领域技术人员已知的,包括但不限于,温度,pH,离子强度,和有机溶剂例
如甲酰胺和二甲基亚砜的浓度。本领域技术人员已知,更高温度,更低离子强度和更低的溶
剂浓度会提高杂交严格度。
[0066] 关于杂交的严格度条件,本领域已知可以采用许多等价条件来建立特定的严格度,这通过改变例如如下因素:探针序列的长度和性质(nature),各种序列的碱基组成,盐
浓度,和其他杂交溶液成分,杂交溶液中阻滞剂的存在(如硫酸葡聚糖和聚乙二醇),杂交反
应温度和时间参数,以及不同的清洗条件。按照本领域中的标准方法选择一系列特定的杂
交条件(参见,例如,Sambrook,等人,Molecular Cloning:A Laboratory Manual,第二版,
(1989)Cold Spring Harbor,纽约)。
[0067] “重组”指代两条多核苷酸之间的遗传信息的交换过程。就本公开目的而言,“同源重组(HR)”指代例如在细胞内双链断裂的修复时发生的特定的这类交换形式。这一过程要
求核苷酸序列同源性,其使用“供体”分子来模板修复“目标”分子(即经过双链断裂的分
子),并被称为“非交叉基因转换”(non‑crossover gene conversion)或“短束基因转换”
(short tract gene conversion),因为这导致遗传信息从供体到目标的转移。不期望被任
何特定理论约束,这种转移可涉及在断裂目标和供体之间形成的异双链DNA的错配修正,
和/或“合成依赖性链退火”,其中供体被用于重新合成将作为目标和/或相关过程的一部分
的遗传信息。这种特定的HR通常导致目标分子序列的改变,以致部分或全部供体多核苷酸
序列被掺入目标多核苷酸。
[0068] “切割/分裂(cleavage)”指代DNA分子共价骨架的破裂。切割可通过多种方法引起,包括但不限于,对磷酸二酯键的酶或化学水解作用。单链分裂和双链分裂都是可能的,
且双链分裂可由两个不同的单链分裂事件引起。DNA分裂可导致平末端或粘性末端
(staggered ends)的产生。在某些实施方案中,融合多肽用于靶向性双链DNA分裂。
[0069] “分裂域”包括一个或多个具有DNA分裂催化活性的多肽序列。分割域可包含在单一多肽链中,或者分裂活性可由两条(或更多条)多肽的联合而产生。
[0070] “分裂半域”是多肽序列,其与第二多肽(无论相同与否)联合,形成具有分裂活性(优选双链分裂活性)的复合物。
[0071] “工程化的分裂半域”是分裂半域,其被修饰以与另一分裂半域(例如,另一工程化的分裂半域)形成专性异二聚体(obligate heterodimers)。参见美国专利第2005/
0064474,30070218528和2008/0131962,所有内容通过引文被合并引入。
[0072] “染色质”("Chromatin")是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白质(包括组蛋白和非组蛋白染色体蛋白质)。大部分真核细胞染色质以
核小体的形式存在,其中核小体核心包含与八聚体联合的大约150个DNA碱基对,所述八聚
体包含组蛋白H2A,H2B,H3,H4每种的各两个;还有在核小体核心之间延伸的接头DNA(根据
生物体不同,长度可变)。H1组蛋白分子一般与接头DNA联合。就本公开目的而言,术语“染色
质”意图涵盖所有类型的细胞核蛋白,包括原核和真核细胞的。细胞染色质包括染色体和附
加体染色质。
[0073] “染色体”是染色质复合物,包括细胞全部或部分的基因组。细胞的基因组通常由染色体组型表征,染色体组型是包含细胞基因组的所有染色体的集合。细胞的基因组可包
含一个或多个染色体。
[0074] “附加体”是复制的核酸、核蛋白质复合物或包含并非细胞染色体组型一部分的核酸的其他结构。附加体的例子包括质粒和某些病毒基因组。
[0075] “可接近(accessible)区域”是细胞染色质内的位点,在该处核酸中存在的目标位点可被识别目标位点的外源分子结合。不希望受任何特定理论约束地,认为可接近区域是
没有包装入核小体结构内的区域。可接近区域的独特结构通常可通过其对化学和酶探针,
例如核酸酶的敏感性被探测。
[0076] “目标位点/靶位点”或“目标序列/靶序列”是一种核酸序列,其限定在存在足以结合的条件时结合分子将结合的核酸部分。例如,序列5'‑GAATTC‑3'是限制性内切酶EcoRl的
目标位点。
[0077] “外源”分子是一种正常不存在于细胞中,但可通过一种或多种遗传、生化或其他方法引入细胞的分子。“正常存在在细胞中”是依照细胞的特定发育阶段和环境条件而确定
的。如此,例如,仅在花的早期发育阶段存在于细胞中的分子相对于完全发育的花的细胞是
外源分子。类似地,相对于无热冲击细胞而言,通过热冲击诱导的分子是外源分子。外源分
子可以包括,例如,任意多肽或其片段的编码序列,功能故障的内源分子的功能型
(functioning version),或正常发挥功能的内源分子的功能故障型(malfunctioning 
version)。另外,外源分子可包括来自另一物种的与宿主细胞内源基因旁系同源的编码序
列。
[0078] 外源分子可以是小分子,如通过组合化学过程产生的小分子,或大分子,如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子任意修饰的衍生物,或包括上
述一个或多个分子的任意复合物等。核酸包括DNA和RNA,可以为单链或双链;可以为线形,
分支形或环形;可以为任意长度。核酸包括能形成双链体以及三链体核酸的核酸。参见,例
如美国专利5,176,996和5,422,251。蛋白质包括但不限于,DNA结合蛋白,转录因子,染色质
重塑因子(chromatin remodeling factors),甲基化的DNA结合蛋白,聚合酶,甲基化酶,脱
甲基酶,乙酰基转移酶,脱乙酰酶,激酶,磷酸酶,整合酶,重组酶,连接酶,拓扑异构酶,促旋
酶和螺旋酶(helicase)。如此,该术语包括“转基因”或“感兴趣的基因(genes of 
interest)”,其是引入植物细胞,例如引入植物细胞的MDH基因中的外源序列。
[0079] 外源分子可以与内源分子的分子类型相同,例如,为外源蛋白质或核酸。举例来说,外源核酸可以包括感染病毒的基因组,引入细胞的质粒或附加体,或正常不存在于细胞
中的染色体。将外源分子导入细胞的方法对本领域技术人员是已知的,包括但不限于,原生
TM
质体转化,碳化硅(silicon carbide)(如WHISKERS ),土壤杆菌(Agrobacterium)介导的转
化,脂质介导的转移(即脂质体,包括中性和阳离子脂质),电穿孔,直接注射,细胞融合,粒
子轰击(如使用“基因枪”),磷酸钙共沉淀,DEAE‑葡聚糖介导的转移和病毒载体介导的转
移。
[0080] 相比之下,“内源”分子是在一定环境条件下在特定发育阶段正常存在于特定细胞中的分子。例如,内源核酸可以包括染色体,线粒体、叶绿体或其他细胞器的基因组,或天然
存在的附加体核酸。其他内源分子可包括蛋白质,例如,转录因子和酶。
[0081] 本文所用的“外源核酸的产物”包括多核苷酸和多肽产物两者,例如,转录产物(多核苷酸如RNA)和翻译产物(多肽)。
[0082] “融合”分子是其中两个或多个亚单位分子连接(优选共价连接)的分子。亚单位分子可以是相同化学类型的分子,或者可以是不同化学类型的分子。融合分子的第一种类型
的例子,包括但不限于,融合蛋白质(例如,ZFP DNA结合域和分裂域之间的融合)和融合核
酸(例如,编码上述融合蛋白的核酸)。融合分子的第二种类型的例子,包括但不限于,形成
三链体的核酸与多肽之间的融合,以及小沟结合体(a minor groove binder)与核酸之间
的融合。
[0083] 细胞中融合蛋白的表达可来自于融合蛋白投递到细胞或编码融合蛋白的多核苷酸投递到细胞,其中该多核苷酸经过转录,转录物被翻译,产生融合蛋白。细胞内蛋白质的
表达也会涉及反式剪接、多肽切割和多肽连接。多核苷酸和多肽投递到细胞的方法在本公
开的别处记载。
[0084] 就本公开目的而言,“基因”包括编码基因产物(如上所述)的DNA区域,也包括调控基因产物生产的DNA区域,无论这类调控序列是否位于编码和/或转录序列的附近。因此,基
因包括但不限于,启动子序列,终止子,翻译调控序列如核糖体结合位点和内部核糖体进入
位点,增强子,沉默子,绝缘子,边界元件,复制起点,基质附着位点(matrix attachment 
sites)和基因座控制区(locus control regions)。
[0085] “基因表达”指基因中包含的信息转化至基因产物中。基因产物可以是基因直接转录的产物(如,mRNA,tRNA,反义RNA,核酶,结构RNA或任意其他种类的RNA)或mRNA翻译产生
的蛋白质。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和剪接(editing)修饰过
的RNA,以及通过例如,甲基化、乙酰化、磷酸化、泛素化、ADP核糖基化、豆蔻基化和糖基化修
饰的蛋白质。
[0086] 基因表达的“调控”指代基因活性中的改变。表达调控可包括但不限于基因的激活和抑制。
[0087] “植物”细胞包括但不限于,单子叶植物(monocot)细胞或双子叶植物(dicot)细胞。单子叶植物非限制性的例子包括谷类植物,如玉米、稻、大麦、燕麦、小麦、高粱、黑麦,甘
蔗,菠萝,洋葱,香蕉和椰子。双子叶植物非限制性的例子包括烟草,番茄,向日葵,棉花,甜
菜,土豆,莴苣,瓜,大豆,芸苔(canola)(油菜籽(rapeseed))和苜蓿。植物细胞可以来自植
物的任何部分和/或来自植物发育的任何阶段。
[0088] “感兴趣的区域”(region of interest)是细胞染色质的任意区域,例如,基因或基因内或其附近的非编码序列,期望其结合外源分子。结合的目的可以是靶向性DNA切割
和/或靶向性重组。感兴趣的区域可存在于,例如染色体,附加体,细胞器基因组(如,线粒
体,叶绿体),或感染病毒基因组中。感兴趣的区域可以在基因的编码区内,在转录的非编码
区内(如例如,前导序列,尾随序列或内含子),或在非转录区内,可位于编码区的上游或下
游。感兴趣的区域的长度可以小至单个核苷酸对或大至2,000个核苷酸对,或任意整数值的
核苷酸对。
[0089] 术语“可操作的连接”(“operative linkage”)和“可操作连接地”就两个或更多个组分(如序列元件)的并置而言是可互换的,其中组分被排列为使得两个组分的功能正常并
允许至少一个组分有能介导在至少一个其他组分上发挥的功能的可能性。举例说明,转录
调控序列如启动子与编码序列是可操作连接的,如果该转录调控序列应答一种或多种转录
调控因子的存在或缺失控制编码序列的转录水平。转录调控序列一般以顺式可操作的连接
于编码序列,但不需要直接与其相邻。例如,增强子是一种与编码序列可操作连接的转录调
控序列,即使它们是不相邻的。
[0090] 关于融合多肽,术语“可操作地连接”可指每个组分在与其他组分连接时实施与未被连接时的相同功能的情况。例如,对于ZFP DNA结合域融合分裂域的融合多肽,如果在融
合多肽中,ZFP DNA结合域部分能够结合它的目标位点和/或结合位点,同时分裂域能够在
目标位点附近分裂DNA,那么ZFPDNA结合域和分裂域即处于可操作的连接。
[0091] 蛋白质、多肽或核酸的“功能性片段”是其序列与全长蛋白质、多肽或核酸不同,但保留了与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能性片段与相应的
天然分子相比,可以具有更多、更少或相同数量的残基,和/或包含一个或多个氨基酸或核
苷酸取代。确定核酸功能(如编码功能,与另一核酸杂交的能力)的方法是现有技术已知的。
类似的,确定蛋白质功能的方法也是已知的。例如,多肽的DNA结合能力可以通过,例如过滤
结合(filter‑binding)、电泳迁移率变动实验、或免疫沉淀测定法来确定。DNA分裂可通过
凝胶电泳进行分析。参见Ausubel等,如上所述。蛋白质与另一蛋白质相互作用的能力可通
过,例如免疫共沉淀,双杂交实验或互补(基因的和生物化学的)方法来确定。参见,例如,
Fields等,(1989)Nature340:245‑246;美国专利No.5,585,245和PCT WO 98/44350。
[0092] DNA结合域
[0093] 任一DNA结合域均可在本文所述方法中使用。在某些实施方案中,DNA结合域包括锌指蛋白。锌指结合域包括一个或多个锌指。Miller等.(1985)EMBO J 4:1609‑1614;
Rhodes(1993)Scientific American Feb.:56‑65;美国专利No.6,453,242。本文所述锌指
结合域一般包括2,3,4,5,6或更多锌指。
[0094] 典型地,单个锌指域的长度约30个氨基酸。结构研究发现,每个锌指域(基序)含有两个beta层(保持在beta转角中,其含有两个不变的半胱氨酸残基)和一个alpha螺旋(包括
两个不变的组氨酸残基),通过两个半胱氨酸和两个组氨酸对锌原子的络合维持一种特定
的构象。
[0095] 锌指包括规范性C2H2锌指(即其中锌离子由两个半胱氨酸和两个组氨酸残基络合的那些锌指)和非规范性锌指,例如,C3H锌指(其中锌离子由三个半胱氨酸残基和一个组氨
酸残基络合的那些锌指)和C4锌指(其中锌离子由四个半胱氨酸残基络合的那些锌指)。关
于非规范性锌指ZFP在植物中的应用,亦参见WO  02/057293和美国专利公开
No.20080182332。
[0096] 工程化的锌指结合域相比天然存在的锌指蛋白,可具有新的结合特异性。工程化方法包括但不限于,合理的设计和多种选择类型。合理的设计包括,例如用包括三联体(或
四联体)核苷酸序列(triplet(or quadruplet)nucleotide sequence)和分别的锌指氨基
酸序列的数据库,其中每个三联体或四联体核酸序列与结合特定三联体或四联体序列的一
个或多个锌指的氨基酸序列联合。
[0097] 示例性选择方法包括噬菌体展示和两杂交系统,已公开在美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO 
98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237。
[0098] 锌指结合域结合特异性的增强已记载于例如WO 02/077227中。
[0099] 由于单个锌指结合三核苷酸(即三联体)序列(或四核苷酸序列,其可与邻近锌指的四核苷酸结合位点重叠一个核苷酸),将锌指结合域工程化以结合的序列(例如靶序列)
的长度将决定工程化的锌指结合域中锌指的数量。例如,对于其中锌指基序不与重叠亚位
点结合的ZFP,六核苷酸目标序列由两指结合域结合;九核苷酸目标序列由三指结合域结
合,等。如本文中记载的,在目标位点中单个锌指的结合位点(即亚位点)不需要相邻,而是
可以被一个或多个核苷酸分隔,这取决于在多指结合域中锌指之间的氨基酸序列(即指间
接头)的长度和性质。
[0100] 在多指锌指结合域中,相邻锌指可被约5个氨基酸(称为“规范性”指间接头)或一个或多个非规范性接头的氨基酸接头序列隔开。参见如,美国专利No.6,453,242和6,534,
261。对于包含多于三指的工程化的锌指结合域,在一些情况中可能期望在特定锌指间插入
更长的(“非规范”)指间接头,因为它可通过结合域增加结合的亲和力和/或特异性。参见,
例如美国专利6,479,626和WO 01/53480。因此,多指锌指结合域也可依据非规范性指间接
头的存在和位置进行表征。例如,包含3个锌指(由两个规范性指间接头连接),较长的接头
和三个另外的锌指(由两个规范性指间接头连接)的六指锌指结合域指示2x3构造。类似的,
包含两指(之间有规范性接头),较长的接头和两个另外的锌指(由规范性接头连接)的结合
域指示2x2构造。包含三个两指单位(每个两指单位中的两指均由规范性接头连接),且其中
每个两指单位通过较长接头连接到相邻两指单位的蛋白质指示为3x2构造。
[0101] 在多指结合域中两个相邻的锌指之间较长或非规范性指间接头的存在,通常允许两指结合目标序列中不直接相连的亚位点上。因此,在目标位点的亚位点之间可能存在一
个或多个核苷酸的间隙;即,目标位点可包括一个或多个锌指不接触的核苷酸。例如,一个
2x2的锌指结合域可结合被一个核苷酸隔开的两个六核苷酸序列上,即,它结合13个核苷酸
的目标位点。亦参见Moore等.(2001a)Proc.Natl.Acad.Sci.美国,98:1432‑1436;Moore等.
(2001b)Proc.Natl.Acad.Sci.美国98:1437‑1441以及WO 01/53480。
[0102] 如前面所讨论过的,靶亚位点(target subsite)是由单个锌指结合的三个或四个核苷酸的序列。出于某些目的,双指单元(two‑finger unit)被指代“结合模块”。结合模块
可以通过例如,在结合特定六核苷酸靶序列的多指蛋白(通常为三指蛋白)的背景中,选择
两个临近的指获得。可选地,可通过组装单个(individual)锌指的方式构建模块。还参见WO 
98/53057和WO 01/53480。
[0103] 或者,DNA结合域可衍生自核酸酶。例如,已知归巢核酸内切酶(homing endonucleases)和大范围核酸酶(如I‑SceI、I‑CeuI、PI‑PspI、PI‑Sce、I‑SceIV、I‑CsmI、I‑
PanI、I‑SceII、I‑PpoI、I‑SceIII、I‑CreI、I‑TevI、I‑TevII和I‑TevIII)的识别序列。还参
见美国专利号5,420,032;美国专利号:6,833,252;Belfort等人,(1997)Nucleic Acids 
Res.25:3379‑3388;Dujon等人,(1989)Gene 82:115‑118;Perler等人,(1994)Nucleic 
Acids Res.22,1125‑1127;Jasin(1996)Trends Genet.12:224‑228;Gimble等人,(1996)J 
Mol.Bioi.263:163‑180;Argast等人,(1998)J Mol.Biol.280:345‑353和New England 
Biolabs catalogue。此外,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可工程化为
结合非天然靶位点。见例如Chevalier等人,(2002)Malec.Cell 10:895‑905;Epinat等人,
(2003)Nucleic Acids Res.31:2952‑2962;Ashworth等人,(2006)Nature 441:656‑659;
Paques等人,(2007)Current Gene Therapy 7:49‑66;美国专利公开号20070117128。
[0104] 或者,DNA结合域可衍生自亮氨酸拉链蛋白。亮氨酸拉链是一类参与在多种真核生物调控蛋白(所述调控蛋白是与基因表达相关的重要转录因子)中蛋白‑蛋白的相互作用的
蛋白质。亮氨酸拉链指在这些跨越包括动物、植物、酵母等多个界的转录因子中共享的共同
结构基序。亮氨酸拉链由两条多肽(同二聚体或异二聚体)形成,所述多肽以其中亮氨酸残
基在α‑螺旋中均匀地隔开,使得两条多肽的亮氨酸残基在螺旋的同一面上结束的方式结合
特定的DNA序列。可在本文中公开的DNA结合域中利用所述亮氨酸拉链的DNA结合特异性。
[0105] 在一些实施方案中,DNA结合域是来自衍生于植物病原菌黄单胞菌(Xanthomonas)的TAL效应子的工程化结构域(见Miller等人,(2011)Nature Biotechnology 29(2):143‑
8;Boch等人,(2009)Science 29 Oct 2009(10.1126/science.117881)和Moscou和
Bogdanove,(2009)Science 29 Oct 2009(10.1126/science.1178817;和美国专利公开号
20110239315,20110145940和20110301073),通过提述完整引入本文。
[0106] CRISPR(间隔规律的成簇短回文重复)/Cas(CRISPR相关的)核酸酶系统是最近工程化的核酸酶系统,该系统基于能用于基因组工程的细菌系统。其基于多种细菌和古细菌
的部分适应性免疫应答。当病毒或质粒入侵细菌时,入侵者DNA的片段通过“免疫”应答被转
换成CRISPR RNA(crRNA)。这种crRNA之后通过部分互补区域与另一类称为tracrRNA的RNA
相关联以引导Cas9核酸酶到与目标DNA中crRNA同源的区域中(称为“protospacer”)。Cas9
切割DNA以在DSB中由包含于crRNA转录本中的20‑核苷酸引导序列所指定的位点处产生平
末端。Cas9需要crRNA和tracrRNA两者进行位点特定性的DNA识别和切割。该系统现在已经
被工程化从而可以将crRNA和tracrRNA合并到一个分子内(“单一引导RNA”),且所述单一引
导RNA的crRNA等同部分可被工程化以引导Cas9核酸酶靶向任何期望序列(见Jinek等人
(2012)Science 337,p.816‑821,Jinek等人,(2013),eLife 2:e00471,和David Segal,
(2013)eLife 2:e00563)。因此CRISPR/Cas系统可被工程化以在基因组的期望靶点处创建
双链断裂(DSB),以及可通过使用修复抑制剂影响DSB的修复以导致易错修复的增加。
[0107] 切割结构域
[0108] 如上所述,DNA结合域可与切割(核酸酶)结构域联合。例如,归巢内切核酸酶可以在其DNA结合特异性中修饰,并保留核酸酶功能。此外,锌指蛋白可同样与切割结构域融合
以形成锌指核酸酶(ZFN)。本文中公开的融合蛋白的切割结构域部分可从任何核酸内切酶
或核酸外切酶中获得。示例性的可衍生切割结构域的核酸内切酶包括,但不限于,限制性核
酸内切酶和归巢核酸内切酶。见,例如2002‑2003 Catalogue New England Biolabs,MA;和
Belfort等人,(1997)Nucleic Acids Res。其他的切割DNA的酶是已知的(如S1核酸酶;绿豆
核酸酶;胰DNA酶I;微球菌核酸酶;酵母HO内切核酸酶;也参见Linn等人,(编)Nucleases,
Cold Spring Harbor Laboratory Press,1993)).归巢内切核酸酶和大范围核酸酶的非限
定的例子包括I‑SceI、I‑CeuI、PI‑PspI、PI‑Sce、I‑SceIV、I‑CsmI、I‑PanI、I‑SceII、I‑
PpoI、I‑SceIII、I‑CreI、I‑TevI、I‑TevII和I‑TevIII是已知的。还见美国专利号5,420,
032;美国专利号:6,833,252;Belfort等人,(1997)Nucleie Acids Res.25:3379‑3388;
Dujon等人,(1989)Gene 82:115‑118;Perler等人,(1994)Nucleic Acids Res.22,1125‑
1127;Jasin(1996)Trends Genet.12:224‑228;Gimble等人,(1996)J Mol.Bioi.263:163‑
180;Argast等人,(1998)J Mol.Biol.280:345‑353和New England Biolabs catalogue。可
将一种或多种的这些酶(或其功能性片段)用作切割结构域和切割半‑结构域的来源。
[0109] 限制性核酸内切酶(限制性酶)存在于许多物种中且能够序列特异性的结合DNA(在识别位点),并在结合位点处或结合位点附近切割DNA。一些限制酶(如IIS型)在从识别
位点移除的位点处切割DNA并具有可分开的结合与切割结构域。例如,IIS型酶FokI催化DNA
的双链切割,切割在一条链上距离结合位点9个核苷酸,而在另一条链上距其识别位点13个
核苷酸。参见,例如美国专利5,356,802;5,436,150和5,487,994;以及Li等人,(1992)
Proc.Natl.Aead Sci.USA 89:4275‑4279;Li等人,(1993)Proc.Natl.Acad.Sci.USA 90:
2764‑2768;Kim等人,(1994a)Proc.Natl.Aead Sci.USA 91:883‑887;Kim等人,(1994b)
J.Biol.Chem.269:31,978‑31,982。因此,在一个实施方案中,融合蛋白包含来自至少一种
IIS型限制酶的切割结构域(或切割半结构域)和一种或多种锌指结合结构域,其是工程化
的或未工程化的。
[0110] 示例性IIS型限制酶(其切割结构域与结合结构域分开)是FokI。这一特别的酶作为二聚体时有活性。Bitinaite等人,(1998)Proc Natl.Acad.Sci.USA 95:10,570‑10,575。
因此,出于本发明公开的目的,用在公开的融合蛋白中的FokI酶的部分被认为是切割的半
结构域。因此,为了使用锌指‑FokI融合进行靶向性双链切割和/或靶向性细胞序列的替换,
两个融合蛋白(每个包含FokI切割半结构域)可被用于重构催化活性的切割结构域。或者,
也可使用包含锌指结合域和两个FokI切割半结构域的单一多肽分子。使用锌指‑FokI融合
进行靶向性切割和靶向性序列变换(alteration)的参数在本公开的别处提供。
[0111] 切割结构域或切割半结构域可以是蛋白的任何部分,其保留切割活性,或其保留多聚化(如二聚化)以形成有功能的切割结构域的能力。
[0112] IIS型限制酶的例子描述于国际公开WO2007/014275中,通过引用将其全文纳入本文。
[0113] 为了增强切割特异性,切割结构域还可以被修饰。在一些实施方案中,使用切割半结构域的变体,这些变体最小化或防止切割半结构域的同二聚化。这种修饰的切割半结构
域的非限制性例子详细描述于WO2007/014275中,通过引用将其全文纳入本文。还参见实施
例。在一些实施方案中,切割结构域包括工程化的切割半结构域(也指二聚化结构域变体),
其最小化或阻止二聚化,这是本领域技术人员所知晓的并描述于例如美国专利公开号
20050064474;20060188987;20070305346和20080131962中,通过引用将其全部内容纳入本
文。位于FokI的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537
和538位的氨基酸残基均是用于影响FokI切割半结构域二聚化的靶点。
[0114] 另外的工程化的FokI的切割半结构域(其形成专性异二聚体)同样可被用于描述于本文的ZFN中。示例性的工程化的形成专性异二聚体的FokI的切割半结构域包括一对切
割半结构域,其中第一个切割半结构域包括在FokI位点490和538的氨基酸残基处的突变以
及第二个切割半结构域包括在486和499位的氨基酸残基处的突变。
[0115] 因此,在一个实施方案中,位于490位置的突变,将Glu(E)替换为Lys(K);位于538位置的突变,将Iso(I)替换为Lys(K);位于486位置的突变,将Gln(Q)替换为(Glu)(E);以及
位于499位置的突变,将Iso(I)替换为Lys(K)。特别是,本文描述的工程化的切割半结构域
通过突变一个切割半结构域中的位置490(E→K)和538(I→K)以产生工程化的切割半结构
域(命名为“E490K:I538K”),以及通过突变在另一个切割半结构域中的位置486(Q→E)和
499(I→L)以产生工程化的切割半结构域(命名为“Q486E:I499L”)。本文中描述的所述工程
化的切割半结构域为专性异二聚体突变体,其中异常切割被最小化或被消除。例如,见美国
专利公开号2008/0131962,通过引用整体将其全文纳入用于所有目的。在一些实施方案中,
所述工程化的切割半结构域包括在486、499和496位置(相对于野生型FokI编号)的突变,例
如在486位置处用Glu(E)残基替换野生型Gln(Q)残基、在499位置处用Leu(L)残基替换野生
型Iso(I)残基,在496位置处用Asp(D)或Glu(E)残基替换野生型Asn(N)残基(亦分别称为
“ELD”和“ELE”结构域)。在其他实施方案中,所述工程化的切割半结构域包括在位置490,
538和537处的突变(相对于野生型FokI编号),例如在490位置处用Lys(K)残基替换野生型
Glu(E)残基、在538位置处用Lys(K)残基替换野生型Iso(I)残基以及在537位置处用Lys(K)
或Arg(R)残基替换野生型His(H)残基(亦分别称为“KKK”和“KKR”结构域)。在其他实施方案
中,所述工程化的切割半结构域包括在位置490和537处的突变(相对于野生型FokI编号),
例如在490位置处用Lys(K)残基替换野生型Glu(E)残基以及在537位置处用Lys(K)或Arg
(R)残基替换野生型His(H)残基(亦分别称为“KIK”和“KIR”结构域)。(见美国专利公开号
20110201055)。在其他实施方案中,所述工程化的切割半结构域包括“Sharkey”和/或
“Sharkey’”突变(见Guo等人,(2010)J Mol.Biol.400(1):96‑107)。
[0116] 可使用任何合适的方法来制备本文中公开的工程化的切割半结构域,例如通过描述于美国专利公开号20050064474;20080131962;和20110201055的对野生型切割半结构域
(FokI)的定点诱变来制备。
[0117] 或者,可使用所谓的“分裂‑酶”技术在体内于核酸靶位点处组装核酸酶(参见例如,美国专利公开号20090068164)。这样的分裂酶的组分可以在分开的表达载体上表达,或
可以被连接入一个开放阅读框中表达(其中例如由自切割2A肽或IRES序列分隔每个组分)。
组分可以是单独锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。
[0118] 在使用前可(例如在基于酵母的染色体系统中(描述于WO 2009/042163和WO20090068164))筛选核酸酶的活性。可通过使用本领域已知方法容易地设计出核酸酶表
达构建体。参见,例如美国专利公开20030232410;20050208489;20050026157;
20050064474;20060188987;20060063231;和国际公开WO 071014275。可以在组成型启动子
或可诱导启动子(例如半乳糖激酶启动子,其在棉子糖和/或半乳糖的存在下被激活(去抑
制),在葡萄糖的存在下被抑制)的控制下表达核酸酶。
[0119] 融合蛋白
[0120] 融合蛋白(以及编码该蛋白的多核苷酸)的设计和构建方法是本领域技术人员已知的。例如设计和构建包含DNA结合域(如,锌指结构域)和调控或切割结构域(或切割半结
构域)的融合蛋白,和编码所述融合蛋白的多核苷酸的方法描述于美国专利6,453,242和6,
534,261以及美国专利申请公开2007/0134796;2005/0064474;20080182332;20090205083;
20100199389;20110167521,20110239315,20110145940和20110301073中,通过引用其全部
并入本文。在一些实施方案中,构建了编码融合蛋白的多核苷酸。可将这些多核苷酸插入载
体,并将所述载体引入细胞中(见下文中关于载体以及将多核苷酸引入细胞中的进一步的
公开内容)。
[0121] 在本文中描述的方法的一些实施方案中,锌指核酸酶包含含有锌指结合结构域和来自FokI限制酶的切割半结构域的融合蛋白,且在细胞中表达两种这类融合蛋白。通过将
所述两蛋白递送到细胞;将一种蛋白和一种编码所述蛋白之一的核酸递送到细胞;将两种
核酸(每种核酸编码蛋白的一种)递送到细胞;或将编码两种蛋白的单一核酸递送到细胞可
导致两融合蛋白在细胞中表达。在另外的实施方案中,融合蛋白包含单个多肽链,该多肽链
包含两种切割半结构域和锌指结合结构域。在这种情况下,在细胞中表达单一融合蛋白且,
不希望受理论的束缚,认为作为形成切割半结构域的分子内二聚体的结果,所述单一融合
蛋白切割DNA。
[0122] 在一些实施方案中,将融合蛋白(如ZFP‑FokI融合体)的组分排列成使得锌指结构域最接近融合蛋白的氨基末端,而切割半结构域最近羧基末端。这模拟了天然存在的二聚
化切割结构域(如那些衍生自FokI酶的二聚化切割结构域,其中DNA结合域最接近氨基末端
而切割半结构域最接近羧基末端)中切割结构域的相对取向。在这些实施方案中,通过使融
合蛋白结合相对DNA链上的位点(结合位点的5’末端彼此接近)从而使切割半结构域二聚化
以形成有功能的核酸酶。
[0123] 在其它的实施方案中,将融合蛋白(如ZFP‑FokI融合体)的组分排列为使得切割半结构域最接近融合蛋白的氨基末端,和锌指结构域最接近羧基末端。在这些实施方案中,通
过使融合蛋白结合相对DNA链上的位点(结合位点的3’末端彼此接近)从而使切割半结构域
二聚化以形成有功能的核酸酶。
[0124] 在另外的其它实施方案中,第一融合蛋白包含最接近所述融合蛋白氨基末端的切割半结构域,和最接近羧基末端的锌指结构域,以及将第二融合蛋白排列成使得锌指结构
域最接近所述融合蛋白的氨基末端而切割半结构域最接近羧基末端。在这些实施方案中,
两融合蛋白均结合到相同DNA链上,其中包含锌指结构域最接近羧基末端的所述第一融合
蛋白的结合位点位于含有锌指结构域最接近氨基末端的所述第二融合蛋白的结合位点的
5’侧。
[0125] 在本发明公开的融合蛋白的一些实施方案中,锌指结构域和切割结构域(或切割半结构域)之间的氨基酸序列记为“ZC接头”。所述ZC接头要与前面讨论的指间接头相区别。
例如,见美国专利公开20050064474和20030232410,和国际专利公开WO05/084190,以获得
优化切割的ZC接头的详细内容。
[0126] 在一个实施方案中,本公开提供了一种核酸酶(例如ZFN),其包含具有一个或多个示于表1A中的识别螺旋氨基酸序列的锌指蛋白(例如由具有如表1A的单行中显示的识别螺
旋的锌指结构域构成的锌指蛋白)。在另一实施方案中,本文提供一种包含以下核苷酸序列
的ZFP表达载体,该核苷酸序列编码具有一种或多种示于表1A中的识别螺旋的ZFP(例如具
有有序的并示于表1A的单行中的识别螺旋区的ZFP)。在另一实施方案中,本文提供一种结
合示于表1B中靶位点的DNA结合域(如ZFP)或一种编码结合示于表1B中的靶位点的DNA结合
域(如ZFP)的多核苷酸。
[0127] 靶位点
[0128] 所公开的方法和组合物包括含有DNA结合域(如ZFP)和调控结构域或切割(如核酸酶)结构域(或切割半结构域)的融合蛋白,其中所述DNA结合域(如锌指结构域)通过结合细
胞染色质中一种或多种植物MDH基因中的序列,指导转录调控结构域或切割结构域(或切割
半结构域)到序列附近的活性,从而调控转录或诱导在靶序列附近中的切割。
[0129] 如在本公开别处所阐述的,可工程化DNA结合域(如锌指结构域)以结合实质上任何期望序列。相应地,当鉴定了含有期望基因调节、切割或重组的序列的感兴趣的区域后,
可将一种或多种锌指结合结构域工程化以结合感兴趣的区域中的一种或多种序列。在一些
实施方案中,本文中描述的ZFP结合示于表1B中的靶位点。
[0130] 通过DNA结合域(如靶位点)选择任何MDH基因的细胞染色质中感兴趣的基因组区域中的靶位点的结合可例如根据公开于美国专利号6,453,242的方法和/或美国专利公开
号20110239315,20110145940和20110301073的方法完成,前述美国专利公开文件还公开了
设计ZFP以结合选择的序列的方法。本领域技术人员清楚,对核苷酸分子的简单肉眼检查同
样可用于靶位点的选择。相应地,靶位点选择的任何方法均可用于要求保护的方法中。
[0131] 靶位点通常由数个临近的靶亚位点(target subsites)构成。靶亚位点指由单个锌指结合的序列(通常为核苷酸三联体或与相邻的四联体重叠一个核苷酸的核苷酸四联
体)。例如,见WO02/077227。如果将锌指蛋白接触最多的链定义为靶链“首要识别链”或“首
要接触链”,则一些锌指蛋白结合靶链中的三碱基三联体和非靶链上的第四碱基。对于锌指
蛋白,靶位点通常具有至少9个核苷酸的长度且,相应地,由含有至少三个锌指的锌指结合
结构域结合。然而,例如4指结合结构域与12核苷酸靶位点的结合、5指结合结构域与15核苷
酸靶位点的结合或6指结合结构域与18核苷酸靶位点的结合也是可能的。显然,更大的结合
结构域(如7‑,8‑,9‑指或更多)与更长的靶位点结合也是有可能的。
[0132] 并不需要靶位点是三核苷酸的倍数。例如,在其中发生交叉链相互作用的情况中(例如,见美国专利号6,453,242和WO 02/077227),多指结合结构域中的各个锌指中的一个
或多个可以与重叠的四联体亚位点结合。作为结果,三指蛋白可结合10‑核苷酸的序列,其
中第十个核苷酸是末端指结合的四联体的一部分,四指蛋白可结合13‑核苷酸序列,其中第
十三个核苷酸是末端的指结合的四联体的一部分等。
[0133] 多锌指结合结构域中的各个锌指之间的氨基酸接头序列的长度和性质也影响与靶序列的结合。例如,多指结合结构域中相邻锌指之间的所谓的“非规范接头”、“长接头”或
“结构接头”的存在可允许那些指结合不是直接相邻的亚位点。这种接头的非限定性的例子
描述于,例如美国专利号6,479,626和WO 01/53480中。相应地,一个或多个亚位点(位于锌
指结合结构域的靶位点中)可由1,2,3,4,5或更多核苷酸彼此分开。提供一个实例,四指结
合结构域可与13‑核苷酸的靶位点结合,该靶位点在序列中含有两个临近的3‑核苷酸亚位
点,一个插入的核苷酸和两个连续的三联体亚位点。对用于连接人工核酸酶以结合被不同
的核苷酸数目分开的靶位点的组合物和方法,亦参见美国专利公开号20090305419。序列
(如靶位点)间的距离指插入两个序列之间的核苷酸或核苷酸对的数目,如从彼此最接近的
序列的边缘测量的。
[0134] 在一些实施方案中,设计了具有转录因子功能的ZFP,例如通过构建包含ZFP和转录调控结构域(如激活或抑制结构域)的融合蛋白。能与DNA结合域融合以调控基因表达的
适合的转录调控结构域的非限定性的例子记载于,例如美国专利号6,534,261;6,824,978;
6,933,113和8,399,218以及美国专利公开号20080182332。对于转录因子的功能而言,通常
都只需要简单结合以及与启动子足够接近。相对于启动子的精确定位,取向和在限制中,距
离并不非常重要。这一特征允许在选择靶位点用于构建人工转录因子中相当大的灵活性。
由ZFP识别的靶位点因此可以是靶基因中的任何合适的位点,其将允许通过ZFP(任选地连
接于调控结构域)激活或抑制基因表达。优选的靶位点包括转录起始位点的临近、下游或上
游区域。另外,靶位点位于增强子区域、抑制子位点、RNA聚合酶暂停位点和特异性调节位点
(如SP‑1位点、缺氧反应元件、核受体识别元件、p53结合位点)、位于cDNA编码区域或表达序
列标签(EST)编码区中的位点中。
[0135] 在其他实施方案中,设计了核酸酶,如ZFN和/或TALEN。在细胞中表达包含融合蛋白的核酸酶影响了靶序列临近中的切割,所述融合蛋白含有DNA结合域和切割结构域(或两
个融合蛋白,每个均包含锌指结合结构域和切割半结构域)。在一些实施方案中,切割依赖
于两个锌指结构域/切割半结构域融合分子与各自的靶位点的结合。两个靶位点可以在相
对的DNA链上,或可选地,两个靶位点可在同一DNA链上。
[0136] 基因表达的调节
[0137] 可使用多种分析以确定DNA结合蛋白(如ZFP)是否调控基因表达。使用各种体外和体内分析,例如通过测量蛋白或mRNA水平、产物水平、酶活性、报道基因的转录激活或抑制
可评估特定蛋白质的活性,如使用免疫测定(如使用抗体的ELISA和免疫组织化学分析)、杂
交分析(如RNase保护、Northern、原位杂交、寡核苷酸阵列研究)、比色分析、扩增分析、酶活
分析、表型分析等等。
[0138] DNA结合蛋白通常首先使用ELISA分析以及然后使用酵母表达系统检测体外活性。例如首先使用含有报告基因的瞬时表达系统测试ZFP,然后在细胞和整个植物中体内和离
体测试对靶内源基因的调控。DNA结合蛋白可以在细胞中重组表达、在移植到植物中的细胞
中重组表达、或在转基因植物中重组表达,以及使用下文中描述的递送媒介物(vehicle)作
为蛋白施用至植物或细胞中。所述细胞可以被固定、在溶液中、被注射入植物或天然存在于
转基因或非转基因植物中。
[0139] 使用本文记载的体外或体内方法中的一种检测基因表达的调控。使用DNA结合蛋白(如ZFP)处理样品或分析并与不含测试化合物的对照样品相比较以检查调控的程度。对
于内源基因表达的调节,DNA结合蛋白通常具有200nM或更少,更为优选地100nM或更少,更
为优选地50nM,最为优选地25nM或更少的Kd。
[0140] 可通过考察前述任何参数测量所述结合蛋白的效果。可使用任何合适的基因表达、表型或生理的变化以评估DNA结合蛋白(如ZFP)的影响。当使用完整的细胞或植物确定
功能性结果时,还可以测量多种作用,例如植物生长、已知和未表征的遗传标记的转录变化
(例如Northen blot或寡核苷酸阵列研究)、细胞代谢的变化(如细胞生长或pH的变化)、以
及胞内第二信使(如cGMP)的变化。
[0141] 优选的内源基因表达调节的分析可在体外进行。在一个优选的体外分析形式中,通过使用ELISA分析检测蛋白产量来测量培养的细胞中内源基因表达的ZFP调控。测试样品
与用空载体或不相关的靶向其他基因的ZFP处理的对照细胞相比较。
[0142] 在另一实施方案中,通过测量靶基因mRNA表达水平体外确定对内源基因表达的调控。使用扩增(如使用PCR(如实时PCR))、LCR、或杂交测定法(例如Northern杂交)、RNase保
护、点印迹测量基因表达水平。在一个实施方案中使用RNase保护。使用直接或间接标记的
检测剂,例如荧光或放射性标记的核酸、放射性或酶法标记的抗体等来检测蛋白或mRNA的
水平,如本文公开的。
[0143] 或者,可使用与报道基因(如萤光素酶、绿色荧光蛋白、CAT或β‑gal)可操作连接的靶基因启动子来设计(devise)报道基因系统。报道构建体典型地共转染到培养的细胞中。
当用选择的DNA结合蛋白(如ZFP)处理后,根据本领域技术人员已知的标准技术测量报告基
因转录、翻译或活性的量。
[0144] 转基因和非转基因植物也被用于优选实施方案中以检测内源基因表达的体内调节。转基因植物可稳定表达选择的DNA结合蛋白(如ZFP)。或者,也可以使用瞬时表达选择的
ZFP的植物或已被施用递送媒介物中的ZFP的植物。使用本文中记载的任何一种分析方法检
测对内源基因表达的调节。
[0145] 靶向性切割的方法
[0146] 可使用公开的方法和组合物切割位于细胞染色质中感兴趣的区域的DNA(如在基因组中期望或预先确定的位点处,例如,在MDH基因内或邻近MDH基因)。对于这样的靶向性
DNA切割,将如锌指结合域的DNA结合域工程化以结合位于或邻近预先确定的切割位点的靶
位点,然后在细胞中引入编码包含工程化的DNA结合域和切割结合域的融合蛋白和/或从其
中的多核苷酸表达。当融合蛋白的锌指部分与靶位点结合时,靠近靶位点的DNA通过切割结
构域被切割。
[0147] 或者,各自包含锌指结合结构域和切割半结构域的两融合蛋白在细胞中表达,并与靶位点相结合,所述靶位点以一种使得有功能的切割结构域被重构并切割靶位点附近的
DNA的方式并置(juxtaposed)。在一个实施方案中,切割发生在两锌指结合域的靶位点之
间。锌指结合域的一个或全部的两个都可被工程化。
[0148] 对于使用锌指结合结构域‑切割结构域融合多肽的靶向性切割,结合位点可包括切割位点,或结合位点的近边(near edge)可以距离切割位点1,2,3,4,5,6,10,25,50或更
多个核苷酸(或1到50之间的任意整数值的核苷酸)。结合位点相对于切割位点的确切位置,
将依赖于特定切割结构域和ZC接头的长度。对于使用两个融合多肽(每个包含锌指结合结
构域和切割半结构域)的方法,结合位点通常跨越切割位点。因此第一结合位点的近边可以
是在切割位点一侧的1,2,3,4,5,6,10,25或更多核苷酸(或1到50之间的任意整数值的核苷
酸),且第二结合位点的近边可以是是在切割位点另一侧的1,2,3,4,5,6,10,25或更多核苷
酸(或1到50之间的任意整数值的核苷酸)。体外和体内匹配切割位点的方法是本领域已知
的。
[0149] 因此,本发明中描述的方法可以使用与切割结构域融合的工程化的锌指结合结构域。在这些情况中,所述结合结构域被工程化以在需要切割的位点处或附近结合靶序列。将
融合蛋白或编码其的多核苷酸引入植物细胞。一旦在细胞中引入或表达,所述融合蛋白结
合靶序列并在靶序列上或附近进行切割。切割的确切位点依赖于切割结构域的性质和/或
结合和切割结构域之间的接头序列的存在和/或性质。在使用两个融合蛋白(每个包含一个
切割半结构域)的情况中,结合位点的近边间的距离可以是1,2,3,4,5,6,7,8,9,10,25或更
多核苷酸(或1到50之间的任意整数值的核苷酸)。切割的最佳水平也可依赖于两融合蛋白
的结合位点间的距离(例如见Smith等人.(2000)Nucleic Acids Res.28:3361‑3369;
Bibikova et al.(2001)Mol.Cell.Biol.21:289‑297)以及每个融合蛋白中ZC接头的长度。
还参见美国专利号7,888,121;美国专利公开20050064474和国际专利公开WO05/084190,
WO05/014791和WO03/080809。
[0150] 在一些实施方案中,切割结构域包括两个切割半结构域(它们均是包括结合结构域的单一肽的部分),即第一切割半结构域和第二切割半结构域。所述切割半结构域可具有
相同的氨基酸序列或不同的氨基酸序列,只要它们发挥切割DNA的功能。
[0151] 还可以在分开的分子中提供切割半结构域。例如,两个融合多肽可以被引入细胞,其中每个多肽包括结合结构域和切割半结构域。所述切割半结构域可具有相同的氨基酸序
列或不同的氨基酸序列,只要它们发挥切割DNA的功能即可。进一步的,结合结构域结合典
型以如下方式排列的靶序列,该方式使得当融合多肽结合时,两个切割半结构域彼此呈现
为允许切割结构域重构(如通过半结构域的二聚化)的空间取向,从而半结构域相对于彼此
定位以形成有功能的切割结构域,并导致感兴趣区域中细胞染色质的切割。通常,通过重构
的切割结构域的切割发生在位于两靶序列之间的位点上。一个或所有两蛋白都可以被工程
化以结合其靶位点。
[0152] 所述两种融合蛋白可以以相同或相反的极性结合到感兴趣的区域中,且它们的结合位点(即靶位点)可由任何数量的核苷酸(如,从0到200个核苷酸或之间的任何整数值)分
开。在一些实施方案中,所述两种融合蛋白的结合位点(每种各包括一个锌指结合结构域和
一个切割半结构域)可定位为相隔5到18个核苷酸(例如5‑8个核苷酸或15‑18个核苷酸,或6
个核苷酸,或16个核苷酸),如从最接近另一结合位点的每个结合位点的边缘测量的,并且
在所述结合位点之间发生切割。
[0153] 切割DNA的位点通常位于两个融合蛋白的结合位点之间。DNA的双链断裂通常起因于两个单链断裂、或“切口”,偏移1,2,3,4,5,6或更多个核苷酸(例如,通过天然FokI对双链
DNA的切割起因于偏移4个核苷酸的单链断裂)。因此切割并不需要发生在每条DNA链的确切
相对的位点处。此外,融合蛋白的结构和靶位点间的距离可影响切割是否发生在单核苷酸
对附近,或者切割是否发生在数个位点处。然而,对于很多应用(包括靶向性重组和靶向性
诱变(见下文)),在一定范围的核苷酸内的切割一般是足够的,且不需要特定碱基对之间的
切割。
[0154] 如前所述,本文所述的融合蛋白可作为多肽和/或多核苷酸引入。例如可将两个多核苷酸(各包含编码一种前述多肽的序列)引入细胞中,且当表达所述多肽且每个多肽结合
其靶序列时,切割发生在靶序列处或其附近。可选地,将包含编码两个融合多肽的序列的单
一多核苷酸引入细胞。多核苷酸可以是DNA、RNA或任何修饰形式或类似物或DNA和/或RNA。
[0155] 为了增强切割特异性,还可在本文描述的方法中使用另外的组合物。例如,单个切割半结构域可以显示出受限的双链切割活性。在将两个融合蛋白(各包含3指锌指结构域和
切割半结构域)引入细胞的方法中,其中任一蛋白指定约9‑核苷酸靶位点。尽管18个氨基酸
的聚集靶序列(aggregated target sequence)在哺乳动物和植物基因组中有可能是唯一
的,但在人类基因组中任何给定的9‑核苷酸靶位点平均出现大约23,000次。因此,由于单个
半结构域的位点特异性结合,可能发生非特异性切割。相应地,本文中描述的方法涵盖使用
切割半结构域如FokI(或其编码核酸)的显性‑阴性突变体,所述突变体与所述两融合蛋白
一并在细胞中表达。所述显性‑阴性突变体能够二聚化但不能切割,且还阻断与其二聚化的
半结构域的切割活性。通过提供比融合蛋白摩尔过量的显性‑阴性突变体,仅其中两融合蛋
白均结合的区域才将具有足够高的功能性切割半结构域的局部浓度进行二聚化,并产生切
割。在只结合了所述两个融合蛋白中的一个的位点上,该融合蛋白的切割半结构域与显性‑
阴性突变体半结构域形成二聚体,且不发生不期望的、非特异性切割。
[0156] 表达载体
[0157] 如本文所记载的编码一个或多个融合蛋白(例如ZFN)的核酸可以克隆到载体中,用于转化到原核或真核细胞中进行复制和/或表达。载体可以是原核载体(例如质粒、穿梭
载体、昆虫载体)或真核载体。编码融合蛋白的核酸还可以克隆到表达载体中,用于施用给
细胞。
[0158] 为了表达融合蛋白(例如ZFN),编码融合蛋白的序列通常亚克隆(subcloned)到包含指导转录的启动子的表达载体中。合适的原核和真核启动子是本领域公知的并记载在如
Sambrook等人,Molecular Cloning,A Laboratory Manual(第2版.1989;第3版.,2001);
Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);和Current 
Protocols in Molecular Biology(Ausubel等人,上文)中。用于表达蛋白的细菌表达系统
可在例如大肠杆菌,芽孢杆菌(Bacillus)菌种和沙门氏菌(Salmonella)(Palva等人,Gene 
22:229‑235(1983))中获得。这样的表达系统试剂盒是商业化提供的。用于哺乳动物细胞,
酵母,和昆虫细胞的真核表达系统对于本领域技术人员而言是公知的并且也是商业化可提
供的。
[0159] 用于指导编码融合蛋白的核酸序列直接表达的启动子取决于具体应用。例如,适合于宿主细胞的强组成型启动子通常用于融合蛋白的表达和纯化。
[0160] 相反,当体内施用融合蛋白以调节植物基因时(参见下面的“核酸到植物细胞的递送”部分),使用组成型、调节型(例如在发育期间,按组织或细胞类型,或按环境)或诱导型
启动子,这取决于融合蛋白的特定用途。植物启动子的非限制性例子包括源自拟南芥
(A.thaliana)泛素‑3(ubi‑3)(Callis等人,1990,J Biol.Chem.265‑12486‑12493);根癌土
壤杆菌(A.tumifaciens)甘露碱合酶(△mas)(Petolino等人,美国专利号6,730,824);和/
或木薯叶脉花叶病毒(CsVMV)(Verdaguer等人,1996,Plant Molecular Biology 31:1129‑
1139)。还参见实施例。
[0161] 除了启动子,表达载体通常还含有转录单元或表达盒,其包含在原核或真核的宿主细胞中表达核酸所需要的所有其他元件。因此常用的表达盒包含与例如编码融合蛋白的
核酸序列可操作连接的启动子(包含核糖体结合位点)、如转录本的高效多聚腺苷酸化、转
录终止或翻译终止所需的信号。表达盒的其他元件可以包括例如增强子、异源剪接信号、来
自明脉扁刺蛾β四体病毒(Thosea asigna virus)的2A序列(Mattion等人.(1996)J 
Virol.70:8124‑8127),和/或核定位信号(NLS)。
[0162] 根据融合蛋白的使用目的例如在植物、动物、细菌、真菌、原生动物等中表达,选择用于将遗传信息运输到细胞内的具体表达载体(参见下面记载的表达载体)。标准的细菌和
动物表达载体是本领域公知的并详细记载于例如美国专利公开号20050064474A1和国际专
利公开号WO05/084190,WO05/014791和WO03/080809中。
[0163] 标准的转染方法可以用于产生表达大量蛋白的细菌、植物、哺乳动物、酵母或昆虫细胞系,然后可以使用标准的方法纯化蛋白质(例如参见Colley等人,J.Biol.Chem.264:
17619‑17622(1989);Guide to Protein Purification,in Methods in Enzymology,
vol.182(Deutscher编,1990))。真核和原核细胞的转化根据标准技术进行(参见例如
Morrison,J Bact.132:349‑351(1977);Clark‑Curtiss & Curtiss,Methods in 
Enzymology 101:347‑362(Wu等人编,1983)。
[0164] 可以使用任何公知的规程将外源核苷酸序列导入到这样的宿主细胞中。这些包括利用磷酸钙转染、聚凝胺(polybrene)、原生质体融合、电穿孔、超声方法(例如声孔效应
(sonoporation))、脂质体、微注射、裸DNA、质粒载体、病毒载体、土壤杆菌介导的转化、碳化
TM
硅(例如,WHISKERS )介导的转化(附加体和整合性两者)、和任何其他公知的用于导入克隆
基因组DNA、cDNA、合成的DNA或其他外源遗传材料到宿主细胞的技术。仅需要使用的特定基
因工程规程能成功地将至少一个基因导入能表达选择的蛋白的宿主细胞中。
[0165] 核酸到植物细胞的递送
[0166] 正如上面所提到的,DNA构建体可以通过多种常规技术导入到期望的植物宿主(例如基因组)中。对于这类技术的综述,参见例如Weissbach & Weissbach Methods for 
Plant Molecular Biology(1988,Academic Press,N.Y.)第III部分,pp.421‑463;和
Grierson&Corey,Plant Molecular Biology(1988,第2版),Blackie,London,Ch.7‑9。还参
见美国专利公开号20090205083;20100199389;20110167521和20110189775,通过引用将其
全文纳入本文。
[0167] 例如,DNA构建体可以通过如电转染和植物细胞原生质体微注射技术直接导入到植物细胞的基因组DNA中,或DNA构建体可以使用基因枪(biolistic)方法,例如DNA粒子轰
击直接导入到植物组织中(参见例如Klein等人,(1987)Nature 327:70‑73)。或者,DNA构建
体可通过纳米颗粒转化以导入到植物细胞中(参见例如美国专利公开号No.20090104700,
其通过提述完整并入本文)。或者,DNA构建体可以与合适的T‑DNA边界/侧翼区组合并导入
到常规的根癌土壤杆菌宿主载体中。根癌土壤杆菌介导的转化技术,包含解除致癌基因和
双元载体的发展和使用,都在科学文献中详细记载。参见例如Horsch等人(1984)Science 
233:496‑498,和Fraley等人(1983)Proc.Nat'l.Acad.Sci.USA 80:4803。
[0168] 此外,基因转移可以使用非土壤杆菌细菌或病毒,例如根瘤菌(Rhizobium)菌种NGR234,苜猜中华根瘤菌(Sinorhizoboium meliloti),百脉根根瘤菌(Mesorhizobium 
loti),马铃薯病毒X,花椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒实现。参见
例如Chung等人(2006)Trends Plant Sci.ll(l):l‑4。
[0169] 当使用双元T‑DNA载体(Bevan(1984)Nuc.Acid Res.12:8711‑8721)或共培植程序(Horsch等人,(1985)Science 227:1229‑1231)由细菌感染细胞时,根癌土壤杆菌宿主的毒
力作用将指导含有构建体和相邻的标记物的T‑链进入植物细胞DNA。通常,土壤杆菌转化系
统用于工程化双子叶植物(Bevan等人,(1982)Ann.Rev.Genet 16:357‑384;Rogers等人,
(1986)Methods Enzymol.118:627‑641)。土壤杆菌转化系统还可以用于将DNA转化和转移
到单子叶植物和植物细胞中。参见美国专利号5,591,616;Hernalsteen et al.等人,
(1984)EMBO J3:3039‑3041;Hooykass‑Van Slogteren等人,(1984)Nature 311:763‑764;
Grimsley等人,(1987)Nature 325:1677‑179;Boulton等人,(1989)Plant Mol.Biol.12:
31‑40;和Gould等人,(1991)Plant Physiol.95:426‑434。
[0170] 备选的基因转移和转化方法包括但不限于,通过钙、聚乙二醇(PEG)、或电穿孔介导的对裸DNA的摄取进行的原生质体转化(参见Paszkowski等人,(1984)EMBO J3:2717‑
2722;Potrykus等人,(1985)Molec.Gen.Genet.199:169‑177;Fromm等人(1985)
Proc.Nat.Acad.Sci.USA 82:5824‑5828;和Shimamoto(1989)Nature 338:274‑276)和植物
组织电穿孔(D'Halluin等人(1992)Plant Cell 4:1495‑1505)。植物细胞转化的其它方法
TM
包括微注射、碳化硅(例如,WHISKERS )介导的DNA摄取(Kaeppler等人,(1990)Plant Cell 
Reporter 9:415‑418)、和微粒轰击(参见Klein等人(1988)Proc.Nat.Acad.Sci.USA 85:
4305‑4309;和Gordon‑Kamm等人(1990)Plant Cell 2:603‑618)。
[0171] 公开的方法和组合物可以用来将外源序列插入到MDH基因中。这是有用的,因为导入植物基因组中的转基因的表达关键性地取决于它的整合位点。因此,编码例如除草剂耐
性、昆虫抗性、营养物(nutrients)、抗菌素或治疗分子的基因可以通过靶向性重组插入到
有利于它们表达的植物基因组区域中。
[0172] 由上面任何一种转化技术所制备的转化植物细胞能培养并再生为具备转化的基因型和由此所期望的表型的完整植物。这样的再生技术依赖于对组织培养生长培养基中某
些植物激素的操纵,通常依赖于已与期望的核苷酸序列一起导入的生物杀灭剂和/或除草
剂标志物。从培养的原生质体的植物再生记载于Evans等人,“Protoplasts Isolation and 
Culture”于Handbook of Plant Cell Culture,pp.124‑176,Macmillian Publishing 
Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,
pp.21‑73,CRC Press,Boca Raton,1985中。再生还可以获自植物愈伤组织、外植体、器官、
花粉、胚,或其部分。这样的再生技术常记载于Klee等人(1987)Ann.Rev.of Plant 
Phys.38:467‑486中。
[0173] 可利用核酸导入植物细胞中赋予基本上任何植物以期望的性状。大量的植物和植物细胞系统可以使用本发明公开的核酸构建体和上面提到的各种转化方法工程化为想要
的生理和农艺特性。在优选实施方案中,工程化的靶植物和植物细胞包括但不限于,那些单
子叶和双子叶植物,例如包括谷类作物(例如,小麦,玉米,稻,稷/粟,大麦),水果作物(例
如,西红柿,苹果,梨,草莓,桔/橙),饲料作物(例如,苜蓿),根菜作物(例如,胡萝卜,土豆,
甜菜,山药),叶菜类蔬菜作物(例如,莴苣,菠菜)在内的作物;开花植物(例如,牵牛花,玫
瑰,菊花),松柏植物(conifers)和松树(例如,松杉,云杉);用于植物修复的植物(如重金属
积累植物);油料作物(如向日葵,油菜种子)和用于实验目的植物(例如,拟南芥)。因此,本
发明公开的方法和组合物使用大量范围的植物,包括但不限于来自于以下属的物种:芦笋
属,燕麦属,芸苔属,柑橘属,西瓜属,辣椒属,南瓜属,胡萝卜属,飞蓬属,大豆属,棉花属,大
麦属,莴苣属,黑麦属,番茄属,苹果属,木薯属,烟草属,诸葛菜属,稻属,鳄梨属,菜豆属,豌
豆属,梨属,樱桃属,萝卜属,黑麦属,茄属,高粱属,小麦属,葡萄属,豇豆属,和玉蜀黍属
(Asparagus,Avena,Brassica,Citrus,Citrullus,Capsicum,Cucurbita,Daucus,
Erigeron,Glycine,Gossypium,Hordeum,Lactuca,Lolium,Lycopersicon,Malus,Manihot,
Nicotiana,Orychophragmus,Oryza,Persea,Phaseolus,Pisum,Pyrus,Prunus,Raphanus,
Secale,Solanum,Sorghum,Triticum,Vitis,Vigna,and Zea)。
[0174] 可利用核酸导入植物细胞中赋予基本上任何植物以期望的性状。在某些实施方案中,植物细胞内改变的MDH的表达/功能导致植物具有增加的果实产量,增加的植物(或植物
的果实)的生物量,更高含量的果肉,浓缩的结实(fruit set),更大的植物,增加的鲜重,增
加的干重,增加的固体含量,更高的收获总重,作物颜色的提高的密度和/或一致性,改变的
化学特性(如油、脂肪酸、碳水化合物、蛋白)等等。
[0175] 本领域技术人员将认识到外源序列能瞬时掺入到植物细胞中。外源多核苷酸序列的导入可以利用导入序列的植物细胞的细胞机制。瞬时掺入植物细胞中的、包含ZFN的外源
多核苷酸序列的表达可以通过分析靶序列的基因组DNA来鉴定和测定任何插入缺失
(indel)、翻转或插入。这些类型的重排由基因组DNA序列内靶位点的切割和随后的DNA修复
导致。此外,外源多核苷酸序列的表达可以使用本领域技术人员知晓的、允许测试标志基因
表达的方法来进行分析。已报道使用多种植物、组织、和DNA递送系统对标志基因的瞬时表
达。瞬时分析系统包括但并不限于,使用任何感兴趣的植物物种在任意的瞬时植物分析中
通过电穿孔或组织的粒子轰击(particle bombardment)的直接基因递送。这样的瞬时系统
包括但并不限于,来自多种组织源的原生质体的电穿孔或对感兴趣的特定组织的粒子轰
击。本发明公开包含了使用任意的瞬时表达系统去评价位点特异性的核酸内切酶(如ZFN)
并在MDH靶基因内导入突变。通过合适的递送系统瞬时检测的植物组织的例子包括但不限
于叶基部组织,愈伤组织,子叶(cotyledons),根,胚乳,胚,花组织,花粉,和表皮组织。
[0176] 本领域技术人员将认识到外源的多核苷酸序列能稳定整合入转基因植物中。一旦外源多核苷酸序列被证实是可操作的,它将通过有性杂交导入到其它植物中。可以使用许
多标准育种技术中的任何一种,这取决于被杂交的物种。
[0177] 转化的植物细胞、愈伤组织、组织或植物可以通过选择和筛选工程化植物材料中由存在于转化DNA上的标记基因编码的性状而进行鉴定和分离。例如,选择可以通过在含有
抑制量的抗生素或除草剂(转化基因构建体赋予对其的抗性)的培养基中生长工程化的植
物材料而进行。进一步地,转化的植物和植物细胞也可以通过筛选任何可见的标记基因(例
如β‑葡糖醛酸糖苷酶,萤光素酶,B或CI基因)的活性而鉴定,其中标记基因可以出现在重组
核酸构建体上。这样的选择和筛选方法为本领域技术人员所公知。
[0178] 物理和生化方法也可以用于鉴定含有稳定插入的基因构建体的植物或植物细胞转化体,或包含靶基因改变的基因组DNA(由位点特异性核酸内切酶(例如ZFN)的瞬时表达
导致)的植物细胞。这些方法包括但不限于:1)Southern分析或PCR扩增用于检测和测定重
组DNA插入的结构;2)Northern blot,S1核糖核酸酶保护(SI RNase protection),引物延
伸或逆转录PCR扩增用于检测或检查基因构建体的RNA转录本;3)检测酶或核酶活性的酶学
分析,其中这类基因产物由基因构建体编码;4)蛋白凝胶电泳,Western blot技术,免疫沉
淀,或酶联免疫分析(ELISA),其中基因构建体产物是蛋白。其它的技术,例如原位杂交、酶
染色和免疫染色,也可以用于检测特定植物器官或组织内重组构建体的存在或表达。用于
所有这些分析的方法都是本领域技术人员所公知的。
[0179] 使用本文公开的方法进行基因操作的效果可以通过例如对自感兴趣组织分离的RNA(例如mRNA)的northern blot观察到。通常,如果mRNA出现或mRNA量增加,可以假定对应
的转基因在进行表达。可以使用测量基因和/或编码的多肽活性的其它方法。根据所使用的
底物和检测反应产品或副产物的增加或降低的方法,可以使用不同类型的酶学分析。此外,
表达的多肽的水平可以通过免疫化学检测,即ELISA,RIA,EIA和其他本领域技术人员所知
晓的基于抗体的检测,例如电泳检测方法(可以染色或western blotting)。作为一个非限
制性例子,使用ELISA分析对AAD‑1和PAT蛋白的检测记载于美国专利公开号20090093366,
通过引用将其全文纳入本文。转基因可以在植物某些组织或某些发育阶段进行选择性的表
达,或者转基因基本在所有的植物组织中表达,基本伴随其整个生命周期。但是,任何组合
的表达模式也是可应用的。
[0180] 本发明公开还包括如上面所记载的转基因植物的种子,其中种子具有转基因或基因构建体。本发明公开进一步包括如上面所述的转基因植物的后代、克隆、细胞系或细胞,
其中所述的后代、克隆、细胞系或细胞具有转基因或基因构建体。
[0181] 融合蛋白(例如ZFN)和编码融合蛋白的表达载体可以直接施用给植物进行基因调控,靶向性切割,和/或重组。在某些实施方案中,植物含有多个旁系同源的MDH靶基因。因
此,一个或多个不同的融合蛋白或编码融合蛋白的表达载体可以施用给植物以靶向植物中
一个或多个这些旁系同源基因。
[0182] 有效量的施用是通过任何常规用于将融合蛋白导入到与待处理的植物细胞最终接触的路径。ZFP以任何合适的方式施用,优选与可接受的载体一起。合适的施用这类调控
物的方法是可获的并且对于本领域技术人员而言是公知的,并且,虽然不止一种路径可以
用于施用特定组合物,一种特定的路径较其它途径常可提供更迅速和更有效的反应。
[0183] 也可以使用载体,其由所施用的特定组合物以及施用组合物的特定方法所部分决定。因此,存在大量合适的载体配制剂可以使用。
实施例
[0184] 实施例1:对来自番茄(Solanum lycopersicum)的线粒体苹果酸脱氢酶(mMDH)靶基因的表征
[0185] 苹果酸脱氢酶(MDH)基因通常以多个旁系同源拷贝存在于生物体中。尽管相似的旁系同源苹果酸脱氢酶(mMDH)基因序列存在于生物体中,但仍从番茄中鉴定和分离出单一
的线粒体苹果酸脱氢酶(mMDH)基因序列。最初,通过比较已知的苹果酸脱氢酶基因序列的
部分,从几个多核苷酸序列数据库鉴定出线粒体苹果酸脱氢酶(mMDH)基因序列,这些已知
的苹果酸脱氢酶基因序列记载于文献中,其中许多不同的多核苷酸序列包含在多核苷酸序
列数据库中。经过大量的序列比对比较后,两种不同的苹果酸脱氢酶基因序列的完整序列
被鉴定出:mMDH序列(下面描述)和糖酵解酶体(glycosomal)MDH(gMDH)序列(登录号:
AY725476)。序列数据库筛选成果鉴定出mMDH基因座为来自于Solgenomics在线可提供的番
茄基因组序列数据库(还参见Bombarely等人.(2011)Nuc Acids Res.(Database issue):
D1149‑55)的登录号Solyc07g062650(SEQ ID NO:1)。
[0186] 将计算机鉴定的mMDH基因序列用于确认来自于两种不同的番茄基因型M82和Moneymaker的mMDH基因序列。基于经计算机鉴定的mMDH基因序列设计聚合酶链式反应
(PCR)的引物。从每一番茄基因型中分离出约6kb的PCR片段,克隆并测序。令人惊奇的是,由
于通常预期较小的差异,来自于番茄基因型的测序mMDH基因与最初由计算机鉴定和分离的
mMDH基因座没有显示出区别。
[0187] 分离的新mMDH基因序列进一步用于锌指试剂的设计。
[0188] 实施例2:设计为结合线粒体苹果酸脱氢酶(mMDH)基因的锌指蛋白的产生
[0189] 如先前描述的设计针对编码番茄v.M82 mMDH基因编码区(见图1)中多个功能域的DNA序列的锌指蛋白。参见例如Urnov等人,(2005)Nature 435:646‑651)。示例性的靶序列
和识别螺旋显示于表1A(识别螺旋区设计)和表1B(靶位点)。在表1B中,通过ZFP识别螺旋接
触的靶位点中的核苷酸以大写字母表示,不接触的核苷酸以小写字母表示。
[0190] 表1A番茄mMDH结合锌指设计
[0191]
[0192]
[0193] 表1B锌指蛋白的靶序列
[0194]
[0195]
[0196] *表示SEQ ID NO:2的互补或反向序列的结合序列。
[0197] 将所设计的mMDH锌指整合入载体中,所述载体编码具有至少一个结构为CCHC的锌指。参见美国专利公开号No.2008/0182332。具体地,每个蛋白的最后一个锌指(finger)具
有用于识别螺旋的CCHC骨架。将非规范性锌指编码序列经由四氨基酸ZC接头融合至IIS型
限制性酶FokI的核酸酶域(Wah等人,(1998)Proc.Natl.Acad.Sci.USA95:10564‑10569的序
列的第384‑579位氨基酸)和源自玉蜀黍(Zea mays)的opaque‑2核定位信号以形成mMDH锌
指核酸酶(ZFN)。采用Shukla等描述的2A核糖体开关信号(Shukla等人.(2009)Nature459:
437::441),在双顺反子表达构建体中表达融合蛋白,并由相对强的组成型和异位的
(ectopic)启动子驱动,例如CsVMV启动子或源自番茄AA6(AA6)启动子的启动子。
[0198] 使用先前显示为鉴定活性核酸酶的基于芽殖酵母的系统来验证优化的锌指的切割活性。参见例如美国专利公开号No.20090111119;Doyon等人.(2008)
Nat.Biotechnol.26:702::708;Geurts等人.(2009)Science325:433。选择针对不同功能域
的锌指用于体内使用。在设计、产生并测试对推定的mMDH基因组多核苷酸靶位点的结合的
大量的ZFN中,有4种ZNF被鉴定为具有高水平的体内活性,并选择用于进一步的实验。参见
表1A。这4种ZFN以能够在植物内高效结合并切割4种独特的mMDH基因组多核苷酸靶位点为
特征。
[0199] 图2A和2B(SEQ ID NO:2)显示了与4个ZFN对(ZFN pairs)的ZFN多核苷酸结合/靶位点相关的mMDH基因座的基因组结构。第一个ZFN对(107830L/107830R;图2A中分别称为
“830L”和“830R”)在外显子1内结合,第二个ZFN对((107832L/107832R;图2A中分别称为
“832L”和“832R”)在外显子3内结合,第三个ZFN对(107833L/107833R;图2A中分别称为
“833L”和“833R”)在外显子4内结合,第四个ZFN对(107835L/107835R;图2A中分别称为
“835L”和“835R”)在外显子6内结合。
[0200] 实施例3:用于在番茄中表达的锌指核酸酶构建体
[0201] 采用本领域公知的技能和技术设计并完成含有4种示例性锌指核酸酶的ZFN表达构建体的质粒载体,所述4种示例性锌指核酸酶是使用酵母测定法鉴定且如实施例2所记载
的。将每个锌指编码序列融合至位于锌指核酸酶上游的编码opaque‑2的核定位信号的序列
(Maddaloni等人.(1989)Nuc.Acids Res.17(18):7532)。
[0202] 然后,将opaque‑2核定位信号::锌指核酸酶融合序列与互补的opaque‑2核定位信号::锌指核酸酶融合序列进行配对。因此,每个构建体均包含由通过来自明脉扁刺蛾β四体
病毒(Thosea asigna virus)的2A序列分隔的两个opaque‑2核定位信号::锌指核酸酶融合
序列构成的单一开放阅读框(Mattion等人.(1996)J.Virol.70:8124::8127)。ZFN编码序列
的表达由高度表达构成性AA6启动子(美国专利公开号No.2009/0328248)驱动,两侧为nos 
3′polyA非翻译区域(Bevan等人,(1983)Nucl.Acid Res.11:369::385)。
[0203] 所得4种质粒构建体pKG7479(包含ZFN 107830L/R构建体),pKG7480(包含ZFN 107832L/R构建体),pKG7481(包含ZFN 107833L/R构建体)和pKG7482(包含ZFN 107835L/R
构建体),通过限制性酶消化实验和DNA测序确认。见图3至6。
[0204] 实施例4:大规模的质粒分离
[0205] 采用如下方案,利用大规模质粒DNA分离方案产生用于原生质体(protoplast)转染的大量DNA。首先,用大肠杆菌TOP10的菌株(Invitrogen,Carlsbad,CA)在37℃过夜接种
含有100μg/mL羧苄青霉素的250mL LB培养基,所述菌株包含如上文实施例3中描述的一种
锌指核酸酶构建体。培养物然后在6000rpm离心15分钟,所得沉淀用20mL无菌GTE缓冲液(每
升:10g葡萄糖、25mL pH为8.0的1M tris和20mL pH为8.0的0.5M EDTA)和20mg溶菌酶
(Duchefa,St.Louis,Mo.)重悬。然后,加入30mL NaOH‑SDS缓冲液(200mM NaOH,1%SDS(w/
v)),无振荡地彻底混合,置冰上孵育3分钟。最后,加入22.5mL醋酸钾缓冲液(294.5g/L),样
品置冰上孵育10分钟。将所得浆液离心(5℃,6000rpm离心25分钟)并通过无菌滤纸过滤后
收集上清。
[0206] 接着,将60mL异丙醇(1体积)加入到过滤的上清中,在室温孵育10分钟。然后将混合物离心(室温,6000rpm离心30分钟),弃去上清,将沉淀在70%乙醇中洗涤。第二轮离心
(室温6000rpm离心5分钟)后,弃去上清,将沉淀溶解于4mL TE溶液(10mM Tris,1mM EDTA,
pH 8.0)中,加入4μl RNase溶液,并将溶液在室温孵育20分钟。然后,样品被转移至12mL管
中,加入400μl pH 5.2的3M NaOAc溶液和4mL苯酚,振荡然后离心(室温4000rpm离心10分
钟)。将离心样品的上层相收集于新管中,加入4ml氯仿/异戊醇(24:1),涡旋、离心(室温
4000rpm,10分钟)。再次收集离心样品的上层相,加入8mL纯乙醇,并在‑20℃孵育30分钟。
[0207] 经过另一轮离心(5℃,4000rpm离心30分钟)后,将沉淀用70%乙醇漂洗并离心(室TM
温,4000rpm离心5分钟),然后在操作台中(flow cabinet)风干。沉淀用4mL MILLI‑Q 纯化
的水溶解并分装到1.5mL eppendorf管中。然后,加入0.5mL的PEG溶液(40%聚乙二醇6000
(w/v),MgCl2:6H2O,过滤(0.2μm)),室温孵育30分钟后,离心样品管(14000rpm 10分钟)。将
沉淀用70%乙醇清洗并离心(14000rpm离心5分钟),该步骤重复2次。去除上清液,沉淀溶解
TM TM
于终体积0.5mL的MILLI‑Q 水中。质粒DNA浓度用NANO DROP 仪器(Thermo Scientific,
Wilmington,Del.)测定。
[0208] 实施例5:番茄原生质体分离和转染
[0209] 番茄叶片原生质体的分离和再生已经在之前记载(Shahin(1985)Theor.Appl.Genet.69:235‑240;Tan等人.(1987)Theor.Appl.Genet.75:105‑108;Tan等
人.(1987)Plant Cell Rep.6:172‑175),可在这些公开出版物中找到能够用于本方案中的
示例性溶液和培养基。简而言之,将番茄(Solanum lycopersicum)种子用0.1%的次氯酸钠
灭菌,在无菌MS20培养基上以光周期为16/8小时、2000lux、25℃、50‑70%相对湿度下体外
培养。然后,将1g收获的新鲜叶片置于含有5mL CPW9M液体培养基的盘子中。用解剖刀片将
收获叶片垂直于主干切割。叶切片宽为~1mm。
[0210] 将叶切片转移至含有25mL酶溶液(CPW9M,包含2%纤维素ONOZUKA RSTM、0.4%浸解TM
酶(macerozyme)ONOZUKA R10 、2,4‑D(2mg/mL)、NAA(2mg/mL)、BAP(2mg/mL),pH5.8)的新鲜
平板中,在黑暗环境中25℃消化过夜。然后,原生质体经置于轨道振荡器(40‑50rpm)振荡1
小时而释放。通过50μm筛网过滤分离细胞碎片中的原生质体,并用CPW9M洗涤筛网两次将细
胞碎片中的原生质体分离出来。然后,原生质体在85倍重力加速度离心,去除上清,沉淀用
一半体积的CPW9M溶液溶解。
[0211] 最后,原生质体溶于3mL CPW9M溶液中,3mL CPW18S小心加入以形成分层界面,并且在两种溶液之间不混和。原生质体在85倍重力加速度旋转10分钟,用长Pasteur吸液管收
集飘浮在界面层处的存活原生质体。加入更多的CPW9M培养基以增加原生质体体积至10mL,
回收的原生质体数量用血球计数器测定。原生质体悬液在5℃经85倍重力加速度离心10分
‑1
钟。去除上清,原生质沉淀重悬至CPW9M洗涤培养基中终浓度为106.mL 。
[0212] 然后用ZFN构建体转染分离的原生质体。在10mL管中,轻柔但完全混合250μl原生质体悬液和质粒DNA(以浓度20μg或30μg使用)和250μl PEG溶液(40%PEG4000,0.1M Ca
(NO3)2,0.4M甘露醇)。室温孵育20分钟后,逐滴加入5mL冷0.275M Ca(NO3)2。原生质体悬液
在4℃以85倍重力加速度离心10分钟。离心后去除上清,原生质体用4mL液体K8p培养基重
悬。原生质体在黑暗环境中28℃孵育48小时,然后通过离心收集以用于分离基因组DNA。
[0213] 采用以上描述过的方案通过转染番茄原生质体检测番茄细胞原生质体内ZFN的活性。大规模分离番茄原生质体,并采用PEG介导的转染方法将质粒DNA导入原生质体细胞中。
典型地,当采用报道构建体例如含有绿色荧光蛋白(GFP)基因的报告构建体时,观察到高达
80%的转染率。大量被导入番茄细胞中的质粒拷贝产生了大量的由该质粒编码的蛋白。由
此,表达GFP蛋白的番茄细胞可在转染后长达48小时检测到。但是,由于在48小时内细胞中
的质粒DNA会被清除,因此导入构建体的表达是瞬时的。
[0214] 实施例6:番茄原生质体内的ZFN活性
[0215] 为了测定番茄原生质体中ZFN构建体的表达和ZFN切割番茄基因组DNA中mMDH基因座的活性,实施了如下的足迹分析(footprint analysis)。分离番茄原生质体,并用携带有
四种示例性ZFN构建体之一的质粒DNA转染,所述质粒DNA为:KG7479(包括ZFN 107830L/R构
建体);pKG7480(包括ZFN 107832L/R构建体);pKG7481(包括ZFN 107833L/R构建体);或
pKG7482(包括ZFN 107835L/R构建体)。导入细胞之后,ZFN表达,ZFN酶诱导在特定mMDH靶位
点处的DNA双链断裂(DSB)。DNA DSB由参与非同源性末端连接(NHEJ)通路的蛋白质修复,这
种修复过程有时是易错的并导致在DSB导入位点处的小插入或缺失(“indels”)。经ZFN处理
后,PCR扩增mMDH靶位点,检测产生的插入缺失并通过高分辨熔解(HRM)曲线分析和/或测序
进行定量。
[0216] 分离来自于番茄M82变体的原生质体(~250,000)并用不同浓度(20或30μg)的pKG7479、pKG7480、pKG7481和pKG7482质粒转染,48小时后收集细胞。使用包含AA6::GFP构
TM
建体的质粒转染番茄原生质体作为阴性对照。然后,利用DNEASY MINI KIT (Qiagen,
Valencia,Calif.)从每份样品分离基因组DNA,并测定DNA浓度。采用HERCULASE II FUSION 
TM
KIT 并按照生产商的操作说明书(Agilent Technologies,Santa Clara,Calif.)从每一转
染的原生质体样品中扩增与导入的ZFN构建体对应的相关靶位点。采用HERCULASE II 
TM
FUSION KIT 并按照生产商的说明书从已转染GFP对照构建体的阴性对照样品扩增所有靶
位点。PCR扩增中使用的引物被描述在表2A(PCR分析)和2B(HRM分析)中。
[0217] 表2A用于PCR分析的靶位点特异性引物
[0218]
[0219]
[0220] 表2B用于HRM分析的引物
[0221]
[0222] PCR扩增产物采用PCR PURIFICATION KITTM(Qiagen)进行纯化,50ng纯化的DNA按TM
照生产商的说明书克隆入ZERO BLUNT CLONING KIT (Invitrogen)。然后,2μl连接混合物
被转入大肠杆菌ONE‑SHOT TOP 10感受态细胞中(Invitrogen),并用补充有100μg/mL卡那
霉素的LB培养基选择克隆。利用表2中所述的HRM引物,按照生产商的操作说明进行
TM
HERCULASE II FUSION KIT PCR反应(终体积为50μl)。每一设置(each set)或PCR引物扩增
大约200bp的片段。将所得PCR产物用于HRM分析。
[0223] HRM分析由行业公认的程序完成。简而言之,将PCR产物按1:1比例与野生型PCR产物混合,所述野生型PCR产物采用相同引物在未经处理过(不经ZFN处理)的基因组DNA上产
TM
生。加入 ‑Green染料,在ROCHE LIGHT  CYCLER (Roche Diagnostics,
Indianapolis,Ind.)装置中检测PCR产物的熔解曲线概况。与未经处理的野生型PCR产物熔
解曲线相比,具有明显不同的熔解曲线的PCR产物被鉴定出来并进行保存。然后直接在经
HRM程序鉴定的细菌克隆上利用M13F和M13R引物完成PCR反应,纯化所得PCR产物并测序。分
析结果如表3和图7所述。
[0224] 表3HRM和测序分析汇总
[0225] 构建体编号 ZFN编号 分析的总克隆 INDEL克隆 %INDEL克隆pKG7479 107830 288 12 4.1
pKG7480 107832 288 16 5.5
pKG7481 107833 288 6 2.0
pKG7482 107835 288 2 0.7
[0226] 如显示的那样,在所有ZFN靶位点都检测到了indel的形成,这说明所有4种ZFN在番茄原生质体中均是有活性的。通过计算由含有indel的处理产生的PCR产物数量可以评估
给定的ZFN构建体的效率。ZFN 107830和107832显示出了数量最多的indel PCR产物(分别
为4.1%和5.5%)。然而ZFN 107833和107835的indel PCR产物是明显较低的(分别为2%和
0.7%)。在源自用GFP质粒处理的对照番茄原生质体的PCR产物中没有检测到任何indel。
[0227] 实施例7:分离在mMDH基因座处含有突变的植物
[0228] 从番茄变体M82和Moneymaker分离番茄原生质体,并如先前描述的用pKG7479、pKG7480、pKG7481和pKG7482进行转染。为了再生转染的番茄植株,原生质体最终重悬于2mL
藻酸盐溶液(甘露醇90g/L,CaCl2.2H20140mg/L,藻酸钠20g/L(Sigma‑Aldrich,St.Louis,
Mo.))中,通过倒置彻底混合。在该重悬过程中,1mL细胞在Ca‑琼脂平板(72.5g/L甘露醇,
7.35g/LCaCl2.2H2O,8g/L凝胶)上均匀分层,并允许聚合。藻酸盐盘随后转移至含有4mL K8p
培养基的4cm布氏培养皿(Petri dish)中,在黑暗中28℃生长7天。经过所分配的温育时间
后,将藻酸盐盘切成薄条带,放置于含有GM‑ZG培养基的培养皿中,在黑暗中28℃培养3周以
促进愈合组织发育。经过该孵育期,从条带中挑选单独的愈合组织,并排列于新鲜的GM‑ZG
培养基上,25℃光照培养。3周后将愈合组织转移至新鲜GM‑ZG培养基中。这一步骤重复两
次,直至愈合组织达到约2cm大小。
[0229] 接下来,将愈合组织转移至培养基(MS20‑ZI;MS20+2mg/L玉米素+0.1mg/L IAA)中以促进茎(shoot)的形成,重复转移直至形成茎。然后每一茎上摘取一片叶片用于DNA分离,
并利用表2中描述的引物扩增相关mMDH靶位点,PCR反应方法如前所述。纯化PCR产物并测
序,以鉴定含有mMDH基因座内突变的茎。这些茎被转移至生根培养基中(MS20+0.5mg/
1IBA),最终移至温室中。
[0230] 这些实验中番茄植株基因组产生的突变汇总结果显示在表4中。ZFN结合位点标有下划线,缺失的核苷酸用(‑)显示。用星号标记的植物鉴定编号表示在mMDH的两个拷贝具有
相同的突变而且所述突变测定为纯合的植物。
[0231] 表4:mMDH内ZFN诱导的突变的汇总
[0232]
[0233]
[0234]
[0235] 然后将可育的突变植物系与亲本植物杂交,收集F1代种子。筛选F1代幼苗以测定存在于亲本突变植物中的indel突变,培养这些植物直至成熟并自繁殖制备F2代种子。由F2
代种子培养的番茄植株可以用于测定突变对番茄产量的影响。
[0236] 实施例8:mMDH基因座处突变的分子和生物化学确认
[0237] 来自每一突变植物系的F2代种子发芽,通过扩增突变位点和测序PCR产物对12株秧苗进行基因分型,从而确定秧苗是否含有野生型序列,或者对于indel突变为杂合性还是
纯合性。然后允许每一类型中的2株秧苗(共6株)生长至成熟并长出果实。收集来自每一植
物的组织样品,测量各种突变对mMDH蛋白水平和mMDH活性的影响。通过Western blotting
半定量测量mMDH蛋白水平,通过测定番茄植株果实产量来测量mMDH活性。
[0238] 为测定mMDH蛋白水平,使用多克隆抗mMDH抗体来检测植物衍生的蛋白,所述抗体通过用mMDH表位(RSEVAGFAGEEQLGQA,SEQ ID NO:62)接种兔产生,并使用在大肠杆菌中过
表达的重组mMDH蛋白测试。检测来自转基因和对照植物的叶片样品中的mMDH。将来自转基
因和对照植物的植物提取物与mMDH蛋白标准一起测定,将其与含有DTT的 LDS
样品缓冲液(Invitrogen,Carlsbad,CA)于90℃孵育10分钟,采用MES电泳缓冲液
(Invitrogen)在预制的丙烯酰胺凝胶中电泳分离。随后按照Invitrogen制造商的方案,将
蛋白电转移至硝酸纤维素膜上。经 Blocking Mix(Invitrogen)封闭和0.1%
PBST洗涤后,通过抗‑mMDH抗血清继之以山羊抗兔磷酸酶检测mMDH蛋白。使用等体积混合的
TM TM
SuperSignal West Pico Luminol Enhancer 与Stable Peroxide Solution (Pierce,
Rockford,IL.)经由化学发光法可以看到检测的蛋白。
[0239] 在F2代突变植物家族上完成Western blot测定以检测mMDH蛋白的存在和确定其分子量。在缺少indel突变的F2代对照植物和杂合indel突变的F2植物中可检测到全长的
mMDH蛋白。但是,在纯合indel突变(破坏mMDH开放阅读框)的F2代植物中检测不到mMDH蛋白
的信号。包含纯合indel的F2代植物产生了截短的mMDH蛋白序列。mMDH蛋白序列通过导入过
早成熟(premature)的终止密码子或缩短mMDH蛋白而被截短。预期截短的mMDH蛋白在
Western blot上以具有较小分子量的条带存在。但是这样的更小的条带没有被检测到。这
些结果说明截短的蛋白在细胞中被降解了。包含纯合的indel突变的F2突变植株107832_8‑
3和107832_9‑6产生了通过Western blot分析显示的全长mMDH蛋白,其中纯合的indel突变
导致位于保守NAD结合域中的一个、两个或更多个氨基酸的缺失或改变(即mMDH蛋白未被截
短)。
[0240] 完成生化分析以测量F2代植物中mMDH的活性。mMDH蛋白催化苹果酸和NAD+转化为草酰乙酸和NADH,反之亦然。转化的NADH在OD340nm处展示出最大吸光度,然而在这一波长
NAD+的吸光度可以忽略不计。因此,样品的mMDH活性可通过在草酰乙酸存在条件下的NADH
到NAD+的转化率来检测。从各F2代植株幼叶中获取直径约2cm的5个叶打孔片(punch),在4
℃在提取缓冲液(50mM咪唑‑HCl缓冲液,包含10mM二硫苏糖醇,20mMMgCl2和2mM EDTA)中碾
碎。将叶片提取物在冷冻离心机中在10,000g离心20分钟;倾出上清并置于冰上直至在分析
中利用酶制备物。为了进行分析,将1.5mL分析缓冲液(50mM Tris‑HCl pH8.0,1mM EDTA)吸
入管中,随后100μl酶提取物被加入并在37℃水浴中孵育5分钟。将混合物倒入石英检测杯
中,然后加入50μl NADH(Tris‑HCl中6mM NADH,pH 8.0),置于设置在340nm的分光光度计
中。以每隔15秒直至3分钟记录初始读数和随后吸光度的降低,并将这些读数作为对照。然
后,加入50μl草酰乙酸(在蒸馏水中现制的0.3M草酰乙酸),记录吸光度3分钟。针对符合阅
读框(in frame)和无义indel突变分离的F2系中的mMDH活性显示于图8。
[0241] 源自于107832_9‑6系的、对indel突变(‑3bps)分离的F2代植物在Westernblot中产生了全长mMDH。所有检测植物中MDH的活性在生物化学分析中都是相似的。生物化学分析
结果对于所有检测植物遵循相同的趋势。检测的植物包括无义(null)、杂合的和纯合的植
物,这些植物含有indel突变并产生缺少单个氨基酸的mMDH蛋白。因此,在生化分析中氨基
酸的缺失对mMDH活性没有不利影响。不过,由于生化分析没有足够的敏感以检测到mMDH活
性的中度降低,因此生化分析的有效性可能会被轻度受损。也使用生化分析检测源自
107832_10‑2系且对indel突变(‑2bps)分离的F2代植物。indel突变空白和杂合的植物产生
相似的mMDH活性水平。而indel突变纯合的植物却显示出了mMDH活性的显著降低。Western 
blot检测中,在这些植物中没有检测到mMDH蛋白。
[0242] 实施例9:在mMDH基因座处的突变对番茄果实产量的影响
[0243] 为了测定先前描述的突变对番茄果实产量的影响,收集第一番茄穗束(truss)的所有果实,采用Centeno等描述的方法(Centeno等.(2011)Plant Cell23:162‑184)测定番
茄的数量和每个番茄的鲜重。
[0244] 在源自indel突变107832_9‑6(‑3bps)的F2代植物中测量每一个收获的番茄的平均鲜重和收获的第一穗束突变植物(杂合的或纯合的)所有番茄的总鲜重。获自于纯合的
107832_9‑6番茄植物的番茄鲜重大于对照组的番茄(不包括突变的)。见图9。107832_9‑6番
茄植株中在mMDH基因座处产生的突变降低了蛋白活性,从而增加了果实产量。相反,对导致
mMDH开放阅读框破坏的任一indel突变杂合的番茄植株显示出生长降低和果实总产量更
低。因此,在对indel突变纯合的植物中检测到的mMDH活性的降低导致了总番茄果实产量的
增加。
[0245] 实施例10:mMDH基因座处的突变对酶速率和活性的影响
[0246] 先前描述的由ZFN切割导致的番茄基因组中mMDH酶的突变,被引入到编码源自番茄(SEQ ID NO:1)、大豆(SEQ ID NO:125)和玉米(SEQ ID NO:126)的天然mMDH酶的分离多
核苷酸序列中。
[0247] 图10中显示了这些酶天然形式的比对,这表明来源于不同植物种属的mMDH酶享有高水平的序列相似性和保守的蛋白基序。图11显示了由ZFN切割导致的番茄mMDH酶的突变,
这些肽序列对应于表4中显示的切割的DNA序列。
[0248] 本公开的实施方案进一步包括贯穿整个编码mMDH酶的分离的多核苷酸序列所掺入的新突变。第一和第二NADH结合位点均包含主要的导入突变。相对于野生型(天然的)序
列编号的一个或多个氨基酸的示例性突变(如删除和/或插入)包括但不限于在一个或多个
氨基酸残基处的突变:104‑136,相对于SEQ ID NO:1所示的番茄MDH序列编号和排列(V,V,
I,I,P,A,G,V,P,R,K,P,G,M,T,R,D,D,L,F,N,I,N,A,G,I,V,K,S,L,C,T,A),和/或氨基酸残
基171‑220,相对于SEQ ID NO:1所示的番茄MDH序列编号(D,E,K,K,L,F,G,V,T,M,L,D,V,V,
R,A,K,T,F,Y,A,G,K,A,K,V,N,V,A,E,V,N,L,P,V,V,G,G,H,A,G,I,T,I,L,P,L,F,S,Q);在氨
基酸残基104‑136处(V,V,I,I,P,A,G,V,P,R,K,P,O,M,T,R,D,D,L,F,N,I,N,A,G,I,V,K N,
L,S,T,A)和/或氨基酸残基171‑220处的一个或多个突变(D,E,K,K,L,F,G,V,T,T,L,D,V,V,
R,A,K,T,F,Y,A,G,K,A,N,L,P,V,T,D,V,N,V,P,V,V,G,G,H,A,G,I,T,I,L,P,L,F,S,Q),其相
对于SEQ ID NO:126所示的玉米MDH序列编号并与SEQ ID NO:1联配;和在一个或多个的氨
基酸残基104‑136(V,V,I,I,P,A,G,V,P,R,K,P,G,M,T,R,D,D,L,F,N,I,N,A,G,I,V,E,T,L,
C,T,A)和/或氨基酸残基171‑220处(D,E,K,R,L,F,G,V,T,T,L,D,V,V,R,A,K,T,F,Y,A,G,K,
A,N,V,P,V,A,G,V,N,V,P,V,V,G,G,H,A,G,I,T,I,L,P,L,F,S,Q)的突变,其相对于SEQ ID 
NO:125所示的大豆MDH序列编号并与SEQ ID NO:1联配。
[0249] 编码MDH基因中这些突变的多核苷酸序列显示如下(SEQ ID NO:132‑137和SEQ ID NO:124)
[0250] 玉米mMDH突变#1(3核苷酸缺失)(SEQ ID NO:132)
[0251] ATGAAGGCCGTCGCTGATGAGATCCACCTCCCAGCTCCTCCGCCGCCGGAGCTACTCCTCCGCATCCGGGCAGCCCGAGCGGAAGGTGGCCATCCTCGGGGCGGCGGGGGGCATCGGGCAGCCGCTGTCGCTGCTCATGAAGCTTA
ACCCACTCGTCTCCTCCCTCTCGCTCTACGATATCGCCGGCACCCCAGGTGTCGCGGCCGACGTCTCCCACATCAAC
TCCCCCGCCCTGGTGAAGGGTTTCATGGGTGATGAGCAGCTTGGGGAAGCGCTAGAGGGCTCGGACGTGGTGATCAT
ACCGGCCGGCGTCCCGAGGAAGCCCGGCATGACCAGGGACGACCTATTCAATATCAACGCTGGCATCGTTAAGAACC
TCAGCACCGCCATCGCCAAGTACTGCCCCAATGCCCTTGTCAACATGATCAGCAACCCTGTGAACTCAACTGTACCG
ATTGCTGCTGAGGTTTTCAAGAAGGCTGGGACATATGATGAGAAGAAGTTGTTTGGCGTGACCACTGATGTTGTTCG
TGCTAAGACTTTCTATGCTGGGAAGGCTAATTTACCAGTTACCGATGTGAATGTCCCTGTTGTTGGTGGTCATGCGG
GTATCACTATCCTGCCGTTGTTCTCACAGGCCACCCCTGCAACCAACGCATTGTCTGATGAAGACATCAAGGCTCTC
ACCAAGAGGACACAGGATGGTGGAACTGAAGTTGTCGAGGCAAAGGCTGGGAAGGGCTCTGCAACCTTGTCCATGGC
GTATGCTGGTGCTGTTTTTGCAGATGCATGCTTGAAGGGTCTCAATGGAGTTCCGGATATTGTTGAGTGCTCTTTTG
TTCAATCAACTGTAACAGAGCTTCCATTCTTTGCATCTAAGGTAAGGCTTGGGAAGAATGGAGTTGAGGAAGTGCTT
GGATTAGGTGAGCTGTCGGACTTTGAGAAAGAAGGGTTGGAGAAGCTCAAGAGCGAGCTCAAGTCTTCGATTGAGAA
GGGTATCAAGTTTGCAAATGATAACTAG
[0252] 玉米mMDH突变#2(9核苷酸缺失)(SEQ ID NO:133)
[0253] ATGAAGGCCGTCGCTGATGAGATCCACCTCCCAGCTCCTCCGCCGCCGGAGCTACTCCTCCGCATCCGGGCAGCCCGAGCGGAAGGTGGCCATCCTCGGGGCGGCGGGGGGCATCGGGCAGCCGCTGTCGCTGCTCATGAAGCTTA
ACCCACTCGTCTCCTCCCTCTCGCTCTACGATATCGCCGGCACCCCAGGTGTCGCGGCCGACGTCTCCCACATCAAC
TCCCCCGCCCTGGTGAAGGGTTTCATGGGTGATGAGCAGCTTGGGGAAGCGCTAGAGGGCTCGGACGTGGTGATCAT
ACCGGCCGGCGTCCCGAGGAAGCCCGGCATGACCAGGGACGACCTATTCAATATCAACGCTGGCATCGTTAAGAACC
TCAGCACCGCCATCGCCAAGTACTGCCCCAATGCCCTTGTCAACATGATCAGCAACCCTGTGAACTCAACTGTACCG
ATTGCTGCTGAGGTTTTCAAGAAGGCTGGGACATATGATGAGAAGAAGTTGTTTGGCGTGACCATTGTTCGTGCTAA
GACTTTCTATGCTGGGAAGGCTAATTTACCAGTTACCGATGTGAATGTCCCTGTTGTTGGTGGTCATGCGGGTATCA
CTATCCTGCCGTTGTTCTCACAGGCCACCCCTGCAACCAACGCATTGTCTGATGAAGACATCAAGGCTCTCACCAAG
AGGACACAGGATGGTGGAACTGAAGTTGTCGAGGCAAAGGCTGGGAAGGGCTCTGCAACCTTGTCCATGGCGTATGC
TGGTGCTGTTTTTGCAGATGCATGCTTGAAGGGTCTCAATGGAGTTCCGGATATTGTTGAGTGCTCTTTTGTTCAAT
CAACTGTAACAGAGCTTCCATTCTTTGCATCTAAGGTAAGGCTTGGGAAGAATGGAGTTGAGGAAGTGCTTGGATTA
GGTGAGCTGTCGGACTTTGAGAAAGAAGGGTTGGAGAAGCTCAAGAGCGAGCTCAAGTCTTCGATTGAGAAGGGTAT
CAAGTTTGCAAATGATAACTAG
[0254] 大豆mMDH突变#1(3核苷酸缺失)(SEQ ID NO:134)
[0255] ATGAAGCCATCGATGCTCAGATCTCTTCACTCTGCCGCCACCCGCGGCGCCTCCCACCTCTCCCGCCGTGGCTACGCCTCCGAGCCGGTGCCGGAGCGCAAGGTGGCCGTTCTAGGTGCCGCCGGCGGGATCGGGCAACCCCTCTC
CCTTCTCATGAAGCTCAACCCCCTCGTTTCCAGCCTCTCCCTCTACGATATCGCCGGAACTCCCGGTGTCGCCGCCG
ATGTCAGCCACATCAACACCGGATCTGAGGTAGTGGGGTACCAAGGTGACGAAGAGCTCGGAAAAGCTTTGGAGGGT
GCAGATGTTGTTATAATTCCTGCTGGTGTGCCCAGAAAGCCTGGAATGACTCGTGATGATCTTTTTAACATCAATGC
TGGCATTGTTGAGACACTGTGTACTGCTATTGCTAAGTACTGCCCTCATGCCCTTGTTAACATGATAAGCAATCCTG
TGAACTCCACTGTTCCTATTGCTGCTGAAGTTTTCAAGAAGGCAGGAACGTATGATGAGAAGAGATTGTTTGGTGTT
ACCACTGATGTTGTTAGGGCAAAAACTTTCTATGCTGGGAAAGCCAATGTTCCAGTTGCTGGTGTTAATGTACCTGT
TGTGGGTGGCCATGCAGGCATTACTATTCTGCCATTATTTTCTCAAGCCACACCAAAAGCCAATCTTGATGATGATG
TCATTAAGGCTCTTACAAAGAGGACACAAGATGGAGGAACAGAAGTTGTAGAAGCTAAGGCTGGAAAGGGTTCTGCA
ACTTTGTCAATGGCCTATGCTGGTGCCCTATTTGCTGATGCTTGCCTTAAGGGCCTCAATGGAGTCCCAGATGTTGT
GGAGTGCTCATTCGTGCAATCCACTGTTACTGAACTTCCCTACTTTGCTTCCAAGGTGAGGCTTGGGAAGAATGGAG
TGGAGGAAGTTCTGGGCTTAGGACCTCTCTCAGATTTTGAGCAACAAGGCCTCGAAAGCCTTAAGCCTGAACTCAAA
TCATCAATTGAGAAGGGAATCAAATTTGCCAACCAGTAA
[0256] 大豆mMDH突变#2(9核苷酸缺失)(SEQ ID NO:135)
[0257] ATGAAGCCATCGATGCTCAGATCTCTTCACTCTGCCGCCACCCGCGGCGCCTCCCACCTCTCCCGCCGTGGCTACGCCTCCGAGCCGGTGCCGGAGCGCAAGGTGGCCGTTCTAGGTGCCGCCGGCGGGATCGGGCAACCCCTCTC
CCTTCTCATGAAGCTCAACCCCCTCGTTTCCAGCCTCTCCCTCTACGATATCGCCGGAACTCCCGGTGTCGCCGCCG
ATGTCAGCCACATCAACACCGGATCTGAGGTAGTGGGGTACCAAGGTGACGAAGAGCTCGGAAAAGCTTTGGAGGGT
GCAGATGTTGTTATAATTCCTGCTGGTGTGCCCAGAAAGCCTGGAATGACTCGTGATGATCTTTTTAACATCAATGC
TGGCATTGTTGAGACACTGTGTACTGCTATTGCTAAGTACTGCCCTCATGCCCTTGTTAACATGATAAGCAATCCTG
TGAACTCCACTGTTCCTATTGCTGCTGAAGTTTTCAAGAAGGCAGGAACGTATGATGAGAAGAGATTGTTTGGTGTT
ACCATTGTTAGGGCAAAAACTTTCTATGCTGGGAAAGCCAATGTTCCAGTTGCTGGTGTTAATGTACCTGTTGTGGG
TGGCCATGCAGGCATTACTATTCTGCCATTATTTTCTCAAGCCACACCAAAAGCCAATCTTGATGATGATGTCATTA
AGGCTCTTACAAAGAGGACACAAGATGGAGGAACAGAAGTTGTAGAAGCTAAGGCTGGAAAGGGTTCTGCAACTTTG
TCAATGGCCTATGCTGGTGCCCTATTTGCTGATGCTTGCCTTAAGGGCCTCAATGGAGTCCCAGATGTTGTGGAGTG
CTCATTCGTGCAATCCACTGTTACTGAACTTCCCTACTTTGCTTCCAAGGTGAGGCTTGGGAAGAATGGAGTGGAGG
AAGTTCTGGGCTTAGGACCTCTCTCAGATTTTGAGCAACAAGGCCTCGAAAGCCTTAAGCCTGAACTCAAATCATCA
ATTGAGAAGGGAATCAAATTTGCCAACCAGTAA
[0258] 番茄mMDH del3(SEQ ID NO:136)
[0259] ATGTCAAGGACCTCCATGTTGAAATCCATCGTCCGCCGGAGCTCCACTGCCGGAGCATCCTATGTATCTCGCCGTGGATTCGCATCGGGATCCGCGCCGGAGAGGAAAGTTGCAGTTTTGGGGGCAGCCGGAGGGATTGGACAGCC
TTTATCTCTTCTAATGAAGCTTAACCCTTTAGTATCCAGCCTTTCACTCTACGATATCGCCGGTACTCCCGGTGTTG
CCGCCGATGTTAGTCACATCAACACCAGATCTGAGGTTGCCGGTTTTGCAGGAGAAGAGCAGCTAGGGCAGGCACTG
GAAGGAGCTGATGTTGTTATCATTCCTGCTGGTGTGCCCCGAAAGCCTGGTATGACCCGAGATGATCTGTTCAACAT
TAATGCGGGTATTGTTAAATCTCTATGCACGGCCATTGCTAAGTACTGCCCCAATGCTCTGGTCAATATGATAAGCA
ACCCAGTGAATTCCACTGTCCCTATTGCTGCTGAGGTGTTTAAGAAAGCTGGAACTTATGATGAAAAGAAGCTCTTT
GGAGTTACCATTGATGTGGTTAGGGCCAAGACATTTTATGCTGGAAAAGCTAAAGTAAATGTTGCTGAGGTCAATCT
CCCAGTAGTTGGTGGTCATGCTGGCATAACTATCCTCCCATTATTTTCTCAAGCCACTCCAAAGGCAAATCTATCAT
ATGAGGAAATTGTTGCACTCACAAAGCGAACCCAAGATGGTGGGACAGAAGTTGTAGAAGCCAAAGCTGGAAAGGGT
TCAGCCACCCTCTCAATAGCCTATGCTGGGGCTATTTTTGCCGATGCTTGCTTGAAGGGGTTGAATGGAGTTCCCGA
TGTTGTTGAATGTGCTTTTGTGCAGTCCAATGTCACCGAGCTTCCCTTCTTCGCATCCAAGGTAAGACTTGGGAAAA
ATGGAGTGGAGGAAGTCCTAGGGTTGGGTCCACTTAACGACTACGAGAAGCAAGGACTTGAGGCTCTTAAGCCAGAG
CTGCTCTCCTCCATTGAAAAGGGAATCAAGTTTGCCAAAGAAAACTAA
[0260] 番茄mMDH del 9(SEQ ID NO:137)
[0261] ATGTCAAGGACCTCCATGTTGAAATCCATCGTCCGCCGGAGCTCCACTGCCGGAGCATCCTATGTATCTCGCCGTGGATTCGCATCGGGATCCGCGCCGGAGAGGAAAGTTGCAGTTTTGGGGGCAGCCGGAGGGATTGGACAGCC
TTTATCTCTTCTAATGAAGCTTAACCCTTTAGTATCCAGCCTTTCACTCTACGATATCGCCGGTACTCCCGGTGTTG
CCGCCGATGTTAGTCACATCAACACCAGATCTGAGGTTGCCGGTTTTGCAGGAGAAGAGCAGCTAGGGCAGGCACTG
GAAGGAGCTGATGTTGTTATCATTCCTGCTGGTGTGCCCCGAAAGCCTGGTATGACCCGAGATGATCTGTTCAACAT
TAATGCGGGTATTGTTAAATCTCTATGCACGGCCATTGCTAAGTACTGCCCCAATGCTCTGGTCAATATGATAAGCA
ACCCAGTGAATTCCACTGTCCCTATTGCTGCTGAGGTGTTTAAGAAAGCTGGAACTTATGATGAAAAGAAGCTCTTT
GGAGTTACCATGGTTAGGGCCAAGACATTTTATGCTGGAAAAGCTAAAGTAAATGTTGCTGAGGTCAATCTCCCAGT
AGTTGGTGGTCATGCTGGCATAACTATCCTCCCATTATTTTCTCAAGCCACTCCAAAGGCAAATCTATCATATGAGG
AAATTGTTGCACTCACAAAGCGAACCCAAGATGGTGGGACAGAAGTTGTAGAAGCCAAAGCTGGAAAGGGTTCAGCC
ACCCTCTCAATAGCCTATGCTGGGGCTATTTTTGCCGATGCTTGCTTGAAGGGGTTGAATGGAGTTCCCGATGTTGT
TGAATGTGCTTTTGTGCAGTCCAATGTCACCGAGCTTCCCTTCTTCGCATCCAAGGTAAGACTTGGGAAAAATGGAG
TGGAGGAAGTCCTAGGGTTGGGTCCACTTAACGACTACGAGAAGCAAGGACTTGAGGCTCTTAAGCCAGAGCTGCTC
TCCTCCATTGAAAAGGGAATCAAGTTTGCCAAAGAAAACTAA
[0262] NADH结合域1中的番茄mMDH del(SEQ ID NO:124)
[0263] ATGTCAAGGACCTCCATGTTGAAATCCATCGTCCGCCGGAGCTCCACTGCCGGAGCATCCTATGTATCTCGCCGTGGATTCGCATCGGGATCCGCGCCGGAGAGGAAAGTTGCAGTTTTGGGGGCAGCCGGAGGGATTGGACAGCC
TTTATCTCTTCTAATGAAGCTTAACCCTTTAGTATCCAGCCTTTCACTCTACGATATCGCCGGTACTCCCGGTGTTG
CCGCCGATGTTAGTCACATCAACACCAGATCTGAGGTTGCCGGTTTTGCAGGAGAAGAGCAGCTAGGGCAGGCACTG
GAAGGAGCTGATGTTGTTATCATTCCTGCTGGTGTGCCCCGAAAGCCTGGTACCCGAGATGATCTGTTCAACATTAA
TGCGGGTATTGTTAAATCTCTATGCACGGCCATTGCTAAGTACTGCCCCAATGCTCTGGTCAATATGATAAGCAACC
CAGTGAACTCCACTGTCCCTATTGCTGCTGAGGTGTTTAAGAAAGCTGGAACTTATGATGAAAAGAAGCTCTTTGGA
GTTACCATGCTTGATGTGGTTAGGGCCAAGACATTTTATGCTGGAAAAGCTAAAGTAAATGTTGCTGAGGTCAATCT
CCCAGTAGTTGGTGGTCATGCTGGCATAACTATCCTCCCATTATTTTCTCAAGCCACTCCAAAGGCAAATCTATCAT
ATGAGGAAATTGTTGCACTCACAAAGCGAACCCAAGATGGTGGGACAGAAGTTGTAGAAGCCAAAGCTGGAAAGGGT
TCANCCACCCTCTCAATAGCCTATGCTGGGGCTATTTTTGCCGATGCTTGCTTGAAGGGGTTGAATGGAGTTCCCGA
TGTTGTTGAATGTGCTTTTGTGCAGTCCAATGTCACCGAGCTTCCCTTCTTCGCATCCAAGGTAAGACTTGGGAAAA
ATGGAGTGGAGGAAGTCCTAGGGTTGGGTCCACTTAACGACTACGAGAAGCAAGGACTTGAGGCTCTTAAGCCAGAG
CTGCTCTCCTCCATTGAAAAGGGAATCAAGTTTGCCAAAGAAAACTAA
[0264] 含有突变MDH开放阅读框的质粒的构建
[0265] 含有融合至6×His标签的番茄mMDH ORF的质粒pKG7495,经HindIII和XhoI限制性TM
酶消化,采用QIAGEN GEL ISOLATION KIT (Qiagen,Carlsbad,Calif.)从琼脂糖凝胶中分
离出5.8kbp的载体条带。合成(GeneArt)侧翼为HindIII/XhoI位点的番茄mMDH序列部分。这
些序列在第二NADH结合域缺少3bp序列(核苷酸543至545缺失;SEQ ID NO:136),对应于在
番茄植物中由ZFN切割这些基因组基因座产生的突变。第二番茄mMDH突变合成在HindIII/
XhoI片段,该片段缺少在第一NADH结合域的3bp(核苷酸353至355缺失;SEQ ID NO:124)。所
有片段均连接入pKG7495载体中,测序鉴定克隆。这些构建体产生一系列的在所有两个NADH
结合域有符合阅读框缺失的番茄突变mMDH克隆,其在大肠杆菌杂合的生产体系中过表达。
[0266] 线粒体苹果酸脱氢酶(mMDH)的过表达和纯化
[0267] 野生型或突变mMDH构建体被克隆到大肠杆菌表达载体中。载体DNA转化到ONEBL21(DE3)化学感受态细胞(Invitrogen)中。克隆靶基因使得当过表达时,产生
的酶含有N末端的六聚组氨酸标签。菌落在含有100μg/mL羧苄青霉素的LB平板上37℃培养
过夜。将单个菌落用来接种于50mL相同培养基的LB种子培养基中。培养于37℃生长过夜,随
后用来接种于1.2L含有100100μg/mL羧苄青霉素的LB中。对于野生型mMDH酶,在OD600为0.6
时用1mM IPTG诱导培养物。诱导允许在37℃进行4小时,8000rpm离心15分钟收集细胞。所有
变体均置冰浴中10分钟,然后在低温(19℃)用200μM IPTG诱导18小时。
[0268] 细胞沉淀在15‑20mL缓冲液A(50mM Tris‑HCl pH 8.2,300mM NaCl,10mM咪唑,和5%甘油)中重悬。一旦溶解立即加入蛋白酶抑制剂(Roche Complete Mini tablets)和溶
菌酶(1mg/mL)。在4℃搅拌溶液20分钟,置冰上超声破碎4×1分钟。离心(16500rpm 45分钟)
除去细胞碎片,接着将粗制裂解物施加到在缓冲液A中平衡的1mL His Trap FF柱。采用从0
至100%的线性梯度的缓冲液B(50mM Tris‑HCl pH 8.2,300mM NaCl,10mM咪唑和5%甘油)
在20个柱体积内洗脱蛋白靶物。SDS‑PAGE分析和活性分析鉴定含有mMDH的级分。阳性级分
收集起来并用装备有10kDa分子量截留膜(10kDa molecular weight cutoff membrane)的
Amicon超滤设备浓缩。浓缩的级分使用PD 10凝胶过滤缓冲液交换为缺少咪唑的缓冲液A
中。蛋白浓度通过使用Expasy Bioinformatics Resource Portal ProtParam工具计算的
理论摩尔消光系数而测定。除去盐分的酶在液氮中快速冻存并保存于‑80℃中,直到进一步
使用。SDS‑PAGE分析证实,纯化蛋白的分子量与它们所计算的分子量~37kDa对应。
[0269] 野生型和突变mMDH的比活性
[0270] 35℃在微板读数器中进行酶测定,200μL终体积中含有100mM pH 8.2的Tris‑HCl、400μM NADH、0.0075‑0.045μM mMDH或mMDH突变体。反应在35℃孵育1分钟,接着通过加入终
浓度为3mM的草酰乙酸启动反应。分光光度法监测NADH氧化(340nm)从而测定初始速率。所
述速率使用摩尔消光系数6220M‑1 cm‑1,从mOD/min转化为μM min‑1。酶分析结果显示在图
13和表15中。
[0271] 如显示的那样,通过分光光度法检测NADH氧化来测定野生型和两种番茄突变体mMDH酶的比活性。SEQ ID NO:124编码(在表5和图13标记为“mMDH del3 NADH BSI”)的第一
NADH结合序列的突变显著减少并产生为野生型酶1.5%的活性。相对而言,SEQ ID NO:136
编码(在表5和图13标记为“mMDH del3”)的第二NADH结合序列的突变保持了野生型酶约
23%的活性。mMDH酶NADH结合位点中导入的突变引起了酶活性降低,因此导致了在mMDH酶
中包含这些突变的番茄植物生长出了鲜重更大的果实。
[0272] 表5:记载为“mMDH del3”和“mMDH del3 NADH BS1的突变mMDH酶上完成的酶动力学分析。与野生型mMDH“WT mMDH”相比,突变导致了酶活性的降低。
[0273]
[0274]
[0275] mMDH酶内掺入其它突变
[0276] 用于线粒体苹果酸脱氢酶(mMDH)的杂合表达和过表达的载体的构建
[0277] 从番茄、大豆和玉米中分离的编码天然和突变的mMDH酶的多核苷酸序列导入载体中,并转化至微生物中杂合表达。包含突变mMDH开放阅读框的质粒构建体可融合6×His标
签或其它用于分离的序列。合成mMDH多核苷酸序列片段。这些片段两侧为限制性酶切位点
且能很便利地克隆到含有mMDH开放阅读框的质粒中。所述片段被设计成在贯穿整个第一和
第二NADH结合域中包含大约3bp、4bp、5bp、6bp、7bp、8bp或9bp的突变。除了这些导入到mMDH
开放阅读框的第二NADH结合域的各种突变外,将番茄植物中所产生的突变掺入到来自番
茄、大豆和玉米的编码mMDH酶的分离多核苷酸序列中。结果,产生一系列包含在两个NADH结
合域内符合阅读框缺失的突变mMDH编码序列用于自番茄、大豆和玉米分离的酶。
[0278] 线粒体苹果酸脱氢酶(mMDH)的过表达和纯化
[0279] 包含导入到番茄、大豆和玉米的编码序列中的多种突变的质粒转化入化学感受态大肠杆菌细胞内。转化的细菌菌落生长。单菌落用于接种种子培养。培养物生长并随后用于
接种培养基。诱导培养物并且培养物的生长采用分光光度计监测。允许诱导经历一个时间
过程,直至收获细胞。
[0280] 培养物离心,所得的细胞沉淀在裂解缓冲液中重悬。重悬的细胞溶液采用超声或本领域技术人员公知的其他方法裂解。离心去除细胞碎片。洗脱蛋白质。通过SDS‑PAGE分析
和活性分析法鉴定含有mMDH的级分。合并阳性级分并浓缩。将浓缩的级分脱盐。蛋白质浓度
通过使用Expasy Bioinformatics Resource Portal ProtParam工具计算的预测摩尔消光
系数测定。脱盐的酶可在液氮中快速冻存并保存于‑80℃中,直到进一步立即使用或测定。
[0281] 野生型和突变型mMDH活性的测定
[0282] 酶分析在包含缓冲液、NADH和纯化的mMDH酶(按需要包含其他试剂)的最终混合物中进行。通过添加草酰乙酸(0‑50mM)开始反应。通过分光光度法监测340nm的降低(NADH氧
化)测定初始的酶速率。导入mMDH酶中的各种突变的速率使用摩尔消光系数6220M‑1 cm‑1
‑1
通过转化为μM min 测定。由掺入突变引起的酶改变导致了mMDH酶的修饰底物特异性。mMDH
酶催化在图12中显示的生化反应,其中mMDH酶通过利用NAD+到NADH的还原,可逆性催化苹
果酸氧化成草酰乙酸。在测试的多种mMDH酶中,鉴定出产生最有利的整体动力学参数
(kcat/Km值)的突变。这些突变导致了mMDH酶活性降低,从而引起了包含对这些mMDH酶的突
变的植物生产出了具有更大鲜重量的种子和果实。
[0283] 本文中提及的所有专利、专利申请、公开均通过提述完整并入本文中。
[0284] 虽然为了清楚理解的目的,本公开以说明和示例的方式提供了一些细节,在没有背离本公开的精神或范围下可进行多种改变和修改,这对于本领域技术人员而言是明显
的。因此,前述描述和示例不应理解为限制性的。