核糖核酸调节子组合物以及使用方法转让专利

申请号 : CN201380066320.0

文献号 : CN104968786B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : A·A·格林尹鹏J·J·柯林斯

申请人 : 哈佛学院院长等波士顿大学理事会

摘要 :

本发明提供了新型的且多功能的核糖核酸调节子种类,其包括除其它以外,激活和抑制性核糖核酸调节子、开关和触发RNA以及sink RNA,并且提供了其用于检测样品例如细胞中的RNA和用于调节蛋白质合成和表达的方法。

权利要求 :

1.一种支点crRNA核糖核酸调节子,其包含RNA,所述RNA包含:

单链的支点域,

包含起始密码子的完全或部分双链的主干域,包含核糖体结合位点的环状域,和

编码域。

2.权利要求1的核糖核酸调节子,其还包含间隔域。

3.权利要求2的核糖核酸调节子,其中所述间隔域编码低分子量氨基酸。

4.权利要求2的核糖核酸调节子,其中所述间隔域的长度为9-33个核苷酸。

5.权利要求3的核糖核酸调节子,其中所述间隔域的长度为9-33个核苷酸。

6.权利要求2的核糖核酸调节子,其中所述间隔域的长度为21个核苷酸。

7.权利要求3的核糖核酸调节子,其中所述间隔域的长度为21个核苷酸。

8.权利要求2-7中任一项的核糖核酸调节子,其中所述间隔域位于主干域和编码域之间。

9.权利要求1的核糖核酸调节子,其中所述主干域包含所述起始密码子上游(5’)和/或下游(3’)的序列。

10.权利要求9的核糖核酸调节子,其中所述起始密码子上游的序列为6个核苷酸。

11.权利要求9的核糖核酸调节子,其中所述起始密码子下游的序列为9个核苷酸。

12.权利要求7的核糖核酸调节子,其中所述起始密码子下游的序列不编码终止密码子。

13.权利要求10的核糖核酸调节子,其中所述起始密码子下游的序列不编码终止密码子。

14.权利要求11的核糖核酸调节子,其中所述起始密码子下游的序列不编码终止密码子。

15.权利要求1-7中任一项的核糖核酸调节子,其中所述编码域编码报告蛋白。

16.权利要求8的核糖核酸调节子,其中所述编码域编码报告蛋白。

17.权利要求9-14中任一项的核糖核酸调节子,其中所述编码域编码报告蛋白。

18.权利要求15的核糖核酸调节子,其中所述报告蛋白是绿色荧光蛋白(GFP)。

19.权利要求16的核糖核酸调节子,其中所述报告蛋白是绿色荧光蛋白(GFP)。

20.权利要求17的核糖核酸调节子,其中所述报告蛋白是绿色荧光蛋白(GFP)。

21.权利要求1-7中任一项的核糖核酸调节子,其中所述编码域编码非报告蛋白。

22.权利要求8的核糖核酸调节子,其中所述编码域编码非报告蛋白。

23.权利要求9-14中任一项的核糖核酸调节子,其中所述编码域编码非报告蛋白。

24.权利要求1的核糖核酸调节子,其中所述支点域在序列上与天然存在的RNA互补。

25.权利要求1的核糖核酸调节子,其中所述支点域在序列上与非天然存在的RNA互补。

26.一种反式-激活RNA(taRNA),其包含第一域,其与权利要求1-25中任一项的核糖核酸调节子的支点域杂交并且不包含或者包含最小限度的二级结构,和第二域,其与支点域下游(3’)的序列杂交。

27.权利要求26的反式-激活RNA,其中所述第一域与所述支点域100%互补。

28.一种系统,其包含

权利要求1-25中任一项的核糖核酸调节子,和权利要求26或27中任一项的反式激活RNA(taRNA)。

29.权利要求28的系统,其中所述系统是细胞。

30.权利要求29的系统,其中所述细胞是原核细胞。

31.权利要求28的系统,其中所述系统是不含细胞的体外系统。

32.权利要求28的系统,其中所述核糖核酸调节子和所述taRNA彼此杂交。

33.权利要求28的系统,其中核糖核酸调节子对taRNA的比率小于1。

34.权利要求28的系统,其中核糖核酸调节子对taRNA的比率小于0.5。

35.权利要求28的系统,其中核糖核酸调节子对taRNA的比率小于0.1。

36.权利要求28的系统,其中所述核糖核酸调节子包含在第一核酸中并且所述taRNA包含在第二核酸中。

37.权利要求36的系统,其中所述第一核酸是第一质粒并且所述第二核酸是第二质粒。

38.权利要求36的系统,其中所述第一质粒包含中等拷贝复制起点并且所述第二质粒包含高拷贝复制起点。

39.一种核酸,其包含或编码

权利要求1-25中任一项的核糖核酸调节子。

40.一种宿主细胞,其包含权利要求39的核酸。

41.一种核酸,其包含或编码

权利要求26或27中任一项的反式-激活RNA(taRNA)。

42.一种宿主细胞,其包含权利要求41的核酸。

43.检测样品中RNA或DNA的存在的方法,包括将权利要求1的核糖核酸调节子与样品混合,其中所述核糖核酸调节子包含与样品中的RNA或DNA互补的支点域,并且其中所述核糖核酸调节子包含编码报告蛋白的编码域,和检测作为样品中RNA或DNA的存在的指示剂的报告蛋白。

44.权利要求43的方法,其中所述样品是细胞,并且样品中的所述RNA或DNA是所述细胞中的内源RNA或DNA。

45.权利要求43或44的方法,其中所述报告蛋白是绿色荧光蛋白(GFP)。

46.权利要求43或44的方法,其中报告蛋白的量是样品中的内源RNA或DNA的量的指示剂。

47.权利要求45的方法,其中报告蛋白的量是样品中的内源RNA或DNA的量的指示剂。

48.控制蛋白质翻译的方法,包括

在允许编码域在taRNA存在的情况下翻译且在taRNA不存在的情况下不翻译的条件下,将权利要求1的核糖核酸调节子与权利要求26的taRNA混合,其中所述核糖核酸调节子包含与taRNA互补的支点域,并且其中所述核糖核酸调节子包含编码非报告蛋白的编码域。

说明书 :

核糖核酸调节子组合物以及使用方法

[0001] 联邦政府资助的研究
[0002] 本发明是在美国政府支持下于DARPA授予的基金号635-67116-XXXX-167832-435548-0002.66625和国立卫生研究院授予的基金号1DP2OD007292下完成的。政府拥有本发明的某些权利。
[0003] 相关申请
[0004] 本申请要求2012年11月6日提交的美国临时申请No.61/722825和2013年7月9日提交的美国临时申请No.61/843934的权益,将其每一个的整个内容通过引用并入本文。
[0005] 发明背景
[0006] 核糖核酸调节子(riboregulator)是在细胞中响应核酸序列而引起变化的RNA序列。这些基于RNA的装置通常调节蛋白质翻译或者引发mRNA降解,其已被用于合成生物学中的多种应用,包括基因表达的灵敏控制,通过不同代谢途径的代谢通量分流,以及对细胞死亡的合成控制。
[0007] 在控制基因表达的核糖核酸调节子中,蛋白质翻译的抑制依赖于通常为单链的核糖体结合位点(RBS)在目标基因(GOI)上游的双链RNA区域中的隔离。其中RBS被隔离在GOI上游的发夹中的mRNA因而是顺式抑制的RNA(crRNA)。可构建基于工程化的crRNA的核糖核酸调节子,在其中反式激活RNA(taRNA)结合至crRNA并使抑制性RNA双链解旋从而暴露出此时为单链的RBS并激活下游基因的翻译。在降低GOI表达的核糖核酸调节子中,GOI的起始密码子和RBS都在触发RNA不存在的情况下被暴露出来。然而,反义于RBS和起始密码子的反式抑制RNA(trRNA)可以结合至核糖核酸调节子并且强烈抑制下游基因的翻译。
[0008] 在过去的十年中,研究人员已经开发出了许多不同的核糖核酸调节子系统来控制原核细胞中的基因表达。这些在先的系统使用了许多重复的设计要点。绝大多数的核糖核酸调节子采用环状-线性相互作用来驱动crRNA/反式-RNA杂交反应的进行。在这些相互作用中,一条链中的线性单链区域结合至在另一条链中的双链末端上建立的环。这种相互作用的本质是形成吻合环结构,在其中RNA序列的三级结构引起环内的碱基向外翻转,从而促进与线性RNA链的结合。重要的是,这个吻合环结构仅与环状区内的特定序列建立,这可极大地限制可能的crRNA设计的数量。
[0009] 所有在先的核糖核酸调节子系统都依赖于RBS的隔离来阻碍GOI的翻译。该设计选择涉及两个至关重要的方面。首先,合成生物学中遗传环路优化的许多工作依赖于改变RBS的强度来微调细胞内的蛋白水平。由于RBS序列是这些核糖核酸调节子的功能性部分,因而不能简单地用变体取代核糖核酸调节子的RBS并期望装置的输出特性按照新RBS的强度以可预见的方式变化。此外,RBS的变化将需要对反式-RNA的序列做出相应的修改。其次,对于激活基因表达的核糖核酸调节子,隔离RBS的核糖核酸调节子必须由与crRNA RBS序列至少部分互补的taRNA序列激活。因此,未结合的taRNA可与去抑制的crRNA种类竞争核糖体的结合。可选择地,taRNA内的RBS序列还可以被隔离在主干区内。这个额外的二级结构可降低结合crRNA的动力学和核糖核酸调节子的动力学范围。
[0010] 发明概述
[0011] 本发明部分提供了可编程的核糖核酸调节子,其可被RNA(包括对于目标细胞或样品是内源的RNA)活化。这样的可编程的核糖核酸调节子在之前是不可能实现的,部分地是因为本文所概述的严格限制,包括序列限制。本发明的新型核糖核酸调节子在taRNA(触发RNA)(以及与taRNA杂交的crRNA(如开关RNA)的相应区域)的序列中提供足够的自由度以允许被例如RNA(例如但不限于内源RNA)激活。当偶联至蛋白报告因子如荧光报告因子时,这样的核糖核酸调节子会作为传感器在活细胞或者其它类型的包含RNA的样品中实时探测RNA的水平。本发明可用于实时检测和定量内源RNA而不需要从细胞(或者样品)中收获RNA。本方法足够灵敏来检测以生理拷贝数存在的RNA。
[0012] 本发明的核糖核酸调节子相比现有技术的那些较少地受限于序列,因此可产生许多核糖核酸调节子并且重要的是,可在单个系统如细胞中一起使用。在此之前使用现有技术的核糖核酸调节子是不可能实现这样的正交性的。本发明的核糖核酸调节子还不因其结构而依赖于RBS。因此,修改RBS而不影响核糖核酸调节子的功能是可能的。本发明的的核糖核酸调节子的可编程性允许更高阶细胞逻辑的“即插即用”实现。
[0013] 因此本发明提供了用于使用本发明的核糖核酸调节子(包括支点开关RNA和/或支点抑制子)和/或taRNA(触发RNA)和/或sink RNA组合物来进行下列测试的方法:检测(传感)和测量一种或多种内源RNA的水平,同时实现对细胞或者样品中一种或多种蛋白的灵敏控制(包括翻译控制),在细胞或者样品中进行复杂的逻辑操作,在细胞或者样品中编程,在活体系统中检测单核苷酸多态性(SNP),以及在体外翻译系统中检测RNA和SNP RNA。
[0014] 本发明的顺式抑制RNA(crRNA)和反式激活RNA(taRNA)可全部或者部分由RNA组成。它们可包含天然存在的核苷酸和/或非天然存在的核苷酸。crRNA在本文还可被称为开关RNA。crRNA意指这样的RNA,其通常被抑制直到结合至taRNA(或者触发RNA)为止,因为这样的结合导致目标蛋白质从crRNA/开关RNA的翻译。在一些情况下,并且如在本文中更详尽地描述的,触发RNA与crRNA/开关的结合通常通过支点域发生。
[0015] 本发明涉及可通过可操作地连接至编码域来模块化使用的crRNA。本发明还涉及可模块化地用于去抑制或者激活crRNA的taRNA。
[0016] 因此,一方面,本发明提供支点crRNA(支点开关)核糖核酸调节子,其包含:单链的支点域,包含起始密码子的完全或部分双链的主干域和包含核糖体结合位点的环状域。所述支点crRNA/支点开关可包含位于环状域中的RBS序列。
[0017] 另一方面,本发明提供包含任选地可操作连接至编码域(如下文所述的)的多于一个crRNA的RNA,其中所述多个crRNA可被相同的或者不同的taRNA(触发RNA)激活。在一些实施方案中,单一的taRNA可激活下游编码序列的表达。在这样的实施方案中,支点crRNA核糖核酸调节子可用于使用单个读出来检测多个taRNA的表达。
[0018] 另一方面,本发明提供支点核糖核酸调节子系统,其包含(1)包括单链支点域、包含起始密码子的完全或部分双链的主干域和包含核糖体结合位点的环状域的crRNA核糖核酸调节子,和(2)编码域。在一些实施方案中,与主干域中的互补区域杂交的taRNA激活下游编码序列的表达。在一些实施方案中,为了激活下游编码序列的表达,2、3、4、5、6个或更多或所有的taRNA是需要的。本文中的术语“系统”和“设备”可互换地用于指核糖核酸调节子组分的集合,其包含但不限于并且为任意组合的crRNA(开关RNA)、taRNA(触发RNA)、sink RNA等。
[0019] 在一些实施方案中,核糖核酸调节子还包含间隔域。在一些实施方案中,所述间隔域编码低分子量的氨基酸。在一些实施方案中,所述间隔域约为9-33个核苷酸长。在一些实施方案中,所述间隔域约为21个核苷酸长。在一些实施方案中,所述间隔域位于主干域和编码域之间。在一些实施方案中,所述间隔域的长度大于33个核苷酸并且可包含单链和双链的区域,包括其它的核糖核酸调节子。
[0020] 在一些实施方案中,主干域包含起始密码子上游(5’)和/或下游(3’)的序列。在一些实施方案中,起始密码子上游的序列为大约6个核苷酸。在一些实施方案中,起始密码子下游的序列为大约9个核苷酸。在一些实施方案中,起始密码子下游的序列不编码终止密码子。
[0021] 在一些实施方案中,编码域编码报告蛋白。在一些实施方案中,报告蛋白为绿色荧光蛋白(GFP)。在一些实施方案中,编码域编码非报告蛋白。如本文中所用,非报告蛋白是以另外的或替代的方式用作报告蛋白或发挥报告蛋白功能的任何蛋白。非报告蛋白可与细胞或样品内的另一个实体相互作用,从而可在细胞或样品中或者在另一部分中引起变化。
[0022] 在一些实施方案中,支点域在序列上与天然存在的RNA互补。天然存在的RNA可以是能够从目标细胞(例如从内源的基因座)表达的RNA。在一些实施方案中,支点域在序列上与非天然存在的RNA互补。非天然存在的RNA可以是目标细胞中非天然表达的RNA(例如其不从内源的基因座表达),而是可以从被引入目标细胞的外源核酸表达。
[0023] 另一方面,本发明提供反式激活RNA(taRNA),其包含与任何前述核糖核酸调节子的支点域杂交且不含或者含有最小限度的二级结构的第一域,和与支点域下游(3’)的序列杂交的第二域。在一些实施方案中,第一域是与支点域100%互补的。在一些实施方案中,第二域与支点域下游的序列的互补性可低于100%。
[0024] taRNA可由多于一条RNA链组成,并且这样的多个RNA组合地提供用于与crRNA杂交的第一和第二域。在一些实施方案中,可使用一种或多种RNA来通过杂交使多个taRNA紧密靠近以使它们能够有效的与核糖核酸调节子杂交。这样的实施方案的例子在图9和10中说明。
[0025] 另一方面,本发明提供了包含一个或多个任意前述crRNA核糖核酸调节子,和/或一个或多个任意前述反式激活RNA(taRNA)的系统。taRNA可全部是天然存在的RNA,或者它们可全部是非天然存在的RNA,或者它们可以是天然存在RNA和非天然存在的RNA的混合物。
[0026] 本发明的系统可包含在其之间具有最小限度串扰的多个核糖核酸调节子(例如,任选地与关联taRNA/触发RNA一起的多个crRNA/开关)。在一些实施方案中,该系统可包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或者更多的支点crRNA/开关,其具有最小限度的串扰(例如在小于20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%或者更低的水平上的)。在一些实施方案中,支点crRNA/开关具有大于50、100、150、200、250、300、350、400或者更高的平均开/关荧光比率。在一些情况下,本发明提供具有多个支点crRNA/开关的系统,所述支点crRNA/开关具有约200-665范围内(包括约400)的平均开/关荧光比率。在一些实施方案中,系统中多个支点核糖核酸调节子之间的串扰的水平为从大约2%到少于20%,或者从大约2%到大约15%,或者从大约5%到大约15%。这样的系统可包含7个或者更多包括8、9、10个等的支点核糖核酸调节子。
[0027] 在一些实施方案中,所述系统是细胞。在一些实施方案中,所述细胞是原核细胞。
[0028] 在一些实施方案中,所述系统是不含细胞的体外系统。
[0029] 在一些实施方案中,crRNA核糖核酸调节子和taRNA是相互杂交的。
[0030] 在一些实施方案中,crRNA核糖核酸调节子对taRNA的比率小于1,小于0.5,或者小于0.1。
[0031] 在一些实施方案中,crRNA核糖核酸调节子或者核糖核酸调节子系统包含在第一核酸中,taRNA包含在第二核酸中。在一些实施方案中,第一核酸是第一质粒,并且第二核酸是第二质粒。在一些实施方案中,第一质粒包含中等拷贝复制起点,第二质粒包含高拷贝复制起点。所述质粒可以是DNA质粒或者RNA质粒。
[0032] 另一方面,本发明提供了核酸,其包含任意前述crRNA核糖核酸调节子或者核糖核酸调节子系统,或者包含编码任意前述crRNA核糖核酸调节子或者核糖核酸调节子系统的序列。另一方面,本发明提供包含任意前述核酸的宿主细胞。
[0033] 另一方面,本发明提供了核酸,其包含任意前述反式-激活RNA(taRNA)或者包含编码任意前述taRNA的序列。另一方面,本发明提供包含所述核酸的宿主细胞。
[0034] 另一方面,本发明提供检测样品中RNA的存在的方法,包括在允许编码域在内源RNA存在的情况下翻译且在内源RNA不存在的情况下不翻译的条件下,将任意前述支点crRNA核糖核酸调节子系统与样品组合,其中所述crRNA核糖核酸调节子包含与内源RNA互补的支点域,并且其中所述核糖核酸调节子系统包含编码报告蛋白的编码域,以及检测作为内源RNA的指示剂的报告蛋白。如本文中所用,允许编码域翻译的条件是包含从RNA产生蛋白所必需的所有装置例如但并不限于核糖体,tRNA等的条件。
[0035] 另一方面,本发明提供了检测细胞中RNA的存在的方法,包括向细胞中引入任意前述支点核糖核酸调节子系统,其中所述crRNA核糖核酸调节子包含与细胞中内源RNA互补的支点域,并且其中所述核糖核酸调节子系统包含编码报告蛋白的编码域,以及检测作为内源RNA的指示剂的报告蛋白。在一些实施方案中,报告蛋白是绿色荧光蛋白(GFP)。在一些实施方案中,报告蛋白的量是内源RNA的量的指示剂。
[0036] 另一方面,本发明提供了控制蛋白翻译的方法,包括在允许编码域在taRNA存在的情况下翻译且在taRNA不存在的情况下不翻译的条件下,将任意前述支点核糖核酸调节子系统与任意前述互补taRNA组合,其中所述支点crRNA核糖核酸调节子包含与taRNA互补的支点域,并且其中所述支点核糖核酸调节子系统包含编码非报告蛋白的编码域。
[0037] 另一方面,本发明提供了信标核糖核酸调节子系统,其包含(1)包含含有核糖体结合位点的全部或部分双链的主干域和环状域的信标crRNA核糖核酸调节子,(2)编码域,和(3)存在于主干域和编码域之间的起始密码子。
[0038] 在一些实施方案中,主干域包含起始密码子上游(5’)的序列。在一些实施方案中,起始密码子上游的序列为约6个核苷酸。
[0039] 在一些实施方案中,编码域编码报告蛋白。在一些实施方案中,报告蛋白是绿色荧光蛋白(GFP)。在一些实施方案中,编码域编码非报告蛋白。
[0040] 在一些实施方案中,环状域在序列上与天然存在的RNA互补。在一些实施方案中,环状域在序列上与非天然存在的RNA互补。在一些实施方案中,环状域为约21个核苷酸长。在一些实施方案中,环状域的长度范围为大约15-30个核苷酸。
[0041] 在一些实施方案中,信标crRNA核糖核酸调节子包含结合域(即与其互补taRNA杂交的域),其包括但不限于环状域。结合域可包含环状域上游(5’)的区域,所述区域可为约9个核苷酸长并且可存在于主干域中。
[0042] 主干域可为约23bp长。主干域可为约15bp至约30bp。
[0043] 另一方面,本发明提供了反式激活RNA(taRNA),其包含与任意前述信标核糖核酸调节子的环状域杂交且不包含或者包含最小限度的二级结构的第一域,和与环状域上游(5’)且存在于主干域中的序列杂交的第二域。在一些实施方案中,第一域与环状域是100%互补的。
[0044] 另一方面,本发明提供了包含任选地可操作地连接至编码域的一个或多个任意前述信标crRNA核糖核酸调节子和任意前述互补的反式激活RNA(taRNA)的系统。
[0045] 在一些实施方案中,所述系统是细胞。在一些实施方案中,所述细胞是原核细胞。在一些实施方案中,所述系统是不含细胞的体外系统。
[0046] 在一些实施方案中,信标crRNA核糖核酸调节子和taRNA是彼此杂交的。
[0047] 在一些实施方案中,信标crRNA核糖核酸调节子对taRNA的比率小于1,小于0.5,或者小于0.1。
[0048] 在一些实施方案中,信标crRNA核糖核酸调节子(或系统)包含于第一核酸中,且taRNA包含于第二核酸中。在一些实施方案中,第一核酸是第一质粒并且第二核酸是第二质粒。在一些实施方案中,第一质粒包含中等拷贝复制起点并且第二质粒包含高拷贝复制起点。所述质粒可以是DNA质粒或者RNA质粒。
[0049] 另一方面,本发明提供了包含任意前述信标crRNA核糖核酸调节子(或系统)或者编码任意前述信标核糖核酸调节子(或系统)的序列的核酸。另一方面,本发明提供了包含所述核酸的宿主细胞。
[0050] 另一方面,本发明提供了包含任意前述反式激活RNA(taRNA)或者编码任意前述taRNA的序列的核酸。另一方面,本发明提供了包含所述核酸的宿主细胞。
[0051] 另一方面,本发明提供了检测样品中RNA的存在的方法,包括在允许编码域在内源RNA存在的情况下翻译且在内源RNA不存在的情况下不翻译的条件下,将信标核糖核酸调节子系统与样品组合,其中所述信标crRNA核糖核酸调节子包含与内源RNA互补的环状域,并且其中所述信标核糖核酸调节子系统包含编码报告蛋白的编码域,以及检测作为内源RNA的指示剂的报告蛋白。
[0052] 另一方面,本发明提供了检测细胞中RNA的存在的方法,包括向细胞中引入信标核糖核酸调节子系统,其中所述信标crRNA核糖核酸调节子包含与细胞中内源RNA互补的环状域,并且其中所述信标核糖核酸调节子系统包含编码报告蛋白的编码域,以及检测作为内源RNA的指示剂的报告蛋白。
[0053] 在一些实施方案中,报告蛋白是绿色荧光蛋白(GFP)。
[0054] 在一些实施方案中,报告蛋白的量是内源RNA的量的指示剂。
[0055] 另一方面,本发明提供了控制蛋白翻译的方法,包括在允许编码域在taRNA存在的情况下翻译且在taRNA不存在的情况下不翻译的条件下,将信标核糖核酸调节子系统与互补taRNA组合,其中所述信标crRNA核糖核酸调节子包含与taRNA互补的环状域,并且其中所述信标核糖核酸调节子系统包含编码非报告蛋白的编码域。
[0056] 本发明的这些和其它方面和实施方案将在本文中更加详尽地进行描述。
[0057] 附图简述
[0058] 图1.支点核糖核酸调节子crRNA碱基设计的示意图。对应的taRNA具有5’-b-a-3’的序列,其中域a和b分别是域a*和b*的反向互补体。
[0059] 图2.6个未被激活的支点核糖核酸调节子crRNA的抑制水平的表征。
[0060] 图3.针对高性能支点核糖核酸调节子所获得的开/关众数荧光比率。
[0061] 图4.在用IPTG诱导后3小时针对一组61个支点核糖核酸调节子所获得的开/关众数荧光比率。
[0062] 图5.信标核糖核酸调节子碱基设计。taRNA具有5’-b-a-3’的序列。
[0063] 图6.针对一组6个信标核糖核酸调节子设备所获得的开/关中值荧光强度。红色点划线表示开/关比率为10。
[0064] 图7.信标核糖核酸调节子靶向小RNA ryhB的反应。核糖核酸调节子传感器用1mM IPTG来诱导并且ryhB用0.5mM 2,2’-联吡啶来诱导。核糖核酸调节子传感器通过以系数~5增加GFP的输出来响应增加的细胞内ryhB水平。
[0065] 图8.被编程来检测具有序列5’-b-a-3’的靶的基于(A)支点和(B)信标核糖核酸调节子的其它内源传感器的设计示意图。这两种设计均采用在AUG起始密码子之前和之后的稳固的RNA双链来抑制蛋白翻译。(A)具有延伸的支点(在一些实例中多于21个核苷酸(nt))以促进具有显著二级结构的RNA靶的强力结合的支点核糖核酸调节子。crRNA主干解旋区的大小减小但会允许翻译的反式激活,因为最接近于RBS的主干是短的(一般为6个碱基对(bp))并且可能自发地解旋。(B)信标核糖核酸调节子具有较大的环(一般为32-nt)用于靶结合,并且现在RBS位于环内以允许更大的可编程性。
[0066] 图9显示了其中两个taRNA一起作用并促成与核糖核酸调节子crRNA杂交的5’-a-b-3’序列的系统。(A)双输入“与”门系统的示意图,其中RNA链A和B是输入,并且链C(crRNA)用作门。(B)针对RNA链A、B和C的所有组合所获得的开/关荧光比率。
[0067] 图10显示了其中各自具有部分5’-a-b-3’序列的两个taRNA被不含有5’-a-b-3’序列的任何部分的第三个taRNA带入紧密靠近状态的系统。
[0068] 图11.使用核糖核酸调节子的2-输入“或”逻辑在体内的实现。(a)系统中的三个经编程的RNA链。(b)“或”门体内活化的示意图。(c)在转录不同的输入RNA至系统后来自GFP的开/关荧光的流式细胞术测量。在关的情况下,与门非关联的taRNA被表达。
[0069] 图12.6-输入“或”门在体内的实现。(A,上)“或”门系统包含串联布置在GFP基因上游的6个crRNA。(A,中)已发现相应的6个taRNA输入均能激活在LB/IPTG平板上诱导的大肠杆菌菌落的GFP表达。相反,四个不同的非关联taRNA当与“或”门构建体共表达时不能引起GFP产生。(B)针对“或”门系统的开/关众数GFP荧光比率的流式细胞术测量。与具有最低的GFP泄漏水平的非关联taRNA(Y)相比,所有的6个经编程的输入RNA tarRNA均显示大于10倍更高的GFP表达。
[0070] 图13.(A)6-输入“与”门系统的示意图。门由包含来自经验证的支点核糖核酸调节子crRNA的序列的延伸的发夹组成。6个输入RNA触发子包含来自相应的taRNA的序列和用于结合相邻输入链的杂交域。(B)针对暴露于输入A到F的指定组合的6-位“与”门的来自大肠杆菌菌落的GFP荧光的图像。仅当所有6个输入均存在时才观察到强的GFP表达,如最右栏中所显示的。
[0071] 图14.sink RNA使触发RNA失活的体内证明。(A)显示逻辑操作背后的分子相互作用的示意图。sink RNA被设计用于与开关RNA竞争性胜出地结合至触发子。每当sink也存在时,这种优先结合阻止触发子激活开关。(B)从具有触发和sink RNA的不同组合的开关RNA测量的GFP荧光。当sink与触发RNA共表达时,相较于单独表达触发子,观察到荧光的90%的抑制。
[0072] 图15.支点抑制子的设计和性能表现。(A)显示支点抑制子系统的分子相互作用的示意图。触发RNA引起开关RNA重新折叠成阻止核糖体接近RNA上的结合元件的构型。(B)从44个支点抑制子的文库测量的抑制水平。一半的系统提供大于90%的抑制。提供了分别为
90%和80%抑制的短划线和点划线。
[0073] 图16.高性能支点抑制子的时间过程测量。在加入诱导剂IPTG后以小时时间点进行测量。
[0074] 图17.支点开关设计和输出特征。(A)传统的核糖核酸调节子系统通过直接与RBS区域的碱基配对来抑制翻译。RNA-RNA相互作用通过RNA发夹中YUNR-环上的环-线性相互作用来起始。(B)支点开关通过在起始密码子AUG之前和之后编程的碱基对来抑制翻译,从而导致RBS和起始密码子区是完全不配对的。RNA-RNA相互作用通过被称为支点的线性-线性相互作用域来起始。支点域(a*)结合到触发RNA上的互补域。随后发生的分支迁移使支点开关mRNA去抑制以实现下游基因的翻译。(C)针对开关在其开和关状态以及针对其中表达具有相同序列的GFP的阳性对照所测量的GFP众数荧光水平。黑色的短划线表示从不具有GFP表达质粒的IPTG-诱导细胞获得的背景荧光水平。(D)针对一组168个支点开关所获得的开/关GFP荧光水平,其中20个显示开/关≥100。插图:针对具有不同性能水平的4个支点开关在IPTG诱导后不同时间点测量的开/关GFP荧光。
[0075] 图18.支点开关正交性的综合评价。(A)表达开关mRNA和触发RNA的676个配对组合的大肠杆菌菌落的GFP荧光。表达GFP的菌落在沿对角线的包含关联的开关和触发链的细胞中是可见的。非对角的组分由于非关联RNA组分之间极小的相互作用而具有很低的荧光。(B)通过流式细胞术针对所有触发子-开关组合所测量的串扰确认强的整体系统正交性。
(C)支点开关和多个之前的基于RNA的调节子的正交文库动力学范围(阈值串扰水平的倒数)和正交文库大小的比较。
[0076] 图19.支点开关的序列分析和正向工程化。(A)对支点开关输出特征至关重要的区域和参数。(B)168个成员的支点开关文库作为开关mRNA主干的顶部和底部三个碱基对中G-C碱基对的数量的函数的评价。图中的背景方块的颜色对应于满足指定的GC碱基配对限制的核糖核酸调节子组的平均开/关GFP荧光。每个方块中的圆圈的颜色对应于满足限制的每个组分所获得的实际开/关比率。(C)针对一组13个正向工程化的支点开关所获得的开/关GFP荧光比率。黑色短划线表示针对168个随机序列支点开关的整个组所测量的平均开/关荧光水平。插图:6号和9号正向工程化开关的时间过程测量。(D)具有超过指定值的开/关比率的随机序列和正向工程化文库组分的百分比。
[0077] 图20.支点开关的热力学分析。(A)作为应用于来自随机序列支点开关文库的开/关水平亚组的不同热力学参数的函数的R2值的图。使用ΔGRBS-接头参数(红色显示的)针对在其主干顶部上具有弱A-U碱基对的开关亚组发现了最强的相关性。(B)显示主干顶部碱基对的位置和用于定义ΔGRBS-接头的序列范围的示意图。(C)ΔGRBS-接头与针对在发夹主干顶部上具有A-U碱基对的支点开关文库中的68个组分所测量的开/关比率之间的相关性。(D)ΔGRBS-接头与针对正向工程化系统的组所测量的开/关比率之间的强相关性。
[0078] 图21.使用支点开关的独立调控和基于mRNA的触发。(A)分别独立调控GFP和mCherry的RNA A和B触发的两个正交支点开关。(B)在IPTG诱导后4小时针对表达RNA A和B的所有4个输入组合的细胞的GFP和mCherry荧光的二维直方图确认预期的系统行为。(C)mRNA反应性支点开关利用命名为c*的延伸的支点域来结合具有广泛的二级结构的mRNA触发子并激活GFP报告因子的表达。(D)由mCherry mRNA以及赋予抗生素抗性的cat和aadA mRNA激活的一系列支点开关的开/关GFP荧光比率。(E)从mCherry传感器在其抑制和激活状态下的流式细胞术获得的GFP和mCherry众数荧光。从不含具有GFP的质粒的未诱导细胞和表达GFP或者mCherry的诱导细胞获得对照表达水平。
[0079] 发明详述
[0080] 本发明提供了两个一般性种类的核糖核酸调节子:支点核糖核酸调节子和信标核糖核酸调节子。这两种类型都可用于在不同的系统包括细胞例如原核细胞中激活蛋白表达(或者翻译)。不像在先的基因表达的经工程化的核糖核酸调节子,这些“设备”可使用单独的具有实质上任意序列的RNA来反式激活。激活RNA的序列不需要与核糖体结合位点(RBS)序列相关。
[0081] 这些新型核糖核酸调节子的优势是多方面的。首先,本发明的许多核糖核酸调节子可在单个细胞中同时激活,其中每一个仅与其关联(特异性)的靶相互作用。这允许对多个细胞活性进行同时控制。其次,本发明的核糖核酸调节子可在体内以低的系统串扰和高的可编程性掺入到复杂的核酸环路中。第三,本发明的核糖核酸调节子可触发内源RNA的蛋白(如,报告蛋白)产生。当核糖核酸调节子输出偶联至荧光蛋白报告因子时,这些核糖核酸调节子用作细胞中内源RNA的可遗传编码的传感器和成像探针。对于其它蛋白,例如参与细胞代谢的蛋白,采用这些核糖核酸调节子激活基因表达可促进细胞内源途径与合成基因网络之间的相互作用以用于生物技术中的新应用。
[0082] 因此本发明提供了多种新型核糖核酸调节子和由其衍生的“设备”,其相较于先前描述的核糖核酸调节子,提供了极大增强的多样性、正交性和功能性。相比于仅仅通过破坏核糖体与RBS的结合而抑制翻译的现有技术核糖核酸调节子,本发明的某些核糖核酸调节子允许核糖体对接(在一些情况下)但通过阻断核糖体接近起始密码子(在所有情况下)和通常从其的延伸来阻止翻译起始。这种方法的优点是RBS不再需要是反式-RNA序列的一部分,这使得能够在不具有对Shine-Dalgarno序列的任何依赖性并且仅有很少的整体序列限制的情况下设计新的核糖核酸调节子。此外,这些新的核糖核酸调节子不依赖于吻合环相互作用来驱动crRNA和反式-RNA之间的杂交。相反,它们利用线性-线性(或者大-环-线性)RNA相互作用,其强度可简单地通过改变驱动初始RNA-RNA相互作用的核苷酸的数目和/或通过改变其碱基组成来合理地控制。相比之下,吻合环相互作用中碱基组成和/或序列长度的改变可影响相互作用域的三级结构并降低杂交反应的动力学。
[0083] 核糖核酸调节子的一般性描述
[0084] 核糖核酸调节子是可用于抑制或者激活开放阅读框的翻译和从而蛋白的产生的RNA分子。抑制是通过调节性核酸元件(顺式抑制性RNA或crRNA)在mRNA分子的5’非翻译区(5’UTR)中的存在来实现的。核酸元件通过互补碱基配对形成包含主干域和环状域的发夹结构。发夹结构阻断核糖体靠近mRNA转录物,从而阻止翻译。在一些实施方案中,包括例如涉及原核细胞的实施方案中,发夹结构的主干域隔离核糖体结合位点(RBS)。在一些实施方案中,包括例如涉及真核细胞的实施方案中,发夹结构的主干域位于起始(或者始译)密码子的上游,在mRNA的5’UTR之内。反式表达和作用(并因此被称为反式激活RNA,或者taRNA)的RNA与crRNA相互作用并且改变发夹结构。这种改变允许核糖体靠近起始密码子上游的转录物区域,从而释放处于抑制状态的RNA并且促进从转录物的蛋白质翻译。crRNA是典型的工程化RNA分子。taRNA可以是工程化分子尽管在一些情况下,如在本文中所描述的,其可以是系统例如细胞中内源的、天然存在的RNA的区域。
[0085] 本发明总体上提供了用于使用RNA分子来调节和从而控制开放阅读框的翻译来转录后调控蛋白表达的核酸、构建体、质粒、宿主细胞和方法。
[0086] 应理解本发明涉及模块化crRNA编码核酸和模块化taRNA编码核酸。如本文中所用,模块化crRNA编码核酸指的是不包含开放阅读框(或者目标基因的编码域)的核酸序列。这样的模块化crRNA可以是支点crRNA或者信标crRNA。因此,本发明涉及以其最终形式的(例如包含目标基因的编码域)核糖核酸调节子或者核糖核酸调节子组件(例如未可操作地连接至目标基因的支点crRNA或者信标crRNA)。
[0087] 本发明还提供了包含crRNA序列的寡核苷酸和包含taRNA序列的寡核苷酸。此外,本发明提供了两种或更多种寡核苷酸的组。第一组寡核苷酸包含其序列一起构成crRNA序列的两个或更多个寡核苷酸。本发明还提供第二组寡核苷酸,其序列一起构成taRNA序列。为了便于克隆,可优选在不同的克隆步骤中使用其各自包含单个主干形成部分的两个寡核苷酸,而不是使用包含两个主干形成部分的单个寡核苷酸,以避免在寡核苷酸内形成主干,这可阻碍克隆。可将寡核苷酸与本文中提及的任何另外的组分一起提供在试剂盒内。寡核苷酸可在一端或者两端上包含限制性酶切位点。
[0088] 支点核糖核酸调节子
[0089] 在支点核糖核酸调节子系统中,crRNA与反式-RNA种类之间的相互作用是通过定位于crRNA主干的5’端的单链RNA域介导的。所述域(被称为支点域)为反式-RNA提供足够的结合亲和力以使得其能够使crRNA主干解旋。反式-RNA与支点域之间的互补程度可不同。在一些实施方案中,其为至少60%,至少70%,至少80%,至少90%,至少95%或者100%。为了最佳的核糖核酸调节子动力学,反式-RNA应当具有最小限度的二级结构和与crRNA的支点域的完全互补性(即100%)。如本文中所用,二级结构是指非线性结构包括例如发夹结构、主干环结构等。因此,优选反式-RNA由在其使用条件下具有极小至没有形成二级结构的可能性的序列组成。本领域的普通技术人员能够手动地或者通过使用本领域可获得的计算机程序来确定这些序列。
[0090] 支点核糖核酸调节子crRNA不将RBS隔离在其主干域内。相反的,RBS被由抑制性主干域形成的环状域所限制。这使得紧接在起始密码子之前(上游或5’)和之后(下游或3’)的区域被隔离在主干域内,从而破坏翻译起始。crRNA支点域、主干域和环状域的各自长度可如下文将详细描述地在不影响支点核糖核酸调节子性能的情况下以较大的程度发生改变。此外,即使其包含许多凸起部分或者错配碱基,crRNA主干域仍可保持其抑制效率,这使得不含有起始密码子AUG序列的反式-RNA能够触发核糖核酸调节子。原则上,对凸起部分的耐受性使得任意taRNA序列包括内源的RNA能够用作进入支点核糖核酸调节子中的输入RNA,尽管其它的标准例如高度的二级结构可影响调节子的反应。
[0091] 支点核糖核酸调节子的示例性非限制性类型具有如图1所示的设计参数。所述类型的crRNA具有大约12-核苷酸(nt)长的支点域和大约11-nt长的环状域以及任选地在其3’端包含RBS序列AGAGGAGA。与所述环状域紧邻的是包含侧接起始密码子(即AUG)的6-bp双链间隔区和9-bp双链区的主干域。起始密码子下游(3’)的9-nt被编程来确保其不编码任何终止密码子,因为这会导致翻译的提前终止。此外,起始密码子三联体相对的3-nt的区域是完全不配对的从而导致crRNA的主干域具有3-nt长的凸起部分。为了减小9-nt双链区域编码影响目标基因(GOI)折叠的氨基酸的可能性,将包含多个低分子量残基的通常21-nt(7-氨基酸)的间隔区插入到crRNA主干域和编码域(例如编码GOI或者报告蛋白的域)之间。
[0092] 应理解图1中示例的实施方案是非限制性的,并且本发明考虑和包含了其它具有不同长度和功能的核糖核酸调节子。因此,支点域、主干域、环状域和接头域以及主干域内双链区的长度与图1所示的实施方案在长度上有所不同。
[0093] 其它支点核糖核酸调节子系统设计描述于实施例7中。
[0094] 如图3所示,通过使用taRNA种类上的靶RNA,支点核糖核酸调节子可显示强的反式-激活,其中在诱导后仅仅2到3小时荧光以超过200的系数增加。在体内对另外60个支点核糖核酸调节子设计进行了同样的测量,开/关比率示于图4中。在其关联taRNA存在的情况下,大约三分之一的所测试的核糖核酸调节子以50或更高的系数增加GFP输出。
[0095] 另外的实验测试还使得能够更好地理解最佳支点核糖核酸调节子操作所需的crRNA二级结构和域长度。至少5或者6nt长的支点域对于taRNA初始结合是优选的。因此支点域的长度可以是5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20个或者更多个核苷酸。此外,还发现taRNA仅需要使crRNA主干的三分之二解旋以允许GOI的翻译。基于这些发现,对于crRNA中的充分抑制,主干域可小至12bp。然而主干域可比12bp更长,包括13,14,15,
16,17,18,19,20个或者更多个碱基对的长度。此外,延伸环长度至12-nt和用具有典范Shine-Dalgarno序列的稍微较强的形式来替换RBS不降低crRNA引起的抑制程度。因此,环状域的长度可以是11,12,13,14,15,16,17,18,19,20个或者更多个核苷酸。支点核糖核酸调节子的变型如图8A所示并且在实施例7中更加详尽地描述。
[0096] 本发明还提供了具有额外特征的crRNA/开关。在一些情况下,发夹主干的顶部三碱基可以是A-U碱基对。在一些情况下,主干的底部三碱基对可包含两个强的G-C碱基对和一个A-U碱基对。在一些情况下,开关支点的长度可以是大约12-nt至大约15-nt。后面的此特征可在一些情况下增强触发RNA与其开关RNA的初始结合。在一些情况下,发夹环的大小可以是大约11-至大约15-nt以在开关激活后增强输出蛋白的翻译。在一些情况下,环的大小为15-nt。在其它情况下,可使用使开关主干的18个碱基中的前15个解旋的关联触发子。在一些情况下,可同时使用一个或多个包括所有的这些特征。实施例证明了使用这样的核糖核酸调节子的结果。
[0097] 本文描述的支点核糖核酸调节子可用于通过多于一个触发RNA发挥功能或者传感多于一个触发RNA的逻辑门中。图12和13显示了本发明的这些额外的实施方案。图12显示了包含以线性方式连接在一起的多个发夹结构(即主干-环结构,crRNA)和下游的GOI编码序列的支点核糖核酸调节子。在图中,所述核糖核酸调节子包含6个发夹结构并且GOI是GFP。每个发夹结构连接到与输入RNA触发子(或者taRNA)互补的支点序列。每个输入RNA触发子(或者taRNA)均能够激活下游GOI的表达。这种核糖核酸调节子被称为“或”门,因为其仅需要一个输入RNA的存在以观察GOI的表达。当任意的输入RNA触发子(或者taRNA)被表达并且结合至其相应的crRNA序列时,此“或”门激活GFP的表达。该图还显示了在单独的输入RNA触发子A-F或者非关联RNA触发子W-Z存在情况下的开/关荧光比率。与非关联RNA触发子相比,在输入RNA触发子存在时开/关比率大得多。
[0098] 图13显示了包含具有延长的主干区的单个发夹(crRNA)结构的“与”门。所述crRNA编码各自用作针对taRNA的结合域的多个区域。输入RNA(或者taRNA)彼此杂交并且还可使crRNA主干的相应部分解旋。此系统只有当所有的输入RNA触发子都存在以使crRNA完全解旋时才激活。其被称为“与”门是因为其需要所有的输入RNA以观察GOI的表达。该图还提供了图片来显示在3、4、5和6个输入RNA触发子的不同组合存在情况下的GFP荧光。
[0099] 在其它方面,本发明认识到阻止触发RNA作用于其关联的开关RNA以阻止系统的激活或者作为将另一层逻辑添加至体内环路的手段是有用的。本文提供了使用在本文被称为“sink RNA”的RNA来减少或者消除触发RNA的活性的方法。sink RNA被设计用来与开关RNA竞争胜出与其关联触发链的结合。在这些系统中,侧翼序列v*和u*被分别加入到触发RNA的5’和3’末端(图14A)。针对触发子的关联sink RNA与触发子中央的b*-a*区域及其侧翼域完全互补。因此,sink-触发RNA相互作用的热力学比触发RNA与其关联开关之间的相互作用(其通过较短的b*-a*序列发生)要强得多。此效应导致触发子与sink的优先结合,并且在触发RNA结合至开关的事件中,v*和u*域将用作暴露的支点,sink RNA可使用所述支点来完成分支迁移过程以驱使触发子关闭开关。为了使sink-触发子杂交更可能地发生,将sink RNA以比触发RNA更高的水平表达。v*和u*域的长度可取决于具体的系统而变化。可将任一域从系统完全移除并仍然保持期望的网络行为,只要另一域是存在的。换句话说,sink RNA可包含一个或者两个侧翼域。在一些情况下,v*和u*域可为12至21nt长。
[0100] 图14B使用GFP作为模型读出来显示大肠杆菌中sink-触发子-开关RNA系统的行为。将理解本发明涉及其中GFP被目标蛋白(或基因)代替的其它系统。当单独表达开关RNA时,GFP报告蛋白的输出很低。当触发子和开关共表达时,结合发生并且开关强烈激活从而导致GFP输出的增加。然而,当所有三种RNA共表达时,由于优先的sink-触发RNA结合而导致GFP输出从其完全激活的水平下降90%。总的来说,仅当在sink不存在的情况下触发RNA存在时输出蛋白才表达;否则,来自系统的蛋白输出很低。因此,此系统执行逻辑操作A N-蕴涵B,其中触发RNA代表A输入,并且sink RNA是B输入。在此情况下,开关RNA用作进行A N-蕴涵B操作的门,并且输出是由开关RNA调控的蛋白。
[0101] 此方法还可直接应用于下文讨论的支点抑制子。当触发子/sink组合与抑制子一起使用时,仅当在sink RNA不存在的情况下触发RNA表达时所述系统才关闭。此行为等价于其中触发子用作A输入且sink是B输入的A蕴涵B操作。
[0102] sink RNA/触发RNA系统可应用于阈值环路。图14中显示的实验采用触发子、开关和sink RNA中每一个的恒定水平。还表达相对于触发RNA化学计量上过量的sink RNA以确保从细胞完全清除游离的触发RNA。然而,如果允许触发和sink RNA的水平发生变化,则此系统可提供阈值行为。例如,如果sink RNA的表达被保持恒定在中等水平而触发RNA的表达从低水平变化至高水平,则一旦触发RNA浓度超过sink RNA的浓度(或者特定比率的sink RNA浓度经受细胞或非细胞环境中RNA杂交行为的变化),开关RNA将被激活。或者,如果触发RNA的表达保持恒定且sink RNA的表达发生变化,则sink RNA用作触发RNA活性的调节器,使来自开关RNA的蛋白输出作为sink RNA浓度的函数而增加或减少。这些行为可用于神经网络类型的行为(参见例如Qian等人Nature,475:368-372,2011),并且可用于构建多数决定门和少数决定门。
[0103] 因此,本发明涉及包含开关RNA(包含目标基因的编码序列)、触发RNA和sink RNA的支点核糖核酸调节子组合物(或系统或设备)。在一些情况下,触发RNA是激活RNA(即,其在足够水平上的存在激活从开关RNA的蛋白表达(或者翻译)和从而目标编码序列的蛋白表达)。在一些情况下,触发RNA是抑制RNA(即,其在足够水平上的存在抑制从开关RNA的蛋白表达(或者翻译)和从而目标编码序列的蛋白表达)。开关RNA、触发RNA和sink RNA的相关结构特征描述于本文中。
[0104] 如本文所简要讨论的,支点核糖核酸调节子还可用作蛋白翻译的抑制子。按照本发明,提供了新的核糖核酸调节子类型,其可响应触发RNA通过新型的链重新配置机制来抑制目标基因的翻译。这些开关RNA/触发RNA核糖核酸调节子系统在本文因其基于支点的相互作用机制而被称为支点抑制子。这些RNA装置的分子实例如图15A所示。支点抑制子由两种RNA组成:包含目标基因编码序列的开关RNA,和引起从开关的蛋白翻译停止的触发RNA。在所示的例子中,开关RNA包含大约15-nt长的5’-支点域。所述支点后紧接着具有大约30-nt长的主干且包含9-nt环的主干-环区。形成主干的b和c域分别为大约18-和12-nt。主干在离主干底部8-、16-和24-nt的三个位置处包含凸起部分。这些凸起部分被掺入来降低转录终止的可能性,但是对于成功的操作是不必需的。凸起部分还可被转移到其它位置和增加数量而不必然地阻止成功的开关操作。还可改变环的大小而不影响操作。主干区后紧接着单链区域,其包含(5’到3’方向):4-nt的间隔子,RBS序列(在本实例中为8-nt),6-nt的间隔子,起始密码子AUG,9-nt的间隔子,21-nt的接头,和随后目标基因的编码序列。由于开关RNA中暴露的RBS至起始密码子区域,在触发RNA不存在时表达被开启。
[0105] 图15A所示,触发RNA是包含与开关RNA的前部区域完美互补的序列的单链RNA,并且由此其具有45-nt的总长度。当触发和开关RNA共表达时,触发RNA结合到开关RNA的支点域并且完成与开关主干的分支迁移反应。主干的移位完全暴露开关RNA的30-nt以及环。这些新暴露的碱基可快速再折叠。这样的链重新配置导致开关RNA的下游碱基形成新的发夹域。此发夹隔离基因起始密码子周围的区域,从而以与支点开关翻译激活子系统中的开关RNA相同的方式进行抑制。此外,值得注意的是,由支点抑制子形成的触发-开关RNA复合物产生具有延伸的支点的发夹,其可进而与具有序列5’-b*-a*-3’的激活性触发RNA相互作用以重新激活目标基因/蛋白的翻译。此具有分离的抑制和激活触发子的系统的行为与A蕴涵B门是等同的,其中A是抑制触发子,B为激活触发子。
[0106] 与支点激活子开关类似的,支点抑制子可采用具有实质上任意序列的触发RNA。因此,设计具有高度正交性的大型抑制子文库是可能的。此外,它们可被用来响应外源和内源RNA而引发翻译抑制。
[0107] 本发明还涉及和提供了基于支点抑制子的更高阶逻辑环路。鉴于其与支点激活子开关的相似性,可以以与翻译激活子基本上相同的方式将支点抑制子开关掺入到复杂的逻辑系统中。
[0108] 因此,一些方面提供了“与非”逻辑门,其是图9,10,13中所示的系统的抑制子形式。N-位“与非”逻辑可使用由产生功能性触发RNA的N-输入RNA链形成的复合物来进行。对于简单的2-位实例,以与用于2-位“与”系统的taRNA相同的方式将两个输入RNA编程为互相结合。这些输入RNA的每一个仅含有开关RNA的关联触发子的一部分,并且由此其每一个单独地不能够进行改变开关状态所需的分支迁移。然而,当两个输入RNA结合时,它们形成完整的触发RNA序列并且可结合到开关支点并使其主干解旋以引发翻译的抑制。此基本概念可扩展至N-位操作,这通过将完整的触发RNA序列分解到多个输入RNA(其以适当的顺序结合在一起以提供触发子序列)之间来进行。在可选择的方法中,两个输入可用来各自提供大约一半的触发子序列。随后这两个输入可通过N-2编程的输入RNA的装配来紧密靠近。
[0109] 其它方面提供了“或非”逻辑门,其是图11和12所示的系统的抑制子形式。N-位“或非”逻辑可使用位于目标蛋白编码序列上游的串联的支点抑制子发夹来评估。对于简单的2-位“或非”实例,“或非”门包含位于基因上游的一对正交的支点抑制子。在任一触发RNA不存在的情况下,两个支点抑制子的RBS和起始密码子均是暴露的并且可用于翻译。当仅表达一个触发RNA时,RBS-起始密码子区域的一个仍然可用于翻译并且核糖体具有足够的持续合成能力来使得其沿途的强发夹解旋。因此,2-位“或非”门只有当两个触发RNA都表达时才能关闭并引起两个支点抑制子域的链重新配置。这些基本概念可扩展至N-位“或非”门操作。
[0110] 本文提供的核糖核酸调节子可用于复杂的逻辑环路。例如,可将支点开关和支点抑制子掺入更高阶的逻辑环路用于“与/与非”、“或/或非”和“蕴涵/N-蕴涵”操作。此运算法的模块化通过将所有这些操作组合在单个延伸的门RNA中而能够实现甚至更加复杂的计算,所述门RNA包含串联的支点调节子发夹以及相关连的输入触发和sink RNA的网络。重要的是,本文提供的基本运算元件组通过将其分解至析取范式的表达式中(即,应用于嵌套“非”和“与”表达式的外部“或”操作)而使得能够对任何逻辑操作进行评估,例如:
[0111] (A与B)或(C与D)或(E与F与G)
[0112] 或者加入sink RNA:
[0113] 非(A与B)或(C与(非D))或(E与F与G)
[0114] 类似的表达式也可用掺入的“与非”和“或非”门来进行评价。使用支点调节子的运算在单一的运算层中进行操作(即,它们不需要一个操作的输出用作后续操作的输入)并且可容易地整合多个输入种类,这提高了其运算速度并且使得能够适应较少的门。这不同于其它的分子计算技术例如Qian等人Science,332:1196-1201,2011和Moon等人Nature,491:249-253,2012所描述的技术。
[0115] 其它实施方案提供和应用了多个输入“异或”和“同或”逻辑。例如,N-位“异或”(“同或”)计算可使用“或”(“或非”)门和触发/sink RNA的组合来进行。此操作背后的主要概念可用简单的2-位“异或”实例来描述。用于此操作的组成型表达的门RNA是包含一对串联的位于被调控基因上游的正交支点开关的2-位“或”系统。这些开关接受关联的触发子A和B。触发子A和B的表达分别受到两个正交化学诱导剂indA和indB的控制。每个触发子均具有关联的sink RNA A*和B*,所述sink RNA A*和B*优先结合到其对应的触发子以阻止门中开关发夹的激活。重要的是,这些sink RNA相比触发RNA从更高拷贝的质粒表达或者使用更强的启动子来表达以确保在细胞中被诱导时它们达到更高的浓度。此外,sink RNA A*和B*的产生分别与indB和indA相关联。因此indA至生长培养基中的加入将引起触发子A和sink B*的表达,而加入indB将引起触发子B和sink A*的产生。
[0116] 当仅存在一个诱导剂时,触发RNA和非关联的sink RNA的表达允许门RNA中一个开关发夹的激活。然而,当存在两个诱导剂时,两个触发RNA均表达,但是sink RNA也以较高水平转录。这些sink RNA与门RNA竞争胜出地用于触发分子并且阻止蛋白翻译的激活。在其中两个诱导剂均不存在的情况下,触发子不表达且门保持关闭。因此,此合成基因网络执行2-位“异或”逻辑。
[0117] 此一般性方法可扩展至N-位“异或”逻辑,其中N个诱导剂的每一个起始单个触发RNA以及补充的N-1个非关联sink RNA的表达。最后,N-位“同或”通过用一组N个串联的支点抑制子替换从N个串联的支点开关形成的N-位“或”门来评估。
[0118] 信标核糖核酸调节子
[0119] 在信标核糖核酸调节子系统中,crRNA包含具有可变长度的主干域,其包含RBS以及,在一些情况下,起始密码子(示例性实施方案见图5)。主干域还包含位于RBS上游的包含与taRNA靶互补的核苷酸的~9bp的区域。与taRNA靶的结合通过crRNA中的大(~21-nt)环状域起始,并且进行到crRNA主干域的5’部分中。通过此大-环-线性相互作用的taRNA靶结合产生稳固的双链,其提供机械力以促进剩余的crRNA解旋。解旋后,活化的crRNA的RBS和起始密码子均暴露出来,从而实现GOI的翻译。由于crRNA的靶结合区独立于RBS和起始密码子,因此原则上,信标核糖核酸调节子的taRNA可采用任意的序列。具有极少二级结构的taRNA将提供更好的反应动力学。此外,靶taRNA必须足够长以迫使crRNA主干域的解旋。
[0120] 使用与支点核糖核酸调节子装置所使用的相同的条件来测试信标核糖核酸调节子。图6显示6个信标核糖核酸调节子所获得的开/关中值荧光强度比率。装置中的4个显示超过10的开/关比率,其中一个设计超过系数200。
[0121] 支点核糖核酸调节子的变型显示于图8B中。
[0122] 如本文所述,反式-激活RNA(taRNA)(本文也称为触发RNA)可以是仅包含与支点或信标核糖核酸调节子的结合域(第一或者第二或者第一和第二域)杂交的那些序列的小RNA分子,或者它们可以是仅使用其序列的一部分杂交至支点或信标核糖核酸调节子的结合域的较长的RNA分子例如mRNA分子。在其它情况下,crRNA的激活可需要一起用于使crRNA的发夹结构解旋的两个或更多个RNA或者其它核酸分子。taRNA可具有不同的长度。在一些情况下,taRNA为大约30nt长。这样的taRNA可结合至具有12nt支点域的crRNA,如本文包括实施例7中所描述的。
[0123] 本发明的crRNA包含最少含有主干域和环状域的发夹结构。crRNA及其发夹通常包含单个核酸分子或其部分,其采用二级结构来形成(a)当分子内的互补序列通过碱基配对相互作用彼此杂交时的双链(双螺旋,部分或者完全双链)区域(本文称为主干域),和(b)在双链的一个末端上的单链环。图1,5和8显示了各种主干-环结构。在本发明的多个实施方案中,当主要为双链时主干域可包含一个或多个错配、凸起部分或者内环。主干域的长度可从互补核苷酸的第一对至互补碱基的最后一对来测量,并且包含错配的核苷酸(例如非AT、AU、GC的配对)、形成凸起部分的核苷酸或者形成内环的核苷酸。
[0124] 将理解虽然发夹是从单个核酸分子形成的,但是分子的两个形成主干域的区域或者序列在本文可被称为“链”。因此主干在本文可被称为部分或者完全双链的。单个分子内彼此互补并且能够形成主干域的核酸序列被称为“自互补”或者“自杂交的”或者能够“自杂交”。一般而言,本文所述的发夹和主干域在生理条件下形成并且在生理条件下是稳定的,所述生理条件是例如存在于细胞内的条件(例如近似生理条件的条件例如PH、温度和盐浓度)。这样的条件包括介于6.8到7.6之间更优选约7.4的PH。典型的温度是约37℃,尽管原核生物和一些真核细胞例如真菌细胞能够在较宽的温度范围包括低于或者高于37℃的温度下生长。
[0125] 本发明的各种核酸可在本文被称作为非天然存在的、人工的、工程化的或者合成的。这意指核酸不是天然地或在天然存在的、未经处理的来源中发现的。非天然存在的、人工的、工程化的或者合成的核酸可在序列上与天然存在的核酸相似,但是相对于在天然存在的对应物中所发现的序列,其可包含至少一个人工产生的插入、缺失、倒置或者置换。包含工程化核酸的细胞可被称作为工程化细胞。
[0126] 本发明的多个实施方案涉及彼此互补的核酸序列。在一些情况下,序列优选是完全互补的(即,100%互补)。然而,在其它情况下,序列仅仅是部分互补的。部分互补的序列可以是至少60%,至少70%,至少80%,至少90%,或者至少95%互补的。仅部分互补的序列当彼此杂交时,将包含双链区和单链区。单链区可以是多个错配、环(其中例如一条链上的一系列连续的核苷酸是未杂交的)、凸起部分(其中例如两条链上的彼此相对的一系列连续的核苷酸是未杂交的)。将理解可对于两个序列的整个长度或对于序列的部分来确定互补性。
[0127] 本发明的核酸和/或其它部分可以是分离的。如本文所用,“分离的”意指与其通常缔合于的组分的至少一些分开,无论其是来自天然存在的来源还是合成地制备的。
[0128] 本发明的核酸和/或其它部分可以是纯化的。如本文所用,“纯化的”意指与大部分的其它化合物或实体分开。化合物或部分可以是部分纯化的或大体上纯化的。纯度可按重量比重量的测量来表示,并且可使用多种分析技术例如但不限于质谱、HPLC等来测定。
[0129] 核酸通常指的是包含核苷酸或者核苷酸类似物的聚合物,所述核苷酸或者核苷酸类似物通过主链键合例如但不限于磷酸二酯键连接在一起。核酸包括脱氧核糖核酸(DNA)和核糖核酸(RNA)例如信使RNA(mRNA)、转移RNA(tRNA)等。核酸可以是单链的、双链的,还可以是三链的。
[0130] 天然存在的核苷酸由核苷即连接至戊糖的含氮碱基,和一个或多个磷酸基团组成,所述磷酸基团通常在连接至核苷戊糖的C-5(表示为5’)的羟基上发生酯化。这样的化合物被称为核苷5’-磷酸或者5’-核苷酸。在DNA中,戊糖是脱氧核糖,而在RNA中戊糖是核糖。含氮碱基可以是嘌呤例如腺嘌呤和鸟嘌呤(见于DNA和RNA中),或者是嘧啶例如胞嘧啶(见于DNA和RNA中)、胸腺嘧啶(见于DNA中)或者尿嘧啶(见于RNA中)。因此,DNA的主要核苷酸是脱氧腺苷5’-三磷酸(dATP)、脱氧鸟苷5’-三磷酸(dGTP)、脱氧胞苷5’-三磷酸(dCTP)和脱氧胸苷5’-三磷酸(dTTP)。RNA的主要核苷酸是腺苷5’-三磷酸(ATP)、鸟苷5’-三磷酸(GTP)、胞苷5’-三磷酸(CTP)和尿苷5’-三磷酸(ATP)。一般而言,稳定的碱基配对相互作用发生在腺嘌呤和胸腺嘧啶(AT)之间、腺嘌呤和尿嘧啶(AU)之间以及鸟嘌呤和胞嘧啶(GC)之间。因此腺嘌呤和胸腺嘧啶、腺嘌呤和尿嘧啶以及鸟嘌呤和胞嘧啶(以及对应的核苷和核苷酸)被称作为彼此互补。
[0131] 通常,核酸的一个末端具有5’-羟基并且核酸的另一末端具有3’-羟基。因此,核酸具有极性。核酸中序列或部分或域的位置或者定位可被表示为在特定标记的上游或5’,意指其介于标记和核酸的5’末端之间。类似的,核酸中序列或部分或域的位置或者定位可被表示为在特定标记的下游或3’,意指其介于标记和核酸的3’末端之间。
[0132] 核酸可包含核苷酸类似物,其包括非天然存在的核苷酸类似物。这样的类似物包括核苷类似物(例如,2-氨基腺苷,2-硫代-胸苷、肌苷、3-甲基腺苷、C5-丙炔胞苷,C5-丙炔尿苷,C5-溴尿苷,C5-氟尿苷,C5-碘尿苷,C5-甲基胞苷,7-脱氮腺苷,7-脱氮鸟苷,8-氧腺苷,8-氧鸟苷,O(6)-甲基鸟嘌呤,和2-硫代胞苷)、化学修饰的碱基、生物修饰的碱基(例如,甲基化的碱基)、插入的碱基、修饰的糖(例如2’-氟代核糖、核糖、2’-脱氧核糖,阿拉伯糖和己糖)、或者修饰的磷酸基团(例如硫代磷酸酯和5’-N-亚磷酰胺键合)。
[0133] 本发明的核酸包括crRNA和taRNA可被提供或存在于较大的核酸中。所述较大的核酸可负责转录和从而产生crRNA和taRNA,例如如实施例1中所描述的。所述较大的核酸可包含被转录以产生本发明的crRNA和taRNA的核苷酸序列。为方便起见,本发明可将较大的核酸称作为包含crRNA和/或taRNA,虽然应理解在实践中此意指较大的核酸包含编码crRNA和/或taRNA的序列。这样的编码序列可可操作地连接至较大核酸中的其它序列例如但不限于复制起点。如本文中所用,“可操作地连接”指的是两个核酸序列之间的关系,其中核酸序列中的一个的产生或表达被另一核酸序列控制、调控、调节等。例如,核酸序列的转录受到可操作连接的启动子序列的支配;核酸的转录后加工受到可操作连接的加工序列的支配;核酸序列的翻译受到可操作连接的翻译调控序列的支配;核酸或者多肽的转运或定位受到可操作连接的转运或定位序列的支配;以及多肽的翻译后加工受到可操作连接的加工序列的支配。优选可操作地连接至第二核酸序列的核酸序列直接或者间接地共价连接至这样的序列,尽管任何有效的缔合是可接受的。
[0134] 如本文中所用,调控序列或元件意指支配、增强或者抑制与其可操作地连接的序列的表达(例如转录、翻译、加工等)的核酸序列的区域。该术语包括启动子、增强子和其它的转录和/或翻译控制元件。本发明的crRNA和taRNA部分在其控制可操作地连接至crRNA的目标基因的翻译的程度上可被认为是调控序列或元件。本发明预见本发明的crRNA和taRNA可支配组成型的或者诱导型的蛋白表达。诱导型的蛋白表达可以以时间或者发展的方式进行控制。
[0135] 术语“载体”指的是能够介导第二核酸分子进入(例如转移、转运等)细胞的核酸。被转移的核酸通常连接至例如插入载体核酸中。载体可包含支配自主复制的序列,或者可包含足以允许整合到宿主细胞DNA中的序列。例如,可用的载体包括例如质粒(通常为DNA分子,尽管RNA质粒也是已知的)、黏粒和病毒载体。
[0136] 在本发明的上下文中,报告蛋白通常用于使crRNA的激活可视化。适用于此目的的报告蛋白包括但不限于荧光或化学发光报告因子(例如,GFP变体、荧光素酶例如来源于萤火虫(北美萤火虫(photinus pyralis))或者海肾(renilla reniformis)的荧光素酶及其突变体),酶类报告因子(例如,β-半乳糖苷酶,碱性磷酸酶,DHFR,CAT)等。eGFP是在位置65上的丝氨酸(Ser65)具有各种置换(例如Thr、Ala、Gly)的蛋白种类。蓝色荧光蛋白(BFP)在位置66上具有突变(Tyr到His的突变),其改变发射和激发性质。BFP中的此Y66H突变引起光谱相较于wtGFP蓝移。青色荧光蛋白(CFP)具有Y66W突变,其中激发和发射光谱波长介于BFP和eGFP的波长之间。Sapphire是在495nM上具有受抑激发峰但仍保留395上的激发峰和511nM上的发射峰的突变体。黄色FP(YFP)突变体在位置203上具有芳香族氨基酸(例如Phe、Tyr等)并且具有红移的发射和激发光谱。
[0137] 应理解,虽然本发明的各个实施方案在RNA的背景下进行描述,但是本发明的核酸可以是RNA或DNA。一般情况下,RNA和DNA可采用体外系统、在细胞内或者使用本领域中已知的方法通过化学合成来产生。将理解,crRNA元件在开放阅读框(ORF)上游的插入可通过修饰包含ORF的核酸来实现。
[0138] 本发明提供了用于crRNA或taRNA的转录的DNA模板。本发明还提供了包含这样的DNA模板的DNA构建体和质粒。在某些实施方案中,发明提供了包含可操作地连接至启动子的用于crRNA或taRNA的转录的模板的构建体。
[0139] 在某些实施方案中,发明提供了DNA构建体,其包含(i)用于crRNA转录的模板;和(ii)位于模板上游的启动子。在某些实施方案中,本发明的构建体或者质粒在用作用于crRNA的模板的构建体部分的3’末端的下游包含限制性酶切位点以允许所选择的ORF的插入。构建体可在用作用于crRNA的模板的部分的下游包含部分或者全部的多接头或多重克隆位点。构建体还可在crRNA的下游包含ORF。
[0140] 在某些实施方案中,本发明提供了DNA构建体,其包含(i)用于taRNA转录的模板;和(ii)位于模板上游的启动子。本发明还提供了包含下列的DNA构建体:(i)用于crRNA转录的模板;(ii)位于用于crRNA转录的模板的上游的启动子;(iii)用于taRNA转录的模板;和(iv)位于用于taRNA转录的模板的上游的启动子。启动子可以是相同的或是不同的。
[0141] 可将构建体掺入质粒,例如能够在细菌中复制的质粒。在某些实施方案中,质粒是高拷贝数质粒(例如,基于pUC或者基于pBR322的质粒),而在其它实施方案中,质粒是低或者中等拷贝数质粒,这些术语在本领域中是被理解和已知的。质粒可包含多种复制起点中的任何复制起点,其可提供不同的拷贝数。例如,可使用任何下述的(拷贝数列在括号中):ColEl(50-70(高)),pl5A(20-30(中等)),pSClOl(10-12(低)),pSOOl*(<4(最低))。可期望使用具有不同拷贝数的质粒用于crRNA和taRNA的转录以改变它们在细胞或者系统中的相对量。此外,在某些实施方案中可使用拷贝数可调的质粒。
[0142] 本发明还提供了包含上述核酸、构建体(例如DNA构建体)和质粒的病毒和细胞。在多个实施方案中,细胞是原核细胞。在多个实施方案中,细胞是真核细胞(例如,真菌细胞、哺乳动物细胞、昆虫细胞、植物细胞等)。核酸或构建体可通过使用重组核酸技术来整合到病毒基因组中,并且可产生包含核酸分子和/或用于其转录的模板的感染性病毒颗粒。可使用本领域中已知的多种方法例如电穿孔、磷酸钙介导的转染,病毒感染等,来将核酸分子、DNA构建体、质粒或者病毒引入到细胞中。
[0143] 如本文所讨论的,可将核酸构建体整合到细胞的基因组中。这样的细胞可以是体外(例如在培养物中)或体内(例如在生物体中)存在的。本发明还提供了包含本发明的核酸、DNA构建体和/或质粒的转基因植物和非人类的转基因动物。产生这样的转基因生物的方法在本领域是已知的。
[0144] 本发明还提供了各种试剂盒。例如,本发明提供了包含质粒的试剂盒,其中第一质粒包含(i)用于crRNA转录的模板;和(ii)位于用于crRNA元件的转录的模板上游的启动子,和任选地第二质粒,其包含(i)用于关联(互补)的taRNA元件的转录的模板,和(ii)位于用于taRNA元件的转录的模板上游的启动子。上述启动子可以是相同的或者优选是不同的。启动子的一个或多个可以是诱导型的。质粒可具有相同的或者不同的拷贝数。本发明还提供了包含单一质粒的试剂盒,所述质粒包含用于crRNA元件的转录的模板和位于用于crRNA元件的转录的模板上游的启动子并且还包含用于关联taRNA元件的转录的模板和位于用于关联taRNA元件的转录的模板上游的启动子。在某些实施方案中,质粒在用于crRNA元件的转录的模板的上游或下游包含一个或多个限制性酶切位点。如果在下游,限制性酶切位点可用于插入所选择的开放阅读框。试剂盒还可包含一种或多种下列组分:(i)一种或多种诱导剂;(ii)宿主细胞(例如,原核或真核宿主细胞);(iii)一种或多种缓冲液;(iv)一种或多种酶,例如限制性内切酶;(v)核酸分离和/或纯化试剂;(vi)缺少crRNA或者taRNA序列的对照质粒;(vii)包含crRNA或taRNA序列或两者的对照质粒;(viii)测序引物;(ix)使用说明书。对照质粒可含有报告序列。
[0145] 在一些情况下,本发明的核糖核酸调节子包含共有原核RBS。然而,在本发明多个实施方案中,各种可选择序列中的任何序列可用作RBS。已确定了大量细菌核糖体结合位点的序列,并且这些序列的重要特征是已知的。用于高水平翻译的优选RBS序列在相对于AUG的位置-6至-11上包含G-富集区域,并且通常在位置-3上包含A。用于本发明的示例性RBS序列包括但并不限于AGAGGAGA(或此序列的子序列,例如至少6个核苷酸长的子序列,例如AGGAGG)。更短的序列也是可接受的,例如AGGA、AGGGAG、GAGGAG等。已产生了许多合成的核糖体结合位点,并且已测试了其翻译起始活性。在多个实施方案中,可将任何天然存在的RBS用于crRNA构建体中。任何候选序列用作RBS的活性可采用任何合适的方法来进行测试。例如,可如公开的PCT申请WO2004/046321中的实施例1中所描述的或者如该公开的PCT申请的参考文献53中所描述的来测量表达,例如通过测量由包含适当地位于AUG上游的候选RBS的mRNA编码的报告蛋白的活性来进行。优选地用于本发明的RBS序列以共有RBS支持的翻译水平的至少10%的水平支持翻译(例如如通过报告蛋白的活性所测量的)。例如,如果候选RBS插入到对照质粒中取代共有RBS,则所测量的荧光将为使用共有RBS所测量的荧光的至少10%。在某些实施方案中,使用以相对于共有RBS支持的翻译水平的至少1%、5%、10%、
20%、30%、40%、50%、60%、70%、80%、90%或更高的水平支持翻译的RBS。在本发明的某些实施方案中,使用比共有RBS更高的水平支持翻译的RBS。
[0146] 关于核糖核酸调节子的其它一般性教导可见于公开的PCT申请WO 2004/046321中,将其全部内容以引用的方式并入本文。
[0147] 支点和信标核糖核酸调节子的优势
[0148] 与现有的技术相比,本发明的核糖核酸调节子提供许多优势。例如,实时定量PCR(qRT-PCR)提供RNA水平的高灵敏检测,Northern印迹显示高特异性,以及微阵列使得能够同时检测成千上万的靶。然而,在所有的这些技术中,必须杀死细胞以获得RNA用于定量,因此实时测量RNA的水平是具有挑战性的。荧光原位杂交(FISH)和荧光RNA适配体的使用使得能够可视化RNA在细胞内的定位。FISH需要固定细胞来可视化,并且杂交使用昂贵的探针且消耗许多小时。RNA适配体可用于在活细胞中成像RNA;然而,那些具有最高荧光强度的适配体仍然需要拷贝数远远超过内源RNA的拷贝数以在大多数光学显微镜下进行检测。RNA水平还可通过使用从与RNA靶相同的启动子驱动的荧光报告蛋白来进行检测。这种方法中的报告因子可反映RNA靶的水平,但是它不能概括远离(例如数千碱基)启动子区域的染色质区域的调控行为。此外,启动子的额外拷贝的存在可滴定远离靶基因的RNA聚合酶活性。最后,用蛋白结合适配体标记的RNA也被用来利用结合蛋白与荧光蛋白报告的融合体来测量细胞内RNA的定位和水平。然而,这种技术需要染色体修饰以标记或敲除对应于待被可视化的RNA的基因。本发明的核糖核酸调节子不受现有技术的这些各种限制的阻碍。实施例
[0149] 实施例1.支点核糖核酸调节子和报告蛋白/GOI
[0150] 实验测试了图1的示例性核糖核酸调节子。GOI是EGFP变体GFPmut3b,其用ASV降解信号进行标记以将其半衰期设置为约110分钟。与crRNA关联的taRNA采用软件包NUPACK来设计为具有最小限度的二级结构,并且具有与crRNA的30-nt长的靶结合位点的完美互补性。
[0151] 核糖核酸调节子在大肠杆菌BL21DE3star中进行测试,所述大肠杆菌是包含携带IPTG诱导型lacUV5启动子控制下的T7RNA聚合酶的λ噬菌体溶菌原的RNA酶E缺陷型菌株。crRNA和taRNA构建体从单独的质粒中表达以使得能够快速表征crRNA与关联及非关联的taRNA序列的相互作用。对于crRNA和taRNA两者,转录均从上游的T7启动子起始,并且采用T7RNA聚合酶终止信号来终止转录。crRNA-GFP转录物从具有中等拷贝数colA起点的质粒产生,而taRNA转录物从具有colE1起点的较高拷贝数质粒产生。这些质粒拷贝数的变化导致完全诱导的细胞内相较于crRNA预计7-倍过量的taRNA。此比率与先前的研究和针对反义RNA及其靶所观测到的典型的拷贝数变化是相似的。
[0152] 在大肠杆菌中进行了体内测试,所述大肠杆菌用crRNA及其关联taRNA靶(开的状态的菌株)或者crRNA及其非关联taRNA(关的状态的菌株)进行转化,并在用透气密封物覆盖的深孔96-孔板中于1ml选择性LB培养基中在37℃下生长过夜。在开和关状态的核糖核酸调节子条件下用两种质粒转化大肠杆菌确保该两种菌株至少在转录的外源RNA的数量方面经历相似的代谢负荷。将过夜培养物稀释100倍并且在深孔板内于37℃生长80分钟。随后将早期对数期细胞用0.1mM的IPTG诱导,在1小时时间点获取等分部分用于通过流式细胞术进行表征。为了比较样品间的GFP荧光强度,从由流式细胞术数据产生的荧光强度直方图计算众数GFP强度。
[0153] 作为核糖核酸调节子性能的第一度量,将crRNA-GFP构建体的荧光强度与来自在相同的BL21DE3star大肠杆菌菌株中以相同的IPTG浓度水平诱导的非顺式抑制GFP构建体的荧光进行比较。这些测量显示极高水平的翻译抑制,其中6个测试的核糖核酸调节子crRNA减少99.5%或者更多的荧光输出(见图2)。为了计算核糖核酸调节子的反式-激活效率,将在其关联taRNA存在情况下的crRNA-GFP的众数GFP荧光与在非关联taRNA存在情况下的crRNA-GFP的荧光进行比较。通过使这两个数相除,计算了所有测试的核糖核酸调节子的开/关比率。图3显示了高性能支点核糖核酸调节子在1小时时间点获取的此开/关比率。误差线是从三个生物学平行测定计算的开/关比率中的标准偏差。从这些数据清楚地显示,支点核糖核酸调节子可展现被靶RNA的强烈反式-激活,其中在诱导后仅2到3小时荧光以超过200的系数增加。
[0154] 在体内对另外的60个支点核糖核酸调节子设计进行了同样的测量,开/关比率显示于图4中。在其关联靶存在时,大约三分之一所测试的核糖核酸调节子以50或更高的系数增加GFP输出。
[0155] 实施例2.信标核糖核酸调节子
[0156] 使用与支点核糖核酸调节子所使用的相同条件来测试信标核糖核酸调节子例如具有图5所示结构的信标核糖核酸调节子。图6显示针对6个信标核糖核酸调节子所获得的开/关中值荧光强度比率。4个装置显示超过10的开/关比率,其中一个设计超过系数200。
[0157] 实施例3.内源RNA传感
[0158] 本文描述的新型核糖核酸调节子可用于检测内源RNA。作为概念的证据,设计和产生可被大肠杆菌中的小RNA ryhB触发的信标核糖核酸调节子。RyhB是90-nt长的非编码RNA,其在大肠杆菌中铁的水平低时上调。此RNA可通过添加铁螯合剂2,2'-联吡啶至培养基中来进行诱导。
[0159] 为了测试此内源传感器,构建了在GFP报告因子上游包含信标核糖核酸调节子的质粒。crRNA转录物的表达通过使用IPTG-诱导的PllacO启动子来控制。将转化了核糖核酸调节子传感器质粒的MG1655大肠杆菌细胞在早期对数期用1mM的IPTG进行诱导。同时,通过添加铁螯合剂诱导ryhB表达。从2小时后收获的细胞获取的流式细胞术测量显示含ryhB的细胞的GFP荧光强度相较于未用2,2'-联吡啶进行诱导的对照群体有5倍的升高(图7)。此外,含有在PllacO-1启动子下的非顺式抑制GFP报告因子的对照细胞当用IPTG和2,2'-联吡啶诱导时相较于用单独的IPTG诱导的细胞显示出荧光强度的降低。此额外的对照表明,来自传感器的GFP输出不是由铁螯合剂的添加所引起的转录水平增加引起的。
[0160] 实施例4.使用核糖核酸调节子的复杂“或”逻辑操作的遗传编码
[0161] 已使用核糖核酸调节子文库的成员成功地在体内进行了多种逻辑“或”操作。最简单的“或”操作包含两个输入,A和B,如果所述输入中的任一个存在即可激活逻辑门。将此系统通过简单地采用两个高性能的核糖核酸调节子并将其沿着相同的mRNA相继置于GFP编码序列的上游来在体内实现(图11a)。此门在体内的预期操作如图11b所示。当任一输入RNA分子存在于细胞中时,其将结合至其对应的crRNA模块并通过使其主干解旋来去抑制所述模块。由于参与蛋白翻译的核糖体具有强RNA解旋酶活性,其可使其路径中的下游crRNA解旋,从而不受阻碍地持续翻译。2-输入“或”门的流式细胞术揭示当任一经编程的taRNA输入被转录时GFP表达的强烈激活(图11c)。此外,其中crRNA的位置互换的平行实验显示相似的系统性能表现。
[0162] 受到2-输入门的成功实现的启示,继续进行以位于GFP上游的6个crRNA模块为特征的6-输入“或”逻辑系统(图12)。由于“或”逻辑系统中的三个母本crRNA包含终止密码子,故修改了其序列以消除这些非期望的密码子并且单独地测试其以确保无终止密码子的变体保留其母本的活性。在这些测试之后,使用基因拼装合成474-bp的6-crRNA构建体并与表达不同taRNA元件的质粒一起转化至大肠杆菌中。同时表达6-输入“或”mRNA和关联taRNA中的一个的细胞当在包含诱导剂IPTG的平板上测量时显示出很强的GFP荧光。然而,4个非关联taRNA的组不能激活GFP的显著表达,这突显了本发明的体内逻辑框架的令人瞩目的正交性。来自这些转化子的流式细胞术测量还确认了成功的“或”门操作,其中所有6个输入相较于4个非关联taRNA的组提供至少5-倍更高的GFP输出。
[0163] 实施例5.使用核糖核酸调节子的复杂“与”逻辑操作的遗传编码
[0164] 已利用支点核糖核酸调节子开发了用于进行“与”逻辑操作的可一般化的系统。图9描述了以GFP报告序列上游的crRNA序列为特征的双输入“与”门。系统中的两个输入是两个包含crRNA门的关联taRNA序列的一半的RNA序列A和B(图9A)。所述两个输入RNA还包含杂交域(u-u*),其使得两个RNA在它们均存在于细胞内时彼此结合。当此杂交事件发生时,taRNA的两半紧密靠近从而提供能够使门crRNA解旋以触发GFP翻译的序列。每个输入RNA当单独表达时均不能去抑制所述crRNA,因为它们:(1)不能使crRNA主干的足够长的区域解旋(这是对于输入B的情况),或者(2)其在动力学和热力学上不利于结合crRNA(这是对于输入A的情况)。2-输入“与”逻辑系统的流式细胞术测量验证了其在大肠杆菌中的操作(图9B)。
GFP输出仅在系统中所有三个RNA都在细胞内表达时才被激活,而在所有其它情况下GFP输出均较低。
[0165] 基于支点核糖核酸调节子的“与”门已成功扩展至6-位操作。如图13A所示,此系统中的门由具有延伸的主干的发夹和来自最底端的crRNA的支点序列组成,所述延伸的主干由6个经验证的支点核糖核酸调节子crRNA的主干序列组成。如此输入RNA包含对应的taRNA序列,并且还具有针对其相邻输入链的杂交序列。给定的输入的杂交序列与下一个输入RNA的支点结合域是互补的。例如,输入A包含与输入B结合的12-至15-nt序列,并且此序列是输入B的关联crRNA的支点。因此,输入A与门的结合使其主干的底部碱基解旋,并且还提供了新的支点用于结合输入B。这种主干解旋/支点呈现过程重复进行直到所有的输入结合到门为止。在所有输入结合之后,RBS和起始密码子被抑制,从而触发GFP或者另一种目标蛋白的产生。已通过在表达门mRNA的大肠杆菌中表达输入RNA的不同组合来验证了此门。图13B显示了从在LB平板上诱导的菌落测量的GFP强度。只有当所有的6个输入都在细胞中表达时才可见强的GFP荧光。在其它6个输入组合中GFP的表达很低,包括其中表达除一个以外的所有输入RNA的严格测试也如此。
[0166] 实施例6.核糖核酸调节子支点抑制子
[0167] 构建了44个支点抑制子的文库(设备/系统)并在大肠杆菌BL21Star DE3中测试了其功能。使用流式细胞术来测试该系统的性能,计算来自处于关状态(即在其关联触发子存在时)以及开状态(即在其关联触发子不存在时)的开关的众数GFP荧光。随后利用下面的方程式计算百分比抑制水平:
[0168] %抑制=1-[关状态的众数荧光÷开状态的众数荧光]
[0169] 图15B显示了针对文库中的44个抑制子所获得的%抑制水平。抑制子40至44具有高度变化的性能表现。假定其行为是由开关RNA折叠的不稳定性引起的,此不稳定性引起开关RNA在开和关状态的构型之间波动,即使在触发RNA不存在的情况下也如此。该设备/系统的其余部分平均起来表现得相当好。总文库的73%具有至少80%的抑制水平。此外,文库的50%显示超过90%的抑制。此令人瞩目的90%的抑制水平超过了几乎所有先前报道过的翻译抑制子(见Mutalik等人,Nat.Chem.Biol.8:447-454,2012)的性能。另外的测量还显示最高性能的支点开关可在1个小时内实现大于95%的翻译抑制,并且在随后的时间点将该水平增加至大于99%(图16)。
[0170] 实施例7.支点开关
[0171] 如本文所述,本发明提供一类新的基因表达转录后核糖核酸调节子,其被称为支点开关并且不具有已知的天然对应体。支点开关响应反式-作用触发RNA而激活所调控的基因的表达。两种新型机制促进了其在活细胞中的操作:在体外研究中率先发现的基于支点的线性-线性RNA相互作用以及通过起始密码子周边区域中的碱基配对进行的高效翻译抑制。已证实支点开关使得能够容易地调节蛋白表达超过100倍,其中最好的开关可媲美基于蛋白的调节剂的动力学范围。已验证了大量的正交组分,包括显示低于2%的系统串扰水平的18个支点开关的文库,这构成了所报道过的基于蛋白或RNA的正交调控元件中的最大且最有说服力的家族。随后正向工程化了一组具有406的平均开/关荧光比率的13个支点开关。还应用了热力学分析来预测系统性能表现的变化。此外,验证了一组能够从功能性mRNA分子有效触发的支点开关。这些支点开关的高动力学范围、正交性、可编程性和多功能性表明它们将是合成生物学中功能强大的新工具。
[0172] 方法
[0173] 菌株,质粒和生长条件。本研究使用下列大肠杆菌菌株:BL21Star DE3(F-ompT hsdSB(rB-mB-)gal dcm rne131(DE3);Invitrogen),BL21DE3(F-ompT hsdSB(rB-mB-)gal dcm(DE3);Invitrogen),MG1655Pro(F-λ-ilvG-rfb-50rph-1SpR lacR tetR),和DH5α- + -
(endA1recA1gyrA96thi-1glnV44relA1hsdR17(rKmK)λ).所有的菌株均生长于具有合适的抗生素的LB培养基中。以下列浓度使用抗生素:氨苄青霉素(50μg mL-1),卡那霉素(30μg mL-1),以及氯霉素(34μg mL-1)。
[0174] 为了表征支点开关,用期望的支点开关和触发子质粒组合转化化学感受态大肠杆菌,然后涂布到含有合适的抗生素对的LB/琼脂平板上。对于菌落GFP荧光测量,将LB/琼脂平板补充0.1mM的异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)以诱导RNA的表达。对于流式细胞术测量,接种从个体菌落中挑选的细胞到含有抗生素的LB培养基中,37摄氏度振荡过夜培养。随后将细胞在新鲜的选择性LB培养基中稀释一百倍,并重新放回96孔板中在37摄氏度振荡培养。对于在BLS21Star DE3和BL21DE3中T7RNA聚合酶驱动的表达,用0.1mM IPTG在生长80分钟后0.2至0.3的OD600处诱导细胞。除非另有说明,在加入IPTG后3小时进行细胞培养物的测量。对于使用组成型PN25启动子的表达,在选择性LB培养基中将过夜培养物稀释100倍。对于后续的测量,此稀释的时间被定义为t=0。
[0175] 质粒构建。所有的DNA寡核苷酸都购买自Integrated DNA Technologies,Inc。从使用通用引物扩增的单个>100-nt的寡核苷酸或者使用基因拼装从使用gene2oligo(Rouillard等人,Nucleic Acids Res32:W176-180,2004)分割的短的<50-nt的寡核苷酸产生双链的触发和开关DNA。随后,以30-bp的重复区使用Gibson拼装(Gibson等人,
Nat.Methods 6:343-345,2009)将这些PCR产物插入到载体主链中。利用通用主链引物对载体主链进行PCR扩增,并在拼装前用DpnI(New England Biolabs,Inc.)进行消化。从基于T7的表达质粒pET15b、pCOLADuet和pACYCDuet(EMD Millipore)产生主链。pET15b、pCOLADuet和pACYCDuet质粒都包含组成型表达的lacI基因、T7RNA聚合酶启动子和终止子对,以及分别的下列抗性标记/复制起点:氨苄青霉素/ColE1、卡那霉素/ColA和氯霉素/P15A。本文公开的所有触发RNA均使用pET15b主链来表达,并且开关mRNA使用pCOLADuet或pACYCDuet主链来表达。主链的反向引物被设计为结合T7启动子的上游区域。触发子主链的正向引物从T7启动子起始处扩增。开关主链的正向引物被设计为引发GFPmut3b-ASV或mCherry的5’末端并添加包含用于Gibson拼装的接头的30-nt序列。构建体被克隆在DH5α中并进行测序以确保所有的支点开关组分被正确合成。所有的转化均使用已建立的化学转化方法来进行(Inoue等人,Gene,96:23-28,1990)。
[0176] 流式细胞术测量和分析。使用配有高通量采样器的BD LSRFortessa细胞分析器来进行流式细胞术。采用488nm的激发激光和530/30nm的滤光器测量GFP荧光强度。采用561nm的激光和610/20nm的发射滤光器测量mCherry荧光强度。在代表性的实验中,将细胞以~65的系数稀释到磷酸盐缓冲液(PBS)中,并从96孔板中采样。将前向散射(FSC)用于触发并分析了~3万个个体细胞。
[0177] 开状态和关状态细胞的荧光测量的误差水平计算自来自至少三个生物学平行试验的测量的标准差。随后通过将开和关状态荧光的相对误差加入求积来确定开/关荧光比率的相对误差水平。对于体内系统串扰的测量,使用流式细胞术测量转化细胞的676个菌株中的每一个的单菌落。为了评估这些菌株在GFP输出上的菌落间变化,测量了随机选择的18个转化株的亚组,并对其以一式六份进行测量。这些测量的相对不确定度平均为12%,这与用于测定文库组分的开/关荧光比率的流式细胞术实验所获得的的不确定度是可比较的。
[0178] 菌落荧光成像。使用Typhoon FLA 9000生物分子成像系统来获得来自大肠杆菌菌落的荧光图像。所有的图像都使用同样的PMT电压、0.1mm的成像分辨率、473nm的激光激发和用于检测GFP的LPB(>510nm的长通)滤光器来获得。诱导的细胞在涂板后~18小时进行成像。由于IPTG在与GFP相同的通道上显示低水平的荧光,因此平板中LB/琼脂的厚度的变化会导致背景荧光水平的变化。为了校正此效应,将对每个平板测量的最小GFP强度从整个平板的强度水平中减去,从而去除大部分的背景IPTG荧光。
[0179] 结果
[0180] 本文提供了新的核糖核酸调节子系统,其使得能够转录后激活蛋白质翻译。与传统的核糖核酸调节子不同,本发明的合成核糖核酸调节子利用支点介导的线性-线性相互作用以起始RNA-RNA链置换相互作用。此外,它们依赖于起始密码子周围区域的隔离以抑制蛋白质翻译,这避开用以破坏翻译的与RBS或者起始密码子本身的任何碱基配对。因此,这些核糖核酸调节子可被设计为响应具有实质上任意序列的触发RNA来激活蛋白质翻译,从而实现组分正交性的实质改善。与RBS结合的缺失以及热力学有利的线性-线性相互作用的使用还使得能够通过RBS工程化来容易地调节翻译效率。因此,这些系统通常使得能够在两个数量级上调节蛋白质表达。基于其相互作用机制近似数字信号处理行为,这些核糖核酸调节子在本文被称作为支点开关。
[0181] 本公开内容还通过在大肠杆菌中验证多个响应预定的触发RNA增加蛋白产生超过100倍的翻译激活子来证实了支点开关的效用。此外,利用新型核糖核酸调节子设计提供的扩展的RNA序列空间来构建了具有前所未有的部分正交性的组分的文库,包括显示整个组上低于12%的串扰的26个系统的组,这以高于3的系数超过了所有在先的正交调节子文库的大小。支点开关的序列和热力学分析产生了一组可用于正向工程化新型核糖核酸调节子的设计原则。这些正向工程化的部分平均显示超过400的开/关比率,这通常是基于蛋白质的遗传网络利用从纯粹理性设计框架构建的组分所保留的动力学范围。
[0182] 支点开关设计。支点开关系统包含两个经编程的RNA链,其被称作为开关和触发子(图17B)。开关mRNA包含被调控基因的编码序列。所述编码序列的上游是基于发夹的加工模块,所述模块包含强核糖体结合位点和起始密码子,随后是编码添加至目标基因N-末端的氨基酸的短接头序列。在发夹模块5’末端的单链支点序列提供用于触发RNA链的初始结合位点。该触发分子是单链RNA,其完成与发夹的分支迁移过程,这暴露了RBS和起始密码子,从而引起目标基因翻译的激活。
[0183] 所述发夹加工单元在触发链不存在的情况下用作翻译的抑制剂。与之前的核糖核酸调节子不同,RBS序列在11-nt的发夹环内是完全未配对的。相反,紧接在起始密码子前后的碱基被隔离在分别为6和9个碱基对长的RNA双链中。在所测试的开关中,起始密码子本身是没有配对的,从而在18-nt发夹主干的中点附近留下3-nt的凸起部分。由于抑制域b(图17B)不具有起始密码子的互补碱基,因此关联触发链进而不需要包含对应的起始密码子碱基,从而增加了潜在的触发子序列的数量。还对在起始密码子后添加的发夹序列的序列筛查了终止密码子的存在,因为终止密码子在核糖核酸调节子被激活时会过早地终止目标基因的翻译。相较于未受抑制的GFP mRNA,来自受抑制的支点开关mRNA的GFP表达的研究显示了98%或者更高的典型抑制水平。在确认了使用此设计的成功翻译抑制之后,在发夹的5’末端采用12-nt的支点域来起始其与关联触发链的相互作用。所述触发链具有与开关mRNA的前部碱基完美互补的30-nt的单链RNA序列。
[0184] 根据此基本的支点开关设计,使用NUPACK核酸序列设计包(Zadeh等人,J.Comput.Chem.32:170-173,2011)来产生了翻译激活子文库。将通常21-nt的序列用于将开关mRNA的发夹模块连接至目标基因的编码序列。此接头序列被编程为编码低分子量的氨基酸以最小化其对目标基因的折叠的影响,其在此实例中选择为GFP报告因子。为了减少计算负荷,对于二级构建体分析只考虑GFP的前29-nt。然而,在设计过程中模拟完整的触发子转录物。此转录物包含GGG前导序列以促进从T7RNA聚合酶启动子的有效转录、5’发夹域以增加RNA的稳定性和在转录物3’末端的47-nt T7RNA聚合酶终止子。NUPACK被用来产生满足预定的二级结构并具有指定的RBS和终止子序列的支点开关设计。设计中未指定的碱基是随机的从而允许是四种RNA碱基中的任一种,其中对NUPACK施加了一些序列限制以排除同种碱基的扩展运行。首先设计了24个支点开关的组以评估体内性能表现并如方法部分中所述地对其进行构建。在确认了多个这些开关显示高动力学范围后,则开始设计支点开关的扩展文库,其包含针对与文库其余部分的低串扰进行的元件。
[0185] 为了产生所述文库,使用NUPACK产生了具有随机化序列的总共672个支点开关设计。在所产生的设计中,25个被发现在起始密码子后的发夹区域中编码终止密码子。在其余的系统中,发现一个重复设计,从而文库中余下646个独特的核糖核酸调节子设计。
[0186] 随后选择这些支点开关设计中144个的亚组用于在大肠杆菌中进行测试,其显示最低水平的非期望的核糖核酸调节子-触发子串扰。电脑模拟筛选串扰具有两个目的:首先,所得的正交调节子文库可提供大量的组分组来在体内独立地调控翻译。第二,筛选了正交性的系统必然会覆盖可能的支点开关的大部分序列空间并给未来的系统设计提供信息。针对所有646个的组(对应417316个RNA-RNA相互作用)模拟了核糖核酸调节子和触发链之间的配对相互作用。这些模拟确定了任何所产生的核糖核酸调节子-触发子复合物的浓度以及它们的二级结构。这些核糖核酸调节子-触发子复合物中支点开关主干的完整性被用来确定非期望的触发子活化的可能性,因为起始密码子附近的双链区域的破坏会导致目标基因的翻译。通过此主干完整性度量,使用Monte Carlo算法来选择了144个具有预测最低的净系统串扰的支点开关设计。这产生了支点开关文库,其包含168个不同的具有受到相同二级结构限制的随机序列的组分。
[0187] 组分验证。在大肠杆菌BL21Star DE3中测试支点开关,其中从中等拷贝质粒(ColA起点)表达开关mRNA并从高拷贝质粒(ColE1起点)表达触发RNA。使用IPTG(通过T7RNA聚合酶触发这两个RNA种类的产生)诱导两种链的表达。为了实现开关性能的定量评价,使用具有已报道的110分钟半衰期的ASV-标记的GFPmut3b(Andersen等人 ,Appl.Environ.Microbiol.64:2240-2246,1998)作为荧光报告因子。在这些实验条件下,表达开关和触发RNA的质粒的拷贝数差异导致相较于开关分子6-8倍过量的触发子,如通过分别从每种质粒表达的GFPmut3b-ASV的荧光测量所测定的。
[0188] 流式细胞术被用来表征支点开关的性能。在用IPTG诱导后以1小时的间隔测量细胞。对于转化了核糖核酸调节子及其关联触发子的细胞测量开的荧光,而从包含核糖核酸调节子和随机选择的非关联触发子的细胞测定关的荧光。来自激活和抑制的支点开关的荧光直方图几乎完全是单峰的,突显了其在细胞数字化逻辑中的潜在应用(数据未显示)。来自直方图的众数荧光值被用来计算每个核糖核酸调节子设计的开/关比率。图17C显示了从三个支点开关(2、3和5号)在其开和关状态(仅开关为第一柱,开关和触发子为第二个柱,以及阳性对照是第三柱)下测量的众数GFP荧光。作为对比,还评价了每个开关mRNA的包含相同GFP报告因子序列的非抑制形式作为阳性对照。开关的关状态荧光接近于不表达GFP的诱导细胞所测量的背景荧光水平。激活的支点开关的开状态荧光与阳性对照是可比较的,表明几乎所有的开关mRNA被其触发RNA结合。
[0189] 在诱导的1小时内观察到系统的活化,并且其在时间上随着GFP的积累而增加(图17D,插图)。图17D显示在诱导后3小时针对随机序列文库中所有168个开关所测量的开/关众数GFP荧光比率。在所测试的系统中,20个显示了超过100的开/关比率,并且接近三分之二显示了至少大于10的开/关比率。作为对照,还在同样条件下表征了被广泛使用的工程化核糖核酸调节子crRNA 10和12(描述于Isaacs等人,Nat.Biotechnol.22:841-847,2004)。
这些较早的核糖核酸调节子系统显示了显著较低的动力学范围,其中crRNA系统10和12的开/关值分别为11±2和13±4。
[0190] 支点开关正交性的评估。为了评估翻译激活子的正交性,从144个正交组分文库中选择了前35个核糖核酸调节子,并进行了另外的电脑模拟筛选以分离出无论是在主干完整性还是在非关联触发与开关链之间的非期望的结合方面显示极低水平串扰的26个核糖核酸调节子的亚组。随后通过用核糖核酸调节子和触发质粒的所有676个组合转化细胞来在大肠杆菌中测定这26个核糖核酸调节子之间的配对相互作用。图18A展示了来自在LB平板上诱导的大肠杆菌菌落的GFP荧光图像。按照在图17D中测量的开/关荧光比率降低的顺序显示正交开关组。可清楚地看见来自沿网格的对角线的关联的开关和触发子配对的强发射光,其中在索引26上的最后的开关因其低开/关比率而显示较低的荧光。相反,表征非关联触发/开关RNA配对的非对角元件被观察到低的荧光水平。
[0191] 为了得到定量信息,使用流式细胞术测量所有配对的触发子-开关相互作用的GFP输出。通过用从非关联触发子和给定的开关mRNA获得的GFP荧光除以处于触发状态的开关的荧光来计算串扰。图18B显示了所得的串扰相互作用的矩阵。根据定义,沿对角线的串扰水平是100%,而非对角线的串扰与菌落图像的定性输出水平一致。基于这些数据,支点开关显示了一种前所未有的正交程度,其中所测试的整个26个调节子的组均显示了低于12%的串扰。由于正交组中调节子的数量由其阈值串扰水平定义,因此鉴定了一系列不同串扰阈值的正交亚组。例如,支点开关中的18个的亚组显示出低于2%的亚组范围的串扰。
[0192] 当选择支点开关作为指定应用时,用于评价其性能的潜在更相关的度量是阈值串扰水平的倒数。对于翻译激活子,此参数代表了当使用开关组来调控具有与GFPmut3b-ASV报告因子相似的输出特征的蛋白时当中预期的最小倍数变化。图18C用此文库动力学范围度量针对支点开关的最大正交亚组大小以及多个其它基于RNA的调节子进行了作图。先前报道的最大的正交核糖核酸调节子的组由7个显示20%串扰的转录弱化子组成(Takahashi等人,Nucleic Acids Res.,2013)。对于该文库,20%的串扰导致其总体动力学范围的上限为5(图18C)。较早的正交翻译激活子和抑制子分别被限制为20%串扰上的4个(Callura等人,Proc.Natl.Acad.Sci.USA  109:5850-5855,2012)和5个(Mutalik等人,Nat.Chem.Biol.8:447-454,2012)的组。对于蛋白,还报道了5个正交真核转录因子的工程化文库的~30%的串扰(Khalil等人,Cell150:647-658,2012)。据本发明人所知,本文提供的开关构成了曾报道过的基于RNA或蛋白质的正交调控元件的最大的组。此外,具有与先前报道的文库可比较大小的正交支点开关的亚组显示出比先前报道的系统在数量级上更大的最小动力学范围。
[0193] 组分分析和正向工程化。来自支点开关的流式细胞术数据提供了大量可用于确定核糖核酸调节子性能的序列依赖性变化的数据集。作为对序列依赖性作用的粗筛,首先研究支点开关输出作为在核糖核酸调节子链的主干中顶部和底部上的碱基配对的函数(图19A)。假设这些区域中碱基配对的强度会对发夹的抑制强度产生强烈的影响,因为它们对于隔离起始密码子是必需的,并且当核糖核酸调节子被活化时它们还可影响RBS和mRNA区域的二级结构,其进而影响翻译效率(Kudla等人,Science 324:255-258,2009)。对发夹模块顶部和底部三个碱基对的分析揭示了核糖核酸调节子的开/关比率作为这些区域中G-C碱基对含量的函数中的重要变化。图19B显示了G-C含量在这两个主干区中所有16个可能的排列所获得的平均开/关荧光,以及满足特定G-C条件的每个支点开关所获得的开/关值。基于文库的大小以及在电脑模拟设计中施加的二级结构限制,许多G-C排列只有一种或两种代表性的支点开关。在主干的顶部和底部分别包含0个和两个G-C碱基对的支点开关显示了
154的平均开/关荧光比率,超过第二高排列的三倍。随着G-C组合进一步偏离该组合,平均开/关水平还倾向于稳步下降。
[0194] 对于核糖核酸调节子主干顶部的低G-C含量的倾向表明了在活化的核糖核酸调节子-触发子复合物中结合的核糖体与附近的RNA双链之间的潜在相互作用。具体地,RNA双链末端上的弱碱基配对可允许双链打开,从而自发地释放RBS上游的碱基以促进核糖体结合。为了研究此效应,研究了一系列具有不同发夹环大小以调整pre-RBS区域的大小的核糖核酸调节子(图19A),所述pre-RBS区域定义为RNA双链与RBS序列的起始点之间的核苷酸。通过增加富含腺嘌呤的序列,环变异核糖核酸调节子的测量显示随着pre-RBS区域通过添加A富集序列在大小上从3-nt增加到19-nt,开状态荧光输出也稳步增加(数据未显示)。值得注意的是,开状态表达的这些增加并没有导致系统关状态的对应增加直到pre-RBS序列的长度为13-nt(相当于21-nt的环)为止。这些观察与先前通过紧接地置于RBS上游的A/U碱基显示翻译增强的研究是一致的(Vimberg等人,BMC Mol.Biol.8:1-13,2007)。此外,他们还提供了通过增加其发夹环的长度来增加支点开关动力学范围的直接方法。还进行了支点开关行为作为触发RNA长度的函数的系统性研究。这些研究揭示了系统开/关比率与支点域长度之间强烈的正相关(数据未显示),并且证明了仅通过部分解旋开关的主干就可增加开关的输出(数据未显示)。
[0195] 先前的核糖核酸调节子是在具体问题具体分析的基础上进行设计的(Isaacs等人,Nat.Biotechnol.22:841-847,2004;和Callura等人,Proc.Natl.Acad.Sci.USA 109:5850-5855,2012),并且使用计算机辅助设计的核糖核酸调节子没有显示一致的高开/关水平(Rodrigo等人,Proc.Natl.Acad.Sci.USA 109:15271-15276,2012)。电脑模拟设计的经正向工程化以显示高的体内性能表现的核糖核酸调节子具有显著减少产生新的遗传环路所需的时间的潜力,这进而使得能够实现更复杂的细胞逻辑。因此,本发明人将上述发现整合为针对高动力学范围进行正向工程化的支点开关组的设计。本发明的正向工程化系统保留了168个支点开关的文库的相同的一般性二级结构和相互作用机制,但是采用了几个上述的发现点以显著提高它们的动力学范围。首先,掺入了图19B所显示的开关mRNA序列限制的组合。具体地,发夹主干的顶部三个碱基被限制为弱的A-U碱基对。主干底部的三个碱基被指定为包含两个强的G-C碱基对和一个A-U碱基对。其次,将支点开关的长度从12-nt增加至15-nt。此变化增强了触发子与开关之间的初始结合。第三,将发夹环的大小从11-nt增加到15-nt以增强在开关活化后的输出蛋白的翻译。选择了相当保守的15-nt的环大小以确保系统在其关状态时的泄漏保持在低水平。最后,采用仅使开关主干中18个碱基中的前15个解旋的关联触发子。此设计改变带来许多益处。它使得触发RNA能够绕开与发夹主干中顶部三个碱基(均被指定为A何U碱基)的结合,从而消除了触发子的相应序列限制,并使其长度在30-nt上不发生变化。此外,避免破坏主干顶部的三个弱碱基对允许其在主干中靠下的碱基被解旋之后自发地打开。此设计改变通过添加3-nt的A/U增强子元件有效地增加了pre-RBS区域的大小而没有伴随关状态泄漏的增加。
[0196] 使用NUPACK设计了13个具有上述4个系统修改的正向工程化的支点开关。图19C显示了调节GFP的正向工程化的翻译激活子的在诱导3个小时后的开/关众数荧光比率。对于几乎所有被测试的系统,均存在开/关荧光的显著增加,其中13个中的12个显示出与来自起始文库的最高性能支点开关可比较或者更高的动力学范围。这些正向工程化系统显示出406的平均开/关比率,而起始支点开关设计为43。此平均开/关比率堪比基于蛋白质的调控系统的动力学范围,其使用高度可编程的系统设计并且不需要任何演化或大规模筛选实验。此外,即使最低性能表现的优化支点开关也显示了33±4的开/关比率,这对于许多细胞决定操作仍然是足够的。小时时间过程测量揭示正向工程化的开关在诱导1或2小时后即被激活(图19C,插图)。此外,开状态的荧光在四个小时上稳定增加,产生了两个开关的远超过
600的开/关水平。
[0197] 通过计算具有超过给定的最低水平的开/关比率的正向工程化设计的百分比并将其与对具有随机序列的168个支点开关的文库进行的相同计算进行比较来定量本发明的正向工程化策略的效率(图19D)。对于所有测试的开/关比率,正向工程化开关的高性能开关产率均较高。例如,相较于对于随机序列文库的168个中的一个开关,正向工程化设计的92%具有至少287的开/关GFP荧光。
[0198] 系统性能的热力学分析。本发明的正向工程化产生具有92%可能性的高动力学范围的核糖核酸调节子。为了开发核糖核酸调节子活性的可预测模型,在落入6个不同类别的多个热力学参数方面对具有随机序列的168个初始开关的开/关比率进行了分析(图20A)。与单独的开和关状态的荧光输出相对的开/关比率被用于定量分析,因为关状态的荧光在文库间相对小地变化,从而使得开/关比率基本上是开状态荧光的测量。按照Salis等人,Nat.Biotechnol.27:946-950,2009公开的处理,表达的蛋白p的量可通过方程式p∝exp(-kΔG)与热力学自由能相关,其中k是拟合参数。因此,热力学参数与核糖核酸调节子的开/关值之间的关系可通过应用于自由能对开/关比率的半对数图的线性回归的决定系数R2来进行评估。然而,当应用于全组分文库时,每种热力学参数均不能显示出任何与核糖核酸调节子输出特性的显著相关性。
[0199] 基于在图19B中观察到的序列依赖性效应,进行了对于热力学参数与具有相似序列特性的支点开关亚组之间的关系的搜寻(图20A,数据未显示)。通过探测多个开关亚组的2
R值,鉴定了显示与系统输出的明确关系的单参数ΔGRBS-接头。ΔGRBS-接头是与从核糖核酸调节子-触发子复合体的RNA双链的下游紧接着起始并延伸至在发夹模块后添加的通常21-nt接头的末端的区域的二级结构相关的自由能(图20B)。它反映了当核糖体结合并起始输出基因的翻译时,核糖体使RBS/前部mRNA区域解旋所需要的能量的值。先前已将翻译效率的变化与mRNA前部的二级结构联系起来,并且已使用相似的热力学因子来计算原核RBS的强度(Salis等人,Nat.Biotechnol.27:946-950,2009)。图20C提供了针对各自在其主干顶部含有弱A-U碱基对的68个核糖核酸调节子的亚组的ΔGRBS-接头与开/关比率之间的关系的实例。来自文库的核糖核酸调节子的这个组是最大的,针对其鉴定了R2≥0.4的与ΔGRBS-接头的相关性。相反,在其主干顶部含有强GC碱基对的100个核糖核酸调节子的互补亚组显示与ΔGRBS-接头的无相关性,其R2=0.024,这可能是由在其备用位点上与核糖体的序列依赖性相互作用所引起的。
[0200] 鉴定了ΔGRBS-接头的重要性之后,开始研究其与正向工程化系统的开/关水平的关系。发现ΔGRBS-接头显示了与开/关水平的远更强的相关性,产生R2=0.79(图20D)。最重要的是,发现此单个热力学术语足够解释单个低性能正向工程化支点开关。此特定支点开关在RBS-接头区域中具有相对高的二级结构,这显著降低了活化的开关mRNA的翻译效率。
[0201] 多重调控。支点开关的正交性可使得其能够在细胞内独立地同时调控多种蛋白。为了证明此能力,用表达两个正交支点开关mRNA的质粒转化细胞,所述mRNA表达光谱不同的荧光蛋白GFP和mCherry,分别用A*和B*表示(图21A)。随后将这些支点开关的关联触发RNA以所有四种可能的组合进行表达,并用流式细胞术定量报告因子表达(图21B)。在单独的A或B触发子转录后,GFP和mCherry荧光分别超过数量级地增加,而正交通道中的荧光水平没有实质改变。如对于两个支点开关所预期的,A和B触发RNA的共表达产生了两种荧光团表达的强烈增加。
[0202] 功能性mRNA触发的支点开关。由支点开关设计提供的序列空间使得其能够被功能性mRNA触发(图21C)。然而,这些mRNA触发子的固化序列对有效的系统活化提出了很大的挑战。与被设计成完全单链的合成的触发RNA不同,mRNA内存在大量的强二级结构,从而破坏支点结合并且减少驱动分支迁移过程的热力学。由触发mRNA定义的支点序列还可显示内部的和与发夹模块下游的序列的碱基配对,因此对开关活化也提出了相似的挑战。为了抵消这些效应,将mRNA反应性开关的支点域长度从12-nt增加到24-nt。此修改帮助将单链区域用于结合起始的重要性从触发mRNA转移到支点开关本身,其中只有开关的下游序列可与结合区杂交。此外,利用了在来自168系统文库的最高性能支点开关的详细研究过程中鉴定的多个设计特征。支点开关1号当与其完整的30-nt关联触发RNA配对时,具有290±20的开/关比率。发现通过使用从其5’末端截断的缩短的触发RNA会极大增加开/关比率。具体地,观察到在对预期仅使其主干的底部5个碱基解旋的触发RNA进行应答时,支点开关1号可提供1900±200的开/关荧光。支点开关1号系统的二级结构和热力学分析表明此极大的动力学范围是因为两个因素而引起的。首先,开关1号的主干包含了相对高比例的弱A-U碱基对,并且主干中G-C碱基对集中于主干的底部。因此,当触发子破坏底部的五个碱基对时,主干上一半的G-C碱基对被消除,从而留下可用于核糖体结合的主要包含A-U碱基对的弱主干。此外,触发子仅与主干中较低的碱基的结合增加了活化的开关的pre-RBS区域,并且提供了额外的翻译增强。其次,已显示在触发子结合后从主干释放的碱基与开关接头区域中的下游碱基相互作用,形成弱的主干环(数据未显示)。此再折叠机制导致主干的额外碱基被破坏,这进一步使其抑制强度变弱,并降低触发结合的能量障碍。
[0203] 将上述所有设计特征合并以产生响应mRNA的支点开关。开关发夹模块来源于支点开关1号序列。具体地,在所有的mRNA传感器中使用了开关1号主干的顶部12个碱基和环(图21C)。此外,将传感器环的大小从11-nt增加到18-nt以增加报告因子的表达。支点和传感器主干的底部六个碱基对具有经编程为与触发mRNA相互作用的可变的碱基。24-nt和30-nt的支点被用于初始的mRNA结合,底部的六个碱基对被指定为由触发子解旋。为了降低触发mRNA解旋主干的能量障碍,还将上述下游RNA再折叠机制明确地编码在传感器中。这些RNA再折叠元件在开关主干的底部四个碱基对被破坏后诱导6-bp主干环的形成并进而迫使开关主干中两个额外碱基的破坏。通过使用此碱基支点开关mRNA传感器设计,模拟了所有可能的传感器在触发mRNA全长上的二级结构和热力学。随后使用电脑模拟筛选来鉴定具有最佳的传感器二级结构和mRNA结合位点可用性的组合的支点开关。
[0204] 使用与之前实验相同的方式测试所得的mRNA传感器,其中从高拷贝ColE1起点载体表达触发mRNA,以及从中等拷贝ColA起点载体表达调控GFP的支点开关。选择三个一组的下列外源mRNA触发子用于检测实验以最小化内源RNA活化开关的可能性:mCherry、氯霉素乙酰转移酶(cat,赋予氯霉素抗性)和aadA(赋予大观霉素抗性)。mCherry触发RNA的特征在于使得能够有效翻译RBS区,而两个赋予抗生素抗性的mRNA缺少RBS,因为核糖体介导的翻译可干扰支点开关的识别和结合。图21D显示了从五个支点开关测量的开/关GFP荧光。由可翻译的mCherry mRNA触发的三个传感器提供了最强的活化,其中使用设计A显示57±10的最佳开/关比率。由不可翻译的mRNA触发的支点开关展示了更为适中的~7倍的活化水平。
[0205] 为了建立支点开关结合对从触发mRNA的翻译的效应,还进行了实验来测量在mCherry传感器存在或不存在情况下的mCherry输出。图21E包含了三个mCherry反应性开关在其活化和抑制状态下测量的GFP荧光,以及从活化细胞测量的mCherry荧光。作为比较,还显示了从对照实验获得的荧光测量,其显示从未诱导细胞测量的背景GFP荧光,以及从GFP和mCherry从ColA和ColE1起点载体的未受调控表达所测量的荧光。mCherry的表达没有受到支点开关RNA的转录的强烈影响。这表明触发子和开关之间的结合没有抑制核糖体的翻译,尽管触发RNA相较于开关的摩尔过量减小了此效应在本实验中的强度。活化的开关的GFP表达水平仅在2.5的系数内变化,而来自被抑制的开关的泄漏变化了约5倍。此泄漏的变化是解释mCherry传感器的开/关水平变化的决定性因素,并且是由使用高灵敏性母本支点开关作为mRNA传感器的母本设计所引起的。
[0206] 讨论
[0207] 支点开关代表了用于在转录后水平调控翻译的多功能性且强有力的新平台。它们将前所未有程度的组分正交性与可比于广泛使用的基于蛋白质的调控元件22的系统动力学范围相结合。对体内开关-触发子配对相互作用的综合评价产生了一组具有低于12%的串扰水平的26个支点开关。据本发明人所知,这代表了曾经报道过的正交调控元件的最大的文库,并且在大小上以大于三的系数超过了先前的文库(Takahashi等人,Nucleic Acids Res.,2013)。在这点上,支点开关的正交组的最终大小受到串扰测定的吞吐量而不是核糖核酸调节子内在的设计特征的限制。此外,13个支点开关系统的正向工程化产生了12个新的高性能组分的亚组,其显示406的平均开/关荧光比率,其中整个组的性能表现由双参数热力学模型来预测。
[0208] 这些进展的关键在于采用了新的机制用于体内翻译抑制和起始RNA-RNA相互作用。支点开关在其关的状态下通过将被调控基因的起始密码子附近的序列隔离在RNA双链中来强烈抑制翻译,而不是先前的通过阻断接近RBS以及在一些情况阻断接近起始密码子的核糖核酸调节子(Isaacs等人,Nat.Biotechnol.22:841-847,2004;Rodrigo等人,Proc.Natl.Acad.Sci.USA 109:15271-15276,2012;和Mutalik等人,Nat.Chem.Biol.8:
447-454,2012)。较早的核糖核酸调节子依赖于环-线性(Isaacs等人,Nat.Biotechnol.22:
841-847,2004;和Mutalik等人,Nat.Chem.Biol.8:447-454,2012)和环-环(Lucks等人,Proc.Natl.Acad.Sci.USA 108:8617-8622,2011;Rodrigo等人,Proc.Natl.Acad.Sci.USA 
109:15271-15276,2012;和Takahashi等人,Nucleic Acids Res.2013)相互作用,而支点开关采用支点介导的线性-线性RNA相互作用来起始核糖核酸调节子mRNA与触发RNA之间的结合。总之,这些操作机制使得支点开关能够接受具有几乎任意序列的触发RNA,从而大大地扩展了正交操作的序列空间,并且它们通过应用12-至15-nt长的延伸的支点域以高反应动力学促进了RNA-RNA相互作用。与较早的报道相反,支点开关性能的热力学分析没有显示核糖核酸调节子开/关水平与核糖核酸调节子-触发子相互作用的自由能以及与支点-触发子结合的自由能之间的显著相关性(Mutalik等人,Nat.Chem.Biol.8:447-454,2012)。这些观察表明支点开关的RNA-RNA相互作用是热力学和动力学高度有利的。
[0209] 本发明的支点开关增加的动力学范围归因于三个主要的因素。首先,增加的驱动触发子-开关相互作用的动力学和热力学自由能引起了细胞中存在的待被触发以产生输出产物的总体开关mRNA的更高的百分比。基于使用开关mRNA的未受抑制形式的对比测量发现被激活的开关mRNA部分接近于100%(图17C)。其次,其中RBS的碱基不被包封在主干内的支点开关设计提供了远更好的平台以通过其工程化RBS及其周围的碱基以用于被调控基因的最佳表达。改变支点开关mRNA的环大小的实验显示开关的开状态荧光与RBS上游较长的A富集区域的存在之间的非常强的依赖性(数据未显示)。重要的是,此RBS的增强只需要将额外的碱基添加到环状域并且不需要触发RNA序列的相应改变。相反,对于许多先前的核糖核酸调节子系统,相似的RBS工程化会需要对两对核糖核酸调节子RNA均进行修改,从而使设计变得复杂并且需要去卷积RBS和RNA-RNA相互作用的效应以适当地解释结果。最后,电脑模拟设计支点开关以提供具有极少二级结构的RBS和mRNA前部区域以促进受调控基因的有效翻译。尽管这通过将额外的碱基和接头添加至输出基因的N-末端来实现,但关于mRNA二级结构选择最佳密码子的算法可被用来产生支点开关而无需增加N-末端碱基。同义密码子也使得能够构建大量的这样的N-末端受限的开关的正交组。
[0210] 本文描述的各种核糖核酸调节子的序列:
[0211] 表1.来自24个随机序列支点开关的起始组的某些支点开关和触发子的序列和性能信息
[0212]
[0213] 表2.来自144个正交随机序列支点开关的组的某些支点开关和触发子的序列和性能信息
[0214]
[0215]
[0216]
[0217] 表3.正向工程化的支点开关组的序列和性能信息
[0218]
[0219]
[0220] 等同物
[0221] 尽管在本文已描述和说明了若干发明实施方案,但本领域技术人员将容易预见多种其它的方法和/或结构用于执行功能和/或获得结果和/一个或多个本文描述的优势,并且这些变化和/或修改的每一种都被视为在本文描述的发明实施方案的范围内。更一般的,本领域技术人员将容易地理解本文描述的所有的参数、尺度、材料和构型意为示例性的,并且实际的参数、尺度、材料和/或构型将取决于本发明的教导被用于的具体应用。本领域技术人员将认可或能够通过使用不超过常规实验来确定本文描述的具体发明实施方案的许多等同物。因此,应理解前述实施方案仅以举例的方式给出,并且在所附权利要求及其等同物的范围内,可与所具体描述和请求保护的内容不同地实践本发明的实施方案。本公开内容的发明实施方案涉及本文描述的每一个个体特征、系统、物体、材料、试剂盒和/或方法。此外,如果这样的特征、系统、物体、材料、试剂盒和/或方法不是相互矛盾的,两个或更多个这样的特征、系统、物体、材料、试剂盒和/或方法的任何组合可包含在本公开内容的发明范围内。
[0222] 如本文定义和使用的,所有的定义应被理解为控制字典定义、通过引用并入的文献中的定义和/或所定义的术语的普通含义。
[0223] 本文公开的所有参考资料、专利和专利申请均关于其每一个所引用用于的主题而通过引用并入,在一些情况下可包括整个文献。
[0224] 如本说明书和权利要求中使用的不定冠词“一个”或者“一种”,除非明确表示相反,应被理解为意指“至少一个/一种”。
[0225] 如本说明书和权利要求中使用的短语“和/或”应被理解为意指如此连接的元件的“任一个或两者”,即元件在一些情况下共同存在并在其它情况下分离地存在。以“和/或”列出的多个元件应以相同的方式来解释,如此连接的元件的“一个或多个”。未通过“和/或”从句明确指出的其它元件可任选地存在,无论与所明确指出的元件是相关的或是不相关的。因此,作为非限制性实例,当与开放性语言例如“包含”结合使用时“A和/或B”的使用在一个实施方案中可指仅A(任选地包括非B的元件);在另一个实施方案中可指仅B(任选地包括非A的元件);在另一个实施方案中可指A和B(任选地包括其它的元件);等等。
[0226] 如本说明书和权利要求中所使用的,“或”应被理解为具有与上述定义的“和/或”相同的含义。例如,当在列表中分列项目时,“或”或“和/或”应被解释为包含性的,即包含多个元件或元件的列表以及任选地额外的未列出的项目中的至少一个且还包括多于一个。只有明确相反指出的术语,例如“仅一个”或“恰好一个”或者在权利要求中使用的“由......组成”,将指包含多个元件或元件列表中的恰好一个元件。在一般情况下,本文所用术语“或”当之前有排他性的术语例如“任一”、“一个”、“仅一个”或“恰好一个”时,应仅被解释为表示排他性的可选物(即“一个或另一个但非两者”)。当在权利要求中使用时,“基本上由...组成”应具有其在专利法领域中所使用的普通含义。
[0227] 如本说明书和权利要求中所使用的,涉及一个或多个元件的列表的短语“至少一个”应当被理解为意指选自元件列表中的任何一个或多个元件的至少一个元件,但并不一定包含元件列表中具体列出的每一个元件的至少一个,并且不排除元件列表中的元件的任意组合。此定义还允许元件可任选地存在,而不是短语“至少一个”所涉及的元件列表中明确指出的元件,无论与明确指出的那些元件是相关的还是不相关的。因此,作为非限制性的实例,“A和B的至少一个”(或等价地“A或B的至少一个”,或等价地“A和/或B的至少一个”)在一个实施方案中可指至少一个(任选地包括多于一个)A,而B不存在(以及任选地包括非B的元件);在另一个实施方案中可指至少一个(任选地包括多于一个)B,而A不存在(以及任选地包括非A的元件);在另一个实施方案中可指至少一个(任选地包括多于一个)A和至少一个(任选地包括多于一个)B(以及任选地包括其它元件);等等。
[0228] 还应理解的是,除非明确指出相反,否则在本文请求保护的包括多于一个步骤或行为的方法中,方法的所述步骤或行为的顺序非必须地限制于方法的步骤或行为所被记载的顺序。
[0229] 在权利要求书中,以及在上文的说明书中,所有连接词例如“包含”,“包括”,“携带”,“具有”,“含有”,“涉及”,“拥有”,“含”等应被理解为是开放式的,即意欲包括但不限于。仅连接词“由...组成”和“基本上由...组成”分别是封闭或半封闭的连接词,如美国专利局专利审查程序手册第2111.03部分中所述的。