会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 击倒 / siRNA表达系统和利用该系统制备功能性基因击倒细胞的方法

siRNA表达系统和利用该系统制备功能性基因击倒细胞的方法

申请号 CN02827635.3 申请日 2002-11-28 公开(公告)号 CN1617929A 公开(公告)日 2005-05-18
申请人 株式会社东京大学TLO; 发明人 多比良和诚; 官岸真;
摘要 本发明的体内siRNA表达系统是能在细胞内表达短链干扰(si)RNA的系统,所述系统含有编码靶向靶基因mRNA任何区域的反义和有义RNA的反义和有义编码DNA,还含有一个或多个能分别由反义和有义编码DNA表达反义和有义RNA的启动子。
权利要求

1.细胞内siRNA表达系统,其含有编码针对靶基因mRNA的区域的反 义RNA的反义编码DNA,编码针对所述靶基因mRNA相同区域的有义RNA 的有义编码DNA,以及一个或多个能分别由所述反义和有义编码DNA表达 所述反义和有义RNA的启动子。

2.根据权利要求1的siRNA表达系统,其中由该系统表达的siRNA的 最终转录产物长度为15至49bp。

3.根据权利要求1的siRNA表达系统,其中由该系统表达的siRNA的 最终转录产物长度为15至35bp。

4根据权利要求1的siRNA表达系统,其中由该系统表达的siRNA的 最终转录产物长度为15至30bp。

5.根据权利要求1的siRNA表达系统,其中siRNA中两条RNA链配对 的双链RNA区域含有错配或凸起。

6.根据权利要求5的siRNA表达系统,其中所述错配中的一个核苷酸是 鸟嘌呤,另一个是尿嘧啶。

7.根据权利要求5的siRNA表达系统,其中siRNA含有1至7个错配。

8.根据权利要求5的siRNA表达系统,其中siRNA含有1至7个凸起。

9.根据权利要求5的siRNA表达系统,其中siRNA含有1至7个错配 和凸起。

10.根据权利要求1至9中任一项的siRNA表达系统,其中所述启动子 是polII或polIII启动子。

11.根据权利要求1至10中任一项的siRNA表达系统,其中所述polIII 启动子是U6启动子。

12.根据权利要求1至11中任一项的siRNA表达系统,其中所述启动子 是诱导型启动子。

13.根据权利要求1至12中任一项的siRNA表达系统,其中所述启动子 分开位于所述反义和有义编码DNA的上游。

14.根据权利要求1至13中任一项的siRNA表达系统,其中所述系统含 有下述(a)至(c)中任一种形式的loxP序列以便可以控制表达:(a)所述启动子含有远侧序列元件DSE和近侧序列元件PSE,其间有间 隔区,间隔区中有两个loxP序列,一个位于DSE附近,另一个位于PSE附 近;

(b)所述启动子含有DSE和PSE,它们处在维持启动子活性的位置,有 一个loxP序列位于它们之间,另一个loxP序列位于DSE的上游或PSE的下 游;和(c)两个loxP序列处在干预反义编码DNA或有义编码DNA的位置。

15.根据权利要求1至14中任一项的siRNA表达系统,其中反义和有义 编码DNA位于相同的载体DNA分子中,或分开位于不同的载体DNA分子 中。

16.根据权利要求1至13中任一项的siRNA表达系统,其中启动子位于 单位的一侧,在所述单位中,反义和有义编码DNA经由接头以相反方向连 接。

17.根据权利要求16的siRNA表达系统,其中所述系统含有下述(a)至(d) 中任一种形式的loxP序列以便可以控制表达:(a)启动子含有DSE和PSE,其间有间隔区,间隔区中有两个loxP序列, 一个位于DSE附近,另一个位于PSE附近;

(b)启动子含有DSE和PSE,它们处在维持启动子活性的位置,有一个 loxP序列位于它们之间,另一个loxP序列位于DSE的上游或PSE的下游;

(c)两个loxP序列处在干预反义编码DNA或有义编码DNA的位置;和(d)两个loxP的排列导致可以干预含有终止序列的接头。

18.根据权利要求16或17的siRNA表达系统,其中反义和有义编码DNA 位于载体分子中。

19.根据权利要求15或18的siRNA表达系统,其中所述载体是质粒载 体。

20.根据权利要求15或18的siRNA表达系统,其中所述载体是病毒载 体。

21.根据权利要求15或18的siRNA表达系统,其中所述载体是哑铃形 DNA载体。

22.一种细胞,其维持着根据权利要求1至21中任一项的siRNA表达 系统。

23.根据权利要求22的细胞,其中所述细胞是哺乳动物细胞。

24.单个生物体,其维持着根据权利要求1至21中任一项的siRNA表 达系统。

25.一种组合物,其含有根据权利要求1至21中任一项的siRNA表达 系统。

26.根据权利要求25的组合物,其中所述组合物是药物组合物。

27.产生靶基因表达沉默的细胞的方法,其中所述方法包括下述步骤:将 根据权利要求1至21中任一项的siRNA表达系统导入细胞,选择导入了所 述siRNA表达系统的细胞。

28.细胞内siRNA文库表达系统,其含有编码siRNA的双链DNA和两 个彼此相对放置的启动子,所述双链DNA含有与表达的siRNA等长的任意 序列,并位于两个启动子之间,所述启动子能由所述双链DNA的各条链表 达彼此互补的RNA。

29.细胞内siRNA文库表达系统,其含有茎-环siRNA产生单位和能在所 述单位的任一侧表达茎-环siRNA的启动子,在所述单位中,反义编码DNA 以及与所述反义编码DNA互补的有义编码DNA经由接头以相反的方向连 接。

30.根据权利要求28或29的siRNA文库表达系统,其中所述系统所表 达的siRNA最终转录产物的长度为15至49bp。

31.根据权利要求28或29的siRNA文库表达系统,其中所述系统所表 达的siRNA最终转录产物的长度为15至35bp。

32.根据权利要求28或29的siRNA文库表达系统,其中系统所表达的 siRNA最终转录产物的长度为15至30bp。

33.根据权利要求28至32中任一项的siRNA文库表达系统,其中siRNA 中两条RNA链配对的双链RNA区域含有错配或凸起。

34.根据权利要求28至33中任一项的siRNA文库表达系统,其中所述 启动子是polII或polIII启动子。

35.根据权利要求28至33中任一项的siRNA文库表达系统,其中所述 启动子是诱导型启动子。

36.根据权利要求28至33中任一项的siRNA文库表达系统,其中所述 系统所表达的siRNA由随机RNA链组成。

37.根据权利要求28至33中任一项的siRNA文库表达系统,其中所述 系统为多个siRNA表达载体的集合,其中每个载体靶向一种含有编码区和/ 或非编码区的基因序列。

38.根据权利要求28至33中任一项的siRNA文库表达系统,其中系统 所表达的siRNA由任何cDNA或基因组DNA的DNA片段所编码的RNA 链组成,所述片段与表达的siRNA等长。

39.一种集合,其是根据权利要求28至38中任一项的siRNA文库表达 系统的集合,其中所述集合中的每个系统表达不同的siRNA。

40.搜索功能基因的方法,所述方法包括下述步骤:

(a)在细胞中导入根据权利要求28至38中任一项的siRNA文库表达系 统或根据权利要求39的siRNA文库表达系统的集合;

(b)选择已导入所述siRNA文库表达系统或所述集合的细胞;和(c)分析所选择细胞的表型。

41.根据权利要求40的搜索功能基因的方法,其中所述方法还包括下述 步骤:根据经表型分析发现表型有所改变的细胞中编码siRNA的DNA序列 来筛选功能基因。

42.选择高活性siRNA的方法,所述方法包括下述步骤:(a)在细胞中导入根据权利要求28至38中任一项的siRNA文库表达系 统或根据权利要求39的siRNA文库表达系统的集合,和(b)测定已导入所述siRNA文库表达系统或所述集合的细胞中具体基因 或蛋白质的表达水平。

说明书全文

技术领域

本发明涉及能沉默靶基因表达的体内siRNA表达系统,以及使用该表达 系统产生击倒细胞的方法。

背景技术

RNA干扰(下文简称为“RNAi”)是一种能通过将双链RNA(下文简称为 “dsRNA”)导入细胞来诱导靶基因mRNA降解,从而使靶基因表达沉默的现 象(过程),其中所述双链RNA含有有义RNA(它具有与靶基因mRNA同源 的序列)和反义RNA(它具有与有义RNA互补的序列)。由于RNAi能够沉默 靶基因表达,因此,人们致力于使之成为一种简单的基因击倒法,以替代依 赖于烦人而无效的同源重组的常规基因破坏法,或者使之成为一种基因治疗 的方式。最初,在线虫中发现了上述RNAi(Fire,A等,Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans.Nature 391,806-811(1998))。随后,在包括植物、线虫、果蝇和原生动物的多种生物 体中也观察到RNAi(Fire,A.RNA-triggered gene silencing.Trends Genet.15, 358-363(1999);Sharp,P.A.RNA interference 2001.Genes Dev.15, 485-490(2001);Hammond,S.M.,Caudy,A.A.& Hannon,G.J. Post-transcriptional gene silencing by double-stranded RNA.Nature Rev.Genet. 2,110-119(2001);Zamore,P.D.RNA interference:listening to the sound of silence.Nat Struct Biol.8,746-750(2001))。在这些生物体中实际导入外源 dsRNA可进一步证实靶基因表达的沉默。已将该技术用作产生击倒个体的方 法。
与上述生物体类似,已尝试在哺乳动物细胞中导入外源dsRNA以诱导 RNAi。然而,此时,由转染的dsRNA引发的宿主抗病毒感染保护机制发挥 作用,抑制了蛋白质的合成,因此未观察到RNAi。
最近,据Tuschl等报道,通过用21或22个核苷酸长的短dsRNA替代 其它生物体中所用的长dsRNA转导细胞,也可在哺乳动物细胞中诱导RNAi, 其中所述短dsRNA具有单链2或3个核苷酸的3’突出端(Elbashir,S.M等, Duplexes of 21-nucleotide RNAs mediate RNA interference in cultured mammalian cells.Nature 411,494-498(2001);Caplen,N.J等,Specific inhibition of gene expression by small double-stranded RNAs in invertebrate and vertebrate systems.Proc.Natl.Acad.Sci.USA 98,9742-9747(2001))。
如上所述,已成功使用短链干扰双链RNA(下文简称为“siRNA”)在哺乳 动物细胞中诱导了RNAi。为了基于由RNAi诱导的基因沉默来进行功能分 析并进行基因治疗,必需将siRNA有效导入细胞,并使其在细胞内稳定维持。
外源siRNA导入细胞的效率根据细胞类型的不同而不同,在某些细胞中 可低至1%至10%。另外,导入哺乳动物细胞的外源siRNA在导入几天后消 失,不具备分析基因功能所需的足够的稳定性。此外,在基因治疗中,必需 以固定的时间间隔施用siRNA,这会增加患者的生理负担。
另外,通过导入外源siRNA很难只在特定的组织或特定的发育/分化时 期诱导RNAi。此外,尽管siRNA较小,但与DNA合成相比,RNA合成要 昂贵得多,直接由siRNA诱导RNAi并不经济。
由于已测定人类基因组的大部分一级DNA序列,人们开发出系统而有 效的搜索功能基因的方法,可快速阐明基因的功能。基于细胞或个体的表型 变化,可以使用RNAi导致的基因沉默进行系统性的功能基因搜索,以加速 发现和分析新的功能基因。

发明内容

本发明的目的是提供能在细胞中更有效、稳定和经济地产生RNAi的细 胞内siRNA表达系统,使用该siRNA表达系统产生击倒细胞的方法,以及 使用该siRNA表达系统搜索功能基因的方法。
考虑到上述问题,本发明人研究了体内siRNA表达系统并成功开发出此 系统。更具体地,本发明涉及:
(1)细胞内siRNA表达系统,其含有编码针对靶基因mRNA区域的反义 RNA的反义编码DNA,编码针对所述靶基因mRNA相同区域的有义RNA 的有义编码DNA,以及一个或多个能分别由所述反义和有义编码DNA表达 所述反义和有义RNA的启动子;
(2)根据(1)的siRNA表达系统,其中由该系统表达的siRNA的最终转录 产物长度为15至49bp;
(3)根据(1)的siRNA表达系统,其中由该系统表达的siRNA的最终转录 产物长度为15至35bp;
(4)根据(1)的siRNA表达系统,其中由该系统表达的siRNA的最终转录 产物长度为15至30bp;
(5)根据(1)的siRNA表达系统,其中siRNA中两条RNA链配对的双链 RNA区域含有错配或凸起;
(6)根据(5)的siRNA表达系统,其中错配的一个核苷酸是鸟嘌呤,另一 个是尿嘧啶;
(7)根据(5)的siRNA表达系统,其中siRNA含有1至7个错配;
(8)根据(5)的siRNA表达系统,其中siRNA含有1至7个凸起;
(9)根据(5)的siRNA表达系统,其中siRNA含有1至7个错配和凸起;
(10)根据(1)至(9)中任一项的siRNA表达系统,其中所述启动子是pol II 或pol III启动子;
(11)根据(1)至(10)中任一项的siRNA表达系统,其中所述pol III启动子 是U6启动子;
(12)根据(1)至(11)中任一项的siRNA表达系统,其中所述启动子是诱导 型启动子;
(13)根据(1)至(12)中任一项的siRNA表达系统,其中所述启动子分开位 于所述反义和有义编码DNA的上游;
(14)根据(1)至(13)中任一项的siRNA表达系统,其中所述系统含有下述 (a)至(c)中任一种形式的loxP序列以使表达能被控制:
(a)启动子含有远侧序列元件(DSE)和近侧序列元件(PSE),其间有间隔 区,间隔区中有两个loxP序列,一个位于DSE附近,另一个位于PSE附近;
(b)启动子含有DSE和PSE,它们所处的位置能维持启动子活性,有一 个loxP序列位于它们之间,另一个loxP序列位于DSE的上游或PSE的下游; 和
(c)两个loxP序列所处的位置使其能干预反义编码DNA或有义编码 DNA;
(15)根据(1)至(14)中任一项的siRNA表达系统,其中反义和有义编码 DNA位于相同的载体DNA分子,或分开位于不同的载体DNA分子;
(16)根据(1)至(13)中任一项的siRNA表达系统,其中启动子位于单位的 一侧,在所述单位中,反义和有义编码DNA经由接头以相反方向连接;
(17)根据(16)的siRNA表达系统,其中所述系统含有下述(a)至(d)中任一 种形式的loxP序列以使表达能被控制:
(a)启动子含有DSE和PSE,其间有间隔区,间隔区中有两个loxP序列, 一个位于DSE附近,另一个位于PSE附近;
(b)启动子含有DSE和PSE,它们所处的位置能维持启动子活性,有一 个loxP序列位于它们之间,另一个loxP序列位于DSE的上游或PSE的下游;
(c)两个loxP序列所处的位置使其能干预反义编码DNA或有义编码 DNA;和
(d)两个loxP所处的位置使其能干预含有终止序列(如TTTTT)的接头;
(18)根据(16)或(17)的siRNA表达系统,其中反义和有义编码DNA位于 载体分子中;
(19)根据(15)或(18)的siRNA表达系统,其中所述载体是质粒载体;
(20)根据(15)或(18)的siRNA表达系统,其中所述载体是病毒载体;
(21)根据(15)或(18)的siRNA表达系统,其中所述载体是哑铃形DNA载 体;
(22)维持根据(1)至(21)中任一项的siRNA表达系统的细胞;
(23)根据(22)的细胞,其中所述细胞是哺乳动物细胞;
(24)维持根据(1)至(21)中任一项的siRNA表达系统的单个生物体;
(25)含有根据(1)至(21)中任一项的siRNA表达系统的组合物;
(26)根据(25)的组合物,其中所述组合物是药物组合物;
(27)产生靶基因表达沉默的细胞的方法,其中所述方法包括下述步骤: 将根据(1)至(21)中任一项的siRNA表达系统导入细胞,选择导入了所述 siRNA表达系统的细胞;
(28)细胞内siRNA文库表达系统,其含有编码siRNA的双链DNA和两 个彼此相对放置的启动子,所述双链DNA含有与表达的siRNA等长的任意 序列,并位于两个启动子之间,所述启动子能由所述双链DNA的各条链表 达彼此互补的RNA;
(29)细胞内siRNA文库表达系统,其含有茎-环siRNA产生单位和能在 所述单位的任一侧表达茎-环siRNA的启动子,在所述单位中,反义编码DNA 和与所述反义编码DNA互补的有义编码DNA经由接头以相反的方向连接;
(30)根据(28)或(29)的siRNA文库表达系统,其中系统所表达的siRNA 最终转录产物的长度为15至49bp;
(31)根据(28)或(29)的siRNA文库表达系统,其中系统所表达的siRNA 最终转录产物的长度为15至35bp;
(32)根据(28)或(29)的siRNA文库表达系统,其中系统所表达的siRNA 最终转录产物的长度为15至30bp;
(33)根据(28)至(32)中任一项的siRNA文库表达系统,其中siRNA中两 条RNA链配对的双链RNA区域含有错配或凸起;
(34)根据(28)至(33)中任一项的siRNA文库表达系统,其中所述启动子是 pol II或pol III启动子;
(35)根据(28)至(33)中任一项的siRNA文库表达系统,其中所述启动子是 诱导型启动子;
(36)根据(28)至(33)中任一项的siRNA文库表达系统,其中系统所表达的 siRNA由随机RNA链组成;
(37)根据(28)至(33)中任一项的siRNA文库表达系统,其中所述系统为多 个siRNA表达载体的集合,其中每个载体靶向一种含有编码区和/或非编码 区的基因序列;
(38)根据(28)至(33)中任一项的siRNA文库表达系统,其中系统所表达的 siRNA由任何cDNA或基因组DNA的DNA片段所编码的RNA链组成,所 述片段与表达的siRNA等长;
(39)根据(28)至(38)中任一项的siRNA文库表达系统的集合,其中所述集 合中的每个系统表达不同的siRNA;
(40)搜索功能基因的方法,所述方法包括下述步骤:
(a)在细胞中导入根据(28)至(38)中任一项的siRNA文库表达系统或根据 (39)的siRNA文库表达系统的集合;
(b)选择已导入所述siRNA文库表达系统或所述集合的细胞;和
(c)分析所选择细胞的表型;
(41)根据(40)的搜索功能基因的方法,其中所述方法还包括下述步骤: 根据经表型分析发现表型有所改变的细胞中编码siRNA的DNA序列来筛选 功能基因;和
(42)选择高活性siRNA的方法,所述方法包括下述步骤:
(a)在细胞中导入根据(28)至(38)中任一项的siRNA文库表达系统或根据 (39)的siRNA文库表达系统的集合,和
(b)测定已导入所述siRNA文库表达系统或所述集合的细胞中特定基因 或蛋白质的表达水平。
一方面,本发明涉及细胞内siRNA表达系统。该siRNA表达系统含有 编码针对靶基因mRNA区域的反义RNA的反义编码DNA,编码针对靶基 因mRNA相同区域的有义RNA的有义编码DNA,以及一个或多个能分别 由反义和有义编码DNA表达反义和有义RNA的启动子。
“siRNA”指的是短链干扰RNA,它是对哺乳动物细胞无毒的短的双链 RNA。据Tuschl等(文献同上)报道,长度不局限于21至23bp。对siRNA的 长度没有特别的限制,只要它不显示毒性即可。“siRNA”的长度可以是例如 15至49bp,优选为15至35bp,更优选为21至30bp。或者,所表达siRNA 的最终转录产物的双链RNA部分的长度可以是例如15至49bp,优选为15 至35bp,更优选为21至30bp。siRNA中两条RNA链配对的双链RNA部分 不局限于完全配对,也可含有由错配(对应的核苷酸不互补)、凸起(一条链上 缺乏对应的互补核苷酸)等引起的未配对部分。未配对部分的含量应以不干 扰siRNA形成为宜。本文所用“凸起”优选含有1至2个未配对的核苷酸, siRNA中两条RNA链配对的双链RNA区域优选含有1至7个,更优选为1 至5个凸起。另外,siRNA中两条RNA链配对的双链RNA区域优选含有1 至7个,更优选为1至5个本文所用“错配”。在优选的错配中,一个核苷酸 是鸟嘌呤,另一个核苷酸是尿嘧啶。该错配是编码有义RNA的DNA中C 至T,G至A的突变或其组合引起的,但也不局限于此。另外,在本发明中, siRNA中两条RNA链配对的双链RNA区域可同时含有凸起和错配,优选它 们的总数可达1至7,更优选为1至5。
所述未配对部分(错配或凸起等)可抑制下文所述的反义和有义编码 DNA之间的重组,并能使下文所述的siRNA表达系统变得稳定。另外,尽 管难以对siRNA中两条RNA链配对的双链RNA区域内不含未配对部分的 茎环DNA进行测序,但通过如上文所述导入错配或凸起即可进行测序。另 外,在配对的双链RNA区域含有错配或凸起的siRNA所具备的优点是:在 大肠杆菌或动物细胞中能稳定存在。
siRNA的末端结构可以是平端或粘端(突出端),只要siRNA能因其RNAi 作用而导致靶基因表达沉默即可。据Tuschl等(文献同上)报道,粘端(突出端) 结构不仅限于3’突出端,也可以包括5’突出端结构,只要它能诱导RNAi作 用即可。另外,突出端核苷酸的数目不限于已报道的2或3个,而可以是任 何数目,只要突出端能诱导RNAi作用即可。例如,突出端由1至8个,优 选2至4个核苷酸组成。在本文中,将具有粘端结构的siRNA的总长度表示 为配对双链部分的长度和两端含有突出单链的配对物长度的总和。例如,当 双链RNA部分为19bp,两端突出4个核苷酸时,可将总长度表示为23bp。 另外,由于该突出序列对靶基因的特异性低,因此它不必与靶基因序列互补 (反义)或相同(有义)。另外,只要siRNA能保持其对靶基因的基因沉默作用, siRNA可在例如,其一端的突出部分含有低分子量RNA(可以是天然RNA 分子,如tRNA、rRNA或病毒RNA,或人工RNA分子)。
此外,“siRNA”的末端结构必须是如上所述的两端切断结构,它可具有 茎-环结构,其中双链RNA一侧的末端由接头RNA连接。双链RNA区域(茎 -环部分)的长度可以是例如15至49bp,优选为15至35bp,更优选为21至 30bp。或者,作为所表达siRNA的最终转录产物的双链RNA区域的长度是 例如15至49bp,优选为15至35bp,更优选为21至30bp。另外,对接头的 长度没有特别的限制,只要它的长度不会妨碍茎部分配对即可。例如,为了 使茎部分稳定配对,并抑制编码该部分的DNA之间发生重组,接头部分可 具有三叶草tRNA结构。即使接头长度妨碍了茎部分的配对,也可以例如构 建接头部分以使其包含内含子,使内含子在将前体RNA加工至成熟RNA的 过程中被切下,从而使茎部分能够配对。对于茎-环siRNA而言,不具有环 结构的RNA的任一端(头或尾)可具有低分子量RNA。如上所述,该低分子 量RNA可以是天然RNA分子,如tRNA、rRNA或病毒RNA,或人工RNA 分子。
术语“靶基因”指的是因本发明系统所表达的siRNA而使其表达被沉默 的基因,可以任意选择靶基因。例如,优选的靶基因是序列已知、但功能有 待阐明的基因,以及其表达被认为是疾病诱因的基因。靶基因可以是其基因 组序列尚未被完全阐明的基因,只要已测定出该基因mRNA中长度至少为 15个核苷酸或更长的部分序列即可,所述长度是能结合siRNA一条链(反义 RNA链)的长度。因此,即使未测定出全长序列,仍可将序列已阐明的基因 已表达序列标志(EST)和mRNA的一部分选为“靶基因”。
“反义RNA”是具有与靶基因mRNA互补的序列的RNA链,据认为,它 可通过结合靶基因mRNA来诱导RNAi。“有义RNA”具有与反义RNA互补 的序列,它与其互补反义RNA退火以形成siRNA。用RNA合成仪可常规合 成这些反义和有义RNA。在本发明中,使用siRNA表达系统,分别由编码 反义和有义RNA的DNA(反义和有义编码DNA)胞内表达这些RNA。
为了分别由反义和有义编码DNA表达反义和有义RNA,本发明的 siRNA表达系统含有“启动子”。可任意选择启动子的类型、数目和位置,只 要它能表达反义和有义编码DNA即可。一种siRNA表达系统的简单构建方 法是形成串联表达系统,其中启动子位于反义和有义编码DNA的上游。该 串联表达系统能产生两端具有上述切断结构的siRNA。在茎-环siRNA表达 系统(茎表达系统)中,反义和有义编码DNA被安放在相反的方向,由接头 DNA连接这些DNA以构建出一个单位。启动子与该单位的一侧连接以构建 出茎-环siRNA表达系统。本文对接头DNA的长度和序列没有特别的限制, 接头DNA可具有任何长度和序列,只要其序列不是终止序列,而其长度和 序列不会妨碍如上所述成熟RNA产生过程中的茎部分的配对即可。例如, 编码上述tRNA等的DNA可用作接头DNA。
对串联和茎-环这两种表达系统而言,5’末端可具有能促进由启动子起始 的转录的序列。更具体地,对串联siRNA而言,在反义和有义编码DNA的 5’末端添加能促进由启动子起始的转录的序列,即可改善siRNA产生的效 率。对茎-环siRNA而言,可在上述单位的5’末端添加所述序列。只要不妨 碍siRNA所致的靶基因沉默,所述序列的转录物可在与siRNA结合的状态 下被使用。如果该状态妨碍了基因沉默,优选使用修整工具(例如下文所述 的核酶)对转录物进行修整。
在上述串联或茎表达系统中,可以使用pol II或pol III启动子,条件是 所述启动子能由上述DNA产生相应的RNA。优选使用适于表达短RNA, 如siRNA的pol III启动子。Pol III启动子包括U6启动子、tRNA启动子、 逆转录病毒LTR启动子、腺病毒VA1启动子、5Sr RNA启动子、7SK RNA 启动子、7SL RNA启动子和H1 RNA启动子。U6启动子在RNA的3’末端 添加了4个尿苷核苷酸,因此,通过为反义和有义编码DNA的5’末端序列 提供0、1、2、3或4个腺嘌呤,可以不受阻碍地将最终产生的siRNA的3’ 突出端变成4、3、2、1或0个核苷酸。当使用其它启动子时,可以随意改 变3’突出端核苷酸的数目。
使用pol III启动子时,为了仅表达短RNA并适当终止转录,优选在有 义和反义编码DNA的3’末端进一步提供终止子。可以使用任何终止序列, 只要它能终止由启动子启动的转录即可。可以使用由4个或更多个连串的腺 嘌呤核苷酸组成的序列,能形成回文结构的序列等。
Pol II启动子包括巨细胞病毒启动子、T7启动子、T3启动子、SP6启动 子、RSV启动子、EF-1α启动子、β-肌动蛋白启动子、γ-球蛋白启动子和SRα 启动子。Pol II启动子产生的RNA不象pol III启动子产生的那样短,而是有 些长。因此,当使用pol II启动子时,必须使用通过自我-加工裂解RNA的 手段,如核酶来截短有些长的RNA,从而产生反义或有义RNA。使用核酶 产生反义或有义RNA的单位可具有下述结构。如图2A所示,反义或有义 RNA产生单位具有反义或有义编码DNA,编码其5’和3’-末端处被核酶识别 的RNA序列的区域(识别序列编码区),以及编码5’-和3’-末端裂解核酶以切 下识别序列的区域,所述区域位于各个识别序列编码区的外面并与之邻近。 所述反义和有义RNA产生单位可以串联并可操作地连接于同一pol II启动 子的下游(图2B),也可以分开并可操作地连接于各自启动子的下游(图2C)。 尽管图2B显示了两个单位串联连接的例子,但必要时也可以在反义和有义 RNA产生单位之间插入任意的间隔序列,以调节各个单位所表达的两个 RNA之间的距离,从而使核酶易于对RNA起作用。
裂解反义和有义编码DNA的5’-和3’-末端的核酶可以是锤头核酶 (Biochem.Biophys.Res.Commun.,Vol.186,PP.1271-1279(1992);Proc.Natl. Acad.Sci.USA,Vol.90,pp.11302-11306(1993))。锤头核酶可具有任何其它序 列,只要它们能自我-加工即可(BIO medica,Vol.7,pp.89-94(1992))。另外,核 酶不限于锤头核酶,也可以使用例如发夹核酶、HDV核酶和得自四膜虫的 核酶,条件是它们能自我-加工(Gene,Vol.122,pp.85-90(1992))。核酶识别序 列是能被5’-和3’-裂解核酶识别的序列。例如,锤头核酶裂解NUH序列(N 是A,G,C或U,而H是A,C或U)的磷酸二酯键。尽管可以使用任何核苷酸 组合,但优选使用“GUC”作为3’-方向最有效的裂解序列。因此,当使用锤 头核酶时,可将NUH,优选为GUC用作识别序列。图2D显示了一例产生 反义和有义RNA的mRNA构建过程,其中在反义和有义RNA的5’-和3’- 末端添加了该锤头核酶和识别序列GUC的组合。在图2D中,为了形成2- 核苷酸突出端,使反义和有义RNA的5’-末端为“C”。当需形成3-核苷酸 突出端时,5’-末端不限于“C”。在图2D所示的构建过程中,在3’-方向添加 序列GUC。
如果将诱导型启动子用作本发明的启动子,就可以在任何合乎需要的时 机表达siRNA。所述诱导型启动子包括四环素-诱导型U6启动子(Ohkawa,J. &Taira,K.Control of the functional activity of an antisense RNA by a tetracycline-responsive derivative of the human U6 snRNA promoter.Hum. Gene Ther.11,577-585(2000);Fig.12)。另外,可以使用组织特异性启动子或 DNA重组系统,如Cre-loxP系统组织-特异性地诱导siRNA表达。
另外,除了可以使用能被药物诱导的启动子和如上所述的启动子外,还 可以使用例如重组酶来控制siRNA产生。实施例中将会描述使用CRE-loxP 重组酶系统的例子(图17)。在启动子中,远侧序列元件(DSE)和近侧序列元 件(PSE)之间有间隔区,在间隔区中,有一个loxP序列位于DSE附近,而另 一个loxP序列位于PSE附近。通常,由于DSE和PSE之间存在距离,启动 子活性处于关闭状态以抑制siRNA表达。CRE蛋白对此表达系统的作用诱 使位于DSE和PSE附近的loxP序列之间发生重组,导致loxP序列之间DNA 的置换。然后,DSE和PSE彼此靠近以将启动子活性开启为表达siRNA的 状态。该实施例描述了siRNA产生系统,其中通过CRE的作用将启动子活 性变换为开启状态。与之形成对照的是也可以构建通过CRE的作用抑制 siRNA表达的系统(未显示)。例如,在能维持启动子活性的前提下将一个loxP 放置在DSE和PSE之间,而将另一个loxP放置在DSE上游或PSE下游。 当缺乏Cre蛋白时,启动子活性处于开启状态,而当存在Cre蛋白时,通过 loxP之间的重组替换了DSE或PSE,从而将启动子活性变换至关闭状态, 导致siRNA产生受到抑制。尽管这是一个在启动子区域放置loxP的例子, 但也可以提供两个loxP,以通过提供CRE蛋白干预反义或有义编码DNA, 从而抑制siRNA的产生。
另外,对茎-环siRNA表达系统而言,可以在接头部分提供两个loxP以 干预终止序列(如TTTTT)。无需CRE蛋白,由启动子起始的转录即可终止 于接头部分的终止序列,导致siRNA产生受到抑制。CRE蛋白诱使loxP之 间发生重组以置换终止序列,导致反义和有义编码DNA转录以产生茎-环 siRNA(参见图28)。
含有上述“启动子”、“反义编码DNA”和“有义编码DNA”的siRNA表达 系统可被整合至染色体中以在细胞内表达反义和有义RNA,从而产生 siRNA。优选使用携有表达系统的载体将siRNA表达系统导入靶标,例如细 胞中以有效地转运系统。可根据欲转染的靶标,如细胞来选择可用于本发明 的载体,对于哺乳动物细胞而言,所述载体包括如逆转录病毒载体、腺病毒 载体、腺-伴随病毒载体、痘苗病毒载体、慢病毒载体、疱疹病毒载体、甲 病毒载体、EB病毒载体、乳头瘤病毒载体和泡沫病毒载体的病毒载体,以 及包括阳离子脂质体、配体DNA复合物,基因枪等的非-病毒载体(Y.Niitsu 等,Molecular Medicine 35:1385-1395(1998)),但并不局限于此。也可优选使 用哑铃-形DNA(Zanta M.A等,Gene delivery:a single nuclear localization signal peptide is sufficient to carry DNA to the cell nucleus.Proc Natl Acad Sci USA.1999 Jan 5;96(1):91-6)、经修饰后具有核酶抗性的DNA或裸露的质粒 (Liu F,Huang L.Improving plasmid DNA-mediated liver gene transfer by prolonging its retention in the hepatic vasculature.J.Gene Med.2001 Nov-Dec; 3(6):569-76)作为病毒载体的替代品。如下文所述的实施例所示,本发明人发 现通过使本发明的siRNA表达系统包含于哑铃-形DNA中,即可有效沉默靶 基因的表达。因此,在本发明的优选实施方案中,优选使用包含在哑铃-形 DNA分子中的siRNA表达系统。哑铃-形DNA可与抗体、肽等连接以便其 导入细胞。
可在相同载体或不同载体中表达反义和有义RNA。例如,通过在反义 和有义编码DNA的上游连接能表达短RNA的启动子,如pol III启动子以 形成反义和有义RNA表达盒,并将该表达盒以相同方向或相反方向插入载 体,即可制备出由相同载体表达反义和有义RNA的结构。图1A显示了这 种结构的一个例子,其中以相同的方向插入了表达盒。也可以按图1B所示 构建表达系统,其中反义和有义编码DNA被放置在方向相反的不同链上以 进行配对。该结构可含有一段双链DNA,所述DNA含有反义和有义RNA 编码链(编码siRNA的DNA),以及位于两端的彼此相对放置的启动子,从 而由各条DNA链表达反义和有义RNA。此时,为了避免在有义和反义RNA 的下游添加过量的序列,优选在每条链(编码反义和有义RNA的链)的3’末 端放置终止子。终止子可以是4个或更多个连串腺嘌呤(A)核苷酸的序列。 在该回文结构表达系统中,优选使用两个不同的启动子。对本文而言,在如 图1A所示的表达系统中,产生了两端具有切断结构的siRNA。
另外,作为另一种可替换的能表达上述茎-环siRNA的结构,也可以形 成一种单位,其中反义和有义编码DNA经由接头以相反方向被放置在相同 DNA链上,再将所得单位连接至单个启动子的下游。此时,表达的次序不 必局限于“编码反义RNA的DNA->接头->编码有义RNA的DNA”,也可以 是“编码有义RNA的DNA->接头->编码反义RNA的DNA”。由具有这种结 构的表达系统产生的RNA具有茎-环结构,其中接头部分形成环,其两侧的 有义和反义RNA配对(茎结构)。然后,该回文结构中的环部分被胞内酶裂解, 从而产生siRNA。在这种情况下,可如上文所述选择茎部分的长度,接头的 长度和类型等。
在图2所示的使用核酶的系统中,可将图2B所示的系统插入载体,或 将图2C所示的两个表达盒以相同方向或相反方向插入相同载体。也可在单 个载体中包含能表达多个siRNA(针对不同靶基因mRNA的siRNA,针对相 同靶基因mRNA的不同靶位点的siRNA,或针对相同靶基因mRNA的相同 靶位点的siRNA)的系统。
通过在反义和有义编码DNA的上游连接例如能表达短RNA的pol III 启动子以构建反义和有义RNA表达盒,并将该表达盒导入不同载体,即可 构建出在不同载体中表达反义和有义RNA的系统。另外,通过将图2C所示 的两个表达盒导入不同载体,可以构建出使用核酶的表达系统。
必要时,也可以使载体进一步携有能选择出被载体转染的细胞的序列, 如选择标记。选择标记的例子包括如新霉素抗性基因、潮霉素抗性基因、嘌 呤霉素抗性基因的药物抗性标记;以酶活性为指示剂来选择的标记,如半乳 糖苷酶;以荧光发射为指示剂来选择的标记,如GFP;以细胞表面抗原,如 EGF受体、B7-2和CD4作为指示剂来选择的标记等。选择标记仅能选择被 载体转染的细胞,即被siRNA表达系统转染的细胞。因此,可以改善将外源 siRNA片段常规转运至细胞的低转染效率,只有表达siRNA的细胞才能被 浓缩。另外,使用载体可延长siRNA表达系统的维持时间。诸如逆转录病毒 载体的载体诱使系统整合至染色体中,从而使细胞中的siRNA表达系统能稳 定提供siRNA。
本发明涉及维持上述siRNA表达系统的细胞。被此siRNA表达系统转 导的细胞优选为哺乳动物细胞,因为siRNA能在哺乳动物细胞中诱导RNAi, 而在一般情况下难以诱导RNAi。另外,也优选难以维持长-链dsRNA长期 稳定表达的细胞,如植物细胞作为被本发明的siRNA表达系统转导的细胞。 然而,本发明所用的上述细胞并不特别地限于哺乳动物和植物细胞,也可以 是例如其它非哺乳类动物的细胞、酵母细胞、真菌细胞等。
可根据细胞任意选择将上述siRNA表达系统导入上述细胞的方法。例 如,为了转导哺乳动物细胞,可选择下述方法:磷酸钙法(Virology,Vol.52, p.456(1973)),电穿孔(Nucleic Acids Res.,Vol.15,p.1311(1987)),脂质转染法 (J.Clin.Biochem.Nutr.,Vol.7,p.175(1989)),病毒感染-介导法(Sci.Am.,p.34, March(1994)),基因枪法等。可通过电穿孔法(Nature,Vol.319,p.791(1986)), 聚乙二醇法(EMBO J.,Vol.3,p.2717(1984)),微粒枪法(Proc.Natl.Acad.Sci. USA,Vol.85,p.8502(1988)),农杆菌-介导法(Nucleic Acids Res.,Vol.12, p8711(1984))等对植物细胞进行转导。
通过已知技术可选择被上述siRNA表达系统转导的细胞,所述技术如使 用特异于siRNA表达系统的DNA序列作为探针或引物的杂交和PCR。然而, 当在含有选择标记的载体中维持siRNA表达系统时,由于标记可用作指示 剂,故可用表型进行选择。
被siRNA表达系统转导的细胞变成击倒细胞,其中靶基因的表达被沉 默。在本文中,“击倒细胞”包括靶基因表达被完全抑制的细胞,以及靶基因 表达未被完全抑制,只是有所降低的细胞。通过缺失或修饰靶基因或其调节 区,可以常规产生击倒细胞。与之形成对照的是,通过将本发明的siRNA表 达系统导入细胞,并选择转导细胞,使用siRNA表达系统能简单地产生靶基 因表达受抑制的细胞,而无需对染色体上的靶基因进行任何修饰。本发明的 击倒细胞可用作研究工具,用于对靶基因进行功能分析,而作为靶基因的致 病基因已沉默的细胞可用作疾病模型细胞等。另外,通过将上述siRNA表达 系统导入生殖细胞,并由维持该系统的生殖细胞产生各个生物体,即可产生 靶基因击倒动物和疾病模型动物等。
对使用上述siRNA表达系统产生靶基因击倒动物的方法没有特别的限 制,可以使用任何已知方法。例如,将siRNA表达载体注射至通过使F1雌 性小鼠(如CBA/JxC57BL/6J)与雄性小鼠(如C57BL/6J)交配而获得的受精卵 内。从由上述受精卵发育而成的小鼠的尾部获得外周血DNA,使用表达载 体的一部分作为探针,对所述DNA进行基因组Southern印迹分析,从而鉴 定出染色体中整合有siRNA表达载体的阳性祖代动物。使上述祖代小鼠与 C57BL/6J或F1(CBA/JxC57BL/6J)杂合小鼠重复回交以获得它们的后代小 鼠。然后,进行基因组Southern印迹和PCR分析以鉴定出基因重组为阳性 的后代。
另外,尽管上文主要描述了将siRNA表达系统导入哺乳动物的情形,但 该系统也可用于植物。由于细胞传代过程中dsRNA的损失,将常规的双链 RNA直接导入植物细胞所诱导的RNAi难以维持RNAi作用。通过使用本发 明的RNA表达系统将siRNA产生系统整合至植物细胞的染色体中,就可以 在植物细胞中维持RNAi作用。也可以由这些细胞产生能稳定维持RNAi作 用的转基因植物。通过本领域技术人员已知的方法即可产生转基因植物。
本发明还涉及含有上述siRNA表达系统的组合物。由于本发明的siRNA 表达系统能使用siRNA来抑制任何所需靶基因的表达,因此,该系统能使致 病基因沉默。可将siRNA表达系统用作添加有适当载体的药物组合物等。
本发明的另一个实施方案涉及细胞内表达siRNA文库的系统。本发明的 “siRNA文库”所表达的siRNA由含有以任意次序排列的腺嘌呤、鸟嘌呤、胞 嘧啶或尿嘧啶,并且与表达的siRNA等长的RNA链,或由与表达的siRNA 等长的(随机)cDNA或基因组DNA片段所编码的RNA链组成。在本文中, 如上所述的siRNA也被称为“随机siRNA”。即本文所用的“随机siRNA”由任 何序列,或由任何选自特定cDNA序列、特定cDNA文库中所包含的序列或 基因组序列的序列组成。上述siRNA表达系统能沉默特定靶基因的表达,同 时,还可使用该实施方案的系统,通过表达siRNA文库和沉默任意基因,例 如功能和序列未知的基因来搜索新的功能基因。一例siRNA文库表达系统具 有图1B所示结构。该系统含有编码双链siRNA的DNA,其中编码随机反 义RNA的DNA和与编码有义RNA的DNA互补的DNA配对(下文称之为 “siRNA编码DNA”),还含有两个彼此相对放置的启动子,所述启动子干预 siRNA编码DNA并能分开表达反义RNA或有义RNA。
除了含有任何序列,或任何选自特定cDNA序列、特定cDNA文库中所 包含的序列或基因组序列的序列外,上述“随机siRNA”与上述siRNA表达系 统相同,并且由链足够短从而对哺乳动物细胞不显示毒性的双链RNA组成。 据Tuschl等(文献同上)报道,短链长度不限于21至23bp,还可以是例如15 至49bp,优选为15至35bp,更优选为21至30bp,只要它不表现出毒性即 可。另外,上述随机siRNA的末端结构可以是平端或粘端(突出端),只要它 们能通过RNAi作用沉默靶基因即可。另外,粘端(突出端)结构不仅包括3’- 突出端,还包括5’-突出端,只要它们能诱导上述RNAi效应即可。另外, 突出端核苷酸的数目不限于2或3,可以是能诱导RNAi效应的任何数目, 例如1至8个核苷酸,优选为2至4个核苷酸。此外,如上所述,siRNA可 在其一端的突出端含有低分子量RNA。另外,如上所述,由siRNA文库表 达系统表达的siRNA可在RNA配对的双链RNA区域含有错配或凸起,或 两种兼备。
此外,siRNA文库表达系统不限于上述结构(具有两个彼此相对放置、 干预siRNA编码DNA的启动子),还可具有能表达茎-环siRNA的结构。即, 本发明还包括这样一种结构,其中启动子连接在单位(下文称之为“茎-环 siRNA文库产生单位”)的上游,所述单位是通过用接头DNA以相反方向连 接编码反义RNA的DNA(例如任何随机序列,或任何选自特定cDNA序列、 特定cDNA文库中所包含的序列或基因组序列的序列)和编码与上述反义 RNA互补的有义RNA的DNA而形成的。图18显示了一例制备上述茎-环 siRNA文库产生单位的方法。即,使用DNA合成仪等合成单链DNA,其含 有编码具有随机序列的反义RNA的DNA(反义编码DNA),在其3’末端还含 有能形成任意回文结构的序列。制备与该单链DNA的5’方向互补的引物, 使引物与其退火以在单链DNA的3’末端形成回文结构。使DNA聚合酶和 DNA连接酶作用于该结构以合成与反义编码DNA互补的有义编码DNA链, 同时形成茎部分伸长的回文结构。通过变性处理使该回文结构成为单链,使 用与反义编码DNA和有义编码DNA两侧序列互补的引物进行PCR,以产 生含有茎-环siRNA文库产生单位的双链DNA。必要时,用限制性酶等修整 含有茎-环siRNA文库产生单位的双链DNA的一条链,将如此获得的双链 DNA连接至适当启动子的下游以产生茎-环siRNA文库表达系统。
由上述茎-环siRNA文库表达系统产生茎-环siRNA。在如上所述的该茎 -环siRNA中,所产生的双链RNA部分(茎部分)的长度可以是例如15至49bp, 优选为15至35bp,更优选为21至30bp。另外,对接头的长度和序列没有 特别的限制,只要它们不会妨碍茎部分配对即可,可将低分子量RNA,如 三叶草tRNA用作接头。
上述“随机反义编码DNA”由任何序列组成,所述序列可任意选自例如: 由四个核苷酸“A,G,C和T”任意组合而形成的、与表达的siRNA等长的序列。 或者,“随机反义编码DNA”由任何选自特定cDNA序列、特定cDNA文库 中所包含的序列或基因组序列的序列组成。本文可用的启动子可以是pol II 或pol III启动子。优选使用适于表达短RNA,如siRNA的pol III启动子。 另外,两个启动子可以相同或不同,考虑到表达效率,优选启动子是不同的 启动子。此时可以使用的pol II和pol III启动子的例子与上文所述的相同。
另外,当使用pol III启动子时,为了在表达互补的短RNA之后适当地 终止转录,优选如图1B所示,在启动子和编码siRNA的DNA之间提供终 止子。可以使用如图1B所示的由4个或更多个连串腺嘌呤组成的序列,本 领域技术人员已知的任何终止子等。
当使用诱导型启动子时,可在预定的时机表达siRNA文库。因此,可以 分析在生物体特定的发育/分化阶段起作用的基因。另外,使用具有组织-特 异性转录活性的启动子能诱导siRNA的组织-特异性表达,从而能分析特定 组织中的功能基因。此时可以使用的诱导型启动子和组织-特异性启动子与 上文所述的相同。上述siRNA文库表达系统可作为DNA插入物整合至细胞 染色体中。为了有效导入细胞等,优选在载体中维持siRNA文库表达系统。 本文可用的“载体”与上文所述的相同。也可通过将能够表达多个siRNA的 siRNA文库表达系统导入单个载体,来改善筛选功能基因的效率。必要时, 携有siRNA文库表达系统的载体可进一步含有选择标记等。此时可用的选择 标记与上文所述的相同。因此,使用选择标记能选择出被携有siRNA文库表 达系统的载体转染的细胞,从而改善筛选功能基因的效率。
本发明siRNA表达系统的另一个实施方案是由多个siRNA表达载体集 合而成的siRNA文库表达系统,各个载体靶向含有编码区和/或非-编码区的 基因序列。
也可以集中能表达不同siRNA的siRNA文库表达系统并构建集合。例 如,可以构建siRNA编码DNA和茎-环siRNA文库表达系统,以产生RNA 链作为由此集合表达的siRNA,所述RNA链含有由四个核苷酸“A,G,C和U” 任意组合而形成的、与表达的siRNA等长的序列。或者,siRNA编码DNA 可含有任何cDNA片段,或任何选自任何cDNA文库中所包含的序列或基因 组序列的序列。因此,使用含有多个siRNA文库表达系统的集合能更有效地 搜索功能基因。
可以使用上述随机siRNA文库表达系统或这些siRNA文库表达系统的 集合,通过下述步骤进行搜索功能基因的方法:将siRNA文库表达系统或上 述siRNA文库表达系统集合导入细胞,选择被上述siRNA文库表达系统或 集合转导的细胞,并分析如此选择的细胞的表型。
如上所述,可根据细胞的类型来改变将siRNA文库表达系统等导入细胞 的方法。具体地说,将所述系统导入哺乳动物细胞的方法可选自磷酸钙法 (Virology,Vol.52,p.456(1973))、电穿孔法(Nucleic Acids Res.,Vol.15, p.1311(1987))、脂质转染法(J.Clin.Biochem.Nutr.,Vol.7,p.175(1989))、病毒 感染转导法(Sci.Am.p.34,March(1994))、基因枪法等,而通过电穿孔法 (Nature Vol.319,p.791(1986))、聚乙二醇法(EMBO J.Vol.3,p.2717(1984))、微 粒枪法(Proc.Natl.Acad.Sci.USA Vol.85,p.8502(1988))、农杆菌介导的方法 (NucleicAcids Res.Vol.12,p.8711(1984))等可将所述系统导入植物细胞。
当将siRNA文库表达系统等导入携有选择标记的载体时,可通过收集具 有选择标记所致表型的细胞,来选择被所述系统或集合转导的细胞。当载体 不含选择标记时,可通过使用siRNA文库表达系统所共有的特定序列为探针 或引物,用已知的杂交方法、PCR等检测转导细胞以选择出转导细胞。
选择出被上述siRNA文库表达系统或集合转导的细胞之后,通过比较转 导细胞与未被siRNA文库表达系统或集合转导的对照细胞的表型来分析转 导细胞的表型。这些表型不仅限于细胞表面表现出的表型,还包括例如细胞 内的变化等。
经上述分析被认为具有表型变化的细胞可含有能沉默任何功能基因的 siRNA文库表达系统。因此,为了筛选功能基因,可基于编码该细胞中所含 siRNA的DNA序列构建探针和引物,并将它们用于杂交或PCR以进行功能 基因的克隆。也可基于编码siRNA的DNA序列进行功能基因的数据库检索。
本发明siRNA表达系统的作用一般会根据靶基因的靶位点的位置而发 生很大变化。例如,当靶向HIV时,siRNA有望通过靶向引发位点获得高 的基因沉默作用。甚至在优选靶位点未知的情况下,本发明的siRNA文库表 达系统也是有效的。即,作为搜索被siRNA有效降解的mRNA最佳靶位点 的系统,本发明的上述siRNA文库表达系统十分有用。本发明提供了选择高 活性siRNA的方法,其包括下述步骤:将本发明的siRNA文库表达系统或 所述siRNA文库表达系统的集合导入细胞,并测定被siRNA文库表达系统 或其集合转导的细胞中特定基因或蛋白质的表达水平。通过本领域技术人员 已知的方法,如Northern印迹杂交或Western印迹杂交,可以容易地测定任 何所需基因或蛋白质的表达水平。
导入本发明的siRNA表达系统和siRNA文库表达系统的细胞不特别地 限于哺乳动物细胞,可以包括其它动物、植物、酵母、真菌等的细胞。
本发明的siRNA表达文库可用于例如搜索与病毒感染相关的基因。将 siRNA表达文库导入细胞,用病毒感染该细胞,并检查存活细胞,籍此可以 容易地鉴定出与病毒感染相关的基因。使用含有人40,000个cDNA的siRNA 表达文库能够鉴定出所有与病毒感染相关的基因。随机化的siRNA表达文库 或基因组片段的siRNA表达文库能鉴定出基因而不是cDNA。可以联合使用 这两个文库。

附图说明

图1描述了使用U6启动子的siRNA表达系统以及利用该系统产生 siRNA的方法。(A)显示了siRNA的产生过程。两个U6启动子产生有义和 反义短RNA,RNA的3’-末端添加有4个尿苷(U)。如此表达的有义和反义 RNA退火形成具有4-核苷酸3’突出端的siRNA双链体。(B)显示了回文结构 型siRNA表达系统,其含有编码siRNA的双链DNA以及位于两端的启动子, 所述DNA含有有义和反义编码DNA,由所述启动子起始表达有义和反义 RNA。
图2描述了一例使用核酶产生siRNA表达系统的结构。
图3描述了当将针对EGFP的siRNA表达系统导入表达潮霉素/EGFP的 细胞时,所述系统的EGFP基因沉默作用。左侧的一组实验(A,D,G和J)显示 了潮霉素/EGFP的表达;中间的一组实验(B,E,H和K)显示了DsRed的表达; 右侧的一组实验(C,F,I和L)显示了潮霉素/EGFP和DsRed合并表达的结果。
图4描述了当将针对sea pansy(肾海鳃属(Renilla))或萤火虫萤光素酶的 siRNA表达系统导入具有萤光素酶活性的HeLa S3细胞时,所述系统的基因 沉默作用。在图4a中,纵坐标值指的是:基于肾海鳃萤光素酶活性归一化 的、导入了针对萤火虫萤光素酶的siRNA表达系统的细胞的萤光素酶活性, 或基于萤火虫萤光素酶活性归一化的、导入了针对肾海鳃萤光素酶的siRNA 表达系统的细胞的萤光素酶活性。图4b显示了当在细胞中导入不同量的针 对每种萤光素酶的siRNA表达系统时,siRNA表达系统对萤火虫或肾海鳃 萤光素酶活性的浓度-依赖型沉默作用。
图5描述了使用一系列针对相同靶基因(萤火虫萤光素酶)上的不同靶位 点的siRNA或siRNA表达系统的基因沉默作用。图5a显示了当将针对不同 靶位点的siRNA表达载体导入细胞时,所述载体的基因沉默作用。图5b显 示了将不同浓度的针对不同靶位点的外源siRNA直接导入细胞时所获得的 结果。
图6a描述了不同长度的siRNA 3’突出端的基因沉默作用。图6b显示了 针对两个靶基因或两个靶位点的siRNA表达系统的基因沉默作用。在图6b 中,基于引入作为内部对照的β-半乳糖苷酶活性归一化萤光素酶活性的值。
图7描述了siRNA表达系统沉默内源性β-连环蛋白基因的能力。A,B和 C实验组是被针对β-连环蛋白(catenin)的siRNA表达载体(pHygEGFP/iβ-连环 蛋白)转导的组,而D,E和F实验组是被空载体(pHygEGFP)转导的组。用抗 -β-连环蛋白的抗体染色所有的组。左侧的实验组(A和D)显示了潮霉素/EGFP 的表达;中间的实验组(B和E)显示了β-连环蛋白的表达;而右侧的实验组 (C和F)显示了这两个表达的合并图像。
图8描述了串联和茎-环siRNA之间RNAi作用的比较。siRNA表达载 体pU6tandem19和pU6stem19分别是串联和茎-环。Cont.表示对照(空白载 体)。
图9描述了多个siRNA表达载体的基因沉默作用。
图10描述了含有得自巨细胞病毒的启动子(CMV启动子)和tRNA启动 子的siRNA表达载体的基因沉默作用。
图11描述了含有错配或凸起的双链siRNA的RNAi诱导作用。
图12图解描述了Tet-ON系统的原理。当缺乏四环素时,四环素阻抑蛋 白与U6启动子结合,导致转录被抑制,而当存在四环素时,四环素阻抑蛋 白与四环素结合,从而从U6启动子上释放下来,转录得以起始。
图13图解描述了具有四环素-诱导型启动子的siRNA表达载体的RNAi 诱导作用。U6Teti表示在U6启动子中含有四环素操纵序列的siRNA表达载 体,U6i表示不含该序列的siRNA表达载体。
图14图示了含有修整核酶的RNA转录物中的自动裂解。
图15图示了修整核酶的自我-加工导致的siRNA产生。核苷酸裂解发生 在黑箭头所示的位置以产生siRNA。
图16是显示RNA自我-加工所导致的siRNA产生的电泳图。箭头表示 对应于21nt siRNA的条带。
图17图示了一例使用Cre-lox系统控制siRNA表达的结构。
图18图示了制备茎-环siRNA文库表达系统的例子。
图19图示了制备siRNA文库表达系统的例子。
①显示了具有长度为19至29bp的去磷酸化平端的随机DNA片段。
②表示在其两端与5’-磷酸化发夹型DNA接头1连接的随机DNA片段 ①。
图20是图19的延续。
③显示了Bst DNA聚合酶所致的自Nick位点起的链置换。
④表示与DNA接头2连接的片段③。
图21是图20的延续。
⑤显示了Bst DNA聚合酶所致的自Nick位点起的链置换。
⑥表示AscI对⑤的裂解。
图22是图21的延续。
⑦表示siRNA文库表达预-文库。
⑧显示了BspMI对siRNA文库表达预-文库的裂解。
当在有义和反义编码DNA之间插入环序列TTCG时,裂解进行至图23 的步骤⑧-2。
⑨表示通过用Klenow片段平端化,除去DNA接头1并进行自身-连接 而获得的已完成的siRNA文库表达系统。
图23是图22的延续。
⑧-2表示在⑧中的有义和反义编码DNA之间插入环序列TTCG的情 况。用BsgI裂解siRNA文库表达预-文库。
⑧-3显示了用BspMI裂解siRNA文库表达预-文库。BsgI的裂解位点 不会被BspMI进攻。
⑨-2表示通过用T4 DNA聚合酶平端化,除去DNA接头1并进行自身 -连接而获得的已完成的siRNA文库表达系统。
图24图示了约20至25bp长的EGFP cDNA片段的制备。具有去磷酸化 平端、约20至25bp长的随机EGFP cDNA片段终产物可用作图19①中的 随机DNA片段。
图25图示了克隆载体的制备。启动子是人U6启动子或人tRNA启动子。 使用BspMI和Klenow制备含有U6启动子的克隆载体,使用BseRI和T4 DNA聚合酶制备含有tRNA启动子的克隆载体。
图26为显微图,显示了用共聚焦显微镜观察EGFP荧光强度的结果。
图27图示了转染后24和48小时测定的pUC18、U6 GFP25 siRNA lib-loop-、U6 GFP25 siRNA lib TTCG、tRNA GFP25 siRNA lib loop-和tRNA GFP25 siRNA lib TTCG中的相对EGFP荧光强度。
图28图示了含有两个loxP的茎-环siRNA表达系统,所述loxP能干预 含有终止序列的接头部分。
图29图示了siRNA表达腺病毒载体的基因沉默作用。
图30图示了siRNA表达HIV载体的基因沉默作用。
图31图示了siRNA表达哑铃-型载体的基因沉默作用。
图32图示了在siRNA的双链RNA区域含有错配或凸起的siRNA表达 系统的基因沉默作用。每个序列前方括号中的数字表示SEQ ID NO:。
实施本发明的最佳模式
[实施例1]使用siRNA表达载体诱导RNAi
检测siRNA表达载体是否能沉默编码外源性潮霉素/EGFP融合蛋白的 靶基因。
潮霉素/EGFP表达载体(pHygEGFP)和内部对照DsRed表达载体 (pDsRed2)购自Clontech。使用携有人U6启动子的质粒pU6(Ohkawa,J.& Taira, K.Control of the functional activity of an antisense RNA by a tetracycline-responsive derivative of the human U6 snRNA promoter.Hum Gene Ther.11,577-585(2000)) 构建siRNA表达载体。用DNA合成仪合成含有编码潮霉素/EGFP有义和反义 RNA部分的DNA的片段,将所述片段直接亚克隆至pU6中U6启动子的下游。 为了将这些合成片段插2pU6中U6启动子的下游,在亚克隆所用载体的U6 启动子下游提供一个BspMI识别位点,在更下游的位置再提供一个BspMI位 点。用BspMI裂解之后,形成4-核苷酸粘端。通过插入末端与所述粘端互补 的合成有义编码DNA,构建出能表达有义RNA的载体。
按照类似的方法合成编码反义RNA的DNA(19个核苷酸),并直接亚克隆 至pU6中U6启动子的下游。
从载体上切下含有U6启动子的反义RNA表达盒,插入含有有义RNA表 达盒的pU6载体以构建siRNA表达载体(pU6iHyg/EGFP)。在本文中,由于据 报道在使用U6启动子时,在表达的mRNA的3’-末端添加有4个尿苷(U),由 siRNA表达载体表达并在细胞内形成的siRNA在两个3’-末端都具有4个核苷 酸的突出端。即,该siRNA表达载体表达23个核苷酸长的siRNA,所述siRNA 具有19个核苷酸的双链体,并在其两个3’末端具有4-核苷酸突出端(图1A)。
通过脂质转染法(使用Lipofectamine 2000),用上述pHygEGFP(1g)、 pDsRed2(0.5g)和pU6iHyg/EGFP(1g)共转染人HeLa S3细胞。转染后48小时, 将细胞置于37℃,在聚焦显微镜下观察。作为对照实验,使用pU6替代siRNA 表达载体进行类似操作。
在图3中,上方的实验组描述了使用pU6的对照实验的结果,而下方的实 验组显示出导入pU6iHyg/EGFP所获得的结果。如图3中间一栏所示,在被作 为内部对照的、能发射红色荧光的pDsRed转导的细胞中,对照和 pU6iHyg/EGFP-转导组之间的荧光强度没有显著差异,表明这两个实验组之 间的载体转移效率没有差别,而且,siRNA表达载体对基因表达没有表现出 非-特异性的基因沉默作用。另一方面,如图3左边一栏所示,因pHygEGFP 而发射绿色荧光的细胞数目减少,而与对照组相比,在pU6iHyg/EGFP-转导 组中,绿色荧光细胞的荧光强度也有所降低。类似地,如图3右边一栏所示, 甚至当红色和绿色荧光合并时,与对照相比,在siRNA表达载体-转导细胞中, 绿色-荧光细胞以及因红色和绿色合并所致的黄色荧光细胞的数目也有所减 少。这些结果证实:导入siRNA表达载体能诱导RNAi,导致靶基因沉默。另 外,使用小鼠COS7细胞进行类似分析的结果显示:pDsRed的表达一点也不 受影响,而pHygEGFP的表达被特异性沉默(未显示)。
[实施例2]定量测定siRNA表达载体的基因沉默活性
为了定量测定RNAi作用,按下述分析针对萤火虫和肾海鳃萤光素酶基 因(作为另一报道基因)的siRNA的基因表达沉默活性。
在添加有10%胎牛血清的Dulbecco改进的Eagle培养基中培养HeLa S3和 COS7细胞。将各自的经培养细胞(3×104个细胞/孔)置于48-孔培养板的每个孔 中。为了进行萤光素酶报道基因分析,通过使用Lipofectamine 2000(Life Technologies)的脂质转染法,用RSV-肾海鳃萤光素酶表达载体 (pRL-RSV)15(30ng)、萤火虫萤光素酶表达载体pGL3(Promega)(30ng)和不同 量的针对萤火虫或肾海鳃萤光素酶转录产物的siRNA表达载体共转染每个孔 中的细胞。
图4显示了HeLa S3细胞中的萤光素酶分析结果。图4A表示导入固定量 (300ng)的siRNA表达载体所获得的结果,表明导入siRNA可以沉默相应的靶 基因表达。另外,在用仅表达有义或反义RNA的质粒进行的萤光素酶活性分 析中,两种质粒对萤火虫和肾海鳃萤光素酶的表达一点也不起作用。图4B 显示了导入不同量siRNA所获得的结果。针对萤火虫萤光素酶基因的siRNA 表达载体剂量-依赖型地降低萤火虫萤光素酶的活性,而不会影响肾海鳃萤 光素酶的活性。另一方面,在用针对肾海鳃萤光素酶基因的siRNA表达载体 转染的细胞中,肾海鳃萤光素酶的活性呈剂量-依赖型降低。这些结果清楚 地表明:使用U6启动子的siRNA表达系统能特异性地、有效地沉默靶基因。
[实施例3]靶位点-依赖型基因沉默
接着,检测针对相同转录产物中的不同靶位点的siRNA表达载体是否具 有不同的基因沉默作用。在此分析中,在类似于实施例2的条件下,将针对 萤火虫萤光素酶转录产物上的4个不同靶位点的各个siRNA表达载体,以及用 作内部对照的萤火虫萤光素酶表达载体和肾海鳃萤光素酶表达载体一起共 转染至HeLa S3细胞。针对4个不同靶位点的siRNA表达载体中的有义和反义 编码DNA的序列如下所示:
萤火虫萤光素酶位点O有义链:5’-GCTATGAAACGATATGGGC-3’(SEQ ID NO:1);
位点O反义链:5’-GCCCATATCGTTTCATAGC-3’(SEQ ID NO:2);
位点A有义链:5’-GTTCGTCACATCTCATCTAC-3’(SEQ ID NO:3);
位点A反义链:5’-GTAGATGAGATGTGACGAA-3’(SEQ ID NO:4);
位点B有义链:5’-GTGCGCTGCTGGTGCCAAC-3’(SEQ ID NO:5);
位点B反义链:5’-GTTGGCACCAGCAGCGCAC-3’(SEQ ID NO:6);
位点C有义链:5’-ATGTACACGTTCGTCACAT-3’(SEQ ID NO:7);
位点C反义链:5’-ATGTGACGAACGTGTACAT-3’(SEQ ID NO:8);
对照肾海鳃萤光素酶
(具有核苷酸突出端的有义链):
5’-GTAGCGCGGTGTATTATAC-3’(SEQ ID NO:9);
(具有核苷酸突出端的反义链):
5’-GTATAATACACCGCGCTAC-3’(SEQ ID NO:10)。
如图5A所示,根据靶位点的不同,萤光素酶基因沉默活性也有所不同。 即,针对位点B的siRNA表达载体的基因沉默活性最高,使得萤火虫萤光素 酶活性降低至对照的14%。针对位点A、C和D的siRNA表达载体使酶表达水 平分别降低至对照的44%、38%和36%。此时,针对位点O的siRNA表达载体 与两个对照表达载体Hyg-U6siRNA和pU6类似,未显示出基因表达沉默活性。
还检测了上述取决于靶位点的基因沉默活性差异是仅由靶位点的差异 导致的,还是由各个siRNA转录效率的差异所引起的。为了进行检测,分别 合成上述有义和反义RNA寡核苷酸。这些siRNA寡核苷酸的序列如下:
萤火虫萤光素酶位点O有义链:
5’-GCUAUGAAACGAUAUGGGCUU-3’(SEQ ID NO:11);
位点O反义链:5’-GCCCAUAUCGUUUCAUAGCUU-3’(SEQ ID NO:12);
位点A有义链:5’-GUUCGUCACAUCUCAUCUACUU-3’(SEQ ID NO:13);
位点A反义链:5’-GUAGAUGAGAUGUGACGAAUU-3’(SEQ ID NO:14);
位点B有义链:5’-GUGCGCUGCUGGUGCCAACUU-3’(SEQ ID NO:15);
位点B反义链:5’-GUUGGCACCAGCAGCGCACUU-3’(SEQ ID NO:16);
位点N有义链:5’-AUGUACACGUUCGUCACAUUU-3’(SEQ ID NO:17);
位点N反义链:5’-AUGUGACGAACGUGUACAUUU-3’(SEQ ID NO:18);
对照肾海鳃萤光素酶
(具有核苷酸突出端的有义链):
5’-GUAGCGCGGUGUAUUAUACUU-3’(SEQ ID NO:19);
(具有核苷酸突出端的反义链):
5’-GUAUAAUACACCGCGCUACUU-3’(SEQ ID NO:20)。
使用394型RNA合成仪(Applied Biosystems)合成上述RNA寡核苷酸。使 合成的RNA脱保护,通过变性的丙烯酰胺凝胶电泳进行纯化。从凝胶中洗脱 之后,将各个RNA级分上样于NAP-10柱(Pharmacia),用不含核糖核酸酶的 水洗脱以脱盐。真空干燥所得洗脱物,并重新悬浮于退火缓冲液(pH6.8的磷 酸-缓冲生理盐水(PBS),2mM MgCl2)。然后,为了退火RNA寡核苷酸,制 备10μM RNA,95℃保温1分钟,然后冷却至70℃,再在2小时内缓慢冷却至 4℃。按照与上文所述类似的方法,将所得siRNA寡核苷酸导入HeLa S3细胞 以检测萤光素酶活性(图5B)。
除了针对位点O的siRNA寡核苷酸表现出的微弱基因沉默活性外,由针 对各个靶位点的siRNA寡核苷酸所致的萤光素酶基因沉默分布图表现出的模 式类似于导入1和0.1nM siRNA表达载体时所获得的相应模式。这些结果表 明:基因沉默活性的差异不是由每个siRNA表达效率的差异引起的,而是取 决于靶位点(如它们的二级结构)的差异和RNA结合蛋白的存在。
[实施例4]siRNA 3’突出端长度的影响
U6启动子产生的siRNA的3’-末端具有4个尿苷核苷酸突出端。另一方面, 据Elbashir等报道,在使用果蝇(Drosphila)的体外实验中,当3’突出端长于2 至3个核苷酸时,siRNA的基因沉默效率会降低(Elbashir,S.M.,Lendeckel,W. & Tuschl,T.RNA interference is mediated by 21-and 22-nucleotide RNAs. Genes Dev.15,188-200(2001))。因此,我们检查了上述siRNA的4-核苷酸3’ 突出端是否会影响siRNA诱导RNAi的效率。通过类似于上述实施例3的化学 合成制备针对上述肾海鳃萤光素酶转录产物上的相同靶位点的siRNA寡核苷 酸,所述siRNA寡核苷酸具有3’突出端,该突出端的尿苷核苷酸数目被设置 为2,3或4。通过脂质转染法,将这些针对肾海鳃萤光素酶转录产物的siRNA 寡核苷酸,以及作为内部对照的萤火虫萤光素酶表达载体以不同的浓度导入 HeLa S3细胞以检测萤光素酶活性(图6A)。
仅用上述内部对照不能沉默肾海鳃萤光素酶的表达,但在被上述siRNA 寡核苷酸转导的细胞组中,所述表达受到剂量-依赖型抑制。另外,据观察, 3’突出端的长度由2个核苷酸变为4个核苷酸,基因沉默活性没有显著差异, 籍此揭示出由U6启动子产生的、具有4-核苷酸3’突出端的siRNA也能象具有 2-或3-核苷酸突出端的siRNA一样,有效地沉默靶基因的表达。
[实施例5]多个基因的同时沉默
我们检查了当同时表达两个包含靶基因的不同基因时,siRNA是否能同 时沉默不同的靶基因。构建含有两个针对萤火虫和肾海鳃萤光素酶的siRNA 表达盒的质粒,将所述质粒共转染至细胞。
将萤火虫萤光素酶表达载体(30ng)、肾海鳃萤光素酶表达载体(30ng)、 表达针对这两种萤光素酶转录产物的siRNA的载体(300ng),连同作为内部对 照的表达β-半乳糖苷酶的载体(100ng)一起共转染至HeLa S3细胞。作为对照, 使用表达针对萤火虫和肾海鳃萤光素酶转录产物中的任一种的siRNA的载体 进行类似实验。
如图6B所示,与导入针对任一种萤光素酶的siRNA表达载体(U6i-Renilla 或U6i-Firefly)时的结果相同,用针对两种萤光素酶的siRNA表达载体 (U6i-Firefly/Renilla)转染能同时将萤火虫和肾海鳃萤光素酶的表达沉默至相 同水平。
如上所述,已阐明通过将多个siRNA表达盒放置在相同质粒中以同时表 达多个siRNA,可以沉默相应的靶基因,而不会在各个启动子中产生干扰。
[实施例6]内源性基因沉默
上述所有实施例涉及沉默导入细胞中的外源性基因。在此实验中,检查 了siRNA表达载体是否能沉默内源性基因表达。
将编码β-连环蛋白的内源性基因选作靶。β-连环蛋白是束缚于膜上的胞 质蛋白,已知它是与细胞间粘着中的钙粘着蛋白相关的因子,它也是一种重 要的癌基因(Peifer,M.& Polakis,P.Wnt signaling in oncogenesis and embryogenesis-a look outside the nucleus.Science 287,1606-1609(2000))。
将含有针对β-连环蛋白的siRNA表达盒的EGFP表达质粒(pEGFP/iβ-连 环蛋白)导入表达β-连环蛋白的SW480细胞。作为对照,按照类似方法,将不 含针对β-连环蛋白的siRNA表达盒的EGFP表达质粒(pEGFP)导入60%铺满的 细胞。使用如Effectene(Qiagen)或Fugene 6(Roche Molecular Biochemicals)的 试剂,将这些质粒导入固定于载玻片上的细胞。转导48小时之后,在含有4% 低聚甲醛的PBS中固定细胞20分钟,在0.1%Triton X100中渗透细胞,然后用 抗-β-连环蛋白抗体(UBI)和Cy3-标记的第二抗体对细胞进行染色。使用聚焦 显微镜分析染色后的细胞荧光(图7)。
结果表明:与不用质粒转导的细胞相比,含有pEGFP/iβ-连环蛋白的绿 色荧光细胞中的β-连环蛋白表达水平要低得多。另外,在用pEGFP转导的绿 色荧光细胞和不用质粒转导的细胞中,β-连环蛋白的表达水平没有差别。
[实施例7]比较串联和茎-环siRNA表达载体之间的基因沉默作用
本实施例检查了siRNA表达载体pU6tandem19和siRNA表达载体 pU6stem19的基因沉默作用,在前一载体中,编码有义和反义RNA的DNA被 串联放置,而后一载体能表达茎环RNA分子。将上述各个载体表达的siRNA 称为串联siRNA和茎-环siRNA。pU6stem19中转录的茎-环siRNA的序列是5’ -GTGCGCTGCTGGTGCCAACgugugcuguccGTTGGCACCAGCA GCGCAC-3′(SEQ ID NO:21)。通过上述实施例中所述的萤光素酶分析定量测 定基因沉默活性。
结果示于图8。串联和茎-环siRNA皆能浓度-依赖型地降低萤光素酶活 性。这些结果表明串联和茎-环siRNA表达系统都能有效抑制靶基因的表达。
[实施例8]多种siRNA表达载体的基因沉默作用
本实施例检查了含有多种启动子的siRNA表达载体的基因沉默作用。在 与上述实施例类似的条件下进行萤光素酶分析。使用了下述siRNA表达载体。
●通过人U6启动子表达串联siRNA的载体(pU6tandem19),
●通过人5S rRNA启动子表达串联siRNA的载体(p5Standem19),
●通过人H1启动子表达串联siRNA的载体(pH1tandem19),和
●通过人H1启动子表达茎-环siRNA的载体(pH1stem19)。
如图9所示,本文所用的多种表达载体显示出萤光素酶抑制活性,这表 明siRNA表达载体中可用的启动子不限于特定的启动子,可以使用多种启动 子,如人U6启动子,人5S rRNA启动子和人H1启动子。
[实施例9]含有CMV启动子或tRNA启动子的siRNA表达载体的基因沉 默作用
本实施例检查了含有得自巨细胞病毒的启动子(CMV启动子)或tRNA启 动子和修整核酶的siRNA表达载体(分别为pCMV-TRz和ptRNA-TRz)的基因 沉默作用。tRNA启动子转录物的5’末端添加有tRNA分子。通过修整核酶的 作用切下非形成siRNA所必需的3’末端过量RNA分子。
如图10所示,含有CMV启动子或tRNA启动子的siRNA表达载体都能降 低萤光素酶活性,这表明优选使用CMV启动子或tRNA启动子作为本发明 siRNA表达载体中的启动子,甚至连与诸如5’末端tRNA的分子结合的表达载 体转录物都具有靶基因沉默作用。
[实施例10]通过含有错配或凸起的双链siRNA诱导RNAi
本实施例检查了双链siRNA中错配或凸起的存在对RNAi的作用。在与上 述实施例类似的条件下进行萤光素酶分析。实验中使用了下述RNA序列。
●对照RNA序列
5′-GUGCGCUGCUGGUGCCAACCCgugugcuguccGGGUUGGCACCAG CAGCGCAC-3′(SEQ ID NO:22)
●含有错配的RNA序列
5′-GUGCGCUGuUGGUGuCAACCCgugugcuguccGGGUUGGCACCAGC AGCGCAC-3′(SEQ ID NO:23)
●含有凸起的RNA序列
5′-GUGCGCUGCUGGUGCuCAACCCgugugcuguccGGGUUGGCACCAG CAGCGCAC-3′(SEQ ID NO:24)
如图11所示,本文所用的多个表达载体显示出萤光素酶抑制活性。双链 siRNA中错配或凸起的存在或缺失不会使基因沉默作用产生显著差异。
另外,本实施例还检查了多种含有错配或凸起的siRNA所诱导的RNAi 作用。图32显示了编码一条siRNA链的DNA序列和由该序列诱导的RNAi作 用(萤光素酶活性)。
这些结果表明:甚至连在其双链中含有错配或凸起的siRNA都能有效抑 制靶基因的表达。即,构成siRNA双链的每条链不必彼此完全互补。
[实施例11]具有四环素-诱导型启动子的siRNA表达载体诱导的RNAi
能通过四环素控制RNA启动子转录活性的系统(Tet-ON系统)是已知的 (Ohkawa,J.& Taira,K.Control of the functional activity of an antisense RNA by a tetracycline-responsive derivative of the human U6 snRNA promoter.Hum Gene Ther.11,577-585(2000))。已将四环素-抗性转座子的四环素操纵序列插 入该系统所用的人U6启动子(图12)。四环素阻抑蛋白与该序列的结合导致启 动子活性受抑制。在表达四环素阻抑蛋白的细胞(HeLa细胞)中,由该启动子 控制转录的表达载体处于转录活性受抑制的状态。可能的原因是:细胞中的 四环素阻抑蛋白与人U6启动子结合,从而抑制转录活性。当在细胞中添加四 环素(或四环素衍生物)时,它与四环素阻抑蛋白结合以从U6启动子上释放出 阻抑蛋白,从而导致转录激活。
本发明人构建了具有人U6启动子的siRNA表达载体,所述启动子中插入 了四环素抗性转座子的四环素操纵序列,并且使用TetON系统检查siRNA表 达载体的基因沉默作用。在与上述实施例类似的条件下进行萤光素酶分析。
如图13所示,通过加入四环素,含有人U6启动子的siRNA表达载体能降 低萤光素酶活性,其中所述启动子插入了四环素抗性转座子的四环素操纵序 列。另一方面,不管加还是不加四环素,不含四环素操纵序列的siRNA表达 载体都能降低萤光素酶活性。这些结果表明:优选使用上述四环素诱导型U6 启动子作为诱导siRNA表达的启动子。
[实施例12]通过RNA自我-加工产生siRNA
在siRNA表达载体中使用pol II启动子导致稍长RNA的转录。因此,当使 用pol II启动子时,必需通过例如自我-加工裂解该RNA以产生反义RNA或有 义RNA。不管是否实际发生了自我-加工,都使用含有反义编码DNA或有义 编码DNA的RNA产生单位(图2)检查编码其5’和3’末端被核酶所识别的RNA 序列的区域(识别序列编码区),以及侧翼于该识别序列编码区外侧的、编码 裂解识别序列编码区的5’和3’末端裂解核酶的区域。图14和15图示了RNA自 我-加工。对上述单位的转录物进行凝胶电泳。
凝胶电泳的结果示于图16。在图16中电泳条带的左侧,图示了对应于各 条带的RNA分子的推定结构。观察到几条对应于不同长度RNA的带,据认为 它们是由RNA自我-加工产生的。还观察到21个核苷酸长的siRNA带。这些结 果表明:使用如图2所示的RNA产生单位,因RNA自我-加工作用,导致能有 效产生siRNA。
[实施例13]制备靶向EGFP mRNA的siRNA文库表达系统
制备靶向EGFP mRNA随机位点的siRNA文库表达系统。图19至23显示 了制备的概要。
(a)制备约20至25bp EGFP cDNA片段
按下述制备“约20至25bp具有去磷酸化平端的随机EGFP cDNA片段”,所 述片段是制备图19-①所示siRNA表达文库的起始物质。图24显示了制备过 程的概要。
通过PCR由pEGFP-N1扩增EGFP编码区,通过用DNase I处理扩增产物获 得约20至25bp随机EGFP cDNA片段。为了大规模制备片段,用Klenow片段 使所得片段成为平端,并亚克隆至通过修饰pUC18而构建的pSwaI载体。该 载体在克隆位点(SwaI识别位点)的上游和下游区域含有限制性酶BseRI的识 别位点,以通过BseRI切下DNA插入物。
用BseRI切下所亚克隆的约20至25bp EGFP cDNA片段。用T4 DNA聚合 酶使得经BseRI裂解后形成的两个核苷酸过度粘端成为平端,然后通过CIAP 处理使两端去磷酸化。上述方法产生了大量具有去磷酸化平端的约20至25bp 随机EGFP cDNA片段。
(b)合成具有靶向EGFP mRNA的siRNA的有义编码DNA和反义编码 DNA的DNA片段
将5’-磷酸化发夹接头1连接至(a)中制备的“约20至25bp具有去磷酸化平 端的EGFP cDNA片段”两端(图19-②)。该发夹接头含有II型限制性酶BspMI 和BsgI的识别位点,使得它们可在连接位点或其附近被裂解。通过使Bst DNA 聚合酶与具有发夹接头的约20至25bp cDNA片段连接产物的连接位点中存 在的Nick位点反应,以进行链置换反应。因此合成了DNA产物,其中约20 至25bp EGFP cDNA片段与发夹接头以1∶1的比例相互连接(图20-③)。接着, 在该产物的平端侧(EGFP cDNA片段侧)连接5’-末端磷酸化DNA接头2(图 20-④)。该DNA接头的一个末端存在AAAAA/TTTTT序列,传递着终止pol III 启动子转录的信号,而另一端存在AscI识别位点。仅有AAAAA/TTTTT侧是 5’-磷酸化的。
将EGFP cDNA、接头1和接头2的连接产物再次与Bst DNA聚合酶反应, 以进行自连接位点处的Nick位点起的链置换反应(图21-⑤)。因此合成了 DNA片段,其中编码siRNA的有义和反义RNA的DNA被串联放置,所述 siRNA靶向EGFP mRNA。在此片段中,有义编码DNA和反义编码DNA之间 存在II型限制性酶BspMI和BsgI的识别位点。
(c)克隆具有编码靶向EGFP mRNA的siRNA的有义和反义RNA的DNA的 DNA片段
用AscI裂解(b)中合成的、具有编码靶向EGFP mRNA的siRNA的有义和 反义RNA的DNA的DNA片段,以制备具有粘端和平端的DNA片段(图21-⑥) 。为了克隆该片段,构建含有人U6启动子的克隆载体(图25)。该启动子的下 游存在限制性酶BspMI、BseRI和AscI的识别位点。用BspMI在紧靠启动子下 游的位置裂解之后,用Klenow使裂解位点成为平端,用AscI裂解产物以制备 具有粘端和平端的克隆载体。将该载体与具有平端和粘端的DNA片段连接, 所述片段具有编码靶向EGFP mRNA的siRNA的有义和反义RNA的DNA,然 后进行克隆(抗-EGFP U6 siRNA表达预-文库)(图22-⑦)。
还构建了含有人tRNA-val启动子的克隆载体(图25)。人tRNA-val启动子 的下游也类似地存在着限制性酶BspMI、BseRI和AscI的识别位点。通过用 BseRI替代BspMI进行裂解来制备该克隆载体。用BseRI在紧靠启动子下游的 位置裂解载体,用T4 DNA聚合酶使裂解位点成为平端,然后用AscI裂解产 物,并按类似的方法进行克隆(抗-EGFP tRNA siRNA预-文库)。
在siRNA有义和反义编码DNA之间的BspMI位点裂解siRNA表达预-文 库质粒DNA(图22-⑧)。用Klenow使裂解片段成为平端并自身-连接以构建抗 -EGFP siRNA表达文库,其中启动子、反义DNA、有义DNA和TTTTT串联连 接(图22-⑨)。序列分析证实产生了合乎需要的产物。表1显示了抗-EGFP U6 siRNA表达文库中编码siRNA的DNA序列的例子。
                         表1
5’-U6启动子-(反义编码DNA)(无环)(有义编码DNA)TTTTTAscI-3’   克隆号     反义编码DNA   环     有义编码DNA   1     GFP 24   无     GFP 24     CCCGTGCCCTGGCCCACCCTCGTG     (SEQ ID NO:39)     CACGAGGGTGGGCCAGGGCACGGG     (SEQ ID NO:40)   2     GFP 24   无     GFP 24     ACCAGGATGGGCACCACCCCGGTG     (SEQ ID NO:41)     CACCGGGGTGGTGCCCATCCTGGT     (SEQ ID NO:42)
在表1中,有些情况下反义密码和有义密码的方向可以与EGFP mRNA中 的相反,这不会影响RNAi诱导。
通过先用BsgI再用BspMI裂解预-文库质粒DNA(图23-⑧-2),用T4 DNA 聚合酶使裂解位点成为平端,然后进行自身-连接,构建出在反义和有义DNA 之间具有siRNA环序列TTCG的siRNA表达文库。通过改变发夹接头1的序列 以及限制性酶的类型和位点,可以随意改变反义和有义编码DNA之间的环序 列,并添加启动子片段、选择标记等。
[实施例14]评价靶向EGFP mRNA的siRNA文库表达系统
通过脂质转染法(Lipofectamine 2000),将上述抗-EGFP U6 siRNA表达文 库(1g)和pEGFP-N1(0.01g)共转染至人HeLa S3细胞。将细胞置于37℃放48小 时,然后在共聚焦显微镜下进行观察。作为对照实验,使用pUC18(1g)替代 siRNA文库表达系统进行类似的操作。
如图26所示,与对照组(pUC18-导入组)相比,在用抗-EGFP U6 siRNA文 库表达系统转导的组中,因pEGFP-N1而发射绿色荧光的细胞数目有所降低。 另外,FACS分析的结果揭示出细胞荧光强度的降低(图27)。这些结果表明: 在细胞中导入抗-EGFP U6 siRNA文库表达系统能诱导RNAi以沉默靶基因。
因此,抗-EGFP U6 siRNA文库表达系统中会存在能诱导RNAi并沉默靶 基因的克隆。
在抗-EGFPtRNA siRNA文库表达系统中获得了类似的结果(图26和27)。
[实施例15]siRNA表达腺病毒载体和HIV载体的基因沉默作用
使用萤光素酶基因(pGL3-Control:Promega)作为评价用的标记基因。使 用人U6启动子串联表达siRNA。靶序列是位点B链: 5′-GTGCGCTGCTGGTGCCAAC-3’(SEQ ID NO:43)。根据Mizuguchi等的方法 制备腺病毒载体(Nippon Rinsho,58,1544-1553(2000))。
1)将RNAi表达盒掺入穿梭质粒
尽管得自Clontech的PShuttle序列中存在3个HincII位点,测序的结果证实: I-CeuI和PI-SceI位点之间仅存在一个HincII位点。
用HindIII裂解表达质粒(pU6i-FGLB)之后,通过Klenow处理使末端成为 平端,然后用EcoRI裂解。将所制备的表达盒(约600bp)掺入已用EcoRI和 HincII处理过的穿梭载体(pShuttle)以构建pU6i-FGLB/Shuttle。
2)将得自pShuttle的表达盒掺入Ad载体质粒并制备Ad载体
根据Mizuguchi等的方法,将RNAi表达盒掺入具有RGD纤维的Ad载体质 粒(pAdHM15-RGD),构建出pU6-FGLB/RGD。
作为对照,用PacI消化不含插入物的pAdHM15-RGD和pU6-FGLB/RGD 之后,使用TransIT293(TaKaRa)进行脂质转染法。根据Mizuguchi等的方法, 由观察到CPE的细胞制备Ad载体。
通过在含有1%BSA的PBS(-)中透析过夜,纯化出通过氯化铯超速离心 法制备的Ad载体。使用Adeno-X Rapid Titer试剂盒(Clontech)测定纯化的Ad 载体的滴度。测定出的各个Ad载体的滴度如下:
RGD/Ad(对照):6.76×10^10ifu/ml
U6-FGLB/Ad:5.27×10^10ifu/ml
3)制备HeLa-S3细胞
制备HeLa-S3细胞至密度为5×105个细胞/ml,并按1ml/孔的量接种于6- 孔培养板的每个孔中。然后,以Moi为1,10,20,50和100的量在每孔中加入每 种Ad载体。24小时之后加入培养基(1.5ml),然后进行脂质转染。
4)对萤光素酶质粒进行脂质转染
转导Ad 24小时之后,用下述各孔组合物中的萤光素酶表达质粒对细胞 进行脂质转染。
在A管中放入Opti-MEM(250μl),在其中加入pGL3-Control(0.02μg)、 pRL-Tk(0.1μg)和pUC19(1.0μg)。在B管中放入Opti-MEM(250μl),在其中加入 LipofectAmine 2000(5μl;Invitrogen),将混合物置于室温下放置5分钟。将B 管全量倒入A管,使混合物彻底混合。将所得混合物置于室温下放置20分钟 之后,全量加入至每孔,37℃保温48小时。
5)萤光素酶测定
使用Dual-Luciferase Reporter Assay System(Promega)进行萤光素酶检测。
脂质转染后培养48小时,然后用(500μl)将培养板中的每个孔洗涤一次。除 去PBS(-)之后,在每个孔中加入1×PLB(500μl),室温下放置15分钟,偶尔振 荡一下培养板以裂解细胞。将细胞裂解物转移至1.5ml管,14000rpm离心1分 钟,将上清液转移至新的1.5ml管(PLB裂解液)。
使用AutoLumatPLUS LB953(Berthold)测定萤光素酶活性。使用PLB裂解 液(101),测定萤火虫萤光素酶和Renilla萤光素酶10秒钟的发光情况。将被 对照RGD/Ad转导的细胞的数值定为100%,基于萤火虫萤光素酶/Renilla萤光 素酶的RLU值来表示各个RNAi表达Ad的相对萤光素酶沉默作用(图29)。
类似地,如图30所示,由表达HIV载体观察到RNAi的萤光素酶抑制作用。
按照与制备siRNA表达腺病毒载体基本上相同的方法,通过将靶向萤火 虫萤光素酶的siRNA表达盒插入HIV穿梭载体制备出siRNA表达HIV载体。在 此试验中,靶序列是位点B链:5′-GTGCGCTGCTGGTGCCAAC-3’(SEQ ID NO:43),使用了U6启动子,表达的RNA具有包括5′-GUGCGCUGCUGGUGCC AACCCgugugcuguccGGGUUGGCACCAGCA GCGCAC(SEQ ID NO:22),5′- GUGCGCUGuUGGUGuCAACCCgugugcuguccGGGUUGGCACCAGCAGCG CAC-3′(SEQ ID NO:23)和5′-GUGCGuUGuUGGUGuuAAuCCgugugcugucc GGGUUGGCACCAGCAGCGCAC-3′(SEQ ID NO:57)的茎-环。将siRNA表达 穿梭质粒导入293T细胞之后,通过标准方法收获病毒颗粒,浓缩,以moi为5 至8的量转染至293T细胞。然后,按照与使用腺病毒载体时类似的方法,在 萤光素酶活性方面检查RNAi作用。
[实施例16]siRNA表达哑铃形载体的基因沉默作用
检查siRNA表达哑铃形载体的基因沉默作用。使用下述siRNA表达载体, 在与上述实施例类似的条件下进行萤光素酶分析。
●使用人U6启动子、表达茎-环siRNA的载体(pU6stem),和
●表达siRNA的哑铃形载体(Dumbbell)
如图31所示,在siRNA表达哑铃形载体中观察到萤光素酶沉默作用,这 表明哑铃形载体中维持的siRNA表达系统表现出有效的基因沉默作用。
工业实用性
如上所述,使用细胞内siRNA表达系统能沉默功能基因的表达。另外, 作为在细胞中导入单个已被转化以维持针对多个靶基因的siRNA表达系统的 载体的结果,多个靶基因的表达也可被沉默。通过使用这种细胞内siRNA表 达系统,可在细胞内部提供siRNA,从而可以进行稳定和长期的siRNA表达, 也即靶基因沉默。另外,通过使用病毒载体等,可以改善siRNA表达系统转 移至细胞的效率,从而在哺乳动物细胞中成功进行RNAi诱导。因此,本发 明的系统能凭借RNAi用于基因治疗和击倒动物的产生。
另外,为了使本发明的系统应用于搜索功能基因的方法,本发明提供了 siRNA文库表达系统及其集合。使用这些系统等可以使搜索功能基因变得简 单而有效,以致于包括siRNA文库表达系统的本发明系统可用于快速阐明功 能基因。
                  序列表
<110>多比良和诚(TAIRA,Kazunari)
     宫岸真(MIYAGISHI,Makoto)
<120>siRNA表达系统和利用该系统制备功能性基因击倒细胞的方法
<130>SEN-A0124-US
<140>
<141>
<150>JP 2001-363385
<151>2001-11-28
<150>PCT/JP02/11293
<151>2002-10-30
<160>57
<170>PatentIn Ver.2.1
<210>1
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>1
gctatgaaac gatatgggc                                     19
<210>2
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>2
gcccatatcg tttcatagc                                       19
<210>3
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>3
gttcgtcaca tctcatctac                                      20
<210>4
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>4
gtagatgaga tgtgacgaa                                       19
<210>5
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>5
gtgcgctgct ggtgccaac                                       19
<210>6
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>6
gttggcacca gcagcgcac                                              19
<210>7
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>7
atgtacacgt tcgtcacat                                              19
<210>8
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>8
atgtgacgaa cgtgtacat                                              19
<210>9
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>9
gtagcgcggt gtattatac                                          19
<210>10
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>10
gtataataca ccgcgctac                                          19
<210>11
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>11
gcuaugaaac gauaugggcu u                                       21
<210>12
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>12
gcccauaucg uuucauagcu u                                       21
<210>13
<211>22
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>13
guucgucaca ucucaucuac uu                                              22
<210>14
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>14
guagaugaga ugugacgaau u                                               21
<210>15
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>15
gugcgcugcu ggugccaacu u                                               21
<210>16
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>16
guuggcacca gcagcgcacu u                                               21
<210>17
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>17
auguacacgu ucgucacauu u                                               21
<210>18
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>18
 augugacgaa cguguacauu u                                              21
<210>19
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>19
guagcgcggu guauuauacu u                                               21
<210>20
<211>21
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>20
guauaauaca ccgcgcuacu u                                               21
<210>21
<211>49
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>21
gtgcgctgct ggtgccaacg ugugcugucc gttggcacca gcagcgcac                 49
<210>22
<211>53
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>22
gugcgcugcu ggugccaacc cgugugcugu ccggguuggc accagcagcg cac            53
<210>23
<211>53
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>23
gugcgcuguu ggugucaacc cgugugcugu ccggguuggc accagcagcg cac            53
<210>24
<211>54
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>24
gugcgcugcu ggugcucaac ccgugugcug uccggguugg caccagcagc gcac           54
<210>25
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(1)..(19)
<223>″n″=碱基a,t,g,或c之一
<400>25
nnnnnnnnnn nnnnnnnnn                                                  19
<210>26
<211>81
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>26
ttcggcaggt ccggtcgacc ctgcacgcgg ccaaggccga aaaggccgcg gccgcaagca     60
ggctcgaccg gacctgccga a                                               81
<210>27
<211>119
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(1)..(19)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(101)..(119)
<223>″n″=碱基a,t,g,或c之一
<400>27
nnnnnnnnnn nnnnnnnnnt tcggcaggtc cggtcgaccc tgcacgcggc caaggccgaa     60
aaggccgcgg ccgcaagcag gctcgaccgg acctgccgaa nnnnnnnnnn nnnnnnnnn      119
<210>28
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>28
ggctcgagaa gcttggcgcg ccgctcttcg cgccaaaaa                            39
<210>29
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>29
tttttggcgc gaagagcggc gcgccaagct tctcgag                              37
<210>30
<211>195
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(39)..(58)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(139)..(158)
<223>″n″=碱基a,t,g,或c之一
<400>30
ggctcgagaa gcttggcgcg ccgctcttcg cgccaaaaan nnnnnnnnnn nnnnnnnntt     60
cggcaggtcc ggtcgaccct gcacgcggcc aaggccgaaa aggccgcggc cgcaagcagg     120
ctcgaccgga cctgccgaan nnnnnnnnnn nnnnnnnntt tttggcgcga agagcggcgc     180
gccaagcttc tcgag                                                      195
<210>31
<211>152
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(39)..(55)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(137)..(152)
<223>″n″=碱基a,t,g,或c之一
<400>31
ggctcgagaa gcttggcgcg ccgctcttcg cgccaaaaan nnnnnnnnnn nnnnnttcgg     60
caggtccggt cgaccctgct tgcggccgcg gccttttcgg ccttggccgc gtgcagggtc     120
gaccggacct gccgaannnn nnnnnnnnnn nn                                   152
<210>32
<211>152
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(1)..(16)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(98)..(113)
<223>″n″=碱基a,t,g,或c之一
<400>32
nnnnnnnnnn nnnnnnttcg gcaggtccgg tcgaccctgc acgcggccaa ggccgaaaag     60
gccgcggccg caagcagggt cgaccggacc tgccgaannn nnnnnnnnnn nnntttttgg     120
cgcgaagagc ggcgcgccaa gcttctcgag cc                                   152
<210>33
<211>142
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(24)..(42)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(124)..(142)
<223>″n″=碱基a,t,g,或c之一
<400>33
cgcgccgctc ttcgcgccaa aaannnnnnn nnnnnnnnnn nnttcggcag gtccggtcga     60
ccctgcttgc ggccgcggcc ttttcggcct tggccgcgtg cagggtcgac cggacctgcc     120
gaannnnnnn nnnnnnnnnn nn                                              142
<210>34
<211>138
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(1)..(19)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(101)..(119)
<223>″n″=碱基a,t,g,或c之一
<400>34
nnnnnnnnnn nnnnnnnnnt tcggcaggtc cggtcgaccc tgcacgcggc caaggccgaa     60
aaggccgcgg ccgcaagcag ggtcgaccgg acctgccgaa nnnnnnnnnn nnnnnnnnnt     120
ttttggcgcg aagagcgg                                                   138
<210>35
<211>43
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(6)..(43)
<223>″n″=碱基a,t,g,或c之一
<400>35
aaaaannnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnn                       43
<210>36
<211>43
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(1)..(38)
<223>″n″=碱基a,t,g,或c之一
<400>36
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnntt ttt                       43
<210>37
<211>47
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(6)..(24)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(29)..(47)
<223>″n″=碱基a,t,g,或c之一
<400>37
aaaaannnnn nnnnnnnnnn nnnncgaann nnnnnnnnnn nnnnnnn                   47
<210>38
<211>47
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<220>
<221>misc_feature
<222>(1)..(19)
<223>″n″=碱基a,t,g,或c之一
<220>
<221>misc_feature
<222>(24)..(42)
<223>″n″=碱基a,t,g,或c之一
<400>38
nnnnnnnnnn nnnnnnnnnt tcgnnnnnnn nnnnnnnnnn nnttttt                  47
<210>39
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>39
cccgtgccct ggcccaccct cgtg                                           24
<210>40
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>40
cacgagggtg ggccagggca cggg                                           24
<210>41
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>41
accaggatgg gcaccacccc ggtg                                           24
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>42
caccggggtg gtgcccatcc tggt                                           24
<210>43
<211>19
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>43
gtgcgctgct ggtgccaac                                                 19
<210>44
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>44
gtgcgctgct ggtgccaacc c                                              21
<210>45
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>45
gtgcgttgtt ggtgttaatc c                                             21
<210>46
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>46
gtgcgctgct ggtgtcaacc c                                             21
<210>47
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>47
gtgcggtggt ggtgggaagc c                                             21
<210>48
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>48
gtgcgttggt ggtggcaacc c                                             21
<210>49
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>49
gtgcgctcat ggtaccaacc c                                             21
<210>50
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>50
gtgcgctgct ggtgtcaacc c                                             21
<210>51
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>51
gtgcgctgtt ggtgtcaacc c                                           21
<210>52
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>52
gtgtgttgtt ggtgtcaatc c                                           21
<210>53
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>53
gtgtgttgtt ggtgttaatt c                                           21
<210>54
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>54
gtgcgttgtt ggtgtttaat cc                                          22
<210>55
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>55
gtgcgctgtc tggtgctcaa ccc                                      23
<210>56
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>56
gtgtcgctgt ctggtgctca actcc                                    25
<210>57
<211>53
<212>RNA
<213>人工序列
<220>
<223>人工序列的描述:人工合成序列
<400>57
gugcguuguu gguguuaauc cgugugcugu ccggguuggc accagcagcg cac     53