改进的表达元件转让专利

申请号 : CN200480003321.1

文献号 : CN1748034B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 史蒂文·杰兰特·威廉姆斯罗伯特·拉克兰·克龙比凯·史蒂文·利平斯基阿利斯泰尔·辛普森·欧文

申请人 : 密理博公司

摘要 :

本发明涉及改进的提供可操作连接的基因在各种组织中高水平表达的遗传元件。尤其是,未甲基化的的片段,小于2kb的CpG岛显示提供增强的转基因表达和在载体构建和克隆容量上具有优势。

权利要求 :

1.分离的多核苷酸,包括

a)延伸的无甲基化CpG岛;

b)可表达的开放阅读框,可操作连接到所述延伸的无甲基化CpG岛;

c)启动子,可操作连接到所述开放阅读框,其中所述启动子并非天然地连接到所述CpG岛;

其特征在于所述的CpG岛包括不超过1.6kb的人HP-1/hnRNPA2基因座的片段,并且其中所述开放阅读框的可重复表达在两种或更多的组织类型中获得。

2.权利要求1的多核苷酸,包括Esp31限制性片段。

3.权利要求2的多核苷酸,包括SEQ ID NO:1所示的图2中核苷酸977到2522的序列。

4.权利要求1到3任一项的多核苷酸,包括不超过1kb的HP-1/hnRNPA2基因座的片段。

5.权利要求4的多核苷酸,包括BspE1-Esp31限制性片段。

6.权利要求5的多核苷酸,包括SEQ ID NO:2所示的图2中核苷酸1536到2522的序列。

7.载体,含权利要求1到6任一项的多核苷酸。

8.权利要求7的载体,其中的载体是游离型载体。

9.权利要求7的载体,其中的载体是整合型载体。

10.权利要求7-9任一项的载体,其中的载体是质粒。

11.权利要求7到10任一项的载体,其中可操作连接的基因是治疗性核酸。

12.权利要求7到11任一项的载体,包括下述的任意项:SEQ IDNOs 1或2、CMV启动子、多克隆位点、多腺苷酸序列和在合适的控制元件下编码选择性标记物的基因。

13.宿主细胞,包括权利要求1到6任一项的多核苷酸,或权利要求7到12任一项的载体。

14.权利要求1到6任一项的多核苷酸、权利要求7到12任一项的载体或权利要求13的宿主细胞在制备用于基因治疗的药物中的应用。

15.药物组合物,与药用赋形剂组合的权利要求1到6任一项的多核苷酸、权利要求7到12任一项的载体或权利要求13的宿主细胞。

16.权利要求1到6任一项的多核苷酸、权利要求7到12任一项的载体或权利要求13的宿主细胞在细胞培养系统中为获得所需基因产物的应用。

17.SEQ ID NOs 1或2的多核苷酸在提高内源性基因表达中的应用,包括在可操作连接内源性基因的位置将多核苷酸插入到细胞的基因组中,从而提高基因的表达水平。

18.权利要求1到6任一项的多核苷酸、权利要求7到12任一项的载体或权利要求13的宿主细胞在获得反义基因序列的表达以失活对应的基因序列中的应用。

19.权利要求1到6任一项的多核苷酸、权利要求7到12任一项的载体的多核苷酸在制备表达文库中的应用。

20.SEQ ID NOs 1或2的多核苷酸在鉴定在非人动物中的可表达基因的方法中的应用,包括将含有多核苷酸的构建体插入到非人动物的胚胎干细胞中,其中所述构建体在插入表达的基因后可以允许进行药物选择。

说明书 :

改进的表达元件

发明领域

[0001] 本发明涉及含改进的,较小的遍在染色质开放元件(UCOE)的多核苷酸。当可操作连接到可表达的核酸序列时,所述元件产生高的和可重复的基因表达水平。本发明还涉及含所述多核苷酸序列的载体,含该载体的宿主细胞和所述多核苷酸、载体或宿主细胞在治疗中的应用,或用于在细胞培养中表达蛋白的应用。
[0002] 发明背景
[0003] 当前的高等真核生物染色质结构模型假定基因组织在“结构域形式”(Dillon,N.& Grosveld,F.染色质结构域作为潜在的真核的基因功能单位,Curr.Opin.Genet.Dev.4,260-264(1994);Higgs,D.R.LCRs开放染色质结构域?Cell 95,299-302(1998))。染色质结构域想象是以浓缩、“闭合的”的,转录沉默状态,或去浓缩的、“开放的”和转录活性的构型存在。特征为DNasel敏感性增加,DNA超甲基化和组蛋白超乙酰化的开放染色质结构的建立,被认为是起始基因表达必须的。
[0004] 染色质区域开放和关闭的性质反映在随机整合到宿主细胞基因组中转基因的行为中。当整合在小鼠基因组不同的位置时,相同的构造产生不同的组织特异性和发育阶段特异性表达模式(Palmiter,R.D.&Brinster,R.L.Ann.Ref.Genet.20,465-499(1986);Allen,N.D.et al.Nature 333,852-855(1988);Bonnerot,C.,Grimber,G.,Briand,P.&;Nicolas,J.F.Proc.Natl.Acad.Sci.USA 87:6331-6335(1990))。
[0005] 在给定的转基因的小鼠组织内还经常地观察到花斑表达模式,通称是位置效应花斑(PEV)(Kioussis,D.&Festenstein,R.Curr.Opin.Genet.Dev.7,614-619(1997))。当外源的基因被整合到体外培养的哺乳动物细胞染色体中时,许多整合事件引起转基因迅速沉默,其余的引起表达水平的较大改变(Pikaart,M.J.,Recillas-Targa,F.& Felsenfield,G.Genes Dev.12,2852-2862(1998);Fussenegger M.,Bailey,J.E.,Hauser,H.&;Mueller,P.P Trends Biotech.17,35-42(1999))。这些位置效应使转基因表达效率降低,显示其基础研究和生物技术的应用潜力。
[0006] 基因组织的染色质结构域模型表明能建立和维持能转录活性的开放染色质结构的遗传控制元件应该与基因组的活性区域有关。
[0007] 基因座控制区域(LCRs)是一类具有远程染色质改造能力的转录调控元件。在转基因小鼠LCRs通过它们在顺式连接的基因上特别是单拷贝转基因上,整合位点不依赖的,转基因拷贝数依赖的、生理水平的表达的能力而以功能方式定义的,Fraser,P.& Grosveld,F.Curr.Opin.Cell Biol.10,361-365(1998);Li,Q.,Harju,S.& amp;Peterson,K.R.Trends Genet.15:403-408(1999)。重要的是,这种表达是组织特异的。LCRs能够阻碍异染色质的散布,防止PEV(Kioussis,D.&Festenstein,R.Curr.Opin.Genet.Dev.7,614-619(1997)),并由一系列位于它们调节的基因的5′或3’的DNase I超敏(HS)位点组成(Li,Q.,Harju,S.&Peterson,K.R.Trends Genet.15:403-408(1999))。
[0008] LCRs表现为由两个单独的,尽管不一定独立的组分组成。首先,建立“开放染色质结构域”,其次,显著的翻译活化能力产生转基因拷贝数依赖性的表达(Fraser,P.&Grosveld,F.Curr.Opin.Cell Biol.10,361-365(1998)。LCRs发挥其功能的分子机制仍然是争论的问题(Higgs,D.R.Cell 95,299-302(1998);Bμlger,M.& Groudine,M.GenesDev.13,2465-2477(1999);Grosveld F.Curr.Opin.Genet Dev.9152-157(1999);Bender,M.A.,Bμlger,M.,Close,J.&;Groudine,M..Mol.Cell 5,387-393(2000)。
[0009] 生产高水平治疗蛋白产品的哺乳动物细胞系的增殖是主要的发展中行业。染色质位置效应使之成为困难的、既费时又费钱的过程。最通常使用的生产这种哺乳动物“细胞工厂”的方法依赖于通过抗药性基因的组合诱导的基因扩增(例如,DHFR、谷氨酰胺合成酶(Kaufman RJ.酶学方法185,537-566(1990)),并维持严格的选择压力。通过利用含来自高表达基因结构域的LCRs的载体,使用来自合适组织的细胞,大大地简化所述方法,产生大比例的显示高水平表达的克隆细胞系(Needham M,Gooding C,Hudson K,Antoniou M,Grosfeld F和Hollis M.Nucleic Acids Res 20,997-1003(1992);Needham M,Egerton M,MillestA,Evans S,Popplewell M,Cerillo G,McPheat J,Monk A,Jack A,Johnstone D和Hollis M.Protein Expr Purif6,124-131(1995)。
[0010] 然而,LCRs的组织特异性,尽管在一些环境下有用,仍然是很多应用的控制因素,例如需要进行表达的组织中已知没有LCR,或要求在许多或全部组织中表达。
[0011] 此处引入作为参考的我们的在审专利申请PCT/GB99/02357(WO00/05393),US09/358082,GB 0022995.5和US 60/252,048,描述了在它们的天然染色体环境中负责建立开放染色质结构域的元件,所述开放染色质结构域跨越仅由遍在表达的管家基因组成的位点。这些元件不是来自LCR,并包括延伸的无甲基化CpG岛。我们使用术语遍在的染色质开放元件(UCOE)以描述这种元件。
[0012] 在哺乳动物DNA中,二核苷酸CpG通过将胞嘧啶甲基化为5-甲基胞嘧啶的DNA甲基转移酶而进行鉴定。然而,5-甲基胞嘧啶是不稳定的,并被转化为胸腺嘧啶。结果,CpG二核苷酸的产生频率比随机出现的机率少得多。然而基因组DNA的一些区域具有接近于期待频率的CpG,并且这些序列被称为“CpG岛”。此处使用的“CpG岛”被定义为至少200bp的DNA序列,其具有至少50%的GC含量和观察的/期望的CpG含量比例至少为0.6(即CpG二核苷酸含量为随机期望值的至少60%)(Gardiner-Green M和Frommer M.J Mol Biol196,261-282(1987);Rice P,Longden I和Bleasby A Trends Genet 16,276-277(2000)。
[0013] 无甲基化CpG岛是现有技术公知的(Bird等(1985)Cell 40:91-99,Tazi和Bird(1990)Cell 60:909-920),并且当显著比例的胞嘧啶残基没有甲基化时,可以定义为CpG岛,并且其通常延伸超过两个紧密间距的(0.1-3kb)背驰转录的基因的5′末端。DNA的这些区域被报道在所有组织中在整个发育阶段保持超甲基化(Wise和Pravtcheva(1999)Genomics 60:258-271)。它们经常与遍在表达基因的5’末端有关,而且估计40%的基因显示组织限制性表达谱(Antequera,F.&Bird,A.Proc.Natl.Acad.Sci.USA 90,1195-11999(1993);Cross,S.H.&Bird,A.P.Curr.Opin,Genet.Dev.5,309-314(1995),并已知是活性染色质的定位区域(Tazi,J.&Bird,A.Cell,60,909-920(1990)。
[0014] ‘延伸′的无甲基化CpG岛是跨越包含超过一个转录起始位点的区域和/或跨越超过300bp并优选超过500bp的无甲基化CpG岛。延伸的无甲基化CpG岛的边界通过在该区域使用PCR,协同使用具有在识别序列消化(切割)DNA的能力对出现的任何CpG残基的甲基化状态敏感的限制性内切酶而进行功能限定。一个这样的酶是Hpa ll,其识别并消化通常在CpG岛内存在的CCGG位点,但只有在中央的CG残基没有甲基化的情况下进行。因此,用Hpall消化的DNA以及包含Hpall位点的区域进行的PCR,如果DNA是未甲基化的则由于Hpall消化不产生扩增产物。PCR将只在DNA是甲基化的情况下产生扩增产物。因此,在Hpall不消化DNA的无甲基化区域外可以观察到PCR扩增产物,从而定义了″延伸的无甲基化CpG岛″的边界。
[0015] 我们已经证实(WO 00/05393)横跨包含来自人TATA结合蛋白(TBP)/蛋白体组Hsγ分-B1(PSMBI)和核不均-核糖核蛋白A2/B1(hnRNPA2)/异染色质蛋白1Hsy(HP1 )基因座的异源二联背驰转录启动子的无甲基化CpG岛的区域,产生可重复的、生理水平的基因表达,而且能够阻止通常发生在中央异染色质内转基因整合作用的花斑表达模式和沉默。
[0016] 此处使用的术语″可重复的表达″指本发明的多核苷酸不管其染色质环境直接在基本上地相同的表达水平表达可表达的基因,优选不管本发明的多核苷酸的细胞类型或组织类型。本领域技术人员将识别获得基本上地相同水平的可操作连接的可表达基因的表达,而不管权利要求的多核苷酸染色质环境,和优选不管细胞类型,假定所述细胞能够主动表达基因。
[0017] 我们已经显示(WO 00/05393)与主动转录的启动子有关的无甲基化的CpG岛具有改造染色质的能力,并从而认为是建立和维持管家基因座的开放结构域的根本的决定因素。
[0018] UCOEs通过改善转基因表达的水平和稳定性使多产基因递送事件的比例增加。这具有重要的研究和生物技术应用,包括制备转基因动物和在培养的细胞中生产重组蛋白产物。我们已经显示(WO 00/05393)UCOEs对CMV-EGFP报道基因构建体和分泌的有药用价值的促红细胞生成素蛋白表达的有利效果。UCOEs的性质还表明在基因治疗中的实用性,其有效性由于低频率的多产基因递送和表达水平和持续时间不充分而经常受到限制(Verma,I.M.& Somia,N.Nature389:239-242(1997)。
[0019] 我们上述的申请PCT/GB99/02357(WO 00/05393)公开了大约4.0kb的功能性UCOE片段,尤其是图21的4102到8286的核苷酸定义的‘5.5RNP′片段(公开于p11,第6和7行)。同一申请公开了‘1.5kbRNP’片段(图22和29,出处描述于p51,第1到5行)。然而,该片段实际上是上述‘5.5RNP’片段的2165bp的BamH1-Tth111I片段,由该申请的4102到6267位核苷酸组成。
[0020] 在另外的申请(WO 02/24930)中,我们公开了人工构建的包括天然存在的CpG岛片段的UCOEs。公开的片段比当前的申请中要求的片段大,并且在当时认为不可能单独使用小的片段,而不仅仅是作为合成或‘混合的’UCOE构建物的组分。
[0021] 即使存在这些显著的暗示和范围较宽的应用,还是有进一步优化转基因表达水平的需要。有需要进一步的优选转基因表达的水平,特别在体内基因治疗领域和体外生产重组蛋白领域。
[0022] 一个特别的需要是降低用于增强基因表达的元件的大小。这样一来,可以生产更小的载体,或能稳定地容纳和表达较大的插入物的载体。
[0023] 发明简述
[0024] 本发明的一个目的是提供小的染色质开放元件以增强可操作连接的转基因的水平和可重复性。
[0025] 根据本发明,提供了包括小的功能UCOEs片段的多核苷酸。这种多核苷酸包括不超过大约2kb无甲基化CpG岛,或大于这种岛不超过大约2kb的片段。
[0026] 尽管包括延长的无甲基化CpG岛的大多核苷酸是现有技术已知的(参见申请人自己以前的申请WO 00/05393),以前没有确定是否有可能使用明显小的片段并仍然维持由大UCOEs/无甲基化CpG岛获得的表达水平和一致性的增强。
[0027] 此处使用的术语″可操作连接″指本发明的多核苷酸元件之间可操作性的关系。″可操作连接″是本领域技术人员公知的术语,描述了顺式作用DNA序列之间的功能关系。准确的结构关系可以是或不是有关联的,并且不同的元件类型不同。至于启动子,其暗示位于与其驱动的开放阅读框5′基本上相邻的(通常在小于100bp之内)的位置。就延伸的无甲基化CpG岛来说,看来对染色质结构的局部作用负责提高基因表达的水平和一致性。举例来说,包括延伸的无甲基化CpG岛的元件被置于与控制可表达基因转录的启动子的紧邻5′端。然而,“可操作连接”包含其被置于其他地方的可能性,只要可以显示明确的功能效果。
[0028] 本发明提供了分离的多核苷酸,其包括
[0029] a)延伸的无甲基化CpG岛;
[0030] b)可表达的开放阅读框,可操作连接到所述延伸的无甲基化CpG岛;
[0031] c)启动子,可操作连接到所述开放阅读框,其中所述的启动子不天然地连接到所述的CpG岛;
[0032] 其特征在于所述的CpG岛大小不超过2kb并且其中在两个组织类型中获得所述开放阅读框的可重复表达。
[0033] 或者,多核苷酸包括人hnRNP A2基因不超过2kb的片段,优选不超过1.6kb,包括1546bp的Esp31限制性片断,更优选图2的序列,977到2522的核苷酸(SEQ ID NO:1),或其功能类似物。优选地,所述的片段定向为正向。
[0034] ‘功能同系物’指能够在严格条件下杂交到所述公开的序列的多核苷酸序列,并且其具有类似的实现可操作连接的可表达的开放阅读框在两个或更多组织中可重复表达的性质。严格的杂交/洗涤条件是现有技术已知的。例如,在0.1x SSC,0.1%SDS在60℃洗涤后稳定的核酸杂交物。如果核酸序列已知,计算最佳杂交条件是本领域公知的。例如,杂交条件可以根据待杂交的核酸GC含量来决定。参见Sambrook等(1989),分子克隆;实验室方法。通用的计算在指定相似性的核酸分子之间获得杂交需要的严格条件的公式是:
[0035] Tm=81.5℃+16.6Log[Na+]+0.41[%G+C]-0.63(%甲酰胺)
[0036] 优选本发明的多核苷酸促进可操作连接的基因非组织特异性地可重复表达。
[0037] 在另外的优选方案中,多核苷酸包括人hnRNP A2基因不超过大约1kb的片段,优选包括987bp的BspE1-Esp31限制性片断,更优选包括图2的序列,1536到2522的核苷酸(SEQ ID NO:2)。
[0038] 优选地,本发明的多核苷酸包括一个或多个天然存在的启动子。
[0039] 优选地,本发明的多核苷酸包括二联或双向的背驰转录的启动子。在其它实施方案中,本发明的多核苷酸包括β-肌动蛋白CpG岛/启动子区域的片段,优选来自于人。更优选本发明的多核苷酸包括100bp到2kb范围内跨越人β-肌动蛋白CpG岛/启动子区域的DNA片段。
[0040] 在另外任选的实施方案中,本发明的多核苷酸包括PDCD2CpG岛/启动子区域的片段,优选来自于人。更优选地,本发明的多核苷酸包括100bp到2kb范围内跨越人PDCD2CpG岛/启动子区域的DNA片段。
[0041] 优选地,本发明的多核苷酸包括100bp到1.9kb范围内跨越人β-肌动蛋白CpG岛/启动子区域的DNA片段和100bp到2kb范围内跨越人PDCD2CpG岛/启动子区域的DNA片段。优选地,所述的片段与它们的背驰方向的启动子直接相邻。
[0042] 另一个方面,本发明提供提供了包括上述公开的本发明的多核苷酸的载体。优选地,所述的载体是经调整用于真核基因表达的表达载体。
[0043] 一般地所述的调整包括,例如但不限于,供给介导细胞/组织特异性表达的转录控制序列(启动子序列)。
[0044] 启动子和增强子是本领域公知的术语,包括下列提供举例而不是作为限制的特征。启动子是5′,顺式作用的调控序列,直接连接到转录起始。启动子元件包括所谓的TATA盒和用于选择转录起始位置的RNA聚合酶起始选择(RIS)序列。这些序列还结合用于RNA聚合酶促进转录起始选择的多肽。
[0045] 优选地,启动子选自CMV、EF-1α、劳氏肉瘤病毒(RSV)LTR、或HIV2LTR或从其衍生的组合序列。更优选地,启动子是CMV立即/早期启动子。最优选其是小鼠CMV立即/早期启动子。
[0046] 在最优选载体的实施方案中,本发明的CpG岛位于与控制可表达的开放阅读框的表达的操作启动子相邻及5′端。
[0047] 增强子元件是顺式作用核酸序列,经常被发现在基因转录起始位点5′(增强子还可以被发现在基因序列的3′乃至位于内含子序列和因此是位置独立的)。增强子的作用是提高连接到增强子的基因的转录比率。增强子活性对应于反式作用的转录因子(多肽),其已经显示特异性结合到增强子元件上。转录因子的结合/活性对应于许多环境的因素,其包括例如但不限于,中间代谢产物(例如葡萄糖)、环境效应器(例如加热)。(参见真核转录因子,David S Latchman,Academic Press Ltd,SanDiego)。
[0048] 调整还包括供给可选标记物和自主复制序列,两者都促进所述的载体在真核细胞或者原核宿主中的维持。自主维持的载体称为游离型载体。游离型载体由于它们自我复制并且不需要整合而能持续所以是合乎需要的。这类游离型载体描述于W098/07876。
[0049] 促进编码基因的载体表达的调整包括供给转录终止/多腺苷酸序列。这还包括供给内部核糖体进入位点(IRES),其作用于使在双顺式或多顺式表达盒中排列的载体编码的基因表达最大化。
[0050] 这些调整是现有技术已知的。通常有大量关于表达载体构建和重组DNA方法的发表的文献。请参见,Sambrook等(1989)分子克隆:实验指南,Cold Spring Harbour,NY和其中的参考文献;Marston,F(1987)DNA克隆技术:实用方法Vol III IRL Press,Oxford UK;DNA Cloning:FM Ausubel等,分子生物学最新手册,John Wiley & Sons,Inc,(1994)。
[0051] 所述载体可以是游离型载体或整合型载体。优选地,该载体是质粒。或者,载体可以是病毒,例如腺病毒,腺病毒相关病毒,疱疹病毒,痘苗病毒,慢病毒或其他的逆转录病毒。
[0052] 优选所述载体包括可操作连接的基因,其是治疗性核酸。这种治疗性核酸可以通过替换或补充导致疾病的缺陷基因的功能而起作用,所述疾病例如囊性纤维化、地中海贫血、镰刀贫血症、Fanconi氏贫血症、血友病、严重联合免疫缺陷(SCID)、苯丙酮酸尿症(PKU)、α-1抗胰蛋白酶缺乏、Duchenne肌肉萎缩、鸟氨酸转氨甲酰酶不足或成骨不全。或者,它可以编码选择性地在靶细胞例如恶性癌细胞中表达细胞毒性试剂或前体药物转化酶,以杀死所述细胞。这种应用,和许多其它应用,是本领域技术人员公知的,并且所述本领域技术人员清楚本发明增强治疗性核酸表达的关联性。
[0053] 最优选所述载体包括SEQ ID Nos 1或2,CMV启动子,多克隆位点,多腺苷酸序列和编码适合的控制元件控制的选择性标记物的基因中的任意一种。
[0054] 还提供转染有载体的宿主细胞。优选是真核细胞,更优选哺乳动物细胞,最优选人或啮齿动物细胞。
[0055] 或者,可能是植物细胞。
[0056] 本发明的另一个方面是任何分离的多核苷酸、无甲基化延伸的CpG岛(特别地SEQ ID Nos 1或2公开的)、上述治疗公开的载体或宿主细胞在治疗尤其是在基因治疗中的应用。
[0057] 本发明还提供了多核苷酸、载体或宿主细胞在制备用于基因治疗的药物或组合物中的应用。
[0058] 本发明还提供了治疗方法,包括对需要这种治疗的患者施用有效剂量的所述本发明的多核苷酸、载体或宿主细胞。优选患者患可以通过基因治疗的疾病。
[0059] 本发明还提供了药物组合物,其包括多核苷酸和/或载体和/或宿主细胞,任选地与药用载体或稀释剂混合用于治疗疾病或提供具有有益的蛋白或功能的特定组织的细胞。
[0060] 本发明的多核苷酸、载体或宿主细胞或药物组合物可以以如下途径给药,包括全身肌内、静脉内、气雾剂、口的(固体或液体)、局部、眼部、直肠、腹膜内和/或鞘内和局部的直接注射。
[0061] 准确的剂量方式将,当然,需要由具体患者的具体临床医生决定,而这,反过来根据所需的基因表达的蛋白和作为治疗靶的组织类型的确切性质而控制。
[0062] 剂量还取决于疾病指症和给药途径。剂量的数目取决于疾病,和来自临床试验的功效数据。
[0063] 根据本发明递送用于有效的基因治疗的多核苷酸或载体DNA的量优选在50ng-1000μg载体DNA/kg体重的范围之内;更优选在大约1-100μg载体DNA/kg的范围内。
[0064] 尽管根据本发明优选施用多核苷酸、载体或宿主细胞到哺乳动物用于体内细胞吸收,可以利用离体方法,借此将细胞从动物中取出,用多核苷酸或载体转导,然后重植入到所述动物。肝脏,例如可以采用离体方法通过从动物取出肝细胞,体外转导肝细胞和重植入转导的肝细胞到动物中(如Chowdhury等,Science 254:1802-1805,1991描述用于兔子,或Wilson,Hμm.Gene Ther.3:179-222,1992描述用于人)进行评价。这种方法还可以有效在循环系统或淋巴系统中递送不同的细胞群体,例如红血球、T细胞、B细胞和造血干细胞。
[0065] 在另外的方面,本发明提供了本发明的多核苷酸载体或宿主细胞在细胞培养系统中的应用以获得所需的基因产物。优选地,可表达的核酸编码用于在体外细胞培养系统中表达的重组蛋白。
[0066] 适合的细胞培养系统是现有技术已知的,并在本领域技术人员知道的文献中有完整的描述。本发明提供了生产本发明的多肽的方法,包括:
[0067] i)提供转化/转染有本发明的多核苷酸的细胞;
[0068] ii)在有助于生产所述多肽的情况下培养所述细胞;以及
[0069] iii)从所述的细胞或其生长环境纯化所述多肽。
[0070] 或者,可表达的基因编码非-多肽产物,例如RNA。这种RNA可以是能够在翻译后水平抑制特定基因表达的反义RNA,或可以是酶促(核糖酶)或其他的功能,例如核蛋白体RNA的功能。
[0071] 还提供了根据SEQ ID NOs:1或2之一的延伸的无甲基化CpG岛多核苷酸用于提高内源基因表达的应用,包括将所述多核苷酸插入到细胞的基因组中与内源基因可操作相连的位置从而提高基因的表达水平。
[0072] 在本发明的另一个实施方案中,提供了包含任何本发明的多核苷酸或载体或任何本发明的延伸的无甲基化CpG岛的非人转基因的动物,其中所述的CpG岛已经被人工地引入。制备转基因小鼠(Gordon等,Proc.Natl.Acad.Sci.USA 77:7380(1980);Harbers等,Nature293:540(1981);Wagner等.,Proc.Natl.Acad.Sci.USA 78:5016(1981);和Wagner等,Proc.Natl.Acad.Sci.USA 78:6376(1981),绵羊,猪,鸡(参见Hammer等.,Nature315:680(1985))等的方法是现有技术已知的并且构思用于本发明。
[0073] 这种包含本发明的多核苷酸转基因动物还可以被用来长期生产所需的蛋白。
[0074] 本发明还提供了使用本发明的多核苷酸、载体或宿主细胞确定基因治疗的功效的哺乳动物模型。哺乳动物模型包括其细胞含有本发明的载体的转基因动物。这种动物可供在进行人体临床试验前进行测试。
[0075] 本发明还提供了本发明的多核苷酸和延伸的无甲基化CpG岛在生产转基因植物中的应用。
[0076] 产量增加、或对疾病、害虫、干旱或盐的抗性提高的转基因植物的生产是本领域技术人员已知的。本发明还提供了包括含有本发明的多核苷酸的细胞的转基因植物。一些或所有包括本发明的多核苷酸细胞可以来自于植物。
[0077] 本发明还涉及本发明的多核苷酸、载体或延伸的无甲基化CpG岛在功能基因组学中的应用。功能基因组学主要地涉及特异性地在特定的细胞类型或疾病状态中表达的基因的鉴定,并且目前提供了具有潜在的药物发现或基因治疗目的价值的数以千计的新基因序列。使用这种信息开发新疗法的主要问题在于如何确定这些基因的功能。本发明的多肽可被用于多种功能基因组应用中以确定基因序列的功能。本发明的功能基因组应用包括,但不限制于:
[0078] (1)使用本发明的多核苷酸获得基因序列的反义序列或核酶knockdown文库的持续表达,从而确定基因失活对细胞表型的效果。
[0079] (2)使用本发明的多核苷酸制备基因序列的表达文库,使递送到细胞内产生所述基因序列的可靠的、可重复的、持续表达。得到的表达所述基因序列的细胞可被用于多种功能鉴定和药物发现的方法。例如,制备基因产物的中和抗体;快速纯化基因本身的蛋白产物用于结构、功能或药物筛选的研究;或用于基于细胞的药物筛选。
[0080] (3)使用本发明的多核苷酸用于小鼠胚胎干细胞(ES)和转基因小鼠的方法中。最强大的功能基因组方法之一包括向小鼠ES细胞基因内随机插入构建体,所述构建体只在插入到表达的基因内以后才允许药物选择,并且其可以容易地克隆出来用于测序(G.Hicks等,Nature Genetics,16,338-334)。具有基因敲除突变和新序列的转基因小鼠能因此容易地用于研究其功能。目前该技术对小鼠ES细胞中良好表达的10%小鼠基因是有用的。掺入本发明的多核苷酸到整合的构建体中将使这些方法扩展到鉴定小鼠表达的全部基因。
[0081] 发明详述
[0082] 本发明目前只参考下面的附图举例进行描述,其中;
[0083] 图1显示表明BamH1、HindIII、Esp31、Tth1111和BspEI限制性位点定义不同的4、2、1.5和1kb CpG岛片段的HP-1/hnRNPA2基因座的图谱。
[0084] 图2显示表明BamH1、Esp31、BspE1和Tth111I限制性位点的HP-1/hnRNPA2基因座的核苷酸序列。
[0085] 图3显示可操作连接到4kb和1.5kb(在两个方向)CpG岛片段的EGFP报告基因的表达。FACScan数据表示为经过71天的荧光中值。
[0086] 图4显示可操作连接到4kb和1.5kb(在两个方向)CpG岛片段的EGFP报告基因的表达。FACScan数据表示为经过71天的阳性细胞%。
[0087] 图5显示可操作连接到4kb、1.5kb和1kb CpG岛片段的EGFP报告基因的表达。FACScan数据表示为经过68天的荧光中值。
[0088] 图6显示可操作连接到4kb、1.5kb和1kb CpG岛片段的EGFP报告基因的表达。FACScan数据表示为经过68天的阳性细胞%。
[0089] 图7 显 示 两 个 腺 病 毒 构 建 体 Ad.CMV-Luc-SV40p(A) 和 Ad.1.5kb(F)UCOE-CMV-Luc-SV40p(A)的结构,其基于腺病毒血清型5。荧光素酶表达盒被以从左到右的方向插入E1区中。E1和E3区被从病毒上删除。由于E1的删除,病毒是复制缺陷性的。CMV(巨细胞病毒)是人CMV增强子/启动子。SV40p(A)是来自pGL3basic(Promega)的SV40病毒晚期多腺苷酸信号。
[0090] 图8显示了1.5kb UCOE当通过腺病毒载体递送后在HeLa细胞中提高基因表达。HeLa细胞以MOI50在200μl感染介质中用Ad.CMV-Luc-SV40p(A)和Ad.1.5kb(F)UCOE-CMV-Luc-SV40p(A)病毒感染2-3小时(正常HeLa介质只包含1%FCS)。在孵育后添加2ml完全培养基,并将细胞接种在6孔板中。在感染2天后分析荧光素酶活性。显示三个独立实验的结果。实验进行三次重复。显示为平均值+/-标准差。
[0091] 图9显示了1.5kb UCOE效果与病毒的制备无关。HeLa细胞以MOI50在200μl的感染介质(正常Hela介质只包含1%FCS)中用来自两个独立的病毒制剂的病毒Ad.CMV-Luc-SV40p(A)和Ad.1.5kb(F)UCOE-CMV-Luc-SV40p(A)分别感染2-3小时。在孵育之后添加2ml完全培养基,然后将细胞接种在6孔板中。在感染2天后分析荧光素酶活性。显示一个典型的实验的结果。实验进行三次重复。
[0092] 图10显示1.5kb UCOE提高逆转录病毒转导的CHO-K1集合体中转基因表达水平和稳定性。(A)FACS分选的CHO-K1集合体(最初FACS分选的36,000细胞)在逆转录病毒转导CMV和1.5UCOE-CMV构建体后的平均GFP值与时间的关系。第一天指测量的第一天(FACS分选后8天)。(B)FACS分选的CHO-K1集合体各测量时间点的柱状图。
[0093] 图11显示在低MOI感染之后转导的CHO-K1(集合体I)的GFP表达。(A)GFP阳性(M1)CHO-K1群在逆转录病毒转导后各时间点的平均GFP值。CMV群从3.19%GFP阳性细胞开始而1.5UCOE-CMV群从4.99%GFP阳性细胞开始。(B)细胞群在各时间点的柱状图。
[0094] 图12显示在中等MOI感染后转导的CHO-K11(集合体II)的GFP表达。(A)GFP阳性(M1)CHO-K1群在逆转录病毒转导后各时间点的平均GFP值。CMV群从25.2%GFP阳性细胞开始而1.5UCOE-CMV群从14.35%GFP阳性细胞开始。(B)细胞群在各时间点的柱状图。
[0095] 图13显示1.5kb UCOE提高逆转录病毒转导的HeLa集合体中转基因表达水平和稳定性。(A)FACS分选的HeLa集合体(最初FACS分选的10,000细胞)在逆转录病毒转导CMV和1.5UCOE-CMV构建体后的平均GFP值与时间的关系。第一天指测量的第一天(FACS分选后5天)。(B)FACS分选的HeLa集合体在各测量时间点的柱状图。
[0096] 图14显示1.5kbUCOE提高在逆转录病毒转导的HeLa细胞克隆中和之间GFP表达的一致性。FACS分选的HeLa克隆被扩大为6孔大小并分析GFP表达。(A-C)所有CMV克隆的柱状图。(D-E)所有1.5UCOE-CMV克隆的柱状图。
[0097] 图15显示1.5kb UCOE降低HeLa细胞克隆中GFP表达的变异系数(CV)。显示图5的全部的逆转录病毒转导的和FACS分选的HeLa克隆的平均值的平均CV值(+/-SD)。1.5UCOE-CMV克隆的CV和它的标准差(SD)与CMV克隆相比显著地降低。
[0098] 实施例
[0099] 实施例1A 1.5kb HP-1/hnRNP A2UCOE增强表达
[0100] 材料和方法
[0101] 载体的构建
[0102] 如我们的在先申请WO 00/05393中所描述,载体CET20通过将人HP-1/hnRNP A2基因座的8.3kb的HindIII片段(其包含HP1/RNP启动子和延伸的CpG岛)克隆到到pBluescript中(Stratagene)而产生。
[0103] 插入的4186bp(称为4kb)片段然后通过BamH1和HindIII消化除去。这些片段使用T4DNA聚合酶补平末端,并连接到已经用Asel消化的pEGFPN-1中(Clontech)并再次使用T4DNA聚合酶补平末端。然后分离具有两个方向的片段的克隆。
[0104] 1546bp的Esp31(BsmBI的同裂酶)片段(称为1.5kb片段)被再次通过Esp31(BsmBI)消化从CET20中分离,随后补平末端,然后将这些连接到如上所述的pEGFPN-1的Asel位点,鉴定两个方向片段的克隆(“正”向与RNPA2启动子具有与转录EGFP转基因的相邻下游操作CMV启动子相同的5′到3′方向。)
[0105] 转染
[0106] 根据标准方法转染CHO-K1细胞被在G418中选择,如此处引入参考的未决申请的描述。
[0107] GFP表达分析
[0108] 转染细胞培养在600μg/ml G418选择培养基中。细胞用标准磷酸盐缓冲盐水洗涤并根据标准方法用胰蛋白酶/EDTA与基质剥离。添加过量的营养混合物F12(HAM)培养基(Gibco),并将细胞转入5ml圆底聚苯乙烯试管用于Becton Dickinson FACScan分析。检测GFP荧光并与亲本细胞群的自身荧光比较。细胞群体中的表达既可以表示为相对于对照(根据标准方法)在图中线性标度的任意单位组的荧光中值,也可以表示为鉴定为阳性表达子的细胞的%。
[0109] 结果
[0110] 如图3所示,从荧光中值角度,与对照相比当1.5kb片段正向插入时表达显著增强(大约10倍,持续至少70天),4kb片段时观察到增强大约60%。在图5显示的实验中,由正向1.5kb片段的表达可与用4kb片段获得的表达相当。然而,相反方向表现为从荧光中值角度较少有效,如图3所示。
[0111] 图4显示两个方向从阳性细胞%角度是相当的。然而,这些数据显示片段也许具有一定程度的方向性而且,对大多数情况而言,正向是优选的。
[0112] 实施例2A 1kb HP-1/hnRNP A2UCOE增强表达
[0113] 材料和方法
[0114] 载体的构建
[0115] 含1kb UCOE的载体通过用PciI和BspEI消化正向具有1.5kbEsp31片段的pEGFPN-1载体除去5′500bp,之以补平和重连接。这产生只在一个方向具有987bp BspE1-Esp31片段的载体。
[0116] 结果
[0117] 所述正向1kb(987bp)片段表现为可与正向1.5kb片段的荧光中值(图5)和阳性细胞%(图6)相当
[0118] 实施例3A 1.5kb HP-1/hnRNP A2UCOE增强腺病毒编码的构建体中的表达[0119] 材料和方法
[0120] 细胞培养
[0121] HeLa获自ATCC(Manassas,弗吉尼亚)。PER.C6获自Crucell,(Leiden,荷兰)。全部购买的细胞系如厂商推荐的方法培养。911细胞由L.S.Young教授(Cancer Research UK Institute for Cancer Studies,伯明翰大学,伯明翰,英国)惠赠,并在含抗生素的DMEM/10%FCS中培养。
[0122] 质粒构建
[0123] PGL3basic获自Promega(Madison,WI,美国)并在多克隆位点下游包含荧光素酶-SV40p(A)盒。人CMV增强子/启动子(0.9kb)被克隆到Smal消化的pGL3basic中制备pGL3/CMV-Luc-SV40p(A)。为制备pGL3/1.5kb(F)UCOE-CMV-SV40p(A),将1.5kb UCOE Esp3I片段(参见图1和2)用T4DNA聚合酶进行平末端化(NEB,Beverly,MA,USA)然后连接到NheI消化的和T4平末端化的pGL3basic/CMV-Luc中。
[0124] 病毒载体构建
[0125] 为 构 建 pPS1128/CMV-Luc-SV40p(A) 和 pPS1128/1.5kb(F)UCOE-CMV-Luc-SV40p(A),表达盒通过PvuI/NheI/BamHI的消化从pGL3/CMV-Luc-SV40p(A)中切除并通过KpnI/BamHI的消化从pGL3/1.5kb(F)UCOE-CMV-Luc-SV40p(A)中切除,两个表达盒然后被平末端化和克隆到SpeI消化的和平末端化的pPS1128中(Djeha等,Cancer Gene Therapy 2000:721-731)。质粒通过限制性酶消化进行分析。
[0126] 病毒Ad.CMV-Luc-SV40p(A)和Ad.1.5kb(F)UCOE-CMV-Luc-SV40p(A)通过在PER.C6中分别使用pPS1128/CMV-Luc-SV40p(A)和pPS1128/1.5kb(F)UCOE-CMV-Luc-SV40p(A)和重叠腺病毒骨架载体pPS1160同源重组而构建(Djeha等,癌症基因治疗2000:721-731),放大和CsCI纯化和滴度测定如别处的描述(Lipinski等,Gene Therapy,8,
2001:274-281)。
[0127] 病毒感染和荧光素酶活性分析
[0128] HeLa细胞(每6孔5.0×104)用含有相应的病毒的200μl感染介质悬液(含抗生素的EMEM/1%FCS)感染2-3小时。然后添加1ml完全培养基,细胞接种至6孔板中。通过在200μl裂解缓冲液(10mM磷酸钠pH 7.8,8mM MgCl2、1mM EDTA、1%Triton-X-100、15%甘油)中裂解细胞制备全细胞抽提物并通过离心(1分钟,13,000×g,RT)得到澄清的裂解液。在线性范围使用光度计(Lumat LB 9501,Berthold,Wildbad,德国)在指明的时间点分析各份上清液的荧光素酶活性。
[0129] 结果
[0130] 为分析UCOE是否可以在腺病毒载体中提高基因表达,将1.5kbUCOE以正向克隆到驱动荧光素酶报告基因的人CMV增强子/启动子上游(RNP启动子具有与CMV启动子相同的方向)。图7示意地显示两个比较它们的荧光素酶活性的病毒的结构。HeLa细胞以MOI50用相应的病毒感染,并分析感染2天后的荧光素酶活性。图8清楚显示1.5kbUCOE片段可以极大增加HeLa细胞中报告基因的表达水平。为排除与病毒制剂相关的特异性作用,我们制备两个病毒的新制剂并重复该实验。图9显示了UCOE效果不取决于病毒制剂并且利用新的独立制剂完全可重复。
[0131] 实施例4 A1.5kb HP-1/hnRNP A2UCOE增强逆转录病毒编码的构建体中的表达[0132] 材料和方法
[0133] 细胞培养
[0134] HeLa,CHO-K1和293获自ATCC(Manassas,弗吉尼亚)。HeLa和293两个都培养在添加1%NEAA和含抗生素的10%FCS的DMEM中。CHO-K1在含10%FCS和抗生素的营养的混合F12(HAM)营养培养基中培养。
[0135] 质粒构建
[0136] 质粒pVPack-GP和pVPack-VSV-G获自Stratagene(LaJolla,CA,美国)并分别地表达逆转录病毒gag-pol和被膜VSV-G蛋白。逆转录病毒载体pQCXIX获自BD Bioscience,它包含用于转基因表达的人CMV启动子(Palo Alto,CA,美国)。质粒phrGFP-1获自Stratagene并被用作修饰的GFP cDNA的来源。为克隆pQCXIX-CMV-hrGFP,将hrGFP cDNA从phr-GFP-1通过BamHI/EcoRV消化而切除并克隆到BamHI/EcoRV消化的pQCXIX中。为产生pQCXIX-1.5UCOE-CMV-hrGFP,将1.5kbUCOE片段(Esp3I/BsmBI片段)作为平末端化片段克隆到XbaI消化的并平末端化的pQCXIX-CMV-hrGFP中。
[0137] 双嗜性VSV-G-被膜逆转录病毒粒子的制备
[0138] 所有的病毒用能产生高效和宽宿主范围转导的双嗜性VSV-G(水泡性口膜炎病毒糖蛋白)制成假病毒。使用的逆转录病毒载体产生自我钝化的病毒,这是由于在反转录后拷贝到5′LTR的3′LTR U3区删除因此抑制从5′LTR的任何进一步转录。
[0139] 4.5×106293细胞(第二天细胞应该80-90%铺满)被接种在瞬时转染前天2
用I型胶原酶包被的8.4厘米直径(55.6cm)平皿中。次日114μl Lipofectamine
2000(Invitrogen,Groenningen,荷兰)与286μl OptiMEM(Invitrogen)混合并在室温(RT)下保温5分钟。平行地,将1.5μg的各质粒pVPack-GP、pVPack-VSV-G和逆转录病毒载体与OptiMEM混合以达到终体积400μl。DNA混合物添加到Lipofectamine 2000溶液中并在RT保温20-30分钟。在温育期间293细胞用PBS洗涤一次并向细胞添加6ml的OptiMEM/10%FCS。最后DNA/Lipofectamine混合物被滴加到细胞,细胞在5%CO2培养箱中37℃培养5小时。然后用8ml新鲜的293培养基替代培养基,细胞被继续培养24-36小时。最后,从细胞收获含病毒粒子的上清液,在1000RPM离心5分钟以沉淀细胞和细胞碎片,上清液使用Millex-HV PVDF低蛋白结合的0.45μm滤器过滤除菌(Millipore,Molsheim,法国)。上清液被分成小份,液氮迅速冷冻并储存在-80℃。
[0140] 逆转录病毒转导靶细胞系
[0141] 靶细胞(HeLa,CHO-K1)在感染前天被以1×105细胞/孔接种到6孔板中。为病毒转导,在存在8.0μg/ml的1,5-二甲基1,5-二氮十一亚甲基聚甲溴化物(Sigma,St.Louis,密苏里州,美国)下添加不同量的含病毒的上清液。细胞与病毒培养24小时,然后用新鲜的培养基替换培养基。基因表达可以在转导后两天观察到。为防止每细胞的多拷贝效应,所有分析中用产生远少于100%转导效率(通常给与1-20%GFP阳性细胞)的病毒量感染靶细胞。在这转导效率范围内,被用来感染的上清液的体积与阳性细胞的数目线性相关而平均表达水平显示低得多的增加。
[0142] FACS分析
[0143] 为进行FACS分析,靶细胞用PBS洗涤,进行胰蛋白酶作用并再悬浮在完全培养基中,用Becton Dickinson FACScan(BD,Franklin Lakes,NJ,美国)使用用于各分析的恒定的仪器设定值分析hrGFP(绿色荧光蛋白)表达。用Apple Mcintosh的CeIIQuest软件分析数据。
[0144] FACS分选
[0145] 为分选表达GFP的HeLa和CHO-K1细胞,细胞被制备用于FACS分析然后用BD Bioscience FACS分选仪分选(由The Institute for CancerStudies惠赠,伯明翰大学,英国)。分选的单个的克隆和集合体随后被扩增,随后经历一段时间表达GFP。
[0146] 结果
[0147] 在第一个研究中,CHO-K1细胞用含逆转录病毒CMV-hrGFP(CMV)和1.5UCOE CMV-hrGFP(1.5UCOE-CMV)细胞的上清液转导。CHO-K1细胞如材料和方法的描述进行转导,感染三天后GFP阳性细胞被FACS分选为群集合体(各细胞构建体36,000细胞)然后扩增。经一段时间进行GFP表达和柱状图作图并分别地图解在图10A和B中。在分析的第17天,1.5UCOE-CMV集合体的平均值比CMV集合体的平均值高2.6倍。另外,如图10B的柱状图所示,1.5UCOE-CMV集合体比CMV集合体产生更密集的GFP表达峰。GFP阳性细胞的平均CV值(变异系数;这是GFP表达均一性的标记)在Marker 1中对CMV集合体为146.0而对1.5UCOE-CMV集合体为83.0。
[0148] 与此研究相比,转导CHO-K1,经一段时间研究细胞群但不进行FACS分选。选择产生低百分比阳性细胞的MOI以排除每细胞的多拷贝效应。如图11A所示(有大约5%GFP阳性细胞的集合体I),1.5UCOE-CMV群在最后测量时间点的阳性细胞的均值比CMV群的均值高2.8倍。对于集合体II(大约15-25%GFP阳性细胞;图12A),1.5UCOE-CMV群在最迟测量时间点的阳性细胞的平均值比CMV群的均值高2.3倍。
[0149] 与FACS分选的群相比,1.5UCOE-CMV群与CMV群相比在所有分析时间点产生明显更密集的表达峰(图11B和图12B)。
[0150] 至于CHO-K1,稳定地转导有逆转录病毒构建体的10,000个HeLa细胞的集合体进行FACS分选。在图13A,平均GFP值被显示为包括FACS分选当天(第五天)的平均值。在最后一次测量中,1.5UCOE-CMV集合体的平均值比CMV集合体的平均值高1.6倍。如图13B的柱状图所示,许多CMV细胞经一段时间后失去其高GFP表达水平;相反大部分1.5UCOE-CMV细胞保持其高GFP表达。
[0151] HeLa单细胞克隆同样进行FACS-挑选并扩增到6孔板中。CMV克隆趋向于产生比1.5UCOE-CMV克隆稍高的表达峰,然而,无论在克隆内部还是在克隆之间,如全部分析的克隆的柱状图(图14A-E)所示,由于存在UCOE,表达水平的一致性被显著地增加。图15显示GFP表达差异的平均系数(CV)和其标准差异(SD)。CMV克隆的CV+/-SD值为
135.0+/-165.3,并且1.5UCOE-CMV克隆为49.4+/-10.9。