核酸序列及其作为启动子的应用转让专利

申请号 : CN202011231411.3

文献号 : CN112553196B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 谷浪屿李陈峥毛晓兵韦宗仿黄友葵何希敏周文君李礼王德寿

申请人 : 中山大学西南大学

摘要 :

本发明涉及基因工程技术领域,尤其涉及核酸序列及其作为启动子的应用。本发明提供了新的启动子序列,其为具有如SEQ ID NO:1所示核苷酸序列的核酸;或在此片段中取代、缺失或添加一个或多个核苷酸的核酸;或与其互补或部分互补的序列。该启动子序列能够驱动蛋白在多种组织或细胞中表达。

权利要求 :

1.如SEQ ID NO:1所示核苷酸序列的核酸作为启动子的应用。

2.根据权利要求1所述的应用,其特征在于,在如SEQ ID NO :1所示的核酸的3’端还添加SEQ ID NO:4所示的核苷酸片段。

3.一种重组蛋白的制备方法,其特征在于,以SEQ ID NO:1所示核苷酸序列的核酸作为启动子,诱导表达重组蛋白。

4.一种育种方法,其特征在于,在菌体中,以SEQ ID NO:1所示核苷酸序列的核酸作为启动子,使目的基因过表达。

说明书 :

核酸序列及其作为启动子的应用

技术领域

[0001] 本发明涉及基因工程技术领域,尤其涉及核酸序列及其作为启动子的应用。

背景技术

[0002] 基因表达是指基因经过转录、翻译等,产生有生物活性的RNA或蛋白,表现出其储存的遗传信息的过程,受多个水平不同因素的调控。无论在真核生物体内还是在原核生物
体内,大多数的调控事件发生在转录水平。转录不仅是基因表达的第一步,还是控制基因活
动的关键步骤。启动子是转录水平调控的重要参与者,一直以来备受关注。
[0003] 启动子(Promoters)是RNA聚合酶识别、结合开始转录启动的一段DNA序列,它含有RNA聚合酶特异性结合和转录起始所需的保守序列,多数位于结构基因转录起始点的上游。
这样的启动子本身不被转录,但有一些启动子(如tRNA启动子)位于转录起始点的下游,这
些DNA序列也可以被转录。启动子的活性受到多种因素的影响,而在基因的异源表达中,常
常需要根据实际需求选择不同活性的启动子。
[0004] 在进化生物学领域中,常常有一些类群特有的基因组片段。这些基因组片段只出现在某一类物种中,是这类物种所特有的。早期对于这种基因组片段的研究相对较少,对其
功能的了解也较少。然而最近,越来越多的研究结果发现,这些类群特有的基因组片段,往
往具有重要的生物学功能,常常和物种适应环境或是新的表型的出现相关。另一方面,以往
的研究多认为生物表型的产生主要是由于基因编码蛋白的编码区的突变所导致。而基因组
中大量存在的非编码区往往被认为是冗余、无功能的所谓“垃圾片段”。然而,随着近些年科
学的发展,人们发现这些非编码区往往具有重要的调控作用,常常使得基因获得新的组织/
细胞表达模式,并且和基因产生新的功能具有重要联系。
[0005] 因此,进一步在研究中发现新的具有转录启动活性的基因组片段,以及构建不同的表达系统具有重要意义。

发明内容

[0006] 有鉴于此,本发明要解决的技术问题在于提供新的核酸序列及其作为启动子的应用,该片段来自于丽鱼科(也称慈鲷科)(Cichlidae)中的奈里朴丽鱼Pundamilia 
nyererei。
[0007] 本发明提供了如I)、II)或III)中任一项所述的核酸:
[0008] I)、具有如SEQ ID NO:1所示核苷酸序列的核酸;
[0009] II)、在I)所述的片段中取代、缺失或添加一个或多个核苷酸的核酸;
[0010] III)、与I)或II)部分互补或完全互补的核酸。
[0011] 一些实施例中,所述核酸的核苷酸序列如SEQ IDNO:1~3中任一项所示。
[0012] 在I)所述的片段中取代、缺失或添加一个或多个核苷酸的核酸,是指与具有如SEQ ID NO:1所示核苷酸序列的核酸具有至少60%同源性,且具有相似功能的序列。
[0013] 其中,SEQ ID NO:1所示核酸片段是来自于东非丽鱼(African cichlid fishes)中的一种,奈里朴丽鱼P.nyererei的野生型片段,长度为2125bp。SEQ ID NO:2所述的核酸
片段是在SEQ ID NO:l的基础上,缺失3bp形成的核酸片段,SEQ ID NO:3来自P.nyererei的
近缘物种尼罗罗非鱼(Oreochromis niloticus),与SEQ ID NO:1所示核酸序列具有94%的
同源性。
[0014] 一些具体实施例中,在如SEQ IDNO:1~3中任一项所示的核酸的3’端还包括SEQ ID NO:4所示的核苷酸片段。
[0015] 本发明中SEQ ID NO:1所示核酸来自奈里朴丽鱼P.nyererei,将P.nyererei的这个基因组片段,通过酶切、连接,构建获得具有由该特有基因组片段作为上游启动子,驱动
eGFP荧光蛋白(Enhanced green fluorescent protein)表达的重组质粒(原质粒不含有启
动子)。将该重组质粒注射进入模式生物(发育模型、疾病模型)斑马鱼的单细胞受精卵中,
获得由该P.nyererei基因组片段驱动eGFP荧光蛋白在斑马鱼中许多重要的组织和细胞中
表达的转基因表达系统。
[0016] 进一步研究表明,SEQ ID NO:2~3所示的核酸片段与具有与SEQ ID NO:1所示的核酸片段相似的功能,但调控蛋白表达的强度较弱,且能够引起蛋白表达的细胞类型也较
少。这说明O.niloticus的相应序列(SEQ ID NO:3)在进化过程中还没有进化出像
P.nyererei(SEQ ID NO:1)那样强的表达功能;另一方面,仅仅删除SEQ ID NO:1的三个连
续SNPs(GTA)(SEQ ID NO:2)就能够改变SEQ ID NO:1序列的表达功能;同时,由于
P.nyererei序列在删除这3bp SNPs后的表达模式变得和O.niloticus(SEQ ID NO:3)的表
达模式相近,说明这三个连续SNPs是导致SEQ ID NO:1和其近缘物种(SEQ ID NO:3,序列中
不含有这3bp SNPs)表达差异的重要因素。
[0017] 本发明还提供了所述核酸作为启动子的应用。
[0018] 斑马鱼是熟知的用于人类疾病研究模型和进化理论模型的模式生物。本发明以斑马鱼为实验动物,以eGFP绿色荧光蛋白为研究对象,以本发明提供的P.nyererei的核酸作
为启动子。结果表明,以本发明所述的核酸可作为启动子,驱动eGFP在斑马鱼的多个组织器
官中表达。
[0019] 本发明还提供了含有所述的核酸和目的基因的转录单元。
[0020] 本发明以eGFP蛋白作为对象,证明本发明提供的核酸可以作为启动子,驱动eGFP的表达。基于同样的原理,本发明提供的核酸也可用于驱动其他蛋白的表达。所述转录单元
包括本发明所述的核酸和目的基因的CDS区。一些实施例中,所述转录单元还包括终止子
和/或启动子的增强子。
[0021] 本发明还提供了一种质粒载体,其含有本发明所述的核酸,或含有本发明所述转录单元。
[0022] 所述质粒载体中还包括:复制原点、选择性标记、多克隆位点、引物检测序列、转座酶片段、分泌信号肽、选择性标签中至少一种。
[0023] 一些实施例中,所述质粒载体包括顺序连接的:本发明所述的核酸、SV40 polyA、150G、Amp抗性筛选标记、200R。
[0024] 一些具体实施例中,所述质粒载体中包括本发明所述的核酸片段和pT2AL骨架载体。
[0025] 本发明还提供了转染或转化所述质粒载体的重组宿主。
[0026] 本发明所述重组宿主,为转染或转化本发明所述质粒载体的微生物、动物细胞和/或植物细胞。
[0027] 本发明还提供了一种重组蛋白的制备方法,其为培养、诱导所述重组宿主表达重组蛋白。
[0028] 本发明还提供了一种育种方法,其为在胚胎细胞或菌体中,转染或转化本发明所述质粒载体,使目的基因过表达。
[0029] 本发明还提供了一种药物,其包括药学上可接受的辅料和如下i)~iv)中的至少一种:
[0030] i)、本发明所述质粒载体;
[0031] ii)、提高本发明所述的核酸活性的制剂;
[0032] iii)、抑制本发明所述的核酸活性的制剂;
[0033] iv)、根据本发明所述的重组宿主的表达产物。
[0034] 本发明提供了新的启动子序列,其为具有如SEQ ID NO:1所示核苷酸序列的核酸;或在此片段中取代、缺失或添加一个或多个核苷酸的核酸;或与其互补或部分互补的序列。
该启动子序列能够驱动蛋白在多种组织或细胞中表达。

附图说明

[0035] 图1a示pT2AL‑Pn质粒Sanger测序结果图;通过对质粒载体上T3引物测序,获得质粒上T3下游序列片段(如质粒上的200R片段,天蓝色标注)、酶切位点SmaI片段(黑色标注)
及5’端开始的部分P.nyererei lg基因(本发明命名该未知功能基因为lg基因)启动子片段
(橙色标注,Pn_promoter_part),注,Sanger测序高质量片段长度一般为800bp左右,且测序
结果中5’和3’端的约100bp峰图较乱;
[0036] 图1b示pT2AL‑Pn质粒Sanger测序结果峰图(图1a放大版);通过对质粒载体上T3引物测序,获得质粒上T3下游序列片段、酶切位点SmaI片段及从5’端开始的部分P.nyererei 
lg基因启动子片段;
[0037] 图2a示pT2AL‑Pn‑eGFP质粒Sanger测序结果图;通过对质粒载体上T7引物测序,获得质粒T7上游序列片段(150G,天蓝色标注;SV40/PolyA,灰色标注)、酶切位点StuI片段(黑
色标注)及从3’端反向测序的部分eGFP编码区片段(绿色标注);注,Sanger测序高质量片段
长度一般为800bp左右,且测序结果中5’和3’端约100bp峰图较乱;
[0038] 图2b示pT2AL‑Pn‑eGFP质粒Sanger测序结果峰图(图2a放大版);通过对质粒载体上T7引物测序,获得质粒T7上游序列片段、酶切位点StuI片段及从3’端反向测序的部分
eGFP编码区片段;
[0039] 图3a示pT2AL‑Pn‑eGFP质粒图谱;红色标记为外源连入质粒空载体中的序列(Pn),包含了黑色标记的酶切位点、橙色标记的P.nyererei lg基因上游启动子序列(Pn_
promoter)以及蓝色标记的lg基因前48bp外显子序列;绿色标记为eGFP编码区序列;
[0040] 图3b示pT2AL‑On‑eGFP质粒图谱;红色标记为外源连入质粒空载体中与Pn序列同源的来自于O.niloticus的序列On,包括黑色标记的酶切位点,橙色标记的O.niloticus lg
基因上游启动子序列On_promoter,蓝色标记的O.niloticus lg基因前48bp外显子序列;绿
色标记为eGFP编码区序列;
[0041] 图3c示pT2AL‑Pn‑noSNPs‑eGFP质粒图谱;红色标记为外源连入质粒空载体中的序列,其中,黑色标记为酶切位点,橙色标记为删除了三个连续SNPs(GTA)后的位于
P.nyererei lg基因上游启动子序列,Pn_noSNPs_promoter,蓝色标记的lg基因前48bp外显
子序列;绿色标记为eGFP编码区序列;
[0042] 图4a示pT2AL‑On‑eGFP质粒Sanger测序结果图;通过对质粒载体上T3引物测序,获得质粒T3下游序列片段(如质粒上的200R片段,天蓝色标注)、酶切位点SmaI片段(黑色标
注)及从5’端开始的部分O.niloticus lg基因启动子片段(橙色标注,On_promoter_part),
注,Sanger测序高质量片段长度一般为800bp左右,且测序结果中5’和3’端约100bp峰图较
乱;
[0043] 图4b示pT2AL‑On‑eGFP质粒Sanger测序结果峰图(图4a放大版);通过对质粒载体T3引物测序,获得质粒T3下游序列片段、酶切位点SmaI片段及从5’端开始的部分
O.niloticus lg基因启动子片段;
[0044] 图5示pT2AL‑Pn‑noSNPs‑eGFP质粒Sanger测序结果图;通过在删除掉三个连续SNPs位点的位置附近设计引物进行Sanger测序,进一步确定pT2AL‑Pn‑noSNPs‑eGFP中的
P.nyererei启动子序列中确实删除掉了三个连续SNPs位点;
[0045] 图6a示孵化腺细胞共定位图;左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑Cathepsin L/MEP抗体表达情况,中间为二者叠加后的共定位图像;
[0046] 图6b示表皮化学感受细胞共定位图;左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑Serotonin抗体表达情况,中间为二者叠加后的共定位图像;
[0047] 图6c示心脏瓣膜表达结果图;图为488nm通道下eGFP荧光表达情况;
[0048] 图6d示下颌骨细胞共定位图;左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑SOX10抗体表达情况,中间为二者叠加后的共定位图像;
[0049] 图6e示背鳍和臀鳍表达结果图;两图均为488nm通道下eGFP荧光表达情况;
[0050] 图6f示胸鳍共定位图;左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑Collagen type II抗体表达情况,中间为二者叠加后的共定位图像;
[0051] 图6g示尾鳍共定位图;左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑Collagen type II抗体表达情况,中间为二者叠加后的共定位图像;
[0052] 图6h示眼睛内核层和外核层神经元共定位图;左图为488nm通道下eGFP荧光表达情况;右一图为647nm通道下anti‑HuC/HuD抗体表达情况;右二图为DAPI荧光表达情况;左
二为三者叠加后的共定位图像;
[0053] 图6i示嗅觉上皮细胞共定位图;左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑HuC/HuD抗体表达情况,中间为二者叠加后的共定位图像;
[0054] 图6j示嗅球细胞共定位图,左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑HuC/HuD抗体表达情况,中间为二者叠加后的共定位图像;
[0055] 图6k示视顶盖和小脑共定位图,左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑HuC/HuD抗体表达情况,中间为二者叠加后的共定位图像;
[0056] 图6l示小脑共定位图,左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑Pvalb7抗体表达情况,中间为二者叠加后的共定位图像;
[0057] 图6m示后脑共定位图,左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑HuC/HuD抗体表达情况,中间为二者叠加后的共定位图像;
[0058] 图6n示脊髓神经元共定位图,左图为488nm通道下eGFP荧光表达情况;右图为647nm通道下anti‑HuC/HuD抗体表达情况,中间为二者叠加后的共定位图像;
[0059] 图7a示转基因品系pT2AL‑Pn‑eGFP荧光表达情况,荧光主要表达在头部的嗅觉上皮细胞、嗅球、前脑、中脑视顶盖、小脑、后脑、胸鳍、脊髓、下颌骨及表皮化学感受细胞中,下
颌骨包括麦氏软骨、腭方软骨、舌续骨、角舌骨以及鳃下骨;
[0060] 图7b示转基因品系pT2AL‑On‑eGFP荧光表达情况,荧光信号相比于pT2AL‑Pn‑eGFP转基因品系明显变弱,能够辨别出来的较为明显的荧光信号主要在小脑、后脑及下颌骨的
前两个骨弓中(麦氏软骨、腭方软骨、舌续骨和角舌骨);
[0061] 图7c示转基因品系pT2AL‑Pn‑noSNPs‑eGFP荧光表达情况,荧光信号相比于pT2AL‑Pn‑eGFP转基因品系明显变弱,更类似于pT2AL‑On‑eGFP转基因品系,能够辨别出来的较为
明显的荧光信号主要在嗅觉上皮、视顶盖、后脑及下颌骨的前两个骨弓中;
[0062] 图7d示相同参数下拍摄的共聚焦图片荧光强度对比统计学分析,转基因品系pT2AL‑Pn‑eGFP荧光信号相比于另外两个转基因品系在小脑、后脑区域以及下颌骨的前两
个骨弓中,荧光强度在统计学上显著更强。

具体实施方式

[0063] 本发明提供了核酸序列及其作为启动子的应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员
来说是显而易见的,它们都被视为包括在本发明。本发明的方法及应用已经通过较佳实施
例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文的方法和应用
进行改动或适当变更与组合,来实现和应用本发明技术。
[0064] 为了获得新型的启动子序列,本发明前期通过比较基因组学和比较转录组学的方法,在东非丽鱼中找到了一个功能未知的新基因,命名为lg基因。通过对整个东非丽鱼系统
发育树主要支系的物种在该基因上游10kb及下游10kb的测序,我们发现了SEQ ID NO:1所
示的这段东非丽鱼所特有的位于lg基因编码区上游的片段。通过设计带有特定酶切位点的
PCR引物,首先利用基因组提取试剂盒对该物种进行全基因组提取,然后对基因组中该片段
以及lg基因的部分5’端编码区序列进行PCR扩增,获得带有特定酶切位点的目的片段。随
后,将该片段通过酶切、连接、转化的方式,作为启动子连接入pT2AL空载体中,并在其下游
连接eGFP荧光蛋白编码区,从而构建由该特有片段驱动eGFP荧光蛋白表达的质粒。将该质
粒进行无内毒素纯化后,显微注射入模式生物斑马鱼单细胞受精卵中,筛选表达eGFP绿色
荧光蛋白的个体培养至性成熟(F0代),和野生型斑马鱼交配挑选后代具有eGFP绿色荧光蛋
白的个体(F1代);继续培养至性成熟后再次和野生型斑马鱼交配,获得品系更纯的表达
eGFP荧光蛋白的后代(F2代)。结果表明,SEQ ID NO:1所述的片段具有启动子功能,能够驱
动荧光蛋白在多种重要的细胞和组织中表达。
[0065] 本发明中,所述互补是指核苷酸碱基之间能够形成氢键,例如,就DNA而言,腺嘌呤(Adenine)与胸腺嘧啶(Thymine)互补,胞嘧啶(Cytosine)与鸟嘌呤(Guanine)互补。本发明
的一些实施例中,所述取代、缺失或添加一个或多个核苷酸形成的核酸,是指与SEQ ID NO:
1所示核苷酸序列的核酸具有至少60%同源性,且具有相似功能的序列。本发明中,所述同
源性是指与SEQ ID NO:1所述序列的匹配程度。一些实施例中,同源性不低于70%、80%、
90%、95%或99%。实施例中,对SEQ ID NO:2~3所述的核酸也进行了功能验证。其中,SEQ 
ID NO:2所述的核酸片段是在SEQ ID NO:l的基础上,人为删除了三个连续SNPs(GTA)形成
的核酸片段;SEQ ID NO:3来自P.nyererei的近缘物种尼罗罗非鱼(O.niloticus),与SEQ 
ID NO:1所示核酸序列具有94%的同源性,且本身就不具有上述缺失的三个连续SNPs。对
SEQ ID NO:2~3所示的核酸片段进行启动子分析研究,结果表明其具有与SEQ ID NO:1所
示的核酸片段相似的功能,但调解蛋白表达的强度较弱,且能够引起蛋白表达的细胞类型
也较少。特别是SEQ ID NO:2与SEQ ID NO:1仅存在3bp的差异,其调控的活性就发生了显著
的降低,说明这三个连续SNPs对于实现SEQ ID NO:1启动子的活性的重要性。
[0066] 本发明中,SEQ ID NO:1的核酸序列为:
[0067] actggtgggctctgagtctttgtttctgtaaactgcagtctgctagtgcatgccactgagtattaatgaaacataataaaaacataataacacaataaaacacggtctatgaaaactcaatcaggtgtaaaaagcatttcaatt
tttaaaggtctaaagagtcagaaatgtatctgcagaggggaactgttgactcatgtgaatcatgagacgggtttcc
ataagtcagtgctcccatgatcactgcaatgtgttgtttgcattatgtgcacacacacgcacacacataaacacac
acacacatgcatacacagagcaaacgtacccatctgatcagattatctgcatgatgtatgtcacaaactttacaca
acatgtttacagctctgcagtcctttttccatttttgtttttagaaggaatcattcattttggcacattttaccaa
aattacagtggctgactgtgttcatttacaatgagacatttttagaaatggcgtcttataagatgaaaaaaaatgt
ggaaaaaataaacctgactccactttgtttgtttgttttgttgttttcttctcttcctctctccctctctctctct
ctctctctctctctcatcacccctcctttgctacatctgtgtctgagtctccttcctcttccctatttcttctgca
tctgtttttctcgctccatcaaaacagtcagccagagacagtgctggggctgaggaaatggatggtgtgtctattt
ttagaagcagggaaggagggcaaaccaaaagtaagcgagggagagagggagcaagagagagagggaggaggaggat
gaggtggaggagagggaggggggatgtgaggagaagataaacctgcattctgcctctgcctctggtcagagacagt
tgaagcttcacagcacaattaacaagcagcagcagatgaaaacagaggatcgtaaataaaattgaggagacaaaaa
aaagagagaacgagagcgacggatgcaggctgctatttaaagctgcaccaggagaagagacaagaaaagattcggt
ggactcaacaaagatcatccgtaaaggtgagtgtgaaggcaaattgagcagaaaacctttacattattcctgagaa
tgcatgacgaacacacacacagagtgcctgttttgtgcttcagcctcgagctgccgccgtggaaccatttttagct
gttgtatacagaaggtgtggtctatatttagcagtggttacaccttggaagaaactgggagaggctggcattttgg
tttggcttgcgctatttttgtcatgaggtcaatacaagcatacattgtgggctacgctctgggttataacaactcg
gcgctccacactctgaaacagtttgaggctttacgtgtctgagatcccacaaaacagtcatctgtgtgtgcagcct
ctcactgggattgtttgtatattgaacggtcaacacacacaactccagagtaagcggcgcacggtgcctgaaatga
aggaaagggagaggagaggctcctatgtttacttggttttatcgatacagccagcagttgtagtcggttgtgtttt
gggagcttcggacaatgtgagcaatgtccagatgcacattatgtcattagaaaaacacattagactgatgaggtga
ttaaacaagaggcttttcaaaagaaactgaggaaaaattgttgcaaatacaatgcaacacaacagtgtgtacgaat
gagaaattaactccagaagttataagtcagttcgtgagataatagtgcacagattcatctttttatttgtatcgtg
tggagacacatattgcaagtttcgacataaatgacacacacaaacagggctctcactttgtaaactaggaagtaag
attgcatacgttgcatctgaccctatcaggaatgtgtcacatctatcaaaatatccagttttccaaatggtgatta
tattttcctaaaggattctgcttttttgagacttggatgcagtatttcacattacacagtttttttccccatctaa
atgagacctctcccgtcttgtctttctctcagct
[0068] SEQ ID NO:2所示的核酸序列为:
[0069] actggtgggctctgagtctttgtttctgtaaactgcagtctgctagtgcatgccactgagtattaatgaaacataataaaaacataataacacaataaaacacggtctatgaaaactcaatcaggtgtaaaaagcatttcaatt
tttaaaggtctaaagagtcagaaatgtatctgcagaggggaactgttgactcatgtgaatcatgagacgggtttcc
ataagtcagtgctcccatgatcactgcaatgtgttgtttgcattatgtgcacacacacgcacacacataaacacac
acacacatgcatacacagagcaaaccccatctgatcagattatctgcatgatgtatgtcacaaactttacacaaca
tgtttacagctctgcagtcctttttccatttttgtttttagaaggaatcattcattttggcacattttaccaaaat
tacagtggctgactgtgttcatttacaatgagacatttttagaaatggcgtcttataagatgaaaaaaaatgtgga
aaaaataaacctgactccactttgtttgtttgttttgttgttttcttctcttcctctctccctctctctctctctc
tctctctctctcatcacccctcctttgctacatctgtgtctgagtctccttcctcttccctatttcttctgcatct
gtttttctcgctccatcaaaacagtcagccagagacagtgctggggctgaggaaatggatggtgtgtctattttta
gaagcagggaaggagggcaaaccaaaagtaagcgagggagagagggagcaagagagagagggaggaggaggatgag
gtggaggagagggaggggggatgtgaggagaagataaacctgcattctgcctctgcctctggtcagagacagttga
agcttcacagcacaattaacaagcagcagcagatgaaaacagaggatcgtaaataaaattgaggagacaaaaaaaa
gagagaacgagagcgacggatgcaggctgctatttaaagctgcaccaggagaagagacaagaaaagattcggtgga
ctcaacaaagatcatccgtaaaggtgagtgtgaaggcaaattgagcagaaaacctttacattattcctgagaatgc
atgacgaacacacacacagagtgcctgttttgtgcttcagcctcgagctgccgccgtggaaccatttttagctgtt
gtatacagaaggtgtggtctatatttagcagtggttacaccttggaagaaactgggagaggctggcattttggttt
ggcttgcgctatttttgtcatgaggtcaatacaagcatacattgtgggctacgctctgggttataacaactcggcg
ctccacactctgaaacagtttgaggctttacgtgtctgagatcccacaaaacagtcatctgtgtgtgcagcctctc
actgggattgtttgtatattgaacggtcaacacacacaactccagagtaagcggcgcacggtgcctgaaatgaagg
aaagggagaggagaggctcctatgtttacttggttttatcgatacagccagcagttgtagtcggttgtgttttggg
agcttcggacaatgtgagcaatgtccagatgcacattatgtcattagaaaaacacattagactgatgaggtgatta
aacaagaggcttttcaaaagaaactgaggaaaaattgttgcaaatacaatgcaacacaacagtgtgtacgaatgag
aaattaactccagaagttataagtcagttcgtgagataatagtgcacagattcatctttttatttgtatcgtgtgg
agacacatattgcaagtttcgacataaatgacacacacaaacagggctctcactttgtaaactaggaagtaagatt
gcatacgttgcatctgaccctatcaggaatgtgtcacatctatcaaaatatccagttttccaaatggtgattatat
tttcctaaaggattctgcttttttgagacttggatgcagtatttcacattacacagtttttttccccatctaaatg
agacctctcccgtcttgtctttctctcagct
[0070] SEQ ID NO:3所示的核酸序列为:
[0071] actggtgggctctgagtctttgtttctgtaaactgcagtctgctagtgcttgccactgagtattaatgaaacataataaaacataataacacaataaaacacagtctatgaaaactcaatcaggtgtaaagagcatttcaattt
ttaaaggtctaatgagtcagaaatgtatctgtagatgagaactgttgactcatgtgactcatgagacaggtttcca
taagtcagtgctcccgtgatcactgcaatgtgttgtttgcattacgtgcacacacgtgcgcacgcataaacacaca
cacatccatatacacagagcaaacatgccaaagcccatctgatcagattgtctgcatgatgtatgtgacaagcttt
acacaacatgtttacagctctgcagtcctttttccatttttgtttttagaaggaatcgttcattttggcacattca
ccaaaattacagtggctgactgtgttcatttacagtgagacatttttagaaatggcgtcttataagatgaaaaaaa
atgtggaaaaaataaacctgtctccactttgtttgttttgttgttttctcctctctctctctctctctctctctct
ctctctctctctcatcacccctctgttacatctgtgtctgagtctccttcctcttccctctttcttctgcctctgt
ttttctcgttccatcaatacagtcagccagagacagtgctggggctgaggaaatggatggtgtgtctatttttaga
agcagggaaggagggcaaaccaaaagtaagcgagggagagagggagcaagagagagagggaggaggaggatgaggt
ggaggagagggaggggggatgtgaggagaagataaatctgcattctgcctctgcctctggtcagagacagttgaag
cttcacagcacaattaaggagaagcagcagcagatgaaaacagacgatcgtaaataaaattgaggagacaaaaaaa
gagagaaagagagcgacggatgcaggctgaaatttaaaactgcaccaggagaaaagacaagaaaagattccgtgga
ctcaacaaagatcatccgtaaaggtgagtgtgaaggcaaattgagcagaaaacctttacattattcctgagaatgc
atgacgaacacacacacagggtgcctgttttgtgcttcagcctcgagctgccgccgtggaaccatttttagctttt
gtatacagaaggtgtggtctatatttagcagtggttacaccttggaagaaactgggagaggctggcattttggttt
ggcttgtgctatttttgtcacgaggtcaatacaagcatatattgtgggctacactcagggttataacaactcggcg
ctccacactctgaaacagtttgaggctttacgtgtctgagatcccacaaaacagtcatctgtgtgtgcagcctctc
gctgggattgtttgtatattgaacggtcaacacacacaactccagagtaagcagcgcacggtgcctgaaatgaagg
gaagggagaggagaggcttctgtgtttacttggttttatcgatacagccagcagttgtagtcggttgtgttttgaa
aacgcttcgggggatgtgagcaatgtccagatgtacattatgtcattagaaaaacacattagactgatgaggtgat
taaacaagaggcttttgaaaagaaactgagcaaaaattgttgcaaatacaatgtgtgtacgaatgtgaaattaact
ccagaagttataagtcagttcatgagataacagtgcacagatttatatttttatttgtattgtgtggaggcacata
ttgcaagtttcgacataaaggacacacacaacacactcactttgtaaactaggaagtaagattgcatacgttgcat
ctgaccctatcaggaatgtgtcacacctatcaaaatatccagttttccaaacggtgattatattttcctaaaggat
tctgctttttcgagacttggatgcagtatttcacattacgcagtttttttccccatctaaatgagacctctcccgt
cttgtctttctctcagct
[0072] SEQ ID NO:4所示的核酸序列为:atgcggccacggtccagactgctgtccaagaggagactgacgctgccc
[0073] 本发明中,所述启动子是位于结构基因5’端上游的一段DNA序列,能够活化RNA聚合酶,启动基因转录。本发明研究表明,以本发明所述的核酸可作为启动子,驱动eGFP在斑
马鱼的多个组织器官中表达。在实际应用中,本发明所述启动子的驱动表达的目的基因可
以是eGFP,也可为其他目的基因。
[0074] 一些实施例中,所述核酸能够驱动eGFP荧光蛋白在斑马鱼体内表达的部位包括:①驱动eGFP荧光蛋白在心脏瓣膜中表达,因此该核酸可以作为研究心脏瓣膜发育等相关疾
病的组织或细胞的分子标记;②驱动eGFP荧光蛋白在斑马鱼脑中许多神经元中表达,包括
在识别化学分子信号用于捕获食物或逃避天敌、求偶交配等相关的嗅觉上皮细胞以及嗅球
中的细胞,和视觉相关的位于中脑的视顶盖,和运动平衡相关的小脑、以及后脑和脊髓中的
神经元中。在脑中不同类型的神经元中的表达有助于研究脑的作用以及为构建相关疾病模
型提供重要的分子标记;③在眼睛中的内核层以及外核层神经元细胞中表达,对于研究视
觉神经作用以及构建相应疾病模型提供重要的分子标记;④能够驱动eGFP荧光蛋白在鱼类
皮肤中的化学感受细胞中表达。鱼类皮肤中的化学感受细胞是用于感受外界环境的细胞,
因此其对于研究鱼类感知环境、细胞与环境之间的相互作用提供重要的研究基础和模型;
⑤能够驱动eGFP荧光蛋白在与鱼卵的孵化相关的孵化腺细胞中表达。孵化腺细胞能够分泌
与卵孵化相关的酶,因此对于鱼类孵化及发育具有重要作用,研究鱼类孵化等基础理论和
水产应用。⑥能够驱动eGFP荧光蛋白在鱼类的鱼鳍及下颌骨骼中表达,对于了解鱼类骨骼
发育以及构建骨骼疾病模型提供重要分子标记。
[0075] 本发明中,转录单元(transcription unit)中的启动子为本发明所述的核酸,其中,启动子与目的基因直接相连或经由linker序列进行连接。一些实施例中,所述转录单元
中还包括终止子和/或启动子的增强子。所述启动子的增强子可理解为基因表达的调控序
列,例如,其可为调控实施基因转录的启动子以外的基因转录的任何操纵序列,以及编码适
当的mRNA核糖体结合位点等。所述转录单元中的目的基因亦可成为靶基因,是指编码目标
蛋白的基因,在本发明实施例中,其为编码eGFP的基因。但本发明所述核酸序列的启动子能
够驱动表达的基因不限于此。在其他应用中,其可为其他结构基因的CDS区。
[0076] 本发明中,所述质粒载体是指具有能够在适当的宿主中表达靶基因的DNA分子。本发明对所述的质粒载体的骨架没有限制,只要其可以在宿主细胞中表达都在本发明的保护
范围内。本发明中,所述质粒载体中靶基因的上游以本发明所述的核酸为启动子,其可以包
含也可不包含其他核酸序列的启动子。一些实施例中,所述的质粒载体中,靶蛋白的上游不
含有其他启动子。所述质粒载体含有本发明所述的核酸,或含有本发明所述转录单元。所述
质粒载体的骨架载体可为天然或重组质粒、粘粒、病毒和噬菌体。其可以为线性载体或环形
载体。可为整合型质粒载体、游离型载体或穿梭质粒。所述载体上包括质粒复制和基因表达
的元件。例如,复制原点、选择性标记、多克隆位点、引物检测序列、转座酶片段、分泌信号
肽、选择性标签或origin片段中至少一种。其中,所述选择性标记为抗性筛选标记、营养缺
陷型筛选标记或荧光标记中至少一种;所述抗性筛选标记为氨苄霉素抗性标记、卡那霉素
抗性标记、四环素抗性标记、链霉素抗性标记或氯霉素抗性标记。例如,所述质粒载体的骨
架可为pWE15、M13、λLB3、λBL4、λIXII、λASHII、λAPII、λt10、λt11、Charon4A、Charon21A等系
列载体;也可以为pBR、pUC、pBluescriptII、pGEM、pTZ、pCL、pET系列载体。更具体的,其可为
pECCG117、pDZ、pACYC177、pACYC184、pCL、pUC19、pBR322、pMW118、pCC1BAC、pCES208、
pXMJ19、pT2AL、pCS2载体。
[0077] 本发明中,所述重组宿主是指转染或转化有本发明所述质粒载体的宿主。所述转染(transfection)是真核细胞在一定条件下主动或被动导入外源DNA片段而获得新的表型
的过程。所述转化(transformation)是某一基因型的细胞从周围介质中吸收来自另一基因
型的DNA而使它的基因型和表现型发生相应变化的现象。本领域常见的转染或转化方法包
括:电穿孔法、脂质体转染法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、微注射法、聚乙
二醇(PEG)技术、DEAE‑葡聚糖技术、阳离子脂质体技术和乙酸锂‑DMSO技术。也可采用其他
基因编辑的手段,使本发明所述的启动子片段连接入宿主的基因组。例如,所述基因编辑的
手段包括:锌指核酸酶法、TALENs技术、CRISPR/Cas9技术、转座酶转基因技术等。所述重组
宿主可为微生物、植物细胞或动物细胞。优选的,所述重组宿主的宿主细胞为为微生物或动
物细胞。一些实施例中,所述动物细胞为斑马鱼的胚胎细胞。
[0078] 本发明所述序列的启动子,可以用于重组蛋白的制备,也可以通过利用本发明所述的启动子过表达某一蛋白从而实现细胞代谢产物水平提高的目的。可以利用该启动子表
达荧光蛋白或者其他筛选标记,对重组宿主中的组织或细胞类型进行定位分析。将其导入
胚胎细胞促进目的基因的表达,从而实现构建新的细胞品系或者动物新品种的目的。将本
发明所述序列的启动子作为药物使用,可以提高目的基因的表达水平,从而实现疾病治疗
的目的。
[0079] 本发明采用的试材皆为普通市售品,皆可于市场购得。其中,骨架载体pT2AL来自西南大学生命科学学院李礼教授实验室。
[0080] 下面结合实施例,进一步阐述本发明:
[0081] 实施例
[0082] 一、质粒构建
[0083] 1.构建pT2AL‑Pn‑eGFP质粒
[0084] 首先将东非丽鱼奈里朴丽鱼P.nyererei特有上游启动子序列以及lg基因的前48bp编码区序列(以下简称为Pn序列)连接入pT2AL空载体质粒中,构建pT2AL‑Pn质粒;然后
将eGFP荧光蛋白编码区序列连接入上述构建的pT2AL‑Pn质粒中Pn序列的下游,获得pT2AL‑
Pn‑eGFP质粒。
[0085] 具体步骤如下:
[0086] 1.1构建pT2AL‑Pn质粒
[0087] 1.1.1通过对空载体pT2AL(西南大学李礼教授实验室提供)多克隆位点序列进行分析,找到合适的双酶切位点Sma I,BamH I(NEB)(存在于pT2AL空载体多克隆位点中,但不
存在于目的片段Pn中,以免将目的片段切碎)。
[0088] 1.1.2设计5’端带保护碱基的酶切位点引物:
[0089] F5’‑3’:TCCCCCGGGACTGGTGGGCTCTGAGT;
[0090] R5’‑3’:CGGGATCCGGGCAGCGTCAGTCTCCTCT;
[0091] 利用高保真酶PrimerSTAR(Takara)通过PCR扩增技术将目的片段从P.nyererei基因组中扩增出来(退火温度Touch‑down:60℃‑50℃,延伸时间2min)并将双酶切位点引入待
连接的目的片段两侧。
[0092] 1.1.3利用胶回收试剂盒(Biospin)对上述PCR扩增产物进行纯化,详细步骤可参阅试剂盒说明书。
[0093] 1.1.4利用双酶切体系(NEB),分别对空载体pT2AL质粒和纯化后的PCR扩增片段进行双酶切,使得质粒载体和PCR产物分别暴露出相同的双酶切位点(Sma I,BamH I)。利用胶
回收试剂盒(Biospin)对酶切后的产物进行纯化回收,并利用Nanodrop2000测定浓度。
[0094] 1.1.5利用连接酶(Solution I,Takara)对双酶切后纯化回收后的线性空载体pT2AL质粒和纯化后的PCR目的片段进行连接。16℃连接2h。连接体系利用如下公式计算:
[0095] (C1V1/目的片段长度)/(C2V2/载体片段长度)=10
[0096] 其中:V1+V2=7.5μL;Solution I=2.5μL;
[0097] C1:目的片段浓度C2:载体浓度
[0098] 1.1.6转化:将上述连接产物(10ul)转化入装有30ul大肠杆菌DH5α感受态细胞(生工)的1.5ml EP管中,冰上放置30min,42℃热激90s后置于冰上5min。加入大肠杆菌培养液
1ml,37℃180rpm扩增培养30min。4000rpm离心5min,弃掉多数上清液(保留约200ul液体即
可)。用移液器反复吹打沉淀和保留的液体将其混匀后,均匀涂于含有氨苄抗生素的大肠杆
菌培养基中,37℃过夜培养,以便筛选出确实将目的片段连接入含有抗氨苄的pT2AL质粒,
获得pT2AL‑Pn质粒。
[0099] 1.1.7挑选培养基中的阳性单克隆菌落到1ml含有氨苄抗生素的培养液中,37℃摇菌扩大培养后送公司提质粒,并对质粒中多克隆位点的T3位点进行Sanger测序(擎科),进
一步确定所挑单克隆确实为连接成功的pT2AL‑Pn质粒。测序结果见图1a,图1b。
[0100] 1.1.8将上述成功构建得到的pT2AL‑Pn质粒在大肠杆菌DH5α感受态细胞中进行转化(转化步骤同步骤1.1.6)。挑取单克隆到40ml含有氨苄抗生素的培养液中,37℃180rpm培
养12‑16h,提取质粒(质粒小提中量试剂盒,Tiangen,详细步骤参见试剂盒说明书),提取后
的质粒于‑20℃冰箱保存。
[0101] 1.2.构建pT2AL‑Pn‑eGFP质粒:
[0102] 1.2.1通过对上述构建获得的pT2AL‑Pn质粒中多克隆位点以及eGFP编码区序列进行分析,找到合适的双酶切位点BamH I,Stu I(存在于pT2AL‑Pn多克隆位点中,但不存在于
eGFP编码区中,以免将eGFP编码区切碎)。
[0103] 1.2.2设计5’端带保护碱基的酶切位点引物:
[0104] F:5’‑3’CGGGATCCATGGTGAGCAAGGGCGAGGA,
[0105] R:5’‑3’GAAGGCCTTTACTTGTACAGCTCGTCCA;
[0106] 利用高保真酶PrimerSTAR(Takara)通过PCR扩增技术将目的片段eGFP编码区扩增出来(退火温度Touch‑down:60℃‑50℃,延伸时间1min),并将酶切位点引入片段两侧。
[0107] 1.2.3利用胶回收试剂盒(Biospin)对上述PCR扩增产物进行纯化,详细步骤可参阅试剂盒说明书。
[0108] 1.2.4利用双酶切体系(NEB),分别对pT2AL‑Pn质粒和纯化后的eGFP PCR产物进行双酶切,使得质粒载体和eGFP分别暴露出相同的酶切位点(BamH I、Stu I),利用胶回收试
剂盒(Biospin)对酶切后的产物进行纯化回,并利用Nanodrop2000测定浓度。
[0109] 1.2.5利用连接酶(Solution I,Takara)对双酶切后纯化回收后的线性载体pT2AL‑Pn质粒和纯化后的eGFP目的片段进行连接。16℃连接2h。连接体系利用如下公式计
算:
[0110] (C1V1/目的片段长度)/(C2V2/载体片段长度)=10
[0111] 其中:V1+V2=7.5μL Solution I=2.5μL
[0112] C1:目的片段浓度 C2:载体浓度
[0113] 1.2.6转化:同步骤1.1.6。筛选出确实将eGFP目的片段连接入含有抗氨苄的pT2AL‑Pn质粒中的pT2AL‑Pn‑eGFP质粒。
[0114] 1.2.7挑选培养基中的阳性单克隆菌落到1ml含有氨苄抗生素的培养液中,37℃摇菌扩大培养后送公司提质粒,并过对质粒中多克隆位点的T7位点进行Sanger测序(擎科生
物公司),进一步确定所挑单克隆确实为连接成功的pT2AL‑Pn‑eGFP质粒。测序结果见图2a
和图2b。
[0115] 1.2.8将上述成功构建得到的pT2AL‑Pn‑eGFP质粒在大肠杆菌感受态细胞中进行转化(转化步骤同步骤6)。挑取单克隆到40ml含有氨苄抗生素的培养液中,37℃180rpm培养
12‑16h,提取质粒(质粒小提中量试剂盒,Tiangen,详细步骤参见试剂盒说明书),提取后的
质粒于‑20℃冰箱保存。
[0116] 1.2.9最后将挑选出来的质粒利用T3和T7引物将连接入质粒的外源片段测通,进一步确定所连入序列为目的序列Pn‑eGFP,所构建质粒为pT2AL‑Pn‑eGFP(见质粒图3a,质粒
全序列如SEQ ID NO:5所示)。
[0117] 2.构建pT2AL‑On‑eGFP质粒
[0118] 利用上述已构建的质粒pT2AL‑Pn‑eGFP中Pn序列两侧的双酶切位点(Sma I和BamH I),将上述已构建得到的pT2AL‑Pn‑eGFP质粒中的Pn序列切下去,替换为东非丽鱼奈里朴丽
鱼P.nyererei的近缘种尼罗罗非鱼O.niloticus中与Pn序列同源的序列,以下简称On,构建
得到pT2AL‑On‑eGFP质粒。具体步骤如下:
[0119] 2.1利用上述已构建的质粒pT2AL‑Pn‑eGFP中Pn序列两侧的双酶切位点(Sma I和BamH I)(该双酶切位点不存在于On序列中,因此不会将On序列切碎)构建pT2AL‑On‑eGFP质
粒。设计5’端带保护碱基的酶切位点引物:
[0120] F:5’‑3’TCCCCCGGGACTGGTGGGCTCTGAGT,
[0121] R:5’‑3’CGGGATCCGGGCAGCGTCAGTCTCCTCT,
[0122] 通过PCR扩增技术将目的片段On从尼罗罗非鱼O.niloticus基因组中扩增出来(退火温度Touch‑down:60℃‑50℃,延伸时间2min)并将双酶切位点引入待连接的目的片段两
侧。
[0123] 2.2利用胶回收试剂盒(Biospin)对上述PCR扩增产物进行纯化,详细步骤可参阅试剂盒说明书。
[0124] 2.3利用双酶切体系(NEB),分别对已构建的pT2AL‑Pn‑eGFP质粒和纯化后的PCR产物进行双酶切,使得质粒载体和PCR产物分别暴露出相同的酶切位点(Sma I和BamH I),将
Pn序列从已构建的pT2AL‑Pn‑eGFP质粒中切掉。利用胶回收试剂盒(Biospin)对酶切后的产
物进行纯化回收,并利用Nanodrop2000测定浓度。
[0125] 2.4利用连接酶(Solution I,Takara)对双酶切后纯化回收后的线性载体pT2AL‑eGFP质粒和纯化后的PCR目的片段进行连接。16℃连接2h。连接体系利用如下公式计算:
[0126] (C1V1/目的片段长度)/(C2V2/载体片段长度)=10
[0127] 其中:V1+V2=7.5ul Solution I=2.5ul
[0128] C1:目的片段浓度 C2:载体浓度
[0129] 2.5转化:同步骤1.1.6。筛选出确实将On序列连接入含有抗氨苄的pT2AL‑eGFP质粒,获得pT2AL‑On‑eGFP质粒。
[0130] 2.6挑选培养基中的阳性单克隆菌落到1ml含有氨苄抗生素的培养液中,37℃摇菌扩大培养后送公司提质粒,并对质粒中多克隆位点的T3位点进行Sanger测序(擎科),进一
步确定所挑单克隆确实为连接成功的pT2AL‑On‑eGFP质粒。测序结果见图4a和图4b。
[0131] 2.7将上述成功构建得到的pT2AL‑On‑eGFP质粒在大肠杆菌感受态细胞中进行转化(转化步骤同上)。挑取单克隆到40ml含有氨苄抗生素的培养液中,37℃180rpm培养12‑
16h,提取质粒(质粒小提中量试剂盒,Tiangen,详细步骤参见试剂盒说明书),提取后的质
粒于‑20℃冰箱保存。
[0132] 2.8最后将挑选出来的质粒利用T3和T7引物将连接入质粒的片段测通,进一步确定所连入序列为目的序列On‑eGFP,所构建质粒为pT2AL‑On‑eGFP(见质粒图谱3b)。
[0133] 3.构建pT2AL‑Pn‑noSNPs‑eGFP质粒
[0134] 利用桥式PCR扩增方法(参见Reikofski J,Tao BY.Polymerase chain reaction(PCR)techniques for site‑directed mutagenesis.Biotechnol.Adv.Biotechnol Adv;
1992;10:535–47.),将Pn序列中特定的连续三个连续SNPs位点(GTA)删除,得到序列Pn‑
noSNPs序列。利用上述已构建的质粒pT2AL‑Pn‑eGFP中Pn序列两侧的双酶切位点(Sma I和
BamH I),将上述已构建得到的pT2AL‑Pn‑eGFP质粒中的Pn序列切下去,替换为删除了三个
连续SNPs位点的Pn‑noSNPs序列,构建得到pT2AL‑Pn‑noSNPs‑eGFP质粒。具体步骤如下:
[0135] 3.1利用桥式PCR技术,将Pn序列中特定的三个连续SNPs位点删除,得到Pn‑noSNPs序列。简言之,在要删除SNPs的位置设计引物分别扩增包含有删除掉该位置的前片段(AB)
和包含有删除掉该位置的后片段(CD),然后分别将PCR片段纯化回收后混合(AB+CD)。再在
整个序列(AD)两端设计PCR引物,以混合后的目的片段(AB+CD)为模板,扩增整条序列,从而
将目的片段中的三个连续SNPs位置删除。同时,在整个序列扩增的时候,在引物上加入带有
保护碱基的双酶切位点(Sma I和BamH I),从而将酶切位点引入PCR扩增产物。各引物序列
(5’‑3’)如下:
[0136] FA:TCCCCCGGGCTGGTGGGCTCTGAGTCTTTG
[0137] FB:TCTGATCAGATGGGGTTTGCTC
[0138] FC:GAGCAAACCCCATCTGATCAG
[0139] FD:CGGGATCCGGGCAGCGTCAGTCTCCTC
[0140] 利用高保真酶PrimerSTAR(Takara)通过PCR扩增技术将目的片段Pn‑noSNPs从质粒pT2AL‑Pn‑eGFP中扩增出来(退火温度:50℃,延伸时间:扩增AB、CD片段分别为1min;扩增
AD片段为2min)。
[0141] 3.2利用胶回收试剂盒(Biospin)对上述PCR扩增产物进行纯化,详细步骤可参阅试剂盒说明书。
[0142] 3.3利用双酶切体系(NEB),分别对已构建的pT2AL‑Pn‑eGFP质粒和纯化后的Pn‑noSNPs PCR产物进行双酶切,使得质粒载体和Pn‑noSNPs PCR产物分别暴露出相同的酶切
位点(Sma I和BamH I),,将Pn序列从已构建的pT2AL‑Pn‑eGFP质粒中切掉,利用胶回收试剂
盒(Biospin)对酶切后的产物进行纯化回收,并利用Nanodrop2000测定浓度。
[0143] 3.4利用连接酶(Solution I,Takara)对双酶切后纯化回收后的线性载体pT2AL‑eGFP质粒和纯化后的Pn‑noSNPs目的片段进行连接,16℃2h。连接体系利用如下公式计算:
[0144] (C1V1/目的片段长度)/(C2V2/载体片段长度)=10
[0145] 其中:V1+V2=7.5ul Solution I=2.5ul
[0146] C1:目的片段浓度 C2:载体浓度
[0147] 3.5转化:同步骤1.1.6。筛选出确实将Pn‑noSNPs目的片段连接入含有抗氨苄的pT2AL‑eGFP质粒,获得pT2AL‑Pn‑noSNPs‑eGFP质粒。
[0148] 3.6挑选培养基中的阳性单克隆菌落到1ml含有氨苄抗生素的培养液中,37℃摇菌扩大培养后送公司提质粒,并对在删除掉三个连续SNPs位点的位置附近设计引物
(testF5’‑3’:GTCTATGAAAACTCAATCAGGTG)进行Sanger测序(擎科生物公司),进一步确定所
挑单克隆确实为连接成功的删除掉三个连续SNPs(GTA)的pT2AL‑Pn‑noSNPs‑eGFP质粒。测
序结果见图5。
[0149] 3.7将上述成功构建得到的pT2AL‑Pn‑noSNPs‑eGFP质粒在大肠杆菌感受态细胞中进行转化(转化步骤同1.1.6)。挑取单克隆到40ml含有氨苄抗生素的培养液中,37℃180rpm
培养12‑16h,提取质粒(质粒小提中量试剂盒,Tiangen,详细步骤参见试剂盒说明书),提取
后的质粒于‑20℃冰箱保存。
[0150] 3.8最后将挑选出来的质粒利用T3和T7引物将连接入质粒的片段测通,进一步确定所构建质粒为pT2AL‑Pn‑noSNPs‑eGFP(见质粒图3c)。
[0151] 二.斑马鱼胚胎单细胞受精卵显微注射、荧光筛选及传代
[0152] 1.将上述成功构建的在东非丽鱼奈里朴丽鱼P.nyererei这个鱼类特有未知功能基因(此处我们命名为lg基因)的丽鱼特有上游插入片段作为启动子,驱动下游eGFP荧光蛋
白表达的1)pT2AL‑Pn‑eGFP质粒载体、2)由P.nyererei近缘物种尼罗罗非鱼O.niloticus的
与Pn具有94%相似同源性的上游片段构建的pT2AL‑On‑eGFP质粒载体、3)将Pn三个连续
SNPs位点删除后构建得到的pT2AL‑Pn‑noSNPs‑eGFP质粒载体分别转入大肠杆菌DH5α感受
态细胞中进行转化(转化步骤同1.1.6)。分别挑取单克隆到40ml含有氨苄抗生素的培养液
中,37℃180rpm培养12‑16h,利用无内毒素质粒提取试剂盒分别对这三个质粒载体进行去
内毒素质粒纯化提取,从而获得去除大肠杆菌胞体等物质的纯度较高的质粒载体。
[0153] 2.分别将这三个质粒载体(70ng/μL)和转座酶(100ng/μL)按照一定浓度比例混合后分别注射入斑马鱼单细胞受精卵,从而通过转座酶的作用分别将这个三个质粒载体随机
整合入斑马鱼基因组中。
[0154] 3.单细胞受精卵胚胎显微注射受精后24h在荧光显微镜下检测eGFP绿色荧光蛋白信号表达情况,从而确定显微注射是否成功,以及重组质粒是否能够驱动eGFP表达。
[0155] 4.将有荧光表达的受精卵挑选出来,于标准温度28.5℃下培养至性成熟(F0代)。将F0代与野生型斑马鱼交配,获得荧光后代个体为F1代。继续将F1代培养至性成熟,与野生
型斑马鱼交配,获得荧光F2代。自此,三个荧光品系的斑马鱼(pT2AL‑Pn‑eGFP,pT2AL‑On‑
eGFP,pT2AL‑Pn‑noSNPs‑eGFP)分别构建完成。
[0156] 三.通过共聚焦荧光显微呈像、荧光免疫组化细胞共定位,确定荧光表达部位及细胞类型
[0157] 1.利用Zeiss 880共聚焦显微镜,检测转基因品系pT2AL‑Pn‑eGFP斑马鱼eGFP荧光表达位置。同时对于一些有相应分子标记抗体的细胞/组织,利用相应抗体,通过荧光免疫
组化反应(参见Barresi MJF,Stickney HL,Devoto SH.The zebrafish slow‑muscle‑
omitted gene product is required for Hedgehog signal transduction and the 
development of slow muscle identity.Development.2000;127:2189–99.)在647nm通道
激发荧光,与本发明所构建的转基因斑马鱼品系在488nm激发光通道的eGFP荧光蛋白进行
细胞共定位,从而进一步确定eGFP绿色荧光蛋白所表达的细胞类型。所用到的荧光标记抗
体包括标记孵化腺细胞的anti‑Cathepsin L/MEP抗体(ab209708,abcam);标记小脑神经元
的anti‑Pvalb7抗体(名古屋大学Masahiko Hibi教授提供);标记表皮化学感受细胞的
anti‑Serotonin抗体(s5545,Sigma);标记神经元的anti‑HuC/HuD抗体(16A11,
Invitrogen);标记下颌软骨的anti‑SOX10抗体(ab229331,abcam);标记成骨细胞的anti‑
Collagen type II抗体(II‑II6B3,DSHB);标记绿色荧光蛋白的anti‑GFP抗体(ab6673,
abcam)。二抗抗体包括驴抗山羊IgG H&L(Alexa 488)预吸附二抗(ab150133,abcam),
驴抗小鼠IgG H&L(Alexa 647)抗体(ab150107,abcam),以及驴抗兔IgG H&L(Alexa
647)预吸附二抗(ab150063,abcam)以及DAPI染色剂(ab228549,abcam)。
[0158] 实验结果:
[0159] 1.首次成功构建了三个转基因品系:1)由鱼类特有未知功能基因(此处命名为lg基因)在东非丽鱼P.nyererei特有上游序列片段作为启动子驱动eGFP荧光蛋白表达的斑马
鱼转基因品系pT2AL‑Pn‑eGFP,2)由其近缘物种尼罗罗非鱼(O.niloticus)同源序列(同源
性94%)作为启动子驱动eGFP荧光蛋白表达的斑马鱼转基因品系pT2AL‑On‑eGFP;3)将
pT2AL‑Pn‑eGFP中由P.nyererei上游片段作为启动子的序列删除掉O.niloticus中所不具
有的三个连续SNPs,构建得到斑马鱼转基因品系pT2AL‑Pn‑noSNPs‑eGFP.
[0160] 质粒图谱分别见图3a,图3b,图3c
[0161] 2.结果表明,P.nyererei上游序列的确具有启动子功能,能够驱动荧光蛋白在多种重要的细胞/组织中高表达:与鱼卵孵化相关的孵化腺细胞(图6a),与感知外界环境(如
水流、信息素、荷尔蒙等)相关的表皮感受细胞(图6b),与控制血流方向、防止血流倒退的心
脏瓣膜细胞(图6c)、与取食相关的下颌软骨细胞(图6d)、与运动相关的鱼鳍中的成骨细胞
(图6e,图6f,图6g)、与视觉相关位于眼部的内核层以及外核层神经元细胞(图6h)以及脑中
大部分神经元细胞(如与感知食物、信息素、荷尔蒙等相关的位于前脑的嗅觉上皮细胞(图
6i)和嗅球(图6j)、与视觉传递相关的位于中脑的视顶盖神经元细胞(图6k)、与运动平衡相
关的小脑神经元细胞(图6k,6l)、与神经传递相关的后脑(图6m)及脊髓神经元细胞(图
6n))。
[0162] 有趣的是,在P.nyererei的近缘物种尼罗罗非鱼O.niloticus中,与Pn序列同源94%相似的On序列虽然也具有启动子功能能够驱动eGFP的表达,但是其表达细胞类型和信
号强度相比于Pn序列(图7a)明显减弱(图7b),其主要在小脑、后脑、脊髓以及和下颌骨形成
相关的前两个骨弓中表达,而在其他细胞和组织中信号则非常弱。
[0163] 而在Pn序列中删除掉On中所不具备的三个连续SNPs位点(GTA)之后的Pn‑noSNPs序列,其所驱动的eGFP荧光蛋白表达信号也明显减弱,所表达细胞类型也明显变少(图7c),
荧光表达部位主要在视顶盖、嗅觉上皮、后脑和下颌骨的前两个骨弓中。表达模式变得更类
似于尼罗罗非鱼On序列的表达模式(图7b)。
[0164] 利用Zeiss880共聚焦显微镜相同参数下拍摄这三种转基因品系斑马鱼4dpf(days post fertilization)胚胎的小脑、后脑和下颌骨前两个骨弓部分,通过统计学分析荧光信
号强度,发现确实pT2AL‑Pn‑eGFP品系信号强度相比于pT2AL‑On‑eGFP品系和pT2AL‑Pn‑
noSNPs‑eGFP品系,存在统计学上的显著差异(图7d)。说明所删除掉的只有P.nyererei所具
有而O.niloticus所不具备的三个连续SNPs(GTA),是导致pT2AL‑Pn‑eGFP品系和pT2AL‑On‑
eGFP品系荧光表达模式差别的重要原因。
[0165] 以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为
本发明的保护范围。