一种功能元件的建库方法及其应用转让专利

申请号 : CN202011630533.X

文献号 : CN112725329B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 施金秀罗燕肖晓丹叶知晟

申请人 : 云舟生物科技(广州)有限公司

摘要 :

本发明公开了一种文库高度多样性的文库构建方法,摒弃了蛋白改组中所采用的体外同源重组技术,通过引入Y型adaptor与DNaseI消化后小于100bp的随机片段连接,成功解决了具有相似特性的或具有特定或未知功能的功能元件无法进行有效重组的缺陷,该方法主要涉及三种文库的构建,分别为构建标签文库、功能元件文库以及索引标签文库,能够快速高通量实现功能元件多样性的构建方法,为最终筛选得到具有优良性能的功能元件奠定了坚实的基础。

权利要求 :

1.一种功能元件文库构建的方法,其特征在于,所述方法包括以下步骤:S01 .构建标签文库;

S02 .构建功能元件文库;

S03 .构建索引标签文库;

所述步骤S01的具体操作为:

a.线性化载体,回收线性化载体骨架;

b.用携带随机标签序列及同源臂的引物扩增载体骨架,获得带有随机标签序列的PCR产物;

c.将PCR产物与回收的线性化载体骨架连接,构建得标签文库;所述载体包括载体骨架与依次连接于载体骨架上的第一终止子、重组位点、报告基因、多克隆位点、转录后调控序列和第二终止子;

其中步骤a中通过单酶切线性化所述载体;步骤b中所述引物的上游引物中含有所述随机标签序列;步骤b中所述引物的上下游引物均含有酶切位点;

步骤c中将连接产物转化大肠杆菌,用于储存;

所述步骤S02的具体操作为:

d.将功能元件的核酸片段随机打断,得功能元件随机短片段;

e.将功能元件随机短片段与Y型接头连接,得含有Y型接头的功能元件随机长片段;

f.将含有Y型接头的功能元件随机长片段与步骤S01构建得到的标签文库进行连接,构建功能元件文库;

所述Y型接头的结构依次包括第一同源臂、第一index序列、酶切位点、随机序列嵌入位点、酶切位点、第二index序列和第二同源臂;所述Y型接头由引物A:GGGCTCACCTCAGGCTACGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCGATCGCTTCATTC(SEQ ID NO.3)和引物B:Phos‑GAATGAAGCGATCGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCCTGACGTAGGCTGACGGC(SEQ ID NO.4)混匀后通过退火制备得到;

所述步骤d中将功能元件的核酸片段随机打断成小于100bp的片段,将核酸片段随机打断后进行末端补平,形成不同大小的平末端短片段;

所述步骤S03的具体操作为:酶切步骤S02中构建的功能元件文库,去除随机序列嵌入位点,回收载体骨架并自连,构建得索引标签文库。

2.根据权利要求1所述的方法,其特征在于,所述步骤e中通过PCR扩增增加含有Y型接头的功能元件随机长片段的产量,将含有Y型接头的功能元件随机长片段改构为双链DNA片段;

所述PCR扩增的引物序列为:

F2:CGGTGGGCTCTATGGTGAGACGCCAGCCGTGGGCTCACCTCAGGCTACGG(SEQ ID NO.5);

R2:GTCTAGACCTCGAGGAGAGACGCCACGGCTGCCGTCAGCCTACGTCAGGG(SEQ ID NO.6)。

3.权利要求1或2所述的功能元件文库构建的方法在筛选功能元件方面的应用。

4.一种筛选功能元件的方法,其特征在于,包括功能元件文库构建的步骤,所述功能元件文库构建的方法如权利要求1或2所述的方法。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括以下步骤:S11  .将权利要求1或2所述方法构建得到的功能元件文库转染细胞或注射入实验动物体内;

S12 .通过报告基因表达情况选取细胞或组织提取mRNA,逆转录成cDNA;

S13 .对所述标签进行测序,通过所述标签序列、第一index序列和第二index序列的对应关系筛选得到功能元件。

说明书 :

一种功能元件的建库方法及其应用

技术领域

[0001] 本发明属于生物工程领域,更具体地,涉及一种功能元件的建库方法及其应用。

背景技术

[0002] 自然进化是一个漫长的优胜劣汰、有利突变不断积累的过程,为了加快这一进程,研究人员在体外模拟突变、重组和选择的自然进化机制,使进化朝着预期的方向发展。早期
研究人员主要采用物理方法、化学方法、致突变菌株或易错PCR等方法将随机突变引入到蛋
白质编码基因中,然后进行细胞或动物水平的功能筛选,从而得到能够满足人们需要的新
功能或优良性能的蛋白质。这些方法虽然能够在一定程度上改善蛋白的某些特性,但是其
所具备的多样性远远无法满足人们的需求。随着分子生物学的不断发展,人们建立了一种
基于PCR技术的新的体外定向分子进化技术‑DNA改组(DNA shuffling)技术,该技术由
Stemmer于1994年首次提出,可用于核酸、蛋白的体外定向进化。DNA改组涉及将不同来源的
多个相关基因家族通过DNaseI消化成随机片段,然后利用各片段间的同源性互为模板和引
物,经过无引物PCR(primerless PCR)将这些片段重新组装成全长基因,该过程会所产生模
板切换或交叉事件,从而增加了突变体文库的多样性。然后利用针对不同蛋白编码框的特
异性5’端和3’端引物对蛋白突变体进行扩增,并克隆到相关的克隆载体上形成突变体文
6
库,通过NGS测序验证文库多样性(~10以上),最后在细胞水平或动物水平进行功能筛选,
得到一种具有改良特性的蛋白。该方法主要针对蛋白分子的定向进化,作为起始模板的不
同基因之间需要具备一定的同源性,从而产生小片段间的体外同源重组引入突变形成可供
筛选的突变体文库。
[0003] 以启动子为例,启动子是一段位于结构基因5’上游区域的DNA序列,能够准确地与特定的RNA聚合酶及相关转录因子结合,从而启动下游基因的转录起始,是调控基因表达最
重要的顺式作用元件。真核生物启动子包含三种具有重要生物功能的保守序列,分别为位
于‑35~‑25区的TATA盒(TATA box)、位于‑80~‑70区的CAAT盒(CAAT box)和位于‑110~‑
80区的GC盒(GC box)。其中TATA盒参与调控下游基因的精确转录起始,CAAT盒和GC盒参与
调控转录起始的频率。尽管上述三种功能区域是构成启动子功能活性的重要体现,但并不
是每个启动子都包含这三种功能区域,这三个功能区域的任意碱基或相对位置的改变往往
会造成启动子活性及特异性的剧烈变化。上游启动子活性是决定下游基因能否顺利表达及
表达水平是否适中的关键性因素,因此,为了使目的基因获得更好的表达,在体外利用分子
定向进化技术对启动子进行改造筛选便显得尤为重要。
[0004] 现有技术中,启动子或增强子改组(promoter or enhancer shuffling)的主要目的是增强启动子的活性或特异性,具有相似特性的启动子(如特异性靶向相同的组织或器
官)之间往往同源性极低,因此上述针对蛋白分子的DNA改组技术显然并不能够生搬硬套用
于启动子的定向进化。目前,启动子改组一般采用以下技术路线:(1)对单个启动子进行两
轮易错PCR,回收PCR产物(形成大量具有同源序列的突变体);(2)用DNaseI消化成小于
100bp的随机片段并回收;(3)将回收产物作为模板,进行无引物PCR;(4)在无引物PCR体系
中加入含有特定酶切位点的特异性引物扩增全长启动子,回收特定大小的PCR产物;(5)用
对应的限制性内切酶对克隆载体及全长启动子突变体进行酶切连接;(6)高通量(Next 
Generation Sequencing,NGS)测序验证启动子文库的多样性。该技术路线高度重复了蛋白
定向进化的方法,且仅能对单个启动子来源进行改组,即便第一轮的易错PCR提高了模板的
多样性,其本质上仍来源于同一个启动子,因此该启动子文库的多样性仍受到极大的限制。
因此,急需开发出解决不同来源启动子由于同源性低而无法进行高效的体外重组导致文库
多样性不足的问题。

发明内容

[0005] 本发明的目的在于克服启动子改组方法的局限性,解决不同来源启动子由于同源性低而无法进行高效的体外重组导致文库多样性不足的问题,提供一种功能元件文库的构
建方法
[0006] 本发明所采取的技术方案是:
[0007] 本发明的第一个方面,提供一种载体,所述载体包括载体骨架与依次连接于载体骨架上的第一终止子、重组位点、报告基因、多克隆位点(MCS)、转录后调控序列(WPRE)和第
二终止子。
[0008] 优选地,根据本发明第一个方面所述的载体,所述载体上还包括至少一个酶切位点。
[0009] 优选地,所述报告基因的表达产物为可通过催化底物反应自身发光或产生颜色变化、可通过催化底物反应使底物发光或产生颜色变化、或经过激发光照射而产生发射光或
产生颜色变化、或可抵抗相应药物筛选。
[0010] 具体地,所述报告基因选自荧光蛋白、荧光素酶、LacZ基因或能起到筛选作用的抗性基因中的至少一种,所述抗性基因例如嘌呤霉素抗性基因。
[0011] 在本发明的部分实施例中,所述报告基因选用TurboGFP。
[0012] 优选地,所述第一终止子与第二终止子为能起转录终止作用的元件。
[0013] 具体地,所述终止子SV40终止子、hGH终止子、BGH终止子或rbGlob终止子。
[0014] 在本发明的部分实施例中,所述第一终止子与第二终止子都选用BGH终止子,记为BGH‑pA。
[0015] 本发明的第二个方面,提供本发明第一个方面所述的载体在文库构建或功能元件筛选方面的应用。
[0016] 本发明的第三个方面,提供一种文库构建的方法,利用Y型接头将随机打断的序列整合入权利要求1所述载体中。
[0017] 具体地,所述整合位点为所述载体的重组位点。
[0018] 进一步地,所述Y型接头从结构上分为互补区和非互补区。
[0019] 更进一步地,所述Y型接头的5’端的非互补序列分别包含来自于骨架载体克隆位点前后两端的第一同源臂、第二同源臂以及第一index序列、第二index序列,3’端的互补序
列包含酶切位点。
[0020] 具体地,所述Y型接头的结构依次为第一同源臂、第一index序列、酶切位点、随机序列嵌入位点、酶切位点、第二index序列和第二同源臂。
[0021] 所述同源序列便于后续与骨架载体进行Gibson克隆反应。
[0022] 所述酶切位点不同于本发明第一个方面所述载体上的酶切位点,该酶切位点可用于功能筛选后的功能元件的测序验证。
[0023] 在本发明的部分实施方式中,所述酶切位点选用AsiSI酶切位点。
[0024] 在本发明的部分实施方式中,所述Y型接头通过PCR引物退火制备得到。
[0025] 进一步地,所述PCR的下游引物上还有酶切位点。
[0026] 更具体地,所述Y型接头由引物A:GGGCTCACCTCAGGCTACGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCGATCGCTTCATTC(SEQ  ID  NO .3)和引物B  Phos‑
GAATGAAGCGATCGCNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNCCCTGACGTAGGCTGACGGC(SEQ ID 
NO.4)混匀后通过退火制备得到。
[0027] 根据本发明第三个方面的方法,包括以下步骤:
[0028] S01.构建标签文库;
[0029] S02.构建功能元件文库;
[0030] S03.构建索引标签文库。
[0031] 进一步地,步骤S01中所述标签是一种具有约40个碱基的随机序列,
[0032] 优选地,随机标签序列位于荧光示踪筛选基因TurboGFP下游,
[0033] 更优选地,随机标签序列位于荧光示踪筛选基因TurboGFP与polyA之间,可在mRNA水平确定Barcode序列,从而间接确定其所对应的功能元件序列。
[0034] 更具体地,步骤S01的具体操作为:
[0035] a.线性化所述载体,回收线性化载体骨架;
[0036] b.用携带随机标签序列及同源臂引物扩增载体骨架,获得带有随机标签序列的的PCR产物;
[0037] c.将PCR产物与回收的线性化载体骨架连接,构建得标签文库。
[0038] 优选地,步骤a中通过单酶切线性化所述载体。
[0039] 优选地,步骤b中所述引物的上游引物中含有所述随机标签序列。
[0040] 优选地,步骤b中所述引物的上下游引物均含有酶切位点。由此扩增出来的PCR片段酶切后可以与酶切后的载体骨架连接。
[0041] 优选地,步骤c中将连接产物转化大肠杆菌,用于储存。
[0042] 在本发明的部分实施方式中,使用XbaI酶切骨架载体,所使用的引物为:F端引物:CACCAAGGAAGCCCTCGAGGACGCGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGATCCCGAC
CTACCGACCCAGCTTTC(SEQ ID NO.1)和R端引物AGGCGAAGACGCGGAAGAGG(SEQ ID NO.2)。
[0043] 回收纯化PCR产物后使用Mlu I+Tfi I进行酶切纯化,得到嵌入标签Insert‑Barcode片段;使用Mlu I+Tfi I酶切克隆骨架,回收4849bp片段作为载体骨架;随后将嵌入
标签Insert‑Barcode片段和文库骨架进行连接反应,并转化至大肠杆菌DH10B中,得到标签
Barcode文库。
[0044] 在本发明的部分实施例中,步骤S01的具体技术路线如下:利用特定的限制性内切酶切除骨架载体MCS和部分元件序列,回收骨架大片段,利用5’端携带随机标签Barcode序
列及同源臂的引物PCR扩增骨架载体,获得带有Barcode的PCR产物;将该PCR产物与经酶切
回收骨架载体进行Gibson克隆反应,构建标签文库,或记为Barcode文库。
[0045] 此外,还可以通过高通量NGS测序验证标签Barcode文库的多样性。
[0046] 进一步地,步骤S02利用所述Y型接头将随机打断的所述功能元件的序列整合入所述载体中。
[0047] 更具体地,步骤S02的具体操作为:
[0048] d.将功能元件的核酸片段随机打断,得功能元件随机短片段;
[0049] e.将功能元件随机短片段与Y型接头连接,得含有Y型接头的功能元件随机长片段;
[0050] f.将含有Y型接头的功能元件随机长片段与步骤S01构建得到的标签文库进行连接,构建功能元件文库。
[0051] 优选地,步骤d中将功能元件片段随机打断成小于100bp的片段。
[0052] 更优选地,步骤d中将功能元件片段随机打断成约50bp的片段。
[0053] 优选地,步骤d中将核酸片段随机打断后进行末端补平,形成不同大小的平末端短片段。
[0054] 优选地,步骤d中所述功能元件的核酸片段为某一特定功能的多种功能元件的核酸片段。
[0055] 优选地,步骤e中可以通过PCR增加含有Y型接头的功能元件随机长片段的产量,并且将含有Y型接头的功能元件随机长片段改构为双链DNA片段。纯化PCR产物后再与标签
Barcode文库进行连接。
[0056] 这一步骤中所使用的引物为:F2:CGGTGGGCTCTATGGTGAGACGCCAGCCGTGGGCTCACCTCAGGCTACGG(SEQ ID NO.5);
[0057] R2:GTCTAGACCTCGAGGAGAGACGCCACGGCTGCCGTCAGCCTACGTCAGGG(SEQ ID NO.6)。
[0058] 进一步地,步骤e中所述Y型接头通过PCR引物退火制备得到。
[0059] 进一步地,所述PCR的下游引物上还有酶切位点。
[0060] 在本发明的部分实施方式中,所述Y型接头由引物A:GGGCTCACCTCAGGCTACGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCGATCGCTTCATTC(SEQ ID NO.3)和引物B Phos‑
GAATGAAGCGATCGCNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNCCCTGACGTAGGCTGACGGC(SEQ ID 
NO.4)混匀后通过退火制备得到。
[0061] 在本发明的部分实施方式中,步骤S02的具体技术路线如下:分别PCR扩增并回收数种具有相同组织特异性或具有特定或未知功能的功能元件;将数种功能元件用DNaseI消
化成小于100bp的随机片段并进行末端补平,回收目的大小条带,如约50bp的小条带;加入
经过退火反应的Y型adaptor与随机平末端短片段进行连接并进行PCR反应,得到结构为第
一同源臂‑第一index序列‑AsiSI酶切位点‑功能元件片段‑AsiSI酶切位点‑第二index序
列‑第二同源臂的克隆片段;克隆片段再次与预先酶切的Barcode文库进行连接,得到功能
元件文库。第一index序列记为index1,第二index序列记为index2。
[0062] 在本发明的部分实施方式中,具体使用Xcm I酶切步骤S01中得到的Barcode文库,回收4845bp片段作为文库骨架;将功能元件随机片段和文库骨架进行连接反应,并转化至
大肠杆菌DH10B中,得到启动子文库。
[0063] 进一步地,步骤S03的具体技术路线为:酶切步骤S02中构建的功能元件文库,去除随机序列嵌入位点,回收载体骨架并自连,构建得索引标签文库。
[0064] 优选地,通过少量多次添加的方法,将酶切功能元件文库得到的片段加入到连接反应中,尽可能地使连接反应中发生的为分子内的连接反应,即使单个线性化片段自身环
化连接;并将连接产物转化至大肠杆菌DH10B中,得到索引标签文库。
[0065] 为了确定index1、index2和Barcode之间的一一对应关系,利用酶切功能元件文库,切去功能元件随机片段,回收骨架并自连,从而实现在一个高通量测序反应中同时对
index1、index2和Barcode进行测序(高通量测序NGS的测序读长最大为1kb),构建得索引标
签文库,发明人将该文库命名为Marriage文库。
[0066] 以Marriage文库质粒为模板,PCR扩增Marriage文库中的index1、index2以及Barcode序列进行高通量测序NGS测序,通过数据分析可以确定三者之间的对应关系。
[0067] 本发明的第四个方面,提供本发明第三个方面所述方法在筛选功能元件方面的应用。
[0068] 本发明的第五个方面,提供一种筛选功能元件的方法,包括文库构建的步骤,所述文库构建的方法本发明第三个方面所述的方法。
[0069] 根据本发明第五个方面所述的方法,包括以下步骤:
[0070] S11.将本发明第三个方面所述的方法构建得到的功能元件文库转染细胞或注射实验动物;
[0071] S12.通过报告基因表达情况选取细胞或组织提取mRNA,逆转录成cDNA;
[0072] S13.对所述标签进行测序,通过所述标签序列、第一index序列和第二index序列的对应关系筛选得到功能元件。
[0073] 在本发明的部分实施方式中,首先将启动子文库转染特定的细胞或显微注射实验动物,如果是病毒载体,则需要包装成病毒颗粒再感染细胞或活体动物,然后观察TurboGFP
荧光表达情况,选择荧光表达强度合适的细胞或组织提取mRNA,逆转录成cDNA并对所述标
签Barcode进行测序,通过Marriage文库中index1、index2和Barcode的对应关系可得到相
应的index1和index2具体序列,最后再以已知序列的index1和index2为引物,以功能元件
文库为模板,PCR扩增出特定的功能元件,最终筛选得到具有优良性能(如片段较小,特异性
高,启动能力强)的功能元件序列。
[0074] 本发明的有益效果是:
[0075] 现有的特定功能元件改组技术是基于蛋白改组中的体外同源重组而来,往往只能利用单一的功能元件作为起始的改组模板,所得到的文库多样性不足。本发明提供了一种
文库高度多样性的文库构建方法,摒弃了蛋白改组中所采用的体外同源重组技术,通过引
入Y型adaptor与DNaseI消化后小于100bp的随机片段连接,成功解决了具有相似特性的或
具有特定或未知功能的功能元件无法进行有效重组的缺陷,该方法主要涉及三种文库的构
建,分别为构建Barcode文库、功能元件文库以及Marriage文库,能够快速高通量实现启动
子或增强子高度多样性的构建方法,该方法也可应用于其他功能元件的构建和筛选,为最
终筛选得到具有优良性能的功能元件奠定了坚实的基础。

附图说明

[0076] 图1Y型接头示意图。
[0077] 图2原始载体图谱(示例)。
[0078] 图3构建标签Barcode文库的载体图谱。
[0079] 图4构建启动子文库的载体图谱。
[0080] 图5构建索引标签Marriage文库的载体图谱。
[0081] 图6小鼠视网膜下原位注射后视网膜切片荧光图。A图中较亮的红色荧光即代表视锥细胞的分布,B图则是整个文库在视网膜中的分布表达情况,C图是A图和B图的共染图,图
C中黄橙色荧光标记的细胞即为可用于后续的启动子序列鉴定。

具体实施方式

[0082] 以下结合具体的实施例及附图对本发明的内容作进一步详细的说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。
[0083] 下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所
述的条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用化学试剂,均为市售
产品。
[0084] 实施例中选用AAV载体作为示例,质粒图谱如附图2所示。本领域一般技术人员应理解采用常规建库使用的载体均可实现本发明目的。如pUC18,pBR322载体等,可根据后续
筛选的方法和应用场景选择不同的载体。
[0085] 基因组功能元件(functional elements)指参与基因表达调控的元件,主要包括顺式作用元件(cis‑acting element)和反式作用因子(trans‑acting element)常见的包
括:启动子(promoter)、增强子(enhancer)、沉默子(silencer)、调控序列(regulatory 
regions and sequence)、可诱导元件(Inducible element)以及激活因子和阻遏因子
(activator and repressor)等。
[0086] 标签Barcode,为高通量测序过程的标签,区分不同的样本。
[0087] 索引index,为为高通量测序过程中进一步区分含有相同标签Barcode的不同样本的索引。
[0088] 实施例1
[0089] 一种功能元件文库的构建方法,包括三种文库的构建,分别为构建Barcode文库、功能元件文库以及Marriage文库,具体包括以下步骤:
[0090] S01.构建标签(Barcode)文库:
[0091] (1)制备Insert‑Barcode片段:
[0092] 使用XbaI酶切原始载体(如图2所示),回收4528bp片段作为PCR的模板扩增多克隆位点MCS+转录调控元件WPRE元件的部分序列;所使用的引物为:F端引物:CACCAAGGAAGCCC
TCGAGGACGCGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGATCCCGACCTACCGACCCAGCT
TTC(SEQ ID NO.1)和R端引物AGGCGAAGACGCGGAAGAGG(SEQ ID NO.2)进行扩增;
[0093] F端引物中的40个N碱基代表随机的测序标签Barcode序列。
[0094] 回收纯化PCR产物后使用Mlu I+Tfi I进行酶切纯化,得到Insert‑Barcode片段。
[0095] F端引物下划线处为Mlu I的酶切位点;Tfi I的酶切位点位于载体骨架的转录调控元件WPRE上,引物F和R的扩增产物上含有TfiI的酶切位点。
[0096] (2)制备线性化克隆骨架:使用Mlu I+Tfi I酶切克隆骨架,回收4849bp片段作为文库骨架。
[0097] (3)将Insert‑Barcode片段和文库骨架进行连接反应(如图3所示),得到Barcode文库,转化至大肠杆菌DH10B中,用以保存。
[0098] 扩增Barcode文库中的Barcode序列进行高通量NGS测序,通过数据分析确认文库的多样性。
[0099] S02.构建功能元件文库:
[0100] (1)随机打断某一类型的数种功能元件的核酸片段,得到功能元件随机片段;
[0101] 使用DNase I对功能元件的核酸片段进行消化(不同长度的片段消化的条件和时间不同),使启动子片段被随机剪切不同大小的短片段;
[0102] 使用 End Repair Module(E6050S)对短片段进行末端补平,形成不同大小的平末端短片段,纯化回收后得到功能元件随机短片段;
[0103] 将引物A:GGGCTCACCTCAGGCTACGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCGATCGCTTCATTC(SEQ ID NO.3)和引物B Phos‑GAATGAAGCGATCGCNNNNNNNNNNNNN NNNNNNNNNNNNNNNN
NCCCTGACGTAGGCTGACGGC(SEQ ID NO.4)混匀后通过退火制备得到。混匀后通过退火形成Y
型adaptor(含有AsiSI酶切位点)。
[0104] 引物B下划线处为AsiSI的酶切位点。
[0105] 将功能元件随机短片段和Y型adaptor按一定的比例混匀后进行连接反应,生成含Y型adaptor的功能元件长片段;
[0106] 通过琼脂糖凝胶电泳、切胶、回收的方法对功能元件长片段进行筛选,将预期范围内的功能元件长片段进行回收纯化;
[0107] 以回收的功能元件长片段为模板,通过PCR扩增的方法增加预期范围内的功能元件长片段的产量,以及将预期含Y型adaptor的功能元件长片段改构为双链DNA片段;回收纯
化PCR产物,得到最终的功能元件随机片段片段。
[0108] PCR的引物序列为:F2:CGGTGGGCTCTATGGTGAGACGCCAGCCGTGGGCTCACCTCAGGCTACGG(SEQ ID NO.5);
[0109] R2:GTCTAGACCTCGAGGAGAGACGCCACGGCTGCCGTCAGCCTACGTCAGGG(SEQ ID NO.6)。
[0110] (2)制备线性化载体骨架:使用Xcm I酶切S01中得到的Barcode文库,去除Stuffer序列,回收4845bp片段作为文库骨架;
[0111] (3)将s功能元件随机片段和载体骨架进行连接反应,得到启动子文库(如图4所示),转化至大肠杆菌DH10B中,用以保存。
[0112] S03.构建Marriage文库
[0113] (1)线性化:使用AsiS I酶切S02中得到的启动子文库,回收4954bp含相同粘性末端的线性化片段;
[0114] (2)连接及转化:通过少量多次添加的方法将上一步中得到的片段加入到连接反应中,尽可能地使连接反应中发生的为分子内的连接反应,即使单个线性化片段自身环化
连接;并将连接产物转化至大肠杆菌DH10B中,得到Marriage文库(如图5所示),转化至大肠
杆菌DH10B中,用以保存。
[0115] 以Marriage文库质粒为模板,PCR扩增Marriage文库中的index1、index2以及Barcode序列进行高通量测序,通过数据分析确定三者之间的对应关系。
[0116] 实施例2
[0117] 为了得到一种高度特异性靶向视锥细胞且能高效表达目的基因的启动子,发明人选择了四种感光细胞特异性的启动子hRO、hRK、mCAR和ProA1为原材料进行DNA改组,这四种
启动子强度差异是hRO≈hRK>mCAR>ProA1。其中ProA1启动子是一个仅在视锥细胞中特异表
达的启动子,但其全长约为2kb,显然并不适用于AAV载体。hRK启动子全长仅有约500bp,可
同时在视锥细胞和视杆细胞中表达,但其特异性未达到预期要求。hRO和mCAR启动子仅在视
杆细胞中表达,同样不符合预期。因此,发明人利用这四种启动子进行DNA改组,选取500bp
的改组片段克隆到AAV载体上形成启动子文库,然后将获得的具有高度多样性的启动子文
库包装成8型AAV,同时,以ProA1‑Tdtomato作为视锥细胞靶向性的参照,动物水平进行视网
膜下原位注射,通过观察TurboGFP(绿色)和Tdtomato(红色)荧光表达情况筛选出具有优良
特性的改组启动子,具体实验步骤如下:
[0118] S01.构建Barcode文库:
[0119] 1.1制备Insert‑barcode片段:
[0120] 1.1.1使用XbaI酶切克隆骨架,回收4528bp片段作为PCR的模板扩增MCS+WPRE元件的部分序列;使用F端引物:CACCAAGGAAGCCCTCGAGGACGCGTNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNGGATCCCGACCTACCGACCCAGCTTTC(SEQ  ID  NO.1)和R端引物
AGGCGAAGACGCGGAAGAGG(SEQ ID NO.2)进行扩增;
[0121] 1.1.2回收纯化PCR产物后使用Mlu I+Tfi I进行酶切纯化,得到Insert‑Barcode片段;
[0122] 1.2制备线性化克隆骨架:使用Mlu I+Tfi I酶切克隆骨架,回收4849bp片段作为文库骨架;
[0123] 1.3将Insert‑Barcode片段和文库骨架进行连接反应,并转化至大肠杆菌DH10B中,得到Barcode文库;
[0124] 1.4扩增Barcode文库中的Barcode序列进行NGS测序,通过数据分析确认文库的多样性。
[0125] S02.构建启动子文库:
[0126] 2.1制备shuffling promoter片段:
[0127] 2.1.1分别通过PCR扩增hRO、hRK、mCAR和ProA1启动子片段;
[0128] 2.1.2使用DNase I对启动子片段进行消化(不同长度的片段消化的条件和时间不同),使启动子片段被随机剪切为50‑100bp的短片段,并进行回收;
[0129] 2.1.3使用 End Repair Module(E6050S)对上述片段进行末端补平,形成50‑100bp大小的平末端短片段,纯化回收后得到启动子随机短片段;
[0130] 2.1.4将引物A:GGGCTCACCTCAGGCTACGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCGATCGCTTCATTC(SEQ ID NO.3)和引物B Phos‑GAATGAAGCGATCGCNNNNNNNNNNNNN NNNNNNNNNNN
NNNNNNCCCTGACGTAGGCTGACGGC(SEQ ID NO.4)混匀后通过退火形成Y型adaptor(含有AsiSI
酶切位点);
[0131] 2.1.5将启动子随机短片段和Y型adaptor按一定的比例混匀后进行连接反应,生成含Y型adaptor的启动子长片段;
[0132] 2.1.6将连接产物进行琼脂糖电泳,对500bp的启动子长片段进行切胶回收纯化;
[0133] 2.1.7以上一步产物为模板,通过PCR扩增的方法增加500bp启动子长片段的产量,以及将预期含Y型adaptor的启动子长片段改构为双链DNA片段;
[0134] 引物序列为:F2:CGGTGGGCTCTATGGTGAGACGCCAGCCGTGGGCTCACCTCAGGCTACGG(SEQ ID NO.5);
[0135] R2:GTCTAGACCTCGAGGAGAGACGCCACGGCTGCCGTCAGCCTACGTCAGGG(SEQ ID NO.6)。
[0136] 2.1.8回收纯化上一步的PCR产物,得到最终的shuffling promoter片段。
[0137] 2.2制备线性化克隆骨架:使用Xcm I酶切第一步中得到的Barcode文库,回收4845bp片段作为文库骨架;
[0138] 2.3将shuffling promoter片段和文库骨架进行连接反应,并转化至大肠杆菌DH10B中,得到启动子文库;
[0139] S03.构建Marriage文库:
[0140] 3.1线性化:使用AsiS I酶切第二步中得到的启动子文库,回收4954bp含相同粘性末端的线性化片段;
[0141] 3.2连接及转化:通过少量多次添加的方法将上一步中得到的片段加入到连接反应中,尽可能地使连接反应中发生的为分子内的连接反应,即使单个线性化片段自身环化
连接;并将连接产物转化至大肠杆菌DH10B中,得到Marriage文库;
[0142] 3.3以Marriage文库质粒为模板,PCR扩增Marriage文库中的index1、index2以及Barcode序列进行NGS测序,通过数据分析确定三者之间的对应关系。
[0143] 本实施例还提供一种筛选功能元件的方法,包括以下步骤:
[0144] S11.将步骤S02构建得到的功能元件文库转染细胞或注射实验动物;
[0145] S12.通过报告基因表达情况选取细胞或组织提取mRNA,逆转录成cDNA;
[0146] S13.对标签Barcode进行测序,通过标签Barcode序列、第一index序列和第二index序列的对应关系筛选得到功能元件。
[0147] 具体来说,以在动物水平筛选具有优良特性的启动子为例:
[0148] 4.1将上述得到的启动子文库以及对照ProA1‑Tdtomato包装成8型AAV病毒;
[0149] 4.2将上述病毒混合后进行小鼠眼球的视网膜下原位注射;
[0150] 4.3两周后摘取眼球进行冷冻切片并拍照观察荧光表达情况;
[0151] 4.4收集感光细胞并进行流式筛选,分选出具有较高荧光强度的细胞,结果见附图6;
[0152] 4.5对分选出来的荧光表达较强的细胞提取RNA;
[0153] 4.6以RNA为模板逆转录成cDNA,PCR扩增出包含Barcode的序列进行NGS测序,通过Marriage文库的数据分析结果,得到index1和index2的具体序列;
[0154] 4.7以得到的index1和index2序列为引物,以启动子文库为模板,PCR扩增出相应的启动子片段;
[0155] 4.8通过Sanger测序得到候选启动子的具体序列。
[0156] 附图6中为将文库病毒与对照ProA1‑Tdtomato病毒预混后进行小鼠视网膜下原位注射所得到的荧光图片。由于ProA1启动子仅特异性靶向视锥细胞中,因此A图中较亮的红
色荧光即代表视锥细胞的分布,B图则是整个文库在视网膜中的分布表达情况,C图是A图和
B图的共染图,图C中黄橙色荧光标记的细胞即为可用于后续的启动子序列鉴定。
[0157] 综上所述,说明本发明提供的文库构建方法可以达到文库高度多样性的效果,成功解决了具有相似特性的或具有特定或未知功能的功能元件无法进行有效重组的缺陷,能
够快速高通量实现启动子、增强子或其他功能元件高度多样性的构建方法,并且可以由此
筛选出具有优良性能(如片段较小,特异性高,启动能力强)的功能元件序列。
[0158] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员
来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保
护范围。