II类V型CRISPR蛋白BfCas12a及其在基因编辑的应用转让专利

申请号 : CN201911121003.X

文献号 : CN110878290B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 殷雷陈鹏周进万义彬刘欢宋广济刘昭鑫雷骏王宏健

申请人 : 武汉大学

摘要 :

本发明属于生物医学领域,具体涉及一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白BfCas12a及其应用。所述BfCas12a的氨基酸序列如SEQ ID NO.1所示;其编码核苷酸序列如SED ID NO.2所示。本发明首次在Butyrivibrio fibrisolvens MD2001菌株中鉴定出具有基因编辑效应的II类V型CRISPR蛋白BfCas12a;所述BfCas12a能够在crRNA的介导下定点对原核生物和真核生物基因组进行基因编辑,BfCas12a的发现进一步扩大了基因编辑工具的种类,对基础科研和临床治疗具有十分重要的作用。

权利要求 :

1.一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白BfCas12a识别的PAM序列在BfCas12a蛋白进行真核生物基因编辑中的应用,所示BfCas12a氨基酸序列如SED ID NO.1所示;所述BfCas12a识别的PAM序列为TTTV、TCTA、TTCA、TCCA、CTTA、或CCTA,所述V表示A、C、或G。

说明书 :

II类V型CRISPR蛋白BfCas12a及其在基因编辑的应用

技术领域

[0001] 本发明属于生物医学领域,具体涉及一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白Cas12a,命名为BfCas12a,在基因编辑中的应用。

背景技术

[0002] 自2013年以来,基因编辑技术取得了突破性进展,此项技术已经在基础科学研究、医药、临床、生物技术等许多领域引起了新的变革。除了具有代表性的Cas9系统之外,
Cas12,又名Cpf1,作为又一种被发现的具有基因编辑效应的CRISPR系统新成员,极大的扩
大了基因编辑系统靶点的可编辑范围,相比于Cas9系统,Cas12a所具有的加工前提RNA的功
能,为其介导多基因编辑提供了相比与Cas9系统更为便捷高效的编辑能力。除此之外,相比
于 Cas9的向导RNA,Cas12a的向导RNA组成更为简单,设计更为方便。
[0003] 2015年,张峰团队首次发现了Cas9系统之外的另外一种具有基因编辑能力的新成员, Cas12a,又名Cpf1,将其划分到CRISPR系统2类V型中。相比于Cas9系统,Cas12a的编辑
效率与Cas9的效率相当,在有些靶点低于Cas9。Cas12a的脱靶率极低,相比于Cas9脱靶率高
的特性,Cas12a是一种安全的基因编辑工具。Cas12a在切割之后形成粘性末端,而 Cas9形
成平末端,已有研究表明,Cas12a切割之后的粘性末端相比于Cas9的平末端而言,更容易发
生同源重组修复,这也为基因的定点插入和修复提供了更好的工具。在向导RNA 的加工方
面,Cas12a具有明显的优势,仅仅只需要Cas12a本身就能够完成对前提RNA的加工,而Cas9
系统则需要RNaseIII的加工,这极大地促进Cas12a在多基因编辑上的应用。在 PAM的识别
上,Cas12a识别5—TTTN—3或5—KYTV—3,Cas9则识别5—NGG—3.
[0004] 因此,Cas12a作为一种新型基因编辑工具,与Cas9系统一道,为科学研究和疾病的治疗提供了有力的工具。基于对目前已有的Cas12a的研究,为应对将来各种情况下的基因
编辑事件,发现更多的具有一定特性的Cas12a是一件具有重要意义的事情。

发明内容

[0005] 本发明针对现有技术的不足,目的在于提供一种来自于Butyrivibrio fibrisolvens MD2001 细菌中的II类V型CRISPR蛋白BfCas12a及其在基因编辑中的应用。
[0006] 为实现上述发明目的,本发明所采用的技术方案为:
[0007] 一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白BfCas12a,其氨基酸序列如SED ID NO.1所示。
[0008] 上述方案中,所述BfCas12a识别的PAM序列为TTTV、TCTA、TTCA、TCCA、CTTA、或CCTA,更为优选的PAM序列为TTTV,所述V表示A、C、或G。
[0009] 用于编辑蛋白BfCas12a氨基酸序列的基因,其核苷酸序列如SEQ ID NO.2所示。
[0010] 上述BfCas12a在基因编辑中的应用。
[0011] 上述BfCas12a在原核生物基因编辑中的应用。
[0012] 上述BfCas12a在真核生物基因编辑中的应用。
[0013] 上述BfCas12a在体外基因编辑中的应用。
[0014] 本发明中所述蛋白BfCas12a的氨基酸序列如下:
[0015] (1)在原核细胞中:
[0016] YYESLTKLYPIKKTIRNELVPIGKTLENIKKNNILEADEDRKIAYIRVKAIMDDYHKRLINEA LSGFALIDLDKAANLYLSRSKSADDIESFSRFQDKLRKAIAKRLREHENFGKIGNKDIIPLLQ KLSENEDDYNALESFK
NFYTYFESYNDVRLNLYSDKEKSSTVAYRLINENLPRFLDNIRAYD AVQKAGITSEELSSEAQDGLFLVNTFNNV
LIQDGINTYNEDIGKLNVAINLYNQKNASVQGF RKVPKMKVLYKQILSDREESFIDEFESDTELLDSLESHYANL
AKYFGSNKVQLLFTALRESK GVNVYVKNDIAKTSFSNVVFGSWSRIDELINGEYDDNNNRKKDEKYYDKRQKELK
KNKS YTIEKIITLSTEDVDVIGKYIEKLESDIDDIRFKGKNFYEAVLCGHDRSKKLSKNKGAVEAIK GYLDSVK
DFERDLKLINGSGQELEKNLVVYGEQEAVLSELSGIDSLYNMTRNYLTKKPFST EKIKLNFNKPTFLDGWDYGNE
EAYLGFFMIKEGNYFLAVMDANWNKEFRNIPSVDKSDCY KKVIYKQISSPEKSIQNLMVIDGKTVKKNGRKEKEG
IHSGENLILEELKNTYLPKKINDIRK RRSYLNGDTFSKKDLTEFIGYYKQRVIEYYNGYSFYFKSDDDYASFKEF
QEDVGRQAYQIS YVDVPVSFVDDLINSGKLYLFRVYNKDFSEYSKGRLNLHTLYFKMLFDERNLKNVVYKLN GQ
AEVFYRPSSIKKEELIVHRAGEEIKNKNPKRAAQKPTRRLDYDIVKDRRYSQDKFMLHT SIIMNFGAEENVSFND
IVNGVLRNEDKVNVIGIDRGERNLLYVVVIDPEGKILEQRSLNCITD SNLDIETDYHRLLDEKESDRKIARRDWT
TIENIKELKAGYLSQVVHIVAELVLKYNAIICLE DLNFGFKRGRQKVEKQVYQKFEKMLIDKLNYLVMDKSREQL
SPEKISGALNALQLTPDFK SFKVLGKQTGIIYYVPAYLTSKIDPMTGFANLFYVKYENVDKAKEFFSKFDSIKYN
KDGKN WNTKGYFEFAFDYKKFTDRAYGRVSEWTVCTVGERIIKFKNKEKNNSYDDKVIDLTNSLK ELFDSYKVT
YESEVDLKDAILAIDDPAFYRDLTRRLQQTLQMRNSSCDGSRDYIISPVKNSK GEFFCSDNNDDTTPNDADANGA
FNIARKGLWVLNEIRNSEEGSKINLAMSNAQWLEYAQD NTI;
[0017] (2)真核细胞中:
[0018] PKKKRKVYYESLTKLYPIKKTIRNELVPIGKTLENIKKNNILEADEDRKIAYIRVKAIMDDYH KRLINEALSGFALIDLDKAANLYLSRSKSADDIESFSRFQDKLRKAIAKRLREHENFGKIGN KDIIPLLQKLSENEDDY
NALESFKNFYTYFESYNDVRLNLYSDKEKSSTVAYRLINENLPRF LDNIRAYDAVQKAGITSEELSSEAQDGLFL
VNTFNNVLIQDGINTYNEDIGKLNVAINLYNQ KNASVQGFRKVPKMKVLYKQILSDREESFIDEFESDTELLDSL
ESHYANLAKYFGSNKVQL LFTALRESKGVNVYVKNDIAKTSFSNVVFGSWSRIDELINGEYDDNNNRKKDEKYYD
KRQ KELKKNKSYTIEKIITLSTEDVDVIGKYIEKLESDIDDIRFKGKNFYEAVLCGHDRSKKLSKN KGAVEAIK
GYLDSVKDFERDLKLINGSGQELEKNLVVYGEQEAVLSELSGIDSLYNMTRNY LTKKPFSTEKIKLNFNKPTFLD
GWDYGNEEAYLGFFMIKEGNYFLAVMDANWNKEFRNIPS VDKSDCYKKVIYKQISSPEKSIQNLMVIDGKTVKKN
GRKEKEGIHSGENLILEELKNTYLPK KINDIRKRRSYLNGDTFSKKDLTEFIGYYKQRVIEYYNGYSFYFKSDDD
YASFKEFQEDVG RQAYQISYVDVPVSFVDDLINSGKLYLFRVYNKDFSEYSKGRLNLHTLYFKMLFDERNLKN V
VYKLNGQAEVFYRPSSIKKEELIVHRAGEEIKNKNPKRAAQKPTRRLDYDIVKDRRYSQD KFMLHTSIIMNFGAE
ENVSFNDIVNGVLRNEDKVNVIGIDRGERNLLYVVVIDPEGKILEQR SLNCITDSNLDIETDYHRLLDEKESDRK
IARRDWTTIENIKELKAGYLSQVVHIVAELVLKY NAIICLEDLNFGFKRGRQKVEKQVYQKFEKMLIDKLNYLVM
DKSREQLSPEKISGALNALQ LTPDFKSFKVLGKQTGIIYYVPAYLTSKIDPMTGFANLFYVKYENVDKAKEFFSK
FDSIKYN KDGKNWNTKGYFEFAFDYKKFTDRAYGRVSEWTVCTVGERIIKFKNKEKNNSYDDKVIDL TNSLKEL
FDSYKVTYESEVDLKDAILAIDDPAFYRDLTRRLQQTLQMRNSSCDGSRDYIISP VKNSKGEFFCSDNNDDTTPN
DADANGAFNIARKGLWVLNEIRNSEEGSKINLAMSNAQW LEYAQDNTIKRPAATKKAGQAKKKKGSYPYDVPDYA
YPYDVPDYAYPYDVPDYA
[0019] 其中在BfCas12a蛋白氨基酸序列的N端加入PKKKRKV序列(该序列为N端NLS入核序列),在BfCas12a蛋白氨基酸序列的C端加入KRPAATKKAGQAKKKK序列(该序列为C 端NLS入核
序列),随后用GS序列连接YPYDVPDYAYPYDVPDYAYPYDVPDYA序列(该序列为3HA序列)。
[0020] 编码本发明所述蛋白BfCas12a的核苷酸序列如下:
[0021] tactacgagagcctgaccaagctgtaccccatcaagaagaccatccgcaacgagctggtgcccatcggcaagaccctggagaacatcaagaagaacaacatcctg gaggccgacgaggaccgcaagatcgcctacatccgcgt
gaaggccatcatggacgactaccacaagcgcctgatcaacgaggccctgagcggcttcgccctgat cgacctgga
caaggccgccaacctgtacctgagccgcagcaagagcgccgacgacatcgagagcttcagccgcttccaggacaag
ctgcgcaaggccatcgcc aagcgcctgcgcgagcacgagaacttcggcaagatcggcaacaaggacatcatcccc
ctgctgcagaagctgagcgagaacgaggacgactacaacgccctgg agagcttcaagaacttctacacctacttc
gagagctacaacgacgtgcgcctgaacctgtacagcgacaaggagaagagcagcaccgtggcctaccgcctgatca 
acgagaacctgccccgcttcctggacaacatccgcgcctacgacgccgtgcagaaggccggcatcaccagcgagga
gctgagcagcgaggcccaggacggcc tgttcctggtgaacaccttcaacaacgtgctgatccaggacggcatcaa
cacctacaacgaggacatcggcaagctgaacgtggccatcaacctgtacaaccagaa gaacgccagcgtgcaggg
cttccgcaaggtgcccaagatgaaggtgctgtacaagcagatcctgagcgaccgcgaggagagcttcatcgacgag
ttcgagagc gacaccgagctgctggacagcctggagagccactacgccaacctggccaagtacttcggcagcaac
aaggtgcagctgctgttcaccgccctgcgcgagagcaa gggcgtgaacgtgtacgtgaagaacgacatcgccaag
accagcttcagcaacgtggtgttcggcagctggagccgcatcgacgagctgatcaacggcgagtacg acgacaac
aacaaccgcaagaaggacgagaagtactacgacaagcgccagaaggagctgaagaagaacaagagctacaccatcg
agaagatcatcaccctga gcaccgaggacgtggacgtgatcggcaagtacatcgagaagctggagagcgacatcg
acgacatccgcttcaagggcaagaacttctacgaggccgtgctgtgc ggccacgaccgcagcaagaagctgagca
agaacaagggcgccgtggaggccatcaagggctacctggacagcgtgaaggacttcgagcgcgacctgaagct ga
tcaacggcagcggccaggagctggagaagaacctggtggtgtacggcgagcaggaggccgtgctgagcgagctgag
cggcatcgacagcctgtacaacat gacccgcaactacctgaccaagaagcccttcagcaccgagaagatcaagct
gaacttcaacaagcccaccttcctggacggctgggactacggcaacgaggagg cctacctgggcttcttcatgat
caaggagggcaactacttcctggccgtgatggacgccaactggaacaaggagttccgcaacatccccagcgtggac
aagagcga ctgctacaagaaggtgatctacaagcagatcagcagccccgagaagagcatccagaacctgatggtg
atcgacggcaagaccgtgaagaagaacggccgcaag gagaaggagggcatccacagcggcgagaacctgatcctg
gaggagctgaagaacacctacctgcccaagaagatcaacgacatccgcaagcgccgcagctac ctgaacggcgac
accttcagcaagaaggacctgaccgagttcatcggctactacaagcagcgcgtgatcgagtactacaacggctaca
gcttctacttcaagagcg acgacgactacgccagcttcaaggagttccaggaggacgtgggccgccaggcctacc
agatcagctacgtggacgtgcccgtgagcttcgtggacgacctgatc aacagcggcaagctgtacctgttccgcg
tgtacaacaaggacttcagcgagtacagcaagggccgcctgaacctgcacaccctgtacttcaagatgctgttcga
cg agcgcaacctgaagaacgtggtgtacaagctgaacggccaggccgaggtgttctaccgccccagcagcatcaa
gaaggaggagctgatcgtgcaccgcgccgg cgaggagatcaagaacaagaaccccaagcgcgccgcccagaagcc
cacccgccgcctggactacgacatcgtgaaggaccgccgctacagccaggacaagtt catgctgcacaccagcat
catcatgaacttcggcgccgaggagaacgtgagcttcaacgacatcgtgaacggcgtgctgcgcaacgaggacaag
gtgaacgtgat cggcatcgaccgcggcgagcgcaacctgctgtacgtggtggtgatcgaccccgagggcaagatc
ctggagcagcgcagcctgaactgcatcaccgacagcaac ctggacatcgagaccgactaccaccgcctgctggac
gagaaggagagcgaccgcaagatcgcccgccgcgactggaccaccatcgagaacatcaaggagctg aaggccggc
tacctgagccaggtggtgcacatcgtggccgagctggtgctgaagtacaacgccatcatctgcctggaggacctga
acttcggcttcaagcgcggc cgccagaaggtggagaagcaggtgtaccagaagttcgagaagatgctgatcgaca
agctgaactacctggtgatggacaagagccgcgagcagctgagccccg agaagatcagcggcgccctgaacgccc
tgcagctgacccccgacttcaagagcttcaaggtgctgggcaagcagaccggcatcatctactacgtgcccgccta
cc tgaccagcaagatcgaccccatgaccggcttcgccaacctgttctacgtgaagtacgagaacgtggacaaggc
caaggagttcttcagcaagttcgacagcatcaa gtacaacaaggacggcaagaactggaacaccaagggctactt
cgagttcgccttcgactacaagaagttcaccgaccgcgcctacggccgcgtgagcgagtgga ccgtgtgcaccgt
gggcgagcgcatcatcaagttcaagaacaaggagaagaacaacagctacgacgacaaggtgatcgacctgaccaac
agcctgaaggagct gttcgacagctacaaggtgacctacgagagcgaggtggacctgaaggacgccatcctggcc
atcgacgaccccgccttctaccgcgacctgacccgccgcctgc agcagaccctgcagatgcgcaacagcagctgc
gacggcagccgcgactacatcatcagccccgtgaagaacagcaagggcgagttcttctgcagcgacaacaa cgac
gacaccacccccaacgacgccgacgccaacggcgccttcaacatcgcccgcaagggcctgtgggtgctgaacgaga
tccgcaacagcgaggagggca gcaagatcaacctggccatgagcaacgcccagtggctggagtacgcccaggaca
acaccatc
[0022] 本发明中Butyrivibrio fibrisolvens MD2001细菌基因组中部分CRISPR array如图2所示,基因组中黑体显示CRISPR array序列为“ATCTACAACAGTAGAAATTATCTATAGGTTC
TT GG”,因此,使用的crRNA direct repeat序列为5’‑AATTTCTACTGTTGTAGAT‑3’。
[0023] 本发明的有益效果:本发明首次在Butyrivibrio fibrisolvens MD2001菌株中鉴定出具有基因编辑效应的II类V型CRISPR蛋白,命名为BfCas12a;所述BfCas12a能够在
crRNA的介导下定点对原核生物和真核生物基因组进行基因编辑,BfCas12a的发现进一步
扩大了基因编辑工具的种类,同时也为后续各种不同情况的基因编辑提供了重要的备选工
具,对基础科研和临床治疗具有十分重要的作用。

附图说明

[0024] 图1为Butyrivibrio fibrisolvens MD2001 CRISPR array及crRNA direct repeat图示。
[0025] 图2为Butyrivibrio fibrisolvens MD2001菌株基因组中存在的部分CRISPR array示意图。
[0026] 图3为体外切割EGFP片段靶点示意图。
[0027] 图4为原核表达BfCas12a之后,体外切割实验,S表示substrate;P表示product。
[0028] 图5为体外实验验证BfCas12a的PAM,S表示substrate;P表示product。
[0029] 图6为体内验证BfCas12a基因编辑,S表示substrate;P表示product。
[0030] 图7为体内验证BfCas12a在相同基因不同靶点的基因编辑效率。

具体实施方式

[0031] 为了更好地理解本发明,下面结合实施例进一步阐明本发明的内容,但本发明的内容不仅仅局限于下面的实施例。
[0032] 实施例1
[0033] BfCas12a体外不同时间梯度切割实验,包括以下实验步骤:
[0034] (1)BfCas12a蛋白的表达与纯化:将BfCas12a基因序列合成到pet28a表达载体上,且在C末端加上6His标签,随后将合成好的质粒转化到E.Coli Rosseta 2(DE3)表达菌株
中,挑取单克隆,小量表达检测确定蛋白表达后进行蛋白的大量表达与纯化;重组蛋白依次
经过 Ni柱亲和层析,heparin柱层析,superdex 200分子筛纯化后,保存在buffer(10mM 
Tris‑HCl, 200mM NaCl,1mM MgCl)中,并冻存于‑80℃备用;
[0035] (2)使用crRNA direct repeat序列为:5’‑AATTTCTACTGTTGTAGAT‑3’,在体外转录获得crRNA;将步骤(1)所得BfCas12a蛋白与crRNA混合得到BfCas12a‑crRNA复合物;
[0036] (3)取100nM BfCas12a‑crRNA所得复合物与300ng线性化的底物(图4所示)混匀, 37℃孵育分别孵育0,1,2,5,10min后,加入适量蛋白酶K,58℃消化60min,跑2%琼脂糖胶,
结果如图4所示,BfCas12a具有良好的体外切割能力。
[0037] 实施例2
[0038] BfCas12a识别PAM的确定
[0039] (1)设计NNNN四个位置随机组合的上下游引物(N表示A、G、C、T),以EGFP片段作为模板,采用overlap PCR方法进行PCR,得到256种带有不同PAM序列,但spacer 序列一样的
1.1kb的线性化底物;
[0040] (2)取100nM BfCas12a‑crRNA复合物与300ng线性化的底物混匀,37℃孵育分别孵育10min后,加入适量蛋白酶K,58℃消化60min,跑2%琼脂糖胶,部分结果如图5所示, 
BfCas12a能够识别不同的PAM:TTTA、TCTA、TTCA、TCCA、CTTA、CCTA,但最优PAM 为TTTV(V表
示A,C,G)。
[0041] 实施例3
[0042] BfCas12a在哺乳动物细胞内不同基因的编辑:
[0043] (1)构建BfCas12a真核表达质粒:将BfCas12a基因序列合成到pet28a表达载体上构建BfCas12a真核表达质粒;
[0044] (2)在哺乳动物细胞中,以293T细胞为例选择TRAC、TRBC、B2M、CTLA4、PD1五个基因,分别以这五个基因为目标,构建5个U6‑crRNA spacer真核表达质粒;
[0045] (3)分别针对这五个基因的切割靶点附近设计surveyor primer,并验证PCR引物的特异性;
[0046] (4)消化293T细胞,适当浓度铺24孔板,每孔500ul;
[0047] (5)24孔板共转BfCas12a真核表达质粒(700ng)和U6‑crRNA spacer真核表达质粒 (300ng),48h后裂解细胞,取1ul裂解液作为模板、以步骤(3)设计的surveyor primer引物
进行PCR,纯化PCR产物;
[0048] (6)取300ng PCR产物与1ul 10XT7EI buffer混匀,按以下PCR程序进行复性95℃ 10min,95℃至85℃‑2℃/S,85℃到25℃‑0.25℃/S,25℃持续1min,复性之后产物加入 1ul 
T7EI,37℃酶切20min,跑2%琼脂糖胶,结果如图6所示在B2M、PD1能够进行基因编辑,(本案
例中的基因只是作为代表进行列举,并不说明在其他基因上没有基因编辑的能力)。
[0049] 实施例4
[0050] BfCas12a在哺乳动物细胞内相同基因不同靶点的基因编辑:
[0051] (1)选取并设计VEGFA基因上3个不同的靶点(VEGFA Site 1、VEGFA Site 2、VEGFA Site 3)的crRNA;
[0052] (2)切割靶点附近设计surveyor primer,并验证PCR引物的特异性;
[0053] (3)消化293T细胞,适当浓度铺24孔板,每孔500ul;
[0054] (4)24孔板共转BfCas12a真核表达质粒(700ng)和U6‑crRNA spacer真核表达质粒 (300ng),48h后裂解细胞,取1ul裂解液作为模板、以步骤(3)设计的surveyor primer引物
进行PCR,纯化PCR产物;
[0055] (5)取300ngPCR产物与1ul 10XT7EI buffer混匀,按以下PCR程序进行复性95℃ 10min,95℃至85℃‑2℃/S,85℃到25℃‑0.25℃/S,25℃持续1min。
[0056] (6)复性之后产物加入1ul T7EI,37℃酶切20min,跑2%琼脂糖胶,结果如图7所示,采用灰度分析可得在各个靶点切割效率分别为20%、34%、6%。
[0057] 显然,上述实施例仅仅是为清楚地说明所作的实例,而并非对实施方式的限制。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或
变动。这里无需也无法对所有的实施方式予以穷举。而因此所引申的显而易见的变化或变
动仍处于本发明创造的保护范围之内。