II类V型CRISPR蛋白BfCas12a及其在基因编辑的应用转让专利

申请号 : CN201911121003.X

文献号 : CN110878290B

文献日 : 2022-03-18

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

本发明属于生物医学领域，具体涉及一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白BfCas12a及其应用。所述BfCas12a的氨基酸序列如SEQ ID NO.1所示；其编码核苷酸序列如SED ID NO.2所示。本发明首次在Butyrivibrio fibrisolvens MD2001菌株中鉴定出具有基因编辑效应的II类V型CRISPR蛋白BfCas12a；所述BfCas12a能够在crRNA的介导下定点对原核生物和真核生物基因组进行基因编辑，BfCas12a的发现进一步扩大了基因编辑工具的种类，对基础科研和临床治疗具有十分重要的作用。

1.一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白BfCas12a识别的PAM序列在BfCas12a蛋白进行真核生物基因编辑中的应用，所示BfCas12a氨基酸序列如SED ID NO.1所示；所述BfCas12a识别的PAM序列为TTTV、TCTA、TTCA、TCCA、CTTA、或CCTA，所述V表示A、C、或G。

II类V型CRISPR蛋白BfCas12a及其在基因编辑的应用

技术领域

[0001] 本发明属于生物医学领域，具体涉及一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白Cas12a，命名为BfCas12a，在基因编辑中的应用。

背景技术

[0002] 自2013年以来，基因编辑技术取得了突破性进展，此项技术已经在基础科学研究、医药、临床、生物技术等许多领域引起了新的变革。除了具有代表性的Cas9系统之外，
Cas12，又名Cpf1，作为又一种被发现的具有基因编辑效应的CRISPR系统新成员，极大的扩
大了基因编辑系统靶点的可编辑范围，相比于Cas9系统，Cas12a所具有的加工前提RNA的功
能，为其介导多基因编辑提供了相比与Cas9系统更为便捷高效的编辑能力。除此之外，相比
于 Cas9的向导RNA，Cas12a的向导RNA组成更为简单，设计更为方便。

[0003] 2015年，张峰团队首次发现了Cas9系统之外的另外一种具有基因编辑能力的新成员， Cas12a，又名Cpf1，将其划分到CRISPR系统2类V型中。相比于Cas9系统，Cas12a的编辑
效率与Cas9的效率相当，在有些靶点低于Cas9。Cas12a的脱靶率极低，相比于Cas9脱靶率高
的特性，Cas12a是一种安全的基因编辑工具。Cas12a在切割之后形成粘性末端，而 Cas9形
成平末端，已有研究表明，Cas12a切割之后的粘性末端相比于Cas9的平末端而言，更容易发
生同源重组修复，这也为基因的定点插入和修复提供了更好的工具。在向导RNA 的加工方
面，Cas12a具有明显的优势，仅仅只需要Cas12a本身就能够完成对前提RNA的加工，而Cas9
系统则需要RNaseIII的加工，这极大地促进Cas12a在多基因编辑上的应用。在 PAM的识别
上，Cas12a识别5—TTTN—3或5—KYTV—3，Cas9则识别5—NGG—3.

[0004] 因此，Cas12a作为一种新型基因编辑工具，与Cas9系统一道，为科学研究和疾病的治疗提供了有力的工具。基于对目前已有的Cas12a的研究，为应对将来各种情况下的基因
编辑事件，发现更多的具有一定特性的Cas12a是一件具有重要意义的事情。

发明内容

[0005] 本发明针对现有技术的不足，目的在于提供一种来自于Butyrivibrio fibrisolvens MD2001 细菌中的II类V型CRISPR蛋白BfCas12a及其在基因编辑中的应用。

[0006] 为实现上述发明目的，本发明所采用的技术方案为：

[0007] 一种来自于Butyrivibrio fibrisolvens MD2001细菌中的II类V型CRISPR蛋白BfCas12a，其氨基酸序列如SED ID NO.1所示。

[0008] 上述方案中，所述BfCas12a识别的PAM序列为TTTV、TCTA、TTCA、TCCA、CTTA、或CCTA，更为优选的PAM序列为TTTV，所述V表示A、C、或G。

[0009] 用于编辑蛋白BfCas12a氨基酸序列的基因，其核苷酸序列如SEQ ID NO.2所示。

[0010] 上述BfCas12a在基因编辑中的应用。

[0011] 上述BfCas12a在原核生物基因编辑中的应用。

[0012] 上述BfCas12a在真核生物基因编辑中的应用。

[0013] 上述BfCas12a在体外基因编辑中的应用。

[0014] 本发明中所述蛋白BfCas12a的氨基酸序列如下：

[0015] (1)在原核细胞中：

[0016] YYESLTKLYPIKKTIRNELVPIGKTLENIKKNNILEADEDRKIAYIRVKAIMDDYHKRLINEA LSGFALIDLDKAANLYLSRSKSADDIESFSRFQDKLRKAIAKRLREHENFGKIGNKDIIPLLQ KLSENEDDYNALESFK
NFYTYFESYNDVRLNLYSDKEKSSTVAYRLINENLPRFLDNIRAYD AVQKAGITSEELSSEAQDGLFLVNTFNNV
LIQDGINTYNEDIGKLNVAINLYNQKNASVQGF RKVPKMKVLYKQILSDREESFIDEFESDTELLDSLESHYANL
AKYFGSNKVQLLFTALRESK GVNVYVKNDIAKTSFSNVVFGSWSRIDELINGEYDDNNNRKKDEKYYDKRQKELK
KNKS YTIEKIITLSTEDVDVIGKYIEKLESDIDDIRFKGKNFYEAVLCGHDRSKKLSKNKGAVEAIK GYLDSVK
DFERDLKLINGSGQELEKNLVVYGEQEAVLSELSGIDSLYNMTRNYLTKKPFST EKIKLNFNKPTFLDGWDYGNE
EAYLGFFMIKEGNYFLAVMDANWNKEFRNIPSVDKSDCY KKVIYKQISSPEKSIQNLMVIDGKTVKKNGRKEKEG
IHSGENLILEELKNTYLPKKINDIRK RRSYLNGDTFSKKDLTEFIGYYKQRVIEYYNGYSFYFKSDDDYASFKEF
QEDVGRQAYQIS YVDVPVSFVDDLINSGKLYLFRVYNKDFSEYSKGRLNLHTLYFKMLFDERNLKNVVYKLN GQ
AEVFYRPSSIKKEELIVHRAGEEIKNKNPKRAAQKPTRRLDYDIVKDRRYSQDKFMLHT SIIMNFGAEENVSFND
IVNGVLRNEDKVNVIGIDRGERNLLYVVVIDPEGKILEQRSLNCITD SNLDIETDYHRLLDEKESDRKIARRDWT
TIENIKELKAGYLSQVVHIVAELVLKYNAIICLE DLNFGFKRGRQKVEKQVYQKFEKMLIDKLNYLVMDKSREQL
SPEKISGALNALQLTPDFK SFKVLGKQTGIIYYVPAYLTSKIDPMTGFANLFYVKYENVDKAKEFFSKFDSIKYN
KDGKN WNTKGYFEFAFDYKKFTDRAYGRVSEWTVCTVGERIIKFKNKEKNNSYDDKVIDLTNSLK ELFDSYKVT
YESEVDLKDAILAIDDPAFYRDLTRRLQQTLQMRNSSCDGSRDYIISPVKNSK GEFFCSDNNDDTTPNDADANGA
FNIARKGLWVLNEIRNSEEGSKINLAMSNAQWLEYAQD NTI；

[0017] (2)真核细胞中：

[0018] PKKKRKVYYESLTKLYPIKKTIRNELVPIGKTLENIKKNNILEADEDRKIAYIRVKAIMDDYH KRLINEALSGFALIDLDKAANLYLSRSKSADDIESFSRFQDKLRKAIAKRLREHENFGKIGN KDIIPLLQKLSENEDDY
NALESFKNFYTYFESYNDVRLNLYSDKEKSSTVAYRLINENLPRF LDNIRAYDAVQKAGITSEELSSEAQDGLFL
VNTFNNVLIQDGINTYNEDIGKLNVAINLYNQ KNASVQGFRKVPKMKVLYKQILSDREESFIDEFESDTELLDSL
ESHYANLAKYFGSNKVQL LFTALRESKGVNVYVKNDIAKTSFSNVVFGSWSRIDELINGEYDDNNNRKKDEKYYD
KRQ KELKKNKSYTIEKIITLSTEDVDVIGKYIEKLESDIDDIRFKGKNFYEAVLCGHDRSKKLSKN KGAVEAIK
GYLDSVKDFERDLKLINGSGQELEKNLVVYGEQEAVLSELSGIDSLYNMTRNY LTKKPFSTEKIKLNFNKPTFLD
GWDYGNEEAYLGFFMIKEGNYFLAVMDANWNKEFRNIPS VDKSDCYKKVIYKQISSPEKSIQNLMVIDGKTVKKN
GRKEKEGIHSGENLILEELKNTYLPK KINDIRKRRSYLNGDTFSKKDLTEFIGYYKQRVIEYYNGYSFYFKSDDD
YASFKEFQEDVG RQAYQISYVDVPVSFVDDLINSGKLYLFRVYNKDFSEYSKGRLNLHTLYFKMLFDERNLKN V
VYKLNGQAEVFYRPSSIKKEELIVHRAGEEIKNKNPKRAAQKPTRRLDYDIVKDRRYSQD KFMLHTSIIMNFGAE
ENVSFNDIVNGVLRNEDKVNVIGIDRGERNLLYVVVIDPEGKILEQR SLNCITDSNLDIETDYHRLLDEKESDRK
IARRDWTTIENIKELKAGYLSQVVHIVAELVLKY NAIICLEDLNFGFKRGRQKVEKQVYQKFEKMLIDKLNYLVM
DKSREQLSPEKISGALNALQ LTPDFKSFKVLGKQTGIIYYVPAYLTSKIDPMTGFANLFYVKYENVDKAKEFFSK
FDSIKYN KDGKNWNTKGYFEFAFDYKKFTDRAYGRVSEWTVCTVGERIIKFKNKEKNNSYDDKVIDL TNSLKEL
FDSYKVTYESEVDLKDAILAIDDPAFYRDLTRRLQQTLQMRNSSCDGSRDYIISP VKNSKGEFFCSDNNDDTTPN
DADANGAFNIARKGLWVLNEIRNSEEGSKINLAMSNAQW LEYAQDNTIKRPAATKKAGQAKKKKGSYPYDVPDYA
YPYDVPDYAYPYDVPDYA

[0019] 其中在BfCas12a蛋白氨基酸序列的N端加入PKKKRKV序列(该序列为N端NLS入核序列)，在BfCas12a蛋白氨基酸序列的C端加入KRPAATKKAGQAKKKK序列(该序列为C 端NLS入核
序列)，随后用GS序列连接YPYDVPDYAYPYDVPDYAYPYDVPDYA序列(该序列为3HA序列)。

[0020] 编码本发明所述蛋白BfCas12a的核苷酸序列如下：

[0021] tactacgagagcctgaccaagctgtaccccatcaagaagaccatccgcaacgagctggtgcccatcggcaagaccctggagaacatcaagaagaacaacatcctg gaggccgacgaggaccgcaagatcgcctacatccgcgt
gaaggccatcatggacgactaccacaagcgcctgatcaacgaggccctgagcggcttcgccctgat cgacctgga
caaggccgccaacctgtacctgagccgcagcaagagcgccgacgacatcgagagcttcagccgcttccaggacaag
ctgcgcaaggccatcgcc aagcgcctgcgcgagcacgagaacttcggcaagatcggcaacaaggacatcatcccc
ctgctgcagaagctgagcgagaacgaggacgactacaacgccctgg agagcttcaagaacttctacacctacttc
gagagctacaacgacgtgcgcctgaacctgtacagcgacaaggagaagagcagcaccgtggcctaccgcctgatca
acgagaacctgccccgcttcctggacaacatccgcgcctacgacgccgtgcagaaggccggcatcaccagcgagga
gctgagcagcgaggcccaggacggcc tgttcctggtgaacaccttcaacaacgtgctgatccaggacggcatcaa
cacctacaacgaggacatcggcaagctgaacgtggccatcaacctgtacaaccagaa gaacgccagcgtgcaggg
cttccgcaaggtgcccaagatgaaggtgctgtacaagcagatcctgagcgaccgcgaggagagcttcatcgacgag
ttcgagagc gacaccgagctgctggacagcctggagagccactacgccaacctggccaagtacttcggcagcaac
aaggtgcagctgctgttcaccgccctgcgcgagagcaa gggcgtgaacgtgtacgtgaagaacgacatcgccaag
accagcttcagcaacgtggtgttcggcagctggagccgcatcgacgagctgatcaacggcgagtacg acgacaac
aacaaccgcaagaaggacgagaagtactacgacaagcgccagaaggagctgaagaagaacaagagctacaccatcg
agaagatcatcaccctga gcaccgaggacgtggacgtgatcggcaagtacatcgagaagctggagagcgacatcg
acgacatccgcttcaagggcaagaacttctacgaggccgtgctgtgc ggccacgaccgcagcaagaagctgagca
agaacaagggcgccgtggaggccatcaagggctacctggacagcgtgaaggacttcgagcgcgacctgaagct ga
tcaacggcagcggccaggagctggagaagaacctggtggtgtacggcgagcaggaggccgtgctgagcgagctgag
cggcatcgacagcctgtacaacat gacccgcaactacctgaccaagaagcccttcagcaccgagaagatcaagct
gaacttcaacaagcccaccttcctggacggctgggactacggcaacgaggagg cctacctgggcttcttcatgat
caaggagggcaactacttcctggccgtgatggacgccaactggaacaaggagttccgcaacatccccagcgtggac
aagagcga ctgctacaagaaggtgatctacaagcagatcagcagccccgagaagagcatccagaacctgatggtg
atcgacggcaagaccgtgaagaagaacggccgcaag gagaaggagggcatccacagcggcgagaacctgatcctg
gaggagctgaagaacacctacctgcccaagaagatcaacgacatccgcaagcgccgcagctac ctgaacggcgac
accttcagcaagaaggacctgaccgagttcatcggctactacaagcagcgcgtgatcgagtactacaacggctaca
gcttctacttcaagagcg acgacgactacgccagcttcaaggagttccaggaggacgtgggccgccaggcctacc
agatcagctacgtggacgtgcccgtgagcttcgtggacgacctgatc aacagcggcaagctgtacctgttccgcg
tgtacaacaaggacttcagcgagtacagcaagggccgcctgaacctgcacaccctgtacttcaagatgctgttcga
cg agcgcaacctgaagaacgtggtgtacaagctgaacggccaggccgaggtgttctaccgccccagcagcatcaa
gaaggaggagctgatcgtgcaccgcgccgg cgaggagatcaagaacaagaaccccaagcgcgccgcccagaagcc
cacccgccgcctggactacgacatcgtgaaggaccgccgctacagccaggacaagtt catgctgcacaccagcat
catcatgaacttcggcgccgaggagaacgtgagcttcaacgacatcgtgaacggcgtgctgcgcaacgaggacaag
gtgaacgtgat cggcatcgaccgcggcgagcgcaacctgctgtacgtggtggtgatcgaccccgagggcaagatc
ctggagcagcgcagcctgaactgcatcaccgacagcaac ctggacatcgagaccgactaccaccgcctgctggac
gagaaggagagcgaccgcaagatcgcccgccgcgactggaccaccatcgagaacatcaaggagctg aaggccggc
tacctgagccaggtggtgcacatcgtggccgagctggtgctgaagtacaacgccatcatctgcctggaggacctga
acttcggcttcaagcgcggc cgccagaaggtggagaagcaggtgtaccagaagttcgagaagatgctgatcgaca
agctgaactacctggtgatggacaagagccgcgagcagctgagccccg agaagatcagcggcgccctgaacgccc
tgcagctgacccccgacttcaagagcttcaaggtgctgggcaagcagaccggcatcatctactacgtgcccgccta
cc tgaccagcaagatcgaccccatgaccggcttcgccaacctgttctacgtgaagtacgagaacgtggacaaggc
caaggagttcttcagcaagttcgacagcatcaa gtacaacaaggacggcaagaactggaacaccaagggctactt
cgagttcgccttcgactacaagaagttcaccgaccgcgcctacggccgcgtgagcgagtgga ccgtgtgcaccgt
gggcgagcgcatcatcaagttcaagaacaaggagaagaacaacagctacgacgacaaggtgatcgacctgaccaac
agcctgaaggagct gttcgacagctacaaggtgacctacgagagcgaggtggacctgaaggacgccatcctggcc
atcgacgaccccgccttctaccgcgacctgacccgccgcctgc agcagaccctgcagatgcgcaacagcagctgc
gacggcagccgcgactacatcatcagccccgtgaagaacagcaagggcgagttcttctgcagcgacaacaa cgac
gacaccacccccaacgacgccgacgccaacggcgccttcaacatcgcccgcaagggcctgtgggtgctgaacgaga
tccgcaacagcgaggagggca gcaagatcaacctggccatgagcaacgcccagtggctggagtacgcccaggaca
acaccatc

[0022] 本发明中Butyrivibrio fibrisolvens MD2001细菌基因组中部分CRISPR array如图2所示，基因组中黑体显示CRISPR array序列为“ATCTACAACAGTAGAAATTATCTATAGGTTC
TT GG”，因此，使用的crRNA direct repeat序列为5’‑AATTTCTACTGTTGTAGAT‑3’。

[0023] 本发明的有益效果：本发明首次在Butyrivibrio fibrisolvens MD2001菌株中鉴定出具有基因编辑效应的II类V型CRISPR蛋白，命名为BfCas12a；所述BfCas12a能够在
crRNA的介导下定点对原核生物和真核生物基因组进行基因编辑，BfCas12a的发现进一步
扩大了基因编辑工具的种类，同时也为后续各种不同情况的基因编辑提供了重要的备选工
具，对基础科研和临床治疗具有十分重要的作用。

附图说明

[0024] 图1为Butyrivibrio fibrisolvens MD2001 CRISPR array及crRNA direct repeat图示。

[0025] 图2为Butyrivibrio fibrisolvens MD2001菌株基因组中存在的部分CRISPR array示意图。

[0026] 图3为体外切割EGFP片段靶点示意图。

[0027] 图4为原核表达BfCas12a之后，体外切割实验，S表示substrate；P表示product。

[0028] 图5为体外实验验证BfCas12a的PAM，S表示substrate；P表示product。

[0029] 图6为体内验证BfCas12a基因编辑，S表示substrate；P表示product。

[0030] 图7为体内验证BfCas12a在相同基因不同靶点的基因编辑效率。

具体实施方式

[0031] 为了更好地理解本发明，下面结合实施例进一步阐明本发明的内容，但本发明的内容不仅仅局限于下面的实施例。

[0032] 实施例1

[0033] BfCas12a体外不同时间梯度切割实验，包括以下实验步骤：

[0034] (1)BfCas12a蛋白的表达与纯化：将BfCas12a基因序列合成到pet28a表达载体上，且在C末端加上6His标签，随后将合成好的质粒转化到E.Coli Rosseta 2(DE3)表达菌株
中，挑取单克隆，小量表达检测确定蛋白表达后进行蛋白的大量表达与纯化；重组蛋白依次
经过 Ni柱亲和层析，heparin柱层析，superdex 200分子筛纯化后，保存在buffer(10mM
Tris‑HCl， 200mM NaCl，1mM MgCl)中，并冻存于‑80℃备用；

[0035] (2)使用crRNA direct repeat序列为：5’‑AATTTCTACTGTTGTAGAT‑3’，在体外转录获得crRNA；将步骤(1)所得BfCas12a蛋白与crRNA混合得到BfCas12a‑crRNA复合物；

[0036] (3)取100nM BfCas12a‑crRNA所得复合物与300ng线性化的底物(图4所示)混匀， 37℃孵育分别孵育0,1,2,5,10min后，加入适量蛋白酶K，58℃消化60min，跑2％琼脂糖胶，
结果如图4所示，BfCas12a具有良好的体外切割能力。

[0037] 实施例2

[0038] BfCas12a识别PAM的确定

[0039] (1)设计NNNN四个位置随机组合的上下游引物(N表示A、G、C、T)，以EGFP片段作为模板，采用overlap PCR方法进行PCR，得到256种带有不同PAM序列，但spacer 序列一样的
1.1kb的线性化底物；

[0040] (2)取100nM BfCas12a‑crRNA复合物与300ng线性化的底物混匀，37℃孵育分别孵育10min后，加入适量蛋白酶K，58℃消化60min，跑2％琼脂糖胶，部分结果如图5所示，
BfCas12a能够识别不同的PAM：TTTA、TCTA、TTCA、TCCA、CTTA、CCTA，但最优PAM 为TTTV(V表
示A,C,G)。

[0041] 实施例3

[0042] BfCas12a在哺乳动物细胞内不同基因的编辑：

[0043] (1)构建BfCas12a真核表达质粒：将BfCas12a基因序列合成到pet28a表达载体上构建BfCas12a真核表达质粒；

[0044] (2)在哺乳动物细胞中，以293T细胞为例选择TRAC、TRBC、B2M、CTLA4、PD1五个基因，分别以这五个基因为目标，构建5个U6‑crRNA spacer真核表达质粒；

[0045] (3)分别针对这五个基因的切割靶点附近设计surveyor primer，并验证PCR引物的特异性；

[0046] (4)消化293T细胞，适当浓度铺24孔板，每孔500ul；

[0047] (5)24孔板共转BfCas12a真核表达质粒(700ng)和U6‑crRNA spacer真核表达质粒 (300ng)，48h后裂解细胞，取1ul裂解液作为模板、以步骤(3)设计的surveyor primer引物
进行PCR，纯化PCR产物；

[0048] (6)取300ng PCR产物与1ul 10XT7EI buffer混匀，按以下PCR程序进行复性95℃ 10min，95℃至85℃‑2℃/S，85℃到25℃‑0.25℃/S，25℃持续1min，复性之后产物加入 1ul
T7EI，37℃酶切20min，跑2％琼脂糖胶，结果如图6所示在B2M、PD1能够进行基因编辑，(本案
例中的基因只是作为代表进行列举,并不说明在其他基因上没有基因编辑的能力)。

[0049] 实施例4

[0050] BfCas12a在哺乳动物细胞内相同基因不同靶点的基因编辑：

[0051] (1)选取并设计VEGFA基因上3个不同的靶点(VEGFA Site 1、VEGFA Site 2、VEGFA Site 3)的crRNA；

[0052] (2)切割靶点附近设计surveyor primer，并验证PCR引物的特异性；

[0053] (3)消化293T细胞，适当浓度铺24孔板，每孔500ul；

[0054] (4)24孔板共转BfCas12a真核表达质粒(700ng)和U6‑crRNA spacer真核表达质粒 (300ng)，48h后裂解细胞，取1ul裂解液作为模板、以步骤(3)设计的surveyor primer引物
进行PCR，纯化PCR产物；

[0055] (5)取300ngPCR产物与1ul 10XT7EI buffer混匀，按以下PCR程序进行复性95℃ 10min，95℃至85℃‑2℃/S，85℃到25℃‑0.25℃/S，25℃持续1min。

[0056] (6)复性之后产物加入1ul T7EI，37℃酶切20min，跑2％琼脂糖胶，结果如图7所示，采用灰度分析可得在各个靶点切割效率分别为20％、34％、6％。

[0057] 显然，上述实施例仅仅是为清楚地说明所作的实例，而并非对实施方式的限制。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或
变动。这里无需也无法对所有的实施方式予以穷举。而因此所引申的显而易见的变化或变
动仍处于本发明创造的保护范围之内。