用于特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体转让专利

申请号 : CN201580023875.6

文献号 : CN106459957B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 西田敬二近藤昭彦小嶋聪美

申请人 : 国立大学法人神户大学

摘要 :

本发明提供一种修饰双链DNA的靶向位点的方法,其包括:使由核酸碱基转变酶、和可与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体,与该双链DNA接触,不切割该靶向位点中的该双链DNA的至少一条链,而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以.上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的工序。

权利要求 :

1.一种修饰双链DNA的靶向位点的非疾病治疗目的的方法,其包括:使由核酸碱基转变酶、和与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体,与该双链DNA接触,不切割该靶向位点中的该双链DNA的至少一条链,而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的工序,其中,核酸序列识别模块为CRISPR-Cas系统,其中该CRISPR-Cas系统包含具有切口酶活性的Cas,其中,所述Cas为Cas9,所述核酸碱基转变酶为脱氨酶。

2.根据权利要求1所述的方法,其中,使用与不同的靶核苷酸序列分别进行特异性结合的两种以上的核酸序列识别模块。

3.根据权利要求2所述的方法,其中,所述不同的靶核苷酸序列存在于不同的基因内。

4.根据权利要求1~3中任一项所述的方法,其中,所述脱氨酶为胞苷脱氨酶。

5.根据权利要求1~3中任一项所述的方法,其中,双链DNA与复合物的接触,通过向具有所述双链DNA的细胞中导入编码所述复合体的核酸来进行。

6.根据权利要求5所述的方法,其中,所述细胞是原核生物细胞。

7.根据权利要求5所述的方法,其中,所述细胞是真核生物细胞。

8.根据权利要求5所述的方法,其中,所述细胞是微生物细胞。

9.根据权利要求5所述的方法,其中,所述细胞是植物细胞。

10.根据权利要求5所述的方法,其中,所述细胞是昆虫细胞。

11.根据权利要求5所述的方法,其中,所述细胞是动物细胞。

12.根据权利要求5所述的方法,其中,所述细胞是脊椎动物细胞。

13.根据权利要求5所述的方法,其中,所述细胞是哺乳动物细胞。

14.根据权利要求6所述的方法,其中,所述细胞为多倍体细胞,并且对同源染色体上的全部靶向化的等位基因内的位点进行修饰。

15.根据权利要求5所述的方法,其包括:将以能够控制表达时期的形式包含编码所述复合体的核酸的表达载体,导入所述细胞的工序,以及在需要使双链DNA的靶向位点的修饰稳定的时期,诱导该核酸的表达的步骤。

16.根据权利要求15所述的方法,其中,双链DNA中的靶核苷酸序列存在于对于所述细胞必需的基因内。

17.核酸修饰酶复合体,该复合体由与双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块,和核酸碱基转变酶连接而成,其中,核酸序列识别模块为CRISPR-Cas系统,其中该CRISPR-Cas系统包含具有切口酶活性的Cas,其中所述Cas为Cas9,所述核酸碱基转变酶为脱氨酶,所述复合体在靶向位点中不切割该双链DNA的至少一条链,使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸。

18.编码权利要求17所述的核酸修饰酶复合体的核酸。

19.根据权利要求1~3中任一项所述的方法,其中,所述Cas是Cas9,其中第10位Asp残基转变为Ala残基。

20.根据权利要求1~3中任一项所述的方法,其中,所述Cas是Cas9,其中第840位His残基转变为Ala残基。

21.核酸序列识别模块在制备用于修饰双链DNA的靶向位点的试剂中的用途,其中双链DNA的靶向位点通过包含以下步骤的方法修饰:使由核酸碱基转变酶、和与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体,与该双链DNA接触,不切割该靶向位点中的该双链DNA的至少一条链,而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的工序,其中,核酸序列识别模块为CRISPR-Cas系统,其中该CRISPR-Cas系统包含具有切口酶活性的Cas,其中,所述Cas为Cas9,所述核酸碱基转变酶为脱氨酶。

22.根据权利要求21所述的用途,其中,使用与不同的靶核苷酸序列分别进行特异性结合的两种以上的核酸序列识别模块。

23.根据权利要求22所述的用途,其中,所述不同的靶核苷酸序列存在于不同的基因内。

24.根据权利要求21~23中任一项所述的用途,其中,所述脱氨酶为胞苷脱氨酶。

25.根据权利要求21~23中任一项所述的用途,其中,双链DNA与复合物的接触,通过向具有所述双链DNA的细胞中导入编码所述复合体的核酸来进行。

26.根据权利要求25所述的用途,其中,所述细胞是原核生物细胞。

27.根据权利要求25所述的用途,其中,所述细胞是真核生物细胞。

28.根据权利要求25所述的用途,其中,所述细胞是微生物细胞。

29.根据权利要求25所述的用途,其中,所述细胞是植物细胞。

30.根据权利要求25所述的用途,其中,所述细胞是昆虫细胞。

31.根据权利要求25所述的用途,其中,所述细胞是动物细胞。

32.根据权利要求25所述的用途,其中,所述细胞是脊椎动物细胞。

33.根据权利要求25所述的用途,其中,所述细胞是哺乳动物细胞。

34.根据权利要求26所述的用途,其中,所述细胞为多倍体细胞,并且对同源染色体上的全部靶向化的等位基因内的位点进行修饰。

35.根据权利要求25所述的用途,其包括:将以能够控制表达时期的形式包含编码所述复合体的核酸的表达载体,导入所述细胞的工序,以及在需要使双链DNA的靶向位点的修饰稳定的时期,诱导该核酸的表达的步骤。

36.根据权利要求25所述的用途,其中,双链DNA中的靶核苷酸序列存在于对于所述细胞必需的基因内。

37.根据权利要求21~23中任一项所述的用途,其中,所述Cas是Cas9,其中第10位Asp残基转变为Ala残基。

38.根据权利要求21~23中任一项所述的用途,其中,所述Cas是Cas9,其中第840位His残基转变为Ala残基。

说明书 :

用于特异性转变靶向DNA序列的核酸碱基的基因组序列的修

饰方法、及其使用的分子复合体

技术领域

[0001] 本发明涉及基因组序列的修饰方法、及其使用的核酸序列识别模块与核酸碱基转变酶的复合体,该基因组序列的修饰方法能够不伴随DNA的双链的切割(无切割或者切割一根链)也不进行外源DNA片段的插入,而修饰基因组的特定区域内的核酸碱基。

背景技术

[0002] 近年来,作为在各种生物种类中修饰关注的基因、基因组区域的技术,基因组编辑受到关注。以往,作为基因组编辑的方法,提出了利用将具有序列非依赖的DNA切割能力的分子与具有序列识别能力的分子的组合的人工核酸酶的方法(非专利文献1)。
[0003] 已有报告例如,使用由锌指DNA结合结构域与非特异性DNA切割结构域连接而成的锌指核酸酶(ZFN),在作为宿主的植物细胞或昆虫细胞中,进行DNA中的靶基因座的重组的方法(专利文献1);使用由作为植物病原菌黄单胞菌属具有的DNA结合模块的转录激活子样(TAL)效应子,与DNA核酸内切酶连接而成的TALEN,在特定的核苷酸序列内或其相邻部位进行切割、修饰靶基因的方法(专利文献2);或者,利用由在真细菌和古细菌具有的获得性免疫系统中起作用的DNA序列CRISPR(Clustered Regularly  interspaced short palindromic repeats),和与CRISPR一起具有重要的作用的核酸酶Cas(CRISPR-associated)蛋白家族组合而成的CRISPR-Cas9系统的方法 (专利文献3)。进一步,也报告了使用PPR蛋白质与核酸酶连接而成的人工核酸酶,在该特定序列的附近切割靶基因的方法(专利文献4),其中,PPR 蛋白质构建为使得利用串联的包括35个氨基酸的并识别1个核酸碱基的 PPR基序,来识别特定的核苷酸序列。
[0004] 现有技术文献
[0005] 专利文献
[0006] 专利文献1:日本专利第4968498号公报
[0007] 专利文献2:日本特表2013-513389号公报
[0008] 专利文献3:日本特表2010-519929号公报
[0009] 专利文献4:日本特开2013-128413号公报
[0010] 非专利文献
[0011] 非专利文献1:Kelvin M Esvelt,Harris H Wang(2013)Genome-scale engineering for systems and synthetic biology,Molecular Systems Biology 9:641发明内容
[0012] 发明要解决的问题
[0013] 迄今为止提出的基因组编辑技术,基本上是以DNA双链切割  (double-DNA breaks:DSB)为前提的,但由于伴随意想不到的基因组修饰,因此有强细胞毒性、染色体重排等副作用,存在诸如以下共通问题:在基因治疗中的可靠性受损、通过核苷酸修饰的细胞存活数极少、在灵长类卵细胞、单细胞微生物中基因修饰本身难以进行。
[0014] 因此,本发明的目的在于,提供一种不DSB、不伴随外源DNA片段的插入,即通过不切割双链DNA或者切割一条链来修饰基因的特定序列的核酸碱基的新型基因组编辑方法,以及用于其的核酸序列识别模块及核酸碱基转变酶的复合体。
[0015] 解决问题的方法
[0016] 本发明人等为了解决上述课题反复进行了深入研究,结果构思了不伴随 DSB,采用基于DNA碱基的转变反应的碱基转变。虽然已经知晓基于DNA 碱基的脱氨基反应的碱基转变反应本身,但尚未实现用其对DNA的特定的序列进行识别而对任意部位靶向化,并通过DNA碱基的碱基转变而特异性修饰被靶向化的DNA。
[0017] 因此,通过使用催化脱氨基反应的脱氨酶作为进行这样的核酸碱基转变的酶并将其与具有DNA序列识别能力的分子连接,从而在包含特定的DNA 序列的区域中进行基于核酸碱基转变的基因组序列的修饰。
[0018] 具体而言,使用CRISPR-Cas系统(CRISPR-突变Cas)进行。即,制作了用于编码将用于募集Cas蛋白质的RNA(反式-激活crRNA:tracrRNA)连接至包含与待修饰的基因的靶序列互补的序列的、基因组特异性CRISPR-RNA: crRNA(gRNA)而成的RNA分子的DNA。另一方面,制作了由编码双链DNA 的任意一条或两条链的切割能力已失活的突变Cas蛋白质的DNA(dCas)与脱氨酶基因连接而成的DNA。将这些DNA导入包含待修饰的基因的宿主酵母细胞。结果,成功地在包括靶序列的关注的基因的几百个核苷酸范围内随机导入突变。与使用对双链DNA的DNA链均不切割的双重突变Cas蛋白质的情况相比,使用切割任意一条链的突变Cas蛋白质的情况下,突变导入效率升高。另外,明确了根据切割DNA双链中的哪条不同,突变区域的面积和突变的多样性也发生变化。此外,通过对关注的基因中的多个区域进行靶向化,可以有效地引入突变。即,确认了将已导入DNA的宿主细胞接种于非选择性培养基,针对随机选择的菌落检查关注的基因的序列,结果几乎针对全部菌落导入了突变。另外,也确认了通过分别对2个以上的关注的基因中具有的区域进行靶向化,可同时进行多个部位的基因组编辑。进一步证实:该方法可以同时向二倍体或多倍体基因组的等位基因中引入突变;不仅可以向真核细胞引入突变,而且可以在原核细胞如大肠杆菌中引入突变;不论生物种类如何均可广泛应用。另外,通过在期望的时期一过性地进行核酸碱基转变反应,可有效地进行迄今为止效率较低的必需基因的编辑。
[0019] 本发明人等基于这些见解进一步反复研究,从而完成了本发明。
[0020] 即,本发明如下所述。
[0021] [1]一种修饰双链DNA的靶向位点的方法,其包括:使由核酸碱基转变酶、和与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体,与该双链DNA接触,不切割该靶向位点中的该双链DNA的至少一条链,而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的工序。
[0022] [2]根据[1]所述的方法,其中,核酸序列识别模块选自:Cas的至少1种 DNA切割能力已失活的CRISPR-Cas系统、锌指基序、TAL效应子及PPR 基序。
[0023] [3]根据[1]所述的方法,其中,核酸序列识别模块为Cas的至少1种DNA 切割能力已失活的CRISPR-Cas系统。
[0024] [4]根据[1]~[3]中任一项所述的方法,其中,使用与不同的靶核苷酸序列分别进行特异性结合的两种以上的核酸序列识别模块。
[0025] [5]根据[4]所述的方法,其中,不同的靶核苷酸序列存在于不同的基因内。
[0026] [6]根据[1]~[5]中任一项所述的方法,其中,核酸碱基转变酶为脱氨酶。
[0027] [7]根据[6]所述的方法,其中,脱氨酶为AID(AICDA)。
[0028] [8]根据[1]~[7]中任一项所述的方法,其中,所述双链DNA与所述复合物的接触,通过向具有所述双链DNA的细胞中导入编码所述复合体的核酸来进行。
[0029] [9]根据[8]所述的方法,其中,细胞是原核生物细胞。
[0030] [10]根据[8]所述的方法,其中,细胞是真核生物细胞。
[0031] [11]根据[8]所述的方法,其中,细胞是微生物细胞。
[0032] [12]根据[8]所述的方法,其中,细胞是植物细胞。
[0033] [13]根据[8]所述的方法,其中,细胞是昆虫细胞。
[0034] [14]根据[8]所述的方法,其中,细胞是动物细胞。
[0035] [15]根据[8]所述的方法,其中,细胞是脊椎动物细胞。
[0036] [16]根据[8]所述的方法,其中,细胞是哺乳动物细胞。
[0037] [17]根据[9]~[16]中任一项所述的方法,其中,细胞为多倍体细胞,并且对同源染色体上的全部靶向化的等位基因内的位点进行修饰。
[0038] [18]根据[8]~[17]中任一项所述的方法,其包括:将以能够控制表达时期的形式包含编码复合物的核酸的表达载体,导入细胞的步骤,以及在需要使双链DNA的靶位点的修饰稳定的时期,诱导该核酸的表达的步骤。
[0039] [19]根据[18]所述的方法,其中,双链DNA中的靶核苷酸序列存在于对于细胞必需的基因内。
[0040] [20]核酸修饰酶复合体,该复合体由与双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块,和核酸碱基转变酶连接而成,在靶向位点中,不切割该双链DNA的至少一条链,使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸。
[0041] [21]编码[20]所述的核酸修饰酶复合体的核酸。
[0042] 发明的效果
[0043] 根据本发明的基因组编辑技术,由于与外来DNA的插入或双链DNA 切割不关联,因此安全性方面优异。即使在常规方法中以基因重组的形式而在生物学上或者法律上存在争议的情况中,技术可能提供解决方案。另外,理论上能够将突变导入的范围从一个碱基的针点(pin point)至几百个碱基的范围进行广泛设定,也可以应用于利用向迄今为止几乎不可能进行的特定的限定区域随机导入突变来进行的局部进化诱导。

附图说明

[0044] [图1]示出了使用CRISPR-Cas系统的本发明的基因修饰方法的机理的示意性说明。
[0045] [图2]示出了使用芽殖酵母(budding yeast),对包含CRISPR-Cas系统与来自七腮鳗(Petromyzon marinus)的PmCDA1脱氨酶的组合的本发明的基因修饰方法的效果进行验证的结果。
[0046] [图3]示出了由使用具有切口酶(nickase)活性的Cas9的D10A突变体的 CRISPR-Cas9系统、与脱氨酶和PmCDA1进行组合的情况 (nCas9D10A-PmCDA1)下,和使用具有DNA双链裂解能力的常规型Cas9的情况下,进行表达诱导后的细胞存活数的变化的图。
[0047] [图4]示出了使用源自人的AID脱氨酶,以与dCas9隔着SH3结构域及其结合配体进行连接的方式构建了多重表达构建体,其中将表达构建体与两种gRNA(以target4及target5的序列为靶)一起导入芽殖酵母的结果的图。
[0048] [图5]示出了通过使用切割任一DNA单链的Cas9,突变导入效率提高的图。
[0049] [图6]示出了在不切割双链DNA的情况下,根据切割哪条单链,突变导入区域的大小和频率发生变化的图。
[0050] [图7]示出通过对邻近的2个区域进行靶向,可以实现极高的突变导入效率的图。
[0051] [图8]示出本发明的基因修饰方法不需要基于标记进行选择的图。确定了序列的全部菌落导入了突变。
[0052] [图9]示出根据本发明的基因修饰方法,可以对基因组中多个部位进行同时编辑的图。上图示出了各基因的靶向部位的核苷酸序列及氨基酸序列,该核苷酸序列上方的箭头指示靶核苷酸序列。箭尾或者箭头的数字表示靶核苷酸序列末端在ORF上的位置。下图示出了红色(R)及白色(W)菌落的各个5 克隆中的靶向部位的测序结果。显示序列中在利用轮廓字体的字母表示的核苷酸中发生了碱基转变。需要说明的是,对刀豆氨酸的反应性(CanR)而言, R显示抗性、S显示敏感性。
[0053] [图10]显示根据本发明的基因修饰方法,可以同时向二倍体基因组的同源染色体上的两个等位基因导入突变的图。图10A显示对于ade1基因(上图) 及can1基因的各自的同源突变导入效率,图10B显示在红色菌落中实际导入了同源突变(下图)。另外,显示在白色菌落中也发生了异源突变(上图)。
[0054] [图11]显示根据本发明的基因修饰方法,能够进行作为原核细胞的大肠杆菌的基因组编辑的图。图11A为显示使用的质粒的示意性说明。图11B 显示可以将galK基因内的区域作为靶标,有效地导入突变(CAA→TAA)。图11C显示对于利用非选择性培养基(none)、含有25μg/ml利福平 (rifampicin)(Rif 25)或含有50μg/ml利福平(Rif 50)的培养基各自的菌落,各2 个克隆进行测序分析的结果。确认导入了赋予利福平抗性的突变(上图)。估计利福平抗性株的出现频率为10%左右(下图)。
[0055] [图12]显示基于指导RNA的长度而调节编辑的碱基部位的图。图12A 显示在使靶核苷酸序列长为20碱基的情况下、为24碱基的情况下的编辑的碱基部位的概念图。图12B显示以gsiA基因为靶标,改变靶核苷酸序列长度进行编辑的结果。突变部位为粗体,“T”及“A”表示在克隆内完全导入了突变(C→T或G→A);“t”表示以50%以上的比例在克隆内导入了突变(C→T)(不完全克隆);“c”表示在克隆内,突变(C→T)的导入效率低于50%。
[0056] [图13]显示实施例11使用的突变导入用温度敏感性质粒的示意性说明。
[0057] [图14]显示实施例11中的突变导入的方案的图。
[0058] [图15]显示实施例11中向rpoB基因导入突变的结果的图。
[0059] [图16]显示实施例11中向galK基因导入突变的结果的图。

具体实施方式

[0060] 本发明提供:不切割待修饰的双链DNA的至少一条链,而是通过将该双链DNA中靶核苷酸序列及其附近的核苷酸转变为其它核苷酸,从而修饰该双链DNA的该靶向位点的方法。该方法包括:通过使由核酸碱基转变酶、和可与该双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块连接而成的复合体,与该双链DNA接触,而使该靶向位点,即靶核苷酸序列及其附近的核苷酸转变为其它核苷酸的工序。
[0061] 在本发明中,对双链DNA的“修饰”是指使DNA链上的某核苷酸(例如: dC)缺失或转变为其它核苷酸(例如:dT、dA或dG),或者向DNA链上的核苷酸之间插入核苷酸或者核苷酸序列。这里,对待修饰的双链DNA没有特别限制,优选为基因组DNA。另外,双链DNA的“靶向位点”是指,核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分,或指其和该靶核苷酸序列的附近(5’上游及3’下游中任意一种或两种),根据目的不同,该范围可以在1碱基~几百个碱基的长度之间适当调节。
[0062] 在本发明中,“核酸序列识别模块”是指,具有对DNA链上的特定的核苷酸序列(即,靶核苷酸序列)进行特异性识别并结合的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合,使与该模块连接的核酸碱基转变酶在双链DNA的靶向位点发挥特异性的作用。
[0063] 在本发明中,“核酸碱基转变酶”是指,可以通过催化DNA碱基的嘌呤或嘧啶环上的取代基转变为其它基团或原子的反应,不切割DNA链,将靶核苷酸转变为其它核苷酸的酶。
[0064] 在本发明中,“核酸修饰酶复合体”是指,包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体,其中复合体具有核酸碱基转变酶活性并且赋予了特定的核苷酸序列识别能力。本申请使用的“复合体”不仅包括由多个分子构成的形式,也包括像融合蛋白那样的具有核酸序列识别模块和核酸碱基转变酶的单个分子。
[0065] 用于本发明的核酸碱基转变酶只要可以催化上述反应即可,没有特别限制,可列举例如,催化氨基转变为羰基的脱氨基反应的、属于核酸/核苷酸脱氨酶超家族的脱氨酶。优选的核酸碱基转变酶可列举:可以将胞嘧啶或 5-甲基胞嘧啶分别转变为尿嘧啶或胸腺嘧啶的胞苷脱氨酶、可以将腺嘌呤转变为次黄嘌呤的腺苷脱氨酶、可以将鸟嘌呤转变为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,可列举更优选作为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶的活化诱导的胞苷脱氨酶(下文,也称为AID)等。
[0066] 对核酸碱基转变酶的来源没有特别限制,可以使用例如:来自七腮鳗的 PmCDA1(Petromyzon marinus cytosine deaminase 1)、来自哺乳动物(例如:人、猪、牛、马、猴等)的AID(Activation-induced cytidine deaminase;AICDA)。分别将PmCDA1的CDS的碱基序列及氨基酸序列显示于序列编号1和2中,分别将人AID的CDS的碱基序列及氨基酸序列显示于序列编号3和4中。
[0067] 对利用本发明的核酸修饰酶复合体的核酸序列识别模块进行识别的双链DNA中的靶核苷酸序列而言,只要可以与该模块特异性结合即可,没有特别的限制,可以为双链DNA中的任意序列。就靶核苷酸序列的长度而言,只要足以与核酸序列识别模块进行特异性结合即可,例如:在向哺乳动物的基因组DNA中特定的部位导入突变时,根据其基因组尺寸为12个核苷酸以上,优选为15个核苷酸以上,更优选为17个核苷酸以上。对长度的上限没有特别的限制,优选为25个核苷酸以下,更优选为22个核苷酸以下。
[0068] 作为本发明的核酸修饰酶复合体的核酸序列识别模块,可以使用例如: Cas的至少1种DNA切割能力已失活的CRISPR-Cas系统(CRISPR-突变 Cas)、锌指基序、TAL效应子及PPR基序等,除此以外,包含限制酶、转录因子、RNA聚合酶等可与DNA进行特异性结合的蛋白质的DNA结合结构域且不具有DNA双链切割能力的片段等,但不限于这些。模块优选包括: CRISPR-突变Cas、锌指基序、TAL效应子、PPR基序等。
[0069] 锌指基序由3~6个Cys2His2不同型的锌指单元(1个手指识别约3个碱基)连接而成,可以识别9~18个碱基的靶核苷酸序列。锌指基序可以根据 Modular assembly法(Nat Biotechnol(2002)20:135-141)、OPEN法(Mol Cell(2008)31:294-301)、CoDA法(Nat Methods(2011)8:67-69)、大肠杆菌单杂交法(Nat Biotechnol(2008)26:695-701)等公知的方法制作。对于制作锌指基序的的细节,可以参照上述专利文献1。
[0070] 对TAL效应子而言,具有以约34氨基酸作为单位的模块的重复结构,利用1个模块的第12及13个氨基酸残基(称为RVD)确定结合稳定性和碱基特异性。由于各个模块的独立性较高,因此可以仅将模块相连接来制作对靶核苷酸序列特异性的的TAL效应子。TAL效应子可以利用Open resource的制作方法(REAL法(Curr Protoc Mol Biol(2012)Chapter 12:Unit 12.15)、FLASH 法(Nat Biotechnol(2012)30:460-465)、Golden Gate法(Nucleic Acids Res(2011)39:e82)等)进行构建,相对容易地设计相对于靶核苷酸序列的TAL 效应子。对于制作TAL效应子的细节,可以参照上述专利文献2。
[0071] 对PPR基序而言,构建为使得通过串联的包含35个氨基酸的1个核酸碱基识别PPR基序来识别特定的核苷酸序列,仅利用各基序的第1、4及第 ii(倒数第2)的氨基酸识别靶向碱基。由于对基序构型没有依赖性,不受两侧的基序的干涉,因此与TAL效应子相似地,可以仅将PPR基序相连接来制作对靶核苷酸序列特异性的PPR蛋白质。对于制作PPR基序的细节,可以参照上述专利文献4。
[0072] 另外,在使用限制酶、转录因子、RNA聚合酶等片段的情况下,由于它们的蛋白质的DNA结合结构域是众所周知的,因此可以容易地设计、构建包含所述结构域且不具有DNA双链切割能力的片段。
[0073] 上述任意核酸序列识别模块也可以以上述核酸碱基转变酶的融合蛋白的形式提供,或者,也可以将SH3结构域、PDZ结构域、GK结构域、GB 结构域等蛋白质结合结构域和它们的结合配偶体,分别与核酸序列识别模块和与核酸碱基转变酶融合,通过该结构域和它们的结合配体的相互作用而以蛋白质复合体的形式提供。或者,也可以将核酸序列识别模块与核酸碱基转变酶和与内含肽(intein)分别融合,利用各蛋白质合成后的接合将两者连接。
[0074] 就包含核酸序列识别模块与核酸碱基转变酶连接而成的复合体(包括融合蛋白)的本发明的核酸修饰酶复合体与双链DNA的接触而言,虽然可以以无细胞体系的酶反应的形式进行,但鉴于本发明的主要的目的,需要通过向具有关注的双链DNA(例如,基因组DNA)的细胞导入编码该复合体的核酸来进行接触。
[0075] 因此,对核酸序列识别模块与核酸碱基转变酶而言,优选以编码它们的融合蛋白的核酸的形式制备,或者,以分别编码它们的核酸的形式以使得利用结合结构域、内含肽等翻译成蛋白质之后,能够在宿主细胞内形成复合体的形态进行制备。在此,核酸可以是DNA也可以是RNA。在为DNA时,优选为双链DNA,并且以在宿主细胞内配置为在功能性的启动子的控制下的表达载体的形态提供。在为RNA时,优选为单链RNA。
[0076] 由于核酸序列识别模块和核酸碱基转变酶连接而成的本发明的复合体与DNA双链切割(DSB)不相关联,因此,能够进行毒性较低的基因组编辑,本发明的基因修饰方法可以适用于范围较广的生物材料。因此,就导入核酸序列识别模块及/或核酸碱基转变酶编码核酸的细胞而言,从作为原核生物的大肠杆菌等细菌、作为低等真核生物的酵母等微生物的细胞,到昆虫、植物等高等真核生物的细胞、包括人等哺乳动物的脊椎动物的细胞,可以包括所有生物种类的细胞。
[0077] 对编码锌指基序、TAL效应子、PPR基序等核酸序列识别模块的DNA 而言,可以通过上述任意方法获得各模块。对编码限制酶、转录因子、RNA 聚合酶等序列识别模块的DNA而言,可以通过以下进行克隆:例如基于它们的cDNA序列信息,来合成使得覆盖编码该蛋白质的期望部分(包含DNA 结合结构域的部分)的区域的寡DNA引物,并利用从产生该蛋白质的细胞制备的总RNA或者mRNA级分作为模板,通过RT-PCR法扩增。
[0078] 编码核酸碱基转变酶的DNA也可以同样地通过以下进行克隆:基于待使用的酶的cDNA序列信息来合成寡DNA引物,使用由产生该酶的细胞制备的总RNA或者mRNA级分作为模板,通过RT-PCR法扩增。例如,就编码七腮鳗的PmCDA1的DNA而言,可以基于NCBI数据库登记的cDNA序列(accession No.EF094822),针对CDS的上游及下游设计适当的引物,通过 RT-PCR法从来自七腮鳗的mRNA进行克隆。另外,就编码人AID的DNA 而言,可以基于NCBI数据库登记的cDNA序列(accession No.AB040431),针对CDS的上游及下游设计适当的引物,例如通过RT-PCR法从来自人淋巴结的mRNA进行克隆。
[0079] 已克隆的DNA可以直接或根据需要利用限制酶进行消化,或在加入适当的接头及/或核定位信号(在关注的双链DNA为线粒体、或叶绿体DNA的情况下,为各细胞器转移信号)之后,与编码核酸序列识别模块的DNA进行接合,来制备编码融合蛋白的DNA。或者,可以通过将编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA分别与编码结合结构域或者其结合配偶体的DNA进行融合,或也可以将两种DNA通过与编码分离内含肽的DNA进行融合,使得核酸序列识别转变模块和核酸碱基转变酶在宿主细胞内翻译,然后再形成复合体。在这些情况下,也可以根据需要,在一方或双方DNA的适当的位置连接接头及/或核定位信号。
[0080] 对编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA而言,可以化学合成DNA链,或者也可以通过将部分重叠的合成的寡DNA短链利用PCR法、Gibson Assembly法进行连接,构建编码其全长的DNA。利用组合化学合成或PCR法或者Gibson Assembly法来构建全长DNA的优点在于,可以在整个CDS全长上设计与待导入该DNA的宿主配合的使用密码子。通过在表达异种DNA时,将该DNA序列转变为在宿主生物中使用频率高的密码子,可以期待使蛋白质表达量增大。就使用的宿主中的密码子使用频率的数据而言,可以使用例如在(公财)Kazusa  DNA研究所的主页上公开的遗传密码使用频率数据库(http://
www.kazusa.or.jp/codon/index.html),还可以参照记载在各宿主中密码子的使用频率的文献。只要参照取得的数据和准备导入的DNA序列,将该DNA序列中使用的密码子中在宿主中使用频率低的密码子,转变为编码同一氨基酸且使用频率高的密码子即可。
[0081] 包含编码核酸序列识别模块及/或核酸碱基转变酶的DNA表达载体,可以通过例如将该DNA连接至适当的表达载体的启动子的下游来制造。
[0082] 作为表达载体,可以使用来自大肠杆菌的质粒(例如,pBR322、pBR325、 pUC12、pUC13);来自枯草杆菌的质粒(例如,pUB110、pTP5、pC194);来自酵母的质粒(例如,pSH19、pSH15);昆虫细胞表达质粒(例如:pFast-Bac);动物细胞表达质粒(例如:pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);λ噬菌体等噬菌体;杆状病毒等昆虫病毒载体(例如:BmNPV、AcNPV);逆转录病毒、痘苗病毒、腺病毒等动物病毒载体等。
[0083] 作为启动子,只要是对应于基因表达的宿主的适当的启动子即可。由于涉及DSB的常规法的毒性的缘故,有时宿主细胞的存活率显著降低,因此期望通过使用诱导启动子增加诱导开始为止的细胞数量,但由于表达本发明的核酸修饰酶复合体也可实现充分的细胞增殖,因此可以无限制地使用构成启动子。
[0084] 例如,在宿主为动物细胞的情况下,可以使用SRα启动子、SV40启动子、LTR启动子、CMV(巨细胞病毒)启动子、RSV(劳斯肉瘤病毒)启动子、 MoMuLV(Moloney小鼠白血病病毒)LTR、HSV-TK(单纯疱疹病毒胸苷激酶) 启动子等。其中,优选CMV启动子、SRα启动子等。
[0085] 当宿主是大肠杆菌的情况下,优选trp启动子、lac启动子、recA启动子、λPL启动子、lpp启动子、T7启动子等。
[0086] 当宿主是芽孢杆菌属的情况下,优选SPO1启动子、SPO2启动子、penP 启动子等。
[0087] 当宿主是酵母的情况下,优选Gal1/10启动子、PHO5启动子、PGK启动子、GAP启动子、ADH启动子等。
[0088] 当宿主是昆虫细胞的情况下,优选多角体蛋白启动子、P10启动子等。
[0089] 当宿主是植物细胞的情况下,优选CaMV35S启动子、CaMV19S启动子、NOS启动子等。
[0090] 作为表达载体,除了上述以外,可以根据需要使用含有增强子、剪接信号、终止子、polyA添加信号、选择标记如药物抗性基因、营养缺陷型互补基因等、复制起点等的载体。
[0091] 编码核酸序列识别模块及/或核酸碱基转变酶的RNA,可以通过例如以编码上述核酸序列识别模块及/或核酸碱基转变酶的DNA编码载体作为模板,通过本身已知的体外转录系统转录为mRNA来制备。
[0092] 可以通过将包含编码核酸序列识别模块及/或核酸碱基转变酶的DNA表达载体导入宿主细胞并培养该宿主细胞,在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体。
[0093] 作为宿主,可以使用例如:埃希氏菌属、芽孢杆菌属、酵母、昆虫细胞、昆虫、动物细胞等。
[0094] 作为埃希氏杆菌属,可以使用例如:大肠杆菌(Escherichia coli)K12?DH1[Proc.Natl.Acad.Sci.USA,60,160(1968)]、大肠杆菌 JM103[Nucleic Acids Research,9,309(1981)]、大肠杆菌JA221[Journal of Molecular Biology,120,517(1978)]、大肠杆菌HB101[Journal of Molecular Biology,41,459(1969)]、大肠杆菌C600[Genetics,39,
440(1954)]等。
[0095] 作为芽孢杆菌属,可以使用例如:枯草芽孢杆菌(Bacillus subtilis)MI114[Gene,24,255(1983)]、枯草芽孢杆菌207-21[Journal of Biochemistry,95,87(1984)]等。
[0096] 作为酵母,可以使用例如:酿酒酵母(Saccharomyces cerevisiae)AH22、 AH22R-、NA87-11A、DKD-5D、20B-12、粟酒裂殖酵母(Schizosaccharomyces pombe)NCYC1913、NCYC2036、巴斯德毕赤酵母(Pichia pastoris)KM71等。
[0097] 作为昆虫细胞,可以使用例如:在病毒为AcNPV的情况下,来自甘蓝夜蛾的幼虫来源的株系细胞(Spodoptera frugiperda cell;Sf细胞)、来自 Trichoplusia ni的中肠MG1细胞、来自Trichoplusia ni的卵的High FiveTM 细胞、来自Mamestra brassicae的细胞、来自Estigmena acrea的细胞等。在病毒为BmNPV的情况下,作为昆虫细胞,可以使用来自蚕的株系细胞 (Bombyx mori N细胞;BmN细胞)等。作为该Sf细胞,可以使用例如:Sf9 细胞(ATCC CRL1711)、Sf21细胞[以上,In Vivo,13,213-217(1977)]等。
[0098] 作为昆虫,可以使用例如:蚕的幼虫、果蝇、蟋蟀等[Nature,315, 592(1985)]。
[0099] 作为动物细胞,可以使用例如:猴COS-7细胞、猴Vero细胞、中国仓鼠卵巣(CHO)细胞、dhfr基因缺陷CHO细胞、小鼠L细胞、小鼠AtT-20细胞、小鼠骨髓瘤细胞、大鼠GH3细胞、人FL细胞等细胞株、人及其它哺乳动物的iPS细胞、ES细胞等多功能性干细胞、由各种组织制备的初代培养细胞。进一步,也可以使用斑马鱼胚胎、非洲爪蟾卵母细胞等。
[0100] 作为植物细胞,可以使用从各种植物(例如:水稻、小麦、玉米等谷物,番茄、黄瓜、茄子等商品作物,康乃馨、洋桔梗等园艺植物,烟草、拟南芥等实验植物等)制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片等。
[0101] 上述任意宿主细胞可以为单倍体(一倍体)、多倍体(例如,二倍体、三倍体、四倍体等)。常规的突变导入方法中,作为原则仅向同源染色体的一条中导入突变而形成异源基因型,因此,如果不是显性突变,就不会表达需要的特征,而使其同源耗时耗力,大多情况不方便。与此相对,根据本发明,由于可以对基因组内的同源染色体上的全部等位基因导入突变,因此即使为隐性突变,也可以在该代表达需要的特征(图10),从克服了常规法的症结的方面考虑,极其有用。
[0102] 对表达载体的导入而言,可以根据宿主的种类,按照公知的方法(例如:溶菌酶法、感受态法、PEG法、CaCl2共沉淀法、电穿孔法、显微注射法、粒子枪法、脂质转化法、农杆菌法等)进行实施。
[0103] 对于大肠杆菌,可以按照例如:Proc.Natl.Acad.Sci.USA,69,2110(1972)、 Gene,17,107(1982)等中记载的方法进行转化。
[0104] 可以按照例如:Molecular&General Genetics,168,111(1979)等中记载的方法,将载体导入芽孢杆菌属。
[0105] 可以按照例如:Methods  in  Enzymology,194,182-187(1991), Proc.Natl.Acad.Sci.USA,75,1929(1978)等中记载的方法,将载体导入酵母。
[0106] 可以按照例如:Bio/Technology,6,47-55(1988)等中记载的方法,将载体导入昆虫细胞及昆虫。
[0107] 可以按照例如:细胞工程学增刊8新细胞工程学实验方案, 263-267(1995)(秀润公司发行),Virology,52,456(1973)中记载的方法,将载体导入动物细胞。
[0108] 就已导入载体的细胞的培养而言,可以根据宿主的种类,按照公知的方法实施。
[0109] 例如,在培养大肠杆菌或芽孢杆菌的情况下,作为用于培养的培养基优选液体培养基。另外,培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。这里,作为碳源,可以举出例如:葡萄糖、糊精、可溶性淀粉、蔗糖等;作为氮源,可以举出例如:铵盐类、硝酸盐类、玉米浆、蛋白胨、酪蛋白、肉浸膏、大豆饼、马铃薯提取液等无机或有机物质;作为无机物,可以举出例如:氯化钙、磷酸二氢钠、氯化镁等。另外,也可以向培养基添加酵母提取物、维生素类、生长促进因子等。培养基的pH优选为约5~约8。
[0110] 作为培养大肠杆菌时的培养基,例如,优选包含葡萄糖、酪蛋白氨基酸的M9培养基[Journal of Experiments in Molecular Genetics,431-433,Cold Spring Harbor Laboratory,New York 1972]。根据需要,为了使启动子有效地工作,例如也可以向培养基添加3β-吲哚基丙烯酸的那样的试剂。大肠杆菌的培养通常在约15~约43℃进行。根据需要,可以进行通气、搅拌。
[0111] 芽孢杆菌的培养通常在约30~约40℃进行。根据需要,可以进行通气、搅拌。
[0112] 作为培养酵母时的培养基,可列举例如:Burkholder最小培养基 [Proc.Natl.Acad.Sci.USA,77,4505(1980)]、0.5%含酪蛋白氨基酸的SD培养基 [Proc.Natl.Acad.Sci.USA,81,5330(1984)]等。培养基的pH优选为约5~约8。培养通常在约20℃~约35℃进行。可以根据需要进行通气、搅拌。
[0113] 作为培养昆虫细胞或昆虫时的培养基,可以使用例如向Grace's Insect Medium[Nature,195,788(1962)]中适当添加了灭活的10%牛血清等添加物的培养基等。培养基的pH优选为约6.2~约6.4。培养通常在约27℃进行。可以根据需要进行通气、搅拌。
[0114] 作为培养动物细胞时的培养基,可以使用例如:包含约5~约20%的胎牛血清的最小必要培养基(MEM)[Science,122,501(1952)]、Dulbecco改良的Eagle培养基(DMEM)[Virology,8,396(1959)]、RPMI 1640培养基[The Journal of the American Medical Association,199,519(1967)]、199培养基 [Proceeding of the Society for the Biological Medicine,73,1(1950)]等。培养基的 pH优选为约6~约8。培养通常在约30℃~约40℃进行。可以根据需要进行通气、搅拌。
[0115] 作为培养植物细胞的培养基,可以使用MS培养基、LS培养基、B5培养基等。培养基的pH优选为约5~约8。培养通常在约20℃~约30℃进行。可以根据需要进行通气、搅拌。
[0116] 如上所述操作,可以在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体,即核酸修饰酶复合体。
[0117] 编码核酸序列识别模块及/或核酸碱基转变酶RNA向宿主细胞的导入,可以通过显微注射法、脂质转化法等进行。RNA的导入可以1次或者隔着适当的间隔进行多次(例如:2~5次)。
[0118] 由导入至细胞内的表达载体或RNA分子,表达核酸序列识别模块和核酸碱基转变酶的复合体时,该核酸序列识别模块特异性识别并结合目的的双链DNA(例如,基因组DNA)内的靶核苷酸序列,利用连接于该核酸序列识别模块的核酸碱基转变酶的作用,靶向位点(可以在包含靶核苷酸序列的全部或者一部分或它们的附近的几百个碱基的范围内适当调节)的有义链或者反义链发生碱基转变,在双链DNA内产生错配(例如:将PmCDA1、AID等胞苷脱氨酶作为核酸碱基转变酶使用的情况下,靶向位点的有义链或者反义链上的胞嘧啶被转变为尿嘧啶,产生U:G或者G:U错配)。通过以下导入各种突变:该错配未被正确修复,或修复使得相反链的碱基与已转变的链的碱基成对(上述的例子中,为T-A或者A-T),修复时进一步取代为其它核苷酸 (例如:U→A、G),或者发生1个~数十个碱基的缺失或者插入。
[0119] 对锌指基序而言,由于与靶核苷酸序列特异性结合的锌指的制作效率不高,另外,结合特异性高的锌指的筛选并不容易,因此,制作实际发挥功能的多个锌指基序并不容易。就TAL效应子、PPR基序而言,比锌指基序的靶核酸序列识别的自由度高,但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质,因此在效率方面存在问题。
[0120] 与此相对,由于CRISPR-Cas系统是通过相对于靶核苷酸序列互补的指导RNA来识别关注的双链DNA的序列,因此可以通过仅合成可与靶核苷酸序列形成特异性的Hybrid的寡DNA,以任意序列为靶标。
[0121] 因此,在本发明更优选的实施形态中,使用了Cas的至少1种DNA切割能力已失活的CRISPR-Cas系统(CRISPR-突变Cas)作为核酸序列识别模块。
[0122] 图1为显示将CRISPR-突变Cas用作核酸序列识别模块的,本发明的双链DNA修饰方法的示意性说明。
[0123] 使用了CRISPR-突变Cas的本发明的核酸序列识别模块,是以RNA分子与突变Cas蛋白质的复合体的形式提供的,其中,所述RNA分子由与靶核苷酸序列互补的指导RNA、对突变Cas蛋白质的募集必需的tracrRNA组成。
[0124] 本发明使用的Cas蛋白质只要属于CRISPR系统即可,没有特别限制,优选为Cas9。作为Cas9,可列举例如,来自化脓性链球菌(Streptococcus pyogenes)的Cas9(SpCas9)、来自嗜热链球菌(Streptococcus thermophilus)的 Cas9(StCas9)等,但不限于这些。优选为SpCas9。作为本发明使用的突变Cas,具有使双链DNA的两条链失活的切割能力的Cas、或仅使一条链失活的切割能力的具有切口酶活性的Cas均可以使用。例如,在为SpCas9的情况下,可以使用第10位的Asp残基转变为Ala残基的、欠缺对形成与指导RNA互补的链的相反链的切割能力的D10A突变体,或者,第840位的His残基转变为Ala残基的、欠缺与指导RNA互补的链的切割能力的H840A突变体,进一步可使用其双突变体,但也可以使用其它突变Cas。
[0125] 对核酸碱基转变酶而言,通过与上述锌指等的连接方式相同的方法,以突变Cas的复合体的形式提供。或者,也可以将核酸碱基转变酶和突变Cas,利用与作为RNA适体的MS2F6、PP7等和由它们的结合蛋白质构成的RNA 支架进行连接。指导RNA与靶核苷酸序列形成互补链,接着tracrRNA募集突变Cas,对DNA切割部位识别序列PAM(protospacer adjacent motif)(当使用SpCas9的情况下,PAM为NGG(N为任意碱基)3个碱基,理论上,基因组上的任意部位都可以被靶向化)进行识别,不切割一条或者两条DNA,利用连接于突变Cas的核酸碱基转变酶的作用,使靶向部位(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)产生碱基转变,在双链DNA内产生错配。通过以下导入各种突变:该错配未被正确修复,修复使得相反链的碱基与已转变链的碱基成对,修复时进一步被转变为其它核苷酸,或者发生1个~数十个碱基的缺失或者插入,(例如:参照图2)。
[0126] 在将CRISPR-突变Cas用作核酸序列识别模块的情况下,也与将锌指等用作核酸序列识别模块的情况相同地,优选将核酸序列识别模块和核酸碱基转变酶,以编码它们的核酸的形态导入具有关注的双链DNA的细胞。
[0127] 编码Cas的DNA,可以通过与对于编码核酸碱基转变酶的DNA的上述方法同样的方法从产生该酶的细胞进行克隆。另外,突变Cas可以通过以下获得:在已克隆的Cas编码DNA中,使用本身公知的部位特异性的突变诱发法,以将对DNA切割活性重要的部位的氨基酸残基(例如:在为Cas9的情况下,可列举第10位的Asp残基、第840位的His残基,但不限于这些) 转变为其它氨基酸的方式导入突变。
[0128] 或者,对编码突变Cas的DNA而言,也可以针对编码核酸序列识别模块的DNA、编码核酸碱基转变酶的DNA,利用与上述相同的方法和化学合成或PCR法或Gibson Assembly法的组合,构建成具有适于使用的宿主细胞的表达的密码子使用的DNA形式。例如:将为了在真核细胞中表达SpCas9 的最优化的CDS序列及氨基酸序列示于序列编号5及6。如果将序列编号5 所示的序列中的碱基编号29的“A”转变为“C”,则可以得到编码D10A突变体的DNA,如果将碱基编号2518-2519的“CA”转变为“GC”,则可以得到编码H840A突变体的DNA。
[0129] 对编码突变CasDNA和编码核酸碱基转变酶的DNA而言,可以连接成使得作为融合蛋白表达,也可以设计成使得使用结合结构域、内含肽等分别进行表达,通过蛋白质间相互作用、蛋白质接合在宿主细胞内形成复合体。
[0130] 对得到的编码突变Cas及/或核酸碱基转变酶的DNA而言,可以根据宿主不同,插入至与上述相同的表达载体的启动子的下游。
[0131] 另一方面,编码指导RNA及tracrRNA的DNA可以设计成,将相对于靶核苷酸序列互补的指导RNA序列与已知的tracrRNA序列(例如: gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtg ctttt;序列编号7)连接而成的寡DNA序列,并用DNA/RNA合成仪进行化学合成。
[0132] 对指导RNA序列的长度而言,只要是可相对于靶核苷酸序列特异性结合即可,没有特别限制,例如为15~30个核苷酸,优选为18~24个核苷酸。
[0133] 编码指导RNA及tracrRNA的DNA也可以根据宿主不同,插入至与上述相同的表达载体,作为启动子,优选使用pol III类的启动子(例如,SNR6、 SNR52、SCR1、RPR1、U6、H1启动子等)及终止子(例如,T6序列)。
[0134] 对编码突变Cas及/或核酸碱基转变酶的RNA而言,可以通过例如,以对编码上述突变Cas及/或核酸碱基转变酶的DNA进行编码的载体作为模板,通过本身公知的体外转录系统转录为mRNA来制备。
[0135] 可以将指导RNA-tracrRNA设计成由与靶核苷酸序列互补的序列与已知的tracrRNA序列连接而成的寡RNA序列,并用DNA/RNA合成仪进行化学合成。
[0136] 对编码突变Cas及/或核酸碱基转变酶的DNA或者RNA、指导 RNA-tracrRNA或编码其的DNA而言,可以根据宿主不同,通过与上述相同的方法导入宿主细胞。
[0137] 常规型的人工核酸酶中,由于伴随DNA双链切割(DSB),因此,对基因组内的序列进行靶向时,发生染色体的无序的切割(脱靶切割)导致的增殖障碍和细胞死亡。该影响对很多微生物、原核生物是特别致命的,阻碍了其适用性。在本发明中,由于通过不切割DNA的对DNA碱基上的取代基的转变反应(特别是脱氨基反应)进行突变导入,因此,可以实现毒性的大幅降低。实际上,如下文的实施例所示,在将芽殖酵母作为宿主使用的比较试验中,确认在使用了具有常规型的DSB活性的Cas9的情况下,由表达诱导导致细胞存活数减少,与此相对,在组合了突变Cas和核酸碱基转变酶的本发明的技术中,细胞继续增殖,细胞存活数增加(图3)。
[0138] 需要说明的是,本发明的双链DNA的修饰不会妨碍在靶向位点(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)以外产生该双链DNA的切割。然而,本发明的最大的优点之一,是避免了由脱靶(off-target)切割导致的毒性,如果考虑到原则上可以适用于任何生物种类,则在一种优选的实施形态中,本发明的双链DNA的修饰不仅在选择的双链 DNA的靶向位点与DNA链的切割不相关联,在其它部位也是。
[0139] 另外,如下文的实施例所示,与使用两条链均不能切断的突变Cas的情况相比,作为突变Cas使用了具有仅能切割双链DNA之中的一条链的切口酶(nickase)活性的Cas的情况下(图5),突变导入效率升高。因此,例如,可以通过在核酸序列识别模块和核酸碱基转变酶以外,进一步连接具有切口酶活性的蛋白质,从而在靶核苷酸序列的附近仅切割DNA一根链,在避免基于DSB的强毒性的同时,使突变导入效率提高。
[0140] 进一步,对具有切割不同链的两种切口酶活性的突变Cas的效果进行比较,结果显示使用一种突变Cas导致突变部位累积于靶核苷酸序列的中央附近,使用另一种突变Cas导致向从靶核苷酸序列到达几百个碱基的区域随机导入了多种突变(图6)。因此,通过选择切口酶待切割的链,可以向特定的核苷酸或核苷酸区域导入点性突变,或者向比较宽的范围随机导入多种突变,可以根据目的不同而适当使用。例如,如果将前者的技术用于基因疾病 iPS细胞,则可以通过在修复了由患者自身的细胞制作的iPS细胞中的病原基因的突变之后,通过使其分化为关注的体细胞,制作排斥风险更低的细胞移植疗法剂。
[0141] 在下文的实施例7和随后的实施例中,示出了可以对特定的核苷酸中几乎在针点上导入突变。像这样,为了对期望的核苷酸针点性导入突变,只要设定靶核苷酸序列使得希望导入突变的核苷酸和靶核苷酸序列的位置关系存在规律性即可。使用CRIPR-Cas系统作为核酸序列识别模块、且使用AID 作为核酸碱基转变酶,可以设计靶核苷酸序列,使得希望导入突变的C(或者其相反链的G)在离靶核苷酸序列的5’端2~5个核苷酸的位置。如上所述,指导RNA序列的长度可以在15~30个核苷酸,优选为18~24个核苷酸之间适当设定。由于指导RNA序列为与靶核苷酸序列互补的序列,因此改变指导RNA序列的长度,导致靶核苷酸序列的长度也发生变化,但无论核苷酸长度如何,都保持对存在于离5’端2~5个核苷酸的位置的C或G可能导入突变的规律性(图12)。因此,通过适当选择靶核苷酸序列(作为其互补链的指导RNA)的长度,可以移动能够导入突变碱基的部位。由此,也可以解除由DNA切割部位识别序列PAM(NGG)导致的限制,进一步提高突变导入的自由度。
[0142] 如下文的实施例所示,相对于当单独的核苷酸序列用作靶时,通过相对于邻近的多个靶核苷酸序列而制作序列识别模块并同时使用,突变导入效率大幅升高(图7)。效果是,从使得两个靶核苷酸序列的一部分发生重复的情到即使两者分开600bp左右的情况下,都同样实现突变诱导。另外,在靶核苷酸序列存在于相同方向(靶核苷酸序列存在于相同链上)(图7)、以及在对向 (靶核苷酸序列存在于双链DNA的各自链上)(图4)的两种情况下,均可发生。
[0143] 如下文的实施例所示,就本发明的基因组序列的修饰方法而言,如果选择适当的靶核苷酸序列,则可以在表达本发明的核酸修饰酶复合体的几乎全部的细胞中导入突变(图8)。因此,不需要在常规基因组编辑中所必需的选择标识基因的插入和选择。其在使基因操作显著地变得简便的同时,由于没有了重组外源DNA的生物,因此对作物育种等的适用性大幅变宽。
[0144] 另外,由于突变导入效率极高,且不需要利用标识的选择,因此在本发明的基因组序列的修饰方法中,可以对完全不同的位置的多个DNA区域作为靶进行修饰(图9)。因此,在本发明优选的一种实施形态中,可以使用与不同的靶核苷酸序列(可以在1个关注的基因内,也可以在不同的2个以上关注的基因内。这些目的基因可以位置在相同的染色体上,也可以在不同的染色体上。)分别特异性结合的、两种以上的核酸序列识别模块。在这种情况下,将这些核酸序列识别模块的各1个与核酸碱基转变酶形成核酸修饰酶复合体。这里,核酸碱基编辑酶可以使用共通的酶。例如,在使用CRISPR-Cas 系统作为核酸序列识别模块的情况下,可以对于Cas蛋白质和核酸碱基转变酶的复合体(包含融合蛋白)使用共通的物质,制作并使用两种以上的嵌合 RNA作为指导RNA-tracrRNA,所述嵌合RNA使是由与不同的靶核苷酸序列分别形成互补链的2种以上的指导RNA的每一种分别与tracrRNA形成的。另一方面,在使用锌指基序、TAL效应子等作为核酸序列识别模块的情况下,例如可以将与不同靶核苷酸特异性结合的各核酸序列识别模块,与核酸碱基转变酶进行融合。
[0145] 为了使本发明的核酸修饰酶复合体在宿主细胞内表达,如上所述将包含编码该核酸修饰酶复合体的DNA的表达载体、编码该核酸修饰酶复合体的 RNA导入宿主细胞,但为了有效地导入突变,优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发,确定在宿主细胞内导入能够自主复制的表达载体(质粒等),但由于该质粒等为外源DNA,因此,优选在顺利实现了导入突变后迅速地将其除去。因此,虽然根据宿主细胞的种类等不同而改变,但优选例如:从导入表达载体到经过6小时~2天后,使用在本技术领域周知的各种质粒除去法,从宿主细胞除去已导入的质粒。
[0146] 或者,只要可实现足以进行突变导入的核酸修饰酶复合体的表达,也优选使用在宿主细胞内不具有自主复制能力的表达载体(例如:缺乏在宿主细胞中发挥功能的复制起点及/或编码对复制必须的蛋白质的基因的载体等)、 RNA,通过一过性地的表达向关注的双链DNA导入突变。
[0147] 由于在使本发明的核酸修饰酶复合体在宿主细胞内进行表达,并进行核酸碱基转变反应的时期,靶基因的表达被抑制,因此,迄今为止难以将对宿主细胞的生存所必需的基因作为靶基因直接编辑(产生宿主的生长障碍、突变导入效率不稳定、对与靶标不同的部位的突变等副作用)。本发明通过在期望的时期发生核酸碱基转变反应,在使靶向位点的修饰稳定所需的时期,使本发明的核酸修饰酶复合体一过性地在宿主细胞内表达,从而成功有效地实现必需基因的直接编辑。需要发生核酸碱基转变反应、使靶向位点的修饰稳定的时期根据宿主细胞的种类、培养条件等不同,但认为通常需要2~20 代。例如,在宿主细胞为酵母、细菌(例如,大肠杆菌)的情况下,需要在5~10 代之间诱导核酸修饰酶复合体的表达。本领域技术人员可以基于使用的培养条件下的宿主细胞的倍增时间,适当确定适宜的表达诱导期。例如,将芽殖酵母在0.02%半乳糖诱导培养基中进行液体培养时,可举例为20~40小时的表达诱导期。就本发明的编码核酸修饰酶复合体的核酸的表达诱导期而言,也可以在对宿主细胞不产生副作用的范围内,超出上述“需要使靶向位点的修饰稳定的时期”并延长。
[0148] 作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法,可使用包括制作以能够控制表达期的形态,包含编码该核酸修饰酶复合体的核酸(在CRISPR-Cas系统中,为编码指导RNA-tracrRNA的DNA、和编码突变Cas及核酸碱基取代酶的DNA)的构建体(表达载体),并将构建体导入宿主细胞内的方法。“以能够控制表达期的形态”,具体而言,可列举将编码本发明的核酸修饰酶复合体的核酸,置于诱导性的调节区域的控制下的形态。对“诱导性的调节区域”没有特别限制,例如,在细菌(例如,大肠杆菌)、酵母等微生物细胞中,可列举温度敏感性(ts)突变阻遏物和控制其的操纵基因(operator)的控制子(operon)。作为ts突变阻遏物,可列举例如来自λ噬菌体的cI阻遏物的ts突变体,但不限于这些。在为λ噬菌体cI阻遏物 (ts)的情况下,在30℃以下(例如,28℃)与操纵基因连接而抑制下游的基因表达,但在37℃以上(例如,42℃)的高温从操纵基因解离,因此可诱导基因表达(图13及14)。因此,通过将已导入编码核酸修饰酶复合体的核酸的宿主细胞,通常在30℃以下培养,在适当的时期将温度升高至37℃以上并培养一定时期,使其进行核酸碱基转变反应,并在向靶基因导入突变后迅速降回30℃以下,从而可以使得抑制靶基因表达的时期最短,即使在对宿主细胞所必需的基因进行靶向的情况下,也可以压抑副作用并有效地进行编辑 (图15)。
[0149] 在利用温度敏感性突变的情况下,可以通过例如,将对载体的自主复制所必须的蛋白质的温度敏感性突变体,包括于包含编码本发明的核酸修饰酶复合体的DNA载体,使该核酸修饰酶复合体表达之后,该载体不能迅速地自主复制,并在细胞分裂期间自然脱落。作为这样的温度敏感性突变蛋白质,可列举pSC101ori的复制所必须的Rep101ori的温度敏感性突变体,但不限于这些。对Rep101ori(ts)而言,虽然在30℃以下(例如,28℃)能够作用于 pSC101ori并进行质粒的自主复制,但处于37℃以上(例如,42℃)时丧失功能,质粒不能自主复制。因此,通过与上述λ噬菌体的cI阻遏物(ts)组合使用,可以使本发明的核酸修饰酶复合体的一过性地表达和质粒除去同时进行。
[0150] 另一方面,将动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞的情况下,在诱导启动子(例如,金属硫蛋白启动子(利用重金属离子诱导)、热休克蛋白质启动子(利用热休克诱导)、Tet-ON/Tet-OFF类启动子(利用添加或除去四环素或其衍生物进行诱导)、类固醇响应启动子(利用类固醇激素或其衍生物进行诱导)等)的控制下,将编码本发明的核酸修饰酶复合体的DNA导入宿主细胞内,在适当的时期向培养基添加诱导物质(或从培养基除去)来诱导该核酸修饰酶复合体的表达,培养一定时期,进行核酸碱基转变反应,可以实现向靶基因导入突变后的核酸修饰酶复合体的一过性地表达。
[0151] 需要说明的是,在大肠杆菌等原核细胞中也可以利用诱导启动子。作为这样的诱导启动子,可列举例如:lac启动子(利用IPTG诱导)、cspA启动子  (利用冷休克诱导)、araBAD启动子(利用阿拉伯糖诱导)等,但不限于这些。
[0152] 或者,也可以将上述的诱导启动子用作在以动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞时的载体除去方法。即,通过使其搭载宿主细胞发挥功能的复制起点、和编码对其复制所必须的蛋白质的核酸(例如,如果为动物细胞,则为SV40ori和大T抗原、oriP和EBNA-1等),利用上述诱导启动子来控制编码该蛋白质的核酸的表达,虽然在诱导物质的存在下载体能够进行自主复制,但如果除去诱导物质则不能进行自主复制,在细胞分裂期间,载体将自然脱落(在Tet-OFF类载体中,相反地,通过添加四环素、多西环素导致不能进行自主复制)。
[0153] 以下,根据实施例对本发明进行说明。但是,本发明并不限于这些实施例。
[0154] 实施例
[0155] 在下文的实施例1~6中,如下所述地进行了实验。
[0156] <细胞株、培养、转化(transformation)、表达诱导>
[0157] 使用芽殖酵母Saccharomyces cerevisiae BY4741株(需要亮氨酸及尿嘧啶),利用标准的YPDA培养基或满足营养要求的撤出成分(Dropout)组成的 SD培养基进行培养。培养在从25℃到30℃之间,通过利用琼脂板的静置培养或利用液体培养基的振荡培养进行。对转化而言,使用乙酸锂法,利用符合适当的营养要求的SD培养基进行选择。对基于半乳糖的表达诱导而言,利用适当的SD培养基预培养一夜,然后接种于将碳源从2%葡萄糖代替为 
2%棉子糖的SR培养基继续培养一夜,进一步接种于将碳源代替为0.2~2%半乳糖的SGal培养基继续培养3小时到二夜左右,进行表达诱导。
[0158] 对于细胞存活数及Can1突变率的测定,将细胞悬浊液适当稀释并涂布于SD平板培养基及SD-Arg+60mg/l刀豆氨酸平板培养基或者SD+300mg/l 刀豆氨酸平板培养基上,将3天后出现的菌落数量作为细胞存活数进行计数。将SD平板中的生存菌落数作为总细胞数,将刀豆氨酸平板中的生存菌落数量作为抗性突变株数,计算并评价突变率。对突变导入部位而言,通过菌落PCR法扩增包含各株的靶标基因区域的DNA片段,然后进行DNA测序,以酵母基因组数据库(http://www.yeastgenome.org/)的序列为基础进行比对分析,并进行鉴定。
[0159] <核酸操作>
[0160] 对DNA而言,利用PCR法、限制酶处理、接合、Gibson Assembly法/ 人工化学合成中的任一种方法进行加工、构建。对质粒而言,作为酵母-大肠杆菌穿梭载体,使用亮氨酸选择用的pRS315、及尿嘧啶选择用的pRS426 作为主链。对质粒而言,利用大肠杆菌株XL-10gold或DH5α进行扩增,通过乙酸锂法导入酵母。
[0161] <构建体>
[0162] 对诱导表达而言,使用了为半乳糖诱导型且为双向启动子的芽殖酵母 pGal1/10(序列编号8)。将核定位信号(Nuclear localization signal)(ccc aag aag aag agg aag gtg;序列编号9(PKKKRV;编码序列编号10))添加至已最优化为真核表达用的密码子的来自化脓性链球菌(Streptococcus pyogenes)的Cas9 基因ORF(序列编号5),将添加而成的产物连至启动子下游,通过接头序列与脱氨酶基因(来自七腮鳗(Petromyzon marinus)的PmCDA1或来自人的 hAID)的ORF(序列编号1或3)相连,以融合蛋白的形式进行表达。作为接头序列,虽然选择、组合使用了GS接头(ggt gga gga ggt tct;序列编号11(编码GGGGS;序列编号12)的重复)、Flag标签(gac tat aag gac cacgac gga gac tac aag gat cat gat att gat tac aaa gac gat gac gat aag;序列编号13(编码 DYKDHDGDYKDHDIDYKDDDDK;序列编号14))、Strep-标签(tgg agc cac ccg cag ttc gaa aaa;序列编号15(编码WSHPQFEK;序列编号16))、其它结构域,但这里,特别使用了2xGS、SH3结构域(序列编号17及18)、Flag标签相连而成的。作为终止子,与来自芽殖酵母的ADH1终止子(序列编号19) 及Top2终止子(序列编号20)相连。另外,在结构域结合方式中,将Cas9基因ORF通过2xGS接头与SH3结构域相连并作为一个蛋白质,将SH3ligand 序列(序列编号21及22)添加至脱氨酶并作为另一蛋白质,使其连接至 Gal1/10启动子的两个方向。并且使它们同时表达。将它们装配至pRS315 质粒。
[0163] 为了除去各自单侧的DNA链的切割能力,向Cas9中导入了将第10位的天冬氨酸转变为丙氨酸的突变(D10A,对应DNA序列突变a29c)、及第840 位的组氨酸转变为丙氨酸的突变(H840A,对应DNA序列突变ca2518gc)。
[0164] 对gRNA而言,以与tracrRNA(来自Streptococcus pyogenes;序列编号 7)的嵌合结构的形式配置在SNR52启动子(序列编号23)和Sup4终止子(序列编号24)之间,装配至pRS426质粒。作为gRNA靶碱基序列,使用了CAN1  基因ORF的187-206(gatacgttctctatggagga;序列编号25)(target1)、786-805 (ttggagaaacccaggtgcct;序列编号26)(target3)、793-812(aacccaggtgcctggggtcc;序列编号27)(target4)、563-582(ttggccaagtcattcaattt;序列编号28)(target2) 及767-786的互补链序列(ataacggaatccaactgggc;序列编号29)(target5r)。在同时表达多个靶标的情况下,使用从启动子到终止子的序列作为1组,并将多个组装配至同一质粒。与Cas9-脱氨酶表达用质粒一起导入细胞,并使其在细胞内表达,形成gRNA-tracrRNA与Cas9-脱氨酶的复合体。
[0165] 实施例1利用将CRISPR-Cas的DNA序列识别能力与脱氨酶PmCDA1连接来修饰基因组序列
[0166] 为了试验利用了脱氨酶和CRISPR-Cas的核酸序列识别能力的本发明的基因组序列的修饰技术的效果,尝试了向编码刀豆氨酸转运蛋白的CAN1 基因导入突变,其基因缺陷产生刀豆氨酸抗性。使用与CAN1基因ORF的 187-206(target1)互补的序列作为gRNA,构建用该gRNA与来自Streptococcus pyogenes的tracrRNA连接而成的嵌合RNA的表达载体,构建表达向来自 Streptococcus pyogenes的Cas9(SpCas9)导入突变(D10A及H840A)从而丧失了核酸酶活性的dCas9,与作为脱氨酶的来自七腮鳗的PmCDA1进行融合而成的蛋白质的载体,并利用乙酸锂法导入芽殖酵母内,使它们共表达。结果示于图2。在含有刀豆氨酸的SD平板上培养,则仅导入并表达 gRNA-tracrRNA和dCas9-PmCDA1的细胞形成了菌落。选取抗性菌落并测序了CAN1基因区域的序列,结果确认在靶核苷酸序列(target1)内及其附近导入了突变。
[0167] 实施例2大幅减轻副作用、毒性
[0168] 在常规型的Cas9及其它人工核酸酶(ZFN、TALEN)中,如果以基因组内的序列为靶标,则产生认为由染色体的无规律切割引起的增殖障碍和细胞死亡。该影响在很多的微生物、原核生物中是特别致命的,阻碍了适用性。
[0169] 因此,为了验证本发明的基因组序列的修饰技术的安全性及对细胞的毒性,进行了常规型的CRISPR-Cas9的比较实验。通过以CAN1基因内序列 (target 3、4)作为gRNA靶标,从半乳糖表达诱导开始后立即到诱导后6小时的生存细胞在SD平板上的菌落形成能力进行了测定。结果示于图3。在常规型Cas9中,由于增殖受到阻碍而诱导细胞死亡,因此细胞存活数减少,与此相对,在本技术(nCas9D10A-PmCDA1)中,细胞可以持续增殖,细胞存活数大幅增加。
[0170] 实施例3不同连接类型的使用
[0171] 检查了如果Cas9和脱氨酶不是融合蛋白形式,而是通过结合结构域和其配体而形成核酸修饰酶复合体,是否也能进行向靶向基因的突变导入。使用了实施例1使用的dCas9作为Cas9,代替PmCDA1使用了人AID作为脱氨酶。将前者与SH3结构域、后者与其结合配体融合,制作成图4所示的各种构建体。另外,使用CAN1基因内序列(target 4、5r)作为gRNA靶标。将它们的构建体导入芽殖酵母。其结果,即使在通过结合结构域将dCas9与脱氨酶连接的情况下,也向CAN1基因的靶向位点有效地导入了突变(图4)。通过向dCas9导入多个结合结构域,突变导入效率显著提高。主要的突变导入部位为ORF的第782位(g782c)。
[0172] 实施例4由使用切口酶(Nickase)引起的高效化和突变模式的变化
[0173] 代替dCas9使用了仅切割与gRNA互补的链的D10A突变体 nCas9(D10A)、或仅切割与gRNA互补的链的相反链的H840A突变体 nCas9(H840A),除此以外,与实施例1同样地进行,向CAN1基因导入突变,检查含有刀豆氨酸的SD平板上产生的菌落的CAN1基因区域的序列,结果发现在前者(nCas9(D10A))中,效率比dCas9升高(图5),并且突变集中在靶标序列的中央(图6)。因此,根据该方法可以进行点性突变导入。另一方面,结果发现,在后者(nCas9(H840A))中,效率比dCas9升高(图5),并且在从靶向的核苷酸到达几百个碱基的区域导入了多个随机突变(图6)。
[0174] 即使改变靶核苷酸序列,也可以确认同样显著的突变导入,在使用 CRISPR-Cas9系统和胞苷脱氨酶的本基因组编辑体系中,确认到如表1所示,在存在于从靶核苷酸序列(20bp)的5’侧到2~5bp左右的范围内的胞嘧啶优先进行脱氨基化。因此,通过基于该规律性设定靶核苷酸序列,并进一步与 nCas9(D10A)组合,能够进行1个核苷酸单位的精密的基因组编辑。另一方面,如果使用nCas9(H840A),则可以在靶核苷酸序列的附近的几百个bp左右的范围同时插入多个突变。进一步,存在通过改变脱氨酶的连接类型,而进一步改变部位特异性的可能性。
[0175] 根据这些结果显示,可以根据目的不同,适当使用Cas9蛋白质的种类。
[0176] [表1]
[0177]
[0178] 实施例5通过将邻近的多个DNA序列作为靶标,效率协同性地升高
[0179] 与单独的靶标相比,通过同时使用邻近的多个靶标,效率大幅升高(图7)。事实上,10~20%的细胞具有刀豆氨酸抗性突变(target3、4)。图中的gRNA1 和gRNA2分别以target3和target4为靶。使用PmCDA1作为脱氨酶。确认了不仅在序列的一部分重复的情况下(target3、4)产生该效果,在分离600bp 的情况下(target1、3)也产生该效果。另外,在DNA序列为相同方向(target3、 4),和对向(target4、5)(图4)的两种情况下均产生该效果。
[0180] 实施例6不需要选择标识的基因修饰
[0181] 对于实施例5中以target3和target4为靶的细胞(Target3、4),从非选择性(不含刀豆氨酸)的平板(不含有Leu及Ura的SD平板)上长出的菌落中,随机选出10个测序了CAN1基因区域的序列。结果,检查的全部菌落均在 CAN1基因的靶向位点导入了突变(图8)。即,根据本发明,如果选择适当的靶向序列,可以期待在表达的细胞的基本全部中发生编辑。因此,不需要常规基因操作中必需的标识基因的插入和选择。其在使基因操作显著地变得简便的同时,由于不是外来DNA重组生物,因此对作物育种等的适用性大幅变宽。
[0182] 在以下的实施例中,对与实施例1~6共同的实验技术,与上述同样地进行。
[0183] 实施例7多个部位(不同基因)的同时编辑
[0184] 在通常的基因操作方法中,由于有各种限制,因此通常在一次操作中只能进行一个部位的突变。因此,试验了使用本发明的方法是否能能够同时进行多个部位的突变操作。
[0185] 将芽殖酵母株BY4741株的Ade1基因ORF的3-22位作为第1靶核苷酸序列(Ade1target5:GTCAATTACGAAGACTGAAC;序列编号30),将Can1 基因ORF的767-786位(互补链)作为第2靶核苷酸序列(Can1 target8(786-767;ATAACGGAATCCAACTGGGC;序列编号29),使分别包含编码与它们互补的核苷酸序列的两种gRNA与tracrRNA(序列编号7)的嵌合 RNA的DNA两者,搭载于同一质粒(pRS426),并与包含编码突变Cas9与 PmCDA1的融合蛋白的核酸的质粒nCas9D10A-PmCDA1一起,导入 BY4741株并使其表达,验证对两个基因的突变导入。以保持质粒的SD撤除成分培养基(Dropout,尿嘧啶及亮氨酸缺陷;SD-UL)为基础,培养细胞。适当稀释细胞,涂布至SD-UL及添加刀豆氨酸的培养基,形成菌落。于28℃培养2天后,观察菌落,分别计数由ade1突变引起的红色菌落的发生率,和在刀豆氨酸培养基中的存活率。将结果示于表2中。
[0186] [表2]
[0187]
[0188] 作为表型,向Ade1基因及Can1基因的两者均导入了突变的比例高,为约31%。
[0189] 下面,利用PCR对SD-UL培养基上的菌落进行扩增并测序分析。对包含Ade1和Can1各自的ORF区域进行拓宽,获得靶标序列周边500b左右的序列的测序信息。具体而言,分析了红菌落5个和白菌落5个,结果全部红菌落的Ade1基因ORF的第5位的C转变为G,全部白菌落的第5位的C 转变为T(图9)。虽然靶标的突变率为100%,但由于作为目的在于基因破坏的突变率,需要使第5位的C变为G而成为终止密码子,因此,认为期望的突变率为50%。相同地,对于Can1基因,虽然确认在全部克隆中,发生了ORF的第782位的G的突变(图9),但由于仅变为C的突变能提供刀豆氨酸抗性,因此,作为期望的突变率为70%。在检查的范围内,对于两种基因同时得到期望的突变的比例为40%克隆(10个克隆中占4个克隆),事实上得到了较高的效率。
[0190] 实施例8多倍体基因组的编辑
[0191] 虽然很多生物具有二倍体或多倍体的基因组,但在常规的突变导入方法中,作为原则仅向同源染色体的一条中导入突变而形成异源基因型,因此,如果不是显性突变,就得不到需要的特征,而使其同源则耗时耗力。因此,试验了根据本发明的技术,是否能够向基因组内的同源染色体上的全部靶等位基因内导入突变。
[0192] 即,在二倍体株的芽殖酵母YPH501株中,进行Ade1及Can1基因的同时编辑。由于这些基因突变的表型(红色菌落及刀豆氨酸抗性)是劣势表型,因此,如果不是导入了基因的两方的突变(同源突变),则这些表型不会表现。
[0193] 将Ade1基因ORF的1173-1154位(互补链)(Ade1target1: GTCAATAGGATCCCCTTTT;序列编号31)或者3-22位(Ade1target5: GTCAATTACGAAGACTGAAC;序列编号30)作为第1靶核苷酸序列,将 Can1基因ORF的767-786位(互补链)作为第2靶核苷酸序列(Can1target8:
ATAACGGAATCCAACTGGGC;序列编号29),使分别包含编码与它们互补的核苷酸序列的两种gRNA与tracrRNA(序列编号7)的嵌合RNA的DNA 两者,搭载于同一质粒(pRS426),并与包含编码突变Cas9与PmCDA1的融合蛋白的核酸的质粒nCas9D10A-PmCDA1一起,导入BY4741株并使其表达,验证了向各基因的突变导入。
[0194] 菌落计数的结果可知,可以以高概率(40%~70%)获得每个表型的特征(图 10A)。
[0195] 进一步,为了确认突变,进行了白菌落和红菌落各自的Ade1靶区域的测序,结果在白菌落中靶向部位确认到显示异源突变的测序信号的重叠(图 10B的上图,↓处G和T的信号发生重叠)。确认在异源突变的菌落中没有出现表型。另一方面,在红菌落中,确认了没有重叠的信号,为同源突变(图 10B下图,↓处为T的信号)。
[0196] 实施例9大肠杆菌中的基因组编辑
[0197] 在本实施例中,验证在作为细菌的代表性模型生物的大肠杆菌中,本技术有效地发挥功能。特别是,由于在细菌中,常规的核酸酶型的基因组编辑技术是致死的而难以适用,因此强调本技术的优越性。另外,与作为真核生物的模型细胞的酵母一起,显示无论在原核还是真核生物种类中均可广泛适用。
[0198] 向包含双向启动子区域的Streptococcus pyogenes Cas9基因导入D10A 及H840A的氨基酸突变(dCas9),构建通过接头序列以与PmCDA1的融合蛋白的形式表达的构建体,进一步制作了同时包括编码与各靶核苷酸序列互补的序列的嵌合gRNA的质粒(全长核苷酸序列示于序列编号32。向该序列中 n20的部分导入与各靶标序列互补的序列)(图11A)。
[0199] 首先,将以大肠杆菌galK基因ORF的426-445位(T CAA TGG GCT AAC TAC GTT C;序列编号33)为靶核苷酸序列导入的质粒,利用钙法或电穿孔法转化至各种大肠杆菌株(XL10-gold、DH5a、MG1655、BW25113),添加 SOC培养基恢复培养一夜,然后通过含有氨苄青霉素LB培养基选择负载质粒的细胞,使其形成菌落。通过由菌落PCR直接测序,验证了突变导入。结果示于图11B。
[0200] 随机选出独立的菌落(1~3),进行测序分析,结果确认了有60%以上的概率将ORF的427位的C转变为T(克隆2、3),从而产生终止密码子(TAA) 的基因发生破坏。
[0201] 下面,以作为必需基因的rpoB基因ORF的1530-1549碱基区域的互补序列(5’-GGTCCATAAACTGAGACAGC-3’;序列编号34)作为靶标,通过与上述同样的方法导入特定的点突变,尝试了对大肠杆菌赋予利福平抗性功能。对利用含有非选择性培养基(none)、25μg/ml利福平(Rif25)及50μg/ml 利福平(Rif50)的培养基中选择的菌落进行测序分析,结果确认,通过将ORF 的1546位的G转变为A,导入了将Asp(GAC)变为Asn(AAC)的氨基酸突变,赋予了利福平抗性(图11C,上图)。将经转化处理后的细胞悬浊液的10倍稀释系列,分别点在含有非选择性培养基(none)、25μg/ml利福平(Rif25)及 50μg/ml利福平(Rif50)培养基上并培养,结果可见以约10%的频率得到了利福平抗性株(图11C,下图)。
[0202] 像这样,根据本技术,不仅可以破坏基因,还可以通过特定的点突变来添加新的功能。另外,在直接编辑必需基因的方面,也显示了本技术的优越性。
[0203] 实施例10利用gRNA长度来调节编辑碱基部位
[0204] 以往,针对靶核苷酸序列的gRNA长度以20b为基础,并以存在于从其 5’末端到2~5b(PAM序列的上游15~19b)的部位的胞嘧啶(或相反链的鸟嘌呤) 作为突变靶标。检查了如果表达使该gRNA长度改变的核酸,与其对应的作为靶标的碱基的部位是否移动(图12A)。
[0205] 将利用大肠杆菌进行的实验例示于图12B。检索在大肠杆菌基因组上的胞嘧啶多个排列的部位,使用作为putative ABC-转运蛋白的gsiA基因进行实验。检查了将靶的长度变为24bp、22bp、20bp、18bp时的取代的胞嘧啶,结果在20bp(标准长度)的情况下,第898、899位的胞嘧啶被取代为胸腺嘧啶。可知,在靶向部位长于20bp的情况下,第896和897位的胞嘧啶也被取代,在靶向部位较短的情况下,第900和901位的胞嘧啶也可被取代,实际上可以通过改变gRNA的长度使靶向部位移动。
[0206] 实施例11温度依赖性基因组编辑质粒的开发
[0207] 将本发明的核酸修饰酶复合体设计为利用高温条件进行表达诱导的方式的质粒。目的在于通过限定表达状态进行控制而将效率最优化,并且减轻副作用(产生宿主的生长障碍、突变导入效率不稳定、对与靶标不同的部位的突变)。同时,通过组合利用高温停止质粒的复制的机制,意图在编辑后同时且容易地进行质粒的除去。以下示出实验的细节。
[0208] 将温度敏感性质粒pSC101-Rep101系(pSC101ori的序列示于序列编号 35,温度敏感性Rep101的序列示于序列编号36)作为主链(backbone),使用温度敏感性的λ阻遏物(cI857)系统表达诱导。向基因组编辑用的λ阻遏物导入RecA抗性的G113E突变,使得在SOS应答下也正常发挥功能(序列编号 37)。将dCas9-PmCDA1(序列编号38)连接至Right Operator(序列编号39)、 gRNA(序列编号40)连接至Left Operator(序列编号41)的下游,使得控制表达 (构建成的表达载体的所有核苷酸序列示于序列编号42)。在30℃以下培养时期,由于分别抑制了gRNA的转录和dCas9-PmCDA1的表达,因此细胞可以正常增殖。当在37℃以上培养时,诱导gRNA的转录和dCas9-PmCDA1 的表达,而与此同时抑制质粒的复制,因此,一过性地地供给对基因组编辑所必须的核酸修饰酶复合体,可以在编辑之后容易地除去质粒(图13)。
[0209] 碱基取代的具体的方案示于图14。
[0210] 进行质粒构建时的培养温度设为28℃左右,首先建立保持所需质粒的大肠杆菌菌落。下面,直接使用菌落,或当菌株改变的情况下提取质粒,再次进行向靶菌株的转化,使用得到的菌落。在28℃进行液体培养一夜。随后,利用培养基稀释,在42℃进行从1小时到一夜左右的诱导培养,适当稀释细胞悬浊液并铺展或点在板上,得到单个菌落。
[0211] 作为验证实验,进行了向作为必需基因的rpoB的点突变导入。作为RNA 聚合酶的构成因素之一的rpoB如果缺失或失能,则大肠杆菌将不能存活。一方面,已知通过向特定的部位引入点突变,获得相对于作为抗生素的利福平(Rif)的抗性。因此,为了导入这样的点突变而选定靶向部位,并进行测定。
[0212] 结果示于图15。左上图的左为LB(添加氯霉素)平板,右为添加了利福平的LB(添加氯霉素)平板,利用这些平板准备了在28℃*42℃培养时有或无氯霉素的样品。虽然在28℃培养的情况下,Rif抗性的比例较低,但在42℃培养的情况下,以极高的效率得到了利福平抗性。对实际LB上得到的菌落 (非选择)的8个菌落测序,结果可知,在42℃培养的菌株有60%以上的比例的第1546位的鸟嘌呤(g)被取代为腺嘌呤(A)(左下及右上图)。可知在实际的测序谱(右下图)中,碱基也被完全取代了。
[0213] 类似地,进行对参与半乳糖代谢的因素之一的galK的碱基取代。由于对大肠杆菌而言,galK通过代谢作为半乳糖的类似物的2-脱氧半乳糖(2DOG) 而致死,因此,将其用作选择方法。分别设定了靶向位点,使得对target 8 引起错义突变,target 12成为终止密码子(图16右下)。
[0214] 结果示于图16。在左上和左下图中,左侧为LB(添加氯霉素)平板,右侧为添加了2-DOG的LB(添加氯霉素)平板,利用这些平板准备了在28℃、 42℃培养时有或无氯霉素的样品。在target 8中,在添加2-DOG的平板中仅轻微产生菌落(左上图),但对LB上的菌落(红框)3个菌落测序,确定全部菌落中的第61位胞嘧啶(C)被取代为胸腺嘧啶(T)(右上)。推测该突变不足以造成galK的失能。另一方面,在target 12中,在28℃、42℃培养的任一情况下,在2-DOG添加板中均得到菌落(左下图)。对LB上的3个菌落进行测序,确定全部菌落中的第271位胞嘧啶被胸腺嘧啶取代(右下)。显示即使在这样的不同的靶中,也可以更稳定且高效地导入突变。
[0215] 包含在此提到的专利及专利申请说明书的全部出版物中记载的内容,通过在此引用,将其整体与已写明的程度相同地并入本说明书。
[0216] 本申请分别基于2014年3月5日及同年9月30日在日本提交的日本特愿2014-43348及日本特愿2014-201859,通过引用将其内容全部并入本说明书。
[0217] 工业实用性
[0218] 根据本发明,可以没有外源DNA的插入也没有DNA双链的切割,安全地向任意生物种类导入部位特异性的突变。另外,能够将突变导入的范围在从一个碱基的针点(pin point)至几百个碱基的范围进行广泛设定,也可以应用于利用向迄今为止几乎不可能进行的特定的限定区域随机导入突变的局部进化诱导,极其有用。