一种基因定点敲入载体构建方法、系统及平台转让专利

申请号 : CN202011537705.9

文献号 : CN112582024B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 高翠白颖

申请人 : 广州赛业百沐生物科技有限公司

摘要 :

本发明属于生物信息领域,具体涉及一种基因定点敲入载体构建方法、系统及平台。本发明通过获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架,构建载体敲入模型;实时获取待插入序列数据,定点将待敲入基因同源臂序列、外源基因和一些功能元件按设计规则有序敲入载体,以及与方法相对应的系统及平台,可以实现外源基因的定点敲入,使遗传背景更为简单,实验操作更加精准、高效,而且比传统操作更简单,设计上更灵活,成本更低,周期也更短。并且通过基因的定点敲入为未来靶向基因治疗提供了可能,将功能缺失的DNA片段修复为有功能的DNA片段,即可实现基因治疗的目的,同时可以大大提高产出,解放人力,提高工作效率。

权利要求 :

1.一种基因定点敲入载体构建方法,其特征在于,所述方法具体包括:获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;

根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;

实时获取待敲入序列数据,结合所述载体敲入模型,定点将待敲入基因同源臂和功能元件敲入载体;

所述根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型之中,还包括:构建基因序列元件敲入质粒载体模型;根据敲入序列的长度和元件的序列来源,构建连转引物模型;构建菌检引物模型和酶切鉴定模型;构建测序引物模型,用于对载体进行测序;

所述实时获取待敲入序列数据,结合所述载体敲入模型,定点将待敲入基因同源臂序列、外源基因和调控元件序列敲入载体之后,还包括:可视化展示敲入各元件序列后的载体。

2.根据权利要求1所述的一种基因定点敲入载体构建方法,其特征在于,所述获取待敲入基因原始数据信息之中,还包括:标注与所述待敲入基因相对应的同源臂和敲入元件序列信息;

实时筛选与所述待敲入基因模型相对应的骨架。

3.根据权利要求2所述的一种基因定点敲入载体构建方法,其特征在于,所述标注与所述待敲入基因相对应的同源臂和敲入元件序列信息之中,还包括:创建同源臂区域,并对敲入元件序列进行溯源;

实时处理同源臂和基因序列上的突变。

4.根据权利要求1所述的一种基因定点敲入载体构建方法,其特征在于,所述构建基因序列元件敲入质粒载体模型之中,还包括:根据所述敲入序列的长度,实时创建元件敲入方案;

通过所述敲入方案,实时选定第一步之后的每一步敲入操作切割骨架时所需内切酶,并将所选内切酶加入所述方案相应步骤待敲入元件的序列中,首次敲入的序列已有骨架切割位点方案。

5.根据权利要求1所述的一种基因定点敲入载体构建方法,其特征在于,所述根据敲入序列的长度和元件的序列来源,构建连转引物模型之中,还包括:根据序列片段长度和元件来源对序列进行分组,极短序列通过引物连入,有模板的序列通过引物进行PCR扩增获取,除上述以外的序列则通过基因序列合成获得,相邻合成片段可合在一起通过序列合成一个片段获得;

根据序列片段类型构建连转引物模型。

6.根据权利要求4所述的一种基因定点敲入载体构建方法,其特征在于,所述根据所述敲入序列的长度,实时创建元件敲入方案之中,还包括:创建元件分步敲入顺序模型;并判定质粒载体骨架切割处理酶切数据。

7.一种基因定点敲入载体构建系统,其特征在于,所述系统具体包括:获取单元,用于获取待敲入基因原始数据信息,并创建与所述待敲入基因模型相对应的骨架;

模型构建单元,用于根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;

定点敲入单元,用于实时获取待敲入序列数据,结合所述载体敲入模型,定点将各序列元件敲入载体;

所述系统中,还包括用于可视化展示敲入各元件序列后的载体的展示模块;

所述模型构建单元中,还包括用于构建基因序列元件敲入质粒载体模型的第一构建模块,同时包含内切酶切割骨架方案模型;用于根据敲入序列的长度和元件的序列来源,构建连转引物模型的第二构建模块;用于构建菌检引物模型和酶切鉴定模型的第三构建模块;

用于构建测序引物模型,用于对所述载体进行测序的第四构建模块。

8.根据权利要求7所述的一种基因定点敲入载体构建系统,其特征在于,所述获取单元中,还包括:

标注模块,用于标注与所述待敲入基因相对应的同源臂和基因序列信息、突变信息、调控元件信息;

筛选模块,用于实时筛选与所述待敲入基因相对应的骨架;

第一创建模块,用于创建同源臂区域,并对敲入元件序列进行溯源;

处理模块,用于实时处理同源臂和基因序列上的突变;

所述模型构建单元中,还包括:

第三创建模块,用于根据所述元件序列的长度,实时创建元件敲入方案;

第一选定模块,用于通过所述敲入方案,实时选定第一步之后的每一步操作敲入切割骨架时所需内切酶,并将所选内切酶加入所述方案相应步骤待敲入元件的序列中;

分组模块,用于根据序列片段长度和元件来源对序列进行分组;

第五构建模块,用于根据序列片段类型构建连转引物模型;

第二创建模块,用于创建元件敲入顺序模型;并判定处理酶切数据。

9.一种基因定点敲入载体构建平台,其特征在于,包括:处理器、存储器以及基因定点敲入载体构建平台控制程序;

其中在所述的处理器执行所述的基因定点敲入载体构建平台控制程序,所述的基因定点敲入载体构建平台控制程序被存储在所述存储器中,所述的基因定点敲入载体构建平台控制程序,实现如权利要求1至6中任一项所述的基因定点敲入载体构建方法步骤。

说明书 :

一种基因定点敲入载体构建方法、系统及平台

技术领域

[0001] 本发明属于生物信息领域,具体涉及一种基因定点敲入载体构建方法、系统及平台。

背景技术

[0002] 当前,研究基因功能的手段主要有两种:一种是基因功能缺失;另一种是实现基因的过表达。基因敲入是实现基因稳定过表达的一种有效技术。基因敲入(Gene knock‑in)是
指利用随机整合、转座子系统、同源重组等方式将外源功能基因插入到基因组中,使其在细
胞内进行表达的基因编辑技术。
[0003] 然而,目前的基因敲入模型包含:常规基因敲入、点突变、条件性点突变和人源化,较早的基因敲入方式主要是通过随机整合或转座子系统整合到宿主基因组中,这种敲入方
式随机性较强,很容易引起其它基因功能的丧失,同时插入的拷贝数和位置不固定,因此同
一来源的细胞系中不同的细胞间表达差异比较明显,不利于控制基因的表达水平。
[0004] 此外,当前市面上仅存在多款辅助人工设计的质粒载体设计系统,并没有一款既包含质粒载体设计又包含生产各环节流程自动设计方法。而且传统操作,由于人工设计载
体方案用时很长,需要投入很多人力以及大量时间,于此同时实验设计方案各项技术点需
要经验丰富的实验人员进行设计,最后还达不到获得目的基因敲入方案载体构建的设计需
求。
[0005] 因此,针对以上传统实验操作无法实现外源基因的定点敲入,并且操作复杂繁琐、效率低下、耗时费力的缺陷技术问题,有必要提出一种基因定点敲入载体构建方法、系统及
平台。

发明内容

[0006] 针对以上目前操作传统实验操作无法实现外源基因的定点敲入,并且操作复杂繁琐、效率低下、耗时费力的技术问题及缺陷。本发明提供一种基因定点敲入载体构建方法、
系统及平台,也就是说:
[0007] 本发明的第一目的在于:提供一种基因定点敲入载体构建方法;
[0008] 本发明的第二目的在于:提供一种基因定点敲入载体构建系统;
[0009] 本发明的第三目的在于:提供一种基因定点敲入载体构建平台;
[0010] 本发明的第一目的是这样实现的:所述方法具体包括:
[0011] 获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;
[0012] 根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0013] 实时获取待插入序列数据,结合所述载体敲入模型,定点将待敲入基因同源臂和功能调控元件敲入载体。
[0014] 进一步地,所述获取待敲入基因原始数据信息之中,还包括:
[0015] 标注与所述待敲入基因相对应的同源臂和敲入元件序列信息;
[0016] 实时筛选与所述待敲入基因模型相对应的骨架。
[0017] 进一步地,所述标注与所述待敲入基因相对应的同源臂和敲入元件序列信息之中,还包括:
[0018] 创建同源臂区域,并对敲入元件序列进行溯源;
[0019] 实时处理同源臂和基因序列上的突变。
[0020] 进一步地,所述根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型之中,还包括:
[0021] 构建基因序列元件敲入质粒载体模型;
[0022] 根据插入序列的长度和元件的序列来源,构建连转引物模型;
[0023] 构建菌检引物模型和酶切鉴定模型;
[0024] 构建测序引物模型,用于对载体进行测序;
[0025] 所述实时获取待插入序列数据,结合所述载体敲入模型,定点将待敲入基因同源臂序列、外源基因和调控元件序列载体之后,还包括:
[0026] 可视化展示敲入各元件序列后的载体。
[0027] 进一步地,所述构建基因序列元件敲入质粒载体模型之中,还包括:
[0028] 根据所述敲入序列的长度,实时创建元件敲入方案;
[0029] 通过所述敲入方案,实时选定第一步之后的每一步敲入操作切割骨架时所需内切酶,并将所选内切酶加入所述方案相应步骤待敲入元件的序列中,首次敲入的序列已有骨
架切割位点方案。
[0030] 进一步地,所述根据敲入序列的长度和元件的序列来源,构建连转引物模型之中,还包括:
[0031] 根据序列片段长度和元件来源对序列进行分组,极短序列通过引物连入,有模板的序列通过引物进行PCR扩增获取,除上述以外的序列则通过基因序列合成获得,相邻合成
片段可合在一起通过序列合成一个片段获得;
[0032] 根据序列片段类型构建连转引物模型。
[0033] 进一步地,所述根据所述敲入序列的长度,实时创建元件敲入方案之中,还包括:
[0034] 创建元件分步敲入顺序模型;并判定质粒载体骨架切割处理酶切数据。
[0035] 本发明的第二目的是这样实现的:所述系统具体包括:
[0036] 获取单元,用于获取待敲入基因原始数据信息,并创建与所述待敲入基因模型相对应的骨架;
[0037] 模型构建单元,用于根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0038] 定点敲入单元,用于实时获取待敲入序列数据,结合所述载体敲入模型,定点将各序列元件敲入载体。
[0039] 进一步地,所述系统中,还包括:
[0040] 展示模块,用于可视化展示敲入各元件序列后的载体;
[0041] 所述获取单元中,还包括:
[0042] 标注模块,用于标注与所述待敲入基因相对应的同源臂和基因序列信息、突变信息、调控元件信息;
[0043] 筛选模块,用于实时筛选与所述待敲入基因相对应的骨架;
[0044] 第一创建模块,用于创建同源臂区域,并对敲入元件序列进行溯源;
[0045] 处理模块,用于实时处理同源臂和基因序列上的突变;
[0046] 所述模型构建单元中,还包括:
[0047] 第一构建模块,用于构建基因序列元件敲入质粒载体模型,同时包含内切酶切割骨架方案模型;
[0048] 第二构建模块,用于根据敲入序列的长度和元件的序列来源,构建连转引物模型;
[0049] 第三构建模块,用于构建菌检引物模型和酶切鉴定模型;
[0050] 第四构建模块,用于构建测序引物模型,用于对所述载体进行测序;
[0051] 第三创建模块,用于根据所述元件序列的长度,实时创建元件敲入方案;
[0052] 第一选定模块,用于通过所述敲入方案,实时选定第一步之后的每一步操作敲入切割骨架时所需内切酶,并将所选内切酶加入所述方案相应步骤待敲入元件的序列中;
[0053] 分组模块,用于根据序列片段长度和元件来源对序列进行分组;
[0054] 第五构建模块,用于根据序列片段类型构建连转引物模型;
[0055] 第二创建模块,用于创建元件敲入顺序模型;并判定处理酶切数据。
[0056] 本发明的第三目的是这样实现的:包括:
[0057] 处理器、存储器以及基因定点敲入载体构建平台控制程序;
[0058] 其中在所述的处理器执行所述的基因定点敲入载体构建平台控制程序,所述的基因定点敲入载体构建平台控制程序被存储在所述存储器中,所述的基因定点敲入载体构建
平台控制程序,实现所述的基因定点敲入载体构建方法步骤。
[0059] 与现有技术相比,本发明具有以下有益效果:
[0060] 本发明通过一种基因定点敲入载体构建方法:获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;根据待敲入基因原始数据信息及骨架和敲入元件,
构建载体敲入模型;实时获取待插入序列数据,结合所述载体敲入模型,定点将外源基因敲
入载体;以及与方法相对应的系统及平台,可以实现外源基因的定点敲入,使遗传背景更为
简单,实验操作更加精准、高效。而且比传统操作更简单,设计上更灵活,成本更低,周期也
更短。并且通过基因的定点敲入为未来靶向基因治疗提供了可能,将功能缺失的DNA片段修
复为有功能的DNA片段,即可实现基因治疗的目的。
[0061] 也就是说,通过本发明方案,可以大大提高产出,解放人力,提高工作效率,和精准率原本繁琐复杂的设计过程,现在变得更加简单快捷;而且打破知识背景壁垒,没有丰富实
验经验的研究者,也可以获得基因敲入质粒载体设计的各个环节的详细步骤方案。

附图说明

[0062] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于
本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他
的附图。
[0063] 图1为本发明一种基因定点敲入载体构建方法流程架构示意图;
[0064] 图2为本发明一种基因定点敲入载体构建方法之基于cas9技术/ES细胞基因打靶技术质粒载体构建方法流程架构示意图;
[0065] 图3为本发明一种基因定点敲入载体构建方法之载体构建总流程架构示意图;
[0066] 图4为本发明一种基因定点敲入载体构建方法之插入分组设计流程架构示意图;
[0067] 图5为本发明一种基因定点敲入载体构建方法之测序引物设计流程架构示意图;
[0068] 图6为本发明一种基因定点敲入载体构建方法之序列插入酶切方案流程架构示意图;
[0069] 图7为本发明一种基因定点敲入载体构建方法之连转引物设计流程架构示意图;
[0070] 图8为本发明一种基因定点敲入载体构建方法之菌检引物设计流程架构示意图;
[0071] 图9为本发明一种基因定点敲入载体构建方法之可视化流程架构示意图;
[0072] 图10为本发明一种基因定点敲入载体构建系统架构示意图;
[0073] 图11为本发明一种基因定点敲入载体构建平台架构示意图;
[0074] 图12为本发明一种实施例中计算机可读取存储介质架构示意图;
[0075] 本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0076] 为便于更好的理解本发明的目的、技术方案和优点更加清楚,下面结合附图和具体的实施方式对本发明作进一步说明,本领域技术人员可由本说明书所揭示的内容轻易地
了解本发明的其它优点与功效。
[0077] 本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
[0078] 需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、
运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
[0079] 另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技
术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特
征。其次,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能
够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的
结合不存在,也不在本发明要求的保护范围之内。
[0080] 优选地,本发明一种基因定点敲入载体构建方法应用在一个或者多个终端或者服务器中。所述终端是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处
理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific 
Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数
字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
[0081] 所述终端可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可以与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
[0082] 本发明为实现一种基因定点敲入载体构建方法、系统、平台及存储介质。
[0083] 如图1所示,是本发明实施例提供的基因定点敲入载体构建方法的流程图。
[0084] 在本实施例中,所述基因定点敲入载体构建方法,可以应用于具备显示功能的终端或者固定终端中,所述终端并不限定于个人电脑、智能手机、平板电脑、安装有摄像头的
台式机或一体机等。
[0085] 所述基因定点敲入载体构建方法也可以应用于由终端和通过网络与所述终端进行连接的服务器所构成的硬件环境中。网络包括但不限于:广域网、城域网或局域网。本发
明实施例的基因定点敲入载体构建方法可以由服务器来执行,也可以由终端来执行,还可
以是由服务器和终端共同执行。
[0086] 例如,对于需要进行基因定点敲入载体构建终端,可以直接在终端上集成本发明的方法所提供的基因定点敲入载体构建功能,或者安装用于实现本发明的方法的客户端。
再如,本发明所提供的方法还可以软件开发工具包(Software Development Kit,SDK)的形
式运行在服务器等设备上,以SDK的形式提供基因定点敲入载体构建功能的接口,终端或其
他设备通过所提供的接口即可实现基因定点敲入载体构建功能。
[0087] 以下结合附图对本发明作进一步阐述。
[0088] 如图1所示,本发明提供了一种基因定点敲入载体构建方法,所述的方法具体包括如下步骤:
[0089] S1、获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;
[0090] S2、根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0091] S3、实时获取待插入序列数据,结合所述载体敲入模型,定点将待敲入基因同源臂和功能调控元件敲入载体。
[0092] 也就是说,如图2所示,本发明方案通过获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;并且根据待敲入基因原始数据信息及骨架和敲入元件,构
建载体敲入模型;实时获取待插入序列数据,结合所述载体敲入模型,定点将外源基因和调
控元件敲入载体。操作者只需要简单的参数选择和序列粘贴复杂甚至可以进行点突变的设
定,一分钟内即可得到一份包含详细的载体构建流程。
[0093] 所述获取待敲入基因原始数据信息之中,还包括:
[0094] S11、标注与所述待敲入基因相对应的同源臂和敲入元件序列信息;
[0095] S12、实时筛选与所述待敲入基因模型相对应的骨架。
[0096] 具体地,对于骨架选择,如图3所示,根据用户填写的技术类型和插入的元件序列系统自动挑选合适的质粒骨架进行载体设计。影响骨架选择的参数包含:
[0097] 1)技术类型:ES细胞打靶技术或者CRISPR/Cas9技术;
[0098] 2)启动子Promoter;
[0099] 3)LSL模块:重组酶识别序列元件+表达终止元件组件+重组酶酶识别序列元件;
[0100] 4)polyA;
[0101] 较佳地,确定需要插入的序列元件和需要切割的骨架元件,即定点敲入需要通过比较用户选择设计的Promoter、LSL组件和polyA与骨架的对应元件计算出需要替换以及插
入的元件确定骨架的内切酶方案。原位敲入需要区分ES和Cas9两种技术路线从而采取不同
的质粒载体设计方案。
[0102] 所述标注与所述待敲入基因相对应的同源臂和基因序列信息之中,还包括:
[0103] S111、创建同源臂区域,并对插入元件序列进行溯源;
[0104] S112、实时处理同源臂和基因序列上的突变。
[0105] 也就是说,在本发明实施例对基因信息获取过程中,还包括:数据分析使用Ensembl的基因数据信息,通过目标转录本的编号用于获取对应信息,具体地有:
[0106] a.基因基本信息:基因名称、长度、所属染色体、外显子区域、蛋白编码区域、NCBI库基因和Ensembl库基因的对应关系等基本用于方案展示的信息;
[0107] b.用于数据分析的数据:基因的目标转录本信息、编码蛋白信息、基因序列信息包含基因上下游15kb序列;
[0108] c.定义同源臂:根据定义的信息标注载体设计所需要的两端同源arm臂以及其它涉及到的基因序列信息。
[0109] 较佳地,在创建插入序列模型搜索中,如图4所示,对于插入序列的来源分析,主要存在以下情况:
[0110] a.基因组数据:直接设计引物PCR扩增获取;
[0111] b.固有元件:常用元件直接PCR扩增获取,其中包含常用复杂序列元件,有序列源不通过模板PCR得到,但会影响到后续载体构建的流程和方案的具体实施;
[0112] c.载体模板库:序列比对分析得到PCR扩增模板来源;
[0113] d.基因组orf序列:专门的销售网站进行搜索和序列比对,可用就直接下单购买;
[0114] e.无模板:通过基因片段合成序列。
[0115] 所述根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型之中,还包括:
[0116] 对于实时处理同源臂和基因序列上的突变,即通过判断每组酶切数据能否保留,引入的酶切位点需全部抹掉;若骨架上固有的酶切识别序列在两端与骨架接壤的序列插入
时做出判断,若后续片段插入不再重复使用此酶可补回整个序列,否则需要在构建载体时
通过引物删除对应的酶切识别序列。
[0117] S21、构建基因序列元件敲入质粒载体模型;
[0118] S22、根据插入序列的长度和元件的序列来源,构建连转引物模型;
[0119] S23、构建菌检引物模型和酶切鉴定模型;
[0120] S24、构建测序引物模型,用于对载体进行测序;
[0121] 在本发明方案中,对于测序引物设计,如图5所示,测序区域包含骨架上复杂的元件(比如3*SV40 polyA),每个同源序列插入片段的边界一定区域和包含的exon区域,以及
插入的其它元件的全部序列。分三个内容设计测序引物:
[0122] a.骨架固定测序引物,判断引物是否可以有效测序区间是否;
[0123] b.引物对排序:优选引物产物长度靠近600bp, 内切酶方案切割长度差大于100bp。
[0124] 所述构建基因序列元件敲入质粒载体模型之中,还包括:
[0125] S211、根据所述敲入序列的长度,实时创建元件敲入方案;
[0126] S212、通过所述敲入方案,实时选定第一步之后的每一步敲入操作切割骨架时所需内切酶,并将所选内切酶加入所述方案相应步骤待敲入元件的序列中,首次敲入的序列
已有骨架切割位点方案。
[0127] 也就是说,对元件插入质粒载体方案进行设计,即模型创建,由于技术原因每次插入骨架的序列长度有限,因此过长的KI序列需要分成多次进行插入。每个设计方案均需要
对插入进行判断和插入设计,多次插入的方案需再之前的插入步骤中提前在对应位置引入
酶切识别序列用于后续实验。
[0128] 具体地,如图6所示,片段插入方案设计:
[0129] a.插入序列总长小于设定的最长插入长度限制,片段可一次性插入载体;
[0130] b.插入序列总长大于设定的最长插入长度限制,片段需分多步插入质粒骨架;即特定的复杂元件单独插入,以及每个分组拆分多组,拆分原则是:尽量保留每个元件完整,
拆分的组合数最少,拆分的片段间的大小尽量均一。
[0131] c.插入顺序设计:
[0132] 1)优先插入PCR扩增区域,其次插入需要基因合成的片段,最后插入复杂元件;
[0133] 2)片段插入的酶切方案设计,第一个片段均固定使用骨架上已有的酶切位点,之后的每个片段组合的插入均需提前引入酶切方案;
[0134] d.方案设计需满足的规则:已经插入的序列和骨架上均不能存在对应的酶切位点; 前一组序列插入的时候两端需引入0‑2组酶切方案用于后续的片段插入; 同时引入的
两组酶不能存在冲突; 新引入的酶切方案不能与还未使用的酶切组合冲突。
[0135] e.判断每组酶切数据能否保留:即引入的酶切位点需全部抹掉,以及骨架上固有的酶切识别序列在两端与骨架接壤的序列插入时做出判断,若后续片段插入不再重复使用
此酶可补回整个序列,否则需要在构建载体时通过引物删除对应的酶切识别序列。
[0136] 所述根据敲入序列的长度和元件的序列来源,构建连转引物模型之中,还包括:
[0137] S221、根据序列片段长度和元件来源对序列进行分组,极短序列通过引物连入,有模板的序列通过引物进行PCR扩增获取,除上述以外的序列则通过基因序列合成获得,相邻
合成片段可合在一起通过序列合成一个片段获得;
[0138] S222、根据序列片段类型构建连转引物模型。
[0139] 也就是说,对于连转引物设计,如图7所示,根据插入的序列的长度和元件的序列来源设计每一步载体所使用的连转引物,具体为:
[0140] a.根据片段长度和元件模板来源对序列进行分组;
[0141] 1)PCR来源片段均在序列两端设计对向引物进行PCR扩增;
[0142] 2)短序列片段若其中一端是基因合成片段均与旁边的片段一起进行片段合成;
[0143] 3)多个连续片段均合成时可合在一起进行基因合成;
[0144] b.根据片段类型进行引物设计;
[0145] 合成片段:1)若合成片段与骨架连接,直接在合成序列末端增加骨架末端的20nt长度的片段一起合成;若合成片段与其它PCR片段连接,需在合成序列末端增加相连PCR片
段末端的20nt长度的片段一起合成;2)片段末端增加一组特异性的限制性内切酶识别序列
一起合成,两端设计一组对向引物。
[0146] PCR扩增片段:1)与骨架连接的部分引物需延长至与骨架有20nt的重叠区域;2)片段之间的连接处的引物也需要至少20nt的重叠区域;3)片段末端序列若超过最长引物限制
需额外叠加引物进行延伸,叠加的引物之间至少也有20nt长度的序列。
[0147] 对于菌检引物设计创建来说,如图8所示,每一步插入序列均需设计一到两组菌检引物和一组空载引物,引物参数由实验人员根据经验总结出的设计规则进行设计和筛选。
[0148] a.插入片段长度小于500nt,在插入位置前后骨架上设一组对向引物;
[0149] b.插入片段长度大于500nt,在插入的两个接口上下游各设一组对向引物;
[0150] c.在骨架切口位置上下游设一组对向引物,最终PCR的产物长度要求与倒数第一组菌检产物有长度差。
[0151] 对于酶切方案设计创建来说,单双酶切割质粒载体,选择合适的酶切方案。筛选要求如下:
[0152] a.片段长度在100~1000nt,长度差大于等于100nt;
[0153] b.片段长度在1000~2000nt,长度差大于等于150nt;
[0154] c.片段长度在2000~3000nt,长度差大于等于300nt;
[0155] d.片段长度在3000~5000nt,长度差大于等于500nt;
[0156] e.片段长度在5000~8000nt,长度差大于等于1000nt;
[0157] f.单酶切方案优于双酶切方案。
[0158] 所述根据所述敲入序列的长度,实时创建元件敲入方案之中,还包括:
[0159] S2121、创建元件分步敲入顺序模型;并判定质粒载体骨架切割处理酶切数据。
[0160] 具体地,方案创建设计需满足的规则:已经插入的序列和骨架上均不能存在对应的酶切位点; 前一组序列插入的时候两端需引入0‑2组酶切方案用于后续的片段插入; 同
时引入的两组酶不能存在冲突; 新引入的酶切方案不能与还未使用的酶切组合冲突。
[0161] 同时判断每组酶切数据能否保留:即引入的酶切位点需全部抹掉,以及骨架上固有的酶切识别序列在两端与骨架接壤的序列插入时做出判断,若后续片段插入不再重复使
用此酶可补回整个序列,否则需要在构建载体时通过引物删除对应的酶切识别序列。
[0162] 所述实时获取待插入序列数据,结合所述载体敲入模型,定点将外源基因敲入载体之后,还包括:
[0163] S40、可视化展示敲入各元件序列后的载体。
[0164] 也就是说,在本发明方案中,对于可视化展示来说,如图9所示,具体可以实现:
[0165] a.文档下载模块:包含各个环节的gb注释文件、策略图图片、方案文档和载体设计所有环节所设计的数据文档;
[0166] b.酶切策略图展示模块:重组酶反应(策略图)图示;
[0167] c.载体构建过程图示展示模块:可视化展示敲入方案,标注酶切方案、连转引物、菌检引物和测序引物;
[0168] d.表格展示数据模块:插入酶切方案、连转引物鉴定数据、菌检鉴定数据、测序引物数据和酶切鉴定数据;
[0169] e.基因信息展示模块:NCBI网站关于基因的信息,包含基因描述、基因组版本、Ensembl网站关于基因的信息和转录本图示信息;
[0170] f.同源臂序列分析模块:Dot Plot分析图和GC含量分析图。
[0171] 为实现上述目的,本发明还提供一种基因定点敲入载体构建系统,如图10所示,所述的系统具体包括:
[0172] 获取单元,用于获取待敲入基因原始数据信息,并创建与所述待敲入基因模型相对应的骨架;
[0173] 模型构建单元,用于根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0174] 定点敲入单元,用于实时获取待敲入序列数据,结合所述载体敲入模型,定点将各序列元件敲入载体。
[0175] 进一步地,所述系统中,还包括:
[0176] 展示模块,用于可视化展示定点敲入外源基因和调控元件序列后的载体;
[0177] 所述获取单元中,还包括:
[0178] 标注模块,用于标注与所述待敲入基因相对应的同源臂和基因序列信息、突变信息、调控元件信息;
[0179] 筛选模块,用于实时筛选与所述待敲入基因相对应的骨架;
[0180] 第一创建模块,用于创建同源臂区域,并对插入元件序列进行溯源;
[0181] 处理模块,用于实时处理同源臂和基因序列上的突变;
[0182] 所述模型构建单元中,还包括:
[0183] 第一构建模块,,用于构建基因序列元件敲入质粒载体模型,同时包含内切酶切割骨架方案模型;
[0184] 第二构建模块,用于根据敲入序列的长度和元件的序列来源,构建连转引物模型;
[0185] 第三构建模块,用于构建菌检引物模型和酶切鉴定模型;
[0186] 第四构建模块,用于构建测序引物模型,用于对所述载体进行测序;
[0187] 第三创建模块,用于根据所述元件序列的长度,实时创建元件敲入方案;
[0188] 第一选定模块,用于通过所述敲入方案,实时选定第一步之后的每一步操作敲入切割骨架时所需内切酶,并将所选内切酶加入所述方案相应步骤待敲入元件的序列中;
[0189] 分组模块,用于根据序列片段长度和元件来源对序列进行分组;
[0190] 第五构建模块,用于根据序列片段类型构建连转引物模型;
[0191] 第二创建模块,用于创建元件敲入顺序模型;并判定处理酶切数据。。
[0192] 也就是说,在本发明系统中,具体包含:目标基因信息获取模块、插入序列模板搜索模块、载体构建方案设计模块、连转引物设计模块、测序引物设计模块、菌检引物设计模
块和可视化展示模块。
[0193] 在本发明系统方案实施例中,所述系统涉及到的各单元或模块的功能,可参照一种基因定点敲入载体构建方法中涉及的方法步骤,具体细节已在上文阐述,此处不再赘述。
[0194] 为实现上述目的,本发明还提供一种基因定点敲入载体构建平台,如图11所示,包括:
[0195] 处理器、存储器以及基因定点敲入载体构建平台控制程序;
[0196] 其中在所述的处理器执行所述的基因定点敲入载体构建平台控制程序,所述的基因定点敲入载体构建平台控制程序被存储在所述存储器中,所述的基因定点敲入载体构建
平台控制程序,实现所述的基因定点敲入载体构建方法步骤,例如:
[0197] S1、获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;
[0198] S2、根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0199] S3、实时获取待插入序列数据,结合所述载体敲入模型,定点将外源基因和调控相关序列敲入载体。
[0200] 步骤具体细节已在上文阐述,此处不再赘述。
[0201] 本发明实施例中,所述的基因定点敲入载体构建平台内置处理器,可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封
装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微
处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器利用各种接口和线路
连接取各个部件,通过运行或执行存储在存储器内的程序或者单元,以及调用存储在存储
器内的数据,以执行基因定点敲入载体构建各种功能和处理数据;
[0202] 存储器用于存储程序代码和各种数据,安装在基因定点敲入载体构建平台中,并在运行过程中实现高速、自动地完成程序或数据的存取。
[0203] 所述存储器包括只读存储器(Read‑Only Memory,ROM),随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read‑Only Memory,PROM)、可擦
除可编程只读存储器(Erasable Programmable Read‑Only Memory,EPROM)、一次可编程只
读存储器(One‑time Programmable Read‑Only Memory,OTPROM)、电子擦除式可复写只读
存储器(Electrically‑Erasable Programmable Read‑Only Memory,EEPROM)、只读光盘
(Compact Disc Read‑Only Memory,CD‑ROM)或其他光盘存储器、磁盘存储器、磁带存储器、
或者能够用于携带或存储数据的计算机可读的任何其他介质。
[0204] 为实现上述目的,本发明还提供一种计算机可读取存储介质,如图12所示,所述计算机可读取存储介质存储有基因定点敲入载体构建平台控制程序,所述的基因定点敲入载
体构建平台控制程序,实现所述的基因定点敲入载体构建方法步骤,例如:
[0205] S1、获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;
[0206] S2、根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0207] S3、实时获取待插入序列数据,结合所述载体敲入模型,定点将外源基因和调控元件序列敲入载体。
[0208] 步骤具体细节已在上文阐述,此处不再赘述。
[0209] 在本发明的实施方式的描述中,需要说明的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过
程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包
括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的
方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理
解。
[0210] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供
指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令
执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或
设备而使用。就本说明书而言,“计算机可读取介质”可以是任何可以包含、存储、通信、传播
或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用
的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线
的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器
(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存
储器(CDROM)。
[0211] 另外,计算机可读取介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他
合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0212] 在本发明实施例中,为实现上述目的,本发明还提供一种芯片系统,所述芯片系统包括至少一个处理器,当程序指令在所述至少一个处理器中执行时,使得所述芯片系统执
行所述的基因定点敲入载体构建方法步骤,例如:
[0213] S1、获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;
[0214] S2、根据待敲入基因原始数据信息及骨架和敲入元件,构建载体敲入模型;
[0215] S3、实时获取待插入序列数据,结合所述载体敲入模型,定点将外源基因和调控元件序列敲入载体。
[0216] 步骤具体细节已在上文阐述,此处不再赘述。
[0217] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟
以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员
可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出
本申请的范围。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的
系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘
述。
[0218] 通过本发明的方法步骤、系统、平台及存储介质,可以解决对基因敲入实验设计技术的依赖问题,实现普通实验人员也能直接使用的基因敲入载体构建方案;同时本发明方
案还解决实验成本问题,通过自动搜索比对已有的模板库,解决序列模板来源问题。相比于
序列合成,PCR扩增更加便宜,实验周期也更短;此外,本发明方案还解决序列片段插入载体
策略问题,系统解决长片段拆分,复杂元件单独插入,多片段分步插入,各步插入顺序以及
内切酶选择方案等问题,快速给出载体构建策略;以及解决了传统操作需要耗费时间成本
和人力成本问题,本发明方案从获取基因信息,挑选合适的载体骨架,搜索序列模板,设计
载体构建方案,综合考虑序列的复杂度和片段长度设计合适的连转引物,避免了传统操作
设计出载体后续鉴定使用的测序引物和菌检引物,出具载体构建方案文档等等大量的工作
需要耗费很多时间和精力的技术问题,而本系统全部自动化实现,综合考量各个因素,直接
给出方案报告和实验设计方案。
[0219] 也就是说,本发明方案,只需用户定义设计的目标载体表达框的信息,系统会自动搜索合适的骨架载体,自动分析后续的载体构建流程。也可在半成品质粒载体上改造生成
最终的质粒载体,同时支持自定义基因位点进行基因敲入载体设计,避免了由于人工设计
载体方案用时很长,因此需要投入很多人力大量时间才能满足短时间内获得目的基因敲入
方案载体构建的设计需求。
[0220] 即原有技术设计基因敲入方案需要有经验的专家或者实验人员完成,而本发明方案是将经验丰富的实验专家总结的设计规则研发的一款自动化实验设计系统。使用者只需
要简单的参数选择和序列粘贴复杂甚至可以进行点突变的设定,一分钟内即可得到一份包
含详细的载体构建流程。数据包括gRNA脱靶数据、载体插入酶切方案、连转引物、测序引物、
菌检引物、各环节的载体注释信息文件、一份实验所需的设计数据文档和一份方案文档报
告。利用计算机的高效快速处理技术,结合设计人员自行开发的多个算法模块,给出合理的
实验设计方案。
[0221] 总的来说,本发明通过一种基因定点敲入载体构建方法:获取待敲入基因原始数据信息,并创建与所述待敲入基因相对应的骨架;根据待敲入基因原始数据信息及骨架和
敲入元件,构建载体敲入模型;实时获取待插入序列数据,结合所述载体敲入模型,定点将
外源基因和调控元件序列敲入载体;以及与方法相对应的系统及平台,可以实现外源基因
的定点敲入,使遗传背景更为简单,实验操作更加精准、高效。而且比传统操作更简单,设计
上更灵活,成本更低,周期也更短。并且通过基因的定点敲入为未来靶向基因治疗提供了可
能,将功能缺失的DNA片段修复为有功能的DNA片段,即可实现基因治疗的目的。
[0222] 也就是说,通过本发明方案,可以大大提高产出,解放人力,提高工作效率,和精准率原本繁琐复杂的设计过程,现在变得更加简单快捷;而且打破知识背景壁垒,没有丰富实
验经验的研究者,也可以获得基因敲入质粒载体设计的各个环节的详细步骤方案;通过本
发明方案可以直接全自动设计生产方案,实现实验各环节实验设计的自动化分析,为未来
生产流程的自动化提供可能性。
[0223] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员
来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保
护范围。因此,本发明专利的保护范围应以所附权利要求为准。