基于纳米孔测序的力谱分析方法和分析装置转让专利

申请号 : CN202110598008.2

文献号 : CN113322180B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 赵新佳陈晓钰米壮单欣岩陆兴华

申请人 : 中国科学院物理研究所

摘要 :

本发明提供了一种用于纳米孔的差分力谱分析装置,包括:具有电解质溶液的溶液池,所述电解质溶液包含具有已知碱基序列的生物分子;介质膜,用于容纳待分析的纳米孔并将溶液池分隔为两个腔室;电场发生器,用于产生施加于溶液池的电场;电信号检测器,用于当生物分子在电场的驱动下穿过纳米孔时检测所产生的电流数据;以及控制模块,用于根据电流数据获得生物分子的每个碱基穿过纳米孔的滞留时间,从而确定能够表征所述纳米孔的至少一种特性的纳米孔与生物分子相互作用的差分力分布。本发明所述的方法和装置能够高精度定量计算单个碱基与蛋白质相互作用,以及进一步精确确定蛋白质内部微观结构特征。

权利要求 :

1.一种用于纳米孔的差分力谱分析装置,包括:

具有电解质溶液的溶液池,所述电解质溶液包含具有已知碱基序列的至少一种生物分子;

介质膜,用于容纳待分析的纳米孔并将所述溶液池分隔为两个腔室;

电场发生器,用于产生施加于所述溶液池的电场;

电信号检测器,用于当所述至少一种生物分子在电场的驱动下穿过所述纳米孔时检测所产生的电流数据;以及控制模块,用于根据所述电流数据获得所述至少一种生物分子的每个碱基穿过所述纳米孔的滞留时间,从而确定能够表征所述纳米孔的至少一种特性的所述纳米孔与所述至少一种生物分子相互作用的差分力分布。

2.根据权利要求1所述的装置,其中,所述控制模块根据碱基解析算法,判定并生成所述电流数据对应的解析碱基序列并获得其中每一个碱基的所述滞留时间,以及根据序列比对算法选择与所述解析碱基序列最接近的所述已知碱基序列,从而将所述解析碱基序列的所述每一个碱基的所述滞留时间映射到所述已知碱基序列。

3.根据权利要求2所述的装置,其中,所述碱基解析算法基于隐马氏模型。

4.根据权利要求2所述的装置,其中,仅保留所获得的解析碱基序列的中段的数据而丢弃两端的数据。

5.根据权利要求1所述的装置,其中,对于任意一个所述碱基,所述差分力正比于所述滞留时间。

6.根据权利要求1所述的装置,其中,所述控制模块获得多组所述电流数据以计算所述已知碱基序列种的每一个碱基的滞留时间,从而对所述滞留时间进行统计平均。

7.根据权利要求1至6任一项所述的装置,其中,所述纳米孔具有分子马达,所述生物分子为具有同一已知碱基序列的DNA链,所述DNA链由所述分子马达解螺旋后的其中一条DNA单链穿过所述纳米孔;以及其中所述分子马达以与所述电信号检测器精度匹配的步进速度解螺旋所述DNA链。

8.根据权利要求7所述的装置,其中,所述根据以下公式计算所述碱基序列的任一碱基S的差分力δF(S,X):其中,X代表所述碱基S在所述生物分子穿过所述纳米孔的前进方向上的位置坐标,m为所述DNA链的质量,x0为DNA链中相邻碱基的间距,t0为任一碱基对解旋后运动x0所花费的时间,t(S,X)为碱基S在坐标X的滞留时间,表示所有碱基的平均滞留时间,以及其中碱基S是A、T、C、G四种碱基中的一种。

9.根据权利要求8所述的装置,其中

以碱基类型A、T、C、G对所述碱基序列的所有碱基S分类并统计每种碱基的差分力分布;

以及

其中,对于任一坐标X,根据每种碱基的差分力大小确定所述纳米孔在该处与此种碱基相互作用强度以表征所述纳米孔的至少一种特性。

10.根据权利要求9所述的装置,其中,根据A、T、C、G四种碱基在所述坐标X处的所述相互作用差异将所述纳米孔在所述坐标X处的化学结构表征为来自氢键、范德华力或其组合中的一种。

11.根据权利要求1所述的装置,其用于对CsgG蛋白、α‑hemolysin蛋白、或MspA蛋白或者纳米孔孔径为所述生物分子直径的101%至200%的蛋白的纳米孔进行差分力谱分析。

12.一种用于纳米孔的差分力谱分析方法,包括:

驱动至少一种生物分子穿过待分析的纳米孔,并检测该过程的电流数据,其中所述至少一种生物分子具有已知碱基序列;

根据所述电流数据获得所述至少一种生物分子中的每个碱基穿过所述纳米孔的滞留时间,以确定所述纳米孔与所述至少一种生物分子相互作用的差分力分布,从而表征所述纳米孔在所述生物分子前进方向上的特性。

说明书 :

基于纳米孔测序的力谱分析方法和分析装置

技术领域

[0001] 本发明涉及生物分子领域,具体涉及基于纳米孔测序技术获得蛋白内部结构的力谱分析方法和分析装置。

背景技术

[0002] 纳米孔是指二维薄膜上直径为纳米尺度的小孔,基于纳米孔的DNA测序技术日臻成熟。纳米孔测序技术以绝缘介质膜隔绝电解质溶液(离子液),分隔为两个电解质溶液池,其中绝缘介质膜上存在一纳米尺度小孔。该纳米孔是唯一的离子、分子通道。当外加电压时,电解质溶液中离子受电场力而定向移动产生电流。当电解质溶液中存在DNA分子时,DNA分子也会受到电场力的驱动而穿过纳米孔。在纳米孔测序操作期间,DNA双链在分子马达(马达分子蛋白)的作用下与镶嵌在生物膜上的纳米孔蛋白结合并解螺旋,解螺旋后的一支DNA单链由于在纳米孔两侧所施加的偏置电压作用,被强迫以一定的速率通过纳米孔。DNA分子穿孔时会对纳米孔中的离子电流产生阻塞效应,即跨屏障的电流会由于例如不同碱基化学结构存在差异导致的阻塞程度而发生变化,从而形成可探测的不同电学信号。来自该电流大小信号以及电流大小的变化信号可以使用放大器或其他已知的信号检测设备进行测量,在记录的电流信号中会看到一个突变,即所谓的阻孔电流。由于每个碱基的尺寸大小不同,对应的阻孔电流也有差异,由此,根据测量结果,由特定算法对其进行判定即可获得相应碱基序列的排列信息,完成序列的实时测定。
[0003] 纳米孔测序技术按照纳米孔材质可以划分为两大类,一类是固态纳米孔,另一类是生物纳米孔。固态纳米孔由于其对于DNA分子的运动控制还不理想,尚无法实现碱基序列的测定。生物纳米孔一般由天然或改造过的蛋白质构成,生物纳米孔对于DNA分子的运动控制主要来自于分子马达,分子马达可以令DNA分子步进式运动,致使单个碱基在纳米孔中滞留时间达数毫秒。目前已有基于生物纳米孔的商品化测序仪面世,例如牛津纳米孔技术公司的纳米孔测序仪系列产品。然而,目前纳米孔测序仪的应用中缺少能够对DNA序列和纳米孔蛋白相互作用进行精确计算的手段,不具备进一步精细化描述纳米孔蛋白内部结构的微观特征的能力。

发明内容

[0004] 针对现有技术存在的上述技术问题,本发明的第一方面提供了一种用于纳米孔的差分力谱分析装置,包括:
[0005] 具有电解质溶液的溶液池,所述电解质溶液包含具有已知碱基序列的至少一种生物分子,
[0006] 介质膜,用于容纳待分析的纳米孔并将所述溶液池分隔为两个腔室,[0007] 电场发生器,用于产生施加于所述溶液池的电场,
[0008] 电信号检测器,用于当所述至少一种生物分子在电场的驱动下穿过所述纳米孔时检测所产生的电流数据,以及
[0009] 控制模块,用于根据所述电流数据获得所述至少一种生物分子的每个碱基穿过所述纳米孔的滞留时间,从而确定能够表征所述纳米孔的至少一种特性的所述纳米孔与所述至少一种生物分子相互作用的差分力分布。
[0010] 优选地,所述控制模块根据碱基解析算法,判定并生成所述电流数据对应的解析碱基序列并获得其中每一个碱基的所述滞留时间,以及根据序列比对算法选择与所述解析碱基序列最接近的所述已知碱基序列,从而将所述解析碱基序列的所述每一个碱基的所述滞留时间映射到所述已知碱基序列。
[0011] 优选地,其中所述碱基解析算法基于隐马氏模型。
[0012] 优选地,仅保留所获得的解析碱基序列的中段的数据而丢弃两端的数据。
[0013] 优选地,对于任意一个所述碱基,所述差分力正比于所述滞留时间。
[0014] 优选地,所述控制模块获得多组所述电流数据以计算所述已知碱基序列种的每一个碱基的滞留时间,从而对所述滞留时间进行统计平均。
[0015] 优选地,所述纳米孔具有分子马达,所述生物分子为具有同一已知碱基序列的DNA链,所述DNA链由所述分子马达解螺旋后的其中一条DNA单链穿过所述纳米孔;以及[0016] 其中所述分子马达以与所述电信号检测器精度匹配的步进速度解螺旋所述DNA链。
[0017] 优选地,所述根据以下公式计算所述碱基序列的任一碱基S的差分力δF(S,X):
[0018]
[0019] 其中,X代表所述碱基S在所述生物分子穿过所述纳米孔的前进方向上的位置坐标,m为所述DNA链的质量,x0为DNA链中相邻碱基的间距,t0为任一碱基对解旋后运动x0所花费的时间,t(S,X)为碱基S在坐标X的滞留时间,表示所有碱基的平均滞留时间,以及其中碱基S是A、T、C、G四种碱基中的一种。
[0020] 优选地,其中,以碱基类型A、T、C、G对所述碱基序列的所有碱基S分类并统计每种碱基的差分力分布;以及
[0021] 其中,对于任一坐标X,根据每种碱基的差分力大小确定所述纳米孔在该处与此种碱基相互作用强度以表征所述纳米孔的至少一种特性。
[0022] 优选地,其中根据A、T、C、G四种碱基在所述坐标X处的所述相互作用差异将所述纳米孔在所述坐标X处的化学结构表征为来自氢键、范德华力或其组合中的一种。
[0023] 优选地,其用于对CsgG蛋白、α‑hemolysin蛋白、或MspA蛋白或者纳米孔孔径为所述生物分子直径的101%至200%的蛋白的纳米孔进行差分力谱分析。
[0024] 本发明的第二方面提供一种用于纳米孔的差分力谱分析方法,包括:
[0025] 驱动至少一种生物分子穿过待分析的纳米孔,并检测该过程的电流数据,其中所述至少一种生物分子具有已知碱基序列;
[0026] 根据所述电流数据获得所述至少一种生物分子中的每个碱基穿过所述纳米孔的滞留时间,以确定所述纳米孔与所述至少一种生物分子相互作用的差分力分布,从而表征所述纳米孔在所述生物分子前进方向上的特性。
[0027] 本发明所述的差分力谱分析方法基于大量测序数据的统计和精准的针对性建模分析。该方法具有极高的灵敏度,可实现DNA序列中单个碱基与蛋白质相互作用的定量化描述,揭示蛋白质内部结构的物理化学图像。

附图说明

[0028] 以下参照附图对本发明实施例作进一步说明,其中:
[0029] 图1示出了纳米孔测序原理的示意图;
[0030] 图2示出了序列中每个碱基及其滞留时间的示意图;
[0031] 图3示出了所获得的四种碱基的差分力沿着位置偏移量的分布图;
[0032] 图4示出了由差分力谱确定纳米孔蛋白化学结构的示意图。

具体实施方式

[0033] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本发明进一步详细说明。
[0034] 本发明提供一种差分力谱分析方法,旨在通过对纳米孔测序相关信息的解析,获得单个碱基与蛋白分子相互作用的力谱特征,从而可定量分析相关的微观物理机制。
[0035] 图1示出了纳米孔测序原理的示意图。在纳米孔测序操作期间,DNA双链在例如解旋酶的分子马达的作用下与镶嵌在生物膜上的纳米孔蛋白结合并解螺旋,随后由于电压偏置的作用而穿越纳米孔移动。纳米孔上具有测序敏感位点,用于记录该处的离子电流信号,测序敏感有效厚度或者说测量精度在2纳米尺度内。根据图1所示,解旋酶的作用位点与纳米孔测序敏感位点存在一偏移量X(nt)。
[0036] 当核苷酸穿过纳米孔时,单链DNA分子上每个碱基的穿孔滞留时间通常被控制在毫秒量级。每个碱基的步进滞留时间在序列解析过程中可同时获得。根据牛顿定律,碱基步进滞留时间与DNA‑纳米孔结构相互作用力有关。碱基序列相关的滞留时间变化反映了每个碱基与纳米孔结构相互作用的特征。因此发明人提出以下分析原理以获得更精确的纳米孔结构相互作用特征:由于解旋步进过程依赖ATP分子的能量转化,每个碱基滞留时间的涨落基本是随机的。另外,每次利用实际测量所得的离子电流信号解析出的碱基序列(以下均称解析序列)都与实际序列(以下均称已知序列)存在一定的偏差。由此,需要序列比对算法将解析序列中每个碱基滞留时间映射到已知序列数据相应的碱基上,合并形成输出序列数据,并需要通过大量统计将所述输出序列数据的随机涨落导致的误差抑制到足够小。此后,通过对碱基穿孔过程的受力分析,可以得出单个碱基或某个碱基序列片段在纳米孔结构特定位置所受到的力与平均力(碱基随机平均情况下)的差(以下均称差分力)。差分力是碱基和位置的函数,表达如下:
[0037]
[0038] 式中δF(S,X)代表差分力,S代表一个碱基或序列片段,X代表碱基在纳米孔结构中的位置坐标,m为一定长度的DNA链的质量,x0为单链DNA分子相邻碱基的间距,t0为某碱基对解旋后运动x0所花费的时间。t(S,X)为碱基或序列片段S在坐标X的滞留时间,表示四种碱基总体上统计获得的平均穿孔滞留时间。S可以是A、T、C、G四种碱基之一。从该力的表达式可以看出,差分力与碱基步进时间的变化差值成正比。
[0039] 通过绘制四种碱基的差分力谱δF(S,X),可以获得某些特定位点上的突出信号,由此可进一步反推出该纳米孔蛋白质内部结构信息,尤其是与穿过其的分子的相互作用信息。下面将结合特定实施例详细展开介绍。以下实施例根据上文所述的差分力原理,对于待测的DNA双链结构,经解旋后计算获得其所穿越纳米孔的DNA单链的实际碱基序列中各碱基对应的相互作用特征数据。其过程可以由以下步骤实现。
[0040] 步骤1:采用纳米孔测序技术,批量操纵单链DNA分子穿过纳米孔并记录该单链DNA分子的各个碱基依次穿过该纳米孔时的原始数据,即离子电流数据,其中该离子电流数据为单链DNA分子完整的穿孔过程中在纳米孔敏感位点处的阻孔电流值(即电流强度)随时间变化的数据,其中任意时刻的阻孔电流值与该时刻所穿过纳米孔的碱基的所属类型特征高度相关。
[0041] 步骤2:采用碱基解析算法,对上述离子电流数据中的一系列阻孔电流值曲线特征,例如振幅(即电流强度)、峰谷值宽度(即时间)等特征分别进行判断,从而按照顺序先后解析得到一系列电流值所对应的最可能的碱基类型(从碱基A、T、C、G中选择),并同步获得每一个碱基解析结果对应的穿孔滞留时间,并将至少以上两个维度的数据合并输出为初步加工的解析序列数据并作为本步骤2的输出。
[0042] 其中,本实施例中示例性的示出了一种碱基解析算法:基于隐马氏模型的碱基解析算法,然而,还可以采用本领域已知的其他碱基解析算法作为本实施例的替代或附加。此外,对于所述解析序列数据(即解析后的碱基序列数据),发明人发现通常靠近碱基序列中起点和终点附近的碱基解析结果准确度略低于碱基序列靠近中部的解析结果,因此在本实施例的进一步变形中还对解析后的碱基序列数据进行整理,丢弃靠近所述起点和终点附近的一部分数据值,以获得准确度更高的待处理样本。对于整个解析序列数据(即解析后的碱基序列长度)的长度内,此处所述丢弃的起点和终点附近数据量可以理解为各自独立占据碱基序列长度(即解析序列数据)的0.1%至15%、或者1%至10%、或者2%至5%之间的数值,优选为不超过50个碱基长度,且两端的丢弃量不必须相等。此外在其他实施例中也可以选择保留解析序列数据中的全部碱基序列或者根据待分析单链DNA或RNA分子的结构特征选取其中的多个独立区段。所述解析序列数据虽已具备一定精度,仍需在后续步骤对其进行进一步校准。
[0043] 步骤3:采用序列比对算法,将上述解析序列数据的序列特征与预先获得的已知序列数据(即该生物分子的预先已知的精确序列,也可称为参考序列)的序列特征进行全序列比对并计算出其最可能的对应方式,对应成功之后,该序列比对算法将所述解析碱基序列的所述每一个碱基的所述滞留时间映射到所述已知碱基序列,由此获得输出序列数据。因此,所获得的输出序列数据既包含该单链DNA分子准确的已知碱基序列,又包含与该碱基序列中的每一个碱基位置一一映射的穿孔滞留时间。其中,在本领域中序列比对算法已经有多种成熟的算法与软件,可以根据实际需要选择其中一种进行计算。
[0044] 步骤4:对步骤3所获得的多个输出序列数据进行统计,即将单链DNA分子碱基序列中的每一个碱基所对应的多个穿孔滞留时间进行平均,获得统计序列数据。
[0045] 图2示例性示出了根据本发明的实施例的统计序列数据中的其中一部分。在图2所示的数据中,横坐标表示碱基序列的序列值,纵坐标表示对碱基序列中每一个碱基统计而获得的平均穿孔滞留时间。其中,在有限长度的横坐标上示出了超过40000个坐标点(碱基),因此图示的数据点值在图中较为密集,但是每一个横坐标点的碱基序列值仅仅对应一个纵坐标值(即平均穿孔滞留时间值)。图2仅为示例性示出,不同纳米孔结构的离子电流信号与碱基序列的对应关系是不同的,不应将特定列出的单链DNA分子视为对本申请的限定,还可以将其扩展到纳米孔测序或者类似测序手段所能够实施测序的其他碱基序列或类似结构。
[0046] 具体地,对于每个碱基位置的统计过程如下:本实施例采用的纳米孔测序属于高度平行化的高通量纳米孔测序技术,在一次纳米孔测序中通常会获得同一单链DNA分子的数千份(例如,6000份至8000份)原始的离子电流数据以及从其相应导出的数千份输出序列数据,因此理论上在步骤4中对于同一精确碱基位置,至少可以对6000份以上的穿孔滞留时间样本进行统计平均,其使得即统计序列数据的精确度进一步提升。例如,本实施例中单个输出序列数据样本的准确率至少在90%左右,而本步骤4统计平均后的统计序列数据准确率会更高。
[0047] 步骤5:从上述获得的统计序列数据提取并获得A、T、C、G四种碱基的差分力δF与偏移量X的对应关系。
[0048] 图3示出了所获得的四种碱基的差分力沿着位置偏移量的分布图。其中,差分力δF的计算根据上文所述的公式(1)进行。其中需要确定t(S,X),即某一碱基或者序列片段S在相对纳米孔位置步进期间在各个位点X(例如被分子马达解旋之前、在分子马达解旋位点、在纳米孔位点、已经处于纳米孔另一端等等一系列位点)处的滞留时间,以及其中,由于单链DNA穿越纳米孔的过程中仅需要关注其前进方向,因此可以视为仅具有一维尺度。其坐标计算可以有多种方式,举例说明,可以约定以纳米孔所在位置(或者更确切地说是该纳米孔的测序敏感位点)为参照原点,将分子马达相对于所述原点所在的一侧规定为正半轴,将每一个碱基距离该参照原点的位置近似表达为两者之间间隔的碱基数量,例如X=13即表示该碱基所在位置距离纳米孔间隔为十三个碱基,X=0即表示该碱基恰好处于纳米孔处。然而此设定仅为举例示出,还可以在进一步的实施例中采用其他适合的坐标系或者参考点计算差分力δF,包括但不限于极坐标系、球坐标系,柱坐标系等。
[0049] 可以根据步骤4所获得的统计序列数据,由其中的序列排序以及每一个碱基在该测序敏感位点处的滞留时间推算出该碱基在所述一维坐标轴上各个坐标X的滞留时间t(S,X),从而根据公式(1)获得其差分力沿一维坐标轴的点值分布。对于A、C、T、G四种碱基,统计平均后可以获得其各自沿一维坐标轴的差分力分布曲线,如图3所示出的,其中横坐标代表所约定的一维坐标轴,纵坐标代表差分力的强度。
[0050] 对于纳米孔DNA测序实验而言,DNA分子在孔中受到力主要来源有:①解旋酶解旋作用力;②电场力;③粘滞阻力;④碱基与蛋白质内部化学基团的相互作用力。同时,一般而言DNA分子中A和T碱基互补配对,二者通过两个氢键相连接;C和G碱基互补配对,二者通过三个氢键连接。
[0051] 根据上述推理基础,分析图3中的差分力特征,在X<0及X>18的位置,对于A、T、C、G来说差分力δF趋同于一条曲线附近,并没有明显区分,并且差分力的值都在0左右。然而,从图3可以看到,在坐标X的另一些位置上(如X在0至10,或更显著的在10至15之间)不同的碱基或碱基片段的差分力出现了多个差异化的峰。以下分析这些峰的来源:
[0052] (1)差分力如果来自于解旋酶的解旋作用力,那么对于A‑T碱基对来说,A和T碱基就应该在相同位置有特征峰,C和G碱基也应该在相同位置有特征峰。基于这样的认识,观察到在X=2处,δF(C,2)远大于其他三个碱基的差分力,这就意味着产生图3所示的特征峰差异的主要原因,并不是解旋酶的解旋作用力。
[0053] (2)差分力如果来自于电场力,电场力应当正比于不同碱基带电量和电场大小。本7
实施例中,电场在纳米孔孔道内强度约为10 V/m,然而在图3中,观察到在X=‑10~10区域内的各个差分力并非在某一相同位点处(即电场施加处)一致变化,因此特征峰差异并不是来自电场力。
[0054] (3)差分力如果来自于粘滞阻力,由于粘滞阻力是DNA单链与蛋白质内部结构的摩擦力。基于碱基G是构成DNA分子的碱基中最大的碱基,那么粘滞阻力对于碱基G的影响是最大的,也就是差分力中碱基G应该有峰出现(如图3中X=6~15中,碱基G差分力的特征峰数值最大这一特征可以根据以上分析来解释),然而在纳米孔测序敏感位点所处的X=0~4这一区域,碱基G并未出现差分力的特征峰高于其余碱基这一现象,由此可看出引起这些峰差异的主要原因也并非粘滞阻力。
[0055] 由上述推断可以看出,排除这几种可能性之后,产生这些差异化峰值特征信号的最可能来源就是碱基与蛋白质内部结构的相互作用。这种相互作用例如可能来自于氢键或范德华力或其组合,以下均称相互作用力。基于这样的考虑,可以通过该坐标轴上某一特定偏移量处的差分力峰值特征反推出蛋白质内部的结构。发明人发现,其中碱基对之间通过氢键连接,解旋酶解开双螺旋后,单链DNA上存在一些可以形成氢键的基团。
[0056] 以此为分析的基础,下面以图3为例列举几种典型位置的分析示例:
[0057] 示例(1):对于X=2的位置,差分力有δF(C,2)>δF(T,2)>δF(A,2)~δF(G,2),很可能在X=2的位置处,蛋白质内部存在一个与碱基C形成较强相互作用的化学结构(例如形成氢键),而与其他碱基无法形成较强相互作用。
[0058] 示例(2),对于X=11的位置,有δF(A,11)~δF(G,11)>δF(C,11)~δF(T,11),这意味着在X=11的位置处,蛋白质内部存在一个能够与碱基A和碱基G都能存在较强相互作用的化学结构。
[0059] 由此可见差分力的大小变化来源于特定碱基与蛋白质内部化学结构的距离靠近以及远离的过程。对于图3中每个偏移量X均可以如上所述的进行分析,确定该位置处的蛋白质内部结构对四种碱基的相互作用强弱特征,从而推导得出蛋白质内部可能存在的化学结构的物理图像。
[0060] 图4展示了根据差分力谱分析获得的纳米孔与解旋酶结构的内部物理图像。其中图4上方示出了根据本发明的一个实施例中示出的正被分子马达进行解旋的DNA双螺旋结构,以及其一支解旋后的单链穿过纳米孔的情景;图4下方对应示出了该纳米孔以及分子马达的形成的整体结构中各个位置的蛋白质内部结构对不同种碱基的相互作用力强弱的分布曲线,其中能够对单个碱基与蛋白质相互作用进行定量化描述。在本实施例中,计算获得‑17的差分力谱的精度在10 N量级,远优于现有力学测量精度。
[0061] 在其他实施例中,由与上述类似的分析方法,基于纳米孔测序技术还可以进行其他带电分子,例如RNA或其他具有序列特征的生物大分子的穿孔力谱分析,并且可以进一步分析相应的纳米孔蛋白质内部的化学结构信息。
[0062] 对于本发明中所提到的纳米孔结构,并不受限于特定的生物纳米孔,并且对蛋白质限制区域、孔径也无特殊要求。优选地,纳米孔结构可以选择由CsgG这种蛋白质构成。或者其他蛋白分子,如α‑hemolysin蛋白分子、MspA蛋白分子等。优选地,纳米孔蛋白质孔径比生物分子(前进方向)的直径大出约1%至100%,又比如在生物分子为直径在1.1纳米左右的DNA单链时,纳米孔蛋白质孔径不超过2纳米,因为过大的直径可能会导致无法得到高信噪比的阻孔电流信号。
[0063] 本发明中的分子马达优选地采用DNA解旋酶,但其并不限制于DNA解旋酶,更不限制于某种特定的DNA解旋酶,其他任何能够使得DNA分子以较低速度运动(从而实现测序)的分子均可用于替代或附加地使用。
[0064] 本发明中受到电场力驱动而运动穿过纳米孔的生物分子,可以优选地采用双链DNA分子,但其不限制于双链DNA分子,其他任何在电解液中带电的分子,且能够完成纳米孔穿孔行为并产生清晰的阻孔电流信号的分子均满足要求。
[0065] 本发明中的电解质溶液,原则上任何能够产生稳定离子电流的电解质溶液均满足要求。优选地,选择浓度为1摩尔每升的氯化钾溶液,pH值呈弱碱性以保证双链DNA分子的完整性。
[0066] 本发明中的电极材料,原则上任一种能施加稳定电压的,并且不产生气体的电极材料均满足要求。优选地,电极材料为银/氯化银氧化还原电极。
[0067] 本发明中的纳米孔支撑结构,原则上任何起到支撑稳定纳米孔,并且具有一定绝缘性的材料均满足要求。优选地,支撑结构为磷脂双分子层。
[0068] 虽然本发明已经通过优选实施例进行了描述,然而本发明并非局限于这里所描述的实施例,在不脱离本发明范围的情况下还包括所作出的各种改变以及变化。