用于蛋白熔解曲线数据分析的系统和方法转让专利

申请号 : CN201280015278.5

文献号 : CN103688264B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 奈弗蒂塔·马朱木达尔哈里森·梁吴若云

申请人 : 生命技术公司

摘要 :

本教导涉及用于分析多个样品的熔解曲线数据的系统和方法的实施方案。根据多个实施方案,为了适应蛋白熔解曲线数据的复杂性,熔解温度(Tm)可通过一系列不同类型的蛋白熔解曲线数据来确定,所述蛋白熔解曲线数据在多种分析属性上具有可变性。多个样品的组合,连同数据的复杂性产生了以很容易方便最终用户分析数据的方式处理所述数据的需要。本教导的交互式图形用户界面(GUI)的多个实施方案提供了可由最终用户进行的快速且连续的变化,从而显示蛋白熔解曲线数据以允许此类分析。

权利要求 :

1.系统,所述系统用于分析蛋白熔解曲线数据,所述系统包括:处理器;

与所述处理器通信的存储器;

用于通过所述处理器接收一组初始蛋白熔解曲线数据的装置;

用于通过所述处理器接收第一分析区域的装置,所述第一分析区域限定用于拟合所述初始蛋白溶解曲线数据的第一温度范围,其中可反复改变所述第一温度范围内的第一初始温度和第一最终温度以限定第二分析区域,所述第二分析区域限定第二温度范围;

用于从初始蛋白熔解曲线数据生成并显示已处理的蛋白熔解曲线数据的第一数据集的第一显示的装置;

用于向最终用户呈递用于交互式分析所述已处理的蛋白熔解曲线数据的第一数据集的界面的装置,其中所述交互式分析包括生成并显示已处理的蛋白熔解曲线数据的第一数据集的第二显示,其中所述第一显示和所述第二显示是同时向用户显示的,所述第二显示为所述第一数据集的n阶导数,并且所述第一显示和所述第二显示是同步的,以使得用于所述第一显示的温度范围上的改变同时改变用于所述第二显示的温度范围,其中可使用所述界面上的交互工具反复改变所述温度范围。

2.如权利要求1所述的系统,其中所述蛋白熔解曲线数据包括作为最终用户所选分析组的温度的函数的检测器响应值。

3.如权利要求1所述的系统,其中所述第一数据集的第一显示为所述数据的Boltzmann拟合的显示。

4.如权利要求1所述的系统,其中所述第一数据集的第二显示为所述数据的一阶导数图的显示。

5.如权利要求1所述的系统,所述系统还包括用于显示所述第一数据集的菱形图的装置,所述菱形图显示重复组集中趋势和方差。

6.计算机执行的方法,所述方法用于分析蛋白熔解曲线数据,所述方法包括:通过处理器接收一组初始蛋白熔解曲线数据;

通过所述处理器接收第一分析区域,所述第一分析区域限定用于拟合所述初始蛋白溶解曲线数据的第一温度范围,其中可反复改变所述第一温度范围内的第一初始温度和第一最终温度以限定第二分析区域,所述第二分析区域限定第二温度范围;

在计算机上处理所述一组初始蛋白熔解曲线数据,所述处理包括:从初始蛋白熔解曲线数据生成并显示已处理的蛋白熔解曲线数据的第一数据集的第一显示;和向最终用户呈递用于交互式分析所述已处理的蛋白熔解曲线数据的第一数据集的界面,其中所述交互式分析包括生成并显示已处理的蛋白熔解曲线数据的第一数据集的第二显示,向用户同时显示所述第一显示和所述第二显示,所述第二显示为所述第一数据集的n阶导数,并且将所述第一显示和所述第二显示同步以使得用于所述第一显示的温度范围上的改变同时改变用于所述第二显示的温度范围,其中可使用所述界面上的交互工具反复改变所述温度范围。

7.如权利要求6所述的计算机执行的方法,其中所述蛋白熔解曲线数据包括作为最终用户所选分析组的温度的函数的检测器响应值。

8.如权利要求6所述的计算机执行的方法,其中所述第一数据集的第一显示为所述数据的Boltzmann拟合的显示。

9.如权利要求6所述的计算机执行的方法,其中所述第一数据集的第二显示为所述数据的一阶导数图的显示。

10.如权利要求6所述的计算机执行的方法,所述方法还包括显示所述第一数据集的菱形图,所述菱形图显示重复组集中趋势和方差。

说明书 :

用于蛋白熔解曲线数据分析的系统和方法

[0001] 相关申请的交叉引用:
[0002] 本申请要求于2011年2月1日提交的美国临时专利申请第61/438621号、于2011年3月8日提交的美国临时专利申请第61/450306号和于2011年6月14日提交的美国临时专利申请第61/496980号的优先权,所述申请全部在此通过引用并入本文中。
[0003] 背景
[0004] 正如蛋白化学领域中的技术人员可获悉的,蛋白熔解曲线数据可发生很大的变化,并且可在多种分析属性上展现出可变性。此类分析属性可包括,例如但不限于曲线形状、背景信号、信号幅度的变化以及噪声。
[0005] 用于蛋白熔解曲线数据分析的本教导的系统和方法(其中可确定熔解温度(Tm)),满足了客观且一致地分析蛋白熔解曲线数据的需要。对于蛋白熔解曲线数据,例如在高通量分析中,可处理多个蛋白样品,这可产生一组蛋白熔解曲线数据,其在一系列分析属性上展现出高可变性。
[0006] 同时处理的多个样品的组合,连同数据的复杂性,产生了以容易帮助最终用户评价数据的方式处理数据的需要。
[0007] 附图简述
[0008] 图1的框图说明了示例性计算机系统的元件,所述计算机系统可应用于用于处理熔解曲线分析的蛋白样品的系统的控制和连接中。
[0009] 图2为可用于熔解曲线分析的蛋白样品的处理的一些仪器特征的实例的框图。
[0010] 图3为用于分析熔解曲线数据的交互式GUI的多个实施方案的输入示意图/输出示意图。
[0011] 图4的流程图描述了用于分析蛋白熔解曲线数据的系统和方法的多个实施方案。
[0012] 图5的流程图描述了用于分析蛋白熔解曲线数据的系统和方法的多个实施方案。
[0013] 图6的流程图描述了用于分析蛋白熔解曲线数据的系统和方法的多个实施方案。
[0014] 图7的图示说明了用于多相蛋白熔解的峰选择的方法的多个实施方案。
[0015] 图8的图示说明了用于多相蛋白熔解的峰选择的方法的多个实施方案。
[0016] 图9为根据本教导中系统和方法的多个实施方案的交互式GUI的示例性窗口。
[0017] 图10A和图10B为图9的GUI的实施方案的示例性部分,其显示了示例性弹出窗口的功能选择的作用。
[0018] 图11为根据本教导中系统和方法的多个实施方案的交互式GUI的示例性窗口。
[0019] 图12为图9的交互式GUI的实施方案的示例性部分,其显示了最终用户比较熔解温度(Tm)确定的多个实施方案的交互性质。
[0020] 图13为图9的交互式GUI的实施方案的示例性部分,其显示了最终用户选择用于分析熔解温度(Tm)确定的多个实施方案的目标温度区域的交互性质。
[0021] 图14为图9的交互式GUI的实施方案的示例性部分,其显示了用于观察熔解温度(Tm)确定的多个实施方案的选择数据的数据的拟合的设施。
[0022] 图15为本教导中交互式GUI的实施方案的示例性部分,其显示了用于观察显示多相熔解的数据的拟合的设施。
[0023] 图16为图14的交互式GUI的实施方案的示例性部分,其显示了用于观察显示多相的数据的拟合的设施。
[0024] 图17A和图17B显示了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征,其显示了用于观察曲线与共有y轴对齐的多条曲线的设施。
[0025] 图18为显示了用于传送重复数据组相关信息的本教导中的多个实施方案的交互式GUI的特征。
[0026] 图19的图表描述了根据本教导中交互式GUI的系统和方法的多个实施方案,其描述了最终用户可接收的标志通知的多种条件图20描述了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征的示例性部分,其显示了用于观察多种参数对重复数据组的影响的设施。
[0027] 图21描述了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征的示例性部分,其显示了经由示例性弹出窗口的选择用于观察多种参数对重复数据组的影响的设施。
[0028] 图22是图19的交互式GUI的实施方案的示例性部分,其显示了用于观察多种参数对重复数据组的影响的设施。
[0029] 图23是图19的交互式GUI的实施方案的示例性部分,其显示了用于观察多种参数对重复数据组的影响的设施。
[0030] 图24A和图24B为本教导中交互式GUI的实施方案的示例性部分,其显示了用于观察显示出双相熔解的所选数据集的设施。图24C是本教导的交互式GUI的实施方案的示例性部分,其显示了用于观察多种参数对图24A和图24B中选择的数据集的重复数据组的影响的设施。
[0031] 图25A描述了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征的示例性部分,其显示了经由示例性弹出窗口的选择用于观察△Tm的所选正阈值的结果的设施。图25B是图25A的交互式GUI的实施方案的示例性部分,其显示了用于观察落入所选正阈值的重复数据组的设施。
[0032] 图26A描述了本教导中交互式GUI的特征的示例性部分,其显示了经由示例性弹出窗口的选择用于观察△Tm的所选负阈值的结果的设施。图26B是图25A的交互式GUI的实施方案的示例性部分,其显示了用于观察落入所选负阈值的重复数据组的设施。
[0033] 详述
[0034] 本教导涉及容易帮助最终用户分析蛋白熔解曲线数据的系统和方法的实施方案。根据多个实施方案,熔解温度(Tm)可通过一系列不同类型的蛋白熔解曲线数据从蛋白热稳定性研究来确定,所述蛋白熔解曲线数据可在多种分析属性上展现出可变性。对于多个实施方案,分析属性可包括,例如但不限于曲线形状、背景信号、信号幅度的变化以及噪声。另外,多个样品可在多种实验条件下进行处理,从而产生最终用户可评价的大量数据。对于多个实施方案,由于产生数据的复杂性和数量,本教导的系统和方法提供了最终用户分析和评价数据的容易便利性。根据多个实施方案,提供了交互式图形用户界面(GUI)以方便最终用户分析和评价数据。在多个实施方案中,交互式GUI可为能提供允许最终用户连续并快速分析蛋白熔解曲线数据的各种特征的交互式工具。根据多个实施方案,交互式GUI可允许最终用户连续并快速分析和评价蛋白熔解曲线数据和用于确定Tm的数据亚集。对于多个实施方案,交互式GUI可允许最终用户连续并快速分析和评价蛋白熔解曲线数据和关于重复组数据的数据亚集,例如多个实验变量对重复数据集的影响,以及与所选组的蛋白熔解曲线数据有关的重复的集中趋势和方差。
[0035] 本领域技术人员可认识运用蛋白的熔解温度(Tm)的确定情况的各种测定。其中具有例如三级结构的蛋白,从所述三级结构变成无规卷曲结构的过程在本领域中被称为,例如但不限于蛋白变性、蛋白解折叠和蛋白熔解。此外,在多种样品溶液条件下,蛋白可显示出针对该蛋白所观察到的Tm的变化或移位为所述样品溶液条件的函数。多个术语例如热熔解测定(TMA)、热转移测定(TSA)、蛋白热转移(PTS)分析和差示扫描荧光光谱(DSF)是其中一种或多种蛋白的Tm的确定情况对分析是至关重要的领域中的术语的实例。
[0036] 关于蛋白化学适用的测量科学的方面,可以观察到检测器信号幅度的变化为蛋白折叠状态的变化的函数。在这方面,由于荧光信号幅度随施加于蛋白样品的温度而变化,可基于所述荧光信号幅度的增加或减少来进行多种分析。
[0037] 例如,在多种分析中,信号幅度可源自蛋白的氨基酸残基例如色氨酸。如本领域的技术人员所获悉的,色氨酸的最大荧光发射的强度、量子产率和波长是非常依赖于溶剂的。随着色氨酸残基周围溶剂极性的降低,荧光色谱位移至较短的波长并且荧光的强度增加。
因此,当蛋白解折叠时,埋藏的色氨酸残基可暴露于更极性水溶剂环境中,以致从折叠状态到解折叠状态可观察到减少的信号幅度。
[0038] 不是使用源自蛋白分子的固有信号,其它分析可运用染料以指示蛋白的折叠状态。例如,可运用例如 的荧光染料以监测蛋白的折叠状态。对于极性溶剂环境中的 观察到荧光信号的淬灭。对于与溶液中折叠蛋白的表面基团相关的 所述染料是在水环境中,以致其荧光信号被淬灭。当蛋白利用例如
热解折叠来解折叠时,可暴露疏水区或疏水残基。接着 可结合疏水区或疏水残基,从而可增加荧光。对于此类 测定,接着可观察到从折叠状态到解折叠状态增加的信号幅度。染料例如1-苯胺基萘-8-磺酸(1,8-ANS)和4,4'-二苯胺基-1,
1'-联萘-5,5'-二磺酸(双-ANS),其在水环境中淬灭,已显示可用于监测蛋白的折叠,其中,
1,8-ANS和双-ANS的荧光在例如蛋白再折叠的过程中可大大增加。
[0039] 如蛋白质科学领域中的普通技术人员所获悉的,可出于多种原因在学术界以及工业中进行蛋白热稳定性的监测。为了研究例如由定向诱变研究所引起的靶蛋白的突变,可进行例如但不限于,蛋白熔解曲线研究或热研究。此外,可进行蛋白热稳定性研究以筛选由于多种体外处理和保存条件对蛋白稳定性的影响。此类蛋白热稳定性研究可筛选多种添加物,例如缓冲液、配体和有机试剂可以对目标蛋白的热稳定性产生的影响。侯选药物对蛋白靶标的结合的高通量筛选也可通过侯选药物的结合可以对蛋白热稳定性产生的影响来监测。因此,鉴定影响蛋白热稳定性的条件可提高影响蛋白纯化、结晶和功能性表征的多种所需条件的鉴定。
[0040] 正如随后将更详细讨论的,系统和方法的多个实施方案可运用从蛋白熔解测定的全部限定的温度范围收集起来的检测器信号数据。此类信号可存储于各种计算机可读介质中。在本教导的多个实施方案中,可提供计算机程序产品,其可包括有形计算机可读存储介质,其内容包括具有这样的指令的程序,当在处理器上实施时,该指令执行用于向最终用户提供连续并快速分析和评价蛋白熔解曲线数据的能力的方法。
[0041] 图1的框图说明了可用于根据多个实施方案执行处理功能的计算机系统100,依靠该计算机系统可实施本教导的实施方案。计算机系统100可包括一个或多个处理器,例如处理器104。处理器104可利用通用用途或特殊用途的处理引擎(例如微处理器、控制器或其它控制逻辑)来实施。在该实例中,处理器104与总线102或其它通信介质连接。
[0042] 此外,应理解的是,图1的计算机系统100可以多种形式的任何一种呈现,例如机架式计算机、大型机、超级计算机、服务器、客户端、台式电脑、笔记本电脑、平板电脑、手持计算设备(如PDA、手机、智能手机、掌上电脑等)、集群网格、上网本、嵌入式系统、或者任何其它类型的特殊用途或通用用途的计算设备,其是给定应用或环境所需或适用的。此外,计算机系统100可包括传统的网络系统包括客户端/服务器环境以及一个或多个数据库服务器,或带有LIS/LIMS基础设施的集成。一些传统的网络系统,包括局域网(LAN)或广域网(WAN),并包括无线元件和/或有线元件,是本领域中已知的。此外,客户端/服务器环境、数据库服务器和网络在本领域中都是有良好记录的。
[0043] 计算机系统100可包括总线102或用于通信的其它通信机制,以及与总线102耦合的用于处理信息的处理器104。
[0044] 计算机系统100还包括存储器106,其可为与总线102耦合的用于存储由处理器104执行的指令的随机存取存储器(RAM)或其它动态存储器。存储器106还可用于在由处理器104执行指令的执行期间存储临时变量或其它中间信息。计算机系统100进一步包括与总线
102耦合的用于存储静态信息和处理器104的指令的只读存储器(ROM)108或其它静态存储设备。
[0045] 计算机系统100还可包括存储设备110,例如提供与总线102耦合的用于存储信息和指令的磁盘、光盘、或固态驱动器(SSD)。存储设备110可包含介质驱动器和移动式存储接口。介质驱动器可包括驱动器或其它机制以支持固定式存储介质或移动式存储介质,例如硬盘驱动器、软盘驱动器、磁带驱动器、光盘驱动器、CD驱动器或DVD驱动器(R或RW)、闪存驱动器或其它移动式或固定式介质驱动器。正如这些实例所示,存储介质可包括在其中存储有特定的计算机软件、指令和/或数据的计算机可读存储介质。
[0046] 在备选的实施方案中,存储设备110可包括其它类似的工具,用于允许将计算机程序或者其它指令或数据加载到计算机系统100中。此类工具可包括,例如移动式存储单元和接口,例如程序盒和盒式接口、移动式存储器(例如,闪存或其它移动式存储器模块)和存储器插槽以及允许软件和数据从存储设备110传输至计算机系统100的其它移动式存储单元和接口。
[0047] 计算机系统100还可包括通信接口118。通信接口118可用于允许软件和数据在计算机系统100和外部设备之间传输。通信接口118的实例可包括调制解调器、网络接口(如以太网或其它NIC卡)、通信端口(例如如,USB端口、RS-232C串行端口)、PCMCIA插槽、PCMCIA卡、蓝牙等。经由通信接口118传输的软件和数据为这样的信号形式,该信号可以为能被通信接口118接收的电子信号、电磁信号、光信号或其它信号。这些信号可通过诸如无线介质、电线或电缆、光纤或其它通信介质的通道由通信接口118来发送和接收。通道的一些实例包括电话线、手机链接、RF链路、网络接口、局域网或广域网及其它通信通道。
[0048] 计算机系统100可通过通信接口118与显示器112通信,例如用于向计算机用户显示信息的阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)显示器。在多个实施方案中,计算机系统100可通过总线与显示器耦合。输入设备114,包括字母数字键和其它键,与总线102耦合,用于向处理器104通信信息和命令选择。例如,输入设备也可为显示器,如配置具有触屏输入功能的LCD显示器。用户输入设备的另一种类型是光标控制116,例如鼠标、轨迹球或光标方向键,用于向处理器104通信方向信息和命令选择和用于在显示器112上控制光标的移动。该输入设备通常在两个轴(第一轴(例如,x)和第二轴(例如,y))上具有二维自由度,其允许设备在平面内指定位置。计算机系统100提供了数据处理并对此类数据提供了置信水平。与本教导中实施方案的某些实施一致,计算机系统100提供数据处理和置信值,以响应处理器104执行的包含于存储器106中的一个或多个指令的一个或多个序列。此类指令可从另一种计算机可读介质,如存储设备110读入存储器106中。存储器106中包含的指令序列的执行导致处理器104进行本文所述的处理状态。或者,硬接线电路可用于代替或结合软件指令以实施本教导的实施方案。因此,本教导中实施方案的实施并不限于硬件电路和软件的任何特定组合。
[0049] 本文所用术语“计算机可读介质”和“计算机程序产品”通常是指参与向处理器104提供用于执行的一个或多个序列或一个或多个指令的任何介质。此类指令,通常被称作“计算机程序代码”(其可以计算机程序或其它分组的形式分组),当执行时,能使计算机系统100进行本发明的实施方案的特征或功能。计算机可读介质的这些形式和其它形式可采用很多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如,固态硬盘、光盘或磁盘,比如存储设备110,易失性介质包括动态存储器,例如存储器106。传输介质包括同轴电缆、铜线和光纤,包括与总线102的连通性。
[0050] 计算机可读介质的常见形式包括例如,软盘、柔性盘、硬盘、磁带或任何其它磁性介质、CD-ROM、任何其它光学介质、穿孔卡、纸带、带有孔图案的任何其它物理介质、RAM、PROM和EPROM、FLASH-EPROM、任何其它存储芯片或盒、如下文所述的载波,或者计算机可读取的任何其它介质。
[0051] 计算机可读介质的各种形式可携带一个或多个指令的一个或多个序列至处理器104用于执行。例如,所述指令最初可携带在远程计算机的磁盘上。所述远程计算机可将所述指令加载到其动态存储器中并用调制解调器通过电话线发送指令。计算机系统100的本地调制解调器可接收电话线上的数据并用红外发射器将数据转换成红外线信号。与总线
102耦合的红外检测器可接收红外线信号中携带的数据并将所述数据置于总线102上。总线
102将所述数据携带至存储器106,从存储器106中,处理器104检索并执行指令。在由处理器
104执行之前或之后,通过存储器106接收的指令可任选存储于存储设备110上。
[0052] 若适用的话,本领域技术人员应认识到,多个实施方案的操作可使用硬件、软件、固件或其组合来实施。例如,可在软件、固件或硬线逻辑的控制下使用处理器或其它数字电路来进行某些处理。(正如本领域技术人员进行所述功能应认识到的,本文术语“逻辑”是指固定的硬件、可编程逻辑和/或其合适的组合)。软件和固件可存储于计算机可读介质上。一些其它处理可利用模拟电路来实施,如本领域普通技术人员所熟知的。此外,存储器或其它存储以及通信元件可应用于本发明的实施方案中。
[0053] 为清楚起见,应理解的是以上描述已参考不同的功能单元和处理器来描述本发明的实施方案。然而,显而易见的是在不损害本发明的情况下可使用不同的功能单元、处理器或域之间功能性的任何合适的分布。例如,说明由单独的处理器或控制器执行的功能可通过同一处理器或同一控制器来执行。因此,提及特定的功能单元仅被视为提及用于提供所述功能的合适方式,而非指示严格的逻辑或物理结构或组织。
[0054] 本教导中用于分析蛋白熔解曲线数据的方法和系统的多个实施方案可运用图2所示的框图中所述的循环仪的多个实施方案。
[0055] 正如前面所提及的,其中蛋白可解折叠的一种方法是通过利用热解折叠,其中随着温度的升高可进行解折叠。本教导中用于分析蛋白熔解曲线的方法和系统的多个实施方案可运用如图2所示框图中所述的热循环仪的多个实施方案。如图2所示,热循环仪可包括置于样品支持设备中含有的多份样品216之上的加热盖214。在多个实施方案中,样品支持设备也可为具有多个样品区的玻璃的、金属的或塑料的载片或基底,其样品区在所述样品区和加热盖214之间有盖。样品支持设备的一些实例可包括,但不局限于多孔板,例如标准的微量滴定的96孔板、384孔板、能够在每次分析时处理几千个样品的微型设备、或微卡、或基本平的支持物,例如各种微流体装置,微卡设备和从例如但不限于玻璃的、金属的或塑料的载片或基底构建的微芯片设备。样品支持设备的多个实施方案的样品区可包括凹陷、凹口、洞、隆起及其组合,以在载片或基底的表面上形成规则或不规则的阵列来定制。热循环仪的多个实施方案可包括样品块218、用于加热和冷却的元件220以及热交换器222。
[0056] 热循环仪的多个实施方案可同时处理多个样品,并且可用于蛋白熔解曲线数据的生成和采集。在图2中,热循环系统200的多个实施方案提供了针对多个生物样品中的各样品的运行时间信号采集的检测系统,在进行用于产生蛋白熔解曲线数据的全部温度范围内。检测系统可具有发射电磁能量的照明源和检测器或成像器210,用于从样品支持设备中的样品216中接收电磁能量。因此,虽然热循环仪可为蛋白熔解曲线数据的生成和采集的可用平台,但本领域技术人员应认识到,具有检测和样品调温能力的仪器可用于产生蛋白熔解曲线数据。
[0057] 控制系统224可用于控制检测器、加热盖和热块组件的功能。所述控制系统可通过热循环仪200的用户界面226由最终用户访问。如图1所示,计算机系统100可用于提供热循环仪的功能的控制以及用户界面功能的控制。此外,计算机系统100可提供数据处理、显示和报告准备功能。所有此类仪器控制功能可局部专用于热循环仪,或者计算机系统100可提供所述控制、分析和报告功能的部分或全部的远程控制。
[0058] 如上所述,大量蛋白熔解曲线数据可作为用于同一运行中分析的大量样品各自的蛋白熔解测定的整个限定的温度范围中收集的检测器信号数据来生成。由于大量的数据,连同蛋白熔解曲线数据的复杂性,本教导中系统和方法的多个实施方案提供了计算机可读介质的实施方案,所述计算机可读介质可从收集为检测器信号输出的初始蛋白熔解曲线数据生成已处理的数据,所述检测器信号输出为样品支持设备中各样品的温度的函数。
[0059] 此外,本教导中系统和方法的多个实施方案提供了计算机可读介质的实施方案,所述计算机可读介质可允许最终用户利用交互式用户界面来灵活地和动态地分析大数据集及其所选子集。此类交互式用户界面可有助于最终用户选择以下:例如但不限于一组新的分析参数,可分析数据的另一方法、为所选的重复的数据集检查数据、以及用于所述重复集的相关统计以及检查哪组数据集可以落入与目标样品集相比的所选阈值内。
[0060] 图3描述了旨在传达这样的过程的输入图/输出图,通过该过程,用于分析蛋白熔解曲线数据的系统和方法的多个实施方案可提供最终用户动态分析蛋白熔解曲线数据的大数据集的能力。如图3所示,初始输入可包括,例如但不限于板设置信息(set-up information)以及在整个运行中对各样品收集的检测器输出信号。板设置信息包括识别样品名称、以及待测试条件例如缓冲液、配体或测试化合物的类型、蛋白样品的类型等。在多个实施方案中,板设置信息稍后可用于识别复孔并展示针对包括重复统计结果在内的各测试条件的最终结果。根据本教导中系统和方法的多个实施方案,板设置信息可作为初始输入由最终用户在分析前输入,并接着可以输入生成结果的自动模式的多个实施方案中的分析引擎中。此类信息提供了条件值,所述条件例如但不限于样品类型、样品浓度、缓冲液类型以及很多其它的测定条件。在多个实施方案中,板设置信息可在运行后通过最终用户利用测定条件的值的手工分配作为二次输入来手动编辑。对于本教导中系统和方法的多个实施方案,分析组可通过最终用户在运行前作为初始输入或在运行后的分析期间作为二次输入来限定。在多个实施方案中,最终用户可从整个样品支持设备(例如微量滴定板)限定样品数据作为分析组。对于多个实施方案,分析组可包含来自多个样品支持设备的样品数据。在多个实施方案中,分析组可由最终用户限定为来自选择的样品区,例如微量滴定板的孔中的样品数据,所述选择的样品区选自一个或多个样品支持设备。在多个实施方案中,选自单个样品支持设备的样品区的样品数据可分成多个分析组。分析组可由在相同或不同的条件下测定的一个样品的数据组成,或可由相同或不同的条件下测定的多个样品的数据组成,或以上的任何组合。因此,本教导中系统和方法的多个实施方案向最终用户提供了限定的动态灵活性,例如但不限于板设置信息、分析组、分析设置和阈值设置。
[0061] 如图3的分析引擎所示,计算机可读介质的多个实施方案可采用初始输入或二次输入并生成已处理的熔解曲线数据,例如但不限于,检测器信号响应相对温度的熔解曲线图、所述熔解曲线图的n阶导数图、Tm的确定、用于提醒最终用户数据的各个方面及其分析的标志、以及由最终用户识别的作为样品重复的样品组的重复组统计结果,其中多个重复组可包含分析组。自动模式或手动模式的分析设置利用初始输入,例如检测器输出信息和板设置信息,其可用于生成如图3所示的各样品的孔水平的结果。最终用户的板设置信息的输入也可用于计算重复水平的结果和统计结果。在用于蛋白熔解曲线分析的系统和方法的多个实施方案中,用户界面可显示来自初始输入的已处理数据的结果。对于本教导中系统和方法的多个实施方案,一旦通过用户界面已复查来自初始输入的已处理的数据的显示情况,最终用户可通过二次输入的选择来改变影响数据处理的参数。根据用于本教导的蛋白熔解曲线分析的系统和方法的多个实施方案,二次输入是继初始输入后发生的任何用户输入。在这方面,对于本教导中系统和方法的多个实施方案,最终用户可反复选择用于分析和显示数据的参数的方式数目并不受限制。此外,最终用户可同时分析来自不同类型的计算机可读介质上存储的任何初始数据的数据。在这方面,最终用户可同时分析来自不同仪器、不同的运行、不同的实验条件或最终用户可期望选择和分析蛋白熔解曲线数据的任何组合的数据。此类参数可包括,例如但不限于:分析设置、阈值分析、分析模式或Tm可如何确定的方法的选择、用于比较样品或重复组的Tm与另一样品或另一重复组的Tm的方法、作为用户选择的实验变量的函数的重复组显示以及作为用户确定的阈值的函数的重复组显示。板设置的相关信息尤其可影响需要多于一个孔的所有结果,以产生如ΔTm、重复水平的标志和统计分析。
[0062] 在图4-图6中,显示了用于分析初始蛋白熔解曲线数据的方法的多个实施方案。在方法300的图3、方法310的图4和方法320的图5的步骤10中,初始蛋白熔解曲线数据的数据集由用于多个样品的处理器来接收。如前面所述,所述初始蛋白熔解曲线数据包括作为多个样品中每一个样品的温度的函数的检测器信号。
[0063] 参考图4-图6,方法300和方法310的步骤20中,可分别进行多个样品蛋白熔解曲线的每一个的预处理以对检测收集的数据进行降噪。如信号处理领域中的技术人员所知悉的,降噪数据可包括例如但不限于以下的处理步骤:清理、归一化、变换、特征提取和特征选择。对于多个实施方案,可进行第一全局平滑(global smoothing)步骤,其中可去除较高频率的噪声元件。在多个实施方案中,可应用傅立叶变换平滑。依照多个实施方案,可进行第二局部平滑。在多个实施方案中,可进行局部回归平滑,其中在限定的窗口内对样品熔解曲线依次进行平滑处理。对于多个实施方案,可基于诸如数据点和系统噪声的数目来选择窗口。依照多个实施方案,可应用局部平滑函数例如但并不限于,二次回归、线性回归和Savitzky-Golay平滑函数。在多个实施方案中,可利用鲁棒二次平滑函数或线性平滑函数。
[0064] 参考方法300的图4的步骤30和方法310的图5的步骤40,对于用于分析蛋白熔解曲线数据的多种系统和方法,在预处理数据的步骤之后,可进行选择分析区域的步骤。
[0065] 根据用于分析蛋白熔解曲线数据的系统和方法的多个实施方案,在确定分析区域的步骤后可将Boltzmann拟合应用于样品蛋白熔解曲线中。根据多个实施方案,可通过以下给出描述Boltzmann拟合的等式:
[0066] FBoltzmann(T)=FT最初+(FT最终-FT最初)/(1+e^[Tm-T/C])(Eq.1)
[0067] 其中:
[0068] FT最初=数据拟合的初始温度的信号幅度
[0069] FT最终=数据拟合的最终温度的信号幅度
[0070] T=T最初和T最终之间任何数据点的温度
[0071] Tm=曲线的蛋白熔融温度;由拟合解出的
[0072] C=常数
[0073] 通过等式1的检查可看出,所述Boltzmann拟合函数在初始温度时具有信号幅度的项并在最终温度时具有信号幅度的项。根据多个实施方案,如方法300的图4中的步骤30和方法310的图5中的步骤40所示,可确定用于拟合数据的初始温度和最终温度限定的分析区域。根据方法310的图5中的步骤30和方法320的图6中的步骤30所示的多个实施方案,可在用于选择分析区域的样品蛋白熔解曲线上进行数据的至少一个n阶导数。在多个实施方案中,可采用数据的一阶导数。对于多个实施方案,可采用平滑化数据的一阶导数,并且可对所述导数信号进一步平滑以去除高频成分。因此,对于多个实施方案,信号的单调上升区域可从该平滑化导数曲线的正的信号值的区域确定。在多个实施方案中,信号上升最长且最陡的区段可选择作为分析区域。在多个实施方案中,可采用数据的一阶导数。对于多个实施方案,可采用平滑化数据的一阶导数。根据多个实施方案,可采用初始数据或平滑化数据的更高阶导数。在多个实施方案中,导数信号可经历多种缩放(例如求逆)以提高信号的数学和/或数据展示性质,从而准确确定分析区域。
[0074] 如方法300的图4中的步骤40和方法310的图5中的步骤50所述,可找到样品曲线的最佳拟合的熔解温度Tm。根据多个实施方案并参照等式1,当已确定最佳拟合时,最佳拟合的Tm可从Boltzmann拟合函数导出。根据多个实施方案,常数C在针对样品蛋白熔解曲线数据的拟合过程中通过自身恒定的过程被解出,其中所述常数在拟合数据至等式1的迭代过程中被限定。对于多个实施方案,当均方误差项会合于阈值时,最佳拟合在拟合过程中可被会合。根据多个实施方案,算法例如Levenberg-Marquardt算法可用于寻找数据(例如蛋白熔解曲线数据)间最小误差的模型的各种参数,并达到对此类数据的非线性最小二乘拟合。
[0075] 对于图4中所示的方法300、图5中的方法310、图6中的方法320和如等式1所示的Boltzmann等式的多个实施方案,可提供针对多种蛋白熔解曲线数据的拟合,其在多种分析属性上具有可变性。对于多个实施方案,分析属性可包括,例如但不限于曲线形状、背景信号、信号幅度的变化和噪声。
[0076] 根据图5的方法310和图6的方法320的多个实施方案,除提供了用于识别分析区域的基础的n阶导数之外,还可利用n阶导数来确定Tm值。根据本教导的多种系统和方法,最终用户可使用利用n阶导数确定的Tm值以与Boltzmann拟合确定的Tm值进行比较。在多个实施方案,最终用户可选择Boltzmann确定的Tm值或n阶导数确定的Tm值。
[0077] 对于图6的方法320的多个实施方案,可将移动的阈值用于n阶导数数据以鉴别峰。对于图6的方法320的多个实施方案,步骤10-30可如前面图4的方法300和图5的方法310的对应步骤所描述的来进行。如本领域的普通技术人员所知悉的,蛋白可经历多相熔解。因此,对于此类蛋白,对于经历多相熔解的蛋白的熔解曲线可确定多个Tm值。根据图4的方法
300和图5的方法310的多个实施方案,最终用户可利用对多种选择的分析区域的Boltzmann拟合来分析多相熔解曲线。此外,最终用户可根据图6的方法320的多个实施方案来分析多相熔解曲线。
[0078] 对于图6的方法320的多个实施方案,在步骤40中,分析区域可在多相熔解曲线的n阶导数图的信号界限R1和R2之内来选择。在多个实施方案中,多相熔解曲线的n阶导数图的界限R1和R2可为信号值的约20%-约99%。对于多个实施方案,多相熔解曲线的n阶导数图的界限R1和R2可为信号值的约10%-约99%。对于多个实施方案,可选择下限,使得从背景噪声中区别开来的分析信号处或分析信号之上是清楚的。在多个实施方案中,最终用户可选择多相熔解曲线的n阶导数图的界限R1和R2。
[0079] 根据图6的方法320的多个实施方案,在步骤50中,阈值可以逐步的方式在多相熔解曲线的n阶导数图的界限R1和R2之内顺序移动。根据多个实施方案,以逐步方式采集的阈值数量可为约50个阈值-约1000个阈值。在多个实施方案中,以逐步方式采集的阈值数量可为约200个阈值-约600个阈值。对于多个实施方案,以逐步方式采集的阈值的数量可由最终用户选择。例如,多相熔解曲线的n阶导数图中可具有诸如肩峰和噪声的特征,其可在测定与测定以及仪器与仪器之间变化。对于具有小肩特征的多相熔解曲线的n阶导数图,必需进行更多数量的步骤以分析此类特征。相比之下,对于噪声数据,步骤太多可导致分析伪像。此外,增加以逐步方式在信号界限R1和R2之间采集的阈值数量的数量增加了分析时间。
[0080] 根据图6的方法320的多个实施方案,在步骤50中,峰可鉴别为落在任一步骤的任一阈值的阈值之上的连续区域。在多个实施方案中,对于其中在由最终用户检查的数据中可明显目测到一个以上的峰的连续区域,幅度最大的峰可计作该步骤的峰。例如,在图7中,描绘了蛋白的多相熔解的一阶导数图,线I-VI中的每一个表示四个不同步骤中选择的阈值。对于顺序阈值I-II中的每一个,峰可定义为所述阈值以上的连续区域。例如,在图7中,在步骤1的阈值I处,将确定2个峰(P1和P2),而在步骤2的阈值II处、将确定3个峰(P1、P2和P3)。然而,在步骤3的阈值III处,存在包括P2和P3的连续区域,因此仅计数最大幅度的峰P2。接着,对于步骤3的阈值III,计数2个峰(P1和P3)。最后,在步骤6的阈值VI中,计数3个峰(P1、P2和P3)。
[0081] 对于图6的方法320的多个实施方案,阈值可以逐步的方式在多相熔解曲线的n阶导数图的界限R1和R2之间顺序移动,并确定计数的峰的频率。根据多个实施方案,可基于峰计数的最高频率得到归一化值,如:
[0082] Norm=max(N1,N2,......Nn)
[0083] 在该表达式中,N1,N2,......Nn表示在多相熔解曲线的n阶导数图的界限R1和R2之间顺序移动阈值的逐步计数中所计数的峰(P1,P2,......Pn)的次数。此外,对于图3的方法120的多个实施方案,可将每个峰的峰检测频率值确定为:
[0084] Γ(n)=N1/max(N1,N2,......Nn),N2/max(N1,N2,......Nn),...Νn/max(N1,N2,......Nn)
[0085] 在该表达式中,每个峰的峰检测频率确定为顺序移动阈值的逐步计数中所计数的峰的次数除以归一化值的商。
[0086] 根据图6的方法320的多个实施方案,可在Γ(n)上设置弃却限(rejection limit),使得具有比选择界限小的值的任何峰不被计入:
[0087] X%=Nr/max(N1,N2,......Nn)
[0088] 在多个实施方案中,所述弃却限X%,可为约0.5%-约6%。在多个实施方案中,最终用户可选择弃却限。图3的方法120的多个实施方案的实例描述于图8中。在图8中,采用19个顺序逐步的阈值,并在19个阈值的每个当中确定峰的数量。在该实例中,P1计数为3次,Γ(1)为16%,P2计数为1次,Γ(1)为5%,并且P3计数为19次,Γ(1)为100%。对于设置为2%的弃却限,该实例中的所有峰将选择作为具有由一阶导数峰值确定的Tm值的峰。对于设置为6%的弃却限,应去除P2,而2个峰,P1和P3将选择作为具有由一阶导数峰值确定的Tm值的峰。
[0089] 在本教导的用于分析蛋白熔解曲线数据的系统和方法的多个实施方案中,并且关于方法300的图4的步骤50,和分别为方法310和320的图5和图6的步骤6,图3所示的分析引擎,可产生已处理的数据。正如前面所讨论的,所述分析引擎可从初始输入和二次输入中生成已处理的数据,其中二次输入为继初始输入后发生的任何用户的输入。在这方面,对于本教导中系统和方法的多个实施方案,最终用户可反复选择用于分析和显示数据的参数。此类参数可包括,例如但不限于:分析设置、阈值分析、Tm可如何确定的方法、用于比较样品或重复组的Tm与另一样品或另一重复组的Tm的方法、作为用户选择的实验变量的函数的重复组显示以及作为用户确定的阈值的函数的重复组显示、以及通过最终用户作为二次输入而输入的板设置信息。在这种方式下,最终用户可交互和反复分析潜在的大的蛋白熔解曲线数据集的运行分析之中和之间产生的数据和数据子集。在这方面,最终用户可同时分析来自不同类型的计算机可读介质上存储的任何初始数据中的数据。因此,最终用户可同时分析来自不同仪器、不同运行、不同实验条件或最终用户可期望选择和分析蛋白熔解曲线数据的任何组合的数据。由此产生的结果可以图形显示并另外以表格格式呈现。根据多个实施方案,如随后将更详细讨论的,此类图形显示和表格显示可以在同一显示器上动态同步化。因此,选择表格形式上的行输入将突出显示图形显示区上的对应图。在多个实施方案中,最终用户可独立放大任何图形,用于信息的详细复查。对于多个实施方案,以表格格式显示的信息可通过以下来分类:例如使用鼠标或按键以选择作为列标题名称输入的多个特性中的任何一个,从而提供了待被选择的特性进行分类的表格格式的信息。
[0090] 例如,从等式1的检查可看出,所述Boltzmann拟合函数在初始温度时具有信号幅度的项并在最终温度时具有信号幅度的项。根据图9中所示的多个实施方案,对于数据的Boltzmann拟合430与数据的n阶导数435的比较,交互式GUI400可提供限定初始410和最终420的温度范围的分析区域的显示。在多个实施方案中,可采用数据的一阶导数,如图9中所示。对于显示了数据的Boltzmann拟合430与数据的一阶导数435相比的交互式GUI的多个实施方案,所述数据可动态同步到样品的数据列表450。对于多个实施方案,样品线452可由最终用户在表中突出显示,其允许相应数据440、445分别在Boltzmann拟合数据集430和数据的一阶导数集435中清晰可见。在多个实施方案中,最终用户可选择任何线或线的组合用于相应图的选择性复查。样品表450上另外显示的是标志图标的实例,454,其可提醒最终用户影响数据质量和数据分析的因素数目,如将在随后进行更详细的讨论。样品的数据列表450与数据图430、435的动态同步,可有利于最终用户视觉评估所选的数据组,并可允许此类评价的快速重复。例如但不限于,此类动态同步可允许最终用户去评估Boltzmann是否为所选数据组的合适拟合。此外,提醒最终用户影响数据质量和数据分析的因素的标志可有利于最终用户复查影响分析的整体质量的关键问题。
[0091] 虽然在图9中,由最终用户动态选择的图在Boltzmann拟合图440和一阶导数图445中被突出显示,允许比较全部数据集,但在本教导中交互式GUI的多个实施方案中,如图10A和图10B所示,交互式GUI500,可允许最终用户从弹出式窗口580(图10A)作出选择,其允许只查看选择的Boltzmann拟合数据540和相应的一阶导数数据545(图10B)。除了在所分析的所有数据背景下复查的孔水平的数据之外,最终用户可希望评价多种实验条件下的数据。为此,待研究的测定条件可由最终用户用颜色关联来输入。
[0092] 这些颜色关联可通过分析引擎保留并可在图11所示的图示中启用,其中曲线为由特定条件的属性值编码的颜色。图11中所示的显示中所用的数据作为其中变化染色浓度的时间-进程研究生成,故变量显示了颜色编码以指示时间和染色浓度的用途。根据多个实施方案,可通过最终用户从例如下拉菜单中选择不同的条件类别。根据多个实施方案,最终用户可用颜色以进一步提高数据分析,同时保持表格和图形格式之间同步的交互性,正如前面结合图3所讨论的,若最终用户在数据复查过程中编辑板设置的细节;则应考虑此类二次输入并且用于展示属性的颜色的应用将重新展示为编码孔水平的属性值的新的颜色。
[0093] 如图11中所示,分析区域由第一温度选择410和第二温度选择420所限,其可被自动确定或由最终用户手动确定。在图11中,两组曲线,430和432采自研究的同一时间点,但指示染色浓度的差异。如图11中所示,曲线435和437分别为曲线430和432的一阶导数图。样品表450表示选自多个样品支持设备中单个样品支持设备的样品数据的信息,所述样品支持设备用于限定图11部分示出的数据的分析组。
[0094] 正如前面所提及的,分析组可由最终用户以多种方式选择。调用,最终用户可限定来自整个样品支持设备例如微量滴定板的样品数据作为分析组。对于多个实施方案,分析组可包含来自多个样品支持设备的样品数据。在多个实施方案中,分析组可由最终用户限定为来自选择的样品区,例如微量滴定板的孔中的样品数据,所述选择的样品区选自一个或多个样品支持设备。在多个实施方案中,选自单个样品支持设备的样品区的样品数据可分成多个分析组。分析组可由在相同或不同的条件下测定的一个样品的数据组成,或可由相同或不同的条件下测定的多个样品的数据组成,或以上的任何组合。此外,分析组可由最终用户在运行前作为初始输入并在运行分析后作为二次输入来限定。虽然出于阐述的目的,但从图11的该研究中展示两组样品数据;窗470表明展示所包括的样品数据采自352样品区限定的分析组,在该实例中,样品孔,采自多个样品支持设备,在该实例中,为微量滴定板。在多个实施方案中,限定分析组的样品数据可选自约1-约100个样品支持设备。因此,本教导中系统和方法的多个实施方案向最终用户提供了交互式显示和动态分析大量且复杂的数据量的能力。
[0095] 正如前面所讨论的,蛋白熔解数据可受多种分析属性的影响,例如但不限于曲线形状、背景信号、信号幅度的变化和噪声。此外,蛋白作为一类生物聚合物可具有复杂的熔解曲线,这是由于三级和四级的折叠基序上一级结构和二级结构的复杂性。在这方面,向最终用户提供以连续且快速的方式通过交互式GUI来评价多个样品的复杂的蛋白熔解曲线数据的灵活性,可有助于数据分析过程。
[0096] 根据本教导中交互式GUI的多个实施方案,最终用户可进行交互式选择,其使得能够对蛋白熔解曲线实验中的多个样品的数据进行快速且连续的评价。例如如图12中的GUI600所示,对于曲线640,曲线640的Boltzmann拟合确定的Tm642对比通过n阶导数645确定的Tm644的评价,可向最终用户提供用于评价Boltzmann拟合是否适合于待评价数据的工具。如该实例中可见,Boltzmann拟合640确定的Tm642与由一阶导数645确定的Tm644是相当接近的。然而,正如随后将讨论的,由于蛋白熔解数据的复杂性,所述比较可向最终用户提供决定Tm可被如何确定的工具。
[0097] 正如前面所提及的,在确定分析区域的步骤之后,蛋白熔解曲线数据的Tm的确定情况可从Boltzmann拟合数据进行。根据本教导中图13的交互式GUI700的多个实施方案,最终用户可容易且反复地改变Boltzmann图的分析区域并同步n阶导数图,比如一阶导数图。这可通过,例如但不限于拖拉并标记交互式工具来完成。此类交互式工具将允许最终用户通过移动初始第一边界710至新的第一边界711来选择分析的新的分析区域。此外,最终用户通过移动初始第二边界720至新的第二边界721来选择分析的新的分析区域。对于本教导中系统和方法的多个实施方案,如图3所示,接着分析引擎可根据最终用户的新的输入来生成并显示数据。分析区域的反复选择可给最终用户提供理解分析区域的选择对蛋白熔解曲线数据的Tm的确定的影响的快速、可视的工具。
[0098] 虽然利用Boltzmann拟合确定的Tm的比较可通过检查其与利用n阶导数例如一阶导数确定的Tm的确定的关系来评价,本教导中交互式GUI的多个实施方案还可为此类评价提供另外的工具。根据图14的交互式GUI800的多个实施方案,Boltzmann拟合810与数据曲线840可同时在视觉上呈现,并与n阶导数曲线,比如一阶导数曲线845同步。如前面图12所讨论的,从Boltzmann拟合数据810确定的Tm842可直接与从n阶导数曲线845确定的Tm844比较。
[0099] 蛋白结构的复杂性使其适合多相熔解曲线,对此,对于每次相变都可确定Tm。这样的一组多相数据描述于图14和图15中。对于此类多相熔解曲线数据,Boltzmann拟合也许并非是合适的拟合模型。在图15的交互式GUI900的多个实施方案中,最终用户可从样品表950选择数据的子集952,对于多相样品熔解曲线集935,该数据的子集952可在视觉上变得明显940,并与n阶导数曲线集935同步明显945。以该方式,最终用户可从样品表952中依次选择任何一组数据,并查看熔解曲线集930中的数据和n阶导数曲线集935中的数据。此类交互GUI显示可允许最终用户容易地确定显示出多相熔解谱的蛋白的每个相变的Tm。
[0100] 或者,如图16的交互式GUI1000所示,最终用户可专门选择以便仅显示样品表中选择的数据子集。依照本教导中交互式GUI的多个实施方案,最终用户可在限定的分析区域内评价熔解曲线1040的Boltzmann拟合1025,所述限定的分析区域具有第一边界1010和第二边界1020,并具有该选择的拟合确定的Tm1027。对于GUI1000的多个实施方案,可同步显示导数曲线1045。正如通过图16的检查可看出,选择作为分析模式或分析方法的Boltzmann拟合的此类Tm的确定可以与单独确定的各相的Tm显著不同。
[0101] 如前面所提及的,本教导中系统和方法的多个实施方案可利用图形显示中的颜色为最终用户提供用于视觉识别例如但不限于,各种实验条件的工具。因此,研究的属性或条件的离散值可为由最终用户在板设置信息中的输入编码的颜色。如图16所示,颜色还可用于区分拟合曲线1025和多相曲线1040。因此,本教导中系统和方法的多个实施方案可运用用于样品数据的图形显示的多种格式选择,例如颜色或线条类型,以向最终用户提供根据多个变量很容易视觉区分样品数据的各种图形条目的便利。
[0102] 此外,如前面图13所讨论的,对于图15的GUI900或图16的GUI1000,最终用户可运用交互式工具来选择多相熔解数据中每相的分析区域。
[0103] 如图所示,例如但不限于,图9对比图15,似乎图9的多条熔解曲线430的基线是基本对齐的,而似乎图15的多条熔解曲线930的基线似乎在纵坐标值的范围内移动了。根据本教导的多个实施方案,最终用户可即时对齐曲线。分别如图17A和图17B的交互式GUI1100和交互式GUI1110所示,最终用户可从弹出框(未示出)中选择用于对齐曲线1140A和1140B的对齐功能,如图17A所示,导致如图17B中所示的对齐结果。在多个实施方案中,一旦最终用户选择对齐功能,则计算出平均纵坐标偏移量,并接着将选择曲线集中的曲线调整至平均值,从而使其对齐,如图17B所示。此类基线对齐特征可,例如,允许最终用户在视觉上比较选择的曲线集中的曲线之间的异同。例如但不限于,此类基线对齐特征可允许最终用户评价x偏移量,或者可允许评价选择的数据集中曲线形状的差异。
[0104] 本教导交互式GUI的多个实施方案可有助于理解实验变量对蛋白熔解数据集中的多个样品的影响。此类变量可包括,例如但不限于,中性盐的类型和浓度、离液剂的类型和浓度、缓冲液类型;pH和浓度、蛋白样品和分析组。对于用于分析蛋白熔解曲线数据的系统和方法的多个实施方案,如图3所述,分析引擎可确定所选的分析组的多个重复组的统计数据。此类重复组的统计数据可包括,例如但不限于,集中趋势的表示,例如平均值和中值以及方差的表示,如标准偏差和CV%。如图3所述,接着可将从初始输入或二次输入中确定的此类重复组的统计数据显示于交互式用户界面上。
[0105] 例如,本教导中交互式界面的多个实施方案可如图18中的框I-框III显示。在图17上面的两个框中,图(I)是一组参考重复样品的重复组统计数据的视觉描绘。对于用户选择的重复数据集上的分析引擎生成的重复组统计数据,可在视觉上表示重复组的统计数据。
[0106] 根据本教导中交互式GUI的多个实施方案,如图18中所示,重复组的统计数据可部分直观表示为如图(I)中所示的菱形图。对于该菱形图,Tm值的平均值由第一垂直线与第一组顶点相交表示,而与水平线相交的第二组顶点表示所述平均值的95%置信区间。由用户选择的重复数据组上的分析引擎产生的Tm值的中值描述为第二条不同的垂直线。对于该实例,图(I)的重复组统计数据利用如前面所述的计算机和仪器系统的多个实施方案的单独分析运行的两个单独的样品支持设备上运行的一组参照样品的用户选择的数据来产生。来自每个板上每个样品的重复Tm值可很容易地作为由白圈画出的第一组和由黑圈画出的第二组直观确定。例如Tm值的集中趋势和方差的直观显示可容易地允许最终用户来评价,例如,数据质量。例如,由“X”表示的数据点是根据分析标志由最终用户选择被忽略的数据点,其随后将更详细地讨论。此外,重复组统计数据的Tm值的直观比较可允许即时理解实验结果。在这方面,图18的图II中显示的图,是选择用于与图1的参考组样品比较的实验组样品。如图所示,一目了然,最终用户可容易比较参考组和实验组的重复组统计数据。例如但不限于,最终用户可容易一目了然地辨别出,实验组样品的平均Tm比参考组样品的平均Tm转移到更高的温度。另外,菱形图的形状在视觉上大致相同,表明两个数据集的方差大致相同。根据本教导的系统和方法的多个实施方案,多种几何形和线形、颜色和格式可用于直观地赋予最终用户重复组蛋白熔解曲线数据。
[0107] 在图18中,图III显示了具有三相熔解的数据集的重复组统计数据的交错集。正如随后将更详细讨论的,对于此类多相蛋白熔解转变,可确定每次转变的平均Tm并将相关的直观方差反映于用户界面中。
[0108] 如前面在图9的标志454的实例中讨论的,用于分析蛋白熔解曲线数据的系统和方法的多个实施方案提供用于提醒最终用户,例如但不限于关于初始数据的属性(例如信号质量)、多相检测以及分析问题(例如曲线拟合和重复组比较的问题)。在图19中,显示了可提醒最终用户的一些类型的问题的表格。正如图19中可看出的,对于蛋白熔解曲线分析的系统和方法的多个实施方案可确定的每个类型的问题,可选择图标。接着图标与标志的关联可作为样品运行的完全数目或其任何子集的即时直观提醒。这些标志的子集是孔-水平的(样品水平的)标志,根据图3,其不会通过板设置编辑改变,其可通过最终用户作为二次输入来输入。其余的重复组标志通过板设置编辑改变,其可改变包括重复组在内的样品的命名。
[0109] 对于图20的交互式GUI1200的多个实施方案,可向最终用户提供除样品孔表1250之外的重复组表1260,正如前面所讨论的。重复组表1260可包括属于样品蛋白1264的确定组1262的重复样品的选择,以及多种实验变量(1266,1268)的选择。根据本教导中的系统和方法的多个实施方案,可查看重复组数据(1230-1236),例如,选择的实验变量1270-1276组的Tm值,所述实验变量在GUI1200中可作为缓冲液、盐、分析组和蛋白分别显示。所述重复可通过菱形图1230-1236表示,其如前面所讨论的,直观传达了重复组集中趋势和方差相关的重要信息。非重叠的菱形图直观显示了实验变量可对所选重复组的Tm值的影响,例如如图13所示。如图9的交互式GUI1200中所示,实验变量显示于重复组表1260中以及邻近所述重复组数据(1230-1236)的显示中。
[0110] 在本教导交互式GUI的多个实施方案中,弹出框可用于改变变量的顺序,以及由此的层次结构。这可允许最终用户连续且迅速更改实验变量并评价所述变量对选自一组蛋白熔解样品的重复样品的影响的能力。例如,在图21和图22中,证明了这种改变。对于图21,交互式GUI1300的多个实施方案可具有条件层次树弹出框1380,其显示了变量的选择。最终用户可选择任何实验变量并接着移动所选变量1395至新的位置,如条件层次树弹出框1390中所示。在图22中,缓冲区已移至另一位置,以致可观察到新的一组菱形图1430-1436与图20的菱形图1230-1236形成明显对比。图22的变量1470-1476的排序相对于图20的变量1270-1276的排序现已重置。在图23中,已对GUI1500的1570-1576进行顺序的另一种选择。清楚的是最终用户可容易地挑选出与例如盐的浓度相比作为分析组的函数的菱形图1530-1532的移位,如图22所示。
[0111] 图24A-图24C描述了展示具有双相熔解谱的蛋白的重复参考组数据和实验数据的已处理数据的交互式GUI1600的多个实施方案。在图24A中,GUI1600的多个实施方案可显示第一组蛋白熔解曲线1630和对应的第一组导数曲线1635。此外,多个实施方案可向最终用户提供蛋白熔解曲线的另外一组或多组的选择,如蛋白熔解曲线集1630'和对应的一组导数曲线1635',这可同时用第一组观察。在此方式下,最终用户可动态比较例如利用不同的实验条件采集的数据集,或采集自不同的运行的数据集。对于用于分析蛋白熔解曲线数据的系统和方法的多个实施方案,第一曲线集在视觉上看起来比选择的第二曲线集更明显,这允许集中于第一组的交互式分析,但同时保持对第二组的视觉参考。在图24A中,例如,第一参考组蛋白熔解曲线1630和相应的导数曲线1635比实验组的蛋白熔解曲线1630'和相应的导数曲线1635'更明显。对比GUI1610的图24B,实验组蛋白熔解曲线1630'和相应的导数曲线1635'已被最终用户选择用于查看分析,并且看起来比参考组蛋白熔解曲线1630和相应的导数曲线1635更明显。此外,最终用户能选择参考组蛋白熔解曲线的分析区域,如图24A和图24B所示。在图24A中,例如,对于参考组蛋白熔解曲线,蛋白熔解的第一相由1610-
1620选择的区域界定,而对于蛋白熔解的第二相,已选择由1611-1621界定的区域。
[0112] 在图24C中,对于交互式GUI1700的多个实施方案,针对显示出双相熔解的蛋白描述了重复组的统计数据,如图24A和图24B所示。在顶部的视图中,第一菱形图1730和第二菱形图1732描述了如图24A所示的选择曲线1630的第一熔融相和第二熔融相的重复组统计数据。在底部的视图中,第一菱形图1740和第二菱形图1742描述了如图24B所示的选择曲线1630’的第一熔融相和第二熔融相的重复组统计数据。例如,配体实际上相对于天然蛋白熔解1730-1732可转移峰1740,1742。根据本教导的系统和方法的多个实施方案,通过使用重复组可视化的多个实施方案,最终用户可容易观察此类比较。
[0113] 除了即时检查实验变量对来自多个样品的所选重复组的影响之外,菱形图可结合最终用户限定的阈值进行评价。对于图25A的GUI1800的多个实施方案,最终用户可选择弹出框1880。根据本教导中系统和方法的多个实施方案,正点击设置框1882,可允许最终用户选择由数据的曲线拟合的方法限定的△Tm1884的负阈值,以及选择由n阶导数限定的△Tm1886的负阈值。例如在图25A的GUI1900中,最终用户想要特别突出显示,任何重复组都具有低于参考Tm不到3个单位的Tm。在图25B的GUI1900中,如此选择阈值可允许最终用户查看在所选参考的所选阈值以下的组的菱形图1940-1948的位置。在图25B的GUI1900中,显示了参考菱形图1930。尽管实验组1940-1948的菱形图被突出显示为落入所选阈值以下,但菱形图1932清楚地落在选择范围之外。在这方面,菱形图1940-1948被直观地突出显示为最终用户感兴趣的重复组。
[0114] 此外,如图26A和图26B中所示,最终用户还可选择正阈值。对于图26A的GUI2000的多个实施方案,最终用户可选择弹出框2080。根据本教导中系统和方法的多个实施方案,正点击设置框2082,可允许最终用户选择由数据的曲线拟合的方法限定的△Tm2084的正阈值,以及选择由n阶导数限定的△Tm2086的正阈值。例如在图26A的GUI2000中,最终用户想要特别突出显示,任何重复组都具有高于参考Tm大于2个单位的Tm。在图25B的GUI1900中,如此选择阈值可允许最终用户查看所选参考的所选阈值以下的组的菱形图1940-1948的位置。在图26B的GUI2100中,显示了参考菱形图2130。尽管实验组2140-2147的菱形图被突出显示为落在所选阈值以上,但菱形图2132-2136清楚地落在选择范围之外。在这方面,菱形图2140-2147被直观地突出显示为最终用户感兴趣的重复组。
[0115] 根据图25A、图25B、图26A和图26B中所述的本教导中的交互式GUI的多个实施方案,此类交互式GUI可容易允许最终用户来评估一组实验值是否有期望的效果。例如,若实验设计为查看一组变量是否可增加或减少选择的重复组的Tm值,则可设置预期值的阈值,并针对所述预期阈值来评价菱形图。
[0116] 最后,关于图4的步骤60以及图5和图6的步骤70,如前面所讨论的,并且如本领域的普通技术人员可很容易认识到的,有多种以利用许多设备的多种格式向最终用户输出蛋白熔解曲线信息的方式,例如但不限于熔解曲线图、Tm值和△Tm值。例如,关于蛋白熔融曲线信息的格式,所述信息可以图表格式,书面报告或其组合示出。关于输出设备,蛋白熔融曲线信息可输出至设备,例如但不限于打印机、阴极射线管(CRT)显示器、液晶显示器(LCD)和发光二极管(LED)显示器。
[0117] 尽管用于分析蛋白熔解曲线数据的系统和方法的多个实施方案的原则已结合特定的实施方案描述,但是应清楚理解的是,这些描述仅通过实例的方式作出而并非旨在限制本发明的范围。本文已公开的内容已出于阐述和描述的目的提供。其并不旨在穷尽或限制公开至所描述的精确形式。很多修改和变化对于本领域技术人员而言是显而易见的。选择和描述所公开的内容是为了最好地解释所描述领域中的公开实施方案中的原则和实际用途,从而使本领域技术人员理解适合预想的具体用途的各种实施例和各种修改。公开的范围旨在由所附权利要求和其等同物来限定。