处理质谱数据的方法转让专利

申请号 : CN200580040696.X

文献号 : CN101088096B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : O·兰格M·W·森柯

申请人 : 萨默费尼根有限公司

摘要 :

一种处理傅里叶变换质谱(FTMS)数据的方法包括,对时域瞬变的一部分执行傅里叶变换,并标识来自经变换的数据信号中表示离子的存在的峰值。一旦标识了峰值,然后变换全部瞬变,且在部分瞬变变换中标识的峰值被用于定位经变换的全部瞬变中的真正峰值。找出由随机噪声引起的“假”峰值的数目以与分辨率相关,使得使用部分瞬变来标识真正峰值减少了包括假峰值的风险;然而当全数据集被变换时,该信息可应用于全数据集。作为替换,全数据集的替换、不同部分可被变换并使之相关;因为任何噪声是随机的,因此假峰值应出现在两个部分变换的不同位置处。

权利要求 :

1.一种处理具有周期性信号的质谱数据的方法,包括:

a.对于一质荷比范围获得时域中的质谱数据集;

b.将所获得的时域中的质谱数据集的子集变换到频域;

c.对所述频域数据子集的大小应用第一阈值,以区分噪声数据区域和指示具有所述范围的质荷比的离子的存在性的峰值数据区域,以及找出经区分的峰值数据区域的所述质荷比;

d.将所获得的时域中的质谱数据集变换到频域;

e.通过将经区分的峰值数据区域的信号参数与在相同质荷比下的经变换的质谱数据集的信号特性进行比较,标识所述经变换的质谱数据集内与步骤(c)中标识为经变换的数据子集的经区分峰值数据区域具有相同质荷比的区域。

2.如权利要求1所述的方法,其特征在于,还包括:

存储和/或显示来自所述经变换的质谱数据集的、位于所述步骤(e)中所标识的区域内的数据,以及将那些区域外的数据作为噪声而拒绝。

3.如权利要求1或权利要求2所述的方法,其特征在于,还包括对频域中所述经变换的质谱数据集的大小但仅在其所述所标识区域中应用第二阈值内以进一步区分噪声数据区域和峰值数据区域。

4.如权利要求3所述的方法,其特征在于,所述第二阈值等于或小于所述第一阈值。

5.如权利要求1所述的方法,其特征在于,所述子集是在获取其余的质谱数据之前获取的所述质谱数据集的一个初期获取部分。

6.一种处理具有周期性信号的质谱数据的方法,包括:

a.对于一质荷比范围获得时域中的质谱数据集(100);

b.将所述时域中的质谱数据集的第一时域数据子集变换到频域(110);

c.将所述时域中的质谱数据集的第二时域数据子集变换到频域(130),所述第二时域数据子集与所述第一时域数据子集相同或不同;

d.对第一时域数据子集变换到频域后的第一频域数据子集的大小应用第一阈值(120);

e.对第二时域数据子集变换到频域的第二频域数据子集的大小应用第二阈值(140),其中第一阈值和第二阈值被安排为区分噪声数据区域和指示具有所述质荷比(m/z)范围内的质荷比的离子的存在性的峰值数据区域,以及找出经区分的峰值数据区域的所述质荷比;

f.将经变换和阈值化的第二频域数据子集中的经区分的峰值数据区域的信号参数与在相同质荷比下的经变换和阈值化的第一频域数据子集的信号特性进行比较,以便标识每一频域数据子集所共有的峰值。

7.如权利要求6所述的方法,其特征在于,在将所述第一和第二频域数据子集进行比较的步骤(f)之后,所述方法还包括以下步骤:g.将所述质谱数据集的所有数据从时域变换到频域(160);以及h.对所述质谱数据集的所有数据变换到频域后的频域质谱数据集应用第三阈值,以区分噪声数据和指示具有所述质荷比(m/z)范围内的质荷比的离子的存在性的峰值数据,所述第三阈值应用于经区分的峰值数据区域中(170)。

8.如权利要求7所述的方法,其特征在于,还包括将所述经变换的频域质谱数据集中在每一标识峰值的区域以外的数据作为噪声数据而拒绝。

9.如权利要求7或权利要求8所述的方法,其特征在于,所述第一和第二时域数据子集是时域中所述质谱数据集的不重叠的子集。

10.如权利要求7或权利要求8所述的方法,其特征在于,所述第一和第二时域数据子集彼此重叠。

11.如权利要求10所述的方法,其特征在于,所述第一时域数据子集是所述第二时域数据子集的子集,反之亦然。

12.如权利要求6所述的方法,其特征在于,所述比较步骤(f)还包括:i.将所述第一频域质谱数据子集中的峰值的位置与所述第二频域质谱数据子集中峰值的位置进行比较;以及j.标识在所述第一和第二频域数据子集的每一个中具有相同位置的那些峰值(360)。

13.如权利要求6所述的方法,其特征在于,所述比较步骤(f)还包括:k.将所述第一频域数据子集中的峰值的相位与所述第二频域数据子集中的峰值的相位进行比较;以及l.标识在所述第一和第二频域数据子集的每一个之间相位一致的那些峰值。

14.如权利要求6所述的方法,其特征在于,所述比较步骤(f)包括:将所述第一频域数据子集中所有的质谱数据与所述第二频域数据子集中所有的质谱数据进行比较。

15.如权利要求6所述的方法,其特征在于,所述比较步骤(f)包括:将所述第一频域数据子集中在所述第一阈值之上的数据与所述第二频域数据子集中在所述第二阈值之上的数据进行比较。

16.如权利要求7所述的方法,其特征在于,除所述比较步骤(f)以外,所述方法在步骤(g)之后,步骤(h)之前还包括:(m)从所述频域质谱数据集中减去与每一标识的峰值有关的数据(275)。

17.如权利要求7所述的方法,其特征在于,所述方法还包括:在应用所述第三阈值(170)之后仅存储来自所述频域质谱数据集的峰值数据(180)。

18.如权利要求17所述的方法,其特征在于,还包括存储超出所述第一、第二和第三阈值的峰值数据,并将来自所述频域质谱数据集的其余数据作为噪声而拒绝(295)。

19.如权利要求6所述的方法,其特征在于,还包括:

从时域质谱数据到频域的任何变换是从由傅里叶变换、哈达玛变换和拉普拉斯变换构成的组中选择的。

20.一种处理具有周期性信号的质谱数据的方法,包括:

(a)对于一质荷比范围在时域中获得一质谱数据集;

(b)将所述时域数据集的第一时域数据子集变换到频域;

(c)将所述时域数据集的第二时域数据子集变换到频域;

(d)将所获得的时域数据的全时域数据集变换到频域;

(e)对第一和第二时域数据子集变换到频域后的第一和第二频域数据子集的至少其中之一的大小应用第一阈值以便标识所述数据中包含峰值数据的一个或多个区域,其中第一阈值被安排为区分噪声数据区域和指示具有所述质荷比(m/z)范围内的质荷比的离子的存在性的峰值数据区域,以及找出经区分的峰值数据区域的所述质荷比;以及(f)将经变换和阈值化的第一频域数据子集中的经区分的峰值数据区域的信号参数与在相同质荷比下的经变换的第二频域数据子集的信号特性进行比较,以标识所述频域数据子集中的每一个所共有的峰值。

21.如权利要求20所述的方法,其特征在于,还包括标识所述全时域数据集变换到频域后的全频域数据集中的数据中与由步骤(e)或步骤(f)标识的每一区域相对应的一个或多个区域。

22.如权利要求20所述的方法,其特征在于,还包括标识所述全时域数据集变换到频域后的全频域数据集中与由步骤(e)且由步骤(f)标识的每一区域相对应的一个或多个数据区域。

23.如权利要求21或22所述的方法,其特征在于,还包括存储来自所述全时域数据集变换到频域后的全频域数据质谱数据集中由步骤(e)和/或步骤(f)标识的数据区域。

24.一种傅里叶变换质谱仪,包括被配置成实现如权利要求1到23中任一项所述的方法的数据处理装置。

25.一种液相色谱质谱仪,包括被配置成实现如权利要求1到23中任一项所述的方法的数据处理装置。

说明书 :

处理质谱数据的方法

[0001] 发明背景
[0002] 本发明涉及处理质谱数据的方法,尤其但非排他地涉及处理从傅里叶变换离子回旋共振质谱法(FTMS)中获得的数据。
[0003] 一般光谱测定法,尤其是质谱法产生极其丰富的数据集。这对诸如使用双聚焦磁扇形质谱测定法(double focussing magnetic sector mass spectrometry)、飞行式质谱测定法(time-of-flight mass spectrometry)以及傅里叶变换质谱测定法(FTMS)获取的数据等高分辨率质谱数据尤其如此。例如,从FTMS中m/z200-2000的标准采集涉及对一百万个数据点的测量。每秒一次扫描的测量(液相色谱法/质谱测定法(LC/MS)应用中典型的)导致以7.2GB/小时(约170GB/天)的速率生成原始数据。
[0004] 一般,这些光谱被存储在计算机存储器或替换计算机可读介质中,因此需要大量存储器以便存储。这样的光谱数据的大部分(可能99%)不包含有价值的信息,而主要包含除其总体幅度和标准偏差以外的无分析价值的噪声。
[0005] 目前,质谱仪或者存储整个数据集,或者可能尝试以两种方式之一来减小数据集的大小。
[0006] 第一种方式仅存储质谱中找到的峰值的列表(即,存储每一峰值的位置和大小)。这种方法的缺点在于用户或软件不能重新评估数据以获取诸如峰形、背景、信噪比或不能在没有附加假设的情况下生成的其它信息等进一步的特性。当进一步手动或自动处理信息时,关于光谱的非峰值部分的信息是非常有价值的。信噪比给出关于事件重要性的重要提示。此外,对可以使用远超出仅一组内的峰值的位置和强度的自动化处理的技巧来评估光谱的熟练用户,峰值组非常有益。
[0007] 减小要存储的数据文件的大小的第二种方法通过操作员预选阈值以及软件仅存储光谱中其值大于该阈值的数据点来实现。如果操作员正确地猜测了阈值,则将仅存储属于峰值的数据点。这具有保存关于峰形的信息的优点。然而,该方法的缺点在于,它依赖于操作员的技巧来正确设置阈值水平。如果阈值水平设置得太低,则一般将连同峰值数据点一起存储大量噪声数据点,而如果阈值设置得太高,则关于峰形的有价值信息将随峰底的数据点的遗失而丢失。从而,除有经验的操作员以外的任何其他人难以成功地使用这样的软件。此外,未存储关于噪声的任何信息,使得所有这样的信息均丢失。
[0008] 对FTMS数据中的噪声的分析的改进由Hanna在1985年9月9-13日Swansea镇“Advances in Mass Spectrometry 1985:proceedings of the 10th International MassSpectrometry Conference”(John Wiley and Sons出版社)中以及1985年5月26-31日美国加利福尼亚州圣地亚哥市的ASMS 33rd Annual Conference on MassSpectrometry and Allied Topics的学报中描述。Hanna所述的方法使用对FTMS中存在的噪声的统计分析来获得用作光谱的噪声排除水平的阈值。峰值列表从该阈值之上的数据中获得。虽然Hanna文章中所述的技术允许实现对合适噪声阈值的更好的估算,但它们仍有若干缺点。首先,这种技术仅导致对峰值位置及其强度的确定,而关于峰形和光谱噪声两者的有价值信息均丢失。其次,由于为获得噪声分布的参数而需要若干次迭代直到这些参数稳定,因此这种技术在计算上相当昂贵。
[0009] 发明概述
[0010] 针对该背景,且从第一方面,本发明在于一种处理傅里叶变换质谱数据的方法,它包括:(a)对于一质荷比范围获取时域中FTMS数据集;(b)将所获取的时域数据的子集变换到频域;(c)对该频域数据子集应用第一阈值以将噪声数据从指示具有所述范围的质荷比的离子的存在性的峰值数据中区分出来;(d)将所获得的时域数据的基本上全数据集变换到频域;以及(e)标识该经变换的全数据集内与步骤(c)中标识为包含峰值数据的经变换的数据子集的范围相对应的范围。
[0011] 本发明该方面的处理技术允许针对随机噪声改进区分度,不论是移除“标准”阈值处的随机噪声尖峰(spike)以便压缩要存储的数据文件还是使用较低阈值来定位较小的真实信号(但这样数据文件可能不会被压缩)。本发明基于随着分辨率增加(等价于时域数据点的数目),在阈值之上找到的随机噪声峰值的数目增加,但“真实”信号峰值,即真正表示具有所选范围内的质荷比的离子的存在性的峰值的数目稍有增加或没有增加的观察结果。反之也为真:随着分辨率降低,随机峰值的数目也减少。实际上,发现真实信号峰值的数目在所有分辨率下相对稳定。这是因为假定随机噪声是高斯分布的,则存在越多的数据点,任何给定阈值之上的数据点也越多。频域数据点的数目与时域数据点的数目成正比。因此,较小的时域数据集产生较少的随机噪声峰值,并且这可用作对全数据集设置阈值的基础。
[0012] 通过仅将时域中的全部FTMS数据集的一部分变换到频域,由于分辨率的降低,在给定阈值处将出现相对较少数目的假峰值。一旦标识了延及阈值之上的峰值(优选地,这些峰值的位置),将变换全数据集,但仅之前较低分辨率处标识的位置周围的数据需要被分析和/或保存。换言之,避免了如果阈值仅应用于频域中的全数据集而可能找到较大数目的假峰值的问题,因为作为现有的在较低分辨率处应用阈值的结果,假峰值可被忽略。
[0013] 在一个实施例中,可显示和/或存储来自全部变换的基本上所有数据,但仅部分瞬变的变换中所标识的范围中是“真实”数据(因为它们位于第一阈值之上)。换言之,不需对全部变换应用第二强度阈值,并且数据总量主要通过例如标识所扫描范围内仅包含噪声数据的频率/质量范围(通过将第一阈值应用于部分瞬变变换)以及简单地在全部瞬变变换中拒绝这些相应的范围而减少。然而,在附加或替换实施例中,可对全部瞬变变换中的数据应用第二阈值,且仅第二阈值之上的数据被保存以便显示、存储等。该第二阈值可以与第一阈值相同或不同。
[0014] 根据本发明的第二方面,提供了一种处理傅里叶变换质谱(FTMS)数据的方法,包括:(a)将对于一质荷比(m/z)范围在时域中所获得的第一FTMS数据集变换到频域;(b)将不同于所述第一FTMS数据集的第二时域FTMS数据集变换到频域;以及(c)将频域内的第一FTMS数据集与频域内的第二FTMS数据集相关以便标识频域中每一数据集所共有的峰值。
[0015] 本发明的这方面充分利用了噪声基本上是随机的这一事实。这样,当时域中的全数据集的不同部分被变换到频域时,它们应展示同一相对位置处的峰值,例如是那些“真实”峰值的峰值,但从随机噪声得到的数据中的峰值相反应不会在统计上出现在全数据集的两个单独子集的同一位置上。
[0016] 第一和第二数据集可从相同瞬变的不同部分获得(尽管有可能有重叠)。或者,第一和第二数据集可以是不同瞬变的子集。在后一情况中,当然期望每一瞬变中所包括的m/z范围存在至少部分重叠,使得两者之间的相关有意义。
[0017] 在一个实施例中,子集可彼此重叠,例如可分别变换并互相关全数据集的前25%和前50%。或者,可变换分开的子集(例如,前25%以及第二个25%)。又或者,第一和第二时域FTMS数据集可来自完全不同的瞬变。
[0018] 还公开了区分其中出现众多同位素峰值的较大分子中的峰值的方法,它依赖于两个阈值。也可以理解,所公开的方法不仅因为它们允许数据压缩(即,通过减少可能被存储的噪声数据量)而有利。相关的方法尤其允许检测强度低于固有噪声电平的低强度的“真实”峰值,即使它们在全光谱中出现。
[0019] 当然可以理解,本发明的第一和第二方面决不互斥。优选实现实际上组合了这两个方面。因此,根据本发明的第三方面,提供了一种处理质谱数据的方法,它包括:(a)对于一质荷比范围在时域中获得一质谱数据集;(b)将所获得的时域数据的第一子集变换到频域;(c)将所获得的时域数据的第二子集变换到频域;(d)将所获得的时域数据的基本上全数据集变换到频域;(e)对频域中的所述第一和第二子集的至少其中之一应用第一阈值以便标识该数据中包含峰值数据的一个或多个区域;以及(f)将频域中的第一数据子集与频域中的第二数据子集相关,以标识数据中对所述子集的每一个所共有的一个或多个区域。
[0020] 总而言之,本发明提供了一种改进的对FTMS数据定阈值的技术,即对当生成减小的数据集时峰值或光谱数据是被包括还是被排除的决策过程的改进方法。本发明基于对以下准则中的两个或多个的数学或逻辑组合:
[0021] 1.时域(瞬变)中数据子部分的丰度;
[0022] 2.同一数据集的不同子部分中的显著丰度(包括任何类型的重叠子部分);
[0023] 3.完整数据集中的丰度;
[0024] 4.不同数据集中的丰度;
[0025] 5.一个以上不同数据集中的丰度;
[0026] 6.由之前的准则限定的峰值之间的相位相关性;
[0027] 7.关于频繁出现的峰值的信息(可总结或在统计上评估);
[0028] 8.关于在空白中找到的峰值的信息(即,在没有样本离子的情况下生成的光谱)。这些可再次被总结或在统计上评估。
[0029] 用于不同准则的重要程度可以不同。逻辑运算可以是任何类型的,例如AND、OR、XOR、NOT、蕴涵。数学运算可以是乘法、加法、变换、将结果与“主阈值”进行比较等。
[0030] 附图简述
[0031] 为了本发明能被更容易地理解,仅作为示例现在将对附图进行参考,附图中:
[0032] 图1示出质谱形式的全FTMS数据集,包括由于离子存在而得到的峰值以及随机噪声两者;
[0033] 图2示出具体化本发明的第一方面的处理FTMS数据的方法的流程图;
[0034] 图3示出说明根据本发明的第二方面的一个实施例的数据处理方案的流程图;
[0035] 图4示出使用根据现有技术的阈值确定技术处理的傅里叶变换质谱;
[0036] 图5示出使用根据本发明的实施例的改进的阈值确定技术处理的傅里叶变换质谱;
[0037] 图6示出说明根据本发明的第二方面的另一实施例的数据处理方案的流程图;
[0038] 图7示出类似于图6但有所变化的数据处理方案的流程图;以及
[0039] 图8示出说明本发明的第二实施例的又一实施例的流程图。
[0040] 优选实施例的详细描述
[0041] 在傅里叶变换离子回旋共振质谱法(FTMS)中,如所公知的,离子在离子源处生成并通常从诸如线性离子阱等存储装置被注入到测量单元内。对单元中所保存的离子施加均匀磁场和射频电(激励)场使离子在该单元中以回旋频率绕轨道运行。这些离子由单元中的检测电极中的镜像电流检测。
[0042] 通过该技术获得的原始数据处于时域中并被认为是瞬变的。一旦获得这种瞬变,在现有技术的FTMS中,通过以下技术获得质谱。首先,对该瞬变进行变迹(apodise)并填0。接着,实现数据到频域的傅里叶变换。这提供了由实部和虚部组成的一对值构成的复频谱。此后,使用表达式P=(Im2+Re2) 逐点获得幅度频谱。通过应用校准公式将其变换为质谱。所得的质谱的示例在图1中示出。可以看到,数据包括一个或多个峰值(以图1中的质量数标记)以及大量噪声。
[0043] 转换和存储全FTMS数据集是相当耗时的任务,且可能要求非常大的存储容量。所存储信息中的大量信息实际上是分析价值很小或者没有分析价值的噪声。为了减少所存储数据的总容量,现有技术仅对频域中的数据应用阈值以移除该阈值以下的所有数据点。如已在引言中说明的,对固定阈值而言这是迟钝的机制,因为它冒着对数据过度压缩或压缩不足的风险,使得留下过多噪声或错误地移除了真正的峰值。
[0044] 图2示出具体化本发明的第一方面的处理FTMS数据的方法的流程图。在步骤10处,通过FTMS以上述方式获取时域中的瞬变。在步骤20处,这些瞬变中的部分而非全部经傅里叶变换到频域。经傅里叶变换的瞬变的数量是计算速度与准确性之间的折衷。一方面,变换全部瞬变的相对较小的百分比能够迅速完成。另一方面,如果将过小百分比的瞬变变换到频域,则数据中的真正峰值可能会丢失。图2的实施例采用25%的瞬变,一般为前25%。采用前25%的好处在于,处理器可在获得全部瞬变的其余部分之前开始着手对该25%瞬变的后续处理。
[0045] 频域中的数据包含表示具有处于由FTMS装置所选来评估的范围内的质荷比的离子的存在的峰值。频域中的数据也包含实际上是随机噪声的结果但可能被错误地确定为真正峰值的多个数据点。然而,如在本发明的概述中所述的,这样的峰值的数目随着分辨率的降低而减少。因此,仅对全部瞬变的25%进行傅里叶变换应减少随机噪声峰值的数目。
[0046] 从而,在步骤30处,对步骤20处获得的部分傅里叶变换应用强度阈值。相对保守地选择该阈值以便最小化丢弃真正峰值的风险。然而,由于部分数据集中假峰值的数目减少,减少了该强度阈值之上的假峰值(即,随机噪声峰值)通过的风险。
[0047] 接着,在步骤40处,将全部瞬变傅里叶变换到频域。然后,在步骤50处,对通过全部瞬变的傅里叶变换而获得的频域数据应用强度阈值。该阈值可与步骤30中所应用的阈值相同,或可以稍低。然而,重要的是步骤50处应用的阈值仅应用于如步骤30中所确定的真正数据峰值的位置周围的频域光谱(或质谱)的区域中。换言之,落在步骤30中所应用的强度阈值之下的这些峰值的区域之间的数据点将不再被检查。
[0048] 在步骤60处,存储落在步骤50处应用的阈值之上的峰值数据。通过以这种方式去除随机噪声,可实现约90到95%甚至更高的压缩,然而与峰值有关的数据本身未受损或被压缩。而且,如共同待批申请no.PCT/EP04/010736中所述,由于峰值之间的数据被假定为随机噪声,因此可通过假定随机噪声数据是高斯分布的并使用所确定的高斯参数重构该数据来重构伪光谱。
[0049] 图3示出根据第二实施例的处理FTMS数据的方法的流程图。在步骤100处,使用由操作员选择的全分辨率再一次获得瞬变(即,获得全部瞬变)。或者与全部数据瞬变的集合同时地,或在此之后,如图2的步骤20那样,在步骤110处,将瞬变的前25%转换到频域。在图3的步骤120处,对目前处于频域中的瞬变的前25%应用强度阈值,以便定位数据中的真正峰值。如前所述,可采用相对保守的阈值,以最小化忽略真正数据峰值的风险。
[0050] 在步骤130处,将瞬变的第二个25%转换到频域。这可以是原始数据集的重叠的25%,或之后的25%(即,步骤100处所获得的原始时域瞬变的25-50%)。也对该数据应用强度阈值,再一次标识该数据中的真正数据峰值。步骤140处应用的阈值可以与步骤120处应用的强度阈值相同或不同。尤其当相对于步骤110,在步骤130处变换了不同大小的数据集(例如,如果在步骤130处变换了原始时域瞬变的50%)时,则步骤140处应用的阈值可稍高于步骤120处应用的阈值(因为在后一情况中,由于傅里叶变换了更多的瞬变,因此假数据峰值的风险增加)。
[0051] 在步骤150处,比较作为处理步骤120和140的结果获取的数据集或将它们相关。在随步骤120和140获得的光谱的每一个中的同一位置处应出现两个信号。然而,假定噪声是真正随机的且不在全时域数据集(瞬变)的不同部分之间相关,则噪声峰值将不会出现在两个不同光谱的同一位置中。因此,通过分别标识彼此相关的峰值在步骤120和140得到的两个光谱中的位置,并通过丢弃峰值不匹配的数据范围,可生成总数据集的“预滤器”。
[0052] 然后,在步骤160处,将全部瞬变傅里叶变换到频域。阈值(可高于步骤120和140处对部分数据集应用的阈值)被应用于频域内的全部瞬变,但仅用于使用步骤100到
150的预过滤技术标识的峰值范围。所存储的峰值数据,即步骤170处所应用的强度阈值之上的数据在步骤180处被存储。与图2的实施例一样,所丢弃的随机噪声可通过假定它是高斯分布的而被重构。
[0053] 尽管目前优选地对经变换的部分瞬变应用相对较“松”的阈值(步骤120和140),但可以理解这不是必要步骤。虽然计算上是昂贵的,但有可能将来自每一数据集的所有数据相关,而不仅是阈值数据;该过程可减少错过真正峰值的风险。
[0054] 图3的方法的优点在图4和5中示出。图4示出人工时域信号,包括409.6kHz处的“真正”峰值以及该真正信号峰值周围其它位置处的多个随机噪声峰值。409.6kHz处的真正信号的强度刚高于强度阈值。
[0055] 图4示出应用现有技术的结果,其中在没有任何预过滤的情况下对经傅里叶变换的全部瞬变应用阈值。相对于作为全质谱的图1,可见图4不包含“基线”噪声(通过应用阈值去除了该噪声),但存在14个随机噪声峰值,其中多个具有高于409.6kHz处的真正信号的强度。
[0056] 应用图3的改进方案,其中单独变换了全时域数据集中的第一和第二个四分之一,通过检查从时域瞬变到分开的频域变换创建了一列“有效”峰值。图5示出了比较的结果。由于随机噪声引起的所有峰值都消失了,而该质荷比范围内的一个有效信号保留。注意到,即使真正信号的强度低于图4中随机噪声峰值中的任何一个,但它仍保留。因此可以理解,此处所述的方法不仅限于减少数据集的大小以便允许存储减少数量的数据(诸如如上所述的图8的步骤180)。该方法也可用于生成大小可与标准方法相比的数据集,但具有低得多的检测阈值。这将允许在不增加数据总量的情况下检测目前低于简单强度阈值的信号。尽管在图3中,峰值在两个数据子集中的位置被用于标识数据中的真正峰值,但其它参数也可相关,以便标识数据中的真正峰值。例如,峰值的强度可在两个数据子集之间相关(使得匹配的峰值强度被标识为“真正”峰值)。除此之外或者作为替代,真实信号的相位将在瞬变的各个段之间一致,而随机信号的相位相反应是随机的。因此,相位一致性可用作附加或者替换的因素。如果可对信号确定电荷状态,则可预测相关联的同位素峰值的位置。这些同位素的窗口然后可被包括在最终阈值确定区域中,作为进一步的改进。作为又一改进,可采用来自一个以上数据集的数据。这个概念将在以下结合图8进一步说明。在优选实施例中,采用了位置和相位(至少)两者。
[0057] 图6示出根据本发明的又一实施例。图6的实施例包括对图3中所述实施例的进一步修改,以着眼于某些信号的特性。具体地,较大的分子产生不寻常的时域信号或瞬变。由于众多相等间隔的同位素峰值,因此可产生较强的“拍频波形图”(见Hofstadler等人所著“Isotopic beat patterns in Fourier transform ion cyclotronresonance mass spectrometry:implications for high resolution mass measurement bybiopolymers”,International Journal of Mass Spectrometry&Ion Processes 132:109-127(1994))。
使用图3中所述的两段阈值方法,这两个时域数据段之一可与全时域数据的“腹点(anti-node)”相关。从而,在该段中不会出现阈值之上的信号,且因此将不会出现“公共”峰值,即使在两个数据集之一中可能出现强信号。不存在提前预测腹点位置的任何方式,因此不存在保证腹点将不会在时域瞬变的任何所选部分中出现的任何方式。对这个问题的解决方案是使用两个单独的阈值。
[0058] 参考图6,在步骤200处,如前所述需要全部瞬变。在步骤210处,将瞬变的前25%变换到频域,且然后在步骤220处,应用第一、较低强度的阈值(阈值1)来标识该阈值的峰值。如步骤230中所示,一旦瞬变的第二个25%被转换到频域之后,即对其应用类似的技术。阈值1在步骤240处应用于该频域数据以标识其中的峰值。
[0059] 在步骤250处,将来自步骤220和240的两个数据集相关以标识公共峰值。然而,在步骤260处,还将一较高的阈值(阈值2)应用于随步骤220和240获得的数据子集,使得由于上述强拍频波形图而不会错误地丢弃较大的峰值(被假定为是真实峰值)。
[0060] 一旦生成了经修改的预滤器,即在步骤260处确定了真正峰值的位置之后,在步骤270处,将全部瞬变变换到频域,然后在步骤280处,对数据域内的所有数据变换但仅在随步骤250和260确定的区域内应用第三阈值。如前所述,可在步骤290处存储峰值数据。
[0061] 当然,尽管描述了类似幅度的两个部分变换,但可采用不同幅度的时域中的数据子集和/或重叠的数据集。
[0062] 在图7中示出对图6的方法稍加修改的方法。由于图6与7之间的相似性,因此采用相同的参考标号来表示相似的步骤。
[0063] 具体地,步骤200到250在图6与7中相同,即瞬变的两个单独部分被变换到频域,使用第一、相对较低的阈值(阈值1)检测峰值,以及然后相关以定位在每一数据集中匹配的峰值。
[0064] 然而,在步骤265处,并非对每一数据子集应用较高的阈值,而是将整个瞬变变换到频域作为下一步骤。然后,在步骤275处,经由步骤200-250标识为峰值的区域被从全频域数据集中减去或排除。在步骤285处,对其余的数据集应用高于第一阈值的第二阈值。这确保如果峰值达到该第二阈值,甚至预处理步骤未能定位该阈值,该峰值也不会从全光谱中遗漏。
[0065] 在步骤295处,存储来自频域中全数据集但仅处于通过相关预处理(步骤200-250)以及对其余数据的较高水平阈值处理的组合被标识为峰值的区域中的数据。
[0066] 在图8的流程图中示出又一实施例。此处,将来自两个完全分开的时域数据集的峰值相关。在步骤300处开始,在从样本注入到第一离子集的FTMS单元(通常经由上游离子过滤器/离子存储装置)之后,从这些样本离子中获取第一瞬变。这在步骤310处被变换到频域,且在步骤320处,对频域中的该傅里叶变换应用阈值。在步骤330处,获取第二瞬变。一般这是从在收集第一瞬变以及随后对创建该第一瞬变的那些离子单元的清空之后注入到FTMS单元的新的离子集中获取的。在步骤340处,将第二瞬变变换到频域。在步骤350处,该阈值也应用于该频域中的傅里叶变换。
[0067] 步骤320和350处所应用的阈值可以相同或不同。同样,尽管步骤300和330处获取的第一和第二瞬变可分别被整体转换到频域,但代替地可将每一单独瞬变的仅一部分在应用阈值之前在步骤310和340处转换到频域。而且,尽管一般从中获取第一瞬变的样本离子的质量范围对应于提供第二瞬变的样本离子的质量范围,但这些质量范围不必相同。通过调节上游离子过滤器/阱的参数,可将不同的质量范围注入到FTMS单元内,尽管当然它们至少必须重叠。
[0068] 在步骤360处,出现来自每一傅里叶变换的相关或匹配数据(这是从中获得两个瞬变的质量范围为何必须至少部分重叠的原因)。从中,标识了真正峰值的位置,且可在步骤370处存储关于这些真正峰值的数据。假定在步骤310和340中变换了全部瞬变,则避免了图3和6的实施例的两个步骤过程。然而,图8的实施例存在一些缺点。具体地,除非收集了第二数据集,否则对第一数据集的处理不能完成。
[0069] 对本领域的读者而言,各种其它实施例将是显而易见的,例如对样本离子(无论m/z是否已知),有可能改为分析“空白”光谱(即,没有任何样本离子),而非依赖于相同瞬变或不同瞬变的部分。一般,这可在FTMS装置的启动之后进行。此时,可在FTMS测量单元中没有离子的情况下寻找固有噪声峰值。存储任何这样的固有噪声峰值的位置。一般,如上所述,系统软件在不同光谱中以变化的相位查找峰值;这些异相信号然后从光谱中减去。这样的一个好处在于降低单频电子噪声(系统中假/噪声峰值的主要来源),以及可根据本发明的实施例解决的白噪声。
[0070] 尽管结合对由离子回转共振产生的瞬变的分析描述了本发明的实施例,但可以理解,本发明决不如此限定,例如本发明可同等地应用于从FR-IR、FT-NMR或SAR、诸如Orbitrap(见US-A-5,886,346)等静电阱(electrostatic trap)中获得的数据,这些数据作为时域瞬变被捕捉以便最终(通常)傅里叶变换成质谱。这些概念也适于应用于从诸如US-A-4,755,670和US-A-6,403,955中所述的电动阱(electrodynamic trap)中获得的数据。实际上,本发明可应用于静电飞行式(TOF)质谱仪(见,例如Benner,W.H.(1997)“A Gated Electrostatic Ion Trap toRepetitiously Measure the Charge and m/z of Large Electrospray Ions”,AnalyticalChemistry 69第4162-4168页)的输出。而且,傅里叶变换不是可采用的频率变换的唯一形式:本发明可同等地与例如哈达玛变换或拉普拉斯变换一起使用。也参见A.Brock、N.Rodriguez和R.N.Zare的“Hadamard Transform Time-of-Flight MassSpectrometry(HT-TOFMS)”Anal Chem.70,3735-3741(1998)。因此,可以理解,本发明实际上可应用于产生周期性信号的任何MS方法。