会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 信息化学物质 / 一种化学物质注释方法

一种化学物质注释方法

申请号 CN202210873847.5 申请日 2022-07-25 公开(公告)号 CN114965662A 公开(公告)日 2022-08-30
申请人 广东工业大学; 发明人 薛靖川; 诸嘉民; 赵亚男; 蔡宴朋; 方明亮; 谭倩;
摘要 本发明提供一种化学物质注释方法。该方法包括:采集目标化学物质碎片离子的质荷比、母离子质荷比以及对应的保留时间建立目标化学物质数据库;采用EISA技术采集样品化学物质的离子质谱图,以数据库中目标化学物质的保留时间为中心搜索所述离子质谱图,识别所述样品化学物质的质谱离子信息;基于该质谱离子信息,确定所述样品中是否存在具体目标化学物质的母离子与相关碎片离子;若存在,则计算所述具体目标化学物质的母离子丰度与其每一种碎片离子丰度的相关度,并当所述相关度均大于阈值时,将该具体目标化学物质确定为高置信水平物质。本发明提供的方案适合用于低浓度的化学物质的快速注释,并且便于以计算机程序实现。
权利要求

1.一种化学物质注释方法,其特征在于,所述方法包括:

采用离子源设备及设置参数,产生离子源内高能裂解现象以采集目标化学物质的源内碎片离子质谱数据建立目标化学物质离子数据库;所述源内碎片离子质谱数据包括:目标化学物质碎片离子的质荷比,母离子质荷比以及对应的保留时间RT;

采用所述离子源设备、所述设置参数,产生样品化学物质的离子源内高能裂解现象以采集该样品化学物质的源内碎片离子质谱图;设置以所述目标化学物数据库中每个目标化学物质保留时间RT为中心的保留时间窗口K,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息;所述质谱离子信息包括:离子的荷质比,以及各离子的丰度;

对于所述数据库中的任一具体目标化学物质,基于所述质谱离子信息确定该样品化学物质的源内裂解离子中是否存在该具体目标化学物质的母离子与相关碎片离子;若存在,则计算所述具体目标化学物质的母离子及其每一种相关碎片离子在丰度上的相关度;若不存在,则排除该具体目标化学物质;在所述相关度均大于阈值时,将该具体目标化学物质确定为该样品中存在的高置信水平物质。

2.如权利要求1所述的方法,其特征在于,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息,实现为:确定具体目标化学物质的母离子在所述质谱图中对应于所述保留时间窗口K的丰度采样序列中的样本值缺失率是否超过80%,若是,则认为样品中不存在所述具体目标化学物质;若否,识别出样品化学物质的质谱离子信息。

3.如权利要求2所述的方法,其特征在于,所述保留时间窗口K设为:

4.如权利要求1‑3中任一项所述的方法,其特征在于,所述相关度为皮尔逊相关系数,所述相关度 的计算公式为:其中, 为母离子和具体某一碎片离子的相关度, 为母离子丰度的第i个样本, 为所述某一碎片离子丰度的第i个样本, 为母离子丰度样本序列的标准差, 为所述具体某一碎片离子丰度样本序列的标准差,n为母离子或所述碎片离子样本序列的长度,为母离子丰度样本的平均值,为所述某一碎片离子丰度的平均值。

5.如权利要求4所述的方法,其特征在于,所述阈值设为0.8。

说明书全文

一种化学物质注释方法

技术领域

[0001] 本申请提供的技术方案涉及化学物质识别/鉴定领域,具体涉及一种基于质谱离子源内高能裂解技术的化学物质注释新方法。

背景技术

[0002] 暴露组学旨在研究人一生接触到的环境暴露因素总和及其引起的健康效应。质谱是暴露组学研究中对化学物质进行分析的一个重要技术手段。化学物质暴露组首要难点是如何实现对人体化学物质暴露进行快速检测分析。进行暴露组识别的人体内化学物质包括外源性环境污染物及其转化产物和由肠道菌群、炎症反应等体内生化反应过程生成的内源性活性代谢物。环境污染物等化学物质在人体中存在水平较低,常常给检测与分析带来较大挑战,亟需灵敏度较高的分析检测技术对待分析样品中存在的低浓度化学物质进行分析和鉴定。
[0003] 传统化学物质注释/识别方案需要通过串联质谱仪,分别获取母离子质谱(MS)数据和碎片离子的质谱数据。母离子又称作前体离子,通常在离子源内生成。碎片离子的生成通常需要将ESI与串联质谱(ESI‑MS/MS)相结合,当母离子进入碰撞室内后在能量作用下与惰性气体分子发生反应产生碎片离子。但是科学家们发现,即使在ESI(电雾喷离子源)等所谓的“软电离”技术中源内裂解(ISF)现象同样存在,由源内裂解现象产生的源内碎片离子是导致化学物质鉴定结果错误的一个主要原因。
[0004] 传统的基于暴露组学的化学物质注释/识别方案中数据采集模式分为:数据依赖采集模式(DDA)和数据独立采集模式(DIA)。
[0005] 数据依赖采集(DDA)模式是串联质谱中数据采集的一种主要模式。在DDA模式下,质谱仪器在执行MS全扫描时会自动对从全扫描谱图中选择的母离子列表进行MS/MS分析。DDA模式优点是选择性高,但通量较低、难以实现化学物质碎片离子的批量采集。
[0006] 数据独立采集(DIA)是质谱分析中一种批量采集化学物质碎片离子的模式。在该模式中,选定m/z(质荷比)范围内的所有离子都将在串联质谱的第二阶段进行碎片化和分析。该模式下通过裂解在给定时间进入质谱仪的所有离子(称为宽谱DIA)或通过顺序分离和裂解m/z范围来获得串联质谱数据。该数据采集模式尽管可以实现化学物质碎片离子的批量采集,但选择性较低。
[0007] 传统基于碰撞室的碎片离子生成方式对母离子峰高有一定要求,无法有效采集低浓度化学物质的碎片离子信息。申请人在前期建立的基于质谱离子源内高能裂解现象的化学物质高灵敏分析技术(EISA),可以有效采集低浓度化学物质的碎片离子信息,因此可以有效实现低浓度化学物质的鉴定。EISA技术通过优化离子源内裂解能量,革新了碎片离子采集方式,实现了在不影响母离子峰高的情况下生成相应碎片离子。该技术可以采集低浓度化学物质的碎片离子,实现低浓度化学物质的鉴定。在采用该技术进行化学物质分析时,一方面需要手动鉴定,过于耗时耗力;另一方面常用物质鉴定软件通常仅适用于母离子峰和碎片离子峰分开采集的情况,且主要通过峰提取实现物质特征识别,由于低浓度化学物质的质谱峰不明显或丰度峰形较差,不能被传统物质鉴定软件所识别。

发明内容

[0008] 针对现有的低浓度化学物质注释方法的上述不足,本发明提供一种与EISA技术获得的谱图相匹配的化学物质注释新方法,实现化学物质自动化鉴定。
[0009] 本发明提供的技术方案实现为:一种化学物质注释方法,所述方法包括以下步骤:步骤S1,采用离子源设备及设置参数,产生离子源内高能裂解现象以采集目标化学物质的源内碎片离子质谱数据建立目标化学物质离子数据库;所述源内碎片离子质谱数据包括:目标化学物质碎片离子的质荷比,母离子质荷比以及对应的保留时间(retention time);
步骤S2,采用所述离子源设备、所述设置参数,产生样品化学物质的离子源内高能裂解现象以采集该样品化学物质的源内碎片离子质谱图;
步骤S3,设置以所述目标化学物数据库中每个目标化学物质保留时间RT为中心的保留时间窗口K,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息;所述质谱离子信息包括:离子的荷质比,以及各离子的丰度峰(intensity);
步骤S4,对于所述数据库中的任一具体目标化学物质,基于所述质谱离子信息确定该样品化学物质的源内裂解离子中是否存在该具体目标化学物质的母离子与相关碎片离子(即源内裂解碎片离子);若存在,则计算所述具体目标化学物质的母离子及其每一种相关碎片离子在丰度上的相关度;若不存在,则排除该具体目标化学物质;
步骤S5,判断所述相关度是否均大于阈值,若是,将该具体目标化学物质确定为该样品中存在的高置信水平物质。
[0010] 进一步地,所述步骤S3中,在所述样品化学物质的质谱图的所述保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息,实现为:确定具体目标化学物质的母离子在所述质谱图中对应于所述保留时间窗口K的丰度采样序列中的样本值缺失率是否超过80%,若是,则认为样品中不存在所述具体目标化学物质;否则,识别出样品化学物质的质谱离子信息,把在该保留时间窗口K内各离子的丰度峰作为所述特征离子丰度。
[0011] 优选地,所述保留时间窗口K设为: ;所述阈值设为0.8。
[0012] 优选地,所述相关度设置为皮尔逊相关系数,其计算公式为:其中、 为母离子和具体某一碎片离子的相关度, 为母离子丰度的第i个样本, 为所述某一碎片离子丰度的第i个样本, 为母离子丰度样本序列的标准差, 为所述具体某一碎片离子丰度样本序列的标准差,n为母离子或所述碎片离子样本序列的长度,为母离子丰度样本的平均值,为所述某一碎片离子丰度的平均值。
[0013] 本发明提供的化学物质注释方法,基于源内裂解现象实现化学物质的质谱母离子和碎片离子质谱数据的同时采集,基于源内高能裂解技术,样品化学物质在低浓度下能够获得比传统采集模式更高的母离子丰度和碎片离子丰度,再根据母离子与碎片离子丰度的相关性来识别化学物质,能够有效识别低浓度的化学物质。该方法能够非常方便地采用计算机程序来实现,尤其适用于大量化学物质的识别。

附图说明

[0014] 图1为本发明提供的化学物质注释方法的流程图。

具体实施方式

[0015] 为了使本发明所解决的技术问题、技术方案以及有益效果更加清楚明白,以下结合附图对本发明进行进一步详细说明。应该理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0016] 如图1所示的一个实施例中、本发明提供的化学物质注释方法,包括以下步骤:步骤S1,采用离子源设备及设置参数,产生离子源内高能裂解现象以采集目标化学物质的源内碎片离子质谱数据建立目标化学物质离子数据库;所述源内碎片离子质谱数据包括:目标化学物质碎片离子的质荷比,母离子质荷比以及对应的保留时间(retention time);
步骤S2,采用所述离子源设备、所述设置参数,产生样品化学物质的离子源内高能裂解现象以采集该样品化学物质的源内碎片离子质谱图;
步骤S3,设置以所述目标化学物数据库中每个目标化学物质保留时间RT为中心的保留时间窗口K,在所述样品化学物质的质谱图的保留时间窗口K段内进行搜索,识别出所述样品化学物质对应于该保留时间窗口K的质谱离子信息;所述质谱离子信息包括:离子的荷质比,以及各离子的丰度(intensity);
步骤S4,对于所述数据库中的任一具体目标化学物质,基于所述质谱离子信息确定该样品化学物质的源内裂解离子中是否存在该具体目标化学物质的母离子与相关碎片离子(即源内裂解碎片离子);若存在,则计算所述具体目标化学物质的母离子及其每一种相关碎片离子在丰度上的相关度;若不存在,则排除该具体目标化学物质;
步骤S5,判断所述相关度是否均大于阈值,若是,将该具体目标化学物质确定为该样品中存在的高置信水平物质。以确定为该样品化学物质的高置信水平物质的目标化学物质对其进行注释/标注。其中,所述高置信水平物质的目标化学物质按照上述相关度,从高到低进行排序。
[0017] 进一步地,所述步骤S3中,在所述样品化学物质的质谱图的所述保留时间窗口K段内进行搜索,识别出所述样品化学物质的质谱离子信息,实现为:确定具体目标化学物质的母离子在所述质谱图中对应于所述保留时间窗口K的丰度采样序列中的样本值缺失率是否超过80%,若是,则认为样品中不存在所述具体目标化学物质;否则,识别出样品化学物质的质谱离子信息,把在该保留时间窗口K内各离子(包括所有母离子和碎片离子)的丰度峰作为所述特征离子丰度。
[0018] 所述时间窗口K设置成以具体目标化学物质的保留时间RT为中心的一定时间范围能够避免对整个样品化学物质的质谱数据进行搜索,减少了数据搜索量进一步提供了化学物质注释的速度。其中,所述时间范围可以设置成RT±5s,RT±10s,RT±15s,RT±20s,RT±25s,RT±30s。在该实施例中,将所述时间窗口K设置成:RT‑15s≤K≤RT+15s。
[0019] 在上述搜索过程中,对于所述数据库中具体目标化学物质的母离子信息在样品化学物质的质谱图中样本序列中缺失样本值达到一定比例,则认为样品中不存在此化合物,以提高搜索的速度。对于没有忽略掉的具体目标化学物质,则认为样品化学物质质谱图中存在对应数据库中具体目标化学物质的母离子信息。初步筛选完成后才确定对应数据库中具体目标化学物质的所述相关碎片离子是否存在于样品化学物质的质谱图中,以此大大降低了对大量化学物质注释时的数据处理量。
[0020] 在该实施例中,所述相关度设置为皮尔逊相关系数,其计算公式为:其中、 为母离子和具体某一碎片离子的相关度, 为母离子丰度波形的第i个样本, 为所述某一碎片离子丰度波形的第i个样本, 为母离子丰度样本序列的标准差,为所述具体某一碎片离子丰度样本序列的标准差,n为母离子或所述碎片离子样本序列的长度,为母离子丰度样本的平均值,为所述某一碎片离子丰度的平均值,n其取决于保留时间窗口K的大小以及离子丰度波形采样率。显然,若母离子和某一碎片离子的相关度越高,说明相应的碎片离子来源于该母离子裂解的可能性越大,对应样品化学物质属于该具体目标化学物质的概率则越大。
[0021] 与上述方法相对应,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储程序代码,计算机执行所述程序代码实现上述化学物质的注释方法。
[0022] 以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。