金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法转让专利

申请号 : CN201410329539.1

文献号 : CN104237493B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张艳军李遇伯张振珠侯治国王磊武欣张秀秀

申请人 : 天津中医药大学

摘要 :

本发明公开了一种采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法。它是将由Masslynx软件提取的色谱峰数据导入Excel表格中;根据不同能量碰撞裂解的过程,在正离子模式下,查找母离子要符合[M+H]+、[M+Na]+、[M+K]+或[M+H+Na]+的条件;在负离子模式下,查找母离子要符合[M-H]-或[M-HAC]-的条件,对碎片离子进行合并;利用金字塔型筛选方法,对大量的生物样本数据进行不同类别的目标化合物的分类与筛选:经HMDB与KEGG等数据库查询验证,进一步确认目标化合物结构等信息。本发明对脂质组学、石油化工、中药分析等领域中化合物的分类、鉴定、发现、分离都有着重要的指导意义。

权利要求 :

1.一种采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法,其特征在于按如下的步骤进行:(1)将由Masslynx软件提取的色谱峰数据导入Excel表格中;

+

(2)根据不同能量碰撞裂解的过程,在正离子模式下,查找母离子要符合[M+H]、+ + + -[M+Na]、[M+K]或[M+H+Na] 的条件;在负离子模式下,查找母离子要符合[M-H] 或-[M-HAC]的条件,对碎片离子进行合并;

(3)利用金字塔型筛选方法,对大量的生物样本数据进行不同类别的目标化合物的分类与筛选:(4)经HMDB与KEGG等数据库查询验证,进一步确认目标化合物结构等信息;其中所述的金字塔型筛选方法指的是:当化合物分子质量与质量亏损值分别在60.0-204.1和-0.0046-0.1150范围内时,则此类物质属于第I类物质,随后对不同能量碰撞诱导下的离子碎片进行进一步筛选,正离子模式下,若丢失NH3和HCOOH的中性丢失碎片,则为氨基酸;若丢失NH3的中性丢失碎片,则为碱基或单胺类神经递质;负离子模式下,若丢失CO2的中性丢失碎片,则为有机酸;

当化合物分子质量与质量亏损值分别在227.0-364.3和0.0695-0.240范围内时,则此类物质属于第II类物质,即核苷和类固醇激素;在正离子模式下,若含有m/z + +

97.06[C6H9O]和m/z 109.06[C7H9O]的诊断碎片和对应0.0643-0.0662和0.0642-0.0663 Da的诊断碎片质量亏损范围时,则为类固醇激素;在负离子模式下,若含有m/z -

145.06[C10H9O]的诊断碎片和0.0638-0.0667 Da的诊断碎片质量亏损范围,则为雌激素;

正离子模式下,若丢失C5H8O3和C5H8O4中性丢失碎片,则为核苷;

当化合物分子质量与质量亏损值分别在412.2-607.5和0.2385-0.4576范围内时,则此类物质属于第III类物质,即LPEs和LPCs;正离子模式下,若含有m/z +

184.07[C5H15NO4P]的诊断碎片和0.0720-0.0757 Da的诊断碎片质量亏损范围,则为LPCs;若丢失C2H8NO4P的中性丢失碎片,则为LPEs;

当化合物分子质量与质量亏损值分别在635.4-915.8和0.4369-0.8125范围内时,则此类物质属于第IV类物质,即PCs/PEs/PSs/PIs/PAs/PGs物质;正离子模式下,若含+有m/z 184.07[C5H15NO4P]的诊断碎片和0.0720-0.0757 Da的诊断碎片质量亏损范围,则为PCs;若丢失(C2H8NO4P)的中性丢失碎片,则为PEs;负离子模式下,若含有m/z -

241.01[C6H10PO8]的诊断碎片和0.0088-0.0137 Da的诊断碎片质量亏损值范围,则为-PIs;若含有m/z 152.99[C3H6PO5]的诊断碎片和0.9937-0.9968Da的诊断碎片质量亏损范围,则为PAs/PGs;若丢失C3H5NO2的中性丢失碎片,则为PSs,最终对已筛选出的不同类别的化合物,进行HMDB数据库的查询,以期快速准确的筛选出目标化合物。

2.权利要求1所述采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法,其中所述的第I类物质指的是:氨基酸、有机酸、单糖、单胺类神经递质、碱基。

3.权利要求1所述采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法,其中所述的固醇激素指的是:雄激素、孕激素、糖皮质激素和盐皮质激素。

说明书 :

金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方

技术领域

[0001] 本发明属于生物样本的数据后处理技术领域,涉及体内内源性物质的筛选与鉴别的过程处理技,更具体的说是一种采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法。

背景技术

[0002] 如今,随着数据后处理技术的不断发展,质量亏损过滤(Mass defect filtering, MDF)、诊断碎片过滤(Diagnostic fragments filtering, DFF)与中性丢失过滤(Neutral loss filtering, NLF)在物质的筛选与鉴别方面显示出独特的优势。质量亏损过滤是指化合物分子的准确质量数与其最接近的整数值之间的差值,一般根据同一类化合物具有相同的母核结构的特征,通过某一质量亏损范围,从而筛选与鉴别出某类化合物。目前,质量亏损过滤技术已经应用在检测与表征生物基质代谢物、药物设计、中草药中物质分析以及脂质种类的成像等方面,然而其在代谢组学领域未见报道。由于体内内源性物质成分复杂,虽然可对不同类别的物质进行区分,但不同类别物质的质量亏损范围存在相互重叠与交叉的现象,因此不能对其进行准确的分类。同时我们注意到,虽然体内内源性物质种类繁多、化学组成复杂,但同一类别的物质具有相似或相同的母核结构,致使同类物质在质谱碰撞诱导的过程中存在相同的断裂行为。从而,诊断碎片过滤与中性丢失过滤被应用于物质筛选与鉴定过程中。诊断碎片是指同类化合物在质谱断裂过程中均可以形成的特征碎片离子,因此诊断碎片的方法可以用于不同类别物质的筛选以及已知与未知化合物的分类及鉴定。中性丢失是指一级质谱(MS1)与二级质谱(MS2)之间的质量差值(m),利用质量差值可对具有某一类特征取代基团的物质进行粗略的分类。然而,发现不同类别的化合物存在共用一个诊断碎片或中性丢失的情况,导致物质筛选过程中易出现混淆,假阳性的结果增多。由于不同碰撞能量诱导所产生的母离子与碎片离子的丰度差异较大,如果单独的研究某一特定碰撞能下的物质裂解规律可能会造成碎片信息的丢失,而致假阳性结果。许国旺等利用不同碰撞能量裂解下的碎片结合HPLC-MS对慢性乙型肝炎进行分析,弥补了单一碰撞能量下的信息丢失。因此,对于复杂的体内内源性物质的筛选与鉴别的过程,亟需一个快速、准确的数据后处理方法。

发明内容

[0003] 本发明可以从复杂生物样本中准确提取多类物质,这对内源性代谢物的分类、鉴定以及快速发现潜在生物标记物具有重要的意义。本发明在一定程度上解决了代谢组学中的关键难题——代谢物的分类与鉴别,这将有利于代谢组学的进一步发展。
[0004] 为实现上述目的,本发明公开了如下的技术内容:
[0005] 一种采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法,其特征在于按如下的步骤进行:
[0006] (1)将由Masslynx软件提取的色谱峰数据导入Excel表格中;
[0007] (2)根据不同能量碰撞裂解的过程,在正离子模式下,查找母离子要符合[M+H]+、+ + + -[M+Na]、[M+K]或[M+H+Na] 的条件;在负离子模式下,查找母离子要符合[M-H] 或-
[M-HAC]的条件,对碎片离子进行合并;
[0008] (3)利用金字塔型筛选方法,对大量的生物样本数据进行不同类别的目标化合物的分类与筛选:
[0009] (4)经HMDB与KEGG等数据库查询验证,进一步确认目标化合物结构等信息;其中所述的金字塔型筛选方法指的是:
[0010] 1)当化合物分子质量与质量亏损值分别在60.0-204.1和-0.0046-0.1150范围内时,则此类物质属于第I类物质,随后对不同能量碰撞诱导下的离子碎片进行进一步筛选,正离子模式下,若丢失NH3和HCOOH的中性丢失碎片,则为氨基酸;若丢失NH3的中性丢失碎片,则为碱基或单胺类神经递质;负离子模式下,若丢失CO2的中性丢失碎片,则为有机酸;
[0011] 2)当化合物分子质量与质量亏损值分别在227.0-364.3和0.0695-0.240范围内时,则此类物质属于第II类物质,即核苷和类固醇激素;在正离子模式下,若含+ +有m/z 97.06[C6H9O]和m/z 109.06[C7H9O]的诊 断碎 片和 对应0.0643-0.0662和
0.0642-0.0663 Da的诊断碎片质量亏损范围时,则为类固醇激素;在负离子模式下,若含-
有m/z 145.06[C10H9O]的诊断碎片和0.0638-0.0667 Da的诊断碎片质量亏损范围,则为雌激素;正离子模式下,若丢失C5H8O3和C5H8O4中性丢失碎片,则为核苷;
[0012] 3)当化合物分子质量与质量亏损值分别在412.2-607.5和0.2385-0.4576范围内时,则此类物质属于第III类物质,即LPEs和LPCs;正离子模式下,若含有m/+z 184.07[C5H15NO4P]的诊断碎片和0.0720-0.0757 Da的诊断碎片质量亏损范围,则为LPCs;若丢失(C2H8NO4P)的中性丢失碎片,则为LPEs;
[0013] 4)当化合物分子质量与质量亏损值分别在635.4-915.8和0.4369-0.8125范围内时,则此类物质属于第IV类物质,即PCs/PEs/PSs/PIs/PAs/PGs物质;正离子模式下,+若含有m/z 184.07[C5H15NO4P]的诊断碎片和0.0720-0.0757 Da的诊断碎片质量亏损范围,则为PCs;若丢失(C2H8NO4P)的中性丢失碎片,则为PEs;负离子模式下,若含有m/-
z 241.01[C6H10PO8]的诊断碎片和0.0088-0.0137 Da的诊断碎片质量亏损值范围,则为-
PIs;若含有m/z 152.99[C3H6PO5]的诊断碎片和0.9937-0.9968Da的诊断碎片质量亏损范围,则为PAs/PGs;若丢失(C3H5NO2)的中性丢失碎片,则为PSs,最终对已筛选出的不同类别的化合物,进行HMDB数据库的查询,以期快速准确的筛选出目标化。
[0014] 本发明更加详细的步骤如下:
[0015] 1、将由Masslynx软件提取的色谱峰数据导入Excel表格中。
[0016] 2、根据不同能量碰撞裂解的过程,母离子在质谱中随碰撞能量的逐渐升高,响应值逐渐降低,然而碎片离子无此特点,所以可以同时分别提取母离子和碎片离子的信息。正+ + + +离子模式下,查找母离子要符合[M+H]、[M+Na]、[M+K]或[M+H+Na] 的条件;负离子模式- -
下,查找母离子要符合[M-H]或[M-HAC] 的条件,同时不同碎片离子可能来源于同一个化合物,需要对碎片离子进行合并。
[0017] 3、利用金字塔型筛选方法,对大量的生物样本数据进行不同类别的目标化合物的分类与筛选。
[0018] 1)当化合物分子质量与质量亏损值分别在(60.0-204.1)和(-0.0046-0.1150)范围内时,则此类物质属于第I类物质,即氨基酸、有机酸、单糖、单胺类神经递质、碱基。随后,对不同能量碰撞诱导下的离子碎片进行进一步筛选。正离子模式下,若丢失NH3和HCOOH的中性丢失碎片,则为氨基酸;若丢失NH3的中性丢失碎片,则为碱基或单胺类神经递质;负离子模式下,若丢失CO2的中性丢失碎片,则为有机酸。
[0019] 2)当化合物分子质量与质量亏损值分别在(227.0-364.3)和(0.0695-0.240)范围内时,则此类物质属于第II类物质,即核苷和类固醇激素。正离子模式下,若含+ +有m/z 97.06[C6H9O]和m/z 109.06[C7H9O]的诊断碎片和对应(0.0643-0.0662)和(0.0642-0.0663)Da的诊断碎片质量亏损范围时,则为雄激素、孕激素、糖皮质激素和盐皮-
质激素;在负离子模式下,若含有m/z 145.06[C10H9O]的诊断碎片和(0.0638-0.0667)Da的诊断碎片质量亏损范围,则为雌激素;正离子模式下,若丢失(C5H8O3)和(C5H8O4)中性丢失碎片,则为核苷。
[0020] 3)当化合物分子质量与质量亏损值分别在(412.2-607.5)和(0.2385-0.4576)范围内时,则此类物质属于第III类物质,即LPEs和LPCs。正离子模式下,若含有m/+z 184.07[C5H15NO4P]的诊断碎片和(0.0720-0.0757)Da的诊断碎片质量亏损范围,则为LPCs;若丢失(C2H8NO4P)的中性丢失碎片,则为LPEs。
[0021] 4)当化合物分子质量与质量亏损值分别在(635.4-915.8)和(0.4369-0.8125)范围内时,则此类物质属于第IV类物质,即PCs/PEs/PSs/PIs/PAs/PGs物质。正离子模式+下。若含有m/z 184.07[C5H15NO4P]的诊断碎片和(0.0720-0.0757)Da的诊断碎片质量亏损范围,则为PCs;若丢失(C2H8NO4P)的中性丢失碎片,则为PEs。负离子模式下,若含有m/-
z 241.01[C6H10PO8]的诊断碎片和(0.0088-0.0137)Da的诊断碎片质量亏损值范围,则为-
PIs;若含有m/z 152.99[C3H6PO5]的诊断碎片和(0.9937-0.9968)Da的诊断碎片质量亏损范围,则为PAs/PGs;若丢失(C3H5NO2)的中性丢失碎片,则为PSs。最终对已筛选出的不同类别的化合物,进行HMDB数据库的查询,以期快速准确的筛选出目标化合物。
[0022] 4、经HMDB与KEGG等数据库查询验证,进一步确认目标化合物结构等信息。
[0023] 本发明公开的采用金字塔型筛选方法对内源性代谢产物进行分类与鉴定的方法与现有技术相比所具有的积极效果在于:
[0024] (1)常规的代谢物鉴定方法是与标准品信息比对或参考已发表的文献数据或与数据库中信息匹配,但由于内源性物质的标准品不易获得,质谱解析操作复杂、耗时,同时存在不同类别代谢物互为同分异构体的现象。因此,本发明采用质量亏损过滤技术、诊断碎片质量亏损过滤与中性丢失过滤相结合的方法,构建内源性代谢物的金字塔型筛选方法,能够快速、灵敏、准确的对内源性代谢物进行分类与鉴定。
[0025]特征 方法 金字塔筛选的方法 传统的方法
时间 短 长
分类与鉴定物质的数量 多 少
准确度 高 低
标准品需要量 需要量少 需要量大
[0026] (2)这为未知代谢物的发现和分离提供了一条新的线索,同时本发明为潜在生物标记物的寻找,甚至阐述内源性物质的变化机理和解释生命活动的意义有着至关重要的作用。同时对脂质组学、石油化工、中药分析等领域中化合物的分类、鉴定、发现、分离都有着重要的指导意义。
[0027] 附图说明:
[0028] 附图1:不同能量下离子流图;
[0029] 附图2:金字塔形筛选方法图;
[0030] 附图3:各类物质的质量亏损值范围;
[0031] 附图4:为各类物质诊断碎片与中性丢失图表。

具体实施方式

[0032] 下面结合实施例说明本发明,这里所述实施例的方案,不限制本发明,本领域的专业人员按照本发明的精神可以对其进行改进和变化,所述的这些改进和变化都应视为本发明的范围内,本发明的范围和实质都有权利要求来限定;其中所用到的试剂均由市售。
[0033] 实施例1
[0034] 1、将由Masslynx软件提取的色谱峰数据导入Excel表格中。
[0035] 2、根据不同能量碰撞裂解的过程,母离子在质谱中随碰撞能量的逐渐升高,响应值逐渐降低,然而碎片离子无此特点,所以可以同时分别提取母离子和碎片离子的信息。正+ + + +离子模式下,查找母离子要符合[M+H]、[M+Na]、[M+K]或[M+H+Na] 的条件;负离子模式- -
下,查找母离子要符合[M-H]或[M-HAC] 的条件,同时不同碎片离子可能来源于同一个化合物,需要对碎片离子进行合并(见图1)。
[0036] 3、利用金字塔型筛选方法,对大量的生物样本数据进行不同类别的目标化合物的分类与筛选:
[0037] 1)当化合物分子质量与质量亏损值分别在(60.0-204.1)和(-0.0046-0.1150)范围内时,则此类物质属于第I类物质,即氨基酸、有机酸、单糖、单胺类神经递质、碱基。随后,对不同能量碰撞诱导下的离子碎片进行进一步筛选。正离子模式下,若丢失NH3和HCOOH的中性丢失碎片,则为氨基酸;若丢失NH3的中性丢失碎片,则为碱基或单胺类神经递质;负离子模式下,若丢失CO2的中性丢失碎片,则为有机酸。
[0038] 2)当化合物分子质量与质量亏损值分别在(227.0-364.3)和(0.0695-0.240)范围内时,则此类物质属于第II类物质,即核苷和类固醇激素。正离子模式下,若含+ +有m/z 97.06[C6H9O]和m/z 109.06[C7H9O]的诊断碎片和对应(0.0643-0.0662)和(0.0642-0.0663)Da的诊断碎片质量亏损范围时,则为雄激素、孕激素、糖皮质激素和盐皮-
质激素;在负离子模式下,若含有m/z 145.06[C10H9O]的诊断碎片和(0.0638-0.0667)Da的诊断碎片质量亏损范围,则为雌激素;正离子模式下,若丢失(C5H8O3)和(C5H8O4)中性丢失碎片,则为核苷。
[0039] 3)当化合物分子质量与质量亏损值分别在(412.2-607.5)和(0.2385-0.4576)范围内时,则此类物质属于第III类物质,即LPEs和LPCs。正离子模式下,若含有m/+z 184.07[C5H15NO4P]的诊断碎片和(0.0720-0.0757)Da的诊断碎片质量亏损范围,则为LPCs;若丢失(C2H8NO4P)的中性丢失碎片,则为LPEs。
[0040] 4)当化合物分子质量与质量亏损值分别在(635.4-915.8)和(0.4369-0.8125)范围内时,则此类物质属于第IV类物质,即PCs/PEs/PSs/PIs/PAs/PGs物质。正离子模式+下。若含有m/z 184.07[C5H15NO4P]的诊断碎片和(0.0720-0.0757)Da的诊断碎片质量亏损范围,则为PCs;若丢失(C2H8NO4P)的中性丢失碎片,则为PEs。负离子模式下,若含有m/-
z 241.01[C6H10PO8]的诊断碎片和(0.0088-0.0137)Da的诊断碎片质量亏损值范围,则为-
PIs;若含有m/z 152.99[C3H6PO5]的诊断碎片和(0.9937-0.9968)Da的诊断碎片质量亏损范围,则为PAs/PGs;若丢失(C3H5NO2)的中性丢失碎片,则为PSs。最终对已筛选出的不同类别的化合物,进行HMDB数据库的查询,以期快速准确的筛选出目标化合物(见图2,图3,图4)。
[0041] 4、经HMDB与KEGG等数据库查询验证,进一步确认目标化合物结构等信息。人类代谢组数据库(HMDB)是一个包含在人体中发现的小分子代谢物的详细信息,免费提供电子数据库。它的目的是用于代谢组学,临床化学,生物标志物的发现和一般的教育应用。该数据库被设计为包含或连结三种数据:1)化学数据,2)临床数据,3)分子生物学/生物化学数据。该数据库包含41,828代谢产物的条目包括水溶性和脂溶性代谢物,以及常见的(> 1 UM)或相对罕见(<1 nm)的代谢产物。此外,5688种蛋白序列链接到这些代谢物的条目。许多数据字段超链接到其他数据库(KEGG等中)和各种结构和途径查看。该HMDB数据库支持丰富的文本,序列,化学结构和关系查询搜索。四个额外的数据库,DrugBank,T3DB,SMPDB和FooDB也是HMDB套件数据库的一部分。DrugBank包含1600药物和药物代谢当量的信息,T3DB包含3100常见的毒素和环境污染物信息,SMPDB包含440人体代谢和疾病的途径,而FooDB包含28,000食品成分和食品添加剂等同的信息。
[0042] 实施例2:
[0043] 液化小分子物质氨基酸的筛选过程:
[0044] 首先,在临床尿样正离子中筛选出母离子的M/Z值范围,先选定M/Z整列,再进行筛选,共筛选出278个;接着,在筛选完的结果中再次筛选出满足氨基酸类物质质量范围的,氨基酸类物质的质量范围为75.032-204.0899,共筛出234个;其次,在满足氨基酸质量范围的所有M/Z值中,用INT函数求的所有M/Z值得小数部分,这些小数就是它们的质量亏损值。用氨基酸质量亏损范围(亏损范围为0.0197-0.1117)进一步筛选,共得到183个;最+ +后,将筛选完的M/Z值到HMDB中查询,保留含有[M+H]和[M+Na] 的数据,共查出尿样正离子中氨基酸有34个。说明这个方法有助于代谢组学中氨基酸类物质的筛选及鉴定,根据所得的结果可以从分子角度解释相关疾病产生的机制机理。
[0045] 实施例3
[0046] 脂类物质PE的筛选过程:
[0047] 首先,在动物血样正离子中筛选出满足脂类物质母离子的M/Z值范围,先选定M/Z整列,再进行筛选,母离子的M/Z值范围,为70.0-992.0,共筛选出797个;接着,在母离子中筛选出满足PE类物质质量范围的,选定M/Z值整列,进行筛选,筛选的质量范围为637.4806-916.6976,共筛出190个;其次,在满足PE类质量范围的所有数据中,用INT函数求的所有M/Z值的小数部分,再用PE类质量亏损范围进一步筛选,PE类的质量亏损范围为0.4369-0.7656,筛选完后PE类共得到157个;接着,将血样正离子中所有M/Z值加中性丢失,中性丢失为141.0,再次筛选出满足PE类质量范围的M/Z值,在此基础上进一步筛选满足PE类质量亏损范围的有1484个;最后,将筛选完的M/Z值到HMDB中查询,保留含有+ +
[M+H]和[M+Na] 的数据,共筛选出血样正离子中PE类有34个。通过对结果进行鉴定,可以将此分类方法应用于代谢组学及脂质组学当中,有助于以后临床检测及生物化学试剂盒研究。