一种拉曼光谱匹配方法转让专利

申请号 : CN201610475210.5

文献号 : CN106198485B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杜靖熊胜军赵喜夏征

申请人 : 北京华泰诺安探测技术有限公司

摘要 :

本发明公开了一种拉曼光谱匹配方法,包括:步骤1,获得待测物质的拉曼光谱数据;步骤2,判断当前拉曼光谱数据是否具有可提取的特征峰,如果是执行步骤3,如果否执行步骤5;步骤3,确定当前拉曼光谱数据的特征峰的主峰,以主峰为中心确定此中心左方向和右方向的预设数据点的范围为当前分段的主峰区域,查找与主峰区域相匹配的特征峰,计算主峰区域的权重和相关系数;步骤4,从当前拉曼光谱数据中去除当前分段的主峰区域,执行步骤2;步骤5,计算各段的权重与相关系数的乘积之和,将此和与各分段的权重之和的比值作为最终的相关系数,判断匹配程度。本发明可以提高匹配精度,大样本量时误报率低。

权利要求 :

1.一种拉曼光谱匹配方法,其特征在于,包括:步骤1,获得待测物质的拉曼光谱数据;

步骤2,判断当前拉曼光谱数据是否具有可提取的特征峰,如果是,执行步骤3,如果否,执行步骤5;

步骤3,确定当前拉曼光谱数据的特征峰的主峰,以主峰为中心确定此中心左方向和右方向的预设数据点的范围为当前分段的主峰区域,在数据库中查找与所述主峰区域相匹配的特征峰,计算所述主峰区域的权重和相关系数;

步骤4,从当前拉曼光谱数据中去除当前分段的主峰区域,执行步骤2;

步骤5,计算各段的权重与相关系数的乘积之和,将此和与各分段的权重之和的比值作为最终的相关系数,根据此相关系数判断匹配程度。

2.如权利要求1所述的方法,其特征在于,包括:所述步骤3中所述预设数据点的个数为30~60个。

3.如权利要求2所述的方法,其特征在于,包括:所述步骤3中所述预设数据点的个数为50个。

4.如权利要求1所述的方法,其特征在于,包括:所述步骤3中判断当前拉曼光谱数据是否具有可提取的特征峰的方法包括:判断当前拉曼光谱数据中主峰的峰值大于或等于所述步骤1中拉曼光谱数据的主峰能量值的预设比值为具有可提取的特征峰,小于所述预设比值为不具有可提取的特征峰。

5.如权利要求4所述的方法,其特征在于,包括:所述预设比值为2%~4%。

6.如权利要求4所述的方法,其特征在于,包括:所述预设比值3%。

7.如权利要求1所述的方法,其特征在于,包括:所述步骤3中所述主峰区域的权重为此主峰区域的能量值、或者以此主峰区域的能量值为参数的函数值。

8.如权利要求6所述的方法,其特征在于,包括:以此主峰区域的能量值为参数的函数值是指此主峰区域的能量值平方值或开方值。

9.如权利要求1所述的方法,其特征在于,包括:所述步骤1之前还包括:将拉曼光谱数据进行归一化的处理,以及将数据库中全谱图进行归一化处理。

说明书 :

一种拉曼光谱匹配方法

技术领域

[0001] 本发明涉及拉曼光谱检测技术领域,尤其涉及一种拉曼光谱匹配方法。

背景技术

[0002] 现有技术中使用拉曼光谱进行物质匹配的方法主要采用特征峰匹配的方法以及拉曼光谱相关系数匹配的方法。
[0003] 关于特征峰匹配的方法,例如拉曼光谱物质检测快速样本查找方法中,包括以下步骤:建立特征库;在光谱仪测试区域,放入待检测物质样本,并进行拉曼光谱采集;遍历这组数据序列,得到待检测物质样本的最高峰数值Qmax,根据得到最低峰数值;在范围[Qmin,Qmax]内,得到各峰的位置与峰值,同时记录下峰的总数量Mall,进行峰的总数量匹配;对范围[Qmin,Qmax]内平均分的3个高度区间内的峰的数量进行匹配;在保留下来的指定物质样本中查找待检测物质样本。
[0004] 关于拉曼光谱相关系数匹配的方法,例如:利用拉曼光谱检测液体制剂的方法,包括以下步骤:1)获得本方法所需的各拉曼光谱,包括:对水进行拉曼检测,得到其拉曼光谱,以W表示;对空的液体制剂包装进行拉曼检测,得到其拉曼光谱,以B表示;对带有包装的液体制剂进行拉曼检测,得到其拉曼光谱,以DWB表示;通过光谱差减的方式获得液体制剂中活性成分的拉曼光谱,以D表示;对液体制剂中活性成分标准品的水溶液进行拉曼检测,得到包含有活性成分和水的参考拉曼光谱,以RDW表示;通过光谱差减的方式获得液体制剂中活性成分的参考拉曼光谱,以RD表示;对液体制剂中辅料对照品的水溶液进行拉曼检测,得到包含有辅料和水的参考拉曼光谱,以REW表示;通过光谱差减的方式获得液体制剂中辅料的参考拉曼光谱,以RE表示;2)定性鉴别:将液体制剂中活性成分的拉曼光谱和参考拉曼光谱进行对比,计算二者的相关系数,根据相关系数对液体制剂中的活性成分进行定性鉴别;3)定量计算液体制剂中各组分的浓度。
[0005] 现有技术中使用拉曼光谱进行物质匹配的方法主要采用特征峰匹配的方法以及拉曼光谱相关系数匹配的方法。
[0006] 现有的方法中,特征峰匹配精度低,对于大样本量误报率高;相关系数考虑整体匹配因素,但是忽略了信号部分的特性。

发明内容

[0007] 针对上述缺点,本发明提供了一种拉曼光谱匹配数据库方法。
[0008] 本发明提供的拉曼光谱匹配方法,包括:
[0009] 步骤1,获得待测物质的拉曼光谱数据;
[0010] 步骤2,判断当前拉曼光谱数据是否具有可提取的特征峰,如果是,执行步骤3,如果否,执行步骤5;
[0011] 步骤3,确定当前拉曼光谱数据的特征峰的主峰,以主峰为中心确定此中心左方向和右方向的预设数据点的范围为当前分段的主峰区域,在数据库中查找与所述主峰区域相匹配的特征峰,计算所述主峰区域的权重和相关系数;
[0012] 步骤4,从当前拉曼光谱数据中去除当前分段的主峰区域,执行步骤2;
[0013] 步骤5,计算各段的权重与相关系数的乘积之和,将此和与各分段的权重之和的比值作为最终的相关系数,根据此相关系数判断匹配程度。
[0014] 上述方法还可以具有以下特点:
[0015] 所述步骤3中所述预设数据点的个数为30~60个。
[0016] 上述方法还可以具有以下特点:
[0017] 所述步骤3中所述预设数据点的个数为50个。
[0018] 上述方法还可以具有以下特点:
[0019] 所述步骤3中判断当前拉曼光谱数据是否具有可提取的特征峰的方法包括:判断当前拉曼光谱数据中主峰的峰值大于或等于所述步骤1中拉曼光谱数据的主峰能量值的预设比值为具有可提取的特征峰,小于所述预设比值为不具有可提取的特征峰。
[0020] 上述方法还可以具有以下特点:
[0021] 所述预设比值为2%~4%。
[0022] 上述方法还可以具有以下特点:
[0023] 所述预设比值3%。
[0024] 上述方法还可以具有以下特点:
[0025] 所述步骤3中所述主峰区域的权重为此主峰区域的能量值、或者以此主峰区域的能量值为参数的函数值。
[0026] 上述方法还可以具有以下特点:
[0027] 以此主峰区域的能量值为参数的函数值是指此主峰区域的能量值平方值或开方值。
[0028] 上述方法还可以具有以下特点:
[0029] 所述步骤1之前还包括:将拉曼光谱数据进行归一化的处理,以及将数据库中全谱图进行归一化处理。
[0030] 本发明可以提高匹配精度,大样本量时误报率低。本发明不仅考虑到整体匹配因素,也兼顾了信号部分的特性。

附图说明

[0031] 图1是本发明中拉曼光谱匹配方法的流程图。具体实施例
[0032] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0033] 图1是本发明中拉曼光谱匹配方法的流程图,拉曼光谱匹配方法,包括:
[0034] 步骤1,获得待测物质的拉曼光谱数据;
[0035] 步骤2,判断当前拉曼光谱数据是否具有可提取的特征峰,如果是,执行步骤3,如果否,执行步骤5;
[0036] 步骤3,确定当前拉曼光谱数据的特征峰的主峰Peak_Max,以此主峰为中心确定此中心左方向和右方向的预设数据点的范围为当前分段(当前分段为第i次分段,其中i为大于零的整数)的主峰区域即Start_i至End_i,在数据库中查找与此主峰区域相匹配的特征峰,计算此主峰区域的权重Wi和相关系数Ci;
[0037] 其中,主峰区域的权重Wi为此主峰区域的能量值、或者以此主峰区域的能量值为参数的函数值(例如此主峰区域的能量值的平方或者开方)。
[0038] 相关系数的计算公式为:
[0039]
[0040] 其中,X为主峰区域的数据,Y为数据库中的主峰区域的数据,μX为数据X的平均值,μY为数据Y的平均值,σX为数据X的方差,σY为数据Y的方差,E为期望函数。
[0041] 步骤4,从当前拉曼光谱数据中去除当前分段的主峰区域,执行步骤2;
[0042] 步骤5,计算各段的权重与相关系数的乘积之和,将此和与各分段的权重之和的比值作为最终的相关系数,即根据下述公式计算系数相关系数C=∑CiWi/∑Wi,根据此相关系数判断匹配程度。
[0043] 上述方法中:
[0044] 步骤1中还包括以下处理:将拉曼光谱数据进行归一化的处理,以及将数据库中全谱图进行归一化处理。
[0045] 步骤2中判断当前拉曼光谱数据是否具有可提取的特征峰的方法包括:判断当前拉曼光谱数据中主峰的峰值大于或等于所述步骤1中拉曼光谱数据的主峰能量值的预设比值为具有可提取的特征峰,小于所述预设比值为不具有可提取的特征峰。经过多次实验,预设比值为2%~4%时匹配效率较高,更为优选的为3%。
[0046] 步骤3中预设数据点的个数为30~60个,优选为50个。
[0047] 本发明可以提高匹配精度,大样本量时误报率低。本发明不仅考虑到整体匹配因素,也兼顾了信号部分的特性。
[0048] 上面描述的内容可以单独地或者以各种方式组合起来实施,而这些变型方式都在本发明的保护范围之内。
[0049] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括…...”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
[0050] 以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。