拉曼光谱的峰位分析方法、系统、终端设备及介质转让专利

申请号 : CN202111608055.7

文献号 : CN113989578B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王晨卉何兆铭李贺军毕海王悦

申请人 : 季华实验室

摘要 :

本发明公开了一种拉曼光谱的峰位分析方法、系统、终端设备以及计算机可读存储介质,该拉曼光谱的峰位分析方法的步骤包括:基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从多个所述光谱区间确定最优光谱区间;获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析。本发明能够提高针对拉曼光谱峰位进行分析时的分析效率。

权利要求 :

1.一种拉曼光谱的峰位分析方法,其特征在于,所述拉曼光谱的峰位分析方法,包括:基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从多个所述光谱区间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均数;

获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;

根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析;

所述根据所述中间位置确定峰均值组的步骤,包括:将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱,其中,所述PCA特征向量基于所述滑动PCA模型和所述分类预测模型得到;

获取各个所述融合光谱中的多个特征峰位,和,多个所述特征峰位在各自所述中间位置处的峰均值,并基于多个所述峰均值确定各个所述融合光谱对应的峰均值组。

2.如权利要求1所述的拉曼光谱的峰位分析方法,其特征在于,所述将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱的步骤,包括:分别针对多个所述PCA特征向量进行归一化处理;

将归一化处理后的多个所述PCA特征向量与所述原始光谱按照点乘的方式进行融合得到多个所述PCA特征向量各自对应的所述融合光谱。

3.如权利要求1所述的拉曼光谱的峰位分析方法,其特征在于,在所述基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应F1分数,并基于多个所述F1分数从多个所述光谱区间确定最优光谱区间的步骤之前,还包括:

基于预设的初始PCA模型和预设的初始分类预测模型构建所述滑动PCA模型和所述分类预测模型。

4.如权利要求1所述的拉曼光谱的峰位分析方法,其特征在于,所述基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序的步骤,包括:在多个所述峰均值组中,分别将各所述峰均值组中的多个峰均值进行排序得到多个所述峰均值组各自对应的排序结果;

将各所述排序结果进行求和操作得到求和结果,并根据所述求和结果对所述原始光谱中的多个所述光谱峰位进行重要程度排序。

5.如权利要求4所述的拉曼光谱的峰位分析方法,其特征在于,所述针对排序后的多个光谱峰位进行分析的步骤,包括:

获取进行重要程度排序后的多个光谱峰位,并依次对多个所述光谱峰位进行分析。

6.如权利要求1所述的拉曼光谱的峰位分析方法,其特征在于,所述基于多个所述F1分数从多个所述光谱区间确定最优光谱区间的步骤,包括:从多个所述光谱区间各自的所述F1分数中确定最大的F1分数,并将所述最大的F1分数所对应的光谱区间设置为最优光谱区间。

7.一种拉曼光谱的峰位分析系统,其特征在于,所述拉曼光谱的峰位分析系统包括:划分模块,用于基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从多个所述光谱区间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均数;

获取模块,用于获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;

排序模块,用于根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析;

所述排序模块包括:

光谱融合单元,用于将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱,其中,所述PCA特征向量基于所述滑动PCA模型和所述分类预测模型得到;

确定单元,用于获取各个所述融合光谱中的多个特征峰位,和,多个所述特征峰位在各自所述中间位置处的峰均值,并基于多个所述峰均值确定各个所述融合光谱对应的峰均值组。

8.一种终端设备,其特征在于,所述终端设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的拉曼光谱的峰位分析程序,所述拉曼光谱的峰位分析程序被所述处理器执行时实现如权利要求1至6中任一项所述的拉曼光谱的峰位分析方法的步骤。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有拉曼光谱的峰位分析程序,所述拉曼光谱的峰位分析程序被处理器执行时实现如权利要求1至6中任一项所述的拉曼光谱的峰位分析方法的步骤。

说明书 :

拉曼光谱的峰位分析方法、系统、终端设备及介质

技术领域

[0001] 本发明涉及光谱分析领域,尤其是涉及一种拉曼光谱的峰位分析方法、系统、终端设备以及计算机可读存储介质。

背景技术

[0002] 拉曼光谱应用广泛,可用于物质鉴别和测试样品的指纹等。但是由于拉曼光谱较长,导致待测物品的拉曼光谱包含较多拉曼峰,在对待测物品进行分析时无法快速定位待
测样品中的指纹峰,即特征峰。并且目前市场上的拉曼光谱仪无法测量一个较大范围的拉
曼光谱,测试人员需要针对不同的拉曼位移进行测量得到光谱,进而将多个光谱进行拼接,
此种光谱拼接的方式会引入一系列的测量和分析误差。
[0003] 基于传统拉曼光谱分析法选择分析区域时,首先需要进行元素分析或者工业分析获得包含物质的指纹图谱,从而得到光谱特征参数与检测物质的关系,即获取用于后续分
析的拉曼峰的位置或者区域。在使用拉曼光谱进行定量分析时,通常设定一个分析窗口大
小,使用滑动窗口的偏最小二乘法寻找最优的分析区间。使用传统拉曼光谱分析法得到的
光谱峰位复杂,且耗时长,并且计算存在一定误差。此外需要具有较强的相关检测物质的技
术支撑,当测试物品成分复杂或者未知时无法快速计算用于分析的光谱区间。并且简单的
滑动窗口的方法很难获得指纹峰位。通常用于区分几种不同物品成分的物质包含多个拉曼
峰,而传统拉曼光谱分析法不能实现通过使用一个很小的窗口来锁定单个指纹峰,原因在
于窗口宽度减少到只包含单个或拉曼峰时预测模型将变得不可靠,导致得到的拉曼峰的重
要程度也将变得不可靠。
[0004] 综上,传统的拉曼光谱分析法的分析效率低下,并且可靠性低,不适用于复杂的测试环境。

发明内容

[0005] 本发明的主要目的在于提供一种拉曼光谱的峰位分析方法、系统、终端设备以及计算机可读存储介质,旨在提高针对拉曼光谱峰位进行分析时的分析效率。
[0006] 为实现上述目的,本发明提供一种拉曼光谱的峰位分析方法,所述拉曼光谱的峰位分析方法包括:
[0007] 基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从多个所述光谱区
间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均数;
[0008] 获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;
[0009] 根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析。
[0010] 可选地,所述根据所述中间位置确定峰均值组的步骤,包括:
[0011] 将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱,其中,所述PCA特征向量基于所述滑动PCA模型和所述分类预测模型得到;
[0012] 获取各个所述融合光谱中的多个特征峰位,和,多个所述特征峰位在各自所述中间位置处的峰均值,并基于多个所述峰均值确定各个所述融合光谱对应的峰均值组。
[0013] 可选地,在所述基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从
多个所述光谱区间确定最优光谱区间的步骤之前,还包括:
[0014] 基于预设的初始PCA模型和预设的初始分类预测模型构建所述滑动PCA模型和所述分类预测模型。
[0015] 可选地,所述将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱的步骤,包括:
[0016] 分别针对多个所述PCA特征向量进行归一化处理;
[0017] 将归一化处理后的多个所述PCA特征向量与所述原始光谱按照点乘的方式进行融合得到多个所述PCA特征向量各自对应的所述融合光谱。
[0018] 可选地,所述基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序的步骤,包括:
[0019] 在多个所述峰均值组中,分别将各所述峰均值组中的多个峰均值进行排序得到多个所述峰均值组各自对应的排序结果;
[0020] 将各所述排序结果进行求和操作得到求和结果,并根据所述求和结果对所述原始光谱中的多个所述光谱峰位进行重要程度排序。
[0021] 可选地,所述针对排序后的多个光谱峰位进行分析的步骤,包括:
[0022] 获取进行重要程度排序后的多个光谱峰位,并依次对多个所述光谱峰位进行分析。
[0023] 可选地,所述基于多个所述F1分数从多个所述光谱区间确定最优光谱区间的步骤,包括:
[0024] 从多个所述光谱区间各自的所述F1分数中确定最大的F1分数,并将所述最大的F1分数所对应的光谱区间设置为最优光谱区间。
[0025] 为实现上述目的,本发明还提供一种拉曼光谱的峰位分析系统,所述拉曼光谱的峰位分析系统,包括:
[0026] 划分模块,用于基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从
多个所述光谱区间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均数;
[0027] 获取模块,用于获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;
[0028] 排序模块,用于根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析。
[0029] 其中,本发明拉曼光谱的峰位分析系统的各个功能模块各自在运行时均实现如上所述的拉曼光谱的峰位分析方法的步骤。
[0030] 为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:存储器、处理器和存储在所述存储器上并可在所述处理器上运行的拉曼光谱的峰位分析程序,所述拉曼
光谱的峰位分析程序被所述处理器执行时实现如上所述的拉曼光谱的峰位分析方法的步
骤。
[0031] 此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有拉曼光谱的峰位分析程序,所述拉曼光谱的峰位分析程序被处理器执行
时实现如上所述的拉曼光谱的峰位分析方法的步骤。
[0032] 此外,为实现上述目的,本发明还提供计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上所述的拉曼光谱的峰位分析方法的
步骤。
[0033] 本发明提供一种拉曼光谱的峰位分析方法、系统、终端设备、计算机可读存储介质以及计算机程序产品,通过基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光
谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数
从多个所述光谱区间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均
数;获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个
所述光谱峰位对应的峰位区间的中间位置;根据所述中间位置确定峰均值组,基于多个所
述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰
位进行分析。
[0034] 相比于传统拉曼光谱分析法无法快速准确获取待检测物质的特征峰位,本发明基于滑动PCA模型和分类预测模型能够快速获取待检测物质的最优光谱区间和并对该最优光
谱区间中的多个光谱峰位进行排序,以针对排序后的多个光谱峰位进行分析,从而提升了
针对拉曼光谱峰位进行分析时的分析效率,和提升了分析结果的可靠性,能够适用于复杂
的测试环境。

附图说明

[0035] 图1为本发明实施例方案涉及的硬件运行环境的结构示意图;
[0036] 图2为本发明拉曼光谱的峰位分析方法一实施例的流程示意图;
[0037] 图3为本发明拉曼光谱的峰位分析方法一实施例涉及到的待检测物质拉曼光谱的最优光谱区间划分示意图;
[0038] 图4为本发明拉曼光谱的峰位分析方法一实施例涉及到的最优光谱区间示意图;
[0039] 图5为本发明拉曼光谱的峰位分析方法一实施例涉及到的最优光谱区间中的多个光谱峰位示意图;
[0040] 图6为本发明拉曼光谱的峰位分析方法一实施例的PCA特征向量的第一类型示意图;
[0041] 图7为本发明拉曼光谱的峰位分析方法一实施例的PCA特征向量的第二类型示意图;
[0042] 图8为本发明拉曼光谱的峰位分析方法一实施例的PCA特征向量的第三类型示意图;
[0043] 图9为本发明拉曼光谱的峰位分析方法一实施例第一融合光谱示意图;
[0044] 图10为本发明拉曼光谱的峰位分析方法一实施例第二融合光谱示意图;
[0045] 图11为本发明拉曼光谱的峰位分析方法一实施例第三融合光谱示意图;
[0046] 图12为本发明拉曼光谱的峰位分析方法一实施例各个融合光谱中的多个特征峰位的峰均值排序示意图;
[0047] 图13为本发明拉曼光谱的峰位分析系统一实施例功能模块示意图。
[0048] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0049] 应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0050] 如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
[0051] 需要说明的是,本发明实施例终端设备可以是用于辅助用户进行正确发音的设备,该终端设备具体可以是智能手机、个人计算机和服务器等。
[0052] 如图1所示,该设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。
用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口
1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接
口、无线接口(如WI‑FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器
(non‑volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器
1001的存储装置。
[0053] 本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0054] 如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及拉曼光谱的峰位分析程序。操作系统是管理和控制设备硬件和
软件资源的程序,支持拉曼光谱的峰位分析程序以及其它软件或程序的运行。在图1所示的
设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于与服务器
建立通信连接;而处理器1001可以用于调用存储器1005中存储的拉曼光谱的峰位分析程
序,并执行以下操作:
[0055] 基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从多个所述光谱区
间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均数;
[0056] 获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;
[0057] 根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析。
[0058] 进一步地,处理器1001还可以用于调用存储器1005中存储的拉曼光谱的峰位分析程序,还执行以下操作:
[0059] 将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱,其中,所述PCA特征向量基于所述滑动PCA模型和所述分类预测模型得到;
[0060] 获取各个所述融合光谱中的多个特征峰位,和,多个所述特征峰位在各自所述中间位置处的峰均值,并基于多个所述峰均值确定各个所述融合光谱对应的峰均值组。
[0061] 进一步地,在所述基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数
从多个所述光谱区间确定最优光谱区间的步骤之前,处理器1001还可以用于调用存储器
1005中存储的拉曼光谱的峰位分析程序,还执行以下操作:
[0062] 基于预设的初始PCA模型和预设的初始分类预测模型构建所述滑动PCA模型和所述分类预测模型。
[0063] 进一步地,处理器1001还可以用于调用存储器1005中存储的拉曼光谱的峰位分析程序,执行以下操作:
[0064] 分别针对多个所述PCA特征向量进行归一化处理;
[0065] 将归一化处理后的多个所述PCA特征向量与所述原始光谱按照点乘的方式进行融合得到多个所述PCA特征向量各自对应的所述融合光谱。
[0066] 进一步地,处理器1001还可以用于调用存储器1005中存储的拉曼光谱的峰位分析程序,还执行以下操作:
[0067] 在多个所述峰均值组中,分别将各所述峰均值组中的多个峰均值进行排序得到多个所述峰均值组各自对应的排序结果;
[0068] 将各所述排序结果进行求和操作得到求和结果,并根据所述求和结果对所述原始光谱中的多个所述光谱峰位进行重要程度排序。
[0069] 进一步地,处理器1001还可以用于调用存储器1005中存储的拉曼光谱的峰位分析程序,还执行以下操作:
[0070] 获取进行重要程度排序后的多个光谱峰位,并依次对多个所述光谱峰位进行分析。
[0071] 进一步地,处理器1001还可以用于调用存储器1005中存储的拉曼光谱的峰位分析程序,还执行以下操作:
[0072] 从多个所述光谱区间各自的所述F1分数中确定最大的F1分数,并将所述最大的F1分数所对应的光谱区间设置为最优光谱区间。
[0073] 参照图2,图2为本发明拉曼光谱的峰位分析方法第一实施例的流程示意图。
[0074] 在本实施例中,提供了拉曼光谱的峰位分析方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以不同于此处的顺序执行所示出或描述
的步骤。
[0075] 步骤S10,基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数从多个所
述光谱区间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均数;
[0076] 终端设备在获取到待检测物质的拉曼光谱后,将基于预先构建的滑动PCA模型和分类预测模型对该拉曼光谱进行光谱区间的划分,并得到基于该拉曼光谱的多个光谱区
间,在获取到多个光谱区间后将进一步确定到各个光谱区间的F1分数,以基于各个光谱区
间的F1分数从多个光谱区间中得到最优光谱区间。
[0077] 需要说明的是,在本实施例中,终端设备将滑动PCA模型和分类预测模型进行结合,并通过结合后的滑动PCA模型和分类预测模型对拉曼光谱进行划分,以实现拉曼光谱的
区间划分以及确定最优光谱区间和该最优光谱区间中的特征峰。
[0078] 具体地,例如,终端设备在通过结合后的滑动PCA模型和分类预测模型对拉曼光谱进行划分时,可将滑动窗口的初始宽度设置为1/4拉曼光谱长度,即划分完成的各个光谱区
间的宽度为1/4拉曼光谱长度,在本实施例中不对滑动窗口的初始宽度做具体限定,除了本
实施例中的1/4拉曼光谱长度,还可以为其它初始宽度。
[0079] 需要说明的是,在本实施例中,终端设备在通过滑动PCA模型和分类预测模型对拉曼光谱进行划分之前,为了使模型预测的准确率最大化,可对滑动PCA模型和分类预测模型
进行调优。
[0080] 具体地,例如,终端设备首先构建数据集以对滑动PCA模型和分类预测模型进行调优,其中,该数据集包括训练集数据和测试集数据,训练集数据和测试集数据属于多个不同
的生产或者采样批次,并且是在不同实验时间的测试采集得到。在本实施例中可使用K折交
叉验证的方法通过数据集调优滑动PCA模型和预测模型的超参数,其中超参数包括PCA特征
向量的数量、SVM模型的内核种类以及内核相关参数的调整等。
[0081] 进一步地,上述步骤S10中,“基于多个所述F1分数从多个所述光谱区间确定最优光谱区间”,可以包括:
[0082] 步骤S101,从多个所述F1分数中确定分数最高的F1分数,并将所述分数最高的F1分数所对应的光谱区间设置为最优光谱区间。
[0083] 终端设备在通过结合后的滑动PCA模型和分类预测模型对拉曼光谱进行划分得到多个光谱区间后,将进一步获取多个光谱区间的F1分数,进而从多个F1分数中确定最大的
F1分数,即最趋近于1的F1分数,该F1分数所对应的光谱区间即为最优光谱区间。
[0084] 需要说明的是,在本实施例中,F1分数是分类问题的一个衡量指标,F1分数是精确率和召回率的调和平均数,最大为1,最小为0。F1分数越趋近于1说明模型越稳健,在本实施
例中,可用FIk代表第k类别的F1分数,其中,F1k可以表示为:
[0085]
[0086] 其中,precisionk为第k类别的精确率,recallk为第k类别的召回率,
[0087]
[0088]
[0089] 其中,TPk为第k类别的真阳,FPk为第k类别的假阳,FNk为第k类别的假阴。
[0090] 具体地,例如,如图3所示的待检测物质拉曼光谱的最优光谱区间划分示意图,在本实施例中选取420至420+1000(窗口宽度)作为光谱分析区间,并给出了4种待分析酒类在
1000波数不同光谱片段上的F1分数曲线,并计算各个类别的F1分数的均值,对其进行平滑
处理后得到综合F1分数,进而计算均匀步长滑动下各个光谱分析区间的综合F1分数,以选
择综合F1分数最大的光谱分析区间作为最优光谱区间。如图4所示的最优光谱区间示意图,
若是基于滑动PCA模型和分类预测模型选择出的最优光谱区间的综合F1分数具有多个峰
位,则需要选取多个峰位进行特征峰相重要程度排序的分析,以根据峰位重要性排序的结
果对最优光谱区间中的多个峰位逐次进行分析。
[0091] 进一步地,本发明拉曼光谱的峰位分析方法,还可以包括:
[0092] 步骤S20,获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;
[0093] 终端设备在获取到最优光谱区间后,需要进一步确定该最优光谱区间内的原始光谱,其中,该原始光谱中包含了多个光谱峰位,并且,终端设备还需要获取原始光谱中多个
光谱峰位各自的峰位区间,以及确定该峰位区间的中心位置。
[0094] 具体地,例如,如图5所示的原始光谱中的多个光谱峰位示意图,在本实施例中,最优光谱区间中有两个样品的F1分数曲线,并且由于这两个样品的光谱十分接近,即两个样
品的F1分数峰值基本一致,因此在确定原始光谱中的多个光谱峰位时,可同时对两个样品
的光谱峰位进行标注。比如,在本实施例中,终端设备在对原始光谱中多个光谱峰位进行峰
位标注时将两个样品的各个光谱峰位标记为1号光谱峰位、2号光谱峰位、……、8号光谱峰
位,总共标记了8个光谱峰位,并分别确定1号光谱峰位的峰位区间的中间位置Ⅰ、2号光谱峰
位的峰位区间的中间位置Ⅱ、……、8号光谱峰位的峰位区间的中间位置Ⅷ,综上,总共获取
了8个光谱峰位的峰位区间的中间位置Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ和Ⅷ。在本实施例中不对峰位
区间中间位置的获取方式做具体限定。
[0095] 进一步地,本发明拉曼光谱的峰位分析方法,还包括:
[0096] 步骤S30,根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析。
[0097] 终端设备在获取到原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置后,将基于多个中心位置确定多个峰均值,并由多项峰均值构成对应
的峰均值组,以根据各个峰均值组中的多个峰均值的排序情况对原始光谱中的多个光谱峰
位进行排序,对针对排序后的各个光谱峰位进行分析。
[0098] 需要说明的是,在本实施例中,第一峰均值组中包含了在中心位置Ⅰ处的峰均值a1、在中心位置Ⅱ峰均值b1、……、在中心位置Ⅷ处的峰均值h1,同样的,第二峰均值组中包
含了在中心位置Ⅰ处的峰均值a2、在中心位置Ⅱ峰均值b2、……、在中心位置Ⅷ处的峰均值h2
等。
[0099] 进一步地,上述步骤S30中,“根据所述中间位置确定峰均值组”,可以包括:
[0100] 步骤S301,将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱,其中,所述PCA特征向量基于所述滑动PCA模型和所述分类预测模型得到;
[0101] 终端设备在基于滑动PCA模型和分类预测模型得到多个PCA特征向量后,将多个PCA特征向量分别与原始光谱进行融合,并得到多个融合光谱,其中,该融合光谱中包含了
多个特征峰位。
[0102] 需要说明的是,在本实施例中,终端设备在使用K折交叉验证的方法通过数据集调优滑动PCA模型和预测模型的超参数时可得到多个PCA特征向量,以及该PCA特征向量的数
量。
[0103] 具体地,例如,如图6所示的PCA特征向量的第一类型示意图、如图7所示的PCA特征向量的第二类型示意图以及如图8所示的PCA特征向量的第三类型示意图,PCA特征向量包
括峰位不明显、峰位向上、峰位向下三种类型,并且融合后的峰位峰值越高则说明该特征峰
位的影响作用越大。终端设备在将多个PCA特征向量分别与原始光谱进行融合时需要将峰
位不明显、对应峰位向上、对应峰位向下三种类型的PCA特征向量分别与原始光谱进行融
合,并且,由于原始光谱中包含了多个光谱峰位,因此多个PCA特征向量分别与原始光谱进
行融合实际是各个PCA特征向量分别与原始光谱中的多个光谱峰位进行融合。
[0104] 步骤S302,获取各个所述融合光谱中的多个特征峰位,和,多个所述特征峰位在各自所述中间位置处的峰均值,并基于多个所述峰均值得到各个所述融合光谱对应的峰均值
组;
[0105] 终端设备在将第一PCA特征向量、第二PCA特征向量和第三PCA特征向量分别与原始光谱进行融合得到第一融合光谱、第二融合光谱和第三融合光谱后,将进一步获取第一
融合光谱中的多个特征峰位和多个特征峰位在各自中心位置处的峰均值、第二融合光谱中
的多个特征峰位和多个特征峰位在各自中心位置处的峰均值和第三融合光谱中的多个特
征峰位和多个特征峰位在各自中心位置处的峰均值。
[0106] 需要说明的是,在本实施例中,不论是第一融合光谱、第二融合光谱还是第三融合光谱,各个融合光谱中的特征峰位的峰位区间的中心位置都为Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ和Ⅷ,
即仍旧是原始光谱中的8个光谱峰位的峰位区间的中心位置。在本实施例中,终端设备只将
三个类型的PCA特征向量与原始光谱进行融合得到了三个融合光谱和三个融合光谱对应的
三个峰均值组,但是,在本实施例中不对PCA特征向量的数量具体限定,即也不对融合光谱
和峰均值组的数量做具体限定,可根据样本的特性做具体设置。
[0107] 具体地,例如,终端设备获取第一融合光谱中的1号特征峰位在中心位置Ⅰ处的峰均值a1,2号特征峰位在中心位置Ⅱ处的峰均值b1、……、8号特征峰位在中心位置Ⅷ处的峰
均值h1,同样的,获取第二融合光谱中的1号特征峰位在中心位置Ⅰ处的峰均值a2,2号特征峰
位在中心位置Ⅱ处的峰均值b2、……、8号特征峰位在中心位置Ⅷ处的峰均值h2,获取第三融
合光谱中的1号特征峰位在中心位置Ⅰ处的峰均值a3,2号特征峰位在中心位置Ⅱ处的峰均
值b3、……、8号特征峰位在中心位置Ⅷ处的峰均值h3。
[0108] 进一步地,上述步骤S301中,“将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱”,可以包括:
[0109] 步骤S3011,分别针对多个所述PCA特征向量进行归一化处理;
[0110] 步骤S3012,将归一化处理后的多个所述PCA特征向量与所述原始光谱按照点乘的方式进行融合得到多个所述PCA特征向量各自对应的所述融合光谱。
[0111] 需要说明的是,在本实施例中,终端设备在基于滑动PCA模型和分类预测模型得到多个PCA特征向量后,需要先将多个PCA特征向量进行归一化处理,并将归一化后的多个PCA
特征向量与原始光谱进行融合,其中,多个PCA特征向量包括:第一PCA特征向量、第二PCA特
征向量和第三PCA特征向量等,而多个融合光谱包括:第一融合特征向量、第二融合特征向
量和第三融合特征向量等。并且,在本实施例中采用点乘的方式进行融合操作。
[0112] 具体地,例如,如图9所示的第一融合光谱示意图、如图10所示的第二融合光谱示意图以及如图11所示的第三融合光谱示意图,终端设备将第一PCA特征向量进行归一化处
理,并将归一化处理后的第一PCA特征向量与所述原始光谱按照点乘的方式进行融合得到
第一融合光谱,同样将第二PCA特征向量进行归一化处理,并将归一化处理后的第二PCA特
征向量与原始光谱按照点乘的方式进行融合得到第二融合光谱,将第三PCA特征向量进行
归一化处理,并将归一化处理后的第三PCA特征向量与所述原始光谱按照点乘的方式进行
融合得到第三融合光谱,如图9、图10和图11所示,第一融合光谱、第二融合光谱和第三融合
光谱中都包含了8个特征峰位,并且仍将8个特征峰位的峰位区间的中心位置默设置为原始
光谱中的8个光谱峰位的峰位区间的中心位置,以进一步获取该中心位置处峰均值,即在该
中心位置处的F1分数均值。另外,由于在本实施例中的原始光谱中包含了两个光谱特征相
似的样本的F1分数曲线,所以在将多个PCA特征向量与原始光谱按照点乘的方式进行融合
后,将得到包含样本A和样本B的融合光谱。
[0113] 具体地,例如,终端设备将第一PCA特征向量与原始光谱按照点乘的方式进行融合后,将得到样本A的F1分数曲线所对应的8个特征峰位,同样也得到样本B的F1分数曲线所对
应的8个特征峰位,由于样本A和样本B的光谱特征相似,所以默认设置样本A的F1分数曲线
所对应的8个特征峰位的峰位区间的中心位置与样本B的F1分数曲线所对应的8个特征峰位
的峰位区间的中心位置都为原始光谱中的8个光谱峰位的峰位区间的中心位置,即样本A的
8个特征峰位的峰位区间的中心位置也为Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ和Ⅷ,而样本B的8个特征峰
位的峰位区间的中心位置同样也为Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ和Ⅷ。比如,在计算中心位置a处
的峰值时,需要先获取样本A在中心位置a的峰值和样本B在中心位置a的峰值,进而获取中
心位置a处的峰均值。在本实施例中不对样品数量做具体限定。
[0114] 进一步地,上述步骤S30中,“基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序”,可以包括:
[0115] 步骤S303,在多个所述峰均值组中,分别将各所述峰均值组中的多个峰均值进行排序得到多个所述峰均值组各自对应的排序结果;
[0116] 终端设备在获取到第一峰均值组中的峰均值a1、峰均值b1、……、峰均值h1后,对峰均值a1、峰均值b1、……、峰均值h1按大小进行排序得到第一排序结果,同样的,将峰均值a2、
峰均值b2、……、峰均值h2也按大小进行排序得到第二排序结果,也将峰均值a3、峰均值
b3、……、峰均值h3按大小进行排序得到第三排序结果。
[0117] 具体地,例如,如图12所示的各个融合光谱中的多个特征峰位的峰均值排序示意图,终端设备按大小针对峰均值a1、峰均值b1、……、峰均值h1进行排序时,得到第一融合光
谱中的1号特征峰位在中心位置Ⅰ处的峰均值a1排序为2,2号特征峰位在中心位置Ⅱ处的峰
均值b1排序为1,3号特征峰位在中心位置Ⅲ处的峰均值c1排序为3,4号特征峰位在中心位置
Ⅳ处的峰均值d1排序为4,5号特征峰位在中心位置Ⅴ处的峰均值e1排序为7,6号特征峰位在
中心位置Ⅵ处的峰均值f1排序为5,7号特征峰位在中心位置Ⅶ处的峰均值g1排序为6,8号特
征峰位在中心位置Ⅷ处的峰均值h1排序为8。终端设备按大小针对峰均值a2、峰均值
b2、……、峰均值h2进行排序时,得到第二融合光谱中的1号特征峰位在中心位置Ⅰ处的峰均
值a2排序为3,2号特征峰位在中心位置Ⅱ处的峰均值b2排序为1,3号特征峰位在中心位置Ⅲ
处的峰均值c2排序为4,4号特征峰位在中心位置Ⅳ处的峰均值d2排序为7,5号特征峰位在中
心位置Ⅴ处的峰均值e2排序为8,6号特征峰位在中心位置Ⅵ处的峰均值f2排序为5,7号特征
峰位在中心位置Ⅶ处的峰均值g2排序为6,8号特征峰位在中心位置Ⅷ处的峰均值h2排序为
2。终端设备按大小针对峰均值a3、峰均值b3、……、峰均值h3进行排序时,得到第三融合光谱
中的1号特征峰位在中心位置Ⅰ处的峰均值a3排序为2,2号特征峰位在中心位置Ⅱ处的峰均
值b3排序为8,3号特征峰位在中心位置Ⅲ处的峰均值c3排序为5,4号特征峰位在中心位置Ⅳ
处的峰均值d3排序为6,5号特征峰位在中心位置Ⅴ处的峰均值e3排序为7,6号特征峰位在中
心位置Ⅵ处的峰均值f3排序为3,7号特征峰位在中心位置Ⅶ处的峰均值g3排序为4,8号特征
峰位在中心位置Ⅷ处的峰均值h3排序为1。
[0118] 步骤S304,将各所述排序结果进行求和操作得到求和结果,并根据所述求和结果对所述原始光谱中的多个所述光谱峰位进行重要程度排序。
[0119] 需要说明的是,在本实施例中,第一排序结果为2、1、3、4、7、5、6、8,第二排序结果为3、1、4、7、8、5、6、2,第三排序结果为2、8、5、6、7、3、4、2。
[0120] 具体地,例如,终端设备将第一排序结果、第二排序结果和第三排序结果进行求和,如图12所示的各个融合光谱中的多个特征峰位的峰均值排序示意图,比如,将第一融合
光谱中的一号特征峰位的峰均值的排序结果2、第二融合光谱中的一号特征峰位的峰均值
的排序结果3以及第三融合光谱中的一号特征峰位的峰均值的排序结果2进行求和,得到求
和结果为7,按照此种求和方式将第一排序结果、第二排序结果和第三排序结果进行求和得
到的求和结果为7、10、12、17、22、13、16、11。终端设备在获取到求和结果后,将该求和结果
按照从小到大的方式进行排序,排序结果为7、10、11、12、13、16、17、22,并按照排序结果对
原始光谱中的多个光谱峰位进行重要程度排序,此时排序结果“7”对应了原始光谱中的1号
光谱峰位,排序结果“10”对应了原始光谱中的2号光谱峰位,排序结果“11”对应了原始光谱
中的8号光谱峰位,排序结果“12”对应了原始光谱中的3号光谱峰位,排序结果“13”对应了
原始光谱中的6号光谱峰位,排序结果“16”对应了原始光谱中的7号光谱峰位,排序结果
“17”对应了原始光谱中的4号光谱峰位,排序结果“22”对应了原始光谱中的5号光谱峰位。
综上,终端设备将按照1号光谱峰位、2号光谱峰位、8号光谱峰位、3号光谱峰位、6号光谱峰
位、7号光谱峰位、4号光谱峰位和5号光谱峰位的顺序进行拉曼光谱分析。
[0121] 在本实施例中,终端设备在获取到待检测物质的拉曼光谱后,将基于预先构建的滑动PCA模型和分类预测模型对该拉曼光谱进行光谱区间的划分,并得到基于该拉曼光谱
的多个光谱区间,在获取到多个光谱区间后将进一步确定到各个光谱区间的F1 socre,以
基于各个光谱区间的F1 socre从多个光谱区间中得到最优光谱区间。终端设备在获取到最
优光谱区间后,需要进一步确定该最优光谱区间内的原始光谱,其中,该原始光谱中包含了
多个光谱峰位,并且,终端设备还需要获取原始光谱中多个光谱峰位各自的峰位区间,以及
确定该峰位区间的中心位置。终端设备在获取到原始光谱中的多个光谱峰位,并确定多个
所述光谱峰位对应的峰位区间的中间位置后,将基于多个中心位置确定多个峰均值,并由
多项峰均值构成对应的峰均值组,以根据各个峰均值组中的多个峰均值的排序情况对原始
光谱中的多个光谱峰位进行排序,对针对排序后的各个光谱峰位进行分析。
[0122] 本发明能够基于滑动PCA模型和分类预测模型快速获取待检测物质的最优光谱区间和该最优光谱区间中的多个光谱峰位,并对多个光谱峰位进行排序,以针对排序后的多
个光谱峰位进行分析。本发明提升了针对拉曼光谱峰位进行分析时的分析效率,和提升了
分析结果的可靠性,能够适用于复杂的测试环境。
[0123] 进一步地,基于上述本发明拉曼光谱的峰位分析方法的第一实施例,提出本发明报文处理方法的第二实施例。
[0124] 本实施例与上述第一实施例之间的主要区别在于,在上述步骤S10,“基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所
述光谱区间对应的F1 socre,并基于多个所述F1 socre从多个所述光谱区间确定最优光谱
区间”之前,还可以包括:
[0125] 步骤S50,基于预设的初始PCA模型和预设的初始分类预测模型构建所述滑动PCA模型和所述分类预测模型。
[0126] 终端设备在通过滑动PCA模型和分类预测模型对拉曼光谱进行划分之前,需要基于预设的初始PCA模型和预设的初始分类预测模型构建该滑动PCA模型和该分类预测模型。
[0127] 具体地,例如,基于初始PCA(Principal Component Analysis,主成分分析法)构建滑动PCA模型,而分类预测模型可以包括SVM(Support Vector Machines,支持向量机)或
者SVR(Support Vactor Regression,支持向量回归机)等。终端设备将滑动PCA模型和分类
预测模型进行结合,以根据结合后的滑动PCA模型和分类预测模型对拉曼光谱进行光谱区
间的划分。
[0128] 进一步地,上述步骤S30中,“针对排序后的多个光谱峰位进行分析”,可以包括:
[0129] 步骤S305,获取进行重要程度排序后的多个光谱峰位,并依次对多个所述光谱峰位进行分析。
[0130] 需要说明的是,在本实施例中,此时的进行重要程度排序后的多个光谱峰位的排序为1号光谱峰位、2号光谱峰位、8号光谱峰位、3号光谱峰位、6号光谱峰位、7号光谱峰位、4
号光谱峰位和5号光谱峰位。
[0131] 具体地,例如,终端设备在获取进行重要程度排序后的多个光谱峰位后,将按照重要程度排序对原始光谱中的多个光谱峰位依此进行分析,比如,终端设备将首先对1号光谱
峰位进行分析,进而对2号光谱峰位进行分析,依此类推,最后分析5号光谱峰位。通过分析
可以发现1、2号峰主要对应CH3基团非对称形变,8号峰主要对应的是C‑C‑0面内伸缩。结果
表明待测物主要的区别在于包含上述结构的分子所占比例。
[0132] 在本实施例中,终端设备在通过滑动PCA模型和分类预测模型对拉曼光谱进行划分之前,需要基于预设的初始PCA模型和预设的初始分类预测模型构建滑动PCA模型和分类
预测模型,以根据滑动PCA模型和分类预测模型对待检测物质的拉曼光谱进行分析,进而确
定待检测物质的特性。本发明能够快速获取待检测物质的拉曼光谱中已进行重要程度排序
后多个光谱峰位,进而按照重要程度排序对多个光谱峰位依此进行分析,以快速确定待检
测物质的特性。
[0133] 此外,本发明实施例还提出一种拉曼光谱的峰位分析系统,参照图13,图13为本发明拉曼光谱的峰位分析系统一实施例的功能模块示意图。如图13所示,本发明拉曼光谱的
峰位分析系统,包括:
[0134] 划分模块10,用于基于预设的滑动PCA模型和预设的分类预测模型对所述拉曼光谱进行划分得到多个光谱区间和多个所述光谱区间对应的F1分数,并基于多个所述F1分数
从多个所述光谱区间确定最优光谱区间,其中,所述F1分数为精确率和召回率的调和平均
数;
[0135] 获取模块20,用于获取所述最优光谱区间内的原始光谱和所述原始光谱中的多个光谱峰位,并确定多个所述光谱峰位对应的峰位区间的中间位置;
[0136] 排序模块30,用于根据所述中间位置确定峰均值组,基于多个所述峰均值组对所述原始光谱中的多个所述光谱峰位进行排序,并针对排序后的多个光谱峰位进行分析。
[0137] 进一步地,所述排序模块,包括:
[0138] 融合单元,用于将预设的多个PCA特征向量分别与所述原始光谱进行融合得到多个融合光谱,其中,所述PCA特征向量基于所述滑动PCA模型和所述分类预测模型得到;
[0139] 确定单元,用于获取各个所述融合光谱中的多个特征峰位,和,多个所述特征峰位在各自所述中间位置处的峰均值,并基于多个所述峰均值确定各个所述融合光谱对应的峰
均值组。
[0140] 进一步地,本发明拉曼光谱的峰位分析系统,还包括:
[0141] 构建模块,用于基于预设的初始PCA模型和预设的初始分类预测模型构建所述滑动PCA模型和所述分类预测模型。
[0142] 进一步地,所述融合单元,包括:
[0143] 归一子单元,用于分别针对多个所述PCA特征向量进行归一化处理;
[0144] 点乘模块,用于将归一化处理后的多个所述PCA特征向量与所述原始光谱按照点乘的方式进行融合得到多个所述PCA特征向量各自对应的所述融合光谱。
[0145] 进一步地,所述排序模块,还包括:
[0146] 排序单元,用于在多个所述峰均值组中,分别将各所述峰均值组中的多个峰均值进行排序得到多个所述峰均值组各自对应的排序结果;
[0147] 求和单元,用于将各所述排序结果进行求和操作得到求和结果,并根据所述求和结果对所述原始光谱中的多个所述光谱峰位进行重要程度排序。
[0148] 进一步地,所述排序模块,还包括:
[0149] 分析单元,用于获取进行重要程度排序后的多个光谱峰位,并依次对多个所述光谱峰位进行分析。
[0150] 进一步地,所述划分模块,包括:
[0151] 设置单元,用于从多个所述光谱区间各自的所述F1分数中确定最大的F1分数,并将所述最大的F1分数所对应的光谱区间设置为最优光谱区间。
[0152] 本发明拉曼光谱的峰位分析系统的各个功能模块的具体实施方式与上述拉曼光谱的峰位分析方法各实施例基本相同,在此不做赘述。
[0153] 此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有拉曼光谱的峰位分析程序,所述拉曼光谱的峰位分析程序被处理器执行时实现如
上所述的拉曼光谱的峰位分析方法的步骤。
[0154] 本发明拉曼光谱的峰位分析系统和计算机可读存储介质的各实施例,均可参照本发明拉曼光谱的峰位分析方法各个实施例,此处不再赘述。
[0155] 此外,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如以上拉曼光谱的峰位分析方法的任一项实
施例所述的拉曼光谱的峰位分析方法的步骤。
[0156] 本发明计算机程序产品的具体实施例与上述拉曼光谱的峰位分析方法的各实施例基本相同,在此不作赘述。
[0157] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而
且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有
的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该
要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0158] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0159] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下
前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做
出贡献的部分可以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如
ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务
器,或者网络设备等)执行本发明各个实施例所述的方法。
[0160] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技
术领域,均同理包括在本发明的专利保护范围内。