会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 燃料种类 / 燃料 / 原油 / 一种原油种类的近红外光谱识别方法

一种原油种类的近红外光谱识别方法

阅读:539发布:2021-03-03

IPRDB可以提供一种原油种类的近红外光谱识别方法专利检索,专利查询,专利分析的服务。并且一种原油种类的近红外光谱识别方法,包括收集各种原油样品,取4628~4000cm‑1和6076~5556cm‑1谱区经二阶微分处理的吸光度建立原油样品近红外光谱数据库,将近红外光谱库进行主成分分析,取前14~16个主成分的光谱库得分矩阵T和光谱库载荷矩阵P;将待识别原油样品在上述特征谱区经二阶微分处理的吸光度构成矢量x,求得其主成分得分向量t,从光谱库得分矩阵T中选取与得分向量t相近的10~40个原油样品,将其光谱组成邻近光谱数据库,求得邻近光谱库各样品对x的识别参数,若所有的Qi值均不大于Qt,则没有与待识别原油相同的样品;若Qi>Qt,且i样品的每个移动相关系数均不小于0.9900,则待识别原油与邻近数据库中的i样品相同。该法可提高未知原油样品的识别速度。,下面是一种原油种类的近红外光谱识别方法专利的具体信息内容。

1.一种原油种类的近红外光谱识别方法,包括如下步骤:

(1)收集各种类型原油样品,将原油样品的近红外光谱进行二阶微分处理,选取4628~

4000cm-1和6076~5556cm-1谱区的吸光度建立原油样品近红外光谱数据库,将近红外光谱库进行主成分分析,取前14~16个主成分的光谱库得分矩阵T和光谱库载荷矩阵P,(2)测定待识别原油样品的近红外光谱并进行二阶微分处理,取4628~4000cm-1和6076~5556cm-1谱区的吸光度构成光谱矢量x,用光谱库载荷矩阵P乘以光谱矢量x,得待识别原油样品的得分向量t,以得分t为变量,从光谱库得分矩阵T中选取与得分向量t相近的10~

40个原油样品,将其光谱从近红外光谱数据库中提取出来组成邻近光谱数据库,(3)计算光谱矢量x与邻近光谱数据库每个样品在4628~4000cm-1和6076~5556cm-1谱区的每个移动相关系数,按式①计算每个数据库样品的识别参数Qi,式①中,rji为移动相关系数;i为所用光谱数据库中样品的序号,j为移动窗口的序号,n为移动窗口总数,m为所用光谱数据库样品总数,(4)计算阈值Qt,Qt=(d-w-0.15),其中d为近红外光谱的采样点数,w为移动窗口宽度;

若所有的Qi值均不大于Qt,则邻近数据库中没有与待识别原油相同的样品;若Qi>Qt,且i样品的每个移动相关系数均不小于0.9900,则待识别原油与邻近数据库中的i样品相同。

2.按照权利要求1所述的方法,其特征在于所述的近红外光谱吸光度的采样点间隔为2~16个波数。

3.按照权利要求1所述的方法,其特征在于所述的移动相关系数采用移动窗口测定。

4.按照权利要求1或3所述的方法,其特征在于所述的窗口宽度为3~25个采样点。

5.按照权利要求1或3所述的方法,其特征在于所述的移动相关系数的测定方法为:在特征光谱区间,从波数最低的采样点选择一个移动窗口的宽度,计算该窗口内的待识别原油样品与数据库中每个样品的吸光度的相关系数,然后将移动窗口向波数高的方向移动若干个采样点,为下一个移动窗口,计算此移动窗口内的待识别原油样品与数据库中每个样品的吸光度的相关系数,按上述方法连续移动移动窗口,计算每个移动窗口内待识别原油样品与数据库中每个样品的吸光度的相关系数。

6.按照权利要求5所述的方法,其特征在于每次移动移动窗口的距离为1~10个采样点。

7.按照权利要求1所述的方法,其特征在于(2)步通过欧式距离最小法从光谱库得分矩阵T中选取与得分向量t最相近的10~40个原油,所述的欧式距离按式②计算:式②中,dj为待识别测原油与得分矩阵T中第j个原油样品之间的距离;ti为待识别原油得分向量t中第i个得分变量,Tj,i为得分矩阵T中第j个原油样品的第i个得分变量,k为主成分数。

说明书全文

一种原油种类的近红外光谱识别方法

技术领域

[0001] 本发明为一种原油样品的光谱识别方法,具体地说,是一种用近红外光谱识别原油种类的方法。

背景技术

[0002] 原油评价在原油开采、原油贸易、原油加工等各个方面发挥着十分重要的作用,尽管目前已经建立了一套较为完整的原油评价方法,但是这些方法分析时间长、工作量大、成本高,远不能满足实际应用的需要。因此,目前大型石化企业都在基于多种现代仪器分析手段开发建立原油快速评价技术,包括色-质联用(GC-MS)、核磁共振(NMR)、近红外光谱(NIR)和红外光谱(IR)等,其中NIR方法由于测量方便、速度快、并可用于现场或在线分析而倍受青睐。
[0003] 与NIR测定其它油品如汽、柴油不同的是,原油评价指标多,例如仅原油的一般性质就有几十项,若加上各馏分的性质将有上百项。若采用传统的因子分析方法如偏最小二乘(PLS)建立逐个性质的校正模型显然是不可行的。将近红外光谱与原油性质数据库结合起来是较好解决这一问题的技术路线之一,即以NIR光谱为特征对待测原油进行识别,从NIR光谱库中识别出其品种,然后再从已有的原油性质数据库中调出其评价数据,从而实现原油快速评价的目的,为确定原油加工方案和优化生产决策及时获得评价数据提供了一种简捷的方法。
[0004] 现存的原油评价知识库大都具有原油比对的功能,通过待测原油的几个已知性质如密度、粘度、酸值、硫含量和残炭等从数据库中找出最相似的一种或多种原油,从而用这些近似的原油评价数据给出待测原油的评价数据。这类方法用到的识别参数是原油的一些基本性质,这些原油性质的测定相对繁琐,且测量时间长,提供的信息也不全面,限制了这种方式的应用普及。
[0005] 近红外光谱主要反映的是C-H、N-H和S-H等含氢官能团的信息,非常适合油品的定量和定性分析,原油的近红外光谱中包含了丰富的组成结构信息,具有很强的指纹性,且近红外光谱的采集方便、快速、成本低,因此,以近红外光谱为指纹特征对原油的品种进行识别将会成为一种快速简便的原油识别方式。
[0006] CN200910169611.8公开的“一种由近红外光谱快速识别原油种类的方法”基于移动窗口概念(Moving Window)结合传统相关系数法提出了一种用于原油近红外光谱快速识别的方法-移动窗口相关系数法。这种方法可以准确地对原油品种进行识别,并能给出不同原油近红外光谱之间详细的差异信息,为解析谱图提供有力帮助。但是,该方法数学计算量大,耗费的计算时间较长,对于一个包含上千条原油光谱的数据库,识别一种原油往往需要5min,限制了该方法的应用。

发明内容

[0007] 本发明的目的是提供一种原油种类的近红外光谱识别方法,该法可提高现有的原油种类近红外光谱快速识别方法的计算速度。
[0008] 本发明提供的原油种类的近红外光谱识别方法,包括如下步骤:
[0009] (1)收集各种类型原油样品,将原油样品的近红外光谱进行二阶微分处理,选取4628~4000cm-1和6076~5556cm-1谱区的吸光度建立原油样品近红外光谱数据库,将近红外光谱库进行主成分分析,取前14~16个主成分的光谱库得分矩阵T和光谱库载荷矩阵P,[0010] (2)测定待识别原油样品的近红外光谱并进行二阶微分处理,取4628~4000cm-1和
6076~5556cm-1谱区的吸光度构成光谱矢量x,用光谱库载荷矩阵P乘以光谱矢量x,得待识别原油样品的得分向量t,以得分t为变量,从光谱库得分矩阵T中选取与得分向量t相近的
10~40个原油样品,将其光谱从近红外光谱数据库中提取出来组成邻近光谱数据库,[0011] (3)计算光谱矢量x与邻近光谱数据库每个样品在4628~4000cm-1和6076~
5556cm-1谱区的每个移动相关系数,按式①计算每个数据库样品的识别参数Qi,
[0012]    ①
[0013] 式①中,rji为移动相关系数;i为所用光谱数据库中样品的序号,j为移动窗口的序号,n为移动窗口总数,m为所用光谱数据库样品总数,
[0014] (4)计算阈值Qt,Qt=(d-w-0.15),其中d为近红外光谱的采样点数,w为移动窗口宽度;
[0015] 若所有的Qi值均不大于Qt,则邻近数据库中没有与待识别原油相同的样品;若Qi>Qt,且i样品的每个移动相关系数均不小于0.9900,则待识别原油与邻近数据库中的i样品相同。
[0016] 本发明方法通过在建立的近红外光谱数据库中选择与待识别原油相近的原油样品,组成邻近数据库,再在邻近数据库中,通过移动窗口相关系数法,由识别参数确定与待识别原油样品一致的原油样品,减少了计算量,提高了识别速度。

附图说明

[0017] 图1为未知原油样品A与邻近光谱数据中Q值大于阈值的光谱的移动相关系数图。
[0018] 图2为未知原油样品B与邻近光谱数据中Q值大于阈值的光谱的移动相关系数图。
[0019] 图3为未知原油样品C与邻近光谱数据中Q值大于阈值的光谱的移动相关系数图。

具体实施方式

[0020] 本发明对于待测原油样本,利用主成分分析,大大缩小了近红外光谱数据库的信息量,再结合欧式距离最小的方法从原油近红外光谱数据库中选出与待测原油最接近的10~40个原油样品,用这些原油样品的光谱组成新的且数量小的邻近光谱数据库,再利用移动窗口相关系数方法从邻近数据库中识别与待测原油一致的原油样品。由于本发明方法不用在数量较大的近红外原油光谱数据中进行移动窗口相关系数的运算,而是在数量较少的邻近光谱数据库中进行移动窗口相关系数的运算,从而大大减少了计算量,具有更快的识别速度,可将由上千个样本构成的数据库的识别时间由5min降至为20s。
[0021] 主成分分析(PCA)方法是一种有效的光谱特征压缩方法,它把原有的各个光谱吸光度值特征利用线性变换得到一批新的特征,每个特征都是原有光谱在每个波长吸光度下的函数,但新特征总数远少于原有的光谱波长变量,这样新特征既保留了原有光谱的主要信息,又减少了光谱波长变量的个数。
[0022] 本发明方法(1)步为建立原油样品近红外光谱数据库,收集的有代表性的原油样品数量优选200~800个。
[0023] 对原油样品近红外光谱数据库样品进行主成分分析后,取前14~16个主成分的光谱库得分矩阵T和光谱库载荷矩阵P。所述的主成分可选择14~16之间的任何整数,如对于一个由1000个原油光谱、每个光谱有1500个波长点构成的原油光谱数据库,通过主成分分析,选前15个主成分,可将其压缩为1000个原油,每种原油由15个新的特征变量构成的数据库。
[0024] 本发明方法(2)步为按与建库同样的方法对待识别原油样品的近红外光谱进行主成分分析,先对待识别原油样品的近红外光谱进行二阶微分处理,取4628~4000cm-1和6076-1~5556cm 谱区的吸光度构成光谱矢量x,用光谱库载荷矩阵P乘以光谱矢量x,计算出待识别原油样品的得分向量t,以得分t为变量,通过欧式距离方法,从光谱库得分矩阵T中选取与得分向量t最相近的10~30个原油。
[0025] (2)步优选通过欧式距离最小法从光谱库得分矩阵T中选取与得分向量t最相近(欧式距离最小)的10~40个原油,所述的欧式距离按式②计算:
[0026]    ②
[0027] 式②中,dj为待识别原油与得分矩阵T中第j个原油样品之间的距离;ti为待识别原油得分向量t中第i个得分变量,Tj,i为得分矩阵T中第j个原油样品的第i个得分变量,k为主成分数,优选14~16的整数。
[0028] 将上述选出的相近原油样品的近红外光谱从近红外光谱数据库中调出,组成邻近光谱数据库。
[0029] 本发明方法(3)步是利用邻近光谱数据库识别待测(待识别)原油样品,即将待识别原油光谱矢量x与邻近光谱数据库中的样品进行比对,计算其移动相关系数,再计算识别参数,将识别参数大于阈值的样品挑出,如果其每个移动相关系数均不小于0.9900,则待识别原油与邻近数据库中的i样品相同,可将i样品的物性数据作为待识别原油的物性数据,对其进行评价。
[0030] 本发明所述的近红外光谱为扫描波数范围内各采样点对应的吸光度,所述的采样点间隔为2~16个波数,由近红外光谱仪的分辨率决定。
[0031] 本发明方法采用移动相关系数的总和为识别参数,作为判断待测原油样品是否与光谱数据库中的原油样品相同的条件之一。传统的相关系数常用来比较两个光谱的相似程度,计算时所有光谱变量都参与运算,最终得到一个相关系数值,其计算公式如式③:
[0032]    ③
[0033] 式③中, 分别为第i个和第j个光谱所有波数点吸光度的均值,n为波数采样点数,k为波数采样序号。两个光谱越接近,它们之间的相似系数越接近于1或-1。
[0034] 所述的移动窗口是选择一个宽度为w的光谱窗口,从整个光谱的第一个波数采样点开始移动,每次移动一至多个波数的采样间隔,为窗口的移动距离,直至最后一个波数的采样点。移动窗口的移动方向可以是从波数小的采样点向波数大的采样点移动,也可以是从波数大的采样点向波数小的采样点移动。每次移动移动窗口的距离为1~10个采样点。
[0035] 本发明所述的移动相关系数是指对于要比较的两个光谱,对每一个移动窗口波数区都用传统的相关系数公式计算出两个要比较的相关系数―移动相关系数,得到一系列的子波数区的移动相关系数。所述的子波数区为一个移动窗口的宽度。
[0036] 所述的移动相关系数的测定方法为:在特征光谱区间,从波数最低的采样点选择一个移动窗口的宽度,计算该窗口内的待识别原油样品与数据库中每个样品的吸光度的相关系数,然后将移动窗口向波数高的方向移动若干个采样点,为下一个移动窗口,计算此移动窗口内的待识别原油样品与数据库中每个样品的吸光度的相关系数,按上述方法连续移动移动窗口,计算每个移动窗口内待识别原油样品与数据库中每个样品的吸光度的相关系数。
[0037] 将得到的相关系数值与对应移动窗口的起始位置作图,即得到移动相关系数图。从该图中可以方便地看出两个光谱之间的相似程度,若两个光谱完全相同,则在整个光谱范围内的移动相关系数值都为1,若两个光谱只是在某一区间存在差异,则该区间的相关系数值将明显下降。显然,相对于传统的基于整个光谱的相关系数,移动相关系数可以分辨出存在细微差异的两个光谱,提高谱图的识别准确率,并有利于隐含信息的提取。
[0038] 在移动相关系数计算中,移动窗口的宽度应是一个固定值,优选3~25个采样点。移动窗口宽度过小,虽有助于细节信息的辨别,但会存在不能准确识别同一种原油的风险。
移动窗口宽度过大,虽可以排除外界测试条件如温度和湿度等的影响,但会存在错误识别的风险。
[0039] 利用本发明所述的识别参数进行原油种类识别的方法为:计算所用光谱数据库所有样品与待识别原油样品的移动相关系数,将所有移动窗口的相关系数相加,得到每个数据库样品的识别参数Qi。将Qi与阈值Qt相比,如果所有的Qi都不大于阈值Qt,说明数据库中不含待测原油样本的种类。
[0040] 本发明方法适用于从已建的原油样品数据库中快速识别与待测原油样品相同的原油样品,快速预测待识别原油样品的物性数据,进行快速测评。
[0041] 下面通过实例详细说明本发明,但本发明并不限于此。
[0042] 测定原油近红外光谱的仪器采用Thermo AntarisII傅立叶变换近红外光谱仪,光谱范围3800~10000cm-1,分辨率8cm-1,采样间隔为4cm-1,累积扫描次数64次,透射测量方式。
[0043] 实例1
[0044] 建立原油样品近红外光谱数据库
[0045] 收集有代表性的原油样品655种,原油品种基本覆盖了世界主要原油产区。测定原-1 -1油样品的近红外光谱,对其进行二阶微分,取6076.0~5556.0cm 与4628.0~4000.0cm 光谱范围的吸光度,建立原油样品的近红外光谱数据库X,X的维数为655×289,其中655为收集原油的样品数,289为近红外光谱吸光度的采样点数。
[0046] 将X进行主成分分析,得到光谱库得分矩阵T和光谱库载荷矩阵P,T的维数为655×15,其中655为收集原油的样品数,15为主因子数;P的维数为289×15,其中289为近红外光谱吸光度的采样点数,15为主因子数。
[0047] 实例2
[0048] 以下实例按本发明方法对未知原油样品进行识别。
[0049] (1)组建邻近光谱数据库
[0050] 按照与建立近红外光谱数据库X相同的条件,测定表1中未知原油A的近红外光谱,-1 -1对其进行二阶微分,取6076.0~5556.0cm 与4628.0~4000.0cm 光谱范围的吸光度构成矢量xA,其维数为1×289。用光谱库载荷矩阵P乘以矢量xA得到待识别原油A的得分向量t,其维数为1×15。
[0051] 以得分向量t为特征,按式②计算得分向量t与光谱库得分矩阵T中每个样品的欧氏距离,式②中的k=15。
[0052] 从光谱库得分矩阵T中,选取与t距离最小的30个样本,其对应的近红外光谱数据库X中的样本序号分别为:240、024、105、092、534、155、633、526、437、409、501、124、031、162、163、505、008、004、622、591、593、153、360、628、159、567、208、152、480、231,将这30个样本在特征谱区的吸光度从近红外光谱数据库X中提取出来,组成邻近光谱数据库Xm。
[0053] (2)识别未知原油种类
[0054] 对邻近光谱数据库Xm和光谱矢量xA,分别从4000.0cm-1处开始取对应的一段光谱区间作为移动窗口,移动窗口取10个采样间隔,每个采样点间隔为4cm-1,即移动宽度为11个采样点。第1个移动窗口的光谱范围为4000.0cm-1~4040cm-1,计算Xm中每一个光谱与光谱矢量xA在这一光谱范围内的吸光度之间的相关系数,记为r1,i,i=1,2,…,30。然后,移动一个取样间隔,即计算4004.0cm-1~4044cm-1光谱范围内,光谱数据库Xm中每一个光谱和光谱矢量xA之间的相关系数,记为r2,i,i=1,2,…,30。依次类推,直至计算到最后一个移动窗口6036.0~6076.0cm-1的相关系数,记为r279,i,i=1,2,…,30。
[0055] 分别计算光谱矢量xA与Xm中每一个库光谱的识别参数Qi,其中 i=1,2,…,30。阈值Qt=n-w-0.15=289-11-0.15=277.85。
[0056] 经计算得出邻近光谱数据库中,序号为105原油样品的Q105值为277.9675,大于阈值Qt,且每一个移动相关系数值r1,105、r2,105、…、r279,105都不小于0.9900,移动相关系数图见图1,说明未知原油样本A与近红外光谱数据库X中序号为105号的原油样品一致。
[0057] 实例3
[0058] (1)组建邻近光谱数据库
[0059] 按照与建立近红外光谱数据库X相同的条件,测定表1中未知原油B的近红外光谱,对其进行二阶微分,取6076.0~5556.0cm-1与4628.0~4000.0cm-1光谱范围的吸光度构成矢量xB,其维数为1×289。用光谱库载荷矩阵P乘以矢量xB得到待识别原油B的得分向量t,其维数为1×15。
[0060] 以得分向量t为特征,按式②计算得分向量t与光谱库得分矩阵T中每个样品的欧氏距离,式②中的k=15。
[0061] 从光谱库得分矩阵T中,选取与t距离最小的20个样本,其对应的近红外光谱数据库X中的样本序号分别为:201、111、212、001、018、502、089、132、158、481、357、601、257、509、099、189、412、332、215、092,将这20个样本在特征谱区的吸光度从近红外光谱数据库X中提取出来,组成邻近光谱数据库Xm。
[0062] (2)识别未知原油种类
[0063] 对邻近光谱数据库Xm和光谱矢量xB,按实例2(2)步的方法计算光谱矢量xB与Xm中每一个库光谱的识别参数Qi,得知邻近光谱数据库中序号212的原油样品的Q212值为277.9514,大于阈值Qt,且每一个移动相关系数值r1,212、r2,212、…、r279,212都不小于0.9900,其移动相关系数图见图2,说明未知原油B与近红外光谱数据库X中序号为212的原油样品一致。
[0064] 实例4
[0065] (1)组建邻近光谱数据库
[0066] 按照与建立近红外光谱数据库X相同的条件,测定表1中未知原油C的近红外光谱,对其进行二阶微分,取6076.0~5556.0cm-1与4628.0~4000.0cm-1光谱范围的吸光度构成矢量xC,其维数为1×289。用光谱库载荷矩阵P乘以矢量xC得到待识别原油C的得分向量t,其维数为1×15。
[0067] 以得分向量t为特征,按式②计算得分向量t与光谱库得分矩阵T中每个样品的欧氏距离,式②中的k=15。
[0068] 从光谱库得分矩阵T中,选取与t距离最小的15个样本,其对应的近红外光谱数据库X中的样本序号分别为:104、259、260、614、358、009、058、132、625、152、292、654、222、029、434,将这15个样本在特征谱区的吸光度从近红外光谱数据库X中提取出来,组成邻近光谱数据库Xm。
[0069] (2)识别未知原油种类
[0070] 对邻近光谱数据库Xm和光谱矢量xC,按实例2(2)步的方法计算光谱矢量xC与Xm中每一个库光谱的识别参数Qi,得知邻近光谱数据库中序号009的原油样品的Q009值为277.8900,大于阈值Qt,且每一个移动相关系数值r1,212、r2,212、…、r279,212都不小于0.9900,其移动相关系数图见图3,说明未知原油C与近红外光谱数据库X中序号为009的原油样品一致。
[0071] 表1
[0072]
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用