基于多源光谱并联融合的食用油种类快速鉴别方法转让专利
申请号 : CN201810120412.7
文献号 : CN108362659B
文献日 : 2021-03-30
发明人 : 郑晓 , 曾山 , 涂斌 , 王杰
申请人 : 武汉轻工大学
摘要 :
权利要求 :
1.一种基于多源光谱并联融合的食用油种类快速鉴别方法,其特征在于,包括:步骤一、样品选取:选取至少一个种类的若干食用油样品;
其中,收集大豆油、花生油、菜籽油、茶籽油、稻米油、玉米油、葵花籽油、橄榄油8类食用油样品共157份,采用SPXY算法按3:1的比例选取训练集食用油样品118份和预测集食用油样品39份;
步骤二、光谱采集:分别采集若干所述食用油样品的近红外光谱图和拉曼光谱图;
其中,分别采用近红外光谱仪和拉曼光谱仪采集157份食用油样品的近红外光谱图和拉曼光谱图;
所述步骤二中近红外光谱的采集过程如下:将待采集的食用油样品置于样品池中,设置近红外光谱仪的测定范围为1350~1800nm,第一阶段,将食用油样品加热至温度为20℃,采集得到第一近红外光谱图;第二阶段,将食用油样品加热至温度为40℃,采集得到第二近红外光谱图;第三阶段,将食用油样品加热至温度为60℃,采集得到第三近红外光谱图;最终将所述第一近红外光谱图、第二近红外光谱图与第三近红外光谱图的平均值作为所述食用油样品的近红外光谱图;所述步骤二中近红外光谱采集的第一阶段中设置近红外光谱仪‑1
的扫描次数为32次,分辨率为3.5cm ,采用光程为5mm的光程插片置于样品池中;近红外光‑1
谱采集的第二阶段中设置近红外光谱仪的扫描次数为64次,分辨率为3cm ,采用光程为
15mm的光程插片置于样品池中;近红外光谱采集的第三阶段中设置近红外光谱仪的扫描次‑1
数为16次,分辨率为4cm ,采用光程为10mm的光程插片置于样品池中;
所述步骤二中拉曼光谱采集过程如下:将待采集的食用油样品置于样品池中,设置拉‑1
曼光谱仪的测定范围为780~1780cm ,第一阶段,将食用油样品加热至温度为20℃,采集得到第一拉曼光谱图;第二阶段,将食用油样品加热至温度为40℃,采集得到第二拉曼光谱图;第三阶段,将食用油样品加热至温度为60℃,采集得到第三拉曼光谱图;最终将所述第一拉曼光谱图、第二拉曼光谱图与第三拉曼光谱图的平均值作为所述食用油样品的拉曼光谱图;所述步骤二中拉曼光谱采集的第一阶段中设置拉曼光谱仪的积分时间为10秒,激光功率为220MW,采用光程为5mm的光程插片置于样品池中;拉曼光谱采集的第二阶段中设置拉曼光谱仪的积分时间为30秒,激光功率为320MW,采用光程为15mm的光程插片置于样品池中;拉曼光谱采集的第三阶段中设置拉曼光谱仪的积分时间为20秒,激光功率为270MW,采用光程为10mm的光程插片置于样品池中;
步骤三、光谱预处理:分别对若干所述食用油样品的近红外光谱图和拉曼光谱图进行预处理,得到若干所述食用油样品的预处理近红外光谱图和预处理拉曼光谱图;
步骤四、特征变量提取:分别对若干所述食用油样品的的预处理近红外光谱图和预处理拉曼光谱图进行特征变量提取,得到若干所述食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量;首先采用竞争性自适应重加权采样方法对所述食用油样品的预处理近红外光谱图和预处理拉曼光谱图进行一次特征变量提取,得到一次近红外光谱图特征变量和一次拉曼光谱图特征变量;然后采用稀疏字典学习对所述一次近红外光谱图特征变量和一次拉曼光谱图特征变量进行二次特征变量提取,得到所述食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量;采用竞争性自适应重加权采样方法对所述食用油样品的预处理近红外光谱图和预处理拉曼光谱图进行一次特征变量提取,选择波长变量子集时采用
10折偏最小二乘法交叉验证建模,设置蒙特卡罗采样次数为1~50次,当偏最小二乘法交叉验证模型的均方根误差值最小时,得到一次近红外光谱图特征变量和一次拉曼光谱图特征变量;采用稀疏字典学习对所述一次近红外光谱图特征变量和一次拉曼光谱图特征变量进行二次特征变量提取,设置冗余字典参数k=16×16×3,设置平衡误差参数 设置权重参数λ=30/σ,依次采用正交匹配追踪法和K‑奇异值分解方法进行迭代优化,设置迭代次数为2~20次,得到所述食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量;
其中,采用竞争性自适应重加权采样和稀疏字典学习联用对157份食用油样品的近红外光谱图进行特征提取:首先采用竞争性自适应重加权采样方法对食用油样品的近红外光谱图进行一次特征变量提取,选择波长变量子集时采用10折偏最小二乘法交叉验证建模,设置蒙特卡罗采样次数为1~50次,当蒙特卡罗采样次数为第39次时,偏最小二乘法交叉验证模型的均方根误差值最小为1.4839,提取的一次光谱图特征变量为56个;然后采用稀疏字典学习对所述56个一次光谱图特征变量进行二次特征变量提取,设置冗余字典参数k=
16×16×3,设置平衡误差参数 设置权重参数λ=30/σ,依次采用正交匹配追踪法和K‑奇异值分解方法进行迭代优化,设置迭代次数为2~20次,当取σ=25且迭代次数为
10次时,得到均方根误差值最小为0.2572,二次提取得到的光谱图特征变量为28个;
采用竞争性自适应重加权采样和稀疏字典学习联用对157份食用油样品的拉曼光谱图进行特征提取:首先采用竞争性自适应重加权采样方法对食用油样品的拉曼光谱图进行一次特征变量提取,选择波长变量子集时采用10折偏最小二乘法交叉验证建模,设置蒙特卡罗采样次数为1~50次,当蒙特卡罗采样次数为第36次时,偏最小二乘法交叉验证模型的均方根误差值最小为0.5872,提取的一次光谱图特征变量为68个;然后采用稀疏字典学习对所述68个一次光谱图特征变量进行二次特征变量提取,设置冗余字典参数k=16×16×3,设置平衡误差参数 设置权重参数λ=30/σ,依次采用正交匹配追踪法和K‑奇异值分解方法进行迭代优化,设置迭代次数为2~20次,当取σ=25且迭代次数为16次时,得到均方根误差值最小为0.3684,二次提取得到的光谱图特征变量为32个;
步骤五、定性模型建立:将若干所述食用油样品分为训练集和测试集,并根据训练集中的食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量,依次建立近红外训练集定性模型和拉曼训练集定性模型;
其中,将训练集中的118份食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量分别作为定性模型的输入变量,通过支持向量机分类方法依次建立近红外训练集定性模型和拉曼训练集定性模型;采用粒子群优化算法对近红外训练集定性模型和拉曼训练集定性模型中的惩罚因子C和核函数参数g进行优化,优化时设置惩罚因子C和核函数参数g的范‑20 20
围均为2 ~2 ,设置交互验证参数V的范围为2~10;
步骤六、种类鉴别:
分别采用近红外训练集定性模型和拉曼训练集定性模型对预测集中的食用油样品进行种类鉴别;将近红外训练集定性模型和拉曼训练集定性模型对预测集中的食用油样品种类鉴别相同且种类鉴别正确的食用油样品放入步骤五中的训练集中,并重新建立近红外训练集定性模型和拉曼训练集定性模型;并利用重新建立的近红外训练集定性模型和拉曼训练集定性模型对预测集中剩余的食用油样品进行种类鉴别;依此循环直至最终的近红外训练集定性模型和拉曼训练集定性模型对预测集中最终剩余的食用油样品种类鉴别不相同且种类鉴别不正确为止;
其中,分别采用近红外训练集定性模型和拉曼训练集定性模型对预测集中的39份食用油样品进行种类鉴别;得到近红外训练集定性模型和拉曼训练集定性模型对预测集中的32份食用油样品的种类鉴别相同且种类鉴别正确,将该32份食用油样品放入步骤五中的训练集中,得到新的训练集食用油样品150份,并重新建立近红外训练集定性模型和拉曼训练集定性模型;并利用重新建立的近红外训练集定性模型和拉曼训练集定性模型对预测集中剩余的7份食用油样品进行种类鉴别,得到对预测集中的4份食用油样品的种类鉴别相同且种类鉴别正确,将该4份食用油样品放入步骤五中的训练集中,得到新的训练集食用油样品
154份,并再次建立近红外训练集定性模型和拉曼训练集定性模型;并利用再次建立的近红外训练集定性模型和拉曼训练集定性模型对预测集中剩余的3份食用油样品进行种类鉴别,得到对预测集中的3份食用油样品种类鉴别不相同且种类鉴别不正确,将该3份食用油样品放入奇异样本中,而另外由154份食用油样品最终建立的近红外训练集定性模型和拉曼训练集定性模型则可作为并联融合的食用油种类鉴别模型。
2.如权利要求1所述的基于多源光谱并联融合的食用油种类快速鉴别方法,其特征在于,对所述食用油样品的近红外光谱图进行移动平均11点平滑法消除光谱噪声,并采用自适应迭代重加权惩罚最小二乘算法进行基线校正,得到食用油样品的预处理近红外光谱图;对所述食用油样品的拉曼光谱图依次进行Savitzky‑Golay滤波9点平滑消除光谱噪声、‑1
并以1445cm 处的特征峰强度为基准进行归一化处理,得到食用油样品的预处理拉曼光谱图。
3.如权利要求1所述的基于多源光谱并联融合的食用油种类快速鉴别方法,其特征在于,所述步骤五中定性模型的建立过程如下:将训练集中的食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量分别作为定性模型的输入变量,通过支持向量机分类方法依次建立近红外训练集定性模型和拉曼训练集定性模型;采用粒子群优化算法对近红外训练集定性模型和拉曼训练集定性模型中的惩罚因子C和核函数参数g进行优化,优化时设置惩‑20 20
罚因子C和核函数参数g的范围均为2 ~2 ,设置交互验证参数V的范围为2~10。
说明书 :
基于多源光谱并联融合的食用油种类快速鉴别方法
技术领域
背景技术
的食用油中有着不同的多种特征成分含量组成;另外,由于多种特征成分的含量主要决定
了食用油的营养价值,故通常作为评价食用油品质的重要成分指标,同时也是确定其商业
价值的重要依据。随着食用油价格不断的提高,许多不法商家为了牟取暴利,将低价值油冒
充高价值油投入市场,或将低价值油掺入高价值油中,严重侵害着消费者和合法生产销售
企业的利益。因此,有必要研究一种快速鉴别食用油种类的方法,对维护消费者及合法经营
者利益、维持食用油市场正常秩序具有重要意义。
发明内容
二、光谱采集:分别采集若干所述食用油样品的近红外光谱图和拉曼光谱图;步骤三、光谱
预处理:分别对若干所述食用油样品的近红外光谱图和拉曼光谱图进行预处理,得到若干
所述食用油样品的预处理近红外光谱图和预处理拉曼光谱图;步骤四、特征变量提取:分别
对若干所述食用油样品的的预处理近红外光谱图和预处理拉曼光谱图进行特征变量提取,
得到若干所述食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量;步骤五、定性
模型建立:将若干所述食用油样品分为训练集和测试集,并根据训练集中的食用油样品的
近红外光谱图特征变量和拉曼光谱图特征变量,依次建立近红外训练集定性模型和拉曼训
练集定性模型;步骤六、种类鉴别:分别采用近红外训练集定性模型和拉曼训练集定性模型
对预测集中的食用油样品进行种类鉴别;将近红外训练集定性模型和拉曼训练集定性模型
对预测集中的食用油样品种类鉴别相同且种类鉴别正确的食用油样品放入步骤五中的训
练集中,并重新建立近红外训练集定性模型和拉曼训练集定性模型;并利用重新建立的近
红外训练集定性模型和拉曼训练集定性模型对预测集中剩余的食用油样品进行种类鉴别;
依此循环直至最终的近红外训练集定性模型和拉曼训练集定性模型对预测集中最终剩余
的食用油样品种类鉴别不相同且种类鉴别不正确为止。
温度为20℃,采集得到第一近红外光谱图;第二阶段,将食用油样品加热至温度为40℃,采
集得到第二近红外光谱图;第三阶段,将食用油样品加热至温度为60℃,采集得到第三近红
外光谱图;最终将所述第一近红外光谱图、第二近红外光谱图与第三近红外光谱图的平均
值作为所述食用油样品的近红外光谱图。
数为32次,分辨率为3.5cm ,采用光程为5mm的光程插片置于样品池中;近红外光谱采集的
‑1
第二阶段中设置近红外光谱仪的扫描次数为64次,分辨率为3cm ,采用光程为15mm的光程
插片置于样品池中;近红外光谱采集的第三阶段中设置近红外光谱仪的扫描次数为16次,
‑1
分辨率为4cm ,采用光程为10mm的光程插片置于样品池中。
池中,设置拉曼光谱仪的测定范围为780~1780cm ,第一阶段,将食用油样品加热至温度为
20℃,采集得到第一拉曼光谱图;第二阶段,将食用油样品加热至温度为40℃,采集得到第
二拉曼光谱图;第三阶段,将食用油样品加热至温度为60℃,采集得到第三拉曼光谱图;最
终将所述第一拉曼光谱图、第二拉曼光谱图与第三拉曼光谱图的平均值作为所述食用油样
品的拉曼光谱图。
段中设置拉曼光谱仪的积分时间为30秒,激光功率为320MW,采用光程为15mm的光程插片置
于样品池中;拉曼光谱采集的第三阶段中设置拉曼光谱仪的积分时间为20秒,激光功率为
270MW,采用光程为10mm的光程插片置于样品池中。
近红外光谱图;对所述食用油样品的拉曼光谱图依次进行Savitzky‑Golay滤波9点平滑消
‑1
除光谱噪声、并以1445cm 处的特征峰强度为基准进行归一化处理,得到食用油样品的预处
理拉曼光谱图。
量提取,得到一次近红外光谱图特征变量和一次拉曼光谱图特征变量;然后采用稀疏字典
学习对所述一次近红外光谱图特征变量和一次拉曼光谱图特征变量进行二次特征变量提
取,得到所述食用油样品的近红外光谱图特征变量和拉曼光谱图特征变量。
乘法交叉验证建模,设置蒙特卡罗采样次数为1~50次,当偏最小二乘法交叉验证模型的均
方根误差值最小时,得到一次近红外光谱图特征变量和一次拉曼光谱图特征变量。
设置权重参数λ=30/σ,依次采用正交匹配追踪法和K‑奇异值分解方法进行迭
代优化,设置迭代次数为2~20次,得到所述食用油样品的近红外光谱图特征变量和拉曼光
谱图特征变量。
机分类方法依次建立近红外训练集定性模型和拉曼训练集定性模型;采用粒子群优化算法
对近红外训练集定性模型和拉曼训练集定性模型中的惩罚因子C和核函数参数g进行优化,
20 20
优化时设置惩罚因子C和核函数参数g的范围均为2‑ ~2 ,设置交互验证参数V的范围为2
~10。
率、温度和光程对近红外光谱图的影响;通过采用分阶段拉曼光谱采集,可有效消除温度、
光程及拉曼光谱仪自身性能对拉曼光谱图的影响;通过依次竞争性自适应重加权采样方法
和稀疏字典学习进行特征变量提取,可有效压缩近红外光谱和拉曼光谱中的无用变量及干
扰信息;通过依次建立近红外训练集定性模型和拉曼训练集定性模型,并采用并联融合思
路进行种类鉴别,大大提高了鉴别准确率。
附图说明
具体实施方式
‑1
分辨率为3.5cm ,采用光程为5mm的光程插片置于样品池中,将食用油样品加热至温度为20
℃,采集得到第一近红外光谱图;第二阶段,设置近红外光谱仪的扫描次数为64次,分辨率
‑1
为3cm ,采用光程为15mm的光程插片置于样品池中,将食用油样品加热至温度为40℃,采集
‑1
得到第二近红外光谱图;第三阶段,设置近红外光谱仪的扫描次数为16次,分辨率为4cm ,
采用光程为10mm的光程插片置于样品池中,将食用油样品加热至温度为60℃,采集得到第
三近红外光谱图;最终将所述第一近红外光谱图、第二近红外光谱图与第三近红外光谱图
的平均值作为所述食用油样品的近红外光谱图。
谱仪的测定范围为780~1780cm ,第一阶段,设置拉曼光谱仪的积分时间为10秒,激光功率
为220MW,采用光程为5mm的光程插片置于样品池中,将食用油样品加热至温度为20℃,采集
得到第一拉曼光谱图;第二阶段,设置拉曼光谱仪的积分时间为30秒,激光功率为320MW,采
用光程为15mm的光程插片置于样品池中,将食用油样品加热至温度为40℃,采集得到第二
拉曼光谱图;第三阶段,拉曼光谱采集的第三阶段中设置拉曼光谱仪的积分时间为20秒,激
光功率为270MW,采用光程为10mm的光程插片置于样品池中,将食用油样品加热至温度为60
℃,采集得到第三拉曼光谱图;最终将所述第一拉曼光谱图、第二拉曼光谱图与第三拉曼光
谱图的平均值作为所述食用油样品的拉曼光谱图。
并采用自适应迭代重加权惩罚最小二乘算法进行基线校正,得到食用油样品的预处理近红
外光谱图;对所述食用油样品的拉曼光谱图依次进行Savitzky‑Golay滤波9点平滑消除光
‑1
谱噪声、并以1445cm 处的特征峰强度为基准进行归一化处理,得到食用油样品的预处理拉
曼光谱图。
油样品的预处理近红外光谱图和预处理拉曼光谱图进行一次特征变量提取,得到一次近红
外光谱图特征变量和一次拉曼光谱图特征变量;然后采用稀疏字典学习对所述一次近红外
光谱图特征变量和一次拉曼光谱图特征变量进行二次特征变量提取,得到所述食用油样品
的近红外光谱图特征变量和拉曼光谱图特征变量。
法交叉验证建模,设置蒙特卡罗采样次数为1~50次,当偏最小二乘法交叉验证模型的均方
根误差值最小时,得到一次近红外光谱图特征变量和一次拉曼光谱图特征变量。
设置权重参数λ=30/σ,依次采用正交匹配追踪法和K‑奇异值分解方法进行迭
代优化,设置迭代次数为2~20次,得到所述食用油样品的近红外光谱图特征变量和拉曼光
谱图特征变量。
变量,通过支持向量机分类方法依次建立近红外训练集定性模型和拉曼训练集定性模型;
再采用粒子群优化算法对近红外训练集定性模型和拉曼训练集定性模型中的惩罚因子C和
‑20 20
核函数参数g进行优化,优化时设置惩罚因子C和核函数参数g的范围均为2 ~2 ,设置交
互验证参数V的范围为2~10。
测集中的食用油样品种类鉴别相同且种类鉴别正确的食用油样品放入步骤五中的训练集
中,并重新建立近红外训练集定性模型和拉曼训练集定性模型;并利用重新建立的近红外
训练集定性模型和拉曼训练集定性模型对预测集中剩余的食用油样品进行种类鉴别;依此
循环直至最终的近红外训练集定性模型和拉曼训练集定性模型对预测集中最终剩余的食
用油样品种类鉴别不相同且种类鉴别不正确为止。
样品39份;其中,8类食用油样品的预测集样品和训练集样品的数量分布如下表1。
曼光谱图如图3所示。
惩罚最小二乘算法进行基线校正,得到食用油样品的预处理近红外光谱图;对所述食用油
‑1
样品的拉曼光谱图依次进行Savitzky‑Golay滤波9点平滑消除光谱噪声、并以1445cm 处的
特征峰强度为基准进行归一化处理,得到食用油样品的预处理拉曼光谱图。
图进行一次特征变量提取,选择波长变量子集时采用10折偏最小二乘法交叉验证建模,设
置蒙特卡罗采样次数为1~50次,当蒙特卡罗采样次数为第39次时,偏最小二乘法交叉验证
模型的均方根误差值最小为1.4839,提取的一次光谱图特征变量为56个;然后采用稀疏字
典学习对所述56个一次光谱图特征变量进行二次特征变量提取,设置冗余字典参数k=16
×16×3,设置平衡误差参数 设置权重参数λ=30/σ,依次采用正交匹配追踪法
和K‑奇异值分解方法进行迭代优化,设置迭代次数为2~20次,当取σ=25且迭代次数为10
次时,得到均方根误差值最小为0.2572,二次提取得到的光谱图特征变量为28个。
行一次特征变量提取,选择波长变量子集时采用10折偏最小二乘法交叉验证建模,设置蒙
特卡罗采样次数为1~50次,当蒙特卡罗采样次数为第36次时,偏最小二乘法交叉验证模型
的均方根误差值最小为0.5872,提取的一次光谱图特征变量为68个;然后采用稀疏字典学
习对所述68个一次光谱图特征变量进行二次特征变量提取,设置冗余字典参数k=16×16
×3,设置平衡误差参数 设置权重参数λ=30/σ,依次采用正交匹配追踪法和K‑
奇异值分解方法进行迭代优化,设置迭代次数为2~20次,当取σ=25且迭代次数为16次时,
得到均方根误差值最小为0.3684,二次提取得到的光谱图特征变量为32个。
和拉曼训练集定性模型;采用粒子群优化算法对近红外训练集定性模型和拉曼训练集定性
模型中的惩罚因子C和核函数参数g进行优化,优化时设置惩罚因子C和核函数参数g的范围
‑20 20
均为2 ~2 ,设置交互验证参数V的范围为2~10。
份食用油样品的种类鉴别相同且种类鉴别正确,将该32份食用油样品放入步骤五中的训练
集中,得到新的训练集食用油样品150份,并重新建立近红外训练集定性模型和拉曼训练集
定性模型;
类鉴别正确,将该4份食用油样品放入步骤五中的训练集中,得到新的训练集食用油样品
154份,并再次建立近红外训练集定性模型和拉曼训练集定性模型;
类鉴别不正确,将该3份食用油样品放入奇异样本中,而另外由154份食用油样品最终建立
的近红外训练集定性模型和拉曼训练集定性模型则可作为并联融合的食用油种类鉴别模
型。
现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于
特定的细节和这里示出与描述的图例。