沼液理化指标近红外光谱同步快速检测方法转让专利

申请号 : CN201811323250.3

文献号 : CN109507143B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘金明王娜程秋爽孙勇

申请人 : 黑龙江八一农垦大学

摘要 :

沼液理化指标近红外光谱同步快速检测方法属于厌氧发酵液检测技术;本方法通过样品采集、理化指标测定、近红外光谱采集、光谱预处理及样品集划分、基于双重遗传模拟退火算法的特征波长优选后,将校正集光谱数据分别按双重遗传模拟退火算法优选的沼液化学需氧量、挥发性脂肪酸和氨氮理化指标的特征波长建立相应的偏最小二乘回归模型,并使用验证集对回归模型的精度进行评测,建立快速检测模型,对需检测理化指标的沼液样本离心后取上清液进行近红外光谱扫描,再按优选的相应理化指标特征波长输入检测模型,完成沼液理化指标同步快速检测;本方法检测速度快,精度高,检测项目全。

权利要求 :

1.一种沼液理化指标近红外光谱同步快速检测方法,所述方法包括步骤是:

①、样品采集:

以正常产气的半连续厌氧发酵罐中沼液为样品,每4小时采样一次,采样量40ml,采样

30天,共采样180个;样品在6000r/min下冷冻离心10min后,取样品上清液待测;

②、理化指标测定:

取样品上清液采用传统的化学方法进行化学需氧量、挥发性脂肪酸和氨氮含量的测定;所述化学需氧量采用密封催化消解法结合T6新世纪紫外可见分光光度计测定,挥发性脂肪酸中的乙酸、丙酸和总酸含量采用Agilent GC-6890气相色谱仪测定,氨氮采用FOSS FIAstar 5000流动注射分析仪测定;

③、近红外光谱采集:

另取样品上清液采用Antaris II FT-NIR光谱仪进行沼液近红外光谱采集,采用透射分析模块,样品池采用1mm光程矩形比色皿,光谱范围为4000-10000cm-1,扫描次数为32次,分辨率为8.0cm-1;

④、对③中采集的沼液近红外光谱进行预处理及样品集划分:

对光谱数据采用一阶导数平滑处理后,再进行标准正态变量变换处理,并基于蒙特卡洛交叉验证去除异常样本;运用KS法将去除异常样本后的样品集按3∶1的比例划分校正集和验证集;

其特征在于:

⑤、基于双重遗传模拟退火算法的特征波长优选:

第一步:对标准遗传算法进行改进,引入模拟退火算法的温度参数和降温操作,构建遗传模拟退火算法;遗传模拟退火算法以偏最小二乘回归模型的交叉验证均方根误差为目标函数,结合温度参数设计适应度函数,所述适应度函数计算公式如下:式中,f(x)为当前染色体的目标函数值,fmin为当前代种群中的最小目标函数值,t为当前代温度值;

第二步:基于遗传模拟退火算法进行近红外光谱特征区间优选:对校正集中的近红外光谱数据分别按30、40、50、60、80、100、120个波长点划分区间,依次将1557个波长点的光谱数据划分为52、39、31、26、20、16、13个区间,采用二进制编码方式,以区间个数为码长,进行遗传模拟退火算法的种群初始化;“1”和“0”分别表示对应的特征区间所包含波长点对应的数据“是”、“否”选中参与运算;根据种群初始化结果计算各染色体的目标函数值,确定初始温度和降温操作,并计算各染色体的适应度函数值,然后依据适应度函数值对种群中的染色体依此执行带最优保留策略的赌轮选择、离散重组交叉、离散变异和Metropolis选择复制操作,完成一轮次的种群进化过程;经过多个轮次的种群进化,满足设定的算法终止条件后,即完成近红外光谱特征区间优选;按如上步骤,执行多次特征区间优选算法,求出沼液近红外光谱化学需氧量、挥发性脂肪酸和氨氮理化指标在不同区间个数下的多个备选特征区间,通过综合评测校正决定系数和校正均方根误差,确定沼液特定理化指标的最佳区间个数和最佳特征区间;

第三步:基于遗传模拟退火算法进行近红外光谱特征波长点优选:以优选后沼液特定理化指标的近红外光谱特征区间包含的特征波长点数为码长,进行二进制编码,并进行种群初始化;“1”和“0”分别表示该波长点对应的数据“是”、“否”选中参与运算;在确定初始温度、降温操作,计算适应度函数值后,执行多个轮次的遗传模拟退火选择、交叉、变异和Metropolis选择复制进化操作,完成近红外光谱特征波长点的优选;针对遗传模拟退火算法优化结果的随机性,多次执行特征波长点优选算法,并选择多次重复选中的波长点为特征波长点建立偏最小二乘回归模型,得到较高的回归模型性能;

⑥、将校正集光谱数据分别按双重遗传模拟退火算法优选的沼液化学需氧量、挥发性脂肪酸和氨氮理化指标的特征波长建立相应的偏最小二乘回归模型,并使用验证集对回归模型的精度进行评测;若验证集的评测结果不满足测试精度要求,重新执行第⑤步骤,进行特征波长优选;当建立的偏最小二乘回归模型检测精度满足需求时,输出相应模型,完成沼液理化指标近红外光谱同步快速检测模型;

⑦、对需要检测理化指标的沼液样本,离心后取上清液进行近红外透射光谱扫描,再按优选的相应理化指标特征波长输入检测模型,即完成沼液理化指标的同步快速检测。

说明书 :

沼液理化指标近红外光谱同步快速检测方法

技术领域

[0001] 本发明属于厌氧发酵液检测技术,主要涉及一种沼液理化指标近红外光谱同步快速检测方法。

背景技术

[0002] 随着我国农牧业的快速发展,产生了大量的农作物秸秆和畜禽粪便等有机废弃物,由此引起的环境污染问题日益突出。厌氧发酵产沼气作为一项清洁生物质能源技术是实现农牧业有机废弃物资源化利用、改善环境、解决能源问题的重要手段和发展方向。由于沼气发酵是一个极其复杂的生化过程,如何高效地利用农牧业废弃物发酵产沼气,是当前农业面临的重大挑战。化学需氧量、挥发性脂肪酸和氨氮等沼液理化指标是控制和优化厌氧发酵工艺的重要指标。为了对厌氧发酵过程进行有效调控,有必要对上述沼液理化指标进行快速准确测定,但采用传统化学方法测定其含量时存在测试速度慢、成本高的问题。
[0003] 近红外光谱分析技术具有简便、快速、无损、低成本以及可实现多组分同时测定等众多优点,已广泛用于食品、制药、石油、化工、酿酒等行业的定性分析和定量检测。在应用近红外透射光谱进行液相物质检测方面,研究人员已经分别实现了水体的化学需氧量、挥发性脂肪酸和氨氮检测,但检测效率和精度有待进一步提高。原因在于近红外光谱仪器采集的数据量大,在建立上述检测模型时以全谱波长点建模,计算量大,波长冗余严重,不相干和非线性的波长点对模型预测精度影响较大。遗传算法具有较强的鲁棒性和全局搜索能力,其随机搜索能力能够有效解决光谱波长点之间的共线性问题,已广泛应用于近红外光谱特征波长优选。但遗传算法存在早熟问题,且进化后期搜索效率较低。因此,对遗传算法进行改进,并应用于沼液近红外光谱特征波长优选,研究一种沼液化学需氧量、挥发性脂肪酸和氨氮理化指标的近红外光谱同步快速检测方法十分必要。

发明内容

[0004] 本发明的目的就是针对上述现有技术存在的问题,结合厌氧发酵生产作业使用的实际需要,提出一种沼液理化指标近红外光谱同步快速检测方法,达到解决以全谱波长点个数作为染色体码长直接编码时码太长引起解空间发散、波长冗余严重、减少搜索时间、提高检测速度和检测精度的目的。
[0005] 本发明的目的是这样实现的:一种沼液理化指标近红外光谱同步快速检测方法,所述方法包括步骤是:
[0006] ①、样品采集:
[0007] 以正常产气的半连续厌氧发酵罐中沼液为样品,每4小时采样一次,采样量40ml,采样30天,共采样180个;样品在6000r/min下冷冻离心10min后,取样品上清液待测;
[0008] ②、理化指标测定:
[0009] 取样品上清液采用传统的化学方法进行化学需氧量、挥发性脂肪酸和氨氮含量的测定;所述化学需氧量采用密封催化消解法结合T6新世纪紫外可见分光光度计测定,挥发性脂肪酸中的乙酸、丙酸和总酸含量采用Agilent GC-6890气相色谱仪测定,氨氮采用FOSS FIAstar 5000流动注射分析仪测定;
[0010] ③、近红外光谱采集:
[0011] 另取样品上清液采用Antaris II FT-NIR光谱仪进行沼液近红外光谱采集,采用透射分析模块,样品池采用1mm光程矩形比色皿,光谱范围为4000-10000cm-1,扫描次数为32次,分辨率为8.0cm-1;
[0012] ④、对③中采集的沼液近红外光谱进行预处理及样品集划分:
[0013] 对光谱数据采用一阶导数平滑处理后,再进行标准正态变量变换处理,并基于蒙特卡洛交叉验证去除异常样本;运用KS法将去除异常样本后的样品集按3∶1的比例划分校正集和验证集;
[0014] 其特征在于:
[0015] ⑤、基于双重遗传模拟退火算法的特征波长优选:
[0016] 第一步:对标准遗传算法进行改进,引入模拟退火算法的温度参数和降温操作,构建遗传模拟退火算法;遗传模拟退火算法以偏最小二乘回归模型的交叉验证均方根误差为目标函数,结合温度参数设计适应度函数,所述适应度函数计算公式如下:
[0017]
[0018] 式中,f(x)为当前染色体的目标函数值,fmin为当前代种群中的最小目标函数值,t为当前代温度值;
[0019] 第二:基于遗传模拟退火算法进行近红外光谱特征区间优选:对校正集中的近红外光谱数据分别按30、40、50、60、80、100、120个波长点划分区间,依次将1557个波长点的光谱数据划分为52、39、31、26、20、16、13个区间,采用二进制编码方式,以区间个数为码长,进行遗传模拟退火算法的种群初始化;“1”和“0”分别表示对应的特征区间所包含波长点对应的数据“是”、“否”选中参与运算;根据种群初始化结果计算各染色体的目标函数值,确定初始温度和降温操作,并计算各染色体的适应度函数值,然后依据适应度函数值对种群中的染色体依此执行带最优保留策略的赌轮选择、离散重组交叉、离散变异和Metropolis选择复制操作,完成一轮次的种群进化过程;经过多个轮次的种群进化,满足设定的算法终止条件后,即完成近红外光谱特征区间优选;按如上步骤,执行多次特征区间优选算法,求出沼液近红外光谱化学需氧量、挥发性脂肪酸和氨氮理化指标在不同区间个数下的多个备选特征区间,通过综合评测校正决定系数和校正均方根误差,确定沼液特定理化指标的最佳区间个数和最佳特征区间;
[0020] 第三步:基于遗传模拟退火算法进行近红外光谱特征波长点优选:以优选后沼液特定理化指标的近红外光谱特征区间包含的特征波长点数为码长,进行二进制编码,并进行种群初始化;“1”和“0”分别表示该波长点对应的数据“是”、“否”选中参与运算;在确定初始温度、降温操作,计算适应度函数值后,执行多个轮次的遗传模拟退火选择、交叉、变异和Metropolis选择复制进化操作,完成近红外光谱特征波长点的优选;针对遗传模拟退火算法优化结果的随机性,多次执行特征波长点优选算法,并选择多次重复选中的波长点为特征波长点建立偏最小二乘回归模型,得到较高的回归模型性能;
[0021] ⑥、将校正集光谱数据分别按双重遗传模拟退火算法优选的沼液化学需氧量、挥发性脂肪酸和氨氮理化指标的特征波长建立相应的偏最小二乘回归模型,并使用验证集对回归模型的精度进行评测;若验证集的评测结果不满足测试精度要求,重新执行第⑤步骤,进行特征波长优选;当建立的偏最小二乘回归模型检测精度满足需求时,输出相应模型,完成沼液理化指标近红外光谱同步快速检测模型;
[0022] ⑦、对需要检测理化指标的沼液样本,离心后取上清液进行近红外透射光谱扫描,再按优选的相应理化指标特征波长输入检测模型,即完成沼液理化指标的同步快速检测。
[0023] 本发明基于双重遗传模拟退火算法的近红外光谱沼液理化指标特征波长优选先进行特征区间优选,再进行特征波长点优选,在兼顾波长优选性能的同时有效减少搜索时间,解决了以全谱波长点个数做为染色体码长直接编码时码长太长引起解空间发散的问题,且基于该波长优选方法建立的沼液理化指标偏最小二乘回归模型具有检测速度快、精度高的特点,能够实现沼液化学需氧量、挥发性脂肪酸和氨氮理化指标的同步快速检测,检测内容多、项目全。

附图说明

[0024] 图1是沼液理化指标近红外光谱同步快速检测方法流程示意图;
[0025] 图2是基于双重遗传模拟退火算法的特征波长优选流程示意图。

具体实施方式

[0026] 下面结合附图对本发明具体实施方案进行详细描述。一种沼液理化指标近红外光谱同步快速检测方法,所述方法包括步骤是:
[0027] ①、样品采集:
[0028] 以正常产气的半连续厌氧发酵罐中沼液为样品,每4小时采样一次,采样量40ml,采样30天,共采样180个;样品在6000r/min下冷冻离心10min后,取样品上清液待测;
[0029] ②、理化指标测定:
[0030] 取样品上清液采用传统的化学方法进行化学需氧量、挥发性脂肪酸和氨氮含量的测定;所述化学需氧量采用密封催化消解法结合T6新世纪紫外可见分光光度计测定,挥发性脂肪酸中的乙酸、丙酸和总酸含量采用Agilent GC-6890气相色谱仪测定,氨氮采用FOSS FIAstar 5000流动注射分析仪测定;
[0031] ③、近红外光谱采集:
[0032] 另取样品上清液采用Antaris II FT-NIR光谱仪进行沼液近红外光谱采集,采用透射分析模块,样品池采用1mm光程矩形比色皿,光谱范围为4000-10000cm-1,扫描次数为32次,分辨率为8.0cm-1;
[0033] ④、对③中采集的沼液近红外光谱进行预处理及样品集划分:
[0034] 对光谱数据采用一阶导数平滑处理后,再进行标准正态变量变换处理,并基于蒙特卡洛交叉验证去除异常样本;运用KS法将去除异常样本后的样品集按3∶1的比例划分校正集和验证集;
[0035] ⑤、基于双重遗传模拟退火算法的特征波长优选:
[0036] 第一步:对标准遗传算法进行改进,引入模拟退火算法的温度参数和降温操作,构建遗传模拟退火算法;遗传模拟退火算法以偏最小二乘回归模型的交叉验证均方根误差为目标函数,结合温度参数设计适应度函数,所述适应度函数计算公式如下:
[0037] 式中,f(x)为当前染色体的目标函数值,fmin为当前代种群中的最小目标函数值,t为当前代温度值;
[0038] 第二步:基于遗传模拟退火算法进行近红外光谱特征区间优选:对校正集中的近红外光谱数据分别按30、40、50、60、80、100、120个波长点划分区间,依次将1557个波长点的光谱数据划分为52、39、31、26、20、16、13个区间,采用二进制编码方式,以区间个数为码长,进行遗传模拟退火算法的种群初始化;“1”和“0”分别表示对应的特征区间所包含波长点对应的数据“是”、“否”选中参与运算;根据种群初始化结果计算各染色体的目标函数值,确定初始温度和降温操作,并计算各染色体的适应度函数值,然后依据适应度函数值对种群中的染色体依此执行带最优保留策略的赌轮选择、离散重组交叉、离散变异和Metropolis选择复制操作,完成一轮次的种群进化过程;经过多个轮次的种群进化,满足设定的算法终止条件后,即完成近红外光谱特征区间优选;按如上步骤,执行多次特征区间优选算法,求出沼液近红外光谱化学需氧量、挥发性脂肪酸和氨氮理化指标在不同区间个数下的多个备选特征区间,通过综合评测校正决定系数和校正均方根误差,确定沼液特定理化指标的最佳区间个数和最佳特征区间;
[0039] 第三步:基于遗传模拟退火算法进行近红外光谱特征波长点优选:以优选后沼液特定理化指标的近红外光谱特征区间包含的特征波长点数为码长,进行二进制编码,并进行种群初始化;“1”和“0”分别表示该波长点对应的数据“是”、“否”选中参与运算;在确定初始温度、降温操作,计算适应度函数值后,执行多个轮次的遗传模拟退火选择、交叉、变异和Metropolis选择复制进化操作,完成近红外光谱特征波长点的优选;针对遗传模拟退火算法优化结果的随机性,多次执行特征波长点优选算法,并选择多次重复选中的波长点为特征波长点建立偏最小二乘回归模型,能够得到较高的回归模型性能;
[0040] ⑥、将校正集光谱数据分别按双重遗传模拟退火算法优选的沼液化学需氧量、挥发性脂肪酸和氨氮理化指标的特征波长建立相应的偏最小二乘回归模型,并使用验证集对回归模型的精度进行评测;若验证集的评测结果不满足测试精度要求,重新执行第⑤步骤,进行特征波长优选;当建立的偏最小二乘回归模型检测精度满足需求时,输出相应模型,完成沼液理化指标近红外光谱同步快速检测模型;
[0041] ⑦、对需要检测理化指标的沼液样本,离心后取上清液进行近红外透射光谱扫描,再按优选的相应理化指标特征波长输入检测模型,即完成沼液理化指标的同步快速检测。