基于OPLS-SPA-MIX-PLS的木材弹性模量预测方法转让专利

申请号 : CN202010918281.4

文献号 : CN112229816B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张怡卓于慧伶蒋大鹏张健罗泽葛奕麟

申请人 : 江苏东晟辉科技开发有限公司

摘要 :

本发明公开了一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,利用正交偏最小二乘法对获取的近红外光谱数据进行预处理,实现散射光、基线漂移和高频噪声等干扰因素的去除;接着,运用连续投影算法(SPA)提取有效的波长信息;最后,运用MIX‑PLS多专家模型寻找不同树种下的板材试件近红外光谱与板材弹性模量之间的关联,并利用归一化指数函数进行叠加,实现木材弹性模量光谱预测模型的构建,能够有效提高泛化能力。

权利要求 :

1.一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,其特征在于,包括:利用正交偏最小二乘法对获取的近红外光谱数据进行预处理;

利用连续投影算法对预处理后得到的光谱矩阵进行特征提取;

利用多专家模型对特征提取后的所述光谱矩阵进行非线性建模,并利用归一化指数函数进行叠加;

利用正交偏最小二乘法对获取的近红外光谱数据进行预处理,包括:在利用正交偏最小二乘法OPLS进行预处理过程中,设X与y分别为光谱矩阵与木材弹性模量,X与y分别表示为:y=U C+f

其中,E与f是残差矩阵,U是y的数据得分矩阵,C是y的预测成分权重矩阵,T为预测分数矩阵,To为正交分数矩阵;

进行OPLS处理时:首先将获取的近红外光谱数据中的原始光谱矩阵X减去正交成分得分矩阵与正交成分载荷矩阵的乘积 得到删除矩阵 为正交成分得分矩阵To与正交成分载荷矩阵 的乘积;然后,对删除矩阵Xp与弹性模量y进行偏最小T T T二乘分析得Xp=TW+E,其中预测成分得分矩阵T与预测成分载荷矩阵W的乘积TW为最终输出Xopls;OPLS算法根据弹性模量y校正原始近红外光谱矩阵X,将原始光谱矩阵X中与弹性模量y无关的正交部分去除并输出Xopls,实现散射光、基线漂移和高频噪声干扰因素的去除;

利用连续投影算法对预处理后得到的光谱矩阵进行特征提取,包括:对预处理后光谱矩阵Xopls,进行连续投影算法处理时:首先计算投影最大的i,j,其中,xi与xj为预处理后光谱矩阵Xopls的两个子波段;然后,将此时的i记入待选波长字典中,设 接着,计算令投影

最大的i,并将i记入待选波长字典中;当字典中波长个数达到预定值时,终止程序运行;

利用多专家模型对特征提取后的所述光谱矩阵进行非线性建模,并利用归一化指数函数进行叠加,包括:MIX‑PLS模型源于多专家模型,通过各个PLS模型输出值的概率分布叠加近似得到真实的概率分布;其中,子系统是简单的PLS模型,f(x(i)|θ)是PLS子模型输出向量的概率分布,子系统的个数为p,门函数选用softmax函数;

设 为MIX‑PLS模型参数空间 的参数向量,参数空间 每个维度都代表着MIX‑PLS模型的一种参数,Z、y、X分别为p个PLS子系统输出的光谱矩阵的占比,则MIX‑PLS的后验概率分布 由贝叶斯公式计算而得, 与 分别如下公式表示:其中, 为全概率公式,已知向量Z控制着子系统输出占比,在子系统确定为第p个PLS子系统的情况下,模型最终输出结果为p(y(i)|zp(i),x(i),ε);p(y(i)|zp(i),x(i),ε)为一定条件下PLS输出的概率分布,ε为所有PLS子系统参数的集合,即ε={θ1,w1...θp,wp};p(zp(i)=1|x(i),V)为门函数的输出概率分布,两者的逐项乘积即为的解;

p(y(i)|zp(i),x(i),ε)服从高斯分布N(y(i)|fp(x(i),θp),wp),y(i)与x(i)为第i组力学性能特征与光谱样本,θp与wp为mix‑pls算法的参数矩阵,θp与wp的解析解如下:T T

θp=(XΓpX)XΓpy

其中,Γp=diag(γp(1),γp(2),...,γp(k))为对角矩阵,对角矩阵中第i个元素γp(i)为MIX‑PLS的隐变量zp(i)在 上的期望;

old

p(zp(i)=1|x(i),V )为门函数的输出概率分布,门函数控制各个子系统的开闭,权衡各个子系统输出并决定最终输出;子系统p的个数为MIX‑PLS模型参数,该概率分布服从old oldsoftmax回归,V 为softmax回归的权值,vl与vp为权值矩阵V 中的向量,分布表达式为:

说明书 :

基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法

技术领域

[0001] 本发明涉及木材弹性模量预测技术领域,尤其涉及一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法。

背景技术

[0002] 木材的弹性模量是木材重要的力学指标,体现了该材料最重要,最具特征的力学性质。光谱分析技术具有操作过程简单、方便、快速等优势,已成为木材检测的重要手段,但是在实际应用中,基线漂移、光谱特征欠优、模型泛化能力低等问题还没有得到充分解决,木材弹性模量模型的精度与可靠性有待于提升,导致泛化能力不高。

发明内容

[0003] 本发明的目的在于提供一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,能有效提高泛化能力。
[0004] 为实现上述目的,本发明提供了一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,包括:
[0005] 利用正交偏最小二乘法对获取的近红外光谱数据进行预处理;
[0006] 利用连续投影算法对预处理后得到的光谱矩阵进行特征提取;
[0007] 利用多专家模型对特征提取后的所述光谱矩阵进行非线性建模,并利用归一化指数函数进行叠加。
[0008] 其中,利用正交偏最小二乘法对获取的近红外光谱数据进行预处理,包括:
[0009] 将获取的近红外光谱数据中的原始光谱矩阵减去正交成分得分矩阵与正交成分载荷矩阵的乘积,并利用正交偏最小二乘法将得到的删除矩阵与弹性模量进行计算,得到光谱矩阵。
[0010] 其中,利用正交偏最小二乘法对获取的近红外光谱数据进行预处理,还包括:
[0011] 利用S‑G卷积平滑对得到的所述光谱矩阵进行平滑处理。
[0012] 其中,利用多专家模型对特征提取后的所述光谱矩阵进行非线性建模,并利用归一化指数函数进行叠加,包括:
[0013] 利用贝叶斯计算法计算出多个所述光谱矩阵的叠加组成的多专家模型的后验概率,并得到指定所述光谱矩阵对应的概率值。
[0014] 其中,利用多专家模型对特征提取后的所述光谱矩阵进行非线性建模,并利用归一化指数函数进行叠加,还包括:
[0015] 将得到的所述概率值与归一化指数函数输出的概率分布进行逐项乘积,并根据得到全概率分布和所述归一化指数函数的权值,得到所述多专家模型的预测结果。
[0016] 本发明的一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,利用正交偏最小二乘法对获取的近红外光谱数据进行预处理,实现散射光、基线漂移和高频噪声等干扰因素的去除;接着,运用连续投影算法(SPA)提取有效的波长信息;最后,运用MIX‑PLS多专家模型寻找不同树种下的板材试件近红外光谱与板材弹性模量之间的关联,并利用归一化指数函数进行叠加,实现木材弹性模量光谱预测模型的构建,能够有效提高泛化能力。

附图说明

[0017] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018] 图1是本发明提供的一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法的步骤示意图。
[0019] 图2是本发明提供的MIX‑PLS流程框图。
[0020] 图3是本发明提供的SPA每个波段的投影占比。
[0021] 图4是本发明提供的MIX‑PLS模型校验结果。
[0022] 图5是本发明提供的MIX‑PLS模型验证预测结果。

具体实施方式

[0023] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0024] 在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0025] 请参阅图1,本发明提供一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,包括:
[0026] S101、利用正交偏最小二乘法对获取的近红外光谱数据进行预处理。
[0027] 具体的,在利用正交偏最小二乘法(OPLS)进行预处理过程中,设X与y分别为光谱矩阵与木材弹性模量,X与y分别表示为:
[0028]
[0029] y=U C+f
[0030] 其中,E与f是残差矩阵,U是y的数据得分矩阵,C是y的预测成分权重矩阵,T为预测分数矩阵,To为正交分数矩阵。
[0031] 进行OPLS处理时:首先将获取的近红外光谱数据中的原始光谱矩阵X减去正交成分得分矩阵与正交成分载荷矩阵的乘积 即是将与弹性模量y正交的变量剔除,即删除矩阵 为正交成分得分矩阵To与正交成分载荷矩阵 的乘积;然T
后,对删除矩阵Xp与弹性模量y进行偏最小二乘分析得Xp=TW+E,其中预测成分得分矩阵TT T
与预测成分载荷矩阵W 的乘积TW为最终输出Xopls。OPLS算法根据弹性模量y校正原始近红外光谱矩阵X,将原始光谱矩阵X中与弹性模量y无关的正交部分去除并输出Xopls,实现散射光、基线漂移和高频噪声等干扰因素的去除。
[0032] 实验发现,S‑G卷积平滑对OPLS校正后光谱平滑处理效果很好。S‑G卷积平滑为:
[0033]
[0034] 其中,x是吸光度,λ是波长,i,j是波长点数范围内的序号,△λ是波长间隔,k!是求导阶数的阶乘,αk是权重系数。
[0035] S102、利用连续投影算法对预处理后得到的光谱矩阵进行特征提取。
[0036] 具体的,对预处理后光谱矩阵Xopls,进行连续投影算法(SPA)处理时:首先计算投影 最大的i,j,其中,xi与xj为预处理后光谱矩阵Xopls的两个子波段;然后,将此时的i记入待选波长字典中,设 接着,计算令投影
最大的i,并将i记入待选波长字典中。当字典中波长个数达到预定值时,终止程序运行。
[0037] S103、利用多专家模型对特征提取后的所述光谱矩阵进行非线性建模,并利用归一化指数函数进行叠加。
[0038] 具体的,MIX‑PLS模型源于多专家模型,通过各个PLS模型输出值的概率分布叠加近似得到真实的概率分布。其示意图如图2所示。其中,子系统是简单的PLS模型,f(x(i)|θ)是PLS子模型输出向量的概率分布,子系统的个数为p,门函数选用softmax函数。
[0039] 设 为MIX‑PLS模型参数空间 的参数向量,参数空间 每个维度都代表着MIX‑PLS模型的一种参数,Z、y、X分别为p个PLS子系统输出的光谱矩阵的占比。则MIX‑PLS的后验概率分布 可由贝叶斯公式计算而得, 与 分别如下公式表示:
[0040]
[0041] 其中, 为全概率公式,已知向量Z控制着子系统输出占比,在子系统确定为第p个PLS子系统的情况下,模型最终输出结果为p(y(i)|zp(i),x(i),ε)。p(y(i)|zp(i),x(i),ε)为一定条件下PLS输出的概率分布,ε为所有PLS子系统参数的集合,即ε={θ1,w1...θp,wp};p(zp(i)=1|x(i),V)为门函数的输出概率分布,两者的逐项乘积即为的解。
[0042] p(y(i)|zp(i),x(i),ε)服从高斯分布N(y(i)|fp(x(i),θp),wp),y(i)与x(i)为第i组力学性能特征与光谱样本,θp与wp为mix‑pls算法的参数矩阵,θp与wp的解析解如下:
[0043] θp=(XTΓpX)XTΓpy
[0044]
[0045] 其中,Γp=diag(γp(1),γp(2),...,γp(k))为对角矩阵,对角矩阵中第i个元素γp(i)为MIX‑PLS的隐变量zp(i)在 上的期望。
[0046] p(zp(i)=1|x(i),Vold)为门函数的输出概率分布,门函数控制各个子系统的开闭,权衡各个子系统输出并决定最终输出。子系统p的个数为MIX‑PLS模型参数,需要研究人old员自行拟定。该概率分布服从softmax回归,V 为softmax回归的权值,vl与vp为权值矩阵old
V 中的向量,该分布表达式为:
[0047]
[0048] 所述方法还包括:
[0049] 根据采集的不同时间下,不同树种的近红外光谱信息,构建对应的非线性预测模型。
[0050] 具体的,以柞木、色木、桦木3种木材的弹性模量为研究对象,每种材料加工试件70个,共210个。实验材料经光谱仪测量后,按照国家标准《木材抗弯弹性模量测定方法》(GB 1936.2‑2009)中的测试步骤及规范,进行编号并测定其抗弯弹性模量,其中光谱仪为美国海洋光学公司NIRQuest512光谱仪。
[0051] NIRQuest512光谱仪光程为900‑1700nm,光谱仪分辨率达到3nm,实验室温度维持在(22±2)℃、相对湿度维持在50%。光谱仪检测光纤探头外部安装环状垫片,探头与待测试件距离保持在2mm。光谱仪探头在试件表面匀速移动,采集到8组近红外光谱数据,求和取平均作为试件光谱数据。
[0052] 为了比较光谱预处理方法面对外部环境变化的情况下稳定性强弱,本实验使用近红外光谱仪对210个实验材料进行采集,共采集3次并分别设得到的3组原始光谱数据组编号为A,B,C,每次测量需要重置近红外光谱仪。三次测量分别随机选择3个时间点、由不同人员测量。
[0053] 基于OPLS的NIR预处理
[0054] NIRQuest512光谱仪采集的原始光谱数据波段数为512个,其中,OPLS方法循环次数设置为50,S‑G卷积平滑的窗口设置为9,设近似多项式阶数为2。从3种木材的近红外原始光谱图可以看出从1650波段开始,波段数据出现震荡,伴随大量噪声。并且由于近红外光谱漂移等误差因素,一些光谱曲线在1200波段左右的吸收峰不明显。从经OPLS‑SG算法处理后的近红外光谱图可以看出1650‑1700波段的噪声基本消失,1200波段附近吸收峰变得清晰。
[0055] 为了验证OPLS预处理方法的优越性,对光谱归一化后,分别选用OPLS‑SG、SNV‑SG、正交校正(OSC)‑SG三种方法进行对板材全波谱的A,B,C这3组数据进行弹性模量PLS建模。从A、B、C,3组数据集选择一组建立弹性模量校准模型后,将其他两组的光谱数据输入到该模型中分析。由于A、B、C,3组数据分别由不同时间点、不同人员测量得到。那么模型评价指标越高,说明校准模型的鲁棒性越强。
[0056] 表1预处理方法对建模结果的影响
[0057]
[0058] 不同模型在不同光谱数据组所建模型的模型评价指标表如表1所示。比较表1中模型评价指标Rc与RMSEC可知,OPLS处理过的光谱矩阵模型评估结果Rc与RMSEC最高,模型更稳定。OPLS方法可以识别并分离与木材力学性能正交的木材样品光谱矩阵,抑制由外部扰动引起的光谱波动、固体样品散射引起的基线漂移与信号噪声,保证模型的鲁棒性。
[0059] SPA‑MIX‑PLS光谱校准模型
[0060] 采用SPA算法进行特征波段选择,SPA模型的最大组件数为20,执行五折搜索交叉验证对MIX‑PLS的子系统最佳个数进行寻优。SPA模型所获得的最佳波段数为13,经校正集确定MIX‑PLS模型的子系统个数为4个,此时相关系数Rc为0.95,均方根误差RMSEC为2.075。图3为SPA每个波段的投影占比,即光谱波段重要性占比,根据SPA光谱波段筛选结果,本研究在900到1700,512个波段中选取出权重最大的13个波段。
[0061] 使用经SPA算法处理后训练集数据建立木材力学性能的MIX‑PLS光谱辨识模型,并在预测集上对辨识模型进行评价图4与图5给出了MIX‑PLS校准模型校验与预测结果。
[0062] 为验证SPA‑MIX‑PLS回归模型的有效性,使用PLS、iPLS、BiPLS、PCR等几种建模方法进行对比,选择相关系数Rc、均方根误差RMSEC、预测相关系数Rp、预测均方根误差RMSEP作为评价指标,对所建模型结果进行比较分析,相关参数如表2所示。
[0063] 表2各校准模型结果的比较
[0064]
[0065] 从表2可以看出,应用SPA算法后,iPLS、BiPLS、MIX‑PLS精度都有所提升。虽然在校正集中SPA‑MIX‑PLS模型表现并非最佳,但多其泛化能力很强,在预测集中SPA‑MIX‑PLS模型预测精度最好。
[0066] 本文以木材弹性模量预测为目标,以近红外光谱为检测手段,选用OPLS、SG方法对光谱进行预处理,应用SPA方法进行特征光谱优选,并利用MIX‑PLS进行建模,选择柞木、色木、柞木三种材料验证方法有效性。实验结果表明:OPLS校正能够根据目标对象有针对性的对近红外光谱进行预处理,提高光谱矩阵质量,有效简化后续模型数据处理过程;SPA作为光谱矩阵特征提取经典算法,能够快速提取特征光谱波段,提高预测模型精度;MIX‑PLS校准模型的相关系数Rc与Rp分别为0.95与0.90,均方根误差RMSEC与RMSEP分别为2.075与6.001,PLS、iPLS、BiPLS、PCR与MIX‑PLS这5个校准模型的比较得出,MIX‑PLS校准模型预测性能最优,泛化能力最强。
[0067] 本发明的一种基于OPLS‑SPA‑MIX‑PLS的木材弹性模量预测方法,利用正交偏最小二乘法对获取的近红外光谱数据进行预处理,实现散射光、基线漂移和高频噪声等干扰因素的去除;接着,运用连续投影算法(SPA)提取有效的波长信息;最后,运用MIX‑PLS多专家模型寻找不同树种下的板材试件近红外光谱与板材弹性模量之间的关联,并利用归一化指数函数进行叠加,实现木材弹性模量光谱预测模型的构建,能够有效提高泛化能力。
[0068] 以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。