用于山核桃新鲜度检测的传感器阵列优化方法转让专利

申请号 : CN201610301315.9

文献号 : CN105954412B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王俊徐克明

申请人 : 浙江大学

摘要 :

本发明公开了一种用于山核桃新鲜度检测的传感器阵列优化方法,该方法首先根据山核桃挥发性气体的GC‑MS分析结果选择气敏传感器;接着根据传感器阵列在所述挥发性气体中的响应信号挑选传感器构成初始阵列;通过提取保留传感器的平均微分值、稳定值及面积值构成初始特征矩阵;然后以特征值为对象,对不同新鲜度山核桃的特征值数据进行均值分析;其次对特征值进行变异系数分析;再以平方Euclidean距离为度量标准,对特征值进行聚类分析,并对各类特征值进行相关性分析;最后对特征矩阵进行方差膨胀因子分析来获得最终优化特征矩阵及传感器阵列。本发明依据非搜索性特征选择策略进行优化,尽可能挑选出有效信息更多的特征值,有利于提高模式识别的正确率。

权利要求 :

1.一种用于山核桃新鲜度检测的传感器阵列优化方法,其特征在于,该方法包括以下步骤:步骤1:气敏传感器的选择

选择新鲜的山核桃,对山核桃挥发性气体进行GC‐MS分析;根据GC‐MS分析结果,针对挥发性气体中的主要成分,选择具有敏感性的气敏传感器;

步骤2:初始传感器阵列的构建

采用步骤1选择的传感器对不同新鲜度的山核桃顶空气体进行检测,根据传感器对山核桃挥发性气体的响应曲线,选择不同新鲜度山核桃挥发性气体均具有响应的传感器构成初始传感器阵列;

步骤3:构造初始特征矩阵

对初始传感器阵列中各传感器的响应曲线采用平均微分值法、稳定值法、面积值法进行特征提取,构成初始特征矩阵;

步骤4:均值分析

以步骤3提取得到的特征值为对象,进行均值分析,根据优化判别标准,对不同相对变化率下限值情况下得到的特征矩阵进行模式识别,选取最佳区分效果所对应的相对变化率下限值,剔除小于相对变化率下限值的特征值;所述优化判别标准为主成分分析法;

步骤5:变异系数分析

计算步骤4保留下来的特征值的变异系数,剔除变异系数大于0.15的特征值;

步骤6:基于聚类分析的相关性分析

将步骤5保留下来的特征值,以平方Euclidean距离为度量标准,对特征值进行聚类分析;计算各特征值的Rr值,并根据优化判别标准,对不同Rr上限值情况下得到的特征矩阵进行模式识别,选取最佳区分效果所对应的Rr上限值,剔除小于Rr上限值的特征值,以完成相关性分析;

所述Rr值为特征值与其他类所有特征值的相关系数绝对值累加和,其表达式为:其中P为类数,N为各类中特征值个数,Rmj为该特征值与第m类第j个特征值之间的系数;

步骤7:方差膨胀因子分析

对经步骤6分析保留下来的特征值进行方差膨胀因子分析,剔除VIF值大于10或VIF值大于20的特征值;并用优化判别标准进行验证,确定最佳VIF上限值来剔除相应特征值以降低特征矩阵多重共线性;

步骤8:确定优化传感器阵列

根据步骤7保留下来的特征值,选择对应的传感器,从而获得优化后的传感器阵列。

2.根据权利要求1所述的用于山核桃新鲜度检测的传感器阵列优化方法,其特征在于,所述平均微分值法为提取响应曲线上相连两采样点间直线斜率的平均值;所述稳定值法为提取传感器与气体充分反应后响应曲线的稳定值;所述面积值法为提取响应曲线与X轴所组成区域的面积。

说明书 :

用于山核桃新鲜度检测的传感器阵列优化方法

技术领域

[0001] 本发明涉及食品检测领域,尤其涉及一种用于山核桃新鲜度检测的传感器阵列优化方法。

背景技术

[0002] 山核桃因其丰富的营养及独特的口感深受消费者喜欢,然而其内在油脂易受水分、光照、氧气等环境因素的影响而氧化酸败,从而影响其口感。因此,进行山核桃新鲜度检测具有一定的实际意义。
[0003] 山核桃的气味是其内部果仁和果壳散发的挥发性成分,外在气味的变化从一定程度上反映了其内部新鲜度的变化。现有的山核桃新鲜度检测方法主要为感官评定、微生物检测、理化指标测定等,然而上述方法存在主观性或检测成本高且耗时的缺点,使得其不能很好的应用于山核桃新鲜度的快速检测。电子鼻(人工嗅觉系统)是一种模仿动物嗅觉系统的仿生仪器,利用具有交叉敏感性的气敏传感器构成传感器阵列对气体进行检测,得到指纹图谱来进行识别和量化被检测气体,可以实现快速准确的山核桃新鲜度检测。
[0004] 由于山核桃挥发性气体成分复杂,且不同新鲜度山核桃间的差异性小,为实现准确的区分不同新鲜度的山核桃,在电子鼻的应用中,需要对传感器阵列进行筛选优化。在减少传感器数量,降低设备研制成本的同时,有效降低样品数据维度且提高了识别精度,有利于电子鼻在山核桃新鲜度检测中的获得更好的应用。
[0005] 现有的电子鼻传感器阵列优化方法主要以传感器个体为对象,即提取传感器某一个特征值来表征传感器的响应信号,采用搜索性或非搜索性特征选择策略进行优化。如公布号为CN 104483460 A的《用于肉类检测的传感器阵列优化方法》的实施例中,其提取稳定状态下40~45秒的信号作为该传感器的特征值进行相应的优化;王智凝《电子鼻传感器阵列优化对猪肉新鲜度法的检测》一文中,其提取传感器信号的相对变化值来表征传感器并依据非搜索性策略进行优化;周海涛《劲酒电子鼻鉴别分析中传感器阵列优化方法研究》一文中其提取传感器信号的平均微分值构成响应的特征矩阵,并以此进行优化。虽然上述实例均在实际应用中取得了不错的区分预测效果,然而由于不同传感器的不同特征值在模式识别过程中均具有包含有效信息的可能,且其对模式识别的贡献率也不尽相同,因此上述实例得到的传感器阵列往往为较佳的优化阵列,还存在一定的优化空间。故在传感器阵列优化的实际应用中,应尽可能多地提取传感器响应信号的有效特征值来构成特征矩阵,并采用搜索性或非搜索性特征选择策略来选择出能尽可能多表征传感器有效信息且对模式识别贡献率大的特征值,来获取最佳的传感器阵列。

发明内容

[0006] 针对现有技术的不足,本发明提供一种用于山核桃新鲜度检测的传感器阵列优化方法,通过筛选优化传感器阵列,实现在有效提高对不同新鲜度山核桃检测精度的前提下,精简传感器数量,降低数据维度。
[0007] 本发明考虑到不同传感器的不同特征值在模式识别中均具有包含有效信息的可能,故以特征值为对象,采用非搜索性特征性选择方法来选取尽可能多包含有效信息的特征值,并根据特征值矩阵确定传感器阵列。具体包括以下步骤:
[0008] 步骤1:气敏传感器的选择
[0009] 选择新鲜的山核桃,对山核桃挥发性气体进行GC-MS分析;根据GC-MS分析结果,针对挥发性气体中的主要成分,选择具有敏感性的气敏传感器;
[0010] 步骤2:初始传感器阵列的构建
[0011] 采用步骤1选择的传感器对不同新鲜度的山核桃顶空气体进行检测,根据传感器对山核桃挥发性气体的响应曲线,选择对不同新鲜度山核桃挥发性气体均具有响应的传感器构成初始传感器阵列;步骤3:构造初始特征矩阵
[0012] 对初始传感器阵列中各传感器的响应曲线采用平均微分值法、稳定值法、面积值法进行特征提取,构成初始特征矩阵;
[0013] 步骤4:均值分析
[0014] 以步骤3提取得到的特征值为对象,进行均值分析,根据优化判别标准,对不同相对变化率下限值情况下得到的特征矩阵进行模式识别,选取最佳区分效果所对应的相对变化率下限值,剔除小于相对变化率下限值的特征值;
[0015] 步骤5:变异系数分析
[0016] 计算步骤4保留下来的特征值的变异系数,剔除变异系数大于0.15的特征值;
[0017] 步骤6:基于聚类分析的相关性分析
[0018] 将步骤5保留下来的特征值,以平方Euclidean距离为度量标准,对特征值进行聚类分析;计算各特征值的Rr值,并根据优化判别标准,对不同Rr上限值情况下得到的特征矩阵进行模式识别,选取最佳区分效果所对应的Rr上限值,剔除小于Rr上限值的特征值,以完成相关性分析;
[0019] 步骤7:方差膨胀因子分析
[0020] 对经步骤6分析保留下来的特征值进行方差膨胀因子分析,剔除VIF值大于10或VIF值大于20的特征值;并用优化判别标准进行验证,确定最佳VIF上限值来剔除相应特征值以降低特征矩阵多重共线性;
[0021] 步骤8:确定优化传感器阵列
[0022] 根据步骤7保留下来的特征值,选择对应的传感器,从而获得优化后的传感器阵列;
[0023] 进一步地,所述平均微分值法为提取响应曲线上相连两采样点间直线斜率的平均值;所述稳定值法为提取传感器与气体充分反应后响应曲线的稳定值;所述面积值法为提取响应曲线与X轴所组成区域的面积。
[0024] 进一步地,所述优化判别标准为主成分分析法。
[0025] 进一步地,所述Rr值为特征值与其他类所有特征值的相关系数绝对值累加和,其表达式为:
[0026]
[0027] 其中P为类数,N为各类中特征值个数,Rmj为该特征值与第m类第j个特征值之间的系数。
[0028] 与现有技术相比,本发明的有效益果:常用的阵列优化方法多为以传感器为个体,采用搜索性或非搜索性特征选择策略进行优化,往往忽略了传感器不同特征值在模式识别中包含有效信息的不同,往往不能获取较好的优化阵列。本发明基于非搜索性特征选择算法以特征值为对象进行优化,更加合理有效,能得到较佳的传感器阵列。

附图说明

[0029] 图1为本发明的流程图;
[0030] 图2为传感器的响应曲线图;
[0031] 图3为优化前后不同陈化时间山核桃PCA二维得分图;
[0032] 图4为均值分析PCA二维得分图;
[0033] 图5为聚类分析冰柱图。

具体实施方式

[0034] 下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0035] 实施例:
[0036] 如图1所示,本发明以以下具体实施例来进一步说明该发明的实施过程。
[0037] 本实施例中,采用人工陈化山核桃代替自然陈化山核桃。经验证,新鲜山核桃在30℃和35%相对湿度环境存放10天和20天后的各项理化指标与在4℃环境下储藏1年和2年山核桃的各项理化指标几乎相同。故挑选大小、颜色大致一致的山核桃置于温度为35℃、相对湿度为30%的恒温恒湿箱中,每隔5天取出一批作为一种新鲜度的山核桃样品,共计取出3批,再加上新鲜的山核桃,共计4批山核桃,分别为新鲜、陈化5天、陈化10天、陈化15天。进行实验时,从4批样品中,随机抽取30组,一共120组,每组20颗。
[0038] 步骤1:气敏传感器的选择
[0039] 根据胡玉霞等人于2011年发表的“顶空固相微萃取与气质联用分析山核桃香气成分”一文,针对山核桃GC-MS分析结果中含量较多的醛类、烯烷烃类、醇类、酸类气体选择13只金属氧化物传感器,各传感器具体型号及检测范围如表1所示。
[0040] 表1.初选传感器及其性能
[0041]
[0042]
[0043] 步骤2:初始传感器阵列的构建
[0044] 本实施例中,采用上述传感器对山核桃顶空气体进行检测,其典型的传感器响应曲线如图2所示。从图中可知,传感器TGS2442、TGS813、TGS816响应不明显,且对于不同陈化时间的山核桃,各传感器的响应趋势大致相同,且传感器TGS2442、TGS813、TGS816响应均不明显,故予以剔除,并选择剩余的10只传感器组成初始传感器阵列。
[0045] 步骤3:构造初始特征矩阵
[0046] 本实施例中,对传感器阵列的响应曲线采用不同的特征提取方法进行特征提取。所采用的提取方法如下:(1)平均微分值:相连两采样点间直线斜率的平均值;(2)稳定值:
传感器与气体充分反应后的响应值。(3)面积值:传感器响应曲线与X轴所组成区域的面积。
每个测试样品共提取10×3个特征参数,构成30维特征矩阵。特征值和传感器对应关系如表
2所示。所有测试样本的特征参数构成120×30的特征空间。
[0047] 表2特征编号和传感器编号的对应关系
[0048]
[0049]
[0050] 步骤4:均值分析
[0051] 本实施例中,采用PCA分析法获得二维得分图,初始特征矩阵的二维得分图,如图,3a所示。从图中可知,陈化10天与陈化15天山核桃存在部分重叠,且4批陈化山核桃的类内矩较大。以陈化10天于陈化15天山核桃的数据进行均值分析来剔除差异性较小的特征值。
均值分析结果如表3所示。为获取较好的优化结果,以PCA得分图的区分结果为判定标准,进行实际验证,验证结果如图4所示。经验证,剔除相对变化率小于5%的特征值,即剔除特征编号为W1、S1、S2、W5、S5、W6、P7、W7、S7、P8、S8、S9、W10、S10的特征值。
[0052] 表3.陈化10天与陈化15天山核桃样本特征值均值的相对变化率
[0053]
[0054]
[0055] 步骤5:变异系数分析
[0056] 本实施例中,分别计算陈化10天和陈化15天两批样品中各特征值的变异系数来分析特征值的重复性。分析结果如表4所示。故剔除特征编号为P6、P10的特征值。
[0057] 表4.陈化10天与陈化15天山核桃样本特征值的变异系数
[0058]特征值编号 变异系数 特征值编号 变异系数
a b a b
P1 0.0696/0.0717 S4 0.0237/0.0413
P2 0.0812a/0.0764b P5 0.0752a/0.0681b
W2 0.0257a/0.0167b P6 0.2516a/0.1718b
P3 0.0728a/0.0674b S6 0.0131a/0.0095b
W3 0.0298a/0.0315b W8 0.0363a/0.0361b
S3 0.0250a/0.0232b P9 0.1049a/0.0559b
P4 0.0204a/0.0748b W9 0.0406a/0.0401b
W4 0.0293a/0.0343b P10 0.1699a/0.1705b
[0059] 步骤6:基于聚类分析的相关性分析
[0060] 本实施例中,通过SPSS对保留特征值以平方Euclidean距离为度量标准进行聚类分析,分析结果冰柱图,如图5所示。通过实际尝试的方式,确定将特征值分为6类。并计算各特征值的Rr,结果如表5所示。故优先考虑第一类中Rr值小于8的特征值,即特征值编号为W2、W8、W9;优先考虑第二类中Rr值小于6的特征值,即特征值编号为P2、P3、P5、P9;其余各类特征值均保留。
[0061] 表5.各特征值的Rr值
[0062]特征值编号 数值 特征值编号 数值
P1 6.06 W4 9.604
P2 5.12 S4 9.18
W2 7.736 P5 4.793
P3 5.707 S6 9.146
W3 8.439 W8 5.892
S3 10.478 P9 5.722
P4 6.059 W9 4.969
[0063] 步骤7:方差膨胀因子分析
[0064] 本实施例中,通过SPSS对经步骤6分析保留的特征值进行方差膨胀因子分析,分析结果如表6所示。并根据表6,剔除VIF值大于20的特征值来实现最终优化,即剔除特征编号为W2、S3、W9的特征值。
[0065] 表6.各特征值方差膨胀因子
[0066]
[0067] 步骤8:确定优化传感器阵列
[0068] 本实施例中,根据上述步骤的优化,最终得到由特征编号为P2、P3、W4、S4、P5、S6、W8、P9的特征值构成的特征矩阵,并根据该矩阵确定了最终优化传感器阵列。其对应关系如表7所示。
[0069] 表7.优化阵列中传感器型号、特征值编号及特征值之间的对应关系
[0070]传感器型号 特征值编号 特征值
TGS2602 P2 平均微分值
TGS822 P3 平均微分值
TGS825 W4、S4 稳定值、面积值
TGS2444 P5 平均微分值
TGS2611 S6 面积值
TGS2620 W8 稳定值
WSP2110 P9 平均微分值
[0071] 优化后特征矩阵的PCA二维得分图,如图3b所示。对比可知,优化后的特征矩阵前两个主成分的贡献率分别为:76.01%、14.60%,较优化前的66.36%、13.45%有所提高。陈化10天和陈化15天山核桃也得到了明显的区分,同时各类山核桃的聚集度也明显提高。