会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 人工智能 / 人工神经网络 / 一种近红外光谱快速判定茶鲜叶产地的方法

一种近红外光谱快速判定茶鲜叶产地的方法

阅读:547发布:2021-03-03

IPRDB可以提供一种近红外光谱快速判定茶鲜叶产地的方法专利检索,专利查询,专利分析的服务。并且一种近红外光谱快速判定茶鲜叶产地的方法,应用近红外光谱仪,扫描获得不同产地鲜叶样品近红外光谱,然后对鲜叶样品光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的鲜叶产地人工神经网络预测模型,具体包括以下步骤:鲜叶样品采集与分类,光谱采集,光谱预处理,鲜叶光谱主成分分析,建立人工神经网络预测模型以及模型验证等。实现了茶鲜叶产地的快速、无损、准确判别,有效的解决了鲜叶收购时其产地来源判定难的问题,研究结果也为其它地理标志产品的产地判定提供了一种有益的参考。,下面是一种近红外光谱快速判定茶鲜叶产地的方法专利的具体信息内容。

1.一种近红外光谱快速判定茶鲜叶产地的方法,其特征在于,扫描获得不同产地鲜叶样品近红外光谱,然后对鲜叶样品近红外光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的鲜叶产地人工神经网络预测模型判定鲜叶产地,具体包括以下步骤:步骤一、鲜叶样品采集与分类

分别采集不同产地的鲜叶样品,根据其产地不同,将鲜叶样品随机划分为校正集和验证集2个集合,采摘的鲜叶样品为一芽一叶、一芽二叶和一芽三叶;

步骤二、光谱采集

应用傅里叶型近红外光谱仪扫描获得全部鲜叶样品的近红外光谱,所述的傅里叶型近红外光谱仪为用美国赛默飞·世尔AntarisⅡ型傅里叶近红外光谱仪,光谱扫描范围4000-

10000cm-1,分辨率8cm-1,检测器为InGaAs,每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱;

步骤三、光谱预处理

应用化学计量学软件对全部鲜叶样品的近红外光谱进行求导和平滑预处理,然后将鲜叶样品光谱转化为成对的数据点;

步骤四、鲜叶样品光谱主成分分析

应用Matlab软件对全部鲜叶样品的光谱数据进行主成分分析,求得全部鲜叶样品光谱数据的得分Score1值和Score2值,主成分数及其贡献率;

步骤五、建立人工神经网络预测模型

以校正集样品光谱的前3个主成分为输入值,以鲜叶样品产地为输出值,经过反复优化,建立standardnets、jumpconnectionnets和Jordan-Elmannets三种信息传递方式鲜叶产地人工神经网络预测模型,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,其中相关系数R公式为:交互验证均方根方差RMSECV公式为:

式中,R为相关系数,n表示样本数,yi和yi’分别为样品集中第i个样品的产地实测值和产地预测值,为样品集中第i个样品的实测值的平均值,式中i≤n,其中以相关系数R最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型;

步骤六、模型验证

为避免出现过度拟合现象,应用验证集样品对得到的三种校正集模型预测效果进行检验,所得结果用相关系数R和验证集均方差RMSEP表示,其中相关系数R越大和验证集均方差RMSEP越小则表示检验效果越好,此时若得到的近红外光谱的产地预测值与产地实测值基本一致,则表示对验证集样品的预测效果很好,最佳校正集模型可以准确的预测鲜叶样品的产地,其中验证集均方差RMSEP公式为:

式中,n表示样本数,yi和yi’分别为样品集中第i个样品的产地实测值和产地预测值,式中i≤n。

2.根据权利要求1所述的一种近红外光谱快速判定茶鲜叶产地的方法,其特征在于:所述的步骤一中鲜叶样品数量为100份,鲜叶样品按照3:1的比例随机划分为校正集和验证集。

3.根据权利要求1所述的一种近红外光谱快速判定茶鲜叶产地的方法,其特征在于:所述步骤三中的化学计量学软件为TQAnalyst9.4.45软件和OPUS7.0软件。

说明书全文

一种近红外光谱快速判定茶鲜叶产地的方法

技术领域

[0001] 本发明涉及一种判定茶鲜叶产地的方法,更具体的说涉及一种近红外光谱快速判定茶鲜叶产地的方法。

背景技术

[0002] 地理标志产品是指产自特定区域,所具有的质量、声誉或其他特性本质上取决于该产地的自然因素和人为因素,经审核批准以地理名称进行命名的产品。地理标志产品除了按规定必须使用专用标志外,其产品质量还得到了政府担保,具有其他产品无法比拟的声誉和身价,为消费者放心购买和使用提供可靠保障。
[0003] 恩施玉露是我国著名的蒸青绿茶,也是地理标志保护产品,恩施玉露保护区内生态环境优异;其以保护区范围内自然生长的茶鲜叶为加工原料,配以独有的加工工艺,形成了具有独特品质的恩施玉露茶。但是,由于受到利益驱使,保护区周边的部分不法茶农采摘非保护区范围内的鲜叶,声称为保护区内的茶鲜叶,并以较高的价格卖给茶叶加工厂,而收购人员很难根据自身工作经验来判定鲜叶产地来源。因此,为从加工源头上确保恩施玉露茶的地理标志产品属性,保证恩施玉露茶的品质特性,急需建立一种快速、准确、无损地判定茶鲜叶产地的方法。

发明内容

[0004] 本发明的目的在于针对现有的茶叶收购人员很难根据自身工作经验来判定鲜叶产地来源等缺陷,提供一种近红外光谱快速判定茶鲜叶产地的方法。
[0005] 为实现上述目的,本发明的技术解决方案是:一种近红外光谱快速判定茶鲜叶产地的方法,扫描获得不同产地鲜叶样品近红外光谱,然后对鲜叶样品近红外光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的鲜叶产地人工神经网络预测模型判定鲜叶产地,具体包括以下步骤:
[0006] 步骤一、鲜叶样品采集与分类
[0007] 分别采集不同产地的鲜叶样品,根据其产地不同,将鲜叶样品随机划分为校正集和验证集2个集合;
[0008] 步骤二、光谱采集
[0009] 应用傅里叶型近红外光谱仪扫描获得全部鲜叶样品的近红外光谱;
[0010] 步骤三、光谱预处理
[0011] 应用化学计量学软件对全部鲜叶样品的近红外光谱进行求导和平滑预处理,然后将鲜叶样品光谱转化为成对的数据点;
[0012] 步骤四、鲜叶样品光谱主成分分析
[0013] 应用Matlab软件对全部鲜叶样品的光谱数据进行主成分分析,求得全部鲜叶样品光谱数据的得分Score1值和Score2值,主成分数及其贡献率;
[0014] 步骤五、建立人工神经网络预测模型
[0015] 以校正集样品光谱的前3个主成分为输入值,以鲜叶样品产地为输出值,经过反复优化,建立standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式鲜叶产地人工神经网络预测模型,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,
[0016] 其中相关系数R公式为:
[0017] 交互验证均方根方差RMSECV公式为:
[0018] 式中,R为相关系数,n表示样本数,yi和yi’分别为样品集中第i个样品的产地实测值和产地预测值,为样品集中第i个样品的实测值的平均值,式中i≤n,[0019] 其中以相关系数R最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型;
[0020] 步骤六、模型验证
[0021] 为避免出现过度拟合现象,应用验证集样品对得到的三种校正集模型预测效果进行检验,所得结果用相关系数R和验证集均方差RMSEP表示,其中相关系数R越大和验证集均方差RMSEP越小则表示检验效果越好,此时若得到的近红外光谱的产地预测值与产地实测值基本一致,则表示对验证集样品的预测效果很好,最佳校正集模型可以准确的预测鲜叶样品的产地,
[0022] 其中验证集均方差RMSEP公式为:
[0023] 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的产地实测值和产地预测值,式中i≤n。
[0024] 所述的步骤一中鲜叶样品数量为100份,鲜叶样品按照3:1的比例随机划分为校正集和验证集。
[0025] 所述的步骤一中采摘的鲜叶样品为一芽一叶、一芽二叶和一芽三叶。
[0026] 所述步骤二中的傅里叶型近红外光谱仪为用美国赛默飞·世尔AntarisⅡ型傅里叶近红外光谱仪,光谱扫描范围4000-10000cm-1,分辨率8cm-1,检测器为InGaAs,每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱。
[0027] 所述步骤三中的化学计量学软件为TQ Analyst 9.4.45软件和OPUS 7.0软件。
[0028] 与现有技术相比,本发明的有益效果:
[0029] 本发明中基于近红外光谱技术,结合主成分分析和多种信息传递方式的人工神经网络模型判定鲜叶产地,实现了茶鲜叶产地的快速、无损、准确判别,有效的解决了鲜叶收购时其产地来源判定难的问题,研究结果也为其它地理标志产品的产地判定提供了一种有益的参考。

附图说明

[0030] 图1是本发明中全部100个鲜叶样品光谱图。
[0031] 图2是本发明中保护区鲜叶样品和非保护区鲜叶样品Scores1值和Scores2值空间分布图。
[0032] 图3是本发明中standard nets信息传递人工神经网络结构。
[0033] 图4是本发明中jump connection nets信息传递人工神经网络结构。
[0034] 图5是本发明中Jordan-Elman nets信息传递人工神经网络结构。

具体实施方式

[0035] 以下结合附图说明和具体实施方式对本发明作进一步的详细描述。
[0036] 一种近红外光谱快速判定茶鲜叶产地的方法,扫描获得不同产地鲜叶样品近红外光谱,然后对鲜叶样品近红外光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的鲜叶产地人工神经网络预测模型判定鲜叶产地。具体包括以下步骤:
[0037] 步骤一、鲜叶样品采集与分类
[0038] 分别采集不同产地的鲜叶样品,根据其产地不同,将鲜叶样品随机划分为校正集和验证集2个集合;其中验证集鲜叶样品用于检验鲜叶产地校正集预测模型的稳健性。
[0039] 步骤二、光谱采集
[0040] 应用傅里叶型近红外光谱仪(FT-NIR)扫描获得全部鲜叶样品的近红外光谱。
[0041] 近红外光谱(NIRS)是一种介于可见光区和中红外光区之间的电磁波,具有快速、准确和无需预处理等特点,目前已经广泛应用于农业、石化行业、纺织业、医药行业和烟草行业中。在茶叶应用领域中,近红外光谱技术已经成功的实现了对咖啡碱、茶多酚总量的预测及对茶溯源地的判定等。
[0042] 步骤三、光谱预处理
[0043] 应用化学计量学软件对全部鲜叶样品的近红外光谱进行求导和平滑等预处理,然后将鲜叶样品光谱转化为成对的数据点,用于后续建立鲜叶产地校正集预测模型和验证集模型。
[0044] 步骤四、鲜叶样品光谱主成分分析(PCA)
[0045] 应用Matlab软件对全部鲜叶样品的光谱数据进行主成分分析,求得全部鲜叶样品光谱数据的得分Score1值和Score2值,主成分数及其贡献率。
[0046] 步骤五、建立人工神经网络(BP-ANN)预测模型
[0047] 以校正集样品光谱的前3个主成分为输入值,以鲜叶样品产地为输出值,经过反复优化,建立standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式鲜叶产地人工神经网络预测模型,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,
[0048] 其中相关系数R公式为:
[0049] 交互验证均方根方差RMSECV公式为:
[0050] 式中,R为相关系数,n表示样本数,yi和yi’分别为样品集中第i个样品的产地实测值和产地预测值,为样品集中第i个样品的实测值的平均值,式中i≤n;
[0051] 其中以相关系数R最大和交互验证均方根方差RMSECV最小的模型为最佳模型,该模型精度最高,经比较后得到最佳校正集模型。
[0052] 步骤六、模型验证
[0053] 为避免出现过度拟合现象,应用验证集样品对得到的三种校正集模型预测效果进行检验,即是用已经得到的三种校正集预测模型来预测验证集样品的鲜叶产地预测值是否与已经知道的实测值是否一致。所得结果用相关系数R和验证集均方差RMSEP表示,其中相关系数R越大和验证集均方差RMSEP越小则表示检验效果越好;结果用验证集样品的数据进行表达,此时若得到的近红外光谱的产地预测值与产地实测值基本一致,则表示对验证集样品的预测效果很好,最佳校正集模型可以准确的预测鲜叶样品的产地。
[0054] 其中验证集均方差RMSEP公式为: 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的产地实测值和产地预测值,式中i≤n。
[0055] 具体的,所述的步骤一中鲜叶样品数量为100份,鲜叶样品按照3:1的比例随机划分为校正集和验证集。
[0056] 具体的,所述的步骤一中采摘的鲜叶样品为一芽一叶、一芽二叶和一芽三叶。
[0057] 具体的,所述步骤二中的傅里叶型近红外光谱仪为用美国赛默飞·世尔AntarisⅡ型傅里叶近红外光谱仪,光谱扫描范围4000-10000cm-1,分辨率8cm-1,检测器为InGaAs,每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱。
[0058] 具体的,所述步骤三重的化学计量学软件为TQ Analyst 9.4.45软件和OPUS 7.0软件。
[0059] 具体实施例一:
[0060] (1)鲜叶样品采集与分类
[0061] 采集鲜叶样品共100个,其中恩施玉露保护区鲜叶样品60个,非保护区茶鲜叶样品40个。采摘时间为2015年4月3日-4月10日;采摘的鲜叶样品为一芽一叶、一芽二叶和一芽三叶。根据产地不同,将样品分为校正集和验证集2个集合,其中校正集75个样品(恩施玉露保护区鲜叶样品45个,非保护区鲜叶样品30个);验证集样品25个(恩施玉露保护区鲜叶样品
15个,非保护区鲜叶样品10个),验证集用于检验校正集模型的稳健性。
[0062] (2)光谱采集
[0063] 参见图1,采用美国赛默飞·世尔AntarisⅡ型傅里叶近红外光谱仪(FT-NIR),选-1 -1用积分球漫反射光学平台;光谱扫描范围4000-10000cm ;分辨率8cm ,检测器为InGaAs。
每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱。
光谱采集前,将该光谱仪预热1h,保持室内温度和湿度基本一致后,将鲜叶样品装入与该仪器配套的旋转杯中采集光谱,全部鲜叶样品光谱参见图1。
[0064] (3)光谱预处理
[0065] 在光谱采集过程中,通常会产生高频噪声和基线漂移等影响模型预测效果的噪声信息,因此,在建立校正集模型前需要对光谱进行预处理。因此应用化学计量学软件TQ Analyst9.4.45软件和OPUS 7.0软件对全部鲜叶样品的近红外光谱进行求导和平滑等预处理;然后将鲜叶样品光谱转化为1557对数据点,用于后续数据分析,建立判别模型。
[0066] (4)鲜叶光谱主成分分析(PCA)
[0067] 应用Matlab软件对全部鲜叶光谱进行主成分分析,求得主成分数及其贡献率。前8个主成分的贡献率分别如下:
[0068] 表1 前8个主成分贡献率
[0069]
[0070] 从表1可以看出,PC1贡献率最大,为86.13%;从PC1—PC8主成分贡献率急剧降低,PC8贡献率仅为0.01%。其中,PC1,PC2和PC3三个主成分的累计贡献率为99.66%,完全可以代表上述光谱信息,用于后续数据分析。
[0071] 根据上述主成分分析求得的全部鲜叶样品光谱数据的得分Score1值和Score2值信息,得到恩施玉露保护区鲜叶样品和非保护区鲜叶样品的空间位置分布图,具体参见图2。
[0072] 从图2可以看出,保护区鲜叶样品主要分布于坐标轴第三、第四象限,非保护区鲜叶主要分布于坐标轴第一、第二象限,但两者间还有少量样品在分布空间存在信息交叉的状态。因此,仅应用主成分分析求得样品scores1值和scores2值进而确定其空间位置的方法无法达到准确判定鲜叶产地的目的。
[0073] (5)建立人工神经网络(BP-ANN)预测模型
[0074] 在建立人工神经网络模型时,要求尽可能的减少输入变量,但还要尽可能多的代表原始光谱数据信息,因此,选择以上述主成分分析法筛选的光谱的前3个主成分(累计贡献率为99.66%)为输入值,以鲜叶产地为输出值(恩施玉露保护区鲜叶产地值为1.0000,非保护区鲜叶产地值为2.0000),经过反复优化,建立鲜叶产地人工神经网络预测模型。在建立模型的过程中,由于人工神经网络模型内部信息传递方式的不同,而导致建立模型的预测效果也会产生较大差异。在建模过程中,分别比较了standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式人工神经网络模型的预测效果,具体参见图3,通过将前3个主成分分别输入到3种人工神经网络模型中,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,得到了最佳校正集预测模型。最佳校正集模型为Jordan-Elman nets传递方式人工神经网络模型,R为0.940,RMSECV为0.190。
[0075] (6)模型验证
[0076] 为避免出现过度拟合现象,应用验证集25个样品对三种校正集模型进行检验,所得结果用相关系数R和验证集均方差RMSEP表示,具体参见下面的表2:
[0077] 表2 3种人工神经网络模型建模结果比较
[0078]
[0079] 从表2可以看出,鲜叶产地standard nets结构人工神经网络模型校正集相关系数R为0.851,交互验证均方根方差RMSECV为0.288,当用验证集样品进行检验时,得到验证集模型R为0.766,RMSEP为0.331。鲜叶产地jump connection nets结构人工神经网络模型校正集R为0.849,RMSECV为0.289,当用验证集样品进行检验时,得到验证集模型R为0.769,RMSEP为0.326。鲜叶产地Jordan-Elman nets结构人工神经网络模型校正集R为0.940,RMSECV为0.190,当用验证集样品进行检验时,得到验证集模型R为0.905,RMSEP为0.269。可见,在建立的3种信息传递方式人工神经网络模式中,以Jordan-Elman nets结构模型最优,而standard nets结构模型和jump connection nets结构模型预测结果较为接近。
[0080] 应用最佳Jordan-Elman nets结构模型对25个验证集样品产地进行预测,判别结果具体见表3。从表3可以看出,最佳校正集模型可以准确的预测未知样品的产地,达到了较为理想的判定效果(100%),可见,Jordan-Elman nets结构人工神经网络模型可以实现鲜叶产地的快速、准确判别。
[0081] 表3 25个验证集样品产地预测结果
[0082]
[0083] 本发明应用近红外光谱技术,先扫描获得鲜叶样品的近红外光谱,有效降低噪声信息后,对样品光谱进行主成分分析求得Score1值和Score2值,但还不能完全区分两类鲜叶样品的产地;接着采用具有良好非线性特性的人工神经网络方法,以前3个主成分为输入值,建立了standard nets、jump connection nets和Jordan-Elman nets三种结构的鲜叶产地人工神经网络模型,得到以Jordan-Elman nets结构模型预测效果最佳,实现了茶鲜叶产地的快速、准确判别,有效的解决了鲜叶收购时其产地来源判定难的问题。同时,研究结果也为其它地理标志产品的产地判定提供了一种有益的参考。
[0084] 以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,上述结构都应当视为属于本发明的保护范围。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用