目标类别判定方法转让专利
申请号 : CN202111584922.8
文献号 : CN113963225B
文献日 : 2022-04-26
发明人 : 王晨卉 , 何兆铭 , 李贺军 , 毕海 , 王悦
申请人 : 季华实验室
摘要 :
权利要求 :
1.一种目标类别判定方法,其特征在于,所述目标类别判定方法包括:获取待测样本集对应的目标光谱数据;
基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到;
其中,在所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到的步骤之前,所述目标类别判定方法还包括:
采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本;
基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型;
基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本分别对应的各预测结果;
基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息;
若所述判别精确信息不满足预设预测阈值条件,则获取所述判别精确信息不满足预设预测阈值对应白酒样本的光谱数据,并基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构。
2.如权利要求1所述的目标类别判定方法,其特征在于,所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果的步骤包括:基于所述待测样本集的目标光谱数据,通过所述树状种类判别结构的第一层级样本种类判别模型进行种类预测,获得所述待测样本集中各样本对应的种类预测结果,并确定未预测成功的各样本;
基于未预测成功的各样本对应的目标光谱数据,通过所述树状种类判别结构的下一层级样本种类判别模型进行种类预测,直至获得所述待测样本集中所有样本的种类预测结果。
3.如权利要求1所述的目标类别判定方法,其特征在于,在所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤之后,所述目标类别判定方法还包括:若所述不同种类白酒样本集对应的判别精确信息满足预设预测阈值条件,则将各所述测试样本的判别结果作为各自对应的目标种类判别结果。
4.如权利要求1所述的目标类别判定方法,其特征在于,所述采集不同种类白酒样本集的光谱数据的步骤包括:
获取不同种类白酒样本集;
分别将不同种类的白酒样本集进行划分,获得不同种类白酒的划分样本集;
基于预设光谱采集区间,通过预设光谱采集参数分别对各所述划分样本集进行光谱采集,获得所述不同种类白酒样本集对应的光谱数据。
5.如权利要求1所述的目标类别判定方法,其特征在于,所述基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型的步骤包括:分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据;
将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
基于各所述主成分数据,结合监督模式识别方法,构建所述第一层级样本种类判别模型。
6.如权利要求5所述的目标类别判定方法,其特征在于,所述分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据的步骤包括:基于预先设定的窗口宽度以及片段步长,分别对各所述训练样本以及各所述测试样本对应的光谱数据进行选取,获得各所述光谱片段数据。
7.如权利要求1所述的目标类别判定方法,其特征在于,所述基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型的步骤包括:
基于不满足预设预测阈值的各测试样本对应的判别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集;
分别在各所述易混淆样品集中提取各光谱片段数据;
将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级样本种类判别模型。
8.如权利要求1所述的目标类别判定方法,其特征在于,所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤包括:
基于每一所述测试样本对应的各预测结果,采取多数预测结果规则确定每一所述测试样本的判别结果;
基于每一所述测试样本的判别结果,按照预设判别计算方法分别计算不同种类白酒样本集对应的判别精确信息。
说明书 :
目标类别判定方法
技术领域
背景技术
气象色谱对经预处理的样品进行组分分离,然后以合适的检测器确定分离后的各种组分的
化学性质与含量,最后运用化学计量学的方法将不同样品中多种成分的分析结果进行比
对,得出区分结果,色谱技术虽然可以实现微量成分的分离与定性定量分析,但仪器操作方
法繁琐、工作成本较高,导致白酒样品种类检测的效率较低,而感官评价方法要求有经验的
评价人员对白酒样品进行品尝、对样品的各个感官指标进行打分,对评价人员依赖性较高,
导致白酒样品种类检测准确性较低。
发明内容
包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的
白酒样本集对应的光谱数据进行训练得到。
据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进
行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括
多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒
样本集对应的光谱数据进行训练得到,实现了不同光谱区分程度白酒样本集的光谱数据建
立样本种类判别模型,提升了模型的稳定性与准确程度,进一步地,设计包含多个样本种类
判别模型的树状种类判别结构,从而通过树状种类判别结构将样本逐级归类,有效提高复
杂白酒品种判别的效率以及准确性。
附图说明
言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
具体实施方式
判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区
分程度的白酒样本集对应的光谱数据进行训练得到。
同层级的样本种类判别模型为在不同光谱区分程度的白酒样本集对应的光谱数据中按照
特定的光谱区间提取的各光谱片段数据进行训练得到。
练样本和各测试样本对应的光谱数据进行选取各光谱片段数据,进而对各所述光谱片段数
据进行归一化处理,以降低对剔除对拉曼光谱绝对强度的依赖性,进而将处理后的各所述
光谱片段数据,运用主成分分析方法提取各所述光谱片段数据预设数量对应的主成分数
据,进而基于预设数量对应的主成分数据,结合监督模式识别方法构建第一层级样本种类
判别模型,进而通过所述第一层级样本种类判别模型分别对每一测试样本进行种类预测,
获得每一所述测试样本对应的各预测结果,基于每一所述测试样本对应的各预测结果,采
取多数预测结果规则确定每一所述测试样本的判别结果,计算不同种类白酒样本集对应的
判别精确信息,若所述判别精确信息不满足预设预测阈值条件,则确定所述判别精确信息
不满足预设预测阈值对应白酒样本,进而基于不满足预设预测阈值的各测试样本对应的判
别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集,进一步
地,基于预设的窗口宽度和片段步长分别对各所述易混淆样品集进行片段提取,获得各所
述易混淆样品集分别对应的各光谱片段数据,并且运用主成分分析方法提取预设数量对应
的主成分数据,通过复合的主成分分析以及结合监督模式识别方法,建立各所述易混淆样
品集对应的种类判别模型,从而形成第二层级样本种类判别模型,进一步地,基于不满足预
设预测阈值对应白酒样本,通过第二层级样本种类判别模型进行种类预测,以计算不满足
预设预测阈值对应白酒样本的判别精确信息,若还存在判别精确信息不满足所述预设预测
阈值的白酒样本,则继续构建第三层级样本种类判别模型,循环直至所有种类白酒样本集
的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构,进一步地,将待测
样本集对应的目标光谱数据输入上述已搭建的树状种类判别结构中,以对所述待测样本集
进行逐级预测,获得所述待测样本集的种类预测结果,其中,不同层级的样本种类判别模型
对应的窗口宽度和片段步长可以相同,也可以不同,以及主成分数据的数量可相同,也可以
不同。
果,并确定未预测成功的各样本;
种类预测结果。
模型,第二层种类区分模型为所述第二层级样本种类判别模型,第三层种类区分模型为所
述第三层级样本种类判别模型,白酒样本集为所述待测样本集,具体地,将待测样本集输入
所述树状种类判别结构的第一层级样本种类判别模型中进行种类预测,获得待测样本集中
各样本对应的种类预测结果,并且确定未预测成功的各样本,进而基于未预测成功的各样
本的种类预测结果,对未预测成功的各样本划分为各易混淆种类集,并基于所述树状种类
判别结构的第二层级样本种类判别模型,对各所述易混淆种类进行种类预测,以此类推,直
至预测完成所述待测样本集的所有样本,获得所述待测样本集中所有样本的种类预测结
果。
目标光谱数据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待
测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判
别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分
程度的白酒样本集对应的光谱数据进行训练得到,实现了光谱区分程度白酒样本集的光谱
数据建立样本种类判别模型,提升了模型的稳定性与准确程度,进一步地,设计包含多层级
样本种类判别模型的树状种类判别结构,从而通过树状种类判别结构将样本逐级归类,有
效提高复杂白酒品种判别的效率以及准确性。
级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层
级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本
集对应的光谱数据进行训练得到的步骤之前,所述目标类别判定方法还包括:
所述拉曼光谱数据的采集可通过激光显微共聚焦拉曼光谱仪进行采集。
数量的训练样本和测试样本,并且分别将每一种白酒的训练样本和测试样本分别进行划
分,进一步地,确定光谱采集区间,以基于所述光谱采集区间,按照相同的激光参数分别对
划分后的每一种类白酒对应的训练样本和测试样本进行不同次数的激光扫描,并根据训练
样本和测试样本对应的多次扫描结果,按照预设选取规则确定训练样本和测试样本对应的
光谱数据。
次,每个批次10瓶,从每瓶白酒中采集3个样本,共90个样本作为训练样本,每种白酒选择另
外1个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共30个样本作为测试样本。
部分。
立时间,预设光谱采集参数包括红外光参数、激光参数等,在本申请中,优选地,利用激光进
行采集光谱,所述预设光谱采集参数包括分辨率、激光波长、功率以及积分时间,例如,所述
‑1
分辨率可设为1 cm 、激光波长为532nm、功率为40 mW、积分时间4s。
数的激光扫描,获得各划分样本对应的多个扫描结果,进而按照预设选取方法对每一所述
划分样本的多个扫描结果,获得每一所述划分样本对应的光谱,参考图4,图4为本申请中对
白酒样本进行光谱采集的流程示意图,分别将90个训练样本和30个测试样本平均分为三部
分,将三个部分的训练样本分别进行3次、5次、7次扫描以及将三个部分的测试样本分别进
行3次、5次、7次扫描,每一样本多次扫描后的结果取平均值作为该样本光谱采集的结果,每
种白酒样品采集90个光谱数据与30个光谱数据,通过多个扫描次数的选取,使得光谱数据
在信号强度上的离散化,提高建模的稳定性,此外,需要说明的是,使用单一的扫描次数进
行拉曼光谱数据收集,虽然采集的同种样品的拉曼光谱强度一致性较高,但可能导致区分
模型过拟合,对区分模型使用时的鲁棒性有负面影响。
谱数据的任意一端开始,依次选取多个光谱片段数据,直至光谱数据的另一端结束,从而获
得多个不同位移区间的光谱片段数据,进而将各所述光谱片段数据对应的信号强度数据分
别进行归一化预处理,获得各目标片段数据,进而基于各所述目标片段数据,将具有相同位
移区间的各目标片段数据,通过主成分分析方法分别在各目标片段数据中提取预设数量的
主成分数据,进而结合监督模式识别方法分别构建树状种类判别结构中第一层级样本种类
判别模型,其中,所述监督模式识别方法支持向量机(AVM),决策树(deciAion treeA),K‑最
邻近(K‑NN)等方法,所述第一层级样本种类判别模型对应的数量与在每一所述光谱数据提
取的光谱片段数据的片段数量相同。
下步骤:
模型多所述测试样本进行预测,进而获得该测试样本对应的41个预测结果。
应的判别结果,按照预设计算方法计算每一种类白酒样本对应的判别精确信息。
判定方法还包括:
至少达到95%的种类归为已判别种类。
样本对应的41个预测结果,其中有40个预测结果为A种类白酒,1个预测结果为B种类白酒,
进而将40个对应的预测结果作为所述测试样本的判别结果。
样本数量,以及统计该种类白酒对应测试样本的判别结果为其他种类白酒的样本数量,精
确率与召回率的计算方法如下:
类,有10个样本为A类,因此,A类的精确率为100%,以及召回率为100%,而B类的精确率为
100%,以及召回率为66.67%。
样本种类判别模型的精确率不小于90%,召回率不小于90%。
本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型,循环直至所有种类
白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构。
对应白酒样本中各测试样本对应的判别结果,将不满足预设预测阈值对应白酒样本进行分
类,获得各易混淆样品集,进而基于获得各易混淆样品集对应的光谱数据,按照预先设定的
窗口宽度以及片段步长对所述光谱数据进行选取各光谱片段数据,通过主成分分析方法分
别在各目标片段数据中提取预设数量的主成分数据,进而结合监督模式识别方法分别构建
树状种类判别结构中第二层级样本种类判别模型,需要说明的是不同层级的样本种类判别
模型的窗口宽度以及片段步长可以相同,也可不同,主成分数据的预设数量可以相同,也可
不同,进而根据第二层级样本种类判别模型,对不满足预设预测阈值对应白酒样本中各测
试样本进行种类预测,以基于种类预测结果,计算不满足预设预测阈值对应白酒样本对应
的判别精确信息,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈
值,获得所述树状种类判别结构,从而实现了通过预先设定的窗口宽度以及片段步长进行
选取各光谱片段数据,以及选取预设数量的主成分数据,并且结合监督识别方法,构建出包
括多层级样本种类判别模型的树状种类判别结构,提高模型种类预测的准确性,并且及时
当白酒样品集的复杂程度提高、同时包含拉曼光谱区分程度不同的品种时,通过树状种类
判别结构,将样本进行逐级归类,实现较大光谱数据区分度样品的种类的高效判别,同时提
高较小光谱区分度样本的种类判别准确程度。
的步骤包括:
方式中,窗口宽度以及片段步长的确定方法,可按照预设的窗口宽度的范围以及片段步长
‑1 ‑1
的范围进行各种组合从而优化参数,例如,尝试900到1200cm 的窗口宽度与1到10cm 片段
步长的各种组合,对光谱数据截取方式进行优化得到,在另一种可实施方式中,也可建立算
法模型来对光谱区间进行迭代优化,从而确定窗口宽度以及片段步长,例如,参照图6,图6
‑1
为本申请进行截取光谱片段数据的结构示意图,在400‑1500 cm 光谱采集区间对应的光谱
‑1 ‑1
数据中,按照窗口宽度为900 cm ,以最小分辨率的5倍(5 cm )为片段步长进行选取光谱
‑1
片段数据,从而获得41个窗口宽度为900 cm 的光谱片段数据。
的现象、增加模型的鲁棒性,归一化处理具体如下:
准确程度。
的光谱数据进行选取,获得各所述光谱片段数据,进而对各所述光谱片段数据进行归一化
处理,通过主成分分析方法在归一化处理的各光谱片段数据中提取预设数量的主成分数
据,进一步地,基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级
样本种类判别模型,步骤C20至步骤C50的具体实施内容可参照步骤B10至步骤B40中的具体
内容,在此不再赘述。
品牌白酒中,每种白酒选择3个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共90个样
本作为训练样本,每种白酒选择另外1个批次,10瓶,从每瓶白酒中采集3个样本。共30个样
本作为测试样本。
运用相同的激光参数,分别进行3次、5次、7次扫描,多次扫描后取平均值作为一次光谱采集
的结果,每种白酒样品采集90个训练集拉曼光谱与30个测试集拉曼光谱,从训练样本与测
‑1
试样本包括的每个400‑1500cm 区间的拉曼光谱数据中,运用以下经优化的参数进行光谱
‑1 ‑1
片段选取,其中,尝试900到1200cm 的窗口宽度以及1到10cm 片段步长的各种组合,对光
‑1
谱数据进行截取优化参数,例如:按照900 cm 窗口宽度,从拉曼光谱数据的任意一端开始,
‑1
以最小分辨率的5倍(5 cm )为片段步长,依次选取多个拉曼光谱数据片段,到拉曼光谱的
‑1
另一端结束。从每一个原始拉曼光谱中选取41个长度为900 cm 拉曼光谱片段数据,对所得
到的每个拉曼光片段的信号强度数据分别进行独立的归一化预处理,消除对拉曼光谱绝对
强度的依赖,在片段选择与归一化后,基于所有样本有相同的拉曼位移区间的拉曼光谱片
段数据,运用主成分分析方法,以及结合支持向量机方法,将主成分值优化至前4个,分别建
立41个样本种类判别模型,分别对每个测试集样本的种类进行判别,针对每个测试样本,运
用获得的41个种类判别结果进行投票,票数最多的种类作为判别结果,参考表1,表1为同品
牌7种30% vol酒精度白酒的种类判别结果,可以看出对白酒样品集中种类4‑7的测试样本
实现了100%精确率与100%召回率标准的种类判别,而白酒样品集中种类1‑3的样本在该节
点的样品种类判别模型的预测结果中相互混淆。
‑1
cm‑1范围的拉曼光谱数据,运用以下经优化的参数进行光谱片段选取:按照1000 cm 窗口
‑1
宽度,从拉曼光谱的任意一端开始,以最小分辨率(1 cm )为片段步长,依次选取多个拉曼
光谱数据片段,到拉曼光谱的另一端结束。从每一个原始拉曼光谱中选取101个长度为1000
‑1
cm 拉曼光谱片段,对所得到的每个拉曼光片段的强度数据分别进行独立的归一化预处理,
消除对拉曼光谱绝对强度的依赖,在片段选择与归一化后,基于所有样本有相同的拉曼位
移区间的拉曼光谱片段数据,运用主成分分析方法,以及结合支持向量机,将主成分值优化
至前25个,分别建立101个白酒样本种类判别模型,分别对每个测试样本的种类进行判别,
针对每个测试样本,将获得的101个种类判别结果进行选取票数最多的种类作为判别结果,
对白酒样品集中种类1‑3的测试样本实现了精确率(≥90%)与召回率(≥90%)的种类判别。
术领域,均同理包括在本申请的专利处理范围内。