目标类别判定方法转让专利

申请号 : CN202111584922.8

文献号 : CN113963225B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王晨卉何兆铭李贺军毕海王悦

申请人 : 季华实验室

摘要 :

本申请公开了一种目标类别判定方法,所述目标类别判定方法包括:获取待测样本集对应的目标光谱数据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到。本申请解决白酒样品种类检测的效率低以及准确性低的技术问题。

权利要求 :

1.一种目标类别判定方法,其特征在于,所述目标类别判定方法包括:获取待测样本集对应的目标光谱数据;

基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到;

其中,在所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到的步骤之前,所述目标类别判定方法还包括:

采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本;

基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型;

基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本分别对应的各预测结果;

基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息;

若所述判别精确信息不满足预设预测阈值条件,则获取所述判别精确信息不满足预设预测阈值对应白酒样本的光谱数据,并基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构。

2.如权利要求1所述的目标类别判定方法,其特征在于,所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果的步骤包括:基于所述待测样本集的目标光谱数据,通过所述树状种类判别结构的第一层级样本种类判别模型进行种类预测,获得所述待测样本集中各样本对应的种类预测结果,并确定未预测成功的各样本;

基于未预测成功的各样本对应的目标光谱数据,通过所述树状种类判别结构的下一层级样本种类判别模型进行种类预测,直至获得所述待测样本集中所有样本的种类预测结果。

3.如权利要求1所述的目标类别判定方法,其特征在于,在所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤之后,所述目标类别判定方法还包括:若所述不同种类白酒样本集对应的判别精确信息满足预设预测阈值条件,则将各所述测试样本的判别结果作为各自对应的目标种类判别结果。

4.如权利要求1所述的目标类别判定方法,其特征在于,所述采集不同种类白酒样本集的光谱数据的步骤包括:

获取不同种类白酒样本集;

分别将不同种类的白酒样本集进行划分,获得不同种类白酒的划分样本集;

基于预设光谱采集区间,通过预设光谱采集参数分别对各所述划分样本集进行光谱采集,获得所述不同种类白酒样本集对应的光谱数据。

5.如权利要求1所述的目标类别判定方法,其特征在于,所述基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型的步骤包括:分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据;

将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;

通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;

基于各所述主成分数据,结合监督模式识别方法,构建所述第一层级样本种类判别模型。

6.如权利要求5所述的目标类别判定方法,其特征在于,所述分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据的步骤包括:基于预先设定的窗口宽度以及片段步长,分别对各所述训练样本以及各所述测试样本对应的光谱数据进行选取,获得各所述光谱片段数据。

7.如权利要求1所述的目标类别判定方法,其特征在于,所述基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型的步骤包括:

基于不满足预设预测阈值的各测试样本对应的判别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集;

分别在各所述易混淆样品集中提取各光谱片段数据;

将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;

通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;

基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级样本种类判别模型。

8.如权利要求1所述的目标类别判定方法,其特征在于,所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤包括:

基于每一所述测试样本对应的各预测结果,采取多数预测结果规则确定每一所述测试样本的判别结果;

基于每一所述测试样本的判别结果,按照预设判别计算方法分别计算不同种类白酒样本集对应的判别精确信息。

说明书 :

目标类别判定方法

技术领域

[0001] 本申请涉及液体样品检测技术领域,尤其涉及一种目标类别判定方法。

背景技术

[0002] 酒作为中国的传统产品之一,有着悠久的历史。传统的白酒区分方法为色谱法与感官评价方法,其中,色谱法是依据不同色谱的特点对原始样品进行预处理,再应用液相/
气象色谱对经预处理的样品进行组分分离,然后以合适的检测器确定分离后的各种组分的
化学性质与含量,最后运用化学计量学的方法将不同样品中多种成分的分析结果进行比
对,得出区分结果,色谱技术虽然可以实现微量成分的分离与定性定量分析,但仪器操作方
法繁琐、工作成本较高,导致白酒样品种类检测的效率较低,而感官评价方法要求有经验的
评价人员对白酒样品进行品尝、对样品的各个感官指标进行打分,对评价人员依赖性较高,
导致白酒样品种类检测准确性较低。

发明内容

[0003] 本申请的主要目的在于提供一种目标类别判定方法,旨在解决现有技术中的白酒样品种类检测的效率低以及准确性低的技术问题。
[0004] 为实现上述目的,本申请提供一种目标类别判定方法,所述目标类别判定方法包括:
[0005] 获取待测样本集对应的目标光谱数据;
[0006] 基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构
包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的
白酒样本集对应的光谱数据进行训练得到。
[0007] 本申请提供了一种目标类别判定方法,相比于现有技术采用的通过色谱法或感官评价方法来检测白酒的种类的技术手段,本申请首先获取待测样本集对应的目标光谱数
据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进
行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括
多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒
样本集对应的光谱数据进行训练得到,实现了不同光谱区分程度白酒样本集的光谱数据建
立样本种类判别模型,提升了模型的稳定性与准确程度,进一步地,设计包含多个样本种类
判别模型的树状种类判别结构,从而通过树状种类判别结构将样本逐级归类,有效提高复
杂白酒品种判别的效率以及准确性。

附图说明

[0008] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0009] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而
言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0010] 图1为本申请目标类别判定方法第一实施例的流程示意图;
[0011] 图2为本申请树状种类判别结构中不同层级样本种类判别模型建立流程示意图;
[0012] 图3为本申请目标类别判定方法第二实施例的流程示意图;
[0013] 图4为本申请中对白酒样本进行光谱采集的流程示意图;
[0014] 图5为本申请目标类别判定方法第三实施例的流程示意图;
[0015] 图6为本申请进行截取光谱片段数据的结构示意图。
[0016] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0017] 应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0018] 本申请实施例提供一种目标类别判定方法,在本申请目标类别判定方法的第一实施例中,参照图1,所述目标类别判定方法包括:
[0019] 步骤S10,获取待测样本集对应的目标光谱数据;
[0020] 在本实施例中,需要说明的是,所述目标光谱数据包括紫外‑可见光光谱数据、X射线光谱数据、红外光谱数据以及拉曼光谱数据等,在本申请中,优选地,选取拉曼光谱数据。
[0021] 具体地,首先通过预设采集设备采集待测样本集对应的光谱数据,进而在光谱数据谱峰聚集的区间中进行采集待测样本集的目标光谱数据。
[0022] 步骤S20,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类
判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区
分程度的白酒样本集对应的光谱数据进行训练得到。
[0023] 在本实施例中,需要说明的是,所述树状种类判别结构包括多个层级样本种类判别模型,所述样本种类判别模型为基于不同种类白酒样本集的光谱数据进行建立,所述不
同层级的样本种类判别模型为在不同光谱区分程度的白酒样本集对应的光谱数据中按照
特定的光谱区间提取的各光谱片段数据进行训练得到。
[0024] 具体地,首先,采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本,进而基于预先设定的窗口宽度和片段步长在各训
练样本和各测试样本对应的光谱数据进行选取各光谱片段数据,进而对各所述光谱片段数
据进行归一化处理,以降低对剔除对拉曼光谱绝对强度的依赖性,进而将处理后的各所述
光谱片段数据,运用主成分分析方法提取各所述光谱片段数据预设数量对应的主成分数
据,进而基于预设数量对应的主成分数据,结合监督模式识别方法构建第一层级样本种类
判别模型,进而通过所述第一层级样本种类判别模型分别对每一测试样本进行种类预测,
获得每一所述测试样本对应的各预测结果,基于每一所述测试样本对应的各预测结果,采
取多数预测结果规则确定每一所述测试样本的判别结果,计算不同种类白酒样本集对应的
判别精确信息,若所述判别精确信息不满足预设预测阈值条件,则确定所述判别精确信息
不满足预设预测阈值对应白酒样本,进而基于不满足预设预测阈值的各测试样本对应的判
别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集,进一步
地,基于预设的窗口宽度和片段步长分别对各所述易混淆样品集进行片段提取,获得各所
述易混淆样品集分别对应的各光谱片段数据,并且运用主成分分析方法提取预设数量对应
的主成分数据,通过复合的主成分分析以及结合监督模式识别方法,建立各所述易混淆样
品集对应的种类判别模型,从而形成第二层级样本种类判别模型,进一步地,基于不满足预
设预测阈值对应白酒样本,通过第二层级样本种类判别模型进行种类预测,以计算不满足
预设预测阈值对应白酒样本的判别精确信息,若还存在判别精确信息不满足所述预设预测
阈值的白酒样本,则继续构建第三层级样本种类判别模型,循环直至所有种类白酒样本集
的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构,进一步地,将待测
样本集对应的目标光谱数据输入上述已搭建的树状种类判别结构中,以对所述待测样本集
进行逐级预测,获得所述待测样本集的种类预测结果,其中,不同层级的样本种类判别模型
对应的窗口宽度和片段步长可以相同,也可以不同,以及主成分数据的数量可相同,也可以
不同。
[0025] 其中,所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果的步骤包括:
[0026] 步骤S21,基于所述待测样本集的目标光谱数据,通过所述树状种类判别结构的第一层级样本种类判别模型进行种类预测,获得所述待测样本集中各样本对应的种类预测结
果,并确定未预测成功的各样本;
[0027] 步骤S22,基于未预测成功的各样本对应的目标光谱数据,通过所述树状种类判别结构的下一层级样本种类判别模型进行种类预测,直至获得所述待测样本集中所有样本的
种类预测结果。
[0028] 在本实施例中,具体地,参照图2,图2为本申请树状种类判别结构中不同层级样本种类判别模型建立流程示意图,其中,第一层种类区分模型为所述第一层级样本种类判别
模型,第二层种类区分模型为所述第二层级样本种类判别模型,第三层种类区分模型为所
述第三层级样本种类判别模型,白酒样本集为所述待测样本集,具体地,将待测样本集输入
所述树状种类判别结构的第一层级样本种类判别模型中进行种类预测,获得待测样本集中
各样本对应的种类预测结果,并且确定未预测成功的各样本,进而基于未预测成功的各样
本的种类预测结果,对未预测成功的各样本划分为各易混淆种类集,并基于所述树状种类
判别结构的第二层级样本种类判别模型,对各所述易混淆种类进行种类预测,以此类推,直
至预测完成所述待测样本集的所有样本,获得所述待测样本集中所有样本的种类预测结
果。
[0029] 本申请实施例提供了一种目标类别判定方法,相比于现有技术采用的通过色谱法或感官评价方法来检测白酒的种类的技术手段,本申请实施例首先获取待测样本集对应的
目标光谱数据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待
测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判
别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分
程度的白酒样本集对应的光谱数据进行训练得到,实现了光谱区分程度白酒样本集的光谱
数据建立样本种类判别模型,提升了模型的稳定性与准确程度,进一步地,设计包含多层级
样本种类判别模型的树状种类判别结构,从而通过树状种类判别结构将样本逐级归类,有
效提高复杂白酒品种判别的效率以及准确性。
[0030] 进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,在所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐
级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层
级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本
集对应的光谱数据进行训练得到的步骤之前,所述目标类别判定方法还包括:
[0031] 步骤A10,采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本;
[0032] 在本实施例中,需要说明的是,所述光谱数据包括紫外‑可见光光谱数据、X射线光谱数据、红外光谱数据以及拉曼光谱数据等,在本申请中,优选地,选取拉曼光谱数据,进而
所述拉曼光谱数据的采集可通过激光显微共聚焦拉曼光谱仪进行采集。
[0033] 采集不同种类白酒样本集对应的光谱数据,其中,所述光谱数据包括各训练样本和各测试样本,具体地,分别采集不同种类的白酒样本,并将每一种类白酒样本划分为预设
数量的训练样本和测试样本,并且分别将每一种白酒的训练样本和测试样本分别进行划
分,进一步地,确定光谱采集区间,以基于所述光谱采集区间,按照相同的激光参数分别对
划分后的每一种类白酒对应的训练样本和测试样本进行不同次数的激光扫描,并根据训练
样本和测试样本对应的多次扫描结果,按照预设选取规则确定训练样本和测试样本对应的
光谱数据。
[0034] 其中,所述采集不同种类白酒样本集的光谱数据的步骤包括:
[0035] 步骤A11,获取不同种类白酒样本集;
[0036] 在本实施例中,具体地,分别采集同品牌不同种类的白酒样本集,并将每一类白酒样本划分为预设数量的训练样本和预设数量的测试样本,例如,每种白酒样本选择3个批
次,每个批次10瓶,从每瓶白酒中采集3个样本,共90个样本作为训练样本,每种白酒选择另
外1个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共30个样本作为测试样本。
[0037] 步骤A12,分别将不同种类的白酒样本集进行划分,获得不同种类白酒的划分样本集;
[0038] 在本实施例中,具体地,将每一类白酒样本对应的训练样本和测试样本进行划分,获得不同种类白酒的划分样本集,例如,分别将90个训练样本和30个测试样本平均分为三
部分。
[0039] 步骤A13,基于预设光谱采集区间,通过预设光谱采集参数分别对各所述划分样本集进行光谱采集,获得所述不同种类白酒样本集对应的光谱数据。
[0040] 在本实施例中,需要说明的是,所述预设光谱采集区间为光谱谱峰聚集的区间,在本申请中,选择一个尽量窄的范围进行光谱采集,可以大幅度节约实验成本、缩短数据集建
立时间,预设光谱采集参数包括红外光参数、激光参数等,在本申请中,优选地,利用激光进
行采集光谱,所述预设光谱采集参数包括分辨率、激光波长、功率以及积分时间,例如,所述
‑1
分辨率可设为1 cm 、激光波长为532nm、功率为40 mW、积分时间4s。
[0041] 具体地,首先基于光谱谱峰聚集的区间,确定光谱采集对应的预设光谱采集区间,进而运用相同的激光参数分别对不同种类白酒的划分样本集中的各划分样本进行不同次
数的激光扫描,获得各划分样本对应的多个扫描结果,进而按照预设选取方法对每一所述
划分样本的多个扫描结果,获得每一所述划分样本对应的光谱,参考图4,图4为本申请中对
白酒样本进行光谱采集的流程示意图,分别将90个训练样本和30个测试样本平均分为三部
分,将三个部分的训练样本分别进行3次、5次、7次扫描以及将三个部分的测试样本分别进
行3次、5次、7次扫描,每一样本多次扫描后的结果取平均值作为该样本光谱采集的结果,每
种白酒样品采集90个光谱数据与30个光谱数据,通过多个扫描次数的选取,使得光谱数据
在信号强度上的离散化,提高建模的稳定性,此外,需要说明的是,使用单一的扫描次数进
行拉曼光谱数据收集,虽然采集的同种样品的拉曼光谱强度一致性较高,但可能导致区分
模型过拟合,对区分模型使用时的鲁棒性有负面影响。
[0042] 步骤A20,基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型;
[0043] 在本实施例中,具体地,基于各所述训练样本对应的光谱数据与各所述测试样本对应的光谱数据,将每一所述光谱数据按照预先设定的窗口宽度以及片段步长,从所述光
谱数据的任意一端开始,依次选取多个光谱片段数据,直至光谱数据的另一端结束,从而获
得多个不同位移区间的光谱片段数据,进而将各所述光谱片段数据对应的信号强度数据分
别进行归一化预处理,获得各目标片段数据,进而基于各所述目标片段数据,将具有相同位
移区间的各目标片段数据,通过主成分分析方法分别在各目标片段数据中提取预设数量的
主成分数据,进而结合监督模式识别方法分别构建树状种类判别结构中第一层级样本种类
判别模型,其中,所述监督模式识别方法支持向量机(AVM),决策树(deciAion treeA),K‑最
邻近(K‑NN)等方法,所述第一层级样本种类判别模型对应的数量与在每一所述光谱数据提
取的光谱片段数据的片段数量相同。
[0044] 步骤A30,基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本分别对应的各预测结果;
[0045] 在本实施例中,基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本对应的各预测结果,具体地,对于每一所述测试样本均执行以
下步骤:
[0046] 基于所述第一层级样本种类判别模型,对所述测试样本进行种类预测,进而获得所述测试样本对应的各预测结果,例如,假设有41个样本种类判别模型,41个样本种类判别
模型多所述测试样本进行预测,进而获得该测试样本对应的41个预测结果。
[0047] 步骤A40,基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息;
[0048] 在本实施例中,需要说明的是,所述判别精确信息包括白酒样本对应的精确率、错误率、召回率等信息。
[0049] 具体地,对于每一所述测试样本对应的各预测结果均执行以下步骤:
[0050] 根据所述测试样本对应的各预测结果,选取数量最多的预测结果作为所述测试样本对应的判别结果,进而获得全部测试样本对应的判别结果,进而基于各所述测试样本对
应的判别结果,按照预设计算方法计算每一种类白酒样本对应的判别精确信息。
[0051] 其中,在所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤之后,所述目标类别
判定方法还包括:
[0052] 步骤C10,若所述不同种类白酒样本集对应的判别精确信息满足预设预测阈值条件,则将各所述测试样本的判别结果作为各自对应的目标种类判别结果。
[0053] 在本实施例中,需要说明的是,若该种类白酒样本集对应的判别精确信息满足预设预测阈值,则证明该种类白酒样本归为已判别种类,例如,将精确率达到100%,且召回率
至少达到95%的种类归为已判别种类。
[0054] 其中,所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤包括:
[0055] 步骤A41,基于每一所述测试样本对应的各预测结果,采取多数预测结果规则确定每一所述测试样本的判别结果;
[0056] 在本实施例中,需要说明的是,所述多数预测结果规则为在每一预测样本中选取相同预测结果数量最多的规则。
[0057] 对于每一所述测试样本对应的各预测结果均执行以下步骤:基于所述测试样本对应的各预测结果,选取数量最多的预测结果作为所述测试样本的判别结果,例如,某一测试
样本对应的41个预测结果,其中有40个预测结果为A种类白酒,1个预测结果为B种类白酒,
进而将40个对应的预测结果作为所述测试样本的判别结果。
[0058] 步骤A42,基于每一所述测试样本的判别结果,按照预设判别计算方法分别计算不同种类白酒样本集对应的判别精确信息。
[0059] 在本实施例中,需要说明的是,所述判别精确信息包括精确率和召回率。
[0060] 具体地,对于每一种类白酒均执行以下步骤:
[0061] 基于每一所述测试样本的判别结果,统计该种类白酒对应测试样本的判别结果为该种类白酒的样本数量,并统计其他种类白酒的测试样本对应的判别结果为该种类白酒的
样本数量,以及统计该种类白酒对应测试样本的判别结果为其他种类白酒的样本数量,精
确率与召回率的计算方法如下:
[0062]
[0063] 其中,P为精确率,R为召回率,TP代表正确预测为本种类白酒的样本数量,FP代表错误预测为本种类白酒的样本数量,FN代表错误预测为其他种类白酒的样本数量。
[0064] 例如,A、B、C类白酒分别采集30个测试样本,假设A类白酒的30个测试样本中有30个样本对应的判别结果为A类,B类白酒的30个测试样本中有20个样本对应的判别结果为B
类,有10个样本为A类,因此,A类的精确率为100%,以及召回率为100%,而B类的精确率为
100%,以及召回率为66.67%。
[0065] 此外,需要说明的是,不同层级的样本种类判别模型对应的召回率以及精确率可设置不同,例如,第一层级样本种类判别模型的精确率为100%,召回率不小于95%,第二层级
样本种类判别模型的精确率不小于90%,召回率不小于90%。
[0066] 步骤A50,若所述判别精确信息不满足预设预测阈值条件,则获取所述判别精确信息不满足预设预测阈值对应白酒样本的光谱数据,并基于不满足预设预测阈值的各训练样
本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型,循环直至所有种类
白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构。
[0067] 在本实施例中,具体地,若存在判别精确信息不满足预设预测阈值条件,则确定所述判别精确信息不满足预设预测阈值对应种类的白酒样本,进而根据不满足预设预测阈值
对应白酒样本中各测试样本对应的判别结果,将不满足预设预测阈值对应白酒样本进行分
类,获得各易混淆样品集,进而基于获得各易混淆样品集对应的光谱数据,按照预先设定的
窗口宽度以及片段步长对所述光谱数据进行选取各光谱片段数据,通过主成分分析方法分
别在各目标片段数据中提取预设数量的主成分数据,进而结合监督模式识别方法分别构建
树状种类判别结构中第二层级样本种类判别模型,需要说明的是不同层级的样本种类判别
模型的窗口宽度以及片段步长可以相同,也可不同,主成分数据的预设数量可以相同,也可
不同,进而根据第二层级样本种类判别模型,对不满足预设预测阈值对应白酒样本中各测
试样本进行种类预测,以基于种类预测结果,计算不满足预设预测阈值对应白酒样本对应
的判别精确信息,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈
值,获得所述树状种类判别结构,从而实现了通过预先设定的窗口宽度以及片段步长进行
选取各光谱片段数据,以及选取预设数量的主成分数据,并且结合监督识别方法,构建出包
括多层级样本种类判别模型的树状种类判别结构,提高模型种类预测的准确性,并且及时
当白酒样品集的复杂程度提高、同时包含拉曼光谱区分程度不同的品种时,通过树状种类
判别结构,将样本进行逐级归类,实现较大光谱数据区分度样品的种类的高效判别,同时提
高较小光谱区分度样本的种类判别准确程度。
[0068] 进一步地,参照图5,基于本申请中第二实施例,在本申请的另一实施例中,所述基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型
的步骤包括:
[0069] 步骤B10,分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据;
[0070] 在本实施例,具体地,在各所述训练样本以及各所述测试样本对应的光谱数据,按照预先设定的窗口宽度以及片段步长进行选取,获得各光谱片段数据,其中,在一种可实施
方式中,窗口宽度以及片段步长的确定方法,可按照预设的窗口宽度的范围以及片段步长
‑1 ‑1
的范围进行各种组合从而优化参数,例如,尝试900到1200cm 的窗口宽度与1到10cm 片段
步长的各种组合,对光谱数据截取方式进行优化得到,在另一种可实施方式中,也可建立算
法模型来对光谱区间进行迭代优化,从而确定窗口宽度以及片段步长,例如,参照图6,图6
‑1
为本申请进行截取光谱片段数据的结构示意图,在400‑1500 cm 光谱采集区间对应的光谱
‑1 ‑1
数据中,按照窗口宽度为900 cm ,以最小分辨率的5倍(5 cm )为片段步长进行选取光谱
‑1
片段数据,从而获得41个窗口宽度为900 cm 的光谱片段数据。
[0071] 其中,所述分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据的步骤包括:
[0072] 步骤B11,基于预先设定的窗口宽度以及片段步长,分别对各所述训练样本以及各所述测试样本对应的光谱数据进行选取,获得各所述光谱片段数据。
[0073] 在本实施例中,需要说明的是,由于每一光谱数据均按照窗口宽度以及片段步长进行选取,因此,每一光谱片段数据均有其对应的位移区间。
[0074] 步骤B20,将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
[0075] 在本实施例中,需要说明的是,分别对各所述光谱片段数据对应的信号强度数据进行归一化处理,从而消除对拉曼光谱绝对强度的依赖,有效防止建立的模型出现过拟合
的现象、增加模型的鲁棒性,归一化处理具体如下:
[0076]
[0077] 其中,man(x)与min(x)分别为光谱片段数据内拉曼信号强度的最大值与最小值,x为某个位移上的绝对信号强度,x’为在相同位移上归一化后的相对信号强度。
[0078] 步骤B30,通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
[0079] 在本实施例中,具体地,使用主成分分析方法提取出在每一所述目标片段数据上多个主成分数据,得到各所述目标片段数据对应的主成分数据。
[0080] 步骤B40,基于各所述主成分数据,结合监督模式识别方法,构建所述第一层级样本种类判别模型。
[0081] 在本实施例中,具体地,基于具有相同位移区间的各光谱片段数据对应的各所述主成分数据结合支持向量机方法分别构建各所述样本种类判别模型,提升模型的稳定性与
准确程度。
[0082] 进一步地,所述基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型的步骤包括:
[0083] 步骤C10,基于不满足预设预测阈值的各测试样本对应的判别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集;
[0084] 在本实施例中,例如,A种类白酒样本中测试样本的判别结果为B种类白酒样本,则将A种类白酒样本和B种类白酒样本作为一种易混淆样品集。
[0085] 步骤C20,分别在各所述易混淆样品集中提取各光谱片段数据;
[0086] 步骤C30,将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
[0087] 步骤C40,通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
[0088] 步骤C50,基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级样本种类判别模型。
[0089] 在本实施例中,具体地,基于各所述易混淆样品集的各训练样本以及各测试样本,分别按照预先设定的窗口宽度以及片段步长对各所述训练样本以及各所述测试样本对应
的光谱数据进行选取,获得各所述光谱片段数据,进而对各所述光谱片段数据进行归一化
处理,通过主成分分析方法在归一化处理的各光谱片段数据中提取预设数量的主成分数
据,进一步地,基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级
样本种类判别模型,步骤C20至步骤C50的具体实施内容可参照步骤B10至步骤B40中的具体
内容,在此不再赘述。
[0090] 可选地,提起一种可实施例,具体地,使用激光显微共聚焦拉曼光谱仪(Reinshaw inVia)测量同品牌由3类工艺标准的7种30% vol酒精度白酒样本的拉曼光谱,进而从7种同
品牌白酒中,每种白酒选择3个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共90个样
本作为训练样本,每种白酒选择另外1个批次,10瓶,从每瓶白酒中采集3个样本。共30个样
本作为测试样本。
[0091] 选取400‑1500 cm‑1作为光谱采集区间,进行分辨率为1 cm‑1的拉曼光谱采集,激光波长为532nm,功率为40 mW,积分时间4 s,进而将训练样本与测试样品平均分为三部分,
运用相同的激光参数,分别进行3次、5次、7次扫描,多次扫描后取平均值作为一次光谱采集
的结果,每种白酒样品采集90个训练集拉曼光谱与30个测试集拉曼光谱,从训练样本与测
‑1
试样本包括的每个400‑1500cm 区间的拉曼光谱数据中,运用以下经优化的参数进行光谱
‑1 ‑1
片段选取,其中,尝试900到1200cm 的窗口宽度以及1到10cm 片段步长的各种组合,对光
‑1
谱数据进行截取优化参数,例如:按照900 cm 窗口宽度,从拉曼光谱数据的任意一端开始,
‑1
以最小分辨率的5倍(5 cm )为片段步长,依次选取多个拉曼光谱数据片段,到拉曼光谱的
‑1
另一端结束。从每一个原始拉曼光谱中选取41个长度为900 cm 拉曼光谱片段数据,对所得
到的每个拉曼光片段的信号强度数据分别进行独立的归一化预处理,消除对拉曼光谱绝对
强度的依赖,在片段选择与归一化后,基于所有样本有相同的拉曼位移区间的拉曼光谱片
段数据,运用主成分分析方法,以及结合支持向量机方法,将主成分值优化至前4个,分别建
立41个样本种类判别模型,分别对每个测试集样本的种类进行判别,针对每个测试样本,运
用获得的41个种类判别结果进行投票,票数最多的种类作为判别结果,参考表1,表1为同品
牌7种30% vol酒精度白酒的种类判别结果,可以看出对白酒样品集中种类4‑7的测试样本
实现了100%精确率与100%召回率标准的种类判别,而白酒样品集中种类1‑3的样本在该节
点的样品种类判别模型的预测结果中相互混淆。
[0092] 进而若所述白酒样品集中种类1至3均互相混淆,则将白酒样品集中种类1‑3这3个种类归为同一个未判别种类集,基于白酒种类1‑3样本的训练样本与测试样本的400‑1500 
‑1
cm‑1范围的拉曼光谱数据,运用以下经优化的参数进行光谱片段选取:按照1000 cm 窗口
‑1
宽度,从拉曼光谱的任意一端开始,以最小分辨率(1 cm )为片段步长,依次选取多个拉曼
光谱数据片段,到拉曼光谱的另一端结束。从每一个原始拉曼光谱中选取101个长度为1000 
‑1
cm 拉曼光谱片段,对所得到的每个拉曼光片段的强度数据分别进行独立的归一化预处理,
消除对拉曼光谱绝对强度的依赖,在片段选择与归一化后,基于所有样本有相同的拉曼位
移区间的拉曼光谱片段数据,运用主成分分析方法,以及结合支持向量机,将主成分值优化
至前25个,分别建立101个白酒样本种类判别模型,分别对每个测试样本的种类进行判别,
针对每个测试样本,将获得的101个种类判别结果进行选取票数最多的种类作为判别结果,
对白酒样品集中种类1‑3的测试样本实现了精确率(≥90%)与召回率(≥90%)的种类判别。
[0093] 表1 同品牌7种30% vol酒精度白酒的种类判别结果
[0094]
[0095] 以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技
术领域,均同理包括在本申请的专利处理范围内。