基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法转让专利

申请号 : CN202310879515.2

文献号 : CN116642841B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张英华李伟王志敏周晓楠刘丽威胡乃月孙振才马龙飞杜承航李浩然

申请人 : 中国农业大学

摘要 :

本发明光谱数据处理技术领域,具体提供了基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,包括以下步骤:小麦籽粒群体收集与籽粒高光谱原始图像拍摄;高光谱原始图像校正以及图像中小麦单籽粒分割、标记和光谱提取;小麦单籽粒蛋白质含量预测模型的构建和训练;待预测小麦籽粒群体高光谱原始图像拍摄;待预测小麦籽粒群体高光谱原始图像校正与小麦单籽粒分割、标记和光谱提取;待预测小麦籽粒群体单籽粒蛋白质含量预测与品质差异单籽粒筛选。本发明实现小麦群体内单个籽粒蛋白质含量的快速检测和品质差异单籽粒筛选。

权利要求 :

1.基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,包括以下步骤:

S1:收集籽粒群体样品,分别置于高光谱成像采集系统拍摄得到高光谱原始图像,将高光谱原始图像进行预处理得到单籽粒反射率光谱;

S2:测定与籽粒群体样品一一对应的单籽粒蛋白质实际含量;

S3:根据获取籽粒群体样品的单籽粒反射率光谱和测定的单籽粒蛋白质实际含量,通过训练建立单籽粒蛋白质含量预测模型;

S4:将待测样品首先重复步骤S1得到单籽粒的平均光谱,然后输入步骤S3中的单籽粒蛋白质含量预测模型,预测得到待测样品的单籽粒蛋白质预测含量;

S5:根据待测样品的单籽粒蛋白质预测含量的对比对待测样品进行单粒籽筛选;

步骤S5具体包括如下步骤:预测样品的单籽粒蛋白质预测含量对应一图像编号以及籽粒编号,单籽粒蛋白质预测含量表示为Xn,将图像编号、籽粒编号以及单籽粒蛋白质预测含量依次输出到表格中,对单籽粒蛋白质预测含量使用冒泡排序算法按照从大到小进行排序,记录该图像中单籽粒蛋白质预测含量的最大值Xmax和最小值Xmin,并根据如下公式计算该图像中单籽粒蛋白质预测含量的平均值X:X = (X1 + X2 + ……+Xn)/N,得到图像中单籽粒蛋白质预测含量的极值为Xmax‑ Xmin,将图像中单籽粒蛋白质预测含量低于蛋白质含量参考阈值的剔除。

2.根据权利要求1所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,所述步骤S1中的籽粒群体样品的蛋白质含量变异范围为12.5%‑15.7%,收集来自不同年份、不同品种、不同氮肥和水分管理措施下的具有不同蛋白质含量差异的小麦籽粒群体样品。

3.根据权利要求1所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,所述步骤S1的高光谱原始图像的光谱范围为375‑1050nm。

4.根据权利要求1所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,所述步骤S1中的预处理包括采用反射强度和反射率已知的灰度标准板对高光谱原始图像进行校正,校正公式如下:R = I / (Iref/Rref),其中,I表示原始光谱图像的反射强度,Iref表示灰度标准板的反射强度,Rref表示灰度标准板的反射率。

5.根据权利要求1所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,所述步骤S1中的预处理包括采用阈值分割与连通区域法分割提取单籽粒反射率光谱,具体包括如下步骤:将RGB转换为Lab色彩空间,利用Lab色彩空间的L分量或b分量设置阈值分割提取全部籽粒区域,得到全籽粒初始二值图,通过中值模糊和局部平均法去除噪声和毛刺,得到全籽粒处理二值图,采用连通区域分析法将全籽粒处理二值图中的每个籽粒分开并进行标记,利用标记后的单籽粒二值图提取单籽粒反射率光谱。

6.根据权利要求1所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,步骤S2中的单籽粒蛋白质实际含量通过凯氏定氮法测得,具体过程为先测定籽粒中的含氮量,然后乘以换算系数5.7,得到单籽粒蛋白质含量。

7.根据权利要求1所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,其特征在于,单籽粒蛋白质含量预测模型具体过程如下:S31:设定单籽粒蛋白质含量预测模型的第一层采用基线校正、光谱平滑和散射校正的方法对提取的小麦单籽粒光谱数据进行预处理;

S32:设定单籽粒蛋白质含量预测模型的第二层采用偏最小二乘回归算法进行单籽粒光谱与蛋白质含量的关系拟合,随机选取80%的数据组成训练数据集用于建立模型,其余数据组成测试数据集用于验证模型。

8.根据权利要求1‑7中任一项所述的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法在小麦群体内单个籽粒蛋白质品质差异检测和筛选中的应用。

说明书 :

基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法

技术领域

[0001] 本发明涉及高光谱数据处理技术领域,具体涉及基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法。

背景技术

[0002] 小麦是我国重要的粮食作物,其营养价值全面,富含多种蛋白质、矿物质和维生素等。作为人们食物的主要来源之一,小麦不仅为人体提供热量还保障了蛋白质的供应。蛋白质含量的高低决定了小麦营养品质和加工品质,是小麦贸易和品质评价的重要指标。提高籽粒蛋白质含量一直是小麦育种和栽培管理的共同目标,而籽粒蛋白质含量检测则是实现这一目标的必要途径。
[0003] 目前,常规的小麦蛋白质含量测定方法有凯氏定氮法和杜马斯燃烧法。这些方法因其普遍适用性、精确性和重复性,得到广泛认可,是国际和国内蛋白质检测的标准方法。然而上述方法多要求有极强的专业背景和大量的化学试验操作才能达到检测效果,完成检测的同时消耗了大量的时间、人力和物力。而且需要对样品进行破坏,即使测定出蛋白质含量高的籽粒也无法保留样品。因此,传统籽粒蛋白质检测方法在实际应用中缺乏可推广性。
[0004] 近红外光谱分析技术作为一项快速无损检测技术在食品和谷物检测中发挥了重要作用。该技术利用样品的光学特性进行化学成分定量分析,同时具有快速和环保的优点,还节约成本,降低环境污染,减少劳动力和时间的消耗。目前大部分的近红外谷物检测都是针对大量籽粒样品,而且每次仅能采集一个样本,检测效率受到很大限制。
[0005] 近年来,随着技术的发展,基于光谱成像技术的高光谱相机结合了光谱检测分析与成像科学的优势,采集的高光谱图像既包含样品的图像信息,又包含每个像素点内可见光和近红外两个波段的光谱信息。成像光谱技术在玉米籽粒黄曲霉毒素检测、小麦籽粒赤霉病识别方面已经建立了有效的模型,并初步实现了检测效果。
[0006] 在小麦品质育种中常采用单粒传法选择优良的个体。在杂交后代分离群体中准确无损的鉴定单籽粒的蛋白质含量成为快速选育优良蛋白质品质品种的关键。由于长期缺乏有效的手段,育种家只能根据经验和其他感官手段做出判断。因此小麦蛋白质品质育种效率的提高亟需一个快速无损的单籽粒蛋白质检测和筛选方法。因此,如何利用成像高光谱技术,实现基于成像光谱的小麦群体内单个籽粒蛋白质品质差异检测和筛选已经成为亟需解决的技术问题。

发明内容

[0007] 有鉴于此,本发明要解决的问题是提供基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法。
[0008] 为解决上述技术问题,本发明采用的技术方案是:基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法,包括以下步骤:
[0009] S1:收集籽粒群体样品,分别置于高光谱成像采集系统拍摄得到高光谱原始图像,将高光谱原始图像进行预处理得到单籽粒反射率光谱;
[0010] S2:测定与籽粒群体样品一一对应的单籽粒蛋白质实际含量;
[0011] S3:根据获取籽粒群体样品的单籽粒反射率光谱和测定的单籽粒蛋白质实际含量,通过训练建立单籽粒蛋白质含量预测模型;
[0012] S4:将待测样品首先重复步骤S1得到单籽粒的平均光谱,然后输入步骤S3中的单籽粒蛋白质含量预测模型,预测得到待测样品的单籽粒蛋白质预测含量;
[0013] S5:根据待测样品单籽粒蛋白质预测含量的对比对待测样品进行单籽粒筛选。
[0014] 在本发明中,优选地,所述步骤S1中的籽粒群体样品的蛋白质含量变异范围为12.5%‑15.7%,收集来自不同年份、不同品种、不同氮肥和水分管理措施下的具有不同蛋白质含量的小麦籽粒群体样品。
[0015] 在本发明中,优选地,所述步骤S1的高光谱原始图像的光谱范围为375‑1050nm。
[0016] 在本发明中,优选地,所述步骤S1中的预处理包括采用反射强度和反射率已知的灰度标准板对高光谱原始图像进行校正,校正公式如下:R = I / (Iref/Rref),其中,I表示原始光谱图像的反射强度,Iref表示灰度标准板的反射强度,Rref表示灰度标准板的反射率。
[0017] 在本发明中,优选地,所述步骤S1中的预处理包括采用阈值分割与连通区域法分割提取单籽粒反射率光谱,具体包括如下步骤:将RGB转换为Lab色彩空间,利用Lab色彩空间的L分量或b分量设置阈值分割提取全部籽粒区域,得到全籽粒初始二值图,通过中值模糊和局部平均法去除噪声和毛刺,得到全籽粒处理二值图,采用连通区域分析法将全籽粒处理二值图中的每个籽粒分开并进行标记,利用标记后的单籽粒二值图提取单籽粒反射率光谱。
[0018] 在本发明中,优选地,步骤S2中的单籽粒蛋白质实际含量通过凯氏定氮法测得,具体过程为先测定籽粒中的含氮量,然后乘以换算系数5.7,得到单籽粒蛋白质含量。
[0019] 在本发明中,优选地,单籽粒蛋白质含量预测模型具体过程如下:
[0020] S31:设定单籽粒蛋白质含量预测模型的第一层采用基线校正、光谱平滑和散射校正的方法对提取的小麦单籽粒光谱数据进行预处理;
[0021] S32:设定单籽粒蛋白质含量预测模型的第二层采用偏最小二乘回归算法进行单籽粒光谱与蛋白质含量的关系拟合,随机选取80%的数据组成训练数据集用于建立模型,其余数据组成测试数据集用于验证模型。
[0022] 在本发明中,优选地,步骤S5具体包括如下步骤:预测样品的单籽粒蛋白质预测含量对应一图像编号以及籽粒编号,单籽粒蛋白质预测含量表示为Xn,将图像编号、籽粒编号以及单籽粒蛋白质预测含量依次输出到表格中,对单籽粒蛋白质预测含量使用冒泡排序算法按照从大到小进行排序,记录该图像中单籽粒蛋白质预测含量的最大值Xmax和最小值Xmin,并根据如下公式计算该图像中单籽粒蛋白质预测含量的平均值X:
[0023] X = (X1 + X2 + ……+Xn)/N,得到图像中单籽粒蛋白质预测含量的极值为Xmax‑ Xmin,将图像中单籽粒蛋白质预测含量低于蛋白质含量参考阈值的剔除。
[0024] 本发明具有的优点和积极效果是:本发明通过图像分割对高光谱图像中的小麦单籽粒进行分割、标记和提取光谱,采取光谱平滑和散射校正的预处理方法提升光谱质量,建立小麦单个籽粒的有效预测模型,实现小麦群体内单个籽粒蛋白质含量的快速检测和品质差异籽粒的快速筛选。

附图说明

[0025] 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0026] 图1是本发明的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法的整体流程示意图;
[0027] 图2是本发明的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法的单籽粒蛋白质含量预测模型训练的流程示意图;
[0028] 图3是本发明的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法的高光谱原始图像预处理和单籽粒光谱提取流程示意图;
[0029] 图4是本发明的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法的不同待测小麦群体籽粒蛋白质含量预测结果示意图;
[0030] 图5是本发明的基于成像光谱的小麦单籽粒蛋白质含量检测与筛选方法的不同待测小麦群体间和内部蛋白质含量对比示意图。

具体实施方式

[0031] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0032] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。下面通过具体实施例对本发明进行说明,但本发明并不局限于此。
[0033] 下述实施例中所使用的试验方法如无特殊说明,均为常规方法;下述实施例中所用的试剂、材料等,如无特殊说明,均可从商业途径得到。
[0034] 实施例一
[0035] 为了清楚说明本发明的技术方案的具体实施过程,本实施例以小麦群体为例,以获得单籽粒蛋白质品质差异检测以及筛选过程,具体包括以下步骤:
[0036] S1:收集籽粒群体样品,分别置于高光谱成像采集系统拍摄得到高光谱原始图像,将高光谱原始图像进行预处理得到单籽粒反射率光谱;籽粒群体样品的蛋白质含量变异范围为12.5%‑15.7%,收集来自不同年份、不同品种、不同氮肥和水分管理措施下的具有不同蛋白质含量的小麦籽粒群体样品。
[0037] 小麦籽粒样本采集自2018‑2019年中国农业大学吴桥实验站,品种名称和试验水分处理如表1所示。6月15日,所有品种收获后将籽粒自然晾干。对上述30组品种样品进行群体籽粒蛋白质含量测定,结果如表1。并从30组品种样品中分别挑选10个籽粒,共计300粒。将30组小麦籽粒每6组一张图像进行成像光谱采集。
[0038] 表1光谱成像试验小麦样品清单
[0039]
[0040] 注:W0为播种前浇足底墒水,播种后不浇水;W1为播种前浇足底墒水,开花期浇一次水(75 mm)
[0041] 高光谱原始图像采集是利用高光谱(375‑1050nm)成像系统采集小麦籽粒的高光谱原始图像,该图像中包含低蛋白质品质、中蛋白质品质和高蛋白质品质籽粒群体内部的所有单个籽粒图像;
[0042] 本发明的高光谱成像系统包括高光谱成像仪(SOC710‑VP)、一个暗箱、4个60W的卤素灯组成的照明系统、放置样本的升降台和笔记本电脑。SOC710‑VP是一台便携式可见光‑近红外高光谱成像仪,覆盖的光谱范围从375nm到1050nm,共128个波段。
[0043] 在本实施例中,进一步地,将高光谱原始图像进行预处理,具体是采用灰度标准板对原始高光谱图像进行反射率校正,采用阈值分割法获取光谱图像中每个籽粒的平均反射率光谱。这一步骤为的是消除由于暗电流和不均匀的光照强度对高光谱图像造成的噪声影响,对高光谱原始图像进行校正处理,使用反射强度和反射率已知的灰度标准板进行校正,校正公式如下:R = I / (Iref/Rref),其中:I为原始光谱图像的反射强度,Iref为灰度标准板的反射强度,Rref为灰度标准板的反射率。
[0044] 然后将高光谱图像从RGB颜色空间转换到Lab空间,通过Lab空间籽粒和背景颜色值的差异进行图像分割处理。
[0045] Lab色彩空间是一种基于生理特征的颜色模型,由亮度(L)、色彩a(深绿色‑灰色‑亮粉红色)、色彩b(亮蓝色‑灰色‑黄色)组成。Lab不依赖光线和颜料,可以消除拍照过程中光源照射不均匀对图像的影响,适合图像分割与处理。
[0046] 具体方法如图3所示:使用python软件包plantcv中的rgb2gray_lab函数将RGB转换为Lab色彩空间,利用Lab色彩空间的L分量(L阈值为110)或b分量设置阈值(b阈值为138)分割提取小麦籽粒区域,得到二值图。通过中值模糊和局部平均法去除噪声和毛刺,得到小麦籽粒二值图。
[0047] 在本实施例中,进一步地,获得小麦籽粒二值图后,采用连通区域分析法将小麦籽粒二值图中的每一个独立的籽粒分开,并进行标记;利用标记后的小麦籽粒二值图,使用python中的图像分析工具opencv提取单个小麦籽粒的光谱数据。接下来对单籽粒蛋白质含量进行测定,具体而言利用凯氏定氮法测定单个籽粒的含氮量,并通过乘以换算系数5.7,得到单籽粒蛋白质含量。
[0048] 在本实施例中,进一步地,构建小麦单籽粒蛋白质含量预测模型的过程是利用高光谱图像获取的单籽粒光谱和凯氏定氮法测定的单籽粒蛋白质含量,建立基于偏最小二乘回归的小麦单籽粒蛋白质含量预测模型。具体步骤如下: S31:设定小麦单籽粒蛋白质含量预测模型的第一层采用基线校正、光谱平滑和散射校正的方法对提取的小麦单籽粒光谱数据进行预处理;基线校正方法是为了扣除仪器背景或漂移对信号的影响,采用一阶导和二阶导;
[0049] 光谱平滑方法是为了消除光谱信号中的随机噪声,提高样本信噪比,采用Savitaky‑Golay (SG)卷积平滑方法。实际光谱处理时将基线校正和光谱平滑叠加使用,使用SG一阶导和SG二阶导两种光谱预处理方法;散射校正法可以用来消除由于颗粒分布不均匀产生的散射对光谱的影响。散射校正的方法采用Multiplicative Scatter Correction (MSC) 多元散射校正和Standard Normal Variate (SNV) 标准正态变量;
[0050] S32:设定小麦单籽粒蛋白质含量预测模型的第二层采用偏最小二乘回归算法进行单籽粒光谱与蛋白质含量的关系拟合。
[0051] 随机选取80%的数据组成训练数据集用于建立模型,剩余20%的数据组成测试数据集用于验证模型,使用预测值和真实值线性回归的决定系数R2和均方根误差RMSE来评价模型的准确度和精度。
[0052] 原始光谱和不同预处理光谱得到的模型结果如表2:
[0053] 表2 原始光谱和预处理光谱建立的籽粒粗蛋白质含量预测模型相关统计参数[0054] SNV, 标准正态变量;MSC, 多元散射校正;R2,表示预测准确率;RMSE,均方根误差。
[0055] 在本实施例中,进一步地,S4:将待测样品首先重复步骤S1得到单籽粒的平均光谱,首先获取待预测的小麦籽粒高光谱原始图像,选取与建模样品不同的10个小麦品种,每个品种随机抽取120‑200个小麦籽粒进行光谱原始图像采集;然后对高光谱原始图像进行校正,将原始光谱辐射图像转换为光谱反射率图像,采用阈值分割的方式获取光谱图像中每个籽粒的平均光谱;将预处理后得到的单个籽粒光谱数据输入单籽粒蛋白质含量预测模型,预测出群体内部所有单个籽粒的蛋白质含量。
[0056] 在本实施例中,进一步地,S5:根据待测样品的单籽粒蛋白质预测含量的对比对待测样品进行单粒籽筛选小麦单籽粒蛋白质含量预测与籽粒筛选:以图像分割过程得到的单籽粒二值图和原始高光谱图像为输入,并记录该图像编号。根据二值图统计独立区域个数推算出籽粒数量N,将二值图对应的籽粒赋予从1到N的编号。接下来依次从编号为1到N的籽粒区域读取对应高光谱图像中的原始光谱,并将该籽粒区域内的原始光谱取平均作为该籽粒的光谱。然后采用SG平滑和SNV正交向量变换对该籽粒的原始光谱进行预处理。该籽粒光谱经预处理后输入到单籽粒蛋白质含量预测模型,预测出当前图像编号下该籽粒的蛋白质含量Xn(n取值最小为1,最大为N)。将图像编号、图像中的籽粒编号以及籽粒蛋白质含量依次输出到表格中(图4d)。单张图像的所有籽粒预测结束后,对籽粒蛋白质含量X1、X2……Xn使用冒泡排序算法按照从大到小进行排序,记录该图像中蛋白质含量的最大值Xmax和最小值Xmin,并根据如下公式计算该图像中籽粒蛋白质含量的平均值X:X = (X1+ X2+ ……+Xn)/N,该图像中单籽粒蛋白质含量的极值为Xmax‑ Xmin。
[0057] 以15%为蛋白质含量参考阈值,通过图像分析技术将该图像中蛋白质含量高于15%的籽粒保留,蛋白质含量低于15%的籽粒剔除,可得到高蛋白质含量籽粒在图像中的位置并实现筛选高蛋白质含量籽粒的目标。同理将图像中蛋白质含量低于11.5%的籽粒保留,蛋白质含量高于11.5%的籽粒剔除,可得到低蛋白质含量籽粒在图像中的位置,从而实现筛选低蛋白质含量籽粒的目标。筛选过程如图4c(注意:高蛋白和低蛋白籽粒筛选标准均高于国家最高标准,高蛋白质含量国家一级标准为>15%;低蛋白质含量国家标准为<11.5%)。
[0058] 重复上述过程,可对多张高光谱图像代表的小麦籽粒群体进行单籽粒蛋白质含量预测与统计分析,同时实现高蛋白质含量籽粒和低蛋白质含量籽粒的筛选。
[0059] 在本实施例中,进一步地,根据预测的单籽粒蛋白质含量,分别统计不同籽粒群体蛋白质含量的均值、最大值和最小值,比较群体内和群体间的差异。结果如图4。分析群体籽粒蛋白预测含量的均值与凯氏定氮法实测的群体蛋白质含量,二者相关系数为0.9。
[0060] 表3 待测小麦籽粒群体蛋白质含量(实测值+单籽粒真实值)
[0061]
[0062] 以上对本发明的实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明范围所作的均等变化与改进等,均应仍归属于本专利涵盖范围之内。