牛奶中αs1-酪蛋白的中红外快速批量检测方法转让专利

申请号 : CN202111283553.9

文献号 : CN113916824B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张淑君肖仕杰王巧华陈冬梅李春芳倪俊卿马亚宾阮健熊琪陈明新刘锐郝兴杰胡修忠万平民苏俊东

申请人 : 华中农业大学

摘要 :

本发明属于奶牛性能测定和牛奶品质检测领域,公开了牛奶中αs1‑酪蛋白的中红外快速批量检测方法。本发明在原有的傅里叶变换中红外光谱仪获得的数据的基础上,进行去除噪声多、有效信息少的波段,并且进行手动降维,通过SG卷积一阶导数对光谱数据进行预处理、竞争性自适应重加权法提取中红外光谱特征变量、支持向量机回归算法利用训练集数据构建回归模型,最终获得了一种牛奶中αs1‑酪蛋白的中红外快速批量检测方法,该方法具有鉴别速度快、精度高、成本低、操作简单、批量检测、实用性强等的特点,适合大规模推广。

权利要求 :

1.牛奶中αs1‑酪蛋白的中红外快速批量检测方法,包括下述步骤:

1)将待测牛奶在40 45℃水浴锅中水浴15‑20min,利用傅里叶变换中红外光谱仪获得~‑1 ‑1

牛奶样品的透光率;去除噪声多、有效信息少的波段后,选择3005.382cm ‑925.92cm 建立‑1模型,每隔对应波数为3.858cm 的一个波点,取一个透射率,进行手动降维,手动降维后的光谱区域用于后续计算;

2)采用蒙特卡洛交叉验证算法剔除异常样本,采用spxy算法将样本划分为训练集和验证集;

3)采用SG卷积一阶导数对光谱数据进行预处理,竞争性自适应重加权法提取中红外光谱特征变量,支持向量机回归算法利用训练集数据构建回归模型,对测试集中的样本进行预测。

2.根据权利要求1所述的方法,其特征在于:手动降维后的光谱区域为925.92~‑1

3001.524cm 的光谱区域。

3.根据权利要求1所述的方法,其特征在于:所述傅里叶变换中红外光谱仪为FOSS公司TM的MilkoScan 7RM乳成分检测仪。

说明书 :

牛奶中αs1‑酪蛋白的中红外快速批量检测方法

技术领域

[0001] 本发明属于奶牛性能测定和牛奶品质检测领域,具体涉及牛奶中αs1‑酪蛋白的中红外快速批量检测方法。

背景技术

[0002] 牛奶中富含乳蛋白,酶消化后的牛奶蛋白是生物活性肽的主要来源,这些肽能积极影响身体功能,支持双歧杆菌物种的生长,抑制空肠黏液中细菌和病毒的黏附并充当抗炎和免疫调节因子(Jiehui Z,Liuliu M,Haihong X,et al.Immunomodulating effects of casein‑ derived peptides QEPVL and QEPV on lymphocytes in vitro and in vivo[J].Food&function, 2014,5(9):2061‑2069.Ferrario,C.,Duranti,S.,Milani,C.,Mancabelli,L.,Lugli,G.A.,Turroni, F.,Mangifesta,M.,Viappiani,A.,Ossiprandi,M.C.,van Sinderen,D.,and Ventura,M.Exploring amino acid auxotrophy in Bifidobacterium bifidum PRL2010.Front.Microbiol.2015; 610.3389/fmicb.2015.01331.(26635786).Wróblewska B, J,Kroplewski B,et al.The effects of whey and soy proteins on growth performance,gastrointestinal digestion,and selected physiological responses in rats[J].Food&function,2018,
9(3):1500‑1509.)。酪蛋白(CN) 含量占乳蛋白总含量的绝大部分,达到了80%。有研究表明,酪蛋白是牛奶中的主要致敏原组分(蒋红玲,向军俭,王宏,邓宁,刘婉莹,杨红宇,凌钦婕.牛奶中过敏原组分的分离纯化及主要过敏原的鉴定[J].暨南大学学报(医学版),2008(04):341‑346.),而αs1‑酪蛋白是酪蛋白中最主要的一个过敏原,占牛奶总蛋白含量的30%以上(张咪,高璐,印伯星,苏万业,杨振泉,顾瑞霞.基于αs‑酪蛋白特异性的牛乳总蛋白质ELISA定量检测方法的建立[J].江苏农业学报,2015,31(01):87‑92.)。因此,建立牛奶中αs1‑酪蛋白的快速测定方法很有必要。
[0003] 高效液相色谱是鉴定和定量乳蛋白最常用的技术之一,主要是因为它的灵敏度、重复性和再现性;然而,这种分析方法费时、昂贵,并且需要熟练的操作人员。因此不适于在生产实践中广泛使用。
[0004] 中红外光谱(MIRS)是物质的在中红外区的吸收光谱,一般将2.5‑25μm的红外波段划为中红外区。中红外光谱主要是由于分子振动能级的跃迁和转动能级跃迁而产生的。中红外光谱被认为是预测牛奶表型(包括总蛋白质和酪蛋白含量)的可靠、快速和经济的工‑1具。2010年,Marchi等通过反相高效液相色谱对蛋白质组分进行定量,并在 4000‑900cm 的光谱范围内记录MIR数据,去除3470‑3040cm‑1和1700‑ 1600cm‑1两段噪声区域后,通过偏最小二乘回归模型成功预测了αS1‑酪蛋白含量,交叉验证的均方根误差为1.07g/L(Marchi M D,Bonfatti V,Cecchinato A,et al. Prediction of protein composition of individual cow milk using mid‑infrared spectroscopy[J]. Italian Journal of Animal Science,2010,8(2s):399‑401.)。Niero等同样使用反相高效液相色谱法测量了牛奶中αS1‑酪蛋白的参考值,获得光谱后使用马氏距离去除异常值,去除水的吸收(5011‑‑1 ‑1
3052cm 和1717‑1601cm ),与使用标准偏最小二乘回归开发的回归模型相比,UVE过程减少了通过偏最小二乘回归分析的波数变量的数量,并将预测精度提高了 6.0至66.7%。(G,Niero,M,et al.Short communication:Selecting the most informative mid‑ infrared spectra wavenumbers to improve the accuracy of prediction models for detailed milk protein content[J].Journal of Dairy Science,2016,99(3):1853‑
1858.)。此二项研究均未对光谱进行SG卷积平滑、标准正态变量变换(SNV)、多元散射校正(MCS)等预处理,可能存在干扰信息;只使用了PLSR模型,模型单一;模型精度较低。
[0005] 本发明使用了多种预处理方法和特征提取算法,并对比了线性PLSR模型和非线性 SVR模型的精度;此外,手动降维明显提高了模型的精度,预测效果优于此两项研究。

发明内容

[0006] 本发明的目的是为了克服酪蛋白检测中测定耗时长、成本高、操作复杂等问题,提供一种鉴别速度快、精度高、成本低、操作简单、批量检测、实用性强的牛奶中酪蛋白含量的中红外检测方法。
[0007] 为了达到上述目的,本发明采取以下技术措施:
[0008] 牛奶中αs1‑酪蛋白的中红外快速批量检测方法,包括下述步骤:
[0009] 1)将待测牛奶在40~45℃水浴锅中水浴15‑20min,利用傅里叶变换中红外光谱仪获得牛奶样品的透光率;去除噪声多、有效信息少的波段后,每隔一个波点,对应波数为‑13.858cm 取一个透射率进行手动降维,光谱区域用于后续计算;
[0010] 2)采用蒙特卡洛交叉验证算法剔除异常样本,采用spxy算法将样本划分为训练集和验证集;
[0011] 3)采用SG卷积一阶导数对光谱数据进行预处理、竞争性自适应重加权法提取中红外光谱特征变量、支持向量机回归算法利用训练集数据构建回归模型,对测试集中的样本‑1进行预测。以上所述的方法中,优选的,手动降维后的光谱区域为925.92~3001.524cm 的TM
光谱区域所述傅里叶变换中红外光谱仪为FOSS公司的MilkoScan 7RM乳成分检测仪。
[0012] 红外光谱数据预处理、模型构建及验证等均通过matlab2016b实现。
[0013] 与现有技术相比,本发明优点在于:
[0014] (1)提取了代表αs1‑酪蛋白的特征变量组合,利用特征变量组合建立模型,简化了模型,提高了模型精度。
[0015] (2)实现了牛奶中αs1‑酪蛋白的快速检测。具有鉴别速度快、精度高、成本低、操作简单、批量检测、实用性强等的特点。

附图说明

[0016] 图1为实施例1未经处理的牛奶样品中红外光谱图。
[0017] 图2为实施例1中的消噪处理、手动降维和剔除异常值后的牛奶样品中红外光谱图。
[0018] 图3为实施例1的采用竞争性自适应重加权法CARS提取特征变量的过程图;
[0019] 本申请设定蒙特卡罗采样为50次,采用5折交叉验证法计算。由b可知,RMSECV 值随着取样运行次数增加先减小后增大:当RMSECV值逐渐减小时,表明光谱数据中部分无用的信息被剔除;当RMSECV值逐渐增大时,表明光谱数据中有用的重要信息被剔除。因此,取采样50次所建立的PLSR模型中所对应的最小RMSECV作为最优结果,由 b可知,当RMSECV值达到最小值时,各变量的回归系数位于c中竖直线位置,采样运行 30次。

具体实施方式

[0020] 本发明所述技术方案,如未特别说明,均为本领域的常规方案;所述试剂或材料,如未特别说明,均来源于商业渠道。
[0021] 其中SG卷积平滑、标准正态变量变换(SNV)、多元散射校正(MCS)、SG卷积一阶导数、SG卷积二阶导数、归一化(normaliz)、移动窗口平滑(nirmaf)、标准化(auto)、一阶差分(diff1)、二阶差分(diff2)等参数调整,为本领域技术人员根据研究对象进行的常规调整,建模前需要对光谱进行预处理(张津源,朱海涛.光谱预处理方法综述[J].西部皮革,2017,39(16):14.)。在预处理中,以SG卷积平滑预处理为例,会有参数的调整,通常根据自己的研究对象,在一定的范围内改变平滑窗口宽度,这是本领域的常规操作。如付丹丹等人(.付丹丹,王巧华.鸡蛋新鲜度、pH值及黏度的高光谱检测模型[J].食品科学,2016,37(22):173‑
179.)在鸡蛋新鲜度的研究中,经过反复尝试,确定采用窗口宽度为8的 SG法对光谱进行平滑。鲁亮等人(鲁亮,李晶晶,周昭露,田淑华,黄生权,黄延盛.基于近红外光谱技术快速测定口服液中多糖的研究[J].食品工业科技,2017,38(18):247‑251+257.)在口服液中多糖的研究中,选择9平滑窗口宽度。本申请则对比了7、9、11、13、15的平滑窗口宽度,最终选择9作为最佳平滑窗口宽度(如下表所示)。
[0022]
[0023]
[0024] 其余的预处理和参数确定均为本领域的常规方案,不在实施例中赘述和展示。
[0025] 无信息变量消除法(UVE)、竞争性自适应重加权法(CARS)、连续投影法(SPA)3 种特征提取算法提取中红外光谱特征变量。在CARS算法中会对采样次数进行设置,UVE 算法中对阈值进行设置,SPA算法一般采用默认设置(苗雪雪,苗莹,龚浩如,陶曙华,陈英姿, 陈祖武,王洁敏.特征波长优选结合近红外技术检测大米中的含水量[J].食品科技,2019,44(10):335‑341.;郭文川,朱德宽,张乾,杜荣宇.基于近红外光谱的掺伪油茶籽油检测 [J].农业机械学报,2020,51(09):350‑357.;黄平捷,李宇涵,俞巧君,王柯,尹航,侯迪波,张光新. 基于SPA和多分类)。
[0026] 在本发明实施例中,中红外光谱数据预处理、模型构建及验证等均通过matlab2016实现。
[0027] 实施例1:
[0028] 红外光谱检测牛奶中αs1‑酪蛋白含量的方法的建立:
[0029] 选取4个不同地区6个不同牛场的牛奶样本,并编号。将样品倒入直径3.5cm,高9cm TM的圆柱形样品管中,在42℃水浴锅中水浴15‑20min,使用FOSS公司的MilkoScan 7RM 乳成分检测仪,将固体光纤探头伸到液体中,对样品进行扫描,通过计算机获得牛奶样品的透光‑1 ‑1 ‑1
率(图1)。由于4089.48cm ‑2758.47cm ,3005‑3680cm 波数范围内光谱信息波动较大,含‑1
有大量的噪声数据,若用于后续分析和建模会导致模型泛化能力变差;2758.47cm ‑ ‑1 ‑1 ‑1
1716.81cm ,3680cm ‑4000cm 波数范围内有效信息较少,对模型构建的贡献率低;
‑1 ‑1
4000cm 以后的波段不属于中红外范围,不用于建模。因此最终选择3005.382cm ‑‑1
925.92cm 建立模型;PLSR和SVR模型的相关系数RP分别为0.7512和0.6396;均方根误差RMSREP分别为 1.9840和2.1439。模型的精度低。
[0030] 对比发现,每隔一个波点(对应波数为3.858cm‑1)取一个透射率,手动降维一次;使‑1 ‑1波数范围由925.92~3005.382cm 变为925.92~3001.524cm ,波点数由540变为270,PLSR和 SVR模型的相关系数RP分别为0.7584和0.7122;均方根误差RMSREP分别为1.7476和 ‑1
1.8686。模型的精度得到提高。最终选择925.92~3001.524cm 的光谱区域用于建模。
[0031] 采用蒙特卡洛交叉验证算法剔除异常样本,编号为61,75,76,141,144。图2为消噪处理、手动降维和剔除异常值后的牛奶样品中红外光谱图。剔除异常样本前,PLSR和SVR模型的相关系数RP分别为0.7584和0.7122;均方根误差RMSREP分别为1.7476和1.8686。剔除异常样本后,PLSR和SVR模型的相关系数RP分别为0.8577和0.7778;均方根误差 RMSREP分别为1.5856和1.8931。
[0032] 分别采用SG卷积平滑、标准正态变量变换(SNV)、多元散射校正(MCS)、SG卷积一阶导数(SG1)、SG卷积二阶导数(SG2)、归一化(normaliz)、移动窗口平滑 (nirmaf)、标准化(auto)、一阶差分(diff1)、二阶差分(diff2)共10种方法对光谱数据进行预处理。
[0033] 采用spxy算法将样本按7:3随机划分为训练集和测试集。各样本集的αs1‑酪蛋白含量描述性统计分析如下:
[0034]
[0035] 采用无信息变量消除法(UVE)、竞争性自适应重加权法(CARS)、连续投影法 (SPA)3种特征提取算法提取中红外光谱特征变量。
[0036] 使用偏最小二乘回归法(PLSR)和支持向量机回归算法(SVR)利用训练集数据构建回归模型,对测试集中的样本进行预测。
[0037] 筛选和确定模型:
[0038] (1)偏最小二乘回归(PLSR)模型
[0039]
[0040]
[0041] (2)支持向量机回归(SVR)模型
[0042]
[0043]
[0044] 经过对比分析,αs1‑酪蛋白的最佳回归模型为SG1‑CARS‑SVR模型。训练集和测试集相关系数分别为0.88277和0.8998;训练集和测试集均方根误差分别为1.1363和1.3726。
[0045] 实施例2:
[0046] 牛奶中αs1‑酪蛋白的中红外快速批量检测方法的应用:
[0047] 取20个αs1‑酪蛋白样本对模型进行预测。将预测结果与真实值(反相高效液相色谱法, RP‑HPLC)(王浩,张志国,常彦忠,段相林,赵述强,张楠,石振华.RP‑HPLC法对乳制品中主要牛奶蛋白的分离及定量测定[J].食品科学,2009,30(24):376‑380.)对比。
[0048] 方法:按照实施例1的方法采集样本的光谱,将光谱数据代入实施例1构建的SG1‑ CARS‑SVR模型中,即可输出预测结果,预测结果如表所示。Rp=0.8998,RMSEP=1.3726.[0049]
[0050]