基于电阻抗定量检测土壤氮素的方法转让专利

申请号 : CN202110586732.3

文献号 : CN113390925B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李鑫星董玉红张国祥郑永军严海军

申请人 : 中国农业大学

摘要 :

本发明提供一种基于电阻抗定量检测土壤氮素的方法。该方法包括:对所获取的土壤进行预处理,以得到不同氮素含量的土壤样品;检测和分析多组土壤样品,得到多组土壤的全氮含量、阻抗指标数据和影响土壤中的氮素含量检测的主导干扰因素数据;对土壤阻抗指标数据和主导干扰因素数据进行分类;分别建立针对分类后的每类数据的土壤阻抗指标数据、主导干扰因素数据和检测到的土壤氮素含量数据之间的响应函数;以及基于响应函数,检测土壤中的氮素含量。

权利要求 :

1.一种基于电阻抗定量检测土壤氮素的方法,其特征在于,所述方法包括:对所获取的所述土壤进行预处理,以得到不同氮素含量的土壤样品,包括:对待检测地区的典型土壤进行取样,并去除杂物;

利用10目土壤筛来筛选所取样的土壤,以作为基础土壤样品;以及为所述基础土壤样品配置不同含量的氮素,以作为多组土壤样品;

检测和分析多组所述土壤样品,得到多组土壤全氮含量、土壤阻抗指标数据和影响土壤中的氮素含量检测的干扰因素数据中的主导干扰因素数据;

对所述土壤阻抗指标数据和所述主导干扰因素数据进行分类,所述土壤阻抗指标数据包括阻抗模值和相位角,所述主导干扰因素数据包括所述土壤含水率和激励频率,所述干扰因素数据分为阻抗仪器检测参数干扰因素数据和土壤导电环境干扰因素数据,其中所述阻抗仪器检测条件干扰因素数据包括激励时长、所述激励频率、检测前端,所述土壤导电条件干扰因素数据包括土壤环境温度、土壤粒径、所述土壤含水率、土壤pH值,其中所述激励时长为0‑600s,所述激励频率为0.05‑200kHz,所述检测前端包括四端并排式、四端双排式、四端单针式和四端环绕式的前端,所述土壤粒径为小于2mm,所述土壤环境温度为10‑25℃,所述土壤pH值为7.0,所述土壤含水率为0‑20%;

分别建立针对分类后的每类数据的所述土壤阻抗指标数据、所述主导干扰因素数据和检测到的土壤氮素含量数据之间的响应函数,包括:将分类后的k组数据作为训练样本;

引入不敏感损失函数,基于所述不敏感损失函数、高斯核函数和所述训练样本,得到所述响应函数;以及基于所述响应函数和最终聚类质心点,检测土壤中的氮素含量。

2.根据权利要求1所述的基于电阻抗定量检测土壤氮素的方法,其特征在于,所述对所述土壤阻抗指标数据和所述干扰因素数据进行分类,包括:将检测得到的所述土壤阻抗指标数据和所述干扰因素数据归一化处理后作为初始输入数据;

随机选取初始聚类质心点;

分别计算所述初始输入数据与所述初始聚类质心点的欧氏距离,并将所述初始输入数据划分到与所述初始聚类质点的所述欧氏距离最近的类别。

3.根据权利要求2所述的基于电阻抗定量检测土壤氮素的方法,其特征在于,所述对所述土壤阻抗指标数据和所述干扰因素数据进行分类还包括:计算每个类别的中心;

利用所述欧氏距离定义畸变函数;

在所述畸变函数达到最小值之后或训练达到迭代阈值之后,得到分类后的k组数据和最终聚类质心点,其中k为小于n的正整数,n为正整数。

4.根据权利要求3所述的基于电阻抗定量检测土壤氮素的方法,其特征在于,所述方法还包括:分别计算k个聚类簇数的聚类结果;

计算聚类簇数k对应的所有样本与质心点之间的误差平方和;

将出现数据拐点对应的簇数值k定为最终聚类簇数及最终聚类结果。

说明书 :

基于电阻抗定量检测土壤氮素的方法

技术领域

[0001] 本发明涉及土壤成分检测技术领域,尤其涉及一种基于电阻抗定量检测土壤氮素的方法。

背景技术

[0002] 化学肥料可直接提供作物必需的营养元素,满足作物生长发育需求,其投入量与利用率直接影响着作物产出、生产者收入和土壤环境质量。作物对营养元素的选择性吸收造成多余土壤养分逐年累积,使土壤营养结构遭到破坏,长此以往,土壤难以实现自我调节,严重时甚至可导致其丧失生产能力。因此,基于土壤养分的空间变异性实行变量施肥,实现作物养分的按时按需按量供给,施行精准施肥策略,是实现农业清洁生产和可持续发展的重要举措。欲实现精准施肥的自动化、智能化发展,土壤养分定量检测是其重要前提条件,这也成为限制精准施肥发展的最主要瓶颈。
[0003] 尽管现有技术中多利用电化学、光电分色、光谱等技术等原理研究设计土壤养分测定方案可以实现土壤养分的有效测定,但是总体来说,现有的土壤养分测定技术都或多或少依赖于专业的实验设备和实验人员,对实验环境要求较高,且从测定到反馈给农户需要一定的时间辗转,所以难以在实际生产中推广应用。

发明内容

[0004] 本发明提供一种基于电阻抗定量检测土壤氮素的方法,旨在判断并预测出土壤内含的氮素组分信息,使得农户基于土壤环境信息能够对作物生产进行有效管控,满足了对我国农业现代化和可持续发展的现实需求。
[0005] 具体地,本发明实施例提供了以下技术方案:
[0006] 第一方面,本发明的实施例提供一种基于电阻抗定量检测土壤氮素的方法,所述方法包括:
[0007] 对所获取的所述土壤进行预处理,以得到不同氮素含量的土壤样品;
[0008] 检测和分析多组所述土壤样品,得到多组土壤全氮含量、阻抗指标数据和影响土壤中的氮素含量检测的主导干扰因素数据;
[0009] 对所述土壤阻抗指标数据和所述主导干扰因素数据进行分类;
[0010] 分别建立针对分类后的每类数据的所述土壤阻抗指标数据、所述主导干扰因素数据和检测到的土壤氮素含量数据之间的响应函数;以及
[0011] 基于所述响应函数,检测土壤中的氮素含量。
[0012] 进一步地,该方法还包括:
[0013] 所述主导干扰因素数据包括所述土壤含水率和激励频率。
[0014] 进一步地,该方法还包括:
[0015] 所述对所述土壤阻抗指标数据和所述主导干扰因素数据进行分类,包括:
[0016] 将检测得到的所述土壤阻抗指标数据和所述主导干扰因素数据归一化处理后作为初始输入数据;
[0017] 随机选取初始聚类质心点;
[0018] 分别计算所述初始输入数据与所述初始聚类质心点的欧氏距离,并将所述初始输入数据划分到与所述初始聚类质点的所述欧氏距离最近的类别。
[0019] 进一步地,该方法还包括:
[0020] 计算每个类别的中心;
[0021] 利用所述欧氏距离定义畸变函数;
[0022] 在所述畸变函数达到最小值之后或训练达到迭代阈值之后,得到分类后的k组数据和最终聚类质心点,其中k为小于n的正整数,n为正整数。
[0023] 进一步地,该方法还包括:
[0024] 分别计算k个聚类簇数的聚类结果;
[0025] 计算聚类簇数k对应的所有样本与质心点之间的误差平方和;
[0026] 将出现数据拐点对应的簇数值k定为数据最终的聚类簇数及最终聚类结果。
[0027] 进一步地,该方法还包括:
[0028] 所述分别建立针对分类后的每类数据的所述土壤阻抗指标数据、所述主导干扰因素数据和检测到的土壤氮素含量数据之间的响应函数包括:
[0029] 将分类后的k组数据作为训练样本;
[0030] 引入不敏感损失函数,基于所述不敏感损失函数和所述训练样本,得到所述响应函数。
[0031] 进一步地,该方法还包括:
[0032] 所述土壤阻抗指标数据包括阻抗模值和相位角。
[0033] 进一步地,该方法还包括:
[0034] 所述检测和分析多组土壤样品以及所述基于所述响应函数检测土壤中的氮素含量还包括:采用至少一种电阻抗检测前端的检测方式,对所述土壤样品进行检测,其中,所述至少一种电阻抗检测前端包括四端并排式、四端双排式、四端单针式和四端环绕式的前端。
[0035] 进一步地,该方法还包括:
[0036] 其特征在于,所述对所获取的所述土壤进行预处理,以得到不同氮素含量的土壤样品,包括:
[0037] 对待检测地区的典型土壤进行取样,并去除杂物;
[0038] 筛选所取样的土壤,以作为基础土壤样品;以及
[0039] 为所述基础土壤样品配置不同含量的氮素,以作为多组土壤样品。
[0040] 由上面技术方案可知,本发明实施例提供的一种基于电阻抗定量检测土壤氮素的方法,通过电阻抗技术,检测土壤样品的电阻抗和相位角等电学参数,结合土壤含水率和电源激励频率等主导干扰因素数据,建立土壤电阻抗参数与土壤氮素含量之间的响应函数,进而判断预测出土壤内氮素含量的组分信息,使得农户基于土壤环境信息能够对作物生产进行有效管控,满足了对我国农业现代化和可持续发展的现实需求。

附图说明

[0041] 为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042] 图1为本发明一实施例提供的基于电阻抗定量检测土壤氮素的方法的流程图;以及
[0043] 图2为本发明一实施例提供的基于电阻抗定量检测土壤氮素的方法之中的建立响应函数的流程图。

具体实施方式

[0044] 为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0045] 本发明使用的各种术语或短语具有本领域普通技术人员公知的一般含义,即便如此,本发明仍然希望在此对这些术语或短语作更详尽的说明和解释。如果本文涉及的术语和短语有与公知含义不一致的,则以本发明所表述的含义为准;并且如果在本申请中没有定义,则其具有本领域普通技术人员通常理解的含义。
[0046] 现有技术中多利用电化学、光电分色、光谱等技术等原理研究设计土壤养分测定方案可以实现土壤养分的有效测定,但是总体来说,现有的土壤养分测定技术都或多或少依赖于专业的实验设备和实验人员,对实验环境要求较高,且从测定到反馈给农户需要一定的时间辗转,所以难以在实际生产中推广应用。
[0047] 针对于此,第一方面,本发明的一实施例提出一种基于电阻抗定量检测土壤氮素的方法,其旨在克服现有技术中存在的问题。
[0048] 本发明的一实施例提供的方法是用于基于电阻抗定量检测土壤氮素的方法,其中电阻抗检测作为常见的样品物性检测方法,运用在众多研究成果和市场应用中。土壤中包含矿物质、水分、空气、有机物质和生命有机体,是同时具有气、液、固相的混合体。由于水分的存在,土壤中的矿物质溶解到水分中,形成可以导电的电解离子,从而可以将土壤看作是一种同时具有电阻、电感、电容特点的电阻抗器件。在众多养分中,氮素作为作物生长发育过程冲不可或缺的大量元素,其在实际生产中的使用和转化也更为频繁。进行施肥作业时,施加的氮肥会和水形成亚硝态氮、硝态氮、氨和铵离子进入土壤,施氮量的增大形成的土壤+ ‑ ‑氮素含量增加会导致土壤的NH4、NO3、NO2等含氮离子浓度的增加,使得土壤在电学特性方面的导电离子浓度的增加,对电流产生的阻碍和迟滞效应发生相应的改变,造成其实际电阻抗检测数值的变化。其基础理论如下所示:
[0049] 土壤电阻率的大小主要取决于土壤的成分和含水量。其成分不同决定了其所含导电离子浓度的大小。假定土壤中导电离子浓度为 含水率为θ,土壤电阻率ρ(resistivity)就是导电离子浓度η和含水率θ的函数:
[0050]
[0051] 其中,C1、C2为常数。
[0052] 根据公式(1),土壤电阻率将会根据土壤成分以及含水量不同而改变。而在温度一定的情况下,电阻率与电阻存在以下关系:
[0053]
[0054] 其中,R表示电阻,l为材料的长度,S为材料的横截面积。
[0055] 将土壤看作一种同时具有电阻、电感、电容特点的电阻抗器件,则其电阻抗值定义为:
[0056] Z=R+J(XC‑XL)  公式(3)
[0057] 又,
[0058]
[0059] 其中,Z表示电阻抗,R表示电阻,XC表示容抗,XL表示感抗,J表示电阻抗的虚部符号,f表示电流源激励频率,C为电容,L为电感。
[0060] 综合公式(1)、(2)、(3)、(4)可以得到,土壤电阻抗值与土壤含水率和土壤养分含量存在下面的关系:
[0061]
[0062] 对于同一个设施土壤样品,f1、f2、l、S、C、L均为常数,因此上式可以简化为:
[0063]
[0064] 其中,C3,C4,C5均为常数。
[0065] 从公式(6)可以看出,影响土壤电阻抗值大小的主要影响因素包括土壤中导电离子浓度 土壤含水率(θ)和电流源激励频率(f)。
[0066] 影响土壤中导电离子浓度的主要是土壤中所存在的各种养分元素,但同时土壤具有导电离子饱和浓度限制,且导电离子浓度差异导致的土壤电阻抗的变化又不仅仅是施氮量不同导致的含氮离子浓度变化,土壤中存在着众多的其他导电离子,在施加磷肥、钾肥等其它肥料时,也会引起部分离子浓度变化。因此,利用电阻抗方法检测土壤氮素时需要特定的变量控制以及应用时的限定条件。而在一定条件下,土壤电阻抗特性和土壤中氮素含量存在一定的相关性。
[0067] 下面结合图1描述本发明的基于电阻抗定量检测土壤氮素的方法。
[0068] 图1为本发明一实施例提供的基于电阻抗定量检测土壤氮素的方法的流程图。
[0069] 在本实施例中,需要说明的是,该基于电阻抗定量检测土壤氮素的方法可以包括以下步骤:
[0070] S1:对所获取的土壤进行预处理,以得到不同氮素含量的土壤样品;
[0071] S2:检测和分析多组土壤样品,得到多组土壤全氮含量、阻抗指标数据和影响土壤中氮素含量检测的主导干扰因素数据;
[0072] S3:对土壤阻抗指标数据和主导干扰因素数据进行分类;
[0073] S4:分别建立针对分类后的每类数据的土壤阻抗指标数据、主导干扰因素数据和检测到的土壤氮素含量数据之间的响应函数;以及
[0074] S5:基于响应函数,检测土壤中的氮素含量。
[0075] 在本实施例中,需要说明的是,该方法还可以包括:对所获取的土壤进行预处理,以得到土壤样品S1,其包括:对待检测地区的典型土壤进行取样,并去除杂物;筛选所取样的土壤,以作为基础土壤样品;以及为基础土壤样品配置不同含量的氮素,以作为多组土壤样品。
[0076] 具体地,对待测地区的典型土壤进行取样,去除地表覆盖的残茬、菜叶、石块等杂物,在据地表0mm到150mm深处取30kg原始土壤。将取回的原始土壤过10目土壤筛后作为基础土样;为配置不同含氮量水平的土壤样品,本发明选择含氮量为46.4%的尿素作为试验氮肥。取15kg基础土壤样品,平均分成20份,然后向每份土壤样品按照0.1g/kg的氮含量梯度分别添加不同质量的尿素(氮肥),充分混合均匀后放入直径100mm,高度120mm的圆柱形玻璃容器中作为单个土壤样品,静置72小时后从每份土壤样品中取出50g用以检测其土壤全氮含量和含水率,得到其基础数据。
[0077] 在本实施例中,需要说明的是,该方法还可以包括:检测和分析多组土壤样品S2以及基于响应函数检测土壤中的氮素含量S5还包括:采用至少一种电阻抗检测前端的检测方式,对土壤样品进行检测,其中,至少一种电阻抗检测前端包括四端并排式、四端双排式、四端单针式和四端环绕式的前端。
[0078] 具体地,本发明利用LCR TH2829数字电桥测试仪完成土壤电阻抗指标测定,为获取稳定可靠的土壤阻抗信息,本发明分别依据四端法检测原理设计了的电阻抗检测前端,以确定不同形式检测前端的具体测量效果并配合完成相应的阻抗测量干扰因素数据获取。
[0079] 更具体地,四端并排式、四端双排式前端均采用直径2mm,总长度为100mm的紫铜探针,且探针之间的间距设置为20mm;四端单针式检测前端采用内径12mm,厚度为0.3mm,长度为10mm的紫铜环;四端环绕式检测前端,其中心为直径2mm,长度100mm的紫铜探针,外侧环绕铜环外径分别为20mm,40mm,60mm,铜环厚度为0.5mm,总长度为100mm。然而,本发明的实施例不限于此,在不脱离本发明的范围和精神的情况下,本领域的普通技术人员可以根据更多实际作业需要而选择其它不同的检测方式。
[0080] 更具体地,诸如四端并排式、四端双排式、四端单针式、四端环绕式的四种检测前端的各个测量元件之间用3D打印的树脂材料进行连接支撑。
[0081] 在本实施例中,需要说明的是,该方法还可以包括:干扰因素数据包括土壤环境温度、土壤粒径、土壤含水率、土壤pH值、激励时长、激励频率和检测前端。
[0082] 然而,本发明的实施例并不限于此,在不脱离本发明的范围和精神的情况下,本领域的普通技术人员可以根据需要而选择更多不同的干扰因素数据。例如,干扰因素数据分为阻抗仪器检测参数干扰因素数据和土壤导电环境干扰因素数据,其中阻抗仪器检测条件干扰因素数据包括激励时长、激励频率、检测前端,土壤导电条件干扰因素数据包括土壤环境温度、土壤粒径、土壤含水率、土壤pH值,本发明从阻抗仪器检测参数和土壤导电环境两个方面确定激励频率和土壤含水率为主导干扰因素数据。
[0083] 在本实施例中,需要说明的是,该方法还可以包括:电阻抗指标数据包括阻抗模值和相位角。
[0084] 具体地,土壤样品电阻抗参数测定过程会受到众多因素的影响,其依据测量原理可以分为阻抗仪器检测参数和土壤导电环境两个方面,阻抗仪器检测参数主要包括激励时长、激励频率以及检测前端的形式(材料、直径、间距)和探针入土长度等,而土壤导电环境则是主要包括土壤环境温度、土壤粒径以及土壤含水率等因素。本发明主要考虑的土壤样品电阻抗参数测量干扰因素实验条件如表1所示。
[0085]
[0086] 表1
[0087] 例如,在土壤样品制备完成后,利用不同的阻抗检测前端和LCR TH2829数字电桥测试仪完成对土壤样品的阻抗模值(Zs)和相位角(θ)两个阻抗指标的测量。
[0088] 具体地,为量化表征激励时长对土壤阻抗测定值的影响规律,本发明引入土壤阻抗测量指标数据的相对变化量:
[0089]
[0090] 式中,δ表示土壤阻抗指标的相对变化量,x表示变化前的测量参数值,x′表示变化后的参数值。
[0091] 结合公式(7)可得到土壤阻抗模值Zs和相位角θ的相对变化量计算公式,分别为:
[0092]
[0093]
[0094] 其中,式中,δz和δθ分别表示相邻时间节点的通过同一检测前端测定的土壤阻抗模值Zs和相位角θ两个指标数据的相对变化量,Zst和θt为单个土壤样品在该时间节点下获得的平均阻抗模值和平均相位角值,其中t为时间节点值,t=0s,20s,40s...
[0095] 进一步地,本发明将阻抗模值Zs和相位角θ的绝对相对变化量|δ|<0.5%作为土壤阻抗指标的达到稳定状态的临界值,即为土壤样品的测量值,所对应的时间节点即为测量激励时长。
[0096] 本发明采用变异系数(Coefficient of Variation,CV)来表示不同检测前端测定土壤阻抗指标时的稳定性,以此确定适宜的阻抗检测前端,变异系数的计算公式如下:
[0097]
[0098] 式中,SD表示样本标准差,MEAN表示样本平均值。
[0099] 本发明选定变化较为显著的阻抗模值Zs为分析对象,其变异系数越小,说明指标数据稳定性越好,最小变异系数的数据组所对应即为适宜的阻抗检测前端。
[0100] 下面结合图2描述基于电阻抗定量检测土壤氮素的方法之中的建立响应函数的流程图。
[0101] 图2为本发明一实施例提供的基于电阻抗定量检测土壤氮素的方法之中的建立响应函数的流程图。
[0102] 通过研究发现,对于同一含氮量的土壤样品,不同主导干扰因素条件下得到的土壤电阻抗测定值之间存在显著性差异,甚至其阻抗模值都可能不在一个数量级范围,这也是限制将土壤电阻抗特性应用于定量检测土壤氮素的主要原因,干扰因子的存在,严重影响着土壤氮素响应值的稳定性和精度。为解决这一问题,本发明考虑首先将实验数据分类后再分别训练相应的检测模型,进而得到土壤氮素定量检测方法。
[0103] 在本实施例中,需要说明的是,该方法还可以包括:对土壤阻抗指标数据和主导干扰因素数据进行分类S3包括:将检测得到的土壤阻抗指标数据和主导干扰因素数据归一化处理后作为初始输入数据;分别计算k个聚类簇数的聚类结果;随机选取初始聚类质心点;分别计算初始输入数据与初始聚类质心点的欧氏距离,并将初始输入数据划分到与初始聚类质点的欧氏距离最近的类别。
[0104] 具体地,如图2所示,第一步,将检测得到的n组土壤阻抗指标数据(阻抗模值和相(1)位角)和主导干扰因子数据(含水率和激励频率)归一化处理后作为初始输入数据D=[x ;
(2) (i) (n) (i) 4
x ;...;x ;...;x ],其中每个x ∈R。
[0105] 具体地,如图2所示,第二步,随机选取k个初始聚类质心点μ1,...,μj,...,μk,μj∈4
R。
[0106] 对于每一组输入数据x(i),分别计算其与每个初始聚类质点μj的欧式距离,并将其划分到与其距离最近的那一类:
[0107]
[0108] 其中,c(i)表示第i个输入数据x(i)与k个类中距离最近的那个类,c(i)=1,2,...,k;arg是标记符号,arg min用于表明样本指标属于距离最近的质心所代表的类别。
[0109] 在本实施例中,需要说明的是,该方法还可以包括:对土壤阻抗指标数据和干扰因素数据进行分类S3还可以包括:计算每个类别的中心;利用欧氏距离定义畸变函数;在畸变函数达到最小值之后或训练达到迭代阈值之后,得到分类后的k组数据和最终聚类质心点,其中k为小于n的正整数,n为正整数。
[0110] 具体地,如图2所示,第三步,对于每一个类μj,重新计算该类的中心:
[0111]
[0112] 其中,1{c(i)=j}表示当c(i)=j时取值为1,否则为0。
[0113] 具体地,如图2所示,第四步,利用欧氏距离定义畸变函数:
[0114]
[0115] 其中,rij表示输入数据x(i)被归类到μj的时候为1,否则为0。
[0116] 具体地,如图2所示,第五步,重复迭代第三步和第四步,直到畸变函数J达到最小值或训练达到迭代阈值,结束分类,得到k组输入数据D={D1,D2,...,Dk}和最终聚类质心μ(1) (2) (t)={μ1,...,μj,...,μk},其中Dk={xk ,xk ,...,xk },t表示分到第k组数据的个数,其中k为小于n的正整数,n为正整数。
[0117] 在本实施例中,需要说明的是,该方法还可以包括:对土壤阻抗指标数据和干扰因素数据进行分类S3还可以包括:分别计算k个聚类簇数的聚类结果;计算聚类簇数k对应的所有样本与质心点之间的误差平方和;将出现数据拐点对应的簇数值k定为最终聚类簇数及最终聚类结果。
[0118] 具体地,如图2所示,第六步,计算聚类簇数k对应的所有样本与其聚类质心点之间的误差平方和SSE(sum of the squared errors),其公式为:
[0119]
[0120] 其中,Cm表示第m个簇;xm(i)是Cm中的样本点;μm为Cm的质心(Cm中所有样本的均值),SSE为所有样本的聚类误差,用以表征聚类结果。
[0121] 具体地,如图2所示,第七步,重复迭代第二步至第六步,分别计算k个聚类簇数的聚类误差SSEk,k=1,2,...,n,并将出现数据拐点对应的簇数值k定为数据最终的聚类簇数并得到其最终聚类结果。
[0122] 在本实施例中,需要说明的是,该方法还可以包括:分别建立针对分类后的每类数据的土壤阻抗指标数据、干扰因素数据和检测到的土壤氮素含量数据之间的响应函数S4包括:将分类后的k组数据作为训练样本;引入不敏感损失函数,基于不敏感损失函数和训练样本,得到所述响应函数。例如,在实验数据分类完成后,对于每一组数据Dk,按照以下过程建立土壤阻抗指标、主导干扰因子和土壤全氮含量之间的响应方法。
[0123] 具体地,首先将输入数据Dk与其对应的土壤样品的全氮含量yk组成训练样本Tk=(1) (1) (2) (2) (t) (t) 4{(xk ,yk ,(xk ,yk ),...,(xk ,yk )},xk∈R,yk∈R。
[0124] 具体地,引入不敏感损失函数∈k,如果土壤氮素含量预测值f(xk)和样本值yk之间的差距|zk|=|f(xk)‑yk|小于给定的∈k,则认为是无损的(尽管预测值与观测值可能并不完全相等)。
[0125] 具体地,定义目标函数:
[0126]
[0127] 其中wk=(wk1;wk2;...;wkd)为法向量,决定了分离超平面的方向,bk为常数,Ck为正则化常数,l∈是∈k的不敏感损失函数,f(xk)为土壤氮素含量预测值,yk为土壤氮素含量实测样本值。
[0128]
[0129] 其中,zk为土壤氮素含量预测值f(xk)和实测样本值yk之间的差距,zk=f(xk)‑yk。
[0130] 通过拉格朗日乘数方法对上述问题求解,得到线性回归情况下的目标函数如下:
[0131]
[0132] 其中 和ai为待求解的拉格朗日乘子,可由公式(17)求得:
[0133]
[0134] 本发明拟选取多个满足条件0<αi<Ck的样本求解bk后取平均值以增强方法的鲁棒性,考虑特征映射形式,则:
[0135]
[0136] 其中 为低维到高维的映射。为避免求解映射 引入核函数κ(x,y),其满足则土壤阻抗指标、主导干扰因子和土壤全氮含量之间的响应目标函数可表示为:
[0137]
[0138] 对于非线性回归问题,通过非线性变换 将样本空间变换到某高维特征空间,在该空间内构造一个线性模型,而核函数能有效避免求解非线性变换 的问题。通过选择不同的核函数,可以将样本点映射到不同维度的特征空间,并得到其相应的回归模型。本发明拟采用高斯核函数完成训练样本从低维到高维的特征映射:
[0139]
[0140] 具体地,通过以上计算过程,可以分别得到k组关于土壤阻抗、主导影响因子和土壤全氮含量之间的响应函数f(xk),根据响应函数,可以得到相应的土壤样品的土壤全氮含量预测值 进而可以计算其均方根误差RMSE:
[0141]
[0142] 由于在每次分类时初始聚类质心的选取会对最终聚类结果产生影响,因此为得到更合理的预测结果,本发明将数据重复分类训练20次并计算土壤全氮含量预测值与实际值的RMSE,然后将20次训练中RMSE最小的聚类质心μmin={μ1,...,μj,...,μk}作为最终聚类质心,相应的响应函数作为最终土壤氮素定量检测方法。
[0143] 进一步地,当将得到的响应函数用于土壤含氮量检测验证时,首先需要判断验证数据属于哪一类输入数据,然后根据其所在的类别选择相应的响应函数f(xk),从而得到土壤含氮量预测值。验证过程如下:
[0144] 具体地,输入验证数据Te=[xe(1);xe(2);...;xe(i);...;xe(s)],xe(i)∈Rm,Ye=[ye(1);(2) (i) (s) (i)
ye ;...;ye ;...;ye ],其中ye∈R;对于每一组验证输入数据xe ,分别按照公式(14)计(i)
算其与每个最终聚类质点μj的欧式距离,得到与其距离最近的那一类μk;将xe 代入其所属类别的响应函数f(xk),得到其相应的预测值 将土壤含氮量预测值 与实际值ye进行对比分析,验证本发明的实施例提供的方法的适用性。
[0145] 此外,在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个方面或者操作与另一个方面或操作区分开来,而不一定要求或者暗示这些方面或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0146] 此外,在本发明中,参考术语“实施例”、“本实施例”、“又一实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0147] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。