会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 地球科学 / 地壳 / 土壤 / 一种基于三维光谱曲面分区特征的土壤剖面类型识别方法

一种基于三维光谱曲面分区特征的土壤剖面类型识别方法

阅读:897发布:2021-02-27

IPRDB可以提供一种基于三维光谱曲面分区特征的土壤剖面类型识别方法专利检索,专利查询,专利分析的服务。并且本发明公开了一种基于三维光谱曲面分区特征的土壤剖面类型识别方法,包括:(1)获取土壤样本库中任一土壤剖面的发生层光谱反射率数据,进行深度插值处理、深度统一化处理和连续统去除处理;(2)根据步骤(1)处理后的光谱反射率数据生成三维光谱曲面;(3)对于所述三维光谱曲面进行分区域提取统计特征,并记入子特征集合fk,k为当前土壤剖面序号;(4)重复执行步骤(1)到(3),直至土壤样本库中所有土壤剖面都被处理,得到特征集合F={fk|k=1,…,K},K为土壤样本库中土壤剖面的数量;(5)基于特征集合F,进行多次随机森林训练,每次训练时设置相同比例的各类别样本抽样数量,生成随机森林分类模型集合M;(6)基于随机森林分类模型集合M,对待识别土壤剖面进行类型识别。本发明识别效果较好。,下面是一种基于三维光谱曲面分区特征的土壤剖面类型识别方法专利的具体信息内容。

1.一种基于三维光谱曲面分区特征的土壤剖面类型识别方法,其特征在于包括:(1)获取土壤样本库中任一土壤剖面的发生层光谱反射率数据,进行深度插值处理、深度统一化处理和连续统去除处理;

(2)根据步骤(1)处理后的光谱反射率数据生成三维光谱曲面;

(3)对于所述三维光谱曲面进行分区域提取统计特征,并记入子特征集合fk,k为当前土壤剖面序号;

(4)重复执行步骤(1)到(3),直至土壤样本库中所有土壤剖面都被处理,得到特征集合F={fk|k=1,…,K},K为土壤样本库中土壤剖面的数量;

(5)基于特征集合F,进行多次随机森林训练,每次训练时设置相同比例的各类别样本抽样数量,生成随机森林分类模型集合M;

具体包括:

(5-1)基于特征集合F,按用户设定,生成训练集和测试集;

(5-2)设置随机森林模型决策树的数目和随机选择的特征数目,设置每种土壤类型的随机抽样数目;

(5-3)基于设定参数,进行随机森林训练,获取最优随机森林分类模型mq;

(5-4)循环执行步骤(5-3),直到达到用户设定训练次数,得到分类模型集合M={mq|q=

1,…,Q},Q为用户设定训练次数;

(6)基于随机森林分类模型集合M,对待识别土壤剖面进行类型识别。

2.根据权利要求1所述的基于三维光谱曲面分区特征的土壤剖面类型识别方法,其特征在于:所述步骤(1)具体包括:(1-1)针对土壤样本库中任一土壤剖面,获取其各发生层光谱反射率集合P={pij|i=

1,…,n;j=1,…,m},其中,n为光谱波段数,m为土壤剖面所对应发生层的数量,pij表示土壤剖面第j个发生层在波段i处的反射率值;

(1-2)深度插值处理:采用等积二次样条插值方法,对土壤剖面各发生层的反射率值pij进行深度插值处理,获得预设距离间隔、不同深度处的土壤光谱反射率集合P'={p'il|i=

1,…,n;l=1,…,m'},其中,m'表示插值后的土壤光谱曲线数量,p'il表示插值所生成的l深度处光谱曲线在波段i处的反射率值;

(1-3)深度统一化处理:判断当前土壤剖面深度d是否大于120cm,若是,则保留集合P'中[0,120]区间的光谱反射率数据;若否,则将集合P'中[d+1,120]区间的光谱反射率数据使用深度d处的光谱反射率数据替代;从而得到更新后的数据集合P”;

(1-4)连续统去除处理:将数据集合P”中的光谱反射率数据进行连续统去除处理。

3.根据权利要求1所述的基于三维光谱曲面分区特征的土壤剖面类型识别方法,其特征在于:步骤(2)具体包括:对于步骤(1)处理后的光谱反射率数据,以波段为横坐标,以深度为纵坐标,生成tiff格式的三维光谱曲面。

4.根据权利要求1所述的基于三维光谱曲面分区特征的土壤剖面类型识别方法,其特征在于:步骤(3)具体包括:(3-1)根据用户预设分区区间,生成shp格式的分区面图层ZL;

(3-2)根据所述三维光谱曲面和分区面图层ZL,基于ArcGIS空间分析接口,执行分区统计操作;

(3-3)根据分区统计结果,依次读取每一分区的最小值、均值和标准方差,存入子特征集合fk。

5.根据权利要求1所述的基于三维光谱曲面分区特征的土壤剖面类型识别方法,其特征在于:步骤(6)具体包括:(6-1)对于待识别土壤剖面的光谱数据,执行步骤(1)-(3),生成相应的特征信息集合testF;

(6-2)针对testF中的所有待测试土壤剖面数据,基于训练好的随机森林分类模型集合M,进行待识别土壤剖面的多次土壤类型预测,将多次预测结果存入结果集合R;

(6-3)统计集合R中各种类型的频度,频度最高所对应的类型,即为当前待识别土壤剖面的土壤类型。

说明书全文

一种基于三维光谱曲面分区特征的土壤剖面类型识别方法

技术领域

[0001] 本发明涉及地理和地理信息技术领域,具体涉及一种基于三维光谱曲面分区特征的土壤剖面类型识别方法。

背景技术

[0002] 土壤分类是依据土壤实体性状的综合差异,划分出不同级别的土壤类型,以便因地制宜的推广农业技术和改良土壤。对于土壤类型的识别需要获取大量的土体形态、物理、化学乃至生物等诊断信息,其中部分信息可以通过肉眼观察或简单测量得到,但大多数物理、化学信息在传统上需要经过实验室测试分析方可获得。所以,对土壤类型的识别和鉴定通常成本较高,而且需要土壤分类专家的参与。
[0003] 目前,为了满足快速发展的大量高精度土壤信息需求,快速获取和持续更新土壤信息是土壤资源研究领域的核心研究内容之一。传统的土壤类型识别方法由于其成本高、效率低,通常存在采样尺度偏大、采样密度偏稀疏、调查频率偏低等问题,难于满足对土壤信息进行动态、快速、低成本获取和更新的需求。
[0004] 可见-近红外漫反射光谱不仅可以定量分析具有明确光谱吸收特征的水分、粘粒、铁氧化物、有机碳和全氮等基本土壤参数,还可以较好地预测那些不具有明确吸收特征、与基本土壤参数存在相关关系的其它土壤参数(如阳离子交换量)。由于测量简便,且无需对试样进行化学预处理,可见-近红外漫反射光谱技术是快速测定土壤各类理化参数使用最频繁的近地光谱技术。
[0005] 然而,当前基于可见-近红外漫反射光谱进行土壤类型的识别应用中,由于存在不同类型样本的数量不均衡、不同剖面的发生层划分深度不同导致剖面土样采集深度不一致等原因,识别精度并不够理想。

发明内容

[0006] 发明目的:本发明针对现有技术存在的问题,提供一种基于三维光谱曲面分区特征的土壤剖面类型识别方法。
[0007] 技术方案:本发明所述的基于三维光谱曲面分区特征的土壤剖面类型识别方法包括:
[0008] (1)获取土壤样本库中任一土壤剖面的发生层光谱反射率数据,进行深度插值处理、深度统一化处理和连续统去除处理;
[0009] (2)根据步骤(1)处理后的光谱反射率数据生成三维光谱曲面;
[0010] (3)对于所述三维光谱曲面进行分区域提取统计特征,并记入子特征集合fk,k为当前土壤剖面序号;
[0011] (4)重复执行步骤(1)到(3),直至土壤样本库中所有土壤剖面都被处理,得到特征集合F={fk|k=1,…,K},K为土壤样本库中土壤剖面的数量;
[0012] (5)基于特征集合F,进行多次随机森林训练,每次训练时设置相同比例的各类别样本抽样数量,生成随机森林分类模型集合M;
[0013] (6)基于随机森林分类模型集合M,对待识别土壤剖面进行类型识别。
[0014] 进一步的,所述步骤(1)具体包括:
[0015] (1-1)针对土壤样本库中任一土壤剖面,获取其各发生层光谱反射率集合P={pij|i=1,…,n;j=1,…,m},其中,n为光谱波段数,m为土壤剖面所对应发生层的数量,pij表示土壤剖面第j个发生层在波段i处的反射率值;
[0016] (1-2)深度插值处理:采用等积二次样条插值方法,对土壤剖面各发生层的反射率值pij进行深度插值处理,获得预设距离间隔、不同深度处的土壤光谱反射率集合P'={p'il|i=1,…,n;l=1,…,m'},其中,m'表示插值后的土壤光谱曲线数量,p'il表示插值所生成的l深度处光谱曲线在波段i处的反射率值;
[0017] (1-3)深度统一化处理:判断当前土壤剖面深度d是否大于120cm,若是,则保留集合P'中[0,120]区间的光谱反射率数据;若否,则将集合P'中[d+1,120]区间的光谱反射率数据使用深度d处的光谱反射率数据替代;从而得到更新后的数据集合P″;
[0018] (1-4)连续统去除处理:将数据集合P″中的光谱反射率数据进行连续统去除处理。
[0019] 进一步的,步骤(2)具体包括:
[0020] 对于步骤(1)处理后的光谱反射率数据,以波段为横坐标,以深度为纵坐标,生成tiff格式的三维光谱曲面。
[0021] 进一步的,步骤(3)具体包括:
[0022] (3-1)根据用户预设分区区间,生成shp格式的分区面图层ZL;
[0023] (3-2)根据所述三维光谱曲面和分区面图层ZL,基于ArcGIS空间分析接口,执行分区统计操作;
[0024] (3-3)根据分区统计结果,依次读取每一分区的最小值、均值和标准方差,存入子特征集合fk,并将fk放入特征集合F中。
[0025] 进一步的,步骤(5)具体包括:
[0026] (5-1)基于特征集合F,按用户设定,生成训练集和测试集;
[0027] (5-2)设置随机森林模型决策树的数目和随机选择的特征数目,设置每种土壤类型的随机抽样数目;
[0028] (5-3)基于设定参数,进行随机森林训练,获取最优随机森林分类模型mq;
[0029] (5-4)循环执行步骤(5-3),直到达到用户设定训练次数,得到分类模型集合M={mq|q=1,…,Q},Q为用户设定训练次数。
[0030] 进一步的,步骤(6)具体包括:
[0031] (6-1)对于待识别土壤剖面的光谱数据,执行步骤(1)-(3),生成相应的特征信息集合testF;
[0032] (6-2)针对testF中的所有待测试土壤剖面数据,基于训练好的随机森林分类模型集合M,进行待识别土壤剖面的多次土壤类型预测,将多次预测结果存入结果集合R;
[0033] (6-3)统计集合R中各种类型的频度,频度最高所对应的类型,即为当前待识别土壤剖面的土壤类型。
[0034] 有益效果:本发明与现有技术相比,其显著优点是:本发明方法综合使用土壤剖面中不同深度土层的光谱信息,生成三维光谱曲面,从而可以在任一深度和任一波段处对土壤剖面之间的反射特征差异进行分析;又基于随机森林算法,学习发现不同类型土壤剖面的光谱模式,用于未知土壤剖面的类型预测。此外,在运用随机森林模型集合生成多个预测结果的基础上,基于众数判别最终类型,有效消除了不同类型土壤剖面样本数量的不均衡对分类模型的影响。实践证明,本发明方法具有较高的识别正确率。

附图说明

[0035] 图1是本发明的一个实施例的流程示意图;
[0036] 图2是本实施例中土壤剖面34-118的三维光谱曲面示例。

具体实施方式

[0037] 下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
[0038] 本实施例使用的土壤剖面样本来自于中国某土系调查项目,土样是按照剖面的发生层次进行采集。筛选具有完整发生层土样的剖面,测量其发生层土样的可见-近红外漫反射光谱,建立土壤光谱数据库。使用Cary 5000分光光度计测量土样的可见-近红外波段(350-2500nm)漫反射光谱,测量前对土样进行风干、研磨、过筛(0.25mm)和烘干(45℃)处理。为保证样本的代表性,从土壤光谱数据库中选择剖面样本数目不少于40个的土类数据(见表1)。
[0039] 表1.土类类别及其剖面样本数目
[0040]
[0041]
[0042] *中国土壤系统分类
[0043] 如图1所示,本实施例的基于三维光谱曲面分区统计特征的土壤剖面类型识别方法包括以下步骤:
[0044] (1)获取土壤样本库中任一土壤剖面的发生层光谱反射率数据,进行深度插值处理、深度统一化处理和连续统去除处理。具体包括:
[0045] (1-1)针对土壤样本库中任一土壤剖面,获取其各发生层光谱反射率集合P={pij|i=1,…,n;j=1,…,m},其中,n为光谱波段数,m为土壤剖面所对应发生层的数量,pij表示土壤剖面第j个发生层在波段i处的反射率值;本实验例中,n为2151(350-2500nm),对于示例剖面34-118,其发生层的数量m=5;
[0046] (1-2)深度插值处理:采用等积二次样条插值方法,对土壤剖面各发生层的反射率值pij进行深度插值处理,获得预设距离间隔、不同深度处的土壤光谱反射率集合P'={p'il|i=1,…,n;l=1,…,m'},其中,m'表示插值后的土壤光谱曲线数量,p'il表示插值所生成的l深度处光谱曲线在波段i处的反射率值;本实施例中,预设深度距离间隔为1cm,示例剖面34-118的最大深度为100cm,其m'为100;
[0047] 所述等积二次样条插值方法,公开在下列文件中:1.Bishop,T.F.A.,McBratney,A.B.,Laslett,G.M.,1999.Modelling soil attribute depth functions with equal-area quadratic smoothing splines.Geoderma 91,27–45.;2.Malone,B.P.,McBratney,A.B.,Minasny,B.,Laslett,G.M.,2009.Mapping continuous depth functions of soil carbon storage and available water capacity.Geoderma 154,138–152.[0048] (1-3)深度统一化处理:判断当前土壤剖面深度d是否大于120cm,若是,则保留集合P'中[0,120]区间的光谱反射率数据;若否,则将集合P'中[d+1,120]区间的光谱反射率数据使用深度d处的光谱反射率数据替代;从而得到更新后的数据集合P″;本实施例中,示例剖面34-118的深度等于100cm,[101,120]区间的光谱反射率数据使用深度100cm处的光谱反射率数据替代;
[0049] (1-4)连续统去除处理:将数据集合P″中的光谱反射率数据进行连续统去除处理。
[0050] 其中,所述连续统去除方法,公开在下列文件中:Clark,R.N.,Roush,T.L.,1984.Reflectance spectroscopy:quantitative analysis techniques for remote sensing applications.J.Geophys.Research 89,6329-6340.
[0051] (2)根据步骤(1)处理后的光谱反射率数据生成三维光谱曲面。
[0052] 具体为以波段为横坐标,以深度为纵坐标,生成tiff格式的三维光谱曲面,如图2所示。
[0053] (3)对于所述三维光谱曲面进行分区域提取统计特征,并记入子特征集合fk,k为当前土壤剖面序号。具体包括:
[0054] (3-1)根据用户预设分区区间,生成shp格式的分区面图层ZL;本实施例中,分区规则为:深度方向上10cm为一个间隔;光谱方向上(单位nm),分为[350,440],[440,580],[580,760],[760,960],[960,1260],[1260,1560],[1560,2060],[2060,2260],[2260,2400],[2400,2500]共10个区间,共生成120个分区区间;
[0055] (3-2)根据所述三维光谱曲面和分区面图层ZL,基于ArcGIS空间分析接口,执行分区统计操作;结果写入dbf文件。本实施例中,示例剖面34‐118的部分分区统计结果如下表2所示;
[0056] 表2
[0057]
[0058] (3-3)根据分区统计结果,依次读取每一分区的最小值、均值和标准方差,存入子特征集合fk。
[0059] (4)重复执行步骤(1)到(3),直至土壤样本库中所有土壤剖面都被处理,得到特征集合F={fk|k=1,…,K},K为土壤样本库中土壤剖面的数量。
[0060] (5)基于特征集合F,进行多次随机森林训练,生成随机森林分类模型集合M。具体包括:
[0061] (5-1)从表1的各类型剖面样本中各随机抽取5个样本用作测试集(共计35个剖面样本),各类型剩下的剖面样本组成训练集;
[0062] (5-2)设置随机森林模型决策树的数目和随机选择的特征数目(取值为全部特征数目开平方根后取整),设置每种土壤类型的随机抽样数目;本实施例中,随机森林模型决策树的数目设为2000,全部特征数目为360,取其平方根后的整数值为18,从而随机选择的特征数目设为18。每种土壤类型的随机抽样数量均设为35;
[0063] (5-3)基于设定参数,进行随机森林训练,获取最优随机森林分类模型mq;
[0064] (5-4)循环执行步骤(5-3),直到达到用户设定训练次数,得到分类模型集合M={mq|q=1,…,Q},Q为用户设定训练次数。本实施例中,Q=500;进行500次随机抽样和随机森林分类运算。。在本例土类类别分类中,OOB误差的平均值为0.450,中位数为0.449,标准偏差0.005。各类别的平均识别错误率见表3;
[0065] 表3*
[0066]
[0067] *基于500次随机抽样运算的平均值
[0068] 所述随机森林方法,公开在下列文件中:1.Breiman,L.,2001.Random forests.Machine Learning 45,5‐32.;2.Cutler,D.R.,Edwards JR.,T.C.,Beard,K.H.,Cutler,A.,Hess,K.T.,Gibson,J.,et al.,Random Forests for classification in ecology.Ecology 88,2783‐2792.
[0069] (6)基于随机森林分类模型集合M,对待识别土壤剖面进行类型识别。具体包括:
[0070] (6-1)对于待识别土壤剖面的光谱数据,执行步骤(1)-(3),生成相应的特征信息集合testF;
[0071] (6-2)针对testF中的所有待测试土壤剖面数据,基于训练好的随机森林分类模型集合M,进行待识别土壤剖面的多次土壤类型预测,将多次预测结果存入结果集合R;
[0072] (6-3)统计集合R中各种类型的频度,频度最高所对应的类型,即为当前待识别土壤剖面的土壤类型。
[0073] 本实施例中,待识别土壤剖面的预测类型与实际类型如下表4所示。在土类层次上,总体识别结果正确率为60%,不同类别的识别正确率介于20%‐100%(见表5)。
[0074] 表4*
[0075]
[0076]
[0077] *最终预测类型是500次预测结果的众数值
[0078] 表5
[0079]
[0080] 本发明实施例仅进行了中国土壤系统分类中土类层次的剖面类型识别处理,该方法也适用于其它土壤分类系统中土类以及土纲、亚纲、亚类等不同层次的土壤类型识别处理。
[0081] 以上所揭露的仅为本发明一种较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用