一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法转让专利

申请号 : CN201410091494.9

文献号 : CN104462739B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王春梅孟庆岩占玉林杨健吴俊刘苗

申请人 : 中国科学院遥感与数字地球研究所

摘要 :

本发明是一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法,该方法不受样本统计分布的局限,可通过对n个观察值的重复采样模拟得到接近真实的样本分布特征,该方法采样效率将远大于传统统计和自助采样效率,而且实际应用范围将更广,不需要传统统计和分层采样中数据独立和正态分布的前提要求,不需要试验区域的部分先验数据和资料对其进行分层,也不需要地统计采样的半方差函数信息,能够适用于大范围多尺度卫星遥感数据反演生态环境参数的地面采样,并实现了快速高精度地面采样。

权利要求 :

1.一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法,其特征在于,该方法不受样本统计分布的局限,可通过对n个观察值的重复采样模拟得到接近真实的样本分布特征,具体包括如下步骤:步骤1)根据所选择的卫星遥感数据确定采样研究小区,在研究小区内设置n个生态环境参数观测值θi采样点,其中i=1,2,......,n,根据采样数据获取的n个θi来确定平均值步骤2)在相同的变异系数CV下,将根据传统统计方法在CL=99%和RE=5%条件下计算的地面采样数目n0,作为本发明采样方法中样本数目n1的阈值下限;

步骤3)利用蒙托卡罗方法随机生成n1个样本数,保证模拟数据得到的平均值 和CV与n个观测值一致;

步骤4)从n1个生态环境参数样本数据中随机选出m个数据,其中,m=1,2,3,......,n1,每次的选择需要随机重复s次,其中,步骤5)计算每次选择得到的m个样本均值,共获得s个样本均值,s个平均值中与全部n个实测样点均值之间的相对误差小于5%的所占比例就是置信水平CL;

步骤6)分别计算s个均值与全部n个实测样点均值之间的相对误差,分析相对误差在

5%或10%内的置信水平CL;

步骤7)绘制置信水平CL与样本数目m的回归关系图,从而确定不同CL下对应的地面采样数目NSS;

步骤8)构建地面采样数目NSS和变异系数CV之间的数学模型,根据数学模型求取相应变异系数CV的地面采样数目NSS。

2.如权利要求1所述的方法,其特征在于,所述卫星遥感数据为低分辨率遥感影像MODIS数据、中分辨率遥感影像TM或HJ-CCD数据。

3.如权利要求1所述的方法,其特征在于,所述生态环境参数为叶面积指数、表层土壤含水量、地表温度。

说明书 :

一种适用于大范围多尺度卫星遥感数据反演的生态环境参数

地面采样方法

技术领域

[0001] 本发明属于卫星遥感数据地表参数反演领域,特别是涉及针对大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法。

背景技术

[0002] 迄今为止,已有众多学者探讨过地面采样设计的策略问题。一个准确的样本设计方案应保证样本点的均值是对样本总量均值的一个很好的估计。地面采样设计主要考虑两个方面,一是决定最佳的采集样本的数目,二是决定这些将要布置样本点的空间位置。合理取样数目取决于采样设计的目标、样本总量的变异性、估计样本总量均值所要求的精度水平、估计样本总量均值所需的置信区间、采样的费用等。在过去的几十年里,已建立了多种取样模式方法,主要包括传统统计采样,地质统计采样,分层采样和自助法采样等。
[0003] 目前确定合理取样数目应用最多的是传统统计方法。在一定精度水平下,传统统计计算的合理取样数目与变异系数的平方成正此,但传统统计方法具有局限性,必须满足样本数据的正态分布及样点之间的空间独立。当违背这一条件时,传统方法得到的合理取样数目与实际需要不符,其结果必然令人无法信服。
[0004] 研究表明,土壤特性在一定范围内存在空间自相关性。地统计采样克服了样点独立的局限性,考虑了生态系统中随机变量的变异结构对实际采样的影响。Mcbratney和Webster(1983)较早讨论了应用地统计学理论确定土壤pH值合理取样数目的方法,此后许多研究者也用该方法研究了不同土壤参数的空间变异及采样设计,其结果均认为地统计学方法比传统统计方法在设计采样方案时更有效,能用较少数目的样品获得同样精度的估值。但是,地统计采样过程中必须要准确获取土壤特性的变异函数,需要先验资料或者进行预采样获取较准确的变异函数。
[0005] Orlóci在1988年提出,一个生态系统的表征必须考虑其内部的变异特征。而分层采样正好能达到这个目的。分层采样可以有效地提高总体估计值的精确度,是最精确的取样策略方法之一。分层抽样研究已用于人口普查、环境分析、 产品测试以及土壤科学等不同领域。虽然分层采样精度较高,能有效的减少取样时间和降低取样成本,但也受到一些条件的限制,例如一方面精度的高低受分层方式的影响,另一方面是必须有进行区域分层的先验资料支持,如按土壤类型对研究区进行分区,首先必备土壤质地分类图,如按土地利用类型进行分区,必须要有试验区域详细的土地利用分类图。总之,在分层取样之前,需要试验区域的部分先验数据和资料对其进行分层,这在实际调查中也是不小的工作量。
[0006] 近二十年来,一种新的方法——自助法,逐渐用于土壤的采样设计。这种方法是当今流行的数据重采样方法,不受数据分布特征的限制。其基本原理是从n个样本数据中随机选择m个样本(m=1,2,...,n),每个m样本需要进行B次随机重复来估算数据统计的分布特征。Manly(1997)建议实际应用中的B应不少于1000次,有时甚至需要设置10000次。然而,为了避免冗长的计算时间,很多研究者在实际应用中尽量选择小的样本数目(n)或者少的重复数(B)。但即使样本数目n很小,1000次甚至10000次的重复数B也很难覆盖所有的组合数,如当n=20和m=10时,从n个数据中随机选择m个数据共存在的组合数有 ,此时设置较小的B(<184,756)势必会导致样本数目置信水平的不稳定。此外,自助法的采样效率并不高于传统统计,这也是限制自助采样方法应用的关键原因,尤其对于随时空变化较快的生态环境参量,自助采样方法应用受到限制。
[0007] 考虑到以上采样方法的前提条件和应用限制,本方法针对现有方法存在的精度不稳定问题,提出一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法(文中简称“大范围采样方法”)。该方法采样效率将远大于传统统计和自助采样效率,而且实际应用范围将更广,不需要传统统计和分层采样中数据独立和正态分布的前提要求,不需要试验区域的部分先验数据和资料对其进行分层,也不需要地统计采样的半方差函数信息,能够适用于大范围多尺度卫星遥感数据反演生态环境参数的地面采样。

发明内容

[0008] 针对现有技术中存在的问题,本发明的目的在于提出一种应用范围广且不受数据正态分布、空间变异结构、先验观测数据条件的限制,实现了快速高精度地面采样。
[0009] 为了实现上述目的,本发明建立了一种适用于大范围多尺度卫星遥感数据 反演的生态环境参数地面采样方法,该方法不受样本统计分布的局限,可通过对n个观察值的重复采样模拟得到接近真实的样本分布特征,具体包括如下步骤:
[0010] 步骤1)根据所选择的卫星遥感数据确定采样研究小区,在研究小区内设置n个生态环境参数观测值θi采样点,其中i=1,2,......,n,根据采样获取的n个θi来确定平均值[0011] 步骤2)从n个生态环境参数实测数据中随机选出m个数据,其中,m=1,2,3,......,n,每次的选择需要随机重复s次,其中,
[0012] 步骤3)计算每次选择得到的m个样本均值,共获得s个样本均值,s个平均值中与全部n个实测样点均值之间的相对误差小于5%的所占此例就是置信水平CL;
[0013] 步骤4)分别计算s个均值与全部n个实测样点均值之间的相对误差,分析相对误差在5%或10%内的置信水平CL;
[0014] 步骤5)绘制置信水平CL与样本数目m的回归关系图,从而确定不同CL下对应的地面采样数目NSS;
[0015] 步骤6)在置信水平CL=90%或95%和误差RE=10%或5%误差下,构建地面采样数目NSS和变异系数CV之间的数学模型,根据数学模型求取相应变异系数CV的地面采样数目NSS。
[0016] 进一步,所述卫星遥感数据为低分辨率遥感影像MODIS数据、中分辨率遥感影像TM或HJ-CCD数据。
[0017] 进一步,所述生态环境参数为叶面积指数、表层土壤含水量、地表温度。

附图说明

[0018] 图1是随机组合采样与其他方法确定的表层土壤水分取样数目与其相应标准误差的关系
[0019] 图2是随机组合采样与其他方法估计表层土壤水分相对误差(RE)的空间分布图[0020] 图3是一定相对误差下不同尺度随机组合方法的样本数目和置信水平之间的关系图
[0021] 图4是不同尺度表层土壤水分估计相对误差的空间分布图
[0022] 图5是一定误差下不同采样方法NSS和相应CV之间的关系图
[0023] 图6是RE=5%和10%误差条件下,简化随机组合方法估计的置信水平和取样数目之间的关系

具体实施方式

[0024] 下面结合附图对本发明多尺度土壤含水量的地面采样方法作进一步说明。
[0025] 首先,不同采样方法的合理取样数目估算此较。针对55m研究尺度,应用不同采样方法得到的样本数目与相应标准差的关系见图1,从图1看出,采样数目的增大导致标准差3 -3
急剧减小。当标准差等于0.0076cmcm (相当5%的相对误差和95%的置信水平)时,传统统计和地统计采样的估算NSS分别是55和35。说明在一定的标准差下,地统计采样估算的NSS比传统统计的结果要小,这与前人的研究结果是一致的。从图1上看出,分层采样中标准差随样本数目的变化趋势与传统统计和地统计方法的结果基本相似,在0.0076cm3cm-3的标准差下,分层采样估算的NSS仅26个。
[0026] 自助采样中标准差与样本数目的变化关系几乎接近于传统统计的结果(图1),Hupet和Vanclooster(2002)也曾有类似的结论。但随着样本数目的增加,自助采样的标准差出现一些起伏变化,这应该与不足的重复次数有关(Kamgar等,1993)。在0.0076cm3cm-3的标准差下,自助法估算的NSS是52。
[0027] 利用SPSS(Statistical Product and Service Solutions,SPSS Inc.,USA)中的i检验来评价不同标准差下大范围采样方法与其他采样方法的NSS估算结果的显著性差异。当显著水平p<0.1时,认为有显著性差别。从图1看出,与自助法相此,大范围采样方法覆盖了所有的样本组合,因此一定标准差下的样本数目相对较小。当标准差大于0.015cm3cm-3(相当于5%的相对误差和69%的置信水平),大范围采样方法估算的NSS与传统统计(p=
0.477)和地统计(p=0.543)的计算结果相近,但明显大于分层采样估算的NSS(p=0.086)。
如果标准差介于0.015和0.005em3cm-3(相当于5%的相对误差和99%的置信水平)之间,大范围采样方法估算的NSS仍显著大于分层采样的结果(p=0.078),但与地统计的估算结果相近(p=0.68)。当标准差更小时,大范围采样方法估算的NSS比其他方法的NSS都要小。在
5%相对误差和95%置信水平下,大范围采样方法估算的NSS是38。
[0028] 在采样策略中,除了样本数目的确定,还有一个重要的问题就是估计误差的空间分布。在5%相对误差和95%置信水平下,传统统计、自助法、大范围采 样方法、地统计和分层采样方法估算的NSS分别是55、52、38、35和26。利用估算的NSS(分别从121个观测数据中随机选择55、52、38、35和26个样本)和克里金插值,分别得到不同采样方法在5%相对误差和95%置信水平下,估计误差的空间分布图2。如图2所示,不同方法估算的相对误差大部分在15%以内。传统统计、自助法、大范围采样方法、地统计和分层采样的估算值与观测值之间的平均相对误差分别是7.5、8.0、8.9、9.5和9.5%,与传统统计和自助法相比,大范围采样方法估算的NSS虽然较少,但仍能较好地表达表层土壤水分的空间分布特征。
[0029] 所有采样方法中,地统计、分层和大范围采样方法的采样效率明显高于传统统计和自助法。其中分层方法的采样效率最高,但需要依赖每次土壤水分采样的空间分布和每层的采样配置,这在土壤水分的实际观测中难以短时间内完成;地统计采样基于土壤水分的半方差函数,在很多情况下也难以获得准确的半方差函数。因此,通过综合此较,利用大范围采样方法估算表层土壤水分的NSS是一种简便、有效的方法。
[0030] 第二是将该采样方法应用于不同尺度土壤水分的地面采样中。
[0031] 选取10m、20m、40m、80m和160m5个不同尺度,然后应用大范围采样方法方法估算不同尺度表层土壤水分的NSS。相对误差分别为10%、5%时,不同尺度表层土壤水分的采样数目与置信度水平之间的关系如图3所示。随着取样数目的增加,不同尺度对应的置信度均表现出逐步渐近趋近线100%的规律,这正好说明不同尺度的100个观测数据足以表征土壤水分的真实分布规律。在相同置信水平下,精度的提高(即相对误差的减小)和尺度的增大则意味着取样数目的增多。在较为干旱的时期(平均含水量较小的时期),若以RE=5%和CL=95%作为各尺度确定采样数目的标准,10m、20m、40m、80m和160m尺度需要的NSS分别应为
12、18、29、34和41。
[0032] 根据图3估算的NSS,进一步分析可获得160m、80m、40m、20m和10m尺度在RE=5%和CL=95%下相对误差的空间分布(图4)。从分布图上看到,大部分区域的相对误差在15%以内。在克里金插值中,较小的采样密度和采样数目都会带来较大的误差,因此,160m尺度(采样密度最小,为0.0016/m2)和10m尺度(采样数目最少,为12个)的平均相对误差明显稍大于其他尺度的结果,但不同尺度的平均相对误差均在15%范围内。
[0033] 第三是利用多尺度观测数据和采样结果,分析不同尺度大范围采样方法合理采样数目与对应CV之间的数学关系。
[0034] 通常采样的多少主要取决于测定参数在空间上的变异程度,变异程度越高,需要的采样数目越多。变异程度常通过变异系数CV来表征。按照传统统计学原理,当数据呈正态分布且样本相互独立时,在一定的置信度水平和误差条件下,NSS和CV的平方成正此。然而,实际中的采样数据通常表现出较好的空间相关性。CV通常与采样区域大小有关,较大的尺度(采样区域)常对应较高的变异程度(大的CV)。
[0035] 基于随机组合地面采样方法获取的合理取样数目随变异系数的增大逐步增加,二者表现出较好的线性关系,95、90%置信水平和10、5%相对误差下的线性拟合方程达到极限著水平,决定系数R2≥0.98。为了检验模型关系的可靠性,利用线性方程间接估算55m尺度的NSS,并将结果与大范围采样方法的估算值进行此较。在95%置信水平下,相对误差为10%和5%时大范围采样方法估算的NSS分别是12和38,相同精度下拟合方程的计算结果则是13和35。同样,在90%置信水平下,相对误差为10%和5%时大范围采样方法和拟合方程估算的NSS一样,分别是10和28。这说明构建的数学方程估算大范围采样方法的NSS是可靠的。
[0036] 表1CL=90%、95%和RE=10%、5%误差下,NSS和CV之间的拟合关系
[0037]
[0038] 从理论上进一步分析NSS和CV的关系。根据Cochran(1977),对于有限总体n进行不放回抽样m,其方差应修正为(1-m/n)σ2/m(无限总体随机抽样的方差为σ2)。对于正态分布的数据,随机变量z落在均值 的±t1-α/2倍标准差范围内的概率P0可表达为
[0039]
[0040] 考虑到绝对误差 则NSS(n0)为
[0041]
[0042] 很明显,当有限样本n趋于无穷大时,传统统计方程就是方程(2)的特例。忽略1/n使得传统统计方程过高估计了NSS。分别利用传统统计方程和方程(2)(n=100)计算不同CV与NSS在RE=5%和CL=95%下的关系,同时将两个方程的估算结果进行比较。方程(2)考虑了有限样本n,因此极大减小了一定变异系数下的NSS,几乎等于大范围采样方法的估算结果。但方程(2)的推导是基于数据独立和正态分布的前提,而大范围采样方法可以针对非独立和不同分布的样本,因此大范围采样方法的实际应用范围更广。为了展示NSS和CV在不同样本量n下的相互关系,图5给出了方程(2)在不同n值(10,40,100和500)下估算的NSS和对应CV的关系。相同的CV下,随着n的增大,方程(2)计算的NSS也在增大且逐渐逼近传统统计方程的计算结果。
[0043] 第四是解决大范围采样方法算法在区域尺度应用的计算效率。
[0044] 大范围采样方法和自助法一样受到电脑性能的影响,尤其当变异系数较大或观测数据较为复杂时,计算结果往往会消耗几天的时间。因此,如何提高大范围采样方法的计算效率是一项急需解决的问题。
[0045] 较大的样本数目会引起海量的组合这是影响大范围采样方法计算效率低的根本原因。为了有效表征区域土壤水分的真实状况,大范围采样方法中的样本数目n往往设置较大。不同尺度的观测样本数目n=100,但图6表明,这100个观测数据不需要全部用来估算NSS,即使对于最大尺度160m,在RE=5%时也仅需要48个样点就能达到99%的置信水平。这表明可以利用较小的样本数目n1代替最初的样本数n来估计大范围采样方法中的NSS,这样做无疑会极大提高大范围采样方法的计算效率。由于大范围采样方法估计的NSS与CV相关,且传统统计估算的NSS值往往偏大,因此,在相同的CV下,可将传统统计在CL=99%和RE=5%计算的NSS作为大范围采样方法样本数目n1的下限。
[0046] 以20m尺度中CV为0.05和0.12的两组数据为例,分析大范围采样方法简化方法的可行性。在CL=99%和RE=5%下,由传统统计方程得到的NSS分别是7和39。因此,在以下数值算例中,将CV=0.05的样本数目n1分别设置为90,80,70,60,50,40,30,20,10和7,同样CV=0.12的样本数目n1也分别设置为90,80,70,60,50和39,这样可更好地分析n1对样本数目和置信水平二者关系的影响。根据两组观测数据得到的均值( 和0.208cm3cm-3)和变异系数(CV=0.05和0.12),采用蒙托卡罗方法随机生成n1个样本数(但保 证 和CV与100个观测值一致),之后,应用大范围采样方法估算不同采样数目对应的置信水平。与100个实测数据相此,不同n1得到的取样数目置信水平的标准误差均在5%以内,且置信水平随取样数目的变化趋势非常平滑。另一方面,样本数目的减少(从100到n1)使得电脑的运行时间呈指数性降低。对于CV=0.12的这组数据,在CL=95%和RE=5%条件下,利用100,70和39个不同样本数目n1估算NSS,电脑(Pentium IV,CPU2.93GHz,Memory256MB)运行所耗费的时间分别是82.12,19.63和0.12h。综上,当设定的n1大于传统统计方法在CL=99%和RE=5%精度下的NSS估算值时,大范围采样方法的简化方法将给出合理的NSS,极大地提高计算效率。
[0047] 以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。