一种地面观测气温时空数据集的制备方法转让专利

申请号 : CN201410449297.X

文献号 : CN104239706B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 赵国辉张耀南

申请人 : 中国科学院寒区旱区环境与工程研究所

摘要 :

本发明公开了一种地面观测气温时空数据集的制备方法,首先确定预制备数据集的时空分辨率与区域范围;对气温观测数据进行预处理,形成规范的驱动数据集;制备研究区域的宏观地理因素与微观地理因素栅格数据集,使其与研究区域的时空分辨率相对应;在时间维度上,通过构建小波神经网络动态组合预测模型,对气温数据的变化特性进行模拟预测,形成气温未来变化的时间序列集;在空间维度上对目标区域逐格点的计算气温数值,生成气温空间变化趋势的空间数据集;基于关键影响因子,对气温时间维和空间维同时进行模拟计算生成气温未来时空变化的情景预测数据集。本发明具有良好的扩展性,可推广到地学台站其他观测要素的时空数据产品制备与生产应用中。

权利要求 :

1.一种地面观测气温时空数据集的制备方法,其特征在于包含以下步骤:数据准备与处理

a.首先确定气温数据制备目标区域的边界范围、时间分辨率TEMPtp与空间分辨率TEMPsp,利用区域矢量边界数据制作区域的ASCII GRID格式的栅格本底数据,并标定每个网格单元的经度和纬度,即GRIDi,j(λ,)形式,其中i为行号,j为列号,λ为该网格中心点的经度,为该网格中心的纬度;

b.收集整理研究区域内的全部气象观测站点的气温观测记录,并按照站点位置信息以及观测气温数值,制备内容为STATIONid(No,ID,DATE,λ, z,TEMP)的TXT格式文件,其中:No为观测记录编号,ID为世界气象组织WMO规划的气象站点唯一编码,DATE为观测记录时间,z为站点高程,TEMP为对应时间与地点的气温数值,文件名称为该站点的ID编号;

c.对区域全部站点的观测记录,进行序列长度对比分析,确定序列时间维度的模拟预测的分段划分方案,其时间序列划分方式在模型设置与控制中进行定义;

获取目标区域的数字高程模型(Digital ElevationModel,简称DEM)数据,首先利用STATIONid所包含的z值对其进行数据质量检验,对通过验证的数据,利用GIS软件通过拼接、裁剪、投影转换、重采样预处理,生成与目标区域相对应的空间分辨率为TEMPsp的ASCII GRID格式的栅格数据,并在此基础上提取目标区域的坡度、坡向、高程信息;

e.坡度函数计算任一单元和八邻域单元间高程距离的变化的最大变化比率,即坡度值,地面平坦则坡度值较低,地势陡峭,则坡度值较高,其计算公式为:式中Slopedeg以角度表示的坡度值[0-90°],arctan为反正切函数, 表示水平变化率,为垂直变化率,其计算方法为:a b c

d e g

g h i

式中a~i为网格高程值,x_cell_size和y_cell_siz为网格纵横向大小,所述网格为正方形网格,即x_cell_size=y_cell_siz=GRIDi,j(TEMPsp)i=GRIDi,j(TEMPsp)j;

f.坡向按照顺时针方向从正北方0°到360°进行度量,坡向的值代表着斜坡面的方向,平坦的坡面没有方向,赋值为-1;

g.NDVI数据经拼接、裁剪、坐标变换、重采样与研究区域范围相对应,时间分辨率为TEMPtp与空间分辨率TEMPsp;

气温时间序列预测

h.首先对气温观测时间序列数据集进行自相关(ACF)和偏相关(PACF)分析,以相关性最大值确定预见期T;

i.对气温时间观测序列进行小波分解,分解为一系列的高低频成分{D1,D2,……,Dn,An},然后把分解得到的不同频率成分,分解的层次取决于序列的复杂性,考虑到计算效率的问题,n取值3层,小波函数采用DB小波系数族;

j.把{D1,D2,……,Dn,An}作为神经网络模型的输入部分,形成小波与神经网络的组合模型,即为k.把时刻通过质量控制的预测结果TEMPt+T纳入下一次样本集,对[(t+T)+T]时刻的气温值TEMP(t+T)+T做出预测,而样本总数不变,动态循环;

l.模型输出内容为STATIONid_date文本文件,并以“站点ID_时间”为文件名称;

气温空间化计算模拟

m.基于气温影响因子数据集与神经网络模型构建气温的空间化模拟模型,即式中:fANN为气温空间化分布式计算的人工神经网

络模型,TEMPi,j为 的温度,λi,j为网格点GRIDi,j的经度, 为纬度,zi,j为海拔高度,Gi,j为地形因子,包括坡度、坡向,Vi,j为地表覆盖,etc为其他与气温直接相关,并可获取的环境因子;

n.模型的输入内容为

的TXT文本文件,按照模型运行设置的数据集划分方案,依据不同的组合方式对气温与环境影响因子之间的关系进行学习模拟,以确定模型最优输入因子组合;

o.确定输入因子组合后,并且模拟结果满足预设评价指标时,把区域内全部网格点的环境因子值,按照上述m.确定的模式,逐一输入模型,即得到全区域范围的气温空间化数据,气温空间化计算模拟输出结果为GRIDi,j(λ, DATE,TEMP)的文本文件,可基于GIS软件,对TXT格式数据进行栅格数据转换,并进行多维可视化显示;

气温未来时空变化预测

p.气温未来时空变化预测将排除与时间密切相关的环境因子,则须修正气温空间化模型,即气温的未来空间变化预测模型为q.模型的输入内容为STATIONid文本格式,按照不同的组合方式确定模型最优输入,以确定模型最优输入因子组合;

r. 的预测输出数据集与观测数据整体作为修

正后的空间化模型总体样本集,按照最优组合进行空间趋势预测模拟,从而生成气温的未来变化时空数据集;

q.模型输出结果为GRIDi,j格式的文本文件,可基于GIS软件,对这些数据结果进行栅格数据转换,并进行多维可视化显示;

气温时空数据集使用

t.已完全生成气温的时空数据集,对于任意一网格点的温度数据可通过纬度λ和经度查询,对于站点的查询则可以利用站点ID进行快速查询,按照具体应用情况转换为所需的数据格式文档;

模型设置与控制

w.人工神经网络模型采用三层神经网络模型,各层都有一个连接权重矩阵 其中上标表示i1,j1层之间的权重矩阵和偏差bi,通常将输入部分成为输入层,第一层和第二层也称为隐含层,第三层作为网络的输出称为输出,则神经网络的输出矢量为:a3=f3(LW3,2f2(LW2,1f1(LW1,1+b1)+b2)+b3)x.所述人工神经网络模型的数据集按照70%,15%,15%的比例进行划分,其中70%为训练样本集,15%为检验样本集,15%为测试样本集;

y.对输入数据的进行归一化处理,消除原始数据量纲和取值范围不同的影响,其变换公式为:式中,S为原始数据集序列;Smin,Smax分别是原始数据集中的最小值和最大值;S’为归一化后的数据序列,S’min,S’max为归一化数据序列的最大值与最小值,公式中S’min=﹣1,S’max=1;

z.模型评价指标为用平均绝对误差MAE、平均相对误差MRE与均方根误差RMSE为检验精度的标准;MRE和MAE是一种直观的精度评价方法,它直观地反映出样本数据估值的总体误差或精度水平,而RMSE反映出样本数据的估值灵敏度和极值,其分别定义为:注:Oi为观测值,Si为模拟值,N为点值个数

当模型通过符合预期模型评价指标时,即可开展该区域气温时空数据产品的自动化制备。

说明书 :

一种地面观测气温时空数据集的制备方法

技术领域

[0001] 本发明涉及地学领域数据挖掘、数据融合与数据制备领域,具体的说,是一种地面观测气温时空数据集的制备方法。

背景技术

[0002] 气温对人类与自然系统有着重要的影响,其作为反映地球表层系统热量状况的综合环境指数,不仅是参与自然地域系统界限划分的关键指标,也是地表陆面过程模型模拟的重要参数,因此气温被广泛地应用于全球变化研究的各个领域。
[0003] 根据已知地理空间的特性来探索未知地理空间的特性是许多地理研究的第一步,也是地理学的基本问题。现代社会对环境空间信息的需求日益广泛。高分辨率、栅格化的气温数据不仅是地学模拟的重要驱动数据,也是决策管理的重要信息来源,尤其是气候变化的空间数据信息,其对于区域水文、水资源分析以及区域水资源管理、旱涝灾害管理、生态环境治理都具有重要意义。
[0004] 气温数据来源于地面观测网络,例如气象站、水文站、生态观测站及一些临时采样点等,尽管这些站点总体上越来越密,然而受观测手段、资源配置、区域特征等方面的限制,我们不可能每个地理格网点(或带)都建立观测站点或者架设观测仪器,特别是偏远地区,地学观测站点分布十分稀疏,如西北五省区国家气象站点不足200个,因此我们一般只能得到离散的、分布不规则的、详尽程度不一的观测点(或采样点)数据。如何利用这些有限的站点去获得时空连续的地学变量并制备数据产品,是地学应用研究首要解决的问题,也是近年来国内外地学研究的重要课题之一。
[0005] 目前,在地学研究中对气温数据的研究集中于数学统计方法上,这些方法包括在时间序列上的传统模型如回归分析模型,自回归模型、滑动平均模型和一些统计指标,而在空间分布上,一般采用空间插值的方式对其分布特征与规律进行研究,比较常用的方法主要有泰森多边形方法、反距离权重法、径向基函数法、多项式插值法、及各种形式的克里格方法等。这些常规的模型对于非线性气温观测序列存在着局限性。传统的时间序列分析是从纯数学的角度来分析的,但是由于实际应用中时间序列具有不规则、混沌等非线性特征,很难对系统建立理想的模型,预测也显得无能为力,很难对于气温时间序列的变化趋势进行精确的把握,并且在时空分布上忽略了对其有重要影响的环境影响因子,制备的数据集空间变化上严重依赖于观测网格点值。
[0006] 此外许多研究人员尝试利用GCMs(Global Climate Models)或者RCMs(Regional Climate Models)模拟结果作为未来气候变化的情景模式,但是这些模式不仅存在着概念上的争论而且计算复杂,目前数据分辨率也很粗糙。
[0007] 随着社会的发展和科学技术的进步,科研、生产与生活对环境观测数据的精细化的需求越来越迫切,不仅需要高分辨率的栅格数据,而且对地学变量的未来趋势以及过去情景的数据资料也十分关注,然而现阶段的分析方法还难以提供上述所要求的时空尺度分辨率较高的数据产品,因此对地学数据进行时空研究势在必行。
[0008] 与此同时科研人员也不断提出新理论新方法,以克服气温数据中大量的不确定性和复杂性,其中小波分析与人工神经网络在地学研究中表现最为卓越,人工神经网络由于其具有自组织、自学习以及非线性逼近能力和小波分析的时频域聚焦能力,对时间序列的分析得到了有效的应用。这些方法仅针对环境观测要素的时空特性的某一方面进行了理论验证研究与应用,而未从系统上考虑方法间的有效耦合与集成,构成环境观测要素的时空分析系统,尤其是未来情境预测,至今还没有形成一种有效的地面观测气温时空数据集制备方法。

发明内容

[0009] 本发明所要解决的技术问题在于弥补现有技术不足,将新理论新方法应用于气温数据的数据挖掘中,其目的在于提供一种地面观测气温时空数据集的制备方法,应用该方法能够真实直观地反映气温的时空变化规律,结构清晰明了、易于实现。
[0010] 本发明的目的是采用以下技术方案解决上述技术问题。
[0011] 一种地面观测气温时空数据集的制备方法,其步骤是:
[0012] 1)数据准备与处理
[0013] 1.1).首先确定气温数据制备目标区域的边界范围、时间分辨率TEMPtp与空间分辨率TEMPsp,利用区域矢量边界数据制作区域的ASCII GRID格式的栅格本底数据,并标定每个网格单元的经度和纬度,即GRIDi,j(λ, )形式,其中i为行号,j为列号,λ为该网格中心点的经度, 为该网格中心的纬度;
[0014] 1.2). 收集整理研究区域内的全部气象观测站点的气温观测记录,并按照站点位置信息以及观测气温数值,制备内容为STATIONid(No,ID,DATE,λ, ,z,TEMP)的TXT格式文件,其中:No为观测记录编号,ID为世界气象组织WMO规划的气象站点唯一编码,DATE为观测记录时间,z为站点高程,TEMP为对应时间与地点的气温数值,文件名称为该站点的ID编号;
[0015] 1.3). 对区域全部站点的观测记录,进行序列长度对比分析,确定序列时间维度的模拟预测的分段划分方案,其时间序列划分方式在模型设置与控制中进行定义;
[0016] 1.4). 获取目标区域的数字高程模型( Digital Elevation Model,简称DEM)数据,首先利用STATIONid所包含的z值对其进行数据质量检验,对通过验证的数据,利用GIS软件通过拼接、裁剪、投影转换、重采样等预处理,生成与目标区域相对应的空间分辨率为TEMPsp的ASCII GRID格式的栅格数据,并在此基础上提取目标区域的坡度(Gslope)、坡向(Gaspect)、高程( z )信息;
[0017] 1.5). 坡度函数计算任一单元和八邻域单元间高程距离的变化的最大变化比率,即坡度值,地面平坦则坡度值较低,地势陡峭,则坡度值较高,其计算公式为:
[0018]
[0019] 式中Slopedeg以角度表示的坡度值[0-90°],arctan为反正切函数, 表示水平变化率, 为垂直变化率,其计算方法为:
[0020]
[0021]
[0022]
[0023] 式中a i为网格高程值,x_cell_size和y_cell_siz为网格纵横向大小,在本发明~中采用正方形网格,即x_cell_size = y_cell_siz=GRIDi,j(TEMPsp)i= GRIDi,j(TEMPsp)j;
[0024] 1.6). 坡向按照顺时针方向从0°(正北方)到360°进行度量,坡向的值代表着斜坡面的方向,平坦的坡面没有方向,赋值为-1 ;
[0025] 1.7). NDVI(Normalized Difference Vegetation Index,归一化植被指数)数据经拼接、裁剪、坐标变换、重采样与研究区域范围相对应,时间分辨率为TEMPtp与空间分辨率TEMPsp;
[0026] 2) 气温时间序列预测
[0027] 2.1)首先对气温观测时间序列数据集进行自相关(ACF)和偏相关(PACF)分析,以相关性最大值确定预见期T;
[0028] 2.2)  对气温时间观测序列进行小波分解,分解为一系列的高低频成分,然后把分解得到的不同频率成分,分解的层次取决于序列的复杂性,考虑到计算效率的问题,一般情况下n取值3层,小波函数采用DB小波系数族;
[0029] 2.3) 把 作为神经网络模型的输入部分,形成小波与神经网络的组合模型,即为
[0030] 2.4)把 时刻通过质量控制的预测结果TEMPt+T纳入下一次样本集,对[(t+T)+T]时刻的气温值TEMP(t+T)+T做出预测,而样本总数不变,动态循环;
[0031] 2.5) 模型输出内容为STATIONid_date(No,ID,DATE,λ, ,TEMP)的TXT文本文件,并以“站点ID_时间”为文件名称;
[0032] 3)气温空间化计算模拟
[0033] 3.1)基于气温影响因子数据集与神经网络模型构建气温的空间化模拟模型,即,式中:fANN为气温空间化分布式计算的人工神经网络模型,TEMPi,j为GRIDi,j(λi,j,i,j)的温度,λi,j为网格点GRIDi,j的经度,i,j为纬度,zi,j为海拔高度,Gi,j为地形因子(坡度、坡向等),Vi,j为地表覆盖,etc为其他与气温直接相关,并可获取的环境因子;
[0034] 3.2)模型的输入内容为STATIONid(No, ID, DATE, λ,  , z, Gslope, Gaspect, NDVI, etc)的TXT文本文件,按照模型运行设置的数据集划分方案,依据不同的组合方式对气温与环境影响因子之间的关系进行学习模拟,以确定模型最优输入因子组合;
[0035] 3.3)确定输入因子组合后,并且模拟结果满足预设评价指标时,把区域内全部网格点的环境因子值,按照上述3.2) 确定的模式和格式,逐一输入模型,即得到全区域范围的气温空间化数据,气温空间化计算模拟输出结果为GRIDi,j(λ, , DATE, TEMP)的文本文件,可基于GIS软件,对TXT格式数据进行栅格数据转换,并进行多维可视化显示;
[0036] 4) 气温未来时空变化预测
[0037] 4.1)气温未来时空变化预测将排除与时间密切相关的环境因子,则须修正气温空间化模型,即气温的未来空间变化预测模型为 ;
[0038] 4.2) 模型的输入格式为内容为STATIONid(No, ID, DATE, λ,  , z, Gslope, Gaspect) TXT文本格式,按照不同的组合方式确定模型最优输入,以确定模型最优输入因子组合;
[0039] 4.3) 的预测输出数据集与观测数据整体作为修正后的空间化模型总体样本集,按照最优组合进行空间趋势预测模拟,从而生成气温的未来变化时空数据集;
[0040] 4.4) 模型输出结果为GRIDi,j(No,λ, , DATE, TEMP)格式的文本文件,可基于GIS软件,对这些数据结果进行栅格数据转换,并进行多维可视化显示;
[0041] 5) 气温时空数据集使用
[0042] 已完全生成气温的时空数据集,对于任意一网格点的温度数据可通过纬度λ和经度 查询,对于站点的查询则可以利用站点ID进行快速查询,按照具体应用情况转换为所需的数据格式文档;
[0043] 6) 模型设置与控制
[0044] 6.1) 人工神经网络模型采用三层神经网络模型,各层都有一个连接权重矩阵,其中上标表示 层之间的权重矩阵和偏差 ,通常将输入部分成为输入层,第一层和第二层也称为隐含层,第三层作为网络的输出称为输出,则神经网络的输出矢量为:
[0045]
[0046] 其隐含层采用正切双弯曲转移函数(Tan-Sigmoid Transfer Function,TSTF),其定义为
[0047]
[0048] 6.2)本发明涉及的人工神经网络模型的数据集按照70%,15%,15%的比例进行划分,其中70%为训练样本集,15%为检验样本集,15%为测试样本集。
[0049] 对输入数据的进行归一化处理,消除原始数据量纲和取值范围不同的影响,其变换公式为:
[0050]
[0051] 式中,S为原始数据集序列;Smin,Smax分别是原始数据集中的最小值和最大值;S’为归一化后的数据序列,S’min,S’max为归一化数据序列的最大值与最小值,公式中S’min =﹣1,S’max = 1。
[0052] 模型评价指标为用平均绝对误差MAE、平均相对误差MRE与均方根误差RMSE作为检验精度的标准;MRE和MAE是一种比较直观的精度评价方法,它直观地反映出反映样本数据估值的总体误差或精度水平,而RMSE反映出样本数据的估值灵敏度和极值,其分别定义为:
[0053]
[0054]
[0055]
[0056] 注:Oi为观测值,Si为模拟值,N为点值个数
[0057] 当模型通过符合预期模型评价指标时,即可开展该区域气温时空数据产品的自动化制备。
[0058] 本发明的优点和产生的有效效果:
[0059] 本发明对气温数据进行了深度信息挖掘,实现了由多点气温观测记录到气温时空数据立方体的转变,由有限个观测点到任一网格点的数据扩展延伸。本发明在气温空间化上充分考虑了影响气温的众多环境因子,空间分辨率与数据制备范围可自定义,相对于常规空间插值模型相比更加合理、精确;在气温时间序列预测上建立的小波神经网络动态组合预测模型可以基于气温数据的变化特征,预测其未来变化趋势;通过两者的耦合,可生成气温未来时空变化的情景数据集。本发明有效地提高了气温时空分析挖掘的能力,为地区热量资源分析、农业生产建设、生态环境治理乃至全球变化深层次的地学研究提供良好的数据产品,此外该方法具有良好的扩展性,可推广到地学台站其他观测要素的时空数据产品制备与生产应用中。

附图说明

[0060] 图1为本发明一种地面观测气温时空数据集制备方法流程图;
[0061] 图2为本发明所涉及的数据结构与表达形式;
[0062] 图3为本发明所采用的三层神经网络模型示意图;
[0063] 图4为本发明实施例中国西北地区地形图与气象站点的空间分布;
[0064] 图5为本发明实施例中国西北地区各个年份气象站数目分布;
[0065] 图6为本发明实施例DEM与站点高程对比图(虚线为趋势线);
[0066] 图7为本发明实施例制备的中国西北地区气温环境因子数据库;
[0067] 图 8 本发明实施例中气温与环境影响因子相关性分析;
[0068] 图 9 本发明实施例生成的2001-2005年中国西北地区年均气温时空数据集,2006年为未来情景数据。

具体实施方式

[0069] 下面结合附图和具体实施方式对本发明进行详细说明:
[0070] 本发明公开了一种地面观测气温时空数据集的制备方法,包括以下部分:首先定义确定研究区域,形成本底栅格数据,对气温数据进行预处理,制备本底栅格数据,制备宏观地理因素(地理位置、地形、自然地理环境)与微观地理因素(坡度、坡向、小地形形态、植被、土壤、遮蔽度)等的驱动数据集,通过比较分析最终确定了经度、纬度、海拔(高程)、坡度、坡向与植被覆盖指数对温度空间分布重要的影响关系;其次构建小波神经网络动态预测模型,对气温在时间纬度上进行变化特性分析与趋势预测,在空间维度上利用多种环境因子驱动的人工神经网络模型对目标区域逐格点的计算气温数值,得出空间变化趋势;在此基础上可开展气温要素的时间数列集与空间数据集制备,并可对其时间维和空间维同时进行预测生成未来变化情景数据集。
[0071] 本发明在地面观测气温时空数据集制备时,其基本流程如图1所示,具体实施方案由以下步骤来实现:
[0072] 第一步:确定待制备气温时空数据集的区域范围与时空分辨率。本实施例以中国西北地区为研究区域,东经73°-112°,北纬31°-49°之间 (见图 4 ),气温数据制备时间范围为2001-2005年,并对2006年的年均气温变化情境做出预测,时间分辨率为年,空间分辨率为千米。该区域作为中国气候变化的敏感区和生态脆弱区,与其它地区相比,地貌类型复杂多样,气候变化非常复杂,影响因素众多,选择本例更能验证本发明方法的有效性。
[0073] 第二步:数据准备与制备
[0074] 1)中国形成区划图作为边界数据,并制备成ESRI公司的Shapefile格式,利用ArcGIS生成1km×1km的4227893个网格格点的栅格数据(见图7 Grid图层)。
[0075] 2)气温观测站点数据为中国气象科学数据共享网提供的中国西北地区地面气候资料月多要素数据集,利用自编程序,提取每个站点的年均气温,站点的空间位置信息,以站点ID为文件名生成格式为STATIONid(No,ID,DATE,λ, ,z,TEMP)格式的TXT文件,对其整理后共200个站点的数据集,数据集中存在着无效值、缺省值和空值。为了使数据序列具有分析意义,这些年份的数据采用多年气温均值进行代替。
[0076] 3)对本实施例气象台站的气温记录进行分析,各站点数据集并非等长,其最长记录长度为55年,最短记录长度为23年,数据集规则如下:设序列长度为n,则训练样本集为ROUND (n×0.70),检验样本集为ROUND (n×0.15),测试样本集为(n - ROUND (n×0.70)- ROUND (n×0.15)),ROUND为四舍五入函数。
[0077] 4)DEM数据采用来源于美国国家海洋和大气局的美国国家地球物理数据中心(NGDC,http://www.ngdc.noaa.gov/mgg/global/global.html) GLOBE项目提供的全球数字高程模型,利用ArcGIS软件从中获取中国西北地区的DEM数据,其空间分辨率为30″(约1km),基于Albers投影坐标系统,把原始数据重采样为1km×1km的格点数据(图7 DEM层)。
为了检验DEM数据的精度,基于气象站点坐标提取其对应的DEM高程,并与站点的高程值进
2
行对比,结果见图6,通过比较发现:两者呈较好的相关性,R =0.99,DEM的高程与气象站点的高程相差50m以内的格点占82%,相差100m的部分站7%,平均差值0.5m,基本可满足使用要求。
[0078] 5)按照本发明坡度,坡向制备方法,基于获取的DEM数据,利用ArcGIS软件获取该区域范围内的坡度坡向数据(图7 Slope与Aspect图层 )。
[0079] 6)NDVI采用EOS的极地轨道环境遥感卫星Terra的中分辨率成像光谱仪MODIS(Moderate-Resolution Imaging Spectroradiometer) MOD13A3(Vegetation Indices Monthly L3 Global 1km)产品,地面分辨率为1km,时间分辨率为月。NDVI数据经ENVI软件拼接、裁剪、坐标变换等与研究区时空尺度对应(图7 NDVI图层 )。
[0080] 第三步:中国西北地区气温时间序列模拟预测
[0081] 1)所有站点观测序列存在1年的滞后自相关,因此T = 1。选择2001年到2005年的年均气温,进行数据序列预测验证,并对2006年的西北地区年气温均值进行预测。
[0082] 2)利用Matlab软件对每个站点观测序列进行3层小波分解,小波函数选择db2,分解为一系列的高低频成分 。
[0083] 3)按照本发明2.3所述,中国西北地区时间序列分析模型即为
[0084] 4)模型参数设置为最小均方根误差且相关系数大于0.9,最大训练为1000次,对其2001-2006年的中国西北地区200个站点的气温值进行模拟预测,形成中国西北地区2001-
2006年年均气温时间序列预测集,进行保存(见表 1)
[0085] 表 1中国西北地区2001-2006年气温时间序列预测集
[0086]
[0087] 5)预报精度见表2,预测结果显示模型对气象站观测序列的整体模拟结果效果较好,绝对误差(MAE)均小于0.5°C,平均相对误差(MRE)在10%左右,均小于15%,均方根误差(RMSE)在0.5°C左右,相关系数R的平方值(R2)接近于1,因此该站点预测结果具有较高的可信度。
[0088] 表2 中国西北地区气象站点2001-2005年均气温时间序列预测结果评价分析[0089]
[0090] 第四步:中国西北地区年均气温空间化模拟
[0091] 1) 根据环境因子对气象的影响,进行相关分析,如图8所示,在空间位置中,经度主要涉及到离海的远近,而纬度主要考虑太阳辐射的角度对温度分布的影响。根据研究区域气象观测站点的温度分析可以看出,南北 (YZ) 方向存在着温度上升趋势,在东西(XZ)方向存着温度下降-上升的宽“U”型趋势。温度与高程呈显著的负相关(R=0.91),NDVI也具有明显的负相关表现,坡度、坡向与气温的关系较为复杂,难以用线性函数进行描述。按照本发明的 与所建立的气温相关的环境影响因子(经度,纬度,高程,坡度,坡向,NDVI),进行不同组合方案的模拟比较,以确定空间化产品制备方案,同时为了验证本发明方法在气温空间化方面的优越性,特与其他经典方法进行了对比。
[0092] 2) 模型结果详见表3,从表中我们可以看出随着高程对本区域气温空间分布的影响最为显著,其次是NDVI,坡度、坡向对整体的精度表现不明显,通过与常规插值方法的对比,从中可以看出所建立模型的优越性,特别是考虑所有环境因子影响的模型精度最高,本发明构建的空间模型总体上误差较低,按照评价指标,均有明显的优越性,在12种方案中,前四种最优模型均是基于本发明构建的模型。
[0093] 表3 中国西北地区气象站点2001-2005年均气温不同空间化模型结果评价分析[0094]
[0095] 3)基于上述结果中国西北地区年均气温空间化模型为 ,可以基于现有数据进行空间数据集制备生产,制备的数据结构如图9,中国西北地区2000-
2005年的年均气温空间数据集,并可直接应用科研、生产与生活中。
[0096] 4) 由于NDVI严重依赖于时间的变化,是与气温类似的时间变化序列,无法直接获取其未来变化数据,并且 与 从评价指标上相差不大,每个网格节点的空间位置几乎没有任何变化,具备长期预测条件,因此中国西北地区年均气温未来情境模型为 ,其中
按此模式可生成中国西北地区2006年年均气温的时空数据集,如图9 T2006。