一种基于雷达降雨数据挖掘的雨量站观测网络设计方法转让专利
申请号 : CN202011623796.8
文献号 : CN112633595B
文献日 : 2021-07-23
发明人 : 王一欣 , 戴强 , 刘航 , 庄汉宸 , 张书亮
申请人 : 南京师范大学
摘要 :
权利要求 :
1.一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,具体方法如下:
(1)获取研究区域在一段时间内N个降雨事件的降雨数据;
(2)对步骤(1)所述N个降雨事件的降雨数据均进行主成分分析,由此得到每一个降雨事件所对应的主成分方差,进而确定已有雷达降雨观测格网的冗余度是否符合要求;若该冗余度符合要求,则将已有雷达降雨观测格网的数量作为雨量站观测格网的最佳数量,执行步骤(4);否则,执行步骤(3),确定雨量站观测格网的最佳数量;
(3)分别对N个降雨事件迭代计算主成分方差,由此得到每一个降雨事件的最佳主成分个数;在N个降雨事件的最佳主成分个数中选择主成分个数最多的值作为雨量站观测格网的最佳数量M;
(4)使用k‑means聚类分析,将雷达降雨观测格网分配到聚类子集中;
(5)在每个聚类子集中均保留一个雷达降雨观测格网作为最佳雨量站观测格网位置,并设置雨量站观测格网的中心为雨量站最佳位置,得到雨量站观测网络;
(6)对步骤(5)所述得到的雨量站观测网络进行判断;若判断结果为合格,则表示雨量站观测网络符合要求;否则,表示雨量站观测网络不符合要求,返回步骤(3)重新确定雨量站观测格网的最佳数量。
2.根据权利要求1所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(1)的方法具体如下:获取研究区域在一段时间内N个降雨事件的降雨数据;其中,每一个降雨事件均得到已有雷达降雨观测格网的p次观测降雨数据;每一个降雨事件的降雨数据均用数据集X=[X1,T
X2,...,Xn] 表示;其中,Xi=[yi1,yi2,yi3,...,yip],Xi表示数据集X的第i行,即第i个雷达降雨观测格网的降雨观测数据;p表示观测次数;yip表示第i个雷达降雨观测格网的第p次观测数据值;n表示研究区域已有雷达降雨观测格网数。
3.根据权利要求2所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(2)中任意一个降雨事件通过主成分分析,得到相应的主成分方差的具体方法如下:
(2.1)将数据集X进行归一化,使数据集X的每一行减去其对应的期望值,得到归一化后的数据集X′;计算公式:
Xi′=Xi‑E(Xi)
式中,X′表示数据集X归一化后的数据集;Xi′表示数据集X′的第i行;Xi为数据集X的第i行,即第i个雷达降雨观测格网的降雨观测数据;E(Xi)为Xi的期望值;
(2.2)对归一化后的数据集X′计算得到协方差矩阵C;其中协方差矩阵C的第(i,j)项的计算公式如下:
∑i,j=cov(Xi′,Xj′)=E[(Xi′‑μi)·(Xj′‑μj)]式中,Xi′表示数据集X′的第i行;Xj′表示数据集X′的第j行;μi表示Xi′的期望值;μj表示Xj′的期望值;
(2.3)对协方差矩阵C进行特征值分解,并计算其相应的特征向量,将特征值按照降序排列,同时特征值对应的特征向量作为列向量组成特征向量矩阵;
其中,特征值分解公式为:
[C‑λiI]=0
式中,λi为特征值,0<i≤n,同时也是第i主成分的方差;I为单位矩阵;
特征向量计算公式为:
FiC=λiC
T
式中,Fi=[fi,1,fi,2,…fi,n]表示特征值λi对应的特征向量。
4.根据权利要求3所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(2)确定已有雷达降雨观测格网的冗余度是否符合要求,具体方法如下:(2.4)分别对N个降雨事件计算方差贡献率以及累计方差贡献率;
其中,降雨事件的第i主成分方差贡献率通过该降雨事件的第i个特征值除以该降雨事件的所有特征值的和得到,即
累计方差贡献率是通过该降雨事件的前i个主成分方差贡献率之和得到;
(2.5)预设累计方差贡献率阈值范围,当达到累计方差阈值范围时,分别计算N个降雨事件的主成分个数;
(2.6)将步骤(2.5)所述N个降雨事件的主成分个数分别与已有雷达降雨观测格网的数量进行比较,统计主成分个数小于已有雷达降雨观测格网数量的降雨事件数m;
若 则表示已有雷达降雨观测格网的冗余度不符合要求,执行步骤(3),确定设计雨量站观测格网的最佳数量;否则表示已有雷达降雨观测格网的冗余度符合要求,不执行步骤(3),将已有雷达降雨观测格网的数量作为雨量站观测格网的最佳数量,即M=n;其中,M为雨量站观测格网的最佳数量;n表示研究区域已有雷达降雨观测格网数。
5.根据权利要求4所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(3)对任意一个降雨事件迭代计算主成分方差,得到该降雨事件的最佳主成分个数的方法具体如下:
(3.1)迭代初始化,设置k=1;
其中,k表示最佳主成分个数;
(3.2)计算前k个主成分的累计方差贡献率;
(3.3)判断步骤(3.2)所述前k个主成分的累计方差贡献率是否小于方差阈值;所述方差阈值是根据主成分方差曲线设置得到的;
若前k个主成分的累计方差贡献率小于方差阈值,k=k+1,返回步骤(3.2)重新计算前k个主成分的累计方差贡献率;否则,得到最佳主成分个数k。
6.根据权利要求1所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(4)的具体方法如下:(4.1)将研究区域内已有雷达降雨观测网络随机分为M组,并将每一组的中心位置设置为该组的质心,即聚类质心,完成初始化;
(4.2)通过欧式距离计算研究区域内已有雷达降雨观测格网的中心与聚类质心之间的距离,并按照距离大小将雷达降雨观测格网分配到最近的聚类中;
(4.3)按照距离将研究区域内所有雷达降雨观测格网均分配到最近的聚类之后,对聚类质心进行更新,将新的聚类的中心位置设为该聚类的质心;
(4.4)重复步骤(4.2)‑(4.3),直至新的质心与原质心距离小于阈值或计算迭代时间结束,由此将研究区域的已有雷达降雨观测格网全部分配到聚类子集中。
7.根据权利要求1所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(5)所述在每个聚类子集中均保留一个雷达降雨观测格网作为最佳雨量站观测格网位置,方法具体包括:
第一方法:分别对聚类中的每一个雷达降雨观测格网计算p次观测降雨数据的平均值,获得各雷达降雨观测格网的平均值,从中选择平均值最大的雷达降雨观测格网作为最佳雨量站观测格网位置;
第二方法:分别对聚类中的每一个雷达降雨观测格网计算p次观测降雨数据的平均值,获得各雷达降雨观测格网的平均值;根据各雷达降雨观测格网的平均值对各雷达降雨观测格网进行降序排列,将排在中间位置的雷达降雨观测格网作为最佳雨量站观测格网位置;
若中间位置的雷达降雨观测格网有两个,则在其中任意选择一个雷达降雨观测格网作为最佳雨量站观测格网位置。
8.根据权利要求1所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,步骤(6)的具体方法如下:通过皮尔逊相关系数和纳什‑苏克利夫系数判断步骤(5)得到的最佳雨量站观测格网位置是否符合要求;
预先设置系数阈值,若计算得到的皮尔逊相关系数和纳什‑苏克利夫系数均大于其对应的阈值,则表示步骤(5)所述雨量站观测网络符合要求;
否则,表示步骤(5)所述雨量站观测网络不符合要求,返回步骤(3)重新确定雨量站观测格网的最佳数量。
9.根据权利要求8所述的一种基于雷达降雨数据挖掘的雨量站观测网络设计方法,其特征在于,皮尔逊相关系数关系式:式中,Rm为利用步骤(5)所述雨量站观测网络观测得到的降雨量;Ro为已有雷达降雨观测网络观测得到的降雨量; 为皮尔逊相关系数;
纳什‑苏克利夫系数表达式:
t t
式中,Rm 为利用步骤(5)所述雨量站观测网络在t时刻观测得到的降雨量;RO为已有雷达降雨观测网络在t时刻观测得到的降雨量。
说明书 :
一种基于雷达降雨数据挖掘的雨量站观测网络设计方法
技术领域
背景技术
减少。因此,需要一种有效可行的雨量站网络设计方案,以最少的雨量站获取最大的降雨信
息。
则或考虑因素,包括确定雨量站数量及其位置,流域的性质,地形影响,排水方式,拟议地点
的可及性和适用性,仪表的安装和维护成本,网络的应用目的和区域气候。此外,为了代表
高变异性和间歇性的降雨模式,雨量站网络设计一般都十分密集。定量分析的雨量站网络
设计通常基于分析可用的有限雨量站信息或复制成熟的网络。使用的方法有许多,比如空
间相关性,变异函数分析和熵论;或使用统计技术,例如方差减少算法,状态空间随机模型
和广义最小二乘法。但由于这些方法的性质和各个地区的条件差异,这些方法难以实施且
经常需要主观调整参数,同时它们需要用所有可能的候选网络来探索最佳方法,成本较高。
发明内容
T
[X1,X2,...,Xn]表示;其中,Xi=[yi1,yi2,yi3,...,yip],Xi表示数据集X的第i行,即第i个雷
达格网的降雨观测数据;p表示观测次数;yip表示第i个雷达格网的第p次观测数据值;n表示
研究区域已有雷达降雨观测格网数。
若该冗余度符合要求,执行步骤(4);否则,执行步骤(3);
网的最佳数量M;
雨量站格网的最佳数量。
行步骤(3),将已有雷达降雨观测格网的数量作为雨量站格网的最佳数量,即M=n;其中,M
为雨量站格网的最佳数量;n表示研究区域已有雷达降雨观测格网数;
主成分分析,得到每一个降雨事件所对应的主成分方差,进而确定出已有雷达降雨观测格
网的冗余度是否符合要求;
位置的雷达网格作为最佳网格位置;若中间位置的雷达网格有两个,则在其中任意选择一
个雷达网格作为最佳网格位置;其中,所述最佳网格位置的中心即为最佳雨量站位置。
特征,可以在较大尺度上指导设计雨量站的布设网络;本发明充分考虑实际需求,设计得到
的区域雨量站观测网络能够保证使用最少的雨量站得到相对最多的降雨信息,为雨量站的
减少带来的降雨信息的缺失提供了一种新的解决方法;同时本发明所述评估雨量站观测网
络的方法可以广泛应用于其他观测网络的设计评估。
附图说明
具体实施方式
范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所
属领域技术人员所理解的通常意义。下面结合附图与具体实施例对本发明的做进一步详细
说明:
T
[X1,X2,...,Xn]表示;其中,Xi=[yi1,yi2,yi3,...,yip],Xi表示数据集X的第i行,即第i个雷
达格网的降雨观测数据;p表示观测次数;yip表示第i个雷达格网的第p次观测数据值;n表示
研究区域已有雷达降雨观测格网数。
数据集;
冗余度符合要求,执行步骤(4);否则,执行步骤(3);
行步骤(3),将已有雷达降雨观测格网的数量作为雨量站格网的最佳数量,即M=n;其中,M
为雨量站雨量站格网的最佳数量,n表示研究区域已有雷达降雨观测格网数;
究区域内的N=373个降雨事件中随机选择10个降雨事件,根据步骤(2)所述方法判断已有
雷达降雨观测格网数的冗余度是否符合要求;参考图2,对于大多数事件而言,第一个主成
分已经携带了接近90%的总方差,第二个主成分方差和超过95%;这说明该网络的冗余度
非常高,不符合要求,执行步骤(3);
网的最佳数量M;
主成分 1 1 1 2 3 3 6 12
位置的雷达网格作为最佳网格位置;若中间位置的雷达网格有两个,则在其中任意选择一
个雷达网格作为最佳网格位置;
能够较好的保留原始雷达网络的主要降雨信息,均符合要求;但是两种方法下的皮尔逊相
关系数相差较小,而第二方法下的纳什‑苏克利夫系数相较于第一方法下的纳什‑苏克利夫
系数更接近于1,表示在该实施例中第二方法相较于第一方法更优。
终设计得到的雨量站观测网络验证通过。