融合深度学习和误差校正的径流概率性预测方法及系统转让专利

申请号 : CN202010045809.1

文献号 : CN111275253A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 朱双张海荣罗显刚徐战亚王超吴江丁晓玲林霏开肖祖香李建庆孟书令

申请人 : 中国地质大学(武汉)

摘要 :

本发明公开了一种融合深度学习和误差校正的径流概率性预测方法及系统,本发明提供的基于深度学习和高斯混合模型的径流概率性预测方法,能提供相比传统机器学习更高的径流预测精度。本发明提供的基于深度学习和高斯混合模型的径流概率性预测方法,能在深度学习基础上,提供概率性的预测结果。

权利要求 :

1.一种融合深度学习和误差校正的径流概率性预测方法,其特征在于,包含如下步骤:

(1)提取待预测河段水文站点的历史日径流量数据yi,计算当前日降序列与前期日降雨序列的相关系数,依据阈值截断法从前1至p天日径流量中提取相关性大于相关系数阈值的日径流量作为预测因子集Xi=(x1,x2,…,xn),n为因子个数,i表示天数,p为正整数且大于或者等于3;

(2)以预测因子集作为输入,当前日径流量作为输出,生成样本数据(yi,Xi),以q天的样本数据(yi,Xi)构成训练集,q>p;

(3)依据训练集训练深度人工神经网络模型DNN,建立DNN日径流预测模型

训练时以均方根误差为寻优目标;其中, 表示yi的预测值,fDNN表示模型函数;

(4)提取训练过程的DNN模型日径流模型所产生的预测结果,将预测序列与观测值序列相减,获得预报误差序列(5)提取预报误差et和预报误差et-1与et-2,构建误差样本,误差样本以et为输出,以et-1与et-2为输入,训练得到高斯混合模型et=GPR(et-1,et-2);其中,t∈i;

(6)假设当前为第l天,然后预测第l+1天的径流概率性,过程为:将Xl+1输入到步骤(3)所建立的DNN日径流预测模型 中,得到预测数据 然后获取el与el-1,输入到步骤(5)高斯混合模型et=GPR(et-1,et-2)中,得到el+1的el+1∈N(ul+1,σl+12),然后计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相加,生成最后的径流概率性预测;其中u表示均值,σ表示标准差,所述指定概率小于1。

2.根据权利要求1所述的融合深度学习和误差校正的径流概率性预测方法,其特征在于,所述待预测河段水文站点是指宜昌水文站,Xi为滞后1、2及3天的日径流量,此时n=3。

3.根据权利要求1所述的融合深度学习和误差校正的径流概率性预测方法,其特征在于,步骤(6)中,所述计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相加,生成最后的径流概率性预测,具体是指:计算高斯分布N(ul+1,σl+12)的95%置信区间[ul+1-1.96σl+1,ul+1+1.96σl+1],结合 与[ul+1-1.96σl+1,ul+1+1.96σl+1],得到校正后的径流预报概率分布

4.根据权利要求1所述的融合深度学习和误差校正的径流概率性预测方法,其特征在于,p=15。

5.根据权利要求1所述的融合深度学习和误差校正的径流概率性预测方法,其特征在于,步骤(3)中,所述深度人工神经网络模型DNN中,递归隐含层为1个,隐藏单元为50个。

6.一种融合深度学习和误差校正的径流概率性预测系统,其特征在于,包含如下模块:

预测因子集确定模块,用于提取待预测河段水文站点的历史日径流量数据yi,计算当前日降序列与前期日降雨序列的相关系数,依据阈值截断法从前1至p天日径流量中提取相关性大于相关系数阈值的日径流量作为预测因子集Xi=(x1,x2,…,xn),n为因子个数,i表示天数,p为正整数且大于或者等于3;

训练集构成模块,用于以预测因子集作为输入,当前日径流量作为输出,生成样本数据(yi,Xi),以q天的样本数据(yi,Xi)构成训练集,q>p;

DNN训练模块,用于依据训练集训练深度人工神经网络模型DNN,建立DNN日径流预测模型 训练时以均方根误差为寻优目标;其中, 表示yi的预测值,fDNN表示模型函数;

序列形成模块,用于提取训练过程的DNN模型日径流模型所产生的预测结果,将预测序列与观测值序列相减,获得预报误差序列高斯训练模块,用于提取预报误差et和预报误差et-1与et-2,构建误差样本,误差样本以et为输出,以et-1与et-2为输入,训练得到高斯混合模型et=GPR(et-1,et-2);其中,t∈i;

数据预测模块,用于假设当前为第l天,然后预测第l+1天的径流概率性,过程为:将Xl+1输入到步骤(3)所建立的DNN日径流预测模型 中,得到预测数据 然后获取el与el-1,输入到步骤(5)高斯混合模型et=GPR(et-1,et-2)中,得到el+1的el+1∈N(ul+1,σl+12),然后计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相加,生成最后的径流概率性预测;其中u表示均值,σ表示标准差,所述指定概率小于1。

7.根据权利要求6所述的融合深度学习和误差校正的径流概率性预测系统,其特征在于,所述待预测河段水文站点是指宜昌水文站,Xi为滞后1、2及3天的日径流量,此时n=3。

8.根据权利要求6所述的融合深度学习和误差校正的径流概率性预测系统,其特征在于,数据预测模块中,所述计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相加,生成最后的径流概率性预测,具体是指:计算高斯分布N(ul+1,σl+12)的

95%置信区间[ul+1-1.96σl+1,ul+1+1.96σl+1],结合 与[ul+1-1.96σl+1,ul+1+1.96σl+1],得到校正后的径流预报概率分布

9.根据权利要求6所述的融合深度学习和误差校正的径流概率性预测方系统,其特征在于,p=15。

10.根据权利要求6所述的融合深度学习和误差校正的径流概率性预测系统,其特征在于,DNN训练模块中,所述深度人工神经网络模型DNN中,递归隐含层为1个,隐藏单元为50个。

说明书 :

融合深度学习和误差校正的径流概率性预测方法及系统

技术领域

[0001] 本发明属于径流预测技术领域,更具体地,涉及一种融合深度学习和误差校正的径流概率性预测方法及系统。

背景技术

[0002] 可靠的河道流量预测对水资源管理、分配以及防灾减灾均具有重要意义,水文学者一直致力于研究高精度的日径流预测模型和方法。近几年来,深度学习技术在图像识别领域得到飞速的发展,其强大的数据挖掘能力解决了基于海量数据的分类、回归、和预测问题。日径流预测模型也开始从人工神经网络、支持向量机等传统机器学习发展到卷积神经网络、长短期记忆网络等深度学习方法,并获得了更好的预测结果。水文过程具有极大的不确定性,提供概率性的径流预测结果比单点预测更可信,尽管当前建立了越来越多的深度学习类径流预测模型,但是由于深度学习模型往往结构复杂,训练时间长,采用集合预报技术构建概率性径流预测困难较大。
[0003] 由此可见,现有技术还不能完全解决基于深度学习技术的概率性径流预测问题。

发明内容

[0004] 针对现有技术的以上缺陷或改进需求,本发明提供了融合深度学习和误差校正的径流概率性预测方法及系统,由此解决现有深度学习技术概率性径流预测技术问题。
[0005] 根据本发明的其中一方面,本发明解决其技术问题所采用的融合深度学习和误差校正的径流概率性预测方法,包含如下步骤:
[0006] (1)提取待预测河段水文站点的历史日径流量数据yi,计算当前日降序列与前期日降雨序列的相关系数,依据阈值截断法从前1至p天日径流量中提取相关性大于相关系数阈值的日径流量作为预测因子集Xi=(x1,x2,…,xn),n为因子个数,i表示天数,p为正整数且大于或者等于3;
[0007] (2)以预测因子集作为输入,当前日径流量作为输出,生成样本数据(yi,Xi),以q天的样本数据(yi,Xi)构成训练集,q>p;
[0008] (3)依据训练集训练深度人工神经网络模型DNN,建立DNN日径流预测模型训练时以均方根误差为寻优目标;其中,表示yi的预测值,fDNN表示模型函数;
[0009] (4)提取训练过程的DNN模型日径流模型所产生的预测结果,将预测序列与观测值序列相减,获得预报误差序列
[0010] (5)提取预报误差et和预报误差et-1与et-2,构建误差样本,误差样本以et为输出,以et-1与et-2为输入,训练得到高斯混合模型et=GPR(et-1,et-2);其中,t∈i;
[0011] (6)假设当前为第l天,然后预测第l+1天的径流概率性,过程为:将Xl+1输入到步骤(3)所建立的DNN日径流预测模型 中,得到预测数据 然后获取el与el-1,输入到步骤(5)高斯混合模型et=GPR(et-1,et-2)中,得到el+1的el+1∈N(ul+1,σl+12),然后计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相加,生成最后的径流概率性预测;其中u表示均值,σ表示标准差,所述指定概率小于1。
[0012] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测方法中,所述待预测河段水文站点是指宜昌水文站,Xi为滞后1、2及3天的日径流量,此时n=3。
[0013] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测方法中,步骤(6)中,所述计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相2
加,生成最后的径流概率性预测,具体是指:计算高斯分布N(ul+1,σl+1)的95%置信区间[ul+1-1.96σl+1,ul+1+1.96σl+1],结合 与[ul+1-1.96σl+1,ul+1+1.96σl+1],得到校正后的径流预报概率分布
[0014] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测方法中,p=15。
[0015] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测方法中,步骤(3)中,所述深度人工神经网络模型DNN中,递归隐含层为1个,隐藏单元为50个。
[0016] 根据本发明的另一方面,本发明为解决其技术问题,所提供的融合深度学习和误差校正的径流概率性预测系统包含如下模块:
[0017] 预测因子集确定模块,用于提取待预测河段水文站点的历史日径流量数据yi,计算当前日降序列与前期日降雨序列的相关系数,依据阈值截断法从前1至p天日径流量中提取相关性大于相关系数阈值的日径流量作为预测因子集Xi=(x1,x2,…,xn),n为因子个数,i表示天数,p为正整数且大于或者等于3;
[0018] 训练集构成模块,用于以预测因子集作为输入,当前日径流量作为输出,生成样本数据(yi,Xi),以q天的样本数据(yi,Xi)构成训练集,q>p;
[0019] DNN训练模块,用于依据训练集训练深度人工神经网络模型DNN,建立DNN日径流预测模型 训练时以均方根误差为寻优目标;其中,表示yi的预测值,fDNN表示模型函数;
[0020] 序列形成模块,用于提取训练过程的DNN模型日径流模型所产生的预测结果,将预测序列与观测值序列相减,获得预报误差序列
[0021] 高斯训练模块,用于提取预报误差et和预报误差et-1与et-2,构建误差样本,误差样本以et为输出,以et-1与et-2为输入,训练得到高斯混合模型et=GPR(et-1,et-2);其中,t∈i;
[0022] 数据预测模块,用于假设当前为第l天,然后预测第l+1天的径流概率性,过程为:将Xl+1输入到步骤(3)所建立的DNN日径流预测模型 中,得到预测数据 然后获
取el与el-1,输入到步骤(5)高斯混合模型et=GPR(et-1,et-2)中,得到el+1的el+1∈N(ul+1,σl+12),然后计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与 相加,生成最后的径流概率性预测;其中u表示均值,σ表示标准差,所述指定概率小于1。
[0023] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测系统中,所述待预测河段水文站点是指宜昌水文站,Xi为滞后1、2及3天的日径流量,此时n=3。
[0024] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测系统中,数据预测模块中,所述计算高斯分布N(ul+1,σl+12)的指定概率的置信区间,然后将该置信区间与2
相加,生成最后的径流概率性预测,具体是指:计算高斯分布N(ul+1,σl+1)的95%置信区间[ul+1-1.96σl+1,ul+1+1.96σl+1],结合 与[ul+1-1.96σl+1,ul+1+1.96σl+1],得到校正后的径流预报概率分布
[0025] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测系统中,p=15。
[0026] 进一步地,在本发明的融合深度学习和误差校正的径流概率性预测系统中,DNN训练模块中,所述深度人工神经网络模型DNN中,递归隐含层为1个,隐藏单元为50个。
[0027] 实施本发明的融合深度学习和误差校正的径流概率性预测方法及系统,具有以下有益效果:(1)本发明提供的基于深度学习和高斯混合模型的径流概率性预测方法,能提供相比传统机器学习更高的径流预测精度。(2)本发明提供的基于深度学习和高斯混合模型的径流概率性预测方法,能在深度学习基础上,提供概率性的预测结果。

附图说明

[0028] 下面将结合附图及实施例对本发明作进一步说明,附图中:
[0029] 图1是本发明的融合深度学习和误差校正的径流概率性预测方法一实施例的流程图;
[0030] 图2是相关性大小示意图;
[0031] 图3是不同递归隐含层和不同隐藏单元下,MSE的大小示意图;
[0032] 图4是预测值序列与观测值序列的对比图;
[0033] 图5是预测效果与观测值的对比图。

具体实施方式

[0034] 为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
[0035] 本发明的融合深度学习和误差校正的径流概率性预测系统与本发明的方法对应,下述将对本发明的融合深度学习和误差校正的径流概率性预测方法进行详细说明,融合深度学习和误差校正的径流概率性预测系统可参考方法的具体实施例。
[0036] 本发明实施例以长江流域宜昌水文站日径流预测为例。长江全长6380公里,总面积为1808500平方公里,对中国的经济发展和生态环境保护起着至关重要的作用。宜昌水文站是长江上游最重要的控制性站点,宜昌以上流域左岸主要有嘉陵江、雅砻江、岷江,右岸有乌江汇入。三峡水库(TGR)是当今世界上最大的水电工程,位于宜昌水文站下游。以宜昌水文站的日径流预测为例验证所提出的融合深度学习和高斯混合模型的径流概率性预测方法性能。
[0037] 参考图1,图1是本发明的融合深度学习和误差校正的径流概率性预测方法一实施例的流程图。本实施例提供的基于状态空间和联合分布的干旱多级预测方法的流程,具体包括如下步骤:
[0038] (1)选取宜昌水文站前期1-15天的日径流量,利用皮尔逊相关系数计算当前日降序列与前期1-15天日降雨序列的相关系数,参考图2,随着时滞的增加,相关性下降,超过3天其下降速度加快,滞后1、2、3天的日径流流量大于预设的阈值,因此,采用滞后1、2、3天的流量作为预测因子,形成预测因子集Xi=(x1,x2,x3)。
[0039] (2)为了对本发明的测试效果进行验证,本实施例提取宜昌水文站历史日径流量序列(2004年1月1日至2010年12月31日)进行了研究。日径流量的前五年的样本数据(2004年至2008年)作为训练集,后两年的样本数据(2009年至2010年)用于测试集。
[0040] (3)依据训练集训练深度人工神经网络模型DNN,建立DNN日径流预测模型训练时以均方根误差(MSE)为寻优目标;其中,表示yi的预测值,fDNN表示模
型函数。对深度人工神经网络模型DNN进行了1层、2层、3到100个隐藏单元的训练,确定DNN隐藏结构。为了获得更好的泛化效果,本实施例采用了交叉验证的方法。通过一个和两个隐藏层上的收敛过程,发现一个隐含层要优于两个隐含层。然后对1个隐含层和3-100个隐含单元的结构进行测试,发现当隐藏单元数为50时,MSE最小,因此本实施例确定了深度人工神经网络模型DNN的结构,1个递归隐含层和50个隐藏单元,具体可参考图3,其中图3中左侧为1层、2层递归隐含层的对比图,右侧为不同隐含单元的对比图。
[0041] (4)提取训练过程的DNN模型日径流模型所产生的预测结果,将预测序列与观测值序列相减,获得预报误差序列 参考图4,其为预测值序列与观测值序列的对比图。
[0042] (5)提取预报误差et和预报误差et-1与et-2,构建误差样本,误差样本以et为输出,以et-1与et-2为输入,通过这些误差样本训练得到高斯混合模型et=GPR(et-1,et-2);其中,t∈i。
[0043] 高斯混合模型是一种常用的监督学习方法,其预测结果不仅包含该点的值,而同时包含该点的边际分布,因此可以解决回归和概率问题,高斯混合模型的介绍可参见文献[1][2]。以训练期误差数据集建立模型后,可以依据前期误差et-1与et-2,预测出当前误差et的高斯概率分布。其中,文件[1]为Williams,C.K.I.:Prediction with Gaussian processes:From linear regression to linear prediction and beyond.In Jordan,M.I.,ed.:Learning in Graphical Models.Kluwer Academic(1998)599–621,文献[2]为MacKay,D.J.C.:Gaussian processes—a replacement forsupervised neural networks?Tutorial lecture notes for NIPS 1997(1997)。
[0044] (6)用于假设当前为第l天,然后预测第l+1天的径流概率性,过程为:将Xl+1输入到步骤(3)所建立的DNN日径流预测模型 中,得到预测数据 然后获取el与el-1,输入到步骤(5)高斯混合模型et=GPR(et-1,et-2)中,得到el+1的el+1∈N(ul+1,σl+12),然后计算高斯分布N(ul+1,σl+12)的95%置信区间[ul+1-1.96σl+1,ul+1+1.96σl+1],结合 与[ul+1-
1 .9 6σl+ 1 ,u l+ 1 +1 .96σl + 1] ,得到 校正 后的 径 流预 报 概率 分 布[0045] 本实施例将2009年至2010年的测试集采用步骤(6)中的方法进行预测,并与观测值进行比对,得出的对比图见图5。
[0046] 将基于深度学习和高斯混合分布的概率性径流预测方法和常用机器学习径流预测方法(ANN)的预测性能做比较,如下表,本发明提出的方法确定性系数最高(R2),平均相对误差(MRE)、均方根误差最小(RMSE),证明了本方法能有效提高径流预测精度,同时提供概率性预测区间
[0047]   R2 MRE RMSE本方法 0.95 0.09 2206
ANN 0.91 0.11 2918
[0048] 当通过以上实例的验证可以认为,本方法能够精确预测日径流及其概率,可以推广应用。
[0049] 上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。