一种基于贝叶斯回归的多来源降雨数据融合算法及装置转让专利
申请号 : CN202110251215.0
文献号 : CN112612995B
文献日 : 2021-07-09
发明人 : 包申旭 , 杨盼 , 杨思原
申请人 : 武汉理工大学
摘要 :
权利要求 :
1.一种基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,包括:获取至少一个地点位置的观测数据,其中,所述观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
根据所述雷达回波强度数据,建立估算降雨强度的线性方程;
根据所述线性方程对应的随机误差系数,确定对应的变差函数;
根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量;
通过贝叶斯公式对所述第一向量进行估计,确定对应的似然函数,并通过所述似然函数的正态分布,结合所述降雨站监测数据以及所述众包监测数据的不确定性,将所述第一向量转换为第二向量;
通过拉普拉斯近似的方法,求解所述第二向量的最优值,并带入所述估算降雨强度的线性方程,确定降雨强度估计值;
其中,所述通过所述似然函数的正态分布,结合所述降雨站监测数据以及所述众包监测数据的不确定性,将所述第一向量转换为第二向量包括:假设所述似然函数服从正态分布,通过如下公式表示:其中,表示第 个地点位置对应的观测值, 表示所述似然函数的正态分布,表示给定所述似然函数的正态分布时第 个地点位置对应的观测值 的似然函数值,M表示所述地点位置的总数目, 表示所述至少一个地点位置的观测数据形成的观测值集合, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测值 对应的似然函数值之和;
根据所述正态分布,确定第 个地点位置对应的第二期望值和第二标准偏差,通过如下公式表示:
其中, 表示所述第二期望值,表示第 个地点位置对应的雷达强度,所述雷达强度根据所述雷达回波强度数据而确定,所述线性方程的回归系数包括第一回归系数和第二回归系数, 表示所述第一回归系数, 表示所述第二回归系数, 表示第一期望值,表示所述第二标准偏差, 表示所述第二标准偏差 的近似值,ζ为第一常数,表示所述众包监测数据确定的观测值相对于所述降雨站监测数据确定的观测值更大的不确定性, 表示第 个地点位置对应的观测值 来自于所述降雨站监测数据, 表示第 个地点位置对应的观测值 来自于所述众包监测数据;
根据所述第一常数ζ,以及所述第一向量中的所述第一回归系数 、所述第二回归系数、第一取值系数 、第二取值系数 、极限距离 ,共同构成所述第二向量,其中,所述第一取值系数 、所述第二取值系数 为所述变差函数的取值系数,所述极限距离 为所述变差函数趋近于极限值时所对应的极限距离。
2.根据权利要求1所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述获取至少一个地点位置的观测数据包括:针对预设时间段,根据空间位置,确定所述众包监测数据、所述降雨站监测数据对应的所述雷达回波强度数据;
针对所述至少一个地点位置,构建对应的所述众包监测数据、所述降雨站监测数据以及所述雷达回波强度数据之间的映射关系。
3.根据权利要求2所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述估算降雨强度的线性方程通过如下公式表示:其中,表示地点位置的坐标对应的降雨强度估计值,表示所述地点位置的坐标对应的所述雷达强度, 表示所述第一回归系数, 表示所述第二回归系数,表示所述随机误差系数。
4.根据权利要求3所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述随机误差系数的第一期望值和第一标准偏差通过如下公式表示:其中, 表示所述第一期望值,表示所述第一标准偏差, 表示第 个地点位置对应的所述降雨站监测数据或所述众包监测数据的残差,M表示所述地点位置的总数目,表示第 个地点位置对应的加权值, 是所述变差函数的极限值, 表示坐标 对应的地点位置与第 个地点位置形成的所述变差函数。
5.根据权利要求4所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述变差函数的取值系数包括所述第一取值系数和所述第二取值系数,所述变差函数通过如下公式表示:
其中, 表示第 个地点位置与第j个地点位置形成的所述变差函数,表示所述第一取值系数,表示所述第二取值系数, 表示第 个地点位置与第j个地点位置之间的距离, 为变差函数趋近于所述极限值 时所对应的所述极限距离,其中,当所述距离趋近于无穷时,所述极限值 取值 。
6.根据权利要求5所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量包括:
根据所述第一回归系数 、所述第二回归系数 、所述第一取值系数 、所述第二取值系数 、所述极限距离 ,构成所述第一向量。
7.根据权利要求6所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述通过贝叶斯公式对所述第一向量进行估计通过如下公式表示:其中,θ表示所述第一向量, 表示所述至少一个地点位置的观测数据形成的观测值集合,对应于M个所述观测数据, 表示给定所述观测值集合 时所述第一向量θ的后验分布, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测值 对应的似然函数值之和, 表示所述第一向量θ的先验分布, 表示所述观测值集合 的先验分布。
8.根据权利要求7所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述通过拉普拉斯近似的方法,求解所述第二向量的最优值包括:根据所述第二向量的局部最优值,将后验分布 最大化;
确定最大化的后验分布在所述局部最优值处的二次泰勒展开式;
根据所述最大化的后验分布的海森矩阵,确定对应的拉普拉斯近似值函数;
根据所述拉普拉斯近似值函数的均值,确定所述第二向量的最优值。
9.一种基于贝叶斯回归的多来源降雨数据实时融合装置,其特征在于,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现根据权利要求1‑
8任一项所述的基于贝叶斯回归的多来源降雨数据融合方法。
说明书 :
一种基于贝叶斯回归的多来源降雨数据融合算法及装置
技术领域
背景技术
可以模拟分析现有管网的排水能力,确定管网排水能力不足的“瓶颈”段,同时依据模拟结
果预先测出设计改造方案的实际效果,通过分析对比经济性指标,可获得合理经济的方案。
但是SWMM模型的目前主要应用于对已有管网的模拟分析和已有管网改造方案对比。目前,
雨水管网设计主要是人工雨水管网设计,它基于极限暴雨强度所计算的流量,凭经验采用
反复查阅水力计算表的方法对管段的管径和坡度等进行人为的调整,以获得较经济合理的
设计。该人工雨水管网设计方法计算量大,且计算结果精确度较低。这种人工雨水管网设计
方法的水力计算过程基于静态的明渠流公式,假定下游可以自由出流,水力计算过程孤立,
管网的设计过程完全忽略了下游管道的水力流动状况,难以体现管网的实际通洪效果,以
至于产生局部瓶颈现象,导致内涝的发生。也就是说:现有雨水管网设计方法的静态化的计
算过程难以满足城市建设和环境保护的需求。
雨站,雷达降雨数据有高覆盖率的优点,但雷达所测降雨通常存在系统性偏差,本身误差及
不确定性也较大;降雨站监测误差小,但是站点分布稀疏,难以提供高分辨率空间信息,所
以得不出准确的实时降雨强度估算。
方式鼓励市民利用低成本物联网传感器进行降雨监测,覆盖范围极大,密度极高,准确性
高。因此得到的众包降雨数据密度高,范围广。但通常而言,众包降雨数据带有较大的不确
定性,相对于传统监测方法(如降雨站)具有更大的误差。而在城市区域,如何有效结合众包
数据与现有的雷达和降雨站数据,各取其所长,构建一套更加高分辨率和精确度的降雨数
据,十分重要。综上,如何加强降雨数据的准确性是亟待解决的问题。
发明内容
表示所述第二回归系数,表示所述随机误差系数。
表示第 个地点位置对应的加权值, 是所述变差函数的极限值, 表示坐标 对应的地
点位置与第 个地点位置形成的所述变差函数。
的距离, 为变差函数趋近于所述极限值 时所对应的极限距离,其中,当所述距离
趋近于无穷时,所述极限值 取值 。
量θ的后验分布, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测
值 对应的似然函数值之和, 表示所述第一向量θ的先验分布, 表示所述观测值
集合 的先验分布。
似然函数值,M表示所述地点位置的总数目, 表示所述至少一个地点位置的观测数据形
成的观测值集合, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测
值 对应的似然函数值之和;
标准偏差, 表示所述第二标准偏差 的近似值,ζ为第一常数,表示所述众包监测数据
确定的观测值相对于所述降雨站监测数据确定的观测值更大的不确定性, 表示第
个地点位置对应的观测值 来自于所述降雨站监测数据, 表示第 个地点位置对应的
观测值 来自于所述众包监测数据;
量。
多来源降雨数据融合算法。
数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误
差系数,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确
定性;进而,结合线性方程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后
续的方程求解;进而,通过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及
众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站
监测数据以及众包监测数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯
近似的方法,准确求解第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨
强度估计值,保证每个地点位置降雨强度估计的快速性、实时性和高效性。综上,本发明简
单、易读、准确、运行效率高,导出的实时降雨强度估算数据准确性高,为径流估算数据提供
精确的数据来源。
附图说明
具体实施方式
基于贝叶斯回归的多来源降雨数据融合算法包括步骤S1至步骤S6,其中:
换为第二向量;
度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误差系数,有效反馈雷达
回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定性;进而,结合线性方
程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后续的方程求解;进而,通
过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及众包监测数据的不确定
性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包监测
数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯近似的方法,准确求解
第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨强度估计值,保证每个
地点位置降雨强度估计的快速性、实时性和高效性。
针对任一固定时间段,通过空间位置确定来自降雨站及众包监测数据所对应的雷达降雨估
计值,建立一个包含M组数据的一一映射关系(点状降雨站及众包数据与雷达数据的映射),
M为众包数据与降雨站数据的总和。假设 代表第 个观测值对应于位置 处测得的降雨强
度。
系数,表示随机误差系数。
应的加权值, 是变差函数的极限值, 表示坐标 对应的地点位置与第 个地点位置形
成的变差函数。
性。
离, 为变差函数趋近于极限值 时所对应的极限距离,其中,当距离 趋近于无穷
时,极限值 取值 。
量θ的后验分布, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测
值 对应的似然函数值之和, 表示所述第一向量θ的先验分布, 表示所述观测值
集合 的先验分布。
性回归方法。
数值,M表示所述地点位置的总数目, 表示所述至少一个地点位置的观测数据形成的观
测值集合, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测值 对
应的似然函数值之和;
准偏差 的近似值,ζ为第一常数,表示众包监测数据确定的观测值相对于降雨站监测数据
确定的观测值更大的不确定性, 表示第 个地点位置对应的观测值 来自于降雨站
监测数据, 表示第 个地点位置对应的观测值 来自于众包监测数据;
现众包数据相对于降雨站更大的不确定性。
监测数据的相互补充和印证,提高了数据的准确性。
二次泰勒展开式 (10)
比结果显示暴雨径流模型模拟径流数据与实时监测径流数据误差在30%以内,以此为市政
管网建设提供精确的暴雨径流数据。在本发明一个具体的实施例中,美国圣地亚哥市的乔
2
纳斯溪流域为例,它的流域面积为68km ,人口密度约为5400人每平方千米,流域范围广,人
口密度适中,降雨丰富,为众包降雨数据提供优质来源,同时在当地气象雷达系统查到实时
雷达降雨数据,在降雨站获取降雨站监测数据,针对这30组包括雷达回波强度数据、降雨站
监测数据以及众包监测数据的观测数据,通过matlab软件导入步骤S2至步骤S6涉及的算
法,导出对应的降雨强度估算数据,就得到了乔纳斯流域的实时的降雨强度估计值,为之后
导入暴雨径流模型提供了优质的降雨数据来源。进一步将实时的降雨估计值导入暴雨径流
模型进行验证,导出的径流模型数据与真实监测径流数据对比。例如,对于地理位置坐标为
X1,其对应的雷达强度R0为33.4mm,其对应的降雨站监测数据为30.2mm,结合众包监测数
据,应用上述算法,得到降雨数据估计值为31.33mm,将降雨数据估计值输入至暴雨径流模
型进行验证,得到径流模型数据为254.7L/s,对应的真实监测径流数据为249.4L/s。其中,
对比结果显示暴雨径流模型模拟径流数据与实时监测径流数据相吻合,为市政管网建设提
供精确的暴雨径流数据。
叶斯回归的多来源降雨数据融合算法。
基于贝叶斯回归的多来源降雨数据融合装置400包括:
系数、随机误差系数,以及变差函数的取值系数,确定对应的第一向量;还用于通过贝叶斯
公式对第一向量进行估计,确定对应的似然函数,并通过似然函数的正态分布,结合降雨站
监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量;
来源;然后,基于雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度
的有效估计;接着,根据随机误差系数,有效反馈雷达回波强度数据的系统性偏差,充分考
虑了雷达回波强度数据的不确定性;进而,结合线性方程以及变差函数,考虑多种随机变
量,确定对应的第一向量,以便后续的方程求解;进而,通过贝叶斯公式对第一向量进行估
计,充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,
实现了雷达回波强度数据、降雨站监测数据以及众包监测数据的相互补充和印证,提高了
数据的准确性;最后,通过拉普拉斯近似的方法,准确求解第二向量的最优值,并带入线性
方程,高效确定每个地点位置的降雨强度估计值,保证每个地点位置降雨强度估计的快速
性、实时性和高效性。
回归为系统提供了无偏估计,为降雨强度估算提高精确度;且采用拉普拉斯近似的方法求
解贝叶斯方程,在快速求解的基础上实现高精度低不确定性的降雨强度估计。因而本发明
克服以往降雨强度估算的不确定性,合理运用贝叶斯线性回归方法,实现高精度、高分辨率
的实时降雨强度估算,本发明提供的算法简单、易读、准确、运行效率高,导出的实时降雨强
度估算数据准确性高,为径流估算数据提供精确的数据来源。
都应涵盖在本发明的保护范围之内。