一种基于贝叶斯回归的多来源降雨数据融合算法及装置转让专利

申请号 : CN202110251215.0

文献号 : CN112612995B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 包申旭杨盼杨思原

申请人 : 武汉理工大学

摘要 :

本发明涉及一种基于贝叶斯回归的多来源降雨数据融合算法及装置,该算法包括:获取至少一个地点位置的观测数据;根据雷达回波强度数据,建立估算降雨强度的线性方程;根据线性方程对应的随机误差系数,确定对应的变差函数;根据线性方程的回归系数、随机误差系数,以及变差函数的取值系数,确定对应的第一向量;通过贝叶斯公式对第一向量进行估计,确定对应的似然函数,并通过似然函数的正态分布,将第一向量转换为第二向量;通过拉普拉斯近似的方法,求解第二向量的最优值,并带入估算降雨强度的线性方程,确定降雨强度估计值。本发明简单、运行效率高,导出的实时降雨强度估算数据准确性高,为径流估算数据提供精确的数据来源。

权利要求 :

1.一种基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,包括:获取至少一个地点位置的观测数据,其中,所述观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;

根据所述雷达回波强度数据,建立估算降雨强度的线性方程;

根据所述线性方程对应的随机误差系数,确定对应的变差函数;

根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量;

通过贝叶斯公式对所述第一向量进行估计,确定对应的似然函数,并通过所述似然函数的正态分布,结合所述降雨站监测数据以及所述众包监测数据的不确定性,将所述第一向量转换为第二向量;

通过拉普拉斯近似的方法,求解所述第二向量的最优值,并带入所述估算降雨强度的线性方程,确定降雨强度估计值;

其中,所述通过所述似然函数的正态分布,结合所述降雨站监测数据以及所述众包监测数据的不确定性,将所述第一向量转换为第二向量包括:假设所述似然函数服从正态分布,通过如下公式表示:其中,表示第 个地点位置对应的观测值, 表示所述似然函数的正态分布,表示给定所述似然函数的正态分布时第 个地点位置对应的观测值 的似然函数值,M表示所述地点位置的总数目, 表示所述至少一个地点位置的观测数据形成的观测值集合, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测值 对应的似然函数值之和;

根据所述正态分布,确定第 个地点位置对应的第二期望值和第二标准偏差,通过如下公式表示:

其中, 表示所述第二期望值,表示第 个地点位置对应的雷达强度,所述雷达强度根据所述雷达回波强度数据而确定,所述线性方程的回归系数包括第一回归系数和第二回归系数, 表示所述第一回归系数, 表示所述第二回归系数, 表示第一期望值,表示所述第二标准偏差, 表示所述第二标准偏差 的近似值,ζ为第一常数,表示所述众包监测数据确定的观测值相对于所述降雨站监测数据确定的观测值更大的不确定性, 表示第 个地点位置对应的观测值 来自于所述降雨站监测数据, 表示第 个地点位置对应的观测值 来自于所述众包监测数据;

根据所述第一常数ζ,以及所述第一向量中的所述第一回归系数 、所述第二回归系数、第一取值系数 、第二取值系数 、极限距离 ,共同构成所述第二向量,其中,所述第一取值系数 、所述第二取值系数 为所述变差函数的取值系数,所述极限距离 为所述变差函数趋近于极限值时所对应的极限距离。

2.根据权利要求1所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述获取至少一个地点位置的观测数据包括:针对预设时间段,根据空间位置,确定所述众包监测数据、所述降雨站监测数据对应的所述雷达回波强度数据;

针对所述至少一个地点位置,构建对应的所述众包监测数据、所述降雨站监测数据以及所述雷达回波强度数据之间的映射关系。

3.根据权利要求2所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述估算降雨强度的线性方程通过如下公式表示:其中,表示地点位置的坐标对应的降雨强度估计值,表示所述地点位置的坐标对应的所述雷达强度, 表示所述第一回归系数, 表示所述第二回归系数,表示所述随机误差系数。

4.根据权利要求3所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述随机误差系数的第一期望值和第一标准偏差通过如下公式表示:其中, 表示所述第一期望值,表示所述第一标准偏差, 表示第 个地点位置对应的所述降雨站监测数据或所述众包监测数据的残差,M表示所述地点位置的总数目,表示第 个地点位置对应的加权值, 是所述变差函数的极限值, 表示坐标 对应的地点位置与第 个地点位置形成的所述变差函数。

5.根据权利要求4所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述变差函数的取值系数包括所述第一取值系数和所述第二取值系数,所述变差函数通过如下公式表示:

其中, 表示第 个地点位置与第j个地点位置形成的所述变差函数,表示所述第一取值系数,表示所述第二取值系数, 表示第 个地点位置与第j个地点位置之间的距离,  为变差函数趋近于所述极限值 时所对应的所述极限距离,其中,当所述距离趋近于无穷时,所述极限值 取值 。

6.根据权利要求5所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量包括:

根据所述第一回归系数 、所述第二回归系数 、所述第一取值系数 、所述第二取值系数 、所述极限距离 ,构成所述第一向量。

7.根据权利要求6所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述通过贝叶斯公式对所述第一向量进行估计通过如下公式表示:其中,θ表示所述第一向量, 表示所述至少一个地点位置的观测数据形成的观测值集合,对应于M个所述观测数据, 表示给定所述观测值集合 时所述第一向量θ的后验分布, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测值 对应的似然函数值之和, 表示所述第一向量θ的先验分布, 表示所述观测值集合 的先验分布。

8.根据权利要求7所述的基于贝叶斯回归的多来源降雨数据融合方法,其特征在于,所述通过拉普拉斯近似的方法,求解所述第二向量的最优值包括:根据所述第二向量的局部最优值,将后验分布 最大化;

确定最大化的后验分布在所述局部最优值处的二次泰勒展开式;

根据所述最大化的后验分布的海森矩阵,确定对应的拉普拉斯近似值函数;

根据所述拉普拉斯近似值函数的均值,确定所述第二向量的最优值。

9.一种基于贝叶斯回归的多来源降雨数据实时融合装置,其特征在于,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现根据权利要求1‑

8任一项所述的基于贝叶斯回归的多来源降雨数据融合方法。

说明书 :

一种基于贝叶斯回归的多来源降雨数据融合算法及装置

技术领域

[0001] 本发明涉及智慧城市建设技术领域,尤其涉及一种基于贝叶斯回归的多来源降雨数据融合算法及装置。

背景技术

[0002] SWMM模型是由美国环保局推出的一种暴雨径流模型,能够完整地模拟城市降雨径流过程和污染物转移过程,目前广泛应用于暴雨径流模拟和城市排水系统管理。SWMM模型
可以模拟分析现有管网的排水能力,确定管网排水能力不足的“瓶颈”段,同时依据模拟结
果预先测出设计改造方案的实际效果,通过分析对比经济性指标,可获得合理经济的方案。
但是SWMM模型的目前主要应用于对已有管网的模拟分析和已有管网改造方案对比。目前,
雨水管网设计主要是人工雨水管网设计,它基于极限暴雨强度所计算的流量,凭经验采用
反复查阅水力计算表的方法对管段的管径和坡度等进行人为的调整,以获得较经济合理的
设计。该人工雨水管网设计方法计算量大,且计算结果精确度较低。这种人工雨水管网设计
方法的水力计算过程基于静态的明渠流公式,假定下游可以自由出流,水力计算过程孤立,
管网的设计过程完全忽略了下游管道的水力流动状况,难以体现管网的实际通洪效果,以
至于产生局部瓶颈现象,导致内涝的发生。也就是说:现有雨水管网设计方法的静态化的计
算过程难以满足城市建设和环境保护的需求。
[0003] 随着科学技术的发展,各国各省市对暴雨径流模拟精度要求越来越高。提高降雨输入数据精度可以大大提高暴雨径流模拟数据。在城市区域,降雨数据通常包括雷达和降
雨站,雷达降雨数据有高覆盖率的优点,但雷达所测降雨通常存在系统性偏差,本身误差及
不确定性也较大;降雨站监测误差小,但是站点分布稀疏,难以提供高分辨率空间信息,所
以得不出准确的实时降雨强度估算。
[0004] 近年来,国内外兴起了通过众包监测降雨的研究与实践。众包降雨是普通市民利用物联网监测到的降雨数据,在提供有价值的实时降雨观测数据方面具有巨大潜力。众包
方式鼓励市民利用低成本物联网传感器进行降雨监测,覆盖范围极大,密度极高,准确性
高。因此得到的众包降雨数据密度高,范围广。但通常而言,众包降雨数据带有较大的不确
定性,相对于传统监测方法(如降雨站)具有更大的误差。而在城市区域,如何有效结合众包
数据与现有的雷达和降雨站数据,各取其所长,构建一套更加高分辨率和精确度的降雨数
据,十分重要。综上,如何加强降雨数据的准确性是亟待解决的问题。

发明内容

[0005] 有鉴于此,有必要提供一种基于贝叶斯回归的多来源降雨数据融合算法,用以解决如何加强降雨数据的准确性的问题。
[0006] 本发明提供一种基于贝叶斯回归的多来源降雨数据融合算法,包括:
[0007] 获取至少一个地点位置的观测数据,其中,所述观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
[0008] 根据所述雷达回波强度数据,建立估算降雨强度的线性方程;
[0009] 根据所述线性方程对应的随机误差系数,确定对应的变差函数;
[0010] 根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量;
[0011] 通过贝叶斯公式对所述第一向量进行估计,确定对应的似然函数,并通过所述似然函数的正态分布,将所述第一向量转换为第二向量;
[0012] 通过拉普拉斯近似的方法,求解所述第二向量的最优值,并带入所述估算降雨强度的线性方程,确定降雨强度估计值。
[0013] 进一步地,所述获取至少一个地点位置的观测数据包括:
[0014] 针对预设时间段,根据空间位置,确定所述雷达回波强度数据、所述降雨站监测数据对应的所述雷达回波强度数据;
[0015] 针对所述至少一个地点位置,构建对应的所述众包监测数据、所述降雨站监测数据以及所述雷达回波强度数据之间的映射关系。
[0016] 进一步地,所述线性方程的回归系数包括第一回归系数和第二回归系数,所述估算降雨强度的线性方程通过如下公式表示:
[0017]
[0018] 其中,表示地点位置的坐标对应的降雨强度估计值,表示所述地点位置的坐标对应的雷达强度,所述雷达强度根据雷达回波强度数据确定, 表示所述第一回归系数,
表示所述第二回归系数,表示所述随机误差系数。
[0019] 进一步地,所述随机误差系数的第一期望值和第一标准偏差通过如下公式表示:
[0020]
[0021]
[0022] 其中, 表示所述第一期望值, 表示所述第一标准偏差, 表示第 个地点位置对应的所述降雨站监测数据或所述众包监测数据的残差,M表示所述地点位置的总数目,
表示第 个地点位置对应的加权值, 是所述变差函数的极限值, 表示坐标 对应的地
点位置与第 个地点位置形成的所述变差函数。
[0023] 进一步地,所述变差函数的取值系数包括第一取值系数和第二取值系数,所述变差函数通过如下公式表示:
[0024]
[0025] 其中, 表示第 个地点位置与第j个地点位置形成的所述变差函数,表示所述第一取值系数,表示所述第二取值系数, 表示第 个地点位置与第j个地点位置之间
的距离,  为变差函数趋近于所述极限值 时所对应的极限距离,其中,当所述距离
趋近于无穷时,所述极限值 取值 。
[0026] 进一步地,所述根据所述线性方程的回归系数、所述随机误差系数,以及所述变差函数的取值系数,确定对应的第一向量包括:
[0027] 根据所述第一回归系数 、所述第二回归系数 、所述第一取值系数 、所述第二取值系数 、所述极限距离 ,构成所述第一向量。
[0028] 进一步地,所述通过贝叶斯公式对所述第一向量进行估计通过如下公式表示:
[0029]
[0030] 其中,θ表示所述第一向量, 表示所述至少一个地点位置的观测数据形成的观测值集合,对应于M个所述观测数据, 表示给定所述观测值集合 时所述第一向
量θ的后验分布, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测
值 对应的似然函数值之和, 表示所述第一向量θ的先验分布, 表示所述观测值
集合 的先验分布。
[0031] 进一步地,所述通过所述似然函数的正态分布,将所述第一向量转换为第二向量包括:
[0032] 假设所述似然函数服从正态分布,通过如下公式表示:
[0033]
[0034] 其中, 表示第 个地点位置对应的观测值, 表示所述似然函数的正态分布, 表示给定所述似然函数的正态分布时第 个地点位置对应的观测值 的
似然函数值,M表示所述地点位置的总数目, 表示所述至少一个地点位置的观测数据形
成的观测值集合, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测
值 对应的似然函数值之和;
[0035] 根据所述正态分布,确定第 个地点位置对应的第二期望值和第二标准偏差,通过如下公式表示:
[0036]
[0037]
[0038] 其中, 表示所述第二期望值,表示第 个地点位置对应的所述雷达强度, 表示所述第一回归系数, 表示所述第二回归系数, 表示所述第一期望值,表示所述第二
标准偏差, 表示所述第二标准偏差 的近似值,ζ为第一常数,表示所述众包监测数据
确定的观测值相对于所述降雨站监测数据确定的观测值更大的不确定性, 表示第
个地点位置对应的观测值 来自于所述降雨站监测数据, 表示第 个地点位置对应的
观测值 来自于所述众包监测数据;
[0039] 根据所述第一常数ζ,以及所述第一向量中的所述第一回归系数 、所述第二回归系数 、所述第一取值系数 、所述第二取值系数 、所述极限距离 ,共同构成所述第二向
量。
[0040] 进一步地,所述通过拉普拉斯近似的方法,求解所述第二向量的最优值包括:
[0041] 根据所述第二向量的局部最优值,将后验分布 最大化;
[0042] 确定最大化的后验分布在所述局部最优值处的二次泰勒展开式;
[0043] 根据所述最大化的后验分布的海森矩阵,确定对应的拉普拉斯近似值函数;
[0044] 根据所述拉普拉斯近似值函数的均值,确定所述第二向量的最优值。
[0045] 本发明还提供一种多来源降雨数据实时融合装置,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上所述的基于贝叶斯回归的
多来源降雨数据融合算法。
[0046] 与现有技术相比,本发明的有益效果包括:首先,对雷达回波强度数据、降雨站监测数据以及众包监测数据进行有效的获取,保证丰富的数据来源;然后,基于雷达回波强度
数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误
差系数,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确
定性;进而,结合线性方程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后
续的方程求解;进而,通过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及
众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站
监测数据以及众包监测数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯
近似的方法,准确求解第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨
强度估计值,保证每个地点位置降雨强度估计的快速性、实时性和高效性。综上,本发明简
单、易读、准确、运行效率高,导出的实时降雨强度估算数据准确性高,为径流估算数据提供
精确的数据来源。

附图说明

[0047] 图1为本发明提供的基于贝叶斯回归的多来源降雨数据融合算法的流程示意图;
[0048] 图2为本发明提供的获取至少一个地点位置的观测数据的流程示意图;
[0049] 图3为本发明提供的求解第二向量的最优值的流程示意图;
[0050] 图4为本发明提供的基于贝叶斯回归的多来源降雨数据融合装置的结构示意图。

具体实施方式

[0051] 下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
[0052] 实施例1
[0053] 本发明实施例提供了一种基于贝叶斯回归的多来源降雨数据融合算法,结合图1来看,图1为本发明提供的基于贝叶斯回归的多来源降雨数据融合算法的流程示意图,上述
基于贝叶斯回归的多来源降雨数据融合算法包括步骤S1至步骤S6,其中:
[0054] 在步骤S1中,获取至少一个地点位置的观测数据,其中,观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
[0055] 在步骤S2中,根据雷达回波强度数据,建立估算降雨强度的线性方程;
[0056] 在步骤S3中,根据线性方程对应的随机误差系数,确定对应的变差函数;
[0057] 在步骤S4中,根据线性方程的回归系数、随机误差系数,以及变差函数的取值系数,确定对应的第一向量;
[0058] 在步骤S5中,通过贝叶斯公式对第一向量进行估计,确定对应的似然函数,并通过似然函数的正态分布,结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转
换为第二向量;
[0059] 在步骤S6中,通过拉普拉斯近似的方法,求解第二向量的最优值,并带入估算降雨强度的线性方程,确定降雨强度估计值。
[0060] 在本发明实施例中,首先,对雷达回波强度数据、降雨站监测数据以及众包监测数据进行有效的获取,保证丰富的数据来源;然后,基于雷达回波强度数据,建立估算降雨强
度的线性方程,以此保证对降雨强度的有效估计;接着,根据随机误差系数,有效反馈雷达
回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定性;进而,结合线性方
程以及变差函数,考虑多种随机变量,确定对应的第一向量,以便后续的方程求解;进而,通
过贝叶斯公式对第一向量进行估计,充分结合降雨站监测数据以及众包监测数据的不确定
性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包监测
数据的相互补充和印证,提高了数据的准确性;最后,通过拉普拉斯近似的方法,准确求解
第二向量的最优值,并带入线性方程,高效确定每个地点位置的降雨强度估计值,保证每个
地点位置降雨强度估计的快速性、实时性和高效性。
[0061] 优选地,结合图2来看,图2为本发明提供的获取至少一个地点位置的观测数据的流程示意图,上述步骤S1包括步骤S11至步骤S12,其中:
[0062] 在步骤S11中,针对预设时间段,根据空间位置,确定众包监测数据、降雨站监测数据对应的雷达回波强度数据;
[0063] 在步骤S12中,针对至少一个地点位置,构建对应的雷达回波强度数据、降雨站监测数据以及雷达回波强度数据之间的映射关系。
[0064] 作为具体实施例,本发明实施例通过某一个地点位置,获取其对应的众包监测数据、降雨站监测数据、雷达回波强度数据,构建相互的映射关系,实现数据的有效查找。
[0065] 在本发明一个具体的实施例中,对于来自雷达站、降雨站和广大人民观测的降雨数据收集了该流域的M个地点位置的雷达回波强度数据、降雨站监测数据和众包监测数据。
针对任一固定时间段,通过空间位置确定来自降雨站及众包监测数据所对应的雷达降雨估
计值,建立一个包含M组数据的一一映射关系(点状降雨站及众包数据与雷达数据的映射),
M为众包数据与降雨站数据的总和。假设 代表第 个观测值对应于位置 处测得的降雨强
度。
[0066] 优选地,线性方程的回归系数包括第一回归系数和第二回归系数,在步骤S2中,估算降雨强度的线性方程通过如下公式表示:
[0067]                  (1)
[0068] 其中,表示地点位置的坐标对应的降雨强度估计值,表示地点位置的坐标对应的雷达强度,雷达强度根据雷达回波强度数据确定, 表示第一回归系数, 表示第二回归
系数,表示随机误差系数。
[0069] 作为具体实施例,本发明实施例结合雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度的有效估计。
[0070] 优选地,随机误差系数的第一期望值和第一标准偏差通过如下公式表示:
[0071]                  (2)
[0072]        (3)
[0073] 其中, 表示第一期望值,表示第一标准偏差, 表示第 个地点位置对应的降雨站监测数据或众包监测数据的残差,M表示地点位置的总数目,表示第 个地点位置对
应的加权值, 是变差函数的极限值, 表示坐标 对应的地点位置与第 个地点位置形
成的变差函数。
[0074] 作为具体实施例,本发明实施例利用随机误差系数,结合第一期望值和第一标准偏差,有效反馈雷达回波强度数据的系统性偏差,充分考虑了雷达回波强度数据的不确定
性。
[0075] 优先地,变差函数的取值系数包括第一取值系数和第二取值系数,变差函数通过如下公式表示:
[0076]            (4)
[0077]             (5)
[0078] 其中, 表示第 个地点位置与第j个地点位置形成的变差函数,表示所述第一取值系数,表示所述第二取值系数, 表示第 个地点位置与第j个地点位置之间的距
离,  为变差函数趋近于极限值 时所对应的极限距离,其中,当距离 趋近于无穷
时,极限值 取值 。
[0079] 作为具体实施例,本发明实施例在研究区域形成的变差函数,考虑不同地点位置的相互关系,确定对应的第一取值系数和第二取值系数。
[0080] 优先地,在步骤S4中,具体包括:
[0081] 根据第一回归系数 、第二回归系数 、第一取值系数 、第二取值系数 、所述极限距离 ,构成第一向量。
[0082] 作为具体实施例,本发明实施例考虑多种随机变量,确定对应的第一向量,以便后续的方程求解。
[0083] 优先地,上述通过贝叶斯公式对所述第一向量进行估计通过如下公式表示:
[0084]            (6)
[0085] 其中,θ表示所述第一向量, 表示所述至少一个地点位置的观测数据形成的观测值集合,对应于M个所述观测数据, 表示给定所述观测值集合 时所述第一向
量θ的后验分布, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测
值 对应的似然函数值之和, 表示所述第一向量θ的先验分布, 表示所述观测值
集合 的先验分布。
[0086] 作为具体实施例,本发明实施例采用随机贝叶斯方法,将五个未知数转换为随机变量,贝叶斯回归为系统提供了无偏估计,为降雨强度估算提高精确度,合理运用贝叶斯线
性回归方法。
[0087] 优选地,在步骤S5中具体包括:
[0088] 假设似然函数服从正态分布,通过如下公式表示:
[0089]        (7)
[0090] 其中,表示第 个地点位置对应的观测值, 表示似然函数的正态分布,表示给定似然函数的正态分布时第 个地点位置对应的观测值 的似然函
数值,M表示所述地点位置的总数目, 表示所述至少一个地点位置的观测数据形成的观
测值集合, 表示给定所述观测值集合 时所述第一向量为θ时的所有观测值 对
应的似然函数值之和;
[0091] 根据正态分布,确定第 个地点位置对应的第二期望值和第二标准偏差,通过如下公式表示:
[0092]                  (8)
[0093]           (9)
[0094] 其中, 表示第二期望值,表示第 个地点位置对应的雷达强度, 表示第一回归系数, 表示第二回归系数, 表示第一期望值,表示第二标准偏差, 表示第二标
准偏差 的近似值,ζ为第一常数,表示众包监测数据确定的观测值相对于降雨站监测数据
确定的观测值更大的不确定性, 表示第 个地点位置对应的观测值 来自于降雨站
监测数据, 表示第 个地点位置对应的观测值 来自于众包监测数据;
[0095] 根据第一常数ζ,以及第一向量中的第一回归系数 、第二回归系数 、第一取值系数 、第二取值系数 、极限距离 ,共同构成第二向量。
[0096] 需要说明的是,通过式(9)可知,当观测数据来自降雨站监测数据时,似然函数取为其方差;而当观测数据来自众包检测数据时,似然函数中的方差被人为放大,以体
现众包数据相对于降雨站更大的不确定性。
[0097] 作为具体实施例,本发明实施例充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,实现了雷达回波强度数据、降雨站监测数据以及众包
监测数据的相互补充和印证,提高了数据的准确性。
[0098] 优选地,结合图3来看,图3为本发明提供的求解第二向量的最优值的流程示意图,上述步骤S5包括步骤S51至步骤S54,其中:
[0099] 在步骤S51中,根据第二向量的局部最优值,将后验分布 最大化;
[0100] 在步骤S52中,确定最大化的后验分布在局部最优值处的二次泰勒展开式;
[0101] 在步骤S53中,根据最大化的后验分布的海森矩阵,确定对应的拉普拉斯近似值函数;
[0102] 在步骤S54中,根据拉普拉斯近似值函数的均值,确定第二向量的最优值
[0103] 作为具体实施例,本发明实施例采用拉普拉斯近似的方法求解贝叶斯方程,在快速求解的基础上实现高精度低不确定性的降雨强度估计。
[0104] 在本发明一个具体的实施例中,为了计算第二向量θ,令 为第二向量θ的局部最优值,使得在θ= 时,后验概率 最大化,因此,可以得出后验概率分布函数在 的
二次泰勒展开式     (10)
[0105] 其中,第二向量θ是一个6×6矩阵,表示 的海森矩阵(Hessian Matrix)在 时, 取值如下:             (11)
[0106] 其中, 和 分别是θ的第 个和第 个元素,之后取等式(10)两侧的指数,得出第二向量θ后验的拉普拉斯近似值为:
[0107]    (12)
[0108] 其中,等式(12)可近似视为均值为 和协方差为 的多元正态分布。
[0109] 优选地,上述来源降雨数据实时融合算法还包括:将降雨强度估计值导入暴雨径流模型,并与真实监测数据对比,确定对应的误差。其中,在本发明一个具体的实施例中,对
比结果显示暴雨径流模型模拟径流数据与实时监测径流数据误差在30%以内,以此为市政
管网建设提供精确的暴雨径流数据。在本发明一个具体的实施例中,美国圣地亚哥市的乔
2
纳斯溪流域为例,它的流域面积为68km ,人口密度约为5400人每平方千米,流域范围广,人
口密度适中,降雨丰富,为众包降雨数据提供优质来源,同时在当地气象雷达系统查到实时
雷达降雨数据,在降雨站获取降雨站监测数据,针对这30组包括雷达回波强度数据、降雨站
监测数据以及众包监测数据的观测数据,通过matlab软件导入步骤S2至步骤S6涉及的算
法,导出对应的降雨强度估算数据,就得到了乔纳斯流域的实时的降雨强度估计值,为之后
导入暴雨径流模型提供了优质的降雨数据来源。进一步将实时的降雨估计值导入暴雨径流
模型进行验证,导出的径流模型数据与真实监测径流数据对比。例如,对于地理位置坐标为
X1,其对应的雷达强度R0为33.4mm,其对应的降雨站监测数据为30.2mm,结合众包监测数
据,应用上述算法,得到降雨数据估计值为31.33mm,将降雨数据估计值输入至暴雨径流模
型进行验证,得到径流模型数据为254.7L/s,对应的真实监测径流数据为249.4L/s。其中,
对比结果显示暴雨径流模型模拟径流数据与实时监测径流数据相吻合,为市政管网建设提
供精确的暴雨径流数据。
[0110] 实施例2
[0111] 本发明实施例提供了一种多来源降雨数据实时融合装置,包括处理器以及存储器,存储器上存储有计算机程序,计算机程序被处理器执行时,实现如上所述的一种基于贝
叶斯回归的多来源降雨数据融合算法。
[0112] 实施例3
[0113] 本发明实施例提供了一种基于贝叶斯回归的多来源降雨数据融合装置,结合图4来看,图4为本发明提供的基于贝叶斯回归的多来源降雨数据融合装置的结构示意图,上述
基于贝叶斯回归的多来源降雨数据融合装置400包括:
[0114] 获取单元401,用于获取至少一个地点位置的观测数据,其中,观测数据包括雷达回波强度数据、降雨站监测数据以及众包监测数据;
[0115] 处理单元402,用于根据雷达回波强度数据,建立估算降雨强度的线性方程;还用于根据线性方程对应的随机误差系数,确定对应的变差函数;还用于根据线性方程的回归
系数、随机误差系数,以及变差函数的取值系数,确定对应的第一向量;还用于通过贝叶斯
公式对第一向量进行估计,确定对应的似然函数,并通过似然函数的正态分布,结合降雨站
监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量;
[0116] 估计单元403,用于通过拉普拉斯近似的方法,求解第二向量的最优值,并带入估算降雨强度的线性方程,确定降雨强度估计值。
[0117] 本发明公开了一种基于贝叶斯回归的多来源降雨数据融合算法及装置,首先,对雷达回波强度数据、降雨站监测数据以及众包监测数据进行有效的获取,保证丰富的数据
来源;然后,基于雷达回波强度数据,建立估算降雨强度的线性方程,以此保证对降雨强度
的有效估计;接着,根据随机误差系数,有效反馈雷达回波强度数据的系统性偏差,充分考
虑了雷达回波强度数据的不确定性;进而,结合线性方程以及变差函数,考虑多种随机变
量,确定对应的第一向量,以便后续的方程求解;进而,通过贝叶斯公式对第一向量进行估
计,充分结合降雨站监测数据以及众包监测数据的不确定性,将第一向量转换为第二向量,
实现了雷达回波强度数据、降雨站监测数据以及众包监测数据的相互补充和印证,提高了
数据的准确性;最后,通过拉普拉斯近似的方法,准确求解第二向量的最优值,并带入线性
方程,高效确定每个地点位置的降雨强度估计值,保证每个地点位置降雨强度估计的快速
性、实时性和高效性。
[0118] 本发明技术方案,区分了来自降雨站与众包的监测数据,为众包数据设计了更高的不确性,从而可以有效利用降雨站信息为整体输出数据降低不确定性;同时,利用贝叶斯
回归为系统提供了无偏估计,为降雨强度估算提高精确度;且采用拉普拉斯近似的方法求
解贝叶斯方程,在快速求解的基础上实现高精度低不确定性的降雨强度估计。因而本发明
克服以往降雨强度估算的不确定性,合理运用贝叶斯线性回归方法,实现高精度、高分辨率
的实时降雨强度估算,本发明提供的算法简单、易读、准确、运行效率高,导出的实时降雨强
度估算数据准确性高,为径流估算数据提供精确的数据来源。
[0119] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,
都应涵盖在本发明的保护范围之内。