区域化LSTM洪水预报方法转让专利

申请号 : CN202210438848.7

文献号 : CN114707753B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 梁忠民钱名开徐时进王凯叶可佳刘小虎黄一昕胡友兵陈邦慧毕成琳

申请人 : 河海大学淮河水利委员会水文局(信息中心)

摘要 :

本发明公开了一种区域化LSTM洪水预报方法,步骤包括:收集历史水文资料,在综合考虑区域信息的基础上,进行水文数据的预处理;划分率定集与验证集,初定模型参数并进行模型训练;选取精度评价指标,进行模型精度评价;选取优化算法,进行模型参数寻优。本发明通过水文资料与流域信息相结合的方式,构建水文气候一致区尺度的LSTM模型。扩大了LSTM模型的训练集,进一步提高了洪水预报的精度,弥补了无资料地区的洪水预报的不足,具有较强的应用前景。

权利要求 :

1.一种区域化LSTM洪水预报方法,其特征在于,包括如下步骤:步骤1,收集水文气候一致区内的历史水文数据,利用一致区内各流域的特征信息,对水文历史数据进行预处理,作为区域化LSTM模型的输入;包括如下步骤:

1.1,构建反映流域信息的综合表征指标w,将其与该流域原始雨量资料P、流量资料Q相结合,构建包含流域信息的水文数据:雨量数据P和流量数据Q,作为模型输入信息;所述综合表征指标w基于单因子表征指标构建而成,所述单因子表征指标包括流域内雨量站、流量站的面积指标、汇流路径指标和比降指标中的一种或几种;

步骤1.1的具体步骤如下:

步骤1.1.1,收集水文气候一致区内各流域的历史水文数据,设某一水文气候一致区内共有s个流域,设流域i(i∈[1,s])中共计含有m个雨量站、n个流量站;该流域内实测雨量数据Pi、流量数据Qi分别如下式所示:式中,Pi,j为流域i雨量站j的连续原始雨量序列,Qi,k为流域i雨量站k的连续原始流量序列;

步骤1.1.2,基于流域特征,构建流域特征单因子表征指标:对于流域i内雨量站j:

面积指标:

汇流路径指标:

比降指标:

式中, 为流域i雨量站j的面积指标; 为流域i中雨量站j所控制的流域面积;Ai为流域i的总面积; 为流域i雨量站j的汇流路径指标; 为流域i中雨量站j到出口控制断面的汇流路径长度;Li为流域i的最长汇流路径长度; 为流域i雨量站j的比降指标; 为流域i中雨量站j的比降;Ii为流域i的最大比降;

对于流域i内流量站k:

面积指标:

汇流路径指标:

比降指标:

式中, 为流域i流量站k的面积指标; 为流域i中流量站k所控制的流域面积;

为流域i流量站k的汇流路径指标; 为流域i中流量站k到出口控制断面的汇流路径长度;

Li为流域i的最长汇流路径长度; 为流域i流量站k的比降指标; 为流域i中流量站k的比降;Ii为流域i的最大比降;

步骤1.1.3,基于各单因子表征指标对预报断面流量的影响,构建流域特征综合表征指标;

流域i内雨量站j的综合表征指标 如下式:

在流域尺度上,所有雨量站点综合表征指标 的集合如下:将其构造成对角矩阵的格式,如下式所示:

流域i内流量站k的综合表征指标 如下式:

在流域尺度上,所有流量站点综合表征指标 的集合如下:将其构造成对角矩阵的格式,如下式所示:

步骤1.1.4,结合流域信息综合表征指标 与原始水文数据Pi、Qi,构建包含区域因子的水文数据Pi、Qi:步骤1.1.5,选取预报因子长度:

将某一水文站点的水文序列称为预报因子,在上述流域i中含有m个雨量预报因子Pfi,j(j∈[1,m])以及n个流量预报因子Qfi,k(k∈[1,n]);设t为当前时刻,t+r为预报时刻,预报断面为流域i控制断面;雨量预报因子Pfi,j的序列长度取 流量预报因子Qfi,k的序列长度取 预报因子的表达式如下所示:

1.2,对模型输入信息P、Q做归一化处理;

步骤2,划分为率定集和验证集,构建水文气候一致区尺度上的区域化LSTM模型,初定模型参数,运用率定集数据进行模型训练;

步骤3,选取精度评价指标,运用验证集数据综合评估模型精度;

步骤4,采用SCE‑UA优化算法,基于预报流域实际情况选取目标函数,进行参数寻优;

步骤5,实现区域化LSTM洪水预报,模型输出为该流域出口控制断面的预报流量。

2.根据权利要求1所述的区域化LSTM洪水预报方法,其特征在于,步骤1.2中归一化处理的方式为min‑max标准化,公式如下:*

式中,x为归一化处理后的数据,x为待处理的原始数据,xmin为原始数据中的最小值,xmax为原始数据中的最大值,归一化处理后的数据值在0到1之间。

3.根据权利要求1所述的区域化LSTM洪水预报方法,其特征在于,步骤2中以流域为单位划分率定集与验证集,验证流域个数占流域总个数的10%,其余流域作为率定流域;初定区域化LSTM模型参数,运用率定流域的数据来训练模型。

4.根据权利要求1所述的区域化LSTM洪水预报方法,其特征在于,步骤3中选取纳什效率系数NSE、相对误差绝对值平均MRE、合格率RE中的一种或几种作为精度评价指标。

5.根据权利要求1所述的区域化LSTM洪水预报方法,其特征在于,步骤4中根据预报断面对洪峰、洪量、过程匹配度目标的精度要求,分别选取洪峰MRE、洪量MRE、NSE作为目标函数,进行多目标参数寻优;或是综合考虑上述多个目标,构建综合目标函数,进行单目标参数寻优。

6.根据权利要求1所述的区域化LSTM洪水预报方法,其特征在于,步骤5的具体步骤如下:采用同一水文气候一致区内各流域的全部场次洪水一同进行LSTM模型的训练,对该水文气候一致区内特定流域的洪水预报,以预处理后水文数据作为模型输入,模型输出为该流域出口控制断面的预报流量,从而实现区域内各流域出口断面的洪水预报。

说明书 :

区域化LSTM洪水预报方法

技术领域

[0001] 本发明属于基于机器学习的洪水预报技术领域,具体涉及一种区域化LSTM洪水预报方法。

背景技术

[0002] 洪水预报是指基于对洪水发生和运动规律机理的认识,根据本时刻和前期的水文、气象等数据,对未来一定时期内洪水的发生发展情况做出的预报或预测。我国地域辽阔,水文、气候条件复杂,频发的洪涝灾害迫使人民生命安全和财产安全面临巨大的威胁。在洪涝灾害的应对中,大量依赖于洪水预报这种非工程措施,尤其是在决策阶段,洪水预报的及时性和准确性至关重要。此外,洪水预报是进行水科学管理的必要手段,也为区域水资源利用、生态系统保护和工农业安全生产等诸多领域提供科学的支撑。
[0003] 目前,主流的洪水预报模型大多都是建立以水文过程物理机制为基础的传统水文模型,往往需要对流域内水文循环涉及的各个要素进行详细地定义,并对水文过程加以复杂的数学公式进行描述,但是由于水文要素的不确定性和水文过程的复杂性,大大限制了传统水文模型的发展。
[0004] 近年来,得益于机器学习和大数据技术的发展,人工神经网络技术在各个领域取得了长足进步。在水文预报领域,部分研究将目光聚焦于能够学习时间序列状态特征的递归神经网络。LSTM作为递归神经网络在梯度消失问题上的改进,以其在长时间序列模拟上的优势,为洪水预报提供了新思路。
[0005] 相较于高度依赖水文要素及物理机制的传统水文模型,LSTM模型无需对水文过程进行精细的刻画,避开了难以获取的水文状态变量,通过对存在时序特征的数据样本进行训练,能够到达拟合和预测的目的,具有显著的应用优势。但应用LSTM模型进行洪水预报并不成熟完善,仍然存着改进空间。

发明内容

[0006] 为了解决上述背景技术中存在的问题,本发明提供一种区域化LSTM洪水预报方法,具有计算效率高、可操作性高等优点,可以进一步提高洪水预报的准确性和合理性。
[0007] 本发明所采用的技术方案具体如下:
[0008] 一种区域化LSTM洪水预报方法,包括如下步骤:
[0009] 步骤1,收集水文气候一致区内的历史水文数据,利用一致区内各流域的特征信息,对水文历史数据进行预处理,作为区域化LSTM模型的输入;包括如下步骤:
[0010] 1.1,构建反映流域信息的综合表征指标w,将其与该流域原始雨量资料P、流量资料Q相结合,构建包含流域信息的水文数据:雨量数据 和流量数据 作为模型输入信息;所述综合表征指标w基于单因子表征指标构建而成,所述单因子表征指标包括流域内雨量站、流量站的面积指标、汇流路径指标和比降指标中的一种或几种;
[0011] 1.2,对模型输入信息 做归一化处理;
[0012] 步骤2,划分为率定集和验证集,构建水文气候一致区尺度上的区域化LSTM模型,初定模型参数,运用率定集数据进行模型训练;
[0013] 步骤3,选取精度评价指标,运用验证集数据综合评估模型精度;
[0014] 步骤4,采用SCE‑UA优化算法,基于预报流域实际情况选取目标函数,进行参数寻优;
[0015] 步骤5,实现区域化LSTM洪水预报,模型输出为该流域出口控制断面的预报流量。
[0016] 进一步的优化,步骤1.2中归一化处理的方式为min‑max标准化,公式如下:
[0017]
[0018] 式中,x*为归一化处理后的数据,x为待处理的原始数据,xmin为原始数据中的最小值,xmax为原始数据中的最大值,归一化处理后的数据值在0到1之间。
[0019] 进一步的优化,步骤1.1的具体步骤如下:
[0020] 步骤1.1.1,收集水文气候一致区内各流域的历史水文数据,设某一水文气候一致区内共有s个流域,设流域i(i∈[1,s])中共计含有m个雨量站、n个流量站;
[0021] 该流域内实测雨量数据Pi、流量数据Qi分别如下式所示:
[0022]
[0023]
[0024] 式中,Pi,j为流域i雨量站j的连续原始雨量序列,Qi,k为流域i雨量站k的连续原始流量序列;
[0025] 步骤1.1.2,基于流域特征,构建流域特征单因子表征指标:
[0026] ∈[1,m],对于流域i内雨量站j:
[0027] 面积指标:
[0028] 汇流路径指标:
[0029] 比降指标:
[0030] 式中, 为流域i雨量站j的面积指标; 为流域i中雨量站j所控制的流域面积;Ai为流域i的总面积; 为流域i雨量站j的汇流路径指标; 为流域i中雨量站j到出口控制断面的汇流路径长度;Li为流域i的最长汇流路径长度; 为流域i雨量站j的比降指标;
为流域i中雨量站j的比降;Ii为流域i的最大比降;
[0031] ∈[1,n],对于流域i内流量站k:
[0032] 面积指标:
[0033] 汇流路径指标:
[0034] 比降指标:
[0035] 式中, 为流域i流量站k的面积指标; 为流域i中流量站k所控制的流域面积; 为流域i流量站k的汇流路径指标; 为流域i中流量站k到出口控制断面的汇流路径长度;Li为流域i的最长汇流路径长度; 为流域i流量站k的比降指标; 为流域i中流量站k的比降;Ii为流域i的最大比降;
[0036] 步骤1.1.3,基于各单因子表征指标对预报断面流量的影响,构建流域特征综合表征指标;
[0037] 流域i内雨量站j的综合表征指标 如下式:
[0038]
[0039] 在流域尺度上,所有雨量站点综合表征指标 的集合如下:
[0040]
[0041] 将其构造成对角矩阵的格式,如下式所示:
[0042]
[0043] 流域i内流量站k的综合表征指标 如下式:
[0044]
[0045] 在流域尺度上,所有流量站点综合表征指标 的集合如下:
[0046]
[0047] 将其构造成对角矩阵的格式,如下式所示:
[0048]
[0049] 步骤1.1.4,结合流域信息综合表征指标 与原始水文数据Pi、Qi,构建包含区域因子的水文数据Pi、Qi:
[0050]
[0051]
[0052] 步骤1.1.5,选取预报因子长度:
[0053] 将某一水文站点的水文序列称为预报因子,在上述流域i中含有m个雨量预报因子Pfi,j(j∈[1,m])以及n个流量预报因子Qfi,k(k∈[1,n]);设t为当前时刻,t+r为预报时刻,预报断面为流域i控制断面;雨量预报因子Pfi,j的序列长度取 流量预报因子Qfi,k的序列长度取 预报因子的表达式如下所示:
[0054]
[0055]
[0056] 进一步的,所述步骤2中,由于预处理后雨量、流量信息综合考虑了流域信息,区别于流域尺度上的LSTM模型,在运算过程中将水文气候一致区内有流域的资料输入同一个LSTM模型中进行训练。由于本模型的空间尺度为水文气候一致区,因此以流域为单位划分率定集与验证集。验证流域个数占流域总个数的10%,且其资料条件适中,其余流域作为率定流域。初定区域化LSTM模型参数,运用率定流域的数据来训练模型。
[0057] 进一步的,所述步骤3中,具体步骤如下:选取纳什效率系数NSE、相对误差绝对值平均MRE、合格率RE作为精度评价指标,利用验证流域数据作精度评价。精度评价指标公式如下:
[0058] 纳什效率系数:
[0059] 相对误差绝对值平均:
[0060] 合格率:
[0061] 式中,i为第i个时刻;N为时段总数;y0为实测值; 为实测值的平均值;yf为模型预测值。
[0062] 进一步的,所述步骤4中,具体步骤如下:
[0063] 采用SCE‑UA优化算法,对模型参数进行寻优。根据预报断面对洪峰、洪量、过程匹配度等的精度要求,分别选取洪峰MRE、洪量MRE、NSE作为目标函数,进行多目标参数寻优;或是综合考虑上述多个目标,构建综合目标函数,进行单目标参数寻优。
[0064] 进一步地,所述步骤5中,具体步骤如下:
[0065] 在实际应用中,采用同一水文气候一致区内各流域的全部场次洪水一同进行LSTM模型的训练。对该水文气候一致区内特定流域的洪水预报,选取优化后的模型参数以及训练后的模型结构,以预处理后水文数据作为模型输入,模型输出为该流域出口控制断面的预报流量,从而实现区域内各流域出口断面的洪水预报。
[0066] 本发明相较于现有技术具有如下的优点及效果:
[0067] (1)本发明提供的区域化LSTM洪水预报方法,对整个水文气候一致区构建LSTM洪水预报模型,重点在于综合利用一致区内各流域已有的信息,构成具有物理依据的反映流域特征信息的综合表征指标。该指标消除了流域面积、汇流时间、比降因素的影响,以该指标为基础构建的模型能够反映该一致区内流域特征的区域性规律。
[0068] (2)本发明提供的区域化LSTM洪水预报方法,综合区域内各种信息,在水文气候一致区内有较好的应用前景,为区域内实测资料序列匮乏或无资料地区的洪水预报提供有效的参考手段,有效提高了一致区内各流域洪水预报的准确性和可靠性,弥补了一致区内单个流域由于信息匮乏而造成无法进行洪水预报的不足。

附图说明

[0069] 图1是本发明区域化LSTM洪水预报方法的流程图;
[0070] 图2是流域内水文站点分布示意图;
[0071] 图3是北望站2016年场次洪水模拟精度图;
[0072] 图4是北望站2019年场次洪水模拟精度图。

具体实施方式

[0073] 下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0074] 如图1所示,
[0075] 步骤1、选取山东省水文一致区内36个流域,261场洪水的雨量、流量信息。
[0076] 步骤1.1、逐个流域进行水文资料预处理,流域i含有m个雨量站、n个流量站,对水文资料进行区域化处理,使其包含流域信息,其处理过程如下:
[0077] 步骤1.1.1、收集整理该水文气候一致区内的水文数据,原始雨量资料序列Pi、原始流量资料序列Qi如下:
[0078]
[0079]
[0080] 其中,流量数据仅考虑流域出口控制断面单个站点的流量Qi,c,(c∈[1,n]);
[0081] 步骤1.1.2、流域特征单因子表征指标构建:
[0082] 雨量资料的流域特征单因子表征指标:不考虑各个雨量站控制面积大小的影响,即视为等面积 同时不考虑汇流路径、比降等指标的影响,各单因子表征指标如下:
[0083]
[0084] 流量资料的流域特征单因子表征指标:由于所选取的流量站为流域出口控制断面流量站,其控制面积为流域总面积,即 同时不考虑汇流路径、比降等指标的影响,各单因子表征指标如下:
[0085]
[0086] 步骤1.1.3、流域特征综合因子表征指标构建:
[0087] 雨量资料的流域特征综合表征指标:
[0088]
[0089]
[0090] 流量资料的流域特征综合表征指标:
[0091]
[0092] 步骤1.1.4、结合流域信息综合表征指标 与原始水文数据Pi、Qi,构建包含区域因子的雨量数据
[0093]
[0094] 步骤1.1.5、该水文气候一致区内各流域的预报因子长度均初定为12个时间单位;
[0095] 步骤1.2、对区域化处理后的水文数据Pi、Qi进行min‑max标准化处理,公式如下:
[0096]
[0097] 其中,x*为归一化处理后的数据,x为待处理的原始数据,xmin为原始数据中的最小值,xmax为原始数据中的最大值,归一化处理后的数据值在0到1之间。
[0098] 步骤2、共收集本水文气候一致区内36个流域的水文资料,其中选取3个流域(东里店,柴胡店,北望)作为验证流域,其余33个流域作为率定流域;初定区域化LSTM模型的参数,可预报时间长度为36个时间单位,运用率定流域的数据进行模型训练。
[0099] 步骤3、选取洪峰相对误差绝对值平均、洪量相对误差绝对值平均、纳什效率系数作为精度评价指标,利用验证流域数据进行区域化LSTM洪水预报模型的精度评价;选取北望站做单站LSTM洪水预报;两者精度对比如下表1所示,对北望站2016年、2019年场次洪水模拟精度图分别如图3、图4所示:
[0100] 表1区域化、单站LSTM预报精度对比表
[0101]
[0102] 步骤4、采用SCE‑UA算法,选取以洪峰MRE、洪量MRE、NSE为基础构建的综合指标作为目标函数,进行模型参数寻优;保存模型结构以及优化后的模型参数。
[0103] 步骤5、在实际应用过程中,选取优化后的模型参数以及训练后的模型结构,按步骤1所述预处理水文数据作为模型输入,即可实现区域化LSTM洪水预报。
[0104] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。