一种基于卷积生成对抗网络的含水层参数场反演方法转让专利

申请号 : CN202210738233.6

文献号 : CN114818548B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 莫绍星施小清吴吉春

申请人 : 南京大学

摘要 :

本发明公开了一种基于卷积生成对抗网络的含水层参数场反演方法,利用卷积生成对抗网络构建和学习含水层参数场的非均质特征到低维标准正态分布向量的映射关系,实现复杂非均质特征的简单参数化表征,既充分考虑和保留了含水层参数场的复杂非均质特征,又显著减少了待估计参数的数量。本发明通过将卷积生成对抗网络与多步数据同化集合平滑算法结合,基于地下水流‑溶质运移数值模型、水头和浓度观测数据,只需估计低维正态分布变量,即可高效可靠地实现复杂非均质含水层参数场反演,进而有效提高地下水数值模型的仿真性和可靠性。

权利要求 :

1.一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,包括如下步骤:

步骤SS1:收集含水层地质参数先验资料,由地质统计软件随机生成满足先验信息的含水层参数场样本集;

步骤SS2:将所述含水层参数场样本集输入到卷积生成对抗网络,对其地质统计特征进行学习,并基于所述含水层参数场样本集构建低维标准正态分布和其地质统计特征之间的映射关系,建立含水层参数场生成模型;所述步骤SS2具体包括:所述卷积生成对抗网络包含生成器G和判别器D;所述生成器G用于:学习含水层参数场的地质统计特征、构建低维标准正态分布和其地质统计特征之间的映射关系,形成含水层参数场生成模型,即给定低维标准正态分布变量输入,生成含水层参数场样本;所述判别器D用于判断生成器G生成的含水层参数场样本是否符合地质统计特征;

所述步骤SS2中的卷积生成对抗网络的生成器G和判别器D进行交替对抗训练,生成器G训练所采用的损失函数为:判别器D训练所采用的损失函数为:

公式(1)和(2)中,N表示训练样本的数量, 表示低维标准正态分布变量, 表示由生成器G生成的含水层参数场样本, 表示由地质统计软件生成的含水层参数场样本;

步骤SS3:构建地下水流‑溶质运移初始数值模型,模拟水流和溶质运移过程;

步骤SS4:随机生成一系列低维标准正态分布变量样本,并输入到训练好的卷积生成对抗网络,得到对应的含水层参数场样本;

步骤SS5:将步骤SS4中生成的含水层参数场样本输入到所述步骤SS3中的所述地下水流‑溶质运移数值模型中,获得观测点处的水头和浓度模拟值;

步骤SS6:基于水头和浓度的模拟值和观测值,利用多步数据同化集合平滑算法,更新低维标准正态分布变量样本;

步骤SS7:将步骤SS6中更新后的低维标准正态分布变量样本,输入到训练好的卷积生成对抗网络,得到更新后的含水层参数场样本,并输入所述地下水流‑溶质运移数值模型,得到更新后的含水层参数场对应的观测点处水头和浓度模拟值;

步骤SS8:重复步骤SS6和步骤SS7,直到达到预设的收敛标准;将最后一次迭代得到的低维标准正态分布变量样本,输入到卷积生成对抗网络,得到对应的后验含水层参数场。

2.根据权利要求1所述的一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,所述步骤SS1包括:生成满足含水层地质参数先验资料的随机参数场样本。

3.根据权利要求1所述的一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,所述的卷积生成对抗网络的生成器G采用卷积多重残差密集块代替传统卷积层作为网络的基本架构。

4.根据权利要求1所述的一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,所述的卷积生成对抗网络的生成器G为全卷积网络,即生成器G中全为卷积层,不含全连接层。

5.根据权利要求1所述的一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,所述步骤SS6中的多步数据同化集合平滑算法,采用如下公式更新待估计参数样本:公式(3)中,i=1, …, Niter为迭代因子,共Niter次迭代;j=1, …, Ne为样本因子,集合中共包含Ne个样本; 和 分别表示更新前后的参数, 表示参数和观测值的交互协方差矩阵, 为观测误差协方差矩阵, 为扰动因子, 为添加扰动后的观测值,扰动误差为正态分布,所述扰动误差的协方差矩阵为 , 为给定输入参数 条件下的模型模拟值。

6.根据权利要求1所述的一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,所述步骤SS6中采用的多步数据同化集合平滑算法,只需反演低维标准正态分布变量,再输入到卷积对抗生成网络,获得对应的含水层参数场。

7.根据权利要求1所述的一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,所述步骤SS6 步骤SS8循环通过编写Python脚本自动实现如下过程:给定低维标准~正态分布样本输入生成含水层参数场实现、运行地下水流‑溶质运移模型获取水头和溶质浓度模拟值、调用多步数据同化集合平滑算法更新低维标准正态分布样本、判断是否达到收敛标准、输出后验样本。

说明书 :

一种基于卷积生成对抗网络的含水层参数场反演方法

技术领域

[0001] 本发明涉及一种基于卷积生成对抗网络的含水层参数场反演方法,属于水文地质领域地下水数值模拟反演技术领域。

背景技术

[0002] 地下水流‑溶质运移数值模拟技术是再现和预测含水层中水流和溶质运移过程的重要工具,已被广泛应用于地下水污染过程研究、地下水污染溯源和风险评估等领域。
[0003] 为了得到可靠的地下水流‑溶质运移数值模拟结果,需要准确刻画含水层的参数场。由于地下介质的非均质性和观测数据缺乏,直接基于钻井数据刻画参数场的分布具有很大不确定性,影响模拟结果的可靠性。因此,通常需要基于水头和浓度等观测数据通过反演模拟对参数场进一步推估校正。
[0004] 然而,直接对非均质参数场进行反演,会由于待估计的参数过多造成巨大的计算量(即“维数灾难”问题)。为了减少估计参数的数量,通常需要对参数场的非均质性进行简化,以此来减少求解反演问题的计算量,但这会降低模型的保真性和仿真性,进而限制地下水流‑溶质运移数值模拟技术的可靠性和应用范围。为了提高含水层参数场反演的效率和可靠性,将深度学习技术与传统反演方法结合是一种值得探索的方案。

发明内容

[0005] 本发明目的在于,克服现有技术存在的技术缺陷,提供一种基于卷积生成对抗网络的含水层参数场反演方法,该方法通过发展和应用卷积生成对抗网络,实现对复杂非均质含水层参数场的简单参数化表征,在反演计算中,只需估计低维标准正态分布变量,即可高效可靠地实现复杂非均质含水层参数场的反演,从而提高地下水流‑溶质运移模拟技术的可靠性。
[0006] 本发明采用如下技术方案:一种基于卷积生成对抗网络的含水层参数场反演方法,包括如下步骤:
[0007] 步骤SS1:收集含水层地质参数先验资料,由地质统计软件随机生成满足先验信息的含水层参数场样本集;
[0008] 步骤SS2:将所述含水层参数场样本集输入到卷积生成对抗网络,对其地质统计特征进行学习,并基于所述含水层参数场样本集构建低维标准正态分布和其地质统计特征之间的映射关系,建立含水层参数场生成模型;
[0009] 步骤SS3:构建地下水流‑溶质运移初始数值模型,模拟水流和溶质运移过程;
[0010] 步骤SS4:随机生成一系列低维标准正态分布变量样本,并输入到训练好的卷积生成对抗网络,得到对应的含水层参数场样本;
[0011] 步骤SS5:将步骤SS4中生成的含水层参数场样本输入到所述步骤SS3中的所述地下水流‑溶质运移数值模型中,获得观测点处的水头和浓度模拟值;
[0012] 步骤SS6:基于水头和浓度的模拟值和观测值,利用多步数据同化集合平滑算法,更新低维标准正态分布变量样本;
[0013] 步骤SS7:将步骤SS6中更新后的低维标准正态分布变量样本,输入到训练好的卷积生成对抗网络,得到更新后的含水层参数场样本,并输入所述地下水流‑溶质运移数值模型,得到更新后的含水层参数场对应的观测点处水头和浓度模拟值;
[0014] 步骤SS8:重复步骤SS6和步骤SS7,直到达到预设的收敛标准;将最后一次迭代得到的低维标准正态分布变量样本,输入到卷积生成对抗网络,得到对应的后验含水层参数场。
[0015] 作为一种较佳的实施例,所述步骤SS1包括:生成满足含水层地质参数先验资料的随机参数场样本。
[0016] 作为一种较佳的实施例,所述步骤SS2具体包括:所述卷积生成对抗网络包含生成器G和判别器D;所述生成器G用于:学习含水层参数场的地质统计特征、构建低维标准正态分布和其地质统计特征之间的映射关系,形成含水层参数场生成模型,即给定低维标准正态分布变量输入,生成含水层参数场样本;所述判别器D用于判断生成器G生成的含水层参数场样本是否符合地质统计特征。
[0017] 作为一种较佳的实施例,所述步骤SS2中的卷积生成对抗网络的生成器G和判别器D进行交替对抗训练,生成器G训练所采用的损失函数为:
[0018]
[0019] 判别器D训练所采用的损失函数为:
[0020]
[0021] 公式(1)和(2)中,N表示训练样本的数量, 表示低维标准正态分布变量,表示由生成器G生成的含水层参数场样本, 表示由地质统计软件生成的含水层参数场样本。
[0022] 作为一种较佳的实施例,所述的卷积生成对抗网络的生成器G采用卷积多重残差密集块代替传统卷积层作为网络的基本架构。
[0023] 作为一种较佳的实施例,所述的卷积生成对抗网络的生成器G为全卷积网络,即生成器G中全为卷积层,不含全连接层。
[0024] 作为一种较佳的实施例,所述步骤SS6中的多步数据同化集合平滑算法,采用如下公式更新待估计参数样本:
[0025]
[0026] 公式(3)中,i=1, …, Niter为迭代因子,共Niter次迭代;j=1, …, Ne为样本因子,集合中共包含Ne个样本; 和 分别表示更新前后的参数, 表示参数和观测值的交互协方差矩阵, 为观测误差协方差矩阵, 为扰动因子, 为添加扰动后的观测值,扰动误差为正态分布,所述扰动误差的协方差矩阵为 , 为给定输入参数条件下的模型模拟值。
[0027] 作为一种较佳的实施例,所述步骤SS6中采用的多步数据同化集合平滑算法,只需反演低维标准正态分布变量,再输入到卷积对抗生成网络即可获得对应的含水层参数场。
[0028] 作为一种较佳的实施例,所述步骤SS6 步骤SS8循环通过编写Python脚本自动实~现如下过程:给定低维标准正态分布样本输入生成含水层参数场实现、运行地下水流‑溶质运移模型获取水头和溶质浓度模拟值、调用多步数据同化集合平滑算法更新低维标准正态分布样本、判断是否达到收敛标准、输出后验样本。
[0029] 本发明所达到的有益效果:本发明利用卷积生成对抗网络将复杂的含水层非均质参数场映射到低维标准正态分布空间,在保留参数场非均质特征的前提下,相比现有技术能大幅减少反演参数的数量,从而显著提高含水层参数场反演的效率和地下水流‑溶质运移模拟技术的可靠性。

附图说明

[0030] 图1为本发明涉及的基于卷积生成对抗网络的含水层参数场反演流程框架示意图。
[0031] 图2为卷积生成对抗网络的结构示意图,卷积层和转置卷积层中,均包含3个部分:卷积/转置卷积、批归一化和激活函数,生成器采用ReLU激活函数,判别器采用LeakyReLU激活函数,生成器的最后一个卷积层只包含卷积操作。
[0032] 图3为卷积生成对抗网络采用的卷积多重残差密集块结构示意图,采用两重残差连接结构。
[0033] 图4为地质统计软件GSLIB和卷积生成对抗网络生成的随机对数渗透系数场样本比较。
[0034] 图5为目标含水层对数渗透系数场、随机生成的先验对数渗透系数场、反演得到的后验对数渗透系数场和后验样本的标准差场,其中黑色菱形点为示踪剂释放位置、白色圆点为水头和浓度观测点位置。

具体实施方式

[0035] 下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0036] 实施例1:如图1所示,本发明提出一种基于卷积生成对抗网络的含水层参数场反演方法,其特征在于,包括如下步骤:
[0037] 步骤SS1:收集含水层地质参数先验资料,由地质统计软件随机生成满足先验信息的含水层参数场样本集;
[0038] 步骤SS2:将所述含水层参数场样本集输入到卷积生成对抗网络,对其地质统计特征进行学习,并基于所述含水层参数场样本集构建低维标准正态分布和其地质统计特征之间的映射关系,建立含水层参数场生成模型;
[0039] 步骤SS3:构建地下水流‑溶质运移初始数值模型,模拟水流和溶质运移过程;
[0040] 步骤SS4:随机生成一系列低维标准正态分布变量样本,并输入到训练好的卷积生成对抗网络,得到对应的含水层参数场样本;
[0041] 步骤SS5:将步骤SS4中生成的含水层参数场样本输入到所述步骤SS3中的所述地下水流‑溶质运移数值模型中,获得观测点处的水头和浓度模拟值;
[0042] 步骤SS6:基于水头和浓度的模拟值和观测值,利用多步数据同化集合平滑算法,更新低维标准正态分布变量样本;
[0043] 步骤SS7:将步骤SS6中更新后的低维标准正态分布变量样本,输入到训练好的卷积生成对抗网络,得到更新后的含水层参数场样本,并输入所述地下水流‑溶质运移数值模型,得到更新后的含水层参数场对应的观测点处水头和浓度模拟值;
[0044] 步骤SS8:重复步骤SS6和步骤SS7,直到达到预设的收敛标准;将最后一次迭代得到的低维标准正态分布变量样本,输入到卷积生成对抗网络,得到对应的后验含水层参数场。
[0045] 作为一种较佳的实施例,所述步骤SS1包括:生成满足含水层地质参数先验资料的随机参数场样本。
[0046] 作为一种较佳的实施例,所述步骤SS2具体包括:所述卷积生成对抗网络包含生成器G和判别器D;所述生成器G用于:学习含水层参数场的地质统计特征、构建低维标准正态分布和其地质统计特征之间的映射关系,形成含水层参数场生成模型,即给定低维标准正态分布变量输入,生成含水层参数场样本;所述判别器D用于判断生成器G生成的含水层参数场样本是否符合地质统计特征。
[0047] 作为一种较佳的实施例,所述步骤SS2中的卷积生成对抗网络的生成器G和判别器D进行交替对抗训练,生成器G训练所采用的损失函数为:
[0048]
[0049] 判别器D训练所采用的损失函数为:
[0050]
[0051] 公式(1)和(2)中,N表示训练样本的数量, 表示低维标准正态分布变量,表示由生成器G生成的含水层参数场样本, 表示由地质统计软件生成的含水层参数场样本。
[0052] 作为一种较佳的实施例,所述的卷积生成对抗网络的生成器G采用卷积多重残差密集块代替传统卷积层作为网络的基本架构,使得网络训练更稳定、其学习低维标准正态分布到地质统计特征复杂映射的能力更强。
[0053] 作为一种较佳的实施例,所述的卷积生成对抗网络的生成器G为全卷积网络,即生成器G中全为卷积层,不含全连接层。这种全卷积网络结构不仅能够充分学习含水层参数场的空间统计特征,而且能显著减少网络参数的数量。
[0054] 作为一种较佳的实施例,所述步骤SS6中的多步数据同化集合平滑算法,采用如下公式更新待估计参数样本:
[0055]
[0056] 公式(3)中,i=1, …, Niter为迭代因子,共Niter次迭代;j=1, …, Ne为样本因子,集合中共包含Ne个样本; 和 分别表示更新前后的参数, 表示参数和观测值的交互协方差矩阵, 为观测误差协方差矩阵, 为扰动因子(通常设为 ),为添加扰动后的观测值,扰动误差为正态分布,所述扰动误差的协方差矩阵为, 为给定输入参数 条件下的模型模拟值。
[0057] 作为一种较佳的实施例,所述步骤SS6中采用的多步数据同化集合平滑算法,只需反演低维标准正态分布变量,再输入到卷积对抗生成网络即可获得对应的含水层参数场。从而显著减少了反演参数的个数、提高了计算效率。
[0058] 作为一种较佳的实施例,所述步骤SS6 步骤SS8循环通过编写Python脚本自动实~现如下过程:给定低维标准正态分布样本输入生成含水层参数场实现、运行地下水流‑溶质运移模型获取水头和溶质浓度模拟值、调用多步数据同化集合平滑算法更新低维标准正态分布样本、判断是否达到收敛标准、输出后验样本。
[0059] 本发明以地质统计软件GSLIB根据某实际含水层的地质参数先验信息,随机生成的一个渗透系数场实现作为目标参数场,如图5所示,地下水由左向右方向流动,水力坡度设为0.04,在上游3口井释放示踪剂,在下游24口观测井的10个不同深度收集水头和8个时刻的示踪剂浓度数据,共计2 160个观测数据。为了模拟实际情况的观测误差,对所收集的2 160个观测数据添加5%的噪声扰动,基于所收集的观测数据对渗透系数场进行反演。具体实施步骤包括7个阶段:
[0060] 第1阶段:基于先验信息,由GSLIB生成具有不同地质统计特征(均值、方差、三个方向的相关长度)的40 000个渗透系数场随机场样本。
[0061] 第2阶段:基于第1阶段生成的40 000个样本训练卷积生成对抗网络,学习如公式(4)所示由256维标准正态分布到包含10×32×64=20 480个空间网格的渗透系数随机场的函数映射关系 :
[0062]
[0063] 卷积生成对抗网络的结构如图2和3所示,网络训练采用如公式(1)和(2)所示的损失函数进行,采用Pytorch库中自带的Adam优化器更新网络参数,生成器和判别器的学习率均设置为0.0002,样本批大小(batch size)设置为100,训练轮回(epoch)数设置为50,Adam优化器的其它参数均使用系统默认值。
[0064] 第3阶段:随机生成400组256维标准正态分布变量样本,输入卷积生成对抗网络的生成器,得到对应的400组渗透系数场实现。图4对比了由地质统计软件和卷积生成对抗网络生成的随机渗透系数场实现,由图可见,由卷积生成对抗网络生成的渗透系数场与地质统计软件生成的渗透系数场,具有相似的非均质特征。
[0065] 第4阶段:给定生成的400组渗透系数场实现,作为地下水流‑溶质运移模型的输入,获取水头和示踪剂浓度观测数据相对应采样位置和时间的模拟值。
[0066] 第5阶段:基于2160个水头和示踪剂浓度观测数据,以及400组渗透系数场条件下模型的模拟值,使用多步数据同化集合平滑算法(设置迭代次数为20次)基于公式(3)所示的方程更新400组256维标准正态分布变量样本。
[0067] 第6阶段:将更新后的400组256维标准正态分布变量样本,输入卷积生成对抗网络的生成器,得到更新后的400组渗透系数场实现。
[0068] 第7阶段:判断是否达到最大迭代次数,若未达到最大迭代次数,则重复第4‑6阶段;若已达到最大迭代次数,终止循环,将最后一次迭代更新得到的400组渗透系数场实现作为反演渗透系数场的后验样本。
[0069] 步骤4‑7循环通过编写Python脚本自动实现:给定低维标准正态分布样本输入生成含水层参数场实现、运行地下水流‑溶质运移模型获取水头和溶质浓度模拟值、调用多步数据同化集合平滑算法更新低维标准正态分布样本、判断是否达到收敛标准、输出后验样本。
[0070] 图5显示了目标含水层参数场、随机选取的1个先验和1个后验含水层参数场、以及含水层参数场的反演标准差(由400个后验样本计算得到),由图5可见,先验含水层参数场与目标参数场差别显著,而基于水头和浓度观测数据反演得到的含水层参数场则与目标参数场的分布非常接近。
[0071] 值得一提的是,在反演过程中只需估计256个标准正态分布变量,即可反演得到20 480个网格的渗透系数值,在没有损失含水层参数场非均质特征的前提下,减少了98.75%的反演参数个数。由此可见,本发明可以有效且高效地实现含水层参数场的反演识别。
[0072] 本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0073] 本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0074] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。