基于三重多层感知机的数值天气预报混合资料同化方法转让专利
申请号 : CN202010646132.7
文献号 : CN111783361B
文献日 : 2021-03-12
发明人 : 黄丽蓝 , 宋君强 , 任开军 , 李小勇 , 冷洪泽 , 邓科峰 , 汪祥 , 陈睿 , 王东紫
申请人 : 中国人民解放军国防科技大学
摘要 :
权利要求 :
1.基于三重多层感知机的数值天气预报混合资料同化方法,其特征在于,包括以下步骤:
步骤1,建立基于三维变分资料同化方法的第一感知机模型,并对第一感知机模型进行训练;
步骤2,建立基于集合卡尔曼滤波器资料同化方法的第二感知机模型,并对第二感知机模型进行训练;
步骤3,建立混合同化的第三感知机模型;
步骤4,根据第一感知机模型和第二感知机模型的输出对第三感知机模型进行训练;
步骤5,使用训练好的第一感知机模型、第二感知机模型和第三感知机模型来计算获得分析场数据;
所述的第一感知机模型、第二感知机模型和第三感知机模型均为前馈神经网络模型构成,第一感知机模型和第二感知机模型的输入均为背景场序列和观测值序列,输出分别为三维变分资料同化方法对应的分析场和集合卡尔曼滤波器资料同化方法对应的分析场,所述的第一感知机模型和第二感知机模型的输出作为第三感知机模型的输入,第三感知机模型的输出为优化后的分析场;
所述的第一感知机模型的训练过程包括以下步骤:步骤101,准备第一训练数据集,包括背景场序列、观测值序列和对应的分析场;
所述第一训练数据集中的背景场序列和观测值序列长度均为6,即采用6次背景场和6次观测值进行资料同化,对应的分析场表示为:其中, 表示t时刻的分析场, 表示t-i时刻的背景场, 表示t-i时刻的观测值,3Dωt-i和3Dvt-i分别是 和 的权重,bias3D表示偏差;
所述第一训练数据集中对应的分析场是通过三维变分资料同化方法计算所得;
步骤102,使用所述的训练数据集训练所述的第一感知机模型;
所述的第二感知机模型的训练过程包括以下步骤:步骤201,准备第二训练数据集,包括背景场序列、观测值序列和对应的分析场;
所述第二训练数据集中的背景场序列和观测值序列长度均为6,即采用6次背景场和6次观测值进行资料同化,对应的分析场表示为:其中 表示t时刻的分析场, 表示t-i时刻的背景场, 表示t-i时刻的观测值,Enωt-i和Envt-i分别是 和 的权重,biasEn表示偏差;
所述第二训练数据集中对应的分析场是通过集合卡尔曼滤波器资料同化方法计算所得;
步骤202,使用所述的训练数据集训练所述的第二感知机模型。
2.根据权利要求1所述的数值天气预报混合资料同化方法,其特征在于,所述的三维变分资料同化的分析场计算公式为:xa=xb+[B-1+HTR-1h]-1HTR-1(y-h(xb))其中,xa表示分析场,xb表示背景场,B表示背景误差协方差矩阵,H是线性观测算子h的切线性算子,R表示观测误差协方差矩阵,y表示观测值;所述的三维变分资料同化的分析场计算公式通过变换获得目标函数的梯度信息,随后采用最优化方法迭代求解分析场计算公式的近似极小值。
3.根据权利要求1或2所述的数值天气预报混合资料同化方法,其特征在于,所述的第一感知机模型、第二感知机模型和第三感知机模型通过数值实验测定隐藏层个数以及每个隐藏层中的神经元数目,在所述的多层感知机中以ReLU为激活函数得到非线性结果,其损失函数为均方根误差MSE。
4.根据权利要求3所述的数值天气预报混合资料同化方法,其特征在于,所述的第一感知机模型、第二感知机模型训练时学习率η=0.0005,当损失值达到10-5时训练停止,所述的第三感知机采用无隐藏层结构,直接由输出层加权得到输出层,训练时权重从0.1到1,递增率为0.1,两个权重占比之和为1。
说明书 :
基于三重多层感知机的数值天气预报混合资料同化方法
技术领域
背景技术
一个过程,将观测和短期预报(也就是背景场或初猜测值)中的所有可用的数据资源结合起
来,得到分析场,希望得到对实际大气状态的概率密度的最佳估计。即资料同化的目标是为
数值天气预报产生最精确的初始条件。
来自不同信息的不确定性,这些方法以相同的策略为指导,使用新的观测值来修正指定网
格点的初猜测值,即通过最小化代价函数来组合背景场和观测值,代价函数由两个方面组
成:一部分是对背景均值距离的惩罚项和另一个惩罚项是对观察值的距离。但是,具体的实
现方式各不相同。首先,Var通过给出一个静态背景误差协方差矩阵(B)直接同化大量的观
测数据,该矩阵是根据气候数据事先计算得到的。因此,静态B不能正确地表示真正的时空
误差统计。Var分为3D Var和4D Var,前者利用单时刻数据,后者利用给定长度的时间窗口
的数据估计初始状态。虽然在4D Var中,B隐式地随流依赖变化而演化,并且可以获得比3D
Var更好的初始状态,但它需要昂贵的计算代价,并且需要建立线性模型和伴随性数值模
型,这是很难建立的。其次,EnKF提供了集合驱动的B,随着系统的发展而变化,优于3D Var
的B。此外,EnKF不需要线性模型和伴随性数值模型,这节省了巨大的计算开销。
两种方法,称为混合资料同化方法。集合-变分方法以背景误差协方差的流依赖性为出发
点,结合变分方法的静态背景误差协方差和集合方法的动态背景误差协方差,重构背景误
差协方差。实验证明,将两个背景误差协方差联合起来得到一个重新校准且更稳健的B是有
效的。也就是说,混合资料同化方法与纯变分方法或纯集合方法更具有竞争性。然而,集合
预报误差协方差和静态背景误差协方差不同的贡献比率直接影响分析场的质量。尽管NWP
中心有能力在业务系统中实现混合资料同化方法,但在资料同化系统中要处理不确定性和
7
自由度大的背景误差协方差矩阵(通常≥O(10))需要很大的代价。因此,实际业务上使用
经验比例来减轻巨大的计算成本,但牺牲了最佳的精度。
经验性质,则这个子模型可以被机器学习模型所替代。自然地,将非线性神经网络与动力学
模型相结合,形成混合神经-动力学模型,成为一类新的变分资料同化方法。在近似相同的
资料同化效果下,神经网络在计算速度上有显著提升,多次实验检验,速度提升接近90倍,
甚至更高。
料,通过模拟已有的资料同化方法来加速同化过程,并没有提高同化效果。其主要原因是,
研究人员仅仅关注了数据的统计特征,而忽略了大气状态本身的物理性质。
发明内容
资料同化方法进行模拟和优化,自适应地学习耦合权值矩阵,将多种资料同化方法进行耦
合,使得本发明方法提出的基于神经网络的混合同化方法的同化性能较传统方法得到有效
提升。
别为三维变分资料同化方法对应的分析场和集合卡尔曼滤波器资料同化方法对应的分析
场,所述的第一感知机模型和第二感知机模型的输出作为第三感知机模型的输入,第三感
知机模型的输出为优化后的分析场。
析场计算公式通过适当变换获得目标函数的梯度信息,随后采用最优化方法迭代求解分析
场计算公式的近似极小值。
激活函数得到非线性结果,其损失函数为均方根误差MSE。
到输出层,训练时权重从0.1到1,递增率为0.1,两个权重占比之和为1。
数据集,分别利用第一感知机模型和第二感知机模型来优化两类分析场结果,此外还利用
第三感知机模型来对第一感知机和第二感知机的输出进行混合优化,将三维变分资料同化
方法和集合卡尔曼滤波器资料同化方法的分析场耦合起来。本发明方法充分考虑了大气变
量的流依赖,以此引入大气数据本身所包含的时间特征,同时又综合利用了两种传统资料
同化方法的分析场结果,最终使得在数值天气预报中的资料同化效果更佳。
附图说明
具体实施方式
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
化代价函数J来估计数值天气预报模型的单个初始状态,找到分析场。代价函数J表示为:
存储空间,因此在实际解决这个问题时,并不直接求解式(5),而是通过适当变换获得目标
函数的梯度信息,随后采用最优化方法(如牛顿法、拟牛顿法、BFGS法、LBFGS法等)迭代求解
式(5)的近似极小值。
复杂的问题。多层感知器又称为前馈神经网络(ANN),具有全连接的结构,除了输入层外,每
个节点都可以看作具有非线性激活函数的处理单元。如果每一个激活函数都是线性函数,
则任意层中多层感知器的每个节点都可以简化为感知器。即多层感知器是一种经典的深度
神经网络,它是一类通用的逼近器。一个多层感知器如果具有线性输出层和至少一层提供
非线性变换的激活函数的隐藏层,给定网络各层合适的神经元数量,MLP可以实现高精度地
拟合可测函数,即多层感知器的目标是拟合某个函数f(x)。
为t时,根据式(10)找到耦合两个信息的最佳权重矩阵(ω)。
别为三维变分资料同化方法对应的分析场和集合卡尔曼滤波器资料同化方法对应的分析
场,所述的第一感知机模型和第二感知机模型的输出作为第三感知机模型的输入,第三感
知机模型的输出为优化后的分析场。所述的多层感知机的结构如图3所示;
析场计算公式通过适当变换获得目标函数的梯度信息,随后采用最优化方法迭代求解分析
场计算公式的近似极小值。
激活函数得到非线性结果,其损失函数为均方根误差MSE。
到输出层,训练时权重从0.1到1,递增率为0.1,两个权重占比之和为1。
Runge-Kutta时间差分格式进行时间积分,时间步长dt=0.01,在模拟积分步长111000下,
可以通过积分公式(13)中的方程来获得真实场(xt)。在实际大气模型中,变量的地面真值
通常用来表示xt。在真实状态中加入高斯分布的随机观测误差,以近似观测值。此外,我们
还设置了线性观测算子h=I和观测误差协方差矩阵R=I,其中I是三阶单位矩阵。同样,在
相同的初始条件下,采用传统的资料同化方法3D-Var(或EnKF)的同化系统分别完成111000
次同化分析周期,生成分析场(xa)。其中,为达到Lorenz-63系统的稳定状态和获得近似模
拟大气,需进行前1000个积分时间步的spinning up;中间10万步用于准备Cache-MLP的训
练集,最后1万步为测试数据。
3D-Var与EnKF分析场耦合的经验权重为一个固定的比例,即从0.1到1,递增率为0.1,两者
占比之和为1,即比例(3DVar)+比例(EnKF)=1。可知,当3D Var的xa占比为10%,来自EnKF
的xa占比为0.9时,可以得到RMSE的最小平均值为0.1386,如图4。
一项为平流项,第二项为阻尼项。此外,F代表一个外部强迫常数,设置为8,这是一个已知的
形成混沌行为的一般值。Lorenz-96是一个用于模拟大气变量时间演化的周期系统。
Lorenz-96 0.2943 0.2530 14.03
传统方法得到有效提升。本发明方法是在传统的分析周期的基础上,获取由背景场和观测
值组成的训练数据集,训练神经网络来优化分析场,充分考虑了大气变量的流依赖,神经网
络模型的输出值不依赖于单一时间的数据,而是与前五个时间步长数据的有关,以此引入
大气数据本身所包含的时间特征,使得在数值天气预报中的本发明方法资料同化效果更
佳。