基于果蝇优化算法的水质机理建模及水质预测方法转让专利

申请号 : CN201810862667.0

文献号 : CN109033648B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 赵峙尧王小艺周宇琴许继平王立于家斌

申请人 : 北京工商大学

摘要 :

本发明公开了一种基于果蝇优化算法的水质机理建模及水质预测方法,属于环境工程技术领域。本发明首先结合水质演化机理,提出了一种基于果蝇优化算法的湖库水质机理建模及水质预测方法。在已知水质测量数据的基础上,利用果蝇优化算法估计水质机理模型的未知参数。在此基础上,利用蒙特卡洛仿真预测水质演化过程,获得水质指标未来时刻取值的概率分布,实现水质预测。本发明能建立准确的水质机理模型,基于果蝇优化算法的水质机理建模方法能够准确估计水质机理模型的未知参数,与已有方法相比提高了优化精度和速度;水质预测方法能有效实现水质预测,且考虑更加全面、准确,克服了单值预测结果带来的偶然性。

权利要求 :

1.基于果蝇优化算法的水质机理建模及水质预测方法,其特征在于:具体步骤如下,步骤一:建立水质机理模型;

基于水质指标,DO、Phyt、BOD、OP、PO4、ON、NH3-N和NO3-N,建立水质机理模型;DO、Phyt、BOD、OP、PO4、ON、NH3-N和NO3-N分别为溶解氧、浮游植物、碳生化需氧量、有机磷、正磷酸盐、有机氮、氨氮和硝酸盐氮;

水质机理模型的数学模型为上述8个水质指标方程组成的一组非线性连续微分方程组:其中, 分别表示水质指标DO、Phyt、BOD、OP、PO4、ON、NH3-N和NO3-N的浓度, 分别表示所述水质指标浓度的微分;Phyt的浓度由叶绿素a的浓度表征;参数{k1,k2,…,k13}为水质机理模型的未知的模型参数;

θ=(k1,k2,k3,k4,k5,k6,k7,k8,k9,k10,k11,k12,k13)Τ且假设水质机理模型的模型参数是慢变的,则式(1)表示为:上式中,f(x,θ)为式(1)给出的水质机理模型;

步骤二:基于果蝇优化算法的水质机理建模方法;

首先,将式(2)写成离散化形式如下:

上式中, xt为t时刻的水质指标,xt-1为t-1时刻的水质指标;θt为t时刻的模型参数,θt-1为t-1时刻的模型参数;水质指标的过程噪声ωx,t-1为t-1时刻的水质指标的过程噪声,模型参数的过程噪声ωθ,t-1为t-1时刻的模型参数的过程噪声,其中Σx、Σθ为相应的过程噪声协方差阵;h是预测步长,h≤1day,t为离散时间点;

将果蝇优化算法寻优过程中的模型参数代入味道浓度函数中,获得该组模型参数的味道浓度,在果蝇种群中,对比每个果蝇的味道浓度,并找出最优的味道浓度和该果蝇位置,该果蝇位置即最佳位置,其余果蝇利用视觉飞往所述的最佳位置,最后在不断迭代过程中获得最优参数解;基于果蝇优化算法的水质机理建模方法包括初始化和迭代过程两个部分,具体步骤如下:(1)初始化:

设定模型参数初值

设定数据长度为ND,t1=1,2,…,ND;

计算目标函数初值,

x(j,t1)、 分别为t1时刻的水质指标j的真实值和估计值;

保存味道浓度Smell(0)为最佳味道浓度BestSmell;

设定果蝇种群个体数为MaxGroup;

设定果蝇种群个体初始位置均为

设定最大迭代次数MaxGeneration和味道浓度阈值ObjSmell;

(2)迭代过程:for gen=1,2,…,MaxGeneration(2.1)种群寻优过程:for gro=1,2,…,MaxGroup种群中每个果蝇利用嗅觉搜寻食物的随机距离与方向,每一个模型参数θi,i=1,2,…,

13:

X(gro,i)=X_axis(gro,i)+Random valueY(gro,i)=Y_axis(gro,i)+Random value计算果蝇与坐标原点的距离Dist:

计算果蝇的味道浓度判定值S,第gro个果蝇中第i个模型参数的味道浓度判定值S(gro,i)=1/Dist(gro,i),并对每个模型参数赋值θgro,i=S(gro,i)计算第gro个果蝇的目标函数Smell(gro),(2.2)对比寻优过程:

排列果蝇,找到味道浓度最小的果蝇min(Smell),将该果蝇位置记为最优位置(BestX,BestY);

If min(Smell)<BestSmell保存最小味道浓度为最佳味道浓度,BestSmell=min(Smell);

重新定位果蝇群体位置,X_axis=BestX,Y_axis=BestY;

(2.3)判断是否达到最优:

If BestSmell<ObjSmell,寻优结束;

BestS(i)=1/BestDist(i),Bestθi=BestS(i),i=

1,2,…,13;

其中, 为t1时刻的水质指标估计值, 为t1时刻的水质指标真实值;gen表示迭代次数;gro表示果蝇种群中第gro个果蝇;θi=ki,i=1,2,…,13;Random vector的含义为随机向量,Random value的含义为随机值;θgro表示第gro个果蝇寻优的模型参数向量,其中θgro,i为第gro个果蝇寻优的模型参数向量中第i个模型参数,BestDist(i)、BestS(i)、Bestθi分别为果蝇的最优位置、最优味道浓度和最优模型参数;

步骤三:基于蒙特卡洛仿真的河湖水质预测。

2.根据权利要求1所述的基于果蝇优化算法的水质机理建模及水质预测方法,其特征在于:步骤三所述的基于蒙特卡洛仿真的水质预测的具体流程步骤如下:(1)初始化:

设定水质指标 和模型参数初值

蒙特卡洛仿真粒子数NP;

设定预测长度为NT;

(2)蒙特卡洛水质预测:

(m) (m)

对第m个粒子赋初值x0 =x0,θ0 =θ0,m=1,2,…,NP;

单步水质预测,

(3)构建概率密度函数fort2=1,2,…,NT:

8个水质指标的概率密度函数

13个模型参数的概率密度函数

其中,δ表示狄拉克函数, 分别表示在t2时刻的水质指标取值和第m个蒙特卡洛粒子中水质指标在t2时刻的预测值, 分别表示在t2时刻的模型参数取值和第m个蒙特卡洛粒子中模型参数在t2时刻的预测值。

说明书 :

基于果蝇优化算法的水质机理建模及水质预测方法

技术领域

[0001] 本发明设计一种基于果蝇优化算法的水质机理建模及水质预测方法,属于环境工程技术领域。

背景技术

[0002] 水是我们星球上生命的基础,但这种宝贵的资源越来越受到威胁。国际湖泊环境委员会与联合国环境规划署合作开展了题为“世界湖泊状况调查”的项目。该项目收集了全球217个湖泊详细数据。通过这个项目,可以确定六个主要的环境问题都对水质有重大影响,富营养化问题就是其中之一。目前,全球不同地区的湖泊富营养化百分比分别为:亚洲54%,欧洲53%,非洲28%;北美洲48%;南美洲41%,南非60%以上。在中国,据《2016年中国环境公报》,108个监测营养状态的湖泊(水库)中,贫营养的湖泊(水库)有10个,中营养的湖泊(水库)有73个,轻度富营养的湖泊(水库)为20个,中度富营养的湖泊(水库)为5个。因此,水环境问题已刻不容缓。水质机理建模能表现水体内部环境变化,水质预测能有效的掌握水质情况,二者结合能预防大规模水污染事件的发生,对水污染防治具有现实意义,这是解决水环境问题的重要思路。
[0003] 已有的水质建模方法主要分为两类:基于机理的水质建模方法和数据驱动的水质建模方法。(1)基于机理的水质建模方法。这类方法主要是通过分析水体内部的机理演化过程来建立水质模型。已有的经典水质机理模型包括:MIKE、WASP和EFDC等。MIKE是丹麦水动力研究所(DHI)开发,用于模拟河网、河口、滩涂等地区的水质情况,同时也能模拟水体环境中垂向变化常被忽略的湖泊、河口、海岸地区等水质情况,它拥有一维动态模型和二维动态模型,其中二维动态模型能处理三维空间。WASP(The  water quality analysis simulation program)是美国环保局(EPA)开发并推荐使用的用于各类水体水质模拟与分析的软件;它可用于模拟水动力学、河流一维不稳定流、湖泊和河口三维不稳定流、常规污染物和有毒污染物在水中的迁移和转化规律;其基本原理是平移—扩散方程。EFDC(The Environmental Fluid Dynamics Code)模型是涵盖一维到三维地表水水质的数学模型;它可实现河流、湖泊、水库、湿地系统、河口和海洋等水体的水动力学、水质模拟、污染物迁移和泥沙输移等,是一个多参数有限差分模型。(2)数据驱动的水质建模方法。这类方法利用数据分析模型和工具对水质指标的实测数据进行建模。常用的数据驱动模型包括:人工神经网络、时间序列模型和支持向量机等,该类模型均是利用不同时刻的水质指标观测数据建立表征水质演化过程的数据驱动模型。两类方法各具有一定优势,然而基于数据驱动的水质建模效果取决于数据量的数量和质量,且无法合理解释水质指标演化过程。目前,已有的经典水质机理模型通常包含大量未知参数,且仅给定经验取值范围,在此基础上预测水质变化难以满足精度要求。

发明内容

[0004] 本发明为了准确计算水质机理模型中未知参数,提出基于果蝇优化算法(Fruit fly optimization algorithm,FOA)的水质机理建模方法,同时,本发明为了弥补单值预测方法带来的不足,结合蒙特卡洛仿真提出一种水质预测方法,为水质预测的不精确性问题提供一种新思路和可行解决方案。
[0005] 本发明提供一种基于果蝇优化算法的水质机理建模及水质预测方法,该方法具体步骤如下:
[0006] 步骤一:建立水质机理模型。
[0007] 基于水质指标,DO、Phyt、BOD、OP、PO4、ON、NH3-N和NO3-N,建立水质机理模型;DO、Phyt、BOD、OP、PO4、ON、NH3-N和NO3-N分别为溶解氧、浮游植物、碳生化需氧量、有机磷、正磷酸盐、有机氮、氨氮和硝酸盐氮;
[0008] 步骤二:基于果蝇优化算法的水质机理建模方法。
[0009] 果蝇优化算法是一种基于果蝇觅食行为来寻求全局优化的新方法,属于仿生智能优化算法。果蝇是一种感官知觉优于其他物种的昆虫,尤其是嗅觉和视觉。果蝇的嗅觉器官能很好的搜集漂浮在空气中的各种气味,甚至能够嗅到40公里以外的食物源。然后,飞到食物位置附近后亦可使用敏锐的视觉发现食物和同伴聚集的位置,并且向该方向飞去。果蝇优化算法在寻优过程中具有一定的随机性,为了确保果蝇群体向着正确的方向飞行,该算法引入了气味浓度判定值和气味浓度判定函数。
[0010] 果蝇优化算法具有计算过程简单、全局收敛性强、执行的时间短等优点,可应用于求解最优解,在求解数学函数极值、数据挖掘、广义回归神经网络参数优化等领域已有初步成果。
[0011] 步骤三:基于蒙特卡洛仿真的河湖水质预测。
[0012] 蒙特卡洛仿真的基本原理是当问题或对象本身具有概率特征时,可以用计算机模拟的方法产生抽样结果,根据抽样结果计算统计量或者参数的值;随着模拟次数的增多,可以通过对各次统计量或参数的估计值求平均的方法得到稳定结论。在基于蒙特卡洛仿真的预测过程中,水质指标演化过程会被多次模拟。对每一次模拟,每一个水质指标在每一个预测时间点的数值均不相同,这些数值同时具有规律性和随机性。规律性体现在预测值是基于确定的水质动力学模型、水质指标和模型参数初值而产生的;随机性体现在每一个水质指标在每一个预测时间点受噪声影响而得到的预测值不尽相同。当模拟次数充分大时,结合概率统计规律,可以获得各水质指标在不同时间点上取值的概率分布,实现水质预测。
[0013] 本发明的优点在于:
[0014] (1)本发明利用果蝇优化算法估计水质机理模型的未知参数。克服了已有的经典水质机理模型通常包含大量未知参数,且仅给定经验取值范围的问题,同时与粒子群优化算法和遗传算法对比,果蝇优化算法的寻优速度和精度均优于粒子群优化算法和遗传算法。通过该果蝇优化算法方法获得水质机理建模准确度更高。
[0015] (2)本发明利用蒙特卡洛仿真预测8个水质指标的演化过程,获得8个水质指标取值的概率分布,实现水质预测。弥补了单一定值的水质预测的不精确性,降低了预测的偶然性。

附图说明

[0016] 图1是本发明基于果蝇优化算法(FOA)的水质机理建模的8个水质指标演化曲线、基于粒子群优化算法(PSO)的水质机理建模的8个水质指标演化曲线、基于遗传算法(GA)的8个水质指标机理建模的水质演化曲线和8个水质指标真实值曲线图。
[0017] 图2是本发明本发明基于果蝇优化算法(FOA)的水质机理建模的水质演化误差、基于粒子群优化算法(PSO)的水质机理建模的水质演化误差和基于遗传算法(GA)的8个水质指标机理建模的水质演化误差减小曲线图。
[0018] 图3是本发明基于蒙特卡洛仿真的水质预测方法的8个水质指标演化曲线图。
[0019] 图4是本发明不同时刻下的8个水质指标的概率密度函数曲线图。

具体实施方式

[0020] 下面将结合附图和实施例对本发明作进一步的详细说明。
[0021] 本发明是一种基于果蝇优化算法的水质机理建模及水质预测方法,首先结合水质演化机理,提出了一种湖库水质机理建模及水质预测方法;在已知水质测量数据的基础上,利用果蝇优化算法估计水质机理模型的未知参数;在此基础上,利用蒙特卡洛仿真预测水质演化过程,获得水质指标未来时刻取值的概率分布,实现水质预测。
[0022] 本发明提供的所述基于果蝇优化算法的水质机理建模及水质预测方法,通过如下步骤实现:
[0023] 步骤一:建立水质机理模型。
[0024] 水体生态系统主要分为以下四个过程:溶解氧平衡过程、浮游植物动力学过程、磷循环和氮循环。水体生态系统主要由八个水质指标描述其演化过程:溶解氧(DO)、浮游植物(Phyt)、碳生化需氧量(BOD)、有机磷(OP)、正磷酸盐(PO4)、有机氮(ON)、氨氮(NH3-N)和硝酸盐氮(NO3-N)。基于上述水质指标演化机理,针对水体生态系统的富营养化过程建立水质机理模型,其数学模型为上述8个水质指标方程组成的一组非线性连续微分方程组。
[0025]
[0026]
[0027]
[0028]
[0029]
[0030]
[0031]
[0032]
[0033] 其中, 分别表示水质指标DO、Phyt、BOD、OP、PO4、ON、NH3-N和NO3-N的浓度, 分别表示所述水质指
标浓度的微分。Phyt的浓度由叶绿素a(Chl_a)的浓度表征。参数{k1,k2,…,k13}为水质机理模型的未知的模型参数,也是待估计的模型参数,各模型参数的含义和单位如表1所示。
[0034]
[0035]
[0036] 令
[0037]
[0038] θ=(k1,k2,k3,k4,k5,k6,k7,k8,k9,k10,k11,k12,k13)Τ
[0039] 且假设水质机理模型的的模型参数是慢变的,则式(1)表示为:
[0040]
[0041] 上式中,f(x,θ)为式(1)给出的水质机理模型。
[0042] 步骤二:基于果蝇优化算法的水质机理建模方法;
[0043] 首先,将式(2)写成离散化形式如下:
[0044]
[0045] 上式中, xt为t时刻的水质指标,xt-1为t-1时刻的水质指标;θt为t时刻的模型参数,θt-1为t-1时刻的模型参数;水质指标的过程噪声ωx,t-1为t-1时刻的水质指标的过程噪声,模型参数的过程噪声
ωθ,t-1为t-1时刻的模型参数的过程噪声,其中Σx、Σθ为相应的过程噪声协方差阵;h是预测步长,h≤1day,t为离散时间点。
[0046] 在基于果蝇优化算法的估计水质机理模型中未知模型参数的建模过程中,将寻优过程中的模型参数代入味道浓度函数中,获得该组模型参数的味道浓度。在果蝇种群中,对比每个果蝇的味道浓度,并找出最优的味道浓度和该果蝇位置(最佳位置),其余果蝇利用视觉飞往所述的最佳位置。最后在不断迭代过程中获得最优模型参数解。基于果蝇优化算法的水质机理建模方法的步骤如表2所示。
[0047]
[0048]
[0049] 其中, 为t1时刻的水质指标估计值,xt1为t1时刻的水质指标真实值;x(1,t1)为在t1时刻的CDO,x(2,t1)为在t1时刻的CPhyt,x(3,t1)为在t1时刻的CBOD,x(4,t1)为在t1时刻的COP,x(5,t1)为在t1时刻的 x(6,t1)为在t1时刻的CON,x(7,t1)为在t1时刻的 x(8,t1)为在t1时刻的 gen表示迭代次数;gro表示果蝇种群中第gro个果蝇;θi=ki,i=1,2,…,13;Random vector的含义为随机向量,Random value的含义为随机值;θgro表示第gro个果蝇寻优的模型参数向量,其中θgro,i为第gro个果蝇寻优的模型参数向量中第i个模型参数。BestDist(i)、BestS(i)、Bestθi分别为果蝇的最优位置、最优味道浓度和最优模型参数。
[0050] 以上为基于果蝇优化算法的水质机理建模方法。为验证该方法的有效性,采用粒子群优化算法(Particle Swarm Optimization Algorithm,PSO)和遗传算法(Genetic Algorithm,GA)为对比算法,对三个算法的模拟值计算8个水质指标中的最大绝对误差MaxE、平均绝对误差MAE、均方根误差RMSE。计算方法如下,对第j个水质指标,有,[0051]
[0052] 上式中,ND为模拟过程的数据长度,且t1=1,2,…ND,e(j,t1)表示t1时刻第j个水质指标的真实值和估计值的差的平方。
[0053] 步骤三:基于蒙特卡洛仿真的河湖水质预测。
[0054] 在基于蒙特卡洛仿真的预测过程中,水质指标演化过程会被多次模拟。对每一次模拟,每一个水质指标在每一个预测时间点的数值均不相同,这些数值同时具有规律性和随机性。规律性体现在预测值是基于确定的水质机理模型、水质指标和模型参数初值而产生的;随机性体现在每一个水质指标在每一个预测时间点受噪声影响而得到的预测值不尽相同。当模拟次数充分大时,结合概率统计规律,可以获得各水质指标在不同时间点上取值的概率分布。基于蒙特卡洛仿真的水质预测的具体流程步骤如表3所示。
[0055]
[0056] 其中,δ表示狄拉克函数, 分别表示在t2时刻的水质指标取值和第m个蒙特卡洛粒子中水质指标在t2时刻的预测值, 分别表示在t2时刻的模型参数取值和第m个蒙特卡洛粒子中模型参数在t2时刻的预测值。
[0057] 实施例1:
[0058] 步骤一:建立水质机理模型;
[0059] 基于水质指标演化机理,建立水质机理模型,模型方程如公式(1)所示。
[0060] 步骤二:基于果蝇优化算法的水质机理建模方法构建
[0061] 水质指标数据来源于苏州白洋湾金墅站点10月11日至11月10日30天的水质数据,即每组8个水质指标数据,共计ND=720组数据;
[0062] 果蝇优化算算法的最大迭代次数为MaxGeneration=100,
[0063] 果蝇种群个数为MaxGroup=400,
[0064] 味道浓度阈值ObjSmell=10。
[0065] 按照表2和上述参数数值计算8个水质指标演化结果,并和粒子群优化算法和遗传算法对,结果如图1所示,误差减小曲线如图2所示,其优化参数如表4所示,优化参数的水质指标演化误差如表5所示。按照式(4)计算对三个算法的模拟值8个水质指标中的误差最大值MaxE、误差均值MAE、误差方均根RMSE,结果如表6、7、8所示。
[0066]
[0067]
[0068]
[0069]
[0070]
[0071]
[0072] 步骤三:基于蒙特卡洛仿真的河湖水质预测方法的构建
[0073] 水质指标数据来源于苏州白洋湾金墅站点11月11日至11月20日10天的水质数据,采样步长h=1/24(单位:day)、预测时间T=10(单位:day),即每组8个水质指标数据,共计NT=240组数据。
[0074] 水质指标初值为11月10日最后采样时间的水质测量数据,即x0=[10.32,5.03,3.03,0.0098,0.0049,0.7892,0.09998,0.2633]T,
[0075] 水质指标过程噪声协方差阵Σx=diag{1,1,1,0.001,0.001,0.1,0.01,0.1},[0076] 模型参数初值θ0为上述果蝇参数优化算法的优化结果值(Bestθ),
[0077] 模型参数过程噪声协方差阵Σθ=diag{0.1,0.8,0.2,0.2,0.1,0.3,0.8,1,0.8,0.3,1,0.2,0.6}。
[0078] 预测步长h=1/24(单位:day)、
[0079] 粒子数NP=1000
[0080] 按照表3的水质预测步骤、步骤二中表4果蝇算法的优化参数和上述参数数值计算8个水质指标演化结果,并计算不同时刻下的8个水质指标的概率密度函数。基于蒙特卡洛仿真的水质预测方法的8个水质指标演化结果如图3所示,不同时刻下的8个水质指标的概率密度函数如图4所示。