一种基于人工智能及随机自适应阈值的湿地预警方法转让专利

申请号 : CN201911381469.3

文献号 : CN111210128B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 欧阳怡然蔡宴朋周子旋潘炜杰肖俊

申请人 : 广东工业大学

摘要 :

本发明公开了一种基于人工智能及随机自适应阈值的湿地预警方法,应用循环迭代的原理,建立一个随机自适应参数学习模块,使预警系统拥有自适应调节功能。考虑湿地水系统所面临的众多不确定性,将不确定性量化理论(随机)应用于随机自适应阈值的构建,并使用正常阈值参数概率密度函数(PDF)及正常阈值参数累积分布密度函数(CDF)等概念将随机不确定性进行定量化,使用遗人工智能算法以保证实时预警的反应效率。利用预测数据与观测数据的残差分析作为监控湿地生态状态的指标数据,使得预警系统更加灵敏;贝叶斯的引入降低了误警率,引入迭代预警率。从而全面提高了湿地健康预警的准确度。

权利要求 :

1.一种基于人工智能及随机自适应阈值的湿地预警方法,其特征在于,包括以下步骤:S1、确定研究区域湿地内相关的地面监测指标以及确定研究区内的监测点位;然后对研究区内的每个监测点位按监测频次进行持续水生态监测,获得时间上连续的地面监测指标的监测数据;每一组数据皆为时间序列的数据集;

S2、利用主成分分析法对步骤S1所得的众多监测指标的监测数据进行降维处理,抽取每大类指标中的主成分,并进行标准化处理,保证神经网络的数据口径一致;

S3、建立神经网络模型,模型的输入层为降维标准化处理后的数据结果,输出层为待预测的指标值,建立每一个指标与其他指标和其滞后时间指标之间的关系;

S4、将步骤S3得到的预测结果与步骤S2得到的降维后的监测值进行按时间序列求残差,建立基于时间序列的残差数据序列;

S5、为相应监测指标设置随机自适应阈值,当相应监测指标的残差值超过阈值时,触发异常状态,按时间序列将异常状态进行储存后进入步骤S8;当相应监测指标的残差值未超过阈值时,为正常状态,按正常状态的时间序列监测值及其正常状态时间序列残差值储存后进入步骤S6;

S6、将正常状态的时间序列监测值及其正常状态时间序列残差值录入随机自适应学习模块:正常状态时间序列残差值带入随机自适应阈值计算器,求出正常状态下的随机自适应阈值调节参数DTi;

S7、将参数输入正常阈值参数数据库,以方便实时更新的正常阈值参数概率密度函数PDF,而后转换为实时更新的正常阈值参数累积分布密度函数CDF,由此完成不确定量化的工作,并可根据不同的监控强度qi得到不同的随机自适应阈值;

S8、依据步骤S5的异常状态记录情况,通过贝叶斯进行分析,并判断综合判定的累积警情率是否在设定阈值内;如果在,则表明监测指标正常,不进行预警;如果不在,则表明监测指标异常,进行湿地初预警;

所述步骤S3的具体过程如下:

S3‑1、将从步骤S2得到的已进行降维和标准化处理的数据划分为训练集与测试集;其中,前80%数据作为训练集,后20%作为测试集;当数据进入循环迭代程序时,训练集和测试集得到不断地更新,达到为程序校准的目的;

S3‑2、基于训练集中的数据进行神经网络训练:

数据从p个输入x=(x1,…,xp)的输入层传递到包含m个神经元的隐含层;隐藏层中的每个节点接收前一层的加权和输出,然后通过一个激活函数传递该加权和输出,生成隐藏节点输出;同样,K目标为y=(y1,…,yk)的输出层接收上一层的加权输出,并通过一个输出函数进行传递,最终的输出由函数fk(x;w)估计;函数的自适应度函数通过预测值和监测值的标准差和方差进行调节;

多层神经网络MLP的数学模型由下述两公式表示:

上式中,x为输入层的数据输入数列;w为每一指标设置的权重;k为输出层的目标数,目标y有fk(x;w);fk(x;w)为最终的输出函数;wij、wjk为权重值,w0、w0j为偏重值,为激活函数,为输出功能函数;

xi(t)分别为通过神经网络的预测值和t时刻的监测值,而f(.)为通过MLP多层神经网络确定的值;

所述步骤S6的具体过程如下:

随机自适应阈值计算器具体情况如下:

持续时间为T的滑动窗口中,

式中:

Yi,t表示t时间点i种参数的神经网络输出值;

Mean(Yi,w)表示在滑动窗口w中i种参数的滑动窗口平均值;

分别表示监控强度为qi时随机自适应阈值参数的上界值和下界值;

Std(Yi,w)表示滑动窗口w中参数i的神经网络输出值的标准差;

所述步骤S8中通过贝叶斯分析的过程如下:

由于野外的湿地系统存有大量的不确定性及不稳定性,过多干扰情况的产生使得误警的情况时有发生,这时需要一个排除误警的系统,即引入贝叶斯概率公式:p(θ1)为发生污染或恶化事件的概率,p(θ0)为未发生污染或恶化事件的概率;

p(yt+1θ1)为发生了污染或恶化事件时且报警器可以正常报警的概率;

p(yt+1θ0)为未发生污染或恶化事件时且报警器可以正常报警的概率;

π1(t+1)为t+1时刻在真正发生污染事件或恶性事件时,预警器正常报警的概率,它由t时刻的先验概率乘以修正因子所得,并且随着时间序列不断更新;

π1(t+1)=απ1(t+1)+(1‑α)v1(t);

为了避免快速收敛,引入平滑参数α,当随着时间序列不断累积的π1(t+1)超过预警阈值时,发生预警。

2.根据权利要求1所述的一种基于人工智能及随机自适应阈值的湿地预警方法,其特征在于,水生态监测数据包括水质监测数据、水文监测数据、生态监测数据、气象监测数据;

其中,生态监测数据包括动植物的生物量、多样性、外来物种入侵情况。

3.根据权利要求1所述的一种基于人工智能及随机自适应阈值的湿地预警方法,其特征在于,所述步骤S4中残差值计算的具体过程如下:ERi(t)为指标i在t时刻的估计残差值。

4.根据权利要求1所述的一种基于人工智能及随机自适应阈值的湿地预警方法,其特征在于,所述步骤S5具体为检验数据是否超过随机自适阈值上下界;

当持续时间为T的窗口期中满足下列公式时,判定为异常,否则为正常;

公式:

式中:

Yi,t表示t时间点i种参数的神经网络输出值;Mean(Yi,f,w)表示在滑动窗口w中i种参数的滑动窗口平均值; 分别表示监控强度为qi时随机自适应阈值参数的上界值和下界值;Std(Yi,w)表示滑动窗口w中参数i的神经网络输出值的标准差。

说明书 :

一种基于人工智能及随机自适应阈值的湿地预警方法

技术领域

[0001] 本发明涉及生态环境的技术领域,尤其涉及到一种基于人工智能及随机自适应阈值的湿地预警方法。

背景技术

[0002] 湿地是地球上水陆相互作用形成的独特生态系统,是重要的生存环境和自然界最富生物多样性的生态景观之一,它在维持生态平衡、保持生物多样性、涵养水源、蓄洪防旱、降解污染等方面都起到重要作用,被誉为“地球之肾”、“生命的摇篮”、“文明的发源地”和“物种的基因库”。湿地及其与之共存的各种资源是人类赖以生存与持续发展的重要基础,具有不可替代的环境调节作用,而且是极重要的物种基因库。为此,针对湿地的预警系统和方法应运而生。
[0003] 然而,现有的预警系统大多未考虑湿地系统所面临的众多不确定性因素,未考虑引用不确定性定量化理论描述预警过程及湿地系统的不确定性。而且,湿地预警系统就自适应阈值多为静态调控,由于湿地系统的复杂性,预警系统过敏感,过迟钝,静态调控等问题常有出现,适应性不足。而湿地的预警评价方法多为简单的指标加权评价,且忽略了指标间的客观关系;受人为影响较大。评价周期久,灵敏度不高;且有当湿地系统出现紧急污染源或恶性趋势时,无法实时预警。

发明内容

[0004] 本发明的目的在于克服现有技术的不足,提供一种拥有自适应调节能力、考虑了湿地水系统所面临的众多不确定性、能解决预警系统过敏感,过迟钝静态预警等问题、预警准确度高的基于人工智能及随机自适应阈值的湿地预警方法。
[0005] 为实现上述目的,本发明所提供的技术方案为:
[0006] 一种基于人工智能及随机自适应阈值的湿地预警方法,包括以下步骤:
[0007] S1、确定研究区域湿地内相关的地面监测指标以及确定研究区内的监测点位;然后对研究区内的每个监测点位按监测频次进行持续水生态监测,获得时间上连续的地面监测指标的监测数据;每一组数据皆为时间序列的数据集;
[0008] S2、利用主成分分析法对步骤S1所得的众多监测指标的监测数据进行降维处理,抽取每大类指标中的主成分,并进行标准化处理,保证神经网络的数据口径一致;
[0009] S3、建立神经网络模型,模型的输入层为降维标准化处理后的数据结果,输出层为待预测的指标值,建立每一个指标与其他指标和其滞后时间指标之间的关系;
[0010] S4、将步骤S3得到的预测结果与步骤S2得到的降维后的监测值进行按时间序列求残差,建立基于时间序列的残差数据序列;
[0011] S5、为相应监测指标设置随机自适应阈值,当相应监测指标的残差值超过阈值时,触发异常状态,按时间序列将异常状态进行储存后进入步骤S8;当相应监测指标的残差值未超过阈值时,为正常状态,按正常状态的时间序列监测值及其正常状态时间序列残差值储存后进入步骤S6;
[0012] S6、将正常状态的时间序列监测值及其正常状态时间序列残差值录入随机自适应学习模块:正常状态时间序列残差值带入随机自适应阈值计算器,求出正常状态下的随机自适应阈值调节参数DTi;
[0013] S7、将参数输入正常阈值参数数据库,以方便实时更新的正常阈值参数概率密度函数PDF,而后转换为实时更新的正常阈值参数累积分布密度函数CDF,由此完成不确定量化的工作,并可根据不同的监控强度qi(0‑1)得到不同的随机自适应阈值;
[0014] S8、依据步骤S5的异常状态记录情况,通过贝叶斯进行分析,并判断综合判定的累积警情率是否在设定阈值内;如果在,则表明监测指标正常,不进行预警;如果不在,则表明监测指标异常,进行湿地初预警。
[0015] 进一步地,所述水生态监测数据包括水质监测数据、水文监测数据、生态监测数据、气象监测数据;其中,生态监测数据包括动植物的生物量、多样性、外来物种入侵情况。
[0016] 进一步地,所述步骤S3的具体过程如下:
[0017] S3‑1、将从步骤S2得到的已进行降维和标准化处理的数据划分为训练集与测试集;其中,前80%数据作为训练集,后20%作为测试集;当数据进入循环迭代程序时,训练集和测试集得到不断地更新,达到为程序校准的目的;
[0018] S3‑2、基于训练集中的数据进行神经网络训练:
[0019] 数据从p个输入x=(x1,…,xp)的输入层传递到包含m个神经元的隐含层;隐藏层中的每个节点接收前一层的加权和输出,然后通过一个激活函数传递该加权和输出,生成隐藏节点输出;同样,K目标为y=(y1,…,yk)的输出层接收上一层的加权输出,并通过一个输出函数进行传递,最终的输出由函数fk(x;w)估计;函数的自适应度函数通过预测值和监测值的标准差和方差进行调节;
[0020] 多层神经网络MLP的数学模型由下述两公式表示:
[0021]
[0022] 上式中,x为输入层的数据输入数列,假设共有p种为(x1,…,xp);w为为了每一指标设置的权重;k为输出层的目标数,目标y有fk(x;w);fk(x;w)为最终的输出函数;wij、wjk为权重值,w0、w0j为偏重值,为激活函数, 为输出功能函数;
[0023]
[0024] xi(t)分别为通过神经网络的预测值和t时刻的监测值,而f(.)为通过MLP多层神经网络确定的值。
[0025] 进一步地,所述步骤S4中残差值计算的具体过程如下:
[0026]
[0027] ERi(t)为指标i在t时刻的估计残差值。
[0028] 根据权利要求1所述的一种基于人工智能及随机自适应阈值的湿地预警方法,其特征在于,所述步骤S5具体为检验数据是否超过随机自适阈值上下界;
[0029] 当持续时间为T的窗口期中满足下列公式时,判定为异常,否则为正常;
[0030] 公式:
[0031]
[0032]
[0033] 式中:
[0034] Yi,t表示t时间点i种参数的神经网络输出值;Mean(Yi,f,w)表示在滑动窗口w中i种qi qi参数的滑动窗口平均值;PDTi 、NDTi 分别表示监控强度为qi时随机自适应阈值参数的上界值和下界值;Std(Yi,w)表示滑动窗口w中参数i的神经网络输出值的标准差。
[0035] 进一步地,所述步骤S6的具体过程如下:
[0036] 随机自适应阈值计算器具体情况如下:
[0037]
[0038]
[0039] 持续时间为T的滑动窗口中,
[0040]
[0041]
[0042] 式中:
[0043] Yi,t表示t时间点i种参数的神经网络输出值;
[0044] Mean(Yi,w)表示在滑动窗口w中i种参数的滑动窗口平均值;
[0045] 分别表示监控强度为qi时随机自适应阈值参数的上界值和下界值;
[0046] Std(Yi,w)表示滑动窗口w中参数i的神经网络输出值的标准差。
[0047] 进一步地,所述步骤S8中通过贝叶斯分析的过程如下:
[0048] 由于野外的湿地系统存有大量的不确定性及不稳定性,过多干扰情况的产生使得误警的情况时有发生,这时需要一个排除误警的系统,即引入贝叶斯概率公式:
[0049]
[0050]
[0051]
[0052] p(θ1)为发生污染或恶化事件的概率,p(θ0)为未发生污染或恶化事件的概率;
[0053] p(yt+1θ1)为发生了污染或恶化事件时且报警器可以正常报警的概率;
[0054] p(yt+1θ0)为未发生污染或恶化事件时且报警器可以正常报警的概率;
[0055] π1(t+1)为t+1时刻在真正发生污染事件或恶性事件时,预警器正常报警的概率,它由t时刻的先验概率乘以修正因子所得,并且随着时间序列不断更新;
[0056] π1(t+1)=απ1(t+1)+(1‑α)π1(t);
[0057] 为了避免快速收敛,引入平滑参数α,当随着时间序列不断累积的π1(t+1)超过预警阈值时,发生预警。
[0058] 与现有技术相比,本方案原理及优点如下:
[0059] 1.应用循环迭代的原理,建立一个随机自适应参数学习模块,使本预警系统拥有自适应调节功能。
[0060] 2.考虑湿地水系统所面临的众多不确定性,将不确定性量化理论(随机)应用于随机自适应阈值的构建,并使用正常阈值参数概率密度函数(PDF)及正常阈值参数累积分布密度函数(CDF)等概念将随机不确定性进行定量化,使用遗人工智能算法以保证实时预警的反应效率。
[0061] 3.使用不确定性量化理论(随机)描述监控强度这个概念,可以根据管理者对于湿地的重视监管程度调控整个预警系统的对于警情的反应强度,从而达到个性化管理,并解决预警系统过敏感,过迟钝静态预警等问题,提升系统适应性。另外,将水质、水文、生态、气象四类数据作为模型输入,且水生态监测数据中引入了生态指标(动植物生物量,多样性指标),使得评价更为综合。
[0062] 4.使用降维和标准化后的数据作为神经网络的输入,利用神经网络通过非线性、加权、参数化函数将各变量关联起来,突出了单一指标数据与整体指标数据间关联性。
[0063] 5.利用预测数据与观测数据的残差分析作为监控湿地生态状态的指标数据,使得预警系统更加灵敏;贝叶斯的引入降低了误警率,引入迭代预警率。从而全面提高了湿地健康预警的准确度。

附图说明

[0064] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0065] 图1为本发明一种基于人工智能及随机自适应阈值的湿地预警方法的工作流程图;
[0066] 图2为本发明中神经网络算法的流程图。

具体实施方式

[0067] 下面结合具体实施例对本发明作进一步说明:
[0068] 如图1‑2所示,本实施例所述的一种基于人工智能及随机自适应阈值的湿地预警方法,
[0069] S1、确定研究区域湿地内相关的地面监测指标以及确定研究区内的监测点位;然后对研究区内的每个监测点位按监测频次进行持续水生态监测,获得时间上连续的地面监测指标的监测数据;每一组数据皆为时间序列的数据集;
[0070] 本步骤中,水生态监测数据包括水质监测数据(如总氮、总磷、总氯、电导率、含氧率、重金属含量等)、水文监测数据(水位、水量、流速等)、生态监测数据(动植物多样性、生物多样性、外来物种入侵情况等)、气象监测数据(降雨量等)。
[0071] S2、利用主成分分析法对步骤S1所得的众多监测指标的监测数据进行降维处理,抽取每大类指标中的主成分,并进行标准化处理,保证神经网络的数据口径一致;假设共有T个时间序列上连续的k种监测数据序列,则第i种指标的第t个数据用Di(t)(i=1,2,....,k;t=1,2....,T)表示。
[0072] S3、建立神经网络模型,模型的输入层为降维标准化处理后的数据结果,输出层为待预测的指标值,建立每一个指标与其他指标和其滞后时间指标之间的关系;具体过程如下:
[0073] S3‑1、将从步骤S2得到的已进行降维和标准化处理的数据划分为训练集与测试集;其中,前80%数据作为训练集,后20%作为测试集;当数据进入循环迭代程序时,训练集和测试集得到不断地更新,达到为程序校准的目的;
[0074] S3‑2、基于训练集中的数据进行神经网络训练:
[0075] 数据从p个输入x=(x1,…,xp)的输入层传递到包含m个神经元的隐含层;隐藏层中的每个节点接收前一层的加权和输出,然后通过一个激活函数传递该加权和输出,生成隐藏节点输出;同样,K目标为y=(y1,…,yk)的输出层接收上一层的加权输出,并通过一个输出函数进行传递,最终的输出由函数fk(x;w)估计;函数的自适应度函数通过预测值和监测值的标准差和方差进行调节;
[0076] 多层神经网络MLP的数学模型由下述两公式表示:
[0077]
[0078] 上式中,x为输入层的数据输入数列,假设共有p种为(x1,…,xp);w为为了每一指标设置的权重;k为输出层的目标数,目标y有fk(x;w);fk(x;w)为最终的输出函数;wij、wjk为权重值,w0、w0j为偏重值,为激活函数, 为输出功能函数;
[0079]
[0080] xi(t)分别为通过神经网络的预测值和t时刻的监测值,而f(.)为通过MLP多层神经网络确定的值。
[0081] S4、将步骤S3得到的预测结果与步骤S2得到的降维后的监测值进行按时间序列求残差,建立基于时间序列的残差数据序列;
[0082] 残差值计算的具体过程如下:
[0083]
[0084] ERi(t)为指标i在t时刻的估计残差值。
[0085] S5、为相应监测指标设置随机自适应阈值,当相应监测指标的残差值超过阈值时,触发异常状态,按时间序列将异常状态进行储存后进入步骤S8;当相应监测指标的残差值未超过阈值时,为正常状态,按正常状态的时间序列监测值及其正常状态时间序列残差值储存后进入步骤S6;
[0086] 具体如下:
[0087] 当持续时间为T的窗口期中满足下列公式时,判定为异常,否则为正常;
[0088] 公式:
[0089]
[0090]
[0091] 式中:
[0092] Yi,t表示t时间点i种参数(可能为水质、水文、生态、气候类中的某一小类时间序列)的神经网络输出值;Mean(Yi,f,w)表示在滑动窗口w中i种参数的滑动窗口平均值;分别表示监控强度为qi时随机自适应阈值参数的上界值和下界值;Std
(Yi,w)表示滑动窗口w中参数i的神经网络输出值的标准差。
[0093] S6、将正常状态的时间序列监测值及其正常状态时间序列残差值录入随机自适应学习模块:正常状态时间序列残差值带入随机自适应阈值计算器,求出正常状态下的随机自适应阈值调节参数DTi;
[0094] 其中,随机自适应阈值计算器具体情况如下:
[0095]
[0096]
[0097] 持续时间为T的滑动窗口中,
[0098]
[0099]
[0100] 式中:
[0101] Yi,t表示t时间点i种参数的神经网络输出值;
[0102] Mean(Yi,w)表示在滑动窗口w中i种参数的滑动窗口平均值;
[0103] 分别表示监控强度为qi时随机自适应阈值参数的上界值和下界值;
[0104] Std(Yi,w)表示滑动窗口w中参数i的神经网络输出值的标准差。
[0105] S7、将参数输入正常阈值参数数据库,以方便实时更新的正常阈值参数概率密度函数PDF,而后转换为实时更新的正常阈值参数累积分布密度函数CDF,由此完成不确定量化的工作,并可根据不同的监控强度qi(0‑1)得到不同的随机自适应阈值;
[0106] S8、依据步骤S5的异常状态记录情况,通过贝叶斯进行分析,并判断综合判定的累积警情率是否在设定阈值内;如果在,则表明监测指标正常,不进行预警;如果不在,则表明监测指标异常,进行湿地初预警。
[0107] 本步骤中,通过贝叶斯分析的过程如下:
[0108] 由于野外的湿地系统存有大量的不确定性及不稳定性,过多干扰情况的产生使得误警的情况时有发生,这时需要一个排除误警的系统,即引入贝叶斯概率公式:
[0109]
[0110]
[0111]
[0112] p(θ1)为发生污染或恶化事件的概率,p(θ0)为未发生污染或恶化事件的概率;
[0113] p(yt+1θ1)为发生了污染或恶化事件时且报警器可以正常报警的概率;
[0114] p(yt+1θ0)为未发生污染或恶化事件时且报警器可以正常报警的概率;
[0115] π1(t+1)为t+1时刻在真正发生污染事件或恶性事件时,预警器正常报警的概率,它由t时刻的先验概率乘以修正因子所得,并且随着时间序列不断更新;
[0116] π1(t+1)=απ1(t+1)+(1‑α)π1(t);
[0117] 为了避免快速收敛,引入平滑参数α,当随着时间序列不断累积的π1(t+1)超过预警阈值时,发生预警。
[0118] 本实施例具有拥有自适应调节能力、考虑了湿地水系统所面临的众多不确定性、能解决预警系统过敏感,过迟钝静态预警等问题、预警准确度高等优点。
[0119] 以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。