基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法转让专利

申请号 : CN202210477061.1

文献号 : CN115840908B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 朱昱腾杨涛郑鑫李振亚

申请人 : 河海大学

摘要 :

本发明公开了一种基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,包括以下步骤:第一步,基于地面基站分布,搭建微波链路PM2.5监测网;第二步,利用深度学习的方法进行干湿期判别;第三步,根据微波链路路径的平均衰减,计算单条链路的PM2.5浓度;第四步,对监测区域进行网格化处理,生成指定精度的三维PM2.5动态监测场。本发明的基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,利用微波链路电平值在晴天时的衰减量,通过基于多微波链路的组网方式,反演构建高时空分辨率的PM2.5监测场。

权利要求 :

1.一种基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,其特征在于,包括以下步骤:第一步,基于地面基站分布,搭建微波链路PM2.5监测网;

第二步,利用深度学习的方法进行干湿期判别;

第三步,根据微波链路路径的平均衰减,计算单条链路的PM2.5浓度;

第四步,对监测区域进行网格化处理,生成指定精度的三维PM2.5动态监测场;

所述第二步中利用深度学习的方法进行干湿期判别的步骤进一步包括:(1)构建针对微波测雨干湿期分类具有输入输出结构的深度学习模型;

(2)通过历史数据,建立不同链路监测时间与干湿期状况之间的关系训练集;

(3)通过对测试集进行测试,通过迭代的方式调整所述LSTM模型的参数,直到损失函数满足终止条件或者达到迭代次数;

(4)利用某一时刻及其之前n‑1个时间单位的电平值,构成以n为长度的时间窗口,作为LSTM模型的输入,进行干湿期判别;

第三步中,根据微波链路路径的平均衰减,计算单条链路的PM2.5浓度的步骤进一步包括:(1)计算晴天情况下微波链路路径的总衰减和其他情况各自引起的链路路径衰减,最终得出PM2.5引起的链路路径衰减;

(2)通过现有计算模型得出单条链路的PM2.5平均浓度;

第四步中,对监测区域进行网格化处理,生成指定精度的三维PM2.5监测场的步骤进一步包括:(41)微波链路随机序列的模拟,其中包括微波链路均匀随机数的生成、均匀随机数的检验、服从对数正态分布的纯随机序列的模拟、链路随机数的分配;

(42)基于局部加权线性回归的三维PM2.5浓度空间插值,其中包括利用局部加权线性回归模型进行基础三维PM2.5浓度监测场的构建、参考风速、风向漂移量的叠加;

(43)PM2.5分级概率层的统计构建,通过对空间PM2.5监测场各数据点的统计分析实现对空间监测场的等级分层。

2.根据权利要求1所述的一种基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,其特征在于:所述步骤二中终止条件为损失函数loss<0.01,最大迭代次数为1000次。

3.根据权利要求2所述的一种基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,其特征在于,所述步骤(41)具体包含以下步骤:①微波链路数据均匀随机数生成;

采用乘同余法生成[0,1]区间上的均匀随机数:式中:乘子λ、模M和初始值   为根据实际需要自己选定的常数;mod()为取余函数,mod(λ ,M)为用M除以λ 后得到的余数为 ;为[0,1]区间上生成的均匀随机数,其中的个数由指定的PM2.5浓度监测场的分辨率来确定;

②生成均匀随机数的检验:

[0,1]上的随机数 是否满足均匀性需通过统计参数检验、独立性检验、均匀性检验:A.统计参数检验;

记U为均匀随机变量,如果U服从[0,1]均匀分布,则U的均值 、二阶矩 和方差 为;n为生成随机数即  的个数;

它们的数学期望和方差满足下述关系:

 根据大数定律可知:

式中: 渐进服从N(0,1)分布;

给定显著性水平α,若  ,则表示拒绝U为[0,1]上的均匀分布;

B.独立性检验:

(1)计算自相关系数  :

其中,k为阶数,当n  时,m  ;当n  ,m= 或n‑10,原则上参加计算的项数(n‑k)至少10项以上;

(2)构造统计量:Q=n  ,若U为独立随机变量,则Q渐进服从自由度为m的  分布;

(3)给定显著性水平α,查  分布表,得  ;

(4)判断:若Q≤  ,则U是独立的;反之不独立;

C.均匀性检验:

把[0,1]区间分为互不相交的M个等区间,则有  个随机数  属于第j组,已知=   渐进服从于  (k‑1)分布,给定显著性水平  ,若 ,则频率上满足均匀;反之不满足,其中,样本容量n  30且 ;

③服从正态分布的纯随机序列的模拟;

首先生成两组均匀随机数  ,对均匀随机数  做下列变换:则 、 为相互独立的标准正态分布纯随机序列,由大量的 可得到大量的 ,由  可转换为一般正态分布纯随机序列:式中  的均值和标准差;

采用微波链路监测的PM2.5浓度线平均值作为纯随机序列  的均值,以邻近空气监测站的待生成时刻前后15h的PM2.5浓度监测数据与链路均值求得的标准差作为随机序列 的标准差,即:其中  为微波链路相邻的代表性测站前后15h的PM2.5浓度监测数据,  为微波链路监测的线尺度平均值;

 ④链路随机数的分配;

A.已知点数据对链路的反距离权重插值;

获取现有检测设备提供的点尺度PM2.5浓度数据,利用反距离权重插值法进行与随机数模拟相同空间分辨率的微波链路插补,保证与对应链路生成随机数个数相同;

其中  是待插值点的属性值,  是已知点的实测数据,  是已知点与待插值点的距离;

B.随机序列重新排序;

设通过反距离权重插值得出的微波链路数据为  , ,…, ,上述步骤生成的随机数为  ,变换随机数位置,直到其误差的平方和达到最小,即:求min(  ),找出最小值情况下对应的随机数排序方式,并以此次序直接替换链路中反距离权重插值求得的PM2.5浓度数据。

4.据根据权利要求1所述的一种基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,其特征在于,所述步骤(42)具体包含以下步骤:A.给待测点附近的每个点赋予一定的权重,并采用最小二乘法通过最小化损失函数来求得回归系数B:式中:Bi为回归模型的回归系数;  为模型的自变量;  是实际观测站点数据;ε是残差项;W是权重函数,为观测站点与预测站点距离的函数;

采用高斯核函数作为权重系数,采用吉洪诺夫正则化进行权重系数的修正:式中:为待预测站点与邻近监测站点的距离;参数k为核半径;

式中:λ为岭回归参数,即正则化系数,B为修正之前的权重参数,对上式进行求导得到:= 

式中:I为单位矩阵,尺寸大小和  一致;λ为正则化系数;

采用L曲线法估计岭回归参数λ:

式中:  、  、  、  分别代表 的一阶导数和二阶导数,求K的最大值,得到L曲线的最大曲率 , 所对应点的λ值即为所求的岭参数;

B.参考风速、风向因素的漂移量叠加:获取当地风场数据,提取风速、风向参数值,以前一个时间单位的PM2.5浓度空间场作为下一时间单位的漂移数据,以风速、风向数据进行前后时刻插值点的空间坐标变换,计算变换后空间点与下一时刻相邻点的距离并与最近的空间点进行算数平均:其中:  为下一时刻的PM2.5空间场中数据点的浓度值,  为下一时刻利用局部加权线性回归模型构建的基础空间场,  为t+1时刻需要叠加的漂移数据,即前一时刻利用局部加权线性回归模型构建的基础空间场(x,y,z,t)为t时刻数据点的空间位置, 为t时刻待变换点处的风速分量。

说明书 :

基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法

技术领域

[0001] 本发明涉及基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,属于大气监测领域。

背景技术

[0002] PM2.5细颗粒物质虽然对于人类没有致命性的危害,但是对于人体健康尤其是呼吸系统的健康具有十分重要的意义。随着现代化工业的发展以及污染情况的日益严重,国内的空气质量检测设备急需在实时性和精确性上进行提高。目前国内的PM2.5监测主要依赖于空气质量监测站点的实时监控,不过这种方式占地大,耗资多,再加上PM2.5本身具有很强的空间异构性,空气质量监测站点的布设数量、布设位置往往受到局限,稀疏的监测站点网络很难避免空间插值不准确的问题,使得难以获取高精度、高时间分辨率的细粒度PM2.5数据。此外,由于中国本土气象水文特征十分复杂,国外仪器设备的引入很难适应国内的空气质量监测状况,中国空气环境大范围监测依旧存在很大的偏差,城市空气质量检测迫切需要开发新的监测技术。随着嵌入式技术的发展,许多制造商推出手持设备推动全民监测,期望以这种方式解决空气质量站布设稀疏的问题,但是这种便携式设备在高精度严格监测与设备成本上存在着不可协调的矛盾,监测结果误差较大而且传感时间往往长达1小时以上。
[0003] 近年来,通过搭建近地面微波传输链路,实时采集大气中的降雨对微波传播信号的衰减,根据信号衰减与降雨强度之间的关系反演出降水是降雨监测的新兴技术,而在微波链路测雨研究过程中,空气中的悬浮颗粒物也会对微波链路电平值会产生影响。因此基于这一原理利用微波链路监测并获取高时空分辨率PM2.5监测场成为一种可行的新方法。
[0004] 无线微波大数据测雨技术目前主要的攻克点依然在近地面高时空分辨率降水场实时反演这一问题上,这一技术可以依托国内现有的无线基站通信设施,解决传统建设、维护成本高的问题,可以有效监测到低空大范围降水的空间异质特征,实时提供检测范围内不同时空分辨率的降水观测数据,对于目前的降水观测系统起到强大的推动更新作用。是解决城市高时空分辨率降雨信息获取难题的全新途径。
[0005] 不过目前利用微波链路在区域PM2.5监测中的应用刚刚起步,无线微波大数据测雨技术仅应用在湿期反演降水,相对于更长时间的干期仅有日常维护的工作,干期的监测应用技术成为该技术急需研究与突破的一个关键问题。同时由于城市下垫面情况复杂,微波测雨技术主要针对的降水反演在微波衰减量数据的获取上存在着很多的干扰因素,其中细粒度PM2.5对于微波衰减的干扰也是十分重要的一部分,不过微波链路对于 PM2.5监测场的构建目前仅停留在与降水场构建应用相同的二维平面,这无法满足用户实时获取近地面PM2.5浓度分布进行出行规划。因此如何补充完善PM2.5实时监测系统从而准确得出PM2.5等细粒度颗粒造成的微波衰减;如何补充完善微波设备干期应用体系;如何构建能够反映大范围三维空间PM2.5分布特征的监测场,这对于微波降水数据的反演、微波设备的全天候监测应用具有十分重要的意义。

发明内容

[0006] 发明目的:为了克服现有技术中存在的不足,本发明提供基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,利用微波链路电平值在晴天时的衰减量,通过基于多微波链路的组网方式,反演构建高时空分辨率的PM2.5监测场。
[0007] 技术方案:为解决上述技术问题,本发明的一种基于LSTM模型的微波链路构建 PM2.5三维动态监测场的方法,包括步骤:
[0008] 第一步,基于地面基站分布,搭建微波链路PM2.5监测网;
[0009] 第二步,利用深度学习的方法进行干湿期判别;
[0010] 第三步,根据微波链路路径的平均衰减,计算单条链路的PM2.5浓度;
[0011] 第四步,对监测区域进行网格化处理,生成指定精度的三维PM2.5动态监测场。
[0012] 作为优选,所述第二步中利用深度学习的方法进行晴雨区分的步骤进一步包括:
[0013] (1)构建针对微波测雨干湿期分类具有输入输出结构的深度学习模型;
[0014] (2)通过历史数据,建立不同链路监测时间与干湿期状况之间的关系训练集;
[0015] (3)通过对测试集进行测试,通过迭代的方式调整所述LSTM模型的参数,直到损失函数满足终止条件或者达到迭代次数;
[0016] (4)利用某一时刻及其之前n‑1个时间单位(目前监测数据的时间频率可达2‑3 秒就是2‑3秒钟一个微波监测数据)的电平值,构成以n为长度的时间窗口作为输入,作为LSTM模型的输入,进行干湿期判别。
[0017] 作为优选,所述步骤二中所述终止条件为损失函数loss<0.01,最大迭代次数为1000 次。
[0018] 作为优选,第三步中,根据微波链路路径的平均衰减,计算单条链路的PM2.5浓度的步骤进一步包括:
[0019] (1)计算晴天情况下微波链路路径的总衰减和其他情况各自引起的链路路径衰减,最终得出PM2.5引起的链路路径衰减;
[0020] (2)通过计算模型得出单条链路的PM2.5平均浓度。
[0021] 作为优选,第四步中,对监测区域进行网格化处理,生成指定精度的三维PM2.5监测场的步骤进一步包括:
[0022] (41)微波链路随机序列的模拟,其中包括微波链路均匀随机数的生成、均匀随机数的检验、服从对数正态分布的纯随机序列的模拟、链路随机数的分配。
[0023] (42)基于局部加权线性回归的三维PM2.5浓度空间插值,其中包括利用局部加权线性回归模型进行基础三维PM2.5浓度监测场的构建、参考风速、风向漂移量的叠加。
[0024] (43)PM2.5分级概率层的统计构建,通过对空间PM2.5监测场各数据点的统计分析实现对空间监测场的等级分层。
[0025] 作为优选,所述步骤(41)具体包含以下步骤:
[0026] ①微波链路数据均匀随机数生成
[0027] 采用乘同余法生成[0,1]区间上的均匀随机数生成:
[0028]
[0029] 式中:乘子λ、模M和初始值x0为根据实际需要自己选定的常数;mod()为取余函数,mod(λxi‑1,M)为用M除以λxi‑1后得到的余数为xi;ui为[0,1]区间上的均匀随机数,其中ui的个数由指定的PM2.5浓度监测场的分辨率(一般以经纬度0.05度划分为一个网格)来确定;
[0030] ②生成均匀随机数的检验:
[0031] [0,1]上的随机数ui是否满足均匀性需通过统计参数检验、独立性检验、均匀性检验:
[0032] A.统计参数检验2
[0033] 记U为均匀随机变量,如果U服从[0,1]均匀分布,则U的均值 二阶矩 和方差S为
[0034]
[0035] 它们的数学期望和方差满足下述关系:
[0036]
[0037] 根据大树定律可知:
[0038]
[0039] 式中:Y1,Y2,Y3渐进服从N(0,1)分布;
[0040] 给定显著性水平α,若 则表示拒绝U为[0,1]上的均匀分布;独立性检验:若U满足均匀性,则ui(i=1,2,…,n)是独立的:独立性检验:
[0041] 本发明的独立性检验采用综合自相关数检验法:(1)计算自相关系数rk:
[0042]
[0043] 其中,k为阶数,当n>50时, 当n<50时, 或n‑10,原则上参加计算的项数(n‑k)至少10项以上;
[0044] (2)构造统计量: 若U为独立随机变量,则Q渐进服从自由度为m 的X2分布;
2
[0045] (3)给定显著性水平α,查X分布表,得
[0046] (4)判断:若 则U是独立的;反之不独立;
[0047] C.均匀性检验:
[0048] 把[0,1]区间分为互不相交的M个等区间,则有nj个随机数ui属于第j组,已知2
渐进服从于X (k‑1)分布,给定显著性水平α,  若
则频率上满足均匀;反之不满足,其中,样本容量n>>30且
[0049] ③服从对数正态分布的纯随机序列的模拟
[0050] A.变换法:首先生成两组均匀随机数u1、u2,对均匀随机数u1、u2做下列变换:
[0051]
[0052] 则ξ1、ξ2为相互独立的标准正态分布纯随机序列。由大量的ut可得到大量的ξt。由ξt可转换为一般正态分布纯随机序列:
[0053]
[0054] 式中:和σ分别为正态分布纯随机序列xt的均值和标准差;
[0055] 为使生成的正态分布纯随机序列贴合于微波链路测量实际,采用微波链路监测的 PM2.5浓度线平均值作为纯随机序列xt的均值,由于大气颗粒悬浮物具有时滞性以及时间上的周期性,因此以邻近空气监测站的待生成时刻前后15h的PM2.5浓度监测数据与链路均值求得的标准差作为随机序列xt的标准差,即:
[0056]
[0057] 其中Xt为微波链路相邻的代表性测站前后15h的PM2.5浓度监测数据,为微波链路监测的线尺度平均值;
[0058] B.服从对数正态分布的纯随机序列的模拟
[0059] 假定xt服从正态分布,即LN 通过对数变换:
[0060] yt=ln(xt‑a)
[0061] 则yt服从正态分布,可以先利用变换法模拟出ξt,再通过以下公式模拟出yt:
[0062]
[0063] 因此由公式的逆变换就可以随机模拟xt
[0064]
[0065] 其中由于xt为服从对数正态分布的纯随机序列,式中的各参数满足如下关系:
[0066]
[0067] 其中Cv为离势系数,Cs为偏态系数,其计算公式如下:
[0068]
[0069] ④链路随机数的分配
[0070] 上述步骤生成的服从对数正态分布的随机序列虽然结合了链路监测平均值和邻近代表性站点的相邻时段内PM2.5浓度监测数据,但是仍需要考虑PM2.5浓度的空间异质性,本发明采用反距离权重插值法,利用特征值误差平方和最小的原理进行PM2.5浓度随机数的位置排序体现其空间异质性。
[0071] A.已知点数据对链路的反距离权重插值
[0072] 利用周围测站等现有检测设备提供的点尺度PM2.5浓度数据,利用反距离权重插值法进行与随机数模拟相同空间分辨率的微波链路插补,保证与对应链路生成随机数个数相同;
[0073]
[0074] 其中Zp是待插值点的属性值,Zi是已知点的实测数据,di是已知点与待插值点的距离;
[0075] B.随机序列重新排序
[0076] 设通过反距离权重插值得出的微波链路数据为x′i(i=1,2,…,n),即x′1,x′2,…,x′n,上述步骤生成的随机数为xj(j=1,2,…,n),即x1,x2,…,xn,变换随机数位置,直到其误2
差的平方和达到最小,即:求min(∑(x′i‑xj)),找出最小值情况下对应的随机数排序方式,并以此次序直接替换链路中反距离权重插值求得的PM2.5浓度数据。
[0077] 作为优选,所述步骤(42)具体包含以下步骤:
[0078] A.本发明采用局部加权线性回归模型最为三维空间的插值方法。局部加权线性回归模型与普通线性回归模型不同的是给待测点附近的每个点赋予一定的权重,并采用最小二乘法通过最小化损失函数来求得回归系数B。
[0079]
[0080] 式中:B为回归模型的回归系数;Xi为模型的自变量;ε是残差项;W是权重函数,为观测站点与预测站点距离的函数;
[0081] 本发明采用高斯核函数作为权重系数,采用吉洪诺夫正则化进行权重系数的修正:
[0082] (权重系数)
[0083] 式中:di为待预测站点与邻近监测站点的距离;参数k为核半径,核半径决定邻近站点被赋予权重的大小。
[0084]
[0085] 式中:λ为岭回归参数,即正则化系数。对上式进行求导得到:
[0086]
[0087] 式中:I为单位矩阵,尺寸大小和XTWX一致;λ为正则化系数。
[0088] 本发明采用L曲线法估计岭回归参数λ:
[0089]
[0090] α=lg[W(Y‑XB)2]
[0091] β=lg(B)2
[0092] 式中:α’、α‘’、β‘、β‘’分别代表α、β的一阶导数和二阶导数,求K的最大值,得到L曲线的最大曲率Kmax,Kmax所对应点的λ值即为所求的岭参数;
[0093] B.参考风速、风向因素的漂移量叠加:获取当地风场数据,提取风速、风向等资料,以前一个时间单位的PM2.5浓度空间场作为下一时间单位的漂移数据,以风速、风向数据进行前后时刻插值点的空间坐标变换,计算变换后空间点与下一时刻相邻点的距离并与最近的空间点进行算数平均。
[0094]
[0095]
[0096] 其中:Zt+1为下一时刻的PM2.5空间场中数据点的浓度值, 为下一时刻利用局部加权线性回归模型构建的基础空间场, 为t+1时刻需要叠加的漂移数据,即前一时刻利用局部加权线性回归模型构建的基础空间场(x,y,z,t)为t时刻数据点的空间位置, vx、vy、vz为t时刻待变换点处的风速分量。
[0097] 有益效果:本发明的基于LSTM模型的微波链路构建PM2.5三维动态监测场的方法,具有以下优点:
[0098] (1)本发明将无线微波大数据技术应用到PM2.5浓度监测的方向上,微波链路可从传统的仅根据雨量站分布和雷达探测盲区进行补充组网的方式改变为兼顾空气质量检测站点等相关气象、环境监测站点,对微波链路的组网方式起到补充完善作用;
[0099] (2)本发明利用LSTM模型进行干湿期判别的步骤可以更充分考虑到微波链路数据的秒级监测时序性特征,可以更精确快速地收敛到最优解,提高微波数据各类反演模型的准确性。同时LSTM模型深度学习的训练方式可以充分考虑到单条链路在各自布设区域的杂波干扰情况,智能化地形成特定情况特定链路单独的干湿期判别标准,相对于运用统一干湿期判别标准具有更精确的效果,对于我国复杂的下垫面情况包括城市地区建设发展等人为因素影响较大的情况,以及精细化微波网络布设数量变多范围变光的情况有很好的应用效果;
[0100] (3)本发明中利用对数正态分布随机数生成的方式实现微波链路线尺度数据向点尺度数据的转换与传统微波链路线尺度数据直接转换为多点均值的方式不同,能够更充分地反映出PM2.5浓度在空间分布上的差异性,而且本发明中随机数生成的方法具有多次模拟求取插值点统计概率的能力,在插值准确性、多点插值以及概率分层的角度均具有优越性,此外在其余线尺度数据的转化领域中具有推广性;
[0101] (4)本发明中利用局部加权线性回归模型构建实时PM2.5三维监测场的步骤对于完善新型室外PM2.5浓度实时监测系统,填补高时空分辨率大范围PM2.5浓度数据具有十分重要的意义,在与其余各类空气质量检测方法所得数据融合的角度上对于监测数据偏差的改进也起到帮助作用,同时风速、风向时序漂移量叠加的方法与传统直接进行反距离权重插值获取单一时间静态场的方法不同,考虑了数据的时序性。并且在此层面上,由于微波链路数据具有分秒级高时间分辨率的自身优势,基于空气颗粒飘浮的时滞性,本方法具有一定的科学依据;
[0102] (5)本发明中多次模拟随机数对于PM2.5监测场依据PM2.5浓度进行等级分层的方法,便于用户进行直观、便捷地使用,对于用户出行、运动均具有十分重要的意义;
[0103] (6)本发明提出了一种利用微波链路网络监测PM2.5分布的方法,建立了考虑时空变化特征的PM2.5区域监测模型,实现了秒级高分辨率PM2.5浓度监测场的构建,这一方法具有采样时空密度大、分辨率高、覆盖范围广等优势,能够满足微波链路设备在干期综合性监测应用方面的需求,可以有效解决传统空气质量检测站点布设数量少、不全面的问题,能充分灵敏地反应PM2.5的空间异质性,为环保部门空气质量监测提供了一种新的途径。

附图说明

[0104] 图1为本发明的流程图。

具体实施方式

[0105] 下面结合附图对本发明作更进一步的说明。
[0106] 如图1所示,本发明利用微波链路电平值数据,在干湿期判别的基础上,利用晴天时链路电平值波动情况,对PM2.5浓度进行监测。主要包括如下步骤:
[0107] 一、链路组网构建:
[0108] 微波链路PM2.5监测网由地面微波链路构成,监测网相关因素包括组成监测网的微波链路条数、微波链路的长度、微波链路的密度以及空间分布。为更精准的监测PM2.5 浓度分布,微波链路的架设方式以交叉为主,在假设过程中需通透,无遮挡物。架设路径需充分考虑附近传统雨量站、空气质量监测站等已搭建基础设施,在布设测雨雷达的区域也应充分考虑其探测盲区。
[0109] 二、干湿期判别:
[0110] (1)利用历史数据,选取n为长度的时间窗口,作为模型输入形式,并对选取的数据进行训练集标注,标注类型为干、湿;
[0111] (2)代入训练集数据,并对数据进行交叉验证;
[0112] (3)通过迭代调参、调整时间窗口等方式,不断优化模型,获取符合预期准确率的分类模型;
[0113] (4)实际应用中,利用当前时刻及其前n‑1个时间单位(目前监测数据的时间频率可达2‑3秒)的电平值作为LSTM模型的输入,输出结构为0或1,0表示干期,1表示湿期。
[0114] 三、链路线浓度计算:
[0115] 利用已经进行插补、杂波去除、PM2.5真实衰减计算等操作后的微波链路衰减数据 r(t),依据PM2.5浓度与微波衰减量响应关系反演出微波链路路径平均PM2.5浓度 W(t)=f(r(t)),即建立反演模型,此步骤为现有技术。
[0116] 四、PM2.5三维动态监测场的构建
[0117] 1.微波链路随机序列的模拟
[0118] 本部分主要实现将微波链路监测获取的线尺度数据通过均匀随机数的生成、均匀随机数的检验、对数正态随机序列的模拟、随机数的对比分配4个步骤转换为链路上若干个合理分布的点尺度数据。
[0119] ①微波链路数据均匀随机数生成
[0120] 本发明采用采用乘同余法生成[0,1]区间上的均匀随机数生成:
[0121]
[0122] 式中:乘子λ、模M和初始值x0为根据实际需要自己选定的常数;mod()为取余函数,mod(λxi‑1,M)为用M除以λxi‑1后得到的余数为xi;ui为[0,1]区间上的均匀随机数,其中ui的个数由指定的PM2.5浓度监测场的分辨率(一般以经纬度0.05度划分为一个网格)来确定。
[0123] ②生成均匀随机数的检验:
[0124] [0,1]上的随机数ui是否满足均匀性需通过统计参数检验、独立性检验、均匀性检验。
[0125] A.统计参数检验2
[0126] 记U为均匀随机变量,如果U服从[0,1]均匀分布,则U的均值 二阶矩 和方差S为
[0127]
[0128] 它们的数学期望和方差满足下述关系:
[0129]
[0130] 根据大树定律可知:
[0131]
[0132] 式中:Y1,Y2,Y3渐进服从N(0,1)分布。
[0133] 给定显著性水平α(常取0.05),若 则表示拒绝U为[0,1]上的均匀分布。
[0134] B.独立性检验:若U满足均匀性,则ui(i=1,2,…,n)是独立的。本发明的独立性检验采用综合自相关数检验法:(1)计算自相关系数rk:
[0135]
[0136] 其中,当n>50时, 当n<50时, 或n‑10。原则上参加计算的项数(n‑k) 至少10项以上。
[0137] (2)构造统计量: 若U为独立随机变量,则Q渐进服从自由度为m 的χ2分布。
2
[0138] (3)给定显著性水平α(常取0.05),查χ分布表,得
[0139] (4)判断:若 则U是独立的;反之不独立。
[0140] C.均匀性检验:2
[0141] 已知 渐进服从于χ(k‑1)分布。给定显著性水平α,若 则频率上满足均匀;反之不满足。需要注意一般要求样本容量n>>30 且
[0142] ③服从对数正态分布的纯随机序列的模拟
[0143] A.变换法:首先生成两组均匀随机数u1、u2,对均匀随机数u1、u2做下列变换:
[0144]
[0145] 则ξ1、ξ2为相互独立的标准正态分布纯随机序列。由大量的ut可得到大量的ξt。由ξt可转换为一般正态分布纯随机序列:
[0146]
[0147] 式中:和σ分别为正态分布纯随机序列xt的均值和标准差。
[0148] 为使生成的正态分布纯随机序列贴合于微波链路测量实际,采用微波链路监测的 PM2.5浓度线平均值作为纯随机序列xt的均值,由于大气颗粒悬浮物具有时滞性以及时间上的周期性,因此以邻近空气监测站的待生成时刻前后15h的PM2.5浓度监测数据与链路均值求得的标准差作为随机序列xt的标准差,即:
[0149]
[0150] 其中Xt为微波链路相邻的代表性测站前后15h的PM2.5浓度监测数据,为微波链路监测的线尺度平均值。
[0151] B.服从对数正态分布的纯随机序列的模拟
[0152] 假定xt服从正态分布,即LN 通过对数变换:
[0153] yt=ln(xt‑a)
[0154] 则yt服从正态分布。可以先利用变换法模拟出ξt,再通过以下公式模拟出yt:
[0155]
[0156] 因此由公式的逆变换就可以随机模拟xt
[0157]
[0158] 其中由于xt为服从对数正态分布的纯随机序列,式中的各参数满足如下关系:
[0159]
[0160] 其中Cv为离势系数,Cs为偏态系数,其计算公式如下:
[0161]
[0162] ④链路随机数的分配
[0163] 上述步骤生成的服从对数正态分布的随机序列虽然结合了链路监测平均值和邻近代表性站点的相邻时段内PM2.5浓度监测数据,但是仍需要考虑PM2.5浓度的空间异质性,本发明采用反距离权重插值法,利用特征值误差平方和最小的原理进行PM2.5浓度随机数的位置排序体现其空间异质性。
[0164] A.已知点数据对链路的反距离权重插值
[0165] 利用周围测站等现有检测设备提供的点尺度PM2.5浓度数据,利用反距离权重插值法进行与随机数模拟相同空间分辨率的微波链路插补,保证与对应链路生成随机数个数相同。
[0166]
[0167] 其中Zp是待插值点的属性值,Zi是已知点的实测数据,di是已知点与待插值点的距离。
[0168] B.随机序列重新排序
[0169] 设通过反距离权重插值得出的微波链路数据为x′i(i=1,2,…,n),即x′1,x′2,…,x′n,上述步骤生成的随机数为xj(j=1,2,…,n),即x1,x2,…,xn。变换随机数位置,直到其误2
差的平方和达到最小,即:求min(∑(x′i‑xj)),找出最小值情况下对应的随机数排序方式,并以此次序直接替换链路中反距离权重插值求得的PM2.5浓度数据。
[0170] 2.基于局部加权线性回归的三维PM2.5浓度空间插值
[0171] 本部分主要利用上一部分生成的微波链路中的对数正态分布随机序列与相邻监测站点等传统监测手段获取的实测点数据,利用PM2.5颗粒时滞性的特点以及微波链路监测数据的分秒级时间分辨率的特性,在基础三维监测场的前提下考虑风速、风向进行时序上的数据利用。
[0172] 通过局部加权线性回归模型与漂移量的叠加进行三维PM2.5监测空间的构建。
[0173] A.本发明采用局部加权线性回归模型最为三维空间的插值方法。局部加权线性回归模型与普通线性回归模型不同的是给待测点附近的每个点赋予一定的权重,并采用最小二乘法通过最小化损失函数来求得回归系数B。
[0174]
[0175] 式中:B为回归模型的回归系数;Xi为模型的自变量;ε是残差项;W是权重函数,通常是观测站点与预测站点距离的函数。
[0176] 本发明采用高斯核函数作为权重系数,采用吉洪诺夫正则化进行权重系数的修正:
[0177] (权重系数)
[0178] 式中:di为待预测站点与邻近监测站点的距离;参数k为核半径,核半径决定邻近站点被赋予权重的大小。
[0179] (核岭回归)
[0180] 式中:λ为岭回归参数,即正则化系数。对上式进行求导得到:
[0181]
[0182] 式中:I为单位矩阵,尺寸大小和XTWX一致;λ为正则化系数。
[0183] 本发明采用L曲线法估计岭回归参数λ:
[0184]
[0185] 式中:α’、α‘’、β‘、β‘’分别代表α、β的一阶导数和二阶导数。求K的最大值,得到L曲线的最大曲率Kmax,Kmax所对应点的λ值即为所求的岭参数。
[0186] B.参考风速、风向因素的漂移量叠加:获取当地风场数据,提取风速、风向等资料,以前一个时间单位的PM2.5浓度空间场作为下一时间单位的漂移数据,以风速、风向数据进行前后时刻插值点的空间坐标变换,计算变换后空间点与下一时刻相邻点的距离并与最近的空间点进行算数平均。
[0187]
[0188]
[0189] 其中:Zt+1为下一时刻的PM2.5空间场中数据点的浓度值, 为下一时刻利用局部加权线性回归模型构建的基础空间场, 为t+1时刻需要叠加的漂移数据,即前一时刻利用局部加权线性回归模型构建的基础空间场(x,y,z,t)为t时刻数据点的空间位置, vx、vy、vz为t时刻待变换点处的风速分量。
[0190] 这里需要注意的是只有无实测的数据点才需要插值与漂移量叠加,如果有传统监测手段直接获取的PM2.5浓度数据则直接在空间场中标定。
[0191] 3.PM2.5分级概率层的统计构建
[0192] 多次进行对数正态分布随机序列的模拟并重复上述步骤,并以此为基础统计PM2.5 三维检测场中各数据点的PM2,5浓度信息,计算多测模拟的PM2.5浓度在0~150微克/ 立方米、150~250微克/立方米、250~500微克/立方米、500微克/立方米4个区间上的概率值,并取概率最大的情况作为该数据点的PM2.5浓度级别,最终实现PM2.5三维空间监测场的浓度等级分层。
[0193] 以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。