基于人工智能决策树的GPS遥感洪水预警方法转让专利

申请号 : CN202210183348.3

文献号 : CN114254568B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 马广迪杨为琛张国杨生娟李天宇孔诗元施妍慧

申请人 : 浙江国遥地理信息技术有限公司

摘要 :

本发明公开了一种基于人工智能决策树的GPS遥感洪水预测方法,包括如下步骤:S1、读取GPS卫星原始观测值;S2、原始观测值的预处理;S3、采用历元间的伪距差、载波相位差和历元时间间隔的信息生成洪水探测量,所述洪水探测量包括第一探测量和第二探测量;S4、采用基于人工智能决策树算法建立分卫星分频率的洪水探测模型;S5、联合GPS双频信号的第一探测量和第二探测量对洪水进行探测,并根据探测阈值将结果进行标记;S6、根据探测结果进行洪水预警或对洪水探测模型更新迭代。采用基于人工智能决策树算法建立高精度的洪水探测模型,深度挖掘探测量和其它辅助特征参数之间的相关性,降低误探率,保证洪水探测的精准度和稳定性。

权利要求 :

1.一种基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,包括如下步骤:S1、读取GPS卫星原始观测值,包括伪距、载波相位观测值,并获取辅助特征信息,所述辅助特征信号包括计算相应的高度角,方位角和历元时间间隔;

S2、原始观测值的预处理

S2‑1、采用基于均值漂移聚类算法对观测值中的粗差进行探测并剔除;

S2‑2、采用基于均衡阈值策略的小波包变换算法消除高频随机噪声影响;

S3、采用历元间的伪距差、载波相位差和历元时间间隔的信息生成洪水探测量,所述洪水探测量包括第一探测量和第二探测量,所述伪距差通过相邻历元的伪距观测值进行做差得到,所述载波相位差通过相邻历元的载波相位观测值进行做差得到,所述历元时间间隔为相邻历元之间的时间间隔可通过历元的时间做差得到;

所述历元时间间隔的获取方法:

第一个历元的时间表示为T1,第二个历元的时间表示为T2,则历元时间间隔为:ΔT=T2‑T1;

最后,通过历元时间间隔和历元间差值分别计算伪距和载波相位的变化率,所述第一探测量为伪距变化率,所述第二探测量为载波相位变化率;

S4、采用基于人工智能决策树算法建立分卫星分频率的洪水探测模型,

1)采用大地测量型接收机持续收集GPS原始伪距和载波相位观测值,通过步骤S2消除粗差和噪声的影响,并利用步骤S3计算得到第一探测量和第二探测量,同时计算相应历元时刻的高度角和方位角信息,为后续模型建立和模型搜索提供辅助,此外,利用雨量计同步测量雨量信息,将该数据与GPS卫星收集的数据保持时间上的同步;

2)利用第一探测量、第二探测量、相应历元时刻的高度角和方位角信息以及时间同步的雨量信息做为决策树的输入参数,并根据上述决策树推测出探测阈值;

3)通过上述生成的决策树,最终建立其分卫星分频率的洪水探测模型,所述洪水探测模型为以数据库的形式保存在计算机上,所述数据库主要包括第一探测量、第二探测量、相应的高度角、方位角和探测阈值;

S5、联合GPS双频信号的第一探测量和第二探测量对洪水进行探测,并根据探测阈值将结果进行标记;

S6、根据探测结果进行洪水预警或对洪水探测模型更新迭代。

2.根据权利要求1所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述步骤S1中,通过全球IGS站采集伪距和载波相位观测值。

3.根据权利要求1所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述步骤S2‑1包括

1)采用均值漂移聚类算法估计收集的观测值数据集的密度中心,得到不含有粗差值数据的搜索半径,作为后续粗差探测的检验向量;

2)利用计算得到的检验向量对观测日当天的数据进行粗差探测,对于大于探测检验向量的观测数据,则认定为该观测值为粗差,进行剔除,对于小于或等于该探测检验向量内的观测数据,则进行保存,用于后续的洪水探测。

4.根据权利要求3所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述均值漂移聚类算法如下:对于给定的数据集 中的任一数据点的核密度函数估计可以通过下式得到:

式中,n表示数据长度,h是密度核的带宽,d表示数据集的维数,K是核函数,x为输入信号值, 表示范数运算,此处使用使密度估计的均方误差最小的核函数,即Epanechnikov核,定义表示如下:式中,cd是d维单位高维球的体积,T表示转置运算,属于矩阵领域常规符号,其它符号含义同公式(1)相同,对公式(1)进行求导,可得到x点的概率密度梯度为:式中,n表示数据长度,h是密度核的带宽,d表示数据集的维数,nx是超球体内数据集的d个数,hcd表示超球体的体积,其球体的中心是点x,式中 表示x点的密度估计,可以表示为:Rh(x)表示半径为h的超球体范围内所有数据构成的集合,表示为:2

,此外,根据公式(1)和公式(2)可得,(d+2)/h 为常数, 为变量,即:

式中,Mh(x)就是均值漂移向量,该向量会沿着密度增加最快的方向移动,最终在局部密度最大点处收敛,整理上述公式(3)、公式(4)和公式(5),其均值漂移向量可表示为:其迭代过程表示如下:a、根据公式(5)计算均值漂移向量Mh(x);b、转移Mh(x)至下一个迭代点;c、重复a和b至收敛到局部密度最大点为止,最终输出用于后续粗差探测的检验向量。

5.根据权利要求3所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述步骤S2‑2包括

1)通过小波包变换将信号进行分解,得到待去噪的小波系数;

2)利用均衡阈值策略选取最优去噪阈值对分解后的小波系数进行去噪;

3)利用降噪后的小波系数对信号进行小波包反变换,完成信号的重构,得到去噪后的信号。

6.根据权利要求5所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述小波包变换的分解过程表示如下:式中,t和k分别表示连续和离散信号的时间变量序列号, 和 分别是小波包变换的正交尺度函数和小波函数, 表示上一级的信号,初始计算时表示原始信号,分别是正交镜像滤波前置尺度函数和小波母函数,并且两者满足以下关系: 假设 并且 成立,则当 时可以获得如下递归

关系,即:

上述公式即为信号的小波包分解。

7.根据权利要求6所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述均衡阈值策略,其公式表示如下: 式中,Uj,k 表示原始小波系数, 表示去噪后的小波系数,α为 ,sign(˙)表示符号函数,j表示分解层,k表示序列节点,λ表示阈值,其计算公式表示为:式中,median(˙)表示取序列中位数值,N表示信号长度。

8.根据权利要求7所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述重构的过程表示如下:式中, 即为去噪后的信号,j表示分解层数,其它参数含义与公式(7~11)中相同。

9.根据权利要求1所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述步骤S3中,所述伪距差和载波相位差的获取:

对相邻历元的伪距和载波相位观测值进行做差,具体表示如下:式中,P和L分别表示伪距和载波相位观测值,i表示历元,其中Δ表示相邻历元之间做差,最后,通过历元时间间隔和历元间差值分别计算伪距和载波相位的变化率,具体表示为:式中,ΔT为历元时间间隔,ΔP和ΔL分别为历元间伪距和载波相位的差,δP和δL分别为历元间伪距和载波相位的变化率。

10.根据权利要求1所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述决策树为ID3决策树算法,主要是计算每个属性的信息增益值,最终选取具有最大值的属性作为分裂属性,以此来对数据集进行划分,最终形成决策树,其数学表达式如下:假设X是一个取值有限的离散随机变量,离散随机变量用n表示,则它的概率分布可以表示为:则随机变量X的熵定义为:

其中,当pi=0时,定义0log0=0,从上述定义可以知道,信息熵只取决于X的分布,而与X的具体值无关,因此X的熵也可以定义为H(p),即H(p)=H(X)对于随机变量(X,Y),其联合概率分布可以表示为:式中,n和m分布是X和Y的取值个数,则X给定条件下Y的条件熵H(Y|X)表示为:式中, 公式(18)为X给定条件下Y的条件概

率分布的熵对X的数学期望;

进一步,对于数据集D的经验熵可表示为H(D),属性A对数据集D的经验条件熵表示为H(D|A),则属性A对数据集D的信息增益为g(D,A)表示为:信息增益表示在A知道的情况下,了解D所需要的信息减少的量,因此,基于上述定义,可得ID3的算法过程如下:(1)输入:给定训练的数据集D,此处训练数据集包括伪距变化率、载波相位变化率、高度角、方位角和雨量信息;

(2)创建一个初始节点,如果数据集D中所有数据样本都在同一类,则算法终止,将这个类作为类标签,返回决策树;

(3)否则,依据ID3算法选取信息增益最大的属性,将该属性作为本节点的分裂属性;

(4)对该分裂属性中的每一个样本值,延伸一个相应的分支,并根据属性值划分样本;

(5)重复上述(2‑4)过程,自顶向下进行递归,只到满足以下三个条件为止:1)分支没有样本;2)没有可用的属性进行划分;3)待分裂节点的所有样本属于同一类;

(6)输出:最终决策树。

11.根据权利要求10所述的基于人工智能决策树的GPS遥感洪水预警方法,其特征在于,所述步骤S5包括S5‑1、采用基于GPS卫星双频的伪距变化率的探测量对洪水进行探测;

S5‑2、采用基于GPS卫星双频的第二探测量对洪水进行探测。

说明书 :

基于人工智能决策树的GPS遥感洪水预警方法

技术领域

[0001] 本发明涉及导航卫星遥感反演技术领域,具体指一种基于人工智能决策树的GPS遥感洪水预测方法。

背景技术

[0002] 随着全球气候变暖以及由城镇化发展而引发的城市水文效应变化,导致极端强降雨天气极其容易造成城市内涝以及城镇局部洪水发生,使得城市洪涝灾害的风险不断增
大。比如,2016年7月初发生在湖北省武汉市的城市洪涝,2018年7月低发生在新疆哈密市的
城乡局部洪水灾害以及2021年7月低发生在河南新乡的城市局部洪水等,造成几十人死亡,
且直接经济损失高达30亿元,可见城市短时局部内涝以及洪水严重威胁着人民群众的生命
财产安全。因此,建立实时高效精准的城市洪水探测预警方法,增强城市雨洪管理和预防能
力,保障人民群众的生命和财产安全是当前城市地理测绘遥感领域亟待解决的问题之一。
[0003] 当前,基于导航卫星反演洪水的探测方法从观测值角度主要可以分为两大类,第一类是基于信号载噪比观测值进行的洪水预警探测,但不同弧段的载噪比性能表现差异较
大,特别是在洪水探测过程中,高弧段(高度角大于60度)时的载噪比波动比低弧段(高度角
低于30度)时更明显,这就导致常规的基于低弧段载噪比的探测方法效率降低。另外,基于
载噪比的探测方法受接收机类型制约较为严重。比如,不同厂家的接收机输出的载噪比观
测值差异很大,导致难以建立统一规范的探测阈值。而有些载噪比又采用近似输出,导致载
噪比分辨率较低,严重降低洪水探测精度。此外,有些接收机也不具备输出载噪比的功能,
这会导致该方法失效。第二类是基于伪距和载波相位观测值的方法进行洪水探测预警,但
现有方法都是通过对伪距和载波相位观测值进行组合后进行探测,而组合观测值会导致噪
声和其它误差(如对流层残差和电离层残差)放大,导致现有基于伪距和载波相位观测值的
探测方法精度较低。此外,现在方法没有顾及粗差对观测值的影响,导致探测成功率较低,
而对探测模型的建立忽略了特征参数的关联性,这也导致现有方法误探率较高,产生过多
虚假预警。
[0004] 因此,亟需一种顾及伪距和载波相位粗差和噪声影响的算法,进而能够建立精确的洪水探测模型,不仅可以提高洪水探测的实时性和精确性,也可以有效保证洪水探测的
成功率和稳定性,为洪水灾害预警提供强有力的支撑。

发明内容

[0005] 本发明根据现有技术的不足,提出一种基于人工智能决策树的GPS遥感洪水预测方法,采用基于人工智能决策树算法建立高精度的洪水探测模型,模型即一个存储了探测
观测量(伪距变化率和载波相位变化率)以及相应辅助信息(高度角、方位角、卫星号、降雨
量、探测阈值等)的数据库,以文本的形式存储在电脑上,深度挖掘探测量和其它辅助特征
参数之间的相关性,降低误探率,保证洪水探测的精准度和稳定性,并联合GPS卫星L1频和
L2频进行双频联合探测,进一步保证探测精度。
[0006] 为了解决上述技术问题,本发明的技术方案为:
[0007] 一种基于人工智能决策树的GPS遥感洪水预测方法,包括如下步骤:
[0008] S1、读取GPS卫星原始观测值,包括伪距、载波相位观测值,并获取辅助特征信息,所述辅助特征信号包括计算相应的高度角,方位角和历元时间间隔;
[0009] S2、原始观测值的预处理
[0010] S2‑1、采用基于均值漂移聚类算法对观测值中的粗差进行探测并剔除;
[0011] S2‑2、采用基于均衡阈值策略的小波包变换算法消除高频随机噪声影响;
[0012] S3、采用历元间的伪距差、载波相位差和历元时间间隔信息生成洪水探测量,所述洪水探测量包括第一探测量和第二探测量,
[0013] 所述伪距差通过相邻历元的伪距观测值进行做差得到,所述载波相位差通过相邻历元的载波相位观测值进行做差得到,所述历元时间间隔为相邻历元之间的时间间隔可通
过历元的时间做差得到;
[0014] S4、采用基于人工智能决策树算法建立分卫星分频率的洪水探测模型, 该模型即为将每颗卫星每个频率的信息,如伪距变化率、载波相位变化率、高度角、方位角、卫星号、
降雨量、探测阈值单独进行分类,并以文本的形式存储在电脑上的一个数据库中,后续用的
时候直接搜索该文本数据库即可;
[0015] S5、联合GPS双频信号的第一探测量和第二探测量对洪水进行探测,并根据探测阈值将结果进行标记;
[0016] S6、根据探测结果进行洪水预警或对洪水探测模型更新迭代。
[0017] 1、根据权利要求1所述的基于人工智能决策树的GPS遥感洪水预测方法,其特征在于,所述步骤S1中,通过全球IGS站采集伪距和载波相位观测值。
[0018] 作为优选,所述步骤S2‑1包括
[0019] 1)采用均值漂移聚类算法估计收集的观测值数据集的密度中心,得到不含有粗差值数据的搜索半径,作为后续粗差探测的检验向量;
[0020] 2)利用计算得到的检验向量对观测日当天的数据进行粗差探测,对于大于探测检验向量的观测数据,则认定为该观测值为粗差,进行剔除,对于小于或等于该探测检验向量
内的观测数据,则进行保存,用于后续的洪水探测。
[0021] 作为优选,所述均值漂移聚类算法如下:
[0022] 对于给定的数据集 中的任一数据点的核密度函数估计可以通过下式得到:
[0023]               (1)
[0024] 式中,n表示数据长度,h是密度核的带宽,d表示数据集的维数,K是核函数,x为输入信号值, 表示范数运算,此处使用使密度估计的均方误差最小的核函数,即
Epanechnikov核,定义表示如下:
[0025]          (2)
[0026] 式中,cd是d维单位高维球的体积,T表示转置运算,属于矩阵领域常规符号,其它符号含义同公式(1)相同,对公式(1)进行求导,可得到x点的概率密度梯度为:
[0027]        (3)
[0028] 式中,n表示数据长度,h是密度核的带宽,d表示数据集的维数,nx是超球体内数据d
集的个数,hcd表示超球体的体积,其球体的中心是点x,式中 表示x点的密度估
计,可以表示为:
[0029]                (4)
[0030] Rh(x)表示半径为h的超球体范围内所有数据构成的集合,表示为:,此外,根据公式(1)和公式(2)可得,(d+2)/
2
h 为常数, 为变量,即:
[0031]            (5)
[0032] 式中,Mh(x)就是均值漂移向量,该向量会沿着密度增加最快的方向移动,最终在局部密度最大点处收敛,
[0033] 整理上述公式(3)、公式(4)和公式(5),其均值漂移向量可表示为:
[0034]                  (6)
[0035] 其迭代过程表示如下:a、根据公式(5)计算均值漂移向量Mh(x);b、转移Mh(x)至下一个迭代点;c、重复a和b至收敛到局部密度最大点为止,最终输出用于后续粗差探测的检
验向量。
[0036] 作为优选,所述步骤S2‑2包括
[0037] 1)通过小波包变换将信号进行分解,得到待去噪的小波系数;
[0038] 2)利用均衡阈值策略选取最优去噪阈值对分解后的小波系数进去去噪;
[0039] 3)利用降噪后的小波系数对信号进行小波包反变换,完成信号的重构,得到去噪后的信号。
[0040] 作为优选,所述小波包变换的分解过程表示如下:
[0041]           (7)
[0042] 式中,t和k分别表示连续和离散信号的时间变量序列号, 和 分别是小波包变换的正交尺度函数和小波函数, 表示上一级的信号,初始计算时表示
原始信号, 和 分别是正交镜像滤波前置尺度函数和小波母函数,并且两者满
足以下关系:
[0043]              (8)
[0044] 假设 并且 成立,则当 时可以获得如下递归关系,即:
[0045]               (9)
[0046] 上述公式即为信号的小波包分解。
[0047] 作为优选,所述均衡阈值策略,其公式表示如下:
[0048]    (10)
[0049] 式中,Uj,k表示原始小波系数, 表示去噪后的小波系数,α为,sign(˙)表示符号函数,j表示分解层,k表示序列节点,λ表示阈值,其
计算公式表示为:
[0050]             (11)
[0051] 式中,median(˙)表示取序列中位数值,N表示信号长度。
[0052] 作为优选,所述重构的过程表示如下:
[0053]         (12)
[0054] 式中, 即为去噪后的信号,j表示分解层数,其它参数含义与公式(7~11)中相同。
[0055] 作为优选,所述步骤S3中,
[0056] 所述历元时间间隔的获取方法:
[0057] 第一个历元的时间表示为T1,第二个历元的时间表示为T2,则历元时间间隔为:ΔT=T2‑T1;
[0058] 所述伪距差和载波相位差的获取:
[0059] 对相邻历元的伪距和载波相位观测值进行做差,具体表示如下:
[0060]                 (13)
[0061] 式中,P和L分别表示伪距和载波相位观测值,i表示历元,其中Δ表示相邻历元之间做差,
[0062] 最后,通过历元时间间隔和历元间差值分别计算伪距和载波相位的变化率,具体表示为:
[0063]                (14)
[0064] 式中,ΔT为历元时间间隔,ΔP和ΔL分别为历元间伪距和载波相位差,δP和δL分别为历元间伪距和载波相位变化率,通过上述过程可以计算得到第一探测量和第二探测
量,所述第一探测量为伪距变化率,所述第二探测量为载波相位变化率。
[0065] 作为优选,所述步骤S4的方法如下:
[0066] 1)采用大地测量型接收机持续收集GPS原始伪距和载波相位观测值,通过步骤S2消除粗差和噪声的影响,并利用步骤S3计算得到第一探测量和第二探测量,同时计算相应
历元时刻的高度角和方位角信息,为后续模型建立和模型搜索提供辅助,此外,利用雨量计
同步测量雨量信息,将该数据与GPS卫星收集的数据保持时间上的同步;
[0067] 2)利用第一探测量、第二探测量、相应历元时刻的高度角和方位角信息以及时间同步的雨量信息做为决策树的输入参数,并根据上述决策树推测出探测阈值;
[0068] 3)通过上述生成的决策树,最终建立其分卫星分频率的洪水探测模型,所述洪水探测模型为以数据库的形式保存在计算机上,所述数据库主要包括第一探测量、第二探测
量、相应的高度角方位角和探测阈值。
[0069] 作为优选,所述决策树为ID3决策树算法,主要是计算每个属性的信息增益
[0070] 值,最终选取具有最大值的属性作为分裂属性,以此来对数据集进行划分,最终形成决策树,其数学表达式如下:
[0071] 假设X是一个取值有限的离散随机变量,离散随机变量用n表示,则它的概
[0072] 率分布可以表示为:
[0073]         (15)
[0074] 则随机变量X的熵定义为:
[0075]          (16)
[0076] 其中,当p i =0时,定义0log0=0,从上述定义可以知道,信息熵只取决于X的分布,
[0077] 而与X的具体值无关,因此X的熵也可以定义为H(p),即H(p)=H(X).
[0078] 对于随机变量(X,Y),其联合概率分布可以表示为:  (17)
[0079] 式中,n和m分布是X和Y的取值个数,则X给定条件下Y的条件熵H(Y|X)表示为:        (18)
[0080] 式中,  公式(18)为X给定条件下Y的条件概率分布的熵对X的数学期望;进一步,对于数据集D的经验熵可表示为H(D),属性A对数
据集D的经验条件熵表示为H(D|A),则属性A对数据集D的信息增益为g(D,A)表示为:
[0081]          (19)
[0082] 信息增益表示在A知道的情况下,了解D所需要的信息减少的量,因此,基于上述定义,可得ID3的算法过程如下:
[0083] (1)输入:给定训练的数据集D,此处训练数据集就是我们之前得到的第一探测量、载波相位变化率、高度角、方位角和雨量信息;
[0084] (2)创建一个初始节点,如果数据集D中所有数据样本都在同一类,则算法终止,将这个类作为类标签,返回决策树;
[0085] (3)否则,依据ID3算法选取信息增益最大的属性,将该属性作为本节点的分裂属性;
[0086] (4)对该分裂属性中的每一个样本值,延伸一个相应的分支,并根据属性值划分样本;
[0087] (5)重复上述(2‑4)过程,自顶向下进行递归,只到满足以下三个条件
[0088] 为止:1)分支没有样本;2)没有可用的属性进行划分;3)待分裂节点的所有
[0089] 样本属于同一类;(6)输出:最终决策树。
[0090] 作为优选,所述步骤S5包括
[0091] S5‑1、采用基于GPS卫星双频的伪距变化率的探测量对洪水进行探测;
[0092] S5‑2、采用基于GPS卫星双频的第二探测量对洪水进行探测。
[0093] 本发明具有以下的特点和有益效果:
[0094] 一、可以利用现有GPS导航卫星对洪水进行探测,与现有方法相比,既可以解决基于载噪比的方法受接收机类型制约而导致探测精度低或探测失效等问题,也可以解决基于
伪距载波相位组合法受噪声和其它误差(如电离层误差和对流层误差)影响大而导致探测
精度低等问题。
[0095] 二、同时联合GPS双频信号的伪距和载波相位变化率联合探测可以保证探测成功率和稳定性等问题,从而满足高精度、高实时性和高稳定性的洪水探测。
[0096] 三、考虑到原始观测值粗差导致的观测值精度低等问题,采用基于均值漂移聚类的粗差探测方法对原始观测值的粗差进行探测并剔除,保证数据优良率。
[0097] 四、利用基于均衡阈值策略的小波包变换算法滤除高频随机噪声,仅保留含有多径信号影响的观测值,提高探测量精度。
[0098] 五、利用历元间做差和历元时间间隔信息生成伪距变化率和载波相位变化率,同时采用两种探测量也保证探测精度和稳定性。
[0099] 六、采用基于人工智能决策树算法建立洪水探测模型,深度挖掘探测量、辅助特征参数和降雨量之间的相关性,降低洪水误探率。
[0100] 七、联合GPS双频段信号联合探测,有效保证探测成功率和稳定性。同时利用新数据对探测模型进行更新迭代,提高模型的长期稳定性。

附图说明

[0101] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可
以根据这些附图获得其他的附图。
[0102] 图1 基于人工智能决策树的GPS遥感洪水预警方法流程图。
[0103] 图2 基于ID3算法决策树模型对数据处理后的结果简要展示图。
[0104] 图3 基于GPS卫星伪距变化率的洪水预警算法流程图。
[0105] 图4 基于GPS卫星载波相位变化率的洪水预警算法流程图。

具体实施方式

[0106] 需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0107] 在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对
本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”
的含义是两个或两个以上。
[0108] 在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语
在本发明中的具体含义。
[0109] 本发明提供了一种基于人工智能决策树的GPS遥感洪水预测方法,如图1所示,包括如下步骤:
[0110] S1、读取GPS卫星原始观测值,包括伪距、载波相位观测值,并获取辅助特征信息,所述辅助特征信息包括计算相应的高度角,方位角和历元时间间隔;
[0111] S2、原始观测值的预处理
[0112] S2‑1、采用基于均值漂移聚类算法对观测值中的粗差进行探测并剔除;
[0113] S2‑2、采用基于均衡阈值策略的小波包变换算法消除高频随机噪声影响;
[0114] S3、采用历元间的伪距差、载波相位差和历元时间间隔的信息生成洪水探测量,所述洪水探测量包括第一探测量和第二探测量,
[0115] 所述伪距差通过相邻历元的伪距观测值进行做差得到,所述载波相位差通过相邻历元的载波相位观测值进行做差得到,所述历元时间间隔为相邻历元之间的时间间隔可通
过历元的时间做差得到;
[0116] S4、采用基于人工智能决策树算法建立分卫星分频率的洪水探测模型, 该
[0117] 模型即为将每颗卫星每个频率的信息,如伪距变化率、载波相位变化率、高度
[0118] 角,方位角、卫星号、降雨量、探测阈值等单独进行分类,并以文本的形式存
[0119] 储在电脑上的一个数据库中,后续用的时候直接搜索该文本数据库即可;
[0120] S5、联合GPS双频信号的第一探测量和第二探测量对洪水进行探测,并根据探测阈值将结果进行标记;
[0121] S6、根据探测结果进行洪水预警或对洪水探测模型更新迭代。
[0122] 上述技术方案中,可以利用现有GPS导航卫星对洪水进行探测,与现有方法相比,既可以解决基于载噪比的方法受接收机类型制约而导致探测精度低或探测失效等问题,大
大降低了硬件设备的需要和成本,也可以解决基于伪距载波相位组合法受噪声和其它误差
(如电离层误差和对流层误差)影响大而导致探测精度低等问题。
[0123] 可以理解的,高度角和方位角的计算为本领域中常规的技术手段,因此本实施例中不对高度角和方位角的计算进行具体的说明。
[0124] 进一步的,所述步骤S1中,通过全球IGS站采集伪距和载波相位观测值。
[0125] 可以理解的,由于IGS站均建在环境开阔地带,接收环境较好,所以含有粗差观测值的概率较小,因此非常适合做为估计粗差搜索半径的数据集。
[0126] 本发明的进一步设置,所述步骤S2‑1包括
[0127] 1)采用均值漂移聚类算法估计收集的观测值数据集的密度中心,得到不含有粗差值数据的搜索半径,作为后续粗差探测的检验向量;
[0128] 进一步的,所述均值漂移聚类算法如下:
[0129] 对于给定的数据集 中的任一数据点的核密度函数估计可以通过下式得到:
[0130]               (1)
[0131] 式中,n表示数据长度,h是密度核的带宽,d表示数据集的维数,K是核函数,x为输入信号值, 表示范数运算,属于数学常规方法,此处使用使密度估计的均方误差最小的
核函数,即Epanechnikov核,定义表示如下:
[0132]          (2)
[0133] 式中,cd是d维单位高维球的体积,T表示转置运算,属于矩阵领域常规符号,其它符号含义同公式(1)相同,对公式(1)进行求导,可得到x点的概率密度梯度为:
[0134]        (3)
[0135] 式中,n表示数据长度,h是密度核的带宽,d表示数据集的维数,nx是超球体内数据d
集的个数,hcd表示超球体的体积,其球体的中心是点x,式中 表示x点的密度估
计,可以表示为:
[0136]                (4)
[0137] Rh(x)表示半径为h的超球体范围内所有数据构成的集合,表示为:,此外,根据公式(1)和公式(2)可得,(d+2)/
2
h 为常数, 为变量,即:
[0138]            (5)
[0139] 式中,Mh(x)就是均值漂移向量,该向量会沿着密度增加最快的方向移动,最终在局部密度最大点处收敛,
[0140] 整理上述公式(3)、公式(4)和公式(5),其均值漂移向量可表示为:
[0141]            (6)
[0142] 其迭代过程表示如下:a、根据公式(5)计算均值漂移向量Mh(x);b、转移Mh(x)至下一个迭代点;c、重复a和b至收敛到局部密度最大点为止,最终输出用于后续粗差探测的检
验向量。
[0143] 2)利用计算得到的检验向量对观测日当天的数据进行粗差探测,对于大于探测检验向量的观测数据,则认定为该观测值为粗差,进行剔除,对于小于或等于该探测检验向量
内的观测数据,则进行保存,用于后续的洪水探测。
[0144] 本实施例的进一步设置,所述步骤S2‑2包括
[0145] 1)通过小波包变换将信号进行分解,得到待去噪的小波系数;
[0146] 具体的,所述小波包变换的分解过程表示如下:
[0147]           (7)
[0148] 式中,t和k分别表示连续和离散信号的时间变量序列号, 和 分别是小波包变换的正交尺度函数和小波函数, 表示上一级的信号,初始计算时表示
原始信号, 和 分别是正交镜像滤波前置尺度函数和小波母函数,并且两者满
足以下关系:
[0149]              (8)
[0150] 假设 并且 成立,则当 时可以获得如下递归关系,即:
[0151]               (9)
[0152] 上述公式即为信号的小波包分解。
[0153] 需要指出的是,小波包变换每次只能由一个信号分解为一个低频和一个高频信号,因此需要进行迭代。考虑GPS信号的特征,这里选择三层迭代分解,即:总的分解层数为
三层。经过三层小波包分解后,可以得到相应的小波系数。
[0154] 2)利用均衡阈值策略选取最优去噪阈值对分解后的小波系数进去去噪,
[0155] 可以理解的,现有的硬阈值策略会导致小波系数存在不连续的情况,而软阈值策略会导致信号逼近程度差,造成重构信号误差大的情况。因此,这里采用均衡阈值策略,其
公式表示如下:
[0156]    (10)
[0157] 式中,Uj,k表示原始小波系数, 表示去噪后的小波系数,α为,sign(˙)表示符号函数,j表示分解层,k表示序列节点,λ表示阈值,其
计算公式表示为:
[0158]             (11)
[0159] 式中,median(˙)表示取序列中位数值,N表示信号长度。上述均衡阈值策略可有效提高小波包变换去噪效果。
[0160] 3)利用降噪后的小波系数对信号进行小波包反变换,完成信号的重构,得到去噪后的信号,
[0161] 具体的,所述重构的过程表示如下:
[0162]         (12)
[0163] 式中, 即为去噪后的信号,j表示分解层数,其它参数含义与公式(7~11)中相同。
[0164] 通过上述技术方案,可以有效滤除高频随机噪声,得到仅保留多路径反射信号的伪距和载波相位观测值。
[0165] 本实施例的进一步设置,所述步骤S3中,
[0166] 所述历元时间间隔的获取方法:
[0167] 第一个历元的时间表示为T1,第二个历元的时间表示为T2,则历元时间间隔为:ΔT=T2‑T1;
[0168] 所述伪距差和载波相位差的获取:
[0169] 对相邻历元的伪距和载波相位观测值进行做差,具体表示如下:
[0170]                 (13)
[0171] 式中,P和L分别表示伪距和载波相位观测值,i表示历元,其中Δ表示相邻历元之间做差,
[0172] 最后,通过历元时间间隔和历元间差值分别计算伪距和载波相位的变化率,具体表示为:
[0173]                (14)
[0174] 式中,ΔT为历元时间间隔,ΔP和ΔL分别为历元间伪距和载波相位差,δP和δL分别为历元间伪距和载波相位变化率,通过上述过程可以计算得到第一探测量和第二探测
量,所述第一探测量为伪距变化率,所述第二探测量为载波相位变化率。
[0175] 本实施例的进一步设置,如图2所示,所述步骤S4的方法如下:
[0176] 1)采用大地测量型接收机持续收集GPS原始伪距和载波相位观测值,通过步骤S2消除粗差和噪声的影响,并利用步骤S3计算得到第一探测量和第二探测量,同时计算相应
历元时刻的高度角和方位角信息,为后续模型建立和模型搜索提供辅助,此外,利用雨量计
同步测量雨量信息,将该数据与GPS卫星收集的数据保持时间上的同步;
[0177] 2)利用第一探测量、第二探测量、相应历元时刻的高度角和方位角信息以及时间同步的雨量信息做为决策树的输入参数,并根据上述决策树推测出探测阈值;
[0178] 3)通过上述生成的决策树,最终建立其分卫星分频率的洪水探测模型,所述洪水探测模型为以数据库的形式保存在计算机上,所述数据库主要包括第一探测量、第二探测
量、相应的高度角方位角和探测阈值。
[0179] 具体的,所述决策树为ID3决策树算法,ID3算法是一种经典的决策树算法,主要是计算每个属性的信息增益值,最终选取具有最大值的属性作为分裂属性,以此来对数据集
进行划分,最终形成决策树,其数学表达式如下:
[0180] 假设X是一个取值有限的离散随机变量,离散随机变量用n表示,则它的概率分布可以表示为:
[0181]         (15)
[0182] 则随机变量X的熵定义为:
[0183]          (16)
[0184] 其中,当pi=0时,定义0log0=0,从上述定义可以知道,信息熵只取决于X的分布,而与X的具体值无关,因此X的熵也可以定义为H(p),即H(p)=H(X)。
[0185] 对于随机变量(X,Y),其联合概率分布可以表示为:
[0186]   (17)
[0187] 式中,n和m分布是X和Y的取值个数,则X给定条件下Y的条件熵H(Y|X)表示为:
[0188]         (18)
[0189] 式中, 公式(18)为X给定条件下Y的条件概率分布的熵对X的数学期望;
[0190] 进一步,对于数据集D的经验熵可表示为H(D),属性A对数据集D的经验条件熵表示为H(D|A),则属性A对数据集D的信息增益为g(D,A)表示为:
[0191]          (19)
[0192] 信息增益表示在A知道的情况下,了解D所需要的信息减少的量,因此,基于上述定义,可得ID3的算法过程如下:
[0193] (1)输入:给定训练的数据集D,此处训练数据集就是我们之前得到的伪距变化率、载波相位变化率、高度角、方位角和雨量信息;
[0194] 可以理解的,该数据集中还包括卫星号、接收机类型、信号频率等可查询得到的辅助特征参数。
[0195] (2)创建一个初始节点,如果数据集D中所有数据样本都在同一类,则算法终止,将这个类作为类标签,返回决策树;
[0196] (3)否则,依据ID3算法选取信息增益最大的属性,将该属性作为本节点的分裂属性;
[0197] (4)对该分裂属性中的每一个样本值,延伸一个相应的分支,并根据属性值划分样本;
[0198] (5)重复上述(2‑4)过程,自顶向下进行递归,只到满足以下三个条件为止:1)分支没有样本;2)没有可用的属性进行划分;3)待分裂节点的所有样本属于同一类;
[0199] (6)输出:最终决策树。
[0200] 具体的,探测阈值的获取方法如下:
[0201] 根据上述生成的决策树信息生成相应的探测阈值。决策树生成后包含伪距变化率和载波相位变化率,相应的高度角和方位角,以及该时刻的降雨的雨量信息,可根据这些信
息计算不同卫星不同频率不同高度角和方位角下的伪距变化率和载波相位变化率和降雨
量的对应关系,以此推测出相应的探测阈值。本实施例中,当降雨量为0mm时,在高度角E1和
方位角A1下的G01卫星L1频率的伪距变化率为δP1,而当降雨量在100mm时,相同高度角方位
角下的G01卫星L1频率的伪距变化率设为δP2,则可得此时G01卫星L1频率在高度角E1和方位
角A1时的探测阈值为:
[0202] ∆T=|δP2δ‑ P1|                (20)
[0203] 可以理解的,这个探测阈值的生成是根据不同卫星、不同频段和不同高度角和方位角独立生成的,比如G01卫星的L1的探测阈值和L2频段的不一样,G01和其它卫星的也不
一样,不同高度角和方位角的也是不一样。从而实现多频段的预测,能够有效的提高预测的
精度并提高预测的稳定性。
[0204] 本发明的进一步设置,所述步骤S5包括
[0205] S5‑1、采用基于GPS卫星双频的伪距变化率的探测量对洪水进行探测;
[0206] 具体的,如图3所示,所述步骤S5‑1主要有三部分组成:首先,根据原始伪距观测值计算当前探测日的伪距变化率,其计算过程与步骤2和步骤3相同,得到当前历元时刻的第
一探测量,即:伪距变化率。并计算该历元时刻的高度角和方位角,为后续模型搜索提供空
域基准。高度角和方位角计算过程较简单,属于该领域常规方法,此处不再描述。其次,将计
算得到的GPS双频,其中GPS双频包括L1频段和L2频段的伪距变化率和相关的特征参数(即
高度角、方位角和雨量信息)输入洪水探测模型(即步骤S4中建立的数据库)中进行探测,如
果两个频率的伪距变化率波动范围均超过设定的探测阈值,则进行标记。探测阈值在决策
树内根据降雨量和伪距变化率的关系同步生成,存储在探测模型当中。若只有一个频率超
过设定的探测阈值,则进行模型更新。若两个频率都没有出现超过探测阈值的情况,则不进
行任何处理。最后,将探测结果进行保存并输出。
[0207] S5‑2、采用基于GPS卫星双频的第二探测量对洪水进行探测。
[0208] 具体的,如图4所示,所述步骤S5‑2主要有三部分组成:首先,根据原始载波相位观测值计算当前探测日的载波相位变化率,其计算过程与步骤2和步骤3相同,得到当前历元
时刻的第二探测量,即:载波相位变化率。并计算该历元时刻的高度角和方位角,为后续模
型搜索提供空域基准,该过程较简单,属于该领域常规方法,此处不再描述。其次,将计算得
到的GPS双频,GPS双频包括L1频段和L2频段的载波相位变化率和相关的特征参数(即高度
角、方位角和雨量信息)输入洪水探测模型(即步骤S4中建立的数据库)中进行探测,如果两
个频率的载波相位变化率波动范围均超过设定的探测阈值,则进行标记。探测阈值在决策
树内根据降雨量和载波相位变化率的关系同步生成,存储在探测模型当中。若只有一个频
率超过设定的探测阈值,则进行模型更新。若两个频率都没有出现超过探测阈值的情况,则
不进行任何处理。最后,将探测结果进行保存并输出。
[0209] 本发明的进一步设置,所述步骤S6中,将经过两种探测量的洪水探测结果进行联合处理,若两个探测量都存在标记,则认为存在洪水危险,需进行一级洪水预警处理。若只
有一种情况出现标记,则进行二级洪水预警,若两者都没有标记,则更新原有探测模型,提
高原有模型探测精度和准确率。
[0210] 以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式
包括部件进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。