基于毫米波数据分层智能抽样的降水类型预测方法转让专利

申请号 : CN202110108154.2

文献号 : CN113240148B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈志远杨涛郑鑫秦友伟师鹏飞洪岱

申请人 : 河海大学

摘要 :

本发明公开了一种基于毫米波数据分层智能抽样的降水类型预测方法,先获取大量毫米波衰减数据,通过利用较少的随后要发生的降水类型标签的毫米波衰减数据,对所有数据进行标签初始化,再通过智能分层的方法让所有的降水前一段时间的毫米波衰减数据系列自动的分为k层,随后在每层利用简单的分类方法进行多次分类,并对多次分类结果不一样的困难数据点赋予更高的被抽样概率,然后在各层进行不等概率抽样,重点照顾分类困难的模糊困难点,利用各层的抽样数据训练基础分类器,最后通过多数投票的方法将k个基础分类器集成为一个强分类器,对一段毫米波衰减数据,预测出其一段时间后将会发生那种类型的降水。

权利要求 :

1.一种基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,包括以下步骤:

(1)选取区域内的多条链路的多场不同类型的降水,获取每条链路在降水前一段时间内的毫米波衰减数据系列,系列长度为n,得到m组n维毫米波衰减数据;

(2)将毫米波衰减数据进行标签初始化,所述标签为之后将发生的降水类型;

(3)对毫米波衰减数据进行数据自调节分层处理,分为多层数据;

(4)用简单分类法对每层数据进行多次分类,将多次分类结果不同的数据作为困难点,对困难点赋予高抽样概率,按照最终各数据的抽样概率进行不等概率抽样,分别对每层数据进行抽样;

(5)对于每层抽样出的数据,在每层训练建立分类器,作为K个基础分类器;

(6)通过多数投票的方法,将K个基础分类器集成为强分类器;

(7)输入待预测数据点,通过K个基础分类器在每层得到一个分类标签,将出现次数最多的分类标签作为强分类器对于该毫米波衰减数据系列之后要发生的降水类型预测结果;

所述步骤(1)包括:

(11)选定水平方向的毫米波链路,在发射端用选定好的频率发射毫米波信号,在接收端接收到衰减后的毫米波信号,测得水平链路上的发射端功率以及接收端功率,分别记为Pa、Pb;

(12)计算出路径上单位路径毫米波衰减量O为:式中,Pa为毫米波链路发射端功率,Pb为毫米波链路接收端功率,L为链路的长度,单位为km;

(13)毫米波链路每隔时间周期记录一次单位路径毫米波衰减量,选取降水发生前一定长度的毫米波衰减数据系列,设系列长度为n,将这n个毫米波衰减数据按照时间顺序组成一个n维毫米波衰减数据向量R,R=(O1,O2,……,On)∈Rn,其中Oy是序列中第y个时刻毫米波链路所记录的单位路径毫米波衰减量;

(14)对于区域内多条链路,选取多场不同类型的降水,分别执行步骤(11)至(13),得到m组n维毫米波衰减数据向量。

2.根据权利要求1所述的基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,所述步骤(2)包括:

(21)将步骤(1)得到的m组n维毫米波衰减数据随机取出一部分,对取出的数据添加标签,标签集合为L=(L1,L2,...Lp),设有标签的数据组成的有标签数据集为X1={R1,R2,…,Rs},无标签的数据组成的无标签数据集为X2={Rs+1,Rs+2,...,Rm};

(22)根据有标签数据集,利用KNN方法,将无标签数据集中的数据添加标签,对于X2中的数据Rr,在X1中找到与其欧式距离最近的数据Rq,Rq的标签为Lq,则初始化Rr的标签也为Lq。

3.根据权利要求1所述的基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,所述步骤(3)包括:

m×m

(31)根据毫米波衰减数据,构造相似度矩阵M∈R ,其中元素Mij的计算方式为:式中,l(Ri,Rj)为毫米波衰减数据中数据点Ri和Rj的欧氏距离,设Rk为与Ri欧氏距离最近的第k个数据点,则σi为Ri和Rk之间的欧氏距离值,σj为Rj和Rk之间的欧氏距离值;

(32)构造度矩阵D,其主对角线上的元素D(h,h)为相似度矩阵M的第h行元素之和,其它元素均为0,再由相似度矩阵M和度矩阵D构造拉普拉斯矩阵La:‑0.5 ‑0.5

La=D MD

(33)对拉普拉斯矩阵La进行特征值分解,找出其前k个最大特征值所对应的特征向量m×k

v1,v2,...,vk,然后构造矩阵V=[v1,v2,…,vk]∈R ,其中特征向量按列存储,再对V的行向量进行归一化,记归一化后的矩阵为T,T的元素Ti,j为:(34)通过下式优化损失函数,将损失函数值最小的k作为自调节k值:式中,Z为V的旋转矩阵,Ui=maxjZi,j;

k

(35)把矩阵T的每一行看作空间R中的样本,样本数量为m,样本维数为n,然后将这些样本用K‑means算法进行聚类,最后当且仅当矩阵T的第α行被划分到第β层时把最初的样本点划分放入第β层,得到多层数据。

4.根据权利要求1所述的基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,所述步骤(4)中,以第z层为例,设第z层层内数据的数量为Nz,执行以下步骤:(41)初始化第z层各点的抽样概率均为1/Nz;

(42)利用简单分类方法,对第z层的所有数据进行多次分类,设各点的抽样概率为pi(i=1,2,...,Nz),设置分类次数为三次,步骤如下:A、对第z层内所有数据进行第一次分类;

B、对第z层内所有数据进行第二次分类,将第二次分类与第一次分类结果不一样的数据作为困难点,增加困难点的抽样概率,更新各点的抽样概率pi;

C、对第z层内所有数据进行第三次分类,将第三次分类与第一次和第二次分类结果都不一样的数据作为困难点,增加困难点的抽样概率,更新各点的抽样概率pi;

D、统计第z层困难点个数为nz;

(43)利用步骤(42)最终更新得到的各点的抽样概率对第z层内各点进行不等概率抽样,抽取tz个数据。

5.根据权利要求4所述的基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,增加困难点的抽样概率的具体方法为:将一个困难点视为两个数据,再求抽样概率,即获得的困难点的抽样概率是非困难点的两倍。

6.根据权利要求4所述的基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,所述步骤(4)中,各数据层抽取的数据个数与该数据层的数据总个数成比例关系。

7.根据权利要求4所述的基于毫米波数据分层智能抽样的降水类型预测方法,其特征在于,所述步骤(5)中,基础分类器的建立方法为:tz×tz

(51)对于从第z层抽取出来的tz个数据点,先构造相似矩阵S∈R ,其中:2

Si,j=‑||(Ri‑Rj)||(52)通过构造并迭代吸附度ei,j和属于度fi,j来迭代确定类代表中心,其中吸附度ei,j是从Ri指向Rj,表示Rj适合作为Ri的类中心的程度;属于度fi,j是从Rj指向Ri,表示Ri选择Rj作为其类中心的合适程度,ei,j和fi,j的迭代更新公式如下:式中,λ为人为设置的阻尼因子;q为当前迭代的次数,在每一次循环迭代中,ei,j和fi,j的更新值由当前迭代过程更新值和上一步迭代结果通过阻尼因子加权得到,当迭代次数超过设置阈值时或者当聚类中心连续多次迭代不发生改变时终止迭代;

对于任意Ri,在层内寻找满足条件 的Rj,并将其作为Ri的类代表中心;

(53)对第z层抽取出来的tz个数据执行(51)至(52)的操作后,将tz个数据分类得到w个子类;

(54)对子类进行标签映射:用条件概率 来表示在子类Cμ(1≤μ≤w)中任意样本点属于类别标签Lξ(1≤ξ≤p)的概率,其中p为降水类型标签种类数,并且利用第z层抽取出的数据对其进行估计,具体操作如下:A、统计子类Cμ中样本总数为vμ;

B、统计子类Cμ属于类别Lξ的样本流总数为uμξ;

C、通过极大似然估计的方式可得D、最终子类标签映射函数为:

(55)输出第z层抽取出的各数据所在子类的标签,则成功通过第z层抽取出的困难点的数据建立起第z层的基础分类器。

说明书 :

基于毫米波数据分层智能抽样的降水类型预测方法

技术领域

[0001] 本发明涉及地面气象探测领域,尤其是利用毫米波的衰减特点来预测一段时间后可能发生的雨、雪、冰雹等特殊降水类型天气。

背景技术

[0002] 中国是一个雨季集中、暴雨多发的国家,降水的时空分布异常是引发洪涝灾害、山体滑坡、泥石流等自然灾害的重要因素,对于降水的研究早已超过了一个科学研究的范围。
[0003] 目前,毫米波通信网络覆盖广,信号质量高,基本不存在盲区,因此,毫米波通信网络降水分析技术在我国有很高的推广应用价值。现有技术通过利用降水时的毫米波链路的
毫米波衰减特征来进行反演雨、雪、冰雹的滴谱和粒子形状分布,实时监测雨、雪、雹这类特
殊天气状况,精准度高,监测盲区小,费用也相比于雷达少。但是如何利用好大量的降水前
毫米波衰减数据,充分利用不同降水类型发生前温度、湿度特性的不同对毫米波造成的不
同的衰减影响,对接下来一段时间(0‑2小时)后是否发生降水以及发生的降水类型进行预
测,是有待于解决的问题。

发明内容

[0004] 发明目的:为了解决现有技术中预测降水类型较为困难的问题,本发明提供一种基于毫米波数据分层智能抽样的降水类型预测方法。
[0005] 技术方案:一种基于毫米波数据分层智能抽样的降水类型预测方法,包括以下步骤:
[0006] (1)选取区域内的多条链路的多场不同类型的降水,获取每条链路在降水前一段时间内的毫米波衰减数据系列,系列长度为n,得到m组n维毫米波衰减数据;
[0007] (2)将毫米波衰减数据进行标签初始化,所述标签为之后将发生的降水类型;
[0008] (3)对毫米波衰减数据进行数据自调节分层处理,分为多层数据;
[0009] (4)用简单分类法对每层数据进行多次分类,将多次分类结果不同的数据作为困难点,对困难点赋予高抽样概率,按照最终各数据的抽样概率进行不等概率抽样,分别对每
层数据进行抽样;
[0010] (5)对于每层抽样出的数据,在每层训练建立分类器,作为K个基础分类器;
[0011] (6)通过多数投票的方法,将K个基础分类器集成为强分类器;
[0012] (7)输入待预测数据点,通过K个基础分类器在每层得到一个分类标签,将出现次数最多的分类标签作为强分类器对于该毫米波衰减数据系列之后要发生的降水类型预测
结果。
[0013] 进一步地,所述步骤(1)包括:
[0014] (11)选定水平方向的毫米波链路,在发射端用选定好的频率发射毫米波信号,在接收端接收到衰减后的毫米波信号,测得水平链路上的发射端功率以及接收端功率,分别
记为Pa、Pb;
[0015] (12)计算出路径上单位路径毫米波衰减量O为:
[0016]
[0017] 式中,Pa为毫米波链路发射端功率,Pb为毫米波链路接收端功率,L为链路的长度,单位为km;
[0018] (13)毫米波链路每隔时间周期记录一次单位路径毫米波衰减量,选取降水发生前一定长度的毫米波衰减数据系列,设系列长度为n,将这n个毫米波衰减数据按照时间顺序
组成一个n维毫米波衰减数据向量R,R=(O1,O2,……,On)∈Rn,其中Oy是序列中第y个时刻
毫米波链路所记录的单位路径毫米波衰减量;
[0019] (14)对于区域内多条链路,选取多场不同类型的降水,分别执行步骤(11)至(13),得到m组n维毫米波衰减数据向量。
[0020] 进一步地,所述步骤(2)包括:
[0021] (21)将步骤(1)得到的m组n维毫米波衰减数据随机取出一部分,对取出的数据添加标签,标签集合为L=(L1,L2,...Lp),设有标签的数据组成的有标签数据集为X1={R1,
R2,…,Rs},无标签的数据组成的无标签数据集为X2={Rs+1,Rs+2,...,Rm};
[0022] (22)根据有标签数据集,利用KNN方法,将无标签数据集中的数据添加标签,对于X2中的数据Rr,在X1中找到与其欧式距离最近的数据Rq,Rq的标签为Lq,则初始化Rr的标签
也为Lq。
[0023] 进一步地,所述步骤(3)包括:
[0024] (31)根据毫米波衰减数据,构造相似度矩阵M∈Rm×m,其中元素Mij的计算方式为:
[0025]
[0026] 式中,l(Ri,Rj)为毫米波衰减数据中数据点Ri和Rj的欧氏距离,设Rk为与Ri欧氏距离最近的第k个数据点,则σi为Ri和Rk之间的欧氏距离值,σj为Rj和Rk之间的欧氏距离值;
[0027] (32)构造度矩阵D,其主对角线上的元素D(h,h)为相似度矩阵M的第h行元素之和,其它元素均为0,再由相似度矩阵M和度矩阵D构造拉普拉斯矩阵La:
[0028] La=D‑0.5MD‑0.5
[0029] (33)对拉普拉斯矩阵La进行特征值分解,找出其前k个最大特征值所对应的特征m×k
向量v1,v2,...,vk,然后构造矩阵V=[v1,v2,…,vk]∈R ,其中特征向量按列存储,再对V
的行向量进行归一化,记归一化后的矩阵为T,T的元素Ti,j为:
[0030]
[0031] (34)通过下式优化损失函数,将损失函数值最小的k作为自调节k值:
[0032]
[0033] 式中,Z为V的旋转矩阵,Ui=maxjZi,j;
[0034] (34)把矩阵T的每一行看作空间Rk中的样本,样本数量为m,样本维数为n,然后将这些样本用K‑means算法进行聚类,最后仅当矩阵T的第α行被划分到第β层时把最初的样本
点划分放入第β层,得到多层数据。
[0035] 进一步地,所述步骤(4)中,以第z层为例,设第z层层内数据的数量为Nz,执行以下步骤:
[0036] (41)初始化第z层各点的抽样概率均为1/Nz;
[0037] (42)利用简单分类方法,对第z层的所有数据进行多次分类,设各点的抽样概率为pi(i=1,2,...,Nz),设置分类次数为三次,步骤如下:
[0038] A、对第z层内所有数据进行第一次分类;
[0039] B、对第z层内所有数据进行第二次分类,将第二次分类与第一次分类结果不一样的数据作为困难点,增加困难点的抽样概率,更新各点的抽样概率pi;
[0040] C、对第z层内所有数据进行第三次分类,将第三次分类与第一次和第二次分类结果都不一样的数据作为困难点,增加困难点的抽样概率,更新各点的抽样概率pi;
[0041] D、统计第z层困难点个数为nz;
[0042] (43)利用步骤(42)最终更新得到的各点的抽样概率对第z层内各点进行不等概率抽样,抽取tz个数据。
[0043] 进一步地,增加困难点的抽样概率的具体方法为:将一个困难点视为两个数据,再求抽样概率,即获得的困难点的抽样概率是非困难点的两倍。
[0044] 进一步地,所述步骤(4)中,各数据层抽取的数据个数与该数据层的数据总个数成比例关系。
[0045] 进一步地,所述步骤(5)中,基础分类器的建立方法为:
[0046] (51)对于从第z层抽取出来的tz个数据点,先构造相似矩阵S∈Rtz×tz,其中:
[0047] Si,j=‑||(Ri‑Rj)||2
[0048] (52)通过构造并迭代吸附度ei,j和属于度fi,j来迭代确定类代表中心,其中吸附度ei,j是从Ri指向Rj,表示Rj适合作为Ri的类中心的程度;属于度fi,j是从Rj指向Ri,表示Ri选
择Rj作为其类中心的合适程度,ei,j和fi,j的迭代更新公式如下:
[0049]
[0050]
[0051]
[0052] 式中,λ为人为设置的阻尼因子;q为当前迭代的次数,在每一次循环迭代中,ei,j和fi,j的更新值由当前迭代过程更新值和上一步迭代结果通过阻尼因子加权得到,当迭代次
数超过设置阈值时或者当聚类中心连续多次迭代不发生改变时终止迭代;
[0053] 对于任意Ri,在层内寻找满足条件 的Rj,并将其作为Ri的类代表中心;
[0054] (53)对第z层抽取出来的tz个数据执行(51)至(52)的操作后,将tz个数据分类得到w个子类;
[0055] (54)对子类进行标签映射:用条件概率 来表示在子类Cμ(1≤μ≤w)中任意样本点属于类别标签Lξ(1≤ξ≤p)的概率,其中p为降水类型标签种类数,并且利用第z
层抽取出的数据对其进行估计,具体操作如下::
[0056] A、统计子类Cμ中样本总数为vμ;
[0057] B、统计子类Cμ属于类别Lξ的样本流总数为uμξ;
[0058] C、通过极大似然估计的方式可得
[0059] D、最终子类标签映射函数为:
[0060]
[0061] (55)输出第z层抽取出的各数据所在子类的标签,则成功通过第z层抽取出的困难点的数据建立起第z层的基础分类器。
[0062] 本发明提供一种基于毫米波数据分层智能抽样的降水类型预测方法,相比较现有技术,存在以下优点:
[0063] (1)充分利用不同降水类型发生前温度、湿度特性的不同对毫米波造成的不同的衰减影响,对接下来一段时间(0‑2小时)后是否发生降水以及发生的降水类型进行预测,针
对各种降水类型对毫米波的衰减影响,进行预测,可以使预测结果更加准确;
[0064] (2)毫米波衰减一般每隔五到十秒便会记录一个数据,多条链路在一段时间内会有大量的衰减数据被记录下来,对大量的毫米波衰减数据进行分层,在各层先多次简单分
类找到分类困难点并赋予更高的抽样概率,再在各层进行抽样,重点照顾困难点抽样,并且
减轻了复杂分类方法对于数量较大数据的处理压力;
[0065] (3)在各层都建立起基础分类器,通过多数投票的方法,充分集成了各个基础分类器的分类建议,具有很好的代表性和科学性,减少偶然误差,提高预测精准度。

附图说明

[0066] 图1为基于毫米波数据分层智能抽样的降水类型预测方法的流程图。

具体实施方式

[0067] 下面结合附图和具体实施例,对本发明作进一步说明。
[0068] 如图1所示,基于毫米波数据分层智能抽样的降水类型预测方法,先获取大量的不同链路不同降水类型的毫米波衰减数据,利用较少的随后要发生的降水类型标签的毫米波
衰减数据,对所有数据进行标签初始化,再通过智能分层的方法让所有的降水前一段时间
的毫米波衰减数据系列自动分为k层,随后在每层利用最简单的分类方法(例如K‑MEANS)进
行多次分类并对多次分类结果不一样的困难点赋予更高的被抽样概率,然后在各层进行不
等概率抽样,重点照顾分类困难的模糊困难点,利用各层的抽样数据训练基础分类器,最后
通过多数投票的方法将k个基础分类器集成为一个强分类器,对一段毫米波衰减数据,预测
其一段时间后(如0‑2小时后)将会发生哪种类型的降水。具体包括:
[0069] 1、选取区域内的多条链路的多场不同类型的降水,获取每条链路在降水前一段时间内的毫米波衰减数据系列,系列长度为n,得到m组n维毫米波衰减数据,具体包括以下步
骤:
[0070] (11)选定水平方向的毫米波链路,在发射端用选定好的频率发射毫米波信号,毫米波信号在传播的过程之中发生衰减,最终在接收端接收到衰减后的毫米波信号,测得水
平链路上的发射端功率以及接收端功率,分别记为Pa、Pb;
[0071] (12)计算出路径上单位路径毫米波衰减量O为:
[0072]
[0073] 式中,Pa为毫米波链路发射端功率,Pb为毫米波链路接收端功率,L为链路的长度,单位为km;
[0074] (13)毫米波链路每隔时间周期记录一次单位路径毫米波衰减量,选取降水发生前(本实施例为30分钟前,也可取其他时长)一定长度的毫米波衰减数据系列,设系列长度为
n,将这n个毫米波衰减数据按照时间顺序组成一个n维毫米波衰减数据向量R,R=(O1,
O2,……,On)∈Rn,其中Oy是序列中第y个时刻毫米波链路所记录的单位路径毫米波衰减
量;
[0075] (14)对于区域内多条链路,选取多场不同类型的降水(要包含雨,雪,冰雹不同类型的降水,以保证足够的代表性),分别执行步骤(11)至(13),共得到m组n维毫米波衰减数
据向量,记为X。
[0076] 2、将毫米波衰减数据进行标签初始化,所述标签为之后将发生的降水类型,因为数据量较大,为了方便为所有数据添加标签,采用以下方法:
[0077] (21)将步骤(1)得到的m组n维毫米波衰减数据随机取出一部分,对取出的数据添加标签,L=(0,1,2,3),0代表无降水,1代表即将降雨,2代表即将降雪,3代表即将降冰雹
(其他类型的降水在此处为了简洁说明故未一一具体列出)。设有标签的数据组成的有标签
数据集为X1={R1,R2,…,Rs},无标签的数据组成的无标签数据集为X2={Rs+1,Rs+2,...,
Rm};X=X1∪X2;
[0078] (22)利用X1对X2中的数据进行标签初始化:根据有标签数据集,利用KNN方法,K取1,将无标签数据集中的数据添加标签,对于X2中的数据Ri,在X1中找到与其欧式距离最近
的数据Rj,Rj的标签为Lq,则初始化Ri的标签也为Lq。
[0079] 其中,Ri与Rj之间的欧氏距离l计算公式为:
[0080]
[0081] 3、对毫米波衰减数据进行数据自调节分层处理,分为k层数据,具体分层方法为:
[0082] (31)根据毫米波衰减数据,构造相似度矩阵M∈Rm×m,其中元素Mij的计算方式为:
[0083]
[0084] 式中,l(Ri,Rj)为毫米波衰减数据X中数据点Ri和Rj的欧氏距离,设Rk为与Ri欧氏距离最近的第k个数据点,则σi为Ri和Rk之间的欧氏距离值,σj为Rj和Rk之间的欧氏距离值;
[0085] (32)构造拉普拉斯矩阵:先构造度矩阵D,其主对角线上的元素D(h,h)为相似度矩阵M的第h行元素之和,其它元素均为0,再由相似度矩阵M和度矩阵D构造拉普拉斯矩阵La:
[0086] La=D‑0.5MD‑0.5
[0087] (33)对拉普拉斯矩阵La进行特征值分解,找出其前k个最大特征值所对应的特征m×k
向量v1,v2,...,vk,然后构造矩阵V=[v1,v2,…,vk]∈R ,其中特征向量按列存储,再对V
的行向量进行归一化,记归一化后的矩阵为T,T的元素Ti,j为:
[0088]
[0089] (34)自调节k值的确定:通过下式优化损失函数,将损失函数值最小的k作为自调节k值即分层的层数:
[0090]
[0091] 式中,Z为V的旋转矩阵,Ui=maxjZi,j;
[0092] (34)把矩阵T的每一行看作空间Rk中的样本,样本数量为m,样本维数为n,然后将这些样本用K‑means算法进行聚类,最后当且仅当矩阵T的第α行被划分到第β层时把最初的
样本点划分放入第β层,得到多层数据。
[0093] 4、用简单分类法对每层数据进行多次分类,将多次分类结果不同的数据作为困难点,对困难点赋予高抽样概率,按照最终各数据的抽样概率进行不等概率抽样,分别对每层
数据进行抽样,各数据层抽取的数据个数与该数据层的数据总个数成比例关系。
[0094] 对每层数据进行抽样,以第z层为例,设第z层层内数据的数量为Nz,执行以下步骤:
[0095] (41)初始化第z层各点的抽样概率均为1/Nz;
[0096] (42)利用简单分类方法,对第z层的所有数据进行多次分类,设各点的抽样概率为pi(i=1,2,...,Nz),设置分类次数为三次,步骤如下:
[0097] A、对第z层内所有数据进行第一次分类;
[0098] B、对第z层内所有数据进行第二次分类,将第二次分类与第一次分类结果不一样的数据作为困难点,增加困难点的抽样概率(例如在求抽样概率时将一个困难点视为两个
普通数据点,再求抽样概率,则获得的困难点的抽样概率是普通点的两倍),更新各点的抽
样概率pi;
[0099] C、对第z层内所有数据进行第三次分类,将第三次分类与第一次和第二次分类结果都不一样的数据作为困难点,增加困难点的抽样概率(例如将三次抽样得到的结果都不
一样的困难点视为三个普通数据点,则其抽样概率是普通点的三倍;三次抽样有两次结果
一样的困难点视为两个普通数据点,,则其抽样概率是普通点的两倍;三次结果都一样的数
据点则为普通数据点),更新各点的抽样概率pi;
[0100] D、统计第z层困难点个数为nz;
[0101] (43)利用步骤(42)最终更新得到的各点的抽样概率对第z层内各点进行不等概率抽样,抽取tz个数据,各数据层抽取的数据个数与该数据层的数据总个数成比例关系。
[0102] 5、对于每层抽样出的数据,在每层训练建立更为精细的分类器,作为K个基础分类器,其基础分类器的建立方法为:
[0103] (51)对于从第z层抽取出来的tz个数据点,先构造相似矩阵S∈Rtz×tz,其中:
[0104] Si,j=‑||(Ri‑Rj)||2
[0105] (52)通过构造并迭代吸附度ei,j和属于度fi,j来迭代确定类代表中心,其中吸附度ei,j是从Ri指向Rj,表示Rj适合作为Ri的类中心的程度;属于度fi,j是从Rj指向Ri,表示Ri选
择Rj作为其类中心的合适程度,ei,j和fi,j的迭代更新公式如下:
[0106]
[0107]
[0108]
[0109] 式中,λ为人为设置的阻尼因子;q为当前迭代的次数,在每一次循环迭代中,ei,j和fi,j的更新值由当前迭代过程更新值和上一步迭代结果通过阻尼因子加权得到,当迭代次
数超过设置阈值(如1000次)时或者当聚类中心连续多次(如50次)迭代不发生改变时终止
迭代;
[0110] 对于任意Ri,在层内寻找满足条件 的Rj,并将其作为Ri的类代表中心;
[0111] (53)对第z层抽取出来的tz个数据执行(51)至(52)的操作后,将tz个数据分类得到w个子类;
[0112] (54)对子类进行标签映射:用条件概率 来表示在子类Cμ(1≤μ≤w)中任意样本点属于类别标签Lξ(1≤ξ≤p)的概率,其中p为降水类型标签种类数,并且利用第z
层抽取出的数据对其进行估计,具体操作如下:
[0113] A、统计子类Cμ中样本总数为vμ;
[0114] B、统计子类Cμ属于类别Lξ的样本流总数为uμξ;
[0115] C、通过极大似然估计的方式可得
[0116] D、最终子类标签映射函数为:
[0117]
[0118] (55)输出第z层抽取出的各数据所在子类的标签,则成功通过第z层抽取出的困难点的数据建立起第z层的基础分类器。
[0119] 6、对步骤3中分出的k层数据层都进行步骤4和步骤5的操作,则建立起k个基础分类器,这些基础分类器通过多数投票的方法,集成一个强分类器,当输入待预测数据点时,
通过各层所建立的基础分类器在每层得到一个分类标签,最终强分类器对于该毫米波衰减
数据系列之后要发生的降水类型预测结果标签为所有基础分类器预测的结果中出现次数
最多的那种预测结果标签,以此预测数据点的降水类型。
[0120] 7、在使用时,将实际监测到的毫米波衰减数据系列输入建立好的分类器中,通过分类器的输出结果,预测得到接下来一段时间后可能会出现的降水类型。
[0121] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0122] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来
说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护
范围。因此,本申请专利的保护范围应以所附权利要求为准。