基于随机森林的岛礁浅海水深预测方法转让专利

申请号 : CN201910943217.9

文献号 : CN110823190B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 荆文龙刘杨晓月李勇杨骥夏小琳

申请人 : 广州地理研究所

摘要 :

本申请涉及一种基于随机森林的岛礁浅海水深预测方法、装置、存储介质和计算机设备,所述方法包括如下步骤:获取岛礁浅海区的多光谱反射率;获取岛礁浅海区的水深控制点的实际水深值;根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;以多光谱反射率、悬浮泥沙含量预测值作为特征向量的特征分量;以水深控制点的实际水深值为预期输出来训练随机森林模型;将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。本申请所述的基于随机森林的岛礁浅海水深预测方法具有高效快速地获取岛礁浅海水深,结果精确可靠的优点。

权利要求 :

1.一种基于随机森林的岛礁浅海水深预测方法,其特征在于,包括如下步骤:获取岛礁浅海区的多光谱反射率;

获取岛礁浅海区的水深控制点的实际水深值;

根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;

以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;

将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值;

所述在每个子集内,随机抽取部分特征分量训练一棵回归树的步骤包括:在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;

衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:Δi(s,t)=i(t)-pLi(tL)-pRi(tR)

其中, 分别是两个子树tL、tR的样本数量,i(t)是回归误差:Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:

2.根据权利要求1所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得岛礁浅海水深的步骤之后,还包括:获取岛礁浅海区的水深验证点的实际水深值;

根据所述水深验证点的实际水深值与通过时空序列连续反演获得的水深验证点的水深预测值计算反演精度,并建立反演精度与实际水深值的关系模型。

3.根据权利要求1或2所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述实际水深值根据所述多光谱遥感数据的来源卫星的过境时间,对岛礁浅海区的水深控制点或水深验证点进行实测和潮汐校正而获得。

4.根据权利要求1所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤,具体通过如下关系模型进行计算:式中,Rnir和Rred分别为近红外波段和红光波段的反射率,TSS为悬浮泥沙浓度,单位为mg/L,a,b,c为回归系数。

5.根据权利要求4所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤之后,还包括:获取水深控制点的悬浮泥沙含量实测值;

根据所述悬浮泥沙含量实测值对悬浮泥沙含量预测值进行精度验证和对所述关系模型进行校准。

6.根据权利要求1所述的基于随机森林的岛礁浅海水深预测方法,其特征在于:所述以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤中,按照以下方式计算每一个特征分量参与所述随机森林模型的权重值:其中,p(t)是样本到达节点t的比率,即Nt/N,Nt是节点t包含的样本数,N是样本数据的样本数,v(st)是用于分割st的变量,p(t)Δi(st,t)为节点t的加权精度减少比率。

7.一种基于随机森林的岛礁浅海水深预测装置,其特征在于,包括:第一数据获取模块,用于获取岛礁浅海区的多光谱反射率;

第二数据获取模块,用于获取岛礁浅海区的水深控制点的实际水深值;

悬浮泥沙含量预测模块,用于根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;

随机森林构建模块,以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;

水深预测模块,用于将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值;

所述随机森林构建模块在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;

衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:Δi(s,t)=i(t)-pLi(tL)-pRi(tR)

其中, 分别是两个子树tL、tR的样本数量,i(t)是回归误差:Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:

8.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-6任一项的基于随机森林的岛礁浅海水深预测方法的步骤。

9.一种计算机设备,其特征在于,包括:

处理器以及存储器;

其中,所述存储器存储有计算机程序;所述计算机程序适于由所述处理器加载并执行如权利要求1-6中任一所述的基于随机森林的岛礁浅海水深预测方法的步骤。

说明书 :

基于随机森林的岛礁浅海水深预测方法

技术领域

[0001] 本申请涉及地理信息技术领域,特别是涉及一种基于随机森林的岛礁浅海水深预测方法、装置、存储介质和计算机设备。

背景技术

[0002] 目前,对于岛礁浅海区的水深测量主要是依靠搭载了测深仪的无人船在岛礁浅海区进行实地测量,但由于不清楚水深和岛礁的限制,部分浅海区的水深无法测量或者会对无人船造成损伤,效率低下并且测量的结果不够精确。
[0003] 随着卫星遥感技术的广泛应用,推动了水深测量方法的改进,其中通过遥感水深反演的方法测量水深成为了一个值得研究的课题。

发明内容

[0004] 基于此,本申请实施例的目的在于,提供一种基于随机森林的岛礁浅海水深预测方法、装置、存储介质和计算机设备,其具有高效快速地获取岛礁浅海水深,结果精确可靠的优点。
[0005] 第一方面,本申请实施例提供一种基于随机森林的岛礁浅海水深预测方法,包括如下步骤:
[0006] 获取岛礁浅海区的多光谱反射率;
[0007] 获取岛礁浅海区的水深控制点的实际水深值;
[0008] 根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
[0009] 以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
[0010] 将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。在一个实施例中,所述将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得岛礁浅海水深的步骤之后,还包括:
[0011] 获取岛礁浅海区的水深验证点的实际水深值;
[0012] 根据所述水深验证点的实际水深值与通过时空序列连续反演获得的水深验证点的水深预测值计算反演精度,并建立反演精度与实际水深值的关系模型;
[0013] 所述在每个子集内,随机抽取部分特征分量训练一棵回归树的步骤包括:
[0014] 在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
[0015] 衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
[0016] Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
[0017]
[0018] 其中, 分别是两个子树tL、tR的样本数量,i(t)是回归误差:
[0019] Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
[0020] 在一个实施例中,所述水深控制点的实际水深值和悬浮泥沙含量根据所述多光谱遥感数据的来源卫星的过境时间,对岛礁浅海区的水深控制点进行实测而获得。
[0021] 在一个实施例中,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤,具体通过如下关系模型进行计算:
[0022]
[0023] 式中,Rnir和Rred分别为近红外波段和红光波段的反射率,TSS为悬浮泥沙浓度,单位为mg/L,a,b,c为回归系数。
[0024] 在一个实施例中,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤之后,还包括:
[0025] 获取水深控制点的悬浮泥沙含量实测值;
[0026] 根据所述悬浮泥沙含量实测值对悬浮泥沙含量预测值进行精度验证和对所述关系模型进行校准。
[0027] 在一个实施例中,所述以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤中,按照以下方式计算每一个特征分量参与所述随机森林模型的权重值:
[0028]
[0029] 其中,p(t)是样本到达节点t的比率,即Nt/N,Nt是节点t包含的样本数,N是样本数据的样本数,v(st)是用于分割st的变量,p(t)Δi(st,t)为节点t的加权精度减少比率。
[0030] 第二方面,本申请实施例还提供一种基于随机森林的岛礁浅海水深预测装置,包括:
[0031] 第一数据获取模块,用于获取岛礁浅海区的多光谱反射率;
[0032] 第二数据获取模块,用于获取岛礁浅海区的水深控制点的实际水深值;
[0033] 悬浮泥沙含量预测模块,用于根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
[0034] 随机森林构建模块,用于以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
[0035] 水深预测模块,用于将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值;
[0036] 所述随机森林构建模块在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
[0037] 衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
[0038] Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
[0039]
[0040] 其中, 分别是两个子树tL、tR的样本数量,i(t)是回归误差:
[0041] Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
[0042] 第三方面,本申请实施例还提供一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如上任一项的基于随机森林的岛礁浅海水深预测方法的步骤。
[0043] 第四方面,本申请实施例还提供一种计算机设备,包括:
[0044] 处理器以及存储器;
[0045] 其中,所述存储器存储有计算机程序;所述计算机程序适于由所述处理器加载并执行如上任一所述的基于随机森林的岛礁浅海水深预测方法的步骤。
[0046] 在本申请实施例的技术方案中,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型,再将岛礁浅海区的多光谱反射率应用于该随机森林模型即可以反演预测水深,只需实测数量较少的水深控制点的水深值,即可以构建随机森林模型,再由随机森林模型高效快速地反演获得整个岛礁浅海区的不同点的水深值;并且由于考虑到悬浮泥沙含量引起水面反射率的变化,在构建模型时,将悬浮泥沙含量也作为水深的影响因素,使得水深预测值精确可靠。由于子集的随机性和使用的特征分量进行回归树训练的随机性使得随机森林可以在一定程度上消除过拟合。并且相较于单棵决策树模型的输出而言,随机森林模型使用多棵回归树联合进行预测可以有效降低模型的方差。
[0047] 为了更好地理解和实施,下面结合附图详细说明本申请。

附图说明

[0048] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049] 图1为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法的流程步骤图;
[0050] 图2为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法的步骤S100的流程步骤图;
[0051] 图3为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法步骤S300之后还包括的流程步骤图;
[0052] 图4为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法步骤S500之后还包括的流程步骤图;
[0053] 图5为本申请实施例提供的基于随机森林的岛礁浅海水深预测装置的结构示意图;
[0054] 图6为本申请实施例的计算机设备的结构示意图。

具体实施方式

[0055] 为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
[0056] 应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0057] 下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0058] 在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0059] 本申请实施例公开了一种基于随机森林的岛礁浅海水深预测方法,请参阅图1,为本申请实施例提供的基于随机森林的岛礁浅海水深预测方法的流程图。该方法包括如下步骤:
[0060] 步骤S100:获取岛礁浅海区的多光谱反射率。
[0061] 在一个具体的实施例中,请参阅图2,所述获取岛礁浅海区的多光谱反射率的步骤,包括:
[0062] 步骤S110:获取岛礁浅海区的中高分辨率的多光谱遥感数据;
[0063] 步骤S120:通过大气校正和小波变换对多光谱遥感数据进行数据预处理;
[0064] 步骤S130:将多光谱遥感数据转换为多光谱反射率。
[0065] 其中,所述中高分辨率的多光谱遥感数据的来源卫星包括高分-1/2(GF-1、GF-2)、资源三号(ZY-3)、SPOT-6/7、LandsatOLI和Sentinel-2。所述步骤S130是将多光谱波段的DN值转换为多光谱反射率。所述多光谱反射率与岛礁浅海区的水深、悬浮泥沙含量和盐度条件等相关。
[0066] 步骤S200:获取岛礁浅海区的水深控制点的实际水深值。
[0067] 所述水深控制点是预先选定的位于岛礁浅海区内的几个用于无人船实测的控制点。在一个实施例中,所述水深控制点的实际水深值和悬浮泥沙含量根据所述多光谱遥感数据的来源卫星的过境时间,选择晴朗无云的时间对岛礁浅海区的水深控制点进行实测而获得。具体地,利用搭载单波速测深仪、全球定位系统和实时动态载波相位差分技术的无人船开展水深采样,在岛礁周围2000米缓冲区内均匀采样,采样间隔40m,精度误差为±1cm。考虑到受引潮力作用,水体在垂直方向上作一定规律性的涨落运动,所以水深遥感反演的水深控制点的实际水深值应该是多光谱遥感数据获取时刻的瞬时水深。本申请实施例的深度起算面为理论深度基准面,与潮汐表中潮高基准面一致,因此某一时刻的实际水深值等于实测水深值加上该时刻的潮高。针对每一景影像的过境时刻,对实测水深值分别开展水深控制点的潮汐校正,得到实际水深值。
[0068] 步骤S300:根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值。
[0069] 在一个实施例中,基于近红外和红光波段与水体悬浮泥沙浓度有较高的相关性,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤S300,具体通过如下关系模型进行计算:
[0070]
[0071] 式中,Rnir和Rred分别为近红外波段和红光波段的反射率,TSS为悬浮泥沙浓度,单位为mg/L,a,b,c为回归系数。
[0072] 在本申请实施例中,悬浮泥沙浓度为悬浮泥沙含量在采样水体的比例,通过近红外和红外波段反射率计算出水深控制点的悬浮泥沙浓度,也即能推算出悬浮泥沙含量预测值。
[0073] 在一个实施例中,请参阅图3,所述根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值的步骤S300之后,还包括:
[0074] S300a:获取水深控制点的悬浮泥沙含量实测值;
[0075] S300b:根据所述悬浮泥沙含量实测值对悬浮泥沙含量预测值进行精度验证和对所述关系模型进行校准。
[0076] 其中,在获取水深控制点的悬浮泥沙含量实测值时,用于测定悬浮泥沙含量的现场水样采集按照中华人民共和国海洋调查规范(GB/T 12763.1-2007)与海洋测量规范(GB/T 12763.4-2007)进行,现场水样装在黑色瓶内密封遮光保存,送至专业分析实验室采用GB 11901-89烘干称重法进行悬浮泥沙含量测定。
[0077] 步骤S400:以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型。
[0078] 在一个实施例中,从总训练集中随机有放回地抽取子集Ntree,每个子集的大小为总训练集的2/3。对样本进行采样是必须的,如果不进行采样,每次都用完整的训练样本集训练出来的多棵树是相同的,这没有任何意义。
[0079] 由于子集的随机性和使用的特征分量进行回归树训练的随机性使得随机森林可以在一定程度上消除过拟合。并且相较于单棵决策树模型的输出而言,随机森林模型使用多棵回归树联合进行预测可以有效降低模型的方差。
[0080] 在一个实施例中,所述在每个子集内,随机抽取部分特征分量训练一棵回归树的步骤包括:
[0081] 在训练样本所在的输入空间中,递归地选择最优变量St和对应最优值S*将所述分类与回归树t节点分裂为tL和tR两棵子树,并使每棵子树之间的样本具有最大差异性;
[0082] 衡量分裂的误差指标为分裂之前的回归误差减去分裂之后两棵子树的回归误差;当误差指标最大化时,每棵子树之间的样本具有最大差异性;所述误差指标具体为:
[0083] Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
[0084]
[0085] 其中, 分别是两个子树tL、tR的样本数量,i(t)是分裂之前的回归误差,i(tL)、i(tR)是分裂之后两个子树tL、tR的回归误差;并且有回归误差的计算公司为Nt是节点t包含的样本数,yi是节点t中训练样本i的岛礁浅海区的实际水深值,y是yi集合算术平均值:
[0086] 每次分裂时选用使得绝对值误差最小化的那个分裂,与均方和误差相比,绝对值误差能够刻画误差的原本真实水平。也即,每次分裂应该使得i(tL)、i(tR)的值最小,则Δi(s,t)达到最大。
[0087] 在一个实施例中,通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤,具体按照如下公式进行平均计算:
[0088]
[0089] 其中,Ntree是回归树的数量,fi(x)是每棵回归树的输出值。
[0090] 在一个实施例中,所述以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型的步骤中,按照以下方式计算每一个特征分量参与所述随机森林模型的权重值:
[0091]
[0092] 其中,p(t)是样本到达节点t的比率,即Nt/N,Nt是节点t包含的样本数,N是样本数据的样本数,v(st)是用于分割st的变量,p(t)Δi(st,t)为节点t的加权精度减少比率。所述随机森林模型还通过计算每一个特征分量参与所述随机森林模型的权重值,减少相关性低的特征分量对随机森林模型预测结果的影响,提高预测准确性。
[0093] 最终构建的随机森林模型如下:
[0094]
[0095] λ1……λn指不同的波段,Rw(λ1)是第一个波段的波段反射率,R∞(λ1)是第一个波段的深水区反射率; 是自然对数ln(Rw(λ1)与自然对数ln(R∞(λ1))的比值,其他波段亦是同理。
[0096] 步骤S500:将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。因为悬浮泥沙含量与红光波段、近红外波段的反射率有关,则事实上所述随机森林模型的输入即为所述岛礁浅海区的多光谱反射率,并且基于所述岛礁浅海区的多光谱反射率得到的水深预测值是y样本在树中传播时所达到对应叶子节点的值。
[0097] 在一个实施例中,为了验证构建的随机森林模型的精确性,请查阅图4,所述将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得岛礁浅海水深的步骤S500之后,还包括:
[0098] S601:获取岛礁浅海区的水深验证点的实际水深值;
[0099] S602:根据所述水深验证点的实际水深值与通过时空序列连续反演获得的水深验证点的水深预测值计算反演精度,并建立反演精度与实际水深值的关系模型。
[0100] 水深验证点与水深控制点类似,是预先选定的位于岛礁浅海区内的几个用于无人船实测的验证点,主要构成验证集,用于对构建的模型进行验证和校正。水深验证点的实际水深值的获取方法与水深控制点的实际水深值相同。
[0101] 本申请实施例可以根据反演精度与实际水深值的关系模型明确光学遥感水深反演在不同水色条件下的精度及最大深度,还可以根据反演精度与实际水深值的关系模型对所述随机森林模型进行模型校正。
[0102] 在本申请实施例的技术方案中,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型,再将岛礁浅海区的多光谱反射率应用于该随机森林模型即可以反演预测水深,只需实测数量较少的水深控制点的水深值,即可以构建随机森林模型,再由随机森林模型高效快速地反演获得整个岛礁浅海区的不同点的水深值;并且由于考虑到悬浮泥沙含量引起水面反射率的变化,在构建模型时,将悬浮泥沙含量也作为水深的影响因素,使得水深预测值精确可靠。由于子集的随机性和使用的特征分量进行回归树训练的随机性使得随机森林可以在一定程度上消除过拟合。并且相较于单棵决策树模型的输出而言,随机森林模型使用多棵回归树联合进行预测可以有效降低模型的方差。
[0103] 请参阅图5,本申请实施例还提供一种基于随机森林的岛礁浅海水深预测装置,包括:
[0104] 第一数据获取模块1,用于获取岛礁浅海区的多光谱反射率;
[0105] 第二数据获取模块2,用于获取岛礁浅海区的水深控制点的实际水深值;
[0106] 悬浮泥沙含量预测模块3,用于根据所述多光谱反射率中的近红外和红外波段反射率计算水深控制点的悬浮泥沙含量预测值;
[0107] 随机森林构建模块4,用于以所有的水深控制点为总训练集,从所述总训练集中随机有放回地抽取若干个子集,以同一波段水面以下的反射率的自然对数与深水区的反射率的自然对数的比值、以及悬浮泥沙含量预测值作为特征向量的特征分量;在每个子集内,随机抽取部分特征分量训练一棵回归树;通过对所有回归树的输出值进行平均获得水深控制点的实际水深值来训练随机森林模型;
[0108] 水深预测模块5,用于将所述岛礁浅海区的多光谱反射率输入至所述随机森林模型进行时空序列连续反演,获得水深预测值。
[0109] 基于相同的发明构思,本申请实施例的基于随机森林的岛礁浅海水深预测装置具有与基于随机森林的岛礁浅海水深预测方法相同的有益效果。
[0110] 第三方面,本申请实施例还提供一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如上任一项的基于随机森林的岛礁浅海水深预测方法的步骤。
[0111] 第四方面,请参阅图6,本申请实施例还提供一种计算机设备,包括:
[0112] 处理器10以及存储器20;
[0113] 其中,所述存储器20存储有计算机程序;所述计算机程序适于由所述处理器10加载并执行如上任一所述的基于随机森林的岛礁浅海水深预测方法的步骤。
[0114] 在本实施例中,处理器10和存储器20通过总线连接,存储器20可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可读储存介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
[0115] 处理器10可以是一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件。在本实施例中,所述处理器10还可以为多个,或者处理器10可以包括一个或者多个处理核心。
[0116] 在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0117] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0118] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
[0119] 单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0120] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。