点云融合模型获取方法、装置、电子设备及存储介质转让专利

申请号 : CN202310291154.X

文献号 : CN115994936B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邓涛李志建张晟东张立华

申请人 : 季华实验室

摘要 :

本申请属于数据融合技术领域,公开了一种点云融合模型获取方法、装置、电子设备及存储介质,所述方法包括:获取训练数据集;初始化点云融合模型的网络参数;利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率;从而可加速点云融合模型的网络参数收敛速度,进而提高点云融合模型的训练效率。

权利要求 :

1.一种点云融合模型获取方法,用于对点云融合模型进行训练,所述点云融合模型包括输入层、特征提取网络模块、特征融合网络模块、上采样网络模块和输出层;其特征在于,所述点云融合模型获取方法包括步骤:A1.获取训练数据集;

A2.初始化所述点云融合模型的网络参数;

A3.利用所述训练数据集,根据改进梯度下降法迭代更新所述点云融合模型的所述网络参数,直到损失函数或所述网络参数收敛;每次迭代过程中,根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率;

所述根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率的步骤包括:根据以下公式计算第一影响系数和第二影响系数:其中,H1为所述第一影响系数,H2为所述第二影响系数,O1为所述特征提取网络模块的输出数据,O2为所述特征融合网络模块的输出数据,O3为所述上采样网络模块的输出数据;l为所述损失函数;

根据以下公式计算第三影响系数和第四影响系数:其中,xi为所述输入样本的第i个元素,ri为所述损失函数对所述输入样本的第i个元素的偏导数,r2j‑1为所述损失函数对所述输入样本的第2j‑1个元素的偏导数,r2j为所述损失函数对所述输入样本的第2j个元素的偏导数,n为所述输入样本的元素总数量,K1为所述第三影响系数,K2为所述第四影响系数;

根据所述第一影响系数、所述第二影响系数、所述第三影响系数和所述第四影响系数,更新所述学习效率;

所述根据所述第一影响系数、所述第二影响系数、所述第三影响系数和所述第四影响系数,更新所述学习效率的步骤包括:根据以下公式计算基准学习效率:

其中,η为所述基准学习效率,t为当前的迭代次数;

根据所述第一影响系数和所述第二影响系数,通过以下公式计算第一散度:其中,ψ为所述第一散度,ψ0为所述第一散度的预设初始值;

根据所述第三影响系数和所述第四影响系数,通过以下公式计算第二散度:其中, 为所述第二散度, 为所述第二散度的预设初始值;

根据所述第一散度和所述第二散度,通过以下公式计算学习率修正系数:其中,μ为所述学习率修正系数;

根据所述基准学习效率和所述学习率修正系数,通过以下公式更新所述学习效率:其中, 为更新后的所述学习效率。

2.根据权利要求1所述的点云融合模型获取方法,其特征在于,步骤A3中,每次迭代过程包括步骤:A301.计算所述损失函数;

A302.更新一阶动量参数和二阶动量参数;

A303.根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率;

A304.根据所述一阶动量参数、所述二阶动量参数和所述学习效率更新所述点云融合模型的所述网络参数;

A305.若所述损失函数和所述网络参数中的至少一个收敛,则停止迭代。

3.根据权利要求2所述的点云融合模型获取方法,其特征在于,步骤A301包括:根据以下公式计算损失函数:

其中,O为所述点云融合模型的输出数据, 为所述输入样本的真值标签。

4.根据权利要求3所述的点云融合模型获取方法,其特征在于,步骤A302包括:根据以下公式更新所述一阶动量参数和所述二阶动量参数:m′=β1m+(1‑β1)g;

2

v′=β2v+(1‑β2)g;

其中,m′是更新后的所述一阶动量参数,m是更新前的所述一阶动量参数,v′为更新后的所述二阶动量参数,v为更新前的所述二阶动量参数,β1、β2为两个预设调整系数,g为所述损失函数关于所述网络参数的梯度。

5.根据权利要求4所述的点云融合模型获取方法,其特征在于,步骤A304包括:根据以下公式更新所述点云融合模型的所述网络参数:其中,θ′为更新后的所述网络参数,θ为更新前的所述网络参数,ε为预设的收敛阈值。

6.一种点云融合模型获取装置,用于对点云融合模型进行训练,所述点云融合模型包括输入层、特征提取网络模块、特征融合网络模块、上采样网络模块和输出层;其特征在于,所述点云融合模型获取装置包括:第一获取模块,用于获取训练数据集;

初始化模块,初始化所述点云融合模型的网络参数;

更新模块,用于利用所述训练数据集,根据改进梯度下降法迭代更新所述点云融合模型的所述网络参数,直到损失函数或所述网络参数收敛;每次迭代过程中,根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率;

更新模块在根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率的时候,执行:根据以下公式计算第一影响系数和第二影响系数:其中,H1为所述第一影响系数,H2为所述第二影响系数,O1为所述特征提取网络模块的输出数据,O2为所述特征融合网络模块的输出数据,O3为所述上采样网络模块的输出数据;l为所述损失函数;

根据以下公式计算第三影响系数和第四影响系数:其中,xi为所述输入样本的第i个元素,ri为所述损失函数对所述输入样本的第i个元素的偏导数,r2j‑1为所述损失函数对所述输入样本的第2j‑1个元素的偏导数,r2j为所述损失函数对所述输入样本的第2j个元素的偏导数,n为所述输入样本的元素总数量,K1为所述第三影响系数,K2为所述第四影响系数;

根据所述第一影响系数、所述第二影响系数、所述第三影响系数和所述第四影响系数,更新所述学习效率;

更新模块在根据所述第一影响系数、所述第二影响系数、所述第三影响系数和所述第四影响系数,更新所述学习效率的时候,执行:根据以下公式计算基准学习效率:

其中,η为所述基准学习效率,t为当前的迭代次数;

根据所述第一影响系数和所述第二影响系数,通过以下公式计算第一散度:其中,ψ为所述第一散度,ψ0为所述第一散度的预设初始值;

根据所述第三影响系数和所述第四影响系数,通过以下公式计算第二散度:其中, 为所述第二散度, 为所述第二散度的预设初始值;

根据所述第一散度和所述第二散度,通过以下公式计算学习率修正系数:其中,μ为所述学习率修正系数;

根据所述基准学习效率和所述学习率修正系数,通过以下公式更新所述学习效率:其中, 为更新后的所述学习效率。

7.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时,运行如权利要求1‑5任一项所述点云融合模型获取方法中的步骤。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1‑5任一项所述点云融合模型获取方法中的步骤。

说明书 :

点云融合模型获取方法、装置、电子设备及存储介质

技术领域

[0001] 本申请涉及数据融合技术领域,具体而言,涉及一种点云融合模型获取方法、装置、电子设备及存储介质。

背景技术

[0002] 目前,虚拟现实与无人机的结合应用越来越受到重视,虚拟现实不仅能为操作者提供远程操作,还能提供沉浸式的三维动态场景,虚拟现实技术所提供的第一视角的人机互动可以很大改善无人机飞行员的工作条件。其中,无人机虚拟场景三维重建是实现虚拟现实场景与无人机结合的关键技术。
[0003] 通常地,在进行无人机虚拟场景三维重建时,一般需要采用点云融合模型来实现无人机采集到的点云数据的融合,这种点云融合模型在投入使用前需要进行大量训练工作,训练时间长,训练效率较低,需要寻求一种训练方法提高训练效率。

发明内容

[0004] 本申请的目的在于提供一种点云融合模型获取方法、装置、电子设备及存储介质,可提高点云融合模型的训练效率。
[0005] 第一方面,本申请提供了一种点云融合模型获取方法,用于对点云融合模型进行训练,所述点云融合模型包括输入层、特征提取网络模块、特征融合网络模块、上采样网络模块和输出层;所述点云融合模型获取方法包括步骤:
[0006] A1.获取训练数据集;
[0007] A2.初始化所述点云融合模型的网络参数;
[0008] A3.利用所述训练数据集,根据改进梯度下降法迭代更新所述点云融合模型的所述网络参数,直到损失函数或所述网络参数收敛;每次迭代过程中,根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率。
[0009] 该方法在对点云融合模型进行迭代训练的过程中,根据点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数自适应地更新学习效率,可加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0010] 优选地,步骤A3中,每次迭代过程包括步骤:
[0011] A301.计算所述损失函数;
[0012] A302.更新一阶动量参数和二阶动量参数;
[0013] A303. 根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率;
[0014] A304.根据所述一阶动量参数、所述二阶动量参数和所述学习效率更新所述点云融合模型的所述网络参数;
[0015] A305.若所述损失函数和所述网络参数中的至少一个收敛,则停止迭代。
[0016] 优选地,步骤A301包括:
[0017] 根据以下公式计算损失函数:
[0018] ;
[0019] 其中,为所述损失函数, 为所述点云融合模型的输出数据, 为所述输入样本的真值标签。
[0020] 该损失函数的函数曲线光滑、连续,处处可导,便于改进梯度下降算法的使用,而且,随着误差的减小,梯度也在减小,这有利于提高损失函数的收敛速度。
[0021] 优选地,步骤A302包括:
[0022] 根据以下公式更新所述一阶动量参数和所述二阶动量参数:
[0023] ;
[0024] ;
[0025] 其中, 是更新后的所述一阶动量参数, 是更新前的所述一阶动量参数, 为更新后的所述二阶动量参数,为更新前的所述二阶动量参数, 、 为两个预设调整系数, 为所述损失函数关于所述网络参数的梯度。
[0026] 优选地,步骤A303包括:
[0027] 根据以下公式计算第一影响系数和第二影响系数:
[0028] ;
[0029] ;
[0030] 其中, 为所述第一影响系数, 为所述第二影响系数, 为所述特征提取网络模块的输出数据, 为所述特征融合网络模块的输出数据, 为所述上采样网络模块的输出数据;
[0031] 根据以下公式计算第三影响系数和第四影响系数:
[0032] ;
[0033] ;
[0034] ;
[0035] 其中, 为所述输入样本的第i个元素, 为所述损失函数对所述输入样本的第i个元素的偏导数, 为所述损失函数对所述输入样本的第2j‑1个元素的偏导数, 为所述损失函数对所述输入样本的第2j个元素的偏导数,为所述输入样本的元素总数量,为所述第三影响系数, 为所述第四影响系数;
[0036] 根据所述第一影响系数、所述第二影响系数、所述第三影响系数和所述第四影响系数,更新所述学习效率。
[0037] 优选地,所述根据所述第一影响系数、所述第二影响系数、所述第三影响系数和所述第四影响系数,更新所述学习效率的步骤包括:
[0038] 根据以下公式计算基准学习效率:
[0039] ;
[0040] 其中,为所述基准学习效率,t为当前的迭代次数;
[0041] 根据所述第一影响系数和所述第二影响系数,通过以下公式计算第一散度:
[0042] ;
[0043] 其中, 为所述第一散度, 为所述第一散度的预设初始值;
[0044] 根据所述第三影响系数和所述第四影响系数,通过以下公式计算第二散度:
[0045] ;
[0046] 其中,为所述第二散度, 为所述第二散度的预设初始值;
[0047] 根据所述第一散度和所述第二散度,通过以下公式计算学习率修正系数:
[0048] ;
[0049] 其中, 为所述学习率修正系数;
[0050] 根据所述基准学习效率和所述学习率修正系数,通过以下公式更新所述学习效率:
[0051] ;
[0052] 其中,为更新后的所述学习效率。
[0053] 上述更新学习效率的过程,引入损失函数对各网络模块的输出数据和输入样本各个元素的梯度,实现学习效率的自适应更新,有利于加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0054] 优选地,步骤A304包括:
[0055] 根据以下公式更新所述点云融合模型的所述网络参数:
[0056] ;
[0057] 其中, 为更新后的所述网络参数, 为更新前的所述网络参数,为预设的收敛阈值。
[0058] 第二方面,本申请提供了一种点云融合模型获取装置,用于对点云融合模型进行训练,所述点云融合模型包括输入层、特征提取网络模块、特征融合网络模块、上采样网络模块和输出层;所述点云融合模型获取装置包括:
[0059] 第一获取模块,用于获取训练数据集;
[0060] 初始化模块,初始化所述点云融合模型的网络参数;
[0061] 更新模块,用于利用所述训练数据集,根据改进梯度下降法迭代更新所述点云融合模型的所述网络参数,直到损失函数或所述网络参数收敛;每次迭代过程中,根据所述点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数更新学习效率。
[0062] 该装置在对点云融合模型进行迭代训练的过程中,根据点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数自适应地更新学习效率,可加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0063] 第三方面,本申请提供了一种电子设备,包括处理器和存储器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时,运行如前文所述点云融合模型获取方法中的步骤。
[0064] 第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如前文所述点云融合模型获取方法中的步骤。
[0065] 有益效果:
[0066] 本申请提供的点云融合模型获取方法、装置、电子设备及存储介质,在对点云融合模型进行迭代训练的过程中,根据点云融合模型的输入样本和各网络模块的输出数据对所述损失函数的影响系数自适应地更新学习效率,可加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。

附图说明

[0067] 图1为本申请实施例提供的点云融合模型获取方法的流程图。
[0068] 图2为本申请实施例提供的点云融合模型获取装置的结构示意图。
[0069] 图3为本申请实施例提供的电子设备的结构示意图。
[0070] 图4为点云融合模型的结构示意图。
[0071] 标号说明:1、第一获取模块;2、初始化模块;3、更新模块;301、处理器;302、存储器;303、通信总线。

具体实施方式

[0072] 下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0073] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0074] 请参照图1,图1是本申请一些实施例中的一种点云融合模型获取方法,用于对点云融合模型进行训练,该点云融合模型包括输入层、特征提取网络模块、特征融合网络模块、上采样网络模块和输出层;点云融合模型获取方法包括步骤:
[0075] A1.获取训练数据集;
[0076] A2.初始化点云融合模型的网络参数;
[0077] A3.利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率。
[0078] 该方法在对点云融合模型进行迭代训练的过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数自适应地更新学习效率,可加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0079] 其中,参考图4,该点云融合模型的输入层输入的是M×3×N维的数据(其中,M为单帧点云数据的点数,N为输入样本的元素总数量,即输入样本包含的点云数据的总帧数),经特征提取网络模块对输入的点云数据进行特征提取后,输出的数据记为 ,该输出数据为L×3×N维的数据(其中,L为由特征提取网络模块的网络结构决定的中间值);特征融合网络模块对输出数据 进行降维处理和特征融合处理后,输出的数据记为 ,该输出数据 为k×3维的数据(其中,k为由特征融合网络模块的网络结构决定的中间值);上采样网络模块对输出数据 进行数据丰富后,输出的数据记为 ,该输出数据 为J×3维的数据(其中,J为上采样后模型输出维数,且J=M×N)。
[0080] 在本实施例中,特征提取网络模块通过ResNet‑50网络实现对输入的点云数据的特征提取,特征提取网络模块的特征提取函数记为 ,该特征提取网络模块的网络参数记为 ;特征融合网络模块通过flatten方法对输出数据 进行降维处理后,通过三层全连接网络实现特征融合,特征融合网络模块的特征融合函数记为 ,该特征融合网络模块的网络参数记为 ;上采样网络模块通过两层全卷积网络对输出数据 进行数据丰富,上采样网络模块的上采样函数记为 ,该上采样网络模块的网络参数记为 。
[0081] 其中,训练数据集包括多个样本,每个样本包括多帧(N帧)连续的点云数据和对应的真值标签(即对多帧点云数据进行融合后的参考融合点云数据)。根据多帧连续的点云数据获取对应的真值标签的方法为现有技术,此处不对其进行详述。
[0082] 其中,点云融合模型的网络参数包括特征提取网络模块的网络参数 、特征融合网络模块的网络参数 和上采样网络模块的网络参数 。在对点云融合模型的网络参数进行初始化时可初始化为预设值,也可以进行随机初始化,具体根据实际需要选择。若把点云融合模型的网络参数记为 ,则 。
[0083] 在本实施例中,步骤A3中,每次迭代过程包括步骤:
[0084] A301.计算损失函数;
[0085] A302.更新一阶动量参数和二阶动量参数;
[0086] A303.根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率;
[0087] A304.根据一阶动量参数、二阶动量参数和学习效率更新点云融合模型的网络参数;
[0088] A305.若损失函数和网络参数中的至少一个收敛,则停止迭代。
[0089] 即当损失函数和网络参数均不收敛时,需要把下一个样本作为输入样本,把该输入样本的点云数据输入至点云融合模型,并重复步骤A301‑A305进行下一次迭代,直到损失函数和网络参数中的至少一个收敛。
[0090] 其中,损失函数可根据实际需要设置,例如可选择使用MSE损失函数,但不限于此。
[0091] 在一些优选实施方式中,步骤A301包括:
[0092] 根据以下公式计算损失函数:
[0093] ;
[0094] 其中,为损失函数, 为点云融合模型的输出数据, 为输入样本的真值标签。
[0095] 该损失函数的函数曲线光滑、连续,处处可导,便于改进梯度下降算法的使用,而且,随着误差的减小,梯度也在减小,这有利于提高损失函数的收敛速度。
[0096] 具体地,步骤A302包括:
[0097] 根据以下公式更新一阶动量参数和二阶动量参数:
[0098] ;
[0099] ;
[0100] 其中, 是更新后的一阶动量参数, 是更新前的一阶动量参数, 为更新后的二阶动量参数,为更新前的二阶动量参数, 、 为两个预设调整系数, 为损失函数关于网络参数的梯度(即 )。其中, 、 可根据实际需要设置,例如,可均设置为0.9,但不限于此;其中,对于首次迭代过程, , , 、 分别为一阶动量参数和二阶动量参数的预设初始值,可根据实际需要设置,例如均为0,但不限于此。
[0101] 具体地,步骤A303包括:
[0102] 根据以下公式计算第一影响系数和第二影响系数:
[0103] ;
[0104] ;
[0105] 其中, 为第一影响系数, 为第二影响系数, 为特征提取网络模块的输出数据, 为特征融合网络模块的输出数据, 为上采样网络模块的输出数据;其中 表征了输出数据 和输出数据 的变化引起损失函数的变化的显著程度, 表征了输出数据 和输出数据 的变化引起损失函数的变化的显著程度;
[0106] 根据以下公式计算第三影响系数和第四影响系数:
[0107] ;
[0108] ;
[0109] ;
[0110] 其中, 为输入样本的第i个元素, 为损失函数对输入样本的第i个元素的偏导数, 为损失函数对输入样本的第2j‑1个元素的偏导数, 为损失函数对输入样本的第2j个元素的偏导数,为输入样本的元素总数量, 为第三影响系数, 为第四影响系数;
其中,输入样本的第i个元素,即输入样本的第i帧点云数据, 表征的输入样本的第i个元素的变化引起损失函数的变化的显著程度;
[0111] 根据第一影响系数、第二影响系数、第三影响系数和第四影响系数,更新学习效率。
[0112] 具体地,根据第一影响系数、第二影响系数、第三影响系数和第四影响系数,更新学习效率的步骤包括:
[0113] 根据以下公式计算基准学习效率:
[0114] ;
[0115] 其中, 为基准学习效率,t为当前的迭代次数(即当前执行步骤A301‑A305的次数);随着迭代次数的增加,基准学习效率逐渐减小,有利于提高收敛速度;
[0116] 根据第一影响系数和第二影响系数,通过以下公式计算第一散度:
[0117] ;
[0118] 其中, 为第一散度, 为第一散度的预设初始值; 表征了各网络模块的输出数据对整个点云融合模型的输出结果的影响, 可根据实际需要设置,例如为1,但不限于此;
[0119] 根据第三影响系数和第四影响系数,通过以下公式计算第二散度:
[0120] ;
[0121] 其中, 为第二散度, 为第二散度的预设初始值; 表征了输入样本对整个点云融合模型输出结果的影响, 可根据实际需要设置,例如为1,但不限于此;
[0122] 根据第一散度和第二散度,通过以下公式计算学习率修正系数:
[0123] ;
[0124] 其中, 为学习率修正系数;
[0125] 根据基准学习效率和学习率修正系数,通过以下公式更新学习效率:
[0126] ;
[0127] 其中,为更新后的学习效率。
[0128] 上述更新学习效率的过程,引入损失函数对各网络模块的输出数据的梯度和对输入样本各个元素的梯度,实现学习效率的自适应更新,有利于加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0129] 具体地,步骤A304包括:
[0130] 根据以下公式更新点云融合模型的网络参数:
[0131] ;
[0132] 其中, 为更新后的网络参数,为更新前的网络参数( ), 为预设的收敛阈值;其中,可根据实际需要设置,例如为0.003,但不限于此。
[0133] 具体地,步骤A305中,若 ,则判定损失函数收敛,若 ,则判定网络参数收敛。停止迭代后,最后更新得到的网络参数 即为点云融合模型最终的网络参数。
[0134] 由上可知,该点云融合模型获取方法,通过获取训练数据集;初始化点云融合模型的网络参数;利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率;从而可加速点云融合模型的网络参数收敛速度,进而提高点云融合模型的训练效率。
[0135] 参考图2,本申请提供了一种点云融合模型获取装置,用于对点云融合模型进行训练,点云融合模型包括输入层、特征提取网络模块、特征融合网络模块、上采样网络模块和输出层;该点云融合模型获取装置包括:
[0136] 第一获取模块1,用于获取训练数据集;
[0137] 初始化模块2,初始化点云融合模型的网络参数;
[0138] 更新模块3,用于利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率。
[0139] 该装置在对点云融合模型进行迭代训练的过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数自适应地更新学习效率,可加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0140] 其中,参考图4,该点云融合模型的输入层输入的是M×3×N维的数据(其中,M为单帧点云数据的点数,N为输入样本的元素总数量,即输入样本包含的点云数据的总帧数),经特征提取网络模块对输入的点云数据进行特征提取后,输出的数据记为 ,该输出数据为L×3×N维的数据(其中,L为由特征提取网络模块的网络结构决定的中间值);特征融合网络模块对输出数据 进行降维处理和特征融合处理后,输出的数据记为 ,该输出数据 为k×3维的数据(其中,k为由特征融合网络模块的网络结构决定的中间值);上采样网络模块对输出数据 进行数据丰富后,输出的数据记为 ,该输出数据 为J×3维的数据(其中,J为上采样后模型输出维数,且J=M×N)。
[0141] 在本实施例中,特征提取网络模块通过ResNet‑50网络实现对输入的点云数据的特征提取,特征提取网络模块的特征提取函数记为 ,该特征提取网络模块的网络参数记为 ;特征融合网络模块通过flatten方法对输出数据 进行降维处理后,通过三层全连接网络实现特征融合,特征融合网络模块的特征融合函数记为 ,该特征融合网络模块的网络参数记为 ;上采样网络模块通过两层全卷积网络对输出数据 进行数据丰富,上采样网络模块的上采样函数记为 ,该上采样网络模块的网络参数记为 。
[0142] 其中,训练数据集包括多个样本,每个样本包括多帧(N帧)连续的点云数据和对应的真值标签(即对多帧点云数据进行融合后的参考融合点云数据)。根据多帧连续的点云数据获取对应的真值标签的方法为现有技术,此处不对其进行详述。
[0143] 其中,点云融合模型的网络参数包括特征提取网络模块的网络参数 、特征融合网络模块的网络参数 和上采样网络模块的网络参数 。在对点云融合模型的网络参数进行初始化时可初始化为预设值,也可以进行随机初始化,具体根据实际需要选择。若把点云融合模型的网络参数记为 ,则 。
[0144] 在本实施例中,更新模块3在利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛的时候,每次迭代过程执行:
[0145] 计算损失函数;
[0146] 更新一阶动量参数和二阶动量参数;
[0147] 根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率;
[0148] 根据一阶动量参数、二阶动量参数和学习效率更新点云融合模型的网络参数;
[0149] 若损失函数和网络参数中的至少一个收敛,则停止迭代。
[0150] 即当损失函数和网络参数均不收敛时,需要把下一个样本作为输入样本,把该输入样本的点云数据输入至点云融合模型,并进行下一次迭代,直到损失函数和网络参数中的至少一个收敛。
[0151] 其中,损失函数可根据实际需要设置,例如可选择使用MSE损失函数,但不限于此。
[0152] 在一些优选实施方式中,更新模块3在计算损失函数的时候,执行:
[0153] 根据以下公式计算损失函数:
[0154] ;
[0155] 其中,为损失函数, 为点云融合模型的输出数据, 为输入样本的真值标签。
[0156] 该损失函数的函数曲线光滑、连续,处处可导,便于改进梯度下降算法的使用,而且,随着误差的减小,梯度也在减小,这有利于提高损失函数的收敛速度。
[0157] 具体地,更新模块3在更新一阶动量参数和二阶动量参数的时候,执行:
[0158] 根据以下公式更新一阶动量参数和二阶动量参数:
[0159] ;
[0160] ;
[0161] 其中, 是更新后的一阶动量参数, 是更新前的一阶动量参数, 为更新后的二阶动量参数,为更新前的二阶动量参数, 、 为两个预设调整系数, 为损失函数关于网络参数的梯度(即 )。其中, 、 可根据实际需要设置,例如,可均设置为0.9,但不限于此;其中,对于首次迭代过程, , , 、 分别为一阶动量参数和二阶动量参数的预设初始值,可根据实际需要设置,例如均为0,但不限于此。
[0162] 具体地,更新模块3在根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率的时候,执行:
[0163] 根据以下公式计算第一影响系数和第二影响系数:
[0164] ;
[0165] ;
[0166] 其中, 为第一影响系数, 为第二影响系数, 为特征提取网络模块的输出数据, 为特征融合网络模块的输出数据, 为上采样网络模块的输出数据;其中 表征了输出数据 和输出数据 的变化引起损失函数的变化的显著程度, 表征了输出数据 和输出数据 的变化引起损失函数的变化的显著程度;
[0167] 根据以下公式计算第三影响系数和第四影响系数:
[0168] ;
[0169] ;
[0170] ;
[0171] 其中, 为输入样本的第i个元素, 为损失函数对输入样本的第i个元素的偏导数, 为损失函数对输入样本的第2j‑1个元素的偏导数, 为损失函数对输入样本的第2j个元素的偏导数,为输入样本的元素总数量, 为第三影响系数, 为第四影响系数;
其中,输入样本的第i个元素,即输入样本的第i帧点云数据, 表征的输入样本的第i个元素的变化引起损失函数的变化的显著程度;
[0172] 根据第一影响系数、第二影响系数、第三影响系数和第四影响系数,更新学习效率。
[0173] 具体地,根据第一影响系数、第二影响系数、第三影响系数和第四影响系数,更新学习效率具体包括:
[0174] 根据以下公式计算基准学习效率:
[0175] ;
[0176] 其中,为基准学习效率,t为当前的迭代次数;随着迭代次数的增加,基准学习效率逐渐减小,有利于提高收敛速度;
[0177] 根据第一影响系数和第二影响系数,通过以下公式计算第一散度:
[0178] ;
[0179] 其中, 为第一散度, 为第一散度的预设初始值; 表征了各网络模块的输出数据对整个点云融合模型的输出结果的影响, 可根据实际需要设置,例如为1,但不限于此;
[0180] 根据第三影响系数和第四影响系数,通过以下公式计算第二散度:
[0181] ;
[0182] 其中, 为第二散度, 为第二散度的预设初始值; 表征了输入样本对整个点云融合模型输出结果的影响, 可根据实际需要设置,例如为1,但不限于此;
[0183] 根据第一散度和第二散度,通过以下公式计算学习率修正系数:
[0184] ;
[0185] 其中, 为学习率修正系数;
[0186] 根据基准学习效率和学习率修正系数,通过以下公式更新学习效率:
[0187] ;
[0188] 其中,为更新后的学习效率。
[0189] 上述更新学习效率的过程,引入损失函数对各网络模块的输出数据的梯度和对输入样本各个元素的梯度,实现学习效率的自适应更新,有利于加速点云融合模型的网络参数收敛速度,从而提高点云融合模型的训练效率。
[0190] 具体地,更新模块3在根据一阶动量参数、二阶动量参数和学习效率更新点云融合模型的网络参数的时候,执行:
[0191] 根据以下公式更新点云融合模型的网络参数:
[0192] ;
[0193] 其中, 为更新后的网络参数,为更新前的网络参数( ), 为预设的收敛阈值;其中,可根据实际需要设置,例如为0.003,但不限于此。
[0194] 具体地,若 ,则更新模块3判定损失函数收敛,若 ,则更新模块3判定网络参数收敛。停止迭代后,最后更新得到的网络参数 即为点云融合模型最终的网络参数。
[0195] 由上可知,该点云融合模型获取装置,通过获取训练数据集;初始化点云融合模型的网络参数;利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率;从而可加速点云融合模型的网络参数收敛速度,进而提高点云融合模型的训练效率。
[0196] 请参照图3,图3为本申请实施例提供的一种电子设备的结构示意图,本申请提供一种电子设备,包括:处理器301和存储器302,处理器301和存储器302通过通信总线303和/或其他形式的连接机构(未标出)互连并相互通讯,存储器302存储有处理器301可执行的计算机程序,当电子设备运行时,处理器301执行该计算机程序,以执行上述实施例的任一可选的实现方式中的点云融合模型获取方法,以实现以下功能:获取训练数据集;初始化点云融合模型的网络参数;利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率。
[0197] 本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,执行上述实施例的任一可选的实现方式中的点云融合模型获取方法,以实现以下功能:获取训练数据集;初始化点云融合模型的网络参数;利用训练数据集,根据改进梯度下降法迭代更新点云融合模型的网络参数,直到损失函数或网络参数收敛;每次迭代过程中,根据点云融合模型的输入样本和各网络模块的输出数据对损失函数的影响系数更新学习效率。其中,计算机可读存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory, 简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read‑Only Memory, 简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory, 简称EPROM),可编程只读存储器(Programmable Red‑Only Memory, 简称PROM),只读存储器(Read‑Only Memory, 简称ROM),磁存储器,快闪存储器,磁盘或光盘。
[0198] 在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0199] 另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0200] 再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0201] 在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0202] 以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。