一种特征提取模型生成方法、装置、电子设备和存储介质转让专利
申请号 : CN202110606977.8
文献号 : CN113065533B
文献日 : 2021-11-02
发明人 : 朱文涛 , 杨森 , 姚鹏
申请人 : 北京达佳互联信息技术有限公司
摘要 :
权利要求 :
1.一种特征提取模型生成方法,其特征在于,所述方法包括:获取视频数据;
对所述视频数据中预设数量个目标帧位置处的图像进行采样,得到所述预设数量个采样图像;
基于预设的图像增强程度,对所述预设数量个采样图像中的第一帧采样图像进行图像增强处理,得到第一个目标图像;
根据所述预设数量个采样图像中每个其他采样图像对应的图像增强程度,对所述每个其他采样图像进行图像增强处理,得到其他目标图像,所述每个其他采样图像对应的图像增强程度为基于所述每个其他采样图像的上一帧采样图像对应的图像增强程度确定的增强程度,所述每个其他采样图像对应的图像增强程度用于模拟两帧采样图像之间的动态变化,所述其他采样图像为所述预设数量个采样图像中除第一帧采样图像外的采样图像;
将所述第一个目标图像和所述其他目标图像作为多个按序排列的目标图像;
基于至少两组多个按序排列的目标图像,对待训练特征提取模型进行对比学习训练,得到视频特征提取模型。
2.根据权利要求1所述的特征提取模型生成方法,其特征在于,所述根据所述每个其他采样图像对应的图像增强程度,对所述每个其他采样图像进行图像增强处理,得到所述其他目标图像包括:
根据所述每个其他采样图像对应的图像增强参数,对所述每个其他采样图像进行图像增强处理,得到所述其他目标图像,所述图像增强参数表征所述每个其他采样图像对应的图像增强程度,所述图像增强参数为基于所述每个其他采样图像的上一帧采样图像对应的图像增强参数和预设的帧间增强参数进行更新的参数。
3.根据权利要求2所述的特征提取模型生成方法,其特征在于,所述基于预设的图像增强程度,对所述预设数量个采样图像中的第一帧采样图像进行图像增强处理,得到第一个目标图像包括:
将预设的初始图像增强参数作为所述预设的图像增强程度;
根据所述初始图像增强参数,对所述第一帧采样图像进行图像增强处理,得到第一个目标图像;
所述根据所述每个其他采样图像对应的图像增强参数,对所述每个其他采样图像进行图像增强处理,得到所述其他目标图像包括:从所述其他采样图像中确定目标采样图像;
根据所述目标采样图像的上一帧采样图像对应的图像增强参数和预设的帧间增强参数,确定所述目标采样图像对应的图像增强参数;
根据所述目标采样图像对应的图像增强参数,对所述目标采样图像进行图像增强处理,得到所述其他目标图像。
4.根据权利要求1所述的特征提取模型生成方法,其特征在于,所述对所述视频数据中预设数量个目标帧位置处的图像进行采样,得到所述预设数量个采样图像包括:对所述视频数据中与预设采样参数对应的目标帧位置处的图像进行采样,得到第一帧采样图像;
将所述第一帧采样图像作为当前采样图像;
将所述预设采样参数作为当前采样参数;
根据所述当前采样图像的目标帧位置和所述当前采样参数,对所述当前采样图像的目标帧位置的下一目标帧位置处的图像进行采样,得到所述当前采样图像的下一采样图像;
根据所述下一采样图像,更新所述当前采样图像;
根据所述当前采样图像的目标帧位置、所述下一采样图像的目标帧位置和所述视频数据的帧率,更新所述当前采样参数中的视频采样率;
重复所述根据所述当前采样图像的目标帧位置和所述当前采样参数,确定所述当前采样图像的下一采样图像至所述根据所述当前采样图像的目标帧位置、所述下一采样图像的目标帧位置和所述视频数据的帧率,更新所述当前采样参数的步骤,直到采样图像的数量达到所述预设数量。
5.根据权利要求1所述的特征提取模型生成方法,其特征在于,所述基于所述多个按序排列的目标图像,对所述待训练特征提取模型进行训练,得到视频特征提取模型还包括:从所述多个按序排列的目标图像中获取第一数量个训练图像;
在第一训练阶段,基于所述第一数量个训练图像,对待训练业务模型进行训练,得到第一待训练模型;
从所述多个按序排列的目标图像中获取第二数量个训练图像;
在第二训练阶段,基于所述第二数量个训练图像,对所述第一待训练模型中的非特征提取网络进行训练,得到第二待训练模型;
从所述多个按序排列的目标图像中获取第三数量个训练图像;
在第三训练阶段,基于所述第三数量个训练图像,对所述第二待训练模型中的特征提取网络进行训练,得到目标业务模型。
6.根据权利要求1所述的特征提取模型生成方法,其特征在于,所述基于所述多个按序排列的目标图像,对所述待训练特征提取模型进行训练,得到视频特征提取模型之后,所述方法还包括:
将所述视频数据输入到所述视频特征提取模型中进行特征提取,得到视频特征数据;
将所述视频特征数据输入到待训练视频分类模型中进行分类,得到所述视频数据对应的每个视频类别概率,所述视频类别概率表征所述视频数据属于不同的视频类别的概率;
根据所述每个视频类别概率,确定所述视频数据对应的视频类别信息;
根据所述视频类别信息和所述每个视频类别概率,确定分类损失数据;
根据所述视频类别信息、所述每个视频类别概率和预设的标签平滑参数,确定标签平滑损失数据;
基于所述分类损失数据和所述标签平滑损失数据,对所述待训练视频分类模型进行训练,得到视频分类模型。
7.根据权利要求1所述的特征提取模型生成方法,其特征在于,所述方法还包括:对所述预设数量个采样图像进行翻转处理或灰度化处理,得到预设数量个预处理采样图像;
基于预设的图像增强程度,对所述预设数量个预处理采样图像中的第一帧预处理采样图像进行图像增强处理,得到第一个目标图像;
基于所述预设数量个预处理采样图像中的其他预处理采样图像的上一帧预处理采样图像对应的图像增强程度,对所述其他预处理采样图像进行图像增强处理,得到其他目标图像,所述其他预处理采样图像为所述预设数量个预处理采样图像中除第一帧预处理采样图像外的采样图像。
8.一种特征提取模型生成装置,其特征在于,所述装置包括:视频数据获取模块,被配置为执行获取视频数据;
采样模块,被配置为执行对所述视频数据中预设数量个目标帧位置处的图像进行采样,得到所述预设数量个采样图像;
第一图像增强模块,被配置为执行基于预设的图像增强程度,对所述预设数量个采样图像中的第一帧采样图像进行图像增强处理,得到第一个目标图像;
第二图像增强模块,被配置为执行根据所述预设数量个采样图像中每个其他采样图像对应的图像增强程度,对所述每个其他采样图像进行图像增强处理,得到其他目标图像,所述每个其他采样图像对应的图像增强程度为基于所述每个其他采样图像的上一帧采样图像对应的图像增强程度确定的增强程度,所述每个其他采样图像对应的图像增强程度用于模拟两帧采样图像之间的动态变化,所述其他采样图像为所述预设数量个采样图像中除第一帧采样图像外的采样图像;
目标图像确定模块,被配置为执行将所述第一个目标图像和所述其他目标图像作为多个按序排列的目标图像;
特征提取模型训练模块,被配置为执行基于至少两组多个按序排列的目标图像,对待训练特征提取模型进行对比学习训练,得到视频特征提取模型。
9.根据权利要求8所述的特征提取模型生成装置,其特征在于,所述第二图像增强单元包括:
参数增强处理单元,被配置为执行根据所述每个其他采样图像对应的图像增强参数,对所述每个其他采样图像进行图像增强处理,得到所述其他目标图像,所述图像增强参数表征所述每个其他采样图像对应的图像增强程度,所述图像增强参数为基于所述每个其他采样图像的上一帧采样图像对应的图像增强参数和预设的帧间增强参数进行更新的参数。
10.根据权利要求9所述的特征提取模型生成装置,其特征在于,所述第一图像增强模块包括:
初始增强程度确定单元,被配置为执行将预设的初始图像增强参数作为所述预设的图像增强程度;
第一个目标图像获取单元,被配置为执行根据所述初始图像增强参数,对所述第一帧采样图像进行图像增强处理,得到第一个目标图像;
所述参数增强处理单元包括:
目标采样图像确定单元,被配置为执行从所述其他采样图像中确定目标采样图像;
图像增强参数确定单元,被配置为执行根据所述目标采样图像的上一帧采样图像对应的图像增强参数和预设的帧间增强参数,确定所述目标采样图像对应的图像增强参数;
其他目标图像获取单元,被配置为执行根据所述目标采样图像对应的图像增强参数,对所述目标采样图像进行图像增强处理,得到所述其他目标图像。
11.根据权利要求8所述的特征提取模型生成装置,其特征在于,所述采样模块包括:第一帧采样图像确定单元,被配置为执行对所述视频数据中与预设采样参数对应的目标帧位置处的图像进行采样,得到第一帧采样图像;并将所述第一帧采样图像作为当前采样图像;
当前采样参数确定单元,被配置为执行将所述预设采样参数作为当前采样参数;
下一采样图像确定单元,被配置为执行根据所述当前采样图像的目标帧位置和所述当前采样参数,对所述当前采样图像的目标帧位置的下一目标帧位置处的图像进行采样,得到所述当前采样图像的下一采样图像;
当前采样图像更新单元,被配置为执行根据所述下一采样图像,更新所述当前采样图像;
视频采样率更新单元,被配置为执行根据所述当前采样图像的目标帧位置、所述下一采样图像的目标帧位置和所述视频数据的帧率,更新所述当前采样参数中的视频采样率;
采样图像获取单元,被配置为执行重复所述根据所述当前采样图像的目标帧位置和所述当前采样参数,确定所述当前采样图像的下一采样图像至所述根据所述当前采样图像的目标帧位置、所述下一采样图像的目标帧位置和所述视频数据的帧率,更新所述当前采样参数的步骤,直到采样图像的数量达到所述预设数量。
12.根据权利要求8所述的特征提取模型生成装置,其特征在于,所述特征提取模型训练模块包括:
第一训练图像获取模块,被配置为执行从所述多个按序排列的目标图像中获取第一数量个训练图像;
第一训练模块,被配置为执行在第一训练阶段,基于所述第一数量个训练图像,对待训练业务模型进行训练,得到第一待训练模型;
第二训练图像获取模块,被配置为执行从所述多个按序排列的目标图像中获取第二数量个训练图像;
第二训练模块,被配置为执行在第二训练阶段,基于所述第二数量个训练图像,对所述第一待训练模型中的非特征提取网络进行训练,得到第二待训练模型;
第三训练图像获取模块,被配置为执行从所述多个按序排列的目标图像中获取第三数量个训练图像;
第三训练模块,被配置为执行在第三训练阶段,基于所述第三数量个训练图像,对所述第二待训练模型中的特征提取网络进行训练,得到目标业务模型。
13.根据权利要求8所述的特征提取模型生成装置,其特征在于,所述装置还包括:特征提取模块,被配置为执行将所述视频数据输入到所述视频特征提取模型中进行特征提取,得到视频特征数据;
视频分类模块,被配置为执行将所述视频特征数据输入到待训练视频分类模型中进行分类,得到所述视频数据对应的每个视频类别概率,所述视频类别概率表征所述视频数据属于不同的视频类别的概率;
视频类别确定模块,被配置为执行根据所述每个视频类别概率,确定所述视频数据对应的视频类别信息;
分类损失确定模块,被配置为执行根据所述视频类别信息和所述每个视频类别概率,确定分类损失数据;
标签平滑损失确定模块,被配置为执行根据所述视频类别信息、所述每个视频类别概率和预设的标签平滑参数,确定标签平滑损失数据;
分类模型训练模块,被配置为珍惜基于所述分类损失数据和所述标签平滑损失数据,对所述待训练视频分类模型进行训练,得到视频分类模型。
14.根据权利要求8所述的特征提取模型生成装置,其特征在于,所述装置还包括:预处理模块,被配置为执行对所述预设数量个采样图像进行翻转处理或灰度化处理,得到预设数量个预处理采样图像;
第一预处理图像增强模块,被配置为执行基于预设的图像增强程度,对所述预设数量个预处理采样图像中的第一帧预处理采样图像进行图像增强处理,得到第一个目标图像;
第二预处理图像增强模块,被配置为执行基于所述预设数量个预处理采样图像中的其他预处理采样图像的上一帧预处理采样图像对应的图像增强程度,对所述其他预处理采样图像进行图像增强处理,得到其他目标图像,所述其他预处理采样图像为所述预设数量个预处理采样图像中除第一帧预处理采样图像外的采样图像。
15.一种电子设备,其特征在于,所述电子设备包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的一种特征提取模型生成方法。
16.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的一种特征提取模型生成方法。
17.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至7任一项所述的一种特征提取模型生成方法。
说明书 :
一种特征提取模型生成方法、装置、电子设备和存储介质
技术领域
背景技术
入的数据产生标签信息,可以通过对输入的数据进行采样和数据增强的方式,对输入的数
据进行区别,从而可以在特征提取时得到有效的特征信息。
对所有帧采用相同程度的增强不能够充分模拟视频数据中对象的动态变化或摄像头的动
态变化,导致图像增强的有效性低,从而导致自监督学习的准确性低。
发明内容
下:
为所述预设数量个采样图像中除第一帧采样图像外的采样图像;
目标图像包括:
述上一帧采样图像对应的图像增强程度确定的增强程度。
应的图像增强程度,所述图像增强参数为基于所述每个其他采样图像的上一帧采样图像对
应的图像增强参数和预设的帧间增强参数进行更新的参数。
像;
像的目标帧位置和所述视频数据的帧率,更新所述当前采样参数的步骤,直到采样图像的
数量达到所述预设数量。
率;
目标图像,所述其他预处理采样图像为所述预设数量个预处理采样图像中除第一帧预处理
采样图像外的采样图像。
其他目标图像,所述其他采样图像为所述预设数量个采样图像中除第一帧采样图像外的采
样图像;
图像对应的图像增强程度为基于所述上一帧采样图像对应的图像增强程度确定的增强程
度。
数表征所述每个其他采样图像对应的图像增强程度,所述图像增强参数为基于所述每个其
他采样图像的上一帧采样图像对应的图像增强参数和预设的帧间增强参数进行更新的参
数。
数;
为当前采样图像;
样,得到所述当前采样图像的下一采样图像;
率;
像的目标帧位置、所述下一采样图像的目标帧位置和所述视频数据的帧率,更新所述当前
采样参数的步骤,直到采样图像的数量达到所述预设数量。
数据属于不同的视频类别的概率;
像;
采样图像进行图像增强处理,得到其他目标图像,所述其他预处理采样图像为所述预设数
量个预处理采样图像中除第一帧预处理采样图像外的采样图像。
的一种特征提取模型生成方法。
处理,得到第一个目标图像,并基于预设数量个采样图像中的其他采样图像的上一帧采样
图像对应的图像增强程度,对其他采样图像进行图像增强处理,得到其他目标图像,将第一
个目标图像和其他目标图像作为目标图像,基于目标图像,对待训练特征提取模型进行训
练,得到视频特征提取模型。该方法可以根据每一个采样图像的图像增强参数,对该采样图
像进行图像增强,从而提高了图像增强的有效性,并提高增强后的图像间的帧间连续性。
附图说明
具体实施方式
的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相
一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面
相一致的装置和方法的例子。
服务器110对视频数据中预设数量个目标帧位置处的图像进行采样,得到预设数量个采样
图像,并基于预设的图像增强程度,对预设数量个采样图像中的第一帧采样图像进行图像
增强处理,得到第一个目标图像,再基于预设数量个采样图像中的其他采样图像的上一帧
采样图像对应的图像增强程度,对其他采样图像进行图像增强处理,得到其他目标图像,将
第一个目标图像和其他目标图像作为目标图像,服务器110将目标图像作为训练数据,通过
自监督学习的方式生成视频特征提取模型。
存储器等等。具体的,服务器110可以获取视频数据,对视频数据中预设数量个目标帧位置
处的图像进行采样,得到预设数量个采样图像,并对每个采样图像分别进行图像增强处理,
得到目标图像。服务器110还可以目标图像作为训练数据,通过自监督学习的方式生成视频
特征提取模型。
应用程序等。本申请实施例中实体设备上运行的操作系统可以包括但不限于安卓系统、IOS
系统、linux、Unix、windows等。客户端120基于API(Application Programming Interface,
应用程序接口)将视频数据发送给服务器110。
其他帧位置处的上一帧位置处的图像对应的采样参数,对其他帧位置处的图像进行采样,
得到其他采样图像,其他采样图像为预设数量个采样图像中除第一帧采样图像外的采样图
像。
频数据的帧率,更新当前采样参数的步骤,直到采样图像的数量达到预设数量。
平移或抖动时,通过均匀采样得到的采样图像与视频数据在采样过程中的实际动态变化不
匹配,因此可以利用分布函数模拟视频数据中对象的动态变化或坐标参考系的动态变化,
从而通过视频数据在采样过程中的动态分布数据,确定采样图像的目标帧位置,得到预设
数量个采样图像。
位置。根据第一帧采样图像的目标帧位置,得到第一帧采样图像。将第一帧采样图像作为当
前采样图像,并将预设的采样率作为当前采样参数。根据当前视频采样参数和视频数据的
帧率,可以确定视频数据采集过程中的动态分布数据。根据当前采样图像的目标帧位置和
动态分布数据,可以确定当前采样图像的下一采样图像的目标帧位置,动态分布数据可以
确定两个相邻的采样图像间的目标帧位置的差值。根据当前采样图像的下一采样图像的目
标帧位置,可以更新当前采样图像。根据当前采样图像的目标帧位置、当前采样图像的下一
采样图像的目标帧位置和视频数据的帧率,可以更新当前视频采样参数。基于更新后的当
前采样图像的目标帧位置和更新后的当前视频采样参数,可以确定更新后的当前采样图像
的下一采样图像的目标帧位置,并可以再次对当前采样图像和当前视频采样参数进行更
新,并更新动态分布数据。重复上述采样和更新的步骤直到采样图像的数量达到预设数量,
根据每一个采样图像的目标帧位置,可以得到多个按序排列的采样图像。该多个按序排列
的采样图像对应当前采样的视频数据。
,每一帧采样图像和下一帧采样图像间的采样间隔为 。假设
为5,当前采样图像对应的帧位置为第1帧,则下一采样图像对应的帧位置为第6帧,若此
时视频数据中的对象为加速状态,或者摄像机的方向平移,或者摄像机的抖动变得剧烈,则
可以根据预设的分布函数模拟视频数据中对象的动态变化或视频数据对应的参考系的动
态变化,缩短采样率,实际采样的下一采样图像可以为第5帧或者第4帧。
置。此时可以根据均匀分布确定第一帧采样图像的目标帧位置,即 时对应第一帧采样
图像,第一帧采样图像的目标帧位置为 。
以采用预设的分布函数进行模拟,例如高斯分布函数或拉普拉斯分布函数。
位置差值符合高斯分布,即 ,可以根据高斯分布得到 的值,计
算当前采样图像的下一帧采样图像间的目标帧位置。
下一帧采样图像间的目标帧位置差值符合拉普拉斯分布,即 ,
可以根据拉普拉斯分布得到Δs的值,计算当前采样图像的下一帧采样图像间的目标帧位
置。
采样图像,将当前采样图像的下一帧采样图像作为当前采样图像。基于更新后的当前视频
采样参数和视频数据的帧率,可以更新动态分布数据,从而计算当前采样图像和当前采样
图像的下一帧采样图像间的目标帧位置差值,直到采样图像的数量达到预设数量。
化,提高图像采样的准确率和平滑度。
量个采样图像中除第一帧采样图像外的采样图像;
图像,其他预处理采样图像为预设数量个预处理采样图像中除第一帧预处理采样图像外的
采样图像。
利分布数据。服务器在对视频数据对应的预设数量个采样图像进行翻转处理或灰度化处理
时,是对预设数量个采样图像中每一个采样图像均进行翻转处理或灰度化处理。
处理时,服务器可以基于预设的图像增强程度,对预设数量个预处理采样图像中的第一帧
预处理采样图像进行图像增强处理,并根据上一帧预处理采样图像对应的图像增强程度,
对其他预处理采样图像进行图像增强处理。
设数量个采样图像 进行图像增强处理,服务器可以对预设数量个采样图像 进行翻转处
理,得到预处理采样图像 。服务器对预处理采样图像 进行图像增强处理,得到一组目
标图像。服务器对采样图像 进行图像增强处理,得到另一组目标图像。或者服务器可以对
预设数量个采样图像 进行翻转处理,得到预处理采样图像 。服务器对预处理采样图像
进行图像增强处理,得到一组目标图像。服务器可以对预设数量个采样图像 进行灰度化
处理,得到预处理采样图像 ,服务器对预处理采样图像 进行图像增强处理,得到另一
组目标图像。服务器就可以得到两组目标图像,在后续步骤中,根据这两组目标图像进行对
比学习。服务器还可以获得两组以上的目标图像。
率。
对应的图像增强程度确定的增强程度。
他采样图像进行图像增强处理,得到其他目标图像。因此,图像增强程度是一个动态变化的
信息,可以表征两帧采样图像之间的动态变化,从而在进行图像增强时,将两帧采样图像之
间发生的动态变化增加到图像增强中,得到目标其他图像。
种动态变化,从而在应用到后续的对比学习中,可以提高自监督学习的准确性。
样图像的上一帧采样图像对应的图像增强参数和预设的帧间增强参数进行更新的参,图像
增强参数可以包括图像缩放参数、图像裁剪参数和颜色扰动参数中的一种或多种。
缩放参数。服务器根据每个采样图像对应的图像缩放参数,对每个其他采样图像进行图像
缩放处理,可以得到其他目标图像。图像增强参数包括图像缩放参数和图像裁剪参数。服务
器根据每个其他采样图像的上一帧采样图像对应的图像缩放参数和预设的帧间缩放参数,
确定每个其他采样图像对应的图像缩放参数,并根据每个其他采样图像对应的图像缩放参
数,对每个其他采样图像进行图像缩放处理,可以得到缩放后图像。服务器根据每个缩放后
图像的上一个缩放后图像对应的图像裁剪参数和预设的帧间裁剪参数,确定每个缩放后图
像对应的图像裁剪参数。服务器根据每个采样图像对应的图像裁剪参数,对每个缩放后图
像进行图像裁剪处理,可以得到其他目标图像。
各种变形,提高图像增强的有效性。
图像对应的图像增强参数。服务器可以根据第一帧采样图像对应的图像增强参数,对第一
帧采样图像进行图像增强处理,得到第一个目标图像,第一个目标图像为第一帧采样图像
的增强后图像。
采样图像的尺寸信息为 ,对采样图像进行裁剪的目标为将每个采样图像变成
224x224大小的规整的图像,初始图像裁剪参数可以为 。在初始图像
增强参数为初始颜色扰动参数时,初始颜色扰动参数可以为 ,分别
对应为三个颜色通道的初始颜色扰动参数。
确定目标采样图像对应的第一图像增强参数。帧间增强参数可以为预设的平滑分布数据的
参数,帧间增强参数可以包括帧间缩放参数、帧间裁剪参数和帧间颜色扰动参数。平滑分布
数据用来模拟相邻两帧采样图像间图像增强参数的变化,图像增强参数的变化可以包括相
邻两帧采样图像间缩放参数的变化、裁剪位置的变化或者颜色扰动变化。平滑分布数据可
以采用高斯分布或者拉普拉斯分布。服务器根据目标采样图像对应的图像增强参数,对目
标采样图像进行图像增强处理,可以得到其他目标图像,其他目标图像为其他采样图像的
增强后图像。
缩放参数为 。计算目标采样图像对应的图像缩放参数的公式为
。
分布对应的像素位置的变化的发生概率大于90%概率的分布区间,从而确定帧间缩放参数
。
,从而确定帧间缩放参数 。
剪参数 ,计算目标采样图像对应的图像裁剪参数的公式为
。若 为高斯分布,则该高斯分布的方差为 ,
为帧间缩放参数,是一个预先定义的超参数。服务器可以从同一对象在相邻两帧采样图
像中像素位置的变化来确定 ,即高斯分布对应的像素位置的变化大于90%概率的分布
区间,从而确定帧间缩放参数 。
,从而确定帧间缩放参数 。利用拉普拉斯分布模拟图像裁剪参数的变化,计
算目标采样图像对应的图像裁剪参数的公式为:
超参数。可以根据经验值,从同一对象在相邻两帧采样图像中像素值的变化来确定 ,即
高斯分布对应的像素值的变化发生概率大于90%概率的分布区间,从而确定帧间颜色扰动
参数 。
的变化来确定 ,从而确定帧间颜色扰动参数 。利用拉普拉斯分布模拟图像颜
色扰动参数的变化,计算目标采样图像对应的颜色扰动参数的公式为:
进行颜色偏移处理,得到其他目标图像。
的图像增强参数,对该采样图像进行图像增强,从而提高了图像增强的有效性,同时由于考
虑到了帧间增强参数,因此也可以提高增强后的图像间的帧间连续性。
征提取,得到目标图像对应的训练特征数据。目标图像可以有多组,因此训练特征模型也可
以有多组。选择一个目标视频数据,目标视频数据的其中一组目标图像与目标视频数据的
另一组目标图像相似,目标视频数据的其中一组目标图像与其他视频数据的各组目标图像
均不相似,因此可以将目标图像输入到待训练特征提取模型中,通过相似图像间的对比以
及非相似图像间的对比,可以对待训练特征提取模型进行训练,得到视频特征提取模型。
训练特征数据间的损失数据 。损失数据 的计算公式为:
为加快模型训练的温度参数,一般可以取0.1。
第一数量个训练图像,第一数量个训练图像的数量少于目标图像的总数量。在第一训练阶
段,服务器基于第一数量个训练图像,对待训练业务模型进行训练,得到第一待训练模型。
服务器固定第一待训练模型中前预设数目层神经网络的参数,将第一待训练模型中前预设
数目层神经网络作为特征提取网络。服务器从多个目标图像中获取第二数量个训练图像,
第二数量个训练图像的数量少于目标图像的总数量,第二数量个训练图像的数量大于第一
数量个训练图像的数量。在第二训练阶段,服务器基于第二数量个训练图像,对第一待训练
模型中的非特征提取网络进行训练,得到第二待训练模型。
训练图像,第三数量个训练图像的数量少于目标图像的总数量,第三数量个训练图像的数
量可以大于第一数量个训练图像的数量。在第三训练阶段,服务器基于第三数量个训练图
像,对第二待训练模型中的特征提取网络进行训练,得到目标业务模型。
将视频特征数据输入到待训练视频分类模型中进行分类,可以得到视频数据对应的每个视
频类别概率,视频类别概率表征视频数据属于不同的视频类别的概率。
可以根据视频类别信息、每个视频类别概率和预设的标签平滑参数,确定标签平滑损失数
据。标签平滑损失数据对应的公式与分类损失数据对应的公式相同。
模型中,训练得到视频分类模型等目标业务模型。服务器可以基于目标业务模型对视频数
据进行视频分析,根据视频分析的结果生成推荐信息或者广告信息等,将推荐信息或广告
信息发送到客户端。
增强程度,对预设数量个采样图像中的第一帧采样图像进行图像增强处理,得到第一个目
标图像,并基于预设数量个采样图像中的其他采样图像的上一帧采样图像对应的图像增强
程度,对其他采样图像进行图像增强处理,得到其他目标图像,将第一个目标图像和其他目
标图像作为目标图像,基于目标图像,对待训练特征提取模型进行训练,得到视频特征提取
模型。该方法可以模拟视频数据中对象的动态变化和坐标参考系的动态变化,提高图像采
样的准确率和平滑度,该方法还可以根据每一个采样图像的图像增强参数,对该采样图像
进行图像增强,从而提高了图像增强的有效性,并提高增强后的图像间的帧间连续性。该方
法还可以通过标签平滑的方式提高视频分类的准确率,并通过分阶段训练的方式提高模型
训练的效率。
目标图像,其他采样图像为预设数量个采样图像中除第一帧采样图像外的采样图像;
像增强程度为基于上一帧采样图像对应的图像增强程度确定的增强程度。
采样图像对应的图像增强程度,图像增强参数为基于每个其他采样图像的上一帧采样图像
对应的图像增强参数和预设的帧间增强参数进行更新的参数。
像;
样图像的下一采样图像;
图像的目标帧位置和视频数据的帧率,更新当前采样参数的步骤,直到采样图像的数量达
到预设数量。
频类别的概率;
进行图像增强处理,得到其他目标图像,其他预处理采样图像为预设数量个预处理采样图
像中除第一帧预处理采样图像外的采样图像。
线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能
力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操
作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行
提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被
处理器执行时以实现一种特征提取模型的生成方法。
包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD‑ROM、磁带、软盘
和光数据存储设备等。
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的
权利要求指出。