视频防抖方法、终端设备和计算机可读存储介质转让专利

申请号 : CN202010811800.7

文献号 : CN114079725B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 吴虹苗磊贾志平刘蒙刘志鹏

申请人 : 华为技术有限公司

摘要 :

本申请实施例公开了一种视频防抖方法、终端设备和计算机可读存储介质,该方法包括:获取待处理图像,待处理图像为待处理视频中的一帧图像;对待处理图像进行前后景分割,得到第一后景图像和第一前景图像;对第一前景图像进行防抖处理,得到第一前景增稳图像;对第一后景图像进行防抖处理,得到第一后景增稳图像;将第一前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第一增稳图像。本申请实施例对视频图像进行前后景分割,得到前景图像和后景图像,再分别对前景图像和后景图像进行防抖处理,即前景和后景的防抖处理过程是分离的,不耦合的,进而不用牺牲背景防抖能力,也能实现前景和后景的同时稳像。

权利要求 :

1.一种视频防抖方法,应用于终端设备,其特征在于,包括:

获取待处理图像,所述待处理图像为待处理视频中的一帧图像;

对所述待处理图像进行前后景分割,得到第一后景图像和第一前景图像;

对所述第一前景图像进行防抖处理,得到第一前景增稳图像;

对所述第一后景图像进行防抖处理,得到第一后景增稳图像;

将所述第一前景增稳图像和所述第一后景增稳图像进行融合,得到所述待处理图像的第一增稳图像;

其中,所述方法还包括:

提取所述待处理图像的第一边缘带信息,所述第一边缘带信息为所述待处理图像中,前景和后景之间的边缘带的像素信息;

提取所述第一增稳图像的第二边缘带信息,所述第二边缘带信息为所述第一增稳图像中,前景和后景之间的边缘带的像素信息;

根据所述第一边缘带信息和所述第二边缘带信息,对下一帧图像或者所述待处理图像的防抖强度进行调整,所述防抖强度包括前景防抖强度和/或后景防抖强度。

2.根据权利要求1所述的方法,其特征在于,对所述第一前景图像进行防抖处理,得到第一前景增稳图像,包括:提取所述第一前景图像的特征点;

根据所述第一前景图像的特征点和第二前景图像的特征点,得到第一运动轨迹曲线,所述第二前景图像为第一目标图像的前景图像,所述待处理视频包括所述第一目标图像,且所述第一目标图像和所述待处理图像在图像序列上是连续的图像帧;

根据所述待处理图像的前景防抖强度,对所述第一运动轨迹曲线进行路径平滑处理,得到路径平滑处理后的第二运动轨迹曲线;

根据所述第二运动轨迹曲线和所述第一前景图像,得到增稳后的第一前景图像;

对所述增稳后的第一前景图像进行边缘补偿,得到所述第一前景增稳图像。

3.根据权利要求2所述的方法,其特征在于,对所述增稳后的第一前景图像进行边缘补偿,得到所述第一前景增稳图像,包括:通过 计算所述增稳后的第一前景图像中每个待补偿像素点的目

标像素值;

将所述目标像素值作为所述待补偿像素点的像素值,其它像素点的像素值不变,得到所述第一前景增稳图像,所述其它像素点为所述增稳后的第一前景图像中,除了所述待补偿像素点之外的像素点;

其中, V(q)为q点的目标像素值,q点为所述待补偿像素点;P(i,j)为第i行第j列的像素点的像素值,w(i,j)为第i行第j列的像素点的高斯权重,σ为超参数,N为正整数。

4.根据权利要求1所述的方法,其特征在于,根据所述第一边缘带信息和所述第二边缘带信息,对下一帧图像或者所述待处理图像的防抖强度进行调整,包括:确定所述第一边缘带信息和所述第二边缘带信息之间的第一结构性相似度指标;

若所述第一结构性相似度指标未落入预设相似度阈值区间,对下一帧图像或者所述待处理图像的防抖强度进行调整。

5.根据权利要求4所述的方法,其特征在于,若所述第一结构性相似度指标未落入预设相似度阈值区间,对下一帧图像或者所述待处理图像的防抖强度进行调整,包括:若所述第一结构性相似度指标未落入所述预设相似度阈值区间,将所述待处理图像的防抖强度和预设数值相乘,得到调整后的第一防抖强度,将所述调整后的第一防抖强度作为所述下一帧图像的防抖强度或者所述待处理图像的防抖强度。

6.根据权利要求5所述的方法,其特征在于,所述调整后的第一防抖强度包括所述待处理图像的前景防抖强度;所述方法还包括:根据所述调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑处理,得到路径平滑处理后的第三运动轨迹曲线,所述第一运动轨迹曲线为根据所述第一前景图像的特征点和第二前景图像的特征点得到的运动轨迹曲线,所述第二前景图像为第一目标图像的前景图像,所述待处理视频包括所述第一目标图像,且所述第一目标图像和所述待处理图像在图像序列上是连续的图像帧;

根据所述第三运动轨迹曲线和所述第一前景图像,得到第二前景增稳图像;

将所述第二前景增稳图像和所述第一后景增稳图像进行融合,得到所述待处理图像的第二增稳图像;

确定所述第二边缘带信息和第三边缘带信息之间的第二结构性相似度指标,所述第三边缘带信息为所述第二增稳图像中,前景和后景之间的边缘带的像素信息;

若所述第二结构性相似度指标未落入所述预设相似度阈值区间,将所述调整后的第一防抖强度和所述预设数值相乘,得到调整后的第二防抖强度;

将所述调整后的第二防抖强度作为调整后的第一防抖强度,并返回执行根据所述调整后的第一防抖强度,对所述第一运动轨迹曲线进行路径平滑处理,得到路径平滑处理后的第三运动轨迹曲线的步骤,直到所述第二结构性相似度指标落入所述预设相似度阈值区间。

7.根据权利要求1所述的方法,其特征在于,对所述第一后景图像进行防抖处理,得到第一后景增稳图像,包括:提取所述第一后景图像的特征点;

根据所述第一后景图像的特征点和第二后景图像的特征点,得到第四运动轨迹曲线,所述第二后景图像为第二目标图像的后景图像,所述待处理视频包括所述第二目标图像,且所述第二目标图像和所述待处理图像在图像序列上是连续的图像帧;

根据所述待处理图像的后景防抖强度,对所述第四运动轨迹曲线进行路径平滑处理,得到路径平滑处理后的第二运动轨迹曲线;

根据所述第二运动轨迹曲线和所述第一前景图像,得到所述第一前景增稳图像。

8.一种视频防抖装置,应用于终端设备,其特征在于,包括:

图像获取模块,用于获取待处理图像,所述待处理图像为待处理视频中的一帧图像;

前后景分割模块,用于对所述待处理图像进行前后景分割,得到第一后景图像和第一前景图像;

前景防抖模块,用于对所述第一前景图像进行防抖处理,得到第一前景增稳图像;

后景防抖模块,用于对所述第一后景图像进行防抖处理,得到第一后景增稳图像;

图像融合模块,用于将所述第一前景增稳图像和所述第一后景增稳图像进行融合,得到所述待处理图像的第一增稳图像;

其中,所述装置还包括:防抖强度调整模块,用于提取所述待处理图像的第一边缘带信息,所述第一边缘带信息为所述待处理图像中,前景和后景之间的边缘带的像素信息;提取所述第一增稳图像的第二边缘带信息,所述第二边缘带信息为所述第一增稳图像中,前景和后景之间的边缘带的像素信息;根据所述第一边缘带信息和所述第二边缘带信息,对下一帧图像或者所述待处理图像的防抖强度进行调整,所述防抖强度包括前景防抖强度和/或后景防抖强度。

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的视频防抖方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的视频防抖方法。

说明书 :

视频防抖方法、终端设备和计算机可读存储介质

技术领域

[0001] 本申请涉及图像处理技术领域,尤其涉及一种视频防抖方法、终端设备和计算机可读存储介质。

背景技术

[0002] 目前,常见的视频防抖可以分为电子防抖(Electric Image Stabilization,EIS)和光学防抖(Optical Image Stabilization,OIS)。
[0003] 一般情况下,EIS无需额外的元器件辅助,其是一种软件补偿算法,原理是通过算法对视频图像进行后期处理,以对所采集的视频图像进行防抖。现有的EIS方法中,首先通过终端设备的陀螺仪,获得视频图像的背景运动信息,视频图像背景运动信息(或称背景抖动)可以是指终端设备的摄像头运动而产生的运动信息。同时,采集视频图像的人脸特征,根据人脸特征计算人脸的平滑运动轨迹。然后,基于背景运动信息和人脸的平滑运动轨迹之间的权重,根据背景运动信息和人脸的平滑运动轨迹,最终得到相机平滑轨迹。最后,根据该相机平滑轨迹对视频图像进行消抖补偿,实现视频前景和后景的同时稳像。
[0004] 但是,由于背景运动方向和人脸运动方向是相反的,使得背景运动信息和人脸的平滑运动轨迹之间的权重只能折中选取,进而导致前景的防抖效果和后景的防抖效果也是一个折中效果。换句话说,如果需要实现前景防抖,必须牺牲背景防抖能力,进而才能实现前景和后景同时稳像。

发明内容

[0005] 有鉴于此,本申请实施例提供一种视频防抖方法、终端设备和计算机可读存储介质,以解决现有EIS方法中,需要牺牲背景防抖能力才能实现前景和后景同时稳像的问题。
[0006] 第一方面,本申请实施例提供一种视频防抖方法,该方法可以应用于终端设备,该终端设备可以例如为手机和平板等,该方法可以包括:获取待处理图像,该待处理图像为待处理视频中的一帧图像;对待处理图像进行前后景分割,得到第一后景图像和第一前景图像;对第一前景图像进行防抖处理,得到第一前景增稳图像;对第一后景图像进行防抖处理,得到第一后景增稳图像;将第一前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第一增稳图像。
[0007] 本申请实施例通过对视频图像进行前后景分割,得到前景图像和后景图像,再分别对前景图像和后景图像进行防抖处理,即前景和后景的防抖处理过程是分离的,不耦合的,进而不用牺牲背景防抖能力,也能实现前景和后景的同时稳像。
[0008] 在第一方面的一些可能的实现方式中,对第一前景图像进行防抖处理,得到第一前景增稳图像的过程可以包括:提取第一前景图像的特征点;根据第一前景图像的特征点和第二前景图像的特征点,得到第一运动轨迹曲线,第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和待处理图像在图像序列上是连续的图像帧;根据待处理图像的前景防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线;根据第二运动轨迹曲线和第一前景图像,得到增稳后的第一前景图像;对增稳后的第一前景图像进行边缘补偿,得到第一前景增稳图像。
[0009] 增稳后的第一前景图像中,图像边缘会有无意义的像素点生成,进而不利于前后景融合,而该实现方式中,通过对增稳后的第一前景图像进行边缘补偿,使得第一前景增稳图像中不包含黑边,进一步提高后续图像融合得到的视频图像效果。
[0010] 在第一方面的一些可能的实现方式中,对所述增稳后的第一前景图像进行边缘补偿,得到所述第一前景增稳图像的过程可以包括:
[0011] 通过 计算增稳后的第一前景图像中每个待补偿像素点的目标像素值;
[0012] 将目标像素值作为待补偿像素点的像素值,其它像素点的像素值不变,得到第一前景增稳图像,其它像素点为增稳后的第一前景图像中,除了待补偿像素点之外的像素点;
[0013] 其中, V(q)为q点的目标像素值,q点为待补偿像素点;P(i,j)为第i行第j列的像素点的像素值,w(i,j)为第i行第j列的像素点的高斯权重,σ为超参数,N为正整数。
[0014] 在该实现方式中,通过高斯权重插值修补图像的边缘黑边。
[0015] 在第一方面的一些可能的实现方式中,该方法还包括:提取待处理图像的第一边缘带信息,第一边缘带信息为待处理图像中,前景和后景之间的边缘带的像素信息;提取第一增稳图像的第二边缘带信息,第一边缘带信息为第一增稳图像中,前景和后景之间的边缘带的像素信息;根据第一边缘带信息和第二边缘带信息,对下一帧待处理图像或者待处理图像的防抖强度进行调整,防抖强度包括前景防抖强度和/或后景防抖强度。
[0016] 在该实现方式中,根据原图像(即待处理图像)的边缘带信息和融合图像(即第一增稳图像)的边缘带信息,调整防抖强度,进而自动调节前后景融合时产生的伪像强度,以尽可能地防止过度防抖导致融合时产生明显的隔离带,确保前后景融合边缘处自然过渡。
[0017] 在第一方面的一些可能的实现方式中,可以根据结构性相似度指标(Structural SIMilarity,SSIM),来调节防抖强度。即根据第一边缘带信息和第二边缘带信息,对下一帧待处理图像或者待处理图像的防抖强度进行调整的过程可以包括:确定第一边缘带信息和第二边缘带信息之间的第一结构性相似度指标;若第一结构性相似度指标未落入预设相似度阈值区间,对下一帧待处理图像或者待处理图像的防抖强度进行调整。若第一结构性相似度指标未落入预设相似度阈值区间,则不用对防抖强度进行调整。
[0018] 在第一方面的一些可能的实现方式中,若第一结构性相似度指标未落入预设相似度阈值区间,对下一帧待处理图像或者待处理图像的防抖强度进行调整的过程可以包括:若第一结构性相似度指标未落入预设相似度阈值区间,将待处理图像的防抖强度和预设数值相乘,得到调整后的第一防抖强度,将调整后的第一防抖强度作为下一帧待处理图像的防抖强度或者待处理图像的防抖强度。
[0019] 进一步地,第一结构性相似度指标未落入预设相似度阈值区间可以分为两种情况,一种情况为:第一结构性相似度指标高于预设相似度阈值区间,即第一结构性相似度指标大于预设相似度阈值区间的最大值,此时,则可以减小防抖强度。另一种情况为:第一结构性相似度指标低于预设相似度阈值区间,即第一结构性相似度指标小于预设相似度阈值区间的最小值,此时,则可以增大防抖强度。
[0020] 示例性的,当需要减小防抖强度时,预设数值为0.9,即待处理图像的防抖强度和0.9相乘,得到的乘积作为调整后的第一防抖强度。当需要增大防抖强度时,预设数值为
1.1,即待处理图像的防抖强度和1.1相乘,得到的乘积作为调整后的第一防抖强度。
[0021] 调整后的第一防抖强度可以作为下一帧图像的前景防抖强度,和/或下一帧图像的后景防抖强度,此时,可以使用调整后的第一防抖强度,对下一帧待处理图像进行前景防抖或者后景防抖。当然,调整后的第一防抖强度也可以作为待处理图像的前景防抖强度和/或后景防抖强度,此时,则根据调整后的第一防抖强度,重新进行前景防抖,或者后景防抖,直到结构性相似度指标落入预设相似度阈值区间。故在第一方面的一些可能的实现方式中,调整后的第一防抖强度包括待处理图像的前景防抖强度;该方法还可以包括:
[0022] 根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线,第一运动轨迹曲线为根据第一前景图像的特征点和第二前景图像的特征点得到的运动轨迹曲线,第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和待处理图像在图像序列上是连续的图像帧;
[0023] 根据第三运动轨迹曲线和第一前景图像,得到第二前景增稳图像;
[0024] 将第二前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第二增稳图像;
[0025] 确定第二边缘带信息和第三边缘带信息之间的第二结构性相似度指标,第三边缘带信息为第二增稳图像中,前景和后景之间的边缘带的像素信息;
[0026] 若第二结构性相似度指标未落入预设相似度阈值区间,将调整后的第一防抖强度和预设数值相乘,得到调整后的第二防抖强度;
[0027] 将调整后的第二防抖强度作为调整后的第一防抖强度,返回根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线的步骤,直到第二结构性相似度指标落入预设相似度阈值区间。
[0028] 在第一方面的一些可能的实现方式中,对第一后景图像进行防抖处理,得到第一后景增稳图像的过程可以包括:提取第一后景图像的特征点;根据第一后景图像的特征点和第二后景图像的特征点,得到第四运动轨迹曲线,第二后景图像为第二目标图像的后景图像,待处理视频包括第二目标图像,且第二目标图像和待处理图像在图像序列上是连续的图像帧;根据待处理图像的后景防抖强度,对第四运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线;根据第二运动轨迹曲线和第一前景图像,得到第一前景增稳图像。
[0029] 第二方面,本申请实施例提供一种视频防抖装置,应用于终端设备,该装置可以包括:
[0030] 图像获取模块,用于获取待处理图像,待处理图像为待处理视频中的一帧图像;
[0031] 前后景分割模块,用于对待处理图像进行前后景分割,得到第一后景图像和第一前景图像;
[0032] 前景防抖模块,用于对第一前景图像进行防抖处理,得到第一前景增稳图像;
[0033] 后景防抖模块,用于对第一后景图像进行防抖处理,得到第一后景增稳图像;
[0034] 图像融合模块,用于将第一前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第一增稳图像。
[0035] 在第二方面的一些可能的实现方式中,前景防抖模块具体用于:提取第一前景图像的特征点;根据第一前景图像的特征点和第二前景图像的特征点,得到第一运动轨迹曲线,第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和待处理图像在图像序列上是连续的图像帧;根据待处理图像的前景防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线;根据第二运动轨迹曲线和第一前景图像,得到增稳后的第一前景图像;对增稳后的第一前景图像进行边缘补偿,得到第一前景增稳图像。
[0036] 在第二方面的一些可能的实现方式中,前景防抖模块具体用于:通过计算增稳后的第一前景图像中每个待补偿像素点的目标像素值;
[0037] 将目标像素值作为待补偿像素点的像素值,其它像素点的像素值不变,得到第一前景增稳图像,其它像素点为增稳后的第一前景图像中,除了待补偿像素点之外的像素点;其中, V(q)为q点的目标像素值,q点为待补偿像素点;P(i,j)为第
i行第j列的像素点的像素值,w(i,j)为第i行第j列的像素点的高斯权重,σ为超参数,N为正整数。
[0038] 在第二方面的一些可能的实现方式中,该装置还包括:防抖强度调整模块,用于提取待处理图像的第一边缘带信息,第一边缘带信息为待处理图像中,前景和后景之间的边缘带的像素信息;提取第一增稳图像的第二边缘带信息,第二边缘带信息为第一增稳图像中,前景和后景之间的边缘带的像素信息;根据第一边缘带信息和第二边缘带信息,对下一帧待处理图像或者待处理图像的防抖强度进行调整,防抖强度包括前景防抖强度和/或后景防抖强度。
[0039] 在第二方面的一些可能的实现方式中,防抖强度调整模块具体用于:确定第一边缘带信息和第二边缘带信息之间的第一结构性相似度指标;若第一结构性相似度指标未落入预设相似度阈值区间,对下一帧待处理图像或者待处理图像的防抖强度进行调整。
[0040] 在第二方面的一些可能的实现方式中,防抖强度调整模块具体用于:若第一结构性相似度指标未落入预设相似度阈值区间,将待处理图像的防抖强度和预设数值相乘,得到调整后的第一防抖强度,将调整后的第一防抖强度作为下一帧待处理图像的防抖强度或者待处理图像的防抖强度。
[0041] 在第二方面的一些可能的实现方式中,调整后的第一防抖强度包括待处理图像的前景防抖强度;装置还包括当前帧防抖结果调整模块,用于:根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线,第一运动轨迹曲线为根据第一前景图像的特征点和第二前景图像的特征点得到的运动轨迹曲线,第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和待处理图像在图像序列上是连续的图像帧;根据第三运动轨迹曲线和第一前景图像,得到第二前景增稳图像;将第二前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第二增稳图像;确定第二边缘带信息和第三边缘带信息之间的第二结构性相似度指标,第三边缘带信息为第二增稳图像中,前景和后景之间的边缘带的像素信息;若第二结构性相似度指标未落入预设相似度阈值区间,将调整后的第一防抖强度和预设数值相乘,得到调整后的第二防抖强度;将调整后的第二防抖强度作为调整后的第一防抖强度,返回根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线的步骤,直到第二结构性相似度指标落入预设相似度阈值区间。
[0042] 在第二方面的一些可能的实现方式中,后景防抖模块具体用于:提取第一后景图像的特征点;根据第一后景图像的特征点和第二后景图像的特征点,得到第四运动轨迹曲线,第二后景图像为第二目标图像的后景图像,待处理视频包括第二目标图像,且第二目标图像和待处理图像在图像序列上是连续的图像帧;根据待处理图像的后景防抖强度,对第四运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线;根据第二运动轨迹曲线和第一前景图像,得到第一前景增稳图像。
[0043] 上述视频防抖装置具有实现上述第一方面的视频防抖方法的功能,该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现,硬件或软件包括一个或多个与上述功能相对应的模块,模块可以是软件和/或硬件。
[0044] 第三方面,本申请实施例提供一种终端设备,包括存储器、处理器以及存储在存储器中并可在所述处理器上运行的计算机程序,该处理器执行计算机程序时实现如上述第一方面任一项所述的视频防抖方法。
[0045] 第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面任一项的视频防抖方法。
[0046] 第五方面,本申请实施例提供一种芯片系统,该芯片系统包括处理器,该处理器与存储器耦合,该处理器执行存储器中存储的计算机程序,以实现如上述第一方面任一项的视频防抖方法。该芯片系统可以为单个芯片,或者多个芯片组成的芯片模组。
[0047] 第六方面,本申请实施例提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面任一项所述的视频防抖方法。
[0048] 可以理解的是,上述第二方面至第六方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。

附图说明

[0049] 图1为本申请实施例提供的终端设备100的结构示意图;
[0050] 图2为本申请实施例的终端设备100的软件结构示意框图;
[0051] 图3为本申请实施例提供的手机录像界面示意图;
[0052] 图4为本申请实施例提供的视频防抖过程示意框图;
[0053] 图5为本申请实施例提供的视频图像帧的防抖处理过程示意图;
[0054] 图6为本申请实施例提供的视频防抖过程的另一种示意框图;
[0055] 图7为本申请实施例提供的视频防抖过程的又一种示意图;
[0056] 图8为本申请实施例提供的视频防抖过程的又一种示意图;
[0057] 图9为本申请实施例提供的后景防抖过程示意图;
[0058] 图10为本申请实施例提供的视频防抖过程的一种具体流程示意图;
[0059] 图11为本申请实施例提供的视频防抖过程的另一种具体流程示意图;
[0060] 图12为本申请实施例提供的边缘补偿示意图;
[0061] 图13为本申请实施例提供的视频防抖过程的又一种具体流程示意图;
[0062] 图14为本申请实施例提供的视频防抖过程的又一种具体流程示意图;
[0063] 图15为本申请实施例提供的视频防抖过程的又一种具体流程示意图;
[0064] 图16为本申请实施例提供的视频防抖方法的流程示意框图;
[0065] 图17为本申请实施例提供的视频防抖装置的示意框图。

具体实施方式

[0066] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。
[0067] 下面首先对本申请实施例提供的终端设备进行示例性介绍。
[0068] 本申请实施例提供的视频防抖方案可以应用于终端设备,该终端设备可以是具备图像拍摄功能,且具备数据处理能力的终端设备,这类终端设备一般可以包括摄像头,通过该摄像头,终端设备可以拍摄得到视频图像;当然,该终端设备也可以是不具备图像拍摄功能,但具备数据处理能力的终端设备,这种情况下,终端设备可以接收其它设备拍摄的视频图像。
[0069] 该终端设备可以是手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra‑mobile personal computer,UMPC)、上网本、以及个人数字助理(personal digital assistant,PDA)等终端设备,本申请实施例对终端设备的具体类型不作任何限制。
[0070] 示例性的,参见图1示出本申请实施例提供的终端设备100的结构示意图。
[0071] 如图1所示,终端设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器
170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器
192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
[0072] 可以理解的是,本申请实施例示意的结构并不构成对终端设备100的具体限定。在本申请的另一些实施例中,终端设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
[0073] 处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processing unit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural‑network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
[0074] 控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
[0075] 处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
[0076] 在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter‑integrated circuit,I2C)接口,集成电路内置音频(inter‑integrated circuit sound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general‑purpose input/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
[0077] I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现终端设备100的触摸功能。
[0078] I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
[0079] PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
[0080] UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
[0081] MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(display serial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现终端设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现终端设备100的显示功能。
[0082] GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
[0083] USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备100充电,也可以用于终端设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他终端设备,例如AR设备等。
[0084] 可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端设备100的结构限定。在本申请另一些实施例中,终端设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
[0085] 充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过终端设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为终端设备供电。
[0086] 电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
[0087] 终端设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
[0088] 天线1和天线2用于发射和接收电磁波信号。终端设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
[0089] 移动通信模块150可以提供应用在终端设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
[0090] 调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
[0091] 无线通信模块160可以提供应用在终端设备100上的包括无线局域网(wireless local area networks,WLAN)(如无线保真(wireless fidelity,Wi‑Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
[0092] 在一些实施例中,终端设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(code division multiple access,CDMA),宽带码分多址(wideband code division multiple access,WCDMA),时分码分多址(time‑division code division multiple access,TD‑SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidou navigation satellite system,BDS),准天顶卫星系统(quasi‑zenith satellite system,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
[0093] 终端设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
[0094] 显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light‑emitting diode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active‑matrix organic light emitting diode的,AMOLED),柔性发光二极管(flex light‑emitting diode,FLED),Miniled,MicroLed,Micro‑oLed,量子点发光二极管(quantum dot light emitting diodes,QLED)等。在一些实施例中,终端设备100可以包括1个或N个显示屏194,N为大于1的正整数。
[0095] 终端设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
[0096] ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
[0097] 摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal‑oxide‑semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,终端设备100可以包括1个或N个摄像头193,N为大于1的正整数。
[0098] 数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
[0099] 视频编解码器用于对数字视频压缩或解压缩。终端设备100可以支持一种或多种视频编解码器。这样,终端设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
[0100] NPU为神经网络(neural‑network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现终端设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
[0101] 外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
[0102] 内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储终端设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行终端设备100的各种功能应用以及数据处理。
[0103] 终端设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
[0104] 音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
[0105] 扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备100可以通过扬声器170A收听音乐,或收听免提通话。
[0106] 受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
[0107] 麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。终端设备100可以设置至少一个麦克风170C。在另一些实施例中,终端设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,终端设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
[0108] 耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
[0109] 压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。终端设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,终端设备100根据压力传感器180A检测所述触摸操作强度。终端设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
[0110] 陀螺仪传感器180B可以用于确定终端设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定终端设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门或者按下录像按钮,陀螺仪传感器180B检测终端设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消终端设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
[0111] 气压传感器180C用于测量气压。在一些实施例中,终端设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
[0112] 磁传感器180D包括霍尔传感器。终端设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当终端设备100是翻盖机时,终端设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
[0113] 加速度传感器180E可检测终端设备100在各个方向上(一般为三轴)加速度的大小。当终端设备100静止时可检测出重力的大小及方向。还可以用于识别终端设备姿态,应用于横竖屏切换,计步器等应用。
[0114] 距离传感器180F,用于测量距离。终端设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,终端设备100可以利用距离传感器180F测距以实现快速对焦。
[0115] 接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。终端设备100通过发光二极管向外发射红外光。终端设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定终端设备100附近有物体。当检测到不充分的反射光时,终端设备100可以确定终端设备
100附近没有物体。终端设备100可以利用接近光传感器180G检测用户手持终端设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
[0116] 环境光传感器180L用于感知环境光亮度。终端设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测终端设备100是否在口袋里,以防误触。
[0117] 指纹传感器180H用于采集指纹。终端设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
[0118] 温度传感器180J用于检测温度。在一些实施例中,终端设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,终端设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,终端设备100对电池142加热,以避免低温导致终端设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,终端设备100对电池
142的输出电压执行升压,以避免低温导致的异常关机。
[0119] 触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端设备100的表面,与显示屏194所处的位置不同。
[0120] 骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
[0121] 按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备100可以接收按键输入,产生与终端设备100的用户设置以及功能控制有关的键信号输入。
[0122] 马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
[0123] 指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
[0124] SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和终端设备100的接触和分离。终端设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,终端设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在终端设备100中,不能和终端设备100分离。
[0125] 终端设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明终端设备100的软件结构。
[0126] 图2是本申请实施例的终端设备100的软件结构示意框图。
[0127] 分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
[0128] 应用程序层可以包括一系列应用程序包。
[0129] 如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
[0130] 应用程序框架层为应用程序层的应用程序提供应用编程接口(application programming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
[0131] 如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
[0132] 窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
[0133] 内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
[0134] 视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
[0135] 电话管理器用于提供终端设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
[0136] 资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
[0137] 通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,终端设备振动,指示灯闪烁等。
[0138] Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
[0139] 核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
[0140] 应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
[0141] 系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
[0142] 表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
[0143] 媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
[0144] 三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
[0145] 2D图形引擎是2D绘图的绘图引擎。
[0146] 内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
[0147] 下面结合捕获拍照场景,示例性说明终端设备100软件以及硬件的工作流程。
[0148] 参见图3示出的本申请实施例提供的手机录像界面示意图,终端设备100的触摸传感器180K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件31为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过摄像头193捕获静态图像或视频。
[0149] 当终端设备100接收到用户针对控件32的触摸操作时,终端设备100响应于该触摸操作,进行录像,终端设备100将捕获到视频图像通过显示屏194显示视频图像33。当然,终端设备100在捕获视频图像的时候,也可以通过陀螺仪传感器180B采集视频图像的背景运动信息。
[0150] 终端设备100捕获到视频图像之后,可以对每一帧视频图像均采用本申请实施例提供的视频防抖方法进行防抖处理,防抖处理之后,得到前景和后景同时稳像的视频。下面将对本申请实施例提供的视频防抖过程进行介绍说明。
[0151] 参见图4示出的本申请实施例提供的视频防抖过程示意框图,如图4所示,首先,终端设备100获取到输入视频,该输入视频可以是终端设备100响应于用户的录像操作,通过摄像头193捕获的视频,此时,该摄像头193可以是前置摄像头,也可以是后置摄像头,即终端设备100可以对前置摄像头拍摄的视频进行防抖处理,也可以对后置摄像头拍摄的视频进行防抖处理。该输入视频包括多帧图像。
[0152] 当然,在其它一些实施例中,终端设备100也可以通过接收其它设备已拍摄好的视频,以获取到输入视频。例如,终端设备100接收其它一台手机已拍摄好的视频。
[0153] 终端设备100针对输入视频中的每一帧图像,进行图像前后景分割,得到前景图像和后景图像。然后,终端设备100对前景图像进行防抖处理,得到防抖后的前景图像;对后景图像进行防抖处理,得到防抖后的后景图像。最后,将防抖后的前景图像和防抖后的后景图像进行图像融合,得到防抖后的图像。
[0154] 示例性地,参见图5,为本申请实施例提供的视频图像帧的防抖处理过程示意图。如图5所示,终端设备100所获取到输入视频中的某一帧图像为图像51,将图像51进行前后景分割操作之后,得到前景图像52和后景图像53。针对前景图像52,先进行特征提取,然后经过防抖模块54,得到防抖后的前景图像。针对后景图像53,经过防抖模块55后,得到防抖后的后景图像56。将防抖后的后景图像56和防抖后的前景图像进行图像融合,输出视频图像57,视频图像57是指前后景同时稳像的图像。
[0155] 终端设备100针对每一帧输入的视频图像均进行防抖处理,得到一帧帧防抖后的图像。一帧帧防抖后的图像组成视频,得到前后景同时稳像的视频。
[0156] 在一些实施例中,在获取到防抖后的视频图像之后,终端设备100还可以根据输入视频图像的边缘带信息和输出视频图像的边缘带信息,对防抖强度进行调节。其中,输入视频图像的边缘带信息可以是指在前后景分割时,提取出的边缘带的像素信息,而输出视频图像的边缘带信息可以是指图像融合后的图像中,前景和后景之间的边缘带的像素信息。边缘带可以是指图像中前景和后景之间的边缘部分。
[0157] 参见图6,为本申请实施例提供的视频防抖过程的另一种示意框图。如图6所示,与图4类似的是,终端设备100首先获取输入视频;然后,针对每一帧视频图像,进行前后景分割,得到前景图像和后景图像;接着,对后景图像进行后景防抖处理,得到防抖后的后景图像。对前景图像进行防抖处理,得到防抖后的前景图像;最后,将防抖后的后景图像和防抖后的前景图像进行图像融合,得到防抖后的视频图像。
[0158] 与图4不同的是,图6在前后景分割时,还可以提取出待处理图像的前后景之间的边缘带的像素信息,记为第一边缘带信息。另外,还可以从防抖后的视频图像(即融合得到的图像)中,提取前后景之间的边缘带的像素信息,记为第二边缘带信息。根据第一边缘带信息和第二边缘带信息,对防抖范围约束进行反馈控制,即对防抖强度的大小进行调整。防抖范围可以是指防抖强度的大小。防抖强度可以包括前景防抖强度和后景防抖强度,即可以根据第一边缘带信息和第二边缘带信息,对前景防抖强度和后景防抖强度进行调整。
[0159] 在其它一些实施例中,根据第一边缘带信息和第二边缘带信息,对前景防抖强度或后景防抖强度进行调整。参见图7和图8,均为本申请实施例提供的视频防抖过程的又一种示意图。在图7中,根据第一边缘带信息和第二边缘带信息,对前景防抖强度进行调整。调整后的前景防抖强度,作用于前景防抖过程。在图8中,根据第一边缘带信息和第二边缘带信息,对后景防抖强度进行调整,调整后的后景防抖强度作用与后景防抖过程。
[0160] 此时,图7中还示例性地示出了前景防抖的方式是全帧防抖。示例性地,该全帧防抖过程可以包括前景图像特征点提取、路径平滑和边缘补偿等过程。其中,前景图像的特征点提取方法可以是任意的,例如,通过光流法对前景图像进行特征点提取。路径平滑是指根据防抖强度,对前景特征点的运动轨迹曲线进行路径平滑。边缘补偿可以是指对图像边缘部分进行像素补偿,通过边缘补偿,可以消除或减少防抖处理后的前景图像的边缘黑边,更利于后续前景图像和后景图像的融合。边缘补偿的方式可以是任意的,例如,通过高斯权重插值来修补图像边缘黑边。
[0161] 值得指出的是,前景图像的防抖方法和后景图像的防抖方法均可以是任意的,即可以采用任意的视频防抖方法,对前景图像和后景图像进行防抖处理。例如,对于后景图像,可以使用陀螺仪传感器数据进行防抖处理。具体地,终端设备100录像时,可以读取陀螺仪传感器180B输出的数据,并对陀螺仪数据进行角度积分,得到视频图像的背景运动信息。然后再根据背景运动信息,对后景图像进行消抖补偿,以实现后景稳像,即对后景进行防抖处理。参见图9示出的后景防抖过程示意图,对陀螺仪输出的数据进行3维旋转矢量估计,3维旋转矢量平滑,运动补偿量,以及图像仿射变换(Warp)输出等过程,得到防抖后的后景图像。在该过程中,后景防抖强度可以作用于3维旋转矢量平滑过程。
[0162] 为了更好地介绍本申请实施例提供的视频防抖方案,下面将结合图10进行介绍说明。
[0163] 参见图10,为本申请实施例提供的视频防抖过程的一种具体流程示意图。如图10所示,针对前景图像,采用全帧稳像(或称全帧防抖)方式进行防抖处理,得到增稳前景图像(即防抖后的前景图像)。其中,图10中的全帧稳像过程包括前景图像特征点提取,路径平滑,边缘补偿等过程。具体地,可以对多帧前景图像的特征点进行提取,根据多帧前景图像的特征点,得到前景特征点的运动轨迹曲线(或称前景特征点路径)。该多帧前景图像是连续多帧图像的前景图像。例如,终端设备100对当前帧图像进行前后景分割,得到当前帧的前景图像和后景图像。当前时刻,终端设备100缓存有10帧连续的图像,该10帧连续的图像中包括当前帧图像,以当前帧图像为界限,往前和往后分别取n帧图像,获得取出来的连续的多帧图像的前景图像;再分别提取这多张前景图像的特征点;根据多张前景图像的特征点,得到前景特征点路径。
[0164] 得到前景特征点路径之后,使用当前帧图像的前景防抖强度,对前景特征点路径进行路径平滑,得到平滑后的前景特征点路径。然后,再根据路径平滑后的前景特征点路径和当前帧的前景图像,得到增稳前景图像。
[0165] 针对后景图像,使用当前帧图像的后景防抖强度,进行路径平滑,得到增稳后景图像(即防抖后的后景图像)。其中,可以通过特征点提取的方式,得到后景图像特征点的运动轨迹曲线。例如,提取当前帧的后景图像的特征点,依赖于在图像序列上连续的多帧后景图像的特征点,得到后景图像的特征点路径,再使用后景图像的抖动强度,对该后景图像的特征点路径进行路径平滑。当然,后景图像的运动轨迹曲线还可以通过其它方式得到,例如,可以通过陀螺仪数据得到后景图像的运动轨迹曲线。
[0166] 在视频图像前后景分割时,可以提取出边缘带的像素信息,得到第一边缘带信息。而通过将增稳前景图像和增稳后景图像进行图像融合,得到前后景同时稳像的视频图像。
同时,还可以提取出融合得到的视频图像中的边缘带的像素信息,得到第二边缘带信息。
[0167] 计算第一边缘带信息和第二边缘带信息之间的相似度,以通过相似度高低,评价输入视频图像的前后景边缘部分和融合得到视频图像的前后景边缘部分之间的差异,根据差异大小,调节当前帧图像的防抖强度或者下一帧图像的防抖强度。
[0168] 具体应用中,通过计算第一边缘带信息和第二边缘带信息之间的结构性相似度指标,再根据结构性相似度指标,对防抖强度进行调整或调节。具体来说,在计算出结构性相似度指标之后,可以判断该结构性相似度指标是否落入预设相似度阈值区间。如果没有落入,且结构性相似度指标大于预设相似度阈值区间的最大值,则减小防抖强度,直到结构性相似度指标落入该预设相似度阈值区间;如果没有落入,且结构性相似度指标小于预设相似度阈值区间的最小值,则增大防抖强度,直到结构性相似度指标落入该预设相似度阈值区间。
[0169] 其中,实现增大或减小防抖强度的方式可以是任意的。在一些实施例中,可以将当前的防抖强度乘以对应系数,以增大或减小防抖强度。一般情况下,需要增大防抖强度时,对应系数大于1,需要减小防抖强度时,对应系数小于1。例如,当前的防抖强度为A,需要增大防抖强度时,则将当前的防抖强度A乘以1.1,将得到的乘积作为调整后的防抖强度;需要减小防抖强度时,则将当前的防抖强度A乘以0.9,将得到的乘积作为调整后的防抖强度。
[0170] 在图10中,示出了防抖强度调节后,可以作用于前景防抖过程中的路径平滑,以及后景防抖过程中的路径平滑。实际应用中,调整后的防抖强度可以包括当前帧图像的前景防抖强度和/或后景防抖强度,或者下一帧图像的前景防抖强度和/或后景防抖强度,相应地,调整后的防抖强度可以作用于当前帧图像的前景防抖过程和/后景防抖过程,或者,作用于下一帧图像的前景防抖过程和/或后景防抖过程。下面将结合附图对各种情况进行介绍说明。
[0171] 参见图11,为本申请实施例提供的视频防抖过程的另一种具体流程示意图。如图11所示,使用深度神经网络模型(Deep Neural Networks,DNN)对输入视频图像进行前后景分割,使用光流法提取前景图像的特征点,使用高斯权重插值修补边缘黑边,以对图像进行边缘补充。另外,计算两个边缘带信息之间的结构性相似度指标,根据结构性相似度指标对下一帧图像的前景防抖强度进行调节,即使用调节后的前景防抖强度作用于下一帧图像的前景特征点路径平滑过程。
[0172] 可以理解的是,图11中示出的前后景分割方式、前景图像特征点提取方式和边缘补偿方式,均是一种示例方式。下面结合图12示出的边缘补偿示意图,对高斯权重边缘补偿方式进行介绍。
[0173] 如图12所示,增稳后的前景图像中,边缘121为有意义像素点和无意义像素点之间的界线,即以边缘121为分界线,图12左边的像素点为有意义像素点,右边的像素点为无意义像素点。无意义像素点可以是指形成边缘黑边的像素点。对前景图像进行防抖处理后,边缘会生成无意义像素点,无意义像素点不利于前后景融合。为了进一步提高融合后的视频图像的效果,可以对无意义像素点进行边缘补偿,即对图像边缘部分进行像素补偿。
[0174] 图12中的q点为无意义像素点,需要对q点进行像素补充。该q点的像素值可以由周围的像素点,根据高斯权重叠加计算得到。以图12中的区域122作为q点的周围区域,根据区域122中的各个像素点的像素值,得到q点的像素值。具体地,通过 计算q点的像素值。
[0175] 其中, V(q)为q点的像素值,P(i,j)为第i行第j列的像素点的像素值,w(i,j)为第i行第j列的像素点的高斯权重,σ为超参数,N为正整数。
[0176] 依此遍历每个无意义像素点,计算出每个无意义像素点的像素值,将所计算出来的像素值作为无意义像素点的像素值,有意义像素点的像素值不变,即可得到边缘补偿后的增稳前景图像。
[0177] 在图12中,计算出结构性相似度指标之后,确定该结构性相似度指标是否落入预设相似度阈值区间。如果没有落入,则对前景防抖强度进行调节,直到结构性相似度指标落入预设相似度阈值区间。
[0178] 举例来说,当前帧图像的前景防抖强度为A,后景防抖强度为B。根据当前帧图像的前景防抖强度和后景防抖强度,分别对前景图像和后景图像进行防抖处理后,计算得到两个边缘带信息的结构性相似度指标。此时,当前帧图像的结构性相似度指标没有落入预设相似度阈值区间,且该结构性相似度指标高于预设相似度阈值区间的最大值。将当前帧图像的前景防抖强度A乘以0.9,得到调整后的前景防抖强度为0.9A,即下一帧图像的前景防抖强度为0.9A。
[0179] 将当前帧图像的增稳前景图像和增稳后景图像进行图像融合,得到当前帧图像的增稳图像(即防抖后的图像),输出该增稳图像。
[0180] 然后,获取下一帧图像,并对该下一帧图像进行前后景分割,得到前景图像和后景图像。对后景图像进行防抖处理,得到下一帧图像的增稳后景图像,此时,后景防抖强度为B。对前景图像进行防抖处理,得到下一帧图像的增稳前景图像,此时,前景防抖强度为0.9A。接着,再将下一帧图像的增稳后景图像和增稳前景图像进行图像融合,得到下一帧图像的增稳图像,并输出该增稳图像。根据下一帧图像的第一边缘带信息和第二边缘带信息,计算得到下一帧图像的结构性相似度指标。如果下一帧图像的结构性相似度指标落入预设相似度阈值区间,则不对前景防抖强度调节,即下下一帧图像的前景防抖强度为0.9A。如果下一帧图像的结构性相似度指标没有落入预设相似度阈值区间,则基于前景防抖强度为
0.9A,得到下下一帧图像的前景防抖强度。
[0181] 在一些实施例中,还可以根据当前帧图像的结构相似度指标,对下一帧图像的后景防抖强度进行调节,下面结合图13示出的本申请实施例提供的视频防抖过程的又一种具体流程示意图进行介绍说明。
[0182] 如图13所示,针对当前帧图像,计算出边缘带信息之间的结构性相似度指标之后,根据该结构性相似度指标,调节下一帧图像的后景防抖强度,即调整后的后景防抖强度作用于下一帧图像的后景防抖过程。图13和图11类似的部分请参见上文图11的介绍,在此不再赘述。
[0183] 举例来说,当前帧图像的前景防抖强度为A,后景防抖强度为B。根据当前帧图像的前景防抖强度和后景防抖强度,分别对前景图像和后景图像进行防抖处理后,计算得到两个边缘带信息的结构性相似度指标。此时,当前帧图像的结构性相似度指标没有落入预设相似度阈值区间,且该结构性相似度指标高于预设相似度阈值区间的最大值。将当前帧图像的后景防抖强度B乘以0.8,得到调整后的后景防抖强度为0.8B,即下一帧图像的后景防抖强度为0.8B。
[0184] 将当前帧图像的增稳前景图像和增稳后景图像进行图像融合,得到当前帧图像的增稳图像(即防抖后的图像),输出该增稳图像。
[0185] 然后,获取下一帧图像,并对该下一帧图像进行前后景分割,得到前景图像和后景图像。对后景图像进行防抖处理,得到下一帧图像的增稳后景图像,此时,后景防抖强度为0.8B。对前景图像进行防抖处理,得到下一帧图像的增稳前景图像,此时,前景防抖强度为A。接着,再将下一帧图像的增稳后景图像和增稳前景图像进行图像融合,得到下一帧图像的增稳图像,并输出该增稳图像。根据下一帧图像的第一边缘带信息和第二边缘带信息,计算得到下一帧图像的结构性相似度指标。如果下一帧图像的结构性相似度指标落入预设相似度阈值区间,则不对后景防抖强度调节,即下下一帧图像的后景防抖强度为0.8B。如果下一帧图像的结构性相似度指标没有落入预设相似度阈值区间,则基于后景防抖强度为
0.8B,得到下下一帧图像的后景防抖强度。
[0186] 在一些实施例中,还可以根据当前帧图像的结构相似度指标,同时对下一帧图像的后景防抖强度和前景防抖强度进行调节,下面结合图14示出的本申请实施例提供的视频防抖过程的又一种具体流程示意图进行介绍说明。
[0187] 如图14所示,针对当前帧图像,据该结构性相似度指标,调节下一帧图像的后景防抖强度和前景防抖强度,即调整后的后景防抖强度作用于下一帧图像的后景防抖过程,调整后的前景防抖强度作用于下一帧图像的前景防抖过程。
[0188] 举例来说,当前帧图像的前景防抖强度为A,后景防抖强度为B。根据当前帧图像的前景防抖强度和后景防抖强度,分别对前景图像和后景图像进行防抖处理后,计算得到两个边缘带信息的结构性相似度指标。此时,当前帧图像的结构性相似度指标没有落入预设相似度阈值区间,且该结构性相似度指标高于预设相似度阈值区间的最大值。将当前帧图像的后景防抖强度B乘以0.8,得到调整后的后景防抖强度为0.8B,即下一帧图像的后景防抖强度为0.8B。将当前帧图像的前景防抖强度A乘以0.9,得到调整后的前景防抖强度为0.9A,即下一帧图像的前景防抖强度为0.9A。
[0189] 将当前帧图像的增稳前景图像和增稳后景图像进行图像融合,得到当前帧图像的增稳图像(即防抖后的图像),输出该增稳图像。
[0190] 然后,获取下一帧图像,并对该下一帧图像进行前后景分割,得到前景图像和后景图像。对后景图像进行防抖处理,得到下一帧图像的增稳后景图像,此时,后景防抖强度为0.8B。对前景图像进行防抖处理,得到下一帧图像的增稳前景图像,此时,前景防抖强度为
0.9A。接着,再将下一帧图像的增稳后景图像和增稳前景图像进行图像融合,得到下一帧图像的增稳图像,并输出该增稳图像。根据下一帧图像的第一边缘带信息和第二边缘带信息,计算得到下一帧图像的结构性相似度指标。如果下一帧图像的结构性相似度指标落入预设相似度阈值区间,则不对后景防抖强度调节,即下下一帧图像的后景防抖强度为0.8B,前景防抖强度仍然为0.9A。如果下一帧图像的结构性相似度指标没有落入预设相似度阈值区间,则基于后景防抖强度0.8B和前景防抖强度0.9A,分别进行调整,得到下下一帧图像的后景防抖强度和后景防抖强度。
[0191] 在一些实施例中,还可以对当前帧图像的前景防抖强度和/或后景防抖强度,具体可以参见图15示出的本申请实施例提供的视频防抖过程的又一种具体流程示意图。图15和图11的类似部分在此不再赘述。
[0192] 当根据当前帧图像的结构性相似度指标,对当前帧图像的防抖强度进行调整时,如果当前帧图像的结构性相似度指标没有落入预设相似度阈值区间内,则不输出融合得到的视频图像,而是调整前景防抖强度和/或后景防抖强度,直到当前帧图像的结构相似度指标落入预设相似度阈值区间内时,才输出融合得到的视频图像。
[0193] 举例来说,此时,对当前帧图像的前景防抖强度进行调节。第一次计算中,当前帧图像的前景防抖强度为A,后景防抖强度为B。
[0194] 根据当前帧图像的前景防抖强度和后景防抖强度,分别对前景图像和后景图像进行防抖处理后,计算得到两个边缘带信息的结构性相似度指标。此时,当前帧图像的结构性相似度指标没有落入预设相似度阈值区间,且该结构性相似度指标高于预设相似度阈值区间的最大值。将当前帧图像的前景防抖强度A乘以0.9,得到调整后的前景防抖强度为0.9A,即下一次的前景防抖过程的前景防抖强度为0.9A。
[0195] 将当前帧图像的增稳前景图像和增稳后景图像进行图像融合,得到第一次计算的增稳图像(即防抖后的图像),不输出该增稳图像。
[0196] 然后,使用调整后的前景防抖强度进行第二次计算,第二次计算可以不用再次重复第一次计算过程中的一些步骤。此时,可以使用调整后的前景防抖强度,再次对前景图像进行防抖处理。即使用调整后的防抖强度对前景特征点路径进行平滑处理,以得到第二次计算的增稳前景图像。接着,将第二次计算得到增稳前景图像和第一次计算得到的增稳后景图像,得到第二次计算的增稳图像。根据第二次计算的第二边缘带信息和第一次计算得到的第一边缘带信息,计算结构性相似度指标。如果此次的结构性相似度指标落入预设相似度阈值区间,则不对前景防抖强度进行调整,输出第二次计算的增稳图像,即将第二次计算的增稳图像作为当前帧图像的输出视频图像。如果此次的结构性相似度指标没有落入预设相似度阈值区间,则再次对前景防抖强度过程进行调整,使用调整后的前景防抖强度进行第三次计算。依此循环,直到某一次计算的结构性相似度指标落入预设相似度阈值区间,则将该次的增稳图像作为当前帧图像的输出视频图像。
[0197] 又举例来说,此时,对当前帧图像的后景防抖强度进行调节。第一次计算中,当前帧图像的前景防抖强度为A,后景防抖强度为B。第一次计算中,结构性相似度指标没有落入预设相似度阈值区间,将当前帧图像的后景防抖强度B乘以0.8,得到调整后的后景防抖强度为0.8B,即下一次的后景防抖过程的后景防抖强度为0.8B。
[0198] 使用调整后的防抖强度再次作用于后景图像的路径平滑,得到第二次计算的增稳后景图像。使用第二次计算的增稳后景图像和第一次计算的增稳前景图像进行融合,得到第二次计算的增稳图像。计算第二次计算的第二边缘带信息和第一次计算的第一边缘带信息之间的结构性相似度指标。如果第二次计算的结构性相似度指标落入预设相似度阈值区间,则将第二次计算的增稳图像作为当前帧图像的输出视频图像(即防抖处理后的图像)。如果第二次计算的结构性相似度指标没有落入预设相似度阈值区间,则再次对后景防抖强度进行调整,并使用调整后的后景防抖强度进行下一次计算,直到某一次的结构性相似度指标没有落入预设相似度阈值区间。
[0199] 又举例来说,此时,对当前帧图像的后景防抖强度和前景防抖强度进行调节。第一次计算中,当前帧图像的前景防抖强度为A,后景防抖强度为B。第一次计算中,结构性相似度指标没有落入预设相似度阈值区间,将当前帧图像的后景防抖强度B乘以0.8,得到调整后的后景防抖强度为0.8B,即下一次的后景防抖过程的后景防抖强度为0.8B。将当前帧图像的前景防抖强度A乘以0.9,得到调整后的前景防抖强度为0.9A,即下一次的前景防抖过程的前景防抖强度为0.9A。
[0200] 使用调整后的防抖强度进行第二次计算。具体地,使用0.9A对前景图像特征点路径进行路径平滑,得到第二计算的增稳前景图像。使用0.8B对后景图像的运动轨迹曲线进行路径平滑,得到第二次计算的增稳后景图像。将第二计算的增稳前景图像和第二次计算的增稳后景图像进行融合,得到第二次的增稳图像。根据第二次计算的第二边缘带信息和第一次计算的第一边缘带信息,计算第二次的结构相似度指标。如果第二次计算的结构性相似度指标落入预设相似度阈值区间,则将第二次计算的增稳图像作为当前帧图像的输出视频图像(即防抖处理后的图像)。如果第二次计算的结构性相似度指标没有落入预设相似度阈值区间,则再次对防抖强度进行调整,并使用调整后的防抖强度进行下一次计算,直到某一次的结构性相似度指标没有落入预设相似度阈值区间。
[0201] 由上可见,根据相似度指标,调节当前帧图像的前景防抖强度和/或后景防抖强度,或者调节下一帧图像的前景防抖强度和/或后景防抖强度,可以自动调节前后景融合时产生的伪像强度,防止过度防抖导致融合时产生明显的隔离带,让前后景融合边缘处的过渡更加自然。
[0202] 防抖强度可以作用于路径平滑过程。防抖强度越大,曲线平滑强度(或称曲线平滑程度)越大,防抖强度越小,曲线平滑强度越小。
[0203] 具体地,当相似度指标低于预设相似度阈值区间时,增大防抖强度,即增强曲线平滑强度(或称路径平滑强度)。当相似度指标高于预设相似度阈值区间时,则减小防抖强度,即减小曲线平滑强度(或称路径平滑强度)。
[0204] 路径平滑的权重可以根据高斯权重进行调节。由高斯分布可知,高斯权重sigma越大,曲线越平滑。防抖强度可以等同于高斯权重sigma。
[0205] 防抖强度越大,视频防抖效果越好,视频图像边缘无意义像素点越多,视场角越小。反之,防抖强度越小,视频防抖效果越差,视频图像边缘无意义像素点越少,视场角越大。调节防抖强度,使得视场角和无意义像素点达到一个合适的区间。
[0206] 为了更好地介绍视频防抖方案,下面将结合流程图进行介绍说明。
[0207] 参见图16,为本申请实施例提供的视频防抖方法的流程示意框图,该方法可以包括以下步骤:
[0208] 步骤S1601、终端设备获取待处理图像,待处理图像为待处理视频中的一帧图像。
[0209] 具体应用中,终端设备获取待处理图像的方式可以是任意的。例如,参见图3,终端设备为手机100,手机100在接收到用户针对控件32的触发操作时,该触发操作用于指示手机100进行录像,响应于该触发操作,捕获到视频图像,以获取到待处理图像。对该待处理图像进行防抖处理后,再显示在手机100的显示屏上。
[0210] 步骤S1602、终端设备对待处理图像进行前后景分割,得到第一后景图像和第一前景图像。
[0211] 可以理解的是,对一帧图像进行前后景分割的方式是任意的,在此不对前后景分割方式作限定。
[0212] 需要指出的是,本申请实施例的前景图像可以是人脸,也可以不是人脸,例如,前景图像为图5示出的前景。
[0213] 步骤S1603、终端设备对第一前景图像进行防抖处理,得到第一前景增稳图像。
[0214] 其中,第一前景图像的防抖方式可以任意的。而在一些实施例中,为了消除防抖处理后的图像中的边缘黑边,可以使用全帧防抖的方式对前景图像进行防抖处理。具体地,先提取第一前景图像的特征点,再根据第一前景图像的特征点和第二前景图像的特征点,得到第一运动轨迹曲线,该第一运动轨迹曲线可以为前景图像的特征点路径,或者前景图像的抖动轨迹。该第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和所述待处理图像在图像序列上是连续的图像帧。第一目标图像一般是多帧图像。
[0215] 例如,在图像序列上,依据时间先后顺序,分别存在以下图像帧:图像1、图像2、图像3、图像4…图像n,n为正整数。某个时刻,待处理图像为图像5,此时,第一目标图像可以包括图像1、图像2、图像3和图像4,以及图像6,图像7、图像8以及图像9。分别提取图像1、图像2、图像3和图像4,以及图像6,图像7、图像8以及图像9的前景图像,再提取出这些前景图像的特征点。基于待处理图像的前景特征点和第一目标图像的前景特征点,得到前景图像的抖动轨迹。
[0216] 得到第一运动轨迹曲线之后,根据待处理图像的前景防抖强度,对所述第一运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线。再根据第二运动轨迹曲线和所述第一前景图像,得到增稳后的第一前景图像。最后,对增稳后的第一前景图像进行边缘补偿,得到所述第一前景增稳图像。
[0217] 其中,边缘补偿可以使用图12对应的高斯权重插补的方式,具体内容可以参见上文相应内容,在此不再赘述。
[0218] 在另一些实施例中,全帧防抖方式中,也可以不进行边缘补偿。此时,当得到上述的增稳后的第一前景图像后,将该增稳后的第一前景图像作为第一前景增稳图像。
[0219] 步骤S1604、终端设备对第一后景图像进行防抖处理,得到第一后景增稳图像。
[0220] 具体应用中,后景图像的防抖处理方式也是任意的。例如,先提取第一后景图像的特征点。再根据第一后景图像的特征点和第二后景图像的特征点,得到第四运动轨迹曲线。第二后景图像为第二目标图像的后景图像,待处理视频包括第二目标图像,且第二目标图像和待处理图像在图像序列上是连续的图像帧。第二目标图像和上述第一目标图像类似,均是图像序列上连续的多帧图像,在此不再赘述。最后,根据待处理图像的后景防抖强度,对第四运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线。再根据第二运动轨迹曲线和第一前景图像,得到第一前景增稳图像。
[0221] 可以理解的是,步骤S1603和步骤S1604之间的先后顺序可以是任意的,步骤S1603和步骤S1604也可以同时执行,在此不对这两个步骤的执行顺序作限制。
[0222] 步骤S1605、终端设备将第一前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第一增稳图像。
[0223] 需要说明的是,融合得到的第一增稳图像可以作为待处理图像的输出视频图像(即防抖处理后的视频图像)。当然,在其它一些实施例中,如果需要对当前帧图像的防抖强度进行调节,该第一增稳图像可能不是待处理图像的输出视频图像。
[0224] 进一步地,为了防止过渡防抖导致图像融合时产生明显的隔离带,影响用户体验,可以根据相似度指标,来对防抖强度进行调节。
[0225] 具体应用中,可以先提取第一增稳图像的第一边缘带信息,第一边缘带信息为第一增稳图像中,前景和后景之间的边缘带的像素信息。该第一边缘带信息可以是在图像前后景分割过程中提取出的。
[0226] 再提取待处理图像的第二边缘带信息,第二边缘带信息为待处理图像中,前景和后景之间的边缘带的像素信息。该第二边缘带信息可以从融合后的图像中得到。
[0227] 接着,根据第一边缘带信息和第二边缘带信息,对下一帧待处理图像或者待处理图像的防抖强度进行调整,防抖强度包括前景防抖强度和/或后景防抖强度。
[0228] 更具体地,可以通过计算第一边缘带信息和第二边缘带信息之间的第一结构性相似度指标。根据第一结构性相似度指标,来确定是否对防抖强度进行调节。其中,若第一结构性相似度指标未落入预设相似度阈值区间,对下一帧待处理图像或者待处理图像(即当前帧图像)的防抖强度进行调整。具体调整过程可以参见上文的相应内容,在此不再赘述。
[0229] 其中,如果对当前帧图像的前景防抖强度进行调节的过程中,可能进行多次计算。当某次计算的结构性相似度指标落入预设相似度阈值区间时,才将该次对应的增稳图像作为当前帧图像的输出视频图像。
[0230] 具体地,根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线。第一运动轨迹曲线的内容可以参见上文相应内容,在此不再赘述。然后,根据第三运动轨迹曲线和第一前景图像,得到第二前景增稳图像。接着,将第二前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第二增稳图像。确定第二边缘带信息和第三边缘带信息之间的第二结构性相似度指标,第三边缘带信息为第二增稳图像中,前景和后景之间的边缘带的像素信息。
[0231] 若第二结构性相似度指标未落入预设相似度阈值区间,将调整后的第一防抖强度和预设数值相乘,得到调整后的第二防抖强度。将调整后的第二防抖强度作为调整后的第一防抖强度,返回根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线的步骤,直到第二结构性相似度指标落入预设相似度阈值区间。依此循环,直到第二结构性相似度指标落入预设相似度阈值区间,将对应的第二增稳图像作为待处理图像的输出视频图像。
[0232] 对应于上文的方法实施例,本申请实施例提供一种视频防抖装置,应用于终端设备。参见图17示出的本申请实施例提供的视频防抖装置的示意框图,该装置可以包括:
[0233] 图像获取模块171,用于获取待处理图像,待处理图像为待处理视频中的一帧图像。
[0234] 前后景分割模块172,用于对待处理图像进行前后景分割,得到第一后景图像和第一前景图像。
[0235] 前景防抖模块173,用于对第一前景图像进行防抖处理,得到第一前景增稳图像。
[0236] 后景防抖模块174,用于对第一后景图像进行防抖处理,得到第一后景增稳图像。
[0237] 图像融合模块175,用于将第一前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第一增稳图像。
[0238] 在一些可能的实现方式中,前景防抖模块具体用于:提取第一前景图像的特征点;根据第一前景图像的特征点和第二前景图像的特征点,得到第一运动轨迹曲线,第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和待处理图像在图像序列上是连续的图像帧;根据待处理图像的前景防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线;根据第二运动轨迹曲线和第一前景图像,得到增稳后的第一前景图像;对增稳后的第一前景图像进行边缘补偿,得到第一前景增稳图像。
[0239] 在一些可能的实现方式中,前景防抖模块具体用于:通过计算增稳后的第一前景图像中每个待补偿像素点的目标像素值;
[0240] 将目标像素值作为待补偿像素点的像素值,其它像素点的像素值不变,得到第一前景增稳图像,其它像素点为增稳后的第一前景图像中,除了待补偿像素点之外的像素点;其中, V(q)为q点的目标像素值,q点为待补偿像素点;P(i,j)为第
i行第j列的像素点的像素值,w(i,j)为第i行第j列的像素点的高斯权重,σ为超参数,N为正整数。
[0241] 在一些可能的实现方式中,该装置还包括:防抖强度调整模块,用于提取待处理图像的第一边缘带信息,第一边缘带信息为待处理图像中,前景和后景之间的边缘带的像素信息;提取第一增稳图像的第二边缘带信息,第二边缘带信息为第一增稳图像中,前景和后景之间的边缘带的像素信息;根据第一边缘带信息和第二边缘带信息,对下一帧待处理图像或者待处理图像的防抖强度进行调整,防抖强度包括前景防抖强度和/或后景防抖强度。
[0242] 在一些可能的实现方式中,防抖强度调整模块具体用于:确定第一边缘带信息和第二边缘带信息之间的第一结构性相似度指标;若第一结构性相似度指标未落入预设相似度阈值区间,对下一帧待处理图像或者待处理图像的防抖强度进行调整。
[0243] 在一些可能的实现方式中,防抖强度调整模块具体用于:若第一结构性相似度指标未落入预设相似度阈值区间,将待处理图像的防抖强度和预设数值相乘,得到调整后的第一防抖强度,将调整后的第一防抖强度作为下一帧待处理图像的防抖强度或者待处理图像的防抖强度。
[0244] 在一些可能的实现方式中,调整后的第一防抖强度包括待处理图像的前景防抖强度;装置还包括当前帧防抖结果调整模块,用于:根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线,第一运动轨迹曲线为根据第一前景图像的特征点和第二前景图像的特征点得到的运动轨迹曲线,第二前景图像为第一目标图像的前景图像,待处理视频包括第一目标图像,且第一目标图像和待处理图像在图像序列上是连续的图像帧;根据第三运动轨迹曲线和第一前景图像,得到第二前景增稳图像;将第二前景增稳图像和第一后景增稳图像进行融合,得到待处理图像的第二增稳图像;确定第二边缘带信息和第三边缘带信息之间的第二结构性相似度指标,第三边缘带信息为第二增稳图像中,前景和后景之间的边缘带的像素信息;若第二结构性相似度指标未落入预设相似度阈值区间,将调整后的第一防抖强度和预设数值相乘,得到调整后的第二防抖强度;将调整后的第二防抖强度作为调整后的第一防抖强度,返回根据调整后的第一防抖强度,对第一运动轨迹曲线进行路径平滑,得到路径平滑后的第三运动轨迹曲线的步骤,直到第二结构性相似度指标落入预设相似度阈值区间。
[0245] 在一些可能的实现方式中,后景防抖模块具体用于:提取第一后景图像的特征点;根据第一后景图像的特征点和第二后景图像的特征点,得到第四运动轨迹曲线,第二后景图像为第二目标图像的后景图像,待处理视频包括第二目标图像,且第二目标图像和待处理图像在图像序列上是连续的图像帧;根据待处理图像的后景防抖强度,对第四运动轨迹曲线进行路径平滑,得到路径平滑后的第二运动轨迹曲线;根据第二运动轨迹曲线和第一前景图像,得到第一前景增稳图像。
[0246] 上述视频防抖装置具有实现上述视频防抖方法的功能,该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现,硬件或软件包括一个或多个与上述功能相对应的模块,模块可以是软件和/或硬件。
[0247] 本申请实施例还提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现如上述任一项的视频防抖方法。
[0248] 本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
[0249] 本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
[0250] 本申请实施例还提供一种芯片系统,所述芯片系统包括处理器,所述处理器与存储器耦合,所述处理器执行存储器中存储的计算机程序,以实现如上述各个方法实施例所述的方法。所述芯片系统可以为单个芯片,或者多个芯片组成的芯片模组。
[0251] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。此外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。
[0252] 最后应说明的是:以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。