视频质量评估方法及装置转让专利
申请号 : CN202110138817.5
文献号 : CN112995652B
文献日 : 2021-12-07
发明人 : 余冠东 , 易高雄 , 吴庆波 , 龚桂良
申请人 : 腾讯科技(深圳)有限公司
摘要 :
权利要求 :
1.一种视频质量评估方法,其特征在于,所述方法包括:获取待评估视频,所述待评估视频中包含有多个视频帧;
对所述多个视频帧中的各个视频帧进行特征提取,得到所述各个视频帧的图像特征向量,所述图像特征向量是以向量形式表示的图像特征的向量,所述图像特征至少包含视频帧的与画面内容相关的信息以及与画面质量相关的信息;
根据所述图像特征向量,确定所述各个视频帧的与画面内容相关的内容特征向量,并根据所述图像特征向量以及所述内容特征向量,确定所述各个视频帧的与画面质量相关的质量特征向量;
根据所述质量特征向量,确定所述各个视频帧的画面质量分数,并根据所述各个视频帧的画面质量分数,生成针对所述待评估视频的质量评估结果。
2.根据权利要求1所述的方法,其特征在于,根据所述各个视频帧的画面质量分数,生成针对所述待评估视频的质量评估结果,包括:获取所述待评估视频的卡顿次数以及卡顿时长,并根据所述卡顿次数以及所述卡顿时长,确定所述待评估视频的视频流畅度损伤值;
根据所述各个视频帧的画面质量分数,确定所述待评估视频的画面质量分数;
根据所述待评估视频的视频流畅度损伤值以及所述待评估视频的画面质量分数,生成针对所述待评估视频的质量评估结果。
3.根据权利要求2所述的方法,其特征在于,根据所述各个视频帧的画面质量分数,确定所述待评估视频的画面质量分数,包括:根据所述各个视频帧的画面质量分数,计算多个质量分数的平均值,将计算得到的平均值作为所述待评估视频的画面质量分数。
4.根据权利要求2所述的方法,其特征在于,根据所述卡顿次数以及所述卡顿时长,确定所述待评估视频的视频流畅度损伤值,包括:根据所述卡顿次数,确定所述待评估视频的第一视频流畅度损伤值,并根据所述卡顿时长,确定所述待评估视频的第二视频流畅度损伤值;
根据所述第一视频流畅度损伤值以及所述第二视频流畅度损伤值,确定所述待评估视频的视频流畅度损伤值。
5.根据权利要求1所述的方法,其特征在于,所述图像特征向量是通过质量评估模型的特征提取模块提取得到的,所述内容特征向量是将所述图像特征向量输入所述质量评估模型的残差模块后得到的;
根据所述质量特征向量,确定所述各个视频帧的画面质量分数,包括:将所述各个视频帧的质量特征向量输入所述质量评估模型的质量评估模块,得到所述质量评估模块输出的所述各个视频帧的画面质量分数。
6.根据权利要求5所述的方法,其特征在于,所述质量评估模型还包括相关性模块、特征相关系数计算模块以及内容分类模块,所述质量评估模型是通过如下方式训练得到的:获取训练样本集,所述训练样本集中包含有多个批量处理集,所述多个批量处理集中的各个批量处理集中包含有多个视频样本,各个视频样本包含有质量分数标签和视频内容标签;
通过所述特征提取模块、所述残差模块、所述相关性模块以及所述特征相关系数计算模块,确定所述各个批量处理集对应的第一特征相关系数,根据所述第一特征相关系数,确定第一损失函数,并根据所述第一损失函数,调整所述相关性模块的参数;
通过所述特征提取模块、所述残差模块、参数调整后的相关性模块、所述特征相关系数计算模块、所述质量评估模块以及所述内容分类模块,确定所述各个批量处理集对应的第二特征相关系数、质量损失值以及内容损失值,并根据所述第二特征相关系数、所述质量损失值以及所述内容损失值,确定第二损失函数,根据所述第二损失函数,调整所述特征提取模块、所述残差模块、所述质量评估模块以及所述内容分类模块的参数;
基于参数调整后的特征提取模块、参数调整后的残差模块、参数调整后的质量评估模块以及参数调整后的内容分类模块,重新进行所述相关性模块的参数的调整,并基于参数重新调整后的相关性模块,继续进行所述特征提取模块、所述残差模块、所述质量评估模块以及所述内容分类模块的参数的调整,直至收敛。
7.根据权利要求6所述的方法,其特征在于,通过所述特征提取模块、所述残差模块、所述相关性模块以及所述特征相关系数计算模块,确定所述各个批量处理集对应的第一特征相关系数,包括:
通过所述特征提取模块提取所述各个批量处理集中包含的各个视频样本中的多个视频样本帧的图像特征向量,将各个视频样本帧的图像特征向量输入所述残差模块,得到所述残差模块输出的所述各个视频样本帧的与画面内容相关的内容特征向量,根据所述各个视频样本帧的图像特征向量以及所述各个视频样本帧的内容特征向量,确定所述各个视频样本帧的与画面质量相关的质量特征向量;
根据所述各个视频样本帧的内容特征向量以及所述各个视频样本帧的质量特征向量,通过所述相关性模块和所述特征相关系数计算模块确定所述各个视频样本帧对应的特征相关系数,将确定出的所述各个视频样本帧对应的特征相关系数作为所述各个批量处理集对应的第一特征相关系数。
8.根据权利要求7所述的方法,其特征在于,根据所述第一特征相关系数,确定第一损失函数,包括:
获取所述多个视频样本帧分别对应的特征相关系数,将多个特征相关系数中的最小特征相关系数的相反数作为所述第一损失函数。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括:通过所述质量评估模块,确定所述各个批量处理集中包含的各个视频样本的输出画面质量分数,通过所述内容分类模块,确定所述各个批量处理集中包含的各个视频样本的输出视频内容类别;
根据所述各个视频样本的输出画面质量分数以及所述各个视频样本的质量分数标签,确定所述各个批量处理集对应的质量损失值;
根据所述各个视频样本的输出视频内容类别以及所述各个视频样本的视频内容标签,确定所述各个批量处理集对应的内容损失值。
10.一种视频质量评估装置,其特征在于,所述装置包括:获取单元,配置为获取待评估视频,所述待评估视频中包含有多个视频帧;
提取单元,配置为对所述多个视频帧中的各个视频帧进行特征提取,得到所述各个视频帧的图像特征向量,所述图像特征向量是以向量形式表示的图像特征的向量,所述图像特征至少包含视频帧的与画面内容相关的信息以及与画面质量相关的信息;
第一确定单元,配置为根据所述图像特征向量,确定所述各个视频帧的与画面内容相关的内容特征向量,并根据所述图像特征向量以及所述内容特征向量,确定所述各个视频帧的与画面质量相关的质量特征向量;
第二确定单元,配置为根据所述质量特征向量,确定所述各个视频帧的画面质量分数,并根据所述各个视频帧的画面质量分数,生成针对所述待评估视频的质量评估结果。
说明书 :
视频质量评估方法及装置
技术领域
背景技术
高,准确性低等诸多缺陷。
发明内容
提取,得到所述各个视频帧的图像特征向量;根据所述图像特征向量,确定所述各个视频帧
的与画面内容相关的内容特征向量,并根据所述图像特征向量以及所述内容特征向量,确
定所述各个视频帧的与画面质量相关的质量特征向量;根据所述质量特征向量,确定所述
各个视频帧的画面质量分数,并根据所述各个视频帧的画面质量分数,生成针对所述待评
估视频的质量评估结果。
个视频帧中的各个视频帧进行特征提取,得到所述各个视频帧的图像特征向量;第一确定
单元,配置为根据所述图像特征向量,确定所述各个视频帧的与画面内容相关的内容特征
向量,并根据所述图像特征向量以及所述内容特征向量,确定所述各个视频帧的与画面质
量相关的质量特征向量;第二确定单元,配置为根据所述质量特征向量,确定所述各个视频
帧的画面质量分数,并根据所述各个视频帧的画面质量分数,生成针对所述待评估视频的
质量评估结果。
时长,确定所述待评估视频的视频流畅度损伤值;确定子单元,配置为根据所述各个视频帧
的画面质量分数,确定所述待评估视频的画面质量分数;生成子单元,配置为根据所述待评
估视频的视频流畅度损伤值以及所述待评估视频的画面质量分数,生成针对所述待评估视
频的质量评估结果。
估视频的画面质量分数。
估视频的第二视频流畅度损伤值;根据所述第一视频流畅度损伤值以及所述第二视频流畅
度损伤值,确定所述待评估视频的视频流畅度损伤值。
估模型的残差模块后得到的;所述第二确定单元配置为:根据所述质量特征向量,确定所述
各个视频帧的画面质量分数,包括:将所述各个视频帧的质量特征向量输入所述质量评估
模型的质量评估模块,得到所述质量评估模块输出的所述各个视频帧的画面质量分数。
的:获取训练样本集,所述训练样本集中包含有多个批量处理集,所述多个批量处理集中的
各个批量处理集中包含有多个视频样本,各个视频样本包含有质量分数标签和视频内容标
签;通过所述特征提取模块、所述残差模块、所述相关性模块以及所述特征相关系数计算模
块,确定所述各个批量处理集对应的第一特征相关系数,根据所述第一特征相关系数,确定
第一损失函数,并根据所述第一损失函数,调整所述相关性模块的参数;通过所述特征提取
模块、所述残差模块、参数调整后的相关性模块、所述特征相关系数计算模块、所述质量评
估模块以及所述内容分类模块,确定所述各个批量处理集对应的第二特征相关系数、质量
损失值以及内容损失值,并根据所述第二特征相关系数、所述质量损失值以及所述内容损
失值,确定第二损失函数,并根据所述第二损失函数,调整所述特征提取模块、所述残差模
块、所述质量评估模块以及所述内容分类模块的参数;基于参数调整后的特征提取模块、参
数调整后的残差模块、参数调整后的质量评估模块以及参数调整后的内容分类模块,重新
进行所述相关性模块的参数的调整,并基于参数重新调整后的相关性模块,继续进行所述
特征提取模块、所述残差模块、所述质量评估模块以及所述内容分类模块的参数的调整,直
至收敛。
特征提取模块提取所述各个批量处理集中包含的各个视频样本中的多个视频样本帧的图
像特征向量,将各个视频样本帧的图像特征向量输入所述残差模块,得到所述残差模块输
出的所述各个视频样本帧的与画面内容相关的内容特征向量,根据所述各个视频样本帧的
图像特征向量以及所述各个视频样本帧的内容特征向量,确定所述各个视频样本帧的与画
面质量相关的质量特征向量;根据所述各个视频样本帧的内容特征向量以及所述各个视频
样本帧的质量特征向量,通过所述相关性模块和所述特征相关系数计算模块确定所述各个
视频样本帧对应的特征相关系数,将确定出的所述各个视频样本帧对应的特征相关系数作
为所述各个批量处理集对应的第一特征相关系数。
中的最小特征相关系数的相反数作为所述第一损失函数。
块,确定所述各个批量处理集中包含的各个视频样本的输出视频内容类别;根据所述各个
视频样本的输出画面质量分数以及所述各个视频样本的质量分数标签,确定所述各个批量
处理集对应的质量损失值;根据所述各个视频样本的输出视频内容类别以及所述各个视频
样本的视频内容标签,确定所述各个批量处理集对应的内容损失值。
行时,使得所述一个或多个处理器实现如上述实施例中所述的视频质量评估方法。
中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机
指令,使得该计算机设备执行上述各种可选实施例中提供的视频质量评估方法。
频帧的与画面内容相关的内容特征向量,并根据图像特征向量以及内容特征向量,确定各
个视频帧的与画面质量相关的质量特征向量,进而根据各个视频帧的质量特征向量,确定
各个视频帧的画面质量分数,最后根据各个视频帧的画面质量分数,生成针对待评估视频
的质量评估结果。本申请实施例的技术方案,由于将与画面内容相关的特征以及与画面质
量相关的特征分离开来,避免了特征之间相互干扰,提高视频质量评估的准确性,同时本方
案避免了使用结构庞大复杂的模型,节省了计算开销,实用性更强。
附图说明
的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。在附图中:
具体实施方式
全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,
或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方
法、装置、实现或者操作以避免模糊本申请的各方面。
文中使用时指定存在所陈述的特点、整体、步骤、操作、元件、组件和/或其群组,但并不排除
存在或添加其他特点、整体、步骤、操作、元件、组件和/或其群组中的一个或多个。
件。例如,在不脱离本发明的范围的情况下,第一元件可以被称为第二元件。类似地,第二元
件可以被称为第一元件。如本文所使用的,术语“和/或”包含关联的列出的项目中的一个或
多个的任何和所有组合。
这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,
人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能
以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原
理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技
术、自然语言处理技术、以及机器学习/深度学习等几大方向。
医疗等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价
值。
技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是
使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通
常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
视频服务供应提供更优质的服务。近年来,随着各种第四代移动通信技术终端的大量上市,
以及第五代移动通信技术的不断突破,无线网络速度迅速提升。各类视频通话以及视频会
议的应用程序(例如即时通讯类应用以及在线会议类应用等)在现实生活中得到愈发广泛
地应用。然而,在视频的获取、编码、传输以及解码过程中会引入各种各样的失真,严重影响
视频的质量以及用户观看视频的体验。作为视频服务的供应商,为了给用户提供更为优质
的视频观看体验,需要为用户获取的视频质量建立一个评价标准,也就是对这些视频的用
户体验质量进行检测并量化。因此,本申请所提出的对于视频的质量评估的需求是十分迫
切的。
确度不高,多数情况下只能用于评估质量明显下降的样例,在面对高清、场景细节丰富、复
杂多变的视频时,往往会出现许多失败案例。而深度学习方法随着近几年来的发展,在图像
和视频处理领域都表现出了令人瞩目的强大性能,但许多优秀的模型往往结构更复杂,计
算开销非常大,近年来学界开发的方法更是有越做越复杂的趋势,比如在空域特征提取上
选择庞大的残差网络50(Residual Network50,ResNet50),甚至3D卷积神经网络,这些模型
都对硬件设备要求非常高,无法在实际应用中部署到移动设备当中去。另外在时域特征提
取上,长短期记忆网络(Long Short‑Term Memory,LSTM)的应用也越来越广泛,同样限制了
模型预测的实时性。需要注意的是,这种通过增加模型复杂度而带来的性能提升并不显著。
额外的计算开销常常是为了捕获时域特征,但从各方面的实验结果和经验来看,视频流畅
性对于用户的影响远远小于清晰度,所以从实用性来看,现有的深度学习方法在捕获时域
特征上所换来的收益远不足以补偿为之牺牲的计算开销。
个视频帧的与画面内容相关的内容特征向量,并根据图像特征向量以及内容特征向量,确
定各个视频帧的与画面质量相关的质量特征向量,进而根据各个视频帧的质量特征向量,
确定各个视频帧的画面质量分数,最后根据各个视频帧的画面质量分数,生成针对待评估
视频的质量评估结果。本申请实施例的技术方案,由于将与画面内容相关的特征以及与画
面质量相关的特征分离开来,避免了特征之间相互干扰,提高视频质量评估的准确性,同时
本方案避免了使用结构庞大复杂的模型,节省了计算开销,实用性更强。
用以在终端设备102和服务器104之间提供通信链路的介质。网络可以包括各种连接类型,
例如有线、无线通信链路或者光纤电缆等等。
提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、
安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台
等基础云计算服务的云服务器。
供的视频质量评估方法也可以由终端设备102执行,相应地,视频质量评估装置也可以设置
于终端设备102中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例
中,可以是用户通过终端设备102将待评估视频上传至服务器104,服务器104通过本申请实
施例所提供的视频质量评估方法对该视频进行评估,并将得到的质量评估结果发送给终端
设备102。
的服务器集群等。
一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进
一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科
学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信
息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检
索、光学字符识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频
内容/行为识别、三维物体重建、三维技术、虚拟现实、增强现实、同步定位与地图构建等技
术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
视频质量评估方法至少包括以下步骤:
征向量;
估视频中包含有多个视频帧:第1帧、第2帧……第i‑1帧、第i帧、第i+1帧……第n‑1帧、第n
帧等等。
是基于深度卷积神经网络训练得到,比如,该特征提取网络可以采用视觉几何组(Visual
Geometry Group,VGG)网络结构。除了模型法特征提取之外,还可以采用几何法特征提取、
信号处理法特征提取等方法对各个视频帧进行特征提取,本申请实施例不对提取图像特征
的具体方式进行具体限定。
征向量。
色信息、位置信息等。
面内容相关的内容特征向量,进而,利用图像特征向量减去内容特征向量,确定出各个视频
帧的与画面质量相关的质量特征向量。
相应画面质量分数。
以视频样本集中的视频样本为输入,以视频样本中的总体质量分数为输出训练得到的模
型。需要说明,本实施例对质量评估模型的类型不做限定。可选的,质量评估模型的类型可
以为下列中的任意一个:神经网络模型、深度算法模型和机器算法模型。
评估视频的质量评估结果。在一实施方式中,根据各个视频帧的画面质量分数,生成针对待
评估视频的质量评估结果可以是根据各个视频帧的画面质量分数,计算多个质量分数的均
值,然后,将计算得到的均值作为待评估视频的画面质量评估结果。当然,根据各个视频帧
的质量分数,生成针对待评估视频的质量评估结果还可以是其他可行的实施方式,在此不
进行具体限定。
频帧的与画面质量相关的质量特征向量,进而根据各个视频帧的质量特征向量,确定各个
视频帧的画面质量分数,最后根据各个视频帧的画面质量分数,生成针对待评估视频的质
量评估结果。本申请实施例的技术方案由于将与画面内容相关的特征以及与画面质量相关
的特征分离开来,避免了内容特征与质量特征之间的相互干扰,提高视频质量评估的准确
性,同时本方案避免了使用结构庞大复杂的模型,节省了计算开销,实用性更强。
终生成针对待评估视频的质量评估结果。在该实施例中,如图3所示,步骤S240中根据各个
视频帧的画面质量分数,生成针对待评估视频的质量评估结果可以具体包括步骤S310‑步
骤S330,说明如下:
放的卡顿。
则基于视觉暂留效应,可以将卡顿信息作为评估视频质量的一个因素,卡顿信息可以反应
视频的流畅度。在本实施例中,卡顿信息至少包括卡顿次数和卡顿时长,具体实施时,执行
主体可以根据待评估视频的卡顿事件,计算出卡顿次数和卡顿时长,从而获取待评估视频
的卡顿次数以及卡顿时长。
而确定出卡顿时长。
流畅度损伤值可以从视频播放流畅度上反映出待评估视频的流畅度损伤程度,视频流畅度
损伤值越大,则说明待评估视频的播放流畅度越差。
二视频流畅度损伤值,最后,根据第一视频流畅度损伤值和第二视频流畅度损伤值,确定待
评估视频的视频流畅度损伤值。
的第二视频流畅度损伤值D_dur,同时,考虑到第一视频流畅度损伤值D_num和第二视频流
畅度损伤值D_dur的重叠性以及实际情况的多样性,可以根据如下公式三进行计算待评估
视频的视频流畅度损伤值D_stall:
是对各个视频帧的画面质量分数进行加权运算,得到待评估视频的画面质量分数。
得到的平均值作为待评估视频的画面质量分数。
卡顿时长确定出的,可以反映出卡顿事件对待评估视频的整体质量的影响,视频流畅度损
伤值越大,意味着卡顿事件对待评估视频的整体质量的影响越大,那么待评估视频的整体
质量也越差。
生成针对待评估视频的质量评估结果,在具体实现过程中,生成的质量评估结果
predicted_score可以根据如下公式四计算得到:
施例中质量评估模型的一个结构示意图,如图4所示,在预测的过程中,待评估视频通过质
量评估模型后输出画面质量分数,输出的画面质量分数可以是待评估视频中各个视频帧的
画面质量分数,也可以是根据预测得到的待评估视频中各个视频帧的画面质量分数,输出
待评估视频的画面质量分数。具体地,用于评估的质量评估模型包括特征提取模块、残差模
块和质量评估模块,在训练的过程中,还需增加相关性模块1、相关性模块2、特征相关系数
计算模块以及内容分类模块,具体地,用于训练的质量评估模型包括特征提取模块、残差模
块、相关性模块1、相关性模块2、特征相关系数计算模块、质量评估模块和内容分类模块。
征向量,在提取得到各个视频帧的图像特征向量之后,将各个视频帧的图像特征向量输入
质量评估模型的残差模块,从而得到各个视频帧的与画面内容相关的内容特征向量,然后,
利用图像特征向量减去内容特征向量,得到各个视频帧的与画面质量相关的质量特征向
量。最后,在得到各个视频帧的质量特征向量之后,可以将各个视频帧的质量特征向量输入
质量评估模型的质量评估模块,得到质量评估模块输出的各个视频帧的画面质量分数。
限定,残差模块可以采用两层全连接层,保持特征维度不变,质量评估模块也可以采用全连
接层。
容标签。
评估模型的,而是按照批次(batch)的形式传入模型进行计算,也训练样本集可以分成多个
批量处理集,利用各个批量处理集对待训练质量评估模型进行一次训练和参数更新。
待训练质量评估模型参数将会更新。
观感知进行标注的,视频内容标签是与各个视频样本的内容相关的。
相关系数,根据第一特征相关系数,确定第一损失函数,并根据第一损失函数,调整相关性
模块的参数。
1和相关性模块2的参数。
一特征相关系数用以表示各个批量处理集中包含的多个视频样本的与画面内容相关的内
容特征向量以及多个视频样本的与画面质量相关的质量特征向量之间的相关性。
骤S510‑步骤S520,详细说明如下:
块,得到残差模块输出的各个视频样本帧的与画面内容相关的内容特征向量,根据各个视
频样本帧的图像特征向量以及各个视频样本帧的内容特征向量,确定各个视频样本帧的与
画面质量相关的质量特征向量。
模块提取得到多个视频样本帧的图像特征向量之后,可以将各个视频样本帧的图像特征向
量输入残差模块,从而得到残差模块输出的各个视频样本帧的与画面内容相关的内容特征
向量。
质量特征向量。
系数,将确定出的各个视频样本帧对应的特征相关系数作为各个批量处理集对应的第一特
征相关系数。
维处理,将质量特征向量的维度降至1维,并通过相关性模块2对各个视频样本帧的内容特
征向量进行降维处理,将内容特征向量的维度降至1维,再利用特征相关系数计算模块计算
各个视频样本帧对应的特征相关系数。
σc、σq分别为 和 的标准差,ε为用于维持数值稳定性的极小值常量。
特征相关系数后,则可以将计算得到的各个视频样本帧对应的特征相关系数作为各个批量
处理集对应的第一特征相关系数。
第1帧视频样本帧,视频样本2中的第1帧视频样本帧以及视频样本3中的第1帧视频样本帧,
计算出第1帧视频样本帧对应的特征相关系数,根据视频样本1中的第2帧视频样本帧,视频
样本2中的第2帧视频样本帧以及视频样本3中的第2帧视频样本帧,计算出第2帧视频样本
帧对应的特征相关系数,最后,可以将计算出的第1帧视频样本帧对应的特征相关系数以及
第2帧视频样本帧对应的特征相关系数作为批量处理集A对应的第一特征相关系数。
的参数。
关的质量特征向量之间的相关性,因而,为了更好地评估视频的质量,避免模型学习到与画
面质量不相关的其他特征,对模型的回归判别过程造成额外的干扰,影响模型的性能,在模
型训练的第一阶段,可以通过最大化特征相关系数最小的视频样本帧的特征相关系数,确
定第一损失函数,即可以设置第一损失函数为Loss1=‑min|ρj|,其中,min|ρj|为第一特征
相关系数,ρj为第j帧视频样本帧的特征相关系数。
数、质量损失值以及内容损失值,并根据第二特征相关系数、质量损失值和内容损失值,确
定第二损失函数,根据第二损失函数,调整特征提取模块、残差模块、质量评估模块以及内
容分类模块的参数。
评估模块以及内容分类模块的参数。
关系数,第二特征相关系数用以表示各个批量处理集中包含的多个视频样本的与画面内容
相关的内容特征向量以及多个视频样本的与画面质量相关的质量特征向量之间的相关性。
其中,确定第二特征相关系数的方法与第二步中确定第一特征相关系数的方法类似,故在
此不再赘述。
容损失值。具体而言,如图6所示,确定各个批量处理集对应的质量损失值和内容损失值可
以具体包括步骤S610‑步骤S630,详细说明如下:
视频内容类别。
帧的图像特征向量输入残差模块,得到残差模块输出的各个视频样本帧的内容特征向量,
在得到内容特征向量之后,利用图像特征向量减去内容特征向量,得到各个视频样本帧的
质量特征向量;进而可以将质量特征向量输入质量评估模块,将内容特征向量输入内容分
类模块,从而得到质量评估模块输出的各个视频样本帧的画面质量分数以及内容分类模块
输出的各个视频样本帧的内容特征向量;最后根据质量评估模块输出的各个视频样本帧的
画面质量分数,得到各个视频样本的输出画面质量分数,根据内容分类模块输出的各个视
频样本帧的内容特征向量,得到各个视频样本的输出视频内容类别。
包含的各个视频样本的输出画面质量分数以及质量分数标签之间的差值,将计算得到的差
值作为各个批量处理集中包含的各个视频样本对应的质量损失值,然后,可以计算各个视
频样本对应的质量损失值之和与各个批量处理集中包含的视频样本的数量的比值,将计算
出的比值作为各个批量处理集对应的质量损失值。
签,确定各个视频样本对应的内容损失值,内容损失值用以表示输出视频内容类别与视频
内容标签之间的不一致性。由于批量处理集中包含有各个视频样本,因而根据各个视频样
本对应的内容损失值,可以确定出各个批量处理集对应的内容损失值。
第二损失函数,然后,可以根据第二损失函数,调整特征提取模块、残差模块、质量评估模块
以及内容分类模块的参数。
相关性,而为了更好地评估视频的质量,避免模型学习到与画面质量不相关的其他特征,对
模型的回归判别过程造成额外的干扰,影响模型的性能,因此在模型训练的第二阶段,可通
过最小化特征相关系数最大的视频样本帧的特征相关系数,并结合内容损失值和质量损失
值,确定第二损失函数为Loss2=lq+0.1lc+0.1×max|ρj|,其中,lq为质量损失值,采用L1损
失,lc为内容损失值,采用交叉熵损失,max|ρj|为第二特征相关系数,ρj为第j帧视频帧的特
征相关系数。
于参数重新调整后的相关性模块,继续进行特征提取模块、残差模块、质量评估模块以及内
容分类模块的参数的调整,直至收敛。
调整后的质量评估模块以及参数调整后的内容分类模块,重新进行相关性模块的参数的调
整,并基于参数重新调整后的相关性模块,继续进行特征提取模块、残差模块、质量评估模
块以及内容分类模块的参数的调整,直至收敛。
通过减小最大典型相关性来最小化视频样本帧的内容特征向量和质量特征向量的相关性,
将与画面质量相关的特征和与画面质量无关的特征分离开来,使二者在不同的任务中互不
干扰且相关性降至最低,提升了模型的可解释性以及模型对质量回归的预测精度。
预测准确度上的一个对比示意。衡量图像质量评估结果的指标有很多,每种指标都有自己
的特点,通常比较模型客观值与观测的主观值之间的差异和相关性。常见的2种评估指标是
皮尔逊线性相关系数(Pearson Linear Correlation Coefficient,PLCC)和斯皮尔曼排序
相关系数(Spearman Rank Correlation Coefficient,SRCC)。
0.934,三项指标均大幅优于所有对比方法。表1列出了一些其他常用方法包括8个经典的参
数化模型FTW、Mok2011、Liu2012、Xue2014、Yin2015、Spiteri2016、Bentaleb2016和SQI,2个
基于学习的模型VideoATLAS和P.1203。考虑到对比试验存在一定程度的随机性,模型试验
总共进行了30次,表1中所展示的结果是30次结果的中位数。
的实施例。
对所述多个视频帧中的各个视频帧进行特征提取,得到所述各个视频帧的图像特征向量;
第一确定单元706,配置为根据所述图像特征向量,确定所述各个视频帧的与画面内容相关
的内容特征向量,并根据所述图像特征向量以及所述内容特征向量,确定所述各个视频帧
的与画面质量相关的质量特征向量;第二确定单元708,配置为根据所述质量特征向量,确
定所述各个视频帧的画面质量分数,并根据所述各个视频帧的画面质量分数,生成针对所
述待评估视频的质量评估结果。
所述待评估视频的视频流畅度损伤值;确定子单元,配置为根据所述各个视频帧的画面质
量分数,确定所述待评估视频的画面质量分数;生成子单元,配置为根据所述待评估视频的
视频流畅度损伤值以及所述待评估视频的画面质量分数,生成针对所述待评估视频的质量
评估结果。
分数。
视频流畅度损伤值;根据所述第一视频流畅度损伤值以及所述第二视频流畅度损伤值,确
定所述待评估视频的视频流畅度损伤值。
块后得到的;所述第二确定单元配置为:根据所述质量特征向量,确定所述各个视频帧的画
面质量分数,包括:将所述各个视频帧的质量特征向量输入所述质量评估模型的质量评估
模块,得到所述质量评估模块输出的所述各个视频帧的画面质量分数。
本集,所述训练样本集中包含有多个批量处理集,所述多个批量处理集中的各个批量处理
集中包含有多个视频样本,各个视频样本包含有质量分数标签和视频内容标签;通过所述
特征提取模块、所述残差模块、所述相关性模块以及所述特征相关系数计算模块,确定所述
各个批量处理集对应的第一特征相关系数,根据所述第一特征相关系数,确定第一损失函
数,并根据所述第一损失函数,调整所述相关性模块的参数;通过所述特征提取模块、所述
残差模块、参数调整后的相关性模块、所述特征相关系数计算模块、所述质量评估模块以及
所述内容分类模块,确定所述各个批量处理集对应的第二特征相关系数、质量损失值以及
内容损失值,并根据所述第二特征相关系数、所述质量损失值以及所述内容损失值,确定第
二损失函数,根据所述第二损失函数,调整所述特征提取模块、所述残差模块、所述质量评
估模块以及所述内容分类模块的参数;基于参数调整后的特征提取模块、参数调整后的残
差模块以及参数调整后的质量评估模块以及参数调整后的内容分类模块,重新进行所述相
关性模块的参数的调整,并基于参数重新调整后的相关性模块,继续进行所述特征提取模
块、所述残差模块以及所述质量评估模块以及所述内容分类模块的参数的调整,直至收敛。
包括:通过所述特征提取模块提取所述各个批量处理集中包含的各个视频样本中的多个视
频样本帧的图像特征向量,将各个视频样本帧的图像特征向量输入所述残差模块,得到所
述残差模块输出的所述各个视频样本帧的与画面内容相关的内容特征向量,根据所述各个
视频样本帧的图像特征向量以及所述各个视频样本帧的内容特征向量,确定所述各个视频
样本帧的与画面质量相关的质量特征向量;根据所述各个视频样本帧的内容特征向量以及
所述各个视频样本帧的质量特征向量,通过所述相关性模块和所述特征相关系数计算模块
确定所述各个视频样本帧对应的特征相关系数,将确定出的所述各个视频样本帧对应的特
征相关系数作为所述各个批量处理集对应的第一特征相关系数。
征相关系数的相反数作为所述第一损失函数。
批量处理集中包含的各个视频样本的输出视频内容类别;根据所述各个视频样本的输出画
面质量分数以及所述各个视频样本的质量分数标签,确定所述各个批量处理集对应的质量
损失值;根据所述各个视频样本的输出视频内容类别以及所述各个视频样本的视频内容标
签,确定所述各个批量处理集对应的内容损失值。
808加载到随机访问存储器(Random Access Memory,RAM)803中的程序而执行各种适当的
动作和处理,例如执行上述实施例中所述的方法。在RAM 803中,还存储有系统操作所需的
各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/
Output,I/O)接口805也连接至总线804。
等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN(Local Area Network,局
域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络
执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、
磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程
序根据需要被安装入存储部分808。
上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的
实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介
质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的系统中限定
的各种功能。
是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上
的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的
电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程
只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑
磁盘只读存储器(Compact Disc Read‑Only Memory,CD‑ROM)、光存储器件、磁存储器件、或
者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序
的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申
请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其
中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限
于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可
读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于
由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的
计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意
合适的组合。
个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于
实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注
的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可
以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意
的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的
功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来
实现。
下并不构成对该单元本身的限定。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设
备执行时,使得该电子设备实现上述实施例中所述的方法。
模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模
块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失
性存储介质(可以是CD‑ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算
设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的
方法。
途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知
常识或惯用技术手段。