图像处理方法、电子设备及计算存储介质转让专利
申请号 : CN202210093198.7
文献号 : CN114120048B
文献日 : 2022-05-13
发明人 : 周慧 , 屠要峰 , 周祥生 , 孙康康 , 黄圣君
申请人 : 中兴通讯股份有限公司 , 南京航空航天大学
摘要 :
权利要求 :
1.一种图像处理方法,其中,所述方法包括:确定未标注图像集合中每张图像的特征表示性能参数和信息量参数;
根据所述未标注图像集合中每张图像的特征表示性能参数和信息量参数从所述未标注图像集合中选取符合图像效用需求的目标图像;
对所述目标图像进行标注;
所述确定未标注图像集合中每张图像的特征表示性能参数包括:读取已标注图像集合;
将所述已标注图像集合和所述未标注图像集合进行训练得到第一模型;
根据所述第一模型确定所述未标注图像集合中每张图像的特征表示性能参数;
所述将所述已标注图像集合和所述未标注图像集合进行训练得到第一模型包括:分别将所述已标注图像集合中以及所述未标注图像集合中的每张图像均进行预设旋转角度地旋转;
根据旋转每张图像的预设旋转角度分别对旋转之后的每张图像进行标注,得到构造图像集合;
根据所述构造图像集合训练得到所述第一模型。
2.根据权利要求1所述的方法,其中,所述预设旋转角度共有多个类别;所述根据所述第一模型确定所述未标注图像集合中每张图像的特征表示性能参数包括:根据所述第一模型确定所述未标注图像集合中每张图像的预设旋转角度分别被预测为所述多个类别中每个类别的概率;
根据所述概率确定所述未标注图像集合中每张图像的特征表示性能参数。
3.根据权利要求1所述的方法,其中,在所述将已标注图像集合和所述未标注图像集合进行训练得到第一模型之后,所述方法还包括:根据所述已标注图像集合调整所述第一模型的参数得到第二模型;以及
所述确定所述未标注图像集合中每张图像的信息量参数包括:根据所述第二模型确定所述未标注图像集合中每张图像的信息量参数。
4.根据权利要求3所述的方法,其中,所述根据所述第二模型确定所述未标注图像集合中每张图像的信息量参数包括:根据所述第二模型确定所述未标注图像集合中每张图像被预测为预设图像分类任务中的各个类别的概率;
根据所述概率确定所述未标注图像集合中每张图像的信息量参数。
5.根据权利要求3所述的方法,其中,所述第一模型至少包括特征表示层和分类器层,所述特征表示层用于提取图像的特征表示信息,所述根据所述已标注图像集合调整所述第一模型的参数得到第二模型包括:根据所述已标注图像集合调整所述第一模型的分类器层的参数得到所述第二模型。
6.根据权利要求5所述的方法,其中,在所述根据所述已标注图像集合调整所述第一模型的分类器层的参数得到所述第二模型之前,所述方法还包括:根据预设图像分类任务中的类别数量调整所述分类器层的网络结构。
7.根据权利要求3所述的方法,其中,在所述对所述目标图像进行标注之后,所述方法还包括:
将已标注的所述目标图像从所述未标注图像集合中移动到所述已标注图像集合中;
继续执行所述根据所述已标注图像集合调整所述第一模型的参数得到第二模型的步骤。
8.根据权利要求1‑7中任意一项所述的方法,其中,所述根据所述未标注图像集合中每张图像的特征表示性能参数和信息量参数从所述未标注图像集合中选取符合图像效用需求的目标图像包括:
根据所述未标注图像集合中每张图像的特征表示性能参数和信息量参数以及所述未标注图像集合中的图像总数量确定平衡参数;
根据所述平衡参数以及所述未标注图像集合中每张图像的特征表示性能参数和信息量参数确定所述未标注图像集合中每张图像的效用得分;
从所述未标注图像集合中选取预设数量张效用得分最高的图像。
9.一种电子设备,包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1‑8中任一项所述的图像处理方法;
一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
10.一种计算机存储介质,其上存储有计算机程序,其中,所述程序被执行时实现如权利要求1‑8中任一项所述的图像处理方法。
说明书 :
图像处理方法、电子设备及计算存储介质
技术领域
背景技术
型仍需在已标注图像上进行微调,以实现图像分类任务。目前,出于标注代价高昂、敏感性
等种种原因,已标注图像往往非常有限,进而导致图像分类模型的性能不佳。
发明内容
取符合图像有效性需求的未标注图像进行标注,能够兼顾图像在特征学习中的性能表现以
及图像对于下游任务的信息量表现,自动地选取出高效的图像进行标注,降低标注代价且
有助于提升图像分类模型的性能。
附图说明
具体实施方式
使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。
是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、
操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、
组件和/或其群组。
施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属
性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具
有理想化或过度形式上的含义,除非本文明确如此限定。
模型微调,然而图像分类模型需求庞大数量的已标注图像,加之往往由人工对未标注图像
进行标注,导致标记稀缺且代价高昂,严重影响图像分类模型的性能表现。为了提高已标注
图像的数量进而提升图像分类模型的性能,目前通常采用主动采样方法,即主动选取有效
性最高的部分图像进行标注。
中难以学得高效的特征表示,实际上这部分图像对于图像分类模型的帮助较小,甚至可能
会损害图像分类模型的性能,这将浪费标注成本、降低图像分类模型的性能。因此,在采用
主动采样方法选取图像进行标注时,不仅需要考虑图像对于下游任务的信息量贡献,还需
要考虑到图像在特征学习中的性能表现。
以根据每张图像的特征表示性能参数和信息量参数确定每张图像的有效性得分,符合图像
有效性需求的目标图像即未标注图像集合中有效性得分较高的部分图像,这部分图像用以
训练图像分类模型的有效性相对较高,例如可以是未标注图像集合中有效性得分最高的前
N张图像,但本公开实施例对N的具体取值并不做具体限定,只要大于0且小于未标注图像集
合中图像的总数量即可。
取符合图像有效性需求的未标注图像进行标注,能够兼顾图像在特征学习中的性能表现以
及图像对于下游任务的信息量表现,自动地选取出高效的图像进行标注,降低标注代价且
有助于提升图像分类模型的性能。
以训练得到模型,具体的,可以通过已标注图像和未标注图像来训练得到辅助模型,已标注
图像可以从中起到防止模型过拟合的作用。相应的,在一些实施例中,如图2所示,所述确定
未标注图像集合中每张图像的特征表示性能参数(即步骤S1中所述)可以包括如下步骤:
过程,若对于某未标注图像第一模型无法得到较为准确的检验结果,也即若利用未标注图
像检验第一模型时不确定性较大,则意味着第一模型并未从该图像学习到高效的特征表
示,若选取这样的图像进行标注以用作图像分类模型的训练集,无疑会损害图像分类模型
的性能。因此,第一模型可以是能够对图像给出任意输出结果的模型,通过第一模型在对未
标注图像给出输出结果时的不确定性,就能够判断未标注图像是否具备高效的特征表示性
能。作为一种优选的实施方式,第一模型可以是能够对图像给出关于旋转角度的预测模型。
相应的,在一些实施例中,如图3所示,所述将已标注图像集合和所述未标注图像集合进行
训练得到第一模型(即步骤S12)可以包括如下步骤:
旋转之后得到的所有图像及相应的标注构造一个数据集,本公开实施例中称为构造图像集
合。利用构造图像集合训练用以预测图像的旋转角度的第一模型。
90°、180°、270°,可以将旋转之后得到的图像分别标注“0”、“1”、“2”、“3”。当然本公开实施
例并不限于此,预设旋转角度也可以为45°、135°、225°等其他角度,标注内容也不限于“0”、
“1”、“2”和“3”,也可以是其他数字或字母,只要旋转角度与标注内容一一对应即可。
张图像的预测结果的不确定性。相应的,在一些实施例中,所述预设旋转角度对应有多个类
别;如图4所示,所述根据所述第一模型确定所述未标注图像集合中每张图像的特征表示性
能参数(即步骤S13)可以包括如下步骤:
旋转角度分别被预测为多个类别中每个类别的概率,可以分别确定未标注图像集合中每张
图像的特征表示性能参数。
计算未标注图像集合中每张图像的特征表示性能参数 :
度的类别总数量。可见, 越大且 之间的差值越小,则 越小。
得到初始的图像分类模型的,基于初始的图像分类模型可以衡量图像对于图像分类任务的
信息量表现,相应的,在一些实施例中,如图5所示,在所述将已标注图像集合和所述未标注
图像集合进行训练得到第一模型(即步骤S12)之后,所述方法还可以包括如下步骤:
得出每张图像的图像分类结果的不确定性。相应的,在一些实施例中,如图6所示,所述根据
第二模型确定未标注图像集合中每张图像的信息量参数(即步骤S15)可以包括如下步骤:
不确定性越大则信息量参数越小。根据未标注图像集合中每张图像被预测为预设图像分类
任务中的各个类别的概率,可以分别确定未标注图像集合中每张图像的信息量参数。
未标注图像集合中每张图像的信息量参数 :
类别总数量。可见, 越大且 之间的差值越小,则 越小。
中,调整特征表示层是不必要的,可以尽可能地保留特征表示层的性能,只需要对第一模型
的分类器层进行调整即可。相应的,在一些实施例中,所述第一模型至少包括特征表示层和
分类器层,所述特征表示层用于提取图像的特征表示信息,所述根据已标注图像集合调整
第一模型的参数得到第二模型可以包括如下步骤:根据已标注图像集合调整第一模型的分
类器层的参数得到第二模型。
理特征等等。所调整的分类器层的参数可以包括分类阈值、迭代次数、损失函数loss
function(如交叉熵、梯度下降)等等。
像集合调整第一模型的分类器层的参数得到第二模型之前,所述方法还可以包括如下步
骤:根据预设图像分类任务中的类别数量调整分类器层的网络结构。
新,从而使用更新后的已标注图像训练得到图像分类模型。相应的,在一些实施例中,如图7
所示,在所述对目标图像进行标注(即步骤S3)之后,所述方法还可以包括如下步骤:
能多的从未标注图像集合中选取图像进行标注,由于在更新已标注图像集合之前已标注图
像是有限的,对于训练第一模型的作用也是有限的,接续影响其后第二模型的训练、确定图
像的特征表示性能参数和信息量参数等等,若只通过一次性选取数量较多的目标图像来进
行标注,则对于降低标注代价、提升图像分类模型的性能的作用略微较小,因此,在步骤S4
之后,还可以继续执行所述根据已标注图像集合调整第一模型的参数得到第二模型的步骤
(即步骤S14)。
整第一模型的参数得到更新后的第二模型(区别于此前步骤S14中得到的第二模型),根据
更新后的第二模型确定更新后的未标注图像集合中每张图像的信息量参数,根据更新后的
未标注图像集合中每张图像的特征表示性能参数和信息量参数从更新后的未标注图像集
合中选取目标图像进行标注。
的,如图8所示,在一些实施例中,所述根据所述未标注图像集合中每张图像的特征表示性
能参数和信息量参数从所述未标注图像集合中选取符合图像有效性需求的目标图像(即步
骤S2)可以包括如下步骤:
集合中选取有效性得分最高的预设数量个图像。
量参数。
像集合中第张图像 的有效性得分。
开实施例还提供一种模型训练方法,所述方法可以包括如下步骤:根据如前实施例所述的
图像处理方法标注得到的图像训练得到图像分类模型。
取未标注图像进行标注,能够兼顾图像在特征学习中的性能表现以及图像对于下游任务的
信息量表现,自动地选取出高效的图像进行标注,降低标注代价,显著提升已标注图像数
量,根据标注得到的图像训练得到图像分类模型,有助于提升图像分类模型的性能。
能以及提高模型训练效率,在根据如前实施例所述的图像处理方法标注得到图像后,可以
将这些图像加入已标注图像集合中,即对已标注图像集合进行更新,从而使用更新后的已
标注图像对第一模型的参数进行微调得到图像分类模型。相应的,在一些实施例中,所述根
据如前实施例所述的图像处理方法标注得到的图像训练得到图像分类模型可以包括如下
步骤:根据如前各实施例所述的图像处理方法标注得到的图像以及已标注图像集合调整第
一模型的参数得到图像分类模型。
取未标注图像进行标注,能够兼顾图像在特征学习中的性能表现以及图像对于下游任务的
信息量表现,自动地选取出高效的图像进行标注,降低标注代价,根据标注得到的图像以及
已标注图像集合调整第一模型的参数得到图像分类模型,有助于进一步提升图像分类模型
的性能以及提高模型训练效率。
所述的模型训练方法得到的图像分类模型对待处理图像进行图像分类。
取未标注图像进行标注,能够兼顾图像在特征学习中的性能表现以及图像对于下游任务的
信息量表现,自动地选取出高效的图像进行标注,降低标注代价,根据标注得到的图像以及
已标注图像集合调整第一模型的参数得到图像分类模型,有助于提升图像分类模型的性
能,根据该图像分类模型对待处理图像进行图像分类,能够准确地对图像进行分类,提升图
像分类效率。
据全部有标记与无标记图像训练得到预训练模型(即第一模型);S33、读取少量标记图像;
S34、对第一模型在少量标记图像上微调模型得到第二模型;S35、利用第二模型对无标记图
像的图像分类任务类别进行预测;S36、根据无标记图像的特征表示性能参数和信息量参数
选取部分无标记图像向用户查询标记信息;S37、用户反馈标记信息后对选取的无标记图像
进行标注;S38、若已标注图像数量已达到预算,则执行S39,否则继续执行S36;S39、返回获
得的标记实例,结束流程。
初始的第一模型;S43、计算图像旋转角度分类损失;S44、使用梯度下降更新模型参数;S45、
判断初始的模型是否收敛,若未收敛则继续执行S42,直至得到收敛的第一模型,若收敛则
执行S46;S46、读取少量已标注图像;S47、使用少量已标注图像微调第一模型得到初始的第
二模型;S48、计算图像分类损失;S49、使用梯度下降更新模型参数更新第二模型的参数;
S50、判断初始的第二模型是否收敛,若未收敛则继续执行S47,若收敛则输出第二模型,结
束流程。
征表示性能参数;S62、使用当前模型f(即第二模型)对图像语义进行预测,得到图像的信息
量参数;S63、利用图像的特征表示性能参数和信息量参数根据评分函数计算每张图像的价
值评分;S64、将未标价图像按照分数进行排序,选取待查询图像,向用户查询待查询图像的
标记信息;S65、获取用户返回的待查询图像标记,根据待查询图像标记对待查询图像进行
标注,结束流程。
图像;S73、将初始标记图像输入第一模型得到图像分类模型;S74、计算分类损失;S75、梯度
下降更新模型;S76、判断图像分类模型是否收敛,若未收敛则继续执行S72,若收敛则执行
S77;S77、输出图像分类模型,结束流程。
所述第一模型的分类器层的参数得到所述第二模型。
上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理
组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组
件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执
行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以
分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和
通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用
于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中
实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、
ROM、EEPROM、闪存或其他存储器技术、CD‑ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、
磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问
的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指
令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,
并且可包括任何信息递送介质。
易见的是,除非另外明确指出,否则可单独使用与特定实施例相集合描述的特征、特性和/
或元素,或可与其他实施例相集合描述的特征、特性和/或元件组合使用。因此,本领域技术
人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式
和细节上的改变。