一种图像增强方法及其相关设备转让专利

申请号 : CN202110833076.2

文献号 : CN115700729A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 汪涛宋风龙郑卓然任文琦操晓春

申请人 : 华为技术有限公司中国科学院信息工程研究所

摘要 :

本申请提供一种图像增强方法及其相关设备,能够使增强后的目标图像精确显示出需要突出的图像信息,从而提高图像增强效果。本申请的方法包括:通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征;通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过图像处理模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征;根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格;根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像。

权利要求 :

1.一种图像增强方法,其特征在于,所述方法包括:

通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征;

通过所述图像处理模型对所述第一特征和所述第二特征进行第一融合处理,得到所述纹理信息的第三特征,并通过所述图像处理模型对所述第一特征和所述第二特征进行第二融合处理,得到所述颜色信息的第四特征;

根据所述第三特征生成第一双边网格,并根据所述第四特征生成第二双边网格;

根据所述第一双边网格和所述第二双边网络对所述目标图像进行增强处理,得到增强后的目标图像。

2.根据权利要求1所述的方法,其特征在于,所述图像处理模型包含依次连接的N个卷积层,所述第一特征包含N个第一子特征,所述第二特征包含N个第二子特征,所述通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征包括:通过所述N个卷积层对目标图像的纹理信息进行卷积处理,得到所述N个卷积层分别输出的第一子特征;

通过所述N个卷积层对目标图像的颜色信息进行卷积处理,得到所述N个卷积层分别输出的第二子特征。

3.根据权利要求2所述的方法,其特征在于,所述图像处理模型还包含N个第一融合层以及N个第二融合层,所述通过所述图像处理模型对所述第一特征和所述第二特征进行第一融合处理,得到所述纹理信息的第三特征,并通过所述图像处理模型对所述第一特征和所述第二特征进行第二融合处理,得到所述颜色信息的第四特征包括:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行处理,得到第i个第三子特征;

通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行处理,得到第i个第五子特征;

通过第i个第一融合层对所述第i‑1个第四子特征以及所述第i个第五子特征进行处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。

4.根据权利要求1至3任意一项所述的方法,其特征在于,所述通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征之前,所述方法还包括:获取目标图像;

对所述目标图像进行下采样处理,得到下采样后的目标图像;

对所述下采样后的目标图像进行分离处理,得到所述目标图像的纹理信息以及所述目标图像的颜色信息。

5.根据权利要求1至4任意一项所述的方法,其特征在于,所述图像处理模型还包括图像重构层,所述根据所述第一双边网格和所述第二双边网络对所述目标图像进行增强处理,得到增强后的目标图像包括:对所述第一双边网格进行网格重构处理,得到第三双边网格,并对所述第二双边网格进行网格重构处理,得到第四双边网格,所述网格重构处理用于去除双边网格中的部分信息;

对所述第三双边网格进行上采样处理,得到第五双边网格,并对所述第四双边网格进行上采样处理,得到第六双边网格;

根据所述第五双边网格对所述目标图像进行仿射变换,得到第五特征,并根据所述第六双边网格对所述目标图像进行仿射变换,得到第六特征;

通过图像重构层对所述第五特征和所述第六特征进行图像重构处理,得到增强后的目标图像。

6.一种模型训练方法,其特征在于,所述方法包括:

获取待处理图像以及对所述待处理图像进行图像增强后的真实图像;

通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征;

通过所述待训练模型对所述第一特征和所述第二特征进行第一融合处理,得到所述纹理信息的第三特征,并通过所述待训练模型对所述第一特征和所述第二特征进行第二融合处理,得到所述颜色信息的第四特征;

根据所述第三特征生成第一双边网格,并根据所述第四特征生成第二双边网格;

根据所述第一双边网格和所述第二双边网络对所述待处理图像进行增强处理,得到预测图像;

根据所述预测图像、所述真实图像以及处理后的预测图像,获取目标损失,所述目标损失用于指示所述预测图像以及所述真实图像之间的差异,以及所述预测图像以及所述处理后的预测图像之间的差异;

根据所述目标损失对所述待训练模型的模型参数进行更新,直至满足模型训练条件,得到图像处理模型。

7.根据权利要求6所述的方法,其特征在于,所述处理后的预测图像为像素翻转处理和模糊处理后的预测图像。

8.根据权利要求6或7所述的方法,其特征在于,所述待训练模型包含依次连接的N个卷积层,所述第一特征包含N个第一子特征,所述第二特征包含N个第二子特征,所述通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征包括:通过所述N个卷积层对待处理图像的纹理信息进行卷积处理,得到所述N个卷积层分别输出的第一子特征;

通过所述N个卷积层对待处理图像的颜色信息进行卷积处理,得到所述N个卷积层分别输出的第二子特征。

9.根据权利要求8所述的方法,其特征在于,所述待训练模型还包含N个第一融合层以及N个第二融合层,所述通过所述待训练模型对所述第一特征和所述第二特征进行第一融合处理,得到所述纹理信息的第三特征,并通过所述待训练模型对所述第一特征和所述第二特征进行第二融合处理,得到所述颜色信息的第四特征包括:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行处理,得到第i个第三子特征;

通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行处理,得到第i个第五子特征;

通过第i个第一融合层对所述第i‑1个第四子特征以及所述第i个第五子特征进行处理,得到第i个第四子特征;

其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。

10.根据权利要求6至9任意一项所述的方法,其特征在于,所述通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征之前,所述方法还包括:获取待处理图像;

对所述待处理图像进行下采样处理,得到下采样后的待处理图像;

对所述下采样后的待处理图像进行分离处理,得到所述待处理图像的纹理信息以及所述待处理图像的颜色信息。

11.根据权利要求6至10任意一项所述的方法,其特征在于,所述待训练模型还包括图像重构层,所述根据所述第一双边网格和所述第二双边网络对所述待处理图像进行增强处理,得到预测图像包括:对所述第一双边网格进行网格重构处理,得到第三双边网格,并对所述第二双边网格进行网格重构处理,得到第四双边网格,所述网格重构处理用于去除双边网格中的部分信息;

对所述第三双边网格进行上采样处理,得到第五双边网格,并对所述第四双边网格进行上采样处理,得到第六双边网格;

根据所述第五双边网格对所述待处理图像进行仿射变换,得到第五特征,并根据所述第六双边网格对所述待处理图像进行仿射变换,得到第六特征;

通过图像重构层对所述第五特征和所述第六特征进行图像重构处理,得到预测图像。

12.一种图像增强装置,其特征在于,所述装置包括:

第一获取模块,用于通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征;

融合模块,用于通过所述图像处理模型对所述第一特征和所述第二特征进行第一融合处理,得到所述纹理信息的第三特征,并通过所述图像处理模型对所述第一特征和所述第二特征进行第二融合处理,得到所述颜色信息的第四特征;

生成模块,用于根据所述第三特征生成第一双边网格,并根据所述第四特征生成第二双边网格;

增强模块,用于根据所述第一双边网格和所述第二双边网络对所述目标图像进行增强处理,得到增强后的目标图像。

13.根据权利要求12所述的装置,其特征在于,所述图像处理模型包含依次连接的N个卷积层,所述第一特征包含N个第一子特征,所述第二特征包含N个第二子特征,所述第一获取模块,用于:通过所述N个卷积层对目标图像的纹理信息进行卷积处理,得到所述N个卷积层分别输出的第一子特征;

通过所述N个卷积层对目标图像的颜色信息进行卷积处理,得到所述N个卷积层分别输出的第二子特征。

14.根据权利要求13所述的装置,其特征在于,所述图像处理模型还包含N个第一融合层以及N个第二融合层,所述融合模块,用于:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行处理,得到第i个第三子特征;

通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行处理,得到第i个第五子特征;

通过第i个第一融合层对所述第i‑1个第四子特征以及所述第i个第五子特征进行处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。

15.根据权利要求12至14任意一项所述的装置,其特征在于,所述装置还包括:第二获取模块,用于获取目标图像;

下采样模块,用于对所述目标图像进行下采样处理,得到下采样后的目标图像;

分离模块,用于对所述下采样后的目标图像进行分离处理,得到所述目标图像的纹理信息以及所述目标图像的颜色信息。

16.根据权利要求12至15任意一项所述的装置,其特征在于,所述增强模块,用于:对所述第一双边网格进行网格重构处理,得到第三双边网格,并对所述第二双边网格进行网格重构处理,得到第四双边网格,所述网格重构处理用于去除双边网格中的部分信息;

对所述第三双边网格进行上采样处理,得到第五双边网格,并对所述第四双边网格进行上采样处理,得到第六双边网格;

根据所述第五双边网格对所述目标图像进行仿射变换,得到第五特征,并根据所述第六双边网格对所述目标图像进行仿射变换,得到第六特征;

通过图像重构层对所述第五特征和所述第六特征进行图像重构处理,得到增强后的目标图像。

17.一种模型训练装置,其特征在于,所述装置包括:

第一获取模块,用于获取待处理图像以及对所述待处理图像进行图像增强后的真实图像;

第二获取模块,用于通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征;

融合模块,用于通过所述待训练模型对所述第一特征和所述第二特征进行第一融合处理,得到所述纹理信息的第三特征,并通过所述待训练模型对所述第一特征和所述第二特征进行第二融合处理,得到所述颜色信息的第四特征;

生成模块,用于根据所述第三特征生成第一双边网格,并根据所述第四特征生成第二双边网格;

增强模块,用于根据所述第一双边网格和所述第二双边网络对所述待处理图像进行增强处理,得到预测图像;

第三获取模块,用于根据所述预测图像、所述真实图像以及处理后的预测图像,获取目标损失,所述目标损失用于指示所述预测图像以及所述真实图像之间的差异,以及所述预测图像以及所述处理后的预测图像之间的差异;

更新模块,用于根据所述目标损失对所述待训练模型的模型参数进行更新,直至满足模型训练条件,得到图像处理模型。

18.根据权利要求17所述的装置,其特征在于,所述处理后的预测图像为像素翻转处理和模糊处理后的预测图像。

19.根据权利要求17或18所述的装置,其特征在于,所述待训练模型包含依次连接的N个卷积层,所述第一特征包含N个第一子特征,所述第二特征包含N个第二子特征,所述第二获取模块,用于:通过所述N个卷积层对待处理图像的纹理信息进行卷积处理,得到所述N个卷积层分别输出的第一子特征;

通过所述N个卷积层对待处理图像的颜色信息进行卷积处理,得到所述N个卷积层分别输出的第二子特征。

20.根据权利要求19所述的装置,其特征在于,所述待训练模型还包含N个第一融合层以及N个第二融合层,所述融合模块,用于:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行处理,得到第i个第三子特征;

通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行处理,得到第i个第五子特征;

通过第i个第一融合层对所述第i‑1个第四子特征以及所述第i个第五子特征进行处理,得到第i个第四子特征;

其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。

21.根据权利要求17至20任意一项所述的装置,其特征在于,所述装置还包括:第四获取模块,用于获取待处理图像;

下采样模块,用于对所述待处理图像进行下采样处理,得到下采样后的待处理图像;

分离模块,用于对所述下采样后的待处理图像进行分离处理,得到所述待处理图像的纹理信息以及所述待处理图像的颜色信息。

22.根据权利要求17至21任意一项所述的装置,其特征在于,所述待训练模型还包括图像重构层,所述增强模块,用于:对所述第一双边网格进行网格重构处理,得到第三双边网格,并对所述第二双边网格进行网格重构处理,得到第四双边网格,所述网格重构处理用于去除双边网格中的部分信息;

对所述第三双边网格进行上采样处理,得到第五双边网格,并对所述第四双边网格进行上采样处理,得到第六双边网格;

根据所述第五双边网格对所述待处理图像进行仿射变换,得到第五特征,并根据所述第六双边网格对所述待处理图像进行仿射变换,得到第六特征;

通过图像重构层对所述第五特征和所述第六特征进行图像重构处理,得到预测图像。

23.一种图像增强装置,其特征在于,所述装置包括存储器和处理器;所述存储器存储有代码,所述处理器被配置为执行所述代码,当所述代码被执行时,所述图像处理装置执行如权利要求1至11任一所述的方法。

24.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一个或多个指令,所述指令在由一个或多个计算机执行时使得所述一个或多个计算机实施权利要求1至11任一所述的方法。

25.一种计算机程序产品,其特征在于,所述计算机程序产品存储有指令,所述指令在由计算机执行时,使得所述计算机实施权利要求1至11任意一项所述的方法。

说明书 :

一种图像增强方法及其相关设备

技术领域

[0001] 本申请涉及人工智能(artificial intelligence,AI)技术领域,尤其涉及一种图像增强方法及其相关设备。

背景技术

[0002] 随着计算机技术的飞速发展,人们在日常生活和生产活动中,会大量使用到各种各样的图像。为了提高图像质量,可进行图像增强,图像增强指按特定的需求突出图像的某些信息,并削弱或去除某些不需要的信息的处理方法。
[0003] 目前,在获取待增强的目标图像后,可通过图像处理模型提取目标图像的特征,并基于该特征生成相应的双边网格,再利用该双边网格对目标图像进行增强处理,从而得到增强后的目标图像。
[0004] 然而,仅以整个目标图像的特征生成双边网格,所考虑的因素较为单一,即双边网格中包含的有关于目标图像的信息较为片面,故基于该双边网格所得到的增强后的目标图像,无法精确显示出某些需要突出的图像信息,导致图像增强效果不佳。

发明内容

[0005] 本申请实施例提供了一种图像增强方法及其相关设备,能够使增强后的目标图像精确显示出需要突出的图像信息,从而提高图像增强效果。
[0006] 本申请实施例的第一方面提供了一种图像增强方法,其特征在于,所述方法包括:
[0007] 在获取待增强的目标图像后,可对目标图像先进行预处理,从而得到目标图像的纹理信息以及目标图像的颜色信息。
[0008] 得到目标图像的纹理信息以及目标图像的颜色信息后,可将这部分信息输入至图像处理模型,以通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征。
[0009] 得到纹理信息的第一特征和颜色信息的第二特征后,图像处理模型可对第一特征和第二特征进行第一融合处理,即在第一特征的基础上融入第二特征,从而得到第三特征,第三特征既可以用于表征纹理信息,还可用于表征纹理信息和颜色信息之间关联关系。相应地,图像处理模型还可对第一特征和第二特征进行第二融合处理,即在第二特征的基础上融入第一特征,得到第四特征,第四特征既可以用于表征颜色信息,还可用于表征纹理信息和颜色信息之间关联关系。
[0010] 得到纹理信息的第三特征和颜色信息的第四特征后,可根据第三特征生成纹理信息的第一双边网格,并根据第四特征生成颜色信息的第二双边网格。
[0011] 得到纹理信息的第一双边网格和颜色信息的第二双边网格后,可根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像。
[0012] 从上述方法可以看出:由于第三特征是在纹理信息的第一特征的基础上融入了颜色信息的第二特征得到的,第四特征是在颜色信息的第二特征的基础上融入了纹理信息的第一特征得到的,故基于第三特征生成的第一双边网格,不仅包含目标图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含目标图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于目标图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的目标图像,可精确显示出需要突出的图像信息(例如,纹理、颜色、饱和度、亮度、动态范围、对比度等等),从而提高图像增强效果。
[0013] 在一种可能的实现方式中,图像处理模型包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征包括:通过N个卷积层对目标图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征;通过N个卷积层对目标图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。前述实现方式中,通过N个卷积层可分别对目标图像的纹理信息和颜色信息进行多级卷积处理,以相应得到N个第一子特征和N个第二子特征,故可基于N个第一子特征和N个第二子特征实现后续的特征融合处理。
[0014] 在一种可能的实现方式中,图像处理模型还包含N个第一融合层以及N个第二融合层,第1个第一融合层与第1个卷积层连接,第i个第一融合层与第i个第二融合层连接,第i个卷积层与第i个第二融合层连接,i=1,...,N,N为大于或等于1的整数。通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过图像处理模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征包括:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征;通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征;通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。前述实现方式中,N个卷积层的输出分别作为N个第二融合层的输入,N个第二融合层的输出分别作为N个第一融合层的输入,且第i‑1个第一融合层的输出作为第i个第一融合层的输入,如此一来,在N个卷积层、N个第一融合层以及N个第二融合层的相互配合下,可令N个第一子特征和N个第二子特征按低级到高级的顺序,进行多次融合和交互,因此,最终得到的第三特征不仅可用于表征纹理信息,还可用于表征纹理信息和颜色信息之间的关联关系,同样地,第四特征不仅可用于表征颜色信息,还可用于表征纹理信息和颜色信息之间的关联关系。
[0015] 在一种可能的实现方式中,通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征之前,该方法还包括:获取目标图像后,先对目标图像进行下采样处理,得到下采样后的目标图像,下采样后的目标图像的分辨率小于原始的目标图像的分辨率。然后,对下采样后的目标图像进行分离处理,得到目标图像的纹理信息以及目标图像的颜色信息,例如,可对下采样后的目标图像进行一定程度的高斯模糊处理,再去除其中的高频信息,得到目标图像的颜色信息,并用下采样后的目标图像减去颜色信息,得到目标图像的纹理信息等等。
[0016] 在一种可能的实现方式中,图像处理模型还包括图像重构层,根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像包括:首先,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除第一双边网格和第二双边网格中作用较小的信息,且保留作用较大的信息。接着,对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格,其中,第五双边网格的分辨率和原始的目标图像的分辨率相同,第六双边网格的分辨率也和原始的目标图像的分辨率相同。然后,根据第五双边网格对目标图像进行仿射变换,得到第五特征,并根据第六双边网格对目标图像进行仿射变换,得到第六特征,其中,第五特征的分辨率和原始的目标图像的分辨率相同,第六特征的分辨率也和原始的目标图像的分辨率相同。最后,通过图像重构层对第五特征和第六特征进行图像重构处理,得到增强后的目标图像。
[0017] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。前述实现方式中,可对第一双边网格和第二双边网格分别进行tucker分解和tucker重构,有利于过滤这两个双边网格中一部分作用较小的信息,那么,在基于得到的第三双边网格和第四双边网格对目标图像进行后续处理的过程中,可避免双边网格对目标图像产生噪声以及错误边界等问题的出现。
[0018] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0019] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0020] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0021] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0022] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0023] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0024] 在一种可能的实现方式中,图像处理模型还包含特征提取层,对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格包括:在获取目标图像后,可将目标图像输入至图像处理模型的特征提取层,以通过第二特征提取层对目标图像进行特征提取处理,得到纹理引导图和颜色引导图。然后,可以纹理引导图为参考,对第三双边网格进行插值处理,得到第五双边网格,并以颜色引导图为参考,对第四双边网格进行插值处理,得到第六双边网格。
[0025] 在一种可能的实现方式中通过图像重构层对第五特征和第六特征进行图像重构处理,得到增强后的目标图像包括:先通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征。然后,通过图像重构层对第七特征进行卷积处理,得到增强后的目标图像。例如,图像重构层中包含归一化层和依次连接的卷积层,该归一化层接收到第五特征和第六特征后,则对第五特征和第六特征进行归一化处理,并将得到的第七特征发送至卷积层。卷积层接收来自归一化层的第七特征后,可对第七特征进行卷积处理,从而得到增强后的目标图像。
[0026] 在一种可能的实现方式中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0027] 本申请实施例的第二方面提供了一种模型训练方法,该方法包括:获取待处理图像以及对待处理图像进行图像增强后的真实图像;通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征;通过待训练模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过待训练模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征;根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格;根据第一双边网格和第二双边网络对待处理图像进行增强处理,得到预测图像;根据预测图像、真实图像以及处理后的预测图像,获取目标损失,目标损失用于指示预测图像以及真实图像之间的差异,以及预测图像以及处理后的预测图像之间的差异;根据目标损失对待训练模型的模型参数进行更新,直至满足模型训练条件,得到图像处理模型。
[0028] 基于上述方法所得到的图像处理模型,具备对待处理图像进行图像增强的能力。在图像增强的过程中,图像处理模型可在纹理信息的第一特征的基础上融入了颜色信息的第二特征,得到第三特征,且图像处理模型可在颜色信息的第二特征的基础上融入了纹理信息的第一特征,得到第四特征。故基于第三特征生成的第一双边网格,不仅包含待处理图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含待处理图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于待处理图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的待处理图像,可精确显示出需要突出的图像信息,从而提高图像增强效果。
[0029] 在一种可能的实现方式中,处理后的预测图像为像素翻转处理和模糊处理后的预测图像。
[0030] 在一种可能的实现方式中,待训练模型包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征包括:通过N个卷积层对待处理图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征;通过N个卷积层对待处理图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。
[0031] 在一种可能的实现方式中,待训练模型还包含N个第一融合层以及N个第二融合层,通过待训练模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过待训练模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征包括:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征;通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征;通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。
[0032] 在一种可能的实现方式中,通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征之前,该方法还包括:获取待处理图像;对待处理图像进行下采样处理,得到下采样后的待处理图像;对下采样后的待处理图像进行分离处理,得到待处理图像的纹理信息以及待处理图像的颜色信息。
[0033] 在一种可能的实现方式中,待训练模型还包括图像重构层,根据第一双边网格和第二双边网络对待处理图像进行增强处理,得到预测图像包括:对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息;对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格;根据第五双边网格对待处理图像进行仿射变换,得到第五特征,并根据第六双边网格对待处理图像进行仿射变换,得到第六特征;通过图像重构层对第五特征和第六特征进行图像重构处理,得到预测图像。
[0034] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0035] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0036] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0037] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0038] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0039] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0040] 在一种可能的实现方式中,对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格包括:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0041] 在一种可能的实现方式中,待训练模型还包括特征提取层,对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格包括:通过特征提取层对待处理图像进行特征提取处理,得到纹理引导图和颜色引导图;根据纹理引导图对第三双边网格进行插值处理,得到第五双边网格,并根据颜色引导图对第四双边网格进行插值处理,得到第六双边网格。
[0042] 在一种可能的实现方式中,通过图像重构层对第五特征和第六特征进行图像重构处理,得到预测图像包括:通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征;通过图像重构层对第七特征进行卷积处理,得到预测图像。
[0043] 在一种可能的实现方式中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0044] 本申请实施例的第三方面提供了一种图像增强装置,该装置包括:第一获取模块,用于通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征;融合模块,用于通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过图像处理模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征;生成模块,用于根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格;增强模块,用于根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像。
[0045] 从上述装置可以看出:由于第三特征是在纹理信息的第一特征的基础上融入了颜色信息的第二特征得到的,第四特征是在颜色信息的第二特征的基础上融入了纹理信息的第一特征得到的,故基于第三特征生成的第一双边网格,不仅包含目标图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含目标图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于目标图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的目标图像,可精确显示出需要突出的图像信息,从而提高图像增强效果。
[0046] 在一种可能的实现方式中,图像处理模型包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,第一获取模块,用于:通过N个卷积层对目标图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征;通过N个卷积层对目标图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。
[0047] 在一种可能的实现方式中,图像处理模型还包含N个第一融合层以及N个第二融合层,融合模块,用于:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征;通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征;通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。
[0048] 在一种可能的实现方式中,该装置还包括:第二获取模块,用于获取目标图像;下采样模块,用于对目标图像进行下采样处理,得到下采样后的目标图像;分离模块,用于对下采样后的目标图像进行分离处理,得到目标图像的纹理信息以及目标图像的颜色信息。
[0049] 在一种可能的实现方式中,图像处理模型还包括图像重构层,增强模块,用于:对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息;对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格;根据第五双边网格对目标图像进行仿射变换,得到第五特征,并根据第六双边网格对目标图像进行仿射变换,得到第六特征;通过图像重构层对第五特征和第六特征进行图像重构处理,得到增强后的目标图像。
[0050] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0051] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0052] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0053] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0054] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0055] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0056] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0057] 在一种可能的实现方式中,图像处理模型还包含特征提取层,增强模块,用于:通过特征提取层对目标图像进行特征提取处理,得到纹理引导图和颜色引导图;根据纹理引导图对第三双边网格进行插值处理,得到第五双边网格,并根据颜色引导图对第四双边网格进行插值处理,得到第六双边网格。
[0058] 在一种可能的实现方式中,增强模块,用于:通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征;通过图像重构层对第七特征进行卷积处理,得到增强后的目标图像。
[0059] 在一种可能的实现方式中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0060] 本申请实施例的第四方面提供了一种模型训练装置,该装置包括:第一获取模块,用于获取待处理图像以及对待处理图像进行图像增强后的真实图像;第二获取模块,用于通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征;融合模块,用于通过待训练模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过待训练模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征;生成模块,用于根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格;增强模块,用于根据第一双边网格和第二双边网络对待处理图像进行增强处理,得到预测图像;第三获取模块,用于根据预测图像、真实图像以及处理后的预测图像,获取目标损失,目标损失用于指示预测图像以及真实图像之间的差异,以及预测图像以及处理后的预测图像之间的差异;更新模块,用于根据目标损失对待训练模型的模型参数进行更新,直至满足模型训练条件,得到图像处理模型。
[0061] 基于上述装置所得到的图像处理模型,具备对待处理图像进行图像增强的能力。在图像增强的过程中,图像处理模型可在纹理信息的第一特征的基础上融入了颜色信息的第二特征,得到第三特征,且图像处理模型可在颜色信息的第二特征的基础上融入了纹理信息的第一特征,得到第四特征。故基于第三特征生成的第一双边网格,不仅包含待处理图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含待处理图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于待处理图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的待处理图像,可精确显示出需要突出的图像信息,从而提高图像增强效果。
[0062] 在一种可能的实现方式中,处理后的预测图像为像素翻转处理和模糊处理后的预测图像。
[0063] 在一种可能的实现方式中,待训练模型包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,第二获取模块,用于:通过N个卷积层对待处理图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征;通过N个卷积层对待处理图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。
[0064] 在一种可能的实现方式中,待训练模型还包含N个第一融合层以及N个第二融合层,融合模块,用于:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征;通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征;通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。
[0065] 在一种可能的实现方式中,该装置还包括:第四获取模块,用于获取待处理图像;下采样模块,用于对待处理图像进行下采样处理,得到下采样后的待处理图像;分离模块,用于对下采样后的待处理图像进行分离处理,得到待处理图像的纹理信息以及待处理图像的颜色信息。
[0066] 在一种可能的实现方式中,待训练模型还包括图像重构层,增强模块,用于:对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息;对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格;根据第五双边网格对待处理图像进行仿射变换,得到第五特征,并根据第六双边网格对待处理图像进行仿射变换,得到第六特征;通过图像重构层对第五特征和第六特征进行图像重构处理,得到预测图像。
[0067] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0068] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0069] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0070] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0071] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0072] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0073] 在一种可能的实现方式中,增强模块,用于:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0074] 在一种可能的实现方式中,待训练模型还包括特征提取层,增强模块,用于:通过特征提取层对待处理图像进行特征提取处理,得到纹理引导图和颜色引导图;根据纹理引导图对第三双边网格进行插值处理,得到第五双边网格,并根据颜色引导图对第四双边网格进行插值处理,得到第六双边网格。
[0075] 在一种可能的实现方式中,增强模块,用于:通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征;通过图像重构层对第七特征进行卷积处理,得到预测图像。
[0076] 在一种可能的实现方式中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0077] 本申请实施例的第五方面提供了一种图像增强装置,该装置包括存储器和处理器;存储器存储有代码,处理器被配置为执行代码,当代码被执行时,图像增强装置执行如第一方面或第一方面中任意一种可能的实现方式所述的方法。
[0078] 本申请实施例的第六方面提供了一种模型训练装置,该装置包括存储器和处理器;存储器存储有代码,处理器被配置为执行代码,当代码被执行时,模型训练装置执行如第二方面或第二方面中任意一种可能的实现方式所述的方法。
[0079] 本申请实施例的第七方面提供了一种电路系统,该电路系统包括处理电路,该处理电路配置为执行如第一方面、第一方面中任意一种可能的实现方式、第二方面或第二方面中任意一种可能的实现方式所述的方法。
[0080] 本申请实施例的第八方面提供了一种芯片系统,该芯片系统包括处理器,用于调用存储器中存储的计算机程序或计算机指令,以使得该处理器执行如第一方面、第一方面中任意一种可能的实现方式、第二方面或第二方面中任意一种可能的实现方式所述的方法。
[0081] 在一种可能的实现方式中,该处理器通过接口与存储器耦合。
[0082] 在一种可能的实现方式中,该芯片系统还包括存储器,该存储器中存储有计算机程序或计算机指令。
[0083] 本申请实施例的第九方面提供了一种计算机存储介质,该计算机存储介质存储有计算机程序,该程序在由计算机执行时,使得计算机实施如第一方面、第一方面中任意一种可能的实现方式、第二方面或第二方面中任意一种可能的实现方式所述的方法。
[0084] 本申请实施例的第十方面提供了一种计算机程序产品,该计算机程序产品存储有指令,该指令在由计算机执行时,使得计算机实施如第一方面、第一方面中任意一种可能的实现方式、第二方面或第二方面中任意一种可能的实现方式所述的方法。
[0085] 本申请实施例中,获取待增强的目标图像后,可通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征。接着,通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过图像处理模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征。然后,根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格。最后,根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像。前述过程中,由于第三特征是在纹理信息的第一特征的基础上融入了颜色信息的第二特征得到的,第四特征是在颜色信息的第二特征的基础上融入了纹理信息的第一特征得到的,故基于第三特征生成的第一双边网格,不仅包含目标图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含目标图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于目标图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的目标图像,可精确显示出需要突出的图像信息,从而提高图像增强效果。

附图说明

[0086] 图1为人工智能主体框架的一种结构示意图;
[0087] 图2a为本申请实施例提供的图像处理系统的一个结构示意图;
[0088] 图2b为本申请实施例提供的图像处理系统的另一结构示意图;
[0089] 图2c为本申请实施例提供的图像处理的相关设备的一个示意图;
[0090] 图3为本申请实施例提供的系统100架构的一个示意图;
[0091] 图4为本申请实施例提供的图像增强方法的一个流程示意图;
[0092] 图5为本申请实施例提供的图像处理模型的一个结构示意图;
[0093] 图6为本申请实施例提供的第一特征提取层和融合层的一结构示意图;
[0094] 图7为本申请实施例提供的第一融合层和第二融合层的一个结构示意图;
[0095] 图8为本申请实施例提供的模型训练方法的一个流程示意图;
[0096] 图9为本申请实施例提供的图像增强装置的一个结构示意图;
[0097] 图10为本申请实施例提供的模型训练装置的一个结构示意图;
[0098] 图11为本申请实施例提供的执行设备的一个结构示意图;
[0099] 图12为本申请实施例提供的训练设备的一个结构示意图;
[0100] 图13为本申请实施例提供的芯片的一个结构示意图。

具体实施方式

[0101] 本申请实施例提供了一种图像增强方法及其相关设备,能够使增强后的目标图像精确显示出需要突出的图像信息,从而提高图像增强效果。
[0102] 本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”并他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
[0103] 随着计算机技术的飞速发展,人们在日常生活和生产活动中,会大量使用到各种各样的图像。为了提高图像质量,可进行图像增强,图像增强指按特定的需求突出图像的某些信息,并削弱或去除某些不需要的信息的处理方法。
[0104] 相关技术提供的图像增强方法中,获取待增强的目标图像后,可通过图像处理模型提取目标图像的特征,并基于该特征生成相应的双边网格,再利用该双边网格对目标图像进行增强处理,从而得到增强后的目标图像。
[0105] 然而,仅以整个目标图像的特征生成双边网格,所考虑的因素较为单一,即双边网格中融入的有关于目标图像的信息较为片面,故基于该双边网格所得到的增强后的目标图像,无法精确显示出某些需要突出的图像信息(例如,纹理、颜色、饱和度、亮度、动态范围、对比度等等),导致图像增强效果不佳。
[0106] 为了解决上述问题,本申请提供了一种图像增强方法,该方法可结合人工智能(artificial intelligence,AI)技术实现。AI技术是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能的技术学科,AI技术通过感知环境、获取知识并使用知识获得最佳结果。换句话说,人工智能技术是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。利用人工智能进行图像处理是人工智能常见的一个应用方式。
[0107] 首先对人工智能系统总体工作流程进行描述,请参见图1,图1为人工智能主体框架的一种结构示意图,下面从“智能信息链”(水平轴)和“IT价值链”(垂直轴)两个维度对上述人工智能主题框架进行阐述。其中,“智能信息链”反映从数据的获取到处理的一列过程。举例来说,可以是智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。在这个过程中,数据经历了“数据—信息—知识—智慧”的凝练过程。“IT价值链”从人智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程,反映人工智能为信息技术产业带来的价值。
[0108] (1)基础设施
[0109] 基础设施为人工智能系统提供计算能力支持,实现与外部世界的沟通,并通过基础平台实现支撑。通过传感器与外部沟通;计算能力由智能芯片(CPU、NPU、GPU、ASIC、FPGA等硬件加速芯片)提供;基础平台包括分布式计算框架及网络等相关的平台保障和支持,可以包括云存储和计算、互联互通网络等。举例来说,传感器和外部沟通获取数据,这些数据提供给基础平台提供的分布式计算系统中的智能芯片进行计算。
[0110] (2)数据
[0111] 基础设施的上一层的数据用于表示人工智能领域的数据来源。数据涉及到图形、图像、语音、文本,还涉及到传统设备的物联网数据,包括已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。
[0112] (3)数据处理
[0113] 数据处理通常包括数据训练,机器学习,深度学习,搜索,推理,决策等方式。
[0114] 其中,机器学习和深度学习可以对数据进行符号化和形式化的智能信息建模、抽取、预处理、训练等。
[0115] 推理是指在计算机或智能系统中,模拟人类的智能推理方式,依据推理控制策略,利用形式化的信息进行机器思维和求解问题的过程,典型的功能是搜索与匹配。
[0116] 决策是指智能信息经过推理后进行决策的过程,通常提供分类、排序、预测等功能。
[0117] (4)通用能力
[0118] 对数据经过上面提到的数据处理后,进一步基于数据处理的结果可以形成一些通用的能力,比如可以是算法或者一个通用系统,例如,翻译,文本的分析,计算机视觉的处理,语音识别,图像的识别等等。
[0119] (5)智能产品及行业应用
[0120] 智能产品及行业应用指人工智能系统在各领域的产品和应用,是对人工智能整体解决方案的封装,将智能信息决策产品化、实现落地应用,其应用领域主要包括:智能终端、智能交通、智能医疗、自动驾驶、智慧城市等。
[0121] 接下来介绍几种本申请的应用场景。
[0122] 图2a为本申请实施例提供的图像处理系统的一个结构示意图,该图像处理系统包括用户设备以及数据处理设备。其中,用户设备包括手机、个人电脑或者信息处理中心等智能终端。用户设备为图像处理的发起端,作为图像处理请求的发起方,通常由用户通过用户设备发起请求。
[0123] 上述数据处理设备可以是云服务器、网络服务器、应用服务器以及管理服务器等具有数据处理功能的设备或服务器。数据处理设备通过交互接口接收来自智能终端的图像处理请求,再通过存储数据的存储器以及数据处理的处理器环节进行机器学习,深度学习,搜索,推理,决策等方式的图像处理。数据处理设备中的存储器可以是一个统称,包括本地存储以及存储历史数据的数据库,数据库可以在数据处理设备上,也可以在其它网络服务器上。
[0124] 在图2a所示的图像处理系统中,用户设备可以接收用户的指令,例如用户设备可以获取用户输入/选择的一张图像,然后向数据处理设备发起请求,使得数据处理设备针对用户设备得到的该图像执行图像处理应用(例如,图像增强等等),从而得到针对该图像的对应的处理结果。示例性的,用户设备可以获取用户输入的一张图像,然后向数据处理设备发起图像增强请求,使得数据处理设备对该图像进行图像增强,从而得到增强后图像。
[0125] 在图2a中,数据处理设备可以执行本申请实施例的图像处理方法。
[0126] 图2b为本申请实施例提供的图像处理系统的另一结构示意图,在图2b中,用户设备直接作为数据处理设备,该用户设备能够直接获取来自用户的输入并直接由用户设备本身的硬件进行处理,具体过程与图2a相似,可参考上面的描述,在此不再赘述。
[0127] 在图2b所示的图像处理系统中,用户设备可以接收用户的指令,例如用户设备可以获取用户在用户设备中所选择的一张图像,然后再由用户设备自身针对该图像执行图像处理应用(例如图像增强等),从而得到针对该图像的对应的处理结果。
[0128] 在图2b中,用户设备自身就可以执行本申请实施例的图像增强方法。
[0129] 图2c为本申请实施例提供的图像处理的相关设备的一个示意图。
[0130] 上述图2a和图2b中的用户设备具体可以是图2c中的本地设备301或者本地设备302,图2a中的数据处理设备具体可以是图2c中的执行设备210,其中,数据存储系统250可以存储执行设备210的待处理数据,数据存储系统250可以集成在执行设备210上,也可以设置在云上或其它网络服务器上。
[0131] 图2a和图2b中的处理器可以通过神经网络模型或者其它模型(例如,基于支持向量机的模型)进行数据训练/机器学习/深度学习,并利用数据最终训练或者学习得到的模型针对图像执行图像处理应用,从而得到相应的处理结果。
[0132] 图3为本申请实施例提供的系统100架构的一个示意图,在图3中,执行设备110配置输入/输出(input/output,I/O)接口112,用于与外部设备进行数据交互,用户可以通过客户设备140向I/O接口112输入数据,所述输入数据在本申请实施例中可以包括:各个待调度任务、可调用资源以及其他参数。
[0133] 在执行设备110对输入数据进行预处理,或者在执行设备110的计算模块111执行计算等相关的处理(比如进行本申请中神经网络的功能实现)过程中,执行设备110可以调用数据存储系统150中的数据、代码等以用于相应的处理,也可以将相应处理得到的数据、指令等存入数据存储系统150中。
[0134] 最后,I/O接口112将处理结果返回给客户设备140,从而提供给用户。
[0135] 值得说明的是,训练设备120可以针对不同的目标或称不同的任务,基于不同的训练数据生成相应的目标模型/规则,该相应的目标模型/规则即可以用于实现上述目标或完成上述任务,从而为用户提供所需的结果。其中,训练数据可以存储在数据库130中,且来自于数据采集设备160采集的训练样本。
[0136] 在图3中所示情况下,用户可以手动给定输入数据,该手动给定可以通过I/O接口112提供的界面进行操作。另一种情况下,客户设备140可以自动地向I/O接口112发送输入数据,如果要求客户设备140自动发送输入数据需要获得用户的授权,则用户可以在客户设备140中设置相应权限。用户可以在客户设备140查看执行设备110输出的结果,具体的呈现形式可以是显示、声音、动作等具体方式。客户设备140也可以作为数据采集端,采集如图所示输入I/O接口112的输入数据及输出I/O接口112的输出结果作为新的样本数据,并存入数据库130。当然,也可以不经过客户设备140进行采集,而是由I/O接口112直接将如图所示输入I/O接口112的输入数据及输出I/O接口112的输出结果,作为新的样本数据存入数据库
130。
[0137] 值得注意的是,图3仅是本申请实施例提供的一种系统架构的示意图,图中所示设备、器件、模块等之间的位置关系不构成任何限制,例如,在图3中,数据存储系统150相对执行设备110是外部存储器,在其它情况下,也可以将数据存储系统150置于执行设备110中。如图3所示,可以根据训练设备120训练得到神经网络。
[0138] 本申请实施例还提供的一种芯片,该芯片包括神经网络处理器NPU。该芯片可以被设置在如图3所示的执行设备110中,用以完成计算模块111的计算工作。该芯片也可以被设置在如图3所示的训练设备120中,用以完成训练设备120的训练工作并输出目标模型/规则。
[0139] 神经网络处理器NPU,NPU作为协处理器挂载到主中央处理器(central processing unit,CPU)(host CPU)上,由主CPU分配任务。NPU的核心部分为运算电路,控制器控制运算电路提取存储器(权重存储器或输入存储器)中的数据并进行运算。
[0140] 在一些实现中,运算电路内部包括多个处理单元(process engine,PE)。在一些实现中,运算电路是二维脉动阵列。运算电路还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中,运算电路是通用的矩阵处理器。
[0141] 举例来说,假设有输入矩阵A,权重矩阵B,输出矩阵C。运算电路从权重存储器中取矩阵B相应的数据,并缓存在运算电路中每一个PE上。运算电路从输入存储器中取矩阵A数据与矩阵B进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器(accumulator)中。
[0142] 向量计算单元可以对运算电路的输出做进一步处理,如向量乘,向量加,指数运算,对数运算,大小比较等等。例如,向量计算单元可以用于神经网络中非卷积/非FC层的网络计算,如池化(pooling),批归一化(batch normalization),局部响应归一化(local response normalization)等。
[0143] 在一些实现种,向量计算单元能将经处理的输出的向量存储到统一缓存器。例如,向量计算单元可以将非线性函数应用到运算电路的输出,例如累加值的向量,用以生成激活值。在一些实现中,向量计算单元生成归一化的值、合并值,或二者均有。在一些实现中,处理过的输出的向量能够用作到运算电路的激活输入,例如用于在神经网络中的后续层中的使用。
[0144] 统一存储器用于存放输入数据以及输出数据。
[0145] 权重数据直接通过存储单元访问控制器(direct memory access controller,DMAC)将外部存储器中的输入数据搬运到输入存储器和/或统一存储器、将外部存储器中的权重数据存入权重存储器,以及将统一存储器中的数据存入外部存储器。
[0146] 总线接口单元(bus interface unit,BIU),用于通过总线实现主CPU、DMAC和取指存储器之间进行交互。
[0147] 与控制器连接的取指存储器(instruction fetch buffer),用于存储控制器使用的指令;
[0148] 控制器,用于调用指存储器中缓存的指令,实现控制该运算加速器的工作过程。
[0149] 一般地,统一存储器,输入存储器,权重存储器以及取指存储器均为片上(On‑Chip)存储器,外部存储器为该NPU外部的存储器,该外部存储器可以为双倍数据率同步动态随机存储器(double data rate synchronous dynamic random access memory,DDR SDRAM)、高带宽存储器(high bandwidth memory,HBM)或其他可读可写的存储器。
[0150] 由于本申请实施例涉及大量神经网络的应用,为了便于理解,下面先对本申请实施例涉及的相关术语及神经网络等相关概念进行介绍。
[0151] (1)神经网络
[0152] 神经网络可以是由神经单元组成的,神经单元可以是指以xs和截距1为输入的运算单元,该运算单元的输出可以为:
[0153]
[0154] 其中,s=1、2、……n,n为大于1的自然数,Ws为xs的权重,b为神经单元的偏置。f为神经单元的激活函数(activation functions),用于将非线性特性引入神经网络中,来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入。激活函数可以是sigmoid函数。神经网络是将许多个上述单一的神经单元联结在一起形成的网络,即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连,来提取局部接受域的特征,局部接受域可以是由若干个神经单元组成的区域。
[0155] 神经网络中的每一层的工作可以用数学表达式y=a(Wx+b)来描述:从物理层面神经网络中的每一层的工作可以理解为通过五种对输入空间(输入向量的集合)的操作,完成输入空间到输出空间的变换(即矩阵的行空间到列空间),这五种操作包括:1、升维/降维;2、放大/缩小;3、旋转;4、平移;5、“弯曲”。其中1、2、3的操作由Wx完成,4的操作由+b完成,5的操作则由a()来实现。这里之所以用“空间”二字来表述是因为被分类的对象并不是单个事物,而是一类事物,空间是指这类事物所有个体的集合。其中,W是权重向量,该向量中的每一个值表示该层神经网络中的一个神经元的权重值。该向量W决定着上文所述的输入空间到输出空间的空间变换,即每一层的权重W控制着如何变换空间。训练神经网络的目的,也就是最终得到训练好的神经网络的所有层的权重矩阵(由很多层的向量W形成的权重矩阵)。因此,神经网络的训练过程本质上就是学习控制空间变换的方式,更具体的就是学习权重矩阵。
[0156] 因为希望神经网络的输出尽可能的接近真正想要预测的值,所以可以通过比较当前网络的预测值和真正想要的目标值,再根据两者之间的差异情况来更新每一层神经网络的权重向量(当然,在第一次更新之前通常会有初始化的过程,即为神经网络中的各层预先配置参数),比如,如果网络的预测值高了,就调整权重向量让它预测低一些,不断的调整,直到神经网络能够预测出真正想要的目标值。因此,就需要预先定义“如何比较预测值和目标值之间的差异”,这便是损失函数(loss function)或目标函数(objective function),它们是用于衡量预测值和目标值的差异的重要方程。其中,以损失函数举例,损失函数的输出值(loss)越高表示差异越大,那么神经网络的训练就变成了尽可能缩小这个loss的过程。
[0157] (2)反向传播算法
[0158] 神经网络可以采用误差反向传播(back propagation,BP)算法在训练过程中修正初始的神经网络模型中参数的大小,使得神经网络模型的重建误差损失越来越小。具体地,前向传递输入信号直至输出会产生误差损失,通过反向传播误差损失信息来更新初始的神经网络模型中参数,从而使误差损失收敛。反向传播算法是以误差损失为主导的反向传播运动,旨在得到最优的神经网络模型的参数,例如权重矩阵。
[0159] 下面从神经网络的训练侧和神经网络的应用侧对本申请提供的方法进行描述。
[0160] 本申请实施例提供的模型训练方法,涉及图像的处理,具体可以应用于数据训练、机器学习、深度学习等数据处理方法,对训练数据(如本申请实施例提供的模型训练方法中的目标图像)进行符号化和形式化的智能信息建模、抽取、预处理、训练等,最终得到训练好的神经网络(如本申请实施例中的图像处理模型);并且,本申请实施例提供的图像增强方法可以运用上述训练好的神经网络,将输入数据(如本申请实施例提供的图像增强方法中的目标图像)输入到所述训练好的神经网络中,得到输出数据(如本申请实施例提供的图像增强方法中,目标图像的纹理信息的第一特征、目标图像的颜色信息的第二特征、纹理引导图、颜色引导图、第七特征以及增强后的目标图像等等)。需要说明的是,本申请实施例提供的模型训练方法和图像增强方法是基于同一个构思产生的发明,也可以理解为一个系统中的两个部分,或一个整体流程的两个阶段:如模型训练阶段和模型应用阶段。
[0161] 图4为本申请实施例提供的图像增强方法的一个流程示意图,该方法可通过图像处理模型和数学变换模块实现,下文结合图5对图像处理模型和数学变换模块之间的关系进行简单的介绍。如图5所示(图5为本申请实施例提供的图像处理模型的一个结构示意图),图像处理模型分为两个部分,数学变换模块设置于图像处理模型的第一部分与第二部分之间。其中,图像处理模型的第一部分包含第一特征提取层、第二特征提取层以及融合层,图像处理模块的第二部分包含图像重构层。下文将结合图4和图5,对本申请提供的图像增强方法进行具体介绍,该方法包括:
[0162] 401、对目标图像进行预处理,得到目标图像的纹理信息以及目标图像的颜色信息。
[0163] 在获取待增强的目标图像后,可对目标图像先进行预处理,从而得到目标图像的纹理信息(纹理图像)以及目标图像的颜色信息(颜色图像)。具体地,可通过以下方式实现目标图像的预处理:
[0164] 获取目标图像后,先对目标图像进行下采样处理,得到下采样后的目标图像,可以理解的是,下采样后的目标图像相较于原始的目标图像而言,下采样后的目标图像的尺寸较小且分辨率较低。然后,对下采样后的目标图像进行分离处理,得到目标图像的纹理信息以及目标图像的颜色信息,例如,可对下采样后的目标图像进行一定程度的高斯模糊处理,再去除其中的高频信息,得到目标图像的颜色信息,并用下采样后的目标图像减去颜色信息,得到目标图像的纹理信息等等。
[0165] 402、通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征。
[0166] 403、通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征。
[0167] 得到目标图像的纹理信息和目标图像的颜色信息后,可将目标图像的纹理信息和目标图像的颜色信息输入至图像处理模型的第一特征提取层,以通过第一特征提取层对目标图像的纹理信息进行特征提取处理,得到目标图像的纹理信息的第一特征,并通过第一特征提取层对目标图像的颜色信息进行特征提取处理,得到目标图像的颜色信息的第二特征。第一特征提取层得到第一特征和第二特征后,可将第一特征和第二特征输入至融合层,以通过融合层对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过融合层对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征。
[0168] 具体地,如图6所示(图6为本申请实施例提供的第一特征提取层和融合层的一结构示意图),第一特征提取层通常包含依次连接的N个卷积层,融合层包含N个第一融合层和N个第二融合层,其中,第1个第一融合层与第1个卷积层连接,第i个第一融合层与第i个第二融合层连接,第i个卷积层与第i个第二融合层连接,i=1,...,N,N为大于或等于1的整数。
[0169] 在得到目标图像的纹理信息和颜色信息后,可将其输入至N个卷积层中的第1个卷积层,以通过N个卷积层对目标图像的纹理信息进行多级卷积处理,得到N个卷积层分别输出的第一子特征,即N个第一子特征(相当于前述的第一特征),并通过N个卷积层对目标图像的颜色信息进行多级卷积处理,得到N个卷积层分别输出的第二子特征,即N个第二子特征(相当于前述的第二特征)。
[0170] 得到N个第一子特征和N个第二子特征后,可通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征,并通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征,再通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征。其中,i=1,…,N,当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征。
[0171] 例如,第1个卷积层可将第1个第一子特征和第1个第二子特征输入至第1个第一融合层以及第1个第二融合层,以通过第1个第一融合层对第1个第一子特征和第1个第二子特征进行卷积处理以及归一化处理,得到第1个第三子特征,并通过第1个第二融合层对第1个第一子特征和第1个第二子特征进行归一化处理,得到第1个第五子特征,再通过第1个第一融合层对第1个第二子特征以及第1个第五子特征进行卷积处理和相加处理,得到第1个第四子特征。
[0172] 第1个第一融合层可将第1个第三子特征和第1个第四子特征输入至第2个第一融合层,第2个卷积层可将第2个第一子特征和第2个第二子特征输入至第2个第二融合层,以通过第2个第一融合层对第1个第三子特征和第1个第四子特征进行卷积处理以及归一化处理,得到第2个第三子特征,并通过第2个第二融合层对第2个第一子特征和第2个第二子特征进行归一化处理,得到第2个第五子特征,再通过第2个第一融合层对第1个第四子特征以及第2个第五子特征进行卷积处理和相加处理,得到第2个第四子特征。
[0173] 以此类推,第N‑1个第一融合层可将第N‑1个第三子特征和第N‑1个第四子特征输入至第N个第一融合层,第N个卷积层可将第N个第一子特征和第N个第二子特征输入至第N个第二融合层,以通过第N个第一融合层对第N‑1个第三子特征和第N‑1个第四子特征进行卷积处理以及归一化处理,得到第N个第三子特征,并通过第N个第二融合层对第N个第一子特征和第N个第二子特征进行归一化处理,得到第N个第五子特征,再通过第N个第一融合层对第N‑1个第四子特征以及第N个第五子特征进行卷积处理和相加处理,得到第N个第四子特征。
[0174] 进一步地,第一融合层的结构可如图7所示(图7为本申请实施例提供的第一融合层和第二融合层的一个结构示意图),第一融合层可包含两个分支,第一分支可包含依次直接连接的卷积层、归一化层以及卷积层,第二分支可包含依次直接连接的卷积层、相加层以及卷积层。第二融合层则为一个归一化层,需要说明的是,第一融合层包含的归一化层和第二融合层是相同的。为了进一步理解第一融合层和第二融合层的工作过程,下文以第N个第一融合层和第N个第二融合层的工作过程进行介绍:
[0175] 第N‑1个第一融合层将第N‑1个第三子特征发送至第N个第一融合层的第一分支后,第一分支接收的卷积层可对第N‑1个第三子特征进行卷积处理,得到卷积后的第N‑1个第三子特征。同样地,第N‑1个第一融合层将第N‑1个第四子特征发送至第N个第一融合层的第二分支后,第二分支的卷积层可对第N‑1个第四子特征进行卷积处理,得到卷积后的第N‑1个第四子特征。
[0176] 与此同时,第N个卷积层可将第N个第一子特征和第N个第二子特征发送至第N个第二融合层后,第N个第二融合层对第N个第一子特征和第N个第二子特征进行归一化处理,得到第N个第五子特征。
[0177] 接着,第一分支的归一化层可对卷积后的第N‑1个第三子特征以及卷积后的第N‑1个第四子特征进行归一化处理,得到归一化后的特征。然后,第一分支的卷积层再对归一化后的特征进行卷积处理,从而得到第N个第三子特征。
[0178] 相应地,第二分支的相加层可对卷积后的第N‑1个第四子特征以及第N个第五子特征进行相加处理,得到相加后的特征。然后,第二分支的卷积层再对相加后的特征进行卷积处理,从而得到第N个第四子特征。
[0179] 值得注意的是,第N个第一融合层的归一化层所执行的归一化处理以及第N个第二融合层所执行的归一化处理是相同的,二者的归一化处理可通过以下公式实现:
[0180]
[0181] 上式中,t为纹理特征(例如,第N个第一子特征和卷积后的第N‑1个第三子特征),c为颜色特征(例如,第N个第二子特征和卷积后的第N‑1个第四子特征),sigmoid为非线性sigmoid函数,pool为池化处理,μ为求平均值处理,σ为标准差处理。
[0182] 得到第N个第三子特征和第N个第四子特征后,也就相当于得到纹理信息的第三特征和颜色信息的第四特征。
[0183] 应理解,在N个卷积层中,相邻的两个卷积层之间可直接连接,也可间接连接(即相邻的两个卷积层之间可设置有若干个卷积层),此处不做限定。
[0184] 还应理解,为了方便介绍,本实施例中仅以第一特征提取层包含N个卷积层进行示意性说明。在实际应用中,第一特征提取层通常包含两个分支,第一分支包含依次连接的N个第一卷积层,可用于对目标图像的纹理信息进行多级卷积处理。第二分支也包含依次连接的N个第二卷积层,可用于对目标图像的颜色信息进行多级卷积处理。可见,本实施例中,N个卷积层中的每个卷积层包含一个第一卷积层和一个第二卷积层。
[0185] 还应理解,由于N个卷积层依次连接,故在N个第一子特征中,第2个第一子特征是基于第1个第一子特征确定的,第3第一子特征是基于第2个第一子特征确定的,...,第N个第一子特征是基于第N‑1个第一子特征确定的。同样地,N个第二子特征也是如此,此处不再赘述。
[0186] 还应理解,图7仅起示意性说明的作用,并不对本申请的第一融合层的结构构成限制。例如,第一融合层的第一分支可包含三个卷积层以及两个归一化层,第二分值可包含三个卷积层等等。
[0187] 还应理解,第1个第一融合层和第1个第二融合层的工作流程,可参考第N个第一融合层和第N个第二融合层的工作过程。同样地,第2个第一融合层和第2个第二融合层的工作流程,可参考第N个第一融合层和第N个第二融合层的工作过程,...,第N‑1个第一融合层和第N‑1个第二融合层的工作流程,可参考第N个第一融合层和第N个第二融合层的工作过程。
[0188] 404、根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格。
[0189] 得到纹理信息的第三特征和颜色信息的第四特征后,可根据第三特征生成纹理信息的第一双边网格,并根据第四特征生成颜色信息的第二双边网格。需要说明的是,第三特征和第四特征通常为具备三个维度的特征,那么,基于第三特征生成的第一双边网格也为具备三个维度的双边网格,且每个维度上包含多个仿射变换矩阵。例如,设存在尺寸是[16,16,96]的第三特征,即第三特征的高度为16,宽度为16,且深度为96。那么,基于第三特征可生成尺寸为[16,16,8,12]的第一双边网格,第一双边网格的高度为16,宽度为16,深度为8,且每个纬度上均包含尺寸为3*4的仿射变换矩阵,即第一双边网格一共包含16*16*8个尺寸为3*4的仿射变换矩阵。
[0190] 405、对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息。
[0191] 得到纹理信息的第一双边网格和颜色信息的第二双边网格,可分别对第一双边网格和第二双边网格分别进行网络重构处理,可相应得到纹理信息的第三双边网格和颜色信息的第四双边网格,其中,网格重构处理用于去除双边网格中作用较小的信息,保留双边网格中作用较大的信息(即核心信息)。具体地,前述网格重构处理可通过多个方式实现,下文将分别进行介绍:
[0192] 在一种可能的实现方式中,可对第一双边网格的高度、宽度以及深度均进行分解处理和重构处理,再对得到的三个双边网格进行融合处理,得到第三双边网格。具体地,该过程包括:(1)对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格。依旧如上述例子,第一双边网格的高度为16,可将第一双边网格的高度从16压缩为6(对于第一双边网格的高度而言,相当于去除了作用较小的信息,仅保留了作用较大的信息),再将第一双边网格的高度从6重构为16(高度重构的过程中,先前保留的作用较大的信息保持不变,且不添加新的信息),至此,则对第一双边网格的高度完成了tucker分解处理和tucker重构处理,从而得到高度处理后的第一双边网格。(2)对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格。依旧如上述例子,第一双边网格的宽度为16,可将第一双边网格的宽度从16压缩为8(对于第一双边网格的宽度而言,相当于去除了作用较小的信息,仅保留了作用较大的信息),再将第一双边网格的宽度从8重构为16(宽度重构的过程中,先前保留的作用较大的信息保持不变,且不添加新的信息),至此,则对第一双边网格的宽度完成了tucker分解处理和tucker重构处理,从而得到宽度处理后的第一双边网格。(3)对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格。依旧如上述例子,第一双边网格的深度为8,可将第一双边网格的深度从8压缩为2(对于第一双边网格的深度而言,相当于去除了作用较小的信息,仅保留了作用较大的信息),再将第一双边网格的深度从2重构为8(深度重构的过程中,先前保留的作用较大的信息保持不变,且不添加新的信息),至此,则对第一双边网格的深度完成了tucker分解处理和tucker重构处理,从而得到深度处理后的第一双边网格。(4)得到高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这三个双边网格进行加权求和处理,从而得到第三双边网格。
[0193] 进一步地,可对第二双边网格的高度、宽度以及深度均进行分解处理和重构处理,再对得到的三个双边网格进行融合处理,得到第四双边网格。具体地,该过程包括:(1)对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格。(2)对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格。(3)对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格。(4)对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。关于第二双边网格的高度、宽度以及深度的tucker分解处理和tucker重构处理的说明,可参考前述第一双边网格的高度、宽度以及深度的tucker分解处理和tucker重构处理的相关说明部分,此处不再赘述。
[0194] 在另一种可能的实现方式中,可对第一双边网格的高度和宽度均进行分解处理和重构处理,再对得到的两个双边网格进行融合处理,得到第三双边网格。具体地,该过程包括:(1)对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格。(2)对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格。(3)得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格。
[0195] 进一步地,可对第二双边网格的高度以及宽度均进行分解处理和重构处理,再对得到的两个双边网格进行融合处理,得到第四双边网格。具体地,该过程包括:(1)对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格。(2)对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格。(3)对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0196] 在另一种可能的实现方式中,可对第一双边网格的高度和深度均进行分解处理和重构处理,再对得到的两个双边网格进行融合处理,得到第三双边网格。具体地,该过程包括:(1)对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格。(2)对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格。(3)得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格。
[0197] 进一步地,可对第二双边网格的高度以及深度均进行分解处理和重构处理,再对得到的两个双边网格进行融合处理,得到第四双边网格。具体地,该过程包括:(1)对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格。(2)对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格。(3)对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0198] 在另一种可能的实现方式中,可对第一双边网格的宽度和深度均进行分解处理和重构处理,再对得到的两个双边网格进行融合处理,得到第三双边网格。具体地,该过程包括:(1)对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格。(2)对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格。(3)得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格。
[0199] 进一步地,可对第二双边网格的宽度以及深度均进行分解处理和重构处理,再对得到的两个双边网格进行融合处理,得到第四双边网格。具体地,该过程包括:(1)对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格。(2)对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格。(3)对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0200] 在另一种可能的实现方式中,可对第一双边网格的高度进行分解处理和重构处理,得到第三双边网格。具体地,该过程包括:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格。
[0201] 进一步地,可对第二双边网格的高度进行分解处理和重构处理,得到第四双边网格。具体地,该过程包括:对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0202] 在另一种可能的实现方式中,可对第一双边网格的宽度进行分解处理和重构处理,得到第三双边网格。具体地,该过程包括:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格。
[0203] 进一步地,可对第二双边网格的宽度进行分解处理和重构处理,得到第四双边网格。具体地,该过程包括:对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0204] 在另一种可能的实现方式中,可对第一双边网格的深度进行分解处理和重构处理,得到第三双边网格。具体地,该过程包括:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格。
[0205] 进一步地,可对第二双边网格的深度进行分解处理和重构处理,得到第四双边网格。具体地,该过程包括:对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0206] 406、对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格。
[0207] 得到纹理信息的第三双边网格和颜色信息的第四双边网格,可分别对第三双边网格和第四双边网格进行上采样处理,以相应得到纹理信息的第五双边网格和颜色信息的第六双边网格。具体地,上采样处理可通过以下方式实现:
[0208] (1)在获取目标图像后,可将目标图像输入至图像处理模型的第二特征提取层(例如,第二特征提取层可包含至少一个卷积层等等),以通过第二特征提取层对目标图像进行特征提取处理(例如,卷积处理等等),得到纹理引导图和颜色引导图。
[0209] (2)得到第三双边网格和第四双边网格后,可以纹理引导图为参考,对第三双边网格进行插值处理,得到第五双边网格,并以颜色引导图为参考,对第四双边网格进行插值处理,得到第六双边网格。至此,第五双边网格的分辨率则和原始的目标图像的分辨率相同,第六双边网格的分辨率也和原始的目标图像的分辨率相同。
[0210] 应理解,图5所示的图像处理模型,第二特征提取层可包含两个分支(如图5中位于上方的分支和位于下方的分支),这两个分支的结构可以是一样的,但两个分支的参数是不同的,故其中一个分支用于对原始的目标图像进行特征提取,得到纹理引导图,另一个分支用于对原始的目标图像进行特征提取,得到颜色引导图。
[0211] 407、根据第五双边网格对目标图像进行仿射变换,得到第五特征,并根据第六双边网格对目标图像进行仿射变换,得到第六特征。
[0212] 得到纹理信息的第五双边网格和颜色信息的第六双边网格后,可利用第五双边网格对目标图像进行仿射变换,得到目标图像的纹理信息的第五特征,并根据第六双边网格对目标图像进行仿射变换,得到目标图像的颜色信息的第六特征。可以理解的是,第五特征的分辨率则和原始的目标图像的分辨率相同,第六特征的分辨率也和原始的目标图像的分辨率相同。
[0213] 408、通过图像处理模型对第五特征和第六特征进行图像重构处理,得到增强后的目标图像。
[0214] 得到目标图像的纹理信息的第五特征和目标图像的颜色信息的第六特征后,可将第五特征和第六特征输入至图像处理模型的图像重构层,以使得图像重构层对第五特征和第六特征进行图像重构处理,得到增强后的目标图像。具体地,前述图像重构处理可通过以下方式实现:
[0215] (1)通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征,第七特征包含目标图像的纹理信息和颜色信息。其中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。例如,图像重构层中包含归一化层(该归一化层可以和第一融合层中的归一化层、第二融合层相同),该归一化层接收到第五特征和第六特征后,则对第五特征和第六特征进行归一化处理,从而得到第七特征。
[0216] (2)得到第七特征后,通过图像重构层对第七特征进行卷积处理,得到增强后的目标图像。依旧如上述例子,图像重构层还包含依次连接的卷积层,卷积层接收来自归一化层的第七特征后,可对第七特征进行卷积处理,从而得到增强后的目标图像。
[0217] 应理解,本实施例中步骤402、步骤403、步骤406的子步骤(2)和步骤408均通过图像处理模型实现,步骤404、步骤405、步骤406的子步骤(1)和步骤407均通过数学变换模块实现。
[0218] 此外,可将本申请实施例提供的图像增强方法与相关技术的图像增强方法进行比较。具体地,可利用相同的测试样本,使用本申请实施例提供的图像增强方法与相关技术的图像增强方法进行测试,得到的结果如表1所示:
[0219] 表1
[0220]
[0221]
[0222] 有表1,本申请实施例提供的方法,相较于相关技术的方法而言,具有更好的可知峰值信噪比(peak signal to noise ratio,PSNR)、结构相似性(structural similarity,SSIM)、质量分数(Q‑Score)以及执行时间。由此可见,本申请实施例提供的方法的性能明显优于相关技术的方法的性能。
[0223] 本申请实施例中,获取待增强的目标图像后,可通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征。接着,通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过图像处理模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征。然后,根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格。最后,根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像。前述过程中,由于第三特征是在纹理信息的第一特征的基础上融入了颜色信息的第二特征得到的,第四特征是在颜色信息的第二特征的基础上融入了纹理信息的第一特征得到的,故基于第三特征生成的第一双边网格,不仅包含目标图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含目标图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于目标图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的目标图像,可精确显示出需要突出的图像信息(例如,纹理、颜色、饱和度、亮度、动态范围、对比度等等),从而提高图像增强效果。
[0224] 进一步地,本申请实施例中,可对第一双边网格和第二双边网格分别进行tucker分解和tucker重构,有利于过滤这两个双边网格中一部分作用较小的信息,那么,在基于得到的第三双边网格和第四双边网格对目标图像进行后续处理的过程中,可避免双边网格对目标图像产生噪声以及错误边界等问题的出现。
[0225] 更进一步地,本申请实施例中,大部分步骤均是在下采样后的目标图像的基础上所进行的(例如,步骤401至步骤405),由于下采样后的目标图像的分辨率低于原始的目标哦图像,故不会引入过多的计算、存储开销,故本申请实施例提供的方法可在硬件资源较为一般的电子设备(例如,手机等终端设备)上实现。
[0226] 以上是对本申请实施例提供的图像增强方法所进行的详细说明,以下将对本申请实施例提供的模型训练方法进行介绍。图8为本申请实施例提供的模型训练方法的一个流程示意图,如图8所示,该方法包括:
[0227] 801、获取待处理图像以及对待处理图像进行图像增强后的真实图像。
[0228] 802、对待处理图像进行预处理,得到待处理图像的纹理信息以及待处理图像的颜色信息。
[0229] 在需要对待训练模型进行训练时,可获取一批训练图像,包含用于训练的待处理图像。其中,待训练模型包含两个部分,图像处理模型的第一部分包含第一特征提取层、第二特征提取层以及融合层,图像处理模块的第二部分包含图像重构层。值得注意的是,对待处理图像进行图像增强后的真实图像是已确定的。
[0230] 对于待处理图像而言,可对其进行预处理,得到待处理图像的纹理信息以及待处理图像的颜色信息。关于预处理的介绍,可参考图4所示实施例中步骤401的相关说明部分,此处不再赘述。
[0231] 803、通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征。
[0232] 得到待处理图像的纹理信息以及待处理图像的颜色信息后,可将待处理图像的纹理信息和颜色信息输入至待训练模型的第一特征提取层,以通过第一特征提取层对纹理信息进行特征提取处理,得到待处理图像的纹理信息的第一特征,并通过第一特征提取层对颜色信息进行特征提取处理,得到待处理图像的颜色信息的第二特征。
[0233] 具体地,第一特征提取层包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,第一特征提取层可通过以下方式实现特征提取处理:
[0234] 通过N个卷积层对待处理图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征,并通过N个卷积层对待处理图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。
[0235] 804、通过待训练模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征。
[0236] 第一特征提取层得到第一特征和第二特征后,可将第一特征和第二特征输入至融合层,以通过融合层对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过融合层对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征。
[0237] 具体地,融合层包含N个第一融合层以及N个第二融合层,融合层可通过以下方式实现第一融合处理和第二融合处理:
[0238] 通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征,并通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征,再通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征。
[0239] 其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。
[0240] 得到第N个第三子特征和第N个第四子特征后,也就相当于得到纹理信息的第三特征和颜色信息的第四特征。
[0241] 805、根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格。
[0242] 得到纹理信息的第三特征和颜色信息的第四特征后,可根据第三特征生成纹理信息的第一双边网格,并根据第四特征生成颜色信息的第二双边网格。
[0243] 806、对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息。
[0244] 得到纹理信息的第一双边网格和颜色信息的第二双边网格,可分别对第一双边网格和第二双边网格分别进行网络重构处理,可相应得到纹理信息的第三双边网格和颜色信息的第四双边网格,其中,网格重构处理用于去除双边网格中作用较小的信息,保留双边网格中作用较大的信息。
[0245] 具体地,网格重构处理可通过多种方式实现,下文将分别进行介绍:
[0246] 在一种可能的实现方式中,对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0247] 在另一种可能的实现方式中,对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0248] 在另一种可能的实现方式中,对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0249] 在另一种可能的实现方式中,对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0250] 在另一种可能的实现方式中,对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0251] 在另一种可能的实现方式中,对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0252] 在另一种可能的实现方式中,对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0253] 807、对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格。
[0254] 得到纹理信息的第三双边网格和颜色信息的第四双边网格,可分别对第三双边网格和第四双边网格进行上采样处理,以相应得到纹理信息的第五双边网格和颜色信息的第六双边网格。具体地,上采样处理可通过以下方式实现:
[0255] 通过第二特征提取层对待处理图像进行特征提取处理,得到纹理引导图和颜色引导图。然后,根据纹理引导图对第三双边网格进行插值处理,得到第五双边网格,并根据颜色引导图对第四双边网格进行插值处理,得到第六双边网格。
[0256] 808、根据第五双边网格对待处理图像进行仿射变换,得到第五特征,并根据第六双边网格对待处理图像进行仿射变换,得到第六特征。
[0257] 得到纹理信息的第五双边网格和颜色信息的第六双边网格后,可利用第五双边网格对待处理图像进行仿射变换,得到待处理图像的纹理信息的第五特征,并根据第六双边网格对待处理图像进行仿射变换,得到待处理图像的颜色信息的第六特征。
[0258] 809、通过待训练模型对第五特征和第六特征进行图像重构处理,得到预测图像。
[0259] 得到待处理图像的纹理信息的第五特征和待处理图像的颜色信息的第六特征后,可将第五特征和第六特征输入至待训练模型的图像重构层,以使得图像重构层对第五特征和第六特征进行图像重构处理,得到对待处理图像进行图像增强后的预测图像。具体地,前述图像重构处理可通过以下方式实现:
[0260] 通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征。然后,通过图像重构层对第七特征进行卷积处理,得到预测图像,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0261] 810、根据预测图像、真实图像以及处理后的预测图像,获取目标损失,目标损失用于指示预测图像以及真实图像之间的差异,以及预测图像以及处理后的预测图像之间的差异。
[0262] 得到预测图像后,可对预测图像依次进行像素翻转处理和模糊处理,从而得到处理后的预测图像。那么,可根据预测图像、真实图像以及处理后的预测图像进行计算,以得到目标损失,目标损失可用于指示预测图像以及真实图像之间的差异,以及预测图像以及处理后的预测图像之间的差异。具体地,目标损失可通过以下公式计算得到:
[0263]
[0264]
[0265]
[0266] 上式中,Jj为D个训练图像中的第j个图像(例如,待处理图像),Tj为对Jj进行图像增强后的真实图像,λ为预置的参数,255为待处理图像的像素的最大值,mask为对Jj的进行像素翻转处理(例如,将Jj中每个像素的取值设置为原始取值与255之间的差值等等),再进行模糊处理(例如,按一定的半径进行高斯模糊处理等等)后所得到的预测图像。
[0267] 811、根据目标损失对待训练模型的模型参数进行更新,直至满足模型训练条件,得到图像处理模型。
[0268] 得到目标损失后,可基于目标损失对待训练模型的模型参数进行更新,并利用下一批训练样本对更新参数后的待训练模型进行训练(即重新执行步骤801至步骤811),直至满足模型训练条件(例如,目标损失达到收敛等等),可得到图像处理模型。
[0269] 本申请实施例所得到的图像处理模型,具备对待处理图像进行图像增强的能力。在图像增强的过程中,图像处理模型可在纹理信息的第一特征的基础上融入了颜色信息的第二特征,得到第三特征,且图像处理模型可在颜色信息的第二特征的基础上融入了纹理信息的第一特征,得到第四特征。故基于第三特征生成的第一双边网格,不仅包含待处理图像的纹理信息,还包含纹理信息和颜色信息之间的关联关系,基于第四特征生成的第二双边网格,不仅包含待处理图像的颜色信息,还包含纹理信息和颜色信息之间的关联关系,两个双边网格中包含的有关于待处理图像的信息较为全面,那么,基于第一双边网格和第二双边网格所得到的增强后的待处理图像,可精确显示出需要突出的图像信息,从而提高图像增强效果。
[0270] 以上是对本申请实施例提供的模型训练方法所进行的详细说明,以下将对本申请实施例提供的图像增强装置和模型训练装置分别进行介绍。图9为本申请实施例提供的图像增强装置的一个结构示意图。如图9所示,该装置包括:
[0271] 第一获取模块901,用于通过图像处理模型获取目标图像的纹理信息的第一特征以及目标图像的颜色信息的第二特征;
[0272] 融合模块902,用于通过图像处理模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过图像处理模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征;
[0273] 生成模块903,用于根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格;
[0274] 增强模块904,用于根据第一双边网格和第二双边网络对目标图像进行增强处理,得到增强后的目标图像。
[0275] 在一种可能的实现方式中,图像处理模型包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,第一获取模块901,用于:通过N个卷积层对目标图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征;通过N个卷积层对目标图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。
[0276] 在一种可能的实现方式中,图像处理模型还包含N个第一融合层以及N个第二融合层,融合模块902,用于:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征;通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征;通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。
[0277] 在一种可能的实现方式中,该装置还包括:第二获取模块,用于获取目标图像;下采样模块,用于对目标图像进行下采样处理,得到下采样后的目标图像;分离模块,用于对下采样后的目标图像进行分离处理,得到目标图像的纹理信息以及目标图像的颜色信息。
[0278] 在一种可能的实现方式中,图像处理模型还包括图像重构层,增强模块904,用于:对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息;对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格;根据第五双边网格对目标图像进行仿射变换,得到第五特征,并根据第六双边网格对目标图像进行仿射变换,得到第六特征;通过图像重构层对第五特征和第六特征进行图像重构处理,得到增强后的目标图像。
[0279] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0280] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0281] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0282] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0283] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0284] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0285] 在一种可能的实现方式中,增强模块904,用于:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0286] 在一种可能的实现方式中,图像处理模型还包含特征提取层,增强模块904,用于:通过特征提取层对目标图像进行特征提取处理,得到纹理引导图和颜色引导图;根据纹理引导图对第三双边网格进行插值处理,得到第五双边网格,并根据颜色引导图对第四双边网格进行插值处理,得到第六双边网格。
[0287] 在一种可能的实现方式中,增强模块904,用于:通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征;通过图像重构层对第七特征进行卷积处理,得到增强后的目标图像。
[0288] 在一种可能的实现方式中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0289] 图10为本申请实施例提供的模型训练装置的一个结构示意图。如图10所示,该装置包括:
[0290] 第一获取模块1001,用于获取待处理图像以及对待处理图像进行图像增强后的真实图像;
[0291] 第二获取模块1002,用于通过待训练模型获取待处理图像的纹理信息的第一特征以及待处理图像的颜色信息的第二特征;
[0292] 融合模块1003,用于通过待训练模型对第一特征和第二特征进行第一融合处理,得到纹理信息的第三特征,并通过待训练模型对第一特征和第二特征进行第二融合处理,得到颜色信息的第四特征;
[0293] 生成模块1004,用于根据第三特征生成第一双边网格,并根据第四特征生成第二双边网格;
[0294] 增强模块1005,用于根据第一双边网格和第二双边网络对待处理图像进行增强处理,得到预测图像;
[0295] 第三获取模块1006,用于根据预测图像、真实图像以及处理后的预测图像,获取目标损失,目标损失用于指示预测图像以及真实图像之间的差异,以及预测图像以及处理后的预测图像之间的差异;
[0296] 更新模块1007,用于根据目标损失对待训练模型的模型参数进行更新,直至满足模型训练条件,得到图像处理模型。
[0297] 在一种可能的实现方式中,处理后的预测图像为像素翻转处理和模糊处理后的预测图像。
[0298] 在一种可能的实现方式中,待训练模型包含依次连接的N个卷积层,第一特征包含N个第一子特征,第二特征包含N个第二子特征,第二获取模块1002,用于:通过N个卷积层对待处理图像的纹理信息进行卷积处理,得到N个卷积层分别输出的第一子特征;通过N个卷积层对待处理图像的颜色信息进行卷积处理,得到N个卷积层分别输出的第二子特征。
[0299] 在一种可能的实现方式中,待训练模型还包含N个第一融合层以及N个第二融合层,融合模块1003,用于:通过第i个第一融合层对第i‑1个第一融合层输出的第i‑1个第三子特征以及第i‑1个第四子特征进行卷积处理以及归一化处理,得到第i个第三子特征;通过第i个第二融合层对第i个第一子特征以及第i个第二子特征进行归一化处理,得到第i个第五子特征;通过第i个第一融合层对第i‑1个第四子特征以及第i个第五子特征进行卷积处理和相加处理,得到第i个第四子特征;其中,i=1,…,N;当i=1时,第i‑1个第三子特征为第1个第一子特征,第i‑1个第四子特征为第1个第二子特征;当i=N时,第i个第三子特征为第三特征,第i个第四子特征为第四特征。
[0300] 在一种可能的实现方式中,该装置还包括:第四获取模块,用于获取待处理图像;下采样模块,用于对待处理图像进行下采样处理,得到下采样后的待处理图像;分离模块,用于对下采样后的待处理图像进行分离处理,得到待处理图像的纹理信息以及待处理图像的颜色信息。
[0301] 在一种可能的实现方式中,待训练模型还包括图像重构层,增强模块1005,用于:对第一双边网格进行网格重构处理,得到第三双边网格,并对第二双边网格进行网格重构处理,得到第四双边网格,网格重构处理用于去除双边网格中的部分信息;对第三双边网格进行上采样处理,得到第五双边网格,并对第四双边网格进行上采样处理,得到第六双边网格;根据第五双边网格对待处理图像进行仿射变换,得到第五特征,并根据第六双边网格对待处理图像进行仿射变换,得到第六特征;通过图像重构层对第五特征和第六特征进行图像重构处理,得到预测图像。
[0302] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;对高度处理后的第一双边网格、宽度处理后的第一双边网格以及深度处理后的第一双边网格进行加权求和处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格、宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0303] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;得到高度处理后的第一双边网格以及宽度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对高度处理后的第二双边网格以及宽度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0304] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到高度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到高度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对高度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0305] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第一双边网格;对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第一双边网格;得到宽度处理后的第一双边网格以及深度处理后的第一双边网格后,可对这两个双边网格进行加权求和处理,从而得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到宽度处理后的第二双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到深度处理后的第二双边网格;对宽度处理后的第二双边网格以及深度处理后的第二双边网格进行加权求和处理,得到第四双边网格。
[0306] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的高度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0307] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的宽度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0308] 在一种可能的实现方式中,增强模块1005,用于:对第一双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第三双边网格;对第二双边网格的深度分别进行tucker分解处理和tucker重构处理,得到第四双边网格。
[0309] 在一种可能的实现方式中,待训练模型还包括特征提取层,增强模块1005,用于:通过特征提取层对待处理图像进行特征提取处理,得到纹理引导图和颜色引导图;根据纹理引导图对第三双边网格进行插值处理,得到第五双边网格,并根据颜色引导图对第四双边网格进行插值处理,得到第六双边网格。
[0310] 在一种可能的实现方式中,增强模块1005,用于:通过图像重构层对第五特征和第六特征进行第三融合处理,得到第七特征;通过图像重构层对第七特征进行卷积处理,得到预测图像。
[0311] 在一种可能的实现方式中,第三融合处理包含归一化处理、求和处理、相乘处理、级联处理和级联卷积处理中的至少一个。
[0312] 需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参考本申请实施例前述所示的方法实施例中的叙述,此处不再赘述。
[0313] 本申请实施例还涉及一种执行设备,图11为本申请实施例提供的执行设备的一个结构示意图。如图11所示,执行设备1100具体可以表现为手机、平板、笔记本电脑、智能穿戴设备、服务器等,此处不做限定。其中,执行设备1100上可部署有图9对应实施例中所描述的图像增强装置,用于实现图4对应实施例中图像增强的功能。具体的,执行设备1100包括:接收器1101、发射器1102、处理器1103和存储器1104(其中执行设备1100中的处理器1103的数量可以一个或多个,图10中以一个处理器为例),其中,处理器1103可以包括应用处理器11031和通信处理器11032。在本申请的一些实施例中,接收器1101、发射器1102、处理器
1103和存储器1104可通过总线或其它方式连接。
[0314] 存储器1104可以包括只读存储器和随机存取存储器,并向处理器1103提供指令和数据。存储器1104的一部分还可以包括非易失性随机存取存储器(non‑volatile random access memory,NVRAM)。存储器1104存储有处理器和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。
[0315] 处理器1103控制执行设备的操作。具体的应用中,执行设备的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都称为总线系统。
[0316] 上述本申请实施例揭示的方法可以应用于处理器1103中,或者由处理器1103实现。处理器1103可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1103中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1103可以是通用处理器、数字信号处理器(digital signal processing,DSP)、微处理器或微控制器,还可进一步包括专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field‑programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。该处理器1103可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1104,处理器1103读取存储器1104中的信息,结合其硬件完成上述方法的步骤。
[0317] 接收器1101可用于接收输入的数字或字符信息,以及产生与执行设备的相关设置以及功能控制有关的信号输入。发射器1102可用于通过第一接口输出数字或字符信息;发射器1102还可用于通过第一接口向磁盘组发送指令,以修改磁盘组中的数据;发射器1102还可以包括显示屏等显示设备。
[0318] 本申请实施例中,在一种情况下,处理器1103,用于通过图4对应实施例中的图像处理模型,对图像进行图像增强。
[0319] 本申请实施例还涉及一种训练设备,图12为本申请实施例提供的训练设备的一个结构示意图。如图12所示,训练设备1200由一个或多个服务器实现,训练设备1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1214(例如,一个或一个以上处理器)和存储器1232,一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储设备)。其中,存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对训练设备中的一系列指令操作。更进一步地,中央处理器1214可以设置为与存储介质1230通信,在训练设备1200上执行存储介质1230中的一系列指令操作。
[0320] 训练设备1200还可以包括一个或一个以上电源1226,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1258;或,一个或一个以上操作系统1241,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
[0321] 具体的,训练设备可以执行图8对应实施例中的模型训练方法。
[0322] 本申请实施例还涉及一种计算机存储介质,该计算机可读存储介质中存储有用于进行信号处理的程序,当其在计算机上运行时,使得计算机执行如前述执行设备所执行的步骤,或者,使得计算机执行如前述训练设备所执行的步骤。
[0323] 本申请实施例还涉及一种计算机程序产品,该计算机程序产品存储有指令,该指令在由计算机执行时使得计算机执行如前述执行设备所执行的步骤,或者,使得计算机执行如前述训练设备所执行的步骤。
[0324] 本申请实施例提供的执行设备、训练设备或终端设备具体可以为芯片,芯片包括:处理单元和通信单元,所述处理单元例如可以是处理器,所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令,以使执行设备内的芯片执行上述实施例描述的数据处理方法,或者,以使训练设备内的芯片执行上述实施例描述的数据处理方法。可选地,所述存储单元为所述芯片内的存储单元,如寄存器、缓存等,所述存储单元还可以是所述无线接入设备端内的位于所述芯片外部的存储单元,如只读存储器(read‑only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)等。
[0325] 具体的,请参阅图13,图13为本申请实施例提供的芯片的一个结构示意图,所述芯片可以表现为神经网络处理器NPU 1300,NPU 1300作为协处理器挂载到主CPU(Host CPU)上,由Host CPU分配任务。NPU的核心部分为运算电路1303,通过控制器1304控制运算电路1303提取存储器中的矩阵数据并进行乘法运算。
[0326] 在一些实现中,运算电路1303内部包括多个处理单元(Process Engine,PE)。在一些实现中,运算电路1303是二维脉动阵列。运算电路1303还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中,运算电路1303是通用的矩阵处理器。
[0327] 举例来说,假设有输入矩阵A,权重矩阵B,输出矩阵C。运算电路从权重存储器1302中取矩阵B相应的数据,并缓存在运算电路中每一个PE上。运算电路从输入存储器1301中取矩阵A数据与矩阵B进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器(accumulator)1308中。
[0328] 统一存储器1306用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器(Direct Memory Access Controller,DMAC)1305,DMAC被搬运到权重存储器1302中。输入数据也通过DMAC被搬运到统一存储器1306中。
[0329] BIU为Bus Interface Unit即,总线接口单元1313,用于AXI总线与DMAC和取指存储器(Instruction Fetch Buffer,IFB)1309的交互。
[0330] 总线接口单元1313(Bus Interface Unit,简称BIU),用于取指存储器1309从外部存储器获取指令,还用于存储单元访问控制器1305从外部存储器获取输入矩阵A或者权重矩阵B的原数据。
[0331] DMAC主要用于将外部存储器DDR中的输入数据搬运到统一存储器1306或将权重数据搬运到权重存储器1302中或将输入数据数据搬运到输入存储器1301中。
[0332] 向量计算单元1307包括多个运算处理单元,在需要的情况下,对运算电路1303的输出做进一步处理,如向量乘,向量加,指数运算,对数运算,大小比较等等。主要用于神经网络中非卷积/全连接层网络计算,如Batch Normalization(批归一化),像素级求和,对预测标签平面进行上采样等。
[0333] 在一些实现中,向量计算单元1307能将经处理的输出的向量存储到统一存储器1306。例如,向量计算单元1307可以将线性函数;或,非线性函数应用到运算电路1303的输出,例如对卷积层提取的预测标签平面进行线性插值,再例如累加值的向量,用以生成激活值。在一些实现中,向量计算单元1307生成归一化的值、像素级求和的值,或二者均有。在一些实现中,处理过的输出的向量能够用作到运算电路1303的激活输入,例如用于在神经网络中的后续层中的使用。
[0334] 控制器1304连接的取指存储器(instruction fetch buffer)1309,用于存储控制器1304使用的指令;
[0335] 统一存储器1306,输入存储器1301,权重存储器1302以及取指存储器1309均为On‑Chip存储器。外部存储器私有于该NPU硬件架构。
[0336] 其中,上述任一处提到的处理器,可以是一个通用中央处理器,微处理器,ASIC,或一个或多个用于控制上述程序执行的集成电路。
[0337] 另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本申请提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。
[0338] 通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,训练设备,或者网络设备等)执行本申请各个实施例所述的方法。
[0339] 在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
[0340] 所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、训练设备或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、训练设备或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的训练设备、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。