图像分割方法、装置、计算机设备及存储介质转让专利

申请号 : CN202110234267.7

文献号 : CN112598686B

文献日 : 2021-06-04

本申请实施例公开了一种图像分割方法、装置、计算机设备及存储介质，属于计算机技术领域。该方法包括：根据先验知识向量对原始图像进行编码处理，得到目标特征图，对目标特征图进行解码处理，得到原始图像的第一分割图像，根据先验知识向量，对第一分割图像进行图像重构，得到多个标注分割图像，基于多个标注分割图像对目标特征图进行处理，得到原始图像的第二分割图像。本申请实施例提供的方法，通过引入用于表示多个标注者的标注准确度的先验知识权重，重构出与多个标注者相匹配的标注分割图像，通过多个标注分割图像及目标特征图来获取原始图像的第二分割图像，使得第二分割图像中融入了多个标注者对应的标注结果，提高了图像分割的准确性。

1.一种图像分割方法，其特征在于，所述方法包括：调用第一图像分割模型，根据先验知识向量对原始图像进行编码处理，得到目标特征图，所述原始图像中包括目标物体，所述先验知识向量包括多个先验知识权重，每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度；

调用所述第一图像分割模型，对所述目标特征图进行解码处理，得到所述原始图像的第一分割图像，所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域，所述第一分割图像是所述多个先验知识权重所对应的标注者的标注结果融合后的分割图像；

调用图像重构模型，根据所述先验知识向量，对所述第一分割图像进行图像重构，得到多个标注分割图像，每个标注分割图像与一个先验知识权重对应，所述每个标注分割图像用于指示对应的标注者所标注的所述目标区域；

调用第二图像分割模型，基于所述多个标注分割图像对所述目标特征图进行处理，得到所述原始图像的第二分割图像。

2.根据权利要求1所述的方法，其特征在于，所述调用第二图像分割模型，基于所述多个标注分割图像对所述目标特征图进行处理，得到所述原始图像的第二分割图像，包括：调用所述第二图像分割模型，根据所述多个标注分割图像之间的差异，确定不确定性图像，所述不确定性图像用于指示所述多个标注分割图像指示的所述目标区域之间的差异；

将所述目标特征图与所述不确定性图像进行融合，得到所述第二分割图像。

3.根据权利要求2所述的方法，其特征在于，所述每个标注分割图像包括所述原始图像中的多个像素点对应的第一权重，所述第一权重用于表示对应的像素点在所述目标区域内的可能性；

所述调用所述第二图像分割模型，根据所述多个标注分割图像之间的差异，确定不确定性图像，包括：

调用所述第二图像分割模型，确定所述多个标注分割图像与所述多个标注分割图像的平均值图像之间的差值图像；

确定多个差值图像中位于相同位置的像素点的像素值的平方和；

将每个位置对应的平方和与所述多个标注分割图像的个数之间的比值的开方，分别确定为所述每个位置的第二权重；

根据多个位置的第二权重构建所述不确定性图像。

4.根据权利要求2所述的方法，其特征在于，所述将所述目标特征图与所述不确定性图像进行融合，得到所述第二分割图像，包括：确定所述多个标注分割图像的平均值图像；

将所述目标特征图与所述不确定性图像的乘积与所述目标特征图之和，确定为第一融合特征图；

将所述目标特征图与所述平均值图像的乘积与所述目标特征图之和，确定为第二融合特征图；

将所述第一融合特征图及所述第二融合特征图进行拼接，得到拼接融合特征图；

对所述拼接融合特征图进行卷积处理，得到所述第二分割图像。

5.根据权利要求1所述的方法，其特征在于，所述调用第一图像分割模型，根据先验知识向量对原始图像进行编码处理，得到目标特征图，包括：调用所述第一图像分割模型，对所述原始图像进行编码处理，得到所述原始图像的第一特征图；

将所述先验知识向量与所述第一特征图进行融合，得到第二特征图；

对所述第二特征图进行解码处理，得到所述目标特征图。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取样本原始图像、多个样本标注分割图像及所述先验知识向量，所述样本原始图像中包括样本物体，每个样本标注分割图像与一个先验知识权重对应，所述每个样本标注分割图像用于指示对应的标注者所标注的所述样本物体在所述样本原始图像中所处的样本区域；

调用所述第一图像分割模型，根据所述先验知识向量对所述样本原始图像进行编码处理，得到目标样本特征图；

调用所述第一图像分割模型，对所述目标样本特征图进行解码处理，得到所述样本原始图像的第一样本分割图像，所述第一样本分割图像用于指示所述样本物体在所述样本原始图像中所处的所述样本区域；

调用所述图像重构模型，根据所述先验知识向量，对所述第一样本分割图像进行图像重构，得到多个预测标注分割图像，每个预测标注分割图像与一个先验知识权重对应，所述每个预测标注分割图像用于指示预测到的对应的标注者所标注的所述样本区域；

调用所述第二图像分割模型，基于所述多个预测标注分割图像对所述目标样本特征图进行处理，得到所述样本原始图像的预测分割图像；

根据所述先验知识向量，对所述多个样本标注分割图像进行加权融合，得到融合标注分割图像；

根据所述预测分割图像与所述融合标注分割图像之间的差异，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

7.根据权利要求6所述的方法，其特征在于，所述根据所述预测分割图像与所述融合标注分割图像之间的差异，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练，包括：

根据所述预测分割图像与所述融合标注分割图像之间的差异，确定第一损失值；

根据所述第一损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

8.根据权利要求7所述的方法，其特征在于，所述根据所述第一损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练，包括：根据所述第一样本分割图像与所述融合标注分割图像之间的差异，确定第二损失值；

根据所述第一损失值及所述第二损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

9.根据权利要求7所述的方法，其特征在于，所述根据所述第一损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练，包括：根据所述多个预测标注分割图像与对应的样本标注分割图像之间的差异，确定第三损失值；

根据所述第一损失值及所述第三损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

10.根据权利要求7所述的方法，其特征在于，所述图像重构模型包括编码子模型、融合子模型及解码子模型；

所述调用所述图像重构模型，根据所述先验知识向量，对所述第一样本分割图像进行图像重构，得到多个预测标注分割图像，包括：将所述样本原始图像及所述第一样本分割图像进行拼接，得到第一样本拼接图像；

调用所述编码子模型，对所述第一样本拼接图像进行编码处理，得到第一样本特征图；

调用所述融合子模型，将所述先验知识向量与所述第一样本特征图进行融合，得到第二样本特征图；

调用所述解码子模型，对所述第二样本特征图进行解码处理，得到所述多个预测标注分割图像。

11.根据权利要求10所述的方法，其特征在于，所述方法还包括：将所述样本原始图像及所述融合标注分割图像进行拼接，得到第二样本拼接图像；

调用所述编码子模型，对所述第二样本拼接图像进行编码处理，得到第三样本特征图；

所述根据所述第一损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练，包括：

根据所述第三样本特征图与所述第一样本特征图之间的差异，确定第四损失值；

根据所述第一损失值及所述第四损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

12.一种图像分割装置，其特征在于，所述装置包括：编码模块，用于调用第一图像分割模型，根据先验知识向量对原始图像进行编码处理，得到目标特征图，所述原始图像中包括目标物体，所述先验知识向量包括多个先验知识权重，每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度；

解码模块，用于调用所述第一图像分割模型，对所述目标特征图进行解码处理，得到所述原始图像的第一分割图像，所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域，所述第一分割图像是所述多个先验知识权重所对应的标注者的标注结果融合后的分割图像；

重构模块，用于调用图像重构模型，根据所述先验知识向量，对所述第一分割图像进行图像重构，得到多个标注分割图像，每个标注分割图像与一个先验知识权重对应，所述每个标注分割图像用于指示对应的标注者所标注的所述目标区域；

处理模块，用于调用第二图像分割模型，基于所述多个标注分割图像对所述目标特征图进行处理，得到所述原始图像的第二分割图像。

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至11任一权利要求所述的图像分割方法中所执行的操作。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至11任一权利要求所述的图像分割方法中所执行的操作。

图像分割方法、装置、计算机设备及存储介质

技术领域

[0001] 本申请实施例涉及计算机技术领域，特别涉及一种图像分割方法、装置、计算机设备及存储介质。

背景技术

[0002] 随着计算机技术的发展，图像分割技术的应用越来越广泛，在很多领域中都需要进行图像分割。例如，在医疗领域能够采用图像分割技术从图像中提取某个身体部位的图
像。

[0003] 通常在对原始图像进行分割处理时，会先对原始图像进行编码处理，得到原始图像的特征图，再对该特征图进行解码处理，得到分割图像，该分割图像能够指示原始图像中
的目标物体所在的区域。但这种图像分割方式简单，图像分割的准确性差。

发明内容

[0004] 本申请实施例提供了一种图像分割方法、装置、计算机设备及存储介质，能够提高图像分割的准确性。所述技术方案包括如下内容。

[0005] 一方面，提供了一种图像分割方法，所述方法包括：

[0006] 根据先验知识向量对原始图像进行编码处理，得到目标特征图，所述原始图像中包括目标物体，所述先验知识向量包括多个先验知识权重，每个先验知识权重用于表示一
个标注者在任一图像中标注任一物体所在区域的准确度；

[0007] 对所述目标特征图进行解码处理，得到所述原始图像的第一分割图像，所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域；

[0008] 根据所述先验知识向量，对所述第一分割图像进行图像重构，得到多个标注分割图像，每个标注分割图像与一个先验知识权重对应，所述每个标注分割图像用于指示对应
的标注者所标注的所述目标区域；

[0009] 基于所述多个标注分割图像对所述目标特征图进行处理，得到所述原始图像的第二分割图像。

[0010] 在一种可能实现方式中，所述根据所述先验知识向量，对所述第一分割图像进行图像重构，得到多个标注分割图像，包括：

[0011] 将所述原始图像及所述第一分割图像进行拼接，得到拼接图像；

[0012] 对所述拼接图像进行编码处理，得到第三特征图；

[0013] 将所述先验知识向量与所述第三特征图进行融合，得到第四特征图；

[0014] 对所述第四特征图进行解码处理，得到所述多个标注分割图像。

[0015] 另一方面，提供了一种图像分割装置，所述装置包括：

[0016] 编码模块，用于根据先验知识向量对原始图像进行编码处理，得到目标特征图，所述原始图像中包括目标物体，所述先验知识向量包括多个先验知识权重，每个先验知识权
重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度；

[0017] 解码模块，用于对所述目标特征图进行解码处理，得到所述原始图像的第一分割图像，所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域；

[0018] 重构模块，用于根据所述先验知识向量，对所述第一分割图像进行图像重构，得到多个标注分割图像，每个标注分割图像与一个先验知识权重对应，所述每个标注分割图像
用于指示对应的标注者所标注的所述目标区域；

[0019] 处理模块，用于基于所述多个标注分割图像对所述目标特征图进行处理，得到所述原始图像的第二分割图像。

[0020] 在一种可能实现方式中，所述处理模块，包括：

[0021] 第一确定单元，用于根据所述多个标注分割图像之间的差异，确定不确定性图像，所述不确定性图像用于指示所述多个标注分割图像指示的目标区域之间的差异；

[0022] 第一融合单元，用于将所述目标特征图与所述不确定性图像进行融合，得到所述第二分割图像。

[0023] 在另一种可能实现方式中，所述每个标注分割图像包括所述原始图像中的多个像素点对应的第一权重，所述第一权重用于表示对应的像素点在所述目标区域内的可能性；

[0024] 所述第一确定单元，用于确定所述多个标注分割图像与所述多个标注分割图像的平均值图像之间的差值图像；确定多个差值图像中位于相同位置的像素点的像素值的平方
和；将每个位置对应的平方和与所述多个标注分割图像的个数之间的比值的开方，分别确
定为所述每个位置的第二权重；根据多个位置的第二权重构建所述不确定性图像。

[0025] 在另一种可能实现方式中，所述第一融合单元，用于确定所述多个标注分割图像的平均值图像；将所述目标特征图与所述不确定性图像的乘积与所述目标特征图之和，确
定为第一融合特征图；将所述目标特征图与所述平均值图像的乘积与所述目标特征图之
和，确定为第二融合特征图；将所述第一融合特征图及所述第二融合特征图进行拼接，得到
拼接融合特征图；对所述拼接融合特征图进行卷积处理，得到所述第二分割图像。

[0026] 在另一种可能实现方式中，所述编码模块，包括：

[0027] 第一编码单元，用于对所述原始图像进行编码处理，得到所述原始图像的第一特征图；

[0028] 第二融合单元，用于将所述先验知识向量与所述第一特征图进行融合，得到第二特征图；

[0029] 第一解码单元，用于对所述第二特征图进行解码处理，得到所述目标特征图。

[0030] 在另一种可能实现方式中，所述重构模块，包括：

[0031] 拼接单元，用于将所述原始图像及所述第一分割图像进行拼接，得到拼接图像；

[0032] 第二编码单元，用于对所述拼接图像进行编码处理，得到第三特征图；

[0033] 第三融合单元，用于将所述先验知识向量与所述第三特征图进行融合，得到第四特征图；

[0034] 第二解码单元，用于对所述第四特征图进行解码处理，得到所述多个标注分割图像。

[0035] 在另一种可能实现方式中，

[0036] 所述根据先验知识向量对原始图像进行编码处理，得到目标特征图的步骤由第一图像分割模型执行；

[0037] 所述对所述目标特征图进行解码处理，得到所述原始图像的第一分割图像的步骤由所述第一图像分割模型执行；

[0038] 所述根据所述先验知识向量，对所述第一分割图像进行图像重构，得到多个标注分割图像的步骤由图像重构模型执行；

[0039] 所述基于所述多个标注分割图像对所述目标特征图进行处理，得到所述原始图像的第二分割图像的步骤由第二图像分割模型执行。

[0040] 在另一种可能实现方式中，所述装置还包括：

[0041] 获取模块，用于获取样本原始图像、多个样本标注分割图像及所述先验知识向量，所述样本原始图像中包括样本物体，每个样本标注分割图像与一个先验知识权重对应，所
述每个样本标注分割图像用于指示对应的标注者所标注的所述样本物体在所述样本原始
图像中所处的样本区域；

[0042] 所述编码模块，还用于调用所述第一图像分割模型，根据所述先验知识向量对所述样本原始图像进行编码处理，得到目标样本特征图；

[0043] 所述解码模块，还用于调用所述第一图像分割模型，对所述目标样本特征图进行解码处理，得到所述样本原始图像的第一样本分割图像，所述第一样本分割图像用于指示
所述样本物体在所述样本原始图像中所处的样本区域；

[0044] 所述重构模块，还用于调用所述图像重构模型，根据所述先验知识向量，对所述第一样本分割图像进行图像重构，得到多个预测标注分割图像，每个预测标注分割图像与一
个先验知识权重对应，所述每个预测标注分割图像用于指示预测到的对应的标注者所标注
的所述样本区域；

[0045] 所述处理模块，还用于调用所述第二图像分割模型，基于所述多个预测标注分割图像对所述目标样本特征图进行处理，得到所述样本原始图像的预测分割图像；

[0046] 加权融合模块，用于根据所述先验知识向量，对所述多个样本标注分割图像进行加权融合，得到融合标注分割图像；

[0047] 训练模块，用于根据所述预测分割图像与所述融合标注分割图像之间的差异，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

[0048] 在另一种可能实现方式中，所述训练模块，包括：

[0049] 第二确定单元，用于根据所述预测分割图像与所述融合标注分割图像之间的差异，确定第一损失值；

[0050] 训练单元，用于根据所述第一损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

[0051] 在另一种可能实现方式中，所述训练单元，用于根据所述第一样本分割图像与所述融合标注分割图像之间的差异，确定第二损失值；根据所述第一损失值及所述第二损失
值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。

[0052] 在另一种可能实现方式中，所述训练单元，用于根据所述多个预测标注分割图像与对应的样本标注分割图像之间的差异，确定第三损失值；根据所述第一损失值及所述第
三损失值，对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训
练。

[0053] 在另一种可能实现方式中，所述图像重构模型包括编码子模型、融合子模型及解码子模型；

[0054] 所述重构模块，用于将所述样本原始图像及所述第一样本分割图像进行拼接，得到第一样本拼接图像；调用所述编码子模型，对所述第一样本拼接图像进行编码处理，得到
第一样本特征图；调用所述融合子模型，将所述先验知识向量与所述第一样本特征图进行
融合，得到第二样本特征图；调用所述解码子模型，对所述第二样本特征图进行解码处理，
得到所述多个预测标注分割图像。

[0055] 在另一种可能实现方式中，所述装置还包括：

[0056] 拼接模块，用于将所述样本原始图像及所述融合标注分割图像进行拼接，得到第二样本拼接图像；

[0057] 所述重构模块，还用于调用所述编码子模型，对所述第二样本拼接图像进行编码处理，得到第三样本特征图；

[0058] 所述训练单元，用于根据所述第三样本特征图与所述第一样本特征图之间的差异，确定第四损失值；根据所述第一损失值及所述第四损失值，对所述第一图像分割模型、
所述图像重构模型及所述第二图像分割模型进行训练。

[0059] 另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行以
实现如上述方面所述的图像分割方法中所执行的操作。

[0060] 另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如上述方面所
述的图像分割方法中所执行的操作。

[0061] 再一方面，提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机程序代码，所述计算机程序代码存储在计算机可读存储介质中。计算
机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行所述计算机程
序代码，使得所述计算机设备实现如上述方面所述的图像分割方法中所执行的操作。

[0062] 本申请实施例提供的技术方案带来的有益效果至少包括：

[0063] 本申请实施例提供的方法、装置、计算机设备及存储介质，在对原始图像进行分割的过程中，通过引入用于表示多个标注者的标注准确度的先验知识权重，重构出与多个标
注者相匹配的标注分割图像，以指示目标物体在原始图像中所处的目标区域，即重构出了
多个标注者对原始图像的多种标注结果，之后，通过多个标注分割图像及原始图像的目标
特征图来获取原始图像的第二分割图像，使得第二分割图像中融入了多个标注者对应的标
注结果，保证第二分割图像的准确性，从而提高了图像分割的准确性。

附图说明

[0064] 为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例的一些实施
例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获
得其他的附图。

[0065] 图1是本申请实施例提供的一种实施环境的结构示意图；

[0066] 图2是本申请实施例提供的一种图像分割方法的流程图；

[0067] 图3是本申请实施例提供的一种图像分割方法的流程图；

[0068] 图4是本申请实施例提供的一种获取第二特征图方法的流程图；

[0069] 图5是本申请实施例提供的一种多个标注者的标注图像的示意图；

[0070] 图6是本申请实施例提供的一种图像分割方法的流程图；

[0071] 图7是本申请实施例提供的一种多种方式的分割图像的对比图；

[0072] 图8是本申请实施例提供的一种多种方式的分割图像的对比图；

[0073] 图9是本申请实施例提供的一种模型训练方法的流程图；

[0074] 图10是本申请实施例提供的一种获取预测分割图像的流程图；

[0075] 图11是本申请实施例提供的一种模型训练过程的流程图；

[0076] 图12是本申请实施例提供的一种图像分割装置的结构示意图；

[0077] 图13是本申请实施例提供的一种图像分割装置的结构示意图；

[0078] 图14是本申请实施例提供的一种终端的结构示意图；

[0079] 图15是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

[0080] 为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

[0081] 本申请所使用的术语“第一”、“第二”、“第三”、“第四”、“第五”、“第六”等可在本文中用于描述各种概念，但除非特别说明，这些概念不受这些术语限制。这些术语仅用于将一
个概念与另一个概念区分。举例来说，在不脱离本申请的范围的情况下，能够将第一特征图
称为第二特征图，且类似地，能够将第二特征图称为第一特征图。

[0082] 本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”，至少一个包括一个、两个或两个以上，多个包括两个或两个以上，而每个是指对应的多个中的每一个，任一是指多
个中的任意一个。举例来说，多个先验知识权重包括3个先验知识权重，而每个是指这3个先
验知识权重中的每一个先验知识权重，任一是指这3个先验知识权重中的任意一个先验知
识权重，能够是第一个，或者，是第二个，或者，是第三个。

[0083] 人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理
论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解
智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能
也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

[0084] 人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、
大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机
视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

[0085] 计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机
器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数
据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理
解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、
虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生
物特征识别技术。

[0086] 机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习
行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学
习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。
机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示
教学习等技术。

[0087] 本申请实施例提供的方案，基于人工智能的机器学习技术，能够训练第一图像分割模型、图像重构模型及第二图像分割模型，利用训练后的第一图像分割模型、图像重构模
型及第二图像分割模型，实现了图像分割方法。

[0088] 本申请实施例提供的图像分割方法，能够用于计算机设备中。可选地，该计算机设备为终端或服务器。可选地，该服务器是独立的物理服务器，或者，是多个物理服务器构成
的服务器集群或者分布式系统，或者，是提供云服务、云数据库、云计算、云函数、云存储、网
络服务、云通信、中间件服务、域名服务、安全服务、CDN（Content Delivery Network，内容
分发网络）、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地，该终端是
智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。

[0089] 在一种可能实现方式中，多个服务器可组成为一区块链，服务器为区块链上的节点，且本申请实施例提供的图像分割方法，能够应用于该区块链中的任一服务器。该服务器
采用本申请实施例提供的图像分割方法，能够对任一图像进行分割，将得到的分割图像存
储于区块链中，从而与区块链中的其他服务器进行共享。

[0090] 图1是本申请实施例提供的一种实施环境的示意图。参见图1，该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。终端101上安装
由服务器102提供服务的目标应用，终端101能够通过该目标应用实现例如数据传输、消息
交互等功能。可选地，目标应用为终端101操作系统中的目标应用，或者为第三方提供的目
标应用。例如，目标应用为医疗诊断应用，该医疗诊断应用具有图像分割的功能，当然，该医
疗诊断应用还能够具有其他功能，例如，点评功能、导航功能等。

[0091] 终端101用于基于用户标识登录目标应用，通过目标应用将原始图像发送至服务器102，服务器102用于接收终端101发送的原始图像，对该原始图像进行图像分割，获取该
原始图像的分割图像，并将获取到的分割图像返回至终端101，终端101能够显示接收到的
分割图像。

[0092] 本申请实施例提供的方法，可用于多种场景。

[0093] 例如，医疗场景下：

[0094] 终端拍摄用户眼部，得到用户的眼部图像，将该眼部图像发送至具有图像分割功能的服务器，该服务器在接收到该眼部图像后，采用本申请实施例提供的图像分割方法，获
取该眼部图像的分割图像，以确定该眼部图像中视杯和视盘所处的区域，之后医生能够根
据该分割图像中视杯和视盘所处的区域，确定该用户的眼部状态。

[0095] 图2是本申请实施例提供的一种图像分割方法的流程图，应用于计算机设备中，如图2所示，该方法包括以下步骤。

[0096] 201、计算机设备根据先验知识向量对原始图像进行编码处理，得到目标特征图。

[0097] 其中，原始图像中包括目标物体，该原始图像为任意的图像，例如，在医疗场景下，该原始图像为医学图像，该目标物体为某一身体部位，如，该原始图像为眼部图像，该目标
物体为眼部中的视杯或视盘；或者，该原始图像为人体肺部图像，该目标物体为人体肺部的
病变物体。先验知识向量包括多个先验知识权重，每个先验知识权重用于表示一个标注者
在任一图像中标注任一物体所在区域的准确度，目标特征图用于表示该原始图像中包含的
特征信息。

[0098] 202、计算机设备对目标特征图进行解码处理，得到原始图像的第一分割图像。

[0099] 其中，第一分割图像用于指示目标物体在原始图像中所处的目标区域。由于目标特征图中包含了原始图像的特征信息，且该目标特征图中融入了先验知识向量，采用解码
的方式来获取的第一分割图像，相当于是多个先验知识权重所对应的标注者的标注结果融
合后的分割图像。

[0100] 203、计算机设备根据先验知识向量，对第一分割图像进行图像重构，得到多个标注分割图像。

[0101] 其中，每个标注分割图像与一个先验知识权重对应，每个标注分割图像用于指示对应的标注者所标注的目标区域，由于不同的标注者的标注水平不同，则多个标注分割图
像中所指示的目标区域可能存在差异。第一分割图像相当于是多个标注者的标注结果融合
后的分割图像，通过该先验知识向量中的多个先验知识权重及第一分割图像，重构出与多
个标注者相匹配的标注分割图像，以指示目标物体在原始图像中所处的目标区域，以便后
续能够基于重构出的多个标注分割图像来更新原始图像的分割图像，提高分割图像的准确
性。

[0102] 204、计算机设备基于多个标注分割图像对目标特征图进行处理，得到原始图像的第二分割图像。

[0103] 由于每个标注分割图像对应于一个先验知识权重，每个标注分割图像表示对应的标注者对原始图像进行标注的标注结果，则基于该多个标注分割图像对目标特征图进行处
理，以提高第二分割图像的准确性。

[0104] 本申请实施例提供的方法，在对原始图像进行分割的过程中，通过引入用于表示多个标注者的标注准确度的先验知识权重，重构出与多个标注者相匹配的标注分割图像，
以指示目标物体在原始图像中所处的目标区域，即重构出了多个标注者对原始图像的多种
标注结果，之后，通过多个标注分割图像及原始图像的目标特征图来获取原始图像的第二
分割图像，使得第二分割图像中融入了多个标注者对应的标注结果，保证第二分割图像的
准确性，从而提高了图像分割的准确性。

[0105] 图3是本申请实施例提供的一种图像分割方法的流程图，应用于计算机设备中，如图3所示，该方法包括以下步骤。

[0106] 301、计算机设备对原始图像进行编码处理，得到原始图像的第一特征图。

[0107] 其中，该第一特征图用于表示该原始图像中包含的特征信息，该原始图像中包括目标物体，该原始图像为任意的图像，例如，在医疗场景下，该原始图像为医学图像，该目标
物体为某一身体部位，如，该原始图像为眼部图像，该目标物体为眼部中的视杯或视盘；或
者，该原始图像为人体肺部图像，该目标物体为人体肺部的病变物体。

[0108] 在一种可能实现方式中，该步骤301包括：调用第一图像分割模型中的第一编码子模型，对该原始图像进行编码处理，得到该原始图像的第一特征图。

[0109] 其中，第一图像分割模型用于获取原始图像的分割图像的模型，例如，该第一图像分割模型为U‑Net（一种二维图像分割的卷积神经网络）。该第一编码子模型用于获取原始
图像的特征图，例如，该第一编码子模型为U‑Net中的编码器。通过第一图像分割模型中的
第一编码子模型对原始图像进行编码处理，使第一特征图中包含了原始图像的特征信息，
以保证获取到的第一特征图的准确性。

[0110] 可选地，该第一编码子模型包括多个第一卷积模块，则获取第一特征图的过程包括：按照多个第一卷积模块的排列顺序，调用第一个第一卷积模块，对该原始图像进行编码
处理，得到第一个第一参考特征图，调用当前的第一卷积模块对上一个第一卷积模块输出
的参考特征图进行编码处理，得到当前的第一卷积模块对应的第一参考特征图，直至得到
最后一个第一卷积模块输出第一参考特征图，将最后一个第一卷积模块输出的第一参考特
征图确定为该第一特征图。

[0111] 其中，在该第一编码子模型中包括的多个第一卷积模块中，按照多个第一卷积模块的排列顺序，多个第一卷积模块输出的参考特征图的尺寸逐渐减小。通过编码子模型中
的多个第一卷积模块，按照多个尺度对原始图像进行编码处理，即该编码子模型采用一种
下采样的方式，逐渐增强特征图包含的特征，以提高第一特征图的准确性。

[0112] 302、计算机设备将先验知识向量与第一特征图进行融合，得到第二特征图。

[0113] 其中，先验知识向量包括多个先验知识权重，每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度，该先验知识权重能够体现出对应的标
注者的标注水平。由于多个标注者的标注水平有高低之分，则每个标注者对应的先验知识
权重也有大小之分，先验知识权重越大，表示对应的标注者的标注水平越高，即该标注者在
图像中标注物体所在区域的准确度越高；先验知识权重越小，表示对应的标注者的标注水
平越低，即该标注者在图像中标注物体所在区域的准确度越低。

[0114] 可选地，该先验知识向量是由任意设置的，例如，该先验知识向量为[0.1，01，0.4，0.4]，即该先验知识向量包括了4个标注者对应的先验知识权重，两个标注者对应的先验知
识权重为0.1，两个标注者对应的先验知识权重为0.4。

[0115] 通过将先验知识向量与第一特征图进行融合，以使第二特征图中不仅包括了原始图像中的特征，还融入了多个标注者对应的先验知识权重，使得第二特征图中包含的特征
与该先验知识向量之间动态关联，且第二特征图中包含的特征受到该先验知识向量的影
响，增强了第二特征图中包含的特征的动态表征能力，提高了第二特征图包含的特征的准
确性。

[0116] 在一种可能实现方式中，该步骤302包括：调用第一图像分割模型中的知识推断子模型，将先验知识向量与第一特征图进行融合，得到第二特征图。

[0117] 其中，该知识推断子模型用于将先验知识向量融合第一特征图，例如，该知识推断子模型为ConvLSTM（Convolutional Long Short‑Term Memory，长短期注意力模型）。通过
该知识推断子模型，将先验知识向量与原始图像的第一特征图进行融合，增强了第二特征
图中包含的特征的动态表征能力。如图4所示，对先验知识向量进行尺寸扩张，以使尺寸扩
张后的先验知识向量与第一特征图的尺寸相同，之后，通过长短期注意力模型，将扩张后的
先验知识向量与第一特征图进行融合，以增强第一特征图中包含的特征，得到融合后的第
二特征图。

[0118] 可选地，第一特征图、先验知识向量及第二特征图满足以下关系：

[0119]

[0120] 其中，用于表示增强后的特征图，用于表示第一特征图，用于表示长短期注意力模型，表示增强前的特征图，表示特征增强迭代轮次，该
为不小于2的正整数；当时，为该先验知识向量；当时，为该第二特征
图。

[0121] 303、计算机设备对第二特征图进行解码处理，得到目标特征图。

[0122] 其中，目标特征图用于表示该原始图像中包含的特征信息。在得到第二特征图后，采用解码的方式，以细化特征图中包含的特征，提高了目标特征图中包含的特征的准确性。

[0123] 在一种可能实现方式中，该步骤303包括：调用第一图像分割模型中的第一解码子模型，对该第二特征图进行解码处理，得到该目标特征图。

[0124] 其中，该第一解码子模型用于增强特征图中包含的特征，例如，该第一解码子模型为U‑Net中的解码器。

[0125] 可选地，第一图像分割模型包括第一编码子模型，该第一编码子模型包括多个第一卷积模块，该第一解码子模型包括多个第二卷积模块，则获取目标特征图的过程包括：按
照多个第二卷积模块的排列顺序，调用第一个第二卷积模块，对该第二特征图进行解码处
理，得到第一个第二参考特征图，调用当前的第二卷积模块，对上一个第二卷积模块输出的
参考特征图及当前的第二卷积模块对应的第一卷积模块输出的参考特征图进行解码处理，
得到当前的第二卷积模块对应的第二参考特征图，直至得到最后一个第二卷积模块输出第
二参考特征图，将最后一个第二卷积模块输出的第二参考特征图确定为目标特征图。

[0126] 其中，在该第一解码子模型中包括的多个第二卷积模块中，按照多个第二卷积模块的排列顺序，多个第二卷积模块输出的参考特征图的尺寸逐渐增大。通过解码子模型中
的多个第二卷积模块，采用一种上采样的方式，逐渐细化特征图中包含的特征，以提高目标
特征图中包含的特征的准确性。

[0127] 需要说明的是，本申请实施例是将原始图像编码处理后的第一特征图与先验知识向量融合后，对得到的第二特征图进行解码处理来获取目标特征图的，而在另一实施例中，
无需执行上述步骤301‑303，能够采取其他方式，根据先验知识向量对原始图像进行编码处
理，得到目标特征图。

[0128] 在一种可能实现方式中，调用第一图像分割模型，根据先验知识向量对原始图像进行编码处理，得到目标特征图。通过第一图像分割模型，来获取目标特征图，以提高目标
特征图的准确性。

[0129] 304、计算机设备对目标特征图进行解码处理，得到原始图像的第一分割图像。

[0130] 其中，第一分割图像用于指示目标物体在原始图像中所处的目标区域。可选地，该第一分割图像中包括原始图像中的多个像素点对应的权重，该权重用于表示对应的像素点
在该目标区域内的可能性。在该第一分割图像中包括多个像素点，每个像素点的像素值表
示原始图像中位于相同位置的像素点对应的权重，对于原始图像中的任一位置的像素点，
在该第一分割图像中位于相同位置的像素点的像素值，即为该原始图像中该位置的像素点
的权重。

[0131] 可选地，该第一分割图像以热力图的形式表示，在该第一分割图像中，像素点对应的权重越大，该像素点对应的颜色越深，像素点对应的权重越小，该像素点对应的颜色越
浅。例如，在该第一分割图像中，权重为0时，该权重对应的像素点所对应的颜色为蓝色，权
重为1时，该权重对应的像素点所对应的颜色为红色，权重介于0至1之间时，该权重对应的
像素点所对应的颜色为蓝色变为红色之间的过渡色，例如，权重由0变为1，该权重对应的像
素点所对应的颜色由蓝色逐渐变为红色。

[0132] 由于目标特征图中不仅包含了原始图像的特征信息，并且该目标特征图中还融入了先验知识向量，对目标特征图采用解码的方式来获取第一分割图像，该第一分割图像相
当于是多个先验知识权重所对应的标注者的标注结果融合后的分割图像。

[0133] 在一种可能实现方式中，该步骤304包括：调用第一图像分割模型，对目标特征图进行解码处理，得到原始图像的第一分割图像。

[0134] 可选地，调用该第一图像分割模型中的卷积子模型，对该目标特征图进行卷积处理，得到该第一分割图像。

[0135] 305、计算机设备将原始图像及第一分割图像进行拼接，得到拼接图像。

[0136] 由于第一分割图像用于指示目标物体在原始图像中所处的目标区域，通过将原始图像与第一分割图像进行拼接，使得拼接图像中不仅包含了原始图像所包含的信息，还包
含了用于指示目标物体在原始图像中所处的目标区域的信息，丰富了拼接图像中包含的信
息，以便后续能够重构出多个标注分割图像。

[0137] 306、计算机设备对拼接图像进行编码处理，得到第三特征图。

[0138] 其中，第三特征图用于表示原始图像中包含的特征信息及用于指示目标物体在原始图像中所处的目标区域的特征信息。

[0139] 在一种可能实现方式中，该步骤306包括：调用图像重构模型中的编码子模型，对该拼接图像进行编码处理，得到该第三特征图。

[0140] 其中，图像重构模型用于重构多个先验知识权重所对应的标注分割图像，该编码子模型用于获取拼接图像的特征图，例如，该编码子模型为U‑Net中的编码器。该图像重构
模型中的编码子模型与上述步骤301中的第一图像分割模型中的第一编码子模型同理，在
此不再赘述。

[0141] 307、计算机设备将先验知识向量与第三特征图进行融合，得到第四特征图。

[0142] 通过将先验知识向量与第三特征图融合，使得第四特征图中不仅包括原始图像中包含的特征信息，还融入了多个标注者对应的先验知识权重，以便后续能够根据第四特征
图来重构出每个先验知识权重对应的标注分割图像。

[0143] 在一种可能实现方式中，该步骤307包括：调用图像重构模型中的融合子模型，将先验知识向量与第三特征图进行融合，得到第四特征图。

[0144] 其中，融合子模型与上述步骤302中的知识推断子模型类似，在此不再赘述。

[0145] 308、计算机设备对第四特征图进行解码处理，得到多个标注分割图像。

[0146] 其中，每个标注分割图像与一个先验知识权重对应，每个标注分割图像用于指示对应的标注者所标注的目标区域，由于不同的标注者的标注水平不同，则多个标注分割图
像中所指示的目标区域可能存在差异。如图5所示，以原始图像为眼部图像为例，3个标注者
对眼部图像中的视杯和视盘进行标注，由于3个标注者的标注水平不同，则标注得到的视杯
标注图像和视盘标注图像所指示的目标区域存在差异。

[0147] 可选地，每个标注分割图像包括原始图像中的多个像素点对应的第一权重，第一权重用于表示对应的像素点在目标区域内的可能性，则通过该标注图像中包括的多个第一
权重，能够确定对应的标注者所标注的目标物体在原始图像中所处的目标区域。在该任一
标注分割图像中包括多个像素点，每个像素点的像素值即为包含的第一权重，对于原始图
像中的任一位置的像素点，在该标注分割图像中位于相同位置的像素点的像素值，即为该
原始图像中该位置的像素点的第一权重。

[0148] 在本申请实施例中，第四特征图中不仅包含了第一分割图像的特征信息、原始图像的特征信息，还融入了先验知识向量，并且该第一分割图像相当于是多个先验知识权重
所对应的标注者的标注结果融合后的分割图像，则通过采用解码的方式，对第四特征图进
行处理，能够重构出多个先验知识权重所对应的标注分割图像，还原出多个标注者对原始
图像的标注结果，即每个标注者对应的标注分割图像，以便后续更新原始图像的分割图像。

[0149] 在一种可能实现方式中，该步骤308包括：调用图像重构模型中的解码子模型，对第四特征图进行解码处理，得到多个标注分割图像。

[0150] 其中，该解码子模型与上述步骤303中的第一图像分割模型中的第一解码子模型类似，在此不再赘述。

[0151] 需要说明的是，本申请实施例是通过引入原始图像，将原始图像及先验知识向量进行融合，来重构出多个标注分割图像的，而在另一实施例中，无需执行上述步骤305‑308，
能够采取其他方式，根据先验知识向量，对第一分割图像进行图像重构，得到多个标注分割
图像。

[0152] 在一种可能实现方式中，调用图像重构模型，根据先验知识向量，对第一分割图像进行图像重构，得到多个标注分割图像。通过图像重构模型，根据先验知识向量和第一分割
图像，来重构多个先验知识权重对应的标注分割图像，以保证标注分割图像的准确性。

[0153] 309、计算机设备根据多个标注分割图像之间的差异，确定不确定性图像。

[0154] 其中，不确定性图像用于指示多个标注分割图像指示的目标区域之间的差异。由于每个标注分割图像对应一个先验知识权重，即每个标注分割图像相当于对应的先验知识
权重所对应的标注者对原始图像进行标注的标注结果，由于多个标注者的标注水平不同，
多个标注分割图像所指示的目标区域会存在差异，因此，通过多个标注分割图像之间的差
异，能够确定出不确定性图像，该不确定性图像能够指示出多个标注者所标注的多个目标
区域中存在争议的区域。

[0155] 在一种可能实现方式中，该步骤309包括以下步骤3091‑3094。

[0156] 3091、确定多个标注分割图像与多个标注分割图像的平均值图像之间的差值图像。

[0157] 其中，每个标注分割图像包括原始图像中的多个像素点对应的第一权重，该平均值图像包括原始图像中的每个像素点在多个标注分割图像中对应的第一权重的平均值，该
平均值图像能够体现出多个标注分割图像所指示的目标区域之间的一致性，每个差值图像
包括对应的标注分割图像中的每个第一权重与平均值图像中对应的平均值之间的差值。通
过确定多个标注分割图像的平均值图像，之后，在确定每个标注分割图像与该平均值图像
之间的差值图像，从而得到多个差值图像。

[0158] 在一种可能实现方式中，该步骤3091包括：确定多个标注分割图像中位于相同位置的像素点对应的第一权重的平均值，根据得到的多个平均值构建该差值图像，对于每个
标注分割图像，确定该标注分割图像中的多个第一权重与该差值图像中的对应的平均值之
间的差值，将得到的多个差值构成该标注分割图像对应的差值图像。

[0159] 3092、确定多个差值图像中位于相同位置的像素点的像素值的平方和。

[0160] 其中，在任一差值图像中的任一像素点的像素值，即为该差值图像对应的标注分割图像与该像素点位于相同位置的像素点的所对应的第一权重，与平均值图像中与该像素
点位于相同位置的像素点所对应的平均值之间的差值。

[0161] 对于任一位置，确定该多个差值图像中位于该位置的像素点的像素值的平方，将多个差值图像对应的像素值的平方之和，确定为该位置对应的像素值的平方和，重复上述
方式，即可得到多个位置对应的像素值的平方和。

[0162] 3093、将每个位置对应的平方和与多个标注分割图像的个数之间的比值的开方，分别确定为每个位置的第二权重。

[0163] 其中，第二权重用于表示对应的位置在多个标注分割图像中的标注结果的差异，标注结果表示是位于对应的位置的像素点是否在目标区域。

[0164] 3094、根据多个位置的第二权重构建不确定性图像。

[0165] 其中，该不确定性图像包括原始图像中的多个像素点对应的第二权重。

[0166] 在一种可能实现方式中，该多个标注分割图像及该不确定性图像满足以下关系：

[0167]

[0168] 其中，表示不确定性图像，表示多个标注分割图像的个数，为不小于2的正整数；表示多个标注分割图像中标注分割图像的序号，大于等于1，且小于
等于；表示第个标注分割图像。

[0169] 310、计算机设备将目标特征图与不确定性图像进行融合，得到第二分割图像。

[0170] 由于不确定性图像能够指示多个标注分割图像指示的目标区域之间的差异，目标特征图中不仅包含了原始图像的特征信息，还融合了先验知识向量，因此，通过将目标特征
图与不确定性图像进行融合，能够将多个标注分割图像中不确定的区域进行区分开，以提
高第二分割图像所指示的目标区域的准确性。

[0171] 在一种可能实现方式中，该步骤310包括以下步骤3101‑3105。

[0172] 3101、确定多个标注分割图像的平均值图像。

[0173] 该步骤与上述步骤3091中确定平均值图像的方式同理，在此不再赘述。

[0174] 3102、将目标特征图与不确定性图像的乘积与目标特征图之和，确定为第一融合特征图。

[0175] 其中，该第一融合特征图用于表示多个先验知识权重对应的标注分割图像之间的不一致信息。通过确定目标特征图与不确定性图像的乘积，之后，将确定的乘积与该目标特
征图之和，确定为该第一融合特征图。通过获取第一融合特征图，使得目标特征图在该不确
定性图像所指示的不确定区域中的特征得到增强，以提高第一融合特征图的准确性。

[0176] 在一种可能实现方式中，该步骤3102包括：确定目标特征图与不确定性图像的像素级乘积，将得到的乘积与该目标特征图的像素级之和，确定为该第一融合特征图。其中，
像素级乘积是指目标特征图与不确定性图像中位于相同位置的像素点的像素值的乘积，像
素级之和是指得到的乘积与目标特征图中位于相同位置的像素点的像素值的和值。

[0177] 在一种可能实现方式中，在步骤3102之前，该方法还包括：对不确定性图像进行平滑处理，对平滑处理后的不确定性图像进行最大值处理。

[0178] 其中，平滑处理能够采用高斯平滑处理的方式。对于平滑处理后的不确定性图像中包含的多个权重值可能会发生改变，因此，通过最大值处理，将平滑处理后的不确定性图
像与平滑处理前的不确定性图像进行比对，对于平滑处理后的不确定性图像与平滑处理前
的不确定性图像中的任一相同位置，将该位置对应的两个权重中的最大值，确定为该位置
最大操作后的权重，重复上述方式，得到最大值处理后的不确定性图像。通过采用平滑处理
的方式，以使不确定性图像中包含的多个权重趋于平滑，实现过度的效果，以扩大不确定区
域的覆盖范围，从而有效地感知和捕捉多个标注分割图像之间的不一致区域，并且通过最
大值处理，以保证不确定性图像中包含的权重的准确性，提高了不确定性图像的准确性。

[0179] 可选地，对不确定性图像进行平滑处理，对平滑处理后的不确定性图像进行最大值处理，满足以下关系：

[0180]

[0181] 其中，表示最大值处理后的不确定性图像，表示最大函数，用于保留平滑处理后的不确定性图像和原始的不确定性图像中相同位置的较高像素值；
用于表示具有高斯核为的卷积运算，表示原始的不确定性图像。

[0182] 3103、将目标特征图与平均值图像的乘积与目标特征图之和，确定为第二融合特征图。

[0183] 其中，该第二融合特征图用于表示多个先验知识权重对应的标注分割图像之间的一致信息。通过确定目标特征图与平均值图像的乘积，之后，将确定的乘积与该目标特征图
之和，确定为该第二融合特征图。通过获取第二融合特征图，使得目标特征图中多个标注分
割图像均标注为目标区域的区域中的特征得到增强，提高了第二融合特征的准确性。

[0184] 在一种可能实现方式中，该步骤3103包括：确定目标特征图与平均值图像的像素级乘积，将得到的乘积与该目标特征图的像素级之和，确定为该第二融合特征图。其中，像
素级乘积是指目标特征图与平均值图像中位于相同位置的像素点的像素值的乘积，像素级
之和是指得到的乘积与目标特征图中位于相同位置的像素点的像素值的和值。

[0185] 在一种可能实现方式中，在步骤3103之前，该方法还包括：对平均值图像进行平滑处理，对平滑处理后的平均值图像进行最大值处理。

[0186] 该步骤与上述步骤3102中对不确定性图像进行平滑处理，并对平滑处理后的不确定性图像进行最大值处理的过程同理，在此不再赘述。

[0187] 需要说明的是，在本申请实施例中，在执行上述步骤3102和3103获取第一融合特征图和第二融合特征图之前，均能够对不确定性图像及平均值图像进行平滑处理和最大值
处理，则对于上述步骤3012和3013获取到的获取第一融合特征图和第二融合特征图，能够
满足以下关系式：

[0188]

[0189] 其中，用于表示代号，的取值为1和2；表示融合特征图；当为1时，表示第一融合特征图；当为2时，表示第二融合特征图；表示目标特征图，
表示不确定性图像或者平均值图像；当为1时，表示不确定性图
像；当为2时，表示平均值图像；用于表示像素级乘积。

[0190] 3104、将第一融合特征图及第二融合特征图进行拼接，得到拼接融合特征图。

[0191] 例如，该第一融合特征图的尺寸为B*C1*H*W，第二融合特征图的尺寸为B*C2*H*W，拼接后为拼接融合特征图的尺寸为B*（C1+C2）*H*W。

[0192] 3105、对拼接融合特征图进行卷积处理，得到第二分割图像。

[0193] 由于拼接融合特征图中包含了目标特征图在高度确定区域中的增强的特征，及在不确定性区域中的增强的特征，则通过对拼接融合特征进行卷积处理时，能够将拼接特征
图中的确定的目标区域与其他区域区分开，以提高第二分割图像所指示的目标区域的准确
性，也即是提高了第二分割图像的准确性。

[0194] 另外，以原始图像为眼部图像，目标物体为眼部中的视杯和视盘，则获取的第二分割图像用于指示视杯在眼部图像中所处的区域，及视盘在眼部图像中所处的区域。则第二
分割图像满足以下关系：

[0195]

[0196] 其中，表示第二分割图像，表示卷积处理，表示拼接处理；视杯对应的第一融合特征图为；视盘对应的第一融合特征图为；视
杯对应的第二融合特征图为；视盘对应的第二融合特征图为。

[0197] 需要说明的是，本申请实施例是先获取不确定性图像，之后基于目标特征图及不确定性图像来获取第二分割图像的，而在另一实施例中，无需执行上述步骤309‑310，能够
采取其他方式，基于多个标注分割图像对目标特征图进行处理，得到原始图像的第二分割
图像。

[0198] 在一种可能实现方式中，调用第二图像分割模型，基于多个标注分割图像对目标特征图进行处理，得到原始图像的第二分割图像。其中，第二图像分割模型用于获取第二分
割图像。通过第二图像分割模型，利用多个标注分割图像对应的不一致信息和一致信息，以
保证第二分割图像的准确性。如图6所示，以原始图像为眼部图像为例，通过第一图像分割
模型、图像重构模型及第二图像分割模型对原始图像进行图像分割，得到第二分割图像。

[0199] 本申请实施例提供的方法，在对原始图像进行分割的过程中，通过引入用于表示多个标注者的标注准确度的先验知识权重，重构出与多个标注者相匹配的标注分割图像，
以指示目标物体在原始图像中所处的目标区域，即重构出了多个标注者对原始图像的多种
标注结果，之后，通过多个标注分割图像及原始图像的目标特征图来获取原始图像的第二
分割图像，使得第二分割图像中融入了多个标注者对应的标注结果，保证第二分割图像的
准确性，从而提高了图像分割的准确性。

[0200] 并且，通过第一分割图像模型中的知识推断子模型及图像重构模型中的融合子模型，在获取原始图像的分割图像的过程中，能够引入先验知识向量，使先验知识向量嵌入到
原始图像的特征融合，提高模型的动态表示能力。

[0201] 并且，本申请提供的提供了一种软注意力机制，对不确定图像进行平滑处理和最大值处理，以扩大不确定区域的覆盖范围，从而有效地感知和捕捉多个标注分割图像之间
的不一致区域，并且通过最大值处理，以保证不确定性图像中包含的权重的准确性，提高了
不确定性图像的准确性，从而提高后续图像分割的性能。

[0202] 如图7所示，通过本申请提供的图像分割方法及相关技术中提供的其他图像分割模型，对原始图像进行图像分割，并对得到的分割图像进行对比。通过对比可知，本申请实
施例提供的图像分割方法得到的分割图像更准确。

[0203] 本申请实施例提供的方法，能够应用于医疗领域，能够医疗领域中的图像进行图像分割。如图8所示，在医疗领域的不同数据集上，将本申请实施例提供的图像分割方法，与
其他相关技术中的其他分割模型得到的分割图像进行对比。通过对比可知，本申请实施例
提供的图像分割方法得到的分割图像更准确。

[0204] 基于上述图3所示实施例可知，对原始图像进行图像分割的过程，能够采用第一图像分割模型、图像重构模型及第二图像分割模型来执行，在调用第一图像分割模型、图像重
构模型及第二图像分割模型之前，需要对第一图像分割模型、图像重构模型及第二图像分
割模型进行训练，训练过程详见下述实施例。

[0205] 图9是本申请实施例提供的一种模型训练方法的流程图，应用于计算机设备中，如图9所示，该方法包括以下步骤。

[0206] 901、计算机设备获取样本原始图像、多个样本标注分割图像及先验知识向量。

[0207] 其中，样本原始图像中包括样本物体，每个样本标注分割图像与一个先验知识权重对应，每个样本标注分割图像用于指示对应的标注者所标注的样本物体在样本原始图像
中所处的样本区域，每个样本标注分割图像为对应的标注者对该样本原始图像的真实标注
结果。例如，在医疗领域，该样本原始图像为眼部图像，该多个标注者为多个眼部医生。

[0208] 902、计算机设备调用第一图像分割模型，根据先验知识向量对样本原始图像进行编码处理，得到目标样本特征图。

[0209] 该步骤与上述步骤301‑303同理，在此不再赘述。

[0210] 903、计算机设备调用第一图像分割模型，对目标样本特征图进行解码处理，得到样本原始图像的第一样本分割图像。

[0211] 其中，第一样本分割图像用于指示样本物体在样本原始图像中所处的样本区域。

[0212] 该步骤与上述步骤304同理，在此不再赘述。

[0213] 904、计算机设备将样本原始图像及第一样本分割图像进行拼接，得到第一样本拼接图像。

[0214] 该步骤与上述步骤305同理，在此不再赘述。

[0215] 905、计算机设备调用编码子模型，对第一样本拼接图像进行编码处理，得到第一样本特征图。

[0216] 在本申请实施例中，图像重构模型包括编码子模型、融合子模型及解码子模型。该步骤与上述步骤306同理，在此不再赘述。

[0217] 906、计算机设备调用融合子模型，将先验知识向量与第一样本特征图进行融合，得到第二样本特征图。

[0218] 该步骤与上述步骤307同理，在此不再赘述。

[0219] 907、计算机设备调用解码子模型，对第二样本特征图进行解码处理，得到多个预测标注分割图像。

[0220] 其中，每个预测标注分割图像与一个先验知识权重对应，每个预测标注分割图像用于指示预测到的对应的标注者所标注的样本区域。

[0221] 该步骤与上述步骤308同理，在此不再赘述。

[0222] 需要说明的是，本申请实施例是先将样本原始图像及第一样本分割图像进行拼接，之后调用图像重构模型中的编码子模型、融合子模型及解码子模型，来获取多个预测标
注分割图像的，而在另一实施例中，无需执行步骤904‑907，能够采取其他方式，调用图像重
构模型，根据先验知识向量，对第一样本分割图像进行图像重构，得到多个预测标注分割图
像。

[0223] 908、计算机设备调用第二图像分割模型，基于多个预测标注分割图像对目标样本特征图进行处理，得到样本原始图像的预测分割图像。

[0224] 该步骤与上述步骤309‑310同理，在此不再赘述。如图10所示，以样本原始图像为眼部图像为例，通过图像重构模型获取到的预测标注分割图像中包括视杯预测标注分割图
像和视盘预测标注分割图像，则在获取到不确定性图像包括视杯不确定性图像和视盘不确
定性图像，并将多个视杯预测标注分割图像的平均值图像，确定为视杯一致性图像，将多个
视盘预测标注分割图像的平均值图像，确定为视盘一致性图像，之后，通过第二图像分割模
型，将目标样本图像特征分别与视杯不确定性图像、视盘不确定性图像、视杯一致性图像及
视盘一致性图像进行融合，并将融合后的多个特征图进行拼接，并对拼接得到的特征图进
行卷及处理，得到该预测分割图像。

[0225] 909、计算机设备根据先验知识向量，对多个样本标注分割图像进行加权融合，得到融合标注分割图像。

[0226] 由于该先验知识向量包括多个先验知识权重，多个先验知识权重与多个样本标注分割图像一一对应，则通过先验知识向量中的多个先验知识权重，将多个样本标注分割图
像进行加权融合，将得到的融合标注分割图像，作为多个标注者所标注的最终结果，以便后
续将该融合标注分割图像作为监督值，训练第一图像分割模型、图像重构模型及第二图像
分割模型进行训练。

[0227] 在一种可能实现方式中，该多个先验知识权重、多个样本标注分割图像及融合标注分割图像满足以下关系：

[0228] ，

[0229] 其中，表示融合标注分割图像；表示多个先验知识权重的总个数，为大于等于2的正整数；用于表示先验知识权重及样本标注分割图像的序号，
为大于等于1、且小于等于的正整数；表示第个样本标注分割图像；表示
第个先验知识权重，且第个样本标注分割图像与第个先验知识权重对
应。

[0230] 在一种可能实现方式中，每个样本标注分割图像包括原始图像中多个像素点对应的权重，则该步骤909包括：根据先验知识向量，将多个样本标注分割图像中位于相同位置
的像素点的像素值进行加权融合，得到每个位置的融合权重，根据多个位置的融合权重构
成该融合标注分割图像。其中，对于任一样本标注分割图像中任一位置的像素点的像素值，
即为该原始图像中位于相同位置的像素点对应的权重。

[0231] 910、计算机设备根据预测分割图像与融合标注分割图像之间的差异，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。

[0232] 由于融合标注分割图像相当于样本原始图像的真实标注分割图像，即该融合标注分割图像所指示的样本物体在样本原始图像中所处的样本区域，为该样本物体在样本原始
图像中所处的真实区域，该预测分割图像是通过第一图像分割模型、图像重构模型及第二
图像分割模型预测到的，则根据预测分割图像与融合标注分割图像之间的差异，能够确定
第一图像分割模型、图像重构模型及第二图像分割模型的不准确度，以便后续对第一图像
分割模型、图像重构模型及第二图像分割模型进行调整。

[0233] 在一种可能实现方式中，该步骤910包括以下步骤9101‑9102。

[0234] 9101、根据预测分割图像与融合标注分割图像之间的差异，确定第一损失值。

[0235] 其中，该第一损失值用于表示预测分割与融合标注分割图像之间的差异，损失值越大，表示第一图像分割模型、图像重构模型及第二图像分割模型的准确度越低，损失值越
小，表示第一图像分割模型、图像重构模型及第二图像分割模型的准确度越高。

[0236] 9102、根据第一损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。

[0237] 通过第一损失值对第一图像分割模型、图像重构模型及第二图像分割模型进行训练，以减小第一损失值，提高第一图像分割模型、图像重构模型及第二图像分割模型的准确
度。如图11所示，通过第一图像分割模型、图像重构模型及第二个分割模型，来获取预测分
割图像，其中，该知识推断子模型为第一图像分割模型中的子模型。通过对多个样本标注分
割图像进行加权融合，得到融合标注分割图像，之后，通过根据预测分割图像与融合标注分
割图像之间的差异，确定第一损失值，并根据确定的第一损失值对第一图像分割模型、图像
重构模型及第二图像分割模型进行训练。

[0238] 在一种可能实现方式中，该步骤9102包括以下三种方式。

[0239] 第一种方式：根据第一样本分割图像与融合标注分割图像之间的差异，确定第二损失值，根据第一损失值及第二损失值，对第一图像分割模型、图像重构模型及第二图像分
割模型进行训练。

[0240] 其中，该第二损失值用于表示第一样本分割图像与融合标注分割图像之间的差异，第一样本分割图像与融合标注分割图像之间的差异越大，该第二损失值越大，第一样本
分割图像与融合标注分割图像之间的差异越小，该第二损失值越小。

[0241] 通过第一损失值及第二损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练，以减小第一损失值及第二损失值，提高第一图像分割模型、图像重构模
型及第二图像分割模型的准确度。

[0242] 在一种可能实现方式中，根据第一损失值及第二损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程，包括：确定第一损失值与第二损失值的
第一和值，根据第一和值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训
练。

[0243] 第二种方式：根据多个预测标注分割图像与对应的样本标注分割图像之间的差异，确定第三损失值，根据第一损失值及第三损失值，对第一图像分割模型、图像重构模型
及第二图像分割模型进行训练。

[0244] 其中，该第三损失值为重构损失，用于表示多个预测标注分割图像与对应的样本标注分割图像之间的差异。

[0245] 在一种可能实现方式中，多个预测标注分割图像、多个样本标注分割图像及第三损失值，满足以下关系：

[0246]

[0247]

[0248] 其中，表示第三损失值；表示多个先验知识权重的总个数，也即是多个预测标注分割图像的个数，为大于等于2的正整数；表示预测标注分割图像及
样本标注分割图像的序号；为二元交叉熵损失函数；表示第个样本标注分
割图像；表示第个预测标注分割图像。

[0249] 在一种可能实现方式中，根据第一损失值及第三损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程，包括：确定第一损失值与第三损失值的
第二和值，根据第二和值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训
练。

[0250] 第三种方式：将样本原始图像及融合标注分割图像进行拼接，得到第二样本拼接图像，调用编码子模型，对第二样本拼接图像进行编码处理，得到第三样本特征图，根据第
三样本特征图与第一样本特征图之间的差异，确定第四损失值，根据第一损失值及第四损
失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。

[0251] 其中，第四损失值为一致性损失，用于表示第三样本特征图与第一样本特征图之间的差异。获取第二样本拼接图像的过程，与上述步骤305同理，在此不再赘述。调用编码子
模型获取第三样本特征图的过程，与上述步骤905同理在此不再赘述。

[0252] 由于第一样本特征图是调用图像重构模型中的编码子模型，对样本原始图像及第一样本分割图像拼接后的第一样本拼接图像进行编码处理得到的，该第三样本特征图是调
用相同的编码子模型，对样本原始图像及融合标注分割图像拼接后的第二样本拼接图像进
行编码处理得到的，该第一样本分割图像是预测得到的，该融合标注分割图像是多个标注
者标注的真实结果，则通过第四损失值，以确定同一个编码子模型输出的预测结果对应的
第一样本特征图与真实结果对应的第三样本特征图之间的差异。

[0253] 在一种可能实现方式中，根据第一损失值及第四损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程，包括：确定第一损失值与第四损失值的
第三和值，根据第三和值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训
练。

[0254] 在一种可能实现方式中，该编码子模型包括多个第三卷积模块，在调用多个第三卷积模块对第一样本拼接图像进行编码处理的过程中，调用第一个第三卷积模块对第一样
本拼接图像进行编码处理，得到第一个第三参考特征图，调用当前的第三卷积模块对上一
个第三卷积模块输出的第三参考特征图进行编码处理，得到当前的第三卷积模块对应的第
三参考特征图，直至得到最后一个第三卷积模块输出第三参考特征图，将最后一个第三卷
积模块输出的第三参考特征图确定为该第一样本特征图。同理，在调用多个第三卷积模块
对第二样本拼接图像进行编码处理的过程中，按照上述方式，也能够得到第二样本拼接图
像对应的多个第四参考特征图，并将最后一个第三卷积模块输出的第四参考特征图确定为
该第二样本拼接图像；则第四损失值，满足以下关系：

[0255]

[0256] 其中，表示第四损失值；表示编码子模型包括多个第三卷积模块的个数，为大于等于2的正整数；表示第三卷积模块的序号，为大于等于1、且小于
等于的正整数；表示第个第三卷积模块输出的第三参考特征图；表示第
个第三卷积模块输出的第四参考特征图。

[0257] 需要说明的是，上述仅是以三种方式分别对第一图像分割模型、图像重构模型及第二图像分割模型进行训练进行说明的，而在另一实施例中，上述三种方式能够两两结合，
例如，第一种方式与第二种方式结合，第二种方式与第三种方式结合；或者，上述三种方式
结合。

[0258] 在一种可能实现方式中，该步骤9102包括：根据第一样本分割图像与融合标注分割图像之间的差异，确定第二损失值，根据多个预测标注分割图像与对应的样本标注分割
图像之间的差异，确定第三损失值，将样本原始图像及融合标注分割图像进行拼接，得到第
二样本拼接图像，调用编码子模型，对第二样本拼接图像进行编码处理，得到第三样本特征
图，根据第三样本特征图与第一样本特征图之间的差异，确定第四损失值，根据第一损失
值、第二损失值、第三损失值及第四损失值，对第一图像分割模型、图像重构模型及第二图
像分割模型进行训练。

[0259] 可选地，根据第一损失值、第二损失值、第三损失值及第四损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程包括：根据第一损失值、第二损
失值、第三损失值及第四损失值，确定总损失值，根据总损失值，对第一图像分割模型、图像
重构模型及第二图像分割模型进行训练。

[0260] 可选地，第一损失值、第二损失值、第三损失值、第四损失值及总损失值，满足以下关系：

[0261]

[0262] 其中，表示总损失值；为二元交叉熵损失函数；表示第二损失值；表示融合标注分割图像；表示预测分割图像；表示超参数，用于平衡第三损
失值和第二损失值，能够设置为0.7；表示第三损失值；表示第四损失
值。

[0263] 本申请实施例提供的模型训练方式，在对原始图像进行分割的过程中，通过引入用于表示多个标注者的标注准确度的先验知识权重，重构出与多个标注者相匹配的标注分
割图像，以指示目标物体在原始图像中所处的目标区域，即重构出了多个标注者对原始图
像的多种标注结果，之后，通过多个标注分割图像及原始图像的目标特征图来获取原始图
像的第二分割图像，使得第二分割图像中融入了多个标注者对应的标注结果，保证第二分
割图像的准确性，从而提高了图像分割的准确性。

[0264] 并且，通过考虑到重构的多个预测标注分割图像与多个样本标注分割图像之间的差异、第三样本特征图与第一样本特征图之间的差异及第一样本分割图像与融合标注分割
图像之间的差异，以提高第一图像分割模型、图像重构模型及第二图像分割模型的准确性。

[0265] 本申请实施例提供的模型训练方法，是基于多个样本标注分割图像对模型进行训练的。相关技术在模型训练过程中，能够采用单个标注者的样本标注分割图像对模型进行
训练。表1中包括了采用不同的标注者标注的样本标注分割图像，对多种模型训练后的模型
准确率，如表1所示，通过表1中的准确率可知，采用多个标注者的样本标注分割图像对模型
训练后的模型的准确率高。

[0266] 并且，通过提供的图像重构模型，能够重构出多个标注者的标注分割图像，能够增强得到的预测分割图像与样本标注分割图像之间的相关系，能够估计出标注者之间的不确
定性。

[0267]

[0268] 本申请实施例提供的方法，能够通过第一分割图像模型、图像重构模型和第二图像分割模型来对原始图像进行图像分割。表2和3均为以医学图像为例，通过本申请提供的
模型及相关技术提供的图像分割模型，对医学图像进行图像分割的准确率进行比对。表2是
以眼部图像为例，通过对眼部图像进行图像分割，以确定眼部中的视杯对应的分割图像及
眼部中的视盘对应的分割图像。通过表2中的数据可知，无论是获取视杯对应的分割图像，
还是获取视盘对应的分割图像，本申请实施例提供的模型的准确率均最高。表3是以医学图
像中的肾部图像、脑部图像、肿瘤图像等为例，通过表3中的数据可知，无论是获取任一种医
学图像的分割图像，本申请实施例提供的模型的准确率均最高。即表明了，本申请提供的图
像分割方法获取到的分割图像的准确率高，且图像分割的效果好。

[0269]

[0270] 表4验证了本申请提供的图像分割方法能够在不同的先验知识权重条件下生成更好的校正分割结果。其中模型1‑模型6分别表示为采用标注者1‑标注者6的标注分割图像作
为训练样本训练得到的模型。通过采用不同的先验知识向量对多种模型进行评估，多种不
同的先验知识向量包括单一标注者、随机标注者的先验知识权重和平均先验知识权重。如
表4所示，对于单一标注者的先验知识向量，选择的标注者的先验知识向量为1，其他的标注
者的先验知识向量为0。以眼部图像为例，通过多种模型对眼部图像进行分割，得到眼部图
像的分割图像，每种模型得到视杯的分割图像的准确率及视盘的分割图像的准确率如表4
所示，通过表4可知，本申请提供的图像分割方法在不同先验知识向量条件下始终取得优越
的性能。

[0271]

[0272] 图12是本申请实施例提供的一种图像分割装置的结构示意图，如图12所示，该装置包括：

[0273] 编码模块1201，用于根据先验知识向量对原始图像进行编码处理，得到目标特征图，原始图像中包括目标物体，先验知识向量包括多个先验知识权重，每个先验知识权重用
于表示一个标注者在任一图像中标注任一物体所在区域的准确度；

[0274] 解码模块1202，用于对目标特征图进行解码处理，得到原始图像的第一分割图像，第一分割图像用于指示目标物体在原始图像中所处的目标区域；

[0275] 重构模块1203，用于根据先验知识向量，对第一分割图像进行图像重构，得到多个标注分割图像，每个标注分割图像与一个先验知识权重对应，每个标注分割图像用于指示
对应的标注者所标注的目标区域；

[0276] 处理模块1204，用于基于多个标注分割图像对目标特征图进行处理，得到原始图像的第二分割图像。

[0277] 在一种可能实现方式中，如图13所示，处理模块1204，包括：

[0278] 第一确定单元1241，用于根据多个标注分割图像之间的差异，确定不确定性图像，不确定性图像用于指示多个标注分割图像指示的目标区域之间的差异；

[0279] 第一融合单元1242，用于将目标特征图与不确定性图像进行融合，得到第二分割图像。

[0280] 在另一种可能实现方式中，每个标注分割图像包括原始图像中的多个像素点对应的第一权重，第一权重用于表示对应的像素点在目标区域内的可能性；

[0281] 第一确定单元1241，用于确定多个标注分割图像与多个标注分割图像的平均值图像之间的差值图像；确定多个差值图像中位于相同位置的像素点的像素值的平方和；将每
个位置对应的平方和与多个标注分割图像的个数之间的比值的开方，分别确定为每个位置
的第二权重；根据多个位置的第二权重构建不确定性图像。

[0282] 在另一种可能实现方式中，第一融合单元1242，用于确定多个标注分割图像的平均值图像；将目标特征图与不确定性图像的乘积与目标特征图之和，确定为第一融合特征
图；将目标特征图与平均值图像的乘积与目标特征图之和，确定为第二融合特征图；将第一
融合特征图及第二融合特征图进行拼接，得到拼接融合特征图；对拼接融合特征图进行卷
积处理，得到第二分割图像。

[0283] 在另一种可能实现方式中，如图13所示，编码模块1201，包括：

[0284] 第一编码单元1211，用于对原始图像进行编码处理，得到原始图像的第一特征图；

[0285] 第二融合单元1212，用于将先验知识向量与第一特征图进行融合，得到第二特征图；

[0286] 第一解码单元1213，用于对第二特征图进行解码处理，得到目标特征图。

[0287] 在另一种可能实现方式中，如图13所示，重构模块1203，包括：

[0288] 拼接单元，用于将原始图像及第一分割图像进行拼接，得到拼接图像；

[0289] 第二编码单元1231，用于对拼接图像进行编码处理，得到第三特征图；

[0290] 第三融合单元1232，用于将先验知识向量与第三特征图进行融合，得到第四特征图；

[0291] 第二解码单元1233，用于对第四特征图进行解码处理，得到多个标注分割图像。

[0292] 在另一种可能实现方式中，

[0293] 根据先验知识向量对原始图像进行编码处理，得到目标特征图的步骤由第一图像分割模型执行；

[0294] 对目标特征图进行解码处理，得到原始图像的第一分割图像的步骤由第一图像分割模型执行；

[0295] 根据先验知识向量，对第一分割图像进行图像重构，得到多个标注分割图像的步骤由图像重构模型执行；

[0296] 基于多个标注分割图像对目标特征图进行处理，得到原始图像的第二分割图像的步骤由第二图像分割模型执行。

[0297] 在另一种可能实现方式中，如图13所示，装置还包括：

[0298] 获取模块1205，用于获取样本原始图像、多个样本标注分割图像及先验知识向量，样本原始图像中包括样本物体，每个样本标注分割图像与一个先验知识权重对应，每个样
本标注分割图像用于指示对应的标注者所标注的样本物体在样本原始图像中所处的样本
区域；

[0299] 编码模块1201，还用于调用第一图像分割模型，根据先验知识向量对样本原始图像进行编码处理，得到目标样本特征图；

[0300] 解码模块1202，还用于调用第一图像分割模型，对目标样本特征图进行解码处理，得到样本原始图像的第一样本分割图像，第一样本分割图像用于指示样本物体在样本原始
图像中所处的样本区域；

[0301] 重构模块1203，还用于调用图像重构模型，根据先验知识向量，对第一样本分割图像进行图像重构，得到多个预测标注分割图像，每个预测标注分割图像与一个先验知识权
重对应，每个预测标注分割图像用于指示预测到的对应的标注者所标注的样本区域；

[0302] 处理模块1204，还用于调用第二图像分割模型，基于多个预测标注分割图像对目标样本特征图进行处理，得到样本原始图像的预测分割图像；

[0303] 加权融合模块1206，用于根据先验知识向量，对多个样本标注分割图像进行加权融合，得到融合标注分割图像；

[0304] 训练模块1207，用于根据预测分割图像与融合标注分割图像之间的差异，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。

[0305] 在另一种可能实现方式中，如图13所示，训练模块1207，包括：

[0306] 第二确定单元1271，用于根据预测分割图像与融合标注分割图像之间的差异，确定第一损失值；

[0307] 训练单元1272，用于根据第一损失值，对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。

[0308] 在另一种可能实现方式中，训练单元1272，用于根据第一样本分割图像与融合标注分割图像之间的差异，确定第二损失值；根据第一损失值及第二损失值，对第一图像分割
模型、图像重构模型及第二图像分割模型进行训练。

[0309] 在另一种可能实现方式中，训练单元1272，用于根据多个预测标注分割图像与对应的样本标注分割图像之间的差异，确定第三损失值；根据第一损失值及第三损失值，对第
一图像分割模型、图像重构模型及第二图像分割模型进行训练。

[0310] 在另一种可能实现方式中，图像重构模型包括编码子模型、融合子模型及解码子模型；

[0311] 重构模块1203，用于将样本原始图像及第一样本分割图像进行拼接，得到第一样本拼接图像；调用编码子模型，对第一样本拼接图像进行编码处理，得到第一样本特征图；
调用融合子模型，将先验知识向量与第一样本特征图进行融合，得到第二样本特征图；调用
解码子模型，对第二样本特征图进行解码处理，得到多个预测标注分割图像。

[0312] 在另一种可能实现方式中，如图13所示，装置还包括：

[0313] 拼接模块1208，用于将样本原始图像及融合标注分割图像进行拼接，得到第二样本拼接图像；

[0314] 重构模块1203，还用于调用编码子模型，对第二样本拼接图像进行编码处理，得到第三样本特征图；

[0315] 训练单元1272，用于根据第三样本特征图与第一样本特征图之间的差异，确定第四损失值；根据第一损失值及第四损失值，对第一图像分割模型、图像重构模型及第二图像
分割模型进行训练。

[0316] 需要说明的是：上述实施例提供的图像分割装置，仅以上述各功能模块的划分进行举例说明，实际应用中，能够根据需要而将上述功能分配由不同的功能模块完成，即将计
算机设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，
上述实施例提供的图像分割装置与图像分割方法实施例属于同一构思，其具体实现过程详
见方法实施例，这里不再赘述。

[0317] 本申请实施例还提供了一种计算机设备，该计算机设备包括处理器和存储器，存储器中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行以实现上
述实施例的图像分割方法中所执行的操作。

[0318] 可选地，计算机设备提供为终端。图14示出了本申请一个示例性实施例提供的终端1400的结构框图。该终端1400可以是便携式移动终端，比如：智能手机、平板电脑、MP3播
放器（Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层
面3）、MP4（Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频
层面4）播放器、笔记本电脑或台式电脑。终端1400还可能被称为用户设备、便携式终端、膝
上型终端、台式终端等其他名称。

[0319] 终端1400包括有：处理器1401和存储器1402。

[0320] 处理器1401可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1401可以采用DSP（Digital Signal Processing，数字信号处理）、FPGA（Field‑
Programmable Gate Array，现场可编程门阵列）、PLA（Programmable Logic Array，可编程
逻辑阵列）中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器，主
处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU（Central Processing
Unit，中央处理器）；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在
一些实施例中，处理器1401可以集成有GPU（Graphics Processing Unit，图像处理器），
GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1401还可以包
括AI（Artificial Intelligence，人工智能）处理器，该AI处理器用于处理有关机器学习的
计算操作。

[0321] 存储器1402可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1402还可包括高速随机存取存储器，以及非易失性存储器，比如一个
或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1402中的非暂态的计算机可
读存储介质用于存储至少一个计算机程序，该至少一个计算机程序用于被处理器1401所执
行以实现本申请中方法实施例提供的图像分割方法。

[0322] 在一些实施例中，终端1400还可选包括有：外围设备接口1403和至少一个外围设备。处理器1401、存储器1402和外围设备接口1403之间可以通过总线或信号线相连。各个外
围设备可以通过总线、信号线或电路板与外围设备接口1403相连。具体地，外围设备包括：
射频电路1404、显示屏1405、摄像头组件1406、音频电路1407、定位组件1408和电源1409中
的至少一种。

[0323] 外围设备接口1403可被用于将I/O（Input /Output，输入/输出）相关的至少一个外围设备连接到处理器1401和存储器1402。在一些实施例中，处理器1401、存储器1402和外
围设备接口1403被集成在同一芯片或电路板上；在一些其他实施例中，处理器1401、存储器
1402和外围设备接口1403中的任意一个或两个可以在单独的芯片或电路板上实现，本实施
例对此不加以限定。

[0324] 射频电路1404用于接收和发射RF（Radio Frequency，射频）信号，也称电磁信号。射频电路1404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1404将电信
号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路
1404包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解
码芯片组、用户身份模块卡等等。射频电路1404可以通过至少一种无线通信协议来与其它
终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络
（2G、3G、4G及5G）、无线局域网和/或WiFi(Wireless Fidelity，无线保真）网络。在一些实施
例中，射频电路1404还可以包括NFC（Near Field Communication，近距离无线通信）有关的
电路，本申请对此不加以限定。

[0325] 显示屏1405用于显示UI（User Interface，用户界面）。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1405是触摸显示屏时，显示屏1405还具有采集在
显示屏1405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处
理器1401进行处理。此时，显示屏1405还可以用于提供虚拟按钮和/或虚拟键盘，也称软按
钮和/或软键盘。在一些实施例中，显示屏1405可以为一个，设置在终端1400的前面板；在另
一些实施例中，显示屏1405可以为至少两个，分别设置在终端1400的不同表面或呈折叠设
计；在另一些实施例中，显示屏1405可以是柔性显示屏，设置在终端1400的弯曲表面上或折
叠面上。甚至，显示屏1405还可以设置成非矩形的不规则图形，也即异形屏。显示屏1405可
以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light‑Emitting
Diode,有机发光二极管)等材质制备。

[0326] 摄像头组件1406用于采集图像或视频。可选地，摄像头组件1406包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实
施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中
的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像
头融合实现全景拍摄以及VR（Virtual Reality，虚拟现实）拍摄功能或者其它融合拍摄功
能。在一些实施例中，摄像头组件1406还可以包括闪光灯。闪光灯可以是单色温闪光灯，也
可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同
色温下的光线补偿。

[0327] 音频电路1407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1401进行处理，或者输入至射频电路1404以实现语音通
信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1400的不同部位。
麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1401或射频
电路1404的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声
器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将
电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1407还可
以包括耳机插孔。

[0328] 定位组件1408用于定位终端1400的当前地理位置，以实现导航或LBS（Location Based Service，基于位置的服务）。定位组件1408可以是基于美国的GPS（Global
Positioning System，全球定位系统）、中国的北斗系统或俄罗斯的伽利略系统的定位组
件。

[0329] 电源1409用于为终端1400中的各个组件进行供电。电源1409可以是交流电、直流电、一次性电池或可充电电池。当电源1409包括可充电电池时，该可充电电池可以是有线充
电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过
无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

[0330] 在一些实施例中，终端1400还包括有一个或多个传感器1410。该一个或多个传感器1410包括但不限于：加速度传感器1411、陀螺仪传感器1412、压力传感器1413、指纹传感
器1414、光学传感器1415以及接近传感器1416。

[0331] 加速度传感器1411可以检测以终端1400建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1411可以用于检测重力加速度在三个坐标轴上的分量。处理器
1401可以根据加速度传感器1411采集的重力加速度信号，控制显示屏1405以横向视图或纵
向视图进行用户界面的显示。加速度传感器1411还可以用于游戏或者用户的运动数据的采
集。

[0332] 陀螺仪传感器1412可以检测终端1400的机体方向及转动角度，陀螺仪传感器1412可以与加速度传感器1411协同采集用户对终端1400的3D动作。处理器1401根据陀螺仪传感
器1412采集的数据，可以实现如下功能：动作感应（比如根据用户的倾斜操作来改变UI）、拍
摄时的图像稳定、游戏控制以及惯性导航。

[0333] 压力传感器1413可以设置在终端1400的侧边框和/或显示屏1405的下层。当压力传感器1413设置在终端1400的侧边框时，可以检测用户对终端1400的握持信号，由处理器
1401根据压力传感器1413采集的握持信号进行左右手识别或快捷操作。当压力传感器1413
设置在显示屏1405的下层时，由处理器1401根据用户对显示屏1405的压力操作，实现对UI
界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜
单控件中的至少一种。

[0334] 指纹传感器1414用于采集用户的指纹，由处理器1401根据指纹传感器1414采集到的指纹识别用户的身份，或者，由指纹传感器1414根据采集到的指纹识别用户的身份。在识
别出用户的身份为可信身份时，由处理器1401授权该用户执行相关的敏感操作，该敏感操
作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1414可以被设
置在终端1400的正面、背面或侧面。当终端1400上设置有物理按键或厂商Logo时，指纹传感
器1414可以与物理按键或厂商Logo集成在一起。

[0335] 光学传感器1415用于采集环境光强度。在一个实施例中，处理器1401可以根据光学传感器1415采集的环境光强度，控制显示屏1405的显示亮度。具体地，当环境光强度较高
时，调高显示屏1405的显示亮度；当环境光强度较低时，调低显示屏1405的显示亮度。在另
一个实施例中，处理器1401还可以根据光学传感器1415采集的环境光强度，动态调整摄像
头组件1406的拍摄参数。

[0336] 接近传感器1416，也称距离传感器，设置在终端1400的前面板。接近传感器1416用于采集用户与终端1400的正面之间的距离。在一个实施例中，当接近传感器1416检测到用
户与终端1400的正面之间的距离逐渐变小时，由处理器1401控制显示屏1405从亮屏状态切
换为息屏状态；当接近传感器1416检测到用户与终端1400的正面之间的距离逐渐变大时，
由处理器1401控制显示屏1405从息屏状态切换为亮屏状态。

[0337] 本领域技术人员可以理解，图14中示出的结构并不构成对终端1400的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

[0338] 可选地，计算机设备提供为服务器。图15是本申请实施例提供的一种服务器的结构示意图，该服务器1500可因配置或性能不同而产生比较大的差异，可以包括一个或一个
以上处理器（Central Processing Units，CPU）1501和一个或一个以上的存储器1502，其
中，存储器1502中存储有至少一条计算机程序，至少一条计算机程序由处理器1501加载并
执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络
接口、键盘及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现
设备功能的部件，在此不做赘述。

[0339] 本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行以实现上述实施例的
图像分割方法中所执行的操作。

[0340] 本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算
机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序
代码，使得该计算机设备实现如上述实施例的图像分割方法中所执行的操作。

[0341] 本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述程序可以存储于一种计算机可读存
储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

[0342] 以上所述仅为本申请实施例的可选实施例，并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的
保护范围之内。

图像分割方法、装置、计算机设备及存储介质转让专利

申请号 : CN202110234267.7

文献号 : CN112598686B

文献日 : 2021-06-04

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 余双 , 冀炜 , 马锴 , 郑冶枫

申请人 : 腾讯科技(深圳)有限公司

摘要 :

权利要求 :

说明书 :