组织腔体的定位方法、装置、可读介质和电子设备转让专利

申请号 : CN202210208932.X

文献号 : CN114332080B

文献日 : 2022-05-27

本公开涉及一种组织腔体的定位方法、装置、可读介质和电子设备，涉及图像处理技术领域，该方法包括：获取当前时刻内窥镜采集的组织图像，以及当前时刻之前内窥镜采集的至少一个历史组织图像。通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并确定每个历史组织图像与组织图像的相似度。通过定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，并根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果。根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。

1.一种组织腔体的定位方法，其特征在于，所述方法包括：

获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；

通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；

通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；

根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置；

所述根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置，包括：将每个所述历史组织图像与所述组织图像的相似度，作为该历史组织图像对应的权重，对至少一个所述历史定位结果与所述定位结果进行融合，得到综合定位结果；

根据所述综合定位结果确定所述组织图像中组织腔体的位置。

2.根据权利要求1所述的方法，其特征在于，所述通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度，包括：将所述组织图像、每个所述历史组织图像输入所述特征提取模型，以得到所述特征提取模型输出的所述特征图，以及每个所述历史组织图像对应的历史特征图；

根据每个所述历史组织图像对应的历史特征图与所述特征图，确定该历史组织图像与所述组织图像的相似度。

3.根据权利要求1所述的方法，其特征在于，所述通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，包括：将所述特征图输入所述定位模型，以得到所述定位模型输出的位置预测图，并将所述位置预测图作为所述定位结果，所述位置预测图用于表征所述组织图像中组织腔体的位置；

将每个所述历史特征图输入所述定位模型，以得到所述定位模型输出的该历史特征图对应的历史位置预测图，并将所述历史位置预测图作为该历史特征图对应的所述历史组织图像对应的历史定位结果，所述历史位置预测图用于表征对应的所述历史组织图像中组织腔体的位置。

4.根据权利要求1‑3中任一项所述的方法，其特征在于，所述特征提取模型和所述定位模型是通过以下方式联合训练得到的：获取样本输入集和样本输出集，所述样本输入集包括多个样本输入，每个所述样本输入包括样本组织图像和至少一个样本历史组织图像，所述样本输出集中包括与每个所述样本输入对应的样本输出，每个所述样本输出包括对应的所述样本组织图像中组织腔体的真实位置，以及对应的每个所述样本历史组织图像中组织腔体的真实位置，所述样本历史组织图像为所述内窥镜在采集所述样本组织图像之前采集的图像；

将每个所述样本输入作为所述特征提取模型的输入，以得到所述特征提取模型输出的该样本输入中所述样本组织图像对应的样本特征图，以及该样本输入中每个所述样本历史组织图像对应的样本历史特征图；

根据每个所述样本历史组织图像对应的样本历史特征图，与所述样本组织图像对应的样本特征图，确定该样本历史组织图像与所述样本组织图像的相似度；

将所述样本组织图像对应的样本特征图，以及每个所述样本历史组织图像对应的样本历史特征图，输入所述定位模型，以根据所述定位模型的输出、每个所述样本历史组织图像与所述样本组织图像的相似度，与该样本输入对应的所述样本输出，联合训练所述特征提取模型和所述定位模型。

5.根据权利要求4所述的方法，其特征在于，所述将所述样本组织图像对应的样本特征图，以及每个所述样本历史组织图像对应的样本历史特征图，输入所述定位模型，以根据所述定位模型的输出、每个所述样本历史组织图像与所述样本组织图像的相似度，与该样本输入对应的所述样本输出，联合训练所述特征提取模型和所述定位模型，包括：根据所述定位模型输出的所述样本组织图像对应的样本位置预测图、每个所述样本历史组织图像对应的样本历史位置预测图，以及每个所述样本历史组织图像与所述样本组织图像的相似度，确定样本综合预测图；

根据所述样本综合预测图和所述样本组织图像中组织腔体的真实位置，确定整体损失；

根据每个所述样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失；

根据所述整体损失和所述部分损失确定总损失，并以降低所述总损失为目标，利用反向传播算法训练所述特征提取模型和所述定位模型。

6.根据权利要求5所述的方法，其特征在于，所述根据所述样本综合预测图和所述样本组织图像中组织腔体的真实位置，确定整体损失，包括：根据所述样本组织图像中组织腔体的真实位置，确定标签图，所述标签图中每个像素点的值，与所述样本组织图像对应的像素点与所述样本组织图像中组织腔体的真实位置的距离负相关；

根据所述样本综合预测图和所述标签图，确定所述整体损失；

所述根据每个所述样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失，包括：根据该样本历史组织图像中组织腔体的真实位置，确定历史标签图，所述历史标签图中每个像素点的值，与该样本历史组织图像对应的像素点与该样本历史组织图像中组织腔体的真实位置的距离负相关；

根据该样本历史组织图像对应的样本历史位置预测图，和所述历史标签图，确定该样本历史组织图像对应的损失；

将每个所述样本历史组织图像对应的损失的和，作为所述部分损失。

7.一种组织腔体的定位装置，其特征在于，所述装置包括：

获取模块，用于获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；

提取模块，用于通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；

定位模块，用于通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；

处理模块，用于根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置；

所述处理模块包括：

融合子模块，用于将每个所述历史组织图像与所述组织图像的相似度，作为该历史组织图像对应的权重，对至少一个所述历史定位结果与所述定位结果进行融合，得到综合定位结果；

处理子模块，用于根据所述综合定位结果确定所述组织图像中组织腔体的位置。

8.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理装置执行时实现权利要求1‑6中任一项所述方法的步骤。

9.一种电子设备，其特征在于，包括：

存储装置，其上存储有计算机程序；

处理装置，用于执行所述存储装置中的所述计算机程序，以实现权利要求1‑6中任一项所述方法的步骤。

组织腔体的定位方法、装置、可读介质和电子设备

技术领域

[0001] 本公开涉及图像处理技术领域，具体地，涉及一种组织腔体的定位方法、装置、可读介质和电子设备。

背景技术

[0002] 内窥镜能够进入人体内部进行检查，使得医生能够直观地观察到人体内部的情况，在医疗领域得到了广泛应用。由于内窥镜检查是一种侵入式的检查手段，在检查过程中，可能由于经验、视角等原因导致进镜失败、损伤组织粘膜等问题。因此，当内窥镜采集组织图像时，需要识别出组织图像中组织腔体的位置，才能够给操作人员提供有效指示，保证内窥镜安全、有效地进镜。通常情况下，可以通过对组织图像进行图像分割、位置估计等处理，来确定组织腔体的位置，例如公开号为CN113487609B的专利文件所提供的定位方法。然而，由于组织内的环境复杂多变、内窥镜与组织壁过近等原因，可能出现组织图像中并不存在组织腔体的情况，导致识别的准确度低，甚至无法识别的问题。

发明内容

[0003] 提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

[0004] 第一方面，本公开提供一种组织腔体的定位方法，所述方法包括：

[0005] 获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；

[0006] 通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；

[0007] 通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；

[0008] 根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置。

[0009] 第二方面，本公开提供一种组织腔体的定位装置，所述装置包括：

[0010] 获取模块，用于获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；

[0011] 提取模块，用于通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；

[0012] 定位模块，用于通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；

[0013] 处理模块，用于根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置。

[0014] 第三方面，本公开提供一种计算机可读介质，其上存储有计算机程序，该程序被处理装置执行时实现本公开第一方面所述方法的步骤。

[0015] 第四方面，本公开提供一种电子设备，包括：

[0016] 存储装置，其上存储有计算机程序；

[0017] 处理装置，用于执行所述存储装置中的所述计算机程序，以实现本公开第一方面所述方法的步骤。

[0018] 通过上述技术方案，本公开首先获取内窥镜采集的组织图像以及至少一个历史组织图像，之后通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并进一步确定每个历史组织图像与组织图像的相似度。再利用定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果。最后根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。本公开根据组织图像与历史组织图像的相似度，对定位结果和历史定位结果进行融合，以确定组织图像中组织腔体的位置，能够提高组织腔体定位的成功率和准确度。

[0019] 本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

[0020] 结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。在附图中：

[0021] 图1是根据一示例性实施例示出的一种组织腔体的定位方法的流程图；

[0022] 图2是根据一示例性实施例示出的特征提取模型和定位模型的示意图；

[0023] 图3是根据一示例性实施例示出的另一种组织腔体的定位方法的流程图；

[0024] 图4是根据一示例性实施例示出的另一种组织腔体的定位方法的流程图；

[0025] 图5是根据一示例性实施例示出的另一种组织腔体的定位方法的流程图；

[0026] 图6是根据一示例性实施例示出的一种联合训练征提取模型和定位模型的示意图；

[0027] 图7是根据一示例性实施例示出的另一种联合训练征提取模型和定位模型的示意图；

[0028] 图8是根据一示例性实施例示出的一种组织腔体的定位装置的框图；

[0029] 图9是根据一示例性实施例示出的另一种组织腔体的定位装置的框图；

[0030] 图10是根据一示例性实施例示出的另一种组织腔体的定位装置的框图；

[0031] 图11是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

[0032] 下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

[0033] 应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

[0034] 本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

[0035] 需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

[0036] 需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

[0037] 本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

[0038] 图1是根据一示例性实施例示出的一种组织腔体的定位方法的流程图，如图1所示，该方法包括以下步骤：

[0039] 步骤101，获取当前时刻内窥镜采集的组织图像，以及当前时刻之前内窥镜采集的至少一个历史组织图像。

[0040] 举例来说，在进行内窥镜检查时，内窥镜会按照预设的采集周期，在待测组织内不断地采集组织图像，当前时刻采集的为组织图像，当前时刻之前采集的为历史组织图像。可以将组织图像和历史组织图像按照采集时刻排列，作为组织图像集，组织图像集中任意相邻的两个图像对应的采集时刻之间的间隔即为采集周期。具体的，可以将预设时长（例如：5s）内采集的多个图像作为一个组织图像集，其中，最新采集的一个图像即为组织图像，其他的图像则为历史组织图像。也可以将连续采集的预设数量个（例如：5个）图像作为一个组织图像集，其中，最新采集的一个图像即为组织图像，其他的图像则为历史组织图像。需要说明的是，本公开实施例中所述的内窥镜，例如可以是肠镜、胃镜等，若内窥镜为肠镜，那么待测组织即为肠道，组织图像即为肠道图像，组织腔体则为肠腔。若内窥镜为胃镜，那么待测组织可以为食道、胃部、十二指肠，上述组织图像可以为食道图像、胃部图像或者十二指肠图像，组织腔体则为食管腔体、胃内腔体、十二指肠腔。内窥镜还可以用于采集其他组织的图像，本公开对此不作具体限定。

[0041] 内窥镜检查过程中，可能由于进镜手法不稳定，或者内窥镜的位置不合适等原因，会采集到很多无效的图像，例如障碍物遮挡、曝光度过大、清晰度过低等图像。这些无效的图像会对内窥镜的检查结果产生干扰。因此，在得到组织图像和历史组织图像之后，可以先判断组织图像和历史组织图像是否有效，以过滤掉无效的图像。若组织图像或者历史组织图像为无效的图像，可以直接丢弃该图像。这样能够减少不必要的数据处理，提高处理速度。例如，可以利用预先训练的识别模型对组织图像和历史组织图像分别进行识别，以确定组织图像和历史组织图像是否有效，识别模型例如可以是CNN（英文：Convolutional Neural Networks，中文：卷积神经网络）或者LSTM（英文：Long Short‑Term Memory，中文：长短期记忆网络），也可以是Transformer（例如Vision Transformer）中的Encoder等，本公开对此不作具体限定。进一步的，还可以对组织图像和历史组织图像进行预处理，以对其中包括的数据进行增强处理，预处理可以包括：随机仿射变换，随机亮度、对比度、饱和度、色度调整，尺寸变换（英文：Resize）等处理，最后得到的预处理后的组织图像和历史组织图像的尺寸相同，例如的组织图像和历史组织图像均为256*256的图像。

[0042] 步骤102，通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并确定每个历史组织图像与组织图像的相似度。

[0043] 示例的，可以预先训练一个特征提取模型，然后将组织图像和至少一个历史组织图像输入特征提取模型，特征提取模型能够对组织图像和至少一个历史组织图像进行特征提取，以得到组织图像对应的特征图（英文：Feature Map），以及每个历史组织图像对应的历史特征图。特征图能够表征组织图像，历史特征图能够表征对应的历史组织图像。特征提取模型可以理解为Feature Extractor，例如可以是VGG（英文：Visual Geometry Group）网络，也可以是ResNet、DenseNet等能够进行特征提取的网络，本公开对此不作具体限定。以特征提取模型为VGG网络来举例，组织图像和历史组织图像的尺寸均为256*256，可以去掉VGG网络中最后一层的全连接层，那么特征图和历史特征图的尺寸均为512*8*8。

[0044] 进一步的，可以根据每个历史组织图像与组织图像，确定该历史组织图像与组织图像的相似度，也可以根据每个历史特征图与特征图，确定该历史特征图对应的历史组织图像与组织图像的相似度。本公开对此不作具体限定。在得到每个历史组织图像与组织图像的相似度之后，还可以对全部的相似度进行归一化处理，以将每个历史组织图像与组织图像的相似度归一化到0至1之间的值。

[0045] 步骤103，通过定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，并根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，特征提取模型和定位模型根据多个样本图像联合训练得到。

[0046] 示例的，可以预先训练一个定位模型，然后将特征图和至少一个历史特征图输入定位模型，定位模型能够根据特征图进行定位，得到对应的定位结果，还能够根据每个历史特征图进行定位，得到该历史特征图对应的历史组织图像对应的历史定位结果。其中，定位结果用于指示组织图像中组织腔体的位置，历史定位结果用于指示对应的历史组织图像中组织腔体的位置，也可以理解为，定位结果用于表征组织图像中每个像素点属于组织腔体的概率，历史定位结果用于表征对应的历史组织图像中每个像素点属于组织腔体的概率。具体的，定位结果的形式可以是一组概率值，其中包括了组织图像中每个像素点属于组织腔体的概率。定位结果的形式也可以是一个与组织图像相同大小的预测图，预测图中每个像素点的像素值用于表征组织图像中对应的像素点属于组织腔体的概率。定位结果的形式还可以是一个与组织图像相同大小的热力图，热力图中每个像素点的亮度用于表征组织图像中对应的像素点属于组织腔体的概率。历史定位结果的形式与定位结果的形式相同，此处不再赘述。

[0047] 定位模型可以理解为Prediction Head，例如可以包括一个卷积网络，卷积网络中包括依次连接的卷积层、批归一化层和池化层，最后对定位结果（或者历史定位结果）进行上采样。以组织图像和历史组织图像的尺寸均为256*256来举例，特征图和历史特征图的尺寸均为512*8*8，卷积层的卷积核大小可以为3*3，池化层的输出大小可以为64*64，进一步的，为了降低定位模型的训练参数，可以对定位结果进行16倍上采样（可以采用双线性插值的方式实现上采样）。经过特征提取模型得到的特征图以及历史特征图，长度和宽度得到了扩展，之后输入定位模型，连续经过卷积操作以后宽度和长度都得以恢复，最后得到经过16倍的上采样的定位结果（或者历史定位结果），定位结果（或者历史定位结果）与组织图像和历史组织图像的尺寸相同，均为256*256。

[0048] 需要说明的是，上述特征提取模型和定位模型可以根据多个样本图像联合训练得到。特征提取模型（表示为：Feature Extractor）和定位模型（表示为：Prediction Head）的连接关系可以如图2所示，图2中以4个历史组织图像为例。组织图像和4个历史组织图像作为Feature Extractor的输入，Feature Extractor的输出作为Prediction Head的输入，Feature Extractor的输出即为组织图像对应的特征图以及每个历史组织图像对应的历史特征图（均表示为Feature Map），Prediction Head输出定位结果以及4个历史定位结果。

[0049] 步骤104，根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。

[0050] 示例的，在得到定位结果和至少一个历史定位结果之后，可以根据每个历史组织图像与组织图像的相似度，对定位结果和至少一个历史定位结果进行融合，以确定组织图像中组织腔体的位置。具体的，可以将每个历史组织图像与组织图像的相似度，作为该历史组织图像对应的历史定位结果的权重，即与组织图像越相似的历史组织图像，对应的权重越大，与组织图像越不相似的历史组织图，对应的权重越小。然后将至少一个历史定位结果按照对应的权重，与定位结果进行融合，最后根据融合结果确定组织图像中组织腔体的位置。

[0051] 由于定位结果能够表征组织图像中每个像素点属于组织腔体的概率，历史定位结果能够表征对应的历史组织图像中每个像素点属于组织腔体的概率，那么融合结果能够结合历史定位结果与定位结果来表征每个像素点属于组织腔体的概率。可以将融合结果中概率最大的像素点作为组织图像中组织腔体的位置，也可以将融合结果中概率大于指定阈值的一个或多个像素点作为组织图像中组织腔体的位置，本公开对此不作具体限定。根据每个历史组织图像与组织图像的相似度进行融合得到的融合结果，能够结合历史定位结果与定位结果来对组织腔体进行定位，在组织图像中并不存在组织腔体的情况下，也能结合历史定位结果进行定位，有效提高了组织腔体定位的成功率和准确度。在确定组织图像中组织腔体的位置之后，可以在用于展示组织图像的显示界面中实时显示组织腔体的位置，例如可以直接在组织图像中标出组织腔体的位置，也可以按照文字信息的形式显示组织腔体的位置的坐标，从而为操作人员实时提供有效的指示。

[0052] 综上所述，本公开首先获取内窥镜采集的组织图像以及至少一个历史组织图像，之后通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并进一步确定每个历史组织图像与组织图像的相似度。再利用定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果。最后根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。本公开根据组织图像与历史组织图像的相似度，对定位结果和历史定位结果进行融合，以确定组织图像中组织腔体的位置，能够提高组织腔体定位的成功率和准确度。

[0053] 图3是根据一示例性实施例示出的另一种组织腔体的定位方法的流程图，如图3所示，步骤102可以包括：

[0054] 步骤1021，将组织图像、每个历史组织图像输入特征提取模型，以得到特征提取模型输出的特征图，以及每个历史组织图像对应的历史特征图。

[0055] 步骤1022，根据每个历史组织图像对应的历史特征图与特征图，确定该历史组织图像与组织图像的相似度。

[0056] 举例来说，可以先将组织图像、每个历史组织图像输入特征提取模型，特征提取模型能够分别对组织图像和至少一个历史组织图像进行特征提取，以得到组织图像对应的特征图，以及每个历史组织图像对应的历史特征图。之后，可以根据每个历史组织图像对应的历史特征图与特征图，确定该历史组织图像与组织图像的相似度。具体的，可以将每个历史特征图与特征图的哈达玛积（英文：Hadamard product）作为该历史特征图与特征图的相似度。以组织图像集包括5个图像来举例，其中最新采集的组织图像表示为X5，其余4个为历史组织图像分别表示为X1，X2，X3，X4，那么第i个历史组织图像与组织图像的相似度可以通过公式1来确定：

[0057] 公式1

[0058] 其中，当i∈[1,4]时，Si表示第i个历史组织图像与组织图像的相似度，F(Xi)表示第i个历史组织图像对应的历史特征图。当i=5时，F(X5)表示组织图像对应的特征图，S5表示组织图像与组织图像的相似度，可以为1。<,>表示哈达玛运算符。

[0059] 进一步的，还可以对全部的相似度进行归一化处理，以将每个历史组织图像与组织图像的相似度归一化到0至1之间的值。例如，可以通过公式2对相似度进行归一化处理：

[0060] 公式2

[0061] 其中，当i∈[1,4]时，表示第i个历史组织图像与组织图像的归一化后的相似度。当i=5时，表示组织图像与组织图像的归一化后的相似度。

[0062] 图4是根据一示例性实施例示出的另一种组织腔体的定位方法的流程图，如图4所示，步骤103可以通过以下步骤来实现：

[0063] 步骤1031，将特征图输入定位模型，以得到定位模型输出的位置预测图，并将位置预测图作为定位结果，位置预测图用于表征组织图像中组织腔体的位置。

[0064] 步骤1032，将每个历史特征图输入定位模型，以得到定位模型输出的该历史特征图对应的历史位置预测图，并将历史位置预测图作为该历史特征图对应的历史组织图像对应的历史定位结果，历史位置预测图用于表征对应的历史组织图像中组织腔体的位置。

[0065] 举例来说，可以将特征图和至少一个历史特征图分别输入定位模型，定位模型能够根据特征图进行定位，输出位置预测图，定位模型还能够根据每个历史特征图进行定位，输出该历史特征图对应的历史位置预测图。其中，位置预测图用于表征组织图像中组织腔体的位置，历史位置预测图用于表征对应的历史组织图像中组织腔体的位置。也可以理解为，位置预测图用于表征组织图像中每个像素点属于组织腔体的概率，历史位置预测图用于表征对应的历史组织图像中每个像素点属于组织腔体的概率。具体的，位置预测图的大小与组织图像的大小相同，即位置预测图与组织图像的像素点一一对应，位置预测图中每个像素点的像素值用于表征组织图像中对应的像素点属于组织腔体的概率。历史位置预测图的大小与对应的历史组织图像的大小相同，即历史位置预测图与对应的历史组织图像的像素点一一对应，历史位置预测图中每个像素点的像素值用于表征对应的历史组织图像中对应的像素点属于组织腔体的概率。

[0066] 图5是根据一示例性实施例示出的另一种组织腔体的定位方法的流程图，如图5所示，步骤104的实现方式可以包括：

[0067] 步骤1041，将每个历史组织图像与组织图像的相似度，作为该历史组织图像对应的权重，对至少一个历史位置预测图与位置预测图进行融合，得到综合预测图。

[0068] 步骤1042，根据综合预测图确定组织图像中组织腔体的位置。

[0069] 示例的，可以将每个历史组织图像与组织图像的相似度，作为该历史组织图像对应的权重，对至少一个历史位置预测图与位置预测图进行融合，得到综合预测图。具体的，可以根据每个历史组织图像对应的权重，对至少一个历史位置预测图与位置预测图进行加权求和，得到综合预测图。同样组织图像集包括5个图像来举例，其中最新采集的组织图像表示为X5，其余4个为历史组织图像分别表示为X1，X2，X3，X4，可以通过公式3来确定综合预测图：

[0070] 公式3

[0071] 其中，R表示综合预测图，当i∈[1,4]时，Si表示第i个历史组织图像与组织图像的相似度，Ri表示第i个历史组织图像对应的历史位置预测图。当i=5时，S5表示组织图像与组织图像的相似度，R5表示位置预测图。

[0072] 组织图像与历史组织图像的大小相同，相应的，位置预测图的大小与历史位置预测图的大小也相同。那么综合预测图与组织图像的大小相同，即综合预测图与组织图像的像素点一一对应。那么可以根据综合预测图确定组织图像中组织腔体的位置。例如可以通过公式4来确定组织图像中组织腔体的位置：

[0073] 公式4

[0074] 其中，表示组织图像中组织腔体的位置对应的坐标。

[0075] 图6是根据一示例性实施例示出的一种联合训练征提取模型和定位模型的示意图，如图6所示，特征提取模型和定位模型是通过以下方式联合训练得到的：

[0076] 步骤A，获取样本输入集和样本输出集，样本输入集包括多个样本输入，每个样本输入包括样本组织图像和至少一个样本历史组织图像，样本输出集中包括与每个样本输入对应的样本输出，每个样本输出包括对应的样本组织图像中组织腔体的真实位置，以及对应的每个样本历史组织图像中组织腔体的真实位置，样本历史组织图像为内窥镜在采集样本组织图像之前采集的图像。

[0077] 举例来说，在对特征提取模型和定位模型进行联合训练之前，需要先获取样本输入集和样本输出集。样本输入集中包括了多个样本输入，每个样本输入可以为一个样本组织图像和该样本组织图像对应的至少一个样本历史组织图像。其中，样本组织图像例如可以是之前执行内窥镜检查时采集到的组织图像，样本历史组织图像为内窥镜在采集样本组织图像之前采集的图像。样本输出集中包括了与每个样本输入对应的样本输出，每个样本输出包括对应的样本组织图像中组织腔体的真实位置，以及每个样本历史组织图像中组织腔体的真实位置。

[0078] 步骤B，将每个样本输入作为特征提取模型的输入，以得到特征提取模型输出的该样本输入中样本组织图像对应的样本特征图，以及该样本输入中每个样本历史组织图像对应的样本历史特征图。

[0079] 步骤C，根据每个样本历史组织图像对应的样本历史特征图，与样本组织图像对应的样本特征图，确定该样本历史组织图像与样本组织图像的相似度。

[0080] 步骤D，将样本组织图像对应的样本特征图，以及每个样本历史组织图像对应的样本历史特征图，输入定位模型，以根据定位模型的输出、每个样本历史组织图像与样本组织图像的相似度，与该样本输入对应的样本输出，联合训练特征提取模型和定位模型。

[0081] 示例的，在对特征提取模型和定位模型进行联合训练时，可以将任一个样本输入作为特征提取模型的输入，特征提取模型分别对该样本输入中包括的样本组织图像和至少一个样本历史组织图像进行特征提取，得到样本组织图像对应的样本特征图，以及每个样本历史组织图像对应的样本历史特征图。之后，可以根据样本组织图像对应的样本特征图，以及每个样本历史组织图像对应的样本历史特征图，确定该样本历史组织图像与样本组织图像的相似度。具体的，可以将每个样本历史特征图与样本特征图的哈达玛积作为该样本历史特征图对应的样本历史组织图像与样本组织图像的相似度。进一步的，还可以对每个样本历史组织图像与样本组织图像的相似度进行归一化处理。再将样本组织图像对应的样本特征图，以及每个样本历史组织图像对应的样本历史特征图，输入定位模型，定位模型分别对样本特征图以及每个样本历史特征图进行定位，以输出样本特征图的定位结果、每个样本历史特征图的定位结果。

[0082] 最后可以根据定位模型的输出（即样本特征图的定位结果、每个样本历史特征图的定位结果）、每个样本历史组织图像与样本组织图像的相似度，与该样本输入对应的样本输出，确定损失函数，并以降低损失函数为目标，利用反向传播算法来修正特征提取模型和定位模型中的神经元的参数，神经元的参数例如可以是神经元的权重（英文：Weight）和偏置量（英文：Bias）。重复上述步骤，直至损失函数满足预设条件，例如损失函数小于预设的损失阈值，以达到联合训练特征提取模型和定位模型的目的。

[0083] 具体的，可以根据每个样本历史组织图像与样本组织图像的相似度，对定位模型输出的样本特征图的定位结果和每个样本历史特征图的定位结果进行融合，以确定样本组织图像中组织腔体的预测位置。通过比较预测位置与该样本输入对应的样本输出中包括的样本组织图像中组织腔体的真实位置，确定损失函数。也可以通过比较每个样本历史特征图的定位结果与该样本输入对应的样本输出中包括的每个样本历史组织图像中组织腔体的真实位置，确定损失函数。

[0084] 图7是根据一示例性实施例示出的另一种联合训练征提取模型和定位模型的示意图，如图7所示，步骤D可以包括以下步骤：

[0085] 步骤D1，根据定位模型输出的样本组织图像对应的样本位置预测图、每个样本历史组织图像对应的样本历史位置预测图，以及每个样本历史组织图像与样本组织图像的相似度，确定样本综合预测图。

[0086] 步骤D2，根据样本综合预测图和样本组织图像中组织腔体的真实位置，确定整体损失。

[0087] 示例的，可以根据定位模型输出的样本组织图像对应的样本位置预测图、每个样本历史组织图像对应的样本历史位置预测图，以及每个样本历史组织图像与样本组织图像的相似度，确定样本综合预测图。确定样本综合预测图的方式，与步骤1041中确定综合预测图的方式相同，此处不再赘述。之后，可以根据样本综合预测图和样本组织图像中组织腔体的真实位置，确定整体损失，整体损失例如可以是均方误差损失。同样以组织图像集包括5个图像来举例，其中最新采集的组织图像表示为X5，其余4个为历史组织图像分别表示为X1，X2，X3，X4，可以通过公式5来确定整体损失：

[0088] 公式5

[0089] 其中，Lf表示整体损失，(xm,ym)表示X5中的任一像素点，表示样本综合预测图，2
表示根据样本组织图像中组织腔体的真实位置确定的标签图，|| ||表示L2范数。根据样本组织图像中组织腔体的真实位置确定的标签图，用于指示样本组织图像中每个像素点是否属于组织腔体，可以理解为，标签图中包含了每个像素点对应的标签（英文：label）。

[0090] 步骤D3，根据每个样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失。

[0091] 步骤D4，根据整体损失和部分损失确定总损失，并以降低总损失为目标，利用反向传播算法训练特征提取模型和定位模型。

[0092] 示例的，可以根据每个样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失，部分损失同样可以是均方误差损失。可以通过公式6来确定部分损失：

[0093] 公式6

[0094] 其中，Lp表示部分损失，当i∈[1,4]时，Li表示第i个历史组织图像对应的损失。当i=5时，L5表示组织图像对应的损失。即部分损失为每个历史组织图像对应的损失与组织图像对应的损失的和。(xm,ym)表示Xi中的任一像素点，当i∈[1,4]时，Net(xm,ym)表示第i个历史组织图像对应的样本历史位置预测图，表示根据第i个样本历史组织图像中组织腔体的真实位置确定的历史标签图。当i=5时，Net(xm,ym)表示样本组织图像对应的样本位置预2
测图，表示根据样本组织图像中组织腔体的真实位置确定的标签图。同样的，|| || 表示L2范数。根据第i个样本历史组织图像中组织腔体的真实位置确定的历史标签图，用于指示第i个样本历史组织图像中每个像素点是否属于组织腔体，可以理解为，历史标签图中包含了每个像素点对应的标签。

[0095] 最后可以根据整体损失和部分损失确定总损失，并以降低总损失为目标，利用反向传播算法训练特征提取模型和定位模型。例如，可以将整体损失和部分损失的和作为总损失，也可以按照预设权重对整体损失和部分损失进行加权求和，得到总损失。例如，可以通过公式7来得到总损失：

[0096] Lall =αLp +βLf公式7

[0097] 其中，Lall表示总损失，α表示部分损失对应的权重，β表示整体损失对应的权重。

[0098] 联合训练特征提取模型和定位模型的初始学习率可以设置为：1e‑2，mini‑batch size可以设置为：16，优化器可以选择：SGD with Momentum，Epoch可以设置为：100，样本组织图像的大小可以为：256*256。

[0099] 在一种实现方式中，步骤D2可以通过以下步骤来实现：

[0100] 步骤1）根据样本组织图像中组织腔体的真实位置，确定标签图，标签图中每个像素点的值，与样本组织图像对应的像素点与样本组织图像中组织腔体的真实位置的距离负相关。

[0101] 步骤2）根据样本综合预测图和标签图，确定整体损失。

[0102] 相应的，步骤D3可以通过以下步骤来实现：

[0103] 步骤3）根据该样本历史组织图像中组织腔体的真实位置，确定历史标签图，历史标签图中每个像素点的值，与该样本历史组织图像对应的像素点与该样本历史组织图像中组织腔体的真实位置的距离负相关。

[0104] 步骤4）根据该样本历史组织图像对应的样本历史位置预测图，和历史标签图，确定该样本历史组织图像对应的损失。

[0105] 步骤5）将每个样本历史组织图像对应的损失的和，作为部分损失。

[0106] 举例来说，样本输出中，样本组织图像中组织腔体的真实位置、以及每个样本历史组织图像中组织腔体的真实位置，通常是一个点的坐标，那么样本组织图像（或者样本历史组织图像）中只有真实位置处的标签为1，其他像素点的标签均为0，也就是说对应的标签图中只有一个像素点为1，其他像素点为0。那么在对特征提取模型和定位模型进行联合训练时，样本输出中包括的信息量过小，导致损失函数过小，进一步导致联合训练过程不稳定。为了避免这样的问题出现，可以对样本组织图像和每个样本历史组织图像中像素点对应的标签进行处理，以增加标签图中的信息量。

[0107] 具体的，可以根据样本组织图像对应的像素点与样本组织图像中组织腔体的真实位置的距离，生成标签图，标签图中每个像素点的值，与样本组织图像对应的像素点与样本组织图像中组织腔体的真实位置的距离负相关。同样的，可以根据每个样本历史组织图像对应的像素点与该样本历史组织图像中组织腔体的真实位置的距离，生成历史标签图，历史标签图中每个像素点的值，与该样本历史组织图像对应的像素点与该样本历史组织图像中组织腔体的真实位置的距离负相关。在得到标签图和历史标签图之后，可以带入公式5和公式6确定部分损失和整体损失。

[0108] 具体的，可以通过公式8来生成标签图和历史标签图：

[0109] 公式8

[0110] 其中，当i∈[1,4]时，表示第i个样本历史组织图像对应的历史标签图，当i=5时，表示根据样本组织图像对应的标签图。表示Xi中的任一像素点，表示Xi中的织腔体的真实位置。τ表示可学习的系数，可以在联合训练特征提取
模型和定位模型的过程中学习得到。

[0111] 根据公式8可以看出，标签图（或者历史标签图）中，距离组织腔体的真实位置越近的像素点的值越大（可以理解为该点属于组织腔体的概率越大），距离组织腔体的真实位置越远的像素点的值越小（可以理解为该点属于组织腔体的概率越小）。这样，标签图和历史标签图中每个像素点都为非零的值，能够有效提高其中包含的信息量，进一步的，根据标签图和历史标签图分别确定整体损失和部分损失时，能够避免整体损失和部分损失过小，导致联合训练过程不稳定的问题。

[0112] 综上所述，本公开首先获取内窥镜采集的组织图像以及至少一个历史组织图像，之后通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并进一步确定每个历史组织图像与组织图像的相似度。再利用定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果。最后根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。本公开根据组织图像与历史组织图像的相似度，对定位结果和历史定位结果进行融合，以确定组织图像中组织腔体的位置，能够提高组织腔体定位的成功率和准确度。

[0113] 图8是根据一示例性实施例示出的一种组织腔体的定位装置的框图，如图8所示，该装置200可以包括：

[0114] 获取模块201，用于获取当前时刻内窥镜采集的组织图像，以及当前时刻之前内窥镜采集的至少一个历史组织图像。

[0115] 提取模块202，用于通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并确定每个历史组织图像与组织图像的相似度。

[0116] 定位模块203，用于通过定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，并根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，特征提取模型和定位模型根据多个样本图像联合训练得到。

[0117] 处理模块204，用于根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。

[0118] 图9是根据一示例性实施例示出的另一种组织腔体的定位装置的框图，如图9所示，提取模块202可以包括：

[0119] 提取子模块2021，用于将组织图像、每个历史组织图像输入特征提取模型，以得到特征提取模型输出的特征图，以及每个历史组织图像对应的历史特征图。

[0120] 相似度确定子模块2022，用于根据每个历史组织图像对应的历史特征图与特征图，确定该历史组织图像与组织图像的相似度。

[0121] 在一种实现方式中，定位模块203可以用于：

[0122] 将特征图输入定位模型，以得到定位模型输出的位置预测图，并将位置预测图作为定位结果，位置预测图用于表征组织图像中组织腔体的位置。

[0123] 将每个历史特征图输入定位模型，以得到定位模型输出的该历史特征图对应的历史位置预测图，并将历史位置预测图作为该历史特征图对应的历史组织图像对应的历史定位结果，历史位置预测图用于表征对应的历史组织图像中组织腔体的位置。

[0124] 图10是根据一示例性实施例示出的另一种组织腔体的定位装置的框图，如图10所示，处理模块204可以包括：

[0125] 融合子模块2041，用于将每个历史组织图像与组织图像的相似度，作为该历史组织图像对应的权重，对至少一个历史位置预测图与位置预测图进行融合，得到综合预测图。

[0126] 处理子模块2042，用于根据综合预测图确定组织图像中组织腔体的位置。

[0127] 在一种实现方式中，特征提取模型和定位模型是通过以下方式联合训练得到的：

[0128] 步骤A，获取样本输入集和样本输出集，样本输入集包括多个样本输入，每个样本输入包括样本组织图像和至少一个样本历史组织图像，样本输出集中包括与每个样本输入对应的样本输出，每个样本输出包括对应的样本组织图像中组织腔体的真实位置，以及对应的每个样本历史组织图像中组织腔体的真实位置，样本历史组织图像为内窥镜在采集样本组织图像之前采集的图像。

[0129] 步骤B，将每个样本输入作为特征提取模型的输入，以得到特征提取模型输出的该样本输入中样本组织图像对应的样本特征图，以及该样本输入中每个样本历史组织图像对应的样本历史特征图。

[0130] 步骤C，根据每个样本历史组织图像对应的样本历史特征图，与样本组织图像对应的样本特征图，确定该样本历史组织图像与样本组织图像的相似度。

[0131] 步骤D，将样本组织图像对应的样本特征图，以及每个样本历史组织图像对应的样本历史特征图，输入定位模型，以根据定位模型的输出、每个样本历史组织图像与样本组织图像的相似度，与该样本输入对应的样本输出，联合训练特征提取模型和定位模型。

[0132] 在另一种实现方式中，步骤D可以包括以下步骤：

[0133] 步骤D1，根据定位模型输出的样本组织图像对应的样本位置预测图、每个样本历史组织图像对应的样本历史位置预测图，以及每个样本历史组织图像与样本组织图像的相似度，确定样本综合预测图。

[0134] 步骤D2，根据样本综合预测图和样本组织图像中组织腔体的真实位置，确定整体损失。

[0135] 步骤D3，根据每个样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失。

[0136] 步骤D4，根据整体损失和部分损失确定总损失，并以降低总损失为目标，利用反向传播算法训练特征提取模型和定位模型。

[0137] 在又一种实现方式中，步骤D2可以通过以下步骤来实现：

[0138] 步骤1）根据样本组织图像中组织腔体的真实位置，确定标签图，标签图中每个像素点的值，与样本组织图像对应的像素点与样本组织图像中组织腔体的真实位置的距离负相关。

[0139] 步骤2）根据样本综合预测图和标签图，确定整体损失。

[0140] 相应的，步骤D3可以通过以下步骤来实现：

[0141] 步骤3）根据该样本历史组织图像中组织腔体的真实位置，确定历史标签图，历史标签图中每个像素点的值，与该样本历史组织图像对应的像素点与该样本历史组织图像中组织腔体的真实位置的距离负相关。

[0142] 步骤4）根据该样本历史组织图像对应的样本历史位置预测图，和历史标签图，确定该样本历史组织图像对应的损失。

[0143] 步骤5）将每个样本历史组织图像对应的损失的和，作为部分损失。

[0144] 关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

[0145] 综上所述，本公开首先获取内窥镜采集的组织图像以及至少一个历史组织图像，之后通过特征提取模型确定组织图像对应的特征图，以及每个历史组织图像对应的历史特征图，并进一步确定每个历史组织图像与组织图像的相似度。再利用定位模型根据特征图对组织图像中组织腔体进行定位，得到定位结果，根据每个历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果。最后根据每个历史组织图像与组织图像的相似度、定位结果和至少一个历史定位结果，确定组织图像中组织腔体的位置。本公开根据组织图像与历史组织图像的相似度，对定位结果和历史定位结果进行融合，以确定组织图像中组织腔体的位置，能够提高组织腔体定位的成功率和准确度。

[0146] 下面参考图11，其示出了适于用来实现本公开实施例的电子设备（例如可以上述实施例中的执行主体，可以是终端设备或服务器）300的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA（个人数字助理）、PAD（平板电脑）、PMP（便携式多媒体播放器）、车载终端（例如车载导航终端）等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

[0147] 如图11所示，电子设备300可以包括处理装置（例如中央处理器、图形处理器等）301，其可以根据存储在只读存储器（ROM）302中的程序或者从存储装置308加载到随机访问存储器（RAM）303中的程序而执行各种适当的动作和处理。在RAM 303中，还存储有电子设备
300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出（I/O）接口305也连接至总线304。

[0148] 通常，以下装置可以连接至I/O接口305：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306；包括例如液晶显示器（LCD）、扬声器、振动器等的输出装置307；包括例如磁带、硬盘等的存储装置308；以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图11示出了具有各种装置的电子设备300，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

[0149] 特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置309从网络上被下载和安装，或者从存储装置308被安装，或者从ROM 302被安装。在该计算机程序被处理装置301执行时，执行本公开实施例的方法中限定的上述功能。

[0150] 需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD‑ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF（射频）等等，或者上述的任意合适的组合。

[0151] 在一些实施方式中，终端设备、服务器可以利用诸如HTTP（HyperText Transfer Protocol，超文本传输协议）之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信（例如，通信网络）互连。通信网络的示例包括局域网（“LAN”），广域网（“WAN”），网际网（例如，互联网）以及端对端网络（例如，ad hoc端对端网络），以及任何当前已知或未来研发的网络。

[0152] 上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

[0153] 上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置。

[0154] 可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网（LAN）或广域网（WAN）——连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

[0155] 附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

[0156] 描述于本公开实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，模块的名称在某种情况下并不构成对该模块本身的限定，例如，获取模块还可以被描述为“获取组织图像和至少一个历史组织图像的模块”。

[0157] 本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列（FPGA）、专用集成电路（ASIC）、专用标准产品（ASSP）、片上系统（SOC）、复杂可编程逻辑设备（CPLD）等等。

[0158] 在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦除可编程只读存储器（EPROM或快闪存储器）、光纤、便捷式紧凑盘只读存储器（CD‑ROM）、光学储存设备、磁储存设备、或上述内容的任何合适组合。

[0159] 根据本公开的一个或多个实施例，示例1提供了一种组织腔体的定位方法，包括：获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置。

[0160] 根据本公开的一个或多个实施例，示例2提供了示例1的方法，所述通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度，包括：将所述组织图像、每个所述历史组织图像输入所述特征提取模型，以得到所述特征提取模型输出的所述特征图，以及每个所述历史组织图像对应的历史特征图；根据每个所述历史组织图像对应的历史特征图与所述特征图，确定该历史组织图像与所述组织图像的相似度。

[0161] 根据本公开的一个或多个实施例，示例3提供了示例1的方法，所述通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，包括：将所述特征图输入所述定位模型，以得到所述定位模型输出的位置预测图，并将所述位置预测图作为所述定位结果，所述位置预测图用于表征所述组织图像中组织腔体的位置；将每个所述历史特征图输入所述定位模型，以得到所述定位模型输出的该历史特征图对应的历史位置预测图，并将所述历史位置预测图作为该历史特征图对应的所述历史组织图像对应的历史定位结果，所述历史位置预测图用于表征对应的所述历史组织图像中组织腔体的位置。

[0162] 根据本公开的一个或多个实施例，示例4提供了示例3的方法，所述根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置，包括：将每个所述历史组织图像与所述组织图像的相似度，作为该历史组织图像对应的权重，对至少一个所述历史位置预测图与所述位置预测图进行融合，得到综合预测图；根据所述综合预测图确定所述组织图像中组织腔体的位置。

[0163] 根据本公开的一个或多个实施例，示例5提供了示例1至示例4的方法，所述特征提取模型和所述定位模型是通过以下方式联合训练得到的：获取样本输入集和样本输出集，所述样本输入集包括多个样本输入，每个所述样本输入包括样本组织图像和至少一个样本历史组织图像，所述样本输出集中包括与每个所述样本输入对应的样本输出，每个所述样本输出包括对应的所述样本组织图像中组织腔体的真实位置，以及对应得每个所述样本历史组织图像中组织腔体的真实位置，所述样本历史组织图像为所述内窥镜在采集所述样本组织图像之前采集的图像；将每个所述样本输入作为所述特征提取模型的输入，以得到所述特征提取模型输出的该样本输入中所述样本组织图像对应的样本特征图，以及该样本输入中每个所述样本历史组织图像对应的样本历史特征图；根据每个所述样本历史组织图像对应的样本历史特征图，与所述样本组织图像对应的样本特征图，确定该样本历史组织图像与所述样本组织图像的相似度；将所述样本组织图像对应的样本特征图，以及每个所述样本历史组织图像对应的样本历史特征图，输入所述定位模型，以根据所述定位模型的输出、每个所述样本历史组织图像与所述样本组织图像的相似度，与该样本输入对应的所述样本输出，联合训练所述特征提取模型和所述定位模型。

[0164] 根据本公开的一个或多个实施例，示例6提供了示例5的方法，所述将所述样本组织图像对应的样本特征图，以及每个所述样本历史组织图像对应的样本历史特征图，输入所述定位模型，以根据所述定位模型的输出、每个所述样本历史组织图像与所述样本组织图像的相似度，与该样本输入对应的所述样本输出，联合训练所述特征提取模型和所述定位模型，包括：根据所述定位模型输出的所述样本组织图像对应的样本位置预测图、每个所述样本历史组织图像对应的样本历史位置预测图，以及每个所述样本历史组织图像与所述样本组织图像的相似度，确定样本综合预测图；根据所述样本综合预测图和所述样本组织图像中组织腔体的真实位置，确定整体损失；根据每个所述样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失；根据所述整体损失和所述部分损失确定总损失，并以降低所述总损失为目标，利用反向传播算法训练所述特征提取模型和所述定位模型。

[0165] 根据本公开的一个或多个实施例，示例7提供了示例6的方法，所述根据所述样本综合预测图和所述样本组织图像中组织腔体的真实位置，确定整体损失，包括：根据所述样本组织图像中组织腔体的真实位置，确定标签图，所述标签图中每个像素点的值，与所述样本组织图像对应的像素点与所述样本组织图像中组织腔体的真实位置的距离负相关；根据所述样本综合预测图和所述标签图，确定所述整体损失；所述根据每个所述样本历史组织图像对应的样本历史位置预测图，和每个样本历史组织图像中组织腔体的真实位置，确定部分损失，包括：根据该样本历史组织图像中组织腔体的真实位置，确定历史标签图，所述历史标签图中每个像素点的值，与该样本历史组织图像对应的像素点与该样本历史组织图像中组织腔体的真实位置的距离负相关；根据该样本历史组织图像对应的样本历史位置预测图，和所述历史标签图，确定该样本历史组织图像对应的损失；将每个所述样本历史组织图像对应的损失的和，作为所述部分损失。

[0166] 根据本公开的一个或多个实施例，示例8提供了一种组织腔体的定位装置，包括：获取模块，用于获取当前时刻内窥镜采集的组织图像，以及当前时刻之前所述内窥镜采集的至少一个历史组织图像；提取模块，用于通过特征提取模型确定所述组织图像对应的特征图，以及每个所述历史组织图像对应的历史特征图，并确定每个所述历史组织图像与所述组织图像的相似度；定位模块，用于通过定位模型根据所述特征图对所述组织图像中组织腔体进行定位，得到定位结果，并根据每个所述历史组织图像对应的历史特征图对该历史组织图像中组织腔体进行定位，得到该历史组织图像对应的历史定位结果，所述特征提取模型和所述定位模型根据多个样本图像联合训练得到；处理模块，用于根据每个所述历史组织图像与所述组织图像的相似度、所述定位结果和至少一个所述历史定位结果，确定所述组织图像中组织腔体的位置。

[0167] 根据本公开的一个或多个实施例，示例9提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理装置执行时实现示例1至示例7中所述方法的步骤。

[0168] 根据本公开的一个或多个实施例，示例10提供了一种电子设备，包括：存储装置，其上存储有计算机程序；处理装置，用于执行所述存储装置中的所述计算机程序，以实现示例1至示例7中所述方法的步骤。

[0169] 以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的（但不限于）具有类似功能的技术特征进行互相替换而形成的技术方案。

[0170] 此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

[0171] 尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

组织腔体的定位方法、装置、可读介质和电子设备转让专利

申请号 : CN202210208932.X

文献号 : CN114332080B

文献日 : 2022-05-27

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 边成 , 李永会 , 杨延展

申请人 : 北京字节跳动网络技术有限公司

摘要 :

权利要求 :

说明书 :