一种基于深度学习的肋骨提取方法及装置转让专利

申请号 : CN201911243888.0

文献号 : CN111080592B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 钱东东刘守亮魏军

申请人 : 广州柏视医疗科技有限公司广州柏视数据科技有限公司

摘要 :

本发明实施例提供一种基于深度学习的肋骨提取方法,包括以下步骤:训练样本预处理;建立用于肋骨提取的第一深度卷积神经网络,通过训练样本对第一深度卷积神经网络进行训练;建立用于对第一深度卷积神经网络进行判别优化的第二深度卷积神经网络,对第一深度卷积神经网络进行优化;通过训练后的第一深度卷积神经网络,提取医学图像中的肋骨图像。本发明实施例一是采用样本增广的方式,提高了模型的训练效果;二是采用深度卷积神经网络,能够取得较高的识别率;三是在做特征融合时,同时考虑了边界的损失和区域的损失,更加有利于网络的收敛;四是在网络的训练部分,加大了模型对困难样本的关注,网络能更好的收敛。

权利要求 :

1.一种基于深度学习的肋骨提取方法,其特征在于:包括以下步骤:S1:训练样本预处理;

S2:建立用于肋骨提取的第一深度卷积神经网络,通过训练样本对第一深度卷积神经网络进行训练;

其中,所述第一深度卷积神经网络的损失函数为:其中,y′为医学图像中每个像素点输出的概率值,y为对应的像素点在预先标记出的医学图像上的标签(取值为1或0),α、γ的取值分别为0.25、2,m为预处理样本的特征图经隔行

2倍、4倍、8倍采样得到的医学图像m1、m2、m3,e为步骤S2中得到的医学图像特征图e1,f为经过第一深度神经网络处理最终输出的特征图和概率图;ω(m,e)的取值为:当y属于m1点时,ω(m,e)=0.8,当y属于m2点时,ω(m,e)=0.6,当y属于m3点时,ω(m,e)=0.5,当y属于e1点时,ω(m,e)=1.0;

S3:建立用于对第一深度卷积神经网络进行判别优化的第二深度卷积神经网络;通过训练样本及第一深度卷积神经网络对训练样本的输出结果,对第一深度卷积神经网络进行优化;

其中,所述第二深度卷积神经网络的损失函数的设计方法为:将训练样本预处理输入第一深度卷积神经网络,输出的每个像素点的标签为True,基于交叉熵的方法计算损失函数;将第一深度卷积神经网络输出的肋骨概率图输入第二深度卷积神经网络,输出的每个像素点的标签为False,基于交叉熵的方法计算损失函数;

S4:通过训练后的第一深度卷积神经网络,提取医学图像中的肋骨图像。

2.根据权利要求1所述的基于深度学习的肋骨提取方法,其特征在于:所述步骤S1中训练样本预处理的方法包括:

S11:对预先标记出肋骨区域的医学图像样本,执行旋转、水平翻转、垂直翻转和/或弹性形变处理,实现样本增广;

S12:计算步骤S11获得的医学图像的水平梯度和垂直梯度图像;

S13:将医学图像灰度值及步骤S12获得的水平梯度、垂直梯度附加到医学图像数据中,得到预处理后的训练样本。

3.根据权利要求2所述的基于深度学习的肋骨提取方法,其特征在于:所述步骤S2中对第一深度卷积神经网络进行训练时,对同一个batch的输入,把困难样本单独提取出来,重复进行训练;

其中,所述困难样本是指一次训练结束后损失最大的若干个输入数据。

4.一种基于深度学习的肋骨提取装置,其特征在于:基于权利要求1‑3中任一权利要求所述方法,包括:

医学图像预处理模块,用于对训练样本进行预处理;

肋骨提取模块,采用第一深度卷积神经网络结构,用于获得医学图像中每个像素点是否属于肋骨的概率;

其中,所述肋骨提取模块采用的第一深度卷积神经网络的损失函数为:其中,y′为医学图像中每个像素点输出的概率值,y为对应的像素点在预先标记出的医学图像上的标签(取值为1或0),α、γ的取值分别为0.25、2,m为预处理样本的特征图经隔行

2倍、4倍、8倍采样得到的医学图像m1、m2、m3,e为步骤S2中得到的医学图像特征图e1,f为经过第一深度神经网络处理最终输出的特征图和概率图;ω(m,e)的取值为:当y属于m1点时,ω(m,e)=0.8,当y属于m2点时,ω(m,e)=0.6,当y属于m3点时,ω(m,e)=0.5,当y属于e1点时,ω(m,e)=1.0;

判别优化模块,采用第二深度卷积神经网络结构,用于对肋骨提取模块采用的第一深度卷积神经网络进行优化;

其中,所述判别优化模块采用的第二深度卷积神经网络的损失函数的设计方法为:将训练样本预处理输入第一深度卷积神经网络,网络输出的每个像素点的标签为True,基于交叉熵的方法计算损失函数;

将提取出的肋骨概率图输入第二深度卷积神经网络,网络输出的每个像素点的标签为False,基于交叉熵的方法计算损失函数。

5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述方法的步骤。

6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至3任一项所述方法的步骤。

说明书 :

一种基于深度学习的肋骨提取方法及装置

技术领域

[0001] 本发明属于医学图像处理技术领域,尤其涉及一种基于深度学习的肋骨提取方法及装置。

背景技术

[0002] 医学图像分析是医生在诊断肺部疾病时普遍采用的方法。实际工作中,一方面,肋骨往往会对部分肺部组织形成遮挡,从而影响了医生对疾病的准确诊断。为了克服这一问
题,可以预先将医学图像中的肋骨分离出来,从而将肋骨从医学图像中去掉,从而形成一张
仅显示肺部组织结构的医学图像,减少肋骨对疾病诊断带来的不良影响。另一方面,提取出
的肋骨图像,可为分析肋骨解剖结构、诊断各种相关疾病提供基础。然而,现有的肋骨提取
工作通常采用人工标记的方法,该方法一是主要占用医生的大量时间,二是标记的肋骨区
域精度较低,一旦标注错误,难以及时发现并纠正。

发明内容

[0003] 针对现有技术存在的问题,本发明实施例提供一种基于深度学习的肋骨提取方法及装置。
[0004] 第一方面,本发明实施例提供一种基于深度学习的肋骨提取方法,包括以下步骤:
[0005] S1:训练样本预处理;
[0006] S2:建立用于肋骨提取的第一深度卷积神经网络,通过训练样本对第一深度卷积神经网络进行训练;
[0007] S3:建立用于对第一深度卷积神经网络进行判别优化的第二深度卷积神经网络;通过训练样本及第一深度卷积神经网络对训练样本的输出结果,对第一深度卷积神经网络
进行优化;
[0008] S4:通过训练后的第一深度卷积神经网络,提取医学图像中的肋骨图像。
[0009] 进一步的,所述步骤S1中训练样本预处理的方法包括:
[0010] S11:对预先标记出肋骨区域的医学图像样本,执行旋转、水平翻转、垂直翻转和/或弹性形变处理,实现样本增广;
[0011] S12:计算步骤S11获得的医学图像的水平梯度和垂直梯度图像;
[0012] S13:将医学图像灰度值及步骤S12获得的水平梯度、垂直梯度附加到医学图像数据中,得到预处理后的训练样本。
[0013] 进一步的,所述第一深度卷积神经网络的损失函数为:
[0014]
[0015] 其中,y′为医学图像中每个像素点输出的概率值,y为对应的像素点在预先标记出的医学图像上的标签(取值为1或0),α、λ的取值分别为0.25、2,m为预处理样本的特征图经
隔行2倍、4倍、8倍采样得到的医学图像m1、m2、m3,e为步骤S2中得到的医学图像特征图e1,f
为经过第一深度神经网络处理最终输出的特征图和概率图;ω(m,e)的取值为:当y属于m1
点时,ω(m,e)=0.8,当y属于m2点时,ω(m,e)=0.6,当y属于m3点时,ω(m,e)=0.5,当y属
于e1点时,ω(m,e)=1.0。
[0016] 进一步的,所述第二深度卷积神经网络的损失函数的设计方法为:
[0017] 将训练样本预处理输入第一深度卷积神经网络,输出的每个像素点的标签为True,基于交叉熵的方法计算损失函数;
[0018] 将第一深度卷积神经网络输出的肋骨概率图输入第二深度卷积神经网络,输出的每个像素点的标签为False,基于交叉熵的方法计算损失函数。
[0019] 进一步的,所述步骤S2中对第一深度卷积神经网络进行训练时,对同一个batch的输入,把困难样本单独提取出来,重复进行训练。
[0020] 第二方面,本发明实施例提供一种基于深度学习的肋骨提取装置,所述基于深度学习的肋骨提取装置基于第一方面所述方法运行,包括:
[0021] 医学图像预处理模块,用于对训练样本进行预处理;
[0022] 肋骨提取模块,采用第一深度卷积神经网络结构,用于获得医学图像中每个像素点是否属于肋骨的概率;
[0023] 判别优化模块,采用第一深度卷积神经网络结构,用于对肋骨提取模块采用的第一深度卷积神经网络进行优化。
[0024] 进一步的,所述肋骨提取模块采用的第一深度卷积神经网络的损失函数为:
[0025]
[0026] 其中,y′为医学图像中每个像素点输出的概率值,y为对应的像素点在预先标记出的医学图像上的标签(取值为1或0),α、λ的取值分别为0.25、2,m为预处理样本的特征图经
隔行2倍、4倍、8倍采样得到的医学图像m1、m2、m3,e为步骤S2中得到的医学图像特征图e1,f
为经过第一深度神经网络处理最终输出的特征图和概率图;ω(m,e)的取值为:当y属于m1
点时,ω(m,e)=0.8,当y属于m2点时,ω(m,e)=0.6,当y属于m3点时,ω(m,e)=0.5,当y属
于e1点时,ω(m,e)=1.0。
[0027] 进一步的,所述判别优化模块采用的第二深度卷积神经网络的损失函数的设计方法为:
[0028] 将训练样本预处理输入第一深度卷积神经网络,网络输出的每个像素点的标签为True,基于交叉熵的方法计算损失函数;
[0029] 将提取出的肋骨概率图输入第二深度卷积神经网络,网络输出的每个像素点的标签为False,基于交叉熵的方法计算损失函数。
[0030] 第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供
的方法的步骤。
[0031] 第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
[0032] 本发明实施例提供的一种基于深度学习的肋骨提取方法及装置,一是针对人工标定医学图像耗时费力的问题,采用样本增广的方式,提高了模型的训练效果;二是采用深度
卷积神经网络,针对医学图像的肋骨和背景的差异较小的问题,能够取得较高的识别率;三
是在做特征融合时,同时考虑了相邻两个尺度的特征层的影响,即损失函数的设计在同一
个尺度上同时考虑了边界的损失和区域的损失,同时在不同的尺度上设计损失函数,更加
有利于网络的收敛;四是在网络的训练部分,对同一个batch的输入,把困难样本单独提取
出来,做二次训练,加大了模型对困难样本的关注,网络能更好的收敛,得到更好的效果。

附图说明

[0033] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发
明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根
据这些附图获得其他的附图。
[0034] 图1为本发明实施例提供的一种基于深度学习的肋骨提取方法的整体流程示意图;
[0035] 图2为本发明实施例提供的一种基于深度学习的肋骨提取方法与装置的残差模块示意图结构示意图;
[0036] 图3为本发明实施例提供的一种注意力网络的整体结构示意图;
[0037] 图4为本发明实施例提供的一种肋骨提取模块整体结构示意图;
[0038] 图5为本发明实施例提供的一种判别优化模块整体结构示意图;
[0039] 图6为本发明实施例提供的一种肋骨提取的实际效果图;
[0040] 图7为本发明实施例提供的一种电子设备的实体结构示意图。

具体实施方式

[0041] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是
本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员
在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0042] 图1为本发明实施例提供的一种基于深度学习的肋骨提取方法整体流程示意图,如图1所示述,该方法包括以下步骤:
[0043] S1:训练样本预处理;
[0044] S2:建立用于肋骨提取的第一深度卷积神经网络,通过训练样本对第一深度卷积神经网络进行训练;
[0045] S3:建立用于对第一深度卷积神经网络进行判别优化的第二深度卷积神经网络;通过训练样本及第一深度卷积神经网络对训练样本的输出结果,对第一深度卷积神经网络
进行优化;
[0046] S4:通过训练后的第一深度卷积神经网络,提取医学图像中的肋骨图像。
[0047] 具体地,将本发明实施例提供的方法应用于一种基于深度学习的肋骨提取装置,从而实现医学图像中的肋骨图像的自动化提取。所述基于深度学习的肋骨提取装置包括:
[0048] 医学图像预处理模块,用于对训练样本进行预处理;
[0049] 肋骨提取模块,采用第一深度卷积神经网络结构,用于获得医学图像中每个像素点是否属于肋骨的概率;
[0050] 判别优化模块,采用第一深度卷积神经网络结构,用于对肋骨提取模块采用的第一深度卷积神经网络进行优化。
[0051] 以下对基于深度学习的肋骨提取的方法及装置进行详细介绍。
[0052] 所述医学图像预处理模块,用于接收训练样本,对训练样本进行增广、归一化等预处理,并将结果输出至后端的肋骨提取模块和判别优化模块。具体的,所述医学图像预处理
模块的工作过程如下:
[0053] S11:对预先标记出肋骨区域的医学图像样本,执行旋转、水平翻转、垂直翻转和/或弹性形变处理,实现样本增广。对于预先标记出肋骨区域的医学图像样本,采用逐像素进
行标记的方式,例如将肋骨区域标记为1,其他区域标记为0。可采用随机的方式选择不同的
样本进行不同的上述处理;对于旋转操作,可限定在‑30°至﹢30°的范围内进行随机旋转,从
而获得不同角度的医学图像样本;从而实现样本数据增广。优选的,对处理后的医学图像执
行直方图归一化操作。为平衡输出分辨率和处理速度,可将增广后的图像缩放为统一尺寸,
例如512x512像素。
[0054] S12:计算步骤S11获得的医学图像的水平梯度和垂直梯度图像;
[0055] S13:将医学图像灰度值(归一化到[0,1]区间)及步骤S12获得的水平梯度、垂直梯度附加到医学图像数据中,得到预处理后512x512x3的训练样本。
[0056] 本发明实施例中建立了两个深度卷积网络模型,分别应用在肋骨提取模块和判别优化模块。所述肋骨提取模块,用于获得医学图像中每个像素点是否属于肋骨的概率;所述
判别优化模块,用于对肋骨提取模块采用的第一深度卷积神经网络进行优化。下面分别对
这两个模块进行介绍.
[0057] 所述肋骨提取模块的一个具体的处理过程如下:
[0058] 1:将预处理得到的512x512x3的特征图m,执行膨胀卷积模块操作,得到一个512x512x64的特征图,该特征图记录为e1。具体的,所述膨胀卷积模块操作方法为:对特征
图执行kernel为3x3,stride为1,膨胀系数为2,padding为2的膨胀卷积,然后执行BN和
ReLU。
[0059] 2:将e1执行残差模块1,得到一个256x256x256的特征图e2。将m隔行采样,得到一个256x256x3的特征图m1,将m1和e2依通道连接得到一个256x256x259的特征图。对该特征
图执行1x1x256x1的卷积模块操作,得到一个256x256x256的特征图,将该特征图更新为e2。
所述残差模块的结构如图2所示。
[0060] 3:将e2执行残差模块2,得到一个128x128x512的特征图,将该特征图记录为e3。将m1隔行采样得到m2,将m2和e3依通道连接,得到一个128x128x515的特征图。对该特征图执
行1x1x512x1的操作,得到一个128x128x512的特征图,将该特征图更新为e3。将e3执行
kernel为2,步长为2,输出通道为256的反卷积操作,得到一个128x128x256的特征图。将该
特征图与e2依通道进行连接,得到一个256x256x512的特征图。对该特征图执行1x1x256x1
的卷积模块操作,得到一个256x256x256的特征图,将该特征图更新为e2。
[0061] 4:将e3执行残差模块3,得到一个64x64x1024的特征图,该特征图记录为e4,将m2隔行采样得到m3,将m3和e4依通道连接得到一个64x64x1027的特征图,对该特征图执行
1x1x1024x1的操作,得到一个64x64x1024的特征图,并将该特征图更新为e4。将e4执行
kernel为2,步长为2,输出通道为512的反卷积操作,得到一个128x128x512的特征图,将该
特征图与e3依通道进行连接,得到一个128x128x1024的特征图,对该特征图执行1x1x512x1
的卷积模块操作,得到一个128x128x512的特征图,将该特征图更新为e3。
[0062] 5:将e4执行残差模块4,得到一个32x32x2048的特征图,该特征图记录为e5。将m3隔行采样得到m4,将m4和e5依通道连接,得到32x32x2051的特征图,对该特征图执行
1x1x2048x1的操作,得到32x32x2048的特征图,并将该特征图更新为e5。将e5执行kernel为
2,步长为2,输出通道为1024的反卷积操作,得到一个64x64x1024的特征图,将该特征图与
e4依通道进行连接,得到一个128x128x2048的特征图,对该特征图执行1x1x1024x1的卷积
模块操作,得到一个128x128x1024的特征图,将该特征图更新为e4。
[0063] 6:将e5执行3x3x2048x1的卷积模块操作,得到一个32x32x2048的特征图d5。
[0064] 7:将d5执行kernel为2,步长为2,输出通道为1024的反卷积得到64x64x1024的特征图d4。
[0065] 8:以e4和d4为参数利用注意力网络,得到一个64x64x1024特征图,将e4更新为该特征图。e4与d4依通道方向上进行连接得到64x64x2048的特征图,执行3x3x1024x1的卷积
模块操作,得到64x64x1024的特征图,将d4更新为这个特征图。
[0066] 所述注意力网络的结构如图3所示,包括:
[0067] (1)e执行一个We的运算(首先执行一个3x3xcex1(ce为e的通道数)的卷积操作,而后经过一个BN操作)得到特征图e1,d执行一个Wd的运算(首先执行一个3x3xcd(cd为d的通
道数),然后执行一个BN的操作)得到特征图d1,将e1和d1依通道相加,得到新的特征图,以
该特征图更新e1。
[0068] (2)将e1执行一个ReLU和1x1x1x1的卷积操作,然后执行BN,最后经过一个Sigmoid输出,以该概率图输出更新e1。
[0069] (3)将e1依通道和e中的每个通道的特征相乘,得到的特征图和e依通道相加,得到新的特征图,以该特征图更新e。
[0070] 9:将d4执行kernel为2,步长为2,输出通道为512的反卷积得到64x64x512的特征图。将该特征图记录为d3。
[0071] 10:以e3和d3为参数,利用注意力网络,得到一个64x64x512的特征图,将e3更新为该特征图,将e3和d3依通道连接,得到64x64x1024的特征图,然后对该特征图模块执行
3x3x512x1的卷积模块操作,得到一个64x64x512的特征图,将d3更新为该特征图。
[0072] 11:将d3执行kernel为2,步长为2,输出通道为256的反卷积操作,得到一个256x256x256的特征图,将该特征图记录为d2。
[0073] 12:以e2和d2为参数,利用注意力网络,得到一个256x256x256的特征图,将e2更新为该特征图,将e3和d3依通道连接,得到256x256x512的特征图,对该特征图执行3x3x256x1
的卷积模块操作,得到一个256x256x256的特征图,将d2更新为该特征图。
[0074] 13:将d2执行kernel为2,步长为2,输出通道为128的反卷积操作,得到一个512x512x128的特征图,将该特征图记录为d1。
[0075] 14:将e1执行3x3x128的膨胀卷积模块操作,得到一个512x512x128的特征图,将e1更新为该特征图。以e1和d1为参数,利用注意力网络,得到一个512x512x128的特征图,将e1
更新为该特征图。将e1和d1依通道连接,得到512x512x256的特征图,对该通道执行
3x3x256x1的卷积模块操作,得到一个512x512x128的特征图,将d1更新为该特征图。
[0076] 15:将d3执行操作T3得到一个128x128x1的特征图f3;将d2执行操作T2,得到一个256x256x1的概率图f2;将d1并行执行执行操作T1,分别得到两个512x512x1的概率图像f1,
fe。
[0077] 上述肋骨提取模型的结构如图3所示。
[0078] 所述判别优化模块的作用在于,对肋骨提取模块采用的第一深度卷积神经网络进行优化训练,从而使得肋骨提取模块输出的结果与输入的精标图像(预先标记出肋骨区域
的医学图像样本)的肋骨区域尽量一致、肋骨边缘更加平滑,从而获得更好地识别效果。具
体的,所述判别优化模块的一个具体的处理过程如下:
[0079] 1:对输入为512x152x1的医学图像(肋骨的生成概率图或肋骨的精标图像)m执行3x3x32x1的卷积模块操作,得到512x512x32的特征图e1。
[0080] 2:对e1执行3x3x64x2的卷积模块操作,得到256x256x64的特征图e2。
[0081] 3:对e2执行1x1x32x1,3x3x32x2,1x1x128x1的卷积模块操作,得到128x128x128的特征图e3。
[0082] 4:对e3执行1x1x64x1,3x3x64x2,1x1x256x1的卷积模块操作,得到64x64x256的特征图e4。
[0083] 5:对e4执行1x1x128x1,3x3x128x2,1x1x512x1的卷积模块操作,得到32x32x512的特征图e5。
[0084] 6:对e5执行kernel为2,步长为2,输出通道为256的反卷积得到64x64x256的特征图d4,d4与e4依通道方向上进行连接,得到64x64x512的特征图,对该特征图执行3x3x256x2
的卷积模块操作得到64x64x256的特征图,将该特征图更新为d4。
[0085] 7:对d4执行kernel为2,步长为2,输出通道为128的反卷积得到128x128x128的特征图d3,将d3与e3依通道方向上进行连接,得到128x128x256的特征图,然后执行3x3x128x1
的卷积模块操作得到128x128x128的特征图,将该特征图更新为d3。
[0086] 8:对d3执行kernel为2,步长为2,输出通道为64的反卷积得到256x256x64的特征图d2,将d2与e2依通道方向上进行连接,得到256x256x128的特征图,然后执行3x3x64x1的
卷积模块操作得到256x256x64的特征图,将该特征图更新为d2。
[0087] 9:对d2执行kernel为2,步长为2,输出通道为32的反卷积得到512x512x32的特征图,该特征图与e1依通道方向上进行连接,得到512x512x64的特征图,然后执行1x1x1x1的
卷积模块操作得到512x512x1的特征图,经过经过一个Sigmoid函数输出,得到一个512x512
的概率图f。
[0088] 所述判别优化模块的整体结构如图示5所示。
[0089] 以下给出肋骨提取模块损失函数设计的具体方式。所述肋骨提取模块损失函数,包括基于边界的损失函数和区域的损失函数,具体方法如下:
[0090] 1:将肋骨的精标准放缩到和f1,f2,f3相同的尺寸大小,分别得到肋骨的模板图像m1,m2,m3。对m1提取肋骨的边界得到肋骨的边界图e1将这四个图二值化。
[0091] 2:损失函数采用交叉熵的Focal Loss函数,具体为:
[0092]
[0093] 其中,y′为医学图像中每个像素点输出的概率值,y为对应的像素点在预先标记出的医学图像上的标签(取值为1或0),α、λ的取值分别为0.25、2,m为m1、m2、m3,即预处理样本
的特征图经隔行2倍、4倍、8倍采样得到的医学图像,e为e1,即肋骨提取模块步骤1中得到的
512x512x64特征图;f为经过第一深度神经网络处理最终输出的特征图和概率图f1、f2、f3、
fe,即取肋骨提取模块步骤15中得到的特征图和概率图。
[0094] ω(m,e)的取值为:当y属于m1点时,ω(m,e)=0.8,当y属于m2点时,ω(m,e)=0.6,当y属于m3点时,ω(m,e)=0.5,当y属于e1点时,ω(m,e)=1.0。这样取值是为了让网
络更加关注于边界(往往是肋骨的边界比较难分),同时f1作为最终我们需要的输出,给的
权重大一点。
[0095] 以下给出判别优化模块损失函数设计的具体方式,具体方法如下:
[0096] (1)将训练样本预处理输入第一深度卷积神经网络,输出的每个像素点的标签为True,基于交叉熵的方法计算损失函数;
[0097] (2)将第一深度卷积神经网络输出的肋骨概率图输入第二深度卷积神经网络,输出的每个像素点的标签为False,基于交叉熵的方法计算损失函数。
[0098] 以下给出训练过程的一种具体实施方式:
[0099] (1)首先训练肋骨提取的网络N轮(在本实施例中N设定为10),肋骨提取网络和判别优化网络分别计算损失函数,只更新肋骨提取模块的参数。
[0100] (2)固定训练肋骨提取模块的模型权重,只训练判别网络N/2次,只更新判别优化模块中的模型权重。
[0101] 以下给出肋骨提取模块训练的一种具体实施方式:
[0102] (1)batch选择50,首先基于该batch计算损失函数,对网络权重参数更新。同时记录下batch中的每一个的损失,选取损失最大的30个输入数据。
[0103] (2)将这30个输入数据输入网络,对网络的权重进行更新。
[0104] (3)交替训练1,2直到1和2中的loss都收敛到比较小的水平。
[0105] 如图6所示,是采用上述基于深度学习的肋骨提取方法及装置,进行肋骨提取的一个实际效果图。
[0106] 图7为本发明实施例提供的一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)701、通信接口(Communications Interface)702、存储
器(memory)703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线
704完成相互间的通信。处理器701可以调用存储在存储器703上并可在处理器701上运行的
计算机程序,以执行上述各实施例提供的方法,例如包括:训练样本预处理;建立用于肋骨
提取的第一深度卷积神经网络,通过训练样本对第一深度卷积神经网络进行训练;建立用
于对第一深度卷积神经网络进行判别优化的第二深度卷积神经网络;通过训练样本及第一
深度卷积神经网络对训练样本的输出结果,对第一深度卷积神经网络进行优化;通过训练
后的第一深度卷积神经网络,提取医学图像中的肋骨图像。
[0107] 此外,上述的存储器703中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本
发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分
可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指
令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各
个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器
(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘
等各种可以存储程序代码的介质。
[0108] 本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:训练样本
预处理;建立用于肋骨提取的第一深度卷积神经网络,通过训练样本对第一深度卷积神经
网络进行训练;建立用于对第一深度卷积神经网络进行判别优化的第二深度卷积神经网
络;通过训练样本及第一深度卷积神经网络对训练样本的输出结果,对第一深度卷积神经
网络进行优化;通过训练后的第一深度卷积神经网络,提取医学图像中的肋骨图像。
[0109] 以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单
元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其
中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性
的劳动的情况下,即可以理解并实施。
[0110] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上
述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该
计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指
令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施
例或者实施例的某些部分所述的方法。
[0111] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可
以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;
而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和
范围。