基于AE的低倍镜分裂相筛图方法、系统及存储介质转让专利

申请号 : CN202211439142.9

文献号 : CN115496761B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 蔡昱峰张金超卢沁阳刘丽珏穆阳彭伟雄

申请人 : 湖南自兴智慧医疗科技有限公司

摘要 :

本发明公开了一种基于AE的低倍镜分裂相筛图方法、系统及存储介质,用于提高低倍镜下分裂相识别的准确率,本发明涉及医学图像处理技术领域;包括:用人工划分好的K类低倍镜分裂相图像和该图像的类别对搭建的染色体分裂相图类别网格进行训练,得到类别自动编码模型;用K类低倍镜分裂相图像边缘填充成为一个正方形,并且改变图像大小到128*128像素的尺寸,输入到类别自动编码模型的编码器分支,经过编码层得到特征向量Vn,之后存储特征向量,构建特征向量底库S;依次使用类别自动编码模型和特征向量底库S对染色体分裂相图像进行筛选;本发明简单高效,能够有效筛选出质量优质的低倍镜分裂相图。

权利要求 :

1.一种基于AE的低倍镜分裂相筛图方法,其特征在于,包括如下步骤:

S1、用人工划分好的K类低倍镜分裂相图像和该图像的类别对搭建的染色体分裂相图类别网格进行训练,得到类别自动编码模型;其中,K代表类别数量;

S2、用步骤S1划分好的K类低倍镜分裂相图像边缘填充成为一个正方形,并且改变图像大小到128*128像素的尺寸,输入到类别自动编码模型的编码器分支,经过编码层得到特征向量Vn,之后存储特征向量,构建特征向量底库S;

S3、依次使用类别自动编码模型和特征向量底库S对染色体分裂相图像进行筛选;

步骤S2所述构建特征向量底库S的具体步骤如下:

S2.1、将类别自动编码模型中的编码器分支取出;

S2.2、将步骤S1中预先划分好的K类各100张低倍镜分裂相图总共K*100张,将图像边缘填充成为一个正方形并且改变图像大小到128*128像素的尺寸;

S2.3、将步骤S2.2处理好的图像作为样本输入网络的编码器分支,经过编码层得到特征向量Vn;

S2.4、叠加存储步骤S2.3得到的K*100个特征向量,作为特征向量底库S;其中,S维度为K * 100 * 512,K代表类别数量,100代表每个类别的标签样本数量,512代表每个样本提取出来的特征向量的维度。

2.根据权利要求1所述的一种基于AE的低倍镜分裂相筛图方法,其特征在于,步骤S1所述K类低倍镜分裂相图像的类别有杂质、分散好、分散差、条带清晰、条带不清晰,每个类别预先选取数量为100张分裂相图进行训练。

3.根据权利要求1所述的一种基于AE的低倍镜分裂相筛图方法,其特征在于,步骤S1所述类别自动编码模型包括编码器编码层、解码器解码层和特征向量,编码器编码层通过分裂相图的提取特征,输出维度为512的特征向量。

4.根据权利要求3所述的一种基于AE的低倍镜分裂相筛图方法,其特征在于,步骤S1所述类别自动编码模型的训练步骤为:将一张低倍镜图像,首先按照图像长边的长度,将图像填充为正方形,之后改变图像大小到统一的128*128像素尺寸,作为网络训练的输入,进行模型的训练。

5.根据权利要求1所述的一种基于AE的低倍镜分裂相筛图方法,其特征在于, 步骤3所述筛选的具体步骤如下:S3.1、获取一张低倍镜分裂相图,将这张图片按照长边长度填充成为正方形,之后改变图像大小到128*128像素;

S3.2、步骤S3.1处理好的图像输入至编码器中,得到一个特征向量V;

S3.3、将V与预先存储了K*100个特征向量的特征底库S进行相似度计算,最终得到一个相似度矩阵Vt,Vt的尺度为K*100,Vt的每个元素表示当前特征向量与底库样本的相似度值,取值范围[0‑1],接着按照类别K的维度求和,将每个类别的100个相似度值加起来,得到最终的类被评分Vc,其中Vc的维度为K*1,即相似度值越大,代表样本越接近,筛选出类别为分散好、条带清晰数值最大的图像。

6.一种基于AE的低倍镜分裂相筛图系统,其特征在于,包括:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1‑5中任一项所述的一种基于AE的低倍镜分裂相筛图方法。

7.一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于执行如权利要求1‑5中任一项所述的一种基于AE的低倍镜分裂相筛图方法。

说明书 :

基于AE的低倍镜分裂相筛图方法、系统及存储介质

技术领域

[0001] 一种基于AE的低倍镜分裂相筛图方法、系统及存储介质,用于提高低倍镜下分裂相识别的准确率,本发明涉及分子诊断学技术领域。

背景技术

[0002] 人类染色体的分析与识别是细胞遗传学研究的重要课题。如今已成为临床检验工作中一个重要组成部分,它使很多遗传性疾病得到明确诊断,具有重要的临床价值。染色体核型分析流程通常是先通过低倍镜进行全片扫描,找出合适的分裂相进行高倍镜扫描再进行分析。低倍镜扫描的染色体分裂相图像中,分裂相的染色体面积小且聚集在一起,判断会存在一定的失误,如果找错了,通过高倍镜扫描的图片则为无效图片。其次,低倍镜下扫描的图像中,并不是所有的分裂相都适用于染色体核型分析,由于很难确定分裂相中染色体数量与结构,选取的分裂相高倍镜扫描后可能并不适用于染色体分析。
[0003] 传统的低倍镜图像质量筛选技术主要有以下方法,主要是在常规低倍镜图像中,首先训练一个判断低倍镜是否为杂质的模型。接着训练一个判断低倍镜分裂相图属于什么质量等级的分类模型。由于低倍镜分裂相图分辨率不高,直接使用分类模型强行分类,准确率并不高,并且这类方法需要大量的图像作为训练集,以及需要多个神经网络模型配合使用,从而导致低倍镜筛选过程会出现资源消耗大,预先准备训练集过于繁琐。因此,需研发一种简化有效的低倍镜图像筛选方法。

发明内容

[0004] 本发明的目的在于:为了解决现有低倍镜图像分类准确率不高,从而会影响到染色体核型分析,因此本发明提出一种基于AE的低倍镜分裂相筛图方法,能够简单高效的筛选出质量优质的低倍镜分裂相图。
[0005] 本发明采用的技术方案如下:一种基于AE的低倍镜分裂相筛图方法,包括如下步骤:
[0006] S1、用人工划分好的K类低倍镜分裂相图像和该图像的类别对搭建的染色体分裂相图类别网格进行训练,得到类别自动编码模型;其中,K代表类别数量;
[0007] S2、用步骤S1划分好的K类低倍镜分裂相图像边缘填充成为一个正方形,并且改变图像大小到128*128像素的尺寸,输入到类别自动编码模型的编码器分支,经过编码层得到特征向量Vn,之后存储特征向量,构建特征向量底库S;
[0008] S3、依次使用类别自动编码模型和特征向量底库S对染色体分裂相图像进行筛选。
[0009] 步骤S1所述K类低倍镜分裂相图像的类别有杂质、分散好、分散差、条带清晰、条带不清晰,每个类别预先选取数量为100张分裂相图进行训练。
[0010] 步骤S1所述类别自动编码模型包括编码器编码层、解码器解码层和特征向量,编码器编码层通过分裂相图的提取特征,输出维度为512的特征向量。
[0011] 步骤S1所述类别自动编码模型的训练步骤为:将一张低倍镜图像,首先按照图像长边的长度,将图像填充为正方形,之后改变图像大小到统一的128*128像素尺寸,作为网络训练的输入,进行模型的训练。
[0012] 步骤S2所述构建特征向量底库S的具体步骤如下:
[0013] S2.1、将类别自动编码模型中的编码器分支取出;
[0014] S2.2、将步骤S1中预先划分好的K类各100张低倍镜分裂相图总共K*100张,将图像边缘填充成为一个正方形并且改变图像大小到128*128像素的尺寸;
[0015] S2.3、将步骤S2.2处理好的图像作为样本输入网络的编码器分支,经过编码层得到特征向量Vn;
[0016] S2.4、叠加存储步骤S2.3得到的K*100个特征向量,作为特征向量底库S;其中,S维度为K * 100 * 512,K代表类别数量,100代表每个类别的标签样本数量,512代表每个样本提取出来的特征向量的维度。
[0017] 步骤3所述筛选的具体步骤如下:
[0018] S3.1、获取一张低倍镜分裂相图,将这张图片按照长边长度填充成为正方形,之后改变图像大小到128*128像素;
[0019] S3.2、步骤S3.1处理好的图像输入至编码器中,得到一个特征向量V;
[0020] S3.3、将V与预先存储了K*100个特征向量的特征底库S进行相似度计算,最终得到一个相似度矩阵Vt,Vt的尺度为K*100,Vt的每个元素表示当前特征向量与底库样本的相似度值,取值范围[0‑1],接着按照类别K的维度求和,将每个类别的100个相似度值加起来,得到最终的类被评分Vc,其中Vc的维度为K*1,即相似度值越大,代表样本越接近,筛选出类别为分散好、条带清晰数值最大的图像。
[0021] 一种基于AE的低倍镜分裂相筛图系统,包括:
[0022] 至少一个处理器;
[0023] 至少一个存储器,用于存储至少一个程序;
[0024] 当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述所述的一种基于AE的低倍镜分裂相筛图方法。
[0025] 一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行上述所述的一种基于AE的低倍镜分裂相筛图方法。
[0026] 综上所述,由于采用了上述技术方案,本发明的有益效果是:
[0027] 本发明采用一种特征匹配的低倍镜分裂相图的类别划分方法,放弃传统神经网络模型强行分类的方法,提出更符合客观分布,模拟空间聚类的方法。避免了传统神经网络分类模型的训练数据大,容易过拟合,计算资源消耗大的问题,只需要一个特征编码器,就可以完成更符合客观分配的类别划分,此方法简单高效,能够有效筛选出质量优质的低倍镜分裂相图。

附图说明

[0028] 本发明将通过例子并参照附图的方式说明,其中:
[0029] 图1是本发明工作流程框图;
[0030] 图2是本发明类别自动编码模型框图;
[0031] 图3是本发明类别为杂质的例图;
[0032] 图4是本发明类别为分散好的例图;
[0033] 图5是本发明类别为分散差的例图;
[0034] 图6是本发明通过填充并且改变大小到128*128像素的图像;
[0035] 图7是本发明特征向量底库S矩阵图。

具体实施方式

[0036] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和出示的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0037] 因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0038] 实施例1
[0039] 如图1‑7所示,本方法采用神经网络的技术,训练一个自动编码器(AE),用于提取低倍镜分裂相图的特征向量。之后将特征向量与预先存储的特征向量进行比对,得到相似度矩阵。最终根据相似度矩阵确定低倍镜图像类别。具体实现步骤如下:
[0040] A.首先通过人工划分K类低倍镜分裂相类型,如杂质、分散好、分散差、条带清晰、条带不清晰等等,每个类别预先选取数量约为100张分裂相图,尽量均匀分布防止过拟合;
[0041] B. 训练一个类别自动编码模型,这里类别自动编码模型使用常用结构,一部分编码器编码层,一部分解码器解码层,目的是为了获取编码层输出的特征向量,维度为512;用于分裂相图的提取特征。将一张低倍镜图像,首先按照图像长边的长度,将图像填充为正方形,之后改变大小到统一的128*128像素尺寸。作为网络训练的输入,进行模型的训练;
[0042] C. 训练好类别自动编码模型后,将编码器分支取出,将A步骤中预先划分好的K类各100张低倍镜分裂相图总共K*100张,将图像边缘填充成为一个正方形并且改变大小到128*128像素的尺寸,输入网络的编码器分支,经过编码层得到特征向量Vn,之后存储这K*
100个特征向量,作为特征向量底库S。S维度为K * 100 * 512,其中,K代表类别数量,100代表每个类别的标签样本数量,512代表每个样本提取出来的特征向量的维度;
[0043] D. 在特征向量底库S搭建完成后,获取一张低倍镜分裂相图,将这张图片按照长边长度填充成为正方形,之后改变大小到128*128像素,之后将这处理好的图像输入至编码器中,得到一个特征向量V,将V与预先存储了K*100个特征向量的特征向量底库S进行相似度计算,这里可以使用余弦相似度或者其他方法。最终得到一个相似度矩阵Vt,Vt的尺度为K*100。Vt的每个元素表示当前特征向量与特征向量底库样本的相似度值,取值范围[0‑1]。即相似度值越大,代表样本越接近;
[0044] E. 得到相似度矩阵Vt后,相似度矩阵中,特征向量V与每个向量相似度值作为得分,即Vt中每个元素的值作为得分。将相似度矩阵,共K*100个相似度值,按类别K求和,表示每个类别与当前特征向量V的相似度总得分,最后得到一个K*1的类别得分向量,得分最高的即当前图像最接近哪一个类别;最后,筛选出类别为分散好、条带清晰数值最大的图像。
[0045] 实施例2
[0046] 一种基于AE的低倍镜分裂相筛图系统,包括:
[0047] 至少一个处理器;
[0048] 至少一个存储器,用于存储至少一个程序;
[0049] 当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述所述的一种基于AE的低倍镜分裂相筛图方法。
[0050] 实施例3
[0051] 一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行上述所述的一种基于AE的低倍镜分裂相筛图方法。
[0052] 应用例
[0053] 首先采集低倍镜分裂相图,再按照需求分出K个类别的低倍镜图各自100张;训练自动编码器用于将低倍镜分裂相图提取出对应的特征向量;将K*100的预选低倍镜图,输入自动编码器得到特征向量存储起来;输入待分类的低倍镜图像得到特征向量V,V与特征底库的特征向量进行相似度计算,得到相似度矩阵;得到相似度矩阵,按类别求和,得分最高的为对应的类别。
[0054] 以上所述,仅为本发明的较佳实施例,并不用以限制本发明,本发明的专利保护范围以权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。