一种训练集的拆分方法及装置转让专利

申请号 : CN201910251191.1

文献号 : CN110084277B

文献日 : 2021-03-05

本发明实施例提供一种训练集的拆分方法及装置，所述方法包括：获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；根据比照结果拆分所述一类域外训练集。所述装置执行上述方法。本发明实施例提供的训练集的拆分方法及装置，能够提高训练集拆分的合理性。

1.一种训练集的拆分方法，其特征在于，包括：

获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；

识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；

根据比照结果拆分所述一类域外训练集；

所述第一类别包括模糊图片；相应的，所述方法包括：选取模糊度对照图片对所述模糊图片对应的图片进行比照；

将低于所述模糊度对照图片对应的模糊图片拆分至不包含异常特征的第一目标图片集对照图片中；

若判断获知所述模糊图片为整图深度模糊图片、且与所述待检测目标部位的均质整图的特征相似度高于第一预设值，则确定为第一目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片；

选取所述第一目标图片集对照图片对所述第一目标整图深度模糊图片进行比照；

若判断获知比照结果为一致，则拆分所述第一目标整图深度模糊图片至所述第一目标图片集对照图片中；

若判断获知比照结果为不一致，则拆分所述第一目标整图深度模糊图片至所述一类域外训练集中。

2.根据权利要求1所述的方法，其特征在于，所述第一类别包括模糊图片；相应的，所述方法还包括：将高于所述模糊度对照图片对应的模糊图片拆分至所述一类域外训练集中；

所述异常特征包括凸起特征和/或指定颜色特征。

3.根据权利要求2所述的方法，其特征在于，所述方法包括：若判断获知所述模糊图片为整图深度模糊图片、且与细小弥漫性泡沫特征的特征相似度高于第二预设值，则确定为第二目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片；

选取漂浮物对照图片对所述第二目标整图深度模糊图片进行比照；

若判断获知比照结果为一致，则拆分所述第二目标整图深度模糊图片至所述漂浮物对照图片中；

若判断获知比照结果为不一致，则拆分所述第二目标整图深度模糊图片至所述一类域外训练集中。

4.根据权利要求2所述的方法，其特征在于，所述第一类别的图片特征还包括口腔图片；相应的，所述方法包括：选取所述待检测目标部位的均质整图对所述口腔图片进行比照；

若判断获知比照结果为一致，则拆分所述口腔图片至所述第一目标图片集对照图片中；

若判断获知比照结果为不一致，则拆分所述口腔图片至所述一类域外训练集中。

5.根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：若判断获知所述图片特征所属的类别为第二类别，则直接根据所述第二类别对应的图片特征，拆分所述第二类别对应的图片。

6.一种训练集的拆分装置，其特征在于，包括：

获取单元，用于获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；

选取单元，用于识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；

拆分单元，用于根据比照结果拆分所述一类域外训练集；

所述第一类别包括模糊图片；相应的，所述装置包括：选取模糊度对照图片对所述模糊图片对应的图片进行比照；

将低于所述模糊度对照图片对应的模糊图片拆分至不包含异常特征的第一目标图片集对照图片中；

选取所述第一目标图片集对照图片对所述第一目标整图深度模糊图片进行比照；

若判断获知比照结果为一致，则拆分所述第一目标整图深度模糊图片至所述第一目标图片集对照图片中；

若判断获知比照结果为不一致，则拆分所述第一目标整图深度模糊图片至所述一类域外训练集中。

7.一种电子设备，其特征在于，包括：处理器、存储器和总线，其中，所述处理器和所述存储器通过所述总线完成相互间的通信；

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。

8.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至5任一所述的方法。

一种训练集的拆分方法及装置

技术领域

[0001] 本发明实施例涉及图片处理技术领域，尤其涉及一种训练集的拆分方法及装置。

背景技术

[0002] 胶囊内镜具有无痛、无伤、拍摄图像信息量大等优点，具备广泛的应用价值。

[0003] 现有技术采用人工方式识别通过胶囊内镜拍摄的原始图片、并对原始图片进行分类，为了更加准确、高效地识别原始图片，需要构建模型，但是模型在使用之前通常需要进行训练，训练过程中的训练集需要进行拆分，以便模型能够更加准确地进行图片识别，但是，对于训练集的拆分，目前尚没有有效的方法。

[0004] 因此，如何避免上述缺陷，提高训练集拆分的合理性，成为亟须解决的问题。

发明内容

[0005] 针对现有技术存在的问题，本发明实施例提供一种训练集的拆分方法及装置。

[0006] 本发明实施例提供一种训练集的拆分方法，包括：

[0007] 获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；

[0008] 识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；

[0009] 根据比照结果拆分所述一类域外训练集。

[0010] 本发明实施例提供一种训练集的拆分装置，包括：

[0011] 获取单元，用于获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；

[0012] 选取单元，用于识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；

[0013] 拆分单元，用于根据比照结果拆分所述一类域外训练集。

[0014] 本发明实施例提供一种电子设备，包括：处理器、存储器和总线，其中，[0015] 所述处理器和所述存储器通过所述总线完成相互间的通信；

[0016] 所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如下方法：

[0017] 获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；

[0018] 识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；

[0019] 根据比照结果拆分所述一类域外训练集。

[0020] 本发明实施例提供一种非暂态计算机可读存储介质，包括：

[0021] 所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如下方法：

[0022] 获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；

[0023] 识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；

[0024] 根据比照结果拆分所述一类域外训练集。

[0025] 本发明实施例提供的训练集的拆分方法及装置，如果判断获知一类域外训练集中的图片特征所属的类别为第一类别，则选取对照图片对第一类别对应的图片进行比照，并根据该比照结果拆分一类域外训练集，能够提高训练集拆分的合理性。

附图说明

[0026] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0027] 图1为本发明训练集的拆分方法实施例流程图；

[0028] 图2(a)～图2(g)均为本发明实施例拍摄的均质整图图片的截图；

[0029] 图3(a)～图3(g)均为本发明实施例拍摄的细小弥漫性泡沫特征对应图片的截图；

[0030] 图4为本发明训练集的拆分装置实施例结构示意图；

[0031] 图5为本发明实施例提供的电子设备实体结构示意图。

具体实施方式

[0032] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0033] 图1为本发明训练集的拆分方法实施例流程图，如图1所示，本发明实施例提供的一种训练集的拆分方法，包括以下步骤：

[0034] S101：获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集。

[0035] 具体的，装置获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集。需要说明的是：该原始图片是通过胶囊内镜拍摄的，对胶囊内镜的工作过程作如下说明：

[0036] ·胶囊内镜从口腔进入消化道，再从肛门自然排出体外。

[0037] ·胶囊内镜的电池续航力有限，其有效工作区间为口腔、食道、胃、十二指肠、小肠和大肠一部分。

[0038] ·胶囊内镜的每次活动都产生域内检查图片和域外检查图片。

[0039] ·域内检查图片是对消化道某一段所进行的拍摄结果。

[0040] ·域外检查图片是除了域内检查图片以外，胶囊内镜顺便拍到的图片。

[0041] ·全部图片均可自动识别，无需任何人工介入(包括图像预处理)。

[0042] ·识别图像后，将胶囊内镜拍摄的图片分为六个大类(125个小类)，自动保存于125个图片文件夹中，其中，六个大类可以为：

[0043] 第一大类：一类域外分类标签(10个类别)。

[0044] 第二大类：二类域外分类标签(13个类别)。

[0045] 第三大类：基于局部结构特征的第一目标图片分类标签(14个类别)。

[0046] 第四大类：洞状结构第一目标图片分类标签(8个类别)。

[0047] 第五大类：基于全局结构特征的第一目标图片分类标签(24个类别)。

[0048] 第六大类：第二目标图片分类标签(56个类别)。

[0049] ·能够自动识别口腔、食道、胃、十二指肠、小肠和大肠等消化道的不同部位。

[0050] 每粒胶囊内镜每次可以拍摄的原始图片的数量可以为2000～3000张，即胶囊内镜获取到的图片集中的图片数量。

[0051] 可以从医院信息系统中导出、未经任何处理的胶囊内镜拍摄的原始图片(JPG格式)。本发明实施例中的一类域外训练集对应于上述一类域外分类标签，具体说明如下：上述10个类别的一类域外分类标签包括全曝光图片、全黑图片、半曝光图片、局部曝光图片、结构模糊图片、细节模糊图片、在所述胶囊内镜入口之前拍摄的图片、在食道中拍摄的图片、口腔图片、肠道图片分别对应的子类，每个子类都包含有一定数量的、可作为训练样本的样本图片，一类域外训练集可以理解为包含有所有子类对应的所有样本图片的训练集，一类域外训练集中的样本图片可以直接确定为干扰图片，干扰图片可以理解为无法用于图片识别的图片，识别出这些图片以后，需要尽早剔除这些图片，从而减少训练预设模型过程中的运算量。需要说明的是：原始图片的拍摄缺陷可以具体包括上述全曝光图片、全黑图片、半曝光图片、局部曝光图片、结构模糊图片、细节模糊图片六个子类；与待检测目标部位无关的拍摄部位可以具体包括上述在所述胶囊内镜入口之前拍摄的图片、在食道中拍摄的图片、口腔图片、肠道图片。待检测目标部位可以是胃部，不作具体限定。本发明实施例着重对与上述第一大类对应的一类域外训练集进行说明。

[0052] S102：识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照。

[0053] 具体的，装置识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照。第一类别可以理解为图片的图片特征不易区分，需要选取相应的对照图片进行进一步比照的一类图片特征，可以包括模糊图片，选取模糊度对照图片对所述模糊图片对应的图片进行比照，模糊度对照图片可以理解为衡量图片模糊程度的标准图片，将高于所述模糊度对照图片对应的模糊图片拆分至所述一类域外训练集中，即将模糊程度较高的模糊图片拆分至一类域外训练集中；将低于所述模糊度对照图片对应的模糊图片拆分至不包含异常特征的第一目标图片集对照图片中，第一目标图片集对照图片可以理解为评价待检测目标部位的标准图片，异常特征可以包括凸起特征和/或指定颜色特征，凸起特征可以包括肿胀、颗粒状物凸起。指定颜色特征可以包括红色、白色，不作具体限定。需要说明的是：该异常特征可以作为某些疾病诊断过程中的中间参考特征，仅仅依赖该异常特征还不足以诊断出疾病。

[0054] 进一步地，该方法包括：若判断获知所述模糊图片为整图深度模糊图片、且与所述待检测目标部位的均质整图的特征相似度高于第一预设值，则确定为第一目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片；图2(a)～图2(g)均为本发明实施例拍摄的均质整图图片的截图，如图2所示，待检测目标部位的均质整图，具体说明如下：被拍摄对象表面平坦光滑，没有显著纹理，颜色均一，尽管拍摄质量很高，但由于内容过于单一，已经失去医学判断价值(无法判断拍摄对象所处的位置、角度、器官载体、解剖特征等)。图片的数量占比大约是5.8％，这个比例非常高。这类图片由于失去医学价值，尽管表面上不是垃圾图片，即干扰图片，但实际上和“垃圾图片”没有什么分别，后续处理过程中完全可以忽略。第一预设值、预设占比和预设模糊度的具体数值可以根据实际情况自主设置，预设占比可以是模糊区域面积与图片中的拍摄对象对应的区域面积之间的预设比值。

[0055] 选取所述第一目标图片集对照图片对所述第一目标整图深度模糊图片进行比照；即对上述与所述待检测目标部位的均质整图的特征相似度高于第一预设值的整图深度模糊图片进行比照。

[0056] 若判断获知比照结果为一致，则拆分所述第一目标整图深度模糊图片至所述第一目标图片集对照图片中；若判断获知比照结果为不一致，则拆分所述第一目标整图深度模糊图片至所述一类域外训练集中。即实现了对第一目标整图深度模糊图片进行更加精细的拆分。

[0057] 进一步地，该方法还包括：若判断获知所述模糊图片为整图深度模糊图片、且与细小弥漫性泡沫特征的特征相似度高于第二预设值，则确定为第二目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片；图3(a)～图3(g)均为本发明实施例拍摄的细小弥漫性泡沫特征对应图片的截图，如图3所示，细小弥漫性泡沫特征可以理解为：拍摄内容被作为干扰物的气泡群等覆盖，导致图片医学价值较低。第二预设值可以根据实际情况自主设置，预设占比和预设模糊度可参照上述说明，不再赘述。

[0058] 选取漂浮物对照图片对所述第二目标整图深度模糊图片进行比照；漂浮物对照图片可以理解为确定图片是否被漂浮物覆盖、以及被覆盖程度的标准图片。即对上述与细小弥漫性泡沫特征的特征相似度高于第二预设值的整图深度模糊图片进行比照。

[0059] 若判断获知比照结果为一致，则拆分所述第二目标整图深度模糊图片至所述漂浮物对照图片中；若判断获知比照结果为不一致，则拆分所述第二目标整图深度模糊图片至所述一类域外训练集中。即实现了对第二目标整图深度模糊图片进行更加精细的拆分。

[0060] 进一步地，所述第一类别的图片特征还包括口腔图片；相应的，所述方法包括：

[0061] 选取所述待检测目标部位的均质整图对所述口腔图片进行比照；若判断获知比照结果为一致，则拆分所述口腔图片至所述第一目标图片集对照图片中；若判断获知比照结果为不一致，则拆分所述口腔图片至所述一类域外训练集中。均质整图可参照上述说明，不再赘述。由于，有些口腔图片与胃部图片特征相似程度极高，不易区分，通过比照，可以确定这些口腔图片是否是真实的口腔图片，如果是真实的口腔图片，则为干扰图片，拆分至一类域外训练集中，如果不是真实的口腔图片(可能是胃部图片)，则可以拆分至第一目标图片集对照图片中，还可以进一步确认是什么部位的图片。

[0062] 进一步地，所述方法还包括：

[0063] 若判断获知所述图片特征所属的类别为第二类别，则直接根据所述第二类别对应的图片特征，拆分所述第二类别对应的图片。第二类别可以理解为图片的图片特征较易区分，无需选取相应的对照图片进行进一步比照的一类图片特征，可以具体包括上述全曝光图片、全黑图片、半曝光图片、局部曝光图片、胶囊内镜入口之前拍摄的图片。需要说明的是：在食道中拍摄的图片(即食道图片)、肠道图片与其他部位的区别特征较为明显，也可以包含在第二类别之内。

[0064] S103：根据比照结果拆分所述一类域外训练集。

[0065] 具体的，装置根据比照结果拆分所述一类域外训练集。可参照上述说明，不再赘述。

[0066] 本发明实施例提供的训练集的拆分方法，如果判断获知一类域外训练集中的图片特征所属的类别为第一类别，则选取对照图片对第一类别对应的图片进行比照，并根据该比照结果拆分一类域外训练集，能够提高训练集拆分的合理性。

[0067] 在上述实施例的基础上，所述第一类别包括模糊图片；相应的，所述方法包括：

[0068] 选取模糊度对照图片对所述模糊图片对应的图片进行比照。

[0069] 具体的，装置选取模糊度对照图片对所述模糊图片对应的图片进行比照。可参照上述实施例，不再赘述。

[0070] 将高于所述模糊度对照图片对应的模糊图片拆分至所述一类域外训练集中。

[0071] 具体的，装置将高于所述模糊度对照图片对应的模糊图片拆分至所述一类域外训练集中。可参照上述实施例，不再赘述。

[0072] 将低于所述模糊度对照图片对应的模糊图片拆分至不包含异常特征的第一目标图片集对照图片中；所述异常特征包括凸起特征和/或指定颜色特征。

[0073] 具体的，装置将低于所述模糊度对照图片对应的模糊图片拆分至不包含异常特征的第一目标图片集对照图片中；所述异常特征包括凸起特征和/或指定颜色特征。可参照上述实施例，不再赘述。

[0074] 本发明实施例提供的训练集的拆分方法，通过将模糊图片拆分至第一目标图片集对照图片中，进一步能够提高训练集拆分的合理性。

[0075] 在上述实施例的基础上，所述方法包括：

[0076] 若判断获知所述模糊图片为整图深度模糊图片、且与所述待检测目标部位的均质整图的特征相似度高于第一预设值，则确定为第一目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片。

[0077] 具体的，装置若判断获知所述模糊图片为整图深度模糊图片、且与所述待检测目标部位的均质整图的特征相似度高于第一预设值，则确定为第一目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片。可参照上述实施例，不再赘述。

[0078] 选取所述第一目标图片集对照图片对所述第一目标整图深度模糊图片进行比照。

[0079] 具体的，装置选取所述第一目标图片集对照图片对所述第一目标整图深度模糊图片进行比照。可参照上述实施例，不再赘述。

[0080] 若判断获知比照结果为一致，则拆分所述第一目标整图深度模糊图片至所述第一目标图片集对照图片中。

[0081] 具体的，装置若判断获知比照结果为一致，则拆分所述第一目标整图深度模糊图片至所述第一目标图片集对照图片中。可参照上述实施例，不再赘述。

[0082] 若判断获知比照结果为不一致，则拆分所述第一目标整图深度模糊图片至所述一类域外训练集中。

[0083] 具体的，装置若判断获知比照结果为不一致，则拆分所述第一目标整图深度模糊图片至所述一类域外训练集中。可参照上述实施例，不再赘述。

[0084] 本发明实施例提供的训练集的拆分方法，实现了对第一目标整图深度模糊图片进行更加精细的拆分，进一步能够提高训练集拆分的合理性。

[0085] 在上述实施例的基础上，所述方法包括：

[0086] 若判断获知所述模糊图片为整图深度模糊图片、且与细小弥漫性泡沫特征的特征相似度高于第二预设值，则确定为第二目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片。

[0087] 具体的，装置若判断获知所述模糊图片为整图深度模糊图片、且与细小弥漫性泡沫特征的特征相似度高于第二预设值，则确定为第二目标整图深度模糊图片；所述整图深度模糊图片为模糊区域面积占比大于预设占比、且模糊度大于预设模糊度的图片。可参照上述实施例，不再赘述。

[0088] 选取漂浮物对照图片对所述第二目标整图深度模糊图片进行比照。

[0089] 具体的，装置选取漂浮物对照图片对所述第二目标整图深度模糊图片进行比照。可参照上述实施例，不再赘述。

[0090] 若判断获知比照结果为一致，则拆分所述第二目标整图深度模糊图片至所述漂浮物对照图片中。

[0091] 具体的，装置若判断获知比照结果为一致，则拆分所述第二目标整图深度模糊图片至所述漂浮物对照图片中。可参照上述实施例，不再赘述。

[0092] 若判断获知比照结果为不一致，则拆分所述第二目标整图深度模糊图片至所述一类域外训练集中。

[0093] 具体的，装置若判断获知比照结果为不一致，则拆分所述第二目标整图深度模糊图片至所述一类域外训练集中。可参照上述实施例，不再赘述。

[0094] 本发明实施例提供的训练集的拆分方法，实现了对第二目标整图深度模糊图片进行更加精细的拆分，进一步能够提高训练集拆分的合理性。

[0095] 在上述实施例的基础上，所述第一类别的图片特征还包括口腔图片；相应的，所述方法包括：

[0096] 选取所述待检测目标部位的均质整图分别对所述口腔图片进行比照。

[0097] 具体的，装置选取所述待检测目标部位的均质整图分别对所述口腔图片进行比照。可参照上述实施例，不再赘述。

[0098] 若判断获知比照结果为一致，则拆分所述口腔图片至所述第一目标图片集对照图片中。

[0099] 具体的，装置若判断获知比照结果为一致，则拆分所述口腔图片至所述第一目标图片集对照图片中。可参照上述实施例，不再赘述。

[0100] 若判断获知比照结果为不一致，则拆分所述口腔图片至所述一类域外训练集中。

[0101] 具体的，装置若判断获知比照结果为不一致，则拆分所述口腔图片至所述一类域外训练集中。可参照上述实施例，不再赘述。

[0102] 本发明实施例提供的训练集的拆分方法，实现了对口腔图片进行更加精细的拆分，进一步能够提高训练集拆分的合理性。

[0103] 在上述实施例的基础上，所述方法还包括：

[0104] 若判断获知所述图片特征所属的类别为第二类别，则直接根据所述第二类别对应的图片特征，拆分所述第二类别对应的图片。

[0105] 具体的，装置若判断获知所述图片特征所属的类别为第二类别，则直接根据所述第二类别对应的图片特征，拆分所述第二类别对应的图片。可参照上述实施例，不再赘述。

[0106] 本发明实施例提供的训练集的拆分方法，如果判断获知一类域外训练集中的图片特征所属的类别为第二类别，可以根据第二类别对应的图片特征将一类域外训练集中作更加精细的拆分，进一步能够提高训练集拆分的合理性。

[0107] 图4为本发明训练集的拆分装置实施例结构示意图，如图4所示，本发明实施例提供了一种训练集的拆分装置，包括获取单元401、选取单元402和拆分单元403，其中：

[0108] 获取单元401用于获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；选取单元402用于识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；拆分单元403用于根据比照结果拆分所述一类域外训练集。

[0109] 具体的，获取单元401用于获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；选取单元402用于识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；拆分单元403用于根据比照结果拆分所述一类域外训练集。

[0110] 本发明实施例提供的训练集的拆分装置，如果判断获知一类域外训练集中的图片特征所属的类别为第一类别，则选取对照图片对第一类别对应的图片进行比照，并根据该比照结果拆分一类域外训练集，能够提高训练集拆分的合理性。

[0111] 本发明实施例提供的训练集的拆分装置具体可以用于执行上述各方法实施例的处理流程，其功能在此不再赘述，可以参照上述方法实施例的详细描述。

[0112] 图5为本发明实施例提供的电子设备实体结构示意图，如图5所示，所述电子设备包括：处理器(processor)501、存储器(memory)502和总线503；

[0113] 其中，所述处理器501、存储器502通过总线503完成相互间的通信；

[0114] 所述处理器501用于调用所述存储器502中的程序指令，以执行上述各方法实施例所提供的方法，例如包括：获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；根据比照结果拆分所述一类域外训练集。

[0115] 本实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；根据比照结果拆分所述一类域外训练集。

[0116] 本实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述各方法实施例所提供的方法，例如包括：获取用于训练预设模型的训练集；所述训练集包括一类域外训练集；所述一类域外训练集是基于原始图片的拍摄缺陷、与待检测目标部位无关的拍摄部位确定的训练集；识别所述一类域外训练集中的图片特征，若判断获知所述图片特征所属的类别为第一类别，则选取对照图片对所述第一类别对应的图片进行比照；根据比照结果拆分所述一类域外训练集。

[0117] 本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

[0118] 以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

[0119] 通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

[0120] 最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

一种训练集的拆分方法及装置转让专利

申请号 : CN201910251191.1

文献号 : CN110084277B

文献日 : 2021-03-05

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 王斐

申请人 : 广州思德医疗科技有限公司

摘要 :

权利要求 :

说明书 :