分类模型的训练方法、装置、电子设备及存储介质转让专利
申请号 : CN201910113211.9
文献号 : CN109858558B
文献日 : 2022-01-21
发明人 : 张志伟 , 吴丽军 , 李焱
申请人 : 北京达佳互联信息技术有限公司
摘要 :
权利要求 :
1.一种分类模型的训练方法,所述分类模型为对图片进行分类的分类模型;其特征在于,所述分类模型训练时所利用的样本图片集中,每个样本图片具有一分类标签,且预先将各个样本图片的分类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级;所述方法包括:确定待训练的分类模型所需训练阶段的目标数量;
针对所述目标数量个训练阶段中的每一训练阶段,确定该训练阶段对应的目标层级,利用所述样本图片集中,所述目标层级的分类标签对应的样本图片,对所述分类模型进行训练,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程;其中,所述目标数量个训练阶段中,至少有两个训练阶段对应的目标层级不同;
在最后一个训练阶段结束后,将当前训练得到的分类模型作为训练完成的分类模型,以使所述训练完成的分类模型对待预测分类的图片进行分类;
针对所述目标数量个训练阶段中的第一个训练阶段,所述确定该训练阶段对应的目标层级的步骤,包括:
将所述至少两个层级中的顶层,作为该第一个训练阶段对应的目标层级;
针对所述目标数量个训练阶段中的最后一个训练阶段,所述确定该训练阶段对应的目标层级的步骤,包括:
将所述至少两个层级中的所有层级,作为该最后一个训练阶段对应的目标层级;
所述样本图片的分类标签包括:人、狗、狗的品种、猫、动物、男人、建筑以及楼房;
所述预先将各个样本图片的分类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级,包括:将各个样本图片的分类标签划分为三个层级,所述三个层级为顶层、中间层、底层;
其中,所述顶层的分类标签包括:人、动物以及建筑;所述中间层的分类标签包括:猫、狗、楼房以及男人;所述底层的分类标签包括:狗的品种;
或
将各个样本图片的分类标签划分为两个层级,所述两个层级为顶层、底层;
其中,所述顶层的分类标签包括:人、男人、动物以及建筑;所述底层的分类标签包括:猫、狗、狗的品种以及楼房。
2.根据权利要求1所述的方法,其特征在于,所述目标数量为大于2时,针对所述目标数量个训练阶段中,除第一个训练阶段和最后一个训练阶段以外的每一中间训练阶段,所述确定该训练阶段对应的目标层级的步骤,包括:将所述顶层以及该中间训练阶段对应的预定中间层,作为该中间训练阶段对应的目标层级;
其中,每一中间训练阶段对应的预定中间层包括:除所述顶层和底层以外的一个或多个层级。
3.根据权利要求2所述的方法,其特征在于,所述目标数量与所述至少两个层级的层级数量相同;
所述每一中间训练阶段对应的预定中间层包括:第一中间层和所述第一中间层以上的层级,所述第一中间层的层级数等于该中间训练阶段的阶段数。
4.根据权利要求1所述的方法,其特征在于,针对所述目标数量个训练阶段中的第一个训练阶段,所述在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程,包括:当利用第一损失函数计算得到的、所述分类模型对应的损失值,小于第一阈值时,结束所述第一训练阶段的训练过程;
针对所述目标数量个训练阶段中的最后一个训练阶段,所述在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程,包括:当利用第二损失函数计算得到的、所述分类模型对应的损失值,小于第二阈值时,结束所述最后一个训练阶段的训练过程。
5.根据权利要求2所述的方法,其特征在于,针对所述目标数量个训练阶段中的每个中间训练阶段,所述在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程,包括:
当利用第一损失函数计算得到的、所述分类模型对应的损失值,小于第三阈值时,结束该中间训练阶段的训练过程;或者,当利用第二损失函数计算得到的、所述分类模型对应的损失值,小于第四阈值时,结束该中间训练阶段的训练过程。
6.根据权利要求4或5所述的方法,其特征在于,所述第一损失函数中,对各个分类标签所预测的分布概率值,基于S型函数Sigmoid Function计算获得;
所述第二损失函数中,针对每个分类标签,对该分类标签所预测的分布概率值,基于S型函数Sigmoid Function或归一化指数函数Softmax Function计算获得。
7.一种分类模型的训练装置,所述分类模型为对图片进行分类的分类模型;其特征在于,所述分类模型训练时所利用的样本图片集中,每个样本图片具有一分类标签,且预先将各个样本图片的分类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级;包括:
确定模块,被配置为确定待训练的分类模型所需训练阶段的目标数量;
训练模块,被配置为针对所述目标数量个训练阶段中的每一训练阶段,确定该训练阶段对应的目标层级,利用所述样本图片集中,所述目标层级的分类标签对应的样本图片,对所述分类模型进行训练,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程;其中,所述目标数量个训练阶段中,至少有两个训练阶段对应的目标层级不同;
完成训练模块,被配置为在最后一个训练阶段结束后,将当前训练得到的分类模型作为训练完成的分类模型,以使所述训练完成的分类模型对待预测分类的图片进行分类;
所述训练模块,针对所述目标数量个训练阶段中的第一个训练阶段,确定该训练阶段对应的目标层级,包括:将所述至少两个层级中的顶层,确定为该第一个训练阶段对应的目标层级;
所述训练模块,针对所述目标数量个训练阶段中的最后一个训练阶段,确定该训练阶段对应的目标层级,包括:将所述至少两个层级中的所有层级,确定为该最后一个训练阶段对应的目标层级;
所述样本图片的分类标签包括:人、狗、狗的品种、猫、动物、男人、建筑以及楼房;
所述预先将各个样本图片的分类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级,包括:将各个样本图片的分类标签划分为三个层级,所述三个层级为顶层、中间层、底层;
其中,所述顶层的分类标签包括:人、动物以及建筑;所述中间层的分类标签包括:猫、狗、楼房以及男人;所述底层的分类标签包括:狗的品种;
或
将各个样本图片的分类标签划分为两个层级,所述两个层级为顶层、底层;
其中,所述顶层的分类标签包括:人、男人、动物以及建筑;所述底层的分类标签包括:猫、狗、狗的品种以及楼房。
8.根据权利要求7所述的装置,其特征在于,所述目标数量为大于2时,所述训练模块,针对所述目标数量个训练阶段中,除第一个训练阶段和最后一个训练阶段以外的每一中间训练阶段,确定该训练阶段对应的目标层级,包括:将所述顶层以及该中间训练阶段对应的预定中间层,确定为该中间训练阶段对应的目标层级;
其中,每一中间训练阶段对应的预定中间层包括:除所述顶层和底层以外的一个或多个层级。
9.根据权利要求8所述的装置,其特征在于,所述目标数量与所述至少两个层级的层级数量相同;
所述每一中间训练阶段对应的预定中间层包括:第一中间层和所述第一中间层以上的层级,所述第一中间层的层级数等于该中间训练阶段的阶段数。
10.根据权利要求7所述的装置,其特征在于,所述训练模块,针对所述目标数量个训练阶段中的第一个训练阶段,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程,包括:当利用第一损失函数计算得到的、所述分类模型对应的损失值,小于第一阈值时,结束所述第一训练阶段的训练过程;
所述训练模块,针对所述目标数量个训练阶段中的最后一个训练阶段,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程,包括:当利用第二损失函数计算得到的、所述分类模型对应的损失值,小于第二阈值时,结束所述最后一个训练阶段的训练过程。
11.根据权利要求8所述的装置,其特征在于,所述训练模块,针对所述目标数量个训练阶段中的每个中间训练阶段,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程,包括:
当利用第一损失函数计算得到的、所述分类模型对应的损失值,小于第三阈值时,结束该中间训练阶段的训练过程;或者,当利用第二损失函数计算得到的、所述分类模型对应的损失值,小于第四阈值时,结束该中间训练阶段的训练过程。
12.根据权利要求10或11所述的装置,其特征在于,所述第一损失函数中,对各个分类标签所预测的分布概率值,基于S型函数Sigmoid Function计算获得;
所述第二损失函数中,针对每个分类标签,对该分类标签所预测的分布概率值,基于S型函数Sigmoid Function或归一化指数函数Softmax Function计算获得。
13.一种电子设备,其特征在于,包括:处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行所述存储器上所存放的可执行指令时,实现权利要求
1‑6任一项所述的方法。
14.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1‑6任一项所述的方法。
说明书 :
分类模型的训练方法、装置、电子设备及存储介质
技术领域
背景技术
签是狗,而有的样本图片的分类标签则是狗的品种,例如哈士奇等。然而,相关技术在训练
分类模型时,并未将这种情况考虑在内,这无疑影响模型的准确度。因此,在将样本数据的
分类标签之间的上下位关系考虑在内的前提下,如何实现对分类模型的有效训练,从而得
到准确度较高的分类模型,是一个亟待解决的技术问题。
发明内容
类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级;该
方法包括:
行训练,在所述分类模型满足预定收敛条件时,结束该训练阶段的训练过程;其中,所述目
标数量个训练阶段中,至少有两个训练阶段对应的目标层级不同;
级的步骤,包括:
类标签,按照语义划分为具有上下位关系的至少两个层级,每一分类标签属于一个层级;该
装置包括:
据,对所述分类模型进行训练,在所述分类模型满足预定收敛条件时,结束该训练阶段的训
练过程;其中,所述目标数量个训练阶段中,至少有两个训练阶段对应的目标层级不同;
段对应的目标层级;
阶段对应的目标层级。
应的目标层级,包括:
计算得到的、所述分类模型对应的损失值,小于第一阈值时,结束所述第一训练阶段的训练
过程;
型的训练方法。
模型进行分阶段的训练;在每个训练阶段中,基于样本数据的分类标签所属的层级来选取
样本数据,即在模型的训练过程中,增加了样本数据的分类标签的层级因素。因此,本公开
的实施例提供的技术方案,可以在将样本数据的分类标签之间的上下位关系考虑在内的前
提下,实现对分类模型的有效训练,从而得到准确度较高的分类模型。
附图说明
具体实施方式
中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附
权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
器或终端设备,在具体应用中,该终端设备可以为计算机、智能手机以及平板设备等。
体的,按照语义将各个分类标签划分为具有上下位关系的至少两个层级,每一分类标签属
于一个层级。
的分类标签包括:哈士奇、人、狗、猫、动物、男人、建筑以及楼房等;针对这些分类标签的标
签内容的上下位关系,可以将这些分类标签划分为三个层级。其中,顶层的分类标签可以包
括:人、动物以及建筑;中间层的分类标签可以包括:猫、狗、楼房以及男人;底层的分类标签
可以包括:哈士奇。
的层级数为2,那么,对上述8个分类标签进行层级划分时,顶层的分类标签可以包括:人、男
人、动物以及建筑,底层的分类标签可以为猫、狗、哈士奇以及楼房。
这个分类标签,扩展一个名为哺乳动物的下位分类标签,而猫和狗这两个分类标签,则是哺
乳动物这个分类标签的下位分类标签。
也可以称为父亲标签;顶层以下的层级中的分类标签,可以称为子标签,底层的分类标签的
名称较为下位,故底层的分类标签的可以称为叶子标签。
具体应用中,对于样本数据为多标签样本数据的分类模型,只需对多标签的样本数据的各
个分类标签,同样按照语义划分为具有上下位关系的至少两个层级即可。
以应用于本公开实施例所提供的分类模型的训练方法中。
样本数据来进行训练,并使用该训练阶段对应的损失函数,计算分类模型的损失值,当损失
值小于为该训练阶段所预设的阈值时,该训练阶段结束,进入下一训练阶段,直至最后一个
训练阶段结束,分类模型也训练完成。其中,在为每个训练阶段选取样本数据时,可以先确
定每一训练阶段对应的目标层级,按照每个训练阶段对应的目标层级来确定分类标签,进
而也就确定了所要选取的样本数据。可以理解的是,目标层级是上述的对分类标签所划分
的至少两个层级中的一个或多个层级。需要说明的是,本公开实施例中,分类模型至少有两
个训练阶段对应的目标层级不相同。另外,不同的训练阶段可以使用不同的损失函数,当
然,有些训练阶段所使用的损失函数也可以相同。当每个训练阶段中利用损失函数计算得
到的损失值满足预设的阈值时,则可以结束该训练阶段的训练过程,进入下一训练阶段,直
至目标数量个训练阶段全部训练完毕。
目标数量;或者,将大于或小于所述至少两个层级的层级数量的值,确定为该目标数量。
练的分类模型的具体结构进行限定。
在分类模型满足预定收敛条件时,结束该训练阶段的训练过程。
的样本数据。
层,作为该第一个训练阶段对应的目标层级;
述目标数量个训练阶段,还包括第一个训练阶段和最后一个训练阶段之间的中间训练阶
段。
训练阶段对应的目标层级的步骤,可以包括:
分类。例如,在训练一个对图片进行分类的分类模型时,该分类模型的第一个训练阶段完成
之后,该分类模型就可以对图片实现基本的分类,如预测待分类图片的类别是关于风景的
图片,还是关于人物的图片,或者是关于动物的图片等;当第二个训练阶段训练完成之后,
对于包含有动物的待预测分类的图片,可以预测出该图片是关于那种动物的图片;当最后
一个训练阶段完成之后,所有层级中的分类标签都已经参与过分类模型的训练,此时,分类
模型就可以实现对图片中的某种动物的详细品种的预测。
段的训练;在每个训练阶段中,基于样本数据的分类标签所属的层级来选取样本数据,即在
模型的训练过程中,增加了样本数据的分类标签的层级因素。因此,本公开的实施例提供的
技术方案,可以在将样本数据的分类标签之间的上下位关系考虑在内的前提下,实现对分
类模型的有效训练,从而得到准确度较高的分类模型。
阶段为中间训练阶段,阶段数为2,故第二个训练阶段对应的第一中间层为所述至少两个层
级中的第二层,而第二个训练阶段对应的预定中间层仅包括该第二层,因此,第二个训练阶
段对应的目标层级为顶层和第二层;第三个训练阶段也为中间训练阶段,阶段数为3,故第
三个训练阶段对应的第一中间层为所述至少两个层级中的第三层,进而,第三个训练阶段
对应的预定中间层包括第三层以及第二层,因此,第三个训练阶段对应的目标层级为顶层、
第二层以及第三层;第四个训练阶段为最后一个训练阶段,故第四个训练阶段对应的目标
层级为所述至少两个层级中的所有层,即顶层、第二层、第三层以及第四层。
失函数来计算损失值的一个训练阶段中,所利用的各个样本数据的分类标签。
第二损失函数中所针对的每个分类标签为:用该第二损失函数来计算损失值的一个训练阶
段中,所利用的每个样本数据的分类标签。
间的值; 为对该第n个分类标签所预测的分布概率值,该预测的分布概率值,使用
Sigmoid函数计算获得,且该预测的分布概率值,同为0‑1之间的值;C为该训练阶段所利用
的样本数据的分类标签的个数; 为该第一损失函数所计算得到的各个pn与
的交叉损失熵之和,该交叉损失熵之和即为利用该第一损失函数来计算损失值的训练阶段
的损失值。
与第一损失函数不同的是,该第二损失函数中,第一个求和公式中的 使用Softmax函数
计算获得,第二个求和公式中的 使用Sigmoid函数计算获得;C0为该训练阶段所利用的
样本数据的分类标签中,使用Sigmoid函数来计算 的分类标签的个数,C为该训练阶段所
利用的样本数据的分类标签的个数,可以理解的是,第一个求和公式中,使用Softmax函数
来计算 的分类标签是从C0到C之间的分类标签。 为该第二损失函数所计算
得到的各个pn与 的交叉损失熵之和,该交叉损失熵之和即为利用该第二损失函数来计算
损失值的训练阶段的损失值。
函数来计算损失值的训练阶段的分类标签中,哪些分类标签使用Softmax函数计算 哪些
分类标签使用Sigmoid函数计算 也将在这里一并举例说明。
损失函数来计算损失值。另外,在计算各个训练阶段的损失值时,各个分类标签的 的计算
方式,可以依据该分类标签在标签树中所属的层级而定。
说,风景和植物这两个父亲标签,是可以产生交集的,风景可以包含花草,花草也可以构成
风景。而哈士奇和泰迪这两个叶子标签则是相互独立的,无法产生交集。因此,计算叶子标
签的 可以采用Softmax函数,这是因为采用Softmax函数所计算的各个 和为1,而由于
采用Sigmoid函数所计算的各个 分布概率,和可以大于1,故在计算各个父亲标签的 时,
可以采用Sigmoid函数;对于位于标签树的中间层级中,既非父亲标签,也非叶子标签的分
类标签,可以采用Softmax函数计算 或者,也可以采用Sigmoid函数计算 具体的,可以
预先确定每个中间层级的分类标签使用这两个函数中的哪一函数来计算 本公开对此不
做限定。
的 均可以采用Sigmoid函数计算获得。
函数计算,而各个属于第二层的分类标签的 可以采用Sigmoid函数计算,也可以采用
Softmax函数计算。
采用Sigmoid函数计算,而各个属于第二层和各个属于第三层的分类标签的 可以采用
Sigmoid函数计算,也可以采用Softmax函数计算。
分类标签的 仍旧可以采用Sigmoid函数计算,各个属于第二层和各个属于第三层的分类
标签,可以采用Sigmoid函数计算,也可以采用Softmax函数计算,而各个属于底层的分类标
签的 可以采用Softmax函数计算。
类标签,且预先将各个样本数据的分类标签,按照语义划分为具有上下位关系的至少两个
层级,每一分类标签属于一个层级。
应的样本数据,对所述分类模型进行训练,在所述分类模型满足预定收敛条件时,结束该训
练阶段的训练过程;其中,所述目标数量个训练阶段中,至少有两个训练阶段对应的目标层
级不同。
层,确定为该第一个训练阶段对应的目标层级;
练阶段对应的目标层级。
段,确定该训练阶段对应的目标层级,包括:
括:当利用第一损失函数计算得到的、所述分类模型对应的损失值,小于第一阈值时,结束
所述第一训练阶段的训练过程;
包括:
通信组件416。
令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便
于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多
媒体组件408和处理组件402之间的交互。
息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组
合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编
程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储
器,磁盘或光盘。
幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感
器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作
的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒
体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或
视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和
后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组
件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
定按钮。
组件为设备400的显示器和小键盘,传感器组件414还可以检测设备400或设备400一个组件
的位置改变,用户与设备400接触的存在或不存在,设备400方位或加速/减速和设备400的
温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测
附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成
像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感
器,磁传感器,压力传感器或温度传感器。
组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广
播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(NFC)
模块,以促进短程通信。
(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述任一种分类模型
的训练方法。
个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执
行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个
对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行上述任一种分类模
型的训练方法。
备500可以操作基于存储在存储器532的操作系统,例如Windows ServerTM,Mac OS XTM,
UnixTM,LinuxTM,FreeBSDTM或类似。
一种分类模型的训练方法。
模型的训练方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器
(RAM)、CD‑ROM、磁带、软盘和光数据存储设备等。
者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识
或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的
权利要求指出。