一种基于贝叶斯网络和分类器链的图像自动标注方法转让专利
申请号 : CN202011493104.2
文献号 : CN112464010B
文献日 : 2021-08-27
发明人 : 王振武
申请人 : 中国矿业大学(北京)
摘要 :
权利要求 :
1.一种基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,包括如下步骤:步骤S1、获取样本图像,提取样本图像的特征构成训练集和测试集,并获取样本图像的标签,构建总标签集;
步骤S2、对训练集、测试集中样本图像的特征进行归一化处理;
步骤S3、基于总标签集中的每一个标签、归一化处理后的样本图像的特征,通过改进的贝叶斯信息准则BIC评分函数的评分搜索方法构建贝叶斯网络,通过贝叶斯网络进行特征选择,得到每一个标签对应的特征子集;
步骤S4、基于每一个标签对应的特征子集,采用密度聚类DBSCAN对总标签集中的标签进行聚类,生成标签子集;
步骤S5、基于改进的BIC评分函数的评分搜索方法分别为每个标签子集构建一个贝叶斯网络结构;
步骤S6、对于每个标签子集构建的贝叶斯网络结构,进行拓扑顺序提取,并基于拓扑顺序构建分类器链;通过训练集和测试集分别对分类器链中的各基分类器进行训练和测试,得到训练好的分类器链,通过训练好的分类器链对待测图像进行类别预测,完成图像的自动标注;
所述步骤S3中,分别为每个标签lq构建一个贝叶斯网络其中,fww为改进的评分函数, 为贝叶斯网络G在数据集 下的评分函数值,是指使得 最大的贝叶斯网络;最终得到每个标签lq对应的特征子集 d=1,2,…,Dq,Dq为标签lq对应的特征子集的特征个数;
其中,
T表示贝叶斯网
络中节点的个数,Jt为节点Nt的父节点的状态量个数,Kt为节点Nt的状态变量个数,η为调节参数,m为训练集中的样本个数,Ut为节点Nt的父节点个数,counttjk表示数据集 中节点Nt的状态量为k,且其父节点状态量为j的样本个数,表示Nt和u之间的标准化互
信息量; 表示Nt和u之间的互信息,H()表示求解信息熵,p()表示求解概率。
2.根据权利要求1所述的基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,所述步骤S3中,通过爬山法求解使得 最大的网络结构。
3.根据权利要求2所述的基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,所述步骤S5具体包括:
根据所述步骤S3中的评分函数,在初始贝叶斯网络中,不断增加代表标签的节点;
随机选取一个标签作为爬山搜索的起点;
通过加边、减边或翻转,进行贝叶斯网络结构的构建。
4.根据权利要求3所述的基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,所述贝叶斯网络结构的构建过程中,满足评分函数最大化的条件,得到每个标签子集对应的贝叶斯网络结构。
5.根据权利要求3所述的基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,所述步骤S6中,通过训练集对分类器链中的各基分类器进行训练的过程包括:基于每个标签子集Lr(r=1,2,...s)对应的贝叶斯网络,构建标签依赖字典dependency_dictr={<keyq,valueq>},keyq为标签子集中的第q个标签,valueq为标签子集中第q个标签的父节点集;将标签依赖字典中的keyq对应的特征子集与valueq进行拼接,形成新的特征集,完成基分类器的训练。
6.根据权利要求5所述的基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,所述基分类器采用逻辑回归模型。
7.根据权利要求5所述的基于贝叶斯网络和分类器链的图像自动标注方法,其特征在于,所述步骤S6中,通过训练好的分类器链对待测图像进行类别预测的方法包括:对于每个待测图像,将特征输入到无前驱节点标签对应的基分类器中,得到预测结果;
将预测结果输入至分类器链的其他基分类器中,综合所有的输出集为最终的图像预测结果集,完成图像的自动标注。
说明书 :
一种基于贝叶斯网络和分类器链的图像自动标注方法
技术领域
背景技术
的手工图像标注方法不但工作量大,而且不可避免地带来主观性和不精确性,让计算机实
现图像自动标注势在必行。图像自动标注是让计算机自动地给图像加上能够反映其内容的
语义关键词,自动标注的使用能够有效地改善目前图像检索的困境。贝叶斯网络算法是一
种常见的概率图模型,充分考虑了所求标签之间的相关性,分类器链算法是一种充分利用
标签之间相关性的模型,因此,如何提供一种基于贝叶斯网络和分类器链的图像自动标注
方法是目前亟待解决的技术问题。
发明内容
效提高了图像自动标注的鲁棒性和准确性。
特征选择,得到每一个标签对应的特征子集;
试,得到训练好的分类器链,通过训练好的分类器链对待测图像进行类别预测,完成图像的
自动标注。
在数据集 下的评分函数值, 是指使得 最大的贝叶斯
网络;最终得到每个标签lq对应的特征子集 d=1,2,…,Dq,Dq为标签lq对应的特征
子集的特征个数。
中第q个标签的父节点集;将标签依赖字典中的keyq对应的特征子集与valueq进行拼接,形
成新的特征集,完成基分类器的训练。
测结果集,完成图像的自动标注。
进行特征选择并且根据贝叶斯网络的拓扑顺序构建分类器链,通过贝叶斯网络和分类器链
算法构造图像预测标签集本方法能够对所有类型的图像进行标注,通用性强;同时,能够处
理包含连续特征和离散特征的图像,具有良好的适应性,且有效提高了图像标注的鲁棒性
和准确性。
附图说明
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
具体实施方式
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
第d个特征,d=1,2,...,D; 为第i幅图像xi的标签集对应的标签向量,
q=1,2,…,Q, L={l1,l2,…,lQ}为总标签集,lq为L中的第q个标
签,Q为标签总数量。
像x的第d个特征x的归一化结果。
索方法构建贝叶斯网络Gq,通过贝叶斯网络Gq进行特征选择,得到每一个标签对应的特征子
集;
评分 函数 , 为 贝叶 斯网 络G 在数 据集 下的 评 分函 数值 ,
是指所有可能的贝叶斯网络中使得 最大的贝叶斯网
络;通过提取网络Gq中的特征得到每个标签lq对应的特征子集 d=1,2,…,Dq,Dq为
标签lq对应的特征子集的特征个数。
络中节点的个数,Jt为节点Nt的父节点的状态量个数,Kt为节点Nt的状态变量个数,η为调节
参数,本实施例中η=10,m为训练集中的样本个数,Ut为节点Nt的父节点个数,counttjk表示
数据集 中节点Nt的状态量为k ,且其父节点状态量为j的 样本个数,
表示Nt和u之间的标准化互
信息量; 表示Nt和u之间的互信息,H()表
示求解信息熵,p()表示求解概率。
总标签集中的标签进行聚类,生成标签子集L1,L2,…,Ls,s为标签子集的个数。
之间的网络仅包含部分特征);其中,Q为标签总数量;通过加边、减边或翻转,进行贝叶斯网
络结构的构建,构建的贝叶斯网络结构中,包含的特征节点即为标签lq所对应的特征子集
d=1,2,…,Dq,Dq为标签lq对应的特征子集的特征个数;其中,网络结构的构建过
程中,满足评分函数的最大化,得到贝叶斯网络结构。
测试,得到训练好的分类器链,通过训练好的分类器链对待测图像进行类别预测,完成图像
的自动标注。
拥有的标签个数,keyq为标签子集中的第q个标签,valueq为标签子集中第q个标签的父节点
集;由于有些标签没有父标签(标签网络中的根节点),因此这样的标签没有需要依赖的标
签,其value为null。
其在dependency_dictr中对应的value(lq1,lq2,...,lqn)进行拼接形成新的特征集;其中,qn
为value中的标签个数,标签lq作为预测目标对每个key训练一个基分类器;所述基分类器
采用逻辑回归模型,本实施例中,分类阈值为0.5。
果集,完成图像的自动标注。
的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。