
基本信息:
- 专利标题: 一种基于零样本学习的图像分类方法
- 申请号:CN202411678981.5 申请日:2024-11-22
- 公开(公告)号:CN119723155A 公开(公告)日:2025-03-28
- 发明人: 孟宪佳 , 安志南 , 陶文进 , 解家豪
- 申请人: 西北大学
- 申请人地址: 陕西省西安市太白北路229号
- 专利权人: 西北大学
- 当前专利权人: 西北大学
- 当前专利权人地址: 陕西省西安市太白北路229号
- 代理机构: 西安众和至成知识产权代理事务所(普通合伙)
- 代理人: 强宏超
- 主分类号: G06V10/764
- IPC分类号: G06V10/764 ; G06V10/80 ; G06V10/776 ; G06V10/44
摘要:
本发明公开了一种基于零样本学习的图像分类方法,方法包括以下步骤:首先搭建图像分类系统,采用可见类数据集为训练集,不可见类数据集为测试集,通过CNN视觉骨干和GloVe获得视觉全局与语义特征。然后从视觉和语义特征中提取不同维度特征并融合成多元高维度融合视觉特征。之后,用映射函数将融合视觉特征映射到语义空间,得语义嵌入并由优化模块优化。训练完后,获取测试实例语义嵌入,利用最近邻匹配与显式自校准预测标签,通过计算测试样本语义嵌入和类别语义向量点积,选兼容性得分最高类别作预测类别。本发明可以解决在零样本分类中不同维度特征考虑不充足的问题,确保对可见和不可见类的预测分布一致性,提高对不可见类的泛化能力。