
基本信息:
- 专利标题: 一种融合GNN和OCR的智能图像识别方法及系统
- 申请号:CN202410435414.0 申请日:2024-04-11
- 公开(公告)号:CN118230343A 公开(公告)日:2024-06-21
- 发明人: 王振坤 , 樊静雨 , 刘鹏升 , 刘康旭 , 穆聪聪 , 薛玉静 , 董潇 , 赵志珍 , 张发才 , 李逸凡
- 申请人: 国网山东省电力公司
- 申请人地址: 山东省济南市市中区经二路150号
- 专利权人: 国网山东省电力公司
- 当前专利权人: 国网山东省电力公司
- 当前专利权人地址: 山东省济南市市中区经二路150号
- 代理机构: 济南圣达知识产权代理有限公司
- 代理人: 黄海丽
- 主分类号: G06V30/414
- IPC分类号: G06V30/414 ; G06V30/14 ; G06V30/146 ; G06V30/18 ; G06V30/19 ; G06V10/82 ; G06N3/0464 ; G06N3/048 ; G06N3/08
摘要:
本发明提供了一种融合GNN和OCR的智能图像识别方法及系统,包括:获取待识别的图像并进行相应预处理;基于OCR识别技术对图像中的文本区域进行检测,获得文本框及其对应位置信息;以及,对文本框内的文本进行识别,获得文本内容;基于所述文本框构建文本图;其中,所述文本图以文本框作为节点,并基于文本框之间的关系构建边,且每个节点均关联有文本内容、位置信息以及局部图像特征属性信息;将构建的文本图输入预先训练的图像校正判断模型中,对文本图中的每个文本框进行是否需要校正的判断;基于判断结果对文本框中的文本进行校正,获得图像识别结果。