
基本信息:
- 专利标题: 一种多模态电力表单识别方法及装置
- 申请号:CN202211651612.8 申请日:2022-12-19
- 公开(公告)号:CN115810197A 公开(公告)日:2023-03-17
- 发明人: 李洋 , 葛华利 , 许传波
- 申请人: 北京中电普华信息技术有限公司
- 申请人地址: 北京市海淀区清河小营东路15号科研楼710室
- 专利权人: 北京中电普华信息技术有限公司
- 当前专利权人: 北京中电普华信息技术有限公司
- 当前专利权人地址: 北京市海淀区清河小营东路15号科研楼710室
- 代理机构: 北京集佳知识产权代理有限公司
- 代理人: 吴磊
- 主分类号: G06V30/42
- IPC分类号: G06V30/42 ; G06V30/413 ; G06V30/414 ; G06V30/19 ; G06V30/16 ; G06V10/82
摘要:
本申请提供了一种多模态电力表单识别方法及装置。在执行该方法时,先获取待识别电力表单的图像,接着对待识别电力表单的图像进行预处理,得到预处理后的图像,然后利用CTPN神经网络模型对预处理后的图像进行文本行位置信息提取,得到预处理后的图像中文本行的位置信息;并基于文本行的位置信息,利用CRNN模型对预处理后的图像进行识别,得到预处理后的图像的识别结果;最后利用多模态特征信息提取算法,对预处理后的图像的识别结果进行提取,将多模态特征信息作为待识别的电力表单的识别结果。本申请能够在多个场景下自动识别表格性质的电力表单的多模态特征信息,解决人工摘录工作效率低的问题,提高电力表单识别效率,且具有强壮的鲁棒性。