
基本信息:
- 专利标题: 一种利用合成的联机文本图像改进手写OCR性能的方法
- 申请号:CN202011429519.3 申请日:2020-12-09
- 公开(公告)号:CN112364838B 公开(公告)日:2023-04-07
- 发明人: 陈俊杰 , 杨淑爱 , 黄坤山 , 谢克庆
- 申请人: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
- 申请人地址: 广东省佛山市南海高新区佛高科技智库中心A座4楼;
- 专利权人: 佛山市南海区广工大数控装备协同创新研究院,佛山市广工大数控装备技术发展有限公司
- 当前专利权人: 佛山市南海区广工大数控装备协同创新研究院,佛山市广工大数控装备技术发展有限公司
- 当前专利权人地址: 广东省佛山市南海高新区佛高科技智库中心A座4楼;
- 代理机构: 广州科沃园专利代理有限公司
- 代理人: 马盼
- 主分类号: G06V30/226
- IPC分类号: G06V30/226 ; G06V10/764 ; G06T3/00 ; G06V10/82 ; G06N3/0464 ; G06N3/08
摘要:
本发明提供了一种利用合成的联机文本图像改进手写OCR性能的方法,包括以下步骤:步骤S1,选取和划分数据集,采用IAM数据集,所述中IAM数据集含有IAM手写数据集和IAM联机手写数据集;步骤S2,构建风格GAN网络的生成器,所述生成器包括三个部分,内容编码器、内容解码器和风格编码器;步骤S3,训练网络中的的生成器;步骤S4,通过训练出来的生成器网络模型对联机数据集中文本图像进行合成。采用本发明框架生成的手写图像能够有效提升OCR识别精度,对于采集和构造大规模手写数据集提供了一个可行的替代方案。
公开/授权文献:
- CN112364838A 一种利用合成的联机文本图像改进手写OCR性能的方法 公开/授权日:2021-02-12