
基本信息:
- 专利标题: 基于云计算的壮语语音识别方法
- 申请号:CN201810785718.4 申请日:2018-07-17
- 公开(公告)号:CN108899031B 公开(公告)日:2022-11-04
- 发明人: 潘颖 , 李敏 , 李雄 , 蒋雪玲
- 申请人: 广西师范学院
- 申请人地址: 广西壮族自治区南宁市青秀区合兴路3号
- 专利权人: 广西师范学院
- 当前专利权人: 广西师范学院
- 当前专利权人地址: 广西壮族自治区南宁市青秀区合兴路3号
- 代理机构: 北京远大卓悦知识产权代理有限公司
- 代理人: 靳浩
- 主分类号: G10L15/26
- IPC分类号: G10L15/26 ; G10L15/25 ; G10L15/06 ; G10L15/02
摘要:
本发明公开了基于云计算的壮语语音识别方法,包括:建立壮语声学模型和壮语语言模型;建立口型数据库;获得目标语音信号和多个口型图像;对得到的多个口型图像进行组合,得到多个目标口型图像集合,并与口型数据库内的图像集合进行比对,选出、目标口型图像集合;根据选出的目标口型图像集合的拍摄时间段,从目标语音信号中截取出对应时间段的语音片段,根据语音片段和对应的特定壮语辅音对壮语声学模型进行训练,获得更新壮语声学模型;根据更新壮语声学模型和壮语语言模型将目标语音信号识别为文本。本发明利用口型图像信息对壮语声学模型进行更新,提高了识别准确率,并且较适合标准化程度不高的壮语。
公开/授权文献:
- CN108899031A 基于云计算的壮语语音识别方法 公开/授权日:2018-11-27
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L15/00 | 语音识别 |
--------G10L15/26 | .语音—正文识别系统 |