
基本信息:
- 专利标题: 基于多尺度空间信息与频谱特征融合的多通道语音增强方法
- 申请号:CN202411912274.8 申请日:2024-12-24
- 公开(公告)号:CN119889338A 公开(公告)日:2025-04-25
- 发明人: 倪烨 , 邹采荣 , 赵立业 , 王青云 , 梁瑞宇 , 孙成立 , 谢跃 , 赵小燕
- 申请人: 东南大学
- 申请人地址: 江苏省南京市玄武区四牌楼2号
- 专利权人: 东南大学
- 当前专利权人: 东南大学
- 当前专利权人地址: 江苏省南京市玄武区四牌楼2号
- 代理机构: 南京经纬专利商标代理有限公司
- 代理人: 姜慧勤
- 主分类号: G10L21/0208
- IPC分类号: G10L21/0208 ; G10L21/0216 ; G10L21/0232
摘要:
本发明公开了基于多尺度空间信息与频谱特征融合的多通道语音增强方法,根据频谱特性将不同频谱成分重新组合,提取通道内、通道间以及全通道的特征模式;并对上述特征进行融合,创建统一深度特征;引入局部特征提取模块增强当前帧特征权重并通过特征注意力机制融合不同尺度下的特征;引入分解注意力机制,在多个分解空间融合编码器和解码器输出,让细节特征也能被深度模块使用。本发明将空间特征和频谱特征相结合,利用特征融合方法创建统一的特征表达。通过注意力模块自适应学习空间特征中所包含的模式并加以利用,而非拟合具有物理含义的方向性特征,能够更灵活地适应不同的场景,具有良好的应用前景。
IPC结构图谱:
G | 物理 |
--G10 | 乐器;声学 |
----G10L | 语言分析或合成;语言识别 |
------G10L21/00 | 为了改变语音信号的品质或其可理解性而处理语音信号以产生另一种可听的或非可听的信号,例如视觉信号、触觉信号 |
--------G10L21/003 | .改变声音质量,例如音调或共振峰 |
----------G10L21/0208 | ..噪声过滤 |