一种设备端多通道语音质量的检测方法转让专利

申请号 : CN202310000685.9

文献号 : CN115691556B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 许乾坤赵建平张宇韬陈麒聪徐远江

申请人 : 北京睿科伦智能科技有限公司

摘要 :

本发明涉及语音质量评估技术领域,具体涉及一种设备端多通道语音质量的检测方法,其通过获取一段多路麦克风数字信号,将所述多路麦克风数字信号经由单通道特征提取,并对不同通道之间的差异提取,最后接入多通道判决器得到检测结果。本发明仅需要数秒的录音数据,就可以进行检测多通道数据,并根据对录音的各类特征值进行分析,判断无效录音,从而准确有效探明具体是哪个通道出现问题。

权利要求 :

1.一种设备端多通道语音质量的检测方法,其特征在于:通过获取一段多路麦克风数字信号,将所述多路麦克风数字信号经由单通道特征提取,并对不同通道之间的差异提取,最后接入多通道判决器得到检测结果;

用于获取所述多路麦克风数字信号的设备为多通道麦克风拾音器,所述多通道麦克风拾音器包含电路硬件拾音模组,所述硬件拾音模组包含2个或多个麦克风;

所述单通道特征提取额包含RMSE均方根能量、MFCC梅尔倒谱系数和F0基频;

所述RMSE均方根能量,通过分帧对一段多路麦克风数字信号的均方根RMS计算,其声压定义为声波在某一点产生的逾量瞬时压强的均方根值;

MFCC梅尔频率倒谱系数用于对提取的频谱进行平滑化,并消除谐波;

所述F0基频为声音分解的很多正弦波中频率最低的波;

所述差异提取为通道间的差异提取:通过单通道的特征提取保证录取到正确的信号;

通过单通道的平滑频谱来计算两个输入通道之间数字信号的差异Difference,并提取差异范数Flux。

2.根据权利要求1所述的一种设备端多通道语音质量的检测方法,其特征在于:将设备的麦克风数量描述为MIC_NUM;MIC_NUM路麦克风阵列将空气声转为模拟电信号,经由模拟数字转换器后转换为MIC_NUM路数字信号;所述多通道判决器对MIC_NUM路数字信号进行统计,RMSE均方根能量与F0基频的计算用于判断MIC_NUM路麦克风是否录制到正确录音,用于排查非正常能量和无人声的录音;Flux用于判断MIC_NUM路麦克风阵列抖动差异度,是否可以作为正常录音。

说明书 :

一种设备端多通道语音质量的检测方法

技术领域

[0001] 本发明涉及语音质量评估技术领域,具体涉及一种设备端多通道语音质量的检测方法。

背景技术

[0002] 目前,麦克风阵列技术广泛用于会话场景中,商用的阵列通常使用多通道麦克风进行录音并通过声卡等录音设备将模拟信号转换为数字信号,通用的多通道录音设备在智能设备中的应用通常被用来进行角度定位、语音增强和语音分离。进行这些操作可以增强目标方向的语音,提高录音信噪比和语音转写准确率。
[0003] 语音信号可以通过多通道阵列设备进行增强,但需要保证每个麦克风通道信号的准确,检测方法通常有两种:一种是单独检测每个麦克风单元的收音效果,但检测效率低,且无法检测除麦克风单元之外的通道错误,如由电路和网络传输引起的信号错误;另一种是通过软件直接检测传输完成的数字信号,这种方法的好处是直接检测数字信号无论通道错误是由哪个环节引起的。
[0004] 市场场景下没有检测多通道录音质量的方法,但所采用的阵列算法需要依靠信号,会产生无法准确得到结果的现象。本方法着眼检测设备端的麦克风信号,并判断出具体哪个通道出现问题,该方法可以有效应用于各种智能拾音产品,并不限于实时场景。

发明内容

[0005] 本发明提供一种设备端多通道语音质量的检测方法,仅需要数秒的录音数据,就可以进行检测多通道数据,并根据对录音的各类特征值进行分析,判断无效录音,从而准确有效探明具体是哪个通道出现问题。
[0006] 为了达到上述目的,本发明提供如下技术方案:一种设备端多通道语音质量的检测方法,其通过获取一段多路麦克风数字信号,将所述多路麦克风数字信号经由单通道特征提取,并对不同通道之间的差异提取,最后接入多通道判决器得到检测结果。
[0007] 优选的,用于获取所述多路麦克风数字信号的设备为多通道麦克风拾音器,所述多通道麦克风拾音器包含电路硬件拾音模组,所述硬件拾音模组包含2个或多个麦克风。
[0008] 优选的,所述单通道特征提取额包含RMSE均方根能量、MFCC梅尔频率倒谱系数和F0基频;
[0009] 所述RMSE均方根能量,通过分帧对一段多路麦克风数字信号的均方根RMS计算,其声压定义为声波在某一点产生的逾量瞬时压强的均方根值;
[0010] 所述MFCC梅尔频率倒谱系数用于对提取的频谱进行平滑化,并消除谐波;
[0011] 所述F0基频为声音分解的很多正弦波中频率最低的波。
[0012] 优选的,所述差异提取为通道间的差异提取:通过单通道的特征提取保证录取到正确的信号;通过单通道的平滑频谱来计算两个输入通道之间数字信号的差异Difference,并提取差异范数Flux。
[0013] 优选的,将设备的麦克风数量描述为MIC_NUM;MIC_NUM路麦克风阵列将空气声转为模拟电信号,经由模拟数字转换器后转换为MIC_NUM路数字信号;所述多通道判决器对MIC_NUM路数字信号进行统计,RMSE均方根能量与F0基频的计算用于判断MIC_NUM路麦克风是否录制到正确录音,用于排查非正常能量和无人声的录音;Flux用于判断MIC_NUM路麦克风阵列抖动差异度,是否作为正常录音。
[0014] 本发明有益效果为:本发明将软件算法作为检测手段,比直接检测麦克风、电路和传输路径等方式简单易行,而且不需要对所有的录音进行检测,只需提取数秒音频取样,即可有效地发掘单通道无效信号和若干通道间的抖动量,因此可判断具体通道的无效音频,并明确详细问题。

附图说明

[0015] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016] 图1为本发明整体步骤示意图;
[0017] 图2为本发明通道间差异提取方式示意图;
[0018] 图3为实施例中MIC_NUM为5的多通道录音。

具体实施方式

[0019] 下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0020] 根据图1、图2所示,一种设备端多通道语音质量的检测方法,该方法不局限硬件采集模块,通过获取数秒的多路麦克风数字信号,经由单通道特征提取,不同通道之间的差异提取,然后接入判决器得到检测结果。
[0021] 其中优选的硬件采集模块,可为多通道麦克风拾音器,包含电路硬件拾音模组,麦克风数量可为2个或多个,本发明将麦克风数量描述为MIC_NUM;MIC_NUM路麦克风阵列将空气声转为模拟电信号,经由模拟数字转换器后转换为MIC_NUM路数字信号,其中检测时间描述可为MIC_TIME。
[0022] 在单通道特征提取中,本发明中的提取的特征包含RMSE均方根能量(Root‑Mean‑Square Energy),MFCC梅尔频率倒谱系数(Mel‑scale  Frequency Cepstral Coefficients)和F0基频(Fundamental Frequency)。
[0023] RMSE均方根能量,指的是声压有效值,通过分帧对一段声音信号的均方根(RMS)。声压定义为声波在某一点产生的逾量瞬时压强的均方根值。由于声压容易被人耳感知,也易于测量,因此,通常使用声压作为描述声波大小的物理量。
[0024] MFCC,梅尔频率倒谱系数,MFCC特征是对提取的频谱进行平滑化,并消除谐波的作用。此外还可以减少运算量,是一种在自动语音识别和说话人识别中广泛使用的特征。
[0025] F0,基本频率或简称基频,声音分解为很多正弦波,其中频率最低的波就是基音,其他频率高的为泛音。
[0026] 单通道的特征提取能够保证录取到正确的信号,然而对于智能产品而言,需要使用阵列麦克风之间的一致性,如果存在麦克风单元差异过大则会影响到后置的阵列算法。因此检测必须对麦克风通道的相似性进行计算,即通过单通道的平滑频谱,计算两个输入通道之间数字信号的差异Difference,并提取差异范数Flux。
[0027] 多通道判决器将前述获取的MIC_TIME时长录音的特征进行统计,RMSE均方根能量与F0基频的计算可以判断每个麦克风是否录制到正确录音,可以用来排查非正常能量和无人声的录音;Flux则可以判断该阵列抖动差异度,是否作为正常录音。
[0028] 实施例:
[0029] 图3为MIC_NUM为5的多通道录音,即3个通道有录音质量问题,通过下表可以得出结论:从RMSE和F0指标可以得出通道3和4可能存在漏声或者静音的问题,再通过F0和Flux检验得出通道5存在录音抖动,结论与展示的录音结果一致。
[0030]
[0031] 综上,本发明将软件算法作为检测手段,比直接检测麦克风、电路和传输路径等方式简单易行,不需要对所有的录音进行检测,只需提取数秒音频取样即可有效地发掘单通道无效信号和若干通道间的抖动量,同时还可判断具体通道的无效音频,并明确详细问题。
[0032] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。