一种语音信号跨时钟域处理方法及装置和智能语音芯片转让专利

申请号 : CN202110015635.9

文献号 : CN112350688B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 金傲寒梁敏学余新康

申请人 : 北京欣博电子科技有限公司

摘要 :

本发明公开了一种语音信号跨时钟域处理方法及装置和智能语音芯片,所述处理方法包括:对音频接口时钟域的频率数据进行处理,得到第一采样率;对所述第一采样率进行多级降频处理,得到与所述音频接口时钟域的第二采样率相等的第三采样率;本发明可以将接口采样数据快速的同步到音频子系统内部时钟域下,方便复用各类信号处理模块,节省芯片面积和功耗,减少布局布线的难度和设计复杂度。

权利要求 :

1.一种语音信号跨时钟域处理方法,其特征在于,所述处理方法包括:对音频接口时钟域的频率数据进行处理,得到基于音频子系统时钟频率的第一采样率;

对所述第一采样率进行多级降频处理,得到与所述音频接口时钟域的第二采样率相等的第三采样率;

其中,对所述第一采样率进行多级降频处理,得到与音频接口时钟域的第二采样率相等的第三采样率,包括:

对所述第一采样率进行降频处理,得到第一级采样率;

对所述第一级采样率进行降频处理,得到第二级采样率;

对所述第二级采样率进行降频处理,得到所述第三采样率;

对音频接口时钟域的频率数据进行处理,得到基于音频子系统时钟频率的第一采样率,包括:

将基于音频接口时钟域的频率数据转换成基于音频子系统时钟域的频率数据;

对所述基于音频子系统时钟域的频率数据进行过采样处理,得到所述第一采样率;

所述第二采样率为音频接口时钟域的接口采样率。

2.一种语音信号跨时钟域处理装置,其特征在于,包括:异步采样率转换模块,用于将音频接口时钟域的频率数据进行处理,得到基于音频子系统时钟频率的第一采样率;

滤波模块,用于对所述第一采样率进行多级降频处理,得到与音频接口时钟域的第二采样率相等的第三采样率;

其中,所述滤波模块,包括:第一滤波单元,用于所述第一采样率进行降频处理,得到第一级采样率;

第二滤波单元,用于所述第一级采样率进行降频处理,得到第二级采样率;

第三滤波单元,用于所述第二级采样率进行降频处理,得到所述第三采样率;

所述异步采样率转换模块,包括:转换单元,将基于音频接口时钟域的频率数据转换成基于音频子系统时钟域的频率数据;

过采样单元,对所述基于音频子系统时钟域的频率数据进行过采样处理,得到所述第一采样率。

3.根据权利要求2所述的装置,其特征在于,所述第一滤波单元、所述第二滤波单元和所述第三滤波单元均为低通滤波单元。

4.一种智能语音芯片,其特征在于,包括:音频接口时钟域的接口、音频子系统时钟域的接口和实现根据权利要求1所述方法的处理装置;

所述处理装置包括异步采样率转换器和多级滤波器。

5.根据权利要求4所述的一种智能语音芯片,其特征在于,所述音频接口时钟域的接口与所述异步采样率转换器连接;

所述多级滤波器包括第一级滤波器、第二级滤波器和第三级滤波器;

所述第一级滤波器与所述异步采样率转换器连接,所述第一级滤波器通过所述第二级滤波器与所述第三级滤波器连接,所述第三级滤波器与所述音频子系统时钟域的接口连接。

说明书 :

一种语音信号跨时钟域处理方法及装置和智能语音芯片

技术领域

[0001] 本发明涉及一种语音信号的处理方法,特别是涉及一种语音信号跨时钟域处理方法及装置和智能语音芯片。

背景技术

[0002] 在人工智能语音芯片上,通常采用i2s tdm接口进行音频采样,这些接口的采样时钟通常由芯片外部晶振提供,采样后的数据需要同步于音频子系统时钟域,即使用于采样
的基准频率和音频子系统时钟频率一致也会产生基于同种时钟频率的微小频偏或者产生
不确定的相位差,导致采样的数据不能使用基于音频子系统时钟域的滤波器进行滤波。
[0003] 现有技术通常采用将滤波器放置在接口时钟域之中,然后再通过标准同步处理模块将滤波后的数据同步到音频子系统时钟域。缺点在于一般人工智能语音芯片包含多种语
音输入接口,用此方法只能在每种接口时钟域中单独设计音频滤波器,这会导致芯片面积
增加,功耗变大。
[0004] 现有技术通常还会采用高级pll进行频率锁相,将采样到的音频数据同步到音频子系统之中,但是高级pll ip购买费用高,版图设计复杂。会导致设计工作量增加,成本增
加。

发明内容

[0005] (一)发明目的
[0006] 本发明的目的是提供一种语音信号跨时钟域处理方法及装置和智能语音芯片,可以将接口采样数据快速的同步到音频子系统内部时钟域下,方便复用各类信号处理模块,
节省芯片面积和功耗,减少布局布线的难度和设计复杂度。
[0007] (二)技术方案
[0008] 为解决上述问题,本发明一方面提供了一种语音信号跨时钟域处理方法,所述处理方法包括:对音频接口时钟域的频率数据进行处理,得到第一采样率;对所述第一采样率
进行多级降频处理,得到与所述音频接口时钟域的第二采样率相等的第三采样率。
[0009] 可选地,将音频接口时钟域的频率数据进行处理,得到第一采样率,包括:将基于音频接口时钟域的频率数据转换成基于音频子系统时钟域的频率数据;对所述音频子系统
时钟域的频率数据进行过采样处理,得到基于音频子系统时钟频率的第一采样率;所述第
二采样率为音频接口时钟域的接口采样率。
[0010] 可选地,对所述第一采样率进行多级降频处理,得到与音频接口时钟域的第二采样率相等的第三采样率,包括:对所述第一采样率进行降频处理,得到第一级采样率;对所
述第一级采样率进行降频处理,得到第二级采样率;对所述第二级采样率进行降频处理,得
到所述第三采样率。
[0011] 另一方面,本发明还提供了一种语音信号跨时钟域处理装置,包括:异步采样率转换模块,用于将音频接口时钟域的频率数据进行处理,得到基于音频子系统时钟频率的第
一采样率;滤波模块,用于对所述第一采样率进行多级降频处理,得到与音频接口时钟域的
第二采样率相等的第三采样率。
[0012] 可选地,所述异步采样率转换模块,包括:转换单元,将基于音频接口时钟域的频率数据转转换成基于音频子系统时钟域的频率数据;过采样单元,对所述音频子系统时钟
域的频率数据进行过采样处理,得到所述第一采样率。可选地,所述预设频率为所述异步采
样率转换模块的固定有频率。
[0013] 可选地,所述滤波模块,包括:第一滤波单元,用于所述第一采样率进行降频处理,得到第一级采样率;第二滤波单元,用于所述第一级采样率进行降频处理,得到第二级采样
率;第三滤波单元,用于所述第二级采样率进行降频处理,得到所述第三采样率。
[0014] 可选地,所述第一滤波单元、所述第二滤波单元和所述第三滤波单元均为低通滤波单元。
[0015] 另一方面,本发明还提供了一种智能语音芯片,包括:音频接口时钟域的接口、音频子系统时钟域的接口、实现上述所述方法的处理装置;处理装置包括异步采样率转换器
和多级滤波器。
[0016] 可选地,所述音频接口时钟域的接口与所述异步采样率转换器连接;所述多级滤波器包括第一级滤波器、第二级滤波器、第三级滤波器;所述第一级滤波器与所述异步采样
率转换器连接,所述第一级滤波器通过所述第二级滤波器与所述第三级滤波器连接,所述
第三级滤波器与所述音频子系统时钟域的接口连接。
[0017] (三)有益效果
[0018] 本发明的上述技术方案具有如下有益的技术效果:
[0019] 本发明通过对音频接口时钟域的频率进行处理,得到第一采样率;同时对第一采样率进行多级降频处理,使本发明可以将接口采样数据简单直接的同步到音频子系统内部
时钟域下,这样跨时钟域转换的音频数据又可以直接给智能分析模块使用,节省芯片面积
和功耗,减少布局布线的难度和设计复杂度。

附图说明

[0020] 图1为本发明的工作原理图。

具体实施方式

[0021] 为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发
明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本
发明的概念。
[0022] 在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0023] 在本发明的实施例中,本发明提供一种语音信号跨时钟域处理方法,包括对音频接口时钟域的频率数据进行处理,得到基于音频子系统时钟频率的第一采样率;对所述第
一采样率进行多级降频处理,得到与所述音频接口时钟域的第二采样率相等的第三采样
率。
[0024] 本发明通过对音频接口时钟域的频率进行处理,得到第一采样率;同时对第一采样率进行多级降频处理,使本发明可以将接口采样数据快速的同步到音频子系统内部时钟
域下,方便复用各类信号处理模块,节省芯片面积和功耗,减少布局布线的难度和设计复杂
度。
[0025] 在本发明的实施例中,采样率(也称为采样速度或者采样频率)是指每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。
[0026] 在本发明的实施例中,对音频接口时钟域的频率数据进行处理,得到基于音频子系统时钟频率的第一采样率,包括将基于音频接口时钟域的频率数据转转换成基于音频子
系统时钟域的频率数据;对音频子系统时钟域的频率数据进行过采样处理,得到第一采样
率。在本发明的实施例中,第二采样率为音频接口时钟域的接口采样率。
[0027] 本发明通过将基于音频接口时钟域的频率数据转转换成基于音频子系统时钟域的频率数据,使音频接口时钟域的频率数据同步到音频子系统时钟域,进一步,使得后端语
音识别模块可以正常识别语音数据。
[0028] 本发明通过对音频接口时钟频率下频率数据直接进行基于音频子系统时钟频率的过采样处理,得到第一采样频率的数据,再进行三级低通滤波。使本发明可以改变噪声的
分布,也抑制了不同时钟域下数据转换带来的噪声,减少信号源在有用信号的带宽内自带
的噪声,同时也提高时域分辨力从而获得更好的时域波形;还提高滤波器的处理增益,提高
了信噪比。过采样处理也使本发明的采样率大于两倍音频接口时钟域的采样率,使本发明
不会使智能语音模块识别声音的精准度变差。
[0029] 在本发明的实施例中,过采样是指使用远大于奈奎斯特采样频率的频率对输入信号进行采样。设数字音频系统原来的采样频率为fs,通常为44.1kHz或48kHz。若将采样频率
提高到R×fs,R称为过采样比率,并且R>1。在这种采样的数字信号中,由于量化比特数没有
改变,故总的量化噪声功率也不变,但这时量化噪声的频谱分布发生了变化,即将原来均匀
分布在0 ~fs/2频带内的量化噪声分散到了0 ~ Rfs/2的频带上。
[0030] 在本发明的实施例中,对第一采样率进行多级降频处理,得到与音频接口时钟域的第二采样率相等的第三采样率,包括对第一采样率进行降频处理,得到第一级采样率;对
第一级采样率进行降频处理,得到第二级采样率;对第二级采样率进行降频处理,得到所述
第三采样率。
[0031] 在本发明的实施例中,本发明通过对第一采样率进行降频处理,得到第一级采样率;对第一级采样率进行降频处理,得到第二级采样率;对第二级采样率进行降频处理,得
到所述第三采样率;使本发明将第一采样率进行三级降频处理,进一步,加快了接口采样数
据同步到音频子系统内部时钟域下的速度,同时保持了智能语音模块识别声音的精准度。
[0032] 在本发明的实施例中,另一方面,本发明还提供了一种语音信号跨时钟域处理装置,包括异步采样率转换模块,用于将音频接口时钟域的频率数据进行处理,得到基于音频
子系统时钟频率的第一采样率;滤波模块,用于对所述第一采样率进行多级降频处理,得到
与音频接口时钟域的第二采样率相等的第三采样率。
[0033] 本发明通过异步采样率转换模块,实现了音频接口时钟域的频率进行处理,同时通过滤波模块,实现了第一采样率进行多级降频处理,使本发明节省芯片面积和功耗,减少
布局布线的难度和设计复杂度。
[0034] 在本发明的实施例中,异步采样率转换模块,包括转换单元,将基于音频接口时钟域的频率数据转转换成基于音频子系统时钟域的频率数据;过采样单元,对所述音频子系
统时钟域的频率数据进行过采样处理,得到所述第一采样率。在本实施例中,预设频率为异
步采样率转换模块的固定有频率;在其它的实施例中,预设频率也可以根据用户使用需求
而设定。
[0035] 本发明的异步采样率转换模块在其内部设置有转换单元和过采样单元,使本发明实现集中化,简单化,进一步,使本发明节省芯片面积和功耗,减少布局布线的难度和设计
复杂度。
[0036] 在本发明的实施例中,滤波模块,包括第一滤波单元,用于第一采样率进行降频处理,得到第一级采样率;第二滤波单元,用于第一级采样率进行降频处理,得到第二级采样
率;第三滤波单元,用于第二级采样率进行降频处理,得到第三采样率。在本实施中,第一滤
波单元、第二滤波单元和第三滤波单元均为低通滤波单元。
[0037] 在本发明的实施例中,另一方面,本发明还提供了一种智能语音芯片,包括:音频接口时钟域的接口、音频子系统时钟域的接口和实现上述方法的处理装置;处理装置包括
异步采样率转换器和多级滤波。
[0038] 在本发明的实施例中,音频接口时钟域的接口与异步采样率转换器连接;多级滤波器包括第一级滤波器、第二级滤波器、第三级滤波器;第一级滤波器与异步采样率转换器
连接,第一级滤波器通过第二级滤波器与第三级滤波器连接,第三级滤波器与所述音频子
系统时钟域的接口连接。
[0039] 为了更好诠释本发明,通过以下实施例进行说明。
[0040] 在使用外部接口时钟的接口(外部接口时钟的接口为音频接口时钟域的接口),如i2s tdm等等,下级增加asrc模块(asrc为异步采样率转换),本方案asrc具有两种时钟,一
个时钟同步于外部接口时钟,基于该时钟频率的数据采样率通常为16khz或者48khz采样
率,另一个时钟同步于音频子系统。可以通过asrc模块将采样频率提高到192khz,并且达到
数据从外部时钟域跨到音频子系统时钟域的目的。然后再通过三级滤波器将192Khz(此时
该采样率已经基于音频子系统时钟频率)降到16khz。三级滤波器包括第一级滤波器、第二
级滤波器、第三级滤波器,其中第一级滤波器将192khz降到96khz,第二级滤波器将96khz降
到48khz,第三级滤波器将48khz将到16khz。依照这个结构达到将接口输入的基于外部时钟
域的16khz采样频率或者48k hz采样频率的数据转换到基于音频子系统时钟域上来。
[0041] 本发明的工作原理:因为人工智能算法所需的语音信号并不是需要完全还原外部音频输入信号达到高保真的效果,如果输入到人工智能音频算法的语音数据不会降低人工
智能音频算法的精确度的话,可以认为该信号可以被接受。前期实验表明,通过本方案的结
构,人工智能音频算法精度没有受到任何影响,因此本发明的方法对语音人工智能算法有
着良好的匹配性。
[0042] 本发明可以处理接口数据相对于音频子系统时钟域的跨时钟域问题,可以尽早将接口采样数据同步到音频子系统内部时钟域,方便复用各类信号处理模块,节省芯片面积
和功耗,减少布局布线的难度和设计复杂度。
[0043] 应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何
修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨
在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修
改例。