音频处理方法及装置转让专利

申请号 : CN201610703661.X

文献号 : CN106328111B

文献日 : 2018-09-04

本发明是关于一种音频处理方法及装置，属于多媒体处理领域。所述方法包括：每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算所述音频帧的重采样比率；对所述音频帧进行第一滤波处理，得到第一处理音频帧；根据所述重采样比率，对所述第一处理音频帧进行重采样插值处理，得到第二处理音频帧；对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。由于在对待处理的音频信号进行滤波和重采样差值等处理后，可实现周期性改变基频频率，因此达到了颤音音效，使得普通歌唱爱好者正常发出的声音也可以达到颤音的效果，用户粘度高。

1.一种音频处理方法，其特征在于，所述方法包括：

每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算所述音频帧的重采样比率；

根据所述颤动振幅，计算所述音频帧的最大下采样率；

根据所述最大下采样率和所述音频帧的原始采样率，计算第一滤波衰减频率；

根据所述第一滤波衰减频率，对所述音频帧进行第一滤波处理，得到第一处理音频帧；

根据所述重采样比率，对所述第一处理音频帧进行重采样插值处理，得到第二处理音频帧；

对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。

2.根据权利要求1所述的方法，其特征在于，所述根据预设的颤动频率和颤动振幅，应用下述公式，计算所述音频帧的重采样比率，包括：αn＝1.0+A*sin(2π*fs*(n*N/Fs))其中，αn为所述音频帧的重采样比率，A为所述颤动振幅，fs为所述颤动频率，N为所述音频帧的时长，Fs为所述音频帧的原始采样率，n的取值为正整数，n为所述音频帧的帧号。

3.根据权利要求1所述的方法，其特征在于，所述根据所述最大下采样率和所述音频帧的原始采样率，应用下述公式，计算所述第一处理音频帧的第一滤波衰减频率，包括：fc1＝Fs/2*(1.0-A)

其中，fc1为所述第一滤波衰减频率，Fs为所述音频帧的原始采样率，1.0-A为所述最大下采样率。

4.根据权利要求1所述的方法，其特征在于，所述对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号，包括：根据所述颤动振幅，计算所述音频帧的最大上采样率；

根据所述最大上采样率和所述音频帧的原始采样率，计算第二滤波衰减频率；

根据所述第二滤波衰减频率，对所述第二处理音频帧进行第二滤波处理，得到颤音音频信号。

5.根据权利要求4所述的方法，其特征在于，所述根据所述最大上采样率和所述音频帧的原始采样率，应用下述公式，计算第二滤波衰减频率，包括：其中，fc2为所述第二滤波衰减频率，Fs为所述音频帧的原始采样率，1.0+A为所述最大上采样率。

6.一种音频处理装置，其特征在于，所述装置包括：

计算模块，被配置为每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算所述音频帧的重采样比率；

第一处理模块，被配置为根据所述颤动振幅，计算所述音频帧的最大下采样率；根据所述最大下采样率和所述音频帧的原始采样率，计算第一滤波衰减频率；根据所述第一滤波衰减频率，对所述音频帧进行第一滤波处理，得到第一处理音频帧；

第二处理模块，被配置为根据所述重采样比率，对所述第一处理音频帧进行重采样插值处理，得到第二处理音频帧；

第三处理模块，被配置为对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。

7.根据权利要求6所述的装置，其特征在于，所述计算模块，被配置为应用下述公式，计算所述音频帧的重采样比率：αn＝1.0+A*sin(2π*fs*(n*N/Fs))其中，αn为所述音频帧的重采样比率，A为所述颤动振幅，fs为所述颤动频率，N为所述音频帧的时长，Fs为所述音频帧的原始采样率，n的取值为正整数，n为所述音频帧的帧号。

8.根据权利要求6所述的装置，其特征在于，所述第一处理模块，被配置为根据所述最大下采样率和所述音频帧的原始采样率，应用下述公式，计算所述第一处理音频帧的第一滤波衰减频率：fc1＝Fs/2*(1.0-A)

其中，fc1为所述第一滤波衰减频率，Fs为所述音频帧的原始采样率，1.0-A为所述最大下采样率。

9.根据权利要求6所述的装置，其特征在于，所述第二处理模块，被配置为根据所述颤动振幅，计算所述音频帧的最大上采样率；根据所述最大上采样率和所述音频帧的原始采样率，计算第二滤波衰减频率；根据所述第二滤波衰减频率，对所述第二处理音频进行第二滤波处理，得到颤音音频信号。

10.根据权利要求9所述的装置，其特征在于，所述第二处理模块，被配置为根据所述最大上采样率和所述音频帧的原始采样率，应用下述公式，计算第二滤波衰减频率：其中，fc2为所述第二滤波衰减频率，Fs为所述音频帧的原始采样率，1.0+A为所述最大上采样率。

音频处理方法及装置

技术领域

[0001] 本发明涉及多媒体处理领域，特别涉及一种音频处理方法及装置。

背景技术

[0002] 人类歌唱活动在发展到一定高度后，逐渐加入了各种歌唱技巧，进而形成了各国各民族丰富多彩的声乐文化。在歌唱中，人们通过声带发出一系列频率、振幅各不相同的振动，这些振动经过复合形成声音。在这些振动中有一个频率最低的振动，由它发出的音便是基音。基音的频率为基频，决定整个音的音高。在各种歌唱技巧中，颤音是近几年较为流行的一种歌唱技巧。其中，颤音是指歌声呈波浪式活动，又称音波，是一种较高级的唱歌技巧。颤音产生的原理为当气息通过声带发出声音时，歌唱者有意识地将之振动，使声带振动频率以一定频率围绕基频来回振动，进而实现任意颤动振幅和颤动频率的颤音生成。但是对于未经过声乐练习的普通歌唱爱好者来说，很难通过自己的声带振动达到颤音的效果。因此亟需一种音频处理方法，使得普通歌唱爱好者正常发出的声音也可以达到颤音的效果。

发明内容

[0003] 为克服现有技术中存在的问题，本发明提供一种音频处理方法及装置。

[0004] 根据本发明实施例的第一方面，提供一种音频处理方法，包括：

[0005] 每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算所述音频帧的重采样比率；

[0006] 对所述音频帧进行第一滤波处理，得到第一处理音频帧；

[0007] 根据所述重采样比率，对所述第一处理音频帧进行重采样插值处理，得到第二处理音频帧；

[0008] 对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。

[0009] 可选地，所述根据预设的颤动频率和颤动振幅，应用下述公式，计算所述音频帧的重采样比率，包括：

[0010] αn＝1.0+A*sin(2π*fs*(n*N/Fs))

[0011] 其中，αn为所述音频帧的重采样比率，A为所述颤动振幅，fs为所述颤动频率，N为所述音频帧的时长，Fs为所述音频帧的原始采样率，n的取值为正整数，n为所述音频帧的帧号。

[0012] 可选地，所述对所述音频帧进行第一滤波处理，得到第一处理音频帧，包括：

[0013] 根据所述颤动振幅，计算所述音频帧的最大下采样率；

[0014] 根据所述最大下采样率和所述音频帧的原始采样率，计算第一滤波衰减频率；

[0015] 根据所述第一滤波衰减频率，对所述音频帧进行第一滤波处理，得到第一处理音频帧。

[0016] 可选地，所述根据所述最大下采样率和所述音频帧的原始采样率，应用下述公式，计算所述第一处理音频帧的第一滤波衰减频率，包括：

[0017] fc1＝Fs/2*(1.0-A)

[0018] 其中，fc1为所述第一滤波衰减频率，Fs为所述音频帧的原始采样率，1.0-A为所述最大下采样率。

[0019] 可选地，所述对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号，包括：

[0020] 根据所述颤动振幅，计算所述音频帧的最大上采样率；

[0021] 根据所述最大上采样率和所述音频帧的原始采样率，计算第二滤波衰减频率；

[0022] 根据所述第二滤波衰减频率，对所述第二处理音频进行第二滤波处理，得到颤音音频信号。

[0023] 可选地，所述根据所述最大上采样率和所述音频帧的原始采样率，应用下述公式，计算第二滤波衰减频率，包括：

[0024]

[0025] 其中，fc2为所述第二滤波衰减频率，Fs为所述音频帧的原始采样率，1.0+A为所述最大上采样率。

[0026] 根据本发明实施例的第二方面，提供一种音频处理装置，包括：

[0027] 计算模块，被配置为每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算所述音频帧的重采样比率；

[0028] 第一处理模块，被配置为对所述音频帧进行第一滤波处理，得到第一处理音频帧；

[0029] 第二处理模块，被配置为根据所述重采样比率，对所述第一处理音频帧进行重采样插值处理，得到第二处理音频帧；

[0030] 第三处理模块，被配置为对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。

[0031] 可选地，所述计算模块，被配置为应用下述公式，计算所述音频帧的重采样比率：

[0032] αn＝1.0+A*sin(2π*fs*(n*N/Fs))

[0033] 其中，αn为所述音频帧的重采样比率，A为所述颤动振幅，fs为所述颤动频率，N为所述音频帧的时长，Fs为所述音频帧的原始采样率，n的取值为正整数，n为所述音频帧的帧号。

[0034] 可选地，所述第一处理模块，被配置为根据所述颤动振幅，计算所述音频帧的最大下采样率；根据所述最大下采样率和所述音频帧的原始采样率，计算第一滤波衰减频率；根据所述第一滤波衰减频率，对所述音频帧进行第一滤波处理，得到第一处理音频帧。

[0035] 可选地，所述第一处理模块，被配置为根据所述最大下采样率和所述音频帧的原始采样率，应用下述公式，计算所述第一处理音频帧的第一滤波衰减频率：

[0036] fc1＝Fs/2*(1.0-A)

[0037] 其中，fc1为所述第一滤波衰减频率，Fs为所述音频帧的原始采样率，1.0-A为所述最大下采样率。

[0038] 可选地，所述第二处理模块，被配置为根据所述颤动振幅，计算所述音频帧的最大上采样率；根据所述最大上采样率和所述音频帧的原始采样率，计算第二滤波衰减频率；根据所述第二滤波衰减频率，对所述第二处理音频进行第二滤波处理，得到颤音音频信号。

[0039] 可选地，所述第二处理模块，被配置为根据所述最大上采样率和所述音频帧的原始采样率，应用下述公式，计算第二滤波衰减频率：

[0040]

[0041] 其中，fc2为所述第二滤波衰减频率，Fs为所述音频帧的原始采样率，1.0+A为所述最大上采样率。

[0042] 本发明的实施例提供的技术方案可以包括以下有益效果：

[0043] 在每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率，并对该音频帧进行第一滤波处理，得到第一处理音频帧；之后，根据该重采样比率对第一处理音频帧进行重采样插值处理，得到第二处理音频帧；接下来，对得到的第二处理音频帧进行第二滤波处理，进而得到颤音音频信号。由于在对待处理的音频信号进行滤波和重采样差值等处理后，可实现周期性改变基频频率，因此达到了颤音音效，使得普通歌唱爱好者正常发出的声音也可以达到颤音的效果，用户粘度高。

[0044] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

[0045] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

[0046] 图1是根据一示例性实施例示出的一种音频处理方法的流程图；

[0047] 图2是根据一示例性实施例示出的一种音频处理方法的流程图；

[0048] 图3是根据一示例性实施例示出的一种音频处理装置的框图；

[0049] 图4是根据一示例性实施例示出的一种音频处理装置的框图。

具体实施方式

[0050] 这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

[0051] 图1是根据一示例性实施例示出的一种音频处理方法的流程图，如图1所示，包括以下步骤。

[0052] 在步骤101中，每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率。

[0053] 在步骤102中，对该音频帧进行第一滤波处理，得到第一处理音频帧。

[0054] 在步骤103中，根据该重采样比率，对该第一处理音频帧进行重采样插值处理，得到第二处理音频帧。

[0055] 在步骤104中，对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。

[0056] 本发明实施例提供的方法，在每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率，并对该音频帧进行第一滤波处理，得到第一处理音频帧；之后，根据该重采样比率对第一处理音频帧进行重采样插值处理，得到第二处理音频帧；接下来，对得到的第二处理音频帧进行第二滤波处理，进而得到颤音音频信号。由于在对待处理的音频信号进行滤波和重采样差值等处理后，可实现周期性改变基频频率，因此达到了颤音音效，使得普通歌唱爱好者正常发出的声音也可以达到颤音的效果，用户粘度高。

[0057] 可选地，根据预设的颤动频率和颤动振幅，应用下述公式，计算该音频帧的重采样比率，包括：

[0058] αn＝1.0+A*sin(2π*fs*(n*N/Fs))

[0059] 其中，αn为该音频帧的重采样比率，A为该颤动振幅，fs为该颤动频率，N为该音频帧的时长，Fs为该音频帧的原始采样率，n的取值为正整数，n为该音频帧的帧号。

[0060] 可选地，对该音频帧进行第一滤波处理，得到第一处理音频帧，包括：

[0061] 根据该颤动振幅，计算该音频帧的最大下采样率；

[0062] 根据该最大下采样率和该音频帧的原始采样率，计算第一滤波衰减频率。

[0063] 可选地，根据该最大下采样率和该音频帧的原始采样率，应用下述公式，计算该第一处理音频帧的第一滤波衰减频率，包括：

[0064] fc1＝Fs/2*(1.0-A)

[0065] 其中，fc1为该第一滤波衰减频率，Fs为该音频帧的原始采样率，1.0-A为该最大下采样率。

[0066] 可选地，对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号，包括：

[0067] 根据该颤动振幅，计算该音频帧的最大上采样率；

[0068] 根据该最大上采样率和该音频帧的原始采样率，计算第二滤波衰减频率；

[0069] 根据该第二滤波衰减频率，对该第二处理音频进行第二滤波处理，得到颤音音频信号。

[0070] 可选地，根据该最大上采样率和该音频帧的原始采样率，应用下述公式，计算第二滤波衰减频率，包括：

[0071]

[0072] 其中，fc2为该第二滤波衰减频率，Fs为该音频帧的原始采样率，1.0+A为该最大上采样率。

[0073] 上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

[0074] 图2是根据一示例性实施例示出的一种音频处理方法的流程图。如图2所示，包括以下步骤。

[0075] 在步骤201中，每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率。

[0076] 在本发明实施例中，该音频帧为实时接收的且时长等于预设时长的音频信号。其中，预设时长为预先设置时长限制，实时接收的音频帧时长等于预设时长即可被处理，该音频帧由用户自行输入。比如用户实时输入音频信号，即在歌唱的过程中，边唱边进行颤音处理。在用户开始歌唱后，若实时接收的音频信号时长等于预设时长，则该时长等于预设时长的音频信号被作为第一个音频帧进行处理。例如，预设时长为10ms，则当接收到的用户输入的音频信号时长达到10ms时，将该10ms的音频信号作为第一个音频帧，之后立马对该第一个音频帧进行颤音处理。继续接收用户输入的音频信号，当接收到的用户输入的音频信号时长再次达到10ms时，则将该时长为10ms的音频信号作为第二个音频帧，以此类推。

[0077] 在另一个实施例中，处理可以实时接收音频信号并实时进行颤音处理外，本发明实施例还可以接收用户输入的一段固定时长的音频信号，并将该音频信号作为待处理音频信号，对该待处理音频信号进行划分后再处理。例如，如果待处理的音频信号的时长在10s～50s之间，预设时长为5ms，即对音频信号分帧为时长大小为5ms的至少一个音频帧；如果待处理的音频信号的时长在50s～100s之间，预设时长为10ms，即对音频信号分帧为时长大小为10ms的至少一个音频帧。本发明实施例对预设时长、不同时长的音频信号对应的预设时长大小均不进行具体限定。

[0078] 在步骤202中，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率。

[0079] 在本发明实施例中，对接收到的每一个音频帧，根据预设的颤动频率和颤动振幅，应用下述公式一，计算该音频帧的重采样比率。其中公式一如下：

[0080] αn＝1.0+A*sin(2π*fs*(n*N/Fs))

[0081] 其中，αn为该音频帧的重采样比率，即αn为重采样率与原始采样率的比值，A为该颤动振幅，fs为该颤动频率，N为该音频帧的时长，Fs为该音频帧的原始采样率，n的取值为正整数，n为该音频帧的帧号。其中时长为该音频帧的持续时长大小。

[0082] 其中，预设的颤动频率和颤动振幅由用户根据需要自行设置。比如，终端会预置包含颤音部分的歌曲进行示例，并标注颤音部分的颤动频率及颤动振幅，以供用户根据示例选择自己想要的颤音效果。例如，预置的歌曲A在2分19秒至2分56秒处实现了颤音效果，标注颤动频率为5Hz，颤动振幅为0.018。另外，终端也会配置输入框，输入框包括颤动频率及颤动振幅，用户可以根据需要直接在颤动频率及颤动振幅对应的输入框中输入自己想要的数值。例如，如果用户需要设定颤动频率为8Hz，颤动振幅为0.016，则在输入框对应输入上述数值即可。其中，本发明实施例对设置颤动频率及颤动振幅的方式不进行具体限定。

[0083] 在步骤203中，对该音频帧进行第一滤波处理，得到第一处理音频帧。

[0084] 在本发明实施例中，根据第一滤波衰减频率对该音频帧进行第一滤波处理，得到第一处理音频帧。其中，该第一滤波衰减频率为应用下述公式二，根据该最大下采样率和该音频帧的原始采样率计算得出的：

[0085] fc1＝Fs/2*(1.0-A)

[0086] 其中，fc1为该第一滤波衰减频率，Fs为该音频帧的原始采样率，1.0-A为该最大下采样率。

[0087] 该第一滤波处理为根据第一滤波衰减频率的低通滤波处理。在低通滤波的过程中，为了防止下采样造成的频谱混叠现象，所以本发明实施例会计算第一滤波衰减频率，根据第一滤波衰减频率对该音频帧进行第一滤波处理，以避免该音频帧发生频谱混叠的现象。

[0088] 在步骤204中，根据重采样比率，对该第一处理音频帧进行重采样插值处理，得到第二处理音频帧。

[0089] 在本发明实施例中，重采样比率是用来实现对音频信号的重采样的。其中，对音频信号进行重采样后，仍以原采样率进行播放、存储，其播放时长会有所变化，同时基频也会做相应的改变。例如，将原采样率22K的2倍数值大小作为重采样比率，根据44K采样率对音频信号进行重采样，但音频仍以原采样率22K进行播放，则播放时长会变为原来播放时长的2倍，同时基频也会降为原来的一半。即重采样会引起音频信号变速变调。由于颤音的生成要求是音频信号的变调不变速，因此通过对待处理的音频信号进行滤波和重采样等处理，实现周期性地改变基频频率，使基频以一定频率来回振动，利用颤音要求的音高周期性振动来实现振动周期内的变调不变速，实现任意颤动振幅和颤动频率的颤音生成。使未经声乐练习的普通歌唱爱好者能够通过音效处理制作出带有颤音的作品。其中，本发明实施例对变调不变速的方法不进行具体限定。

[0090] 重采样插值用来填充该第一处理音频帧在第一滤波处理时音频帧之间的空隙。利用重采样插值，可以通过第一处理音频帧在有限个音频帧处的状态，估计出该第一处理音频帧在其他音频帧处的近似状态。在该第一处理音频帧的基础上，补插音频帧，使得该第一处理音频帧完整。其中，可根据实际的需求，选用不同的重采样插值方法，例如，线性插值、三次样条曲线插值、拉格朗日插值等方法。本发明实施例对重采样插值方法不进行具体限定。

[0091] 在步骤205中，根据第二滤波衰减频率对该第二处理音频帧进行第二滤波处理，得到颤音音频信号。

[0092] 其中，该第二滤波衰减频率为应用下述公式三，根据最大上采样率和该音频帧的原始采样率计算得出的：

[0093]

[0094] 其中，fc2为该第二滤波衰减频率，Fs为该音频帧的原始采样率，1.0+A为该最大上采样率。

[0095] 该第二滤波处理为根据第二滤波衰减频率的低通滤波处理。在低通滤波的过程中，为了防止上采样造成的频谱镜像现象，本发明实施例会计算第二滤波衰减频率，根据该第二滤波衰减频率对该音频帧进行第二滤波处理，以避免该音频帧发生频谱镜像的现象。需要说明的是，经验上(1+A)的取值不宜超过半个半音，否则容易导致走调。由于1个八度包含十二个半音，因此半个半音的计算公式为2^(0.5/12)＝1.0293，其中^表示幂运算。故A的取值最好不要超过0.0293。

[0096] 需要说明的是，对于每一个音频帧均采取上述步骤203至步骤206所示的方式进行处理，之后便可得到用户输入的音频信号对应的颤音音频信号，实现自动为正常没有颤音音效的音频信号增加颤音音效。此外上述音频处理方法可由终端自行完成。此外，受限于终端的处理能力限制，终端还可将待处理的音频信号发送至服务器进行处理，由服务器对待处理的音频信号进行音频处理，得到颤音音频信号，之后再将颤音音频信号返回给终端，本发明实施例对音频处理的执行主体不进行具体限定。

[0097] 本发明实施例提供的方法，在每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率，并对该音频帧进行第一滤波处理，得到第一处理音频帧；之后，根据该重采样比率对第一处理音频帧进行重采样插值处理，得到第二处理音频帧；接下来，对得到的第二处理音频帧进行第二滤波处理，进而得到颤音音频信号。由于在对待处理的音频信号进行滤波和重采样差值等处理后，可实现周期性改变基频频率，因此达到了颤音音效，使得普通歌唱爱好者正常发出的声音也可以达到颤音的效果，用户粘度高。

[0098] 图3是根据一示例性实施例示出的一种音频处理装置的框图。参照图3，该装置包括：计算模块301，第一处理模块302，第二处理模块303，第三处理模块304。

[0099] 该计算模块301，被配置为每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算所述音频帧的重采样比率；

[0100] 该第一处理模块302，被配置为对所述音频帧进行第一滤波处理，得到第一处理音频帧；

[0101] 该第二处理模块303，被配置为根据所述重采样比率，对所述第一处理音频帧进行重采样插值处理，得到第二处理音频帧；

[0102] 该第三处理模块304，被配置为对得到的第二处理音频帧进行第二滤波处理，得到颤音音频信号。

[0103] 可选地，该计算模块301，被配置为应用下述公式，计算所述音频帧的重采样比率：

[0104] αn＝1.0+A*sin(2π*fs*(n*N/Fs))

[0105] 其中，αn为所述音频帧的重采样比率，A为所述颤动振幅，fs为所述颤动频率，N为所述音频帧的时长，Fs为所述音频帧的原始采样率，n的取值为正整数，n为该音频帧的帧号。

[0106] 可选地，该第一处理模块302，被配置为根据所述颤动振幅，计算所述音频帧的最大下采样率；根据所述最大下采样率和所述音频帧的原始采样率，计算第一滤波衰减频率；根据所述第一滤波衰减频率，对所述音频帧进行第一滤波处理，得到第一处理音频帧。

[0107] 可选地，该第一处理模块302，被配置为根据所述最大下采样率和所述音频帧的原始采样率，应用下述公式，计算所述第一处理音频帧的第一滤波衰减频率：

[0108] fc1＝Fs/2*(1.0-A)

[0109] 其中，fc1为所述第一滤波衰减频率，Fs为所述音频帧的原始采样率，1.0-A为所述最大下采样率。

[0110] 可选地，该第二处理模块303，被配置为根据所述颤动振幅，计算所述音频帧的最大上采样率；根据所述最大上采样率和所述音频帧的原始采样率，计算第二滤波衰减频率；根据所述第二滤波衰减频率，对所述第二处理音频进行第二滤波处理，得到颤音音频信号。

[0111] 可选地，该第二处理模块303，被配置为根据所述最大上采样率和所述音频帧的原始采样率，应用下述公式，计算第二滤波衰减频率：

[0112]

[0113] 其中，fc2为所述第二滤波衰减频率，Fs为所述音频帧的原始采样率，1.0+A为所述最大上采样率。

[0114] 本发明实施例提供的装置，在每接收到一个音频帧后，根据预设的颤动频率和颤动振幅，计算该音频帧的重采样比率，并对该音频帧进行第一滤波处理，得到第一处理音频帧；之后，根据该重采样比率对第一处理音频帧进行重采样插值处理，得到第二处理音频帧；接下来，对得到的第二处理音频帧进行第二滤波处理，进而得到颤音音频信号。由于在对待处理的音频信号进行滤波和重采样差值等处理后，可实现周期性改变基频频率，因此达到了颤音音效，使得普通歌唱爱好者正常发出的声音也可以达到颤音的效果，用户粘度高。

[0115] 关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

[0116] 图4是根据一示例性实施例示出的一种音频处理装置400的框图。例如，装置400可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

[0117] 参照图4，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电源组件406，多媒体组件408，音频组件410，I/O(Input/Output，输入/输出)的接口412，传感器组件414，以及通信组件416。

[0118] 处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理组件402可以包括多媒体模块，以方便多媒体组件408和处理组件402之间的交互。

[0119] 存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如SRAM(Static Random Access Memory，静态随机存取存储器)，EEPROM(Electrically-Erasable Programmable Read-Only Memory，电可擦除可编程只读存储器)，EPROM(Erasable Programmable Read Only Memory，可擦除可编程只读存储器)，PROM(Programmable Read-Only Memory，可编程只读存储器)，ROM(Read-Only Memory，只读存储器)，磁存储器，快闪存储器，磁盘或光盘。

[0120] 电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电力相关联的组件。

[0121] 多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括LCD(Liquid Crystal Display，液晶显示器)和TP(Touch Panel，触摸面板)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

[0122] 音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个MIC(Microphone，麦克风)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

[0123] I/O接口412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

[0124] 传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到设备400的打开/关闭状态，组件的相对定位，例如组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS(Complementary Metal Oxide Semiconductor，互补金属氧化物)或CCD(Charge-coupled Device，电荷耦合元件)图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

[0125] 通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。
在一个示例性实施例中，所述通信组件416还包括NFC(Near Field Communication，近场通信)模块，以促进短程通信。例如，在NFC模块可基于RFID(Radio Frequency Identification，射频识别)技术，IrDA(Infra-red Data Association，红外数据协会)技术，UWB(Ultra Wideband，超宽带)技术，BT(Bluetooth，蓝牙)技术和其他技术来实现。

[0126] 在示例性实施例中，装置400可以被一个或多个ASIC(Application Specific Integrated Circuit，应用专用集成电路)、DSP(Digital signal Processor，数字信号处理器)、DSPD(Digital signal Processor Device，数字信号处理设备)、PLD(Programmable Logic Device，可编程逻辑器件)、FPGA)(Field Programmable Gate Array，现场可编程门阵列)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

[0127] 在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、RAM(Random Access Memory，随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory，光盘只读存储器)、磁带、软盘和光数据存储设备等。

[0128] 一种非临时性计算机可读存储介质，当所述存储介质中的指令由音频处理装置的处理器执行时，使得该装置能够执行上述音频处理方法。

[0129] 本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

[0130] 应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

音频处理方法及装置转让专利

申请号 : CN201610703661.X

文献号 : CN106328111B

文献日 : 2018-09-04

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 肖纯智

申请人 : 广州酷狗计算机科技有限公司

摘要 :

权利要求 :

说明书 :