音频信号处理装置和音频信号滤波方法转让专利

申请号 : CN201580076232.8

文献号 : CN107258090B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 耶塞妮娅·拉库蒂尔·帕罗蒂

申请人 : 华为技术有限公司

摘要 :

本发明涉及一种音频信号处理装置(100),包括:确定器(101),用于基于声学传递函数矩阵H和目标声学传递函数矩阵VH确定滤波矩阵C,其中,所述声学传递函数矩阵H包括扬声器和收听者之间的声学传播路径的传递函数,所述目标声学传递函数矩阵VH包括目标声学传播路径的目标传递函数,所述目标声学传播路径由虚拟扬声器位置相对于所述收听者的目标布置来定义;滤波器(103),用于基于所述滤波矩阵C对所述输入音频信号进行滤波以获取滤波输入音频信号;合路器(105),用于合并所述滤波输入音频信号以获取输出音频信号。

权利要求 :

1.一种音频信号处理装置(100),用于对左声道输入音频信号(L)进行滤波以获取左声道输出音频信号(X1),以及用于对右声道输入音频信号(R)进行滤波以获取右声道输出音频信号(X2),所述左声道输出音频信号(X1)和所述右声道输出音频信号(X2)通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数矩阵(H)定义,其特征在于,所述音频信号处理装置包括:确定器(101),用于基于所述声学传递函数矩阵(H)和目标声学传递函数矩阵(VH)确定滤波矩阵(C),其中,所述目标声学传递函数矩阵(VH)包括目标声学传播路径的目标传递函数,所述目标声学传播路径由虚拟扬声器位置相对于所述收听者的目标布置来定义,所述声学传递函数矩阵H和所述滤波矩阵C的乘积等于由所述虚拟扬声器位置相对于所述收听者的目标布置定义的所述目标声学传递函数矩阵VH;

滤波器(103),用于:基于所述滤波矩阵(C)对所述左声道输入音频信号(L)进行滤波,以获取第一滤波左声道输入音频信号(107)和第二滤波左声道输入音频信号(109),以及基于所述滤波矩阵(C)对所述右声道输入音频信号(R)进行滤波,以获取第一滤波右声道输入音频信号(111)和第二滤波右声道输入音频信号(113);以及合路器(105),用于:合并所述第一滤波左声道输入音频信号(107)和所述第一滤波右声道输入音频信号(111),以获取所述左声道输出音频信号(X1),并合并所述第二滤波左声道输入音频信号(109)和所述第二滤波右声道输入音频信号(113),以获取所述右声道输出音频信号(X2)。

2.如权利要求1所述的音频信号处理装置(100),其特征在于,所述确定器(101)用于根据以下等式基于所述声学传递函数矩阵(H)和所述目标声学传递函数矩阵(VH)确定所述滤波矩阵(C):C=(HH·H+β(ω)I)-1(HH·VH)e-jωM,

其中,HH表示所述声学传递函数矩阵(H)的厄米特转置,I表示单位矩阵,β表示正则化因子,M表示建模时延,ω表示角频率。

3.如权利要求1所述的音频信号处理装置(100),其特征在于,所述确定器(101)用于根据以下等式基于所述声学传递函数矩阵(H)和所述目标声学传递函数矩阵(VH)确定所述滤波矩阵(C):C=(HH·H)-1(HH·VH)e-jωM,

其中,HH表示所述声学传递函数矩阵(H)的厄米特转置,M表示建模时延,ω表示角频率。

4.如权利要求1所述的音频信号处理装置(100),其特征在于,所述确定器(101)用于根据以下等式基于所述声学传递函数矩阵(H)和所述目标声学传递函数矩阵(VH)确定所述滤波矩阵(C):H -1 H -jωM

C=(H·H+β(ω)l) (H·phase(VH))e ,

其中,HH表示所述声学传递函数矩阵(H)的厄米特转置,I表示单位矩阵,β表示正则化因子,M表示建模时延,ω表示角频率,phase(A)表示返回只包含矩阵A的元素的相位分量的矩阵的矩阵运算。

5.如权利要求1所述的音频信号处理装置(100),其特征在于,所述确定器(101)用于根据以下等式基于所述声学传递函数矩阵(H)和所述目标声学传递函数矩阵(VH)确定所述滤波矩阵(C):C=(HH·H)-1(HH·phase(VH))e-jωM,

其中,HH表示所述声学传递函数矩阵(H)的厄米特转置,M表示建模时延,ω表示角频率,phase(A)表示返回只包含矩阵A的元素的相位分量的矩阵的矩阵运算。

6.如前述权利要求中任一项所述的音频信号处理装置(100),其特征在于,所述左声道输出音频信号(X1)将通过左扬声器和所述收听者的左耳之间的第一声学传播路径以及所述左扬声器和所述收听者的右耳之间的第二声学传播路径进行传输,所述右声道输出音频信号(X2)将通过右扬声器和所述收听者的右耳之间的第三声学传播路径以及所述右扬声器和所述收听者的左耳之间的第四声学传播路径进行传输,所述第一声学传播路径的第一传递函数、所述第二声学传播路径的第二传递函数、所述第三声学传播路径的第三传递函数以及所述第四声学传播路径的第四传递函数形成所述声学传递函数矩阵(H)。

7.如前述权利要求1至5中任一项所述的音频信号处理装置(100),其特征在于,所述目标声学传递函数矩阵(VH)包括虚拟左扬声器位置和所述收听者的左耳之间的第一目标声学传播路径的第一目标传递函数、所述虚拟左扬声器位置和所述收听者的右耳之间的第二目标声学传播路径的第二目标传递函数、虚拟右扬声器位置和所述收听者的右耳之间的第三目标声学传播路径的第三目标传递函数以及所述虚拟右扬声器位置和所述收听者的左耳之间的第四目标声学传播路径的第四目标传递函数。

8.如前述权利要求1至5中任一项所述的音频信号处理装置(100),其特征在于,所述确定器(101)还用于从数据库中检索所述声学传递函数矩阵(H)或者所述目标声学传递函数矩阵(VH)。

9.如前述权利要求1至5中任一项所述的音频信号处理装置(100),其特征在于,所述合路器(105)用于:将所述第一滤波左声道输入音频信号(107)和所述第一滤波右声道输入音频信号(111)相加,以获取所述左声道输出音频信号(X1),并将所述第二滤波左声道输入音频信号(109)和所述第二滤波右声道输入音频信号(113)相加,以获取所述右声道输出音频信号(X2)。

10.如前述权利要求1至5中任一项所述的音频信号处理装置(100),其特征在于,所述装置还包括:

分解器(315),用于:将所述左声道输入音频信号(L)分解成主左声道输入音频子信号和次左声道输入音频子信号,并将所述右声道输入音频信号(R)分解成主右声道输入音频子信号和次右声道输入音频子信号,其中所述主左声道输入音频子信号和所述主右声道输入音频子信号分配给主预定频段,所述次左声道输入音频子信号和所述次右声道输入音频子信号分配给副预定频段;以及延时器(317),用于:将所述次左声道输入音频子信号延迟一个时延以获取次左声道输出音频子信号,并将所述次右声道输入音频子信号延迟另一个时延以获取次右声道输出音频子信号;

其中,所述滤波器(103)用于:基于所述滤波矩阵(C)对所述主左声道输入音频子信号进行滤波,以获取第一滤波主左声道输入音频子信号和第二滤波主左声道输入音频子信号,并基于所述滤波矩阵(C)对所述主右声道输入音频子信号进行滤波,以获取第一滤波主右声道输入音频子信号和第二滤波主右声道输入音频子信号;

其中,所述合路器(105)用于:合并所述第一滤波主左声道输入音频子信号、所述第一滤波主右声道输入音频子信号和所述次左声道输入音频子信号,以获取所述左声道输出音频信号(X1),并合并所述第二滤波主左声道输入音频子信号、所述第二滤波主右声道输入音频子信号和所述次右声道输入音频子信号,以获取所述右声道输出音频信号(X2)。

11.如权利要求10所述的音频信号处理装置(100),其特征在于,所述分解器(315)是音频交叉网络。

12.如前述权利要求1至5中任一项所述的音频信号处理装置,其特征在于,所述左声道输入音频信号(L)由多声道输入音频信号的前左声道输入音频信号形成,所述右声道输入音频信号(R)由所述多声道输入音频信号的前右声道输入音频信号形成,所述左声道输出音频信号(X1)由前左声道输出音频信号形成,所述右声道输出音频信号(X2)由前右声道输出音频信号形成;或者,所述左声道输入音频信号(L)由多声道输入音频信号的后左声道输入音频信号形成,所述右声道输入音频信号(R)由所述多声道输入音频信号的后右声道输入音频信号形成,所述左声道输出音频信号(X1)由后左声道输出音频信号形成,所述右声道输出音频信号(X2)由后右声道输出音频信号形成。

13.如权利要求12所述的音频信号处理装置,其特征在于,所述多声道输入音频信号包括中央声道输入音频信号,所述合路器(105)用于:合并所述中央声道输入音频信号、所述前左声道输出音频信号和所述后左声道输出音频信号,并合并所述中央声道输入音频信号、所述前右声道输出音频信号和所述后右声道输出音频信号。

14.一种音频信号处理方法(200),用于对左声道输入音频信号(L)进行滤波以获取左声道输出音频信号(X1),以及用于对右声道输入音频信号(R)进行滤波以获取右声道输出音频信号(X2),所述左声道输出音频信号(X1)和所述右声道输出音频信号(X2)通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数矩阵(H)定义,其特征在于,所述音频信号处理方法包括以下步骤:基于所述声学传递函数矩阵(H)和目标声学传递函数矩阵(VH)确定滤波矩阵(C),其中,所述目标声学传递函数矩阵(VH)包括目标声学传播路径的目标传递函数,所述目标声学传播路径由多个虚拟扬声器位置相对于所述收听者的目标布置来定义,所述声学传递函数矩阵H和所述滤波矩阵C的乘积等于由所述虚拟扬声器位置相对于所述收听者的目标布置定义的所述目标声学传递函数矩阵VH;

基于所述滤波矩阵(C)对所述左声道输入音频信号(L)进行滤波,以获取第一滤波左声道输入音频信号和第二滤波左声道输入音频信号,并基于所述滤波矩阵(C)对所述右声道输入音频信号(R)进行滤波,以获取第一滤波右声道输入音频信号和第二滤波右声道输入音频信号;以及合并所述第一滤波左声道输入音频信号和所述第一滤波右声道输入音频信号,以获取所述左声道输出音频信号(X1),并合并所述第二滤波左声道输入音频信号和所述第二滤波右声道输入音频信号,以获取所述右声道输出音频信号(X2)。

说明书 :

音频信号处理装置和音频信号滤波方法

技术领域

[0001] 本发明涉及音频信号处理领域。特别地,本发明涉及一种音频信号处理装置和音频信号滤波方法,用以创建虚拟声音图像。

背景技术

[0002] 减少音频信号内的串扰对于多数应用来说具有重要意义。例如,当使用扬声器为收听者重现双声道音频信号时,收听者的右耳通常也会听到收听者的左耳所要听到的音频信号。该效果表示为串扰,其可通过向用于对音频信号进行滤波的音频重现链中添加逆滤波器来降低。逆滤波器在本领域中也称为串扰消除单元。
[0003] 在数学上,用于实现串扰消除的逆滤波器可以表达为串扰消除滤波矩阵C。串扰消除的目的是,通过使串扰消除滤波矩阵C与声学传递函数(Acoustic Transfer Function,简称ATF)矩阵H的矩阵相乘的结果约等于单位矩阵I,即H*C≈I,来选择串扰消除滤波矩阵C,更具体地是选择其元素,其中,ATF矩阵H由从扬声器到收听者的各个耳朵的传递函数来定义。
[0004] 找到精确的串扰消除解决方案是不可能的,但却可以应用近似方案。因为逆滤波器通常不稳定,所以这些近似方案使用正则化以便控制串扰消除滤波器的增益并减少动态范围损失。然而,由于病态性,逆滤波器对误差很敏感。换句话说,重现链中的小误差能够导致重现点处的大误差,导致如Takeuchi,T.和Nelson,P.A.在ASA期刊112(6),2002中的《用于扬声器上的双声道合成的最佳来源分布》所描述的狭窄的最佳听音位置和非期望的音染。
[0005] 在本领域中,音频系统为众所周知,其将串扰消除单元与双声道化单元相结合,用于提供无串扰的虚拟环绕声,即收听者感知到的在虚拟扬声器位置处产生的无串扰声音。然而,这种双声道化单元通常会引入不可避免的小误差,这些误差随后会被非完全串扰消除单元放大从而导致更多的音染和错误的空间感知。

发明内容

[0006] 本发明的目的在于提供一种用于提供基本无串扰的虚拟环绕声的改进概念。
[0007] 该目的是通过独立权利要求的主旨实现的。根据从属权利要求、说明书和附图,进一步的实施形式显而易见。
[0008] 本发明以解决串扰问题的理念为基础,不是通过串扰消除阶段和双声道化阶段的易错序列化,而是通过采用串扰消除阶段来将一组期望的虚拟扬声器位置作为目标,而非试图直接消除来自真实扬声器的串扰。这样,在渲染准确的虚拟环绕声和良好音质时,就不需要传统使用的双声道化阶段,从而也避免了错误序列化。
[0009] 第一方面,本发明提供了一种音频信号处理装置,用于对左声道输入音频信号进行滤波以获取左声道输出音频信号,以及用于对右声道输入音频信号进行滤波以获取右声道输出音频信号,所述左声道输出音频信号和所述右声道输出音频信号通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数(Acoustic Transfer Function,简称ATF)矩阵H定义,所述音频信号处理装置包括:确定器,用于基于所述ATF矩阵H和目标ATF矩阵VH确定滤波矩阵C,其中,所述目标ATF矩阵VH包括目标声学传播路径的目标传递函数,所述目标声学传播路径由虚拟扬声器位置相对于所述收听者的目标布置来定义;滤波器,用于:基于所述滤波矩阵C对所述左声道输入音频信号进行滤波,以获取第一滤波左声道输入音频信号和第二滤波左声道输入音频信号,以及基于所述滤波矩阵C对所述右声道输入音频信号进行滤波,以获取第一滤波右声道输入音频信号和第二滤波右声道输入音频信号;以及合路器,用于:合并所述第一滤波左声道输入音频信号和所述第一滤波右声道输入音频信号,以获取所述左声道输出音频信号,并合并所述第二滤波左声道输入音频信号和所述第二滤波右声道输入音频信号,以获取所述右声道输出音频信号。所述滤波器可以由串扰消除单元提供。
[0010] 根据本发明第一方面,在所述音频信号处理装置的第一种实现形式中,所述确定器用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0011] C=(HH·H+β(ω)I)-1(HH·VH)e-jωM,
[0012] 其中,HH表示所述ATF矩阵H的厄米特转置,I表示单位矩阵,β表示正则化因子,M表示建模时延,ω表示角频率。
[0013] 根据本发明第一方面,在所述音频信号处理装置的第二种实现形式中,所述确定器用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0014] C=(HH·H)-1(HH·VH)e-jωM,
[0015] 其中,HH表示所述ATF矩阵H的厄米特转置,M表示建模时延,ω表示角频率。
[0016] 根据本发明第一方面,在所述音频信号处理装置的第三种实现形式中,所述确定器用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0017] C=(HH·H+β(ω)I)-1(HH·phase(VH))e-jωM,
[0018] 其中,HH表示所述ATF矩阵H的厄米特转置,I表示单位矩阵,β表示正则化因子,M表示建模时延,ω表示角频率,phase(A)表示返回只包含矩阵A的元素的相位分量的矩阵的矩阵运算。
[0019] 根据本发明第一方面,在所述音频信号处理装置的第四种实现形式中,所述确定器用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0020] C=(HH·H)-1(HH·phase(VH))e-jωM,
[0021] 其中,HH表示所述ATF矩阵H的厄米特转置,M表示建模时延,ω表示角频率,phase(A)表示返回只包含矩阵A的元素的相位分量的矩阵的矩阵运算。
[0022] 根据本发明第一方面或其前述任意一种实现形式,在所述音频信号处理装置的第五种实现形式中,所述左声道输出音频信号将通过左扬声器和所述收听者的左耳之间的第一声学传播路径以及所述左扬声器和所述收听者的右耳之间的第二声学传播路径进行传输,所述右声道输出音频信号将通过右扬声器和所述收听者的右耳之间的第三声学传播路径以及所述右扬声器和所述收听者的左耳之间的第四声学传播路径进行传输,所述第一声学传播路径的第一传递函数、所述第二声学传播路径的第二传递函数、所述第三声学传播路径的第三传递函数以及所述第四声学传播路径的第四传递函数形成所述ATF矩阵。
[0023] 根据本发明第一方面或其前述任意一种实现形式,在所述音频信号处理装置的第六种实现形式中,所述目标ATF矩阵VH包括虚拟左扬声器位置和所述收听者的左耳之间的第一目标声学传播路径的第一目标传递函数、所述虚拟左扬声器位置和所述收听者的右耳之间的第二目标声学传播路径的第二目标传递函数、虚拟右扬声器位置和所述收听者的右耳之间的第三目标声学传播路径的第三目标传递函数以及所述虚拟右扬声器位置和所述收听者的左耳之间的第四目标声学传播路径的第四目标传递函数。
[0024] 根据本发明第一方面或其前述任意一种实现形式,在所述音频信号处理装置的第七种实现形式中,所述确定器还用于从数据库中检索所述ATF矩阵或者所述目标ATF矩阵。
[0025] 根据本发明第一方面或其前述任意一种实现形式,在所述音频信号处理装置的第八种实现形式中,所述合路器用于:将所述第一滤波左声道输入音频信号和所述第一滤波右声道输入音频信号相加,以获取所述左声道输出音频信号,并将所述第二滤波左声道输入音频信号和所述第二滤波右声道输入音频信号相加,以获取所述右声道输出音频信号。
[0026] 根据本发明第一方面或其前述任意一种实现形式,在所述音频信号处理装置的第九种实现形式中,所述装置还包括:分解器,用于:将所述左声道输入音频信号分解成主左声道输入音频子信号和次左声道输入音频子信号,并将所述右声道输入音频信号分解成主右声道输入音频子信号和次右声道输入音频子信号,其中所述主左声道输入音频子信号和所述主右声道输入音频子信号分配给主预定频段,所述次左声道输入音频子信号和所述次右声道输入音频子信号分配给副预定频段;以及延时器,用于:将所述次左声道输入音频子信号延迟一个时延以获取次左声道输出音频子信号,并将所述次右声道输入音频子信号延迟另一个时延以获取次右声道输出音频子信号;其中,所述滤波器用于:基于所述滤波矩阵C对所述主左声道输入音频子信号进行滤波,以获取第一滤波主左声道输入音频子信号和第二滤波主左声道输入音频子信号,并基于所述滤波矩阵C对所述主右声道输入音频子信号进行滤波,以获取第一滤波主右声道输入音频子信号和第二滤波主右声道输入音频子信号;其中,所述合路器用于:合并所述第一滤波主左声道输入音频子信号、所述第一滤波主右声道输入音频子信号和所述次左声道输入音频子信号,以获取所述左声道输出音频信号,并合并所述第二滤波主左声道输入音频子信号、所述第二滤波主右声道输入音频子信号和所述次右声道输入音频子信号,以获取所述右声道输出音频信号。
[0027] 根据本发明第一方面的第九种实现形式,在所述音频信号处理装置的第十种实现形式中,所述分解器是音频交叉网络。
[0028] 根据本发明第一方面或其前述任意一种实现形式,在所述音频信号处理装置的第十一种实现形式中,所述左声道输入音频信号由多声道输入音频信号的前左声道输入音频信号形成,所述右声道输入音频信号由所述多声道输入音频信号的前右声道输入音频信号形成,所述左声道输出音频信号由前左声道输出音频信号形成,所述右声道输出音频信号由前右声道输出音频信号形成;或者,所述左声道输入音频信号由多声道输入音频信号的后左声道输入音频信号形成,所述右声道输入音频信号由所述多声道输入音频信号的后右声道输入音频信号形成,所述左声道输出音频信号由后左声道输出音频信号形成,所述右声道输出音频信号由后右声道输出音频信号形成。
[0029] 根据本发明第一方面的第十一种实现形式,在所述音频信号处理装置的第十二种实现形式中,所述多声道输入音频信号包括中央声道输入音频信号,所述合路器用于:合并所述中央声道输入音频信号、所述前左声道输出音频信号和所述后左声道输出音频信号,并合并所述中央声道输入音频信号、所述前右声道输出音频信号和所述后右声道输出音频信号。
[0030] 第二方面,本发明提供了一种音频信号处理方法,用于对左声道输入音频信号进行滤波以获取左声道输出音频信号,以及用于对右声道输入音频信号进行滤波以获取右声道输出音频信号,所述左声道输出音频信号和所述右声道输出音频信号通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数(Acoustic Transfer Function,简称ATF)矩阵H定义,所述音频信号处理方法包括以下步骤:基于所述ATF矩阵H和目标ATF矩阵VH确定滤波矩阵C,其中,所述目标ATF矩阵VH包括目标声学传播路径的目标传递函数,所述目标声学传播路径由多个虚拟扬声器位置相对于所述收听者的目标布置来定义;基于所述滤波矩阵C对所述左声道输入音频信号进行滤波,以获取第一滤波左声道输入音频信号和第二滤波左声道输入音频信号,并基于所述滤波矩阵C对所述右声道输入音频信号进行滤波,以获取第一滤波右声道输入音频信号和第二滤波右声道输入音频信号;合并所述第一滤波左声道输入音频信号和所述第一滤波右声道输入音频信号,以获取所述左声道输出音频信号,并合并所述第二滤波左声道输入音频信号和所述第二滤波右声道输入音频信号,以获取所述右声道输出音频信号。
[0031] 根据本发明第二方面所述的方法可以由根据本发明第一方面所述的装置执行。根据本发明第二方面所述的方法的进一步特征可以直接从根据本发明第一方面及其不同实现形式所述的装置的功能中得到。
[0032] 第三方面,本发明涉及一种计算机程序,包括:在计算机上被执行时用于执行根据本发明第二方面所述的方法的程序代码。
[0033] 本发明可以以硬件和/或软件来实现。

附图说明

[0034] 本发明的实施例将结合以下附图进行描述,其中:
[0035] 图1示出了根据一实施例的用于对左声道输入音频信号和右声道输入音频信号进行滤波的音频信号处理装置的图;
[0036] 图2示出了根据一实施例的用于对左声道输入音频信号和右声道输入音频信号进行滤波的音频信号处理方法的图;
[0037] 图3示出了根据一实施例的用于对左声道输入音频信号和右声道输入音频信号进行滤波的音频信号处理装置的图;
[0038] 图4示出了根据一实施例的给预定频段分配频率的图;
[0039] 图5示出了根据一实施例的用于对左声道输入音频信号和右声道输入音频信号进行滤波的音频信号处理装置的图;
[0040] 图6示出了传统的串扰消除技术和本发明实施例之间的A/B测试结果的图。

具体实施方式

[0041] 图1示出了根据一实施例的音频信号处理装置100的图。所述音频信号处理装置100用于对左声道输入音频信号L进行滤波以获取左声道输出音频信号X1,以及对右声道输入音频信号R进行滤波以获取右声道输出音频信号X2。
[0042] 所述左声道输出音频信号X1和所述右声道输出音频信号X2通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数(Acoustic Transfer Function,简称ATF)矩阵H定义。
[0043] 所述音频信号处理装置100包括:确定器101,用于基于所述ATF矩阵H和目标ATF矩阵VH确定滤波矩阵C,其中,所述目标ATF矩阵VH包括目标声学传播路径的目标传递函数,所述目标声学传播路径由虚拟扬声器位置相对于所述收听者的目标布置来定义。
[0044] 术语“虚拟扬声器位置”(以及“虚拟扬声器”)为本领域技术人员所熟知。通过选择合适的传递函数,收听者感知到的接收到扬声器发出的音频信号的位置可以与扬声器的实际位置不同。该位置即是此处使用的“虚拟扬声器位置”,其与诸如立体音扩展和虚拟环绕等技术相关联。其中,虚拟扬声器位置并不只局限于例如立体声扬声器对的物理布局和它们之间的位置。
[0045] 所述音频信号处理装置100还包括:滤波器103,用于:基于所述滤波矩阵C对所述左声道输入音频信号L进行滤波,以获取第一滤波左声道输入音频信号107和第二滤波左声道输入音频信号109,并基于所述滤波矩阵C对所述右声道输入音频信号R进行滤波,以获取第一滤波右声道输入音频信号111和第二滤波右声道输入音频信号113;以及合路器105,用于:合并所述第一滤波左声道输入音频信号107和所述第一滤波右声道输入音频信号111,以获取所述左声道输出音频信号X1,并合并所述第二滤波左声道输入音频信号109和所述第二滤波右声道输入音频信号113,以获取所述右声道输出音频信号X2。
[0046] 在数学上,所述音频信号处理装置100不是用于确定其滤波矩阵C使得所述ATF矩阵H和所述滤波矩阵C的乘积约等于所述单位矩阵I(正如在传统串扰消除单元中的情况),而是用于确定其滤波矩阵C使得所述ATF矩阵H和所述滤波矩阵C的乘积等于由虚拟扬声器位置相对于所述收听者的目标布置定义的所述目标ATF矩阵VH。更具体地,所述目标ATF矩阵VH的元素由所述传递函数定义,所述传递函数描述从期望的虚拟扬声器位置到收听者耳朵的相应声学传播路径。这些传递函数可以是取自数据库或者某些基于模型的传递函数的头相关传递函数(Head Related Transfer Function,简称HRTF)。
[0047] 在一实施例中,所述确定器101用于根据以下等式,使用最小二乘近似,基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0048] C=(HH·H+β(ω)I)-1(HH·VH)e-jωM
[0049] 其中,HH表示所述ATF矩阵H的厄米特转置,I表示单位矩阵,β表示正则化因子,M表示建模时延,ω表示角频率。
[0050] 通常会采用正则化因子β来实现稳定性并限制滤波器的增益。正则化因子β越大,滤波器增益越小,但这是以重现准确度和声音质量为代价的。正则化因子β可被视为被控加性噪声,其被引入以实现稳定性。因为该等式系统的病态性可以随频率而变化,所以可以将该因子设计为频率相关。
[0051] 意外地,本发明提出的方法具有如下有利的副作用:与传统串扰消除单元相比,可以选择较小的正则化因子β。这是因为所述方程的第二项((HH·VH)e-jωM)的作用是增益控制,其被优化以准确地重现期望的双耳因素。即,在不影响双声道重现的准确度的情况下保持了所述滤波器的稳定性和鲁棒性。
[0052] 因此,在进一步的实施例中,可以将所述正则化因子β设置为零,使得在本实施例中,所述确定器101用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0053] C=(HH·H)-1(HH·VH)e-jωM.
[0054] 可以只通过所述目标ATF矩阵VH中包含的相位信息来进一步提高本发明中的输出声音质量,即:
[0055] H·C≈phase(VH),
[0056] 其中,phase(A)表示返回只包含矩阵A的元素的相位分量的矩阵的矩阵运算。
[0057] 因此,在进一步的实施例中,所述确定器101用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0058] C=(HH·H+β(ω)I)-1(HH·phase(VH))e-jωM.
[0059] 该方法基本上对应于使头相关传递函数(Head Related Transfer Function,简称HRTF)或者传递函数近似到全通系统,即,恒定幅度和可变相位。这样就保留了耳间时间差(Inter-Aural Time Difference,简称ITD),同时避免了错误的耳间声级差(Inter-Aural Level Difference,简称ILD),这样就会在不明显影响环绕声效的情况下使得音染显著减少。
[0060] 由于本发明方法的以上描述的对所述正则化因子β的有利效果,对于本实施例,也可将所述正则化因子β设置为零。因此,在进一步的实施例中,所述确定器101用于根据以下等式基于所述ATF矩阵H和所述目标ATF矩阵VH确定所述滤波矩阵C:
[0061] C=(HH·H)-1(HH·phase(VH))e-jωM.
[0062] 图2示出了根据一实施例的音频信号处理方法200的图。所述音频信号处理方法200用于对左声道输入音频信号L进行滤波以获取左声道输出音频信号X1,对右声道输入音频信号R进行滤波以获取右声道输出音频信号X2。
[0063] 所述左声道输出音频信号X1和所述右声道输出音频信号X2通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数(Acoustic Transfer Function,简称ATF)矩阵H定义。
[0064] 所述音频信号处理方法200包括:步骤201:基于所述ATF矩阵H和目标ATF矩阵VH确定滤波矩阵C,其中,所述目标ATF矩阵VH包括目标声学传播路径的目标传递函数,所述目标声学传播路径由多个虚拟扬声器位置相对于所述收听者的目标布置来定义;步骤203:基于所述滤波矩阵C对所述左声道输入音频信号L进行滤波,以获取第一滤波左声道输入音频信号107和第二滤波左声道输入音频信号109,并基于所述滤波矩阵C对所述右声道输入音频信号R进行滤波,以获取第一滤波右声道输入音频信号111和第二滤波右声道输入音频信号113;以及步骤205:合并所述第一滤波左声道输入音频信号107和所述第一滤波右声道输入音频信号111,以获取所述左声道输出音频信号X1,并合并所述第二滤波左声道输入音频信号109和所述第二滤波右声道输入音频信号113,以获取所述右声道输出音频信号X2。
[0065] 本领域技术人员应理解,上述步骤可以连续、并行或者组合执行。例如,步骤201和203可以相对于彼此并行执行,而相对于步骤205,则可连续执行。
[0066] 下文描述了所述音频信号处理装置100和所述音频信号处理方法200的其它实现形式和实施例。
[0067] 图3示出了根据一实施例的音频信号处理装置100的图。所述音频信号处理装置100用于对左声道输入音频信号L进行滤波以获取左声道输出音频信号X1,以及对右声道输入音频信号R进行滤波以获取右声道输出音频信号X2。
[0068] 所述左声道输出音频信号X1和所述右声道输出音频信号X2通过声学传播路径传输给收听者,其中,所述声学传播路径的传递函数由声学传递函数(Acoustic Transfer Function,简称ATF)矩阵H定义。
[0069] 所述音频信号处理装置100包括确定器101,其在图3的实施例中实现为串扰校正器形式的滤波器103的一部分。所述确定器101用于基于所述ATF矩阵H和目标ATF矩阵VH确定滤波矩阵C,其中,所述目标ATF矩阵VH包括目标声学传播路径的目标传递函数,所述目标声学传播路径由虚拟扬声器位置相对于所述收听者的目标布置来定义。
[0070] 所述音频信号处理装置100还包括:分解器315,用于:将所述左声道输入音频信号(L)分解成主左声道输入音频子信号和次左声道输入音频子信号,并将所述右声道输入音频信号R分解成主右声道输入音频子信号和次右声道输入音频子信号。所述主左声道输入音频子信号和所述主右声道输入音频子信号分配给主预定频段,所述次左声道输入音频子信号和所述次右声道输入音频子信号分配给副预定频段。
[0071] 频率分解可以由所述分解器315使用例如低复杂度滤波器组和/或音频交叉网络来实现。所述音频交叉网络可以是模拟音频交叉网络或者数字音频交叉网络。仅作为一个示例,分解器315、确定器101、延时器317以及合路器105可以是数字滤波器的离散元件。
[0072] 图3所示的音频信号处理装置100还包括:延时器317,用于:将所述次左声道输入音频子信号延迟一个时延以获取次左声道输出音频子信号,并将所述次右声道输入音频子信号延迟另一个时延以获取次右声道输出音频子信号。延时器317可以是数字延时线。
[0073] 所述串扰校正器形式的滤波器103用于:基于所述滤波矩阵C对所述主左声道输入音频子信号进行滤波,以获取第一滤波主左声道输入音频子信号和第二滤波主左声道输入音频子信号,并基于所述滤波矩阵C对所述主右声道输入音频子信号进行滤波,以获取第一滤波主右声道输入音频子信号和第二滤波主右声道输入音频子信号。
[0074] 图3所示的音频信号处理装置100还包括:合路器105,用于:合并所述第一滤波主左声道输入音频子信号、所述第一滤波主右声道输入音频子信号和所述次左声道输入音频子信号,以获取要提供给左扬声器319的所述左声道输出音频信号X1,并合并所述第二滤波主左声道输入音频子信号、所述第二滤波主右声道输入音频子信号和所述次右声道输入音频子信号,以获取要提供给右扬声器321的所述右声道输出音频信号X2。
[0075] 在一实施例中,考虑到所述扬声器319和321的声学特性,例如低频截止和高频限制,所述分解器315将所述输入音频信号划分成子频段。避开低于截止频率且高于高频限制的频率以避免失真。所述主预定频段可以是图4中所示的中间频率的频段,所述副预定频段可以是图4中所示的高低频率的频段。在一实施例中,所述分解器315为音频交叉网络。
[0076] 图5示出了根据一实施例的音频信号处理装置100的图。所述音频信号处理装置100用于对左声道输入音频信号进行滤波以获取左声道输出音频信号X1,并对右声道输入音频信号进行滤波以获取右声道输出音频信号X2。该图指的是用于对多声道音频信号进行滤波的虚拟环绕音频系统。
[0077] 所述音频信号处理装置100包括两个分解器315、两个串扰校正器形式的两个滤波器103、实现为相应串扰校正器的一部分的两个确定器101、两个延时器317以及一个具有结合图3描述的相同功能的合路器105。所述左声道输出音频信号X1通过左扬声器319进行传输。所述右声道输出音频信号X2通过右扬声器321进行传输。
[0078] 在该图的上半部分中,所述左声道输入音频信号L由所述多声道输入音频信号的前左声道输入音频信号形成,所述右声道输入音频信号R由所述多声道输入音频信号的前右声道输入音频信号形成。在该图的下半部分中,所述左声道输入音频信号L由所述多声道输入音频信号的后左声道输入音频信号形成,所述右声道输入音频信号R由所述多声道输入音频信号的后右声道输入音频信号形成。
[0079] 所述多声道输入音频信号还包括中央声道输入音频信号,其中,所述合路器105用于:合并所述中央声道输入音频信号、所述前左声道输出音频信号和所述后左声道输出音频信号,并合并所述中央声道输入音频信号、所述前右声道输出音频信号和所述后右声道输出音频信号。
[0080] 图6示出了传统的串扰消除技术和本发明实施例之间的A/B测试结果的图。所评估的属性为环绕感(例如,感知空间印象)和声音质量(例如,偏好)。使用Bradley-Terry-Luce(Bradley-Terry-Luce,简称BTL)模型对数据进行分析,该模型给定了相对偏好范围,其取值反映在Y轴上。信号通过TV-扬声器进行呈现。总共有13个对象参与到该测试中。
[0081] 收听测试的结果将本发明实施例(XTC1)与传统串扰消除(XTC)以及原始立体声进行比较。可以清楚地看出,关于宽度和声音质量方面,本发明明显优于现有技术最高水准的解决方案。
[0082] 本发明实施例还提供了以下优点。控制滤波器的增益所需的正则化较少。因为不再优化该问题以近似于精确求逆而是优化一组传递函数,所以所得到的滤波器更加稳定和强健。强健的滤波器意味着更宽的最佳试音位置。在重现点引入的音染较少,且可以在不影响声音质量的情况下实现逼真的3D音效,使用传统解决方案的情况也是如此。鉴于不再需要双声道化单元,本发明显著降低了滤波器的复杂性。本发明可以与任意扬声器配置(不同的扩散角、几何形状以及扬声器大小)一起使用,并且可以容易地扩展到多于双声道。
[0083] 本发明实施例应用于具有至少两个扬声器的音频终端内,例如TV、高保真(High Fidelity,简称HiFi)系统、影院系统、诸如智能手机或平板电脑等的移动设备、或者电话会议系统。本发明实施例在半导体芯片组中实现。
[0084] 本发明实施例可以在用于在计算机系统上运行的计算机程序中实现,至少包括当在诸如计算机系统等的可编程装置上运行时用于执行根据本发明的方法步骤的代码部分,或者使得可编程装置执行根据本发明的设备或系统的功能的代码部分。
[0085] 计算机程序是指令列表,例如,特定的应用程序和/或操作系统。计算机程序例如可以包括以下中的一个或多个:子例程、函数、流程、对象方法、对象实现、可执行应用、小程序、服务器小程序、源代码、目标代码、共享库/动态加载库和/或设计用于在计算机系统上执行的其它指令序列。
[0086] 计算机程序可以存储在计算机可读存储介质内部或通过计算机可读传输介质传输到计算机系统。全部或部分计算机程序可以在永久地、可移除地或远程地耦合至信息处理系统的瞬时性或非瞬时性计算机可读介质上提供。计算机可读介质可以包括,例如但不限于,任意数量的以下示例:磁存储介质,包括磁盘和磁带存储介质;光存储介质,例如光盘介质(例如,CD-ROM、CD-R等)和数字视频光盘存储介质;非易失性存储器存储介质,包括基于半导体的存储器单元,例如闪存、EEPROM、EPROM、ROM;铁磁数字存储器;MRAM;易失性存储介质,包括寄存器、缓冲器或缓存、主存储器、RAM等;以及数据传输介质,包括计算机网络、点对点电信设备、载波传输介质,此处仅举几例。
[0087] 计算机进程通常包括执行(运行)程序或程序的一部分、当前程序值和状态信息,以及操作系统用来管理进程的执行的资源。操作系统(Operating System,简称OS)是管理计算机资源共享的软件,并为程序员提供用于访问这些资源的接口。操作系统处理系统数据和用户输入,并通过分配及管理任务和内部系统资源作为服务对系统的用户和程序进行响应。
[0088] 计算机系统例如可以包括至少一个处理单元、关联存储器和多个输入/输出(input/output,简称I/O)设备。当执行计算机程序时,计算机系统根据计算机程序处理信息并通过I/O设备生成合成的输出信息。
[0089] 此处讨论的连接可以是适用于例如通过中间设备从或向相应节点、单元或设备传递信号的任意类型的连接。因此,除非另有所指或所述,该连接例如可以是直接连接或间接连接。可以结合单个连接、多个连接、单向连接或双向连接对该连接进行说明或描述。然而,不同的实施例可能会使该连接的实现发生变化。例如,可以使用单独的单向连接而不是双向连接,反之亦然。此外,多个连接可以被替换为以串行或时间复用方式传递多个信号的单个连接。同样地,携带多个信号的单个连接可以被分离成携带这些信号的子集的各种不同的连接。因此,存在许多用于传递信号的选择。
[0090] 本领域技术人员将意识到,各逻辑块之间的界限仅仅是说明性的,并且替代实施例可以合并逻辑块或电路元件,或者可以在各种逻辑块或电路元件上实行功能的替代分解。因此,应当理解,此处所描述的架构仅仅是示例性的,并且实际上,许多其它实现相同功能的架构也能够实现。
[0091] 因此,实现相同功能的组件的任意布置是有效地“关联”,从而实现了所期望的功能。因此,不论是架构或是中间组件,此处组合以实现某个特定功能的任意两个组件可被视为相互“关联”,从而实现了所期望的功能。同样地,任意两个如此关联的组件也可被视为相互“可操作地连接”或“可操作地耦合”,以实现所期望的功能。
[0092] 此外,本领域技术人员将意识到,以上所描述的操作之间的界限仅仅是说明性的。多个操作可以组合成单个操作,单个操作可以分布在附加操作中,操作可以以在时间上至少部分重叠的方式来执行。另外,替代实施例可以包括某个特定操作的多个示例,在各种其它实施例中可以改变操作的顺序。
[0093] 此外,例如,其中的示例或部分可以,例如以任意合适类型的硬件描述语言,实现为物理电路的或可转换成物理电路的逻辑表示的软或代码表示。
[0094] 此外,本发明不限于在不可编程硬件中实现的物理设备或单元,也可以应用于能够通过根据合适的程序代码进行操作来执行所期望的设备功能的可编程设备或单元,例如,大型主机、小型计算机、服务器、工作站、个人计算机、记事本、个人数字助理、电子游戏、汽车和其它嵌入式系统、蜂窝电话和各种其它无线设备,在本申请中通常表示为‘计算机系统’。
[0095] 然而,其它修改、变形和替代也是可能的。相应地,应认为本说明书和附图具有说明性意义而非限制性意义。