会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 信号处理 / 信号 / 输出信号 / 基于音频源信号产生输出信号的装置和方法、声音再现系统和扬声器信号

基于音频源信号产生输出信号的装置和方法、声音再现系统和扬声器信号

阅读:97发布:2021-02-13

IPRDB可以提供基于音频源信号产生输出信号的装置和方法、声音再现系统和扬声器信号专利检索,专利查询,专利分析的服务。并且一种用于基于至少一个音频源信号产生第一多个输出信号的装置包括延迟网络和反馈处理器。延迟网络包括第二多个延迟路径,每个延迟路径具有延迟线和衰减滤波器。每个延迟线被配置为对延迟线输入信号进行延迟并且组合至少一个音频源信号和混响音频信号以获得组合信号,其中延迟路径的衰减滤波器被配置为对来自延迟路径的延迟线的组合信号进行滤波以获得输出信号。所述第一多个输出信号包括该输出信号。反馈处理器被配置为对所述第一多个输出信号进行混响以获得包括所述混响音频信号的第三多个混响音频信号。,下面是基于音频源信号产生输出信号的装置和方法、声音再现系统和扬声器信号专利的具体信息内容。

1.一种用于基于至少一个音频源信号(104a,104b)产生第一多个输出信号(102a-

102d)的装置(100;200),所述装置包括:

延迟网络(202),包括第二多个延迟路径(106a-106d),每个延迟路径(106a-106d)具有延迟线(108a-108d)和衰减滤波器(112a-112d),每个延迟线(108a-108d)被配置为对延迟线输入信号(104a-104b,104a”,104b”,114a-114d)进行延迟并且组合所述至少一个音频源信号(104a-104b,104a”,104b”)和混响音频信号(114a-114d)以获得组合信号(116),其中延迟路径(106a-106d)的衰减滤波器(112a-112d)被配置为对来自延迟路径(106a-106d)的延迟线(108a-108d)的组合信号(116)进行滤波以获得输出信号(102a-102d),其中所述第一多个输出信号包括所述输出信号(102a-102d);以及反馈处理器(120),被配置为对所述第一多个输出信号(102a-102d)进行混响,以获得包含所述混响音频信号的第三多个混响音频信号(114a-114d)。

2.一种用于基于至少一个音频源信号(104a-104d)产生第四多个扬声器信号(144a-

144d)的装置(200),所述装置包括:

延迟网络(202),包括第二多个延迟路径(106a-106d),每个延迟路径(106a-106d)具有延迟线(108a-108d)和衰减滤波器(112a-112d),每个延迟线(108a-108d)被配置为对延迟线输入信号(104a-104b,104a”,104b”,114a-114d)进行延迟并且组合所述至少一个音频源信号(104a-104b,104a”,104b”)和混响音频信号(114a-114d)以获得组合信号(116),其中延迟路径(106a-106d)的衰减滤波器(112a-112d)被配置为对来自延迟路径(108a-106d)的延迟线(108a-108d)的组合信号(116)进行滤波以获得输出信号(102a-102d),其中第一多个输出信号包括所述输出信号(102a-102d);以及反馈处理器(120),被配置为对所述第一多个输出信号(102a-102d)进行混响,以获得包含所述混响音频信号的第三多个混响音频信号(114a-114d);

其中,所述延迟网络(202)包括第五多个均衡滤波器(142a-142d),被配置为对所述第一多个输出信号(102a-102d)或中间延迟线信号(308a-308c)进行频谱整形以获得所述第四多个扬声器信号(144a-144d),其中从延迟线(108a-108d)的输出抽头(306a-306c)接收所述中间延迟线信号(308a-308c)。

3.根据权利要求1或2所述的装置,其中,第一多个、第二多个、第三多个和第五多个均衡滤波器(142a-142d)的数量相等。

4.根据权利要求2或3所述的装置,其中,所述延迟线(108a-108d)与相对于虚拟再现室(130)中的反射声音的收听位置的到达方向相关联,其中所述均衡滤波器(142a-142d)的滤波器参数基于所述到达方向进行调整。

5.根据前述权利要求中任一项所述的装置,其中,所述组合信号(116)包括音频源信号(104a-104b)部分和混响信号(114)部分,并且其中所述延迟线(108a-108d)包括第六多个输入抽头(302a-302d),所述第六多个输入抽头被配置为接收音频源信号(104a-104b)或音频源信号的加权版本(104a”,104b”),其中所述装置(100)包括输入控制器(140),所述输入控制器被配置为基于虚拟音频源在虚拟再现室(130)中的第一位置将音频源信号(104a-

104b)或音频源信号的加权版本(104a”,104b”)和所述第六多个输入抽头(302a-302d)之一连接,并且同时不将音频源信号(104a-104b)或音频源信号的加权版本(104”,104b”)连接到所述第六多个输入抽头(103a-103d)的不同输入抽头,并且其中所述输入控制器(140)被配置为基于虚拟音频源的第二位置将音频源信号(104a-104b)或音频源信号的加权版本(104a”,104b”)与所述第六多个输入抽头(302a-302d)之一断开连接,所述第二位置不同于所述第一位置。

6.根据前述权利要求中任一项所述的装置,其中,所述组合信号(116)包括音频源信号部分(104a-104b)和混响信号(114)部分,并且其中所述延迟线(108a-108d)包括第七多个输出抽头(308a-308c),所述第七多个输出抽头被配置为提供组合信号(116)或中间延迟线信号(308a-308c),其中所述装置(100)包括输出控制器(170),所述输出控制器被配置为基于虚拟再现室(130)的第一反射特性将均衡滤波器(142a-142d)连接到输出信号(102a-

102d)或所述第七多个输出抽头(308a-308c)中的最上面一个,同时不将所述第七多个输出抽头(308a-308c)的不同输出抽头连接到均衡滤波器(142a-142d),并且其中所述输出控制器(170)被配置为基于虚拟再现室(130)的第二反射特性将均衡滤波器(142a-142d)与输出信号(102a-102d)或中间延迟线信号(308a-308c)断开连接,所述第二反射特性不同于所述第一特性。

7.根据前述权利要求中任一项所述的装置,还包括:分配器(118a,118b),被配置为将音频源信号(104a,104b)分配为多个版本(104a′,104b′),所述版本(104a′,104b′)的数量至少是第二多个延迟路径(106a-106d)的数量,音频源信号(104a,104b)的所述版本(104a′,104b′)相对于彼此具有所述第二多个延迟线(106a-106d)的最大时间延迟的至多

20%的延迟。

8.根据权利要求6所述的装置,其中,所述分配器(118a,118b)还包括:第八多个放大器(122),被配置为对音频源信号(104a,104b)的版本(104a′,104b′)进行加权,以获得音频源信号(104a,104b)的加权版本(104a”,104b”),其中音频源信号(104a,104b)的所述加权版本(104a”,104b”)与虚拟再现室(130)中的虚拟声源的音频信号相关联,所述虚拟再现室包括虚拟扬声器(132a-132d),并且其中所述第八多个放大器(122)中的放大器(122)的增益因子与虚拟再现室(130)中的音频源的反射的特性相关联。

9.根据前述权利要求中任一项所述的装置,

其中所述衰减滤波器(112a-112d)包括第九多个滤波器系数(α0-αn,β1-βn);

其中所述延迟路径(106a-106d)与具有虚拟声音传播特性和声音反射结构的虚拟再现室(130)中的虚拟扬声器(132a-132d)的虚拟位置相关联;

其中所述滤波器系数(α0-αn,β1-βn)与对音频源信号进行混响的所述虚拟再现室(130)的混响时间相关。

10.根据权利要求1至8之一所述的装置,

其中所述衰减滤波器(112a-112d)包括第九多个滤波器系数(α0-αn,β1-βn);

其中所述延迟路径(106a-106d)与具有虚拟声音传播特性和声音反射结构的虚拟再现室(130)中的虚拟扬声器(132a-132d)的虚拟位置相关联;

其中所述组合信号(116)包括在虚拟再现室(130)中被反射或混响的反射音频信号或混响音频信号的方向信息;

其中音频源信号(104a,104b)被延迟线(108a-108d)延迟的时间延迟与虚拟再现室(130)的虚拟扬声器(132a-132d)和声音反射结构之间的距离相关;

其中所述滤波器系数(α0-αn,β1-βn)与虚拟再现室(130)的混响时间和扩散特性或声音到达的方向相关。

11.根据前述权利要求中任一项所述的装置,其中,所述反馈处理器(120)被配置为组合所述第一多个输出信号(102a-102d)以获得所述第三多个混响音频信号(114a-114d),其中所述反馈处理器(120)被配置为基于混响参数(α11-α44)组合所述第一多个输出信号(102a-102d),所述混响参数与包括虚拟音频源的虚拟再现室(130)的反射特性相关,所述虚拟音频源与音频源信号(104a,104b)相关联,其中所述混响特性与虚拟再现室(130)中的虚拟音频源的位置无关。

12.根据权利要求11所述的装置,其中,所述参数(α11-αα44)涉及虚拟再现室(130)的多个子室(136a,136b),并且其中所述混响参数(α11-α44)基于下式以矩阵表示法来表示:其中U1表示第一子室(136a)的混响参数,其中U2表示第二子室(136b)的混响特性,其中V1表示从第一子室(136a)到第二子室(136b)的耦合参数,其中V2表示从第二子室(136b)到第一子室(136a)的耦合参数。

13.根据权利要求11或12所述的装置,其中,所述衰减滤波器(112a-112d)包括无限冲激响应结构,并且其中所述无限冲激响应结构的滤波器参数(α0-αn,β1-βn)被适配为使得虚拟再现室(130)的第一子室(136a)的第一混响特性与虚拟再现室(130)的第二子室(136b)的第二混响特性不同。

14.根据前述权利要求中任一项所述的装置,其中,所述延迟网络(202)包括第五多个均衡滤波器(142a-142d),被配置为对输出信号(102a-102d)、中间延迟线信号(308a-308c)或组合信号(116)进行频谱整形,以获得与虚拟再现室(130)的虚拟扬声器(132a-132d)相关的第四多个扬声器信号(144),并且其中所述第四多个扬声器信号(144a-144d)被配置为存储在存储介质上,使得通过装置(150)获得与真实再现室(160)的真实扬声器(162a-

162f)相关的第十多个真实扬声器信号(152a-152f),所述装置(150)被配置为将所述第四多个扬声器信号(144a-144d)平移到所述第十多个真实扬声器信号(144a-144f)。

15.根据前述权利要求中任一项所述的装置,其中,所述延迟线(106a-106d)还被配置为组合至少两个音频源信号(104a,104b)和所述混响音频信号(114),其中所述延迟线(106a-106d)被配置为将第一时间延迟施加到第一音频源信号(104a),并且将第二时间延迟施加到第二音频源信号(104b)。

16.根据前述权利要求中任一项所述的装置,其中,所述第二多个延迟线中的延迟线(106a-106d)与相对于虚拟再现室(130)中的收听者的虚拟位置(604)的虚拟扬声器(132a-

132d)的方向相关联,所述虚拟再现室包括所述虚拟扬声器(132a-132d),其中所述虚拟再现室(130)中的虚拟扬声器(132a-132d)的分布是不均等的。

17.一种声音再现系统(1000),包括:

根据权利要求1至16之一所述的装置(100,200);

第十一多个扬声器(162a-162f);以及

平移器(150),被配置为接收从所述第一多个输出信号(102a-102d)导出的第四多个扬声器信号(144a-144d)并将所述第四多个扬声器信号(144a-144d)平移到第十二多个平移扬声器信号(152a-152f),所述第十二多个平移扬声器信号中的扬声器信号的数量等于所述第十一多个扬声器的扬声器(162a-162f)数量;

其中所述平移器(150)被配置为在平移所述第四多个扬声器信号时保持与所述第四多个扬声器信号(144a-144d)相关联的虚拟再现室(130)的声音传播特性。

18.一种用于基于至少一个音频源信号产生第一多个输出信号的方法,所述方法包括:

利用延迟线(108a-108d)来延迟并组合所述至少一个音频源信号(104a,104b)和混响音频信号(114)以获得组合信号(116);

对来自所述延迟线(108a-108d)的组合信号(116)进行滤波以获得输出信号(102a-

102d),其中从第二多个延迟路径(106a-106d)获得所述第一多个输出信号(102a-102d),每个延迟路径具有延迟线;以及对所述第一多个输出信号(102a-102d)进行混响,以获得包含所述混响音频信号的第三多个混响音频信号(114)。

19.一种用于基于至少一个音频源信号产生第四多个扬声器信号的方法,所述方法包括:

利用延迟线来延迟并组合所述至少一个音频源信号和混响音频信号以获得组合信号;

对来自所述延迟线的组合信号进行滤波以获得输出信号,其中从第二多个延迟路径获得所述第一多个输出信号,每个延迟路径具有延迟线;以及对所述第一多个输出信号进行混响以获得包括所述混响音频信号的第三多个混响音频信号;

对所述第一多个输出信号(102a-102d)或中间延迟线信号(308a-308c)进行频谱整形,以获得所述第四多个扬声器信号(144a-144d),其中从所述延迟线(106a-106d)的输出抽头(306a-306c)接收所述中间延迟线信号(308a-308c)。

20.一种具有程序代码的计算机程序,其中当所述程序运行在计算机上时,所述程序代码用于执行根据权利要求18或19所述的方法。

21.一种扬声器信号(144a-144d),包括直接部分(114)和混响部分(114),所述混响部分包括关于虚拟再现室(130)的方向信息,所述虚拟再现室包括被配置为对所述扬声器信号(144a-144d)进行虚拟再现的虚拟扬声器(132a-132d)。

说明书全文

基于音频源信号产生输出信号的装置和方法、声音再现系统

和扬声器信号

技术领域

[0001] 本发明涉及一种用于基于至少一个音频源信号产生输出信号的装置、一种用于基于至少一个音频源信号产生多个扬声器信号的装置、一种声音再现系统、一种用于产生输出信号的方法和计算机程序。本发明还涉及扬声器信号和用于空间多通道参数混响的技术。

背景技术

[0002] 如果在房间中发出声音,则声波会穿越空间传播,直至它们在房间的边界处被反射。反射被再次反弹,并且随着时间的推移,演变出越来越复杂的声波模式,所谓的混响。图8示出了混响的示意性单通道表示,其中混响是具有直接声音1002、早期反射1004和后期混响1006的典型房间的冲激响应。在接收器位置处并且如图8的横坐标所示,首先,从接收器接收直接声音1002。直接声音1002无反射地传送到接收器。之后,接收早期反射1004。早期反射1004包括多个不同的反射,随着时间的推移,所述多个不同的反射凝聚为后期混响
1006。直接声音1002和早期反射1004特别依赖于相对于房间几何的源和接收器位置。后期混响1006中的反射的特征在于在方向上均匀分布并且相对独立于源和接收器位置。
[0003] 然而,在空间再现中,每个声音具有到达方向(DOA),即,声音从通过方位和仰角给出的特定角度方向而到达。为了更好的说明,图9示出了仅在二维中混响的示意性空间表示。对于直接声音1002,DOA是清晰可感知的,并且主要决定源定位。对于早期反射1004,DOA也是重要的,因为它有助于创建房间几何学意义、源的空间深度和角源定位。后期混响1006是扩散的,并且不能感知到明显的DOA。
[0004] 随着横坐标所示的时间t的增加,接收器首先感知直接声音1002,然后感知早期反射1004,随后感知后期混响1006。角度方向是声波到达方向的方位角,该方位角表示为径向维度。到接收器的距离是到达时间。点的深暗度描绘了感知到的反射水平的程度。因此,图9描绘了二维混响的空间表示。
[0005] 在音频后期制作的过程中,将人为混响添加到声音,以提高空间质量。期望的目标是从音乐性的增强、声音设计的改善到物理声学空间的再建。可以通过使用多个扬声器、源相关的早期反射和不相关的后期混响来创建逼真的声学空间。在这个意义上,其被称为具有大量音频源和大量输出通道的多通道。
[0006] 实际的混响算法通常属于两个类别之一,尽管存在混合类别:
[0007] 1)延迟网络,其中输入信号被延迟、滤波和反馈;
[0008] 2)卷积,其中输入信号简单地与声学空间的记录或估计的冲激响应卷积。
[0009] 卷积混响器以高精度再现给定的声学,但是还具有高计算成本,即,负担。已经设计了多通道卷积混响器,但是计算成本与源和通道对的数量呈线性关系。
[0010] 对于低通道应用,即,单声道和立体声,开发了各种各样的参数混响器。然而,这些开发都没有以有效的方式扩展到高多通道混响器。特别是,它们在应对任意源输入和扬声器设置方面缺乏灵活性。
[0011] 近年来已经开发了许多人造混响器,其中在下文中给出了它们在多通道混响中的应用的简要概述。绝大多数市售的混响器具有低数量的输入和输出通道。虽然它们在可用性、计算效率和声音质量方面展现了高标准,但是对于高数量的输出通道,它们效率低下。
[0012] 使用低通道混响器实现高数量通道的一种方式是实例化多个类似的混响器。这大大增加了存储需求和计算成本。对于不相关的输出通道,混响器被不同地参数化,因此它们可能变得独特。可以通过混响器之间的交叉馈送信号来克服明显可接收的混响器。
[0013] 然而,早期反射的DOA不能以这种方式实现,因为期望的DOA可能在两个混响器的输出通道之间。因此,不存在通过多个混响器的组合来定位多个源的明确方式。此外,多个实例的可用性可能变得棘手和复杂。
[0014] 虽然基于卷积的混响器可以以高精度产生给定的物理声学空间,如在[1]中所描述的,但是它们利用大量声源和输出通道的效率非常低。每对声源和输出通道通过单独的卷积处理。因此,要执行的卷积数是声源数和输出通道数的乘积。冲激响应难以获得,并且它们在具有其它房间参数的源和接收器定位方面缺乏灵活性。
[0015] 相比之下,基于延迟网络的混响器允许对混响声音的任何细节进行广泛控制。此外,近来,延迟网络混响器在低通道应用中展现出了高标准的声音质量。目前现有的算法没有或者低效地提供了一种以高效率重建多通道音频的一致方法。
[0016] 通常,混响分为两个阶段:早期反射和后期混响,如图10所示并在[2,3]中描述。早期反射1004和1004是单声道源1014a和1014b的延迟(1008a和1008b)和衰减(1012a和1012b)副本。标记为τsi的延迟线1008a和1008b、标记为bsi的输出增益1012a和1012以及平移1016取决于源位置,并且对于每个源是排他的。因此,对于每个源1014a和1014b,必须复制早期反射部分1018。为了提高早期反射1004a和1004b的质量,由扩散器单元1022对它们进行处理。扩散器1022通常被实现为全通滤波器或短有限冲激响应(FIR)滤波器,以模拟非镜面壁反射的影响。扩散器1022和平移1016单元的特定顺序和替换可以变化,例如,为了每单个早期反射1004a和1004ba的精确平移,可以采用用于每个源1014a和1014b的专用平移单元1016,或者扩散器1022可以直接放置在延迟线1008a和1008b的源输入处。因此,该特定设计是精细控制和计算效率之间的折衷。
[0017] 后期混响由反馈延迟网络(FDN)1024来创建。FDN 1024基于标记为τ1、τ2、...、τN的一组N个延迟线1025和反馈混合矩阵A,以随着时间的推移演变出复杂的回波模式。混响时间和扩散由标记为α1、α2、...、αN的衰减滤波器1026控制。衰减滤波器的实现范围从如[4]所述的简单低通滤波器到如[5]所述的吸收性全通滤波器。
[0018] 将早期反射馈送到FDN环路中,以增加延迟混响的初始密度。将延迟混响混合并添加到平移的早期反射。将所产生的通道馈送到再现室1032的扬声器1028中。可选地,通道相关均衡滤波器(EQ)1034可以应用于扬声器通道,以用于频谱校正和扬声器相关频率响应。
[0019] 在收听位置,再现室160中的所有输出通道被延迟和相加并形成接收器信号。因此,通常在先前设计中执行的延迟线信号的预混合增加了每个输出通道中的回波密度,但是没有增加在房间中感知到的回波密度。相反,它趋向于引入不愉快的相干性和梳状滤波器伪影。使用Hadamard混合矩阵可能发生的一个极端例子是将延迟线的输出分配到所有输出通道,从而产生具有相位翻转的多通道单声道信号。
[0020] 已知概念的设计没有有效和方便的方式来处理多通道混响,包括空间提示和方向依赖性。此外,对于混响器的空间感知最重要的早期反射是由已知概念分开呈现的,导致计算成本高昂。
[0021] 目前,存在许多不同的多扬声器配置,这意味着高度需要具有灵活扬声器配置的多通道混响。因此,例如,需要音频再现概念,允许具有更灵活的扬声器配置的多通道混响器和/或用于获得混响的有效方式。

发明内容

[0022] 本发明的目的是提供一种用于获得混响信号的更有效装置和更灵活的声音再现系统的概念。
[0023] 本发明的其他有利修改是从属权利要求的主题。
[0024] 本发明的实施例涉及一种用于基于至少一个音频源信号产生第一多个输出信号的装置。该装置包括延迟网络和反馈处理器。延迟网络包括第二多个延迟路径,其中每个延迟路径包括延迟线和衰减滤波器。每个延迟线被配置为对延迟线的输入信号进行延迟并且组合所述至少一个音频源信号和混响音频信号以获得组合信号。延迟路径的衰减滤波器被配置为对来自延迟路径的延迟线的组合信号进行滤波以获得输出信号。所述第一多个输出信号包括该输出信号。反馈处理器被配置为对所述第一多个输出信号进行混响以获得包括所述混响音频信号的第三多个混响音频信号。
[0025] 这允许从一个FDN获得延迟信号(早期反射)和混响信号,其中FDN的复杂度可以几乎独立于源信号的数量,使得有效地获得延迟信号和混响信号。
[0026] 本发明的另外实施例涉及一种用于基于至少一个音频源信号产生第四多个扬声器信号的装置。该装置包括延迟网络和反馈处理器。延迟网络包括第二多个延迟路径,其中每个延迟路径包括延迟线和衰减滤波器。每个延迟线被配置为对延迟线的输入信号进行延迟并且组合所述至少一个音频源信号和混响音频信号以获得组合信号。延迟路径的衰减滤波器被配置为对来自延迟路径的延迟线的组合信号进行滤波以获得输出信号。所述第一多个输出信号包括该输出信号。反馈处理器被配置为对所述第一多个输出信号进行混响以获得包括所述混响音频信号的第三多个混响音频信号。延迟网络还包括第五多个均衡滤波器,其被配置为对所述第一多个输出信号或中间延迟线信号进行频谱整形,以获得第四多个扬声器信号。从延迟线的输出抽头接收所述中间延迟线信号。
[0027] 发明人已经发现,通过在延迟线中组合音频源信号和混响音频信号两者,可以通过反馈延迟网络来获得早期反射和后期混响。所提出概念的计算复杂度以要获得的输出信号或扬声器信号的数量来衡量,但是可以分别独立于或几乎独立于将要渲染到输出信号、扬声器信号中的音频源信号的数量。此外,可以保持反射和/或混响音频信号的空间信息。
[0028] 本发明的另外实施例涉及一种声音再现系统,其包括用于产生第一多个输出信号的装置或用于产生第四多个扬声器信号的装置、多个扬声器和平移器,该平移器被配置为接收从输出信号导出的扬声器信号并且将扬声器信号平移到对应于可能与多个接收到的扬声器信号的数量不同的多个扬声器的多个扬声器信号。该平移器被配置为当将接收的信号平移到平移的扬声器信号时,保持与多个接收到的扬声器信号相关联的虚拟再现室的声音传播特性。
[0029] 这允许独立于装置的所生成的输出信号或扬声器信号的灵活的扬声器配置,因为这些信号可以包括与用于产生输出信号或扬声器信号的装置的延迟线相关的方向信息,使得可以保持那些空间信息。
[0030] 本发明的另外实施例涉及一种用于产生第一多个输出信号的方法、一种用于产生多个扬声器信号的方法以及一种计算机程序和一种扬声器信号。

附图说明

[0031] 将参考附图更详细地描述本发明的实施例,在附图中:
[0032] 图1示出了根据实施例的包括用于基于两个音频源信号产生多个输出信号的装置的声音再现系统的示意性框图;
[0033] 图2示出了根据实施例的用于产生扬声器信号的装置的示意性框图;
[0034] 图3示出了根据实施例的延迟路径的示意性框图;
[0035] 图4a示出了根据实施例的其中扬声器信号包括音频源信号的反射部分和混响部分的情况的示意性框图;
[0036] 图4b示出了根据实施例的其中均衡滤波器连接到延迟线的输出抽头的不同情况的示意性框图;
[0037] 图5a示出了根据实施例的被配置为对输出信号进行混响的反馈处理器的示意性框图;
[0038] 图5b示出了根据实施例的包括例如两个子室的虚拟再现室的示意图;
[0039] 图6a示出了根据实施例的虚拟再现室的上半球中的16个延迟线的分布的示意性俯视图;
[0040] 图6b示出了根据实施例的通过矩阵A的参数实现的虚拟扬声器之间的声耦合的示意性实现;
[0041] 图7示出了根据实施例的衰减滤波器的可能实现的示意性框图;
[0042] 图8示出了混响的示意性单通道表示,其中混响是具有直接声音、早期反射和后期混响的典型房间的冲激响应;
[0043] 图9示出了仅在二维中的混响的示意性空间表示;以及
[0044] 图10是根据现有技术的用于获得混响信号的构思。
[0045] 在下面的描述中,即使在不同的图中出现,同样的或等同的元素或者具有同样的或等同的功能的元素也由同样的或等同的附图标记来表示。

具体实施方式

[0046] 在以下描述中,阐述了多个细节以提供对本发明的实施例的更透彻的解释。然而,本领域技术人员将清楚的是,可以在没有这些具体细节的情况下实践本发明的实施例。在其他实例中,以框图形式而不是具体地示出了公知的结构和设备,以避免对本发明的实施例造成混淆。此外,除非另外具体指示,否则下文所述的不同实施例的特征可以彼此组合。
[0047] 图1示出了声音再现系统1000的示意性框图,其包括用于基于两个音频源信号104a和104b产生多个输出信号102a至102d的装置100。音频源信号可以是例如单声道信号,并且可以与虚拟音频对象(即,适于发出单声道信号的虚拟音频源)相关联。
[0048] 装置100被配置为基于音频源信号104a和104b产生输出信号102a至102d,使得输出信号102a至102d是音频源信号104a和104b的反射和/或混响版本,即,从音频源信号104a和104b导出输出信号102a至102d。由输出信号102a至102d携带的信息可以随时间变化。例如,输出信号可以是在第一时刻处在虚拟再现室130中的音频源信号的早期反射以及在第一时刻之后的第二时刻处音频源信号的混响版本。
[0049] 装置100包括四个延迟线106a至106d。每个延迟路径106a至106d包括延迟线108a至108d和衰减滤波器112a至112d。延迟线108a至108d被配置为接收音频源信号104a和104b以及混响音频信号114a至114d,即,每个延迟线108a至108d被配置为接收三个信号,两个音频源信号和一个混响音频信号。
[0050] 如稍后将更详细地描述的,每个延迟线108a至108d被配置为对接收的(输入)信号进行延迟并且组合接收的信号和延迟的信号,使得获得组合信号116。例如,通过不同的时间延迟,组合信号116包括音频源信号104a和104b以及混响信号114a、114b、114c或114c的延迟部分。延迟线108a至108d被描绘为标记为τ1至τ4的示意性块。示意性地,延迟线104a至104d可以被理解为延迟滤波器,例如,将接收的信号从一个方向(例如示意性滤波器结构的左侧)传送到另一方向(例如,示意性滤波器结构的右侧)的有限冲激响应(FIR)滤波器。简言之,信号输入到延迟线中越“左”,则其被延迟得越多。当参考延迟线108a时,音频源信号
104a比音频源信号104b延迟更大的时间延迟,并且混响音频信号114a比音频源信号104a延迟更长的持续时间。
[0051] 延迟路径106a至106d包括分别标记为α1、α2、α3、α4的衰减滤波器112a至112d。衰减滤波器116被配置为通过衰减延迟线108a至108d的组合信号116来提供(即,输出)输出信号102a至102d,并且可以实现为例如无限冲激响应(IIR)滤波器。通过在延迟线108a至108d中组合音频源信号104a和104b并通过衰减组合信号116,可以获得音频源信号104a和104b的早期反射。
[0052] 装置100还包括反馈处理器120,其被配置为对输出信号102a至102d进行混响,使得获得混响音频信号114a至114d。反馈处理器120可以被理解为例如对输出信号102a至102d进行交叉馈送。交叉馈送可以被描绘为例如矩阵运算。延迟路径可以形成延迟网络。反馈处理器120和延迟网络可以形成反馈延迟网络(FDN),其中反馈处理器120被配置为执行输出信号102到延迟网络的反馈和/或交叉馈送。
[0053] 装置100包括两个分配器118a和118b,其中分配器118a被配置为接收音频源信号104a,并且其中分配器118b被配置为接收音频源信号104b。分配器118a和118b被配置为将接收到的音频源信号104a或104b分配为多个版本(副本)。简言之,分配器118a和118b被配置为对接收到的音频源信号104a或104b进行划分或复制。所获得的版本104a′、104b′可以包括相对于相应音频源信号104a或104b的每个其它版本的无延迟或低延迟。低延迟可以例如低于或等于延迟线108a至108d的最大时间延迟的20%或10%或4%。分配器118a和118b还包括多个或大量放大器122,其被配置为分别单独放大或衰减版本104a′、104b′。所施加的增益或衰减可以例如与虚拟再现室中的声源的反射的强度或值相关。
[0054] 分配器118a被配置为提供音频源信号104a的多个单独(即,彼此独立)放大的版本104a”,其中版本104a”的数量可以等于延迟路径106a至106d的数量,使得每个延迟线108a至108d可以接收版本104a”之一。分配器118b可以包括多个放大器122,其被配置为独立地放大版本104b′以获得音频源信号104b的多个独立放大的版本104b”,其中所获得的版本
104b”或104b′的数量可以等于延迟线108a至108d的数量,使得每个延迟线108a至108d可以接收放大的版本104b”之一。由于每个延迟线106a至106d可以与虚拟扬声器相关联,所以每个放大器122的增益可以影响在诸如墙壁的声音反射结构处反射且在虚拟再现室中再现的声音对象的再现反射的特性。
[0055] 音频源信号104a和104b的版本(副本)和放大版本承载关于单声道信号(即,音频源信号104a和104b)的不变信息。关于延迟、衰减等的进一步处理,这些信号可以被视为不变。
[0056] 装置100的结构允许随着时间的推移,每个输出信号102a至102d包括音频源信号104a和104b的反射部分和混响部分,如将在下面的示例中所描述的:
[0057] 延迟线108a被配置为分别接收音频源信号104a、其放大版本104a”和音频源信号104b的放大版本104b”。音频源信号104b比音频源信号104a延迟更短的时间延迟,这由当与音频源信号104a的输入相比时音频源信号104b的输入被布置得更靠近延迟线108a的输出来指示。例如,当延迟线108a包括多个延迟块时,与音频源信号104b相比,音频源信号104a可被延迟更多数量的延迟块。因此,组合信号116包括从延迟的音频源信号104b导出的部分和被延迟更长时间的音频源信号104b的部分。组合信号116被提供给衰减滤波器112a。输出信号102a可以被描述为音频源信号104a和104b的被延迟和衰减并因此被反射的版本。
[0058] 如由在不同实际位置处的输入并且因此由延迟线108a至108d的时间延迟所指示的,其中所述输入分别接收音频源信号104a和104b、放大版本104a”和104b”,每个版本104a”可以与其他延迟线108a至108d相比被延迟不同的时间延迟。因此,当与其他延迟线
108a至108d相比时,音频源信号104b的每个版本104b”可以被延迟不同的时间延迟。因此,可以获得多个反射信号。
[0059] 输出信号102a至102d由反馈处理器120进行混响,然后提供给延迟路径106a至106d。混响信号114a至114d被延迟线108a至108d延迟并与音频源信号104a和104b组合。这允许在输出信号102a至102d中获得混响部分。
[0060] 另外的音频源信号可以馈送到延迟网络,即,进入多个延迟路径106a至106d。可以获得对另外的音频源信号的处理,而无需进一步布置延迟路径,并且因此不提供额外的存储器或滤波器级。替代地,可以仅对一个音频源信号进行处理,即,进行延迟和混响。
[0061] 可以根据虚拟扬声器132a至132d在虚拟再现室130中的位置来调整或设置音频源信号104a和104b的时间延迟,即,相对于延迟线108a至108d的信号输入的位置。虚拟再现室130可以被参数化为其中将再现或生成音频对象的参考场景。虚拟扬声器130a至130d被布置在虚拟再现室中的虚拟位置处,并且包括诸如方向和/或辐射图案之类的虚拟辐射特性。
在虚拟再现室130中的虚拟扬声器132a至132d的声音传播的位置和/或方向(声音到达方向)分别通过延迟线108a至108d由FDN相关(参数化)。简言之,虚拟再现室130可以用于获取延迟线108a至108d、衰减滤波器112a至112d和反馈处理器120的参数。
[0062] 延迟线108a至108d的延迟时间可以与虚拟扬声器132a至132d到虚拟再现室的声音反射结构的距离相对应。虚拟再现室的混响时间可以与衰减滤波器112a至112d的衰减因子相对应。衰减滤波器112a至112d的衰减因子和/或混响时间可以是频率相关的,即,第一频率可以利用不同于第二混响时间的第一混响时间来混响,不同于第一频率的第二频率通过第二混频时间混响。例如,衰减越高,混响时间可越短。因此,衰减滤波器112a至112d的滤波器系数可以与音频源信号相对于虚拟再现室130的混响时间相关。滤波器系数可以是时变的,例如,基于时变虚拟再现室130。
[0063] 因此,虚拟扬声器132a至132d与包括虚拟再现室130中的声音传播的虚拟方向在内的信息相关联。可以相对于其它虚拟扬声器132a至132d独立地调节每个虚拟扬声器132a至132d。通过改变延迟线108a至108d的时间延迟,可以影响虚拟再现室130中的相应虚拟扬声器132a至132d的位置,或者反之亦然。因此,虚拟扬声器设置可以以任何期望的形式来实现,例如,虚拟扬声器132a至132d可以均匀地分布在虚拟再现室130中。替代地,虚拟扬声器132a至132d可以例如相对于收听者的位置不均匀地分布,当与虚拟再现室130的其它部分相比时,收听者的左、右、前或后区域可以包括较高密度的扬声器。
[0064] 地板、天花板、墙壁和/或其它声音反射物体也可以被虚拟再现室或在虚拟再现室中参数化。因此,可以通过虚拟扬声器130a至130d再现在具有诸如方向的声音传播特性的虚拟再现室中发出声音的虚拟声音对象。虚拟再现室的声音传播特性,例如在墙壁等处的声音反射和/或声音衰减,可以至少部分地传送到延迟网络的参数中。例如,虚拟扬声器与虚拟再现室的墙壁之间的距离可以在声波被反射之前的行进时间(时间延迟)中传送。延迟线108a至108d的时间延迟可以表示在到达虚拟收听位置之前虚拟再现室中所传播声音的延迟。每个延迟路径106a至106d可以与虚拟再现室130中的虚拟扬声器130a至130d有关。这允许基于多个虚拟扬声器130a至130d而不是基于多个再现的声源来衡量装置100。
[0065] 基于虚拟音频源在虚拟再现室130中的可变位置,时间延迟也可以变化,例如,当虚拟音频源移动到靠近墙壁时,则所发出的声音被更早地反射。装置100包括输入控制器140,其被配置为将音频源信号104a和104b、放大版本104a”和104b”分别与延迟线108a至
108d的不同输入连接,其中所述不同输入与相应输入和输出之间的不同时间延迟相关。简言之,输入控制器140被配置为接收与所需或目标时间延迟相关的参数,并且对音频源信号被延迟线108a至108d延迟的时间延迟进行适配。
[0066] 输出信号102a至102d可以例如存储在数据存储器上或中,例如硬盘驱动器、数字视频盘(DVD)、互联网或其它媒介。替代地,可以将输入信号102a至102d提供给均衡网络141,该均衡网络包括被配置为对输出信号102a至102d进行频谱整形的均衡滤波器142a至
142d。均衡滤波器142a至142d的频谱整形可以根据在虚拟再现室中发出的声音的声音传播特性和/或声音传播的方向来实现。例如,当虚拟再现室130的墙壁适于衰减高频时,均衡滤波器142a至142d可以根据这种特性来实现,并且可以允许根据声音方向进行声音调节。
[0067] 因此,均衡滤波器142a至142d的输出信号144a至144d可以被配置用于再现包括虚拟音频对象、虚拟再现室130和虚拟扬声器132a至132d的虚拟再现场景,如虚拟再现室130和虚拟扬声器132a至132d是真实的那样。所获得的信号144a至144d可以存储在存储介质上和/或提供给音频系统1000的平移器150,其中,平移器150被配置为根据实际再现室160中的真实扬声器162的数量而以数字提供(实际)扬声器信号152a至152f。简言之,平移器150被配置为将数量符合虚拟扬声器132a至132d的数量的多个扬声器信号144a至144d平移到数量符合真实扬声器162a至162f的数量的多个扬声器信号152a至152f。通常,真实扬声器152a至152f的数量可以高于或低于虚拟扬声器132a至132d的数量。当产生输出信号102a至
102d和/或扬声器信号144a至144d时,真实扬声器的数量可以取决于用户设置,并且甚至可以是未知的。因此,输出信号102a至102d和/或扬声器信号144a至144d的产生可以被认为是独立于再现室的。因此,输出信号102a至102d、延迟路径106a至106d和用于对输出信号进行滤波的均衡滤波器142a至142d的数量可以相等。简言之,延迟线106a至106d与虚拟再现室
130中的早期反射的声音传播的方向相关联。均衡滤波器142a至142d的滤波器参数可以基于声音传播的方向来适配。
[0068] 再现音频场景可以包括再现直接声音,即,从再现的音频对象到收听者的未反射的信号。音频再现系统1000可以包括均衡滤波器143a和143b,其被配置为对音频源信号104a和/或104b进行均衡(即,频谱整形),以获得频谱整形的音频源信号145a和145b。平移器150可以被配置为接收音频源信号104a和104b和/或频谱整形信号145a和145b。平移器
150还可以被配置为分别基于扬声器信号144a至144d和音频源信号104a和104b、其频谱整形版本来提供扬声器信号152a至152f。简言之,平移器150可以提供包括与直接声音、与早期反射和与后期混响相关的信息在内的扬声器信号152a至152d。
[0069] 尽管均衡滤波器152a至152d被描述为被配置为接收输出信号102a至102d,但是均衡滤波器142a至142d还可以被配置为接收中间延迟线信号,所述中间延迟线信号例如不被衰减滤波器112a至112d衰减。稍后描述这种情况,该情况允许获得扬声器信号144a至144d以及在没有反射部分的情况下包括混响信号的扬声器信号152a至152d。
[0070] 装置100可以包括被配置为将均衡滤波器142a至142d连接到延迟线108a至108d的输出抽头的输出控制器170。在输出抽头处,可以获得中间延迟线信号。基于虚拟再现室的变化的声音反射特性,输出控制器170进一步被配置为将均衡滤波器142a至142d与延迟线108a至108d的输出抽头断开连接和/或将均衡滤波器142a至142d连接到另一输出抽头。根据实施例,至多一个输出抽头连接到均衡滤波器142a至142d。输入控制器140和输出控制器
170两者可以被配置为分别仅连接延迟线的一个输入抽头,仅连接一个输出抽头。
[0071] 图2示出了根据实施例的用于产生扬声器信号144a至144d的装置200的示意性框图。当与装置100相比时,装置200包括均衡滤波器142a至142d,使得输出信号102a至102d可以在内部进行频谱整形,即,装置200被配置为输出扬声器信号144a至144d作为输出信号。
[0072] 装置200包括延迟网络202,该延迟网络包括延迟路径106a至106d。延迟网络202和反馈处理器120形成FDN,其中反馈处理器120被配置为执行输出信号102到延迟网络202的反馈和/或交叉馈送。
[0073] 换言之,在图1和图2中,提出了一种新颖的延迟网络多通道混响器,其允许利用大量扬声器定位大量声源,同时保持计算效率。FDN被扩展以创建大量的空间可分配的去相关通道以及针对所有源的单独的早期反射和对空间混响时间和频谱功率的增益控制。
[0074] 延迟线的数量和源的数量可从一扩展到更高的整数。在诸如图10所示的现有设计中,在不同网络中获得早期反射和后期混响,这些网络可能必须根据输入通道(源)的数量来衡量。此外,FDN不具有明确的方向信息,有时甚至通过诸如正交混合的高密度技术使其最小化。在图1和图2所示的反馈延迟网络中,通过直接馈入虚拟扬声器或通过根据虚拟扬声器132a至132d适配延迟路径106a至106d,延迟线输出(即,输出信号102a至102d)被给予方向信息。然后,这些虚拟扬声器通过平移器150的平移算法被渲染到诸如再现室130的再现室中。根据实际的渲染情况,可以保证混响输出以最大的灵活性再现正确的空间特性。
[0075] 与已知构思相比,将延迟线直接分配给虚拟扬声器132a至132d的虚拟方向可以提供优选的解决方案。反之亦然,角度方向被分配给每个滤波的延迟线输出(输出信号102a至102d),并因此分配给延迟线108a至108d本身。与现有设计相比,延迟线108a至108d和虚拟扬声器130a至130d之间的一一对应关系(例如延迟线108a至虚拟扬声器130a)可以被认为是重要的或甚至最重要的,可以将空间设计引入FDN框架。类似地,衰减滤波器112a至112d和输出均衡滤波器142a至142d可以与空间方向相对应。
[0076] 然后,由虚拟再现室130中的虚拟扬声器132a至132d指示的通道方向平移到实际再现室160中的所需输出扬声器设置。每个虚拟扬声器132可以被理解为围绕收听者的球体上的点源,其可以由物理扬声器根据其相对位置以加权增益再现。例如,如[6]所述的基于矢量的幅度平移(VBAP)可以用作简单有效的选择。替代地,特别是在使用诸如至少20个、至少30个或至少50个的大量扬声器的情况中,平移可以被执行为所谓的硬平移,即,扬声器信号144a至144d被提供给最接近的真实扬声器162a至162f,即具有与发射声音信号的虚拟扬声器132a至132d最近距离的真实扬声器。
[0077] 虚拟再现室的中间步骤允许在扬声器设置的选择中具有高或甚至最大的灵活性,并且以良好的水平或甚至尽可能最佳地保持混响的空间和声学特征。在多通道扬声器设置的计算复杂度方面,所得到的混合矩阵,即反馈处理器120,非常稀疏。
[0078] 延迟线108a至108d被定位成使围绕收听位置的平移球体离散。该特定定位可以在声音设计上进行平移,例如,它们可以等距地放置在球体上,或者可以通过延迟线的数量来增强球体的某些部分。
[0079] 根据目标扬声器设置,可以省略球体的某些部分,可以凝集其他部分,例如:针对如5.1+4或22.2的扬声器设置,可以省略下半球的大部分,或者根据应用,可能有利的是在前面(自然阶段方向)放置更多的延迟线。这样的区域在图9中表示为“前”。可以注意到,虚拟扬声器的角度分辨率可以高于物理扬声器的布置。
[0080] 图3示出了延迟路径106a的示意性框图,其中以下描述也适用于其它延迟路径106b至106d。延迟路径106a包括例如被实现为有限冲激响应滤波器的延迟线108a。延迟线
108a包括多个输入抽头302a至302d。例如,延迟线108a可以包括至少4个、至少16个、至少
500个或甚至至少1000个输入抽头302a至302d。输入抽头302a至302d被配置为接收音频源信号(诸如音频源信号104a和104b)、其版本和/或放大版本。例如,图1所示的输入控制器
140可以将第一音频源信号连接到输入抽头302a至302d之一或与输入抽头302a至302d之一断开连接,同时不将该输入信号连接到其它输入抽头,使得音频源信号在一个输入抽头处连接到延迟线108a。这允许延迟线的时变延迟时间。输入控制器140可以被配置为将相同或不同的输入抽头302a至302d连接到另一音频源信号和/或将输入信号或其(放大的)版本连接到不同的延迟线。
[0081] 输入抽头302a至302d被顺序地排列并且在两个输入抽头302a至302d之间具有延迟块304a至304d。因此,在输入抽头302a处接收的信号被转发到延迟块304a,被延迟,然后被转发到第二输入抽头302b。当第一输入抽头302a接收混响音频信号114a时,并且当第二输入抽头302b接收音频源信号104a时,混响音频信号114a在第二输入抽头处与音频源信号104a组合。最后输出抽头(例如,输出抽头306c)可以是提供组合信号116的滤波器的输出,使得“最后”中间延迟线信号(例如,308c)可以是组合信号。
[0082] 替代地或另外,例如,当第三输入抽头302c接收音频源信号104b时,在第三输入抽头302c处,混响音频信号114a、音频源信号104a和音频源信号104b被组合。信号114a、104a和104b中的每一个被延迟不同的时间延迟,即,不同数量的延迟块304a至304c。在输入抽头302a至302d处组合的信号可以通过增益因子或衰减因子k1-k3被放大或衰减。随后的放大或衰减信号在输出抽头306a至306c处组合,其中在输出抽头306a至306c处可以获得中间延迟线信号308a至308c。例如,输出控制器170可以将输出抽头306a至306c之一或衰减滤波器
112a的输出与均衡滤波器142a连接或从均衡滤波器142a断开连接,使得均衡滤波器142a可以接收中间延迟线信号308a至308c或输出信号102a之一。
[0083] 图4a和图4b描绘了用于获得扬声器信号144的不同情况的示意性框图。
[0084] 图4a示出了其中扬声器信号144包括音频源信号104a的反射部分和混响部分的情况的示意性框图。可以是例如延迟线108a至108d之一的延迟线108i被配置为在第一输入处接收混响音频信号114i,例如混响音频信号114a至114d之一。在可以是诸如输入抽头302a至302d之一的任何输入抽头的输入抽头302i处,延迟线108i被配置为接收音频源信号104a的放大版本104a”。因此,混响音频信号114i和音频源信号302i在输入抽头302i处组合。
[0085] 从输入抽头302i到滤波器输出的延迟时间(即,直到衰减滤波器112i接收到组合信号116)可以被认为是反射延迟。衰减滤波器112i的输出信号102i(例如,输出信号102a至102d之一)被转发到均衡滤波器142i,使得扬声器信号144i包括混响部分和反射部分。当延迟线108i和/或衰减滤波器112i的滤波器例如处于初始或基本状态时,混响信号114i也可以是静态的和/或初始的,例如处于零状态。当音频源信号104被施加到系统并且延迟线
108i接收到其放大版本时,扬声器信号144i可以首先仅包括反射部分,因为混响信号114i在下一迭代中与零状态不同。简言之,音频源信号首先通过延迟线108i的部分行进一次,使得扬声器信号144i基于延迟(反射)的音频源信号。然后,输出信号102i被混响并与音频源信号组合,使得在随后的时间间隔中扬声器信号144i基于反射和混响部分。
[0086] 图4b示出了其中均衡滤波器142i连接到输出抽头306i(例如,输出抽头306a至306c之一)的不同情况的示意性框图。当在时域中被示意性地示出时,输出抽头306i布置在连接到音频源信号的输入抽头302i之“前”。因此,当从零状态考虑时,音频源信号首先被延迟,然后由衰减滤波器112i衰减,由反馈处理器120混响,并输入到延迟线108i。中间延迟线信号308i连接到均衡滤波器142i。基于这种情况,当与零状态不同时,扬声器信号144i可以总是包括混响部分。由此,可以获得具有低早期反射或甚至没有早期反射的信号。这样的情况可能是期望的,例如,当在不再发生明显的早期反射的情况下(例如在扩散情况下)再现声音场景时。
[0087] 换句话说,对于每个源,可以以如下方式选择高达延迟线数量的输入抽头(即,输入抽头):以增益、延迟和近似方向确定第一反射,并且所有反射由衰减滤波器滤波。与已知的现有方法相比,所提出的装置和方法具有降低的计算成本。在不需要空间早期反射的情况下,如图4b所示的替代方法可以实现为延迟线设计。图4a和图4b之间的差异仅在于输出抽头(即,输出抽头308i)的位置连接到均衡滤波器。代替反馈矩阵输入(即,输出信号102i),输出(即,中间延迟线信号308i)以源输入抽头放置在输出抽头之后的方式取自延迟线108i的开始(在连接输入之前的部分)。因此,输出信号由反馈处理器(反馈矩阵)处理至少一次,并且可能地分配到所有延迟线方向。这导致较不突出的早期反射和更快的反射密度增加。
[0088] 图5a示出了被配置为对输出信号102a至102d进行混响的反馈处理器120的示意性框图。如矩阵运算所示,反馈处理器被配置为将输出信号102a至102d与不同混响参数a11至a44组合。矩阵A的对角线上的参数a11、a22、a33和a44表示输出信号102a至102d的变化(放大或衰减)。其它值表示其它输出信号102a至102d对相应输出信号的影响(混响)。因此,混响音频信号114a至114d可以基于一个或多个输出信号102a和/或由一个或多个输出信号102a影响。参数a11至a44的值可以表示虚拟再现室的配置,例如影响混响的虚拟再现室的扬声器设置和/或反射特性。简言之,可以标记如下矩阵运算,例如:
[0089] r=A*o或者,替代地rT=oT*AT
[0090] 其中,r表示包括混响信号114a至114d的矢量,A表示混响矩阵,o表示输出信号102a至102d,xT表示x的转置版本。
[0091] 图5b示出了虚拟再现室130的示意图,其包括例如两个子室136a和136b。子室136a可以是例如房间的前侧或第一侧。虚拟再现室130包括例如由房间中的虚拟物体和/或物体或墙壁的材料以及结构本身所限定的传播特征。
[0092] 当与子室136a相比时,子室136b可以是例如虚拟再现室130的后侧或第二不同侧。子室136a可以由参数块U1(包括参数a11至a44的子集)参数化。子室136b可以由参数块U2(包括参数a11至a44的至少部分不同的子集)参数化。参数块V1和V2分别表示从第一子室136a到第二子室136b的声耦合、从第二子室136b到第一子室136a的声耦合。矩阵A可以根据参数块U1、U2、V1和V2来构造。子室136a和136b也可以是包括彼此之间的声耦合的两个不同的房间,例如由门连接的两个房间。这允许虚拟再现室130的简单参数化。可以基于保持的反射和/或混响的方向信息来获得参数化。
[0093] 换句话说,通常选择反馈矩阵A来控制反射密度。矩阵中的每个条目指示从一个延迟线到另一延迟线的增益。矩阵越密集,混响尾部将越密集。所提出的装置和方法允许将矩阵A细分为定向部分以控制反射随时间的定向传播。延迟线的虚拟方向是已知的,使得矩阵条目指示从一个方向到另一方向的传播,例如,对角线条目保持该方向。对于每个方向彼此混合的均匀房间,统一的矩阵增益可能是适当的。两个声学耦合的房间(例如,房间和相邻的走廊)可以通过2×2块矩阵来实现。
[0094] 对角线块U1和U2分别控制例如前房间和后房间的混合。非对角线块V1和V2可以控制耦合的房间之间的泄漏。
[0095] 图6a示出了虚拟再现室130的上半球中的16个延迟线的分布的示意性俯视图。每个点603对应于虚拟扬声器在虚拟再现室130中的位置,并且可以通过相关延迟路径的参数进行调整。因此,虚拟扬声器至少部分地由虚拟延迟线角位置(即,基于延迟路径的延迟线的参数的位置)来定义。虚拟扬声器分布不均匀,即,不对称地分布。十六个虚拟扬声器中的十个相对于收听者的位置604并且相对于指示为零度的前方向而布置在前部中。十六个虚拟扬声器中的六个布置在虚拟再现室的后部区域中。根据十六个个虚拟扬声器的数量,装置100或200包括16个延迟路径。换句话说,图6a示出了上半球中16个延迟线的分布。
[0096] 图6b示出了通过矩阵A的参数实现的虚拟扬声器之间的声耦合的示意性实现。箭头606中的每一个描绘了两个扬声器之间的耦合,即,不等于零的参数aij。相反,虚线箭头608指示沿着相应路径不存在可以通过等于零的参数aij来实现的声耦合。布置在前部区域中的灰色阴影表面例如对应于虚拟再现室130的第一子室136a。布置在虚拟子室130的后面的灰色阴影表面可以例如对应于子室136b。由于延迟线与虚拟扬声器在虚拟再现室中的方向和位置相关,所以它还可以与虚拟扬声器和虚拟再现室130的声音反射结构之间的距离相关。aij还可以表示为混响参数,因为混响参数与基于虚拟再现室的声耦合对声音信号的混响相关。可以根据虚拟再现室130的混响特性来调整参数aij。因此,混响时间和因此相应的滤波器系数可以根据和/或取决于(声音)到达的方向来调配。
[0097] 因此,可以不同地调整与布置在不同子室中的虚拟扬声器相关的衰减滤波器和/或均衡滤波器,即,可以实现不同的混响特性。
[0098] 换句话说,图6b示出了用于针对前耦合和后耦合的方向相关混合的示意性方案,并且包括对在图6a的延迟线分布中的延迟线方向之间描绘为箭头的增益路径的选择。简单房间几何中的混响时间可以通过单个曲线来描述。耦合房间的更极端情况或像具有高拱顶形天花板的大教堂似的不均匀房间可以具有方向相关混响时间。所提出的方法和装置允许对混响时间的方向相关调整。这是基于方向相关混合矩阵A的。如果块几乎是隔离的,并且混合正缓慢地传播,则衰减滤波器112a至112d的频谱滤波对于每个方向保持不变。按照图5b和图6b所示的耦合房间的上述示例,通过选择房间和走廊(即,子室136a和136b)中的衰减滤波器的不同衰减强度,可以在前部和后部实现不同的混响时间。另一示例是在大教堂的圆顶天花板上的长混响时间。在音乐厅内,在乐团方向的短混响时间以及后部侧面的更长的混响时间可以创造一个音乐平衡的环境。
[0099] 图7示出了衰减滤波器112a的可能实现的示意性框图,其中以下描述也适用于衰减滤波器112b至112d。衰减滤波器112a被配置为控制反馈延迟网络的混响时间和扩散性。早期反射的着色和扩散可能带有房间几何和边界材料的重要感知线索。布置在延迟的输出处的衰减滤波器112a可以确保在反馈延迟网络输出中不存在直接信号的未处理副本,这可以例如在音频源信号连接到延迟路径的延迟线的最后输入抽头时来获得。当衰减滤波器
112a被布置用于调节混响时间时,可以实现对早期反射的滤波,而不需要在额外滤波器方面的额外成本。尽管衰减滤波器112a被描绘为被实现为直接形式的2无限冲激响应(IIR)结构,但是衰减滤波器112a也可以被实现为另一种滤波器类型,例如直接形式的1 IIR结构,如级联IIR滤波器、晶格滤波器等。替代地,还可以布置具有有限冲激响应结构的滤波器。
[0100] 换句话说,为了在方向和时间上进行一定的反射,可以选择到期望到达方向的最近延迟线,并且将输入抽头以适当的距离放置在延迟线中。早期反射的方向由角度延迟线分布近似,并且可以反映早期反射的降低的DOA感知。与已知方法相比,无论渲染多少输入源,对于外部延迟线都不需要额外的存储器。此外,可以省略用于早期反射的专用平移单元。在已知方法中,通常需要进行早期反射输出的额外处理以避免未衰减的早期反射。对于额外输入抽头的计算成本实际上等于早期反射输出抽头的成本。
[0101] 通常,例如通过针对图1和图2中的均衡滤波器142a至142d所描述的频谱整形来调整混响的总频谱功率。这可以在装置中的FDN输出处或作为外部装置来执行。因此,频谱功率调整可以基于通道执行。然而,通常房间具有不同的边界材料,并因此改变频谱功率曲线,例如,与从刚性材料弹起的前反射相比,由于软的后壁,后反射具有较少的行程。上述实施例允许频谱功率的方向相关调整。当虚拟再现室130中的延迟线108a至108d的平移方向是已知的时,可以根据该方向设计均衡滤波器142a至142d。使用这个概念,空间频谱功率可以独立于最终扬声器设置并且在所有选择上是一致的。所提出的概念将早期反射整合到现有的FDN框架中。对于每个输入源,即音频源信号,在每个延迟线上存在输入抽头,如针对图1在图3中所述。输入抽头和输出抽头之间的“距离”可给出反射延迟。反射的增益由放大器
122所施加的输入抽头增益来确定。
[0102] 所提出的概念呈现了用于空间多通道参数混响的技术。它是基于作为延迟网络混响器的最通常代表的反馈延迟网络。
[0103] 所提出的概念引入了延迟线的空间解释。虚拟收听室的中间级别通过平移算法向目标扬声器设置给予加权灵活性。因此,用于早期反射的综合技术是适用的。同时,可以保持计算成本,并且可以控制到达方向。此外,所提出的方法允许有效地调整方向相关频谱功率、混合和混响时间。所提出的概念允许在3D多通道扬声器设置中创建用于回放的空间混响。因此,所提出的概念提供了用于空间多通道参数混响的技术。提出了一种新颖的延迟网络多通道混响器,其允许用大量扬声器定位大量声源,同时保持计算效率。所提出的概念引入了延迟线的空间解释和用于处理早期反射的综合技术。此外,所提出的概念允许有效地调整方向相关频谱功率、混合和混响时间。
[0104] FDN和/或均衡滤波器的衰减滤波器可以被实现为具有低数量滤波器系数(例如至多200个、至多100个或至多50个)和/或低阶滤波器(例如至多8阶、5阶或3阶或更低)的IIR滤波器。可以基于组合信号的频率选择性混响时间来调整衰减滤波器的衰减因子。均衡滤波器的滤波器系数可以分别基于输出信号、中间延迟线信号的频率选择性频谱能量。此外,衰减滤波器和/或均衡滤波器的滤波器系数可以根据要实现的声音的到达方向来设置。
[0105] 尽管上述实施例涉及多达四和十六条延迟线,但是其它实施例涉及不同数量的延迟线,并因此涉及虚拟扬声器,例如至少三个、至少八个、十二个或十六个。
[0106] 尽管上述实施例涉及反馈处理器的实现,使得反馈处理器被配置为执行基于矩阵的运算,但是反馈处理器可以替代地或另外地配置为执行其它类型的运算,例如与矩阵相关(例如,与IIR或FIR滤波器相关)的卷积运算、变换、差分、除法和/或非线性运算。
[0107] 尽管上述实施例涉及包括六个扬声器的再现室,但是再现室还可以包括不同数量的扬声器,例如至少两个、至少四个、十个或更多个。
[0108] 尽管上述实施例涉及延迟线被实现为FIR滤波器,但是延迟线还可以被实现为不同类型的滤波器和/或没有衰减或增益参数。例如,可以数字地实现多个延迟块,使得延迟线可以由用于延迟信号的简单数量的延迟块来表征。
[0109] 尽管上述实施例涉及包括两个子室或一个房间的虚拟再现室,但是虚拟再现室还可以包括三个或更多个子室。因此,矩阵A还可以包括可以彼此分离或组合(部分重叠)的不同数量的参数块,并且其中多个参数块和/或延迟路径可以基于子室之间的多个耦合路径。然而,尽管矩阵A被描绘为二次的,但是基于耦合参数,矩阵A还可以是非二次的和/或包括具有非二次形式的一个或多个子室相关矩阵。
[0110] 虽然已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示对相应方法的描述,其中,框或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方案也表示对相应块或项或者相应装置的特征的描述。
[0111] 新颖的编码音频信号可以存储在数字存储介质上,或者可以在诸如无线传输介质或有线传输介质(例如,互联网)等的传输介质上传输。
[0112] 取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行该实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。
[0113] 根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。
[0114] 通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
[0115] 其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
[0116] 换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
[0117] 因此,本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。
[0118] 因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
[0119] 另一实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
[0120] 另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
[0121] 在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
[0122] 上述实施例对于本发明的原理仅是说明性的。应当理解的是:本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。
[0123] 文献
[0124] [1]S.Diedrichsen,″Methods,modules,and computer-readable recording media for providing a multichannel convolution reverb,″Patent US8 363 843 BB,2013.
[0125] [2]P.S.Anand,″Method and device for artificial reverberation,″Patent US2 002 067 836 AA,2001.
[0126] [3]J.M.Jot,″Method and system for artificial spatialisation of digital audio SignalS,″Patent US5 491 754 A,1996.
[0127] [4]J.-M.Jot,“An analysis/synthesis approach to realtime artificial reverberation,”in International Conference on Acoustics,Speech,and Signal Processing,ICASSP-92.,vol.2.IEEE,1992,pp.221-224.
[0128] [5]L.Dahl and J.-M.Jot,“A reverberator based on absorbent all-pass filters,”in Proc.COST G-6Conference on Digital Audio Effects(DAFX-00),2000.[0129] [6]V.Pulkki,“Virtual sound source positioning using vector base amplitude panning,”Journal ofthe Audio Engineering Society,vol.45,no.6,pp.456-466,1997.
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用