将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元转让专利

申请号 : CN201710457835.3

文献号 : CN107040861B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 于尔根·赫勒法比安·卡驰迈克尔·卡拉舒曼阿西姆·孔茨克里斯托弗·佛里尔

申请人 : 弗朗霍夫应用科学研究促进协会

摘要 :

用于执行将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法的计算机程序,方法包括:提供与多个输入声道的每个输入声道相关联的规则的集合,其中规则定义相关联的输入声道与输出声道的集合之间的不同映射。对于多个输入声道的每个输入声道,访问与输入声道相关联的规则,确定访问的规则中定义的输出声道的集合是否存在于输出声道配置中,以及如果访问的规则中定义的输出声道的集合存在于输出声道配置中,选择访问的规则。根据选择的规则将输入声道映射至输出声道。

权利要求 :

1.一种非临时性计算机可读存储介质,其中存储有计算机程序,当其在计算机或处理器上运行时,用于执行将输入声道配置(404)的多个输入声道映射至输出声道配置(406)的输出声道的方法,所述方法包括:提供与所述多个输入声道的每个输入声道相关联的规则集合(400),其中所述规则定义相关联的所述输入声道与输出声道集合之间的不同映射;

对于所述多个输入声道的每个输入声道,访问(500)与所述输入声道相关联的规则,确定(502)访问的所述规则中定义的所述输出声道集合是否存在于所述输出声道配置(406)中,以及如果访问的所述规则中定义的所述输出声道集合存在于所述输出声道配置(406)中,则选择(402,504)访问的所述规则;以及根据选择的所述规则,将所述输入声道映射(508)至所述输出声道,

其中所述规则集合中的所述规则被按优先顺序排列,其中较高排序的规则比较低排序的规则更优先地被选择,并且包括以下至少一个:其中定义将所述输入声道映射至与水平收听者平面中的所述输入声道具有较低方向偏差的一个或多个输出声道的规则比定义将所述输入声道映射至与所述水平收听者平面中的所述输入声道具有较高方向偏差的一个或多个输出声道的规则被更高优先排序,其中定义将输入声道映射至具有与所述输入声道相同仰角的一个或多个输出声道的规则比定义将所述输入声道映射至具有与所述输入声道的仰角不同的仰角的一个或多个输出声道的规则被更高优先排序,其中在所述规则集合中,最高优先排序的规则定义具有相同方向的所述输入声道与输出声道之间的直接映射,以及

其中与具有90度仰角的输入声道相关联的规则集合中的一个规则定义将所述输入声道映射至具有比所述输入声道的所述仰角更低的第一仰角的全部可用输出声道,并且所述规则集合中的另一较低优先排序的规则定义将所述输入声道映射至具有比所述第一仰角更低的第二仰角的全部可用输出声道。

2.如权利要求1所述的非临时性计算机可读存储介质,其中所述方法包括:如果访问的所述规则中定义的所述输出声道集合不存在于所述输出声道配置(406)中,则不选择访问的所述规则,并且重复访问、确定及选择与所述输入声道相关联的至少一个其它规则的步骤。

3.如权利要求1所述的非临时性计算机可读存储介质,其中所述规则定义待应用至所述输入声道的增益系数、待应用至所述输入声道的延迟系数、待应用以将输入声道映射至两个或更多个输出声道的平移法则、以及待应用至所述输入声道的频率相关增益中的至少一个。

4.如权利要求1所述的非临时性计算机可读存储介质,其中所述方法包括:以特定顺序访问所述规则集合中的所述规则直到确定访问的所述规则中定义的所述输出声道集合存在于所述输出声道配置(406)中,以便通过所述特定顺序给定所述规则的优先次序。

5.如权利要求1所述的非临时性计算机可读存储介质,其中假定传递较高声音质量的规则比假定传递较低声音质量的规则被更高优先排序。

6.如权利要求1所述的非临时性计算机可读存储介质,其中,在所述规则集合中,最高优先排序的规则定义具有相同方向的所述输入声道与输出声道之间的直接映射,所述方法包括:对于每个输入声道,在访问存储与每个输入声道相关联的规则集合中的其它规则的存储器(422)之前,检查具有与所述输入声道相同方向的输出声道是否存在于所述输出声道配置(406)中。

7.如权利要求1所述的非临时性计算机可读存储介质,其中,在所述规则集合中,最低优先排序的规则定义将所述输入声道映射至具有左输出声道及右输出声道的立体声输出声道配置的一个或两个输出声道。

8.如权利要求1所述的非临时性计算机可读存储介质,其中,与具有与前中心方向不同的方向的输入声道相关联的规则集合中的一个规则定义将所述输入声道映射至与所述输入声道位于所述前中心方向的同侧且位于所述输入声道的方向的两侧的两个输出声道,并且所述规则集合中的另一较低优先排序的规则定义将所述输入声道映射至与所述输入声道位于所述前中心方向的相同侧的单个输出声道。

9.如权利要求1所述的非临时性计算机可读存储介质,其中与包括前中心方向的输入声道相关联的规则集合中的规则定义将所述输入声道映射至两个输出声道,一个位于所述前中心方向的左侧,一个位于所述前中心方向的右侧。

10.如权利要求1所述的非临时性计算机可读存储介质,其中与具有与前中心方向不同的方向的输入声道相关联的规则集合中的规则定义使用小于1的增益系数将所述输入声道映射至与所述输入声道位于所述前中心方向的相同侧的单个输出声道,其中所述输出声道相对于前中心方向的角度小于所述输入声道相对于所述前中心方向的角度。

11.如权利要求1所述的非临时性计算机可读存储介质,其中定义将具有仰角的输入声道映射至具有比所述输入声道的所述仰角小的仰角的一个或多个输出声道的规则定义使用小于1的增益系数。

12.如权利要求1所述的非临时性计算机可读存储介质,其中定义将具有仰角的输入声道映射至具有比所述输入声道的所述仰角小的仰角的一个或多个输出声道的规则定义应用频率选择性处理。

13.如权利要求1所述的非临时性计算机可读存储介质,其中所述方法包括接收与所述输入声道相关联的输入音频信号,其中将所述输入声道映射(508)至所述输出声道包括评估(410,520)选择的所述规则以得到待应用至所述输入音频信号的系数,应用(524)所述系数至所述输入音频信号以便产生与所述输出声道相关联的输出音频信号,以及输出(528)所述输出音频信号至与所述输出声道相关联的扬声器。

14.如权利要求13所述的非临时性计算机可读存储介质,其中所述方法包括生成降混矩阵(414)以及将所述降混矩阵(414)应用至所述输入音频信号。

15.如权利要求13所述的非临时性计算机可读存储介质,其中所述方法包括应用修整延迟及修整增益至所述输出音频信号以便减少或补偿所述输入声道配置(404)及所述输出声道配置(406)中的各个扬声器与中心收听者位置的距离之间的差。

16.如权利要求13所述的非临时性计算机可读存储介质,其中所述方法包括:当评估定义将输入声道映射至包括特定输出声道的一个或两个输出声道的规则时,将实际输出配置的输出声道的水平角与规则集合中定义的所述特定输出声道的水平角之间的偏差列入考虑,其中所述水平角表示在水平收听者平面内相对于前中心方向的角度。

17.如权利要求1所述的非临时性计算机可读存储介质,其中所述方法包括修改增益系数,所述增益系数在定义将具有仰角的输入声道映射至具有比所述输入声道的仰角低的仰角的一个或多个输出声道的规则中被定义,以便将实际输出配置中的输出声道的仰角与所述规则中定义的一个输出声道的仰角之间的偏差列入考虑。

18.如权利要求13所述的非临时性计算机可读存储介质,其中所述方法包括修改规则中定义的频率选择性处理以将实际输出配置中的输出声道的仰角与所述规则中定义的一个输出声道的仰角之间的偏差列入考虑,所述规则定义将具有仰角的输入声道映射至具有比所述输入声道的仰角小的仰角的一个或多个输出声道。

说明书 :

将输入声道配置的多个输入声道映射至输出声道配置的输出

声道的方法和信号处理单元

[0001] 本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2014年7月15日、申请号为201480041264.X、发明名称为“将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元”的分案申请。

技术领域

[0002] 本发明涉及用于将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法及信号处理单元,特别地,涉及适用于不同扬声器声道配置之间的格式降混转换的方法及装置。

背景技术

[0003] 空间音频编码工具为业界众所周知且已经标准化,例如MPEG环绕标准。空间音频编码始于多个原始输入,例如5或7个输入声道,通过其在重现设置中的布置识别,例如识别为左声道、中声道、右声道、左环绕声道、右环绕声道、及低频加强(LFE)声道。空间音频编码器可从原始声道得到一个或多个降混声道,此外,可得到与空间线索相关的参数数据,如声道相干值中的声道间位准差、声道间相位差、声道间时间差等。一个或多个降混声道与指示空间线索的参数边带信息一起传送给空间音频解码器用于解码降混声道及相关联的参数数据,从而最终获得输出声道,其为原始输入声道的近似版本。声道在输出设置中的布置可以为固定,例如5.1格式、7.1格式等。
[0004] 此外,空间音频对象编码工具为业界众所周知且已经标准化,例如MPEG SAOC标准(SAOC=空间音频对象编码)。与始于原始声道的空间音频编码相反,空间音频对象编码始于非自动专用于某些渲染重现设置的音频对象。更确切地,音频对象在重现场景中的布置是灵活的且可由用户设置,例如通过将某些渲染信息输入空间音频对象编码解码器内。可选地或额外地,渲染信息可以作为额外的边带信息或元数据被传输;渲染信息可包括某个音频对象将被布置(例如经过一段时间)在重现设置中的哪个位置的信息。为了获得某个数据压缩,使用SAOC编码器对多个音频对象进行编码,通过根据某个降混信息对对象进行降混,SAOC编码器从输入对象计算一或多个传送声道。此外,SAOC编码器计算表示对象间线索的参数边带信息,如对象级差(OLD)、对象相干值等。如在SAC(SAC=空间音频编码)中,对于各个时间/频率拼贴块(tile)计算对象间参数数据。对于音频信号的某个帧(例如1024或2048个样本),考虑多个频带(例如24、32或64个频带),以便为每个帧及每个频带提供参数数据。例如,当音频片段有20帧且每个帧被划分为32个频带时,时间/频率拼贴块的数量为
640。
[0005] 期望的重现格式,即输出声道配置(输出扬声器配置)可与输入声道配置不同,其中输出声道的数量与输入声道的数量不同。因此,可以要求格式转换以将输入声道配置的输入声道映射至输出声道配置的输出声道。

发明内容

[0006] 本发明的目的在于提出一种以灵活的方式将输入声道配置的输入声道映射至输出声道配置的输出声道的被认可的办法。
[0007] 此目的由根据本发明实施例的方法、计算机程序信号处理单元及音频解码器实现。
[0008] 本发明的实施例提出一种用于将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法,该方法包括:
[0009] 提供与多个输入声道的每个输入声道相关联的规则集合,其中集合中的规则定义相关联的输入声道与输出声道集合之间的不同映射;
[0010] 对于多个输入声道的每个输入声道,访问与该输入声道相关联的规则,确定相关联的规则中定义的输出声道集合是否存在于输出声道配置中,以及如果访问的规则中定义的输出声道集合存在于输出声道配置中,选择该访问的规则;以及
[0011] 根据所选择的规则,将输入声道映射至输出声道。
[0012] 本发明的实施例提供一种计算机程序,当其在计算机或处理器上运行时,执行此种方法。本发明的实施例提供一种包括用于或被编程为执行此种方法的处理器的信号处理单元。本发明的实施例提供一种包括此种信号处理单元的音频解码器。
[0013] 本发明的实施例基于新颖的方法,其中描述潜在输入-输出声道映射的规则集合与多个输入声道中的每个输入声道相关联,并且其中对于给定输入-输出声道配置选择规则集合中的一个规则。由此,规则不与输入声道配置或与特定输入-声道配置相关联。因此,对于给定输入声道配置及特定输出声道配置,对于给定输入声道配置中存在的多个输入声道的每个,访问相关联的规则集合以便确定哪个规则匹配给定的输出声道配置。规则可直接定义待应用至输入声道的一个或多个系数,或可定义待应用的处理以得到待应用至输入声道的系数。根据系数,可生成系数矩阵如降混(DMX)矩阵,其可应用至给定输入声道配置的输入声道以将其映射至给定输出声道配置的输出声道。由于规则集合与输入声道相关联而非与输入声道配置或特定输入-输出声道配置相关联,因此本发明办法可以灵活的方式用于不同输入声道配置及不同输出声道配置。
[0014] 在本发明的实施例中,声道表示音频通道,其中各个输入声道及各个输出声道具有方向,其中相关联的扬声器相对于中心收听者位置定位。

附图说明

[0015] 将关于附图描述本发明的实施例,其中:
[0016] 图1显示3D音频系统的3D音频编码器的概述;
[0017] 图2显示3D音频系统的3D音频解码器的概述;
[0018] 图3显示用于实现可在图2的3D音频解码器中实现的格式转换器的实施例;
[0019] 图4显示扬声器配置的示意俯视图;
[0020] 图5显示另一扬声器配置的示意后视图;
[0021] 图6A显示用于将输入声道配置的输入声道映射至输出声道配置的输出声道的信号处理单元的框图;
[0022] 图6B显示根据本发明实施例的信号处理单元;
[0023] 图7显示用于将输入声道配置的输入声道映射至输出声道配置的输出声道的方法;及
[0024] 图8更详细地显示映射步骤的示例。

具体实施方式

[0025] 在详细描述本发明方法的实施例之前,给出其中可实现本发明方法的3D音频编解码系统的概述。
[0026] 图1和图2显示根据据实施例的3D音频系统的算法块。更具体地,图1显示3D音频编码器100的概述。音频编码器100在预渲染器/混合器电路102(可选择性地设置)处接收输入信号,更具体地,多个输入声道提供多个声道信号104、多个对象信号106及对应的对象元数据108给音频编码器100。通过预渲染器/混合器102处理的对象信号106(参考信号110)可被提供给SAOC编码器112(SAOC=空间音频对象编码)。SAOC编码器112生成提供给USAC编码器116(USAC=统一语音及音频编码)的输入。此外,信号SAOC-SI 118(SAOC-SI=SAOC边带信息)也提供给USAC编码器116的输入。USAC编码器116进一步从预渲染器/混合器直接接收对象信号120以及声道信号及预渲染的对象信号122。对象元数据信息108被应用至OAM编码器
124(OAM=对象元数据),OAM编码器124提供压缩的对象元数据信息126给USAC编码器。基于前述输入信号,USAC编码器116生成压缩输出信号MP4,如128所示。
[0027] 图2显示3D音频系统的3D音频解码器200的概述。音频解码器200,更具体地,USAC解码器202接收由图1的音频编码器100所产生的编码信号128(MP4)。USAC解码器202将接收到的信号128解码成声道信号204、预渲染的对象信号206、对象信号208、及SAOC传送声道信号210。进一步地,压缩的对象元数据信息212及信号SAOC-SI 214通过USAC解码器输出。对象信号208被提供给对象渲染器216,对象渲染器216输出渲染的对象信号218。SAOC传送声道信号210被提供给SAOC解码器220,SAOC解码器220输出渲染的对象信号222。压缩的对象元数据信息212被提供给OAM解码器224用于输出各个控制信号给对象渲染器216以及提供给SAOC解码器220用于生成渲染的对象信号218及渲染的对象信号222。解码器进一步包括混合器226,如图2所示,混合器226接收输入信号204、206、218及222用于输出声道信号228。如230指示,声道信号可直接输出给扬声器,例如32声道扬声器。可选地,信号228可提供给格式转换电路232,格式转换电路232接收信号228作为指示声道信号228被转换的方式的重现布局信号的控制输入。在图2描绘的实施例中,假设以信号可被提供给5.1扬声器系统(如
234指示)的方式完成转换。此外,声道信号228被提供给双耳渲染器236生成两个输出信号,例如用于耳机,如238指示。
[0028] 图1及2描绘的编码/解码系统可基于用于声道及对象信号的编码(参考信号104及106)的MPEG-D USAC编解码器。为了提高编码大量对象的效率,可使用MPEG SAOC技术。三个类型的渲染器可执行下列工作:渲染对象至声道,渲染声道至耳机,或渲染声道至不同扬声器设置(参考图2,附图标记230、234及238)。当对象信号被显式传输或使用SAOC参数化编码时,相应的对象元数据信息108被压缩(参考信号126)及多路复用为3D音频比特流128。
[0029] 图1及图2显示用于总体3D音频系统的算法块,下面将进一步详细地描述。
[0030] 可选择性地提供预渲染器/混合器102以在编码之前将声道加对象输入场景转换成声道场景。功能上而言其与对象渲染器/混合器相同,下面将详细描述。可以期望对象的预渲染以确保编码器输入处的确定性信号熵基本上与同时作用的对象信号的数量相独立。通过对象的预渲染,无需传输对象元数据。离散对象信号被渲染至编码器使用的声道布局。
从相关联的对象元数据(OAM)获得用于每个声道的对象的加权。
[0031] USAC编码器116为用于扬声器声道信号、离散对象信号、对象降混信号及预渲染的信号的核心编解码器。它基于MPEG-D USAC技术。它基于输入声道及对象分配的几何及语义信息而产生声道及对象映射信息,从而处理上述信号的编码。这个映射信息描述如何将输入声道及对象映射至USAC-声道元素(如声道对元素(CPE)、单声道元素(SCE)、低频音效(LFE)及四声道立体声元素(QCE))以及如何将CPE、SCE及LFE、及相对应信息传输至解码器。在编码器速率控制中考虑所有额外的载荷,例如SAOC数据114、118或对象元数据126。取决于渲染器的速率/失真要求及交互要求,可以以不同的方式进行对象的编码。根据实施例,下列对象编码变化是可能的:
[0032] ●预渲染对象:在编码之前,对象信号被预渲染及混合成22.2声道信号。后续编码链参见22.2声道信号。
[0033] ●离散对象波形:对象作为单声道波形提供给编码器。除了声道信号之外,编码器使用单声道元素(SCE)以发送对象。解码的对象在接收器端被渲染及混合。压缩的对象元数据信息被传输至接收器/渲染器。
[0034] ●参数对象波形:利用SAOC参数描述对象性质及彼此之间的关系。对象信号的降混由USAC编码。一起传输参数信息。取决于对象的数量及总数据速率,选择降混声道的数量。压缩的对象元数据信息被传输至SAOC渲染器。
[0035] 用于对象信号的SAOC编码器112及SAOC解码器220可基于MPEG SAOC技术。基于较少数量的被传输的声道及额外参数数据如OLD、IOC(对象间相干性)、DMG(降混增益),系统能够重建、修改及渲染多个音频对象。与分别地传输全部对象所要求的数据速率相比,额外参数数据显示显著较低的数据速率,使得编码非常有效率。SAOC编码器112以作为输入的对象/声道信号作为单声道波形,并输出参数信息(其被打包在3D音频比特流128内)及SAOC传送声道(其使用单声道元素被编码及传输)。SAOC解码器220从解码的SAOC传送声道210及参数信息214重建对象/声道信号,并基于重现布局、解压缩的对象元数据信息及选择性地基于用户交互信息生成输出音频场景。
[0036] 提供对象元数据编解码器(参考OAM编码器124及OAM解码器224),使得对于每个对象,通过对象性质在时间和空间中的量化而有效地编码说明对象在3D空间中的几何位置及体积的相关联元数据。压缩的对象元数据cOAM 126被传输至接收器200作为边带信息。
[0037] 对象渲染器216利用压缩的对象元数据以根据给定重现格式生成对象波形。每个对象根据其元数据被渲染至某个输出声道218。这个块的输出由部分结果的和产生。如果基于声道的内容以及离散/参数对象都被解码,在输出产生的波形228之前,或在将产生的波形228馈至后处理器模块如双耳渲染器236或扬声器渲染器模块232之前,通过混合器226混合基于声道的波形及渲染的对象波形。
[0038] 双耳渲染器模块236产生多声道音频材料的双耳降混,使得每个输入声道通过虚拟声源表示。在QMF(正交镜像滤波器组)域中帧式地进行处理,并且基于测量的双耳室脉冲响应进行双耳化。
[0039] 扬声器渲染器232在被传输的的声道配置228与期望的重现格式间转换。也可称作“格式转换器”。格式转换器进行转换成较少数量的输出声道,即产生降混。
[0040] 图3示出格式转换器232的可能实现。在本发明的实施例中,信号处理单元为此种格式转换器。格式转换器232(又称扬声器渲染器),通过将传送器(输入)声道配置的传送器(输入)声道映射至期望的重现格式(输出声道配置)的(输出)声道而在传送器声道配置与期望的重现格式间转换。格式转换器232通常进行转换成较少数量的输出声道,即进行降混(DMX)处理240。降混器240,优选地在QMF域中操作,接收混合器输出信号228及输出扬声器信号234。可提供配置器242(又称控制器),其接收下列信号作为控制输入:指示混合器输出布局(输入声道配置,即确定通过混合器输出信号228表示的数据的布局)的信号246,及指示期望重现布局(输出声道配置)的信号248。基于这个信息,控制器242优选地自动地生成用于给定组合的输出和输出格式的降混矩阵并将这些矩阵应用至降混器240。格式转换器232允许标准扬声器配置以及允许具有非标准扬声器位置的随机配置。
[0041] 本发明的实施例涉及扬声器渲染器232的实现,即用于实现扬声器渲染器232的功能的方法及信号处理单元。
[0042] 现在参考图4及图5。图4显示表示5.1格式的扬声器配置,包括表示左声道LC、中心声道CC、右声道RC、左环绕声道LSC、右环绕声道LRC及低频加强声道LFC的六个扬声器。图5显示另一个扬声器配置,包括表示左声道LC、中心声道CC、右声道RC及架高中心声道ECC的扬声器。
[0043] 下面,不考虑低频加强声道,因为与低频加强声道相关联的扬声器(重低音喇叭)的正确位置并不重要。
[0044] 在关于中心收听者位置P的特定方向布置声道。参考图5,通过方位角α及仰角β定义每个声道的方向。方位角表示声道在水平收听者平面300的角度且可表示各个声道关于前中心方向302的方向。如图4可知,前中心方向302可被定义为位于中心收听者位置P处的收听者的假定观察方向。后中心方向304包括相对于前中心方向300为180度的方位角。在前中心方向与后中心方向之间的前中心方向左侧的全部方位角都在前中心方向的左侧上,在前中心方向与后中心方向之间的前中心方向右侧的全部方位角都在前中心方向的右侧上。位于虚拟线306前方的扬声器为前扬声器,虚拟线306与前中心方向302正交且通过中心收听者位置P,位于虚拟线306后方的扬声器为后扬声器。在5.1格式中,声道LC的方位角α为向左30度,CC的α为0度,RC的α为向右30度,LSC的α为向左110度,及RSC的α为向右110度。
[0045] 声道的仰角β定义水平收听者平面300与中心收听者位置和与声道相关联的扬声器之间的虚拟连接线的方向之间的夹角。在图4的配置中,全部扬声器被布置在水平收听者平面300内,因此全部仰角皆为零。在图5中,声道ECC的仰角β可为30度。位于中心收听者位置正上方的扬声器将具有90度的仰角。布置在水平收听者平面300下方的扬声器具有负仰角。
[0046] 特定声道在空间中的位置,即与(特定声道)相关联的扬声器位置由方位角、仰角及扬声器距中心收听者位置的距离给定。
[0047] 降混应用将输入声道集合渲染成输出声道集合,其中输入声道的数量通常大于输出声道的数量。可以将一个或多个输入声道混合到相同的输出声道。同时,一个或多个输入声道可在多于一个输出声道上渲染。通过降混系数集合(可选地,公式化为降混矩阵)确定这种从输入声道至输出声道的映射。降混系数的选择显著地影响可实现的降混输出声音质量。坏的选择可能导致输入声音场景的不平衡混合或坏的空间重现。
[0048] 为了获得良好的降混系数,专家(例如音效工程师)可将其专业知识列入考虑,手动调谐系数。但是,在一些应用中有多个理由声明反对手动调谐:市面上的声道配置(声道设置)的数量增加,对于每个新配置要求新调谐效应。由于配置数量的增加,对于输入及输出声道配置的每种可能组合的DMX矩阵进行手动个别优化变得不合实际。新配置将出现在制造端上,要求自/至既有配置或其它新配置的新DMX矩阵。新配置可出现在已经部署降混应用之后,因而不再可能做手动调谐。在典型应用场景(例如起居室扬声器收听)中,遵照标准的扬声器设置(例如根据ITU-R BS 775的5.1环绕)规则之外的例外。用于这种非标准扬声器设置的DMX矩阵无法被手动优化,因为它们在系统设计阶段是未知的。
[0049] 现有的或先前提出的用于确定DMX矩阵的系统包括在许多降混应用中采用手动调谐的降混矩阵。这些矩阵的降混系数并非以自动方式得到,而是由音效师优化以提供最佳的降混质量。音效师可以在DMX系数的设计期间将不同输入声道的不同性质列入考虑(例如对于中置声道、对于环绕声道等的不同处理)。但如前文摘述,如果在设计过程后的后续阶段增加新输入和/或输出配置,对于每种可能输入-输出声道配置组合进行降混系数的手动推导是相当不合实际或甚至为不可能的。
[0050] 一种自动得到用于输入和输出配置的给定组合的降混系数的直接的可能是将每个输入声道作为虚拟声源处理,其在空间中的位置由与特定声道相关联的空间中的位置(即,与特定输入声道相关联的扬声器位置)给定。每个虚拟声源可由通用平移(panning)算法重现,例如2D中的正切定律平移,或3D中的矢量基幅值平移(VBAP),参考V.Pulkki:“Virtual Sound Source Positioning Using Vector Base Amplitude Panning”,音频工程学会期刊,45卷,456-466页,1997年。由此,所应用的平移定律的平移增益确定当将输入声道映射至输出声道时所应用的增益,即平移增益为期望的降混系数。虽然通用平移算法允许自动地得到DMX矩阵,但是因为各种理由,得到的降混声音质量通常为低:
[0051] -对于不存在于输出配置中的每个输入声道位置应用平移。这导致下述情况,输入信号非常经常地在多个输出声道上相干分布。这是不被期望的,因为其使得包络声音如混响的重现恶化。此外,对于输入信号中的离散声音分量,重现为幻象源造成来源宽度及染色的非期望的改变。
[0052] -通用平移不考虑不同声道的不同性质,例如,其不允许与其它声道不同地针对中置声道而优化降混系数。根据声道语义学针对不同声道差异地优化该降混通常将允许获得较高输出信号质量。
[0053] -通用平移不考虑心理声觉知识,其对于前向声道、边带声道等要求不同的平移算法。此外,通用平移导致用于间隔宽广扬声器上的渲染的平移增益,其不导致空间声音场景在输出配置上的正确重现。
[0054] -包括垂直间隔的扬声器上的平移的通用平移不导致良好结果,因为其并未考虑心理听觉效应(垂直空间知觉线索与水平线索不同)。
[0055] -通用平移并未考虑收听者大半转头朝向较佳方向(‘前方’,屏幕),因而传递次优结果。
[0056] 用于输入及输出配置的给定组合的降混系数的数学(即自动)推导的另一项提议已由A.Ando做出:“Conversion of Multichannel Sound Signal Maintaining Physical Properties of Sound in Reprodcued Sound Field”,关于音频、语音及语言处理的IEEE学报,19卷,6期,2011年8月。这个推导也基于并未考虑输入及输出声道配置的语义学的数学公式。因而其也具有与正切定律或VBAP平移方法相同的问题。
[0057] 本发明的实施例提出用于不同扬声器声道配置之间的格式转换的新颖方法,其可进行为将多个输入声道映射至多个输出声道的降混处理,其中输出声道的数量通常小于输入声道的数量,并且其中输出声道位置可与输入声道位置不同。本发明的实施例指向改进这种降混实现的性能的新颖方法。
[0058] 虽然关于音频编码描述本发明的实施例,但是应注意的是,所描述的与新颖降混相关的方法也可应用至通常降混应用,即例如不涉及音频编码的应用。
[0059] 本发明的实施例涉及用于自动生成可应用于降混应用(例如用于前文参考图1至3描述的降混方法)的DMX系数或DMX矩阵的方法及信号处理单元(系统)。根据输入及输出声道配置得到降混系数。输入声道配置及输出声道配置可被作为输入数据,并且优化DMX系数(或优化DMX矩阵)可从输入数据得到。在下面的描述中,术语降混系数涉及静态降混系数,即不取决于输入音频信号波形的降混系数。在降混应用中,例如可应用额外系数(例如动态、时变增益)以保持输入信号的功率(所谓的有源降混技术)。用于自动生成DMX矩阵的本公开系统的实施例允许对于给定的输入及输出声道配置的高质量DMX输出信号。
[0060] 在本发明的实施例中,将输入声道映射至一个或多个输出声道包括对于输入声道所映射至的每个输出声道,得到待应用至输入声道的至少一个系数。至少一个系数可包括:待应用至与输入声道相关联的输入信号的增益系数(即增益值),和/或待应用至与输入声道相关联的输入信号的延迟系数(即,延迟值)。在本发明的实施例中,映射可包括推导用于输入声道的不同频带的频率选择性系数(即,不同系数)。在本发明的实施例中,将输入声道映射至输出声道包括从系数生成一个或多个系数矩阵。每个矩阵定义对于输出声道配置的每个输出声道,待应用至输入声道配置的每个输入声道的系数。对于输入声道不映射至的输出声道,系数矩阵中的各个系数将为零。在本发明的实施例中,可以生成用于增益系数及延迟系数的单独的系数矩阵。在本发明的实施例中,在系数为频率选择性的情况下,可生成用于每个频带的系数矩阵。在本发明的实施例中,映射可进一步包括将得到的系数应用至与输入声道相关联的输入信号。
[0061] 图6显示用于DMX矩阵的自动生成的系统。系统包括描述潜在输入-输出声道映射的规则集合(块400),以及基于规则集合400,选择用于输入声道配置404及输出声道配置406的给定组合的最适当规则的选择器402。该系统可包括适当接口以接收关于输入声道配置404及输出声道配置406的信息。
[0062] 输入声道配置定义存在于输入设置中的声道,其中每个输入声道具有相关联的方向或位置。输出声道配置定义存在于输出设置中的声道,其中每个输出声道具有相关联的方向或位置。
[0063] 选择器402将所选择的规则408提供给评估器410。评估器410接收所选择的规则408及评估所选择的规则408以基于所选择的规则408得到DMX系数412。可从所得到的降混系数生成DMX矩阵414。评估器410可用于从降混系数得到降混矩阵。评估器410可接收关于输入声道配置及输出声道配置的信息,如关于输出设置几何形状的信息(例如声道位置)及关于输入设置几何形状的信息(例如声道位置),并在得到降混系数时将该信息列入考虑。
[0064] 如图6B显示,该系统可在信号处理单元420中实施,信号处理单元420包括被编程或被配置以用作选择器402及评估器410的处理器422,以及用于储存映射规则的集合400的至少部分的存储器424。映射规则的另一部分可由处理器检查,而不存储在存储器424中的规则。任一个情况下,规则被提供给处理器以执行所描述的方法。信号处理单元可包括用于接收与输入声道相关联的输入信号228的输入接口426及用于输出与输出声道相关联的输出信号234的输出接口428。
[0065] 应注意的是,规则通常应用至输入声道而不是输入声道配置,以使得每个规则可被用于共享相同输入声道的多个输入声道配置,对于该输入声道,设计特定规则。
[0066] 规则集合包括描述将每个输入声道映射至一个或数个输出声道的可能性的规则集合。对于一些输入声道,集合或规则可仅仅包括单个声道,但通常地,规则集合将包括用于大部分或全部输入声道的多个(多数)规则。规则集合可由系统设计师填充,该设计师当填充该规则集合时结合有关降混的专家知识。例如,该设计师可结合有关听觉心理的知识或其技艺意图。
[0067] 潜在地,对于每个输入声道可存在数个不同的映射规则。不同映射规则例如定义依据特定使用情况下可用的输出声道的列表将正在考虑的输入声道渲染至输出声道上的不同可能性。换言之,对于每个输入声道,可能存在多个规则,例如每个规则定义从输入声道至输出扬声器的不同集合的映射,其中输出扬声器的集合也可只包括一个扬声器或甚至可为空的。
[0068] 对于映射规则的集合中的一个输入声道具有多个规则的可能最常见理由为,不同的可用输出声道(由不同的可能输出声道配置确定)要求从一个输入声道至可用输出声道的不同映射。例如,一个规则可定义从特定输入声道映射至在一个输出声道配置为可用而在另一个输出声道配置为不可用的特定输出扬声器。
[0069] 因此,如图7显示,在方法的实施例中,对于输入声道,访问相关联的规则集合中的规则,步骤500。确定所访问的规则中定义的输出声道集合是否在输出声道配置中为可用,步骤502。如果该输出声道集合在输出声道配置中为可用,则选择所访问的规则,步骤504。如果输出声道集合在输出声道配置中为不可用,则方法跳回步骤500并访问下一个规则。步骤500及502被迭代重复地进行,直到找到定义与输出声道配置相匹配的输出声道集合的规则为止。在本发明的实施例中,当遇到定义空输出声道集合的规则以使得相对应的输入声道根本不被映射(或换言之,被使用系数0进行映射)时,可停止迭代过程,。
[0070] 如图7中通过块506所指示的,对于输入声道配置的多个输入声道中的每个输入声道,进行步骤500、502及504。多个输入声道可包括输入声道配置的全部输入声道,或可包括输入声道配置的至少两个输入声道的子集。然后,根据所选择的规则,将输入声道映射至输出声道。
[0071] 如图8显示,将输入声道映射至输出声道可包括评估所选择的规则以得到待应用至与输入声道相关联的输入音频信号的系数,块520。该系数可被应用至输入信号以生成与输出声道相关联的输出音频信号,箭头522及块524。可选地,可从该系数生成降混矩阵,块526,及该降混矩阵可被应用至输入信号,块524。然后,输出音频信号可输出至与输出声道相关联的扬声器,块528。
[0072] 因此,对于给定输入/输出配置的规则的选择包括:通过从描述如何将每个输入声道映射至给定输出声道配置中可用的输出声道上的规则集合中选择适当条款(entry),而得到用于给定输入及输出配置的降混矩阵。特别地,系统只选择那些对于给定输出设置为有效的映射规则,即对于特定使用情况,描述至给定输出声道配置中可用的扬声器声道的映射的映射规则。描述至不存在于所考虑的输出配置中的输出声道的映射的规则被舍弃为无效,因而不被选择为用于给定输出配置的适当规则。
[0073] 下面,描述用于一个输入声道的多个规则的一个示例,以将架高中置声道(即方位角为0度且仰角大于0度的声道)映射至不同输出扬声器。用于架高中置声道的第一规则可定义直接地映射至水平面中的中置声道(即,映射至方位角0度且仰角0度的声道)。用于架高中置声道的第二规则可定义输入信号映射至左及右前声道(例如立体声重现系统的两个声道或5.1环绕重现系统的左及右声道)作为幻象源。例如第二规则可以以相等增益将输入信号映射至左及右前声道,以使得重现信号被感知为中心位置处的幻象源。
[0074] 如果输入声道配置的输入声道(扬声器位置)也存在于输出声道配置中,则该输入声道可被直接地映射至相同的输出声道。通过增加直接一对一映射规则作为第一规则,这可反映在映射规则的集合中。第一规则可在映射规则选择之前被处理。在映射规则确定外部的处理避免了在存储其余映射规则的存储器或数据库内,指定用于每个输入声道的一对一映射规则(例如30度方位角处的左前输入映射至30度方位角处的左前输出)的需要。这种直接一对一映射可被处理,例如以便如果输入声道的直接一对一映射关系为可能的(即,存在相关的输出声道),该特定输入声道被直接地映射至相同输出声道而不启动在其余映射规则的集合中搜索该特定输入声道。
[0075] 在本发明的实施例中,规则被按优先顺序排列。在规则的选择期间,系统偏好较高排序规则优于较低排序规则。这可通过用于每个输入声道的规则的优先列表的迭代而实现。对于每个输入声道,系统可循环通过用于考虑中的输入声道的潜在规则的有序列表,直到找到适当的有效映射规则为止,由此停止且由此选择最高优先排序的适当映射规则。具现优先排序的另一个可能可以为将成本项分配给反映映射规则的应用的质量影响的每个规则(较高成本对较低质量)。然后该系统可运行搜索算法,通过选出最佳规则而最小化成本项。如果用于不同输入声道的规则选择可彼此交互,则成本项的使用也允许全局地最小化成本项。成本项的全局最小化确保获得最高输出质量。
[0076] 规则的优先排序可由系统架构定义,例如通过按优选顺序填写潜在映射规则的列表,或通过将成本项分配给各个规则。优先排序可反映输出信号的可实现的声音质量:与较低优先排序的规则相比,较高优先排序的规则可以传递较高声音质量,例如较佳空间影像,更好的包络。在规则的优先排序中可以考虑潜在其它方面,例如复杂度方面。因为不同规则产生不同的降混矩阵,它们可最终导致应用所产生的降混矩阵的降混处理中的不同运算复杂度或内存要求。
[0077] 所选择的映射规则(如通过选择器402)确定DMX增益,可能结合几何形状信息。即,用于确定DMX增益值的规则可传递取决于与扬声器声道相关联的位置的DMX增益值。
[0078] 映射规则可直接定义一个或数个DMX增益,即增益系数,作为数值。例如,通过指定待应用的特定平移法则,例如正切定律平移或VBAP,规则可以可选地直接定义增益。在这种情况下,DMX增益取决于几何形状数据,如输入声道相对于收听者的位置或方向,以及一个或多个输出频道相对于收听者的位置或方向。规则可定义DMX增益频率相关性。该频率相关性可由用于不同频率或频带的不同增益值反映或可被反映作为参数均衡器参数(例如用于雪弗滤波器或二阶部分的参数,其描述当将输入声道映射至一个或数个输出声道时应用至信号的滤波器的响应)。
[0079] 在本发明的实施例中,规则被实现为直接地或间接地定义作为待应用至输入声道的降混增益的降混系数。但是,降混系数并不限于降混增益,而是也可以包括当将输入声道映射至输出声道时所应用的其它参数。映射规则可被实现为直接地或间接地定义延迟值,该延迟值可被应用以通过延迟平移技术而非幅值平移技术来渲染输入声道。进一步地,延迟与幅值平移可被组合。在此种情况下,映射规则将允许确定增益及延迟值作为降混系数。
[0080] 在本发明的实施例中,对于每个输入声道,评估所选择的规则,得到的用于映射至输出声道的增益(和/或其它系数)被转移给降混矩阵。开始时该降混矩阵被以零初始化,使得当对于每个输入声道评估所选择的规则时,可以以非零值稀疏地填充该降混矩阵。
[0081] 规则集合的规则可用于在将输入声道映射至输出声道时实施不同构想。下面讨论特定规则或特定类别的规则及可作为规则的基础的通用映射构想。
[0082] 一般而言,规则允许在降混系数的自动生成中结合专家知识,以获得比从通用数学降混系数生成器如基于VBAP的解决方案获得的降混系数更佳质量的降混系数。专家知识可来自于有关听觉心理的知识,其比通用数学公式如通用平移法则更精确地反映出声音的人类知觉。所结合的专家知识也可反映出设计降混解决方案中的经验或可反映出技艺降混意图。
[0083] 规则可被实现以减少过度平移:经常不期望有大量经平移的输入声道的重现。映射规则可被设计,以使得它们接受方向重现错误,即声音源可被渲染在错误位置以减少回送时的平移量。例如,规则可在稍微错误的位置将输入声道映射至输出声道,而非将输入声道平移至两个或多个输出声道上的正确位置。
[0084] 规则可被实现以考虑被考虑的声道的语义学。具有不同意义的声道,如载有特定内容的声道可具有相关联的不同调谐规则。一个示例为用于将输入声道映射至输出声道的规则:中置声道的声音内容疆场与其它声道的声音内容有显著差异。例如,在电影中,中置声道主要用于重现对白(即作为‘对白声道’),以便有关该中置声道的规则可被实现为语音好像来自具有低空间源扩展和自然音色的近场声音源的感知意图。如此,中置映射规则允许比用于其它声道之规则更大的重现音源位置偏差而避免平移(即幻象源渲染)的需要。这确保电影对白被重现为离散源,其具有比幻象源小的扩展和更自然的音色。
[0085] 其它语义规则可将左及右前置声道解释为立体声声道对的一部分。这种规则可旨在重现立体声声音影像使得其被置中:如果左及右前置声道被映射至非对称性输出设置,左-右非对称,则规则可应用校正项(例如校正增益),其确保该立体声声音影像的平衡重现,即置中重现。
[0086] 利用声道语义学的另一示例为用于环绕声道的规则,其经常被用于生成不引起具有不同源位置的声音源的感知的包络环境声场(例如室混迭)。因此,这种声音内容的重现的确切位置通常并不重要。因此,将环绕声道的语义学列入考虑的映射规则可只有对空间精度的低度要求而被定义。
[0087] 规则可被实现以反映出保留输入声道配置固有的多样性的意图。这种规则例如可重现输入声道为幻象源,即使在幻象源的位置处有可用的离散输出声道。在无-平移解决方案中蓄意地引入平移可以为有利的,如果离散输出声道及幻象源被馈以输入声道配置中(例如空间)多样的输入声道:离散输出声道及幻象源被差异地感知,由此保留所考虑的输入声道的多样性。
[0088] 多样性保留规则的一个示例为从架高中置声道映射至水平面中的中心位置处的左及右前声道作为幻象源,即使水平面中的中置扬声器在输出配置中为物理可用的。如果同时另一输入声道被映射至水平面中的中置声道,则可应用来自这个示例的映射以保留输入声道多样性。如果没有多样性保留规则,则两个输入声道(即架高中置声道及另一输入声道)将通过相同信号路径重现,即通过水平面中的物理中置扬声器重现,从而丧失输入声道多样性。
[0089] 除了使用如前文解释之幻象源之外,输入声道配置固有的空间多样性特性的保留或仿真可通过实施下列策略的规则而实现。1、如果将输入声道映射至较低位置(较低仰角)处的输出声道,则规则可定义应用至与架高位置(较高仰角)处的输入声道相关联的输入信号的均衡滤波。该均衡滤波可补偿不同声道的音色变化且可基于实验专家知识和/或测量的BRIR数据等而得到。2、如果将输入声道映射至较低位置处的输出声道,则规则可定义应用至与架高位置处的输入声道相关联的输入信号的解相关/混迭滤波。该滤波可从有关室内声学等的BRIR测量或实验知识得到。该规则可定义滤波后的信号在多个扬声器上重现,其中对于每个扬声器可应用不同滤波。滤波也可只模拟早期反射。
[0090] 在本发明的实施例中,在选择用于输入声道的规则时,选择器可将其它输入声道如何映射至一个或多个输出声道列入考虑。例如,选择器可选择第一规则将输入声道映射至第一输出声道,如果没有其它输入声道被映射至该输出声道。在有另一输入声道被映射至该输出声道的情况下,选择器可选择另一规则,将输入声道映射至一个或多个其它输出声道,意图保留输入声道配置固有的多样性。例如,当另一输入声道也被映射至相同输出声道的情况下,选择器可应用被实现为用于保留输入声道配置固有的多样性的规则,否则,可以应用另一规则。
[0091] 规则可被实现为音色保留规则。换言之,规则可被实现以考虑下述事实:输出设置的不同扬声器被收听者以不同声染色感知。一项理由为通过收听者的头部、耳廓、及躯干的声音效应所导入的声染色。声染色取决于声音到达收听者耳朵的入射角,即,对于不同扬声器位置的声音的染色不同。这种规则将用于输入声道位置及该输入声道所映射至的输出声道位置的声音的不同染色列入考虑,并得到补偿染色的非期望差异(即补偿非期望的音色变化)的平衡信息。为此,规则可包括均衡规则以及映射规则,确定从一个输入声道至输出配置的映射,因为均衡特性通常取决于被考虑的特定输入及输出声道。换言之,均衡规则可映射规则中的一些相关联,其中两个规则可一起被解释为一个规则。
[0092] 均衡规则可产生均衡信息,例如可由频率相关降混系数反映,或例如可由用于均衡滤波的参数数据反映,均衡滤波被应用至信号以获得期望的音色保留效应。音色保留规则的一个示例是描述从架高中置声道映射至水平面中的中心声道的规则。音色保留规则将定义均衡滤波,其被应用于降混处理中以在安装于架高中置声道位置处的扬声器上重现信号时补偿收听者感知的不同信号染色,而不是位于水平平面中的中置声道位置处的扬声器上的信号的重现的感知染色。
[0093] 本发明的实施例为通用映射规则提供后备。可采用通用映射规则,例如输入配置位置的通用VBAP平移,其在对于给定输入声道及给定输出声道配置没有发现其他更高级的规则时应用。这个通用映射规则确保对于全部可能的配置总能找到有效输入/输出映射,并且确保对于每个输入声道,至少满足基本渲染质量。应注意的是,通常可使用比后备规则更精确的规则映射其它输入声道,以使得生成的降混系数的总体质量通常比由通用数学解决方案如VBAP所生成的系数的质量高(至少一样高)。在本发明的实施例中,通用映射规则可定义输入声道映射至具有左输出声道及右输出声道的立体声道配置的一个或两个输出声道。
[0094] 在本发明的实施例中,所描述的程序(即,从潜在映射规则的集合中确定映射规则,并且通过从可应用至DMX处理中的映射规则构建DMX矩阵应用所选择的规则)可被更改,以使得所选择的映射规则可直接应用于降混处理而无需中间形成DMX矩阵。例如,由所选择的规则确定的映射增益(即降混增益)可直接应用于降混处理而无中间形成DMX矩阵。
[0095] 其中将系数或降混矩阵应用至与输入声道相关联的输入信号的方式为本领域技术人员所显然易知。通过应用所得到的系数而处理输入信号,并且处理后的信号输出至与输入声道所映射至的输出声道相关联的扬声器。如果两个或更多个输入声道被映射至相同输出声道,则各个信号被相加并输出至与输出声道相关联的扬声器。
[0096] 在有利实施例中,系统可被如下实现。给定映射规则的有序列表。顺序反映映射规则的优先排序。每个映射规则确定从一个输入声道至一个或多个输出声道的映射,即每个映射规则确定在哪个输出扬声器上渲染输入声道。映射规则以数值方式明确地定义降混增益。可选地,映射规则指示对于所考虑的输入及输出声道必须被评估的平移法则,即必须根据所考虑的输入及输出声道的空间位置(例如方位角)评估平移法则。映射规则可额外地指示当进行降混处理时,均衡滤波必须应用至所考虑的输入声道。可通过确定应用滤波器列表中的哪个滤波器的滤波器参数索引来指明均衡滤波器。该统可如下生成用于给定输入及输出声道配置的降混系数的集合。对于输入声道配置的每个输入声道:a)关于列表的顺序,迭代通过映射规则的列表;b)对于描述从所考虑的输入声道的映射的每个规则,确定该规则是否适用(有效),即确定该映射规则考虑用于渲染的输出声道是否在所考虑的输出声道配置中为可获得的;c)对于所考虑的输入声道发现的第一有效规则确定从输入声道至输出声道的映射;d)找到有效规则后,对于所考虑的输入声道,结束迭代;e)评估所选择的规则以确定用于所考虑的输入声道的降混系数。规则的评估可涉及平移增益的计算和/或可涉及滤波器规格的确定。
[0097] 本发明的用于得到降混系数的方法为有利的,因为其提供在降混设计中结合专家知识(例如听觉心理原理、不同声道的语义学处理等)的可能性。因此,与纯粹数学方法(例如VBAP的通用应用)相比,其允许当将得到的降混系数应用于降混应用时,获得更高质量的降混输出信号。与手动调谐降混系数相比,该系统允许对于更多数量的输入/输出配置组合,自动推导系数而无需调谐专家,因而减低成本。该系统进一步允许在已经部署降混实现的应用中得到降混系数,从而当设计过程之后输入/输出配置可能改变时,即无需专家调谐系数是可能的时,实现高质量降混应用。
[0098] 下文中,将进一步详细地描述本发明的特定非限制性实施例。参考可实现图2所示的格式转换232的格式转换器描述实施例。下文中描述的格式转换器包括多个特定特性件,其中应清楚的是,特性件中的一些为可选的,因而可被省略。下文中,将描述如何初始化转换器以实现本发明。
[0099] 下面的说明参照表1至6(可在说明书的末尾处发现)。表中使用的用于各个声道的标记解释如下:符号“CH”表示“声道”。符号“M”表示“水平收听者平面”,即0度仰角。这是正常2D设置如立体声或5.1中扬声器所在的平面。符号“L”表示较低平面,即仰角<0度。符号“U”表示较高平面,即仰角>0度,如30度,作为3D设置中的上扬声器。符号“T”表示顶声道,即90度仰角,又名“上帝之声”声道。位在标记M/L/U/T中的一个后方的为用于左(L)或右(R)的标记,接着为方位角。例如,CH_M_L030及CH_M_R030表示常规立体声设置的左及右声道。每个声道的方位角及仰角在表1中指示,除了LFE声道及最后的空声道之外。
[0100] 输入声道配置及输出声道配置可包括表1中指示的声道的任一种组合。
[0101] 表2中示出示例性输入/输出格式,即输入声道配置及输出声道配置。表2中指示的输入/输出格式为标准格式并且其标示将为本领域技术人员所认知。
[0102] 表3显示规则矩阵,其中一个或多个规则与每个输入声道(源声道)相关联。如从表3可见,每个规则定义输入声道将映射至的一个或多个输出声道(目的声道)。此外,每个规则在其第3栏定义增益值G。每个规则进一步定义EQ索引,EQ索引指示是否应用均衡滤波器,并且如果是,指示将应用哪个特定的均衡滤波器(EQ索引1至4)。以表3第3栏中给定的增益G进行输入声道至一个输出声道的映射。通过应用两个输出声道之间的平移进行输入声道至两个输出声道(第2栏中指示)的映射,其中从应用平移法则所得的平移增益g1及g2被额外乘以各个规则给定的增益(表3第3栏)。特定规则适用顶声道。根据第一规则,顶声道被映射至上平面的全部输出声道,以ALL_U指示;根据第二(较低优先排序)规则,顶声道被映射至水平收听者平面的全部输出声道,以ALL_M指示。
[0103] 表3不包括与每个声道相关联的第一规则,即直接地映射至具有相同方向的声道。在访问表3中示出的规则之前,可通过系统/算法检查第一规则。由此,对于存在直接映射的输入声道,算法无需访问表3以找出匹配规则,而是将直接映射规则应用于得到一个输入声道的系数以直接地映射输入声道至输出声道。在这种情况下,对于不满足第一规则的那些声道,即对于不存在直接映射的那些声道,后文描述为有效的。在可选实施例中,直接映射规则可包括于规则表中,并且在访问规则表之前不进行检查。
[0104] 表4显示用于预定义的均衡滤波器中的77个滤波器组频带的标准化中心频率。表5显示用于预定义的均衡滤波器中的均衡器参数。
[0105] 表6显示在各列中被考虑为彼此上方/下方的声道。
[0106] 在处理输入信号之前,初始化格式转换器,音频信号例如为通过核心解码器如图2中所示的解码器200的核心解码器传递的音频样本。在初始化阶段期间,与输入声道相关联的规则被评估,并得到待应用至输入声道(即与输入声道相关联的输入信号)的系数。
[0107] 在初始化阶段中,对于输入及输出格式的给定组合,格式转换器可自动生成优化的降混参数(例如降混矩阵)。格式转换器可应用算法,对于每个输入扬声器,从已经设计为结合听觉考虑的规则列表中选择最适合的映射规则。每个规则描述从一个输入声道至一个或数个输出扬声器声道的映射。输入声道或被映射至单个输出声道,或被平移至两个输出声道,或被(在‘上帝之声’声道的情况下)分布在更多个输出声道上。可依据期望输出格式中可用的输出扬声器列表选择用于每个输入声道的最佳映射。每个映射定义用于所考虑的输入声道的降混增益,以及可能也定义应用至所考虑的输入声道的均衡器。通过提供与常规扬声器设置的方位角及仰角偏差,可以用信号将具有非标准扬声器位置的输出设置传送给系统。进一步地,将期望目标扬声器位置的距离变化列入考虑。音频信号的实际降混可在信号的混合QMF子带表示上进行。
[0108] 馈入格式转换器的音频信号可被称作输入信号。作为格式转换处理的结果的音频信号可称作输出信号。格式转换器的音频输入信号可以为核心解码器的音频输出信号。通过粗体符号标示向量及矩阵。向量元素或矩阵元素被标示为补充了指示向量/矩阵元素在向量/矩阵中的列/行的索引的斜体变量。
[0109] 格式转换器的初始化可在处理通过核心解码器传递的音频信号之前进行。初始化可将下列列入考虑作为输入参数:待处理的音频数据的采样率;传送待使用格式转换器处理的音频数据的声道配置的参数;传送期望输出格式的声道配置的参数;及选择性地,传送输出扬声器位置与标准扬声器设置(随机设置功能)的偏差的参数。该初始化可返回输入扬声器配置的声道的数量、输出扬声器配置的声道的数量、应用于格式转换器的音频信号处理中的均衡滤波器参数及降混矩阵,以及用于补偿扬声器距离变化的修整增益及延迟值。
[0110] 具体地,初始化可将下列输入参数列入考虑:
[0111] 输入参数
[0112]format_in 输入格式,参考表2
format_out 输出格式,参考表2
fs 与输入声道相关联的输入信号的采样率(频率以Hz表示)
razi,A 对于每个输出声道c,指定方位角,确定与标准格式扬声器方位的偏差
rele,A 对于每个输出声道c,指定仰角,确定与标准格式扬声器仰角的偏差
trimA 对于每个输出声道c,指定扬声器至中心收听位置的距离,以米表示
Nmaxdelay 可用于修整(样本)的最大延迟
[0113] 输入格式及输出格式与输入声道配置及输出声道配置相对应。razi,A及rele,A表示传送扬声器位置(方位角及仰角)与遵照规则的标准扬声器设置的偏差的参数,其中A为声道索引。根据标准设置的声道的角度在表1中示出。
[0114] 在本发明的实施例中,其中只得到增益系数矩阵,唯一输入参数可以为format_in及format_out。取决于实现的特征,其它输入参数为可选择性的,其中fs可用于在频率选择性系数情况下初始化一个或多个均衡滤波器,razi,A及rele,A可用于将扬声器位置的偏差列入考虑,trimA及Nmaxdelay可用于将各个扬声器距中心收听者位置的距离列入考虑。
[0115] 在转换器的实施例中,可验证下列情况,并且如果不符合情况,则转换器初始化被视为失败并返回错误。razi,A及rele,A的绝对值分别地不应超过35度及55度。任何扬声器对(不含LFE声道)之间的最小夹角不应小于15度。razi,A的值应为通过水平扬声器的方位角的排序不改变。同样地,高及低扬声器的排序不应改变。rele,A值应为通过(近似)位于彼此上方/下方的扬声器的仰角的排序不改变。为了验证此,可应用下列程序:
[0116] ●对于表6的每列,其含有输出格式的两个或三个声道,进行:
[0117] ○通过仰角排序声道,不考虑随机化。
[0118] ○通过仰角排序声道,考虑随机化。
[0119] ○如果两种排序不同,则返回初始化错误。
[0120] 术语“随机化”表示将实际场景声道与标准声道之间的偏差列入考虑,即偏差razic及relec被应用至标准输出声道配置。
[0121] trimA中的扬声器距离应为0.4米至200米之间。最大扬声器距离与最小扬声器距离之间的比应不超过4。最大计算的修整延迟不应超过Nmaxdelay。
[0122] 如果满足前述条件,则转换器的初始化成功。
[0123] 在实施例中,格式转换器初始化返回下列输出参数:
[0124] 输出参数
[0125]Nin 输入声道的数量
Nout 输出声道的数量
MDMX 降混矩阵[线性增益]
IEQ 含有用于每个输入声道的EQ索引的向量
GEQ 含有用于所有EQ索引和频带的均衡器增益值的矩阵
Tg,A 用于每个输出声道A的修整增益[线性]
Td,A 用于每个输出声道A的修整延迟[样本]
[0126] 为了清楚的原因,下面的描述采用如后文定义的中间参数。应注意的是,算法的实现可省略中间参数的引入。
[0127]S 转换器源声道[输入声道索引]的向量
D 转换器目的声道[输出声道索引]的向量
G 转换器增益[线性]的向量
E 转换器EQ索引的向量
[0128] 中间参数以映射取向方式描述降混参数,即每个映射i的参数Si、Di、Gi、Ei的集合。
[0129] 不言而喻,在本发明的实施例中,取决于实现哪个特性件,转换器将不输出上述全输出参数的全部。
[0130] 对于随机扬声器设置,即含有位于与期望的输出格式偏移的位置(声道方向)处的扬声器的输出配置,通过将扬声器位置偏差角度指明为输入参数razi,A及rele,A而用信号传送位置偏差。通过将razi,A及rele,A应用至标准设置的角度而进行预处理。更具体地,通过将razi,A及rele,A增加至对应的声道而修改表1中的声道的方位角和仰角。
[0131] Nin传送输入声道(扬声器)配置的声道数量。对于给定输入参数format_in,这个数量可从表2得到。Nout传送输出声道(扬声器)配置的声道数量。对于给定输入参数format_out,这个数量可从表2得到。
[0132] 参数向量S、D、G、E定义输入声道至输出声道的映射。对于以非零降混增益从输入声道至输出声道的每个映射i,其定义降混增益以及均衡器索引,均衡器索引指示哪个均衡器曲线必须应用至映射i中考虑的输入声道。
[0133] 考虑一种情况,其中输入格式Format_5_1被转换成Format_2_0,将获得下列降混矩阵(考虑用于直接映射的系数1、表2及表5、及具有IN1=CH_M_L030、IN=CH_M_R030、IN3=CH_M_000、IN4=CH_M_L110、IN5=CH_M_R110、OUT1=CH_M_L030、及OUT2=CH_M_R030):
[0134]
[0135] 左向量指示输出声道,矩阵表示降混矩阵,右向量指示输入声道。
[0136] 由此,降混矩阵包括不是零的六个项,并且因此,i从1运行至6(任意顺序,只要在各个向量中使用相同顺序即可)。如果从第一列开始,从左至右且从上至下地计数该降混矩阵的项,则在本示例中向量S、D、G及E将为:
[0137] S=(IN1,IN3,IN4,IN2,IN3,IN5)
[0138] D=(OUT1,OUT1,OUT1,OUT2,OUT2,OUT2)
[0139]
[0140] E=(0,0,0,0,0,0)
[0141] 因此,每个向量中的第i个项与一个输入声道及一个输出声道之间的第i个映射有关,以便向量为每个声道提供数据集合,包括涉及的输入声道、涉及的输出声道、待应用的增益值及待应用哪个均衡器。
[0142] 为了补偿扬声器距中心收听者位置的不同距离,Tg,A和/或Td,A可应用至每个输出声道。
[0143] 根据如下算法对向量S、D、G、E进行初始化:
[0144] -首先,映射计数器被初始化:i=1
[0145] -如果输入声道也以输出格式存在(例如,考虑的输入声道为CH_M_R030且声道CH_M_R030存在于输出格式中),则:
[0146] Si=来源声道在输入中的索引(示例:根据表2,Format_5_2_1中的声道CH_M_R030在第二位置处,即在本格式中具有索引2)
[0147] Di=相同声道在输出中的索引
[0148] Gi=1
[0149] Ei=0
[0150] i=i+1
[0151] 由此,首先处理直接映射并且将增益系数1及均衡器索引0与每个直接映射相关联。在每个直接映射之后,i增加1,i=i+1。
[0152] 对于不存在直接映射的每个输入声道,搜索并选择表3的输入栏(源栏)中这个声道的第一记录,对于该声道存在输出栏(目的栏)的对应列中的声道。换言之,搜索并选择定义均存在于输出声道配置(通过format_out)中的一个或多个输出声道的这个声道的第一记录。对于特定规则,这可以意味着,如对于输入声道CH_T_000,定义相关联的输入声道被映射至具有特定仰角的全部输出声道,这可表示选择定义具有特定仰角的一个或多个输出声道(存在于输出配置中)的第一规则。
[0153] 由此,算法继续进行:
[0154] -否则(即,如果输入声道不存在于输出格式中)
[0155] 搜索表3的源栏中的这个声道的第一记录,对于此目的栏的相应列中存在声道。如果输出格式含有至少一个“CH_U_”声道,则ALL_U目的应被考虑为有效(即,存在相关输出声道)。如果输出格式含有至少一个“CH_M_”声道,则ALL_M目的应被考虑为有效(即,存在相关输出声道)。
[0156] 由此,为每个输入声道选择规则。然后如下评估规则以得到待应用至输入声道的系数。-如果目的地栏含有ALL_U,则:
[0157] 对于名称中具有“CH_U_”的每个输出声道x,进行:
[0158] Si=输入中的源声道的索引
[0159] Di=输出中声道x的索引
[0160] Gi=(增益栏的值)/开平方(“CH_U_”声道的数量)
[0161] Ei=EQ栏的值
[0162] i=i+1
[0163] -否则,如果目的地栏含有ALL_M,则:
[0164] 对于名称中具有“CH_M_”的每个输出声道x,进行:
[0165] Si=输入中的源声道的索引
[0166] Di=输出中的声道x的索引
[0167] Gi=(增益栏的值)/开平方(“CH_M_”声道的数量)
[0168] Ei=EQ栏的值
[0169] i=i+1
[0170] -否则,如果目的栏中只有一个声道,则:
[0171] Si=输入中的源声道的索引
[0172] Di=输出中的目的声道的索引
[0173] Gi=增益栏的值
[0174] Ei=EQ栏的值
[0175] i=i+1
[0176] -否则(目的栏中两个声道)
[0177] Si=输入中的源声道的索引
[0178] Di=输出中的第一目的声道的索引
[0179] Gi=(增益栏的值)*g1
[0180] Ei=EQ栏的值
[0181] i=i+1
[0182] Si=Si-1
[0183] Di=输出中的第二目的声道的索引
[0184] Gi=(增益栏的值)*g2
[0185] Ei=Ei-1
[0186] i=i+1
[0187] 通过应用正切定律幅度平移,以以下方式计算增益g1和g2:
[0188] ●打开源目的声道方位角为正
[0189] ●目的声道的方位角为α1及α2(参考表1)
[0190] ●源声道(平移目标)的方位角为αsrc
[0191] ●
[0192] ●
[0193] ●α=(αcenter-αsrc)·sgn(α2-α1)具有
[0194] ●
[0195] 通过上述算法,得到待应用至输入声道的增益系数(Gi)。此外,确定是否应用均衡器,如果是,则确定应用哪个均衡器(Ei)。
[0196] 增益系数Gi可直接应用至输入声道或可被增加至可应用至输入声道(即与输入声道相关联的输入信号)的降混矩阵。
[0197] 前述算法仅为示例性的。在其它实施例中,系数可从规则或基于规则得到,并且可被增加至降混矩阵而不定义前述特定向量。
[0198] 均衡器增益值GEQ可被如下确定:
[0199] GEQ由每个频带k及均衡器索引e的增益值组成。五个预定义的均衡器为不同峰值滤波器的组合。如由表5可知,均衡器GEQ,1、GEQ,2、及GEQ,5包括单个峰值滤波器,均衡器GEQ,3包括三个峰值滤波器,均衡器GEQ,4包括两个峰值滤波器。每个均衡器为一个或多个峰值滤波器的串行级联,并且增益为:
[0200]
[0201] 其中,band(k)为频带j的标准化中心频率(如表4中指定),fs为采样频率,用于负G的函数peak()为
[0202]
[0203] 否则,
[0204]
[0205] 均衡器的参数在表5中指明。如上述等式1及2中,b由band(k).fs/2给定,Q由用于各个峰值滤波器(1至n)的PQ给定,G由用于各个峰值滤波器的Pg给定,f由用于各个峰值滤波器的Pf给定。
[0206] 作为示例,对于具有索引4的均衡器,使用取自表5的相应列中的滤波参数计算均衡器增益值GEQ,4。表5列举用于峰值滤波器GEQ,4的两个参数集合,即对于n=1及n=2的参数集合。参数为峰值频率Pf(以Hz表示),峰值滤波品质因子PQ,峰值频率处应用的增益Pg(以dB表示),及应用至两个峰值滤波器的级联(对于参数n=1及n=2的滤波器的级联)的总增益g(以dB表示)。
[0207] 因此,
[0208]
[0209] 如上陈述的均衡器,对于每个频带k,独立地定义零相位增益GEQ,4。每个频带k通过其标准化中心频率band(k)指明,其中0<=band<=1。注意的是,标准化中心频率band=1相对应于未经标准化频率fs/2,其中fs表示采样频率。因此band(k).fs/2表示频带k的未经标准化的中心频率,以Hz表示。
[0210] 用于每个输出声道A的样本中的修整延迟Td,A及用于每个输出声道A的修整增益Tg,A(线性增益值)被计算为扬声器距离的函数,以trimA表示:
[0211]
[0212]
[0213] 其中
[0214]
[0215] 表示全部输出声道的最大trimA。
[0216] 如果最大Td,A超过Nmaxdelay,则初始化可能失败并可返回错误。
[0217] 如下可将输出设置与标准设置的偏差列入考虑。
[0218] 通过简单地应用razi,A至如前文解释的标准设置的角度而将方位角偏差razi,A(方位角偏差)列入考虑。因此,当将输入声道平移至两个输出声道时,使用修改的角度。因此,当将一个输入声道映射至两个或更多个输出声道时,当进行各个规则中定义的平移时,将razi,A列入考虑。在可选实施例中,各个规则可直接定义各个增益值(即已经预先进行平移)。在这种实施例中,系统可适用于基于随机化的角度而重新计算增益值。
[0219] 如下在后处理中可将仰角偏差rele,A列入考虑。一旦计算出输出参数,可相关于特定随机仰角进行修改。只有不是全部rele,A皆为零时才进行本步骤。
[0220] -对于Di中的每个i,进行:
[0221] -如果具有索引Di的输出声道被定义为水平声道(即输出声道标记含有标记‘_M_’),并且
[0222] 如果这个输出声道现在为高度声道(仰角在0…60度的范围内),并且
[0223] 如果具有索引Si的输入声道为高度声道(即标记含有‘_U_’),则
[0224] ●h=min(随机化输出声道的仰角,35)/35
[0225] ●
[0226] ●定义具有新索引e的新均衡器,其中
[0227]
[0228] ●Ei=e
[0229] 否则,如果具有索引Si的输入声道为水平声道(标记含有‘_M_’),
[0230] ●h=min(随机化输出声道的仰角,35)/35
[0231] ●定义具有新索引e的新均衡器,其中
[0232]
[0233] ●Ei=e
[0234] h为标准化仰角参数,其指示因随机设置仰角偏差rele,A所导致的标称水平输出声道(‘_M_’)的仰角。对于零仰角偏差,得到h=0并且有效地未应用后处理。
[0235] 当将上输入声道(声道标记中有‘_U_’)映射至一个或数个水平输出声道(声道标记中有‘_M_’)时,规则表(表3)通常应用0.85的增益。在输出声道因随机设置仰角偏差rele,A而获得架高的情况下,通过以因子Gcomp缩放均衡器增益,部分(0
[0236] 在将水平输入声道映射至因随机设置仰角偏差rele,A而获得架高的输出声道的情况下,均衡器 被部分(0
[0237] 通过这个过程,在随机化输出声道比设置输出声道高的情况下,与1不同的增益值及因输入声道被映射至较低输出声道而施加的均衡器被修改。
[0238] 根据前文描述,增益补偿直接应用至均衡器。在可选方法中,降混系数Gi可被修改。对于这种可选方法,应用增益补偿的算法将为如下:
[0239] -如果具有索引Di的输出声道被定义为水平声道(即输出声道标记含有标记‘_M_’),并且
[0240] 如果这个输出声道现在为高度声道(仰角在0…60度的范围内),并且
[0241] 如果具有索引Si的输入声道为高度声道(即标记含有‘_U_’),则
[0242] ●h=min(随机化输出声道的仰角,35)/35
[0243] ●Gi=hGi/0.85+(1-h)Gi
[0244] ●定义具有新索引e的新均衡器,其中
[0245]
[0246] ●Ei=e
[0247] 否则,如果具有索引Si的输入声道为水平声道(标记含有‘_M_’),
[0248] ●h=min(随机化输出声道的仰角,35)/35
[0249] ●定义具有新索引e的新均衡器,其中
[0250]
[0251] ●Ei=e
[0252] 作为示例,令Di为从输入声道至输出声道的第i个映射的输出声道的声道索引。例如,对应于输出格式FORMAT_5_1(参考表2),Di=3将指示中置声道CH_M_000。对于标称为具有0度仰角的水平输出声道(即具有标记‘CH_M_’的声道)的输出声道Di,考虑rele,A=35度(即第i个映射的输出声道的rele,A)。在应用rele,A至输出声道之后(通过将rele,A增加至各个标准设置角度,如表1定义的),输出声道Di现在具有35度仰角。如果上输入声道(具有标记‘CH_U_’)被映射至这个输出声道Di,则从评估前述规则所得的用于这个映射的参数将被修改如下:
[0253] 标准化仰角参数被计算为h=min(35,35)/35=35/35=1.0。
[0254] 因此,
[0255] Gi,后处理=Gi,后处理之前/0.85。
[0256] 对于根据 计算出的修改的均衡器定义新的未使用的索引e(例如e=6)。通过设定Ei=e=6, 可归属为映射规则。
[0257] 因此,为了将输入声道映射至架高(先前水平)输出声道Di,已经通过因子1/0.85缩放增益并且已经以具有常数增益=1.0的均衡器曲线(即具有平坦频率响应)替换均衡器。这是预期结果,因为上声道已经被映射至有效上输出声道(因应用35度的随机设置仰角偏差,标称水平输出声道变成有效上输出声道)。
[0258] 因此,在本发明的实施例中,方法及信号处理单元用于将输出声道的方位角及仰角与标准设置的偏差列入考虑(其中已经基于标准设置设计规则)。通过修改各个系数的计算和/或通过重新计算/修改事先已经计算出的或明确地定义于规则中的系数而将偏差列入考虑。因此,本发明的实施例可处理与标准设置偏差的不同输出设置。
[0259] 初始化输出参数Nin、Nout、Tg,A、Td,A、GEQ可如前述得到。其余初始化输出参数MDMX、IEQ可通过将中间参数从映射取向表示(通过映射计数器i枚举)重排成声道取向表示而得到,定义如下:
[0260] -将MDMX初始化为Nout×Nin零矩阵。
[0261] -对于i(i呈上升顺序),进行:
[0262] MDMX,A,B=Gi具有A=Di,B=Si(A、B为声道索引)
[0263] IEQ,A=Ei具有A=Si
[0264] 其中,MDMX,A,B表示MDMX的第A列及第B栏中的矩阵元素,IEQ,A表示向量IEQ的第A个元素。
[0265] 可从表3得到设计为传递较高声音质量的不同特定规则及规则的优先排序。下面将给出示例。
[0266] 定义将输入声道映射至与水平收听者平面中的输入声道具有较低方向偏差的一个或多个输出声道的规则的优先次序比定义将输入声道映射至与水平收听者平面内的输入声道具有较高方向偏差的一个或多个输出声道的规则的优先次序高。因此,输入设置中的扬声器的方向被尽可能正确地重现。定义将输入声道映射至与输入声道具有相同仰角的一个或多个输出声道的规则的优先次序比定义将输入声道映射至具有与输入声道的仰角不同的仰角的一个或多个输出声道的规则的优先次序高。如此,考虑下述事实:源自于不同仰角的信号被用户差异地感知。
[0267] 具有与前中心方向不同的方向的输入声道相关联的规则集合中的一个规则可定义将输入声道映射至与输入声道位于前中心方向的同侧并且位于输入声道的方向的两侧的两个输出声道,并且规则集合中的另一个较低优先次序的规则定义将输入声道映射至与输入声道位于前中心方向的同侧的单个输出声道。与具有90度仰角的输入声道相关联的规则集合中的一个规则可定义将输入声道映射至具有比输入声道的仰角低的第一仰角的全部可用输出声道,并且规则集合中的另一个较低优先次序的规则定义将输入声道映射至具有比第一仰角低的第二仰角的全部可用输出声道。与包含前中心方向的输入声道相关联的规则集合中的一个规则可定义将输入声道映射至两个输出声道,一个位于前中心方向的左侧而一个位于前中心方向的右侧。如此,可对于特定声道设计规则以便将特定声道的特定性质和/或语义学列入考虑。
[0268] 与包含后中心方向的输入声道相关联的规则集合中的规则可定义将输入声道映射至两个输出声道,一个位于前中心方的之左侧而一个位于前中心方向的右侧,其中规则进一步定义如果两个输出声道相对于后中心方向的角度大于90度,则使用小于1的一增益系数。与包含与前中心方向不同的方向的输入声道相关联的规则集合中的规则可定义在将输入声道映射至与输入声道位于前中心方向的同侧的单个输出声道时使用小于1的增益系数,其中输出声道相对于前中心方向的角度小于输入声道相对于前中心方向的角度。如此,声道可被映射至位于更前方的一个或多个声道以减少输入声道的不理想空间渲染的可感知性。进一步地,可帮助减少降混中的环境声音量,这是期望特征。环境声音可主要存在于后声道。
[0269] 定义将具有仰角的输入声道映射至具有比输入声道的仰角低的仰角的一个或多个输出声道的规则可定义使用小于1的增益系数。定义将具有仰角的输入声道映射至具有比输入声道的仰角低的仰角的一个或多个输出声道的规则可定义应用使用均衡滤波器的频率选择性处理。因此,架高声道通常以与水平或较低声道不同的方式被感知的事实可在将输入声道映射至输出声道时列入考虑。
[0270] 一般而言,得到的所映射的输入声道的重现的感知与输入声道的感知的偏差愈大,则被映射至偏离输入声道位置的输出声道的输入声道可被衰减愈多,即,可根据可用扬声器上的重现的不完整度而衰减输入声道。
[0271] 通过使用均衡滤波器可实现频率选择性处理。例如,可以以频率相关的方式修改降混矩阵的元素。例如,通过对于不同频带使用不同增益因子可以实现这种修改,以便实现应用均衡滤波器的效果。
[0272] 综上,在本发明的实施例中,给定描述从输入声道至输出声道的映射的规则的优先排序集合。其可由系统设计师在系统设计阶段定义,反映专家降混知识。集合可被实现为有序列表。对于输入声道配置的每个输入声道,系统根据给定使用情况的输入声道配置及输出声道配置选择映射规则集合中的适当规则。每个所选择的规则确定从一个输入声道至一个或数个输出声道的一个(或多个)降混系数。系统可迭代通过给定输入声道配置的输入声道,并从通过评估对于全部输入声道所选择的映射规则而得到的降混系数编译降混矩阵。规则选择将规则优先排序列入考虑,如此最优化系统性能,例如当应用所得到的降混系数时,获得最高降混输出质量。映射规则可考虑在纯粹数学映射算法例如VBAP中并不反映的听觉心理或技艺原理。映射规则可将声道语义学列入考虑,例如对于中心声道或左/右声道对应用不同处理。映射规则通过允许渲染中的角度错误而减少平移量。映射规则可蓄意地引入幻象源(例如通过VBAP渲染),即使单个相对应输出扬声器为可用的。如此做的意图可以为保持输入声道配置固有的多样性。
[0273] 虽然已经以装置为背景描述若干方面,但显然这些方面也表示相对应方法的描述,其中块或装置相对应于方法步骤或方法步骤的特性。类似地,以方法步骤为背景描述的方面也表示相对应块或相对应装置的项目或特性的描述。部分或全部方法步骤可通过(或使用)硬件装置执行,例如微处理器、可编程计算机或电子电路。在一些实施例中,最重要的方法步骤中的某一个或多个可通过此种装置执行。在本发明的实施例中,此处描述的方法为处理器实现的或计算机实现的。
[0274] 根据某些实现要求,本发明的实施例可以硬件或软件实现。该实现可使用非永久性存储介质执行,如数字存储介质,例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存,具有存储在其上的电子可读取控制信号,其与可编程计算机系统协作(或能够协作),以便执行各个方法。因此,数字存储介质可为计算机可读取的。
[0275] 根据本发明的一些实施例包括具有电子可读取控制信号的数据载体,电子可读取控制信号能够与可编程计算机系统协作,以便执行此处描述的方法中的一个。
[0276] 一般而言,本发明的实施例可被实现为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,程序代码被操作用以执行此处描述的方法中的一个。程序代码例如可存储在机器可读取载体上。
[0277] 其它实施例包括存储在机器可读取载体上用以执行此处描述的方法中的一个的计算机程序。
[0278] 换言之,因此,本发明方法的实施例为具有程序代码的计算机程序,当计算机程序在计算机上运行时,程序代码用以执行此处描述的方法中的一个。
[0279] 因此,本发明方法的又一实施例为数据载体(或数字存储介质、或计算机可读取介质),包括记录在其上用以执行此处描述的方法中的一个的计算机程序。数据载体、数字存储介质或记录介质典型地为有形的和/或非永久性的。
[0280] 因此,本发明方法的又一实施例为数据流或信号序列,其表示用以执行此处描述的方法中的一个的计算机程序。数据流或信号序列例如可被配置为通过数据通信连接例如通过因特网传送。
[0281] 又一实施例包括处理元件,例如计算机或可编程逻辑设备,被编程、被配置、或被调适以执行此处描述的方法中的一个。
[0282] 又一实施例包括计算机,其上安装有计算机程序以执行此处描述的方法中的一个。
[0283] 根据本发明的又一实施例包含被配置为将用于执行此处描述的方法中的一个的计算机程序传送(例如电子地或光学地)给接收器的装置或系统。接收器例如可为计算机、移动装置、存储装置等。装置或系统例如可包含文件服务器用以将计算机程序传送给接收器。
[0284] 在一些实施例中,可编程逻辑设备(例如现场可编程门阵列)可用以执行此处描述的方法的部分或全部功能。在一些实施例中,现场可编程门阵列可与微处理器协作以执行此处描述的方法中的一个。一般而言,优选地通过任何硬件装置执行方法。
[0285] 前述实施例仅用于例示本发明的原理。理解的是,此处描述的配置及细节的修改及变化将为本领域的其他技术人员所显然易知。因此意图本发明仅由所附的专利权利要求的范围所限制而非由通过实施例的描述和解释的方式所呈现的特定细节所限制。
[0286] 表1:具有相应方位角及仰角的声道
[0287]声道 方位角[度] 仰角(度)
CH_M_000 0 0
CH_M_L030 +30 0
CH_M_R030 -30 0
CH_M_L060 +60 0
CH_M_R050 -60 0
CH_M_L090 +90 0
CH_M_R090 -90 0
CH_M_L110 +110 0
CH_M_R110 -110 0
CH_M_L135 +135 0
CH_M_R135 -135 0
CH_M_180 180 0
CH_U_000 0 +35
CH_U_L045 +45 +35
CH_U_R045 -45 +35
CH_U_L030 +30 +35
CH_U_R030 -30 +35
CH_U_L090 +90 +35
CH_U_R090 -90 +35
CH_U_L110 +110 +35
CH_U_R110 -110 +35
CH_U_L135 +135 +35
CH_U_R135 -135 +35
CH_U_180 180 +35
CH_T_000 0 +90
CH_L_000 0 -15
CH_L_L045 +45 -15
CH_L_R045 -45 -15
CH_LFE1 n/a n/a
CH_LFE2 n/a n/a
CH_EMPTY n/a n/a
[0288] 表2:具有相应声道数量及声道顺序的格式
[0289]
[0290]
[0291] 表3:转换器规则矩阵
[0292]
[0293]
[0294]
[0295] 表4:77个滤波器组带的标准化中心频率
[0296]
[0297]
[0298]
[0299] 表5:均衡器参数
[0300]均衡器 Pf[Hz] PQ Pq[dB] g[dB]
GEQ,1 12000 0.3 -2 1.0
GEQ,2 12000 0.3 -3.5 1.0
GEQ,3 200,1300,600 0.3,0.5,1.0 -6.5,1.8,2.0 0.7
GEQ,4 5000,1100 1.0,0.8 4.5,1.8 -3.1
GEQ,5 35 0.25 -1.3 1.0
[0301] 表6:每列列出被视为在彼此上方/下方的声道
[0302]CH_L_000 CH_M_000 CH_U_000
CH_L_L045 CH_M_L030 CH_U_L030
CH_L_L045 CH_M_L030 CH_U_L045
CH_L_L045 CH_M_L060 CH_U_L030
CH_L_L045 CH_M_L060 CH_U_L045
CH_L_R045 CH_M_R030 CH_U_R030
CH_L_R045 CH_M_R030 CH_U_R045
CH_L_R045 CH_M_R060 CH_U_R030
CH_L_R045 CH_M_R060 CH_U_R045
CH_M_180 CH_U_180  
CH_M_L090 CH_U_L090  
CH_M_L110 CH_U_L110  
CH_M_L135 CH_U_L135  
CH_M_L090 CH_U_L110  
CH_M_L090 CH_U_L135  
CH_M_L110 CH_U_L090  
CH_M_L110 CH_U_L135  
CH_M_L135 CH_U_L090  
CH_M_L135 CH_U_L135  
CH_M_R090 CH_U_R090  
CH_M_R110 CH_U_R110  
CH_M_R135 CH_U_R135  
CH_M_R090 CH_U_R110  
CH_M_R090 CH_U_R135  
CH_M_R110 CH_U_R090  
CH_M_R110 CH_U_R135  
CH_M_R135 CH_U_R090  
CH_M_R135 CH_U_R135