再现音频信号的方法及其回放装置转让专利

申请号 : CN200510103155.9

文献号 : CN1750717B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 佐古曜一郎寺内俊郎三浦雅美矢部进山下功诚

申请人 : 索尼株式会社

摘要 :

本发明提供了一种再现音频信号的方法,包括以下步骤:将预定音频信号提供给扬声器阵列,以合成表面波前,并通过所述波前合成来形成虚拟声源;以及控制所述音频信号,以在所述虚拟声源附近改变所述虚拟声源的位置。

权利要求 :

1.一种再现音频信号的方法,所述方法包括以下步骤:将预定音频信号提供给扬声器阵列,以合成表面波前,并通过所述波前合成来形成虚拟声源;以及控制所述音频信号,以在所述虚拟声源附近改变所述虚拟声源的位置,其中所述虚拟声源的位置的改变是预定波动。

2.如权利要求1所述的再现音频信号的方法,其中所述波动的参数或模式可由用户设置。

3.如权利要求1所述的再现音频信号的方法,其中在所述形成步骤中,所述虚拟声源被形成在多个位置处,并且所述虚拟声源的位置是改变的。

4.一种用于再现音频信号的装置,包括:

处理电路,用于处理被提供给扬声器阵列的音频信号,以使得从所述扬声器阵列输出的声波的波前被合成,以形成虚拟声源;

设置电路,用于设置所述虚拟声源的位置;以及控制电路,用于控制对所述音频信号的处理,以使得由所述设置电路设置的所述虚拟声源的位置在所述虚拟声源附近改变,其中所述虚拟声源的位置的改变是预定波动。

5.如权利要求4所述的用于再现音频信号的装置,其中在所述处理电路中,所述虚拟声源被形成在多个位置处。

6.如权利要求4所述的用于再现音频信号的装置,还包括:操作装置,用于由用户选择所述波动的类型、幅度和频率。

说明书 :

再现音频信号的方法及其回放装置

技术领域

[0001] 本发明涉及再现音频信号的方法及其回放装置。

背景技术

[0002] 在例如图10所示的2声道立体声音响中,在左声道扬声器SPL到右声道扬声器SPR的连线中形成了虚拟声源VSS。声音从虚拟声源VSS输出,并且声像(sound image)被定位在虚拟声源VSS的位置处。在此情形下,当收听者位于以扬声器SPL和SPR之间的直线连线为底边的正三角形的顶点时,可获得最佳效果。
[0003] 此外,在多声道立体声音响中,声场由多个扬声器形成,原声场(original sound field)可被更准确地再现。
[0004] 下文是相关技术PCT日本翻译专利公开No.2002-505058的示例性文件。

发明内容

[0005] 当乐器被实际演奏时,大多数乐器被演奏者的手所支撑。因此,乐器的位置在演奏中(具体而言,根据旋律和节奏)会有所波动。即使当演奏被固定在地板上的乐器例如钢琴时,从乐器产生的声音也会被演奏者反射和折射。而且,由于演奏者在演奏中移动他/她的身体,这等价于乐器的位置移动。此外,在歌唱、演讲和会话中,歌者或演讲者头部和脸的的位置和朝向,即作为声源的口的位置在演讲期间波动。
[0006] 当由立体声系统形成虚拟声源VSS时,其位置被固定在两个扬声器SPL和SPR之间的连线上,如上所述。因此,当表演和演讲被立体声系统回放时,这就变得很不自然并且缺乏生动感和真实感。
[0007] 因此,希望克服这样的问题。
[0008] 根据本发明的一个实施例,提供了一种再现音频信号的方法,包括以下步骤:将预定音频信号提供给扬声器阵列,以合成表面波前并通过所述波前合成(wavefront synthesis)来形成虚拟声源;以及控制所述音频信号,以在所述虚拟声源附近改变所述虚拟声源的位置。
[0009] 根据本发明的实施例,使得被再现的虚拟声源的位置波动。因此,在音乐回放期间,可提供自然的、极为生动并且富有真实感而宽广的声源。或者,在语音的情形下,可产生可感觉到呼吸的真实感。
[0010] 此外,声源的移动状态还可被模拟,并且特殊变形效果也可被创建。具体地说,当视频例如动画、游戏或SF电影存在时,可执行更有效的声像处理。

附图说明

[0011] 图1示出了说明本发明的实施例的声音空间;
[0012] 图2示出了说明本发明的实施例的公式;
[0013] 图3A和3B示出了说明本发明的实施例的声音空间;
[0014] 图4示出了根据本发明实施例的声音空间示例;
[0015] 图5A和5B示出了本发明实施例中的波前合成状态;
[0016] 图6A和6B示出了说明本发明的实施例的声音空间;
[0017] 图7是示出了本发明实施例中可使用的一种电路的系统图;
[0018] 图8是示出了本发明实施例的系统图;
[0019] 图9A、9B、9C和9D示出了本法的实施例;以及
[0020] 图10示出了典型立体声声场。

具体实施方式

[0021] 本发明通过使用波前合成技术实现了虚拟声源,而且通过控制虚拟声源的位置而解决了上述问题。这些在下面将依次描述。
[0022] (1)声场再现
[0023] 如图1所示,假设在闭合曲面S中包含了任意希望形状的空间,还假设声源不包含在闭合曲面S内。那么,如果对闭合曲面S的内部空间和外部空间进行如下设置,则Kirchhoff积分公式由图2中的公式(1)表示:
[0024] p(ri):内部空间期望点ri的声压
[0025] p(rj):闭合曲面S上期望点rj的声压
[0026] ds:包含点rj的一个极小区域
[0027] n:点rj处的极小区域的法线
[0028] un(rj):点rj处法线方向上的粒子速度
[0029] ω:音频信号角频率
[0030] ρ:空气密度
[0031] c:声速(=340m/s)
[0032] k:ω/c
[0033] 这意味着,如果闭合曲面S上点rj的声压p(rj)和点rj处法线方向上的粒子速度un(rj)可被适当地控制,则闭合曲面S的内部空间的声场可被再现。
[0034] 因此,例如图3A所示,假设声源SS被放置在左侧,并且闭合曲面SR(由虚线表示)被放置在右侧。那么,如果闭合曲面SR上的声压和粒子速度被如上控制,则声源SS在闭合曲面SR的内部空间中创建的声场可被再现,即使不存在声源SS。那么此时,虚拟声源VSS在声源SS的位置处被创建。即,如果闭合曲面SR上的声压和粒子速度被适当地控制,则闭合曲面SR内的收听者接收声音就好像虚拟声源VSS存在于声源SS的位置处一样。
[0035] 接着,如果闭合曲面SR的半径R变得无限大,如图3A中实线所示,则闭合曲面SR变为平面SSR。同样,在此情形下,通过控制平面SSR上的声压和粒子速度,声源SS在闭合曲面SR的内部空间中(即平面SSR的右侧)创建的声场可被再现,即使不存在声源SS。而且,此时,虚拟声源VSS在声源SS位置处被创建。
[0036] 更具体地说,如果平面SSR上所有点处的声压和粒子速度都可被适当地控制,则虚拟声源VSS可被放置在平面SSR更左侧,于是声场可被放置在右侧并且声场可变为收听空间。
[0037] 在实践中,如图3B所示,平面SSR只需要具有有限的延伸,并且平面SSR上仅有限个点CP1到CPx处的声压和粒子速度需要被控制。在下文中,平面SSR上的其声压和粒子速度被控制的点CP1到CPx将被称为“控制点”。
[0038] (2)在控制点CP1到CPx处控制声压和粒子速度
[0039] 为了控制控制点CP1到CPx处的声压和粒子速度,如图4所示,需要进行以下操作:
[0040] (A)多个(m个)扬声器SP1到SPm例如平行于平面SSR而被放置在平面SSR的声源侧。所述扬声器SP1到SPm构成了扬声器阵列。
[0041] (B)被提供到扬声器SP1到SPm的音频信号被控制,以控制控制点CP1到CPx处的声压和粒子速度。
[0042] 上述操作的结果是,从扬声器SP1到SPm输出的声波波前被合成,获得了好像声波从虚拟声源VSS输出的效果,并且可形成所希望的声场。由于从扬声器SP1到SPm输出的声波波前被合成的位置成为平面SSR,因此在下面,平面SSR将被称为“波前合成面”。
[0043] (3)波前合成状态
[0044] 图5A和5B通过仿真示出了波前合成状态的示例。后面将描述对提供到扬声器SP1到SPm的音频信号进行处理的方法。在本示例中,每个值被设置如下:
[0045] 扬声器数量m:16
[0046] 扬声器间隔:10cm
[0047] 扬声器直径:8cm
[0048] 控制点位置:从扬声器开始向着收听者10cm处
[0049] 控制点数量:一行116个,间距1.3cm
[0050] 虚拟声源位置:
[0051] 收听区域前1m(图5A的情形)
[0052] 收听区域前3m(图5B的情形)
[0053] 收听区域延伸:2.9m(前后方向)×4m(左右方向)。
[0054] 如果下列值被设置:
[0055] w:扬声器之间的间隔[m]
[0056] c:声速(=340m/s),以及
[0057] fhi:上限再现频率[Hz],那么
[0058] fhi=c/(2w)。
[0059] 因此,优选地,扬声器SP1到SPm(m=16)的间隔w较窄。因此,必须减小扬声器SP1到SPm的直径。
[0060] 当对被提供到扬声器SP1到SPm的音频信号进行数字化处理时,为了消除其采样造成的影响,控制点CP1到CPx之间的间隔优选地被设置为与采样频率相对应的波长的1/4到1/5或更小。在上述数值的示例中,由于采样频率被设置为8kHz,因此如上所述,控制点CP1到CPx之间的间隔被设置为1.3cm。
[0061] 然后,根据图5A和5B,从扬声器SP1到SPm输出的声波的波前被合成,就好像它们是从虚拟声源VSS输出的声波一样,并且在收听区域绘出了清楚的波纹。即,可看出,波前合成被适当地执行,并行目标虚拟声源VSS和目标声场被形成。
[0062] 如上所述,在图5A的情形下,由于虚拟声源VSS的位置在收听区域前1m处,并且虚拟声源VSS距离平面SSR相对较近,因此波纹的曲率很小。但是,在图5B的情形下,由于虚拟声源VSS在收听区域前3m处,与图5A的情形相比,虚拟声源VSS距离平面SSR较远,因此波纹的曲率大于图5A的情形。即,可以看出,虚拟声源VSS越远,声波越接近平行波前。
[0063] (4)波前合成算法
[0064] 对于波前合成平面SSR中的波前合成,例如在图4中,从扬声器SP1到SPm输出的信号只需要被控制以使得下述信号之间的差最小,所述信号分别是虚拟声源VSS位置处的声源SS在控制点CP1到CPx处生成的信号,以及扬声器SP1到SPm在控制点CP1到CPx处生成的信号。
[0065] 因此,如图6A所示,如果进行如下设置:
[0066] u(ω):虚拟声源VSS的输出信号,即原始音频信号
[0067] A(ω):从虚拟声源VSS到控制点CP1到CPx的传输函数
[0068] d(ω):在控制点CP1到CPx处获得的信号(所希望的信号)由于将传输函数A(ω)叠加到原始音频信号u(ω)上所得到的信号是所希望的信号d(ω),因此得到:
[0069] d(ω)=A(ω)·u(ω)。
[0070] 在此情形下,通过预先确定从虚拟声源VSS到控制点CP1到CPx的传输特性,可定义传输函数A(ω)。
[0071] 如图6B所示,如果进行如下设置:
[0072] H(ω):为了实现适当的波前合成而被叠加在信号u(ω)上的传输函数[0073] C(ω):从扬声器SP1到SPm到控制点CP1到CPx的传输函数
[0074] q(ω):控制点CP1到CPx处的波前合成所实际产生的信号,类似地,获得:
[0075] q(ω)=C(ω)·H(ω)·u(ω)。
[0076] 在此情形下,通过预先确定从扬声器SP1到SPm到控制点CP1到CPx的传输函数,传输函数C(ω)可被定义。
[0077] 如果传输函数H(ω)被控制以使得再现信号q(ω)等于所希望的信号d(ω),则此时再现信号q(ω)实现了适当的波前合成,并且与所希望的信号d(ω)所形成的声场和声像相等的声场和声像可被分别再现。
[0078] 因此,由e(ω)=d(ω)-q(ω)表示的误差信号e(ω)被确定,并且传输函数H(ω)被控制,以使得值e(ω)T·e(ω)变得最小。最小二乘解为:
[0079] H(ω)=C(ω)T·A(ω)/(C(ω)T·C(ω))。
[0080] 为了使得虚拟声源VSS成为理想的点声源,传输函数Q(ω)由下式表示:
[0081] Q(ω)=e(-jωx/c)/x,其中x是距离,c是声速,Q(ω)在传输函数A(ω)和C(ω)中被代替,以确定传输函数H(ω)。
[0082] (5)生成电路
[0083] 当根据上述(4)从原始音频信号u(ω)生成再现音频信号q(ω)时,生成电路可被构造为例如图7所示。生成电路被提供给扬声器SP1到SPm中的每一个,并且被标记为生成电路WF1到WFm。
[0084] 更具体地说,在生成电路WF1到WFm的每一个中,数字化的原始音频信号u(ω)经由输入端11被提供给数字滤波器12,从而信号变为所希望的信号d(ω)。此外,信号u(ω)被依次提供给数字滤波器13和数字滤波器14,从而信号u(ω)变为再现信号q(ω)。然后,信号d(ω)和q(ω)被提供给减法电路15,在这里误差信号e(ω)被提取。信号e(ω)被转换电路17转换为控制信号,根据该控制信号控制数字滤波器13的传输函数H(ω),从而误差信号e(ω)变得最小。
[0085] 因此,如果从数字滤波器14输出的再现信号q(ω)被提供给扬声器SP1到SPm中对应的扬声器,则虚拟声源VSS被形成,并且在其位置处形成声像。
[0086] (6)实施例
[0087] 图8示出了用于根据上述(1)到(5)来使得虚拟声源VSS的位置波动或用于使得虚拟声源VSS的位置移动的回放装置的示例。即,数字音频信号u(ω)从信号源SC例如CD播放器、DVD播放器和数字广播调谐器被提取。信号u(ω)被提供给生成电路WF1到WFm,其中对应于再现信号q(ω)的再现信号q1(ω)到qm(ω)被生成。然后,信号q1(ω)到qm(ω)被提供给D/A转换器电路DA1到DAm,从而信号被D/A转换为模拟音频信号,这些信号分别经由功率放大器PA1到PAm而被提供给扬声器SP1到SPm。
[0088] 在此情形下,如参照图4所述的扬声器SP1到SPm在收听者前面被水平布置,从而这些扬声器构成了扬声器阵列。更具体地说,它们可被设置为如(3)所述。
[0089] 为了设置虚拟声源VSS的位置,声源位置设置电路22被提供,并且预定的控制信号S22形成。控制信号22被提供给生成电路WF1到WFm的数字滤波器13,从而传输函数H1(ω)到Hm(ω)被控制。于是,当声源位置设置电路22的操作部分23被操作时,生成电路WF1到WFm的数字滤波器13的传输函数H1(ω)到Hm(ω)根据该操作而被控制,虚拟声源VSS的位置如图5A和5B所示被改变,或进一步被变为其它位置。
[0090] 此外,为了使得虚拟声源VSS的位置波动,控制电路24被提供,并且波动控制信号S24被生成。声源位置设置电路22根据控制信号S24被控制。于是,可使得根据控制信号22设置的虚拟声源VSS的位置波动。
[0091] 波动的禁止/允许、类型(波形)、幅度、频率(速度)、规律性的存在与否等参数通过连接到波动控制电路24的操作部分25而被收听者(用户)选择或设置。此时,频率越高,可使幅度越小,就像1/f波动。
[0092] 图9A、9B、9C和9D示出了控制信号S24控制下所获得的波动的示例。图9A示出了这样的情形,即虚拟声源VSS在前后方向上、左右方向上、上下方向上,或前述方向的组合方向上波动。图9B示出了这样的情形,其中虚拟声源VSS在3维空间中预定平面上旋转。图9C示出了这样的情形,其中虚拟声源VSS沿着由预先提供的函数所表示的路线以三维方式移动。
[0093] 图9D示出了这样的情形,其中虚拟声源VSS的幅度改变。在此情形下,例如,扬声器SP1到SPm需要被划分为多个组,从而使得每个组形成的虚拟声源的位置有所不同,另外,该组合也改变。即,如果虚拟声源被形成在基本相同的位置,则小虚拟声源作为一个整体被形成。相反,如果虚拟声源被形成在不同的位置,则大虚拟声源作为一个整体被形成。图9A到9D的波动还可被组合,从而可以下述方式执行控制,即虚拟声源VSS的幅度如图9D所示被改变,同时,例如如图9B所示旋转。这些波动的模式由收听者(用户)利用操作部分25进行选择或设置。
[0094] 以此方式,在图8所示回放装置中,被再现的虚拟声源VSS的位置可波动或改变。因此,根据该回放装置,在音乐回放期间,可提供自然的声场和声源,其具有极为生动的感觉和丰富的真实感,并且很宽广。或者,在语音的情形下,可产生能感觉到呼吸的真实感。
[0095] 此外,声源的移动状态也可被模拟,并且还可创建特殊的变形效果。具体地说,当视频例如动画、游戏或SF电影存在时,可执行更有效的声像处理。例如,当声源从远处向收听者靠近时,如果虚拟声源VSS的位置被如此控制,并且同时执行控制以使得虚拟声源VSS的幅度随着声源靠近而逐渐增大,则可给出更有力和更真实的感觉。
[0096] (7)其它
[0097] 在上述描述中,描述了这样的情形,其中多个(m)个扬声器SP1到SPm被水平排为一行,以构成扬声器阵列。或者,扬声器SP1到SPm还可被排列为垂直平面内多行多列的矩阵。在上述描述中,扬声器SP1到SPm和平面SSR是彼此平行的。但是,它们不需要是平行的,并且扬声器SP1到SPm可以不必排为直线形或平面形状。
[0098] 对于与方向有关的听觉,水平方向上的灵敏度和识别性能很高,而垂直方向上的则很低。因此,扬声器SP1到SPm可被排列为交叉形状或倒T形。此外,当扬声器SP1到SPm被集成在AV系统中时,扬声器SP1到SPm还可被排列为框的形状,即位于显示器的上、下、左、右,或者排列为符号∏的形状,即位于显示器的上、左和右,或者排列为Ц的形状,即位于显示器的下、左和右。
[0099] 此外,当存在视频时,虚拟声源VSS的波动还可根据变为视频的视频信号而被控制。
[0100] 本领域的技术人员应当理解,各种修改、组合、子组合和替换可根据设计需要和其它因素而出现,只要它们落在所附权利要求或其等同的范围内。
[0101] 本发明包含与2004年9月17日向日本专利局提交的日本专利申请JP2004-270873有关的内容,该申请的全部内容通过引用而被包含于此。