声像定位装置转让专利

申请号 : CN200710196277.6

文献号 : CN101175343B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 饭田一博伊藤元邦

申请人 : 松下电器产业株式会社

摘要 :

使用根据与目标位置对应的参数的单一的IIR滤波器的声像定位装置和使用一个标准的头部传递函数的声像定位装置中,无法对多个收听者容易且正确地进行声像定位,因此在本发明的声像定位装置中,其结构包括:参数设定单元,由来自收听者的图像信息的身体特征信息、收听者的属性、所输入的目标位置等设定用于再现头部传递函数的结构特征的参数;以及声像定位处理单元,按照所述参数对声源信号进行声像定位处理,并输出声像定位信号。

权利要求 :

1.声像定位装置,所述声像定位装置对声源信号进行处理以使声像定位在目标位置,所述声像定位装置包括:参数设定单元,设定用于再现对应于所输入的目标位置的头部传递函数的结构特征中声像定位所需的一部分结构特征的参数;以及声像定位处理单元,按照所述参数对所述声源信号进行声像定位处理,输出声像定位信号,所述结构特征至少包含一个峰值和比该峰值偏于高频端的两个谷值,所述参数设定单元至少设定用于再现所述两个谷值的结构特征的参数。

2.如权利要求1所述的声像定位装置,所述参数设定单元除了设定用于再现所述两个谷值的构造特征的参数外,还设定用于再现所述一个峰值的构造特征的参数。

3.如权利要求1所述的声像定位装置,所述结构特征还包含所述头部传递函数的左右耳的时间差及左右耳的电平差中的至少一个,所述参数设定单元还设定用于再现所述头部传递函数的左右耳的时间差及左右耳的电平差中至少一个的参数。

4.如权利要求1所述的声像定位装置,所述参数设定单元还基于所输入的收听者信息设定适合于所述收听者信息的所述参数。

5.如权利要求1所述的声像定位装置,所述参数设定单元保持用于表示目标位置和所述参数之间的关系的函数,并根据所输入的目标位置用所述函数算出所述参数。

6.如权利要求1所述的声像定位装置,其中,所述参数设定单元保持用于保存与目标位置对应的所述参数的参数表,并从所述参数表中选择与所输入的目标位置对应的所述参数。

7.如权利要求4所述的声像定位装置,所述参数设定单元保持用于表示所输入的收听者信息和目标位置与所述参数之间的关系的函数,并根据所述收听者信息和所述目标位置用所述函数算出所述参数。

8.如权利要求4所述的声像定位装置,所述参数设定单元保持用于保存与所述收听者信息和目标位置对应的所述参数的参数表,并从所述参数表中选择与所输入的目标位置和所述收听者信息对应的所述参数。

9.如权利要求6或权利要求8所述的声像定位装置,所述参数设定单元在所输入的目标位置没有包含在所述参数表中时,通过从相邻位置的所述参数进行插补而求得所述目标位置的参数。

10.如权利要求1所述的声像定位装置,所述声像定位处理单元包括用于再现所述两个谷值的多个无限脉冲响应滤波器,所述参数设定单元对所述多个无限脉冲响应滤波器设定用于再现所述两个谷值的参数。

11.如权利要求10所述的声像定位装置,所述声像定位处理单元还包括用于再现所述一个峰值的无限脉冲响应滤波器,所述参数设定单元对所述无限脉冲响应滤波器设定用于再现所述一个峰值的参数。

12.如权利要求10所述的声像定位装置,所述声像定位处理单元还包括延时器及电平调整器中的至少一个,所述参数设定单元将再现所述左右耳的时间差的参数设定在所述延时器中,将再现所述左右耳的电平差的参数设定在所述电平调整器中。

13.如权利要求1所述的声像定位装置,所述参数设定单元在再现对于左右中的任一个耳朵的所述头部传递函数的结构特征时,再现与另一个耳朵的目标位置左右对称的位置的所述头部传递函数的结构特征。

14.如权利要求1所述的声像定位装置,所述参数设定单元根据为声像定位处理所分配的处理量,改变要再现的所述头部传递函数的结构特征的数并设定参数。

15.如权利要求1所述的声像定位装置,所述参数设定单元根据所述输入的目标位置,改变要再现的所述头部传递函数的结构特征的数并设定参数。

16.如权利要求1所述的声像定位装置,所述参数设定单元,根据收听者而改变要再现的所述头部传递函数的结构特征的数并设定参数。

17.如权利要求4所述的声像定位装置,所述收听者信息是关于收听者的身体特征的身体特征信息。

18.如权利要求17所述的声像定位装置,它还包括:身体特征提取单元,从包含所输入的收听者的身体特征的信息中提取收听者的身体特征信息并进行输出。

19.如权利要求18所述的声像定位装置,包含所述收听者的身体特征的信息是收听者的图像信息。

20.如权利要求4所述的声像定位装置,所述收听者信息是由收听者的实测或数值计算所得到的头部传递函数。

21.如权利要求4所述的声像定位装置,所述收听者信息是收听者的属性信息。

22.如权利要求4所述的声像定位装置,所述收听者信息是有关收听者的听觉特征的信息。

23.声像定位方法,所述方法包括:

参数设定步骤,设定以下参数,即,仅再现与输入的目标位置对应的从头部传递函数的频率特性中所包含的峰值、谷值、高频阻尼及低频阻尼中选择的特性的参数;再现所述头部传递函数的左右耳的时间差的参数;以及再现所述头部传递函数的左右耳的电平差的参数;中至少一个参数,声像定位处理步骤,按照所述参数对声源信号进行声像定位处理并输出声像定位信号,所述头部传递函数的频率特性,至少包含一个峰值和比该峰值偏于高频端的两个谷值,所述参数设定步骤至少设定用于再现所述两个谷值的特征的参数。

说明书 :

技术领域

本发明涉及使声像定位在三维空间的任意位置的声像定位装置。

背景技术

以往,对于使用扬声器和耳机等声音再生装置使声像定位在三维空间的任意位置的技术有诸多的研究。
通过这些研究,知道了通过真实地再现从想要使声像定位的位置到收听者的耳朵的声音传递特性,并将该声音传递特性卷积到声源信号而向收听者进行提示,能够使声像定位在期望的位置上。
该声音传递特征可分为表示通过墙壁等的反射、衍射、散射等的传递特性的空间传递函数,和表示通过收听者的头部和身体的反射、衍射、散射等的传递特性的头部传递函数等。
其中,对于使用了头部传递函数的声像定位,已知通过真实地再现收听者的头部传递函数,并将该头部传递函数加入到声源信号而向收听者进行提示,从而能够使声像定位在任意的位置上(例如,参照非专利文献1)。
在使用了该头部传递函数的以往的声像定位装置中,有将收听者本人的头部传递函数正确地测定,并将该头部传递函数真实地再现而进行声像定位的装置,以及对所有的收听者共同使用标准的头部传递函数而进行声像定位的装置。
图14是表示以往的声像定位装置的方框图。
图14中,以往的声像定位装置包括:头部传递函数存储部分61,将在每个想要使声像定位的方向上生成的头部传递函数作为FIR(Finite ImpulseResponse)滤波器的系数来存储;头部传递函数选择部分62,根据定位声像的目标位置信息而选择头部传递函数;声像定位处理部分63,根据所选择的头部传递函数进行滤波处理并输出。
这里,存储在头部传递函数存储部分61中的头部传递函数可以是收听者本人的头部传递函数,也可以是对所有的收听者共同使用的标准的头部传递函数。
在这样的以往的声像定位装置中,输入的声源信号根据输入的目标位置信息对选择的头部传递函数卷积,作为已被声像定位的声音信号即声像定位信号而被输出到耳机和扬声器等声音再生装置。
这样,在以往的声像定位装置中,可使用收听者本人或标准的头部传递函数进行声像定位。
但是,在这样的以往的声像定位装置中,需要存储所有想要使声像定位的位置的头部传递函数,其数据量庞大。并且,通过FIR滤波器的声像定位处理,其运算量增加,阻碍了声像定位装置小型化、简化。
为了解决这样的问题,存在这样的方案,在必要的位置单位保持用于模拟所测定的头部传递函数的单一的IIR(Infinite Impulse Response)滤波器的参数(中心频率fc、锐度Q、电平L),通过与目标位置对应的参数,用IIR滤波器模拟头部传递函数(例如,参照专利文献1)。
此外,已知头部传递函数存在个人差,在使用非本人的头部传递函数时,存在无法将声像正确地定位在作为目标的位置上的情况。因此,在将标准的头部传递函数对所有的收听者共同使用的声像定位装置中,存在着产生无法正确进行声像定位的收听者的问题。
此外,由于测定头部传递函数需要特殊的装置等,因此对于所有的收听者测定本人的头部传递函数,在现实上是不可能的,存在着不易制作用于收听者本人的头部传递函数的声像定位装置的问题。
为了解决这样的问题,存在这样的方案,通过使标准的头部传递函数在频率轴上进行扩展或收缩,从而导出与各收听者对应的头部传递函数,并进行声像定位(例如,参照专利文献2)。
专利文献1:特开2000-23299号公报
专利文献2:特开2001-16697号公报
非专利文献1:イエンスブラウエルト·森本政之·后藤敏幸编著「空间音响」鹿岛出版会、昭和61年7月10日

发明内容

发明要解决的问题
但是,在专利文献1所公开的声像定位装置中,由于仅用单一的IIR滤波器模拟头部传递函数,因此只能再现头部传递函数的振幅频率特性中所包含的峰值和谷值(dip)的其中一个,存在有时不能正确进行声像定位的问题。再者,若想真实地模拟头部传递函数的振幅频率特性,则需要很多个IIR滤波器,与上述的以往例子相同,存在所需的数据量及运算量较多的问题。
此外,在专利文献2所公开的声像定位装置中,只是将所有标准的头部传递函数在频率轴上进行扩展或收缩,因此有时存在无法再现适合于各收听者的头部传递函数,且不能正确进行声像定位的问题。
本发明是为了解决以往的问题而制作完成的,其目的在于提供一种声像定位装置,该装置能够削减所需的数据量及运算量,同时能够对多个收听者容易且正确地进行声像定位。
解决课题的方案
本发明提供一种声像定位装置,所述声像定位装置对声源信号进行处理以使声像定位在目标位置,所述声像定位装置包括:参数设定单元,设定用于再现对应于所输入的目标位置的头部传递函数的结构特征中声像定位所需的一部分结构特征的参数;以及声像定位处理单元,按照所述参数对所述声源信号进行声像定位处理,输出声像定位信号。所述结构特征至少包含一个峰值和比该峰值偏于高频端的两个谷值。所述参数设定单元至少设定用于再现所述两个谷值的结构特征的参数。
本发明还提供一种声像定位方法,所述方法包括:参数设定步骤,设定以下参数,即,仅再现与输入的目标位置对应的从头部传递函数的频率特性中所包含的峰值、谷值、高频阻尼及低频阻尼中选择的特性的参数;再现所述头部传递函数的左右耳的时间差的参数;以及再现所述头部传递函数的左右耳的电平差的参数;中至少一个参数,声像定位处理步骤,按照所述参数对声源信号进行声像定位处理并输出声像定位信号。所述头部传递函数的频率特性,至少包含一个峰值和比该峰值偏于高频端的两个谷值。所述参数设定步骤至少设定用于再现所述两个谷值的参数。
本发明的声像定位装置具有,对声源信号进行处理以再现与所输入的目标位置对应的头部传递函数的结构特征的结构。
根据该结构,通过只要再现头部传递函数的结构特征,就能够容易且正确地进行声像定位,并能够削减所需的数据量及运算量。
这里,结构包括:设定用于再现所述头部传递函数的结构特征的参数的参数设定单元;以及按照所述参数对所述声源信号进行声像定位处理并输出声像定位信号的声像定位处理单元。
根据该结构,通过用于再现头部传递函数的结构特征的参数进行声像定位处理。因此,能够容易且正确地进行声像定位。
此外,所述参数设定单元的结构为,根据所输入的收听者信息设定适合所述收听者信息的所述参数。
根据该结构,设定适合所输入的收听者信息的参数。因此,能够容易且正确地对更多的人进行声像定位。
此外,所述收听者信息构成为有关收听者的身体特征的身体特征信息。
根据该结构,设定适合收听者的身体特征的参数。因此,能够容易且正确地对更多的人进行声像定位。
此外,结构包括身体特征提取单元,其从包含所输入的收听者的身体特征的信息中提取收听者的身体特征信息并输出。
根据该结构,从包含所输入的收听者的身体特征的信息中提取身体特征信息,设定适合所提取的身体特征信息的参数。因此,能够容易且正确地对更多的人进行声像定位。
此外,包含所述收听者的身体特征的信息构成为收听者的图像信息。
根据该结构,从收听者的图像信息中提取身体特征信息,设定适合所提取的身体特征信息的参数。因此,能够容易且正确地对更多的人进行声像定位。
此外,所述收听者信息构成为收听者的实测或数值计算所得的头部传递函数。
根据该结构,设定适合收听者的头部传递函数的参数,因此,能够容易且正确地对更多的人进行声像定位。
此外,所述收听者信息构成为收听者的属性信息。
根据该结构,设定适合收听者的属性信息的参数。因此,能够容易且正确地对更多的人进行声像定位。
此外,所述收听者信息构成为有关收听者的听觉特征的信息。
根据该结构,设定适合有关收听者的听觉特征的信息的参数。因此,能够容易且正确地对更多的人进行声像定位。
此外,所述参数设定单元构成为保持用于表示目标位置和参数之间的关系的函数,并从所输入的目标位置通过所述函数计算所述参数。
根据该结构,能够容易地由目标位置设定参数,并能够削减所需的数据量及运算量。
此外,所述参数设定单元构成为保持用于保存与目标位置对应的所述参数的参数表,并从所述参数表选择与所输入的目标位置对应的所述参数。
根据该结构,能够容易地由目标位置设定参数,并能够削减所需的数据量及运算量。
此外,所述参数设定单元构成为保持用于表示所述收听者信息和目标位置以及所述参数之间的关系的函数,并从所输入的目标位置和所述收听者信息通过所述函数计算所述参数。
根据该结构,能够容易地由目标位置设定参数,并能够削减所需的数据量及运算量。
此外,所述参数设定单元构成为保持用于保存与所述收听者信息和目标位置对应的所述参数的参数表,并从所述参数表选择与所输入的目标位置和所述收听者信息对应的所述参数。
根据该结构,能够容易地由目标位置设定参数,并能够削减所需的数据量及运算量。
此外,所述参数设定单元构成为在所输入的目标位置没有包含在所述参数表中时,由接近位置的所述参数通过插补求解所述目标位置的参数。
根据该结构,能够削减所需的数据量。
此外,所述参数设定单元构成为设定仅再现从所述头部传递函数的振幅频率特性中所包含的峰值、谷值、高频阻尼及低频阻尼中选择的参数。
根据该结构,通过仅再现头部传递函数的振幅频率特性中所包含的峰值、谷值、高频阻尼及低频阻尼中选择的参数,能够容易且正确地进行声像定位,并能够削减所需的数据量及运算量。
此外,所述参数设定单元构成为设定用于再现所述头部传递函数的左右耳的时间差及电平差中的至少一个的参数。
根据该结构,仅通过设定再现头部传递函数的左右耳的时间差及电平差中的至少一个的参数,能够容易且正确地进行声像定位,并能够削减所需所需的数据量及运算量。
此外,所述声像定位处理单元构成为包括多个IIR滤波器,所述参数设定单元构成为在所述IIR滤波器中设定用于再现所述峰值、谷值、高频阻尼及低频阻尼的参数。
根据该结构,能够削减所需的数据量及运算量。
此外,所述声像定位处理单元构成为包括延时器(delayer)及电平调整器中的至少一个,所述参数设定单元将再现所述左右耳的时间差的参数设定在所述延时器中,而将再现所述左右耳的电平差的参数设定在所述电平调整器中。
根据该结构,能够削减所需的数据量及运算量。
此外,构成为在再现对于左右耳中的任何一个耳朵的所述头部传递函数的结构特征时,使用与另一个耳朵的目标位置左右对称的位置的所述头部传递函数的构造性特征。
根据该结构,能够削减所需的数据量。
此外,构成为改变所再现的所述头部传递函数的结构特征的数量。
根据该结构,能够削减所需的数据量及运算量。
此外,构成为根据为声像定位处理所分配的处理量,改变所再现的所述头部传递函数的结构特征的数量。
根据该结构,能够削减所需的数据量及运算量。
此外,构成为根据所述输入的目标位置而改变所再现的所述头部传递函数的结构特征的数量。
根据该结构,能够削减所需的数据量及运算量。
此外,构成为根据收听者而改变所再现的所述头部传递函数的结构特征的数量。
根据该结构,能够削减所需的数据量及运算量。
此外,本发明的程序使计算机具有作为参数设定单元和声像定位处理单元的功能,其中,参数设定单元设定以下参数,仅再现与输入的目标位置对应的从头部传递函数的振幅频率特性中所包含的峰值、谷值、高频阻尼及低频阻尼中选择的参数;再现所述头部传递函数的左右耳的时间差的参数;以及再现所述头部传递函数的左右耳的电平差的参数中的至少一个参数;声像定位处理单元按照所述参数对声源信号进行声像定位处理,从而输出声像定位信号。
根据该结构,仅通过再现头部传递函数的振幅频率特性中所包含的,且被选择的峰值、谷值、高频阻尼及低频阻尼、头部传递函数的左右耳的时间差、以及头部传递函数的左右耳的电平差中的至少一个,能够容易且正确地进行声像定位,并能够削减所需的数据量及运算量。
发明的效果
根据本发明,通过仅再现与所输入的目标位置对应的头部传递函数的构造性特征,能够削减所需的数据量及运算量,同时能够容易且正确地对更多的人进行声像定位。

附图说明

图1是本发明的实施方式1的声像定位装置的方框图。
图2是表示头部传递函数的振幅频率特性的构造特征的图。
图3是表示头部传递函数的两耳间时间差及两耳间电平差的图。
图4是本发明的实施方式1的声像定位装置的声像定位处理部分的方框图。
图5是表示再现本发明的实施方式1的声像定位装置的振幅频率特性的峰值及谷值的其他方法的图。
图6是表示本发明的实施方式1的声像定位装置的参数设定部分使用了参数设定函数的例子的方框图。
图7是表示本发明的实施方式1的声像定位装置的参数设定部分使用了参数表的例子的方框图。
图8是本发明的实施方式2的声像定位装置的方框图。
图9是表示本发明的实施方式2的声像定位装置的参数设定部分使用了参数设定函数的例子的方框图。
图10是表示本发明的实施方式2的声像定位装置的参数设定部分使用了参数表的例子的方框图。
图11是本发明的实施方式3的声像定位装置的方框图。
图12是本发明的实施方式3的声像定位装置的身体特征提取部分的方框图。
图13是表示头部传递函数的左右对称性的图。
图14是以往的声像定位装置的方框图。
标号说明
11参数设定部分
111参数计算部分
112参数选择部分
12声像定位处理部分
121La~121Lz、121Ra~121Rz IIR滤波器
122L、122R延时器
123L、123R电平调整器
21参数设定部分
211参数计算部分
212参数选择部分
31身体特征提取部分
311图像识别部分
61头部传递函数存储部分
62头部传递函数选择部分
63声像定位处理部分

具体实施方式

首先,说明有关头部传递函数的结构特征的理论,头部传递函数是用于进行作为本发明的基本的声像定位的线索。
如技术背景中叙述的那样,如果真实地再现头部传递函数,就能够将声像定位在任意位置,因此认为用于声像定位的线索就包含在头部传递函数中。
根据所述非专利文献1,认为用于声像定位的线索中,与前后和上下方向的定位有关的线索包含在头部传递函数的振幅频率特性所包含的峰值、谷值、高频或低频中的阻尼等构造特征中。此外,认为与左右方向的定位有关的线索包含在头部传递函数所包含的左右的时间差(两耳间时间差:ITD(Interaural Time Difference))和电平差(两耳间电平差:ILD(Interaural LevelDifference))等结构特征中。
本发明人就成为前后及上下方向的声像定位的线索的头部传递函数的结构特征,对每个被实验者进行了分析。其结果,发现并不是头部传递函数中包含的所有的结构特征(峰值、谷值、高频或低频中的阻尼)都需要再现,而只要通过再现其中的几个(例如5、6个),就能够正确地进行声像定位。
而且,还得知通过仅再现个人差较少的结构特征,就能够对多个收听者正确地进行声像定位。
另外,已知通过使用ITD及ILD,声像的左右方向的定位可以与前后及上下方向的定位相独立地控制(例如,参照专利第3388235号)。因此,对再现了成为上述的前后及上下方向的声像定位的线索的头部传递函数的结构特征的信号,可以使用ITD及ILD,控制声像的左右方向。
以下,参照附图说明本发明的实施方式。
(实施方式1)
图1是表示本发明的实施方式1的声像定位装置的图。
图1中,本实施方式的声像定位装置包括:参数设定部分11,保持用于将进行与目标位置对应的声像定位的头部传递函数的结构特征再现的参数,并基于所输入的目标位置信息将对应的参数设定于声像定位处理部分12;以及声像定位处理部分12,基于由参数设定部分11设定的参数而对所输入的声源信号进行声像定位处理,从而将施加了声像定位处理的声像定位信号输出到未图示的耳机和扬声器等声音再生装置。
参数设定部分11在如图2所示的想要定位声像的每个目标位置,在与目标位置对应的标准头部传递函数的振幅频率特性|Hl,r(f)|所包含的峰值P1、P2...、谷值D1、D2...、高频阻尼Ch、低频阻尼Cl等结构特征中,设定了用于再现所选择的多个特征分别对应的参数,即,中心频率fc、锐度Q、电平L。
此外,在如图3所示的想要定位声像的每个目标位置,设定了用于再现与目标位置对应的标准头部传递函数(左耳:hl(t)、右耳:hr(t))的ITD和ILD等结构特征的参数,即,延时量及电平调整量。
如图4所示,声像定位处理部分12包括:基于所设定的中心频率fc、锐度Q、电平L的参数,对输入信号进行再现头部传递函数的峰值、谷值、高频阻尼或低频阻尼的滤波处理的左耳用的多个IIR滤波器121La~121Lz;基于所设定的延时量,使输入信号延时的左耳用的延时器122L;基于所设定的电平调整量调整输入信号的电平的左耳用的电平调整器123L;基于所设定的中心频率fc、锐度Q、电平L的参数,对输入信号进行再现头部传递函数的峰值、谷值、高频阻尼或低频阻尼的滤波处理的右耳用的多个IIR滤波器121Ra~121Rz;基于所设定的延时量,使输入信号延时的右耳用的延时器122R;基于所设定的电平调整量,调整输入信号的电平的右耳用的电平调整器123R。
在这样的声像定位装置中,当参数设定部分11中被输入目标位置信息时,参数设定部分11读出与输入的目标位置信息对应的左耳用、右耳用的各自的参数(中心频率fc、锐度Q、电平L),将相当于所设定的数的参数进行设定,将左耳用的参数与左耳用的IIR滤波器121La~121Lz对应,将右耳用的参数与右耳用的IIR滤波器121Ra~121Rz对应,以使一个参数分别与一个IIR滤波器对应。
此外,设定与输入的目标位置信息对应的左耳用、右耳用的延时量,将左耳用的延时量设定在左耳用的延时器122L中,将右耳用的延时量设定在右耳用的延时器122R中,设定与输入的目标位置信息对应的左耳用、右耳用的电平调整量,将左耳用的电平调整量设定在左耳用的电平调整器123L中,将右耳用的电平调整量设定在右耳用的电平调整器123R中。
在声像定位处理部分12,对于被分为左耳用、右耳用的声源信号,IIR滤波器121La~121Lz、121Ra~121Rz、延时器122L、122R、电平调整器123L、123R各自按照设定在参数设定部分11中的参数,对左耳用、右耳用的信号分别进行处理,从而输出被声像定位过的左耳用(Lch)声像定位信号及右耳用(Rch)声像定位信号。
这样,在本实施方式中,并不是真实地再现头部传递函数,而仅再现作为头部传递函数的结构特征的峰值、谷值、高频阻尼及低频阻尼中所选择的特征,因此能够削减所需的数据量及运算量,同时能够容易且正确地对多个收听者进行声像定位。
另外,本实施方式中,用1个IIR滤波器再现了1个峰值或谷值,但如图5所示,通过将1个峰值P1’和2个谷值D1’、D2’进行组合,从而能够再现3个峰值和2个谷值。即,能够用再现P1’、D1’、D2’的3个IIR滤波器来再现5个峰值及谷值,从而能够减少所使用的IIR滤波器的数量。如上所述,还能够通过更少数量的IIR滤波器的组合来实现头部传递函数中所包含的多个峰值和谷值。
此外,如图6所示,参数设定部分11也可以具有参数计算部分111,预先保存用于表示目标位置和参数的值之间的关系的函数,在参数计算部分111中,根据该函数来计算出与输入的目标位置信息对应的参数。
此外,如图7所示,参数设定部分11也可以具有参数选择部分112,预先保存用于存储与目标位置对应的参数的参数表,参数选择部分112从参数表中选择与输入的目标位置信息对应的参数。这种情况下,目标位置没有被包含在参数表中时,例如,能够从与目标位置接近的位置的参数,通过使用普遍被使用的线性插补等插补处理而求得目标位置的参数。
(实施方式2)
图8是表示本发明的实施方式2的声像定位装置的图。另外,本实施方式与上述的实施方式1的结构大致相同,因此对相同的构成赋予同样的标号,并仅说明特征部分。
本实施方式的声像定位装置的特征在于,参数设定部分21在目标位置信息的基础上还输入收听者的头部和耳朵的大小或形状等对声像定位带来影响的身体特征信息,并基于该身体特征信息和目标位置信息来决定在声像定位处理部分12中所设定的参数。
具体来说,在参数设定部分21中,对于与耳翼的形状等有关的每个身体特征信息(例如,耳翼(pinna)的大小和外耳(concha)的大小等)的值,对于想要定位声像的每个目标位置,在与耳翼的形状等和目标位置对应的头部传递函数的振幅频率特性|Hl,r(f)|所包含的峰值、谷值、高频阻尼及低频阻尼等结构特征中,设定了用于再现与所选择的多个特征分别对应的参数(中心频率fc、锐度Q、电平L)。
此外,在参数设定部分21中,对于与头部的大小等有关的每个身体特征信息(例如,从正面看到的头的大小(head size)等)的值,设定了用于再现对于想要定位声像的每个目标位置的、与头部的大小等和目标位置对应的头部传递函数(左耳:hl(t)、右耳:hr(t))的ITD和ILD等结构特征的参数(延时量及电平调整量)。
然后,参数设定部分21中被输入目标位置信息和耳翼的形状等以及头部的大小等身体特征信息时,参数设定部分21读出与所输入的目标位置信息和耳翼的形状等对应的左耳用、右耳用的各自的参数(中心频率fc、锐度Q、电平L),将相当于所设定的数的参数进行设定,将左耳用的参数设定在左耳用的IIR滤波器121La~121Lz中,将右耳用的参数设定在右耳用的IIR滤波器121Ra~121Rz中,以使一个参数分别与一个IIR滤波器对应。
此外,设定与输入的目标位置信息和头部的大小等对应的左耳用、右耳用的延时量,将左耳用的延时量设定在左耳用的延时器122L中,将右耳用的延时量设定在右耳用的延时器122R中,设定与输入的目标位置信息和头部的大小等对应的左耳用、右耳用的电平调整量,将左耳用的电平调整量设定在左耳用的电平调整器123L中,将右耳用的电平调整量设定在右耳用的电平调整器123R中。
在声像定位处理部分12,对于被分为左耳用、右耳用的声源信号,IIR滤波器121La~121Lz、121Ra~121Rz、延时器122L、122R、电平调整器123L、123R按照各自设定在参数设定部分21中的参数,对左耳用、右耳用的信号分别进行处理,输出被声像定位过的左耳用(Lch)声像定位信号及右耳用(Rch)声像定位信号。
这样在本实施方式中,仅再现在作为与收听者的身体特征信息和目标位置对应的头部传递函数的从结构特征的峰值、谷值、高频阻尼及低频阻尼中选择的特征,因此能够削减所需的数据量及运算量,同时能够容易且正确地对多个收听者进行声像定位。
另外,如图9所示,参数设定部分21也可以具有参数计算部分211,预先保存用于表示身体特征信息值和目标位置以及参数值之间的关系的函数,由参数计算部分211根据该函数计算与输入的目标位置信息及身体特征信息对应的参数。
此外,如图10所示,参数设定部分21也可以具有参数选择部分212,预先保存对表示身体特征的每个值存储与目标位置对应的参数的参数表,参数选择部分212从参数表中选择与所输入的身体特征信息及目标位置信息对应的参数。这种情况下,目标位置没有被包含在参数表中时,例如,能够从与目标位置接近的位置的参数,通过使用普遍被使用的线性插补等插补处理来求解目标位置的参数。
此外,在本实施方式中,基于身体特征信息设定了参数,但例如,也可以基于收听者的实测或数值计算所得到的头部传递函数来设定参数。这种情况下,从收听者的头部传递函数中提取振幅频率特性的峰值和谷值、高频阻尼、低频阻尼、ITD和ILD,并基于它们设定参数即可。或者,也可以基于收听者的年龄和性别等属性信息来设定参数。或者,也可以基于非专利文献1中所详细叙述的方向确定区域和听力等与收听者的听觉特征有关的信息来设定参数。
(实施方式3)
图11是表示本发明的实施方式3的声像定位装置的图。另外,本实施方式与上述的实施方式2的构成大致相同,因此对相同的构成赋予同样的标号,并仅说明特征部分。
本实施方式的声像定位装置的特征在于,包括从包含所输入的收听者的身体特征的信息中提取身体特征信息并输出到参数设定部分21的身体特征提取部分31,基于身体特征提取部分31所提取的身体特征信息和目标位置信息,决定在声像定位处理部分12中所设定的参数。
与实施方式2同样地,在参数设定部分21中,对于与耳翼的形状等有关的每个身体特征信息(例如,耳翼(pinna)的大小和外耳(concha)的大小等)的值,对于想要定位声像的每个目标位置,设定了在与耳翼的形状等和目标位置对应的头部传递函数的振幅频率特性|Hl,r(f)|所包含的峰值、谷值、高频阻尼及低频阻尼等结构特征中,用于再现与所选择的多个特征分别对应的参数(中心频率fc、锐度Q、电平L)。
此外,在参数设定部分21中,对于与头部的大小等有关的每个身体特征信息(例如,从正面看到的头的大小(head size)等)的值,设定了对于想要定位声像的每个目标位置的、用于再现与头部的大小等和目标位置对应的头部传递函数(左耳:hl(t)、右耳:hr(t))的ITD和ILD等结构特征的参数(延时量及电平调整量)。
然后,如图12所示,身体特征提取部分31中被输入由相机等所拍摄的耳朵的图像信息和头部整体的图像信息等。
身体特征提取部分31通过图像识别部分311,使用特征提取和模式匹配等图像识别的方法,从所输入的图像信息中提取耳翼和头部的大小或耳翼的形状等身体特征信息,并输出到参数设定部分21。
参数设定部分21读出与所输入的目标位置信息和耳翼的形状等对应的左耳用、右耳用的各自的参数(中心频率fc、锐度Q、电平L),将相当于所设定的数的参数进行设定,将左耳用的参数设定在左耳用的IIR滤波器121La~121Lz中,将右耳用的参数设定在右耳用的IIR滤波器121Ra~121Rz中,以使一个参数各自与一个IIR滤波器对应。
此外,设定与输入的目标位置信息和头部的大小等对应的左耳用、右耳用的延时量,将左耳用的延时量设定在左耳用的延时器122L中,将右耳用的延时量设定在右耳用的延时器122R中,设定与输入的目标位置信息和头部的大小等对应的左耳用、右耳用的电平调整量,将左耳用的电平调整量设定在左耳用的电平调整器123L中,将右耳用的电平调整量设定在右耳用的电平调整器123R中。
在声像定位处理部分12,对于被分为左耳用、右耳用的声源信号,按照IIR滤波器121La~121Lz、121Ra~121Rz、延时器122L、122R、电平调整器123L、123R各自设定在参数设定部分21中的参数,对左耳用、右耳用的信号分别进行处理,从而输出被声像定位了的左耳用(Lch)声像定位信号及右耳用(Rch)声像定位信号。
这样在本实施方式中,从包含图像信息等收听者的身体特征的信息中提取身体特征信息,并且仅再现作为与提取的身体特征信息和目标位置对应的头部传递函数的结构特征的峰值、谷值、高频阻尼及低频阻尼中所选择的特征,因此能够容易地输入身体特征信息,能够削减所需的数据量及运算量,同时能够容易且正确地对多个收听者进行声像定位。
另外,在上述的各实施方式中,例如像中心面内的定位,在只需要定位声像的前后及上下方向的情况下,在参数设定部分中不进行ITD及ILD的设定,并且在声像定位处理部分中也不设置延时器和电平调整器,仅靠多个IIR滤波器就能进行声像定位处理。
此外,例如像水平面内的定位,在只需要定位声像的左右方向的情况下,在参数设定部分中不进行表示峰值、谷值、高频阻尼及低频阻尼的中心频率、电平、锐度等的设定,并且在声像定位处理部分中也不设置IIR滤波器,仅靠延时器和电平调整器就能进行声像定位处理。
此外,例如在中心面内附近,左右的头部传递函数的振幅频率特性的差异较少,因此在只需要在正中面内附近定位的情况下,对于IIR滤波器不分左耳用、右耳用,只设置一列对左右耳进行共同的处理,也能够得到同样的效果。
此外,在左右的时间差或电平差中,仅靠其中一个也能够对左右方向的声像定位带来线索,因此即使声像定位处理部分只包括延时器或者电平调整器的其中一个,参数设定部分对声像定位装置包括的延时器或者电平调整器只设定ITD或ILD的其中一个来进行声像定位处理,也能够得到同样的效果。
此外,人类的头部形状大致是左右对称的,因此,例如图13所示,位于从正面角的位置的右耳的头部传递函数Hr(f;)和位于左右对称的位置的左耳的头部传递函数Hl(f;-)中所包含的结构特征可以看作是大致相同的。同样的,位于角的位置的左耳的头部传递函数Hl(f;)和位于左右对称的位置的右耳的头部传递函数Hr(f;-)中所包含的结构特征可以看作是大致相同的。
因此,例如与头部传递函数的结构特征有关的信息,只保存收听者的右半侧的位置的信息,而在左半侧的位置上使用替换了左右对称的位置的左右耳的特征信息(图13中,将Hr(f;)的结构特征作为Hl(f;-)的结构特征来使用,或者将Hl(f;)的结构特征作为Hr(f;-)的结构特征来使用),也能得到同样的效果。只保存左半侧的位置的信息也是一样的。
或者,与头部传递函数的结构特征有关的信息,对所有的位置仅保存右耳的信息,而对于左耳使用左右对称位置的右耳的信息(图13中,对任意的将Hr(f;-)的结构特征作为Hl(f;)的结构特征来使用),也能够得到同样的效果。只保存左耳的信息也是一样的。
无论是哪一种情况下,都只是将头部传递函数中声像定位所需要的结构特征作为左右对称来处理,因此与直接将头部传递函数作为左右对象来处理的方法(例如,参照特开平7-111699号公报)相比,受到头部传递函数中所包含的细微的左右非对称性的影响较少,在所有的位置能够正确地进行声像定位。进而能够将需要的数据量减少到一半。
此外,进行声像定位所需的头部传递函数的结构特征的数没必要是一直恒定的,也可以根据进行声像定位的方向和收听者,或分配到声像定位的处理量而使其手动或自动地改变。
例如,在分配到声像定位的处理量变少的情况下,如果只留下结构特征中对声像定位起着特别重要的作用的特征来进行再现,则能够抑制有限的处理量下的声像定位效果的劣化。
此外,使用IIR滤波器、延时器、电平调整器进行了声像定位处理,但也可以使用具有相同功能的其他装置来进行上述的处理。例如,使用DSP(Digital Signal Processor)等,也可以用程序进行上述的处理。
此外,将参数设定部分、身体特征提取部分的各部分作为设定用于声像定位的参数的声像定位辅助装置也可以,作为根据通信等提供用于声像定位的参数的声像定位信息服务器也可以。此外,将声像定位处理部分作为基于用于声像定位的参数而进行声像定位处理的声像定位处理装置也可以。
此外,从扬声器等再现声像定位信号的情况下,显然,如需要的话,则只要将众所周知的串音(crosstalk)消除装置连接在上述的各实施方式的声像定位装置中,并在进行串音消除处理后通过扬声器等进行再现即可。
工业上的可利用性
如上所述,本发明的声像定位装置能够削减所需的数据量及运算量,同时具有能够对多个收听者容易且正确地进行声像定位的效果,在手机、声音再生装置、声音记录装置、信息终端装置、游戏机、会议装置、通信及广播系统等进行声音再生等的装置全体中进行声像定位处理时是有用的。
本发明是以下专利申请的分案申请:申请号:200580047926.5,申请日:2005年8月30日,发明名称:声像定位装置