一种基于音频分析的自适应立体声系统转让专利

申请号 : CN202010944331.6

文献号 : CN112153552B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 边仿

申请人 : 头领科技(昆山)有限公司

摘要 :

本发明提供一种基于音频分析的自适应立体声系统,其包括头戴式扬声器、TWS耳机和音频信号处理设备,且具有测试工况和播放工况两种工作状态;在测试工况下,所述音频信号处理设备用于生成带有音源位置信息的测试音频信号和处理经由所述TWS耳机回传的测量数字信号,求解收听者的HRTF并存储;在播放工况下,所述音频信号处理设备通过所述HRTF求解音源音频信号的播放音频信号,并将所述播放音频信号通过有线和/或无线途径输出至所述头戴式扬声器和/或所述TWS耳机。本发明兼具获取使用者HRTF与提供多声道立体声音频播放的功能,能够通过使用者的个性化输入和测量数据计算使用者所具有的独一无二的HRTF,并根据该HRTF对音频输入进行处理以获得符合使用者生理特征的,可提供更为真实音源位置信息的立体声音效。

权利要求 :

1.一种基于音频分析的自适应立体声系统,包括头戴式扬声器、TWS耳机和音频信号处理设备,所述基于音频分析的自适应立体声系统具有测试工况和播放工况两种工作状态,其特征在于:

在所述测试工况下,所述音频信号处理设备用于生成带有音源位置信息的测试音频信号和处理经由所述TWS耳机回传的测量数字信号,求解收听者的HRTF并存储;在所述播放工况下,所述音频信号处理设备通过所述HRTF求解音源音频信号的播放音频信号,并将所述播放音频信号通过有线和/或无线途径输出至所述头戴式扬声器和/或所述TWS耳机;

所述头戴式扬声器与所述音频信号处理设备通信连接;在所述测试工况下,所述头戴式扬声器用于将所述音频信号处理设备生成的所述测试音频信号转换为测试声信号;在所述播放工况下,所述头戴式扬声器用于将所述音频信号处理设备生成的所述播放音频信号转换为头戴式声信号;

所述TWS耳机包括耳塞和芯片仓;所述耳塞内设置有发声部和收声部,所述芯片仓内设置有数据转换模组和蓝牙传输模组;

所述发声部设置于所述耳塞靠近使用者耳道的一侧,用于将所述TWS耳机接收到的播放音频信号转化为TWS声信号向收听者传递;所述收声部设置于所述耳塞远离使用者耳道的一侧,用于接收所述头戴式扬声器释放的测试声信号并将其接收到的声信号转换为测量模拟信号;

在所述测试工况下,所述数据转换模组用于将所述测量模拟信号转换为测量数字信号并将其输出至所述蓝牙传输模组,所述蓝牙传输模组执行蓝牙栈协议将所述测量数字信号无线传输至所述音频信号处理设备;在所述播放工况下,蓝牙传输模组经无线传输手段由所述音频信号处理设备获取播放音频信号并将其输出至所述数据转换模组,所述数据转换模组将所述播放音频信号转换为播放模拟信号并将其输出至所述发声部;

所述头戴式声信号和所述TWS声信号能够组成四声道声场;

所述发声部与收声部之间设置有隔音部件,所述隔音部件为真空隔音仓室。

2.根据权利要求1所述的基于音频分析的自适应立体声系统,其特征在于,所述音源位置信息包括音源位置与收听者头部中心位置的距离R,音源位置与收听者头部之间的方位角φ,音源位置与收听者头部之间的俯仰角θ;所述方位角φ的角度范围为0°至360°,所述俯仰角θ的角度范围为‑90°至90°。

3.根据权利要求2所述的基于音频分析的自适应立体声系统,其特征在于,所述测试音频信号包括远场测试信号和近场测试信号;所述远场测试信号中音源位置与收听者头部中心位置的距离R为2米;所述近场测试信号中音源位置与收听者头部中心位置的距离R为1米。

4.根据权利要求2所述的基于音频分析的自适应立体声系统,其特征在于,音源位置与收听者头部之间的俯仰角θ的采样点为5个,分别为‑90°、‑45°、0°、45°、90°。

5.根据权利要求2所述的基于音频分析的自适应立体声系统,其特征在于,音源位置与收听者头部之间的方位角φ的采样点为8个,分别0°、45°、90°、135°、180°、225°、270°、315°和360°。

6.根据权利要求1所述的基于音频分析的自适应立体声系统,其特征在于,所述音频信号处理设备能够根据收听者的选择进行模式设定和/或参数设定。

7.根据权利要求6所述的基于音频分析的自适应立体声系统,其特征在于,所述模式设定包括姿态设定、性别设定、体态设定;所述参数设定包括身高设定、体重设定。

8.根据权利要求6所述的基于音频分析的自适应立体声系统,其特征在于,所述音频信号处理设备根据所述模式设定和参数设定计算收听者头部中心的高度。

9.根据权利要求1所述的基于音频分析的自适应立体声系统,其特征在于,所述头戴式扬声器包括外壳体和弹性耳套;所述外壳体与所述弹性耳套连接,所述弹性耳套用于与收听者头部接触;所述外壳体异于所述弹性耳套的一侧具有多层网结构,多层所述网结构的网格交错设置,所述网格上设置有网格谐振腔。

10.根据权利要求9所述的基于音频分析的自适应立体声系统,其特征在于,多层所述网结构之间相邻两层网格的网格重叠面积不大于35%。

11.根据权利要求9所述的基于音频分析的自适应立体声系统,其特征在于,所述弹性耳套包括弹性层和隔音环,所述弹性层包裹于所述隔音环的外侧。

12.根据权利要求11所述的基于音频分析的自适应立体声系统,其特征在于,所述隔音环一端与所述外壳体连接,所述隔音环异于外壳体的一侧被所述弹性层包裹;所述头戴式扬声器在佩戴时,收听者的头部与所述隔音环的距离不大于1.2毫米。

13.根据权利要求11所述的基于音频分析的自适应立体声系统,其特征在于,所述隔音环是一个具有双层壳体的封闭环,所述双层壳体之间为真空层,所述双层壳体的每层壳体的厚度不大于1.0毫米。

14.根据权利要求13所述的基于音频分析的自适应立体声系统,其特征在于,所述双层壳体包括内侧壳体和外侧壳体,所述外侧壳体上布置有环谐振腔,所述环谐振腔为直径

0.02毫米至0.12毫米、深0.1毫米至0.25毫米的轴对称孔结构;所述环谐振腔均布于所述外侧壳体,所述环谐振腔的开孔率为30%至80%。

15.根据权利要求9至14任意一项所述的基于音频分析的自适应立体声系统,其特征在于,所述头戴式扬声器在佩戴时与收听者头部紧密贴合,其与收听者头部所形成的密闭空间基底噪音不大于35db。

说明书 :

一种基于音频分析的自适应立体声系统

技术领域

[0001] 本发明涉及音频分析处理技术领域,尤其涉及一种基于音频分析的自适应立体声系统。

背景技术

[0002] 头相关传输函数HRTF(Head—Related Transfer Function)又称为ATF(Anatomical Transfer Function),是一种描述声波从音源到收听者双耳传输过程的音效
定位算法,它反应了人体结构,诸如头部、耳廓、躯干结构乃至性别对声波的综合滤波结果,
包含了关于音源的定位信息,对立体声音效的复现和音源虚拟位置信息的仿真具有非常重
要的意义。在实际应用场景中,耳机或扬声器可以将经由HRTF处理过的信号转换为声波信
号,来展现不同的空间听觉效果。
[0003] HRTF具有个性化特征,不同收听者的不同生理结构和尺寸特征决定了其具有独一无二的HRTF特征。华南理工大学物理科学与技术学院声学研究所谢菠荪教授等人在《头相
关传输函数数据库及其特性分析》中以52名受试者进行测量,建立了基于中国人采集样本
的高空间分辨率HRTF,其研究结果表明,在统计意义上最大双耳时间差(Interaural Time 
Differences,ITDS)存在显著的性别差异;并且,通过与国外CIPIC HRTF数据库的比对发
现,基于中国人样本的ITDS与主要基于西方人样本的统计结果具有显著差异,即HRTF的个
性化特征存在明显的性别和种群差异。
[0004] 现有的付诸应用的HRTF模型,是基于样本统计的平均化HRTF模型,特别是基于西方人样本的统计结果,其并不能较为真实的符合实际收听者的HRTF特征,因而基于其建立
的再现声场或模拟声场也就不能准确反应该声场中的音源位置信息。

发明内容

[0005] 针对现有技术中的上述缺点,本发明提供一种基于音频分析的自适应立体声系统,包括头戴式扬声器、TWS耳机和音频信号处理设备,所述基于音频分析的自适应立体声
系统具有测试工况和播放工况两种工作状态,在所述测试工况下,所述音频信号处理设备
用于生成带有音源位置信息的测试音频信号和处理经由所述TWS耳机回传的测量数字信
号,求解收听者的HRTF并存储;在所述播放工况下,所述音频信号处理设备通过所述HRTF求
解音源音频信号的播放音频信号,并将所述播放音频信号通过有线和/或无线途径输出至
所述头戴式扬声器和/或所述TWS耳机。
[0006] 所述头戴式扬声器与所述音频信号处理设备通信连接;在所述测试工况下,所述头戴式扬声器用于将所述音频信号处理设备生成的所述测试音频信号转换为测试声信号;
在所述播放工况下,所述头戴式扬声器用于将所述音频信号处理设备生成的所述播放音频
信号转换为头戴式声信号。
[0007] 所述TWS耳机包括耳塞和芯片仓;所述耳塞内设置有发声部和收声部,所述芯片仓内设置有数据转换模组和蓝牙传输模组;所述发声部设置于所述耳塞靠近使用者耳道的一
侧,用于将所述TWS耳机接收到的播放音频信号转化为TWS声信号向收听者传递;所述收声
部设置于所述耳塞远离使用者耳道的一侧,用于接收所述头戴式扬声器释放的测试声信号
并将其接收到的声信号转换为测量模拟信号。
[0008] 在所述测试工况下,所述数据转换模组用于将所述测量模拟信号转换为测量数字信号并将其输出至所述蓝牙传输模组,所述蓝牙传输模组执行蓝牙栈协议将所述测试数字
信号无线传输至所述音频信号处理设备;在所述播放工况下,蓝牙传输模组经无线传输手
段由所述音频信号处理设备获取播放音频信号并将其输出至所述数据转换模组,所述数据
转换模组将所述播放音频信号转换为播放模拟信号并将其输出至所述发声部。
[0009] 所述头戴式声信号和所述TWS声信号能够组成四声道声场。
[0010] 优选地,所述音源位置信息包括音源位置与收听者头部中心位置的距离R,音源位置与收听者头部之间的方位角φ,音源位置与收听者头部之间的俯仰角θ;所述方位角φ的
角度范围为0°至360°,所述俯仰角θ的角度范围为‑90°至90°。
[0011] 优选地,所述测试音频信号包括远场测试信号和近场测试信号;所述远场测试信号中音源位置与收听者头部中心位置的距离R为2米;所述近场测试信号中音源位置与收听
者头部中心位置的距离R为1米。
[0012] 优选地,音源位置与收听者头部之间的俯仰角θ的采样点为5个,分别为‑90°、‑45°、0°、45°、90°。
[0013] 优选地,音源位置与收听者头部之间的方位角φ的采样点为8个,分别0°、45°、90°、135°、180°、225°、270°、315°和360°。
[0014] 优选地,所述音频信号处理设备能够根据收听者的选择进行模式设定和/或参数设定。
[0015] 优选地,所述模式设定包括姿态设定、性别设定、体态设定;所述参数设定包括身高设定、体重设定。
[0016] 优选地,所述音频信号处理设备根据所述模式设定和参数设定计算收听者头部中心的高度。
[0017] 优选地,所述头戴式扬声器包括外壳体和弹性耳套;所述外壳体与所述弹性耳套连接,所述弹性耳套用于与收听者头部接触;所述外壳体异于所述弹性耳套的一侧具有多
层网结构,多层所述网结构的网格交错设置,所述网格上设置有网格谐振腔。
[0018] 优选地,多层所述网结构之间相邻两层网格的网格重叠面积不大于35%。
[0019] 优选地,所述弹性耳套包括弹性层和隔音环,所述弹性层包裹于所述隔音环的外侧。
[0020] 优选地,所述隔音环一端与所述外壳体连接,所述隔音环异于外壳体的一侧被所述弹性层包裹;所述头戴式扬声器在佩戴时,收听者的头部与所述隔音环的距离不大于1.2
毫米。
[0021] 优选地,所述隔音环是一个具有双层壳体的封闭环,所述双层壳体之间为真空层,所述双层壳体的每层壳体的厚度不大于1.2毫米。
[0022] 优选地,所述双层壳体包括内侧壳体和外侧壳体,所述外侧壳体上布置有环谐振腔,所述环谐振腔为直径0.02毫米至0.12毫米、深0.1毫米至0.25毫米的轴对称孔结构;所
述环谐振腔均布于所述外侧壳体,所述环谐振腔的开孔率为30%至80%。
[0023] 优选地,其特征在于,所述头戴式扬声器在佩戴时与收听者头部紧密贴合,其与使用者头部所形成的密闭空间基底噪音不大于35db。
[0024] 本发明通过一组头戴式耳机和TWS耳机以及音频信号处理设备组成兼顾使用者HRTF获取与多声道立体声音频播放功能的基于音频分析的自适应立体声系统,能够根据使
用者的个性化输入和测量数据计算使用者的个性化HRTF,并根据该HRTF对音频播放输入进
行处理,从而获得符合使用者身体特征的,可提供更为真实音源位置信息的立体声音效,适
用于头戴式耳机在电影、游戏以及远场音效音乐品鉴场景中的应用。

附图说明

[0025] 图1为本发明实施例结构示意图。
[0026] 图2为本发明实施例测试工况工作原理示意图。
[0027] 图3为本发明实施例播放工况工作原理示意图。
[0028] 图4为本发明实施例TWS耳机结构示意图。
[0029] 图5为本发明实施例头戴式扬声器局部结构示意图。
[0030] 图6为本发明实施例弹性耳套局部结构示意图。
[0031] 图7为本发明实施例隔音环结构示意图。
[0032] 图8为本发明实施例网结构示意图。
[0033] 图9为本发明实施例网/环谐振腔截面示意图。
[0034] 其中,基于音频分析的自适应立体声系统‑100、头戴式扬声器‑110、外壳体‑111、网结构‑1111、网格谐振腔‑1112、弹性耳套‑112、弹性层‑1121、隔音环‑1122、内侧壳体‑
11221、外侧壳体‑11222、环谐振腔‑11223、TWS耳机‑120、耳塞‑121、发声部‑1211、收声部‑
1212、芯片仓‑122、数据转换模‑1221、蓝牙传输模组‑1222、音频信号处理设备‑130;测试音
频信号‑211、测试声信号‑212、测量数字信号‑221、测量模拟信号‑222、音源音频信号‑231、
播放音频信号‑232,头戴式声信号‑233、TWS声信号‑234。。

具体实施方式

[0035] 为了建立基于收听者个性化特征的,能够准确反应音源位置信息的再现声场或模拟声场,本发明所提供的基于音频分析的自适应立体声系统是通过以下技术方案实现的:
[0036] 实施例1:
[0037] 请参阅图1至图4,其中,图1为本发明实施例结构示意图;图2为本发明实施例测试工况工作原理示意图;图3为本发明实施例播放工况工作原理示意图;图4为本发明实施例
TWS耳机结构示意图。
[0038] 本实施例提供一种基于音频分析的自适应立体声系统100,其包括头戴式扬声器110、TWS耳机120和音频信号处理设备130。该基于音频分析的自适应立体声系统100具有测
试工况和播放工况两种工作状态。
[0039] 在测试工况下,由音频信号处理设备130生成带有音源位置信息的测试音频信号211,该测试音频信号211由头戴式扬声器110播出,并由TWS耳机120接收,再回传至音频信
号处理设备130求解收听者的HRTF。具体地,头戴式扬声器110与音频信号处理设备130通信
连接,将音频信号处理设备130生成的测试音频信号211转换为测试声信号212,该测试声信
号212由TWS耳机120的收声部1212接收并生成测量模拟信号222并被发送至数据转换模组
1221,数据转换模组1221将该测量模拟信号222转换为测量数字信号221并将其输出至蓝牙
传输模组1222,由蓝牙传输模组1222执行蓝牙栈协议将测试数字信号无线传输至所述音频
信号处理设备130求解收听者的HRTF。
[0040] 该测量和求解HRTF的过程基于封闭耳道法,通过TWS耳机120对收听者的耳道形成封闭,并在收听者的耳道口布置声信号拾取装置,在完全保留HRTF中有关声源的空间方向
信息的基础上,避免耳道个体差异对测量结果的影响,兼顾HRTF简化测量的可实现性和准
确性。具体地,TWS耳机120由耳塞121和芯片仓122组成。其中,芯片仓122用于承载功能性元
件,例如数据转换模组1221、蓝牙传输模组1222、供电模组等;耳塞121内部则设置有发声部
1211和收声部1212,在使用时,收听者将耳塞121塞入耳道,耳塞121靠近收听者耳道的一侧
设置发声部1211,另一侧设置收声部1212。在测试工况下,发声部1211停止工作,以避免其
对收声部1212的干扰;发声部1211与收声部1212之间也可以设置隔音或吸引部件,例如真
空隔音仓室,真空隔音仓室由两层隔板和外壁连接件组成,其将发声部1211与收声部1212
分隔,两层隔板间为真空隔音带,黏弹性外壁连接件设置在其四周,其用于削弱收声部1212
与发声部1211间壳体传播路径的导振能力,并且发声部1211的相关连接线缆也布置在外壁
连接件内。
[0041] 在播放工况下,该系统可以通过头戴式扬声器110和TWS耳机120组成四声道播放系统,也可以单独使用头戴式扬声器110或TWS耳机120组成双声道播放系统。在该过程中,
音频信号处理设备130根据在测试工况中获得的HRTF求解音源音频信号231的播放音频信
号232,再根据头戴式扬声器110和TWS耳机120的工作模式重新分配各声道的播放音频信号
232,并将该信号通过有线和/或无线途径输出至头戴式扬声器110和/或TWS耳机120。具体
地,对于TWS耳机120,其由蓝牙传输模组1222经无线传输手段由所述音频信号处理设备130
获取播放音频信号232并将其输出至数据转换模组1221,数据转换模组1221将播放音频信
号232转换为播放模拟信号并将其输出至发声部1211继而产生TWS声信号234;对于头戴式
扬声器110,则可以通过相同的传递过程通过无线途径传输数据,或直接通过有线途径传输
数据继而产生头戴式声信号233。
[0042] 在测试工况下,头戴式扬声器110需要播放多组来自具有不同方位特征音源的测试声并根据收声部1212获得的反馈来确定收听者的HRTF特性。音源位置信息,即音源的方
位特征,包括音源位置与收听者头部中心位置的距离,音源位置与收听者头部之间的方位
角,音源位置与收听者头部之间的俯仰角;其中,方位角的角度范围为0°至360°,俯仰角的
角度范围为‑90°至90°。而对于音源位置与收听者头部中心位置的距离,由于该距离值在近
场声场和远场声场(1.2米临界)中对HRTF的影响存在明显差异,其在远场声场对HRTF的影
响可忽略不计,因此可根据HRTF的应用场景对测试模式进行划分。对于应用远场音效的场
合,例如影视、游戏、交响乐、音乐会等,采用由远场测试信号计算得到的远场HRTF以减小计
算量;对于应用近场音效的场合,采用由近场测试信号计算得到的近场HRTF。具体地,远场
测试信号中音源位置与收听者头部中心位置的距离为2米;近场测试信号中音源位置与收
听者头部中心位置的距离为1米。
[0043] 在测试工况下,在方位角和俯仰角的范围区间内设置多组采样点。具体地,俯仰角的采样点可以为5个,分别为‑90°、‑45°、0°、45°、90°;方位角的采样点可以为8个,分别0°、
45°、90°、135°、180°、225°、270°、315°和360°。
[0044] 本实施例通过一组头戴式耳机和TWS耳机以及音频信号处理设备130组成兼顾使用者HRTF获取与多声道立体声音频播放功能的基于音频分析的自适应立体声系统,能够根
据使用者的个性化输入和测量数据计算使用者的个性化HRTF,并根据该HRTF对音频播放输
入进行处理,从而获得符合使用者生理特征的,可提供更为真实音源位置信息的立体声音
效。
[0045] 实施例2:
[0046] 本实施例提供一种基于音频分析的自适应立体声系统,其能够根据收听者的选择进行模式设定和/或参数设定。
[0047] 具体地,模式设定可包括姿态设定、性别设定、体态设定;参数设定可包括身高设定、体重设定。
[0048] 收听者头部中心位置或耳道位置的高度对于人体的HRTF同样具有显著影响。但是,常规的头戴式或TWS耳机系统以及基于常规头戴式和/或TWS耳机系统的基于音频分析
的自适应立体声系统并不能直观地反映或获得收听者的这一参数,因此需要收听者进行操
作以完成设定。
[0049] 具体地,可通过姿态设定,例如坐姿或站姿,来调取系统数据库中关于坐姿或站姿头部中心位置的平均高度或设定高度。其还可以通过其它模式设定进行校正,例如,性别设
定中的男、女差异等。此外,参数设定除了包括收听者头部中心位置或耳道位置高度参数,
其还可以包括头部细节参数,以供系统更加精确地计算或估算收听者头部中心位置的高
度。
[0050] 本实施例提供了一种关于估算和修正、计算收听者头部中心位置高度的方式,使得所述基于音频分析的自适应立体声系统能够获取更加贴近于收听者真实情况的HRTF。
[0051] 实施例3:
[0052] 请参阅图5至图9,其中,图5为本发明实施例头戴式扬声器局部结构示意图;图6为本发明实施例弹性耳套局部结构示意图;图7为本发明实施例隔音环结构示意图;图8为本
发明实施例网结构示意图;图9为本发明实施例网/环谐振腔截面示意图。
[0053] 本实施例提供一种基于音频分析的自适应立体声系统,其能够构建符合HRTF测试过程的背景环境。其中,头戴式扬声器110包括外壳体111和弹性耳套112,弹性耳套112用于
与收听者头部接触,另一侧与外壳体111相连接;外壳体111异于弹性耳套112的一侧具有多
层网结构1111,多层所述网结构1111的网格交错设置,所述网格上设置有网格谐振腔1112
且每层网结构1111上的网格谐振腔1112具有不同尺寸特征,多层所述网结构1111之间相邻
两层网格的网格重叠面积不大于35%,使得外壳体111对外界低频噪声在一个较宽的频带范
围具有较好的抗性消声效果。
[0054] 弹性耳套112包括弹性层1121和隔音环1122,弹性层1121包裹于隔音环1122的外侧。隔音环1122的一端与外壳体111相连,隔音环1122异于外壳体111的一端被弹性层1121
包裹;头戴式扬声器110在佩戴时,收听者的头部与所述隔音环1122的距离不大于1.2毫米,
在保证佩戴舒适度的同时减少了外界噪声通过头戴式扬声器110结构部件的传递路径。
[0055] 隔音环1122是一个具有双层壳体的封闭环,所述双层壳体之间为真空层,所述双层壳体的每层壳体的厚度不大于1.2毫米。所述双层壳体包括内侧壳体11221和外侧壳体
11222,所述外侧壳体11222上布置有环谐振腔11223,所述环谐振腔11223为直径0.02毫米
至0.12毫米、深0.1毫米至0.25毫米的轴对称孔结构;所述环谐振腔11223均布于所述外侧
壳体11222,所述环谐振腔11223的开孔率为30%至80%,进一步隔绝了外界噪声,特别是低频
噪声通过弹性耳套112输入的传递路径。
[0056] 本实施例通过优化头戴式扬声器的被动降噪设计,头戴式扬声器在佩戴时与收听者头部紧密贴合,融合多种高孔隙率谐振腔、吸声材料以及传递路径阻隔布局,兼顾不同频
率低频噪声和高频噪声的消声和隔绝处理,使得头戴式扬声器在使用时与收听者头部所形
成的密闭空间内基底噪音不大于35db。
[0057] 需要注意的是,以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,在上述实施例的指导下,本领域技术人员可
以在上述实施例的基础上进行各种改进和变形,而这些改进或者变形落在本发明的保护范
围内。