基于音频的装置控制转让专利

申请号 : CN201780046695.9

文献号 : CN109891910B

文献日 : 2020-06-16

相似专利: 请登录后查看

一些公开的系统可以包括具有两个或更多麦克风的麦克风系统、接口系统和控制系统。在一些示例中，所述控制系统能够经由所述接口系统从所述麦克风系统的两个或更多麦克风接收音频数据，能够至少部分地基于所述音频数据确定手势位置，并且能够基于所述手势位置控制所述系统的一个或多个设置。

1.一种系统，包括：

包括两个或更多麦克风的麦克风系统；

接口系统；以及

控制系统，其能够：

经由所述接口系统从所述麦克风系统的两个或更多麦克风中的第一麦克风接收源于在用户上执行的手势的第一音频数据；

经由所述接口系统从所述麦克风系统的两个或更多麦克风中的第二麦克风接收源于所述手势的第二音频数据；

至少部分地基于所述第一音频数据和所述第二音频数据确定所述手势的位置，其中，所述位置对应于用户上的多个位置中的一个位置；以及基于所述手势的所述位置控制所述系统的一个或多个设置。

2.根据权利要求1所述的系统，其中，第一装置包括所述麦克风系统的所述第一麦克风，并且第二装置包括所述麦克风系统的所述第二麦克风。

3.根据权利要求2所述的系统，其中，所述控制系统能够基于所述手势的所述位置控制所述第一装置、所述第二装置或这两者的一个或多个设置。

4.根据权利要求2所述的系统，其中，所述第一装置和所述第二装置是个人声音放大产品或助听器。

5.根据权利要求2所述的系统，其中，所述控制系统的至少一部分处于所述第一装置中，处于所述第二装置中，或者处于所述第一装置和所述第二装置两者中。

6.根据权利要求5所述的系统，其中，所述控制系统的至少部分处于所述第一装置和所述第二装置两者中，并且其中，所述第一装置被配置为用于与所述第二装置进行无线或有线通信。

7.根据权利要求5所述的系统，其中，所述第一装置和所述第二装置能够交换有关所述手势的所述位置的信息。

8.根据权利要求5所述的系统，其中，所述第一装置和所述第二装置能够使对装置设置的调整同步。

9.根据权利要求1所述的系统，其中，单个装置包括所述麦克风系统的所述两个或更多麦克风以及所述控制系统。

10.根据权利要求1所述的系统，其中，所述用户上的所述多个位置包括所述用户的头部上的多个位置、所述用户的下巴上的多个位置或其任意组合。

11.根据权利要求1所述的系统，其中，所述控制系统的至少部分处于移动装置中。

12.根据权利要求1所述的系统，其中，所述控制系统还能够：确定所述手势的类型；以及

根据所述手势的所述位置和所述手势的所述类型控制所述系统的一个或多个设置。

13.根据权利要求12所述的系统，其中，所述手势的所述类型对应于一个或多个手势模式。

14.根据权利要求12所述的系统，其中，所述控制系统能够根据所述手势的音频特性确定所述手势的所述类型。

15.根据权利要求14所述的系统，其中，所述控制系统能够基于从单个麦克风接收的音频数据对所述音频特性进行分类。

16.根据权利要求14所述的系统，其中，对所述音频特性进行分类涉及判断所述手势的所述音频特性是否对应于从由轻敲、响指、猛击和摩擦手势构成的一系列手势中选择的一个或多个手势。

17.根据权利要求1所述的系统，其中，所述控制系统能够基于所述两个或更多麦克风所检测到的所述第一音频信号和所述第二音频信号之间的时间差，基于所述两个或更多麦克风所检测到的所述第一音频信号和所述第二音频信号之间的幅度差，或者基于所述时间差和所述幅度差两者来确定所述手势的所述位置。

18.根据权利要求1所述的系统，其中，所述手势的所述位置不处于所述系统的部件上，或者不接近于所述系统的部件。

19.一种系统，包括：

包括两个或更多麦克风的麦克风系统；以及

被配置为用于与所述麦克风系统通信的控制单元，所述控制单元包括用于进行下述操作的单元：从所述麦克风系统的两个或更多麦克风中的第一麦克风接收源于在用户上执行的手势的第一音频数据；

从所述麦克风系统的两个或更多麦克风中的第二麦克风接收源于所述手势的第二音频数据；

20.根据权利要求19所述的系统，其中，第一装置包括所述麦克风系统的所述第一麦克风，并且第二装置包括所述麦克风系统的所述第二麦克风，并且其中，所述控制单元包括用于基于所述手势的所述位置控制所述第一装置、所述第二装置或这两者的一个或多个设置的单元。

21.根据权利要求20所述的系统，其中，所述第一装置和所述第二装置是个人声音放大产品或助听器。

22.一种具有存储于其上的软件的非暂态介质，所述软件包括用于控制系统的一个或多个装置进行下述操作的指令：从两个或更多麦克风中的第一麦克风接收源于在用户上执行的手势的第一音频数据；

从所述两个或更多麦克风中的第二麦克风接收源于所述手势的第二音频数据；

23.根据权利要求22所述的非暂态介质，其中，第一装置包括所述两个或更多麦克风中的所述第一麦克风，并且第二装置包括所述两个或更多麦克风中的所述第二麦克风，并且其中，所述软件包括用于基于所述手势的所述位置控制所述第一装置、所述第二装置或这两者的一个或多个设置的指令。

24.根据权利要求23所述的非暂态介质，其中，所述第一装置和所述第二装置是个人声音放大产品或助听器。

25.根据权利要求22所述的非暂态介质，其中，所述软件包括用于进行下述操作的指令：确定所述手势的类型；以及

根据所述手势的所述位置和所述手势的所述类型来控制所述系统的一个或多个设置。

26.根据权利要求25所述的非暂态介质，其中，所述软件包括用于根据所述手势的音频特性来确定所述手势的所述类型的指令。

27.一种控制包括两个或更多麦克风的系统的一个或多个装置的方法，所述方法包括：从两个或更多麦克风中的第一麦克风接收源于在用户上执行的手势的第一音频数据；

从所述两个或更多麦克风中的第二麦克风接收源于所述手势的第二音频数据；

28.根据权利要求27所述的方法，其中，第一装置包括所述两个或更多麦克风中的所述第一麦克风，并且第二装置包括所述两个或更多麦克风中的所述第二麦克风，并且其中，所述方法涉及基于所述手势的所述位置控制所述第一装置、所述第二装置或这两者的一个或多个设置。

29.根据权利要求28所述的方法，其中，所述第一装置和所述第二装置是个人声音放大产品或助听器。

30.根据权利要求27所述的方法，还包括：

确定所述手势的类型；以及

根据所述手势的所述位置和所述手势的所述类型来控制所述系统的一个或多个设置。

基于音频的装置控制

[0001] 优先权要求

[0002] 本申请要求于2016年8月1日提交、并且标题为AUDIO-BASED DEVICE CONTROL的美国专利申请No.15/225619的优先权，由此通过引用的方式将该美国专利申请并入。

技术领域

[0003] 本公开涉及用于装置控制的方法和设备，并且更具体而言涉及基于音频的装置控制。

背景技术

[0004] 存在各种类型的对于用户而言不方便调整的装置，包括但不限于听力装置。这样的听力装置可以包括助听器以及个人扩音产品。很多人遭受可以利用听力装置缓解的听力损失。令人遗憾的是，与听力装置的使用相关联的社交羞耻感以及适当调节听力装置的困难都可能妨碍一些人使用听力装置。为了缓解这样的羞耻感，一种趋势是将听力装置制作得更小且不易被看到，例如完全处于耳道内的(CIC)助听器。然而，在耳道口处露出很小的面积使得与这样的装置进行交互成为挑战。一些现有的听力装置要求用户使用外部磁体与内置的磁强计进行交互，从而实现装置上的控制。用于控制听力装置以及其他装置的改进的方法和装置将是期望的。

发明内容

[0005] 本公开的系统、方法和装置均具有几个创新方面，其中的任何单一方面都不单独负责取得文中公开的预期属性。文中公开的方法可以经由硬件、固件、存储在一个或多个非暂态介质中的软件和/或它们的组合来实现。

[0006] 例如，本公开中描述的主题的一个或多个创新方面可以在可以包括一个或多个装置的系统中实现。在一些示例中，系统可以包括麦克风系统、接口系统和控制系统。在一些这样的示例中，所述麦克风系统可以包括两个或更多麦克风。所述麦克风系统的麦克风可以存在于同一装置中或者可以不存在于同一装置中，取决于特定的实施方式。

[0007] 在一些实施方式中，所述控制系统可以包括至少一个处理器，例如通用单芯片或者多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或晶体管逻辑、分立硬件部件和/或它们的组合。

[0008] 所述接口系统可以被配置为在系统的部件之间提供通信(其可以包括有线或无线通信，例如电通信、无线电通信等)。在一些这样的示例中，所述接口系统可以被配置为在控制系统和麦克风系统之间提供通信。根据一些示例，所述接口系统可以被配置为在所述系统与其他装置和/或人之间提供通信。在一些这样的示例中，所述接口系统可以包括用户接口和/或网络接口。在一些实施方式中，所述设备可以包括存储器系统。在一些示例中，所述接口系统可以包括处于控制系统和存储器系统之间的至少一个接口。

[0009] 根据一些示例，所述控制系统能够经由所述接口系统从所述麦克风系统的两个或更多麦克风接收音频数据，并且能够至少部分地基于所述音频数据确定手势位置。在一些这样的示例中，所述控制系统能够基于手势位置控制所述系统的一项或多项设置。根据一些示例，手势位置可以对应于用户的头部的多个预定位置之一。替代地或此外，手势位置可以对应于一个或多个其他预定位置，例如汽车内部的一个或多个预定位置。在一些这样的实施方式中，手势位置可以对应于方向盘上的一个或多个预定位置。在一些示例中，所述手势位置可以不处于系统的部件上，或者不接近系统的部件。

[0010] 根据一些示例，所述控制系统能够基于两个或更多麦克风所检测到的对应音频信号之间的时间差来确定手势位置。在一些示例中，控制系统能够基于两个或更多麦克风所检测到的对应音频信号之间的幅度差来确定手势位置。在一些实施方式中，控制系统能够基于两个或更多麦克风所检测到的对应音频信号之间的时间差和幅度差两者来确定手势位置。

[0011] 在一些实施方式中，第一装置可以包括所述麦克风系统的第一麦克风，并且第二装置可以包括所述麦克风系统的第二麦克风。根据一些实施方式，所述控制系统能够基于手势位置来控制第一装置、第二装置或者第一装置和第二装置两者的一个或多个设置。根据一些示例，所述控制系统的至少部分可以存在于第一装置中，存在于第二装置中或者存在于第一装置和第二装置两者中。在一些这样的实施方式中，控制系统的至少部分可以存在于第一装置和第二装置二者中。第一装置可以被配置为用于与第二装置进行无线通信和/或有线通信。第一装置和第二装置(例如)能够交换有关手势位置的信息。根据一些实施方式，第一装置和第二装置能够使对装置设置的调整同步。在一些示例中，第一装置和第二装置可以是个人声音放大产品或助听器。

[0012] 在一些实施方式中，单个装置可以包括麦克风系统的两个或更多麦克风。在一些这样的实施方式中，控制系统能够基于来自单个装置的两个或更多麦克风的音频数据确定手势位置。

[0013] 在一些示例中，控制系统能够确定手势类型并且能够根据手势位置和手势类型来控制系统的一个或多个设置。根据一些实施方式，手势类型可以与一种或多种手势模式对应。在一些示例中，控制系统能够根据手势的音频特性确定手势类型。根据一些示例，控制系统能够对音频特性进行分类。根据一些这样的示例，控制系统能够基于从单个麦克风接收的音频数据对音频特性进行分类。在一些实施方式中，对音频特性进行分类可以涉及判断手势的音频特性是否与轻敲、响指、猛击和/或摩擦手势对应。

[0014] 可以在控制包括两个或更多麦克风的系统的一个或多个装置的方法中实现本公开中描述的主题的一个或多个创新方面。所述方法可以涉及从两个或更多麦克风接收音频数据。所述方法可以涉及至少部分地基于音频数据确定手势位置以及基于手势位置控制系统的一个或多个设置。

[0015] 在一些示例中，第一装置可以包括两个或更多麦克风中的第一麦克风，并且第二装置可以包括两个或更多麦克风中的第二麦克风。所述方法可以涉及基于手势位置来控制第一装置、第二装置或者第一装置和第二装置两者的一个或多个设置。在一些实施方式中，第一装置和第二装置可以是个人声音放大产品或助听器。

[0016] 根据一些实施方式，所述方法可以涉及确定手势类型。在一些这样的实施方式中，所述方法可以涉及根据手势位置和手势类型控制系统的一个或多个设置。

[0017] 一些实施方式可以包括具有存储于其上的软件的一个或多个非暂态介质。在一些示例中，所述非暂态介质可以包括闪速存储器、硬盘驱动器和/ 或其他存储器装置。在一些这样的实施方式中，所述软件可以包括用于控制用于从两个或更多麦克风接收音频数据的至少一个设备的指令，用于至少部分地基于所述音频数据确定手势位置的指令，以及用于基于手势位置控制系统的一个或多个设置的指令。

[0018] 在一些示例中，第一装置可以包括两个或更多麦克风中的第一麦克风，并且第二装置可以包括两个或更多麦克风中的第二麦克风。在一些这样的示例中，所述软件可以包括用于基于手势位置控制第一装置、第二装置或者第一装置和第二装置两者的一个或多个设置的指令。

[0019] 在一些实施方式中，所述软件可以包括用于确定手势类型的指令以及用于根据手势位置和手势类型控制系统的一个或多个设置的指令。根据一些实施方式，所述软件可以包括用于根据手势的音频特性确定手势类型的指令。

[0020] 本公开中描述的主题的一种或多种实施方式的细节将在附图和下文的描述中得以阐释。通过所述描述、附图和权利要求，其他特征、方面和优点将变得显而易见。注意，以下附图的相对尺寸可能不是按比例绘制的。

附图说明

[0021] 图1是示出了根据一些实施方式的系统元件的示例的方框图。

[0022] 图2是概括可以由诸如图1所示的系统的系统执行的方法的一个示例的流程图。

[0023] 图3A示出了人的头部上的预定手势位置的示例。

[0024] 图3B是与图3A中所示的预定位置处的手势对应的幅度差和相位差的图示。

[0025] 图4是概括可以由诸如图1所示的系统的系统执行的方法的一个示例的流程图。

[0026] 图5A示出了替代的实施方式。

[0027] 图5B示出了另一替代的实施方式。

[0028] 图6示出了又一替代的实施方式。

具体实施方式

[0029] 下文的描述将针对某些实施方式，以用于描述本公开的创造性方面的目的。然而，本领域普通技术人员将容易地认识到，能够通过很多种不同的方式应用文中的教导。所描述的实施方式可以在能够被配置为显示图像的任何装置、设备或系统中实现，不管是运动图像(例如视频)还是静止图像(例如静态图像)，也不管是文字、图形还是图片。更具体而言，可以设想所描述的实施方式可以包含在各种电子装置中或者与之相关联，所述电子装置可以例如但不限于：移动电话、支持多媒体因特网的蜂窝电话、移动电视接收器、无线电视、智能电话、装置、个人数据助理(PDA)、无线电子邮件接收器、手提或便携式计算机、上网本电脑、笔记本电脑、智能本、平板电脑、打印机、复印机、扫描仪、传真装置、全球定位系统 (GPS)接收器/导航仪、照相机、数字媒体播放器(例如MP3播放器)、摄像录像机、游戏控制台、腕表、时钟、计算器、电视监视器、平板显示器、电子阅读装置(例如，电子阅读器)、计算机监视器、自动显示器(包括里程表和速度计显示器等)、驾驶舱控制和/或显示器、照相机视图显示器(例如车辆后视照相机的显示器)、电子照片、电子布告栏或电子标牌、投影仪、建筑结构、微波、冰箱、立体声系统、盒式录音机或播放器、DVD 播放器、CD播放器、VCR、无线电、便携式存储器芯片、洗衣机、烘干机、洗衣机/烘干机、停车计时器、封装(例如，在包括微机电系统(MEMS) 应用在内的机电系统(EMS)应用以及非EMS应用中)、审美结构(例如，一件珠宝或衣物上的图像显示器)以及各种EMS装置。文中的教导还可以用于非显示器应用中，例如但不限于电子开关装置、无线电频率滤波器、传感器、加速度计、陀螺仪、运动感测装置、磁力计、用于消费电子装置的惯性部件、消费电子产品的零件、变容二极管、液晶装置、电泳装置、驱动方案、制造过程和电子测试设备。因而，所述教导并非意在局限于唯独在附图中描绘的实施方式，而是具有很宽范数的实用性，这对于本领域普通技术人员而言是显而易见的。

[0030] 尽管存在各种各样的对于用户而言不方便调整的装置，但是一些听力装置在这一方面尤其复杂。因此，尽管本公开的教导广泛地适用于很多类型的装置，但是各种示例在本文中是在听力装置的背景下提供的，听力装置可以包括助听器和个人声音放大产品。如上文所指出的，例如，完全处于耳道内的(CIC)助听器可以减少社交羞耻感。然而，在耳道口处露出很小的面积使得与这样的装置进行交互成为挑战。一些现有的助听器要求用户使用外部磁体与内置磁力计交互，从而实现装置上的控制，而其他听力装置要求用户直接轻敲每一助听器，以调整其设置。这些类型的用户交互繁冗，经常不可靠，并且可能带来新类型的与交互本身相关联的羞耻感。

[0031] 一些已公开的实施方式可以包括具有两个或更多麦克风的麦克风系统、接口系统和控制系统。在一些示例中，控制系统能够经由接口系统从麦克风系统的两个或更多麦克风接收音频数据，能够至少部分地基于所述音频数据来确定手势位置，并且能够基于手势位置控制设备或系统的一个或多个设置。例如，手势可以是轻敲、响指、猛击和/或摩擦手势。在一些示例中，控制系统能够例如根据手势的音频特性来确定手势模式或手势类型，并且能够根据手势位置以及手势模式和/或手势类型来控制设备或系统的一个或多个设置。例如，不同的手势类型、轻敲模式、轻敲位置等可以与对听力装置设置的特定调整相对应。
一些这样的实施方式提供了根据用户的头部的预定轻敲位置上的轻敲来控制听力装置的方法。来自两个听力装置的麦克风的音频数据可以用于检测头部轻敲位置以及头部轻敲位置上的轻敲模式。

[0032] 可以实现本公开中描述的主题的具体实施方式以实现下述潜在优点中的一者或多者。一些听力装置实施方式可以提供更加方便的与诸如完全处于耳道内的(CIC)助听器之类的不显眼的听力装置交互的方法。一些所公开的与听力装置交互的方法比例如在助听器上轻敲更谨慎，并且能够有助于减少与使用这样的装置相关联的羞耻感。使这样的装置的使用更加方便并且较少尴尬可以鼓励更多的人使用听力装置并缓解其听力损失。缓解听力损失又能够减少社会隔离，并且可以加强用户的个人安全。

[0033] 然而，本公开的教导广泛适用于很多类型的装置，包括诸如头戴显示器(HMD)、智能衣物、智能手表等可穿戴装置。下文描述HMD实施方式的一些示例。

[0034] 替代的实施方式可以部署到汽车中，以例如向驾驶员或乘客提供手势控制。例如，一些实施方式能够确定汽车内的手势的位置和/或类型，例如方向盘或仪表板上的轻敲的位置、响指、猛击和/或摩擦手势的位置。一些这样的实施方式可以允许由驾驶员或乘客根据这样的手势中的一个或多个来控制汽车的一个或多个特征。在一些这样的示例中，驾驶员或乘客可以与一个或多个压力传感器交互，以控制汽车的一个或多个特征。

[0035] 图1是示出了根据一些实施方式的系统元件的示例的方框图。仅通过示例的方式提供图1的元件。一些实施方式可以包括更多或更少的元件。在该示例中，系统100包括麦克风系统105、控制系统110和接口系统115。

[0036] 在一些示例中，系统100可以是单个装置。然而，在替代的实施方式中，系统100可以包括两个或更多装置。在一些这样的示例中，系统100 可以包括第一装置和第二装置。在一些示例中，第一装置和/或第二装置可以是个人声音放大产品或助听器。在一些实施方式中，系统100可以包括一个或多个可穿戴装置，例如HMD。一些这样的HMD可以被配置为用于向穿戴者提供沉浸式虚拟现实体验。根据一些实施方式，控制系统110的至少一部分可以在第一装置中，可以在第二装置中，或者可以在第一装置和第二装置二者中。在一些这样的实施方式中，控制系统110的至少部分在第一装置和第二装置二者中，并且第一装置被配置为用于与第二装置进行无线或有线通信。在一些示例中，控制系统110的至少部分可以在移动装置中。

[0037] 在一些示例中，麦克风系统105可以包括两个或更多麦克风。根据一些实施方式，第一装置可以包括麦克风系统中的第一麦克风，并且第二装置可以包括麦克风系统中的第二麦克风。然而，在一些实施方式中，单个装置可以包括麦克风系统中的两个或更多麦克风。文中公开了各种示例。

[0038] 接口系统115可以包括一个或多个网络接口、一个或多个用户接口和/ 或一个或多个外部装置接口(例如一个或多个通用串行总线(USB)接口)。在该示例中，接口系统115包括处于控制系统110和麦克风系统105之间的一个或多个接口。在一些示例中，接口系统115可以包括处于控制系统 110和存储器系统之间的一个或多个接口。然而，在一些实施方式中，控制系统110可以包括存储器系统。

[0039] 例如，控制系统110可以包括通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑装置、分立门或晶体管逻辑和/或分立硬件部件。在一些实施方式中，控制系统110能够至少部分地执行文中公开的方法。

[0040] 图2是概括可以由诸如图1所示的系统的系统执行的方法的一个示例的流程图。相应地，下文参考图1描述方法200的方框。与文中描述的其他方法一样，方法200中的方框未必是按照所指示的顺序执行的。此外，这样的方法可以包括比所示和/或所描述的更多或者更少的方框。

[0041] 在该示例中，方框205涉及从麦克风系统的两个或更多麦克风接收音频数据。在一些实施方式中，方框205可以涉及控制系统110经由接口系统从麦克风系统105的两个或更多麦克风接收音频数据。

[0042] 这里，方框210涉及至少部分地基于音频数据来确定手势位置。根据一些实施方式，控制系统110能够至少部分地基于音频数据来确定手势位置。在一些实施方式中，手势可以是轻敲、响指、猛击和/或摩擦手势。在一些示例中，手势位置可以对应于用户的头部的多个预定位置之一。

[0043] 在图2所示的示例中，方框215涉及基于手势位置控制系统的一个或多个设置。在一些实施方式中，控制系统110能够基于手势位置控制系统 100的一个或多个设置。如上文所指出的，在一些实施方式中，第一装置可以包括麦克风系统的第一麦克风，并且第二装置可以包括麦克风系统的第二麦克风。根据一些这样的实施方式，控制系统能够至少部分地基于手势位置来控制第一装置、第二装置或者第一装置和第二装置两者的一个或多个设置。

[0044] 在一些这样的示例中，控制系统的至少部分可以存在于第一装置中、存在于第二装置中或者存在于第一装置和第二装置两者中。根据一些这样的示例，控制系统的至少部分存在于第一装置和第二装置两者中。第一装置可以被配置为用于与第二装置进行无线或有线通信。在一些示例中，第一装置和第二装置能够交换有关手势位置确定的信息。根据一些这样的示例，第一装置和第二装置能够使对装置设置的调整同步。

[0045] 然而，在一些实施方式中，单个装置可以包括麦克风系统的两个或更多麦克风。控制系统能够基于来自单个装置的两个或更多麦克风的音频数据来确定手势位置。

[0046] 图3A示出了人的头部上的预定手势位置的示例。在该示例中，有五个预定手势位置，在图3A中被标记为1到5。然而，其他实施方式可以涉及更多或更少的手势位置。此外，其他实施方式可以涉及更多的或者处于人的头部以外的位置上的手势位置。文中公开了各种示例。

[0047] 在该示例中，麦克风305a和305b被示为从手势位置2处的手势接收声波。麦克风305a和305b可以是文中公开的麦克风系统105的麦克风。在一些实施方式中，手势可以包括一次或多次轻敲、拍打、猛击、摩擦、响指等。在该示例中，没有手势位置与麦克风系统105或者控制系统110 中的部件对应。在该示例中，控制系统110被配置为例如经由文中公开的接口系统115与麦克风305a和305b通信，并且被配置为从麦克风305a和 305b接收与手势对应的音频数据。取决于特定的实施方式，控制系统110 可以被配置为经由有线或无线接口与麦克风305a和305b通信。

[0048] 在一些示例中，麦克风305a可以存在于第一装置中，并且麦克风305b 可以存在于第二装置中。在一些这样的示例中，第一装置和第二装置可以是个人声音放大产品或助听器。根据一些替代的示例，单个装置可以包括麦克风305a和麦克风305b。下文描述了一些示例。

[0049] 在该实施方式中，控制系统110至少部分地存在于与麦克风305a和 305b分开的装置中。在一些这样的实施方式中，控制系统110可以至少部分地存在于智能电话、手表和/或另一类型的装置(例如另一类型的可穿戴装置)中。然而，在一些实施方式中，控制系统110可以至少部分地存在于包括麦克风305a、麦克风305b或者麦克风305a和麦克风305b两者的装置中。

[0050] 在该示例中，控制系统110能够至少部分地基于从麦克风305a和305b 接收的音频数据确定手势位置。在一些这样的示例中，控制系统110能够基于麦克风305a和305b所检测到的对应音频信号之间的时间差确定手势位置。替代地或此外，控制系统110能够基于麦克风305a和305b所检测到的对应音频信号之间的幅度差确定手势位置。

[0051] 图3B是与图3A所示的预定位置处的手势对应的幅度差和相位差的图示。在图3B 的 350中，水平轴指示麦克风305a和305b所检测到的对应音频信号之间的幅度差δA，并且竖直轴指示麦克风305a和305b所检测到的对应音频信号之间的相位差δθ。相位差δθ对应于麦克风305a和305b所检测到的对应音频信号之间的抵达时间差。用于手势位置1-5的符号形状与图 3A中所示的那些相对应。在该示例中，图3B 的 350上指示的符号实例中的每者对应于麦克风305a和305b所检测到的处于对应手势位置处的各个轻敲的声音。在图3B 的 350中可以看出，用于手势位置中的每者的符号实例聚集在由虚线370分隔开的区域360a-
360e中。

[0052] 相应地，在该示例中，控制系统110可以根据与手势对应的音频信号被映射到区域360a-360e中的哪个区域而确定手势位置。例如，如果与手势对应的音频信号具有幅度差δA和相位差δθ，那么音频信号将被映射到区域360c，并且控制系统110将确定手势是在手势位置3处做出的。

[0053] 然而，在替代的示例中，控制系统110可以仅根据幅度差或者仅根据相位差或时间差来确定手势位置。从图3B 的 350可以观察到，可以容易地仅根据幅度差或者仅根据相位差或时间差来确定位置1、3、5中任一个处的手势。

[0054] 在一些示例中，控制系统110能够至少部分地基于手势位置控制系统的一个或多个设置。例如，控制系统110能够至少部分地基于手势位置调整包括麦克风305a和/或麦克风305b的装置的一个或多个设置。

[0055] 根据一些这样的示例，控制系统110能够至少部分地基于手势位置调整诸如个人声音放大产品或助听器之类的听力装置的一个或多个设置。例如，手势位置可以与设置类型(例如音量设置)和/或将调整其设置的听力装置相对应。在一个这样的示例中，位置1中的第一手势可以指示用户的右耳的听力装置的设置的变化，而位置5中的第一手势可以指示用户的左耳的听力装置的设置的变化。一个或多个后续手势可以指示要改变的设置的类型以及如何改变所述设置。

[0056] 在一些实施方式中，控制系统110能够至少部分地基于手势位置调整可穿戴装置的一个或多个设置，所述可穿戴装置例如是用于提供虚拟现实体验的HMD。例如，手势位置可以对应于设置类型，例如显示设置类型或音频设置类型。在一个这样的示例中，位置1中的第一手势可以指示HMD 的位于用户的右耳附近的扬声器的设置的变化，而位置5中的第一手势可以指示HMD的位于用户的左耳附近的扬声器的设置的变化。位置3中的第一手势可以指示HMD的显示设置的变化。一个或多个后续手势可以指示要改变的设置的类型以及如何改变所述设置。

[0057] 根据一些基于汽车的实施方式，汽车的预定位置中(例如，仪表板上、方向盘上、座椅或者扶手上等)的第一手势可以指示特定汽车设置的变化，例如音频设置、显示设置、巡航控制设置、自动驾驶设置等的变化。一个或多个后续手势可以指示如何改变所述设置。

[0058] 在一些示例中，控制系统110能够确定手势类型以及根据手势位置、手势类型或手势位置和手势类型两者来控制系统的一个或多个设置。根据一些实施方式，手势类型可以是轻敲、响指、猛击或摩擦手势(例如拇指与另一指一起摩擦的声音、手指摩擦面部的声音等)。在一些示例中，手势类型可以与一个或多个手势模式相对应，例如轻敲模式、响指模式、猛击模式等。

[0059] 图4是概括可以由诸如图1所示的系统的系统执行的方法的一个示例的流程图。相应地，下文参考图1描述方法400的各方框。与文中公开的其他方法一样，方法400的方框未必是按照所指示的顺序执行的。此外，这样的方法可以包括比所示和/或所描述的更多或者更少的方框。

[0060] 在该示例中，方框405涉及从麦克风系统的两个或更多麦克风接收音频数据。在一些实施方式中，方框405可以涉及控制系统110经由接口系统从麦克风系统105的两个或更多麦克风接收音频数据。这里，方框410 涉及至少部分地基于音频数据确定手势位置。根据一些实施方式，控制系统110可以在方框410中确定手势位置。在一些实施方式中，手势可以是轻敲、响指、猛击和/或摩擦手势。在一些示例中，手势位置可以对应于用户的头部的多个预定位置之一。在其他示例中，手势位置可以对应于汽车的多个预定位置之一。

[0061] 在该实施方式中，方框415涉及至少部分地基于音频数据确定手势类型。根据一些这样的示例，在方框415中，控制系统110可以根据手势的音频特性确定手势类型。音频特性可以包括一个或多个幅度特性、频率特性、相位特性、节奏特性等。例如，轻敲用户的身体的有肉部位的声音可以具有相对较低的幅度，并且与响指相比可以包括更低频率的声音。与响指或轻敲相比，猛击或摩擦手势的声音通常将具有相对较长的持续时间。由于一些音频特性在时域内可能会更加明显，而其他音频特性在频域内可能更加明显，所以一些实施方式可以涉及将音频数据从时域转换至频域。在一些示例中，控制系统110能够对手势的音频特性进行分类并且能够基于从单个麦克风接收的音频数据来确定手势类型。

[0062] 这里，方框420涉及基于手势位置和手势类型控制系统的一个或多个设置。在一些这样的示例中，在方框420中，控制系统110可以基于手势位置和手势类型调整诸如个人声音放大产品或助听器之类的听力装置的一个或多个设置。例如，预定手势位置可以对应于设置类型，并且手势模式可以对应于特定设置调整。例如，一个预定手势位置可以对应于音量设置。预定手势位置中的单次轻敲(或者其他手势)可以指示两个听力装置的音量设置均应当增加，而同一预定手势位置中的两次轻敲可以指示两个听力装置的音量设置都应当降低。其他预定手势位置可以对应于其他听力装置设置，例如波束转向，以允许用户更清楚地听到来自特定方向的声音。预定手势位置中的一个或多个手势可以允许用户选择感兴趣的声音方向。

[0063] 图5A示出了替代的实施方式。在该示例中，系统100包括能够相互无线通信的听力装置505a和505b。相应地，其为包括无线接口的接口系统 115的示例。在该实施方式中，控制系统110的一部分存在于听力装置505a 中，并且控制系统110的另一部分存在于听力装置505b中。根据该示例，听力装置505a和505b均包括一个或多个麦克风以及一个或多个扬声器。

[0064] 在该示例中，在用户的头部的预定位置上示出了三个手势位置510。在该示例中，手势位置510处于用户的下颌的预定位置上。在该实施方式中，控制系统110能够至少部分地基于来自听力装置505a和505b的麦克风的音频数据来确定手势位置。这里，控制系统110能够至少部分地基于手势位置来控制听力装置505a和505b的一个或多个设置。

[0065] 在一些示例中，控制系统110能够确定手势类型以及至少部分地基于手势类型来控制听力装置505a和505b的一个或多个设置。根据一些实施方式，听力装置505a和505b能够交换有关手势位置和/或手势类型的信息。在一些示例中，听力装置505a和505b能够使对诸如音量设置、方向性设置和/或其他设置之类的装置设置的调整同步。

[0066] 图5B示出了另一替代的实施方式。在该示例中，系统100包括听力装置505a和505b以及移动装置520，它们全都能够相互无线通信。因此，这是包括无线接口的接口系统115的另一示例。在该实施方式中，控制系统 110的一部分存在于听力装置505a中，控制系统110的一部分存在于听力装置505b中，并且控制系统110的另一部分存在于移动装置520中。如在参考图5A描述的示例中，听力装置505a和505b均包括一个或多个麦克风以及一个或多个扬声器。

[0067] 根据一些实施方式，控制系统110能够确定手势位置和/或手势类型以及至少部分地基于手势位置和/或手势类型来控制听力装置505a和505b的一个或多个设置。在图5B所示的示例中，手势515a和515b对应于用户的下巴的相对侧上的猛击，其可以是手的猛击或手指的猛击。在该示例中，控制系统110能够根据手势515a和515b引起的声音来确定手势位置和手势类型，所述声音是由听力装置505a和505b中的麦克风检测到的。根据一些这样的实施方式，控制系统110的存在于移动装置中的部分能够确定手势位置和/或手势类型并且能够至少部分地基于手势位置和/或手势类型来控制听力装置505a和505b的一个或多个设置。

[0068] 图6示出了另一替代的实施方式。在该示例中，系统100包括装置605a 和605b以及控制系统610，它们全部被配置为经由耳机620中的线路相互通信。在该示例中，装置605a和605b均包括一个或多个麦克风以及一个或多个扬声器。然而，取决于具体实施方式，装置
605a和605b可以是或者可以不是听力装置。

[0069] 在该示例中，控制系统610是图1所示的控制系统110的实例。根据一些实施方式，控制系统610能够确定手势位置和/或手势类型以及至少部分地基于手势位置和/或手势类型控制听力装置605a和605b的一个或多个设置。这样的示例包括其中单个装置包括麦克风系统的两个或更多麦克风并且其中控制系统能够基于来自单个装置的两个或更多麦克风的音频数据确定手势位置的实施方式。

[0070] 在图6所示的示例中，手势515c是响指。在该示例中，控制系统610 能够根据手势515c引起的声音确定手势位置和手势类型，所述声音是由装置605a和605b中的麦克风检测到的。例如响指可以是根据其幅度、频率成分和/或短持续时间检测到的。根据一些替代的实施方式，控制系统610 的一部分可以存在于装置605a中，存在于装置605b中或者存在于另一装置中，例如存在于移动装置中。

[0071] 如文中所使用的，提及项目列表的“至少其中之一”的短语是指这些项目的任何组合，包括单个成员项。作为示例，“a、b或c的至少其中之一”意在包含a、b、c、a-b、a-c、b-c和a-b-c。

[0072] 结合本文公开的实施方式描述的各种例示性逻辑、逻辑块、模块、电路和算法步骤可以实现为电子硬件、计算机软件或两者的组合。已经总体上从功能方面对硬件和软件的可互换性做出了描述，并且在上文所述的各种例示性部件、块、模块、电路和步骤中示出了该可互换性。这样的功能被实现为硬件还是软件取决于特定应用以及施加于整个系统的设计约束。

[0073] 用于实现结合文中公开的方面描述的各种示例性逻辑、逻辑块、模块和电路的硬件和数据处理设备可以是借助于被设计为执行文中描述的功能的通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路 (ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或晶体管逻辑、分立硬件部件或其任何组合来实现或执行的。通用处理器可以是微处理器，或者任何常规处理器、控制器、微控制器或状态机。处理器也可以被实现为计算装置的组合，例如，DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或者任何其他这种配置。在一些实施方式中，可以通过专用于给定功能的电路执行特定步骤和方法。

[0074] 在一个或多个方面中，可以通过包括本说明书中公开的结构及其结构等价物在内的硬件、数字电子电路、计算机软件、固件或其任意组合来实现所描述的功能。本说明书中描述的主题的实施方式也可以被实现为编码在计算机存储介质上以由数据处理设备执行或者控制其运行的一个或多个计算机程序，即，计算机程序指令的一个或多个模块。

[0075] 如果被实现成软件，功能可以作为一个或多个指令或代码被存储在计算机可读介质上或被传送。本文公开的方法或算法的步骤可以实现在处理器可执行软件模块中，其可以存在于计算机可读介质中。计算机可读介质包括计算机存储介质和通信介质，通信介质包括能够使计算机程序从一个地方传输到另一个地方的任何介质。存储介质可以是可以由计算机访问的任何可用介质。例如但并非限制，这样的计算机可读介质可以包括RAM、 ROM、EEPROM、CD-ROM或其他光盘存储器、磁盘存储器或其他磁存储装置、或可以用于以指令或数据结构的形式存储期望的程序代码并且可以由计算机访问的任何其他介质。而且，任何连接都可以被适当地称为计算机可读介质。如本文所使用的，磁盘和光盘包括紧致光盘(CD)、激光盘、光学光盘、数字多用盘(DVD)、软盘和蓝光光盘，其中磁盘通常通过磁性方式复制数据，而光盘利用激光通过光学方式复制数据。以上的组合也可以包括在计算机可读介质的范围内。此外，方法或算法的操作可以作为代码和指令之一或任意组合或集合而存在于可以被并入计算机程序产品中的机器可读介质和处理器可读介质上。

[0076] 对本公开中描述的实施方式的各种修改对于本领域技术人员而言是显而易见的，文中定义的一般性原理可以应用于其他实施方式，而不脱离本公开的精神或范围。因而，权利要求并非意在局限于文中所示的实施方式，而是为其赋予与本公开、文中公开的原理和新颖特征一致的最宽范围。此外，本领域普通技术人员将容易地认识到，有时使用术语“上”、“下”来方便描述附图，并且该术语指示对应于适当取向的页面上的附图的取向的相对位置，并且可能并不反映例如IMOD显示元件在实现时的适当取向。

[0077] 本说明书中在单独的实施方式的语境下描述的某些特征也可以在单一实施方式中以组合方式实现。相反，在单一实施方式的语境下描述的各种特征也可以在多种实施方式中单独地或者以任何适当的子组合的方式实现。此外，尽管上文可以将特征描述为以某些组合的方式发挥作用，甚至最初像这样主张权利，但是在某些情况下能够从所主张的组合中去除该组合中的一个或多个特征，而且所主张的组合可以指向子组合或者子组合的变型。

[0078] 类似地，尽管在附图中将操作描绘为具有特定顺序，但是本领域普通技术人员将认识到未必一定要按照所示的特定顺序或者一定要顺次执行这样的操作，或者要执行所有的所示操作，以获得预期的结果。此外，附图可能以流程图的形式示意性地描绘了一个或多个示例性过程。然而，可以在示意性地例示的示例性过程中可以并入其他未描绘的操作。例如，可以在所示出的操作中任一个之前、之后、同时或者在其之间执行一个或多个额外操作。在某些环境中，多任务及并行处理可以是有利的。此外，不应将上述实施方式中的各种系统部件的分隔理解为在所有实施方式中都要求这样的分隔，并且应当理解，一般可以通过单个软件产品将所描述的程序部件和系统集成到一起，或者可以将它们封装成多个软件产品。此外，其他实施方式也处于所附权利要求的范围内。在一些情况下，可以按照不同的顺序执行权利要求中列举的动作，并且该动作仍然能够获得预期的结果。

基于音频的装置控制转让专利

申请号 : CN201780046695.9

文献号 : CN109891910B

文献日 : 2020-06-16

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : F·韩 , J·W·李 , 吴新宙 , R·A·A·阿塔尔

申请人 : 高通股份有限公司

摘要 :

权利要求 :

说明书 :