包括助听仪器的助听系统以及用于操作助听仪器的方法转让专利

申请号 : CN202011271442.1

文献号 : CN112822617B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : M.瑟曼C.威尔逊E.费舍尔

申请人 : 西万拓私人有限公司

摘要 :

提供了一种包括助听仪器(4)的助听系统(2),所述助听仪器被设计为支持听力障碍用户的听力。此外,提供了一种用于操作助听仪器的方法。所述方法包括从助听仪器(4)的环境中捕获声音信号,处理捕获的声音信号以至少部分地补偿用户的听力障碍,并将经处理的声音信号输出给用户。分析所述捕获的声音信号以识别语音间隔,其中所述捕获的声音信号包含语音。在识别的语音间隔期间,确定所述捕获的声音信号的幅度和/或音高的至少一个时间导数(D1,D2)。如果至少一个导数(D1,D2)满足预定标准,则暂时地增大所述经处理的声音信号的幅度。

权利要求 :

1.一种用于操作助听仪器(4)的方法,所述助听仪器被设计成支持听力障碍用户的听力,所述方法包括: ‑从所述助听仪器(4)的环境中捕获声音信号;

‑处理捕获的声音信号以至少部分地补偿用户的听力障碍;

‑向所述用户输出经处理的声音信号;

所述方法进一步包括:

‑分析所述捕获的声音信号以识别语音间隔,其中,所述捕获的声音信号包含语音;

‑在识别的语音间隔期间,确定所述捕获的声音信号的幅度和/或音高(P)的至少一个时间导数(D1,D2);以及‑如果至少一个导数(D1,D2)满足用于识别语音重音的预定标准,暂时地增大所述经处理的声音信号的幅度。

2.根据权利要求1所述的方法,

其中,如果所述至少一个导数(D1,D2)满足所述预定标准,在预定时间间隔(TE)内增大所述经处理的声音信号的幅度。

3.根据权利要求2所述的方法,

其中,所述预定时间间隔(TE)在5至15毫秒之间。

4.根据权利要求2或3所述的方法,

其中,在所述预定时间间隔(TE)内,连续增大和/或连续减小所述经处理的声音信号的幅度。

5.根据权利要求1‑3之一所述的方法,其中,根据所述预定标准,如果所述至少一个导数(D1)超过预定阈值(T1)或者在预定范围内,暂时地增大所述经处理的声音信号的幅度。

6.根据权利要求1‑3之一所述的方法,其中,所述至少一个导数是所述捕获的声音信号的幅度和/或音高(P)的时间平均导数。

7.根据权利要求1‑3之一所述的方法,其中,所述至少一个导数(D1,D2)包括一阶导数(D1)。

8.根据权利要求7所述的方法,

其中,所述至少一个导数(D1,D2)进一步包括至少一个高阶导数(D2)。

9.根据权利要求8所述的方法,

‑其中,根据所述预定标准,如果所述一阶导数(D1)超过预定阈值(T1)或者在预定范围内,暂时地增大所述经处理的声音信号的幅度;以及‑其中,所述阈值(T1)或所述范围依赖于所述高阶导数(D2)而变化。

10.根据权利要求1‑3之一所述的方法,其中,将所述经处理的声音信号的幅度暂时地增大依赖于所述至少一个导数而变化的量。

11.根据权利要求1‑3之一所述的方法,其中,将所述识别的语音间隔区分为其中用户说话的自身话音间隔和其中至少一个不同说话者说话的外来话音间隔;以及其中,仅在所述外来话音间隔期间执行暂时地增大所述经处理的声音信号的幅度的步骤。

12.一种具有助听仪器(4)的助听系统(2),所述助听仪器(4)被设计成支持听力障碍用户的听力,所述助听仪器(4)包括:‑输入换能器(6),布置成从所述助听仪器(4)的环境中捕获声音信号;

‑信号处理器(12),布置成处理捕获的声音信号以至少部分地补偿用户的听力障碍;和‑输出换能器(8),布置成向所述用户发射经处理的声音信号,所述助听系统(2)还包括:

‑话音识别单元(14),配置成分析所述捕获的声音信号以识别语音间隔,其中,所述捕获的声音信号包含语音;

‑推导单元(24),配置成在识别的语音间隔期间确定所述捕获的声音信号的幅度和/或音高(P)的至少一个时间导数(D1,D2);以及‑语音增强单元(26),配置成如果至少一个导数(D1,D2)满足增强语音重音的预定标准,暂时地增大所述经处理的声音信号的幅度。

13.根据权利要求12所述的助听系统(2),其中,所述语音增强单元(26)配置成:如果所述至少一个导数(D1,D2)满足所述预定标准,在预定时间间隔(TE)内增大所述经处理的声音信号的幅度。

14.根据权利要求13所述的助听系统(2),其中,所述预定时间间隔(TE)在5至15毫秒之间。

15.根据权利要求13或14所述的助听系统(2),其中,所述语音增强单元(26)配置成在所述预定时间间隔(TE)内连续增大和/或连续减小所述经处理的声音信号的幅度。

16.根据权利要求12‑14之一所述的助听系统(2),其中,所述语音增强单元(26)配置成:根据所述预定标准,如果所述至少一个导数(D1)超过预定阈值(T1)或者在预定范围内,暂时地增大所述经处理的声音信号的幅度。

17.根据权利要求12‑14之一所述的助听系统(2),其中,所述至少一个导数是幅度和/或音高(P)的时间平均导数。

18.根据权利要求12‑14之一所述的助听系统(2),其中,所述至少一个导数(D1,D2)包括一阶导数(D1)。

19.根据权利要求18所述的助听系统(2),其中,所述至少一个导数(D1,D2)进一步包括至少一个高阶导数(D2)。

20.根据权利要求19所述的助听系统(2),其中,所述语音增强单元(26)配置成:‑根据所述预定标准,如果所述一阶导数(D1)超过预定阈值(T1)或者在预定范围内,暂时地增大所述经处理的声音信号的幅度;以及‑依赖于所述高阶导数(D2)改变所述阈值(T1)或范围。

21.根据权利要求12‑14之一所述的助听系统(2),其中,所述语音增强单元(26)配置成将所述经处理的声音信号的幅度暂时地增大依赖于所述至少一个导数(D1,D2)而变化的量。

22.根据权利要求12‑14之一所述的助听系统(2),‑其中,所述话音识别单元(14)配置成将所述识别的语音间隔区分为其中用户说话的自身话音间隔和其中至少一个不同说话者说话的外来话音间隔;以及‑其中,所述语音增强单元(26)仅在所述外来话音间隔期间暂时地增大所述经处理的声音信号的幅度。

说明书 :

包括助听仪器的助听系统以及用于操作助听仪器的方法

技术领域

[0001] 本发明涉及一种用于操作助听仪器的方法。本发明还涉及一种包括助听仪器的助听系统。

背景技术

[0002] 通常,助听仪器是被设计用来支持佩戴人的听力的电子设备(此佩戴人称为助听器的用户或佩戴者)。具体地,本发明涉及专门配置为至少部分地补偿听力障碍用户的听力障碍的助听仪器。
[0003] 助听仪器经常被设计为佩戴在用户的耳朵内或耳朵处,例如,作为耳后(BTE)或耳内(ITE)设备。此种设备称为“助听器”。关于其内部结构,助听仪器通常包括(声电)输入换能器、信号处理器和输出换能器。在助听仪器的操作期间,输入换能器从助听仪器的环境捕获声音信号,并将其转换成输入音频信号(即传输声音信息的电信号)。在信号处理器中,处理输入音频信号,特别是根据频率将其放大,以补偿用户的听力障碍。信号处理器将处理后的信号(也称为输出音频信号)输出到输出换能器。最常见的,输出换能器是电声换能器(也称为“接收器”),其将输出音频信号转换成处理后的空气承载的声音,其被发射到用户耳道中。可选地,输出换能器可以是机电换能器,其将输出音频信号转换成结构承载的声音(振动),其被发送到例如用户的颅骨。此外,除了传统的助听器之外,还有诸如人工耳蜗的植入式助听仪器,以及输出换能器直接刺激用户听觉神经的助听仪器。
[0004] 术语“助听系统”表示提供助听仪器操作所需功能的一个设备或者设备和/或其他结构的组件。助听系统可以由单个独立的助听仪器组成。作为替换,助听系统可以包括助听仪器和至少一个另外的电子设备,例如,另外的电子设备是用于用户另一只耳朵的另一助听仪器、远程控制器和用于助听仪器的编程工具之一。此外,现代助听系统通常包括助听仪器和用于控制和/或编程助听仪器的软件应用,该软件应用被安装在或能被安装在计算机或诸如移动电话(智能电话)的移动通信设备上。在后一种情形中,典型地,计算机或移动通信设备不是助听系统的一部分。具体地,常见的是,计算机或移动通信设备将独立于助听系统而被制造和销售。
[0005] 听力障碍者的典型问题是不良的语音感知,这通常是由内耳的病理引起的,从而导致听力障碍者个体减少的动态范围。这意味着有听力障碍的听者(尤其是在嘈杂的环境中)听不到柔和的声音,从而需要响亮的声音来满足这些听者的响度水平。
[0006] 通常,助听仪器通过放大输入信号来补偿听力障碍。由此,经常使用压缩来补偿听力障碍用户减少的动态范围,即输入信号的幅度随输入信号水平的函数而增大。然而,由于信号处理的实时限制,助听仪器中常用的压缩实现方式经常导致各种技术问题和失真。此外,在许多情形下,压缩不足以将语音感知增强到满意的程度。
[0007] 根据EP1101390B1,已知一种包括特定语音增强算法的助听仪器。其中,增大了音频流中的语音片段的水平。通过分析信号水平的包络来识别语音片段。具体地,检测突然的水平峰值(突发),作为语音的指示。

发明内容

[0008] 本发明的目的是提供一种用于操作佩戴在用户耳朵内或耳朵处的助听仪器的方法,此方法为佩戴所述助听仪器的用户提供改善的语音感知。
[0009] 本发明的另一目的是提供一种包括佩戴在用户耳朵内或耳朵处的助听仪器的助听系统,所述系统为佩戴所述助听仪器的用户提供改善的语音感知。
[0010] 根据本发明的第一方面,如权利要求1所规定的,提供了一种用于操作助听仪器的方法,所述助听仪器被设计成支持听力障碍用户的听力。所述方法包括例如通过助听仪器的输入换能器从助听仪器的环境中捕获声音信号。例如,通过助听仪器的信号处理器处理所述捕获的声音信号,以至少部分地补偿用户的听力障碍,由此产生经处理的声音信号。例如通过助听仪器的输出换能器向所述用户输出所述经处理的声音信号。在优选实施例中,在输出至用户之前,所述捕获的声音信号和所述经处理的声音信号是音频信号,即传输声音信息的电信号。
[0011] 助听仪器可以是上述规定的任何类型。优选地,其被设计成佩戴在用户的耳朵内或耳朵处,例如,作为BTE助听器(具有内部或外部接收器)或者作为ITE助听器。可选地,助听仪器可以设计为可植入的助听仪器。所述经处理的声音信号可以输出为空气承载的声音、结构承载的声音或直接刺激用户听觉神经的信号。
[0012] 所述方法还包括
[0013] ‑语音识别步骤,其中分析所述捕获的声音信号以识别语音间隔,其中,所述捕获的声音信号包含语音;
[0014] ‑推导步骤,其中在识别的语音间隔期间,确定所述捕获的声音信号的幅度和/或音高(即,基频)的至少一个导数;此处以及后文中,除非另有说明,术语“导数”总是表示此术语数学意义上的“时间导数”;以及
[0015] ‑语音增强步骤,其中如果所述至少一个导数满足预定标准,则暂时地增大所述经处理的声音信号的幅度(即,暂时地应用附加增益)。
[0016] 本发明是基于这样的发现,语音声音通常涉及短持续时间的、有节奏(即,或多或少周期性)的系列变化,特别是峰值,在下文中将被称为“(语音)重音”。具体地,此种语音重音可以表现为语音声音的幅度和/或音高的变化,并且已经证明其对于语音感知是必要的。本发明旨在识别和增强语音重音,以提供更好的语音感知。发现通过分析捕获的声音信号的幅度和/或音高的导数,可以非常有效地识别语音重音。
[0017] 在语音增强步骤中,将至少一个导数与预定标准进行比较,并且如果所述至少一个导数满足标准则识别语音重音。通过暂时地应用增益,由此暂时地增大经处理的声音信号的幅度,识别的语音重音被增强并由此更容易被用户感知到。
[0018] 优选地,在语音增强步骤中,经处理的声音信号的幅度在预定时间间隔内增大(这意味着附加增益以及幅度的增大截止到增强间隔的末尾)。在合适的实施例中,所述时间间隔(在下文中表示为“增强间隔”)设置为5到15毫秒之间的值,具体是约为10毫秒。
[0019] 在本发明的实施例中,如果至少一个导数满足预定标准,经处理的声音信号的幅度可以骤然(阶梯式)地增大,并且在增强间隔结束时骤然(阶梯式)地减小。然而,优选地,在所述预定时间间隔内,经处理的声音信号的幅度可以连续地增大和/或连续地减小,以避免经处理的声音信号中突然水平的变化。具体地,所述经处理的声音信号的幅度根据时间的平滑函数而增大和/或减小。
[0020] 在本发明的另一实施例中,至少一个导数包括一(阶)导数。这里,术语“一阶导数”或“第一阶导数”根据它们的数学意义使用,其表示指示所述捕获的声音信号的幅度或音高随时间的改变量。优选地,为了降低错误检测语音重音的风险,至少一个导数是捕获的声音信号的幅度和/或音高的时间平均导数。既可以通过求导后求平均值也可以通过求平均后求导来确定所述时间平均导数。在前一种情形下,通过对幅度或音高的非平均的导数求平均值来推导所述时间平均导数。在后一种情形下,从幅度或音高的时间平均值来推导所述导数。优选地,此种求平均值的时间常数(即,动态平均的时间窗口)设置为5至25毫秒之间的值,具体是10至20毫秒。
[0021] 在本发明的合适实施例中,预定标准涉及阈值。在此情形下,如果至少一个导数超过所述阈值,则识别出在所述捕获的声音信号中出现语音重音(并且暂时地增大所述经处理的声音信号的幅度)。在更精细的替换中,所述预定标准涉及(由较低阈值和较高阈值定义的) 范围。在此种情形下,仅当至少一个导数在所述范围内(即,超过所述较低阈值但仍低于所述较高阈值)时,暂时地增大所述经处理的声音信号的幅度。后一种替换反映了这样的思想:对于所捕获的声音信号的幅度和/或音高的导数超过所述较高阈值的强重音,由于这些重音能被感知,而无需被增强。相反,仅增强用户可能无法听到的小和中等程度的重音。
[0022] 在本发明的简单但有效的实施例中,仅分析和评估所捕获的声音信号的幅度和音高之一,以识别语音重音。在本发明的更精细的实施例中,确定和评估幅度和音高两者的导数以识别语音重音。在后一种情形下,仅增强从幅度和音高的时间变化的组合分析中识别出的语音重音。例如,仅当幅度和音高两者的导数同时满足预定标准时(例如,超过各自的阈值或在各自的范围内),才识别出语音重音。
[0023] 优选地,所述至少一个导数包括所捕获的声音信号的幅度和/或音高的一阶导数和至少一个高阶导数(即,导数的导数,例如二阶或三阶导数)。在此种情形下,预定标准涉及一阶导数和高阶导数两者。例如,在优选实施例中,如果一阶导数超过预定阈值或在预定范围内,则识别出语音重音(并且,暂时地增大经处理的声音信号的幅度),其中,所述阈值或范围依赖于所述高阶导数而改变。作为替换,将一阶导数和高阶导数的数学组合与阈值或范围进行比较。例如,利用取决于高阶导数的加权因子对一阶导数进行加权,并且将加权的一阶导数与预定阈值或范围进行比较。
[0024] 在本发明的更精细的实施例中,将所述经处理的声音信号的幅度暂时地增大依赖于至少一个导数而变化的量。此外或者作为替换,增强间隔可以依赖于至少一个导数而改变。因此,将小和强的重音增强到不同程度。
[0025] 根据偏好,在语音识别步骤中,将识别出的语音间隔区分为其中用户说话的自身话音间隔和其中至少一个不同说话者说话的外来话音间隔。在这种情形下,在助听仪器的常规操作中,仅在所述外来话音间隔期间执行所述语音增强步骤以及,可选地,推导步骤。换句话说,在自身话音间隔期间并不增强语音重音。此实施例反映了这样的经验,当用户说话时,由于用户知道他或她说了什么,即可以毫无问题地感知他或她自己的话音,而无需增强语音重音。通过在自身话音间隔期间停止增强语音重音,可以将包含自身话音更自然声音的经处理的声音信号提供给用户。
[0026] 根据本发明的第二方面,如权利要求11所规定的,提供了一种具有助听仪器(如前文所规定)的助听系统。所述助听仪器包括:布置成从助听仪器的环境中捕获(原始)声音信号的输入换能器、;布置成处理捕获的声音信号以至少部分地补偿用户的听力障碍(从而提供经处理的声音信号)的信号处理器、以及布置成向用户发射所述经处理的声音信号的输出换能器。具体地,所述输入换能器将原始声音信号转换成(包含所述捕获的声音信号的信息的)输入音频信号,所述输入音频信号被馈送(feed)至所述信号处理器,并且所述信号处理器将(包含经处理的声音信号的信息的)输出音频信号输出到所述输出换能器,所述输出换能器将所述输出音频信号转换成空气承载的声音、结构承载的声音或者直接刺激听觉神经的信号。
[0027] 一般地,所述助听系统配置成自动执行根据本发明的第一方面的方法。为此,所述系统包括:
[0028] ‑话音识别单元,配置成分析所述捕获的声音信号以识别语音间隔,其中所述捕获的声音信号包含语音;
[0029] ‑推导单元,配置成在识别的语音间隔期间,确定所述捕获的声音信号的幅度和/或音高的至少一个(时间)导数;以及
[0030] ‑语音增强单元,配置成如果所述至少一个导数满足预定标准,暂时地增大所述经处理的声音信号的幅度。
[0031] 对于根据本发明的第一方面的方法的每个实施例或变型,存在根据本发明第二方面的助听系统的对应实施例或变型。因此,与所述方法相关的公开内容在必要修改后也适用于所述助听系统,反之亦然。
[0032] 具体地,在所述助听系统的优选实施例中,
[0033] ‑所述语音增强单元可以配置成:如果所述至少一个导数满足预定标准,在例如5到15毫秒(具体约为10毫秒)的预定增强间隔内增大所述经处理的声音信号的幅度,[0034] ‑所述语音增强单元可以配置成在所述预定时间间隔内连续增大和/或减小所述经处理的声音信号的幅度,
[0035] ‑所述语音增强单元可以配置成:根据所述预定标准,如果所述至少一个导数超过预定阈值或者在预定范围内,暂时地增大所述经处理的声音信号的幅度,
[0036] ‑所述语音增强单元可以配置成:根据所述预定标准,如果一阶导数超过预定阈值或在预定范围内,暂时地增大所述经处理的声音信号的幅度,并且依赖于高阶导数改变所述阈值或范围,
[0037] ‑所述语音增强单元可以配置成将所述经处理的声音信号的幅度暂时的增大依赖于至少一个导数而变化的量,和/或
[0038] ‑所述话音识别单元可以配置成将所述识别的语音间隔区分成自身话音间隔和外来话音间隔,如上所定义的,其中所述语音增强单元仅在外来话音间隔期间(即,不在自身话音间隔期间)暂时地增大所述经处理的声音信号的幅度。
[0039] 优选地,信号处理器被设计为数字电子设备。其可以是单个单元或者由多个子处理器组成。信号处理器或至少一个所述子处理器可以是可编程设备(例如,微控制器)。在此种情形下,上述功能或部分所述功能可以实现为软件(具体是固件)。或者,信号处理器或至少一个所述子处理器可以是不可编程设备(例如,ASIC)。在此种情形下,上述功能或部分所述功能可以实现为硬件电路。
[0040] 在本发明的优选实施例中,所述话音识别单元、推导单元和/或语音增强单元被布置在助听仪器中。具体地,这些单元的每个可以被设计为信号处理器的硬件或软件组件,或者作为独立的电子组件。然而,在本发明的其他实施例中,所述话音识别单元、推导单元和/或语音增强单元或其至少功能部分可以位于诸如移动电话的外部电子设备上。
[0041] 在优选实施例中,所述话音识别单元包括用于检测一般话音活动的话音活动检测(VAD)模块和用于检测用户的自身话音的自身话音检测(OVD)模块。

附图说明

[0042] 将参照附图描述本发明的实施例,其中,
[0043] 图1示出了包括助听器(即,佩戴在用户耳朵内或耳朵处的助听仪器)的助听系统的示示意图,所述助听器包括布置成从助听器的环境中捕获声音信号的输入换能器、布置成处理捕获的声音信号的信号处理器以及布置成向用户发射经处理的声音信号的输出换能器;
[0044] 图2示出了用于操作图1助听器的方法的流程图,所述方法包括:在语音增强步骤中,暂时地应用增益,并因此暂时地增大经处理的声音信号的幅度,以增强捕获的声音信号中的外来话音语音的语音重音;
[0045] 图3示出了用于识别语音重音的方法步骤的第一实施例的流程图,所述方法步骤是根据图2的方法的语音增强步骤的一部分;
[0046] 图4示出了用于识别语音重音的方法步骤的第二实施例的流程图;
[0047] 图5至图7以随时间变化的经处理的声音信号的幅度的三个示意图示出暂时地增大经处理声音信号的幅度的三个不同变体;以及
[0048] 图8示出了包括根据图1的助听器和用于控制和编程助听器的软件应用的助听系统的示意图,所述软件应用安装在移动电话上。

具体实施方式

[0049] 除非另外指出,相同的附图标记表示相同的部件、结构和元件。
[0050] 图1示出了包括助听器4的助听系统2,即配置为支持听力障碍用户的听力的助听仪器,其配置为佩戴在用户的一只耳朵内或耳朵处。如图1所示,举例来说,助听器4可以设计为耳后(BTE)助听器。可选地,系统2包括第二助听器(未示出),第二助听器佩戴在用户的另一只耳朵内或耳朵处,以向用户提供双耳支持。
[0051] 在外壳5内,助听器4包括作为输入换能器的两个麦克风6和作为输出换能器的接收器8。助听器4还包括电池10和信号处理器12。优选地,信号处理器12包括可编程子单元(诸如微处理器)和不可编程子单元(诸如ASIC)。信号处理器12包括话音识别单元14,话音识别单元14包括话音活动检测(VAD)模块16和自身话音检测 (OVD)模块18。根据偏好,模块16和18两者均被设计为安装在信号处理器12中的软件组件。
[0052] 信号处理器12由电池10供电,即电池10向信号处理器12提供电源电压U。
[0053] 在助听器4的常规操作期间,麦克风6从助听器2的环境中捕获声音信号。麦克风6将声音转换成包含关于所捕获的声音的信息的输入音频信号I。输入音频信号I被馈送到信号处理器12。信号处理器 12处理输入音频信号I,即提供定向声音信息(波束形成),以执行降噪和动态压缩,并且基于用户的听力图数据单独地放大输入音频信号I的不同频谱部分,以补偿特定于用户的听力损失。信号处理器12 向接收器8发射包含关于经处理的声音的信息的输出音频信号O。接收器8将输出音频信号O转换成经处理的空气传播的声音,经由连接接收器8和外壳5的尖端22的声音通道20以及连接尖端22和插入到用户耳道中的耳机的柔性声音管(未示出),所述声音被发射到用户的耳道中。
[0054] VAD模块16一般地检测输入音频信号I中(与特定说话者无关的)话音的存在,而OVD模块18特定地检测用户自身话音的存在。根据偏好,例如根据US 2013/0148829A1或WO 2016/078786A1,模块16和18应用本领域已知的VAD和OVD技术。通过分析输入音频信号I(以及因此捕获声音信号),VAD模块16和OVD模块18识别语音间隔,其中输入音频信号I包含语音,语音间隔被区分(细分) 为其中用户说话的自身话音间隔和其中至少一个不同说话者说话的外来话音间隔。
[0055] 此外,助听系统2包括推导单元24和语音增强单元26。推导单元24配置成从输入音频信号I推导所捕获的声音信号的音高P(即基频),作为时间相关变量。推导单元24还配置成对音高P的测量值应用动态平均,例如,应用15毫秒的时间常数(即,用于平均的时间窗口的大小),并且配置成推导音高P的时间平均值的一阶(时间) 导数D1和二阶(时间)导数D2。
[0056] 例如,在简单而有效的实现中,音高P的时间平均值的周期性时间序列由…AP[n‑2]、AP[n‑1]、AP[n]、…给出,其中AP[n]是当前值,AP[n‑2]和AP[n‑1]是先前确定的值。然后,可以按照如下确定一阶导数D1的当前值D1[n]和先前值D1[n‑1]:
[0057] D1[n]=AP[n]–AP[n‑1]=D1,
[0058] D1[n‑1]=AP[n‑1]–AP[n‑2],
[0059] 并且,可以按照如下确定二阶导数D2的当前值D2[n]:
[0060] D2[n]=D1[n]–D1[n‑1]=D2。
[0061] 语音增强单元26配置为根据随后更详细描述的标准来分析导数 D1和D2,以识别输入音频信号I(即,所捕获的声音信号)中的语音重音。此外,语音增强单元26配置为如果导数D1和D2满足标准 (指示语音重音),则暂时地应用附加增益G,从而增大经处理的声音信号O的幅度。
[0062] 根据偏好,推导单元24和语音增强单元26两者被设计为安装在信号处理器12中的软件组件。
[0063] 在助听器4的常规操作期间,话音识别单元14(即,VAD模块 16和OVD模块18)、推导单元24和语音增强单元26交互以执行图 2所图示的方法。
[0064] 在所述方法的第一步骤30中,话音识别单元14分析输入音频信号I的外来话音间隔,即其检查是否VAD模块16返回肯定的结果(指示在输入音频信号I中检测到语音),同时OVD模块18返回否定的结果(指示在输入音频信号I中不存在用户自己的话音)。
[0065] 如果识别到外来话音间隔(Y),则话音识别单元14触发推导单元24执行下一步骤32。否则(N),重复步骤30。
[0066] 在步骤32中,推导单元24从输入音频信号I推导所捕获的声音的音高P,并且如上所述的对音高P应用时间平均处理。在随后的步骤34中,推导单元24推导音高P的时间平均值的一阶导数D1和二阶导数D2。此后,推导单元24触发语音增强单元26执行语音增强步骤36,在图2所示的示例中,步骤36被细分为两个步骤38和40。
[0067] 在步骤38中,语音增强单元26如上所述的分析导数D1和D2,以识别语音重音。如果识别到语音重音(Y),则语音增强单元26进行步骤40。否则(N),即如果未识别到语音重音,则语音增强单元 26触发话音识别单元14再次运行步骤30。
[0068] 在步骤40中,语音增强单元26将附加增益G暂时地应用于经处理的声音信号。因此,对于预定的时间间隔(称为增强间隔TE),增大经处理的声音信号O的幅度,从而增强识别的语音重音。在增强间隔TE期满后,增益G降低到1(0dB)。随后,语音增强单元 26触发话音识别单元14执行步骤30,从而再次执行图2的方法。
[0069] 图3和图4更详细地示出了图2的方法的重音识别步骤38的两个替换实施例。对于这两个实施例,前面提到的用于识别语音重音的标准涉及时间平均的音高P的一阶导数D1与(第一)阈值T1之间的比较,所述比较进一步受到二阶导数D2的影响。
[0070] 在第一实施例中,根据图3,阈值T1依赖于二阶导数D2偏移(改变)。为此,在步骤42中,语音增强单元26将二阶导数D2与(第二)阈值T2进行比较。如果二阶导数D2超过阈值T2(Y),语音增强单元26将阈值T1设置为两个预定值中较低的一个值(步骤44)。否则(N),即如果二阶导数D2未超过阈值T2,语音增强单元26将阈值T1设置为所述两个预定值中较高的一个值(步骤46)。
[0071] 在随后的步骤48中,语音增强单元26检查一阶导数D1是否超过阈值T1(D1>T1?)。如果是(Y),语音增强单元26进行步骤 40,如前面参照图2所述。否则(N),也如参照图2所述,语音增强单元26触发话音识别单元14再次运行步骤30。
[0072] 在第二实施例中,根据图4,利用可变权重因子W对一阶导数 D1进行加权,权重因子根据二阶导数D2来确定。为此,在步骤50 中,语音增强单元26根据二阶导数D2确定权重因子W。例如,如果D2超过阈值T2,则将W设置为正值W0(W=W0,其中W0>1),否则,将W设置为1(W=1)。
[0073] 在步骤52中,语音增强单元26将一阶导数D1乘以权重因子W (D1→W·D1)。
[0074] 随后,在步骤54中,语音增强单元26检查加权的一阶导数D1 (即乘积W·D1)是否超过阈值T1(W·D1>T1?)。如果是(Y),语音增强单元26进行步骤40,如前面参照图2所述。否则(N),也如参照图2所述,语音增强单元26触发话音识别单元14再次运行步骤30。
[0075] 图5至图7示出了增益G随时间t变化的三个图。每个图示出了如何在步骤40中暂时地应用增益G的不同示例,从而在增强间隔TE 期间增大输出音频信号O的幅度。
[0076] 在根据图5的第一示例中,语音增强单元26阶梯式地增大增益 G(即,按照时间t的二进制函数)。如果在步骤38中识别到语音重音,将增益G设置为超过1的正值G0(G=G0,G0>1)。值G0在整个增强间隔TE内保持不变。在增强间隔TE期满之后,将增益G 重置为常数1(G=1)。值G0可以被预定为常数。可选地,值G0 可以根据一阶导数D1或二阶导数D2而变化。例如,值G0可以与一阶导数D1成比例(因此,随着导数D1值的增大/减小而增大/减小)。
[0077] 在根据图6的第二示例中,如果识别到语音重音,将增益G阶梯式地(骤然地)设置为正值G0。此后,在增强间隔TE结束时,其连续减小(具有线性或非线性的时间相关性)以达到G=1。
[0078] 在根据图7的第三示例中,如果识别到语音重音,则连续增大增益G,并且此后连续减小,以在增强间隔TE结束时达到G=1。
[0079] 图8示出了助听系统2的另一实施例,其中此种情形包括如前所述的助听器4以及安装在用户的移动电话74上的软件应用程序(随后表示为“助听应用程序”72)。这里,移动电话74不是系统2的一部分。相反,其仅仅由系统74使用,作为提供计算能力和存储器的资源。
[0080] 助听器4和助听应用程序72经由无线链路76(例如,基于蓝牙标准)交换数据。为此,助听应用程序72访问移动电话74的无线收发器(未示出),无线收发器具体为蓝牙收发器,以向助听器4发送数据并从助听器4接收数据。
[0081] 在根据图8的实施例中,在助听应用程序72中实现前述助听系统2的一些元件或功能。例如,在助听应用程序72中实现被配置为执行步骤38的语音增强单元26的功能部分。
[0082] 本领域技术人员将会理解,在不脱离权利要求中广泛描述的本发明的精神和范围的情况下,可以对具体示例中所示的发明进行各种变化和/或修改。因此,本示例在所有方面均被认为是说明性的,而非限制性的。
[0083] 附图标记列表
[0084] 2   (助听)系统
[0085] 4   助听器
[0086] 5   外壳
[0087] 6   麦克风
[0088] 8   接收器
[0089] 10  电池
[0090] 12  信号处理器
[0091] 14  话音识别单元
[0092] 16  话音检测模块(VD模块)
[0093] 18  自身话音检测模块(OVD模块)
[0094] 20  声音通道
[0095] 22  尖端
[0096] 24  推导单元
[0097] 26  语音增强单元
[0098] 30  步骤
[0099] 32  步骤
[0100] 34  步骤
[0101] 36  步骤
[0102] 38  步骤
[0103] 40  步骤
[0104] 42  步骤
[0105] 44  步骤
[0106] 46  步骤
[0107] 48  步骤
[0108] 50  步骤
[0109] 52  步骤
[0110] 54  步骤
[0111] 72  助听应用程序
[0112] 74  移动电话
[0113] 76  无线链路
[0114] t   时间
[0115] D1  一阶导数
[0116] D2  二阶导数
[0117] G   增益
[0118] G0  值
[0119] I   输入音频信号
[0120] O   输出音频信号
[0121] P   音高
[0122] T1  阈值
[0123] T2  阈值
[0124] TE  增强间隔
[0125] U   电源电压
[0126] W   权重因子
[0127] W0  值