带有操作校正的机动车仪器操作转让专利

申请号 : CN201580038865.X

文献号 : CN106537491B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : D·恩格尔哈特J·保利克K·特勒曼S·沙德尔

申请人 : 奥迪股份公司

摘要 :

本发明涉及一种用于运行机动车操作装置(2)的方法,用于根据语音控制在机动车(1)的仪器(4、5、6)上实施两个基于彼此构建的操作步骤。在语音识别设备(8)中设定规定用于第一操作步骤的第一词汇(17)。基于所设定的第一词汇(17)产生第一识别结果,根据第一识别结果执行所述第一操作步骤。然后在语音识别设备(8)中设定规定用于第二操作步骤的第二词汇(18)且接收第二语音输入(24)。重复识别设备(25)在第二语音输入(24)之时或之后识别使用者(3)的校正意图。然后在仪器(4、5、6)中撤销第一操作步骤,在语音识别设备(8)中重新设定第一词汇(17)。根据从第二语音输入(24)的至少一部分中确定的第二识别结果再次执行第一操作步骤。

权利要求 :

1.一种用于运行机动车操作装置(2)的方法,用于根据语音控制在机动车(1)的仪器(4、5、6)上实施两个基于彼此构建的操作步骤,其中:-在语音识别设备(8)中设定规定用于第一操作步骤的第一词汇(17),-基于所设定的第一词汇(17)针对使用者(3)的第一语音输入(22)产生第一识别结果,-根据第一识别结果执行所述第一操作步骤,-在语音识别设备(8)中,取代第一词汇(17)设定与第一词汇(17)至少部分不同的、规定用于第二操作步骤的第二词汇(18),-检测使用者(3)的第二语音输入(24),

其特征在于,

重复识别设备(25)在检测第二语音输入(24)之时或之后识别使用者(3)的校正意图,并在仪器(4、5、6)中撤销第一操作步骤,在语音识别设备(8)中取代第二词汇(18)重新设定第一词汇(17),并基于该重新设定的第一词汇(17)针对第二语音输入(24)的至少一部分产生第二识别结果,根据该第二识别结果再次执行第一操作步骤。

2.根据权利要求1所述的方法,其特征在于,每个词汇(17、18)规定了使用者(3)能使用的语音命令(D1、D2、D3、E1、E2、E3),在第二词汇(18)中缺少用于控制第一操作步骤的语音命令(D1、D2、D3)。

3.根据权利要求1或2所述的方法,其特征在于,由重复识别设备(25)根据使用者在第二语音输入(24)开始时说出的语音表达识别出校正意图。

4.根据权利要求1或2所述的方法,其特征在于,由重复识别设备(25)-根据从执行第一操作步骤至第二语音输入(24)开始之间的语音停顿时长,或-根据使用者(3)在第二语音输入(24)期间所操作的操作元件的操作信号识别出校正意图。

5.根据权利要求1或2所述的方法,其特征在于,在无需使用者(3)操作的情况下通过操作装置执行第一操作步骤的撤销和第一词汇(17)的重新设定。

6.根据权利要求1或2所述的方法,其特征在于,通过语音对话系统(9)进行所述两个操作步骤的语音控制,并且在语音对话系统(9)中设定之前的对话状态(14)用于重新设定第一词汇(17)。

7.根据权利要求1或2所述的方法,其特征在于,所述第一操作步骤和所述第二操作步骤涉及:-在地址簿中搜寻数据库或

-逐步地规划路线用于导航辅助或

-通过电话系统建立电话连接。

8.根据权利要求1或2所述的方法,其特征在于,在设定第二词汇(18)之后示出命令显示,该命令显示告知使用者(3)要如何表明校正意图。

9.一种用于机动车(1)的操作装置(2),该操作装置具有:-用于检测使用者(3)的语音输入(22、24)的语音检测设备(7),-用于向机动车(1)的仪器(4、5、6)输出控制命令的处理器设备(11),其中通过每个控制命令在仪器(4、5、6)中执行预定的操作步骤,其特征在于一种处理器设备(11),该处理器设备被设计用于执行根据上述权利要求之一所述的方法。

10.一种机动车(1),其具有根据权利要求9所述的操作装置(2)。

说明书 :

带有操作校正的机动车仪器操作

技术领域

[0001] 本发明涉及一种用于运行机动车操作装置的方法,用于根据语音控制在机动车的仪器上执行至少两个基于彼此构建的操作步骤。例如,在导航设备上在输入导航目的地时首先要输入城市名,然后输入街道名。本发明还包括一种用于执行所述方法的操作装置以及一种具有根据本发明的操作装置的机动车。

背景技术

[0002] 通过语音输入的、未被语音识别器正确识别的数据、例如所述的城市名称现今必须通过两步骤的校正程序重新输入。原因在于,语音识别设备通常具有动态词汇,即为每个操作步骤提供自有的词汇,其只含有对于该操作步骤可行的语音命令。由此使语音识别系统更鲁棒。
[0003] 动态词汇所涉及的数据数量通常非常大。而必须识别越少的数据,识别则越准确。因此在接下来的对话步骤中的识别被减至对该接下来的对话步骤中的所期望的数据进行识别。
[0004] 所述两步骤的校正程序因此通常规定,通过语音命令,例如“改变”或“校正”告知语音识别系统:先前的语音输入要加以校正。之后,通过系统输出、例如“校正”反馈给使用者:所启动的校正阶段已被理解。之后通过系统输出要求使用者重新输入数据,例如“请您说出城市”作为语音输出。相反,在没有“校正”或“改变”命令的情况下,则在下个步骤中继续执行操作,其中所述语音识别设备认定识别是正确的。但在该接下来的操作步骤中,识别被减至对第二操作步骤的语音命令、例如街道名称的识别。因而如果使用者就是再次说出城市名称,则该城市名称是决不会被识别的。
[0005] 因此如果使用者想要在未提前说出或等候例如“校正”命令的情况下在这时校正其输入数据,则该语音命令一直被错误地被识别,这是因为在新的对话状态下已经不再提供识别搜寻空间可供之前的语音输入使用。
[0006] 所述两步骤的校正程序对使用者而言是费时的,并且尤其在行驶过程中以所不期望的方式使使用者从行驶状况中转移注意力。但最主要的是这种校正程序并不直观,因为在人-人-沟通中不使用命令,例如“校正”。
[0007] 从文献US 6 128 594A中已知:输出所检测的用于检查的语音命令。使用者于是可以利用语音命令引发对所识别的语音结果的校正。由此在仪器上执行命令之前,可以校正在所识别的语音结果中的各词语。
[0008] 从文献KR 2004 0035151A中已知一种用于利用输出所检测的语音命令进行语音识别的方法。使用者可以借助于操作开关产生重新输入。如果语音命令被准确地识别,则可以通过对仪器进行操作而继续。

发明内容

[0009] 本发明的目的在于,在用于仪器的操作装置中避免在错误识别时进行两步骤的校正程序,所述仪器使用借助于动态的词汇的语音控制。
[0010] 该目的通过一种用于运行机动车操作装置的方法实现,该方法用于根据语音控制在机动车的仪器上实施两个基于彼此构建的操作步骤,其中:
[0011] -在语音识别设备中设定规定用于第一操作步骤的第一词汇,
[0012] -基于所设定的第一词汇针对使用者的第一语音输入产生第一识别结果,
[0013] -根据第一识别结果执行所述第一操作步骤,
[0014] -在语音识别设备中,取代第一词汇设定与第一词汇至少部分不同的、规定用于第二操作步骤的第二词汇,
[0015] -检测使用者的第二语音输入,
[0016] 重复识别设备在检测第二语音输入之时或之后识别使用者的校正意图,并在仪器中撤销第一操作步骤,在语音识别设备中取代第二词汇重新设定第一词汇,并基于该重新设定的第一词汇针对第二语音输入的至少一部分产生第二识别结果,根据该第二识别结果再次执行第一操作步骤。
[0017] 根据本发明提供了一种用于运行机动车操作装置的方法,用于根据语音控制在机动车的仪器中实施两个基于彼此构建的操作步骤,也就是例如首先输入城市名称,然后输入街道名称。在语音识别设备中设定第一词汇,该第一词汇被规定用于第一操作步骤。在所述示例中,所述第一词汇可以例如包括城市名称。词汇的另一称谓是语音识别器的语法。
[0018] 对于使用者的第一语音输入,基于所设定的第一词汇产生第一识别结果,并且根据第一识别结果执行第一操作步骤。因此例如在导航系统中输入所识别到的城市名称并且告知导航系统:现在要执行接下来的问询、即对街道名称的问询。在语音识别设备中于是取代第一词汇设定与第一词汇至少部分不同的、被规定用于第二操作步骤的第二词汇。在该示例中,该第二词汇可以是街道名称。此外,检测使用者的第二语音输入。
[0019] 通过操作装置必须识别出:使用者是否真的想要输入街道名称,或者想要校正之前所识别的城市名称。根据本发明,重复识别设备为此在检测第二语音输入之时或之后识别使用者的校正意图。如果识别到校正意图,则根据所述方法的另一步骤在仪器中撤销第一操作步骤。仪器状态也就被设定到先前的状态。此外,在语音识别设备中再次设定第一词汇取代第二词汇。于是针对第二语音输入的至少一部分,基于重新设定的第一词汇产生第二识别结果。于是根据第二识别结果再次执行第一操作步骤。
[0020] 通过本发明获得的优点是,针对第一操作步骤的校正是一步骤的程序,使得由此产生更快的、随着第二语音输入一同进行的校正。通过重复识别设备不需要使用者之前引发校正,然后等待,直至语音识别设备被重新就绪,然后才能再次重复第一语音输入,也就是例如城市名称。
[0021] 如果通过重复识别设备未识别到校正意图,即通过该重复识别设备识别到继续运行意图、而非校正意图,从而可以保持第二词汇,也就是保持设定。基于所设定的第二词汇可以针对第二语音输入产生第二识别结果,并且根据第二识别结果执行第二操作步骤。例如,就此在导航设备中确定街道名称。
[0022] 结合具有动态词汇的语音识别系统使用根据本发明的方法是特别有利的,其中因而每个词汇规定了使用者可使用的语音命令,在此尤其在第二词汇中不存在用于控制第一操作步骤的语音命令。换句话说,第二词汇的数据数量可以因此保持较小,这是因为第二词汇不必包括第一词汇。
[0023] 为识别校正意图,本发明提出多种改进方案。
[0024] 在一改进方案中,通过重复识别设备根据使用者在第二语音输入开始时的语音表达识别出校正意图。换句话说,识别出用于引导的校正命令。尤其是直观地将使用者使用的词语评估或识别为校正命令。例如,这种语音表达包括:“不,……”、“额……”、“不,我是说……”或者“我是说……”。通过识别引导的语音表达得到的优点是,使用者不必为了校正而从交通状况中转移视线,而是只需进行单独的第二语音输入。
[0025] 在本发明的另一改进方案中,通过重复识别设备根据从执行第一操作步骤延伸至第二语音输入开始的语音停顿时长识别校正意图。换而言之,将使用者的延迟解读为校正意图。
[0026] 在另一改进方案中,通过重复识别设备根据使用者在第二语音输入时所操作的操作元件的操作信号识别校正意图。例如,可以设有按键,使用者在说出第二语音输入期间按压该按键。这是用于识别校正意图的特别鲁棒的实施方式。为此也不需要视线转向。
[0027] 如所述那样,第一操作步骤的撤销和第一词汇的重新设定在无需使用者操作的情况下通过操作装置以一步骤的方式实现,换句话说,对第一操作步骤的校正和重新输入一同进行。
[0028] 在一特别有利的实施方式中,通过语音对话系统进行所述两个操作步骤的语音控制。为重新设定第一词汇,在语音对话系统中设定之前的对话状态或对话步骤。换句话说,后退地执行对话步骤。由此得到的优点是,在语音识别设备中自动地激活配属于该对话步骤的词汇。因此,不必改变语音识别设备本身就可以调整词汇。
[0029] 根据本发明的方法尤其在下面仪器中证实有用:数字地址簿、导航设备、电话系统。本发明的相应的改进方案提出,第一操作步骤和第二操作步骤涉及:在地址簿中的数据库搜寻或用于导航辅助的逐步地路线规划或通过电话系统建立电话连接。
[0030] 证实特别有利的是,在设定第二词汇之后示出命令显示,其告知使用者要如何表明校正意图。由此得到优点是,操作装置是明白易晓的。
[0031] 本发明还包括用于机动车的操作装置。该操作装置具有用于检测使用者的语音输入的语音检测设备。此外,设有用于向机动车的仪器发出控制命令的处理器设备。通过每个控制命令在仪器中相应执行一个操作步骤。处理器设备被设计用于执行根据本发明的方法的实施形式。
[0032] 最后,本发明还包括一种机动车,其具有根据本发明的操作装置的实施形式。根据本发明的机动车优选被设计为汽车、尤其是轿车。

附图说明

[0033] 下面描述本发明的一实施例。为此,唯一的示图(图)示出根据本发明的机动车的实施形式的示意图。
[0034] 实施方式
[0035] 在下面所述实施例中所涉及的是本发明的优选实施形式。但在该实施例中,该实施方式的加以说明的部件分别构成了本发明的各个、彼此独立看待的特征,其分别彼此独立地改进了本发明并且因而也要被单独地或以与所示出的组合不同的组合被看作是本发明的组成部分。此外,所述实施形式还能够由本发明的其它的已经加以说明的特征来补充。
[0036] 附图示出机动车1,其在此可以是汽车、尤其是轿车。该机动车1可以具有操作装置2,使用者3利用该操作装置能够通过语音控制操作一个或多个仪器4、5、6。仪器4例如可以是具有地址簿的电话设备,其在此由标记“A”表示。仪器5例如可以是用于导航辅助的导航设备,其由标记“B”表示。仪器6例如可以是媒体播放设备,例如收音机和/或MP3播放器,这在附图中通过标记“C”表示。
[0037] 为操作仪器4、5、6之一,使用者3例如可以叫出或说出设备名称,也就是例如“A”、“B”、“C”,然后逐步依次地说出各个语音指令,以便激活仪器的特定功能。在该示例中假定,使用者3选择导航设备,以便然后输入导航目的地,其方式是使用者逐步依次地在导航设备中设定导航目的地的城市名称作为第一操作步骤,然后在导航设备中设定导航目的地的街道名称作为第二操作步骤。
[0038] 为实现该语音操作,操作装置2可以具有语音检测设备7、语音识别设备8(ASR-Automatic Speech Recognition-自动语音识别)、语音对话系统9和控制设备10。语音检测设备7可以例如包括一个或多个麦克风。语音识别设备8可以例如由操作装置2的处理器设备11的程序模块实现。还可以实现的是,语音识别设备8利用车辆外部的语音识别系统实施真正的语音识别,语音识别设备8例如能够通过无线连接和通过因特网与该车辆外部的语音识别系统连接。所述语音对话系统9同样可以是处理器设备11的程序模块。
[0039] 语音对话系统9可以例如包括带有多个对话步骤13、14、15的语音对话12。为每个对话步骤13、14、15可以规定一个专有化的识别词汇或简称为词汇16、17、18,其中含有分别在对话步骤13、14、15中有效的或规定的或可行的语音命令19。针对每个对话步骤13、14、15,控制设备10以已知的方式这样设置语音识别设备8,使得设定对应有效的词汇16、17、
18。由此能够实现更鲁棒且快速的语音识别。控制设备10为此可以被实现为处理器设备和/或处理器设备11的程序模块。
[0040] 在该示例中假定,使用者3为确定导航目的地首先通过说出了“B”的称谓而选择导航设备。该语音输入的语音声波被语音检测设备7检测到并被转换为电信号和/或数字信号,该信号被传输给了语音识别设备8,该语音识别设备8基于由控制设备10所设定的词汇16识别出了B的称谓并将该语音识别结果传递给了语音对话系统9。通过该语音对话系统9可以在仪器4、5、6之间这样切换,使得语音对话系统9与仪器5、即导航设备耦合。
[0041] 语音对话系统9继而在前进步骤20中从对话步骤13切换至对话步骤14。语音对话系统9可以将所述用于对话步骤14的词汇17例如作为操作词汇21接收。所述操作词汇例如可以是城市名称D1、D2、D3。
[0042] 该词汇17可以由控制设备10的语音对话系统9提供,所述控制设备之后在语音词汇识别设备8中利用词汇17调整或更换所述词汇16。
[0043] 为在仪器5上执行所述第一操作步骤,即例如在仪器5中设定城市名称,使用者3可以说出所期望的城市名称、在此例如说出D2来作为第一语音输入22。语音检测设备7以所述的方式检测到语音输入22,语音识别设备8基于所设定的词汇17对所检测到的语音输入加以识别。
[0044] 如果语音识别设备8识别出第一语音输入22,也就是在此识别出城市名称D1、D2或D3之一,那么这作为语音命令被执行,也就是说,作为第一操作步骤,语音对话系统9可以在仪器5中设定城市名称。然后所述仪器5等待第二操作步骤。相应地,在语音对话系统9中,在前进步骤23中从对话步骤14切换至对话步骤15。对于该对话步骤15,可以在此由仪器5以所述方式接收用于控制或执行第二操作步骤、即在此用于设定街道名称的词汇。用于第二操作步骤的该词汇18可以再次以所述方式由语音对话系统传递给控制设备10,该控制设备在语音识别设备8中设定词汇18取代词汇17。这时,使用者可以说出街道名称E1、E2、E3,相应地,在第二操作步骤中,在仪器5中设定相应的街道名称。
[0045] 在附图中所示的示例中假定,在对话步骤14中错误理解了语音输入22。例如,语音识别设备8没有理解关于城市名称D2的语音命令,而是错误地理解成了城市名称D1。在前进步骤23中加载用于城市名称的词汇并由控制设备18在语音识别设备8中设定所述词汇。在示例中假定,使用者3此时识别出选择了错误的城市名称。因为也就执行了错误的第一操作步骤。使用者因而为进行校正再次说出用于第一操作步骤的语音命令,并且口头说明,出现了错误。例如,他可以说出:“不,我是说D2。”或者例如:“不,不是D1,而是D2。”或者“不,D2。”或者“返回,D2。”该第二语音输入24再次被语音检测设备7传递给语音识别设备8。但该语音识别设备8此刻已经根据对话步骤15为第二操作步骤设定了词汇18。其中并不含有关于城市名称D1、D2、D3的语音命令,也就是说,缺少这些城市名称。
[0046] 因此为了仍识别使用者3的校正意图,语音识别设备或者广泛地讲,操作装置2具有重复识别设备25。该重复识别设备25探查或识别使用者3的校正意图,并且因此在语音对话系统9中触发从对话步骤15退至对话步骤14的后退步骤26。因此,为识别语音输入24的语音命令,从词汇18再返回切换至词汇17。
[0047] 重复识别设备25还负责或者还被设计用于在仪器5中进行校正。在仪器5中,使所述第一操作步骤、也就是设定城市名称的步骤被撤销。例如,可以因而后退设定仪器状态5。对于撤销操作,对相应仪器4、5、6的设置要分别加以考虑。例如,针对每个前进步骤20、23,在对话系统9中可以规定对应的后退步骤26,并且针对每个后退步骤可以为仪器4、5、6规定相应的控制信号,该控制信号使得前进步骤20、23被撤销。这例如可以记录或存储在命令表中。
[0048] 为了使重复识别设备25识别使用者3利用语音输入24不想要控制第二操作步骤,也就是例如不想要输入街道名称,而是想要校正或重复第一操作步骤,那么所述重复识别设备例如可以使用或具有辅助词汇27,其可以预设一种或多种语音表达28,使用者3通过所述语音表达更大可能地表示校正意图。例如,这种词汇28可以是“不,”“不,我是说”。如果语音表达的开始在语音输入24中识别出这种语音表达28,则这被重复识别设备25识别为校正意图的信号,并且以所述方式使第一操作步骤撤销,并在语音识别设备28中设定或激活第一词汇17来重复第一操作步骤。那么这时可以基于词汇17识别语音输入24的其余部分,即例如重复说出的城市名称D2。
[0049] 如果这时正确识别出语音输入24,则以所述方式继续下述步骤:通过在前进步骤23中激活对话步骤15,在仪器5中设定校正后的城市名称D2,因此成功执行第一操作步骤。
[0050] 然后仪器5再次准备好接收街道名称,并且语音识别设备8同样被设定了针对识别街道名称的词汇18。
[0051] 在错误理解数据输入后,使用者因为可以利用带有引导的命令—例如“不,我是说”,加上新的数据输入一步地校正之前所输入的和错误地理解的数据。识别器由此识别出所涉及的是基于之前对话状态的数据,并针对之前对话步骤开启搜寻空间。通过该一步骤的程序使得能够更快实现校正。此外,对使用者而言,新的数据输入被构造得明显更直观。
[0052] 通过前置的命令“不,我是说”或“我是说......”向识别器表明:要针对之前步骤开启识别器搜寻空间。所要识别的数据这时被减少至之前对话步骤的数据。在命令“不,我是说”之后可以直接输入新的语音内容。
[0053] 总体上,所述示例示出了通过本发明如何能够通过语音操作提供对语音输入的马上校正。