纠错处理方法及装置、计算机设备及可读介质转让专利

申请号 : CN201810225708.5

文献号 : CN108595412B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陆永帅

申请人 : 百度在线网络技术(北京)有限公司

摘要 :

本发明提供一种纠错处理方法及装置、计算机设备及可读介质。其方法包括:接收预设环境中的用户的原始语音输入语句;根据原始语音输入语句试图进行服务召回处理;若根据原始语音输入语句无法召回到相应服务时,根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理。本发明的技术方案,可以基于纠错映射表,实现对对原始语音输入语句进行纠错处理,进而能够有效地提高服务召回率,增强用户的使用体验。且本发明中,针对每一种使用环境,均可以基于该环境下的纠错映射表实现纠错处理,使用非常灵活。

权利要求 :

1.一种纠错处理方法,其特征在于,所述方法包括:

采集预设环境中、预设的采集时间周期内或者是预设次数的所有的语音输入语句以及所述所有的语音输入语句中能够召回相应服务的至少一个正确语音输入语句,其中,所述预设环境是预设的语言环境;

从所述所有的语音输入语句中挖掘与各所述正确语音输入语句的差异度小于预设差异度阈值、和/或所述采集周期内与所述正确语音输入语句的共同出现的次数大于预设次数阈值的错误语音输入语句;

将各所述正确语音输入语句与对应的所述错误语音输入语句之间建立纠错映射关系,得到所述纠错映射表;

接收位于同一所述预设环境中的用户的原始语音输入语句;

根据所述原始语音输入语句试图进行服务召回处理;

若根据所述原始语音输入语句无法召回到相应服务时,根据所述预设环境中预先挖掘的纠错映射表,对所述预设环境中的所述原始语音输入语句进行纠错处理;

其中每一种预设的语言环境具有其各自的语言特色,针对每一种预设的语言环境,基于该种预设的语言环境下的纠错映射表进行纠错处理。

2.根据权利要求1所述的方法,其特征在于,根据所述原始语音输入语句试图进行服务召回处理,具体包括:对所述原始语音输入语句进行语音识别,得到对应的原始文字语句;

根据所述原始文字语句,从预设的服务集合中试图进行服务召回处理。

3.根据权利要求2所述的方法,其特征在于,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理,具体包括:根据所述预设环境中预先挖掘的所述纠错映射表,对所述原始语音输入语句对应的所述原始文字语句进行纠错处理,得到所述原始语音输入语句对应的目标文字语句。

4.根据权利要求3所述的方法,其特征在于,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理之后,所述方法还包括:根据所述目标文字语句,从所述服务集合中试图进行服务召回处理。

5.权利要求1所述的方法,其特征在于,接收预设环境中的用户的原始语音输入语句,具体包括:接收所述预设环境中的智能终端设备发送的所述用户的原始语音输入语句,所述用户的原始语音输入语句为所述智能终端设备采集的。

6.一种纠错处理装置,其特征在于,所述装置包括:

采集模块,用于采集预设环境中、预设的采集时间周期内或者是预设次数的所有的语音输入语句以及所述所有的语音输入语句中能够召回相应服务的至少一个正确语音输入语句,其中,所述预设环境是预设的语言环境;

挖掘模块,用于从所述所有的语音输入语句中挖掘与各所述正确语音输入语句的差异度小于预设差异度阈值、和/或所述采集周期内与所述正确语音输入语句的共同出现的次数大于预设次数阈值的错误语音输入语句;

建立模块,用于将各所述正确语音输入语句与对应的所述错误语音输入语句之间建立纠错映射关系,得到所述纠错映射表;

接收模块,用于接收位于同一所述预设环境中的用户的原始语音输入语句;

召回处理模块,用于根据所述原始语音输入语句试图进行服务召回处理;

纠错模块,用于若根据所述原始语音输入语句无法召回到相应服务时,根据所述预设环境中预先挖掘的纠错映射表,对所述预设环境中的所述原始语音输入语句进行纠错处理;

其中每一种预设的语言环境具有其各自的语言特色,针对每一种预设的语言环境,基于该种预设的语言环境下的纠错映射表进行纠错处理。

7.根据权利要求6所述的装置,其特征在于,所述召回处理模块,具体用于:对所述原始语音输入语句进行语音识别,得到对应的原始文字语句;

根据所述原始文字语句,从预设的服务集合中试图进行服务召回处理。

8.根据权利要求7所述的装置,其特征在于,所述纠错模块,具体用于根据所述预设环境中预先挖掘的所述纠错映射表,对所述原始语音输入语句对应的所述原始文字语句进行纠错处理,得到所述原始语音输入语句对应的目标文字语句。

9.根据权利要求8所述的装置,其特征在于,所述召回处理模块,还用于根据所述目标文字语句,从所述服务集合中试图进行服务召回处理。

10.权利要求6所述的装置,其特征在于,所述接收模块,具体用于接收所述预设环境中的智能终端设备发送的所述用户的原始语音输入语句,所述用户的原始语音输入语句为所述智能终端设备采集的。

11.根据权利要求6所述的装置,其特征在于,所述纠错处理装置设置在终端设备或者云端服务器中。

12.一种计算机设备,其特征在于,所述设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。

13.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。

说明书 :

纠错处理方法及装置、计算机设备及可读介质

【技术领域】

[0001] 本发明涉及计算机应用技术领域,尤其涉及一种纠错处理方法及装置、计算机设备及可读介质。【背景技术】
[0002] 随着智能终端设备相关技术的迅猛发展,用户可以直接通过语音与智能终端设备进行交互,彻底解放了用户的双手,极大地提高了用户的使用体验。例如,基于相关技术,可以研发出各种类似于儿童故事机、智能音箱等智能终端设备。
[0003] 现有的智能终端设备在工作时,可以接收用户的语音输入语句即Query语句,然后对用户的Query语句进行自动语音识别(Automatic Speech Recognition;ASR),得到识别后的文字结果。然后基于文字结果进行相应服务的召回。若召回相应服务,在向用户推送相应服务;若召回不到相应服务,则不做任何回应。现有的智能终端设备所支持的用户输入语音可以为中文或者英文或者其他语言。但对于每一种语言,仅支持一种标准的发音。例如若用户输入的语言为中文时,智能终端设备通常仅支持输入的语音为标准的中文普通话。但是实际应用中,市场上的智能终端设备可能会售卖到各个地方,使用的用户群体也非常复杂,例如可能有服务于带口音的用户,也可能服务于自带萌萌的语调的用户;有可能服务于自字正腔圆的东北的用户,也有可能服务于来自平舌翘舌部分的西南地区的用户。
[0004] 基于智能终端设备的用户群体的复杂性,智能终端设备存在接收的用户的语音输入语句的发音不标准,而且现有技术缺乏对语音输入语句的纠错,从而导致智能终端设备的服务召回率较小。【发明内容】
[0005] 本发明提供了一种纠错处理方法及装置、计算机设备及可读介质,用于提高智能终端设备的服务召回率。
[0006] 本发明提供一种纠错处理方法,所述方法包括:
[0007] 接收预设环境中的用户的原始语音输入语句;
[0008] 根据所述原始语音输入语句试图进行服务召回处理;
[0009] 若根据所述原始语音输入语句无法召回到相应服务时,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理。
[0010] 进一步可选地,如上所述的方法中,根据所述原始语音输入语句试图进行服务召回处理,具体包括:
[0011] 对所述原始语音输入语句进行语音识别,得到对应的原始文字语句;
[0012] 根据所述原始文字语句,从预设的服务集合中试图进行服务召回处理。
[0013] 进一步可选地,如上所述的方法中,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理,具体包括:
[0014] 根据所述预设环境中预先挖掘的所述纠错映射表,对所述原始语音输入语句对应的所述原始文字语句进行纠错处理,得到所述原始语音输入语句对应的目标文字语句。
[0015] 进一步可选地,如上所述的方法中,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理之后,所述方法还包括:
[0016] 根据所述目标文字语句,从所述服务集合中试图进行服务召回处理。
[0017] 进一步可选地,如上所述的方法中,接收预设环境中的用户的原始语音输入语句,具体包括:
[0018] 接收所述预设环境中的智能终端设备发送的所述用户的原始语音输入语句,所述用户的原始语音输入语句为所述智能终端设备采集的。
[0019] 进一步可选地,如上所述的方法中,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理之前,所述方法还包括:
[0020] 采集所述预设环境中、预设的采集时间周期内或者是预设次数的所有的语音输入语句以及所述所有的语音输入语句中能够召回相应服务的至少一个正确语音输入语句;
[0021] 从所述所有的语音输入语句中挖掘与各所述正确语音输入语句的差异度小于预设差异度阈值、和/或所述采集周期内与所述正确语音输入语句的共同出现的次数大于预设次数阈值的错误语音输入语句;
[0022] 将各所述正确语音输入语句与对应的所述错误语音输入语句之间建立纠错映射关系,得到所述纠错映射表。
[0023] 本发明提供一种纠错处理装置,所述装置包括:
[0024] 接收模块,用于接收预设环境中的用户的原始语音输入语句;
[0025] 召回处理模块,用于根据所述原始语音输入语句试图进行服务召回处理;
[0026] 纠错模块,用于若根据所述原始语音输入语句无法召回到相应服务时,根据所述预设环境中预先挖掘的纠错映射表,对所述原始语音输入语句进行纠错处理。
[0027] 进一步可选地,如上所述的装置中,所述召回处理模块,具体用于:
[0028] 对所述原始语音输入语句进行语音识别,得到对应的原始文字语句;
[0029] 根据所述原始文字语句,从预设的服务集合中试图进行服务召回处理。
[0030] 进一步可选地,如上所述的装置中,所述纠错模块,具体用于根据所述预设环境中预先挖掘的所述纠错映射表,对所述原始语音输入语句对应的所述原始文字语句进行纠错处理,得到所述原始语音输入语句对应的目标文字语句。
[0031] 进一步可选地,如上所述的装置中,所述召回处理模块,还用于根据所述目标文字语句,从所述服务集合中试图进行服务召回处理。
[0032] 进一步可选地,如上所述的装置中,所述接收模块,具体用于接收所述预设环境中的智能终端设备发送的所述用户的原始语音输入语句,所述用户的原始语音输入语句为所述智能终端设备采集的。
[0033] 进一步可选地,如上所述的装置中,还包括:
[0034] 采集模块,用于采集所述预设环境中、预设的采集时间周期内或者是预设次数的所有的语音输入语句以及所述所有的语音输入语句中能够召回相应服务的至少一个正确语音输入语句;
[0035] 挖掘模块,用于从所述所有的语音输入语句中挖掘与各所述正确语音输入语句的差异度小于预设差异度阈值、和/或所述采集周期内与所述正确语音输入语句的共同出现的次数大于预设次数阈值的错误语音输入语句;
[0036] 建立模块,用于将各所述正确语音输入语句与对应的所述错误语音输入语句之间建立纠错映射关系,得到所述纠错映射表。
[0037] 进一步可选地,如上所述的装置中,所述纠错处理装置设置在终端设备或者云端服务器中。
[0038] 本发明还提供一种计算机设备,所述设备包括:
[0039] 一个或多个处理器;
[0040] 存储器,用于存储一个或多个程序;
[0041] 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的纠错处理方法。
[0042] 本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的纠错处理方法。
[0043] 本发明的纠错处理方法及装置、计算机设备及可读介质,通过接收预设环境中的用户的原始语音输入语句;根据原始语音输入语句试图进行服务召回处理;若根据原始语音输入语句无法召回到相应服务时,根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理。本发明的技术方案,可以基于纠错映射表,实现对对原始语音输入语句进行纠错处理,进而能够有效地提高服务召回率,增强用户的使用体验。且本发明中,针对每一种使用环境,均可以基于该环境下的纠错映射表实现纠错处理,使用非常灵活。【附图说明】
[0044] 图1为本发明的纠错处理方法实施例一的流程图。
[0045] 图2为本发明的纠错处理方法实施例二的流程图。
[0046] 图3为本发明的纠错处理装置实施例一的结构图。
[0047] 图4为本发明的纠错处理装置实施例二的结构图。
[0048] 图5为本发明的计算机设备实施例的结构图。
[0049] 图6为本发明提供的一种计算机设备的示例图。【具体实施方式】
[0050] 为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
[0051] 图1为本发明的纠错处理方法实施例一的流程图。如图1所示,本实施例的纠错处理方法,具体可以包括如下步骤:
[0052] 100、接收预设环境中的用户的原始语音输入语句;
[0053] 101、根据原始语音输入语句试图进行服务召回处理;
[0054] 102、若根据原始语音输入语句无法召回到相应服务时,根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理。
[0055] 本实施例的纠错方法的执行主体为纠错处理装置,该纠错处理装置可以设置在智能终端设备中。即本实施例的纠错处理方法的使用场景在智能终端设备中。此时,智能终端设备可以为如智能音箱、智能儿童故事机等能够接收用户的语音Query的智能终端设备,且该智能终端设备还能够基于用户的语音Query为用户提供服务。
[0056] 或者本实施例的纠错处理装置还可以设置在与智能终端设备无线通讯连接的云端服务器中。即本实施例的纠错处理方法的使用场景在云端服务器中。此时,智能终端设备可以仅接收位于智能终端设备的使用环境中的用户的语音Query,然后向云端服务器上报采集的语音Query,由云端服务器根据该智能终端设备上报的用户的语音Query,通过该智能终端设备为用户提供服务。
[0057] 由于实际应用中,智能终端设备可以被售卖到不同的地方,在不同地方具有不同的语言环境,例如智能终端设备可能会被售卖到一家平翘舌不分的家庭中,也有可能被售卖到一家幼儿园,能够为一群说话还吐字不清的小朋友提供相应服务。对于每一种环境,都有其语言特色,本实施例为了提高该环境中的服务召回率,需要智能终端设备能够对该环境中的语音输入语句进行纠错,以根据纠错后的语音输入语句获取更多的服务召回,进而提高了服务召回率。
[0058] 例如,若本实施例的纠错处理装置位于智能终端设备中时,此时,该步骤100具体可以为智能终端设备采集预设环境中的用户的原始语音输入语句。进而由智能终端设备根据原始语音输入语句试图进行服务召回处理;然后智能终端设备判断是否召回到相应服务,若召回到,则直接向用户提供相应服务。否则若未召回到,此时智能终端设备根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理,这样后续可以基于纠错后的语音输入语句进行服务召回。
[0059] 而若本实施例的纠错处理装置位于云端服务器中时,此时,该步骤100具体可以为云端服务器接收智能终端设备采集并上报的预设环境中的用户的原始语音输入语句。由云端服务器根据原始语音输入语句试图进行服务召回处理;若根据原始语音输入语句无法召回到相应服务时,根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理。然后云端服务器判断是否召回到相应服务,若召回到,则直接向智能终端设备推送召回的服务,以供智能终端设备向用户提供相应服务。而若未召回到,此时云端服务器根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理,这样后续可以云端服务器可以基于纠错后的语音输入语句进行服务召回,并在召回后,向智能终端设备推送召回的服务,以供智能终端设备向用户提供召回的服务。
[0060] 无论在本实施例的哪种场景下,在根据原始语音输入语句无法召回到相应服务时,均需要根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理。
[0061] 其中预先挖掘的纠错映射表中可以包括该预设环境中的一些常用的纠错映射关系。例如该智能终端设备刚进入某一环境时,智能终端设备需要不断地适应该环境,接收该环境中的用户的一段采集时间周期或者一定次数的语音输入,便可以挖掘出该环境中的一些错误Quey与正确Query之间的纠错映射关系,形成纠错映射表。
[0062] 例如该某环境中的用户前后输入A和B两个Query语句,若用户输入A之后,预设时间周期内未提供相关服务,则表示用户输入的A召回。该预设时间周期可以为响应服务的最大时间周期。而若用户紧接着输入B之后,智能终端设备提供了相应的服务,且用户短时间内不再继续Query,则表示用户对于B的结果时满足的。基于上述情况,可以推断出A可能是错误的Query,B可能为正确的Query。然后基于A与B的差异度以及A与B共同出现的次数,按照A与B的差异度小于预设差异度阈值,和/或A-B这样的语句在该预设环境中出现次数大于预设次数阈值,则可以筛选出A-B是一个语音识别中的“错误-正确”的纠错配对。其中输入A与B的差异度越小,表示A和B作为纠错对的概率越大,例如用户输入带有口音的A语句之后,未召回到相应服务后,意识到A中的某些文字发音为方言,立马修改A语句为B语句输入,则召回到相应服务,此时,A和B为一对纠错对,A和B的差异度较小。另外,在采集的数据中,A和B一起出现的次数越多,则表示A和B作为纠错对的概率也越大。如A可以为该环境中的用户携带方言输入的语句,而B为该环境中用户的标准普通话输入的语句。具体地,用户经常在携带方言的输入语句A之后,未召回到相应服务时,及时将输入语句A调整为标准普通话版本的输入语句B,召回到相应服务,这种情况下,A和B便属于共同出现。也就是说,本实施例的共同出现是具有一定的场景,必须是很短的一个预设时间周期内一起出现,且有一个召回到相应服务,另一个未召回到相应服务。
[0063] 本实施例中的A和B两个语句的差异度等于A和B拼音的最小编辑距离/(A和B中长Query的拼音字数)。其中分子为A和B两个拼音字符串的编辑距离,是指利用字符操作,把字符串A转换成字符串B所需要的最少操作数。其中,字符操作包括删除一个字符、插入一个字符、修改一个字符三种操作。最小编辑距离可以使用动态规划的算法得到。分母可以表示为max(len(A的拼音),len(B的拼音)),即A、B的拼音中长度最长者的长度。
[0064] 例如,在实际场景的一个环境中,用户先说了“我要听流浪之女的故事”,智能终端设备返回“对不起,没有找到该故事”,则表示智能终端设备不召回;若用户后续又说了“我要听牛郎织女的故事”,智能终端设备返回了正确的故事,则表示设备召回。且经过分析发现:A语句“我要听流浪之女的故事”拼音为“woyaotingliulangzhinvdegushi”,B语句为“woyaotingniulangzhinvdegushi”。上述A和B的差异度经计算为1/28,如预设差异度阈值为0.2时,1/28远远低于0.2(参考值),则A是B的一个纠错,A和B为一对纠错对。若在历史数据种,A和B一起出现次数为3次,若预设阈值次数为2次,也可以验证A是B的一个纠错,A和B为一对纠错对。
[0065] 按照上述方式,可以根据预设环境中的智能终端设备刚开始使用的一段采集时间周期内的数据,或者刚开始使用一定的预设次数的数据,挖掘预设环境中的所有纠错对,形成纠错映射表。本实施例的采集时间周期可以根据实际需求来设置,如可以为1星期、1个月或者其他长度的时间周期。预设次数可以为500次,1000次或者其他次数数值,本实施例的使用一定的预设次数可以采用采集用户的语音输入语句的次数来表示。
[0066] 经过上述方式挖掘的纠错映射表中可以包括数对纠错映射关系,每一堆纠错映射关系中包括一个正确的语音输入语句和对应的一个错误的语音输入语句。而且不同的纠错映射关系中,可以包括相同的正确的语音输入语句。例如用户先后输入A、B和C语句,若A和B语句均未召回服务,而C语句召回服务,且A和B、A和C均满足差异度小于预设差异度阈值、和/或共同出现的次数大于预设次数阈值,则A和B为一对纠错映射关系、A和C也为一对纠错映射关系。这样,在根据原始语音输入语句无法召回到相应服务时,可以根据预设环境中预先挖掘的纠错映射表,判断原始输入语句是否命中纠错映射表中的某一个纠错映射关系中的错误语音输入语句,若命中,采用对应的纠错映射关系获取该错误语音输入语句对应的正确语音输入语句,以采用该正确语音输入语句对用户输入的错误的语音输入语句进行纠错。后续便可以根据该正确语音输入语句进行服务召回,从而可以有效地提高服务召回率。
[0067] 本实施例的纠错处理方法,通过接收预设环境中的用户的原始语音输入语句;根据原始语音输入语句试图进行服务召回处理;若根据原始语音输入语句无法召回到相应服务时,根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句进行纠错处理。本实施例的技术方案,可以基于纠错映射表,实现对对原始语音输入语句进行纠错处理,进而能够有效地提高服务召回率,增强用户的使用体验。且本实施例中,针对每一种使用环境,均可以基于该环境下的纠错映射表实现纠错处理,使用非常灵活。
[0068] 图2为本发明的纠错处理方法实施例二的流程图。如图2所示,本实施例的纠错处理方法,在上述实施例的技术方案的基础上,以纠错处理装置设置在云端服务器为例,来描述本发明的技术方案。本实施例的纠错处理方法,具体可以包括如下步骤:
[0069] 200、位于预设环境中的智能终端设备采集该预设环境中、预设的采集时间周期内的每一条语音输入语句,并上报云端服务器;
[0070] 201、云端服务器接收位于预设环境中的智能终端设备的所有上报,并采集预设环境中、预设的采集时间周期内的所有的语音输入语句以及所有的语音输入语句中能够召回相应服务的至少一个正确语音输入语句;
[0071] 202、云端服务器从所有的语音输入语句中挖掘与各正确语音输入语句的对应的错误语音输入语句;
[0072] 本实施例的挖掘原则可以为挖掘与各正确语音输入语句的差异度小于预设差异度阈值的错误语音输入语句、和/或采集周期内与正确语音输入语句的共同出现的次数大于预设次数阈值的错误语音输入语句,详细可以参考上述实施例的记载,在此不再赘述。
[0073] 203、云端服务器将各正确语音输入语句与对应的错误语音输入语句之间建立纠错映射关系,得到纠错映射表;
[0074] 上述步骤200-203可以理解为建立该预设环境中的纠错映射表的离线操作。后续步骤204-211便可以根据建立的纠错映射表,对未召回到相应服务的语音输入语句进行纠错,以提高服务的召回率。
[0075] 204、云端服务器接收位于预设环境中的智能终端设备采集并上报的用户的原始语音输入语句;
[0076] 205、云端服务器对原始语音输入语句进行语音识别,得到对应的原始文字语句;
[0077] 206、云端服务器根据原始文字语句,从预设的服务集合中试图进行服务召回处理;
[0078] 207、云端服务器判断是否召回到相应服务,若未召回到,执行步骤208;否则执行步骤209;
[0079] 208、云端服务器根据预设环境中预先挖掘的纠错映射表,对原始语音输入语句对应的原始文字语句进行纠错处理,得到原始语音输入语句对应的目标文字语句;执行步骤210;
[0080] 209、云端服务器根据原始文字语句,从服务集合中试图进行服务召回处理;执行步骤211;
[0081] 210、云端服务器根据目标文字语句,从服务集合中试图进行服务召回处理;执行步骤211;
[0082] 211、云端服务器召回到相应服务时,向智能终端设备推送召回的服务,以供智能终端设备为用户提供召回的服务,结束。
[0083] 本实施例的服务集合为能够提供的所有服务的集合,例如对于智能终端设备为儿童故事机时,该服务集合中可以存储有无数个儿童故事的语音数据,以便于提供儿童故事服务。例如,当小朋友通过儿童故事机请求“小马过河”时,云端服务器可以跟该服务集合,从中获取“小马过河”的音频数据,并推送给儿童故事集,以供儿童故事机向小朋友提供“小马过河”的音频服务。
[0084] 本实施例的纠错处理方法,是在云端服务器实现本发明的技术方案,详细实施过程亦可以参考上述图1所示实施例的相关记载,在此不再赘述。
[0085] 本实施例的纠错处理方法,通过采用上述技术方案,可以基于纠错映射表,实现对对原始语音输入语句进行纠错处理,进而能够有效地提高服务召回率,增强用户的使用体验。且本实施例中,针对每一种使用环境,均可以基于该环境下的纠错映射表实现纠错处理,使用非常灵活。
[0086] 图3为本发明的纠错处理装置实施例一的结构图。如图3所示,本实施例的纠错处理装置,具体可以包括:
[0087] 接收模块10用于接收预设环境中的用户的原始语音输入语句;
[0088] 召回处理模块11用于根据接收模块10接收的原始语音输入语句试图进行服务召回处理;
[0089] 纠错模块12用于若召回处理模块11根据原始语音输入语句无法召回到相应服务时,根据预设环境中预先挖掘的纠错映射表,对接收模块10接收的原始语音输入语句进行纠错处理。
[0090] 本实施例的纠错处理装置,通过采用上述模块实现纠错处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
[0091] 图4为本发明的纠错处理装置实施例二的结构图。如图4所示,本实施例的纠错处理装置,在上述图3所示实施例的技术方案的基础上,进一步更加详细地介绍本发明的技术方案。
[0092] 本实施例的纠错处理装置中,召回处理模块11具体用于:
[0093] 对原始语音输入语句进行语音识别,得到对应的原始文字语句;
[0094] 根据原始文字语句,从预设的服务集合中试图进行服务召回处理。
[0095] 进一步可选地,本实施例的纠错处理装置中,纠错模块12具体用于根据预设环境中预先挖掘的纠错映射表,对接收模块10接收的原始语音输入语句对应的原始文字语句进行纠错处理,得到原始语音输入语句对应的目标文字语句。
[0096] 进一步可选地,本实施例的纠错处理装置中,召回处理模块11还用于根据目标文字语句,从服务集合中试图进行服务召回处理。
[0097] 进一步可选地,本实施例的纠错处理装置中,接收模块10具体用于接收预设环境中的智能终端设备发送的用户的原始语音输入语句,用户的原始语音输入语句为智能终端设备采集的。
[0098] 进一步可选地,如图4所示,本实施例的纠错处理装置中,还包括:
[0099] 采集模块13用于采集预设环境中、预设的采集时间周期内或者是预设次数的所有的语音输入语句以及所有的语音输入语句中能够召回相应服务的至少一个正确语音输入语句;
[0100] 挖掘模块14用于从采集模块13采集的所有的语音输入语句中挖掘与各正确语音输入语句的差异度小于预设差异度阈值、和/或采集周期内与正确语音输入语句的共同出现的次数大于预设次数阈值的错误语音输入语句;
[0101] 建立模块15用于将挖掘模块14挖掘的各正确语音输入语句与对应的错误语音输入语句之间建立纠错映射关系,得到纠错映射表。
[0102] 对应地,纠错模块12用于若召回处理模块11根据原始语音输入语句无法召回到相应服务时,根据建立模块15建立的预设环境中预先挖掘的纠错映射表,对接收模块10接收的原始语音输入语句对应的原始文字语句进行纠错处理,得到原始语音输入语句对应的目标文字语句。
[0103] 进一步可选地,本实施例的纠错处理装置可以设置在终端设备或者云端服务器中。
[0104] 本实施例的纠错处理装置,通过采用上述模块实现纠错处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
[0105] 图5为本发明的计算机设备实施例的结构图。如图5所示,本实施例的计算机设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1-图2所示实施例的纠错处理方法。图5所示实施例中以包括多个处理器30为例。例如本实施例的计算机设备具体可以为智能终端设备,或者也可以为云端服务器设备。
[0106] 例如,图6为本发明提供的一种计算机设备的示例图。图6示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图6显示的计算机设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0107] 如图6所示,计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
[0108] 总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
[0109] 计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0110] 系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图4各实施例的功能。
[0111] 具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图4各实施例中的功能和/或方法。
[0112] 计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信,和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且,计算机设备
12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0113] 处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的纠错处理方法。
[0114] 本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的纠错处理方法。
[0115] 本实施例的计算机可读介质可以包括上述图6所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。
[0116] 随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
[0117] 本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0118] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0119] 计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0120] 可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0121] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0122] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0123] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0124] 上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0125] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。