会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 人工智能 / 语音技术 / 语音识别 / 语音识别方法及设备

语音识别方法及设备

阅读:1015发布:2020-10-09

IPRDB可以提供语音识别方法及设备专利检索,专利查询,专利分析的服务。并且本发明公开了一种语音识别方法,所述方法包括:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;在收到网络异常信息时,启动重试等待;在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。本发明还同时公开了一种语音识别设备。,下面是语音识别方法及设备专利的具体信息内容。

1.一种语音识别方法,其特征在于,所述方法包括:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;

在收到网络异常信息时,启动重试等待;

在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:循环执行所述重试等待和所述再次发送,直至所述云端服务器识别成功或者达到最大重试次数。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述网络异常信息由所述云端服务器返回,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生。

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。

6.一种语音识别设备,其特征在于,所述设备包括:音频采集模块,用于采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;

重试等待模块,用于在收到网络异常信息时,启动重试等待;

重试处理模块,用于在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。

7.根据权利要求6所述的设备,其特征在于,所述设备还包括:循环执行模块,用于循环执行所述重试等待模块和所述重试处理模块,直至所述云端服务器识别成功或者达到最大重试次数。

8.根据权利要求6所述的设备,其特征在于,所述设备还包括:异常识别模块,用于识别由所述云端服务器返回的所述网络异常信息,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生所述网络异常信息。

9.根据权利要求7所述的设备,其特征在于,所述设备还包括:数据清理模块,用于在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。

10.根据权利要求6所述的设备,其特征在于,所述设备还包括:设置模块,用于在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。

说明书全文

语音识别方法及设备

技术领域

[0001] 本发明涉及移动终端语音识别技术领域,特别涉及一种语音识别方法及设备。

背景技术

[0002] 由于移动终端的计算和存储能力相对较弱,而语音识别的计算量较大且需要较大的空间来存储语音库,故现有的语音识别方案,比如:Apple Siri、Google Now等,均是在云端进行语音识别,移动终端只负责语音指令的采集和传输。为尽量降低反应延迟,现有技术不等待用户发出全部语音指令,而是在用户刚发出语音指令的同时,便将采集到的音频流直接传输到云端服务器,由云端服务器直接对音频流进行处理和识别。采用现有技术的方案,在进行语音识别过程中需要保持终端的网络连接,但实际情况中,由于移动终端经常会随用户快速移动,时常会出现网络连接不佳的情况,比如:行车过程中、终端切换信号基站、通过隧道、超出WIFI范围和WIFI路由重启等,这都会影响语音识别的成功率。
[0003] 现有技术直接将音频流实时传输到云端服务器,一旦网络异常,移动终端本地和云端服务器均没有完整的音频数据,只能向用户汇报网络异常,如:网络掉线时报网络错误;网速慢等导致长时间收不到服务器响应时报网络超时等,由用户根据异常情况,在排除异常后重新发出语音指令来再次识别。故现有技术的语音识别失败率较高,且需要用户人工干预来重新识别,识别效率低,用户体验不佳。

发明内容

[0004] 为解决现有存在的技术问题,本发明实施例期望提供一种语音识别方法及设备,以提高云端语音识别效率,增强用户体验。
[0005] 本发明实施例的技术方案是这样实现的:
[0006] 在本发明实施例的一方面,提供了一种语音识别方法,包括:
[0007] 采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;
[0008] 在收到网络异常信息时,启动重试等待;
[0009] 在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。
[0010] 优选地,所述方法还包括:循环执行所述重试等待和所述再次发送,直至所述云端服务器识别成功或者达到最大重试次数。
[0011] 优选地,所述方法还包括:所述网络异常信息由所述云端服务器返回,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生。
[0012] 优选地,所述方法还包括:在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。
[0013] 优选地,所述方法还包括:在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。
[0014] 在本发明实施例的另一方面,还提供一种语音识别设备,包括:
[0015] 音频采集模块,用于采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;
[0016] 重试等待模块,用于在收到网络异常信息时,启动重试等待;
[0017] 重试处理模块,用于在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。
[0018] 优选地,所述设备还包括:循环执行模块,用于循环执行所述重试等待模块和所述重试处理模块,直至所述云端服务器识别成功或者达到最大重试次数。
[0019] 优选地,所述设备还包括:异常识别模块,用于识别由所述云端服务器返回的所述网络异常信息,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生所述网络异常信息。
[0020] 优选地,所述设备还包括:数据清理模块,用于在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。
[0021] 优选地,所述设备还包括:设置模块,用于在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。
[0022] 本发明实施例期望提供的语音识别方法及设备,通过本地存储数据自动进行异常后的重试处理,无需用户的干预即可反复进行重试处理,确保云端语音识别的顺利进行,可大幅提高网络连接不理想时云端语音识别的成功率,避免用户重复输入语音指令,提高了语音识别效率,提升用户体验。

附图说明

[0023] 图1为本发明的一个实施例中语音识别方法的流程示意图;
[0024] 图2为本发明的另一个实施例中语音识别设备的模块结构示意图。

具体实施方式

[0025] 为在网络连接不理想时确保云端语音识别的成功率,避免用户重复输入语音指令,如图1所示,本发明实施例提供了一种语音识别方法,包括:
[0026] S1:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;
[0027] S2:在收到网络异常信息时,启动重试等待;
[0028] S3:在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。
[0029] 其中,本发明实施例中的网络环境为数据链路、WIFI以及其它的无线网络环境,所述网络异常信息包括但不限于网络掉线时的网络错误信息、网速慢等导致长时间收不到服务器响应时的网络超时信息等。上述步骤S2中,所述网络异常信息由云端服务器返回,或在超出预定时间仍未收到云端服务器的响应时自动产生。上述步骤S3中,所述重试条件包括:排除网络异常情况和/或达到重试等待时间。
[0030] 更进一步地,本发明实施例的方法中,进行重试的步骤S2和S3重复执行,直到云端识别成功或者达到重试次数的上限。其中,最大重试次数以及每次重试等待时间的间隔可在语音识别初始化时设置或由用户动态调整。
[0031] 本发明实施例通过重试机制提高云端语音识别效率,语音指令以音频流方式直接发送到云端进行识别的同时,本地也记录完整音频流数据的至少一份拷贝,音频流数据可采用本地录音文件数据、内存数据等保存方式;为合理控制本地存储空间,在识别成功或达到最大重试次数后删除本地保存的音频流数据。最大重试次数N以及每次重试的等待时间可以预先设置。其中,各次重试等待时间可以相同,也可以分别设置为不同的值,比如:第i次重试的等待时间Ti可以逐一设置,也可以按一定变化规律(递增、递减、先增后减、先减后增等等)自动设置;所述变化规律可以采用预设函数来表示也可是随机序列。此外,最大重试次数及重试等待时间也可由用户随时更改调整。
[0032] 语音识别主要应用于用户不便用手直接操作终端设备的情况,比如驾驶期间,在将语音指令的音频流发送到云端之后,等待云端识别的结果,若云端返回识别后的操作指令,则按所述操作指令控制终端设备,本次语音识别结束。若未收到识别后的操作指令而是第i次返回网络异常信息,则启动第i次重试等待,按预设的等待时间Ti进行计时。在到达等待时间Ti时,或者网络异常情况被排除时,比如发现可用网络并建立连接后,将本地保存的音频流数据再次发送给云端服务器进行识别。若返回网络异常信息的次数i大于预设的最大重试次数N,则返回识别失败信息并结束本次语音识别。
[0033] 如图2所示,本发明实施例还同时提供了一种语音识别设备1,与云端服务器2进行交互,所述语音识别设备1包括:
[0034] 音频采集模块101,用于采集语音指令,将所述语音指令的音频流发送到云端服务器2进行识别的同时,在本地记录所述音频流数据;
[0035] 重试等待模块102,用于在收到网络异常信息时,启动重试等待;
[0036] 重试处理模块103,用于在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器2。
[0037] 在本发明优选实施例中,重试可重复多次循环执行,故所述语音识别设备1还包括:循环执行模块,用于循环执行所述重试等待模块和所述重试处理模块,直至所述云端服务器识别成功或者达到最大重试次数。
[0038] 异常信息由云端服务器返回或本地产生,所述语音识别设备1还包括:异常识别模块,用于识别由所述云端服务器返回的所述网络异常信息,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生所述网络异常信息。
[0039] 优选地,所述语音识别设备1还包括:数据清理模块,用于在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。以及,设置模块,用于在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。
[0040] 优选地,上述语音识别设备可以是移动终端本身;也可以是相对独立的功能单元,通过移动终端加载后实现终端到云端服务器的云端语音识别。
[0041] 在实际应用中,所述音频采集模块101、重试等待模块102以及重试处理模块、循环执行模块、异常识别模块、数据清理模块和设置模块均可由位于终端设备中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro Processor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)、或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。所述音频流数据记录在数据记录模块中,所述数据记录模块可由各种存储器、或存储设备等存储介质实现。
[0042] 下面介绍本发明实施例的几个典型应用场景:用户启动语音识别,优选设置最大重试次数为3,各次重试等待时间分别为10秒、20秒、30秒。在第1个示例的场景中,用户在车载环境中使用终端语音识别,车辆正处在没有移动数据信号或者移动数据信号弱的地带,用户开启语音识别发出语音命令,使用本发明实施例的方案,即使第一次识别失败,如果车辆能够在后面重试的10秒、20秒、30秒的等待时间内到达网络信号好的位置,就仍然能够成功识别语音。在第2个示例的场景中,用户终端接入WIFI进行语音识别,用户开启语音识别发出语音命令,远端路由器出现故障或者重启等问题,使用本发明实施例的方案,即使第一次识别失败,如果网络路由能够在后面重试的10秒、20秒、30秒的等待时间内恢复正常,就仍然能够成功识别语音。
[0043] 本发明实施例提供了一种语音识别方法及设备,通过本地存储数据自动进行异常后的重试处理,无需用户的干预即可反复进行重试处理,确保云端语音识别的顺利进行,可大幅提高网络连接不理想时云端语音识别的成功率,避免用户重复输入语音指令,提高了语音识别效率,提升用户体验。
[0044] 以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
高效检索全球专利

IPRDB是专利检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,专利查询、专利分析

电话:13651749426

侵权分析

IPRDB的侵权分析产品是IPRDB结合多位一线专利维权律师和专利侵权分析师的智慧,开发出来的一款特色产品,也是市面上唯一一款帮助企业研发人员、科研工作者、专利律师、专利分析师快速定位侵权分析的产品,极大的减少了用户重复工作量,提升工作效率,降低无效或侵权分析的准入门槛。

立即试用