一种语音识别的方法、装置及移动终端转让专利

申请号 : CN201711038376.1

文献号 : CN107819946B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 彭思文

申请人 : 维沃移动通信有限公司

摘要 :

本发明实施例公开了一种语音识别的方法、装置及移动终端,该方法包括:获取输入的指纹数据;如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;当检测到信息输入框的输入操作时,将所述识别结果输入到所述信息输入框中。利用本发明实施例,可以通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。

权利要求 :

1.一种语音识别的方法,其特征在于,所述方法包括:获取输入的指纹数据;

如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;

存储所述识别结果;

记录所述识别结果的存储时间点;

当检测到信息输入框的输入操作指令,且当前时间点与所述存储时间点之间的时间间隔小于预定的第一时间阈值时,将所述识别结果输入到所述信息输入框中。

2.根据权利要求1所述的方法,其特征在于,所述识别结果中包括多个语音数据的识别结果,所述将所述识别结果输入到所述信息输入框中,包括:显示所述多个语音数据的识别结果;

当接收到选取结束的操作指令时,获取从所述多个语音数据的识别结果中选取的至少一个语音数据的识别结果;

将获取的至少一个语音数据的识别结果输入到所述信息输入框中。

3.根据权利要求2所述的方法,其特征在于,所述将所述识别结果输入到所述信息输入框中,包括:显示所述多个语音数据的识别结果;

当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态;

当接收到结束编辑的操作指令时,获取编辑后的识别结果;

将所述编辑后的识别结果输入到所述信息输入框中。

4.根据权利要求3所述的方法,其特征在于,所述显示所述多个语音数据的识别结果之后,所述方法还包括:如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将所述最近的存储时间点的识别结果输入到所述信息输入框中;

当接收到编辑操作指令时,将所述多个语音数据的识别结果设置为待编辑状态,包括:如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑操作指令时,将所述多个语音数据的识别结果设置为待编辑状态。

5.根据权利要求1所述的方法,其特征在于,所述获取输入的指纹数据,包括:当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。

6.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行语音识别,得到识别结果,包括:对所述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果;或者,对所述语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。

7.一种语音识别的装置,其特征在于,所述装置包括:数据获取模块,用于获取输入的指纹数据;

识别结果确定模块,用于如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;

存储模块,用于存储所述识别结果;

记录模块,用于记录所述识别结果的存储时间点;

第一输入模块,用于当检测到信息输入框的输入操作指令时,且当前时间点与所述存储时间点之间的时间间隔小于预定的第一时间阈值时,将所述识别结果输入到所述信息输入框中。

8.根据权利要求7所述的装置,其特征在于,所述识别结果中包括多个语音数据的识别结果,所述第一输入模块,包括:

显示单元,用于显示所述多个语音数据的识别结果;

选取单元,用于当接收到选取结束的操作指令时,获取从所述多个语音数据的识别结果中选取的至少一个语音数据的识别结果;

输入单元,用于将获取的至少一个语音数据的识别结果输入到所述信息输入框中。

9.根据权利要求8所述的装置,其特征在于,所述第一输入模块,包括:所述显示单元,用于显示所述多个语音数据的识别结果;

状态设置单元,用于当接收到编辑操作指令时,将所述多个语音数据的识别结果设置为待编辑状态;

编辑单元,用于当接收到结束编辑的操作指令时,获取编辑后的识别结果;

所述输入单元,用于将所述编辑后的识别结果输入到所述信息输入框中。

10.根据权利要求9所述的装置,其特征在于,所述装置还包括:第二输入模块,用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将所述最近的存储时间点的识别结果输入到所述信息输入框中;

所述状态设置单元,用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态。

11.根据权利要求7所述的装置,其特征在于,所述数据获取模块,用于当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。

12.根据权利要求7所述的装置,其特征在于,所述识别结果确定模块,用于对所述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果;或者,对所述语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。

13.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的语音识别的方法的步骤。

说明书 :

一种语音识别的方法、装置及移动终端

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种语音识别的方法、装置及移动终端。

背景技术

[0002] 随着终端技术的不断发展,通过终端进行用户之间的沟通交流成为人们之间沟通交流的重要方式,其中最常用的是通过文字和字符等进行沟通交流,在此过程中,需要用户调用终端设备中安装的文字和字符输入法,编辑相应的文字或字符发送给指定的用户。但是,用户通过输入法输入文字或字符的速度通常较慢,这样,很容易影响用户之间的沟通交流。
[0003] 语音输入凭借其速度快、效率高等优点,成为人们之间沟通交流的一种方式,然而,并不是所有的应用程序都支持用户之间发送语音数据,因此,为了提高文字或字符的输入效率,可以通过语音识别的方式将用户输入的语音数据转换为文字和字符,然后将转换后的文字和字符发送给其它用户。而且,随着语音识别算法的进步,语音识别的速度和准确率得到了进一步提升,而越来越多的文字和字符输入法增加了语音识别功能。
[0004] 尽管如此,用户在启动语音识别功能时,仍然需要经过多道程序或过程才能够完成,例如,用户需要发送信息时,需要点击信息输入框,以调出文字和字符输入法,然后,从该输入法中查找到语音识别功能,并选择语音作为输入,文字和字符作为输出,以此将语音数据识别为文字或字符,输入到信息输入框中。可见,用户需要通过多个过程才能开启语音识别功能,语音识别功能的调用路径较长,使得语音识别的处理过程较繁琐。

发明内容

[0005] 本发明实施例提供一种语音识别的方法,以解决现有技术中语音识别的处理过程较繁琐的问题。
[0006] 为解决上述技术问题,本发明实施例是这样实现的:
[0007] 第一方面,本发明实施例提供一种语音识别的方法,所述方法包括:
[0008] 获取输入的指纹数据;
[0009] 如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;
[0010] 当检测到信息输入框的输入操作时,将所述识别结果输入到所述信息输入框中。
[0011] 可选地,所述得到识别结果之后,所述方法还包括:
[0012] 存储所述识别结果;
[0013] 记录所述识别结果的存储时间点;
[0014] 所述当检测到信息输入框的输入操作时,将所述识别结果输入到所述信息输入框中,包括:
[0015] 当检测到信息输入框的输入操作,且当前时间点与所述存储时间点之间的时间间隔小于预定的第一时间阈值时,将所述识别结果输入到所述信息输入框中。
[0016] 可选地,所述识别结果中包括多个语音数据的识别结果,
[0017] 所述将所述识别结果输入到所述信息输入框中,包括:
[0018] 显示所述多个语音数据的识别结果;
[0019] 当接收到选取结束的操作指令时,获取从所述多个语音数据的识别结果中选取的至少一个语音数据的识别结果;
[0020] 将获取的至少一个语音数据的识别结果输入到所述信息输入框中。
[0021] 可选地,所述将所述识别结果输入到所述信息输入框中,包括:
[0022] 显示所述多个语音数据的识别结果;
[0023] 当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态;
[0024] 当接收到结束编辑的操作指令时,获取编辑后的识别结果;
[0025] 将所述编辑后的识别结果输入到所述信息输入框中。
[0026] 可选地,所述显示所述多个语音数据的识别结果之后,所述方法还包括:
[0027] 如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将所述最近的存储时间点的识别结果输入到所述信息输入框中;
[0028] 当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态,包括:
[0029] 如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态。
[0030] 可选地,所述获取输入的指纹数据,包括:
[0031] 当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0032] 可选地,所述对所述语音数据进行语音识别,得到识别结果,包括:
[0033] 对所述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果;或者,
[0034] 对所述语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0035] 第二方面,本发明实施例提供一种语音识别的装置,所述装置包括:
[0036] 数据获取模块,用于获取输入的指纹数据;
[0037] 识别结果确定模块,用于如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;
[0038] 第一输入模块,用于当检测到信息输入框的输入操作时,将所述识别结果输入到所述信息输入框中。
[0039] 可选地,所述装置还包括:
[0040] 存储模块,用于存储所述识别结果;
[0041] 记录模块,用于记录所述识别结果的存储时间点;
[0042] 所述第一输入模块,用于当检测到信息输入框的输入操作,且当前时间点与所述存储时间点之间的时间间隔小于预定的第一时间阈值时,将所述识别结果输入到所述信息输入框中。
[0043] 可选地,所述识别结果中包括多个语音数据的识别结果,
[0044] 所述第一输入模块,包括:
[0045] 显示单元,用于显示所述多个语音数据的识别结果;
[0046] 选取单元,用于当接收到选取结束的操作指令时,获取从所述多个语音数据的识别结果中选取的至少一个语音数据的识别结果;
[0047] 输入单元,用于将获取的至少一个语音数据的识别结果输入到所述信息输入框中。
[0048] 可选地,所述第一输入模块,包括:
[0049] 所述显示单元,用于显示所述多个语音数据的识别结果;
[0050] 状态设置单元,用于当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态;
[0051] 编辑单元,用于当接收到结束编辑的操作指令时,获取编辑后的识别结果;
[0052] 所述输入单元,用于将所述编辑后的识别结果输入到所述信息输入框中。
[0053] 可选地,所述装置还包括:
[0054] 第二输入模块,用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将所述最近的存储时间点的识别结果输入到所述信息输入框中;
[0055] 所述状态设置单元,用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态。
[0056] 可选地,所述数据获取模块,用于当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0057] 可选地,所述识别结果确定模块,用于对所述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果;或者,对所述语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0058] 第三方面,本发明实施例提供一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述实施例提供的语音识别的方法的步骤
[0059] 由以上本发明实施例提供的技术方案可见,本发明实施例通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。

附图说明

[0060] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0061] 图1为本发明一种语音识别的方法实施例;
[0062] 图2为本发明一种语音识别的显示界面示意图;
[0063] 图3为本发明另一种语音识别的方法实施例;
[0064] 图4为本发明一种选取识别结果的显示界面示意图;
[0065] 图5为本发明又一种语音识别的方法实施例;
[0066] 图6为本发明又一种语音识别的方法实施例;
[0067] 图7为本发明一种语音识别的装置实施例;
[0068] 图8为本发明一种移动终端实施例。

具体实施方式

[0069] 本发明实施例提供一种语音识别的方法、装置及移动终端。
[0070] 为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0071] 实施例一
[0072] 如图1所示,本发明实施例提供一种语音识别的方法,该方法的执行主体可以为终端设备,该终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该终端设备可以为用户使用的终端设备。该方法可以为用户快速调取语音识别功能或语音识别应用提供便利等。该方法具体可以包括以下步骤:
[0073] 在步骤S102中,获取输入的指纹数据。
[0074] 其中,指纹数据可以是通过指纹识别组件采集用户的指纹后经过分析处理得到的数据,该指纹数据可以是用户的任意手指的指纹数据,也可以是用户的多个手指的指纹数据等。
[0075] 在实施中,随着终端技术的不断发展,通过终端进行用户之间的沟通交流成为人们之间沟通交流的重要方式,其中最常用的是通过文字和字符等进行沟通交流,在此过程中,需要用户调用终端设备中安装的文字和字符输入法,并通过输入法中提供的字符按键编辑文字或字符,并将编辑完成的文字或字符输入到文本框中,输入完成后,可以点击文本框中的发送按键,终端设备可以将文本框中的文字和/或字符发送给指定的用户。但是,用户通过输入法输入文字或字符的速度通常较慢,这样,很容易影响用户之间的沟通交流。而语音输入凭借其速度快、效率高等优点,成为人们之间沟通交流的一种方式,然而,并不是所有的应用程序都支持用户之间发送语音数据,因此,为了提高文字或字符的输入效率,本发明实施例提供一种实现方式,即通过语音识别的方式将用户输入的语音数据转换为文字和字符,然后将转换后的文字和字符发送给其它用户。随着语音识别算法的进步,语音识别的速度和准确率得到了进一步提升,而越来越多的文字和字符输入法增加了语音识别功能,尽管如此,用户在启动语音识别功能时,仍然需要经过多道程序或过程才能够完成,例如,用户需要发送信息时,可以点击信息输入框,此时,终端设备调出文字和字符输入法,并从该输入法中查找到语音识别功能,然后选择语音识别功能生效,此时,终端设备开启麦克风接收语音数据,并将语音数据识别为文字或字符,输入到信息输入框中。这样,用户需要使用语音识别功能时,需要通过多个过程才能开启,使得语音识别功能的开启较繁琐(即语音识别功能的调用路径较长),为此,本发明实施例提供一种能够快速进行语音识别的技术方案,具体可以包括以下内容:
[0076] 考虑到指纹识别具有安全、快捷和高效等特点,可以使用指纹来启动语音识别功能,具体地,终端设备中可以设置有指纹设置选项,当用户需要设置通过指纹启动语音识别功能时,可以点击指纹设置选项,终端设备获取并显示指纹设置页面,用户可以在指纹设置页面选择或设置启动语音识别功能的启动策略,例如,通过一个指纹数据或多个指纹数据的组合来启动语音识别功能等,然后,用户可以将用户的一个或多个手指分别放置在终端设备的指纹识别组件上,通过指纹识别组件获取用户的一个指纹数据或多个指纹数据作为启动语音识别功能的指纹数据。设置完成后,可以点击指纹设置页面中的完成按键,终端设备可以获取指纹设置页面中用户输入的指纹数据,并存储该指纹数据。
[0077] 当用户需要启动语音识别功能时(例如,用户通过手机与好友进行语音通话的过程中,用户需要记录语音通话内容时,或者,用户需要记录某讲座或课程上老师讲述的内容时,再或者,用户当前不方便通过输入法输入字符向好友发送信息时等),用户可以根据预先设置的启动策略,将相应的手指放置在指纹识别组件上,指纹识别组件可以采集该手指的指纹数据,从而获取到输入的指纹数据。
[0078] 在步骤S104中,如果上述指纹数据为预定指纹数据,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果。
[0079] 其中,预定指纹数据可以是用于启动语音识别功能的指纹数据,预定指纹数据可以是一个手指的指纹数据,也可以是多个手指的指纹数据,预定指纹数据的设置方式可以参见上述步骤S102中的相关内容。语音数据可以用户输入的任意内容的语音数据。识别结果可以是语音数据的内容所对应的文字和/或其它字符,例如,识别结果由文字和英文字母构成,或者,识别结果由文字和数字构成等。
[0080] 在实施中,当终端设备通过上述步骤S102得到输入的指纹数据后,可以分别将该指纹数据与终端设备中预先存储的指纹数据进行对比,如果该指纹数据与预先存储的指纹数据均不相同,则可以输出提示信息,以提示用户本次输入的指纹数据有误,此时,用户可以重新输入指纹数据。如果该指纹数据与预先存储的指纹数据中的用于启动语音识别功能的预定指纹数据相同,则可以启动语音识别功能,此时,终端设备可以打开麦克风采集语音数据,并可以对采集到的语音数据,根据语音识别功能中预先设置的语音识别算法进行实时语音识别,即将采集到的语音数据转换为文字和/或其它字符,由转换后的文字和/或其它字符可以构建识别结果,从而得到语音数据的识别结果。
[0081] 此外,在对接收到的语音数据进行实时识别的过程中,终端设备还可以实时显示识别结果,以供用户预览,如图2所示,用户在与用户A进行语音通话的过程中通过指纹启动了终端设备的语音识别功能,并得到了语音数据的识别结果,显示在终端设备的显示界面的预定位置。
[0082] 需要说明的是,终端设备得到识别结果后,为了后续能够使用该识别结果,可以对该识别结果进行存储,其存储位置可以由用户预先设置,相应的,终端设备中设置有识别结果的存储位置的设置页面,当用户需要设置其存储位置时,可以打开该设置页面,可以在该设置页面中输入识别结果的存储区域或存储位置。当终端设备通过上述步骤S104的处理得到语音数据的识别结果后,可以将该识别结果存储在上述存储区域中或存储位置处。
[0083] 此外,为了提高数据的交互速度,可以将识别结果存储在内存或缓存中,这样,可以提高后续识别结果的取用。另外,还可以将识别结果存储在剪贴板中,这样,也可以提高后续识别结果的取用。
[0084] 在步骤S106中,当检测到信息输入框的输入操作时,将上述识别结果输入到该信息输入框中。
[0085] 在实施中,当用户需要向其他用户发送信息时,例如,用户需要向某即时通讯应用中的好友发送信息,此时,用户可以通过终端设备开启信息编辑页面或聊天界面等,该信息编辑页面或聊天界面中可以包括信息输入框,用户可以点击该信息输入框,此时,终端设备可以检测到信息输入框的输入操作。然后,终端设备可以获取上述步骤S104得到的识别结果,可以将该识别结果输入到该信息输入框中。此时,用户还可以对信息输入框中的识别结果做进一步的编辑,编辑完成后,可以点击信息编辑页面或聊天界面中的确定或发送按键,终端设备可以存储或发送信息输入框中的识别结果。
[0086] 本发明实施例提供一种语音识别的方法,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0087] 实施例二
[0088] 如图3所示,本发明实施例提供一种语音识别的方法,该方法的执行主体可以为终端设备,该终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该终端设备可以为用户使用的终端设备。该方法可以为用户快速调取语音识别功能或语音识别应用提供便利等。该方法具体可以包括以下步骤:
[0089] 在步骤S302中,当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0090] 其中,预设时长阈值可以根据实际情况设定,具体如2秒钟或3秒钟等。
[0091] 在实施中,考虑到终端设备中可以存在多种通过指纹进行验证或启动应用程序的设置,例如,通过指纹解锁手机屏幕或通过指纹进行支付验证等。为了区分上述指纹设置,可以采用指纹与特定操作相组合的方式来降低对其它应用程序的操作干扰。本发明实施例中可以采用指纹与连续进行指纹识别的时长来触发启动语音识别功能,具体地,用户可以在指纹设置页面中输入指纹,并设定连续进行指纹识别的预设时长阈值,例如,用户可以将食指的指纹数据通过指纹识别组件输入到指纹设置页面中,并在预设时长阈值处设置时长为2秒钟等。当用户需要启动语音识别功能时,用户可以将食指放置在指纹识别组件上,此时,终端设备可以通过指纹识别组件检测用户连续进行指纹识别的时长,如果用户保持食指放置在指纹识别组件上达到2秒钟,终端设备可以确定用户需要启动语音识别功能,此时,指纹识别组件可以采集该手指的指纹数据,从而获取到输入的指纹数据。
[0092] 需要说明的是,上述采用指纹与特定操作相组合的方式不仅可以降低对其它应用程序的操作干扰,还可以避免用户的误操作。
[0093] 在步骤S304中,如果上述指纹数据为预定指纹数据,则获取输入的语音数据,在对该语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0094] 其中,预设数值可以根据实际情况设定,具体如1个文字或字符,或2个文字或字符等。单位时间输出的识别结果的数据量具体可以是每秒钟识别出的文字或字符的数量,也可以是每隔3秒钟识别出的文字或字符的数量等。
[0095] 在实施中,如果上述指纹数据为预定指纹数据,则获取输入的语音数据,并对该语音数据进行语音识别的具体处理过程可以参见上述实施例一中步骤S104的相关内容,在此不再赘述。为了提高语音识别效率,可以设置检测语音识别结束的处理机制,即设定在预定时长内单位时间输出的识别结果的数据量的阈值(即预设数值),具体如,在连续的3秒钟内,每秒钟输出的有效识别结果的预设数值为1个文字或字符。在对该语音数据进行语音识别的过程中,终端设备可以实时检测输出的识别结果的速度,当检测到在连续的3秒钟内,每秒钟输出的有效识别结果的数据量小于1个文字或字符时,可以确定用户当前已停止语音数据的输入,此时,终端设备可以停止语音识别,并关闭语音识别功能,从而得到最终的识别结果。
[0096] 除了可以通过自动识别的方式停止语音识别处理外,还可以通过用户手动停止的方式实现,具体可以包括以下内容:对上述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果。
[0097] 其中,结束识别操作可以通过多种方式实现,例如,可以通过输入预设的指纹数据实现,或者,可以通过指纹与特定操作(如上述用户连续进行指纹识别的时长等)相组合的方式实现,再或者,可以通过指定的按键的点击操作实现等,本发明实施例对此不做限定。
[0098] 在实施中,以通过指纹与特定操作相组合的方式为例,当在上述语音数据进行语音识别的过程中,如果用户需要停止语音识别,则可以将预先设置的指纹数据对应的手指放置在指纹识别组件上,并保持一定的时长,此时,终端设备可以确定用户需要停止语音识别,则可以关闭语音识别功能,从而得到最终的识别结果。
[0099] 需要说明的是,如果由于用户的误操作,通过上述步骤S302和步骤S304的处理方式启动了语音识别功能,则终端设备可以通过屏幕显示识别结果,以供用户预览,从而使得用户知悉语音识别功能已开启,以便引导用户及时关闭语音识别功能。
[0100] 在步骤S306中,存储上述识别结果。
[0101] 上述步骤S306的具体处理过程可以参见上述步骤S104中的相关内容,在此不再赘述。
[0102] 考虑到输入的语音数据可能是多个,相应的,识别结果中也应该包括多个语音数据的识别结果,而用户选择使用的识别结果可能是其中的一个或多个识别结果,为此,本发明实施例还提供了相应的处理过程,具体可以参见下述步骤S308~步骤S316。
[0103] 在步骤S308中,记录上述识别结果的存储时间点。
[0104] 在步骤S310中,当检测到信息输入框的输入操作,且当前时间点与上述存储时间点之间的时间间隔小于预定的第一时间阈值时,显示多个语音数据的识别结果。
[0105] 其中,第一时间阈值可以根据实际情况设定,具体如20秒钟或30秒钟等。
[0106] 在实施中,为了便于数据的存储,上述步骤S306中识别结果可以存储在剪贴板中。当用户需要向其他用户发送信息时,例如,用户需要向某即时通讯应用中的好友发送信息,此时,用户可以通过终端设备开启信息编辑页面或聊天界面等,该信息编辑页面或聊天界面中可以包括信息输入框,用户可以点击该信息输入框,此时,终端设备可以检测到信息输入框的输入操作。为了提高信息的发送速度,终端设备可以首先判断是否需要将上述识别结果作为输入的信息,其判断策略可以基于当前时间点与上述存储时间点之间的时间间隔设定,即设定当前时间点与上述存储时间点之间的时间间隔的第一时间阈值,则终端设备检测到信息输入框的输入操作后,可以获取当前时间点,并将当前时间点与上述存储时间点进行比较,如果当前时间点与上述存储时间点之间的时间间隔不小于预定的第一时间阈值,则终端设备调取输入法,此时,用户可以通过输入法输入文字、数字或字母等字符。如果当前时间点与上述存储时间点之间的时间间隔小于预定的第一时间阈值,则终端设备可以确定用户需要将上述识别结果作为输入的信息,此时,如图4所示,终端设备可以打开剪贴板,显示多个语音数据的识别结果(具体如可以以下拉列表的方式显示识别结果,或者,以弹出的新页面中显示识别结果等),以供用户查看和选择。
[0107] 需要说明的是,考虑到识别结果中包括多个不同的识别结果,且多个不同的识别结果的存储时间点可能不同,因此,在计算当前时间点与上述存储时间点之间的时间间隔时,可以通过以下方式实现,当前时间点与上述存储时间点中最近存储时间点之间的时间间隔,或者,计算上述存储时间点的平均值,然后再计算当前时间点与该平均值之间的时间间隔等。
[0108] 在步骤S312中,当接收到选取结束的操作指令时,获取从多个语音数据的识别结果中选取的至少一个语音数据的识别结果。
[0109] 其中,选取结束的操作指令可以通过多种方式实现,例如通过点击指定按键触发选取结束的操作指令,或通过其它任意预设操作触发选取结束的操作指令等,本发明实施例对此不做限定。
[0110] 在实施中,如图4所示,终端设备显示多个语音数据的识别结果后,用户可以从中查找需要使用的识别结果,并选择相应的识别结果(如图4中用户选择了识别结果1),选择完成后,可以点击显示识别结果的页面中设置的确定按键,此时,终端设备可以生成选取结束的操作指令,并从显示识别结果的页面中获取用户选取的至少一个语音数据的识别结果。
[0111] 在步骤S314中,将获取的至少一个语音数据的识别结果输入到上述信息输入框中。
[0112] 需要说明的是,上述步骤S310~步骤S314的处理是通过用户选取的方式向信息输入框中输入相应的识别结果的,在实际应用中,为了简化处理流程,还可以通过以下方式完成向信息输入框中输入相应的识别结果的处理,具体可以包括以下内容:当检测到信息输入框的输入操作,且当前时间点与上述存储时间点之间的时间间隔小于预定的第一时间阈值时,将上述识别结果输入到信息输入框中。
[0113] 此外,考虑到识别结果中包括多个不同的识别结果,而且,多个不同的识别结果的总体数据量可能较大,因此,在向信息输入框中输入相应的识别结果时,可以将最近存储时间点的识别结果输入到信息输入框中。
[0114] 在步骤S316中,存储或发送信息输入框中的识别结果。
[0115] 本发明实施例提供一种语音识别的方法,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0116] 此外,本发明实施例优化了语音识别功能的触发速度、并行性及关闭的智能性,实现了识别结果的快速调用,提升了多条识别结果进一步编辑和复用的可能性,有效拓展了文字或字符输入方式及语音识别的使用场景和效率。
[0117] 实施例三
[0118] 如图5所示,本发明实施例提供一种语音识别的方法,该方法的执行主体可以为终端设备,该终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该终端设备可以为用户使用的终端设备。该方法可以为用户快速调取语音识别功能或语音识别应用提供便利等。该方法具体可以包括以下步骤:
[0119] 在步骤S502中,当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0120] 在步骤S504中,如果上述指纹数据为预定指纹数据,则获取输入的语音数据,在对该语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0121] 除了可以通过自动识别的方式停止语音识别处理外,还可以通过用户手动停止的方式实现,具体可以包括以下内容:对上述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果。
[0122] 在步骤S506中,存储上述识别结果。
[0123] 上述步骤S502~步骤S506的步骤内容分别与上述实施例二中的步骤S302~步骤S306的步骤内容相同,步骤S502~步骤S506的具体处理过程可以分别参见上述步骤S302~步骤S306的相关内容,在此不再赘述。
[0124] 考虑到输入的语音数据可能是多个,相应的,识别结果中也应该包括多个语音数据的识别结果,而用户选择使用的识别结果可能是其中的一个或多个识别结果,而且,用户可能还需要对选择的识别结果进行删除、排序或修改等编辑操作,为此,本发明实施例还提供了相应的处理过程,具体可以参见下述步骤S508~步骤S518。
[0125] 在步骤S508中,记录上述识别结果的存储时间点。
[0126] 在步骤S510中,当检测到信息输入框的输入操作,且当前时间点与上述存储时间点之间的时间间隔小于预定的第一时间阈值时,显示多个语音数据的识别结果。
[0127] 上述步骤S508~步骤S510的步骤内容分别与上述实施例二中的步骤S308~步骤S310的步骤内容相同,步骤S508~步骤S510的具体处理过程可以分别参见上述步骤S308~步骤S310的相关内容,在此不再赘述。
[0128] 在步骤S512中,当接收到编辑指令时,将上述多个语音数据的识别结果设置为待编辑状态。
[0129] 在实施中,显示多个语音数据的识别结果的页面中可以包括多个操作按键,例如,在图4中增加编辑按键,则显示多个语音数据的识别结果的页面中可以包括编辑按键、取消按键和确定按键等,其中,编辑按键可以引导用户对识别结果进行编辑操作。如果用户查看到显示的识别结果相对于用户想要编写的信息不能完全匹配,则可以点击编辑按键,此时,终端设备可以将多个语音数据的识别结果设置到编辑页面中,相应的,多个语音数据的识别结果设置为待编辑状态。
[0130] 在步骤S514中,当接收到结束编辑的操作指令时,获取编辑后的识别结果。
[0131] 其中,结束编辑的操作指令可以通过多种方式实现,例如通过点击指定按键触发结束编辑的操作指令,或通过其它任意预设操作触发结束编辑的操作指令等,本发明实施例对此不做限定。
[0132] 在实施中,用户可以对编辑页面中的多个语音数据的识别结果进行删除、修改和排序中的任意一种或多种操作,最终可以将多个语音数据的识别结果编辑成用户想要编写的信息,编辑完成后,可以点击编辑页面中的确定按键,此时,终端设备可以生成结束编辑的操作指令,执行结束编辑的操作指令,以获取编辑页面中用户编辑完成的识别结果(即编辑后的识别结果)。
[0133] 在步骤S516中,将上述编辑后的识别结果输入到信息输入框中。
[0134] 在步骤S518中,存储或发送信息输入框中的识别结果。
[0135] 本发明实施例提供一种语音识别的方法,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0136] 此外,本发明实施例优化了语音识别功能的触发速度、并行性及关闭的智能性,实现了识别结果的快速调用,提升了多条识别结果进一步编辑和复用的可能性,有效拓展了文字或字符输入方式及语音识别的使用场景和效率。
[0137] 实施例四
[0138] 如图6所示,本发明实施例提供一种语音识别的方法,该方法的执行主体可以为终端设备,该终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该终端设备可以为用户使用的终端设备。该方法可以为用户快速调取语音识别功能或语音识别应用提供便利等。该方法具体可以包括以下步骤:
[0139] 在步骤S602中,当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0140] 在步骤S604中,如果上述指纹数据为预定指纹数据,则获取输入的语音数据,在对该语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0141] 除了可以通过自动识别的方式停止语音识别处理外,还可以通过用户手动停止的方式实现,具体可以包括以下内容:对上述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果。
[0142] 在步骤S606中,存储上述识别结果。
[0143] 上述步骤S602~步骤S606的步骤内容分别与上述实施例二中的步骤S302~步骤S306的步骤内容相同,步骤S602~步骤S606的具体处理过程可以分别参见上述步骤S302~步骤S306的相关内容,在此不再赘述。
[0144] 考虑到输入的语音数据可能是多个,相应的,识别结果中也应该包括多个语音数据的识别结果,而用户选择使用的识别结果可能是其中的一个或多个识别结果,而且,用户可能最希望使用最近存储时间点的识别结果,或者,用户可能还需要对识别结果进行删除、排序或修改等编辑操作,为此,本发明实施例还提供了相应的处理过程,具体可以参见下述步骤S608~步骤S620。
[0145] 在步骤S608中,记录上述识别结果的存储时间点。
[0146] 在步骤S610中,当检测到信息输入框的输入操作,且当前时间点与上述存储时间点之间的时间间隔小于预定的第一时间阈值时,显示多个语音数据的识别结果。
[0147] 上述步骤S608~步骤S610的步骤内容分别与上述实施例二中的步骤S308~步骤S310的步骤内容相同,步骤S608~步骤S610的具体处理过程可以分别参见上述步骤S308~步骤S310的相关内容,在此不再赘述。
[0148] 考虑到如果用户刚刚完成语音识别处理后,就执行了信息输入操作,此时,用户可能最希望使用最近存储时间点的识别结果,因此,可以设置相应的策略,以使得可以在编辑识别结果前判断用户是否希望使用最近存储时间点的识别结果,如果否,则可以执行下述步骤S612~步骤S616的处理,如果是,则可以执行下述步骤S618的处理。
[0149] 在步骤S612中,如果当前时间点与上述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑指令时,将多个语音数据的识别结果设置为待编辑状态。
[0150] 其中,第二时间阈值可以根据实际情况设定,具体如10秒钟或8秒钟等。而且,第一时间阈值大于第二时间阈值,具体如,第一时间阈值为20秒钟,第二时间阈值为10秒钟等。
[0151] 在步骤S614中,当接收到结束编辑的操作指令时,获取编辑后的识别结果。
[0152] 在步骤S616中,将上述编辑后的识别结果输入到信息输入框中。
[0153] 上述步骤S612~步骤S616的步骤内容分别与上述实施例三中的步骤S512~步骤S516的步骤内容相同,步骤S612~步骤S616的具体处理过程可以分别参见上述步骤S512~步骤S516的相关内容,在此不再赘述。
[0154] 在步骤S618中,如果当前时间点与上述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将最近的存储时间点的识别结果输入到信息输入框中。
[0155] 在实施中,例如,多个语音数据的识别结果中共包括3个语音数据的识别结果,分别为识别结果1、识别结果2和识别结果3,其中,识别结果1的存储时间点为10:32:20,识别结果2的存储时间点为10:31:50,识别结果3的存储时间点为10:31:10,第一时间阈值为20秒钟,第二时间阈值为10秒钟,当前时间点为10:32:28,则可以确定最近的存储时间点为10:32:20,当前时间点10:32:28与最近的存储时间点10:32:20之间的时间间隔8秒钟小于预定的第二时间阈值10秒钟,因此,可以将存储时间点为10:32:20的识别结果1直接输入到信息输入框中。
[0156] 需要说明的是,输入到信息输入框中的识别结果,用户仍然可以对其内容进行编辑。
[0157] 在步骤S620中,存储或发送信息输入框中的识别结果。
[0158] 此外,如果剪贴板中的识别结果中包括如手机号、邮箱、链接、账号等信息时,用户还可以对其进行快速拨号、发送短消息、打开浏览器等一系列快捷操作。
[0159] 本发明实施例提供一种语音识别的方法,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0160] 此外,本发明实施例优化了语音识别功能的触发速度、并行性及关闭的智能性,实现了识别结果的快速调用,提升了多条识别结果进一步编辑和复用的可能性,有效拓展了文字或字符输入方式及语音识别的使用场景和效率。
[0161] 实施例五
[0162] 以上为本发明实施例提供的语音识别的方法,基于同样的思路,本发明实施例还提供一种语音识别的装置,如图7所示。
[0163] 所述语音识别的装置包括:数据获取模块701、识别结果确定模块702和第一输入模块703,其中:
[0164] 数据获取模块701,用于获取输入的指纹数据;
[0165] 识别结果确定模块702,用于如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;
[0166] 第一输入模块703,用于当检测到信息输入框的输入操作时,将所述识别结果输入到所述信息输入框中。
[0167] 本发明实施例中,所述装置还包括:
[0168] 存储模块,用于存储所述识别结果;
[0169] 记录模块,用于记录所述识别结果的存储时间点;
[0170] 所述第一输入模块703,用于当检测到信息输入框的输入操作,且当前时间点与所述存储时间点之间的时间间隔小于预定的第一时间阈值时,将所述识别结果输入到所述信息输入框中。
[0171] 本发明实施例中,所述识别结果中包括多个语音数据的识别结果,[0172] 所述第一输入模块703,包括:
[0173] 显示单元,用于显示所述多个语音数据的识别结果;
[0174] 选取单元,用于当接收到选取结束的操作指令时,获取从所述多个语音数据的识别结果中选取的至少一个语音数据的识别结果;
[0175] 输入单元,用于将获取的至少一个语音数据的识别结果输入到所述信息输入框中。
[0176] 本发明实施例中,所述第一输入模块703,包括:
[0177] 所述显示单元,用于显示所述多个语音数据的识别结果;
[0178] 状态设置单元,用于当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态;
[0179] 编辑单元,用于当接收到结束编辑的操作指令时,获取编辑后的识别结果;
[0180] 所述输入单元,用于将所述编辑后的识别结果输入到所述信息输入框中。
[0181] 本发明实施例中,所述装置还包括:
[0182] 第二输入模块,用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将所述最近的存储时间点的识别结果输入到所述信息输入框中;
[0183] 所述状态设置单元,用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态。
[0184] 本发明实施例中,所述装置还包括:
[0185] 处理模块,用于存储或发送所述信息输入框中的识别结果。
[0186] 本发明实施例中,所述数据获取模块701,用于当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0187] 本发明实施例中,所述识别结果确定模块702,用于对所述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果;或者,对所述语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0188] 本发明实施例提供的语音识别的装置能够实现图1至图6的方法实施例中终端设备实现的各个过程,为避免重复,这里不再赘述。
[0189] 本发明实施例提供一种语音识别的装置,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0190] 此外,本发明实施例优化了语音识别功能的触发速度、并行性及关闭的智能性,实现了识别结果的快速调用,提升了多条识别结果进一步编辑和复用的可能性,有效拓展了文字或字符输入方式及语音识别的使用场景和效率。
[0191] 实施例六
[0192] 图8为实现本发明各个实施例的一种移动终端的硬件结构示意图。
[0193] 该移动终端800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、处理器810、以及电源811等部件。本领域技术人员可以理解,图8中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
[0194] 其中,处理器810,用于获取输入的指纹数据;
[0195] 处理器810,还用于如果所述指纹数据为预定指纹数据,则获取输入的语音数据,并对所述语音数据进行语音识别,得到识别结果;
[0196] 输入单元804,用于当检测到信息输入框的输入操作时,将所述识别结果输入到所述信息输入框中。
[0197] 此外,存储器809,用于存储所述识别结果;
[0198] 处理器810,还用于记录所述识别结果的存储时间点;
[0199] 输入单元804,还用于当检测到信息输入框的输入操作,且当前时间点与所述存储时间点之间的时间间隔小于预定的第一时间阈值时,将所述识别结果输入到所述信息输入框中。
[0200] 另外,所述识别结果中包括多个语音数据的识别结果,
[0201] 输入单元804,用于显示所述多个语音数据的识别结果;当接收到选取结束的操作指令时,获取从所述多个语音数据的识别结果中选取的至少一个语音数据的识别结果;将获取的至少一个语音数据的识别结果输入到所述信息输入框中。
[0202] 此外,输入单元804,用于显示所述多个语音数据的识别结果;当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态;当接收到结束编辑的操作指令时,获取编辑后的识别结果;将所述编辑后的识别结果输入到所述信息输入框中。
[0203] 另外,输入单元804,还用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔小于预定的第二时间阈值,则将所述最近的存储时间点的识别结果输入到所述信息输入框中;
[0204] 输入单元804,还用于如果当前时间点与所述多个语音数据的识别结果中最近的存储时间点之间的时间间隔不小于预定的第二时间阈值,则当接收到编辑指令时,将所述多个语音数据的识别结果设置为待编辑状态。
[0205] 另外,处理器810,还用于存储或发送所述信息输入框中的识别结果。
[0206] 此外,处理器810,还用于当检测到用户连续进行指纹识别的时长达到预设时长阈值时,获取输入的指纹数据。
[0207] 另外,处理器810,还用于对所述语音数据进行语音识别的过程中,当检测到预定的结束识别操作时,停止获取语音数据,得到识别结果;或者,对所述语音数据进行语音识别的过程中,当预定时长内单位时间输出的识别结果的数据量小于预设数值时,停止获取语音数据,得到识别结果。
[0208] 本发明实施例提供一种移动终端,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0209] 此外,本发明实施例优化了语音识别功能的触发速度、并行性及关闭的智能性,实现了识别结果的快速调用,提升了多条识别结果进一步编辑和复用的可能性,有效拓展了文字或字符输入方式及语音识别的使用场景和效率。
[0210] 应理解的是,本发明实施例中,射频单元801可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器810处理;另外,将上行的数据发送给基站。通常,射频单元801包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元801还可以通过无线通信系统与网络和其他设备通信。
[0211] 移动终端通过网络模块802为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
[0212] 音频输出单元803可以将射频单元801或网络模块802接收的或者在存储器809中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元803还可以提供与移动终端800执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元803包括扬声器、蜂鸣器以及受话器等。
[0213] 输入单元804用于接收音频或视频信号。输入单元804可以包括图形处理器(Graphics Processing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元806上。经图形处理器8041处理后的图像帧可以存储在存储器809(或其它存储介质)中或者经由射频单元801或网络模块802进行发送。麦克风8042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元801发送到移动通信基站的格式输出。
[0214] 移动终端800还包括至少一种传感器805,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板8061的亮度,接近传感器可在移动终端800移动到耳边时,关闭显示面板8061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器805还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
[0215] 显示单元806用于显示由用户输入的信息或提供给用户的信息。显示单元806可包括显示面板8061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板8061。
[0216] 用户输入单元807可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板8071上或在触控面板8071附近的操作)。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器810,接收处理器810发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8071。除了触控面板8071,用户输入单元807还可以包括其他输入设备8072。具体地,其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
[0217] 进一步的,触控面板8071可覆盖在显示面板8061上,当触控面板8071检测到在其上或附近的触摸操作后,传送给处理器810以确定触摸事件的类型,随后处理器810根据触摸事件的类型在显示面板8061上提供相应的视觉输出。虽然在图8中,触控面板8071与显示面板8061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板8071与显示面板8061集成而实现移动终端的输入和输出功能,具体此处不做限定。
[0218] 接口单元808为外部装置与移动终端800连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元808可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端800内的一个或多个元件或者可以用于在移动终端800和外部装置之间传输数据。
[0219] 存储器809可用于存储软件程序以及各种数据。存储器809可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器809可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0220] 处理器810是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器809内的软件程序和/或模块,以及调用存储在存储器809内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器810可包括一个或多个处理单元;优选的,处理器810可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
[0221] 移动终端800还可以包括给各个部件供电的电源811(比如电池),优选的,电源811可以通过电源管理系统与处理器810逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0222] 优选的,本发明实施例还提供一种移动终端,包括处理器810,存储器809,存储在存储器809上并可在所述处理器810上运行的计算机程序,该计算机程序被处理器810执行时实现上述语音识别的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0223] 实施例七
[0224] 本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述语音识别的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
[0225] 本发明实施例提供一种计算机可读存储介质,通过获取输入的指纹数据,并且判定该指纹数据是否为预定指纹数据,如果是,则获取输入的语音数据,并对该语音数据进行语音识别,得到识别结果,进而在检测到信息输入框的输入操作时,将该识别结果输入到信息输入框中,这样,通过指纹来触发启动语音识别功能,并通过语音识别功能对语音数据进行识别,得到相应的识别结果并存储,以备后续使用,从而用户可以快速准确地启动语音识别功能,从而大大缩短了语音识别功能的调用路径,简化了语音识别的处理过程。
[0226] 此外,本发明实施例优化了语音识别功能的触发速度、并行性及关闭的智能性,实现了识别结果的快速调用,提升了多条识别结果进一步编辑和复用的可能性,有效拓展了文字或字符输入方式及语音识别的使用场景和效率。
[0227] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0228] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0229] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0230] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0231] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0232] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0233] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0234] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0235] 本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0236] 以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。