一种基于大数据的计算机语音识别系统转让专利

申请号 : CN202110331201.X

文献号 : CN113096654B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 潘晓光张娜宋晓晨陈亮陈智娇

申请人 : 山西三友和智慧信息技术股份有限公司

摘要 :

本发明公开了一种基于大数据的计算机语音识别系统,包括关键词记录单元、个人特征记录单元、语音特征分析系统、语音特征结果生成单元、语音数据匹配系统、语音记录库系统、大数据库、关键词搜索生成系统、关键词匹配系统和计算机语音识别系统;关键词记录单元和个人特征记录单元均连接语音特征分析系统,关键词记录单元用于记录关键词语音信息;个人特征单元用于对使用者记录个人特征语音信息,语音特征分析系统用于将关键词和个人特征语音信息进行提取分析;使得本装置具有可以由使用者的个人特征预计关键词两个方面对使用的语音进行识别,大大的提高了计算机语音识别系统识别的效率以及准确性的特点。

权利要求 :

1.一种基于大数据的计算机语音识别系统,其特征在于,包括关键词记录单元、个人特征记录单元、语音特征分析系统、语音特征结果生成单元、语音数据匹配系统、语音记录库系统、大数据库、关键词搜索生成系统、关键词匹配系统和计算机语音识别系统;

关键词记录单元和个人特征记录单元均连接语音特征分析系统,关键词记录单元用于记录关键词语音信息;个人特征单元用于对使用者记录个人特征语音信息,语音特征分析系统用于将关键词和个人特征语音信息进行提取分析;语音特征分析系统连接语音特征结果生成单元,语音特征分析系统将提取分析的语音信息发送给语音特征结果生成单元;语音特征结果生成单元连接语音数据匹配系统,语音特征结果生成单元将接收的语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统;

语音数据匹配系统与语音记录库系统连接,语音记录库系统与大数据库连接;语音记录库系统用于将大数据库中的语音信息提取至语音记录库系统,再由语音记录库系统进行进一步精确提取后将精确提取的语音信息发送至语音数据匹配系统内;语音数据匹配系统用于将语音特征结果与精确提取的语音信息进行互相匹配对比,进而匹配对比出关键词;

语音数据匹配系统与关键词搜索生成系统连接,语音数据匹配系统将对比出的关键词传送给关键词搜索生成系统;关键词搜索生成系统与计算机语音识别系统连接,关键词搜索生成系统将关键词发送到计算机语音识别系统;

关键词记录单元与关键词匹配系统连接,关键词匹配系统双向连接有大数据库,关键词匹配系统用于通过关键词记录单元对关键词进行一次搜索;关键词匹配系统与关键词搜索生成系统双向连接,关键词搜索生成系统对关键词匹配系统中匹配对比出的关键词进行二次的搜索,然后将提取的语音信息发送给计算机语音识别系统。

2.根据权利要求1所述的一种基于大数据的计算机语音识别系统,其特征在于,个人特征记录单元包括性别记录单元、年龄记录单元和/或职务记录单元。

3.根据权利要求2所述的一种基于大数据的计算机语音识别系统,其特征在于,性别记录单元、年龄记录单元和职务记录单元均与语音特征分析系统连接。

4.根据权利要求1所述的一种基于大数据的计算机语音识别系统,其特征在于,还包括语音信息收集单元,关键词记录单元与个人特征单元均与语音信息收集单元连接,语音信息收集单元通过信息采集单元向外界收集各种语音信息,并将收集的各种语音信息通过筛分单元分别传输至相应的关键词记录单元以及个人特征单元。

5.根据权利要求1所述的一种基于大数据的计算机语音识别系统,其特征在于,还包括关键词类目分析单元和关键词领域分析单元;

关键词类目分析单元与关键词匹配系统连接,关键词类目分析单元用于对关键词记录单元中的关键词的类目进行分类;关键词领域分析单元与关键词匹配系统连接;关键词领域分析单元用于对关键词记录单元中的关键词的领域进行分类。

6.根据权利要求1所述的一种基于大数据的计算机语音识别系统,其特征在于,语音特征分析系统包括语音识别转换器,语音识别转换器用于提取语音信息内容特征,并将提取的语音信息内容特征发送给语音特征结果生成单元。

7.根据权利要求1所述的一种基于大数据的计算机语音识别系统,其特征在于,语音特征结果生成单元包括信息提取转换设备,信息提取转换设备用于将语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统。

8.根据权利要求1所述的一种基于大数据的计算机语音识别系统,其特征在于,语音记录库系统中设置搜索引擎,搜索引擎用于将大数据库中的语音信息提取至语音记录库系统。

说明书 :

一种基于大数据的计算机语音识别系统

技术领域

[0001] 本发明涉及计算机语音识别系统领域,具体涉及一种基于大数据的计算机语音识别系统。

背景技术

[0002] 计算机俗称电脑,是现代一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。可分为超级计算机、工业控制计算机、网络计算机、个人计算机、嵌入式计算机五类,较先进的计算机有生物计算机、光子计算机、量子计算机等。
[0003] 而计算机的系统软件System software,由一组控制计算机系统并管理其资源的程序组成,其主要功能包括:启动计算机,存储、加载和执行应用程序,对文件进行排序、检索,将程序语言翻译成机器语言等。实际上,系统软件可以看作用户与计算机的接口,它为应用软件和用户提供了控制、访问硬件的手段,这些功能主要由操作系统完成。此外,编译系统和各种工具软件也属此类,它们从另一方面辅助用户使用计算机。下面分别介绍它们的功能。随着计算机系统的发展,从而人员可以通过语言进行操作使用,这样计算机内部就会有语言识别系统。
[0004] 现有的计算机语音识别系统技术存在以下问题:现有的计算机语音识别系统在识别的时候,不能很准确的找到对应语音,使得在使用识别的时候不是很准确,同时在使用是对语音识别反应的速度较慢。

发明内容

[0005] 本发明的目的在于提供一种基于大数据的计算机语音识别系统。
[0006] 为实现上述目的,本发明提供如下技术方案:一种基于大数据的计算机语音识别系统,包括关键词记录单元、个人特征记录单元、语音特征分析系统、语音特征结果生成单元、语音数据匹配系统、语音记录库系统、大数据库、关键词搜索生成系统、关键词匹配系统和计算机语音识别系统;
[0007] 关键词记录单元和个人特征记录单元均连接语音特征分析系统,关键词记录单元用于记录关键词语音信息;个人特征单元用于对使用者记录个人特征语音信息,语音特征分析系统用于将关键词和个人特征语音信息进行提取分析;语音特征分析系统连接语音特征结果生成单元,语音特征分析系统将提取分析的语音信息发送给语音特征结果生成单元;语音特征结果生成单元连接语音数据匹配系统,语音特征结果生成单元将接收的语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统;
[0008] 语音数据匹配系统与语音记录库系统连接,语音记录库系统与大数据库连接;语音记录库系统用于将大数据库中的语音信息提取至语音记录库系统,再由语音记录库系统进行进一步精确提取后将精确提取的语音信息发送至语音数据匹配系统内;语音数据匹配系统用于将语音特征结果与精确提取的语音信息进行互相匹配对比,进而匹配对比出关键词;语音数据匹配系统与关键词搜索生成系统连接,语音数据匹配系统将对比出的关键词传送给关键词搜索生成系统;关键词搜索生成系统与计算机语音识别系统连接,关键词搜索生成系统将关键词发送到计算机语音识别系统。
[0009] 进一步的,关键词记录单元与关键词匹配系统连接,关键词匹配系统用于通过关键词记录单元对关键词进行一次搜索;关键词匹配系统与关键词搜索生成系统连接,关键词搜索生成系统对关键词匹配系统中匹配对比出的关键词进行二次搜索,然后将提取的语音信息发送给计算机语音识别系统。
[0010] 进一步的,个人特征记录单元包括性别记录单元、年龄记录单元和/或职务记录单元。
[0011] 进一步的,性别记录单元、年龄记录单元和职务记录单元均与语音特征分析系统连接。
[0012] 进一步的,还包括语音信息收集单元,关键词记录单元与个人特征单元均与语音信息收集单元连接,语音信息收集单元通过信息采集单元向外界收集各种语音信息,并将收集的各种语音信息通过筛分单元分别传输至相应的关键词记录单元以及个人特征单元。
[0013] 进一步的,还包括关键词类目分析单元和关键词领域分析单元;
[0014] 关键词类目分析单元与关键词匹配系统连接,关键词类目分析单元用于对关键词记录单元中的关键词的类目进行分类;
[0015] 关键词领域分析单元与关键词匹配系统连接;关键词领域分析单元用于对关键词记录单元中的关键词的领域进行分类。
[0016] 进一步的,语音特征分析系统包括语音识别转换器,语音识别转换器用于提取语音信息内容特征,并将提取的语音信息内容特征发送给语音特征结果生成单元。
[0017] 进一步的,语音特征结果生成单元包括信息提取转换设备,信息提取转换设备用于将语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统。
[0018] 进一步的,语音记录库系统中设置搜索引擎,搜索引擎用于将大数据库中的语音信息提取至语音记录库系统。
[0019] 本发明的技术效果如下:通过语音特征分析系统分别连接的关键词记录单元、性别记录单元、年龄记录单元以及职务记录单元可以方便的对使用者记录性别、年龄以及职务信息进行提取分析,同时通过语音特征分析系统所连接的关键词记录单元与关键词匹配系统的连接,可以方便的对使用者的关键词进行提取,进而可以方便由使用者个人情况特征以及关键词,并参照大数据进行高效的匹配搜索,以高效的提取语音信息,并发送给计算机语音识别系统。使得本装置具有可以由使用者的个人特征预计关键词两个方面对使用的语音进行识别,大大的提高了计算机语音识别系统识别的效率以及准确性的特点。

附图说明

[0020] 图1为实施例中基于大数据的计算机语音识别系统的系统图;
[0021] 图2为实施例中基于大数据的计算机语音识别系统的关键词匹配系统与大数据库之间的系统图。

具体实施方式

[0022] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023] 实施例
[0024] 如图1‑2所示,一种基于大数据的计算机语音识别系统,包括关键词记录单元、个人特征记录单元、语音特征分析系统、语音特征结果生成单元、语音数据匹配系统、语音记录库系统、大数据库、关键词搜索生成系统、关键词匹配系统和计算机语音识别系统;
[0025] 关键词记录单元和个人特征记录单元均连接语音特征分析系统,关键词记录单元用于记录关键词语音信息;个人特征单元用于对使用者记录个人特征语音信息,语音特征分析系统用于将关键词和个人特征语音信息进行提取分析;语音特征分析系统连接语音特征结果生成单元,语音特征分析系统将提取分析的语音信息发送给语音特征结果生成单元;语音特征结果生成单元连接语音数据匹配系统,语音特征结果生成单元将接收的语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统;
[0026] 语音数据匹配系统与语音记录库系统双向信号连接,语音记录库系统与大数据库双向信息连接;语音记录库系统用于将大数据库中的语音信息提取至语音记录库系统,再由语音记录库系统进行进一步精确提取后将精确提取的语音信息发送至语音数据匹配系统内;语音数据匹配系统用于将语音特征结果与精确提取的语音信息进行互相匹配对比,进而匹配对比出关键词;语音数据匹配系统与关键词搜索生成系统连接,语音数据匹配系统将对比出的关键词传送给关键词搜索生成系统;关键词搜索生成系统与计算机语音识别系统连接,关键词搜索生成系统将关键词发送到计算机语音识别系统。
[0027] 关键词记录单元与关键词匹配系统连接,关键词匹配系统双向连接有大数据库,关键词匹配系统用于通过关键词记录单元对关键词进行一次搜索;关键词匹配系统与关键词搜索生成系统双向连接,关键词搜索生成系统对关键词匹配系统中匹配对比出的关键词进行二次的搜索,然后将提取的语音信息发送给计算机语音识别系统。
[0028] 个人特征记录单元包括性别记录单元、年龄记录单元和/或职务记录单元。性别记录单元、年龄记录单元和职务记录单元均与语音特征分析系统连接。
[0029] 还包括语音信息收集单元,关键词记录单元与个人特征单元均与语音信息收集单元连接,语音信息收集单元通过各个信息采集单元向外界收集各种语音信息,并将收集的各种语音信息通过筛分单元分别传输至相应的关键词记录单元以及个人特征单元。
[0030] 具体的,关键词记录单元、性别记录单元、年龄记录单元以及职务记录单元包括筛分单元对语音信息收集单元内传递的信息进行筛分,进而可以将各种筛分的信息分别递送至各个关键词记录单元、性别记录单元、年龄记录单元以及职务记录单元用于提取关键词,记录性别、年龄以及职务信息并向语音特征分析系统发送。
[0031] 还包括关键词类目分析单元和关键词领域分析单元;关键词类目分析单元与关键词匹配系统连接,关键词类目分析单元用于高效的对关键词记录单元中的关键词的类目进行分类;关键词领域分析单元与关键词匹配系统连接;关键词领域分析单元用于高效的对关键词记录单元中的关键词的领域进行分类。
[0032] 语音特征分析系统包括语音识别转换器,语音识别转换器用于提取语音信息内容特征,并将提取的语音信息内容特征发送给语音特征结果生成单元。
[0033] 语音特征结果生成单元包括信息提取转换设备,信息提取转换设备用于将语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统。
[0034] 语音记录库系统中设置搜索引擎,搜索引擎用于将大数据库中的语音信息提取至语音记录库系统,再由语音记录库系统进行进一步精确提取后发送至语音数据匹配系统内。
[0035] 工作原理如下:在使用时,可以通过语音特征分析系统分别连接的关键词记录单元、性别记录单元、年龄记录单元以及职务记录单元可以方便的对使用者记录性别、年龄以及职务信息进行提取分析,进而语音特征分析系统将提取的语音内容特征发送给语音特征结果生成单元。语音特征结果生成单元将会把接收的语音信息内容特征转换为语音特征结果并发送给语音数据匹配系统。
[0036] 语音数据匹配系统与语音记录库系统双向信号连接,语音记录库系统与大数据库双向信息连接,用于将大数据库中的语音信息提取至语音记录库系统,再由语音记录库系统进行进一步精确提取后发送至语音数据匹配系统内。
[0037] 语音数据匹配系统用于将分别由语音特征结果生成单元内接收的语音特征结果与语音记录库系统内的精确提取的语音信息进行互相匹配对比,进而可以匹配对比出关键词,并将关键词传送给关键词搜索生成系统。
[0038] 而关键词匹配系统连接有关键词类目分析单元以及关键词领域分析单元,用于高效的对关键词记录单元中的关键词的领域以及类目进行分类,进而可以先通过关键词记录单元对关键词进行一次的搜索,然后可以通过关键词搜索生成系统对通过匹配得出的关键词进行二次的搜索,进而可以方便由使用者个人语音和语音内的情况特征以及关键词,并按照大数据进行高效的匹配搜索,以高效的提取语音信息,并发送给计算机语音识别系统。使得本装置具有可以由使用者的个人特征以及关键词两个方面对使用的语音进行识别,大大的提高了计算机语音识别系统识别的效率以及准确性的特点。
[0039] 上面仅对本发明的较佳实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化,各种变化均应包含在本发明的保护范围之内。