一种播放语速调节方法及装置转让专利

申请号 : CN201811230565.3

文献号 : CN109147802B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 廖海霖李保水郑文成毛跃辉秦萍

申请人 : 珠海格力电器股份有限公司

摘要 :

本发明提供了一种播放语速调节方法及装置,其中,该方法包括:采集语音信息;提取所述语音信息的声纹信息;根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;根据确定的播放语速播放当前语音类型的语音。通过本发明,可以解决相关技术中不能根据用户的需求自动调节不同类型节目播放的速度的问题,根据用户实现设置好的不同节目类型的播放速度进行播放,实现了不同类型节目播放时自动调节播放语速,达到提高用户体验的效果。

权利要求 :

1.一种播放语速调节方法,其特征在于,包括:采集语音信息;

提取所述语音信息的声纹信息;

根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;

根据确定的播放语速播放当前语音类型的语音;

其中,在根据确定的播放语速播放当前语音类型的语音之后,所述方法还包括:接收调节播放语速的调节指令;根据所述调节指令调节播放当前语音类型的播放语速;根据调节后的播放语速播放当前语音类型的语音;

其中,所述方法还包括:通过应用绑定智能语音设备;通过所述应用创建声纹模型,并通过所述应用在所述声纹模型下创建语速表,其中,所述语速表用于设定文本内容对应的语速,且存储在服务器中,所述智能语音设备用于根据所述语速表中设定的语速进行播放。

2.根据权利要求1所述的方法,其特征在于,在采集所述语音信息之前,所述方法还包括:采集多段语音信息;

分别提取所述多段语音信息的声纹信息;

分别接收设置每段语音信息的声纹信息对应不同语音类型的播放语速的设置指令;

建立所述每段语音信息的声纹信息与不同语音类型的播放语速的对应关系。

3.根据权利要求1所述的方法,其特征在于,在根据调节后的播放语速播放当前语音类型的语音之后,所述方法还包括:接收将所述调节后的播放语速更新到数据库中的更新指令;

根据所述更新指令更新所述声纹信息与当前语音类型的播放语速的对应关系。

4.根据权利要求1所述的方法,其特征在于,在根据确定的播放语速播放当前语音类型的语音之后,所述方法还包括:接收更改所述声纹信息与不同语音类型的播放语速的对应关系的更改指令;

根据所述更改指令更改所述声纹信息与不同语音类型的播放语速的对应关系。

5.根据权利要求1所述的方法,其特征在于,所述语音类型至少包括:音乐、成人故事、儿童故事、相声、幼儿学习。

6.一种播放语速调节装置,其特征在于,包括:第一采集模块,用于采集语音信息;

提取模块,用于提取所述语音信息的声纹信息;

确定模块,用于根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;

第一播放模块,用于根据确定的播放语速播放当前语音类型的语音;

其中,所述装置还用于在根据确定的播放语速播放当前语音类型的语音之后,接收调节播放语速的调节指令;根据所述调节指令调节播放当前语音类型的播放语速;根据调节后的播放语速播放当前语音类型的语音;

其中,所述装置还用于通过应用绑定智能语音设备;通过所述应用创建声纹模型,并通过所述应用在所述声纹模型下创建语速表,其中,所述语速表用于设定文本内容对应的语速,且存储在服务器中,所述智能语音设备用于根据所述语速表中设定的语速进行播放。

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:第二采集模块,用于采集多段语音信息;

分别提取模块,用于分别提取所述多段语音信息的声纹信息;

分别接收模块,用于分别接收设置每段语音信息的声纹信息对应不同语音类型的播放语速的设置指令;

建立模块,用于建立所述每段语音信息的声纹信息与不同语音类型的播放语速的对应关系。

8.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至5任一项中所述的方法。

9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至5任一项中所述的方法。

说明书 :

一种播放语速调节方法及装置

技术领域

[0001] 本发明涉及通信领域,具体而言,涉及一种播放语速调节方法及装置。

背景技术

[0002] 语音技术已经由一门很年轻的计算机技术发展成了一门非常流行,也越来成熟的技术。
[0003] 未来的计算机的发展趋势是人工智能,让计算机能听、能说,是未来人机交互的重要发展方向,其中语音成为未来被看好的人机交互方式,而且语音比其他的交互方式有更多的优势。
[0004] 语音设备大多数是采用语音播报的方式进行语音播放,由于每个人的听觉结构及大脑结构都不尽相同,同一段相同语速的语音不同的人可能能听到的内容不尽相同,尤其语音设备现在几乎在小朋友的学习上是必不可少的好友,设想你的好友如果说话太快或太慢会怎么,太快听不清楚,太慢听起来着急,所以研究可人工调节语音语速的方法及设备非常有必要。
[0005] 现有技术中,在用户手机客户端应用程序增加语速调节控件,使得用户选择调节语速,选定语速等级,手机按照用户设定调节语速等级播放语音内容。但是上述方法也存在一下缺点:首先,语速的调节虽然分为几个等级,但是用户人手动预设,且在调节好之后,不管播放内容是什么,都是按照之前调节好的速度进行播放,如果在节目内容发生改变之后,想要改变播放速度,只能依赖于用户在播放过程中调节当前类型节目的播放速度,操作不够智能,用户体验差。
[0006] 针对相关技术中不能根据用户的需求自动调节不同类型节目播放的速度的问题,尚未提出解决方案。

发明内容

[0007] 本发明实施例提供了一种播放语速调节方法及装置,以至少解决相关技术中不能根据用户的需求自动调节不同类型节目播放的速度的问题。
[0008] 根据本发明的一个实施例,提供了一种播放语速调节方法,包括:
[0009] 采集语音信息;
[0010] 提取所述语音信息的声纹信息;
[0011] 根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;
[0012] 根据确定的播放语速播放当前语音类型的语音。
[0013] 可选地,在采集所述语音信息之前,所述方法还包括:
[0014] 采集多段语音信息;
[0015] 分别提取所述多段语音信息的声纹信息;
[0016] 分别接收设置每段语音信息的声纹信息对应不同语音类型的播放语速的设置指令;
[0017] 建立上述每段语音信息的声纹信息与不同语音类型的播放语速的对应关系。
[0018] 可选地,在根据确定的播放语速播放当前语音类型的语音之后,所述方法还包括:
[0019] 接收调节播放语速的调节指令;
[0020] 根据所述调节指令调节播放当前语音类型的播放语速;
[0021] 根据调节后的播放语速播放当前语音类型的语音。
[0022] 可选地,在根据调节后的播放语速播放当前语音类型的语音之后,所述方法还包括:
[0023] 接收将所述调节后的播放语速更新到数据库中的更新指令;
[0024] 根据所述更新指令更新所述声纹信息与当前语音类型的播放语速的对应关系。
[0025] 可选地,在根据确定的播放语速播放当前语音类型的语音之后,所述方法还包括:
[0026] 接收更改所述声纹信息与不同语音类型的播放语速的对应关系的更改指令;
[0027] 根据所述更改指令更改所述声纹信息与不同语音类型的播放语速的对应关系。
[0028] 可选地,所述语音类型至少包括:音乐、成人故事、儿童故事、相声、幼儿学习。
[0029] 根据本发明的另一个实施例,还提供了一种播放语速调节装置,包括:
[0030] 第一采集模块,用于采集语音信息;
[0031] 提取模块,用于提取所述语音信息的声纹信息;
[0032] 确定模块,用于根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;
[0033] 第一播放模块,用于根据确定的播放语速播放当前语音类型的语音。
[0034] 可选地,所述装置还包括:
[0035] 第二采集模块,用于采集多段语音信息;
[0036] 分别提取模块,用于分别提取所述多段语音信息的声纹信息;
[0037] 分别接收模块,用于分别接收设置每段语音信息的声纹信息对应不同语音类型的播放语速的设置指令;
[0038] 建立模块,用于建立上述每段语音信息的声纹信息与不同语音类型的播放语速的对应关系。
[0039] 可选地,所述装置还包括:
[0040] 第一接收模块,用于接收调节播放语速的调节指令;
[0041] 调节模块,用于根据所述调节指令调节播放当前语音类型的播放语速;
[0042] 第二播放模块,用于根据调节后的播放语速播放当前语音类型的语音。
[0043] 可选地,所述装置还包括:
[0044] 第二接收模块,用于接收将所述调节后的播放语速更新到数据库中的更新指令;
[0045] 更新模块,用于根据所述更新指令更新所述声纹信息与当前语音类型的播放语速的对应关系。
[0046] 可选地,所述装置还包括:
[0047] 第三接收模块,用于接收更改所述声纹信息与不同语音类型的播放语速的对应关系的更改指令;
[0048] 更改模块,用于根据所述更改指令更改所述声纹信息与不同语音类型的播放语速的对应关系。
[0049] 根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0050] 根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0051] 通过本发明,采集语音信息;提取所述语音信息的声纹信息;根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;根据确定的播放语速播放当前语音类型的语音,因此,可以解决相关技术中不能根据用户的需求自动调节不同类型节目播放的速度的问题,根据用户实现设置好的不同节目类型的播放速度进行播放,实现了不同类型节目播放时自动调节播放语速,达到提高用户体验的效果。

附图说明

[0052] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0053] 图1是本发明实施例的一种播放语速调节方法的移动终端的硬件结构框图;
[0054] 图2是根据本发明实施例的一种播放语速调节方法的流程图;
[0055] 图3是根据本发明实施例的播放语速调节装置的框图;
[0056] 图4是根据本发明优选实施例的播放语速调节装置的框图一;
[0057] 图5是根据本发明优选实施例的播放语速调节装置的框图二。

具体实施方式

[0058] 下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0059] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0060] 实施例1
[0061] 本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种播放语速调节方法的移动终端的硬件结构框图,如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
[0062] 存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的报文接收方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0063] 传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
[0064] 基于上述的移动终端,本实施例提供了一种播放语速调节方法,图2是根据本发明实施例的一种播放语速调节方法的流程图,如图2所示,该流程包括如下步骤:
[0065] 步骤S202,采集语音信息;
[0066] 步骤S202中的语音信息可以是用户触发启动播放器播放的语音,例如,播放音乐、播放小品等。
[0067] 步骤S204,提取所述语音信息的声纹信息;
[0068] 步骤S206,根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;
[0069] 这里查询语音数据库,还可以包括将提取的声纹信息与语音数据库中对应的该类声纹信息的范围区间进行对比,判断提取的声纹信息的数值位于哪个范围,进而确认该范围对应的预设播放速度。用户也可以根据实际需求对声纹信息的范围区间进行修改,也可以对每个范围对应的预设播放速度进行修改,以适应用户的个性化需求,提高用户体验。
[0070] 步骤S208,根据确定的播放语速播放当前语音类型的语音。
[0071] 上述步骤208中,根据得到的播放速度对语音进行调节,以达到该播放速度。这里并不对具体的语音调节的方法进行限定,只要可以将获取的语音调节到对应的播放速度进行播放即可。
[0072] 通过上述步骤S202至步骤S208,采集语音信息;提取所述语音信息的声纹信息;根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;根据确定的播放语速播放当前语音类型的语音,因此,可以解决相关技术中不能根据用户的需求自动调节不同类型节目播放的速度的问题,根据用户实现设置好的不同节目类型的播放速度进行播放,实现了不同类型节目播放时自动调节播放语速,达到提高用户体验的效果。
[0073] 本发明实施例中,用户可以预先设置对应每种声纹信息相应的播放速度,或者几种声纹信息共同确定对应的一个播放速度;这里可以在语音数据库中以对应列表的形式将上述对应关系进行存储,也可以利用映射表的形式将上述对应关系进行存储。具体地,在采集所述语音信息之前,采集多段语音信息;分别提取所述多段语音信息的声纹信息;分别接收设置每段语音信息的声纹信息对应不同语音类型的播放语速的设置指令;建立上述每段语音信息的声纹信息与不同语音类型的播放语速的对应关系。
[0074] 本发明实施例中,用户还可以根据实际情况的变化对语音数据库中保存的对应关系进行修改、删除、增加等修改,以保证设定的声纹信息相对应的播放速度为最新的,能够满足用户的实际需求。
[0075] 在一个可选的实施例中,用户可以在播放的过程中随时改变播放的速度,还可以将改变后的播放速度更新到数据库中,具体地,在根据确定的播放语速播放当前语音类型的语音之后,接收调节播放语速的调节指令;根据所述调节指令调节播放当前语音类型的播放语速;根据调节后的播放语速播放当前语音类型的语音。之后,接收将所述调节后的播放语速更新到数据库中的更新指令;根据所述更新指令更新所述声纹信息与当前语音类型的播放语速的对应关系。更新数据库中的对应关系。
[0076] 在另一个可选的实施例中,用户也可以在播放完成之后直接修改某种类型语音的播放速度,具体地,在根据确定的播放语速播放当前语音类型的语音之后,接收更改所述声纹信息与不同语音类型的播放语速的对应关系的更改指令;根据所述更改指令更改所述声纹信息与不同语音类型的播放语速的对应关系。
[0077] 本发明实施例中的语音类型至少包括:音乐、成人故事、儿童故事、相声、幼儿学习。
[0078] 本发明实施例中针对不同类型的语音(即不同类型的节目)进行播放语速调节,让耳朵听起来更舒服。根据声纹及语音信息制定对应的语速表,如表1所示,如音乐是正常,儿童故事0.9倍正常语速,当然这个0.9是可调的,用户可根据自己的听力能力自行调节语音。
[0079] 表1
[0080]
[0081] 本发明实施例提供两种调节语速的方法,另一种语音发送命令,调节语速后用户能够更加清楚地听到语音设备播放的内容,有助力于听力。根据声纹匹配语速表,根据语音类型制定及匹配语速表,实现不同类型节目自动调节语音播放速度。
[0082] 通过app绑定智能语音设备,根据app创建声纹模型,并使用app在每个声纹模型下创建语速表。在创建语速时设置一段文本内容,并使用设置该类型语音信息的语速读出来,如设置的文本是:“你好”,音乐使用的是正常,填完正常之后,可选择播放示例,app立刻采用正常语速播放该信息,你好。如果采用的是2岁~3岁的幼儿,0.6倍正常语速,则播放:你…好,这样幼儿听起来更清楚,学起来更简单。
[0083] 用户根据不同的类型设置好之后,按确定提交到服务器储存,用户保存好语速表后,就可以正常使用智能设备,智能设备根据设定的语速进行播放。
[0084] 在播放过程中,如果觉得语速过快或过慢,用户可以使用语音命令进行调整,如现在正在讲儿童故事,过快,用户可以采用语音命令:降低语速;如果想把该语速重新覆盖服务器并储存起来,需要使用语音命令:储存当前语音类型语速;同样用户也可以通过app更正语速表。
[0085] 如果出现某个声纹并不存在声纹模型或语速表,则按照该语音信息的正常语速播放。
[0086] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0087] 实施例2
[0088] 在本实施例中还提供了一种播放语速调节装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0089] 图3是根据本发明实施例的播放语速调节装置的框图,如图3所示,包括:
[0090] 第一采集模块32,用于采集语音信息;
[0091] 提取模块34,用于提取所述语音信息的声纹信息;
[0092] 确定模块36,用于根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;
[0093] 第一播放模块38,用于根据确定的播放语速播放当前语音类型的语音。
[0094] 可选地,所述装置还包括:
[0095] 第二采集模块,用于采集多段语音信息;
[0096] 分别提取模块,用于分别提取所述多段语音信息的声纹信息;
[0097] 分别接收模块,用于分别接收设置每段语音信息的声纹信息对应不同语音类型的播放语速的设置指令;
[0098] 建立模块,用于建立上述每段语音信息的声纹信息与不同语音类型的播放语速的对应关系。
[0099] 图4是根据本发明优选实施例的播放语速调节装置的框图一,如图4所示,所述装置还包括:
[0100] 第一接收模块42,用于接收调节播放语速的调节指令;
[0101] 调节模块44,用于根据所述调节指令调节播放当前语音类型的播放语速;
[0102] 第二播放模块46,用于根据调节后的播放语速播放当前语音类型的语音。
[0103] 可选地,所述装置还包括:
[0104] 第二接收模块,用于接收将所述调节后的播放语速更新到数据库中的更新指令;
[0105] 更新模块,用于根据所述更新指令更新所述声纹信息与当前语音类型的播放语速的对应关系。
[0106] 图5是根据本发明优选实施例的播放语速调节装置的框图二,如图5所示,所述装置还包括:
[0107] 第三接收模块52,用于接收更改所述声纹信息与不同语音类型的播放语速的对应关系的更改指令;
[0108] 更改模块54,用于根据所述更改指令更改所述声纹信息与不同语音类型的播放语速的对应关系。
[0109] 需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
[0110] 实施例3
[0111] 本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0112] 可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
[0113] S11,采集语音信息;
[0114] S12,提取所述语音信息的声纹信息;
[0115] S13,根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;
[0116] S14,根据确定的播放语速播放当前语音类型的语音。
[0117] 可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
[0118] 实施例4
[0119] 本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0120] 可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
[0121] 可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
[0122] S11,采集语音信息;
[0123] S12,提取所述语音信息的声纹信息;
[0124] S13,根据数据库中预先保存的声纹信息与不同语音类型的播放语速的对应关系确定所述声纹信息对应的当前语音类型的播放语速;
[0125] S14,根据确定的播放语速播放当前语音类型的语音。
[0126] 可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
[0127] 显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0128] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。