一种音频数据采集方法、装置、设备及存储介质转让专利

申请号 : CN201811536016.9

文献号 : CN109597721B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨康康段旭恒

申请人 : 广州势必可赢网络科技有限公司

摘要 :

本发明公开了一种音频数据采集方法,该方法包括以下步骤:接收用户的音频数据采集触发指令;确定是否存储有当前采集任务的采集进度数据;如果是,则根据采集进度数据,确定当前采集任务的采集进度点;从采集进度点开始继续采集用户的音频数据,以完成当前采集任务;在采集用户的音频数据的过程中,更新采集进度数据。应用本发明实施例所提供的技术方案,针对一次采集任务,如果在采集过程中发生中断,则可以根据存储的采集进度数据,对当前采集任务进行恢复,保存完整的音频数据,不需要重新开始采集,提高了音频数据采集效率。本发明还公开了一种音频数据采集装置、设备及存储介质,具有相应技术效果。

权利要求 :

1.一种音频数据采集方法,其特征在于,包括:接收用户的音频数据采集触发指令;

确定是否存储有当前采集任务的采集进度数据;

如果是,则根据所述采集进度数据,确定所述当前采集任务的采集进度点;

从所述采集进度点开始继续采集所述用户的音频数据,以完成所述当前采集任务;

在采集所述用户的音频数据的过程中,更新所述采集进度数据;

其中,如果所述采集进度数据包含已采集的完整的音频数据的条数,则根据所述采集进度数据确定所述当前采集任务的采集进度点为已采集的最后一条完整的音频数据的结束点;

如果所述采集进度数据包含已采集的完整的音频数据的条数及已采集的不完整的音频数据的时长,则根据所述采集进度数据确定所述当前采集任务的采集进度点为已采集的不完整的音频数据的时长所在点。

2.根据权利要求1所述的方法,其特征在于,在确定存储有当前采集任务的采集进度数据时,还包括:输出采集提示信息;

如果接收到所述用户根据所述采集提示信息发送的继续采集指令,则执行所述根据所述采集进度数据,确定所述当前采集任务的采集进度点的步骤。

3.根据权利要求2所述的方法,其特征在于,还包括:如果接收到所述用户根据所述采集提示信息发送的重新采集指令,则重新开始采集所述用户的音频数据,以完成所述当前采集任务;

并在采集所述用户的音频数据的过程中,更新所述采集进度数据。

4.根据权利要求1至3之中任一项所述的方法,其特征在于,还包括:确定所述当前采集任务是否完成;

如果是,则清除所述当前采集任务的采集进度数据。

5.根据权利要求4所述的方法,其特征在于,在确定未存储有当前采集任务的采集进度数据时,还包括:采集所述用户的音频数据,以完成所述当前采集任务;

在采集所述用户的音频数据的过程中,记录所述当前采集任务的采集进度数据。

6.一种音频数据采集装置,其特征在于,包括:触发指令接收模块,用于接收用户的音频数据采集触发指令;

进度数据确定模块,用于确定是否存储有当前采集任务的采集进度数据;如果是,则触发进度点确定模块;

所述进度点确定模块,用于根据所述采集进度数据,确定所述当前采集任务的采集进度点;

音频数据采集模块,用于从所述采集进度点开始继续采集所述用户的音频数据,以完成所述当前采集任务;

进度数据更新模块,用于在采集所述用户的音频数据的过程中,更新所述采集进度数据;

其中,如果所述采集进度数据包含已采集的完整的音频数据的条数,则根据所述采集进度数据确定所述当前采集任务的采集进度点为已采集的最后一条完整的音频数据的结束点;

如果所述采集进度数据包含已采集的完整的音频数据的条数及已采集的不完整的音频数据的时长,则根据所述采集进度数据确定所述当前采集任务的采集进度点为已采集的不完整的音频数据的时长所在点。

7.根据权利要求6所述的装置,其特征在于,还包括提示信息输出模块,用于:在确定存储有当前采集任务的采集进度数据时,输出采集提示信息;

如果接收到所述用户根据所述采集提示信息发送的继续采集指令,则触发所述进度点确定模块执行所述根据所述采集进度数据,确定所述当前采集任务的采集进度点的步骤;

如果接收到所述用户根据所述采集提示信息发送的重新采集指令,则重新开始采集所述用户的音频数据,以完成所述当前采集任务;并在采集所述用户的音频数据的过程中,更新所述采集进度数据。

8.根据权利要求6或7所述的装置,其特征在于,还包括进度数据清除模块,用于:确定所述当前采集任务是否完成;

如果是,则清除所述当前采集任务的采集进度数据。

9.一种音频数据采集设备,其特征在于,包括:存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述音频数据采集方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述音频数据采集方法的步骤。

说明书 :

一种音频数据采集方法、装置、设备及存储介质

技术领域

[0001] 本发明涉及数据采集技术领域,特别是涉及一种音频数据采集方法、装置、设备及存储介质。

背景技术

[0002] 随着对信息安全的关注程度的提高,声纹识别技术逐渐发展起来。在声纹数据库的建设过程中,声纹识别模型的训练过程中,都需要采集大量的不同人的不同音频数据。
[0003] 目前,多是通过手机、平板电脑、笔记本电脑等终端进行音频数据的采集。在进行音频数据的采集时,可能需要采集每个用户的多条音频数据,如采集30条不同的音频数据。在采集过程中,如果终端系统或者应用发生故障,将会使得采集任务中断,需要从第一条开始重新采集,导致音频数据采集效率较低。

发明内容

[0004] 本发明的目的是提供一种音频数据采集方法、装置、设备及存储介质,以提高音频数据采集效率。
[0005] 为解决上述技术问题,本发明提供如下技术方案:
[0006] 一种音频数据采集方法,包括:
[0007] 接收用户的音频数据采集触发指令;
[0008] 确定是否存储有当前采集任务的采集进度数据;
[0009] 如果是,则根据所述采集进度数据,确定所述当前采集任务的采集进度点;
[0010] 从所述采集进度点开始继续采集所述用户的音频数据,以完成所述当前采集任务;
[0011] 在采集所述用户的音频数据的过程中,更新所述采集进度数据。
[0012] 在本发明的一种具体实施方式中,在确定存储有当前采集任务的采集进度数据时,还包括:
[0013] 输出采集提示信息;
[0014] 如果接收到所述用户根据所述采集提示信息发送的继续采集指令,则执行所述根据所述采集进度数据,确定所述当前采集任务的采集进度点的步骤。
[0015] 在本发明的一种具体实施方式中,还包括:
[0016] 如果接收到所述用户根据所述采集提示信息发送的重新采集指令,则重新开始采集所述用户的音频数据,以完成所述当前采集任务;
[0017] 并在采集所述用户的音频数据的过程中,更新所述采集进度数据。
[0018] 在本发明的一种具体实施方式中,还包括:
[0019] 确定所述当前采集任务是否完成;
[0020] 如果是,则清除所述当前采集任务的采集进度数据。
[0021] 在本发明的一种具体实施方式中,在确定未存储有当前采集任务的采集进度数据时,还包括:
[0022] 采集所述用户的音频数据,以完成所述当前采集任务;
[0023] 在采集所述用户的音频数据的过程中,记录所述当前采集任务的采集进度数据。
[0024] 一种音频数据采集装置,包括:
[0025] 触发指令接收模块,用于接收用户的音频数据采集触发指令;
[0026] 进度数据确定模块,用于确定是否存储有当前采集任务的采集进度数据;如果是,则触发进度点确定模块;
[0027] 所述进度点确定模块,用于根据所述采集进度数据,确定所述当前采集任务的采集进度点;
[0028] 音频数据采集模块,用于从所述采集进度点开始继续采集所述用户的音频数据,以完成所述当前采集任务;
[0029] 进度数据更新模块,用于在采集所述用户的音频数据的过程中,更新所述采集进度数据。
[0030] 在本发明的一种具体实施方式中,还包括提示信息输出模块,用于:
[0031] 在确定存储有当前采集任务的采集进度数据时,输出采集提示信息;
[0032] 如果接收到所述用户根据所述采集提示信息发送的继续采集指令,则触发所述进度点确定模块执行所述根据所述采集进度数据,确定所述当前采集任务的采集进度点的步骤;
[0033] 如果接收到所述用户根据所述采集提示信息发送的重新采集指令,则重新开始采集所述用户的音频数据,以完成所述当前采集任务;并在采集所述用户的音频数据的过程中,更新所述采集进度数据。
[0034] 在本发明的一种具体实施方式中,还包括进度数据清除模块,用于:
[0035] 确定所述当前采集任务是否完成;
[0036] 如果是,则清除所述当前采集任务的采集进度数据。
[0037] 一种音频数据采集设备,包括:
[0038] 存储器,用于存储计算机程序;
[0039] 处理器,用于执行所述计算机程序时实现上述任一项所述音频数据采集方法的步骤。
[0040] 一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述音频数据采集方法的步骤。
[0041] 应用本发明实施例所提供的技术方案,在接收到用户的音频数据采集触发指令时,可以先确定是否存储有当前采集任务的采集进度数据,如果是,则根据采集进度数据,确定当前采集任务的采集进度点,从该采集进度点开始继续采集用户的音频数据,以完成当前采集任务,并在采集用户的音频数据的过程中,更新采集进度数据。这样针对一次采集任务,如果在采集过程中发生中断,则可以根据存储的采集进度数据,对当前采集任务进行恢复,保存完整的音频数据,不需要重新开始采集,提高了音频数据采集效率。

附图说明

[0042] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043] 图1为本发明实施例中一种音频数据采集方法的实施流程图;
[0044] 图2为本发明实施例中一种音频数据采集装置的结构示意图;
[0045] 图3为本发明实施例中一种音频数据采集设备的结构示意图。

具体实施方式

[0046] 为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0047] 本发明的核心是提供一种音频数据采集方法,该方法可以应用于手机、平板电脑、台式机、笔记本电脑等终端,终端在接收到用户的音频数据采集触发指令时,如果确定存储有当前采集任务的采集进度数据,则根据采集进度数据,确定当前采集任务的采集进度点,从采集进度点开始继续采集用户的音频数据,以完成当前采集任务,并在采集用户的音频数据的过程中,更新采集进度数据。这样针对一次采集任务,如果在采集过程中发生中断,则可以根据存储的采集进度数据,对当前采集任务进行恢复,保存完整的音频数据,不需要重新开始采集,提高了音频数据采集效率。
[0048] 具体的,终端可以自动对音频数据的采集进行上述处理操作,还可以通过终端中的某一应用程序进行上述处理操作,比如通过录音应用程序进行上述处理操作。为方便描述,对本发明实施例中各步骤的说明均在终端角度进行相应描述。
[0049] 参见图1所示,为本发明实施例所提供的一种音频数据采集方法的实施流程图,该方法可以包括以下步骤:
[0050] S110:接收用户的音频数据采集触发指令。
[0051] 在实际应用中,用户可以通过终端进行音频数据的录制。当检测到用户打开录音应用程序时,可以视为接收到用户的音频数据采集触发指令,表明用户即将使用终端进行音频数据的录制,或者在检测到用户点击录制按钮时,可以视为接收到用户的音频数据采集触发指令。
[0052] 接收到用户的音频数据采集触发指令后,可以继续执行步骤S120的操作。
[0053] S120:确定是否存储有当前采集任务的采集进度数据。
[0054] 在本发明实施例中,一个采集任务可以包括对多条音频数据的采集,每条音频数据时长大于设定值,如10秒。
[0055] 在实际应用中,在采集用户的音频数据的过程中,可以记录当前采集任务的采集进度数据,存储在终端内存中。具体存储伪代码可表示为:storage.writeFile(‘process.txt’,process)。
[0056] 在接收到用户的音频数据采集触发指令后,可以先检测确定是否存储有当前采集任务的采集进度数据,如果有,则表明当前采集任务还未完成,可能因为终端故障或者应用程序故障等使得采集任务中断了,如果没有,则表明当前采集任务为一个新的采集任务,上一个采集任务可能已经完成。
[0057] 具体检测伪代码可表示为:storage.checkFile(‘process.txt’)。
[0058] S130:根据采集进度数据,确定当前采集任务的采集进度点。
[0059] 采集进度数据中可以记录当前采集任务中断时的信息。如当前采集任务为对10条音频数据的采集,每条音频数据大于10秒,采集进度数据中记录的当前采集任务中断的信息是:已采集6条完整的音频数据,或者,采集到第7条音频数据的第4秒。
[0060] 在确定存储有当前采集任务的采集进度数据时,进一步可以读取采集进度数据。具体读取伪代码可表示为:storage.readFile(‘process.txt’)。
[0061] 根据采集进度数据,确定当前采集任务的采集进度点。具体的,如果采集进度数据包含已采集的完整的音频数据的条数,则可以根据采集进度数据确定当前采集任务的采集进度点为已采集的最后一条完整的音频数据的结束点。如果采集进度数据包含已采集的完整的音频数据的条数及已采集的不完整的音频数据的时长,则可以根据采集进度数据确定当前采集任务的采集进度点为已采集的不完整的音频数据的时长所在点。
[0062] S140:从采集进度点开始继续采集用户的音频数据,以完成当前采集任务。
[0063] 根据采集进度数据,确定当前采集任务的采集进度点后,可以从采集进度点开始继续采集用户的音频数据,直至完成当前采集任务。当然,如果在采集过程中出现中断,则可以重复执行步骤S110的操作。
[0064] 举例而言,如果采集进度数据包括已采集6条完整的音频数据,第7条音频数据未被完整采集,则确定的采集进度点为第6条完整的音频数据的结束点,即从第7条音频数据开始继续采集用户的音频数据。如果采集进度数据包括已采集6条完整的音频数据,已采集到第7条音频数据的第3秒,则确定的采集进度点为第7条音频数据的第3秒,即从第7条音频数据的第3秒开始继续采集用户的音频数据。
[0065] S150:在采集用户的音频数据的过程中,更新采集进度数据。
[0066] 在采集用户的音频数据的过程中,实时更新采集进度数据,以便再次中断时,根据采集进度数据确定采集进度点,进行相应的采集操作。
[0067] 应用本发明实施例所提供的方法,在接收到用户的音频数据采集触发指令时,可以先确定是否存储有当前采集任务的采集进度数据,如果是,则根据采集进度数据,确定当前采集任务的采集进度点,从该采集进度点开始继续采集用户的音频数据,以完成当前采集任务,并在采集用户的音频数据的过程中,更新采集进度数据。这样针对一次采集任务,如果在采集过程中发生中断,则可以根据存储的采集进度数据,对当前采集任务进行恢复,保存完整的音频数据,不需要重新开始采集,提高了音频数据采集效率。
[0068] 在本发明的一个实施例中,在确定存储有当前采集任务的采集进度数据时,该方法还可以包括以下步骤:
[0069] 步骤一:输出采集提示信息;
[0070] 步骤二:如果接收到用户根据采集提示信息发送的继续采集指令,则执行步骤S130及其以下操作;
[0071] 步骤三:如果接收到用户根据采集提示信息发送的重新采集指令,则重新开始采集用户的音频数据,以完成当前采集任务,并在采集用户的音频数据的过程中,更新采集进度数据。
[0072] 为便于描述,将上述三个步骤结合起来进行说明。
[0073] 在本发明实施例中,在确定存储有当前采集任务的采集进度数据时,可以输出采集提示信息,提示用户之前的采集任务还未完成,可以恢复进度。用户根据该采集提示信息,结合自身实际情况,可以选择恢复或者不恢复。如果选择恢复则视为用户发出继续采集指令,如果选择不恢复则视为用户发出重新采集指令。
[0074] 如果接收到用户根据采集提示信息发送的继续采集指令,则可以执行根据采集进度数据,确定当前采集任务的采集进度点及其以下步骤的操作。
[0075] 如果接收到用户根据采集提示信息发送的重新采集指令,则可以重新开始当前采集任务,即重新开始采集用户的音频数据。在采集用户的音频数据的过程中,更新采集进度数据。以便再次中断时,可以根据实际情况恢复采集进度。
[0076] 在本发明的一个实施例中,该方法还可以包括以下步骤:
[0077] 第一个步骤:确定当前采集任务是否完成;如果是,则执行第二个步骤;
[0078] 第二个步骤:清除当前采集任务的采集进度数据。
[0079] 为便于描述,将上述两个步骤结合起来进行说明。
[0080] 在采集用户的音频数据的过程中,更新采集进度数据,在确定当前采集任务完成时,可以清除当前采集任务的采集进度数据。也就是说,当未存储有采集进度数据时,可以表明当前采集任务为一个新的采集任务,上一个采集任务已经完成。具体清除伪代码可表示为:storage.clearFile(‘process.txt’)。
[0081] 在确定未存储有当前采集任务的采集进度数据时,可以开始采集用户的音频数据,以完成当前采集任务,如图1所示。在采集用户的音频数据的过程中,可以记录当前采集任务的采集进度数据。以便再中断时,可以基于采集进度数据恢复采集进度。
[0082] 相应于上面的方法实施例,本发明实施例还提供了一种音频数据采集装置,下文描述的一种音频数据采集装置与上文描述的一种音频数据采集方法可相互对应参照。
[0083] 参见图2所示,该装置包括以下模块:
[0084] 触发指令接收模块210,用于接收用户的音频数据采集触发指令;
[0085] 进度数据确定模块220,用于确定是否存储有当前采集任务的采集进度数据;如果是,则触发进度点确定模块230;
[0086] 进度点确定模块230,用于根据采集进度数据,确定当前采集任务的采集进度点;
[0087] 音频数据采集模块240,用于从采集进度点开始继续采集用户的音频数据,以完成当前采集任务;
[0088] 进度数据更新模块250,用于在采集用户的音频数据的过程中,更新采集进度数据。
[0089] 应用本发明实施例所提供的装置,在接收到用户的音频数据采集触发指令时,可以先确定是否存储有当前采集任务的采集进度数据,如果是,则根据采集进度数据,确定当前采集任务的采集进度点,从该采集进度点开始继续采集用户的音频数据,以完成当前采集任务,并在采集用户的音频数据的过程中,更新采集进度数据。这样针对一次采集任务,如果在采集过程中发生中断,则可以根据存储的采集进度数据,对当前采集任务进行恢复,保存完整的音频数据,不需要重新开始采集,提高了音频数据采集效率。
[0090] 在本发明的一种具体实施方式中,还包括提示信息输出模块,用于:
[0091] 在确定存储有当前采集任务的采集进度数据时,输出采集提示信息;
[0092] 如果接收到用户根据采集提示信息发送的继续采集指令,则触发进度点确定模块230执行根据采集进度数据,确定当前采集任务的采集进度点的步骤;
[0093] 如果接收到用户根据采集提示信息发送的重新采集指令,则重新开始采集用户的音频数据,以完成当前采集任务;并在采集用户的音频数据的过程中,更新采集进度数据。
[0094] 在本发明的一种具体实施方式中,还包括进度数据清除模块,用于:
[0095] 确定当前采集任务是否完成;
[0096] 如果是,则清除当前采集任务的采集进度数据。
[0097] 在本发明的一种具体实施方式中,音频数据采集模块240,还用于:
[0098] 在确定未存储有当前采集任务的采集进度数据时,采集用户的音频数据,以完成当前采集任务;
[0099] 在采集用户的音频数据的过程中,记录当前采集任务的采集进度数据。
[0100] 相应于上面的方法实施例,本发明实施例还提供了一种音频数据采集设备,如图3所示,包括:
[0101] 存储器310,用于存储计算机程序;
[0102] 处理器320,用于执行计算机程序时实现上述音频数据采集方法的步骤。
[0103] 相应于上面的方法实施例,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述音频数据采集方法的步骤。
[0104] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
[0105] 专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0106] 结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
[0107] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。