声纹特征的采样方法、用户识别方法、装置及电子设备转让专利

申请号 : CN202010413953.6

文献号 : CN111339517B

文献日 : 2021-08-13

本说明书实施例提供一种声纹特征的采样方法、用户识别方法、装置及电子设备。采样方法包括：在目标用户进行人机交互时，采集目标用户的声纹特征和非声纹生物特征。基于采集到的非声纹生物特征，对目标用户进行身份验证。在身份验证成功后，将采集到的声纹特征作为目标用户的参考声纹特征存储至特征库中。用户识别方法包括：获取待识别用户提供的语音数据。从待识别用户的语音数据中提取出待识别用户的声纹特征。获取特征库中留样的目标用户的参照声纹特征。将待识别用户的声纹特征与目标用户的参照声纹特征进行近似匹配，确定待识别对象是否为目标用户。

1.一种声纹特征的采样方法，包括：在目标用户进行人机交互时，无用户感知采集所述目标用户的声纹特征和非声纹生物特征；

基于采集到的非声纹生物特征，无用户感知对所述目标用户进行身份验证；

在身份验证成功后，无用户感知将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中，所述特征库中的声纹特征用于对目标用户进行基于声纹的身份识别。

2.根据权利要求1所述的方法，无用户感知将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中，包括：

无用户感知判断特征库是否预先存储有所述目标用户的其他参照声纹特征；

是，则无用户感知对采集到的声纹特征与所述特征库预先存储的所述目标用户的其他参照声纹特征进行近似匹配；以及，在近似匹配成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征无用户感知存储至特征库中。

3.根据权利要求2所述的方法，无用户感知将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中，还包括：

若所述特征库未预先存储有所述目标用户的其他参照声纹特征，则直接将所述目标用户的声纹特征作为所述目标用户的参考声纹特征无用户感知存储至特征库。

4.根据权利要求2所述的方法，无用户感知将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中，还包括：

若近似匹配失败，或者所述特征库未预先存储有所述目标用户的其他参照声纹特征，则向所述目标用户发起预设的深度身份验证，所述深度身份验证包括密码验证、答题验证、验证码验证中的至少一者；以及，在深度身份验证成功后，则将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

5.根据权利要求1‑4中任一项所述的方法，所述非声纹生物特征包括指纹特征、掌纹特征、虹膜特征、唇语特征和人脸特征中的至少一者。

6.一种基于声纹特征的用户识别方法，包括：获取待识别用户提供的语音数据；

从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时无用户感知采集到的，并基于在所述人机交互时无用户感知采集到的除声纹特征外的非声纹生物特征，无用户感知对所述目标用户进行身份验证成功后无用户感知存储至所述特征库中；

将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别用户是否为目标用户。

7.一种声纹特征的采样装置，包括：采集模块，在目标用户进行人机交互时，无用户感知采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征；

验证模块，基于采集到的非声纹生物特征，无用户感知对所述目标用户进行身份验证；

留样模块，在身份验证成功后，无用户感知将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中，所述特征库中的声纹特征用于对目标用户进行基于声纹的身份识别。

8.一种电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行：在目标用户进行人机交互时，无用户感知采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征；

基于采集到的非声纹生物特征，无用户感知对所述目标用户进行身份验证；

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：在目标用户进行人机交互时，无用户感知无用户感知采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征；

基于采集到的非声纹生物特征，无用户感知对所述目标用户进行身份验证；

10.一种基于声纹特征的用户识别装置，包括：获取模块，获取待识别用户提供的语音数据；

提取模块，从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

取样模块，获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时无用户感知采集到的，并基于在所述人机交互时无用户感知采集到的除声纹特征外的非声纹生物特征，无用户感知对所述目标用户进行身份验证成功后无用户感知存储至所述特征库中；

匹配模块，将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别用户是否为目标用户。

11.一种电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行：获取待识别用户提供的语音数据；

从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别用户是否为目标用户。

12.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：获取待识别用户提供的语音数据；

从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别用户是否为目标用户。

声纹特征的采样方法、用户识别方法、装置及电子设备

技术领域

[0001] 本文件涉及生物识别技术领域，尤其涉及一种声纹特征的采样方法、用户识别方法、装置及电子设备。

背景技术

[0002] 随着物联网、大数据、云计算、人工智能的快速发展，生物识别技术也得到了广泛应用。在对安全性提出了更高要求的大背景下，生物识别由当今单一化的指纹识别或人脸
识别会逐渐演变为多模态识别。

[0003] 目前，语音识别是其中一种比较主流的基于声音的识别方式。语音识别的原理是识别用户“说了什么”，因此需要用户配合朗读固定内容进行声音留样，显然这种方式给用
户带来的体验较差，导致用户能动性不高，限制了普及性。为此，当前亟需一种对用户更加
友好的声音识别方式，能够以更好的用户体验进行声音采样。

发明内容

[0004] 本说明书实施例目的是提供一种声纹特征的采样方法、用户识别方法、装置及电子设备，能够以更好的用户体验进行声音采样。

[0005] 为了实现上述目的，本说明书实施例是这样实现的：

[0006] 第一方面，提供一种声纹特征的采样方法，包括：

[0007] 在目标用户进行人机交互时，采集所述目标用户的声纹特征和非声纹生物特征；

[0008] 基于采集到的非声纹生物特征，对所述目标用户进行身份验证；

[0009] 在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0010] 第二方面，提供一种基于声纹特征的用户识别方法，包括：

[0011] 获取待识别用户提供的语音数据；

[0012] 从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

[0013] 获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交互时采集到的
除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储至所述特征库
中；

[0014] 将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0015] 第三方面，一种声纹特征的采样装置，包括：

[0016] 采集模块，在目标用户进行人机交互时，采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征；

[0017] 验证模块，基于采集到的非声纹生物特征，对所述目标用户进行身份验证；

[0018] 留样模块，在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0019] 第四方面，提供一种电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行：

[0020] 在目标用户进行人机交互时，采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征；

[0021] 基于采集到的非声纹生物特征，对所述目标用户进行身份验证；

[0022] 在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0023] 第五方面，提供一种算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：

[0024] 在目标用户进行人机交互时，采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征；

[0025] 基于采集到的非声纹生物特征，对所述目标用户进行身份验证；

[0026] 在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0027] 第六方面，提供一种基于声纹特征的用户识别装置，包括：

[0028] 获取模块，获取待识别用户提供的语音数据；

[0029] 提取模块，从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

[0030] 取样模块，获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交互时
采集到的除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储至所
述特征库中；

[0031] 匹配模块，将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0032] 第七方面，提供一种电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行：

[0033] 获取待识别用户提供的语音数据；

[0034] 从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

[0035] 获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交互时采集到的
除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储至所述特征库
中；

[0036] 将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0037] 第八方面，提供一种算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：

[0038] 获取待识别用户提供的语音数据；

[0039] 从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征；

[0040] 获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交互时采集到的
除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储至所述特征库
中；

[0041] 将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0042] 本说明书实施例的方案可以随时随地采集用户的声纹特征和非声纹生物特征，并通过非声纹生物特征进行身份验证，在身份验证成功后，对声纹特征进行留样以用于用户
识别。显然，整个过程中可以在用户无感知下进行，不需要用户特意配合朗读固定内容，因
此具有更好的用户体验，对多模态识别起到了推广作用。同时，“声纹识别”不同于“语音识
别”，是识别“谁在说”，而不是“说了什么”，因此在识别准确率得到了提升，实现了安全性更
可靠的识别验证。

附图说明

[0043] 为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是
本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳
动性的前提下，还可以根据这些附图获得其他的附图。

[0044] 图1为本说明书实施例提供的声纹特征的采样方法的流程示意图。

[0045] 图2为本说明书实施例提供的基于声纹特征的用户识别方法的流程示意图。

[0046] 图3为本说明书实施例提供的声纹特征的采样装置的结构示意图。

[0047] 图4为本说明书实施例提供的基于声纹特征的用户识别装置的结构示意图。

[0048] 图5为本说明书实施例提供的电子设备的结构示意图。

具体实施方式

[0049] 为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述
的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，
本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于
本说明书保护的范围。

[0050] 如前所述，在人们对安全性提出更高要求的背景下，生物识别由当今单一化的指纹识别或人脸识别会逐渐演变为多模态识别。其中，声音识别就是一种比较理想的非指纹
识别方式。目前，语音识别是主流的声音识别方式。语音识别的原理是识别用户“说了什
么”，因此需要用户配合朗读固定内容进行声音留样，显然这种方式给用户带来的体验较
差，限制了推广。为此，本文件旨在提出一种对用户更加友好的声音识别方式，能够在用户
无意识下进行声音采样。

[0051] 图1是本说明书实施例声纹特征的采样方法的流程图。图1所示的方法可以由下文相对应的装置执行，包括：

[0052] 步骤S102，在目标用户进行人机交互时，采集目标用户的声纹特征和非声纹生物特征。

[0053] 具体地，本步骤可以在目标用户开启终端设备的语音交互功能时，通过终端设备采集目标用户的声纹特征和非声纹生物特征。这里，用户开启终端设备的语音交互功能并
不一定是用于进行声音留样，比如，在用户开启交互软件进行语音聊天时，或者在用户开启
搜索引擎软件进行语音搜索时，在目标用户无意识的状态下采集目标用户的声纹特征。

[0054] 步骤S104，基于采集到的非声纹生物特征，对目标用户进行身份验证。

[0055] 应理解，本说明书实施例的可以适用于多模态识别方案，通过非声纹生物特征对目标用户进行身份验证。比如，采集用户的人脸特征，并基于用户的人脸特征进行身份验
证。

[0056] 步骤S106，在身份验证成功后，将采集到的声纹特征作为目标用户的参考声纹特征存储至特征库中。

[0057] 应理解，后续可以基于特征库对应记录的声纹特征对目标用户进行身份识别。

[0058] 本说明书实施例的采样方法可以随时随地采集用户的声纹特征和非声纹生物特征，并通过非声纹生物特征进行身份验证，在身份验证成功后，对声纹特征进行留样以后续
用于生物识别。显然，整个过程中可以在用户无感知下进行，不需要用户特意配合朗读固定
内容，因此具有更好的用户体验，对多模态识别起到了推广作用。

[0059] 下面结合实际的应用场景对本说明书实施例的方法进行示例介绍。

[0060] 本应用场景在人脸识别基础上，进一步引入基于声纹特征的生物识别，从而实现多模态化的身份验证。对应地，流程主要包括以下步骤：

[0061] 步骤A1，在目标用户与终端设备进行人机交互时，启动终端设备的麦克风和摄像头，采集目标用户的声纹特征和人脸特征（非声纹生物特征）；

[0062] 如前所述，本步骤可以利用常见的具有语音功能的APP，来获取目标用户的声纹特征。比如，在目标用户在使用即时通信APP进行语音时，可以获取目标用户输入的语音数据，
并从语音数据提取出目标用户的声纹特征。同时，还可以控制终端设备启动摄像头，拍摄目
标用户的人脸图像，并从人脸图像中提取目标用户的人脸特征。显然，本步骤的整个过程可
以在终端设备的后台进行，避免影响到目标用户对终端设备的正常使用。

[0063] 步骤A2，基于采集到的人脸特征，对目标用户进行身份验证。验证成功，则执行步骤A3，否则结束。

[0064] 应理解，本应用场景中，目标用户预先在终端设备上录入自己的参照人脸特征，因此可以将步骤一提取到的人脸特征与预先录入的参照人脸特征进行比对，确定目标用户的
身份。

[0065] 步骤A3，判断特征库是否预先存储有目标用户的其他参照声纹特征。是，则执行步骤A4，否，则执行步骤A5或者步骤A6。

[0066] 步骤A4，对采集到的声纹特征与所述特征库预先存储的所述目标用户的其他参照声纹特征进行近似匹配。若在近似匹配成功后，则执行步骤A5。否则执行步骤A6。

[0067] 步骤A5，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中，并结束流程。

[0068] 步骤A6，向目标用户发起预设的深度身份验证。若深度身份验证成功，则执行步骤A5后结束流程，否则直接结束流程。

[0069] 其中，深度身份验证包括:密码验证、答题验证、验证码验证中的至少一者。

[0070] 基于上述应用场景可以知道，本说明书实施例的方法可以在目标用户进行人机语音交互的过程中，实时采用人脸特征和声纹特征，用户可以非配合地、自然地进行多次声纹
留底，从而克服用户生硬朗读进行声纹留底的不良体验，使声纹特征可以和包含人脸特征
在内的其他识别方式一起实现多模态的用户识别，以用于提升识别性能。

[0071] 对应地，本说明书实施例还提供一种基于声纹特征的用户识别方法。图2是本说明书实施例用户识别方法的流程图。图2所示的方法可以由下文相对应的装置执行，包括：

[0072] 步骤S202，获取待识别用户提供的语音数据。

[0073] 步骤S204，从待识别用户的语音数据中提取出述待识别用户的声纹特征。

[0074] 步骤S206，获取特征库中留样的目标用户的参照声纹特征，其中，特征库中留样的参照声纹特征是在目标用户进行人机交互时采集到的，并基于在人机交互时采集到的除声
纹特征外的非声纹生物特征，对目标用户进行身份验证成功后存储至特征库中。

[0075] 步骤S208，将待识别用户的声纹特征与目标用户的参照声纹特征进行近似匹配，确定待识别对象是否为目标用户。

[0076] 应理解，近似匹配方法并不唯一，因此本说明书实施例不作具体限定。作为示例性介绍：

[0077] 本步骤可以计算待识别用户的声纹特征与目标用户的参照声纹特征之间的数据距离（例如汉明距离、欧氏距离等），当数据举例未达到预设的标准值，则表示待识别用户为
目标用户。否则，表示待识别用户不是目标用户。

[0078] 或者，也可以预先可以利用目标用户的参照声纹特征对深度学习模型进行训练，本步骤将待识别用户的声纹特征输入至训练完毕的深度学习模型，由深度学习模型给出待
识别用户是否为目标用户的识别结果。

[0079] 本说明书实施例的用户识别方法可以随时随地采集用户的声纹特征和非声纹生物特征，并通过非声纹生物特征进行身份验证，在身份验证成功后，对声纹特征进行留样以
用于用户识别。显然，整个过程中可以在用户无感知下进行，不需要用户特意配合朗读固定
内容，因此具有更好的用户体验。同时，“声纹识别”不同于“语音识别”，是识别“谁在说”，而
不是“说了什么”，因此在识别准确率得到了提升，实现了安全性更可靠的识别验证。

[0080] 以上是对本说明书实施例声纹特征的采样方法以及后续基于声纹特征的用户识别方法的介绍。应理解，在不脱离本文上述原理基础之上，还可以进行适当的变化，这些变
化也应视为本说明书实施例的保护范围。

[0081] 与上述采样方法相对应地，本说明书实施例还提供一种声纹特征的采样装置。图3是本说明书实施例采样装置300的结构图，包括：

[0082] 采集模块310，在目标用户进行人机交互时，采集所述目标用户的声纹特征和除声纹特征外的非声纹生物特征。

[0083] 验证模块320，基于采集到的非声纹生物特征，对所述目标用户进行身份验证。

[0084] 留样模块330，在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0085] 本说明书实施例的采样装置可以随时随地采集用户的声纹特征和非声纹生物特征，并通过非声纹生物特征进行身份验证，在身份验证成功后，对声纹特征进行留样以后续
用于生物识别。显然，整个过程中可以在用户无感知下进行，不需要用户特意配合朗读固定
内容，因此具有更好的用户体验，对多模态识别起到了推广作用。

[0086] 可选地，所述留样模块330在执行时，具体判断特征库是否预先存储有所述目标用户的其他参照声纹特征；是，则对采集到的声纹特征与所述特征库预先存储的所述目标用
户的其他参照声纹特征进行近似匹配；以及，在近似匹配成功后，将采集到的声纹特征作为
所述目标用户的参考声纹特征存储至特征库中。否，则直接将所述目标用户的声纹特征作
为所述目标用户的参考声纹特征存储至特征库。

[0087] 可选地，所述留样模块330在执行时，若近似匹配失败，或者所述特征库未预先存储有所述目标用户的其他参照声纹特征，则向所述目标用户发起预设的深度身份验证，所
述深度身份验证包括密码验证、答题验证、验证码验证中的至少一者；以及，在深度身份验
证成功后，则将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0088] 可选地，所述非声纹生物特征包括指纹特征、掌纹特征、虹膜特征、唇语特征和人脸特征中的至少一者。

[0089] 显然，本说明书实施例的采样装置可以作为上述图1所示的采样方法的执行主体，因此能够实现采样方法在图1所实现的功能。由于原理相同，本文不再赘述。

[0090] 与上述用户识别方法相对应地，本说明书实施例还提供一种基于声纹特征的用户识别装置。图4是本说明书实施例用户识别装置的结构图，包括：

[0091] 获取模块410，获取待识别用户提供的语音数据。

[0092] 提取模块420，从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征。

[0093] 取样模块430，获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交
互时采集到的除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储
至所述特征库中。

[0094] 匹配模块440，将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0095] 本说明书实施例的用户识别装置可以随时随地采集用户的声纹特征和非声纹生物特征，并通过非声纹生物特征进行身份验证，在身份验证成功后，对声纹特征进行留样以
用于用户识别。显然，整个过程中可以在用户无感知下进行，不需要用户特意配合朗读固定
内容，因此具有更好的用户体验。同时，“声纹识别”不同于“语音识别”，是识别“谁在说”，而
不是“说了什么”，因此在识别准确率得到了提升，实现了安全性更可靠的识别验证。

[0096] 显然，本说明书实施例的用户识别装置可以作为上述图2所示的用户识别方法的执行主体，因此能够实现该用户识别装置在图2所实现的功能。由于原理相同，本文不再赘
述。

[0097] 图5是本说明书的一个实施例电子设备的结构示意图。请参考图5，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内
存，例如高速随机存取存储器(Random‑Access Memory，RAM)，也可能还包括非易失性存储
器（non‑volatile memory），例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他
业务所需要的硬件。

[0098] 处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构）总线、PCI(Peripheral
Component Interconnect，外设部件互连标准)总线或EISA(Extended Industry Standard
Architecture，扩展工业标准结构）总线等。所述总线可以分为地址总线、数据总线、控制总
线等。为便于表示，图5中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的
总线。

[0099] 存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

[0100] 可选地，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成上述声纹特征的采样装置。处理器，执行存储器所存放的程序，并具体用
于执行以下操作：

[0101] 在目标用户进行人机交互时，采集所述目标用户的声纹特征和非声纹生物特征。

[0102] 基于采集到的非声纹生物特征，对所述目标用户进行身份验证。

[0103] 在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0104] 或者，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成上述用户识别装置。处理器，执行存储器所存放的程序，并具体用于执行以
下操作：

[0105] 获取待识别用户提供的语音数据。

[0106] 从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征。

[0107] 获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交互时采集到的
除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储至所述特征库
中。

[0108] 将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0109] 上述如本说明书图1所示实施例揭示的采样方法或者图2所示实施例揭示的用户识别方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有
信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑
电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器
（Central Processing Unit，CPU）、网络处理器（Network Processor，NP）等；还可以是数字
信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific
Integrated Circuit，ASIC）、现场可编程门阵列（Field－Programmable Gate Array，
FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或
者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器
或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可
以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行
完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写
可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存
储器中的信息，结合其硬件完成上述方法的步骤。

[0110] 应理解，本说明书实施例的电子设备可以实现上述声纹特征的采样装置在图1所示的实施例的功能，或者实现上述基于声纹特征的用户识别装置在图2所示的实施例的功
能。由于原理相同，本文不再赘述。

[0111] 当然，除了软件实现方式之外，本说明书的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个
逻辑单元，也可以是硬件或逻辑器件。

[0112] 此外，本说明书实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令。

[0113] 其中，上述指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下步骤：

[0114] 在目标用户进行人机交互时，采集所述目标用户的声纹特征和非声纹生物特征。

[0115] 基于采集到的非声纹生物特征，对所述目标用户进行身份验证。

[0116] 在身份验证成功后，将采集到的声纹特征作为所述目标用户的参考声纹特征存储至特征库中。

[0117] 或者，上述指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图2所示实施例的方法，并具体用于执行以下步骤：

[0118] 获取待识别用户提供的语音数据。

[0119] 从所述待识别用户的语音数据中提取出所述待识别用户的声纹特征。

[0120] 获取特征库中留样的目标用户的参照声纹特征，其中，所述特征库中留样的所述参照声纹特征是在目标用户进行人机交互时采集到的，并基于在所述人机交互时采集到的
除声纹特征外的非声纹生物特征，对所述目标用户进行身份验证成功后存储至所述特征库
中。

[0121] 将所述待识别用户的声纹特征与所述目标用户的参照声纹特征进行近似匹配，确定所述待识别对象是否为目标用户。

[0122] 本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施
例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质（包括但不限于磁盘存储器、CD‑ROM、光学存储器等）上实施的计算机程序产
品的形式。

[0123] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来
执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺
序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可
以的或者可能是有利的。

[0124] 以上仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、
等同替换、改进等，均应包含在本说明书的权利要求范围之内。此外，本领域普通技术人员
在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本文件的保护范围。

声纹特征的采样方法、用户识别方法、装置及电子设备转让专利

申请号 : CN202010413953.6

文献号 : CN111339517B

文献日 : 2021-08-13

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 方硕

申请人 : 支付宝(杭州)信息技术有限公司

摘要 :

权利要求 :

说明书 :

声纹特征的采样方法、用户识别方法、装置及电子设备

技术领域

背景技术

发明内容

附图说明

具体实施方式