会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学 / 一种目标语音信号的干扰信号生成方法及装置

一种目标语音信号干扰信号生成方法及装置

申请号 CN202210011028.X 申请日 2022-01-05 公开(公告)号 CN114337908B 公开(公告)日 2024-04-12
申请人 中国科学院声学研究所; 发明人 李军锋; 程龙彪; 姚鼎鼎; 顾建军; 颜永红;
摘要 本 申请 公开了一种目标语音 信号 的 干扰信号 生成方法及装置,方法包括:获取待干扰的目标 语音信号 ;对目标语音信号进行分 帧 处理,获得至少一个语音帧;对其中的每个语音帧进行处理,包括对其进行第一处理、第二处理和/或第三处理,获得频域包络反转信号、时域反转信号和/或时域包络反转信号;根据频域包络反转信号、时域反转信号和/或时域包络反转信号以及与其分别对应的预设权重系数,确定目标语音信号的干扰信号。本申请通过构造三种与目标语音信号相关的频域包络反转信号、时域反转信号、时域包络反转信号,并根据构造的三种信号以及与其对应的预设权重系数,获得目标语音信号的干扰信号进一步提高了干扰信号对目标语音信号的干扰作用。
权利要求

1.一种目标语音信号干扰信号生成方法,其特征在于,包括:
获取待干扰的目标语音信号
对所述目标语音信号进行分处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;
对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:
对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;
对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;
根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号;
其中,所述对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号,包括:
对所述至少一个语音帧中的每个语音帧进行傅里叶变换,获得所述至少一个语音帧中的每个语音帧的频谱
根据所述至少一个语音帧中的每个语音帧的频谱,确定所述每个语音帧的频谱包络;
根据所述每个语音帧的频谱包络,确定与其对应的第一精细结构;
根据所述每个语音帧的频谱包络,确定所述每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线,N为大于或等于1的整数;
根据所述每个语音帧的频谱包络、所述每个语音帧的频谱包络各自的N次多项式或指数函数拟合曲线以及所述第一精细结构,确定所述频域包络反转信号;
所述对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号,包括:
对所述至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号;
根据所述各个频带对应的部分目标语音信号,确定其时域包络;
根据所述各个频带对应的部分目标语音信号的时域包络,确定与其对应的第二精细结构;
根据所述各个频带对应的部分目标语音信号的时域包络和所述第二精细结构,确定时域包络反转信号。
2.根据权利要求1所述的方法,其特征在于,所述对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号,包括:
对所述至少一个语音帧中的每个语音帧进行时域反转,获得时域反转信号。
3.根据权利要求1所述的方法,其特征在于,所述根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号,包括:
根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号;
根据所述目标语音信号和所述加权信号,确定所述目标语音信号的干扰信号。
4.根据权利要求3所述的方法,其特征在于,所述根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号,包括:
将所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号与其分别对应的预设权重系数相乘,获得至少一个相乘结果;
将所述至少一个相乘结果累加,获得加权信号。
5.根据权利要求3所述的方法,其特征在于,所述根据所述目标语音信号和所述加权信号,确定所述目标语音信号的干扰信号,包括:
对所述加权信号进行低通滤波,获得低通干扰信号;
将任意频带对应的部分低通干扰信号替换为所述任意频带对应的部分目标语音信号,获得所述目标语音信号的干扰信号。
6.一种目标语音信号的干扰信号生成装置,其特征在于,包括:
收发单元,用于获取待干扰的目标语音信号;
处理单元,用于对所述目标语音信号进行分帧处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;
所述处理单元,用于对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:
对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;
对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;
所述处理单元,用于根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号;
其中,所述处理单元具体用于对所述至少一个语音帧中的每个语音帧进行傅里叶变换,获得所述至少一个语音帧中的每个语音帧的频谱;根据所述至少一个语音帧中的每个语音帧的频谱,确定所述每个语音帧的频谱包络;根据所述每个语音帧的频谱包络,确定与其对应的第一精细结构;根据所述每个语音帧的频谱包络,确定所述每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线,N为大于或等于1的整数;根据所述每个语音帧的频谱包络、所述每个语音帧的频谱包络各自的N次多项式或指数函数拟合曲线以及所述第一精细结构,确定所述频域包络反转信号;
所述处理单元具体用于对所述至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号;根据所述各个频带对应的部分目标语音信号,确定其时域包络;根据所述各个频带对应的部分目标语音信号的时域包络,确定与其对应的第二精细结构;根据所述各个频带对应的部分目标语音信号的时域包络和所述第二精细结构,确定时域包络反转信号。
7.一种目标语音信号的干扰信号生成装置,其特征在于,包括至少一个处理器,所述处理器用于执行存储器中存储的程序,当所述程序被执行时,使得所述装置执行:
如权利要求1‑5任一项所述的方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑5任一所述的方法。

说明书全文

一种目标语音信号干扰信号生成方法及装置

技术领域

[0001] 本发明涉及语音信号处理技术领域。尤其涉及一种目标语音信号的干扰信号生成方法及装置。

背景技术

[0002] 随着移动互联网飞速发展,我们身边的可录音设备在种类和数量上都呈现出了爆炸式增长。无处不在的可录音设备在为我们带来便利的同时,也使语音隐私泄露问题日渐严重,给国家安全和人民生活带来威胁。
[0003] 语音隐私保护技术的主要目标就是降低可录音设备拾取的用户语音信号的可懂度。早期的研究都集中在如何使用物理隔离的方式来保护语音隐私。近年来,主动对潜在窃听设备进行干扰的技术得到了更为广泛的关注。语音可懂度在干扰条件下受到的掩蔽效应分为两大类,能量掩蔽和信息掩蔽。能量掩蔽主要手段主要是利用非相关噪声对语音进行掩盖。随着语音增强技术的发展,能量掩蔽后的语音很容易被复原。与能量掩蔽不同,用于信息掩蔽的掩蔽信号均是由目标语音信号变化而来,与目标语音信号有着较强的相关性。但是,目前难以保证用于信息掩蔽的目标语音信号的干扰信号(即掩蔽信号)的实时性。

发明内容

[0004] 由于现有方法存在上述问题,本申请提出一种目标语音信号的干扰信号生成方法及装置。
[0005] 第一方面,本申请提出一种目标语音信号的干扰信号生成方法,包括:
[0006] 获取待干扰的目标语音信号;
[0007] 对所述目标语音信号进行分处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;
[0008] 对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:
[0009] 对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;
[0010] 对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或[0011] 对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;
[0012] 根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号。
[0013] 在一种可能的实现中,所述对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号,包括:
[0014] 对所述至少一个语音帧中的每个语音帧进行傅里叶变换,获得所述至少一个语音帧中的每个语音帧的频谱
[0015] 根据所述至少一个语音帧中的每个语音帧的频谱,确定所述每个语音帧的频谱包络;
[0016] 根据所述每个语音帧的频谱包络,确定与其对应的第一精细结构;
[0017] 根据所述每个语音帧的频谱包络,确定所述每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线,N为大于或等于1的整数;
[0018] 根据所述每个语音帧的频谱包络、所述每个语音帧的频谱包络各自的N次多项式或指数函数拟合曲线以及所述第一精细结构,确定所述频域包络反转信号。
[0019] 在一种可能的实现中,所述对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号,包括:
[0020] 对所述至少一个语音帧中的每个语音帧进行时域反转,获得时域反转信号。
[0021] 在一种可能的实现中,所述对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号,包括:
[0022] 对所述至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号;
[0023] 根据所述各个频带对应的部分目标语音信号,确定其时域包络;
[0024] 根据所述各个频带对应的部分目标语音信号的时域包络,确定与其对应的第二精细结构;
[0025] 根据所述各个频带对应的部分目标语音信号的时域包络和所述第二精细结构,确定时域包络反转信号。
[0026] 在一种可能的实现中,所述根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号,包括:
[0027] 根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号;
[0028] 根据所述目标语音信号和所述加权信号,确定所述目标语音信号的干扰信号。
[0029] 在一种可能的实现中,所述根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号,包括:
[0030] 将所述频域包络反转信号、所述时域反转信号、所述时域包络反转信号与其分别对应的预设权重系数相乘,获得至少一个相乘结果;
[0031] 将所述至少一个相乘结果累加,获得加权信号。
[0032] 在一种可能的实现中,所述根据所述目标语音信号和所述加权信号,确定所述目标语音信号的干扰信号,包括:
[0033] 采用低通滤波器对加权信号进行低通滤波,获得低通干扰信号。需要说明的是,为减小被生成的干扰信号干扰后的目标语音信号被还原的可能性,低通滤波器的截止频率随机设置;
[0034] 将任意频带对应的部分低通干扰信号替换为所述任意频带对应的部分目标语音信号,获得所述目标语音信号的干扰信号。
[0035] 第二方面,本申请提出一种目标语音信号的干扰信号生成装置,包括:
[0036] 收发单元用于获取待干扰的目标语音信号;
[0037] 处理单元用于对所述目标语音信号进行分帧处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;
[0038] 所述处理单元用于对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:
[0039] 对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;
[0040] 对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或[0041] 对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;
[0042] 所述处理单元用于根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号。
[0043] 在一种可能的实现中,所述处理单元具体用于对所述至少一个语音帧中的每个语音帧进行傅里叶变换,获得所述至少一个语音帧中的每个语音帧的频谱;根据所述至少一个语音帧中的每个语音帧的频谱,确定所述每个语音帧的频谱包络;根据所述每个语音帧的频谱包络,确定与其对应的第一精细结构;根据所述每个语音帧的频谱包络,确定所述每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线,N为大于或等于1的整数;根据所述每个语音帧的频谱包络、所述每个语音帧的频谱包络各自的N次多项式或指数函数拟合曲线以及所述第一精细结构,确定所述频域包络反转信号。
[0044] 在一种可能的实现中,所述处理单元具体用于对所述至少一个语音帧中的每个语音帧进行时域反转,获得时域反转信号。
[0045] 在一种可能的实现中,所述处理单元具体用于对所述至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号;根据所述各个频带对应的部分目标语音信号,确定其时域包络;根据所述各个频带对应的部分目标语音信号的时域包络,确定与其对应的第二精细结构;根据所述各个频带对应的部分目标语音信号的时域包络和所述第二精细结构,确定时域包络反转信号。
[0046] 在一种可能的实现中,所述处理单元具体用于根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号;根据所述目标语音信号和所述加权信号,确定所述目标语音信号的干扰信号。
[0047] 在一种可能的实现中,所述处理单元具体用于将所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号与其分别对应的预设权重系数相乘,获得至少一个相乘结果;将所述至少一个相乘结果累加,获得加权信号。
[0048] 在一种可能的实现中,所述处理单元具体用于对所述加权信号进行低通滤波,获得低通干扰信号;将任意频带对应的部分低通干扰信号替换为所述任意频带对应的部分目标语音信号,获得所述目标语音信号的干扰信号。
[0049] 第三方面,本申请还提出一种目标语音信号的干扰信号生成装置,包括至少一个处理器,所述处理器用于执行存储器中存储的程序,当所述程序被执行时,使得所述装置执行如第一方面及各种可能的实现中的各个步骤。
[0050] 第四方面,本申请还提出一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面及各种可能的实现中的各个步骤。
[0051] 由上述技术方案可知,本申请通过构造三种与目标语音信号相关的频域包络反转信号、时域反转信号、时域包络反转信号,并对三种信号进行动态加权,获得加权信号,该加权信号对目标语音信号的干扰作用强于前述三种信号,提高了对目标语音信号的干扰作用。而对加权信号进行低通滤波,获得低通干扰信号以及将任意频带对应的部分低通干扰信号替换为任意频带对应的部分目标语音信号,获得目标语音信号的干扰信号,进一步提高了干扰信号对目标语音信号的干扰作用。此外,前述三种信号的生成过程是具有随机性的,进一步减小了被干扰信号干扰后的目标语音信号被还原的可能性。附图说明
[0052] 为了更清楚地说明本申请实施例现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
[0053] 图1为本申请实施例提供的一种目标语音信号的干扰信号生成方法的流程示意图;
[0054] 图2为本申请实施例提供的对至少一个语音帧中的每个语音帧进行第一处理的流程示意图;
[0055] 图3为本申请实施例提供的对至少一个语音帧中的每个语音帧进行第三处理的流程示意图;
[0056] 图4为本申请实施例提供的根据频域包络反转信号、时域反转信号、时域包络反转信号以及与其分别对应的预设权重系数,确定目标语音信号的干扰信号的流程示意图;
[0057] 图5为本申请实施例提供的一种目标语音信号的干扰信号生成装置的结构示意图;
[0058] 图6为本申请实施例提供的一种目标语音信号的干扰信号生成装置的另一结构示意图。

具体实施方式

[0059] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0060] 需要说明的是,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请实施例的说明书权利要求书中的术语“第一”、“第二”和“第三”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一处理、第二处理和第三处理等是用于区别不同的处理,而不是用于描述目标对象的特定顺序。在本申请实施例中,“示例性的”、“举例来说”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”、“举例来说”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。在本申请实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
[0061] 为防止语音隐私泄露,如会议室外的人可以听到会议室内的人讲话内容,本申请实施例提供了一种目标语音信号的干扰信号生成方法及装置。上述方法生成了目标语音信号的干扰信号。使用该干扰信号去干扰目标语音信号,可以有效防止窃听。例如,在会议室外播放该干扰信号,使得会议室外的人不能准确识别出目标语音信号,从而达到防止窃听的目的。
[0062] 图1为本申请提供的一种目标语音信号的干扰信号生成方法的流程示意图,该流程示意图包括:S101—S106,具体包括:
[0063] S101,获取待干扰的目标语音信号。
[0064] 在本申请实施例中,获取待干扰的目标语音信号。
[0065] S102,对所述目标语音信号进行分帧处理,获得至少一个语音帧。
[0066] 在本申请实施例中,对目标语音信号进行分帧处理,获得至少一个语音帧。为减小被生成的干扰信号干扰后的目标语音信号被还原的可能性,上述至少一个语音帧中的每个语音帧的帧长为随机值。例如,对目标语音信号进行分帧处理获得三个语音帧,第一个语音帧的帧长为3帧,第二个语音帧的帧长为6帧,第三个语音帧的帧长为8帧。
[0067] S103,对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号。
[0068] 在本申请实施例中,对至少一个语音帧中的每个语音帧进行第一处理。第一处理过程包括S201‑S205,具体包括:
[0069] S201,对至少一个语音帧中的每个语音帧进行傅里叶变换,获得至少一个语音帧中的每个语音帧的频谱。
[0070] S202,根据至少一个语音帧中的每个语音帧的频谱,确定每个语音帧的频谱包络;
[0071] S203,根据每个语音帧的频谱包络,确定与其对应的第一精细结构;
[0072] S204,根据每个语音帧的频谱包络,确定每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线;
[0073] 在本申请实施例中,可以利用最小二乘法,根据每个语音帧的频谱包络,确定每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线,N为大于或等于1的整数。
[0074] S205,根据所述每个语音帧的频谱包络、所述每个语音帧的频谱包络各自的N次多项式或指数函数拟合曲线以及所述第一精细结构,确定所述频域包络反转信号。
[0075] 在本申请实施例中,将每个语音帧的频谱包络以各自的N次多项式或指数函数拟合曲线中的一个作为对称轴进行反转。根据反转后的频谱包络和第一精细结构,确定频域包络反转信号每一语音帧的频谱。对频域包络反转信号每一语音帧的频谱进行逆傅里叶变换,获得频域包络反转信号。至此,生成了一种与目标语音信号相关的第一语音可懂度干扰信号。
[0076] 在本申请实施例中,为获得时域反转信号,需要对至少一个语音帧中的每个语音帧进行第二处理。具体地,第二处理可以为对至少一个语音帧中的每个语音帧进行时域反转。至此,生成了一种与目标语音信号相关的第二语音可懂度干扰信号。
[0077] 在本申请实施例中,对至少一个语音帧中的每个语音帧进行第三处理,第三处理包括:S301‑S304,具体包括:
[0078] S301,对至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号。
[0079] 在本申请实施例中,采用带通滤波器对至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号。
[0080] S302,根据各个频带对应的部分目标语音信号,确定其时域包络。
[0081] S303,根据各个频带对应的部分目标语音信号的时域包络,确定与其对应的第二精细结构。
[0082] S304,根据各个频带对应的部分目标语音信号的时域包络和第二精细结构,确定时域包络反转信号。
[0083] 在本申请实施例中,对各个频带对应的部分目标语音信号的时域包络进行时间反转。根据反转后的时域包络和第二精细结构,确定时域包络反转信号。至此,生成了一种与目标语音信号相关的第三语音可懂度干扰信号。
[0084] S104,根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号。
[0085] 在本申请实施例中,根据频域包络反转信号、时域反转信号和/或时域包络反转信号以及与其分别对应的预设权重系数,确定目标语音信号的干扰信号包括:S401‑S402,具体包括:
[0086] S401,根据频域包络反转信号、时域反转信号和/或时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号。
[0087] 在本申请实施例中,将频域包络反转信号、时域反转信号和/或时域包络反转信号与其分别对应的预设权重系数相乘,获得至少一个相乘结果。将至少一个相乘结果累加,获得加权信号。
[0088] S402,根据目标语音信号和加权信号,确定目标语音信号的干扰信号。
[0089] 在本申请实施例中,由于4kHZ以上的加权信号对目标语音信号的干扰作用比较微弱,因此,采用低通滤波器对加权信号进行低通滤波,获得低通干扰信号。需要说明的是,为减小被生成的干扰信号干扰后的目标语音信号被还原的可能性,低通滤波器的截止频率随机设置。然后,将任意频带对应的部分低通干扰信号替换为任意频带对应的部分目标语音信号,获得目标语音信号的干扰信号。该干扰信号与目标语音信号的相关性较强,被该干扰信号干扰的目标语音信号被还原的可能性极小,从而防止了目标语音信号被窃听。
[0090] 本申请实施例通过构造三种与目标语音信号相关的频域包络反转信号、时域反转信号、时域包络反转信号,即第一语音可懂度干扰信号、第二语音可懂度干扰信号、第三语音可懂度干扰信号,并对三种语音可懂度干扰信号进行动态加权,获得加权信号,该加权信号对目标语音信号的干扰作用强于前述三种语音可懂度干扰信号,提高了对目标语音信号的干扰作用。而对加权信号进行低通滤波,获得低通干扰信号以及将任意频带对应的部分低通干扰信号替换为任意频带对应的部分目标语音信号,获得目标语音信号的干扰信号,进一步提高了干扰信号对目标语音信号的干扰作用。此外,前述三种语音可懂度干扰信号的生成过程是具有随机性的,进一步减小了被干扰信号干扰后的目标语音信号被还原的可能性。
[0091] 图5为本申请提供的一种目标语音信号的干扰信号生成装置的结构示意图500,该结构示意图500包括:收发单元501和处理单元502;
[0092] 收发单元501用于获取待干扰的目标语音信号;
[0093] 处理单元502用于对所述目标语音信号进行分帧处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;
[0094] 所述处理单元502用于对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:
[0095] 对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;
[0096] 对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或[0097] 对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;
[0098] 所述处理单元502用于根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号。
[0099] 在一种可能的实现中,所述处理单元502具体用于对所述至少一个语音帧中的每个语音帧进行傅里叶变换,获得所述至少一个语音帧中的每个语音帧的频谱;根据所述至少一个语音帧中的每个语音帧的频谱,确定所述每个语音帧的频谱包络;根据所述每个语音帧的频谱包络,确定与其对应的第一精细结构;根据所述每个语音帧的频谱包络,确定所述每个语音帧的频谱包络各自的N次多项式和/或指数函数拟合曲线,N为大于或等于1的整数;根据所述每个语音帧的频谱包络、所述每个语音帧的频谱包络各自的N次多项式或指数函数拟合曲线以及所述第一精细结构,确定所述频域包络反转信号。
[0100] 在一种可能的实现中,所述处理单元502具体用于对所述至少一个语音帧中的每个语音帧进行时域反转,获得时域反转信号。
[0101] 在一种可能的实现中,所述处理单元502具体用于对所述至少一个语音帧中的每个语音帧进行频带划分,获得各个频带对应的部分目标语音信号;根据所述各个频带对应的部分目标语音信号,确定其时域包络;根据所述各个频带对应的部分目标语音信号的时域包络,确定与其对应的第二精细结构;根据所述各个频带对应的部分目标语音信号的时域包络和所述第二精细结构,确定时域包络反转信号。
[0102] 在一种可能的实现中,所述处理单元502具体用于根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定加权信号;根据所述目标语音信号和所述加权信号,确定所述目标语音信号的干扰信号。
[0103] 在一种可能的实现中,所述处理单元502具体用于将所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号与其分别对应的预设权重系数相乘,获得至少一个相乘结果;将所述至少一个相乘结果累加,获得加权信号。
[0104] 在一种可能的实现中,所述处理单元502具体用于对所述加权信号进行低通滤波,获得低通干扰信号;将任意频带对应的部分低通干扰信号替换为所述任意频带对应的部分目标语音信号,获得所述目标语音信号的干扰信号。
[0105] 图6为本申请实施例提供的一种目标语音信号的干扰信号生成装置的结构示意图600。该装置600可以为芯片系统。本申请实施例中,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。装置600包括至少一个处理器610,用于实现本申请实施例提供的方法。装置600还可以包括通信接口620。在本申请实施例中,通信接口620可以是收发器、电路、总线、模或其它类型的通信接口,用于通过传输介质和其它设备进行通信。
[0106] 处理器610可以执行装置500中处理单元502所执行的功能;通信接口620可以用于执行装置500中收发单元501所执行的功能。
[0107] 当装置600用于执行上述方法时,通信接口620用于获取待干扰的目标语音信号;处理器610用于对所述目标语音信号进行分帧处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号。
[0108] 通信接口620还用于执行上述方法实施例中除收发单元501以外的其它步骤或操作。处理器610还可以用于执行上述方法实施例中除处理单元502以外的其它步骤或操作,在此不再一一赘述。
[0109] 装置600还可以包括至少一个存储器630,用于存储程序指令和/或数据。存储器630和处理器610耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器610可能和存储器630协同操作。处理器610可能执行存储器630中存储的程序指令。在一种可能的实现中,所述至少一个存储器中的至少一个可以与处理器集成在一起。在另一种可能的实现中,存储器630位于装置600之外。
[0110] 本申请实施例中不限定通信接口620、处理器610以及存储器630之间的具体连接介质。本申请实施例在图6中以存储器630、处理器610以及通信接口620之间通过总线640连接,总线在图6中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线可以分为地址总线数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0111] 示例性的,处理器610可以是一个或多个中央处理器(Central Processing Unit,CPU),在处理器610是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。处理器410可以是通用处理器、数字信号处理器、专用集成电路、现场可编程阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
[0112] 示例性的,存储器630可包括但不限于硬盘(hard disk drive,HDD)或固态硬盘(solid‑state drive,SSD)等非易失性存储器,随机存储记忆体(Random Access Memory,RAM)、可擦除可编程只读存储器(Erasable Programmable ROM,EPROM)、只读存储器(Read‑Only Memory,ROM)或便携式只读存储器(Compact Disc Read‑Only Memory,CD‑ROM)等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。。
[0113] 本申请实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:
[0114] 获取待干扰的目标语音信号;
[0115] 对所述目标语音信号进行分帧处理,获得至少一个语音帧,所述至少一个语音帧中的每个语音帧的帧长为随机值;
[0116] 对所述至少一个语音帧中的每个语音帧进行处理,所述处理包括:
[0117] 对所述至少一个语音帧中的每个语音帧进行第一处理,获得频域包络反转信号;
[0118] 对所述至少一个语音帧中的每个语音帧进行第二处理,获得时域反转信号;和/或[0119] 对所述至少一个语音帧中的每个语音帧进行第三处理,获得时域包络反转信号;
[0120] 根据所述频域包络反转信号、所述时域反转信号和/或所述时域包络反转信号以及与其分别对应的预设权重系数,确定所述目标语音信号的干扰信号。
[0121] 以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0122] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0123] 应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。