会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学 / 语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
101 用于处理用户语音话语的系统和用于操作该系统的方法 CN201910725656.2 2019-08-07 CN110858481B 2024-04-30 李志秀; 韩正雅; 马尔科·保罗·安东尼奥·亚科诺; 格拉夫·布尚; 克里斯多夫·迪恩·布里格姆; 马克·格雷戈里·加贝尔
提供了一种用于处理用户语音话语的系统和用于操作该系统的方法。所述系统包括至少一个存储器以及被可操作地连接到所述存储器的至少一个处理器。所述存储器可存储当被执行时使得所述处理器执行以下操作的指令:从用户接收选择至少一个域的输入并且将所述输入存储在所述存储器中,至少部分地基于关于在所述输入被存储之后接收到的用户话语的数据识别所述话语,当所述话语不包括域名时,确定所述话语是否与已选定域相应,以及当所述话语与所述已选定域相应时,通过使用所述已选定域处理所述话语以产生响应。
102 一种信息显示方法、装置、设备及可读存储介质 CN201810777950.3 2018-07-16 CN110728983B 2024-04-30 金超; 翟吉博
申请公开了一种信息显示方法、装置、设备及可读存储介质,本申请能够根据输入的语音数据及对应的识别文本数据,确定对象在输入语音时的情绪信息,通过确定的情绪信息可以匹配对应的文本显示模式,进而能够控制识别文本数据按照匹配的文本显示模式进行显示,由于该显示的文本已经是按照用户情绪匹配的显示模式进行显示的,因此无需用户再次对显示的文本进行编辑操作,简化了操作步骤且提高了输入效率。
103 音频信号处理方法及装置、通信设备、通信系统、存储介质 CN202380011593.9 2023-10-13 CN117941380A 2024-04-26 王宾
本公开提出一种音频信号处理方法及装置、通信设备、通信系统、存储介质,该方法包括:确定第一信息和/或第二信息,其中,第一信息用于指示第一设备的能信息,第二信息用于指示第一设备的类型信息;根据第一信息和/或第二信息,确定目标模式;接收第一音频信号,并根据目标模式处理第一音频信号,得到双信号。本公开的方法,在用于处理音频信号的设备中能够有效采用最优的解码渲染解决方案。
104 用于检测异常声音的方法和系统 CN202280062389.5 2022-05-12 CN117940996A 2024-04-26 G·维切恩; A·查克拉巴尔蒂; 王中秋; J·勒鲁克斯
公开了一种用于检测异常声音的系统和方法。该方法包括接收音频信号的谱图,所述谱图所具有的元素由谱图的时频域中的值限定。每个值均对应于谱图的由时频域中的坐标标识的元素。将谱图的时频域划分为上下文区域和目标区域。由神经网络使用注意神经过程处理上下文区域和目标区域,以针对坐标在目标区域中的元素恢复谱图的值。将目标区域的元素的恢复值与所划分的目标区域的元素的值进行比较。基于所述比较来确定异常分数。使用所述异常分数执行控制动作。
105 基于长期预测和/或谐波后置滤波生成预测频谱的处理器 CN202280062479.4 2022-07-14 CN117940994A 2024-04-26 戈兰·马尔科维奇; 伯恩德·埃德勒; 斯特凡·拜耳; 简·弗雷德里克·基内
一种用于处理(编码的)音频信号的处理器,处理器包括:LTP缓冲器,被配置为接收从编码的音频信号得出的样本;间隔分割器,被配置为根据编码的基音参数将与编码的音频信号的后续帧相关联的时间间隔划分成子间隔;计算装置,被配置为根据子间隔在与编码的音频信号的后续帧相关联的时间间隔内的位置,从编码的基音参数得出子间隔参数;预测器,被配置为根据子间隔参数从LTP缓冲器生成预测信号;以及频域变换器,被配置为基于预测信号生成预测频谱(XP);和/或处理器包括:分割器,被配置为将与音频信号的帧相关联的时间间隔分割成多个子间隔,每个子间隔具有各自的长度,多个子间隔的各自的长度取决于基音滞后值;谐波后置滤波器,被配置为对多个子间隔进行滤波,其中谐波后置滤波器基于包括分子和分母的传递函数,其中分子包括谐度值,分母包括基音滞后值和谐度值和/或增益值。
106 车辆环境监测方法、装置、计算机设备和存储介质 CN202311667625.9 2023-12-06 CN117939065A 2024-04-26 马世童; 陈兴; 朱静
申请涉及一种车辆环境监测方法、装置、计算机设备和存储介质。所述方法包括:在目标车辆处于静止状态的情况下,采集目标车辆所处周围环境的环境信息,根据环境信息,确定目标车辆所处周围环境是否安全,若否,则根据环境信息对应的车辆报警等级,对环境信息的信息采集频率进行更新,根据更新后的信息采集频率,采集环境信息,以确定目标车辆所处周围环境中的危险因素。采用本方法能够提高环境监测的准确性。
107 音视频文件的编码方法、装置 CN202410195400.6 2024-02-21 CN117939016A 2024-04-26 陈龙; 刘翔; 徐福燕; 宋洁瑜; 陈淼生; 郭思超
申请公开了一种音视频文件的编码方法、装置。其中,该方法包括:获取音视频源编码文件;对于音视频源编码文件内的每个第一编码数据,对第一编码帧数据进行解码,得到音视频帧数据,并利用目标编码器对音视频帧数据进行编码,得到第二编码帧数据,其中,目标编码器至少包括:EVS音频编码器;将多个第二编码帧数据按照时间顺序进行组合,得到通用音视频编码文件;响应于目标终端对音视频源文件的获取请求,向目标终端发送该通用音视频编码文件。本申请解决了相关音视频文件编解码技术需要多次调用编解码器对系统本地存储的预定编码文件进行转码,导致系统资源消耗较多的技术问题。
108 一种音箱本地控制系统和方法 CN202410031586.1 2024-01-09 CN117938564A 2024-04-26 焦党辉; 李梁
发明涉及一种音箱本地控制系统和方法,包括人体存在传感器、取电组件、开关组件、磁组件以及集成的zigbee协调器模,其特征在于:所述音箱具备网关功能,能够通过zigbee协调器模块建立并管理zigbee智能设备网络,实现对zigbee设备的组网、配置和控制;所述音箱支持在线和离线语音识别;所述音箱能够对接端进行标签管理,用户对设备配置标签后,云端将标签信息下发至音箱,音箱依据标签信息解析设备控制指令,并通过zigbee协调器控制目标设备;所述音箱还具有反馈机制,对于识别成功的控制指令,能够联动智能设备执行,并向用户播报执行结果。发明的一个用途是提升了用户的体验和智能家居系统的实用性。
109 一种用于个性化营销的用户情感分析方法及系统 CN202410332613.9 2024-03-22 CN117935865A 2024-04-26 曹炜; 陈园; 杨成龙; 周天文
发明公开了一种用于个性化营销的用户情感分析方法及系统,涉及数据处理技术领域。所述方法包括以下步骤:获取与用户的音频交流数据,并对音频交流数据进行预处理;对预处理后的音频交流数据进行识别,获取文本交流数据,并对文本交流数据进行预处理。本发明通过对与用户的通话音频进行转文字处理,获取对话文本,然后对对话文本进行特征提取,并通过特征进行识别,获取用户的需求评估报告,再对通话音频进行识别,进行情感分析,生成情感评估报告,然后通过将需求评估报告与情感评估报告结合,生成完整的情感分析报告,有助于减少企业复核通话音频的时间,提高通话信息提取的准确率,为后续高效维护客户提供了重要的技术支持。
110 一种朗读评测方法和装置、电子设备、存储介质 CN202311708186.1 2023-12-12 CN117935863A 2024-04-26 苏涛; 杨康; 李宝善; 王慧娟; 吴奎; 张凯波; 盛志超; 王士进
申请公开了一种朗读评测方法和装置、电子设备、存储介质,该方法包括获取待评测文本的发音序列和朗读音频;其中,朗读音频是用户对待评测文本进行朗读得到;对朗读音频进行句子划分,得到各目标句子的句子朗读音频;基于各目标句子在发音序列中的句子发音序列对句子朗读音频进行评测,得到各目标句子的句子评测结果;基于各句子评测结果,得到朗读音频的目标评测结果。通过上述方式,本申请能够自动对待评测文本的朗读音频进行评测,提高评测效率和准确度。
111 一种声学场景与声音事件联合任务分析方法 CN202410138072.6 2024-01-31 CN117935860A 2024-04-26 武梦龙; 张琳; 张海月; 蔡希昌; 黄明; 邢喆
发明公开了一种基于多任务学习的声学场景与声音事件联合分析方法,目标是通过加入额外的声音事件信息,重点提升声学场景感知的性能,包括:将Multi‑gate Mixture‑of‑Experts模型引入声学领域,替代传统多任务学习模型,弱化任务间差异带来的固有冲突。在Multi‑gate Mixture‑of‑Experts模型基础上增加两条信息交互分支,提出一种新的模型—Cross_MMoE。将Class‑Balanced Loss代替传统的多任务加权损失,在传统多任务模型、MMoE模型、Cross_MMoE模型进行评估,得到评估结果。本发明的优点是:利用多任务学习策略对声学领域相关联的两个任务进行联合分析,降低了计算和存储成本,大大增加了推理速度,并且提高了声学场景分类的准确率。
112 快递履约过程监控方法、装置、设备及存储介质 CN202410033970.5 2024-01-09 CN117935845A 2024-04-26 林思斌; 李波涛
发明涉及语音信号处理领域,公开了一种快递履约过程监控方法、装置、设备及存储介质。该方法包括:获取预设时间范围内快递履约过程中的所有语音通话,获取每段语音通话对应的语音通话信息;分别对每个语音通话信息进行语音识别操作和关键词提取操作,得到每个语音通话信息对应的关键词集;根据每个关键词集得到每段所述语音通话的履约情况,并根据每个履约情况生成每段语音通话对应的履约监控结果;对所有履约监控结果进行统计分析操作,生成分析结果,并根据分析结果生成监控分析报告。本发明提供的是一种快递履约过程监控方法,实现快递履约监控从人工判断到自动化分析的转变,降低人成本,在大幅提升监控效率的同时也保障了监控的准确性。
113 语音分离的方法、系统、计算设备和存储介质 CN202410101410.9 2024-01-24 CN117935839A 2024-04-26 徐娜; 胡洋; 时猛; 黄海荣
本公开涉及一种语音分离的方法、系统、计算设备和存储介质等。该方法包括:获得目标说话人的第一音频;获得通过单个麦克采集得到的包括目标说话人的混合音频;将所述第一音频和所述混合音频输入已训练的语音分离模型,得到目标说话人的掩膜值;以及基于所述掩膜值从所述混合音频得到所述目标说话人的频域信号和干扰音频的频域信号。利用本公开的方法,能够在仅利用一个麦克风进行语音采集的情况下有效地从多人混叠音频中提取目标说话人的音频。
114 音频降噪方法、电子设备以及存储介质 CN202410336819.9 2024-03-22 CN117935835A 2024-04-26 袁笑; 洪传荣; 杨国全; 曹亚曦; 王克彦
申请公开了一种音频降噪方法、电子设备以及存储介质,音频降噪方法包括:分别获取至少两个收音设备在当前时刻采集到的当前音频数据,当前音频数据中包括目标声源发出的音频;基于各收音设备之间的位置关系以及目标声源的位置确定各当前音频数据之间的导向矢量;以及,确定至少一个当前音频数据与至少一个目标收音设备在历史时刻采集到的历史音频数据之间的时间相关系数,至少一个目标收音设备为采集至少一个当前音频数据的收音设备,历史时刻为早于当前时刻的时刻;利用导向矢量与时间相关系数,确定目标滤波参数;基于目标滤波参数,对各当前音频数据进行滤波降噪处理,得到目标音频数据。上述方案,能够提高音频降噪效果。
115 自动降低在线会议中的回声影响 CN202211259182.5 2022-10-14 CN117935829A 2024-04-26 杨慧鹏; 邹健; 王烁; 周民亮
本公开提出了用于自动降低在线会议中的回声影响的方法、装置和计算机程序产品。在在线会议期间,可以获得由参与所述在线会议的设备产生的初始语音信号。可以检测所述初始语音信号中是否存在回声。响应于检测到所述初始语音信号中存在回声,可以确定所述设备上的用于进行所述在线会议的会议应用的回声消除功能是否被开启。响应于确定所述回声消除功能未被开启,可以自动开启所述回声消除功能。
116 一种基于Transformer的戏曲演唱音色转换方法 CN202410245017.7 2024-03-05 CN117935827A 2024-04-26 耿国华; 杨超然; 曲雅云; 寇宇帆; 贺思凯; 李震; 周蓬勃
发明公开了一种基于Transformer的戏曲演唱音色转换方法,包括:1、构建源音频数据集;2、构建说话人音频数据集并导入基于神经连接的唱歌声音转换系统;3、自监督学习从源音频数据集和说话人音频数据集提取音频特征,k邻近匹配策略将源音频特征替换为说话人音频特征,生成自监督学习特征;4、神经谐波信号发生器模块将正弦激励信号与滤波后的激励信号相连,形成神经谐波信号;5、音频合成器模块对神经谐波信号和响度进行一维卷积,下采样模块向上采样模块提供响度;6、音频合成器模块通过上采样模块将自监督学习特征、响度和神经谐波信号合成为说话人音色演唱音频,从而将任意说话人音色迁移至源演唱音频,生成不含源音频音色的演唱音频。
117 一种自适应语音通信方法、设备及存储介质 CN202410070888.X 2024-01-17 CN117935823A 2024-04-26 卓春才; 杨德文; 皮碧虹; 龙丁奋
发明涉及车载语音通讯技术领域,公开了一种自适应语音通信方法、设备及存储介质。该方法包括:选择音频编码器,判断语音数据是否支持硬编码处理;若不支持硬编码处理,则判断CPU是否过载;若CPU不过载,则读取网络带宽,判断网络带宽是否小于带宽阈值;若小于带宽阈值,则使用Opus编码,对所述PCM音频裸数据进行编码处理,得到Opus编码数据,发送所述Opus编码数据至接收端;若不小于带宽阈值,则使用AAC编码,对PCM音频裸数据进行编码处理,得到AAC编码数据,发送AAC编码数据至接收端。在本发明实施例中,自适应语音通信方法能够解决车载在线语音识别通讯时语音编码器压缩率低、编码音频策略单一的问题。
118 电子设备执行的方法、电子设备以及存储介质 CN202211308212.7 2022-10-25 CN117935821A 2024-04-26 温亮; 王立众; 郑宇星; 崔光杓
本公开提供了一种由电子设备执行的方法、电子设备以及存储介质,所述方法包括:基于神经网络,从接收的语音信号获得第一高频信号和第一低频信号;基于滤波处理,从接收的语音信号获得第二高频信号和第二低频信号;基于第一高频信号、第一低频信号、第二高频信号和第二低频信号,获得带宽扩展的语音信号。同时,可以使用人工智能模型来执行上述方法。
119 多用户配置 CN202410272195.9 2020-03-27 CN117935806A 2024-04-26 T·G·卡瑞根; P·L·科夫曼; D·C·格拉哈姆
本公开涉及多用户配置。示例性方法包括:在电子设备处:接收请求;以及响应于该请求:如果语音输入不匹配与跟该电子设备相关联的账户相关联的语音简档:则使得使用与该电子设备相关联的第一账户基于该请求来输出第一信息;如果该电子设备的设置具有第一状态,则使得基于该请求来更新该第一账户的账户数据;并且如果该设置具有第二状态,则放弃使得更新该账户数据;并且如果该语音输入匹配与跟该电子设备相关联的账户相关联的语音简档:则使得使用与匹配的语音简档相关联的该账户来输出该第一信息;并且使得基于该请求来更新该账户的账户数据。
120 一种语音识别转换方法及装置 CN202410117353.3 2024-01-29 CN117935803A 2024-04-26 仇月娟; 杨光耀; 石丽娟
发明涉及语音识别转换技术领域,具体为一种语音识别转换方法及装置,包括以下步骤:S1:中控系统通过人机交互获取数据。本发明中,通过数据预处理单元对视频和音频数据进行预处理,给后续特征提取步骤提供便捷,通过源数据库暂存处理后的数据,并进行特征提取,生成特征文件项目,执行与特征文件项目近似度检索最相似的结果项,在客户端基于执行组件执行动作表,通过反馈组件提交反馈,反馈结果交由模型训练单元进行判定,基于判定结果进行训练工作,以此达成了在该装置运行过程中,对其内部模型自动化训练、模型参完善的效果,降低了后台人员的人成本损耗。