会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
101 一种变压器工况识别声纹特征提取方法、装置及介质 CN202311768969.9 2023-12-21 CN117877495A 2024-04-12 程涣超; 王一林; 赵晓宇; 黄毅伟; 史超; 涂万里; 赵义焜; 唐勇; 谭瑞娟; 张耀; 王朝华; 杜君莉; 寇晓适; 夏大伟; 赵永峰; 李超
发明公开了一种变压器工况识别声纹特征提取方法、装置及介质。其中,方法包括:采用多加窗平均法获取采集的变压器附近的声信号功率谱;根据功率谱获取代表稳定环境噪声成分的稳态趋势谱;基于电网工频提取功率谱的谐波谱;将谐波谱减去谱趋势,获取变压器振动声纹的去趋势谐波谱;根据去趋势谐波谱,确定是否为变压器声纹特征。
102 一种基于自适应类边界间隔的说话人识别方法、系统及存储介质 CN202311867976.4 2023-12-29 CN117877493A 2024-04-12 罗辉; 赵昊洋
发明一种基于自适应类边界间隔的说话人识别方法、系统及存储介质,涉及说话人识别技术领域,为解决现方法假设不同说话人之间不存在差异性,调整类边界间隔的方式是固定且一致的,导致无法区分差异性较小的说话人的问题。包括:步骤1、获取说话人音频数据集,将添加音频数据添加标签;步骤2、对音频数据进行预处理,对预处理的音频数据中提取FBank特征作为声学特征;步骤3、构建基于深度学习的说话人识别模型,将说话人音频样本分为正确分类和错误分类,以样本属于某个说话人的概率为先验信息,自适应地调整类边界间隔,构建损失函数对模型进行训练;步骤4、将待测说话人音频数据输入训练后的说话人识别模型,判断是否为同一个人的音频数据。
103 语音识别系统、方法、电子设备和计算机可读存储介质 CN202311813122.8 2023-12-26 CN117877487A 2024-04-12 戴恩斌
申请涉及一种语音识别系统、方法、电子设备和计算机可读存储介质。其中,该语音识别系统包括语音识别模、游戏引擎模块;所述语音识别模块与所述游戏引擎模块通讯连接,用于对所接收到的目标音频数据进行识别,并将识别结果发送至所述游戏引擎模块;所述语音识别模块是根据预先获取的语音识别模型搭建的本地服务器;所述游戏引擎模块与所述语音识别模块通过Websocket网络传输协议进行数据传输,所述游戏引擎模块用于获取原始音频数据,对所述原始音频数据进行处理得到所述目标音频数据,并将所述目标音频数据发送至所述语音识别模块。
104 口语评分模型的训练方法、口语评分方法以及相关设备 CN202311745175.0 2023-12-18 CN117877483A 2024-04-12 王士进; 韩凯; 吴奎; 金海; 盛志超; 刘聪; 胡国平
申请公开了一种口语评分模型的训练方法,该方法包括获取语音识别数据,所述语音识别数据包括语音模态数据与其对应的文本模态数据;利用所述语音识别数据对初始口语评分模型进行预训练,其中,所述初始口语评分模型包括声学编码器和文本编码器,预训练后的所述声学编码器对应的语音模态和预训练后的所述文本编码器对应的文本模态对齐;获取口语评测数据;利用所述口语评测数据对预训练后的所述初始口语评分模型进行模型优化,得到目标口语评分模型。本申请还公开了口语评分方法以及相关设备。本申请提高了自动口语评估的效率与准确度。
105 一种基于人脸唇动语音分离的声纹识别方法及装置 CN202311827401.X 2023-12-26 CN117877482A 2024-04-12 吕江涛; 王征华; 郑攀; 张华军; 汤申亮; 邓小涛; 周靖轩
发明涉及一种基于人脸唇动语音分离的声纹识别方法及装置,该方法包括:构造语音分离网络,所述语音分离网络包括面部属性分析网络、唇动分析网络和音频处理网络;基于所述语音分离网络从待检测视频中提取目标语音;基于声纹识别模型对所述目标语音进行声纹识别;其中,所述面部属性分析网络提取面部属性特征,所述唇动分析网络用于提取嘴唇运动特征,所述音频处理网络用于进行语音分离,所述声纹识别模型是基于注册语音训练得到的。本发明实现了多人说话场景下的单通道语音分离,提高了语音分离的灵活性。
106 音频文件处理方法、装置、设备和存储介质 CN202311734028.3 2023-12-15 CN117877473A 2024-04-12 张宝; 彭梦; 潘露; 李宏伟
发明实施例提供了一种音频文件处理方法、装置、设备和存储介质,所述方法包括:获取人机交互过程中产生的音频文件和所述音频文件对应的描述文件;根据所述描述信息将所述音频文件拆分为人工合成音频和非人工合成音频;将所述人工合成音频转换为文本信息;若识别到所述非人工合成音频中包括敏感信息,则将所述非人工合成音频拆分为第一音频和第二音频;在所述描述文件中记录所述第一音频和所述第二音频分别对应的描述信息;对所述第二音频进行加密得到加密后的所述第二音频;保存所述文本信息、所述第一音频和加密后的所述第二音频以及所述描述文件,以追溯所述音频文件。本发明实施例减少了音频文件长期存储时所需要占用的存储空间。
107 语音交互方法和装置、电子设备和存储介质 CN202410051518.1 2024-01-12 CN117877469A 2024-04-12 王定; 曾晋科; 黄孝江; 许芳; 王诗鹏; 华克儒; 牟小峰
申请公开了一种语音交互方法和装置、电子设备和存储介质,涉及语音交互技术领域。其中,语音交互方法,用于电子设备,包括:控制电子设备进入全双工模式。接收来自用户的第一语音信息。对第一语音信息进行识别。在识别结果指示第一语音信息属于第一应用场景语音信息的情况下,获取第一语音信息对应的输出信息。基于输出信息,控制电子设备与用户进行语音交互。
108 语音合成的方法、电子设备、存储介质及计算机程序产品 CN202410193217.2 2024-02-20 CN117877464A 2024-04-12 江明奇; 殷昊; 王瑞; 史文婧; 陈云琳
本公开提供了一种语音合成的方法,包括:调用韵律模对目标文本的文本编码特征进行韵律分析,获得关于目标文本的文本韵律特征,其中文本韵律特征用于表征目标文本的期望韵律;基于目标文本的音素时长数据,将文本韵律特征与文本编码特征进行时长规整,获得韵律融合特征;以及将韵律融合特征转换为具有期望韵律的目标语音。本公开还提供一种电子设备、存储介质及计算机程序产品。
109 一种计算量小的智能座舱噪声主动控制系统及方法 CN202410074005.2 2024-01-18 CN117877457A 2024-04-12 刘志恩; 钱宇书; 陈弯; 卢炽华; 罗挺; 邵炯炀; 吕之品; 孙孟雷
发明提供了一种计算量小的智能座舱噪声主动控制系统及方法,通过生成参考信号;获取座舱内噪声信号,作为误差信号;通过所述参考信号识别噪声主要频率,选取对应频点的局部次级通路估计模型计算得到滤波参考信号;通过滤波参考信号和误差信号,采用自适应滤波算法进行滤波器权系数更新迭代;将所述参考信号和滤波器权系数进行卷积,得到扬声器输出信号,输出声波信号和座舱内噪声干涉抵消,进行主动噪声控制。使用频点局部次级通路估计模型#imgabs0#代替全局次级通路估计模型#imgabs1#次级通路模型的阶数由通常的256阶缩减至2阶,自适应算法的计算量大幅降低,算法实时性和延时得到改善,硬件资源占用降低。
110 一种基于亥姆霍兹共振腔阵列的吸声与压电俘能装置 CN202410087647.6 2024-01-22 CN117877453A 2024-04-12 吕佳; 李丽君; 司传豪; 张帆
发明公开了一种基于亥姆霍兹共振腔阵列的吸声与压电俘能装置,该装置将两个亥姆霍兹共振腔镜像放置,通过压电薄膜将两个亥姆霍兹共振腔的底部连接,构成一个结构单元。通过管形波导并联若干个所述结构单元的短管。声波从管形波导一端进入时,一部分声波沿管形波导直接进入一侧的亥姆霍兹共振腔的短管中,另一部分沿迷宫形波导输入到另一侧的亥姆霍兹共振腔的短管中,路径的差距使输入到两侧短管的声波相位相差180°,实现一侧亥姆霍兹共振腔内声压为正时,另一侧的共振腔内声压为负,两亥姆霍兹共振腔内部声压始终相反,以此增大压电薄膜的形变量,提高输出电压。所有压电片串联作为电压源,通过整流电路为小功率用电设备供电。1.本发明通过亥姆霍兹共振腔型声学超材料有效解决中低频吸声问题,显著降低噪声;2.通过共振腔结构单元中的压电薄膜在声压作用下的变形,实现声能到电能的转换,完成能量回收和自供电;3.通过迷宫形波导实现输入到两侧共振腔的声波相位相差180°,增大压电薄膜变形量,进一步增大输出电压。
111 一种基于虚拟仿真的实验教学方法、服务器及系统 CN202311670588.7 2023-12-07 CN117877333A 2024-04-12 李颖; 樊珂君
发明公开了一种基于虚拟仿真的实验教学方法、服务器及系统,涉及虚拟仿真实验教学技术领域,一种基于虚拟仿真的实验教学方法包括以下步骤:S1、语音识别:使用语音识别引擎来将语音转换为文本,将语音识别引擎的API集成到虚拟仿真环境中,作为接收、处理和理解学生的口语输入,实现实时反馈功能,当学生进行口语练习时,系统能够即时识别语音,并给予语法纠正、发音建议;本发明法整合了语音识别、手势识别和面部表情识别三种多模态交互技术,使学生能够通过语音、手势和面部表情与虚拟环境进行无障碍交互,提供了更丰富的学习体验,使学生能够在虚拟环境中更全面地表达和理解信息。
112 基于会议的数据处理方法、装置、存储介质及电子设备 CN202410071372.7 2024-01-17 CN117875431A 2024-04-12 钟力; 冯程; 杨超; 王宇峰
发明公开了一种基于会议的数据处理方法、装置、存储介质及电子设备。涉及人工智能技术领域。其中,该方法包括:通过虚拟对象获取目标对象的目标对话数据,其中,目标对话数据包括:会议中参会对象的对话数据,目标对话数据的数据类型为下述其中之一:语音数据、文本数据;基于目标对话数据的数据类型,将目标对话数据输入目标语言模型,输出目标对话文本,其中,目标语言模型用于识别目标对话数据的语义,并生成对目标对话数据进行回复的对话数据;基于目标对话数据的数据类型,展示目标对话文本。本发明解决了相关技术中会议中的智能会议助手对参数会议的语义识别的精准度低,导致智能会议助手生成的答复精度低的技术问题。
113 一种交通信息播报自适应提词方法 CN202410016866.5 2024-01-05 CN117874165A 2024-04-12 王少华; 张思楠; 杨佳宁; 孙垣; 杨璐铨; 刘霞; 张可可; 牛苗苗
发明公开了一种交通信息播报自适应提词方法,该方法采用实时语音监测技术,用户可自主决定结束播报时机。解决了在播报过程中,出现新增内容或提词有误而不得不临时说出与整篇提词无关的语句,导致系统直接中断的问题;可对播报信息文本进行预处理,有助于减小后续匹配处理时的时间复杂度和空间复杂度;使用二次匹配的方式,解决了当前语音文本与整篇提词文字中多条语句重复时应该如何定位匹配的问题,显著提高了匹配的精度;最后该方法使用n维向量的余弦计算公式计算文本匹配度,并根据使用场景提出匹配阈值P的具体数值,显著提高了匹配的准确性,以确保车辆驾驶员能够及时获得准确的交通信息,保障行车安全和交通畅通。
114 一种语音播报与翻页同步控制方法、设备及存储介质 CN202311776478.9 2023-12-22 CN117873617A 2024-04-12 周军; 胡耀清; 陈帆; 周峰; 贾月; 赵建青
发明提供一种语音播报与翻页同步控制方法、设备及存储介质,应用于具有显示屏的电子设备,其中,所述控制方法包括:判断当前资源页面的段资源是否跨页或当前控件是否展示不下全段资源,若否,执行翻页动作并同步语音播报翻页后的资源页面内容;若是,计算出当前资源页面或当前控件的自动切换资源翻页触发的延时时间t,并在语音播报完当前资源页面内容后,自动翻页并同步语音播报翻页后的资源页面内容;本发明能够实现文字资源在跨页面场景中,自动控制资源切换或翻页,并保证文字转语音后朗读的连贯性。
115 一种录制控制方法、电子设备及介质 CN202211243356.9 2022-10-11 CN117873418A 2024-04-12 卞超
申请涉及录制技术领域,公开了一种录制控制方法、电子设备及介质。方法包括:响应于用户开始录制的第一操作,通过麦克、摄像头中的至少一个采集模执行录制;响应于用户通过采集模块输入控制指令的第二操作,根据控制指令对录制进行控制,控制指令包括语音指令或图像指令;响应于用户结束录制的第三操作,根据录制内容至少生成第一录制文件,第一录制文件包括删除第一时间区间对应录制内容后的拼接内容,第一时间区间根据控制指令所处的第二时间区间确定。基于上述方案,能够实现在录制过程通过控制指令进行录制控制,且最终录制内容也不会存在额外的语音指令或者图像指令内容,提升用户体验。
116 分体式头戴设备的数据交互方法、设备及介质 CN202311820200.7 2023-12-27 CN117873317A 2024-04-12 李国鑫; 陈曰清
申请公开了一种分体式头戴设备的数据交互方法、设备及介质,涉及头戴技术领域。其中所述分体式头戴设备包括头显及控制设备,方法应用于所述头显,包括:与所述控制设备建立与所述头显的系统相匹配的通信连接;控制所述头显上的麦克采集第一语音信息;基于所述通信连接向所述控制设备发送所述第一语音信息;基于所述通信连接从所述控制设备接收针对于所述第一语音信息的生成结果信息。通过该方法可实现用户基于头戴设备对生成式模型的使用。
117 一种烟机的噪声调节方法、装置、厨房电器及存储介质 CN202410099861.3 2024-01-24 CN117869974A 2024-04-12 任富佳; 董豪炳; 胡冬芳; 陈尘缘; 郑强; 罗贤才
发明实施例提供了一种烟机的噪声调节方法、装置、厨房电器及存储介质,烟机设置于灶具上方,用于吸收灶具上锅具产生的烟雾;该控制方法首先实时采集灶具的火强度;实时采集烟雾浓度;然后根据烟雾浓度和火力强度,确定噪声等级;并根据噪声等级确定预先设置且与噪声等级相互映射的电流;最后将烟机的工作电流调整至与噪声等级相互映射的电流,以将烟机的噪声调整至理想噪声。利用上述方法,通过烟雾浓度和火力强度对烟机的噪声进一步调节,解决了现有技术只针对烟机档位设定恒噪声,不能根据烹饪情况对恒噪声灵活调节的问题,使得恒定噪声更加贴合用户使用情况,提升了用户体验。
118 一种降噪装置及应用有该降噪装置的吸油烟机 CN202410014342.2 2024-01-04 CN117869965A 2024-04-12 刘豪
发明涉及一种降噪装置及应用有该降噪装置的吸油烟机,其中降噪装置包括:降噪盒,内部中空且具有一敞口;微穿孔板,位于降噪盒的敞口处,所述微穿孔板与降噪盒之间形成腔室,所述微穿孔板上开设有多个第一微穿孔,以所述微穿孔板的延伸方向为第一方向,其特征在于还包括:第一隔板,沿第一方向设于所述腔室内,用于将腔室分隔成靠近降噪盒敞口的降噪腔室和远离降噪盒敞口的非降噪腔室;并且所述第一隔板以能相对微穿孔板靠近或远离移动的方式约束于所述腔室内。优点在于:该降噪装置在第一隔板移动时而改变降噪腔室的深度,进而实现不同频带的噪声吸音,提高降噪效果。
119 一种隔音降噪的石料粉碎 CN202410111820.1 2024-01-26 CN117861831A 2024-04-12 冯晓红
发明公开了一种隔音降噪的石料粉碎机,属于石料粉碎机领域,包括粉碎机本体,粉碎机本体的内部由上到下依次设置有锤式碎石机构、对辊式碎石机构和碎石筛分机构,粉碎机本体的底端设置有减震座,粉碎机本体通过减震结构与减震座连接,粉碎机本体的壳体由内到外依次包括隔音结构、真空层以及吸音结构,粉碎机本体的顶端设置有石料填充口,石料填充口上设置有填充盖。本发明采用上述一种隔音降噪的石料粉碎机,利用隔音结构、真空层、吸音结构三层隔音降噪的结构,降低石料粉碎机工作过程中发出的噪音,能够大大提高石料粉碎机隔音降噪的效果。
120 基于广义互相关的音频数据处理方法、装置及存储介质 CN202410103476.1 2024-01-25 CN117636907B 2024-04-12 杨霏; 万欣; 杨刚; 蒋蓝祥; 袁梦莹; 淳俊源; 任格; 龚贵兴; 顾浩然
发明提供一种基于广义互相关的音频数据处理方法、装置及存储介质,其中方法包括通过计算窗口取出两路音频流的当前处理数据,并分别放入到两路音频片段缓冲区;采用短时平均能量特征对所述两路音频片段缓冲区的数据进行静音段处理;采用广义互相关延迟算法对经过静音段处理的数据进行延迟估计处理,获取两路音频数据之间的延迟估计值;根据所述两路音频数据之间的延迟估计值,采用皮尔森相关系数对所述两路音频片段缓冲区的数据进行限判决;通过状态机对延迟估计处理以及门限判决进行控制调控,实现两路音频数据对齐。利用本发明,能够解决各路音频传输延迟不确定、音频延迟实时变化的问题,从而实现各路音频数据实时精确对齐。