会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
161 用于保护江豚的体施工过程中的水下噪声预警系统 CN202410252228.3 2024-03-06 CN117854532A 2024-04-09 梅志刚; 王克雄; 陈小红; 王丁
发明涉及体施工噪声测量预警技术领域,具体涉及一种用于保护江豚的水体施工过程中的水下噪声预警系统。该系统同时获取水上噪声、水下噪声和江豚声音三种声音数据,根据江豚声音数据获得的江豚信息获得截取范围并向前截取数据,获得待分析的数据;基于两类数据的相关性进行数据整合获得整合数据,基于待分析数据的变化趋势获得采集范围并继续采集数据,获得噪声判断数据。根据噪声判断数据进行噪声预警的检测。本发明通过自适应获得的采集范围获得用于评估噪声的噪声判断数据,能够提高水体施工的噪声预警灵活性,通过灵活的噪声预警使得水体施工能够在不影响江豚生存的基础上顺利进行施工。
162 一种矿用溜槽的堵塞检测系统及其检测方法 CN202410075801.8 2024-01-18 CN117854531A 2024-04-09 谭兴富; 卢军; 成举炳; 吕子奇; 宋阳
发明公开了一种矿用溜槽的堵塞检测系统及其检测方法,音频预处理部分负责获取音频传感器中的原始音频信号,将其转换为数字音频文件后进行除静音段、修剪开头和结尾的无效部分等处理;音频增强部分通过训练Wave‑U‑Net模型对原始音频数据进行降噪去混响处理,之后进行特征提取即MFCC转换;堵塞发生检测部分主要包含SELDnet模型,识别并检测目标声音事件,确定其发生的时间;堵塞定位部分包含ECAPA‑TDNN模型,根据不同空间位置声音具有不同的特征将声音进行分类,进而确定声音来源。本发明可在不影响现有溜槽等设备的布置下,更加精确的检测到溜槽堵塞事件的发生,并且可以定位到堵塞位置。
163 动画色语音变换系统及方法、存储介质、电子装置 CN202311831401.7 2023-12-28 CN117854524A 2024-04-09 司马华鹏; 姚奥; 汤毅平
申请实施例提供了一种动画色语音变换系统及方法、存储介质、电子装置,通过角色特征编码模获取所述目标配音演员针对不同动画角色的配音音频作为角色特征样本,基于所述角色特征样本对应的角色特征向量与所述待转换音频对应的音频特征向量的相似度确定第一权重和第一角色特征,通过所述第一角色特征对应的角色特征向量与所述待转换音频对应的音频特征向量之间的音素相似度确定第二权重,基于所述第一权重和所述第二权重加权求和后得到所述待转换音频对应的角色特征;将所述待转换音频对应的音频特征向量、所述目标语音样本的目标音频特征、所述目标语音样本的第二个人特征以及所述目标角色特征输入音色转换模块得到目标语音,解决了相关技术中动画角色的配音在复刻过程中无法理想实现的声音转换的问题。
164 端到端语音变换系统及方法、存储介质、电子装置 CN202311831109.5 2023-12-28 CN117854523A 2024-04-09 司马华鹏; 姚奥; 汤毅平
申请实施例提供了一种端到端语音变换系统及方法、存储介质、电子装置,所述系统包括音频特征编码模格特征编码模块和音色转换模块,在训练过程中获取目标说话人的目标语音样本,并根据目标语音样本的风格类别,提取目标语音样本的目标音频特征;获取目标语音样本的第一风格特征,并根据第一风格特征确定目标语音样本的第二风格特征;其中,第一风格特征用于指示目标语音样本的静态声音特性,第二风格特征用于指示在预设时长内对第一风格特征的特征偏置量与增益量的预测值;根据第一损失函数、第二损失函数、第三损失函数得到训练后的音色转换模块,并通过训练后的音色转换模块将待处理语音转换为目标说话人对应的目标语音。
165 方法及装置、非易失性存储介质、电子设备 CN202311869324.4 2023-12-29 CN117854522A 2024-04-09 宋耀东; 廉洁; 李杰
申请公开了一种方法及装置、非易失性存储介质、电子设备。其中,方法包括:根据第一特征和第二特征确定原始音频的内容特征;利用预训练的目标基频预测模型对原始音频的基频、静音标识、内容特征以及说话人特征进行处理,得到原始音频对应的预测基频;利用先验编码器确定内容特征、预测基频以及静音标识对应的第一分布函数,并利用预训练的流模确定第一分布函数和说话人特征对应的第二分布函数;利用预训练的目标解码器对第二分布函数、说话人特征和/或校正后的预测基频进行处理,得到转化音频。本申请解决了由于相关的声音转换方法需要对转换模型和声码器分别进行训练,以确定待转换音频对应的目标音频,造成声音转换效率较低的技术问题。
166 音频编解码方法、装置和设备 CN202410071426.X 2024-01-17 CN117854516A 2024-04-09 王海强; 潘翔; 许晓中
提供了音频编解码方法、装置和设备,涉及音视频编解码领域。该音频解码方法包括:解析待解码码流,得到量化结果;对量化结果进行反量化,得到重建编码向量;根据重建编码向量和填充数据,得到组合重建编码向量;其中,填充数据的长度根据解码网络对应的有效输入长度确定,填充数据包括已解码码流的重建编码向量;将组合重建编码向量中的有效输入长度对应的重建编码向量输入所述解码网络,利用解码网络对输入重建编码向量进行解码操作,输出重建信号;重建信号与待解码码流的重建编码向量相关且与已解码码流的重建编码向量不相关,解码网络不进行非真实数据填充。本申请实施例能够实现提高基于深度学习的音频编解码架构的编解码效率和质量
167 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 CN202410037965.1 2018-07-26 CN117854515A 2024-04-09 扬·比特; 弗伦茨·罗伊特尔胡贝尔; 萨沙·迪施; 纪尧姆·福克斯; 马库斯·马特拉斯; 拉尔夫·盖格尔
一种用于对已编码的多声道信号进行解码的装置,包括:基础声道解码器(700),用于对已编码的基础声道进行解码以获得已解码的基础声道;去相关滤波器(800),用于对已解码的基础声道的至少一部分进行滤波以获得填充信号;以及多声道处理器(900),用于使用已解码的基础声道的频谱表示和填充信号的频谱表示来执行多声道处理,其中去相关滤波器(800)是宽频带滤波器,且多声道处理器(900)被配置为将窄频带处理施加到已解码的基础声道的频谱表示和填充信号的频谱表示。
168 一种车牌号码的语音识别方法、装置、设备及存储介质 CN202410033554.5 2024-01-09 CN117854502A 2024-04-09 秦冬冬; 冯晨; 王晓东; 刘晨宇; 董奕琳; 张建辉; 谭明
申请公开了一种车牌号码的语音识别方法、装置、设备及存储介质,可用于语音识别领域,该方法中,首先,获取对包含车牌号码的通话语音进行语音识别得到的待纠错文本;而后,基于通话语音对应电话号码的归属省份,确定文本纠正规则;继而,基于文本纠正规则处理待纠错文本,得到纠正文本;最后,基于纠正文本中文字的音素特征以及车牌格式,从纠正文本中识别车牌号码。由此,根据通话语音对应电话号码的归属省份为待纠错文本配置文本纠正规则,可以更好地适应于不同地区的发音差异,得到语音识别准确度更高的纠正文本,继而可以基于纠正文本中文字的音素特征以及车牌格式,更为准确地识别出通话语音中的车牌号码。
169 音频检测方法和装置 CN202410027756.9 2024-01-08 CN117854501A 2024-04-09 姚树杰; 赵宏涛
发明实施例提供了音频检测方法和装置,包括:获取原始音频和哨兵音频的哨兵特征向量;对原始音频进行MFCC特征提取,得到第一原始特征向量;将原始音频进行音频分和静音识别,确定候选匹配位置;将候选匹配位置按照滑窗顺序,对第一原始特征向量进行截取,得到与哨兵特征向量等长的第二原始特征向量;将第二原始特征向量和哨兵特征向量输入DTW算法中,输出得到距离;如果距离小于预设阈值,则原始音频中包括与哨兵音频相似的音频片段;通过静音分析判定候选匹配位置,减少音频匹配次数,进一步提升识别效率;再结合MFCC特征矩阵上动态滑窗DTW搜索匹配的方式,降低时间消耗。
170 语音控制方法、设备及介质 CN202211216024.1 2022-09-30 CN117854495A 2024-04-09 霍伟明; 颜林; 席红艳; 陈柏仰; 方海波
发明公开了一种语音控制方法、设备及介质,方法应用于语音控制设备,通过确定干扰环境下语音唤醒词的唤醒置信度与预设置信度阈值的比较结果,确定语音控制的目标语音控制设备从而基于语音唤醒词对相应的目标家电设备进行控制。从而相较于只通过将语音唤醒的信噪比转换为能量值、最大能量值对应的控制设备响应语音唤醒的方式,除了考虑信噪比之外,还考虑语音唤醒词信噪比的唤醒置信度,从而当干扰影响到语音唤醒、识别时,在多语音入口的当前场景下确定相对响应较好的控制设备,从而响应用户的语音唤醒对其对应的家电设备进行控制,进而在干扰环境下准确确定响应语音唤醒的目标语音控制设备。
171 车辆座舱语音意图识别方法、装置及车辆控制方法 CN202410029424.4 2024-01-08 CN117854493A 2024-04-09 曹明; 张轩; 尹超俊
申请公开一种车辆座舱语音意图识别方法、装置及车辆控制方法,通过获取用户当前语音输入文本数据、用户当前表情肢体数据以及车辆内外环境数据;利用多分类模型对用户当前语音输入文本数据进行用户意图识别,以得到第一意图识别结果;通过多模态识别模型,基于所用户当前语音输入文本数据、用户历史语音输入文本数据、用户当前表情肢体数据以及车辆内外环境数据进行用户意图识别,以得到第二意图识别结果;将第一意图识别结果与第二意图识别结果进行融合,以获取用户真实意图识别结果。通过融合多分类模型及多模态识别模型的意图识别结果,能够提高语音意理解的准确性,从而提升车辆座舱对话系统的智能性以及用户体验感。
172 一种降低误识别率的离线命令词语音识别系统及方法 CN202410034427.7 2024-01-09 CN117854487A 2024-04-09 李俊潇; 王阳宣; 李阳; 李晓冬; 彭世伟
发明涉及语音识别技术领域,其公开了一种降低误识别率的离线命令词语音识别系统及方法,有效降低误识别概率,提高离线语音识别的准确率。本发明将离线语音识别输出的具有最大概率的命令词的概率与预设的较大的第一概率值和较小的第二概率值进行比较,若大于第一概率值,则判定该命令词识别正确,若小于第二概率值,则判定该命令词识别错误;若介于第一概率值与第二概率值之间,则需要进一步基于提取的语音特征进行误识别推理,从而根据误识别推理的标签来判断该命令词是否正确。此外,本发明在离线命令词识别的应用过程中,根据识别结果不断收集具有标签的正、负样本,从而对误识别过滤引擎进行增量训练。本发明适用于离线语音识别系统。
173 音频信号处理方法、设备、服务器及计算机可读存储介质 CN202211209224.4 2022-09-30 CN117854481A 2024-04-09 李裕兴; 霍伟明
发明公开了一种音频信号处理方法、设备、服务器及计算机可读存储介质,基于模数转换增益调节待识别音频信号,并对所述待识别音频信号进行语音识别;在语音识别失败时,根据所述待识别音频信号的信号幅值更新所述模数转换增益,并调转执行所述基于模数转换增益调节待识别音频信号,并对所述待识别音频信号进行语音识别的步骤。本发明旨在提高语音识别率。
174 跨语言语音生成方法、系统及存储介质 CN202410054026.8 2024-01-12 CN117854472A 2024-04-09 叶俊杰; 王伦基; 李权; 莫世玉; 成秋喜
发明公开一种跨语言语音生成方法、系统及存储介质,应用于语音合成技术领域,能够实现在不同语言之间目标对象的语音生成,提高语音生成的完整性和可靠性。该方法包括:获取待合成目标对象语音数据,输入预设语音合成模型;通过目标对象特征提取器对语音波形文件提取得到目标对象嵌入向量;通过目标对象条件感受器对语音波形文件进行计算得到目标对象潜在条件向量;根据待合成文本数据和目标语言信息进行转化编码处理得文本记号序列;根据文本记号序列和目标对象潜在条件向量通过预设语音特征生成器计算得到生成声音记号序列;根据生成声音记号序列和目标对象嵌入向量通过声音解码器进行音频波形生成,得到目标语音波形信号
175 声学及语言学打分的不达标连续语音标注数据检查方法 CN202311855299.4 2023-12-29 CN117854471A 2024-04-09 赵柳
发明公开了一种声学及语言学打分的不达标连续语音标注数据检查方法,属于连续语音识别技术领域。所述方法包括:获取待检测音频和标注文本合成音频,分别计算待检测音频与标注文本合成音频之间的声学相似度打分、标注文本的语言模型混淆度打分,之后将所述声学相似度打分和所述标注文本的语言模型混淆度打分进行融合,通过设置阈值的方式判断待检测音频标注是否达标。本发明能将不合格的标注数据快速找出呈现给检查端,极大的提升标注数据的检查进度。
176 用于汇总机动车辆中的对话的方法及机动车辆 CN202311113776.X 2023-08-31 CN117854465A 2024-04-09 S·汉里德尔; S·迈尔; T·施莱彻; M·穆勒; M·格朗德; B·波平嘉
发明涉及一种用于汇总机动车辆(10)中的对话的方法。所述方法包括如下步骤:由车辆传感器系统(18、20、22)确定(S10)是否存在挑战性驾驶任务;如果存在挑战性驾驶任务,则通过生成抵消声来为驾驶员(14)屏蔽(S12)机动车辆(10)中的对话;通过至少一个车辆麦克(22)接收(S14)机动车辆(10)中的对话;通过人工智能单元评估(S16)并汇总所接收的对话;在判定挑战性驾驶任务不再存在之后,为驾驶员(14)输出(S18)所汇总的对话;在输出所汇总的对话之后,停用(S20)抵消声。
177 用于键盘乐器的键盘装置 CN202311257906.7 2023-09-27 CN117854460A 2024-04-09 鬼头慧
一种用于键盘乐器的键盘装置包括键盘底架,其由合成树脂制成,并且具有用于支承在左右方向上延伸的止动件的止动件支承部分。键在前后方向上延伸,并且各个键通过其按下而向下枢转地移动,并且通过其松开而向上枢转地移动,以移动到经由其向前突出的接触部分从下方与止动件接触,从而使其进一步向上枢转移动被阻止。止动件支承部分包括沿键的整体在左右方向上延伸的板状竖立部分,以及使止动件安装在其下表面上的止动件安装部分。键盘底架进一步包括竖立在竖立部分的前表面上的板状肋,使得肋分别与键的接触部分中的对应一个相关联。
178 音频调整方法、系统、计算机设备和计算机可读存储介质 CN202311663676.4 2023-12-06 CN117854458A 2024-04-09 岳伯禹; 李成
发明公开了一种音频调整方法、系统、计算机设备和计算机可读存储介质,涉及音频处理技术领域,方法包括:对待调整音频进行分轨,得到每个声源对应的音轨数据;确定至少一个目标声源,并对每个目标声源对应的音轨数据进行变调处理,得到每个目标声源对应的最终音轨数据;将每个目标声源对应的最终音轨数据和未进行变调处理的音轨数据进行合并,得到调整好的音频。本发明只需要录制一次音频,通过对声源对应的音轨数据进行变调处理,能够更灵活地实现不同的音频效果,极大降低经济成本和时间成本。
179 一种基于设备运行音频的异常设备监控方法及系统 CN202311795505.7 2023-12-25 CN117854245A 2024-04-09 黄毅伟; 李少洋; 涂万里; 邢子龙; 史超; 丁亚彪; 王盈佳
发明公开了一种基于设备运行音频的异常设备监控方法及系统,包括:首先响应于异常设备监控指令,确定待监控的目标环境;然后收集目标环境中的声音,并提取其中的目标设备运行音频;根据这些运行音频,确定设备的异常情况;最后根据设备异常情况表征的异常情况等级,发起对应等级的报警信息。如此设计,通过自动收集和分析设备运行音频,可以实时地监控设备状态,及时发现设备的异常情况,并根据异常的严重程度,发起相应等级的报警信息。这将大大提高设备监控的效率和准确性,同时也降低了对人工检测的依赖。
180 具隐私保护的危安行为与语意的辨识系统与方法 CN202311810465.9 2023-12-26 CN117854147A 2024-04-09 钟金峯; 王忠祥; 魏家博
发明为一种具隐私保护的危安行为与语意的辨识系统与方法,该系统包含至少一监测主机及一监测后台,该监测主机通过红外线镜头拍摄需监测场所的被照护人员的热影像,且该监测主机通过收音麦克收录该场所的人员声音或环境声音,并对各热影像进行分析,以判断该热影像中的人形动作,以及对收录的声音进行辨识,以识别人员声音或环境声音。当该人员的动作行为或人员声音或环境声音已符合发出警示讯息的条件时,该监测主机向监测后台发报警示讯息,令该监测后台的管理人员可即时发现被照护人员发生暴对话、急难呼救、坠床、跌倒或长时间静止不动等可能的危安语意或动作的行为,并可即时处置。