会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
41 一种词边界估计方法、装置及电子设备 CN201910832104.1 2019-09-04 CN112447169B 2024-04-19 陈孝良; 王江; 冯大航; 常乐
42 共鸣音信号发生方法、共鸣音信号发生装置、记录介质及电子音乐装置 CN202010917065.8 2020-09-03 CN112447159B 2024-04-19 小岛裕之; 仲田昌史
43 用于自然语言处理的音频分析 CN201980029699.5 2019-05-02 CN112074900B 2024-04-19 E·维瑟; F·扎基; Y·郭; S·穆恩; L-H·金; R·乔德里
44 一种订单处理方法、装置、电子设备及存储介质 CN201910414644.8 2019-05-17 CN111862946B 2024-04-19 葛檬; 张睿雄
45 一种3D模型的加载显示方法及电子设备 CN202010408322.5 2020-05-14 CN111639221B 2024-04-19 崔颖
46 可隐匿于琴壳体内的功能面板装置及其使用方法 CN201910773012.0 2019-08-21 CN110400549B 2024-04-19 马季平
47 拼接式隔声量可调磁流变液隔声体及其隔声单元 CN201811314933.2 2018-11-06 CN109147748B 2024-04-19 徐晓美; 刘凯; 孙宁; 苏敏; 陈宁; 孙嵩松; 赵奉奎
48 交互式琴及交互方法 CN201511011485.5 2015-12-30 CN105741826B 2024-04-19 吴天延
49 直播视频自动化剪切方法、装置、设备及介质 CN202410084558.6 2024-01-19 CN117896574A 2024-04-16 毛羽
申请涉及一种直播视频自动化剪切方法、装置、设备及介质,应用于图像处理技术领域,其方法包括:获取待剪辑的直播视频和目标短视频的剪辑需求;对所述直播视频进行语音翻译,得到视频翻译内容;基于所述视频翻译内容和预设关键词库确定所述直播视频的直播关键词;基于所述直播关键词确定所述目标短视频的视频主题;基于所述视频翻译内容和所述直播关键词给所述视频翻译内容增加时间戳;基于所述剪辑需求、所述时间戳和所述视频主题对所述直播视频进行剪切,生成目标短视频。本申请具有提高短视频剪辑的连贯性的效果。
50 通信策略生成方法、控制方法、系统、设备及介质 CN202211222062.8 2022-10-08 CN117896364A 2024-04-16 宋志刚
发明公开了通信策略生成方法、控制方法、系统、设备及介质,通信策略生成方法包括:获取用户的历史语音数据,所述历史语音数据根据用户的历史语音指令生成,所述历史语音数据用于触发所述车载端与服务端的通断;根据所述历史语音数据生成通信策略,所述通信策略用于控制所述车载端与所述服务端的通断,根据用户的历史语音数据进行学习,以根据用户的语音习惯生成匹配的通信策略,用于控制车载端和服务端的通断,能够在不影响用户通信的情况下,减少对于带宽及服务端资源的占用。
51 一种用于音频压缩历史识别任务的音频数据集的构建方法 CN202311784000.0 2023-12-22 CN117894326A 2024-04-16 孟宪佳; 陈佳林; 易江燕; 丁勤勤; 王成龙
发明属于音频取证的压缩历史识别领域,公开了一种用于音频压缩历史识别任务的音频数据集的构建方法,该数据集包含不同音频压缩格式的多种常用码率,包含一次压缩和二次压缩音频文件,包含含有多种视频格式的音视频格式转换子集。旨在创造一个普遍通用与压缩历史识别任务的数据集。该数据集作为一个可以用于音频压缩历史识别的可靠的开源数据集,成为挑选优越的音频压缩历史识别方法的主要参考数据集。为未来的音频压缩历史识别研究提供有价值的参考资源。
52 基于扩散模型的语音印注入及确权方法和系统 CN202410005991.6 2024-01-03 CN117894323A 2024-04-16 胡嘉宸; 韩蒙; 李荣昌; 罗文杰; 欧南涵; 林昶廷; 陈建海
发明公开了一种基于扩散模型的语音印注入及确权方法和系统,包括:获取原始语音音频并利用ID提取器提取原始语音音频中的第一水印信息;将原始语音音频转换为梅尔频谱图,利用扩散模型基于梅尔频谱图通过前向扩散添加噪声得到噪声数据,基于噪声数据通过后向扩散去噪实现水印注入,得到添加水印的生成语音音频;利用ID解码器对生成语音音频进行解码得到第二水印信息,比较第一水印信息与第二水印信息实现语音音频的确权。该方法和系统可以改进语音水印注入的鲁棒性和不可感知性。
53 模型训练方法、电子设备、存储介质及程序产品 CN202410108323.6 2024-01-25 CN117894315A 2024-04-16 张莉娜; 魏光辉; 宋莎莎
本公开提供了模型训练方法、电子设备、存储介质及程序产品。本公开还提供的模型训练方法包括:获取多媒体文件集;对于多媒体文件集中任一多媒体文件,将该多媒体文件的语音输入第一语音识别模型,得到语音识别结果;对该多媒体文件的字幕进行光学字符识别,得到文本识别结果;根据多媒体文件集中多媒体文件的语音、语音识别结果和文本识别结果训练第二语音识别模型。
54 语音识别控制方面的仿生机器人 CN202410225452.3 2024-02-29 CN117894311A 2024-04-16 刘志坚; 刘旭; 原俊杰; 潘远娇; 刘贞; 刘运钦; 陈世超; 宋建达; 胡晓伟; 张洪国
发明涉及语音识别控制技术领域,具体为语音识别控制方面的仿生机器人,语音识别控制方面的仿生机器人包括语音识别模、用户意图分析模块、行为模式识别模块、安全性增强模块、任务优先级调整模块、异常状态识别模块、决策支持模块、响应执行模块。本发明中,采用卷积神经网络和长短期记忆网络深度分析语音信号,提升识别准确性,双向编码器表示从变换器模型,深入解析文本语义,准确把握用户意图,隐尔可夫模型和声纹识别技术,优化行为模式识别和安全性,遗传算法和隔离森林算法,实现资源优化和异常检测,增强系统响应和稳定性,通过决策树贝叶斯网络,进行险收益分析,利用状态机模型和规则引擎,提高执行精准性。
55 一种语音识别模型的训练方法、语音识别方法和相关装置 CN202311870858.9 2023-12-29 CN117894301A 2024-04-16 杨阳; 程磊; 朱家泉; 蔡旭浦; 陆海俊
申请公开了一种语音识别模型的训练方法、语音识别方法和相关装置,该方法包括:利用语音识别模型对第一样本语音特征进行多次编码处理,得到第一样本语音编码特征,其中,至少一次编码处理作为目标编码处理,目标编码处理得到的编码特征作为样本目标特征,目标编码处理的输出特征为基于目标编码处理对应的样本分类特征得到,样本分类特征是对样本目标特征进行对应的目标建模单元的分类预测得到,对第一样本语音编码特征进行解码,得到第一样本语音对应的第一样本识别文本;基于第一样本识别文本和样本分类特征,调整语音识别模型的模型参数,能够提升语音识别模型的训练效率。
56 移动终端的语音控制方法及装置 CN202311869929.3 2023-12-31 CN117894297A 2024-04-16 陈才立
发明涉及一种移动终端的语音控制方法及装置。其中,移动终端的语音控制方法,可以在本地设备中运行语音处理,并实现语音识别和关键词的匹配,相较于传统语音识别需要用到利用识别模型进行声音向量分析以及采用语音模型选择最可能的文字,本申请利用拼音进行控制,无需考虑文字的准确性即可满足语音控制的准确性需求。
57 基于音频分离的原伴唱音频识别方法及存储介质 CN202211255142.3 2022-10-13 CN117894296A 2024-04-16 陈勇; 王子亮; 马雪怀
发明公开了一种基于音频分离的原伴唱音频识别方法及存储介质,方法包括:获取待识别多媒体文件,并提取所述待识别多媒体文件中的第一音频和第二音频;分别提取各音频中的人声成分,得到各音频对应的人声成分音频;分别计算所述第一音频和第二音频对应的人声成分音频的能量值;根据所述第一音频和第二音频对应的人声成分音频的能量值,确定原唱音频和伴唱音频。本发明可提高原伴唱音频的识别效率。
58 一种基于物联网的智能琴调音系统 CN202410160252.4 2024-02-05 CN117894283A 2024-04-16 张珈瑞
发明涉及物联网技术领域,本发明公开了一种基于物联网的智能琴调音系统,包括信息采集模、信息去噪模块、音频监测模块、低频段计算模块、高频段计算模块、波形模拟模块,波形对比模块,以及修正调节模块,信息采集模块利用传感器采集音频信号,信息去噪模块对音频信号进行预处理和去噪操作,音频监测模块确定音频频段,低频段计算模块计算得出低频段信号的谐波系数,高频段计算模块计算得出高频段信号的谐波系数,波形模拟模块计算得出模拟波形指数,波形对比模块将系统自动生成二维图形与预设的标准波形图形对比,判断是否吻合,修正调节模块对判断结果为不吻合的部分进行调音操作。
59 一种基于蚂蚁算法的智慧安防人员违章作业监测方法 CN202410057391.4 2024-01-15 CN117893970A 2024-04-16 杨劲松; 王远洪; 龚登位; 马景山; 马庆志; 张鹤鸣; 何战勇; 康建伟; 刘进涛; 陈映喜; 郭豪; 欧阳杰; 贺臻; 陈红; 郭光波
发明公开了一种基于蚂蚁算法的智慧安防人员违章作业监测方法,包括:采集安防人员的人脸、声纹信息并进行预处理,生成样本数据;对样本数据添加UWB标签和身份地址IP,生成唯一标识的电子工牌二维码,并将其上传至终端后台进行存储;基于蚂蚁算法构建识别模型,调取存储的电子工牌二维码对优选识别模型进行预训练,迭代N次后,生成优选识别模型;获取待识别安防人员的人脸、声纹信息,查看是否生成如终端后台存储的电子工牌二维码:若未生成,则待识别安防人员未通过验证,向终端后台发送验证未通过消息,终端后台通过信息交互,远程关闭待识别安防人员所在周围5米内对设备设施的作业操作权限;若生成,则待识别安防人员通过验证。
60 一种相框、基于相框的展览方法 CN202410296698.X 2024-03-15 CN117893649A 2024-04-16 魏博
发明公开了一种相框、基于相框的展览方法,其中,所述相框的框体包括显示模、语音采集模块、处理模块,所述相框在被启动后,所述语音采集模块拾取观看者的语音信息;所述处理模块基于所述语音信息对当前显示的画像中的人物进行处理,以使画像中的人物与观看者进行交互;所述显示模块对交互过程中的画像进行显示。通过语音技术,赋予照片和画作更生动、沉浸式的展示体验。该相框能识别展示的图片内容并自动生成相应的语音描述,使观众通过听觉和视觉更深入地了解作品。与传统相框相比,本发明为艺术作品展示带来新的交互层面,丰富了观赏体验。克服了相关技术中仅通过视觉呈现作品,限制了艺术作品的传达和沉浸式体验。