会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
181 基于振动和声音的预测性维护对提升系统监测的方法 CN202311548455.2 2023-11-20 CN117853085A 2024-04-09 代岩; 张传江; 雷雨; 殷鹏; 殷仕诚; 邵卫; 李文军; 王鲜; 戚士永; 徐继营; 杨超; 罗新成; 杨浩强
发明提供了基于振动和声音的预测性维护对提升系统监测的方法,包括有以下步骤:S1、新增接触式声纹传感器和非接触式声纹传感器监测提升系统;S2、采集提升系统正常运行状态下的振动、声音和温度数据;S3、对三个维度的数据在时序上做对齐;S4、将对齐的数据填充到算法中进行训练,得到正样本训练出的算法模型,并给出本次训练的打分阈值;S5、模型给出打分结果,通过与阈值对比,判断设备是否有异常;本发明以机器声纹为核心的多传感器信息融合系统,同步采集声音、振动、温度等多维度特征,运用深度学习人工智能建模技术,构建提升系统声纹数据模型,通过对输入音频处理及预测,能够实时生成残差值。
182 一种财富数据交互式管理系统及方法 CN202410020051.4 2024-01-06 CN117851462A 2024-04-09 褚国峰
发明公开了一种财富数据交互式管理系统及方法,该系统包括用户管理模用于管理用户的个人信息,财富数据管理模块统计该用户对应的财富资产数据,财富数据展示模块展示第一资产数据,经济数据管理模块获取多个不同经济数据源实时的经济数据,建议推送模块用于将第一资产数据与市场经济报告数据进行分析,得到分析建议,语音交互模块用于识别用户语音指令,并根据所述语音指令进行分析,以及将分析结果作为检索字段到数据库中进行检索筛选出用户所需要的数据,并通过语音播放形式外放。本发明通过以上设计,可以丰富其财富数据管理系统的功能,同时增强与用户的交互,从而提升用户体验。
183 基于虚拟形象的语音交互方法及智能终端 CN202310376624.2 2023-03-31 CN117850733A 2024-04-09 吴佳伦; 郏友涛; 盖于涛; 姜飞俊
说明书一个或多个实施例提供一种基于虚拟形象的语音交互方法及智能终端。该方法包括:获取所述智能终端待输出的与用户输入的用户语音对应的反馈语音;获取所述反馈语音对应的语音特征,并基于所述语音特征预测与所述反馈语音同步的面部特征信息;基于所述面部特征信息对虚拟形象进行可视化渲染,并输出可视化渲染后的所述虚拟形象,以使所述虚拟形象在播报所述反馈语音的过程中同步呈现与所述面部特征信息对应的面部表情。
184 基于虚拟现实的交互方法、装置、设备及存储介质 CN202410052573.2 2024-01-12 CN117850596A 2024-04-09 张敬相; 张帅兵
本公开提供了基于虚拟现实的交互方法、装置、设备及存储介质,涉及计算机技术领域,尤其涉及人工智能、大语言模型等技术领域。具体实现方案为:根据接收到的交互信息,从候选交互对象对应的候选虚拟形象中确定目标虚拟形象;获取目标虚拟形象对应的目标画像信息;根据目标画像信息和交互信息,生成目标虚拟形象针对交互信息的反馈信息。本公开提供的方案能够根据用户发送的交互信息选择目标虚拟形象并生成对应的反馈信息,实现用户与虚拟形象之间的交互,并保证反馈信息与交互信息和目标虚拟形象的画像信息之间的贴合性,有效提升交互的智能化程度和交互体验。
185 基于两级MPSO-SVM算法的睡眠体位声学判别方法 CN202410008190.5 2024-01-02 CN117838048A 2024-04-09 许志勇; 蔡佳燕; 赵兆; 田巳睿
发明公开了一种基于两级MPSO‑SVM算法的睡眠体位声学判别方法,包括:采集整夜睡眠声音,并进行预处理以及声音活动检测,得到整夜睡眠中的声音片段,并对数据进行标记;对睡眠有声片段进行特征提取,获得梅尔频率倒谱系数、空间特征;对声音片段进行标注,将提取到的特征按比例分为训练集和测试集;基于MPSO算法对SVM模型的关键参数进行优化,将睡眠声音数据通过两级SVM进行训练,获得两级SVM模型;利用训练后的两级SVM分类器对待检测的睡眠声音数据进行鼾声检测及睡眠体位判别。本发明基于睡眠实测数据,采用麦克阵列技术实现噪声环境下鼾声体位的准确识别,运行效率高且易于实现,对于睡眠质量监测具有重要意义。
186 一种声发射信号分类方法、计算机设备及介质 CN202410121543.2 2024-01-30 CN117647587B 2024-04-09 黄槿亮; 朱兆林; 任浩然; 陈志豪; 鲁昊天; 杨子瑾
发明公开一种声发射信号分类方法、计算机设备及介质,涉及无损检测和声发射信号处理领域,该方法通过多个传感器获取的同一振动实验装置的目标声发射信号,对各目标声发射信号的MFCC特征、LPC特征、GTCC特征进行拼接融合,得到MFCC融合特征、LPC融合特征、GTCC融合特征和M‑GTCC‑LPC特征,通过融合拼接后的上述特征进行声发射信号分类,提高了声发射信号分类的精度
187 数据处理方法、装置、电子设备、程序产品及介质 CN202210597334.6 2022-05-27 CN115132197B 2024-04-09 陈杰; 苏丹
申请实施例公开了数据处理方法、装置、电子设备、程序产品及介质,可应用于数据处理技术领域。其中方法包括:根据目标时间窗内的K个语音的语音数据分别对应的音频特征,确定目标时间窗的语音数据是否命中命令词;当目标时间窗的语音数据命中命令词时,确定与当前语音帧关联的验证时间窗;确定验证时间窗内的语音数据与每个命令词对应的第一置信度,并确定验证时间窗对应的关联特征;基于每个命令词对应的第一置信度以及关联特征确定命中的结果命令词。采用本申请实施例,有助于提升对语音数据的命令词检测的准确度。本申请实施例还可应用于技术、人工智能、智慧交通、辅助驾驶、智能家电等各种场景。
188 直播平台的信息处理方法、装置、计算机设备及存储介质 CN202210573939.1 2022-05-24 CN115002496B 2024-04-09 杨紫颖
申请实施例公开了一种直播平台的信息处理方法、装置、计算机设备及存储介质。本方案根据主播客户端采集主播用户的语音消息,根据语音消息从多个预设虚拟礼物中选取符合当前直播内容的目标虚拟礼物,然后主播客户端将目标虚拟礼物发送至观众客户端,观众客户端可以直接在直播界面显示目标虚拟礼物,方便观众用户快速进行送礼操作,缩短直播过程中的送礼流程,提高直播过程中用户送礼效率。
189 一种用于麻醉手术的智能辅助系统及方法 CN202111677791.8 2021-12-31 CN114366030B 2024-04-09 贾朋飞; 迟淞元; 吕甜甜; 杨洪波
发明公开一种用于麻醉手术的智能辅助系统及方法,系统包括:硬件监测终端对多种生理指标数据进行采集和传输、融合;数据库接收并存储麻醉案例数据和病患基础信息数据以及生理指标数据;决策模块获取生理指标数据、麻醉案例数据以及病患基础信息数据、制定生理指标差异化规范、训练包括生理指标健康评估、潜在症状预测以及诊疗方案推荐的决策模型;医生应用终端获取生理指标健康评估、潜在症状预测、诊疗方案推荐并进行调校;语音模块提供数据联动、询问和播放的语音交互服务。本发明设置的语音交互服务,生理指标异常或存在某种可疑症状时可给出语音提醒;也可为医生提供病患生理指标发展情况或诊疗方案建议;有效减轻医生注意负担,提升手术安全性。
190 语音识别方法、装置、设备及存储介质 CN202010554161.0 2020-06-17 CN113808582B 2024-04-09 徐文铭; 杨晶生; 郑翔; 苗天时
本公开实施例公开了一种语音识别方法、装置、设备及存储介质。包括:获取目标关键词列表;其中,所述目标关键词列表由全局关键词列表和相关关键词列表融合获得;所述相关关键词列表根据音视频会议的内容生成;基于所述目标关键词列表对所述音视频会议的语音信息中的关键词进行识别。本公开实施例提供的语音识别方法,基于全局关键词列表和相关关键词列表融合而成的目标关键词列表,对语音信息中的关键词进行识别时,可以基于目标关键词列表进行识别,从而提高关键词识别的准确性。
191 频带增益模型的训练方法及用于车载场景的语音降噪方法 CN202110985541.4 2021-08-26 CN113782011B 2024-04-09 姜彦吉; 张胜; 宋湘钰; 范佳亮; 彭博
发明公开了频带增益模型的训练方法及用于车载场景的语音降噪方法,训练方法包括以下步骤:将纯语音信号和纯噪声信号分别分后,并逐帧按照频率进行分带,得到纯语音频带和纯噪声频带,将纯语音信号和纯噪声信号混合后,对其进行分帧处理,并逐帧按照相应频率进行分带,得到带噪语音频带,根据各纯噪声、纯语音、带噪语音频带的能量,以得到纯噪声频带相应的对数谱、增益期望值和特征值;将特征值输入频带增益模型,以输出各带噪语音频带对应的增益值,并利用增益期望值以及对数谱作为标签进行神经网络训练,以实现对所述频带增益模型的参数优化。本发明提供的训练方法及语音降噪方法对带噪语音进行降噪的同时保证语音识别系统的鲁棒性。
192 语音交互模型的训练方法、语音交互方法及装置 CN202110931751.5 2021-08-13 CN113658585B 2024-04-09 瞿琴; 吴玉芳; 刘兵; 吴震; 王潇; 付晓寅; 臧启光
本公开提供了一种语音交互模型的训练方法、语音交互方法及装置,涉及人工智能技术中的语音技术深度学习技术,可以应用于人机交互语音识别的场景。包括:获取训练语音文本,并对训练语音文本进行解析处理,得到训练语音文本的训练句式信息,对训练语音文本进行特征提取,得到第一语音特征,对所述训练句式信息进行特征提取,得到第二语音特征,根据第一语音特征和第二语音特征,训练得到语音交互模型避免了相关技术中确定是否需要对交互语音进行澄清缺乏泛化能的弊端,提高了普遍适用性,且提高了确定是否需要澄清的准确性,从而提高了语音交互的可靠性的技术效果。
193 唤醒程度识别模型训练方法及语音唤醒程度获取方法 CN202110462278.0 2021-04-27 CN113192537B 2024-04-09 邵池; 黄东延
申请实施例提供了一种唤醒程度识别模型训练方法及语音唤醒程度获取方法,其中方法包括:获取样本语音的唤醒程度标签,并根据所述样本语音的唤醒程度标签对部分所述样本语音进行数据增强;提取所述样本语音对应序列的特征矩阵;将各类唤醒程度标签对应帧序列的特征矩阵及对应的唤醒程度标签输入神经网络进行训练。通过所提供的唤醒程度识别模型训练方案,针对不同唤醒程度的样本语音进行特征提取,并输入到神经网络中进行训练,这样即可得到能够识别语音唤醒程度的唤醒程度识别模型。将唤醒程度识别模型应用于语音识别场景,在基础语音识别的基础上增加唤醒程度的识别,增强语音识别的准确性和多样性。
194 在调用短语检测中选择性地适配和利用噪声降低技术 CN201980014370.1 2019-01-14 CN111742362B 2024-04-09 克里斯托弗·休斯; 黄译腾; 图拉伊·扎基扎德·沙别斯塔雷; 泰勒·阿普勒鲍姆
描述了用于在检测音频数据流的一个或多个特征时选择性地适配和/或选择性地利用噪声降低技术的技术。例如,各种技术涉及在检测音频数据帧流中的调用短语、检测音频数据帧流中的话音特性(例如,用于说话者识别)等时选择性地适配和/或利用噪声降低技术。利用描述的技术能够在各种情形下诸如在具有强背景噪声的环境中得到对音频数据帧流的特征的更鲁棒和/或更准确的检测。在各种实现方式中,结合自动化助理实现描述的技术,并且利用本文描述的技术检测到的特征来适配自动化助理的功能性。
195 歌曲合唱的方法、装置及系统 CN202010223176.9 2020-03-26 CN111402844B 2024-04-09 范苑; 黄裕佳; 田先明; 黄仕强
申请是关于一种歌曲合唱的方法、装置及系统,属于通信领域。所述方法包括:第一终端获取待合唱歌曲的歌曲信息,待合唱歌曲的歌词信息和伴奏信息,所述歌曲信息包括所述待合唱歌曲的歌曲标识;第一终端向第二终端发送合唱请求,所述合唱请求包括所述歌曲信息,所述合唱请求用于所述第二终端基于所述歌曲信息获取所述待合唱歌曲的歌词信息和伴奏信息;第一终端播放所述待合唱歌曲的歌词信息和伴奏信息,并获取所述待合唱歌曲的播放进度;第一终端向所述第二终端发送第一播放请求,所述第一播放请求包括所述播放进度,所述第一播放请求用于所述第二终端基于所述播放进度播放所述待合唱歌曲的歌词信息和伴奏信息。本申请能够实现实时合唱。
196 包括连杆机构的键盘装置 CN201910881060.1 2019-09-18 CN110930971B 2024-04-09 寺井康志; M.V.普莱特内夫; A.A.尼基丁; 石田秀行
发明涉及一种包括连杆机构的键盘装置,具体公开了:一种键盘装置,其具有琴键,所述琴键尽管被配置成长度短于大琴的琴键的长度,但能够获得足够触重。连杆机构各自设置在基部上,以用于从下方支撑琴键中的相关联的一个,并且被配置成引起相关联琴键操作成使得当按下琴键的前端时,琴键的后端的向下移动量变为琴键的前端的向下移动量的近似一半。每个连杆机构包括前侧和后侧琴键连杆条以及前侧和后侧连接连杆条。前侧和后侧连接连杆条分别被枢转地支撑,并且经由其相应的后端和前端枢转地和可滑动地彼此连接。
197 语音识别方法和装置 CN201780078456.1 2017-12-14 CN110088833B 2024-04-09 金相润; 金成洙; 金逸桓; 李暻慜; 金南勋; 柳宗烨; 李在原
提供了一种语音识别方法和语音识别装置,其预先下载预测使用的语音识别模型并在语音识别中使用语音识别模型。所述语音识别方法,由所述语音识别装置执行,包括:基于用户信息确定语音识别模型,下载语音识别模型,基于语音识别模型执行语音识别,以及输出执行语音识别的结果。
198 基于语音识别的保单录入方法和相关装置 CN201811527496.2 2018-12-13 CN109524009B 2024-04-09 罗柏发
发明提供用于基于语音识别的保单录入方法和相关装置,方法包括:接收语音采集终端发送的目标语音数据;对目标语音数据进行语音识别,得到目标语音数据对应的保单信息;根据保单信息以及目标保单项目确定目标保单项目对应的多个第一信息选项;将多个第一信息选项发送给语音采集终端,以使语音采集终端在保单录入用户对目标保单项目进行录入时,向保单录入用户显示多个第一信息选项;接收语音采集终端针对目标保单项目返回的保单项目信息,保单项目信息关联于多个第一信息选项中的至少一个信息选项;将保单项目信息作为目标保单项目对应的信息录入至保单信息存储系统,保单信息存储系统用于保存保单信息。该技术方案可以提高保单录入的效率。
199 用于实时处理医学图像的系统和方法 CN202280052703.1 2022-07-04 CN117836870A 2024-04-05 阿扎尔·阿扎德; 熊博; 大卫·阿姆斯特朗; 方淇音; 大卫·弗利特; 米查·利夫尼
本文描述了用于分析在医疗诊断过程中获得的图像和语音的系统的各种实施例,以使用具有至少一个感兴趣对象(OOI)的一个或多个图像的注释数据和分类来自动生成注释图像,其中注释数据包括根据用户对具有至少一个OOI的一个或多个图像进行注释所提供的语音生成的文本。
200 具有从语音信号覆盖在显示器上的可移动嘴唇的图像的翻译的护目镜 CN202280057763.2 2022-07-29 CN117836852A 2024-04-05 凯瑟琳·沃辛顿·麦克马洪
具有语音至移动嘴唇算法护目镜,语音至移动嘴唇算法接收和翻译通过护目镜观看的人的语音和话语,并且然后在被观看的人的面罩上显示对应于语音和话语的移动嘴唇的覆盖。具有文本至移动嘴唇信息的数据库被用于翻译语音并且以很少的等待时间近实时地生成移动嘴唇。这种翻译为聋/听受损的用户提供了与通过眼镜观看的人在他们佩戴面罩时进行理解和交流的能力。翻译可以包括自动语音识别(ASR)和自然语言理解(NLU)作为声音识别引擎。