会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 乐器;声学
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
121 基于AI的直饮质量监测方法 CN202311106485.8 2023-08-30 CN117235661B 2024-04-12 张志慧
发明涉及直饮质量监测方法技术领域,具体为基于AI的直饮水质量监测方法,包括以下步骤,使用IoT设备和传感器进行水质基础数据收集,对水质基础数据进行预处理,生成预处理后的水质数据集。本发明中,通过IoT设备、计算机视觉和声信号三种不同的采集手段,确保了水质的综合评估,避免了单一监测方式可能遗漏的问题,通过数据清洗和标准化,确保后续分析的准确性,特征工程和计算机视觉技术则从大量的数据中提取关键特征,提高了模型的分析效率,将不同的数据源融合,提高了水质评估的准确性,在识别到水质异常时,能够及时进行预警,避免了对人体健康的潜在危害,此外,还能为管理部提供优化建议,促进水质管理的持续改进。
122 一种基于主动降噪量调节的滤波器自适应调节方法 CN202210864555.5 2022-07-21 CN115312021B 2024-04-12 郭骏华; 张德宝; 陈沧毅
发明公开了一种基于主动降噪量调节的滤波器自适应调节方法,包括如下步骤:步骤一、将耳机放置于调测系统的人工耳上,关闭耳机的主动降噪,通过声卡输出扫频信号驱动音箱发出指数扫频噪声信号;步骤二、关闭耳机的反馈降噪控制器,开启前馈降噪控制器,并且设置数字滤波器为直通滤波器;步骤三、根据采集的数据FR1、FR2对主动降噪量进行估计,并将主动降噪引入数字滤波器的优化设计中;步骤四、对耳机写入新滤波器,重新进行曲线测量,本发明在自动化地生成滤波器的过程中,能够对主动降噪量进行估计,能够对目标频段的主动降噪施加约束,保证耳机在目标频段的主动降噪量。
123 一种基于场景的汽车语音控制系统及控制方法 CN202210257817.1 2022-03-14 CN114758654B 2024-04-12 冷真凤; 孙迪
发明公开了一种基于场景的汽车语音控制系统及控制方法,其针对车内语音控制功能,根据不同场景进行了不同的区分,在车内人员睡觉或者打电话时,关闭车内语音控制功能,同时关闭车外语音控制功能,在车辆静止且车内有人的场景下,如果未征得车内人员同意,车外语音控制功能会关闭,只有声纹识别成功且征得车内人员同意的情况下才能开启车外语音控制功能,在车辆静止且车内无人的场景下,只有车外人员人脸识别成功,且车外人员声纹识别成功时,场景识别控制器才确定开启车外语音控制功能。本发明能提升用户体验,提高车辆及车内人员安全性。
124 对话推荐方法、模型的训练方法、装置、设备及介质 CN202210154576.8 2022-02-18 CN114550705B 2024-04-12 柳泽明; 刘浩; 牛正雨; 吴华; 王海峰; 熊辉
本公开提供了一种对话推荐方法、对话推荐模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及数据处理技术领域,尤其涉及语音交互、深度学习人工智能等技术领域。具体实现方案为:获取历史对话信息;基于历史对话信息,从对话目标图谱中确定待生成的目标对话对象,对话目标图谱包括对象节点,对象节点用于表征对话对象,目标对话对象是基于对象节点确定的;以及基于目标对话对象,生成用于推荐的目标对话信息。
125 背景音效的转换方法、装置、计算机设备及存储介质 CN202210140971.0 2022-02-16 CN114449339B 2024-04-12 彭宁
申请涉及图像处理技术领域,揭露一种背景音效的转换方法、装置、计算机设备及存储介质,其中方法包括获取待处理音频以及目标转换类型,其中,目标转换类型包括无线电音效、电话音效以及潜音效;按照预设采样频率对待处理音频进行分处理,得到基础音频;根据预设大小的汉明窗口,对基础音频进行短时傅里叶变换处理,得到初始频谱图;基于目标转换类型,对初始频谱图进行频率范围修改处理,得到目标频谱图,将目标频谱图还原为时域信号,得到目标音效。本发明实施例根据音效转换类型修改频谱图的频率范围,有利于提高背景音效的转换效果的精度,使得背景音效更加具备辨识度。
126 一种目标语音信号干扰信号生成方法及装置 CN202210011028.X 2022-01-05 CN114337908B 2024-04-12 李军锋; 程龙彪; 姚鼎鼎; 顾建军; 颜永红
申请公开了一种目标语音信号干扰信号生成方法及装置,方法包括:获取待干扰的目标语音信号;对目标语音信号进行分处理,获得至少一个语音帧;对其中的每个语音帧进行处理,包括对其进行第一处理、第二处理和/或第三处理,获得频域包络反转信号、时域反转信号和/或时域包络反转信号;根据频域包络反转信号、时域反转信号和/或时域包络反转信号以及与其分别对应的预设权重系数,确定目标语音信号的干扰信号。本申请通过构造三种与目标语音信号相关的频域包络反转信号、时域反转信号、时域包络反转信号,并根据构造的三种信号以及与其对应的预设权重系数,获得目标语音信号的干扰信号进一步提高了干扰信号对目标语音信号的干扰作用。
127 用于家电系统语音识别的方法及装置、家电系统 CN202111415812.9 2021-11-25 CN114244641B 2024-04-12 马玉奇; 杨通
申请涉及智能家电技术领域,公开一种用于家电系统语音识别的方法,包括:在接收到激活指令的情况下,发送反馈信息;在接收到第一控制指令的情况下,发送编号信息;在接收到编号指令的情况下,开启相应家电设备。在控制器接收到激活指令的情况下,通过发送相应的反馈信息确定需开启的目标家电设备是否正确。在接收到第一控制指令的情况下,判定反馈信息中包含的目标家电设备错误,此时自行选取家电设备失败需要重新确定目标家电设备。通过发送编号信息来使用户自行选取要开启的目标设备,为了便于用户操作,用户只需反馈相应的编号即可确定目标设备并开启该目标设备。本申请还公开一种用于家电系统语音识别的装置及家电系统。
128 运用密文手机号进行通话分析的方法、装置、设备及介质 CN202111199677.9 2021-10-14 CN113824845B 2024-04-12 窦国宁
发明公开了一种运用密文手机号进行通话分析的方法,包括步骤:获取电信运营商与店铺之间密文手机号的解密接口规范,及店铺对客户手机号的加密算法及密文手机号的解密接口;依据所述电信运营商与店铺之间密文手机号的解密接口规范,及店铺对客户手机号的加密算法及密文手机号的解密接口,获取电信运营商对客户手机号、店铺外显号码与虚拟号之间的绑定信息;依据所述电信运营商对客户手机号、店铺外显号码与虚拟号之间的绑定信息,获取所述客户与店铺之间的密文通讯和电信运营商回传的实时通话内容信息。本申请扩大了应用场景,有效保护客户的隐私,且店铺可以获取通话内容,并根据通话内容进行分析获取有用信息。
129 用于使用声音质量的估计和控制的源分离的装置和方法 CN201980092879.8 2019-12-20 CN113574597B 2024-04-12 克里斯蒂安·乌勒; 马特奥·托尔科利; 萨沙·迪史克; 约尼·鲍卢斯; 于尔根·赫勒; 奥利弗·赫尔穆特; 哈拉尔德·福斯
提供了一种用于从音频输入信号生成分离的音频信号的装置。音频输入信号包括目标音频信号部分和残差音频信号部分。残差音频信号部分指示音频输入信号与目标音频信号部分之间的残差。所述装置包括源分离器(110)、确定模(120)和信号处理器(130)。源分离器(110)被配置为确定取决于音频输入信号的估计的目标信号,估计的目标信号是仅包括目标音频信号部分的信号的估计。确定模块(120)被配置为根据估计的目标信号的估计声音质量确定一个或多个结果值以获得一个或多个参数值,其中一个或多个参数值是一个或多个结果值、或者取决于一个或多个结果值。信号处理器(130)被配置为根据一个或多个参数值、以及根据估计的目标信号和音频输入信号和估计的残差信号中的至少一个来生成分离的音频信号,估计的残差信号是仅包括残差音频信号部分的信号的估计。
130 一种面向盲人的物体寻找系统及方法 CN202110684533.6 2021-06-21 CN113536945B 2024-04-12 刘华平; 王晨旭; 郭迪; 袁小虎
发明属于图像处理技术领域,特别涉及一种面向盲人的物体寻找系统及方法。本明的目的是为克服已有技术的不足之处,提出一种面向盲人的物体寻找系统及方法。本发明能够将目标检测技术、场景图生成技术与知识图谱技术结合起来,为盲人提供所需要寻找的物体的详细信息,包括其在视野中的相对位置及其在场景图中的相对位置,并在未找到目标时在知识图谱中主动查找相似的替代品,尽可能满足用户的真实需求。本发明从盲人用户的现实需求出发,解决寻找一类物品的问题,可以部署于盲人视觉辅助眼镜、服务机器人等诸多设备。
131 基于BN-SGMM-HMM低资源语音识别方法 CN202110897247.8 2021-08-05 CN113421555B 2024-04-12 赵宏亮; 雷杰
基于BN‑SGMM‑HMM低资源语音识别方法,在低资源条件下,将经过神经网络训练过的瓶颈特征与子空间高斯混合模型结合起来形成基线系统,组成BN‑SGMM‑HMM声学模型,并将该模型移植到树莓派上,完成语音识别任务,相较于传统的语音识别模型相比,该模型在识别率方面有显著提高且参数规模比传统的语音识别系统要小,并且移植到开源硬件上成本低且该语音识别系统无需联网即可使用。
132 语音语义模型的处理方法和装置 CN202110475912.4 2021-04-29 CN113408736B 2024-04-12 张兰英; 江黎枫; 钟亮; 李培; 郭玉春; 王永彬; 许璐; 文禄; 张海宁; 李蔷
发明公开了一种语音语义模型的处理方法和装置。其中,该方法包括:部署语音语义模型;将菜单标准问文件同步到目标租户的应用程序,以使目标租户的应用程序匹配本地菜单文件与菜单标准问文件,生成菜单关联文件,并加载菜单关联文件以启用语音语义模型。本发明解决了现有技术中APP租户依靠手工操作来触发新的语音语义模型生效的技术问题。
133 基于声音的投影仪控制方法、装置、设备及存储介质 CN202110362191.6 2021-04-02 CN112967718B 2024-04-12 吴建雄
申请公开了一种基于声音的投影仪控制方法、装置、设备及计算机可读存储介质,所述基于声音的投影仪控制方法包括:获取待识别声音,并基于特征提取模型,对所述待识别声音进行特征提取,获得所述待识别声音对应的目标声音表征,其中,所述特征提取模型是基于预设目标声音样本集和预设噪音样本集进行对比学习构建的;基于所述目标声音表征和声音识别模型,对所述待识别声音进行声音识别,获得声音识别结果;基于所述声音识别结果对应的控制命令,控制目标投影仪。本申请解决了语音控制投影仪的准确度低的技术问题。
134 语音合成方法、装置、可读介质及电子设备 CN202110075977.X 2021-01-20 CN112786008B 2024-04-12 吴鹏飞; 伍林; 潘俊杰
本公开涉及一种语音合成方法、装置、可读介质及电子设备,涉及电子信息处理技术领域,该方法包括:获取待合成文本和指定声学特征,指定声学特征用于指示音频的韵律特征,提取待合成文本对应的音素序列,将指定声学特征按照音素序列进行扩展,得到声学特征序列,将音素序列和声学特征序列输入预先训练的语音合成模型,以得到语音合成模型输出的,待合成文本对应的目标音频,目标音频的声学特征与指定声学特征匹配。本公开通过指定声学特征来控制文本的语音合成,使得语音合成模型输出的目标音频能够与指定声学特征对应,能够实现语音合成过程中声学特征的显性控制,提高了目标音频的表现
135 一种基于双层知识蒸馏说话人模型压缩系统和方法 CN202011079752.3 2020-10-10 CN112712099B 2024-04-12 李入云; 宋丹丹; 欧阳鹏
发明公开一种基于双层知识蒸馏说话人模型压缩系统和方法,属于立体匹配算法的实现方式技术领域。包括:Embedding层知识蒸馏指导学生网络模仿教师网络的段级说话人表示(说话人表征),它捕获了每个说话人特征的基本分布。Logit层知识蒸馏引导学生网络模仿教师网络的说话人后验概率分布,利用了说话人类别之间的相似性。此方法从教师网络那里迁移了说话人表征分布的层次结构。本发明解决了现有技术中学生网络不能实现较小的说话人类内差异和较大的说话人类间差异,且相同说话人和不同说话人验证系统的准确性较低的问题。
136 语音识别结果的校正方法及装置、电子设备、存储介质 CN202011566768.7 2020-12-25 CN112669845B 2024-04-12 简仁贤; 陈映文; 张嘉恬; 林长洲
申请提供一种语音识别结果的校正方法及装置、电子设备、存储介质,该方法包括:获取同一语音输入的多种候选词序列;针对每种候选词序列,利用已训练的与目标场景对应的个性化模型,计算候选词序列中每个词汇的出现概率;根据每种候选词序列中每个词汇的出现概率,选取最佳词序列;计算最佳词序列中每个词汇与目标场景对应的关键词之间的音素相似度;根据关键词对应配置的阈值,用关键词替换最佳词序列中与关键词之间的音素相似度大于阈值的词汇。该方案可以提高语音识别结果的准确性。
137 一种车载多屏幕的通话方法及装置 CN201910786708.7 2019-08-23 CN112489661B 2024-04-12 张宏升; 吕震; 卢昱; 余蔚
申请公开了一种车载多屏幕的通话方法及装置,该方法包括:在获取到用户的通话启动指令后,首先,根据该启动指令,启动车载多屏幕的通话功能,然后,根据待识别的目标语音或用户的语音启动指令,生成用户的声纹特征,并确定出用户所在区域以及该区域对应的车载屏幕,接着,根据用户的声纹特征、用户所在区域以及对应区域的车载屏幕,按照预设的通话模式,进行车载多屏幕的通话。可见,本申请在启动车载多屏幕的通话功能后,首先生成了用户的声纹特征,并确定出了用户所在的区域及屏幕,进而可以按照预设的通话模式,将各个不同需求的通话界面显示在指定的不同屏幕上,从而可以达到良好的车载多屏幕通话效果,提高乘车人员的通话体验。
138 一种语音处理方法、装置和用于语音处理的装置 CN202011063543.X 2020-09-30 CN112185413B 2024-04-12 潘逸倩; 姚升余
发明实施例提供了一种语音处理方法、装置和用于语音处理的装置。其中的方法包括:获取待处理的语音数据;对所述语音数据进行声源位置估计,检测所述语音数据中的第一跳变点,所述第一跳变点为表示所述语音数据中声源位置发生变化的时间点;基于所述语音数据中说话者表征特征的变化信息以及所述第一跳变点对所述语音数据进行分割,得到分割结果。本发明实施例可以提高说话者分割的准确率。
139 结合RPA和AI的语料数据的获取方法和装置 CN202010840221.5 2020-08-19 CN112036160B 2024-04-12 潘静鹏; 胡景超; 胡一川; 汪冠春; 褚瑞; 李玮
本公开提供的结合RPA和AI的语料数据的获取方法和装置,RPA系统获取语料数据的语料文本以及相应的任务配置信息;RPA系统根据所述任务配置信息生成语料采集任务,并将语料采集任务分配至各第一用户终端,以供所述各第一用户终端根据所述语料文本生成语料采集数据;RPA系统根据所述任务配置信息生成语料采集数据的语料校验任务,并将语料校验任务分配至各第二用户终端,以供各第二用户终端对所述语料采集数据进行校验,获得语料校验结果;RPA系统根据所述语料校验结果将通过校验的语料采集数据作为语料数据进行输出,从而可获得高质量的语料数据。
140 一种车载多音区语音处理的方法和相关装置 CN202010424470.6 2020-05-19 CN111599366B 2024-04-12 王飞; 蒋亚冲; 钱俊
申请公开了一种车载多音区语音处理的方法和相关装置,该方法包括:通过各个车载座椅传感器检测得到包括至少一个位置方向的位置信息;利用回声消除技术和窄波束算法处理多路麦克音频得到多路音频;结合位置信息和多路音频综合确定语音识别的目标方向。由此可见,在多路音频的基础上,将各个车载座椅传感器检测得到位置信息作为辅助信息,综合确定语音识别的目标方向,能够有效避免恶劣语音唤醒场景下车载多音区语音交互过程中语音唤醒时的声源定位干扰,以提高车载多音区语音交互过程中语音唤醒时声源定位的准确性,从而实现更精准的车载多音区语音交互,提升车载多音区语音交互的用户体验。