音效参数生成方法及装置、存储介质、电子设备转让专利

申请号 : CN202110576504.8

文献号 : CN113031907B

文献日 : 2021-11-05

本发明的实施方式涉及计算机技术领域，更具体地，本发明的实施方式涉及音效参数生成方法及装置，存储介质和电子设备。所述方法包括：基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果；根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数；将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果；循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数。本方法能实现针对用户的音效参数的个性化配置。

1.一种音效参数生成方法，其特征在于，包括：基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果；

根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数，包括：根据所述当前音效参数构建均衡器参数向量，并根据所述均衡器参数向量构建协方差矩阵；以及根据所述评分结果构建评分矩阵；基于所述协方差矩阵和所述评分矩阵估计所述用户偏好模型对应均值和方差；根据所述用户偏好模型的模型分布计算所述当前音效参数对应的后验分布，以基于所述后验分布确定最大似然估计结果；基于预定义的期望函数利用所述最大似然估计结果获取预测参数，并将所述预测参数配置为所述更新音效参数；

将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果；

循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数；

其中，所述第一评分结果和第二评分结果为根据用户在交互界面中评分窗口中的触控操作生成的，用于表示对当前音效的喜爱程度。

2.根据权利要求1所述的音效参数生成方法，其特征在于，所述基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果，包括：根据所述当前音效参数调整均衡器的频段数值以播放所述音频数据，并在交互界面中展示评分窗口；

响应于用户对所述评分窗口的触控操作，获取所述当前音效参数对应的第一评分结果。

3.根据权利要求1所述的音效参数生成方法，其特征在于，所述最大似然估计结果包括均值估计结果和方差估计结果；

获取所述最大似然估计结果后，所述方法还包括：按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，以用于基于所述最大似然估计结果计算所述更新音效参数。

4.根据权利要求3所述的音效参数生成方法，其特征在于，所述按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，包括：

为所述均值估计结果添加微小扰动偏差，以计算对应的扰动期望；

将所述均值估计结果对应的期望与所述扰动期望进行比对，并保留期望值最大的结果；

循环上述过程至迭代至预设次数，以输出期望最大的结果作为所述最大似然估计结果。

5.根据权利要求1所述的音效参数生成方法，其特征在于，在生成所述更新音效参数后，所述方法还包括：

计算所述更新音效参数和更新前的所述当前音效参数之间的频点增益差，并在所述频点增益差小于预设增益阈值时，将所述更新音效参数配置为所述用户定制音效参数；或者在所述频点增益差大于预设增益阈值时，将所述更新音效参数配置为当前音效参数。

6.根据权利要求1所述的音效参数生成方法，其特征在于，所述方法还包括：初始状态下，以随机方式或默认数值生成所述当前音效参数。

7.一种音效参数生成装置，其特征在于，包括：评分结果获取模块，用于基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果；

音效参数更新模块，用于根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数，包括：矩阵构建模块，用于根据所述当前音效参数构建均衡器参数向量，并根据所述均衡器参数向量构建协方差矩阵；以及根据所述评分结果构建评分矩阵；矩阵计算模块，用于基于所述协方差矩阵和所述评分矩阵估计所述用户偏好模型对应均值和方差；估计处理模块，用于根据所述用户偏好模型的模型分布计算所述当前音效参数对应的后验分布，以基于所述后验分布确定最大似然估计结果；参数更新模块，用于基于预定义的期望函数利用所述最大似然估计结果获取预测参数，并将所述预测参数配置为所述更新音效参数；

评估结果更新模块，用于将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果；

音效参数输出模块，用于循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数；

其中，所述第一评分结果和第二评分结果为根据用户在交互界面中评分窗口中的触控操作生成的，用于表示对当前音效的喜爱程度。

8.根据权利要求7所述的音效参数生成装置，其特征在于，所述评分结果获取模块包括：

评分窗口展示模块，用于根据所述当前音效参数调整均衡器的频段数值以播放所述音频数据，并在交互界面中展示评分窗口；

评分结果输出模块，用于响应于用户对所述评分窗口的触控操作，获取所述当前音效参数对应的第一评分结果。

9.根据权利要求7所述的音效参数生成装置，其特征在于，所述最大似然估计结果包括均值估计结果和方差估计结果；

所述音效参数更新模块还包括：

迭代计算模块，用于按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，以用于基于所述最大似然估计结果计算所述更新音效参数。

10.根据权利要求9所述的音效参数生成装置，其特征在于，所述迭代计算模块包括：扰动计算模块，用于为所述均值估计结果添加微小扰动偏差，以计算对应的扰动期望；

将所述均值估计结果对应的期望与所述扰动期望进行比对，并保留期望值最大的结果；循环上述过程至迭代至预设次数，以输出期望最大的结果作为所述最大似然估计结果。

11.根据权利要求7所述的音效参数生成装置，其特征在于，所述装置还包括：音效参数应用模块，用于在生成所述更新音效参数后，计算所述更新音效参数和更新前的所述当前音效参数之间的频点增益差，并在所述频点增益差小于预设增益阈值时，将所述更新音效参数配置为所述用户定制音效参数；或者在所述频点增益差大于预设增益阈值时，将所述更新音效参数配置为当前音效参数。

12.根据权利要求7所述的音效参数生成装置，其特征在于，所述装置还包括：初始参数配置模块，用于初始状态下，以随机方式或默认数值生成所述当前音效参数。

13.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1 6中任一项所述的音效参数生成方法。

14.一种电子设备，其特征在于，包括：处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1 6中任一项所述~

的音效参数生成方法。

音效参数生成方法及装置、存储介质、电子设备

技术领域

[0001] 本发明的实施方式涉及计算机技术领域，更具体地，本发明的实施方式涉及音效参数生成方法及装置，存储介质和电子设备。

背景技术

[0002] 本部分旨在为权利要求中陈述的本发明的实施方式提供背景或上下文，此处的描述不因为包括在本部分中就承认是现有技术。

[0003] 在目前的技术中，用户可以通过音乐类的应用程序播放音乐或视频，并可以在应用程序中进行音效的配置，并将配置的音效应用于K歌、直播等应用场景。例如，通过配置均
衡器和音效环境来调整音效。

发明内容

[0004] 但是，在一些技术中，用户一般不具备配置音效参数的专业知识；而应用程序一般通过预配置不同类型的播放设备来配置音效，如为不同的耳机配置不同的音效参数；或者
为不同的播放环境配置不同音效参数。但这样预配置的音效往往是通用的，配置的音效参
数可能并不是用户满意的；并且，也不能实现对用户音效需求的个性化配置。

[0005] 为此，非常需要一种改进的音效参数生成方法及装置、存储介质和电子设备，以提供一种能够为用户进行个性化配置的音效参数自动生成的方案。

[0006] 在本上下文中，本发明的实施方式期望提供一种音效参数生成方法和装置、存储介质和电子设备。

[0007] 根据本公开的一个方面，提供一种音效参数生成方法，包括：

[0008] 基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果；

[0009] 根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数；

[0010] 将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果；

[0011] 循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数。

[0012] 在本公开的一种示例性实施例中，所述基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果，包括：

[0013] 根据所述当前音效参数调整均衡器的频段数值以播放所述音频数据，并在交互界面中展示评分窗口；

[0014] 响应于用户对所述评分窗口的触控操作，获取所述当前音效参数对应的第一评分结果。

[0015] 在本公开的一种示例性实施例中，所述根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参
数，包括：

[0016] 根据所述当前音效参数构建均衡器参数向量，并根据所述均衡器参数向量构建协方差矩阵；以及根据所述评分结果构建评分矩阵；

[0017] 基于所述协方差矩阵和所述评分矩阵估计所述用户偏好模型对应均值和方差；

[0018] 根据所述用户偏好模型的模型分布计算所述当前音效参数对应的后验分布，以基于所述后验分布确定最大似然估计结果；

[0019] 基于预定义的期望函数利用所述最大似然估计结果获取预测参数，并将所述预测参数配置为所述更新音效参数。

[0020] 在本公开的一种示例性实施例中，所述最大似然估计结果包括均值估计结果和方差估计结果；

[0021] 获取所述最大似然估计结果后，所述方法还包括：

[0022] 按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，以用于基于所述最大似然估计结果计算所述更新音效参数。

[0023] 在本公开的一种示例性实施例中，所述按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，包括：

[0024] 为所述均值估计结果添加微小扰动偏差，以计算对应的扰动期望；

[0025] 将所述均值估计结果对应的期望与所述扰动期望进行比对，并保留期望值最大的结果；

[0026] 循环上述方法至迭代至预设次数，以输出期望最大的结果作为所述最大似然估计结果。

[0027] 在本公开的一种示例性实施例中，在生成所述更新音效参数后，所述方法还包括：

[0028] 计算所述更新音效参数和更新前的所述当前音效参数之间的频点增益差，并在所述频点增益差小于预设增益阈值时，将所述更新音效参数配置为所述用户定制音效参数；
或者

[0029] 在所述频点增益差大于预设增益阈值时，将所述更新音效参数配置为当前音效参数。

[0030] 在本公开的一种示例性实施例中，所述方法还包括：

[0031] 初始状态下，以随机方式或默认数值生成所述当前音效参数。

[0032] 根据本公开的一个方面，提供一种音效参数生成装置，包括：

[0033] 评分结果获取模块，用于基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果；

[0034] 音效参数更新模块，用于根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数；

[0035] 评估结果更新模块，用于将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果；

[0036] 音效参数输出模块，用于循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数。

[0037] 在本公开的一种示例性实施例中，所述评分结果获取模块包括：

[0038] 评分窗口展示模块，用于根据所述当前音效参数调整均衡器的频段数值以播放所述音频数据，并在交互界面中展示评分窗口；

[0039] 评分结果输出模块，用于响应于用户对所述评分窗口的触控操作，获取所述当前音效参数对应的第一评分结果。

[0040] 在本公开的一种示例性实施例中，所述音效参数更新模块包括：

[0041] 矩阵构建模块，用于根据所述当前音效参数构建均衡器参数向量，并根据所述均衡器参数向量构建协方差矩阵；以及根据所述评分结果构建评分矩阵；

[0042] 矩阵计算模块，用于基于所述协方差矩阵和所述评分矩阵估计所述用户偏好模型对应均值和方差；

[0043] 估计处理模块，用于根据所述用户偏好模型的模型分布计算所述当前音效参数对应的后验分布，以基于所述后验分布确定最大似然估计结果；

[0044] 参数更新模块，用于基于预定义的期望函数利用所述最大似然估计结果获取预测参数，并将所述预测参数配置为所述更新音效参数。

[0045] 在本公开的一种示例性实施例中，所述最大似然估计结果包括均值估计结果和方差估计结果；所述音效参数更新模块还包括：

[0046] 迭代计算模块，用于按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，以用于基于所述最大似然估计结果计算
所述更新音效参数。

[0047] 在本公开的一种示例性实施例中，所述迭代计算模块包括：

[0048] 扰动计算模块，用于为所述均值估计结果添加微小扰动偏差，以计算对应的扰动期望；将所述均值估计结果对应的期望与所述扰动期望进行比对，并保留期望值最大的结
果；循环上述方法至迭代至预设次数，以输出期望最大的结果作为所述最大似然估计结果。

[0049] 在本公开的一种示例性实施例中，所述装置还包括：

[0050] 音效参数应用模块，用于在生成所述更新音效参数后，计算所述更新音效参数和更新前的所述当前音效参数之间的频点增益差，并在所述频点增益差小于预设增益阈值
时，将所述更新音效参数配置为所述用户定制音效参数；或者在所述频点增益差大于预设
增益阈值时，将所述更新音效参数配置为当前音效参数。

[0051] 在本公开的一种示例性实施例中，所述装置还包括：

[0052] 初始参数配置模块，用于初始状态下，以随机方式或默认数值生成所述当前音效参数。

[0053] 根据本公开的一个方面，提供一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时上述的音效参数生成方法。

[0054] 根据本公开的一个方面，提供一种电子设备，包括：

[0055] 处理器；以及

[0056] 存储器，用于存储所述处理器的可执行指令；

[0057] 其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的音效参数生成方法。

[0058] 根据本发明实施方式的音效参数生成方法，通过获取用户对当前音效参数的评分结果，利用构建的用户偏好模型根据当前音效参数和对应的评分结果来更新音效参数，并
获取用户针对该更新后的音效参数的评分结果，重复循环该过程直至评分结果满足阈值，
从而获得最终用户需要求的音效参数。从而实现针对用户的音效参数的个性化配置。并且，
该过程中仅需得到用户对当前音效参数的主观评价，而不需要在音效调整过程中由用户调
整具体的参数配置，不需要用户具有相关的专业知识，从而提供一种对于用户更友好，且简
单有效的音效参数生成方法。

附图说明

[0059] 通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若
干实施方式，其中：

[0060] 图1示意性地示出了根据本发明实施方式的音效参数生成方法的流程图；

[0061] 图2示意性地示出了根据本发明实施方式的更新音效参数方法的流程图；

[0062] 图3示意性地示出了根据本发明实施方式的播放参考音频数据的交互界面示意图；

[0063] 图4示意性地示出了根据本发明实施方式的音效参数生成方法的流程图；

[0064] 图5示意性地示出了根据本发明实施方式的用户期望的音效参数曲线示意图；

[0065] 图6示意性地示出了根据本发明实施方式的音效参数收敛误差的示意图；

[0066] 图7示意性地示出了根据本发明实施方式的音效参数生成装置的方框图；

[0067] 图8示出了根据本发明实施方式的存储介质的示意图；

[0068] 图9示意性示出了根据发明实施方式的电子设备的方框图。

[0069] 在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

[0070] 下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何
方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能
够将本公开的范围完整地传达给本领域的技术人员。

[0071] 本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件
（包括固件、驻留软件、微代码等），或者硬件和软件结合的形式。

[0072] 根据本发明的实施方式，提供一种音效参数生成方法、音效参数生成装置、存储介质和电子设备。

[0073] 在本文中，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

[0074] 下面参考本发明的若干代表性实施方式，详细阐述本发明的原理和精神。

[0075] 发明概述

[0076] 本发明人发现，现有技术中，在音乐播放应用程序、视频播放应用程序等多媒体数据播放应用程序中，用户可以定义不同的播放音效。一般来说，音效通常具有复杂的参数配
置。以均衡音效为例，均衡器具有不同频段的增益参数等，而用户往往不具备相关的专业音
乐知识，不能主动配置具体的参数细节。因此，现有技术在进行音效配置时，存在不准确、无
法令用户满意，或者配置时间过程的问题。

[0077] 鉴于上述内容，本发明的基本思想在于：根据本发明实施方式的音效参数生成方法和音效参数生成装置，通过获取用户对不同音效的评价结果，并基于此构建用户的偏好
模型，实现基于用户对音效的主观评价来对用户进行个性化的音效参数配置。

[0078] 在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

[0079] 示例性方法

[0080] 下面结合图1来描述根据本发明示例性实施方式的音效参数生成方法。

[0081] 参考图1，所述音效参数生成方法可以包括以下步骤：

[0082] S1、基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果；

[0083] S2、根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数；

[0084] S3、将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果；

[0085] S4、循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数。

[0086] 在本发明实施方式的音效参数生成方法中，通过获取用户对当前音效参数的评分结果，利用构建的用户偏好模型根据当前音效参数和对应的评分结果来更新音效参数，并
获取用户针对该更新后的音效参数的评分结果，重复循环该过程直至评分结果满足阈值，
从而获得最终用户需要求的音效参数；一方面，实现针对用户的音效参数的个性化配置。另
一方面，该过程中仅需得到用户对当前音效参数的主观评价，而不需要在音效调整过程中
由用户调整具体的参数配置，不需要用户具有相关的专业知识，从而提供一种对于用户更
友好，且简单有效的音效参数生成方法。

[0087] 在步骤S1中，基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果。

[0088] 在本公开的示例性实施方式中，上述的方法可以应用于手机、平板电脑、笔记本电脑等智能终端。具体的，可以作为以独立的应用程序运行；或者，也可以插件的形式在多媒
体数据播放的应用程序中运行。例如，可以在音乐播放程序，或者短视频播放应用程序中运
行。

[0089] 在本公开的示例性实施方式中，可以在终端的交互界面中，预先配置一段或多段不同长度的音频数据，作为参考音频数据，用于为用户配置音效参数。该音频数据可以是纯
音乐，也可以是包含人声的音乐片段；音乐的时长可以设置为30秒、1分钟或者2分钟等长
度。或者，也可以根据音乐的类型或风格配置不同的时长。例如，针对电子风格的音乐可以
配置39秒或45秒的时长，并截取相对激烈，能表现音效特征的片段；针对爵士乐、乡村音乐
或者抒情音乐，则可以从音乐的初始点截取2分钟或完整音乐配置为参考音频数据；等等。
或者，也可以由用户自定义参考音频数据的类型以及具体的歌曲。或者，也可以获取用户待
播放的歌单或历史歌单，并根据歌单中歌曲的类型和风格来配置对应的具有相同或近似风
格或类型的歌曲作为参考音频数据。

[0090] 在本公开的示例性实施方式中，上述的步骤S1可以包括：根据所述当前音效参数调整均衡器的频段数值以播放所述音频数据，并在交互界面中展示评分窗口；

[0091] 响应于用户对所述评分窗口的触控操作，获取所述当前音效参数对应的第一评分结果。

[0092] 举例来说，在初始状态下，可以通过随机方式或默认数值生成当前音效参数；并在交互界面中以当前音效参数播放上述的参考音频数据。参考图3所示，可以在交互界面300
中显示参考音频数据的播放进度，当前音效参数，以及用户评分窗口301；用户可以在评分
窗口301中通过滑动图标来选择对当前音效的喜爱程度。其中，在交互界面中展示的音效参
数“AAA”可以包含预先设定好的音效名称，也可以包含具体的EQ（Equalizer，均衡器）值，以
直观提示用户当前音效的类型或级别。用户对当前音效的喜爱程度或接受程度，可以通过
评分结果来表示。例如，在基于默认数值的音效参数播放参考音频数据后，便可以根据用户
的触控操作得到用于对其的第一评分结果。其中，用户可以在参考音频播放的过程中在交
互界面中触控图标来输出评分结果；或者，也可以在音乐播放结束之后，再触控图标来输出
评分结果。在用户输出评分结果后，便可以停止当前的参考音频的播放。

[0093] 在步骤S2中，根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数。

[0094] 在本公开的示例性实施方式中，在获取用户对一音效参数的评分结果后，便可以根据均衡器参数和用户评价结果构建对应的偏好模型。具体来说，参考图2所示，上述的步
骤S2可以包括：

[0095] 步骤S21，根据所述当前音效参数构建均衡器参数向量，并根据所述均衡器参数向量构建协方差矩阵；以及根据所述评分结果构建评分矩阵；

[0096] 步骤S22，基于所述协方差矩阵和所述评分矩阵估计所述用户偏好模型对应均值和方差；

[0097] 步骤S23，根据所述用户偏好模型的模型分布计算所述当前音效参数对应的后验分布，以基于所述后验分布确定最大似然估计结果；

[0098] 步骤S24，基于预定义的期望函数利用所述最大似然估计结果获取预测参数，并将所述预测参数配置为所述更新音效参数。

[0099] 举例而言，上述配置的音效参数，可以是针对数字音效、环境音效、专业MP3音效或者普通MP3音效中的任意一项音效的音效参数。具体的，音效参数的配置可以通过均衡器的
调节来实现；均衡器的频段个数d，增益范围[a，b]dB。

[0100] 例如，均衡器可包括多个频段等级，各频段可以配置有多个不同的调节等级。例如，均衡器可以分为5段，包括：50Hz档，200Hz档，1KHz档，3KHz档，14KHz档，每段有10级调
节：‑15dB，‑12dB，‑9dB，‑6dB，‑3dB，0dB，+3dB，+6dB，+9dB，+12dB，+15dB。或者，均衡器也可
以包括31Hz、62Hz、125Hz、250Hz、500Hz、1KHz、2KHz、4KHz、8KHz、16KHz；各档可以在‑12 dB
~
12 dB之间自由调节。

[0101] 具体来说，对于用户的评分结果，可以配置[‑1，1]的范围；例如，用1表示喜欢，‑1表示不喜欢，用户可以在[‑1，1]的范围以0.1为步长进行评价，通过在交互界面中操作图标
并输出评价结果。

[0102] 具体来说，用户偏好模型根据统计学方法建立。在频段个数d，增益范围[a，b]dB范T
围内的参数向量x=[x1，…，xn]作为观测向量，则每一个独立的向量xi都有一个对应的用户
偏好实函数值f(xi)落在[‑1，1]的区间范围内，即对于每一个xi∈X={xi|i=1，…，n}，都有对
应的实值响应yi∈ Y = {yi|i=1，…，n}。从xi到yi的模型f(xi)可以看作高斯过程，表示了用
户对于某个参数的偏好。该模型即为待学习的用户偏好模型，输入向量的多个参数构成了
联合高斯分布，通过一系列观测实验估计出用户评价的数学期望和协方差分布。可以得到
数学期望最大的参数作为用户的最佳偏好参数。具体的，模型的建立可以包括：

[0103] σs|θs～μ(0,∞)，σs是隐性函数的标准差。

[0104] σl|θl～μ(0,∞)，σl是协方差函数的长度。

[0105] σ|θl～μ(0,∞)，σ是隐性函数的噪声标准差。

[0106] fi|σs,σl~GP(m(xi),k(xi,∙)σs,σl)，k(xi,∙)表示协方差函数，GP为高斯过程。

[0107] zi|fi～N(fi,σ)，zi为变形函数，表示为逆累积高斯分布。

[0108]

[0109] 在此模型下，选定协方差核函数为：

[0110]

[0111]

[0112] 其中，Λ是各向同性平方指数协方差函数，表示了输入空间参数的互相关先验信息。

[0113] 建立偏好模型后，通过贪婪选择预测出最有信息量的下一组样本，能够达到更快的收敛速度。定义每一个输入xj期望改进函数为：

[0114]

[0115]

[0116]

[0117] 其中，N表示均匀分布；Φ表示累积高斯分布；μj和σj是预测样本的均值和方差；μmax和σmax是当前模型均值和方差的最大似然估计。

[0118] 则新的预测样本为：

[0119]

[0120] 在本公开的示例性实施方式中，举例来说，假定用户期望的均衡器曲线参数为xexp={6,6,6,0,0,0,‑6,‑6,‑6,‑6}。

[0121] 首先，在初始状态下，以随机方式生成的音效参数对应的均衡器向量为xj=[x1, T
…, xn] ，计算当前参数向量集的协方差核函数k(xi, xj)矩阵，得到KXX。σs和σl是可调优的
参数，这里均取值1.0。

[0122]

[0123]

[0124]

[0125]

[0126] 其次，通过交互界面获取用户的评价结果yi加入矩阵Y，分布函数Φ取1，计算得到预测模型的均值：

[0127]

[0128] 预测模型的协方差：

[0129]

[0130] 基于估计出的模型均值和方差，在当前已知参数集中计算每个xj的后验分布，得到μmax和σmax，对应的参数为xmax和EI(xmax)。

[0131] 基于上述内容，本公开的示例性实施方式中，上述的方法还可以包括：获取所述最大似然估计结果后，按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望
最大的结果作为所述最大似然估计结果，以用于基于所述最大似然估计结果计算所述更新
音效参数。其中，最大似然估计结果包括均值估计结果和方差估计结果。

[0132] 具体而言，上述的方法具体可以包括：为所述均值估计结果添加微小扰动偏差，以计算对应的扰动期望；将所述均值估计结果对应的期望与所述扰动期望进行比对，并保留
期望值最大的结果；循环上述方法至迭代至预设次数，以输出期望最大的结果作为所述最
大似然估计结果。

[0133] 举例来说，如上述实施例，可以在xmax附近增加微小扰动偏差ϵ，计算EI(xmax+ϵ)，当EI(xmax+ϵ)> EI(xmax)，则保留xmax+ϵ作为新的xmax否则则丢弃。优选的，可以设定迭代次数为
10，找出的xmax作为xnew输出。该过程可借助贝叶斯优化器Bayesian Optimization完成。为
了简化计算量，σEI可以表示为：

[0134]

[0135] 通过在估计的后验分布结果附近使用增加微小扰动偏差的方式，迭代运算一定的次数，从而可以获取更优解，即获取更符合用户期望的音效参数。从而能够减少迭代运算的
次数，缩短用户自定义音效参数的时长，提升处理效率。

[0136] 在步骤S3中，将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果。

[0137] 在本公开的示例性实施方式中，在根据上述步骤S2中的方法计算更新音效参数后，便可以将该参数配置为新的当前音效参数，实现对音效参数的一次更新；并利用更新后
的音效参数在交互界面中重新播放上述的参考音频数据，以便于用户对更新后的当前音效
参数进行评价，并输出用户的评分结果作为第二评分结果。

[0138] 在步骤S4中，循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数。

[0139] 在本公开的示例性实施方式中，在获取第二评分结果后，可以将该评分结果与预设评分阈值进行比对，从而判断当前的音效参数是否满足用户要求。

[0140] 举例来说，若用户的第二评分结果为1，则判定为用户满意当前的音效参数配置结果，从而可以直接将当前音效参数配置为自定义的用户定制音效参数。

[0141] 或者，可以预先配合上述的评分阈值为0.85、0.8或0.9等数值。若当前的第二评分结果小于该评分阈值，则利用该第二评分结果以及对应的当前音效参数，再次利用上述步
骤S2中的计算方法再次更新音效参数，再利用该音效参数播放参考音频数据，进而获取用
户的第三、第四、第五等评分结果。若最后一次的评分结果大于预设的评分阈值，则将最后
一次的当前音效参数配置为用户自定义的用户定制音效参数。

[0142] 基于上述过程，可以实现不需用户手动配置均衡器，而仅根据主观意愿对当前的音效进行评分，实现对音效参数的更新，并最终获取用户最喜爱、最符合用户期望的音效参
数，实现对音效参数的自定义配置。

[0143] 基于上述内容，在本公开的其他示例性实时方式中，系统也可以自动根据音效参数的具体变化，来确定是否将当前音效配置用户的用户定制音效参数。具体来说，参考图4
所示，上述的方法还可以包括：

[0144] 步骤S5，计算所述更新音效参数和更新前的所述当前音效参数之间的频点增益差，并在所述频点增益差小于预设增益阈值时，将所述更新音效参数配置为所述用户定制
音效参数；或者

[0145] 在所述频点增益差大于预设增益阈值时，将所述更新音效参数配置为当前音效参数。

[0146] 具体而言，从心理声学的角度，当迭代达到一定次数，新产生的参数与之前的参数相比区别小于一定的阈值，则用户从主观上已经很难分辨差异。例如，当EQ的频点增益差距
小于2dB，人耳已经很难分辨。可以配置上述的预设增益阈值为2dB。例如，当第七次更新后
的音效参数与前一次的音效参数进行比对时，若音效参数的增益小于预设增益阈值，即当‖
xnew‑xlast‖<2dB时，便退出迭代，判定已得到当前用户最佳的音效参数，输出最终参数xexp，
作为用户自定义的用户定制音效参数。

[0147] 通过对相邻两次的音效参数进行比对，从而可以避免用户无限次的循环该听歌、评分、更新音效的迭代过程，实现提前退出迭代，减少迭代次数；避免耗时过长；加快算法收
敛过程。

[0148] 举例来说，在迭代过程中，根据与xexp的期望距离的大小进行评价反馈，按照30次迭代生成的曲线如图5所示，横轴（Frequency）表示各频段的频率，单位为Hz；纵轴
（Magnitude）表示各频段的调节等级，单位为dB。最终参数收敛为用户希望的参数xexp。优选
的，参考图6所示，横轴（Times）表示迭代次数，纵轴（Magnitude）表示收敛误差，单位为dB。
收敛误差则在迭代次数达到9次后明显收敛，例如设定预设增益阈值为2dB，则迭代次数会
减小到10次以下。此时用户主观已经基本分辨不出均衡器参数小于2dB的误差，最终参数与
用户期望效果一致。通过调整预设增益阈值，可将算法收敛的次数降低到7～15次。

[0149] 在本公开的示例性实施方式中，可以首先根据当前的音效参数对应参数集x计算协方差矩阵K；以及，根据用户的交互操作得到对应的评价结果y；进而估计当前模型分布的
均值μ和方差σ；根据模型分布计算当前参数集x的后验μ和σ，找出对应μ和σ最大的xmax；在
xmax附近迭代寻找令EI最大的参数作为xnew输出；再判断是否满足||xnew‑xast||<2dB；若当前
满足这一条件，则终止迭代，并输出xexp，得到最终的用户定制音效参数。

[0150] 在本公开的示例性实施方式中，在交互界面中播放参考音频数据之后，可以首先获取用户的评分结果，若用户评分结果大于预设的评分阈值，则结束迭代过程；若用户评分
结果小于预设评分阈值，则将当前音效参数与上一周期的音效参数进行比对，判断频点增
益与预设增益阈值之间的大小。若频点增益小于预设增益阈值，则停止迭代过程；若频点增
益大于预设增益阈值，则继续执行迭代过程。通过这样双判断的方式，可以有效的考量用户
对当前音效参数的主观感受，同时兼顾迭代过程的次数，有效压缩迭代的过程，避免由于用
户原因导致的迭代次数过多，帮助用户尽快确定用户定制音效参数。

[0151] 综上所述，本公开提供的方法，可以在无需用户提前预知自己的参数偏好的前提下，对用户偏好的音效进行预测，这对于绝大多数的普通用户降低了对音乐知识的要求，符
合大多数普通用户的使用习惯。且本方法交互简单，只需要用户判断是否喜欢，并输出评价
结果，通过利用音效参数和对应的评分结果构建用户偏好模型；用户只需要重复收听有限
次数的参考音频数据即可，例如试听7～15次即可。并且，最终生成的参数真正时符合个性
化的用户偏好，而不是提前预设的某种模板，可以满足不同用户独特的听音习惯。同时，本
方法通过加速算法可以中止收敛，将心理声学的判断条件引入算法迭代，加快收敛速度，使
用户定制音效参数的生成过程更加快捷。

[0152] 示例性装置

[0153] 在介绍了本发明示例性实施方式的消息推送方法之后，接下来，参考图7对本发明示例性实施方式的消息推送装置进行描述。

[0154] 参考图7所示，本发明示例性实施方式的音效参数生成装置70可以包括：评分结果获取模块701、音效参数更新模块702、评估结果更新模块703以及音效参数输出模块704；其
中：

[0155] 所述评分结果获取模块701可以用于基于当前音效参数播放音频数据，以获取用户对所述当前音效参数的第一评分结果。

[0156] 所述音效参数更新模块702可以用于根据所述当前音效参数和所述第一评分结果构建用户偏好模型，并利用所述用户偏好模型对音效参数进行更新以获取更新音效参数。

[0157] 所述评估结果更新模块703可以用于将所述更新音效参数配置为当前音效参数并播放所述音频数据，以获取用户对更新后的所述当前音效参数的第二评分结果。

[0158] 所述音效参数输出模块704可以用于循环上述过程至评分结果满足预设评分阈值，将更新后的所述当前音效参数配置为用户定制音效参数。

[0159] 根据本公开的示例性实施例，所述评分结果获取模块701可以包括：评分窗口展示模块、评分结果输出模块（图中未示出）。其中：

[0160] 所述评分窗口展示模块可以用于根据所述当前音效参数调整均衡器的频段数值以播放所述音频数据，并在交互界面中展示评分窗口。

[0161] 所述评分结果输出模块可以用于响应于用户对所述评分窗口的触控操作，获取所述当前音效参数对应的第一评分结果。

[0162] 根据本公开的示例性实施例，所述音效参数输出模块704可以包括：矩阵构建模块、矩阵计算模块、估计处理模块和参数更新模块（图中未示出）。其中：

[0163] 所述矩阵构建模块可以用于根据所述当前音效参数构建均衡器参数向量，并根据所述均衡器参数向量构建协方差矩阵；以及根据所述评分结果构建评分矩阵。

[0164] 所述矩阵计算模块可以用于基于所述协方差矩阵和所述评分矩阵估计所述用户偏好模型对应均值和方差。

[0165] 所述估计处理模块可以用于根据所述用户偏好模型的模型分布计算所述当前音效参数对应的后验分布，以基于所述后验分布确定最大似然估计结果。

[0166] 所述参数更新模块可以用于基于预定义的期望函数利用所述最大似然估计结果获取预测参数，并将所述预测参数配置为所述更新音效参数。

[0167] 根据本公开的示例性实施例，所述最大似然估计结果包括均值估计结果和方差估计结果；所述音效参数输出模块704可以包括：迭代计算模块（图中未示出）。

[0168] 所述迭代计算模块可以用于按预设规则迭代对所述均值估计结果添加微小扰动偏差，并选取期望最大的结果作为所述最大似然估计结果，以用于基于所述最大似然估计
结果计算所述更新音效参数。

[0169] 根据本公开的示例性实施例，所述迭代计算模块可以包括：扰动计算模块（图中未示出）。

[0170] 所述扰动计算模块可以用于为所述均值估计结果添加微小扰动偏差，以计算对应的扰动期望；将所述均值估计结果对应的期望与所述扰动期望进行比对，并保留期望值最
大的结果；循环上述方法至迭代至预设次数，以输出期望最大的结果作为所述最大似然估
计结果。

[0171] 根据本公开的示例性实施例，所述装置还可以包括：音效参数应用模块（图中未示出）。

[0172] 所述音效参数应用模块可以用于在生成所述更新音效参数后，计算所述更新音效参数和更新前的所述当前音效参数之间的频点增益差，并在所述频点增益差小于预设增益
阈值时，将所述更新音效参数配置为所述用户定制音效参数；或者在所述频点增益差大于
预设增益阈值时，将所述更新音效参数配置为当前音效参数。

[0173] 根据本公开的示例性实施例，所述装置还可以包括：初始参数配置模块（图中未示出）。

[0174] 所述初始参数配置模块可以用于初始状态下，以随机方式或默认数值生成所述当前音效参数。

[0175] 由于本发明实施方式的音效参数生成装置的各个功能模块与上述音效参数生成方法发明实施方式中相同，因此在此不再赘述。

[0176] 示例性存储介质

[0177] 在介绍了本发明示例性实施方式的音效参数生成方法和装置之后，接下来，参考图8对本发明示例性实施方式的存储介质进行说明。

[0178] 参考图8所示，描述了根据本发明的实施方式的用于实现上述方法的程序产品80，其可以采用便携式紧凑盘只读存储器(CD‑ROM)并包括程序代码，并可以在设备，例如个人
电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包
含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合
使用。

[0179] 所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或
半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举
的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读
存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器
(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

[0180] 计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、
光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介
质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其
结合使用的程序。

[0181] 可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

[0182] 可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言‑诸如Java、C++等，还包括常规的过
程式程序设计语言‑诸如"C"语言或类似的程序设计语言。程序代码可以完全地在用户计算
设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设
备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网
络，包括局域网（LAN）或广域网（WAN），连接到用户计算设备，或者，可以连接到外部计算设
备（例如利用因特网服务提供商来通过因特网连接）。

[0183] 示例性电子设备

[0184] 在介绍了本发明示例性实施方式的存储介质之后，接下来，参考图9对本发明示例性实施方式的电子设备进行说明。

[0185] 图9显示的电子设备800仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

[0186] 如图9所示，电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于：上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件
（包括存储单元820和处理单元810）的总线830、显示单元840。

[0187] 其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元810执行，使得所述处理单元810执行本说明书上述"示例性方法"部分中描述的根据本发明各种
示例性实施方式的步骤。例如，所述处理单元810可以执行如图1中所示的步骤S1至步骤S4。

[0188] 存储单元820可以包括易失性存储单元，例如随机存取存储单元（RAM）8201和/或高速缓存存储单元8202，还可以进一步包括只读存储单元（ROM）8203。

[0189] 存储单元820还可以包括具有一组（至少一个）程序模块8205的程序/实用工具8204，这样的程序模块8205包括但不限于：操作系统、一个或者多个应用程序、其它程序模
块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

[0190] 总线830可以包括数据总线、地址总线和控制总线。

[0191] 电子设备800也可以与一个或多个外部设备900（例如键盘、指向设备、蓝牙设备等）通信，这种通信可以通过输入/输出（I/O）接口850进行。电子设备800还包括显示单元
840，其连接到输入/输出（I/O）接口850，用于进行显示。并且，电子设备800还可以通过网络
适配器860与一个或者多个网络（例如局域网（LAN），广域网（WAN）和/或公共网络，例如因特
网）通信。如图所示，网络适配器860通过总线830与电子设备800的其它模块通信。应当明
白，尽管图中未示出，可以结合电子设备800使用其它硬件和/或软件模块，包括但不限于：
微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备
份存储系统等。

[0192] 应当注意，尽管在上文详细描述中提及了音频播放装置和音频分享装置的若干模块或子模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方
式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，
上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

[0193] 此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的
结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个
步骤分解为多个步骤执行。

[0194] 虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能
组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和
范围内所包括的各种修改和等同布置。

音效参数生成方法及装置、存储介质、电子设备转让专利

申请号 : CN202110576504.8

文献号 : CN113031907B

文献日 : 2021-11-05

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 赵翔宇 , 曹偲 , 刘华平

申请人 : 杭州网易云音乐科技有限公司

摘要 :

权利要求 :

说明书 :