对音频进行波形幅度控制方法及装置转让专利

申请号 : CN201910055475.3

文献号 : CN109859729B

文献日 : 2021-03-05

本申请公开了一种对音频进行波形幅度控制方法及装置，其中方法包括：确定干声音频的波形幅度信息；确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化；根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。达到了能够通过伴奏的响度调整干声对应音频幅度的目的，从而实现了能够快速自动使干声与伴奏进行混音，同时能够有效保障干声与伴奏响度和谐的技术效果，进而解决了混音师通过手动调试波形幅度包络，反复叠加伴奏对比听才能够确认混音是否成功的技术问题。

1.一种对音频进行波形幅度控制方法，其特征在于，包括：

确定干声音频的波形幅度信息，包括：确定所述干声音频的平均幅度信息；确定所述干声音频的最大幅度信息；确定所述干声音频的波形幅度包络随时间变化的包络信息；

确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化，所述确定伴奏音频的伴奏响度信息包括：确定用于计算所述伴奏音频的响度的音量计算因子；通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度；其中，所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间，且各帧伴奏音频按时序排列；对所述伴奏音频中每帧伴奏音频的响度进行平滑处理，得到所述伴奏响度信息；

根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频，包括：预先设置一个音频波形的幅值目标；其中，所述幅值目标为常数；

将所述平均幅度信息、最大幅度信息及包络信息输入DRC算法，并根据所述幅值目标对所述干声音频的整体波形进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得到稳定的干声音频；

根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整，包括：将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内，得到相应的调整信息；根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系；

确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系；

根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系；

按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。

2.一种对音频进行波形幅度控制装置，其特征在于，包括：

干声幅值确定单元，用于确定干声音频的波形幅度信息，所述确定干声音频的波形幅度信息包括：确定所述干声音频的平均幅度信息；确定所述干声音频的最大幅度信息；确定所述干声音频的波形幅度包络随时间变化的包络信息；

伴奏响度确定单元，用于确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化，伴奏响度确定单元包括：音量计算因子确定模块，用于确定用于计算所述伴奏音频的响度的音量计算因子；每帧响度计算模块，用于通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度；其中，所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间，且各帧伴奏音频按时序排列；响度平滑处理模块，用于对所述伴奏音频中每帧伴奏音频的响度进行平滑处理，得到所述伴奏响度信息；

调整单元，用于根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频，包括：预先设置一个音频波形的幅值目标；其中，所述幅值目标为常数；将所述平均幅度信息、最大幅度信息及包络信息输入DRC算法，并根据所述幅值目标对所述干声音频的整体波形进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得到稳定的干声音频；

确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系；

根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系；

按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。

对音频进行波形幅度控制方法及装置

技术领域

[0001] 本申请涉及通信领域，具体而言，涉及一种对音频进行波形幅度控制方法及装置。

背景技术

[0002] 在唱歌录制过程中，会存在一些因素，影响录制演唱歌曲的质量，比如歌唱者在歌唱过程中声音由于改变自身与麦克风之间的距离、情绪变化导致声音时而慷慨激昂，时而
脆弱无力等。这些都会降低演唱作品的可欣赏性，破坏干声与伴奏的和谐关系，乃至使人误
解歌曲意义的表达。我们需要将这些问题改正，来保证演唱作品的质量。

[0003] 现有技术为：专业音乐录制过程中，混音师会根据整首歌中干声的响度变化，以及伴奏随时间的变化来调整干声波形幅度包络的大小，来平衡干声在整首歌曲中的幅度变
化，改善干声与伴奏的融合度。

[0004] 现有技术存在以下述问题：

[0005] 混音师通常会手动调试波形幅度包络，反复叠加伴奏对比听来确认混音是否成功，这样的工作量是很大的，并且此工作对于歌唱者，这种行为是不可能完成的。

[0006] 针对相关技术中存在的问题，目前尚未提出有效的解决方案。

发明内容

[0007] 本申请的主要目的在于提供一种快速进行伴奏叠加的对音频进行波形幅度控制方法及装置，以解决相关技术中存在的至少一个技术问题。

[0008] 为了实现上述目的，根据本申请的一个方面，提供了一种对音频进行波形幅度控制方法。

[0009] 根据本申请的对音频进行波形幅度控制方法包括：

[0010] 确定干声音频的波形幅度信息；

[0011] 确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化；

[0012] 根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。

[0013] 进一步的，如前述的对音频进行波形幅度控制方法，所述根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，包括：

[0014] 将所述干声音频的每个时刻的波形幅度进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得到稳定的干声音频；

[0015] 根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。

[0016] 进一步的，如前述的对音频进行波形幅度控制方法，所述确定干声音频的波形幅度信息，包括：

[0017] 确定所述干声音频的平均幅度信息；

[0018] 确定所述干声音频的最大幅度信息；

[0019] 确定所述干声音频的波形幅度包络随时间变化的包络信息。

[0020] 进一步的，如前述的对音频进行波形幅度控制方法，所述将所述干声音频的每个时刻的波形幅度进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得
到稳定的干声音频，包括：

[0021] 预先设置一个音频波形的幅值目标；其中，所述幅值目标为一常数；

[0022] 将所述平均幅度信息、最大幅度及包络信息输入DRC算法，并根据所述幅值目标对所述干声音频的整体波形进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范
围内，得到所述稳定的干声音频。

[0023] 进一步的，如前述的对音频进行波形幅度控制方法，所述确定伴奏音频的伴奏响度信息，包括：

[0024] 确定用于计算所述伴奏音频的响度的音量计算因子；

[0025] 通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度；其中，所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间，且各帧伴奏音频按时序排
列；

[0026] 对所述伴奏音频中每帧伴奏音频的响度进行平滑处理，得到所述伴奏响度信息。

[0027] 进一步的，如前述的对音频进行波形幅度控制方法，所述根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整，包括：

[0028] 将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内，得到相应的调整信息；

[0029] 根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系；

[0030] 确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系；

[0031] 根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系；

[0032] 按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。

[0033] 为了实现上述目的，根据本申请的另一方面，提供了一种对音频进行波形幅度控制装置。

[0034] 根据本申请的对音频进行波形幅度控制装置包括：

[0035] 干声幅值确定单元，用于确定干声音频的波形幅度信息；

[0036] 伴奏响度确定单元，用于确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化；

[0037] 调整单元，用于根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。

[0038] 进一步的，如前述的对音频进行波形幅度控制装置，所述调整单元包括：

[0039] 干声稳定模块，用于将所述干声音频的每个时刻的波形幅度进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得到稳定的干声音频；

[0040] 干声调整模块，用于根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。

[0041] 进一步的，如前述的对音频进行波形幅度控制装置，所述伴奏响度确定单元包括：

[0042] 音量计算因子确定模块，用于确定用于计算所述伴奏音频的响度的音量计算因子；

[0043] 每帧响度计算模块，用于通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度；其中，所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间，且
各帧伴奏音频按时序排列；

[0044] 响度平滑处理模块，用于对所述伴奏音频中每帧伴奏音频的响度进行平滑处理，得到所述伴奏响度信息。

[0045] 进一步的，如前述的对音频进行波形幅度控制装置，所述干声调整模块包括：

[0046] 伴奏响度归一化子模块，用于将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内，得到相应的调整信息；

[0047] 第一对应子模块，用于根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系；

[0048] 第二对应子模块，用于确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系；

[0049] 第三对应子模块，用于根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系；

[0050] 调整子模块，用于按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。

[0051] 在本申请实施例中，采用对音频进行波形幅度控制方法及装置的方式，通过确定干声音频的波形幅度信息；确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的每
个响度都有对应的一帧伴奏音频，每帧伴奏音频有对应的时间，且各帧伴奏音频按时序排
列；根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间
的变化正比于所述伴奏响度信息的调整后的干声音频。达到了能够通过伴奏的响度调整干
声对应音频幅度的目的，从而实现了能够快速自动使干声与伴奏进行混音，同时能够有效
保障干声与伴奏响度和谐的技术效果，进而解决了混音师通过手动调试波形幅度包络，反
复叠加伴奏对比听才能够确认混音是否成功的技术问题。

附图说明

[0052] 构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不
构成对本申请的不当限定。在附图中：

[0053] 图1是根据本申请一种实施例的对音频进行波形幅度控制方法的流程示意图；以及

[0054] 图2是根据本申请一种实施例的对音频进行波形幅度控制装置的功能模块结构示意图。

具体实施方式

[0055] 为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是
本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范
围。

[0056] 需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的
过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清
楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

[0057] 在本申请中，术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例，并非用于限定所指示的装置、元件或组成部分必须具有特定方位，或以特定方位进行构造和操作。

[0058] 并且，上述部分术语除了可以用于表示方位或位置关系以外，还可能用于表示其他含义，例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领
域普通技术人员而言，可以根据具体情况理解这些术语在本申请中的具体含义。

[0059] 此外，术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如，可以是固定连接，可拆卸连接，或整体式构造；可以是机械连接，或电连接；可以是直接相连，或者是通过中间媒介间接相连，又或者是两个装置、元件或组成部分之间内部的连通。
对于本领域普通技术人员而言，可以根据具体情况理解上述术语在本申请中的具体含义。

[0060] 需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

[0061] 根据本申请的一个方面，提供了一种对音频进行波形幅度控制方法；如图1所示，该方法包括如下的步骤S1至步骤S3：

[0062] S1.确定干声音频的波形幅度信息；

[0063] 具体的，计算并确定所述干声音频的波形幅度信息用于确定所述干声音频的波形幅度随时间的变化关系，因而能够在后续中对该干声音频进行准确的调整；

[0064] S2.确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化；

[0065] 具体的，所述伴奏音频中的每个响度都有对应的一帧伴奏音频，每帧伴奏音频有对应的时间，且各帧伴奏音频按时序排列；因而响度也是随着时间而起伏变化的，并且可以
得到一条响度随时间变化的第一曲线；

[0066] S3.根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。

[0067] 具体的，可以根据上述中响度随时间变化的第一曲线对所述干声音频进行调整，使得所述干声音频中响度随时间变化的第二曲线整体上与所述第一曲线对应，因此达到了
能够通过伴奏的响度调整干声对应音频幅度的目的，从而实现了能够快速自动使干声与伴
奏进行混音，同时能够有效保障干声与伴奏响度和谐的技术效果，进而解决了混音师通过
手动调试波形幅度包络，反复叠加伴奏对比听才能够确认混音是否成功的技术问题。

[0068] 在一些实施例中，如前述的对音频进行波形幅度控制方法，所述根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，包括：

[0069] 将所述干声音频的每个时刻的波形幅度进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得到稳定的干声音频；

[0070] 因为在唱歌录制过程中，会存在一些因素，影响录制演唱歌曲的质量，比如歌唱者在歌唱过程中声音由于改变自身与麦克风之间的距离、情绪变化导致声音时而慷慨激昂，
时而脆弱无力等，因而同一个人在唱歌时也会出现波形幅度的起伏偏移，因而如果在此基
础上通过所述伴奏响度信息对干声音频进行调整的话，则会出现响度变化太大，造成歌曲
可欣赏性大大降低的情况；此外人与人之间的声音大小是存在差异性的，因此不同的人在
唱歌时也会得到不一样干声音频的响度；而在生成相应的歌曲的时候，一般都会使人声达
到一特定的响度，为了克服人与人的差异，因此要将所述干声音频的每个时刻的波形幅度
调整至一目标范围内；使其能够达到在播放时有适当的响度。

[0071] 根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。

[0072] 在一些实施例中，如前述的对音频进行波形幅度控制方法，所述确定干声音频的波形幅度信息，包括：

[0073] 确定所述干声音频的平均幅度信息；

[0074] 具体的，计算所述干声音频的平均幅度用于确定对应演唱者的平均演唱的响度信息；

[0075] 确定所述干声音频的最大幅度信息；

[0076] 具体的，计算所述干声音频的最大幅度信息于确定对应演唱者的最大演唱的响度信息；

[0077] 确定所述干声音频的波形幅度包络随时间变化的包络信息。

[0078] 通过确定所述平均幅度信息、最大幅度信息以及所述包络信息，可以判断得到该干声音频与幅值目标(即：目标范围)的差异；从而为之后进行响度调整提供基础信息。

[0079] 在一些实施例中，如前述的对音频进行波形幅度控制方法，所述将所述干声音频的每个时刻的波形幅度进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围
内，得到稳定的干声音频，包括：

[0080] 预先设置一个音频波形的幅值目标；其中，所述幅值目标为一常数；具体的，所述幅值目标可以是通过统计或行业默认的一首歌曲中干声的最佳的平均幅值；

[0081] 将所述平均幅度信息、最大幅度及包络信息输入DRC算法，并根据所述幅值目标对所述干声音频的整体波形进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范
围内，得到所述稳定的干声音频。具体的，所述目标范围可以是包括所述幅值目标的一个幅
值区间。

[0082] 也就是说，随后通过DRC算法进行动态的调整使得所有干声音频波形的幅值都向这个幅值目标去靠。达到的效果是大于这个幅值的波形被缩小，小于这个幅值的波形被放
大，使得声音维持一个相对比较一致的音量(即：在目标范围内)。

[0083] 在一些实施例中，如前述的对音频进行波形幅度控制方法，所述确定伴奏音频的伴奏响度信息，包括：

[0084] 确定用于计算所述伴奏音频的响度的音量计算因子；具体的，所述音量计算因子可以是均方值或者更复杂的响度算法；具体实际所采用的算法可以根据具体的使用情况进
行选择；

[0085] 通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度；其中，所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间，且各帧伴奏音频按时序排
列；具体的，每帧伴奏音频的时长可以根据具体情况进行选择，但无论如何进行时长的选
择，各帧伴奏音频总能构成时序上不间断的所述伴奏音频，优选的，时长越短，越能够准确
得到对应的伴奏音频的响度曲线，因此，在本实施例中为毫秒级的短帧；

[0086] 对所述伴奏音频中每帧伴奏音频的响度进行平滑处理，得到所述伴奏响度信息；

[0087] 具体的，由于已经得到相应的每帧音频的响度，且由于各帧伴奏音频总构成时序上不间断的所述伴奏音频；因此可以通过波形平滑处理的方法对各帧伴奏音频的响度进行
处理，进而得到随时间变化且平滑的所述伴奏响度信息。

[0088] 在一些实施例中，如前述的对音频进行波形幅度控制方法，所述根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整，包括：

[0089] 将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内，得到相应的调整信息；

[0090] 具体的，由于伴奏音频的响度波动范围可能会出现由极轻到极大之间的变化，而干声音频的响度的波动范围一般是大大小于伴奏音频的，因此，若完全按照伴奏音频的响
度波动曲线对干声音频进行调节，虽然能够获得干声音频的波形幅度随伴奏音频的波形幅
度同步变化的效果，但是干声音频的响度会出现太轻或爆音等情况，很大程度会影响可听
度；因此，需要将所述伴奏音频的响度波动进行缩小，也就是说，若所述伴奏音频的原始的
波动范围为0至100的大的变化幅度，则将其适应性降低为0至10或0至1的变化幅度，因此，
整体的响度起伏是原伴奏音频保持一致的，只是起伏的幅度相应缩小；因此本实施例中将
所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A(优选为0.7至1)
内，得到相应的调整信息；因此在通过此调整信息对干声音频进行调整时，可以使干声音频
的响度的变化较为平缓，与正常情况下听众的需求更加适配，可听度更高；

[0091] 根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系；

[0092] 确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系；

[0093] 根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系；

[0094] 因此，通过上述方法可以准确地将调整信息与所述干声音频进行对应；因而可以逐帧地对干声音频进行调整；

[0095] 按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。

[0096] 需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不
同于此处的顺序执行所示出或描述的步骤。

[0097] 根据本发明实施例，还提供了一种用于实施上述对音频进行波形幅度控制方法的对音频进行波形幅度控制装置，如图2所示，该装置包括：为了实现上述目的，根据本申请的另一方面，提供了一种对音频进行波形幅度控制装置。

[0098] 根据本申请的对音频进行波形幅度控制装置包括：

[0099] 干声幅值确定单元1，用于确定干声音频的波形幅度信息；

[0100] 伴奏响度确定单元2，用于确定伴奏音频的伴奏响度信息；其中，所述伴奏响度信息中的响度随时间变化而变化；

[0101] 调整单元3，用于根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整，得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。

[0102] 具体的，本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述，此处不再赘述。

[0103] 在一些实施例中，如前述的对音频进行波形幅度控制装置，所述调整单元包括：

[0104] 干声稳定模块，用于将所述干声音频的每个时刻的波形幅度进行调整，使所述干声音频的每个时刻的波形幅度均在一目标范围内，得到稳定的干声音频；

[0105] 干声调整模块，用于根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。

[0106] 具体的，本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述，此处不再赘述。

[0107] 在一些实施例中，如前述的对音频进行波形幅度控制装置，所述伴奏响度确定单元包括：

[0108] 音量计算因子确定模块，用于确定用于计算所述伴奏音频的响度的音量计算因子；

[0109] 每帧响度计算模块，用于通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度；其中，所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间，且
各帧伴奏音频按时序排列；

[0110] 响度平滑处理模块，用于对所述伴奏音频中每帧伴奏音频的响度进行平滑处理，得到所述伴奏响度信息。

[0111] 具体的，本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述，此处不再赘述。

[0112] 在一些实施例中，如前述的对音频进行波形幅度控制装置，所述干声调整模块包括：

[0113] 伴奏响度归一化子模块，用于将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内，得到相应的调整信息；

[0114] 第一对应子模块，用于根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系；

[0115] 第二对应子模块，用于确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系；

[0116] 第三对应子模块，用于根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系；

[0117] 调整子模块，用于按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。

[0118] 具体的，本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述，此处不再赘述。

[0119] 显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成
的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储
在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们
中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的
硬件和软件结合。

[0120] 以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修
改、等同替换、改进等，均应包含在本申请的保护范围之内。

对音频进行波形幅度控制方法及装置转让专利

申请号 : CN201910055475.3

文献号 : CN109859729B

文献日 : 2021-03-05

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 李好博 , 杨闯

申请人 : 北京小唱科技有限公司

摘要 :

权利要求 :

说明书 :