编码装置、解码装置、编码方法及解码方法转让专利

申请号 : CN201110150379.0

文献号 : CN102201242B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 押切正浩江原宏幸吉田幸司

申请人 : 松下电器产业株式会社

摘要 :

公开了编码装置、解码装置、编码方法及解码方法。本发明的编码装置,根据原信号生成低频带的编码信息及高频带的编码信息,该编码装置具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算单元,根据所述原信号,计算第二频谱;估计单元,将所述第二频谱的高频带部分分割为多个频带,使用所述第一频谱分别估计各个频带中所包含的所述第二频谱;以及第一误差分量编码单元,对所述第二频谱的高频带部分与所述估计频谱之间的第一误差分量进行编码。

权利要求 :

1.一种编码装置,根据原信号生成低频带的编码信息及高频带的编码信息,该编码装置具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;

第二频谱计算单元,根据所述原信号,计算第二频谱;

第一参数计算单元,计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度的第一参数;

第二参数计算单元,计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量的第二参数;以及编码单元,将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码。

2.根据权利要求1所述的编码装置,其中,

所述第一频谱计算单元调整所述解码信号的频谱的动态范围使其接近所述原信号的频谱的高频域部分的动态范围以生成所述第一频谱。

3.根据权利要求1所述的编码装置,还具有:

残差分量编码单元,对所述第一频谱与所述第二频谱的低频带部分之间的残差分量进行编码,所述第一参数计算单元和所述第二参数计算单元在使用由所述残差分量编码单元编码的所述残差分量提高了所述第一频谱的质量后,计算所述第一参数和所述第二参数。

4.根据权利要求3所述的编码装置,其中,

所述残差分量编码单元提高所述第一频谱的低频带部分的质量和解码频谱的高频带部分的质量的双方,所述解码频谱是根据由所述第一参数计算单元计算出的所述第一参数及由所述第二参数计算单元计算出的所述第二参数得到的。

5.根据权利要求1所述的编码装置,其中,

所述第一参数计算单元和所述第二参数计算单元在使用所述第一频谱与所述第二频谱的低频带部分之间的残差分量提高了所述第一频谱的质量后,计算所述第一参数和所述第二参数。

6.一种解码装置,具有:

编码信息获取单元,获取低频带的编码信息以及高频带的编码信息;

频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;

参数获取单元,分别获取作为高频带的编码信息被编码的第一参数和作为高频带的编码信息被编码的第二参数,该第一参数是表示类似程度的参数,所述类似程度是所述第一频谱与将对应于原信号的第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度,该第二参数表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量;以及解码单元,使用获取的所述第一参数和所述第二参数对所述第二频谱进行解码。

7.一种编码方法,根据原信号生成低频带的编码信息及高频带的编码信息,该编码方法具有以下步骤:根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;

根据所述原信号,计算第二频谱;

计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度的第一参数;

计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量的第二参数;以及将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码。

8.一种解码方法,具有以下步骤:

获取低频带的编码信息以及高频带的编码信息;

根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;

分别获取作为高频带的编码信息被编码的第一参数和作为高频带的编码信息被编码的第二参数,该第一参数是表示类似程度的参数,所述类似程度是所述第一频谱与将对应于原信号的第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度,该第二参数表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量;以及使用获取的所述第一参数和所述第二参数对所述第二频谱进行解码。

说明书 :

编码装置、解码装置、编码方法及解码方法

[0001] 本申请是申请日为2005年11月2日、申请号为200580037233.8、发明名称为“编码装置、解码装置、编码方法及解码方法”的发明专利申请的分案申请。

技术领域

[0002] 本发明涉及对语音信号、音频信号等进行编码/解码的编码装置、解码装置、编码方法及解码方法。

背景技术

[0003] 为有效利用移动通信系统的电波资源等,需要用低比特率来压缩语音信号。另一方面用户却希望提高通话语音的质量及实现较高临场感的通话服务。为实现该目的,除需提高语音信号的质量以外,还需对语音以外的频带更宽的音频信号等信号进行高质量的编码。
[0004] 对于这样互相矛盾的需求,将多个编码技术结合起来的提案比较具有前景。具体来说,采用将第一编码单元和第二编码单元分层组合的结构,所述第一编码单元,以适合语音信号的模式用低比特率对输入信号进行编码,所述第二编码单元,以适合语音以外的信号的模式对输入信号与第一层解码信号的残差信号进行编码。具有这种分层结构的编码方式,由于通过编码单元得到的比特流具有扩展性(通过比特流的一部分信息也能够得出解码信号),因此被称为扩展性编码。扩展性编码基于其特性,可以灵活地对应比特率不同的网络之间的通信。可以说该特征适用于通过IP协议将多种网络合并的将来的网络环境。
[0005] 以往的扩展性编码例如有非专利文献1记载的扩展性编码。该文献中,记述了关于使用基于MPEG-4(Moving Picture Experts Group phase-4,流动图像专家组)的标准化技术来构成扩展性编码的方法。具体来说,在第一层单元(基本层单元)中,使用CELP(Code Excited Linear Prediction,码本激励线性预测)对语音信号即原信号进行编码,在第二层单元(扩展层单元),使用诸如AAC(Advanced Audio Coder,高级音频编码器)或者TwinVQ(Transform Domain Weighted Interleave Vector Quantization,传输域加权交织向量量化)的变换编码来对残差信号进行编码。在此,残差信号为从原信号中减去对第一层单元中得到的编码代码进行解码的结果(第一层解码信号)而得到的信号。
[0006] 非专利文献:三木弼一编著、“MPEG-4の全て”、初版、(株)工業調査会、1998年9月30日、P.126-127

发明内容

[0007] 发明需要解决的问题
[0008] 然而,上述以往的技术中,第二层单元中的变换编码是针对从原信号中减去第一层解码信号所得的残差信号来进行的。因此,包含在原信号中的一部分主要信息,由于通过第一层单元而可能被去除。这种情况下,残差信号的特性就变成接近噪音序列的特性。由此,在第二层单元使用诸如AAC或TwinVQ的被设计成有效地对音乐信号进行编码的变换编码时,要通过对具有上述特性的残差信号进行编码来达到提高解码信号的质量的目的,就需要分配较多的比特。其结果是具有比特率变大的问题。
[0009] 本发明鉴于上述问题,其目的在于提供一种即使在第二层单元或更高的层单元中进行低比特率的编码也能够得到高质量的解码信号的编码装置、解码装置、编码方法及解码方法。
[0010] 解决该问题的方案
[0011] 本发明的编码装置为根据原信号生成低频带的编码信息及高频带的编码信息的编码装置,其采用具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算单元,根据所述原信号,计算第二频谱;第一参数计算单元,计算表示所述第一频谱与所述第二频谱的高频带部分的类似程度的第一参数;第二参数计算单元,计算表示所述第一频谱与所述第二频谱的高频带部分的变动分量的第二参数;以及编码单元,将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码的结构。
[0012] 本发明的编码装置为根据原信号生成低频带的编码信息及高频带的编码信息的编码装置,其采用具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算单元,根据所述原信号,计算第二频谱;参数计算单元,计算表示所述第一频谱与所述第二频谱的高频带部分的类似程度的参数;参数编码单元,将算出的参数作为所述高频带的编码信息来进行编码;以及残差分量编码单元,对所述第一频谱和所述第二频谱的低频带部分的残差分量进行编码,其中,所述参数计算单元,使用由所述残差分量编码单元编码的残差分量提高所述第一频谱的质量后,计算所述参数的结构。
[0013] 本发明的解码装置采用具有:频谱获取单元,获取对应于低频带的第一频谱;参数获取单元,分别获取作为高频带的编码信息被编码的第一参数,该第一参数表示所述第一频谱与对应于原信号的第二频谱的高频带部分的类似程度,和作为高频带的编码信息被编码的第二参数,该第二参数表示所述第一频谱与所述第二频谱的高频带部分的变动分量;以及解码单元,使用获取的第一参数和第二参数对所述第二频谱进行解码的结构。
[0014] 本发明的编码方法为根据原信号生成低频带的编码信息及高频带的编码信息的编码方法,其具有:第一频谱计算步骤,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算步骤,根据所述原信号,计算第二频谱;第一参数计算步骤,计算表示所述第一频谱与所述第二频谱的高频带部分的类似程度的第一参数;第二参数计算步骤,计算表示所述第一频谱与所述第二频谱的高频带部分的变动分量的第二参数;以及编码步骤,将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码。
[0015] 本发明的解码方法具有:频谱获取步骤,获取对应与低频带的第一频谱;参数获取步骤,分别获取作为高频带的编码信息被编码的第一参数,该第一参数表示所述第一频谱与对应于原信号的第二频谱的高频带部分的类似程度,和作为高频带的编码信息被编码的第二参数,该第二参数表示所述第一频谱与所述第二频谱的高频带部分的变动分量;以及解码步骤,使用获取的第一参数和第二参数对所述第二频谱进行解码。
[0016] 本发明的编码装置,根据原信号生成低频带的编码信息及高频带的编码信息,该编码装置具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算单元,根据所述原信号,计算第二频谱;第一参数计算单元,计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度的第一参数;第二参数计算单元,计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量的第二参数;以及编码单元,将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码。
[0017] 本发明的解码装置具有:编码信息获取单元,获取低频带的编码信息以及高频带的编码信息;频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;参数获取单元,分别获取作为高频带的编码信息被编码的第一参数和作为高频带的编码信息被编码的第二参数,该第一参数是表示类似程度的参数,所述类似程度是所述第一频谱与将对应于原信号的第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度,该第二参数表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量;以及解码单元,使用获取的所述第一参数和所述第二参数对所述第二频谱进行解码。
[0018] 本发明的编码方法,根据原信号生成低频带的编码信息及高频带的编码信息,该编码方法具有以下步骤:根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;根据所述原信号,计算第二频谱;计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度的第一参数;计算表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量的第二参数;以及将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码。
[0019] 本发明的解码方法具有以下步骤:获取低频带的编码信息以及高频带的编码信息;根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;分别获取作为高频带的编码信息被编码的第一参数和作为高频带的编码信息被编码的第二参数,该第一参数是表示类似程度的参数,所述类似程度是所述第一频谱与将对应于原信号的第二频谱的高频带部分分割为多个频带所得的各个频带的类似程度,该第二参数表示所述第一频谱与将所述第二频谱的高频带部分分割为多个频带所得的各个频带的变动分量;以及使用获取的所述第一参数和所述第二参数对所述第二频谱进行解码。
[0020] 发明的有益效果
[0021] 根据本发明,即使在第二层单元或更高的层单元中进行低比特率的编码也能够得到高质量的解码信号。

附图说明

[0022] 图1是示意本发明的实施方式1涉及的编码装置的结构的方框图;
[0023] 图2是示意本发明的实施方式1涉及的第二层编码单元的结构的方框图;
[0024] 图3是示意本发明的实施方式1涉及的扩展频带编码单元的结构的方框图;
[0025] 图4是示意本发明的实施方式1涉及的扩展频带编码单元的滤波单元处理的生成频谱缓存的模式图;
[0026] 图5是示意本发明的实施方式1涉及的编码装置的复用单元输出的比特流的内容的模式图;
[0027] 图6是示意本发明的实施方式1涉及的解码装置的结构的方框图;
[0028] 图7是示意本发明的实施方式1涉及的第二层解码单元的结构的方框图[0029] 图8是示意本发明的实施方式1涉及的扩展频带解码单元的结构的方框图;
[0030] 图9是示意本发明的实施方式2涉及的第二层编码单元的结构的方框图;
[0031] 图10是示意本发明的实施方式2涉及的第一频谱编码单元的结构的方框图;
[0032] 图11是示意本发明的实施方式2涉及的第二层解码单元的结构的方框图;
[0033] 图12是示意本发明的实施方式2涉及的第一频谱解码单元的结构的方框图;
[0034] 图13是示意本发明的实施方式2涉及的扩展频带编码单元的结构的方框图;
[0035] 图14是示意本发明的实施方式2涉及的扩展频带解码单元的结构的方框图;
[0036] 图15是示意本发明的实施方式3涉及的第二层编码单元的结构的方框图;
[0037] 图16是示意本发明的实施方式3涉及的第二频谱编码单元的结构的方框图;
[0038] 图17是示意本发明的实施方式3涉及的第二频谱编码单元的结构的变形例的方框图;
[0039] 图18是示意本发明的实施方式3涉及的第二层解码单元的结构的方框图;
[0040] 图19是示意本发明的实施方式3涉及的第二频谱解码单元的结构的变形例的方框图;
[0041] 图20是示意本发明的实施方式3涉及的第二层编码单元的结构的变形例的方框图;以及
[0042] 图21是示意本发明的实施方式3涉及的第二层解码单元的结构的变形例的方框图。

具体实施方式

[0043] 本发明涉及适用于扩展性编码的较高层的变换编码,特别是该变换编码中频谱的有效编码方法。
[0044] 其主要特征之一为,使用具有将通过对第一层解码信号进行频率分析而得到的频谱(第一层解码频谱)作为内部状态(滤波器状态)的滤波器进行滤波处理,并将该输出信号当作原频谱的高频域部分的估计值。在此,原频谱是指,对经过延迟调整的原信号进行频率分析而得到的频谱。接着,对生成与原频谱的高频域部分最为类似的输出信号时的滤波信息进行编码,再传送给解码单元。由于只对滤波信息进行编码,而能够达到低比特率化的目的。
[0045] 在本发明的某一实施方式中,使用记录有多个频谱残差候选的频谱残差形状码本,向所述滤波器提供频谱残差并进行滤波处理。另外,在其它的实施方式中,在将第一层解码频谱存储在滤波器的内部状态之前,对第一层解码频谱的误差分量进行编码,在提高了第一层解码频谱的质量之后,通过滤波处理进行原频谱的高频域部分的估计。再者,在其它的实施方式中,在对第一层解码频谱的误差分量进行编码时,编码第一层解码频谱的误差分量以使第一层解码频谱的编码性能和使用了第一层解码频谱的高频域频谱的估计性能都提高。
[0046] 下面,针对本发明的实施方式参照附图进行详细说明。另外,在各实施方式中,进行具有由多个层构成的分层结构的扩展性编码。另外,在各实施方式中作为一个示例,(1)假设扩展性编码的分层结构为,第一层(基本层或低层)和比第一层高的第二层(扩展层或高层)的两层结构,(2)在第二层的编码中,在频率区域进行编码(变换编码),(3)第二层的编码使用MDCT(Modified Discrete Cosine Transform,修正的离散余弦变换)变换方式,(4)在第二层的编码中,将全频带分割成多个子带的情况下,以Bark定标等间隔地分割全频带,让各个子带与各个临界频带对应,(5)假设第一层的输入信号的采样率(F1)与第二层的输入信号的采样率(F2)之间的关系为F2大于等于F1(F1≦F2)。
[0047] (实施方式1)
[0048] 图1是示意形成例如语音编码装置等的编码装置100的结构的方框图。编码装置100具有:下采样单元101、第一层编码单元102、第一层解码单元103、复用单元104、第二层编码单元105及延迟单元106。
[0049] 图1中,采样率为F2的语音信号或音频信号(原信号)被提供给下采样单元101,在下采样单元101中进行采样变换处理,生成采样率为F1的信号,并提供给第一层编码单元102。第一层编码单元102,将对采样率为F1的信号进行编码而得到的编码代码输出给第一层解码单元103及复用单元104。
[0050] 第一层解码单元103,根据从第一层编码单元102输出的编码代码生成第一层解码信号,并输出给第二层编码单元105。
[0051] 延迟单元106,对原信号赋予预定长度的延迟,并输出给第二层编码单元105。该延迟用于调整由下采样单元101、第一层编码单元102及第一层解码单元103产生的时间延迟的。
[0052] 第二层编码单元105,用从第一层解码单元103输出的第一层解码信号,对从延迟单元106输出的原信号进行编码。接着,将通过该编码单元得到的编码代码输出给复用单元104。
[0053] 复用单元104,将从第一层编码单元102输出的编码代码与从第二层编码单元105输出的编码代码复用,作为比特流输出。
[0054] 接下来,对第二层编码单元105进行更详细的说明。第二层编码单元105的结构如图2所示。第二层编码单元105具有:频域变换单元201,扩展频带编码单元202,频域变换单元203及听觉掩蔽计算单元204。
[0055] 在图2中,频域变换单元201,对从第一层解码单元103输出的第一层解码信号通过MDCT变换进行频率分析,计算MDCT系数(第一层解码频谱)。接着,将第一层解码频谱输出给扩展频带编码单元202。
[0056] 频域变换单元203,对从延迟单元106输出的原信号通过MDCT变换进行频率分析,计算MDCT系数(原频谱)。接着,将原频谱输出给扩展频带编码单元202。
[0057] 听觉掩蔽计算单元204,用从延迟单元106输出的原信号,计算每个频带的听觉掩蔽,并将该听觉掩蔽通知给扩展频带编码单元202。
[0058] 在此,人的听觉特性具有当听见某个信号时,与该信号的频率接近的声音即使传入耳朵中也很难听见该声音的特性,这种特性被称为听觉掩蔽特性。上述听觉掩蔽用于实现有效的频谱编码。该频谱编码中,利用人的听觉掩蔽特性将听觉上容许的量化失真定量化,并适用对应于该容许量化失真的编码方法。
[0059] 扩展频带编码单元202,如图3所示具有:振幅调整单元301、滤波器状态设定单元302、滤波单元303、延迟量(Lag)设定单元304、频谱残差形状码本305、搜索单元306、频谱残差增益码本307、乘法器308、扩展频谱解码单元309及定标因子(scale factor)编码单元310。
[0060] 振幅调整单元301,被提供来自频域变换单元201的第一层解码频谱{S1(k);0≦k<Nn}、来自频域变换单元203的原频谱{S2(k);0≦k<Nw}。在此,假设第一层解码频谱的频谱点数为Nn,原频谱的频谱点数为Nw,且Nn<Nw。
[0061] 振幅调整单元301,进行振幅调整以使第一层解码频谱{S1(k);0≦k<Nn}的最大振幅频谱与最小振幅频谱的比(动态范围),接近原频谱的高频域部分{S2(k);Nn≦k<Nw}的动态范围。具体来说,如式(1)所示,求振幅频谱的幂次。
[0062] S1′(k)=sign(S1(k))·|S1(k)|γ…(1)
[0063] 在此,sign()为颠倒正号/负号的函数,γ表示0≦γ≦1范围内的实数。振幅调整单元301,从事先准备好的多个候选中选择,振幅调整后的第一层解码频谱的动态范围最接近原频谱的高频域部分{S2(k);Nn≦k<Nw}的动态范围时的γ(振幅调整系数),并将其编码代码输出给复用单元104。
[0064] 滤波器状态设定单元302,将振幅调整后的第一层解码频谱{S1′(k);0≦k<Nn}设成后述的音调滤波器的内部状态。具体来说,将振幅调整后的第一层解码频谱{S1′(k);0≦k<Nn}代入生成频谱缓存{S(k);0≦k<Nn},并输出给滤波单元303。在此,生成频谱缓存S(k)为在0≦k≦Nw范围内定义的排列变量。通过后述的滤波处理生成(Nw-Nn)点的原频谱的估计值(以下称为“估计原频谱”候选。
[0065] 延迟量设定单元304,按照来自搜索单元306的指示,在事先设定的搜索范围TMIN~TMAX中,渐进地让延迟量T一点点地变化,同时顺次地输出给滤波单元303。
[0066] 频谱残差形状码本305,存储多个频谱残差形状向量的候选。另外,按照搜索单元306的指示,从所有的候选中或事先限定的候选中,顺次地输出频谱残差形状向量。
[0067] 同样的,频谱残差增益码本307,存储多个频谱残差增益的候选。另外,按照搜索单元306的指示,从所有的候选中或事先限定的候选中,顺次地输出频谱残差增益。
[0068] 乘法器308,将频谱残差形状码本305输出的频谱残差形状向量与频谱残差增益码本307输出的频谱残差增益相乘,并对频谱残差形状向量进行增益调整。接着,将增益调整后的频谱残差形状向量输出给滤波单元303。
[0069] 滤波单元303,使用由滤波器状态设定单元302设定的音调滤波器的内部状态、由延迟量设定单元304输出的延迟量T及增益调整后的频谱残差形状向量来进行滤波处理,并计算估计原频谱。在此,音调滤波器的传递函数由式(2)表示。另外,该滤波处理由式(3)表示。
[0070]
[0071] S(k)=S(k-T)+g(j)·C(i,k)Nn≤k
[0072] 在此,C(i,k)表示第i个频谱残差形状向量,g(j)表示第j个频谱残差形状增益。将范围Nn≦k<Nw所包含的生成频谱缓存S(k)作为滤波单元303的输出信号(即,估计原频谱)输出给搜索单元306。图4示意生成频谱缓存、振幅调整后的第一层解码频谱及滤波单元303的输出信号之间的相互关系。
[0073] 搜索单元306,分别向延迟量设定单元304、频谱残差形状码本305及频谱残差增益码本307,指示延迟量、频谱残差形状及频谱残差增益的输出。
[0074] 另外,搜索单元306,计算原频谱的高频域部分{S2(k);Nn≦k<Nw}与滤波单元303的输出信号{S(k);Nn≦k<Nw}之间的失真E。接着,通过基于合成的分析方法(AbS:
Analysis by Synthesis),决定失真为最小时的延迟量、频谱残差形状向量及频谱残差增益的组合。此时,利用听觉掩蔽计算单元204输出的听觉掩蔽,选择听觉上失真最小的组合。假设该失真为E,那么失真E用例如由听觉掩蔽决定的权重函数W(k)就可以由式(4)来表示。在此,权重函数W(k)对听觉掩蔽较大(很难听到失真)的频率取较小的值,对听觉掩蔽较小(容易听到失真)的频率取较大的值。
[0075]
[0076] 由搜索单元306决定的延迟量的编码代码、频谱残差形状向量的编码代码及频谱残差增益的编码代码,输出给复用单元104及扩展频谱解码单元309。
[0077] 在上述的基于AbS的编码代码决定方法中,也可以同时决定延迟量、频谱残差形状向量及频谱残差增益,或者也可以顺次地决定各参数(例如延迟量、频谱残差形状向量、频谱残差增益的顺序)以减少计算量。
[0078] 扩展频谱解码单元309,对振幅调整单元301输出的振幅调整系数的编码代码及搜索单元306输出的延迟量的编码代码、频谱残差形状向量的编码代码及频谱残差增益的编码代码进行解码,生成原频谱的估计值(估计原频谱)。
[0079] 具体来说,首先使用解码后的振幅调整系数γ,根据上述式(1)进行第一层解码频谱{S1(k);0≦k<Nn}的振幅调整。接着,将振幅调整后的第一层解码频谱作为滤波器的内部状态来使用,同时分别使用解码后的延迟量、频谱残差形状向量及频谱残差增益,根据上述式(3)进行滤波处理,生成估计原频谱{S(k);Nn≦k<Nw}。生成的估计原频谱输出给定标因子编码单元310。
[0080] 定标因子编码单元310,使用频域变换单元203输出的原频谱的高频域部分{S2(k);Nn≦k<Nw}和扩展频谱解码单元309输出的估计原频谱{S(k);Nn≦k<Nw},并利用听觉掩蔽对听觉上最合适的估计原频谱的定标因子(定标系数)进行编码,将该编码代码输出给复用单元104。
[0081] 也就是说,第二层编码代码由振幅调整单元301输出的编码代码(振幅调整系数)、搜索单元306输出的编码代码(延迟量、频谱残差形状向量、频谱残差增益)及定标因子编码单元310输出的编码代码(定标因子)的组合构成。
[0082] 另外,本实施方式中已说明了对于频带Nn~Nw适用扩展频带编码单元202,来决定一组编码代码(振幅调整系数、延迟量、频谱残差形状向量、频谱残差增益、定标因子)的结构,也可以是将频带Nn~Nw分割成多个频带,对各个频带适用扩展频带编码单元202的结构。这种情况下,就按每个频带来决定编码代码(振幅调整系数、延迟量、频谱残差形状向量、频谱残差增益、定标因子),并输出给复用单元104。例如将频带Nn~Nw分割成M个频带并对各个频带适用扩展频带编码单元202的话,就会得到M组的编码代码(振幅调整系数、延迟量、频谱残差形状向量、频谱残差增益、定标因子)。
[0083] 另外,也可以不发送多个频带分别独立的编码代码,而是在相邻频带之间共享一部分编码代码。例如,将频带Nn~Nw分割成M个频带,相邻的2个频带使用共通的振幅调整系数时,振幅调整系数的编码代码的数量就为M/2个,而其它的编码代码的数量分别为M个。
[0084] 另外,本实施方式说明了使用1次AR型音调滤波器的情况。然而,本发明可以适用的滤波器并不局限于1次AR型音调滤波器,传递函数由式(5)表示的滤波器也适用于本发明。使用的音调滤波器的用于规定滤波器的次数的参数L及M越大,就越能够表示多种特性,而有可能提高质量。不过,由于次数越大就需要分配更多的滤波器系数的编码比特,因此需要按照实用性的比特分配来决定恰当的音调滤波器的传递函数。
[0085]
[0086] 另外,本实施方式以使用听觉掩蔽为前提,但也可以是不使用听觉掩蔽的结构。这种情况下,就没有必要在第二层编码单元105中设置图2的听觉掩蔽计算单元204,能够减少装置整体的计算量。
[0087] 在此,针对复用单元104输出的比特流的结构用图5来说明。从比特流的MSB(Most Significant Bit,最高有效比特)开始依次地存储有第一层编码代码、第二层编码代码。再者,第二层编码代码依次地存储有定标因子、振幅调整系数、延迟量、频谱残差增益、频谱残差形状向量,越靠后的信息配置在越靠近LSB(Least Significant Bit,最低有效比特)的位置。该比特流的结构,对于相对各编码代码的代码丢失的敏感程度(编码代码丢失时会使解码信号的质量恶化多少的程度),将代码差错敏感度越大(恶化较大)的比特配置在越靠近MSB的位置。根据该结构,由于在传输路径上丢弃部分的比特流时从LSB开始顺序丢弃,因此能够将由丢弃引起的恶化控制在最小限度。作为在从LSB端开始优先地丢弃比特流的网络结构的一个示例,可列举出将图5所示的被分割开的各编码代码用不同的分组传送,对各分组排列优先顺序,并使用能够进行优先控制的分组网的结构。不过,网络的结构并不局限于上述的结构。
[0088] 另外,在图5所示的将代码差错敏感度越高的编码参数配置在越靠近MSB的比特流结构中,若适用对于越靠近MSB的比特越使用较强的差错检测·纠错的信道编码,便能够得到将解码质量的恶化控制在最小限度的效果。例如作为差错检测、纠错的方法可以适用CRC码或RS码等。
[0089] 图6是示意形成例如语音解码装置等的解码装置600的结构的方框图。
[0090] 解码装置600具有:分离单元601,将编码装置100输出的比特流分离成第一层编码代码和第二层编码代码;第一层解码单元602,对第一层编码代码进行解码;以及第二层解码单元603,对第二层编码代码进行解码。
[0091] 分离单元601,接收编码装置100发送的比特流,分离成第一层的编码代码和第二层的编码代码,并分别输出给第一层解码单元602;以及第二层解码单元603。
[0092] 第一层解码单元602,根据第一层编码生成第一层解码信号,并输出给第二层解码单元603。另外,根据需要将生成的第一层解码信号作为可以保证最低限度质量的解码信号(第一层解码信号)输出。
[0093] 第二层解码单元603,使用第一层解码信号和第二层编码代码生成高质量的解码信号(在此,称为第二层解码信号),根据需要将该解码信号输出。
[0094] 这样,通过第一层解码信号可以保证再生语音的最低限度的质量,通过第二层解码信号能够提高再生语音的质量。另外,将第一层解码信号或第二层解码信号中的哪一方作为输出信号,取决于根据网络环境(发生分组丢失等)是否能得到第二层编码代码,或应用(application)及用户的设定等。
[0095] 针对第二层解码单元603的结构用图7进行详细说明。在图7中,第二层解码单元603具有:扩展频带解码单元701、频域变换单元702及时域变换单元703。
[0096] 频域变换单元702,将从第一层解码单元602输入的第一层解码信号变换成频域的参数(例如MDCT系数等),并将该参数作为频谱点数为Nn的第一层解码频谱输出给扩展频带解码单元701。
[0097] 扩展频带解码单元701,根据从分离单元601输入的第二层编码代码(该结构中与扩展频带编码代码相同),对各种参数(振幅调整系数、延迟量、频谱残差形状向量、频谱残差增益、定标因子)进行解码。另外,用解码后的各种参数和频域变换单元702输出的第一层解码频谱,来生成第二频谱,该第二频谱为被频域扩展后的第二解码频谱,频谱点数为Nw。接着,将第二解码频谱输出给时域变换单元703。
[0098] 时域变换单元703,将第二解码频谱变换成时域的信号后,根据需要适当地进行开窗或叠加加法等处理,避开帧之间产生的不连续,并将第二层解码信号输出。
[0099] 接下来,针对扩展频域解码单元701用图8进行详细说明。图8中,扩展频域解码单元701具有:分离单元801、振幅调整单元802、滤波器状态设定单元803、滤波单元804、频谱残差形状码本805、频谱残差增益码本806、乘法器807、定标因子解码单元808、定标单元809及频谱合成单元810。
[0100] 分离单元801,将从分离单元601输入的扩展频带编码代码分离成:振幅调整系数编码代码、延迟量编码代码、残差形状编码代码、残差增益编码代码、定标因子编码代码。另外,分别将振幅调整系数编码代码输出给振幅调整单元802,将延迟量编码代码输出给滤波单元804,将残差形状编码代码输出给频谱残差形状码本805,将残差增益编码代码输出给频谱残差增益码本806,将定标因子编码代码输出给定标因子解码单元808。
[0101] 振幅调整单元802,对从分离单元801输入的振幅调整系数编码代码进行解码,用解码后的振幅调整系数对另外的频域变换单元702输入的第一层解码频谱的振幅进行调整,并将振幅调整后的第一层解码频谱输出给滤波器状态设定单元803。振幅调整用上述的式(1)所示的方法进行。在此,S1(k)表示第一层解码频谱,S1′(k)表示振幅调整后的第一层解码频谱。
[0102] 滤波器状态设定单元803,将振幅调整后的第一层解码频谱设定成上述式(2)所示的传递函数的音调滤波器的滤波器状态。具体来说,将振幅调整后的第一层解码频谱{S1′(k);0≦k<Nn}代入生成频谱缓存S(k),并输出给滤波单元804。在此,T为音调滤波器的延迟量。另外,生成频谱缓存S(k)为在k=0~Nw-1范围内定义的排列变量,通过本滤波处理生成(Nw-Nn)点的频谱。
[0103] 滤波单元804,对从分离单元801输入的延迟量T进行解码,使用解码后的延迟量T对从滤波器状态设定单元803输入的生成频谱缓存S(k)进行滤波处理。具体来说,通过上述式(3)所示的方法生成输出频谱{S(k);Nn≦k<Nw}。在此,g(j)表示由残差增益编码代码j表示的频谱残差增益,C(i,k)表示由残差形状编码代码i表示的频谱残差形状向量,g(j)·C(i,k)从乘法器807输入。生成的滤波单元804的输出频谱{S(k);Nn≦k<Nw}输出给定标单元809。
[0104] 频谱残差形状码本805,对从分离单元801输入的残差形状编码代码进行解码,并将对应于解码结果的频谱残差形状向量C(i,k)输出给乘法器807。
[0105] 频谱残差增益码本806,对从分离单元801输入的残差增益编码代码进行解码,并将对应于解码结果的频谱残差增益g(j)输出给乘法器807。
[0106] 乘法器807,将从频谱残差形状码本805输入的频谱残差形状向量C(i,k)与从频谱残差增益码本806输入的频谱残差增益g(j)相乘的结果输出给滤波单元804。
[0107] 定标因子解码单元808,对从分离单元801输入的定标因子编码代码进行解码,并将解码后的定标因子输出给滤波单元809。
[0108] 定标单元809,在由滤波单元804提供的输出频谱{S(k);Nn≦k<Nw}上乘以从定标因子解码单元808输出的定标因子,并将相乘的结果输出给频谱合成单元810。
[0109] 频谱合成单元810,将由频域变换单元702提供的第一层解码频谱{S1(k);0≦k<Nn}与从定标单元809输入的定标后的生成频谱缓存的高频域部分{S(k);Nn≦k<Nw}相结合而得到的频谱,作为第二解码频谱输出给时域变换单元703。
[0110] (实施方式2)
[0111] 图9示意本发明的实施方式2涉及的第二层编码单元105的结构。图9中与图2具有相同名称的方框,由于具有相同的功能,在此省略其详细的说明。图2与图9的不同之处在于,频域变换单元201与扩展频带编码单元202之间存在第一频谱编码单元901。第一频谱编码单元901,使从频域变换单元201输出的第一层解码频谱的质量提高,将此时的编码代码(第一频谱编码代码)输出给复用单元104,同时将质量得以提高的第一层解码频谱(第一解码频谱)提供给扩展频带编码单元202。扩展频带编码单元202,用第一解码频谱进行上述的处理,作为其结果输出扩展频带编码代码。也就是说,本实施方式的第二层编码代码由扩展频带编码代码和第一频谱编码代码的组合构成。因此,在本实施方式中,复用单元104将第一层编码代码、扩展频带编码代码及第一频谱编码复用,来生成比特流。
[0112] 接下来,针对第一频谱编码单元901用图10进行详细说明。第一频谱编码单元901具有:定标系数编码单元1001、定标系数解码单元1002、详细频谱编码单元1003、复用单元1004、详细频谱解码单元1005、归一化单元1006、减法器1007及加法器1008。
[0113] 减法器1007,从原频谱中减去第一层解码频谱来生成残差频谱,并将残差频谱输出给定标系数编码单元1001及归一化单元1006。定标系数编码单元1001,计算表示残差频谱的频谱大致轮廓的定标系数,对该定标系数进行编码,并将该编码代码输出给复用单元1004及定标系数解码单元1002。
[0114] 在定标系数的编码中也可以使用听觉掩蔽。例如,用听觉掩蔽来决定定标系数编码所需的比特分配,根据该比特分配信息来进行编码。此时,若有完全没有被分配比特的频带时,则该频带的定标系数就没有被编码。这样,能够提高定标系数的编码效率。
[0115] 定标系数解码单元1002,根据输入的定标系数编码代码对定标系数进行解码,并将解码后的定标系数输出给归一化单元1006、详细频谱编码单元1003及详细频谱解码单元1005。
[0116] 归一化单元1006,用由定标系数解码单元1002提供的定标系数,对由减法器1007提供的残差频谱进行归一化,并将归一化后的残差频谱输出给详细频谱编码单元1003。
[0117] 详细频谱编码单元1003,用从定标系数解码单元1002输入的定标系数计算各个频带的听觉重要度,并求分配到各个频带的比特数,根据该比特数的条件对归一化后的残差频谱(详细频谱)进行编码。接着,将通过该编码得到的详细频谱编码代码输出给复用单元1004及详细频谱解码单元1005。
[0118] 另外,对归一化后的残差频谱进行编码时,也可以用听觉掩蔽来进行编码以减小听觉上的失真。另外,也可以用第一层解码频谱的信息来计算听觉重要度。这种情况下的结构为将第一层解码频谱输入给详细频谱编码单元1003。
[0119] 由定标系数编码单元1001及详细频谱编码单元1003输出的编码代码,在复用单元1004被复用,作为第一频谱编码代码输出给复用单元104。
[0120] 详细频谱解码单元1005,用从定标系数解码单元1002输入的定标系数计算各个频带的听觉重要度,并求分配给各个频带的比特数,根据定标系数及从详细频谱编码单元1003输入的详细频谱编码代码对各个频带的残差频谱进行解码,再将解码后的残差频谱输出给加法器1008。另外,也可以用第一层解码频谱的信息来计算听觉重要度。这种情况下的结构为将第一层解码频谱输入给详细频谱解码单元1005。
[0121] 加法器1008,将解码后的残差频谱与第一层解码频谱相加来生成第一解码频谱,并将生成的第一解码频谱输出给扩展频带编码单元202。
[0122] 这样,根据本实施方式,在改善了第一层解码频谱的质量之后,使用改善质量后的频谱,即第一频谱在扩展频带编码单元202生成高频域部分(Nn≦k<Nw)的频谱,由此能够改善频带被扩展的解码信号的质量。
[0123] 针对本实施方式的第二层解码单元603的结构,用图11进行详细说明。图11中与图7相同名称的方框,由于具有相同的功能,在此省略其详细的说明。图11中,第二层解码单元603具有:分离单元1101、第一频谱解码单元1102、扩展频带解码单元701、频域变换单元702及时域变换单元703。
[0124] 分离单元1101,将第二层编码代码分离成第一频谱编码代码和扩展频带编码代码,并分别将第一频谱编码代码输出给第一频谱解码单元1102,将扩展频带编码代码输出给扩展频带解码单元701。
[0125] 频域变换单元702,将从第一层解码单元602输入的第一层解码信号变换成频域的参数(例如MDCT系数等),并将该参数作为第一层解码频谱输出给第一频谱解码单元1102。
[0126] 第一频谱解码单元1102,将对从分离单元1101输入的第一频谱编码代码进行解码而得到的第一层的编码误差的量化频谱,与从频域变换单元702输入的第一层解码频谱相加。接着,将该相加的结果作为第一解码频谱输出给扩展频带解码单元701。
[0127] 在此,针对第1频谱解码单元1102用图12进行详细说明。第一频谱解码单元1102具有:分离单元1201、定标系数解码单元1202、详细频谱解码单元1203及频谱解码单元1204。
[0128] 分离单元1201,将输入的第一频谱编码代码分离成表示定标系数的编码代码和表示详细频谱(频谱详细结构)的编码代码,并分别将定标系数编码代码输出给定标系数解码单元1202,将详细频谱编码代码输出给详细频谱解码单元1203。
[0129] 定标系数解码单元1202,根据输入的定标系数编码代码对定标系数进行解码,并将解码后的定标系数输出给频谱解码单元1204及详细频谱解码单元1203。
[0130] 详细频谱解码单元1203,用从定标系数解码单元1202输入的定标系数计算各个频带的听觉重要度,并求分配各个频带的详细频谱的比特数。另外,根据从分离单元1201输入的详细频谱编码代码对各个频带的详细频谱进行解码,并将解码后的详细频谱输出给频谱解码单元1204。
[0131] 另外,也可以用第一层解码频谱的信息来计算听觉重要度。这种情况下的结构为将第一层解码频谱输入给详细频谱解码单元1203。
[0132] 频谱解码单元1204,根据由频域变换单元702提供的第一层解码频谱、从定标系数解码单元1202输入的定标系数及从详细频谱解码单元1203输入的详细频谱,对第一解码频谱进行解码,并将该解码频谱输出给扩展频带解码单元701。
[0133] 另外,也可以不在本实施方式的扩展频带编码单元202中设置频谱残差形状码本305及频谱残差增益码本307。这种情况下的扩展频带编码单元202的结构如图13所示。
另外,也可以不在扩展频带解码单元701中设置频谱残差形状码本805及频谱残差增益码本806。这种情况下的扩展频带解码单元701的结构如图14所示。另外,图13及图14分别示意的滤波单元1301、1401的输出信号如式(6)所示。
[0134] S(k)=S(k-T)Nn≤k
[0135] 本实施方式中,在改善了第一层解码频谱的质量之后,使用该质量改善后的频谱由扩展频带编码单元202生成高频域部分的(Nn≦k≦Nw)频谱。根据该结构,能够改善解码信号的质量。该优点无论是否具有频谱残差形状码本及频谱残差增益码本均可以享有。
[0136] 另外,第一频谱编码单元901中,对低域部分(0≦k<Nn)的频谱进行编码时,也可以对低域部分(0≦k<Nn)的频谱进行编码以使全频带(0≦k<Nw)的编码失真为最小。这种情况下,扩展频带编码单元202中,进行包括高频域部分(Nn≦k<Nw)的编码。另外,这种情况下,第一频谱编码单元901中,考虑低域部分的编码结果给高频域部分的编码带来的影响,来进行低域部分的编码。这样,由于对低域部分的频谱进行的编码使全频带的频谱为最佳,而能够得到提高质量的效果。
[0137] (实施方式3)
[0138] 本发明的实施方式3涉及的第二层编码单元105的结构用图15表示。由于图15中与图9中相同名称的方框具有相同的功能,在此省略其详细说明。
[0139] 与图9的不同之处在于,设有扩展频带编码单元1501,具有解码功能且求取扩展频带编码代码;第二频谱编码单元1502,用该扩展频带编码代码生成第二解码频谱,对从原频谱中减去第二解码频谱而求出的误差频谱进行编码。通过在第二频谱编码单元1502对上述误差频谱进行编码,能够生成更高质量的解码频谱,而能够提高由解码装置得到解码信号的质量。
[0140] 扩展频带编码单元1501,与图3所示的扩展频带编码单元202相同地生成扩展频带编码代码并输出。另外,扩展频带编码单元1501,包括图8所示的扩展频带解码单元701相同的结构,与扩展频带解码单元701相同地生成第二解码频谱。该第二解码频谱输出给第二频谱编码单元1502。也就是说,本实施方式的第二层编码代码,由扩展频带编码代码、第一频谱编码代码及第二频谱编码代码构成。
[0141] 另外,在扩展频带编码单元1501的结构中,也可以共享图3与图8中具有共通名称的方框。
[0142] 第二频谱编码单元1502,如图16所示具有:定标系数编码单元1601、定标系数解码单元1602、详细频谱编码单元1603、复用单元1604、归一化单元1605及减法器1606。
[0143] 减法器1606,从原频谱中减去第二解码频谱以生成残差频谱,并将残差频谱输出给定标系数编码单元1601及归一化单元1605。定标系数编码单元1601,计算表示残差频谱的频谱大致轮廓的定标系数,对该定标系数进行编码,并将定标系数编码代码输出给复用单元1604及定标系数解码单元1602。
[0144] 在此,也可以用听觉掩蔽来达到提高定标系数编码的效率的目的。例如,用听觉掩蔽来决定定标系数编码所需的比特分配,根据该比特分配信息进行编码。此时,若有完全没有被分配比特的频带,则该频带的定标系数不被编码。
[0145] 定标系数解码单元1602,根据输入的定标系数编码代码对定标系数进行解码,并将解码后的定标系数输出给归一化单元1605及详细频谱编码单元1603。
[0146] 归一化单元1605,用由定标系数解码单元1602提供的定标系数,对由减法器1606提供的残差频谱进行归一化,并将归一化后的残差频谱输出给详细频谱编码单元1603。
[0147] 详细频谱编码单元1603,用从定标系数解码单元1602输入的解码定标系数计算各个频带的听觉重要度,求取分配给各个频带的比特数,并基于该比特数的条件对归一化后的残差频谱(详细频谱)进行编码。接着,将通过该编码得到的编码代码输出给复用单元1604。
[0148] 另外,在对归一化后的残差频谱进行编码时,也可以进行使用听觉掩蔽减小听觉上的失真的编码。另外,也可以使用第二层解码频谱的信息来计算听觉重要度。这种情况下的结构将第二层解码频谱输入给详细频谱编码单元1603。
[0149] 定标系数编码单元1601及详细频谱编码单元1603输出的编码代码由复用单元1604复用,作为第二频谱编码代码输出。
[0150] 图17示意第二频谱编码单元1502的结构的变形例。由于图17中与图16中相同名称的方框具有相同的功能,在此省略其详细说明。
[0151] 该结构中,第二频谱编码单元1502将由减法器1606提供的残差频谱直接编码。也就是说,不进行残差频谱的归一化处理。因此在本结构中没有设置,图16所示的定标系数编码单元1601、定标系数解码单元1602及归一化单元1605。根据该结构,由于无需通过第二频谱编码单元1502对定标系数分配比特,因此能够降低比特率。
[0152] 听觉重要度及比特分配计算单元1701,根据第二解码频谱求取各个频带的听觉重要度,并求取基于听觉重要度决定的各个频带的比特分配。将求出的听觉重要度及比特分配输出给详细频谱编码单元1603。
[0153] 详细频谱编码单元1603,根据从听觉重要度及比特分配计算单元1701输入的听觉重要度及比特分配,将残差频谱编码。接着,将通过该编码得到的编码代码作为第二频谱编码代码输出给复用单元104。另外,在对残差频谱进行编码之际,也可以进行使用听觉掩蔽减小听觉上失真的编码。
[0154] 本实施方式的第二层解码单元603的结构用图18表示。第二层解码单元603具有:扩展频带解码单元701、频域变换单元702、时域变换单元703、分离单元1101、第一频谱解码单元1102及第二频谱解码单元1801。图18中与图11中相同名称的方框具有相同的功能,在此省略其详细说明。
[0155] 第二频谱解码单元1801,将对从分离单元1101输入的第二频谱编码代码进行解码而得到的第二解码频谱的编码误差量化后的频谱,加在从扩展频带解码单元701输入的第二解码频谱上。接着,将该相加的结果作为第三解码频谱输出给时域变换单元703。
[0156] 第二频谱解码单元1801,在第二频谱编码单元1502采用图16所示的结构的情况下,采用与图12相同的结构。不过,图12中的第一频谱编码代码、第一层解码频谱及第一解码频谱分别置换成第二频谱编码代码、第二解码频谱及第三解码频谱。
[0157] 另外,本实施方式中,对于第二频谱解码单元1801的结构,以第二频谱编码单元1502采用图16所示的结构的情况为例进行了说明,不过在第二频谱编码单元1502采用图
17所示的结构的情况下,第二频谱解码单元1801的结构就如图19所示。
[0158] 即图19示意与不使用定标系数的第二频谱编码单元1502对应的第二频谱解码单元1801的结构。第二频谱解码单元1801具有:听觉重要度及比特分配计算单元1901、详细频谱解码单元1902及频谱解码单元1903。
[0159] 图19中,听觉重要度及比特分配计算单元1901,根据从扩展频带解码单元701输入的第二解码频谱求取各个频带的听觉重要度,并求取根据听觉重要度决定的各个频带的比特分配。将求出的听觉重要度及比特分配输出给详细频谱解码单元1902。
[0160] 详细频谱解码单元1902,基于从听觉重要度及比特分配计算单元1901输入的听觉重要度及比特分配,对从分离单元1101作为第二频谱编码代码输入的详细频谱编码代码进行解码,并将解码结果(各个频带的详细频谱)输出给频谱解码单元1903。
[0161] 详细频谱解码单元1903,将从扩展频带解码单元701输入的第二解码频谱与从详细频谱解码单元1902输入的详细频谱相加,并将相加的结果作为第三解码频谱向外部输出。
[0162] 另外,在本实施方式中,以包括第一频谱编码单元901及第一频谱解码单元1102的结构为例进行了说明,不过即使没有第一频谱编码单元901及第一频谱解码单元1102也能够实现本实施方式的作用效果。这种情况下的第二层编码单元105的结构由图20示意,第二层解码单元603的结构由图21示意。
[0163] 以上,对本发明的扩展性解码装置及扩展性编码装置的实施方式进行了说明。
[0164] 另外,在上述的实施方式中,作为变换方式用MDCT进行了说明,不过并不局限于此,本发明也可以适用其它的变换方式,例如使用傅立叶变换、余弦变换或小波(Wavelet)变换等。
[0165] 另外,在上述实施方式中,基于层数为2的情况进行了说明,不过并不局限于此,也适用于具有2层以上层数的扩展性编码/解码。
[0166] 另外,本发明涉及的编码装置及解码装置,不局限于上述的实施方式1~3,可以进行各种变更。例如,可以将各实施方式适当地组合起来实施。
[0167] 本发明涉及的编码装置及解码装置,也可以安装在移动系统的通信终端装置及基站装置上,这样能够提供具有与上述相同作用效果的通信终端装置及基站装置。
[0168] 另外,在此以本发明通过硬件构成的情况为例进行了说明,不过本发明也可以通过软件来实现。
[0169] 另外,在上述各实施方式的说明中使用的各功能块,最为典型的是通过集成电路LSI来实现,可以将各功能块个别芯片化,也可以将全部或一部分功能块芯片化。
[0170] 另外,此处所称的LSI,根据集成度的不同也可称作IC、系统LSI、超级LSI、超大LSI等。
[0171] 另外,集成电路化的方法并不局限于LSI,也可以通过专用电路或通用处理器来实现。也可以使用在制造LSI后可编程的FPGA(Field Programmable Gate Array,现场可编程门阵列),或LSI内部的电路块的连接或设定可以重新构成的可重构处理器。
[0172] 再者,根据半导体技术的进步或派生出的其他技术,若有可以替代LSI的集成电路化技术问世的话,当然也可以利用该技术进行功能块的集成化。也有应用生物技术的可能性。
[0173] 也就是说,上述实施方式涉及的扩展性编码装置为根据原信号生成低频带的编码信息及高频带的编码信息的该扩展性编码装置,其采用具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算单元,根据所述原信号,计算第二频谱;第一参数计算单元,计算表示所述第一频谱与所述第二频谱的高频带部分的类似程度的第一参数;第二参数计算单元,计算表示所述第一频谱与所述第二频谱的高频带部分的变动分量的第二参数;以及编码单元,将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码的结构。
[0174] 另外,上述实施方式涉及的编码装置基于上述结构采用,所述第一参数计算单元,使用将所述第一频谱作为内部状态的滤波器,将表示所述滤波器特性的参数作为所述第一参数输出的结构。
[0175] 另外,上述实施方式涉及的扩展性编码装置基于上述结构采用,所述第二参数计算单元,具有记录多个频谱残差候选的频谱残差形状码本,将所述频谱残差的代码作为所述第二参数输出的结构。
[0176] 另外,上述实施方式涉及的扩展性编码装置基于上述结构采用还具有残差分量编码单元,对所述第一频谱与所述第二频谱的低频带部分的残差分量进行编码,其中,所述第一参数计算单元及所述第二参数计算单元,使用由所述残差分量编码单元编码的残差分量来提高所述第一频谱的质量之后,计算所述第一参数及第二参数的结构。
[0177] 另外,上述实施方式涉及的扩展性编码装置基于上述结构采用,所述残差分量编码单元,使所述第一频谱的低频带部分的质量和根据由所述编码单元编码的第一参数及第二参数得到的解码频谱的高频带部分的质量的双方提高的结构。
[0178] 另外,上述实施方式涉及的扩展性编码装置基于上述结构采用,所述第一参数包含延迟量;所述第二参数包含频谱残差;其中还具有构成单元,构成按所述延迟量、所述频谱残差的顺序被配置的比特流的结构。
[0179] 另外,本实施方式涉及的编码装置为根据原信号生成低频带的编码信息及高频带的编码信息的编码装置,其采用具有:第一频谱计算单元,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算单元,根据所述原信号,计算第二频谱;参数计算单元,计算表示所述第一频谱与所述第二频谱的高频带部分的类似程度的参数;参数编码单元,将算出的参数作为所述高频带的编码信息来进行编码;以及残差分量编码单元,对所述第一频谱和所述第二频谱的低频带部分的残差分量进行编码,其中,所述参数计算单元,使用由所述残差分量编码单元编码的残差分量提高所述第一频谱的质量后,计算所述参数的结构。
[0180] 另外,上述实施方式涉及的扩展性解码装置采用具有:频谱获取单元,获取对应于低频带的第一频谱;参数获取单元,分别获取作为高频带的编码信息被编码的第一参数,该第一参数表示所述第一频谱与对应于原信号的第二频谱的高频带部分的类似程度,和作为高频带的编码信息被编码的第二参数,该第二参数表示所述第一频谱与所述第二频谱的高频带部分的变动分量;以及解码单元,使用获取的第一参数和第二参数对所述第二频谱进行解码的结构。
[0181] 另外,上述实施方式涉及的扩展性编码方法为根据原信号生成低频带的编码信息及高频带的编码信息的扩展性编码方法,其具有:第一频谱计算步骤,根据所述低频带的编码信息的解码信号,计算低频带的第一频谱;第二频谱计算步骤,根据所述原信号,计算第二频谱;第一参数计算步骤,计算表示所述第一频谱与所述第二频谱的高频带部分的类似程度的第一参数;第二参数计算步骤,计算表示所述第一频谱与所述第二频谱的高频带部分的变动分量的第二参数;以及编码步骤,将算出的第一参数和第二参数作为所述高频带的编码信息来进行编码。
[0182] 另外,上述实施方式涉及的扩展性解码方法具有:频谱获取步骤,获取对应于低频带的第一频谱;参数获取步骤,分别获取作为高频带的编码信息被编码的第一参数,该第一参数表示所述第一频谱与对应于原信号的第二频谱的高频带部分的类似程度,和作为高频带的编码信息被编码的第二参数,该第二参数表示所述第一频谱与所述第二频谱的高频带部分的变动分量;以及解码步骤,使用获取的第一参数和第二参数对所述第二频谱进行解码。
[0183] 特别是,根据本发明的第一种扩展性编码装置,在使用将第一频谱作为内部状态的滤波器估计第二频谱的高频域部分,将滤波器信息编码后发送的频谱编码装置中,具有记录多个频谱残差候选的频谱残差形状码本,将频谱残差作为所述滤波器的输入信号,进行滤波处理来估计第二频谱的高频域部分,由于通过使用频谱残差,能够将通过第一频谱的变形无法表达的第二频谱的高频域部分的分量编码,而能够提高第二频谱的高频域部分的估计性能且提高质量。
[0184] 另外,根据本发明的第二种扩展性编码装置,在对第二频谱的低域部分与第一频谱之间的误差分量进行编码以达到提高第一频谱的质量的目的之后,使用将该第一频谱作为内部状态的滤波器来估计第二频谱的高频域部分,改善了相对第二频谱的低域部分的第一频谱的质量之后,通过用改善质量后的第一频谱来估计第二频谱的高频域部分,而能够提高估计性能且提高质量。
[0185] 另外,根据本发明的第三种扩展性编码装置,对第二频谱的低域部分和第一频谱之间的误差分量进行编码,以使通过将第一频谱作为内部状态的滤波器估计第二频谱的高频域部分而生成的估计频谱与第二频谱的高频域部分之间的误差分量,和第二频谱的低域部分与第一频谱之间的误差分量使这两个误差分量减小,在对第一频谱与第二频谱的低域部分之间的误差进行编码之际,由于进行使第一频谱及第二频谱的高频域部分的估计频谱双方的质量同时得到提高的第一频谱编码,因而能够提高质量。
[0186] 另外,在上述的1至3的扩展性编码装置中,也可以在编码装置中生成传送给解码装置的比特流时,该比特流至少含有定标因子、动态范围调整系数、延迟量,并按该顺序来构成比特流。这样,由于比特流的结构为将对解码信号的质量影响越大的参数配置在越靠近比特流的MSB(Most Significant Bit)位置,因此,能够得到即使从比特流的LSB(Least Significant Bit)开始任意的位置删除比特也很难产生质量恶化的效果。
[0187] 本说明书基于2004年11月5日提出的日本专利申请2004-322959,其内容全部包含于此。
[0188] 工业实用性
[0189] 本发明涉及的编码装置、解码装置、编码方法及解码方法,适用于扩展性编码/解码等。