通信装置和通信方法转让专利

申请号 : CN200580005701.3

文献号 : CN1922660B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 山梨智史佐藤薰森井利幸

申请人 : 松下电器产业株式会社

摘要 :

提供一种通信装置,其通过考虑接收端的使用环境来控制发送端的传输比特率,从而在维持预定的质量的同时进行有效率的语音/音频信号的编码。在此装置中,传输模式决定单元(101)检测输入信号中的语音/音频信号的背景所包含的环境噪声,并决定传输模式,该传输模式是根据该环境噪声的等级来控制从作为对方通信终端的通信终端装置(150)传输的信号的传输比特率。信号解码单元(103)对通过传输路径(110)从通信终端装置(150)传输的编码信息进行解码,将获得的信号作为输出信号来输出。信号解码单元(103)通过在考虑传输延迟的同时对从传输路径(110)输出的编码信息所包含的传输模式信息和从传输模式决定单元(101)获得的传输模式信息进行比较,检测出传输差错。

权利要求 :

1.一种通信装置,包括:

传输模式决定单元,基于本通信装置的输入信号所包含的环境噪声的等级,来决定考虑了本通信装置的环境噪声的用于控制传输比特率的第一传输模式,并且,基于表示所述第一传输模式的第一传输模式信息、以及从通信对方的装置接收的第二传输模式信息,来决定考虑了本通信装置和所述通信对方的环境噪声的用于控制传输比特率的第三传输模式;以及编码单元,以对应于所述第三传输模式的传输比特率对输入信号进行编码,并将通过编码而获得的信息源代码和所述第三传输模式传输到所述通信对方的装置,其中,所述传输模式决定单元计算预定期间的输入信号的功率值的最大值和最小值,并且使用所述功率值的最大值和最小值中的至少一个来检测包含在输入信号中的环境噪声的等级。

2.如权利要求1所述的通信装置,其中,所述传输模式决定单元在检测出的环境噪声的等级与上一次检测出的环境噪声的等级之间的差超过预定的阈值的时候,进行决定传输模式的处理。

3.一种通信方法,包括:

传输模式决定步骤,基于本通信装置的输入信号所包含的环境噪声的等级,来决定考虑了本通信装置的环境噪声的用于控制传输比特率的第一传输模式,并且,基于表示所述第一传输模式的第一传输模式信息、以及从通信对方的装置接收的第二传输模式信息,来决定考虑了本通信装置和所述通信对方的环境噪声的用于控制传输比特率的第三传输模式;以及编码步骤,以对应于所述第三传输模式的传输比特率对输入信号进行编码,并将通过编码而获得的信息源代码和所述第三传输模式传输到所述通信对方的装置,其中,在所述传输模式决定步骤中,计算预定期间的输入信号的功率值的最大值和最小值,并且使用所述功率值的最大值和最小值中的至少一个来检测包含在输入信号中的环境噪声的等级。

4.如权利要求3所述的通信方法,其中,在所述传输模式决定步骤中,在检测出的环境噪声的等级与上一次检测出的环境噪声的等级之间的差超过预定的阈值的时候,进行决定传输模式的处理。

说明书 :

技术领域

本发明涉及一种在以因特网通信为代表的分组通信系统或者在移动通信系统等中传输语音/音频信号时的通信装置和信号编码/解码方法。

背景技术

在以因特网通信为代表的分组通信系统中或者在移动通信系统中传输语音/音频信号时,为了提高语音/音频信号的传输效率,压缩/编码技术常被使用。另外,关于信号的复用,由于各个通信终端的传输比特率越小,就能够使越多的通信的复用成为可能,因此,为了使许多用户同时进行通信,人们对降低各个通信终端的传输比特率以及谋求线路高效化的技术抱以期望。
在这方面,以往曾有人公开以下技术:在通信终端和基站获得同时连接的用户数、呼损率、连接等待时间、BER(Bit Error Rate,误码率)、SIR(SignalInterference Ratio,信号干扰比)等信息,通过基于获得的信息从事先决定的多个通信模式中选择适当的模式进行通信,由此来降低传输比特率(如专利文献1)。
另外,也发展出检测有无说话者的语音并根据该检测结果来控制传输比特率的技术。例如,在非专利文献1中公开了以下技术:对说话者语音的有无进行检测,对说话者发出语音的区间(有声区间)以高比特率进行编码,对说话者没有发出语音的区间(无声区间)以低比特率进行编码,并传输所编码的数据,由此降低整体的传输比特率(如非专利文献1)。
[专利文献1]特开平11-331936号公报
[非专利文献1]ANSI/TIA/EIA-96-C,Speech Service Option Standard forWideband Spread Spectrum Digital Cellular System

发明内容

然而,在上述传统的语音/音频编码/解码方法中有以下的课题:作为一种通信环境,由于只是进行作为发送端通信环境因素之一的降低传输比特率的控制,而完全没有考虑接收端的使用环境,所以无法进行有效率的传输。
本发明的目的在于,提供一种通信装置和信号编码/解码方法,其通过考虑接收端的使用环境来控制发送端的传输比特率,由此能够在维持预定的质量的同时进行有效率的语音/音频信号的编码。
本发明提供了一种通信装置,包括:传输模式决定单元,基于本通信装置的输入信号所包含的环境噪声的等级,来决定考虑了本通信装置的环境噪声的用于控制传输比特率的第一传输模式,并且,基于表示所述第一传输模式的第一传输模式信息、以及从通信对方的装置接收的第二传输模式信息,来决定考虑了本通信装置和所述通信对方的环境噪声的用于控制传输比特率的第三传输模式;以及编码单元,以对应于所述第三传输模式的传输比特率对输入信号进行编码,并将通过编码而获得的信息源代码和所述第三传输模式传输到所述通信对方的装置,其中,所述传输模式决定单元计算预定期间的输入信号的功率值的最大值和最小值,并且使用所述功率值的最大值和最小值中的至少一个来检测包含在输入信号中的环境噪声的等级。
本发明提供了一种通信方法,包括:传输模式决定步骤,基于本通信装置的输入信号所包含的环境噪声的等级,来决定考虑了本通信装置的环境噪声的用于控制传输比特率的第一传输模式,并且,基于表示所述第一传输模式的第一传输模式信息、以及从通信对方的装置接收的第二传输模式信息,来决定考虑了本通信装置和所述通信对方的环境噪声的用于控制传输比特率的第三传输模式;以及编码步骤,以对应于所述第三传输模式的传输比特率对输入信号进行编码,并将通过编码而获得的信息源代码和所述第三传输模式传输到所述通信对方的装置,其中,在所述传输模式决定步骤中,计算预定期间的输入信号的功率值的最大值和最小值,并且使用所述功率值的最大值和最小值中的至少一个来检测包含在输入信号中的环境噪声的等级。
本发明的通信装置所采用的结构包括:传输模式决定单元,决定传输模式,并将所述传输模式传输到通信对方的装置,所述传输模式根据包含在输入信号的环境噪声的等级来控制从通信对方的装置传输的信号的传输比特率;以及解码单元,基于从所述通信对方的装置传输的所述传输模式,对在所述通信对方的装置以对应于所述传输模式的传输比特率对输入信号进行编码而获得的信息源代码进行解码。
本发明的通信装置所采用的结构包括:传输模式决定单元,决定第一传输模式和第二传输模式,所述第一传输模式根据通信对方的装置的输入信号所包含的环境噪声的等级来控制从本通信装置传输的信号的传输比特率,所述第二传输模式根据本通信装置的输入信号所包含的环境噪声的等级来控制所述通信装置的输入信号的传输比特率;以及编码单元,以对应于所述第二传输模式的传输比特率对输入信号进行编码,将通过编码而获得的信息源代码和所述第二传输模式传输到所述通信对方的装置。
本发明的通信装置所采用的结构包括:解码单元,对在通信对方的装置进行编码而获得的信息源代码进行解码;传输模式决定单元,决定传输模式,该传输模式根据由所述解码单元解码的信号的环境噪声的等级来控制输入信号的传输比特率;以及编码单元,以对应于由所述传输模式决定单元决定的传输模式的传输比特率对所述输入信号进行编码,将通过编码获得的信息源代码和所述传输模式传输到所述通信对方的装置。
本发明的通信装置所采用的结构包括:解码单元,对在通信对方的装置进行编码而获得的信息源代码进行解码;传输模式决定单元,决定传输模式,该传输模式根据包含在输入信号的环境噪声的等级以及由所述解码单元解码的信号的环境噪声的等级来控制所述输入信号的传输比特率;以及编码单元,以对应于由所述传输模式决定单元决定的传输模式的传输比特率对所述输入信号进行编码,将通过编码获得的信息源代码和所述传输模式传输到所述通信对方的装置。
本发明的通信装置所采用的结构包括:传输模式决定单元,决定传输模式,并将所述传输模式传输到所述通信对方的装置,所述传输模式根据包含在输入信号的环境噪声的等级来控制从通信对方的装置传输的信号的传输比特率;以及解码单元,基于由所述传输模式决定单元决定的传输模式对信息源代码进行解码,该信息源代码是在所述通信对方的装置以对应于所述传输模式的传输比特率对输入信号进行编码而获得的。
本发明的信号编码/解码方法是:第一通信装置和第二通信装置进行无线通信,所述第二通信装置将对输入信号进行编码而获得的信息源代码传输到所述第一通信装置,所述第一通信装置对所述信息源代码进行解码的信号编码/解码方法,包括以下步骤:在第一通信装置决定传输模式,并将所述传输模式传输到所述第二通信装置,所述传输模式根据输入信号所包含的环境噪声的等级来控制从第二通信装置传输的信号的传输比特率;在所述第二通信装置以对应于在所述第一通信装置决定的传输模式的传输比特率对输入信号进行编码,将通过编码获得的信息源代码传输到所述第一通信装置;以及在所述第一通信装置对从所述第二通信装置传输的所述传输比特率的信息源代码进行解码。
本发明的信号编码/解码方法包括以下步骤:决定传输模式,并将所述传输模式传输到通信对方的装置,所述传输模式根据包含在输入信号的环境噪声的等级来控制从所述通信对方的装置传输的信号的传输比特率;以及基于从所述通信对方的装置传输的所述传输模式,对在所述通信对方的装置以对应于所述传输模式的传输比特率对输入信号进行编码而获得的信息源代码进行解码。
本发明的信号编码/解码方法包括以下步骤:对在通信对方的装置进行编码而获得的信息源代码进行解码;决定传输模式,该传输模式根据所述解码的信号的环境噪声的等级来控制输入信号的传输比特率;以及以对应于所述决定的传输模式的传输比特率对所述输入信号进行编码,将通过编码而获得的信息源代码和所述传输模式传输到所述通信对方的装置。
根据本发明,在接收端存在汽车或电车的噪音等的时候,通过利用在接收端起因于环境噪声的掩蔽效果来决定发送端的比特率,使得在发送端能够在对人们听觉没有影响的范围内以最小限度的传输比特率进行通信,由此能够大幅提高线路效率。

附图说明

图1是用于说明听觉掩蔽效果的图;
图2是表示本发明实施方式1涉及的通信终端装置的结构的方框图;
图3是表示上述实施方式涉及的通信终端装置的传输模式决定单元的内部结构的方框图;
图4是表示上述实施方式涉及的通信终端装置的信号编码单元的内部结构的方框图;
图5是表示上述实施方式涉及的通信终端装置的基本层编码单元的内部结构的方框图;
图6是表示上述实施方式涉及的通信终端装置的基本层解码单元的内部结构的方框图;
图7是表示上述实施方式涉及的通信终端装置的信号解码单元的内部结构的方框图;
图8是表示上述实施方式涉及的通信终端装置的信号编码单元的内部结构的方框图;
图9是表示上述实施方式涉及的通信终端装置的信号解码单元的内部结构的方框图;
图10是表示本发明实施方式2涉及的通信终端装置的结构的方框图;
图11是表示上述实施方式涉及的通信终端装置的传输模式决定单元的内部结构的方框图;
图12是表示本发明实施方式3涉及的通信装置的结构的方框图;
图13是表示本发明实施方式4涉及的通信终端装置的结构的方框图;
图14是表示上述实施方式涉及的通信终端装置的传输模式决定单元的内部结构的方框图;
图15是表示本发明实施方式5涉及的通信终端装置的结构的方框图;
图16是表示上述实施方式涉及的通信终端装置的传输模式决定单元的内部结构的方框图;
图17是表示本发明实施方式6涉及的通信终端装置以及中继站的结构的方框图;
图18是表示上述实施方式涉及的中继站的结构的方框图;以及
图19是表示上述实施方式涉及的中继站的结构的另一个方框图。

具体实施方式

在以MP3(Mpeg 1 Audio Layer-3,音频动态压缩第三层)和AAC(AdvancedAudio Coding,高级音频编码)为代表的音频编码方式中,利用听觉掩蔽效果,并进行量化使对每个频带进行编码时的量化误差小于或等于从作为编码对象的音频信号计算出的掩蔽等级,由此实现有效率的编码。所谓听觉掩蔽效果是指「由于在某个频率存在能量较大的成分,使得在邻近的频率的能量较小的成分被掩蔽而听不见」的现象。
图1是用于说明听觉掩蔽效果的图。图1中的成分B和成分C被成分A以及成分D掩蔽而听不见。因此,像成分B和成分C那样被掩蔽的成分即使被大量删减也无法察觉。另外,能量较大的成分(图1的三角形区域的较大成分)具有以下性质:即使在编码时进行粗糙的量化,其误差(量化误差)在听觉上也难以被察觉。
在本发明中,将在音频编码方式中常被使用的听觉掩蔽效果和编码时的量化误差的关系应用到环境噪声,并且基于该环境噪声的掩蔽等级来控制传输比特率。
下面,将参照附图详细说明本发明的实施方式。
(实施方式1)
实施方式1将说明一种在通信终端之间的双向通信中,用考虑了环境噪声的听觉掩蔽效果来决定传输模式,并控制传输比特率的语音/音频编码/解码方法。
图2是表示本发明实施方式1涉及的通信终端装置的结构的方框图。在图2,假设在两个通信终端装置100和150之间进行双向通信。
首先说明通信终端装置100的结构。通信终端装置100主要包括传输模式决定单元101、信号编码单元102和信号解码单元103。
传输模式决定单元101检测输入信号中的语音/音频信号的背景所包含的环境噪声并决定传输模式,该传输模式根据该环境噪声的等级来控制从作为对方通信终端的通信终端装置150传输的信号的传输比特率。并且,传输模式决定单元101将表示该决定的传输模式的信息(下面称为「传输模式信息」)输出到传输路径110以及信号解码单元103。另外,在本实施方式的一个例子中,假设从事先决定的两个或更多的传输比特率中选择一个传输比特率,并且传输模式信息可取3种传输比特率值即bitrate1、bitrate2、bitrate3(bitrate3<bitrate2<bitrate1)。
信号编码单元102根据通过传输路径110从通信终端装置150传输的传输模式信息,对作为语音/音频信号的输入信号进行编码,并将获得的编码信息输出到传输路径110。
信号解码单元103对通过传输路径110从通信终端装置150传输的编码信息进行解码,并将获得的信号作为输出信号来输出。信号解码单元103考虑传输延迟来对从传输路径110输出的编码信息所包含的传输模式信息和从传输模式决定单元110获得的传输模式信息进行比较,由此能够检测出传输差错。具体地说,当考虑了传输延迟的从传输模式决定单元101获得的传输模式信息不同于从传输路径110输出的编码信息所包含的传输模式信息时,信号解码单元103判断在传输路径110发生了传输差错。另外,也可采用下述方法,即,在通信终端装置150的信号编码单元152中不使编码信息与传输模式信息合并,在信号解码单元103中,使用从传输模式决定单元101获得的传输模式信息来对从传输路径110输出的编码信息进行解码。
接着说明通信终端装置150的结构。通信终端装置150主要包括传输模式决定单元151、信号编码单元152和信号解码单元153。
传输模式决定单元151以输入信号作为输入,检测语音/音频信号的背景中所包含的环境噪声,并决定传输模式,该传输模式根据该环境噪声的等级来控制从通信终端装置100传输的信号的传输比特率。然后,传输模式决定单元151将表示决定的传输模式的传输模式信息输出到传输路径110以及信号解码单元153。
信号编码单元152以通过传输路径110从通信终端装置100传输的传输模式信息作为输入,根据传输模式信息对作为语音/音频信号的输入信号进行编码,将获得的编码信息输出到传输路径110。
信号解码单元153以通过传输路径110从通信终端装置100传输的编码信息以及从传输模式决定单元151获得的传输模式信息作为输入,将编码信息解码后,将获得的信号作为输出信号进行输出。另外,信号解码单元153考虑传输延迟来对从传输路径110输出的编码信息所包含的传输模式信息和从传输模式决定单元151获得的传输模式信息进行比较,由此能够检测出传输差错。具体地说,当考虑了传输延迟的从传输模式决定单元151获得的传输模式信息不同于从传输路径110输出的编码信息所包含的传输模式信息时,信号解码单元153判断在传输路径110发生了传输差错。另外也可采用下述方法,即,在通信终端装置100的信号编码单元102中不使编码信息与传输模式信息合并,在信号解码单元153中,使用从传输模式决定单元151获得的传输模式信息对从传输路径110输出的编码信息进行解码。
接下来使用图3说明图2的传输模式决定单元101的内部结构。图2的传输模式决定单元151的结构与传输模式决定单元101的结构相同。
传输模式决定单元101主要包括掩蔽等级计算单元301和传输模式判定单元302。
掩蔽等级计算单元301从输入信号计算掩蔽等级,将计算出的掩蔽等级输出到传输模式判定单元302。
传输模式判定单元302将从掩蔽等级计算单元301输出的掩蔽等级与预定的阈值进行比较,根据比较结果来决定传输比特率。具体地说,在由通信终端装置100检测的在通信终端装置100中存在的环境噪声的等级是大的以及其掩蔽等级也是大的时候,降低传输比特率。这是基于下述原理,即,通过环境噪声的听觉掩蔽效果,从通信终端装置150传输的编码信息的量化误差有某种程度的掩蔽,因此,即使在通信终端装置150中降低传输比特率,也能够获得与不降低传输比特率情况相等听觉质量的解码信号。另一方面,在由通信终端装置100检测出的在通信终端装置100侧存在的环境噪声的等级是小的时候,从通信终端装置150传输的编码信息的量化误差不会被该环境噪声的听觉掩蔽效果掩蔽,因此传输比特率提高。
然后,传输模式判定单元302将表示所决定传输模式的传输模式信息输出到传输路径110以及信号解码单元103。
这里,说明在传输模式决定单元101采用下述方法,即,计算出在预定期间(例如,5秒~10秒左右的一定区间内)的输入信号的功率值的最大值和最小值、从最大值和最小值判定包含在输入信号中的环境噪声的等级、并根据该等级来控制传输比特率的方法的时候,有关掩蔽等级计算单元301和传输模式判定单元302的处理。然而,这里说明这种情况,即对在每次对各个帧进行处理的时候,判定环境噪声的等级,并进行输出处理的情况,但除此之外,也可以以来自通信终端用户的按键压下等作为触发来进行随后的处理,或是按某个一定时间的间隔进行随后处理。再有,也可以按一定时间的间隔检测环境噪声等级,以及在检测出的环境噪声的等级与上一次检测的等级之间的差大于或等于预定的阈值的时候进行随后的处理。
首先,说明掩蔽等级计算单元301的处理。掩蔽等级计算单元301将输入信号按N个样本的组进行划分(N为自然数),将每个区间作为一个帧并以帧单位进行处理。下面,将作为编码对象的输入信号表示为xn(n=0,...,N-1)。
另外,掩蔽等级计算单元301包括缓冲器bufi(i=0,...,Ni-1)。这里,Ni是事先决定的非负的整数,取决于一个帧的样本数N,并且在一个帧的区间为大约20毫秒的时候,确定在Ni是100~500左右量级的值时能够获得期望的性能。
然后,掩蔽等级计算单元301通过以下的式1求出作为处理对象的帧的帧功率Pframe。
Pframe=Σn=0N-1|xn|2…(式1)
接着,掩蔽等级计算单元301将通过式1求出的帧功率Pframe代入缓冲器bufNi-1。
然后,掩蔽等级计算单元301求出i区间(区间长Ni)的帧功率Pframe的最小值PframeMIN和最大值PframeMAX,并将PframeMIN、PframeMAX输出到传输模式判定单元302。
接着,掩蔽等级计算单元301由以下的式2更新缓冲器bufi。
bufi=bufi+1(i=0,…Nt-2)…(式2)
以上即为图3的掩蔽等级计算单元301的处理的说明。
接下来说明传输模式判定单元302的处理。传输模式判定单元302基于掩蔽等级计算单元301输出的PframeMIN、PframeMAX,通过以下的式3来决定传输模式信息Mode。
Mode=bitrate1(Th0PframeMAX/PframeMIN)bitrate2(Th1PframeMAX/PframeMIN<Th0)bitrate3(PframeMAX/PframeMIN<Th1)…(式3)
这里,Th0和Th1(Th0<Th1)是通过基于环境噪声的听觉掩蔽效果的预备实验而事先决定的常数。
下面对用于计算出Th0和Th1的预备实验进行简单说明。这里,将Mode为bitrate1的时候使用的编码方法称为编码方法A,并将对通过编码方法A编码的信息进行解码而获得的信号称为解码信号A。同样地,将Mode为bitrate2的时候使用的编码方法称为编码方法B,并将对通过编码方法B编码的信息进行解码而获得的信号称为解码信号B。并且,将Mode为bitrate3的时候使用的编码方法称为编码方法C,并将对通过编码方法C编码的信息进行解码而获得的信号称为解码信号C。
当将平均噪声(例如,白噪声等)渐渐地附加到解码信号A和解码信号B上使得其等级渐渐增加时,假设在附加了噪声的解码信号A在听觉上变成等于附加了噪声的解码信号B时的噪声等级为Th0。同样地,假设在附加了噪声的解码信号A在听觉上变成等于附加了噪声的解码信号C时的噪声等级为Th1。这样,利用噪声的掩蔽效果,实验性地决定了Th0和Th1。
然后,传输模式判定单元302将传输模式信息输出到传输路径110以及信号解码单元103。
以上即为图2的传输模式决定单元101的内部结构的说明。
接下来使用图4说明图2的信号编码单元102的结构。注意,图2的信号编码单元152的结构与信号编码单元102的结构相同。
这里,在本实施方式中,说明这种情况,其使用由基本层和两个增强层构成的三层的语音编码/解码方法来对语音/音频信号进行编码/解码。但是,本发明对层数并无限制,本发明也可应用于使用具有四层或更多层的分层语音编码/解码方法来对语音/音频信号进行编码/解码的情况。
分层语音编码方法是指一种方法,其中,对残差信号(低层的输入信号和低层的解码信号之间的差)进行编码并将编码信息输出的语音编码方法在高层存在多个,由此形成分层结构。并且,分层语音解码方法是指一种方法,其中,对残差信号进行解码的语音解码方法在高层存在多个,以形成分层结构。这里,假设存在于最下层的语音编码/解码方法是基本层。并且,假设存在于比基本层还要高层的语音编码/解码方法是增强层。另外,下面将基本层的编码单元和解码单元分别称为基本层编码单元和基本层解码单元,并将增强层的编码单元和解码单元分别称为增强层编码单元和增强层解码单元。
信号编码单元102主要包括传输比特率控制单元401、控制开关402~405、基本层编码单元406、基本层解码单元407、加法单元408和411、第一增强层编码单元409、第一增强层解码单元410、第二增强层编码单元412以及编码信息合并单元413。
输入信号被输入到基本层编码单元406和控制开关402。并且,传输模式信息被输入到传输比特率控制单元401。
传输比特率控制单元401根据输入的传输模式信息进行控制开关402~405的接通/断开控制。具体地说,传输比特率控制单元401在传输模式信息为bitrate1的时候,使控制开关402~405全为接通状态。另外,传输比特率控制单元401在传输模式信息为bitrate2的时候,使控制开关402及403为接通状态,并使控制开关404及405为断开状态。再有,传输比特率控制单元401在传输模式信息为bitrate3的时候,使控制开关402~405全为断开状态。这样,传输比特率控制单元401根据传输模式信息对控制开关进行接通/断开控制,并且由此决定用于输入信号编码的编码单元的组合。注意,传输模式信息从传输比特率控制单元401被输出到编码信息合并单元413。
基本层编码单元406对输入信号进行编码,将经编码获得的信息源代码(下面称为「基本层信息源代码」)输出到编码信息合并单元213及控制开关403。另外,基本层编码单元406的内部结构将后述。
基本层编码单元407在控制开关403为接通状态的时候,对从基本层编码单元406输出的基本层信息源代码进行解码,将获得的解码信号(下面称为「基本层解码信号」)输出到加法单元408。另外,基本层解码单元407在控制开关403为断开状态的时候不进行任何动作。然而,基本层解码单元407的内部结构将后述。
加法单元408在控制开关402、403为接通状态的时候,将输入信号与从基本层解码单元407输出的基本层解码信号的极性反转后的信号相加,将作为相加结果的第一残差信号输出到第一增强层编码单元409和控制开关404。另外,加法单元408在控制开关402、403为断开状态的时候不进行任何动作。
第一增强层编码单元409在控制开关402、403为接通状态的时候,对从加法单元408输出的第一残差信号进行编码,将经编码获得的信息源代码(下面称为「第一增强层信息源代码」)输出到编码信息合并单元413及控制开关405。另外,第一增强层编码单元409在控制开关402、403为断开状态的时候不进行任何动作。
第一增强层解码单元410在控制开关405为接通状态的时候,对从第一增强层编码单元409输出的第一增强层信息源代码进行解码,将经解码获得的解码信号(下面称为「第一增强层解码信号」)输出到加法单元411。另外,第一增强层解码单元410在控制开关405为断开状态的时候不进行任何动作。
加法单元411在控制开关404、405为接通状态的时候,将第一残差信号与第一增强层解码单元410的输出信号的极性反转后的信号相加,将作为相加结果的第二残差信号输出到第二增强层编码单元412。另外,加法单元411在控制开关404、405为断开状态的时候不进行任何动作。
第二增强层编码单元412在控制开关404、405为接通状态的时候,对从加法单元408输出的第二残差信号进行编码,将经编码获得的信息源代码(下面称为「第二增强层信息源代码」)输出到编码信息合并单元413。另外,第二增强层编码单元412在控制开关404、405为断开状态的时候不进行任何动作。
编码信息合并单元413对从传输比特率控制单元401输出的传输模式信息、从基本层编码单元406输出的基本层信息源代码、从第一增强层编码单元409输出的第一增强层信息源代码以及从第二增强层编码单元412输出的第二增强层信息源代码进行合并,将合并后的编码信息输出到传输路径110。
以上为使用图4的对信号编码单元102结构的说明。迄今,一直以在各个帧处理时传输模式信息总是被输入到传输比特率控制单元401的条件下说明信号编码单元102,但是,在传输模式信息不被输入到传输比特率控制单元401的时候,也可以将上一次输入的传输模式信息存储在传输比特率控制单元401内部的缓冲器等中来使用上一次输入的传输模式信息。
接着使用图5说明图4的基本层编码单元406的结构。并且,在本实施方式中,对在基本层编码单元406中进行CELP型的语音编码的情况进行说明。
预处理单元501对输入采样频率的信号进行除去DC(直流)成分的高通滤波处理、以及用以改善后续编码处理的性能的波形整形处理和预加强处理,并将经过这些处理的信号(Xin)输出到LPC(线性预测系数)分析单元502和加法单元505。
LPC分析单元502使用Xin进行线性预测分析,将分析结果(线性预测系数)输出到LPC量化单元503。LPC量化单元503对从LPC分析单元502输出的线性预测系数(LPC)进行量化处理,在将量化LPC输出到合成滤波器504的同时,将表示量化LPC的代码(L)输出到复用单元514。
合成滤波器504通过利用基于量化LPC的滤波系数,对从后述的加法单元511输出的驱动声源进行滤波合成,生成合成信号,并将合成信号输出到加法单元505。
加法单元505通过反转合成信号的极性并与Xin相加来计算误差信号,将误差信号输出到听觉加权单元512。
自适应声源代码本506将较早由加法单元511输出的驱动声源存储在缓冲器,从参数决定单元513输出的信号所确定的较早的驱动声源中取出与1帧对应的样本作为自适应声源向量并输出到乘法单元509。
量化增益生成单元507将由参数决定单元513输出的信号所确定的量化自适应声源增益和量化固定声源增益分别输出到乘法单元509和乘法单元510。
固定声源代码本508将具有由参数决定单元513输出的信号所确定的形状的脉冲声源向量与扩展向量相乘,并将由此所获得的固定声源向量输出到乘法单元510。
乘法单元509将从量化增益生成单元507输出的量化自适应声源增益与从自适应声源代码本506输出的自适应声源向量相乘,并将相乘结果输出到加法单元511。乘法单元510将从量化增益生成单元507输出的量化固定声源增益与从固定声源代码本508输出的固定声源向量相乘,并将相乘结果输出到加法单元511。
加法单元511分别从乘法单元509和乘法单元510输入乘以增益之后的自适应声源向量和固定声源向量,并对它们进行向量相加,将作为相加结果的驱动声源输出到合成滤波器504以及自适应声源代码本506。另外,将输入到自适应声源代码本506的驱动声源存储在缓冲器。
听觉加权单元512对从加法单元505输出的误差信号进行听觉加权,并将结果作为编码失真输出到参数决定单元513。
参数决定单元513分别从自适应声源代码本506、固定声源代码本508、以及量化增益生成单元507选择使听觉加权单元514输出的编码失真最小的自适应声源向量、固定声源向量、以及量化增益,将表示选择结果的自适应声源向量代码(A)、固定声源向量代码(F)、以及声源增益代码(G)输出到复用单元514。
复用单元514从LPC量化单元503输入表示量化LPC的代码(L),从参数决定单元513输入表示自适应声源向量的代码(A)、表示固定声源向量的代码(F)以及表示量化增益的代码(G),并对这些信息进行复用,将复用结果作为基本层信息源代码输出。
以上为图4的基本层编码单元406的内部结构的说明。
然而,图4的第一增强层编码单元409和第二增强层编码单元412的内部结构与基本层编码单元406的相同,仅有输入的信号的种类与输出的信息源代码的种类不同,故省略其说明。
接着使用图6说明图4的基本层信号解码单元407的内部结构。这里,对在基本层解码单元407中进行CELP型的语音解码的情况进行说明。
在图6中,输入到基本层解码单元407的基本层信息源代码由复用分离单元601分离为一个个的代码(L、A、G、F)。分离出的LPC代码(L)被输出到LPC解码单元602、分离出的自适应声源向量代码(A)被输出到自适应声源代码本605、分离出的声源增益代码(G)被输出到量化增益生成单元606、分离出的固定声源向量代码(F)被输出到固定声源代码本607。
LPC解码单元602从复用分离单元601输出的代码(L)中解码量化LPC,将结果输出到合成滤波器603。
自适应声源代码本605从复用分离单元601输出的代码(A)所指定的较早的驱动声源中取出与1帧对应的样本作为自适应声源向量并将其输出到乘法单元608。
量化增益生成单元606对复用分离单元601输出的声源增益代码(G)所指定的量化自适应声源增益和量化固定声源增益进行解码并将解码结果输出到乘法单元608和乘法单元609。
固定声源代码本607生成复用分离单元601输出的代码(F)所指定的固定声源向量并将其输出到乘法单元609。
乘法单元608将自适应声源向量乘以量化自适应声源增益,并将相乘结果输出到加法单元610。乘法单元609将固定声源向量乘以量化固定声源增益,并将相乘结果输出到加法单元610。
加法单元610对乘法单元608、609输出的乘以增益之后的自适应声源向量与固定声源向量相加,生成驱动声源,并将此输出到合成滤波器603和自适应声源代码本605。
合成滤波器603使用由LPC解码单元602解码的滤波系数进行加法单元610输出的驱动声源的滤波合成,并将合成的信号输出到后处理单元604。
后处理单元604对合成滤波器603输出的信号进行诸如共振峰(formant)增强和音调(pitch)增强之类的改善语音主观质量的处理以及改善静态噪声的主观质量的处理等,并且将处理的信号作为基本层解码信息输出。
以上为图4的基本层解码单元407的内部结构的说明。
然而,图4的第一增强层解码单元410的内部结构与基本层解码单元407的内部结构相同,仅有输入的信息源代码的种类与输出的信号的种类不同,故省略其说明。
接着使用图7说明图2的信号解码单元103的结构。然而,图2的信号解码单元153的结构与信号解码单元103的结构相同。
信号解码单元103主要包括传输比特率控制单元701、基本层解码单元702、第一增强层解码单元703、第二增强层解码单元704、控制开关705、706、以及加法单元707、708。
传输比特率控制单元701根据接收的编码信息所包含的传输模式信息进行控制开关705、706的接通/断开控制。具体地说,传输比特率控制单元701在传输模式信息为bitrate1的时候,使控制开关705、706双方皆为接通状态。另外,传输比特率控制单元701在传输模式信息为bitrate2的时候,使控制开关705为接通状态,并使控制开关706为断开状态。另外,传输比特率控制单元701在传输模式信息为bitrate3的时候,使控制开关705、706双方皆为断开状态。再有,传输比特率控制单元701将所接收的编码信息分离成基本层信息源代码、第一增强层信息源代码以及第二增强层信息源代码,并分别将基本层信息源代码输出到基本层解码单元702、将第一增强层信息源代码输出到控制开关705、将第二增强层信息源代码输出到控制开关706。
基本层解码单元702对从传输比特率控制单元701输出的基本层信息源代码进行解码,生成基本层解码信号并输出到加法单元708。
第一增强层解码单元703在控制开关705为接通状态的时候,对从传输比特率控制单元701输出的第一增强层信息源代码进行解码,生成第一增强层解码信号并输出到加法单元707。另外,第一增强层解码单元703在控制开关705为断开状态的时候不进行任何动作。
第二增强层解码单元704在控制开关706为接通状态的时候,对从传输比特率控制单元701输出的第二增强层信息源代码进行解码,生成第二增强层解码信号并输出到加法单元707。另外,第二增强层解码单元704在控制开关706为断开状态的时候不进行任何动作。
加法单元707在控制开关705、706为接通状态的时候,将第二增强层解码单元704输出的第二增强层解码信号与第一增强层解码单元703输出的第一增强层解码信号相加,将相加后的信号输出到加法单元708。并且,加法单元707在控制开关706为断开状态且控制开关705为接通状态的时候,将第一增强层解码单元703输出的第一增强层解码信号输出到加法单元708。另外,加法单元707在控制开关705、706为断开状态的时候不进行任何动作。
加法单元708对从基本层解码单元702输出的基本层解码信号与加法单元707的输出信号进行相加,将相加后的信号作为输出信号进行输出。再有,加法单元708在控制开关705、706为断开状态的时候,将基本层解码单元702输出的基本层解码信号作为输出信号进行输出。
以上为图2的信号解码单元103的结构说明。
注意,图7的基本层解码单元702、第一增强层解码单元703和第二增强层解码单元704的内部结构与图4的基本层解码单元407的内部结构相同,仅有输入的信号的种类与输出的信息源代码的种类不同,故省略其说明。
这里,作为信号编码单元102以及信号解码单元103的编码/解码方法,也可以应用通过在比特率不同的多个编码/解码方法之间进行切换来进行编码/解码的结构。下面,使用图8、图9对在此情况下的信号编码单元102和信号解码单元103的结构进行说明。
并且,在本实施方式中对利用三种语音编码/解码方法来对语音/音频信号进行编码/解码的情况进行说明。但是,本发明对于编码/解码方法的数目并无限制,本发明也可应用于利用四种或更多的不同的比特率的语音编码/解码方法来对语音/音频信号进行编码/解码的情况。
图8是表示信号编码单元102的内部结构的方框图。信号编码单元102主要包括传输比特率控制单元801、控制开关802、803、信号编码单元804~806、以及编码信息合并单元807。
输入信号被输入到控制开关802。并且,传输模式信息被输入到传输比特率控制单元801。
传输比特率控制单元801根据输入的传输模式信息进行控制开关802、803的切换控制。具体地说,传输比特率控制单元801在传输模式信息为bitrate1的时候,使控制开关802、803双方都与信号编码单元804连接。并且,传输比特率控制单元801在传输模式信息为bitrate2的时候,使控制开关802、803双方都与信号编码单元805连接。另外,传输比特率控制单元801在传输模式信息为bitrate3的时候,使控制开关802、803双方都与信号编码单元806连接。如上述,通过由传输比特率控制单元801根据传输模式信息对控制开关进行切换控制,来决定用于输入信号的编码的编码单元。并且,传输模式信息从传输比特率控制单元801被输出到编码信息合并单元807。
信号编码单元804以对应于bitrate1的编码方法对输入信号进行编码,将通过编码获得的信息源代码经由控制开关803输出到编码信息合并单元807。
信号编码单元805以对应于bitrate2的编码方法对输入信号进行编码,将通过编码获得的信息源代码经由控制开关803输出到编码信息合并单元807。
信号编码单元806以对应于bitrate3的编码方法对输入信号进行编码,将通过编码获得的信息源代码经由控制开关803输出到编码信息合并单元807。
编码信息合并单元807对从传输比特率控制单元801输出的传输模式信息以及从控制开关803输出的信息源代码进行合并,将合并后的编码信息输出到传输路径110。
以上为使用图8的对信号编码单元102结构的说明。然而,上述情况一直以每次处理帧时传输模式信息总是被输入到传输比特率控制单元801为条件进行说明,但是,在传输模式信息不被输入到传输比特率控制单元801的时候,也可以通过例如将上一次输入的传输模式信息存储在传输比特率控制单元801内部的缓冲器等中来使用上一次输入的传输模式信息。
然而,图8的信号编码单元804~806的内部结构与图4的基本层编码单元406相同,仅有输入的信号的种类与输出的信息源代码的种类不同,故省略其说明。
图9是表示信号解码单元103的内部结构的方框图。信号解码单元103主要包括传输比特率控制单元901、控制开关902、903、以及信号解码单元904~906。
编码信息被输入到传输比特率控制单元901。
传输比特率控制单元901根据接收的编码信息所包含的传输模式信息进行控制开关902、903的切换控制。具体地说,传输比特率控制单元901在传输模式信息为bitrate1的时候,使控制开关902、903双方都与信号解码单元904连接。并且,传输比特率控制单元901在传输模式信息为bitrate2的时候,使控制开关902、903双方都与信号解码单元905连接。并且,传输比特率控制单元901在传输模式信息为bitrate3的时候,使控制开关902、903双方都与信号解码单元906连接。再有,传输比特率控制单元901还将接收到的信息源代码输出到控制开关902。
信号解码单元904以对应于bitrate1的解码方法对经由控制开关902输入的信息源代码进行解码,将通过解码获得的输出信号经由控制开关903输出。
信号解码单元905以对应于bitrate2的解码方法对经由控制开关902输入的信息源代码进行解码,将通过解码获得的输出信号经由控制开关903输出。
信号解码单元906以对应于bitrate3的解码方法对经由控制开关902输入的信息源代码进行解码,将通过解码获得的输出信号经由控制开关903输出。
以上为使用图9的对信号解码单元103结构的说明。
然而,图9的信号解码单元904~906的内部结构与图4的基本层解码单元407的内部结构相同,仅有输入的信息源代码的种类与输出的信号的种类不同,故省略其说明。
如上述,借助考虑接收端的环境噪声引起的掩蔽效果,通过根据环境噪声的掩蔽等级来控制发送端的传输比特率,能够进行有效率的语音/音频信号的编码。
(实施方式2)
在此,上述的CELP等的语音编码方法因为使用语音声源/声道模型,所以虽然能够对人的语音有效率地进行编码,但对于例如存在于背景的环境噪声等人的语音之外的成分就无法有效率地进行编码。因此,在发送端存在环境噪声的时候,为了以与不存在环境噪声的情况相同质量的方式对包含该环境噪声的发送端的语音/音频信号进行编码,与发送端不存在环境噪声的情况相比,需要更多的比特。
实施方式2说明这种情况,在这里,控制传输比特率不仅要考虑接收端的环境噪声,而且还考虑发送端的环境噪声。
图10是表示本发明实施方式2涉及的通信终端装置的结构的方框图。然而,对于图10所示的通信终端装置1000、1050中与图2所示的通信终端装置100、150中共同的结构部件指定了与图2相同的标号,并且省略其说明。
图10的通信终端装置1000与图2的通信终端装置100相比,传输模式决定单元1001的作用与传输模式决定单元101的作用不同。并且,图10的通信终端装置1050与图2的通信终端装置150相比,传输模式决定单元1051的作用与传输模式决定单元151的作用不同。
传输模式决定单元1001检测输入信号中的语音/音频信号的背景所包含的环境噪声,决定用于根据环境噪声的等级来控制从作为对方通信终端的通信终端装置1050传输的信号的传输比特率的传输模式,以及将表示决定的传输模式的传输模式信息输出到传输路径110。并且,传输模式决定单元1001决定传输模式,以及将表示决定的传输模式的传输模式信息输出到信号编码单元102和信号解码单元103,该传输模式根据输入信号中的环境噪声的等级与从通信终端装置1050通过传输路径110传输的传输模式信息对进行编码/解码时的传输比特率进行控制。
接下来使用图11说明图10的传输模式决定单元1001的内部结构。传输模式决定单元1001主要包括掩蔽等级计算单元1101和传输模式判定单元1102。然而,这里,对在每次对各个帧进行处理的时候,判定环境噪声的等级,并进行输出处理的情况进行说明。但除此之外,也可以以来自通信终端用户的按键压下等作为触发来进行随后的处理,或是按某个一定时间的间隔进行随后的处理。
掩蔽等级计算单元1101与图3的掩蔽等级计算单元301同样地从输入信号计算掩蔽等级,并将计算出的掩蔽等级输出到传输模式判定单元1102。
传输模式判定单元1102基于在从掩蔽等级计算单元1101输出的掩蔽等级与预定的阈值之间的比较结果,决定考虑了发送端的环境噪声的用于控制传输比特率的传输模式,并且将表示决定的传输模式的信息(下面称为「第一传输模式信息」)输出到传输路径110。并且,传输模式判定单元1102基于第一传输模式信息以及从通信终端装置1050通过传输路径110传输的传输模式信息(下面称为「第二传输模式信息」)来决定考虑了发送端和接收端的环境噪声的用于控制传输比特率的传输模式,并且将表示决定的传输模式的信息(下面称为「第三传输模式信息」)输出到信号编码单元102和信号解码单元103。
这里,说明在传输模式决定单元1001采用下述方法,即,计算出在预定期间的输入信号的功率值的最大值和最小值,从最大值和最小值判定包含在输入信号的环境噪声的等级,并根据该等级来控制传输比特率的方法的时候,有关传输模式判定单元1102的处理。
首先,传输模式判定单元1102基于掩蔽等级计算单元1101输出的PframeMIN、PframeMAX,通过以下的式4来决定第一传输模式信息Mode’1。
Mode1=bitratehigh(Th0PframeMAX/PframeMIN)bitratelow(PframeMAX/PframeMIN<Th0)…(式4)
这里,Th’0是通过与在实施方式1说明的预备实验同样的实验,基于环境噪声的听觉掩蔽效果而事先决定的常数。
然后,传输模式判定单元1102将第一传输模式信息Mode’1输出到传输路径110。
并且,传输模式判定单元1102使用从通信终端装置1050通过传输路径110传输的第二传输模式信息Mode’2,通过以下的式5来求出第三传输模式信息Mode’3,并将其输出到信号编码单元102和信号解码单元103。
Mode3=bitrate1(Mode1=bitratelow)and(Mode2=bitratehigh)bitrate2((Mode1=bitratehigh)and(Mode2=bitratehigh))or((Mode1=bitratelow)and(Mode2=bitratelow))bitrate3(Mode1=bitratehigh)and(Mode2=bitratelow)…(式5)
以上即为图10的传输模式决定单元1001的内部结构的说明。
并且,图10的传输模式决定单元1051的结构与传输模式决定单元1001的结构相同。
这样,在接收端存在汽车或电车等的声音的时候,通过在接收端识别出前述的环境噪声并利用环境噪声的掩蔽效果,由此,发送端就能够在对人们听觉没有影响的范围内使用最小限度的传输比特率对语音/音频信号进行通信,从而能够大幅提高线路效率。再有,除了接收端的环境噪声之外,还检测发送端的环境噪声的信息,并将此应用在语音/音频信号的编码,由此能够实现更有效率的通信。
(实施方式3)
在实施方式3中,说明将本发明的传输模式信息决定方法应用于以利用移动电话等便携式终端的音乐播发服务为代表的单向通信中的例子。
图12是表示实施方式3涉及的通信装置的结构的方框图。在图12中,通信装置1200是接收音乐播发服务的用户端的通信终端装置,通信装置1250是音乐播发服务器端的基站装置。
通信装置1200主要包括传输模式决定单元1201和信号解码单元1202。通信装置1250包括信号编码单元1251。
传输模式决定单元1201检测作为语音/音频信号的输入信号的背景所包含的环境噪声,决定根据该环境噪声的等级来控制通信装置1250的传输比特率的传输模式,并将此作为传输模式信息输出到传输路径110和信号解码单元1202。
信号编码单元1251基于通过传输路径110传输的传输模式信息对输入信号进行编码,然后,与传输模式信息进行合并,并将其结果作为编码信息输出到传输路径110。
信号解码单元1202对通过传输路径110传输的编码信息进行解码,将获得的解码信号作为输出信号来输出。另外,信号解码单元1202考虑传输延迟来对从传输路径110输出的编码信息所包含的传输模式信息和从传输模式决定单元1201获得的传输模式信息进行比较,由此能够检测出传输差错。具体地说,当考虑了传输延迟的从传输模式决定单元1201获得的传输模式信息不同于从传输路径110输出的编码信息所包含的传输模式信息时,信号解码单元1202判断在传输路径110发生了传输差错。另外也可采用下述技术,即,在通信装置1250的信号编码单元1251中不使编码信息与传输模式信息合并,而在信号解码单元1202中,使用从传输模式决定单元1201获得的传输模式信息对从传输路径110输出的编码信息进行解码。
然而,图12的传输模式决定单元1201、信号编码单元1202、信号解码单元1251的内部结构分别与图2所示的传输模式决定单元101、信号编码单元102、信号解码单元103相同,故省略有关这些结构的详细说明。
如上述,根据本实施方式,即使在音乐播发服务等单向通信系统中,通过检测通信装置的环境噪声并利用环境噪声的听觉掩蔽效果来决定传输模式信息,基站装置能够在对人们听觉没有影响的范围内使用最小限度的传输比特率对语音/音频信号进行通信,从而能够大幅提高线路效率。
(实施方式4)
实施方式4对下述情况进行说明,即,对从对方发送来的编码信息进行解码并且检测包含在获得的解码信号中的环境噪声来决定传输模式的情况。
图13是表示本发明实施方式4涉及的通信终端装置的结构的方框图。然而,对于图13所示的通信终端装置1300、1350中与图2所示的通信终端装置100、150共同的结构成分附上与图2相同的标号并省略其说明。
图13的通信终端装置1300与图2的通信终端装置100相比,传输模式决定单元1301的作用与传输模式决定单元101的作用不同。并且,图13的通信终端装置1350与图2的通信终端装置150相比,传输模式决定单元1351的作用与传输模式决定单元151的作用不同。
传输模式决定单元1301检测包含在解码信号中的环境噪声,决定根据该环境噪声的等级来控制进行编码时的传输比特率的传输模式,并将表示决定的传输模式的传输模式信息输出到信号编码单元102。
接下来使用图14说明图13的传输模式决定单元1301的内部结构。传输模式决定单元1301主要包括掩蔽等级计算单元1401和传输模式判定单元1402。然而,图13的传输模式决定单元1301与图2的传输模式决定单元101同样地,除了在每次对各个帧进行处理的时候,判定环境噪声的等级并进行输出处理的方法之外,也可以以来自通信终端用户的按键压下等作为触发来进行随后的处理,或是按某个一定时间的间隔进行随后的处理。
掩蔽等级计算单元1401与图3的掩蔽等级计算单元301同样地,从信号解码单元103输出的解码信号计算掩蔽等级,并将计算出的掩蔽等级输出到传输模式判定单元1402。
传输模式判定单元1402与图3的传输模式判定单元302同样地,将从掩蔽等级计算单元1401输出的掩蔽等级与预定的阈值进行比较,根据比较结果决定用于控制传输比特率的传输模式,将表示决定的传输模式的传输模式信息输出到信号编码单元102。
然而,图13中传输模式决定单元1351的内部结构与传输模式决定单元1301的结构相同,故省略其详细说明。
如上述,根据本实施方式,通过对从对方发送来的编码信息进行解码,检测包含在获得的解码信号中的环境噪声,由此能够利用该环境噪声的掩蔽效果,从而进行极有效率的信号编码。
(实施方式5)
在实施方式5中,说明这种情况,即不仅使用包含在解码信号中的接收端的环境噪声而且还使用发送端的环境噪声来决定传输模式的情况。
图15是表示本发明实施方式5涉及的通信终端装置的结构的方框图。然而,对于图15所示的通信终端装置1500、1550中的与图2所示的通信终端装置100、150共同的结构成分附上与图2相同的标号并省略其说明。
图15的通信终端装置1500与图2的通信终端装置100相比,传输模式决定单元1501的作用与传输模式决定单元101的作用不同。并且,图15的通信终端装置1550与图2的通信终端装置150相比,传输模式决定单元1551的作用与传输模式决定单元151的作用不同。
传输模式决定单元1501检测输入信号中的语音/音频信号的背景所包含的环境噪声,并进一步检测包含在解码信号的环境噪声,决定根据该环境噪声的等级控制进行编码时的传输比特率的传输模式,然后将表示决定的传输模式的传输模式信息输出到信号编码单元102。
接下来使用图16说明图15的传输模式决定单元1501的内部结构。传输模式决定单元1501主要包括掩蔽等级计算单元1601和传输模式判定单元1602。然而,图15的传输模式决定单元1501与图2的传输模式决定单元101同样地,除了在每次对各个帧进行处理的时候,判定环境噪声的等级并进行输出处理的方法之外,也可以以来自通信终端用户的按键压下等作为触发来进行随后的处理,或是按某个一定时间的间隔进行随后的处理。
掩蔽等级计算单元1601从输入信号以及从信号解码单元103输出的解码信号计算掩蔽等级,将计算出的掩蔽等级输出到传输模式判定单元1602。
传输模式判定单元1602与图3的传输模式判定单元302同样地,将从掩蔽等级计算单元1601输出的掩蔽等级与预定的阈值进行比较,根据比较结果决定用于控制传输比特率的传输模式,将表示决定的传输模式的传输模式信息输出到信号编码单元102。
这里,说明在传输模式决定单元1501采用下述方法,即,计算出在预定期间的输入信号的功率值的最大值和最小值,从最大值和最小值判定包含在输入信号的环境噪声的等级,并根据该等级来控制传输比特率的方法的时候,有关掩蔽等级计算单元1601和传输模式判定单元1602的处理。
掩蔽等级计算单元1601将输入信号划分为N个样本的组(N为自然数),将每个区间作为一个帧并以帧单位进行处理。下面,将作为编码对象的输入信号表示为u’n(n=0,…,N-1)。
另外,掩蔽等级计算单元1601包括缓冲器bufu’i(i=0,...,Ni-1)。
然后,掩蔽等级计算单元1601通过以下的式6求出作为处理对象的帧的帧功率Pframeu’。
Pframeu=Σn=0N-1|un|2…(式6)
接着,掩蔽等级计算单元1601将通过式6求出的帧功率Pframeu’代入缓冲器bufu’Ni-1。
然后,掩蔽等级计算单元1601求出i区间(区间长Ni)的帧功率Pframeu’的最小值Pframeu’MIN和最大值Pframeu’MAX,并将Pframeu’MIN、Pframeu’MAX输出到传输模式判定单元1602。
接着,掩蔽等级计算单元1601由以下的式7更新缓冲器bufu’i。
bufu′i=bufu′i+1(i=0,…Nt-2)…(式7)
另外,掩蔽等级计算单元1601将从信号解码单元103输出的解码信号划分为N个样本的组(N为自然数),以N个样本作为一个帧并以帧单位进行处理。下面,将作为编码对象的信号表示为u”n(n=0,…,N-1)。
另外,掩蔽等级计算单元1601包括缓冲器bufu”i(i=0,...,Ni-1)。
然后,掩蔽等级计算单元1601通过以下的式8求出作为处理对象的帧的帧功率Pframeu”。
Pframeu=Σn=0N-1|un|2…(式8)
接着,掩蔽等级计算单元1601将通过式8求出的帧功率Pframeu”代入缓冲器bufu”Ni-1。
然后,掩蔽等级计算单元1601求出i区间(区间长Ni)的帧功率Pframeu”的最小值Pframeu”MIN和最大值Pframeu”MAX,并将Pframeu”MIN、Pframeu”MAX输出到传输模式判定单元1602。
接着,掩蔽等级计算单元1601由以下的式9更新缓冲器bufu”i。
bufu″i=bufu″i+1(i=0,…Nt-2)…(式9)
以上即为图16的掩蔽等级计算单元1601的处理的说明。
接下来说明传输模式判定单元1602的处理。传输模式判定单元1602基于掩蔽等级计算单元1601输出的Pframeu’MIN、Pframeu’MAX,通过以下的式10来决定传输模式信息Modeu’。
Modeu1=bitratehigh(Thu0PframeuMAX/PframeuMIN)bitratelow(PframeuMAX/PframeuMIN<Thu0)…(式10)
这里,Thu’0是通过与上述的预备实验同样的实验,基于环境噪声的听觉掩蔽效果而事先决定的常数。
接着,传输模式判定单元1602基于掩蔽等级计算单元1601输出的Pframeu”MIN、Pframeu”MAX,通过以下的式11来决定传输模式信息Modeu’2。
Modeu2=bitratehigh(Thu0PframeuMAX/PframeuMIN)bitratelow(PframeuMAX/PframeuMIN<Thu0)…(式11)
这里,Thu”0是通过与上述的预备实验同样的实验,基于环境噪声的听觉掩蔽效果而事先决定的常数。
接着,传输模式判定单元1602使用传输模式信息Modeu’1和传输模式信息Modeu’2,通过以下的式12求出传输模式信息Modeu’3并将其输出到信号编码单元102。
Mode3=bitrate1(Mode1=bitratelow)and(Mode2=bitratehigh)bitrate2((Mode1=bitratehigh)and(Mode2=bitratehigh))or((Mode1=bitratelow)and(Mode2=bitratelow))bitrate3(Mode1=bitratehigh)and(Mode2=bitratelow)··(式12)
以上即为图15的传输模式决定单元1501的内部结构的说明。
然而,图15的传输模式决定单元1551的内部结构与传输模式决定单元1501的相同,故省略其说明。
如上述,根据本实施方式,在接收端存在汽车或电车的声音等的时候,通过在发送端识别从接收端传输的语音/音频信号所包含的环境噪声,并利用环境噪声的掩蔽效果,由此,发送端就能够在对人们听觉没有影响的范围内使用最小限度的传输比特率进行通信,从而能够大幅提高线路效率。再有,通过不仅检测接收端的环境噪声而且还检测发送端的有关环境噪声的信息,并且将此应用在语音/音频信号的编码中,由此能够实现更有效率的通信。
(实施方式6)
实施方式6对下述情况进行说明,即,在通过可扩展性编码方式进行通信的环境下,在传输路径110的中继站对从各个通信终端装置传输的传输比特率进行调整的情况。
图17是表示本发明实施方式6涉及的通信终端装置和中继站的结构的方框图。并且,在图17的通信终端装置1700、1750的通信中途有中继站1730存在。然而,对于图17所示的通信终端装置1700、1750中与图2所示的通信终端装置100、150共同的结构成分附上与图2相同的标号并省略其说明。
图17的通信终端装置1700与图2的通信终端装置100相比,传输模式决定单元1701和信号编码单元1702的作用分别与传输模式决定单元101和信号编码单元102的作用不同。并且,图17的通信终端装置1750与图2的通信终端装置150相比,传输模式决定单元1751和信号编码单元1752的作用分别与传输模式决定单元151和信号编码单元152的作用不同。
传输模式决定单元1701检测输入信号中的语音/音频信号的背景所包含的环境噪声,决定根据该环境噪声的等级来控制进行编码时的传输比特率的传输模式,并将表示决定的传输模式的传输模式信息输出到传输路径110和信号解码单元103。然而,图17的传输模式决定单元1701与图2的传输模式决定单元101同样地,除了在每次对各个帧进行处理的时候,判定环境噪声的等级并进行输出处理的方法之外,也可以以来自通信终端用户的按键压下等作为触发来进行随后的处理,或是按某个一定时间的间隔进行随后的处理。
信号编码单元1702将输入信号和初始传输模式信息输入,根据初始传输模式信息对输入信号进行编码,将获得的编码信息输出到传输路径110。然而,信号编码单元1702的内部结构与图4所示的信号编码单元102相比,是将传输模式信息置换为初始传输模式信息的结构。
传输模式决定单元1751检测输入信号中的语音/音频信号的背景所包含的环境噪声,决定根据该环境噪声的等级来控制进行编码时的传输比特率的传输模式,并将表示决定的传输模式的传输模式信息输出到传输路径110和信号解码单元153。
信号编码单元1752将输入信号和初始传输模式信息输入,根据初始传输模式信息对输入信号进行编码,将获得的信息源代码和初始传输模式信息合并,并将其结果作为编码信息输出到传输路径110。
假设通信终端装置1700、1750的初始传输模式信息ModeA由以下的式13表示。
ModeA=bitrate1bitrate2bitrate3…(式13)
然而,图17的传输模式决定单元1751的内部结构与传输模式决定单元1701的相同,故省略其说明。
接下来使用图18说明中继站1730的内部结构。另外,在图18中,虽然是对根据来自通信终端装置1750的传输模式信息来控制来自通信终端装置1700的编码信息的传输比特率的情况进行说明,但根据来自通信终端装置1700的传输模式信息来控制来自通信终端装置1750的编码信息的传输比特率的情况也是同样的。
中继站1730主要包括接口单元1801、编码信息分析单元1802、传输模式变换单元1803、编码信息合并单元1804、以及接口单元1805。
接口单元1801经由传输路径110将通信终端装置1700传输的信息输入,并经由传输路径110将信息传输到通信终端装置1750。
编码信息分析单元1802对从通信终端装置1700传输的信息进行分析,将其分离为在信号编码单元1702内的各层编码的信息源代码和初始传输模式信息ModeA,并将这些信息输出到传输模式变换单元1803。
传输模式变换单元1803根据从通信终端装置1750传输的传输模式信息ModeB,对信息源代码和初始传输模式信息ModeA进行传输比特率变换处理。具体地说,传输模式变换单元1803在初始传输模式信息ModeA为bitrate1、传输模式信息ModeB为bitrate2的时候,将初始传输模式信息ModeA变更为bitrate2,并将基本层信息源代码、第一增强层信息源代码、以及初始传输模式信息ModeA输出到编码信息合并单元1804。并且,传输模式变换单元1803在初始传输模式信息ModeA为bitrate1、传输模式信息ModeB为bitrate3的时候,将初始传输模式信息ModeA变更为bitrate3,并将基本层信息源代码以及初始传输模式信息ModeA输出到编码信息合并单元1804。另外,传输模式变换单元1803在初始传输模式信息ModeA为bitrate2、传输模式信息ModeB为bitrate3的时候,将初始传输模式信息ModeA变更为bitrate3,并将基本层信息源代码以及初始传输模式信息ModeA输出到编码信息合并单元1804。再有,传输模式信息变换单元1803在初始传输模式信息ModeA、传输模式信息ModeB为上述以外的组合时,原封不动地将信息源代码和初始传输模式信息ModeA输出到编码信息合并单元1804。
编码信息合并单元1804输入从传输模式变换单元1803获得的信息源代码以及初始传输模式信息ModeA,将这些合并后作为变换后编码信息输出到接口单元1805。
接口单元1805经由传输路径110将通信终端装置1750传输的信息输入,并经由传输路径110将信息传输到通信终端装置1700。
以上为有关图17的中继站1730的结构的说明。
如上述,根据本实施方式,在接收端存在汽车或电车的声音等的环境噪声的时候,也能够在中继站而不是发送端,来进行传输比特率的控制。由此,使更具弹性的传输比特率控制成为可能,从而能够谋求线路效率更进一步的提高。
另外,在本实施方式中,中继站不仅能够使用接收端的环境噪声而且还能够使用发送端的环境噪声来决定用于控制传输比特率的传输模式。
图19是表示上述情况的中继站1730的结构的方框图,传输模式变换单元1901的作用与图18的传输模式变换单元1803的作用不同。传输模式变换单元1901根据来自通信终端装置1700的传输模式信息ModeA’和传输模式信息ModeB’,对信息源代码和初始传输模式信息ModeA进行传输比特率变换处理。具体地说,传输模式变换单元1901在初始传输模式信息ModeA为bitrate1、传输模式信息ModeB为bitratehigh、且传输模式信息ModeA’为bitratehigh的时候,将初始传输模式信息ModeA变更为bitrate2,并将基本层信息源代码、第一增强层信息源代码、以及初始传输模式信息ModeA输出到编码信息合并单元1804。并且,传输模式变换单元1901在初始传输模式信息ModeA为bitrate1、传输模式信息ModeB为bitratelow、且传输模式信息ModeA’为bitratelow的时候,将初始传输模式信息ModeA变更为bitrate2,并将基本层信息源代码、第一增强层信息源代码、以及初始传输模式信息ModeA输出到编码信息合并单元1804。另外,传输模式变换单元1901在初始传输模式信息ModeA为bitrate1、传输模式信息ModeB为bitratelow、且传输模式信息ModeA’为bitratehigh的时候,将初始传输模式信息ModeA变更为bitrate3,并将基本层信息源代码以及初始传输模式信息ModeA输出到编码信息合并单元1804。而且,传输模式变换单元1901在初始传输模式信息ModeA为bitrate2、传输模式信息ModeB为bitratelow、且传输模式信息ModeA’为bitratehigh的时候,将初始传输模式信息ModeA变更为bitrate3,并将基本层信息源代码以及传输模式信息ModeA输出到编码信息合并单元1804。再有,传输模式变换单元1901在初始传输模式信息ModeA、传输模式信息ModeB以及传输模式信息ModeA’为上述以外的组合时,原封不动地将信息源代码和传输模式信息ModeA输出到编码信息合并单元1804。
如上述,根据本实施方式,在接收端及发送端存在汽车或电车的声音等的环境噪声的时候,也能够在中继站而不是发送端,来对传输比特率进行控制。由此,使更具弹性的传输比特率的控制成为可能,从而能够谋求线路效率更进一步的提高。
在根据可扩展性编码方式进行在单向通信方式下的语音/音频信号的通信的环境中,当在传输路径110中存在某个中继站的时候,本实施方式与上述实施方式3的组合也将使得该中继站能够利用从通信终端传输的传输模式信息,减少从基站传输的编码信息的信息量,以及将其再次向传输路径110送出。
本说明书基于2004年2月24日提交的日本专利申请第2004-048569号。其内容都包含于此以资参考。
工业实用性
本发明适合用于分组通信系统或移动通信系统的通信终端装置。