接收装置及方法转让专利

申请号 : CN200480030019.5

文献号 : CN1868150B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 田代厚史

申请人 : 冲电气工业株式会社

摘要 :

本发明提供一种接收装置,接收在发送侧对基于处于时间先后关系的多个取样值的相对差异的值进行量化,并根据量化结果来分割以时间序列所生成的生成数据,并将分割结果收纳在规定的传送单位信号中进行发送的数据,包括:调整是否需要判定单元,根据上述传送单位信号中所收纳的生成数据的解码结果表示的信号波形的振幅值来判定是否需要振幅调整;以及振幅调整单元,在从该调整是否需要判定单元给出不需要振幅调整的判定结果的情况下,使上述信号波形透过性地通过,而在给出需要振幅调整的判定结果的情况下,则在执行规定的振幅调整处理并对上述信号波形的振幅进行了调整以后使之通过。

权利要求 :

1.一种接收装置,接收在发送侧对基于处于时间先后关系的多个取样值的相对差异的值进行量化,并根据量化结果来分割以时间序列所生成的生成数据,并将分割结果收纳在规定的传送单位信号中进行了发送的数据,其特征在于包括:根据上述传送单位信号中所收纳的生成数据的解码结果表示的信号波形的振幅值来判定是否需要振幅调整的调整是否需要判定单元;以及在从该调整是否需要判定单元给出不需要振幅调整的判定结果的情况下,使上述信号波形透过性地通过,而在给出需要振幅调整的判定结果的情况下,则在执行振幅调整并对上述信号波形的振幅进行了调整以后使该调整后的信号波形通过的振幅调整单元,上述振幅调整单元具备:

通过移动上述信号波形的波形轴来执行上述振幅调整的第1振幅调整执行部;或者通过使上述信号波形的振幅的绝对值小于规定的基准振幅值来执行上述振幅调整的第2振幅调整执行部;或者通过按所附与的衰减率使上述信号波形的振幅进行衰减来执行上述振幅调整的第3振幅调整执行部中的至少某一个。

2.按照权利要求1所述的接收装置,其特征在于,

上述调整是否需要判定单元具备:

计算表示上述信号波形的振幅的上述量化结果的总和的振幅总和计算部;和将该振幅总和计算部计算出的总和与预先设定的第1阈值进行比较,并基于该比较结果来判定是否需要振幅调整的第1判定执行部。

3.按照权利要求1所述的接收装置,其特征在于,

上述调整是否需要判定单元具备:

计算表示上述信号波形的振幅的上述量化结果的总和的振幅总和计算部;

计算表示上述信号波形的振幅的量化结果之中持有正值的总和的正数振幅总和计算部;

计算表示上述信号波形的振幅的量化结果之中持有负值的总和的负数振幅总和计算部;和在将上述振幅总和计算部计算出的总和与预先设定的第1阈值进行比较,将上述正数振幅总和计算部计算出的总和与预先设定的第2阈值进行比较,而且将上述负数振幅总和计算部计算出的总和与预先设定的第3阈值进行比较以后,根据这些三个比较结果来判定是否需要振幅调整的第2判定执行部。

4.按照权利要求1所述的接收装置,其特征在于,

上述调整是否需要判定单元具备:

计算表示上述信号波形的振幅的上述量化结果之中持有正值的个数的正个数计算部;

计算表示上述信号波形的振幅的上述量化结果之中持有负值的个数的负个数计算部;和求该正个数计算部计算出的个数与负个数计算部计算出的个数的差分,将此差分与预先设定的第4阈值进行比较,并基于该比较结果来判定是否需要振幅调整的第3判定执行部。

5.按照权利要求1所述的接收装置,其特征在于,

上述调整是否需要判定单元具备:

基于表示上述信号波形的振幅的上述量化结果来计算信号波形的包络线的包络线计算部;和通过将该包络线计算部计算出的包络线与在其以前计算好的基准包络线进行比较,来判定是否需要振幅调整的第4判定执行部。

6.按照权利要求1所述的接收装置,其特征在于,

在以一个上述传送单位信号中所收纳的生成数据为单位来执行上述振幅调整的情况下,若以时间序列所接收的上述传送单位信号缺损,则将紧靠与所缺损的传送单位信号对应的生成数据之后的区间设为上述振幅调整的对象。

7.按照权利要求5所述的接收装置,其特征在于,

若以时间序列所接收的上述传送单位信号缺损,则从有关紧靠与所缺损的传送单位信号对应的生成数据之前的生成数据的上述信号波形,来计算上述基准包络线。

8.一种接收方法,接收在发送侧对基于处于时间先后关系的多个取样值的相对差异的值进行量化,并根据量化结果来分割以时间序列所生成的生成数据,并将分割结果收纳在规定的传送单位信号中进行了发送的数据,其特征在于:调整是否需要判定单元根据上述传送单位信号中所收纳的生成数据的解码结果表示的信号波形的振幅值来判定是否需要振幅调整;以及振幅调整单元在从该调整是否需要判定单元给出不需要振幅调整的判定结果的情况下,使上述信号波形透过性地通过,而在给出需要振幅调整的判定结果的情况下,则利用通过移动上述信号波形的波形轴来执行振幅调整的处理、或者通过使上述信号波形的振幅的绝对值小于规定的基准振幅值来执行振幅调整的处理、或者通过按所附与的衰减率使上述信号波形的振幅进行衰减来执行振幅调整的处理中的某一个,在对上述信号波形的振幅进行了调整以后使该调整后的信号波形通过。

说明书 :

技术领域

本发明涉及一种接收装置及方法,例如优选适用于诸如采用了VoIP技术的IP电话等那样进行实时通信等情况。

背景技术

目前,采用VoIP技术并利用了因特网等网络的语音通信正在盛行中。
在经由因特网等的通信质量没有被保证的网络的通信中,起因于在传送途中分组(数据分组、数据包)丢失的分组损失,原本应该以时间序列被接收的语音数据的一部分缺损的现象(语音损耗)会频繁地发生。在发生了语音损耗的情况下,如果还照原样解码,语音的中断等就会频繁发生,语音质量恶化。但是,作为针对这种恶化的补偿方法,例如,下面所述的非专利文献1的技术已经为公众所知。
这个方法是为了取样(标本化)频率8kHz的语音之用而记载的,监视每个作为解码处理单位的语音帧(分组)中语音损耗的发生,每当语音损耗发生就执行补偿处理。由于已把对编码串进行了解码以后的语音数据存储在内部存储器等中,所以当发生语音损耗时,以从该内部存储器中读出的语音数据为基础,求出产生语音损耗附近的周期。然后,对于由于语音损耗而有必要进行语音数据的插补的帧,为了使这个帧的起始相位与紧靠其前的帧的结束相位吻合以能够确保波形周期上的连续性,而从内部存储器取出语音数据进行插补。
另一方面,作为通过网络的语音通信的方式,公开了下述的非专利文献2和3中所记载的技术。
在非专利文献2的技术中,采用把经过取样后的语音的振幅值照原样量化的方法,在非专利文献3的技术中,采用对取样点之间的振幅值的变化量进行量化的差分量化等方法。
在差分量化方式中,利用进行语音编码的编码器求出语音信号的取样点之间的差分,并作为将此差分进行量化后的差分信号来传送。在接收所发送的差分信号的解码器中,以到达的差分信号为基础,复原成原来的语音信号。在差分量化方式中,在编码器、解码器中具有用于计算/变换此差分和原信号的共用的内部变量。
从而,在编码器、解码器根据此方式而动作的期间,编码器、解码器内的内部变量时常被进行更新。
非专利文献1:ITU-T建议G.711 Appendix I
非专利文献2:ITU-T建议G.711
非专利文献3:ITU-T建议G.726

发明内容

可是,如上述非专利文献2把经过取样的语音的振幅值照原样量化比较好。但是,如上述非专利文献3若使用对取样点之间的振幅值的变化量进行差分量化等方法,则在接收到语音帧的通信装置中,当进行与量化相反的操作(逆量化)并在振幅方向得到离散性的值时就可能出现不能预期的极端的离散值。这是因为:在差分量化等中,当通过逆量化而得到某个离散值时,由于该离散值的数值取决于在时间上在前(或在后)的离散值,即使用某些方法所得到的插补用的语音数据本身的值接近由于上述语音损耗而失去的本来的语音数据的值,在逆量化过程中,也有可能生成较本来的值极端地不同的离散值。
这在实际的装置的内部,例如,在上述的解码器的内部变量中可以以发生不连续的跳跃的形式被反映出来。另外,在逆量化时,如果这样生成了不能预期的极端的离散值,则在实际的语音输出中,与在此之前一直进行(或者,在其后进行)的语音输出相比,就成为极端异常的语音输出而被用户(听取语音输出的人)感受到的可能性变高,被认为是明显的通信质量的恶化,因此通信质量低。
为了解决这种课题,在本发明第1技术方案的接收装置中,接收在发送侧对基于处于时间先后关系的多个取样值的相对差异的值进行量化,并根据量化结果来分割以时间序列所生成的生成数据,并将分割结果收纳在规定的传送单位信号中进行了发送的数据,其特征在于包括:根据上述传送单位信号中所收纳的生成数据的解码结果表示的信号波形的振幅值来判定是否需要振幅调整的调整是否需要判定单元;以及在从该调整是否需要判定单元给出不需要振幅调整的判定结果的情况下,使上述信号波形透过性地通过,而在给出需要振幅调整的判定结果的情况下,则在执行规定的振幅调整处理并对上述信号波形的振幅进行了调整以后使之通过的振幅调整单元。
另外,在第2技术发明中的接收方法中,接收在发送侧对基于处于时间先后关系的多个取样值的相对差异的值进行量化,并根据量化结果来分割以时间序列所生成的生成数据,并将分割结果收纳在规定的传送单位信号中进行了发送的数据,其特征在于:调整是否需要判定单元根据上述传送单位信号中所收纳的生成数据的解码结果表示的信号波形的振幅值来判定是否需要振幅调整;以及振幅调整单元在从该调整是否需要判定单元给出不需要振幅调整的判定结果的情况下,使上述信号波形透过性地通过,而在给出需要振幅调整的判定结果的情况下,则在执行规定的振幅调整处理并对上述信号波形的振幅进行了调整以后使之通过。
根据本发明的技术方案就可以提高通信质量。

附图说明

图1是表示第1~第3实施方式中使用的通信终端的主要部分的构成例的概略图。
图2是表示第1及第2实施方式的通信终端中所包含的调整器的构成例的概略图。
图3是表示第1实施方式中使用的通信终端中所包含的总和计算器的构成例的概略图。
图4是表示第2实施方式中使用的通信终端中所包含的总和计算器的构成例的概略图。
图5是表示第3实施方式中使用的通信终端中所包含的调整器的构成例的概略图。
图6是表示第3实施方式中使用的通信终端中所包含的包络线计算器的构成例的概略图。
图7是涉及第1~第3实施方式的通信系统的整体构成例的概略图。
图8是第1~第3实施方式的动作说明图。
附图标记说明
11解码器;12调整器;13插补器;14损耗判定器;21总和计算器;22判定器;23补偿器;31正负判定器;32总和累计器;33正数总和累计器;34负数总和累计器;70通信系统;71网络;72、73通信终端;P11~P26取样点;PK11~PK13分组(语音帧)

具体实施方式

(A)实施方式
以下,以把涉及本发明的接收装置和方法应用于采用了上述差分量化的语音通信中的情况为例子,就实施方式进行说明。
(A-1)第1实施方式的构成
图7中表示涉及本实施方式的通信系统70的整体构成例子。
在图7中,该通信系统70,备有:网络71,和通信终端72、73。
其中,网络71既可以是因特网,也可以是通信行业提供的、在某种程度上保证通信质量的IP网络等。
另外,通信终端72,是例如IP电话机那样可以实时地执行语音通信的通信装置。IP电话机可以利用VoIP技术、在使用IP协议的网络上交换语音数据来进行通话。通信终端73也是与该通信终端72同样的通信装置。
通信终端72由用户U1利用,通信终端73由用户U2利用。通常,在IP电话机中,为了使用户之间的对话得以建立而以双向方式来交换语音。但是,在这里,我们关注语音帧(语音分组)PK11~PK13等从通信终端72被发送,并经由网络71在通信终端73接收这些分组的方向来进行说明。
由于在这些分组PK11~PK13中,包含着表示用户U1说出的内容的语音数据,所以只要是和这个方向相关,通信终端73就只进行接收处理,用户U2只进行用户U1发出的语音的听取。
这些分组,按照PK11、PK12、PK13,...的顺序被发送,在多数情况下,全部的分组按照这个顺序没有欠缺地被通信终端73接收,但是,起因于网络上71的路由器(没有图示)的阻塞等现象有时会发生分组损失。由于分组损失而丢失的分组,例如,也可以是PK12。
由于本实施方式的特征在于接收侧的功能,在以下,我们以上述通信终端73为关注对象来说明。图1中表示通信终端73的主要部分的构成例子。当然上述通信终端72为了进行接收处理也可以具备与此相同的构成。
(A-1-1)通信终端的构成例子
在图1中,该通信终端73,备有:解码器11、调整器12、插补器13和损耗判定器14。
其中,解码11是对从该通信终端73接收到的分组中抽取出的语音数据CD1进行解码,并输出解码结果CD1的部分。当在发送侧的通信终端72中通过编码而生成语音数据CD1时,由于进行着上述差分量化,故在由接收侧的通信终端73中所包含的该解码器11进行的这个解码之中,就执行与差分量化相对应的逆量化。
损耗判定器14是根据基础信息ST1检测上述分组损失(语音损耗)的发生,并输出损耗状态检测结果ER1的部分。当分组损失发生时,由于需要上述调整器12和插补器13的功能,故利用该损耗状态检测结果ER1把该用意通知给上述调整器12和插补器13。
在分组损耗的检测方法中可以使用各种方法。例如,既可以当各分组中包含的RTP标题等持有的、应该是连续的序号(通信终端72在分组发送时所附与的连续号码)中发生了遗漏时,判定为发生了分组损失,也可以以该RTP标题等持有的时间戳记(通信终端72在分组发送时所附与的发送时刻信息)的值为基础,把延迟过大的分组,判定为由于分组损失而丢失的分组。在使用序号的情况下,上述基础信息ST1就为该序号;而在使用时间标志的情况下,上述基础信息ST1就为时间标志。
曾经被判定为由于分组损失而丢失了的分组,也有可能在后来被接收。但是,在这种情况下,也可以废弃接收到的分组。这是因为在实时通信中,在应该被接收的时刻之前没有被接收的语音数据,不能用于语音输出。
但是,在以序号为基础来判断分组损失的情形中,当在语音输出之前的来得及的时刻接收到该分组时,通过把接收到的分组的序号在通信终端73内进行更换,就有可能能够用于语音输出。因此,在进行这样的更换时,最好已进行考虑以使得通过上述损耗状态检测结果ER1通知分组损失的时刻不会过早。
插补器13是对被从上述解码器11输出,并通过调整器12调整后的语音信息(调整结果)AJ1的系列,插入插补语音信息并输出插补结果IN1的部分。该插补器13,在上述损耗状态检测结果ER1已经表示语音损耗时,就把按规定的方法创建的插补语音(插补语音信息)插入到与上述语音损耗相对应的区间。
在插补语音的创建中可以使用各种方法。但是,为此如果需要的话,该插补器13也可以把从调整器12所供给的调整结果AJ1之中新的部分保存起来,例如,从紧靠语音损耗之前的调整结果AJ1来创建该插补语音。
还可以把该插补器13配置在解码器11和调整器12之间,用调整器12对插补后的语音信息进行调整;或者配置在解码器11的前级,在解码之前进行插补。但是,在本实施方式中,如图示那样由于插补器13是被配置在调整器12的后级,故插补在调整后得以执行。
不论在哪一个位置进行插补,由于通过插补而插入的信息是与本来的语音信息相异的疑似语音信息,所以只是通过插补不能防止由于在解码器11中被执行的逆量化,而如上所述那样出现不能预期的极端的离散值,并使从通信终端73输出的语音输出质量恶化。
因此,在本实施方式中,采用上述调整器12来减轻与语音损耗区间(在这里插补语音信息被插入)和其后区间的连接相关的语音输出的质量恶化。
调整器12通过求解与从上述解码器11供给的解码结果DC1相关的直流分量倾向等,来判定是否需要调整,当判定为需要调整时,调整解码结果DC1表示的振幅值,否则不进行任何处理透过性地使解码结果DC1通过(这时,DC1就原封不动成为AJ1),把调整结果AJ1传给后级的插补器13。
图2中表示了这样的调整器12的详细构成。
(A-1-2)调整器的详细构成
在图2中,该调整器12,备有:总和计算器21、判定器22、补偿器23。
其中,总和计算器21是求出基本上与上述解码结果DC1相关的直流分量的倾向的部分。该总和计算器21求出的直流分量倾向,通过后述的3个总和信息SG1~SG3来表达。
该总和计算器21,在没有发生语音损耗的区间和正在发生语音损耗的区间不工作,而在语音损耗解除以后的定时工作。这是因为,在语音损耗解除之前的语音损耗正在发生的区间,不存在待处理的有效的解码结果DC1的缘故。例如,如果用上述损耗状态检测结果ER1明确地表示语音损耗(分组损耗)的发生和分组的接收的话,则在该损耗状态检测结果ER1表示了语音损耗之后,在最初表示了分组接收的时刻,该总和计算器21就能够开始动作。
关于使已开始的总和计算器21的工作继续的期间(这个期间,与补偿器23执行后述的振幅调整处理的处理区间相对应),可以考虑各种变形例子。
这个处理区间,例如,也可以与分组大小(严格来说,收纳在分组中的语音数据的(例如,CD11)大小)吻合。这时,当1个分组中的语音数据的大小变动时,配合其变动使处理区间的长度也进行变化。这是因为与解码器11相同,在调整器12中,也把1个分组(严格来说,在1分组中收纳着的1个的语音数据)作为处理单位会更有效率。
如图3所示,该总和计算器21,包含:正负判定器31、总和累计器32、负数总和累计器34、正数总和累计器33和正负变换器35。
其中,总和累计器32是把解码结果DC1中包含的离散的值(振幅值),在上述处理区间之间进行累计,并输出该累计结果的部分。
由于总和累计器32是对在上述处理区间之间中存在的所有离散值的值进行累计,并把该累计结果作为全总和信息SG1进行输出,所以例如当在该处理区间之间,在正方向和负方向上同程度大小的离散值按同程度数量相应存在等情况下,由于它们大体上互相抵消,结果该全总和信息SG1的值就成为0或者接近0的值。但是,当在正方向和负方向上离散值的大小极端不同,或者在离散值的数量上存在很大偏差等情况下,不能抵消干净而剩余的部分就变多,该全总和信息SG1的值(绝对值)就变大。
图8表示语音波形的一个例子。在图8中,横轴X是时间轴(图中表示的时间范围与上述处理区间相比非常短),纵轴Y表示振幅。Y轴的0以上为正(+)、0以下为负(-)。另外,把取样(采样)的时刻用虚线表示,因此,各虚线与语音波形AW1的相交各点P11~P26成为取样点。虽然实际上量化噪声可能会混入,但是,基本上各取样点(例如,P11)表示的振幅值(Y坐标的值)是与差分量化后的离散值(振幅值)相对应。但是在差分量化中与基于上述非专利文献2的量化不同,如上述非专利文献3中所述那样是对取样点之间的振幅值的变化量进行量化,这一点如已经说明过那样。
另外,正负判定器31,对在上述处理区间之间、解码结果DC1中所包含的各离散值(例如,与上述各取样点P11~P26相对应),判定其值的正负(在上述Y轴0以上还是以下)。把判定结果为正的离散值作为正数语音P1提供给正数总和累计器33,把判定结果为负的离散值作为负数语音N1提供给负数总和累计器34。虽然取决于具体的实现,但当负数语音N1持有负的符号等时,如图3所示,通过正负变换器35,实施除去负的符号的操作,在其以后的处理中就没有必要使用正负符号,因而处理效率提高的情况也不少。
上述正数总和累计器33是对被提供的正数语音P1表示的值进行累计,并把该累计值作为正数总和信息SG3输出的部分。这个正数总和信息SG3,例如,在图8中,与由波形AW1和X轴所围起的区域中的Y坐标比0大的部分的面积相对应。
另外,负数总和累计器34是对被提供的负数语音N1表示的值进行累计,并把该累计值作为负数总和信息SG2输出的部分。这个负数总和信息SG2,例如,在图8中,与由波形AW1和X轴所围起的区域中的Y坐标比0小的部分的面积相对应。
这些总和信息SG1~SG3,被提供给图2中表示的判定器22。
在图2中,该判定器22是以总和信息SG1~SG3为基础,判定是否出现了上述的不能预期的极端的离散值(多数情况下,极端地大的异常振幅值),并输出判定结果DS1的部分。
关于如何以这些总和信息SG1~SG3为基础,来确定不能预期的极端的离散值的存在与否也有可能能够利用各种方法。但是,在这里设采用下面的CR1及CR2的判定方法。
CR1:当上述全总和信息SG1的绝对值超过规定的阀值TH1时,判定为存在极端的离散值。
CR2:检查同时被输入的负数总和信息SG2和正数总和信息SG3的大小关系,当大的一方超过规定的阀值TH2,而且,小的一方比规定的阀值TH3小时,判定为存在极端的离散值。
换言之,当根据这些判定方法CR1、CR2的任何一个都判定为不存在极端的离散值时,就认为为正常。即使在语音损耗已经发生了的情况下,根据在语音损耗的区间的前后的用户U1说话的内容(例如,其间什么也没有说是无声等情况)等,也有可能不出现极端的离散值。
此外,作为上述阀值TH1、TH2、TH3的值,可以设定为各种值,作为一例,也可以设定TH1为300、TH2为200、TH3为100等。
通过该判定器22得到判定结果DS1,接收到上述解码结果DC1的补偿器23,在判定结果DS1表示没有出现上述极端的离散值的情况下,对解码结果DC1不做任何加工透过性地使其通过,在表示出现有上述极端的离散值的情况下,在通过变更解码结果DC1的离散值以解除极端度这样进行了调整的基础上使其通过。在任何一种情况下,通过了该补偿器23的解码结果DC1,作为调整结果AJ1被提供给上述插补器13。
有各种用于解除极端度的调整方法(振幅调整处理),例如,也可以参考插补器13创建的上述插补语音(插补语音信息)的振幅,变更成接近其振幅的值等,但是,当极端度在振幅值极端地变大的方向上显现的倾向较强时、或当在变大的方向上显现时特别是当给用户U2带来很大的不舒服的感觉的倾向强等情况下,把振幅变更为0也比较简便。另外,也可以通过移动波形轴来解除该极端度。
所谓波形轴的移动,例如,在图8的情况下是与把波形AW1在Y轴方向上平行移动相当的操作。由于在波形AW1的情况下是偏向Y轴正方向,所以如果对该波形AW1施用波形轴的移动的话,就是使其向Y轴的负方向平行移动。
可以采用任何一种的解除方法。但是,在这里采用使振幅值为0的方法。
以下,对具有上述那样的构成的本实施方式的动作进行说明。
(A-2)第1实施方式的动作
用户U1说出的语音被收纳于从图7中所示的通信终端72以时间序列进行发送的分组PK11、PK12、PK13,...,经由网络71被通信终端73接收并被语音输出。这个语音输出被用户U2听取。若为了区分被收纳在各分组中的语音数据CD1,把被收纳在分组PK11中的语音数据记为CD11,把被收纳在分组PK12中的语音数据记为CD12,把被收纳在分组PK13中的语音数据记为CD13,则语音数据CD11、CD12、CD13,与用户U2听到的语音信息相关,构成一连串的系列。
如果分组PK11~PK13在网络71中传送时没有发生分组损失的话,通信终端73内的图1中表示的损耗判定器14输出的损耗状态检测结果ER1就不会表示语音损耗的发生,因此,调整器12把从解码器11接收到的解码结果DC1(作为调整结果AJ1)透过性地交给插补器13,插补器13不进行上述插补语音的创建和插入。
只要持续这样的状态,如果不存在使通信质量恶化的其他的主要原因(发生大的不稳定等),通信终端73就可以以高的语音质量来继续语音输出。
可是,如果任何一个分组(在这里,设为PK12)由于分组损耗而丢失,则上述损耗状态检测结果ER1就表示语音损耗的发生,因此,在插补器13内上述插补语音被创建;在调整器12内上述总和计算器21和判定器22等进行工作开始的准备。
在实际中,该总和计算器21和判定器22等开始工作是上述损耗状态检测结果ER1已经表示了语音损耗的发生以后,成为明确地表示上述分组(在这里,设为PK13)的接收的状态的时刻,也就是,语音损耗已解除的时刻。
在这里,当进行与上述差分量化相对应的解码(逆量化)时,以上述系列中的某个语音数据(这里,CD13)的逆量化利用在时间上靠前的语音数据(这里,CD12)的内容为前提。
由于分组损失(语音损耗),应该利用的语音数据CD12不存在,因此,语音数据CD13的逆量化的结果就变得不正常,很有可能出现上述极端的离散值(振幅值)。例如,在上述处理区间中,包含这个语音数据CD13的区间的一部分或全部。
在以作为上述总和计算器21内的各构成要素31~34进行了动作的结果而被输出的总和信息SG1~SG3为基础,执行根据上述判定方法CR1、CR2的处理以后的结果是,当判定器22判定在语音数据CD13的解码结果DC1中包含着极端的离散值(振幅值)时,补偿器23如上所述,使语音数据CD13振幅值变更为0。
另外,对于因语音损耗而丢失了的语音数据CD12的区间插入上述插补器13所创建的插补语音。
从而,在此情况下,用户U2就在与分组PK11~PK13相对应,本来听取与语音数据CD11、CD12、CD13的解码结果相对应的语音输出的区间,听取语音数据CD11的解码结果、插补语音、无音(振幅值0)。
在这种情况下,与本来能够听取的解码结果的情况相比较语音质量的下降不可避免,但是,若与在与语音数据CD13相对应的区间进行对应于上述的极端的离散值的语音输出的情况相比,无音区间与语音数据CD11的解码结果或插补语音的区间的连接较为自然,与在后续的分组(在PK13以后被接收的分组)中包含的语音数据的解码结果之间的连接也变得平滑,对用户U2来说没有不舒服的感觉。通过这样,就可以抑制通信质量的恶化程度,因此可以说与以往相比通信质量较高。
(A-3)第1实施方式的效果
根据本实施方式,就能够在采用差分量化的条件下,使发生了分组损失时的通信质量比以往提高。
(B)第2实施方式
以下,只对本实施方式与第1实施方式的不同点进行说明。
本实施方式与第1实施方式不同之处,基本是限于与上述总和计算器21的功能相关的方面。从而,图1和图7等照原样来表示本实施方式的构成。
为了与第1实施方式的总和计算器21区别,对本实施方式的总和计算器标以附图标记80。
(B-1)第2实施方式的构成及动作
本实施方式的总和计算器80的内部构成例如如图4所示。
在图4中,该总和计算器80,备有:正负计数器41、总和累计器42、正数计数器43、负数计数器44。
其中,正负计数器41是当从上述解码器11接收到解码结果DC1,就在上述处理区间之间、对在解码结果DC1中所包含的各离散值(例如,与上述各取样点P11~P26相对应),判定该值的正负(在上述Y轴上,0以上还是以下),每当判定结果为正就输出正数判定信号P11,每当判定结果为负就输出负数判定结果N11的部分。
接收该正数判定信号P11的正数计数器43,是每当收到正数判定信号P11,例如,通过加1(+1)对接收到的正数判定信号P11的数量(正取样点数)进行计数,并把计数结果作为正数计数信息SG13输出的部分。该正数计数信息SG13被提供给上述判定器22。
同样地,接收上述负数判定信号N11的负数计数器44,是每当收到负数判定信号N11,例如,通过加1(+1)对接收到的负数判定信号N11的数量(负取样点数)进行计数,并把计数结果作为负数计数信息SG12输出的部分。该负数计数信息SG12被提供给上述判定器22。
判定器22,根据这两个计数信息SG12、SG13进行判定,因此,其动作也与第1实施方式不同。在使用计数信息SG12和SG13对上述的极端的离散值出现与否进行判定的判定方法中可以有各种各样的方法。但是,在这里采用下面的判定方法CR3。
CR3:求出正数计数信息SG13表示的正取样点数和负数计数信息SG12表示的负取样点数的差分,当这个差分的绝对值超过规定的阀值TH14时,判定为存在极端的离散值。
作为该阀值TH14的值可以设定各种各样的值,但是,作为一例,也可以设定为20。
图4所示的上述总和累计器42,其自身的作用与第1实施方式中的总和累计器32完全相同。因此,从该总和累计器42被输出的全总和信息SG11与第1实施方式的全总和信息SG1相同。但是,本实施方式的全总和信息SG11,被提供给不是判定器22而是补偿器23。
接收到这个全总和信息SG11的本实施方式的补偿器23,把其作为条件相符的区间(例如,在上述分组PK12丢失的情况下与上述语音数据CD13相对应的区间)的直流分量。然后,把从这个区间的解码结果DC1中减去该直流分量以后的值,作为该区间的调整结果AJ1输出。也可以将全总和信息SG11的平均值作为该直流分量。
进而,减去直流分量时的扣除量,最好是以在当前的处理期间之前的和之后的期间使扣除量连续地变化的方式来决定其值。也可以采取以下的方法等:例如,把当前的分组(例如,作为上述PK13的下一个分组的PK14(没有图示))中的直流分量和前一个的分组(这里是PK13)中的直流分量分别作为D0、D1进行保持,以当前的处理期间(与PK14相对应)的最初的扣除量为D1、最后的扣除量为D0这样的方式使该处理期间内的扣除量线性地变化。
这个处理,在从进行利用补偿器23的调整(也就是振幅调整)的期间向不进行调整的期间过渡时,也能够同样地进行。
此外,在即使上述损耗状态检测结果ER1表示了语音损耗的发生,但通过依照上述的判定方法CR3的处理,被判定为没有出现极端的离散值时,对解码结果DC1不作任何加工而透过性地使其通过等方面,本实施方式也与第1实施方式相同。
(B-2)第2实施方式的效果
根据本实施方式,就可以得到与第1实施方式同等的效果。
加之,在本实施方式中,由于与第1的实施方式的正数总和累计器(33)和负数总和累计器(34)相当的正数计数器(43)和负数计数器(44),只对取样点的数量进行计数即可,所以当在同一条件下进行比较时,与如第1实施方式那样对离散值进行累计的情况相比,就可以减少存储资源的耗费量,能够加快处理速度的可能性也高。
(C)第3实施方式
以下,只对本实施方式与第1、第2的实施方式的不同点进行说明。
本实施方式与第1、第2的实施方式的不同之处,基本上限于利用上述解码结果DC1表示的包络线来进行各处理的点上。从而,图1和图7等照原样来表示本实施方式的构成。
为了与第1实施方式的调整器12区别,对本实施方式的调整器标以附图标记81。
(C-1)第3实施方式的构成及动作
本实施方式的调整器81的内部构成例如图5所示。
在图5中,该调整器81,备有:包络线计算器51、判定器52、补偿器53。
其中,包络线计算器51是计算解码结果DC1的各离散值的包络线RE1的部分。
为此,该包络线计算器51,例如包括备有如图6所示的延迟器61、放大器62、63和加法器64的循环型滤波器。
在这里,放大器61的增益α是比1小的正数,作为一例也可以是0.9。
被输入到增益为1-α的放大器63中的输入x(t),与在上述解码结果DC1中被包含的各离散值(振幅值)相对应,但是,是不含正负符号的绝对值。
从该放大器63输出的输出值和上述从放大器62输出的输出值在加法器64中被相加的结果,成为包络线的值(包络值)y(t)。另外,该y(t)通过延迟器61被延迟以后返回的值y(t-1),成为对上述放大器62的输入值,把该输入值在该放大器62中经过处理以后的结果,成为下次向加法器64输出的输出值。
在上述增益α较大的情况下,对包络值y(t),加强与通过延迟器61进行循环的值y(t-1)相对应的信号分量;当较小时,加强与新的输入值x(t)相对应的信号分量。
该包络线计算器51是可以与在第1实施方式中的总和计算器21相对应的部分。但是,第1实施方式中的总和计算器21,在没有发生语音损耗的区间不工作,相对于此,该包络线计算器51在没有发生语音损耗的区间也工作这点是不同的。
虽然判定器52把判定结果DS1提供给补偿器53这点与上述判定器22相同,但是,用于得到其判定结果的判定方法CR4与第1、第2实施方式的判定方法不同。
为了执行此判定方法CR4,判定器52需要时常把在没有发生语音损耗的区间通过上述包络线计算器51工作而得到的包络值y(t)之中的新值储存起来。这时,每当新的包络值y(t)被供给,就把相同大小的包络值的存储数据从旧的开始按顺序删除(或无效化),以确保用于存储其新的包络值y(t)的存储区域为好。
在该基础上,该判定器52,在已经发生了语音损耗时,执行下面的判定方法CR4。
CR4:对在语音损耗已解除的时刻被提供给判定器52的最新的包络值y(t)与所存储的包络值(其正是紧靠语音损耗之前的包络值)进行比较。在比较的结果,当最新的包络值y(t)的一方比被存储的包络值y(t)小时就判定为正常;而在大时就判定为异常的振幅。
从该判定器52接收判定结果DS1的补偿器53的工作(调整方法),也可以与第1、第2实施方式的补偿器23相同。但是,在这里,把存储在判定器52内的紧靠语音损耗之前的包络值用与各离散值相对的包络值进行除法计算将其结果作为衰减率与被包含在解码结果DC1中的离散值(振幅值)进行相乘,将该乘法计算结果作为调整结果AJ1进行输出。通过这样来调整振幅。
此外,例如,只在上述处理区间之间,对解码结果DC1中的各离散值,反复进行借助于判定器52的采用了判定方法CR4的包络值的大小判定和借助于补偿器53的振幅调整。
虽然在这里,是把比较和衰减率的基准设定为紧靠损耗之前的包络值。但是,并不限定于此。例如,也可以设定为紧靠损耗之前的语音数据(例如,上述CD11)中的包络值的平均等。
另外,补偿器53中的振幅调整处理(调整方法),也可以不是乘以衰减率的方法,而是减去使其衰减的量。只要是使当前的异常的振幅衰减,并使其接近损耗之前的振幅的方法则不限定于这个方法。
进而,还可以采取把上述处理区间,设定为与把紧靠语音损耗已解除之后的衰减率(从0到1之间的值)10倍后的分组(语音数据)数相当的期间等方法。只要是以某种形式设定进行振幅调整的期间的上限的方法则不限定手段。
进而,为了使进行振幅调整的区间和后续的区间之间的连接平滑,在进行振幅调整的区间的最后的部分(例如,最后的10ms的期间),保持紧靠该10ms之前的衰减率,并在该10ms期间之内线性地减小此衰减率,连续地使其过渡到不进行振幅调整的语音为好。
作为这个期间,当然也可以准备为10ms以外的期间。
另外,只要是从调整振幅以后的语音,连续地使其过渡到原来的语音的方法,则不限定于这个方法,例如,也可以使用以指数函数的方式使衰减率减少的方法等。
(C-2)第3实施方式的效果
根据本实施方式,就可以得到与第1实施方式的效果同等的效果。
另外,在本实施方式中,由于直接利用与各个振幅值相对应的包络值,检查在解码结果(DC1)中是否存在极端的离散值(振幅值),所以可以进行更高精度的检查。
另外,由于在本实施方式中,利用连续的多个包络值来得知包络线的形状,故在补偿器(53)执行的振幅调整处理中,就可以更为自然地(更为忠实地)进行与前后的波形的变化相匹配的调整,对用户(U2)的听觉上的不舒服感的进一步减小和解除较为有效。
(D)其他的实施方式
在上述第1~第3的实施方式中,把工作一旦开始以后的总和计算器21和补偿器23等继续工作的处理区间设为与分组大小相吻合。但是,也可以采取处理区间的长度不依赖分组大小的结构。在这等情况下,例如也可以把处理区间设定为80ms的固定值。
另外,也可以采取,不固定地设定该期间,而设为与把振幅总和0.05倍以后的数量的分组(帧)相当的期间等方法。只要是以某种形式设定振幅调整期间的上限的方法则不限定手段。进一步,也可以把比与一个分组相对应的期间还短的期间作为单位来决定进行振幅调整的期间。
另外,当振幅调整有必要跨越多个分组(帧)时也可以采用。例如,对每个分组进行上述的判定方法,当振幅调整不必要时,在以后的分组中不进行振幅调整;当振幅调整有必要时继续进行振幅调整,反复进行此动作。这时,不言而喻在重复的分组(帧)的数量上也可以设定上限。作为该方法,也可以使用上述的设定上限的方法。
进而,虽然在上述第1~第3的实施方式中,在多数处理中采用了共用的上述处理区间。但是,也可以使用对每个处理不同的处理区间。例如,即便用于求解上述全总和信息SG1的处理区间和用于求解上述负数总和信息SG2和正数总和信息SG3的处理区间的长度不同也无妨。
此外,作为上述补偿器(12,81)执行的调整方法,可以采用上述以外的方法。
另外,当然也可以将各实施方式和调整方法的组合从上所述的情况进行变更。
进一步,上述阀值TH1~TH4的值不限定于上述情况,这一点如同已经说明过那样。另外,也可以不固定这些阀值TH1~TH4的值,而是根据语音的输入情况等进行变更。
此外,并不拘泥于上述第3的实施方式,也可以用循环型滤波器以外的手段,求出波形(例如AW1)的振幅变化。
例如,也可以在从某个取样点开始到一定时间为止的全部取样点中,取振幅值的绝对值的总和,并把对各个取样点求出这个值的系列作为包络线来使用。
另外,虽然在上述第3实施方式中,把作为基准被存储着的包络值与最新的包络值进行比较。但是,也可以在这些包络值中设定有效范围。例如,也可以如果把已经存储在判定器52中的紧靠语音损耗之前的包络值用最新的包络值相除后得到的衰减率的倒数没有达到1.001就结束振幅调整。,
进而,虽然在上述第1~第3的实施方式中,对紧靠语音损耗之后的语音数据(其解码结果(例如,上述DC13))执行调整方法。但是,哪个语音数据执行调整方法,取决于所使用的差分量化的步骤以及装置的构成。
例如,在差分量化是以关于某个区间的振幅值的量化,对从其前的区间的振幅值的变化量进行量化时,也可以如上述第1~第3的实施方式那样,对紧靠语音损耗已发生之后的语音数据执行调整方法。但是,在以关于某个区间的振幅值的量化,对至其后的区间的振幅值的变化量进行量化时等,也有可能需要对紧靠语音损耗之前的语音数据执行调整方法。
另外,虽然在上述第1~第3的实施方式中,在分组损失(语音损耗)已发生时,给与调整器(12,81)发挥功能的机会,根据需要,使之进行振幅调整。但是,也有可能即便在分组损失没有发生时也进行振幅调整。
例如,也可以在对于某个分组(帧)检测出传送错误的发生等时,给与调整器(12,81)起作用的机会。这是因为,在即使可以接收分组,但传送错误被检测出来的情况下,有可能该分组中的语音数据破坏,而出现上述的极端的离散值(振幅值)。
此外,虽然在上述第1~第3的实施方式中,以语音通信为例子来进行说明。但是,本发明也有可能应用于语音通信以外的实时通信中。例如,也可以把本发明应用于活动图像数据的通信等。
另外,当然应用本发明的通信协议没有必要限定于上述的IP协议。
虽然在以上的说明中,主要是通过硬件实现了本发明。但是,也可以通过软件来实现本发明。