一种语音质量增强方法和系统转让专利

申请号 : CN200510091269.6

文献号 : CN1917039B

文献日 : 2010-09-15

本发明提供一种语音质量增强方法和系统，其方法的核心为：控制端确定需要对语音流进行语音质量增强处理，所述控制端将需要进行的语音质量增强处理的控制信息承载于控制包中传输至语音质量增强处理的执行端，所述执行端根据控制包中承载的控制信息对其接收的语音流进行相应的语音质量增强处理。本发明中的控制端通过控制包来控制语音质量增强执行端进行声学回波抵消等语音质量增强处理，使本发明的方法能够在分离架构的2G/3G网络中适用，从而实现了提高语音质量的目的。

1.一种语音质量增强方法，其特征在于，包括：

a、控制端根据主叫侧/被叫侧的局向信息和/或用户签约信息确定需要对主叫侧和/或被叫侧的语音流进行语音质量增强处理；

b、所述控制端将需要对主叫侧和/或被叫侧的语音流进行语音质量增强处理的控制信息承载于控制包中传输至语音质量增强处理的执行端，所述控制包为基于H.248的控制包；

c、所述执行端根据控制包中承载的控制信息对其接收的语音流进行相应的语音质量增强处理。

2.如权利要求1所述的一种语音质量增强方法，其特征在于，所述控制端为：呼叫服务器。

3.如权利要求1所述的一种语音质量增强方法，其特征在于，所述语音质量增强处理的执行端为：基于分离架构模式的2G/3G网络中的媒体网关或NGN网络中的媒体网关。

4.如权利要求1、2或3所述的一种语音质量增强方法，其特征在于，所述步骤b中需要进行的语音质量增强处理的控制信息包括：打开/关闭声学回波抵消、和/或电学回声抑制深度、和/或打开/关闭背景噪声抑制、和/或打开/关闭自动增益控制、和/或打开/关闭自动本地听筒增益控制、和/或打开/关闭语音增强识别、和/或打开/关闭数据业务检测。

5.如权利要求4所述的一种语音质量增强方法，其特征在于，所述步骤b中需要进行语音质量增强的控制信息还包括：声学回波抵消方向、和/或自动增益控制的方向、和/或自动本地听筒增益控制的方向、和/或语音增强识别的方向、和/或数据业务检测的方向。

6.如权利要求4所述的一种语音质量增强方法，其特征在于：当所述控制信息中携带的电学回声抑制深度为预定值时，语音质量增强处理的执行端根据需要自主确定电学回声抑制深度。

7.如权利要求1、2或3所述的一种语音质量增强方法，其特征在于，所述步骤c具体包括：执行端根据控制包承载的控制信息分配相应的语音质量增强资源，并对外部传输来的基于G.711语音流进行语音质量增强处理；或执行端根据控制包承载的控制信息分配相应的语音质量增强资源和码转换器资源；

所述码转换器资源将外部传输来的语音流转换为基于G.711语音流，并由所述语音质量增强资源对G.711语音流进行相应的语音质量增强处理。

8.一种语音质量增强系统，其特征在于，包括：

控制端：在确定需要对语音流进行语音质量增强处理时，将需要进行的语音质量增强处理的控制信息承载于控制包中传输至语音质量增强处理的执行端，所述控制包为基于H.248的控制包；

执行端：根据其接收的控制包中承载的控制信息对语音流进行相应的语音质量增强处理；

所述控制端包括：

确定模块：根据主叫侧/被叫侧的局向信息和/或用户签约信息确定需要对主叫侧/被叫侧的语音流进行语音质量增强处理，并通知控制信息下发模块；

控制信息下发模块：根据确定模块的通知将需要对主叫侧/被叫侧的语音流进行语音质量增强处理的控制信息承载于控制包中传输至执行端。

9.如权利要求8所述的一种语音质量增强系统，其特征在于，所述执行端包括：资源分配模块：根据控制端传输来的控制包中承载的控制信息为执行模块分配相应的语音质量增强资源；

执行模块：根据资源分配模块为其分配的资源对基于G.711语音流进行语音质量增强处理。

10.如权利要求9所述的一种语音质量增强系统，其特征在于，所述执行端还包括：转换模块：将外部传输来的语音流转换为基于G.711语音流，并传输至执行模块。

11.如权利要求8、9或10所述的一种语音质量增强系统，其特征在于：所述控制端为：呼叫服务器；

所述执行端为：2G/3G网络中的媒体网关或NGN网络中的媒体网关。

技术领域

本发明涉及网络通讯技术领域，具体涉及一种语音质量增强方法和系统。

背景技术

在用户通话过程中，手机或固定电话的听筒中用户的声音会扩散到房间里，同时也会通过电话内部到达话筒，这样，说话方就会听到从对方听筒里传过来的自己的声音。
这种现象在线路迟延比较小时，用户感觉不到，当线路迟延比较大时，用户就会听到从对方听筒里传过来的自己的声音，特别是在免提模式下，该问题比较明显。
在移动通信中的信道迟延比较大时，通常会使用声学回波抵消技术，即AEC(声学回波抵消)技术来提高语音的通话质量。
AEC技术是一种语音质量增强的方法，除AEC技术外，还有如下语音质量增强方法：
NR(背景噪声抑制)：NR可以消除通话中的背景环境的干扰噪声，使得另一方能够听到清晰的通话。
ALE(自动本地听筒增益控制)：ALE功能能够根据用户所在环境的噪声强度，自动调整用户听到声音的增益，使得用户在吵杂环境中能够听清通话内容。
ALG(自动增益控制)：ALG功能可以自动调整用户语音音量，当通话声音变小时，可以自动调整改其增益，使得通话另一方不会听见声音过小或过高。
VEI(语音增强识别)：可使语音容易理解。
DD(数据业务检测)：可以检测到话音信号中的带内数据业务，并透传带内数据业务。
EEC(电学回波抵消)：可以抵消模拟电话2线转4线产生的电学回波，通常有不同的尾长。
上述语音质量增强功能在使用过程中存在工作方向如双向、对内、对外等，即语音质量增强功能可以双向起作用、可以对内起作用、可以对外起作用。
目前，使用声学回波抵消技术、NR、ALE等上述语音质量增强功能实现语音质量增强的方法主要为：
将AEC、NR、ALE、ALG、VEI、DD、EEC等语音质量增强功能集成在编解码器中，如将AEC、NR、ALE、ALG、VEI、DD、EEC等语音质量增强功能集成在BSS(基站子系统)编解码器中，再如将AEC、NR、ALE、ALG、VEI、DD、EEC等语音质量增强功能集成在MSC(移动交换机)上的编解码器中，以消除移动用户到核心网方向的声学回声，提高语音质量。
同时，集成在编解码器中的AEC功能还能够识别FAX(传真)业务和数据业务、实现自动打开、关闭AEC功能等。
上述语音质量增强的方法虽然能够明显地改进语音质量，但是，该方法的实施会降低编解码器的密度和处理能力，而且，不适合在2G/3G的分离架构中使用。

发明内容

本发明的目的在于，提供一种语音质量增强方法和系统，控制端通过控制包来控制执行端进行语音质量增强，使本发明的方法能够在2G/3G的分离架构中适用，从而实现了提高语音质量的目的。
为达到上述目的，本发明提供的一种语音质量增强方法，包括：
a、控制端确定需要对语音流进行语音质量增强处理；
b、所述控制端将需要进行的语音质量增强处理的控制信息承载于控制包中传输至语音质量增强处理的执行端；
c、所述执行端根据控制包中承载的控制信息对其接收的语音流进行相应的语音质量增强处理。
所述控制端包括：呼叫服务器。
所述语音质量增强处理的执行端包括：基于分离架构模式的2G/3G网络中的媒体网关或NGN网络中的媒体网关。
所述步骤a具体包括：
所述控制端根据主叫侧/被叫侧的局向信息和/或用户签约信息确定需要对主叫侧/被叫侧的语音流进行语音质量增强处理。
所述步骤b中的控制包为：基于H.248的控制包。
所述步骤b中需要进行的语音质量增强处理的控制信息包括：打开/关闭声学回波抵消、和/或电学回声抑制深度、和/或打开/关闭背景噪声抑制、和/或打开/关闭自动增益控制、和/或打开/关闭自动本地听筒增益控制、和/或打开/关闭语音增强识别、和/或打开/关闭数据业务检测。
所述步骤b中需要进行语音质量增强的控制信息还包括：声学回波抵消方向、和/或自动增益控制的方向、和/或自动本地听筒增益控制的方向、和/或语音增强识别的方向、和/或数据业务检测的方向。
当所述控制信息中携带的电学回声抑制深度为预定值时，语音质量增强处理的执行端根据需要自主确定电学回声抑制深度。
所述步骤c具体包括：
执行端根据控制包承载的控制信息分配相应的语音质量增强资源，并对外部传输来的基于G.711语音流进行语音质量增强处理。
所述步骤c具体包括：
执行端根据控制包承载的控制信息分配相应的语音质量增强资源和码转换器资源；
所述码转换器资源将外部传输来的语音流转换为基于G.711语音流，并由所述语音质量增强资源对G.711语音流进行相应的语音质量增强处理。
本发明还提供一种语音质量增强系统，包括：
控制端：在确定需要对语音流进行语音质量增强处理时，将需要进行的语音质量增强处理的控制信息承载于控制包中传输至语音质量增强处理的执行端；
执行端：根据其接收的控制包中承载的控制信息对语音流进行相应的语音质量增强处理。
所述控制端包括：
确定模块：根据主叫侧/被叫侧的局向信息和/或用户签约信息确定需要对主叫侧/被叫侧的语音流进行语音质量增强处理，并通知控制信息下发模块；
控制信息下发模块：根据确定模块的通知将需要进行的语音质量增强处理的控制信息承载于控制包中传输至执行端。
所述执行端包括：
资源分配模块：根据控制端传输来的控制包中承载的控制信息为执行模块分配相应的语音质量增强资源；
执行模块：根据资源分配模块为其分配的资源对基于G.711语音流进行语音质量增强处理。
所述执行端还包括：
转换模块：将外部传输来的语音流转换为基于G.711语音流，并传输至执行模块。
所述控制端为：呼叫服务器；
所述执行端为：2G/3G网络中的媒体网关、或NGN网络中的媒体网关。
通过上述技术方案的描述可知，本发明的控制端通过控制包来控制执行端进行语音质量增强，使本发明的方法能够在分离架构的2G/3G网络中适用；通过在语音质量增强处理的执行端如媒体网关等，对语音流进行语音质量增强处理，避免了对编解码器的密度、处理能力的影响；本发明的控制端通过在控制包中承载一种或多种语音质量增强功能的控制信息，并设置其工作方向，使执行端如媒体网关能够通过简单的命令执行来完成语音质量增强处理，简化了媒体网关的语音质量增强操作；从而通过本发明提供的技术方案实现了提高语音质量的目的。

附图说明

图1是本发明的2G网络中语音质量增强方法示意图；
图2是本发明的3G网络中语音质量增强方法示意图；
图3是本发明的3G网络和PSTN网络互通中语音质量增强方法示意图。

具体实施方式

本发明的核心是：控制端确定需要对语音流进行语音质量增强，所述控制端将需要进行的语音质量增强的控制信息承载于控制包中传输至语音质量增强处理的执行端，所述执行端根据所述控制包中承载的控制信息对其接收的语音流进行语音质量增强处理。
下面基于本发明的核心思想对本发明提供的技术方案做进一步的描述。
在分离架构模式下的2G/3G网络中，本发明的控制端可以为呼叫服务器，执行端可以为媒体网关。在NGN网络中，语音质量增强处理的执行端可以为媒体网关。
呼叫服务器可以根据主叫用户、被叫用户的局向信息、用户签约信息等确定是否需要对语音流进行语音质量增强处理，如果呼叫服务器确定需要对语音流进行语音质量增强处理，则还需要对其中部分语音质量增强功能进行方向指示，用以指明是单向语音质量增强处理还是双向语音质量增强处理，呼叫服务器将语音质量增强处理的控制信息通过基于H.248的控制包传输至媒体网关。
基于H.248的控制包中承载的语音质量增强处理的控制信息可同时包括下述语音质量增强功能的一种或多种：打开或关闭AEC处理功能、电学回声抑制深度、打开或关闭背景噪声抑制、打开或关闭自动增益控制、打开或关闭自动本地听筒增益控制、打开或关闭语音增强识别、打开或关闭数据业务检测等。
另外，当控制包的语音质量增强的控制信息中包含有打开自动增益控制、打开自动本地听筒增益控制、打开语音增强识别或打开数据业务检测时，在控制信息中还应该指明该语音质量增强功能的生效方向，即自动增益控制的方向、自动本地听筒增益控制的方向、语音增强识别的方向、数据业务检测的方向。
控制信息中电学回声抑制深度可以为：16ms、32ms、48ms、64ms、96ms或128ms，呼叫服务器可以根据主叫侧/被叫侧的呼叫特性如主叫侧/被叫侧的局向信息、用户签约信息等来确定对主叫侧/被叫侧的语音流的回声抑制深度。
本发明基于H.248的控制包enhance ec package(增强回声抑制包)可以定义为如下形式：
PropertyID：aec(0x0001)
Type：integer
Possible values：为0表示关闭，为1表示打开。缺省值为关闭。
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：aec_direction(0x0002)
Type：integer
Possible values：为0表示对内(incoming)，为1表示对外(outcoming)，2为双向(both)，缺省值为对内。
Description：aec的方向
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：eec_depth(0x0003)
Type：integer
Possible values：为0表示由媒体网关根据实际需要自己选择电学回声抑制功能的深度，为1表示16ms EEC，为2表示32ms EEC，为3表示48ms EEC，为4表示64ms EEC，为5表示96msEEC，为6表示128msEEC，缺省值为0；
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：nr(0x0004)
Description：背景噪声抑止
Type：integer
Possible values：为0(off)表示关闭，为1(on)表示打开。缺省值为关闭。
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：nr_dir(0x0005)
Description：nr的作用方向
Type：Enumeration
Possible values：incoming(0)，outcoming(1)，both(2)。Default：both
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：ale(0x0006)
Description：自动本地听筒增益控制
Type：integer
Possible values：为0(off)表示关闭，为1(on)表示打开，缺省值为关闭。
Defined in：LocalControlDescriptor
Characteristics ：read/write
PropertyID：ale_dir(0x0007)
Description：ale的作用方向
Type：Enumeration
Possible values：为0表示对内(incoming)，为1表示对外(outcoming)，2为双向(both)，缺省值为双向。
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：alg(0x0008)
Description：自动增益控制
Type：Enumeration
Possible values：为0表示对内(incoming)，为1表示对外(outcoming)，2为双向(both)，缺省值为双向。
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：alg_dir(0x0009)
Description：alg的作用方向
Type：Enumeration
Possible values：为0表示对内(incoming)，为1表示对外(outcoming)，2为双向(both)，缺省值为双向。
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：vei(0x000A)
Description：语音增强识别
Type：integer
Possible values：为0(off)表示关闭，为1(on)表示打开，缺省值为关闭。
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：vei_dir(0x000B)
Description：vei的作用方向
Type：Enumeration
Possible values.：为0表示对内(incoming)，为1表示对外(outcoming)，2为双向(both)，缺省值为双向。
Defined in：LocalControlDeseriptor
Characteristics：read/write
PropertyID：dd(0x000C)
Description：数据业务检测
Type：integer
Possible values：为0(off)表示关闭，为1(on)表示打开。缺省值为关闭
Defined in：LocalControlDescriptor
Characteristics：read/write
PropertyID：dd_dir(0x000D)
Description：dd的作用方向
Type：Enumeration
Possible values：为0表示对内(incoming)，为1表示对外(outcoming)，2为双向(both)，缺省值为双向。
Defined in：LocalControlDescriptor
Characteristics：read/write
本发明通过扩展H.248协议接口，增加语音增强的种类，普通的电学EC(EEC)的打开和关闭通过原来的H.248.1定义的TDM Circuit Package(时分复用电路包)进行处理，在enhance ec package中扩展了电学EC的尾长，即电学回声抑制深度，在使用TDM Circuit Package打开电学EC的情况下，可使用enhanceec package定义的eec_depth参数指明其尾长。
在软交换和媒体网关之间，可以通过上面定义的基于H.248的控制包来实现呼叫服务器和媒体网关之间的语音增强处理控制信息传输，媒体网关根据呼叫服务器的控制信息为语音流分配相应的语音质量增强资源，媒体网关通过该语音质量增强资源对语音流进行相应的语音质量增强处理，从而，在不影响编解码器的密度和处理能力的情况下，达到提高语音质量的目的。
下面结合附图对本发明的技术方案进行详细说明。
在分离构架模式下的2G网络中，本发明的语音质量增强的实现方法如附图1所示。
在图1中，MS1和MS2均为移动用户，BSC1为MS1对应的基站控制器，BSC2为MS2对应的基站控制器。如果设定MS1为主叫用户、MS2为被叫用户，则BSC1为主叫侧基站控制器、BSC2为被叫侧基站控制器。
MS1和BSC1之间、MS2和BSC2之间为空中接口部分，并通过无线信道传递语音数据；媒体网关通过E1接口板分别和BSC1、BSC2连接，BSC1和BSC2之间采用TDM(时分复用)方式来传输语音流，而BSC和媒体网关通过E1进行连接，用来在BSC和MSC之间传递语音数据流。
由于BSC1和BSC2向媒体网关传输的语音流为已经采用了G.711的语音编码算法的语音流，而且，目前的EC芯片支持G.711的语音编码算法的语音流，因此，本发明的媒体网关可以根据呼叫服务器传输来的基于H.248的控制包中承载的控制信息直接为主叫侧、被叫侧分配VQE1(语音质量增强)、VQE2资源，以对媒体网关中E1接口板上承载语音业务数据流进行语音质量增强处理，其中，VQE1资源用于对MS1的语音流进行语音质量增强处理，VQE2资源用于对MS2的语音流进行语音质量增强处理，从而，达到提高主叫侧、被叫侧语音质量的目的。
在分离构架模式下的3G网络的R4组网中，由于需要EC芯片支持压缩语音，或将压缩语音转换为基于G.711的语音流后再进行语音质量增强处理，因此，建议在3G网络的R4组网中可以不支持语音质量增强处理功能。
在分离构架模式下的3G网络的R99组网中，本发明的语音质量增强的实现方法如附图2所示。
在图2中，RNC是3G网络中的无线网络控制器，设定RNC1是主叫侧无线用户终端对应的无线网络控制器，RNC2是被叫侧无线用户终端对应的无线网络控制器，无线用户终端和RNC之间通过无线接口传递语音数据。RNC和媒体网关之间的宽带接口板可以采用ATM的宽带接口板。
由于RNC1和RNC2向媒体网关传输的语音流没有采用G.711的语音编码算法，所以，本发明的媒体网关可以根据呼叫服务器传输来的基于H.248的控制包中承载的控制信息采用双TC和双AEC的方式分别对主叫侧到被叫侧、被叫侧到主叫侧的语音流进行语音质量增强处理，即本发明的媒体网关在RNC的IU接口到TDM方向增加对主叫侧、被叫侧的语音流的语音质量增强处理功能。具体方法为：媒体网关直接为主叫侧、被叫侧分配TC1、VQE1、TC2、VQE2资源，以对媒体网关中宽带接口板上承载的语音业务数据流进行解码转换及语音质量增强处理，其中，TC1资源用于将RNC1发送到媒体网关的主叫侧语音流解码成基于G.711的语音编码算法的语音流，然后，由VQE1资源对TC1解码后的语音流进行语音质量增强处理，TC2资源用于将RNC2发送到媒体网关的被叫侧语音流解码成基于G.711的语音编码算法的语音流，然后，由VQE2资源对TC2解码后的语音流进行语音质量增强处理，从而，达到提高主叫侧、被叫侧语音质量的目的。
在分离构架模式下的3G网络的R99网络与PSTN(公共电话交换网)互通时，本发明的语音质量增强方法如附图3所示。
图3中，RNC1是3G网络中的无线网络控制器，设定RNC1是主叫侧无线用户终端对应的无线网络控制器，无线用户终端和RNC1之间通过无线接口传递语音数据，PSTN用户为被叫侧用户。
RNC和媒体网关之间的宽带接口板可以采用ATM的宽带接口板。
由于RNC1向媒体网关传输的语音流没有采用G.711的语音编码算法，而且在PSTN侧没有声学回声，因此，本发明的媒体网关可以根据呼叫服务器传输来的基于H.248的控制包中承载的控制信息采用TC+VQE方式，对主叫侧到被叫侧的语音流进行EEC以外的语音质量增强处理，对被叫侧到主叫侧的语音流进行普通的EEC处理，具体方法为：媒体网关直接为主叫侧、被叫侧分配TC1、VQE1资源，设定VQE1资源中的每种语音增强技术的工作开关和工作方向。以对媒体网关中宽带接口板上承载的语音业务数据流进行解码转换、语音质量增强，其中，TC1资源用于将RNC1发送到媒体网关的主叫侧语音流解码成基于G.711的语音编码算法的语音流，然后，由VQE1资源按照工作参数设置对TC1解码后的语音流进行语音质量增强处理，从而，达到提高主叫侧、被叫侧语音质量的目的。
本发明提供的语音质量增强系统包括：控制端和执行端。控制端可以为呼叫服务器，执行端可以为媒体网关，如2G/3G网络中的媒体网关或NGN网络中的媒体网关等。
控制端主要用于在确定需要对语音流进行语音质量增强处理时，将需要进行的语音质量增强处理的控制信息承载于控制包中传输至语音质量增强处理的执行端。
控制端的功能由确定模块和控制信息下发模块来实现。
确定模块主要用于根据主叫侧/被叫侧的局向信息和/或用户签约信息确定需要对主叫侧/被叫侧的语音流进行语音质量增强处理，并通知控制信息下发模块。控制信息下发模块主要用于根据确定模块的通知将需要进行的语音质量增强处理的控制信息承载于控制包中传输至执行端。语音质量增强处理的控制信息的内容和控制包的消息结构如上述方法中的描述。
执行端主要用于根据其接收的控制包中承载的控制信息对语音流进行相应的语音质量增强处理。执行端的功能由资源分配模块、执行模块和转换模块来实现。
资源分配模块主要用于根据控制端传输来的控制包中承载的控制信息为执行模块分配相应的语音质量增强资源，如为主叫侧、被叫侧分配TC1、VQE1资源等，具体如上述方法中的描述。
执行模块主要用于根据资源分配模块为其分配的资源对外部传输来的基于G.711语音流或转换模块传输来的基于G.711语音流进行语音质量增强处理。具体过程如上述方法中的描述。
转换模块主要用于将外部传输来的语音流转换为基于G.711语音流，并传输至执行模块。
虽然通过实施例描绘了本发明，本领域普通技术人员知道，本发明有许多变形和变化而不脱离本发明的精神，希望所附的权利要求包括这些变形和变化。

一种语音质量增强方法和系统转让专利

申请号 : CN200510091269.6

文献号 : CN1917039B

文献日 : 2010-09-15

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 刘振华 , 王玉军

申请人 : 华为技术有限公司

摘要 :

权利要求 :

说明书 :

技术领域

背景技术

发明内容

附图说明

具体实施方式