音频信息网络数字化实时传输系统及方法转让专利

申请号 : CN201110153078.3

文献号 : CN102223406B

文献日 : 2014-01-08

本发明提供一种音频信息网络数字化实时传输系统及方法，应用于具有至少一音频信息发送端及一音频信息接收端的网络架构中，该方法主要是在音频信息发送端预设一丢包率阀值；然后将采集的音频信息作为音频信息源缓存，同时将音频信息源编码为音频包输出；接着将所述音频包通过网络传输至音频信息接收端；并检测网络传输所述音频包时的丢包率，当丢包率大于预设的丢包率阀值时，提取缓存的音频信息源；而后将该音频信息源识别为文字信息经由网络传输至音频信息接收端；当音频信息接收端接收到文字信息后将其识别为音频信息予以输出，以此解决现有技术中存在的网络带宽不足、不稳定，丢包率比较高，造成对方无法完整接收到音频信息等问题。

1.一种音频信息网络数字化实时传输系统，应用于具有至少一音频信息发送端及一音频信息接收端的网络架构中，其特征在于，所述系统至少包括：音频信息输入模块，设置在所述音频信息发送端，用于采集音频信息，并将采集到的音频信息作为音频信息源予以输出；

信息源缓存模块，设置在所述音频信息发送端，连接所述音频信息输入模块，用以接收到所述音频信息输入模块输出的音频信息源后予以缓存；

编码模块，设置在所述音频信息发送端，连接所述音频信息输入模块，用以将所述音频信息输入模块输出的音频信息源经编码为音频包后予以输出；

网络传输模块，设置在所述音频信息发送端，连接所述编码模块及音频信息接收端，用以将所述编码模块输出的音频包通过网络传输至所述音频信息接收端；

检测模块，设置在所述音频信息发送端，连接所述网络传输模块，预设有一丢包率阀值，用以实时检测所述网络传输模块将所述音频包传输给所述音频信息接收端时的丢包率，当检测到所述丢包率大于该丢包率阀值时，发出一音频识别指令；

音频识别模块，设置在所述音频信息发送端，连接所述检测模块、信息源缓存模块及网络传输模块，用以接收到所述检测模块输出的音频识别指令后，自所述信息源缓存模块中提取缓存的音频信息源，并将提取的音频信息源识别为文字信息后经由所述网络传输模块输出；

文字转音频识别模块，设置在所述音频信息接收端，经由网络连接所述网络传输模块，用以接收到所述网络传输模块输出的文字信息后，将该文字信息识别为音频信息予以输出；

音频信息输出模块，设置在所述音频信息接收端，连接所述文字转音频识别模块，用于将接收到的音频信息予以输出。

2.根据权利要求1所述的音频信息网络数字化实时传输系统，其特征在于：还包括一解码模块，设置在所述音频信息接收端，连接所述网络传输模块及音频信息输出模块，用于将所述网络传输模块传输的音频包进行解码为音频信息后传输至所述音频信息输出模块。

3.根据权利要求1所述的音频信息网络数字化实时传输系统，其特征在于：还包括一文字显示模块，设置在所述音频信息接收端，连接所述网络传输模块，用于将所述网络传输模块传输的文字信息转换为文字字幕予以显示。

4.根据权利要求3所述的音频信息网络数字化实时传输系统，其特征在于：所述网络传输模块还用以将所述音频识别模块输出的文字信息传送至所述文字显示模块。

5.一种音频信息网络数字化实时传输方法，应用于具有至少一音频信息发送端及一音频信息接收端的网络架构中，其特征在于，所述方法至少包括以下步骤：

1）于所述音频信息发送端预设一丢包率阀值；

2）采集音频信息；

3）将所述音频信息作为音频信息源予以缓存，同时将音频信息源编码为音频包予以输出；

4）将所述音频包通过网络传输至所述音频信息接收端；

5）实时检测网络传输所述音频包时的丢包率，当所述丢包率大于预设的丢包率阀值时，提取缓存的音频信息源；

6）将提取的音频信息源识别为文字信息经由网络传输至音频信息接收端；

7）音频信息接收端接收到所述文字信息后，将该文字信息识别为音频信息予以输出；

8）输出音频信息。

6.根据权利要求5所述的音频信息网络数字化实时传输方法，其特征在于：于步骤5）中，还包括当所述丢包率不大于预设的丢包率阀值时，所述音频信息接收端接收到网络传输的音频包后，将所述音频包解码为音频信息，并进至步骤8）。

7.根据权利要求5所述的音频信息网络数字化实时传输方法，其特征在于：于步骤7）中，还包括文字显示步骤，用于所述音频信息接收端接收到网络传输的文字信息后，将文字信息转换为文字字幕予以显示。

音频信息网络数字化实时传输系统及方法

技术领域

[0001] 本发明涉及一种音频信息的传输技术，特别是涉及一种音频信息网络数字化实时传输系统及方法。

背景技术

[0002] 随着应用于网络中的视音频编解码技术的提高，各种基于互联网络的远程音视频交互迅速普及，音频采集、编解码、传输等技术有很大的发展和进步，各种音频编解码标准，网络传输纠错能力都有成熟的应用。

[0003] 但是，在现有技术中，网络带宽依然是大多数网络流媒体交互应用的瓶颈，在多数应用场合中无法实时保证稳定的网络带宽，因此就会出现音频丢包，远程接收的音频信息不全导致声音断续、音质差无法分辨，甚至听不到声音。由于网络带宽不足或者带宽不稳定导致的经过编解码压缩后的音频信息无法完整的传输给接收方，进而造成通信中断，更有甚者，常会因为音频传递质量差而导致信息的接收方误判传递信息而造成更大损失。基于上述问题，目前的做法是借助其他的手段(例如邮件传递、拷贝等)将音频信息发送给接收方，这样不但降低的工作效率，同时大大提高了信息交互的时间成本。

发明内容

[0004] 鉴于以上所述现有技术的缺点，本发明的目的在于提供一种音频信息网络数字化实时传输系统及方法，以解决现有技术中存在的网络带宽不足、不稳定，丢包率比较高，造成对方无法完整接收到音频信息等问题。

[0005] 为实现上述目的及其他相关目的，本发明提供一种音频信息网络数字化实时传输系统，应用于具有至少一音频信息发送端及一音频信息接收端的网络架构中，其特征在于，所述系统至少包括：音频信息输入模块，设置在所述音频信息发送端，用于采集音频信息，并将采集到的音频信息作为音频信息源予以输出；信息源缓存模块，设置在所述音频信息发送端，连接所述音频信息输入模块，用以接收到所述音频信息输入模块输出的音频信息源后予以缓存；编码模块，设置在所述音频信息发送端，连接所述音频信息输入模块，用以将所述音频信息输入模块输出的音频信息源经编码为音频包后予以输出；网络传输模块，设置在所述音频信息发送端，连接所述编码模块及音频信息接收端，用以将所述编码模块输出的音频包通过网络传输至所述音频信息接收端；检测模块，设置在所述音频信息发送端，连接所述网络传输模块，预设有一丢包率阀值，用以实时检测所述网络传输模块将所述音频包传输给所述音频信息接收端时的丢包率，当检测到所述丢包率大于该丢包率阀值时，发出一音频识别指令；音频识别模块，设置在所述音频信息发送端，连接所述检测模块、信息源缓存模块及网络传输模块，用以接收到所述检测模块输出的音频识别指令后，自所述信息源缓存模块中提取缓存的音频信息源，并将提取的音频信息源识别为文字信息后经由所述网络传输模块输出；文字转音频识别模块，设置在所述音频信息接收端，经由网络连接所述网络传输模块，用以接收到所述网络传输模块输出的文字信息后，将该文字信息识别为音频信息予以输出；音频信息输出模块，设置在所述音频信息接收端，连接所述文字转音频识别模块，用于将接收到的音频信息予以输出。

[0006] 本发明的音频信息网络数字化实时传输系统还包括一解码模块，设置在所述音频信息接收端，连接所述网络传输模块及音频信息输出模块，用于将所述网络传输模块传输的音频包进行解码为音频信息后传输至所述音频信息输出模块。

[0007] 本发明的音频信息网络数字化实时传输系统还包括一文字显示模块，设置在所述音频信息接收端，连接所述网络传输模块，用于将所述网络传输模块传输的文字信息转换为文字字幕予以显示。

[0008] 本发明的音频信息网络数字化实时传输系统中，所述网络传输模块还用以将所述音频识别模块输出的文字信息传送至所述文字显示模块。

[0009] 本发明还提供一种音频信息网络数字化实时传输方法，应用于具有至少一音频信息发送端及一音频信息接收端的网络架构中，其特征在于，所述方法至少包括以下步骤：1)于所述音频信息发送端预设一丢包率阀值；2)采集音频信息；3)将所述音频信息作为音频信息源予以缓存，同时将音频信息源编码为音频包予以输出；4)将所述音频包通过网络传输至所述音频信息接收端；5)实时检测网络传输所述音频包时的丢包率，当所述丢包率大于预设的丢包率阀值时，提取缓存的音频信息源；6)将提取的音频信息源识别为文字信息经由网络传输至音频信息接收端；7)音频信息接收端接收到所述文字信息后，将该文字信息识别为音频信息予以输出；8)输出音频信息。

[0010] 本发明的音频信息网络数字化实时传输方法，于步骤5)中，还包括当所述丢包率不大于预设的丢包率阀值时，所述音频信息接收端接收到网络传输的音频包后，将所述音频包解码为音频信息，并进至步骤8)。

[0011] 本发明的音频信息网络数字化实时传输方法，于步骤7)中，还包括文字显示步骤，用于所述音频信息接收端接收到网络传输的文字信息后，将文字信息转换为文字字幕予以显示。

[0012] 如上所述，本发明主要是将音频信息在发送端通过预设阀值判断，当达到阀值时，将音频信息通过识别软件转换成文字信息，将文字信息流通过网络发送给接收方，接收方再根据设置情况，转换成音频输出或文字视频输出，进而解决了现有技术中存在的网络带宽不足、不稳定，丢包率比较高，造成对方无法完整接收到音频信息等问题，而且，应用本发明还具有以下有益效果：1.远程视频会议、远程监控指挥、视频教学等应用场景中，如果网络带宽不足或者网络时好时坏的情况下也能接收到对方传来的信息，信息可通过文字显示的方式或者语音方式表现出来；2.某些特殊应用中，例如不便接收声音的场合或者接收信息的场合声音过于嘈杂时可直接将语音转成文字传输。

附图说明

[0013] 图1显示为本发明的音频信息网络数字化实时传输系统原理框图。

[0014] 图2显示为本发明的音频信息网络数字化实时传输方法流程图。

具体实施方式

[0015] 以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在不背离本发明的精神下进行各种修饰或改变。

[0016] 请参阅图1，图1显示为本发明的音频信息网络数字化实时传输系统原理框图。需要说明的是，本实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

[0017] 如图所示，本发明提供一种音频信息网络数字化实时传输系统，应用于具有至少一音频信息发送端1及一音频信息接收端2的网络架构中，于本实施方式中，所述音频信息发送端1及音频信息接收端2可例如为设置在网络架构中的电脑、服务器、智能手机或者具有音频及视频信息处理功能的其他电子设备，但并不以此为限，需要说明的是，在本实施方式中，所述音频信息发送端1及音频信息接收端2的界定暂以音频信息单方向传输为例，而在实际的应用中，所述音频信息发送端1及音频信息接收端2的界定将可能依据实际的音频信息传输方向的改变而互换，所述音频信息网络数字化实时传输系统至少包括：音频信息输入模块11、信息源缓存模块12、编码模块13、网络传输模块14、检测模块15、音频识别模块16、文字转音频识别模块21、音频信息输出模块22、解码模块23、以及文字显示模块24。

[0018] 所述音频信息输入模块11设置在所述音频信息发送端1，用于采集音频信息，并将采集到的音频信息作为音频信息源予以输出。

[0019] 所述信息源缓存模块12设置在所述音频信息发送端1，连接所述音频信息输入模块11，用以接收到所述音频信息输入模块11输出的音频信息源后，将所述音频信息源予以缓存。

[0020] 所述编码模块13设置在所述音频信息发送端1，连接所述音频信息输入模块11，用以将所述音频信息输入模块11输出的音频信息源经编码为音频包后，将所述音频包予以输出。

[0021] 所述网络传输模块14设置在所述音频信息发送端1，连接所述编码模块13及音频信息接收端2，用以将所述编码模块13输出的音频包通过网络传输至所述音频信息接收端2；具体地，所述网络传输模块14将所述编码模块13输出的音频包通过网络传输到设置在所述音频信息接收端2的一解码模块23中，所述解码模块23连接所述网络传输模块14及音频信息输出模块22，用于将所述网络传输模块14传输的音频包进行解码为音频信息后传输至所述音频信息输出模块22。在本实施方式中，所述网络传输模块14还用以将所述音频识别模块16输出的文字信息传送至所述文字显示模块24，容后讲述。

[0022] 所述检测模块15设置在所述音频信息发送端1，连接所述网络传输模块14，该检测模块15中预设有一丢包率阀值，用以实时检测所述网络传输模块14将所述音频包传输给所述音频信息接收端2时的丢包率，当检测到所述丢包率大于该丢包率阀值时，发出一音频识别指令给音频识别模块16。

[0023] 所述音频识别模块16设置在所述音频信息发送端1，连接所述检测模块15、信息源缓存模块12及网络传输模块14，用以接收到所述检测模块15输出的音频识别指令后，自所述信息源缓存模块12中提取缓存的音频信息源，并将提取的音频信息源识别为文字信息后经由所述网络传输模块14输出。在实际的应用中，所述音频信息接收端2可以根据自身的需求而将所述文字信息作相应地处理，例如，将所述文字信息转换为音频信息予以输出，或者将所述文字信息予以视频字幕显示。

[0024] 所述文字转音频识别模块21设置在所述音频信息接收端2，经由网络连接所述网络传输模块14，用以接收到所述网络传输模块14输出的文字信息后，将该文字信息识别为音频信息予以输出。

[0025] 所述音频信息输出模块22设置在所述音频信息接收端2，连接所述文字转音频识别模块21，用于将接收到的音频信息予以输出。诚如上述，所述音频信息输出模块22还用于输出所述解码模块23将音频包解码完成的音频信息。

[0026] 所述文字显示模块24设置在所述音频信息接收端2，连接所述网络传输模块14，用于将所述音频识别模块16经由网络传输模块14传输的文字信息转换为文字字幕后予以显示。在具体的实施方式中，所述文字显示模块24例如为液晶显示屏或者LED显示屏等。

[0027] 于另一种实施方式中，本发明还提供一种音频信息网络数字化实时传输方法，请参阅图2，图2显示为本发明的音频信息网络数字化实时传输方法流程图，所述音频信息网络数字化实时传输方法应用于具有至少一音频信息发送端及一音频信息接收端的网络架构中，于本实施方式中，所述音频信息发送端及音频信息接收端可例如为设置在网络架构中的电脑、服务器、智能手机或者具有音频及视频信息处理功能的其他电子设备，但并不以此为限，需要说明的是，在本实施方式中，所述音频信息发送端及音频信息接收端的界定暂以音频信息单方向传输为例，而在实际的应用中，所述音频信息发送端及音频信息接收端的界定将可能依据实际的音频信息传输方向的改变而互换，如图所示，所述方法至少包括以下步骤：

[0028] 首先执行步骤S1，于所述音频信息发送端预设一丢包率阀值；接着执行步骤S2。

[0029] 在步骤S2中，令音频信息发送端开始采集音频信息；接着执行步骤S3。

[0030] 在步骤S3中，将所述音频信息发送端采集的音频信息作为音频信息源予以缓存，同时将所述音频信息源进行编码为音频包，再予以输出；接着执行步骤S4。

[0031] 在步骤S4中，令所述音频信息发送端将所述音频包通过网络传输至所述音频信息接收端；接着执行步骤S5。

[0032] 在步骤S5中，令所述音频信息发送端实时检测网络传输所述音频包时的丢包率，接着执行步骤S65。

[0033] 在步骤S6中，判断所述丢包率是否大于步骤S1中预设的丢包率阀值，若是则执行步骤S7，若否则转至步骤S12。

[0034] 在步骤S7中，提取缓存的音频信息源；接着执行步骤S8。

[0035] 在步骤S8中，将提取的音频信息源识别为文字信息经由网络传输至音频信息接收端；接着执行步骤S9或者执行步骤11。换言之，所述音频信息接收端可以根据自身的需求而将所述文字信息作相应地处理，例如，将所述文字信息转换为音频信息予以输出则执行步骤S9，或者将所述文字信息予以视频字幕显示则执行步骤11。

[0036] 在步骤S9中，所述音频信息接收端接收到所述文字信息后，将该文字信息识别为音频信息予以输出。接着执行步骤10。

[0037] 在步骤S10中，将接收到的音频信息予以输出。

[0038] 在步骤S11中，所述音频信息接收端接收到网络传输的文字信息后，将文字信息转换为文字字幕予以显示。在具体的实施方式中，例如通过液晶显示屏或者LED显示屏等显示装置将文字字幕予以显示。

[0039] 在步骤S12中，所述音频信息接收端接收到所述音频信息发送端通过网络传输知道音频包后，将所述音频包进行解码为音频信息，再进至步骤S10，将接收到的音频信息予以输出。

[0040] 综上所述，本发明与现有技术相比，主要是将音频信息在发送端通过预设阀值判断，当达到阀值时，将音频信息通过识别软件转换成文字信息，将文字信息流通过网络发送给接收方，接收方再根据设置情况，转换成音频输出或文字视频输出，进而解决了现有技术中存在的网络带宽不足、不稳定，丢包率比较高，造成对方无法完整接收到音频信息等问题，而且，应用本发明还具有以下有益效果：1.远程视频会议、远程监控指挥、视频教学等应用场景中，如果网络带宽不足或者网络时好时坏的情况下也能接收到对方传来的信息，信息可通过文字显示的方式或者语音方式表现出来；2.某些特殊应用中例如不便接收声音的场合或者接收信息的场合声音过于嘈杂时可直接将语音转成文字传输。所以，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

[0041] 上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

音频信息网络数字化实时传输系统及方法转让专利

申请号 : CN201110153078.3

文献号 : CN102223406B

文献日 : 2014-01-08

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 苏文波 , 桂天江

申请人 : 华平信息技术股份有限公司

摘要 :

权利要求 :

说明书 :