一种图像超大压缩传输方法及传输系统转让专利

申请号 : CN201110460855.9

文献号 : CN102523453B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周诠李晓博

申请人 : 西安空间无线电技术研究所

摘要 :

一种图像超大压缩传输方法及传输系统,根据需要发送的原灰度图像A确定K个类噪声图像B0i(i=1,...K),对原灰度图像A分别进行K个非线性映射FAi(i=1,...,K),变换为K幅映射图像Bi(i=1,...K),Bi对应的原图像为B0i(i=1,...K);计算K幅映射图像Bi与类噪声图像B0i的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像B0j以及非线性映射FAj;根据所需的压缩比R对类噪声图像B0j以及非线性变换FAj的参数信息进行编码,然后传输到接收端;接收端把数据接收后,提取出其中的参数,通过译码处理得到映射图像B0j;对类噪声图像B0j进行逆映射,得到原灰度图像A,对灰度图像A进行数据格式变换,得到用户希望的各种格式的图像。本发明适合于各种图像的大压缩比传输,同时具有保密性和信息隐藏性。

权利要求 :

1.图像超大压缩传输方法,其特征在于包括以下步骤:

(1)根据需要发送的原灰度图像A确定K个类噪声图像BOi(i=1,...K),类噪声图像BOi与原灰度图像A大小相同,其中,所述K为正整数,所述原灰度图像A的大小为M行、N列、Q比特量化,总比特数为MNQ;

(2)对原灰度图像A分别进行K个非线性映射FAi(i=1,...,K),变换为K幅映射图像Bi(i=1,...K),Bi对应的原图像为BOi(i=1,...K);计算K幅映射图像Bi与类噪声图像BOi的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像BOj以及非线性映射FAj;

(3)根据所需的压缩比R对类噪声图像BOj以及非线性变换FAj的参数信息进行编码,然后传输到接收端;

(4)接收端把数据接收后,提取出其中的参数,通过译码处理得到映射图像BOj;

(5)对类噪声图像BOj进行逆映射,得到原灰度图像A,对灰度图像A进行数据格式变换,得到用户希望的各种格式的图像;

所述步骤(1)中确定类噪声图像BOi的方法如下:

根据原始图像A大小,选择相同大小的类噪声图像,类噪声图像大小为M行、N列、Q比Q

特量化,总比特数为MNQ;类噪声图像的灰度值Gi为介于0到2-1之间的正整数,压缩比R为MNQ/Cdata,Cdata为类噪声图像传输所需参数的总比特数;

所述步骤(2)中的非线性映射FAi(i=1,...K)为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N1-N2-N3,N1为输入层节点数,N2为中间层节点数,N3为输出层节点数,选择K类图像Pi(i=1,...K),Pi与原始图像A同大小,每类图像对应一个目标图像BOi(i=1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像BOi相类似的图像Bi(i=1,...K),事先设定BOi与Bi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足(dB)时,算法结束,形成K套神经网络权值Wi(i=1,...K),其中Q为原始图像A的量化比特;当输入原灰度图像A时,K个多层前馈神经网络按照上述K套权值Wi(i=1,...K)进行非线性映射,得出K个不同的映射图像,选出其中峰值信噪比PSNR最大者作为最终的非线性映射Faj;

所述步骤(5)中的逆变换是非线性映射FBi(i=1,...K),该映射为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N4-N5-N6,N4为输入层节点数,N5为中间层节点数,N6为输出层节点数,选择K类图像BOi(i=1,...K),即BO1,BO2,...,BOK,BOi与原始图像A同大小,每类图像对应一个目标图像Pi(i=1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像Pi相类似的图像Ai(i=1,...K),事先设定Ai与Pi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足 (dB)时,算法结束,形成K套神经网络权值Vi(i=1,...K),其中Q为原始图像A的量化比特,当输入类噪声图像BOj时,多层前馈神经网络按照上述K套权值中峰值信噪比PSNR最大者对应的第j套权值Vj进行非线性映射,得出第j个图像,即为恢复的原始图像A。

2.根据权利要求1所述的图像超大压缩传输方法,其特征在于:所述类噪声图像BOi为一类伪随机图像,基于Logistic混沌映射产生,其模型为Xn+1=μXn(1-Xn),n∈{0,1,

2,...};

其中,μ称为分支参数,3.5699456<μ≤4;X0为初值,0

3.根据权利要求1所述的图像超大压缩传输方法,其特征在于:对步骤(3)中所述的类噪声图像BOj以及非线性变换FAj的传输参数进行编码,编码后总数据量为H字节,压缩比R=MNQ/(8H),其中H=H1+H2+H3+H4+H5+H6,Hi(i=1,...6)为正整数;传输参数编码格式具体如下:起始位为H1,图像序号j为H2,图像大小M,N,Q为H3,图像参数μ,X0为H4,网络序号为H5,预留数据为H6;其中,起始位、图像序号、图像大小、图像参数、预留数据为类噪声图像BOj的传输参数,网络序号为非线性变换FAj的传输参数。

4.图像超大压缩传输系统,其特征在于:包括发送端处理模块和接收端处理模块,所述的发送端处理模块包括图像输入单元、图像映射单元以及图像参数编码单元;所述的接收端处理模块包括图像参数译码单元、图像逆映射单元以及图像输出单元;

图像输入单元:将选好的K个类噪声图像BOi(i=1,...K)预先存储在图像输入单元,输入原始灰度图像A,形成非线性映射所需要的输入数据;所述类噪声图像BOi与原灰度图像A大小相同,其中,所述K为正整数,所述原灰度图像A的大小为M行、N列、Q比特量化、总比特数为MNQ;确定类噪声图像BOi的方法如下:根据原始图像A大小,选择K个相同大Q小的类噪声图像BOi(i=1,2,...,K),类噪声图像的灰度值Gi为介于0到2-1之间的正整数,压缩比R为MNQ/Cdata,Cdata为类噪声图像传输所需参数的总比特数;

图像映射单元:对原灰度图像A分别进行K个非线性映射FAi(i=1,...K),变换为K幅映射图像Bi(i=1,...K),Bi对应的原图像为BOi(i=1,...K);计算K幅映射图像Bi与类噪声图像BOi的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像BOj以及非线性映射FAj;非线性映射FAi(i=1,...K)为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N1-N2-N3,N1为输入层节点数,N2为中间层节点数,N3为输出层节点数,选择K类图像Pi(i=1,...K),Pi与原始图像A同大小,每类图像对应一个目标图像BOi(i=1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像BOi相类似的图像Bi(i=1,...K),事先设定BOi与Bi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足(dB)时,算法结束,形成K套神经网络权值Wi(i=1,...K),其中Q为原始图像A的量化比特;当输入原灰度图像A时,K个多层前馈神经网络按照上述K套权值Wi(i=1,...K)进行非线性映射,得出K个不同的映射图像,选出其中峰值信噪比PSNR最大者作为最终的非线性映射FAj;

图像参数编码单元:根据所需的压缩比R对类噪声图像BOj以及非线性变换FAj的传输参数信息进行编码,然后传输到接收端的图像参数译码单元;

图像参数译码单元:接收图像参数编码单元的信息,并通过译码处理提取出其中的参数,通过计算得到映射图像BOj;

图像逆映射单元:对计算出的类噪声图像BOj进行逆映射FBj,逆映射FBj与非线性映射FAj对应,得到恢复后图像数据A;逆变换是非线性映射FBi(i=1,...K),该映射为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N4-N5-N6,N4为输入层节点数,N5为中间层节点数,N6为输出层节点数,选择K类图像BOi(i=1,...K),即BO1,BO2,...,BOK,BOi与原始图像A同大小,每类图像对应一个目标图像Pi(i=

1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像Pi相类似的图像Ai(i=1,...K),事先设定Ai与Pi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足 (dB)时,算法结束,形成K套神经网络权值Vi(i=1,...K),其中Q为原始图像A的比特量化;当输入类噪声图像BOj时,多层前馈神经网络按照上述K套权值中峰值信噪比PSNR最大者对应的第j套权值Vj进行非线性映射,得出第j个图像,即为恢复的原始图像A。

图像输出单元:对恢复后图像数据A,按照用户希望的图像数据格式输出。

说明书 :

一种图像超大压缩传输方法及传输系统

技术领域

[0001] 本发明涉及一种图像通信的方法与系统,特别涉及一种图像数据的传输方法与系统,属于通信(如数据通信技术等)领域。

背景技术

[0002] 随着科技的发展,人们对高分辨率图像的需求越来越多,总在想方设法提高图像分辨率。但是随着图像分辨率的提高,数据量越来越大,给数据传输和存储带来越来越大的压力,采用大压缩比的数据压缩是非常必要的。但是现有的图像压缩方法和设备,能得到的压缩比在几倍-几十倍之间,很少有能达到“成千上万”倍的压缩方法,即使是几十倍-100倍以上的压缩方法也较少,虽然对个别图像也许压缩比可以达到100倍以上。
[0003] 现有压缩技术标准,是基于图像的相关性进行压缩的,或者是对有冗余的图像进行压缩的,如果图像(数据)相关性不强,则无法进行有效的压缩。例如,对类似白噪声的图像是无法进行压缩的,有时甚至会带来数据的扩张(增加)。现有技术是把图像先进行各种变换,主要是DCT变换和小波变换(DCT,WT),如JPEG以及JPEG2000压缩算法。现有技术没有把图像经过多个非线性映射变为类噪声图像再进行传输的。

发明内容

[0004] 本发明的技术解决问题是:克服现有技术的不足,提供一种超大压缩比的传输方法及传输系统,适合于各种图像的大压缩比传输,同时具有保密性和信息隐藏性。
[0005] 本发明的技术解决方案是:图像超大压缩传输方法,其特征在于包括以下步骤:
[0006] (1)根据需要发送的原灰度图像A确定K个类噪声图像B0i(i=1,...K),类噪声图像B0i与原灰度图像A大小相同,其中,所述K为正整数,所述原灰度图像A的大小为M行、N列、Q比特量化,总比特数为MNQ;
[0007] (2)对原灰度图像A分别进行K个非线性映射FAi(i=1,...,K),变换为K幅映射图像Bi(i=1,...K),Bi对应的原图像为B0i(i=1,...K);计算K幅映射图像Bi与类噪声图像B0i的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像B0j以及非线性映射FAj;
[0008] (3)根据所需的压缩比R对类噪声图像B0j以及非线性变换FAj的参数信息进行编码,然后传输到接收端;
[0009] (4)接收端把数据接收后,提取出其中的参数,通过译码处理得到映射图像B0j;
[0010] (5)对类噪声图像B0j进行逆映射,得到原灰度图像A,对灰度图像A进行数据格式变换,得到用户希望的各种格式的图像。
[0011] 所述步骤(1)中确定类噪声图像B0i的方法如下:
[0012] 根据原始图像A大小,选择相同大小的类噪声图像,类噪声图像大小为M行、N列、QQ比特量化,总比特数为MNQ;类噪声图像的灰度值Gi为介于0到2-1之间的正整数,压缩比R为MNQ/Cdata,Cdata为类噪声图像传输所需参数的总比特数。
[0013] 所述步骤(2)中的非线性映射FAi(i=1,...K)为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N1-N2-N3,N1为输入层节点数,N2为中间层节点数,N3为输出层节点数,选择K类图像Pi(i=1,...K),Pi与原始图像A同大小,每类图像对应一个目标图像B0i(i=1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像B0i相类似的图像Bi(i=1,...K),事先设定B0i与Bi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足要求时,算法结束,形成K套神经网络权值Wi(i=1,...K),最小均方误差MSE与PSNR的关系如下:
[0014]
[0015] Q为原始图像A的量化比特;当输入原灰度图像A时,K个多层前馈神经网络按照上述K套权值Wi(i=1,...K)进行非线性映射,得出K个不同的映射图像,选出其中峰值信噪比PSNR最大者作为最终的非线性映射FAj。
[0016] 所述类噪声图像B0i为一类伪随机图像,基于Logistic混沌映射产生,其模型为Xn+1=μXn(1-Xn),n∈{0,1,2,...};
[0017] 其中,μ称为分支参数,3.5699456<μ≤4;X0为初值,0<X0<1;给出μ值和初值X0,即可计算产生Xn+1;对Xn+1进行判决即可得到0-1序列Si(i=1,...MNQ),当Xn+1≥0.5时,Si=1;0<Xn+1<0.5,Si=0;以Q比特对序列Si进行划分,Q比特通过二进制到十进制的转换形成灰度值,从而得到一幅类噪声图像;再给出另外的μ值和初值X0,即可得到其余类噪声图像,这样便形成K幅类噪声图像B0i,即B01,B02,...,B0k。
[0018] 对步骤(3)中所述的类噪声图像B0j以及非线性变换FAj的传输参数进行编码,编码后总数据量为H字节,总数据量Cdata为8H比特,压缩比R=MNQ/(8H),其中H=H1+H2+H3+H4+H5+H6,Hi(i=1,...6)为正整数;传输参数编码格式具体如下:
[0019] 表1传输参数编码格式(单位:字节)
[0020]
[0021] 所述步骤(5)中的逆变换是非线性映射FBi(i=1,...K),该映射为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N4-N5-N6,N4为输入层节点数,N5为中间层节点数,N6为输出层节点数,选择K类图像B0i(i=1,...K),即B01,B02,...,B0K,B0i与原始图像A同大小,每类图像对应一个目标图像Pi(i=1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像Pi相类似的图像Ai(i=1,...K),事先设定Ai与Pi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足要求时,算法结束,形成K套神经网络权值Vi(i=1,...K),最小均方误差MSE与PSNR的关系如下:
[0022]
[0023] Q为原始图像A的比特量化;当输入类噪声图像B0j时,多层前馈神经网络按照上述K套权值中峰值信噪比PSNR最大者对应的第j套权值Vj进行非线性映射,得出第j个图像,即为恢复的原始图像A。
[0024] 图像超大压缩传输系统,其特征在于:包括发送端处理模块和接收端处理模块,所述的发送端处理模块包括图像输入单元、图像映射单元以及图像参数编码单元;所述的接收端处理模块包括图像参数译码单元、图像逆映射单元以及图像输出单元;
[0025] 图像输入单元:将选好的K个类噪声图像B0i(i=1,...K)预先存储在图像输入单元,输入原始灰度图像A,形成非线性映射所需要的输入数据;所述类噪声图像B0i与原灰度图像A大小相同,其中,所述K为正整数,所述原灰度图像A的大小为M行、N列、Q比特量化、总比特数为MNQ;
[0026] 图像映射单元:对原灰度图像A分别进行K个非线性映射FAi(i=1,...K),变换为K幅映射图像Bi(i=1,...K),Bi对应的原图像为B0i(i=1,...K);计算K幅映射图像Bi与类噪声图像B0i的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像B0j以及非线性映射FAj;
[0027] 图像参数编码单元:根据所需的压缩比R对类噪声图像B0j以及非线性变换FAj的传输参数信息进行编码,然后传输到接收端的图像参数译码单元;
[0028] 图像参数译码单元:接收图像参数编码单元的信息,并通过译码处理提取出其中的参数,通过计算得到映射图像B0j;
[0029] 图像逆映射单元:对计算出的类噪声图像B0j进行逆映射FBj,逆映射FBj与非线性映射FAj对应,得到恢复后图像数据A;
[0030] 图像输出单元:对恢复后图像数据A,按照用户希望的图像数据格式输出。
[0031] 本发明与现有技术相比的优点在于:
[0032] 传统的图像数据压缩传输方法及系统,是对原图像直接进行数据压缩(时域、频域等变换)再进行传输,或者对图像进行分块处理,压缩后进行传输。本发明是把图像变为另外的类噪声图像,不对图像本身进行压缩编码传输而是对参数进行传输,与图像数据常规压缩方法有着本质的不同,效果极其明显。
[0033] 压缩比R可以事先设定,恢复图像与原始图像的PSNR可达到或优于目前实际使用的压缩系统性能。
[0034] (1)本发明采用变换处理方法,把一幅图像变换成另外的类噪声图像,只传输噪声图像的有关参数。变换本身就具有一定保密效果。
[0035] (2)本发明在传输前采用变换处理方法,把一幅图像先进行变换,采用多个前馈神经网络形成K个非线性映射进行变换。
[0036] (3)本发明的压缩效果事先是可以知道的,因为图像变换过程的精度是可以通过学习训练事先设定的。
[0037] (4)本发明的传输系统,可以达到目前常规压缩传输系统无法达到的超大压缩比。

附图说明

[0038] 图1为本发明传输系统框图;
[0039] 图2a为图像映射例子图一;
[0040] 图2b为图像映射例子图二;
[0041] 图2c为图像映射例子图三;
[0042] 图2d为图像映射例子图四;
[0043] 图3为本发明图像映射原理图;
[0044] 图4为图像逆映射原理图。

具体实施方式

[0045] 本发明的图像超大压缩传输方法与系统是为了解决大容量、高分辨率图像安全传输问题而提出的,超大压缩是指压缩比远远大于目前常规压缩方法所能达到的压缩比,比如100倍以上-几百-几千倍-几万以上压缩比。本发明采用发端先对图像进行非线性变换,变成另一幅事先知道生成规律的类噪声图像,不传输该图像,而是传输产生该噪声图像的参数或表达式,避免了大数据量的传输问题,极大提高了压缩比,压缩比可以达到成千上万倍,而压缩质量可以达到用户要求。
[0046] 本发明采用的方案是把原始图像先转换为类噪声图像,该类噪声图像在技术上能用一些参数描述;再对这些参数进行编码传输,在收端经过译码处理、逆变换恢复出原始图像。具体实现步骤如下:
[0047] (1)根据需要发送的原灰度图像A确定K个类噪声图像B0i(i=1,...K),类噪声图像B0i与原灰度图像A大小相同,其中,所述K为正整数,所述原灰度图像A的大小为M行、N列、Q比特量化、总比特数为MNQ;并将原灰度图像A的格式转换为非线性映射FAi需要格式的图像数据;
[0048] 确定类噪声图像B0i的方法如下:
[0049] 根据原始图像A大小,选择相同大小的类噪声图像,大小为M行、N列、Q比特量化,Q类噪声图像的灰度值为介于0到2-1之间的正整数。
[0050] 类噪声图像传输参数的总比特数Cdata远远小于原灰度图像A的总比特数MNQ,压缩比R为MNQ/Cdata。
[0051] 在具体实现时,可以采用伪随机图像作为类噪声图像B0i,基于Logistic混沌映射产生。近年来,混沌理论在国内外发展十分迅速。混沌理论是指系统从有序突然变为无序状态的一种演化理论。由混沌系统产生的混沌序列具有确定性、伪随机性、非周期性和不收敛等性质,并且对初始值有极其敏感的依赖性。比较典型的有一维Logistic映射等。
[0052] 图2a-图2d所示的,为一种示例图,将lena_128.bmp图像A映射为chaos图像_128.bmp图像B。一种神经网络结构如下:输入256,隐含层256,输出256。神经网络结构可以为其他结构,如输入64,隐含层64,输出64。如输入64,隐含层32,输出64等。
[0053] Logistic混沌映射的模型为Xn+1=μXn(1-Xn),n∈{0,1,2,...}[0054] 其中,μ称为分支参数,3.5699456<μ≤4,Logistic映射工作于混沌状态。X0为初值,0<X0<1,给出μ值和初值X0,即可计算产生Xn+1。对Xn+1进行判决即可得到0-1序列Si(i=1,...MNQ),(当Xn+1≥0.5,Si=1;0<Xn+1<0.5,Si=0),以Q比特对序列Si进行划分,Q比特通过二进制到十进制的转换形成灰度值,从而得到一幅类噪声图像B0;再给出另外的μ的值和初值X0,即可得到其余类噪声图像B0,这样便形成K幅类噪声图像B0i(i=1,...K)。
[0055] (2)对原灰度图像A分别进行K个非线性映射FAi(i=1,...K),变换为K幅映射图像Bi(i=1,...K),Bi对应的原图像为B0i(i=1,...K);计算K幅映射图像Bi与类噪声图像B0i的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像B0j以及非线性映射FAj;
[0056] 所述步骤(2)中的非线性映射FAi(i=1,...K)为基于K个多层前馈神经网络,每个网络结构为N1-N2-N3,N1为输入层节点数,N2为中间层节点数,N3为输出层节点数。选择K类图像如P1,...,PK(与图像A大小相同),每类图像对应一个目标图像B0i(i=
1,...K),即P1对应的目标图像为B01,P2对应的目标图像为B02,...,PK对应的目标图像为B0K,采用BP(反向传播)类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像B0i相类似的图像Bi(i=1,...K),事先设定B0i与Bi之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足要求时,算法结束,形成K套神经网络权值Wi(i=
1,...K)。PSNR根据要求设定,一般大于40dB。当图像A输入时,网络对A按照得到的K套权值Wi进行非线性映射FAi,得出映射图像Bi,选出其中PSNR最大者作为最终的非线性映射FAj。
[0057] (3)根据所需的压缩比R对类噪声图像B0j以及非线性映射FAj的传输参数进行编码,然后传输到接收端。
[0058] (4)接收端把数据接收后,通过译码处理提取出其中的参数,通过计算得到映射图像B0j;
[0059] (5)对计算出的类噪声图像B 0j进行逆映射FBj(与非线性变换FAj对应),得到原灰度图像A。
[0060] 逆映射是非线性映射FBi(i=1,...K),该映射为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N4-N5-N6,N4为输入层节点数,N5为中间层节点数,N6为输出层节点数,选择K类图像B01,B02,...,B0i,...,B0K(B0i与原始图像A同大小),每类图像对应一个目标图像Pi(i=1,...K),即B01对应的目标图像为P1,B02对应的目标图像为P2,...,B0K对应的目标图像为PK,采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像Pi相类似的图像Ai(i=1,...K),事先设定Pi与Ai之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足要求时,算法结束,形成K套神经网络权值Vi(i=1,...K),最小均方误差MSE与PSNR的关系如下:
[0061]
[0062] Q为原始图像A的量化比特;当输入类噪声图像B0j时,多层前馈神经网络按照上述K套权值中的第j套权值Vj(PSNR最大者对应的权值)进行非线性映射,得出第j个图像Aj,即恢复的原始图像A。
[0063] 对原灰度图像A进行数据格式变换,得到用户所希望的不同格式的灰度图像。图像有原始格式(raw),bmp格式,tif格式,jpg格式等,目前有许多图像格式转换软件。
[0064] 如图1所示,本发明的图像超大压缩传输系统包括发送端处理模块和接收端处理模块,所述的发送端处理模块包括图像输入单元、图像映射单元以及图像参数编码单元组成;所述的接收端处理模块包括图像参数译码单元、图像逆映射单元以及图像输出单元组成;
[0065] 图像输入单元:将预先选好的K个类噪声图像B0i(i=1,...K)存储在预处理单元,输入灰度图像A,形成非线性映射FAi所需要的输入数据;所述类噪声图像B0i与原灰度图像A大小相同,其中,所述K为正整数,所述原灰度图像A的大小为M行、N列、Q比特量化、总比特数为MNQ;
[0066] 图像映射单元:对原灰度图像A分别进行K个非线性映射FAi(i=1,...K),变换为K幅映射图像Bi(i=1,...K),即FA1对应的映射图像为B1,FA2对应的映射图像为B2,...,FAK对应的映射图像为BK,Bi对应的类噪声图像为B0i(i=1,...K);计算K幅映射图像Bi与类噪声图像B0i的峰值信噪比PSNR,选出峰值信噪比PSNR最大值对应的类噪声图像B0j以及非线性映射FAj;
[0067] 图像参数编码单元:根据所需的压缩比R对类噪声图像B0j以及非线性变换FAj的传输参数信息进行编码,然后传输到接收端的图像参数译码单元;
[0068] 本发明的一种实施例中起始位、图像序号、图像大小、图像参数、预留数据为类噪声图像B0j的传输参数,网络序号为非线性变换FAj的传输参数。
[0069] 图像参数译码单元:接收图像参数编码单元的信息,并通过译码处理提取出其中的参数,通过计算得到映射图像B0j。
[0070] 接收端收到传输参数H1,...,H6之后,根据起始位H1按顺序找到H2,H3,H4等。根据类噪声图像生成规律进行计算,得到映射图像B0j。具体过程如下:
[0071]
[0072] 根据H4确定μ值和初值X0,根据H3确定的M、N、Q,根据H2确定的图像Bi序号j,也就是图像B0i的序号j,即B0j。
[0073] 计算Xn+1=μXn(1-Xn),n∈{0,1,2,...}
[0074] 对Xn+1进行判决即可得到0-1序列Si(i=1,...MNQ),(当Xn+1≥0.5,Si=1;0<Xn+1<0.5,Si=0),以Q比特对序列Si进行划分,Q比特通过二进制到十进制的转换形成灰度值,从而得到一幅类噪声图像B0j;
[0075] 图像逆映射单元:对计算出的类噪声图像B0j进行逆变换,得到原灰度图像A。
[0076] 图3所示为图像非线性映射原理图,网络结构为N1-N2-N3。
[0077] 本发明采用非线性映射的方法,采用神经网络进行处理。首先对图像进行分块m×n,得到含L(=m×n)个数据的矢量,m≤M,n≤N,m与n为正整数。构造多层前馈神经网络(三层BP网络),输入层N1个神经元、隐层N2个神经元,输出层N3个神经元。采用BP类算法进行学习,从K类输入图像Pi(i=1,...K)得到K类输出图像B0i(i=1,...K),形成K套网络加权值Wi(i=1,...K)。
[0078] 多层前馈神经网络通过对样本的输入,不断的调整各网络节点的连接权值,从而得到样本的输入与输出的非线性关系。最常用的多层前馈神经网络算法一反向传播BP(Back Propagation)算法,是通过代价函数的最小化过程来完成输入到输出的非线性映射,其基本思想是:如果利用已有的权重正向传播得不到期望的输出,则反向传播,反复修改(迭代)各网络节点的权重,逐步减小代价函数,直到达到预先设定的要求,一般为代价函数小于某一相当小的正数或迭代时不再减少,而是反复振荡为止。
[0079] 峰值信噪比 MSE为两幅图像的最小均方误差。
[0080] PSNR可以根据系统要求设定,一般可以设为40dB或以上。
[0081] 对类噪声图像B0j传输参数(μ,初值X0)进行编码,参数编码后总数据量为H字节,总数据量Cda ta为8H比特。H=H1+H2+H3+H4+H5+H6,由于Cdata很小,因此压缩比R=MNQ/Cdata很大。格式如下:
[0082] 表1参数编码格式(单位:字节)
[0083]
[0084] 表2参数编码例子一(单位:字节)
[0085]
[0086] H=32,Cdata=256比特
[0087] 表2对应的压缩比R可计算如下:
[0088] R=QMN/(8H)=8MN/(8H)=MN/H
[0089] M=1024,N=1024,H=32,则R=32768倍,3万多倍压缩!
[0090] M=256,N=256,H=32,R=2048倍,2千多倍压缩!
[0091] M=128,N=128,H=32,则R=512倍,500多倍压缩!
[0092] 表3参数编码例子二(单位:字节)
[0093]
[0094] H=64字节,Cdata=512比特。
[0095] 表3对应压缩比R可计算如下:
[0096] R=QMN/(8H)=8MN/(8H)=MN/H
[0097] M=1024,N=1024,H=64,则R=16384倍,1万多倍压缩!
[0098] M=256,N=256,H=64,R=1024倍,1千多倍压缩!
[0099] M=128,N=128,H=64,则R=256倍,200多倍压缩!
[0100] 图4所示为图像逆映射原理图,网络结构为N4-N5-N6。
[0101] 逆映射也是非线性映射FBi(i=1,...K),该映射为K个基于多层前馈神经网络的非线性映射,每个多层前馈神经网络的网络结构为N4-N5-N6,N4为输入层节点数,N5为中间层节点数,N6为输出层节点数。选择K类图像B0i(i=1,...K),即B01,B02,...,B0i,...,B0K,每类图像对应一个目标图像Pi(i=1,...K),采用反向传播BP类算法对K个神经网络分别进行学习,每类图像得到一个与目标图像Pi相类似的图像Ai(i=1,...K),事先设定Pi与Ai之间的峰值信噪比PSNR或最小均方误差MSE,当PSNR或MSE满足要求时,算法结束,形成K套神经网络权值Vi(i=1,...K),最小均方误差MSE与PSNR的关系如下:
[0102]
[0103] Q为原始图像A的量化比特;当输入类噪声图像B0j时,多层前馈神经网络按照上述K套权值中的第j套权值Vj(PSNR最大者对应的权值)进行非线性映射,得出第j个图像Aj,即恢复的原始图像A。
[0104] 本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。