基于结构字典的分块图像压缩感知重建方法转让专利

申请号 : CN201210155980.3

文献号 : CN102708576B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨淑媛焦李成陈义光刘芳侯彪王爽马文萍齐智峰谢冬梅

申请人 : 西安电子科技大学

摘要 :

本发明公开了一种基于结构字典的分块图像压缩感知重建方法,克服了现有技术中分块压缩感知重建时由于单一字典对具有不同结构的图像块不能最稀疏的表示,而导致重建效果不理想的缺点,实现步骤为:(1)构造训练样本库;(2)图像块分类;(3)训练结构字典;(4)构造观测矩阵;(5)观测图像块;(6)结构字典重建;(7)获取重建误差;(8)重建图像;(9)输出重建图像。采用基于图像块在所有结构字典下误差的加权求和方法进行重建,明显的提高了重建质量。

权利要求 :

1.一种基于结构字典的分块图像压缩感知重建方法,包括如下步骤:(1)获取训练样本:

1a)从数据库中选取具有平滑特征、不规则特征及不同的方向信息的多幅原图像,分别对这些图像进行下采样,得到下采样图像;

1b)将选取的多幅原图像与数据库中剩余的原图像,构成训练样本库;

1c)将训练样本库中的图像按同样大小进行不重叠的逐次分块,随机抽取10000~

40000个训练图像块,并将其按列依次拉为列向量,作为训练样本;

(2)图像块分类:

2a)分别计算各个训练样本的方差;

2b)将方差小于平滑阈值的图像块归为平滑类图像块,方差大于平滑阈值的图像块归为非平滑类图像块;

2c)根据梯度计算方法,分别计算各个非平滑类图像块中各像素水平方向与垂直方向的梯度,得到梯度矩阵;

2d)对梯度矩阵进行奇异值分解,得到左酉矩阵、对角矩阵和右酉矩阵;

2e)计算对角矩阵中的两个奇异值的差与和,并计算两者的比值;

2f)将比值与不规则阈值进行比较,若比值大于不规则阈值,则将非平滑类图像块归为规则类图像块,否则,归为不规则类图像块;

所述的不规则阈值是指,当概率密度函数p的曲线下降到水平位置时的变量值R即为不规则阈值:按照下式计算变量值R,其中,p为独立同分布白高斯矩阵条件数的概率密度函数,R为概率密度函数的变量值,N为图像块中像素点数;

2g)利用下式,计算规则类图像块指向值:其中,θ为规则类图像指向值,v1和v2为主分量,分别代表左、右酉矩阵的列向量;

2h)将-90°~90°指向的取值范围均分为12个离散区间,将规则类图像的指向值在同一区间内对应的规则类图像块归为一类;

(3)训练分类字典:

3a)将分类得到的平滑类图像块、不规则类图像块及12个不同指向的图像块作为训练样本;

3b)进行字典训练初始化设置;

3c)利用K-Singular Value Decomposition(KSVD)方法进行字典训练,得到对应于各类图像块训练样本的分类冗余字典;

3d)根据余弦基公式,构造余弦基字典;

所述的余弦基公式如下:

C=λkcos(πk(x cosθ+y cosθ))其中,C为余弦基值,k表示余弦基方向变换的频率,在0~1取值范围内取16个均匀分布的离散值,λk表示余弦基的幅度,当k取值为0或1时,λk取值1,否则,λk取值θ表示余弦基变换的方向,在0~π取值范围内取16个均匀分布的离散值,x、y分别表示余弦基在水平方向和垂直方向像素点的值;

3e)将分类冗余字典与余弦基字典组成结构字典;

(4)构造观测矩阵:

4a)根据压缩感知的低采样特性,在0.2~0.4范围内选择采样率;

4b)将采样率与图像块像素数目相乘,得到对应采样率的观测矩阵维数

4c)随机初始化相应维数的高斯随机矩阵作为观测矩阵;

(5)观测图像块:

5a)对原始图像按同样大小进行不重叠的逐次分块处理,并将图像块按列依次拉为列向量,得到原始图像矩阵;

5b)利用观测矩阵对原始图像矩阵进行相乘投影,得到观测值矩阵;

(6)结构字典重建:

6a)将观测矩阵与步骤(3)所得的结构字典逐个对应相乘,得到恢复矩阵;

6b)利用正交匹配追踪方法进行分块压缩感知图像重建,得到重建解;

6c)将步骤(3)所得的结构字典与重建解相乘,得到重建图像矩阵;

(7)获取重建误差:

将原始图像矩阵与在步骤(3)所得的结构字典的逐个重建图像矩阵的差平方求和,获得重建误差;

(8)重建图像:

8a)将重建误差作为权重,对重建图像矩阵进行加权求和,得到最终重建图像矩阵;

8b)将最终重建图像矩阵进行反分块处理,得到最终的重建图像;

(9)输出重建图像。

2.根据权利要求1所述的基于结构字典的分块图像压缩感知重建方法,其特征在于,步骤2b)所述的平滑阈值为10~30。

3.根据权利要求1所述的基于结构字典的分块图像压缩感知重建方法,其特征在于,步骤2c)所述的梯度计算方法是指,用非平滑类图像块中每个像素点的水平分量与垂直分量,分别减去其相邻像素点的水平分量与垂直分量,得到该像素点的梯度,所有像素点的梯度构成一个梯度矩阵。

4.根据权利要求1所述的基于结构字典的分块图像压缩感知重建方法,其特征在于,步骤3b)所述的字典训练初始化是指,将初始字典设为冗余离散余弦字典的训练字典,稀疏度设为6,原子数目为256,迭代次数为30。

5.根据权利要求1所述的基于结构字典的分块图像压缩感知重建方法,其特征在于,步骤6b)所述的正交匹配追踪方法是指,在字典中贪婪的选取与重建信号最相关的原子,对所选原子进行加权求和重建原始信号。

6.根据权利要求1所述的基于结构字典的分块图像压缩感知重建方法,其特征在于,步骤8b)所述的反分块处理是指,将最终重建图像矩阵的列向量恢复为图像块,再将图像块逐个排列组成重建图像。

说明书 :

基于结构字典的分块图像压缩感知重建方法

技术领域

[0001] 本发明属于图像处理技术领域,更进一步涉及一种压缩感知理论框架下的基于结构字典的分块压缩感知图像重建方法,可用于压缩观测下各类自然图像的高质量重构。

背景技术

[0002] 为了得到高分辨率的图像,传统的图像获取方法中需要增加传感器的数目,这会增大成像设备的成本与体积。压缩感知理论是近几年在信号处理领域发展起来的一种新的信息获取与处理方法,它对稀疏或可压缩信号同时进行采样与压缩,使用低分辨的传感设备就可以在终端精确重建信号,从而解决了传统乃奎斯特采样中对采样速率要求的瓶颈问题。
[0003] 在二维图像压缩感知重建中,如果对原始图像整体进行采样,需要较高的计算复杂度与硬件代价。之后发展起来的分块图像压缩感知重建方法先把图像分为固定大小的图像块,对所有的图像块进行随机投影,逐块重建后再聚合成原图像。此时,分块重建具有易于运输和存储等优点,是实现图像压缩感知的一个重要进步。
[0004] 西安电子科技大学的专利申请“基于核回归的压缩感知图像重构方法”(公开号:CN102332153A,申请号:201110268034.5,申请日:2011年9月13日)中公开了一种基于核回归的压缩感知图像重构方法。该方法首先对图像进行分块,利用正交匹配追踪OMP算法和冗余离散余弦(DCT)字典对这些图像块进行初步重构,然后对图像运用核回归方法得到图像小块的局部信息,利用邻域图像块加权得到图像小块的非局部信息,最后利用图像小块的局部信息和非局部信息通过最小二乘求解得到重构图像小块,对所有图像小块重复此类操作,获得最终SAR高分辨重建图像。该专利申请存在的不足是,对不同图像块进行初步重构时采用的字典是单一的冗余离散余弦字典,但不同的图像块一般具有不同的结构特征,从而对具有不同结构特征的图像块不能进行最稀疏的表示,影响重建效果;另外,该专利有对具有纹理信息的图像重建效果不理想的缺点。

发明内容

[0005] 本发明的目的在于针对现有压缩感知重构技术中采用单一字典,难以最稀疏的表示具有不同结构特征图像块的缺点,而影响图像的最终重建效果的缺点,提出一种基于结构字典的分块图像压缩感知重构方法。
[0006] 本发明的思路是,首先基于图像块的结构特征对图像块分进行类,然后以每类图像块作为训练样本,利用K-Singular Value Decomposition(KSVD)字典训练方法训练得到冗余字典与余弦基字典组成结构字典,最后在分块图像压缩感知重建时,利用基于重建误差加权求和的方法获得最终图像。
[0007] 本发明的实现的具体步骤如下:
[0008] (1)获取训练样本;
[0009] (2)图像块分类
[0010] 2a)分别计算各个训练样本的方差;
[0011] 2b)将方差小于平滑阈值的图像块归为平滑类图像块,方差大于平滑阈值的图像块归为非平滑类图像块;
[0012] 2c)根据梯度计算方法分别计算各个非平滑类图像块中各像素水平方向与垂直方向的梯度,得到梯度矩阵;
[0013] 2d)对梯度矩阵进行奇异值分解,得到左酉矩阵、对角矩阵和右酉矩阵;
[0014] 2e)计算对角矩阵中的两个奇异值的差与和,并计算两者的比值;
[0015] 2f)将比值与不规则阈值进行比较,若比值大于不规则阈值,则将非平滑类图像块归为规则类图像块,否则,归为不规则类图像块;
[0016] 2g)利用下式计算规则类图像块指向值:
[0017]
[0018] 其中,θ为规则类图像指向值,v1和v2为主分量,分别代表右酉矩阵的列向量;
[0019] 2h)将-90°~90°指向的取值范围均分为12个离散区间,将指向值在同一区间内对应的的规则类图像块归为一类;
[0020] (3)训练分类字典
[0021] 3a)将分类得到的平滑类图像块、不规则类图像块及12个不同指向的图像块作为训练样本;
[0022] 3b)进行字典训练初始化设置;
[0023] 3c)利用KSVD方法进行字典训练,得到对应于各类图像块训练样本的分类冗余字典;
[0024] 3d)根据余弦基公式,构造余弦基字典;
[0025] 3e)将分类冗余字典与余弦基字典组成结构字典;
[0026] (4)构造观测矩阵
[0027] 4a)根据压缩感知的低采样特性,在0.2~0.4范围内选择采样率;
[0028] 4b)将采样率与图像块像素数目相乘,得到对应采样率的观测矩阵维数[0029] 4c)随机初始化相应维数的高斯随机矩阵作为观测矩阵;
[0030] (5)观测图像块
[0031] 5a)对原始图像按同样大小进行不重叠的逐次分块处理,并将图像块按列依次拉为列向量,得到原始图像矩阵;
[0032] 5b)利用观测矩阵对原始图像矩阵进行相乘投影,得到观测值矩阵;
[0033] (6)结构字典重建
[0034] 6a)将观测矩阵与步骤(3)所得的结构字典逐个对应相乘,得到恢复矩阵;
[0035] 6b)利用正交匹配追踪方法进行分块压缩感知图像重建,得到重建解;
[0036] 6c)将步骤(3)所得的结构字典与重建解相乘,得到重建图像矩阵;
[0037] (7)获取重建误差
[0038] 将原始图像矩阵与在步骤(3)所得的结构字典下的逐个重建图像矩阵的差平方求和,获得重建误差;
[0039] (8)重建图像
[0040] 8a)将重建误差作为权重,对重建图像矩阵进行加权求和,得到最终重建图像矩阵;
[0041] 8b)将最终重建图像矩阵进行反分块处理,得到最终的重建图像;
[0042] (9)输出重图像。
[0043] 与现有技术相比,本发明具有以下优点:
[0044] 第一,本发明提出的基于图像块结构特征对图像块进行分类,将分类结果作为训练样本训练结构字典的方法,克服了现有技术中采用单一字典对具有不同结构特征图像块不能实现最稀疏表示的缺点,使得本发明对具有不同结构特征的图像块进行分块图像压缩感知重建时,都能得到较好的效果。
[0045] 第二,本发明引入具有不同的纹理信息余弦基字典,克服了现有技术对具有纹理信息图像块重建效果不理想的缺点,使得本发明在对具有不同纹理信息的图像进行分块压缩感知重建时,提高了重建质量。

附图说明

[0046] 图1是本发明的流程图;
[0047] 图2是本发明图像块分类结果与字典训练结果的对比图;
[0048] 图3是本发明构造余弦基字典的结果图;
[0049] 图4是本发明进行仿真选择的自然图像及其局部放大图;
[0050] 图5是本发明与现有技术对自然图像的仿真对比图。
[0051] 具体实施方法
[0052] 下面结合附图对本发明做进一步描述。
[0053] 参照附图1,本发明的具体步骤如下:
[0054] 步骤1,获取训练样本
[0055] 第一步,从数据库中选取具有平滑特征、不规则特征及不同的指向信息等多种结构特征信息的多幅原图像,分别对这些图像进行下采样,得到下采样图像。
[0056] 第二步,将数据库中选取的多幅原图像与原图像,构成训练样本库。
[0057] 第三步,将样本库中的图像按8×8的大小进行不重叠的逐次分块,随机抽取20000个训练图像块,并将其按列依次拉为列向量,作为训练样本。
[0058] 步骤2,图像块分类
[0059] 分别计算各个训练样本的方差,设定平滑阈值为20,将方差小于平滑阈值的图像块归为平滑类图像块,方差大于平滑阈值的图像块归为非平滑类图像块。
[0060] 根据梯度计算方法分别计算各个非平滑类图像块中各像素水平方向与垂直方向的梯度,得到梯度矩阵,即将非平滑类图像块中每个像素点的水平分量与垂直分量分别减去其相邻像素点的水平分量与垂直分量,得到该像素点的梯度,所有像素点的梯度构成一个大小为64行2列的梯度矩阵,对梯度矩阵进行奇异值分解,得到左酉矩阵、对角矩阵和右酉矩阵。
[0061] 计算对角矩阵中的两个奇异值的差与和,并计算两者的比值,将比值与不规则阈值进行比较,若比值大于不规则阈值,则将非平滑类图像块归为规则类图像块,否则,归为不规则类图像块,不规则阈值按照下式计算,当概率密度函数p的曲线下降到水平位置时的变量R即为不规则阈值:
[0062]
[0063] 其中,p为独立同分布白高斯矩阵条件数的概率密度函数,R为概率密度函数的变量值,N为图像块中像素点数。
[0064] 利用下式计算规则类图像块方向值:
[0065]
[0066] 其中,θ为规则类图像方向值,v1和v2为主分量,分别代表右酉矩阵的列向量;
[0067] 将-90°~90°指向的取值范围均分为12个离散区间,将指向值在同一区间内对应的的规则类图像块归为一类。
[0068] 步骤3,训练分类字典
[0069] 将分类得到的平滑类图像块、不规则类图像块及12个不同指向的图像块作为训练样本。
[0070] 进行字典训练初始化设置,即将初始字典设为冗余离散余弦字典,稀疏度设为6,原子数目为256,迭代次数为30,利用KSVD方法进行字典训练,得到对应于各类图像块训练样本的分类冗余字典。
[0071] 根据余弦基公式,构造余弦基字典,将分类冗余字典与余弦基字典组成结构字典,余弦基公式如下:
[0072] C=λkcos(πk(xcosθ+ycosθ))
[0073] 其中,C为余弦基值,k表示余弦基方向变换的频率,在0~1取值范围内取16个均匀分布的离散值,λk表示余弦基的幅度,当k取值为0或1时,λk取值1,否则,λk取值θ表示余弦基变换的方向,在0~π取值范围内取16个均匀分布的离散值,x、y分别表示余弦基在水平方向和垂直方向像素点的值。
[0074] 步骤4,构造观测矩阵
[0075] 根据压缩感知的低采样特性,在0.2~0.4范围内选择采样率,将采样率与图像块像素数目相乘得到对应采样率的观测矩阵维数。
[0076] 随机初始化对应维数的高斯随机矩阵作为观测矩阵。
[0077] 步骤5,观测图像块
[0078] 同步骤(1)中所述,对待重建图像进行分块处理,得到图像矩阵,利用观测矩阵对图像矩阵进行观测,得到观测值矩阵。
[0079] 步骤6,结构字典重建
[0080] 将观测矩阵与步骤(3)所得的结构字典逐个对应相乘,得到恢复矩阵;利用正交匹配追踪方法,在字典中贪婪的选取与重建信号最相关的原子,对所选原子进行加权求和进行分块压缩感知图像重建,得到重建解。
[0081] 将步骤(3)所得的结构字典与重建解相乘,得到重建图像矩阵。
[0082] 步骤7,获取重建误差
[0083] 将原始图像矩阵与在步骤(3)所得的结构字典下的逐个重建图像矩阵的差平方求和,获得重建误差。
[0084] 步骤8,重建图像
[0085] 重建误差作为权重,对重建图像矩阵进行加权求和,得到最终重建图像矩阵;将最终重建图像矩阵进行反分块处理,即将最终重建图像矩阵的列向量恢复为图像块,再将图像块逐个排列组成重建图像,得到最终的重建图像。
[0086] 步骤9,输出重建图像。
[0087] 本发明的效果可以通过以下仿真进一步说明。
[0088] 1.仿真条件
[0089] 本发明的效果通过两个仿真实验加以验证。仿真实验1的仿真条件是在MATLAB7.0软件中进行,对在图像数据库中随机抽取的图像块样本进行仿真实验。仿真实验2的仿真条件是在MATLAB7.0软件中进行,选择常用的512×512的标准Lena自然图像及Monarch自然图像,分别在采样率为20%、30%、40%时进行仿真实验。
[0090] 2.仿真实验1
[0091] 本仿真实验是对在图像数据库中随机抽取的图像块样本进行基于图像块结构特征的分类及字典训练。部分分类结果及训练结果如图2所示。
[0092] 图2中,图2(a)表示平滑类图像块,图2(b)表示不规则类图像块,图2(c)表示60度指向的图像块,图2(d)表示30度指向的图像块,图2(e)表示0度指向的图像块,图2(f)表示-30度指向的图像块,图2(g)表示-60度指向的图像块,图2(h)表示-90度或90度指向的图像块,可以看出平滑类及不规则类图像块分别具有明显的平滑特征和不规则特征,不同指向的图像块也都具有相应指向的视觉特征。图2(i)表示平滑类字典,图2(j)表示不规则类字典,图2(k)表示60度指向的字典,图2(l)表示30度指向的字典,图2(m)表示0度指向的字典,图2(n)表示-30度指向的字典,图2(o)表示-60度指向的字典,图2(p)表示-90度或90度指向的字典。由图2(a)与图2(i),2(b)与图2(j),2(c)与图2(k),2(d)与图2(l),2(e)与图2(m),2(f)与图2(n),2(g)与图2(o),2(h)与图2(p)的视觉对比可以看出,本发明将具有不同结构特征的图像块作为样本训练的字典也相应具有明显的平滑特征、不规则特征及不同指向的视觉特征。
[0093] 图3是本发明构造的余弦基字典结果图,从图3中可以看出,字典中的纹理信息以不同频率和不同方向进变换,能对具有纹理信息的图像块进行较好的稀疏表示。
[0094] 实验表明,本发明的基于图像块结构特征的分类方法能有效的对图像块进行分类,并且字典训练也可以得到较为理想的结果。
[0095] 3.仿真实验2
[0096] 仿真实验2是对两幅自然图像Lena和Monarch在采样率为30%时进行分块压缩感知重建的仿真实验。
[0097] 图4中,图4(a)是进行仿真对比所选择的Lena自然图像,图4(c)为4(a)的局部放大图;图4(b)是进行仿真对比所选择的Monarch自然图像,图4(d)为4(b)的局部放大图。
[0098] 图5中,图5(a)是对图4(a)利用单一KSVD字典进行重建后的局部放大图,图5(c)是对图4(a)利用本发明的结构字典进行重建后的局部放大图;图5(b)是对图4(b)利用单一KSVD字典进行重建后的局部放大图,图5(d)是对图4(b)利用本发明的结构字典进行重建后的局部放大图。从图4(a)和图4(b)在两种字典下的重建结果图5(a)与图5(c),图5(b)与图5(d)的视觉对比可以看出,本发明的重建结果在整体上有明显的提高,尤其是在图像细节方面,效果更加明显。
[0099] 实验表明,本发明的结构字典进行分块压缩感知图像的重建结果与单一字典相比,在整体上可以得到更为理想的效果,而且在图像细节方面,重建效果有了更加明显的提高。
[0100] 为了更好的比较本发明方法和传统方法的重建结果图的质量,计算不同方法得到的Lena图像重建结果图的峰值信噪比(PSNR),相似度指数(SSIM),平均相似度指数(MSSIM)及特征相似度指数(FSIM),最终数据如下表所示:
[0101]
[0102] 从上表可以看出,本发明的结构字典在采样率为20%、30%、40%时得到的结果图的评价指标都要高于传统的单一字典,即本发明的方法的重建图像质量要比传统方法高。
[0103] 从各仿真的结果可以看出,本发明的方法能够很好地对图像块进行分类,训练得到的结构字典对图像进行分块压缩感知重建时,明显的提高了包括纹理信息在内的图像细节方面的重建效果,提高了图像的重建质量。