JPEG图像双重压缩检测方法及系统转让专利

申请号 : CN201110357479.0

文献号 : CN102413328B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 杨建权史芳玲朱国普黄继武

申请人 : 中国科学院深圳先进技术研究院

摘要 :

一种JPEG图像双重压缩检测方法,包括以下步骤:对待检测JPEG图像进行矫正获得参考图像;提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值;采用经训练的分类器对所述特征值进行模式识别,判别所述待检测JPEG图像是否经过双重压缩。上述JPEG图像双重压缩检测方法在待检测JPEG图像和参考图像的每个频率上只提取一个特征值,因此特征值个数少,分类器训练耗时短;特征值经过有效提炼,因此判别准确率高,性能稳定。此外,还提供一种JPEG图像双重压缩检测系统。

权利要求 :

1.一种JPEG图像双重压缩检测方法,包括以下步骤:对待检测JPEG图像进行矫正获得参考图像;

提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值,排列成特征矢量;所述量化DCT参数是量化DCT系数、量化DCT系数绝对值、量化DCT系数首位数字中的一种;

采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩。

2.根据权利要求1所述的JPEG图像双重压缩检测方法,其特征在于,所述对待检测JPEG图像进行矫正获得参考图像的步骤包括:读取待检测JPEG图像的亮度量化表,并对所述待检测JPEG图像解压得到亮度值矩阵;

删除所述亮度值矩阵的a行和b列;删除所述亮度值矩阵的a行和b列是第1~n行、第1~m列、最后8-n行和最后8-m列,m和n不能同时是8的倍数;

对删除部分行列后的亮度值矩阵用所述亮度量化表进行JPEG压缩,得到参考图像。

3.根据权利要求1所述的JPEG图像双重压缩检测方法,其特征在于,所述提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值的步骤包括:读取待检测JPEG图像和参考图像亮度平面上的量化DCT参数矩阵;

计算待检测JPEG图像和参考图像在亮度平面上各个空间频率的量化DCT参数的直方图Hij和Gij,其中Hij表示待检测JPEG图像第(i,j)频率的直方图,其中1≤i≤8,

1≤j≤8,Gij表示参考图像第(i,j)频率的直方图,其中1≤i≤8,1≤j≤8;

根据下述公式计算各频率的特征值:

式中,n为量化DCT参数的值,L是频率位置构成的集合,

4.根据权利要求1所述的JPEG图像双重压缩检测方法,其特征在于,所述分类器的构造采用支持向量机技术。

5.根据权利要求4所述的JPEG图像双重压缩检测方法,其特征在于,分类器构造的步骤具体是:选取未经压缩的图像构成训练图像集;

对所述训练图像集中的图像,以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集Ss;

对所述训练图像集中的图像,固定QF2,令QF1在 内等概率随机取值,并以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集Sd;

上述的QF1表示第一次JPEG压缩的质量因子,QF1取值集合为 ,QF2表示第二次JPEG压缩的质量因子,QF2取值集合为 ,QF1≠QF2;

计算Ss和Sd中各图像的特征矢量,根据所述特征矢量对分类器进行训练;对QF2的每一个取值都训练一个分类器,共得到 个分类器,从而构成分类器组。

6.根据权利要求5所述的JPEG图像双重压缩检测方法,其特征在于,还包括提取待检测JPEG图像的亮度量化表,并得到亮度量化表对应的质量因子的步骤;

所述采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩的步骤,选择的是与亮度量化表对应的质量因子相等的QF2对应的分类器进行判别。

7.一种JPEG图像双重压缩检测系统,其特征在于,包括以下模块:图像矫正模块,用于对待检测JPEG图像进行矫正获得参考图像;

特征提取模块,用于提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值,排列成特征矢量;所述量化DCT参数是量化DCT系数、量化DCT系数绝对值、量化DCT系数首位数字中的一种;

判断模块,用于采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩。

8.根据权利要求7所述的JPEG图像双重压缩检测系统,其特征在于,所述图像矫正模块还用于:读取待检测JPEG图像的亮度量化表,并对所述待检测JPEG图像解压得到亮度值矩阵;

删除所述亮度值矩阵的a行和b列;

对删除部分行列后的亮度值矩阵用所述亮度量化表进行JPEG压缩,得到参考图像;

所述图像矫正模块删除所述亮度值矩阵的a行和b列是第1~n行、第1~m列、最后

8-n行和最后8-m列,m和n不能同时是8的倍数;

所述特征提取模块还用于:

读取待检测JPEG图像和参考图像亮度平面上的量化DCT参数矩阵;

计算待检测JPEG图像和参考图像在亮度平面上各个空间频率的量化DCT参数的直方图Hij和Gij,其中Hij表示待检测JPEG图像第(i,j)频率的直方图,其中1≤i≤8,

1≤j≤8,Gij表示参考图像第(i,j)频率的直方图,其中1≤i≤8,1≤j≤8;

根据下述公式计算各频率的特征值:

式中,n为量化DCT参数的值,L是频率位置构成的集合, {1;所述系统还包括分类器构造模块,用于构造分类器,具体步骤为:选取未经压缩的图像构成训练图像集;

对所述训练图像集中的图像,以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集Ss;

对所述训练图像集中的图像,固定QF2,令QF1在 内等概率随机取值,并以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集Sd;

上述的QF1表示第一次JPEG压缩的质量因子,QF1的取值集合为 ,QF2表示第二次JPEG压缩的质量因子,QF2的取值集合为 ,QF1≠QF2;

计算Ss和Sd中各图像的特征值,排列成特征矢量,根据所述图像的特征矢量训练分类器;对QF2的每一个取值都训练一个分类器,共得到 个分类器,从而构成分类器组;

所述分类器构造模块还用于提取待检测JPEG图像的亮度量化表,并得到亮度量化表对应的质量因子;

所述判断模块还用于选择与亮度量化表对应的质量因子相等的QF2对应的分类器进行判别。

说明书 :

JPEG图像双重压缩检测方法及系统

【技术领域】

[0001] 本发明涉及图像处理技术,尤其涉及一种JPEG图像双重压缩检测方法及系统。【背景技术】
[0002] JPEG(Joint Photographic Experts Group,联合图像专家小组)有损压缩技术能够有效去除图像的冗余信息(如视觉冗余,频率冗余等),具有较高的文件压缩率和细节保真度,且提供了一种在二者间权衡的机制(通过选择不同的压缩质量因子),因此在图像摄取设备和网络传输中广泛应用。然而,图像处理技术的快速发展,使得篡改JPEG图像越发容易且不留视觉痕迹;图像隐写技术的成熟,也使得网络上携带秘密信息的JPEG图像数量越来越多。这些伪造或携带秘密信息的图像如果不能被正确辨别,可能会造成严重的社会危害:如伪造的图像见于新闻报道可能会误导公众舆论,用于法庭证据可能会导致假案错案;携带秘密信息的图像可能会被恐怖分子,分裂分子用于秘密通信或传递行动指令。仅靠人眼从海量的JPEG图像中辨别哪些经过篡改或是隐藏有秘密信息显得效率低下,不切实际,目前可行的解决方案是发展一种计算机自动篡改检测与隐写分析的技术。
[0003] 不少学者已对JPEG图像的篡改检测和隐写分析技术进行了广泛深入的研究,提出了多种方法。这些方法通常都需要获知待检测JPEG图像的压缩历史信息,即需要获知图像是经过单次压缩还是双重压缩。由此可见,JPEG双重压缩检测方法作为前端处理,其有效性直接影响着具体的篡改检测或隐写分析算法的性能。
[0004] JPEG图像压缩是基于分块的图像压缩方案。图像如果具有多个通道,则分别对每个通道进行压缩,下面以亮度通道进行叙述,其它色差通道的处理过程类似。
[0005] JPEG压缩时,首先将输入图像的亮度值矩阵分割成互不重叠的8×8块。对每一个分块,进行离散余弦变换(Discrete Cosine Transform,DCT)后,根据一个8×8的量化步长矩阵(也称为量化表,每个量化表可用一个质量因子表示,如质量因子100对应最高的图像保真度,质量因子1对应最低的图像保真度,常用的质量因子范围是50~100)对DCT系数进行量化,最后将所得的量化DCT系数进行编码后写成JPEG文件。由于是对8×8的分块进行DCT,因此变换后可得到64个空间频率,包括1个直流(DC)频率和63个交流(AC)频率。计算每个频率量化DCT系数的直方图,共可获得64个直方图。由于DC频率的直方图不服从特定分布,而较高AC频率的直方图的非零系数太少,因此在双重压缩检测过程中,往往只采用较低AC频率的直方图提取特征。
[0006] JPEG解压时,首先从JPEG文件头读取量化表并对文件内码流进行解码,得到量化DCT系数矩阵。根据量化表对量化DCT系数进行反量化、逆向离散余弦变换(Inverse Discrete Cosine Transform,IDCT)并取整后,还原出亮度值矩阵。
[0007] 在整个JPEG压缩和解压缩过程中,DCT与IDCT,编码与解码是两对无损操作,只有量化与反量化会导致图像信息丢失。换言之,量化与反量化会在JPEG图像上留下痕迹。单次压缩的JPEG图像上的量化痕迹与双重压缩的JPEG图像上的量化痕迹不同,这些痕迹在量化DCT系数直方图上能反映出来。因此,在量化DCT系数直方图上提取区分特征能够检测出JPEG图像是否经过双重压缩。目前存在下述几种基于量化DCT系数直方图特征进行JPEG图像双重压缩检测的方法:
[0008] 利用JPEG图像量化DCT系数直方图形状进行双重压缩检测方法。单次压缩的JPEG图像的量化DCT系数绝对值的直方图具有大致平滑下降的趋势,而双重压缩的JPEG图像的该直方图则会出现局部峰值,局部最小值,双峰值等,其趋势不再平滑下降。换言之,直方图的形状具有区分性。据此,Pevny和Fridrich提出的方法首先计算量化DCT系数绝对值的直方图,并直接截取该直方图的前15个值作为特征。如果考虑n个频率,则把每个频率的这15个特征依次排列,最终得到一个长度为15×n的特征矢量,作为JPEG图像双重压缩检测的特征矢量,并通过SVM(support vector machine,支持向量机)技术构造分类器。
[0009] 利用JPEG图像量化DCT系数的首位数字(如12的首位数字是1,214的首位数字是2)直方图进行双重压缩检测的方法。单次压缩的JPEG图像的量化DCT系数首位数字直方图满足广义Benford律,而双重压缩的JPEG图像的该直方图则会违背这一统计规律,据此可辨别JPEG图像是否经历双重压缩。Li等人提出的方法首先计算各频率量化DCT系数的首位数字直方图,直接将该直方图的值作为特征,共9个特征(因为首位数字只能是1~9)。如果考虑n个频率,则把每个频率的这9个特征依次排列,最终得到一个长度为9×n的特征矢量,作为JPEG图像双重压缩检测的特征矢量,并通过Fisher线性辨别技术构造分类器。
[0010] 利用JPEG图像量化DCT系数直方图的周期性进行双重压缩检测的方法。单次压缩的JPEG图像的量化DCT系数的直方图大致平滑下降,而双重压缩图像的该直方图会周期性地出现峰值或最小值,因此通过度量这些元素的周期性,可用于判别JPEG图像是否经过双重压缩。Popescu提出的方法首先计算量化DCT系数直方图的傅立叶幅度谱,通过曲线拟合技术消除幅度谱的背景形状,得到反映直方图周期性模式的谱线,然后通过与一些标准模板的谱线进行加权平均得到周期性度量值。该值越大,表明周期性越显著。最后通过设定一个阈值,对待测JPEG图像是否经历双重压缩进行判决。
[0011] 利用JPEG图像量化DCT系数直方图分布模型进行双重压缩检测的方法。单次压缩的JPEG图像的量化DCT AC系数的分布服从拉普拉斯分布,而双重压缩图像的量化DCT AC系数则不服从该分布,据此可辨别JPEG图像是否经历双重压缩。专利“针对JPEG图像二次压缩的检测方法”首先对图像的所有AC系数的分布进行拉普拉斯拟合,并将拟合分布与实际分布的差异作为特征矢量训练SVM得到分类器。
[0012] 这些方法提取的区分特征没有经过有效提炼,具有较大的冗余性,导致特征矢量冗长,分类器训练过程耗时,且对不同质量因子组合的双重压缩检测效果不够稳定。【发明内容】
[0013] 鉴于此,有必要提供一种能够稳定有效工作且计算相对简单的JPEG图像双重压缩检测方法。
[0014] 本发明涉及一种JPEG图像双重压缩检测方法,包括以下步骤:
[0015] 对待检测JPEG图像进行矫正获得参考图像;
[0016] 提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值,排列成特征矢量;
[0017] 采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩。
[0018] 优选地,所述对待检测JPEG图像进行矫正获得参考图像的步骤包括:
[0019] 读取待检测JPEG图像的亮度量化表,并对所述待检测JPEG图像解压得到亮度值矩阵;
[0020] 删除所述亮度值矩阵的a行和b列;
[0021] 对删除部分行列后的亮度值矩阵用所述亮度量化表进行JPEG压缩,得到参考图像。
[0022] 优选地,删除所述亮度值矩阵的a行和b列是第1~n行、第1~m列、最后8-n行和最后8-m列。
[0023] 优选地,所述提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值的步骤包括:
[0024] 读取待检测JPEG图像和参考图像亮度平面上的量化DCT参数矩阵;
[0025] 计算待检测JPEG图像和参考图像在亮度平面上各个空间频率的量化DCT参数的直方图Hij和Gij,其中Hij表示待检测JPEG图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图,Gij表示参考图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图;
[0026] 根据下述公式计算各频率的特征值:
[0027] (i,j)∈L
[0028] 式中,L是频率位置构成的集合,
[0029] 优选地,所述量化DCT参数是量化DCT系数、量化DCT系数绝对值、量化DCT系数首位数字中的一种。
[0030] 优选地,所述分类器的构造采用支持向量机技术。
[0031] 优选地,分类器训练的步骤具体是:
[0032] 选取未经压缩的图像构成训练图像集;
[0033] 对所述训练图像集中的图像,以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集Ss;
[0034] 对所述训练图像集中的图像,固定QF2,令QF1在 内等概率随机取值,并以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集Sd;
[0035] 上述的QF1表示第一次JPEG压缩的质量因子,QF1取值集合为 QF2表示第二次JPEG压缩的质量因子,QF2取值集合为 QF1≠QF2;
[0036] 计算Ss和Sd中各图像的特征值,并排列成特征矢量,根据所述特征矢量对分类器进行训练;对QF2的每一个取值都训练一个分类器,共得到 个分类器,从而构成分类器组。
[0037] 优选地,还包括提取待检测JPEG图像的亮度量化表,并得到亮度量化表对应的质量因子的步骤;
[0038] 所述采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩的步骤,选择的是与亮度量化表对应的质量因子相等的QF2对应的分类器进行判别。
[0039] 此外,还有必要提供一种特征值个数少,能够稳定有效工作且计算相对简单的JPEG图像双重压缩检测系统。
[0040] 一种JPEG图像双重压缩检测系统,包括以下模块:
[0041] 图像矫正模块,用于对待检测JPEG图像进行矫正获得参考图像;
[0042] 特征提取模块,用于提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值,排列成特征矢量;
[0043] 判断模块,用于采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩。
[0044] 优选地,所述图像矫正模块还用于:
[0045] 读取待检测JPEG图像的亮度量化表,并对所述待检测JPEG图像解压得到亮度值矩阵;
[0046] 删除所述亮度值矩阵的a行和b列;
[0047] 对删除部分行列后的亮度值矩阵用所述亮度量化表进行JPEG压缩,得到参考图像;
[0048] 所述图像矫正模块删除所述亮度值矩阵的a行和b列是第1~n行、第1~m列、最后8-n行和最后8-m列;
[0049] 所述特征提取模块还用于:
[0050] 读取待检测JPEG图像和参考图像亮度平面上的量化DCT参数矩阵;
[0051] 计算待检测JPEG图像和参考图像在亮度平面上各个空间频率的量化DCT参数的直方图Hij和Gij,其中Hij表示待检测JPEG图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图,Gij表示参考图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图;
[0052] 根据下述公式计算各频率的特征值:
[0053] (i,j)∈L
[0054] 式中,L是频率位置构成的集合,
[0055] 所述量化DCT参数是量化DCT系数、量化DCT系数绝对值、量化DCT系数首位数字中的一种;
[0056] 所述系统还包括分类器构造模块,用于构造分类器,具体步骤为为:
[0057] 选取未经压缩的图像构成训练图像集;
[0058] 对所述训练图像集中的图像,以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集Ss;
[0059] 对所述训练图像集中的图像,固定QF2,令QF1在 内等概率随机取值,并以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集Sd;
[0060] 上述的QF1表示第一次JPEG压缩的质量因子,QF1的取值集合为 QF2表示第二次JPEG压缩的质量因子,QF2的取值集合为 QF1≠QF2;
[0061] 计算Sd和Sd中各图像的特征值,排列成特征矢量,根据所述图像的特征矢量训练分类器;对QF2的每一个取值都训练一个分类器,共得到 个分类器,从而构成分类器组;
[0062] 所述分类器构造模块还用于提取待检测JPEG图像的亮度量化表,并得到亮度量化表对应的质量因子;
[0063] 所述判断模块还用于选择与亮度量化表对应的质量因子相等的QF2对应的分类器进行判别。
[0064] 上述JPEG图像双重压缩检测方法通过对待检测JPEG图像进行矫正获得参考图像,并提取两者的量化DCT系数绝对值的直方图,再计算两者直方图的各频率的特征值,最后通过训练好的分类器就能够判断待检测JPEG图像是否经过双重压缩。由于每个频率上只计算一个特征值,且该特征值经过有效提炼,因此所述检测方法具有准确性高,稳定性好,复杂性低的优点。【附图说明】
[0065] 图1为JPEG图像双重压缩检测方法的流程图;
[0066] 图2为JPEG图像矫正操作示意图;
[0067] 图3为Zigzag扫描示意图;
[0068] 图4为计算JPEG图像特征值方法的流程图;
[0069] 图5为分类器组的构造流程图;
[0070] 图6为JPEG图像双重压缩检测的系统结构图。【具体实施方式】
[0071] 如图1所示,为JPEG图像双重压缩检测方法的流程图,包括以下步骤:
[0072] 步骤S110,对待检测JPEG图像进行矫正获得参考图像。
[0073] 在本实施例中,矫正是指对删除行列后的亮度值矩阵用亮度量化表进行JPEG压缩,具体包括下列步骤:
[0074] ①读取待检测JPEG图像的亮度量化表,并对所述待检测JPEG图像解压得到亮度值矩阵。
[0075] ②删除所述亮度值矩阵的a行和b列。
[0076] ③对删除部分行列后的亮度值矩阵用所述亮度量化表进行JPEG压缩,得到参考图像。
[0077] 在本实施例中,读取JPEG图像的亮度量化表作为辅助信息,对待检测JPEG图像进行解压操作得到亮度值矩阵。
[0078] 在本实施例中,如图2所示,为JPEG图像矫正操作示意图。删除亮度值矩阵的第1~n行、第1~m列和最后8-n行、最后8-m列。然后截取删除部分行列后的图像,得到截取后的像素矩阵,对截取后的图像用亮度量化表进行JPEG图像压缩得到参考图像。m和n不能同时是8的倍数。
[0079] 在本实施例中,对待检测JPEG图像进行矫正时,令m=4,n=4,因而删除待检测JPEG图像亮度值矩阵的第1~4行、第1~4列和最后4行、最后4列,并对删除部分行列的图像进行压缩得到参考图像。
[0080] 步骤S120,提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值,排列成特征矢量。
[0081] 在本实施例中,所述量化DCT参数是量化DCT系数、量化DCT系数绝对值、量化DCT系数首位数字中的一种,优选为量化DCT系数绝对值。
[0082] 在本实施例中,所述提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值的步骤包括:
[0083] ①读取待检测JPEG图像和参考图像亮度平面上的量化DCT参数矩阵。
[0084] ②计算待检测JPEG图像和参考图像在亮度平面上各个空间频率的量化DCT参数的直方图Hij和Gij,其中Hij表示待检测JPEG图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图,Gij表示参考图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图。
[0085] ③根据下述公式计算各频率的特征值:
[0086] (i,j)∈L
[0087] 式中,L是频率位置构成的集合,
[0088] L通常由Zigzag扫描序的前K个AC频率位置构成,即将Zigzag扫描序的标号为2~K+1的频率位置构成L。如图3所示,为一个实施例中Zigzag的扫描序。
[0089] 在本实施例中,计算参考图像的特征值时,取N=15,K=20。即计算特征值Sij时,使用量化DCT参数的直方图第1~15个值,并将Zigzag序前20个AC频率位置的特征值排成特征矢量。
[0090] 在本实施例中,计算各频率特征值的公式还可以是:
[0091] (i,j)∈L
[0092] 或 (i,j)∈L
[0093] 或 (i,j)∈L
[0094] 或其它类似的变更。
[0095] 基于上述实施例,如图4所示,为计算JPEG图像特征值方法的流程图。对待检测JPEG图像进行矫正操作得到参考图像,分别计算待检测图像的量化系数绝对值直方图和参考图像的量化系数绝对值直方图,然后计算各频率特征值,从而可得到特征矢量。
[0096] 步骤S130,采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩。
[0097] 在本实施例中,所述分类器的构造采用支持向量机技术。
[0098] 在本实施例中,JPEG图像双重压缩检测方法还包括对分类器的训练。具体步骤是:
[0099] ①选取未经压缩的图像构成训练图像集。
[0100] ②步骤S134,对所述训练图像集中的图像,以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集Ss。
[0101] ③对所述训练图像集中的图像,固定QF2,令QF1在 内等概率随机取值,并以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集Sd。上述的QF1表示第一次JPEG压缩的质量因子,QF1取值集合为 QF2表示第二次JPEG压缩的质量因子,QF2取值集合为 QF1≠QF2。
[0102] ④计算Ss和Sd中各图像的特征值,并排列成特征矢量,根据所述特征矢量对分类器进行训练;对QF2的每一个取值都训练一个分类器,共得到 个分类器,从而构成分类器组。
[0103] 在本实施例中,还包括提取待检测JPEG图像的量化表,并得到亮度量化表对应的质量因子的步骤。所述采用经过训练的分类器对所述特征矢量进行分类,判别所述待检测JPEG图像是否经过双重压缩的步骤,选择的是与亮度量化表对应的质量因子相等的QF2对应的分类器进行判别。
[0104] 基于上述实施例,如图5所示,为分类器组的构造流程图。选取未压缩图像集,固定QF2,令QF1随机取值。例如QF2固定为A时,令QF1随机取值。以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集。以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集。对两个图像集分别进行特征提取,得到的特征矢量用于训练SVM得到分类器A。类似地,每次改变QF2的值,都可训练一个分类器,遍历QF2的所有可能取值后,共可得到若干个分类器,这些分类器组成一个分类器组。
[0105] 这里对SVM方法作简单介绍。SVM方法的主要思想是通过非线性映射把样本空间映射到一个高维的特征空间(Hilbert空间),使得原样本空间中非线性可分的问题在高维特征空间中线性可分。简单地说,就是通过升维使分类问题线性可分,从而使问题得以简化。SVM技术是目前工程上广泛应用的相当成熟的机器学习技术。。
[0106] 以下通过一个具体实施例对上述JPEG图像双重压缩检测方法进行具体描述。
[0107] 取n=4,m=4。即在实施矫正操作时,删除输入的JPEG图像亮度值矩阵的第1~4行和第1~4列,并重压缩得到参考JPEG图像。取N=15,K=20。即计算特征值Sij时,使用量化DCT系数绝对值的直方图第1~15个值,并将Zigzag序前20个AC频率位置的特征值排成特征矢量。
[0108] 取200幅512×384未经压缩的图像构成训练图像集,指定QF1的取值集合和QF2的取值集合 即最终得到的分类器组中含有2个(SVM)分类器,分别对应于质量因子60和80。可以通过训练更多的SVM分类器来扩展分类器组的检测范围,在本实施例中只示范性地训练2个。
[0109] 由不同于训练图像库的338幅512×384的未经压缩的图像构成测试图像库。令对测试图像库的每幅图像以质量因子QF1和QF2进行JPEG双重压缩,并通过上述构造的分类器组进行判决,所得的判决准确率如表1所示(单位是%)。需说明的是,表中QF1=QF2(如QF1=80,QF2=80)的项显示的是待测图像经过单次压缩,而分类器组将之判决为单次压缩的准确率;表中QF1≠QF2的项显示的是待测图像经过双重压缩,而分类器组将之判决为双重压缩的准确率。
[0110] 表1判决准确率(单位:%)
[0111]
[0112] 表1显示,对大多数QF1和QF2的组合,本发明方法都具有高于95%的判决准确率。当QF1取90时,判决准确率有较明显的下降。这是因为如果QF2远小于QF1或QF1取值很大(如上表中的QF2=60而QF1=90,相差达30且QF1接近最大值100),第一次JPEG压缩在图像上留下的痕迹将被第二次压缩掩盖,从而导致现有的JPEG双重压缩检测算法(包括本发明方法)的判决准确率降低。但总的而言,本发明方法在QF1<90情况下,能很好地区分待测图像是否经历JPEG双重压缩。
[0113] 如图6所示,为JPEG图像双重压缩检测系统的结构图,包括图像矫正模块10、特征提取模块20和判断模块30;
[0114] 其中,图像矫正模块10,用于对待检测JPEG图像进行矫正获得参考图像。
[0115] 在本实施例中,图像矫正模块10还用于:
[0116] 读取待检测JPEG图像的亮度量化表,并对所述待检测JPEG图像解压得到亮度值矩阵。
[0117] 删除所述亮度值矩阵的a行和b列。
[0118] 对删除部分行列后的亮度值矩阵用所述亮度量化表进行JPEG压缩,得到参考图像。
[0119] 在本实施例中,图像矫正模块10删除所述亮度值矩阵的a行和b列是第1~n行、第1~m列、最后8-n行和最后8-m列。
[0120] 特征提取模块20,用于提取待检测JPEG图像及参考图像的量化DCT参数的直方图,并根据两者直方图计算各频率的特征值,排列成特征矢量。
[0121] 在本实施例中,量化DCT参数是量化DCT系数、量化DCT系数绝对值、量化DCT系数首位数字中的一种。
[0122] 在本实施例中,特征提取模块20还用于:
[0123] 读取待检测JPEG图像和参考图像亮度平面上的量化DCT参数矩阵。
[0124] 计算待检测JPEG图像和参考图像在亮度平面上各个空间频率的量化DCT参数的直方图Hij和Gij,其中Hij表示待检测JPEG图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图,Gij表示参考图像第(i,j)(1≤i≤8,1≤j≤8)频率的直方图。
[0125] 根据下述公式计算各频率的特征值:
[0126] (i,j)∈L
[0127] 式中,L是频率位置构成的集合,
[0128] 判断模块30,用于采用经过训练的分类器对所述特征值进行分类,判别所述待检测JPEG图像是否经过双重压缩。
[0129] 在本实施例中,系统还包括分类器构造模块,用于选取未经压缩的图像构成训练图像集;
[0130] 对所述训练图像集中的图像,以质量因子QF2进行JPEG压缩,得到JPEG单次压缩图像集Ss;
[0131] 对所述训练图像集中的图像,固定QF2,令QF1在 内等概率随机取值,并以质量因子QF1和QF2对图像进行双重JPEG压缩,得到JPEG双重压缩图像集Sd;上述的QF1表示第一次JPEG压缩的质量因子,QF1取值集合为 QF2表示第二次JPEG压缩的质量因子,QF2取值集合为 QF1≠QF2。
[0132] 计算Ss和Sd中各图像的特征值,并排列成特征矢量,根据所述特征矢量对分类器进行训练;对QF2的每一个取值都训练一个分类器,共得到 个分类器,从而构成分类器组。
[0133] 在本实施例中,分类器构造模块还用于提取待检测JPEG图像的亮度量化表,并得到亮度量化表对应的质量因子。
[0134] 判断模块30还用于选择与亮度量化表对应的质量因子相等的QF2对应的分类器进行判别。
[0135] 上述JPEG图像双重压缩检测系统首先选取图像构成训练图像集,然后通过提取训练图像集中的图像的特征来训练多个分类器构成分类器组。当需要对待检测JPEG图像进行双重压缩检测时,首先对其进行特征提取,将提取的特征值组成特征矢量,然后从之前就训练好的分类器组中选择合适的分类器对待检测JPEG图像的特征矢量进行判决。
[0136] 上述JPEG图像双重压缩检测方法通过对待检测JPEG图像进行矫正操作得到参考图像,并计算待检测JPEG图像与参考图像的直方图相似度作为特征,使每个频率的特征维数下降为1,有效地消除了特征的冗余,减轻了待检测JPEG图像自身内容导致的特征差异性的影响,具有更稳定的判断准确率。
[0137] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。