一种对JPEG图像的像素块分类方法及基于此的图像篡改检测和被篡改区域定位方法转让专利

申请号 : CN201110386240.6

文献号 : CN102521606B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 赵于前廖苗

申请人 : 中南大学

摘要 :

本发明提供了一种对JPEG图像的像素块分类方法,以及基于此的图像篡改检测和被篡改区域定位方法,将待检测的JPEG图像分成连续不重叠的8×8大小的像素块,以某个像素块为中心选取(2n+1)×(2n+1)个像素块组合而成的方形区域作为子图像,利用子图像的前i个AC系数带中AC系数的首位数分布概率特性,将中心像素块区分为单压缩或双压缩;进而分类结果为单压缩且其面积大于M个8×8像素块的连通区域判定为篡改区域。本发明的方法能准确检测和定位篡改区域;对三种不同篡改技术的篡改区域检测均有效,适用范围较广;本发明是一种JPEG篡改图像的自动盲检测方法,不需要任何先验知识,且有较高的检测覆盖率且误检测率小。

权利要求 :

1.一种判断JPEG图像是否被篡改的方法,其特征在于:包括以下步骤,(1)挑选足够数量的未压缩图像分别进行JPEG单压缩和JPEG块匹配双压缩,并分别提取其特征向量,训练一个单压缩/双压缩二分类的分类器;所述特征向量提取的方法为:选取JPEG图像的前i个AC系数带,计算每一个AC系数带中AC系数的首位数分布概率,由此得到i×9维的特征向量,其中i为1~25的自然数;

(2)在待检测图像上选取子图像,方法为:将待检测的JPEG图像分成连续不重叠的

8×8大小的像素块,以某个像素块为中心选取(2n+1)×(2n+1)个像素块组成的方形区域作为子图像,其中n为0~3的非负整数;

(3)按步骤(1)所述的特征向量提取方法提取步骤(2)选取的子图像的特征向量,并利用步骤(1)训练好的单压缩/双压缩二分类器对选取的子图像进行分类;

(4)对子图像中的中心像素块给出与子图像一致的分类结果;

(5)重复步骤(2)~(4),输出待检测图像中所有像素块的分类结果;

(6)当有M个以上分类结果为单压缩的像素块形成连通区域时,待检测图像被判定为篡改图像,其中M为25以上的正整数。

2.如权利要求1所述的判断JPEG图像是否被篡改的方法,其特征在于:所述的第(2)步中,当对边界像素块进行子图像提取时,则先以边界为轴以镜像反射的方式补足像素块,然后再按所述方法获取子图像。

3.如权利要求1或2所述的判断JPEG图像是否被篡改的方法,其特征在于:所述n优选1或2,所述i优选15~25的自然数。

4.如权利要求3所述的判断JPEG图像是否被篡改的方法,其特征在于:所述i最优选

20。

5.一种对JPEG图像篡改区域定位的方法,其特征在于:首先采用如权利要求1~4之一所述的方法的步骤(1)~(5)将待检测图像像素块分类后,找出由M个以上分类结果为单压缩的像素块形成的连通区域,将这些区域作出标识,其中M设定25以上的正整数。

说明书 :

一种对JPEG图像的像素块分类方法及基于此的图像篡改

检测和被篡改区域定位方法

技术领域

[0001] 本发明涉及判断数字图像是否被篡改的方法,特别涉及JPEG图像是否被篡改的判断和对被篡改区域定位的方法。

背景技术

[0002] 随着日益复杂的图像编辑软件的出现,人们可以方便地对数字图像进行篡改而不留下明显的痕迹,因此,对数字图像的真伪鉴别以及篡改区域的检测技术要求在日益提高,但目前多种针对数字图像真伪鉴别以及篡改区域的检测方法仍存在应用受限、误检率高等缺点。
[0003] 在文献“Detecting doubly compressed JPEG images by using mode based first digit features”(IEEE International Workshop on Multimedia Signal Processing,pp.730-735,2008.)中,公开了通过计算JPEG图像的AC系数带的首位数分布概率来区分JPEG单压缩\双压缩图像的方法。具体而言,JPEG图像被分成连续不重叠的8×8大小的像素块,每个像素块中的相同索引位置的AC系数构成一个AC系数带(mode),
2
将AC系数以“之”字型排列获得63个AC系数带,以x 评估每个AC系数带的首位数概率分
2
布符合广义Benford法则的程度,x 定义如下:
[0004]
[0005] 其中,pi(d)(d=1,2,...,9)表示实际得到的第i个AC系数带的JPEG系数首位 数为d概率分布, (d=1,2,...,9)则表示理论上由广义Benford法则计算得到的第i个AC系数带的JPEG系数首位数为d的概率分布。x2值越小表明该AC系数带能越好地符合广义Benford法则。由于高频AC系数带对应的量化步长较大,所以高频AC系数被量化并取整后大部分变为0,因此,它们的系数首位数概率分布也会严重背离通用Benford法则,表现为x2值相应增大。对UCID(Uncompressed Image Database)中1338幅图像分别以JPEG质量因子QF从50到100(步长为10)进行单压缩,并计算每一相同压缩因子的所有单压缩图像的每一个AC系数带的x2均值,结果如图1所示。结果表明,前1~25个AC系数带的首位数的概率分布能较好地符合通用Benford法则。即表明前1~25个AC系数带具有良好的首位数统计特性(符合通用Benford法则),可以作为特征向量的选取标准。 [0006] 但目前,利用文献所公开的这种分类器原理及方法,还只能对JPEG图像整幅图像的压缩历史做出判断,对于检测和定位一幅给定JPEG图像的篡改区域尚没有做到。 发明内容
[0007] 本发明旨在提供一种JPEG图像的像素块分类方法,以及基于此的适用范围广、判断准确率高的对JPEG图像是否被篡改及对篡改区域定位的方法。
[0008] 本发明通过以下方案实现:
[0009] 一种对JPEG图像的像素块分类及基于此的图像篡改检测和被篡改区域定位方法,包括以下步骤:
[0010] (1)挑选足够数量的未压缩图像分别进行JPEG单压缩和JPEG块匹配双压缩,并分别提取其特征向量,训练一个单压缩/双压缩二分类的分类器;所述特 征向量提取的方法为:选取图像的前i个AC系数带,计算每一个AC系数带中AC系数的首位数(即1~9)概率分布,由此得到i×9维的特征向量,其中i为1~25的自然数;所述AC系数带的定义采用文献“Detecting doubly compressed JPEG images by using mode based first digit features”(IEEE International Workshop on Multimedia Signal Processing,pp.730-735,2008.)中的定义方法,即:JPEG图像被分成连续不重叠的8×8大小的像素块,每个像素块中的一个相同索引位置的AC系数构成一个AC系数带;将AC系数以“之”字型排列,则每幅图像可获得63个AC系数带(注:每个8×8像素块的第一个索引位置的系数为DC系数,其余63个索引位置的系数为AC系数)。
[0011] (2)在待检测图像上选取子图像,方法为:将待检测的JPEG图像分成连续不重叠的8×8大小的像素块,以某个像素块为中心选取(2n+1)×(2n+1)个像素块组合而成的方形区域作为子图像,其中n为0~3的非负整数,n值为0时,选取的子图像就是中心像素块本身。
[0012] (3)对于每个子图像,按步骤(1)所述的特征向量提取方法提取特征向量,并利用步骤(1)训练好的单压缩/双压缩二分类器对选取的子图像进行分类。
[0013] (4)对子图像的中心像素块给出与子图像一致的分类结果。即若子图像分类为单压缩,则子图像对应的中心像素块分类为单压缩;若子图像分类为双压缩,则子图像的中心像素块分类为双压缩。
[0014] (5)重复步骤(2)~(4),输出待检测图像的所有像素块的分类结果。 [0015] 在所述的第(2)步中,当对边界像素块进行子图像提取时,则先以边界为轴以镜像反射的方式补足像素块,然后再按所述方法获取子图像。
[0016] 优选的方案是,子图像选取步骤中,所述n值优选1或2,即选择3×3个像 素块组成的方形区域或5×5个像素块组成的方形区域。AC系数带个数i值则优选15~25的自然数,而最优的方案是AC系数带个数i值为20,即选择前20个AC系数带,提取20×9=180维的特征向量。
[0017] 采用上述方法将待检测图像的像素块分类后,为了消除检测结果中的噪声影响及由此带来的误判断,当有M个以上分类结果为单压缩的像素块形成连通区域时,待检测图像被判定为篡改图像,其中M为25以上的正整数。
[0018] 为了能将JPEG图像的篡改区域进行定位,采用上述方法将待检测图像的像素块分类后,找出由M个(其中M设定25以上的正整数)以上分类结果为单压缩的像素块形成的连通区域,将这些区域作出标识,例如标记为“1”,表示其为篡改区域,其它区域则为标记为“0”,即为未篡改区域。
[0019] 与现有技术相比,采用本发明方法有以下几个优点:
[0020] 一、它能准确检测和定位篡改区域。
[0021] 二、对下述三种不同篡改技术的篡改区域检测均有效,适用范围较广:(1)复制-粘贴篡改且插入区域来自无压缩图像(简称,JPEG+无压缩);(2)复制-粘贴篡改且插入区域来自JPEG图像(简称,JPEG+JPEG);(3)JPEG图像的润饰(Inpainting)篡改(简称,JPEG+润饰)。
[0022] 三、本发明是一种JPEG篡改图像的自动盲检测方法,不需要任何先验知识。 [0023] 四、本方法有较高的检测覆盖率且误检测率小。

附图说明

[0024] 图1单压缩图像AC系数带的首位数概率分布图;
[0025] 图2不同压缩历史的JPEG图像的JPEG系数首位数概率分布图;
[0026] 图3实施例1的子图像选取方法示意图,其中图3(a)是正常情况下子图像的选取方法示意图,图3(b)是对边界像素块进行子图像选取的方法示意图。

具体实施方式

[0027] 实施例1
[0028] 假定一幅JPEG图像篡改后再次保存为JPEG格式,篡改区域与未篡改区域一般具有不同的压缩历史。对于复制-粘贴篡改且插入区域来自无压缩图像(简称“JPEG+无压缩”)和JPEG图像的润饰篡改(简称“JPEG+润饰”)两种篡改方式,篡改区域经历了JPEG单压缩,而未篡改区域经历了JPEG块匹配双压缩;对于复制-粘贴篡改且插入区域来自JPEG图像(简称,“JPEG+JPEG”)篡改方式,篡改区域经历JPEG块匹配双压缩的概率只有1/64,经历JPEG块不匹配双压缩的概率有63/64,未篡改区域则经历了JPEG块匹配双压缩。我们的实验表明,单压缩JPEG图像和块不匹配双压缩图像的JPEG系数首位数的概率分布能很好地符合通用Benford法则,而块匹配双压缩JPEG图像的JPEG系数首位数概率分布则严重背离通用Benford法则,结果见图2。
[0029] 实施例2
[0030] 一种对JPEG图像的像素块分类方法,包括以下步骤:
[0031] (1)挑选足够数量的未压缩图像分别进行JPEG单压缩和JPEG块匹配双压缩,分别选取图像的前20个AC系数带,计算每一个AC系数带中AC系数的首位数(即1~9)概率分布,由此得到20×9=180维的特征向量,之后训练一个单压缩/双压缩二分类的分类器;
[0032] (2)在待检测图像上选取子图像,方法为:将待检测的JPEG图像分成连续不重叠的8×8大小的像素块,如图3所示,图中每一个小方格为一个8×8大小 的像素块,图3(a)为正常情况下子图像的选取方法,即以某个像素块为中心选取3×3(即(2n+1)×(2n+1)中的n值为1的方案)个像素块组成的方形区域作为子图像;图3(b)为对边界像素块进行子图像选取的方法,即先以边界为轴以镜像反射的方式补足像素块(图1(b)中虚线区框的像素块为补足的虚拟像素块),然后再按图3(a)所述的方法获取子图像。图中黑格为中心像素块,斜线阴影区域(含黑格)为选取的子图像。
[0033] (3)对于步骤(2)选取的子图像,按步骤(1)所述方法提取特征向量,即选取子图像的前20个AC系数带,计算每一个AC系数带中AC系数的首位数(即1~9)概率分布,由此得到20×9=180维的特征向量;利用步骤(1)训练好的单压缩/双压缩二分类器对选取的子图像进行分类。
[0034] (4)对子图像的中心像素块给出与子图像一致的分类结果。即若子图像分类为单压缩,则子图像中心像素块对应待检测图像的像素块分类为单压缩;若子图像分类为双压缩,则子图像中心像素块对应待检测图像的像素块分类为双压缩。
[0035] (5)重复步骤(2)~(4),输出待检测图像所有像素块的分类结果。 [0036] 实施例3
[0037] 采用实施例2的方法将待检测图像中的所有像素块分类后,为了消除检测结果中的噪声影响及由此带来的误判断,当有M个以上分类结果为单压缩的像素块形成了连通区域时,待检测图像才被判定为篡改图像,其中M设定为25。
[0038] 进一步,为了能将JPEG图像的篡改区域进行定位,则是采用实施例2的方法将待检测图像中的所有像素块分类后,找出所有M个以上的(M设定为25)分类结果为单压缩的像素块形成的连通区域,将这些区域标记为“1”,表示为篡 改区域,其它区域标记为“0”,即为未篡改区域。
[0039] 实施例4
[0040] 采用实施例3的方法对待检测JPEG图像进行测试统计。从一个图像大小为576×768的彩色图像数据库(McGill Calibrated Colour Image Database)中随机挑选
700幅图像,分别根据“JPEG+无压缩”和“JPEG+JPEG”两种不同的篡改方式进行测试统计,篡改区域大小为150×150个像素。由于对于“JPEG+润饰”和“JPEG+无压缩”两种篡改方式而言,其得到的篡改图像,篡改区域与未篡改区域分别具有相同的压缩历史,测试将会有几乎相同的结果,因此,不单独统计“JPEG+润饰”篡改方式的实验结果。实验过程中参数设置为:n=1,i=20。可以运用检测覆盖率(Overlap)和误检率(Detection Error)来评估检测结果,公式如下:
[0041] 检测覆盖率:
[0042]
[0043] 其中,A1表示检测到的篡改区域,A2表示真实篡改区域。
[0044] 误检率:
[0045]
[0046] 其中,W1表示将未篡改区域误判为篡改区域的大小,W2表示将篡改区域误判为未篡改区域的大小,TR表示真实篡改区域。
[0047] 表1给出了“JPEG+无压缩”篡改方式的OL值的数学期望(ME)与标准差(STD),表2给出了“JPEG+无压缩”篡改方式的DE值的数学期望与标准差,表3给出了“JPEG+JPEG”修改方式的OL值的数学期望与标准差,表4给出 了“JPEG+JPEG”修改方式的DE值的数学期望与标准差。
[0048] 表中,QF1为原始JPEG图像的质量因子,QF2为篡改后整幅图像保存的JPEG质量因子。从表1-4可以看出,本发明对于不同的JPEG质量因子与不同的篡改方式均有理想的检测结果。
[0049] 表1
[0050]
[0051] 表2
[0052]
[0053] 表3
[0054]
[0055] 表4
[0056]
[0057] 实施例5
[0058] 采用与实施例2和3基本相同的方法对JPEG图像的像素块分类、判断是否篡改并标识篡改区域,将其中的某些参数做出调整,可得出相应方案:
[0059] 在实施例1第(2)步选取子图像的方法中,选取的方形区域可以是3×3、5×5或7×7(即n值分别为1、2或3)个像素块组成的方形区域,n值为0时,即选取的是中心像素块本身。在相同检测条件下,分别统计每种篡改方式不同n值的平均检测覆盖率(OL)和误检率(DE),检测结果如表5所示。
[0060] 表5
[0061]
[0062] 表中Method 1指“JPEG+无压缩”的篡改方式;Method 2指“JPEG+JPEG”且两个JPEG图像质量因子相同的篡改方式;Method 3指“JPEG+JPEG”且两个JPEG图像质量因子不同的篡改方式;Method 4指“JPEG+润饰”的篡改方式。统计检测结果表明,n=0,1,2,3的方案均能得到理想结果,同时n=1时检测结果最优。
[0063] 实施例6
[0064] 从彩色图像数据库(McGill Calibrated Colour Image Database)随机挑选700幅图像,首先以JPEG质量因子65进行压缩,然后将其进行JPEG+无压缩篡改且将合成图像以JPEG质量因子85保存。篡改区域大小为150×150。分别用本发明的实施例3的方法、现有公开技术的差的绝对值之和的均值(averaged sum of absolute difference,ASAD)方法和编码块后验概率图(block posterior probability map,BPPM)三种检测方法对篡改图像进行检测,并分别计算OL与DE的均值(ME)与标准差(STD)。表6是检测结果。可以看到本发明方法明显优于其他两种方法。
[0065] 表6
[0066]