多媒体数据盗版追踪方法转让专利

申请号 : CN200810048702.1

文献号 : CN101645116B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 叶登攀廉士国王丽娜

申请人 : 武汉大学

摘要 :

本发明涉及一种多媒体数据盗版追踪方法,首先进行媒体侦探搜索,从网络搜集获取媒体内容资源;然后通过分层过滤实现追踪,包括有第一层过滤,用于根据近似信息过滤媒体内容资源,得到与给定媒体内容具有相似性的媒体内容集合;第二层过滤,用于根据精确信息过滤媒体内容集合,得到与给定媒体内容相符的拷贝媒体内容;第三层过滤,用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息,然后参照预存在用户码数据库中的用户码,追踪到非法的拷贝媒体内容和非法传播用户。本发明提供了一种适应在互联网等公用网络环境中有效跟踪非法拷贝和追踪非法传播用户的技术方案,通过分层过滤技术实现追踪,因此具有高效率性和准确性。

权利要求 :

1.一种多媒体数据盗版追踪方法,其特征在于:首先进行媒体侦探搜索,从网络搜集获取媒体内容资源;然后通过分层过滤实现追踪,包括有以下三个步骤,步骤1.1,第一层过滤,用于根据近似信息过滤媒体内容资源,得到与给定媒体内容具有相似性的媒体内容集合;具体实现方式为对媒体内容资源中的待判断媒体内容逐一处理,处理过程包括以下步骤,步骤1.1.1,从给定媒体内容M中获取近似信息A,从媒体内容资源中任一待判断媒体内容M’中获取近似信息A’;

步骤1.1.2,根据近似信息A和近似信息A’获取平均近似值|A′-A|;

步骤1.1.3,将平均近似值和预设近似阈值T0比较,如果|A′-A|≤T0,判定待判断媒体内容M’与给定媒体内容M具有相似性,加入媒体内容集合,否则过滤掉待判断媒体内容M’;

步骤1.2,第二层过滤,用于根据精确信息过滤媒体内容集合,得到与给定媒体内容相符的拷贝媒体内容;具体实现方式为对媒体内容集合中的任一待判断媒体内容逐一处理,处理过程包括以下步骤,步骤1.2.1,从给定媒体内容M中获取精确信息B,从媒体内容集合中的中任一待判断媒体内容M’中获取精确信息B’;

步骤1.2.2,根据精确信息B和精确信息B’获取平均精确值|B′-B|;

步骤1.2.3,将平均精确值|B′-B|和预设精确阈值T1比较,如果|B′-B|≤T1,判定待判断媒体内容M’与给定媒体内容M相符,将其认定为拷贝媒体内容,否则过滤掉待判断媒体内容M;

步骤1.3,第三层过滤,用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息,然后参照预存在用户码数据库中的用户码,追踪到非法的拷贝媒体内容和非法传播用户;具体实现方式包括以下步骤,步骤1.3.1,从给定媒体内容M中获取身份识别信息C,从任一已判断为拷贝媒体内容的待判断媒体内容M’中获取身份识别信息C’;

步骤1.3.2,参照预存在用户码数据库中的第j个用户码Fj(j=0,1,…,S-1),其中S是用户码的个数,获取第j个身份识别信息值

步骤1.3.3,比较第j个身份识别信息值和预设身份识别阈值T2,如果≥T2,判定第j个用户为非法传播用户,否则调整j值并返回执行步骤1.3.2和1.3.3,直到找到非法传播用户。

2.根据权利要求1所述的多媒体数据盗版追踪方法,其特征在于:所述媒体侦探搜索的实现方式包括以下步骤,步骤2.1,获取给定媒体内容的媒体类型信息;

步骤2.2,以所得媒体类型信息为关键词,从网络中收集与给定媒体内容类型相同的媒体内容,作为媒体内容资源。

3.根据权利要求2所述的多媒体数据盗版追踪方法,其特征在于:给定媒体内容的媒体类型信息从给定媒体内容的头信息中提取。

4.根据权利要求2所述的多媒体数据盗版追踪方法,其特征在于:从网络中收集与给定媒体内容类型相同的媒体内容后,存储到多媒体数据库中,以便作为媒体内容资源提供。

5.根据权利要求1或2或3或4所述的多媒体数据盗版追踪方法,其特征在于:所述获取近似信息,方式为将图像m分割为块,每块进行DCT变换,然后将每块的DC系数提取出来,所获取的信息量L即提取DC系数的个数,得到标志近似信息的序列a(i)=a(0),a(1),…,a(L-1);或者方式为,图像m的像素是m(i),i=0,1,…,WxH-1,其中WxH为图像m的尺寸,近似信息由分开的像素构成,提取分开的像素采用计算公式 i=

0,1,…,WxH-1,其中,q0是大于零的整数,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数;获取近似信息A=a1(i)和近似信息A’=a2(i)后,求取平均近似值

6.根据权利要求1或2或3或4所述的多媒体数据盗版追踪方法,其特征在于:所述获取精确信息,方式为将图像m分割为块,每块进行DCT变换,然后将每块中的头5个AC系数提取出来,所获取的信息量L即提取AC系数的总数,得到标志精确信息的序列b(i)=b(0),b(1),…,b(L-1);或者方式为,图像m的像素是m(i),i=0,1,…,WxH-1,其中WxH为图像m的尺寸,精确信息由分开的像素构成,提取分开的像素采用计算公式i=0,1,…,WxH-1,其中,q0是大于零的整数,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数;获取精确信息B=b1(i)和精确信息B’=b2(i)后,求取平均精确值

7.根据权利要求1或2或3或4所述的多媒体数据盗版追踪方法,其特征在于:所述获取身份识别信息,方式为将图像m分割为块,每块进行DCT变换,然后将每块中的第6~

15个AC系数提取出来,所获取的信息量L即提取AC系数的总数,得到标志身份识别信息的序列c(i)=c(0),c(1),…,c(L-1);或者方式为,图像m的像素是m(i),i=0,1,…,WxH-1,其中WxH为图像m的尺寸,精确信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,WxH-1,其中,q0、q1是大于零的整数,且q0>q1,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数;

获取身份识别信息C=c1(i)和身份识别信息C’=c2(i)后,求取第j个身份识别信息值

说明书 :

多媒体数据盗版追踪方法

技术领域

[0001] 本发明属于数字版权保护技术领域,,特别涉及一种多媒体数据盗版追踪方法。

背景技术

[0002] 对于多媒体服务提供商,一般会将多媒体内容分发给广大用户。其中某些不良用户会非法地将内容散布到如互联网等公用网络中去,这将损害多媒体内容和服务提供商的利益。
[0003] 对于多媒体相关服务,需要内容检索和版权保护相关技术支持。内容检索是指在内容数据库中找到某个内容,而版权保护是指对所有权的保护、版权泄漏者的身份追踪等。现有的专利和文献中均是独立地实现了两部分的功能。例如,专利[P1]中的内容检索方法用于基于图像特征提取和匹配的图像检索目的。此方法中,图像的某些特征被提取,并和存在数据库中图像所提取的特征进行比较,或者直接和存放在数据库中的特征进行比较,能找到一个或多个匹配的图像。内容检索系统很少考虑版权保护应用。对于版权保护,数字水印方法会经常用到:将版权信息透明地嵌入到多媒体内容中来实现版权认证。专利[P2]声明的数字水印保护方法中,在分发媒体内容之前会先嵌入所有者信息。给定内容和同时存放的相应的关键词,能够实现对内容数据库中的内容搜索。然后通过检测内容中是否含有水印信息,来判断内容的合法性。然而,该系统由于同时存放内容和关键词,耗费太多的存储空间。其次,对于互联网上的内容,存储和检索关键词是很困难的事情。另外,内容所有权信息并不能指认非法的内容散布者。
[0004] [P1]GILLES SEBASTIEN;WINTER ALEXANDRE;POIRIER NATHALIE.Image oraudiovisual sequence extraction method for extraction of an image oraudiovisual sequence from an image flux,wherein images are analyzed togenerate a reference index and this is compares with the current index.FR2843212.2003.
[0005] [P2]FUJII TAKEYA.SYSTEM FOR SEARCHING ILLEGITIMATE USE OF CONTENTS.JP2004112318.2004.

发明内容

[0006] 本发明目的在于针对现有技术的不足,提出一种高效率的多媒体数据盗版追踪方法,能够方便地在大信息容量的网络中追踪给定媒体内容的非法拷贝及相应的非法传播用户。
[0007] 本发明的技术方案为:首先进行媒体侦探搜索,从网络搜集获取媒体内容资源;然后通过分层过滤实现追踪,包括有以下三个步骤,
[0008] 步骤1.1,第一层过滤,用于根据近似信息过滤媒体内容资源,得到与给定媒体内容具有相似性的媒体内容集合;
[0009] 步骤1.2,第二层过滤,用于根据精确信息过滤媒体内容集合,得到与给定媒体内容相符的拷贝媒体内容;
[0010] 步骤1.3,第三层过滤,用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息,然后参照预存在用户码数据库中的用户码,追踪到非法的拷贝媒体内容和非法传播用户。
[0011] 而且,所述媒体侦探搜索的实现方式包括以下步骤,
[0012] 步骤2.1,获取给定媒体内容的媒体类型信息;
[0013] 步骤2.2,以所得媒体类型信息为关键词,从网络中收集与给定媒体内容类型相同的媒体内容,作为媒体内容资源。
[0014] 而且,给定媒体内容的媒体类型信息从给定媒体内容的头信息中提取。
[0015] 而且,从网络中收集与给定媒体内容类型相同的媒体内容后,存储到多媒体数据库中,以便作为媒体内容资源提供。
[0016] 而且,步骤1.1中,根据近似信息过滤媒体内容资源的具体实现方式为对媒体内容资源中的待判断媒体内容逐一处理,处理过程包括以下步骤,
[0017] 步骤5.1,从给定媒体内容M中获取近似信息A,从媒体内容资源中任一待判断媒体内容M’中获取近似信息A’;
[0018] 步骤5.2,根据近似信息A和近似信息A’获取平均近似值|A′-A|;
[0019] 步骤5.3,将平均近似值和预设近似阈值T0比较,如果|A′-A|≤T0,判定待判断媒体内容M’与给定媒体内容M具有相似性,加入媒体内容集合,否则过滤掉待判断媒体内容M’。
[0020] 而且,所述获取近似信息,方式为将图像m分割为块,每块进行DCT变换,然后将每块的DC系数提取出来,所获取的信息量L即提取DC系数的个数,得到标志近似信息的序列a(i)=a(0),a(1),…,a(L-1);或者方式为,图像m的像素是m(i),i=0,1,…,W×H-1,其中W×H为图像m的尺寸,近似信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,W×H-1,其中,q0是大于零的整数,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数;
[0021] 获取近似信息A=a1(i)和近似信息A’=a2(i)后,求取平均近似值[0022] 而且,步骤1.2中,根据精确信息过滤媒体内容资源的具体实现方式为对媒体内容集合中的任一待判断媒体内容逐一处理,处理过程包括以下步骤,
[0023] 步骤7.1,从给定媒体内容M中获取精确信息B,从媒体内容集合中的中任一待判断媒体内容M’中获取精确信息B’;
[0024] 步骤7.2,根据精确信息B和精确信息B’获取平均精确值|B′-B|;
[0025] 步骤7.3,将平均精确值|B′-B|和预设精确阈值T1比较,如果|B′-B|≤T1,判定待判断媒体内容M’与给定媒体内容M相符,将其认定为拷贝媒体内容,否则过滤掉待判断媒体内容M’。
[0026] 而且,所述获取精确信息,方式为将图像m分割为块,每块进行DCT变换,然后将每块中的头5个AC系数提取出来,所获取的信息量L即提取AC系数的总数,得到标志精确信息的序列b(i)=b(0),b(1),…,b(L-1);或者方式为,图像m的像素是m(i),i=0,1,…,W×H-1,其中W×H为图像m的尺寸,精确信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,W×H-1,其中,q0是大于零的整数,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数;
[0027] 获取精确信息B=b1(i)和精确信息B’=b2(i)后,求取平均精确值[0028] 而且,步骤1.3的具体实现方式包括以下步骤,
[0029] 步骤9.1,从给定媒体内容M中获取身份识别信息C,从任一已判断为拷贝媒体内容的待判断媒体内容M’中获取身份识别信息C’;
[0030] 步骤9.2,参照预存在用户码数据库中的第j个用户码Fj(j=0,1,…,S-1),其中S是用户码的个数,获取第j个身份识别信息值
[0031] 步骤9.3,比较第j个身份识别信息值和预设身份识别阈值T2,如果≥T2,判定第j个用户为非法传播用户,否则调整j值并返回执行步骤9.2和9.3,直到找到非法传播用户。
[0032] 而且,所述获取身份识别信息,方式为将图像m分割为块,每块进行DCT变换,然后将每块中的第6~15个AC系数提取出来,所获取的信息量L即提取AC系数的总数,得到标志身份识别信息的序列c(i)=c(0),c(1),…,c(L-1);或者方式为,图像m的像素是m(i),i=0,1,…,W×H-1,其中W×H为图像m的尺寸,精确信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,W×H-1,其中,q0、q1是大于零的整数,且q0>q1,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数;
[0033] 获取身份识别信息C=c1(i)和身份识别信息C’=c2(i)后,求取第j个身份识别信息值
[0034] 本发明提供了一种适应在互联网等公用网络环境中有效跟踪非法拷贝和追踪非法传播用户的技术方案。网络中包含的媒体内容是海量数据,本发明首先按照与给定媒体内容相同类型的标准搜索,然后按照具有相似性的标准根据近似信息初步过滤,最后根据精确信息过滤确定出与给定媒体内容相符的拷贝媒体内容,即可按照身份识别信息追索出非法传播用户。通过分层过滤实现追踪可以有效降低处理信息量,因此具有高效率性。本发明还提供了近似信息、精确信息和身份识别信息的提取方案,进一步提高了追踪准确性。

附图说明

[0035] 图1为本发明实施例原理示意图;
[0036] 图2为本发明实施例媒体侦探搜索示意图。
[0037] 图3为本发明实施例分层过滤追踪示意图。

具体实施方式

[0038] 以下结合附图详细说明本发明的技术方案:
[0039] 参见附图1,本发明的技术方案是首先进行媒体侦探搜索,从网络搜集获取媒体内容资源,然后通过分层过滤实现追踪。实施时,可以从网络中收集与给定媒体内容类型相同的媒体内容后,存储到多媒体数据库中,以便作为媒体内容资源提供。本发明实施例是从互联网中进行多媒体侦探,搜索出所有多媒体构成多媒体库源,即是媒体内容资源。参见附图2,本发明实施例的媒体侦探搜索分为两步骤:获取给定媒体内容的媒体类型信息;以所得媒体类型信息为关键词,从网络中收集与给定媒体内容类型相同的媒体内容,作为媒体内容资源。给定媒体内容的类型可由头文件信息决定。按照先行多媒体格式标准,互联网中每一媒体对象都应包含说明媒体类型的头文件信息,因此实现非常方便。具体实施时也可考虑通过媒体内容长度等信息进行搜索。
[0040] 媒体内容可以分割为几个部分,包括近似信息、精确信息、身份识别信息等互相独立从最有意义到最无意义的排序的信息。意义表明对媒体内容质量的重要性。因此本发明利用这些信息进行分层过滤:第一层过滤,用于根据近似信息过滤媒体内容资源,得到与给定媒体内容具有相似性的媒体内容集合,可简称为媒体集合。第二层过滤,用于根据精确信息过滤媒体内容集合,得到与给定媒体内容相符的拷贝媒体内容,由于往往不止搜索出一份拷贝媒体内容,也简称为拷贝集合。媒体集合和拷贝集合表达了整体的含义,具体实施时,可以将集合内容整体收集存储后进行下一层过滤,也可以采用更高效的实时处理做法,直接将本层过滤得到属于相应集合中的待判断媒体内容M’送入下层过滤。第三层过滤,用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息,然后参照预存在用户码数据库中的用户码,追踪到非法的拷贝媒体内容和非法传播用户。
[0041] 具体实施时,提取身份识别信息的方式与媒体内容在分发给用户之前加入数字指纹的方式有关。简要的说,就是用户码F嵌入到媒体内容X,就会得到X’传送到用户端。本发明将每个用户相应的用户码预存在用户码数据库中,就可供过滤时进行比对。现有技术有多种编码嵌入方法在媒体内容中嵌入用户码,例如参考文献[1][2][3],本发明实施例采取最常用的加性嵌入方法[4]。提取身份识别信息是追踪到非法传播用户的关键,具体实施时提取近似信息、精确信息的方式可以参考身份识别信息的提取情况。
[0042] [1]I.J.Cox,J.Kilian,T.Leighton and T.Shamoon:Secure SpreadSpectrum Watermarking for Multimedia.IEEE Trans.on Image Processing,Vol.6,No.12.(1997)1673-1687.
[0043] [2]Qiang Cheng and Thomas S.Huang:Optimum Detection and Decoding ofMultiplicative Watermarks in DFT Domain.Proceedings of IEEEInternational Conference on Acoustics,Speech and Processing,Vol.4.(2002)3477-3480.[0044] [3]P.Bas,J.-M.Chassery and B.Macq:Geometrically InvariantWatermarking Using Feature Points.IEEE Trans.Image Processing,Vol.11,No.9.(2002)1014-1028.[0045] [4]Q.Cheng,T.S.Huang.An Additive Approach toTransform-DomainInformation Hiding and Optimum Detection Structure.IEEE Transactionson Multimedia,Vol.3,No.3,pp.273-284,2001.
[0046] 本发明提供了进一步方案,通过近似信息、精确信息、身份识别信息计算出一个平均数值,然后与预设阀值比较,从而实现过滤。参见附图3,本发明实施例的分层过滤方式如下:
[0047] 第一层过滤:从给定媒体内容M中获取近似信息A,从媒体内容资源中任一待判断媒体内容M’中获取近似信息A’;根据近似信息A和近似信息A’获取平均近似值|A′-A|;将平均近似值和预设近似阈值T0比较,如果|A′-A|≤T0,判定待判断媒体内容M’与给定媒体内容M具有相似性,加入媒体内容集合,否则过滤掉待判断媒体内容M’。本发明实施例还提供了获取近似信息的方式。方式一为将图像m分割为块,每块进行DCT变换,然后将每块的DC系数提取出来,所获取的信息量L即提取DC系数的个数,得到标志近似信息的序列a(i)=a(0),a(1),…,a(L-1)。方式二为,图像m的像素是m(i),i=0,1,…,W×H-1,其中W×H为图像m的尺寸,近似信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,W×H-1,其中,q0是大于零的整数,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数。获取近似信息A=a1(i)和近似信息A’=a2(i),平均近似值
[0048] 第二层过滤:从给定媒体内容M中获取精确信息B,从媒体内容集合中的中任一待判断媒体内容M’中获取精确信息B’;根据精确信息B和精确信息B’获取平均精确值|B′-B|;将平均精确值|B′-B|和预设精确阈值T1比较,如果|B′-B|≤T1,判定待判断媒体内容M’与给定媒体内容M相符,将其认定为拷贝媒体内容,否则过滤掉待判断媒体内容M’。本发明实施例还提供了获取精确信息的方式。方式一为将图像m分割为块,每块进行DCT变换,然后将每块中的头5个AC系数提取出来,所获取的信息量L即提取AC系数的总数,得到标志精确信息的序列b(i)=b(0),b(1),…,b(L-1)。方式二为,图像m的像素是m(i),i=0,1,…,W×H-1,其中W×H为图像m的尺寸,精确信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,W×H-1,其中,q0是大于零的整数,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数。获取精确信息B=b1(i)和精确信息B’=b2(i),平均精确值
[0049] 第三层过滤:从给定媒体内容M中获取身份识别信息C,从任一已判断为拷贝媒体内容的待判断媒体内容M’中获取身份识别信息C’;参照预存在用户码数据库中的第j个用户码Fj(j=0,1,…,S-1),其中S是用户码的个数,获取第j个身份识别信息值;比较第j个身份识别信息值和预设身份识别阈值T2,如果≥T2,判定第j个用户为非法传播用户,否则调整j值并返回从上步骤开始执行,直到找到非法传播用户。本发明实施例还提供了获取身份识别信息的方式。方式一为获取身份识别信息的方式为,将图像m分割为块,每块进行DCT变换,然后将每块中的第6~15个AC系数提取出来,所获取的信息量L即提取AC系数的总数,得到标志身份识别信息的序列c(i)=c(0),c(1),…,c(L-1)。方式二为,图像m的像素是m(i),i=0,1,…,W×H-1,其中W×H为图像m的尺寸,精确信息由分开的像素构成,提取分开的像素采用计算公式 i=0,1,…,W×H-1,其中,q0、q1是大于零
的整数,且q0>q1,符号 表示小于等于x的整数,所获取的信息量L即为提取所得像素个数。获取身份识别信息C=c1(i)和身份识别信息C’=c2(i),第j个身份识别信息值[0050] 实施时,预设近似阈值T0、预设精确阈值T1、预设身份识别阈值T2是比零大的阈值即可,可以根据过滤精度需要设定。根据实施时用户码嵌入方式具体情况,可以对系数选取数目进行选择,或者对计算公式进行相应调整。