表示出现在图像中的目标的方法、设备和计算机系统转让专利

申请号 : CN200910132822.4

文献号 : CN101539997B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : M·波贝尔

申请人 : 三菱电机株式会社

摘要 :

表示出现在图像中的目标的方法、设备和计算机系统。一种通过处理与图像对应的信号来表示出现在静止或视频图像中的目标的方法,所述方法包括:导出表示所述目标的形状的多组坐标值并且量化所述坐标值来导出该形状的编码表示,其中,对于第一组坐标值的给定坐标值小于第二组坐标值中的对应坐标值,向所述第一组值的给定坐标值的量化表示分配的比特数目少于向所述第二组值的对应坐标值的量化表示分配的比特数目。

权利要求 :

1.一种通过处理与图像对应的信号来表示出现在静止或视频图像中的目标的方法,所述方法包括:导出表示所述目标的形状的多组坐标值并且量化所述坐标值来导出该形状的编码表示,其中对于第一组坐标值的给定坐标值小于第二组坐标值中的对应坐标值,向所述第一组值的给定坐标值的量化表示分配的比特数目少于向所述第二组值的对应坐标值的量化表示分配的比特数目。

2.如权利要求1所述的方法,其中第一组坐标值的给定坐标值的量化范围至少基于第二组坐标值的对应坐标值。

3.如权利要求2所述的方法,其中对于递减的坐标值的序列,每一坐标值的量化范围是基于它们存在的一个或多个先前的、比所述每个坐标值高的坐标值的。

4.如权利要求1到3的任何一项所述的方法,其中在所述给定坐标值被量化的范围对于第一组坐标值比对于第二组坐标值要小。

5.如权利要求1到3的任何一项所述的方法,其中向第一组值的给定坐标值的量化表示分配的比特数目与向第二组值的对应坐标值的量化表示分配的比特数目相同。

6.如权利要求1到3的任何一项所述的方法,其中这些坐标组是坐标对,并且对于每一对坐标值的至少一个坐标值,所述量化范围是变化的。

7.如权利要求6所述的方法,其中所述坐标对对应于形状的CSS表示中的峰值的位置。

8.如权利要求7所述的方法,其中变化的量化范围用于与峰值高度对应的坐标值。

9.如权利要求1到3的任何一项所述的方法,其中对于多个坐标值,该量化范围是相同的。

10.如权利要求1到3的任何一项所述的方法,包括按照递减或递增的大小对坐标值进行排序的步骤。

11.一种通过处理与图像对应的信号来搜索静止或视频图像中的目标的方法,所述方法包括:输入查询目标,导出所述查询目标的表示,把所述表示与使用如前面的权利要求中任何一项所述的方法所导出的表示进行比较,并且选择和显示其表示指示了与所述查询的相似程度的那些目标。

12.一种设备,包括用于执行如权利要求1至11中任何一项所述的方法的步骤的装置。

13.如权利要求12的设备,还包括用于存储图像和/或图像表示的存储装置。

说明书 :

表示出现在图像中的目标的方法、设备和计算机系统

技术领域

[0001] 本发明涉及例如出现在诸如在多媒体数据库中所存储的图像之类的静止或视频图像中的目标的表示,并且特别地涉及这样一种表示的编码。

背景技术

[0002] 在诸如图像或视频文库之类的应用中,希望的是:对于出现在静止或视频图像中的目标或目标各个部分的轮廓或形状具有一种有效表示和存储。基于形状的索引和重现(retricval)的一种已知技术使用曲率缩放空间(CSS)(Curvature Scale Space)表示。CSS表示的细节可以在文件“Robust and Efficient Shape Indexing throughCurvature Scale Space”(通过曲率缩放空间的强大并有效的形状索引)Proc.British Machine Vision conference,第53-62页,Edinburgh,UK,1996和“Indexing an Image Database by ShapeContent using Curvature Scale Space”(通过形状内容使用曲率缩放空间来索引一个图像数据库)Proc.IHE Colloquium onIntelligent Databases,London 1996,中找到。两篇文章都是F.Mokhtarian、S.Abbasi和J.Kittler的,将其内容引用在此供参考。

发明内容

[0003] CSS表示使用目标轮廓的一个曲率函数,从该轮廓上的一个任意点开始。因为轮廓形状被使形状平滑的一系列失真所演变故研究曲率函数。更明确地,计算以高斯滤波器系列旋转的曲率函数的导数的零交叉。将该零交叉被绘制在一个曲线图上,通称为曲率缩放空间,在此X轴是该曲线的标准化弧长而Y轴是演变参数,更明确地,是所应用的滤波器的参数。曲线图上的曲线环绕成轮廓特性。目标轮廓的每一凸形或凹形部分对应于该CSS图像中的一个环路。CSS图像中的最凸出的环路的峰值坐标被使用作为该轮廓的一个表示。
[0004] 为了搜索与输入目标形状匹配的储存在数据库中的图像中的目标,计算出一个输入形状的CSS表示。通过使用匹配算法来比较在各个CSS图像中的峰值的位置和高度,从而确定输入形状和储存形状之间的相似性。
[0005] 表示一个描述符中的轮廓形状性质所需要的比特数目应该尽可能小以便进行有效储存和传输。
[0006] 按照本发明,提供了一种通过处理与图像对应的信号来表示出现在静止或视频图像中的目标的方法,所述方法包括:导出表示所述目标的形状的多组坐标值并且量化所述坐标值来导出该形状的编码表示,其中,对于第一组坐标值的给定坐标值小于第二组坐标值中的对应坐标值,向所述第一组值的给定坐标值的量化表示分配的比特数目少于向所述第二组值的对应坐标值的量化表示分配的比特数目。
[0007] 本发明能够提供一个非常简洁的表示(根据用于存储的比特数目)而在重现性能中没有任何显著的恶化。

附图说明

[0008] 下面将参考附图描述的本发明的实施例,附图中:
[0009] 图1是一个视频数据库系统的框图;
[0010] 图2是一个轮廓的CSS表示;
[0011] 图3是说明CSS表示的坐标值编码的图表。

具体实施方式

[0012] 图1示出了根据本发明实施例的一个计算机化的视频数据库系统。该系统包括计算机形式的一个控制单元2,监视器形式的一个显示单元4,鼠标形式的一个定点设备6,包括储存的静止和视频图像的一个图像数据库8以及一个描述符数据库10,该描述符数据库10存储出现在储存在图像数据库8中的图像中的目标或目标各个部分的描述符。
[0013] 出现在图像数据库中的图像中每一感兴趣目标的形状描述符被控制单元2导出并且被储存在描述符数据库10中。控制单元2导出在执行如下所述方法的一个适当程序控制下操作的描述符。
[0014] 首先,对于一个给定目标轮廓,轮廓的一个CSS表示被导出。使用在上面提及的文件之一中描述的已知方法来执行之。
[0015] 更明确地,该轮廓通过一个表示Ψ={(x(u),y(u),u∈[0,1]}来表示,在此,u是一个标准化弧长参数而(x,y)是目标轮廓上的点的坐标。
[0016] 该轮廓通过用Gaussan核心g(u,σ)或类似的核心旋转Ψ而被平滑,并且演变的曲线的曲率零交叉被检查作为σ变量。使用曲率的下列表达式来识别零交叉。
[0017]
[0018] 在此
[0019] X(u,σ)=x(u)*g(u,σ) Y(u,σ)=y(u)*g(u,σ)
[0020] 和
[0021] Xu(u,σ)=x(u)*gu(u,σ) Xuu(u,σ)=x(u)*guu(u,σ)[0022] 在上面,*表示卷积而下标表示导数。
[0023] 曲率零交叉的数目改变为σ变量,并且当σ十分高时,Ψ成为没有零交叉的一个凸形曲线。
[0024] 零交叉(u,σ)被绘制在一曲线图上,通称CSS图像空间。这导致原始轮廓的多个曲线特性。特性曲线的峰值被识别并且相应的坐标被提取和储存。在一般的术语中,这给出了一组n个坐标对[(x1,y1),(x2,y2)(xn,yn)],在此,n是峰值数目,而xi是第i个峰值的弧长位置并且yi是峰值高度。
[0025] 特性曲线的顺序和位置以及它们出现在CSS图像空间中的相应峰值取决于如上所述的曲率函数的起始点。峰值坐标被重新排列,如下所述。
[0026] 让我们假定从中提取参数的轮廓有n个峰值,峰值参数形成一组{(x1,y1),(x2,2 n n
y),...(x,y)},如图2所示。然后根据高度按照递增或递减的顺序排列峰值{(x1,y1),(x2,y2),(xn,yn)}(下标表示在排序之后的峰值序号)。让我们假定按照递减的顺序排列峰值,所以最高峰值是第一个(x1y1),并且每一后续峰值低于或等于该组中的它的前者(图
3)。
[0027] 这些重新排列的峰值坐标形成目标轮廓的描述符的基础。诸如环状C、偏心率E和紧密度D之类的另外的形状参数(其中某些从所谓的“原型轮廓形状”中被提取)还可以被计算并储存来使用在如共同悬而未决的申请no.GB 9916684.5中所述的匹配处理中,该申请的内容在此被参考结合。
[0028] 接下来,执行峰值高度的粗略量化。对于每个峰值,执行量化的范围是不同的,并且取决于较高的峰值(例如,在作为被排列组中的前者的那些峰值的高度)。
[0029] 参见图3,第一峰值在范围I1=[0,Ymax]上被量化,在此,Ymax是对某一类形状所期待的峰值的最大值。每一剩余峰值被量化到该范围,这取决于一个或好几个早先峰值的数值。例如,峰值y2在间隔I2=[0,y1]上被量化,(图3)峰值y3在间隔[0,y2]上被量化。
[0030] 在这个实施例中,使用7比特把第一峰值量化在间隔[0,1024]上并且在适当的各个范围上把剩余峰值量化到比特3。假如第一峰值的高度是893,则说,那么使用3比特在范围[0,893]上把y2量化,等等。因此,对于峰值y2到y5,量化间隔被降低,尽管使用较少的比特,但给出更大的精确度。每个峰值的X坐标被量化到在[0,1]间隔上均匀分布的6比特。x值可以是原始X值,例如如图2所示,或者在沿着x轴偏移一个数量之后,如此以使最高峰值的x值在0处。
[0031] 让我们检查从本发明中的获益。在传统解决方案中,每一峰值需要两个浮点数,每一个是4字节。因此,对于具有9个峰值的一个典型形状,存储规格是9*2*4=72字节(576比特)。在建议的实施例的应用之后,第一峰值需要7个比特,假定x值被作为零来对待,并且每个连续峰值6+3比特,因此总共为79比特。
[0032] 代替一个范围[0,yi],一个范围(0,R(yi))可以被使用,在此,R(yi)是在反量化之后的值yi的重建。
[0033] 具有类似效果的另一个实施例通过各个早先峰值的数值划分每一峰值{y2,y3,...,yn}(除最高一个之外)的高度。在此操作之后,所有yi的范围是来自组(0,1]中。这允许对于所有的yi使用许多粗略量化。
[0034] 在任一示例中,可以通过对于所有剩余峰值的最高峰值加4或3比特量化来使用7或6比特量化从而获得优良的结果。也可以使用其它数目的比特。
[0035] 上面的操作还可以在坐标值已经蒙受一个副法线和一个非线性变换之后被执行,正如在共同悬而未决的申请no.GB9915699.4中所述,该申请的内容在此被参考结合。代替或者像y值一样,可以沿着如上所述的线路来编码x坐标。
[0036] 通过适当的修改,该结果值可以被储存,例如用来使用在一个适当的匹配程序中,比如在我们的共同悬而未决的申请GB9915699.4,GB9915698.6和GB9916684.5中所描述的,例如在执行匹配之前对被储存描述符执行反量化。