自适应内核密度估计运动检测装置与方法转让专利

申请号 : CN200710177310.0

文献号 : CN101437113B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘迎建刘昌平黄磊徐东彬

申请人 : 汉王科技股份有限公司

摘要 :

本发明提出了一种自适应内核密度估计运动检测装置和方法。根据本发明的自适应内核密度估计运动检测装置包括:接收单元,用于接收输入的视频帧;初始化单元,用于初始化背景模型和帧间差分背景模型;概率计算统计单元,用于针对当前视频帧的每个像素,根据背景样本,计算该像素的内核密度估计概率,并统计当前视频帧的像素的内核密度估计概率直方图;分类单元,用于自适应地求取内核密度估计概率直方图的前景阈值和背景阈值,如果某一像素的内核密度估计概率小于所述前景阈值,则确定该像素为前景像素;如果该像素的内核密度估计概率大于所述背景阈值,则确定该像素为背景像素。

权利要求 :

1.一种自适应内核密度估计运动检测装置,包括:

接收单元,用于接收输入的视频帧;

初始化单元,用于初始化背景模型和帧间差分背景模型;

概率计算统计单元,用于针对当前视频帧的每个像素,根据背景样本,计算该像素的内核密度估计概率,并统计当前视频帧的像素的内核密度估计概率直方图;

分类单元,用于自适应地求取内核密度估计概率直方图的前景阈值和背景阈值,如果某一像素的内核密度估计概率小于所述前景阈值,则确定该像素为前景像素;如果该像素的内核密度估计概率大于所述背景阈值,则确定该像素为背景像素,其中,所述分类单元首先对内核密度估计概率直方图进行平滑和差分,得到差分直方图,然后在差分直方图上,寻找内核密度估计概率直方图变化趋势变缓的起点PL和缓慢变化的终点PR,最后根据PL和PR,确定所述前景阈值和所述背景阈值。

2.根据权利要求1所述的自适应内核密度估计运动检测装置,其特征在于还包括:概率背景更新单元,用于对内核密度估计概率大于所述前景阈值且小于所述背景阈值的像素进行概率背景更新。

3.根据权利要求2所述的自适应内核密度估计运动检测装置,其特征在于所述概率背景更新单元按照先进先出的原则顺序更新背景样本。

4.根据权利要求1所述的自适应内核密度估计运动检测装置,其特征在于还包括:突变背景更新单元,用于根据帧间差分背景模型和分类单元的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。

5.根据权利要求4所述的自适应内核密度估计运动检测装置,其特征在于当帧间差分背景模型确定一像素为背景,而分类单元确定该像素为前景时,所述突变背景更新单元判断该像素为突变像素。

6.根据权利要求4所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。

7.根据权利要求6所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。

8.根据权利要求5所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。

9.根据权利要求8所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。

10.根据权利要求2所述的自适应内核密度估计运动检测装置,其特征在于还包括:突变背景更新单元,用于根据帧间差分背景模型和分类单元的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。

11.根据权利要求10所述的自适应内核密度估计运动检测装置,其特征在于当帧间差分背景模型确定一像素为背景,而分类单元确定该像素为前景时,所述突变背景更新单元判断该像素为突变像素。

12.根据权利要求10所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。

13.根据权利要求12所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。

14.根据权利要求11所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。

15.根据权利要求14所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。

16.根据权利要求3所述的自适应内核密度估计运动检测装置,其特征在于还包括:突变背景更新单元,用于根据帧间差分背景模型和分类单元的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。

17.根据权利要求16所述的自适应内核密度估计运动检测装置,其特征在于当帧间差分背景模型确定一像素为背景,而分类单元确定该像素为前景时,所述突变背景更新单元判断该像素为突变像素。

18.根据权利要求16所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。

19.根据权利要求18所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。

20.根据权利要求17所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。

21.根据权利要求20所述的自适应内核密度估计运动检测装置,其特征在于所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。

22.根据权利要求1~21之一所述的自适应内核密度估计运动检测装置,其特征在于还包括:运动处理单元,用于对检测到的前景像素进行连通域分析,并结合运动目标的先验知识,对于属于同一个目标的区域进行合并,对于属于不同目标的区域进行分割,从而得到完整的运动目标。

23.一种自适应内核密度估计运动检测方法,包括:

接收步骤,接收输入的视频帧;

初始化步骤,初始化背景模型和帧间差分背景模型;

概率计算统计步骤,针对当前视频帧的每个像素,根据背景样本,计算该像素的内核密度估计概率,并统计当前视频帧的像素的内核密度估计概率直方图;

分类步骤,自适应地求取内核密度估计概率直方图的前景阈值和背景阈值,如果某一像素的内核密度估计概率小于所述前景阈值,则确定该像素为前景像素;如果该像素的内核密度估计概率大于所述背景阈值,则确定该像素为背景像素,其中,在所述分类步骤中,首先对内核密度估计概率直方图进行平滑和差分,得到差分直方图,然后在差分直方图上,寻找内核密度估计概率直方图变化趋势变缓的起点PL和缓慢变化的终点PR,最后根据PL和PR,确定所述前景阈值和所述背景阈值。

24.根据权利要求23所述的自适应内核密度估计运动检测方法,其特征在于还包括:概率背景更新步骤,对内核密度估计概率大于所述前景阈值且小于所述背景阈值的像素进行概率背景更新。

25.根据权利要求24所述的自适应内核密度估计运动检测方法,其特征在于在所述概率背景更新步骤中,按照先进先出的原则顺序更新背景样本。

26.根据权利要求23所述的自适应内核密度估计运动检测方法,其特征在于还包括:突变背景更新步骤,根据帧间差分背景模型和分类步骤的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。

27.根据权利要求26所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,当帧间差分背景模型确定一像素为背景,而分类步骤确定该像素为前景时,判断该像素为突变像素。

28.根据权利要求26所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。

29.根据权利要求28所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。

30.根据权利要求27所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。

31.根据权利要求30所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。

32.根据权利要求24所述的自适应内核密度估计运动检测方法,其特征在于还包括:突变背景更新步骤,根据帧间差分背景模型和分类步骤的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。

33.根据权利要求32所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,当帧间差分背景模型确定一像素为背景,而分类步骤确定该像素为前景时,判断该像素为突变像素。

34.根据权利要求32所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。

35.根据权利要求34所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。

36.根据权利要求33所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。

37.根据权利要求36所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。

38.根据权利要求25所述的自适应内核密度估计运动检测方法,其特征在于还包括:突变背景更新步骤,根据帧间差分背景模型和分类步骤的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。

39.根据权利要求38所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,当帧间差分背景模型确定一像素为背景,而分类步骤确定该像素为前景时,判断该像素为突变像素。

40.根据权利要求38所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。

41.根据权利要求40所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。

42.根据权利要求39所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。

43.根据权利要求42所述的自适应内核密度估计运动检测方法,其特征在于在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。

44.根据权利要求23~43之一所述的自适应内核密度估计运动检测方法,其特征在于还包括:运动处理步骤,对检测到的前景像素进行连通域分析,并结合运动目标的先验知识,对于属于同一个目标的区域进行合并,对于属于不同目标的区域进行分割,从而得到完整的运动目标。

说明书 :

自适应内核密度估计运动检测装置与方法

技术领域

[0001] 本发明涉及视频分析领域中的背景模型生成,采用自适应前景、背景阈值的双阈值选择方法进行像素分类。根据本发明的采用双阈值的技术方案能够克服采用单一阈值分类存在的不足,更重要的是,阈值的选择能够自适应地进行,且能适应不同的场景。在此基础上,本发明进一步提出了基于概率的背景更新模型,按照像素的概率来更新背景,能够降低前景对背景的污染程度,有利于运动目标检测。同时,本发明还利用帧间差分背景模型和内核密度估计分类结果来进行突变背景检测,较好地解决了背景突变时所存在的运动目标误检测问题。

背景技术

[0002] 从视频序列中分离出运动目标,是计算机视觉中的重要研究内容,可以应用到交通监测、人的行为识别和人机交互等领域。背景减除技术(Background subtraction)是摄像机静止条件下的一种应用广泛的运动检测技术,为此研究人员提出了不同的方法(参见参考文献[1])。Elgamma等提出了基于内核密度估计(Kernel DensityEstimation,KDE)的非参数背景模型(参见参考文献[2]),该方法能够适应不同的场景;不同于高斯混合模型(GMM),它充分利用最近的历史帧信息来更新背景模型,能够适应复杂的像素分布密度,克服像素值在短时间内发生的频繁变化,因此能得到较准确的估计结果。但是,在参考文献[2]中,通过给定的假正率(False Positive)来选择阈值,这需要有场景的先验知识,对于不同的场景需要人工干预,重新选择。Anurag Mittal和Nikos Paragios根据设定的误报率(false alarmrate)和漏报率(miss probability),通过训练样本调整阈值(参见参考文献[3]),使用该阈值在给定的条件下能够获得相对好的分类结果。但该方法采用单一阈值,这样很难解决误报率和漏报率之间的矛盾,不可避免带来分类误差。特别是,当场景改变时,需要重新选择样本进行训练,才能得到适用于该场景的阈值。

发明内容

[0003] 本发明的目的是提供一种自适应的内核密度估计运动检测方案。首先这种方案,对概率直方图进行分析,提出了一种自适应前景阈值和背景阈值的双阈值选择方法,该方法不需要对样本进行训练,可以根据场景的不同,自适应调整阈值,克服了采用单一阈值分类引起的误差。针对背景更新机制,本发明提出了基于概率的更新背景模型方法,能够得到更为合理的背景,有利于运动目标的检测。此外,本发明还提出了一种利用帧间差分背景模型和KDE分类结果的突变背景检测装置和方法,较好地解决了背景发生突变时的运动目标误检测问题。
[0004] 为了实现上述目的,根据本发明的第一方案,提出了一种自适应内核密度估计运动检测装置,包括:接收单元,用于接收输入的视频帧;初始化单元,用于初始化背景模型和帧间差分背景模型;概率计算统计单元,用于针对当前视频帧的每个像素,根据背景样本,计算该像素的内核密度估计概率,并统计当前视频帧的像素的内核密度估计概率直方图;分类单元,用于自适应地求取内核密度估计概率直方图的前景阈值和背景阈值,如果某一像素的内核密度估计概率小于所述前景阈值,则确定该像素为前景像素;如果该像素的内核密度估计概率大于所述背景阈值,则确定该像素为背景像素。所述分类单元首先对内核密度估计概率直方图进行平滑和差分,得到差分直方图,然后在差分直方图上,寻找内核密度估计概率直方图变化趋势变缓的起点PL和缓慢变化的终点PR,最后根据PL和PR,确定所述前景阈值和所述背景阈值。
[0005] 优选地,所述自适应内核密度估计运动检测装置还包括:概率背景更新单元,用于对内核密度估计概率大于所述前景阈值且小于所述背景阈值的像素进行概率背景更新。
[0006] 优选地,所述概率背景更新单元按照先进先出的原则顺序更新背景样本。
[0007] 优选地,所述自适应内核密度估计运动检测装置还包括:突变背景更新单元,用于根据帧间差分背景模型和分类单元的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。
[0008] 优选地,当帧间差分背景模型确定一像素为背景,而分类单元确定该像素为前景时,所述突变背景更新单元判断该像素为突变像素。
[0009] 优选地,所述突变背景更新单元对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,所述突变背景更新单元才对与该连通域相关的突变像素进行突变背景更新。
[0010] 优选地,所述突变背景更新单元以当前视频帧后的预定多个视频帧来更新背景样本。
[0011] 优选地,所述自适应内核密度估计运动检测装置还包括:运动处理单元,用于对检测到的前景像素进行连通域分析,并结合运动目标的先验知识,对于属于同一个目标的区域进行合并,对于属于不同目标的区域进行分割,从而得到完整的运动目标。
[0012] 为了实现上述目的,根据本发明的第二方案,提出了一种自适应内核密度估计运动检测方法,包括:接收步骤,接收输入的视频帧;初始化步骤,初始化背景模型和帧间差分背景模型;概率计算统计步骤,针对当前视频帧的每个像素,根据背景样本,计算该像素的内核密度估计概率,并统计当前视频帧的像素的内核密度估计概率直方图;分类步骤,自适应地求取内核密度估计概率直方图的前景阈值和背景阈值,如果某一像素的内核密度估计概率小于所述前景阈值,则确定该像素为前景像素;如果该像素的内核密度估计概率大于所述背景阈值,则确定该像素为背景像素。在所述分类步骤中,首先对内核密度估计概率直方图进行平滑和差分,得到差分直方图,然后在差分直方图上,寻找内核密度估计概率直方图变化趋势变缓的起点PL和缓慢变化的终点PR,最后根据PL和PR,确定所述前景阈值和所述背景阈值。
[0013] 优选地,所述自适应内核密度估计运动检测方法还包括:概率背景更新步骤,对内核密度估计概率大于所述前景阈值且小于所述背景阈值的像素进行概率背景更新。
[0014] 优选地,在所述概率背景更新步骤中,按照先进先出的原则顺序更新背景样本。
[0015] 优选地,所述自适应内核密度估计运动检测方法还包括:突变背景更新步骤,根据帧间差分背景模型和分类步骤的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。
[0016] 优选地,在所述突变背景更新步骤中,当帧间差分背景模型确定一像素为背景,而分类步骤确定该像素为前景时,判断该像素为突变像素。
[0017] 优选地,在所述突变背景更新步骤中,对所有突变像素进行连通域分析,提取连通域的多个预定特征,当且仅当连通域的预定特征满足预定条件时,才对与该连通域相关的突变像素进行突变背景更新。
[0018] 优选地,在所述突变背景更新步骤中,以当前视频帧后的预定多个视频帧来更新背景样本。
[0019] 优选地,所述自适应内核密度估计运动检测方法还包括:运动处理步骤,对检测到的前景像素进行连通域分析,并结合运动目标的先验知识,对于属于同一个目标的区域进行合并,对于属于不同目标的区域进行分割,从而得到完整的运动目标。
[0020] 本发明具有以下优点和技术效果:采用双阈值能够克服单一阈值的不足,更重要的是,阈值的选择不需要人工干预,能够自动进行,且能适应不同的场景。在此基础上,本发明提出了基于概率的背景更新模型。该模型利用KDE概率,结合前景和背景阈值的分类结果,把像素按照不同的概率更新到背景中,从而减轻了前景对背景的污染程度,能够得到更为合理的背景模型,有利于运动目标的检测。此外,本发明还利用帧间差分的快速性,结合KDE检测结果,较好地解决了背景突变的更新和运动检测等问题。
[0021] 附图说明
[0022] 通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
[0023] 图1是根据本发明的自适应内核密度估计运动检测方法的整体流程图;
[0024] 图2示出了像素的概率分布及其直方图;
[0025] 图3示出了局部概率直方图、差分直方图和分割结果;
[0026] 图4示出了像素的概率处于不同范围时的分割结果;
[0027] 图5示出了采用概率更新得到的背景和相应的分割结果;
[0028] 图6是根据本发明的自适应内核密度估计运动检测装置的整体方框图。

具体实施方式

[0029] 下面参照附图对本发明的优选实施例进行详细说明,在描述过程中省略了对于本发明来说是不必要的细节和功能,以防止对本发明的理解造成混淆。
[0030] 图1示出了根据本发明的自适应内核密度估计运动检测方法的整体流程图。以下将参考图1,对根据本发明的自适应内核密度估计运动检测方法的各个步骤进行详细描述。
[0031] 1.初始化模型参数(步骤S100和S102)
[0032] 对输入的视频帧(步骤S100),初始化背景模型、帧间差分背景模型,初始化系统的其他参数,例如:采样的视频帧数为50。(步骤S102)。
[0033] 2.计算内核密度估计(KDE)概率(步骤S104)
[0034] 假定视频帧中有M个像素点,每个像素点有N个历史采样作为对应像素的背景样本,则第i个像素点的第j个背景样本的像素值为xi,j,i=1...M、j=1...N。在t时刻视频帧中第i个像素点的像素值为x(t)i,则t时刻像素点i概率Pr(x(t)i)可以通过公式(1)进行估计:
[0035]
[0036] 其中x(t)i,j为t时刻视频帧中第i个像素点的第j个背景样本的像素值,K为核估计子,如果K取正态分布N(0,∑),公式(1)变形为如下所示的公式(2):
[0037]
[0038] 其中d为像素的颜色分量特征维数,x(t)im为x(t)i的第m个颜色分量。对于RGB格式的彩色图像,像素的颜色分量可以取R、G、B像素值,假设像素的R、G、B相互独立,这样,此时的特征维数d为3;σi,m,m=1…3为第i个像素对应的R、G、B颜色分量的核宽,则构成的第i个像素对应的三维核宽矩阵∑i为:
[0039]
[0040] 3.统计像素分布得到概率直方图(步骤S106)
[0041] 按照公式(2),计算输入视频帧中t时刻M个像素的概率Pr(x(t)i),i=1...M,为了计算方便,将公式(2)修改为如下所示的公式(3),计算N个采样的概率和:
[0042]
[0043] 按照参考文献[2]中的方法进行估计第i个像素点的核宽σi,m,当所有核宽σi,m的最大可能取值σmax和最小可能取值σmin确定后,在任意时刻t,对于像素的N个采样来说,t时刻视频帧中的第i个像素点概率Pr(x(t)i)的可能最大值Prmax可由公式(4)确定:
[0044]
[0045] Pr(x(t)i)可能取值的最小值Prmin,不仅取决于σmax,还由公式(3)中指数项决定,可以取0。把[0,Prmax]乘以比例因子β进行量化,得到[0,Prh]。然后,遍历所有像素的概率,形成概率分布直方图histp(如公式(5)所示):
[0046]
[0047] 图2示出了像素的概率分布及其直方图。如图2所示,(a)为原始图像,场景中的运动目标为行人,(b)为(a)的概率分布,x轴方向对应图像的宽度方向,y轴方向对应图像的高度方向,z轴代表概率值的大小,(c)为(b)的俯视图,x轴方向对应图像的宽度方向,y轴方向对应图像的高度方向,(d)概率直方图histp,u轴表示像素的概率值取值,v轴表示概率等于该取值的像素数目。
[0048] 4.自适应前景阈值和背景阈值的选择(步骤S108)
[0049] 用高斯核函数对histp进行平滑得到histps(图2中的(d))。对histps(i)及histps(i+1)按照公式(6)进行差分,在此用预定小阈值th来进一步去除干扰,得到差分直方图histdiff(如公式(6)所示):
[0050]
[0051] diff=abs(histps(i+1)-histps(i))
[0052] 图3示出了局部概率直方图、差分直方图和分割结果。如图3所示,(a)为图2(d)的局部放大图,(b)为由公式(6)得到的与图2(d)对应的差分直方图,(c)为(b)的局部放大图,图中u轴表示像素的概率值取值,v轴表示概率等于该取值的像素数目。(d)为选取差分直方图的第一个零点作为前景阈值(该点为直方图变化趋于稳定的点,图3(c)中为6)的分割结果,x轴方向对应图像的宽度方向,y轴方向对应图像的高度方向。
[0053] 为此,如下选取前景阈值Thf:
[0054] 1) 通过差分直方图histdiff(图3中的(b))寻找直方图由陡变缓的转折点Pz(图3(c)中标出),即Pz满足下式:
[0055]
[0056] 2) 在差分直方图histdiff(图3中的(b))上从Pz开始向右侧寻找变化趋势变缓的起点PL(图3(c)中标出);
[0057] 3) 在差分直方图histdiff(图3中的(b))上从PL开始向右侧寻找缓慢变化的终点PR(图3(c)中标出),直到Pmax(可以由场景中的先验知识得到,为目标在整个场景中所占的最大比例,图3(c)中标出)止;
[0058] 4) 当Thf取PL时会带来漏掉部分前景目标,当Thf取PR时会把部分背景误检测为前景,为此按照公式(8)进行处理,确定适当的前景阈值Thf,其中a为大于1的系数:
[0059] Thf=PL+(PR-PL)/a (8)
[0060] 自适应背景阈值Thb的选取是为了减少把前景错分为背景的概率,从而有利于合理更新背景。如果直接采用Thf把背景和前景分成两类,会把一些属于前景的像素当作背景,并更新到背景样本中,这样会造成前景像素的漏检测。因此,需要适当提高判断为背景像素的阈值。 因此,在本发明中,把PR作为背景阈值:
[0061] Thb=PR (9)
[0062] 图4示出了像素的概率处于不同范围时的分割结果:
[0063] (a)0≤Pr(x(t)i)<PL时的结果,从图中可以看出运动目标(行人)的部分像素出现缺失,但噪音很小;(b)为PL≤Pr(x(t)i)<PR时的结果,原来由运动到静止的目标(栏杆)也被检测出来,且存在较多噪声;(c)为Pr(x(t)i)≥PR时的分割结果,从图中可以看出只有少量属于前景的像素被检测为背景;(d)为采用公式(8)求取阈值并按照公式(10)进行分类的结果,运动目标(行人)漏检测像素很少,有少量属于背景的像素被当作前景来检测。图中x轴方向对应图像的宽度方向,y轴方向对应图像的高度方向。
[0064] 5.像素分类(步骤S110)
[0065] 依据像素的概率值,按照下式(10)进行分类,如果某一像素的概率值小于前景阈值Thf,则确定该像素为运动像素,并将该像素输出至运动处理单元进行处理。
[0066] Pr(x(t)i)<Thf (10)
[0067] 否则按照第6步进行背景更新。
[0068] 6.基于概率的背景更新模型(步骤S120、S122和S124)
[0069] 由公式(3)得到的像素概率,实际上反映了该像素和背景的相似程度。因此,可以把概率值作为背景更新的依据。考虑在t时刻概率Pr(x(t)i),显然如果Pr(x(t)i)小于前景阈值Thf,像素x(t)i为前景,在背景更新时不做考虑;如果Pr(x(t)i)大于背景阈值Thb,像素x(t)i为背景,可以直接把该像素更新到背景中去;概率介于Thf和Thb之间的像素,可以按照公式(11)进行如下处理,再根据概率进行更新:
[0070]
[0071] 在得到当前帧用于更新背景的概率Prb(x(t)i)之后,就可以按照概率更新背景样本。更新背景样本时采用先入先出的原则顺序进行。例如在t-1时刻更新第i个像素的第j-1个背景样本x(t)i,j-1,则在t时刻更新第i个像素的第j个背景样本x(t)i,j。假设在t-1时刻更新第i个像素的第j-1个背景样本x(t)i,j-1,则t时刻的样本更新如公式(12)所示,其中i=1...M:
[0072] x(t)i,j=Prb(x(t)i)*x(t)i+(1-Prb(x(t)i))*x(t-1)i,j (12)如果更新了第i个像素的背景样本,则按照参考文献[2]中的方法重新估计第i个像素的核宽σi,m。
[0073] 例如,在t-1时刻更新第i个像素的第9个背景样本x(t)i,9,则在t时刻更新第i个像素的第10个背景样本x(t)i,10。假设x(t)i为130,Prb(x(t)i)为0.8,x(t-1)i,10为120,则更新后的背景样本为:
[0074] x(t)i,10=0.8*130+(1-0.8)*120=128。
[0075] 图5示出了采用概率更新得到的背景和前景检测结果:
[0076] (a)为原始视频中的一帧,(b)为该时刻没有采用概率更新得到的背景,(c)为该时刻采用概率更新得到的背景,(d)为采用本文算法得到的分割结果,图中的白色像素为检测到的运动目标。对比图5中的(b)和(c)中的粗实线方框内的区域,采用概率更新得到的背景,只有少量的前景区域被更新到背景中去,而没有采用概率更新,则较多的前景区域被更新到背景中去。
[0077] 采用公式(12)可以对属于背景的像素进行可靠更新,对于属于前景而误检测为背景的像素以概率进行更新,而属于前景的像素不作更新,从而避免了对背景的污染,并且能够反映背景的缓慢变化。
[0078] 按照第7步进行背景突变检测,并进行相应的更新。
[0079] 7.突变背景的检测、更新模型(步骤S114、S116和S118)
[0080] 设B(i)、C(i)、L(i)分别对应位置像素i的背景像素值、当前帧像素值和前一帧的像素值,其中th1为一个预先设定的小阈值,Cn(i)用来统计背景发生变化的计数变量(如公式(13)所示):
[0081]
[0082] 当Cn(i)满足公式(14)时,则认为该像素i是背景,需要以当前像素值C(i)来更新对应位置的背景像素值B(i),其中th2为更新率:
[0083]
[0084] 背景更新的快慢取决于更新率th2,由于不涉及复杂的运算,因此运行速度很快。当th2取值较小时,会把前景更新到背景中去,从而检测不到前景目标;当更新率较高时,变化的背景可能不会得到及时更新,误把背景当作前景目标。在本发明中,只是利用上述更新方案的快速更新特性,作为背景发生变化的依据,因此th2的选择不易太高,例如,可以选取以下数值:30~40之间的整数值,如30、35、40等。
[0085] 属于背景的像素,在背景未被更新之前,可能会被KDE检测为前景,可以利用这种特性来检测背景的显著变化,如公式(15)所示,其中B表示背景像素集合,Bkde用来表示背景发生突变与否的掩码,i=1…M:
[0086]
[0087] 如果Bkde为1,说明背景已经发生了突变。否则,背景没有发生突变。
[0088] 通过公式(15)所检测到的背景发生突变的像素,不应立即作为更新KDE背景样本的依据。突变的背景一般表现为区域性,面积较大。为提高系统的鲁棒性,对满足公式(15)的所有突变像素进行连通域分析,提取连通域的面积、个数、最大长度、最大宽度等特征。当这些特征满足背景突变的条件(例如,连通域的面积大于场景的预定比例、个数大于场景中的最大目标个数、最大长度大于场景中的最大目标长度、宽度大于场景中的最大目标宽度等)时,才认为背景确实发生了突变,从而减少干扰,提高系统准确性。
[0089] 当背景确实发生突变时,用当前帧开始后的N帧图像更新背景中的样本,保证背景模型得到及时更新,提高检测的鲁棒性。同时,本发明也能解决背景更新中的死锁情况(deadlock situations)(参见参考文献[2,4])。
[0090] 图6是根据本发明的自适应内核密度估计运动检测装置的整体方框图。
[0091] 具体地,根据本发明的自适应内核密度估计运动检测装置500包括:接收单元510、初始化单元520、概率计算统计单元530、分类单元540、突变背景更新单元550、概率背景更新单元560和运动处理单元570。
[0092] 接收单元510用于接收输入的视频帧。初始化单元520用于初始化背景模型、帧间差分背景模型,以及初始化系统的其他参数,例如:采样的视频帧数为50。
[0093] 概率计算统计单元530用于针对当前帧的每个像素,根据背景样本,计算该像素的内核密度估计概率,并统计当前帧的像素的内核密度估计概率直方图。
[0094] 分类单元540用于自适应地求取内核密度估计概率直方图的前景阈值和背景阈值,如果某一像素的内核密度估计概率小于所述前景阈值,则确定该像素为前景像素,并将该像素输出至运动处理单元570;如果该像素的内核密度估计概率大于所述背景阈值,则确定该像素为背景像素,直接将该像素更新到背景中;如果该像素的内核密度估计概率大于所述前景阈值且小于所述背景阈值,则将该像素输出至概率背景更新单元560。
[0095] 概率背景更新单元560用于对内核密度估计概率大于所述前景阈值且小于所述背景阈值的像素进行概率背景更新。在所述概率背景更新过程中,概率背景更新单元560按照先进先出的原则顺序更新背景样本。
[0096] 突变背景更新单元550用于根据帧间差分背景模型和分类单元的结果,判断是否出现了突变像素,并在突变像素满足预定条件时,对突变像素进行突变背景更新。
[0097] 运动处理单元570用于对检测到的前景像素进行连通域分析,并结合运动目标的先验知识,如目标的最大和最小宽度、最大和最小高度、最大和最小面积等,对于属于同一个目标的区域进行合并,对于属于不同目标的区域进行分割,从而得到完整的运动目标。
[0098] 至此已经结合优选实施例对本发明进行了描述。应该理解,本领域技术人员在不脱离本发明的精神和范围的情况下,可以进行各种其它的改变、替换和添加。因此,本发明的范围不局限于上述特定实施例,而应由所附权利要求所限定。
[0099] 参考文献列表
[0100] [1]M Piccardi,Background subtraction techniques:areview.Systems.Man and Cybernetics[J],2004.4:3099-3104;
[0101] [2]A.Elgammal,D.Hanvood,and L.S.Davis,Non-parametric model for background subtraction[C].Proc.ECCV 2000.751-767;
[0102] [3]Anurag Mittal,Nikos Paragios. Motion-BasedBackground Subtraction using Adaptive Kernel Density Estimation.[C].CVPR,2004.II(2):302-309;
[0103] [4]Hanzi Wang,David Suter.A consensus-based method fortracking:Modeling background scenario and foregroundappearance[J].Pattern Recognition.2007.40:1091-1105.