特征提取方法及装置转让专利

申请号 : CN201510827886.1

文献号 : CN105654093B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 龙飞陈志军张涛

申请人 : 小米科技有限责任公司

摘要 :

本公开揭示了一种特征提取方法及装置,属于图像处理技术领域。所述特征提取方法包括:将图像划分为若干个块,每个块包括若干个单元格;将每个单元格从空间域转化为频率域;提取图像在频率域中的方向梯度直方图HOG特征。通过在频率域提取图像的HOG特征;解决了在HOG特征提取过程中是针对图像的空间域直接计算得到,导致在模式识别中的检测率和准确度较低的问题;达到了在频率域提取图像的HOG特征,提高了在模式识别中的检测率和准确度的效果。

权利要求 :

1.一种特征提取方法,其特征在于,所述方法包括:将图像划分为若干个块,每个所述块包括若干个单元格;

将每个所述单元格从空间域转化为频率域;

计算所述频率域中每个所述单元格的梯度大小和梯度方向,得到每个所述单元格的描述子;

统计所述频率域中每个所述块内的各个所述描述子,得到每个所述块的HOG特征;

统计所述图像在所述频率域中各个所述块的HOG特征,得到所述图像的HOG特征。

2.根据权利要求1所述的方法,其特征在于,所述将每个所述单元格从空间域转化为频率域,包括:对每个所述单元格进行离散余弦变换DCT。

3.根据权利要求1所述的方法,其特征在于,所述将每个所述单元格从空间域转化为频率域,包括:对每个所述单元格进行离散傅里叶变换DFT。

4.根据权利要求1所述的方法,其特征在于,所述统计所述图像中各个所述块的HOG特征,得到所述图像的HOG特征,包括:将所述图像中各个所述块的HOG特征串联成一个矩阵,得到所述图像的HOG特征,所述矩阵的每一列为一个所述块的HOG特征。

5.根据权利要求1所述的方法,其特征在于,所述统计所述图像中各个所述块的HOG特征,得到所述图像的HOG特征,包括:将所述图像中每个所述块的HOG特征由初始的L*1维向量调整为M*N的矩阵,每个所述块包括M*N个像素,L=M*N;

根据每个所述块的调整后的所述HOG特征和每个所述块在所述图像中的对应位置,得到所述图像的HOG特征。

6.根据权利要求1至5任一所述的方法,其特征在于,所述方法,还包括:将所述图像进行归一化处理,得到预定尺寸大小的所述图像。

7.一种特征提取装置,其特征在于,所述装置包括:划分模块,被配置为将图像划分为若干个块,每个所述块包括若干个单元格;

转化模块,被配置为将每个所述单元格从空间域转化为频率域;

提取模块包括计算子模块、第一统计子模块和第二统计子模块,所述计算子模块,被配置为计算所述频率域中每个所述单元格的梯度大小和梯度方向,得到每个所述单元格的描述子;所述第一统计子模块,被配置为统计所述频率域中每个所述块内的各个所述描述子,得到每个所述块的HOG特征;所述第二统计子模块,被配置为统计所述图像在所述频率域中各个所述块的HOG特征,得到所述图像的HOG特征。

8.根据权利要求7所述的装置,其特征在于,所述转化模块,被配置为对每个所述单元格进行离散余弦变换DCT。

9.根据权利要求7所述的装置,其特征在于,所述转化模块,被配置为对每个所述单元格进行离散傅里叶变换DFT。

10.根据权利要求7所述的装置,其特征在于,所述第二统计子模块,被配置为将所述图像中各个所述块的HOG特征串联成一个矩阵,得到所述图像的HOG特征,所述矩阵的每一列为一个所述块的HOG特征。

11.根据权利要求7所述的装置,其特征在于,所述第二统计子模块,包括:调整子模块,被配置为将所述图像中每个所述块的HOG特征由初始的L*1维向量调整为M*N的矩阵,每个所述块包括M*N个像素,L=M*N;

特征提取子模块,被配置为根据每个所述块的调整后的所述HOG特征和每个所述块在所述图像中的对应位置,得到所述图像的HOG特征。

12.根据权利要求7至11任一所述的装置,其特征在于,所述装置,还包括:处理模块,被配置为将所述图像进行归一化处理,得到预定尺寸大小的所述图像。

13.一种特征提取装置,其特征在于,所述装置包括:处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为:

将图像划分为若干个块,每个所述块包括若干个单元格;

将每个所述单元格从空间域转化为频率域;

计算所述频率域中每个所述单元格的梯度大小和梯度方向,得到每个所述单元格的描述子;

统计所述频率域中每个所述块内的各个所述描述子,得到每个所述块的HOG特征;

统计所述图像在所述频率域中各个所述块的HOG特征,得到所述图像的HOG特征。

说明书 :

特征提取方法及装置

技术领域

[0001] 本公开涉及图像处理技术领域,特别涉及一种特征提取方法及装置。

背景技术

[0002] 图像检测与识别是计算机视觉中一个重要的研究领域。图像检测与识别技 术中最常用的方法是通过提取图像中的某种特征从而对图像进行检测与识别。
[0003] 在相关技术中,通过提取图像的HOG(Histogram of Oriented Gradient,方 向梯度直方图)特征对图像进行检测与识别。HOG特征提取的方法如下:计算 图像中每个像素的梯度;将图像划分成若干个单元格,每个单元格包括若干个 像素,每相邻的n个单元格形成一个块;统计每个单元格中所有像素的梯度直 方图,再根据每个块中的所有单元格的梯度直方图得到每个块的HOG特征;统 计图像中所有块的HOG特征得到图像的HOG特征。

发明内容

[0004] 为了解决相关技术中存在的问题,本公开提供一种特征提取方法及装置。 所述技术方案如下:
[0005] 根据本公开实施例的第一方面,提供一种特征提取方法,该方法包括:
[0006] 将图像划分为若干个块,每个块包括若干个单元格;
[0007] 将每个单元格从空间域转化为频率域;
[0008] 提取图像在频率域中的方向梯度直方图HOG特征。
[0009] 在一个可选的实施例中,将每个单元格从空间域转化为频率域,包括:对 每个单元格进行离散余弦变换DCT。
[0010] 在一个可选的实施例中,将每个单元格从空间域转化为频率域,包括:对 每个单元格进行离散傅里叶变换DFT。
[0011] 在一个可选的实施例中,提取图像在频率域中的方向梯度直方图HOG特征, 包括:
[0012] 计算频率域中每个单元格的梯度大小和梯度方向,得到每个单元格的描述 子;
[0013] 统计频率域中每个块内的各个描述子,得到每个块的HOG特征;
[0014] 统计图像在频率域中各个块的HOG特征,得到图像的HOG特征。
[0015] 在一个可选的实施例中,统计图像中各个块的HOG特征,得到图像的HOG 特征,包括:
[0016] 将图像中各个块的HOG特征串联成一个矩阵,得到图像的HOG特征,矩 阵的每一列为一个块的HOG特征。
[0017] 在一个可选的实施例中,统计图像中各个块的HOG特征,得到图像的HOG 特征,包括:
[0018] 将图像中每个块的HOG特征由初始的L*1维向量调整为M*N的矩阵,每 个块包括M*N个像素,L=M*N;
[0019] 根据每个块的调整后的HOG特征和每个块在图像中的对应位置,得到图像 的HOG特征。
[0020] 在一个可选的实施例中,该方法,还包括:
[0021] 将图像进行归一化处理,得到预定尺寸大小的图像。
[0022] 根据本公开实施例的第二方面,提供一种特征提取装置,该装置包括:
[0023] 划分模块,被配置为将图像划分为若干个块,每个块包括若干个单元格;
[0024] 转化模块,被配置为将每个单元格从空间域转化为频率域;
[0025] 提取模块,被配置为提取图像在频率域中的方向梯度直方图HOG特征。
[0026] 在一个可选的实施例中,转化模块,被配置为对每个单元格进行离散余弦 变换DCT。
[0027] 在一个可选的实施例中,转化模块,被配置为对每个单元格进行离散傅里 叶变换DFT。
[0028] 在一个可选的实施例中,提取模块,包括:
[0029] 计算子模块,被配置为计算频率域中每个单元格的梯度大小和梯度方向, 得到每个单元格的描述子;
[0030] 第一统计子模块,被配置为统计频率域中每个块内的各个描述子,得到每 个块的HOG特征;
[0031] 第二统计子模块,被配置为统计图像在频率域中各个块的HOG特征,得到 图像的HOG特征。
[0032] 在一个可选的实施例中,第二统计子模块,被配置为将图像中各个块的HOG 特征串联成一个矩阵,得到图像的HOG特征,矩阵的每一列为一个块的HOG 特征。
[0033] 在一个可选的实施例中,第二统计子模块,包括:
[0034] 调整子模块,被配置为将图像中每个块的HOG特征由初始的L*1维向量调 整为M*N的矩阵,每个块包括M*N个像素,L=M*N;
[0035] 特征提取子模块,根据每个块的调整后的HOG特征和每个块在图像中的对 应位置,得到图像的HOG特征。
[0036] 在一个可选的实施例中,该装置,还包括:
[0037] 处理模块,被配置为将图像进行归一化处理,得到预定尺寸大小的图像。
[0038] 根据本公开实施例的第三方面,提供一种特征提取装置,该装置包括:
[0039] 处理器;
[0040] 用于存储处理器可执行指令的存储器;
[0041] 其中,处理器被配置为:
[0042] 将图像划分为若干个块,每个块包括若干个单元格;
[0043] 将每个单元格从空间域转化为频率域;
[0044] 提取图像在频率域中的方向梯度直方图HOG特征。
[0045] 本公开的实施例提供的技术方案可以包括以下有益效果:
[0046] 通过将图像划分为若干个块,每个块包括若干个单元格;将每个单元格从 空间域转化为频率域;提取图像在频率域中的方向梯度直方图HOG特征;解决 了在HOG特征提取过程中是针对图像的空间域直接计算得到,导致在模式识别 中的检测率和准确度较低的问题;达到了在频率域提取图像的HOG特征,提高 了在模式识别中的检测率和准确度的效果。
[0047] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能 限制本公开。

附图说明

[0048] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开 的实施例,并于说明书一起用于解释本公开的原理。
[0049] 图1是根据一示例性实施例示出的一种特征提取方法的流程图;
[0050] 图2A是根据另一示例性实施例示出的一种特征提取方法的流程图;
[0051] 图2B是根据一示例性实施例示出的一种图像划分的示意图;
[0052] 图2C是根据另一示例性实施例示出的一种图像划分的示意图;
[0053] 图2D是根据一示例性实施例示出的一种统计块内HOG特征的示意图;
[0054] 图3A是根据一示例性实施例示出的一种特征提取方法的流程图;
[0055] 图3B是根据一示例性实施例示出的一种统计图像HOG特征的示意图;
[0056] 图4是根据一示例性实施例示出的一种特征提取装置的框图;
[0057] 图5是根据另一示例性实施例示出的一种特征提取装置的框图;
[0058] 图6是根据一示例性实施例示出的一种特征提取装置的子模块的框图;
[0059] 图7是根据另一示例性实施例示出的一种特征提取装置的框图。

具体实施方式

[0060] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描 述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。 以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方 式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一 致的装置和方法的例子。
[0061] 图1是根据一示例性实施例示出的一种特征提取方法的流程图,如图1所 示,本实施例以该方法应用于模式识别的硬件中来举例说明,该方法可以包括 以下步骤。
[0062] 在步骤102中,将图像划分为若干个块,每个块包括若干个单元格。
[0063] 在步骤104中,将每个单元格从空间域转化为频率域。
[0064] 对每个单元格进行转化,将图像从空间域转化为频率域。
[0065] 在步骤106中,提取图像在频率域中的HOG特征。
[0066] 在频率域中提取图像的HOG特征。
[0067] 综上所述,本公开实施例中提供的特征提取方法,通过将图像划分为若干 个块,每个块包括若干个单元格;将每个单元格从空间域转化为频率域;提取 图像在频率域中的方向梯度直方图HOG特征;解决了在HOG特征提取过程中 是针对图像的空间域直接计算得到,导致在模式识别中的检测率和准确度较低 的问题;达到了在频率域提取图像的HOG特征,提高了在模式识别中的检测率 和准确度的效果。
[0068] 图2A是根据另一示例性实施例示出的一种特征提取方法的流程图,如图 2A所示,本实施例以该方法应用于模式识别的硬件中来举例说明,该方法可以 包括以下步骤:
[0069] 在步骤201中,将图像进行归一化处理,得到预定尺寸大小的图像。
[0070] 在模式识别中,一般会涉及到对多个图像的特征提取。
[0071] 在对图像进行特征提取之前,终端先对图像进行归一化处理,将不同大小 的图像处理为预定尺寸大小的图像,以便于对图像的统一处理。
[0072] 在步骤202中,将图像划分为若干个块,每个块包括若干个单元格。
[0073] 可选的,终端对归一化处理后的图像进行划分包括:将图像划分为若干个 块,再将每个块划分为若干个单元格。
[0074] 可选的,终端对归一化处理后的图像进行划分包括:将图像划分为若干个 单元格,再将相连的单元格组成一个块,每个块中包含有若干个单元格,比如: 将两两相邻的四个呈田字形排列的单元格组成一个块。
[0075] 本实施例中,在图像划分过程中,对划分块和划分单元格的顺序不作具体 限定,可以先划分块再划分单元格,也可以先划分单元格再组合成块。
[0076] 本实施例中,对图像划分的块与块之间是否存在重叠区域不作具体限定, 块与块之间可以存在重叠区域也可以不存在重叠区域。
[0077] 比如:将128像素*128像素的图像20先划分为16像素*16像素互不重叠 的块21,再将每个16像素*16像素的块21划分为8像素*8像素的单元格22, 则图像中包含有8个*8个=64个互不重叠的块21,每个块中包含有2个*2个=4 个单元格,如图2B所示。
[0078] 比如:将128像素*128像素的图像20先划分为16像素*16像素存在重叠 区域的块23,再将每个16像素*16像素的块23划分为8像素*8像素的单元格 24,则图像中包含有16个*16个=256个存在重叠区域的块23,每个块中包含有 2个*2个=4个单元格,如图2C所示。
[0079] 在步骤203中,对每个单元格进行DCT变换。
[0080] 对于图像中的每个单元格而言,假定每个单元格的像素组成的矩阵A的大 小为M像素*N像素,则矩阵A的DCT(Discrete Cosine Transform,离散余弦 变换)变换系数如下公式:
[0081]
[0082] 其中, Bp·q为矩阵A的 DCT系数,p=0,1,2…,M-1,m=0,1,2…,M-1,q=0,1,2…,N-1,n=0,1,2…,N-1。
[0083] 将图像中的每个单元格都进行DCT变换,从而将图像从空间域转换为频率 域。
[0084] 可选的,终端对每个单元格进行DFT变换(Discrete Fourier Transform,离 散傅里叶变换)。
[0085] 对于图像中的每个单元格而言,假定每个单元格的大小为M像素*N像素, 像素(x,y)组成的函数为f(x,y),则函数f(x,y)的DFT系数F(u,v)如下公式:
[0086]
[0087] 其中,u=0,1,2…,M-1,v=0,1,2…,N-1。
[0088] 终端将图像中的每个单元格都进行DFT变换,从而将图像从空间域转换为 频率域。
[0089] 在步骤204中,计算频率域中每个单元格的梯度大小和梯度方向,得到每 个单元格的描述子。
[0090] 终端利用梯度算子计算经过DCT变换或DFT变换后的每个单元格中的每个 像素的横向梯度和纵向梯度。示例性的,常用的梯度算子如下表一所示:
[0091]
[0092] 表一
[0093] 本实施例中,在计算每个单元格中像素的梯度大小时可以选择表一中的任 意一个梯度算子,也可以选择其他的梯度算子,本实施例中对梯度算子的选择 不作具体限定。
[0094] 假定像素(x,y)的横向梯度为H(x,y),纵向梯度为V(x,y),则每个像素的梯 度方向和梯度幅值的计算分别如下公式(1)和公式(2):
[0095] θ(x,y)=tan-1[V(x,y)/H(x,y)]  (1)
[0096] m(x,y)=[H(x,y)2+V(x,y)2]1/2  (2)
[0097] 其中,θ(x,y)为像素(x,y)的梯度方向,m(x,y)为像素(x,y)的梯度大小。
[0098] 梯度方向θ(x,y)的取值范围为-90度到90度,将梯度方向θ(x,y)平均分成 z份,对每个单元格中的所有像素按照权重m(x,y)在梯度方向划分的每一份进 行统计,最后每个单元格得到一个z维的向量,也即得到每个单元格对应的描 述子。
[0099] 比如:将梯度方向θ(x,y)平均分成9份,每一份对应的角度为20度,对每 个单元格中所有像素按照权重m(x,y)在各个20度中进行统计,最后对应每个单 元格得到一个9维的向量。
[0100] 本实施例中,对将梯度方向划分为多少份不作具体限定。
[0101] 在步骤205中,统计频率域中每个块内的各个描述子,得到每个块的HOG 特征。
[0102] 终端对每个块内包含的各个单元格中计算得到的描述子进行统计,得到每 个块的HOG特征。
[0103] 在对各个单元格中计算得到的描述子进行统计时,终端可以将各个单元格 对应的描述子进行串联,使得每个块的HOG特征是一个向量,该向量的维数是 该块内包含单元格对应的描述子维数的k倍。
[0104] 比如:各个单元格中的描述子为9维的向量,每个块包含有4个单元格, 则将4个单元格中的9维描述子进行串联,形成一个36维的向量,将该36维 的向量作为对应块的HOG特征。
[0105] 在步骤206中,统计图像在频率域中各个块的HOG特征,得到图像的HOG 特征。
[0106] 终端统计各个块的HOG特征,得到图像的HOG特征。将图像中各个块的 HOG特征串联成一个矩阵,得到图像的HOG特征,矩阵的每一列为一个块的 HOG特征。
[0107] 比如:图像中包含有K个块,各个块的HOG特征为Ki,则将Ki个HOG 特征串联成一个矩阵25,将K1放在串联成的矩阵的第一列26,将K2放在串联 的矩阵的第二列27,以此类推。如图2D所示。
[0108] 综上所述,本公开实施例中提供的特征提取方法,通过将图像划分为若干 个块,每个块包括若干个单元格;对每个单元格进行DCT变换或DFT变换;计 算频率域中每个单元格的梯度大小和梯度方向,得到每个单元格的描述子;统 计频率域中每个块内的各个描述子,得到每个块的HOG特征;统计图像在频率 域中各个块的HOG特征,得到图像的HOG特征;解决了在HOG特征提取过 程中是针对图像的空间域直接计算得到,导致在模式识别中的检测率和准确度 较低的问题;达到了在频率域提取图像的HOG特征,提高了在模式识别中的检 测率和准确度的效果。
[0109] 在基于图2A所示的可选实施例中,在统计图像中各个块的HOG特征得到 图像的HOG特征的过程中,可以按照在图像的对应位置的形式进行排列。步骤 206可替换成为如下步骤206a和206b,如图3A所示:
[0110] 在步骤206a中,将图像中每个块的HOG特征由初始的L*1维向量调整为 M*N的矩阵,每个块包括M*N个像素,L=M*N。
[0111] 每个块的HOG特征是将各个单元格对应的描述子进行串联得到的L*1维向 量,将L*1维向量调整为M*N的矩阵,也即,终端将各个块中的L*1维向量按 照包含的单元格调整为对应的矩阵,该对应的矩阵的每一列为一个单元格的描 述子;再将每个单元格的描述子按照对应的像素进行调整,调整后得到的矩阵 的每一列为对应块中对应列的像素对应的HOG特征。
[0112] 在步骤206b中,根据每个块的调整后的HOG特征和每个块在图像中的对 应位置,得到图像的HOG特征。
[0113] 根据每个块的调整后的HOG特征和每个块在图像中的对应位置,得到图像 中对应像素位置的HOG特征。
[0114] 比如:图像中包含有K个块,各个块的HOG特征为Ki,则将Ki个HOG 特征调整为M*N的矩阵,将K1调整后的矩阵31放在第一个块32在图像中的 对应位置,将K2调整后的矩阵33放在第二个块34在图像中的对应位置,以此 类推,最后一个将矩阵MN放在最后一个块MN在图像中的对应位置。如图3B 所示。
[0115] 综上所述,本实施例提供的特征提取方法,通过将图像中每个块的HOG特 征由初始的L*1维向量调整为M*N的矩阵,每个块包括M*N个像素,L=M*N; 根据每个块的调整后的HOG特征和每个块在图像中的对应位置,得到图像的 HOG特征;使得提取后的图像的HOG特征与对应于图像中每个块的对应位置, 可以更好地突出图像中各个块的特征。
[0116] 下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开 装置实施例中未披露的细节,请参照本公开方法实施例。
[0117] 图4是根据一示例性实施例示出的一种特征提取装置的框图,如图4所示, 该特征提取装置包括但不限于:
[0118] 划分模块420,被配置为将图像划分为若干个块,每个块包括若干个单元格。
[0119] 转化模块440,被配置为将每个单元格从空间域转化为频率域。
[0120] 转化模块440对每个单元格进行转化,将图像从空间域转化为频率域。
[0121] 提取模块460,被配置为提取图像在频率域中的方向梯度直方图HOG特征。
[0122] 综上所述,本公开实施例中提供的特征提取装置,通过将图像划分为若干 个块,每个块包括若干个单元格;将每个单元格从空间域转化为频率域;提取 图像在频率域中的方向梯度直方图HOG特征;解决了在HOG特征提取过程中 是针对图像的空间域直接计算得到,导致在模式识别中的检测率和准确度较低 的问题;达到了在频率域提取图像的HOG特征,提高了在模式识别中的检测率 和准确度的效果。
[0123] 图5是根据另一示例性实施例示出的一种特征提取装置的框图,如图5所 示,该特征提取装置包括但不限于:
[0124] 处理模块410,被配置为将图像进行归一化处理,得到预定尺寸大小的图像。
[0125] 在模式识别中,一般会涉及到对多个图像的特征提取。
[0126] 在对图像进行特征提取之前,处理模块410对图像进行归一化处理,将不 同大小的图像处理为预定尺寸大小的图像,以便于对图像的统一处理。
[0127] 划分模块420,被配置为将图像划分为若干个块,每个块包括若干个单元格。
[0128] 可选的,划分模块420对归一化处理后的图像进行划分包括:将图像划分 为若干个块,再将每个块划分为若干个单元格。
[0129] 可选的,划分模块420对归一化处理后的图像进行划分包括:将图像划分 为若干个单元格,再将相连的单元格组成一个块,每个块中包含有若干个单元 格,比如:将两两相邻的四个呈田字形排列的单元格组成一个块。
[0130] 本实施例中,划分模块420在图像划分过程中,对划分块和划分单元格的 顺序不作具体限定,可以先划分块再划分单元格,也可以先划分单元格再组合 成块。
[0131] 本实施例中,划分模块420对图像划分的块与块之间是否存在重叠区域不 作具体限定,块与块之间可以存在重叠区域也可以不存在重叠区域。
[0132] 转化模块440,被配置为对每个单元格进行离散余弦变换DCT。
[0133] 对于图像中的每个单元格而言,假定每个单元格的像素组成的矩阵A的大 小为M像素*N像素,则矩阵A的DCT(Discrete Cosine Transform,离散余弦 变换)变换系数如下公式:
[0134]
[0135] 其中, Bp·q为矩阵A的 DCT系数,p=0,1,2…,M-1,m=0,1,2…,M-1,q=0,1,2…,N-1,n=0,1,2…,N-1。
[0136] 转化模块440将图像中的每个单元格都进行DCT变换,从而将图像从空间 域转换为频率域。
[0137] 可选的,转化模块440,被配置为对每个单元格进行DFT变换(Discrete Fourier Transform,离散傅里叶变换)。
[0138] 对于图像中的每个单元格而言,假定每个单元格的大小为M像素*N像素, 组成的函数为f(x,y),则函数f(x,y)的DFT系数F(u,v)如下公式:
[0139]
[0140] 其中,u=0,1,2…,M-1,v=0,1,2…,N-1,(x,y)为像素的位置。
[0141] 转化模块440将图像中的每个单元格都进行DFT变换,从而将图像从空间 域转换为频率域。
[0142] 提取模块460,被配置为提取图像在频率域中的方向梯度直方图HOG特征。
[0143] 本实施例中,提取模块460可以包括如下子模块:
[0144] 计算子模块461,被配置为计算频率域中每个单元格的梯度大小和梯度方 向,得到每个单元格的描述子。
[0145] 计算子模块461利用梯度算子计算经过DCT变换或DFT变换后的每个单元 格中的每个像素的横向梯度和纵向梯度。
[0146] 本实施例中对梯度算子的选择不作具体限定。
[0147] 假定像素的横向梯度为H(x,y),纵向梯度为V(x,y),则每个像素的梯度方 向和梯度幅值的计算分别如下公式(1)和公式(2):
[0148] θ(x,y)=tan-1[V(x,y)/H(x,y)]  (1)
[0149] m(x,y)=[H(x,y)2+V(x,y)2]1/2  (2)
[0150] 其中,θ(x,y)为像素(x,y)的梯度方向,m(x,y)为像素(x,y)的梯度大小。
[0151] 梯度方向θ(x,y)的取值范围为-90度到90度,将梯度方向θ(x,y)平均分成 z份,对每个单元格中的所有像素按照权重m(x,y)在梯度方向划分的每一份进 行统计,最后每个单元格得到一个z维的向量,也即得到每个单元格对应的描 述子。
[0152] 本实施例中,对将梯度方向划分为多少份不作具体限定。
[0153] 第一统计子模块462,被配置为统计频率域中每个块内的各个描述子,得到 每个块的HOG特征。
[0154] 第一统计子模块462对每个块内包含的各个单元格中计算得到的描述子进 行统计,得到每个块的HOG特征。
[0155] 在对各个单元格中计算得到的描述子进行统计时,第一统计子模块462可 以将各个单元格对应的描述子进行串联,使得每个块的HOG特征是一个向量, 该向量的维数是该块内包含单元格对应的描述子维数的k倍。
[0156] 第二统计子模块463,被配置为统计图像在频率域中各个块的HOG特征, 得到图像的HOG特征。
[0157] 第二统计子模块463统计各个块的HOG特征,得到图像的HOG特征。
[0158] 可选的,第二统计子模块463,被配置为将图像中各个块的HOG特征串联 成一个矩阵,得到图像的HOG特征,矩阵的每一列为一个块的HOG特征。
[0159] 综上所述,本公开实施例中提供的特征提取装置,通过将图像划分为若干 个块,每个块包括若干个单元格;对每个单元格进行DCT变换或DFT变换;计 算频率域中每个单元格的梯度大小和梯度方向,得到每个单元格的描述子;统 计频率域中每个块内的各个描述子,得到每个块的HOG特征;统计图像在频率 域中各个块的HOG特征,得到图像的HOG特征;解决了在HOG特征提取过 程中是针对图像的空间域直接计算得到,导致在模式识别中的检测率和准确度 较低的问题;达到了在频率域提取图像的HOG特征,提高了在模式识别中的检 测率和准确度的效果。
[0160] 在基于图5所示的可选实施例中,第二统计子模块463可以包括如下子模 块,如图6所示:
[0161] 调整子模块610,被配置为将图像中每个块的HOG特征由初始的L*1维向 量调整为M*N的矩阵,每个块包括M*N个像素,L=M*N。
[0162] 每个块的HOG特征是将各个单元格对应的描述子进行串联得到的L*1维向 量,调整子模块610将L*1维向量调整为M*N的矩阵,也即,将各个块中的 L*1维向量按照包含的单元格调整为对应的矩阵,该对应的矩阵的每一列为一个 单元格的描述子;再将每个单元格的描述子按照对应的像素进行调整,调整后 得到的矩阵的每一列为对应块中对应列的像素对应的HOG特征。
[0163] 特征提取子模块620,被配置为根据每个块的调整后的HOG特征和每个块 在图像中的对应位置,得到图像的HOG特征。
[0164] 特征提取子模块620根据每个块的调整后的HOG特征和每个块在图像中的 对应位置,得到图像中对应像素位置的HOG特征。
[0165] 综上所述,本实施例提供的特征提取装置,通过将图像中每个块的HOG特 征由初始的L*1维向量调整为M*N的矩阵,每个块包括M*N个像素,L=M*N; 根据每个块的调整后的HOG特征和每个块在图像中的对应位置,得到图像的 HOG特征;使得提取后的图像的HOG特征与对应于图像中每个块的对应位置, 可以更好地突出图像中各个块的特征。
[0166] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关 该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0167] 本公开一示例性实施例提供了一种特征提取装置,能够实现本公开提供的 特征提取方法,该特征提取装置包括:处理器、用于存储处理器可执行指令的 存储器;
[0168] 其中,处理器被配置为:
[0169] 将图像划分为若干个块,每个块包括若干个单元格;
[0170] 将每个单元格从空间域转化为频率域;
[0171] 提取图像在频率域中的方向梯度直方图HOG特征。
[0172] 图7是根据一示例性实施例示出的一种特征提取装置的框图。例如,装置 700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平 板设备,医疗设备,健身设备,个人数字助理等。
[0173] 参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器 704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)接口712, 传感器组件714,以及通信组件716。
[0174] 处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数 据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多 个处理器718来执行指令,以完成上述的方法的全部或部分步骤。此外,处理 组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。 例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件 702之间的交互。
[0175] 存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些 数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人 数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失 性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM), 电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM), 可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器, 磁盘或光盘。
[0176] 电源组件706为装置700的各种组件提供电力。电源组件706可以包括电 源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相 关联的组件。
[0177] 多媒体组件708包括在装置700和用户之间的提供一个输出接口的屏幕。 在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏 幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触 摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触 摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作 相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像 头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前 置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置 摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0178] 音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括 一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音 识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进 一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件 710还包括一个扬声器,用于输出音频信号。
[0179] I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口 模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音 量按钮、启动按钮和锁定按钮。
[0180] 传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的 状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件 的相对定位,例如组件为装置700的显示器和小键盘,传感器组件714还可以 检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或 不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可 以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。 传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成 像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器, 陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0181] 通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通 信。装置700可以接入基于通信标准的无线网络,如Wi-Fi,2G或3G,或它们 的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广 播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件716 还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射 频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝 牙(BT)技术和其他技术来实现。
[0182] 在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、 数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、 现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实 现,用于执行上述特征提取方法。
[0183] 在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介 质,例如包括指令的存储器704,上述指令可由装置700的处理器718执行以完 成上述特征提取方法。例如,非临时性计算机可读存储介质可以是ROM、随机 存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
[0184] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公 开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化, 这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开 的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性 的,本公开的真正范围和精神由下面的权利要求指出。
[0185] 应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结 构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的 权利要求来限制。