一种图片聚类的方法及装置转让专利

申请号 : CN201210144457.0

文献号 : CN103390165B

文献日 : 2017-08-22

本发明提供了一种图片聚类的方法及装置，其中图片聚类的方法包括：A.提取多张输入图片的全局特征和局部特征；B．根据所述全局特征对所述输入图片进行初次聚类，以得到初步聚类结果，其中所述初步聚类结果包括一个以上的图片组；C．根据所述局部特征分别对每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片的二次聚类结果。通过上述方式，可以有效提高对海量图片聚类时的准确度和召回率。

1.一种图片聚类方法，包括：

A.提取多张输入图片的全局特征和局部特征；

B.根据所述全局特征对所述输入图片进行初次聚类，以得到初步聚类结果，其中所述初步聚类结果包括一个以上的图片组；

C.根据所述局部特征分别对每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片的二次聚类结果；

其中，根据所述局部特征分别对每个图片组内的图片进行二次聚类的步骤具体包括：针对每个图片组，建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引；利用所述倒排索引，将拥有共同特征分量数超过预设值的图片归为一类，得到每个图片组内的一个以上的集合；

所述方法进一步包括：在对输入图片进行聚类之后，对聚类结果中相同集合的图片赋予统一标识；

对输入图片进行初次聚类包括：

从输入图片中选取一定数量的图片作为样本图片，利用样本图片确定K个聚类中心，其中K为自然数；将输入图片中除样本外的剩余图片分为K份，其中每份图片对应一个聚类中心，利用分布式计算平台，将每份图片中的每张图片分别与对应的聚类中心进行相似度比较，并将当前比较的图片归到最相似的聚类中心所在类。

2.根据权利要求1所述的方法，其特征在于，所述步骤A中提取所述输入图片的多个全局特征；

所述步骤B中根据每个全局特征分别对所述输入图片进行初次聚类，以得到与每个全局特征对应的初次聚类结果，其中每个初次聚类结果包含一个以上的图片组；

所述步骤C中针对与每个全局特征对应的初次聚类结果，根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片与每个全局特征对应的二次聚类结果；

所述方法进一步包括：将各二次聚类结果进行合并，得到所述输入图片的最终聚类结果。

3.根据权利要求2所述的方法，其特征在于，将各二次聚类结果进行合并的步骤具体包括：将各二次聚类结果包含的集合中，两两之间存在交集的多个集合合并为一个集合。

4.根据权利要求2所述的方法，其特征在于，所述多个全局特征中包含第一全局特征，其中所述第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。

5.根据权利要求2所述的方法，其特征在于，所述多个全局特征中包含第二全局特征，其中所述第二全局特征为Gist特征。

6.根据权利要求1所述的方法，其特征在于，所述步骤B中采用K-means方法对所述输入图片进行初次聚类。

7.根据权利要求1所述的方法，其特征在于，所述全局特征为：颜色、纹理或形状特征；

所述局部特征为SIFT特征。

8.根据权利要求1所述的方法，其特征在于，所述方法进一步包括：将所述二次聚类结果中的包含图片数量大于设定值的集合中的图片作为热门图片，所述热门图片用于在搜索引擎系统中作为优先返回的检索结果。

9.一种图片聚类的装置，包括：

特征提取单元，用于提取多张输入图片的全局特征和局部特征；

分组单元，用于根据所述全局特征对所述输入图片进行初次聚类，以得到初步聚类结果，其中所述初步聚类结果包括一个以上的图片组；所述对输入图片进行初次聚类包括：从输入图片中选取一定数量的图片作为样本图片，利用样本图片确定K个聚类中心，其中K为自然数；将输入图片中除样本外的剩余图片分为K份，其中每份图片对应一个聚类中心，利用分布式计算平台，将每份图片中的每张图片分别与对应的聚类中心进行相似度比较，并将当前比较的图片归到最相似的聚类中心所在类；

确定单元，用于根据所述局部特征对每个图片组内的图片进行二次聚类，以将每个组内的图片分为一个以上的集合，得到所述输入图片的二次聚类结果；

所述确定单元具体包括：

索引单元，用于针对每个图片组，建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引；

归类单元，用于利用所述倒排索引，将拥有共同特征分量数超过预设值的图片归为一类，得到每个图片组内的一个以上的集合；

所述装置进一步包括：标识单元，用于为聚类结果中的相同集合的图片赋予统一标识。

10.根据权利要求9所述的装置，其特征在于，所述特征提取单元提取所述输入图片的多个全局特征；

所述分组单元根据每个全局特征分别对所述输入图片进行初次聚类，以得到与每个全局特征对应的初次聚类结果，其中每个初次聚类结果包含一个以上的图片组；

所述确定单元针对与每个初次聚类结果，根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片与每个全局特征对应的二次聚类结果；

所述装置进一步包括：

合并单元，用于将各二次聚类结果进行合并，得到所述输入图片的最终聚类结果。

11.根据权利要求10所述的装置，其特征在于，所述合并单元将各二次聚类结果进行合并的方式具体包括：将各二次聚类结果包含的集合中，两两之间存在交集的多个集合合并为一个集合。

12.根据权利要求10所述的装置，其特征在于，所述多个全局特征中包含第一全局特征，其中所述第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。

13.根据权利要求10所述的装置，其特征在于，所述多个全局特征中包含第二全局特征，其中所述第二全局特征为Gist特征。

14.根据权利要求9所述的装置，其特征在于，所述分组单元采用K-means方法对所述输入图片进行初次聚类。

15.根据权利要求9所述的装置，其特征在于，所述全局特征为：颜色、纹理或形状特征；

所述局部特征为SIFT特征。

16.根据权利要求9所述的装置，其特征在于，所述装置进一步包括：选取单元，用于将所述二次聚类结果中的包含图片数量大于设定值的集合中的图片作为热门图片，所述热门图片用于在搜索引擎系统中作为优先返回的检索结果。

一种图片聚类的方法及装置

【技术领域】

[0001] 本发明涉及图片处理技术，特别涉及一种图片聚类的方法及装置。【背景技术】

[0002] 对海量图片进行聚类，根据聚类结果对同一类的图片进行相应处理，是图片搜索引擎向用户返回准确的检索结果的前提。例如，对海量图片进行聚类处理，根据聚类结果，将同一类中的重复图片去除，可以实现对海量图片的去重工作，这样用户在海量图片数据库中进行图片检索时，针对相同关键词可以得到尽可能丰富的结果。

[0003] 在现有技术中，对海量图片进行聚类，通常采用的方法是抽取图片的全局特征，然后通过比较不同图片的全局特征的相似度将相似图片聚为一类。在现有技术的方法对海量图片进行聚类时，准确度和召回率都不够高。【发明内容】

[0004] 本发明所要解决的技术问题是提供一种图片聚类的方法及装置，以解决现有技术对海量图片进行聚类时，准确度和召回率较低的缺陷。

[0005] 本发明为解决技术问题而采用的技术方案是提供一种图片聚类方法，包括：A.提取多张输入图片的全局特征和局部特征；B．根据所述全局特征对所述输入图片进行初次聚类，以得到初步聚类结果，其中所述初步聚类结果包括一个以上的图片组；C．根据所述局部特征分别对每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片的二次聚类结果。

[0006] 根据本发明之一优选实施例，所述步骤A中提取所述输入图片的多个全局特征；所述步骤B中根据每个全局特征分别对所述输入图片进行初次聚类，以得到与每个全局特征对应的初次聚类结果，其中每个初次聚类结果包含一个以上的图片组；所述步骤C中针对与每个全局特征对应的初次聚类结果，根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片与每个全局特征对应的二次聚类结果；所述方法进一步包括：将各二次聚类结果进行合并，得到所述输入图片的最终聚类结果。

[0007] 根据本发明之一优选实施例，将各二次聚类结果进行合并的步骤具体包括：将各二次聚类结果包含的集合中，两两之间存在交集的多个集合合并为一个集合。

[0008] 根据本发明之一优选实施例，所述多个全局特征中包含第一全局特征，其中所述第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。

[0009] 根据本发明之一优选实施例，所述多个全局特征中包含第二全局特征，其中所述第二全局特征为Gist特征。

[0010] 根据本发明之一优选实施例，所述步骤B中采用K-means方法对所述输入图片进行初次聚类。

[0011] 根据本发明之一优选实施例，所述全局特征为：颜色、纹理或形状特征；所述局部特征为SIFT特征。

[0012] 根据本发明之一优选实施例，根据所述局部特征分别对每个图片组内的图片进行二次聚类的步骤具体包括：针对每个图片组，建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引；利用所述倒排索引，将拥有共同特征分量数超过预设值的图片归为一类，得到每个图片组内的一个以上的集合。

[0013] 根据本发明之一优选实施例，所述方法进一步包括：将所述二次聚类结果中的包含图片数量大于设定值的集合中的图片作为热门图片，所述热门图片用于在搜索引擎系统中作为优先返回的检索结果。

[0014] 本发明还提供了一种图片聚类的装置，包括：特征提取单元，用于提取多张输入图片的全局特征和局部特征；分组单元，用于根据所述全局特征对所述输入图片进行初次聚类，以得到初步聚类结果，其中所述初步聚类结果包括一个以上的图片组；确定单元，用于根据所述局部特征对每个图片组内的图片进行二次聚类，以将每个组内的图片分为一个以上的集合，得到所述输入图片的二次聚类结果。

[0015] 根据本发明之一优选实施例，所述特征提取单元提取所述输入图片的多个全局特征；所述分组单元根据每个全局特征分别对所述输入图片进行初次聚类，以得到与每个全局特征对应的初次聚类结果，其中每个初次聚类结果包含一个以上的图片组；所述确定单元针对与每个初次聚类结果，根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为一个以上的集合，得到所述输入图片与每个全局特征对应的二次聚类结果；所述装置进一步包括：合并单元，用于将各二次聚类结果进行合并，得到所述输入图片的最终聚类结果。

[0016] 根据本发明之一优选实施例，所述合并单元将各二次聚类结果进行合并的方式具体包括：将各二次聚类结果包含的集合中，两两之间存在交集的多个集合合并为一个集合。

[0017] 根据本发明之一优选实施例，所述多个全局特征中包含第一全局特征，其中所述第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。

[0018] 根据本发明之一优选实施例，所述多个全局特征中包含第二全局特征，其中所述第二全局特征为Gist特征。

[0019] 根据本发明之一优选实施例，所述分组单元采用K-means方法对所述输入图片进行初次聚类。

[0020] 根据本发明之一优选实施例，所述全局特征为：颜色、纹理或形状特征；所述局部特征为SIFT特征。

[0021] 根据本发明之一优选实施例，所述确定单元具体包括：索引单元，用于针对每个图片组，建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引；归类单元，用于利用所述倒排索引，将拥有共同特征分量数超过预设值的图片归为一类，得到每个图片组内的一个以上的集合。

[0022] 根据本发明之一优选实施例，所述装置进一步包括：选取单元，用于将所述二次聚类结果中的包含图片数量大于设定值的集合中的图片作为热门图片，所述热门图片用于在搜索引擎系统中作为优先返回的检索结果。

[0023] 由以上技术方案可以看出，通过采用全局特征对海量图片初次聚类以对输入图片进行分组，再通过局部特征对每组内的图片进行二次聚类，可以有效提高对海量图片聚类时的准确度和召回率。【附图说明】

[0024] 图1是本发明中图片聚类的方法的实施例的流程示意图；

[0025] 图2是本发明中图片聚类效果示意图；

[0026] 图3是本发明中为图片及其特征分量建立的普通索引的示意图；

[0027] 图4是本发明中为图片及其特征分量建立的倒排索引的示意图；

[0028] 图5是本发明中图片聚类装置的实施例一的结构示意框图；

[0029] 图6是本发明中图片聚类装置的实施例二的结构示意框图。【具体实施方式】

[0030] 为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

[0031] 请参考图1和图2，图1为本发明中图片聚类的方法的实施例的流程示意图，图2为本发明中图片聚类效果示意图。如图1所示，该实施例包括：

[0032] 步骤S101：提取多张输入图片的全局特征和局部特征。

[0033] 步骤S102：根据上述全局特征对上述输入图片进行初次聚类，以得到与上述全局特征对应的初步聚类结果，其中初步聚类结果包括一个以上的图片组。

[0034] 步骤S103：根据上述局部特征分别对每个图片组内的图片进行二次聚类，以将每个组内的图片分为一个以上的集合，得到输入图片的二次聚类结果。

[0035] 作为一个实施例，步骤S101中，为每张输入图片提取一个全局特征和一个局部特征。全局特征可以是图片的颜色、纹理、形状等特征，具体地，如MPEG-7的各种颜色或纹理描述符、LBP(Local Binary Patterns)特征、距特征、小波特征等。局部特征可以是SIFT(Scale Invariant Feature Transform，尺度不变特征转换)特征、SURF(Speeded Up Robust Features)特征、color-SIFT特征、PCA-SIFT特征等。

[0036] 提取图片的颜色特征，可以采用颜色直方图、颜色集、颜色距、颜色聚合向量等方法；提取图片的纹理特征，可以采用灰度共生矩阵、自回归纹理模型、小波变换等方法；提取图片的形状特征，可以采用边界特征法、傅里叶形状描述符法等。由于上述各种特征提取方法都属于现有技术，在此不再赘述。

[0037] SIFT特征是采用SIFT算法提取的一种局部特征，对旋转、尺度缩放、亮度变化具有不变性。由于SIFT特征的提取算法属于现有技术，本说明书在此不再做进一步的介绍。

[0038] 步骤S102中可以采用K-means聚类法对输入图片进行聚类，聚类采用的特征就是步骤S101中提取的全局特征。K-means聚类法以空间中k个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方法，逐次更新各聚类中心的值，直至得到最好的聚类结果。

[0039] 具体地，对输入图片进行初次聚类包括：

[0040] 从输入图片中选取一定数量的图片作为样本图片，利用样本图片确定K个聚类中心，其中K为自然数；将输入图片中除样本外的剩余图片分为K份，其中每份图片对应一个聚类中心，利用分布式计算平台，将每份图片中的每张图片分别与对应的聚类中心进行相似度比较，并将当前比较的图片归到最相似的聚类中心所在类。

[0041] 上述过程中，确定K个聚类中心，以及将每张图片分别与对应的聚类中心进行比较过程中，依据的都是图片的全局特征。

[0042] 应该理解，本发明中用于聚类的输入图片，数量很可能是巨大的，在上述实施方式中，对所有输入图片进行初次聚类采用了分布式计算的方式进行，这样能够使得对海量图片的聚类处理所需时间保持在可接受的范围之内。

[0043] 输入图片在经过初次聚类后，被分为了若干个图片组。每个组内的图片具有一定的相似性，但不一定是相同内容的图片，例如一个组内的图片都是圆形的物体，但是里面有的是富士苹果，有的是蛇果，并不完全一致。

[0044] 接下来，步骤S103中，将根据图片的局部特征对该图片组内的图片进行二次聚类。

[0045] 具体地，对图片组内的图片进行二次聚类的步骤包括：

[0046] 针对每个图片组，建立局部特征中各特征分量与图片组中的各图片之间的倒排索引；

[0047] 利用该倒排索引，将拥有共同特征分量数超过预设值的图片归为一类，得到每个图片组内的一个以上的集合。

[0048] 在步骤S101中提取的局部特征为SIFT特征，该特征以特征向量的形式表示，为了后续处理的方便，优选地，本发明还在步骤S103之前对SIFT特征向量进行了量化处理。对SIFT特征进行量化处理，就是将SIFT特征的各特征分量变为010101序列，即将SIFT特征中以实数表示的特征分量转化为二进制序列表示的特征分量。

[0049] 请参考图3和图4，其中图3是本发明中为图片及其特征分量建立的普通索引的示意图，图4是本发明中为图片及其特征分量建立的倒排索引的示意图。其中图3所示的普通索引可以通过图片的ID确定该图片的各特征分量，而图4所示的倒排索引则可以通过已知的特征分量，确定与该特征分量对应的各图片ID。

[0050] 本发明中，为图片及其局部特征的特征分量，建立如图3所示的倒排索引，在得到该倒排索引之后，查找该倒排索引，就可以确定拥有相同特征分量的图片，例如查询特征分量1，对应找到的图片有图片A、B、C，则图片A、B、C就是拥有相同特征分量的图片。当几张图片拥有相同特征分量的数目大于一个设定的阈值时，这几张图片就可以聚为一个集合，从而把初次聚类结果中的每个组内的图片进行了划分，得到了输入图片的二次聚类结果。这时输入图片的二次聚类结果与初次聚类结果相比，拥有更小粒度的集合。由于采用了局部特征进行二次聚类，在二次聚类结果的每个集合中，可以得到相同内容而版本可能不同的图片，例如一个集合中的图片表达的都是相同一只苹果，各个图片上加印了一些不同文字等。

[0051] 在另一个实施例中，步骤S101中提取输入图片的多个全局特征和一个局部特征。步骤S102中根据每个全局特征分别对输入图片进行初次聚类，以得到与每个全局特征对应的初次聚类结果，其中每个初次聚类结果包含多个图片组。步骤S103中针对与每个全局特征对应的初次聚类结果，根据步骤S101中提取的局部特征分别对初次聚类结果中的每个图片组内的图片进行二次聚类，以将每个图片组内的图片分为多个集合，得到输入图片与每个全局特征对应的二次聚类结果。此外，在本实施例中，在步骤S103后还包括步骤S104：将各个二次聚类结果合并，得到输入图片的最终聚类结果。

[0052] 其中所述多个全局特征中包括第一全局特征，该第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。

[0053] 上述各个特征描述子，即对应特征的特征向量，用于描述对应特征。前文已经介绍了颜色特征、纹理特征及形状特征的提取方式，在此不再重复。通常空间关系特征的提取方式有两种：一种是对图像进行自动分割，划分出图像中所包含的对象或颜色区域，然后根据这些区域提取图像特征；一种是简单地将图像均匀地划分为若干规则子块，然后对每个图像子块提取特征，由于都属于现有技术，在此不再展开描述。

[0054] 以优选的实施方式为例，第一全局特征融合了上述四个特征描述子，具体地，在得到上述四个特征描述子后，将这四个特征描述子融合为第一全局特征的步骤包括：

[0055] 将上述四个特征描述子组合为一个特征向量；

[0056] 对该特征向量进行降维处理；

[0057] 对降维之后的特征向量进行量化处理，得到第一全局特征。

[0058] 其中降维处理是为了保留原特征向量中特征分量值高的特征分量，这些特征分量包含了第一全局特征的主要信息。由于降维处理和量化处理的算法均可采用现有技术进行，在此不再做过多的描述。

[0059] 步骤S101中提取的多个全局特征，除了上述方式得到的第一全局特征，还包括第二全局特征，所述第二全局特征可以是Gist(概要)特征。

[0060] Gist特征是描述图片概要信息的一种全局特征，其具体的算法可以参考http://ilab．usc．edu/siagian/Research/Gist/Gist．html中的介绍，在此不做重复说明。

[0061] 在本实施例中，通过采用两种不同的全局特征分别进行初次聚类，然后利用局部特征在两个初次聚类结果内分别进行二次聚类，得到两个二次聚类结果，通过将这两个二次聚类结果合并，可以有效地扩大召回，本领域技术人员应该能够理解，在其他的实施例中，采用多种全局特征分别进行初次聚类也是可行的。

[0062] 在上述的实施例中，将多个聚类结果进行合并的方式具体包括：将各个二次聚类结果包含的集合中，两两之间存在交集的多个集合合并为一个集合。以两个聚类结果为例进行说明，如果聚类结果A包含集合A1、A2、A3，聚类结果B包含集合B1、B2、B3，其中集合A1中包含图片4、5、6，集合B2中包含图片4、5、7，则集合A1和B2存在交集图片4和5，将集合A1和B2合并后得到的集合C1包含图片4、5、6、7，假设集合A2、A3与B1、B3之间没有交集，则将聚类结果A和聚类结果B合并后的最终聚类结果包含的集合为C1、A2、A3、B1、B3。

[0063] 在另一个实施例中，在对输入图片进行聚类之后，还可以对聚类结果中相同集合的图片赋予统一标识，以方便搜索引擎接收到用户的搜索关键字后，根据统一标识向用户返回该标识对应集合中的图片。

[0064] 在另一个实施例中，在对输入图片进行聚类后，还可以将聚类结果中包含图片数量大于设定值的集合中的图片作为热门图片，这些热门图片可用于在搜索引擎系统中作为优先返回的检索结果。

[0065] 请参考图5，图5是本发明中图片聚类装置的实施例一的结构示意框图。如图5所示，该实施例包括特征提取单元201、分组单元202及确定单元203。

[0066] 其中特征提取单元201，用于提取多张输入图片的全局特征和局部特征。分组单元202，用于根据所述全局特征对输入图片进行初次聚类，以得到与所述全局特征对应的初步聚类结果，其中初步聚类结果包括一个以上的图片组。确定单元203，用于根据所述局部特征对每个图片组内的图片进行二次聚类，以将每个组内的图片分为一个以上的集合，得到输入图片的二次聚类结果。

[0067] 其中，特征提取单元201提取的全局特征，可以是图片的颜色纹理、形状等特征，如MPEG-7的各种颜色或纹理描述符、LBP特征、距特征、小波特征等。局部特征可以是SIFT特征、SURF特征、color-SIFT特征、PCA-SIFT特征等。

[0068] 分组单元202可以采用K-means聚类法对输入图片进行聚类，聚类采用的特征就是特征提取单元201提取的全局特征。

[0069] 具体地，分组单元202可以包括聚类中心确定单元(图中未示出)和比较单元(图中未示出)。

[0070] 其中聚类中心确定单元用于从输入图片中选取一定数量的图片作为样本图片，利用样本图片确定K个聚类中心，其中K为自然数。比较单元用于将输入图片中除样本外的剩余图片分为K份，其中每份图片对应一个聚类中心，利用分布式计算平台，将每份图片中的每张图片分别与对应的聚类中心进行相似度比较，并将当前比较的图片归到最相似的聚类中心所在类。

[0071] 具体地，确定单元203包括索引单元(图中未示出)和归类单元(图中未示出)，其中索引单元用于针对分组单元203得到的每个图片组，建立局部特征中各特征分量与图片组中的各图片之间的倒排索引。归类单元用于利用上述倒排索引，将拥有共同特征分量数超过预设值的图片归为一类，得到每个图片组内的一个以上的集合。

[0072] 请参考图6，图6为本发明中图片聚类装置的实施例二的结构示意框图。如图6所示，该装置包括：特征提取单元3011、第一分组单元3021、第二分组单元3022、第一确定单元3031、第二确定单元3032及合并单元3041。

[0073] 其中特征提取单元3011，用于提取输入图片的第一全局特征、第二全局特征及局部特征。第一分组单元3021，用于根据第一全局特征对输入图片进行初次聚类，得到与第一全局特征对应的初次聚类结果。第二分组单元3022，用于根据第二全局特征对输入图片进行初次聚类，得到与第二全局特征对应的初次聚类结果。其中第一分组单元3021和第二分组单元3022得到的聚类结果中均包含有一个以上的图片组。

[0074] 第一确定单元3031，用于针对第一分组单元3021得到的初次聚类结果，根据特征提取单元3011提取的局部特征对该初次聚类结果中的每个图片组内的图片进行二次聚类，得到输入图片与第一全局特征对应的二次聚类结果。第二确定单元3032，用于针对第二分组单元3022得到的初次聚类结果，根据特征提取单元3011提取的局部特征对该初次聚类结果中的每个图片组内的图片进行二次聚类，得到输入图片与第二全局特征对应的二次聚类结果。

[0075] 合并单元3041，用于将与第一全局特征对应的二次聚类结果和与第二全局特征对应的二次聚类结果合并，得到输入图片的最终聚类结果。其中合并的具体方式包括：将两个聚类结果各自包含的集合中存在交集的两个集合合并为一个集合。基于相似的方法，如果在其他实施例中存在两个以上的二次聚类结果，则合并的具体方式包括：将各聚类结果包含的集合中，两两之间存在交集的多个集合合并为一个集合。

[0076] 在本实施例中，特征提取单元3011中提取的第一全局特征包括颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。第二全局特征为Gist特征。局部特征为SIFT特征。

[0077] 在本发明的另一个实施例中，本发明的装置还可以包括标识单元(图中未示出)或选取单元(图中未示出)。其中标识单元用于为聚类结果中的相同集合的图片赋予统一标识。选取单元用于将聚类结果中包含图片数量大于设定值的集合中的图片作为热门图片，其中热门图片用于在搜索引擎系统中作为优先返回的检索结果。可以理解，这里的聚类结果对实施例一而言指的是输入图片的二次聚类结果，对实施例二而言是输入图片的最终聚类结果。

[0078] 以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

一种图片聚类的方法及装置转让专利

申请号 : CN201210144457.0

文献号 : CN103390165B

文献日 : 2017-08-22

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 文林福

申请人 : 北京百度网讯科技有限公司

摘要 :

权利要求 :

说明书 :

一种图片聚类的方法及装置