一种类簇合并方法、装置、终端及计算机可读存储介质转让专利

申请号 : CN202210855360.4

文献号 : CN114937165B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 华逸伦余文杰彭京朱树磊殷俊李建邓彦杰李海安

申请人 : 浙江大华技术股份有限公司

摘要 :

本发明提供一种类簇合并方法、装置、终端及计算机可读存储介质,类簇合并方法包括:获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像;基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇;将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同;将当前类簇与真实合档类簇进行合并。本申请不需要将当前类簇中的所有图像与历史类簇集中的所有历史类簇中的各图像进行相似度计算,即减少了不必要的计算,节约了类簇合并过程中的耗时,同时又保证了召回率。

权利要求 :

1.一种类簇合并方法,其特征在于,包括:

获取当前类簇,并确定所述当前类簇的类簇信息,其中,所述当前类簇包括多张包含同一目标对象的多张图像;

基于所述当前类簇的类簇信息,从历史类簇集中筛选出与所述当前类簇相关的多个历史类簇,作为候选合档类簇;

对所述当前类簇中包含的所述图像进行检测,得到所述图像中包含的所述目标对象的检测信息;所述检测信息包括目标对象质量分;

基于各所述图像对应的所述目标对象质量分,确定所述当前类簇对应的组别;其中,各所述组别分别对应不同的评分范围;

基于所述当前类簇的组别和所述候选合档类簇的组别,确定所述当前类簇与各所述候选合档类簇之间的配对组;其中,所述配对组中的所述当前类簇的组别对应的评分范围与所述候选合档类簇的组别对应的评分范围最近;

基于各所述配对组的相似度,计算所述当前类簇与所述候选合档类簇的相似度,以确定所述当前类簇对应的真实合档类簇;其中,所述真实合档类簇的目标对象与所述当前类簇的目标对象相同;

将所述当前类簇与所述真实合档类簇进行合并。

2.根据权利要求1所述的类簇合并方法,其特征在于,所述类簇信息包括属性信息、时空轨迹信息和第一特征信息;

所述基于所述当前类簇的类簇信息,从历史类簇集中筛选出与所述当前类簇相关的多个历史类簇,作为候选合档类簇,包括:从所述历史类簇集中提取与所述当前类簇的属性差异符合第一预设条件的历史类簇,形成第一候选集;

从所述第一候选集中提取与所述当前类簇的时空轨迹有交集的历史类簇,形成第二候选集;

从所述第二候选集中提取与所述当前类簇的第一特征差异符合第二预设条件的历史类簇,所述历史类簇作为所述当前类簇的候选合档类簇。

3.根据权利要求2所述的类簇合并方法,其特征在于,所述属性信息包括所述目标对象的性别信息和年龄信息;

所述从所述历史类簇集中提取与所述当前类簇的属性差异符合第一预设条件的历史类簇,形成第一候选集,包括:从所述历史类簇集中提取与所述当前类簇的所述目标对象的性别相同的所述历史类簇,形成初始候选集;

从所述初始候选集中提取与所述当前类簇的所述目标对象的年龄差值小于预设差值的所述历史类簇,形成所述第一候选集。

4.根据权利要求2所述的类簇合并方法,其特征在于,

所述从所述第一候选集中提取与所述当前类簇的时空轨迹有交集的历史类簇,形成第二候选集,包括:响应于所述第一候选集中的历史类簇的时空轨迹信息中的任一时空坐标点与所述当前类簇的时空轨迹信息中的任一时空坐标点相同或者差值在预设范围内,确定所述历史类簇与所述当前类簇的时空轨迹有交集;

基于确定的所述当前类簇的时空轨迹有交集的所述历史类簇,形成所述第二候选集。

5.根据权利要求2所述的类簇合并方法,其特征在于,所述第一特征信息包括所述当前类簇的平均质心;

所述从所述第二候选集中提取与所述当前类簇的第一特征差异符合第二预设条件的历史类簇,所述历史类簇作为所述当前类簇的候选合档类簇,包括:计算所述第二候选集中的历史类簇的平均质心与所述当前类簇的平均质心的相似度;

响应于所述第二候选集中的历史类簇的平均质心与所述当前类簇的平均质心之间的相似度大于预设阈值,所述历史类簇作为所述当前类簇的候选合档类簇。

6.根据权利要求1所述的类簇合并方法,其特征在于,所述类簇信息还包括组别和所述组别的第二特征信息;

所述基于各所述配对组的相似度,计算所述当前类簇与所述候选合档类簇的相似度,以确定所述当前类簇对应的真实合档类簇,包括:计算每一所述配对组中所述当前类簇的组别与所述候选合档类簇的组别之间的相似度,以作为所述配对组的相似度;

基于每一所述配对组的相似度,计算所述当前类簇与所述候选合档类簇的相似度,以确定所述当前类簇对应的真实合档类簇。

7.根据权利要求6所述的类簇合并方法,其特征在于,所述第二特征信息包括每个所述组别的实体质心;

所述基于所述当前类簇的组别和所述候选合档类簇的组别,确定所述当前类簇与各所述候选合档类簇之间的配对组,包括:基于所述当前类簇的组别的实体质心与所述候选合档类簇的组别的实体质心进行组别配对,得到配对组;其中,所述配对组的个数为所述当前类簇的组别数和所述候选合档类簇的组别数中的较小者。

8.根据权利要求6所述的类簇合并方法,其特征在于,

所述计算每一所述配对组中所述当前类簇的组别与所述候选合档类簇的组别之间的相似度,以作为所述配对组的相似度,包括:选择所述配对组中所述当前类簇的组别与所述候选合档类簇的组别中属性距离最接近的两张图像进行相似度计算,以作为所述配对组的相似度。

9.一种类簇合并装置,其特征在于,包括:

获取模块,用于获取当前类簇,并确定所述当前类簇的类簇信息,其中,所述当前类簇包括多张包含同一目标对象的多张图像;

初筛模块,用于基于所述当前类簇的类簇信息,从历史类簇集中筛选出与所述当前类簇相关的多个历史类簇,作为候选合档类簇;

二筛模块,用于对所述当前类簇中包含的所述图像进行检测,得到所述图像中包含的所述目标对象的检测信息;所述检测信息包括目标对象质量分;基于各所述图像对应的所述目标对象质量分,确定所述当前类簇对应的组别;其中,各所述组别分别对应不同的评分范围;基于所述当前类簇的组别和所述候选合档类簇的组别,确定所述当前类簇与各所述候选合档类簇之间的配对组;其中,所述配对组中的所述当前类簇的组别对应的评分范围与所述候选合档类簇的组别对应的评分范围最近;基于各所述配对组的相似度,计算所述当前类簇与所述候选合档类簇的相似度,以确定所述当前类簇对应的真实合档类簇,其中,所述真实合档类簇的目标对象与所述当前类簇的目标对象相同;

合并模块,用于将所述当前类簇与所述真实合档类簇进行合并。

10.一种终端,其特征在于,所述终端包括存储器、处理器以及存储于所述存储器中并在所述处理器上运行的计算机程序,所述处理器用于执行程序数据以实现如权利要求1 8~任一项所述的类簇合并方法中的步骤。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1 8任一项所述的类簇合并方法中~的步骤。

说明书 :

一种类簇合并方法、装置、终端及计算机可读存储介质

技术领域

[0001] 本发明涉及图像识别技术领域,特别是涉及一种类簇合并方法、装置、终端及计算机可读存储介质。

背景技术

[0002] 传统的人脸聚类,是通过人脸识别技术对人脸图片进行特征值解析,提取出图片的相关要素信息,再通过比较特征值相似度,对图片进行聚类。新的类簇与旧的类簇进行合并时,往往需要将两个类簇中包含的所有人脸图像分别进行相似度比较,导致计算速度慢,且只用了特征信息,准确率不高。另一种方式是比较类簇质心的特征值相似度,确定新的类簇与旧的类簇是否需要进行合并。如果满足一定的阈值,则添加到类簇。但是仅通过质心特征的相似度确定两个类簇是否对应同一目标对象,虽然减少了计算量,但是影响了合并类簇的准确率。

发明内容

[0003] 本发明主要解决的技术问题是提供一种类簇合并方法、装置、终端及计算机可读存储介质,解决现有技术中合并一人多档的过程耗时长的问题。
[0004] 为解决上述技术问题,本发明采用的第一个技术方案是:提供一种类簇合并方法,类簇合并方法包括:获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像;基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇;将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同;将当前类簇与真实合档类簇进行合并。
[0005] 其中,类簇信息包括属性信息、时空轨迹信息和第一特征信息;基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇,包括:从历史类簇集中提取与当前类簇的属性差异符合第一预设条件的历史类簇,形成第一候选集;从第一候选集中提取与当前类簇的时空轨迹有交集的历史类簇,形成第二候选集;从第二候选集中提取与当前类簇的第一特征差异符合第二预设条件的历史类簇,历史类簇作为当前类簇的候选合档类簇。
[0006] 其中,属性信息包括目标对象的性别信息和年龄信息;从历史类簇集中提取与当前类簇的属性差异符合第一预设条件的历史类簇,形成第一候选集,包括:从历史类簇集中提取与当前类簇的目标对象的性别相同的历史类簇,形成初始候选集;从初始候选集中提取与当前类簇的目标对象的年龄差值小于预设差值的历史类簇,形成第一候选集。
[0007] 其中,从第一候选集中提取与当前类簇的时空轨迹有交集的历史类簇,形成第二候选集,包括:响应于第一候选集中的历史类簇的时空轨迹信息中的任一时空坐标点,与当前类簇的时空轨迹信息中的任一时空坐标点相同或者差值在预设范围内,确定历史类簇与当前类簇的时空轨迹有交集;基于确定的当前类簇的时空轨迹有交集的历史类簇,形成第二候选集。
[0008] 其中,第一特征信息包括当前类簇的平均质心;从第二候选集中提取与当前类簇的第一特征差异符合第二预设条件的历史类簇,历史类簇作为当前类簇的候选合档类簇,包括:计算第二候选集中的历史类簇的平均质心与当前类簇的平均质心的相似度;响应于第二候选集中的历史类簇的平均质心与当前类簇的平均质心之间的相似度大于预设阈值,历史类簇作为当前类簇的候选合档类簇。
[0009] 其中,类簇信息还包括组别和组别的第二特征信息;将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,包括:将当前类簇中的组别与候选合档类簇中的组别进行组别配对,得到配对组;计算每一配对组中当前类簇的组别与候选合档类簇的组别之间的相似度,以作为配对组的相似度;基于每一配对组的相似度,计算当前类簇与候选合档类簇的相似度,以确定当前类簇对应的真实合档类簇。
[0010] 其中,当前类簇和历史类簇分别基于目标对象质量分将其内的多张图像分成多个组别,第二特征信息包括每个组别的实体质心;将当前类簇中的组别与候选合档类簇中的组别进行组别配对,得到配对组,包括:基于当前类簇的组别的实体质心与候选合档类簇的组别的实体质心进行组别配对,得到配对组;其中,配对组的个数为当前类簇的组别数和候选合档类簇的组别数中的较小者。
[0011] 其中,计算每一配对组中当前类簇的组别与候选合档类簇的组别之间的相似度,以作为配对组的相似度,包括:选择配对组中当前类簇的组别与候选合档类簇的组别中属性距离最接近的两张图像进行相似度计算,以作为配对组的相似度。
[0012] 为解决上述技术问题,本发明采用的第二个技术方案是:提供一种类簇合并装置,类簇合并装置包括:获取模块,用于获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像;初筛模块,用于基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇;二筛模块,用于将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同;合并模块,用于将当前类簇与真实合档类簇进行合并。
[0013] 为解决上述技术问题,本发明采用的第三个技术方案是:提供一种终端,该终端包括存储器、处理器以及存储于存储器中并在处理器上运行的计算机程序,处理器用于执行程序数据以实现上述类簇合并方法中的步骤。
[0014] 为解决上述技术问题,本发明采用的第四个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述类簇合并方法中的步骤。
[0015] 本发明的有益效果是:区别于现有技术的情况,提供的一种类簇合并方法、装置、终端及计算机可读存储介质,类簇合并方法包括:获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像;基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇;将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同;将当前类簇与真实合档类簇进行合并。本申请通过筛选当前类簇的候选合档类簇,并从候选合档类簇中确定真实合档类簇,不需要将当前类簇中的所有图像与历史类簇集中的所有历史类簇中的各图像进行相似度计算,即减少了不必要的计算,节约了类簇合并过程中的耗时,同时又保证了召回率。

附图说明

[0016] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0017] 图1是本发明提供的类簇合并方法的流程示意图;
[0018] 图2是本发明提供的类簇合并方法一具体实施例的流程示意图;
[0019] 图3是本发明提供的类簇合并装置一实施例的框架示意图;
[0020] 图4是本申请终端一实施例的框架示意图;
[0021] 图5为本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

[0022] 下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0023] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0024] 本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0025] 为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明所提供的一种类簇合并方法做进一步详细描述。
[0026] 请参阅图1,图1是本发明提供的类簇合并方法的流程示意图。
[0027] 本实施例中提供一种类簇合并方法,该类簇合并方法包括如下步骤。
[0028] S11:获取当前类簇,并确定当前类簇的类簇信息。
[0029] 具体地,当前类簇包括多张包含同一目标对象的多张图像。类簇信息包括属性信息、时空轨迹信息和第一特征信息。属性信息包括目标对象的性别信息和年龄信息。在另一实施例中,类簇信息还包括组别和组别的第二特征信息。
[0030] S12:基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇。
[0031] 具体地,从历史类簇集中提取与当前类簇的属性差异符合第一预设条件的历史类簇,形成第一候选集;从第一候选集中提取与当前类簇的时空轨迹有交集的历史类簇,形成第二候选集;从第二候选集中提取与当前类簇的第一特征差异符合第二预设条件的历史类簇,历史类簇作为当前类簇的候选合档类簇。
[0032] 在一实施例中,从历史类簇集中提取与当前类簇的目标对象的性别相同的历史类簇,形成初始候选集;从初始候选集中提取与当前类簇的目标对象的年龄差值小于预设差值的历史类簇,形成第一候选集。
[0033] 在一实施例中,响应于第一候选集中的历史类簇的时空轨迹信息中的任一时空坐标点,与当前类簇的时空轨迹信息中的任一时空坐标点相同或者差值在预设范围内,确定历史类簇与当前类簇的时空轨迹有交集;基于确定的当前类簇的时空轨迹有交集的历史类簇,形成第二候选集。
[0034] 在一实施例中,第一特征信息包括当前类簇的平均质心。计算第二候选集中的历史类簇的平均质心与当前类簇的平均质心的相似度;响应于第二候选集中的历史类簇的平均质心与当前类簇的平均质心之间的相似度大于预设阈值,历史类簇作为候选合档类簇。
[0035] S13:将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇。
[0036] 具体地,真实合档类簇的目标对象与当前类簇的目标对象相同。将当前类簇中的组别与候选合档类簇中的组别进行组别配对,得到配对组;计算每一配对组中当前类簇的组别与候选合档类簇的组别之间的相似度,以作为配对组的相似度;基于每一配对组的相似度,计算当前类簇与候选合档类簇的相似度,以确定当前类簇对应的真实合档类簇。
[0037] 在一实施例中,当前类簇和历史类簇分别基于目标对象质量分将其内的多张图像分成多个组别,第二特征信息包括每个组别的实体质心。基于当前类簇的组别的实体质心与候选合档类簇的组别的实体质心进行组别配对,得到配对组;其中,配对组的个数为当前类簇的组别数和候选合档类簇的组别数中的较小者。
[0038] 在一实施例中,选择配对组中当前类簇的组别与候选合档类簇的组别中属性距离最接近的两张图像进行相似度计算,以作为配对组的相似度。
[0039] S14:将当前类簇与真实合档类簇进行合并。
[0040] 具体地,将当前类簇中的图像与当前类簇对应的所有真实合档类簇包含的图像进行合并得到合并类簇。对于相同的多个图像,合并类簇中只保留一个,其他的剔除。
[0041] 在一实施例中,基于当前类簇的类簇信息、当前类簇包含的图像的个数以及真实合档类簇的类簇信息、真实合档类簇包含的图像的个数,确定合并类簇的类簇信息。
[0042] 本实施例提供了一种类簇合并方法包括:获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像;基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇;将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同;将当前类簇与真实合档类簇进行合并。本申请通过筛选当前类簇的候选合档类簇,并从候选合档类簇中确定真实合档类簇,不需要将当前类簇中的所有图像与历史类簇集中的所有历史类簇中的各图像进行相似度计算,即减少了不必要的计算,节约了类簇合并过程中的耗时,同时又保证了召回率。
[0043] 请参阅图2,图2是本发明提供的类簇合并方法的一具体实施例的流程示意图。
[0044] 本实施例中提供一种类簇合并方法,该类簇合并方法包括如下步骤。
[0045] S201:获取当前类簇和历史类簇集。
[0046] 具体地,当前类簇包括多张包含同一目标对象的多张图像;历史类簇集包括M个历史类簇;历史类簇包括至少一张包含目标对象的图像,M为正整数。其中,M个历史类簇对应的目标对象可以均不相同,也可以多个历史类簇对应同一目标对象。
[0047] 在一实施例中,在城市中的多个预设位置安装图像采集设备,对安装的图像采集设备进行编号,图像采集设备的编号与对应的预设位置的位置坐标相关联。图像采集设备进行图像采集时,采集的图像具有采集时间。
[0048] 在一具体实施例中,将多个预设位置进行空间域的划分,即将多个预设位置划分为A个不同的空间域,编号为1,2……A。每个预设位置对应不同的编号。设定图像采集设备进行首次采集图像的时间为TIME_START,如2021‑01‑01的00:00:00,时间间隔为TIME_INTERVAL,按时间间隔将TIME_START到当前时间,分为B个时间域,编号为1,2……B。
[0049] 在一具体实施例中,通过设置的图像采集设备抓拍多张人脸图像,并对采集的人脸图像进行人脸聚类,即将同一目标对象的多张人脸图像归属于同一类簇。将聚类得到的各类簇分别作为当前类簇。在本实施例中,目标对象为人,图像为人脸图像。图像也可以为人体图像、头肩图像等。在其他实施例中,目标对象也可以为动物、植物,在此不做限制。
[0050] S202:基于当前类簇中包含的图像,确定当前类簇的类簇信息。
[0051] 具体地,对当前类簇中包含的所有图像分别进行特征提取,得到各图像的目标特征;基于当前类簇中包含的所有图像的目标特征,确定当前类簇的类簇信息。
[0052] 在一具体实施例中,对当前类簇中包含的所有人脸图像分别进行特征提取,得到各人脸图像的人脸特征,将所有人脸图像的人脸特征进行加和并求取平均值,将平均值进行归一化处理,进而得到当前类簇的平均质心,当前类簇的平均质心作为当前类簇的类簇信息。当前类簇的实体质心为当前类簇包含的所有人脸图像。
[0053] 通过上述方法也可以得到各历史类簇的类簇信息。
[0054] S203:基于当前类簇中包含的图像,确定当前类簇的属性信息。
[0055] 具体地,属性信息包括目标对象的性别信息和年龄信息。对当前类簇中包含的所有图像分别进行目标识别,得到图像中包含的目标对象的年龄和性别;将目标对象的年龄作为当前类簇的年龄信息,将目标对象的性别作为当前类簇的性别信息。
[0056] 在一具体实施例中,对当前类簇中的图像中的人脸图像进行年龄识别和性别识别,得到各人脸图像对应的目标对象的年龄和性别。性别包括男性和女性两种。将当前类簇中所有人脸图像分别对应的目标对象的年龄进行加和平均,将平均年龄作为当前类簇的年龄信息。统计当前类簇中所有人脸图像分别对应的目标对象的性别。如果女性对应的人脸图像的数量多于男性对应人脸图像的数量,则确定女性为当前类簇的性别信息。如果女性对应的人脸图像的数量少于男性对应人脸图像的数量,则确定男性为当前类簇的性别信息。
[0057] 通过上述方法也可以得到各历史类簇的属性信息。
[0058] S204:基于当前类簇中包含的图像,确定当前类簇的时空轨迹信息。
[0059] 具体地,统计各图像的采集时间和采集地点;基于当前类簇中包含的图像的采集时间和采集地点,确定当前类簇对应的目标对象的时空轨迹信息。
[0060] 在一具体实施例中,统计当前类簇中所有图像的采集时间和采集地点,形成当前类簇的时空轨迹信息S。时空轨迹信息S中的每一个元素为一个时空坐标点(a,b),其中,a∈(1,A),b∈(1,B)。A表示图像采集设备的空间域的个数,B表示图像采集设备抓拍人脸图像时的时间域的个数,a和b表示图像采集设备抓拍人脸图像时空间域坐标和时间域坐标。在本实施例中,当前类簇的时空轨迹信息S中依据时间域坐标的大小将各时空坐标点进行排序。
[0061] 通过上述方法也可以得到各历史类簇的时空轨迹信息。
[0062] S205:对当前类簇中包含的图像进行检测,得到图像中包含的目标对象的检测信息。
[0063] 具体地,检测信息包括目标对象质量分。例如,目标对象质量分的范围为[0,100]。对当前类簇中包含的人脸图像进行人脸检测,得到各人脸图像对应的人脸检测质量分。当目标对象的人脸的偏转角度较小,且未遮挡、分辨率较高时,人脸图像对应的的人脸检测质量分较高;当目标对象的人脸的偏转角度较大或人脸存在遮挡、人脸分辨率较低,则人脸图像对应的人脸检测质量分较低。
[0064] S206:基于图像的目标对象质量分,将当前类簇中各图像归属于对应的组别。
[0065] 具体地,为了缩短类簇合并的耗时,基于图像的目标对象质量分,将当前类簇中包含的人脸图像进行分组。将同一等级的目标对象质量分对应的人脸图像归属于同一组别。
[0066] 在一具体实施例中,设置组别集,组别集包括多个组别且各组别对应不同的评分范围。本实施例中,组别为十个。第一组别的评分范围为[0,10];第二组别的评分范围为(10,20];第三组别的评分范围为(20,30];第四组别的评分范围为(30,40];第五组别的评分范围为(40,50];第六组别的评分范围为(50,60];第七组别的评分范围为(60,70];第八组别的评分范围为(70,80];第九组别的评分范围为(80,90];第十组别的评分范围为(90,100]。将当前类簇中各人脸图像的目标对象质量分归属于对应的组别。例如,当前类簇中一人脸图像的目标对象质量分为19,则将该人脸图像归属于第二组别中。将当前类簇中人脸图像所属的组别确定为当前类簇的组别。其中,当前类簇和历史类簇均对应同一组别集。
[0067] S207:将当前类簇中所有图像分别对应的组别,确定当前类簇对应的组别。
[0068] 具体地,并不是每个组别都对应有人脸图像。各组别对应至少一张图像。将当前类簇中人脸图像所属的组别确定为当前类簇的组别。例如,当前类簇中所有人脸图像的目标对象质量分归属于第二组别、第五组别和第十组别,其他的组别中没有归属人脸图像。因此,当前类簇对应的组别为(2,5,10)。
[0069] S208:从历史类簇集中提取与当前类簇的属性差异符合第一预设条件的所有历史类簇,形成第一候选集。
[0070] 具体地,从历史类簇集中提取与当前类簇的性别信息相同的所有历史类簇,形成初始候选集。
[0071] 从初始候选集中提取与当前类簇的年龄信息差值小于预设差值的所有历史类簇,形成第一候选集。在一具体实施例中,初始候选集中的历史类簇的年龄信息与当前类簇的年龄信息相同,则将该历史类簇归属于第一候选集。在另一具体实施例中,由于历史类簇和当前类簇分别对应的年龄信息均为平均值,并不一定是目标对象的真实年龄,因此当初始候选集中的历史类簇的年龄信息与当前类簇的年龄信息的差值小于预设差值时,也可以将该历史类簇归属于第一候选集。
[0072] S209:从第一候选集中提取与当前类簇的时空轨迹信息有交集的所有历史类簇,形成第二候选集。
[0073] 具体地,判断第一候选集中各历史类簇包含的一图像的采集时间与当前类簇包含的一图像的采集时间的差值是否小于第一预设值,且历史类簇中图像的采集地点与当前类簇中图像的采集地点之间的差异是否小于第二预设值;如果历史类簇中图像的采集时间与当前类簇中图像的采集时间之间的差值小于第一预设值,且历史类簇中图像的采集地点与当前类簇中图像的采集地点之间的差异小于第二预设值,则确定历史类簇的时空轨迹信息与当前类簇的时空轨迹信息有交集;基于第一候选集中与当前类簇的时空轨迹信息有交集的所有历史类簇,形成第二候选集。
[0074] S210:基于当前类簇的类簇信息与第二候选集中包含的各历史类簇的类簇信息,确定当前类簇的候选合档类簇。
[0075] 具体地,计算得到第二候选集中各历史类簇的类簇信息分别与当前类簇的类簇信息之间对应的相似度;响应于历史类簇的类簇信息与当前类簇的类簇信息之间的相似度超过相似度阈值,则确定历史类簇为当前类簇的候选合档类簇。其中,当前类簇与候选合档类簇可能对应同一目标对象。
[0076] 为了提高类簇合并的准确率,需要进一步确定当前类簇是否与候选合档类簇对应同一目标对象。
[0077] S211:基于当前类簇对应的组别和一候选合档类簇对应的组别,确定当前类簇与候选合档类簇之间的配对组。
[0078] 具体地,配对组包括当前类簇中一组别和候选合档类簇中一组别。当前类簇对应的组别的数量为第一数量,候选合档类簇对应的组别的数量为第二数量。
[0079] 响应于第一数量小于第二数量,则基于当前类簇对应的各组别在候选合档类簇对应的组别中对应选取评分范围最近的组别,形成候选类簇与候选合档类簇之间对应的第一数量个配对组。
[0080] 在一具体实施例中,当前类簇记为类簇C,一候选合档类簇记为类簇D。类簇C对应的组别为(c1,c2,c3),总共三个组别。类簇D对应的组别为(d1,d2,d3,d4,d5),总共5个组别。由于类簇C对应的组别的个数较少,则遍历类簇C中的每一个组别,在类簇D对应的组别中寻找与类簇C中组别的等级最近的组别。例如,c1=2,c2=5,c3=10,d1=3,d2=4,d3=5,d4=7,d5=9。c1=2表示类簇C对应第二组别,第二组别中的人脸图像的人脸检测质量分在(10,20]范围内。基于目标对象质量分最近的原则,类簇C中的第二组别与类簇D中的第三组别的评分等级最近,则将类簇C中的组别c1与类簇D中的组别d1组成一配对组,记为(c1,d1)。采用上述方法将类簇C中的组别c2与类簇D中的组别d3组成一配对组,记为(c2,d3)。采用上述方法将类簇C中的组别c3与类簇D中的组别d5组成一配对组,记为(c3,d5)。即得到三个配对组。
[0081] S212:基于配对组中图像之间的相似度,确定当前类簇与候选合档类簇之间的类簇相似度。
[0082] 具体地,检测信息还包括目标属性。其中,目标属性包括人脸遮挡程度得分和人脸角度得分。
[0083] 在一实施例中,计算得到配对组中一组别中的各图像的目标属性分别与另一组别中的各图像的目标属性之间对应的属性相似度;选取最大的属性相似度对应的两个图像;将两个图像分别对应的目标特征之间的相似度,确定为配对组的相似度;基于当前类簇与候选合档类簇之间对应的所有配对组的相似度,确定当前类簇与候选合档类簇之间的类簇相似度。
[0084] 在一具体实施例中,以配对组(c1,d1)为例,c1对应三张人脸图像,d1对应四张人脸图像。将c1中的一人脸图像对应的人脸遮挡程度得分和人脸角度得分与d1中的一人脸图像对应的人脸遮挡程度得分和人脸角度得分进行加权求和,得到两个人脸图像对应的属性相似度。进而计算得到c1中的各人脸图像与d1中的各人脸图像之间对应的属性相似度。其中,属性相似度可以通过计算两个人脸图像之间的欧式距离得到。属性相似度也可以称为属性距离。
[0085] 为了进一步减少计算量,不需要计算配对组中各人脸图像的人脸特征之间的相似度,仅选取最大的属性相似度对应的两个人脸图像来计算配对组(c1,d1)的相似度即可。
[0086] 在一具体实施例中,计算得到类簇C和类簇D对应的各配对组的相似度,基于类簇C和类簇D对应的所有配对组对应的相似度确定类簇C和类簇D之间的类簇相似度。
[0087] 本实施例综合了每个配对组的相似度,考虑到不同目标对象质量分的影响,趋势上对目标对象质量分较低的配对组进行更多的加分,保证了召回率。
[0088] 具体的,可以基于如下公式1基于类簇C和类簇D对应的所有配对组对应的相似度,确定类簇C和类簇D之间的类簇相似度。
[0089] (公式1)
[0090] 公式1中:中 为所有配对组对应的 相似度的平均值;为配对组中两个组别的平均组别;
则为加分倍数。其目的是为了给目标对象质量分较低的配对组进行适当加分。因为目标对象质量分较低的图像之间的相似度会低于目标对象质量分较高的图像之间的相似度。
[0091] 在进行真实合并类簇的判断过程中,利用人脸检测质量分进行分组,再对每个组别进行组别配对,只通过相同或相近组别的相似度计算配对组的相似度。一方面减少了计算量,另一方面减少了由于质量差异过大导致相似度过低对真实合并类簇判断结果的干扰。
[0092] S213:响应于当前类簇与候选合档类簇之间的类簇相似度超过类簇相似度阈值,则确定候选合档类簇为当前类簇的真实合档类簇。
[0093] 具体地,如果当前类簇与候选合档类簇之间的类簇相似度超过类簇相似度阈值,则确定候选合档类簇为当前类簇的真实合档类簇。即当前类簇对应的目标对象与候选合档类簇的目标对象相同。
[0094] 如果当前类簇与候选合档类簇之间的类簇相似度未超过类簇相似度阈值,则确定候选合档类簇不是当前类簇的真实合档类簇。即当前类簇对应的目标对象与候选合档类簇的目标对象不同。
[0095] 本实施例中在确定当前类簇的真实合档类簇前,增加了筛选当前类簇的候选合档类簇,减少对全部历史类簇进行判断的操作,节省了不必要的计算资源浪费。筛选当前类簇的候选合档类簇时利用了目标特征、目标属性、采集时间和采集地点,保证了后续合并类簇的召回率。
[0096] S214:将当前类簇与真实合档类簇进行合并,得到合并类簇。
[0097] 具体地,将当前类簇中的图像与当前类簇对应的所有真实合档类簇包含的图像进行合并得到合并类簇。对于相同的多个图像,合并类簇中只保留一个,其他的剔除。
[0098] S215:基于当前类簇的类簇信息、当前类簇包含的图像的个数以及真实合档类簇的类簇信息、真实合档类簇包含的图像的个数,确定合并类簇的类簇信息。
[0099] 具体地,可以基于如下公式2计算得到合并类簇的类簇信息。
[0100] (公式2)
[0101] 公式2中:Nc是类簇C中图像的个数;Nd是类簇D中图像的个数; 表示类簇C的类簇信息的第e维特征,即为Nc的权重; 表示类簇D的类簇信息的第e维特征,即为Nd的权重。
[0102] 在另一实施例中,基于合并类簇中所有图像对应的采集时间和采集地点,确定合并类簇的时空轨迹信息。由于合并类簇对应的是同一目标对象,则合并类簇的年龄信息为当前类别的年龄信息,合并类簇的性别信息为当前类别的性别信息。
[0103] 本实施例提供了一种类簇合并方法包括:获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像;基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇;将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同;将当前类簇与真实合档类簇进行合并。通过筛选当前类簇的候选合档类簇,并从候选合档类簇中确定真实合档类簇,不需要将当前类簇中的所有图像与历史类簇集中的所有历史类簇中的各图像进行相似度计算,即减少了不必要的计算,节约了类簇合并过程中的耗时,同时又保证了召回率。
[0104] 参阅图3,图3是本发明提供的类簇合并装置一实施例的框架示意图。本实施例提供一种类簇合并装置60,类簇合并装置60包括获取模块61、初筛模块62、二筛模块63和合并模块64。
[0105] 获取模块61用于获取当前类簇,并确定当前类簇的类簇信息,其中,当前类簇包括多张包含同一目标对象的多张图像。
[0106] 初筛模块62用于基于当前类簇的类簇信息,从历史类簇集中筛选出与当前类簇相关的多个历史类簇,作为候选合档类簇。
[0107] 二筛模块63用于将当前类簇与每个候选合档类簇进行类簇相似度比较,以确定当前类簇对应的真实合档类簇,其中,真实合档类簇的目标对象与当前类簇的目标对象相同。
[0108] 合并模块64用于将当前类簇与真实合档类簇进行合并。
[0109] 本实施例提供的类簇合并装置,通过筛选当前类簇的候选合档类簇,并从候选合档类簇中确定真实合档类簇,不需要将当前类簇中的所有图像与历史类簇集中的所有历史类簇中的各图像进行相似度计算,即减少了不必要的计算,节约了类簇合并过程中的耗时,同时又保证了召回率。
[0110] 请参阅图4,图4是本申请终端一实施例的框架示意图。终端80包括相互耦接的存储器81和处理器82,处理器82用于执行存储器81中存储的程序指令,以实现上述任一类簇合并方法实施例的步骤。在一个具体的实施场景中,终端80可以包括但不限于:微型计算机、服务器,此外,终端80还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
[0111] 具体而言,处理器82用于控制其自身以及存储器81以实现上述任一类簇合并方法实施例的步骤。处理器82还可以称为CPU(Central Processing Unit,中央处理单元)。处理器82可能是一种集成电路芯片,具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(Digital Signal Processor, DSP)、专用集成电路(Application Specific Integrated Circuit, ASIC)、现场可编程门阵列(Field‑Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器82可以由集成电路芯片共同实现。
[0112] 请参阅图5,图5为本申请计算机可读存储介质一实施例的框架示意图。计算机可读存储介质90存储有能够被处理器运行的程序指令901,程序指令901用于实现上述任一类簇合并方法实施例的步骤。
[0113] 在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
[0114] 上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
[0115] 在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
[0116] 另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0117] 集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0118] 若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
[0119] 以上仅为本发明的实施方式,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。