基于wifi指纹信息的设备识别系统转让专利
申请号 : CN202110575779.X
文献号 : CN113220689B
文献日 : 2022-03-18
发明人 : 段五福 , 方毅 , 章玉珍 , 董霖 , 王杰
申请人 : 每日互动股份有限公司
摘要 :
权利要求 :
1.一种基于wifi指纹信息的设备识别系统,其特征在于,包括第一数据库、第二数据库、存储有计算机程序的存储器和处理器,其中,所述第一数据库用于存储设备wifi指纹记录,所述设备wifi指纹记录包括设备gid、设备wifi指纹信息和第一地理位置信息字段,其中,所述设备wifi指纹信息是设备gid所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,每一wifi mac对应一个上报时间戳,所述gid是设备的全局唯一标识;
所述第二数据库用于存储小程序wifi指纹记录,所述小程序wifi指纹记录包括设备cid、小程序wifi指纹信息和第二地理位置信息字段,其中,每一cid在所述第二数据库中是唯一的,但不同cid对应的设备为相同的设备或不同的设备,所述小程序wifi指纹信息是指同一设备运行同一小程序所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,每一wifi mac对应一个上报时间戳;
所述处理器执行所述计算机程序实现以下步骤:步骤S1、以预设的时间窗在所述第一数据库中获取预设地理区域范围内的M个时间窗内每一设备gid的设备wifi指纹信息 i=1,2,…X,X为M个时间窗内所涉及的所有设备gid去重后的总数量, 表示第i设备gid在第m时间窗内的设备wifi指纹信息,m的取值为1到M;
步骤S2、以所述预设时间窗在所述第二数据库中获取所述预设地理区域范围内的对应的M个时间窗内每一设备cid的小程序wifi指纹信息 j=1,2,…Y,Y为M个时间窗内所涉及的所有设备cid的总数量, 表示第j设备cid在第m时间窗内的小程序wifi指纹信息,m的取值为1到M;
步骤S3、将 和 分别转换为对应的TF‑IDF向量 和 i的取值为1到X,j的取值为1到Y,m的取值为1到M;
步骤S4、获取 和 的向量相似度,基于 和 的向量相似度确定每一设备cid所对应的设备gid。
2.根据权利要求1所述的系统,其特征在于,所述步骤S3之前还包括:
步骤S100、将 和 中wifi mac的信号强度小于预设信号强度阈值的wifi mac删除;
和/或,
步骤S200、将 和 中wifi mac在预设时间内连接设备数量超过预设连接数量阈值的wifi mac删除。
3.根据权利要求2所述的系统,其特征在于,所述信号强度阈值为‑70dbm。
4.根据权利要求1或2所述的系统,其特征在于,所述步骤S3包括:
步骤S31、获取 和 中出现的每一wifi mac的TF‑IDF值;
步骤S32、构建TF‑IDF向量框架(v1,v2…vN),N表示 和中出现的所有wifi mac去重后的总数;
步骤S33、判断 中是否存在第n个wifi mac,若存在,则将TF‑IDF向量框架(v1,v2…vN)中的vn设置为第n个wifi mac的TF‑IDF值,若不存在,则将TF‑IDF向量框架(v1,v2…vN)中的vn设置为零,n取值为1到N,从而生成 对应的TF‑IDF向量判断 中是否存在第n个wifi mac,若存在,则将TF‑IDF向量框架(v1,v2…vN)中的vn设置为第n个wifi mac的TF‑IDF值,若不存在,则将TF‑IDF向量框架(v1,v2...vN)中的vn设置为零,n取值为1到N,从而生成 对应的TF‑IDF向量
5.根据权利要求4所述的系统,其特征在于,所述步骤S31包括:
步骤S311、基于 和 计算每一wifi mac的TF值:其中,TFn表示第n个wifi mac对应的TF值,TCnZ表示第n个wifi mac在 中出现的数量,TDnZ表示第n个wifi mac在 中出现的数量,TCZ表示中的所有wifi mac的总数量,TDZ表示 中的所有wifi mac的总数量;
步骤S312、基于 和 计算每一wifi mac的IDF值:其中,IDFn表示第n个wifi mac对应的IDF值,SCZ表示 中设备指纹信息的总数量,SDZ表示 中小程序指纹信息的总数量,SCn表示 中出现有第n个wifi mac的设备指纹信息数量,SDn表示 中出现有第n个wifi mac的小程序指纹信息数量;
步骤S313、基于第n个wifi mac对应的TFn和IDFn确定第n个wifi mac对应的TF‑IDF值:TF‑IDFn=TFn×IDFn。
6.根据权利要求5所述的系统,其特征在于,所述步骤S4包括:
步骤S401、获取每一 与所有 的 向量相似度,将相似度最高的 对应的设备gid确定为 对应的cid所对应的设备gid。
7.根据权利要求5所述的系统,其特征在于,所述步骤S4包括:
步骤S411、获取每一 与所有 的 向量相似度,并按相似度从大到小排序,获取预设前R个设备wifi指纹信息的TF‑IDF向量对应的设备gid;
步骤S412、将前R个设备wifi指纹信息的TF‑IDF向量对应的设备gid中占比最高的gid确定为 对应的cid所对应的设备gid。
8.根据权利要求5所述的系统,其特征在于,所述步骤S4包括:
步骤S41、将所有的 进行聚类,将所有的 划分为K类,对应K个分类中心向量(CV1,CV2…CVK),CVk为第k个分类对应的中心向量,k的取值为1到K;
步骤S42、获取 与CVk的向量相似度,k的取值为1到K,确定与 向量相似度最大的目标中心向量CVW,将中心向量CVW对应的类别中的所有设备wifi指纹信息的TF‑IDF向量确定为目标设备wifi指纹信息的TF‑IDF向量集合;
步骤S43、获取 与对应的目标设备wifi指纹信息的TF‑IDF向量集合中每一设备wifi指纹信息的TF‑IDF向量的相似度,并从大到小进行排序,获取预设前R个设备wifi指纹信息的TF‑IDF向量对应的设备gid;
步骤S44、将前R个设备wifi指纹信息的TF‑IDF向量对应的设备gid中占比最高的gid确定为 对应的cid所对应的设备gid。
9.根据权利要求1所述的系统,其特征在于,所述预设时间窗为1周,所述M值为8。
说明书 :
基于wifi指纹信息的设备识别系统
技术领域
背景技术
型应用作为载体进行使用。小程序只能识别到活跃行为,获取活跃行为对应的wifi连接信
息,但不能识别出打开小程序的设备id。但随着大数据时代的到来和小程序活跃用户的激
增,小程序所获取到是数据量也是巨大的。如果要对小程序进行进一步开发和分析,是很有
必要基于小程序的海量数据确定使用小程序的设备信息,然后可以基于设备信息对应的特
征参数来分析群体特征等。由此可知,如何识别使用小程序的设备成为亟待解决的技术问
题。
发明内容
所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,每一wifi mac对应一个上报
时间戳,所述gid是设备的全局唯一标识;
是唯一的,但不同cid对应的设备为相同的设备或不同的设备,所述小程序wifi指纹信息是
指同一设备运行同一小程序所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,
每一wifi mac对应一个上报时间戳;
内所涉及的所有设备gid去重后的总数量, 表示第i设备gid在第m时间窗内的设备wifi
指纹信息,m的取值为1到M;
Y为M个时间窗内所涉及的所有设备cid的总数量, 表示第j设备cid在第m时间窗内的小
程序wifi指纹信息,m的取值为1到M;
少具有下列优点:
更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
具体实施方式
后。
存储设备wifi指纹记录,所述设备wifi指纹记录包括设备gid、设备wifi指纹信息和第一地
理位置信息字段,其中,所述设备wifi指纹信息是设备gid所连接的wifi mac按照时间顺序
排序所产生的wifi mac序列,可以理解的是,设备wifi指纹信息对应的wifi mac序列中同
一wifi mac可能出现一次或多次,每一wifimac对应一个上报时间戳,所述gid是设备的全
局唯一标识,基于设备gid可以确定对应的设备信息。
是唯一的,但不同cid对应的设备为相同的设备或不同的设备,所述小程序wifi指纹信息是
指同一设备运行同一小程序所连接的wifi mac按照时间顺序排序所产生的wifi mac序列,
可以理解的是,小程序wifi指纹信息对应的wifi mac序列中同一wifi mac也可能出现一次
或多次,每一wifi mac对应一个上报时间戳,需要说明的是,第二数据库中只能够获取到一
个设备上的同一小程序上报的小程序wifi指纹信息,第二数据库中的小程序wifi指纹信息
可以包括一个或多个小程序的wifi指纹信息,每个设备上报一个wifi指纹信息对应一个设
备cid,基于设备cid无法确定真正的设备信息,且多个不同的设备cid可能是同一个设备
的,但现有的数据无法确认,基于此,本申请所述系统可以实现设备cid和设备gid的关联。
具体的,所述处理器执行所述计算机程序实现以下步骤:
所涉及的所有设备gid去重后的总数量, 表示第i设备gid在第m时间窗内的设备wifi指
纹信息,m的取值为1到M;
述预设时间窗可设置为1周,所述M值为8,因此可以获取连续8周内的每一设备gid对应的设
备wifi指纹信息,即每一设备gid每周对应一个wifi mac列表。优选的,第一数据库的设备
gid能够覆盖第二数据库的设备cid所对应的设备gid。
Y为M个时间窗内所涉及的所有设备cid的总数量, 表示第j设备cid在第m时间窗内的小
程序wifi指纹信息,m的取值为1到M;
小程序活跃行为和对应的wifi指纹,因此,8周內获取的是8周的所有设备cid对应的小程序
wifi指纹信息,即虽然多个设备cid可能对应的是同一个设备,但由于小程序无法识别,因
此,得到的仍是不同多个设备cid所对应的小程序wifi指纹信息。
范围
步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作
完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方
法、函数、规程、子例程、子程序等等。
必要的计算量,提高数据处理的效率和准确度。
vN)中的vn设置为零,n取值为1到N,从而生成 对应的TF‑IDF向量
设置为零,n取值为1到N,从而生成 对应的TF‑IDF向量
量,TCZ表示 中的所有wifimac的总数量,TDZ表示 中的所有
wifi mac的总数量;
中出现有第n个wifi mac的设备指纹信息数量,SDn表示 中
出现有第n个wifi mac的小程序指纹信息数量;
且获取结果的效率会比较低,此时采用下述实施例来执行,所述步骤S4具体可包括:
IDF向量确定为目标设备wifi指纹信息的TF‑IDF向量集合;
纹信息的TF‑IDF向量对应的设备gid;
实现。
员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰
为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质
对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。